Publication: Müşteri işlemlerindeki birlikteliklerin belirlenmesinde veri madenciliği uygulaması
Abstract
Teknolojik gelişmeler ile birlikte günümüzde her alanda sürekli olarak şirketler ve kurumlar özellikle müşteri ve satış verilerini depolamaktadırlar. Bu verilerden veri madenciliği teknikleri uygulanarak önceden bilinmeyen, veri içinde gizli, anlamlı, potansiyel olarak kullanışlı ve değerli bilgiler elde edilmek istenmektedir. Birliktelik-ilişki kuralıda bu tekniklerden biridir. Birliktelik-ilişki kuralı, hareket verileri içinde birlikte hareket eden öğelerin keşfedilmesi, keşfedilen bu bağıntılar ile geleceğe yönelik tahminler üretilmesini sağlar. Apriori algoritması, veri madenciliğinde sık geçen öğelerin keşfedilmesi için kullanılan en çok bilinen birliktelik-ilişki kuralı algoritmasıdır, temel olarak iteratif bir yapıya sahiptir. Sık geçen öğeleri bulmak için birçok kez veritabanını taramak gerekir, bu taramalar aşamasında Apriori algoritmasının birleştirme, budama işlemleri ve minumum destek ölçütü yardımı ile birliktelik ilişkisi olan öğeler bulunur. Bu tez kapsamında, veritabanlarında bilgi keşfi süreçleri, veri madenciliği, veri madenciliğinde kullanılan birliktelik-ilişki kuralı ve Apriori algoritması hakkında bilgiler verilmiştir. Bu tezde ayrıca, bir firmanın pastane satış lokasyonlarındaki satış verileri üzerinde veri madenciliği uygulamak için, çok boyutlu bir veritabanı tasarlanmıştır. Veri seçme işlemi ile operasyon veritabanından uygulama veritabanına veriler transfer edilmiştir. Veritabanı içindeki veriler üzerinde veri önişleme ve veri indirgeme süreçleri uygulanarak veri madenciliğine uygun veri seti elde edilmiştir. Apriori algoritmasını uyguyabilmek için .net platformunda Web tabanlı bir uygulama yazılımı geliştirilmiştir. Bu uygulama yazılımı algoritmanın her aşamasında uygulanan işlemleri adım adım görüntülenmesine imkan sağlayacak şekilde tasarlamıştır. Uygulama yazılımı ile veritabanındaki veriler üzerinde Apriori algoritması uygulanmıştır, uygulama yazılımının çalışması esnasında algoritmanın her aşaması izlenmiştir. Her aşamadaki girdiler ve sonuçlar net olarak gözlemlenmiştir. Uygulanan Apriori algoritması ile farklı zaman dilimi, farklı satış lokasyonu girdi değerleri doğrultusunda birlikte satın alınan ürünler ile ilgili bağıntılar olduğu gözlemlenmiştir. Genelde aynı ürün grubuna ait ürünlerin en sık birlikte satın alınan ürünler olduğu görülmüştür.
In this time period, many of companies and corporates specially store customer and sales data in databases together with technological developments. They want to obtain previously unknown, implicit, meaningful, and potentially useful information from data in databases with data mining techniques. Association rule mining is one kind of data mining techniques which discovers strong association or correlation relationships among a large of data items. The Apriori algorithm is the most popular association rule algorithm which discovers all frequent itemsets in large database of transactions. This algorithm uses iterative approach to count the frequent itemsets. Using this algorithm, candidate patterns which receive sufficient support from the database and the algorithm uses aprior gen actions join and prune to find all frequent itemsets. In this thesis, processes of knowledge discovery in databases, data mining, association rule and Apriori algorithm are explained. Furthermore, to apply data mining on real sales data which are several pastry-shops transactions data; designed a multidimensional database, transfered operational data to thesis application database with data selection process, applied data preprocessing and data reduction on application-data and application-data comes ready to apply data mining. On the .net platform, we generated a web-based application software. This software that represents processes of Apriori algorithm step by step. We applied Appriori algorithm on selected dataset with application software. When the application software is running, observed all processes of Apriori algorithm, also observed all entries and all results each steps. Algorithm generated some relations between together purchased products with entry values which are different time period and different pastry-shop locations. To observe most frequently purchased products together which are generally in same product group.
In this time period, many of companies and corporates specially store customer and sales data in databases together with technological developments. They want to obtain previously unknown, implicit, meaningful, and potentially useful information from data in databases with data mining techniques. Association rule mining is one kind of data mining techniques which discovers strong association or correlation relationships among a large of data items. The Apriori algorithm is the most popular association rule algorithm which discovers all frequent itemsets in large database of transactions. This algorithm uses iterative approach to count the frequent itemsets. Using this algorithm, candidate patterns which receive sufficient support from the database and the algorithm uses aprior gen actions join and prune to find all frequent itemsets. In this thesis, processes of knowledge discovery in databases, data mining, association rule and Apriori algorithm are explained. Furthermore, to apply data mining on real sales data which are several pastry-shops transactions data; designed a multidimensional database, transfered operational data to thesis application database with data selection process, applied data preprocessing and data reduction on application-data and application-data comes ready to apply data mining. On the .net platform, we generated a web-based application software. This software that represents processes of Apriori algorithm step by step. We applied Appriori algorithm on selected dataset with application software. When the application software is running, observed all processes of Apriori algorithm, also observed all entries and all results each steps. Algorithm generated some relations between together purchased products with entry values which are different time period and different pastry-shop locations. To observe most frequently purchased products together which are generally in same product group.
