Publication:
Veri madenciliği uygulaması

Loading...
Thumbnail Image

Date

Journal Title

Journal ISSN

Volume Title

Publisher

Research Projects

Organizational Units

Journal Issue

Abstract

Veri madenciliği, günümüz bilgi çağında en güncel teknolojilerden birisidir. Bilgisayar sistemlerinin her geçen gün hem daha ucuzluyor olması, hem de güçlerinin artıyor olması, bilgisayarlarda daha büyük miktarlarda verinin saklanabilmesine imkan vermektedir. Bu yüzden, büyük miktardaki verileri işleyebilen teknikleri kullanabilmek, büyük önem kazanmaktadır. Veri madenciliği bu gibi durumlarda kullanılan, büyük miktardaki veri setlerinde saklı durumda bulunan örüntü ve eğilimleri keşfetme işlemidir. Bu tezin ilk kısmında, veri madenciliği genel hatları ile anlatılmaktadır. İkinci kısımda ise, veri madenciliği modelleri işlevlerine göre Sınıflama (Classification), Regresyon (Regression), Kümeleme (Clustering) ve Birliktelik Kuralları (Association Rules) başlıkları altında incelenmektedir. Tezin üçüncü bölümünde sınıflama modeli, veri madenciliği tekniklerinden biri olan karar ağacı tekniği ile birlikte detaylı olarak anlatılmakta ve karar ağacı tekniği kullanarak gerçekleştirilen veri madenciliği uygulamasının tasarımı anlatılmaktadır. Dördüncü bölümde gerçekleştirilen uygulamanın sonuçları incelenirken, beşinci bölümde de uygulama ile ilgili değerlendirmeler yapılmaktadır. Bu tez çalışmasında gerçekleştirilen veri madenciliği uygulaması, sınıflama modelini ve karar ağacı tekniğini kullanarak, bir bankanın müşterilerine verdiği krediler üzerinde tahminlerde bulunmaktadır. Program, bankanın geçmişte müşterilerine verdiği ve kontratları sona ermiş olan kredileri inceleyerek karar ağacı ve sınıflama kuralları oluşturmaktadır. Ardından bu sınıflama kuralları kullanılarak, kredi kontratı halen devam etmekte olan müşterilerin, kontrat sonunda kredilerini geri ödeme durumları tahmin edilmektedir. E Data mining is one of the hottest current technologies of the information age. As computer systems getting cheaper and computer power increases, the amount of data available to be collected and processed increases. Therefore using techniques that operates very well with large amounts of data becomes an obvious choice. Data mining is a process, which is used in these cases for discovering patterns and trends in large datasets. In the first part of this thesis, data mining is described in general terms. In the second part, data mining models like Classification, Regression, Clustering and Association Rules are examined. In the third part, the classification model and the decision tree technique are described in detail, and the design of the program, which is constructed using the decision tree technique, is explained. The results and the evaluations of the program are given in the fourth and the fifth parts. The application designed for this thesis, uses the classification model with decision tree technique and makes predictions on the loans already granted by bank. Our program constructs a decision tree and extracts classification rules by examining the granted loans whose contracts are already finished. Then by using the classification rules, it makes predictions on the granted loans whose contracts are still running whether they will be repaid or not by the time the contracts are finished. S

Description

Citation

Collections

Endorsement

Review

Supplemented By

Referenced By