Publication:
Veri madenciliği teknikleri ile istenmeyen türkçe e-postaların önlenmesi üzerine bir uygulama

dc.contributor.advisorÇAKIR, Özgür
dc.contributor.authorSaylan, Sefa
dc.contributor.departmentMarmara Üniversitesi
dc.contributor.departmentSosyal Bilimler Enstitüsü
dc.contributor.departmentSayısal Yöntemler Bilim Dalı
dc.contributor.departmentİşletme Anabilim Dalı
dc.date.accessioned2026-01-13T11:35:51Z
dc.date.issued2018
dc.description.abstractİstenmeyen e-postalara maruz kalmak işletmelerin iş süreçlerinde aksamalara, zaman kayıplarına ve hatta maddi kayıplarına sebep olduğundan günümüzün önemli sorunlarından biri olarak görülmektedir. İstenmeyen e-postaların engellenmesi için öncelikle tespit edilmeleri gerekmektedir. Bu çalışmada, gelen e-postaların sınıflandırılması ve istenmeyen Türkçe e-postaların tespiti için Naive Bayes algoritmaları (iki terimli ve çok terimli) ve Destek Vektör Makinesi algoritmaları (doğrusal ve RBF çekirdek fonksiyonlu) kullanılmıştır. Çalışmada, öğrenme kümesinin Türkçede kullanılan etkisiz kelimelerden arındırılması ve arındırılmaması durumunda TF-IDF yöntemi ile oluşturulan farklı boyutlardaki özellik vektörlerinin sınıflandırma başarısına etkisi 72 farklı model oluşturularak incelenmiştir. Öğrenme kümesinden etkisiz kelimelerin arındırılmaması durumunda oluşturulan modellerin çoğunlukla daha yüksek başarı ile sınıflandırma işlemini gerçekleştirdiği sonucuna ulaşılmıştır. En yüksek başarıyı elde eden sınıflandırma algoritmasının çok terimli naive bayes algoritması olduğu gözlemlenmiştir.
dc.description.abstractNowadays, spam (Junk) mails might be considered as an important issue since they causes disruptions of business processes, a waste of time and also financial losses. The first step to prevent spam mails have to be detecting them. In this study, Naïve Bayes (Bernoulli and Multinomial) and Support Vector Machine (Linear and RBF Kernel Functions) algorithms are applied to a data set in order to classify incoming mails and prevent unwanted ones. Besides, in 72 different models, it is examined how different size TF-IDF feature vectors affect the accuracy of classification in learning data set with or without stop-words used in Turkish. In case of not removed stop-words used in Turkish success of classification in learning data has been observed to increase. In this study using Multinomial Naive Bayes classification algorithm achieved the best result.
dc.format.extentX, 128 s.
dc.identifier.urihttps://katalog.marmara.edu.tr/veriler/yordambt/cokluortam/4C/6D686B38-F632-194C-9478-DAF928F3F948.pdf
dc.identifier.urihttps://hdl.handle.net/11424/203145
dc.language.isotur
dc.rightsinfo:eu-repo/semantics/openAccess
dc.subjectBernoulli Naive Bayes
dc.subjectClassification
dc.subjectData mining
dc.subjectDestek Vektör Makinesi
dc.subjectElectronic data processing
dc.subjectElectronic mail systems
dc.subjectElektronik bilgi işlem
dc.subjectElektronik posta sistemleri
dc.subjectİstenmeyen Türkçe E-postalar
dc.subjectLinear Functions
dc.subjectLineer Çekirdek Fonksiyonu
dc.subjectManagement
dc.subjectMultinomial Naive Bayes
dc.subjectNaive Bayes
dc.subjectRBF Çekirdek Fonksiyonu Spam/ Junk mails
dc.subjectRBF Kernel
dc.subjectSınıflandırma
dc.subjectSupport Vector Machine
dc.subjectVeri madenciliği
dc.subjectYönetim
dc.titleVeri madenciliği teknikleri ile istenmeyen türkçe e-postaların önlenmesi üzerine bir uygulama
dc.typemasterThesis
dspace.entity.typePublication

Files

Collections