Publication: Karar ağacı algoritması ile metin sınıflandırma: Müşteri yorumları örneği
Loading...
Files
Date
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Günümüzde mevcut olan verinin büyük çoğunluğunun metin tabanlı olması, onların analizi için birtakım yöntemlerin
geliştirilmesini zorunlu hale getirmiştir. Zira bu metinlerin manuel olarak incelenmesi çok zordur, hatta çoğu durumda imkânsızdır.
Metin verilerden bilgi çıkarımının zorunlu hale gelmesi otomatik olarak bilgi çıkarımına yönelik çalışmaları tetiklemiş ve metin
sınıflandırma yöntemleri ortaya çıkmıştır. Ancak metin veriler yapısal olmadığından analizleri de geleneksel makine öğrenmesi
uygulamalarından farklı olmaktadır.
Bu çalışmada bir işletme veri tabanında yer alan müşteri yorumlarından örneklem seçilerek, onları şikâyet-talep-teşekkür
sınıflarına atayacak bir karar ağacı modeli oluşturulmuştur. Algoritma, entropi ve bilgi kazanımı hesaplama yöntemlerini esas
almaktadır. Bu yolla önce müşteri yorumlarından onları temsil edebilecek nitelikteki öznitelikler –kelimeler– çıkarılmış ve düğümler
belirlenerek ilgili sınıf etiketleri tespit edilmiştir.
Most of the data available today are text based. This necessitates developing some methods for their analysis. Because inspecting these text is very difficult, even impossible most of the time. Necessity of extracting knowledge from text data has triggered works about automatically extracting knowledge out of text data and text classifications methods have emerged. But since text data are not structural, their analysis are different than traditional machine learning applications. In this study, by selecting a sample from customer comments in a firm’s database, a decision tree model is constructed which can assign these comments into complaint-request-acknowledgement classes. Algorithm is based on entropy and knowledge gain calculations. This way, first attributes -words- that can represent customer comments have extracted and by defining nodes class labels.
Most of the data available today are text based. This necessitates developing some methods for their analysis. Because inspecting these text is very difficult, even impossible most of the time. Necessity of extracting knowledge from text data has triggered works about automatically extracting knowledge out of text data and text classifications methods have emerged. But since text data are not structural, their analysis are different than traditional machine learning applications. In this study, by selecting a sample from customer comments in a firm’s database, a decision tree model is constructed which can assign these comments into complaint-request-acknowledgement classes. Algorithm is based on entropy and knowledge gain calculations. This way, first attributes -words- that can represent customer comments have extracted and by defining nodes class labels.
