Publication: Improving efficiency of the solutions for class imbalance problems using data mining techniques
Abstract
Klinik karar almada yanlış bir teşhis hastanın yaşamına zarar verebilir. Bu sebeple veri madenciliğinin sağlık sektörüne uygulanmasındaki kayda değer artış ölçüm doğruluğunu klinik teşhis öngörüsünde kritik performans ölçümlerinden biri haline getirmektedir. Bununla birlikte sınıf dengesizliği problemi yaygın olarak klinik veri kümelerini sıkıntıya sokmaktadır. Bu hal, veri kümelerindeki sınıflar eşitsiz biçimde ortaya konduğunda meydana gelmektedir. Bu durum algoritmaların verilerle overfitting uyuşmazlığına sebep olan ve klinik öngörüde zayıf doğruluk veren sinirsel ağ algoritmalarıının işlerliğini azaltmaktadır. Torbalama metodu sınıf dengesizliği problemine yaklaşım becerisine sahip ve ölçme doğruluğunu artıran yaygın kümeleme metodlarından biridir. Bunun yanısıra torbalama metodu kararsız kümeleyicilerde olumlu biçimde işlemektedir. Kararsız kümeleyicilerden biri de sinirsel ağlardır. Bu sebeple bu çalışmada, yukarıdaki probleme yaklaşım konusunda torbalama tabanlı sinirsel ağ öne sürülmektedir. Deneysel sonuçlara göre bu yöntem doğru ölçmede konvansiyonel sinirsel ağdan daha iyi sonuç vermekte ve klinik teşhis öngörüsünde sınıf dengesizliği problemine başarılı bir yaklaşım sergileyebilmektedir.
In clinical decision making, an inaccurate diagnosis might harm patient's life. Therefore, the significant growth of data mining’s implementation in healthcare industry takes the accuracy into one of the critical performance measures for clinical diagnosis prediction. However, clinical datasets commonly suffer from class imbalance problem. It occurs when the classes in the datasets are unequally presented. This situation degrades the performance of neural network algorithms which leads the algorithms to overfit the data and have poor accuracy in clinical prediction. Bagging method is one of the popular ensemble methods that is capable to address class imbalance problem and improve the accuracy. Furthermore, bagging method performs well with unstable classifiers. One of the unstable classifiers is neural networks. Therefore, bagging based neural network is proposed to address the above problem. From the experimental results, the proposed method achieves better accuracy than the conventional neural network and successfully addresses class imbalance problem on clinical diagnosis predictions.
In clinical decision making, an inaccurate diagnosis might harm patient's life. Therefore, the significant growth of data mining’s implementation in healthcare industry takes the accuracy into one of the critical performance measures for clinical diagnosis prediction. However, clinical datasets commonly suffer from class imbalance problem. It occurs when the classes in the datasets are unequally presented. This situation degrades the performance of neural network algorithms which leads the algorithms to overfit the data and have poor accuracy in clinical prediction. Bagging method is one of the popular ensemble methods that is capable to address class imbalance problem and improve the accuracy. Furthermore, bagging method performs well with unstable classifiers. One of the unstable classifiers is neural networks. Therefore, bagging based neural network is proposed to address the above problem. From the experimental results, the proposed method achieves better accuracy than the conventional neural network and successfully addresses class imbalance problem on clinical diagnosis predictions.
Description
Keywords
bagging, Bilgi işlem, Bilgi saklama ve geri alma sistemleri, Bilgisayar programları, Computer programs, Data processing, Data transmission systems, Değerlendirme, Evaluation, Hastaneler, Hospitals, Information storage and retrieval systems, neural networks, sınıf dengesizliği problemi, sinirsel ağlar class imbalance problem, torbalama, Veri iletim sistemleri
