Publication: OECD sağlık verilerinin veri madenciliği yöntemleri ile analizi
Abstract
Günümüzde sağlık hizmetleri, ekonomik ve sosyal kalkınmanın en temel belirleyicilerinden biri olarak kabul edilmektedir. Sağlık hizmetlerine ait sağlık verileri ülkelerin sağlık alanındaki gelişiminin tespit edilmesinde yol gösterici olmaktadır. Birleşmiş Milletler tarafından geliştirlen bir kavram olan İnsani Gelişim Endeksi, sağlık, eğitim ve gelir olmak üzere üç temel alan üzerinden toplumların insani gelişim düzeylerini belirlemek için kullanılmaktadır. İnsani Gelişim Endeksi değerinin sağlık boyutu üzerinde hangi faktörlerin etkili olduğunun belirlenmesi için OECD ülkeleri sağlık verilerilerinden yararlanılabilir. Literatürden yararlanılarak İnsani Gelişim Endeksi’nin sağlık boyutu üzerinde etkili olduğu belirlenen dokuz faktör; medikal teknoloji, hastane yatak sayısı, hastane sayısı, doğumda yaşam beklentisi, bebek ölüm oranı, anne ölüm oranı, kişi başına GSYH, sağlık harcaması ve kişi başına düşen ilaç satışı olarak belirlenmiştir. Bu tez çalışmasında Ekonomik Kalkınma ve İş Birliği Örgütü ülkelerindeki sağlık hizmeti göstergelerinin İnsani Gelişim Endeksi üzerindeki etkisini belirlemek için veri madenciliği metotları kullanılarak çıkarımlar yapmak amaçlanmıştır. 2011-2016 yıllarındaki bu dokuz faktöre ait değerler Ekonomik Kalkınma ve İş Birliği Örgütü sitesinde yayınlanan verilerden derlenerek bir veri seti hazırlanmıştır. Eğri uydurma ve ortalama değer atama yöntemleri ile eksik veriler tamamlanmıştır. Bilgi kazancı ve korelasyon tabanlı özellik seçimi yöntemleri kullanılarak endeks üzerinde en etkili göstergenin bebek ölüm oranı olduğu belirlenmiştir. Anne ölüm oranı ve kişi başına düşen ilaç harcaması da insani gelişime güçlü etkisi olan özellikler olarak tespit edildi. Hiyerarşik kümeleme, k-means ve k-medoids yardımıyla veri setindeki veriler kümelendi ve sonuçlar karşılaştırıldı. Naive Bayes, Yapay Sinir Ağları ve Lojistik Regresyon yöntemleri kullanılarak sınıflandırma işlemi gerçekleştirildi. Sağlık verilerini sınıflandırmada en başarılı yöntem yapay sinir ağları yöntemi oldu. Son altı yılın İnsani Gelişim Endeksi değerleri incelendiğinde doğumda yaşam beklentisinde en fazla gelişim gösteren ülkenin Türkiye, İnsani Gelişim Endeksi’ni en fazla arttıran ülkelerin ise Türkiye ve İrlanda olduğu belirlendi.
Nowadays, health services are considered as one of the main determinants of economic and social development. Data of health services are guiding for the development of countries in the field of health. The Human Development Index, a concept developed by the United Nations, is used to determine the human development levels of societies in three main areas: health, education and income. Health data of OECD countries can be used to determine which factors affect the health dimension of Human Development Index. Nine factors determined to be effective on the Human Development Index based on the literature; Gross Domestic Product per capita, infant mortality, maternal mortality, hospital beds density, health expenditures, hospitals number, life expectancy, medical technology and pharmaceutical sales. It is aimed to make inferences using data mining methods to determine the impact of healthcare indicators in Organization for Economic Cooperation and Development countries on Human Development Index. A data set was prepared by compiling the values of these nine factors between 2011 and 2016 years from the data that published on the Organization for Economic Cooperation and Development website. The missing data was completed by curve fitting and average value assignment methods. The infant mortality rate was determined as the most effective indicator on the index by using info gain and correlation-based feature selection methods. Maternal mortality rate and pharmaceutical expenditure were also identified as features that had a strong impact on human development. With the help of hierarchical clustering, k-means and k-medoids, the data in the dataset was clustered and the results were compared. Classification was carried out using Naive Bayes, Artificial Neural Networks and Logistic Regression methods. The most successful method in classifying OECD health data was artificial neural networks. When the life expectancy at birth values of the past six years is examined Turkey has shown great development in this area.
Nowadays, health services are considered as one of the main determinants of economic and social development. Data of health services are guiding for the development of countries in the field of health. The Human Development Index, a concept developed by the United Nations, is used to determine the human development levels of societies in three main areas: health, education and income. Health data of OECD countries can be used to determine which factors affect the health dimension of Human Development Index. Nine factors determined to be effective on the Human Development Index based on the literature; Gross Domestic Product per capita, infant mortality, maternal mortality, hospital beds density, health expenditures, hospitals number, life expectancy, medical technology and pharmaceutical sales. It is aimed to make inferences using data mining methods to determine the impact of healthcare indicators in Organization for Economic Cooperation and Development countries on Human Development Index. A data set was prepared by compiling the values of these nine factors between 2011 and 2016 years from the data that published on the Organization for Economic Cooperation and Development website. The missing data was completed by curve fitting and average value assignment methods. The infant mortality rate was determined as the most effective indicator on the index by using info gain and correlation-based feature selection methods. Maternal mortality rate and pharmaceutical expenditure were also identified as features that had a strong impact on human development. With the help of hierarchical clustering, k-means and k-medoids, the data in the dataset was clustered and the results were compared. Classification was carried out using Naive Bayes, Artificial Neural Networks and Logistic Regression methods. The most successful method in classifying OECD health data was artificial neural networks. When the life expectancy at birth values of the past six years is examined Turkey has shown great development in this area.
