Publication: Sayma veri modelleri ve bir uygulama
Abstract
ÖZETSAYMA VERİ MODELLERİ VE BİR UYGULAMAİstatistiksel ve Ekonometrik analizlerde en önemli noktalardan biri kullanılacak veri yapısına uygun regresyon modellerinin tercih edilmesidir. Regresyon modellerinde yer alan bağımlı değişkenin, sayım ile elde edilen verilerden oluşması durumunda tahminlerin güvenilirliği için sayma veri regresyon modellerinin kullanılması gerekir. Sayma veriler kesikli bir yapıya sahiptir, dolayısıyla sayma veri modelleri geliştirilirken kesikli dağılımlardan yararlanılmaktadır. Sayma veri modellerinin başında Poisson regresyon modeli gelir ve en önemli özelliği eşit yayılıma sahip olmasıdır. Bağımlı değişken varyansının ortalamasından büyük olması aşırı yayılım olarak adlandırılmaktadır. Aşırı yayılım durumunda tercih edilmesi gereken model Negatif Binom regresyon modelidir. Bağımlı değişkende sıfır yoğunun olması durumunda ise Sıfır Değer Ağırlıklı regresyon modellerinin kullanılması uygun olacaktır.Çalışma için gerekli olan veriler TÜİK 2016 yılı Hanehalkı Bütçe Anket araştırması mikro veri seti kullanılarak elde edilmiştir. Yaş, cinsiyet, medeni durum, hanehalkı geliri, tasarruf, şans oyunu, iş durumu ve çalışma saatinin hanehalkının sahip olduğu konut sayısı üzerindeki etkileri tespit edilmeye çalışılmıştır. Bağımlı değişken olan hanehalkı konut sayısı sayma veri yapısına sahip olduğu için Sayma Veri modelleri tahmin edilmiştir. Yapılan uyum iyiliği testleri sonucuna göre veri setinin Poisson modeline uyum sağladığı tespit edilmiştir. Poisson ve Sıfır Değer Ağırlıklı Poisson modelleri karşılaştırılmış ve veri yapısına uygun olan modelin Sıfır Değer Ağırlıklı Poisson modeli olduğu sonucuna ulaşılmıştır.
ABSTRACTCOUNT DATA REGRESSION AN APPLICATIONChoice of regression model that is appropriate to the data structure is one of the most important point in statiscal and econometric analysis. In the case when dependent variable consist of data obtained by count, Count Data Regression model should be used for the reliability. Count Data is discrete, for that reason discrete distributions are used when developing counting data models. Poisson Regression Model is the foremost Count Data Model and equal distribution is the most important feature of this model. When dependent variable variance is greater than mean it is called overdispersion. In overdispersion Negative Binomial Regression model should be used. If dependent variable has a zero dense Zero – Inflated regression models should be used.Data required for this study were obtained by using TÜİK 2016 Household Budget Survey micro data set. The effects of age, gender, marital status, household income, savings, lottery, job status and working hours on the number of houses owned by the household were tried to be determined. Counting Data Models were estimated because the number of households, which is the dependent variable and has count data structure. According to the results of goodness of fit tests, it was found that the data set conformed to the poisson model. Poisson and Zero – Inflated Poisson models were compared and it was concluded that the model suitable for the data structure was Zero – Inflated Poisson model.
ABSTRACTCOUNT DATA REGRESSION AN APPLICATIONChoice of regression model that is appropriate to the data structure is one of the most important point in statiscal and econometric analysis. In the case when dependent variable consist of data obtained by count, Count Data Regression model should be used for the reliability. Count Data is discrete, for that reason discrete distributions are used when developing counting data models. Poisson Regression Model is the foremost Count Data Model and equal distribution is the most important feature of this model. When dependent variable variance is greater than mean it is called overdispersion. In overdispersion Negative Binomial Regression model should be used. If dependent variable has a zero dense Zero – Inflated regression models should be used.Data required for this study were obtained by using TÜİK 2016 Household Budget Survey micro data set. The effects of age, gender, marital status, household income, savings, lottery, job status and working hours on the number of houses owned by the household were tried to be determined. Counting Data Models were estimated because the number of households, which is the dependent variable and has count data structure. According to the results of goodness of fit tests, it was found that the data set conformed to the poisson model. Poisson and Zero – Inflated Poisson models were compared and it was concluded that the model suitable for the data structure was Zero – Inflated Poisson model.
Description
Keywords
Count Data Models, Econometrics, Ekonometri, Konut Sayısı Count Data, Negatif Binom Regresyon Modeli, Negative Binomial Regression Model, Number of households, Poisson Regression Model, Poisson Regresyon Modeli, Sayma Veri, Sayma Veri Modelleri, Sıfır Değer Ağırlıklı Regresyon Modelleri, Zero – Inflated Regression Models
