Publication:
Çok sınıflı ve dengesiz eğitimsel veri kümesiyle yükseköğretim planlama ve karar destek sistemi: Teknoloji fakültesi örneği

dc.contributor.authorERDAL, HASAN
dc.contributor.authorsYılmaz E., Altıkardeş A. Z., Erdal H.
dc.date.accessioned2023-05-03T06:52:39Z
dc.date.available2023-05-03T06:52:39Z
dc.date.issued2023-04-01
dc.description.abstractEğitimsel Veri Madenciliğinin alt dalı olan akademik performans tahminiyle ilgili çalışmaların son yıllarda attığı görüldü. Gerçek ortamlarda eğitimsel veri kümeleri çoğunlukla sınıf dengesizliğine ve çok sınıflı hedef değişkene sahip olduğu ancak bu veri kümesi ile yapılan çalışmaların literatürde az olduğu görüldü. Bu bağlamda, bu çalışmada, 23.05.2022-286783 etik no kararı ile Marmara Üniversitesi (MÜ) Teknoloji Fakültesi (TF) öğrencilerine ait veri seti kullanılarak, çok sınıflı dengesiz eğitimsel veri kümesiyle, riskli öğrencileri tespit etmek için öğrenci mezuniyet durum tahmini yapıldı. Veri ön işleme ve özellik seçimi (FS) aşamalarıyla 1394 örneklem ve 11 özellik elde edildi. 2016 yılına ait 153 öğrenci sağlamlık kontrolü için kullanıldı. 7 farklı FS ile elde edilen 11, 7 ve 5 özellik içeren 3 farklı veri kümesi oluşturuldu. 9 farklı örnekleme yöntemi ve 16 farklı makine öğrenmesi algoritması kullanılarak birbirinden farklı 750 model oluşturuldu. Modellere sağlamlık kontrolü yapıldı. Başarı ölçütü olarak F1 Score ve Repeated Stratified 5*5 fold-CV kullanıldı. Hiper parametre ayarları GridSearchCV ile yapıldı. Sonuç olarak RandomOverSampler + RandomForest F1 Score 0.9935 değeriyle en başarılı algoritma olmasına rağmen, en başarılı ve en tutarlı modeller 7 özellikli, None+ET, None+MLP, None+Bagging_DT ve None+RF modelleri oldu. Bu modellerle karar destek sistemi web uygulaması geliştirilerek MÜ TF öğretim üyelerine sunuldu
dc.description.abstractStudies on academic performance prediction, a sub-branch of Educational Data Mining, have increased in recent years. Educational datasets in real environments often have class imbalanced and multi-class target variables. However, studies with these datasets are very few. In this context, in this study, with the ethical no decision of 23.05.2022-286783, using the data set of Marmara University (MU) Faculty of Technology (TF) students, a student graduation status estimation was made with the multiclass imbalanced educational dataset to identify the students at risk. 1394 samples and 11 features were obtained through data preprocessing and feature selection (FS) stages. 153 students belonging to 2016 were used for robustness control. 3 different datasets containing 11, 7 and 5 features obtained with 7 different FS were created. Using 9 different sampling methods and 16 different machine learning algorithms, 750 different models were created. Models were checked for robustness. F1 Score and Repeated Stratified 5*5 fold-CV were used as success criteria. Hyperparameter settings were made with GridSearchCV. As a result, although ROS+RF was the most successful algorithm with an F1 Score of 0.9935, the most successful and most consistent models were the 7-featured None+ET, None+MLP, None+Bagging_DT and None+RF models. With these models, the decision support system web application was developed and presented to MU TF faculty members.
dc.identifier.citationYılmaz E., Altıkardeş A. Z., Erdal H., "Çok Sınıflı ve Dengesiz Eğitimsel Veri Kümesiyle Yükseköğretim Planlama ve Karar Destek Sistemi: Teknoloji Fakültesi Örneği", Gazi Mühendislik Bilimleri Dergisi, cilt.9, sa.1, ss.63-78, 2023
dc.identifier.endpage78
dc.identifier.issn2149-4916
dc.identifier.issue1
dc.identifier.startpage63
dc.identifier.urihttps://dergipark.org.tr/tr/pub/gmbd/issue/77081/1134006
dc.identifier.urihttps://hdl.handle.net/11424/289094
dc.identifier.volume9
dc.language.isotur
dc.relation.ispartofGazi Mühendislik Bilimleri Dergisi
dc.rightsinfo:eu-repo/semantics/openAccess
dc.subjectMühendislik ve Teknoloji
dc.subjectEngineering and Technology
dc.subjectMühendislik, Bilişim ve Teknoloji (ENG)
dc.subjectEngineering, Computing & Technology (ENG)
dc.subjectEğitimsel Veri Madenciliği
dc.subjectDengesiz Veri Kümesi
dc.subjectÇok Sınıflı Veri Kümesi
dc.subjectTahmin
dc.subjectEducational data mining
dc.subjectımbalanced dataset
dc.subjectmulticlass dataset
dc.subjectprediction
dc.titleÇok sınıflı ve dengesiz eğitimsel veri kümesiyle yükseköğretim planlama ve karar destek sistemi: Teknoloji fakültesi örneği
dc.title.alternativeHigher education planning and decision support system with multi-class and imbalanced educational dataset: A case of technology faculty
dc.typearticle
dspace.entity.typePublication
local.avesis.id5e121c4e-eaeb-433f-b834-292116c9a55e
relation.isAuthorOfPublication819a2e66-ead9-43dc-b167-2990f1787c41
relation.isAuthorOfPublication.latestForDiscovery819a2e66-ead9-43dc-b167-2990f1787c41

Files

Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
5.pdf
Size:
3.94 MB
Format:
Adobe Portable Document Format

Collections