Person:
YILDIZ, KAZIM

Loading...
Profile Picture

Email Address

Birth Date

Research Projects

Organizational Units

Job Title

Last Name

YILDIZ

First Name

KAZIM

Name

Search Results

Now showing 1 - 2 of 2
  • PublicationOpen Access
    du-CBA: veriden habersiz ve artırımlı sınıflandırmaya dayalı birliktelik kuralları çıkarma mimarisi
    (2023-01-01) BÜYÜKTANIR, BÜŞRA; YILDIZ, KAZIM; ÜLKÜ, EYÜP EMRE; Büyüktanır B., Yıldız K., Ülkü E. E., Büyüktanır T.
    İstemci sunucu sistemlerinde makine öğrenmesi modeli kullanılması bir ihtiyaçtır. Ancak istemcilerden verilerin toplanması, sunucuya aktarılması, makine öğrenmesi modeli eğitilmesi ve bu modelin istemcilerde çalışan cihazlara entegre edilmesi bir çok problemi beraberinde getirmektedir. Verilerin istemcilerden sunucuya transferi ağ trafiğine sebep olmakta, fazla enerji gerektirmekte ve veri mahremiyetini istismar edilebilmektedir. Çalışma kapsamında, bahsedilen problemlere çözüm için federe öğrenme mimarisi kullanılmaktadır. Mimariye göre, her bir istemcide istemcinin kendi verilerinden makine öğrenmesi modeli eğitilmektedir. Her bir istemcide eğitilen modeller sunucuya gönderilmekte ve sunucuda bu modeller birleştirilerek yeni bir model oluşturulmaktadır. Oluşturulan nihai model tekrar istemcilere dağıtılmaktadır. Bu çalışmada Veriden Habersiz İlişkili Kurallara Dayalı Sınıflandırma (Data Unaware Classification Based on Association, du-CBA) olarak adlandırılan ilişkisel sınıflandırma algoritması geliştirilmiştir. Federe öğrenme ile klasik öğrenme mimarilerini karşılaştırıp başarılarını ölçmek için çalışma kapsamında benzetim ortamı oluşturulmuştur. Benzetim ortamında du-CBA ve CBA algoritmaları kullanılarak modeller eğitilmiş ve sonuçlar kıyaslanmıştır. Modellerin eğitiminde University of California Irvine (UCI) veri havuzundan alınan beş veri seti kullanılmıştır. Deneysel sonuçlar, her bir veri seti için federe öğrenme ile eğitilen modellerin, klasik öğrenme ile eğitilen modellerle neredeyse aynı doğruluğu elde ettiğini ama eğitim sürelerinin yaklaşık %70 oranında azaldığını göstermiştir. Sonuçlar geliştirilen algoritmanın başarıya ulaştığını ortaya koymaktadır.
  • PublicationOpen Access
    Occupational groups prediction in Turkish Twitter data by using machine learning algorithms with multinomial approach
    (2024-10-15) YILDIZ, KAZIM; Ciplak Z., YILDIZ K.
    A lot of research has been done on personality and sentiment analysis, demographic and professional aspects using user shares in social networks. In particular, information extraction and value are produced based on Twitter data. This study aims to predict the users, occupational groups, who share in Turkish on Twitter, using machine learning methods. First, occupational groups and the Twitter accounts of the occupations in these occupational groups were determined manually and the tweets shared in these accounts were scraped. All tweets were then grouped by occupation into groups of one, five and ten, creating datasets with different characteristics, each containing more than 500,000 tweets. Some datasets were preprocessed using the Zemberek library, which is used in many Turkish NLP studies, and experiments were conducted out with a total 6 datasets. During the preprocessing phase, since the ready-made stopwords lists were not considered sufficient, unnecessary word lists consisting of single and binary words were created manually. Count and TF-IDF vectorizers are used to convert textual data into numerical. Since each word represents a variable in the text classification study, new variables were created by combining double and triple word phrases (ngrams) with feature extraction. In the experiments in which 24 different models were run, instead of using all the features created, the method of \"determining the optimal number of features\", which consists of the most valuable features, was used. It was found that the most successful model in the experiments using machine learning algorithms with a multinomial approach achieved 97.3% success in all calculated metrics.