Publication:
Kodlayıcı kod çözücü ve dikkat algoritmaları kullanılarak karakter tabanlı kelime üretimi

dc.contributor.authorİNAN, TİMUR
dc.contributor.authorsErgin İ., İnan T.
dc.date.accessioned2024-06-05T14:36:30Z
dc.date.accessioned2026-01-10T21:51:55Z
dc.date.available2024-06-05T14:36:30Z
dc.date.issued2024-05-01
dc.description.abstractBu çalışmada, derin öğrenme algoritmalarından kodlayıcı-kod çözücü ve dikkat mimarisi kullanılarak karakter tabanlı Türkçe dil bilgisi kurallarına uygun anlamlı kelime üretimi amaçlanmıştır. Geliştirilen modelin sonuçları diğer derin öğrenme algoritmaları olan LSTM ve GRU modellerinin sonuçları ile karşılaştırılmaktadır. LSTM ve GRU modelleri ile oluşturulan dil modelleri 100 ve 200 epoch değerlerinde ve sıcaklık örnek alma yönteminin farklı eşik değerlerinde birbirine yakın sonuçlar verdiği görülmektedir. Bu modellerden en yüksek başarı değerini 200 epoch ve 0,5 sıcaklık eşik değerinde %88,40 ile GRU modeli vermektedir. Bu çalışma için geliştirilen kodlayıcı-kod çözücü ve dikkat dil modeli ise 100 ve 200 epoch değerlerinde ve sıcaklık örnek alma yönteminin farklı eşik değerlerinde en yüksek başarı değerini 200 epoch ve 0,5 sıcaklık eşik değerinde %91,90 ile vermektedir. Yapılan denemeler sonunda, kodlayıcı-kod çözücü ve dikkat mimarisi modeli LSTM modeline göre ortalama olarak %2,83 ve GRU modeline göre ortalama olarak %0,19 oranında daha fazla başarı göstermiştir.
dc.description.abstractIn this study, it is aimed to produce meaningful words in accordance with character-based Turkish grammar rules by using encoder-decoder and attention architecture, which are deep learning algorithms. The results of the developed model are compared with the results of LSTM and GRU models, which are other deep learning algorithms. It is seen that the language models created with LSTM and GRU models give similar results at 100 and 200 epoch values and at different threshold values of the temperature sampling method. Among these models, the GRU model gives the highest success value with 88.40% at 200 epochs and 0.5 temperature threshold value. The encoder-decoder and attention language model developed for this study gives the highest success value of 91.90% at 100 and 200 epoch values and at different threshold values of the temperature sampling method at 200 epoch and 0.5 temperature threshold value. At the end of the experiments, the encoder-decoder and attention architecture model showed an average of 2.83% more success than the LSTM model and an average of 0.19% more success than the GRU model.
dc.identifier.citationErgin İ., İnan T., "Kodlayıcı kod çözücü ve dikkat algoritmaları kullanılarak karakter tabanlı kelime üretimi", Gazi üniversitesi mühendislik mimarlık fakültesi dergisi, cilt.39, sa.3, ss.1999-2010, 2024
dc.identifier.doi10.17341/gazimmfd.1206277
dc.identifier.endpage2010
dc.identifier.issn1300-1884
dc.identifier.issue3
dc.identifier.startpage1999
dc.identifier.urihttps://dergipark.org.tr/tr/pub/gazimmfd/issue/82783/1206277
dc.identifier.urihttps://hdl.handle.net/11424/296991
dc.identifier.volume39
dc.language.isotur
dc.relation.ispartofGazi üniversitesi mühendislik mimarlık fakültesi dergisi
dc.rightsinfo:eu-repo/semantics/openAccess
dc.subjectBilgisayar Bilimleri
dc.subjectYapay Zeka, Bilgisayarda Öğrenme ve Örüntü Tanıma
dc.subjectMühendislik ve Teknoloji
dc.subjectComputer Sciences
dc.subjectArtificial Intelligence, Computer Learning and Pattern Recognition
dc.subjectEngineering and Technology
dc.subjectMühendislik, Bilişim ve Teknoloji (ENG)
dc.subjectBilgisayar Bilimi
dc.subjectBİLGİSAYAR BİLİMİ, YAPAY ZEKA
dc.subjectEngineering, Computing & Technology (ENG)
dc.subjectCOMPUTER SCIENCE
dc.subjectCOMPUTER SCIENCE, ARTIFICIAL INTELLIGENCE
dc.subjectBilgisayarla Görme ve Örüntü Tanıma
dc.subjectBilgisayar Bilimi Uygulamaları
dc.subjectYapay Zeka
dc.subjectBilgisayar Bilimi (çeşitli)
dc.subjectGenel Bilgisayar Bilimi
dc.subjectFizik Bilimleri
dc.subjectComputer Vision and Pattern Recognition
dc.subjectComputer Science Applications
dc.subjectArtificial Intelligence
dc.subjectComputer Science (miscellaneous)
dc.subjectGeneral Computer Science
dc.subjectPhysical Sciences
dc.subjectArtificial intelligence
dc.subjectmachine learning
dc.subjectnatural language processing
dc.subjectlanguage model
dc.subjecttext generation
dc.subjectdeep learning
dc.subjectYapay zekâ
dc.subjectmakina öğrenmesi
dc.subjectdoğal dil işleme
dc.subjectdil modeli
dc.subjectmetin üretimi
dc.subjectderin öğrenme
dc.titleKodlayıcı kod çözücü ve dikkat algoritmaları kullanılarak karakter tabanlı kelime üretimi
dc.title.alternativeEncoder character based using decoder and attention algorithms word production
dc.typearticle
dspace.entity.typePublication

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
file.pdf
Size:
803.95 KB
Format:
Adobe Portable Document Format