Publication: Nesne tespiti ile Göktürkçe metinlerin okunması
Abstract
Bu metinlerin okunması ve yorumlanmasında nesne tespiti teknolojilerinin kullanılmasını araştırmaktadır. Göktürkçe, Türk tarihinin en eski yazılı dillerinden biri olup, özellikle Orhun Yazıtları gibi tarihi belgelerde yer almaktadır. Ancak, bu metinlerin okunması ve analiz edilmesi, dilin karmaşıklığı ve yazılı taşların aşınmışlığı nedeniyle zorluklar içermektedir. Bu çalışmada, derin öğrenme tekniklerine dayalı nesne tespiti algoritmaları kullanılarak Göktürkçe harflerin ve kelimelerin otomatik olarak tespit edilmesi ve tanınması hedeflenmiştir. Bu amaçla, öncelikle Göktürkçe yazıtların yüksek çözünürlüklü görüntüleri toplanmış ve bu görüntüler üzerinde veri setleri oluşturulmuştur. Veri setleri, nesne tespiti modellerinin eğitimi için etiketlenmiş ve hazırlanmıştır. Eğitim sürecinde, Convolutional Neural Networks (CNN) ve You Only Look Once (YOLO) gibi ileri seviye derin öğrenme modelleri kullanılmıştır. Modellerin performansı, doğru tespit ve tanıma oranları, yanıltıcı pozitif ve negatif tespitler gibi kriterler üzerinden değerlendirilmiştir. Ayrıca, nesne tespiti sonuçlarının doğruluğunu artırmak için veri artırma teknikleri ve transfer öğrenme stratejileri uygulanmıştır. Araştırma sonuçları, nesne tespiti algoritmalarının Göktürkçe metinlerin okunmasında etkin bir şekilde kullanılabileceğini göstermektedir. Elde edilen bulgular, tarihi metinlerin dijitalleştirilmesi, korunması ve incelenmesi konularında önemli katkılar sunmaktadır. Bu çalışma, ayrıca, benzer antik dillerin incelenmesi ve okunması için bir model teşkil etmekte olup, arkeoloji ve dilbilim alanlarında yeni araştırmalara ilham verebilir. Sonuç olarak, nesne tespiti teknolojileri, tarihsel ve dilsel araştırmalarda yeni bir perspektif sunarak, Göktürkçe metinlerin okunması ve anlaşılmasında önemli bir araç olarak öne çıkmaktadır. Bu tez, bu alandaki mevcut literatüre katkı sağlamayı ve gelecekteki çalışmalara temel oluşturmayı amaçlamaktadır.
This master's thesis investigates the use of object detection technologies in reading and interpreting Gokturk texts. Gokturk is one of the oldest written languages in Turkish history, notably found in historical documents such as the Orkhon Inscriptions. However, reading and analyzing these texts is challenging due to the complexity of the language and the erosion of the inscribed stones. In this study, object detection algorithms based on deep learning techniques are utilized to automatically detect and recognize Old Turkic letters and words. To achieve this, high-resolution images of Old Turkic inscriptions were first collected, and datasets were created from these images. The datasets were labeled and prepared for training object detection models. During the training process, advanced deep learning models such as Convolutional Neural Networks (CNN) and You Only Look Once (YOLO) were used. The performance of the models was evaluated based on criteria such as accurate detection and recognition rates, and false positive and negative detections. Additionally, data augmentation techniques and transfer learning strategies were applied to improve the accuracy of the object detection results. The research findings demonstrate that object detection algorithms can be effectively used in reading Old Turkic texts. The results provide significant contributions to the digitization, preservation, and analysis of historical texts. This study also serves as a model for examining and reading similar ancient languages, potentially inspiring new research in archaeology and linguistics. In conclusion, object detection technologies offer a new perspective in historical and linguistic research, emerging as an essential tool in reading and understanding Old Turkic texts. This thesis aims to contribute to the existing literature in this field and lay the groundwork for future studies.
This master's thesis investigates the use of object detection technologies in reading and interpreting Gokturk texts. Gokturk is one of the oldest written languages in Turkish history, notably found in historical documents such as the Orkhon Inscriptions. However, reading and analyzing these texts is challenging due to the complexity of the language and the erosion of the inscribed stones. In this study, object detection algorithms based on deep learning techniques are utilized to automatically detect and recognize Old Turkic letters and words. To achieve this, high-resolution images of Old Turkic inscriptions were first collected, and datasets were created from these images. The datasets were labeled and prepared for training object detection models. During the training process, advanced deep learning models such as Convolutional Neural Networks (CNN) and You Only Look Once (YOLO) were used. The performance of the models was evaluated based on criteria such as accurate detection and recognition rates, and false positive and negative detections. Additionally, data augmentation techniques and transfer learning strategies were applied to improve the accuracy of the object detection results. The research findings demonstrate that object detection algorithms can be effectively used in reading Old Turkic texts. The results provide significant contributions to the digitization, preservation, and analysis of historical texts. This study also serves as a model for examining and reading similar ancient languages, potentially inspiring new research in archaeology and linguistics. In conclusion, object detection technologies offer a new perspective in historical and linguistic research, emerging as an essential tool in reading and understanding Old Turkic texts. This thesis aims to contribute to the existing literature in this field and lay the groundwork for future studies.
