Publication: Retrospektif kohort çalışmaları için yapay zeka destekli kullanıcı arayüzü geliştirilmesi : nükleer tıp alanında bir vaka çalışması
Abstract
Retrospektif kohort çalışmaları için yapay zeka destekli kullanıcı arayüzü geliştirilmesi : nükleer tıp alanında bir vaka çalışması Son yıllarda yapay zekâ (AI) alanındaki ilerlemeler, bilimsel araştırma ve klinik uygulamalarda yenilikçi gelişmelere yol açmıştır. Otomasyon, akıllı veri işleme ve tahmine dayalı analiz gibi yetkinlikler, sağlık alanında daha önce mümkün olmayan uygulamaların önünü açmıştır. Bu bağlamda, insan dilini yüksek doğrulukla anlama, üretme ve analiz etme kapasitesine sahip Büyük Dil Modelleri (LLM), özellikle yapılandırılmamış verilerin yönetimi açısından dikkat çekici bir potansiyele sahiptir. Elektronik hasta kayıtları, laboratuvar sonuçları, görüntüleme raporları ve el yazısı tıbbi belgeler bu kapsamda en kritik veri kaynaklarını oluşturmaktadır. Retrospektif kohort çalışmaları, hastalık progresyonu, tedavi yanıtları ve klinik sonuçların değerlendirilmesinde temel yöntemlerden biridir. Ancak tarihsel el yazısı kayıtların heterojenliği, eksikliği ve okunabilirlik sorunları bu araştırma yaklaşımının önünde önemli engeller teşkil etmektedir. Manuel dijitalleştirme süreçleri ise hem zaman alıcı hem de hata ve gizlilik riski barındırmaktadır. Bu sorunları aşmak amacıyla, bu tez kapsamında İstanbul Üniversitesi-Cerrahpaşa, Cerrahpaşa Tıp Fakültesi, Dahili Tıp Bilimleri Bölümü, Nükleer Tıp ndaki tiroid kanseri vakalarına odaklanan, AI destekli bir retrospektif analiz sistemi geliştirilmiştir. Sistem, el yazısı belgeleri dijitalleştirmek ve metin içeriklerini çıkarmak için optik karakter tanıma (OCR) teknikleri ile LLM tabanlı dil işleme modellerini bir arada kullanmaktadır. Görüntü iyileştirme, gürültü azaltma ve segmentasyon gibi ön işleme adımları doğruluk oranlarını artırmak üzere sürece entegre edilmiştir. Elde edilen veriler; hasta demografisi, klinik raporlar, laboratuvar sonuçları ve görüntüleme bulgularını kapsayan ilişkisel bir veritabanında yapılandırılmıştır. Süreci yöneten yapay zekâ ajanı, belge sınıflandırma, metin çıkarımı, hata düzeltme ve veritabanı entegrasyonu görevlerini otomatikleştirerek iş akışının bütüncül yönetimini sağlamaktadır. Geliştirilen sistem hem mobil uygulama hem de web tabanlı kullanıcı arayüzleri ile desteklenmiştir. Mobil uygulama, yeni belgelerden gerçek zamanlı veri toplama ve manuel giriş hatalarının azaltılması imkânı sunarken; web arayüzü ayrıntılı analiz, görselleştirme ve raporlama desteği sağlamaktadır. Klinik kullanıcılar ve araştırmacılar, veri filtreleme, istatistiksel özetleme ve hasta sonuçlarının zamansal takibi gibi işlevler aracılığıyla eyleme dönüştürülebilir bilgilere erişebilmektedir. Hibrit mobil uygulama, yeni belgelerden gerçek zamanlı veri toplama imkânı sunarak manuel giriş hatalarını azaltırken, web tabanlı arayüz detaylı analiz, görselleştirme ve raporlama desteği sağlamaktadır. Sistem, veri filtreleme, istatistiksel özetleme ve hasta sonuçlarının zamansal takibini yaparak klinisyen ve araştırmacılara eyleme dönüştürülebilir bilgiler sunmaktadır. Uygulama sürecinde karşılaşılan temel zorluklar arasında tutarsız el yazısı, eksik kayıtlar ve veri gizliliği sorunları yer almıştır. Bu bağlamda hasta bilgileri anonimleştirilmiş, güvenli veri saklama yöntemleri, erişim kontrolü ve denetleme mekanizmaları uygulanmıştır. Elde edilen sonuçlar, sistemin retrospektif veri toplama süresini önemli ölçüde kısalttığını ve veri kalitesini artırdığını göstermektedir. Önceden haftalar süren manuel giriş süreçleri, bu sistem aracılığıyla daha hızlı, güvenilir ve tekrarlanabilir bir biçimde yürütülebilmektedir. Ayrıca modüler ve genişletilebilir yapısı sayesinde, sistemin farklı klinik alanlara veya araştırma konularına uyarlanabilmesi mümkündür. Sonuç olarak, bu tez çalışması, LLM, yapay zekâ ajanları ve özel dijital arayüzlerin retrospektif kohort araştırmalarında etkin ve güvenilir biçimde kullanılabileceğini ortaya koymaktadır. Tarihsel kayıtların otomatik dijitalleştirilmesi, metin çıkarımı ve yapılandırılması yoluyla geçmiş ile günümüz araştırma süreçleri arasında bir köprü kurulmuş; araştırma verimliliği artırılmış, hasta gizliliği korunmuş ve sağlık alanında daha geniş uygulamalara yönelik güçlü bir temel sunulmuştur.
Development of an artifıcial intelligence-assisted user interface for retrospective cohort studies : a case study in nuclear medicine In recent years, advances in artificial intelligence (AI) have led to innovative developments in scientific research and clinical applications. Competencies such as automation, intelligent data processing, and predictive analysis have enabled healthcare practices that were previously unattainable. In this context, Large Language Models (LLMs), with their capacity to accurately understand, generate, and analyze human language, hold remarkable potential, particularly in the management of unstructured data. Electronic health records, laboratory results, imaging reports, and handwritten medical documents constitute the most critical data sources in this regard. Retrospective cohort studies are a fundamental method for assessing disease progression, treatment responses, and clinical outcomes. However, the heterogeneity, incompleteness, and readability issues of historical handwritten records present significant obstacles to this research approach. Manual digitization processes, on the other hand, are time-consuming, error-prone, and raise privacy concerns. To address these challenges, this thesis develops an AI-supported retrospective analysis system focusing on thyroid cancer cases at Istanbul University-Cerrahpaşa, Cerrahpaşa Faculty of Medicine, Department of Internal Medicine, Division of Nuclear Medicine. The system integrates optical character recognition (OCR) techniques with LLM-based language processing models to digitize handwritten documents and extract their textual content. Preprocessing steps such as image enhancement, noise reduction, and segmentation were incorporated to improve accuracy rates. The extracted data were structured into a relational database encompassing patient demographics, clinical reports, laboratory results, and imaging findings. An AI agent manages the overall workflow by automating document classification, text extraction, error correction, and database integration. The developed system is supported by both a mobile application and a web-based user interface. The mobile application enables real-time data collection from new documents and reduces manual entry errors, while the web interface provides detailed analysis, visualization, and reporting support. Clinical users and researchers can access actionable insights through functions such as data filtering, statistical summarization, and temporal tracking of patient outcomes. The main challenges encountered during implementation included inconsistent handwriting, missing records, and data privacy concerns. Accordingly, patient information was anonymized, and secure data storage methods, access controls, and auditing mechanisms were applied. The results demonstrate that the system significantly reduces the time required for retrospective data collection while improving data quality. Manual entry processes that previously took weeks can now be performed more rapidly, reliably, and reproducibly. Furthermore, due to its modular and extensible design, the system can be adapted to other clinical domains or research contexts. In conclusion, this thesis shows that LLMs, AI agents, and customized digital interfaces can be effectively and reliably employed in retrospective cohort studies. By automating digitization, text extraction, and structuring of historical records, the system bridges the gap between past and contemporary research processes, enhances research efficiency, safeguards patient privacy, and provides a strong foundation for broader applications in healthcare research.
Development of an artifıcial intelligence-assisted user interface for retrospective cohort studies : a case study in nuclear medicine In recent years, advances in artificial intelligence (AI) have led to innovative developments in scientific research and clinical applications. Competencies such as automation, intelligent data processing, and predictive analysis have enabled healthcare practices that were previously unattainable. In this context, Large Language Models (LLMs), with their capacity to accurately understand, generate, and analyze human language, hold remarkable potential, particularly in the management of unstructured data. Electronic health records, laboratory results, imaging reports, and handwritten medical documents constitute the most critical data sources in this regard. Retrospective cohort studies are a fundamental method for assessing disease progression, treatment responses, and clinical outcomes. However, the heterogeneity, incompleteness, and readability issues of historical handwritten records present significant obstacles to this research approach. Manual digitization processes, on the other hand, are time-consuming, error-prone, and raise privacy concerns. To address these challenges, this thesis develops an AI-supported retrospective analysis system focusing on thyroid cancer cases at Istanbul University-Cerrahpaşa, Cerrahpaşa Faculty of Medicine, Department of Internal Medicine, Division of Nuclear Medicine. The system integrates optical character recognition (OCR) techniques with LLM-based language processing models to digitize handwritten documents and extract their textual content. Preprocessing steps such as image enhancement, noise reduction, and segmentation were incorporated to improve accuracy rates. The extracted data were structured into a relational database encompassing patient demographics, clinical reports, laboratory results, and imaging findings. An AI agent manages the overall workflow by automating document classification, text extraction, error correction, and database integration. The developed system is supported by both a mobile application and a web-based user interface. The mobile application enables real-time data collection from new documents and reduces manual entry errors, while the web interface provides detailed analysis, visualization, and reporting support. Clinical users and researchers can access actionable insights through functions such as data filtering, statistical summarization, and temporal tracking of patient outcomes. The main challenges encountered during implementation included inconsistent handwriting, missing records, and data privacy concerns. Accordingly, patient information was anonymized, and secure data storage methods, access controls, and auditing mechanisms were applied. The results demonstrate that the system significantly reduces the time required for retrospective data collection while improving data quality. Manual entry processes that previously took weeks can now be performed more rapidly, reliably, and reproducibly. Furthermore, due to its modular and extensible design, the system can be adapted to other clinical domains or research contexts. In conclusion, this thesis shows that LLMs, AI agents, and customized digital interfaces can be effectively and reliably employed in retrospective cohort studies. By automating digitization, text extraction, and structuring of historical records, the system bridges the gap between past and contemporary research processes, enhances research efficiency, safeguards patient privacy, and provides a strong foundation for broader applications in healthcare research.
Description
Keywords
AI agents, Belge sınıflandırma, Bilgisayar mühendisliği, Büyük Dil Modelleri (BDM), Clinical data processing, Clinical research, Computer engineering, Data anonymization, Data digitization, Document classification, El yazısı tıbbi kayıtlar, Electronic health records, Elektronik sağlık kayıtları, Görüntü ön işleme, Handwritten medical records, Image preprocessing, İlişkisel veritabanı, Klinik araştırma, Klinik veri işleme, Large Language Models (LLMs), Medical informatics, Metin çıkarma, Nuclear medicine, Nükleer tıp, Optical Character Recognition (OCR), Optik Karakter Tanıma (OCR)Retrospektif kohort çalışması, Öngörüsel analiz, Predictive analysis, Relational database, Retrospective cohort study, Text extraction, Thyroid cancer, Tıbbi bilişim Artificial Intelligence (AI), Tiroid kanseri, Unstructured data, Veri anonimleştirme, Veri dijitalleştirme, Yapay Zekâ (YZ), Yapay zekâ ajanları, Yapılandırılmamış veri
