Abstractive legal text summarization using attention mechanisms

Alomar, Rafah

Publication:
Abstractive legal text summarization using attention mechanisms

dc.contributor.advisor	GANİZ, Murat Can
dc.contributor.author	Alomar, Rafah
dc.contributor.department	Marmara Üniversitesi
dc.contributor.department	Fen Bilimleri Enstitüsü
dc.contributor.department	Bilgisayar Mühendisliği Anabilim Dalı
dc.date.accessioned	2026-01-13T07:34:41Z
dc.date.issued	2024
dc.description.abstract	Yasal belgelerin özetlenmesini otomatikleştirmek, karmaşık, terminoloji açısından ağır metinleri damıtarak hukuk uzmanları için önemli miktarda zaman kazandırabilir. Türk hukuk alanında, mevcut çalışmaların çoğu ekstraktif özetleme yöntemlerine odaklanmaktadır. Türkçe hukuk belgeleri için soyut özetlemeyi keşfeden ilk çalışma olan araştırmamız, yüksek mahkeme kararları ve özetleri içeren büyük bir veri seti hazırladı. Eğitim seti, ChatGPT kullanılarak oluşturulan 13.000 özet içerirken, test seti Marmara Üniversitesi Hukuk Fakültesi öğrencileri tarafından oluşturulan 2.922 özet içermektedir. Veri setlerimizi kullanarak birkaç önceden eğitilmiş transformatör modelini denedik, ince ayarladık ve değerlendirdik. Ekstraktif yöntemler ROUGE puanlarında soyut yöntemlerden daha iyi performans gösterse de, soyut yaklaşım daha tutarlı ve özlü özetler oluşturdu. F1 puanları açısından, BERT2BERT modelleri üstünlük gösterdi, BART en yüksek hassasiyeti 0,44 puanla elde etti ve GPT-2 en iyi geri çağırma sonuçlarını verdi. Bu araştırma, Türkçe hukuk belgeleri bağlamında soyut özetleme tekniklerinin gelecekteki gelişimi için temel bir adım oluşturmaktadır.
dc.description.abstract	Automating the summarization of legal documents can save significant time for legal professionals by distilling complex, terminology-heavy texts. In the Turkish legal domain, most existing work focuses on extractive summarization methods. Our study, the first to explore abstractive summarization for Turkish legal documents, compiled a large dataset of higher court decisions and summaries. The training set comprises 13,000 summaries generated using ChatGPT, while the test set contains 2,922 summaries created by Law Faculty students at Marmara University. We experimented with several pretrained transformer models, fine-tuning and evaluating them using our datasets. Although extractive methods outperformed abstractive ones in ROUGE scores, the abstractive approach generated more coherent and concise summaries. In terms of F1 scores, BERT2BERT models excelled, BART achieved the highest precision with a score of 0.44, and GPT-2 yielded the best recall results. This research serves as a foundational step for the future development of abstractive summarization techniques in the context of Turkish legal documents.
dc.format.extent	X, 65 sayfa
dc.identifier.uri	https://katalog.marmara.edu.tr/veriler/yordambt/cokluortam/5A/65f3ef7e0c8cb.pdf
dc.identifier.uri	https://hdl.handle.net/11424/296624
dc.language.iso	eng
dc.rights	info:eu-repo/semantics/openAccess
dc.subject	Abstraktif Özetleme Abstractive Summarization
dc.subject	Bilgisayar mühendisliği
dc.subject	Computer engineering
dc.subject	Hukuk Metni Özetleme
dc.subject	Legal Text Summarization
dc.subject	Pre-trained Language Models
dc.subject	Transformers
dc.title	Abstractive legal text summarization using attention mechanisms
dc.type	masterThesis
dspace.entity.type	Publication

Collections

Tezler

Publication: Abstractive legal text summarization using attention mechanisms

Files

Collections

Publication:
Abstractive legal text summarization using attention mechanisms