Publication: Coreference resolution sieve based on answer set programming
Abstract
Coreference (e¸sgönderge) çözümlenmesi, cümleleri ve aynı gerçek dünya varlı˘gını ifade ettikleritakdirde metin içindeki edatları ba˘glama i¸sine verilen isimdir. Bu görevde yüksek ba¸sarı eldeetmek bilgi ve semantik gerektirir, örne˘gin; Obama ve ba¸skan kelimeleri arasında ba˘glantıkurulmalı ya da içerik bilgisine ba˘glı olarak, mesela bu bilgi makalenin tarihi olabilir, o takdirdebu iki kelime arasında ba˘glantı kurulmamalıdır. Modern son teknoloji coreference çözümlenmesimethodları istatistiksel yöntemleri veya kuralları veya her ikisini birden kullanır, ancak nadirenmetnin yüzeyinin ötesine geçer. Bu çalı¸smada Stanford dcoref coreference çözümlenmesimimarisinin, bilginin entegrasyonunu sa˘glayacak hesaplama mantı˘gı kullanarak uyarlanmasınıönerilmektedir. Stanford Sieve deterministik mimarisini uygulamak için temel bir kural çerçevesitanımlanmaktadır, bu da deterministik parçayı gerçekle¸stirmenin uygun oldu˘gunu göstermektedir.Yaptı˘gımız i¸s, deterministik mimariyi nondeterministik hale getirmeye yönelik ilk adımdır. Vizyonumuz,yeni mimarinin, (i) ba˘glantılar üzerinde kısıtlamalar getirmesi ve (ii) sı˘g semantik bilgiyedayalı olarak ke¸sfedilemeyen ba˘glantılar için yeni adaylar üretebilmesi için, yeni mimarininanlambilimsel bilgiyi bütünle¸stirmesine olanak tanımasıdır. Çerçevemizle elde etti˘gimiz deneyselsonuçlar, hesaplama mantı˘gının istenen esnekli˘gi sa˘gladı˘gını, bununla birlikte çok daha fazlakaynak gerektirdi˘gini önermektedir. Bu, kuralları daha az sürdürülebilir hale getiren performanskurallarını ayarlayarak önlenebilir ve ileride otomatik kural tabanlı optimizasyon algoritmalarınıngeli¸stirilmesinde kullanılması önerilmektedir .
Coreference Resolution is the task of connecting phrases and prepositions in a text if they denotethe same real world entity. Succeeding with a high score in this task naturally requiresknowledge and semantics, for example to link “Obama” with “the president”, or, depending onthe context, for example the date of the article, not to link these phrases. Contemporary state-ofthe-art Coreference Resolution methods use statistical methods or sets of rules or both, but rarelygo beyond the surface of the text. We propose an adaptation of the Stanford “dcoref” CoreferenceResolution architecture using computational logic, which will allow an integration of knowledge.We describe a basic rule framework for applying the deterministic architecture of Stanford Sievewhich shows that realizing the deterministic part is feasible. Our work is the first step towardmaking the deterministic architecture nondeterministic. Our vision is that this will allows the newarchitecture to flexibly integrate semantic knowledge in order to (i) impose constraints on links aswell as (ii) generate new candidates for links that cannot be discovered based on shallow semanticknowledge. Our empirical results with our framework suggest, that computational logic providesthe desired flexibility, however it also requires significantly more resources. This can be avertedby tuning the rules for performance, which unfortunately makes the rules less maintainable andsuggests future development of automatic rule-base optimization algorithms.
Coreference Resolution is the task of connecting phrases and prepositions in a text if they denotethe same real world entity. Succeeding with a high score in this task naturally requiresknowledge and semantics, for example to link “Obama” with “the president”, or, depending onthe context, for example the date of the article, not to link these phrases. Contemporary state-ofthe-art Coreference Resolution methods use statistical methods or sets of rules or both, but rarelygo beyond the surface of the text. We propose an adaptation of the Stanford “dcoref” CoreferenceResolution architecture using computational logic, which will allow an integration of knowledge.We describe a basic rule framework for applying the deterministic architecture of Stanford Sievewhich shows that realizing the deterministic part is feasible. Our work is the first step towardmaking the deterministic architecture nondeterministic. Our vision is that this will allows the newarchitecture to flexibly integrate semantic knowledge in order to (i) impose constraints on links aswell as (ii) generate new candidates for links that cannot be discovered based on shallow semanticknowledge. Our empirical results with our framework suggest, that computational logic providesthe desired flexibility, however it also requires significantly more resources. This can be avertedby tuning the rules for performance, which unfortunately makes the rules less maintainable andsuggests future development of automatic rule-base optimization algorithms.
