# 09 Koreference

# Predstavitev označevanja koreferenčnosti

V tem poglavju je strnjeno predstavljeno označevanje koreferenc. Podrobnejšo predstavitev najdete v smernicah v poglavju Označevalne smernice.

Dele besedila, ki se nanašajo na istega referenta, imenujemo **omenitve** (angl. *mentions*). Omenitve se lahko pojavljajo preko različnih stavkov, povedi, odstavkov ali drugih delov besedila. Pri označevanju jih povežemo v t. i. **koreferenčno verigo** (angl. *coreference chain*). Koreferenčne verige nakazujemo z različnimi barvami, kot na primer v naslednjih povedih:

- **\[1.a\]** <span style="color:blue">Peter</span> ima <span style="color:magenta">dva psa</span>.
- **\[1.b\]** <span style="color:blue">On</span> se velikokrat igra z <span style="color:magenta">njima</span>.

Omenitvi *Peter* in *On* se nanašata na istega referenta, tj. isto konkretno osebo, kar pomeni, da sta koreferenčni. Enako velja za omenitvi *njima* in *dva psa*, ki se nanašata na isti par živali.  
Naloga pri označevanju koreferenčnosti je identifikacija in povezovanje omenitev. Označuje se samo omenitve, ki so koreferenčne z drugo omenitvijo. Delov besedila, ki niso koreferenčni z nobenim drugim delom besedila, torej ne označujemo.  
  
Označevanja koreferenčnosti prikazuje še spodnja shema. Prikazane so tri omenitve, ki se sklicujejo na določeno entiteto. Povezave med zaporednimi omenitvami, ki se sklicujejo na isto entiteto, so koreferenčne povezave in skupaj z vsemi omenitvami tvorijo koreferenčno verigo. Vsaka omenitev ima določene še lastne oznake.

[![coref_shema.png](https://wiki.cjvt.si/uploads/images/gallery/2023-03/scaled-1680-/coref-shema.png)](https://wiki.cjvt.si/uploads/images/gallery/2023-03/coref-shema.png)

# Označevalne smernice

V tem poglavju so zbrane označevalne smernice za odkrivanje koreferenčnosti.

**Različica 1.6  
projekt [Razvoj slovenščine v digitalnem okolju](https://rsdo.slovenscina.eu/)**  
ŽITNIK, Slavko, ARHAR HOLDT, Špela, ROBIDA, Nejc in BLAGUS, Neli, 2023: *Smernice za označevanje koreferenčnosti v slovenskem jeziku*: Različica 1.6. Čistopis za projekt Razvoj slovenščine v digitalnem okolju. [\[DOCX\]](https://wiki.cjvt.si/attachments/32) [\[PDF\]](https://wiki.cjvt.si/attachments/33)

# Reference in povezave

V tem poglavju so zbrane relevantne reference in povezave na projekte, v katerih se je označevalni sistem razvijal ter uporabljal.

**Projekti, na katerih se je razvijal označevalni sistem** [ReLDI](https://reldi.spur.uzh.ch/)  
[Razvoj slovenščine v digitalnem okolju](https://rsdo.slovenscina.eu/)

**Reference** RELDI: Uputstvo za anotiranje koreferenci, Verzija 1.1, Januar 2018.

Martha Palmer, Will Styler, Kevin Crooks, Tim O'Gorman: *Richer Event Description (RED) Annotation Guidelines* v.1.7. [https://github.com/timjogorman/RicherEventDescription/blob/master/guidelines.md](https://github.com/timjogorman/RicherEventDescription/blob/master/guidelines.md)

M. Ogrodniczuk, M. Zawisławska, K. Głowińska, and A. Savary, Coreference Annotation Schema for an Inflectional Language, in *Proceedings of the 14th International Conference on Intelligent Text Processing and Computational Linguistics (CICLing 2013)*, 2013, pp. 394–407.

M. Ogrodniczuk, K. Głowińska, M. Kopeć, A. Savary, and M. Zawisławska, Interesting Linguistic Features in Coreference Annotation of an Inflectional Language, in *Proceedings of the 12th China National Conference on Computational Linguistics (CCL 2013) and the First International Symposium on Natural Language Processing Based on Naturally Annotated Big Data (NLP-NABD 2013)*, 2013, pp. 97–108.

S. Pradhan, A. Moschitti, N. Xue, O. Uryupina, and Y. Zhang, “CoNLL-2012 Shared Task: Modeling Multilingual Unrestricted Coreference in OntoNotes,” in Proceedings of the Joint Conference on EMNLP and CoNLL: Shared Task, 2012, pp. 1–40.

M. Recasens, M. A. Martí, and C. Orasan, Annotating Near-Identity from Coreference Disagreements, *Proceedings of LREC 2012*, pp. 165–172, 2012.

M. Recasens, *Coreference: Theory, Annotation, Resolution and Evaluation*, PhD dissertation, 2010.