# 07 Universal Dependencies

# Predstavitev oznak

Shema Universal Dependencies določa univerzalni nabor oznak za besedne vrste, oblikoslovne lastnosti in odvisnostne skladenjske relacije, ki se lahko prenesejo na drevesnice posameznih jezikov ali pa dopolnijo z novimi oblikoslovnimi oznakami oz. izpeljavami jedrnih relacij, če je to potrebno. Konkretno je bilo na slovenske podatke preneseno vseh 17 besednih vrst (Tabela 1), 22 oblikoslovnih lastnosti z 62 različnimi vrednostmi (Tabela 2) in 35 odvisnostnih relacij (Tabela 3).

<table id="bkmrk-oznaka-opis-adj-prid"><thead><tr><th>**Oznaka**</th><th>**Opis**</th></tr></thead><tbody><tr><td>**ADJ**</td><td>pridevnik</td></tr><tr><td>**ADP**</td><td>adpozicija (predlog)</td></tr><tr><td>**ADV**</td><td>prislov</td></tr><tr><td>**AUX**</td><td>pomožnik</td></tr><tr><td>**CCONJ**</td><td>priredni veznik</td></tr><tr><td>**DET**</td><td>določilnik</td></tr><tr><td>**INTJ**</td><td>medmet</td></tr><tr><td>**NOUN**</td><td>samostalnik</td></tr><tr><td>**NUM**</td><td>števnik</td></tr><tr><td>**PART**</td><td>členek</td></tr><tr><td>**PRON**</td><td>zaimek</td></tr><tr><td>**PROPN**</td><td>lastnoimenski samostalnik</td></tr><tr><td>**PUNCT**</td><td>ločilo</td></tr><tr><td>**SCONJ**</td><td>podredni veznik</td></tr><tr><td>**SYM**</td><td>simbol</td></tr><tr><td>**VERB**</td><td>glagol</td></tr><tr><td>**X**</td><td>drugo</td></tr></tbody></table>

**Tabela 1:** Na slovenskih besedilih uporabljene oznake za besedne vrste.

<table id="bkmrk-lastnost-vrednosti-o"><thead><tr><th>**Lastnost**</th><th>**Vrednosti**</th><th>**Opis**</th></tr></thead><tbody><tr><td>**Abbr**</td><td> Yes</td><td>okrajšanost</td></tr><tr><td>**Animacy**</td><td> Anim, Inanim</td><td>živost</td></tr><tr><td>**Aspect**</td><td> Imp, Perf</td><td>vid</td></tr><tr><td>**Case**</td><td> Nom, Gen, Dat, Acc, Loc, Ins</td><td>sklon</td></tr><tr><td>**Definite**</td><td> Ind, Def</td><td>določnost</td></tr><tr><td>**Degree**</td><td> Pos, Cmp, Sup</td><td>stopnja</td></tr><tr><td>**Foreign**</td><td> Yes</td><td>tujejezičnost</td></tr><tr><td>**Gender**</td><td> Masc, Fem, Neut</td><td>spol</td></tr><tr><td>**Gender\[psor\]**</td><td> Masc. Fem, Neut</td><td>spol svojine</td></tr><tr><td>**Mood**</td><td> Ind, Imp, Cnd</td><td>naklon</td></tr><tr><td>**Number**</td><td> Sing, Dual, Plur</td><td>število</td></tr><tr><td>**Number\[psor\]**</td><td> Sing, Dual, Plur</td><td>število svojine</td></tr><tr><td>**NumForm**</td><td> Word, Digit, Roman</td><td>oblika števnika</td></tr><tr><td>**NumType**</td><td> Card, Ord, Mult, Sets</td><td>vrste števnika</td></tr><tr><td>**Person**</td><td> 1, 2, 3</td><td>oseba</td></tr><tr><td>**Polarity**</td><td> Neg, Pos</td><td>nikalnost</td></tr><tr><td>**Poss**</td><td> Yes</td><td>svojina</td></tr><tr><td>**PronType**</td><td> Prs, Int, Rel, Dem, Tot, Neg, Ind</td><td>vrsta zimka</td></tr><tr><td>**Reflex**</td><td> Yes</td><td>povratnost</td></tr><tr><td>**Tense**</td><td> Pres, Fut</td><td>čas</td></tr><tr><td>**Variant**</td><td> Bound, Short</td><td>oblika zaimka</td></tr><tr><td>**VerbForm**</td><td> Fin, Inf, Sup, Part, Conv</td><td>vrsta glagola</td></tr></tbody></table>

**Tabela 2:** Na slovenskih besedilih uporabljene oznake za oblikoslovne lastnosti. V korpusu so navedene v obliki parov lastnosti in vrednosti (npr. Tense=Pres).

<table id="bkmrk-oznaka-angle%C5%A1ki-opis"><thead><tr><th>**Oznaka**</th><th>**Angleški opis**</th><th>**Slovenski opis**</th></tr></thead><tbody><tr><td>**acl**</td><td>clausal modifier of noun</td><td>stavčni prilastki</td></tr><tr><td>**advcl**</td><td>adverbial clause modifier</td><td>prislovni odvisniki</td></tr><tr><td>**advmod**</td><td>adverbial modifier</td><td>prislovna določila (v širšem smislu)</td></tr><tr><td>**amod**</td><td>adjectival modifier</td><td>pridevniški prilastki</td></tr><tr><td>**appos**</td><td>appositional modifier</td><td>pristavčna določila</td></tr><tr><td>**aux**</td><td>auxiliary verb</td><td>pomožni glagoli</td></tr><tr><td>**case**</td><td>case marking preposition</td><td>predlogi</td></tr><tr><td>**cc**</td><td>coordinating conjunction</td><td>priredni vezniki</td></tr><tr><td>**ccomp**</td><td>clausal complement</td><td>stavčna dopolnila (predmetni odvisniki)</td></tr><tr><td>**conj**</td><td>conjunct</td><td>priredno zloženi elementi</td></tr><tr><td>**cop**</td><td>copula verb</td><td>vezni glagoli</td></tr><tr><td>**csubj**</td><td>clausal subject</td><td>osebkovi odvisniki</td></tr><tr><td>**dep**</td><td>unspecified dependency</td><td>nedoločena povezava</td></tr><tr><td>**det**</td><td>determiner</td><td>določilniki</td></tr><tr><td>**discourse**</td><td>discourse element</td><td>diskurzni členki</td></tr><tr><td>**dislocated**</td><td>dislocated element</td><td>dislocirani elementi</td></tr><tr><td>**expl**</td><td>expletive</td><td>ekspletivne besede</td></tr><tr><td>**fixed**</td><td>fixed multi-word expression</td><td>funkcijske zveze</td></tr><tr><td>**flat**</td><td>flat multi word-expression</td><td>eksocentrične zveze</td></tr><tr><td>**goeswith**</td><td>disjointed token</td><td>razdruženi deli besed</td></tr><tr><td>**iobj**</td><td>indirect object</td><td>nepremi predmeti</td></tr><tr><td>**list**</td><td>list</td><td>seznami</td></tr><tr><td>**mark**</td><td>marker (subordinating conjunction)</td><td>podredni vezniki</td></tr><tr><td>**nmod**</td><td>nominal modifier</td><td>samostalniški prilastki</td></tr><tr><td>**nsubj**</td><td>nominal subject</td><td>samostalniški osebki</td></tr><tr><td>**nummod**</td><td>numeric modifier</td><td>številčna določila</td></tr><tr><td>**obj**</td><td>(direct) object</td><td>premi predmeti</td></tr><tr><td>**obl**</td><td>oblique nominal (adjunct)</td><td>odvisne samostalniške zveze</td></tr><tr><td>**orphan**</td><td>dependent of missing parent</td><td>elementi v eliptičnih strukturah</td></tr><tr><td>**parataxis**</td><td>parataxis</td><td>stavčna soredja</td></tr><tr><td>**punct**</td><td>punctuation symbol</td><td>ločila</td></tr><tr><td>**reparandum**</td><td>overriden disfluency</td><td>samopopravljanja</td></tr><tr><td>**root**</td><td>root element</td><td>koren povedi</td></tr><tr><td>**vocative**</td><td>vocative</td><td>ogovori</td></tr><tr><td>**xcomp**</td><td>open clausal complement</td><td>odprta stavčna dopolnila</td></tr></tbody></table>

**Tabela 3:** Na slovenskih besedilih uporabljene oznake za odvisnostne skladenjske relacije (brez podoznak).

# Označevalne smernice

V tem poglavju so zbrane označevalne smernice za oblikoslovje in skladnjo po sistemu Universal Dependencies (UD).

**Različica 1.7   
projekt [SPOT](https://spot.ff.uni-lj.si/)**  
DOBROVOLJC, Kaja in TERČON, Luka: 2024. *Universal Dependencies: Smernice za označevanje besedil v slovenščini.* Različica 1.7. Rezultat projekta Na drevesnici temelječ pristop k raziskavam govorjene slovenščine. [\[DOCX\]](https://wiki.cjvt.si/attachments/70) [\[PDF\]](https://wiki.cjvt.si/attachments/71)

**Različica 1.3   
projekt [SPOT](https://spot.ff.uni-lj.si/)**  
DOBROVOLJC, Kaja in TERČON, Luka: 2023. *Universal Dependencies: Smernice za označevanje besedil v slovenščini.* Različica 1.3. Rezultat projekta Na drevesnici temelječ pristop k raziskavam govorjene slovenščine. [\[DOCX\]](https://wiki.cjvt.si/attachments/67) [\[PDF\]](https://wiki.cjvt.si/attachments/66)

**Različica 1.0   
projekt [Razvoj slovenščine v digitalnem okolju](https://rsdo.slovenscina.eu/)**  
DOBROVOLJC, Kaja in TERČON, Luka: 2023. *Universal Dependencies: Smernice za označevanje besedil v slovenščini.* Rezultat projekta Razvoj slovenščine v digitalnem okolju. [\[DOCX\]](https://wiki.cjvt.si/attachments/22) [\[PDF\]](https://wiki.cjvt.si/attachments/23)

Priloga k smernicam: Odprta vprašanja pri prenosu označevalne sheme Universal Dependencies na slovenska besedila  
[\[DOCX\]](https://wiki.cjvt.si/attachments/24) [\[PDF\]](https://wiki.cjvt.si/attachments/25)

# Reference in povezave

V tem poglavju so zbrane relevantne reference in povezave na projekte, v katerih se je označevalni sistem razvijal ter uporabljal.  
  
Krovna spletna stran projekta Universal Dependencies: [https://universaldependencies.org/](https://universaldependencies.org/)   
Splošne smernice: [https://universaldependencies.org/guidelines.html](https://universaldependencies.org/guidelines.html)   
Smernice za slovenščino (v angleščini): [https://universaldependencies.org/sl/index.html](https://universaldependencies.org/sl/index.html)   
Platforma za diskusijo glede smernic za slovenščino in predloge izboljšav (v angleščini): [https://github.com/UniversalDependencies/UD\_Slovenian-SSJ/issues](https://github.com/UniversalDependencies/UD_Slovenian-SSJ/issues)

**Korpusi z ročno pregledanimi oznakami UD**  
Drevesnica pisne slovenščine SSJ: [https://github.com/UniversalDependencies/UD\_Slovenian-SSJ](https://github.com/UniversalDependencies/UD_Slovenian-SSJ)  
Drevesnica govorjene slovenščine SST: [https://github.com/UniversalDependencies/UD\_Slovenian-SST](https://github.com/UniversalDependencies/UD_Slovenian-SST)  
Drevesnica SSJ kot del trenutne različice učnega korpusa SUK: Arhar Holdt, Špela; et al., 2024, Training corpus SUK 1.1, Slovenian language resource repository CLARIN.SI, ISSN 2820-4042, [http://hdl.handle.net/11356/1959](http://hdl.handle.net/11356/1959).

**Reference**  
Dobrovoljc, K. (2024). Extending the Spoken Slovenian Treebank. Conference on Language Technologies and Digital Humanities (JT-DH-2024), Ljubljana, Slovenia. [https://doi.org/10.5281/zenodo.13936394](https://doi.org/10.5281/zenodo.13936394)

Dobrovoljc, K., Terčon, L., Ljubešić, N. (2023). Universal Dependencies za slovenščino: nove smernice, ročno označeni podatki in razčlenjevalni model. Slovenščina 2.0, 11(1): 218–246. [https://doi.org/10.4312/slo2.0.2023.1.218-246](https://doi.org/10.4312/slo2.0.2023.1.218-246) [\[PDF\]](https://wiki.cjvt.si/attachments/65)

Dobrovoljc, K., Terčon, L., &amp; Ljubešić, N. (2022). Universal Dependencies za slovenščino: nadgradnja smernic, učnih podatkov in razčlenjevalnega modela. In D. Fišer &amp; T. Erjavec (Eds.), Jezikovne tehnologije in digitalna humanistika: zbornik konference (pp. 30–39). Inštitut za novejšo zgodovino. [https://nl.ijs.si/jtdh22/pdf/JTDH2022\_Dobrovoljc-et-al\_Universal-Dependencies-za-slovenscino.pdf](https://nl.ijs.si/jtdh22/pdf/JTDH2022_Dobrovoljc-et-al_Universal-Dependencies-za-slovenscino.pdf)

de Marneffe, M.-C., Manning, C. D., Nivre, J., &amp; Zeman, D. (2021). Universal Dependencies. Computational Linguistics, 47(2), 255–308. [https://doi.org/10.1162/coli\_a\_00402](https://doi.org/10.1162/coli_a_00402)

Nivre, J., de Marneffe, M.-C., Ginter, F., Hajič, J., Manning, C. D., Pyysalo, S., Schuster, S., Tyers, F., &amp; Zeman, D. (2020). Universal Dependencies v2: An Evergrowing Multilingual Treebank Collection. Proceedings of the Twelfth Language Resources and Evaluation Conference, 4034–4043. [https://aclanthology.org/2020.lrec-1.497](https://aclanthology.org/2020.lrec-1.497)

Dobrovoljc, K., Erjavec, T., &amp; Krek, S. (2017). The Universal Dependencies Treebank for Slovenian. Proceedings of the 6th Workshop on Balto-Slavic Natural Language Processing, 33–38. [https://doi.org/10.18653/v1/W17-1406](https://doi.org/10.18653/v1/W17-1406)

Dobrovoljc, K., &amp; Nivre, J. (2016). The Universal Dependencies Treebank of Spoken Slovenian. Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC’16), 1566–1573. [https://aclanthology.org/L16-1248](https://aclanthology.org/L16-1248)