Predstavitev oznak
Shema Universal Dependencies določa univerzalni nabor oznak za besedne vrste, oblikoslovne lastnosti in odvisnostne skladenjske relacije, ki se lahko prenesejo na drevesnice posameznih jezikov ali pa dopolnijo z novimi oblikoslovnimi oznakami oz. izpeljavami jedrnih relacij, če je to potrebno. Konkretno je bilo na slovenske podatke preneseno vseh 17 besednih vrst (Tabela 1), 22 oblikoslovnih lastnosti z 62 različnimi vrednostmi (Tabela 2) in 35 odvisnostnih relacij (Tabela 3).
| Oznaka | Opis | 
|---|---|
| ADJ | pridevnik | 
| ADP | adpozicija (predlog) | 
| ADV | prislov | 
| AUX | pomožnik | 
| CCONJ | priredni veznik | 
| DET | določilnik | 
| INTJ | medmet | 
| NOUN | samostalnik | 
| NUM | števnik | 
| PART | členek | 
| PRON | zaimek | 
| PROPN | lastnoimenski samostalnik | 
| PUNCT | ločilo | 
| SCONJ | podredni veznik | 
| SYM | simbol | 
| VERB | glagol | 
| X | drugo | 
Tabela 1: Na slovenskih besedilih uporabljene oznake za besedne vrste.
| Lastnost | Vrednosti | Opis | 
|---|---|---|
| Abbr | Yes | okrajšanost | 
| Animacy | Anim, Inanim | živost | 
| Aspect | Imp, Perf | vid | 
| Case | Nom, Gen, Dat, Acc, Loc, Ins | sklon | 
| Definite | Ind, Def | določnost | 
| Degree | Pos, Cmp, Sup | stopnja | 
| Foreign | Yes | tujejezičnost | 
| Gender | Masc, Fem, Neut | spol | 
| Gender[psor] | Masc. Fem, Neut | spol svojine | 
| Mood | Ind, Imp, Cnd | naklon | 
| Number | Sing, Dual, Plur | število | 
| Number[psor] | Sing, Dual, Plur | število svojine | 
| NumForm | Word, Digit, Roman | oblika števnika | 
| NumType | Card, Ord, Mult, Sets | vrste števnika | 
| Person | 1, 2, 3 | oseba | 
| Polarity | Neg, Pos | nikalnost | 
| Poss | Yes | svojina | 
| PronType | Prs, Int, Rel, Dem, Tot, Neg, Ind | vrsta zimka | 
| Reflex | Yes | povratnost | 
| Tense | Pres, Fut | čas | 
| Variant | Bound, Short | oblika zaimka | 
| VerbForm | Fin, Inf, Sup, Part, Conv | vrsta glagola | 
Tabela 2: Na slovenskih besedilih uporabljene oznake za oblikoslovne lastnosti. V korpusu so navedene v obliki parov lastnosti in vrednosti (npr. Tense=Pres).
| Oznaka | Angleški opis | Slovenski opis | 
|---|---|---|
| acl | clausal modifier of noun | stavčni prilastki | 
| advcl | adverbial clause modifier | prislovni odvisniki | 
| advmod | adverbial modifier | prislovna določila (v širšem smislu) | 
| amod | adjectival modifier | pridevniški prilastki | 
| appos | appositional modifier | pristavčna določila | 
| aux | auxiliary verb | pomožni glagoli | 
| case | case marking preposition | predlogi | 
| cc | coordinating conjunction | priredni vezniki | 
| ccomp | clausal complement | stavčna dopolnila (predmetni odvisniki) | 
| conj | conjunct | priredno zloženi elementi | 
| cop | copula verb | vezni glagoli | 
| csubj | clausal subject | osebkovi odvisniki | 
| dep | unspecified dependency | nedoločena povezava | 
| det | determiner | določilniki | 
| discourse | discourse element | diskurzni členki | 
| dislocated | dislocated element | dislocirani elementi | 
| expl | expletive | ekspletivne besede | 
| fixed | fixed multi-word expression | funkcijske zveze | 
| flat | flat multi word-expression | eksocentrične zveze | 
| goeswith | disjointed token | razdruženi deli besed | 
| iobj | indirect object | nepremi predmeti | 
| list | list | seznami | 
| mark | marker (subordinating conjunction) | podredni vezniki | 
| nmod | nominal modifier | samostalniški prilastki | 
| nsubj | nominal subject | samostalniški osebki | 
| nummod | numeric modifier | številčna določila | 
| obj | (direct) object | premi predmeti | 
| obl | oblique nominal (adjunct) | odvisne samostalniške zveze | 
| orphan | dependent of missing parent | elementi v eliptičnih strukturah | 
| parataxis | parataxis | stavčna soredja | 
| punct | punctuation symbol | ločila | 
| reparandum | overriden disfluency | samopopravljanja | 
| root | root element | koren povedi | 
| vocative | vocative | ogovori | 
| xcomp | open clausal complement | odprta stavčna dopolnila | 
Tabela 3: Na slovenskih besedilih uporabljene oznake za odvisnostne skladenjske relacije.
