Predstavitev oznak
Shema Universal Dependencies določa univerzalni nabor oznak za besedne vrste, oblikoslovne lastnosti in odvisnostne skladenjske relacije, ki se lahko prenesejo na drevesnice posameznih jezikov ali pa dopolnijo z novimi oblikoslovnimi oznakami oz. izpeljavami jedrnih relacij, če je to potrebno. Konkretno je bilo na slovenske podatke preneseno vseh 17 besednih vrst (Tabela 1), 22 oblikoslovnih lastnosti z 62 različnimi vrednostmi (Tabela 2) in 35 odvisnostnih relacij (Tabela 3).
| Oznaka | Opis |
|---|---|
| ADJ | pridevnik |
| ADP | adpozicija (predlog) |
| ADV | prislov |
| AUX | pomožnik |
| CCONJ | priredni veznik |
| DET | določilnik |
| INTJ | medmet |
| NOUN | samostalnik |
| NUM | števnik |
| PART | členek |
| PRON | zaimek |
| PROPN | lastnoimenski samostalnik |
| PUNCT | ločilo |
| SCONJ | podredni veznik |
| SYM | simbol |
| VERB | glagol |
| X | drugo |
Tabela 1: Na slovenskih besedilih uporabljene oznake za besedne vrste.
| Lastnost | Vrednosti | Opis |
|---|---|---|
| Abbr | Yes | okrajšanost |
| Animacy | Anim, Inanim | živost |
| Aspect | Imp, Perf | vid |
| Case | Nom, Gen, Dat, Acc, Loc, Ins | sklon |
| Definite | Ind, Def | določnost |
| Degree | Pos, Cmp, Sup | stopnja |
| Foreign | Yes | tujejezičnost |
| Gender | Masc, Fem, Neut | spol |
| Gender[psor] | Masc. Fem, Neut | spol svojine |
| Mood | Ind, Imp, Cnd | naklon |
| Number | Sing, Dual, Plur | število |
| Number[psor] | Sing, Dual, Plur | število svojine |
| NumForm | Word, Digit, Roman | oblika števnika |
| NumType | Card, Ord, Mult, Sets | vrste števnika |
| Person | 1, 2, 3 | oseba |
| Polarity | Neg, Pos | nikalnost |
| Poss | Yes | svojina |
| PronType | Prs, Int, Rel, Dem, Tot, Neg, Ind | vrsta zimka |
| Reflex | Yes | povratnost |
| Tense | Pres, Fut | čas |
| Variant | Bound, Short | oblika zaimka |
| VerbForm | Fin, Inf, Sup, Part, Conv | vrsta glagola |
Tabela 2: Na slovenskih besedilih uporabljene oznake za oblikoslovne lastnosti. V korpusu so navedene v obliki parov lastnosti in vrednosti (npr. Tense=Pres).
| Oznaka | Angleški opis | Slovenski opis |
|---|---|---|
| acl | clausal modifier of noun | stavčni prilastki |
| advcl | adverbial clause modifier | prislovni odvisniki |
| advmod | adverbial modifier | prislovna določila (v širšem smislu) |
| amod | adjectival modifier | pridevniški prilastki |
| appos | appositional modifier | pristavčna določila |
| aux | auxiliary verb | pomožni glagoli |
| case | case marking preposition | predlogi |
| cc | coordinating conjunction | priredni vezniki |
| ccomp | clausal complement | stavčna dopolnila (predmetni odvisniki) |
| conj | conjunct | priredno zloženi elementi |
| cop | copula verb | vezni glagoli |
| csubj | clausal subject | osebkovi odvisniki |
| dep | unspecified dependency | nedoločena povezava |
| det | determiner | določilniki |
| discourse | discourse element | diskurzni členki |
| dislocated | dislocated element | dislocirani elementi |
| expl | expletive | ekspletivne besede |
| fixed | fixed multi-word expression | funkcijske zveze |
| flat | flat multi word-expression | eksocentrične zveze |
| goeswith | disjointed token | razdruženi deli besed |
| iobj | indirect object | nepremi predmeti |
| list | list | seznami |
| mark | marker (subordinating conjunction) | podredni vezniki |
| nmod | nominal modifier | samostalniški prilastki |
| nsubj | nominal subject | samostalniški osebki |
| nummod | numeric modifier | številčna določila |
| obj | (direct) object | premi predmeti |
| obl | oblique nominal (adjunct) | odvisne samostalniške zveze |
| orphan | dependent of missing parent | elementi v eliptičnih strukturah |
| parataxis | parataxis | stavčna soredja |
| punct | punctuation symbol | ločila |
| reparandum | overriden disfluency | samopopravljanja |
| root | root element | koren povedi |
| vocative | vocative | ogovori |
| xcomp | open clausal complement | odprta stavčna dopolnila |
Tabela 3: Na slovenskih besedilih uporabljene oznake za odvisnostne skladenjske relacije.