Predstavitev oznak
Shema Universal Dependencies določa univerzalni nabor oznak za besedne vrste, oblikoslovne lastnosti in odvisnostne skladenjske relacije, ki se lahko prenesejo na drevesnice posameznih jezikov ali pa dopolnijo z novimi oblikoslovnimi oznakami oz. izpeljavami jedrnih relacij, če je to potrebno. Konkretno je bilo na slovenske podatke preneseno vseh 17 besednih vrst (Tabela 1), 22 oblikoslovnih lastnosti z 62 različnimi vrednostmi (Tabela 2) in 35 odvisnostnih relacij (Tabela 3).
| Oznaka | Opis |
|---|---|
| ADJ | pridevnik |
| ADP | adpozicija (predlog) |
| ADV | prislov |
| AUX | pomožnik |
| CCONJ | priredni veznik |
| DET | določilnik |
| INTJ | medmet |
| NOUN | samostalnik |
| NUM | števnik |
| PART | členek |
| PRON | zaimek |
| PROPN | lastnoimenski samostalnik |
| PUNCT | ločilo |
| SCONJ | podredni veznik |
| SYM | simbol |
| VERB | glagol |
| X | drugo |
Tabela 1: Na slovenskih besedilih uporabljene oznake za besedne vrste.
| Lastnost | Vrednosti | Opis |
|---|---|---|
| Abbr | okrajšanost | |
| Animacy | živost | |
| Aspect | vid | |
| Case | sklon | |
| Definite | določnost | |
| Degree | stopnja | |
| Foreign | tujejezičnost | |
| Gender | spol | |
| Gender[psor] | spol svojine | |
| Mood | naklon | |
| Number | število | |
| Number[psor] | število svojine | |
| NumForm | oblika števnika | |
| NumType | vrste števnika | |
| Person | oseba | |
| Polarity | nikalnost | |
| Poss | svojina | |
| PronType | vrsta zimka | |
| Reflex | povratnost | |
| Tense | čas | |
| Variant | oblika zaimka | |
| VerbForm | vrsta glagola |
Tabela 2: Na slovenskih besedilih uporabljene oznake za oblikoslovne lastnosti. V korpusu so navedene v obliki parov lastnosti in vrednosti (npr. Tense=Pres).
| Oznaka | Angleški opis | Slovenski opis |
|---|---|---|
| acl | clausal modifier of noun | stavčni prilastki |
| advcl | adverbial clause modifier | prislovni odvisniki |
| advmod | adverbial modifier | prislovna določila (v širšem smislu) |
| amod | adjectival modifier | pridevniški prilastki |
| appos | appositional modifier | pristavčna določila |
| aux | auxiliary verb | pomožni glagoli |
| case | case marking preposition | predlogi |
| cc | coordinating conjunction | priredni vezniki |
| ccomp | clausal complement | stavčna dopolnila (predmetni odvisniki) |
| conj | conjunct | priredno zloženi elementi |
| cop | copula verb | vezni glagoli |
| csubj | clausal subject | osebkovi odvisniki |
| dep | unspecified dependency | nedoločena povezava |
| det | determiner | določilniki |
| discourse | discourse element | diskurzni členki |
| dislocated | dislocated element | dislocirani elementi |
| expl | expletive | ekspletivne besede |
| fixed | fixed multi-word expression | funkcijske zveze |
| flat | flat multi word-expression | eksocentrične zveze |
| goeswith | disjointed token | razdruženi deli besed |
| iobj | indirect object | nepremi predmeti |
| list | list | seznami |
| mark | marker (subordinating conjunction) | podredni vezniki |
| nmod | nominal modifier | samostalniški prilastki |
| nsubj | nominal subject | samostalniški osebki |
| nummod | numeric modifier | številčna določila |
| obj | (direct) object | premi predmeti |
| obl | oblique nominal (adjunct) | odvisne samostalniške zveze |
| orphan | dependent of missing parent | elementi v eliptičnih strukturah |
| parataxis | parataxis | stavčna soredja |
| punct | punctuation symbol | ločila |
| reparandum | overriden disfluency | samopopravljanja |
| root | root element | koren povedi |
| vocative | vocative | ogovori |
| xcomp | open clausal complement | odprta stavčna dopolnila |
Tabela 3: Na slovenskih besedilih uporabljene oznake za odvisnostne skladenjske relacije.relacije (brez podoznak).