Predstavitev oznak
Shema Universal Dependencies določa univerzalni nabor oznak za besedne vrste, oblikoslovne lastnosti in odvisnostne skladenjske relacije, ki se lahko prenesejo na drevesnice posameznih jezikov ali pa dopolnijo z novimi oblikoslovnimi oznakami oz. izpeljavami jedrnih relacij, če je to potrebno. Konkretno je bilo na slovenske podatke preneseno vseh 17 besednih vrst (Tabela 1), 22 oblikoslovnih lastnosti z 62 različnimi vrednostmi (Tabela 2) in 35 odvisnostnih relacij (Tabela 3).
| Oznaka | Opis |
|---|---|
| ADJ | pridevnik |
| ADP | adpozicija (predlog) |
| ADV | prislov |
| AUX | pomožnik |
| CCONJ | priredni veznik |
| DET | določilnik |
| INTJ | medmet |
| NOUN | samostalnik |
| NUM | števnik |
| PART | členek |
| PRON | zaimek |
| PROPN | lastnoimenski samostalnik |
| PUNCT | ločilo |
| SCONJ | podredni veznik |
| SYM | simbol |
| VERB | glagol |
| X | drugo |
Tabela 1: Na slovenskih besedilih uporabljene oznake za besedne vrste.