Predstavitev oznak
Shema Universal Dependencies določa univerzalni nabor oznak za besedne vrste, oblikoslovne lastnosti in odvisnostne skladenjske relacije, ki se lahko prenesejo na drevesnice posameznih jezikov ali pa dopolnijo z novimi oblikoslovnimi oznakami oz. izpeljavami jedrnih relacij, če je to potrebno. Konkretno je bilo na slovenske podatke preneseno vseh 17 besednih vrst (Tabela 1), 22 oblikoslovnih lastnosti z 62 različnimi vrednostmi (Tabela 2) in 35 odvisnostnih relacij (Tabela 3).
Oznaka | Opis |
---|---|
ADJ | pridevnik |
ADP | adpozicija (predlog) |
ADV | prislov |
AUX | pomožnik |
CCONJ | priredni veznik |
DET | določilnik |
INTJ | medmet |
NOUN | samostalnik |
NUM | števnik |
PART | členek |
PRON | zaimek |
PROPN | lastnoimenski samostalnik |
PUNCT | ločilo |
SCONJ | podredni veznik |
SYM | simbol |
VERB | glagol |
X | drugo |
Tabela 1: Na slovenskih besedilih uporabljene oznake za besedne vrste.