Skip to main content

Predstavitev oznak

Shema Universal Dependencies določa univerzalni nabor oznak za besedne vrste, oblikoslovne lastnosti in odvisnostne skladenjske relacije, ki se lahko prenesejo na drevesnice posameznih jezikov ali pa dopolnijo z novimi oblikoslovnimi oznakami oz. izpeljavami jedrnih relacij, če je to potrebno. Konkretno je bilo na slovenske podatke preneseno vseh 17 besednih vrst (Tabela 1), 22 oblikoslovnih lastnosti z 62 različnimi vrednostmi (Tabela 2) in 35 odvisnostnih relacij (Tabela 3).

Oznaka Opis
ADJ pridevnik
ADP adpozicija (predlog)
ADV prislov
AUX pomožnik
CCONJ priredni veznik
DET določilnik
INTJ medmet
NOUN samostalnik
NUM števnik
PART členek
PRON zaimek
PROPN lastnoimenski samostalnik
PUNCT ločilo
SCONJ podredni veznik
SYM simbol
VERB glagol
X drugo

Tabela 1: Na slovenskih besedilih uporabljene oznake za besedne vrste.