Predstavitev oznak
Shema Universal Dependencies določa univerzalni nabor oznak za besedne vrste, oblikoslovne lastnosti in odvisnostne skladenjske relacije, ki se lahko prenesejo na drevesnice posameznih jezikov ali pa dopolnijo z novimi oblikoslovnimi oznakami oz. izpeljavami jedrnih relacij, če je to potrebno. Konkretno je bilo na slovenske podatke preneseno vseh 17 besednih vrst (Tabela 1), 22 oblikoslovnih lastnosti z 62 različnimi vrednostmi (Tabela 2) in 35 odvisnostnih relacij (Tabela 3).
Oznaka | Opis |
---|---|
ADJ | pridevnik |
ADP | adpozicija (predlog) |
ADV | prislov |
AUX | pomožnik |
CCONJ | priredni veznik |
DET | določilnik |
INTJ | medmet |
NOUN | samostalnik |
NUM | števnik |
PART | členek |
PRON | zaimek |
PROPN | lastnoimenski samostalnik |
PUNCT | ločilo |
SCONJ | podredni veznik |
SYM | simbol |
VERB | glagol |
X | drugo |
Tabela 1: Na slovenskih besedilih uporabljene oznake za besedne vrste.
Lastnost | Vrednosti | Opis |
---|---|---|
Abbr | Yes | okrajšanost |
Animacy | Anim, Inanim | živost |
Aspect | Imp, Perf | vid |
Case | Nom, Gen, Dat, Acc, Loc, Ins | sklon |
Definite | Ind, Def | določnost |
Degree | Pos, Cmp, Sup | stopnja |
Foreign | Yes | tujejezičnost |
Gender | Masc, Fem, Neut | spol |
Gender[psor] | Masc. Fem, Neut | spol svojine |
Mood | Ind, Imp, Cnd | naklon |
Number | Sing, Dual, Plur | število |
Number[psor] | Sing, Dual, Plur | število svojine |
NumForm | Word, Digit, Roman | oblika števnika |
NumType | Card, Ord, Mult, Sets | vrste števnika |
Person | 1, 2, 3 | oseba |
Polarity | Neg, Pos | nikalnost |
Poss | Yes | svojina |
PronType | Prs, Int, Rel, Dem, Tot, Neg, Ind | vrsta zimka |
Reflex | Yes | povratnost |
Tense | Pres, Fut | čas |
Variant | Bound, Short | oblika zaimka |
VerbForm | Fin, Inf, Sup, Part, Conv | vrsta glagola |
Tabela 2: Na slovenskih besedilih uporabljene oznake za oblikoslovne lastnosti. V korpusu so navedene v obliki parov lastnosti in vrednosti (npr. Tense=Pres).
Oznaka | Angleški opis | Slovenski opis |
---|---|---|
acl | clausal modifier of noun | stavčni prilastki |
advcl | adverbial clause modifier | prislovni odvisniki |
advmod | adverbial modifier | prislovna določila (v širšem smislu) |
amod | adjectival modifier | pridevniški prilastki |
appos | appositional modifier | pristavčna določila |
aux | auxiliary verb | pomožni glagoli |
case | case marking preposition | predlogi |
cc | coordinating conjunction | priredni vezniki |
ccomp | clausal complement | stavčna dopolnila (predmetni odvisniki) |
conj | conjunct | priredno zloženi elementi |
cop | copula verb | vezni glagoli |
csubj | clausal subject | osebkovi odvisniki |
dep | unspecified dependency | nedoločena povezava |
det | determiner | določilniki |
discourse | discourse element | diskurzni členki |
dislocated | dislocated element | dislocirani elementi |
expl | expletive | ekspletivne besede |
fixed | fixed multi-word expression | funkcijske zveze |
flat | flat multi word-expression | eksocentrične zveze |
goeswith | disjointed token | razdruženi deli besed |
iobj | indirect object | nepremi predmeti |
list | list | seznami |
mark | marker (subordinating conjunction) | podredni vezniki |
nmod | nominal modifier | samostalniški prilastki |
nsubj | nominal subject | samostalniški osebki |
nummod | numeric modifier | številčna določila |
obj | (direct) object | premi predmeti |
obl | oblique nominal (adjunct) | odvisne samostalniške zveze |
orphan | dependent of missing parent | elementi v eliptičnih strukturah |
parataxis | parataxis | stavčna soredja |
punct | punctuation symbol | ločila |
reparandum | overriden disfluency | samopopravljanja |
root | root element | koren povedi |
vocative | vocative | ogovori |
xcomp | open clausal complement | odprta stavčna dopolnila |
Tabela 3: Na slovenskih besedilih uporabljene oznake za odvisnostne skladenjske relacije.