Predstavitev oznak
Shema Universal Dependencies določa univerzalni nabor oznak za besedne vrste, oblikoslovne lastnosti in odvisnostne skladenjske relacije, ki se lahko prenesejo na drevesnice posameznih jezikov ali pa dopolnijo z novimi oblikoslovnimi oznakami oz. izpeljavami jedrnih relacij, če je to potrebno. Konkretno je bilo na slovenske podatke preneseno vseh 17 besednih vrst (Tabela 1), 22 oblikoslovnih lastnosti z 62 različnimi vrednostmi (Tabela 2) in 35 odvisnostnih relacij (Tabela 3).
Oznaka | Opis |
---|---|
ADJ | pridevnik |
ADP | adpozicija (predlog) |
ADV | prislov |
AUX | pomožnik |
CCONJ | priredni veznik |
DET | določilnik |
INTJ | medmet |
NOUN | samostalnik |
NUM | števnik |
PART | členek |
PRON | zaimek |
PROPN | lastnoimenski samostalnik |
PUNCT | ločilo |
SCONJ | podredni veznik |
SYM | simbol |
VERB | glagol |
X | drugo |
Tabela 1: Na slovenskih besedilih uporabljene oznake za besedne vrste.
Lastnost | Vrednosti | Opis |
---|---|---|
Abbr | okrajšanost | |
Animacy | živost | |
Aspect | vid | |
Case | sklon | |
Definite | določnost | |
Degree | stopnja | |
Foreign | tujejezičnost | |
Gender | spol | |
Gender[psor] | spol svojine | |
Mood | naklon | |
Number | število | |
Number[psor] | število svojine | |
NumForm | oblika števnika | |
NumType | vrste števnika | |
Person | oseba | |
Polarity | nikalnost | |
Poss | svojina | |
PronType | vrsta zimka | |
Reflex | povratnost | |
Tense | čas | |
Variant | oblika zaimka | |
VerbForm | vrsta glagola |
Tabela 2: Na slovenskih besedilih uporabljene oznake za oblikoslovne lastnosti. V korpusu so navedene v obliki parov lastnosti in vrednosti (npr. Tense=Pres).
Oznaka | Angleški opis | Slovenski opis |
---|---|---|
acl | clausal modifier of noun | stavčni prilastki |
advcl | adverbial clause modifier | prislovni odvisniki |
advmod | adverbial modifier | prislovna določila (v širšem smislu) |
amod | adjectival modifier | pridevniški prilastki |
appos | appositional modifier | pristavčna določila |
aux | auxiliary verb | pomožni glagoli |
case | case marking preposition | predlogi |
cc | coordinating conjunction | priredni vezniki |
ccomp | clausal complement | stavčna dopolnila (predmetni odvisniki) |
conj | conjunct | priredno zloženi elementi |
cop | copula verb | vezni glagoli |
csubj | clausal subject | osebkovi odvisniki |
dep | unspecified dependency | nedoločena povezava |
det | determiner | določilniki |
discourse | discourse element | diskurzni členki |
dislocated | dislocated element | dislocirani elementi |
expl | expletive | ekspletivne besede |
fixed | fixed multi-word expression | funkcijske zveze |
flat | flat multi word-expression | eksocentrične zveze |
goeswith | disjointed token | razdruženi deli besed |
iobj | indirect object | nepremi predmeti |
list | list | seznami |
mark | marker (subordinating conjunction) | podredni vezniki |
nmod | nominal modifier | samostalniški prilastki |
nsubj | nominal subject | samostalniški osebki |
nummod | numeric modifier | številčna določila |
obj | (direct) object | premi predmeti |
obl | oblique nominal (adjunct) | odvisne samostalniške zveze |
orphan | dependent of missing parent | elementi v eliptičnih strukturah |
parataxis | parataxis | stavčna soredja |
punct | punctuation symbol | ločila |
reparandum | overriden disfluency | samopopravljanja |
root | root element | koren povedi |
vocative | vocative | ogovori |
xcomp | open clausal complement | odprta stavčna dopolnila |
Tabela 3: Na slovenskih besedilih uporabljene oznake za odvisnostne skladenjske relacije.relacije (brez podoznak).