Predstavitev oznak

Shema Universal Dependencies določa univerzalni nabor oznak za besedne vrste, oblikoslovne lastnosti in odvisnostne skladenjske relacije, ki se lahko prenesejo na drevesnice posameznih jezikov ali pa dopolnijo z novimi oblikoslovnimi oznakami oz. izpeljavami jedrnih relacij, če je to potrebno. Konkretno je bilo na slovenske podatke preneseno vseh 17 besednih vrst (Tabela 1), 22 oblikoslovnih lastnosti z 62 različnimi vrednostmi (Tabela 2) in 35 odvisnostnih relacij (Tabela 3).

Oznaka Opis
ADJ pridevnik
ADP adpozicija (predlog)
ADV prislov
AUX pomožnik
CCONJ priredni veznik
DET določilnik
INTJ medmet
NOUN samostalnik
NUM števnik
PART členek
PRON zaimek
PROPN lastnoimenski samostalnik
PUNCT ločilo
SCONJ podredni veznik
SYM simbol
VERB glagol
X drugo

Tabela 1: Na slovenskih besedilih uporabljene oznake za besedne vrste.


Lastnost Vrednosti Opis
Abbr  Yes okrajšanost
Animacy  Anim, Inanim živost
Aspect  Imp, Perf vid
Case  Nom, Gen, Dat, Acc, Loc, Ins sklon
Definite  Ind, Def določnost
Degree  Pos, Cmp, Sup stopnja
Foreign  Yes tujejezičnost
Gender  Masc, Fem, Neut spol
Gender[psor]  Masc. Fem, Neut spol svojine
Mood  Ind, Imp, Cnd naklon
Number  Sing, Dual, Plur število
Number[psor]  Sing, Dual, Plur število svojine
NumForm  Word, Digit, Roman oblika števnika
NumType  Card, Ord, Mult, Sets vrste števnika
Person  1, 2, 3 oseba
Polarity  Neg, Pos nikalnost
Poss  Yes svojina
PronType  Prs, Int, Rel, Dem, Tot, Neg, Ind vrsta zimka
Reflex  Yes povratnost
Tense  Pres, Fut čas
Variant  Bound, Short oblika zaimka
VerbForm  Fin, Inf, Sup, Part, Conv vrsta glagola

Tabela 2: Na slovenskih besedilih uporabljene oznake za oblikoslovne lastnosti. V korpusu so navedene v obliki parov lastnosti in vrednosti (npr. Tense=Pres).


Oznaka Angleški opis Slovenski opis
acl clausal modifier of noun stavčni prilastki
advcl adverbial clause modifier prislovni odvisniki
advmod adverbial modifier prislovna določila (v širšem smislu)
amod adjectival modifier pridevniški prilastki
appos appositional modifier pristavčna določila
aux auxiliary verb pomožni glagoli
case case marking preposition predlogi
cc coordinating conjunction priredni vezniki
ccomp clausal complement stavčna dopolnila (predmetni odvisniki)
conj conjunct priredno zloženi elementi
cop copula verb vezni glagoli
csubj clausal subject osebkovi odvisniki
dep unspecified dependency nedoločena povezava
det determiner določilniki
discourse discourse element diskurzni členki
dislocated dislocated element dislocirani elementi
expl expletive ekspletivne besede
fixed fixed multi-word expression funkcijske zveze
flat flat multi word-expression eksocentrične zveze
goeswith disjointed token razdruženi deli besed
iobj indirect object nepremi predmeti
list list seznami
mark marker (subordinating conjunction) podredni vezniki
nmod nominal modifier samostalniški prilastki
nsubj nominal subject samostalniški osebki
nummod numeric modifier številčna določila
obj (direct) object premi predmeti
obl oblique nominal (adjunct) odvisne samostalniške zveze
orphan dependent of missing parent elementi v eliptičnih strukturah
parataxis parataxis stavčna soredja
punct punctuation symbol ločila
reparandum overriden disfluency samopopravljanja
root root element koren povedi
vocative vocative ogovori
xcomp open clausal complement odprta stavčna dopolnila

Tabela 3: Na slovenskih besedilih uporabljene oznake za odvisnostne skladenjske relacije (brez podoznak).


Revision #4
Created 5 March 2023 20:55:20 by Tina Munda
Updated 22 January 2024 10:41:12 by Tina Munda