Skip to main content

04 Oblikoskladnja MULTEXT-East

Sistem MULTEXT-East za označevanje oblikoskladnje pojavnic v korpusih definira črkovne kode, npr. »Somei«, in njihovo preslikavo v slovnične lastnosti, npr. »samostalnik vrsta=občno_ime spol=moški število=ednina sklon=imenovalnik«. Sistem je definiran za 20 jezikov oz. dialektov, mdr. za vse slovanske jezike.
Uporaba oznak MULTEXT-East za slovenščino se je začela že leta 1996, nato pa se je nadaljevala pri vseh nadaljnjih ročno in tudi avtomatsko označenih odprtih korpusih slovenščine, vse do pojavitve sistema označevanja oblikoskladnje v okviru projekta Universal Dependencies, ki sedaj počasi prevzema vlogo, ki jo je desetletja imel MULTEXT-East.