Skip to main content

05 Lematizacija

Lema (osnovna besedna oblika) je pri označevanju pripisana vsem besednim oblikam v besedilu, kar omogoča njihovo nadaljnje enovito procesiranje. Sistem lematizacije je bil razvit v projektu Sporazumevanje v slovenskem jeziku (Holozan et al. 2008) in sledi sistemu oblikoskladenjskega označevanja MULTEXT-East v4 oz. JOS pri določanju besedne vrste, velike začetnice in nekaterih drugih značilnosti.