Skip to main content

Annotation Guidelines

This chapter summarizes the annotation guidelines for the MULTEXT-East morphosyntax as applied to Slovene texts. The guidelines are arranged from the latest, up-to-date version to the oldest version.

Version 2.0 (25-02-2023)
Project Development of Slovene in a Digital Environment

HOLOZAN, Peter, KREK, Simon, PIVEC, Matej, RIGAČ, Simon, ROZMAN, Simon, VELUŠČEK, Aleš, PORI, Eva, ARHAR HOLDT, Špela, 2023: Specifikacije za učni korpus: lematizacija in MSD. Različica 2.0. Rezultat projekta Razvoj slovenščine v digitalnem okolju.
[DOCX] [PDF] - only in Slovene

Version 1.0 for non-standard Slovene (21-12-2016)
Project Janes - Resources, Tools and Methods for the Research of Nonstandard Internet Slovene

ČIBEJ, Jaka, ARHAR HOLDT, Špela, ERJAVEC, Tomaž, FIŠER, Darja, ZUPAN, Katja, 2016: Smernice za označevanje računalniško posredovane komunikacije: tokenizacija, stavčna segmentacija, normalizacija, lematizacija in oblikoskladenjsko označevanje. Različica 1.0. Rezultat projekta Viri, orodja in metode za raziskovanje nestandardne spletne slovenščine. [PDF] - only in Slovene

Version 1.0 (2008)
Project Communication in Slovene

HOLOZAN, Peter, KREK, Simon, PIVEC, Matej, RIGAČ, Simon, ROZMAN, Simon, VELUŠČEK, Aleš, 2008: Specifikacije za učni korpus. Različica 1.0. Kazalnik K2 projekta Sporazumevanje v slovenskem jeziku. [PDF] - only in Slovene

Specifications MULTEXT-East:
Specifications MULTEXT-East V6 on GitHub: https://github.com/clarinsi/mte-msd
Specifications MULTEXT-East V6 in TEI: https://nl.ijs.si/ME/V6/msd/xml/
Specifications MULTEXT-East V6 for reading: https://nl.ijs.si/ME/V6/msd/html/index.html
Specifications MULTEXT-East V6 for Slovene:
some text• in TEI: https://nl.ijs.si/ME/V6/msd/xml/msd-sl.spc.xml
some text• for reading: https://nl.ijs.si/ME/V6/msd/html/msd-sl.html
some text• tags in table format: https://nl.ijs.si/ME/V6/msd/tables/msd-human-sl.tbl
some text• tags encoded in TEI: https://nl.ijs.si/ME/V6/msd/tables/msd-fslib2-sl.xml