Reference in povezave
V tem razdelku so zbrane reference in povezave na projekte, v katerih se je označevalni sistem razvijal ter uporabljal.
Smernice MULTEXT-East
- Smernice MULTEXT-East V6 na GitHub: https://github.com/clarinsi/mte-msd
- Smernice MULTEXT-East V6 v TEI: https://nl.ijs.si/ME/V6/msd/xml/
- Smernice MULTEXT-East V6 za branje: https://nl.ijs.si/ME/V6/msd/html/index.html
- Smernice MULTEXT-East V6 za slovenski jezik:
- v TEI: https://nl.ijs.si/ME/V6/msd/xml/msd-sl.spc.xml
- za branje: https://nl.ijs.si/ME/V6/msd/html/msd-sl.html
- oznake v tabeli TSV: https://nl.ijs.si/ME/V6/msd/tables/msd-human-sl.tbl
- oznake kodirane kot strukture lastnosti v TEI:
https://nl.ijs.si/ME/V6/msd/
html/tables/msd-fslib2-sl.htmlxml
Projekti, na katerih se je razvijal označevalni sistem
- MULTEXT-East - Multilingual corpora and text tools for Central and East European langauges:
https://nl.ijs.si/ME/ - JOS - Jezikoslovno označevanje slovenskega jezika: http://nl.ijs.si/jos/
- Sporazumevanje v slovenskem jeziku: http://ssj.slovenscina.eu/
- Janes: https://nl.ijs.si/janes/
- Razvoj slovenščine v digitalnem okolju: https://rsdo.slovenscina.eu/
Učni korpusi z ročno pregledanimi oznakami MULTEXT-East
-
Krek, Simon; et al., 2019, Training corpus ssj500k 2.2, Slovenian language resource repository CLARIN.SI, ISSN 2820-4042, http://hdl.handle.net/11356/1210.
-
Arhar Holdt, Špela; et al., 2022, Training corpus SUK 1.0, Slovenian language resource repository CLARIN.SI, ISSN 2820-4042, http://hdl.handle.net/11356/1747.
-
Lenardič, Jakob; et al., 2022, CMC training corpus Janes-Tag 3.0, Slovenian language resource repository CLARIN.SI, ISSN 2820-4042, http://hdl.handle.net/11356/1732.
Reference
-
Erjavec, Tomaž; Fišer, Darja; Krek, Simon in Ledinek, Nina. 2010. The JOS Linguistically Tagged Corpus of Slovene. V: Proceedings of the Seventh conference on International Language Resources and Evaluation (LREC’10), Valeta, Malta, Maj. European Language Resources Association (ELRA). http://www.lrec-conf.org/proceedings/lrec2010/pdf/139_Paper.pdf
-
Erjavec, Tomaž. 2012. MULTEXT-East: morphosyntactic resources for Central and Eastern European languages. Language Resources and Evaluation, 46(1): 131–142. DOI 10.1007/s10579-011-9174-8.
-
Erjavec, Tomaž. 2017. MULTEXT-East. V (Nancy Ide, James Pustejovsky, ur.): Handbook of linguistic annotation. pp. 441-462. Springer. DOI 10.1007/978-94-024-0881-2_17.
-
Krek, Simon; Erjavec, Tomaž; Dobrovoljc, Kaja; Gantar, Polona; Arhar Holdt, Špela; Čibej, Jaka in Brank, Janez. The ssj500k training corpus for Slovene language processing. V: Fišer, D. in Erjavec, T. Jezikovne tehnologije in digitalna humanistika: zbornik konference: 24.-25. september 2020, Ljubljana, Slovenija. Ljubljana: Inštitut za novejšo zgodovino, 2020. Str. 24–33. http://nl.ijs.si/jtdh20/pdf/JT-DH_2020_Krek-et-al_The-ssj500k-Training-Corpus-for-Slovene-Language-Processing.pdf.