12 Jezikovni popravki (KOST)

Označevalni sistem KOST je bil zasnovan skupaj s korpusom slovenščine kot tujega jezika KOST (Stritar Kučuk 2022) in je namenjen kategorizaciji jezikovnih napak v besedilih, ki so jih napisali govorci slovenščine kot drugega oz. tujega jezika. Označevalni sistem je hierarhično urejen v dve stopnji: najprej so popravki opredeljeni glede na jezikovno ravnino, sledi pa opredelitev splošnega tipa popravka oz. določitev besedne vrste. Dvodelne oznake omogočajo robustno analizo, ki ji mora slediti podrobnejši ročni pregled.

Predstavitev oznak

V tem poglavju so strnjeno navedene oznake jezikovnih popravkov po sistemu KOST.

Oznaka Jezikovna ravnina Tip popravka/besedna vrsta
Z-LOC zapis ločilo
Z-CRK zapis črkovanje
Z-SN zapis skupaj/narazen
Z-MV zapis mala/velika začetnica
Z-KR zapis krajšave
B-SAM besedišče samostalnik
B-GLAG besedišče glagol
B-ZAIM besedišče zaimek
B-PRID besedišče pridevnik
B-PRISL besedišče prislov
B-PRED besedišče predlog
B-VEZ besedišče veznik
B-OST besedišče ostalo
O-SAM oblika samostalnik
O-GLAG oblika glagol
O-ZAIM oblika zaimek
O-PRID oblika pridevnik
O-PRISL oblika prislov
O-OST oblika ostalo
S-STR skladnja struktura
S-BR skladnja besedni red
S-IZP skladnja izpuščeni jezikovni elementi
S-ODV skladnja odvečni jezikovni elementi
POV / povezani popravki
[???] / nerazumljivo, nejasen popravek

Označevalne smernice

V tem poglavju so zbrane označevalne smernice KOST. Smernice so razvrščene od nastarejše različice do zadnje, ažurne različice.

Različica 1.0 (04-2022)
projekt Razvoj slovenščine v digitalnem okolju

STRITAR KUČUK, Mojca, 2023: KOST 1.0: Priročnik za označevanje napak, delovna verzija. Različica 1.0. [PDF]

Reference in povezave

V tem poglavju so zbrane relevantne reference in povezave na projekte, v katerih se je označevalni sistem razvijal ter uporabljal.

Projekti, na katerih se je razvijal označevalni sistem
Razvoj slovenščine v digitalnem okolju

Trenutna različica korpusa KOST
STRITAR KUČUK, Mojca, ŠTER, Helena, PISEK, Staša, PETRIC LASNIK, Ivana, KETE MATIČIČ, Jana, PIRIH SVETINA, Nataša, PREGLAU, Daniela, ARHAR HOLDT, Špela, KRSNIK, Luka, ERJAVEC, Tomaž, 2023, Slovene learner corpus KOST 1.0, Slovenian language resource repository CLARIN.SI, ISSN 2820-4042, http://hdl.handle.net/11356/1753.

Orodje CJVT Svala za označevanje korpusov z jezikovnimi popravki
ARHAR HOLDT, Špela, KOSEM, Iztok, STRITAR KUČUK, Mojca, KRSNIK, Luka, JOVAN, Leon Noe, 2022: CJVT Svala (Kazalnik projekta Razvoj slovenščine v digitalnem okolju), v1.0, https://orodja.cjvt.si/svala/, dostop 2. 3. 2023.

Literatura o korpusu KOST
STRITAR KUČUK, Mojca, 2022: KOST med korpusi usvajanja tujega jezika. Obdobja 41: Na stičišču svetov: slovenščina kot drugi in tuji jezik. 323–334. https://centerslo.si/wp-content/uploads/2022/11/Stritar-Kucuk_Obdobja-41.pdf

ARHAR HOLDT, Špela, KOSEM, Iztok, STRITAR KUČUK, Mojca, 2022: Metode in orodja za lažjo pripravo korpusov usvajanja jezika. Obdobja 41: Na stičišču svetov: slovenščina kot drugi in tuji jezik. 23–30. https://centerslo.si/wp-content/uploads/2022/11/Arhar-Holdt-et-al_Obdobja-41.pdf

STRITAR KUČUK, Mojca, 2020: Modul Leto plus – prvi korak do korpusa slovenščine kot tujega jezika. Zbornik konference Jezikovne tehnologije in digitalna humanistika 2020. 131–135. http://nl.ijs.si/jtdh20/pdf/JT-DH_2020_StritarKucuk_Modul-Leto-plus%e2%80%93prvi-korak-do-korpusa-slovenscine-kot-tujega-jezika.pdf