Skip to main content

V1.0 (DRAFT)

Smernice za zapis izgovora kratic v slovenskem oblikoslovnem leksikonu Sloleks 2.0

KdajVerzijaKdoOpis
2022-11-041.0Jaka ČibejObjava prve različice.

Kratic načeloma ne moremo dovolj zanesljivo avtomatsko pretvoriti v fonetični zapis na podlagi oblike, zato potrebujemo vmesni ortografski zapis, iz katerega s pretvornikom tvorimo fonetični zapis v mednarodni fonetični abecedi (IPA) oz. v fonetični abecedi SAMPA.

Seznam kratic je bil pridobljen strojno, zanje so razvezave in slovenske oblike pridobili študentje. V sklopu dela, ki je bilo opravljeno med februarjem in aprilom 2021, je bilo obravnavanih 1032 kratic, v dokumentu jih ostaja še 5628.

 1 Način dela

Kratice smo obravnavali s stališča črkovalnosti, variantnosti zapisa, prevzetosti, izgovora, pregibanja in spola. Beležili smo posebnosti pri posameznih kraticah, opažanja beležili v komentarje, zapisali pa smo tudi druge razvezave, torej tiste, ki jih program ni zaznal samodejno.

Viri: Pri delu sledimo podatkom iz pisnega korpusa Gigafida 2.0 (način, kako se kratica pregiba, je indic izgovora), lastnemu znanju, podatkom iz korpusa GOS in drugim referenčnim virom, npr. relevantnim domačim spletnim stranem, novicam RTV, Wikipediji, določenim posnetkom na portalu Youtube.

Urejanje kratic je potekalo v devetih stolpcih, pri čemer je vsak stolpec predstavljal eno izmed zgoraj opisanih predmetov raziskovanja:

StolpecPodatek
Hčrkovalna
Ivariante_zapisa
Jprevzeta
Kizgovor
Lpregibanje
Mspol
Nposebnosti
Okomentar
Pdruge razvezave