Skip to main content

V1.0 (DRAFT)

Smernice za zapis izgovora kratic v slovenskem oblikoslovnem leksikonu Sloleks 2.0

Kdaj Verzija Kdo Opis
2022-11-04 1.0 Jaka Čibej Objava prve različice.

Kratic načeloma ne moremo dovolj zanesljivo avtomatsko pretvoriti v fonetični zapis na podlagi oblike, zato potrebujemo vmesni ortografski zapis, iz katerega s pretvornikom tvorimo fonetični zapis v mednarodni fonetični abecedi (IPA) oz. v fonetični abecedi SAMPA.

Seznam kratic je bil pridobljen strojno, zanje so razvezave in slovenske oblike pridobili študentje. V sklopu dela, ki je bilo opravljeno med februarjem in aprilom 2021, je bilo obravnavanih 1032 kratic, v dokumentu jih ostaja še 5628.

1 Način dela

Kratice smo obravnavali s stališča črkovalnosti, variantnosti zapisa, prevzetosti, izgovora, pregibanja in spola. Beležili smo posebnosti pri posameznih kraticah, opažanja beležili v komentarje, zapisali pa smo tudi druge razvezave, torej tiste, ki jih program ni zaznal samodejno.

Viri: Pri delu sledimo podatkom iz pisnega korpusa Gigafida 2.0 (način, kako se kratica pregiba, je indic izgovora), lastnemu znanju, podatkom iz korpusa GOS in drugim referenčnim virom, npr. relevantnim domačim spletnim stranem, novicam RTV, Wikipediji, določenim posnetkom na portalu Youtube.

Urejanje kratic je potekalo v devetih stolpcih, pri čemer je vsak stolpec predstavljal eno izmed zgoraj opisanih predmetov raziskovanja:

Stolpec Podatek
H črkovalna
I variante_zapisa
J prevzeta
K izgovor
L pregibanje
M spol
N posebnosti
O komentar
P druge razvezave

1.1 Črkovalna (stolpec H)

V stolpcu H je določeno, ali gre za črkovalno ali nečrkovalno kratico.

Črkovalna kratica je tista, pri kateri izgovarjamo črke s polglasniki ali samoglasniki (KBM > [kabeem], NKD > [n3k3d3]), nečrkovalna kratica je tista, pri kateri posameznih črk ne izgovarjamo s polglasniki ali samoglasniki, temveč celotno kratico izgovorimo kot navadno besedo (MIP > [mip]). Črkovalno označimo z da, nečrkovalno pa z ne.

Kratica Razvezava Opis Črkovalna Variante zapisa Prevzeta Izgovor Pregibanje Spol Posebnosti Komentar Druge razvezave
SIB Slovenska investicijska banka Slovenska izvozna in razvojna banka ne ne ne síp SIB / SIB-a ž / m pri ničti končnici moški in ženski spol
FDV Fakulteta za družbene vede da ne ne fə̀də̀və̀ FDV / FDV-ja ž / m pri ničti končnici moški in ženski spol

Pri določenih kraticah je mogoč črkovalen in nečrkovalen izgovor, pri teh vpišemo možnost “variantno”. Tak primer je VIP > [vip] in [vəipə]:

Kratica Razvezava Opis Črkovalna Variante zapisa Prevzeta Izgovor Pregibanje Spol Posebnosti Komentar Druge razvezave
VIP Very Important Person Zelo pomembna oseba; Uporabljeno tudi v kontekstu firme VIP mobil variantno da da víájpí // víp VIP / VIP-ja vip m

Več o izgovorih v točki 1.4.

1.2 Variante zapisa (stolpec I)

V stolpcu I se določa, ali je kratica črkovalna ali ne. Kratice navadno zapisujemo z velikimi tiskanimi črkami (običajno, npr. “SDS”), nekatere pa poznajo tudi zapis z malimi tiskanimi črkami ali kombinacijo obeh (DeSUS // Desus; SMS // sms).

Nečrkovalne kratice pogosto preidejo med navadno besedje (UNICEF > Unicef in EMŠO > emšo). Kratice preidejo v stvarna poimenovanja, ko se prekine zapis s samimi velikimi črkami.

  • Če nečrkovalna kratica preide v besedo, jo kot občno poimenovanje zapisujemo z malimi črkami (emšo; mrsa), kot lastno ime pa z veliko začetnico (Nuk, Ajpes, Unesco, Nasa).
  • Redke črkovalne kratice lahko zapisujemo tudi z malimi črkami (SMS/sms, GSM/gsm).
  • Posebni so primeri, ko se ubesedi cel izgovor, npr. TV > teve, SMS > esemes.

Kaj je varianta, smo skušali opredeliti s pomočjo razmerjih v frekvenci zapisa, za kar lahko uporabimo funkcijo Oblike niza orodja noSketchEngine.

! Pri dvoumnih oblikah tipa NATO - nato, STA - sta bo težje priti do natančnih številčnih podatkov.

Ko označujemo variantnost zapisa, označimo z:

  • ne: ko se kratica piše samo z velikimi tiskanimi črkami
  • da: ko se kratica piše z veliki tiskanimi in malimi tiskanimi (ponavadi nečrkovalne)

*Kadar imamo variantni zapis, v stolpcu Pregibanje napišemo oba variantna zapisa, v stolpec Posebnosti pa dopišemo “prehaja med navadno besedje”.

KUD kulturno-umetniško društvo ne da ne kút KUD / KUD-a Kuda m prehod v navadno besedišče

1.3 Prevzeta (stolpec J)

V tabeli posebej zabeležimo, če je kratica prevzeta. Prevzetost nam pomeni, da je podstava v tujem jeziku, npr. USA - United States of America, zato v razpredelnici zapišemo “da”. Če tujejezična podstava kreira enako kratico kot slovenska (npr. EU - European Union = Evropska unija), kratice načeloma ne smatramo za prevzeto in v razpredelnici zabeležimo “ne”. Pri prevzetih kraticah, ki imajo variantno izgovorjavo, vedno najprej navedemo tujo varianto, nato znak // in nato slovensko varianto (izmišljen primer): písí // pécé / pə̀cə̀.

Pri nekaterih prevzetih kraticah:

  • ohranimo izvorni način izgovarjanja (BBC [bíbísí])
  • uporabljamo izvorno in podomačeno izgovorjavo (GSM [géêsêm in džíêsêm]).
CD Compact disc kompaktni disk da da da cédé CD / CD-ja cd-ja m (tudi) pridevniško; ubeseditev izgovora "cede"

1.4 Izgovor (stolpec K)

V stolpcu K beležimo izgovor kratic. Izgovor zapisujemo z uporabo ostrivcev, krativcev in strešic. Primer:

ZRC Znanstvenoraziskovalni center Večinoma v kontekstu ZRC SAZU ali založba/inštitut ZRC da ne ne zə̀rə̀cə̀ ZRC / ZRC-ja ž / m pri ničti končnici moški in ženski spol najpogosteje v zvezi z 'založba' in 'SAZU'

Pri črkovalnih kraticah si lahko pomagamo z razpredelnico:

imena_crk.PNG

Pri črkovalnih kraticah beležimo - z uporabo zgoraj navedenih virov - ali se kratica izgovarja s polglasniki ali vokali. Izgovor zabeležimo na simplificiran način: vedno z naglasi na vseh črkah kratice in v primeru, da se pojavljata obe vrsti izgovora, vedno najprej izgovor z vokali, ki je ločen od polglasniškega z znakoma //: zédéá / zə̀də̀á.

NK nogometni klub da ne ne ènká / nə̀kə̀ NK / NK-ja m NK-ja samo 18 in NK-ju 6 pojavitev (vir: rtvslo.si)

Pri nekaterih prevzetih kraticah:

  • ohranimo izvorni način izgovarjanja (BBC [bíbísí], FBI [êfbíáj], DJ [dídžêj])
  • uporabljamo izvorno in podomačeno izgovorjavo (PC [pécé in písí], GSM [géêsêm in džíêsêm]).

Če ima kratica več načinov izgovora, jih zapišemo enega ob drugem, ločimo jih s poševnico (/). Primer:

RKrokometni klubdaneneèrká / rə̀kə̀RK / RK-jam