V1.0 (DRAFT)
Smernice za zapis izgovora kratic v slovenskem oblikoslovnem leksikonu Sloleks 2.0
Kdaj | Verzija | Kdo | Opis |
---|---|---|---|
2022-11-04 | 1.0 | Jaka Čibej | Objava prve različice. |
Kratic načeloma ne moremo dovolj zanesljivo avtomatsko pretvoriti v fonetični zapis na podlagi oblike, zato potrebujemo vmesni ortografski zapis, iz katerega s pretvornikom tvorimo fonetični zapis v mednarodni fonetični abecedi (IPA) oz. v fonetični abecedi SAMPA.
Seznam kratic je bil pridobljen strojno, zanje so razvezave in slovenske oblike pridobili študentje. V sklopu dela, ki je bilo opravljeno med februarjem in aprilom 2021, je bilo obravnavanih 1032 kratic, v dokumentu jih ostaja še 5628.
1 Način dela
Viri: Pri delu sledimo podatkom iz pisnega korpusa Gigafida 2.0 (način, kako se kratica pregiba, je indic izgovora), lastnemu znanju, podatkom iz korpusa GOS in drugim referenčnim virom, npr. relevantnim domačim spletnim stranem, novicam RTV, Wikipediji, določenim posnetkom na portalu Youtube.
Urejanje kratic je potekalo v devetih stolpcih, pri čemer je vsak stolpec predstavljal eno izmed zgoraj opisanih predmetov raziskovanja:
Stolpec | Podatek |
---|---|
H | črkovalna |
I | variante_zapisa |
J | prevzeta |
K | izgovor |
L | pregibanje |
M | spol |
N | posebnosti |
O | komentar |
P | druge razvezave |
1.1 Črkovalna (stolpec H)
V stolpcu H je določeno, ali gre za črkovalno ali nečrkovalno kratico.
Črkovalna kratica je tista, pri kateri izgovarjamo črke s polglasniki ali samoglasniki (KBM > [kabeem], NKD > [n3k3d3]), nečrkovalna kratica je tista, pri kateri posameznih črk ne izgovarjamo s polglasniki ali samoglasniki, temveč celotno kratico izgovorimo kot navadno besedo (MIP > [mip]). Črkovalno označimo z da, nečrkovalno pa z ne.
Kratica | Razvezava | Opis | Črkovalna | Variante zapisa | Prevzeta | Izgovor | Pregibanje | Spol | Posebnosti | Komentar | Druge razvezave |
---|---|---|---|---|---|---|---|---|---|---|---|
SIB | Slovenska investicijska banka | Slovenska izvozna in razvojna banka | ne | ne | ne | síp | SIB / SIB-a | ž / m | pri ničti končnici moški in ženski spol | ||
FDV | Fakulteta za družbene vede | da | ne | ne | fə̀də̀və̀ | FDV / FDV-ja | ž / m | pri ničti končnici moški in ženski spol |
Pri določenih kraticah je mogoč črkovalen in nečrkovalen izgovor, pri teh vpišemo možnost “variantno”. Tak primer je VIP > [vip] in [vəipə]:
Kratica | Razvezava | Opis | Črkovalna | Variante zapisa | Prevzeta | Izgovor | Pregibanje | Spol | Posebnosti | Komentar | Druge razvezave |
---|---|---|---|---|---|---|---|---|---|---|---|
VIP | Very Important Person | Zelo pomembna oseba; Uporabljeno tudi v kontekstu firme VIP mobil | variantno | da | da | víájpí // víp | VIP / VIP-ja | vip | m |
Več o izgovorih v točki 1.4.
1.2 Variante zapisa (stolpec I)
V stolpcu I se določa, ali je kratica črkovalna ali ne. Kratice navadno zapisujemo z velikimi tiskanimi črkami (običajno, npr. “SDS”), nekatere pa poznajo tudi zapis z malimi tiskanimi črkami ali kombinacijo obeh (DeSUS // Desus; SMS // sms).
Nečrkovalne kratice pogosto preidejo med navadno besedje (UNICEF > Unicef in EMŠO > emšo). Kratice preidejo v stvarna poimenovanja, ko se prekine zapis s samimi velikimi črkami.
- Če nečrkovalna kratica preide v besedo, jo kot občno poimenovanje zapisujemo z malimi črkami (emšo; mrsa), kot lastno ime pa z veliko začetnico (Nuk, Ajpes, Unesco, Nasa).
- Redke črkovalne kratice lahko zapisujemo tudi z malimi črkami (SMS/sms, GSM/gsm).
- Posebni so primeri, ko se ubesedi cel izgovor, npr. TV > teve, SMS > esemes.
Kaj je varianta, smo skušali opredeliti s pomočjo razmerjih v frekvenci zapisa, za kar lahko uporabimo funkcijo Oblike niza orodja noSketchEngine.
! Pri dvoumnih oblikah tipa NATO - nato, STA - sta bo težje priti do natančnih številčnih podatkov.
Ko označujemo variantnost zapisa, označimo z:
- ne: ko se kratica piše samo z velikimi tiskanimi črkami
- da: ko se kratica piše z veliki tiskanimi in malimi tiskanimi (ponavadi nečrkovalne)
*Kadar imamo variantni zapis, v stolpcu Pregibanje napišemo oba variantna zapisa, v stolpec Posebnosti pa dopišemo “prehaja med navadno besedje”.
KUD | kulturno-umetniško društvo | ne | da | ne | kút | KUD / KUD-a | Kuda | m | prehod v navadno besedišče |
---|
1.3 Prevzeta (stolpec J)
V tabeli posebej zabeležimo, če je kratica prevzeta. Prevzetost nam pomeni, da je podstava v tujem jeziku, npr. USA - United States of America, zato v razpredelnici zapišemo “da”. Če tujejezična podstava kreira enako kratico kot slovenska (npr. EU - European Union = Evropska unija), kratice načeloma ne smatramo za prevzeto in v razpredelnici zabeležimo “ne”. Pri prevzetih kraticah, ki imajo variantno izgovorjavo, vedno najprej navedemo tujo varianto, nato znak // in nato slovensko varianto (izmišljen primer): písí // pécé / pə̀cə̀.
Pri nekaterih prevzetih kraticah:
- ohranimo izvorni način izgovarjanja (BBC [bíbísí])
- uporabljamo izvorno in podomačeno izgovorjavo (GSM [géêsêm in džíêsêm]).
CD | Compact disc | kompaktni disk | da | da | da | cédé | CD / CD-ja | cd-ja | m | (tudi) pridevniško; ubeseditev izgovora "cede" |
---|
1.4 Izgovor (stolpec K)
V stolpcu K beležimo izgovor kratic. Izgovor zapisujemo z uporabo ostrivcev, krativcev in strešic. Primer:
ZRC | Znanstvenoraziskovalni center | Večinoma v kontekstu ZRC SAZU ali založba/inštitut ZRC | da | ne | ne | zə̀rə̀cə̀ | ZRC / ZRC-ja | ž / m | pri ničti končnici moški in ženski spol | najpogosteje v zvezi z 'založba' in 'SAZU' |
---|
Pri črkovalnih kraticah si lahko pomagamo z razpredelnico:
Pri črkovalnih kraticah beležimo - z uporabo zgoraj navedenih virov - ali se kratica izgovarja s polglasniki ali vokali. Izgovor zabeležimo na simplificiran način: vedno z naglasi na vseh črkah kratice in v primeru, da se pojavljata obe vrsti izgovora, vedno najprej izgovor z vokali, ki je ločen od polglasniškega z znakoma //: zédéá / zə̀də̀á.
NK | nogometni klub | da | ne | ne | ènká / nə̀kə̀ | NK / NK-ja | m | NK-ja samo 18 in NK-ju 6 pojavitev (vir: rtvslo.si) |
---|
Pri nekaterih prevzetih kraticah:
- ohranimo izvorni način izgovarjanja (BBC [bíbísí], FBI [êfbíáj], DJ [dídžêj])
- uporabljamo izvorno in podomačeno izgovorjavo (PC [pécé in písí], GSM [géêsêm in džíêsêm]).
Če ima kratica več načinov izgovora, jih zapišemo enega ob drugem, ločimo jih s poševnico (/). Primer:
RK | rokometni klub | da | ne | ne | èrká / rə̀kə̀ | RK / RK-ja | m |
---|
Pri prevzetih kraticah, ki ima variantno izgovorjavo, vedno najprej navedemo tujo varianto, nato znak // in nato slovensko varianto (izmišljen primer): písí // pécé / pə̀cə̀.
PC | Personal Computer | osebni računalnik | da | ne | da | pisí // pécé / pə̀cə̀ | PC / PC-ja | m |
---|
Pri črkovalnih kraticah zaradi značilne glasovne sestave izgovarjamo vsako črko posebej; soglasnike lahko izgovarjamo na dva načina (pri opisu kratice skušamo slediti dejanski rabi):
- z ustreznim glasom in polglasnikom (PVC [pə̀və̀cə̀], NK [nə̀kə̀]);
- z ustreznim glasom in samoglasnikom e oz. a (PVC [pévécé], NK [ênká]).
*Zapis kratic je lahko indikator izgovora (ali gre za podaljšavo z j-jem): SDS:
- SDS-a: [esdees] > [esdeesa]
- SDS-ja: [s3d3s3] > [s3d3s3ja]
Nečrkovalne kratice običajno izgovarjamo kot druge besede ([núk], [sazú], [téš]). Pogosto preidejo med navadno besedje (UNICEF > Unicef in EMŠO > emšo). Kratice preidejo v stvarna poimenovanja, ko se prekine zapis s samimi velikimi črkami.
1.5 Pregibanje (stolpec L)
V tabeli beležimo, kakšne vrste pregibanja smo našli. Primarni vir informacij je pisni korpus Gigafida 2.0, oblike pa iščemo tudi v drugih virih, kot je na primer Fran, razna periodika na spletu, kredibilni članki ipd. Izpis pregibnih oblik, ki so v korpusu z vezajem, je pripravljen že v podatkovni tabeli. Ta izpis lahko služi natančnejši analizi, kjer primerjamo pojavitve kratice v rabi, npr. pojavljanje zvez po poročanju STA in po poročanju STA-ja. Pri črkovalnih kraticah nas zanima, ali se kratica pregiba z vezajem, z ničto končnico ali oboje. Pri zapisu variant vedno najprej navedemo pregibanje brez, nato znak / in nato pregibanje z vezajem. Če se pregiba z vezajem, nas zanima, ali se pregiba s podaljšavo z -j-, brez podaljšave ali oboje. Če gre za varianto, najprej navedemo podaljšano, nato znak //, nato nepodaljšano varianto. Način pregibanja nakažemo z rodilniško obliko (predvidoma v ednini), npr. EU / EU-ja. Kot variante obravnavamo pogoste pojavitve, ne pa tudi redkejše ali lapsuse (npr. EUja, EU-a).
Neko pregibanje beležimo, če število najdenih pregibanj v Gigafidi obsega vsaj 0,05 % vseh najdenih primerov. Če je bilo primerov, ki so potrjevali pregibanje, malo, pa so se nam na podlagi primerov in virov zdeli relevantni, smo jih dopisali in v komentarju zapisali, da je primerov pregibanja malo. Nekaj primerov:
- | - | - | - | - | - | - | - | - | - | - | - | - | - |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
WTO | World Trade Organization | Svetovna trgovinska organizacija | da | ne | da | və̀tə̀ó | WTO / WTO-ja | ž / m | pri ničti končnici moški in ženski spol | ||||
KAC | Klagenfurter Athletiksport Club | avstrijski hokejski klub | ne | ne | da | kác | KAC / KAC-a | m | |||||
DAX | Deutscher Aktienindex | nemški delniški indeks | ne | da | da | dáks | DAX / DAX-a | Daxa | m | ||||
SZS | Smučarska zveza Slovenije | da | ne | ne | sə̀zə̀sə̀ | SZS / SZS-ja | ž / m |