V1.0 (DRAFT) Smernice za zapis izgovora kratic v slovenskem oblikoslovnem leksikonu Sloleks 2.0 Datum Različica Objavitelj_ica Opis 2022-11-04 1.0 Jaka Čibej Objava prve različice. Kratic načeloma ne moremo dovolj zanesljivo avtomatsko pretvoriti v fonetični zapis na podlagi oblike, zato potrebujemo vmesni ortografski zapis, iz katerega s pretvornikom tvorimo fonetični zapis v mednarodni fonetični abecedi (IPA) oz. v fonetični abecedi SAMPA. Seznam kratic je bil pridobljen strojno, zanje so razvezave in slovenske oblike pridobili študentje. V sklopu dela, ki je bilo opravljeno med februarjem in aprilom 2021, je bilo obravnavanih 1032 kratic, v dokumentu jih ostaja še 5628. 1 Način dela Kratice smo obravnavali s stališča črkovalnosti, variantnosti zapisa, prevzetosti, izgovora, pregibanja in spola. Beležili smo posebnosti pri posameznih kraticah, opažanja beležili v komentarje, zapisali pa smo tudi druge razvezave, torej tiste, ki jih program ni zaznal samodejno. Viri: Pri delu sledimo podatkom iz pisnega korpusa Gigafida 2.0 (način, kako se kratica pregiba, je indic izgovora), lastnemu znanju , podatkom iz korpusa GOS in drugim referenčnim virom , npr. relevantnim domačim spletnim stranem, novicam RTV, Wikipediji, določenim posnetkom na portalu Youtube. Urejanje kratic je potekalo v devetih stolpcih, pri čemer je vsak stolpec predstavljal eno izmed zgoraj opisanih predmetov raziskovanja: Stolpec Podatek H črkovalna I variante_zapisa J prevzeta K izgovor L pregibanje M spol N posebnosti O komentar P druge razvezave 1.1 Črkovalna (stolpec H) V stolpcu H je določeno, ali gre za črkovalno ali nečrkovalno kratico. Črkovalna kratica je tista, pri kateri izgovarjamo črke s polglasniki ali samoglasniki (KBM > [kabeem], NKD > [n3k3d3]), nečrkovalna kratica je tista, pri kateri posameznih črk ne izgovarjamo s polglasniki ali samoglasniki, temveč celotno kratico izgovorimo kot navadno besedo (MIP > [mip]). Črkovalno označimo z da , nečrkovalno pa z ne . Kratica Razvezava Opis Črkovalna Variante zapisa Prevzeta Izgovor Pregibanje Spol Posebnosti Komentar Druge razvezave SIB Slovenska investicijska banka Slovenska izvozna in razvojna banka ne ne ne síp SIB / SIB-a ž / m pri ničti končnici moški in ženski spol FDV Fakulteta za družbene vede da ne ne fə̀də̀və̀ FDV / FDV-ja ž / m pri ničti končnici moški in ženski spol Pri določenih kraticah je mogoč črkovalen in nečrkovalen izgovor, pri teh vpišemo možnost “variantno”. Tak primer je VIP > [vip] in [vəipə]: Kratica Razvezava Opis Črkovalna Variante zapisa Prevzeta Izgovor Pregibanje Spol Posebnosti Komentar Druge razvezave VIP Very Important Person Zelo pomembna oseba; Uporabljeno tudi v kontekstu firme VIP mobil variantno da da víájpí // víp VIP / VIP-ja vip m Več o izgovorih v točki 1.4. 1.2 Variante zapisa (stolpec I) V stolpcu I se določa, ali je kratica črkovalna ali ne. Kratice navadno zapisujemo z velikimi tiskanimi črkami (običajno, npr. “SDS”), nekatere pa poznajo tudi zapis z malimi tiskanimi črkami ali kombinacijo obeh (DeSUS // Desus; SMS // sms). Nečrkovalne kratice pogosto preidejo med navadno besedje (UNICEF > Unicef in EMŠO > emšo). Kratice preidejo v stvarna poimenovanja, ko se prekine zapis s samimi velikimi črkami. Če nečrkovalna kratica preide v besedo, jo kot občno poimenovanje zapisujemo z malimi črkami (emšo; mrsa), kot lastno ime pa z veliko začetnico (Nuk, Ajpes, Unesco, Nasa). Redke črkovalne kratice lahko zapisujemo tudi z malimi črkami (SMS/sms, GSM/gsm). Posebni so primeri, ko se ubesedi cel izgovor, npr. TV > teve, SMS > esemes. Kaj je varianta, smo skušali opredeliti s pomočjo razmerjih v frekvenci zapisa, za kar lahko uporabimo funkcijo Oblike niza orodja noSketchEngine. ! Pri dvoumnih oblikah tipa NATO - nato, STA - sta bo težje priti do natančnih številčnih podatkov. Ko označujemo variantnost zapisa, označimo z: ne: ko se kratica piše samo z velikimi tiskanimi črkami da: ko se kratica piše z veliki tiskanimi in malimi tiskanimi (ponavadi nečrkovalne) *Kadar imamo variantni zapis, v stolpcu Pregibanje napišemo oba variantna zapisa, v stolpec Posebnosti pa dopišemo “prehaja med navadno besedje”. KUD kulturno-umetniško društvo ne da ne kút KUD / KUD-a Kuda m prehod v navadno besedišče 1.3 Prevzeta (stolpec J) V tabeli posebej zabeležimo, če je kratica prevzeta. Prevzetost nam pomeni, da je podstava v tujem jeziku, npr. USA - United States of America, zato v razpredelnici zapišemo “da”. Če tujejezična podstava kreira enako kratico kot slovenska (npr. EU - European Union = Evropska unija), kratice načeloma ne smatramo za prevzeto in v razpredelnici zabeležimo “ne”. Pri prevzetih kraticah, ki imajo variantno izgovorjavo, vedno najprej navedemo tujo varianto, nato znak // in nato slovensko varianto (izmišljen primer): písí // pécé / pə̀cə̀. Pri nekaterih prevzetih kraticah: ohranimo izvorni način izgovarjanja (BBC [bíbísí]) uporabljamo izvorno in podomačeno izgovorjavo (GSM [géêsêm in džíêsêm]). CD Compact disc kompaktni disk da da da cédé CD / CD-ja cd-ja m (tudi) pridevniško; ubeseditev izgovora "cede" 1.4 Izgovor (stolpec K) V stolpcu K beležimo izgovor kratic. Izgovor zapisujemo z uporabo ostrivcev, krativcev in strešic. Primer: ZRC Znanstvenoraziskovalni center Večinoma v kontekstu ZRC SAZU ali založba/inštitut ZRC da ne ne zə̀rə̀cə̀ ZRC / ZRC-ja ž / m pri ničti končnici moški in ženski spol najpogosteje v zvezi z 'založba' in 'SAZU' Pri črkovalnih kraticah si lahko pomagamo z razpredelnico: Pri črkovalnih kraticah beležimo - z uporabo zgoraj navedenih virov - ali se kratica izgovarja s polglasniki ali vokali. Izgovor zabeležimo na simplificiran način: vedno z naglasi na vseh črkah kratice in v primeru, da se pojavljata obe vrsti izgovora, vedno najprej izgovor z vokali, ki je ločen od polglasniškega z znakoma //: zédéá / zə̀də̀á. NK nogometni klub da ne ne ènká / nə̀kə̀ NK / NK-ja m NK-ja samo 18 in NK-ju 6 pojavitev (vir: rtvslo.si) Pri nekaterih prevzetih kraticah: ohranimo izvorni način izgovarjanja (BBC [bíbísí], FBI [êfbíáj], DJ [dídžêj]) uporabljamo izvorno in podomačeno izgovorjavo (PC [pécé in písí], GSM [géêsêm in džíêsêm]). Če ima kratica več načinov izgovora, jih zapišemo enega ob drugem, ločimo jih s poševnico (/). Primer: RK rokometni klub da ne ne èrká / rə̀kə̀ RK / RK-ja m Pri prevzetih kraticah, ki ima variantno izgovorjavo, vedno najprej navedemo tujo varianto, nato znak // in nato slovensko varianto (izmišljen primer): písí // pécé / pə̀cə̀. PC Personal Computer osebni računalnik da ne da pisí // pécé / pə̀cə̀ PC / PC-ja m Pri črkovalnih kraticah zaradi značilne glasovne sestave izgovarjamo vsako črko posebej; soglasnike lahko izgovarjamo na dva načina (pri opisu kratice skušamo slediti dejanski rabi): z ustreznim glasom in polglasnikom (PVC [pə̀və̀cə̀], NK [nə̀kə̀]); z ustreznim glasom in samoglasnikom e oz. a (PVC [pévécé], NK [ênká]). *Zapis kratic je lahko indikator izgovora (ali gre za podaljšavo z j-jem): SDS: SDS-a: [esdees] > [esdeesa] SDS-ja: [s3d3s3] > [s3d3s3ja] Nečrkovalne kratice običajno izgovarjamo kot druge besede ([núk], [sazú], [téš]). Pogosto preidejo med navadno besedje (UNICEF > Unicef in EMŠO > emšo). Kratice preidejo v stvarna poimenovanja, ko se prekine zapis s samimi velikimi črkami. 1.5 Pregibanje (stolpec L) V tabeli beležimo, kakšne vrste pregibanja smo našli. Primarni vir informacij je pisni korpus Gigafida 2.0, oblike pa iščemo tudi v drugih virih, kot je na primer Fran, razna periodika na spletu, kredibilni članki ipd. Izpis pregibnih oblik, ki so v korpusu z vezajem, je pripravljen že v podatkovni tabeli. Ta izpis lahko služi natančnejši analizi, kjer primerjamo pojavitve kratice v rabi, npr. pojavljanje zvez po poročanju STA in po poročanju STA-ja. Pri črkovalnih kraticah nas zanima, ali se kratica pregiba z vezajem, z ničto končnico ali oboje. Pri zapisu variant vedno najprej navedemo pregibanje brez, nato znak / in nato pregibanje z vezajem. Če se pregiba z vezajem, nas zanima, ali se pregiba s podaljšavo z -j-, brez podaljšave ali oboje. Če gre za varianto, najprej navedemo podaljšano, nato znak //, nato nepodaljšano varianto. Način pregibanja nakažemo z rodilniško obliko (predvidoma v ednini), npr. EU / EU-ja. Kot variante obravnavamo pogoste pojavitve, ne pa tudi redkejše ali lapsuse (npr. EUja, EU-a). Neko pregibanje beležimo, če število najdenih pregibanj v Gigafidi obsega vsaj 0,05 % vseh najdenih primerov. Če je bilo primerov, ki so potrjevali pregibanje, malo, pa so se nam na podlagi primerov in virov zdeli relevantni, smo jih dopisali in v komentarju zapisali, da je primerov pregibanja malo. Nekaj primerov: - - - - - - - - - - - - - - WTO World Trade Organization Svetovna trgovinska organizacija da ne da və̀tə̀ó WTO / WTO-ja ž / m pri ničti končnici moški in ženski spol KAC Klagenfurter Athletiksport Club avstrijski hokejski klub ne ne da kác KAC / KAC-a m DAX Deutscher Aktienindex nemški delniški indeks ne da da dáks DAX / DAX-a Daxa m SZS Smučarska zveza Slovenije da ne ne sə̀zə̀sə̀ SZS / SZS-ja ž / m Končnice in obrazila pišemo za vezajem z malimi črkami, če se kratica govorno končuje na: soglasnik (OZN OZN-a, OZN-ov [ózèèn ózèêna ózèênov-]; ŠOS ŠOS-a, ŠOS-ov [šós šósa šósov-]) ali naglašeni samoglasnik (OZN OZN-ja, OZN-jev [ózə̀nə̀ ózə̀nə̀ja ózə̀nə̀jev-], STA STA-ja, STA-jev [èstèá èstèája èstèájev-]). Če je na koncu kratice v izgovoru polglasnik, torej pride do podaljšave z j-. Številne kratice se pregibajo po ničti sklanjatvi - ostanejo vedno enake. Kadar iz kratic napravimo tvorjenke, pregibamo tudi te (DUTB-jev DUTB-jeva DUTB-jevo). 1.6 Spol (stolpec M) V stolpec M vpisujemo slovnični spol kratice. Ženski spol označujemo z “ž”, moški z “m”, srednji pa s “s”. V primeru, da je možnih več spolov, oznake med seboj ločujemo s poševnico (ž/s/m). Pri določanju slovničnega spola velja, da: so kratice najpogosteje moškega spola - ne glede na to, katerega spola je jedrna beseda podstave (DDV < davek na dodano vrednost, NUK < Narodna in univerzitetna knjižnica, KUD < kulturno-umetniško društvo) in se sklanjajo po prvi moški sklanjatvi (DDV-ja, NUK-a, KUD-a); NUK Narodna in univerzitetna knjižnica ne da ne núk NUK / NUK-a Nuka m prehaja med navadno besedje kratice ženskega spola, ki se končujejo na nenaglašeni a, sklanjamo po prvi ženski sklanjatvi: CIA CIE – pri tej skupini je pogost prehod med navadno besedje; kratice ženskega spola, ki se ne končujejo na naglašeni a, sklanjamo po tretji ženski sklanjatvi z ničto končnico (ostanejo vedno enake). Novost je izrecno izpostavljena možnost sklanjanja po ničtem sklanjatvenem vzorcu pri prav vseh kraticah: ne glede na spol jedrnega samostalnika v podstavi (torej tako pri ženskem in moškem kot tudi srednjem spolu) in ne glede na tip kratice (črkovalna, nečrkovalna) – brez DDV, na ARSO, o DNK, iz EU, pri MNZ. DNK Deoksiribonukleinska kislina da ne ne déènká DNK / DNK-ja ž / m pri ničti končnici ženski in moški spol; (tudi) pridevniško POSEBNOSTI Redke črkovalne in nečrkovalne kratice, ki jih sklanjamo po ničtem sklanjatvenem vzorcu, lahko ohranjajo ženski oz. srednji spol podstavne zveze: FF ('Filozofska fakulteta') – na mariborski FF, DNK ('dezoksiribonukleinska kislina') – analiza človekove DNK, EU ('Evropska unija') – na ravni celotne EU; DOPPS ('Društvo za opazovanje in proučevanje ptic Slovenije') – DOPPS se je pritožilo zoper odredbo, Za nekatere kratice so v rabi različne sklanjatvene možnosti, npr. NUK: Izvod knjige hranijo v ljubljanskem NUK-u; Že več let je na voljo razglednica z motivi Plečnikovega NUK; Razpis za gradnjo nove NUK je bil napovedan že leta 1988. Nekatere kratice, ki imajo v jedru podstave samostalnik v množini (ZDA, NVO), lahko ohranjajo število in spol podstavnega samostalnika: ZDA – Leta 1924 so ZDA Indijancem priznale ameriško državljanstvo, toda: ZDA in EU sta podpisali sporazum. Spol v tabeli beležimo skladno s pregibanjem: če se črkovalna kratica pregiba z vezajem, gre za moški spol. Če se pregiba z ničto končnico, spol ugotovimo iz podstave in korpusnih zgledov. 1.7 Posebnosti (stolpec N) V stolpcu Posebnosti smo opozarjali na: Variantni zapis Zabeležili smo, ali kratica prehaja v navadni zapis, in sicer s komentarjem: prehaja med navadno besedje Posebnosti v spolu Na posebnosti v rabi (npr. primere, kjer korpusni kontekst dokazuje, da je v rabi več slovničnih spolov tudi pri ničti končnici; kadar se kratica rabi množinsko) opozorimo v stolpcu Posebnosti. Označevali smo s komentarji: pri ničti končnici moški in ženski spol pri ničti končnici vsi trije spoli Primer: SGP Splošno gradbeno podjetje da ne ne èsgépé / sə̀gə̀pə̀ SGP ž / s / m pri ničti končnici vsi trije spoli Pridevniško rabo Beležili smo tudi, ali se kratica rabi (tudi) pridevniško, in sicer s komentarjema: Pridevniško (tudi) pridevniško Primer: “LCD” Množinsko rabo Če se kratica uporablja samo v množini, v stolpcu komentar označimo: Množinsko Primer: “ZDA” 1.8 Komentar (stolpec O) V stolpec “komentar” lahko zapišemo vsa opazovanja, dileme in vprašanja, ki se pojavijo pri obravnavi kratic. V komentarju smo beležili predvsem naslednje posebnosti pri kraticah: kandidatka za kratico se mi ne zdi relevantna - predlagam za izključitev izgovor izpeljala iz pregibanja najpogosteje kot del večbesednega poimenovanja navadno sledi ime gledališča/kluba/šole v Franu zapis pregibanja z vezajem (MK-ja) popravila zapis kratice (velike tiskane črke) 6x pregibanje brez podaljšave (UNCHR-a) (*če ne dosega vsaj 8 zadetkov v korpusu, je pa blizu) 6x pregibanje s podaljšavo (UNCHR-ja) pregibanje z vezajem potrjujejo le 4 primeri ( od 2370 cca. ) (pregibanje z vezajem potrjuje le nekaj primerov) ne najdem primerov / težko najdem zglede variant zapisa malo preimenovanje v: [razvezava] (npr. SMC: Mira Cerarja > modernega centra) 1.9 Druge razvezave (stolpec P) V stolpcu “druge razvezave” beležimo vse druge razvezave, ki jih najdemo. V komentar napišemo [NOVA RAZVEZAVA]. SF Slovenska filharmonija da ne ne sə̀fə̀ SF / SF-ja ž / m izgovor izpeljala iz pregibanja science fiction 2 Drugo Zapis kratic je lahko indikator izgovora (ali gre za podaljšavo z j-jem): SDS: SDS-a: [esdees] > [esdeesa] SDS-ja: [s3d3s3] > [s3d3s3ja] Če nečrkovalna kratica preide v besedo, jo kot občno poimenovanje zapisujemo z malimi črkami (emšo; mrsa), kot lastno ime pa z veliko začetnico (Nuk, Ajpes, Unesco, Nasa). Redke črkovalne kratice lahko zapisujemo tudi z malimi črkami (SMS/sms, GSM/gsm). Posebni so primeri, ko se ubesedi cel izgovor, npr. TV > teve, SMS > esemes. Operacijo Razvoj slovenščine v digitalnem okolju sofinancirata Republika Slovenija in Evropska unija iz Evropskega sklada za regionalni razvoj. Operacija se izvaja v okviru Operativnega programa za izvajanje evropske kohezijske politike v obdobju 2014-2020.