# V1.0 (DRAFT)

# Smernice za zapis izgovora kratic v slovenskem oblikoslovnem leksikonu Sloleks 2.0


| **Datum** | **Različica** | **Objavitelj_ica** |  **Opis** |
| :----- | :----- | :----- | :----- |
| 2022-11-04 | 1.0 | Jaka Čibej | Objava prve različice. |


Kratic načeloma ne moremo dovolj zanesljivo avtomatsko pretvoriti v fonetični zapis na podlagi oblike, zato potrebujemo vmesni ortografski zapis, iz katerega s pretvornikom tvorimo fonetični zapis v mednarodni fonetični abecedi (IPA) oz. v fonetični abecedi SAMPA.

Seznam kratic je bil pridobljen strojno, zanje so razvezave in slovenske oblike pridobili študentje. V sklopu dela, ki je bilo opravljeno med februarjem in aprilom 2021, je bilo obravnavanih 1032 kratic, v dokumentu jih ostaja še 5628.

## <a id="nacin-dela"></a> 1 Način dela

Kratice smo obravnavali s stališča črkovalnosti, variantnosti zapisa, prevzetosti, izgovora, pregibanja in spola. Beležili smo posebnosti pri posameznih kraticah, opažanja beležili v komentarje, zapisali pa smo tudi druge razvezave, torej tiste, ki jih program ni zaznal samodejno.

**Viri:**
Pri delu sledimo podatkom iz **pisnega korpusa Gigafida 2.0** (način, kako se kratica pregiba, je indic izgovora), **lastnemu znanju**, **podatkom iz korpusa GOS** in **drugim referenčnim virom**, npr. relevantnim domačim spletnim stranem, novicam RTV, Wikipediji, določenim posnetkom na portalu Youtube. 

Urejanje kratic je potekalo v devetih stolpcih, pri čemer je vsak stolpec predstavljal eno izmed zgoraj opisanih predmetov raziskovanja:
| Stolpec | Podatek |
| :----- | :----- |
| H | črkovalna |
| I | variante_zapisa |
|J|prevzeta|
|K|izgovor|
|L|pregibanje|
|M|spol|
|N|posebnosti|
|O|komentar|
|P|druge razvezave|

### <a id="crkovalna-stolpec-h"></a> 1.1 Črkovalna (stolpec H)
V stolpcu H je določeno, ali gre za črkovalno ali nečrkovalno kratico.

**Črkovalna** kratica je tista, pri kateri izgovarjamo črke s polglasniki ali samoglasniki (KBM > [kabeem], NKD > [n3k3d3]), **nečrkovalna** kratica je tista, pri kateri posameznih črk ne izgovarjamo s polglasniki ali samoglasniki, temveč celotno kratico izgovorimo kot navadno besedo (MIP > [mip]). Črkovalno označimo z **da**, nečrkovalno pa z **ne**.

| Kratica | Razvezava | Opis | Črkovalna | Variante zapisa | Prevzeta | Izgovor | Pregibanje | Spol | Posebnosti | Komentar | Druge razvezave |
| :----- | :----- | :----- | :----- | :----- | :----- | :----- | :----- | :----- | :----- | :----- | :----- |
|SIB|Slovenska investicijska banka|Slovenska izvozna in razvojna banka|ne|ne|ne|síp|SIB / SIB-a|ž / m|pri ničti končnici moški in ženski spol|||
|FDV|Fakulteta za družbene vede|da|ne|ne|fə̀də̀və̀|FDV / FDV-ja|ž / m|pri ničti končnici moški in ženski spol|

Pri določenih kraticah je mogoč črkovalen in nečrkovalen izgovor, pri teh vpišemo možnost “variantno”. Tak primer je VIP > [vip] in [vəipə]:

| Kratica | Razvezava | Opis | Črkovalna | Variante zapisa | Prevzeta | Izgovor | Pregibanje | Spol | Posebnosti | Komentar | Druge razvezave |
| :----- | :----- | :----- | :----- | :----- | :----- | :----- | :----- | :----- | :----- | :----- | :----- |
|VIP|Very Important Person|Zelo pomembna oseba; Uporabljeno tudi v kontekstu firme VIP mobil|variantno||da|da|víájpí // víp|VIP / VIP-ja|vip|m|

Več o izgovorih v točki 1.4.

### <a id="variante-zapisa-stolpec-i"></a> 1.2 Variante zapisa (stolpec I)
V stolpcu I se določa, ali je kratica črkovalna ali ne. Kratice navadno zapisujemo z velikimi tiskanimi črkami (običajno, npr. “SDS”), nekatere pa poznajo tudi zapis z malimi tiskanimi črkami ali kombinacijo obeh (DeSUS // Desus; SMS // sms). 

Nečrkovalne kratice pogosto preidejo med navadno besedje (UNICEF > Unicef in EMŠO > emšo). Kratice preidejo v stvarna poimenovanja, ko se prekine zapis s samimi velikimi črkami.

- Če nečrkovalna kratica preide v besedo, jo kot občno poimenovanje zapisujemo z malimi črkami (emšo; mrsa), kot lastno ime pa z veliko začetnico (Nuk, Ajpes, Unesco, Nasa).
- Redke črkovalne kratice lahko zapisujemo tudi z malimi črkami (SMS/sms, GSM/gsm).
- Posebni so primeri, ko se ubesedi cel izgovor, npr. TV > teve, SMS > esemes.

Kaj je varianta, smo skušali opredeliti s pomočjo razmerjih v frekvenci zapisa, za kar lahko uporabimo funkcijo Oblike niza orodja noSketchEngine. 

! Pri dvoumnih oblikah tipa NATO - nato, STA - sta bo težje priti do natančnih številčnih podatkov.

Ko označujemo variantnost zapisa, označimo z:
- ne: ko se kratica piše samo z velikimi tiskanimi črkami
- da: ko se kratica piše z veliki tiskanimi in malimi tiskanimi (ponavadi nečrkovalne)


*Kadar imamo variantni zapis, v stolpcu Pregibanje napišemo oba variantna zapisa, v stolpec Posebnosti pa dopišemo “prehaja med navadno besedje”.

|KUD|kulturno-umetniško društvo||||||||ne|da|ne|kút|KUD / KUD-a|Kuda|m|prehod v navadno besedišče|
|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|

### <a id="prevzeta-stolpec-j"></a> 1.3 Prevzeta (stolpec J)
V tabeli posebej zabeležimo, če je kratica prevzeta. Prevzetost nam pomeni, da je podstava v tujem jeziku, npr. USA - United States of America, zato v razpredelnici zapišemo “da”.  Če tujejezična podstava kreira enako kratico kot slovenska (npr. EU - European Union = Evropska unija), kratice načeloma ne smatramo za prevzeto in v razpredelnici zabeležimo “ne”.  Pri prevzetih kraticah, ki imajo variantno izgovorjavo, vedno najprej navedemo tujo varianto, nato znak // in nato slovensko varianto (izmišljen primer): písí // pécé / pə̀cə̀.

Pri nekaterih prevzetih kraticah:
- ohranimo izvorni način izgovarjanja (BBC [bíbísí])
- uporabljamo izvorno in podomačeno izgovorjavo (GSM [géêsêm in džíêsêm]).

|CD|Compact disc|kompaktni disk|||||da|da|da|cédé|CD / CD-ja|cd-ja|m|(tudi) pridevniško; ubeseditev izgovora "cede"|
|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|

### <a id="izgovor-stolpec-k"></a> 1.4 Izgovor (stolpec K)
V stolpcu K beležimo izgovor kratic. Izgovor zapisujemo z uporabo ostrivcev, krativcev in strešic. 
Primer:

|ZRC|Znanstvenoraziskovalni center|||Večinoma v kontekstu ZRC SAZU ali založba/inštitut ZRC|||da|ne|ne|zə̀rə̀cə̀|ZRC / ZRC-ja|ž / m|pri ničti končnici moški in ženski spol|najpogosteje v zvezi z 'založba' in 'SAZU'|
|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|

Pri črkovalnih kraticah si lahko pomagamo z razpredelnico: 

[![imena_crk.PNG](https://wiki.cjvt.si/uploads/images/gallery/2022-11/scaled-1680-/imena-crk.PNG)](https://wiki.cjvt.si/uploads/images/gallery/2022-11/imena-crk.PNG)

Pri črkovalnih kraticah beležimo - z uporabo zgoraj navedenih virov -  ali se kratica izgovarja s polglasniki ali vokali. Izgovor zabeležimo na simplificiran način: vedno z naglasi na vseh črkah kratice in v primeru, da se pojavljata obe vrsti izgovora, vedno najprej izgovor z vokali, ki je ločen od polglasniškega z znakoma //: zédéá / zə̀də̀á.

|NK|nogometni klub|||||||da|ne|ne|ènká / nə̀kə̀|NK / NK-ja|m|||NK-ja samo 18 in NK-ju 6 pojavitev (vir: rtvslo.si)|
|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|

Pri nekaterih prevzetih kraticah:
- ohranimo izvorni način izgovarjanja (BBC [bíbísí], FBI [êfbíáj], DJ [dídžêj])
- uporabljamo izvorno in podomačeno izgovorjavo (PC [pécé in písí], GSM [géêsêm in džíêsêm]).

Če ima kratica več načinov izgovora, jih zapišemo enega ob drugem, ločimo jih s poševnico (/). 
Primer: 

|RK|rokometni klub|||||||da|ne|ne|èrká / rə̀kə̀|RK / RK-ja|m|
|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|

Pri prevzetih kraticah, ki ima variantno izgovorjavo, vedno najprej navedemo tujo varianto, nato znak // in nato slovensko varianto (izmišljen primer): písí // pécé / pə̀cə̀.

|PC|Personal Computer|osebni računalnik|||||da|ne|da|pisí // pécé / pə̀cə̀|PC / PC-ja|m|
|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|


Pri črkovalnih kraticah zaradi značilne glasovne sestave izgovarjamo vsako črko posebej; soglasnike lahko izgovarjamo na dva načina (pri opisu kratice skušamo slediti dejanski rabi): 
- z ustreznim glasom in polglasnikom (PVC [pə̀və̀cə̀], NK [nə̀kə̀]);
- z ustreznim glasom in samoglasnikom e oz. a (PVC [pévécé], NK [ênká]).

*Zapis kratic je lahko indikator izgovora (ali gre za podaljšavo z j-jem):
SDS:
- SDS-a: [esdees] > [esdeesa]
- SDS-ja: [s3d3s3] > [s3d3s3ja]

Nečrkovalne kratice običajno izgovarjamo kot druge besede ([núk], [sazú], [téš]). Pogosto preidejo med navadno besedje (UNICEF > Unicef in EMŠO > emšo). Kratice preidejo v stvarna poimenovanja, ko se prekine zapis s samimi velikimi črkami.

### <a id="pregibanje-stolpec-l"></a> 1.5 Pregibanje (stolpec L)
V tabeli beležimo, kakšne vrste pregibanja smo našli. Primarni vir informacij je pisni korpus Gigafida 2.0, oblike pa iščemo tudi v drugih virih, kot je na primer Fran, razna periodika na spletu, kredibilni članki ipd. Izpis pregibnih oblik, ki so v korpusu z vezajem, je pripravljen že v podatkovni tabeli. Ta izpis lahko služi natančnejši analizi, kjer primerjamo pojavitve kratice v rabi, npr. pojavljanje zvez po poročanju STA in po poročanju STA-ja.
Pri črkovalnih kraticah nas zanima, ali se kratica pregiba z vezajem, z ničto končnico ali oboje. Pri zapisu variant vedno najprej navedemo pregibanje brez, nato znak / in nato pregibanje z vezajem. Če se pregiba z vezajem, nas zanima, ali se pregiba s podaljšavo z -j-, brez podaljšave ali oboje. Če gre za varianto, najprej navedemo podaljšano, nato znak //, nato nepodaljšano varianto. Način pregibanja nakažemo z rodilniško obliko (predvidoma v ednini), npr. EU / EU-ja. Kot variante obravnavamo pogoste pojavitve, ne pa tudi redkejše ali lapsuse (npr. EUja, EU-a).

Neko pregibanje beležimo, če število najdenih pregibanj v Gigafidi obsega vsaj 0,05 % vseh najdenih primerov. Če je bilo primerov, ki so potrjevali pregibanje, malo, pa so se nam na podlagi primerov in virov zdeli relevantni, smo jih dopisali in v komentarju zapisali, da je primerov pregibanja malo. 
Nekaj primerov:

|-|-|-|-|-|-|-|-|-|-|-|-|-|-|
|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|
|WTO|World Trade Organization|Svetovna trgovinska organizacija|||||da|ne|da|və̀tə̀ó|WTO / WTO-ja|ž / m|pri ničti končnici moški in ženski spol|
|KAC|Klagenfurter Athletiksport Club|avstrijski hokejski klub|||||ne|ne|da|kác|KAC / KAC-a|m||
|DAX|Deutscher Aktienindex|nemški delniški indeks|||||ne|da|da|dáks|DAX / DAX-a|Daxa|m|prehaja med navadno besedje|
|SZS|Smučarska zveza Slovenije|||||||da|ne|ne|sə̀zə̀sə̀|SZS / SZS-ja|ž / m|pri ničti končnici moški in ženski spol|

Končnice in obrazila pišemo za vezajem z malimi črkami, če se kratica govorno končuje na:
- soglasnik (OZN OZN-a, OZN-ov [ózèèn ózèêna ózèênov-]; ŠOS ŠOS-a, ŠOS-ov [šós šósa šósov-]) ali
- naglašeni samoglasnik (OZN OZN-ja, OZN-jev [ózə̀nə̀ ózə̀nə̀ja ózə̀nə̀jev-], STA STA-ja, STA-jev [èstèá èstèája èstèájev-]). Če je na koncu kratice v izgovoru polglasnik, torej pride do podaljšave z j-.

Številne kratice se pregibajo po ničti sklanjatvi - ostanejo vedno enake. Kadar iz kratic napravimo tvorjenke, pregibamo tudi te (DUTB-jev DUTB-jeva DUTB-jevo).

### <a id="spol-stolpec-m"></a> 1.6 Spol (stolpec M)
V stolpec M vpisujemo slovnični spol kratice. Ženski spol označujemo z “ž”, moški z “m”, srednji pa s “s”. V primeru, da je možnih več spolov, oznake med seboj ločujemo s poševnico (ž/s/m).
Pri določanju slovničnega spola velja, da:
- so kratice najpogosteje moškega spola - ne glede na to, katerega spola je jedrna beseda podstave (DDV < davek na dodano vrednost, NUK < Narodna in univerzitetna knjižnica, KUD < kulturno-umetniško društvo) in se sklanjajo po prvi moški sklanjatvi (DDV-ja, NUK-a, KUD-a);

|NUK|Narodna in univerzitetna knjižnica|||||||ne|da|ne|núk|NUK / NUK-a|Nuka|m|prehaja med navadno besedje|
|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|

- kratice ženskega spola, ki se končujejo na nenaglašeni a, sklanjamo po prvi ženski sklanjatvi: CIA CIE – pri tej skupini je pogost prehod med navadno besedje;
- kratice ženskega spola, ki se ne končujejo na naglašeni a, sklanjamo po tretji ženski sklanjatvi z ničto končnico (ostanejo vedno enake).

Novost je izrecno izpostavljena možnost sklanjanja po ničtem sklanjatvenem vzorcu pri prav vseh kraticah: ne glede na spol jedrnega samostalnika v podstavi (torej tako pri ženskem in moškem kot tudi srednjem spolu) in ne glede na tip kratice (črkovalna, nečrkovalna) – brez DDV, na ARSO, o DNK, iz EU, pri MNZ.

|DNK|Deoksiribonukleinska kislina|||||||da|ne|ne|déènká|DNK / DNK-ja|ž / m|pri ničti končnici ženski in moški spol; (tudi) pridevniško|
|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|


**POSEBNOSTI**

- Redke črkovalne in nečrkovalne kratice, ki jih sklanjamo po ničtem sklanjatvenem vzorcu, lahko ohranjajo ženski oz. srednji spol podstavne zveze: FF ('Filozofska fakulteta') – na mariborski FF, DNK ('dezoksiribonukleinska kislina') – analiza človekove DNK, EU ('Evropska unija') – na ravni celotne EU; DOPPS ('Društvo za opazovanje in proučevanje ptic Slovenije') – DOPPS se je pritožilo zoper odredbo,

- Za nekatere kratice so v rabi različne sklanjatvene možnosti, npr. NUK: Izvod knjige hranijo v ljubljanskem NUK-u; Že več let je na voljo razglednica z motivi Plečnikovega NUK; Razpis za gradnjo nove NUK je bil napovedan že leta 1988.

- Nekatere kratice, ki imajo v jedru podstave samostalnik v množini (ZDA, NVO), lahko ohranjajo število in spol podstavnega samostalnika: ZDA – Leta 1924 so ZDA Indijancem priznale ameriško državljanstvo, toda: ZDA in EU sta podpisali sporazum.

Spol v tabeli beležimo skladno s pregibanjem: če se črkovalna kratica pregiba z vezajem, gre za moški spol. Če se pregiba z ničto končnico, spol ugotovimo iz podstave in korpusnih zgledov. 

### <a id="posebnosti-stolpec-n"></a> 1.7 Posebnosti (stolpec N)
V stolpcu Posebnosti smo opozarjali na: 

**Variantni zapis**

Zabeležili smo, ali kratica prehaja v navadni zapis, in sicer s komentarjem: 
prehaja med navadno besedje

**Posebnosti v spolu**

Na posebnosti v rabi (npr. primere, kjer korpusni kontekst dokazuje, da je v rabi več slovničnih spolov tudi pri ničti končnici; kadar se kratica rabi množinsko) opozorimo v stolpcu Posebnosti.
Označevali smo s komentarji: 
- pri ničti končnici moški in ženski spol
- pri ničti končnici vsi trije spoli

Primer:

|SGP|Splošno gradbeno podjetje|||||||da|ne|ne|èsgépé / sə̀gə̀pə̀|SGP|ž / s / m|pri ničti končnici vsi trije spoli|
|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|

**Pridevniško rabo**
Beležili smo tudi, ali se kratica rabi (tudi) pridevniško, in sicer s komentarjema: 
Pridevniško 
(tudi) pridevniško
Primer: “LCD”

**Množinsko rabo**
Če se kratica uporablja samo v množini, v stolpcu komentar označimo: 
Množinsko
Primer:  “ZDA”


### <a id="komentar-stolpec-o"></a> 1.8 Komentar (stolpec O)
V stolpec “komentar” lahko zapišemo vsa opazovanja, dileme in vprašanja, ki se pojavijo pri obravnavi kratic. 
V komentarju smo beležili predvsem naslednje posebnosti pri kraticah: 
- kandidatka za kratico se mi ne zdi relevantna - predlagam za izključitev
- izgovor izpeljala iz pregibanja
- najpogosteje kot del večbesednega poimenovanja
- navadno sledi ime gledališča/kluba/šole
- v Franu zapis pregibanja z vezajem (MK-ja)
- popravila zapis kratice (velike tiskane črke)
- 6x pregibanje brez podaljšave (UNCHR-a) (*če ne dosega vsaj 8 zadetkov v korpusu, je pa blizu)
- 6x pregibanje s podaljšavo (UNCHR-ja)
- pregibanje z vezajem potrjujejo le   4   primeri ( od    2370 cca.   )
- (pregibanje z vezajem potrjuje le nekaj primerov)
- ne najdem primerov / težko najdem zglede
- variant zapisa malo
- preimenovanje v: [razvezava] (npr. SMC: Mira Cerarja > modernega centra)

#### <a id="druge-razvezave-stolpec-p"></a> 1.9 Druge razvezave (stolpec P)

V stolpcu “druge razvezave” beležimo vse druge razvezave, ki jih najdemo. 
V komentar napišemo [NOVA RAZVEZAVA]. 

|SF|Slovenska filharmonija|||||||da|ne|ne|sə̀fə̀|SF / SF-ja|ž / m|izgovor izpeljala iz pregibanja|science fiction|
|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|:-----|

## <a id="drugo"></a> 2 Drugo

Zapis kratic je lahko indikator izgovora (ali gre za podaljšavo z j-jem):
SDS:
- SDS-a: [esdees] > [esdeesa]
- SDS-ja: [s3d3s3] > [s3d3s3ja]

- Če nečrkovalna kratica preide v besedo, jo kot občno poimenovanje zapisujemo z malimi črkami (emšo; mrsa), kot lastno ime pa z veliko začetnico (Nuk, Ajpes, Unesco, Nasa).
- Redke črkovalne kratice lahko zapisujemo tudi z malimi črkami (SMS/sms, GSM/gsm).
- Posebni so primeri, ko se ubesedi cel izgovor, npr. TV > teve, SMS > esemes.

---

*Operacijo Razvoj slovenščine v digitalnem okolju sofinancirata Republika Slovenija in Evropska unija iz Evropskega sklada za regionalni razvoj. Operacija se izvaja v okviru Operativnega programa za izvajanje evropske kohezijske politike v obdobju 2014-2020.*