Skip to main content
Advanced Search
Search Terms
Content Type

Exact Matches
Tag Searches
Date Options
Updated after
Updated before
Created after
Created before

Search Results

71 total results found

Označevalne smernice

07 Universal Dependencies

V tem poglavju so zbrane označevalne smernice za oblikoslovje in skladnjo po sistemu Universal Dependencies (UD). Različica 1.3 projekt SPOT DOBROVOLJC, Kaja in TERČON, Luka: 2023. Universal Dependencies: Smernice za označevanje besedil v slovenščini. Različ...

Reference in povezave

07 Universal Dependencies

V tem poglavju so zbrane relevantne reference in povezave na projekte, v katerih se je označevalni sistem razvijal ter uporabljal. Krovna spletna stran projekta Universal Dependencies: https://universaldependencies.org/ Splošne smernice: https://universalde...

Predstavitev normalizacije

03 Normalizacija

V tem poglavju je strnjeno predstavljen potek normalizacije nestandardnih besed. Podrobnejšo predstavitev najdete v smernicah v poglavju Označevalne smernice. Normalizacija tvitov, v tabeli razdeljenih na pojavnice, je potekala hkrati s tokenizacijo. Pri ročne...

Označevalne smernice

03 Normalizacija

V tem poglavju so zbrane označevalne smernice za normalizacijo nestandardnih besedil. Smernice so razvrščene od zadnje, ažurne različice do nastarejše različice. Različica 2.0 projekt Razvoj slovenščine v digitalnem okolju LENARDIČ, Jakob in FIŠER, Darja, 2022...

Reference in povezave

03 Normalizacija

V tem poglavju so zbrane relevantne reference in povezave na projekte, v katerih se je postopek normalizacije razvijal in uporabljal. Projekti, na katerih se je razvijal označevalni sistem Razvoj slovenščine v digitalnem okolju Janes: Viri, orodja in metode za...

Predstavitev oznak

12 Jezikovni popravki (KOST)

V tem poglavju so strnjeno navedene oznake jezikovnih popravkov po sistemu KOST. Oznaka Jezikovna ravnina Tip popravka/besedna vrsta Z-LOC zapis ločilo Z-CRK zapis črkovanje Z-SN zapis skupaj/narazen Z-MV zapis mala/velika začetnica Z-KR zapis k...

Označevalne smernice

12 Jezikovni popravki (KOST)

V tem poglavju so zbrane označevalne smernice KOST. Smernice so razvrščene od nastarejše različice do zadnje, ažurne različice. Različica 1.0 (04-2022) projekt Razvoj slovenščine v digitalnem okolju STRITAR KUČUK, Mojca, 2023: KOST 1.0: Priročnik za označevanj...

Reference in povezave

12 Jezikovni popravki (KOST)

V tem poglavju so zbrane relevantne reference in povezave na projekte, v katerih se je označevalni sistem razvijal ter uporabljal. Projekti, na katerih se je razvijal označevalni sistem Razvoj slovenščine v digitalnem okolju Trenutna različica korpusa KOST STR...

Predstavitev segmentacije

02 Segmentacija

V tem poglavju je strnjeno predstavljena stavčna segmentacija. Glavno vodilo za razmejevanje povedi je kombinacija končnega ločila, presledka in besede, zapisane z veliko začetnico. Temu se pridružujejo dodatna pravila, ki zajemajo okrajšave. Te se namreč zapi...

Reference in povezave

02 Segmentacija

V tem poglavju so zbrane relevantne reference in povezave na projekte, v katerih se je postopek segmentacije razvijal in uporabljal. Projekti, na katerih se je označevalni sistem razvijal oz. uporabljal JOS - Jezikoslovno označevanje slovenskega jezika: metode...

Annotation Guidelines

01 Tokenization

This chapter summarizes the annotation guidelines for tokenization. ⬥ Space is the principal separator for tokens. ⬥ Sequences of words that can be written both with or without space without changing its meaning (e.g. kdorkoli, kdor koli “anybody, any body”) f...

Introduction to Normalization

03 Normalization

This chapter summarizes the process of normalizing non-standard Slovene words. A more detailed presentation can be found in the guidelines in the Annotation Guidelines chapter. In the case of Slovene tweets, normalization was carried out simultaneously with to...

Annotation Guidelines

03 Normalization

This chapter summarizes the annotation guidelines for normalization of Slovene non-standard texts. The guidelines are arranged from the latest, up-to-date version to the oldest version. Version 2.0 Project Development of Slovene in a Digital Environment LENARD...

References and Links

03 Normalization

This chapter compiles relevant references and provides links to projects where the normalization process has been developed and applied to Slovene texts. Projects, in which normalization has been developed or applied Development of Slovene in a Digital Environ...

Introduction to Tags

04 MULTEXT-East Morphosyntax

In this chapter, we outline the design of the MULTEXT-East specifications. The multilingual MULTEXT-East specifications are written in XML, following the TEI recommendations, and define the morphosyntactic features (attributes and their values) of words, i.e. ...

Annotation Guidelines

04 MULTEXT-East Morphosyntax

This chapter summarizes the annotation guidelines for the MULTEXT-East morphosyntax as applied to Slovene texts. The guidelines are arranged from the latest, up-to-date version to the oldest version. Version 2.0 (25-02-2023) Project Development of Slovene in a...

References and Links

04 MULTEXT-East Morphosyntax

This chapter compiles relevant references and provides links to projects where the MULTEXT-East morphosyntax has been developed and applied to Slovene texts. Projects, in which the system has been developed or applied MULTEXT-East - Multilingual corpora and te...

Annotation Guidelines

05 Lemmatization

This chapter summarizes the annotation guidelines for the lemmatization of Slovene texts. The guidelines are arranged from the latest, up-to-date version to the oldest version. Version 2.0 (25-02-2023) Project Development of Slovene in a Digital Environment HO...

References and Links

05 Lemmatization

This chapter compiles relevant references and provides links to projects where the lemmatization of Slovene has been developed and applied to Slovene texts. Projects, in which the system has been developed: JOS - Linguistic Annotation of Slovene: Methods and R...

Introduction to Tags

06 JOS-SYN Syntax

This chapter summarises the JOS-SYN syntax tags. A more detailed presentation can be found in the guidelines in the Annotation Guidelines chapter. Tag Description Atr (Attribute) Atr is used to link heads and their dependents in word phrases. The source...