wiki:cs/Terminologie

Version 6 (modified by Zuzana Nevěřilová, 6 years ago) (diff)

--

Stručný terminologický slovník

Tento slovníček obsahuje základní lingvistické termíny (určené zejména počítačovým lingvistům) a některé termíny z počítačové lingvistiky (kurzívou jsou uvedeny anglické překlady)

Adjektivum (adjective) přídavné jméno

Adverbium (adverb) příslovce

Aktivum (active voice) činný rod

Akuzativ (accusative) čtvrtý pád

Anotace (anotation) značkování

Dativ (dative) třetí pád

Desambiguací (disambiguation) se rozumí proces, v němž je zjednoznačněn výstup analyzátoru podle kontextu, v němž se slovo v textu nalézá.

Duál dvojné číslo (např. oba)

Femininum (feminine) ženský rod

Genitiv (genitive) druhý pád

Homografie (homography) - z jednoho slovního tvaru lze bez ohledu na kontext vytvořit dva tvary základní. Například tvaru ' ubrus' lze jako základní tvar přiřadit nominativ substantiva 'ubrus' nebo infinitiv slovesa 'ubrousit'.

Homonymie (homonymy) - dvě slova nelišící se v žádném z tvarů mají přitom dva různé významy. Kupříkladu slovo zámek označující panské sídlo nebo součást dveřního kování.

Imperativ rozkazovací způsob (imperative)

Imperfektum nedokonavý vid (imperfective)

Infinitiv neurčitek (infinitive)

Instrumentál (instrumental) sedmý pád

Jazyk je systém znaků sloužící k výměně a vyrovnávání obsahů lidského vědomí.

Jazykový styl je způsob cílevědomého výběru a uspořádání jazykových prostředků, který se uplatňuje při genezi textu; v hotovém komunikátu se pak projevuje jako princip organizace jazykových jednotek, který z částí a jednotlivostí tvoří jednotu vyhovující komunikačnímu záměru autora.

Kmen (stem) je ta část slovního tvaru, která zbývá po odtržení koncovky.

Komparativ druhý stupeň stupňování adjektiv nebo adverbií (např. krásnější, hůře)

Koncovka je tvarotvorná přípona stojící v absolutním konci slova (pádová, osobní, infinitivní).

Kondicionál podmiňovací způsob u sloves

Konsonant (consonant) souhláska

Korpusem (corpus, corpora) se rozumí rozsáhlý vnitřně strukturovaný a ucelený soubor textů daného jazyka elektronicky uložený a zpracovávaný. Texty jsou v korpusu strukturovány a organizovány se zřetelem k využití pro určitý cíl, vůči němuž pak je korpus považován za reprezentativní. Podle uložených dat mohou korpusy obsahovat pouze holé texty nebo texty různě označkované (anotované).

Lokativ (locative) šestý pád

Maskulinum (masculine) mužský rod

Matice záměn (confusion matrix) způsob vyhodnocení klasifikační úlohy. Matice dává do souvislosti výsledky klasifikace nějakých dat s informací o „správném“ zařazení těchto příkladů do tříd (true positives, true negatives, false negatives, false positives). Pomocí matice záměn lze spočítat přesnost, pokrytí, celkovou správnost a F-míry.

Morfémy jsou elementární znaky jazyka. V praxi rozlišujeme různé typy morfémů: kořeny - nesamostatné morfémy nesoucí elementární lexikální významy; afixy, které se dále dělí podle funkce na gramatické a lexikální, podle postavení vzhledem ke kořeni na prefixy - morfémy stojící před kořenovým morfémem, sufixy - morfémy připojované za kořenové morfémy, postfixy - slovotvorné morfémy připojované až za gramatický sufix

Morfologický analyzátor (morphological analyser) - automat, který ke každému slovnímu tvaru poskytuje množinu základních tvarů - lemmat a gramatických značek.

Morfologický disambiguátor (tagger) - program, který na základě pravidel, statistiky nebo pomocí hybridního přístupu vybere ze značek a lemmat poskytnutých morfologickým analyzátorem jednu dvojici (lemma, značky).

Neutrum (neuter) střední rod

Nominativ (nominative) první pád

Participium (participle) - příčestí, tj. neurčitý tvar slovesa. Spolu s dalšími částmi sloves tvoří např. pasivní konstrukce, minulý čas nebo kondicionál.

Partikule (particle) - částice

Pasivum (passive voice) trpný rod (např. být viděn)

Perfektum (perfective) dokonavý vid

Plurál (plural, plural form) množné číslo

Počítačová lingvistika je oborem jazykovědy, který se zabývá strojovým zpracováním přirozeného jazyka. Primárním cílem počítačové lingvistiky je automatizace procesu porozumění přirozenému jazyku, a to jak v mluvené, tak i v psané formě.

Pokrytí (recall) poměr true positives k součtu true positives a false positives

Přesnost (precision) poměr true negatives k součtu true negatives a false positives

Reflexivní (reflexive) zvratný

Singulár (singular, singular form) jednotné číslo

Slovní tvar (word form) je lineární segment promluvy, charakterizovaný celistvostí jak významově funkční, tak i zvukovou a grafickou, se zásadní samostatností, projevující se v jeho přemístitelnosti (omezené ovšem zákonitostmi pořádku slov ve větě).

Slovo jako potenciální jednotka jazyka (jazykového systému), která je slovem v předchozím smyslu reprezentována. Z této definice vyplývá též rozlišování slova textového a slova systémového, nebo také slovoformy a lexému. Textové slovo je realizací systémového slova.

Slovo jako reálně vyčlenitelná jednotka jazykového projevu (textu), jako sled, řetězec morfů.

Stylistický korektor definujeme jako prostředek pro automatickou detekci stylistických a stylových prohřešků, který pracuje nad elektronicky uchovaným textem přirozeného jazyka.

Stylistika je jazykovědná disciplína, která styl studuje a na základě jednotlivých textů dochází ke zobecnění zákonitostí stylizace jazykových projevů.

Substantivum podstatné jméno

Superlativ třetí stupeň (např. nejchytřejší)

Textové slovo je vzhledem k zaměření morfologické analýzy na psaný text definováno jako posloupnost znaků (písmen) ohraničená po obou stranách mezerou. Textová slova jsou realizacemi systémových slov, která jsou definována ve slovníku kmenových základů.

Tvarotvorný základ je lexikální složka slovního tvaru, která je všem tvarům ohebného slova společná.

Verbum (verb) sloveso

Vokál (vowel) samohláska

Vokativ (vocative) pátý pád

Prameny

Čechová M., Chloupek J., Krčmová M., Minářová E.: Stylistika současné češtiny, Praha, ISV, 1997.

https://en.wikipedia.org/wiki/Precision_and_recall