Changes between Initial Version and Version 1 of cs/Morfologie


Ignore:
Timestamp:
Mar 23, 2015, 1:11:36 PM (8 years ago)
Author:
xkocinc
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
 • cs/Morfologie

  v1 v1  
   1= Morfologie = #morph
   2[[Image(/trac/research/raw-attachment/wiki/cs/MainTopics/majka_nlpportal.png, align=right)]]
   3
   4Morfologická  analýza je základním prostředkem zkoumání přirozeného jazyka a zabývá  se rozlišováním a generováním správných gramatických tvarů slovních  výrazů, které vzniknou skloňováním a časováním.  Výsledkem je sada  značek, které popisují gramatické kategorie daného tvaru, zejména pak  základní tvar (lemma) a slovní vzor.  Automatické rozlišení tvaru slova  ve volném textu lze využít při vývoji gramatického korektoru, jako  pomůcka při značkování korpusů nebo při poloautomatickém vytváření  slovníků. Morfologická analýza je také výchozím bodem zpracování textu pro analýzy náročnější: syntaktickou i sémantickou. Největší problém v této oblasti je morfologická desambiguace  (zjednoznačňování gramatické značky) - tedy jak automaticky rozlišit,  zda slovo ''jedu'' označuje sloveso (1. osoba od ''jet'') nebo podstatné jméno (2. nebo 3. pád od ''jed'').
   5
   6V CZPJ byl vytvořen obecný morfologický analyzátor pro češtinu '''Majka'''  pokrývající slovní zásobu s více než 6 milióny slovních tvarů. Díky  němu vznikly podobný analyzátor pro slovenštinu, gramatický korektor '''fispell''', převodník ascii textu na text s diakritikou '''czaccent''' nebo interaktivní rozhraní pro IM protokol Jabber. Analyzátor Majka byl později rozšířen pro slovenštinu, polštinu a angličtinu.
   7
   8''Související projekty:''
   9
   10 * Majka ([http://nlp.fi.muni.cz/czech-morphology-analyser česká],[http://nlp.fi.muni.cz/slovak-morphology-analyser slovenská],[http://nlp.fi.muni.cz/polish-morphology-analyser polská],[http://nlp.fi.muni.cz/english-morphology-analyser anglická] morfologie) [http://nlp.fi.muni.cz/projekty/wwwajka (webové rozhraní)]
   11
   12 * [http://nlp.fi.muni.cz/ma/free.html Fajka (analyzátor s volnou verzí dat)]
   13
   14 * [http://nlp.fi.muni.cz/cz_accent/ CZ accent] oháčkovávač textů bez diakritiky