Čeština
English
  • Vítejte na stránkách NLP Centra!
  • Zapojte se do vývoje softwarových nástrojů!
  • Analýza přirozeného jazyka
  • Vyzkoušejte si korpusy o velikosti knihoven online!
  • Studujte jednu ze specializací!
  • Členové laboratoře

Morfologie

/trac/research/raw-attachment/wiki/cs/MainTopics/majka_nlpportal.png

Morfologická analýza je základním prostředkem zkoumání přirozeného jazyka a zabývá se rozlišováním a generováním správných gramatických tvarů slovních výrazů, které vzniknou skloňováním a časováním. Výsledkem je sada značek, které popisují gramatické kategorie daného tvaru, zejména pak základní tvar (lemma) a slovní vzor. Automatické rozlišení tvaru slova ve volném textu lze využít při vývoji gramatického korektoru, jako pomůcka při značkování korpusů nebo při poloautomatickém vytváření slovníků. Morfologická analýza je také výchozím bodem zpracování textu pro analýzy náročnější: syntaktickou i sémantickou. Největší problém v této oblasti je morfologická desambiguace (zjednoznačňování gramatické značky) - tedy jak automaticky rozlišit, zda slovo jedu označuje sloveso (1. osoba od jet) nebo podstatné jméno (2. nebo 3. pád od jed).

V CZPJ byl vytvořen obecný morfologický analyzátor pro češtinu Majka pokrývající slovní zásobu s více než 6 milióny slovních tvarů. Díky němu vznikly podobný analyzátor pro slovenštinu, gramatický korektor fispell, převodník ascii textu na text s diakritikou czaccent nebo interaktivní rozhraní pro IM protokol Jabber. Analyzátor Majka byl později rozšířen pro slovenštinu, polštinu a angličtinu.

Související projekty

  • CZ accent oháčkovávač textů bez diakritiky

Další informace