Changes between Version 51 and Version 52 of cs/MainTopics
- Timestamp:
- Apr 28, 2014, 12:02:06 PM (9 years ago)
Legend:
- Unmodified
- Added
- Removed
- Modified
-
cs/MainTopics
v51 v52 63 63 64 64 == Slovníky == #dict 65 {{{66 #!html67 <img src="https://nlp.fi.muni.cz/trac/research/raw-attachment/wiki/cs/MainTopics/debII_slovniky.png?format=raw" />68 }}}69 70 65 [[Image(/trac/research/raw-attachment/wiki/cs/MainTopics/debII_slovniky.png, align=right)]] 71 72 66 73 67 Slovníky jsou odjakživa základní pomůckou jazykovědců. Ovšem práce s nimi v papírové podobě je zdlouhavá a nepraktická. Proto jedním z prvních projektů CZPJ byla digitalizace klasických slovníků spisovného jazyka a vývoj souboru pokročilých nástrojů pro zpracování slovníkových dat označovaných souhrnně jako lexikografická stanice. Jedná se o systém, který umožní odbornému uživateli pohodlný přístup k mnoha různým lingvistickým zdrojům a poskytne mu aplikační prostředí pro vyhledávání a editaci dat. … … 90 84 91 85 == Morfologie == #morph 92 {{{ 93 #!html 94 <img src="/trac/research/raw-attachment/wiki/cs/MainTopics/majka_nlpportal.png?format=raw" /> 95 }}} 86 87 [[Image(/trac/research/raw-attachment/wiki/cs/MainTopics/majka_nlpportal.png, align=right)]] 88 96 89 Morfologická analýza je základním prostředkem zkoumání přirozeného jazyka a zabývá se rozlišováním a generováním správných gramatických tvarů slovních výrazů, které vzniknou skloňováním a časováním. Výsledkem je sada značek, které popisují gramatické kategorie daného tvaru, zejména pak základní tvar (lemma) a slovní vzor. Automatické rozlišení tvaru slova ve volném textu lze využít při vývoji gramatického korektoru, jako pomůcka při značkování korpusů nebo při poloautomatickém vytváření slovníků. Největší problém v této oblasti je morfologická desambiguace (zjednoznačňování gramatické značky) - tedy jak automaticky rozlišit, zda slovo "jedu" označuje sloveso nebo podstatné jméno. 97 90 … … 107 100 108 101 == Syntaktická analýza == #syntan 109 {{{ 110 #!html 111 <img src="/trac/research/raw-attachment/wiki/cs/MainTopics/synt_tree.png?format=raw" /> 112 }}} 102 103 [[Image(/trac/research/raw-attachment/wiki/cs/MainTopics/synt_tree.png, align=right)]] 104 113 105 Úkolem syntaktické analýzy je rozpoznat, zda vstupní textový řetězec je větou v daném (přirozeném) jazyce. V kladném případě je výsledkem analýzy syntaktická struktura věty, například v podobě derivačního stromu. Cílem syntaktické analýzy je, aby počítač "porozuměl" gramatice přirozeného jazyka. Toho lze využít např. při vývoji syntaktického korektoru na opravu interpunkce, dialogového systému pro komunikaci v přirozeném jazyce nebo jako jeden z nástrojů pro realizaci strojového překladu. Čeština se svou bohatou ohebností (flexí) a volným slovosledem patří k nejobtížněji analyzovatelným jazykům, jelikož vyžaduje mnohem více pravidel gramatiky, než jiné jazyky. 114 106 … … 124 116 125 117 == Sémantika == #semant 126 {{{ 127 #!html 128 <img src="/trac/research/raw-attachment/wiki/cs/MainTopics/disct2_small.png?format=raw" /> 129 }}} 118 119 [[Image(/trac/research/raw-attachment/wiki/cs/MainTopics/disct2_small.png, align=left)]] 120 130 121 Sémantická a pragmatická analýza jsou nejkomplexnější úrovně zpracování přirozeného jazyka, protože využívají všechny výše zmíněné disciplíny. Prubířským kamenem je zde strojový překlad, který s uspokojivými výsledky pro češtinu neexistuje. 131 122 … … 149 140 150 141 == Další informace == 142 151 143 * [[Specializace| Předměty specializace Zpracování přirozeného jazyka]] 152 144