Changes between Version 3 and Version 4 of cs/MainTopics
- Timestamp:
- Feb 28, 2014, 2:19:56 PM (11 years ago)
Legend:
- Unmodified
- Added
- Removed
- Modified
-
cs/MainTopics
v3 v4 10 10 ''[[BR]]Bližší informace následují níže, tematicky seskupené do následujících kapitol:'' 11 11 12 * [ http://nlp.fi.muni.cz/cs/main_topics#corp Korpusy]12 * [[MainTopics#corp| Korpusy]] 13 13 14 * [ http://nlp.fi.muni.cz/cs/main_topics#dict Slovníky]14 * [[MainTopics#dict| Slovníky]] 15 15 16 * [ http://nlp.fi.muni.cz/cs/main_topics#morph Morfologie]16 * [[MainTopics#morph| Morfologie]] 17 17 18 * [ http://nlp.fi.muni.cz/cs/main_topics#syntan Syntaktická analýza]18 * [[MainTopics#syntan| Syntaktická analýza]] 19 19 20 * [ http://nlp.fi.muni.cz/cs/main_topics#semant Sémantika]20 * [[MainTopics#semant| Sémantika]] 21 21 22 22 == Korpusy == #Korpusy … … 53 53 ([http://nlp.fi.muni.cz/cs/main_topics#guidepost zpět na seznam kategorií]) [[BR]] 54 54 55 == Slovníky == # Slovn.2BAO0-ky55 == Slovníky == #dict 56 56 Slovníky jsou odjakživa základní pomůckou jazykovědců. Ovšem práce s nimi v papírové podobě je zdlouhavá a nepraktická. Proto jedním z prvních projektů CZPJ byla digitalizace klasických slovníků spisovného jazyka a vývoj souboru pokročilých nástrojů pro zpracování slovníkových dat označovaných souhrnně jako lexikografická stanice. Jedná se o systém, který umožní odbornému uživateli pohodlný přístup k mnoha různým lingvistickým zdrojům a poskytne mu aplikační prostředí pro vyhledávání a editaci dat. 57 57 … … 74 74 ([http://nlp.fi.muni.cz/cs/main_topics#guidepost zpět na seznam kategorií]) [[BR]] 75 75 76 == Morfologie == # Morfologie76 == Morfologie == #morph 77 77 Morfologická analýza je základním prostředkem zkoumání přirozeného jazyka a zabývá se rozlišováním a generováním správných gramatických tvarů slovních výrazů, které vzniknou skloňováním a časováním. Výsledkem je sada značek, které popisují gramatické kategorie daného tvaru, zejména pak základní tvar (lemma) a slovní vzor. Automatické rozlišení tvaru slova ve volném textu lze využít při vývoji gramatického korektoru, jako pomůcka při značkování korpusů nebo při poloautomatickém vytváření slovníků. Největší problém v této oblasti je morfologická desambiguace (zjednoznačňování gramatické značky) - tedy jak automaticky rozlišit, zda slovo "jedu" označuje sloveso nebo podstatné jméno. 78 78 … … 89 89 ([http://nlp.fi.muni.cz/cs/main_topics#guidepost zpět na seznam kategorií]) [[BR]] 90 90 91 == Syntaktická analýza == # Syntaktick.2BAOE_anal.2BAP0-za91 == Syntaktická analýza == #syntan 92 92 Úkolem syntaktické analýzy je rozpoznat, zda vstupní textový řetězec je větou v daném (přirozeném) jazyce. V kladném případě je výsledkem analýzy syntaktická struktura věty, například v podobě derivačního stromu. Cílem syntaktické analýzy je, aby počítač "porozuměl" gramatice přirozeného jazyka. Toho lze využít např. při vývoji syntaktického korektoru na opravu interpunkce, dialogového systému pro komunikaci v přirozeném jazyce nebo jako jeden z nástrojů pro realizaci strojového překladu. Čeština se svou bohatou ohebností (flexí) a volným slovosledem patří k nejobtížněji analyzovatelným jazykům, jelikož vyžaduje mnohem více pravidel gramatiky, než jiné jazyky. 93 93 … … 104 104 ([http://nlp.fi.muni.cz/cs/main_topics#guidepost zpět na seznam kategorií]) [[BR]] 105 105 106 == Sémantika == # S.2BAOk-mantika106 == Sémantika == #semant 107 107 Sémantická a pragmatická analýza jsou nejkomplexnější úrovně zpracování přirozeného jazyka, protože využívají všechny výše zmíněné disciplíny. Prubířským kamenem je zde strojový překlad, který s uspokojivými výsledky pro češtinu neexistuje. 108 108