Changes between Version 51 and Version 52 of cs/MainTopics


Ignore:
Timestamp:
Apr 28, 2014, 12:02:06 PM (7 years ago)
Author:
xkocinc
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • cs/MainTopics

    v51 v52  
    6363
    6464== Slovníky == #dict
    65 {{{
    66 #!html
    67 <img src="https://nlp.fi.muni.cz/trac/research/raw-attachment/wiki/cs/MainTopics/debII_slovniky.png?format=raw" />
    68 }}}
    69 
    7065[[Image(/trac/research/raw-attachment/wiki/cs/MainTopics/debII_slovniky.png, align=right)]]
    71 
    7266
    7367Slovníky  jsou odjakživa základní pomůckou jazykovědců. Ovšem práce s nimi v  papírové podobě je zdlouhavá a nepraktická. Proto jedním z prvních  projektů CZPJ byla digitalizace klasických slovníků spisovného jazyka a  vývoj souboru pokročilých nástrojů pro zpracování slovníkových dat  označovaných souhrnně jako lexikografická stanice. Jedná se o systém,  který umožní odbornému uživateli pohodlný přístup k mnoha různým  lingvistickým zdrojům a poskytne mu aplikační prostředí pro vyhledávání a  editaci dat.
     
    9084
    9185== Morfologie == #morph
    92 {{{
    93 #!html
    94 <img src="/trac/research/raw-attachment/wiki/cs/MainTopics/majka_nlpportal.png​?format=raw" />
    95 }}}
     86
     87[[Image(/trac/research/raw-attachment/wiki/cs/MainTopics/majka_nlpportal.png, align=right)]]
     88
    9689Morfologická  analýza je základním prostředkem zkoumání přirozeného jazyka a zabývá  se rozlišováním a generováním správných gramatických tvarů slovních  výrazů, které vzniknou skloňováním a časováním.  Výsledkem je sada  značek, které popisují gramatické kategorie daného tvaru, zejména pak  základní tvar (lemma) a slovní vzor.  Automatické rozlišení tvaru slova  ve volném textu lze využít při vývoji gramatického korektoru, jako  pomůcka při značkování korpusů nebo při poloautomatickém vytváření  slovníků.  Největší problém v této oblasti je morfologická desambiguace  (zjednoznačňování gramatické značky) - tedy jak automaticky rozlišit,  zda slovo "jedu" označuje sloveso nebo podstatné jméno.
    9790
     
    107100
    108101== Syntaktická analýza == #syntan
    109 {{{
    110 #!html
    111 <img src="/trac/research/raw-attachment/wiki/cs/MainTopics/synt_tree.png​?format=raw" />
    112 }}}
     102
     103[[Image(/trac/research/raw-attachment/wiki/cs/MainTopics/synt_tree.png​, align=right)]]
     104
    113105Úkolem  syntaktické analýzy je rozpoznat, zda vstupní textový řetězec je větou v  daném (přirozeném) jazyce. V kladném případě je výsledkem analýzy  syntaktická struktura věty, například v podobě derivačního stromu. Cílem  syntaktické analýzy je, aby počítač "porozuměl" gramatice přirozeného  jazyka.  Toho lze využít např. při vývoji syntaktického korektoru na  opravu interpunkce, dialogového systému pro komunikaci v přirozeném  jazyce nebo jako jeden z nástrojů pro realizaci strojového překladu.  Čeština se svou bohatou ohebností (flexí) a volným slovosledem patří k  nejobtížněji analyzovatelným jazykům, jelikož vyžaduje mnohem více  pravidel gramatiky, než jiné jazyky.
    114106
     
    124116
    125117== Sémantika == #semant
    126 {{{
    127 #!html
    128 <img src="/trac/research/raw-attachment/wiki/cs/MainTopics/disct2_small.png​?format=raw" />
    129 }}}
     118
     119[[Image(/trac/research/raw-attachment/wiki/cs/MainTopics/disct2_small.png, align=left)]]
     120
    130121Sémantická a  pragmatická analýza jsou nejkomplexnější úrovně zpracování přirozeného  jazyka, protože využívají všechny výše zmíněné disciplíny. Prubířským  kamenem je zde strojový překlad, který s uspokojivými výsledky pro  češtinu neexistuje.
    131122
     
    149140
    150141== Další informace ==
     142
    151143 * [[Specializace| Předměty specializace Zpracování přirozeného jazyka]]
    152144