Changes between Version 3 and Version 4 of cs/MainTopics


Ignore:
Timestamp:
Feb 28, 2014, 2:19:56 PM (11 years ago)
Author:
xkocinc
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • cs/MainTopics

    v3 v4  
    1010''[[BR]]Bližší informace následují níže, tematicky seskupené do následujících kapitol:''
    1111
    12  * [http://nlp.fi.muni.cz/cs/main_topics#corp Korpusy]
     12 * [[MainTopics#corp| Korpusy]]
    1313
    14  * [http://nlp.fi.muni.cz/cs/main_topics#dict Slovníky]
     14 * [[MainTopics#dict| Slovníky]]
    1515
    16  * [http://nlp.fi.muni.cz/cs/main_topics#morph Morfologie]
     16 * [[MainTopics#morph| Morfologie]]
    1717
    18  * [http://nlp.fi.muni.cz/cs/main_topics#syntan Syntaktická analýza]
     18 * [[MainTopics#syntan| Syntaktická analýza]]
    1919
    20  * [http://nlp.fi.muni.cz/cs/main_topics#semant Sémantika]
     20 * [[MainTopics#semant| Sémantika]]
    2121
    2222== Korpusy == #Korpusy
     
    5353([http://nlp.fi.muni.cz/cs/main_topics#guidepost zpět na seznam kategorií]) [[BR]]
    5454
    55 == Slovníky == #Slovn.2BAO0-ky
     55== Slovníky == #dict
    5656Slovníky  jsou odjakživa základní pomůckou jazykovědců. Ovšem práce s nimi v  papírové podobě je zdlouhavá a nepraktická. Proto jedním z prvních  projektů CZPJ byla digitalizace klasických slovníků spisovného jazyka a  vývoj souboru pokročilých nástrojů pro zpracování slovníkových dat  označovaných souhrnně jako lexikografická stanice. Jedná se o systém,  který umožní odbornému uživateli pohodlný přístup k mnoha různým  lingvistickým zdrojům a poskytne mu aplikační prostředí pro vyhledávání a  editaci dat.
    5757
     
    7474([http://nlp.fi.muni.cz/cs/main_topics#guidepost zpět na seznam kategorií]) [[BR]]
    7575
    76 == Morfologie == #Morfologie
     76== Morfologie == #morph
    7777Morfologická  analýza je základním prostředkem zkoumání přirozeného jazyka a zabývá  se rozlišováním a generováním správných gramatických tvarů slovních  výrazů, které vzniknou skloňováním a časováním.  Výsledkem je sada  značek, které popisují gramatické kategorie daného tvaru, zejména pak  základní tvar (lemma) a slovní vzor.  Automatické rozlišení tvaru slova  ve volném textu lze využít při vývoji gramatického korektoru, jako  pomůcka při značkování korpusů nebo při poloautomatickém vytváření  slovníků.  Největší problém v této oblasti je morfologická desambiguace  (zjednoznačňování gramatické značky) - tedy jak automaticky rozlišit,  zda slovo "jedu" označuje sloveso nebo podstatné jméno.
    7878
     
    8989([http://nlp.fi.muni.cz/cs/main_topics#guidepost zpět na seznam kategorií]) [[BR]]
    9090
    91 == Syntaktická analýza == #Syntaktick.2BAOE_anal.2BAP0-za
     91== Syntaktická analýza == #syntan
    9292Úkolem  syntaktické analýzy je rozpoznat, zda vstupní textový řetězec je větou v  daném (přirozeném) jazyce. V kladném případě je výsledkem analýzy  syntaktická struktura věty, například v podobě derivačního stromu. Cílem  syntaktické analýzy je, aby počítač "porozuměl" gramatice přirozeného  jazyka.  Toho lze využít např. při vývoji syntaktického korektoru na  opravu interpunkce, dialogového systému pro komunikaci v přirozeném  jazyce nebo jako jeden z nástrojů pro realizaci strojového překladu.  Čeština se svou bohatou ohebností (flexí) a volným slovosledem patří k  nejobtížněji analyzovatelným jazykům, jelikož vyžaduje mnohem více  pravidel gramatiky, než jiné jazyky.
    9393
     
    104104([http://nlp.fi.muni.cz/cs/main_topics#guidepost zpět na seznam kategorií]) [[BR]]
    105105
    106 == Sémantika == #S.2BAOk-mantika
     106== Sémantika == #semant
    107107Sémantická a  pragmatická analýza jsou nejkomplexnější úrovně zpracování přirozeného  jazyka, protože využívají všechny výše zmíněné disciplíny. Prubířským  kamenem je zde strojový překlad, který s uspokojivými výsledky pro  češtinu neexistuje.
    108108