Context Navigation

Changes between Version 25 and Version 26 of cs/MainTopics

Timestamp:: Apr 8, 2014, 10:02:51 AM (11 years ago)
Author:: xkocinc
Comment:: --

Legend:

: Unmodified
: Added
: Removed
: Modified

cs/MainTopics

-                      v25
+                      v26
+= Na čem pracujeme v NLP Centru? =
 Centrum zpracování přirozeného jazyka  se zaměřuje na získávání výsledků v oblastech informačních technologií a  jazykovědy. Výsledky projektů jsou hojně publikovány na konferencích,  Centrum ZPJ také spolupracuje s tuzemskými i zahraničními pracovišti  podobného zaměření a studentům nabízí výměnné pobyty na partnerských  univerzitách mimo republiku.
+Vyzkoušejte si některé naše jazykové nástroje:
+Vyzkoušejte si některé naše jazykové nástroje:
  * [http://prirucka.ujc.cas.cz/ Internetová jazyková příručka]
  * [http://nlp.fi.muni.cz/cz_accent/ CZ accent][[BR]] ''nástroj na doplňování diakritiky''
  * [http://nlp.fi.muni.cz/%7Expopelk/xplain/ X-Plain][[BR]] ''hra Activity s počítačem''
  * [http://nlp.fi.muni.cz/czech-morphology-analyser Majka] [http://nlp.fi.muni.cz/projekty/wwwajka (webové rozhraní)] [[BR]] ''morfologický analyzátor''
+ * [http://nlp.fi.muni.cz/cz_accent/ CZ accent][[BR]] ''nástroj na doplňování diakritiky''
+ * [http://nlp.fi.muni.cz/%7Expopelk/xplain/ X-Plain][[BR]] ''hra Activity s počítačem''
+ * [http://nlp.fi.muni.cz/czech-morphology-analyser Majka] [http://nlp.fi.muni.cz/projekty/wwwajka (webové rozhraní)] [[BR]] ''morfologický analyzátor''
  * [http://nlp.fi.muni.cz/projekty/wwwsynt/query.cgi Synt] a [http://nlp.fi.muni.cz/projekty/set/ SET] ''syntaktické analyzátory''
  * [https://the.sketchengine.co.uk/open/ Vyhledávání v textových korpusech]
+ * [https://the.sketchengine.co.uk/open/ Vyhledávání v textových korpusech]
 ''Bližší informace následují níže, tematicky seskupené do následujících kapitol:''
 …
 <img src="/trac/research/raw-attachment/wiki/cs/MainTopics/corpora.png" />
 }}}
 Korpus je  kolekce textových dat v elektronické podobě. Jako významný zdroj  lingvistických dat slouží korpusy ke zkoumání mnoha frekvenčních jevů  jazyka a v současnosti jsou již neodmyslitelným nástrojem v oblasti NLP.  Kromě korpusů obsahujících libovolné texty, se vytvářejí i jiné pro  zvláštní účely, např. značkované, doménové, mluvené nebo chybové.
 …
 <img src="https://nlp.fi.muni.cz/trac/research/raw-attachment/wiki/cs/MainTopics/metatrans.png"/>
 }}}
 ''Související projekty:''
 …
  * [http://radimrehurek.com/gensim/index.html Gensim]
 ''Související články:''
  * [[UvodDoKorpusoveLingvistiky| Úvod do korpusové lingvistiky]]
 == Slovníky == #dict
 {{{
 #!html
 <img src="https://nlp.fi.muni.cz/trac/research/raw-attachment/wiki/cs/MainTopics/debII_slovniky.png?format=raw" />
 }}}
 Slovníky  jsou odjakživa základní pomůckou jazykovědců. Ovšem práce s nimi v  papírové podobě je zdlouhavá a nepraktická. Proto jedním z prvních  projektů CZPJ byla digitalizace klasických slovníků spisovného jazyka a  vývoj souboru pokročilých nástrojů pro zpracování slovníkových dat  označovaných souhrnně jako lexikografická stanice. Jedná se o systém,  který umožní odbornému uživateli pohodlný přístup k mnoha různým  lingvistickým zdrojům a poskytne mu aplikační prostředí pro vyhledávání a  editaci dat.
 …
  * [http://nlp.fi.muni.cz/projekty/cpa/ CPA]
 == Morfologie == #morph
 {{{
 #!html
 <img src="https://nlp.fi.muni.cz/trac/research/raw-attachment/wiki/cs/MainTopics/majka_nlpportal.png?format=raw" />
 }}}
 Morfologická  analýza je základním prostředkem zkoumání přirozeného jazyka a zabývá  se rozlišováním a generováním správných gramatických tvarů slovních  výrazů, které vzniknou skloňováním a časováním.  Výsledkem je sada  značek, které popisují gramatické kategorie daného tvaru, zejména pak  základní tvar (lemma) a slovní vzor.  Automatické rozlišení tvaru slova  ve volném textu lze využít při vývoji gramatického korektoru, jako  pomůcka při značkování korpusů nebo při poloautomatickém vytváření  slovníků.  Největší problém v této oblasti je morfologická desambiguace  (zjednoznačňování gramatické značky) - tedy jak automaticky rozlišit,  zda slovo "jedu" označuje sloveso nebo podstatné jméno.
 …
  * [http://nlp.fi.muni.cz/cz_accent/ CZ accent]
 == Syntaktická analýza == #syntan
 {{{
 …
 <img src="https://nlp.fi.muni.cz/trac/research/raw-attachment/wiki/cs/MainTopics/synt_tree.png?format=raw" />
 }}}
 Úkolem  syntaktické analýzy je rozpoznat, zda vstupní textový řetězec je větou v  daném (přirozeném) jazyce. V kladném případě je výsledkem analýzy  syntaktická struktura věty, například v podobě derivačního stromu. Cílem  syntaktické analýzy je, aby počítač "porozuměl" gramatice přirozeného  jazyka.  Toho lze využít např. při vývoji syntaktického korektoru na  opravu interpunkce, dialogového systému pro komunikaci v přirozeném  jazyce nebo jako jeden z nástrojů pro realizaci strojového překladu.  Čeština se svou bohatou ohebností (flexí) a volným slovosledem patří k  nejobtížněji analyzovatelným jazykům, jelikož vyžaduje mnohem více  pravidel gramatiky, než jiné jazyky.
 …
  * [http://nlp.fi.muni.cz/projekty/zuzana/ Zuzana]
 == Sémantika == #semant
 {{{
 …
 <img src="https://nlp.fi.muni.cz/trac/research/raw-attachment/wiki/cs/MainTopics/disct2_small.png?format=raw" />
 }}}
 Sémantická a  pragmatická analýza jsou nejkomplexnější úrovně zpracování přirozeného  jazyka, protože využívají všechny výše zmíněné disciplíny. Prubířským  kamenem je zde strojový překlad, který s uspokojivými výsledky pro  češtinu neexistuje.
 …
  * [cs/main_topics/VlDemoGif ve formátu GIF (zjednodušená)]
 == Další informace ==
  * [[Specializace| Předměty specializace Zpracování přirozeného jazyka]]