wiki:cs/Semantika

Sémantika

/trac/research/raw-attachment/wiki/cs/MainTopics/dict2_small.png

Sémantická a pragmatická analýza jsou nejkomplexnější úrovně zpracování přirozeného jazyka, protože využívají všechny výše zmíněné disciplíny. Prubířským kamenem je zde strojový překlad, který s uspokojivými výsledky pro češtinu zatím neexistuje.

Jedním z dlouhodobých projektů CZPJ je využití transparentní intenzionální logiky (TIL) jako jazyka pro sémantickou reprezentaci znalostí a transformačního jazyka v procesu automatického překladu. V současné fázi je reálné zpracovávat omezené znalosti v jednodušší podobě - experimentuje se se strojovým překladem nad určitou doménou, např. úředních dokumentů nebo počasí, nebo s poloautomatickým překladem mezi blízkými jazyky, což jsou problémy řádově snažší. Při tom se využívají korpusy, sémantické sítě a elektronické slovníky.

V oblasti reprezentace významů a znalostí můžeme zmínit významnou spoluúčast členů centra v evropských projektech EuroWordNet a Balkanet, které byly zaměřeny na budování vícejazyčné sémantické sítě typu WordNet.

Do oblasti sémantické analýzy spadají úkoly jako rezoluce anafor (jejímž cílem je například zjistit, na jaký objekt v reálném světě určité zájmeno odkazuje), parafrázování a textové vyplývání. Jde o náročné úlohy, které se zatím nepodařilo uspokojivě vyřešit pro žádný jazyk. Experimentálními nástroji jsou programy pro rozpoznání anafor Saara a systém pro generování parafrází a textových vyplývání Watsonson.

Související projekty

  • PreseMT strojový překlad založený na vzorech

Animovaná ukázka Visual Browseru (zjednodušená)

/trac/research/raw-attachment/wiki/cs/MainTopics/vl_anim.gif

Další informace

Last modified 5 years ago Last modified on Mar 23, 2015 1:19:22 PM

Attachments (2)

Download all attachments as: .zip