Sémantika
Sémantická a pragmatická analýza jsou nejkomplexnější úrovně zpracování přirozeného jazyka, protože využívají všechny výše zmíněné disciplíny. Prubířským kamenem je zde strojový překlad, který s uspokojivými výsledky pro češtinu zatím neexistuje.
Jedním z dlouhodobých projektů CZPJ je využití transparentní intenzionální logiky (TIL) jako jazyka pro sémantickou reprezentaci znalostí a transformačního jazyka v procesu automatického překladu. V současné fázi je reálné zpracovávat omezené znalosti v jednodušší podobě - experimentuje se se strojovým překladem nad určitou doménou, např. úředních dokumentů nebo počasí, nebo s poloautomatickým překladem mezi blízkými jazyky, což jsou problémy řádově snažší. Při tom se využívají korpusy, sémantické sítě a elektronické slovníky.
V oblasti reprezentace významů a znalostí můžeme zmínit významnou spoluúčast členů centra v evropských projektech EuroWordNet a Balkanet, které byly zaměřeny na budování vícejazyčné sémantické sítě typu WordNet.
Do oblasti sémantické analýzy spadají úkoly jako rezoluce anafor (jejímž cílem je například zjistit, na jaký objekt v reálném světě určité zájmeno odkazuje), parafrázování a textové vyplývání. Jde o náročné úlohy, které se zatím nepodařilo uspokojivě vyřešit pro žádný jazyk. Experimentálními nástroji jsou programy pro rozpoznání anafor Saara a systém pro generování parafrází a textových vyplývání Watsonson.
Související projekty
- PreseMT strojový překlad založený na vzorech
Animovaná ukázka Visual Browseru (zjednodušená)
Další informace
Attachments (2)
- vl_anim.gif (140.5 KB) - added by 9 years ago.
- dict2_small.png (40.0 KB) - added by 9 years ago.
Download all attachments as: .zip