wiki:cs/VetnyRozbor

Version 1 (modified by xkocinc, 10 years ago) (diff)

--

Čtyři věci, které jste nevěděli o větném rozboru

1. Větný rozbor je užitečný

Také jsme to nevěděli, dokud jsme nezačali pracovat v Centru zpracování přirozeného jazyka.

2. Větný rozbor říká, co věta znamená

Nositeli významu jsou slova, to ví každý. Ne každého ovšem napadne, že nositeli významu jsou menší jednotky (např. koncovka -tel velmi často znamená vykonavatel děje, třeba ve dvojicích slov učit-učitel). Podobně jsou nositeli významu i větší jednotky. Záleží, kde se slovo ve větě nachází a jakou roli tam hraje.

Představte si věty:

  1. Petr uviděl, jak Jiří políbil Lucii, a bylo mu to líto.
  2. Jiří uviděl, jak Petr políbil Lucii, a bylo mu to líto.

Stejná slova, ale zatracený rozdíl. Zvlášť, pokud jste Petr.

3. Automatický větný rozbor je základem pro další počítačové zpracování textu

„Hale,“ pokračoval, „nemáš snad ty sám nějaké nesnáze - víš, něco, co by samo mohlo být podnětem k těmhle obtížím?“

Opět ta nezvyklá prodleva. Pak Hal odpověděl svým zcela normálním tónem.

„Podívej, Dave, já vím, že to dobře myslíš, že chceš pomoci věci vyřešit. Ale buď je chyba v anténním systému - nebo ve vašich zkouškách. Mé zpracování informací je absolutně normální. Přezkoumej mé záznamy, zjistíš, že jsou zcela bez chyb.“

„Znám tvé pracovní záznamy do detailu, Hale - jenže to nedokazuje, že se právě teď nemůžeš mýlit. Chybu může udělat každý.“

„Nechci ti nijak zdůrazňovat, Dave, ale já chyby dělat nemohu.“

Na to nebyla žádná účinná odpověď; Bowman diskusi vzdal.

„No dobře, Hale,“ řekl poněkud uspěchaně. „Chápu, jak se na to díváš. Nechme to prostě být.“

Skoro by byl dodal: „A zapomeň na celou věc, prosím tě.“ Jenže to právě bylo něco, co Hal nedokázal.

  • A.C.Clarke: 2001: Vesmírná odysea. Odeon Praha 1979.

Všimněte si, jak lidé s myslícím počítačem mluví a on jim rozumí. Co to ale znamená? Nevíme. Jak se ono porozumění projevuje? To víme: počítač umí odpovědět na otázku, rozhodnout se na základě zjištěných faktů, pozná z krátké narážky, co si člověk myslí... Musí tedy rozumět (ať už tím myslíme cokoli) slovům, ale musí také rozumět větám. K tomu slouží modul pro automatický větný rozbor, také mu říkáme syntaktická analýza. Větný rozbor je jen malou částí oblasti zpracování přirozeného jazyka. Podívejte se, jak souvisí s umělou inteligencí.

4. Slova mají několik významů, ale jich mají desítky i stovky!

Oblíbená věta anglických počítačových lingvistů je:

Time flies like an arrow.

Lidé jí rozumí snadno a všichni stejně: čas letí jako šíp. Počítačové programy ale znají více čtení, např. časové mouchy mají rády šipku. V češtině je takových víceznačných vět také dost, např.:

Ženu holí stroj.

Jaké čtení napadlo jako první? A druhé? A třetí?

Obě uvedené věty těžko najdeme v běžném textu, jsou ukázkou něčeho extrémního. Náhodou slovo ženu znamená čtvrtý pád od žena a zároveň první osobu jednotného čísla od slovesa hnát. S holí a stroj je to podobné - podstatné jméno a sloveso zároveň.

Ve zlatém fondu druhých čtení skončila docela běžná a nevinná věta:

Zaslání na dobírku není možné, pro montáž volat předem kvůli dohodnutí ceny.

Náš systém ji „přečetl“ takto: Pokud chcete namontovat vole, my budeme příst (jako kočka), abychom si dohodli cenu.