wiki:cs/NlpNeniDokonale

Version 3 (modified by xkocinc, 10 years ago) (diff)

--

NLP ještě dlouho nebude dokonalé…

http://revealingerrors.com/pyblosxom-images/translate_server_error.jpg Nechť tato stránka funguje jako shromaždiště všech roztomilých příkladů nedokonalosti NLP nástrojů vyvíjených ať už zde či někde jinde.

Osobní převzetí není možné, pouze v případě objednání montáže volat předem pro stanovení ceny''

  • interpretace syntu (dodal Vašek N.): pokud si přejete namontovat volata, budeme příst, abychom stanovili cenu

O hotovostní zálohy si prosím piště nejpozději do pátku.

  • interpretace desambu (dodal Vašek N.): prosím nejpozději do pátku a u toho pištím

Translate server error

Příběhy ze Slovníkových Příkladů

Engrish

Autokorektor

Siri

Statistický strojový překlad

  • Ve skladbě „International music“ skupiny Kraftwek zní slova „mezinárodní hudba“ v různých jazycích. V češtině je to ale chybně: International music na Youtube, od pozice 4:26. Hádáme, že za touto chybou stojí statistický strojový překlad. Srovnejte s překladem stejné fráze podle Google translate. V učicích datech pravděpodobně bylo mnohem častěji přídavné jméno, například „Mezinárodní hudební festival“. Kraftwerk vystupují podobni robotům (nebo dokonce místo sebe používají figuríny v podobě robotů) a zkreslují svůj hlas vokodérem. Můžeme tedy říci, že tato chyba, způsobena strojovým překladem, se ke skupině dobře hodí.

Čeština je složitější, než jsme si mysleli

To víte, že máme 10 pádů? Ve značkách c0, c8, c9. Viz hity v korpusu czTenTen12:

Speech Recognition