| 1 | = NLP ještě dlouho nebude dokonalé... = |
| 2 | Nechť tato stránka funguje jako shromaždiště všech roztomilých příkladů nedokonalosti NLP nástrojů vyvíjených ať už zde či někde jinde. |
| 3 | |
| 4 | === osobní převzetí není možné, pouze v případě objednání montáže volat předem pro stanovení ceny!'' === #osobn.2BAO0_p.2BAVk-evzet.2BAO0_nen.2BAO0_mo.2BAX4-n.2BAOk.2C_pouze_v_p.2BAVkA7Q-pad.2BARs_objedn.2BAOE-n.2BAO0_mont.2BAOEBfg-e_volat_p.2BAVk-edem_pro_stanoven.2BAO0_ceny.27.27 |
| 5 | |
| 6 | * interpretace syntu (dodal Vašek N.): ''pokud si přejete namontovat volata, budeme příst, abychom stanovili cenu'' |
| 7 | |
| 8 | |
| 9 | |
| 10 | === O hotovostní zálohy si prosím piště nejpozději do pátku. === |
| 11 | |
| 12 | * interpretace desambu (dodal Vašek N.): ''prosím nejpozději do pátku a u toho pištím'' |
| 13 | |
| 14 | |
| 15 | |
| 16 | === Translate server error === #Translate_server_error |
| 17 | |
| 18 | * [http://images.google.com/search?hl=en&biw=1886&bih=1016&gbv=2&tbm=isch&sa=1&q=translate+server+errors Translate server error] |
| 19 | |
| 20 | |
| 21 | * [http://revealingerrors.com/autoresponder_road_sign podobný případ ve welštině] |
| 22 | |
| 23 | |
| 24 | |
| 25 | === Příběhy ze Slovníkových Příkladů === #P.2BAVkA7Q-b.2BARs-hy_ze_Slovn.2BAO0-kov.2BAP0-ch_P.2BAVkA7Q-klad.2BAW8- |
| 26 | |
| 27 | * [http://nlp.fi.muni.cz/cs/PribehyZeSlovnikovychPrikladu aneb Co nám vypráví Verbalex] |
| 28 | |
| 29 | |
| 30 | |
| 31 | === Engrish === #Engrish |
| 32 | |
| 33 | * [http://www.engrish.com/2007/12/then-say-someone-made-you-do-it/ then-say-someone-made-you-do-it] |
| 34 | |
| 35 | |
| 36 | * http://www.buzzfeed.com/nataliemorin/chinese-signs-that-got-seriously-lost-in-tranlsation?s=mobile |
| 37 | |
| 38 | |
| 39 | * aneb, při pohledu na některé [http://www.engrish.com/most-popular/ '"Most Popular Engrish"'] je jasné, že ty největší perly nemá na svědomí počítač, ale že i na ně je nutné vynaložit značnou dávku [http://www.engrish.com/2008/12/gender-dysphoria-approved/ lidské kreativity ...] |
| 40 | |
| 41 | |
| 42 | |
| 43 | === Autokorektor === #Autokorektor |
| 44 | |
| 45 | * [http://damnyouautocorrect.com/13603/the-25-funniest-autocorrects-of-dyacs-first-year/ aneb, když trénujete na špatné doméně] |
| 46 | |
| 47 | |
| 48 | |
| 49 | === Siri === #Siri |
| 50 | |
| 51 | * [http://www.youtube.com/watch?feature=player_embedded&v=pQj0uueIzAQ Ovládání hlasem od Apple - aneb když selže uživatel.] |
| 52 | |
| 53 | === Statistický strojový překlad === #Statistick.2BAP0_strojov.2BAP0_p.2BAVk-eklad |
| 54 | |
| 55 | * Ve skladbě „International music“ skupiny Kraftwek zní slova „mezinárodní hudba“ v různých jazycích. V češtině je to ale chybně: [http://www.youtube.com/watch?v=ruTCUI8_Iz4&t=4m26s International music na Youtube, od pozice 4:26]. Hádáme, že za touto chybou stojí statistický strojový překlad. Srovnejte s [http://translate.google.com/#en/cs/international%20music překladem stejné fráze podle Google translate]. V učicích datech pravděpodobně bylo mnohem častěji přídavné jméno, například „Mezinárodní hudební festival“. Kraftwerk vystupují podobni robotům (nebo dokonce místo sebe používají figuríny v podobě robotů) a zkreslují svůj hlas vokodérem. Můžeme tedy říci, že tato chyba, způsobena strojovým překladem, se ke skupině dobře hodí. |
| 56 | |
| 57 | |
| 58 | |
| 59 | === Čeština je složitější, než jsme si mysleli === #A.2BAQw-e.2BAWE-tina_je_slo.2BAX4-it.2BARs-j.2BAWEA7Q.2C_ne.2BAX4_jsme_si_mysleli |
| 60 | To víte, že máme 10 pádů? Ve značkách c0, c8, c9. Viz hity v korpusu czTenTen12: |
| 61 | |
| 62 | * [https://beta.sketchengine.co.uk/bonito/run.cgi/viewattrsx?q=atag%2C%22.*c0.*%22&corpname=preloaded%2Fcztenten12&refs=doc&fromp=1&setattrs=word&setattrs=tag&allpos=kw&setstructs=p&setstructs=g&setrefs=doc&refs_up=0&pagesize=20&newctxsize=40&gdex_enabled=0&gdexcnt=100©_icon=0&multiple_copy=0&use_noflash=0&select_lines=0&line_numbers=0&tbl_template=vanilla Nultým pádem voláme pípí] |
| 63 | |
| 64 | |
| 65 | * [https://beta.sketchengine.co.uk/bonito/run.cgi/first?corpname=preloaded%2Fcztenten12&reload=&iquery=&queryselector=cqlrow&lemma=&phrase=&word=&char=&cql=%22.*c8.*%22&default_attr=tag&fc_lemword_window_type=both&fc_lemword_wsize=5&fc_lemword=&fc_lemword_type=all&sca_doc.t2ld=&sca_doc.tld=&sca_doc.urldomain=&sca_doc.url=&sca_doc.wordcount= Osmým pádem označujeme zejména apostrof] |
| 66 | |
| 67 | |
| 68 | * [https://beta.sketchengine.co.uk/bonito/run.cgi/first?corpname=preloaded%2Fcztenten12&reload=&iquery=&queryselector=cqlrow&lemma=&phrase=&word=&char=&cql=%22.*c9.*%22&default_attr=tag&fc_lemword_window_type=both&fc_lemword_wsize=5&fc_lemword=&fc_lemword_type=all&sca_doc.t2ld=&sca_doc.tld=&sca_doc.urldomain=&sca_doc.url=&sca_doc.wordcount= Omega je natolik významná, že jí vyhrazujeme devátý pád] |
| 69 | |
| 70 | |
| 71 | |
| 72 | === Speech Recognition === #Speech_Recognition |
| 73 | * [http://www.independent.co.uk/news/weird-news/chinese-new-year-bbc-blunder-welcome-to-the-year-of-the-whores-9102117.html jak to umí v BBC] |