Changes between Initial Version and Version 1 of cs/NlpNeniDokonale


Ignore:
Timestamp:
Mar 5, 2014, 2:03:08 PM (8 years ago)
Author:
xkocinc
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • cs/NlpNeniDokonale

    v1 v1  
     1= NLP ještě dlouho nebude dokonalé... =
     2Nechť  tato stránka funguje jako shromaždiště všech roztomilých příkladů  nedokonalosti NLP nástrojů vyvíjených ať už zde či někde jinde.
     3
     4=== osobní převzetí není možné, pouze v případě objednání montáže volat předem pro stanovení ceny!'' === #osobn.2BAO0_p.2BAVk-evzet.2BAO0_nen.2BAO0_mo.2BAX4-n.2BAOk.2C_pouze_v_p.2BAVkA7Q-pad.2BARs_objedn.2BAOE-n.2BAO0_mont.2BAOEBfg-e_volat_p.2BAVk-edem_pro_stanoven.2BAO0_ceny.27.27
     5
     6 * interpretace syntu (dodal Vašek N.): ''pokud si přejete namontovat volata, budeme příst, abychom stanovili cenu''
     7
     8
     9
     10=== O hotovostní zálohy si prosím piště nejpozději do pátku. ===
     11
     12 * interpretace desambu (dodal Vašek N.): ''prosím nejpozději do pátku a u toho pištím''
     13
     14
     15
     16=== Translate server error === #Translate_server_error
     17
     18 * [http://images.google.com/search?hl=en&biw=1886&bih=1016&gbv=2&tbm=isch&sa=1&q=translate+server+errors Translate server error]
     19
     20
     21 * [http://revealingerrors.com/autoresponder_road_sign podobný případ ve welštině]
     22
     23
     24
     25=== Příběhy ze Slovníkových Příkladů === #P.2BAVkA7Q-b.2BARs-hy_ze_Slovn.2BAO0-kov.2BAP0-ch_P.2BAVkA7Q-klad.2BAW8-
     26
     27 * [http://nlp.fi.muni.cz/cs/PribehyZeSlovnikovychPrikladu aneb Co nám vypráví Verbalex]
     28
     29
     30
     31=== Engrish === #Engrish
     32
     33 * [http://www.engrish.com/2007/12/then-say-someone-made-you-do-it/ then-say-someone-made-you-do-it]
     34
     35
     36 * http://www.buzzfeed.com/nataliemorin/chinese-signs-that-got-seriously-lost-in-tranlsation?s=mobile
     37
     38
     39 * aneb, při pohledu na některé [http://www.engrish.com/most-popular/ '"Most Popular Engrish"'] je jasné, že ty největší perly nemá na svědomí počítač, ale že i na ně je nutné vynaložit značnou dávku [http://www.engrish.com/2008/12/gender-dysphoria-approved/ lidské kreativity ...]
     40
     41
     42
     43=== Autokorektor === #Autokorektor
     44
     45 * [http://damnyouautocorrect.com/13603/the-25-funniest-autocorrects-of-dyacs-first-year/ aneb, když trénujete na špatné doméně]
     46
     47
     48
     49=== Siri === #Siri
     50
     51 * [http://www.youtube.com/watch?feature=player_embedded&v=pQj0uueIzAQ Ovládání hlasem od Apple - aneb když selže uživatel.]
     52
     53=== Statistický strojový překlad === #Statistick.2BAP0_strojov.2BAP0_p.2BAVk-eklad
     54
     55 * Ve skladbě „International music“ skupiny Kraftwek zní slova „mezinárodní hudba“ v různých jazycích. V češtině je to ale chybně: [http://www.youtube.com/watch?v=ruTCUI8_Iz4&t=4m26s International music na Youtube, od pozice 4:26]. Hádáme, že za touto chybou stojí statistický strojový překlad. Srovnejte s [http://translate.google.com/#en/cs/international%20music překladem stejné fráze podle Google translate].  V učicích datech pravděpodobně bylo mnohem častěji přídavné jméno,  například „Mezinárodní hudební festival“. Kraftwerk vystupují podobni  robotům (nebo dokonce místo sebe používají figuríny v podobě robotů) a  zkreslují svůj hlas vokodérem. Můžeme tedy říci, že tato chyba,  způsobena strojovým překladem, se ke skupině dobře hodí.
     56
     57
     58
     59=== Čeština je složitější, než jsme si mysleli === #A.2BAQw-e.2BAWE-tina_je_slo.2BAX4-it.2BARs-j.2BAWEA7Q.2C_ne.2BAX4_jsme_si_mysleli
     60To víte, že máme 10 pádů? Ve značkách c0, c8, c9. Viz hity v korpusu czTenTen12:
     61
     62 * [https://beta.sketchengine.co.uk/bonito/run.cgi/viewattrsx?q=atag%2C%22.*c0.*%22&corpname=preloaded%2Fcztenten12&refs=doc&fromp=1&setattrs=word&setattrs=tag&allpos=kw&setstructs=p&setstructs=g&setrefs=doc&refs_up=0&pagesize=20&newctxsize=40&gdex_enabled=0&gdexcnt=100&copy_icon=0&multiple_copy=0&use_noflash=0&select_lines=0&line_numbers=0&tbl_template=vanilla Nultým pádem voláme pípí]
     63
     64
     65 * [https://beta.sketchengine.co.uk/bonito/run.cgi/first?corpname=preloaded%2Fcztenten12&reload=&iquery=&queryselector=cqlrow&lemma=&phrase=&word=&char=&cql=%22.*c8.*%22&default_attr=tag&fc_lemword_window_type=both&fc_lemword_wsize=5&fc_lemword=&fc_lemword_type=all&sca_doc.t2ld=&sca_doc.tld=&sca_doc.urldomain=&sca_doc.url=&sca_doc.wordcount= Osmým pádem označujeme zejména apostrof]
     66
     67
     68 * [https://beta.sketchengine.co.uk/bonito/run.cgi/first?corpname=preloaded%2Fcztenten12&reload=&iquery=&queryselector=cqlrow&lemma=&phrase=&word=&char=&cql=%22.*c9.*%22&default_attr=tag&fc_lemword_window_type=both&fc_lemword_wsize=5&fc_lemword=&fc_lemword_type=all&sca_doc.t2ld=&sca_doc.tld=&sca_doc.urldomain=&sca_doc.url=&sca_doc.wordcount= Omega je natolik významná, že jí vyhrazujeme devátý pád]
     69
     70
     71
     72=== Speech Recognition === #Speech_Recognition
     73 * [http://www.independent.co.uk/news/weird-news/chinese-new-year-bbc-blunder-welcome-to-the-year-of-the-whores-9102117.html jak to umí v BBC]