Changes between Version 10 and Version 11 of cs/ZpracovaniPrirozenehoJazyka


Ignore:
Timestamp:
Aug 14, 2017, 12:26:04 PM (7 years ago)
Author:
x413827
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • cs/ZpracovaniPrirozenehoJazyka

    v10 v11  
    11= Zpracování přirozeného jazyka aneb NLP =
    2 
    32Anglická zkratka znamená '''natural language processing''', což vůbec nesouvisí s „neurolingvistickým programováním“.
    43
     
    65
    76== Mluvící a myslící stroje ==
     7Myšlenka mluvících a myslících strojů je velmi stará, podobně jako myšlenka strojů, které by uměly překládat mezi různými jazyky. V souvislosti s moderní informatikou musíme zmínit jejího zakladatele ‒ britského matematika [http://cs.wikipedia.org/wiki/Alan_Turing Alana Turinga]. Turing ve svém článku z roku 1950, [http://www.loebner.net/Prizef/TuringArticle.html Computing machinery and intelligence], popsal test, který může sloužit (a dodnes slouží) k rozpoznání „inteligentních“ strojů. O strojích (nebo počítačových programech), které člověk v konverzaci nerozezná od jiného člověka, můžeme říci, že ''prošly'' [http://cs.wikipedia.org/wiki/Turingův_test Turingovým testem]. V závěru zmíněného článku Turing píše:
    88
    9 Myšlenka mluvících a myslících strojů je velmi stará, podobně jako myšlenka strojů, které by uměly překládat mezi různými jazyky. V souvislosti s moderní informatikou musíme zmínit jejího zakladatele ‒ britského matematika [http://cs.wikipedia.org/wiki/Alan_Turing Alana Turinga]. Turing ve svém článku z roku 1950, [http://www.loebner.net/Prizef/TuringArticle.html Computing machinery and intelligence], popsal test, který může sloužit (a dodnes slouží) k rozpoznání „inteligentních“ strojů. O strojích (nebo počítačových programech), které člověk v konverzaci nerozezná od jiného člověka, můžeme říci, že ''prošly'' [http://cs.wikipedia.org/wiki/Turingův_test Turingovým testem]. V závěru zmíněného článku Turing píše:
     9  '' We may hope that machines will eventually compete with men in all purely intellectual fields. But which are the best ones to start with? Even this is a difficult decision. Many people think that a very abstract activity, like the playing of chess, would be best. It can also be maintained that it is best to provide the machine with the best sense organs that money can buy, and then teach it to understand and speak English. This process could follow the normal teaching of a child. Things would be pointed out and named, etc. Again I do not know what the right answer is, but I think both approaches should be tried.''
    1010
    11    ''We may hope that machines will eventually compete with men in all purely intellectual fields. But which are the best ones to start with? Even this is a difficult decision. Many people think that a very abstract activity, like the playing of chess, would be best. It can also be maintained that it is best to provide the machine with the best sense organs that money can buy, and then teach it to understand and speak English. This process could follow the normal teaching of a child. Things would be pointed out and named, etc. Again I do not know what the right answer is, but I think both approaches should be tried.''
    12 
    13 Dnes, po více než 60 letech, víme mnohem více, avšak Turingovy otázky nás trápí stále: co musí umět inteligentní počítač, abychom mu mohli říkat „inteligentní“? Máme počítačové programy, které umí [http://cs.wikipedia.org/wiki/Deep_Blue hrát šachy], máme programy, které umí [http://cs.wikipedia.org/wiki/Samo%C5%99%C3%ADd%C3%ADc%C3%AD_auto řídit auto], existuje počítač, který [[cs/OtazkyWatson|vyhrál hru Riskuj]]. V každém z uvedených případů bychom se však zdráhali mluvit o počítači, který někomu nebo něčemu rozumí.
     11Dnes, po více než 60 letech, víme mnohem více, avšak Turingovy otázky nás trápí stále: co musí umět inteligentní počítač, abychom mu mohli říkat „inteligentní“? Máme počítačové programy, které umí [http://cs.wikipedia.org/wiki/Deep_Blue hrát šachy], máme programy, které umí [http://cs.wikipedia.org/wiki/Samo%C5%99%C3%ADd%C3%ADc%C3%AD_auto řídit auto], existuje počítač, který [[cs/OtazkyWatson|vyhrál hru Riskuj]]. V každém z uvedených případů bychom se však zdráhali mluvit o počítači, který někomu nebo něčemu rozumí.
    1412
    1513== Tak aspoň mluvící stroje ==
    16 
    17 Ukazuje se, že k mluvícím a myslícím strojům vede velmi dlouhá cesta, o které ani přesně nevíme, zda je schůdná. Vědecké úsilí o tuto oblast se rozdělilo na různé podúkoly. Jedním z nich je i '''zpracování přirozeného jazyka''', totiž snaha o vytváření takových počítačových programů, které budou pracovat, ''jako kdyby rozuměly našemu lidskému jazyku''.
     14Ukazuje se, že k mluvícím a myslícím strojům vede velmi dlouhá cesta, o které ani přesně nevíme, zda je schůdná. Vědecké úsilí o tuto oblast se rozdělilo na různé podúkoly. Jedním z nich je i '''zpracování přirozeného jazyka''', totiž snaha o vytváření takových počítačových programů, které budou pracovat, ''jako kdyby rozuměly našemu lidskému jazyku''.
    1815
    1916Ani tento podúkol není snadný. Texty v přirozeném jazyce se skládají z vět, které na sebe navazují. Věty se skládají ze slov, která mají různé tvary i různé funkce. Slova jsou ve větě poskládána určitým způsobem, a pokud je přeskládáme, věta může úplně změnit význam. Lidé jsou kreativní, a tak si vymýšlejí nová slova a stará slova používají v nových významech. Věty v přirozeném jazyce vypadají někdy zcela nelogicky nebo dokonce nepravdivě, a přesto jim rozumíme. A konečně, věta pronesená určitou osobou v určitém čase a místě může znamenat něco docela jiného, než tatáž věta pronesená někým jiným někde jinde. Všechny tyto aspekty zkoumáme odděleně i dohromady na tzv. jazykových i mimojazykových rovinách.
    2017
    2118== Přehled rovin zkoumání přirozeného jazyka ==
    22 
    2319|| || popis || příklad ||
    2420|| lexikální rovina || slovní zásoba a její proměny || Co je to ''step''? Druh krajiny? Tanec? Anglicky ''krok''? ||
     
    2925|| pragmatická rovina || význam promluvy v kontextu || Co se děje, když někdo řekne ''Můžete mi prosím podat sůl?'' ||
    3026
    31 
    32 Pro zpracování jednotlivých jazykových i mimojazykových rovin potřebujeme naprosto různé nástroje. Například pro práci na lexikální rovině musíme mít seznam slov, která se v určitém jazyce používají, zatímco pro práci na sémantické rovině potřebujeme znalosti o světě. Na různých rovinách používáme různé algoritmy. Velmi často také na jedné rovině zpracování potřebujeme informace z rovin ostatních. Každá konkrétní aplikace je tedy výsledkem využití algorimů a datových zdrojů na několika rovinách zpracování přirozeného jazyka.
     27Pro zpracování jednotlivých jazykových i mimojazykových rovin potřebujeme naprosto různé nástroje. Například pro práci na lexikální rovině musíme mít seznam slov, která se v určitém jazyce používají, zatímco pro práci na sémantické rovině potřebujeme znalosti o světě. Na různých rovinách používáme různé algoritmy. Velmi často také na jedné rovině zpracování potřebujeme informace z rovin ostatních. Každá konkrétní aplikace je tedy výsledkem využití algorimů a datových zdrojů na několika rovinách zpracování přirozeného jazyka.
    3328
    3429Podívejte se, [[cs/MainTopics| na čem pracujeme v CZPJ]], a [[cs/LangToolsLinks| vyzkoušejte si některé naše nástroje]].