Changes between Version 9 and Version 10 of cs/ZpracovaniPrirozenehoJazyka


Ignore:
Timestamp:
Aug 14, 2017 12:19:38 PM (2 years ago)
Author:
x413827
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • cs/ZpracovaniPrirozenehoJazyka

    v9 v10  
    11= Zpracování přirozeného jazyka aneb NLP =
    22
    3 Anglická zkratka znamená '''natural language processing''', což vůbec nesouvisí s „neurolingvistickým programováním“.
     3Anglická zkratka znamená '''natural language processing''', což vůbec nesouvisí s „neurolingvistickým programováním“.
    44
    55Jde o ne úplně mladý obor na pomezí informatiky, matematiky a jazykovědy (lingvistiky), jehož cílem je vytvářet počítačové programy, které budou lidem „rozumět“. V následujícím textu vysvětlíme, co všechno je k tomu potřeba.
     
    77== Mluvící a myslící stroje ==
    88
    9 Myšlenka mluvících a myslících strojů je velmi stará, podobně jako myšlenka strojů, které by uměly překládat mezi různými jazyky. V souvislosti s moderní informatikou musíme zmínit jejího zakladatele ‒ britského matematika [http://cs.wikipedia.org/wiki/Alan_Turing Alana Turinga]. Turing ve svém článku z roku 1950 [http://www.loebner.net/Prizef/TuringArticle.html Computing machinery and intelligence] popsal test, který může sloužit (a dodnes slouží) k rozpoznání „inteligentních“ strojů. O strojích (nebo počítačových programech), které člověk v konverzaci nerozezná od jiného člověka, můžeme říci, že ''prošly'' [http://cs.wikipedia.org/wiki/Turingův_test Turingovým testem]. V závěru zmíněného článku Turing píše:
     9Myšlenka mluvících a myslících strojů je velmi stará, podobně jako myšlenka strojů, které by uměly překládat mezi různými jazyky. V souvislosti s moderní informatikou musíme zmínit jejího zakladatele ‒ britského matematika [http://cs.wikipedia.org/wiki/Alan_Turing Alana Turinga]. Turing ve svém článku z roku 1950, [http://www.loebner.net/Prizef/TuringArticle.html Computing machinery and intelligence], popsal test, který může sloužit (a dodnes slouží) k rozpoznání „inteligentních“ strojů. O strojích (nebo počítačových programech), které člověk v konverzaci nerozezná od jiného člověka, můžeme říci, že ''prošly'' [http://cs.wikipedia.org/wiki/Turingův_test Turingovým testem]. V závěru zmíněného článku Turing píše:
    1010
    1111   ''We may hope that machines will eventually compete with men in all purely intellectual fields. But which are the best ones to start with? Even this is a difficult decision. Many people think that a very abstract activity, like the playing of chess, would be best. It can also be maintained that it is best to provide the machine with the best sense organs that money can buy, and then teach it to understand and speak English. This process could follow the normal teaching of a child. Things would be pointed out and named, etc. Again I do not know what the right answer is, but I think both approaches should be tried.''
    1212
    13 Dnes, po více než 60 letech, víme mnohem více, avšak Turingovy otázky nás trápí stále: co musí umět inteligentní počítač, abychom mu mohli říkat „inteligentní“? Máme počítačové programy, které umí [http://cs.wikipedia.org/wiki/Deep_Blue hrát šachy], máme programy, které umí [http://cs.wikipedia.org/wiki/Samo%C5%99%C3%ADd%C3%ADc%C3%AD_auto řídit auto], existuje počítač, který [[cs/OtazkyWatson|vyhrál hru Riskuj]]. V každém z uvedených případů bychom se však zdráhali mluvit o počítači, který někomu nebo něčemu rozumí.
     13Dnes, po více než 60 letech, víme mnohem více, avšak Turingovy otázky nás trápí stále: co musí umět inteligentní počítač, abychom mu mohli říkat „inteligentní“? Máme počítačové programy, které umí [http://cs.wikipedia.org/wiki/Deep_Blue hrát šachy], máme programy, které umí [http://cs.wikipedia.org/wiki/Samo%C5%99%C3%ADd%C3%ADc%C3%AD_auto řídit auto], existuje počítač, který [[cs/OtazkyWatson|vyhrál hru Riskuj]]. V každém z uvedených případů bychom se však zdráhali mluvit o počítači, který někomu nebo něčemu rozumí.
    1414
    1515== Tak aspoň mluvící stroje ==
     
    1717Ukazuje se, že k mluvícím a myslícím strojům vede velmi dlouhá cesta, o které ani přesně nevíme, zda je schůdná. Vědecké úsilí o tuto oblast se rozdělilo na různé podúkoly. Jedním z nich je i '''zpracování přirozeného jazyka''', totiž snaha o vytváření takových počítačových programů, které budou pracovat, ''jako kdyby rozuměly našemu lidskému jazyku''.
    1818
    19 Ani tento podúkol není snadný. Texty v přirozeném jazyce se skládají z vět, které na sebe navazují. Věty se skládají ze slov, která mají různé tvary i různé funkce. Slova jsou ve větě poskládána určitým způsobem a pokud je přeskládáme, věta může úplně změnit význam. Lidé jsou kreativní, a tak si vymýšlejí nová slova a stará slova používají v nových významech. Věty v přirozeném jazyce vypadají někdy zcela nelogicky nebo dokonce nepravdivě, a přesto jim rozumíme. A konečně, věta pronesená určitou osobou v určitém čase a místě může znamenat něco docela jiného, než tatáž věta pronesená někým jiným někde jinde. Všechny tyto aspekty zkoumáme odděleně i dohromady na tzv. jazykových i mimojazykových rovinách.
     19Ani tento podúkol není snadný. Texty v přirozeném jazyce se skládají z vět, které na sebe navazují. Věty se skládají ze slov, která mají různé tvary i různé funkce. Slova jsou ve větě poskládána určitým způsobem, a pokud je přeskládáme, věta může úplně změnit význam. Lidé jsou kreativní, a tak si vymýšlejí nová slova a stará slova používají v nových významech. Věty v přirozeném jazyce vypadají někdy zcela nelogicky nebo dokonce nepravdivě, a přesto jim rozumíme. A konečně, věta pronesená určitou osobou v určitém čase a místě může znamenat něco docela jiného, než tatáž věta pronesená někým jiným někde jinde. Všechny tyto aspekty zkoumáme odděleně i dohromady na tzv. jazykových i mimojazykových rovinách.
    2020
    2121== Přehled rovin zkoumání přirozeného jazyka ==
     
    2929|| pragmatická rovina || význam promluvy v kontextu || Co se děje, když někdo řekne ''Můžete mi prosím podat sůl?'' ||
    3030
     31
    3132Pro zpracování jednotlivých jazykových i mimojazykových rovin potřebujeme naprosto různé nástroje. Například pro práci na lexikální rovině musíme mít seznam slov, která se v určitém jazyce používají, zatímco pro práci na sémantické rovině potřebujeme znalosti o světě. Na různých rovinách používáme různé algoritmy. Velmi často také na jedné rovině zpracování potřebujeme informace z rovin ostatních. Každá konkrétní aplikace je tedy výsledkem využití algorimů a datových zdrojů na několika rovinách zpracování přirozeného jazyka.
    3233
    33 Podívejte se, [[cs/MainTopics| na čem pracujeme v CZPJ]] a [[cs/LangToolsLinks| vyzkoušejte si některé naše nástroje]].
     34Podívejte se, [[cs/MainTopics| na čem pracujeme v CZPJ]], a [[cs/LangToolsLinks| vyzkoušejte si některé naše nástroje]].