6 | | |
7 | | * přirozený jazyk = náš lidský jazyk (čeština, slovenština, angličtina) |
8 | | * snažíme se o porozumění jazyku počítačem. |
9 | | * kámen mudrců NLP: komunikace s počítačem v přirozeném jazyce a strojový překlad. |
10 | | * s jazykem pracujeme empiricky, jako s živým systémem, nepíšeme básně ani prózu (ale můžeme je studovat), nerozebíráme literární díla |
11 | | * jazyk vidíme skrze korpusy (odkaz), což jsou obrovské (miliardové) soubory slov |
12 | | * pracujeme tím pádem s velkými objemy dat, máme výkonné servery a píšeme efektivní programy (v různých programovacích jazycích) |
13 | | * studujeme jazyk na několika úrovních (které se vyučují už na základní škole, ale my je bereme trochu víc vážně): tvaroslovné (morfologické), syntaktické i významové (sémantické) |
14 | | * jak souvisí lingvistika s informatikou? aplikace jsou: jazykové korektory, vyhledávače (proč umí Seznam najít i slova v jiném pádu?), výkladové a překladové slovníky, dotazovací systémy (UIO), překlad |
15 | | * spolupracujeme s FF (obor Český jazyk se specializací počítačová lingvistika) |
| 6 | * přirozený jazyk = náš lidský jazyk (čeština, slovenština, angličtina) |
| 7 | * snažíme se o porozumění jazyku počítačem. |
| 8 | * kámen mudrců NLP: komunikace s počítačem v přirozeném jazyce a strojový překlad. |
| 9 | * s jazykem pracujeme empiricky, jako s živým systémem, nepíšeme básně ani prózu (ale můžeme je studovat), nerozebíráme literární díla |
| 10 | * jazyk vidíme skrze korpusy (odkaz), což jsou obrovské (miliardové) soubory slov |
| 11 | * pracujeme tím pádem s velkými objemy dat, máme výkonné servery a píšeme efektivní programy (v různých programovacích jazycích) |
| 12 | * studujeme jazyk na několika úrovních (které se vyučují už na základní škole, ale my je bereme trochu víc vážně): tvaroslovné (morfologické), syntaktické i významové (sémantické) |
| 13 | * jak souvisí lingvistika s informatikou? aplikace jsou: jazykové korektory, vyhledávače (proč umí Seznam najít i slova v jiném pádu?), výkladové a překladové slovníky, dotazovací systémy (UIO), překlad |
| 14 | * spolupracujeme s FF (obor Český jazyk se specializací počítačová lingvistika) |
19 | | * slova se skládají z kmenů, předpon, přípon, koncovek |
20 | | * slova jsou ohebná (pád-číslo-rod, osoba-číslo-čas) a neohebná |
21 | | * máme program, který pro každé slovo dokáže určit, co je zač ([http://nlp.fi.muni.cz/projekty/wwwajka/ wwwajka]) - Seznam.cz jej používá na lemmatizaci, čili lze hledat slova zapsaná v libovolném korektním tvaru. |
| 21 | * máme díky tomu i [http://nlp.fi.muni.cz/cz_accent/index.php oháčkovávač], který využívá také Seznam.cz - tím pádem lze hledat i slova bez diakritiky. |
23 | | |
24 | | * máme díky tomu i [http://nlp.fi.muni.cz/cz_accent/index.php oháčkovávač], který využívá také Seznam.cz - tím pádem lze hledat i slova bez diakritiky. |
25 | | |
26 | | |
27 | | * může se použít taky na opravu překlepů (spell-checker) |
28 | | * když nevíme, jak se něco píše, můžeme se podívat do [http://prirucka.ujc.cas.cz/ Internetové jazykové příručky] - spolupráce s ÚJČ |
29 | | |
30 | | |
| 23 | * může se použít taky na opravu překlepů (spell-checker) |
| 24 | * když nevíme, jak se něco píše, můžeme se podívat do [http://prirucka.ujc.cas.cz/ Internetové jazykové příručky] - spolupráce s ÚJČ |
33 | | |
34 | | * věty jsou tvořeny ze slov, ale ne ledajak, podle pravidel |
35 | | * tato pravidla tvoří tzv. syntax určitého jazyka |
36 | | * pamatujeme si ze základní školy nechvalně proslulé větné rozbory, a máme program, který je umí dělat za nás ([http://nlp.fi.muni.cz/projekty/wwwsynt/ wwwsynt]) |
37 | | |
38 | | |
| 27 | * věty jsou tvořeny ze slov, ale ne ledajak, podle pravidel |
| 28 | * tato pravidla tvoří tzv. syntax určitého jazyka |
| 29 | * pamatujeme si ze základní školy nechvalně proslulé větné rozbory, a máme program, který je umí dělat za nás ([http://nlp.fi.muni.cz/projekty/wwwsynt/ wwwsynt]) |
42 | | * máme k dispozici překladové slovníky (LEDA) |
43 | | * máme i speciální slovníky: Slovník spisovného jazyka českého, Slovník spisovné češtiny, Příruční slovník jazyka českého, Slovník cizích slov, Slovník českých synonym, Slovník české frazeologie a idiomatiky: výrazy slovesné i neslovesné. (DEB, DEBDict) |
44 | | * máme taky sítě slov (hierarchický slovník, sémantická/významová databáze): [https://nlp.fi.muni.cz/cs/WordNet WordNet] (viz Visual Browser) - podobnost s biologickou taxonomií |
| 36 | * zjistíme, že luxovat může člověk za pomocí stroje ([http://nlp.fi.muni.cz/verbalex/html2/generated/alphabet/ VerbaLex]) |
67 | | |
68 | | * Peking, hlavní město USA, přivítalo císaře Evropské unie. |
69 | | * "Pravda a láska" jsou ošklivá a falešná slovíčka. |
70 | | * Petr viděl, že se Marie koupe s Pavlem, a hrozně si přál, aby se v tomto okamžiku proměnil v Pavla. |
71 | | * Pane vrchní, jednou pivo s rumem, jednou bez. |
| 51 | * Peking, hlavní město USA, přivítalo císaře Evropské unie. |
| 52 | * "Pravda a láska" jsou ošklivá a falešná slovíčka. |
| 53 | * Petr viděl, že se Marie koupe s Pavlem, a hrozně si přál, aby se v tomto okamžiku proměnil v Pavla. |
| 54 | * Pane vrchní, jednou pivo s rumem, jednou bez. |