Changes between Version 14 and Version 15 of cs/DenOtevrenychDveri
- Timestamp:
- Jul 22, 2014, 1:41:21 PM (9 years ago)
Legend:
- Unmodified
- Added
- Removed
- Modified
-
cs/DenOtevrenychDveri
v14 v15 3 3 [[Image(/trac/research/raw-attachment/wiki/cs/DenOtevrenychDveri/demagog.png, align=right)]] 4 4 5 Určeno jak pro zájemce o studium, takpro zájemce o cokoliv.5 Den otevřených dveří [[http://www.fi.muni.cz|FI MU]] pořádá každoročně v lednu a únoru. My chápeme Den otevřených dveří jako příležitost pro zájemce o studium i pro zájemce o cokoliv. 6 6 7 7 Pro zájemce o doktorské studium máme i [[cs/DODPhD|pokročilejší informace]]. 8 9 Při Dni otevřených dveří probíhá společná přednáška o FI MU a dále si zájemci mohou prohlédnout jednotlivá pracoviště na FI. Protože je celý program poněkud hektický, níže v bodech shrnujeme, co se mohou návštěvníci dozvědět v CZPJ. 8 10 9 11 * jeden z oborů, které je možné na FI studovat, je i [[cs/Specializace|Umělá inteligence a zpracování přirozeného jazyka]] … … 11 13 * přirozený jazyk = náš lidský jazyk (čeština, slovenština, angličtina) 12 14 * snažíme se o porozumění jazyku počítačem. 13 * kámen mudrců NLP: komunikace s počítačem v přirozeném jazyce a strojový překlad.15 * cíl oboru: komunikace s počítačem v přirozeném jazyce, počítačové porozumění. 14 16 * s jazykem pracujeme empiricky, jako s živým systémem, nepíšeme básně ani prózu (ale můžeme je studovat), nerozebíráme literární díla 15 * jazyk vidíme skrze korpusy (odkaz), což jsou obrovské (miliardové) soubory slov17 * jazyk vidíme skrze [[cs/JazykovyKorpus|korpusy]], což jsou obrovské (miliardové) soubory slov 16 18 * pracujeme tím pádem s velkými objemy dat, máme výkonné servery a píšeme efektivní programy (v různých programovacích jazycích) 17 * studujeme jazyk na několika úrovních (které se vyučují už na základní škole, ale my je bereme trochu víc vážně): tvaroslovné (morfologické), syntaktickéi významové (sémantické)18 * jak souvisí lingvistika s informatikou? aplikace jsou: jazykové korektory, vyhledávače (proč umí Seznam najít i slova v jiném pádu?), výkladové a překladové slovníky, dotazovací systémy (UIO),překlad19 * studujeme jazyk na několika úrovních (které se vyučují už na základní škole, ale my je bereme trochu víc vážně): tvaroslovné (morfologické), [[cs/VetnyRozbor|syntaktické]] i významové (sémantické) 20 * jak souvisí lingvistika s informatikou? aplikace jsou: jazykové korektory, vyhledávače (proč umí Seznam najít i slova v jiném pádu?), výkladové a překladové slovníky, dotazovací systémy, strojový překlad 19 21 * spolupracujeme s FF (obor Český jazyk se specializací počítačová lingvistika) 20 22 21 == Slovotvorná rovina zpracování přirozeného jazyka == #words 23 == Letem světem počítačovou lingvistikou == 24 === Slovotvorná rovina zpracování přirozeného jazyka === #words 22 25 23 26 * slova se skládají z kmenů, předpon, přípon, koncovek 24 27 * slova jsou ohebná (pád-číslo-rod, osoba-číslo-čas) a neohebná 25 * máme program, který pro každé slovo dokáže určit, co je zač ([http://nlp.fi.muni.cz/projekty/wwwajka/ wwwajka]) - Seznam.cz jej používá na lemmatizaci, čili lze hledat slova zapsaná v libovolném korektním tvaru. 28 * máme program, který pro každé slovo dokáže určit, co je zač ([http://nlp.fi.muni.cz/projekty/wwwajka/ wwwajka]) - Seznam.cz jej používá na lematizaci, čili lze hledat slova zapsaná v libovolném korektním tvaru. 29 * máme i [http://nlp.fi.muni.cz/cz_accent/index.php oháčkovávač] - tím pádem lze hledat i slova bez diakritiky. 30 * slovník slovních tvarů se může použít taky na opravu překlepů (spell-checker) 31 * když nevíme, jak se něco píše, můžeme se podívat do [http://prirucka.ujc.cas.cz/ Internetové jazykové příručky] - výsledek naší spolupráce s ÚJČ 26 32 27 * máme díky tomu i [http://nlp.fi.muni.cz/cz_accent/index.php oháčkovávač], který využívá také Seznam.cz - tím pádem lze hledat i slova bez diakritiky. 28 29 * může se použít taky na opravu překlepů (spell-checker) 30 * když nevíme, jak se něco píše, můžeme se podívat do [http://prirucka.ujc.cas.cz/ Internetové jazykové příručky] - spolupráce s ÚJČ 31 32 == Syntaktická rovina zpracování přirozeného jazyka == #syntan 33 === Syntaktická rovina zpracování přirozeného jazyka === #syntan 33 34 34 35 [[Image(/trac/research/raw-attachment/wiki/cs/DenOtevrenychDveri/opinion.png, align=right)]] … … 38 39 * pamatujeme si ze základní školy nechvalně proslulé větné rozbory, a máme program, který je umí dělat za nás ([http://nlp.fi.muni.cz/projekty/wwwsynt/ wwwsynt]) 39 40 40 == Sémantická a lexikální rovina== #seman41 === Sémantická a lexikální rovina === #seman 41 42 * máme k dispozici překladové slovníky (LEDA) 42 43 * máme i speciální slovníky: Slovník spisovného jazyka českého, Slovník spisovné češtiny, Příruční slovník jazyka českého, Slovník cizích slov, Slovník českých synonym, Slovník české frazeologie a idiomatiky: výrazy slovesné i neslovesné. (DEB, DEBDict) 43 44 * máme taky sítě slov (hierarchický slovník, sémantická/významová databáze): !WordNet (viz Visual Browser) - podobnost s biologickou taxonomií 44 45 45 * zjistíme, že luxovat může člověk za pomocí stroje ([http://nlp.fi.muni.cz/verbalex/html2/generated/alphabet/ VerbaLex]) 46 47 [http://nlp.fi.muni.cz/%7Expopelk/screencast.avi http://nlp.fi.muni.cz/~xpopelk/screencast.avi]48 49 [http://nlp.fi.muni.cz/%7Expopelk/final.avi http://nlp.fi.muni.cz/~xpopelk/final.avi]50 51 [http://nlp.fi.muni.cz/%7Expopelk/dod.avi http://nlp.fi.muni.cz/~xpopelk/dod.avi]52 53 Schéma krátké verse výkladu:54 55 * [https://nlp.fi.muni.cz/trac/research/attachment/wiki/cs/DenOtevrenychDveri/dod_2012.pdf verse 2012]56 57 * [https://nlp.fi.muni.cz/trac/research/attachment/wiki/cs/DenOtevrenychDveri/dod_jan2013.pdf verse 2013]58 46 59 47 == Příklady z korpusu == #examples