Changes between Version 14 and Version 15 of cs/DenOtevrenychDveri


Ignore:
Timestamp:
Jul 22, 2014, 1:41:21 PM (10 years ago)
Author:
Zuzana Nevěřilová
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • cs/DenOtevrenychDveri

    v14 v15  
    33[[Image(/trac/research/raw-attachment/wiki/cs/DenOtevrenychDveri/demagog.png, align=right)]]
    44
    5 Určeno jak pro zájemce o studium, tak pro zájemce o cokoliv.
     5Den otevřených dveří [[http://www.fi.muni.cz|FI MU]] pořádá každoročně v lednu a únoru. My chápeme Den otevřených dveří jako příležitost pro zájemce o studium i pro zájemce o cokoliv.
    66
    77Pro zájemce o doktorské studium máme i [[cs/DODPhD|pokročilejší informace]].
     8
     9Při Dni otevřených dveří probíhá společná přednáška o FI MU a dále si zájemci mohou prohlédnout jednotlivá pracoviště na FI. Protože je celý program poněkud hektický, níže v bodech shrnujeme, co se mohou návštěvníci dozvědět v CZPJ.
    810
    911 * jeden z oborů, které je možné na FI studovat, je i [[cs/Specializace|Umělá inteligence a zpracování přirozeného jazyka]]
     
    1113 * přirozený jazyk = náš lidský jazyk (čeština, slovenština, angličtina)
    1214 * snažíme se o porozumění jazyku počítačem.
    13  * kámen mudrců NLP: komunikace s počítačem v přirozeném jazyce a strojový překlad.
     15 * cíl oboru: komunikace s počítačem v přirozeném jazyce, počítačové porozumění.
    1416 * s  jazykem pracujeme empiricky, jako s živým systémem, nepíšeme básně ani  prózu (ale můžeme je studovat), nerozebíráme literární díla
    15  * jazyk vidíme skrze korpusy (odkaz), což jsou obrovské (miliardové) soubory slov
     17 * jazyk vidíme skrze [[cs/JazykovyKorpus|korpusy]], což jsou obrovské (miliardové) soubory slov
    1618 * pracujeme tím pádem s velkými objemy dat, máme výkonné servery a píšeme efektivní programy (v různých programovacích jazycích)
    17  * studujeme  jazyk na několika úrovních (které se vyučují už na základní škole, ale  my je bereme trochu víc vážně): tvaroslovné (morfologické), syntaktické i  významové (sémantické)
    18  * jak  souvisí lingvistika s informatikou? aplikace jsou: jazykové korektory,  vyhledávače (proč umí Seznam najít i slova v jiném pádu?), výkladové a  překladové slovníky, dotazovací systémy (UIO), překlad
     19 * studujeme  jazyk na několika úrovních (které se vyučují už na základní škole, ale  my je bereme trochu víc vážně): tvaroslovné (morfologické), [[cs/VetnyRozbor|syntaktické]] i  významové (sémantické)
     20 * jak  souvisí lingvistika s informatikou? aplikace jsou: jazykové korektory,  vyhledávače (proč umí Seznam najít i slova v jiném pádu?), výkladové a  překladové slovníky, dotazovací systémy, strojový překlad
    1921 * spolupracujeme s FF (obor Český jazyk se specializací počítačová lingvistika)
    2022
    21 == Slovotvorná rovina zpracování přirozeného jazyka == #words
     23== Letem světem počítačovou lingvistikou ==
     24=== Slovotvorná rovina zpracování přirozeného jazyka === #words
    2225
    2326 * slova se skládají z kmenů, předpon, přípon, koncovek
    2427 * slova jsou ohebná (pád-číslo-rod, osoba-číslo-čas) a neohebná
    25  * máme program, který pro každé slovo dokáže určit, co je zač ([http://nlp.fi.muni.cz/projekty/wwwajka/ wwwajka]) - Seznam.cz jej používá na lemmatizaci, čili lze hledat slova zapsaná v libovolném korektním tvaru.
     28 * máme program, který pro každé slovo dokáže určit, co je zač ([http://nlp.fi.muni.cz/projekty/wwwajka/ wwwajka]) - Seznam.cz jej používá na lematizaci, čili lze hledat slova zapsaná v libovolném korektním tvaru.
     29 * máme i [http://nlp.fi.muni.cz/cz_accent/index.php oháčkovávač] - tím pádem lze hledat i slova bez diakritiky.
     30 * slovník slovních tvarů se může použít taky na opravu překlepů (spell-checker)
     31 * když nevíme, jak se něco píše, můžeme se podívat do [http://prirucka.ujc.cas.cz/ Internetové jazykové příručky] - výsledek naší spolupráce s ÚJČ
    2632
    27  * máme díky tomu i [http://nlp.fi.muni.cz/cz_accent/index.php oháčkovávač], který využívá také Seznam.cz - tím pádem lze hledat i slova bez diakritiky.
    28 
    29  * může se použít taky na opravu překlepů (spell-checker)
    30  * když nevíme, jak se něco píše, můžeme se podívat do [http://prirucka.ujc.cas.cz/ Internetové jazykové příručky] - spolupráce s ÚJČ
    31 
    32 == Syntaktická rovina zpracování přirozeného jazyka == #syntan
     33=== Syntaktická rovina zpracování přirozeného jazyka === #syntan
    3334
    3435[[Image(/trac/research/raw-attachment/wiki/cs/DenOtevrenychDveri/opinion.png, align=right)]]
     
    3839 * pamatujeme si ze základní školy nechvalně proslulé větné rozbory, a máme program, který je umí dělat za nás ([http://nlp.fi.muni.cz/projekty/wwwsynt/ wwwsynt])
    3940
    40 == Sémantická a lexikální rovina == #seman
     41=== Sémantická a lexikální rovina === #seman
    4142 * máme k dispozici překladové slovníky (LEDA)
    4243 * máme  i speciální slovníky: Slovník spisovného jazyka českého, Slovník  spisovné češtiny, Příruční slovník jazyka českého, Slovník cizích slov,  Slovník českých synonym, Slovník české frazeologie a idiomatiky: výrazy  slovesné i neslovesné. (DEB, DEBDict)
    4344 * máme taky sítě slov (hierarchický slovník, sémantická/významová databáze): !WordNet (viz Visual Browser) - podobnost s biologickou taxonomií
    44 
    4545 * zjistíme, že luxovat může člověk za pomocí stroje ([http://nlp.fi.muni.cz/verbalex/html2/generated/alphabet/ VerbaLex])
    46 
    47 [http://nlp.fi.muni.cz/%7Expopelk/screencast.avi http://nlp.fi.muni.cz/~xpopelk/screencast.avi]
    48 
    49 [http://nlp.fi.muni.cz/%7Expopelk/final.avi http://nlp.fi.muni.cz/~xpopelk/final.avi]
    50 
    51 [http://nlp.fi.muni.cz/%7Expopelk/dod.avi http://nlp.fi.muni.cz/~xpopelk/dod.avi]
    52 
    53 Schéma krátké verse výkladu:
    54 
    55  * [https://nlp.fi.muni.cz/trac/research/attachment/wiki/cs/DenOtevrenychDveri/dod_2012.pdf verse 2012]
    56 
    57  * [https://nlp.fi.muni.cz/trac/research/attachment/wiki/cs/DenOtevrenychDveri/dod_jan2013.pdf verse 2013]
    5846
    5947== Příklady z korpusu == #examples