IB030 Úvod do počítačové lingvistiky - podzim 2005
- Slajdy
- postupně doplňovány během semestru.
- 1.přednáška (20.9.)
Úvod do počítačové lingvistiky, situace na FI MU -
Postscript,
Postscript - 2 na 1,
Postscript - 4 na 1,
PDF.
- 2.přednáška (5.10.)
Roviny analýzy jazyka. Fonetika -
Postscript,
Postscript - 2 na 1,
Postscript - 4 na 1,
PDF.
- 3.přednáška (19.10.)
Syntéza a analýza řeči (Pavel Cenek) -
PDF,
příklady.
- 4.přednáška (12.10.)
Morfologie, morfologická analýza -
Postscript,
Postscript - 2 na 1,
Postscript - 4 na 1,
PDF.
- 5.přednáška (26.10.)
Syntaxe - gramatiky a syntaktické struktury -
Postscript,
Postscript - 2 na 1,
Postscript - 4 na 1,
PDF.
- 6.přednáška (2.11.)
Gramatické formalismy pro ZPJ -
Postscript,
Postscript - 2 na 1,
Postscript - 4 na 1,
PDF.
- 7.přednáška (9.11.)
Gramatické formalismy pro ZPJ II -
Postscript,
Postscript - 2 na 1,
Postscript - 4 na 1,
PDF.
- 8.přednáška (16.11.)
Algoritmy syntaktické analýzy PJ (Vladimír Kadlec) -
PDF.
- 9.přednáška (23.11.)
Textové korpusy, korpusové manažery (Pavel Rychlý) -
PDF,
příklady.
- 10.přednáška (30.11.)
Sémantika a základní sémantické reprezentace -
Postscript,
Postscript - 2 na 1,
Postscript - 4 na 1,
PDF.
podrobné zadání samostatného úkolu
- 11.přednáška (7.12.)
Intenzionální sémantika, reprezentace znalostí -
Postscript,
Postscript - 2 na 1,
Postscript - 4 na 1,
PDF.
- 12.přednáška (14.12.)
samostudium na vypracování úkolu -
přednáška 14.12. není (služ.cesta)
- písemná zkouška - předtermín (21.12.)
- Odkazy
-
- Rozvrh
- St 12:00-14:00 B204
- Osnova
- Východiska počítačového zpracování přirozeného jazyka.
- Přirozený jazyk jako hlavní nástroj lidské komunikace. Jazyková data v korpusech.
- Roviny: fonetika, fonologie, morfologie, syntax, sémantika, pragmatika. Klasické a formální gramatiky: reprezentace morfologických a syntaktických struktur, reprezentace významu, gramatiky: nekontextové, kontextové, logické -- DCG, transformační, Analýza a syntéza: morfologická, syntaktická, sémantická, Analyzátory: morfologický -- AJKA, syntaktický -- KLARA, Strategie analýzy: shora, zdola, smíšené, heuristiky. Problém víceznačnosti a prohledávání.
- Počítačové slovníky: reprezentace znalostí o lexikálních jednotkách. Typy elektronických slovníků: výkladové, thesaury, frazeologické, slovníky kmenů, překladové -- vícejazyčné, jejich formalizace.
- Reprezentace významu věty: logická vs. lexikální sémantika, Princip kompozicionality: skládání významů. Sémantické klasifikace: valenční rámce, predikáty, ontologie, transparentní intenzionální logika a její aplikace na analýzu významů vět přirozeného jazyka.
- Pragmatika: sémantická a pragmatická povaha jmenných skupin, struktura promluvy, deiktické výrazy, kontexty. Porozumění jazyku: význam, inference a reprezentace znalostí.
- Literatura
- Pala, Karel: Počítačové zpracování
přirozeného jazyka. neoficiální vyd. Brno : FI MU,
2000. 128 s.
- Allen, James: Natural language understanding. 2nd ed.
Redwood City : Benjamin/Cummings Publishing Company, 1995. xv, 654 s.
- The Oxford handbook of computational linguistics. Edited by
Ruslan Mitkov. Oxford : Oxford University Press, 2003. xx, 784 s.
ISBN 0-19-823882-7.
- Chomsky, Noam: Syntaktické struktury., Logický základ teorie
jazyka., O pojmu gramatické pravidlo. 1. vyd. Praha : Academia,
1966. 209 s. Obsahuje bibliografii.
- Materna, Pavel - Štěpán, Jan: Filozofická logika: nová
cesta? Olomouc : Olomouc (Univerzita Palackého), 2000. 127 s.
ISBN 80-244-0109-6.
- slajdy na této stránce.
- Hodnocení
- závěrečné hodnocení se děje na základě písemné zkoušky a průběžného
samostatného úkolu
- závěrečná písemka (max 80 bodů) --
příklad závěrečné písemky
- průběžný úkol (max 20 bodů) -- podrobné zadání viz 10.přednáška
- hodnocení -- součet bodů za písemku i úkol (max 100 bodů)
- rozdíly zk, k, z - různé limity