Podrobné pokyny k volbě tématu programátorského úkolu do IB030
- součástí úkolu je i vlastní volba tématu, ne jen programování.
- volba tématu znamená:
- vyberte si jednu nebo více z doporučených knihoven níže
- podívejte se do dokumentace vybrané knihovny, udělejte si
představu jaké úkoly zpracování přirozeného jazyka knihovna řeší
(úkoly=např. klasifikace, detekce, extrakce, analýza, generování,
dialog, sumarizace, ...). Možných úkolů jsou desítky.
- vyberte si úkol, který Vás zaujme a jehož úprava pro češtinu (s
využitím dat a nástrojů Centra ZPJ FI MU) bude mít odpovídající
složitost (tj. ani triviální, ani příliš složitý). Je možné řešit
úkoly i pro slovenštinu, ale pro tento jazyk je k dispozici méně
nástrojů.
- připravte si, co budete k řešení tématu potřebovat - dostanete
přístup k linuxovému serveru laboratoře ZPJ FI MU, kde budete zvolený
úkol řešit. Na serveru můžete získat přístup ke zdrojům jako český
morfologický analyzátor, označkovaný český korpus, ...
- zvolené téma přidejte v rozpisu
témat - přednášející téma schváli nebo doplní. Dozvíte se, jestli
je téma odpovídající a na co se máte soustředit.
- k odevzdání je zapotřebí:
- naprogramovat odsouhlasený vybraný algoritmus na češtině
- doplnit dokumentaci programu s
- popisem algoritmu a implementace
- ukázkami z běhu
- návodem na instalaci/spuštění na serveru
aurora.fi.muni.cz
- vyhodnocením úspěšnosti algoritmu na netriviálních
českých datech
- vše uložit v komprimovaném archivu do odevzdávárny tématu do
termínu na webu předmětu.
- hodnocení bude od 0 do 20 bodů podle:
- složitosti vybraného algoritmus
- kvality zpracování algoritmu i dokumentace
Doporučené knihovny
Příklady úkolů pro inspiraci
U všech témat je důležité si rozmyslet na jaké konkrétní datové sadě
proběhne vyhodnocení úspěšnosti vlastního řešení.
- FAQbot - Chatbot slúžiaci ako podpora a FAQ ohľadne štúdia na MUNI a informačného systému MUNI
- Rozpoznání textově zapsaných čísel
- Český chatbot na téma počasí
- Analýza časových údajů v textu
- Implementace a vyhodnocení technik pro hledání českých víceslovných výrazů (multi-word expressions, MWE)
- Dialog s robotem o aktuálních výsledcích anglické Premier League
- Comparing techniques for Czech sentiment analysis
- Implementace české lematizace funkcí nltk.stem.wordnet
- Slovní hra s robotem Pepper
- Automatická úprava slovosledu české věty
- Dialog s robotem Pepper o aktuálním rozvrhu na FI
- Sémantický klasifikátor sentimentu v poezii
- Comparison of current named entity recognition engines for Czech
- Predicting movie review results from text
- Evaluating fastText with different tasks
- Lematizácia slovenských slov pomocou neurónových sietí a strojového učenia
- Generování básní na základě prvního verše nebo pomocník k tvorbě básní
- Chatbot, který zákazníka provede eshopem (části: nalezení produktu, porovnání produktů, shrnutí recenzí)
- Textová adventure hra s volnou konverzací ze strany uživatele
- Doplňování/rozšiřování vět a jejich částí v průběhu psaní podle předchozího textu
- Česká gramatika do Grammatical Framework pro "malé" překlady
- Klasifikace otázek podle typu a určování toho, na co se ptáme
- Rozpoznání jazyka textu v různých typech textu (konverzace, zpráva, blog, ...)
- Slovní úlohy (např. trojčlenka, fyzikální úlohy, ...)
- Tvorba/detekce parafrází
Zpět na stránku předmětu.