Podrobné pokyny k volbě tématu programátorského úkolu do IB030
- součástí úkolu je i vlastní volba tématu, ne jen programování.
- volba tématu znamená:
- vyberte si jednu nebo více z doporučených knihoven ve slajdech
první přednášky
- podívejte se do dokumentace vybrané knihovny, udělejte si
představu jaké úkoly zpracování přirozeného jazyka knihovna řeší
(úkoly=např. klasifikace, detekce, extrakce, analýza, generování,
dialog, sumarizace, ...). Možných úkolů jsou desítky.
- vyberte si úkol, který Vás zaujme a jehož úprava pro češtinu (s
využitím dat a nástrojů Centra ZPJ FI MU) bude mít odpovídající
složitost (tj. ani triviální, ani příliš složitý). Je možné řešit
úkoly i pro slovenštinu, ale pro tento jazyk je k dispozici méně
nástrojů.
- připravte si, co budete k řešení tématu potřebovat - dostanete
přístup k linuxovému serveru laboratoře ZPJ FI MU, kde budete zvolený
úkol řešit. Na serveru můžete získat přístup ke zdrojům jako český
morfologický analyzátor, označkovaný český korpus, ...
- zvolené téma pošlete e-mailem přednášejícímu - dozvíte se, jestli
je téma odpovídající a na co se máte soustředit.
- další informace k odevzdání výsledku jsou uvedeny opět na slajdech
první přednášky.
Příklady úkolů pro inspiraci
U všech témat je důležité si rozmyslet na jaké konkrétní datové sadě
proběhne vyhodnocení úspěšnosti vlastního řešení.
- Rozpoznání textově zapsaných čísel
- Český chatbot na téma počasí
- Analýza časových údajů v textu
- Implementace a vyhodnocení technik pro hledání českých víceslovných výrazů (multi-word expressions, MWE)
- Dialog s robotem o aktuálních výsledcích anglické Premier League
- Comparing techniques for Czech sentiment analysis
- Implementace české lematizace funkcí nltk.stem.wordnet
- Slovní hra s robotem Pepper
- Automatická úprava slovosledu české věty
- Dialog s robotem Pepper o aktuálním rozvrhu na FI
- Sémantický klasifikátor sentimentu v poezii
- Comparison of current named entity recognition engines for Czech
- Predicting movie review results from text
- Evaluating fastText with different tasks
- Lematizácia slovenských slov pomocou neurónových sietí a strojového učenia
- Generování básní na základě prvního verše nebo pomocník k tvorbě básní
- Chatbot, který zákazníka provede eshopem (části: nalezení produktu, porovnání produktů, shrnutí recenzí)
- Textová adventure hra s volnou konverzací ze strany uživatele
- Doplňování/rozšiřování vět a jejich částí v průběhu psaní podle předchozího textu
- Česká gramatika do Grammatical Framework pro "malé" překlady
- Klasifikace otázek podle typu a určování toho, na co se ptáme
- Rozpoznání jazyka textu v různých typech textu (konverzace, zpráva, blog, ...)
- Slovní úlohy (např. trojčlenka, fyzikální úlohy, ...)
- Tvorba/detekce parafrází