Changes between Version 3 and Version 4 of cs/TopicRecognition
- Timestamp:
- Mar 10, 2014, 3:51:30 PM (10 years ago)
Legend:
- Unmodified
- Added
- Removed
- Modified
-
cs/TopicRecognition
v3 v4 6 6 7 7 == Zadání lingvistického úkolu do IB030 Úvod do počítačové lingvistiky == 8 Cílem je vytvořit část výše zmíněné databáze. Každý student přečte a vyhodnotí 70 krátkých textů (perexy z novinových zpráv) a vyznačí v nich témata - očekáváme, že jich bude v každém textu okolo pěti. Počítáme průměrně5 minut na přečtení článku a výběr témat (ze začátku to zřejmě bude více, pak to půjde rychleji, jak si osvojíte pokyny). Následují pokyny k vypracování otázek.8 Cílem je vytvořit část výše zmíněné databáze. Každý student přečte a vyhodnotí 120 krátkých textů (perexy z novinových zpráv) a vyznačí v nich témata - očekáváme, že jich bude v každém textu okolo pěti. Počítáme průměrně 3-5 minut na přečtení článku a výběr témat (ze začátku to zřejmě bude více, pak to půjde rychleji, jak si osvojíte pokyny). Následují pokyny k vypracování otázek. 9 9 10 10 * každý anotátor dostane náhodný vzorek z perexů z nedávných novinových článků … … 89 89 90 90 == Vyhodnocení úkolu == 91 Za splnění úkolu můžete získat 0-20 bodů. Z vámi zpracovávaných textů bude náhodně vybráno několik, u nichž zkontrolujeme, zda vybraná témata splňují kritéria popsaná výše. Za každé vybrané téma splňující kritéria dostanete 1 bod, celkové body budou přepočítány do max. 20 podle počtu kontrolovaných textů. Porušení globálních instrukcí (např. špatný formát souboru, zvolení tématu, které není souvislým podřetězcem textu) bude sankcionováno deseti zápornými body.91 Za splnění úkolu můžete získat 0-20 bodů. Z vámi zpracovávaných textů bude náhodně vybráno několik, u nichž zkontrolujeme, zda vybraná témata splňují kritéria popsaná výše. Za každé vybrané téma splňující kritéria dostanete 1 bod, celkové body budou přepočítány do max. 20 podle počtu kontrolovaných textů. Porušení globálních instrukcí (např. špatný formát souboru, zvolení tématu, které není souvislým podřetězcem textu) bude sankcionováno deseti zápornými body. 92 92 93 93 V případě nejasností a otázek se neváhejte obracet e-mailem na skupinovou adresu ib030ling@aurora.fi.muni.cz, která zahrnuje následující lidi: 94 94 95 Aleš Horák[[BR]] Zuzana Nevěřilová[[BR]]Vojtěch Kovář95 Aleš Horák[[BR]] Zuzana Nevěřilová[[BR]] Vojtěch Kovář 96 96 97 97 Pamatujte, že nejhloupější otázka je ta, která zůstala nepoložena.