Changes between Version 3 and Version 4 of cs/TopicRecognition


Ignore:
Timestamp:
Mar 10, 2014, 3:51:30 PM (10 years ago)
Author:
Zuzana Nevěřilová
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • cs/TopicRecognition

    v3 v4  
    66
    77== Zadání lingvistického úkolu do IB030 Úvod do počítačové lingvistiky ==
    8 Cílem je vytvořit část výše zmíněné databáze. Každý student přečte a vyhodnotí 70 krátkých textů (perexy z novinových zpráv) a vyznačí v nich témata - očekáváme, že jich bude v každém textu okolo pěti. Počítáme průměrně 5 minut na přečtení článku a výběr témat (ze začátku to zřejmě bude více, pak to půjde rychleji, jak si osvojíte pokyny). Následují pokyny k vypracování otázek.
     8Cílem je vytvořit část výše zmíněné databáze. Každý student přečte a vyhodnotí 120 krátkých textů (perexy z novinových zpráv) a vyznačí v nich témata - očekáváme, že jich bude v každém textu okolo pěti. Počítáme průměrně 3-5 minut na přečtení článku a výběr témat (ze začátku to zřejmě bude více, pak to půjde rychleji, jak si osvojíte pokyny). Následují pokyny k vypracování otázek.
    99
    1010 * každý anotátor dostane náhodný vzorek z perexů z nedávných novinových článků
     
    8989
    9090== Vyhodnocení úkolu ==
    91 Za splnění úkolu můžete získat 0-20 bodů. Z vámi zpracovávaných textů bude náhodně vybráno několik, u nichž zkontrolujeme, zda vybraná témata splňují kritéria popsaná výše. Za každé vybrané téma splňující kritéria dostanete 1 bod, celkové body budou přepočítány do max.20 podle počtu kontrolovaných textů. Porušení globálních instrukcí (např. špatný formát souboru, zvolení tématu, které není souvislým podřetězcem textu) bude sankcionováno deseti zápornými body.
     91Za splnění úkolu můžete získat 0-20 bodů. Z vámi zpracovávaných textů bude náhodně vybráno několik, u nichž zkontrolujeme, zda vybraná témata splňují kritéria popsaná výše. Za každé vybrané téma splňující kritéria dostanete 1 bod, celkové body budou přepočítány do max. 20 podle počtu kontrolovaných textů. Porušení globálních instrukcí (např. špatný formát souboru, zvolení tématu, které není souvislým podřetězcem textu) bude sankcionováno deseti zápornými body.
    9292
    9393V případě nejasností a otázek se neváhejte obracet e-mailem na skupinovou adresu ib030ling@aurora.fi.muni.cz, která zahrnuje následující lidi:
    9494
    95   Aleš Horák[[BR]]Zuzana Nevěřilová[[BR]]Vojtěch Kovář
     95  Aleš Horák[[BR]] Zuzana Nevěřilová[[BR]] Vojtěch Kovář
    9696
    9797Pamatujte, že nejhloupější otázka je ta, která zůstala nepoložena.