Changes between Version 6 and Version 7 of cs/ArtRychlyPruvodce
- Timestamp:
- Apr 13, 2015, 3:27:04 PM (8 years ago)
Legend:
- Unmodified
- Added
- Removed
- Modified
-
cs/ArtRychlyPruvodce
v6 v7 2 2 3 3 Do systému ART se můžete přihlásit na adrese http://asteria04.fi.muni.cz:6543, 4 která slouží pouze pro Vaše testovací účely.4 která slouží pouze pro vaše testovací účely. 5 5 6 6 Nástroj ART používá rozdělení dat na projekty tak, aby v jednu chvíli s jedním projektem pracoval právě jeden člověk. … … 23 23 1. Zvolte si projekt MV_BLOG1/2 v sekci Home page/Switch project 24 24 1. Přejděte do sekce Authorship !Verification/Verify data sets 25 1. Nahoře zvolte sadu `Select data collection:` MV_BLOG[blog_test] (je potřeba vybírat sady, které mají primární testovací data, tj. druhé číslo ze tří parametrů alespoň dva)25 1. Nahoře zvolte sadu `Select data collection:` MV_BLOG[blog_test] (je potřeba vybírat sady, které mají primární testovací data, tj. druhé číslo - ze tří parametrů alespoň dva) 26 26 1. Sjeďte na konec stránky do sekce `Verification of document pairs` 27 1. Zvolte rozumný počet srovnávaných dvojic `Document pair limit`, např. 100 (čím vyšší číslo, tím déle srovnání trvá). Při větších úlohách kvůli 27 1. Zvolte rozumný počet srovnávaných dvojic `Document pair limit`, např. 100 (čím vyšší číslo, tím déle srovnání trvá). Při větších úlohách kvůli nárokům na paměť doporučujeme používat menší sady a problémy dělit. 28 28 1. Stiskněte tlačítko `Run verification of document pairs` 29 29 1. Vyčkejte zhruba dvě minuty, než se výsledek spočítá 30 1. Čeká na Vás tabulka výsledků, tzv. confusion matrix (http://en.wikipedia.org/wiki/Confusion_matrix) s celkovou úspěšností30 1. Čeká na vás tabulka výsledků, tzv. confusion matrix (http://en.wikipedia.org/wiki/Confusion_matrix) s celkovou úspěšností 31 31 1. Níže pro každou srovnávanou dvojici můžete zjistit, jak jsou si dokumenty podobné v jednotlivých kategoriích, výsledky jsou ve tvaru: 32 32 1. 59221 vs. 59250 (id dokumentů) [[BR]] 33 33 Similarity:% Kategorie: % 34 34 Pokud chcete zjistit autory jednotlivých dokumentů, např. v sekci Data 35 management/Edit data sets můžete zadávat id dokumentu a vyhledá se vám36 záznam Nebo si můžete projít celé sady dokumentů v Home page/View projects a35 management/Edit data sets, můžete zadávat id dokumentu a vyhledá se vám 36 záznam. Nebo si můžete projít celé sady dokumentů v Home page/View projects a 37 37 doklikat se. 38 38 … … 47 47 1. Stiskněte tlačítko `Run verification of data sets` 48 48 1. Vyčkejte, než se provede analýza 49 1. Čeká na Vás tabulka výsledků, kde zjistíte konzistenci jednoho autora, druhého autora (tj. jak je autor ve svém stylu stabilní) a podobnost mezi autory. Pokud je podobnost mezi autory podobná jejich konzistenci, výsledek je shoda autorství, pokud je velmi nízká, neshoda, v opačním případě raději vracíme nejistotu (systém vrací v 96 % správnou odpověďza cenu asi 70% pokrytí)49 1. Čeká na vás tabulka výsledků, kde zjistíte konzistenci jednoho autora, druhého autora (tj. jak je autor ve svém stylu stabilní) a podobnost mezi autory. Pokud je podobnost mezi autory podobná jejich konzistenci, výsledek je shoda autorství, pokud je velmi nízká, neshoda, v opačném případě raději vracíme nejistotu (systém vrací v 96 % správnou odpověď za cenu asi 70% pokrytí) 50 50 1. Celý postup opakujeme pro sadu MV_BOOK[book_same_author_pair] 51 51 52 Výsledek vypadá následovně: (přehled doumentů 1. kandidáta -- dokumenty si lze prohlédnout kliknutím na ně -- doporučujeme otevřít v novém okně -- provádí se současně jejichanalýza, proto to chvíli trvá, prosím mějte strpení)52 Výsledek vypadá následovně: (přehled dokumentů 1. kandidáta -- dokumenty si lze prohlédnout kliknutím na ně -- doporučujeme otevřít v novém okně -- provádí se současně jejich analýza, proto to chvíli trvá, prosím mějte strpení) 53 53 54 54 Analysis complete for documents of the first author '''Josef Pecinovský:10''': … … 83 83 1. Přejděte do sekce Authorship writing 84 84 1. Pro automatické přiřazení dokumentů do výběru zůstaňte v sekci !`Analyse author's characteristics` 85 1. Zvolte si autora, např. Karla Čapka (kolonka Author's web identity, 85 1. Zvolte si autora, např. Karla Čapka (kolonka Author's web identity, rychle se autor hledá, když začnete psát začátek jeho jména, např. Karel) 86 86 1. max. number of documents: čím menší číslo, tím rychleji analýza proběhne a graf bude větší a čitelnější 87 1. Stiskněte !`analyse autor`, pro každou charakteristiku stylu autora se vygeneruje podrobný graf.V jednom sloupci jsou vždy hodnoty všech dokumentů pro jednu charakteristiku a pod sloupcem barva značí, jak je autor konzistentní (zelená hodně, červená vůbec). Pod grafy jsou vysvětivky jednotlivých popisků.87 1. Stiskněte !`analyse autor`, pro každou charakteristiku stylu autora se vygeneruje podrobný graf. V jednom sloupci jsou vždy hodnoty všech dokumentů pro jednu charakteristiku a barva pod sloupcem značí, jak je autor konzistentní (zelená hodně, červená vůbec). Pod grafy jsou vysvětlivky jednotlivých popisků. 88 88 89 89 Podobně se postupuje i pro řešení dalších úloh, zde se odkážeme na podrobný 90 manuál. Kroměverifikace je k dispozici i přiřazování autorství z kandidátů (je90 manuál. Kromě verifikace je k dispozici i přiřazování autorství z kandidátů (je 91 91 tolik kandidátů jako dokumentů v sekundární testovací sadě -- třetí číslo u 92 sady) a přiřazování autorství bez kandidátů. Jednotlivé sady jde ručně upravovat93 nebo spojovat. Samozřejmostí je i učení nových klasifikátorů a možnost volit94 mezi aktuálním a 95 vynechat 92 sady) a přiřazování autorství bez kandidátů. Jednotlivé sady jde ručně upravovat 93 nebo spojovat. Samozřejmostí je i učení nových klasifikátorů a možnost volit 94 mezi aktuálním a starším klasifikátorem. Lze měnit i parametry klasifikátorů a 95 vynechat některé charakteristiky autora. např. při zpracování anglických dat 96 96 je potřeba je zcela přenastavit (např. v `Settings` zvolit `Select en only`).