Changes between Version 6 and Version 7 of cs/ArtRychlyPruvodce


Ignore:
Timestamp:
Apr 13, 2015, 3:27:04 PM (6 years ago)
Author:
pala
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • cs/ArtRychlyPruvodce

    v6 v7  
    22
    33Do systému ART se můžete přihlásit na adrese http://asteria04.fi.muni.cz:6543,
    4 která slouží pouze pro Vaše testovací účely.
     4která slouží pouze pro vaše testovací účely.
    55
    66Nástroj ART používá rozdělení dat na projekty tak, aby v jednu chvíli s jedním projektem pracoval právě jeden člověk.
     
    23231. Zvolte si projekt MV_BLOG1/2 v sekci Home page/Switch project
    24241. Přejděte do sekce Authorship !Verification/Verify data sets
    25 1.  Nahoře zvolte sadu `Select data collection:` MV_BLOG[blog_test] (je  potřeba vybírat sady, které mají primární testovací data, tj. druhé  číslo ze tří parametrů alespoň dva)
     251.  Nahoře zvolte sadu `Select data collection:` MV_BLOG[blog_test] (je  potřeba vybírat sady, které mají primární testovací data, tj. druhé  číslo - ze tří parametrů alespoň dva)
    26261. Sjeďte na konec stránky do sekce `Verification of document pairs`
    27 1.  Zvolte rozumný počet srovnávaných dvojic `Document pair limit`, např.  100 (čím vyšší číslo, tím déle srovnání trvá). Při větších úlohách kvůli  nárokům na paměť doporučujeme používat menší sady a problémy dělit.
     271.  Zvolte rozumný počet srovnávaných dvojic `Document pair limit`, např.  100 (čím vyšší číslo, tím déle srovnání trvá). Při větších úlohách kvůli nárokům na paměť doporučujeme používat menší sady a problémy dělit.
    28281. Stiskněte tlačítko `Run verification of document pairs`
    29291. Vyčkejte zhruba dvě minuty, než se výsledek spočítá
    30 1. Čeká na Vás tabulka výsledků, tzv. confusion matrix (http://en.wikipedia.org/wiki/Confusion_matrix) s celkovou úspěšností
     301. Čeká na vás tabulka výsledků, tzv. confusion matrix (http://en.wikipedia.org/wiki/Confusion_matrix) s celkovou úspěšností
    31311.  Níže pro každou srovnávanou dvojici můžete zjistit, jak jsou si  dokumenty podobné v jednotlivých kategoriích, výsledky jsou ve tvaru:
    3232 1. 59221 vs. 59250 (id dokumentů) [[BR]]
    3333 Similarity:%                     Kategorie: %
    3434Pokud  chcete zjistit autory jednotlivých dokumentů, např. v sekci Data
    35 management/Edit data sets můžete zadávat id dokumentu a vyhledá se vám
    36 záznamNebo si můžete projít celé sady dokumentů v Home page/View projects a
     35management/Edit data sets, můžete zadávat id dokumentu a vyhledá se vám
     36záznam. Nebo si můžete projít celé sady dokumentů v Home page/View projects a
    3737doklikat se.
    3838
     
    47471. Stiskněte tlačítko `Run verification of data sets`
    48481. Vyčkejte, než se provede analýza
    49 1.  Čeká na Vás tabulka výsledků, kde zjistíte konzistenci jednoho autora,  druhého autora (tj. jak je autor ve svém stylu stabilní) a podobnost  mezi autory. Pokud je podobnost mezi autory podobná jejich konzistenci,  výsledek je shoda autorství, pokud je velmi nízká, neshoda, v opačním  případě raději vracíme nejistotu (systém vrací v 96 % správnou odpověď za cenu asi 70% pokrytí)
     491.  Čeká na vás tabulka výsledků, kde zjistíte konzistenci jednoho autora, druhého autora (tj. jak je autor ve svém stylu stabilní) a podobnost mezi autory. Pokud je podobnost mezi autory podobná jejich konzistenci, výsledek je shoda autorství, pokud je velmi nízká, neshoda, v opačném  případě raději vracíme nejistotu (systém vrací v 96 % správnou odpověď za cenu asi 70% pokrytí)
    50501.  Celý postup opakujeme pro sadu MV_BOOK[book_same_author_pair]
    5151
    52  Výsledek vypadá následovně:(přehled  doumentů 1. kandidáta -- dokumenty si lze prohlédnout kliknutím na ně  -- doporučujeme otevřít v novém okně -- provádí se současně jejich analýza, proto to chvíli trvá, prosím mějte strpení)
     52 Výsledek vypadá následovně: (přehled  dokumentů 1. kandidáta -- dokumenty si lze prohlédnout kliknutím na ně  -- doporučujeme otevřít v novém okně -- provádí se současně jejich analýza, proto to chvíli trvá, prosím mějte strpení)
    5353
    5454 Analysis complete for documents of the first author '''Josef Pecinovský:10''':         
     
    83831. Přejděte do sekce Authorship writing
    84841. Pro automatické přiřazení dokumentů do výběru zůstaňte v sekci !`Analyse author's characteristics`
    85 1. Zvolte si autora, např. Karla Čapka (kolonka Author's web identity,  rychle se autor hledá, když začnete psát začátek jeho jména, např.  Karel)
     851. Zvolte si autora, např. Karla Čapka (kolonka Author's web identity, rychle se autor hledá, když začnete psát začátek jeho jména, např.  Karel)
    86861. max. number of documents: čím menší číslo, tím rychleji analýza proběhne a graf bude větší a čitelnější
    87 1. Stiskněte !`analyse autor`, pro každou charakteristiku stylu autora se  vygeneruje podrobný graf.V jednom sloupci jsou vždy hodnoty všech  dokumentů pro jednu charakteristiku a pod sloupcem barva značí, jak je  autor konzistentní (zelená hodně, červená vůbec).  Pod grafy jsou  vysvětivky jednotlivých popisků.
     871. Stiskněte !`analyse autor`, pro každou charakteristiku stylu autora se vygeneruje podrobný graf. V jednom sloupci jsou vždy hodnoty všech  dokumentů pro jednu charakteristiku a barva pod sloupcem značí, jak je  autor konzistentní (zelená hodně, červená vůbec).  Pod grafy jsou  vysvětlivky jednotlivých popisků.
    8888
    8989Podobně se postupuje i pro řešení dalších úloh, zde se odkážeme na podrobný
    90 manuál.Kromě verifikace je k dispozici i přiřazování autorství z kandidátů (je
     90manuál. Kromě verifikace je k dispozici i přiřazování autorství z kandidátů (je
    9191tolik  kandidátů jako dokumentů v sekundární testovací sadě -- třetí číslo u
    92 sady) a přiřazování autorství bez kandidátů.Jednotlivé sady jde ručně upravovat
    93 nebo spojovat.Samozřejmostí  je i učení nových klasifikátorů a možnost volit
    94 mezi aktuálním a  starším klasifikátorem. Lze měnit i parametry klasifikátorů a
    95 vynechat  některé charakteristiky autora. např. při zpracování anglických dat
     92sady) a přiřazování autorství bez kandidátů. Jednotlivé sady jde ručně upravovat
     93nebo spojovat. Samozřejmostí  je i učení nových klasifikátorů a možnost volit
     94mezi aktuálním a starším klasifikátorem. Lze měnit i parametry klasifikátorů a
     95vynechat některé charakteristiky autora. např. při zpracování anglických dat
    9696je  potřeba je zcela přenastavit (např. v `Settings` zvolit `Select en only`).