| 1 | = ART - Rychlý průvodce = |
| 2 | |
| 3 | Do systému ART se můžete přihlásit na adrese http://asteria04.fi.muni.cz:6543, |
| 4 | která slouží pouze pro Vaše testovací účely. |
| 5 | |
| 6 | Nástroj ART používá rozdělení dat na projekty tak, aby v jednu chvíli s jedním projektem pracoval právě jeden člověk. |
| 7 | Zatímco dokumenty vložené do systému může používat každý, projekty se liší: |
| 8 | * kolekcemi dat: kolekce je soubor dokumentů, které nás zajímají a chceme je vyhodnocovat nebo na nich trénovat nový model |
| 9 | * naučenými klasifikátory pro rozhodování autorství, každý typ dokumentů (např. blog, kniha, diskuze, twitter) se od sebe významně liší a je proto vhodné vyhodnocovat jednotlivé typy zvlášť (případně při vyhodnocování např. knih s blogy se učíme na datech složených z knih a blogů) |
| 10 | |
| 11 | Po přihlášení začnete v projektu MV_BLOG1/2, který má vytvořený základní model pro rozpoznávání blogů a k dispozici náhodně vytvořenou sadu dokumentů pro testování. |
| 12 | |
| 13 | V reálném použití je typické, že každý uživatel si vytvoří vlastní projekty a bude s nimi pracovat. I proto jsme základní projekty s ukázkami vytvořili vždy dvakrát, tj. je MV_BLOG1 i MV_BLOG2. |
| 14 | |
| 15 | Prosíme, abyste každý používal projekty se svým číslem a zabránil tak protichůdným akcím -- např. jeden člověk na datech vyhodnocuje, zatímco druhý se rozhodne vylepšit klasifikátor autorství a v půlce vyhodnocování ho přeučí. |
| 16 | Samozřejmě si můžete tvořit další projekty, v kterých budete experimentovat. Po vytvoření projektu se do něj nezapomeňte přepnout akcí Home page/Switch project. |
| 17 | |
| 18 | Pro rychlejší orientaci v systému jsme připravili rychlý návod, jak řešit základní úlohy. |
| 19 | |
6 | | 1. Nahoře zvolte sadu !`Select data collection:` MV_BLOG[blog_test] (je potřeba vybírat sady, které mají primární testovací data, tj. druhé číslo ze tří parametrů alespoň dva) |
7 | | 1. Sjeďte na konec stránky do sekce !`Verification of document pairs` |
8 | | 1. Zvolte rozumný počet srovnávaných dvojic !`Document pair limit`, např. 100 (čím vyšší číslo, tím déle srovnání trvá). Při větších úlohách kvůli nárokům na paměť doporučujeme používat menší sady a problémy dělit. |
9 | | 1. Stiskněte tlačítko !`Run verification of document pairs` |
| 25 | 1. Nahoře zvolte sadu `Select data collection:` MV_BLOG[blog_test] (je potřeba vybírat sady, které mají primární testovací data, tj. druhé číslo ze tří parametrů alespoň dva) |
| 26 | 1. Sjeďte na konec stránky do sekce `Verification of document pairs` |
| 27 | 1. Zvolte rozumný počet srovnávaných dvojic `Document pair limit`, např. 100 (čím vyšší číslo, tím déle srovnání trvá). Při větších úlohách kvůli nárokům na paměť doporučujeme používat menší sady a problémy dělit. |
| 28 | 1. Stiskněte tlačítko `Run verification of document pairs` |