= Projekt GAMU Manipulativní techniky propagandy v době internetu = MUNI/G/0872/2016 Zpráva za tým FI, 2018 == Zpráva za rok 2018 == V roce 2018 jsme do editoru doplnili automatické návrhy. Na základě manuálních anotací [DOPLNIT POCET] dokumentů jsme vytvořili 2 modely: jeden pro predikci hodnot jednotlivých atributů v novém neanotovaném dokumentu a jeden pro odhad částí textů, které souvisí s vybraným atributem. Na obrázku je vidět náhled automatických návrhů (které jsou určeny pro ruční kontrolu anotátory). Tyto návrhy nejsou zobrazené defaultně, ale anotátor si je může nechat zobrazit. [[Image(propaganda_scr.png, align=right, 50%)]] Model [DOPLNIT INFO O METODĚ] pro navrhování hodnot atributů přiřazuje pro každý atribut s omezeným množstvím hodnot (např. ano/ne/nevím) každé této hodnotě pravděpodobnost. Na obrázku je znázorněna různou sytostí červené. Nejsytější znamená nejvyšší pravděpodobnost dané hodnoty a daného atributu. Druhý model [DOPLNIT INFO O METODĚ] pro vybraný atribut, ke kterému jsou k dispozici anotované rozsahy v textech, přiřadí všem slovům z článku pravděpodobnost, která je opět zobrazena jako různá sytost červené. V roce 2018 proběhly další anotace dat. Tyto anotace byly přidány do databáze článků, ve které je aktuálně [DOPLNIT] plně anotovaných článků. Z toho [DOPLNIT] je anotováno více anotátory, takže lze zkoumat mezianotátorskou shodu. == Plán na rok 2019 == [TADY VAŘÍM Z VODY] Dále se zaměříme na vylepšování trénování modelů pro automatické návrhy anotací. V rámci své magisterské práce se student pokusí stáhnout co nejčistší data z českých propagandistických webů (pro srovnání budou zahrnuty i mainstreamová média) i s metadaty. Toto stahování bude probíhat pravidelně a bude plně automatizované; bude na něj navázané následné zpracování dat (čištění, jazyková analýza) a několik datových analýz s využitím nástrojů NLP centra.