wiki:ZpravaFI2018

Version 3 (modified by Vít Baisa, 6 years ago) (diff)

--

Projekt GAMU Manipulativní techniky propagandy v době internetu

MUNI/G/0872/2016

Zpráva za tým FI, 2018

Zpráva za rok 2018

V roce 2018 jsme do editoru doplnili automatické návrhy. Na základě manuálních anotací [DOPLNIT POCET] dokumentů jsme vytvořili 2 modely: jeden pro predikci hodnot jednotlivých atributů v novém neanotovaném dokumentu a jeden pro odhad částí textů, které souvisí s vybraným atributem. Na obrázku je vidět náhled automatických návrhů (které jsou určeny pro ruční kontrolu anotátory). Tyto návrhy nejsou zobrazené defaultně, ale anotátor si je může nechat zobrazit.

Model [DOPLNIT INFO O METODĚ] pro navrhování hodnot atributů přiřazuje pro každý atribut s omezeným množstvím hodnot (např. ano/ne/nevím) každé této hodnotě pravděpodobnost. Na obrázku je znázorněna různou sytostí červené. Nejsytější znamená nejvyšší pravděpodobnost dané hodnoty a daného atributu.

Druhý model [DOPLNIT INFO O METODĚ] pro vybraný atribut, ke kterému jsou k dispozici anotované rozsahy v textech, přiřadí všem slovům z článku pravděpodobnost, která je opět zobrazena jako různá sytost červené.

V roce 2018 proběhly další anotace dat. Tyto anotace byly přidány do databáze článků, ve které je aktuálně [DOPLNIT] plně anotovaných článků. Z toho [DOPLNIT] je anotováno více anotátory, takže lze zkoumat mezianotátorskou shodu.

Plán na rok 2019

[TADY VAŘÍM Z VODY]

Dále se zaměříme na vylepšování trénování modelů pro automatické návrhy anotací. V rámci své magisterské práce se student pokusí stáhnout co nejčistší data z českých propagandistických webů (pro srovnání budou zahrnuty i mainstreamová média) i s metadaty. Toto stahování bude probíhat pravidelně a bude plně automatizované; bude na něj navázané následné zpracování dat (čištění, jazyková analýza) a několik datových analýz s využitím nástrojů NLP centra.

Attachments (1)

Download all attachments as: .zip