Changes between Initial Version and Version 1 of VyhodnoceniSumarizaceManual


Ignore:
Timestamp:
Jan 20, 2022, 9:45:02 AM (2 years ago)
Author:
Ales Horak
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • VyhodnoceniSumarizaceManual

    v1 v1  
     1= Vyhodnocení výstupu GPT-2 abstraktivní sumarizace =
     2== Anotační manuál ==
     3
     4Cílem je ...
     5
     6=== Technické předpoklady ===
     7
     8Anotace se provádí ...
     9
     10Abstraktu je přiřazen seznam o třech prvcích (3 věty v každém abstraktu)
     11Větám je přiřazena dvojice `(A, (B, C))` kde:
     12  - `A` = typ chyby v `Mapping` {`1`, ..., `5`}
     13  - `B` = kategorie chyby v `Malformed` {`1`, `2`}
     14  - `C` = typ chyby v `Malformed` {`a`, `b`, `c`}   
     15
     16  - použití `None` místo seznamu v případě, že je v sumarizaci méně než tři věty (zřídka)
     17  - k nové přidanému `Repetitive` vyjádření pak přiřadit: `(5, None)` - žádná další chyba by
     18    tam totiž z definice neměla být
     19  - kromě `(5, None)` vždy přiřadit jak `Mapping`, tak `Misleading`
     20  - pokud je věta celá v pořádku, označujeme ji `"OK"`   
     21
     22=== Obecné rady ===
     23
     24*
     25
     26=== Vysvětlení hodnot anotace ===
     27
     28`Mapping`:
     29   - pomáhá odhalit PŘÍČINU chyby
     30   - povrchová hladina
     31   - jak sumarizátor používá slova a věty k vytvoření chyby v abstraktu
     32   - hodnoty:
     33     1. `Omission`: zkopírování věty/fráze, ale vynechání slova/fráze
     34     2. `Wrong combination`: kopírování části z více různých vět a jejich chybová kombinace
     35     3. `Fabrication`: přidání jednoho nebo více nových slov, které způsobí chybu
     36     4. `Lack of rewriting`: chybné přepsání vět (např. nedostatečný kontext, chybné nahrazení
     37        referenčních výrazu nepůvodním objektem)
     38     5. `Repetitive` (přidáno): Repetitivní vyjádření, jinak všechno ok
     39`Meaning`:
     40   - EFEKT chyby (`Malformed` má přednost před `Misleading`, je méně častá)
     41   - kategorie a typy:
     42    1. `Malformed`: čtenář se zaráží nad kvalitou, ale věta není zavádějící/lživá
     43        a. `Ungrammatical`: syntakticky poškozena/nepřirozená věta, mluvčí by ji takto neřekl
     44        b. `Semantically implausible`: sémantický nesmyslná/nepřirozená věta
     45        c. `No meaning can be inferred`:
     46            - gramaticky správná věta, které není možné přiřadit význam
     47            - většinou spojené s `Lack of rewriting` - chybí kontext a tím věta ztrácí
     48              význam
     49    2. `Misleading`: můžou navodit nesprávné přesvědčení, nevyvoditelné z článku
     50        a. `Meaning changed, not entailed`: význam věty nelze vyvodit z článku (v kontextu sumarizace)
     51        b. `Meaning changed, contradiction`: význam věty má opačný
     52           nebo JINÝ význam než vyvozujeme z článku (v kontextu sumarizace)
     53        c. `Pragmatic meaning changed`: věta nabývá PRAGMATICKÉHO významu, který v článku
     54           není, nebo se PRAGMATICKÝ význam vytrácí (v kontextu sumarizace)         
     55
     56        např. byla použita obrazná věta a její význam se v sumarizaci změnil nebo
     57        vytratil (zní, že je myšlen doslovně)
     58
     59Praktické příklady (angl.) lze dohledat v [https://aclanthology.org/2020.eval4nlp-1.1.pdf článku].
     60
     61
     62------------
     63= Pro inspiraci: Manipulativní techniky propagandy v době internetu =
     64== Anotační manuál ==
     65
     66[[Image(https://nlp.fi.muni.cz/trac/propaganda/raw-attachment/wiki/ZpravaFI2017/propaganda_scr.png,width=50%,right)]]
     67
     68Cílem je vyznačit v textech článků ze zpravodajských webových portálů přítomnost stanovených manipulativních technik. U každého článku je potřeba přiřadit hodnotu několika atributům, které jsou v pravé části obrazovky (doporučujeme pracovat na velkém monitoru).
     69
     70Atributy dělíme na 2 typy: ''atributy s rozsahem'' a ''dokumentové atributy''. K atributům s rozsahem je kromě určení jejich hodnoty navíc potřeba vyznačit odpovídající část/části textu. Rozsah se vybírá kliknutím na první a poslední slovo následované kliknutím na název atributu, ke kterému rozsah patří (pro výběr pouze jednoho slova na něj klikněte dvakrát). Nevyplněný rozsah se indikuje červenou ikonkou `<>` u příslušného atributu.
     71
     72Při každé akci se zobrazí nahoře v okně hláška o úspěšném uložení údajů.
     73
     74{{{#!comment
     75Anotační editor je dostupný [https://nlp.fi.muni.cz/projekty/propaganda/edit zde]. Před vlastním anotováním se musíte v aplikaci nejprve přihlásit svým loginem na FI.
     76}}}
     77
     78=== Technické předpoklady ===
     79
     80Aplikace je vyvíjena a testována s webovým prohlížečem **Google Chromium**. V jiných prohlížečích může fungovat také, ale je možné, že některé interaktivní funkce nebudou korektní. Pro jednoduchost prosím použijte Chromium.
     81
     82=== Obecné rady ===
     83
     84* Vyvarujte se nechávání hodnot `===NONE===` ve formuláři.
     85* V případě potřeby je možné nahlédnout na originální článek, použijte odkaz z názvu článku.
     86* Zpětnou vazbu (něco nefunguje, něco není jasné) posílejte na adresu: propaganda@aurora.fi.muni.cz
     87* Po vyplnění všech atributů můžete přejít na další dokument odkazem vpravo nahoře.
     88* Anotujte sami a nekonzultujte anotace s dalšími studenty.
     89* Hodnocení anotací bude provedeno podle množství anotovaných článků a pečlivosti anotací včetně rozsahů
     90
     91=== Vysvětlení atributů s rozsahem ===
     92
     93* Místo (EU/ČR/USA/jiná země/nelze určit/Rusko)
     94  * jaká je hlavní lokace, které se článek týká
     95  * v textu vyznačte přímo frázi označující danou lokaci nebo, pokud tam lokace konkrétně není, tak tu část textu, podle které čtenář lokaci odhaduje, např. "'''Německá policie zasáhla''' proti ..." `->` Německo/jiná země
     96  * [https://cz.sputniknews.com/svet/201611014052058-Rusko-Japonsko-priprava-mirova-smlouva/ příklad Rusko]
     97* Vina (ano/ne/nevím)
     98  * je v textu na někoho svalována vina?
     99  * v textu by mělo být zřetelné co je vina (co se vytýká) a kdo je viník (na koho se svaluje)
     100  * [http://www.svetkolemnas.info/novinky/zahranicni/4011-v-oklahome-mozna-bude-potrat-kvalifikovan-jako-vrazda-1-stupne příklad vina]
     101* Nálepkování (ano/ne/nevím)
     102  * stereotypy, kolektivní vina
     103  * krátké jednoduché, úderné, výstižné, zapamatovatelné slovní spojení (ne celý odstavec), pejorativní
     104  * nejčastěji přídavná jména
     105  * může být i pozitivní
     106  * [http://www.svetkolemnas.info/novinky/zahranicni/4012-cizi-agenti-jsou-mezi-nami příklad nálepkování]
     107* Argumentace (ano/ne/nevím)
     108  * pokud se jenom něco konstatuje (že se něco stalo), tak NE
     109  * pokud působí jako argument (logický nebo emotivní), tak ANO
     110  * logika může být zdánlivá a ne nutně úplná - jak to působí na čtenáře
     111  * [http://www.svetkolemnas.info/novinky/zahranicni/4019-obama-vlade-by-melo-byt-dovoleno-dostat-se-kdykoliv-do-jakehokoliv-mobilniho-telefonu příklad argumentace]
     112* Obsažené emoce (rozhořčení/strach/nenávist/...)
     113  * jakou převažující emoci text ve čtenáři vyvolává?
     114  * emotivně zabarvené výrazy, nezáleží na obsahu, ale na emoci, kterou má text vyvolat
     115  * [http://www.svetkolemnas.info/novinky/zahranicni/4022-rusti-chlapci-v-nemecku-se-s-drzymi-migranty-nemazlili-takhle-necekane-to-dopadlo příklad emoce (rozhořčení)]
     116  * [http://www.svetkolemnas.info/novinky/domaci/4023-pozor-je-vydavatel-britskych-listu-jan-culik-je-udavac-prevleceny-za-novinare příklad emoce (nenávist)]
     117  * [http://www.svetkolemnas.info/novinky/zahranicni/4034-vrcholny-dansky-imam-priznal-agendu-pro-muslimy-cilem-je-dobyt-evropu příklad emoce (strach)]
     118* Démonizace
     119  * je nepřítel v textu démonizován?
     120  * musí být definovaný nepřítel, většinou velmi negativní
     121  * destrukce, negativní zájmy/cíle
     122  * emotivně velmi vyhrocené nálepkování
     123  * [https://www.parlamentnilisty.cz/arena/rozhovory/-Hejtman-samopal-Martin-Puta-o-Zemanovi-Alespon-nekdo-vidi-ze-i-na-venkove-ziji-lide-Obcas-prestreli-ale-protistrana-se-chova-velmi-podobne-jako-on-424857 příklad démonizace]
     124* Relativizace
     125  * relativizuje se negativní konání Ruska/pozitivní zásluha Západu?
     126  * většinou použita pro zmírnění něčeho negativního
     127  * [https://www.parlamentnilisty.cz/arena/rozhovory/-Hejtman-samopal-Martin-Puta-o-Zemanovi-Alespon-nekdo-vidi-ze-i-na-venkove-ziji-lide-Obcas-prestreli-ale-protistrana-se-chova-velmi-podobne-jako-on-424857 příklad relativizace]
     128* Strach
     129  * přesah do budoucna, apel na strach, nejistotu či ohrožení
     130  * např. zavírající se podniky, rušení soc. dávek
     131  * [https://www.parlamentnilisty.cz/arena/rozhovory/-Hejtman-samopal-Martin-Puta-o-Zemanovi-Alespon-nekdo-vidi-ze-i-na-venkove-ziji-lide-Obcas-prestreli-ale-protistrana-se-chova-velmi-podobne-jako-on-424857 příklad strach]
     132* Fabulace
     133  * zveličování problémů, fámy, nepodložená tvrzení
     134  * [https://www.parlamentnilisty.cz/arena/rozhovory/-Hejtman-samopal-Martin-Puta-o-Zemanovi-Alespon-nekdo-vidi-ze-i-na-venkove-ziji-lide-Obcas-prestreli-ale-protistrana-se-chova-velmi-podobne-jako-on-424857 příklad fabulace]
     135* Názor
     136  * obsahuje článek jasný osobní názor ''_autora_'' článku?
     137  * může mít i formu komentáře nebo sugestivně položené otázky v rozhovoru
     138  * [https://www.parlamentnilisty.cz/arena/rozhovory/-Hejtman-samopal-Martin-Puta-o-Zemanovi-Alespon-nekdo-vidi-ze-i-na-venkove-ziji-lide-Obcas-prestreli-ale-protistrana-se-chova-velmi-podobne-jako-on-424857 příklad (hejtman Martin Půta)]
     139* Zdroj
     140  * je text/názor zaštítěn odkazem na jiný zdroj?
     141  * webové stránky, médium, dokumenty; i Facebook
     142  * [https://www.parlamentnilisty.cz/arena/rozhovory/-Kavarna-a-jeji-zahranicni-loutkovodici-nemohou-cekat-do-voleb-Musi-k-sesazeni-Zemana-pouzit-nedemokraticke-metody-odhaduje-vysokoskolsky-pedagog-461641 příklad zdroj (pořad ČT Máte slovo)]
     143* Rusko
     144  * nemusíte vyplňovat (projeví se u Místo)
     145* Odborník (ano/ne/nevím)
     146  * je text/názor zaštítěn odborníkem?
     147  * i zdánlivý (expert); musí být označen jménem, nikoli celá instituce
     148  * [https://www.parlamentnilisty.cz/arena/rozhovory/-Kavarna-a-jeji-zahranicni-loutkovodici-nemohou-cekat-do-voleb-Musi-k-sesazeni-Zemana-pouzit-nedemokraticke-metody-odhaduje-vysokoskolsky-pedagog-461641 příklad (pedagog)]
     149* Politik N
     150  * označte v textu, předvyplní se automaticky
     151  * pokud se politik vyskytuje na více místech textu, je nejdůležitější vyznačení jeho plného jména (když v textu je). je možné označit i další výskyty (např. pouze zmínka o "prezidentovi", když z textu víme o kterém), ale kvůli časové náročnosti to není vyžadováno.
     152  * [https://www.parlamentnilisty.cz/arena/rozhovory/-Hejtman-samopal-Martin-Puta-o-Zemanovi-Alespon-nekdo-vidi-ze-i-na-venkove-ziji-lide-Obcas-prestreli-ale-protistrana-se-chova-velmi-podobne-jako-on-424857 příklad politik (Si Tin-Pching)]
     153* Vyznění N (neutrální/negativní/pozitivní/velebící/nenávistné)
     154  * pokud jsou argumenty pro i proti => neutrální
     155  * [http://www.parlamentnilisty.cz/arena/monitor/-Donalde-preju-ti-to-vzkazuje-Ivana-Trump-Na-Vanoce-do-USA-leta-i-jeji-mama-ktera-zije-v-CR-Syn-vzpomina-na-dedu-Milose-462118 příklad vyznění (pozitivní)]
     156
     157=== Atributy dokumentu ===
     158
     159* Téma (migrační krize/domácí politika/...)
     160  * vyberte co se nejvíce hodí
     161  * [https://www.parlamentnilisty.cz/arena/rozhovory/-Hejtman-samopal-Martin-Puta-o-Zemanovi-Alespon-nekdo-vidi-ze-i-na-venkove-ziji-lide-Obcas-prestreli-ale-protistrana-se-chova-velmi-podobne-jako-on-424857 příklad téma (migrační krize)]
     162* Žánr (zpravodajství/rozhovor/komentář)
     163  * zpravodajství: mezi normálními články, článek většinou má autora/redaktora
     164  * rozhovor obvykle obsahuje dialog (střídající se odstavce)
     165  * komentář: má vždy autora, slovo komentář v názvu
     166  * [http://www.parlamentnilisty.cz/arena/rozhovory/-Sedi-prase-na-Hrade-libuje-si-v-urade-Co-chcete-od-spolecnosti-ktera-tomu-tleska-Cechokanadan-Jirovec-ukazuje-v-zasadni-veci-na-Schwarzenberga-463944 příklad rozhovor]
     167* Zaměření (zahraniční/domácí/nelze určit)
     168  * portály mají většinou zahraniční/domácí v URL
     169  * [https://www.parlamentnilisty.cz/arena/rozhovory/-Hejtman-samopal-Martin-Puta-o-Zemanovi-Alespon-nekdo-vidi-ze-i-na-venkove-ziji-lide-Obcas-prestreli-ale-protistrana-se-chova-velmi-podobne-jako-on-424857 příklad zaměření (zahraničí, viz URL)]
     170* Celkové vyznění (neutrální/negativní/pozitivní)
     171  * [http://cz.sputniknews.com/svet/201611224173147-karjakin-porazka-carlsen-utkani-svetova-sachova-koruna příklad vyznění (neutrální)]
     172* Obrázek (ano/ne/nevím)
     173  * je nutné nahlédnout do zdroje
     174  * obsahuje článek MANIPULATIVNÍ obrázek?
     175  * montáž
     176  * ANO pouze pokud má obrázek ovlivnit mínění; normální ilustrativní obrázky ignorujte
     177  * [http://www.svetkolemnas.info/novinky/zahady/4002-astronaut-willams-vyfotil-na-zemske-obezne-draze-neco-co-tam-nepatri příklad obrázek]
     178* Video (ano/ne/nevím)
     179  * jako obrázek
     180* Poznámka
     181  * nemusíte vyplňovat