Návrhy experimentů
Postup otestování nového experimentu train_novy_experiment.py
:
-
ssh asteria04 newgrp propaganda cd /nlp/projekty/propaganda/eval cp train_base.py train_novy_experiment.py time make -j12 eval libreoffice eval_f1_weighted_relative.csv
Experimenty k testování:
- přidat stylometrické rysy do rysů k učení - #52
- vyhodnocení na odstavcích (větách?):
- podle rozsahů: odstavec s rozsahem = 1.0, odstavec v pozitivním dokumentu bez rozsahu = 0.5, jinak 0.0
- podle přítomnosti významných (non-stop) slov a n-gramů z rozsahů
- podle sentimentu odstavců - jen pro odpovídající rysy
- podle sentimentu rozsahů - spíš pro info, jestli sentiment hraje roli
Výsledek pak převést na dokument - ve většině případů asi jako
alespoň jeden pozitivní odstavec
?
- pro sentiment porovnat algoritmus se SentiWordNetem a https://nlp.fi.muni.cz/projekty/rozpoznani_emoci_v_textu. K sentiwordnetu jde pridat
/nlp/projekty/ne_eval/afinn.cz.txt
. - rekurentní neuronová sít pro klasifikaci (např. Bi-GRU)
- ...
Last modified 5 years ago
Last modified on Mar 28, 2019, 11:56:52 AM