Changes between Version 5 and Version 6 of private/NlpInPracticeCourse/MachineTranslation


Ignore:
Timestamp:
Oct 4, 2015, 8:08:30 PM (9 years ago)
Author:
Vít Baisa
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • private/NlpInPracticeCourse/MachineTranslation

    v5 v6  
    5656{{{make clean}}}
    5757
    58 Po každé změně vstupních souborů a parametrů, při změně skriptů, vyčistěte dočasné soubory a starý slovník příkazem
     58Po každé změně vstupních souborů a parametrů, při změně skriptů, vyčistěte dočasné soubory a starý slovník příkazem {{{make clean}}}.
    5959
     60== Detailní pohled na skripty a generovaná data ==
     61
     62* Cvičně si spusťte implicitní {{{make dict}}} a podívejte se na vytvořené soubory:
     63  * czech.words.freq
     64  * english.words.freq
     65  * english.words-czech.words.cofreq
     66  * english.words-czech.words.dict (výsledný slovník)
     67* Podívejte se, jak jsou výsledné soubory veliké (kolik obsahují řádků) a jaké data obsahují.
     68* Podívejte se na skript make_dict.py, který generuje slovník, na klíčových místech obsahuje řetězec TODO, v těchto místech můžete skript upravovat a měnit podmínky tak, aby se výsledné f-score vygenerovaného slovníku co nejíce zvýšilo.
     69
     70== Zadání ==
     71
     72Změňte klíčová místa ve skriptech par2items.py, make_dict.py tak, abyste dosáhli co nejvyššího f-score (viz {{{make eval}}}). Do odevzdávárny nahrajte všechny skripty, které změníte (Makefile, *.py) v jednom archívu. Ten vytvoříte příkazem
     73{{{tar czf ia161_mt_<uco_nebo_login>.tar.gz Makefile *.py}}}
     74