Context Navigation

MachineTranslation

Timestamp:: Oct 5, 2015, 8:11:11 AM (10 years ago)
Author:: Vít Baisa
Comment:: --

Legend:

: Unmodified
: Added
: Removed
: Modified

private/NlpInPracticeCourse/MachineTranslation

-                      v7
+                      v8
 == Praktická část: generování překladového slovníku z paralelních dat ==
 === Instrukce ===
+=== Základní instrukce ===
 * stáhněte si archív se skripty a trénovacími daty (příloha)
 * rozbalte ho do domovského adresáře, vytvoří se podadresář it161_mt
+{{{tar xzf ia161_mt.tar.gz}}}
+* rozbalte ho do domovského adresáře příkazem {{{tar xzf ia161_mt.tar.gz}}}
+* vytvoří se podadresář it161_mt
 === Soubory v archívu ===
 …
 {{{make dict}}}
+* samotny prikaz pouzije 1000 radku trenovacich dat a vygeneruje slovnik na zakladne slovnich tvaru (soubory czech.words a english.words)
+* je mozne zadat alternativni soubory s lemmaty pomoci parametru L1DATA a L2DATA
+* je take mozne zmenit pocet radku, ktere se pouziji pro vygenerovani slovniku
+  {{{make dict [L1DATA=<soubor>] [L2DATA=<soubor>] [LIMIT=<pocet radku>]}}}
+Například: {{{make dict L1DATA=english.lemmas L2DATA=czech.lemmas LIMIT=10000}}}
+* samotný příkaz použije 1000 řádků trénovacích dat a vygeneruje slovnik na zakladne slovnich tvaru (soubory czech.words a english.words)
+* je možné zadat alternativní soubory s lemmaty pomocí parametru L1DATA a L2DATA
+* je také možné změnit počet řádků, které se použijí pro vygenerovaní slovníku
+* obecně: {{{make dict [L1DATA=<soubor>] [L2DATA=<soubor>] [LIMIT=<pocet radku>]}}}
+* konkrétně: {{{make dict L1DATA=english.lemmas L2DATA=czech.lemmas LIMIT=10000}}}
 {{{make eval}}}