Changes between Version 7 and Version 8 of private/NlpInPracticeCourse/MachineTranslation


Ignore:
Timestamp:
Oct 5, 2015, 8:11:11 AM (9 years ago)
Author:
Vít Baisa
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • private/NlpInPracticeCourse/MachineTranslation

    v7 v8  
    1919== Praktická část: generování překladového slovníku z paralelních dat ==
    2020
    21 === Instrukce ===
     21=== Základní instrukce ===
    2222
    2323* stáhněte si archív se skripty a trénovacími daty (příloha)
    24 * rozbalte ho do domovského adresáře, vytvoří se podadresář it161_mt
    25 {{{tar xzf ia161_mt.tar.gz}}}
     24* rozbalte ho do domovského adresáře příkazem {{{tar xzf ia161_mt.tar.gz}}}
     25* vytvoří se podadresář it161_mt
    2626
    2727=== Soubory v archívu ===
     
    4141{{{make dict}}}
    4242
    43 * samotny prikaz pouzije 1000 radku trenovacich dat a vygeneruje slovnik na zakladne slovnich tvaru (soubory czech.words a english.words)
    44 * je mozne zadat alternativni soubory s lemmaty pomoci parametru L1DATA a L2DATA
    45 * je take mozne zmenit pocet radku, ktere se pouziji pro vygenerovani slovniku
    46   {{{make dict [L1DATA=<soubor>] [L2DATA=<soubor>] [LIMIT=<pocet radku>]}}}
    47 
    48 Například: {{{make dict L1DATA=english.lemmas L2DATA=czech.lemmas LIMIT=10000}}}
     43* samotný příkaz použije 1000 řádků trénovacích dat a vygeneruje slovnik na zakladne slovnich tvaru (soubory czech.words a english.words)
     44* je možné zadat alternativní soubory s lemmaty pomocí parametru L1DATA a L2DATA
     45* je také možné změnit počet řádků, které se použijí pro vygenerovaní slovníku
     46* obecně: {{{make dict [L1DATA=<soubor>] [L2DATA=<soubor>] [LIMIT=<pocet radku>]}}}
     47* konkrétně: {{{make dict L1DATA=english.lemmas L2DATA=czech.lemmas LIMIT=10000}}}
    4948
    5049{{{make eval}}}