Custom Query (24 matches)

Filters
 
Or
 
  
 
Columns

Show under each result:


Results (19 - 21 of 24)

1 2 3 4 5 6 7 8
Ticket Resolution Summary Owner Reporter
#33 done Zpracování překladové paměti DGT xmedved1 Vít Baisa
Description

Přidal jsem Marka M. do skupiny a aliasu skrivanek(nda). Níže píšu informace pro Marka.

Složka projektu:

alba:/nlp/projekty/skrivanek_nda/

Domovské stránky DGT

Ukázka konfigurace paralelního korpusu:

alba:/corpora/registry/academia_en

Umístění skriptů a dat DGT (dále DGT_HOME):

alba:/nlp/tm/DGT/

Jednotlivé kroky:

  • založit v DGT_HOME git, ignorovat veškerá data pomocí .gitignore
  • vytvořit makefile s pravidly
    • download: stáhne pomocí wget všechny .zip soubory s TMX daty
    • tmx: sloučí všechny TMX soubory do jednoho souboru se zachováním informace odkud překladové páry/n-tice pochází (release dat, jméno původního souboru)
    • vert: vytvoří pro všechny jazyky vertikály, tokenizované, označkované (pokud máme tagger); vertikály dej do /corpora/vert/dgt/dgt_en.vert atd.
    • compile: zkompiluje vertikály (předpřipravíš si registry soubory pro všechny korpusy)

S dotazy se Marku obracej na mne.

V další fázi (bude na to ticket) pak přidáme další pravidlo tbx, které vytvoří kandidátské návrhy pro termíny ze všech korpusů (podle jazyků) a kandidátské návrhy překladů pro termíny a všechna tato data uloží do TBX souboru.

#20 fixed Databáze + frekvence x383264 x383264
Description

databáze slov k anotování s jejich frekvencí z korpusu

#21 fixed teoretická část BP(1) x383264 x383264
Description

tvarosloví

1 2 3 4 5 6 7 8
Note: See TracQuery for help on using queries.