Custom Query (24 matches)

Filters
 
Or
 
  
 
Columns

Show under each result:


Results (22 - 24 of 24)

1 2 3 4 5 6 7 8
Ticket Resolution Summary Owner Reporter
#31 done Make skript pro vyhodnocování metod pro rozšiřování TM xbusta1 Vít Baisa
Description

Připravit jeden Makefile s pravidly na vyhodnocení jednotlivých metod. V adresáři ...skrivanek_nda/git/Makefile, takže když spustím v tom adresáři make, případně make eval_join_1, make eval_substitute_xyz, tak to vygeneruje jeden soubor, ze kterého půjde jednoduše poznat, jestli se metoda po posledním zásahu zlepšila nebo zhoršila.

Výsledky z jednotlivých běhů můžou být označené datem/časem, pro lepší orientaci a možnost srovnání se staršími vyhodnoceními.

Vyhodnocovat chceme jednak pokrytí (výstup může vypadat jako tabulky, které máme ve článcích na RASLAN) a jednak kvalitu (na základě).

Stačí asi upravit existující skripty, které generují HTML soubory. Stránky totiž dovolují přidávat jednoduše vysvětlující informace (z jakých subsegmentů se segment vytvořil, seznam kandidátů s hodnotami skóre atd.).

Nevadí, když bude vyhodnocování trvat 10 hodin. Večer spustím make xxx a ráno se podívám na výsledky.

Makefile musí být v gitu a měl by být rozumně okomentovaný, aby se v něm i prase vyznalo. :)

Možná ještě někdo upřesněte, co má ve vyhodnocení přesně být.

A v rámci úklidu bych výsledky vyhodnocení dával do nějakého adresáře ...eval... a zpřístupnil na nlp.fi.muni.cz/projekty/skrivanek_nda/eval či podobně, aby se na výsledky mohl podívat rychle i ten, kdo je negeneroval.

#33 done Zpracování překladové paměti DGT xmedved1 Vít Baisa
Description

Přidal jsem Marka M. do skupiny a aliasu skrivanek(nda). Níže píšu informace pro Marka.

Složka projektu:

alba:/nlp/projekty/skrivanek_nda/

Domovské stránky DGT

Ukázka konfigurace paralelního korpusu:

alba:/corpora/registry/academia_en

Umístění skriptů a dat DGT (dále DGT_HOME):

alba:/nlp/tm/DGT/

Jednotlivé kroky:

  • založit v DGT_HOME git, ignorovat veškerá data pomocí .gitignore
  • vytvořit makefile s pravidly
    • download: stáhne pomocí wget všechny .zip soubory s TMX daty
    • tmx: sloučí všechny TMX soubory do jednoho souboru se zachováním informace odkud překladové páry/n-tice pochází (release dat, jméno původního souboru)
    • vert: vytvoří pro všechny jazyky vertikály, tokenizované, označkované (pokud máme tagger); vertikály dej do /corpora/vert/dgt/dgt_en.vert atd.
    • compile: zkompiluje vertikály (předpřipravíš si registry soubory pro všechny korpusy)

S dotazy se Marku obracej na mne.

V další fázi (bude na to ticket) pak přidáme další pravidlo tbx, které vytvoří kandidátské návrhy pro termíny ze všech korpusů (podle jazyků) a kandidátské návrhy překladů pro termíny a všechna tato data uloží do TBX souboru.

#34 done Zarovnání dokumentu a referenčního překladu xmedved1 xbusta1
Description

Zarovnání segmentů z referenčního dokumentu: "/nlp/projekty/skrivanek_nda/Prekladova\ pamet\ a\ Testovaci\ soubory/CS-EN/Soubory_CS-EN/02_vyhotoveni/1301-02414_ori_03492_DH_LokalizaceReporty_UzivDOC2.docx"

k segmentům z následujícího dokumentu (segmenty jsou v druhém sloupci): "/nlp/projekty/skrivanek_nda/Prekladova\ pamet\ a\ Testovaci\ soubory/CS-EN/Fragmenty_MemoQ/Porovnani_prekladu_pro_ucely_MT_vyzkumu.xlsx"

1 2 3 4 5 6 7 8
Note: See TracQuery for help on using queries.