wiki:cs/KonfiguraceProManatee

Version 2 (modified by Vít Baisa, 10 years ago) (diff)

--

Konfigurace pro Manatee

Každý korpus musí mít konfigurační soubor. Konfigurační soubory pro jednotlivé korpusy jsou uloženy v /corpora/registry/<jméno korpusu>. Soubor obsahuje mimo jiné tyto položky:

PATH   "/corpora/manatee/czes"
VERTICAL "/corpora/vert/czes/czes.vert"
LANGUAGE "Czech"
ENCODING "utf-8"

PATH popisuje cestu ke zkompilovanému korpusu, VERTICAL je cesta k vertikálu, LANGUAGE obsahuje označení jazyka, ENCODING určuje použité kódování vertikálu.

Kofigurační soubor pokračuje popisem gramatických relací pro SketchEngine:

WSDEF "/home/xnemcik/public_html/pub/ws-syn2k-ajka_v6.txt"

Následují atributy:

ATTRIBUTE   word
ATTRIBUTE   lemma
ATTRIBUTE   tag

A struktury:

STRUCTURE g {
        DISPLAYTAG 0
        DISPLAYBEGIN "_EMPTY_"
}
STRUCTURE   head

Vysvětlení k jednotlivým položkám konfiguračního souboru na najdete v dokumentaci SketchEngine.