Version 2 (modified by 9 years ago) (diff) | ,
---|
Konfigurace pro Manatee
Každý korpus musí mít konfigurační soubor. Konfigurační soubory pro jednotlivé korpusy jsou uloženy v /corpora/registry/<jméno korpusu>
. Soubor obsahuje mimo jiné tyto položky:
PATH "/corpora/manatee/czes" VERTICAL "/corpora/vert/czes/czes.vert" LANGUAGE "Czech" ENCODING "utf-8"
PATH
popisuje cestu ke zkompilovanému korpusu, VERTICAL
je cesta k vertikálu, LANGUAGE
obsahuje označení jazyka, ENCODING
určuje použité kódování vertikálu.
Kofigurační soubor pokračuje popisem gramatických relací pro SketchEngine:
WSDEF "/home/xnemcik/public_html/pub/ws-syn2k-ajka_v6.txt"
Následují atributy:
ATTRIBUTE word ATTRIBUTE lemma ATTRIBUTE tag
A struktury:
STRUCTURE g { DISPLAYTAG 0 DISPLAYBEGIN "_EMPTY_" } STRUCTURE head
Vysvětlení k jednotlivým položkám konfiguračního souboru na najdete v dokumentaci SketchEngine.