Version 1 (modified by 11 years ago) (diff) | ,
---|
Konfigurace pro Manatee
Každý, kdo si vytvoří korpus a chtěl by, aby byl korpus dosažitelný pro Manatee, musí napsat konfigurační soubor. Konfigurační soubory pro jednotlivé korpusy jsou /corpora/registry/<jméno korpusu>
. Soubor začíná takto:
PATH "/corpora/manatee/czes" VERTICAL "/corpora/vert/czes/czes.vert" LANGUAGE "Czech" ENCODING "utf-8"
PATH
popisuje cestu ke korpusu, VERTICAL
je cesta k vertikálu, LANGUAGE
obsahuje označení jazyka, ENCODING
je druh kódování.
Kofigurační soubor pokračuje popisem gramatických relací pro SketchEngine:
WSDEF "/home/xnemcik/public_html/pub/ws-syn2k-ajka_v6.txt"
Následují atributy:
ATTRIBUTE word { LOCALE "cs_CZ" TYPE "FD_FGD" } ATTRIBUTE lemma { LOCALE "cs_CZ" TYPE "FD_FGD" } ATTRIBUTE tag { TYPE "FD_FGD" }
A struktury:
STRUCTURE g { DISPLAYTAG 0 DISPLAYBEGIN "_EMPTY_" } STRUCTURE head
Vysvětlení k jednotlivým položkám konfiguračního souboru na http://trac.sketchengine.co.uk/wiki/SkE/Config/FullDoc.