wiki:cs/KonfiguraceProManatee

Version 1 (modified by xkocinc, 10 years ago) (diff)

--

Konfigurace pro Manatee

Každý, kdo si vytvoří korpus a chtěl by, aby byl korpus dosažitelný pro Manatee, musí napsat konfigurační soubor. Konfigurační soubory pro jednotlivé korpusy jsou /corpora/registry/<jméno korpusu>. Soubor začíná takto:

PATH   "/corpora/manatee/czes"
VERTICAL "/corpora/vert/czes/czes.vert"
LANGUAGE "Czech"
ENCODING "utf-8"

PATH popisuje cestu ke korpusu, VERTICAL je cesta k vertikálu, LANGUAGE obsahuje označení jazyka, ENCODING je druh kódování.

Kofigurační soubor pokračuje popisem gramatických relací pro SketchEngine:

WSDEF "/home/xnemcik/public_html/pub/ws-syn2k-ajka_v6.txt"

Následují atributy:

ATTRIBUTE   word {
        LOCALE  "cs_CZ"
    TYPE "FD_FGD"
}

ATTRIBUTE   lemma {
        LOCALE  "cs_CZ"
    TYPE "FD_FGD"
}

ATTRIBUTE   tag {
    TYPE "FD_FGD"
}

A struktury:

STRUCTURE g {
        DISPLAYTAG 0
        DISPLAYBEGIN "_EMPTY_"
}
STRUCTURE   head

Vysvětlení k jednotlivým položkám konfiguračního souboru na http://trac.sketchengine.co.uk/wiki/SkE/Config/FullDoc.