wiki:cs/KonfiguraceProManatee

Version 1 (modified by xkocinc, 10 years ago) (diff)

--

Konfigurace pro Manatee

Každý, kdo si vytvoří korpus a chtěl by, aby byl korpus dosažitelný pro Manatee, musí napsat konfigurační soubor. Konfigurační soubory pro jednotlivé korpusy jsou /corpora/registry/<jméno korpusu>. Soubor začíná takto:

PATH  "/corpora/manatee/czes"
VERTICAL "/corpora/vert/czes/czes.vert"
LANGUAGE "Czech"
ENCODING "utf-8"

PATH popisuje cestu ke korpusu, VERTICAL je cesta k vertikálu, LANGUAGE obsahuje označení jazyka, ENCODING je druh kódování.

Kofigurační soubor pokračuje popisem gramatických relací pro SketchEngine:

WSDEF "/home/xnemcik/public_html/pub/ws-syn2k-ajka_v6.txt"

Následují atributy:

ATTRIBUTE  word {
    LOCALE "cs_CZ"
  TYPE "FD_FGD"
}

ATTRIBUTE  lemma {
    LOCALE "cs_CZ"
  TYPE "FD_FGD"
}

ATTRIBUTE  tag {
  TYPE "FD_FGD"
}

A struktury:

STRUCTURE g {
    DISPLAYTAG 0
    DISPLAYBEGIN "_EMPTY_"
}
STRUCTURE  head

Vysvětlení k jednotlivým položkám konfiguračního souboru na http://trac.sketchengine.co.uk/wiki/SkE/Config/FullDoc.