# Copyright 2008 Vojtech Kovar
#
# This file is part of SET.
#
# SET is free software: you can redistribute it and/or modify
# it under the terms of the GNU General Public License as published by
# the Free Software Foundation, either version 3 of the License, or
# (at your option) any later version.
#
# SET is distributed in the hope that it will be useful,
# but WITHOUT ANY WARRANTY; without even the implied warranty of
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
# GNU General Public License for more details.
#
# You should have received a copy of the GNU General Public License
# along with SET. If not, see .
# This is the SET grammar for Czech
##############################################################################
# word classes / aliases
# "verb", "noun", "prep" and "adj" are used by the parser internally, so
# it is a good idea to define them
# for --marx option, the following must be defined in addition:
# "pron", "num", "adv", "abbr", "conj", "part", "punct"
# (if some of them does not exist in the tagset, just use a never-matching tag)
CLASS noun (tag k1)
CLASS adj (tag k2)
CLASS comma (word ,|-)
CLASS verbfin (tag k5.*m[IBRAPN])
CLASS verb (tag k5)
CLASS modalverb (lemma být|bývat|mít|chtít|moci|muset|smět|hodlat|umět|dovést|dokázat|troufnout|dát|nechat|možno|nutno|lze|)
CLASS vpart (word by|bychom|byste|bych|bys)
CLASS prep (tag k7)
CLASS num (tag k4)
CLASS infinitive (tag k5.*mF)
CLASS pron (tag k3)
CLASS adv (tag k6)
CLASS abbr (tag kA)
CLASS conj (tag k8)
CLASS part (tag k9)
CLASS punct (tag kI)
##############################################################################
::: relative clauses :::
# and other... TODO redesign labels
##############################################################################
::: coordinations :::
################### negative rules #######################################
TMPL: (word co) (tag .*d3.*) MARK 0 HEAD 0 PROB 1000
################### positive rules #######################################
# myslim, ze
TMPL: $NEG $CONJ MARK 1 HEAD 1
$CONJ(tag): k8.*xS
$CONJ(word not): i jako než či jak
$NEG(lemma not): a co přinejmenším
$NEG(word not): * dále i ale jen
$NEG(tag not): k8.*xS
# maly, ale sikovny
TMPL: $NEG $CONJ MARK 1 HEAD 1
$CONJ(word): neboť avšak aby kdyby případně resp resp. respektive tj. tj abych abys abychom kdybych kdybys kdybychom
$NEG(word not): i ale přesto neboť avšak aby kdyby případně například resp resp. respektive * zřejmě tj. tj např. např jen místo
$NEG(tag not): k7 k3.*y[RQ] k6.*y[RQ] k8
# nevi, ma-li prijit
TMPL: (tag .*) (word -) (word li) MARK 0 HEAD 0
# bylo jich 14, z toho 11 blbych
TMPL: (word z) (word toho) (tag k4) MARK 0 HEAD 0
# ale zda
TMPL: $W $CONJ MARK 0 HEAD 0
$CONJ(tag): k8.*xS
$CONJ(word not): i jako než či jak
$W(word): přinejmenším i jen ale
# prinejmensim kdyby
TMPL: $W $CONJ MARK 0 HEAD 0
$CONJ(word): aby kdyby ale přesto když
$W(word): přinejmenším zřejmě i jen místo
# prsi, a proto jdeme domu
TMPL: $1 $2 MARK 0 HEAD 0
MATCH $1(word) $2(word)
a to
a tak
a tedy
a proto
ať už
to jest
jako je
jako například
a ne
a dokonce
a tudíž
a tím
dokonce ani
tak jak
# a přitom
END
##############################################################################
::: dependencies :::