# Copyright 2008 Vojtech Kovar # # This file is part of SET. # # SET is free software: you can redistribute it and/or modify # it under the terms of the GNU General Public License as published by # the Free Software Foundation, either version 3 of the License, or # (at your option) any later version. # # SET is distributed in the hope that it will be useful, # but WITHOUT ANY WARRANTY; without even the implied warranty of # MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the # GNU General Public License for more details. # # You should have received a copy of the GNU General Public License # along with SET. If not, see . # This is the SET grammar for Czech ############################################################################## # word classes / aliases # "verb", "noun", "prep" and "adj" are used by the parser internally, so # it is a good idea to define them # for --marx option, the following must be defined in addition: # "pron", "num", "adv", "abbr", "conj", "part", "punct" # (if some of them does not exist in the tagset, just use a never-matching tag) CLASS noun (tag k1) CLASS adj (tag k2) CLASS comma (word ,|-) CLASS verbfin (tag k5.*m[IBRAPN]) CLASS verb (tag k5) CLASS modalverb (lemma být|bývat|mít|chtít|moci|muset|smět|hodlat|umět|dovést|dokázat|troufnout|dát|nechat|možno|nutno|lze|) CLASS vpart (word by|bychom|byste|bych|bys) CLASS prep (tag k7) CLASS num (tag k4) CLASS infinitive (tag k5.*mF) CLASS pron (tag k3) CLASS adv (tag k6) CLASS abbr (tag kA) CLASS conj (tag k8) CLASS part (tag k9) CLASS punct (tag kI) ############################################################################## ::: relative clauses ::: # and other... TODO redesign labels ############################################################################## ::: coordinations ::: ################### negative rules ####################################### TMPL: (word co) (tag .*d3.*) MARK 0 HEAD 0 PROB 1000 ################### positive rules ####################################### # myslim, ze TMPL: $NEG $CONJ MARK 1 HEAD 1 $CONJ(tag): k8.*xS $CONJ(word not): i jako než či jak $NEG(lemma not): a co přinejmenším $NEG(word not): * dále i ale jen $NEG(tag not): k8.*xS # maly, ale sikovny TMPL: $NEG $CONJ MARK 1 HEAD 1 $CONJ(word): neboť avšak aby kdyby případně resp resp. respektive tj. tj abych abys abychom kdybych kdybys kdybychom $NEG(word not): i ale přesto neboť avšak aby kdyby případně například resp resp. respektive * zřejmě tj. tj např. např jen místo $NEG(tag not): k7 k3.*y[RQ] k6.*y[RQ] k8 # nevi, ma-li prijit TMPL: (tag .*) (word -) (word li) MARK 0 HEAD 0 # bylo jich 14, z toho 11 blbych TMPL: (word z) (word toho) (tag k4) MARK 0 HEAD 0 # ale zda TMPL: $W $CONJ MARK 0 HEAD 0 $CONJ(tag): k8.*xS $CONJ(word not): i jako než či jak $W(word): přinejmenším i jen ale # prinejmensim kdyby TMPL: $W $CONJ MARK 0 HEAD 0 $CONJ(word): aby kdyby ale přesto když $W(word): přinejmenším zřejmě i jen místo # prsi, a proto jdeme domu TMPL: $1 $2 MARK 0 HEAD 0 MATCH $1(word) $2(word) a to a tak a tedy a proto ať už to jest jako je jako například a ne a dokonce a tudíž a tím dokonce ani tak jak # a přitom END ############################################################################## ::: dependencies :::