en/AdvancedNlpCourse2018/AutomaticCorrection: punct.set

File punct.set, 3.5 KB (added by Ales Horak, 15 months ago)
Line 
1# Copyright 2008 Vojtech Kovar
2#
3# This file is part of SET.
4#
5# SET is free software: you can redistribute it and/or modify
6# it under the terms of the GNU General Public License as published by
7# the Free Software Foundation, either version 3 of the License, or
8# (at your option) any later version.
9#
10# SET is distributed in the hope that it will be useful,
11# but WITHOUT ANY WARRANTY; without even the implied warranty of
12# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
13# GNU General Public License for more details.
14#
15# You should have received a copy of the GNU General Public License
16# along with SET.  If not, see <http://www.gnu.org/licenses/>.
17
18
19# This is the SET grammar for Czech
20
21##############################################################################
22# word classes / aliases
23
24# "verb", "noun", "prep" and "adj" are used by the parser internally, so
25# it is a good idea to define them
26# for --marx option, the following must be defined in addition:
27#   "pron", "num", "adv", "abbr", "conj", "part", "punct"
28# (if some of them does not exist in the tagset, just use a never-matching tag)
29
30CLASS noun (tag k1)
31CLASS adj (tag k2)
32CLASS comma (word ,|-)
33CLASS verbfin (tag k5.*m[IBRAPN])
34CLASS verb (tag k5)
35CLASS modalverb (lemma být|bývat|mít|chtít|moci|muset|smět|hodlat|umět|dovést|dokázat|troufnout|dát|nechat|možno|nutno|lze|)
36CLASS vpart (word by|bychom|byste|bych|bys)
37CLASS prep (tag k7)
38CLASS num (tag k4)
39CLASS infinitive (tag k5.*mF)
40CLASS pron (tag k3)
41CLASS adv (tag k6)
42CLASS abbr (tag kA)
43CLASS conj (tag k8)
44CLASS part (tag k9)
45CLASS punct (tag kI)
46
47
48##############################################################################
49::: relative clauses :::
50# and other... TODO redesign labels
51
52
53
54##############################################################################
55::: coordinations :::
56
57################### negative rules #######################################
58
59TMPL: (word co) (tag .*d3.*)  MARK 0 <n>  HEAD 0  PROB 1000
60
61
62################### positive rules #######################################
63
64# myslim, ze
65TMPL: $NEG $CONJ  MARK 1 <c>  HEAD 1
66    $CONJ(tag): k8.*xS
67    $CONJ(word not): i jako než či jak
68    $NEG(lemma not): a co přinejmenším
69    $NEG(word not): * dále i ale jen
70    $NEG(tag not): k8.*xS
71
72# maly, ale sikovny
73TMPL: $NEG $CONJ  MARK 1 <c>  HEAD 1
74    $CONJ(word): neboť avšak aby kdyby případně resp resp. respektive tj. tj abych abys abychom kdybych kdybys kdybychom
75    $NEG(word not): i ale přesto neboť avšak aby kdyby případně například resp resp. respektive * zřejmě tj. tj např. např jen místo
76
77
78    $NEG(tag not): k7 k3.*y[RQ] k6.*y[RQ] k8
79    $NEG(word not): a * " tak přitom
80
81
82# nevi, ma-li prijit
83TMPL: (tag .*) (word -) (word li)  MARK 0 <c>  HEAD 0
84
85# bylo jich 14, z toho 11 blbych
86TMPL: (word z) (word toho) (tag k4)  MARK 0 <c>  HEAD 0
87
88# ale zda
89TMPL: $W $CONJ  MARK 0 <c>  HEAD 0
90    $CONJ(tag): k8.*xS
91    $CONJ(word not): i jako než či jak
92    $W(word): přinejmenším i jen ale
93
94# prinejmensim kdyby
95TMPL: $W $CONJ  MARK 0 <c>  HEAD 0
96    $CONJ(word): aby kdyby ale přesto když
97    $W(word): přinejmenším zřejmě i jen místo
98
99# prsi, a proto jdeme domu
100TMPL: $1 $2  MARK 0 <c>  HEAD 0
101
102MATCH $1(word) $2(word)
103    a to
104    a tak
105    a tedy
106    a proto
107    ať už
108    to jest
109    jako je
110    jako například
111    a ne
112    a dokonce
113    a tudíž
114    a tím
115    dokonce ani
116    tak jak
117#    a přitom
118END
119
120
121##############################################################################
122::: dependencies :::
123
124
125