alib_wrap.c

[ Python Module : alib ]

Contents


1. Lemmatization options (taken from alib.h)

GETNULL = 1

[ Constant: int ]
no special lemma

GETPREF = 2

[ Constant: int ]
returns lemma with prefix "ne" nejely --> nejet, jet otherwise

GETPOST = 4

[ Constant: int ]
returns lemma with postfix komusi --> kdosi, kdo otherwise

GETPOSS = 8

[ Constant: int ]
for possesives returns possesive as lemma otcovy --> otcuv, otec otherwise

GETNUMS = 16

[ Constant: int ]
for numerativa returns lemma of the same kind paterem --> patero, pet otherwise

GETDEVE = 32

[ Constant: int ]
for substantives and adjectives derivated from verbs returns lemma of the same kind ctenim --> cteni, udelanemu --> udelany, cist, udelat otherwise

GETADVE = 64

[ Constant: int ]
for adverb derivated from adjective returns adverb rychle --> rychle, rychly otherwise

GETREFL = 128

[ Constant: int ]
for reflexive verbs returns "(se/si)" string after the lemma, otherwise it returns lemma

GETMINI = ((2)|(4))

[ Constant: int ]

GETNORM = ((4)|(8))

[ Constant: int ]

GETMAXI = ((((4)|(8)))|(16)|(32)|(64)|(128))

[ Constant: int ]

2. Generation options (taken from alib.h)

GENNEGA = 1

[ Constant: int ]
generate negative forms

GENCOMP = 2

[ Constant: int ]
generate comparative forms

GENSUPR = 4

[ Constant: int ]
generate superlative forms

GENCONN = 8

[ Constant: int ]
generate connective forms (česko-)

GENNUMP = 16

[ Constant: int ]
generate numeric prefixes (dvoj-)

GENCOLL = 32

[ Constant: int ]
generate colloquial forms

GENMINI = 0

[ Constant: int ]
no special generation

GENNORM = ((1)|(2)|(4))

[ Constant: int ]

GENMAXI = ((1)|(2)|(4)|(8)|(16)|(32))

[ Constant: int ]

3. Třída alib

3.1. class alib

[ created from struct alib ]

self.morf

[ Member data: returns void * ]
interní informace

self.cnt

[ Member data: returns int ]
počet homonym při posledním `check'

alib(mrff,stmf)

[ Constructor: returns alib * ]

del this

[ Destructor: returns void ]

spell(word)

[ Member : returns int ]
testuje existenci slova ve slovníku

accent(word)

[ Member : returns char * ]
vrátí všechny možné slova s případnými akcenty, slova jsou odděleny čárkou

check(word)

[ Member : returns int ]
otestuje slovo, vrací počet homonym; následně lze použít: para, segm, lemm, lemmata, tags, allw

para(i)

[ Member : returns int ]
číselný identifikátor vzoru i-tého homonyma

segm()

[ Member : returns char * ]
vrátí segmentace jednotlivých homonym oddělené čárkou

lemm(i,lopt)

[ Member : returns char * ]
vrátí základní tvar i-tého homonyma

lemmata(lopt)

[ Member : returns char * ]
vrátí základní tvary jednotlivých homonym oddělené čárkou

tags(i)

[ Member : returns char * ]
vrátí všechny možné značky i-tého homonyma

note(i);

[ Member : returns char * ]
vrátí všechny možné poznámky i-tého homonyma

allw(i,gopt)

[ Member : returns char * ]
vrátí všechny možné slovní tvary i-tého homonyma