English English
UVODNI STRANKA REJSTRIK VYHLEDAVANI

Morfologický analyzátor ajka – nápověda


Obsah


Interaktivní režim

Interaktivní režim je jedním z režimů práce ajky. Zde je možné si vybrat ze 3 zpracování vloženého textu:

  • Akcentovat
  • Segmentovat
  • Analyzovat
Akcentovat - zobrazí se tabulka se všemi akcentovanými tvary, které lze dále analyzovat.
Segmentovat - zobrazí základní tvar spolu s vlastní segmentací.
Analyzovat - provede samotnou morfologickou analýzu slova. Zobrazí se základní tvar, segmentace, číslo vzoru a gramatické kategorie k němu příslušející. U základního tvaru naleznete odkaz '(*)', který přehledně vypíše všechny možné odvozené tvary. Krome čísla vzoru jsou všechny položky v tabulce klikací, přičemž po zakliknutí získáte další informace jako je např. vysvětlení gramatických značek.

Dávkový režim

Dávkový režim je druhým režimem, ve kterém může analyzátor ajka pracovat. Hlavní činností zde je morfologická analýza celého souboru, jejíž výstup je řízen formátovacím řetězcem.

Formátovací řetězec je řetězec podobný formátovacím řetězcům v jazyce C. Jeho tvar je vysvětlen na samotných stránkých.

Typy akceptovaných souborů jsou rovněž vypsány na stránkách. Délka vstupního souboru není při vkládání omezena, nicméně analyzovat se bude první 2KB. Pokud máte zájem o analýzu delších souborů, je toto možné po domluvě mailem na nlpinfo\@aurora.fi.muni.cz

Výsledek analýzy je možné si prohlédnout v 'syrové' formě na obrazovce (zvolen výstup na obrazovku) nebo si výsledek stáhnout ve formátu .zip


Kódování češtiny

K překódování textů byl použit balík cstools, podle toho také vypadá "nabídka" kódování češtiny. K získání znaků s diakritikou v kódování Latex sekvence se používají tyto zápisy:

  • \\'{ZNAK} nebo \\'ZNAK - znaky s čárkou
  • \\v{ZNAK} - znaky s háčkem
  • \\accent23u, \\accent23{u}, \\accent23U, \\accent23{U} - 'U', 'u' s kroužkem ('ů','Ů')

Lematizační volby

Lematizační volby jsou přepínače ajky, kterými lze ovlivňovat, jakým způsobem se budou vypisovat základní tvary (lemmata) analyzovaných slov. Které slovní druhy to jsou a jak budou jejich lemmata ovlivňena nastavíte v přepínačích na stránce.


Logování neznámých slov

V obou režimech, jak v interaktivním, tak i dávkovém se může stát, že analyzátor vložený tvar nezná. V tomto případě je uživateli nabídnuta možnost přidat tento tvar do uživatelského slovníku neznámých tvarů. Pro toto je ale nutné, aby pro neznámé slovo určil odpovídající gramatické kategorie, přičemž přiřazování kategorií musí odpovídat určitým pravidlům. Po korektním přiřazení je slovo uloženo do databáze.


Morfologická analýza - interaktivní režim      Morfologická analýza - dávkový režim