Changes between Version 9 and Version 10 of cs/MainTopics
- Timestamp:
- Mar 6, 2014, 2:08:14 PM (10 years ago)
Legend:
- Unmodified
- Added
- Removed
- Modified
-
cs/MainTopics
v9 v10 2 2 3 3 Vyzkoušejte si některé naše jazykové nástroje: 4 * [http://prirucka.ujc.cas.cz/ Internetová jazyková příručka] 4 * [http://prirucka.ujc.cas.cz/ Internetová jazyková příručka] 5 * [https://the.sketchengine.co.uk/open/ Vyhledávání v textových korpusech] 5 6 * [http://nlp.fi.muni.cz/cz_accent/ CZ accent][[BR]] ''nástroj na doplňování diakritiky'' 6 7 * [http://nlp.fi.muni.cz/%7Expopelk/xplain/ X-Plain][[BR]] ''hra Activity s počítačem'' … … 33 34 ''Související projekty:'' 34 35 35 * [http://nlp.fi.muni.cz/ projekty/bonito/ Bonito]36 * [http://nlp.fi.muni.cz/trac/noske NoSketch Engine] 36 37 37 * [http://ske.fi.muni.cz/ Corpus Architect]38 * [http://ske.fi.muni.cz/ Lokální instalace Sketch Engine pro Masarykovu univerzitu] 38 39 39 * [http://www.sketchengine.co.uk/ WordSketch Engine]40 * [http://www.sketchengine.co.uk/ Sketch Engine] 40 41 41 42 * [http://nlp.fi.muni.cz/projekty/cpa/ CPA] … … 49 50 * [http://radimrehurek.com/gensim/index.html Gensim] 50 51 52 51 53 ''Související články:'' 52 54 … … 55 57 56 58 == Slovníky == #dict 57 [[Image(deb dict2.0_small.png,align=right)]]59 [[Image(debII_slovniky.png, 400px, align=right)]] 58 60 Slovníky jsou odjakživa základní pomůckou jazykovědců. Ovšem práce s nimi v papírové podobě je zdlouhavá a nepraktická. Proto jedním z prvních projektů CZPJ byla digitalizace klasických slovníků spisovného jazyka a vývoj souboru pokročilých nástrojů pro zpracování slovníkových dat označovaných souhrnně jako lexikografická stanice. Jedná se o systém, který umožní odbornému uživateli pohodlný přístup k mnoha různým lingvistickým zdrojům a poskytne mu aplikační prostředí pro vyhledávání a editaci dat. 59 61 … … 76 78 77 79 == Morfologie == #morph 78 [[Image(m orph1.1_small.png, 200px, align=left)]]80 [[Image(majka.png, 200px, align=left)]] 79 81 80 82 Morfologická analýza je základním prostředkem zkoumání přirozeného jazyka a zabývá se rozlišováním a generováním správných gramatických tvarů slovních výrazů, které vzniknou skloňováním a časováním. Výsledkem je sada značek, které popisují gramatické kategorie daného tvaru, zejména pak základní tvar (lemma) a slovní vzor. Automatické rozlišení tvaru slova ve volném textu lze využít při vývoji gramatického korektoru, jako pomůcka při značkování korpusů nebo při poloautomatickém vytváření slovníků. Největší problém v této oblasti je morfologická desambiguace (zjednoznačňování gramatické značky) - tedy jak automaticky rozlišit, zda slovo "jedu" označuje sloveso nebo podstatné jméno. 81 83 82 V CZPJ byl vytvořen obecný morfologický analyzátor pro češtinu '''''" ajka"''''' pokrývající slovní zásobu s více než 6 milióny slovních tvarů. Díky němu vznikly podobný analyzátor pro slovenštinu, gramatický korektor '''''"fispell"''''', převodník ascii textu na text s diakritikou '''''"czaccent"''''' nebo interaktivní rozhraní pro IM protokol Jabber.84 V CZPJ byl vytvořen obecný morfologický analyzátor pro češtinu '''''"Majka"''''' pokrývající slovní zásobu s více než 6 milióny slovních tvarů. Díky němu vznikly podobný analyzátor pro slovenštinu, gramatický korektor '''''"fispell"''''', převodník ascii textu na text s diakritikou '''''"czaccent"''''' nebo interaktivní rozhraní pro IM protokol Jabber. 83 85 84 86 ''Související projekty:'' 85 87 86 * [http://nlp.fi.muni.cz/ projekty/ajka/ Ajka]88 * [http://nlp.fi.muni.cz/czech-morphology-analyser Majka] [http://nlp.fi.muni.cz/projekty/wwwajka (webové rozhraní)] 87 89 88 90 * [http://nlp.fi.muni.cz/ma/free.html Fajka (analyzátor s volnou versí dat)] … … 129 131 130 132 131 == Další informace == #Dal.2BAWEA7Q_informace133 == Další informace == 132 134 * [[Specializace| Předměty specializace Zpracování přirozeného jazyka]] 133 135