= Pro zájemce o doktorské studium = #Den_otev.2BAVk-en.2BAP0-ch_dve.2BAVkA7Q_pro_z.2BAOE-jemce_o_doktorsk.2BAOk_studium Centrum zpracování přirozeného jazyka (CZPJ) je jedno z pracovišť na [http://www.fi.muni.cz FI MU]. Jsme také jedno z nejlepších pracovišť zabývajících se [[cs/ZpracovaniPrirozenehoJazyka|zpracováním přirozeného jazyka]] v ČR. == Lidé == #Lid.2BAOk- Centrum ZPJ má dva školitele (doc. Aleš Horák, Ph.D., doc. Pavel Rychlý, Ph.D.), několik postdoků (Pavel Šmerk, Vojtěch Kovář, Vít Suchomel, Marek Medveď) a několik Ph.D. studentů. Studují u nás studenti programu Umělá inteligence a zpracování dat (FI) a Český jazyk a počítačová lingvistika (FF), kterým vedeme závěrečné kvalifikační práce. == Stroje == #Stroje Současné vybavení: * 15 GPU karet * diskové pole IBM DS3512 o kapacitě 92 TB složené z 2TB disků („neRAIDovaná“ kapacita) * desktopy: 8 GB RAM, 2 TB disky a procesor core i7 * 2 4socketové 12jádrové (AMD 6238) servery, každý s kapacitou 32 GB RAM * možnost využití výpočetní síly z [http://www.cerit-sc.cz/cs/index.html CERIT-Scientific Cloud]. == Prostředí == #Prost.2BAVk-ed.2BAO0- Máme 2 místnosti na FI pro studenty pracující na projektech v CZPJ (B203, B206). Většina doktorandů se často a aktivně účastní prestižních mezinárodních konferencí, např.: * COLING - International Conference on Computational Linguistics * [http://www.eacl.org/ EACL] - European Chapter of the ACL * [http://www.euralex.org/ Euralex] - European Association for Lexicography * [http://www.lrec-conf.org/ LREC] - International Conference on Language Resources and Evaluation * PACLIC - Pacific Asia Conference on Language, Information and Computation * [http://www.tsdconference.org/ TSD] - International Conference on Text, Speech and Dialogue Lidé z CZPJ patří do programových rad některých konferencí či mezi recenzenty nebo pomocné recenzenty (''subreviewers''). NLP lab pořádá každoročně [https://raslan.nlp-consulting.net/ workshop RASLAN] - Recent Advances in Slavonic NLP. == Projekty == #Projekty [[cs/GrantoveProjekty|přehled grantových projektů]] == Témata == #T.2BAOk-mata Pracujeme hlavně v oblastech: * využití a tvorba velkých jazykových modelů (LLM) * morfologická analýza (ajka, desamb, guesser, příručka) * syntaktická analýza (synt, SET, DIS) * sémantická analýza (anaphora resolution, sémantické sítě, common sense, opinion mining, kvantitativní analýza textu) * logická analýza (vyplývání, transparentní intenzionální logika) * lexikální zdroje (named entities, multi-word expressions, sémantické sítě) * strojový překlad (česko-slovenský, altrnativní přístupy ke Google Translate) * umělá inteligence (rozhodování, agentové systémy, umělí hráči) * zpracování velkých dat Software, který se používá (i jinde než u nás): * jazykové inženýrství (czaccent, příručka) * korpusové nástroje (Sketch Engine, Corpus Builder) * lexikální nástroje (DEB, slovník současné češtiny) [[cs/LangToolsLinks|software k vyzkoušení]]