Version 2 (modified by 9 years ago) (diff) | ,
---|
Den otevřených dveří pro zájemce o doktorské studium
Jsme jedno z nejlepších pracovišť na FI MU. Jsme také jedno z nejlepších pracovišť zabývajících se NLP v ČR.
Lidé
Centrum ZPJ má tři školitele (doc. PhDr. Karel Pala, CSc., doc. Aleš Horák Ph.D., doc. RNDr. Petr Sojka Ph.D.), 7 Ph.D. (Dana Hlaváčková, Aleš Horák, Juyeon Kang, Eva Mráková, Jan Pomikálek, Pavel Rychlý, Pavel Šmerk), spoustu Ph.D. studentů. Studují u nás studenti oborů Umělá inteligence a zpracování přirozeného jazyka (FI) a Český jazyk a počítačová lingvistika (FF), kterým vedeme závěrečné kvalifikační práce.
Stroje
Současné vybavení:
- diskové pole IBM DS3512 o kapacitě 92 TB složené z 2TB disků (,,neRAIDovaná kapacita)
Chystané aktualizace HW:
- desktopy, 8 GB RAM, 2 TB disky a procesor core i7
- 2 4socketové 12jádrové (AMD 6238) servery, každý s kapacitou 32 GB RAM
Možnost využití výpočetní síly z CERIT-Scientific Cloud.
Prostředí
Máme 2 místnosti na FI pro studenty pracující na projektech v NLP (B203, B206). Po přestavbě budovy FI budeme mít víc.
Většina doktorandů se často a aktivně účastní prestižních mezinárodních konferencí, např.:
- CICLing - Conference on Intelligent Text Processing and Computational Linguistic
- COLING - International Conference on Computational Linguistics
- EACL - European Chapter of the ACL
- Euralex - European Association for Lexicography
- GWC - Global Wordnet Conference
- LREC - International Conference on Language Resources and Evaluation
- LTC - Language & Technology Conference
- NLPCS - International Workshop on Natural Language Processing and Cognitive Science
- PACLIC - Pacific Asia Conference on Language, Information and Computation
- TSD - International Conference on Text, Speech and Dialogue
Místní konference:
- Kognice
- Kolokvium mladých jazykovedcov
- Slovko
Řada sborníků z těchto konferencí je v ISI Web of Knowledge.
Spolupořádáme konferenci TSD. Pořádáme workshop RASLAN - Recent Advances in Slavonic NLP.
Projekty
Pracujeme na projektech:
- LC536 - Centrum komputační lingvistiky (2005-2011, MSM/LC)
- GAP401/10/0792 - Temporální aspekty znalostí a informací (2010-2012, GA0/GA)
- 7E10057 - Pattern REcognition-based Statistically Enhanced MT (2010-2012, MSM/7E)
- VF20102014003 - Analýza přirozeného jazyka v prostředí internetu (2010-2014, MV0/VF)
- GA407/07/0679 - Právní e-slovník - PES
- EuDML - Evropská digitální matematická knihovna
Témata
Pracujeme hlavně v oblastech:
- morfologická analýza (ajka, desamb, guesser, příručka)
- syntaktická analýza (synt, SET, DIS)
- sémantická analýza (anaphora resolution, sémantické sítě, common sense, kvantitativní analýza textu)
- logická analýza (vyplývání, transparentní intenzionální logika)
- lexikální zdroje (named entities, multi-word expressions, sémantické sítě)
- strojový překlad (česko-slovenský, altrnativní přístupy ke Google Translate)
- umělá inteligence (rozhodování, agentové systémy, umělí hráči)
Software, který se používá (i jinde než u nás):
- jazykové inženýrství (czaccent, příručka)
- korpusové nástroje (Sketch Engine, Corpus Builder)
- lexikální nástroje (DEB, slovník současné češtiny)
Z toho plyne, že pracujeme nejen s jazykem, ale i obecněji s velkými daty.