wiki:cs/DODPhD

Version 1 (modified by xkocinc, 10 years ago) (diff)

--

Den otevřených dveří pro zájemce o doktorské studium

Jsme jedno z nejlepších pracovišť na FI MU. Jsme také jedno z nejlepších pracovišť zabývajících se NLP v ČR.

Lidé

Centrum ZPJ má dva školitele (doc. PhDr. Karel Pala, CSc., doc. RNDr. Petr Sojka Ph.D.), 7 Ph.D. (Dana Hlaváčková, Aleš Horák, Juyeon Kang, Eva Mráková, Jan Pomikálek, Pavel Rychlý, Pavel Šmerk), spoustu Ph.D. studentů. Studují u nás studenti oborů Umělá inteligence a zpracování přirozeného jazyka (FI) a Český jazyk a počítačová lingvistika (FF), kterým vedeme závěrečné kvalifikační práce.

Stroje

Současné vybavení:

  • diskové pole IBM DS3512 o kapacitě 92 TB složené z 2TB disků (,,neRAIDovaná kapacita)

Chystané aktualizace HW:

  • desktopy, 8 GB RAM, 2 TB disky a procesor core i7
  • 2 4socketové 12jádrové (AMD 6238) servery, každý s kapacitou 32 GB RAM

Možnost využití výpočetní síly z CERIT-Scientific Cloud.

Prostředí

Máme 2 místnosti na FI pro studenty pracující na projektech v NLP (B203, B206). Po přestavbě budovy FI budeme mít víc.

Většina doktorandů se často a aktivně účastní prestižních mezinárodních konferencí, např.:

  • CICLing - Conference on Intelligent Text Processing and Computational Linguistic
  • COLING - International Conference on Computational Linguistics
  • EACL - European Chapter of the ACL
  • Euralex - European Association for Lexicography
  • GWC - Global Wordnet Conference
  • LREC - International Conference on Language Resources and Evaluation
  • LTC - Language & Technology Conference
  • NLPCS - International Workshop on Natural Language Processing and Cognitive Science
  • PACLIC - Pacific Asia Conference on Language, Information and Computation
  • TSD - International Conference on Text, Speech and Dialogue

Místní konference:

  • Kognice
  • Kolokvium mladých jazykovedcov
  • Slovko

Řada sborníků z těchto konferencí je v ISI Web of Knowledge.

Spolupořádáme konferenci TSD. Pořádáme workshop RASLAN - Recent Advances in Slavonic NLP.

Projekty

Pracujeme na projektech:

  • LC536 - Centrum komputační lingvistiky (2005-2011, MSM/LC)
  • 7E10057 - Pattern REcognition-based Statistically Enhanced MT (2010-2012, MSM/7E)
  • VF20102014003 - Analýza přirozeného jazyka v prostředí internetu (2010-2014, MV0/VF)
  • EuDML - Evropská digitální matematická knihovna

Témata

Pracujeme hlavně v oblastech:

  • morfologická analýza (ajka, desamb, guesser, příručka)
  • syntaktická analýza (synt, SET, DIS)
  • sémantická analýza (anaphora resolution, sémantické sítě, common sense, kvantitativní analýza textu)
  • logická analýza (vyplývání, transparentní intenzionální logika)
  • lexikální zdroje (named entities, multi-word expressions, sémantické sítě)
  • strojový překlad (česko-slovenský, altrnativní přístupy ke Google Translate)
  • umělá inteligence (rozhodování, agentové systémy, umělí hráči)

Software, který se používá (i jinde než u nás):

  • jazykové inženýrství (czaccent, příručka)
  • korpusové nástroje (Sketch Engine, Corpus Builder)
  • lexikální nástroje (DEB, slovník současné češtiny)

Z toho plyne, že pracujeme nejen s jazykem, ale i obecněji s velkými daty.