Čeština
English
  • Vítejte na stránkách NLP Centra!
  • Zapojte se do vývoje softwarových nástrojů!
  • Analýza přirozeného jazyka
  • Vyzkoušejte si korpusy o velikosti knihoven online!
  • Studujte jednu ze specializací!
  • Členové laboratoře

Pro zájemce o doktorské studium

Centrum zpracování přirozeného jazyka (CZPJ) je jedno z pracovišť na MU]. Jsme také jedno z nejlepších pracovišť zabývajících se zpracováním přirozeného jazyka v ČR.

Lidé

Centrum ZPJ má tři školitele (doc. PhDr. Karel Pala, CSc., doc. Aleš Horák Ph.D., doc. RNDr. Petr Sojka Ph.D.), několik postdoků (Marek Grác, Dana Hlaváčková, Pavel Rychlý, Pavel Šmerk, Vojtěch Kovář, Zuzana Nevěřilová), spoustu Ph.D. studentů. Studují u nás studenti oborů Umělá inteligence a zpracování přirozeného jazyka (FI) a Český jazyk a počítačová lingvistika (FF), kterým vedeme závěrečné kvalifikační práce.

Stroje

Současné vybavení:

  • diskové pole IBM DS3512 o kapacitě 92 TB složené z 2TB disků („neRAIDovaná“ kapacita)
  • desktopy: 8 GB RAM, 2 TB disky a procesor core i7
  • 2 4socketové 12jádrové (AMD 6238) servery, každý s kapacitou 32 GB RAM
  • možnost využití výpočetní síly z CERIT-Scientific Cloud.

Prostředí

Máme 2 místnosti na FI pro studenty pracující na projektech v CZPJ (B203, B206).

Většina doktorandů se často a aktivně účastní prestižních mezinárodních konferencí, např.:

  • CICLing - Conference on Intelligent Text Processing and Computational Linguistic
  • COLING - International Conference on Computational Linguistics
  • EACL - European Chapter of the ACL
  • Euralex - European Association for Lexicography
  • GWC - Global Wordnet Conference
  • LREC - International Conference on Language Resources and Evaluation
  • LTC - Language & Technology Conference
  • NLPCS - International Workshop on Natural Language Processing and Cognitive Science
  • PACLIC - Pacific Asia Conference on Language, Information and Computation
  • TSD - International Conference on Text, Speech and Dialogue

Lidé z CZPJ patří do programových rad některých konferencí či mezi recenzenty nebo pomocné recenzenty (subreviewers).

Místní konference:

  • Kognice
  • Kolokvium mladých jazykovedcov
  • Slovko
  • Korpusová lingvistika

Řada sborníků z těchto konferencí je v ISI Web of Knowledge.

Spolupořádáme konferenci TSD. Pořádáme workshop RASLAN - Recent Advances in Slavonic NLP.

Projekty

přehled grantových projektů

Témata

Pracujeme hlavně v oblastech:

  • morfologická analýza (ajka, desamb, guesser, příručka)
  • syntaktická analýza (synt, SET, DIS)
  • sémantická analýza (anaphora resolution, sémantické sítě, common sense, opinion mining, kvantitativní analýza textu)
  • logická analýza (vyplývání, transparentní intenzionální logika)
  • lexikální zdroje (named entities, multi-word expressions, sémantické sítě)
  • strojový překlad (česko-slovenský, altrnativní přístupy ke Google Translate)
  • umělá inteligence (rozhodování, agentové systémy, umělí hráči)
  • zpracování velkých dat

Software, který se používá (i jinde než u nás):

  • jazykové inženýrství (czaccent, příručka)
  • korpusové nástroje (Sketch Engine, Corpus Builder)
  • lexikální nástroje (DEB, slovník současné češtiny)

software k vyzkoušení