| 1 | = Den otevřených dveří pro zájemce o doktorské studium = #Den_otev.2BAVk-en.2BAP0-ch_dve.2BAVkA7Q_pro_z.2BAOE-jemce_o_doktorsk.2BAOk_studium |
| 2 | Jsme jedno z nejlepších pracovišť na FI MU. Jsme také jedno z nejlepších pracovišť zabývajících se NLP v ČR. |
| 3 | |
| 4 | == Lidé == #Lid.2BAOk- |
| 5 | Centrum ZPJ má dva školitele (doc. !PhDr. Karel Pala, CSc., doc. RNDr. Petr Sojka Ph.D.), 7 Ph.D. (Dana Hlaváčková, Aleš Horák, Juyeon Kang, Eva Mráková, Jan Pomikálek, Pavel Rychlý, Pavel Šmerk), spoustu Ph.D. studentů. Studují u nás studenti oborů Umělá inteligence a zpracování přirozeného jazyka (FI) a Český jazyk a počítačová lingvistika (FF), kterým vedeme závěrečné kvalifikační práce. |
| 6 | |
| 7 | == Stroje == #Stroje |
| 8 | Současné vybavení: |
| 9 | |
| 10 | * diskové pole IBM DS3512 o kapacitě 92 TB složené z 2TB disků (!,,neRAIDovaná kapacita) |
| 11 | |
| 12 | |
| 13 | |
| 14 | Chystané aktualizace HW: |
| 15 | |
| 16 | * desktopy, 8 GB RAM, 2 TB disky a procesor core i7 |
| 17 | * 2 4socketové 12jádrové (AMD 6238) servery, každý s kapacitou 32 GB RAM |
| 18 | |
| 19 | Možnost využití výpočetní síly z [http://www.cerit-sc.cz/cs/index.html CERIT-Scientific Cloud]. |
| 20 | |
| 21 | == Prostředí == #Prost.2BAVk-ed.2BAO0- |
| 22 | Máme 2 místnosti na FI pro studenty pracující na projektech v NLP (B203, B206). Po přestavbě budovy FI budeme mít víc. |
| 23 | |
| 24 | Většina doktorandů se často a aktivně účastní prestižních mezinárodních konferencí, např.: |
| 25 | |
| 26 | * [http://www.cicling.org/ CICLing] - Conference on Intelligent Text Processing and Computational Linguistic |
| 27 | |
| 28 | |
| 29 | * COLING - International Conference on Computational Linguistics |
| 30 | * [http://www.eacl.org/ EACL] - European Chapter of the ACL |
| 31 | |
| 32 | |
| 33 | * [http://www.euralex.org/ Euralex] - European Association for Lexicography |
| 34 | |
| 35 | |
| 36 | * GWC - Global Wordnet Conference |
| 37 | * [http://www.lrec-conf.org/ LREC] - International Conference on Language Resources and Evaluation |
| 38 | |
| 39 | |
| 40 | * LTC - Language & Technology Conference |
| 41 | |
| 42 | |
| 43 | * NLPCS - International Workshop on Natural Language Processing and Cognitive Science |
| 44 | * PACLIC - Pacific Asia Conference on Language, Information and Computation |
| 45 | * [http://www.tsdconference.org/ TSD] - International Conference on Text, Speech and Dialogue |
| 46 | |
| 47 | |
| 48 | |
| 49 | Místní konference: |
| 50 | |
| 51 | * Kognice |
| 52 | * Kolokvium mladých jazykovedcov |
| 53 | * Slovko |
| 54 | |
| 55 | Řada sborníků z těchto konferencí je v ISI Web of Knowledge. |
| 56 | |
| 57 | Spolupořádáme konferenci TSD. Pořádáme workshop RASLAN - Recent Advances in Slavonic NLP. |
| 58 | |
| 59 | == Projekty == #Projekty |
| 60 | Pracujeme na projektech: |
| 61 | |
| 62 | * [http://www.isvav.cz/projectDetail.do?rowId=LC536 LC536] - Centrum komputační lingvistiky (2005-2011, MSM/LC) |
| 63 | |
| 64 | |
| 65 | * [http://www.isvav.cz/projectDetail.do?rowId=GAP401%2F10%2F0792 GAP401/10/0792] - Temporální aspekty znalostí a informací (2010-2012, GA0/GA) |
| 66 | |
| 67 | |
| 68 | * [http://www.isvav.cz/projectDetail.do?rowId=7E10057 7E10057] - Pattern REcognition-based Statistically Enhanced MT (2010-2012, MSM/7E) |
| 69 | |
| 70 | |
| 71 | * [http://www.isvav.cz/projectDetail.do?rowId=VF20102014003 VF20102014003] - Analýza přirozeného jazyka v prostředí internetu (2010-2014, MV0/VF) |
| 72 | |
| 73 | |
| 74 | * [http://www.isvav.cz/projectDetail.do?rowId=GA407%2F07%2F0679 GA407/07/0679] - Právní e-slovník - PES |
| 75 | |
| 76 | |
| 77 | * [http://nlp.fi.muni.cz/projekty/eudml/ EuDML] - Evropská digitální matematická knihovna |
| 78 | |
| 79 | |
| 80 | |
| 81 | == Témata == #T.2BAOk-mata |
| 82 | Pracujeme hlavně v oblastech: |
| 83 | |
| 84 | * morfologická analýza (ajka, desamb, guesser, příručka) |
| 85 | * syntaktická analýza (synt, SET, DIS) |
| 86 | * sémantická analýza (anaphora resolution, sémantické sítě, common sense, kvantitativní analýza textu) |
| 87 | * logická analýza (vyplývání, transparentní intenzionální logika) |
| 88 | * lexikální zdroje (named entities, multi-word expressions, sémantické sítě) |
| 89 | * strojový překlad (česko-slovenský, altrnativní přístupy ke Google Translate) |
| 90 | * umělá inteligence (rozhodování, agentové systémy, umělí hráči) |
| 91 | |
| 92 | Software, který se používá (i jinde než u nás): |
| 93 | |
| 94 | * jazykové inženýrství (czaccent, příručka) |
| 95 | * korpusové nástroje (Sketch Engine, Corpus Builder) |
| 96 | * lexikální nástroje (DEB, slovník současné češtiny) |
| 97 | |
| 98 | Z toho plyne, že pracujeme nejen s jazykem, ale i obecněji s velkými daty. |