Programme of the Laboratory Seminar in the past semesters
This page does not contain the program of the current seminar, it only shows the history of the past semesters of the Laboratory Seminar.
Seminar programme in the autumn semester 2023
date | programme |
20.9. | seminar programme for this semester |
---|---|
Aleš Horák: RASLAN 2023 Call for Papers | |
Ondřej Sotolář: SemEval task team call | |
Zuzana Nevěřilová: Scientist Night team call | |
27.9. | Ondřej Sotolář: Detection of supportive interactions in dialogs |
Pavel Rychly: 2nd Czech speech/NLP day | |
4.10. | Klara Vrabl: Digital Linguistics in Ljubljana |
Vítek Suchomel: Games for the Promotion of NLP to the Public. (10') Try and test the latest game before it's presented at Researchers' Night! (20', Czech only) | |
11.10. | Edoardo Signoroni: Report on the WMT2023 Low-resource Indic MT shared task |
18.10. | Petr Zelina: GPT for extraction of Side-Effects from pdf drug leaflets |
25.10. | Martin Habrovec (Seznam.cz): Image-Text Alignment: Learning Representations for Image Search |
1.11. | Radoslav Sabol: Expanding Stylometric Feature Set for Manipulative Style Recognition |
8.11. | Michal Spiegel: Machine generated text detection |
15.11. | Leonard Turčan: Authorship verification via cloze-test |
22.11. | David Porteš: Guding LLMs by speech melody |
Ondra Sotolář: EMNLP paper | |
29.11. | Adam Karásek: Authorship identification |
Krištof Anetta: Medical Text Analysis | |
6.12. | Edoardo Signoroni: Machine Translation Evaluation Metrics |
13.12. | Tomáš Houfek: Medical reports analysis |
Filip Brzý: Usage of LLMs in programming Pepper social robot |
Seminar programme in the spring semester 2023
date | programme |
14.2. | seminar programme for this semester |
---|---|
21.2. | Pavel Rychlý: Data Processing |
28.2. | Mauro Le Donne: Tokenisation of Italian Pre-trained Models |
Vítek Suchomel: Text processing in Linux – hands on example | |
7.3. | David Porteš: Discussion about Research Tools |
14.3. | Katarína Hudcovicová: Propaganda detection |
Ondřej Sotolář: Explainability Tools – link to presentation | |
21.3. | |
28.3. | Edoardo Signoroni: Overview of Low-Resource Machine Translation |
4.4. | Michal Měchura: Issues and challenges when encoding dictionaries on computers |
11.4. | Marek Medveď: Full AQA pipeline |
Krištof Anetta: Medical text content understanding | |
18.4. | Hien Thi Ha: Information extraction from scanned documents |
25.4. | Ondřej Metelka: Automatic morphological paradigm construction |
Radoslav Sabol: Optimizing the Inference of Neural Transformer Models | |
| |
2.5. | Tomáš Houfek: Czech Medical Language Model and Document Classification |
Petr Zelina: Medical Data Processing | |
9.5. | Michaela Denisová: Cross-lingual embedding models |
Ondřej Sotolář: Conference report: AISTATS, EACL |
Seminar programme in the autumn semester 2022
date | programme |
14.9. | seminar programme for this semester |
---|---|
Aleš Horák: RASLAN 2022 Call for Papers | |
21.9. | Vítek Novotný, Martin Geletka, Marek Toma, Petr Sojka: Report from CLEF 2022 |
Marek Medveď: SQAD+AQA | |
5.10. | Ondřej Sotolář: Psychological phenomena in dialogues |
Aleš Horák: Contract research with Azure Language Studio | |
12.10. | Petr Zelina: Patient similarity |
19.10. | Tereza Vrabcová: Machine translation of the FI MU website |
26.10. | Vítek Novotný: AHISTO NER |
2.11. | Edoardo Signoroni: High-frequency tokenizer |
| |
9.11. | Katarína Hudcovicová: Propaganda detection |
16.11. | Ondřej Metelka: Automatic morphological paradigm construction |
Radoslav Sabol: Propaganda Detection with Stylometry | |
23.11. | Ota Mikušek: Lingua - language detection tool and language detection in historical texts |
| |
30.11. | Yevhenii Karpizenkov: Processing of legal texts |
Samuel Wittlinger: Speaker identification | |
Krištof Anetta: Health records analysis | |
Mauro Le Donne: Word Blendings in Italian | |
7.12. | David Porteš: Multilingual neural representations |
Michaela Denisová: Cross-lingual embedding models | |
Veronika Andrlová: Training a Czech Discussion Robot | |
Dominik Tuchyňa: Source Code Processing |
Seminar programme in the spring semester 2022
date | programme |
16.2. | seminar programme for this semester |
---|---|
23.2. | Pavel Rychly: Modules for Machine Translation (MoMaT) |
Pavel Rychly: NLP data processing | |
2.3. | Zuzana Neverilova: Konica Minolta projects |
Michal Stary: Event Miner | |
Radoslav Sabol: Officebot | |
Ivan Hochman: Logo detection | |
9.3. | Rastislav Papčo: Topic classificaton in web corpora |
Vit Suchomel: Corpus Data Checks | |
16.3. | Greta Zella: Introduction |
Adam Hajek: Czech Summarization | |
Tomas Foltynek: Authorship verification (try it out) | |
23.3. | Tereza Vrabcova: Machine translation training |
Hien Thi Ha: OCRMiner | |
30.3. | Kristof Anetta: Electronic health records analysis |
6.4. | Ondrej Sotolar: Dialogue act classification |
13.4. | Ota Mikusek: Czech members of parliament sentence identification |
20.4. | Filip Bobek: OCR Evaluation |
Zuzana Nevěřilová: Invoice Mining | |
Mahmut Arslan: EHR processing | |
27.4. | Veronika Burgerova: Conversion between first and third person |
Marek Medveď: Unanswerable questions | |
4.5. | Kamila Samajova: Pepper app |
Daniel Kratky: Adding accents with the use of transformers | |
11.5. | Edoardo Signoroni: Sentence alignments - evaluation |
Filip Brukner: Enriching essays with generated attributes | |
Greta Zella: TBA |
Seminar programme in the autumn semester 2021
date | programme |
16.9. | seminar programme for this semester |
---|---|
Aleš Horák: RASLAN 2021 Call for Papers | |
23.9. | Vít Novotný: SIGIR 2021 and RANLP 2021 |
Adam Rambousek: AHISTO project | |
30.9. | Michaela Denisová: Crosslingual embedding models |
7.10. | Mikuláš Bankovič: Superresolution techniques for OCR |
14.10. | Rastislav Papčo: Topic classificaton in web corpora |
Edoardo Signoroni: Corpus alignment by machine translation techniques | |
21.10. | Dalibor Bačovský: Improving the Subword Model of fastText |
4.11. | Ondřej Sotolář: Facebook conversations classification |
Radoslav Sabol: Language identification and sentiment analysis for social network texts | |
11.11. | Tereza Vrabcová: Preparation of Parallel Corpora for Machine Translation |
Adam Hájek: Automatic text summarization using GPT-2 | |
18.11. | Petr Zelina: Czech transformers |
Samuel Špalek: Tokenizers: comparison of 'utok' and 'unitok' | |
25.11. | Marek Medveď: Answer Context in Question Answering |
Kristína Němcová: Multimodal machine learning | |
2.12. | Tomáš Houfek: Information extraction from medical records |
Daniel Krátký: Adding accents to Czech texts | |
9.12. | Krištof Anetta, Mahmut Arslan: Electronic health records processing |
Seminar programme in the spring semester 2021
date | programme |
2.3. | seminar programme for this semester |
---|---|
9.3. | Pavel Rychlý: projekt LINDAT/CLARIAH-CZ |
Pavel Rychlý: projekt strojového překladu | |
Pavel Rychlý: projekt generování slovníku | |
16.3. | Helena Medková: Zeugma Detection using Word Sketch |
Vítek Novotný: EDS-MEMBED: Multi-Sense Embeddings Based on Enhanced Distributional Semantic Structures via a Graph Walk over Word Senses | |
23.3. | Michal Štefánik: Unsupervised Estimation of Out-of-Domain Performance of Language Models |
Marek Medveď: SQAD database update | |
30.3. | Hien Thi Ha: Block type classification from scanned invoices |
Vítek Novotný: Combining log-bilinear language models with Transformers | |
6.4. | Tomáš Houfek: Vytěžování dat z lékařských zpráv |
13.4. | Mikuláš Bankovič: Application of super-resolution on OCR of historical documents |
Adam Hájek: výpočet GTP-2 na Metacentru | |
20.4. | Tereza Vrabcová: Parallel corpus from web pages |
Vítek Novotný: When FastText Pays Attention (preprint) | |
27.4. | Tereza Kinská: Creation of Judikatura corpora of court decisions |
Pavel Rychlý: Using Makefiles for NLP projects | |
4.5. | Petr Zelina: ALBERT Training with TensorFlow and PyTorch |
11.5. | Krištof Anetta: Electronic Health Records processing, Apache cTakes |
18.5. | Ondřej Sotolář: Building a Corpus for Personal Data Detection |
25.5. | Michal Starý: Event Detection |
Program semináře v podzimním semestru 2020
datum | program |
6.10. | program semináře na tento semestr |
---|---|
Aleš Horák: RASLAN 2020 Call for Papers | |
Aleš Horák: TSD 2020 | |
Zuzana Nevěřilová: Clarin conference 2020 | |
13.10. | Vítek Novotný: MIR@MU at ARQMath 2020 |
Vítek Novotný: Enhancing word embeddings: Positionality, subword sizes, and hyphenation | |
20.10. | Zuzana Nevěřilová: Information Extraction from Medical Forms |
27.10. | Hien Thi Ha: Contract information extraction |
Vítek Novotný: When Tesseract does it alone: OCR of medieval texts | |
3.11. | Helena Medková: Zeugma detection |
10.11. | Veronika Burgerová: Time and date extraction and normalization |
24.11. | Alexander Macinský: NL processing of Japanese for Dictionary Systems |
1.12. | Krištof Anetta: Electronic Health Records processing |
Adam Hájek: Automatic Text Summarization | |
8.12. | Radoslav Sabol: Officebot |
15.12. | Marek Medveď: Question Answering dataset SQAD |
5.1. | Marie Stará: Towards the evaluation of automatic explanations |
Petr Zelina: Transferring ALBERT from en to cs | |
12.1. | Ondřej Sotolář: Personal Data Anonymization |
Program semináře v jarním semestru 2020
datum | program |
19.2. | program semináře na tento semestr |
---|---|
26.2. | Aleš Horák: konference TSD 2020 |
Pavel Rychlý: LINDAT CLARIAH | |
Pavel Rychlý: Simplicity | |
4.3. | Miloš Jakubíček: Co je nového ve Sketch Engine a LCC |
11.3. | seminar cancelled due to COVID-19 regulations |
18.3. | seminar cancelled due to COVID-19 regulations |
25.3. | Samuel Gazda: Word game Ghost for the robot Pepper |
1.4. | Renáta Pivodová: Zpracování nových gramatických fenoménů v logické analýze PJ |
Michal Hala: Implementace efektivní sémantické sítě pro reprezentací znalostí | |
8.4. | Vít Novotný: Joint word embeddings and soft cosine measure at ARQMath |
15.4. | Veronika Burgerová: Paraphrase Generation for Czech |
22.4. | Marie Stará: Automatic creation of explanations |
Petr Zelina: Evaluating Czech ALBERT | |
6.5. | Michal Starý: Event Miner |
13.5. | Hien Thi Ha: Information extraction from contracts |
Program semináře v podzimním semestru 2019
Audio/video komentáře jsou k dipozici zde
datum | program |
17.9. | program semináře na tento semestr |
---|---|
Eniafe Festus Ayetiran: Research Intro | |
Ondřej Herman: RANLP conference | |
Petr Sojka: TUG conference and 25th Anniversary of FI MU | |
Aleš Horák: RASLAN 2019 Call for Papers | |
24.9. | Zuzana Nevěřilová: Summer Schools on Deep Learning |
Michal Měchura: NVH: Problems with XML/JSON/YAML and the ultimate solution. | |
8.10. | Vít Suchomel: Classification of Topics of Web Documents Using Fasttext's Supervised Learning on Classes and Data from dmoz.org |
Vít Suchomel: Active Learning Demo Shown at Night of Scientists | |
Presentation slides | |
Souležba na sedací soupravě jako příklad špatné lexikografie. | |
15.10. | Eniafe Festus Ayetiran: Multi-sense Embeddings |
22.10. | Pavel Rychlý: Meeting of the Czech Speech & NLP Community |
Luca Brigada Villa: Relations between syntactic dependency graphs and dependency parsing | |
29.10. | Vít Novotný: Text classification with word embedding regularization and soft similarity measure |
5.11. | Martin Víta: Figurative Language Paraphrasing |
12.11. | Martin Kroon: Towards the automatic detection of syntactic differences |
Veronika Burgerová: Evaluation and Error Analysis of Rule-based Paraphrase Generation for Czech | |
19.11. | Pavlína Klimešová: Neural networks for Czech sentiment analysis |
Pavlína Klimešová: BERT experiments with SQAD 2.0 and 3.0 | |
Hien Thi Ha: Information extraction from scanned invoices | |
26.11. | Michal Starý: TBA |
3.12. | Marie Stará: Automatically Created Definitions -- What's New |
Adam Hájek: Automatic Text Summarization | |
10.12. | Petr Zelina: Pretraining an (AL)BERT model |
17.12. | Ondra Herman: Word Senses |
Michala Vacíková: Online kurz počítačové lingvistiky |
Program semináře v jarním semestru 2019
datum | program |
20.2. | program semináře na tento semestr |
---|---|
Josef Plch: Substituční segmentér | |
27.2. | moved to April 10 |
Marek Medveď: ICAART 2019 | |
6.3. | Vít Suchomel: žánry |
Pavel Rychlý: word2vec - odkrývání magie Yoav Goldberg -- word embeddings | |
Monday 11.3. 12:00 | David Sears: Collocations in music? What systematic musicology can learn from corpus linguistics |
13.3. | Hien Thi Ha: NLP of Vietnamese |
20.3. | Marie Stará: Automatické vytváření definic |
27.3. | Vít Novotný: Trains of Thought in Informations Retrieval (10") |
Dávid Lupták: Effective Indexing, Searching and Querying of Structures (10") | |
Adam Rambousek: Systém pro tezaury odborné terminologie | |
3.4. | moved to April 24 |
10.4. | Tomasz Jadczyk: CardioCube - Conversational AI for cardiovascular patients |
Aleš Horák: robot Karel Pepper | |
17.4. | Martin Víta: Story Cloze Task, Facebook InferSent |
24.4. | Vit Novacek: Biomedical Discovery Informatics Using Knowledge Graphs |
Štěpán Balážik: Rozvrhbot s robotem Pepper | |
Petr Zelina: Better fasttext word embeddings for Czech | |
15.5. | Adam Bajger: neural PoS tagger with fastText embeddings |
Vítek Suchomel: Bigger, cleaner and richer web corpora | |
22.5. | Radoslav Sabol: Answer selection and GPU computing in Metacentrum |
Ondřej Svoboda: Lemmatizace a morfologické značkování korpusů historické češtiny (období 1300-1500) |
Program semináře v podzimním semestru 2018
datum | program |
20.9. | program semináře na tento semestr |
---|---|
27.9. | Ha, Hien Thi: Information extraction from scanned invoices |
4.10. | Pavel Rychly: Majka a DESAM |
11.10. | Pavel Rychlý: Makefile, Make, Mk (and how to use them in data processing) |
18.10. | Obluková, Barbora: TBA |
25.10. | mimořádně v A420 - Martin Víta: Pipeline selection in classification tasks (deep learning approaches) |
1.11. | Daša Kušniráková: Question/answer type extraction |
Ondřej Herman: Word sense shift detection | |
8.11. | Luboš Popelínský: Anomaly detection in text (after Guthries) |
15.11. | Zuzana Nevěřilová: EMNLP 2018 |
22.11. | Švárová, Nikola: Sentiment analysis |
Michal Měchura: Lexonomy (what is new) | |
29.11. | Vítek Suchomel: Bigger, cleaner and richer web corpora (writing a dissertation thesis in progress) |
6.12. | Marek Medveď: Towards new AQA version |
Vítek Baisa: Sentence alignment using Dijkstra | |
13.12. | Aleš Horák: What Karel Pepper can(not) do |
Program semináře v jarním semestru 2018
datum | program |
22.2. | program semináře na tento semestr |
---|---|
1.3. | Vojtěch Mrkývka: Outlier detection in US president speeches |
Zuzana Nevěřilová: Workshop PoznejFI for high school students | |
8.3. | Adam Rambousek: Towards - Thesauri for governmental offices |
15.3. | Pavel Veselý: Using NLP tools in anomaly detection |
22.3. | Vít Suchomel: New Czech web corpus, Web crawling, Genres in web documents |
29.3. | Zuzana Nevěřilová: CICLING 2018 |
5.4. | Vojta Kovář: On word sense induction (30') |
Ondřej Herman: On word sense induction II | |
12.4. | Matin Víta: Attention based CNNs for recognizing Faceted Entailment |
19.4. | Aleš Horák: On Siamese Neural Networks |
Terézia šulganová: Logical analysis of English sentences | |
Hien Thi Ha: Extracting structure of scanned invoices | |
26.4. | Josef Hlaváč, DGT EU: DGT, its way of working and its needs |
3.5. | Michal Měchura: What's new in Lexonomy |
Adam Gonda: Extrakce definic | |
Lucie Findejsová: Naming animal kinds and their representatives: patterns and their relationship to frequency | |
10.5. | Daša Kušniráková: Question classification |
Marek Medveď: ILP for outlier detection | |
17.5. | Marie Stará: Automatic creation of dictionary definitions |
Jiří Mauritz: Automatic Classification of Legal Documents |
Program semináře v podzimním semestru 2017
datum | program |
20.9. | program semináře na tento semestr |
---|---|
Noc vědců | |
27.9. | Marie Stará, Vojtěch Mrkývka: TransTech Summer School |
Michal Měchura: Grammatical Framework summer school | |
4.10. | Aleš Horák: RASLAN 2017 |
Louis Lecailliez: Multilingual dictionaries for mobile application use and East-Asian languages handling | |
Miloš Jakubíček: ELEXIS project | |
Miloš Jakubíček: New version of SketchEngine | |
11.10. | James Brown (What3Words): what3words: how words power tech-for-good |
18.10. | Martina Cvinčeková: Recommender systems for language learning with opinion mining |
Honza Rygl: Speech biometry in Phonexia (30 min), current autorstvi.cz demo (10 min) | |
Zuzana Nevěřilová: Short Report on Grants' Week (5 min), presentations | |
25.10. | Martin Víta: From project-reviewer matching to baseline for faceted textual entailment |
Louis Lecailliez: Multilingual dictionaries - first mobile prototype demo | |
1.11. | Vojtěch Mrkývka: Wikilinks |
8.11. | Wörgötter, Martin: Comparison of statistical and neural machine translation |
15.11. | Hien Ha Thi: OCR document classification |
22.11. | Zuzana Nevěřilová: Mývalit, topit, baštit - How to improve web corpus annotation |
29.11. | Moiz Khan Sherwani: Toponym disambiguation |
Terézia Šulganová: Logical analysis of English sentences | |
6.12. | Vítek Suchomel: crawler, czTenTen17?, žánry |
13.12. | Josef Šamánek: Automatic Text Summarization |
Marek Medveď: AQA |
Program semináře v jarním semestru 2017
datum | program |
22.2. | program semináře na tento semestr |
---|---|
HaBiT Corpus Annotation results | |
1.3. | Aleš Horák: Manipulativní techniky propagandy v době internetu |
Adam Rambousek, Michal Měchura: Budapešť COST meeting | |
Adam Rambousek, Michal Měchura: Nový český slovník | |
8.3. | Aleš Horák: Intergovernmental exchange programmes |
Ondřej Herman: Word embeddings using Fasttext | |
15.3. | Vítek Suchomel: Genre Identification of Documents in a Large Web Corpus |
22.3. | Aleš Horák: Joint Masters programme: Multilingual Digital Content studies |
29.3. | Zuzana Nevěřilová: Build It, Break It The Language Edition |
Aleš Horák: Environment for Communication-based AI, General AI Challenge, Machine Learning Meetup | |
Michal Měchura: Grammatical Framework | |
Marek Medveď: chatbot | |
5.4. | Zuzana Nevěřilová: NER |
12.4. | Lukáš Banič: Budovanie frázových tezaurov pomocou CQL dotazov a modifikácie word2vec-u |
19.4. | Lukáš Banič: POS-tagging using minimal training sets |
Marek Medveď: GoodAI | |
26.4. | Vojtěch Kovář: Sketch Grammar development by non-native speaker |
Michal Růžička: Sémantické vyhledávání dokumentů | |
3.5. | Vojtěch Mrkývka: TBA |
Michal Štefánik: Klasifikace témat webových dokumentů. Postup a vyhodnotenie úspešností. Praktické postrehy z použitia nástrojov (gensim-preprocessing, -word2vec, -doc2vec, sklearn, tensorflow pre NN). | |
10.5. | Petr Mejzlík: Editor vertikálu |
17.5. | Honza Rygl: Praktická demonstrace SIR (30 min) |
Terézia Šulganová: TIL | |
24.5. 13:00 | Miloš Jakubíček: a možná prijde i dizertačka;) (A víno, sýry a tak...) subtopic: Syntactic and Logical Analysis of Natural Language and its Evaluation Methods |
Program semináře v podzimním semestru 2016
datum | program |
21.9. | program semináře na tento semestr |
---|---|
Michal Měchura: Lexonomy | |
workshop na UAA | |
5.10. | |
12.10. | Vítek Suchomel: Web crawling, DSL competition, Active learning for genre identification |
19.10. | Pavel Rychly: Manatee |
26.10. | Blanka Hanzlová: Antroponyms in Facebook group LARP CZ |
Vít Baisa: obhajoba dizertace nanečisto (max 20 min) | |
2.11. | Ahmed Abdalla: Sentiment Polarity |
Tomaž Erjavec: Slovene Academic Texts: Prototype Corpus and Research Plan | |
9.11. | Ondra Svoboda: PoS Tagging evaluation |
16.11. | Adriana Babincova: Morphological variants - a problem of NLP |
23.11. | Jakub Machura: Automatic Punctuation Detection |
30.11. | Sandra Tukacova: Comparison of Czech and English WordNet(s) |
Nikola Ljubešić: The Tweet(Cat|Geo|Pub) suite for collecting, analysing and publishing Twitter corpora | |
Darja Fišer: The JANES toolchain for processing non-standard language | |
Honza Rygl: NN in NLP | |
7.12. | Adam Rambousek: Recent news from Institute of Czech Language |
Milos Jakubicek: TBA | |
14.12. | Marek Medved: AQA development |
Vojta Kovar: Wine, cheese, Christmas songs and syntax | |
chatbot projekt |
Program semináře v jarním semestru 2016
25.2. | program semináře na tento semestr |
---|---|
témata BP/DP | |
organizace TSD | |
výběr nlpassist | |
Habit: workshop v Addis Abeba | |
zpracování a značkování czTenTenu15 | |
soutěž v umělé inteligenci o 20 000 http://rare-technologies.com/competitions/rarebot/ | |
3.3. | Vojta Kovář: Řím a gold standardy |
10.3. | TextMiner |
info schuzka pro potencialni nove PGS | |
Miloš Jakubíček, Aleš Horák: nový český slovník | |
17.3. | Zuzka Nevěřilová: Annotation of MWEs and Foreign Words |
Marek Medveď: AQA: answer extraction | |
24.3. | Jitka Dvořáková: praktické využití českých korpusů při výuce na ZŠ |
31.3. | |
Ondřej Svoboda: „kde je plně označkovanej DESAM?“ | |
7.4. | Ondřej Svoboda: nástroj na měření chyb při změnách tagsetu/značkování |
nlpunix - vyhled HW | |
14.4. | Honza Rygl: Style & Identity Recognition |
Pavel Rychlý: Efektivita distribuovaných výpočtů | |
21.4. | Vítek Baisa: bajtové jazykové modely |
28.4. | Nikol Volková, Daniela Ryšavá: převod mezi CQL a přirozeným jazykem |
5.5. | Ján Švec: Aktuálne o korpusoch s metainformáciami |
12.5. | Vít Suchomel: 1. Protispamové úpravy v crawlingu. 2. Vlastnosti webových korpusů (homogenita, žánr dokumentu). |
19.5. | Pavel Šmerk: TBA (Tracheobronchial amyloidosis) |
Program semináře v podzimním semestru 2015
datum | program |
23.9. | doktorát Herzinger |
---|---|
Norské fondy - workshop na UAA | |
publikace | |
program semináře na tento semestr | |
Noc vědců | |
Pavel Šmerk: Derivanče | |
30.9. | nábytek do laboratoře |
Marek Medveď: konference RANLP | |
Marek Medveď: možnosti zařízení z Norských fondů | |
Vítek Baisa: rozhovor pro ruská média | |
7.10. | Honza Rygl: konference Data-Znalosti, workshop o Pythonu |
14.10. | děkanské volno - čestný doktorát prof.Herzingera |
21.10. | Michal Rott, TUL Liberec: Představení Laboratoře počítačového zpracování řeči |
Ján Švec: aktuálně o autorském korpusu | |
Zuzka Nevěřilová: Seminář o NooJ | |
4.11. | Vojta Kovář: anglický EFa |
11.11. | Vítek Baisa: aktuální výzkum TBC |
18.11. | Pavel Šmerk: Internetová jazyková příručka a obrana proti vykrádání |
25.11. | Zuzka Nevěřilová: něco o pojmenovaných entitách |
2.12. | Marek Medveď: Question Answering |
9.12. | Miloš Jakubíček: Nový český slovník |
16.12. | Vítek Suchomel: Vyhodnocení protispamových úprav v crawleru |
Program semináře v jarním semestru 2015
datum | program |
17.2. | program semináře na tento semestr |
---|---|
předmět Advanced NLP | |
meeting COST akce ENeL | |
24.2. | Mgr internship |
zahraniční PGS | |
Miloš Jakubíček: Vyhodnocování word sketchů (III), http://corpus.tools, správa dlouho běžících procesu ve SkE | |
3.3. | Zuzka Nevěřilová: workshop PARSEME |
Zuzka Nevěřilová: MWE | |
10.3. | Návrhy nových směrů na FI - do 31.3. |
Všichni: výstup na Milošovku :) | |
Lucia Kocincová: GAČR - info pro uchazeče o grant | |
Jana Rusinková: web NLP očami copywritera | |
17.3. | Winograd Schema Challenge |
Jana Rusinková: klasifikace dokumentů | |
Lucia Kocincová: vizualizace korpusových dat | |
24.3. | Vítek Suchomel: spam ve webových korpusech |
Honza Bušta: klasifikace Creative Language | |
31.3. | Business Research Forum MUNI |
Vítek Baisa: extrakce vícejazyčné terminologie | |
Vítek Baisa: novinky ve SketchEngine | |
Vítek Baisa: SemEval 2015, task 15: report | |
7.4. | Ján Švec: Automatické budovanie webového korpusu |
Tomáš Čapek: update k Sholva a Czechtris | |
14.4. | Provozní řád - přístup do serverovny |
Dita Salajková: Počítačová simulace sociální role | |
Honza Bušta: průběžné výstupy klasifikace Creative Language | |
21.4. | Vojta Kovář: Doplňování a korekce interpunkce v češtině |
Lucia Kocincová: new visualizations in Sketche Engine; usability testing and tracking tools | |
28.4. | Word Embeddings |
Ondra Svoboda: parser ijáček, parsování z pohledu slovosledu | |
5.5. | Marek Medveď: nové výsledky v QA |
Kristýna Zemková: jednoduše syntax a interpunkce | |
Vítek Baisa: překladoví kandidáti pomocí kolokací | |
12.5. | Honza Rygl: další aplikace SIR |
Adam Rambousek: DEBWrite - dictionary application in one-click |
Program semináře v podzimním semestru 2014
datum | program |
16.9. | program semináře na tento semestr |
---|---|
pokonferenční schůzka TSD | |
termín RASLAN 2014 | |
23.9. | Dana Hlaváčková: Návrh do OP VVV |
Vítek Baisa, Vojta Kovář, Zuzka Nevěřilová: workshop PLIN | |
Petr Machovec: Sumarizace textu krátce (5 min) | |
30.9. | Pepa Bušta: Rozšiřování překladových pamětí |
Pavel Rychlý: HaBiT project | |
Zuzka Nevěřilová: Jak proběhla Noc vědců | |
možnost úvazku extrakce informací | |
7.10. | Petr Sojka: Math Information Retrieval: Past, Present and Future |
14.10. | Vojtěch Kovář: Co se nevešlo do disertace |
Michal Růžička: Math Information Retrieval for Digital Libraries | |
21.10. | prof. Lu Qin from Hong Kong PolyU (with prof. Chu-Ren): Web Persons Disambiguation |
Hongkong study advertisements | |
4.11. | dr. Partha Pakray: Textual Entailment and Question Answering |
Pavel Šmerk: Přídavná jména od jmen místních | |
11.11. | Vít Baisa: Character-based language model |
Zuzka Nevěřilová: Prediktivní psaní | |
Vojta Kovář: Vybrané (a aktualizované) kapitoly z disertace | |
18.11. | Adam Rambousek: Aktuální slovníkové projekty platformy DEB |
Statistika příspěvků RASLAN 2014 | |
25.11. | Marek Medveď: Question Answering |
Tomáš Čapek: Czechtris | |
2.12. | Vítek Suchomel: Podobnost a stejnorodost (sub)korpusů |
9.12. | Honza Rygl: Rozpoznávání stylu pisatele |
16.12. | Petr Machovec: Sumarizace textu |
Miloš Jakubíček: wine & cheese & koledy |
Program semináře v jarním semestru 2014
datum | program |
18.2. | program semináře na tento semestr |
25.2. | Pavel Hančar: Hadoop a jine MapReduce v labu |
---|---|
Zuzka Nevěřilová: parafrázování a dr. Watsonson | |
4.3. | Vojta Kovář: něco o SETu |
Martin Čarnogurský: nové webové rozhraní pro Synt | |
11.3. | Vítek Suchomel et al: extrakce termínů |
Vítek Baisa: extrakce dvojjazyčné terminologie | |
Lucia Kocincová: NLP web - rýchla diskusia o zániku/ponechaní stránok | |
18.3. | Louis Wei-lun Lu, FF, MU: zpracování tchajwanštiny a čínštiny na MU |
Honza Bušta: nlpunix -- stav a vize :) | |
25.3. | NLP robot |
web nlp - pristup, notifikace, preklopeni? | |
Matej Pavla: Question answering se syntaktickou analýzou | |
Vojta Kovář: něco o SETu -- dokončení | |
1.4. | Adam Rambousek: Tezaurus pro katastr |
Štěpán Přichystal: Question Game | |
8.4. | Jiří Materna: LDA rámce (stav před odevzdáním disertace) |
15.4. | TSD - domluva na vyletu |
doplnit probehle prezentace! | |
22.4. | Vítek Suchomel: detekce spamu na webu |
Andrej Herich: Vyvozování znalostí v TIL | |
Zuzana Nevěřilová: CICLing | |
29.4. | workshop se seznamem |
clanky do casopisu | |
Honza Bušta: něco o neologismech a idiomech | |
6.5. | Lucia Kocincová: Parsovanie enTenTen aneb adaptácia MST a Malt Parseru na angličtinu |
Marek Medveď: slovenský synt | |
13.5. | Honza Rygl: autorství a kurz vedení vědeckého týmu |
Miloš Jakubíček: TBA |
Program semináře v podzimním semestru 2013
datum | příspěvky |
16. 9. | program semináře na tento semestr |
termíny RASLANu 2013 | |
web NLP -- co zbývá udělat? (Lucka, VítekB, Zuzka) | |
nákupy HW | |
trička NLP | |
23. 9. | Vítek Suchomel: stručné postřehy z konference Corpus Linguistics [10'] |
Pavel Rychlý, Miloš Jakubíček: Virtuální korpusy v Manatee [30'] | |
Pavel Rychlý, Miloš Jakubíček: META-FORUM 2013 a 2014 [15'] | |
30. 9. | Aleš Jiroudek: Možnosti paralelizace s platformou CUDA |
Zdeňka Sitová: Jak bylo na ESSLLI 2013 | |
Vít Baisa, Vojtěch Kovář, Miloš Jakubíček: Workshop pro PLIN v Baldovci [15'] | |
Zuzka Nevěřilová: Noc vědců | |
7. 10. | Aleš Horák: Info schůzka oborů UMI a PLIN, přednáška na kolokviu |
Vít Baisa: CAT a rozšiřování překladových pamětí | |
Lucia Kocincová: How to write competitive proposals | |
14. 10. | Tomáš Čapek: nejspis NLP portal |
21. 10. | Laboratorní seminář není dokonalý |
28. 10. | Státní svátek - Den vzniku samostatného Československa (1918) :) |
4. 11. | Zuzana Nevěřilová: Anotační hry/a |
Vojta Kovář: Novinky ve SkE, v SETu a vůbec :) | |
11. 11. | Vít Baisa: Novinky v CPA, SkE, drobnosti |
Lucia Kocincová: Jak propagovat nejen projekty | |
18. 11. | Martin Víta: Linked data in linguistics (a možná překlady inzerátů) |
Marek Medvěď: Lexikální analýza v Syntu | |
25. 11. | Vítek Suchomel: Spam v dokumentech z webu |
Jirka Materna: word2vec aneb statisticka semantika trochu jinak | |
2. 12. | Adam Rambousek: Slovník znakového jazyka |
Vít Baisa: Pár postřehů z české Wikikonference | |
9. 12. | Pavel Šmerk: TBA |
Honza Rygl: Autor | |
16. 12. | Lucia Kocincová: wine & cheese & koledy |
Honza Bušta: Nové neologismy |
Program semináře v jarním semestru 2013
datum | příspěvky |
20. 2. | program semináře na tento semestr |
možná spolupráce s Poznaní | |
možná spolupráce s Chaps - S. Franc | |
27. 2. | CLARIN mobility granty, oživit http://nlp.fi.muni.cz/trac/research |
Vojta Kovář: co dělám na syntaxi a na SkE (přetečení z minulého semestru -- myslím, že tak na 30-60 minut, ale to už jsem si myslel předtím dvakrát :) ) | |
Zuzana Nevěřilová: Pojmenované entity v češtině | |
6. 3. | Zuzana Nevěřilová: CZPJ a média (zpráva ze semináře Jak prezentovat vědu v médiích) |
Vít Baisa: Nový editor CPA, Trac, Editor | |
Všichni: Organizace práce v labu (trac, měsíční zprávy, peer-review atd.) v Trac | |
13. 3. | Ismaïl El Maarouf: Progress and perspectives in computational linguistics aspects of the DVC project |
Vašek Němčík: Saara a statistiky spoluvýskytů ze Ske [25'] | |
Marek Medveď: RFtagger na slovenštině | |
20. 3. | Vít Baisa:! ukázka CZ-EN MT pomocí suffix array |
27. 3. | diskuse ke grantům - GAČR, TAČR |
Honza Bušta: Creative language | |
Vítek Suchomel: lepší extrakce termínů než minule (a možná něco dalšího) | |
3. 4. | Miloš Jakubíček: CICLing 2013 (zážitky, poznámky, fotky, víno atd. - 30') |
prof. Zygmunt Vetulani: Invited talk | |
10. 4. | Martin Víta (F-solutions): Evaluace vybraných systémů MT na specifických kolekcích textů |
Kristýna Zemková: Využití syntaktické analýzy pro určování autorství | |
Helena Palátová: Floskule | |
Honza Michelfeit, Vojta Kovář, Miloš Jakubíček: Paralelní korpusy | |
17. 4. | Lucia Kocincová: parsery pro češtinu |
24. 4. | Honza Rygl: Autor - (před)produkční verze |
Tomáš Čapek: obhajoba meho diplomanta nanecisto - komentarovy system pro online zdroje; novinky v NLP portalu, snad neco noveho k anotovani a CZWN | |
Adam Rambousek: slovník znakového jazyka | |
Vašek Němčík: Saara a preference na základě statistik spoluvýskytů a sémantických tříd [15'] | |
15. 5. | Pavel Šmerk, Miloš Jakubíček: Nový a lepší tagger pro češtinu |
Vojta Kovář, Vítek Baisa, Miloš Jakubíček: WSeval | |
Jiří Materna: Aplikace pro LDA rámce |
Program semináře v podzimním semestru 2012:
- 18.9.2012
- program semináře na tento semestr
- informace o plánovaných změnách v doktorském studiu
- 25.9.2012
- Pavel Šmerk: Představení stránky o fajce
- RASLAN - místo a čas
- schůzka oborů UMI a PLIN
- 2.10.2012
- Petr Horáček (FIT VUT): Nové gramatické systémy a jejich lingvistické aplikace
- Vašek Němčík: Saara - proč, co, kde a jak. [~30']
- Aleš Horák: studentské projektu GA MU, dohody na anotace, práce nad texty PSP
- 9.10.2012
- Pavel Šmerk: Opravdu představení stránky o fajce
- Miloš Jakubíček: Proč a jak používat Git
- Pavel Rychlý: O značkování dat
- 16.10.2012
- Zdeňka Sitová: Erasmus a výuka AI na K.U. Leuven
- Miloš Jakubíček: Valence v Syntu aj.
- Jirka Vejvoda: Shlukování článků se stejnou tématikou v gensimu
- 23.10.2012
- Petr Sojka: Matematika v korpusové lingvistice (prezentace)
- 30.10.2012
- Zuzka Nevěřilová: Inference v textu
- Pavel Rychlý: projekty CLARIN a LINDAT
- 6.11.2012
- Vojta Kovář: co nového v rozhraní Sketch Engine (30')
- časopisecké publikace
- 13.11.2012
- Jiří Materna: LDA rámce -- další vývoj
- 20.11.2012
- Adam Rambousek, Vít Baisa: Lze použít CPA principy pro češtinu?
- Vít Baisa: Suffix array, longest common prefix a longest frequent prefix (SA, LCP, LFP)
- 27.11.2012
- Pavel Hančar: MapReduce
- Vojta Kovář: co nového v SETu (30')
- Lucka Kocincová: jak děláme skeče ze syntaktické analýzy a rozjíždíme cizí parsery
- 4.12.2012
- Vítek Suchomel: co nového v Corpus Architectu, získávání matematických textů z webu, czTenTen12 (30')
- Honza Rygl: Autorství (funkční DEMO)
- Petr Machovec: Prohledávání VerbaLexu
- 11.12.2012
- Marek Blahuš: Webové stránky pro studium češtiny (nabídka spolupráce na projektu CJV MU)
- Tomáš Čapek: OpenCZWordNet - plán a realizace
- 18.12.2012
- wine & cheese & koledy & tlačenka
Program semináře v jarním semestru 2012:
- 22.2.2012
- program semináře na tento semestr
- Pavel Rychlý: organizační pokyny
- 29.2.2012
- Andrej Gardoň: konference ICAART 2012
- Vojta Kovář: Nový zéland
- Honza Pomikálek: podobnost korpusů, extrakce termů
- 7.3.2012
- Vojta Kovář: ještě něco o konferenci na NZ[5']
- Miloš Jakubíček, Aleš Horák: poznatky z review
- Vašek Němčík: PDT2vert a "Brno ze zkumavky"
- 14.3.2012
- Vojta Kovář: Recent SET developments [15']
- Vojta Kovář: Yet another formalism for syntax? [15']
- Vítek Suchomel: new corpora (quick overview) [10']
- Vítek Suchomel: vertfork (parallelization tool) [5']
- 21.3.2012
- odpadá
- 28.3.2012
- Juyeon Kang: French supertagging (a little bit of Czech)
- Vašek Němčík: Saara (where and how) and corpora annotated for coreference (overview)
- 4.4.2012
- Miloš Jakubíček: citace RASLANu (5 min)
- Zuzka Nevěřilová: něco o odvozování v textu
- Tomáš Čapek: Dokumentování čehokoliv včera a dnes
- 11.4.2012
- Probrat, jestli nechceme ignorovat rektorské volno 16.5.
- Miloš Jakubíček: desamb se syntem
- Vít Baisa: CBLM - ukázka, diskuze spíše technického rázu [15']
- 18.4.2012
- Vít Baisa: ukázka dat z CBLM [10']
- 25.4.2012
- Adam Rambousek: FaNUK
- Vítek Suchomel: named entities recognition using GATE (3rd party software, brief demonstration) [15']
- Vašek Němčík: Saara evaluation
- Aleš Horák: info o pozicích v DERI, nabídka dat od Seznamu
- 2.5.2012
- Jiří Materna: Hierarchické LDA rámce
- 9.5.2012
- Honza Rygl: Autor demo 2
- Pavel Šmerk: fajka
- 16.5.2012
- Pavel Hančar: MapReduce
- Gulšan Dovudov: morphological analysis of Tajik
- Marek Medveď: Synt a SET pro slovenštinu
- Miloš Jakubíček & Lucka Kocincová: Trochu statistiky o UMI
Program semináře v podzimním semestru 2011:
- 22.9.2011
- program semináře na tento semestr
- kontrola cest
- Noc vědců
- 29.9.2011
- Honza Pomikálek, Vítek Suchomel: Jedi Crawler, jusText, Onion, Chared
- 6.10.2011
- Zuzka Nevěřilová: Sheldon's Cookbook
- Juyeon Kang: Intro
- 13.10.2011
- Vašek Němčík: Saara & how to feed her
- 20.10.2011
- Miloš Jakubíček: Zapojení syntu do desambu
- Vojta Kovář: ten zbytek do syntaktického semináře
- 27.10.2011
- Vítek Baisa: představení tezí, fotky z Kyrgyzstánu a organizační záležitosti k výletu do krasu
- Pavel Rychlý: Proč programovat v Pythonu. (přednáška nebude ani o Pythonu ani o programování( nlpcentre.pdf )
- 3.11.2011
- Petr Sojka et al.: The Art of Mathematics Retrieval
- 10.11.2011
- Jirka Materna: Nové a lepší LDA rámce (Prezentace)
- 17.11.2011
- seminář se nekoná, státní svátek
- 24.11.2011
- Adam Rambousek: Nová encyklopedie češtiny
- 1.12.2011
- Andrej Gardoň: Langauge, Mind and their simulation using TIL (Dolphin Nick, GuessME! )
- Presentation language: slovak
- 8.12.2011
- Honza Bušta: Idiomy (a idioty)
- Honza Bušta: Serverová aplikace pro korpus chyb
- 15.12.2011
- Pavel Hančar: MapReduce u nás v laboratoři
- Jan Rygl: DEMO Autorství
- 22.12.2011
- Pavel Šmerk: ajka => majka (a svařák a koledy?)
Program semináře v jarním semestru 2011:
- 23.2.2011
- program semináře na tento semestr
- informace o NlpAssistentce
- informace o cestách v roce 2011
- 2. 3. 2011
- Honza Pomikálek: PRESEMT + Čištění korpusových dat
- 9. 3. 2011
- Pavel Rychlý: Jak psát dobré programy
- Aleš Horák, Miloš Jakubíček, Vojta Kovář: Jak a proč vyhrál Watson Jeopardy?
- 16. 3. 2011
- Vít Baisa: Fotky z Chile & Argentiny
- Vít Baisa: Průběžné výsledky ze dvou poloautomatických anotací VerbaLexu
- Zuzka Nevěřilová: Nový formát VerbaLexu
- 23. 3. 2011
- Vašek Němčík: Saara a export PDT2 do vertikálu
- Aleš Horák, Miloš Jakubíček, Vojta Kovář: TIL korpus
- 30. 3. 2011
- Tomáš Čapek: Limity strojového překladu
- 6. 4. 2011
- info k návrhu GAČR projektu
- Miloš Jakubíček: synt: méně je více
- Karel Vaculík: Predicate-argument structure z české věty
- 13. 4. 2011
- info o H-indexu a citování
- Dana Hlaváčková: nová verze dat VerbaLexu
- Vojta Kovář: SET TBA
- 20. 4. 2011
- Vojta Kovář: SET (dokončení)
- Vít Baisa: Jeden princip: od morfologie až k reprezentaci znalostí
- 27. 4. 2011
- Jiří Materna: Introduction to Latent Dirichlet Allocation
- Jiří Materna: Semantic frames as probabilistic generative models
- 4. 5. 2011
- Miloš Jakubíček: (< 15 min) RFC: brief formát
- Vít Baisa: Jeden princip: od morfologie až k reprezentaci znalostí (dokončení)
- Petr Sojka et al: EuDML@MU status quo, demos
- Michal Růžička: Kanonizace MathML pro vyhledávání matematiky
- Milos Líška: Mathematical Indexing and Querying
- 11. 5. 2011
- Marek Blahuš: Rozšíření českého WordNetu podle anglického překladovým slovníkem - diplomová práce
- Marek Grác: nástin dizertačky TBA
- 18. 5. 2011
- Zdeněk Žabokrtský: Strojový překlad s využitím závislostní syntaxe
- speciální přednáška - 31. 5. 2011
Program semináře v podzimním semestru 2010:
- 22.9.2010
- program semináře na tento semestr
- postery na Noc vědců - dodělat odkazy Vyzkoušejte si na náš web, vyrobit screencasty pro prezentaci
- nachystat schůzku UMI a PLIN, cca za 3 týdny, asi v B204 v Po v 18
- 29.9.2010
- Pavel Rychlý: ČAJ (aneb když jsme byli mladí a hezcí)
- Honza Bušta: Erasmus
- kde jsme byli, co jsme viděli
- 6.10.2010 EuDML – status reports
- Petr Sojka: EuDML latest developments, WP7
- Michal Růžička, Petr Kovář: Metadata Editor
- Radim Hatlapatka: PDF Enhancements Tools
- Zuzana Nevěřilová: Visual Browser 4 Math – use cases
- Martin Líška: Mathematical Indexig and Quering
- Peter Mravec: Searching on Corpora of Mathematics Texts
- 13.10.2010
- Tomáš Čapek: Výsledky heuristických testů nad CZWN
- 20.10.2010
- Zuzana Nevěřilová: něco o named entity recognition a Wikipedii
- 27.10.2010
- záskok Adam Rambousek
- 3.11.2010
- Vašek Němčík: Saara - demo a sbírání postřehů a feature requests
- Honza Bušta: Detekce idiomů v korpusu
- 10.11.2010
- Vít Baisa: PZPJ: přístup "odspodu"
- 17.11.2010
- seminář se nekoná - státní svátek
- 24.11.2010
- Marek Blahuš: pracovní stáž ve Francii
- Miloš Husák: sémanticky podložená extrakce informací z korpusu
- 1.12.2010
- Miloš Jakubíček, Vojta Kovář: syntaktický seminář– PDT, synt, set, TIL projekt a další
- 8.12.2010
- Jiří Materna: Určení tematické konzistence dokumentu
- 15.12.2010
- Pavel Šmerk: wine & cheese a koledy apod.
- Dana Hlaváčková, Vašek Němčík: Editace VerbaLexu
Program semináře v jarním semestru 2010:
- 24.2.2010
- program of the seminar
- planning of publications and trips
- 3.3.2010
- Zuzka Nevěřilová - Xplain ( neverilova_xplain.pdf )
- 10.3.2010
- Aleš Horák, Pavel Rychlý - návrhy nových přednášek
- Pavel Šmerk - new [fm]ajka and a new lexicon
- Miloš Jakubíček - Erasmus in Saarbruecken
- 17.3.2010 EuDML I
- Petr Sojka: Digital Mathematics Library: from DML-CZ to EuDML
- Michal Růžička: (Meta)data acquisition and validation
- Miha Filej: Localization issues in Metadata editor web application
- Radim Hatlapatka: PDF recompression
- Zuzana Nevěřilová: Metadata processing
- 24.3.2010
- Přestavba laboratoře
- Adam Rambousek: Corpus Pattern Analysis for Spanish, Italian, Czech, ...
- Tomáš Čapek: WordNet heuristic tests
- 31.3.2010
- Marek Grác, Vojta Kovář: Noun phrases semantic annotation
- Marek Grác, Vojta Kovář: Noun phrases semantic annotation
- 7.4.2010
- Honza Pomikálek - odstraňování boilerplate a duplicit
- Honza Pomikálek - odstraňování boilerplate a duplicit
- 14.4.2010
- Vašek Němčík: PDT 2.0, anotace, detekce klausí, atp.
- Vašek Němčík: PDT 2.0, anotace, detekce klausí, atp.
- 21.4.2010
- Vojta Kovář: The SET Parsing System and why I do not have a better presentation about it
- Vojta Kovář: The SET Parsing System and why I do not have a better presentation about it
- 28.4.2010 Towards EuDML
- Petr Sojka: Towards European Digital Mathematics Library
- Michal Růžička: Data Acquisition and Enhancements
- Miha Filej: Localization issues in Metadata editor web application
- Radim Hatlapatka: PDF enhancement tools
- Zuzana Nevěřilová: Visual Browser 4 DML
- Martin Liška: Mathematical Indexing and Querying
- 5.5.2010
- 12.5.2010
- Vít Baisa: Comparing English and Czech Word Sketches
- Honza Bušta: TBA
- 19.5.2010
- Miloš Jakubíček: valence v syntu
- Zuzka Nevěřilová: něco o slovesech
Program semináře v podzimním semestru 2009:
- 23.9.2009
- program semináře na tento semestr
- plánování publikací a cest
- 30.9.2009
- Tomáš Čapek, Adam Rambousek - český wordnet v DEBDictu
- Tomáš Čapek - koncepce pro opravy v českém wordnetu
- 7.10.2009
- Karel Pala - návrh na koupě HW a SW
- Petr Sojka - prezentace navštívených konferencí a workshopů - TSD 2009, ECDL 2009, DML 2009
- změny a aktualizace na laboratorním webu
- Vít Baisa - několik návrhů na změnu vzhledu a na doplnění obsahu lab. webu
- 14.10.2009
- ňáký anafory v syntu jsou nemocný ... budou presentovány po uzdravení
- 21.10.2009
- Marek Grác - GUI klikátko na slovesné valence
- Zuzka Nevěřilová - Extending VerbaLex ( neverilova_prezentace.pdf )
- navrhované BP/DP
- 28.10.2009 - svátek, seminář není
- 4.11.2009
- Jiří Materna - Doménové kolokace
- 11.11.2009
- Jaroslav Moravec - Korekturní rozšíření pro OpenOffice.org
- 18.11.2009
- Honza Pomikálek - nový algoritmus na klasifikaci odstavců
- příprava na raslan
- 25.11.2009
- Aleš Horák - stav VerbaLexu
- Adam Rambousek, Aleš Horák - projekt KYOTO
- Marek Blahuš - Kontrolor pravopisu pro Esperanto - studentský projekt
- 2.12.2009
- Vašek Němčík - Anafory v syntu
- 9.12.2009
- Vojta Kovář - SET a vůbec a jak je to se studentskýma projektama
- Honza Bušta - KMJ, neologismy
- Vít Baisa - Asistovaný překlad
- 16.12.2009
- Vít Baisa - Asistovaný překlad (krátké dokončení z minula, diskuze)
- Honza Pomikálek - disertačka o korpusech
- Miloš Jakubíček - LTC, LCT, lt-world.org a další diskuse ohledně zviditelnění CZPJ
Program semináře v jarním semestru 2009:
- 17.2.2009
- program semináře na tento semestr
- plánování publikací a cest, hodnocení vědy a výzkumu
- 24.2.2009
- Miloš Jakubíček: stručně k nalezeným ISI proceedings et al. a informace o novém laboratorním prosemináři
- Radim Řehůřek: Detekce jazyka po stodvacáté – slovníková metoda vs. písmenné ngramy, vícejazyčné texty
- Aleš Horák: informace o (http://nlp.fi.muni.cz/cs/NLPaRozpoznavaniReci) požadavku řečařů z Liberce (prof.Nouza)
- 3.3.2009
- Aleš Horák: ještě k požadavku řečařů z Liberce
- Aleš Horák: různé - přidat otravnou zprávičku o ochraně dat labu, publikace v březnu
- Marek Blahuš: Zkušenosti z půlročního pobytu na K.U.Leuven v Belgii v rámci programu Erasmus
- 10.3.2009
- Marek Grác: NLPunix
- Pavel Rychlý: Korpus Czes
- 17.3.2009
- Tomáš Čapek: Nové MWE
- Tomáš Čapek: Nové MWE
- 24.3.2009
- Honza Pomikálek: CICLING 2009 v Mexiku
- Honza Pomikálek: CICLING 2009 v Mexiku
- 31.3.2009
- Vojtěch Kovář: Syntaktická analýza češtiny: současný stav, problémy a nápady na jejich řešení, analyzátor SET
- Vojtěch Kovář: Syntaktická analýza češtiny: současný stav, problémy a nápady na jejich řešení, analyzátor SET
- 7.4.2009
- Jiří Materna: Rozšiřování VerbaLexu o informace z Framenetu
- 14.4.2009
- Miloš Jakubíček: Využití extrakce struktur: interpunkční korektor a extrakce valencí
- Marek Grác, Miloš Jakubíček, Jan Bušta: O kolokviu mladých jazykovědců v Prešově
- 21.4.2009
- Miloš Jakubíček, Jan Bušta: Korpus chyb
- Miloš Jakubíček, Jan Bušta: Korpus chyb
- 28.4.2009
- Adam Rambousek, Aleš Horák: Postup v projektu KYOTO
- Adam Rambousek, Aleš Horák: Postup v projektu KYOTO
- 5.5.2009
- Marek Grác: I cesta může být cíl
- Honza Pomikálek: Corpus Architect
- 12.5.2009
- Pavel Šmerk: to stačí (TBA)
- Pavel Šmerk: to stačí (TBA)
- 19.5.2009
- Václav Němčík: TBA
- Pavel Rychlý: Translingual Europe 2009
Program semináře v podzimním semestru 2008:
- 17.9.2008
- program semináře na tento semestr
- plánování cest a workshopu RASLAN 2008
- 24.9.2008
- Pavel Rychlý: Proč (ne)programovat v některých jazycích II
- 1.10.2008
- Aleš Horák: zhodnocení TSD 2008
- 8.10.2008
- Miloš Jakubíček, Jan Bušta: EMLS 2008
- Petr Sojka: From Pixels to Minds and Back
- 15.10.2008
- Pavel Rychlý, Honza Pomikálek: BiWeC II
- 22.10.2008
- Jiří Materna: Seznámení s FrameNetem? a nápady pro český FrameNet
- 29.10.2008
- Vašek Němčík: Anaphora Resolution & MMAX2 & PDT2
- 5.11.2008
- Vojta Kovář, Miloš Jakubíček: Test suite a další novinky v syntu
- 12.11.2008
- Vojta Kovář: Syntaktická analýza s využitím postupné segmentace věty (SET)
- 19.11.2008
- Jan Bušta: Četnost idiomů v korpusu
- 26.11.2008
- Aleš Horák, Adam Rambousek: Postup v projektu KYOTO
- 3.12.2008
- Honza Pomikálek, Vojta Kovář: Mikulášský Corpus Architect
- Honza Pomikálek, Vojta Kovář: Výsledky NLPbota ve FIBotovi
- 10.12.2008
- Tomáš Čapek: Semantické sítě a hierarchické lexikony v praxi
- 17.12.2008
- Pavel Šmerk: (hotová?) nová ajka
- Máša Khokhlova: Krátká Vánoční zpráva, aneb opožděné představení
Program semináře v jarním semestru 2008:
- 27.2.2008
- Pavel Rychlý: Od programování k filosofii a zpět
- 5.3.2008
- Husák: GDEX, Good Dictionary Examples
- Webadmini NLP (Němčík): MoinMoin Wiki
- 12.3.2008
- Vláďa Kadlec, Vojta Kovář, Aleš Horák: Syntaktická analýza s využitím slovesných valencí
- Admini NLP: Jak formátovat disky, udržba distribuce na strojích NLP, apod.
- 19.3.2008
- Honza Pomikálek: Jak spolehlivě detekovat kódování znaků, známe-li jazyk textu
- Radim Řehůřek, Petr Sojka: Klasifikace matematických textů
- 26.3.2008
- Vojta Kovář: Postupná segmentace věty a její využití v syntaktické analýze
- 2.4.2008
- Marek Blahuš: Kontrola pravopisu a její specifika pro jazyk esperanto
- Jiří Materna: Automatické určení domény české webové stránky
- 9.4.2008
- Pavel Rychlý, Honza Pomikálek: BiWeC (Big Web Corpus)
- Pavel Šmerk: Guesser
- 16.4.2008
- Jakubíček: Extrakce struktur syntaktického analyzátoru
- 23.4.2008
- Vašek Němčík: WordNet Assistant
- Aleš Horák: KYOTO projekt
- 30.4.2008
- Radim Řehůřek: Oprava překlepů ve fulltextovém hledání Seznam.cz (1h až neomezeně)
- 7.5.2008
- Bušta: Četnost idiomů v korpusu
- 14.5.2008
- Petr Sojka et al.: DML-CZ
- 21.5.2008
- probírání nákupu HW, organizace laboratoře
Program semináře v podzimním semestru 2007:
- 18.12.2007
- Víťa Nováček - co dělám v Irsku :-), aneb: (1) projekt Knowledge Web - dynamic ontology lifecycle, integrace ontologií; (2) Jak se peče OWL - nahlédnutí do kuchyně W3C; (3) empirické usuzování - pokus o jedno čistě soukromé kacířství na pokračování... Rozsah a pořadí konkrétních témat můžeme libovolně upravit dle zájmu a času na místě.
- 11.12.2007
- Vojta Kovář - Opravdu hotový beautified chart
- 4.12.2007
- Vašek Němčík - Anaphora Resolution: krátký úvod; ukázka dat pomocí MMAX; ukázka anotace v PDT2; ukázka dat získaných ze syntu; výhled do budoucna (využití valencí/thesauru, strojové učení)
- 27.11.2007
- pro nemoc se seminář nekoná
- 20.11.2007
- Adam Rambousek, Aleš Horák - Administrační rozhraní DEB
- 13.11.2007
- Vláďa Kadlec - Syntaktická analýza přirozeného jazyka založená na bezkontextových gramatikách
- 6.11.2007
- Honza Pomikálek, Pavel Rychlý - Odstraňování duplicit v korpusu
- 30.10.2007
- Dana Hlaváčková - VerbaLex 2.0
- 23.10.2007
- Marek Grác - Parciální vzory pro slovesa
- 16.10.2007
- Pavel Šmerk – Od naskenovaného textu ke značkovaným validovaným datům (SSJC, PSJC)
- 9.10.2007
- Aleš Horák, Adam Rambousek - Global WordNet Grid
- 2.10.2007
- Honza Pomikálek - Tvorba paralelních korpusů z webu
- 25.9.2007
- Dana Hlaváčková - přehled možností pro výjezdní zasedání laboratoře
- Pavel Rychlý - Opravdu velké (dvacetimiliardové) korpusy
- 18.9.2007
- vytvoření seznamu prezentací pro tento semestr
- cesty do konce roku
- nlpweb, prezentace laboratoře na fi?
- nlpunix, marx
- vyjezdni zasedani laboratore
Nabídka vystoupení:
- Vláďa Kadlec, Aleš Horák - Syntaktická analýza s využitím slovesných valencí
- Honza Pomikálek - jak spolehlivě detekovat kódování znaků, známe-li jazyk textu
Program semináře v jarním semestru 2007:
- 15.5.2007
- Petr Sojka - Od naskenovaného textu ke značkovanému repositáři matematických textů
- Marek Grác - Nástroj pro automatickou tvorbu česko-slovenského slovníku
- 24.4.2007
- Vašek Němčík - Anaphora Resolution
- 17.4.2007
- Pavel Šmerk - ajka2: "chci být jiná, lepší"
- 10.4.2007
- Mirek Prýmek, Aleš Horák - projekt ElNet, simulační systém Rice
- Pavel Šmerk - ajka2: "chci být jiná, lepší"
- 3.4.2007
- Vojta Kovář - Zobrazování konkordancí obousměrných horizontálních textů
- Vojta Kovář - synt - beautified chart
- Radim Řehůřek - Segmentace textu, vyhodnocení
- 27.3.2007
- Dana Hlaváčková - aktuální práce na VerbaLexu, diskuze o problémech při editaci
- 20.3.2007
- Patrick Hanks, Adam Rambousek - CPA
- 13.3.2007
- Pavel Rychlý - Kapradí - nástroj pro práci s paralelními korpusy anglického dramatu
- Jiří Materna, Richard Šimek, Marek Grác - Valenční rámce v analyzátoru Zuzana
- Vláďa Kadlec - Použití VerbaLexu v syntu
- 6.3.2007
- Martin Kudlej, Adam Rambousek - Cornetto – nizozemský wordnet
- Tomáš Čapek - prezentace CMS systému DRUPAL
- 27.2.2007 - v laboratoři B203
- Tomáš Čapek - praktické použití českého WordNetu, problémy s jeho ontologií
- 20.2.2007 - v B411
- plán vystoupení na semináři na celý semestr
- Vašek Němčík - prezentace laboratoře na webu FI
- úprava velkého labu pro to, aby v něm mohly být další semináře
Program semináře v podzimním semestru 2006:
- 19.12.2006
- Vašek Němčík - anaphora resolution, wordnet assistant
- Pavel Šmerk - český tagger
- 12.12.2006 v akvárku
- Radim Řehůřek! - segmentace a (ne)indexování textů
- 5.12.2006
- James Thomas - Využití korpusů ve výuce jazyků
- 28.11.2006 v akvárku
- Pavel Rychlý – finlib
- 21.11.2006 v zasedačce
- Adam Rambousek - nlpis
- Jarek Hlávka - nlplab-ubuntu
- 14.11.2006
- Aleš Horák - GDW a wwwsynt, GUI rozhraní k syntu
- 7.11.2006
- Tomáš Čapek - DTP v Open Source
- 31.10.2006 v B411
- Martin Rajman - informace o možné spolupráci se švýcarskou EPFL
- 24.10.2006
- Lubomír Popelínský - Strojové učení a přirozený jazyk 2004-6 (ve vztahu k laboratoři vyhledávání znalostí)
- 17.10.2006
- Vojta Kovář - Redukce počtu stromů na výstupu Syntu. Beautified stromy, beautified chart, přehled dalších metod
- 10.10.2006
- POZOR jsme v zasedačce
- stanovení programu semináře na celý semestr
- zprávy z konferencí a workshopů (SemWeb, Euralex, ...)
- 3.10.2006
- diskuze - zálohování, laboratorní plakát, web
- přestavba velkého labu
- 26.9.2006
- Adam Rambousek – jak vyrábět deb-balíky
- 19.9.2006
- seznámení, představení, návrhy na prezentace
Program semináře v jarním semestru 2006:
- 23.5.2006
- Radim Řehůřek - zkusenosti z pulrocniho pobytu v Belgii v ramci programu Erasmus
- 16.5.2006
- Vašek Němčík - Anaphora Resolution: úvod do problematiky, modulární systém presentovaný v diplomové práci, výhledy do budoucna
- Pavel Cenek - From Unimodal to Multimodal Dialog Management
- 9.5.2006
- Mudrak - OCR matematiky v ramci projektu DML CZ
- Marek Grác, Radovan Štancel - Česko-slovenský strojový překlad
- 2.5.2006
- Petr Sojka - obecně o projektu DML CZ
- Panak - OCR matematiky v ramci projektu DML CZ
- 25.4.2006
- Zuzana Nevěřilová - program pro korekturu textů
- 11.4.2006
- Víťa Nováček - dolování (fuzzy) ontologií z textu v NL
- 4.4.2006
- Pavel Šmerk - český značkovač
- 28.3.2006
- Adam Rambousek - DEB a jeho noví klienti
- 14., 21.3.2006
- Co chceme v laboratoři dělat a co děláme (nástin probíhajících/připravovaných projektů)
- 7.3.2006
- Pavel Rychlý: Stručné dokončení z minulého semináře
- 28.2.2006
- Pavel Rychlý: V čem a jak programovat aneb proč neprogramovat v jazycích Java, Perl, C++, XSLT, ...
- 21.2.2006
- Honza Pomikálek: WebBootCaT (tvorba korpusů z webu), MetaTrans (překladový metaslovník)
Program semináře v podzimním semestru 2005:
- 21.12.2005
- Lukáš Svoboda: Dialogový systém UIO
- 14.12.2005
- Patrick Hanks: Corpus Pattern Analysis
- Anna Rumshisky:
- 7.12.2005
- Zuzka Nevěřilová: řekne později
;-)
- Víťa Nováček: Ontology learning
- Zuzka Nevěřilová: řekne později
- 30.11.2005
- seminář se nekoná
- 23.11.2005
- Honza Pomikálek: GVP, textové klasifikátory
- Jeník Provazník: Inteligentní webcrawler
- 16.11.2005
- Pavel Šmerk: stav morfologické desambiguace, značek a korpusů
- 2.11.2005
- Aleš Horák, Adam Rambousek, Martin Kudlej: DEB II - platforma pro vývoj slovníkových editorů
- 26.10.2005 (výjimečně v B411)
- Jirka Mikulášek: blizna, pestík, floret, is-text-search, ...
- Vladimír Kadlec: Robust stochastic parsing using optimal maximum coverage
- 19.10.2005
- Honza Pomikálek: Corpus Builder
- 12.10.2005
- Pavel Rychlý: Korpusový manažer Manatee: použití, nástroje, API
- 21.9.2005
- Seznamení: Každý aktivní spolupracovník řekne, čím se zabývá a zejména čeho by chtěl v následujícím semestru dosáhnout.
Program semináře v jarním semestru 2005:
- 9.6.2005 - 29.9.2005
- pouze příležitostně po předchozím ohlášení e-mailem na all at aurora.fi.muni.cz
- 2.6.2005
- Zdenko Staníček: Universální informační robot
- 26.5.2005
- Honza Provazník, Petr Jurášek - NLP unix
- 19.5.2005
- Václav Brožek: Formát pro uložení víceznačné morfologie a syntaktických struktur ve vertikálu
- všeobecná diskuze: společný projekt české morfologie (desam + ajka)
- 12.5.2005
- Pavel Šmerk: stav a možnosti úprav korpusů DESAM a Stoka
- všeobecná diskuze: web laboratoře
- všeobecná diskuze: značky v ajce
- 5.5.2005
- Pavel Cenek: Řízení dialogu
- všeobecná diskuze: značky v ajce
- 28.4.2005
- Pavel Rychlý: práce s daty, čeho se vyvarovat
- všeobecná diskuze: budoucnost ajky
- 21.4.2005
- Pavel Rychlý: Nový velký slovník cizích slov
- 14.4.2005
- Petr Sojka: Competing Patterns in Language Engineering and Computer Typesetting
- Zuzana Nevěřilová: Vizuální lexikon
- Zuzana Nevěřilová, Petr Sojka: Visualizace sémantického webu na příkladu doménově vymezené digitální matematické knihovny
- 7.4.2005
- Lukáš Svoboda: uuiiuioo
- 31.3.2005
- Radek Sedláček: Morfologický analyzátor Ajka
- Dana Hlaváčková, Aleš Horák: Lexikon slovesných valencí FI MU Vallex
- 24.3.2005
- Pavel Rychlý: Tvorba korpusu
- Marek Veber: Editor morfologické databáze i_par
- 17.3.2005
- Jan Pomikálek a spol.
- 10.3.2005
- Aleš Horák a Vladimír Kadlec: Syntaktický analyzátor
synt
- Aleš Horák a Vladimír Kadlec: Syntaktický analyzátor
- 3.3.2005
- krátké (max. několik minut) představení se každého aktivního spolupracovníka, na čem aktuálně pracuje, zamýšlí pracovat, případně pracoval.