Programme of the Laboratory Seminar in the past semesters

This page does not contain the program of the current seminar, it only shows the history of the past semesters of the Laboratory Seminar.

Seminar programme in the spring semester 2025

date	programme
19.2.	seminar programme for this semester
	Ondřej Herman: announcement of Shared Task: Robust Word Sense Induction
	Aleš Horák: new sitting corner in the NLP lab
	Aleš Horák: NLP Matrix server for NLP lab members
26.2.	David Porteš: Reproducible ML experiments using Kubernetes, Gitlab and DVC
5.3.	Edoardo Signoroni: Efficient Architectures for Low-Resource Machine Translation
12.3.	Anna Winklerova: Linguistic feature overview and analysis
19.3.	Ota Mikusek: From natural language to corpus-query language
26.3.	Radoslav Sabol: Fine-grained Propaganda training set construction
2.4.	Kryštof Bednařík: Topic Extraction
9.4.	Filip Prochac: RAG chatbot
16.4.	Petr Zelina: BERT-like models for medical token classification
23.4.	Helena Medková: BERT model for Zeugma Detection
30.4.	Yasir Yakup Demircan: Misconfiguration Detection with sec-certs Framework
7.5.	Ondra Herman: Trends on Word Senses
7.5.	Vlasta Ohlidalova: POS tagging evaluation for Czech
14.5.	Michaela Denisová: Evaluation of cross-lingual word embeddings without linguistic data

Seminar programme in the autumn semester 2024

date	programme
23.9.	seminar programme for this semester
	Aleš Horák: Opravidlo 2.0 – Public Online Proofreading Service
	Aleš Horák: RASLAN 2024 Call for Papers
	Zuzana Nevěřilová: Scientist Night team call
30.9.	Patrik Stano: Anaphora Resolution
7.10.	Ondřej Valášek: Terminology Extraction Evaluation
14.10.	Filip Prochác: RAG chatbot
21.10.	Vojtěch Formánek: Jailbreaking Empathy
4.11.	Emma Bednaříková: Language Identification on the token level
4.11.	Edoardo Signoroni: Low-Resource Machine Translation
11.11.	Petr Zelina: regex from examples using LLMs
18.11.	Radoslav Sabol: Progress on Slama: Foundational Slavonic Large Language Model
25.11.	Marek Hába: Comparing different taggers for French on Rapcor corpus
2.12.	Helena Medková: The Explainability of the ZeugBERT model predictions on the Zeugma detection use case
9.12.	Michaela Denisová: Aligning Sense-specific Word Embeddings
9.12.	Michal Spiegel: Improving Semantic Representation in LLMs
16.12.	David Porteš: Using speech prosody to guide LLM generation
16.12.	Anna Winklerova: Item text features: engineering and evaluation of explanatory power

Seminar programme in the spring semester 2024

date	programme
22.2.	seminar programme for this semester
29.2.	Pavel Rychly: Understanding LLM
7.3.	Anna Winklerová: Test item feature extraction
14.3.	Krištof Anetta: Medical Text Analysis
21.3.	Leonard Turčan: Authorship verification system
28.3.	Petr Zelina: Low sample NER with active learning
4.4.	Jura Bogomolov: Natural language interface for an analytical system
11.4.	Tomáš Houfek - Medical Named Entity Recognition (and more)
18.4.	Radoslav Sabol: Towards Slama: Foundational Slavonic LLM
18.4.	Edoardo Signoroni: Smaller Models for Low-resource MT
25.4.	David Porteš: Driving LLMs using Prosody
2.5.	Yuliia Teslia: Analyzing Automatic Language Detection Methods for Czech-Ukrainian Translation Task
9.5.	Ondřej Sotolář: Empathetic Response Generation
16.5.	Michaela Denisová: TBA
16.5.	Veronika Andrlova: Czech discussion robot

Seminar programme in the autumn semester 2023

date	programme
20.9.	seminar programme for this semester
	Aleš Horák: RASLAN 2023 Call for Papers
	Ondřej Sotolář: SemEval task team call
	Zuzana Nevěřilová: Scientist Night team call
27.9.	Ondřej Sotolář: Detection of supportive interactions in dialogs
27.9.	Pavel Rychly: 2nd Czech speech/NLP day
4.10.	Klara Vrabl: Digital Linguistics in Ljubljana
4.10.	Vítek Suchomel: Games for the Promotion of NLP to the Public. (10') Try and test the latest game before it's presented at Researchers' Night! (20', Czech only)
11.10.	Edoardo Signoroni: Report on the WMT2023 Low-resource Indic MT shared task
18.10.	Petr Zelina: GPT for extraction of Side-Effects from pdf drug leaflets
25.10.	Martin Habrovec (Seznam.cz): Image-Text Alignment: Learning Representations for Image Search
1.11.	Radoslav Sabol: Expanding Stylometric Feature Set for Manipulative Style Recognition
8.11.	Michal Spiegel: Machine generated text detection
15.11.	Leonard Turčan: Authorship verification via cloze-test
22.11.	David Porteš: Guding LLMs by speech melody
22.11.	Ondra Sotolář: EMNLP paper
29.11.	Adam Karásek: Authorship identification
29.11.	Krištof Anetta: Medical Text Analysis
6.12.	Edoardo Signoroni: Machine Translation Evaluation Metrics
13.12.	Tomáš Houfek: Medical reports analysis
13.12.	Filip Brzý: Usage of LLMs in programming Pepper social robot

Seminar programme in the spring semester 2023

date	programme
14.2.	seminar programme for this semester
21.2.	Pavel Rychlý: Data Processing
28.2.	Mauro Le Donne: Tokenisation of Italian Pre-trained Models
28.2.	Vítek Suchomel: Text processing in Linux – hands on example
7.3.	David Porteš: Discussion about Research Tools
14.3.	Katarína Hudcovicová: Propaganda detection
14.3.	Ondřej Sotolář: Explainability Tools – link to presentation
21.3.	~~Hien Thi Ha: Information extraction from scanned documents~~
28.3.	Edoardo Signoroni: Overview of Low-Resource Machine Translation
4.4.	Michal Měchura: Issues and challenges when encoding dictionaries on computers
11.4.	Marek Medveď: Full AQA pipeline
11.4.	Krištof Anetta: Medical text content understanding
18.4.	Hien Thi Ha: Information extraction from scanned documents
25.4.	Ondřej Metelka: Automatic morphological paradigm construction
	Radoslav Sabol: Optimizing the Inference of Neural Transformer Models
	~~Veronika Andrlová: Training a Czech Discussion Robot~~
2.5.	Tomáš Houfek: Czech Medical Language Model and Document Classification
2.5.	Petr Zelina: Medical Data Processing
9.5.	Michaela Denisová: Cross-lingual embedding models
9.5.	Ondřej Sotolář: Conference report: AISTATS, EACL

Seminar programme in the autumn semester 2022

date	programme
14.9.	seminar programme for this semester
14.9.	Aleš Horák: RASLAN 2022 Call for Papers
21.9.	Vítek Novotný, Martin Geletka, Marek Toma, Petr Sojka: Report from CLEF 2022
21.9.	Marek Medveď: SQAD+AQA
5.10.	Ondřej Sotolář: Psychological phenomena in dialogues
5.10.	Aleš Horák: Contract research with Azure Language Studio
12.10.	Petr Zelina: Patient similarity
19.10.	Tereza Vrabcová: Machine translation of the FI MU website
26.10.	Vítek Novotný: AHISTO NER
2.11.	Edoardo Signoroni: High-frequency tokenizer
2.11.	~~Dominik Tuchyňa: TBA~~
9.11.	Katarína Hudcovicová: Propaganda detection
16.11.	Ondřej Metelka: Automatic morphological paradigm construction
16.11.	Radoslav Sabol: Propaganda Detection with Stylometry
23.11.	Ota Mikušek: Lingua - language detection tool and language detection in historical texts
23.11.	~~Veronika Andrlová: TBA~~
30.11.	Yevhenii Karpizenkov: Processing of legal texts
	Samuel Wittlinger: Speaker identification
	Krištof Anetta: Health records analysis
	Mauro Le Donne: Word Blendings in Italian
7.12.	David Porteš: Multilingual neural representations
	Michaela Denisová: Cross-lingual embedding models
	Veronika Andrlová: Training a Czech Discussion Robot
	Dominik Tuchyňa: Source Code Processing

Seminar programme in the spring semester 2022

date	programme
16.2.	seminar programme for this semester
23.2.	Pavel Rychly: Modules for Machine Translation (MoMaT)
23.2.	Pavel Rychly: NLP data processing
2.3.	Zuzana Neverilova: Konica Minolta projects
	Michal Stary: Event Miner
	Radoslav Sabol: Officebot
	Ivan Hochman: Logo detection
9.3.	Rastislav Papčo: Topic classificaton in web corpora
9.3.	Vit Suchomel: Corpus Data Checks
16.3.	Greta Zella: Introduction
	Adam Hajek: Czech Summarization
	Tomas Foltynek: Authorship verification (try it out)
23.3.	Tereza Vrabcova: Machine translation training
23.3.	Hien Thi Ha: OCRMiner
30.3.	Kristof Anetta: Electronic health records analysis
6.4.	Ondrej Sotolar: Dialogue act classification
13.4.	Ota Mikusek: Czech members of parliament sentence identification
20.4.	Filip Bobek: OCR Evaluation
	Zuzana Nevěřilová: Invoice Mining
	Mahmut Arslan: EHR processing
27.4.	Veronika Burgerova: Conversion between first and third person
27.4.	Marek Medveď: Unanswerable questions
4.5.	Kamila Samajova: Pepper app
4.5.	Daniel Kratky: Adding accents with the use of transformers
11.5.	Edoardo Signoroni: Sentence alignments - evaluation
	Filip Brukner: Enriching essays with generated attributes
	Greta Zella: TBA

Seminar programme in the autumn semester 2021

date	programme
16.9.	seminar programme for this semester
16.9.	Aleš Horák: RASLAN 2021 Call for Papers
23.9.	Vít Novotný: SIGIR 2021 and RANLP 2021
23.9.	Adam Rambousek: AHISTO project
30.9.	Michaela Denisová: Crosslingual embedding models
7.10.	Mikuláš Bankovič: Superresolution techniques for OCR
14.10.	Rastislav Papčo: Topic classificaton in web corpora
14.10.	Edoardo Signoroni: Corpus alignment by machine translation techniques
21.10.	Dalibor Bačovský: Improving the Subword Model of fastText
4.11.	Ondřej Sotolář: Facebook conversations classification
4.11.	Radoslav Sabol: Language identification and sentiment analysis for social network texts
11.11.	Tereza Vrabcová: Preparation of Parallel Corpora for Machine Translation
11.11.	Adam Hájek: Automatic text summarization using GPT-2
18.11.	Petr Zelina: Czech transformers
18.11.	Samuel Špalek: Tokenizers: comparison of 'utok' and 'unitok'
25.11.	Marek Medveď: Answer Context in Question Answering
25.11.	Kristína Němcová: Multimodal machine learning
2.12.	Tomáš Houfek: Information extraction from medical records
2.12.	Daniel Krátký: Adding accents to Czech texts
9.12.	Krištof Anetta, Mahmut Arslan: Electronic health records processing

Seminar programme in the spring semester 2021

date	programme
2.3.	seminar programme for this semester
9.3.	Pavel Rychlý: projekt LINDAT/CLARIAH-CZ
	Pavel Rychlý: projekt strojového překladu
	Pavel Rychlý: projekt generování slovníku
16.3.	Helena Medková: Zeugma Detection using Word Sketch
16.3.	Vítek Novotný: EDS-MEMBED: Multi-Sense Embeddings Based on Enhanced Distributional Semantic Structures via a Graph Walk over Word Senses
23.3.	Michal Štefánik: Unsupervised Estimation of Out-of-Domain Performance of Language Models
23.3.	Marek Medveď: SQAD database update
30.3.	Hien Thi Ha: Block type classification from scanned invoices
30.3.	Vítek Novotný: Combining log-bilinear language models with Transformers
6.4.	Tomáš Houfek: Vytěžování dat z lékařských zpráv
13.4.	Mikuláš Bankovič: Application of super-resolution on OCR of historical documents
13.4.	Adam Hájek: výpočet GTP-2 na Metacentru
20.4.	Tereza Vrabcová: Parallel corpus from web pages
20.4.	Vítek Novotný: When FastText Pays Attention (preprint)
27.4.	Tereza Kinská: Creation of Judikatura corpora of court decisions
27.4.	Pavel Rychlý: Using Makefiles for NLP projects
4.5.	Petr Zelina: ALBERT Training with TensorFlow and PyTorch
11.5.	Krištof Anetta: Electronic Health Records processing, Apache cTakes
18.5.	Ondřej Sotolář: Building a Corpus for Personal Data Detection
25.5.	Michal Starý: Event Detection

Program semináře v podzimním semestru 2020

datum	program
6.10.	program semináře na tento semestr
	Aleš Horák: RASLAN 2020 Call for Papers
	Aleš Horák: TSD 2020
	Zuzana Nevěřilová: Clarin conference 2020
13.10.	Vítek Novotný: MIR@MU at ARQMath 2020
13.10.	Vítek Novotný: Enhancing word embeddings: Positionality, subword sizes, and hyphenation
20.10.	Zuzana Nevěřilová: Information Extraction from Medical Forms
27.10.	Hien Thi Ha: Contract information extraction
27.10.	Vítek Novotný: When Tesseract does it alone: OCR of medieval texts
3.11.	Helena Medková: Zeugma detection
10.11.	Veronika Burgerová: Time and date extraction and normalization
24.11.	Alexander Macinský: NL processing of Japanese for Dictionary Systems
1.12.	Krištof Anetta: Electronic Health Records processing
1.12.	Adam Hájek: Automatic Text Summarization
8.12.	Radoslav Sabol: Officebot
15.12.	Marek Medveď: Question Answering dataset SQAD
5.1.	Marie Stará: Towards the evaluation of automatic explanations
5.1.	Petr Zelina: Transferring ALBERT from en to cs
12.1.	Ondřej Sotolář: Personal Data Anonymization

Program semináře v jarním semestru 2020

datum	program
19.2.	program semináře na tento semestr
26.2.	Aleš Horák: konference TSD 2020
	Pavel Rychlý: LINDAT CLARIAH
	Pavel Rychlý: Simplicity
4.3.	Miloš Jakubíček: Co je nového ve Sketch Engine a LCC
11.3.	seminar cancelled due to COVID-19 regulations
18.3.	seminar cancelled due to COVID-19 regulations
25.3.	Samuel Gazda: Word game Ghost for the robot Pepper
1.4.	Renáta Pivodová: Zpracování nových gramatických fenoménů v logické analýze PJ
1.4.	Michal Hala: Implementace efektivní sémantické sítě pro reprezentací znalostí
8.4.	Vít Novotný: Joint word embeddings and soft cosine measure at ARQMath
15.4.	Veronika Burgerová: Paraphrase Generation for Czech
22.4.	Marie Stará: Automatic creation of explanations
22.4.	Petr Zelina: Evaluating Czech ALBERT
6.5.	Michal Starý: Event Miner
13.5.	Hien Thi Ha: Information extraction from contracts

Program semináře v podzimním semestru 2019

Audio/video komentáře jsou k dipozici zde

datum	program
17.9.	program semináře na tento semestr
	Eniafe Festus Ayetiran: Research Intro
	Ondřej Herman: RANLP conference
	Petr Sojka: TUG conference and 25th Anniversary of FI MU
	Aleš Horák: RASLAN 2019 Call for Papers
24.9.	Zuzana Nevěřilová: Summer Schools on Deep Learning
24.9.	Michal Měchura: NVH: Problems with XML/JSON/YAML and the ultimate solution.
8.10.	Vít Suchomel: Classification of Topics of Web Documents Using Fasttext's Supervised Learning on Classes and Data from dmoz.org
	Vít Suchomel: Active Learning Demo Shown at Night of Scientists
	Presentation slides
	Souležba na sedací soupravě jako příklad špatné lexikografie.
15.10.	Eniafe Festus Ayetiran: Multi-sense Embeddings
22.10.	Pavel Rychlý: Meeting of the Czech Speech & NLP Community
22.10.	Luca Brigada Villa: Relations between syntactic dependency graphs and dependency parsing
29.10.	Vít Novotný: Text classification with word embedding regularization and soft similarity measure
5.11.	Martin Víta: Figurative Language Paraphrasing
12.11.	Martin Kroon: Towards the automatic detection of syntactic differences
12.11.	Veronika Burgerová: Evaluation and Error Analysis of Rule-based Paraphrase Generation for Czech
19.11.	Pavlína Klimešová: Neural networks for Czech sentiment analysis
	Pavlína Klimešová: BERT experiments with SQAD 2.0 and 3.0
	Hien Thi Ha: Information extraction from scanned invoices
26.11.	Michal Starý: TBA
3.12.	Marie Stará: Automatically Created Definitions -- What's New
3.12.	Adam Hájek: Automatic Text Summarization
10.12.	Petr Zelina: Pretraining an (AL)BERT model
17.12.	Ondra Herman: Word Senses
17.12.	Michala Vacíková: Online kurz počítačové lingvistiky

Program semináře v jarním semestru 2019

datum	program
20.2.	program semináře na tento semestr
20.2.	Josef Plch: Substituční segmentér
27.2.	~~Tomasz Jadczyk: CardioCube - Conversational AI for cardiovascular patients~~ moved to April 10
27.2.	Marek Medveď: ICAART 2019
6.3.	Vít Suchomel: žánry
6.3.	Pavel Rychlý: word2vec - odkrývání magie Yoav Goldberg -- word embeddings
Monday 11.3. 12:00	David Sears: Collocations in music? What systematic musicology can learn from corpus linguistics
13.3.	Hien Thi Ha: NLP of Vietnamese
20.3.	Marie Stará: Automatické vytváření definic
27.3.	Vít Novotný: Trains of Thought in Informations Retrieval (10")
	Dávid Lupták: Effective Indexing, Searching and Querying of Structures (10")
	Adam Rambousek: Systém pro tezaury odborné terminologie
3.4.	~~Štěpán Balážik: TBA~~ moved to April 24
10.4.	Tomasz Jadczyk: CardioCube - Conversational AI for cardiovascular patients
10.4.	Aleš Horák: robot Karel Pepper
17.4.	Martin Víta: Story Cloze Task, Facebook InferSent
24.4.	Vit Novacek: Biomedical Discovery Informatics Using Knowledge Graphs
	Štěpán Balážik: Rozvrhbot s robotem Pepper
	Petr Zelina: Better fasttext word embeddings for Czech
15.5.	Adam Bajger: neural PoS tagger with fastText embeddings
15.5.	Vítek Suchomel: Bigger, cleaner and richer web corpora
22.5.	Radoslav Sabol: Answer selection and GPU computing in Metacentrum
22.5.	Ondřej Svoboda: Lemmatizace a morfologické značkování korpusů historické češtiny (období 1300-1500)

Program semináře v podzimním semestru 2018

datum	program
20.9.	program semináře na tento semestr
27.9.	Ha, Hien Thi: Information extraction from scanned invoices
4.10.	Pavel Rychly: Majka a DESAM
11.10.	Pavel Rychlý: Makefile, Make, Mk (and how to use them in data processing)
18.10.	Obluková, Barbora: TBA
25.10.	mimořádně v A420 - Martin Víta: Pipeline selection in classification tasks (deep learning approaches)
1.11.	Daša Kušniráková: Question/answer type extraction
1.11.	Ondřej Herman: Word sense shift detection
8.11.	Luboš Popelínský: Anomaly detection in text (after Guthries)
15.11.	Zuzana Nevěřilová: EMNLP 2018
22.11.	Švárová, Nikola: Sentiment analysis
22.11.	Michal Měchura: Lexonomy (what is new)
29.11.	Vítek Suchomel: Bigger, cleaner and richer web corpora (writing a dissertation thesis in progress)
6.12.	Marek Medveď: Towards new AQA version
6.12.	Vítek Baisa: Sentence alignment using Dijkstra
13.12.	Aleš Horák: What Karel Pepper can(not) do

Program semináře v jarním semestru 2018

datum	program
22.2.	program semináře na tento semestr
1.3.	Vojtěch Mrkývka: Outlier detection in US president speeches
1.3.	Zuzana Nevěřilová: Workshop PoznejFI for high school students
8.3.	Adam Rambousek: Towards - Thesauri for governmental offices
15.3.	Pavel Veselý: Using NLP tools in anomaly detection
22.3.	Vít Suchomel: New Czech web corpus, Web crawling, Genres in web documents
29.3.	Zuzana Nevěřilová: CICLING 2018
5.4.	Vojta Kovář: On word sense induction (30')
5.4.	Ondřej Herman: On word sense induction II
12.4.	Matin Víta: Attention based CNNs for recognizing Faceted Entailment
19.4.	Aleš Horák: On Siamese Neural Networks
	Terézia šulganová: Logical analysis of English sentences
	Hien Thi Ha: Extracting structure of scanned invoices
26.4.	Josef Hlaváč, DGT EU: DGT, its way of working and its needs
3.5.	Michal Měchura: What's new in Lexonomy
	Adam Gonda: Extrakce definic
	Lucie Findejsová: Naming animal kinds and their representatives: patterns and their relationship to frequency
10.5.	Daša Kušniráková: Question classification
10.5.	Marek Medveď: ILP for outlier detection
17.5.	Marie Stará: Automatic creation of dictionary definitions
17.5.	Jiří Mauritz: Automatic Classification of Legal Documents

Program semináře v podzimním semestru 2017

datum	program
20.9.	program semináře na tento semestr
20.9.	Noc vědců
27.9.	Marie Stará, Vojtěch Mrkývka: TransTech Summer School
27.9.	Michal Měchura: Grammatical Framework summer school
4.10.	Aleš Horák: RASLAN 2017
	Louis Lecailliez: Multilingual dictionaries for mobile application use and East-Asian languages handling
	Miloš Jakubíček: ELEXIS project
	Miloš Jakubíček: New version of SketchEngine
11.10.	James Brown (What3Words): what3words: how words power tech-for-good
18.10.	Martina Cvinčeková: Recommender systems for language learning with opinion mining
	Honza Rygl: Speech biometry in Phonexia (30 min), current autorstvi.cz demo (10 min)
	Zuzana Nevěřilová: Short Report on Grants' Week (5 min), presentations
25.10.	Martin Víta: From project-reviewer matching to baseline for faceted textual entailment
25.10.	Louis Lecailliez: Multilingual dictionaries - first mobile prototype demo
1.11.	Vojtěch Mrkývka: Wikilinks
8.11.	Wörgötter, Martin: Comparison of statistical and neural machine translation
15.11.	Hien Ha Thi: OCR document classification
22.11.	Zuzana Nevěřilová: Mývalit, topit, baštit - How to improve web corpus annotation
29.11.	Moiz Khan Sherwani: Toponym disambiguation
29.11.	Terézia Šulganová: Logical analysis of English sentences
6.12.	Vítek Suchomel: crawler, czTenTen17?, žánry
13.12.	Josef Šamánek: Automatic Text Summarization
13.12.	Marek Medveď: AQA

Program semináře v jarním semestru 2017

datum	program
22.2.	program semináře na tento semestr
22.2.	HaBiT Corpus Annotation results
1.3.	Aleš Horák: Manipulativní techniky propagandy v době internetu
	Adam Rambousek, Michal Měchura: Budapešť COST meeting
	Adam Rambousek, Michal Měchura: Nový český slovník
8.3.	Aleš Horák: Intergovernmental exchange programmes
8.3.	Ondřej Herman: Word embeddings using Fasttext
15.3.	Vítek Suchomel: Genre Identification of Documents in a Large Web Corpus
22.3.	Aleš Horák: Joint Masters programme: Multilingual Digital Content studies
29.3.	Zuzana Nevěřilová: Build It, Break It The Language Edition
	Aleš Horák: Environment for Communication-based AI, General AI Challenge, Machine Learning Meetup
	Michal Měchura: Grammatical Framework
	Marek Medveď: chatbot
5.4.	Zuzana Nevěřilová: NER
12.4.	Lukáš Banič: Budovanie frázových tezaurov pomocou CQL dotazov a modifikácie word2vec-u
19.4.	Lukáš Banič: POS-tagging using minimal training sets
19.4.	Marek Medveď: GoodAI
26.4.	Vojtěch Kovář: Sketch Grammar development by non-native speaker
26.4.	Michal Růžička: Sémantické vyhledávání dokumentů
3.5.	Vojtěch Mrkývka: TBA
3.5.	Michal Štefánik: Klasifikace témat webových dokumentů. Postup a vyhodnotenie úspešností. Praktické postrehy z použitia nástrojov (gensim-preprocessing, -word2vec, -doc2vec, sklearn, tensorflow pre NN).
10.5.	Petr Mejzlík: Editor vertikálu
17.5.	Honza Rygl: Praktická demonstrace SIR (30 min)
17.5.	Terézia Šulganová: TIL
24.5. 13:00	Miloš Jakubíček: a možná prijde i dizertačka;) (A víno, sýry a tak...) subtopic: Syntactic and Logical Analysis of Natural Language and its Evaluation Methods

Program semináře v podzimním semestru 2016

datum	program
21.9.	program semináře na tento semestr
	Michal Měchura: Lexonomy
	workshop na UAA
5.10.
12.10.	Vítek Suchomel: Web crawling, DSL competition, Active learning for genre identification
19.10.	Pavel Rychly: Manatee
26.10.	Blanka Hanzlová: Antroponyms in Facebook group LARP CZ
26.10.	Vít Baisa: obhajoba dizertace nanečisto (max 20 min)
2.11.	Ahmed Abdalla: Sentiment Polarity
2.11.	Tomaž Erjavec: Slovene Academic Texts: Prototype Corpus and Research Plan
9.11.	Ondra Svoboda: PoS Tagging evaluation
16.11.	Adriana Babincova: Morphological variants - a problem of NLP
23.11.	Jakub Machura: Automatic Punctuation Detection
30.11.	Sandra Tukacova: Comparison of Czech and English WordNet(s)
	Nikola Ljubešić: The Tweet(Cat\|Geo\|Pub) suite for collecting, analysing and publishing Twitter corpora
	Darja Fišer: The JANES toolchain for processing non-standard language
	Honza Rygl: NN in NLP
7.12.	Adam Rambousek: Recent news from Institute of Czech Language
7.12.	Milos Jakubicek: TBA
14.12.	Marek Medved: AQA development
	Vojta Kovar: Wine, cheese, Christmas songs and syntax
	chatbot projekt

Program semináře v jarním semestru 2016

25.2.	program semináře na tento semestr
	témata BP/DP
	organizace TSD
	výběr nlpassist
	Habit: workshop v Addis Abeba
	zpracování a značkování czTenTenu15
	soutěž v umělé inteligenci o 20 000 http://rare-technologies.com/competitions/rarebot/
3.3.	Vojta Kovář: Řím a gold standardy
10.3.	TextMiner
	info schuzka pro potencialni nove PGS
	Miloš Jakubíček, Aleš Horák: nový český slovník
17.3.	Zuzka Nevěřilová: Annotation of MWEs and Foreign Words
17.3.	Marek Medveď: AQA: answer extraction
24.3.	Jitka Dvořáková: praktické využití českých korpusů při výuce na ZŠ
31.3.	~~Vítek Baisa: hierarchický jazykový model~~
31.3.	Ondřej Svoboda: „kde je plně označkovanej DESAM?“
7.4.	Ondřej Svoboda: nástroj na měření chyb při změnách tagsetu/značkování
7.4.	nlpunix - vyhled HW
14.4.	Honza Rygl: Style & Identity Recognition
14.4.	Pavel Rychlý: Efektivita distribuovaných výpočtů
21.4.	Vítek Baisa: bajtové jazykové modely
28.4.	Nikol Volková, Daniela Ryšavá: převod mezi CQL a přirozeným jazykem
5.5.	Ján Švec: Aktuálne o korpusoch s metainformáciami
12.5.	Vít Suchomel: 1. Protispamové úpravy v crawlingu. 2. Vlastnosti webových korpusů (homogenita, žánr dokumentu).
19.5.	Pavel Šmerk: TBA (Tracheobronchial amyloidosis)

Program semináře v podzimním semestru 2015

datum	program
23.9.	doktorát Herzinger
	Norské fondy - workshop na UAA
	publikace
	program semináře na tento semestr
	Noc vědců
	Pavel Šmerk: Derivanče
30.9.	nábytek do laboratoře
	Marek Medveď: konference RANLP
	Marek Medveď: možnosti zařízení z Norských fondů
	Vítek Baisa: rozhovor pro ruská média
7.10.	Honza Rygl: konference Data-Znalosti, workshop o Pythonu
14.10.	děkanské volno - čestný doktorát prof.Herzingera
21.10.	Michal Rott, TUL Liberec: Představení Laboratoře počítačového zpracování řeči
	Ján Švec: aktuálně o autorském korpusu
	Zuzka Nevěřilová: Seminář o NooJ
4.11.	Vojta Kovář: anglický EFa
11.11.	Vítek Baisa: aktuální výzkum TBC
18.11.	Pavel Šmerk: Internetová jazyková příručka a obrana proti vykrádání
25.11.	Zuzka Nevěřilová: něco o pojmenovaných entitách
2.12.	Marek Medveď: Question Answering
9.12.	Miloš Jakubíček: Nový český slovník
16.12.	Vítek Suchomel: Vyhodnocení protispamových úprav v crawleru

Program semináře v jarním semestru 2015

datum	program
17.2.	program semináře na tento semestr
	předmět Advanced NLP
	meeting COST akce ENeL
24.2.	Mgr internship
	zahraniční PGS
	Miloš Jakubíček: Vyhodnocování word sketchů (III), http://corpus.tools, správa dlouho běžících procesu ve SkE
3.3.	Zuzka Nevěřilová: workshop PARSEME
3.3.	Zuzka Nevěřilová: MWE
10.3.	Návrhy nových směrů na FI - do 31.3.
	Všichni: výstup na Milošovku :)
	Lucia Kocincová: GAČR - info pro uchazeče o grant
	Jana Rusinková: web NLP očami copywritera
17.3.	Winograd Schema Challenge
	Jana Rusinková: klasifikace dokumentů
	Lucia Kocincová: vizualizace korpusových dat
24.3.	Vítek Suchomel: spam ve webových korpusech
24.3.	Honza Bušta: klasifikace Creative Language
31.3.	Business Research Forum MUNI
	Vítek Baisa: extrakce vícejazyčné terminologie
	Vítek Baisa: novinky ve SketchEngine
	Vítek Baisa: SemEval 2015, task 15: report
7.4.	Ján Švec: Automatické budovanie webového korpusu
7.4.	Tomáš Čapek: update k Sholva a Czechtris
14.4.	Provozní řád - přístup do serverovny
	Dita Salajková: Počítačová simulace sociální role
	Honza Bušta: průběžné výstupy klasifikace Creative Language
21.4.	Vojta Kovář: Doplňování a korekce interpunkce v češtině
21.4.	Lucia Kocincová: new visualizations in Sketche Engine; usability testing and tracking tools
28.4.	Word Embeddings
28.4.	Ondra Svoboda: parser ijáček, parsování z pohledu slovosledu
5.5.	Marek Medveď: nové výsledky v QA
	Kristýna Zemková: jednoduše syntax a interpunkce
	Vítek Baisa: překladoví kandidáti pomocí kolokací
12.5.	Honza Rygl: další aplikace SIR
12.5.	Adam Rambousek: DEBWrite - dictionary application in one-click

Program semináře v podzimním semestru 2014

datum	program
16.9.	program semináře na tento semestr
	pokonferenční schůzka TSD
	termín RASLAN 2014
23.9.	Dana Hlaváčková: Návrh do OP VVV
	Vítek Baisa, Vojta Kovář, Zuzka Nevěřilová: workshop PLIN
	Petr Machovec: Sumarizace textu krátce (5 min)
30.9.	Pepa Bušta: Rozšiřování překladových pamětí
	Pavel Rychlý: HaBiT project
	Zuzka Nevěřilová: Jak proběhla Noc vědců
	možnost úvazku extrakce informací
7.10.	Petr Sojka: Math Information Retrieval: Past, Present and Future
14.10.	Vojtěch Kovář: Co se nevešlo do disertace
14.10.	Michal Růžička: Math Information Retrieval for Digital Libraries
21.10.	prof. Lu Qin from Hong Kong PolyU (with prof. Chu-Ren): Web Persons Disambiguation
21.10.	Hongkong study advertisements
4.11.	dr. Partha Pakray: Textual Entailment and Question Answering
4.11.	Pavel Šmerk: Přídavná jména od jmen místních
11.11.	Vít Baisa: Character-based language model
	Zuzka Nevěřilová: Prediktivní psaní
	Vojta Kovář: Vybrané (a aktualizované) kapitoly z disertace
18.11.	Adam Rambousek: Aktuální slovníkové projekty platformy DEB
18.11.	Statistika příspěvků RASLAN 2014
25.11.	Marek Medveď: Question Answering
25.11.	Tomáš Čapek: Czechtris
2.12.	Vítek Suchomel: Podobnost a stejnorodost (sub)korpusů
9.12.	Honza Rygl: Rozpoznávání stylu pisatele
16.12.	Petr Machovec: Sumarizace textu
16.12.	Miloš Jakubíček: wine & cheese & koledy

Program semináře v jarním semestru 2014

datum	program
18.2.	program semináře na tento semestr
25.2.	Pavel Hančar: Hadoop a jine MapReduce v labu
25.2.	Zuzka Nevěřilová: parafrázování a dr. Watsonson
4.3.	Vojta Kovář: něco o SETu
4.3.	Martin Čarnogurský: nové webové rozhraní pro Synt
11.3.	Vítek Suchomel et al: extrakce termínů
	Vítek Baisa: extrakce dvojjazyčné terminologie
	Lucia Kocincová: NLP web - rýchla diskusia o zániku/ponechaní stránok
18.3.	Louis Wei-lun Lu, FF, MU: zpracování tchajwanštiny a čínštiny na MU
18.3.	Honza Bušta: nlpunix -- stav a vize :)
25.3.	NLP robot
	web nlp - pristup, notifikace, preklopeni?
	Matej Pavla: Question answering se syntaktickou analýzou
	Vojta Kovář: něco o SETu -- dokončení
1.4.	Adam Rambousek: Tezaurus pro katastr
1.4.	Štěpán Přichystal: Question Game
8.4.	Jiří Materna: LDA rámce (stav před odevzdáním disertace)
15.4.	TSD - domluva na vyletu
15.4.	doplnit probehle prezentace!
22.4.	Vítek Suchomel: detekce spamu na webu
	Andrej Herich: Vyvozování znalostí v TIL
	Zuzana Nevěřilová: CICLing
29.4.	workshop se seznamem
	clanky do casopisu
	Honza Bušta: něco o neologismech a idiomech
6.5.	Lucia Kocincová: Parsovanie enTenTen aneb adaptácia MST a Malt Parseru na angličtinu
6.5.	Marek Medveď: slovenský synt
13.5.	Honza Rygl: autorství a kurz vedení vědeckého týmu
13.5.	Miloš Jakubíček: TBA

Program semináře v podzimním semestru 2013

datum	příspěvky
16. 9.	program semináře na tento semestr
	termíny RASLANu 2013
	web NLP -- co zbývá udělat? (Lucka, VítekB, Zuzka)
	nákupy HW
	trička NLP
23. 9.	Vítek Suchomel: stručné postřehy z konference Corpus Linguistics [10']
	Pavel Rychlý, Miloš Jakubíček: Virtuální korpusy v Manatee [30']
	Pavel Rychlý, Miloš Jakubíček: META-FORUM 2013 a 2014 [15']
30. 9.	Aleš Jiroudek: Možnosti paralelizace s platformou CUDA
	Zdeňka Sitová: Jak bylo na ESSLLI 2013
	Vít Baisa, Vojtěch Kovář, Miloš Jakubíček: Workshop pro PLIN v Baldovci [15']
	Zuzka Nevěřilová: Noc vědců
7. 10.	Aleš Horák: Info schůzka oborů UMI a PLIN, přednáška na kolokviu
	Vít Baisa: CAT a rozšiřování překladových pamětí
	Lucia Kocincová: How to write competitive proposals
14. 10.	Tomáš Čapek: nejspis NLP portal
21. 10.	Laboratorní seminář není dokonalý
28. 10.	Státní svátek - Den vzniku samostatného Československa (1918) :)
4. 11.	Zuzana Nevěřilová: Anotační hry/a
	Vojta Kovář: Novinky ve SkE, v SETu a vůbec :)
11. 11.	Vít Baisa: Novinky v CPA, SkE, drobnosti
	Lucia Kocincová: Jak propagovat nejen projekty
18. 11.	Martin Víta: Linked data in linguistics (a možná překlady inzerátů)
	Marek Medvěď: Lexikální analýza v Syntu
25. 11.	Vítek Suchomel: Spam v dokumentech z webu
	Jirka Materna: word2vec aneb statisticka semantika trochu jinak
2. 12.	Adam Rambousek: Slovník znakového jazyka
	Vít Baisa: Pár postřehů z české Wikikonference
9. 12.	Pavel Šmerk: TBA
	Honza Rygl: Autor
16. 12.	Lucia Kocincová: wine & cheese & koledy
	Honza Bušta: Nové neologismy

Program semináře v jarním semestru 2013

datum	příspěvky
20. 2.	program semináře na tento semestr
	možná spolupráce s Poznaní
	možná spolupráce s Chaps - S. Franc
27. 2.	CLARIN mobility granty, oživit http://nlp.fi.muni.cz/trac/research
	Vojta Kovář: co dělám na syntaxi a na SkE (přetečení z minulého semestru -- myslím, že tak na 30-60 minut, ale to už jsem si myslel předtím dvakrát :) )
	Zuzana Nevěřilová: Pojmenované entity v češtině
6. 3.	Zuzana Nevěřilová: CZPJ a média (zpráva ze semináře Jak prezentovat vědu v médiích)
	Vít Baisa: Nový editor CPA, Trac, Editor
	Všichni: Organizace práce v labu (trac, měsíční zprávy, peer-review atd.) v Trac
13. 3.	Ismaïl El Maarouf: Progress and perspectives in computational linguistics aspects of the DVC project
	Vašek Němčík: Saara a statistiky spoluvýskytů ze Ske [25']
	Marek Medveď: RFtagger na slovenštině
20. 3.	Vít Baisa:! ukázka CZ-EN MT pomocí suffix array
27. 3.	diskuse ke grantům - GAČR, TAČR
	Honza Bušta: Creative language
	Vítek Suchomel: lepší extrakce termínů než minule (a možná něco dalšího)
3. 4.	Miloš Jakubíček: CICLing 2013 (zážitky, poznámky, fotky, víno atd. - 30')
	prof. Zygmunt Vetulani: Invited talk
10. 4.	Martin Víta (F-solutions): Evaluace vybraných systémů MT na specifických kolekcích textů
	Kristýna Zemková: Využití syntaktické analýzy pro určování autorství
	Helena Palátová: Floskule
	Honza Michelfeit, Vojta Kovář, Miloš Jakubíček: Paralelní korpusy
17. 4.	Lucia Kocincová: parsery pro češtinu
24. 4.	Honza Rygl: Autor - (před)produkční verze
	Tomáš Čapek: obhajoba meho diplomanta nanecisto - komentarovy system pro online zdroje; novinky v NLP portalu, snad neco noveho k anotovani a CZWN
	Adam Rambousek: slovník znakového jazyka
	Vašek Němčík: Saara a preference na základě statistik spoluvýskytů a sémantických tříd [15']
15. 5.	Pavel Šmerk, Miloš Jakubíček: Nový a lepší tagger pro češtinu
	Vojta Kovář, Vítek Baisa, Miloš Jakubíček: WSeval
	Jiří Materna: Aplikace pro LDA rámce

Program semináře v podzimním semestru 2012:

18.9.2012
- program semináře na tento semestr
- informace o plánovaných změnách v doktorském studiu
25.9.2012
- Pavel Šmerk: Představení stránky o fajce
- RASLAN - místo a čas
- schůzka oborů UMI a PLIN
2.10.2012
- Petr Horáček (FIT VUT): Nové gramatické systémy a jejich lingvistické aplikace
- Vašek Němčík: Saara - proč, co, kde a jak. [~30']
- Aleš Horák: studentské projektu GA MU, dohody na anotace, práce nad texty PSP
9.10.2012
- Pavel Šmerk: Opravdu představení stránky o fajce
- Miloš Jakubíček: Proč a jak používat Git
- Pavel Rychlý: O značkování dat
16.10.2012
- Zdeňka Sitová: Erasmus a výuka AI na K.U. Leuven
- Miloš Jakubíček: Valence v Syntu aj.
- Jirka Vejvoda: Shlukování článků se stejnou tématikou v gensimu
23.10.2012
- Petr Sojka: Matematika v korpusové lingvistice (prezentace)
30.10.2012
- Zuzka Nevěřilová: Inference v textu
- Pavel Rychlý: projekty CLARIN a LINDAT
6.11.2012
- Vojta Kovář: co nového v rozhraní Sketch Engine (30')
- časopisecké publikace
13.11.2012
- Jiří Materna: LDA rámce -- další vývoj
20.11.2012
- Adam Rambousek, Vít Baisa: Lze použít CPA principy pro češtinu?
- Vít Baisa: Suffix array, longest common prefix a longest frequent prefix (SA, LCP, LFP)
27.11.2012
- Pavel Hančar: MapReduce
- Vojta Kovář: co nového v SETu (30')
- Lucka Kocincová: jak děláme skeče ze syntaktické analýzy a rozjíždíme cizí parsery
4.12.2012
- Vítek Suchomel: co nového v Corpus Architectu, získávání matematických textů z webu, czTenTen12 (30')
- Honza Rygl: Autorství (funkční DEMO)
- Petr Machovec: Prohledávání VerbaLexu
11.12.2012
- Marek Blahuš: Webové stránky pro studium češtiny (nabídka spolupráce na projektu CJV MU)
- Tomáš Čapek: OpenCZWordNet - plán a realizace
18.12.2012
- wine & cheese & koledy & tlačenka

Program semináře v jarním semestru 2012:

22.2.2012
- program semináře na tento semestr
- Pavel Rychlý: organizační pokyny
29.2.2012
- Andrej Gardoň: konference ICAART 2012
- Vojta Kovář: Nový zéland
- Honza Pomikálek: podobnost korpusů, extrakce termů
7.3.2012
- Vojta Kovář: ještě něco o konferenci na NZ[5']
- Miloš Jakubíček, Aleš Horák: poznatky z review
- Vašek Němčík: PDT2vert a "Brno ze zkumavky"
14.3.2012
- Vojta Kovář: Recent SET developments [15']
- Vojta Kovář: Yet another formalism for syntax? [15']
- Vítek Suchomel: new corpora (quick overview) [10']
- Vítek Suchomel: vertfork (parallelization tool) [5']
21.3.2012
- odpadá
28.3.2012
- Juyeon Kang: French supertagging (a little bit of Czech)
- Vašek Němčík: Saara (where and how) and corpora annotated for coreference (overview)
4.4.2012
- Miloš Jakubíček: citace RASLANu (5 min)
- Zuzka Nevěřilová: něco o odvozování v textu
- Tomáš Čapek: Dokumentování čehokoliv včera a dnes
11.4.2012
- Probrat, jestli nechceme ignorovat rektorské volno 16.5.
- Miloš Jakubíček: desamb se syntem
- Vít Baisa: CBLM - ukázka, diskuze spíše technického rázu [15']
18.4.2012
- Vít Baisa: ukázka dat z CBLM [10']
25.4.2012
- Adam Rambousek: FaNUK
- Vítek Suchomel: named entities recognition using GATE (3rd party software, brief demonstration) [15']
- Vašek Němčík: Saara evaluation
- Aleš Horák: info o pozicích v DERI, nabídka dat od Seznamu
2.5.2012
- Jiří Materna: Hierarchické LDA rámce
9.5.2012
- Honza Rygl: Autor demo 2
- Pavel Šmerk: fajka
16.5.2012
- Pavel Hančar: MapReduce
- Gulšan Dovudov: morphological analysis of Tajik
- Marek Medveď: Synt a SET pro slovenštinu
- Miloš Jakubíček & Lucka Kocincová: Trochu statistiky o UMI

Program semináře v podzimním semestru 2011:

22.9.2011
- program semináře na tento semestr
- kontrola cest
- Noc vědců
29.9.2011
- Honza Pomikálek, Vítek Suchomel: Jedi Crawler, jusText, Onion, Chared
6.10.2011
- Zuzka Nevěřilová: Sheldon's Cookbook
- Juyeon Kang: Intro
13.10.2011
- Vašek Němčík: Saara & how to feed her
20.10.2011
- Miloš Jakubíček: Zapojení syntu do desambu
- Vojta Kovář: ten zbytek do syntaktického semináře
27.10.2011
- Vítek Baisa: představení tezí, fotky z Kyrgyzstánu a organizační záležitosti k výletu do krasu
- Pavel Rychlý: Proč programovat v Pythonu. (přednáška nebude ani o Pythonu ani o programování( nlpcentre.pdf )
3.11.2011
- Petr Sojka et al.: The Art of Mathematics Retrieval
10.11.2011
- Jirka Materna: Nové a lepší LDA rámce (Prezentace)
17.11.2011
- seminář se nekoná, státní svátek
24.11.2011
- Adam Rambousek: Nová encyklopedie češtiny
1.12.2011
- Andrej Gardoň: Langauge, Mind and their simulation using TIL (Dolphin Nick, GuessME! )
- Presentation language: slovak
8.12.2011
- Honza Bušta: Idiomy (a idioty)
- Honza Bušta: Serverová aplikace pro korpus chyb
15.12.2011
- Pavel Hančar: MapReduce u nás v laboratoři
- Jan Rygl: DEMO Autorství
22.12.2011
- Pavel Šmerk: ajka => majka (a svařák a koledy?)

Program semináře v jarním semestru 2011:

23.2.2011
- program semináře na tento semestr
- informace o NlpAssistentce
- informace o cestách v roce 2011
2. 3. 2011
- Honza Pomikálek: PRESEMT + Čištění korpusových dat
9. 3. 2011
- Pavel Rychlý: Jak psát dobré programy
- Aleš Horák, Miloš Jakubíček, Vojta Kovář: Jak a proč vyhrál Watson Jeopardy?
16. 3. 2011
- Vít Baisa: Fotky z Chile & Argentiny
- Vít Baisa: Průběžné výsledky ze dvou poloautomatických anotací VerbaLexu
- Zuzka Nevěřilová: Nový formát VerbaLexu
23. 3. 2011
- Vašek Němčík: Saara a export PDT2 do vertikálu
- Aleš Horák, Miloš Jakubíček, Vojta Kovář: TIL korpus
30. 3. 2011
- Tomáš Čapek: Limity strojového překladu
6. 4. 2011
- info k návrhu GAČR projektu
- Miloš Jakubíček: synt: méně je více
- Karel Vaculík: Predicate-argument structure z české věty
13. 4. 2011
- info o H-indexu a citování
- Dana Hlaváčková: nová verze dat VerbaLexu
- Vojta Kovář: SET TBA
20. 4. 2011
- Vojta Kovář: SET (dokončení)
- Vít Baisa: Jeden princip: od morfologie až k reprezentaci znalostí
27. 4. 2011
- Jiří Materna: Introduction to Latent Dirichlet Allocation
- Jiří Materna: Semantic frames as probabilistic generative models
4. 5. 2011
- Miloš Jakubíček: (< 15 min) RFC: brief formát
- Vít Baisa: Jeden princip: od morfologie až k reprezentaci znalostí (dokončení)
- Petr Sojka et al: EuDML@MU status quo, demos
- Michal Růžička: Kanonizace MathML pro vyhledávání matematiky
- Milos Líška: Mathematical Indexing and Querying
11. 5. 2011
- Marek Blahuš: Rozšíření českého WordNetu podle anglického překladovým slovníkem - diplomová práce
- Marek Grác: nástin dizertačky TBA
18. 5. 2011
- Zdeněk Žabokrtský: Strojový překlad s využitím závislostní syntaxe
speciální přednáška - 31. 5. 2011
- prof. Aravind K. Joshi (University of Pennsylvania)

Program semináře v podzimním semestru 2010:

22.9.2010
- program semináře na tento semestr
- postery na Noc vědců - dodělat odkazy Vyzkoušejte si na náš web, vyrobit screencasty pro prezentaci
- nachystat schůzku UMI a PLIN, cca za 3 týdny, asi v B204 v Po v 18
29.9.2010
- Pavel Rychlý: ČAJ (aneb když jsme byli mladí a hezcí)
- Honza Bušta: Erasmus
- kde jsme byli, co jsme viděli
6.10.2010 EuDML – status reports
- Petr Sojka: EuDML latest developments, WP7
- Michal Růžička, Petr Kovář: Metadata Editor
- Radim Hatlapatka: PDF Enhancements Tools
- Zuzana Nevěřilová: Visual Browser 4 Math – use cases
- Martin Líška: Mathematical Indexig and Quering
- Peter Mravec: Searching on Corpora of Mathematics Texts
13.10.2010
- Tomáš Čapek: Výsledky heuristických testů nad CZWN
20.10.2010
- Zuzana Nevěřilová: něco o named entity recognition a Wikipedii
27.10.2010
- záskok Adam Rambousek
3.11.2010
- Vašek Němčík: Saara - demo a sbírání postřehů a feature requests
- Honza Bušta: Detekce idiomů v korpusu
10.11.2010
- Vít Baisa: PZPJ: přístup "odspodu"
17.11.2010
- seminář se nekoná - státní svátek
24.11.2010
- Marek Blahuš: pracovní stáž ve Francii
- Miloš Husák: sémanticky podložená extrakce informací z korpusu
1.12.2010
- Miloš Jakubíček, Vojta Kovář: syntaktický seminář– PDT, synt, set, TIL projekt a další
8.12.2010
- Jiří Materna: Určení tematické konzistence dokumentu
15.12.2010
- Pavel Šmerk: wine & cheese a koledy apod.
- Dana Hlaváčková, Vašek Němčík: Editace VerbaLexu

Program semináře v jarním semestru 2010:

24.2.2010
- program of the seminar
- planning of publications and trips
3.3.2010
- Zuzka Nevěřilová - Xplain ( neverilova_xplain.pdf )
10.3.2010
- Aleš Horák, Pavel Rychlý - návrhy nových přednášek
- Pavel Šmerk - new [fm]ajka and a new lexicon
- Miloš Jakubíček - Erasmus in Saarbruecken
17.3.2010 EuDML I
- Petr Sojka: Digital Mathematics Library: from DML-CZ to EuDML
- Michal Růžička: (Meta)data acquisition and validation
- Miha Filej: Localization issues in Metadata editor web application
- Radim Hatlapatka: PDF recompression
- Zuzana Nevěřilová: Metadata processing
24.3.2010
- Přestavba laboratoře
- Adam Rambousek: Corpus Pattern Analysis for Spanish, Italian, Czech, ...
- Tomáš Čapek: WordNet heuristic tests
31.3.2010
- Marek Grác, Vojta Kovář: Noun phrases semantic annotation
7.4.2010
- Honza Pomikálek - odstraňování boilerplate a duplicit
14.4.2010
- Vašek Němčík: PDT 2.0, anotace, detekce klausí, atp.
21.4.2010
- Vojta Kovář: The SET Parsing System and why I do not have a better presentation about it
28.4.2010 Towards EuDML
- Petr Sojka: Towards European Digital Mathematics Library
- Michal Růžička: Data Acquisition and Enhancements
- Miha Filej: Localization issues in Metadata editor web application
- Radim Hatlapatka: PDF enhancement tools
- Zuzana Nevěřilová: Visual Browser 4 DML
- Martin Liška: Mathematical Indexing and Querying
5.5.2010
- Marek Blahuš: Česko-slovenský paralelní korpus Aktualne
- Jirka Materna: Linking VerbaLex with FrameNet
12.5.2010
- Vít Baisa: Comparing English and Czech Word Sketches
- Honza Bušta: TBA
19.5.2010
- Miloš Jakubíček: valence v syntu
- Zuzka Nevěřilová: něco o slovesech

Program semináře v podzimním semestru 2009:

23.9.2009
- program semináře na tento semestr
- plánování publikací a cest
30.9.2009
- Tomáš Čapek, Adam Rambousek - český wordnet v DEBDictu
- Tomáš Čapek - koncepce pro opravy v českém wordnetu
7.10.2009
- Karel Pala - návrh na koupě HW a SW
- Petr Sojka - prezentace navštívených konferencí a workshopů - TSD 2009, ECDL 2009, DML 2009
- změny a aktualizace na laboratorním webu
- Vít Baisa - několik návrhů na změnu vzhledu a na doplnění obsahu lab. webu
14.10.2009
- ňáký anafory v syntu jsou nemocný ... budou presentovány po uzdravení
21.10.2009
- Marek Grác - GUI klikátko na slovesné valence
- Zuzka Nevěřilová - Extending VerbaLex ( neverilova_prezentace.pdf )
- navrhované BP/DP
28.10.2009 - svátek, seminář není
4.11.2009
- Jiří Materna - Doménové kolokace
11.11.2009
- Jaroslav Moravec - Korekturní rozšíření pro OpenOffice.org
18.11.2009
- Honza Pomikálek - nový algoritmus na klasifikaci odstavců
- příprava na raslan
25.11.2009
- Aleš Horák - stav VerbaLexu
- Adam Rambousek, Aleš Horák - projekt KYOTO
- Marek Blahuš - Kontrolor pravopisu pro Esperanto - studentský projekt
2.12.2009
- Vašek Němčík - Anafory v syntu
9.12.2009
- Vojta Kovář - SET a vůbec a jak je to se studentskýma projektama
- Honza Bušta - KMJ, neologismy
- Vít Baisa - Asistovaný překlad
16.12.2009
- Vít Baisa - Asistovaný překlad (krátké dokončení z minula, diskuze)
- Honza Pomikálek - disertačka o korpusech
- Miloš Jakubíček - LTC, LCT, lt-world.org a další diskuse ohledně zviditelnění CZPJ

Program semináře v jarním semestru 2009:

17.2.2009
- program semináře na tento semestr
- plánování publikací a cest, hodnocení vědy a výzkumu
24.2.2009
- Miloš Jakubíček: stručně k nalezeným ISI proceedings et al. a informace o novém laboratorním prosemináři
- Radim Řehůřek: Detekce jazyka po stodvacáté – slovníková metoda vs. písmenné ngramy, vícejazyčné texty
- Aleš Horák: informace o (http://nlp.fi.muni.cz/cs/NLPaRozpoznavaniReci) požadavku řečařů z Liberce (prof.Nouza)
3.3.2009
- Aleš Horák: ještě k požadavku řečařů z Liberce
- Aleš Horák: různé - přidat otravnou zprávičku o ochraně dat labu, publikace v březnu
- Marek Blahuš: Zkušenosti z půlročního pobytu na K.U.Leuven v Belgii v rámci programu Erasmus
10.3.2009
- Marek Grác: NLPunix
- Pavel Rychlý: Korpus Czes
17.3.2009
- Tomáš Čapek: Nové MWE
24.3.2009
- Honza Pomikálek: CICLING 2009 v Mexiku
31.3.2009
- Vojtěch Kovář: Syntaktická analýza češtiny: současný stav, problémy a nápady na jejich řešení, analyzátor SET
7.4.2009
- Jiří Materna: Rozšiřování VerbaLexu o informace z Framenetu
14.4.2009
- Miloš Jakubíček: Využití extrakce struktur: interpunkční korektor a extrakce valencí
- Marek Grác, Miloš Jakubíček, Jan Bušta: O kolokviu mladých jazykovědců v Prešově
21.4.2009
- Miloš Jakubíček, Jan Bušta: Korpus chyb
28.4.2009
- Adam Rambousek, Aleš Horák: Postup v projektu KYOTO
5.5.2009
- Marek Grác: I cesta může být cíl
- Honza Pomikálek: Corpus Architect
12.5.2009
- Pavel Šmerk: to stačí (TBA)
19.5.2009
- Václav Němčík: TBA
- Pavel Rychlý: Translingual Europe 2009

Program semináře v podzimním semestru 2008:

17.9.2008
- program semináře na tento semestr
- plánování cest a workshopu RASLAN 2008
24.9.2008
- Pavel Rychlý: Proč (ne)programovat v některých jazycích II
1.10.2008
- Aleš Horák: zhodnocení TSD 2008
8.10.2008
- Miloš Jakubíček, Jan Bušta: EMLS 2008
- Petr Sojka: From Pixels to Minds and Back
15.10.2008
- Pavel Rychlý, Honza Pomikálek: BiWeC II
22.10.2008
- Jiří Materna: Seznámení s FrameNetem a nápady pro český FrameNet
29.10.2008
- Vašek Němčík: Anaphora Resolution & MMAX2 & PDT2
5.11.2008
- Vojta Kovář, Miloš Jakubíček: Test suite a další novinky v syntu
12.11.2008
- Vojta Kovář: Syntaktická analýza s využitím postupné segmentace věty (SET)
19.11.2008
- Jan Bušta: Četnost idiomů v korpusu
26.11.2008
- Aleš Horák, Adam Rambousek: Postup v projektu KYOTO
3.12.2008
- Honza Pomikálek, Vojta Kovář: Mikulášský Corpus Architect
- Honza Pomikálek, Vojta Kovář: Výsledky NLPbota ve FIBotovi
10.12.2008
- Tomáš Čapek: Semantické sítě a hierarchické lexikony v praxi
17.12.2008
- Pavel Šmerk: (hotová?) nová ajka
- Máša Khokhlova: Krátká Vánoční zpráva, aneb opožděné představení

Program semináře v jarním semestru 2008:

27.2.2008
- Pavel Rychlý: Od programování k filosofii a zpět
5.3.2008
- Husák: GDEX, Good Dictionary Examples
- Webadmini NLP (Němčík): MoinMoin Wiki
12.3.2008
- Vláďa Kadlec, Vojta Kovář, Aleš Horák: Syntaktická analýza s využitím slovesných valencí
- Admini NLP: Jak formátovat disky, udržba distribuce na strojích NLP, apod.
19.3.2008
- Honza Pomikálek: Jak spolehlivě detekovat kódování znaků, známe-li jazyk textu
- Radim Řehůřek, Petr Sojka: Klasifikace matematických textů
26.3.2008
- Vojta Kovář: Postupná segmentace věty a její využití v syntaktické analýze
2.4.2008
- Marek Blahuš: Kontrola pravopisu a její specifika pro jazyk esperanto
- Jiří Materna: Automatické určení domény české webové stránky
9.4.2008
- Pavel Rychlý, Honza Pomikálek: BiWeC (Big Web Corpus)
- Pavel Šmerk: Guesser
16.4.2008
- Jakubíček: Extrakce struktur syntaktického analyzátoru
23.4.2008
- Vašek Němčík: WordNet Assistant
- Aleš Horák: KYOTO projekt
30.4.2008
- Radim Řehůřek: Oprava překlepů ve fulltextovém hledání Seznam.cz (1h až neomezeně)
7.5.2008
- Bušta: Četnost idiomů v korpusu
14.5.2008
- Petr Sojka et al.: DML-CZ
21.5.2008
- probírání nákupu HW, organizace laboratoře

Program semináře v podzimním semestru 2007:

18.12.2007
- Víťa Nováček - co dělám v Irsku :-), aneb: (1) projekt Knowledge Web - dynamic ontology lifecycle, integrace ontologií; (2) Jak se peče OWL - nahlédnutí do kuchyně W3C; (3) empirické usuzování - pokus o jedno čistě soukromé kacířství na pokračování... Rozsah a pořadí konkrétních témat můžeme libovolně upravit dle zájmu a času na místě.
11.12.2007
- Vojta Kovář - Opravdu hotový beautified chart
4.12.2007
- Vašek Němčík - Anaphora Resolution: krátký úvod; ukázka dat pomocí MMAX; ukázka anotace v PDT2; ukázka dat získaných ze syntu; výhled do budoucna (využití valencí/thesauru, strojové učení)
27.11.2007
- pro nemoc se seminář nekoná
20.11.2007
- Adam Rambousek, Aleš Horák - Administrační rozhraní DEB
13.11.2007
- Vláďa Kadlec - Syntaktická analýza přirozeného jazyka založená na bezkontextových gramatikách
6.11.2007
- Honza Pomikálek, Pavel Rychlý - Odstraňování duplicit v korpusu
30.10.2007
- Dana Hlaváčková - VerbaLex 2.0
23.10.2007
- Marek Grác - Parciální vzory pro slovesa
16.10.2007
- Pavel Šmerk – Od naskenovaného textu ke značkovaným validovaným datům (SSJC, PSJC)
9.10.2007
- Aleš Horák, Adam Rambousek - Global WordNet Grid
2.10.2007
- Honza Pomikálek - Tvorba paralelních korpusů z webu
25.9.2007
- Dana Hlaváčková - přehled možností pro výjezdní zasedání laboratoře
- Pavel Rychlý - Opravdu velké (dvacetimiliardové) korpusy
18.9.2007
- vytvoření seznamu prezentací pro tento semestr
- cesty do konce roku
- nlpweb, prezentace laboratoře na fi?
- nlpunix, marx
- vyjezdni zasedani laboratore

Nabídka vystoupení:

Vláďa Kadlec, Aleš Horák - Syntaktická analýza s využitím slovesných valencí
Honza Pomikálek - jak spolehlivě detekovat kódování znaků, známe-li jazyk textu

Program semináře v jarním semestru 2007:

15.5.2007
- Petr Sojka - Od naskenovaného textu ke značkovanému repositáři matematických textů
- Marek Grác - Nástroj pro automatickou tvorbu česko-slovenského slovníku
24.4.2007
- Vašek Němčík - Anaphora Resolution
17.4.2007
- Pavel Šmerk - ajka2: "chci být jiná, lepší"
10.4.2007
- Mirek Prýmek, Aleš Horák - projekt ElNet, simulační systém Rice
- Pavel Šmerk - ajka2: "chci být jiná, lepší"
3.4.2007
- Vojta Kovář - Zobrazování konkordancí obousměrných horizontálních textů
- Vojta Kovář - synt - beautified chart
- Radim Řehůřek - Segmentace textu, vyhodnocení
27.3.2007
- Dana Hlaváčková - aktuální práce na VerbaLexu, diskuze o problémech při editaci
20.3.2007
- Patrick Hanks, Adam Rambousek - CPA
13.3.2007
- Pavel Rychlý - Kapradí - nástroj pro práci s paralelními korpusy anglického dramatu
- Jiří Materna, Richard Šimek, Marek Grác - Valenční rámce v analyzátoru Zuzana
- Vláďa Kadlec - Použití VerbaLexu v syntu
6.3.2007
- Martin Kudlej, Adam Rambousek - Cornetto – nizozemský wordnet
- Tomáš Čapek - prezentace CMS systému DRUPAL
27.2.2007 - v laboratoři B203
- Tomáš Čapek - praktické použití českého WordNetu, problémy s jeho ontologií
20.2.2007 - v B411
- plán vystoupení na semináři na celý semestr
- Vašek Němčík - prezentace laboratoře na webu FI
- úprava velkého labu pro to, aby v něm mohly být další semináře

Program semináře v podzimním semestru 2006:

19.12.2006
- Vašek Němčík - anaphora resolution, wordnet assistant
- Pavel Šmerk - český tagger
12.12.2006 v akvárku
- Radim Řehůřek! - segmentace a (ne)indexování textů
5.12.2006
- James Thomas - Využití korpusů ve výuce jazyků
28.11.2006 v akvárku
- Pavel Rychlý – finlib
21.11.2006 v zasedačce
- Adam Rambousek - nlpis
- Jarek Hlávka - nlplab-ubuntu
14.11.2006
- Aleš Horák - GDW a wwwsynt, GUI rozhraní k syntu
7.11.2006
- Tomáš Čapek - DTP v Open Source
31.10.2006 v B411
- Martin Rajman - informace o možné spolupráci se švýcarskou EPFL
24.10.2006
- Lubomír Popelínský - Strojové učení a přirozený jazyk 2004-6 (ve vztahu k laboratoři vyhledávání znalostí)
17.10.2006
- Vojta Kovář - Redukce počtu stromů na výstupu Syntu. Beautified stromy, beautified chart, přehled dalších metod
10.10.2006
- POZOR jsme v zasedačce
- stanovení programu semináře na celý semestr
- zprávy z konferencí a workshopů (SemWeb, Euralex, ...)
3.10.2006
- diskuze - zálohování, laboratorní plakát, web
- přestavba velkého labu
26.9.2006
- Adam Rambousek – jak vyrábět deb-balíky
19.9.2006
- seznámení, představení, návrhy na prezentace

Program semináře v jarním semestru 2006:

23.5.2006
- Radim Řehůřek - zkusenosti z pulrocniho pobytu v Belgii v ramci programu Erasmus
16.5.2006
- Vašek Němčík - Anaphora Resolution: úvod do problematiky, modulární systém presentovaný v diplomové práci, výhledy do budoucna
- Pavel Cenek - From Unimodal to Multimodal Dialog Management
9.5.2006
- Mudrak - OCR matematiky v ramci projektu DML CZ
- Marek Grác, Radovan Štancel - Česko-slovenský strojový překlad
2.5.2006
- Petr Sojka - obecně o projektu DML CZ
- Panak - OCR matematiky v ramci projektu DML CZ
25.4.2006
- Zuzana Nevěřilová - program pro korekturu textů
11.4.2006
- Víťa Nováček - dolování (fuzzy) ontologií z textu v NL
4.4.2006
- Pavel Šmerk - český značkovač
28.3.2006
- Adam Rambousek - DEB a jeho noví klienti
14., 21.3.2006
- Co chceme v laboratoři dělat a co děláme (nástin probíhajících/připravovaných projektů)
7.3.2006
- Pavel Rychlý: Stručné dokončení z minulého semináře
28.2.2006
- Pavel Rychlý: V čem a jak programovat aneb proč neprogramovat v jazycích Java, Perl, C++, XSLT, ...
21.2.2006
- Honza Pomikálek: WebBootCaT (tvorba korpusů z webu), MetaTrans (překladový metaslovník)

Program semináře v podzimním semestru 2005:

21.12.2005
- Lukáš Svoboda: Dialogový systém UIO
14.12.2005
- Patrick Hanks: Corpus Pattern Analysis
- Anna Rumshisky:
7.12.2005
- Zuzka Nevěřilová: řekne později ;-)
- Víťa Nováček: Ontology learning
30.11.2005
- seminář se nekoná
23.11.2005
- Honza Pomikálek: GVP, textové klasifikátory
- Jeník Provazník: Inteligentní webcrawler
16.11.2005
- Pavel Šmerk: stav morfologické desambiguace, značek a korpusů
2.11.2005
- Aleš Horák, Adam Rambousek, Martin Kudlej: DEB II - platforma pro vývoj slovníkových editorů
26.10.2005 (výjimečně v B411)
- Jirka Mikulášek: blizna, pestík, floret, is-text-search, ...
- Vladimír Kadlec: Robust stochastic parsing using optimal maximum coverage
19.10.2005
- Honza Pomikálek: Corpus Builder
12.10.2005
- Pavel Rychlý: Korpusový manažer Manatee: použití, nástroje, API
21.9.2005
- Seznamení: Každý aktivní spolupracovník řekne, čím se zabývá a zejména čeho by chtěl v následujícím semestru dosáhnout.

Program semináře v jarním semestru 2005:

9.6.2005 - 29.9.2005
- pouze příležitostně po předchozím ohlášení e-mailem na all at aurora.fi.muni.cz
2.6.2005
- Zdenko Staníček: Universální informační robot
26.5.2005
- Honza Provazník, Petr Jurášek - NLP unix
19.5.2005
- Václav Brožek: Formát pro uložení víceznačné morfologie a syntaktických struktur ve vertikálu
- všeobecná diskuze: společný projekt české morfologie (desam + ajka)
12.5.2005
- Pavel Šmerk: stav a možnosti úprav korpusů DESAM a Stoka
- všeobecná diskuze: web laboratoře
- všeobecná diskuze: značky v ajce
5.5.2005
- Pavel Cenek: Řízení dialogu
- všeobecná diskuze: značky v ajce
28.4.2005
- Pavel Rychlý: práce s daty, čeho se vyvarovat
- všeobecná diskuze: budoucnost ajky
21.4.2005
- Pavel Rychlý: Nový velký slovník cizích slov
14.4.2005
- Petr Sojka: Competing Patterns in Language Engineering and Computer Typesetting
- Zuzana Nevěřilová: Vizuální lexikon
- Zuzana Nevěřilová, Petr Sojka: Visualizace sémantického webu na příkladu doménově vymezené digitální matematické knihovny
7.4.2005
- Lukáš Svoboda: uuiiuioo
31.3.2005
- Radek Sedláček: Morfologický analyzátor Ajka
- Dana Hlaváčková, Aleš Horák: Lexikon slovesných valencí FI MU Vallex
24.3.2005
- Pavel Rychlý: Tvorba korpusu
- Marek Veber: Editor morfologické databáze i_par
17.3.2005
- Jan Pomikálek a spol.
10.3.2005
- Aleš Horák a Vladimír Kadlec: Syntaktický analyzátor synt
3.3.2005
- krátké (max. několik minut) představení se každého aktivního spolupracovníka, na čem aktuálně pracuje, zamýšlí pracovat, případně pracoval.