Čeština
English
  • Vítejte na stránkách NLP Centra!
  • Zapojte se do vývoje softwarových nástrojů!
  • Analýza přirozeného jazyka
  • Vyzkoušejte si korpusy o velikosti knihoven online!
  • Studujte jednu ze specializací!
  • Členové laboratoře

Programme of the Laboratory Seminar in the past semesters

This page does not contain the program of the current seminar, it only shows the history of the past semesters of the Laboratory Seminar.

Seminar programme in the spring semester 2023

date programme

14.2.

seminar programme for this semester

21.2.

Pavel Rychlý: Data Processing

28.2.

Mauro Le Donne: Tokenisation of Italian Pre-trained Models
Vítek Suchomel: Text processing in Linux – hands on example

7.3.

David Porteš: Discussion about Research Tools

14.3.

Katarína Hudcovicová: Propaganda detection
Ondřej Sotolář: Explainability Tools – link to presentation

21.3.

Hien Thi Ha: Information extraction from scanned documents

28.3.

Edoardo Signoroni: Overview of Low-Resource Machine Translation

4.4.

Michal Měchura: Issues and challenges when encoding dictionaries on computers

11.4.

Marek Medveď: Full AQA pipeline
Krištof Anetta: Medical text content understanding

18.4.

Hien Thi Ha: Information extraction from scanned documents

25.4.

Ondřej Metelka: Automatic morphological paradigm construction
Radoslav Sabol: Optimizing the Inference of Neural Transformer Models
Veronika Andrlová: Training a Czech Discussion Robot

2.5.

Tomáš Houfek: Czech Medical Language Model and Document Classification
Petr Zelina: Medical Data Processing

9.5.

Michaela Denisová: Cross-lingual embedding models
Ondřej Sotolář: Conference report: AISTATS, EACL

Seminar programme in the autumn semester 2022

date programme

14.9.

seminar programme for this semester
Aleš Horák: RASLAN 2022 Call for Papers

21.9.

Vítek Novotný, Martin Geletka, Marek Toma, Petr Sojka: Report from CLEF 2022
Marek Medveď: SQAD+AQA

5.10.

Ondřej Sotolář: Psychological phenomena in dialogues
Aleš Horák: Contract research with Azure Language Studio

12.10.

Petr Zelina: Patient similarity

19.10.

Tereza Vrabcová: Machine translation of the FI MU website

26.10.

Vítek Novotný: AHISTO NER

2.11.

Edoardo Signoroni: High-frequency tokenizer
Dominik Tuchyňa: TBA

9.11.

Katarína Hudcovicová: Propaganda detection

16.11.

Ondřej Metelka: Automatic morphological paradigm construction
Radoslav Sabol: Propaganda Detection with Stylometry

23.11.

Ota Mikušek: Lingua - language detection tool and language detection in historical texts
Veronika Andrlová: TBA

30.11.

Yevhenii Karpizenkov: Processing of legal texts
Samuel Wittlinger: Speaker identification
Krištof Anetta: Health records analysis
Mauro Le Donne: Word Blendings in Italian

7.12.

David Porteš: Multilingual neural representations
Michaela Denisová: Cross-lingual embedding models
Veronika Andrlová: Training a Czech Discussion Robot
Dominik Tuchyňa: Source Code Processing

Seminar programme in the spring semester 2022

date programme

16.2.

seminar programme for this semester

23.2.

Pavel Rychly: Modules for Machine Translation (MoMaT)
Pavel Rychly: NLP data processing

2.3.

Zuzana Neverilova: Konica Minolta projects
Michal Stary: Event Miner
Radoslav Sabol: Officebot
Ivan Hochman: Logo detection

9.3.

Rastislav Papčo: Topic classificaton in web corpora
Vit Suchomel: Corpus Data Checks

16.3.

Greta Zella: Introduction
Adam Hajek: Czech Summarization
Tomas Foltynek: Authorship verification (try it out)

23.3.

Tereza Vrabcova: Machine translation training
Hien Thi Ha: OCRMiner

30.3.

Kristof Anetta: Electronic health records analysis

6.4.

Ondrej Sotolar: Dialogue act classification

13.4.

Ota Mikusek: Czech members of parliament sentence identification

20.4.

Filip Bobek: OCR Evaluation
Zuzana Nevěřilová: Invoice Mining
Mahmut Arslan: EHR processing

27.4.

Veronika Burgerova: Conversion between first and third person
Marek Medveď: Unanswerable questions

4.5.

Kamila Samajova: Pepper app
Daniel Kratky: Adding accents with the use of transformers

11.5.

Edoardo Signoroni: Sentence alignments - evaluation
Filip Brukner: Enriching essays with generated attributes
Greta Zella: TBA

Seminar programme in the autumn semester 2021

date programme

16.9.

seminar programme for this semester
Aleš Horák: RASLAN 2021 Call for Papers

23.9.

Vít Novotný: SIGIR 2021 and RANLP 2021
Adam Rambousek: AHISTO project

30.9.

Michaela Denisová: Crosslingual embedding models

7.10.

Mikuláš Bankovič: Superresolution techniques for OCR

14.10.

Rastislav Papčo: Topic classificaton in web corpora
Edoardo Signoroni: Corpus alignment by machine translation techniques

21.10.

Dalibor Bačovský: Improving the Subword Model of fastText

4.11.

Ondřej Sotolář: Facebook conversations classification
Radoslav Sabol: Language identification and sentiment analysis for social network texts

11.11.

Tereza Vrabcová: Preparation of Parallel Corpora for Machine Translation
Adam Hájek: Automatic text summarization using GPT-2

18.11.

Petr Zelina: Czech transformers
Samuel Špalek: Tokenizers: comparison of 'utok' and 'unitok'

25.11.

Marek Medveď: Answer Context in Question Answering
Kristína Němcová: Multimodal machine learning

2.12.

Tomáš Houfek: Information extraction from medical records
Daniel Krátký: Adding accents to Czech texts

9.12.

Krištof Anetta, Mahmut Arslan: Electronic health records processing

Seminar programme in the spring semester 2021

date programme

2.3.

seminar programme for this semester

9.3.

Pavel Rychlý: projekt LINDAT/CLARIAH-CZ
Pavel Rychlý: projekt strojového překladu
Pavel Rychlý: projekt generování slovníku

16.3.

Helena Medková: Zeugma Detection using Word Sketch
Vítek Novotný: EDS-MEMBED: Multi-Sense Embeddings Based on Enhanced Distributional Semantic Structures via a Graph Walk over Word Senses

23.3.

Michal Štefánik: Unsupervised Estimation of Out-of-Domain Performance of Language Models
Marek Medveď: SQAD database update

30.3.

Hien Thi Ha: Block type classification from scanned invoices
Vítek Novotný: Combining log-bilinear language models with Transformers

6.4.

Tomáš Houfek: Vytěžování dat z lékařských zpráv

13.4.

Mikuláš Bankovič: Application of super-resolution on OCR of historical documents
Adam Hájek: výpočet GTP-2 na Metacentru

20.4.

Tereza Vrabcová: Parallel corpus from web pages
Vítek Novotný: When FastText Pays Attention (preprint)

27.4.

Tereza Kinská: Creation of Judikatura corpora of court decisions
Pavel Rychlý: Using Makefiles for NLP projects

4.5.

Petr Zelina: ALBERT Training with TensorFlow and PyTorch

11.5.

Krištof Anetta: Electronic Health Records processing, Apache cTakes

18.5.

Ondřej Sotolář: Building a Corpus for Personal Data Detection

25.5.

Michal Starý: Event Detection

Program semináře v podzimním semestru 2020

datum program

6.10.

program semináře na tento semestr
Aleš Horák: RASLAN 2020 Call for Papers
Aleš Horák: TSD 2020
Zuzana Nevěřilová: Clarin conference 2020

13.10.

Vítek Novotný: MIR@MU at ARQMath 2020
Vítek Novotný: Enhancing word embeddings: Positionality, subword sizes, and hyphenation

20.10.

Zuzana Nevěřilová: Information Extraction from Medical Forms

27.10.

Hien Thi Ha: Contract information extraction
Vítek Novotný: When Tesseract does it alone: OCR of medieval texts

3.11.

Helena Medková: Zeugma detection

10.11.

Veronika Burgerová: Time and date extraction and normalization

24.11.

Alexander Macinský: NL processing of Japanese for Dictionary Systems

1.12.

Krištof Anetta: Electronic Health Records processing
Adam Hájek: Automatic Text Summarization

8.12.

Radoslav Sabol: Officebot

15.12.

Marek Medveď: Question Answering dataset SQAD

5.1.

Marie Stará: Towards the evaluation of automatic explanations
Petr Zelina: Transferring ALBERT from en to cs

12.1.

Ondřej Sotolář: Personal Data Anonymization

Program semináře v jarním semestru 2020

datum program

19.2.

program semináře na tento semestr

26.2.

Aleš Horák: konference TSD 2020
Pavel Rychlý: LINDAT CLARIAH
Pavel Rychlý: Simplicity

4.3.

Miloš Jakubíček: Co je nového ve Sketch Engine a LCC

11.3.

seminar cancelled due to COVID-19 regulations

18.3.

seminar cancelled due to COVID-19 regulations

25.3.

Samuel Gazda: Word game Ghost for the robot Pepper

1.4.

Renáta Pivodová: Zpracování nových gramatických fenoménů v logické analýze PJ
Michal Hala: Implementace efektivní sémantické sítě pro reprezentací znalostí

8.4.

Vít Novotný: Joint word embeddings and soft cosine measure at ARQMath

15.4.

Veronika Burgerová: Paraphrase Generation for Czech

22.4.

Marie Stará: Automatic creation of explanations
Petr Zelina: Evaluating Czech ALBERT

6.5.

Michal Starý: Event Miner

13.5.

Hien Thi Ha: Information extraction from contracts

Program semináře v podzimním semestru 2019

Audio/video komentáře jsou k dipozici zde

datum program

17.9.

program semináře na tento semestr
Eniafe Festus Ayetiran: Research Intro
Ondřej Herman: RANLP conference
Petr Sojka: TUG conference and 25th Anniversary of FI MU
Aleš Horák: RASLAN 2019 Call for Papers

24.9.

Zuzana Nevěřilová: Summer Schools on Deep Learning
Michal Měchura: NVH: Problems with XML/JSON/YAML and the ultimate solution.

8.10.

Vít Suchomel: Classification of Topics of Web Documents Using Fasttext's Supervised Learning on Classes and Data from dmoz.org
Vít Suchomel: Active Learning Demo Shown at Night of Scientists
Presentation slides
Souležba na sedací soupravě jako příklad špatné lexikografie.

15.10.

Eniafe Festus Ayetiran: Multi-sense Embeddings

22.10.

Pavel Rychlý: Meeting of the Czech Speech & NLP Community
Luca Brigada Villa: Relations between syntactic dependency graphs and dependency parsing

29.10.

Vít Novotný: Text classification with word embedding regularization and soft similarity measure

5.11.

Martin Víta: Figurative Language Paraphrasing

12.11.

Martin Kroon: Towards the automatic detection of syntactic differences
Veronika Burgerová: Evaluation and Error Analysis of Rule-based Paraphrase Generation for Czech

19.11.

Pavlína Klimešová: Neural networks for Czech sentiment analysis
Pavlína Klimešová: BERT experiments with SQAD 2.0 and 3.0
Hien Thi Ha: Information extraction from scanned invoices

26.11.

Michal Starý: TBA

3.12.

Marie Stará: Automatically Created Definitions -- What's New
Adam Hájek: Automatic Text Summarization

10.12.

Petr Zelina: Pretraining an (AL)BERT model

17.12.

Ondra Herman: Word Senses
Michala Vacíková: Online kurz počítačové lingvistiky

Program semináře v jarním semestru 2019

datum program

20.2.

program semináře na tento semestr
Josef Plch: Substituční segmentér

27.2.

Tomasz Jadczyk: CardioCube - Conversational AI for cardiovascular patients
moved to April 10
Marek Medveď: ICAART 2019

6.3.

Vít Suchomel: žánry
Pavel Rychlý: word2vec - odkrývání magie Yoav Goldberg -- word embeddings

Monday 11.3. 12:00

David Sears: Collocations in music? What systematic musicology can learn from corpus linguistics

13.3.

Hien Thi Ha: NLP of Vietnamese

20.3.

Marie Stará: Automatické vytváření definic

27.3.

Vít Novotný: Trains of Thought in Informations Retrieval (10")
Dávid Lupták: Effective Indexing, Searching and Querying of Structures (10")
Adam Rambousek: Systém pro tezaury odborné terminologie

3.4.

Štěpán Balážik: TBA
moved to April 24

10.4.

Tomasz Jadczyk: CardioCube - Conversational AI for cardiovascular patients
Aleš Horák: robot Karel Pepper

17.4.

Martin Víta: Story Cloze Task, Facebook InferSent

24.4.

Vit Novacek: Biomedical Discovery Informatics Using Knowledge Graphs
Štěpán Balážik: Rozvrhbot s robotem Pepper
Petr Zelina: Better fasttext word embeddings for Czech

15.5.

Adam Bajger: neural PoS tagger with fastText embeddings
Vítek Suchomel: Bigger, cleaner and richer web corpora

22.5.

Radoslav Sabol: Answer selection and GPU computing in Metacentrum
Ondřej Svoboda: Lemmatizace a morfologické značkování korpusů historické češtiny (období 1300-1500)

Program semináře v podzimním semestru 2018

datum program

20.9.

program semináře na tento semestr

27.9.

Ha, Hien Thi: Information extraction from scanned invoices

4.10.

Pavel Rychly: Majka a DESAM

11.10.

Pavel Rychlý: Makefile, Make, Mk (and how to use them in data processing)

18.10.

Obluková, Barbora: TBA

25.10.

mimořádně v A420 - Martin Víta: Pipeline selection in classification tasks (deep learning approaches)

1.11.

Daša Kušniráková: Question/answer type extraction
Ondřej Herman: Word sense shift detection

8.11.

Luboš Popelínský: Anomaly detection in text (after Guthries)

15.11.

Zuzana Nevěřilová: EMNLP 2018

22.11.

Švárová, Nikola: Sentiment analysis
Michal Měchura: Lexonomy (what is new)

29.11.

Vítek Suchomel: Bigger, cleaner and richer web corpora (writing a dissertation thesis in progress)

6.12.

Marek Medveď: Towards new AQA version
Vítek Baisa: Sentence alignment using Dijkstra

13.12.

Aleš Horák: What Karel Pepper can(not) do

Program semináře v jarním semestru 2018

datum program

22.2.

program semináře na tento semestr

1.3.

Vojtěch Mrkývka: Outlier detection in US president speeches
Zuzana Nevěřilová: Workshop PoznejFI for high school students

8.3.

Adam Rambousek: Towards - Thesauri for governmental offices

15.3.

Pavel Veselý: Using NLP tools in anomaly detection

22.3.

Vít Suchomel: New Czech web corpus, Web crawling, Genres in web documents

29.3.

Zuzana Nevěřilová: CICLING 2018

5.4.

Vojta Kovář: On word sense induction (30')
Ondřej Herman: On word sense induction II

12.4.

Matin Víta: Attention based CNNs for recognizing Faceted Entailment

19.4.

Aleš Horák: On Siamese Neural Networks
Terézia šulganová: Logical analysis of English sentences
Hien Thi Ha: Extracting structure of scanned invoices

26.4.

Josef Hlaváč, DGT EU: DGT, its way of working and its needs

3.5.

Michal Měchura: What's new in Lexonomy
Adam Gonda: Extrakce definic
Lucie Findejsová: Naming animal kinds and their representatives: patterns and their relationship to frequency

10.5.

Daša Kušniráková: Question classification
Marek Medveď: ILP for outlier detection

17.5.

Marie Stará: Automatic creation of dictionary definitions
Jiří Mauritz: Automatic Classification of Legal Documents

Program semináře v podzimním semestru 2017

datum program

20.9.

program semináře na tento semestr
Noc vědců

27.9.

Marie Stará, Vojtěch Mrkývka: TransTech Summer School
Michal Měchura: Grammatical Framework summer school

4.10.

Aleš Horák: RASLAN 2017
Louis Lecailliez: Multilingual dictionaries for mobile application use and East-Asian languages handling
Miloš Jakubíček: ELEXIS project
Miloš Jakubíček: New version of SketchEngine

11.10.

James Brown (What3Words): what3words: how words power tech-for-good

18.10.

Martina Cvinčeková: Recommender systems for language learning with opinion mining
Honza Rygl: Speech biometry in Phonexia (30 min), current autorstvi.cz demo (10 min)
Zuzana Nevěřilová: Short Report on Grants' Week (5 min), presentations

25.10.

Martin Víta: From project-reviewer matching to baseline for faceted textual entailment
Louis Lecailliez: Multilingual dictionaries - first mobile prototype demo

1.11.

Vojtěch Mrkývka: Wikilinks

8.11.

Wörgötter, Martin: Comparison of statistical and neural machine translation

15.11.

Hien Ha Thi: OCR document classification

22.11.

Zuzana Nevěřilová: Mývalit, topit, baštit - How to improve web corpus annotation

29.11.

Moiz Khan Sherwani: Toponym disambiguation
Terézia Šulganová: Logical analysis of English sentences

6.12.

Vítek Suchomel: crawler, czTenTen17?, žánry

13.12.

Josef Šamánek: Automatic Text Summarization
Marek Medveď: AQA

Program semináře v jarním semestru 2017

datum program

22.2.

program semináře na tento semestr
HaBiT Corpus Annotation results

1.3.

Aleš Horák: Manipulativní techniky propagandy v době internetu
Adam Rambousek, Michal Měchura: Budapešť COST meeting
Adam Rambousek, Michal Měchura: Nový český slovník

8.3.

Aleš Horák: Intergovernmental exchange programmes
Ondřej Herman: Word embeddings using Fasttext

15.3.

Vítek Suchomel: Genre Identification of Documents in a Large Web Corpus

22.3.

Aleš Horák: Joint Masters programme: Multilingual Digital Content studies

29.3.

Zuzana Nevěřilová: Build It, Break It The Language Edition
Aleš Horák: Environment for Communication-based AI, General AI Challenge, Machine Learning Meetup
Michal Měchura: Grammatical Framework
Marek Medveď: chatbot

5.4.

Zuzana Nevěřilová: NER

12.4.

Lukáš Banič: Budovanie frázových tezaurov pomocou CQL dotazov a modifikácie word2vec-u

19.4.

Lukáš Banič: POS-tagging using minimal training sets
Marek Medveď: GoodAI

26.4.

Vojtěch Kovář: Sketch Grammar development by non-native speaker
Michal Růžička: Sémantické vyhledávání dokumentů

3.5.

Vojtěch Mrkývka: TBA
Michal Štefánik: Klasifikace témat webových dokumentů. Postup a vyhodnotenie úspešností. Praktické postrehy z použitia nástrojov (gensim-preprocessing, -word2vec, -doc2vec, sklearn, tensorflow pre NN).

10.5.

Petr Mejzlík: Editor vertikálu

17.5.

Honza Rygl: Praktická demonstrace SIR (30 min)
Terézia Šulganová: TIL

24.5. 13:00

Miloš Jakubíček: a možná prijde i dizertačka;) (A víno, sýry a tak...)
subtopic: Syntactic and Logical Analysis of Natural Language and its Evaluation Methods

Program semináře v podzimním semestru 2016

datum program

21.9.

program semináře na tento semestr
Michal Měchura: Lexonomy
workshop na UAA

5.10.

12.10.

Vítek Suchomel: Web crawling, DSL competition, Active learning for genre identification

19.10.

Pavel Rychly: Manatee

26.10.

Blanka Hanzlová: Antroponyms in Facebook group LARP CZ
Vít Baisa: obhajoba dizertace nanečisto (max 20 min)

2.11.

Ahmed Abdalla: Sentiment Polarity
Tomaž Erjavec: Slovene Academic Texts: Prototype Corpus and Research Plan

9.11.

Ondra Svoboda: PoS Tagging evaluation

16.11.

Adriana Babincova: Morphological variants - a problem of NLP

23.11.

Jakub Machura: Automatic Punctuation Detection

30.11.

Sandra Tukacova: Comparison of Czech and English WordNet(s)
Nikola Ljubešić: The Tweet(Cat|Geo|Pub) suite for collecting, analysing and publishing Twitter corpora
Darja Fišer: The JANES toolchain for processing non-standard language
Honza Rygl: NN in NLP

7.12.

Adam Rambousek: Recent news from Institute of Czech Language
Milos Jakubicek: TBA

14.12.

Marek Medved: AQA development
Vojta Kovar: Wine, cheese, Christmas songs and syntax
chatbot projekt

Program semináře v jarním semestru 2016

25.2.

program semináře na tento semestr
témata BP/DP
organizace TSD
výběr nlpassist
Habit: workshop v Addis Abeba
zpracování a značkování czTenTenu15
soutěž v umělé inteligenci o 20 000 http://rare-technologies.com/competitions/rarebot/

3.3.

Vojta Kovář: Řím a gold standardy

10.3.

TextMiner
info schuzka pro potencialni nove PGS
Miloš Jakubíček, Aleš Horák: nový český slovník

17.3.

Zuzka Nevěřilová: Annotation of MWEs and Foreign Words
Marek Medveď: AQA: answer extraction

24.3.

Jitka Dvořáková: praktické využití českých korpusů při výuce na ZŠ

31.3.

Vítek Baisa: hierarchický jazykový model
Ondřej Svoboda: „kde je plně označkovanej DESAM?“

7.4.

Ondřej Svoboda: nástroj na měření chyb při změnách tagsetu/značkování
nlpunix - vyhled HW

14.4.

Honza Rygl: Style & Identity Recognition
Pavel Rychlý: Efektivita distribuovaných výpočtů

21.4.

Vítek Baisa: bajtové jazykové modely

28.4.

Nikol Volková, Daniela Ryšavá: převod mezi CQL a přirozeným jazykem

5.5.

Ján Švec: Aktuálne o korpusoch s metainformáciami

12.5.

Vít Suchomel: 1. Protispamové úpravy v crawlingu. 2. Vlastnosti webových korpusů (homogenita, žánr dokumentu).

19.5.

Pavel Šmerk: TBA (Tracheobronchial amyloidosis)

Program semináře v podzimním semestru 2015

datum program

23.9.

doktorát Herzinger
Norské fondy - workshop na UAA
publikace
program semináře na tento semestr
Noc vědců
Pavel Šmerk: Derivanče

30.9.

nábytek do laboratoře
Marek Medveď: konference RANLP
Marek Medveď: možnosti zařízení z Norských fondů
Vítek Baisa: rozhovor pro ruská média

7.10.

Honza Rygl: konference Data-Znalosti, workshop o Pythonu

14.10.

děkanské volno - čestný doktorát prof.Herzingera

21.10.

Michal Rott, TUL Liberec: Představení Laboratoře počítačového zpracování řeči
Ján Švec: aktuálně o autorském korpusu
Zuzka Nevěřilová: Seminář o NooJ

4.11.

Vojta Kovář: anglický EFa

11.11.

Vítek Baisa: aktuální výzkum TBC

18.11.

Pavel Šmerk: Internetová jazyková příručka a obrana proti vykrádání

25.11.

Zuzka Nevěřilová: něco o pojmenovaných entitách

2.12.

Marek Medveď: Question Answering

9.12.

Miloš Jakubíček: Nový český slovník

16.12.

Vítek Suchomel: Vyhodnocení protispamových úprav v crawleru

Program semináře v jarním semestru 2015

datum program

17.2.

program semináře na tento semestr
předmět Advanced NLP
meeting COST akce ENeL

24.2.

Mgr internship
zahraniční PGS
Miloš Jakubíček: Vyhodnocování word sketchů (III), http://corpus.tools, správa dlouho běžících procesu ve SkE

3.3.

Zuzka Nevěřilová: workshop PARSEME
Zuzka Nevěřilová: MWE

10.3.

Návrhy nových směrů na FI - do 31.3.
Všichni: výstup na Milošovku :)
Lucia Kocincová: GAČR - info pro uchazeče o grant
Jana Rusinková: web NLP očami copywritera

17.3.

Winograd Schema Challenge
Jana Rusinková: klasifikace dokumentů
Lucia Kocincová: vizualizace korpusových dat

24.3.

Vítek Suchomel: spam ve webových korpusech
Honza Bušta: klasifikace Creative Language

31.3.

Business Research Forum MUNI
Vítek Baisa: extrakce vícejazyčné terminologie
Vítek Baisa: novinky ve SketchEngine
Vítek Baisa: SemEval 2015, task 15: report

7.4.

Ján Švec: Automatické budovanie webového korpusu
Tomáš Čapek: update k Sholva a Czechtris

14.4.

Provozní řád - přístup do serverovny
Dita Salajková: Počítačová simulace sociální role
Honza Bušta: průběžné výstupy klasifikace Creative Language

21.4.

Vojta Kovář: Doplňování a korekce interpunkce v češtině
Lucia Kocincová: new visualizations in Sketche Engine; usability testing and tracking tools

28.4.

Word Embeddings
Ondra Svoboda: parser ijáček, parsování z pohledu slovosledu

5.5.

Marek Medveď: nové výsledky v QA
Kristýna Zemková: jednoduše syntax a interpunkce
Vítek Baisa: překladoví kandidáti pomocí kolokací

12.5.

Honza Rygl: další aplikace SIR
Adam Rambousek: DEBWrite - dictionary application in one-click

Program semináře v podzimním semestru 2014

datum program

16.9.

program semináře na tento semestr
pokonferenční schůzka TSD
termín RASLAN 2014

23.9.

Dana Hlaváčková: Návrh do OP VVV
Vítek Baisa, Vojta Kovář, Zuzka Nevěřilová: workshop PLIN
Petr Machovec: Sumarizace textu krátce (5 min)

30.9.

Pepa Bušta: Rozšiřování překladových pamětí
Pavel Rychlý: HaBiT project
Zuzka Nevěřilová: Jak proběhla Noc vědců
možnost úvazku extrakce informací

7.10.

Petr Sojka: Math Information Retrieval: Past, Present and Future

14.10.

Vojtěch Kovář: Co se nevešlo do disertace
Michal Růžička: Math Information Retrieval for Digital Libraries

21.10.

prof. Lu Qin from Hong Kong PolyU (with prof. Chu-Ren): Web Persons Disambiguation
Hongkong study advertisements

4.11.

dr. Partha Pakray: Textual Entailment and Question Answering
Pavel Šmerk: Přídavná jména od jmen místních

11.11.

Vít Baisa: Character-based language model
Zuzka Nevěřilová: Prediktivní psaní
Vojta Kovář: Vybrané (a aktualizované) kapitoly z disertace

18.11.

Adam Rambousek: Aktuální slovníkové projekty platformy DEB
Statistika příspěvků RASLAN 2014

25.11.

Marek Medveď: Question Answering
Tomáš Čapek: Czechtris

2.12.

Vítek Suchomel: Podobnost a stejnorodost (sub)korpusů

9.12.

Honza Rygl: Rozpoznávání stylu pisatele

16.12.

Petr Machovec: Sumarizace textu
Miloš Jakubíček: wine & cheese & koledy

Program semináře v jarním semestru 2014

datum program
18.2. program semináře na tento semestr

25.2.

Pavel Hančar: Hadoop a jine MapReduce v labu
Zuzka Nevěřilová: parafrázování a dr. Watsonson

4.3.

Vojta Kovář: něco o SETu
Martin Čarnogurský: nové webové rozhraní pro Synt

11.3.

Vítek Suchomel et al: extrakce termínů
Vítek Baisa: extrakce dvojjazyčné terminologie
Lucia Kocincová: NLP web - rýchla diskusia o zániku/ponechaní stránok

18.3.

Louis Wei-lun Lu, FF, MU: zpracování tchajwanštiny a čínštiny na MU
Honza Bušta: nlpunix -- stav a vize :)

25.3.

NLP robot
web nlp - pristup, notifikace, preklopeni?
Matej Pavla: Question answering se syntaktickou analýzou
Vojta Kovář: něco o SETu -- dokončení

1.4.

Adam Rambousek: Tezaurus pro katastr
Štěpán Přichystal: Question Game

8.4.

Jiří Materna: LDA rámce (stav před odevzdáním disertace)

15.4.

TSD - domluva na vyletu
doplnit probehle prezentace!

22.4.

Vítek Suchomel: detekce spamu na webu
Andrej Herich: Vyvozování znalostí v TIL
Zuzana Nevěřilová: CICLing

29.4.

workshop se seznamem
clanky do casopisu
Honza Bušta: něco o neologismech a idiomech

6.5.

Lucia Kocincová: Parsovanie enTenTen aneb adaptácia MST a Malt Parseru na angličtinu
Marek Medveď: slovenský synt

13.5.

Honza Rygl: autorství a kurz vedení vědeckého týmu
Miloš Jakubíček: TBA

Program semináře v podzimním semestru 2013

datum příspěvky
16. 9. program semináře na tento semestr
termíny RASLANu 2013
web NLP -- co zbývá udělat? (Lucka, VítekB, Zuzka)
nákupy HW
trička NLP
23. 9. Vítek Suchomel: stručné postřehy z konference Corpus Linguistics [10']
Pavel Rychlý, Miloš Jakubíček: Virtuální korpusy v Manatee [30']
Pavel Rychlý, Miloš Jakubíček: META-FORUM 2013 a 2014 [15']
30. 9. Aleš Jiroudek: Možnosti paralelizace s platformou CUDA
Zdeňka Sitová: Jak bylo na ESSLLI 2013
Vít Baisa, Vojtěch Kovář, Miloš Jakubíček: Workshop pro PLIN v Baldovci [15']
Zuzka Nevěřilová: Noc vědců
7. 10. Aleš Horák: Info schůzka oborů UMI a PLIN, přednáška na kolokviu
Vít Baisa: CAT a rozšiřování překladových pamětí
Lucia Kocincová: How to write competitive proposals
14. 10. Tomáš Čapek: nejspis NLP portal
21. 10. Laboratorní seminář není dokonalý
28. 10. Státní svátek - Den vzniku samostatného Československa (1918) :)
4. 11. Zuzana Nevěřilová: Anotační hry/a
Vojta Kovář: Novinky ve SkE, v SETu a vůbec :)
11. 11. Vít Baisa: Novinky v CPA, SkE, drobnosti
Lucia Kocincová: Jak propagovat nejen projekty
18. 11. Martin Víta: Linked data in linguistics (a možná překlady inzerátů)
Marek Medvěď: Lexikální analýza v Syntu
25. 11. Vítek Suchomel: Spam v dokumentech z webu
Jirka Materna: word2vec aneb statisticka semantika trochu jinak
2. 12. Adam Rambousek: Slovník znakového jazyka
Vít Baisa: Pár postřehů z české Wikikonference
9. 12. Pavel Šmerk: TBA
Honza Rygl: Autor
16. 12. Lucia Kocincová: wine & cheese & koledy
Honza Bušta: Nové neologismy

Program semináře v jarním semestru 2013

datum příspěvky
20. 2. program semináře na tento semestr
možná spolupráce s Poznaní
možná spolupráce s Chaps - S. Franc
27. 2. CLARIN mobility granty, oživit http://nlp.fi.muni.cz/trac/research
Vojta Kovář: co dělám na syntaxi a na SkE (přetečení z minulého semestru -- myslím, že tak na 30-60 minut, ale to už jsem si myslel předtím dvakrát :) )
Zuzana Nevěřilová: Pojmenované entity v češtině
6. 3. Zuzana Nevěřilová: CZPJ a média (zpráva ze semináře Jak prezentovat vědu v médiích)
Vít Baisa: Nový editor CPA, Trac, Editor
Všichni: Organizace práce v labu (trac, měsíční zprávy, peer-review atd.) v Trac
13. 3. Ismaïl El Maarouf: Progress and perspectives in computational linguistics aspects of the DVC project
Vašek Němčík: Saara a statistiky spoluvýskytů ze Ske [25']
Marek Medveď: RFtagger na slovenštině
20. 3. Vít Baisa:! ukázka CZ-EN MT pomocí suffix array
27. 3. diskuse ke grantům - GAČR, TAČR
Honza Bušta: Creative language
Vítek Suchomel: lepší extrakce termínů než minule (a možná něco dalšího)
3. 4. Miloš Jakubíček: CICLing 2013 (zážitky, poznámky, fotky, víno atd. - 30')
prof. Zygmunt Vetulani: Invited talk
10. 4. Martin Víta (F-solutions): Evaluace vybraných systémů MT na specifických kolekcích textů
Kristýna Zemková: Využití syntaktické analýzy pro určování autorství
Helena Palátová: Floskule
Honza Michelfeit, Vojta Kovář, Miloš Jakubíček: Paralelní korpusy
17. 4. Lucia Kocincová: parsery pro češtinu
24. 4. Honza Rygl: Autor - (před)produkční verze
Tomáš Čapek: obhajoba meho diplomanta nanecisto - komentarovy system pro online zdroje; novinky v NLP portalu, snad neco noveho k anotovani a CZWN
Adam Rambousek: slovník znakového jazyka
Vašek Němčík: Saara a preference na základě statistik spoluvýskytů a sémantických tříd [15']
15. 5. Pavel Šmerk, Miloš Jakubíček: Nový a lepší tagger pro češtinu
Vojta Kovář, Vítek Baisa, Miloš Jakubíček: WSeval
Jiří Materna: Aplikace pro LDA rámce

Program semináře v podzimním semestru 2012:

  • 18.9.2012
    • program semináře na tento semestr
    • informace o plánovaných změnách v doktorském studiu
  • 25.9.2012
    • Pavel Šmerk: Představení stránky o fajce
    • RASLAN - místo a čas
    • schůzka oborů UMI a PLIN
  • 2.10.2012
    • Petr Horáček (FIT VUT): Nové gramatické systémy a jejich lingvistické aplikace
    • Vašek Němčík: Saara - proč, co, kde a jak. [~30']
    • Aleš Horák: studentské projektu GA MU, dohody na anotace, práce nad texty PSP
  • 9.10.2012
    • Pavel Šmerk: Opravdu představení stránky o fajce
    • Miloš Jakubíček: Proč a jak používat Git
    • Pavel Rychlý: O značkování dat
  • 16.10.2012
    • Zdeňka Sitová: Erasmus a výuka AI na K.U. Leuven
    • Miloš Jakubíček: Valence v Syntu aj.
    • Jirka Vejvoda: Shlukování článků se stejnou tématikou v gensimu
  • 23.10.2012
    • Petr Sojka: Matematika v korpusové lingvistice (prezentace)
  • 30.10.2012
    • Zuzka Nevěřilová: Inference v textu
    • Pavel Rychlý: projekty CLARIN a LINDAT
  • 6.11.2012
    • Vojta Kovář: co nového v rozhraní Sketch Engine (30')
    • časopisecké publikace
  • 13.11.2012
    • Jiří Materna: LDA rámce -- další vývoj
  • 20.11.2012
    • Adam Rambousek, Vít Baisa: Lze použít CPA principy pro češtinu?
    • Vít Baisa: Suffix array, longest common prefix a longest frequent prefix (SA, LCP, LFP)
  • 27.11.2012
    • Pavel Hančar: MapReduce
    • Vojta Kovář: co nového v SETu (30')
    • Lucka Kocincová: jak děláme skeče ze syntaktické analýzy a rozjíždíme cizí parsery
  • 4.12.2012
    • Vítek Suchomel: co nového v Corpus Architectu, získávání matematických textů z webu, czTenTen12 (30')
    • Honza Rygl: Autorství (funkční DEMO)
    • Petr Machovec: Prohledávání VerbaLexu
  • 11.12.2012
    • Marek Blahuš: Webové stránky pro studium češtiny (nabídka spolupráce na projektu CJV MU)
    • Tomáš Čapek: OpenCZWordNet - plán a realizace
  • 18.12.2012
    • wine & cheese & koledy & tlačenka

Program semináře v jarním semestru 2012:

  • 22.2.2012
    • program semináře na tento semestr
    • Pavel Rychlý: organizační pokyny
  • 29.2.2012
    • Andrej Gardoň: konference ICAART 2012
    • Vojta Kovář: Nový zéland
    • Honza Pomikálek: podobnost korpusů, extrakce termů
  • 7.3.2012
    • Vojta Kovář: ještě něco o konferenci na NZ[5']
    • Miloš Jakubíček, Aleš Horák: poznatky z review
    • Vašek Němčík: PDT2vert a "Brno ze zkumavky"
  • 14.3.2012
    • Vojta Kovář: Recent SET developments [15']
    • Vojta Kovář: Yet another formalism for syntax? [15']
    • Vítek Suchomel: new corpora (quick overview) [10']
    • Vítek Suchomel: vertfork (parallelization tool) [5']
  • 21.3.2012
    • odpadá
  • 28.3.2012
    • Juyeon Kang: French supertagging (a little bit of Czech)
    • Vašek Němčík: Saara (where and how) and corpora annotated for coreference (overview)
  • 4.4.2012
    • Miloš Jakubíček: citace RASLANu (5 min)
    • Zuzka Nevěřilová: něco o odvozování v textu
    • Tomáš Čapek: Dokumentování čehokoliv včera a dnes
  • 11.4.2012
    • Probrat, jestli nechceme ignorovat rektorské volno 16.5.
    • Miloš Jakubíček: desamb se syntem
    • Vít Baisa: CBLM - ukázka, diskuze spíše technického rázu [15']
  • 18.4.2012
    • Vít Baisa: ukázka dat z CBLM [10']
  • 25.4.2012
    • Adam Rambousek: FaNUK
    • Vítek Suchomel: named entities recognition using GATE (3rd party software, brief demonstration) [15']
    • Vašek Němčík: Saara evaluation
    • Aleš Horák: info o pozicích v DERI, nabídka dat od Seznamu
  • 2.5.2012
    • Jiří Materna: Hierarchické LDA rámce
  • 9.5.2012
    • Honza Rygl: Autor demo 2
    • Pavel Šmerk: fajka
  • 16.5.2012
    • Pavel Hančar: MapReduce
    • Gulšan Dovudov: morphological analysis of Tajik
    • Marek Medveď: Synt a SET pro slovenštinu
    • Miloš Jakubíček & Lucka Kocincová: Trochu statistiky o UMI

Program semináře v podzimním semestru 2011:

  • 22.9.2011
    • program semináře na tento semestr
    • kontrola cest
    • Noc vědců
  • 29.9.2011
    • Honza Pomikálek, Vítek Suchomel: Jedi Crawler, jusText, Onion, Chared
  • 6.10.2011
    • Zuzka Nevěřilová: Sheldon's Cookbook
    • Juyeon Kang: Intro
  • 13.10.2011
    • Vašek Němčík: Saara & how to feed her
  • 20.10.2011
    • Miloš Jakubíček: Zapojení syntu do desambu
    • Vojta Kovář: ten zbytek do syntaktického semináře
  • 27.10.2011
    • Vítek Baisa: představení tezí, fotky z Kyrgyzstánu a organizační záležitosti k výletu do krasu
    • Pavel Rychlý: Proč programovat v Pythonu. (přednáška nebude ani o Pythonu ani o programování( nlpcentre.pdf )
  • 3.11.2011
  • 10.11.2011
    • Jirka Materna: Nové a lepší LDA rámce (Prezentace)
  • 17.11.2011
    • seminář se nekoná, státní svátek
  • 24.11.2011
    • Adam Rambousek: Nová encyklopedie češtiny
  • 1.12.2011
    • Andrej Gardoň: Langauge, Mind and their simulation using TIL (Dolphin Nick, GuessME! )
    • Presentation language: slovak
  • 8.12.2011
    • Honza Bušta: Idiomy (a idioty)
    • Honza Bušta: Serverová aplikace pro korpus chyb
  • 15.12.2011
    • Pavel Hančar: MapReduce u nás v laboratoři
    • Jan Rygl: DEMO Autorství
  • 22.12.2011
    • Pavel Šmerk: ajka => majka (a svařák a koledy?)

Program semináře v jarním semestru 2011:

  • 23.2.2011
    • program semináře na tento semestr
    • informace o NlpAssistentce
    • informace o cestách v roce 2011
  • 2. 3. 2011
    • Honza Pomikálek: PRESEMT + Čištění korpusových dat
  • 9. 3. 2011
  • 16. 3. 2011
    • Vít Baisa: Fotky z Chile & Argentiny
    • Vít Baisa: Průběžné výsledky ze dvou poloautomatických anotací VerbaLexu
    • Zuzka Nevěřilová: Nový formát VerbaLexu
  • 23. 3. 2011
    • Vašek Němčík: Saara a export PDT2 do vertikálu
    • Aleš Horák, Miloš Jakubíček, Vojta Kovář: TIL korpus
  • 30. 3. 2011
    • Tomáš Čapek: Limity strojového překladu
  • 6. 4. 2011
    • info k návrhu GAČR projektu
    • Miloš Jakubíček: synt: méně je více
    • Karel Vaculík: Predicate-argument structure z české věty
  • 13. 4. 2011
  • 20. 4. 2011
    • Vojta Kovář: SET (dokončení)
    • Vít Baisa: Jeden princip: od morfologie až k reprezentaci znalostí
  • 27. 4. 2011
    • Jiří Materna: Introduction to Latent Dirichlet Allocation
    • Jiří Materna: Semantic frames as probabilistic generative models
  • 4. 5. 2011
  • 11. 5. 2011
    • Marek Blahuš: Rozšíření českého WordNetu podle anglického překladovým slovníkem - diplomová práce
    • Marek Grác: nástin dizertačky TBA
  • 18. 5. 2011
    • Zdeněk Žabokrtský: Strojový překlad s využitím závislostní syntaxe
  • speciální přednáška - 31. 5. 2011

Program semináře v podzimním semestru 2010:

  • 22.9.2010
    • program semináře na tento semestr
    • postery na Noc vědců - dodělat odkazy Vyzkoušejte si na náš web, vyrobit screencasty pro prezentaci
    • nachystat schůzku UMI a PLIN, cca za 3 týdny, asi v B204 v Po v 18
  • 29.9.2010
    • Pavel Rychlý: ČAJ (aneb když jsme byli mladí a hezcí)
    • Honza Bušta: Erasmus
    • kde jsme byli, co jsme viděli
  • 6.10.2010 EuDML – status reports
  • 13.10.2010
    • Tomáš Čapek: Výsledky heuristických testů nad CZWN
  • 20.10.2010
    • Zuzana Nevěřilová: něco o named entity recognition a Wikipedii
  • 27.10.2010
    • záskok Adam Rambousek
  • 3.11.2010
    • Vašek Němčík: Saara - demo a sbírání postřehů a feature requests
    • Honza Bušta: Detekce idiomů v korpusu
  • 10.11.2010
    • Vít Baisa: PZPJ: přístup "odspodu"
  • 17.11.2010
    • seminář se nekoná - státní svátek
  • 24.11.2010
    • Marek Blahuš: pracovní stáž ve Francii
    • Miloš Husák: sémanticky podložená extrakce informací z korpusu
  • 1.12.2010
    • Miloš Jakubíček, Vojta Kovář: syntaktický seminář– PDT, synt, set, TIL projekt a další
  • 8.12.2010
    • Jiří Materna: Určení tematické konzistence dokumentu
  • 15.12.2010
    • Pavel Šmerk: wine & cheese a koledy apod.
    • Dana Hlaváčková, Vašek Němčík: Editace VerbaLexu

Program semináře v jarním semestru 2010:

Program semináře v podzimním semestru 2009:

  • 23.9.2009
    • program semináře na tento semestr
    • plánování publikací a cest
  • 30.9.2009
    • Tomáš Čapek, Adam Rambousek - český wordnet v DEBDictu
    • Tomáš Čapek - koncepce pro opravy v českém wordnetu
  • 7.10.2009
    • Karel Pala - návrh na koupě HW a SW
    • Petr Sojka - prezentace navštívených konferencí a workshopů - TSD 2009, ECDL 2009, DML 2009
    • změny a aktualizace na laboratorním webu
    • Vít Baisa - několik návrhů na změnu vzhledu a na doplnění obsahu lab. webu
  • 14.10.2009
    • ňáký anafory v syntu jsou nemocný ... budou presentovány po uzdravení
  • 21.10.2009
    • Marek Grác - GUI klikátko na slovesné valence
    • Zuzka Nevěřilová - Extending VerbaLex ( neverilova_prezentace.pdf )
    • navrhované BP/DP
  • 28.10.2009 - svátek, seminář není
  • 4.11.2009
    • Jiří Materna - Doménové kolokace
  • 11.11.2009
    • Jaroslav Moravec - Korekturní rozšíření pro OpenOffice.org
  • 18.11.2009
    • Honza Pomikálek - nový algoritmus na klasifikaci odstavců
    • příprava na raslan
  • 25.11.2009
    • Aleš Horák - stav VerbaLexu
    • Adam Rambousek, Aleš Horák - projekt KYOTO
    • Marek Blahuš - Kontrolor pravopisu pro Esperanto - studentský projekt
  • 2.12.2009
    • Vašek Němčík - Anafory v syntu
  • 9.12.2009
    • Vojta Kovář - SET a vůbec a jak je to se studentskýma projektama
    • Honza Bušta - KMJ, neologismy
    • Vít Baisa - Asistovaný překlad
  • 16.12.2009
    • Vít Baisa - Asistovaný překlad (krátké dokončení z minula, diskuze)
    • Honza Pomikálek - disertačka o korpusech
    • Miloš Jakubíček - LTC, LCT, lt-world.org a další diskuse ohledně zviditelnění CZPJ

Program semináře v jarním semestru 2009:

  • 17.2.2009
  • 24.2.2009
  • 3.3.2009
    • Aleš Horák: ještě k požadavku řečařů z Liberce
    • Aleš Horák: různé - přidat otravnou zprávičku o ochraně dat labu, publikace v březnu
    • Marek Blahuš: Zkušenosti z půlročního pobytu na K.U.Leuven v Belgii v rámci programu Erasmus
  • 10.3.2009
    • Marek Grác: NLPunix
    • Pavel Rychlý: Korpus Czes
  • 17.3.2009
    • Tomáš Čapek: Nové MWE
  • 24.3.2009
    • Honza Pomikálek: CICLING 2009 v Mexiku
  • 31.3.2009
    • Vojtěch Kovář: Syntaktická analýza češtiny: současný stav, problémy a nápady na jejich řešení, analyzátor SET
  • 7.4.2009
    • Jiří Materna: Rozšiřování VerbaLexu o informace z Framenetu
  • 14.4.2009
    • Miloš Jakubíček: Využití extrakce struktur: interpunkční korektor a extrakce valencí
    • Marek Grác, Miloš Jakubíček, Jan Bušta: O kolokviu mladých jazykovědců v Prešově
  • 21.4.2009
    • Miloš Jakubíček, Jan Bušta: Korpus chyb
  • 28.4.2009
    • Adam Rambousek, Aleš Horák: Postup v projektu KYOTO
  • 5.5.2009
    • Marek Grác: I cesta může být cíl
    • Honza Pomikálek: Corpus Architect
  • 12.5.2009
    • Pavel Šmerk: to stačí (TBA)
  • 19.5.2009
    • Václav Němčík: TBA
    • Pavel Rychlý: Translingual Europe 2009

Program semináře v podzimním semestru 2008:

  • 17.9.2008
    • program semináře na tento semestr
    • plánování cest a workshopu RASLAN 2008
  • 24.9.2008
    • Pavel Rychlý: Proč (ne)programovat v některých jazycích II
  • 1.10.2008
    • Aleš Horák: zhodnocení TSD 2008
  • 8.10.2008
    • Miloš Jakubíček, Jan Bušta: EMLS 2008
    • Petr Sojka: From Pixels to Minds and Back
  • 15.10.2008
    • Pavel Rychlý, Honza Pomikálek: BiWeC II
  • 22.10.2008
  • 29.10.2008
    • Vašek Němčík: Anaphora Resolution & MMAX2 & PDT2
  • 5.11.2008
    • Vojta Kovář, Miloš Jakubíček: Test suite a další novinky v syntu
  • 12.11.2008
    • Vojta Kovář: Syntaktická analýza s využitím postupné segmentace věty (SET)
  • 19.11.2008
    • Jan Bušta: Četnost idiomů v korpusu
  • 26.11.2008
    • Aleš Horák, Adam Rambousek: Postup v projektu KYOTO
  • 3.12.2008
    • Honza Pomikálek, Vojta Kovář: Mikulášský Corpus Architect
    • Honza Pomikálek, Vojta Kovář: Výsledky NLPbota ve FIBotovi
  • 10.12.2008
    • Tomáš Čapek: Semantické sítě a hierarchické lexikony v praxi
  • 17.12.2008
    • Pavel Šmerk: (hotová?) nová ajka
    • Máša Khokhlova: Krátká Vánoční zpráva, aneb opožděné představení

Program semináře v jarním semestru 2008:

  • 27.2.2008
    • Pavel Rychlý: Od programování k filosofii a zpět
  • 5.3.2008
    • Husák: GDEX, Good Dictionary Examples
    • Webadmini NLP (Němčík): MoinMoin Wiki
  • 12.3.2008
    • Vláďa Kadlec, Vojta Kovář, Aleš Horák: Syntaktická analýza s využitím slovesných valencí
    • Admini NLP: Jak formátovat disky, udržba distribuce na strojích NLP, apod.
  • 19.3.2008
    • Honza Pomikálek: Jak spolehlivě detekovat kódování znaků, známe-li jazyk textu
    • Radim Řehůřek, Petr Sojka: Klasifikace matematických textů
  • 26.3.2008
    • Vojta Kovář: Postupná segmentace věty a její využití v syntaktické analýze
  • 2.4.2008
    • Marek Blahuš: Kontrola pravopisu a její specifika pro jazyk esperanto
    • Jiří Materna: Automatické určení domény české webové stránky
  • 9.4.2008
    • Pavel Rychlý, Honza Pomikálek: BiWeC (Big Web Corpus)
    • Pavel Šmerk: Guesser
  • 16.4.2008
    • Jakubíček: Extrakce struktur syntaktického analyzátoru
  • 23.4.2008
    • Vašek Němčík: WordNet Assistant
    • Aleš Horák: KYOTO projekt
  • 30.4.2008
    • Radim Řehůřek: Oprava překlepů ve fulltextovém hledání Seznam.cz (1h až neomezeně)
  • 7.5.2008
    • Bušta: Četnost idiomů v korpusu
  • 14.5.2008
    • Petr Sojka et al.: DML-CZ
  • 21.5.2008
    • probírání nákupu HW, organizace laboratoře

Program semináře v podzimním semestru 2007:

  • 18.12.2007
    • Víťa Nováček - co dělám v Irsku :-), aneb: (1) projekt Knowledge Web - dynamic ontology lifecycle, integrace ontologií; (2) Jak se peče OWL - nahlédnutí do kuchyně W3C; (3) empirické usuzování - pokus o jedno čistě soukromé kacířství na pokračování... Rozsah a pořadí konkrétních témat můžeme libovolně upravit dle zájmu a času na místě.
  • 11.12.2007
    • Vojta Kovář - Opravdu hotový beautified chart
  • 4.12.2007
    • Vašek Němčík - Anaphora Resolution: krátký úvod; ukázka dat pomocí MMAX; ukázka anotace v PDT2; ukázka dat získaných ze syntu; výhled do budoucna (využití valencí/thesauru, strojové učení)
  • 27.11.2007
    • pro nemoc se seminář nekoná
  • 20.11.2007
    • Adam Rambousek, Aleš Horák - Administrační rozhraní DEB
  • 13.11.2007
    • Vláďa Kadlec - Syntaktická analýza přirozeného jazyka založená na bezkontextových gramatikách
  • 6.11.2007
    • Honza Pomikálek, Pavel Rychlý - Odstraňování duplicit v korpusu
  • 30.10.2007
  • 23.10.2007
    • Marek Grác - Parciální vzory pro slovesa
  • 16.10.2007
    • Pavel Šmerk – Od naskenovaného textu ke značkovaným validovaným datům (SSJC, PSJC)
  • 9.10.2007
    • Aleš Horák, Adam Rambousek - Global WordNet Grid
  • 2.10.2007
    • Honza Pomikálek - Tvorba paralelních korpusů z webu
  • 25.9.2007
    • Dana Hlaváčková - přehled možností pro výjezdní zasedání laboratoře
    • Pavel Rychlý - Opravdu velké (dvacetimiliardové) korpusy
  • 18.9.2007
    • vytvoření seznamu prezentací pro tento semestr
    • cesty do konce roku
    • nlpweb, prezentace laboratoře na fi?
    • nlpunix, marx
    • vyjezdni zasedani laboratore

Nabídka vystoupení:

  • Vláďa Kadlec, Aleš Horák - Syntaktická analýza s využitím slovesných valencí
  • Honza Pomikálek - jak spolehlivě detekovat kódování znaků, známe-li jazyk textu

Program semináře v jarním semestru 2007:

  • 15.5.2007
    • Petr Sojka - Od naskenovaného textu ke značkovanému repositáři matematických textů
    • Marek Grác - Nástroj pro automatickou tvorbu česko-slovenského slovníku
  • 24.4.2007
    • Vašek Němčík - Anaphora Resolution
  • 17.4.2007
    • Pavel Šmerk - ajka2: "chci být jiná, lepší"
  • 10.4.2007
    • Mirek Prýmek, Aleš Horák - projekt ElNet, simulační systém Rice
    • Pavel Šmerk - ajka2: "chci být jiná, lepší"
  • 3.4.2007
    • Vojta Kovář - Zobrazování konkordancí obousměrných horizontálních textů
    • Vojta Kovář - synt - beautified chart
    • Radim Řehůřek - Segmentace textu, vyhodnocení
  • 27.3.2007
    • Dana Hlaváčková - aktuální práce na VerbaLexu, diskuze o problémech při editaci
  • 20.3.2007
    • Patrick Hanks, Adam Rambousek - CPA
  • 13.3.2007
    • Pavel Rychlý - Kapradí - nástroj pro práci s paralelními korpusy anglického dramatu
    • Jiří Materna, Richard Šimek, Marek Grác - Valenční rámce v analyzátoru Zuzana
    • Vláďa Kadlec - Použití VerbaLexu v syntu
  • 6.3.2007
    • Martin Kudlej, Adam Rambousek - Cornetto – nizozemský wordnet
    • Tomáš Čapek - prezentace CMS systému DRUPAL
  • 27.2.2007 - v laboratoři B203
    • Tomáš Čapek - praktické použití českého WordNetu, problémy s jeho ontologií
  • 20.2.2007 - v B411
    • plán vystoupení na semináři na celý semestr
    • Vašek Němčík - prezentace laboratoře na webu FI
    • úprava velkého labu pro to, aby v něm mohly být další semináře

Program semináře v podzimním semestru 2006:

  • 19.12.2006
    • Vašek Němčík - anaphora resolution, wordnet assistant
    • Pavel Šmerk - český tagger
  • 12.12.2006 v akvárku
    • Radim Řehůřek! - segmentace a (ne)indexování textů
  • 5.12.2006
    • James Thomas - Využití korpusů ve výuce jazyků
  • 28.11.2006 v akvárku
    • Pavel Rychlý – finlib
  • 21.11.2006 v zasedačce
    • Adam Rambousek - nlpis
    • Jarek Hlávka - nlplab-ubuntu
  • 14.11.2006
    • Aleš Horák - GDW a wwwsynt, GUI rozhraní k syntu
  • 7.11.2006
    • Tomáš Čapek - DTP v Open Source
  • 31.10.2006 v B411
    • Martin Rajman - informace o možné spolupráci se švýcarskou EPFL
  • 24.10.2006
    • Lubomír Popelínský - Strojové učení a přirozený jazyk 2004-6 (ve vztahu k laboratoři vyhledávání znalostí)
  • 17.10.2006
    • Vojta Kovář - Redukce počtu stromů na výstupu Syntu. Beautified stromy, beautified chart, přehled dalších metod
  • 10.10.2006
    • POZOR jsme v zasedačce
    • stanovení programu semináře na celý semestr
    • zprávy z konferencí a workshopů (SemWeb, Euralex, ...)
  • 3.10.2006
    • diskuze - zálohování, laboratorní plakát, web
    • přestavba velkého labu
  • 26.9.2006
    • Adam Rambousek – jak vyrábět deb-balíky
  • 19.9.2006
    • seznámení, představení, návrhy na prezentace

Program semináře v jarním semestru 2006:

  • 23.5.2006
  • 16.5.2006
    • Vašek Němčík - Anaphora Resolution: úvod do problematiky, modulární systém presentovaný v diplomové práci, výhledy do budoucna
    • Pavel Cenek - From Unimodal to Multimodal Dialog Management
  • 9.5.2006
    • Mudrak - OCR matematiky v ramci projektu DML CZ
    • Marek Grác, Radovan Štancel - Česko-slovenský strojový překlad
  • 2.5.2006
    • Petr Sojka - obecně o projektu DML CZ
    • Panak - OCR matematiky v ramci projektu DML CZ
  • 25.4.2006
    • Zuzana Nevěřilová - program pro korekturu textů
  • 11.4.2006
    • Víťa Nováček - dolování (fuzzy) ontologií z textu v NL
  • 4.4.2006
    • Pavel Šmerk - český značkovač
  • 28.3.2006
    • Adam Rambousek - DEB a jeho noví klienti
  • 14., 21.3.2006
    • Co chceme v laboratoři dělat a co děláme (nástin probíhajících/připravovaných projektů)
  • 7.3.2006
    • Pavel Rychlý: Stručné dokončení z minulého semináře
  • 28.2.2006
    • Pavel Rychlý: V čem a jak programovat aneb proč neprogramovat v jazycích Java, Perl, C++, XSLT, ...
  • 21.2.2006
    • Honza Pomikálek: WebBootCaT (tvorba korpusů z webu), MetaTrans (překladový metaslovník)

Program semináře v podzimním semestru 2005:

  • 21.12.2005
    • Lukáš Svoboda: Dialogový systém UIO
  • 14.12.2005
    • Patrick Hanks: Corpus Pattern Analysis
    • Anna Rumshisky:
  • 7.12.2005
    • Zuzka Nevěřilová: řekne později ;-)
    • Víťa Nováček: Ontology learning
  • 30.11.2005
    • seminář se nekoná
  • 23.11.2005
    • Honza Pomikálek: GVP, textové klasifikátory
    • Jeník Provazník: Inteligentní webcrawler
  • 16.11.2005
    • Pavel Šmerk: stav morfologické desambiguace, značek a korpusů
  • 2.11.2005
    • Aleš Horák, Adam Rambousek, Martin Kudlej: DEB II - platforma pro vývoj slovníkových editorů
  • 26.10.2005 (výjimečně v B411)
    • Jirka Mikulášek: blizna, pestík, floret, is-text-search, ...
    • Vladimír Kadlec: Robust stochastic parsing using optimal maximum coverage
  • 19.10.2005
    • Honza Pomikálek: Corpus Builder
  • 12.10.2005
    • Pavel Rychlý: Korpusový manažer Manatee: použití, nástroje, API
  • 21.9.2005
    • Seznamení: Každý aktivní spolupracovník řekne, čím se zabývá a zejména čeho by chtěl v následujícím semestru dosáhnout.

Program semináře v jarním semestru 2005:

  • 9.6.2005 - 29.9.2005
    • pouze příležitostně po předchozím ohlášení e-mailem na all at aurora.fi.muni.cz
  • 2.6.2005
    • Zdenko Staníček: Universální informační robot
  • 26.5.2005
    • Honza Provazník, Petr Jurášek - NLP unix
  • 19.5.2005
    • Václav Brožek: Formát pro uložení víceznačné morfologie a syntaktických struktur ve vertikálu
    • všeobecná diskuze: společný projekt české morfologie (desam + ajka)
  • 12.5.2005
    • Pavel Šmerk: stav a možnosti úprav korpusů DESAM a Stoka
    • všeobecná diskuze: web laboratoře
    • všeobecná diskuze: značky v ajce
  • 5.5.2005
    • Pavel Cenek: Řízení dialogu
    • všeobecná diskuze: značky v ajce
  • 28.4.2005
    • Pavel Rychlý: práce s daty, čeho se vyvarovat
    • všeobecná diskuze: budoucnost ajky
  • 21.4.2005
    • Pavel Rychlý: Nový velký slovník cizích slov
  • 14.4.2005
    • Petr Sojka: Competing Patterns in Language Engineering and Computer Typesetting
    • Zuzana Nevěřilová: Vizuální lexikon
    • Zuzana Nevěřilová, Petr Sojka: Visualizace sémantického webu na příkladu doménově vymezené digitální matematické knihovny
  • 7.4.2005
    • Lukáš Svoboda: uuiiuioo
  • 31.3.2005
    • Radek Sedláček: Morfologický analyzátor Ajka
    • Dana Hlaváčková, Aleš Horák: Lexikon slovesných valencí FI MU Vallex
  • 24.3.2005
    • Pavel Rychlý: Tvorba korpusu
    • Marek Veber: Editor morfologické databáze i_par
  • 17.3.2005
    • Jan Pomikálek a spol.
  • 10.3.2005
    • Aleš Horák a Vladimír Kadlec: Syntaktický analyzátor synt
  • 3.3.2005
    • krátké (max. několik minut) představení se každého aktivního spolupracovníka, na čem aktuálně pracuje, zamýšlí pracovat, případně pracoval.