wiki:en/NLPSeminarHistory

Version 26 (modified by Ales Horak, 3 years ago) (diff)

--

Program Laboratorního semináře v uplynulých semestrech

Tato stránka neobsahuje program aktuálně probíhajícího semináře, zachycuje pouze historii uplynulých semestrů Laboratorního semináře.

Program semináře v podzimním semestru 2020

datum program

6.10.

program semináře na tento semestr
Aleš Horák: RASLAN 2020 Call for Papers
Aleš Horák: TSD 2020
Zuzana Nevěřilová: Clarin conference 2020

13.10.

Vítek Novotný: MIR@MU at ARQMath 2020
Vítek Novotný: Enhancing word embeddings: Positionality, subword sizes, and hyphenation

20.10.

Zuzana Nevěřilová: Information Extraction from Medical Forms

27.10.

Hien Thi Ha: Contract information extraction
Vítek Novotný: When Tesseract does it alone: OCR of medieval texts

3.11.

Helena Medková: Zeugma detection

10.11.

Veronika Burgerová: Time and date extraction and normalization

24.11.

Alexander Macinský: NL processing of Japanese for Dictionary Systems

1.12.

Krištof Anetta: Electronic Health Records processing
Adam Hájek: Automatic Text Summarization

8.12.

Radoslav Sabol: Officebot

15.12.

Marek Medveď: Question Answering dataset SQAD

5.1.

Marie Stará: Towards the evaluation of automatic explanations
Petr Zelina: Transferring ALBERT from en to cs

12.1.

Ondřej Sotolář: Personal Data Anonymization

Program semináře v jarním semestru 2020

datum program

19.2.

program semináře na tento semestr

26.2.

Aleš Horák: konference TSD 2020
Pavel Rychlý: LINDAT CLARIAH
Pavel Rychlý: Simplicity

4.3.

Miloš Jakubíček: Co je nového ve Sketch Engine a LCC

11.3.

seminar cancelled due to COVID-19 regulations

18.3.

seminar cancelled due to COVID-19 regulations

25.3.

Samuel Gazda: Word game Ghost for the robot Pepper

1.4.

Renáta Pivodová: Zpracování nových gramatických fenoménů v logické analýze PJ
Michal Hala: Implementace efektivní sémantické sítě pro reprezentací znalostí

8.4.

Vít Novotný: Joint word embeddings and soft cosine measure at ARQMath

15.4.

Veronika Burgerová: Paraphrase Generation for Czech

22.4.

Marie Stará: Automatic creation of explanations
Petr Zelina: Evaluating Czech ALBERT

6.5.

Michal Starý: Event Miner

13.5.

Hien Thi Ha: Information extraction from contracts

Program semináře v podzimním semestru 2019

Audio/video komentáře jsou k dipozici zde

datum program

17.9.

program semináře na tento semestr
Eniafe Festus Ayetiran: Research Intro
Ondřej Herman: RANLP conference
Petr Sojka: TUG conference and 25th Anniversary of FI MU
Aleš Horák: RASLAN 2019 Call for Papers

24.9.

Zuzana Nevěřilová: Summer Schools on Deep Learning
Michal Měchura: NVH: Problems with XML/JSON/YAML and the ultimate solution.

8.10.

Vít Suchomel: Classification of Topics of Web Documents Using Fasttext's Supervised Learning on Classes and Data from dmoz.org
Vít Suchomel: Active Learning Demo Shown at Night of Scientists
Presentation slides
Souležba na sedací soupravě jako příklad špatné lexikografie.

15.10.

Eniafe Festus Ayetiran: Multi-sense Embeddings

22.10.

Pavel Rychlý: Meeting of the Czech Speech & NLP Community
Luca Brigada Villa: Relations between syntactic dependency graphs and dependency parsing

29.10.

Vít Novotný: Text classification with word embedding regularization and soft similarity measure

5.11.

Martin Víta: Figurative Language Paraphrasing

12.11.

Martin Kroon: Towards the automatic detection of syntactic differences
Veronika Burgerová: Evaluation and Error Analysis of Rule-based Paraphrase Generation for Czech

19.11.

Pavlína Klimešová: Neural networks for Czech sentiment analysis
Pavlína Klimešová: BERT experiments with SQAD 2.0 and 3.0
Hien Thi Ha: Information extraction from scanned invoices

26.11.

Michal Starý: TBA

3.12.

Marie Stará: Automatically Created Definitions -- What's New
Adam Hájek: Automatic Text Summarization

10.12.

Petr Zelina: Pretraining an (AL)BERT model

17.12.

Ondra Herman: Word Senses
Michala Vacíková: Online kurz počítačové lingvistiky

Program semináře v jarním semestru 2019

datum program

20.2.

program semináře na tento semestr
Josef Plch: Substituční segmentér

27.2.

Tomasz Jadczyk: CardioCube - Conversational AI for cardiovascular patients
moved to April 10
Marek Medveď: ICAART 2019

6.3.

Vít Suchomel: žánry
Pavel Rychlý: word2vec - odkrývání magie Yoav Goldberg -- word embeddings

Monday 11.3. 12:00

David Sears: Collocations in music? What systematic musicology can learn from corpus linguistics

13.3.

Hien Thi Ha: NLP of Vietnamese

20.3.

Marie Stará: Automatické vytváření definic

27.3.

Vít Novotný: Trains of Thought in Informations Retrieval (10")
Dávid Lupták: Effective Indexing, Searching and Querying of Structures (10")
Adam Rambousek: Systém pro tezaury odborné terminologie

3.4.

Štěpán Balážik: TBA
moved to April 24

10.4.

Tomasz Jadczyk: CardioCube - Conversational AI for cardiovascular patients
Aleš Horák: robot Karel Pepper

17.4.

Martin Víta: Story Cloze Task, Facebook InferSent

24.4.

Vit Novacek: Biomedical Discovery Informatics Using Knowledge Graphs
Štěpán Balážik: Rozvrhbot s robotem Pepper
Petr Zelina: Better fasttext word embeddings for Czech

15.5.

Adam Bajger: neural PoS tagger with fastText embeddings
Vítek Suchomel: Bigger, cleaner and richer web corpora

22.5.

Radoslav Sabol: Answer selection and GPU computing in Metacentrum
Ondřej Svoboda: Lemmatizace a morfologické značkování korpusů historické češtiny (období 1300-1500)

Program semináře v podzimním semestru 2018

datum program

20.9.

program semináře na tento semestr

27.9.

Ha, Hien Thi: Information extraction from scanned invoices

4.10.

Pavel Rychly: Majka a DESAM

11.10.

Pavel Rychlý: Makefile, Make, Mk (and how to use them in data processing)

18.10.

Obluková, Barbora: TBA

25.10.

mimořádně v A420 - Martin Víta: Pipeline selection in classification tasks (deep learning approaches)

1.11.

Daša Kušniráková: Question/answer type extraction
Ondřej Herman: Word sense shift detection

8.11.

Luboš Popelínský: Anomaly detection in text (after Guthries)

15.11.

Zuzana Nevěřilová: EMNLP 2018

22.11.

Švárová, Nikola: Sentiment analysis
Michal Měchura: Lexonomy (what is new)

29.11.

Vítek Suchomel: Bigger, cleaner and richer web corpora (writing a dissertation thesis in progress)

6.12.

Marek Medveď: Towards new AQA version
Vítek Baisa: Sentence alignment using Dijkstra

13.12.

Aleš Horák: What Karel Pepper can(not) do

Program semináře v jarním semestru 2018

datum program

22.2.

program semináře na tento semestr

1.3.

Vojtěch Mrkývka: Outlier detection in US president speeches
Zuzana Nevěřilová: Workshop PoznejFI for high school students

8.3.

Adam Rambousek: Towards - Thesauri for governmental offices

15.3.

Pavel Veselý: Using NLP tools in anomaly detection

22.3.

Vít Suchomel: New Czech web corpus, Web crawling, Genres in web documents

29.3.

Zuzana Nevěřilová: CICLING 2018

5.4.

Vojta Kovář: On word sense induction (30')
Ondřej Herman: On word sense induction II

12.4.

Matin Víta: Attention based CNNs for recognizing Faceted Entailment

19.4.

Aleš Horák: On Siamese Neural Networks
Terézia šulganová: Logical analysis of English sentences
Hien Thi Ha: Extracting structure of scanned invoices

26.4.

Josef Hlaváč, DGT EU: DGT, its way of working and its needs

3.5.

Michal Měchura: What's new in Lexonomy
Adam Gonda: Extrakce definic
Lucie Findejsová: Naming animal kinds and their representatives: patterns and their relationship to frequency

10.5.

Daša Kušniráková: Question classification
Marek Medveď: ILP for outlier detection

17.5.

Marie Stará: Automatic creation of dictionary definitions
Jiří Mauritz: Automatic Classification of Legal Documents

Program semináře v podzimním semestru 2017

datum program

20.9.

program semináře na tento semestr
Noc vědců

27.9.

Marie Stará, Vojtěch Mrkývka: TransTech Summer School
Michal Měchura: Grammatical Framework summer school

4.10.

Aleš Horák: RASLAN 2017
Louis Lecailliez: Multilingual dictionaries for mobile application use and East-Asian languages handling
Miloš Jakubíček: ELEXIS project
Miloš Jakubíček: New version of SketchEngine

11.10.

James Brown (What3Words): what3words: how words power tech-for-good

18.10.

Martina Cvinčeková: Recommender systems for language learning with opinion mining
Honza Rygl: Speech biometry in Phonexia (30 min), current autorstvi.cz demo (10 min)
Zuzana Nevěřilová: Short Report on Grants' Week (5 min), presentations

25.10.

Martin Víta: From project-reviewer matching to baseline for faceted textual entailment
Louis Lecailliez: Multilingual dictionaries - first mobile prototype demo

1.11.

Vojtěch Mrkývka: Wikilinks

8.11.

Wörgötter, Martin: Comparison of statistical and neural machine translation

15.11.

Hien Ha Thi: OCR document classification

22.11.

Zuzana Nevěřilová: Mývalit, topit, baštit - How to improve web corpus annotation

29.11.

Moiz Khan Sherwani: Toponym disambiguation
Terézia Šulganová: Logical analysis of English sentences

6.12.

Vítek Suchomel: crawler, czTenTen17?, žánry

13.12.

Josef Šamánek: Automatic Text Summarization
Marek Medveď: AQA

Program semináře v jarním semestru 2017

datum program

22.2.

program semináře na tento semestr
HaBiT Corpus Annotation results

1.3.

Aleš Horák: Manipulativní techniky propagandy v době internetu
Adam Rambousek, Michal Měchura: Budapešť COST meeting
Adam Rambousek, Michal Měchura: Nový český slovník

8.3.

Aleš Horák: Intergovernmental exchange programmes
Ondřej Herman: Word embeddings using Fasttext

15.3.

Vítek Suchomel: Genre Identification of Documents in a Large Web Corpus

22.3.

Aleš Horák: Joint Masters programme: Multilingual Digital Content studies

29.3.

Zuzana Nevěřilová: Build It, Break It The Language Edition
Aleš Horák: Environment for Communication-based AI, General AI Challenge, Machine Learning Meetup
Michal Měchura: Grammatical Framework
Marek Medveď: chatbot

5.4.

Zuzana Nevěřilová: NER

12.4.

Lukáš Banič: Budovanie frázových tezaurov pomocou CQL dotazov a modifikácie word2vec-u

19.4.

Lukáš Banič: POS-tagging using minimal training sets
Marek Medveď: GoodAI

26.4.

Vojtěch Kovář: Sketch Grammar development by non-native speaker
Michal Růžička: Sémantické vyhledávání dokumentů

3.5.

Vojtěch Mrkývka: TBA
Michal Štefánik: Klasifikace témat webových dokumentů. Postup a vyhodnotenie úspešností. Praktické postrehy z použitia nástrojov (gensim-preprocessing, -word2vec, -doc2vec, sklearn, tensorflow pre NN).

10.5.

Petr Mejzlík: Editor vertikálu

17.5.

Honza Rygl: Praktická demonstrace SIR (30 min)
Terézia Šulganová: TIL

24.5. 13:00

Miloš Jakubíček: a možná prijde i dizertačka;) (A víno, sýry a tak...)
subtopic: Syntactic and Logical Analysis of Natural Language and its Evaluation Methods

Program semináře v podzimním semestru 2016

datum program

21.9.

program semináře na tento semestr
Michal Měchura: Lexonomy
workshop na UAA

5.10.

12.10.

Vítek Suchomel: Web crawling, DSL competition, Active learning for genre identification

19.10.

Pavel Rychly: Manatee

26.10.

Blanka Hanzlová: Antroponyms in Facebook group LARP CZ
Vít Baisa: obhajoba dizertace nanečisto (max 20 min)

2.11.

Ahmed Abdalla: Sentiment Polarity
Tomaž Erjavec: Slovene Academic Texts: Prototype Corpus and Research Plan

9.11.

Ondra Svoboda: PoS Tagging evaluation

16.11.

Adriana Babincova: Morphological variants - a problem of NLP

23.11.

Jakub Machura: Automatic Punctuation Detection

30.11.

Sandra Tukacova: Comparison of Czech and English WordNet(s)
Nikola Ljubešić: The Tweet(Cat|Geo|Pub) suite for collecting, analysing and publishing Twitter corpora
Darja Fišer: The JANES toolchain for processing non-standard language
Honza Rygl: NN in NLP

7.12.

Adam Rambousek: Recent news from Institute of Czech Language
Milos Jakubicek: TBA

14.12.

Marek Medved: AQA development
Vojta Kovar: Wine, cheese, Christmas songs and syntax
chatbot projekt

Program semináře v jarním semestru 2016

25.2.

program semináře na tento semestr
témata BP/DP
organizace TSD
výběr nlpassist
Habit: workshop v Addis Abeba
zpracování a značkování czTenTenu15
soutěž v umělé inteligenci o 20 000 http://rare-technologies.com/competitions/rarebot/

3.3.

Vojta Kovář: Řím a gold standardy

10.3.

TextMiner
info schuzka pro potencialni nove PGS
Miloš Jakubíček, Aleš Horák: nový český slovník

17.3.

Zuzka Nevěřilová: Annotation of MWEs and Foreign Words
Marek Medveď: AQA: answer extraction

24.3.

Jitka Dvořáková: praktické využití českých korpusů při výuce na ZŠ

31.3.

Vítek Baisa: hierarchický jazykový model
Ondřej Svoboda: „kde je plně označkovanej DESAM?“

7.4.

Ondřej Svoboda: nástroj na měření chyb při změnách tagsetu/značkování
nlpunix - vyhled HW

14.4.

Honza Rygl: Style & Identity Recognition
Pavel Rychlý: Efektivita distribuovaných výpočtů

21.4.

Vítek Baisa: bajtové jazykové modely

28.4.

Nikol Volková, Daniela Ryšavá: převod mezi CQL a přirozeným jazykem

5.5.

Ján Švec: Aktuálne o korpusoch s metainformáciami

12.5.

Vít Suchomel: 1. Protispamové úpravy v crawlingu. 2. Vlastnosti webových korpusů (homogenita, žánr dokumentu).

19.5.

Pavel Šmerk: TBA (Tracheobronchial amyloidosis)

Program semináře v podzimním semestru 2015

datum program

23.9.

doktorát Herzinger
Norské fondy - workshop na UAA
publikace
program semináře na tento semestr
Noc vědců
Pavel Šmerk: Derivanče

30.9.

nábytek do laboratoře
Marek Medveď: konference RANLP
Marek Medveď: možnosti zařízení z Norských fondů
Vítek Baisa: rozhovor pro ruská média

7.10.

Honza Rygl: konference Data-Znalosti, workshop o Pythonu

14.10.

děkanské volno - čestný doktorát prof.Herzingera

21.10.

Michal Rott, TUL Liberec: Představení Laboratoře počítačového zpracování řeči
Ján Švec: aktuálně o autorském korpusu
Zuzka Nevěřilová: Seminář o NooJ

4.11.

Vojta Kovář: anglický EFa

11.11.

Vítek Baisa: aktuální výzkum TBC

18.11.

Pavel Šmerk: Internetová jazyková příručka a obrana proti vykrádání

25.11.

Zuzka Nevěřilová: něco o pojmenovaných entitách

2.12.

Marek Medveď: Question Answering

9.12.

Miloš Jakubíček: Nový český slovník

16.12.

Vítek Suchomel: Vyhodnocení protispamových úprav v crawleru

Program semináře v jarním semestru 2015

datum program

17.2.

program semináře na tento semestr
předmět Advanced NLP
meeting COST akce ENeL

24.2.

Mgr internship
zahraniční PGS
Miloš Jakubíček: Vyhodnocování word sketchů (III), http://corpus.tools, správa dlouho běžících procesu ve SkE

3.3.

Zuzka Nevěřilová: workshop PARSEME
Zuzka Nevěřilová: MWE

10.3.

Návrhy nových směrů na FI - do 31.3.
Všichni: výstup na Milošovku :)
Lucia Kocincová: GAČR - info pro uchazeče o grant
Jana Rusinková: web NLP očami copywritera

17.3.

Winograd Schema Challenge
Jana Rusinková: klasifikace dokumentů
Lucia Kocincová: vizualizace korpusových dat

24.3.

Vítek Suchomel: spam ve webových korpusech
Honza Bušta: klasifikace Creative Language

31.3.

Business Research Forum MUNI
Vítek Baisa: extrakce vícejazyčné terminologie
Vítek Baisa: novinky ve SketchEngine?
Vítek Baisa: SemEval 2015, task 15: report

7.4.

Ján Švec: Automatické budovanie webového korpusu
Tomáš Čapek: update k Sholva a Czechtris

14.4.

Provozní řád - přístup do serverovny
Dita Salajková: Počítačová simulace sociální role
Honza Bušta: průběžné výstupy klasifikace Creative Language

21.4.

Vojta Kovář: Doplňování a korekce interpunkce v češtině
Lucia Kocincová: new visualizations in Sketche Engine; usability testing and tracking tools

28.4.

Word Embeddings
Ondra Svoboda: parser ijáček, parsování z pohledu slovosledu

5.5.

Marek Medveď: nové výsledky v QA
Kristýna Zemková: jednoduše syntax a interpunkce
Vítek Baisa: překladoví kandidáti pomocí kolokací

12.5.

Honza Rygl: další aplikace SIR
Adam Rambousek: DEBWrite - dictionary application in one-click

Program semináře v podzimním semestru 2014

datum program

16.9.

program semináře na tento semestr
pokonferenční schůzka TSD
termín RASLAN 2014

23.9.

Dana Hlaváčková: Návrh do OP VVV
Vítek Baisa, Vojta Kovář, Zuzka Nevěřilová: workshop PLIN
Petr Machovec: Sumarizace textu krátce (5 min)

30.9.

Pepa Bušta: Rozšiřování překladových pamětí
Pavel Rychlý: HaBiT project
Zuzka Nevěřilová: Jak proběhla Noc vědců
možnost úvazku extrakce informací

7.10.

Petr Sojka: Math Information Retrieval: Past, Present and Future

14.10.

Vojtěch Kovář: Co se nevešlo do disertace
Michal Růžička: Math Information Retrieval for Digital Libraries

21.10.

prof. Lu Qin from Hong Kong PolyU (with prof. Chu-Ren): Web Persons Disambiguation
Hongkong study advertisements

4.11.

dr. Partha Pakray: Textual Entailment and Question Answering
Pavel Šmerk: Přídavná jména od jmen místních

11.11.

Vít Baisa: Character-based language model
Zuzka Nevěřilová: Prediktivní psaní
Vojta Kovář: Vybrané (a aktualizované) kapitoly z disertace

18.11.

Adam Rambousek: Aktuální slovníkové projekty platformy DEB
Statistika příspěvků RASLAN 2014

25.11.

Marek Medveď: Question Answering
Tomáš Čapek: Czechtris

2.12.

Vítek Suchomel: Podobnost a stejnorodost (sub)korpusů

9.12.

Honza Rygl: Rozpoznávání stylu pisatele

16.12.

Petr Machovec: Sumarizace textu
Miloš Jakubíček: wine & cheese & koledy

Program semináře v jarním semestru 2014

datum program
18.2. program semináře na tento semestr

25.2.

Pavel Hančar: Hadoop a jine MapReduce v labu
Zuzka Nevěřilová: parafrázování a dr. Watsonson

4.3.

Vojta Kovář: něco o SETu
Martin Čarnogurský: nové webové rozhraní pro Synt

11.3.

Vítek Suchomel et al: extrakce termínů
Vítek Baisa: extrakce dvojjazyčné terminologie
Lucia Kocincová: NLP web - rýchla diskusia o zániku/ponechaní stránok

18.3.

Louis Wei-lun Lu, FF, MU: zpracování tchajwanštiny a čínštiny na MU
Honza Bušta: nlpunix -- stav a vize :)

25.3.

NLP robot
web nlp - pristup, notifikace, preklopeni?
Matej Pavla: Question answering se syntaktickou analýzou
Vojta Kovář: něco o SETu -- dokončení

1.4.

Adam Rambousek: Tezaurus pro katastr
Štěpán Přichystal: Question Game

8.4.

Jiří Materna: LDA rámce (stav před odevzdáním disertace)

15.4.

TSD - domluva na vyletu
doplnit probehle prezentace!

22.4.

Vítek Suchomel: detekce spamu na webu
Andrej Herich: Vyvozování znalostí v TIL
Zuzana Nevěřilová: CICLing

29.4.

workshop se seznamem
clanky do casopisu
Honza Bušta: něco o neologismech a idiomech

6.5.

Lucia Kocincová: Parsovanie enTenTen aneb adaptácia MST a Malt Parseru na angličtinu
Marek Medveď: slovenský synt

13.5.

Honza Rygl: autorství a kurz vedení vědeckého týmu
Miloš Jakubíček: TBA

Program semináře v podzimním semestru 2013

datum příspěvky
16. 9. program semináře na tento semestr
termíny RASLANu 2013
web NLP -- co zbývá udělat? (Lucka, VítekB, Zuzka)
nákupy HW
trička NLP
23. 9. Vítek Suchomel: stručné postřehy z konference Corpus Linguistics [10']
Pavel Rychlý, Miloš Jakubíček: Virtuální korpusy v Manatee [30']
Pavel Rychlý, Miloš Jakubíček: META-FORUM 2013 a 2014 [15']
30. 9. Aleš Jiroudek: Možnosti paralelizace s platformou CUDA
Zdeňka Sitová: Jak bylo na ESSLLI 2013
Vít Baisa, Vojtěch Kovář, Miloš Jakubíček: Workshop pro PLIN v Baldovci [15']
Zuzka Nevěřilová: Noc vědců
7. 10. Aleš Horák: Info schůzka oborů UMI a PLIN, přednáška na kolokviu
Vít Baisa: CAT a rozšiřování překladových pamětí
Lucia Kocincová: How to write competitive proposals
14. 10. Tomáš Čapek: nejspis NLP portal
21. 10. Laboratorní seminář není dokonalý
28. 10. Státní svátek - Den vzniku samostatného Československa (1918) :)
4. 11. Zuzana Nevěřilová: Anotační hry/a
Vojta Kovář: Novinky ve SkE, v SETu a vůbec :)
11. 11. Vít Baisa: Novinky v CPA, SkE, drobnosti
Lucia Kocincová: Jak propagovat nejen projekty
18. 11. Martin Víta: Linked data in linguistics (a možná překlady inzerátů)
Marek Medvěď: Lexikální analýza v Syntu
25. 11. Vítek Suchomel: Spam v dokumentech z webu
Jirka Materna: word2vec aneb statisticka semantika trochu jinak
2. 12. Adam Rambousek: Slovník znakového jazyka
Vít Baisa: Pár postřehů z české Wikikonference
9. 12. Pavel Šmerk: TBA
Honza Rygl: Autor
16. 12. Lucia Kocincová: wine & cheese & koledy
Honza Bušta: Nové neologismy

Program semináře v jarním semestru 2013

datum příspěvky
20. 2. program semináře na tento semestr
možná spolupráce s Poznaní
možná spolupráce s Chaps - S. Franc
27. 2. CLARIN mobility granty, oživit http://nlp.fi.muni.cz/trac/research
Vojta Kovář: co dělám na syntaxi a na SkE (přetečení z minulého semestru -- myslím, že tak na 30-60 minut, ale to už jsem si myslel předtím dvakrát :) )
Zuzana Nevěřilová: Pojmenované entity v češtině
6. 3. Zuzana Nevěřilová: CZPJ a média (zpráva ze semináře Jak prezentovat vědu v médiích)
Vít Baisa: Nový editor CPA, Trac, Editor
Všichni: Organizace práce v labu (trac, měsíční zprávy, peer-review atd.) v Trac
13. 3. Ismaïl El Maarouf: Progress and perspectives in computational linguistics aspects of the DVC project
Vašek Němčík: Saara a statistiky spoluvýskytů ze Ske [25']
Marek Medveď: RFtagger na slovenštině
20. 3. Vít Baisa:! ukázka CZ-EN MT pomocí suffix array
27. 3. diskuse ke grantům - GAČR, TAČR
Honza Bušta: Creative language
Vítek Suchomel: lepší extrakce termínů než minule (a možná něco dalšího)
3. 4. Miloš Jakubíček: CICLing 2013 (zážitky, poznámky, fotky, víno atd. - 30')
prof. Zygmunt Vetulani: Invited talk
10. 4. Martin Víta (F-solutions): Evaluace vybraných systémů MT na specifických kolekcích textů
Kristýna Zemková: Využití syntaktické analýzy pro určování autorství
Helena Palátová: Floskule
Honza Michelfeit, Vojta Kovář, Miloš Jakubíček: Paralelní korpusy
17. 4. Lucia Kocincová: parsery pro češtinu
24. 4. Honza Rygl: Autor - (před)produkční verze
Tomáš Čapek: obhajoba meho diplomanta nanecisto - komentarovy system pro online zdroje; novinky v NLP portalu, snad neco noveho k anotovani a CZWN
Adam Rambousek: slovník znakového jazyka
Vašek Němčík: Saara a preference na základě statistik spoluvýskytů a sémantických tříd [15']
15. 5. Pavel Šmerk, Miloš Jakubíček: Nový a lepší tagger pro češtinu
Vojta Kovář, Vítek Baisa, Miloš Jakubíček: WSeval
Jiří Materna: Aplikace pro LDA rámce

Program semináře v podzimním semestru 2012:

  • 18.9.2012
    • program semináře na tento semestr
    • informace o plánovaných změnách v doktorském studiu
  • 25.9.2012
    • Pavel Šmerk: Představení stránky o fajce
    • RASLAN - místo a čas
    • schůzka oborů UMI a PLIN
  • 2.10.2012
    • Petr Horáček (FIT VUT): Nové gramatické systémy a jejich lingvistické aplikace
    • Vašek Němčík: Saara - proč, co, kde a jak. [~30']
    • Aleš Horák: studentské projektu GA MU, dohody na anotace, práce nad texty PSP
  • 9.10.2012
    • Pavel Šmerk: Opravdu představení stránky o fajce
    • Miloš Jakubíček: Proč a jak používat Git
    • Pavel Rychlý: O značkování dat
  • 16.10.2012
    • Zdeňka Sitová: Erasmus a výuka AI na K.U. Leuven
    • Miloš Jakubíček: Valence v Syntu aj.
    • Jirka Vejvoda: Shlukování článků se stejnou tématikou v gensimu
  • 23.10.2012
  • 30.10.2012
    • Zuzka Nevěřilová: Inference v textu
    • Pavel Rychlý: projekty CLARIN a LINDAT
  • 6.11.2012
    • Vojta Kovář: co nového v rozhraní Sketch Engine (30')
    • časopisecké publikace
  • 13.11.2012
    • Jiří Materna: LDA rámce -- další vývoj
  • 20.11.2012
    • Adam Rambousek, Vít Baisa: Lze použít CPA principy pro češtinu?
    • Vít Baisa: Suffix array, longest common prefix a longest frequent prefix (SA, LCP, LFP)
  • 27.11.2012
    • Pavel Hančar: MapReduce
    • Vojta Kovář: co nového v SETu (30')
    • Lucka Kocincová: jak děláme skeče ze syntaktické analýzy a rozjíždíme cizí parsery
  • 4.12.2012
    • Vítek Suchomel: co nového v Corpus Architectu, získávání matematických textů z webu, czTenTen12 (30')
    • Honza Rygl: Autorství (funkční DEMO)
    • Petr Machovec: Prohledávání VerbaLexu
  • 11.12.2012
    • Marek Blahuš: Webové stránky pro studium češtiny (nabídka spolupráce na projektu CJV MU)
    • Tomáš Čapek: OpenCZWordNet - plán a realizace
  • 18.12.2012
    • wine & cheese & koledy & tlačenka

Program semináře v jarním semestru 2012:

  • 22.2.2012
    • program semináře na tento semestr
    • Pavel Rychlý: organizační pokyny
  • 29.2.2012
    • Andrej Gardoň: konference ICAART 2012
    • Vojta Kovář: Nový zéland
    • Honza Pomikálek: podobnost korpusů, extrakce termů
  • 7.3.2012
    • Vojta Kovář: ještě něco o konferenci na NZ[5']
    • Miloš Jakubíček, Aleš Horák: poznatky z review
    • Vašek Němčík: PDT2vert a "Brno ze zkumavky"
  • 14.3.2012
    • Vojta Kovář: Recent SET developments [15']
    • Vojta Kovář: Yet another formalism for syntax? [15']
    • Vítek Suchomel: new corpora (quick overview) [10']
    • Vítek Suchomel: vertfork (parallelization tool) [5']
  • 21.3.2012
    • odpadá
  • 28.3.2012
    • Juyeon Kang: French supertagging (a little bit of Czech)
    • Vašek Němčík: Saara (where and how) and corpora annotated for coreference (overview)
  • 4.4.2012
    • Miloš Jakubíček: citace RASLANu (5 min)
    • Zuzka Nevěřilová: něco o odvozování v textu
    • Tomáš Čapek: Dokumentování čehokoliv včera a dnes
  • 11.4.2012
    • Probrat, jestli nechceme ignorovat rektorské volno 16.5.
    • Miloš Jakubíček: desamb se syntem
    • Vít Baisa: CBLM - ukázka, diskuze spíše technického rázu [15']
  • 18.4.2012
    • Vít Baisa: ukázka dat z CBLM [10']
  • 25.4.2012
    • Adam Rambousek: FaNUK
    • Vítek Suchomel: named entities recognition using GATE (3rd party software, brief demonstration) [15']
    • Vašek Němčík: Saara evaluation
    • Aleš Horák: info o pozicích v DERI, nabídka dat od Seznamu
  • 2.5.2012
    • Jiří Materna: Hierarchické LDA rámce
  • 9.5.2012
    • Honza Rygl: Autor demo 2
    • Pavel Šmerk: fajka
  • 16.5.2012
    • Pavel Hančar: MapReduce
    • Gulšan Dovudov: morphological analysis of Tajik
    • Marek Medveď: Synt a SET pro slovenštinu
    • Miloš Jakubíček & Lucka Kocincová: Trochu statistiky o UMI

Program semináře v podzimním semestru 2011:

  • 22.9.2011
    • program semináře na tento semestr
    • kontrola cest
    • Noc vědců
  • 29.9.2011
    • Honza Pomikálek, Vítek Suchomel: Jedi Crawler, jusText, Onion, Chared
  • 6.10.2011
    • Zuzka Nevěřilová: Sheldon's Cookbook
    • Juyeon Kang: Intro
  • 13.10.2011
    • Vašek Němčík: Saara & how to feed her
  • 20.10.2011
    • Miloš Jakubíček: Zapojení syntu do desambu
    • Vojta Kovář: ten zbytek do syntaktického semináře
  • 27.10.2011
    • Vítek Baisa: představení tezí, fotky z Kyrgyzstánu a organizační záležitosti k výletu do krasu
    • Pavel Rychlý: Proč programovat v Pythonu. (přednáška nebude ani o Pythonu ani o programování( nlpcentre.pdf )
  • 3.11.2011
  • 10.11.2011
  • 17.11.2011
    • seminář se nekoná, státní svátek
  • 24.11.2011
    • Adam Rambousek: Nová encyklopedie češtiny
  • 1.12.2011
    • Andrej Gardoň: Langauge, Mind and their simulation using TIL (Dolphin Nick, GuessME! )
    • Presentation language: slovak
  • 8.12.2011
    • Honza Bušta: Idiomy (a idioty)
    • Honza Bušta: Serverová aplikace pro korpus chyb
  • 15.12.2011
    • Pavel Hančar: MapReduce? u nás v laboratoři
    • Jan Rygl: DEMO Autorství
  • 22.12.2011
    • Pavel Šmerk: ajka => majka (a svařák a koledy?)

Program semináře v jarním semestru 2011:

  • 23.2.2011
    • program semináře na tento semestr
    • informace o NlpAssistentce
    • informace o cestách v roce 2011
  • 2. 3. 2011
    • Honza Pomikálek: PRESEMT + Čištění korpusových dat
  • 9. 3. 2011
  • 16. 3. 2011
    • Vít Baisa: Fotky z Chile & Argentiny
    • Vít Baisa: Průběžné výsledky ze dvou poloautomatických anotací VerbaLexu
    • Zuzka Nevěřilová: Nový formát VerbaLexu
  • 23. 3. 2011
    • Vašek Němčík: Saara a export PDT2 do vertikálu
    • Aleš Horák, Miloš Jakubíček, Vojta Kovář: TIL korpus
  • 30. 3. 2011
    • Tomáš Čapek: Limity strojového překladu
  • 6. 4. 2011
    • info k návrhu GAČR projektu
    • Miloš Jakubíček: synt: méně je více
    • Karel Vaculík: Predicate-argument structure z české věty
  • 13. 4. 2011
  • 20. 4. 2011
    • Vojta Kovář: SET (dokončení)
    • Vít Baisa: Jeden princip: od morfologie až k reprezentaci znalostí
  • 27. 4. 2011
    • Jiří Materna: Introduction to Latent Dirichlet Allocation
    • Jiří Materna: Semantic frames as probabilistic generative models
  • 4. 5. 2011
  • 11. 5. 2011
    • Marek Blahuš: Rozšíření českého WordNetu? podle anglického překladovým slovníkem - diplomová práce
    • Marek Grác: nástin dizertačky TBA
  • 18. 5. 2011
    • Zdeněk Žabokrtský: Strojový překlad s využitím závislostní syntaxe
  • speciální přednáška - 31. 5. 2011

Program semináře v podzimním semestru 2010:

  • 22.9.2010
    • program semináře na tento semestr
    • postery na Noc vědců - dodělat odkazy Vyzkoušejte si na náš web, vyrobit screencasty pro prezentaci
    • nachystat schůzku UMI a PLIN, cca za 3 týdny, asi v B204 v Po v 18
  • 29.9.2010
    • Pavel Rychlý: ČAJ (aneb když jsme byli mladí a hezcí)
    • Honza Bušta: Erasmus
    • kde jsme byli, co jsme viděli
  • 6.10.2010 EuDML – status reports
  • 13.10.2010
    • Tomáš Čapek: Výsledky heuristických testů nad CZWN
  • 20.10.2010
    • Zuzana Nevěřilová: něco o named entity recognition a Wikipedii
  • 27.10.2010
    • záskok Adam Rambousek
  • 3.11.2010
    • Vašek Němčík: Saara - demo a sbírání postřehů a feature requests
    • Honza Bušta: Detekce idiomů v korpusu
  • 10.11.2010
    • Vít Baisa: PZPJ: přístup "odspodu"
  • 17.11.2010
    • seminář se nekoná - státní svátek
  • 24.11.2010
    • Marek Blahuš: pracovní stáž ve Francii
    • Miloš Husák: sémanticky podložená extrakce informací z korpusu
  • 1.12.2010
    • Miloš Jakubíček, Vojta Kovář: syntaktický seminář– PDT, synt, set, TIL projekt a další
  • 8.12.2010
    • Jiří Materna: Určení tematické konzistence dokumentu
  • 15.12.2010
    • Pavel Šmerk: wine & cheese a koledy apod.
    • Dana Hlaváčková, Vašek Němčík: Editace VerbaLexu

Program semináře v jarním semestru 2010:

Program semináře v podzimním semestru 2009:

  • 23.9.2009
    • program semináře na tento semestr
    • plánování publikací a cest
  • 30.9.2009
    • Tomáš Čapek, Adam Rambousek - český wordnet v DEBDictu
    • Tomáš Čapek - koncepce pro opravy v českém wordnetu
  • 7.10.2009
    • Karel Pala - návrh na koupě HW a SW
    • Petr Sojka - prezentace navštívených konferencí a workshopů - TSD 2009, ECDL 2009, DML 2009
    • změny a aktualizace na laboratorním webu
    • Vít Baisa - několik návrhů na změnu vzhledu a na doplnění obsahu lab. webu
  • 14.10.2009
    • ňáký anafory v syntu jsou nemocný ... budou presentovány po uzdravení
  • 21.10.2009
    • Marek Grác - GUI klikátko na slovesné valence
    • Zuzka Nevěřilová - Extending VerbaLex ( neverilova_prezentace.pdf )
    • navrhované BP/DP
  • 28.10.2009 - svátek, seminář není
  • 4.11.2009
    • Jiří Materna - Doménové kolokace
  • 11.11.2009
    • Jaroslav Moravec - Korekturní rozšíření pro OpenOffice.org
  • 18.11.2009
    • Honza Pomikálek - nový algoritmus na klasifikaci odstavců
    • příprava na raslan
  • 25.11.2009
    • Aleš Horák - stav VerbaLexu?
    • Adam Rambousek, Aleš Horák - projekt KYOTO
    • Marek Blahuš - Kontrolor pravopisu pro Esperanto - studentský projekt
  • 2.12.2009
    • Vašek Němčík - Anafory v syntu
  • 9.12.2009
    • Vojta Kovář - SET a vůbec a jak je to se studentskýma projektama
    • Honza Bušta - KMJ, neologismy
    • Vít Baisa - Asistovaný překlad
  • 16.12.2009
    • Vít Baisa - Asistovaný překlad (krátké dokončení z minula, diskuze)
    • Honza Pomikálek - disertačka o korpusech
    • Miloš Jakubíček - LTC, LCT, lt-world.org a další diskuse ohledně zviditelnění CZPJ

Program semináře v jarním semestru 2009:

  • 17.2.2009
  • 24.2.2009
  • 3.3.2009
    • Aleš Horák: ještě k požadavku řečařů z Liberce
    • Aleš Horák: různé - přidat otravnou zprávičku o ochraně dat labu, publikace v březnu
    • Marek Blahuš: Zkušenosti z půlročního pobytu na K.U.Leuven v Belgii v rámci programu Erasmus
  • 10.3.2009
    • Marek Grác: NLPunix
    • Pavel Rychlý: Korpus Czes
  • 17.3.2009
    • Tomáš Čapek: Nové MWE
  • 24.3.2009
    • Honza Pomikálek: CICLING 2009 v Mexiku
  • 31.3.2009
    • Vojtěch Kovář: Syntaktická analýza češtiny: současný stav, problémy a nápady na jejich řešení, analyzátor SET
  • 7.4.2009
    • Jiří Materna: Rozšiřování VerbaLexu o informace z Framenetu
  • 14.4.2009
    • Miloš Jakubíček: Využití extrakce struktur: interpunkční korektor a extrakce valencí
    • Marek Grác, Miloš Jakubíček, Jan Bušta: O kolokviu mladých jazykovědců v Prešově
  • 21.4.2009
    • Miloš Jakubíček, Jan Bušta: Korpus chyb
  • 28.4.2009
    • Adam Rambousek, Aleš Horák: Postup v projektu KYOTO
  • 5.5.2009
    • Marek Grác: I cesta může být cíl
    • Honza Pomikálek: Corpus Architect
  • 12.5.2009
    • Pavel Šmerk: to stačí (TBA)
  • 19.5.2009
    • Václav Němčík: TBA
    • Pavel Rychlý: Translingual Europe 2009

Program semináře v podzimním semestru 2008:

  • 17.9.2008
    • program semináře na tento semestr
    • plánování cest a workshopu RASLAN 2008
  • 24.9.2008
    • Pavel Rychlý: Proč (ne)programovat v některých jazycích II
  • 1.10.2008
    • Aleš Horák: zhodnocení TSD 2008
  • 8.10.2008
    • Miloš Jakubíček, Jan Bušta: EMLS 2008
    • Petr Sojka: From Pixels to Minds and Back
  • 15.10.2008
    • Pavel Rychlý, Honza Pomikálek: BiWeC II
  • 22.10.2008
  • 29.10.2008
    • Vašek Němčík: Anaphora Resolution & MMAX2 & PDT2
  • 5.11.2008
    • Vojta Kovář, Miloš Jakubíček: Test suite a další novinky v syntu
  • 12.11.2008
    • Vojta Kovář: Syntaktická analýza s využitím postupné segmentace věty (SET)
  • 19.11.2008
    • Jan Bušta: Četnost idiomů v korpusu
  • 26.11.2008
    • Aleš Horák, Adam Rambousek: Postup v projektu KYOTO
  • 3.12.2008
    • Honza Pomikálek, Vojta Kovář: Mikulášský Corpus Architect
    • Honza Pomikálek, Vojta Kovář: Výsledky NLPbota ve FIBotovi
  • 10.12.2008
    • Tomáš Čapek: Semantické sítě a hierarchické lexikony v praxi
  • 17.12.2008
    • Pavel Šmerk: (hotová?) nová ajka
    • Máša Khokhlova: Krátká Vánoční zpráva, aneb opožděné představení

Program semináře v jarním semestru 2008:

  • 27.2.2008
    • Pavel Rychlý: Od programování k filosofii a zpět
  • 5.3.2008
    • Husák: GDEX, Good Dictionary Examples
    • Webadmini NLP (Němčík): MoinMoin? Wiki
  • 12.3.2008
    • Vláďa Kadlec, Vojta Kovář, Aleš Horák: Syntaktická analýza s využitím slovesných valencí
    • Admini NLP: Jak formátovat disky, udržba distribuce na strojích NLP, apod.
  • 19.3.2008
    • Honza Pomikálek: Jak spolehlivě detekovat kódování znaků, známe-li jazyk textu
    • Radim Řehůřek, Petr Sojka: Klasifikace matematických textů
  • 26.3.2008
    • Vojta Kovář: Postupná segmentace věty a její využití v syntaktické analýze
  • 2.4.2008
    • Marek Blahuš: Kontrola pravopisu a její specifika pro jazyk esperanto
    • Jiří Materna: Automatické určení domény české webové stránky
  • 9.4.2008
    • Pavel Rychlý, Honza Pomikálek: BiWeC (Big Web Corpus)
    • Pavel Šmerk: Guesser
  • 16.4.2008
    • Jakubíček: Extrakce struktur syntaktického analyzátoru
  • 23.4.2008
    • Vašek Němčík: WordNet? Assistant
    • Aleš Horák: KYOTO projekt
  • 30.4.2008
    • Radim Řehůřek: Oprava překlepů ve fulltextovém hledání Seznam.cz (1h až neomezeně)
  • 7.5.2008
    • Bušta: Četnost idiomů v korpusu
  • 14.5.2008
    • Petr Sojka et al.: DML-CZ
  • 21.5.2008
    • probírání nákupu HW, organizace laboratoře

Program semináře v podzimním semestru 2007:

  • 18.12.2007
    • Víťa Nováček - co dělám v Irsku :-), aneb: (1) projekt Knowledge Web - dynamic ontology lifecycle, integrace ontologií; (2) Jak se peče OWL - nahlédnutí do kuchyně W3C; (3) empirické usuzování - pokus o jedno čistě soukromé kacířství na pokračování... Rozsah a pořadí konkrétních témat můžeme libovolně upravit dle zájmu a času na místě.
  • 11.12.2007
    • Vojta Kovář - Opravdu hotový beautified chart
  • 4.12.2007
    • Vašek Němčík - Anaphora Resolution: krátký úvod; ukázka dat pomocí MMAX; ukázka anotace v PDT2; ukázka dat získaných ze syntu; výhled do budoucna (využití valencí/thesauru, strojové učení)
  • 27.11.2007
    • pro nemoc se seminář nekoná
  • 20.11.2007
    • Adam Rambousek, Aleš Horák - Administrační rozhraní DEB
  • 13.11.2007
    • Vláďa Kadlec - Syntaktická analýza přirozeného jazyka založená na bezkontextových gramatikách
  • 6.11.2007
    • Honza Pomikálek, Pavel Rychlý - Odstraňování duplicit v korpusu
  • 30.10.2007
  • 23.10.2007
    • Marek Grác - Parciální vzory pro slovesa
  • 16.10.2007
    • Pavel Šmerk – Od naskenovaného textu ke značkovaným validovaným datům (SSJC, PSJC)
  • 9.10.2007
    • Aleš Horák, Adam Rambousek - Global WordNet? Grid
  • 2.10.2007
    • Honza Pomikálek - Tvorba paralelních korpusů z webu
  • 25.9.2007
    • Dana Hlaváčková - přehled možností pro výjezdní zasedání laboratoře
    • Pavel Rychlý - Opravdu velké (dvacetimiliardové) korpusy
  • 18.9.2007
    • vytvoření seznamu prezentací pro tento semestr
    • cesty do konce roku
    • nlpweb, prezentace laboratoře na fi?
    • nlpunix, marx
    • vyjezdni zasedani laboratore

Nabídka vystoupení:

  • Vláďa Kadlec, Aleš Horák - Syntaktická analýza s využitím slovesných valencí
  • Honza Pomikálek - jak spolehlivě detekovat kódování znaků, známe-li jazyk textu

Program semináře v jarním semestru 2007:

  • 15.5.2007
    • Petr Sojka - Od naskenovaného textu ke značkovanému repositáři matematických textů
    • Marek Grác - Nástroj pro automatickou tvorbu česko-slovenského slovníku
  • 24.4.2007
    • Vašek Němčík - Anaphora Resolution
  • 17.4.2007
    • Pavel Šmerk - ajka2: "chci být jiná, lepší"
  • 10.4.2007
    • Mirek Prýmek, Aleš Horák - projekt ElNet?, simulační systém Rice
    • Pavel Šmerk - ajka2: "chci být jiná, lepší"
  • 3.4.2007
    • Vojta Kovář - Zobrazování konkordancí obousměrných horizontálních textů
    • Vojta Kovář - synt - beautified chart
    • Radim Řehůřek - Segmentace textu, vyhodnocení
  • 27.3.2007
    • Dana Hlaváčková - aktuální práce na VerbaLexu?, diskuze o problémech při editaci
  • 20.3.2007
    • Patrick Hanks, Adam Rambousek - CPA
  • 13.3.2007
    • Pavel Rychlý - Kapradí - nástroj pro práci s paralelními korpusy anglického dramatu
    • Jiří Materna, Richard Šimek, Marek Grác - Valenční rámce v analyzátoru Zuzana
    • Vláďa Kadlec - Použití VerbaLexu? v syntu
  • 6.3.2007
    • Martin Kudlej, Adam Rambousek - Cornetto – nizozemský wordnet
    • Tomáš Čapek - prezentace CMS systému DRUPAL
  • 27.2.2007 - v laboratoři B203
    • Tomáš Čapek - praktické použití českého WordNetu?, problémy s jeho ontologií
  • 20.2.2007 - v B411
    • plán vystoupení na semináři na celý semestr
    • Vašek Němčík - prezentace laboratoře na webu FI
    • úprava velkého labu pro to, aby v něm mohly být další semináře

Program semináře v podzimním semestru 2006:

  • 19.12.2006
    • Vašek Němčík - anaphora resolution, wordnet assistant
    • Pavel Šmerk - český tagger
  • 12.12.2006 v akvárku
    • Radim Řehůřek! - segmentace a (ne)indexování textů
  • 5.12.2006
    • James Thomas - Využití korpusů ve výuce jazyků
  • 28.11.2006 v akvárku
    • Pavel Rychlý – finlib
  • 21.11.2006 v zasedačce
    • Adam Rambousek - nlpis
    • Jarek Hlávka - nlplab-ubuntu
  • 14.11.2006
    • Aleš Horák - GDW a wwwsynt, GUI rozhraní k syntu
  • 7.11.2006
    • Tomáš Čapek - DTP v Open Source
  • 31.10.2006 v B411
    • Martin Rajman - informace o možné spolupráci se švýcarskou EPFL
  • 24.10.2006
    • Lubomír Popelínský - Strojové učení a přirozený jazyk 2004-6 (ve vztahu k laboratoři vyhledávání znalostí)
  • 17.10.2006
    • Vojta Kovář - Redukce počtu stromů na výstupu Syntu. Beautified stromy, beautified chart, přehled dalších metod
  • 10.10.2006
    • POZOR jsme v zasedačce
    • stanovení programu semináře na celý semestr
    • zprávy z konferencí a workshopů (SemWeb?, Euralex, ...)
  • 3.10.2006
    • diskuze - zálohování, laboratorní plakát, web
    • přestavba velkého labu
  • 26.9.2006
    • Adam Rambousek – jak vyrábět deb-balíky
  • 19.9.2006
    • seznámení, představení, návrhy na prezentace

Program semináře v jarním semestru 2006:

  • 23.5.2006
  • 16.5.2006
    • Vašek Němčík - Anaphora Resolution: úvod do problematiky, modulární systém presentovaný v diplomové práci, výhledy do budoucna
    • Pavel Cenek - From Unimodal to Multimodal Dialog Management
  • 9.5.2006
    • Mudrak - OCR matematiky v ramci projektu DML CZ
    • Marek Grác, Radovan Štancel - Česko-slovenský strojový překlad
  • 2.5.2006
    • Petr Sojka - obecně o projektu DML CZ
    • Panak - OCR matematiky v ramci projektu DML CZ
  • 25.4.2006
    • Zuzana Nevěřilová - program pro korekturu textů
  • 11.4.2006
    • Víťa Nováček - dolování (fuzzy) ontologií z textu v NL
  • 4.4.2006
    • Pavel Šmerk - český značkovač
  • 28.3.2006
    • Adam Rambousek - DEB a jeho noví klienti
  • 14., 21.3.2006
    • Co chceme v laboratoři dělat a co děláme (nástin probíhajících/připravovaných projektů)
  • 7.3.2006
    • Pavel Rychlý: Stručné dokončení z minulého semináře
  • 28.2.2006
    • Pavel Rychlý: V čem a jak programovat aneb proč neprogramovat v jazycích Java, Perl, C++, XSLT, ...
  • 21.2.2006
    • Honza Pomikálek: WebBootCaT (tvorba korpusů z webu), MetaTrans? (překladový metaslovník)

Program semináře v podzimním semestru 2005:

  • 21.12.2005
    • Lukáš Svoboda: Dialogový systém UIO
  • 14.12.2005
    • Patrick Hanks: Corpus Pattern Analysis
    • Anna Rumshisky:
  • 7.12.2005
    • Zuzka Nevěřilová: řekne později ;-)
    • Víťa Nováček: Ontology learning
  • 30.11.2005
    • seminář se nekoná
  • 23.11.2005
    • Honza Pomikálek: GVP, textové klasifikátory
    • Jeník Provazník: Inteligentní webcrawler
  • 16.11.2005
    • Pavel Šmerk: stav morfologické desambiguace, značek a korpusů
  • 2.11.2005
    • Aleš Horák, Adam Rambousek, Martin Kudlej: DEB II - platforma pro vývoj slovníkových editorů
  • 26.10.2005 (výjimečně v B411)
    • Jirka Mikulášek: blizna, pestík, floret, is-text-search, ...
    • Vladimír Kadlec: Robust stochastic parsing using optimal maximum coverage
  • 19.10.2005
    • Honza Pomikálek: Corpus Builder
  • 12.10.2005
    • Pavel Rychlý: Korpusový manažer Manatee: použití, nástroje, API
  • 21.9.2005
    • Seznamení: Každý aktivní spolupracovník řekne, čím se zabývá a zejména čeho by chtěl v následujícím semestru dosáhnout.

Program semináře v jarním semestru 2005:

  • 9.6.2005 - 29.9.2005
    • pouze příležitostně po předchozím ohlášení e-mailem na all at aurora.fi.muni.cz
  • 2.6.2005
    • Zdenko Staníček: Universální informační robot
  • 26.5.2005
    • Honza Provazník, Petr Jurášek - NLP unix
  • 19.5.2005
    • Václav Brožek: Formát pro uložení víceznačné morfologie a syntaktických struktur ve vertikálu
    • všeobecná diskuze: společný projekt české morfologie (desam + ajka)
  • 12.5.2005
    • Pavel Šmerk: stav a možnosti úprav korpusů DESAM a Stoka
    • všeobecná diskuze: web laboratoře
    • všeobecná diskuze: značky v ajce
  • 5.5.2005
    • Pavel Cenek: Řízení dialogu
    • všeobecná diskuze: značky v ajce
  • 28.4.2005
    • Pavel Rychlý: práce s daty, čeho se vyvarovat
    • všeobecná diskuze: budoucnost ajky
  • 21.4.2005
    • Pavel Rychlý: Nový velký slovník cizích slov
  • 14.4.2005
    • Petr Sojka: Competing Patterns in Language Engineering and Computer Typesetting
    • Zuzana Nevěřilová: Vizuální lexikon
    • Zuzana Nevěřilová, Petr Sojka: Visualizace sémantického webu na příkladu doménově vymezené digitální matematické knihovny
  • 7.4.2005
    • Lukáš Svoboda: uuiiuioo
  • 31.3.2005
    • Radek Sedláček: Morfologický analyzátor Ajka
    • Dana Hlaváčková, Aleš Horák: Lexikon slovesných valencí FI MU Vallex
  • 24.3.2005
    • Pavel Rychlý: Tvorba korpusu
    • Marek Veber: Editor morfologické databáze i_par
  • 17.3.2005
    • Jan Pomikálek a spol.
  • 10.3.2005
    • Aleš Horák a Vladimír Kadlec: Syntaktický analyzátor synt
  • 3.3.2005
    • krátké (max. několik minut) představení se každého aktivního spolupracovníka, na čem aktuálně pracuje, zamýšlí pracovat, případně pracoval.