= Laboratorní seminář = Laboratorní seminář slouží primárně k prezentaci činnosti aktivních spolupracovníků laboratoře: čím se zabývají, jaké mají výsledky, jaké případné problémy, které dílčí úkoly nestíhají řešit a uvítali by spolupráci někoho dalšího atd. Nepravidelně a spíše výjimečně lze očekávat i prezentace spřízněných pracovišť. Seminář se koná ve '''čtvrtek ve 14:00 hodin v B203''' (podzim 2021) a je otevřen všem zájemcům o danou problematiku (nemusí být aktivní v laboratoři). Lze si jej také zapsat jako předmět [https://is.muni.cz/predmet/fi/pv173 PV173 Seminář Laboratoře zpracování přirozeného jazyka] a za aktivní účast včetně prezentace svých výsledků (dosažených při řešení projektů NLP Centra, nebo o relevantní problematice) získat tři kredity. Případné přílohy k on-line prezentaci nahrejte podle [wiki:/cs/LaboratorniSeminar/PresentationInstructions instrukcí]. Nahraná videa (i dřívější) jsou dostupná na [wiki:/cs/LaboratorniSeminar/Videos video stránce]. === Žádané příspěvky: === * Dalibor Bačovský === Nabídka příspěvku: === * [https://www.leeds.ac.uk/arts/profile/125106/1011/serge_sharoff Serge Sharoff]: Reliable classification of web genres === Program semináře v podzimním semestru 2021 === #seminar_podzim || '''datum''' || '''program''' || {{{#!th rowspan=2 '''16.9.''' }}} || program semináře na tento semestr || || Aleš Horák: [http://raslan2021.nlp-consulting.net RASLAN 2021] Call for Papers || {{{#!th rowspan=2 '''23.9.''' }}} || Vít Novotný: [htdocs:seminar2021/VNovotny-Summer_NLP_Conferences.pdf SIGIR 2021 and RANLP 2021] || || Adam Rambousek: [http://nlp.fi.muni.cz/projects/ahisto AHISTO project] || {{{#!th rowspan=1 '''30.9.''' }}} || Michaela Denisová: Crosslingual embedding models || {{{#!th rowspan=1 '''7.10.''' }}} || Mikuláš Bankovič: Superresolution techniques for OCR || {{{#!th rowspan=2 '''14.10.''' }}} || Edoardo Signoroni: Corpus alignment by machine translation techniques || || Rastislav Papčo: Topic classificaton in web corpora || {{{#!th rowspan=1 '''21.10.''' }}} || Ondřej Sotolář: Facebook conversations classification || {{{#!th rowspan=2 '''4.11.''' }}} || Radoslav Sabol: TBA || || Ondřej Herman: TBA || {{{#!th rowspan=2 '''11.11.''' }}} || Tereza Vrabcová: TBA || || Adam Hájek: TBA || {{{#!th rowspan=2 '''18.11.''' }}} || Petr Zelina: TBA || || Samuel Špalek: TBA || {{{#!th rowspan=2 '''25.11.''' }}} || Marek Medveď: QA || || Kristína Němcová: TBA || {{{#!th rowspan=2 '''2.12.''' }}} || Tomáš Houfek: Information extraction from medical records || || Daniel Krátký: TBA || {{{#!th rowspan=1 '''9.12.''' }}} || Krištof Anetta, Mahmut Arslan: Electronic health records processing || === Program semináře v jarním semestru 2021 === #seminar_jaro || '''datum''' || '''program''' || {{{#!th rowspan=1 '''2.3.''' }}} || program semináře na tento semestr || {{{#!th rowspan=3 '''9.3.''' }}} || Pavel Rychlý: projekt LINDAT/CLARIAH-CZ || || Pavel Rychlý: projekt strojového překladu || || Pavel Rychlý: projekt generování slovníku || {{{#!th rowspan=2 '''16.3.''' }}} || Helena Medková: Zeugma Detection using Word Sketch || || Vítek Novotný: [htdocs:seminar2020/VNovotny-EDS_EMBED.pdf EDS-MEMBED: Multi-Sense Embeddings Based on Enhanced Distributional Semantic Structures via a Graph Walk over Word Senses] || {{{#!th rowspan=2 '''23.3.''' }}} || Michal Štefánik: Unsupervised Estimation of Out-of-Domain Performance of Language Models || || Marek Medveď: SQAD database update || {{{#!th rowspan=2 '''30.3.''' }}} || Hien Thi Ha: Block type classification from scanned invoices || || Vítek Novotný: Combining log-bilinear language models with Transformers || {{{#!th rowspan=1 '''6.4.''' }}} || Tomáš Houfek: Vytěžování dat z lékařských zpráv || {{{#!th rowspan=2 '''13.4.''' }}} || Mikuláš Bankovič: Application of super-resolution on OCR of historical documents || || Adam Hájek: výpočet GTP-2 na Metacentru || {{{#!th rowspan=2 '''20.4.''' }}} || Tereza Vrabcová: Parallel corpus from web pages || || Vítek Novotný: [htdocs:seminar2020/VNovotny-FastText_Attention_slides.pdf When FastText Pays Attention] ([https://arxiv.org/abs/2104.09691 preprint]) || {{{#!th rowspan=2 '''27.4.''' }}} || Tereza Kinská: Creation of Judikatura corpora of court decisions || || Pavel Rychlý: [htdocs:seminar2020/PRychly-Using_Makefiles.pdf Using Makefiles for NLP projects] || {{{#!th rowspan=1 '''4.5.''' }}} || Petr Zelina: [htdocs:seminar2020/PZelina-ALBERT_training.pdf ALBERT Training with TensorFlow and PyTorch] || {{{#!th rowspan=1 '''11.5.''' }}} || Krištof Anetta: Electronic Health Records processing, Apache cTakes || {{{#!th rowspan=1 '''18.5.''' }}} || Ondřej Sotolář: [htdocs:seminar2021/OSotolar-Personal_Data_Detection.pdf Building a Corpus for Personal Data Detection] || {{{#!th rowspan=1 '''25.5.''' }}} || Michal Starý: [htdocs:seminar2021/MStary-EventDetection.pdf Event Detection] || [[BR]]Je možné si prohlédnout i [[cs/LaboratorniSeminarHistorie | program semináře v dřívějších semestrech]].