= Laboratorní seminář = Laboratorní seminář slouží primárně k prezentaci činnosti aktivních spolupracovníků laboratoře: čím se zabývají, jaké mají výsledky, jaké případné problémy, které dílčí úkoly nestíhají řešit a uvítali by spolupráci někoho dalšího atd. Nepravidelně a spíše výjimečně lze očekávat i prezentace spřízněných pracovišť. Seminář se koná ve '''čtvrtek ve 14:00 hodin v B203''' (podzim 2021) a je otevřen všem zájemcům o danou problematiku (nemusí být aktivní v laboratoři). Lze si jej také zapsat jako předmět [https://is.muni.cz/predmet/fi/pv173 PV173 Seminář Laboratoře zpracování přirozeného jazyka] a za aktivní účast včetně prezentace svých výsledků (dosažených při řešení projektů NLP Centra, nebo o relevantní problematice) získat tři kredity. Případné přílohy k on-line prezentaci nahrejte podle [wiki:/cs/LaboratorniSeminar/PresentationInstructions instrukcí]. Nahraná videa (i dřívější) jsou dostupná na [wiki:/cs/LaboratorniSeminar/Videos video stránce]. === Žádané příspěvky: === === Nabídka příspěvku: === * [https://www.leeds.ac.uk/arts/profile/125106/1011/serge_sharoff Serge Sharoff]: Reliable classification of web genres === Zajistí občerstvení (nepřišli nebo přesunuli svůj příspěvek méně než 24 h před termínem): === * X === Program semináře v jarním semestru 2021 === #seminar_jaro || '''datum''' || '''program''' || {{{#!th rowspan=1 '''2.3.''' }}} || program semináře na tento semestr || {{{#!th rowspan=3 '''9.3.''' }}} || Pavel Rychlý: projekt LINDAT/CLARIAH-CZ || || Pavel Rychlý: projekt strojového překladu || || Pavel Rychlý: projekt generování slovníku || {{{#!th rowspan=2 '''16.3.''' }}} || Helena Medková: Zeugma Detection using Word Sketch || || Vítek Novotný: [htdocs:seminar2020/VNovotny-EDS_EMBED.pdf EDS-MEMBED: Multi-Sense Embeddings Based on Enhanced Distributional Semantic Structures via a Graph Walk over Word Senses] || {{{#!th rowspan=2 '''23.3.''' }}} || Michal Štefánik: Unsupervised Estimation of Out-of-Domain Performance of Language Models || || Marek Medveď: SQAD database update || {{{#!th rowspan=2 '''30.3.''' }}} || Hien Thi Ha: Block type classification from scanned invoices || || Vítek Novotný: Combining log-bilinear language models with Transformers || {{{#!th rowspan=1 '''6.4.''' }}} || Tomáš Houfek: Vytěžování dat z lékařských zpráv || {{{#!th rowspan=2 '''13.4.''' }}} || Mikuláš Bankovič: Application of super-resolution on OCR of historical documents || || Adam Hájek: výpočet GTP-2 na Metacentru || {{{#!th rowspan=2 '''20.4.''' }}} || Tereza Vrabcová: Parallel corpus from web pages || || Vítek Novotný: [htdocs:seminar2020/VNovotny-FastText_Attention_slides.pdf When FastText Pays Attention] ([https://arxiv.org/abs/2104.09691 preprint]) || {{{#!th rowspan=2 '''27.4.''' }}} || Tereza Kinská: Creation of Judikatura corpora of court decisions || || Pavel Rychlý: [htdocs:seminar2020/PRychly-Using_Makefiles.pdf Using Makefiles for NLP projects] || {{{#!th rowspan=1 '''4.5.''' }}} || Petr Zelina: [htdocs:seminar2020/PZelina-ALBERT_training.pdf ALBERT Training with TensorFlow and PyTorch] || {{{#!th rowspan=1 '''11.5.''' }}} || Krištof Anetta: Electronic Health Records processing, Apache cTakes || {{{#!th rowspan=1 '''18.5.''' }}} || Ondřej Sotolář: [htdocs:seminar2021/OSotolar-Personal_Data_Detection.pdf Building a Corpus for Personal Data Detection] || {{{#!th rowspan=1 '''25.5.''' }}} || Michal Starý: [htdocs:seminar2021/MStary-EventDetection.pdf Event Detection] || === Program semináře v podzimním semestru 2020 === #seminar_podzim || '''datum''' || '''program''' || {{{#!th rowspan=4 '''6.10.''' }}} || program semináře na tento semestr || || Aleš Horák: [http://raslan2020.nlp-consulting.net RASLAN 2020] Call for Papers || || Aleš Horák: [http://www.tsdconference.org/tsd2020 TSD 2020] || || Zuzana Nevěřilová: [https://www.clarin.eu/content/programme-clarin-annual-conference-2020 Clarin conference 2020] || {{{#!th rowspan=2 '''13.10.''' }}} || Vítek Novotný: [htdocs:seminar2020/three-is-better-than-one.pdf MIR@MU at ARQMath 2020] || || Vítek Novotný: [htdocs:seminar2020/enhancing-word-embeddings.pdf Enhancing word embeddings: Positionality, subword sizes, and hyphenation] || {{{#!th rowspan=1 '''20.10.''' }}} || Zuzana Nevěřilová: [htdocs:seminar2020/Text_Extraction_from_Medical_Forms.pptx Information Extraction from Medical Forms] || {{{#!th rowspan=2 '''27.10.''' }}} || Hien Thi Ha: Contract information extraction || || Vítek Novotný: [htdocs:seminar2020/when-tesseract-does-it-alone.pdf When Tesseract does it alone: OCR of medieval texts] || {{{#!th rowspan=1 '''3.11.''' }}} || Helena Medková: Zeugma detection || {{{#!th rowspan=1 '''10.11.''' }}} || Veronika Burgerová: Time and date extraction and normalization || {{{#!th rowspan=1 '''24.11.''' }}} || Alexander Macinský: NL processing of Japanese for Dictionary Systems || {{{#!th rowspan=2 '''1.12.''' }}} || Krištof Anetta: [htdocs:seminar2020/Anetta_PV173_2020.pdf Electronic Health Records processing] || || Adam Hájek: Automatic Text Summarization || {{{#!th rowspan=1 '''8.12.''' }}} || Radoslav Sabol: Officebot || {{{#!th rowspan=1 '''15.12.''' }}} || Marek Medveď: Question Answering dataset SQAD || {{{#!th rowspan=2 '''5.1.''' }}} || Marie Stará: Towards the evaluation of automatic explanations || || Petr Zelina: Transferring ALBERT from en to cs || {{{#!th rowspan=1 '''12.1.''' }}} || Ondřej Sotolář: [https://docs.google.com/presentation/d/1vWeXKsBAtowg3vatFZxeIl9UYu1uxef_1DqYsHYqLXA/edit?usp=sharing Personal Data Anonymization] || [[BR]]Je možné si prohlédnout i [[cs/LaboratorniSeminarHistorie | program semináře v dřívějších semestrech]].