{{{#!html
}}}
= Laboratorní seminář =
Laboratorní seminář slouží primárně k prezentaci činnosti aktivních spolupracovníků laboratoře: čím se zabývají, jaké mají výsledky, jaké případné problémy, které dílčí úkoly nestíhají řešit a uvítali by spolupráci někoho dalšího atd. Nepravidelně a spíše výjimečně lze očekávat i prezentace spřízněných pracovišť.
Seminář se koná ve '''čtvrtek ve 14:00 hodin v B203''' (podzim 2021) a je otevřen všem zájemcům o danou problematiku (nemusí být aktivní v laboratoři). Lze si jej také zapsat jako předmět [https://is.muni.cz/predmet/fi/pv173 PV173 Seminář Laboratoře zpracování přirozeného jazyka] a za aktivní účast včetně prezentace svých výsledků (dosažených při řešení projektů NLP Centra, nebo o relevantní problematice) získat tři kredity.
Vybrané prezentace jsou vysílány i on-line na [https://cesnet.zoom.us/j/92417314815 autentizovaném ZOOM].
Případné přílohy k on-line prezentaci nahrejte podle [wiki:/cs/LaboratorniSeminar/PresentationInstructions instrukcí]. Nahraná videa (i dřívější) jsou dostupná na [wiki:/cs/LaboratorniSeminar/Videos video stránce].
=== Žádané příspěvky: ===
*
=== Nabídka příspěvku: ===
* [https://www.leeds.ac.uk/arts/profile/125106/1011/serge_sharoff Serge Sharoff]: Reliable classification of web genres
=== Program semináře v podzimním semestru 2021 === #seminar_podzim
|| '''datum''' || '''program''' ||
{{{#!th rowspan=2
'''16.9.'''
}}}
|| program semináře na tento semestr ||
|| Aleš Horák: [http://raslan2021.nlp-consulting.net RASLAN 2021] Call for Papers ||
{{{#!th rowspan=2
'''23.9.'''
}}}
|| Vít Novotný: [htdocs:seminar2021/VNovotny-Summer_NLP_Conferences.pdf SIGIR 2021 and RANLP 2021] ||
|| Adam Rambousek: [http://nlp.fi.muni.cz/projects/ahisto AHISTO project] ||
{{{#!th rowspan=1
'''30.9.'''
}}}
|| Michaela Denisová: Crosslingual embedding models ||
{{{#!th rowspan=1
'''7.10.'''
}}}
|| Mikuláš Bankovič: Superresolution techniques for OCR ||
{{{#!th rowspan=2
'''14.10.'''
}}}
|| Rastislav Papčo: Topic classificaton in web corpora ||
|| Edoardo Signoroni: Corpus alignment by machine translation techniques ||
{{{#!th rowspan=1
'''21.10.'''
}}}
|| Dalibor Bačovský: Improving the Subword Model of fastText ||
{{{#!th rowspan=2
'''4.11.'''
}}}
|| Ondřej Sotolář: Facebook conversations classification ||
|| Radoslav Sabol: TBA ||
{{{#!th rowspan=2
'''11.11.'''
}}}
|| Tereza Vrabcová: TBA ||
|| Adam Hájek: TBA ||
{{{#!th rowspan=2
'''18.11.'''
}}}
|| Petr Zelina: TBA ||
|| Samuel Špalek: TBA ||
{{{#!th rowspan=2
'''25.11.'''
}}}
|| Marek Medveď: QA ||
|| Kristína Němcová: TBA ||
{{{#!th rowspan=2
'''2.12.'''
}}}
|| Tomáš Houfek: Information extraction from medical records ||
|| Daniel Krátký: TBA ||
{{{#!th rowspan=2
'''9.12.'''
}}}
|| Krištof Anetta, Mahmut Arslan: Electronic health records processing ||
|| Ondřej Herman: TBA ||
=== Program semináře v jarním semestru 2021 === #seminar_jaro
|| '''datum''' || '''program''' ||
{{{#!th rowspan=1
'''2.3.'''
}}}
|| program semináře na tento semestr ||
{{{#!th rowspan=3
'''9.3.'''
}}}
|| Pavel Rychlý: projekt LINDAT/CLARIAH-CZ ||
|| Pavel Rychlý: projekt strojového překladu ||
|| Pavel Rychlý: projekt generování slovníku ||
{{{#!th rowspan=2
'''16.3.'''
}}}
|| Helena Medková: Zeugma Detection using Word Sketch ||
|| Vítek Novotný: [htdocs:seminar2020/VNovotny-EDS_EMBED.pdf EDS-MEMBED: Multi-Sense Embeddings Based on Enhanced Distributional Semantic Structures via a Graph Walk over Word Senses] ||
{{{#!th rowspan=2
'''23.3.'''
}}}
|| Michal Štefánik: Unsupervised Estimation of Out-of-Domain Performance of Language Models ||
|| Marek Medveď: SQAD database update ||
{{{#!th rowspan=2
'''30.3.'''
}}}
|| Hien Thi Ha: Block type classification from scanned invoices ||
|| Vítek Novotný: Combining log-bilinear language models with Transformers ||
{{{#!th rowspan=1
'''6.4.'''
}}}
|| Tomáš Houfek: Vytěžování dat z lékařských zpráv ||
{{{#!th rowspan=2
'''13.4.'''
}}}
|| Mikuláš Bankovič: Application of super-resolution on OCR of historical documents ||
|| Adam Hájek: výpočet GTP-2 na Metacentru ||
{{{#!th rowspan=2
'''20.4.'''
}}}
|| Tereza Vrabcová: Parallel corpus from web pages ||
|| Vítek Novotný: [htdocs:seminar2020/VNovotny-FastText_Attention_slides.pdf When FastText Pays Attention] ([https://arxiv.org/abs/2104.09691 preprint]) ||
{{{#!th rowspan=2
'''27.4.'''
}}}
|| Tereza Kinská: Creation of Judikatura corpora of court decisions ||
|| Pavel Rychlý: [htdocs:seminar2020/PRychly-Using_Makefiles.pdf Using Makefiles for NLP projects] ||
{{{#!th rowspan=1
'''4.5.'''
}}}
|| Petr Zelina: [htdocs:seminar2020/PZelina-ALBERT_training.pdf ALBERT Training with TensorFlow and PyTorch] ||
{{{#!th rowspan=1
'''11.5.'''
}}}
|| Krištof Anetta: Electronic Health Records processing, Apache cTakes ||
{{{#!th rowspan=1
'''18.5.'''
}}}
|| Ondřej Sotolář: [htdocs:seminar2021/OSotolar-Personal_Data_Detection.pdf Building a Corpus for Personal Data Detection] ||
{{{#!th rowspan=1
'''25.5.'''
}}}
|| Michal Starý: [htdocs:seminar2021/MStary-EventDetection.pdf Event Detection] ||
[[BR]]Je možné si prohlédnout i [[cs/LaboratorniSeminarHistorie | program semináře v dřívějších semestrech]].