= Zpracování přirozeného jazyka (nejen) na FI = Stránka je určena studentům FI se zájmem o oblast zpracování přirozeného jazyka (natural language processing). Poskytuje náměty ke studiu, a to jak přímo na FI, tak prostřednictvím MOOC (massive open online courses). Zpracování přirozeného jazyka se typicky realizuje v několik rovinách: od signálu (text, řeč), přes zpracování na úrovni slov (morfologická rovina), vět (synktaktická rovina) až po reprezentaci významu (sémantická rovina) a rovinu užití v kontextu reálného světa (pragmatická rovina). Některé z uvedených kurzů jsou v tomto směru přehledové, jiné se týkají jen určité roviny zpracování. == Přednášky na MU == * [https://is.muni.cz/predmet/fi/IB030 IB030 Úvod do počítačové lingvistiky] (Aleš Horák) - Základní kurz nabízející přehled jednotlivých aspektů počítačové lingvistiky (roviny zpracování přirozeného jazyka, automatická analýza a syntéza na těchto rovinách) se vztahem k umělé inteligenci (reprezentace významu). * [https://is.muni.cz/predmet/fi/IB047 IB047 Úvod do korpusové lingvistiky a počítačové lexikografie] (Pavel Rychlý) - Základní kurz práce s textovými korpusy z pohledu uživatele (lingvisty či lexikografa) i informatika. Studenti se seznámí s metodami a algoritmy značkování, ukládání a prohledávání textových korpusů, se statistickými metodami zpracování přirozeného jazyka a s konkrétními korpusy a dalšími jazykovými zdroji. * [https://is.muni.cz/predmet/fi/PB095 PB095 Úvod do počítačového zpracování řeči] (Luděk Bártek) - Základní kurz počítačového zpracování řeči, s důrazem na techniky rozpoznávání řeči, automatické syntézy řeči a dialogové systémy. * [https://is.muni.cz/predmet/fi/PA153 PA153 Počítačové zpracování přirozeného jazyka] (Karel Pala) - Pokročilý kurz se věnuje podrobněji všem rovinám zpracování přirozeného jazyka. Na jednotlivých přednáškách prezentují členové Centra zpracování přirozeného jazyka současné přístupy k morfologické analýze a desambiguaci, syntaktické analýze, reprezentaci významu. * [https://is.muni.cz/predmet/fi/IV029 IV029 Logická analýza přirozeného jazyka I] a [https://is.muni.cz/predmet/fi/IA157 IA157 Logická analýza přirozeného jazyka II] (Pavel Materna) - Kurzy se zaměřují na reprezentaci významu pomocí konstrukcí transparentní intezionální logiky. Studenti se seznámí s teorií možných světů, vztahy mezi pojmy a výrazy a metodami analýzy různých typů vět v přirozeném jazyce. * [https://is.muni.cz/predmet/fi/PA154 PA154 Jazykové modelování] (Pavel Rychlý) - Kurz se zaměřuje na využití statistických metod v různých oblastech zpracování přirozeného jazyka: značkování textových korpusů, syntaktická analýza, strojový překlad, shlukování a kategorizace textů. * [https://is.muni.cz/predmet/fi/PA156 PA156 Dialogové systémy] (Luděk Bártek) - Pokročilý kurz nabízející přehled problematiky dialogových systémů: od historie přes typy dialogů po dialogové strategie. * [https://is.muni.cz/predmet/fi/IA161 IA161 Syntaktické formalismy a jejich aplikace na analýzu přirozeného jazyka] (Aleš Horák) - Pokročilý kurz zaměřený na algoritmy syntaktické analýzy přirozeného jazyka. * [https://is.muni.cz/predmet/phil/CJBB105 CJBB105 Korpusová lingvistika - přednáška] (Klára Osolsobě) - Kurz poskytuje základní orientaci v korpusové lingvistice: textové korpusy v ČR, značkování korpusů, mluvené korpusy, korpusové manažery. * [https://is.muni.cz/predmet/phil/PLIN019 PLIN019 Machine Translation] (Vít Baisa) - Přehledový kurz poskytuje informace o pravidlových, statistických a hybridních metodách strojového překladu. * [https://is.muni.cz/predmet/phil/PLIN021 PLIN021 Sémantická analýza v praxi] (Zuzana Nevěřilová) - Přehledový kurz se zaměřuje na problematiku reprezentace významu, od čistě statistických metod po metody založené na znalostech. * [https://is.muni.cz/predmet/phil/PLIN037 PLIN037 Sémantika a počítače] (Zuzana Nevěřilová) - Navazující kurz, který se zabývá minulými i současnými metodami zpracování textů s důrazem na uchopení jejich významu. Důležitou součastí předmětu jsou prezentace současného výzkumu, jejich přehled najdete na stránce OCemSeMluvi. * [https://is.muni.cz/predmet/phil/PLIN041 PLIN041 Vývoj počítačové lingvistiky] (Karel Pala) - Kurz poskytuje přehled vývoje počítačové lingvistiky od 50. let do součanosti. * [https://is.muni.cz/predmet/phil/PLIN064 PLIN064 Úvod do Digital Humanities] (Zuzana Nevěřilová) - kurz zabývající se zpracováním digitálních artefaktů z pohledu humanitního vědce. Náplní kurzu je problematika sběru dat, formátu dat, digitalizace, textové zpracování pomocí nástrojů NLP, práce se vzdálenými službami. Praktická část zahrnuje práci s připravenými Jupyter notebooky. Důležitou součastí předmětu jsou inspirativní projekty, jejichž přehled najdete na stránce DigitalHumanities. * Další relevantní kurzy: [https://is.muni.cz/predmet/fi/PB016 IV028 Základní pojmy obecné logiky], [https://is.muni.cz/predmet/fi/MV011 MV011] Statistika I a [https://is.muni.cz/predmet/fi/MA012 MA012 Statistika II], [https://is.muni.cz/predmet/fi/PB016 PB016 Umělá inteligence I] a [https://is.muni.cz/predmet/fi/IV126 IV126 Umělá inteligence II], [https://is.muni.cz/predmet/fi/PV248 PV248 Kurz jazyka Python], [https://is.muni.cz/predmet/fi/PV004 PV004 Unix], kurzy z rozcestníku [https://www.fi.muni.cz/studies/rozcestniky/strojove-uceni.xhtml.cs Strojové učení]. == Online kurzy a přednášky == * [https://www.coursera.org/course/ml Machine Learning] (Andrew Ng, Coursera) - základní kurz strojového učení. * [https://www.coursera.org/course/nlp Natural Language Processing] (Coursera) - základní, výživný, a poměrně časově náročný kurz od předních odborníků na statistické zpracování přirozeného jazyka. * [https://www.futurelearn.com/courses/corpus-linguistics-2014-q3 Corpus Linguistics: Method, Analysis, Interpretation] == Praktické zkušenosti == === Na FI === Možnosti zapojení do projektů, seminářů, tvorby tématických závěrečných prací v Centru zpracování přirozeného jazyka (CZPJ): * [https://is.muni.cz/predmet/fi/PB106 PB106 Projekt z korpusové lingvistiky] určeno i pro začátečníky * [https://is.muni.cz/predmet/fi/IA080 PA107 Projekt z korpusových nástrojů] studium pokročilých partií * [https://is.muni.cz/predmet/fi/PV173 PV173 Seminář zpracování přirozeného jazyka] méně formální seminář, kde členové CZPJ a hosté prezentují své současné projekty a myšlenky === Jinde === * [http://aclweb.org/aclwiki/index.php?title=SemEval_Portal SENSEVAL, SemEval] - soutěže v různých disciplínách zabývajících se významovou rovinou jazyka (původní soutěže SENSEVAL se zabývaly lexikální desambiguací) * [http://aclweb.org/aclwiki/index.php?title=Recognizing_Textual_Entailment PASCAL] - soutěže v rozpoznání textového vyplývání (recognizing textual entailment)