Čeština
English
  • Vítejte na stránkách NLP Centra!
  • Zapojte se do vývoje softwarových nástrojů!
  • Analýza přirozeného jazyka
  • Vyzkoušejte si korpusy o velikosti knihoven online!
  • Studujte jednu ze specializací!
  • Členové laboratoře

Grantové projekty

Členové Centra zpracování přirozeného jazyka jsou spoluřešiteli následujících grantových projektů:

  • Na všechno sami: příležitosti a rizika individualizace společnosti (PRINS) (CZ.02.01.01/00/23_025/0008710) MUNI
    • Ministerstvo školství, mládeže a tělovýchovy ČR / OP JAK
    • 5/2025 — 12/2028
    • Předmětem projektu „Na všechno sami: příležitosti a rizika individualizace společnosti“ je realizovat excelentní výzkum s interdisciplinárním přístupem, který umožní porozumět příležitostem a rizikům spojeným s individualizací, která akcentuje individuální hodnoty, potřeby a preference. Projekt si klade za cíl nejen identifikovat a analyzovat tato rizika, ale také navrhnout strategie pro minimalizaci jejich dopadu a využití příležitostí ke zvýšení individuální i společenské odolnosti.
  • LINDAT/CLARIAH-CZ - Digitální výzkumná infrastruktura pro jazykové technologie, umění a humanitní vědy (LM2023062) MUNI
    • Ministerstvo školství, mládeže a tělovýchovy ČR / Velké infrastruktury pro výzkum, vývoj a inovace
    • 1/2023 — 12/2026
    • LINDAT/CLARIAH-CZ je Digitální výzkumná infrastruktura pro jazykové technologie, umění a humanitní vědy. Umožňuje archivaci, zpracování, správu a zpřístupnění dat, zdrojů a nástrojů z oblasti umění, humanitních a společenských věd. Cílem projektu je posílit a rozšířit výzkum obohacený o digitální zdroje a nástroje a podpořit výuku digitálních humanitních věd napříč tradičními humanitními obory filozofické fakulty.
  • Komplexní data a systémy s využitím umělé inteligence (MUNI/A/1873/2025) MUNI
    • Masarykova univerzita / Specifický výzkum - podpora studentských projektů
    • 1/2026 — 12/2026
    • Navrhovaný projekt se zaměřuje na výzkum a rozvoj metod umělé inteligence pro práci s komplexními daty v oblastech vyhledávacích systémů, biomedicínské informatiky, vizualizace a zpracování přirozeného jazyka. Projekt navazuje na dlouhodobé výsledky jednotlivých výzkumných skupin a propojuje teoretický výzkum s praktickými aplikacemi napříč různými datovými doménami.
  • Oscars - Opravidlo 2.0 – Public Online Proofreading Service (OSCARS-01-247) MUNI
    • Evropská unie / Horizont Evropa
    • 10/2024 — 9/2026
    • The proposed project aims to bring a beta-version online proofreading service, Opravidlo, into its operational phase. Currently, Opravidlo works with reasonably high precision but low recall. The proofreader detects errors in spelling (capitalization, diacritics, word spelling), grammar (punctuation, grammatical agreement, sentence constructions), and typesetting (e.g., quotes or spaces). Opravidlo is based on a set of rules designed by linguistic experts to achieve high precision. It suggests corrections, provides explanations of various language phenomena, and links to further explanations if available. The project's contribution will be public and scientific: A hybrid approach to Opravidlo that will increase recall, precision, and more adequate explanations will lead to a higher quality of public service, both for native speakers and language learners. A high-precision proofreader will serve the public good for all age groups of native Czechs and accelerate the integration of immigrants to Czechia.
  • Webová aplikace na prokazování autorství (TQ01000110) MUNI
    • Technologická agentura ČR / SIGMA
    • 9/2023 — 8/2026
    • Tzv. contract cheating, kdy si student nechá vypracovat seminární či závěrečnou práci na zakázku, patří k nejpalčivějším etickým problémům současného vysokého školství. Contract cheating je těžké odhalit, a ještě těžší je jej prokázat. Cílem projektu je vyvinout webovou aplikaci použitelnou v rámci disciplinárního řízení pro prokázání autorství předloženého dokumentu.
  • BioMedAI TWINNING (101079183) MUNI
    • Evropská unie / Horizont Evropa
    • 11/2022 — 10/2025
    • Increasing demand for sophisticated clinical diagnostics makes current diagnostic capacities insufficient. A potential solution lies in semi-automatic systems speeding up the diagnosis process. Artificial intelligence (AI) and machine learning seem to be very promising approaches to the automation of diagnostic systems. However, most academic AI systems are opaque black boxes that cannot be easily tested and certified. Also, academic AI solutions are often hard to reproduce, and their evaluation is insufficiently connected with clinical practice. This motivates MU and MMCI to team with two advanced partners (AP), MUG and TUB, and establish a BioMedAI infrastructure allowing close cooperation of computer science and clinical experts to develop explainable trustworthy AI solutions. Both AP possess rich experience with AI solutions for healthcare. Namely, processing large amounts of sensitive image and clinical data, interactive machine learning methods with a human-in-the-loop, and validating AI methods for healthcare. The main body of the BioMedAI project concentrates on training computer science researchers at MU and clinical experts at MMCI in the development of explainable AI methods based on high-quality medical data and validated in a clinical setting. Concretely, we propose organizing thematic workshops, virtual training with hands-on experience in developing explainable AI tools, and two summer schools. One will be oriented towards basic research in explainable AI methods for image and clinical data processing, and the other one towards the management of sensitive medical data. Furthermore, the BioMedAI project will also increase the visibility and presence of the explainable AI research in healthcare at MU and MMCI by training a PR manager responsible for presenting the research to various stakeholders, and by training the existing project management staff at MU and MMCI in writing grant applications for projects in EU and elsewhere.
  • AIcope - AI support for Clinical Oncology and Patient Empowerment (MUNI/G/1763/2020) MUNI
    • Masarykova univerzita / Grantová agentura MU
    • 4/2021 — 12/2023
    • In 2016, over half a million people were registered as oncological patients in the Czech Republic, of which 96,500 were newly diagnosed. 27,261 people died that year (based on data from the Institute of Health Information and Statistics). This clearly shows the substantial impact cancer has not only on the healthcare system, but also on the whole society and economy. The additional problem is that while there are various efficacious treatments available for most cancers, many of them may drastically impact the entire patients’ life, each in their own way. To further reduce the societal burden of cancer, it is therefore crucial to pick the right type of treatment, not only based on the patient's biological profile but also on their preferences and general lifestyle.
  • Modelling the future: Understanding the impact of technology on adolescent’s well-being (GX19-27828X) MUNI
    • Grantová agentura ČR / EXPRO
    • 1/2019 — 12/2023
    • Cílem projektu je vyvinout komplexní teorii založenou na empirických datech postihujících dopady používání technologií na fyzický, psychologický a sociální well-being adolescentů ve věku 11-18 let. Projekt rozvine inovativní výzkumné metody založené na softwaru používajícím umělou inteligenci.
  • Historické prameny na dosah. Zpřístupnění středověkých písemných dokumentů formou kontextuální databáze. (TL03000365) MUNI
    • Technologická agentura ČR / ÉTA
    • 5/2020 — 4/2023
    • Základním cílem projektu je zpřístupnit písemné prameny k českým středověkým dějinám širokému okruhu uživatelů internetu: vědcům, pracovníkům paměťových institucí, učitelům, studentům i nejširší veřejnosti. Projekt využije digitalizovaných dat portálu Czech medieval sources online, která budou převedena do nově implementovaného systému AHISTO. Ten propojí dosavadní obrazová data se semiautomaticky vytvářenou textovou databází a umožní plnotextové sémantické prohledávání textů i metadat, tvorbu pokročilých anotací a extrakci strukturních dat. Vzhledem k rozsahu textového korpusu byl pro zpracování metadat zvolen testovací vzorek v podobě úředních písemností z husitské epochy (1419–1436).
  • LINDAT/CLARIAH-CZ - Digitální výzkumná infrastruktura pro jazykové technologie, umění a humanitní vědy (LM2018101) MUNI
    • Ministerstvo školství, mládeže a tělovýchovy ČR / Velké infrastruktury pro výzkum, vývoj a inovace
    • 1/2019 — 12/2022
  • Moduly pro strojový překlad (Modules for Machine Translation) (MUNI/33/06202107/2021) MUNI
    • Masarykova univerzita / Interní projekty CTT
    • 1/2022 — 11/2022
    • Centrum zpracování přirozeného jazyka na FI MU (NLP Centrum) má technologie ve formě programů či databází, které mohou být využity v externích aplikacích. Cílem projektu je ověření použitelnosti modulů těchto technologií ve formě webových aplikačních rozhraní na příkladu externí aplikace strojového překladu.
  • Využití strojového učení při detekci společného argumentu v koordinovaných strukturách (MUNI/A/1184/2020) MUNI
    • Masarykova univerzita / Specifický výzkum - podpora studentských projektů
    • 1/2021 — 12/2021
    • Cílem navrhovaného projektu je vytvoření nástroje pro češtinu k automatickému předzpracování textu, který umožní ve větě rozpoznávat argument vážící se ke dvěma souřadně spojeným výrazům. Při řešení nastíněného problému bude využita metoda řízeného strojového učení (s učitelem). Konkrétně půjde o úlohu klasifikace vstupu do tříd, kdy klasifikátor dostane anotovaná vstupní data, ze kterých se naučí rozpoznávat dané struktury i na neoznačených datech.
  • Hyperintensionální usuzování nad texty přirozeného jazyka (GA18-23891S) MUNI
    • Grantová agentura ČR / Standardní projekty
    • 1/2018 — 12/2020
    • Tento projekt je interdisciplinárně zaměřen, neboť zasahuje do tří příbuzných oborů, a to komputační lingvistiky, logiky a umělé inteligence. Soustředíme se na dva hlavní problémy, které dosud nejsou uspokojivě řešeny v současných systémech určených pro získávání znalostí z textů. Za prvé, dostatečně přesná lingvistická a logická analýza otázek a příslušných textů je nutnou podmínkou pro získávání adekvátních odpovědí. Za tím účelem aplikujeme procedurální sémantiku Transparentní intenisonální logiky (TIL), která umožňuje rozlišovat tři druhy kontextu, ve kterém se může daný výraz vyskytovat, a to extensionální, intensionální a hyperintensionální. Definice tří druhů kontextu nám umožnila navrhnout extensionální logiku hyperintensí, ve které jsou všechna extensionální pravidla usuzování platná ve všech kontextech. Za druhé, tuto teorii využijeme k získávání inferenčních znalostí z explicitních znalostí zakódovaných v rozsáhlých bázích textů v přirozeném jazyce tak, aby systém poskytoval inteligentní odpovědi na otázky.
  • LINDAT/CLARIN - Výzkumná infrastruktura pro jazykové technologie (CZ.02.1.01/0.0/0.0/16_013/0001781) MUNI
    • Ministerstvo školství, mládeže a tělovýchovy ČR / OP Výzkum, vývoj a vzdělávání (OP VVV)
    • 1/2017 — 12/2020
    • Projekt navazuje na běžící projekt LINDAT-Clarin, který koncipován jako český „uzel“ mezinárodní sítě Clarin (Common Language Resources and Technology Infrastructure). Centrum LINDAT-Clarin bude tedy v českém jazykovém prostředí zaměřeno na sběr jazykových dat a především jejich anotaci (tj. formální manuální, poloautomatickou a automatickou jazykovou analýzu). Sběr a anotace budou probíhat v takovém rozsahu, kvalitě a technologické přípravě (specifikace, schémata, formáty), která bude přímo využitelná jak v humanitní oblasti (jazykovědný a mezioborový výzkum, kde přirozený jazyk hraje podstatnou roli), tak i pro výzkum a vývoj v oblasti jazykových technologií za použití moderních statistických a hybridních metod. Náplň práce centra a jeho výsledky se dotýkají žady oborů – v humanitních vědách to jsou jazykověda obecná a jazykověda zabývající se konkrétními jazyky, zejména češtinou, dále překladatelství, lexikografie, sociolingvistika, částečně i obory příbuzné (psychologie, sociologie, knihovnictví, neurovědy, cognitive science) s významným přechodem do informatiky (computer science, computational linguistics), matematiky (statistika a pravděpodobnost) a elektrotechniky (zpracování akustického signálu).
  • Metodika a technologie pro tvorbu odborných tezaurů a slovníků pro potřeby rozvoje národní infrastruktury pro prostorové informace (TITIMV702) MUNI
    • Technologická agentura ČR / BETA2
    • 5/2018 — 4/2020
    • Vytvořit obecnou metodiku a podpůrné technologie pro tvorbu, správu a využívání propojitelných odborných tezaurů a slovníků z oblasti rozvoje národní infrastruktury pro prostorové informace, s vazbou na existující nadnárodní tématické tezaury, s možností využití v dalších oblastech činnosti veřejné správy a to včetně revize a zdokonalení existujících národních slovníků a tezaurů s návrhem jejich společné koordinované správy. Výstupy tohoto projektu budou přímo navazovat na výsledky předcházejícího projektu "Terminologický tezaurus pro obor zeměměřictví a katastru nemovitostí".
  • Manipulativní techniky propagandy v době internetu (MUNI/G/0872/2016) MUNI
    • Masarykova univerzita / Grantová agentura MU
    • 3/2017 — 12/2019
    • Společný projekt výzkumníků z FSS MU, FI, MU a PrF MU „Manipulativní techniky propagandy v době internetu“ reaguje na aktuální problematiku šíření politické propagandy cizích aktérů skrze nová média a sociální sítě v České republice. Tento jev přináší výzvy pro metodologický, bezpečnostní a právní výzkum a skýtá tak příležitost vytvořit unikátní výzkumný tým. Na případu pro-ruské informační války projekt rozvíjí metody rozpoznávání, detekce a analýzy manipulativních technik propagandy, analyzuje uživatele sdílející manipulativní obsahy z hlediska jejich motivace a zhodnocuje bezpečnostní rizika pro ČR vyplývající ze šíření obsahů s manipulativním obsahem, včetně zhodnocení možných legislativních důsledků protagonistů manipulativních technik propagandy. Projekt je rozdělen do dvou oblastí výzkumu podle typu médií. První oblast se věnuje kvantitativní analýze sentimentu a manipulativním technikám pro-ruských zpravodajských serverů. Druhou oblast představuje analýza aktivit a motivací uživatelů sociální sítě Facebook, kteří se podílejí na šíření manipulativního obsahu. Výstupem projektu bude analytický software pro detekci manipulativních technik v textu a minimálně šest odborných publikací věnujících se metodologickému uchopení analýzy manipulativních technik propagandy, analýze manipulativních technik na pro-ruských zpravodajských serverech, analýze uživatelů a šiřitelů manipulativních obsahů na sociálních sítích, právním analýzám důsledků šíření manipulativních obsahů a bezpečnostním aspektům této problematiky pro ČR.
  • Projekt LINDAT-Clarin - Vybudování a provoz českého uzlu pan-evropské infrastruktury pro výzkum (LM2015071) MUNI
    • Ministerstvo školství, mládeže a tělovýchovy ČR / Velké infrastruktury pro výzkum, vývoj a inovace
    • 1/2016 — 12/2019
    • Projekt LINDAT-Clarin je koncipován jako český „uzel“ mezinárodní sítě Clarin (Common Language Resources and Technology Infrastructure. Centrum LINDAT-Clarin bude tedy v českém jazykovém prostředí zaměřeno na sběr jazykových dat a především jejich anotaci (tj. formální manuální, poloautomatickou a automatickou jazykovou analýzu). Sběr a anotace budou probíhat v takovém rozsahu, kvalitě a technologické přípravě (specifikace, schémata, formáty), která bude přímo využitelná jak v humanitní oblasti (jazykovědný a mezioborový výzkum, kde přirozený jazyk hraje podstatnou roli), tak i pro výzkum a vývoj v oblasti jazykových technologií za použití moderních statistických a hybridních metod. Náplň práce centra a jeho výsledky se dotýkají řady oborů – v humanitních vědách to jsou jazykověda obecná a pro jazykověda zabývající se konkrétními jazyky, zejména češtinou, dále překladatelství, lexikografie, sociolingvistika, částečně i obory příbuzné (psychologie, sociologie, knihovnictví, neurovědy, cognitive science) s významným přesahem do informatiky (computer science, computational linguistics), matematiky (statistika a pravděpodobnost), a elektrotechniky (zpracování akustického signálu).
  • Ověření úspěšnosti technik zpracování přirozeného jazyka pro extrakci informací ze skenovaných dokumentů (MUNI/33/55939/2017) MUNI
    • Masarykova univerzita / Interní projekty CTT
    • 4/2017 — 8/2018
    • Cílem projektu je ověřit možnost automatického vytěžování informací ze skenovaných textů - finančních dokumentů (faktur) a smluvních dokumentů. Ze vstupu v podobě sledu naskenovaných dokumentů ve formě částečně strukturované textu bude nejprve každý dokument automaticky klasifikován do určité kategorie. U finančních dokumentů budou extrahovány informace o dodavateli a odběrateli, datu splatnosti, jednotlivých položkách faktury (cena a popis), místu vydání faktury, číslu objednávky a faktury a také o čísle účtu a dalších platebních parametrech. U smluvních dokumentů se budou extrahovat informace o jednotlivých smluvních stranách (jména, adresy, ...), datu podpisu, typy smlouvy, závazcích smluvních stran a spisovém číslu dokumentu. Veškeré tyto informace je zatím možné efektivně získávat pouze ručně. Navrhovaný tým má v současnosti k dispozici vlastní podpůrné jazykové nástroje a v rámci projektu plánuje ověřit jejich efektivitu při zmíněných procesech automatické extrakce informací.
  • Hyperintensionální logika pro analýzu přirozeného jazyka (GA15-13277S) MUNI
    • Grantová agentura ČR / Standardní projekty
    • 3/2015 — 12/2017
    • Projekt má jako hlavní cíl stanovenu počítačově podporovanou lingvisticko-logickou analýzu přirozeného jazyka, a to především češtiny a angličtiny. Navrhovaný projekt bude rozvíjet logický rámec Transparentní intensionální logiky (TIL), což je jeden z hlavních představitelů systémů procedurální sémantiky, a to zejména jeho aplikací v oblasti zpracování přirozeného jazyka, komunikace a usuzování. Dokončíme úspěšně nastartovaný projekt návrhu a vývoje inferenčního stroje pro TIL s využitím jeho komputační varianty, tj. funkcionálního programovacího jazyka TIL-Script. Projekt je interdisciplinární, neboť jsme přesvědčeni, že logická analýza jazyka musí navazovat na výsledky analýzy lingvistické. Proto bude do výzkumu zahrnuto využití nástrojů komputační lingvistiky, logiky, filosofie a informatiky.
  • Rozhraní pro Linked Data v systému pro editaci slovníků DEB (LD15066) MUNI
    • Ministerstvo školství, mládeže a tělovýchovy ČR / COST CZ (od projektů s počátkem řešení v roce 2011)
    • 10/2015 — 10/2017
    • V projektu budou navrženy a ověřovány nové postupy pro tvorbu celoevropského slovníkového portálu v souladu s metodikou Linked Open Data (otevřená propojená data), které umožní sdílení lexikografických vědeckých zdrojů mezi zapojenými výzkumnými institucemi a také veřejné zpřístupnění zdrojů pro další využití a výzkum. Součástí projektu bude také analýza a návrh inovativních technologií pro tvorbu lexikografických zdrojů s využitím údajů z rozsáhlých jazykových databází (korpusů) a analýza možností rozšíření vlastností elektronických slovníků pro zlepšení přístupnosti pro uživatele.
  • Harvesting big text data for under-resourced languages (7F14047) MUNI
    • Ministerstvo školství, mládeže a tělovýchovy ČR / Česko-norský výzkumný program (CZ09)
    • 6/2014 — 4/2017
    • Cílem projektu je získat z webu velká textová data (korpusy) pro jazyky s nedostatečnými zdroji, mezi něž patří norština, zčásti čeština a také některé etiopské jazyky (amharština, afaan oromština, tigrinština, somálština). Data budou anotována, parsována tak, aby byla použitelná pro různé aplikace v oblasti počítačového zpracování přirozeného jazyka, např. extrakce informací, strojový překlad a další. Konsorcium bude tvořeno jedním norským týmem (NTNU Trondheim a přidruženou Universitou v Oslo), které se budou věnovat zpracování vzniklých korpusů, a jedním českým týmem (MU Brno), který využije iiž svých existujících nástrojů pro budování korpusů z webu. Projekt bude koordinován brněnským týmem. Jedním cílem projektu bude vytvoření velkého norského korpusu čítajícího miliardy slovních tvarů s použitím nástrojů vyvinutých v rámci spolupráce s NTNU v EU projektu PRESEMT ("PRESEMT: Pattern REcognition-based Statistically Enhanced MT", 2010-2012). Za druhé, NTNU spolupracuje s Universitou v Oslo a dvěma etiopskými universitami v projektu na podporujícím budování jazykových zdrojů a fundovaném organizací Norad ("Linguistic Capacity Building – tools for the inclusive development of Ethiopia", NORHED 2013-2018). Je tedy přirozené propojit tyto aktivity a zahrnout zpracování čtyř velkých etiopských jazyků do předkládaného projektu: projekt HaBiT tak může podpořit a posílit projekt NORHED důkladným testováním technologií a tím adresovat témata evaluace a verifikace a také splnit společenskou výzvu pro informační technologie (ICT). Takto získáme relevantní přidanou hodnotu rovněž po politické stránce díky kooperaci s méně rozvinutou zemí. Za třetí, budou vytvořeny aplikace pro povrchové zpracování češtiny a norštiny a aspoň jednoho etiopského jazyka, umožňující vyčlenění a zkoumání mnohoznačnosti slov v korpusech, tj. indukci slovních významů a také tvorbu vícevektorových prostorů a paralelních multilinguálních prostorů pro desambiguaci významů slov při překladu.
  • Vytvoření tezauru pro obor zeměměřictví a katastru nemovitostí (TB02CUZK004) MUNI
    • Technologická agentura ČR / BETA
    • 2/2014 — 12/2015
    • Vývoj systému pro správu vícejazyčného tezauru, který umožní editaci a prohlížení tezauru, včetně importu dat z tématických databází (slovník VÚGTK, RUIAN a další) a exportu dat v konfigurovatelném formátu s možností nastavení kritérií pro předávání informací. Součástí systému bude také webová služba pro publikaci obsahu tezauru dalším aplikacím podle popsaného rozhraní (s využitím standardů WSDL a REST JSON).
  • Nový encyklopedický slovník češtiny online (Enc-Czech online) (GAP406/11/0294) MUNI
    • Grantová agentura ČR / Standardní projekty
    • 1/2011 — 12/2015
    • Počet publikací: 678
  • Analýza přirozeného jazyka v prostředí internetu (VF20102014003) MUNI
    • Ministerstvo vnitra ČR / Jiné dotační projekty výzkumné
    • 10/2010 — 12/2014
    • Předmětem veřejné zakázky je vyvinout a implementovat techniky zpracování přirozeného jazyka umožňující analyzovat jazykové projevy na Internetu, které spadají do působnosti českých bezpečnostních orgánů (neonacismu, anarchismu, rasismu, terorismu) s důrazem na určování pravděpodobnosti autorství textů. Předmětem zájmu bude veškerý webový obsah produkovaný domácími i mezinárodními zájmovými skupinami nebo jednotlivci, tj. webové adresy, fóra, chaty, blogy, sociální sítě a další zdroje.
  • Spolehlivá elektroenergetická soustava s připojenými netradičními zdroji (GA102/09/1842) MUNI
    • Grantová agentura ČR / Standardní projekty
    • 1/2009 — 12/2013
    • Počet publikací: 23
  • The European Digital Mathematics Library (250503) MUNI
    • Evropská unie / Rámcový program pro konkurenceschopnost a inovace (CIP)
    • 2/2010 — 1/2013
    • Cílem projektu EuDML The European Digital Mathematics Library je zpřístupnit převážnou část korpusu matematické odborné literatury publikované v Evropě on-line, ve formě autoritativního a udržitelného digitálního repozitáře, vytvořeného a spravovaného sítí institucí. Dosavadní národní aktivity vedly k digitalizaci velkých objemů matematické literatury, zejména partnery tohoto projektu.
  • Pattern Recognition-based Statistically Enhanced MT (248307) MUNI
    • Evropská unie / 7. rámcový program EU
    • 1/2010 — 12/2012
    • This proposal describes PRESEMT, a flexible and adaptable MT system, based on a language-independent method, whose principles ensure easy portability to new language pairs. This method attempts to overcome well-known problems of other MT approaches, e.g. bilingual corpora compilation or creation of new rules per language pair. PRESEMT will address the issue of effectively managing multilingual content and is expected to suggest a language-independent machine-learning-based methodology. The key aspects of PRESEMT involve syntactic phrase-based modelling, pattern recognition approaches (such as extended clustering or neural networks) or game theory techniques towards the development of a language-independent analysis, evolutionary algorithms for system optimisation. It is intended to be of a hybrid nature, combining linguistic processing with the positive aspects of corpus-based approaches, such as SMT and EBMT.
  • Temporální aspekty znalostí a informací (GAP401/10/0792) MUNI
    • Grantová agentura ČR / Standardní projekty
    • 1/2010 — 12/2012
    • Počet publikací: 52
  • Soukromá korespondence 20. století. Rozšíření korpusových zdrojů, nové možnosti lingvistického využití (GAP406/10/0823) MUNI
    • Grantová agentura ČR / Standardní projekty
    • 1/2010 — 12/2012
  • Centrum komputační lingvistiky (LC536) MUNI
    • Ministerstvo školství, mládeže a tělovýchovy ČR / Centra základního výzkumu
    • 1/2005 — 12/2011
  • Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce (2C06009) MUNI
    • Ministerstvo školství, mládeže a tělovýchovy ČR / Informační technologie pro znalostní společnost
    • 7/2006 — 12/2010
  • Inteligentní metody pro zvýšení spolehlivosti elektrických sítí (1ET100300414) MUNI
    • Akademie věd ČR / Informační společnost (Národní program výzkumu)
    • 7/2004 — 12/2008
    • Hlavním cílem výzkumného projektu je zvýšení bezpečnosti a spolehlivosti chodu elektroenergetické soustavy rozvojem nových inteligentních metod. Velice aktuální je rovněž snížení rizika black - out v České republice. Problematika spolehlivosti elektrických rozvodných soustav je na fakultě elekrotechniky a informatiky úspěšně řešena několik let. Vzniklo zde celostátní výzkumné pracoviště pro tvorbu a kategorizaci databáze poruch rozvodných zařízení a výpadků dodávky elektrické energie. Z celé České republiky a ze Slovenska jsou zasílány informace z jednotlivých regionálních distribučních společností a vytváří se tak objektivně vypovídající prostředí pro výpočty spolehlivosti rozvodných systémů.
  • Digitální knihovny (MSM 143300004) MUNI
    • Ministerstvo školství, mládeže a tělovýchovy ČR / Výzkumné záměry
    • 1/1999 — 1/2004
    • Náplní výzkumného záměru je oblast digitálních knihoven (digital libraries) jako kritické složky nově vznikajících systémů distribuovaného znalostního prostředí (Distributed Knowledge Environments) umožňujících univerzální přístup prakticky ke všem oblastem lidského vědění. Výzkum je zaměřen do vybraných pod-oblastí digitálních knihoven:

Starší projekty

  • BalkaNet - Návrh a tvorba vícejazyčného balkánského WordNetu
    • Účastníci: Univerzita v Patrasu, Institut počítačových technologií, Univerzita Alexandru Ioan Cuza, Římská akademie, Bulharská akademie věd, Univerzita Sabanci, Masarykova univerzita, Memodata, Univerzita v Plovdiv, Athenská univerzita
    • Hlavní řešitel z FI: doc. PhDr. Karel Pala Csc. (pala@fi.muni.cz)
    • Poskytovatel: Komise evropského společenství
    • Doba trvání: 36 měsíců
    • Poznámka: shrnutí tohoto projektu je dostupné na adrese: http://www.ceid.upatras.gr/Balkanet/