Grant projects
NLP Centre members are co-investigators on the following grant projects (some title/descriptions are in Czech only):
- On our own: Opportunities and Risks in the Individualization of Society (PRINS) (CZ.02.01.01/00/23_025/0008710) MUNI
- Ministry of Education, Youth and Sports of the CR / OP JAK
- 5/2025 — 12/2028
- Předmětem projektu „Na všechno sami: příležitosti a rizika individualizace společnosti“ je realizovat excelentní výzkum s interdisciplinárním přístupem, který umožní porozumět příležitostem a rizikům spojeným s individualizací, která akcentuje individuální hodnoty, potřeby a preference. Projekt si klade za cíl nejen identifikovat a analyzovat tato rizika, ale také navrhnout strategie pro minimalizaci jejich dopadu a využití příležitostí ke zvýšení individuální i společenské odolnosti.
- LINDAT/CLARIAH-CZ - Digitální výzkumná infrastruktura pro jazykové technologie, umění a humanitní vědy (LM2023062) MUNI
- Ministry of Education, Youth and Sports of the CR / Large Infrastructures for Research, Development and Innovation
- 1/2023 — 12/2026
- LINDAT/CLARIAH-CZ is a Digital Research Infrastructure for Language Technologies, Arts and Humanities. It enables the archiving, processing, administration and making available of data, resources and tools from the fields of arts, humanities and social sciences. The goal of the project is to strengthen and expand research enriched with digital resources and tools and to support the teaching of digital humanities across the traditional humanities disciplines of the Faculty of Philosophy.
- Oscars - Opravidlo 2.0 – Public Online Proofreading Service (OSCARS-01-247) MUNI
- European Union / Horizon Europe
- 10/2024 — 9/2026
- The proposed project aims to bring a beta-version online proofreading service, Opravidlo, into its operational phase. Currently, Opravidlo works with reasonably high precision but low recall. The proofreader detects errors in spelling (capitalization, diacritics, word spelling), grammar (punctuation, grammatical agreement, sentence constructions), and typesetting (e.g., quotes or spaces). Opravidlo is based on a set of rules designed by linguistic experts to achieve high precision. It suggests corrections, provides explanations of various language phenomena, and links to further explanations if available. The project's contribution will be public and scientific: A hybrid approach to Opravidlo that will increase recall, precision, and more adequate explanations will lead to a higher quality of public service, both for native speakers and language learners. A high-precision proofreader will serve the public good for all age groups of native Czechs and accelerate the integration of immigrants to Czechia.
- A web application for authorship verification (TQ01000110) MUNI
- Technology Agency of the Czech Republic / SIGMA
- 9/2023 — 8/2026
- Tzv. contract cheating, kdy si student nechá vypracovat seminární či závěrečnou práci na zakázku, patří k nejpalčivějším etickým problémům současného vysokého školství. Contract cheating je těžké odhalit, a ještě těžší je jej prokázat. Cílem projektu je vyvinout webovou aplikaci použitelnou v rámci disciplinárního řízení pro prokázání autorství předloženého dokumentu.
- BioMedAI TWINNING (101079183) MUNI
- European Union / Horizon Europe
- 11/2022 — 10/2025
- Increasing demand for sophisticated clinical diagnostics makes current diagnostic capacities insufficient. A potential solution lies in semi-automatic systems speeding up the diagnosis process. Artificial intelligence (AI) and machine learning seem to be very promising approaches to the automation of diagnostic systems. However, most academic AI systems are opaque black boxes that cannot be easily tested and certified. Also, academic AI solutions are often hard to reproduce, and their evaluation is insufficiently connected with clinical practice. This motivates MU and MMCI to team with two advanced partners (AP), MUG and TUB, and establish a BioMedAI infrastructure allowing close cooperation of computer science and clinical experts to develop explainable trustworthy AI solutions. Both AP possess rich experience with AI solutions for healthcare. Namely, processing large amounts of sensitive image and clinical data, interactive machine learning methods with a human-in-the-loop, and validating AI methods for healthcare. The main body of the BioMedAI project concentrates on training computer science researchers at MU and clinical experts at MMCI in the development of explainable AI methods based on high-quality medical data and validated in a clinical setting. Concretely, we propose organizing thematic workshops, virtual training with hands-on experience in developing explainable AI tools, and two summer schools. One will be oriented towards basic research in explainable AI methods for image and clinical data processing, and the other one towards the management of sensitive medical data. Furthermore, the BioMedAI project will also increase the visibility and presence of the explainable AI research in healthcare at MU and MMCI by training a PR manager responsible for presenting the research to various stakeholders, and by training the existing project management staff at MU and MMCI in writing grant applications for projects in EU and elsewhere.
- AIcope - AI support for Clinical Oncology and Patient Empowerment (MUNI/G/1763/2020) MUNI
- Masaryk University / Grant Agency of Masaryk University
- 4/2021 — 12/2023
- In 2016, over half a million people were registered as oncological patients in the Czech Republic, of which 96,500 were newly diagnosed. 27,261 people died that year (based on data from the Institute of Health Information and Statistics). This clearly shows the substantial impact cancer has not only on the healthcare system, but also on the whole society and economy. The additional problem is that while there are various efficacious treatments available for most cancers, many of them may drastically impact the entire patients’ life, each in their own way. To further reduce the societal burden of cancer, it is therefore crucial to pick the right type of treatment, not only based on the patient's biological profile but also on their preferences and general lifestyle.
- Modelling the future: Understanding the impact of technology on adolescent’s well-being (GX19-27828X) MUNI
- Czech Science Foundation / EXPRO
- 1/2019 — 12/2023
- This project aims to develop a complex evidence-based theory depicting impacts of technology usage on physical, psychological and social well-being of adolescents. We will integrate theories used by different fields, such as ecological systems theory (psychology), differential susceptibility to media effects theory (media studies), problem behavior theory (psychology) and behavioral change theory (health). Further, we plan to develop an innovative methodology integrating findings from short-term and long-term data collections. The first work package (WP) is based on the analyses of up-to-date data and aims to understand the associations of selected online risks and opportunities with well-being in the cross-culture perspective. We will use data from the project EU Kids Online, which collected representative data in 25 countries in the year 2010 and in 12 countries in the years 2017 to 2018. The second WP will assess the effects of the technology and various psycho-social factors on well-being of adolescents in longitudinal perspective. To capture the changes and to provide results in terms of causality, we will carry out the three-wave longitudinal research (with a one-year interval between each wave) on Czech adolescents aged 11-18 years. We aim for a sample of at least 1,000 adolescents and parents who attended the survey in all three waves. The third WP will comprise series of short-term studies focusing on examination of the cognitive processes related to impact of technology on well-being. We will present the stimuli on a computer/smartphone screen, and using eye-tracker, capture the pattern of eye movement. We will measure how different stimuli causes changes in well-being in relation to cognitive perceptions of the screens. The fourth WP will develop innovative research tools which will integrate short-term and long-term data collections. We will develop a software based on machine learning tools which will automatically access online behavior of adolescents. The data collection will combine intensive data collections based on real time behavior of adolescents (4x two weeks) with short surveys displayed on smart phones and two standard surveys.
- Historické prameny na dosah. Zpřístupnění středověkých písemných dokumentů formou kontextuální databáze. (TL03000365) MUNI
- Technology Agency of the Czech Republic / ÉTA
- 5/2020 — 4/2023
- Základním cílem projektu je zpřístupnit písemné prameny k českým středověkým dějinám širokému okruhu uživatelů internetu: vědcům, pracovníkům paměťových institucí, učitelům, studentům i nejširší veřejnosti. Projekt využije digitalizovaných dat portálu Czech medieval sources online, která budou převedena do nově implementovaného systému AHISTO. Ten propojí dosavadní obrazová data se semiautomaticky vytvářenou textovou databází a umožní plnotextové sémantické prohledávání textů i metadat, tvorbu pokročilých anotací a extrakci strukturních dat. Vzhledem k rozsahu textového korpusu byl pro zpracování metadat zvolen testovací vzorek v podobě úředních písemností z husitské epochy (1419–1436).
- LINDAT/CLARIAH-CZ - Digitální výzkumná infrastruktura pro jazykové technologie, umění a humanitní vědy (LM2018101) MUNI
- Ministry of Education, Youth and Sports of the CR / Large Infrastructures for Research, Development and Innovation
- 1/2019 — 12/2022
- The LINDAT/CLARIAH‐CZ Research Infrastructure is planned as a new addition to the Czech Republic’s Research Infrastructure Roadmap, as a national node of the pan‐European DARIAH‐EU network. It will bring the key institutions in the Czech Republic to the European Digital Humanities landscape, and it is foreseen that Czech Republic will become a full member of DARIAH ERIC, the governing body of the network, which has formally been established on Aug. 15, 2014. LINDAT/CLARIAH‐CZ RI is currently in its preparatory phase. The RI will enter its construction phase at the beginning of the funding phase, i.e. at the beginning of 2019. It is assumed, based on previous experience of similar SSH RIs, such as CLARIN or other DARIAH nodes in Europe, that the construction phase will have to last for about two years (until the end of 2021). The last year of the construction phase (2021), with the planned equipment being installed, will be devoted to testing and gradual opening of services to the public. Starting in 2022, the LINDAT/CLARIAH‐CZ will enter its operational phase; data collection and development of services will continue throughout.
- Moduly pro strojový překlad (Modules for Machine Translation) (MUNI/33/06202107/2021) MUNI
- Masaryk University / Internal projects of TTO
- 1/2022 — 11/2022
- Centrum zpracování přirozeného jazyka na FI MU (NLP Centrum) má technologie ve formě programů či databází, které mohou být využity v externích aplikacích. Cílem projektu je ověření použitelnosti modulů těchto technologií ve formě webových aplikačních rozhraní na příkladu externí aplikace strojového překladu.
- Využití strojového učení při detekci společného argumentu v koordinovaných strukturách (MUNI/A/1184/2020) MUNI
- Masaryk University / Specific research - support for student projects
- 1/2021 — 12/2021
- Cílem navrhovaného projektu je vytvoření nástroje pro češtinu k automatickému předzpracování textu, který umožní ve větě rozpoznávat argument vážící se ke dvěma souřadně spojeným výrazům. Při řešení nastíněného problému bude využita metoda řízeného strojového učení (s učitelem). Konkrétně půjde o úlohu klasifikace vstupu do tříd, kdy klasifikátor dostane anotovaná vstupní data, ze kterých se naučí rozpoznávat dané struktury i na neoznačených datech.
- Hyperintensionální usuzování nad texty přirozeného jazyka (GA18-23891S) MUNI
- Czech Science Foundation / Standard Projects
- 1/2018 — 12/2020
- Tento projekt je interdisciplinárně zaměřen, neboť zasahuje do tří příbuzných oborů, a to komputační lingvistiky, logiky a umělé inteligence. Soustředíme se na dva hlavní problémy, které dosud nejsou uspokojivě řešeny v současných systémech určených pro získávání znalostí z textů. Za prvé, dostatečně přesná lingvistická a logická analýza otázek a příslušných textů je nutnou podmínkou pro získávání adekvátních odpovědí. Za tím účelem aplikujeme procedurální sémantiku Transparentní intenisonální logiky (TIL), která umožňuje rozlišovat tři druhy kontextu, ve kterém se může daný výraz vyskytovat, a to extensionální, intensionální a hyperintensionální. Definice tří druhů kontextu nám umožnila navrhnout extensionální logiku hyperintensí, ve které jsou všechna extensionální pravidla usuzování platná ve všech kontextech. Za druhé, tuto teorii využijeme k získávání inferenčních znalostí z explicitních znalostí zakódovaných v rozsáhlých bázích textů v přirozeném jazyce tak, aby systém poskytoval inteligentní odpovědi na otázky.
- LINDAT/CLARIN - Výzkumná infrastruktura pro jazykové technologie (CZ.02.1.01/0.0/0.0/16_013/0001781) MUNI
- Ministry of Education, Youth and Sports of the CR / Operational Programme Research, Development and Education
- 1/2017 — 12/2020
- Projekt navazuje na běžící projekt LINDAT-Clarin, který koncipován jako český „uzel“ mezinárodní sítě Clarin (Common Language Resources and Technology Infrastructure). Centrum LINDAT-Clarin bude tedy v českém jazykovém prostředí zaměřeno na sběr jazykových dat a především jejich anotaci (tj. formální manuální, poloautomatickou a automatickou jazykovou analýzu). Sběr a anotace budou probíhat v takovém rozsahu, kvalitě a technologické přípravě (specifikace, schémata, formáty), která bude přímo využitelná jak v humanitní oblasti (jazykovědný a mezioborový výzkum, kde přirozený jazyk hraje podstatnou roli), tak i pro výzkum a vývoj v oblasti jazykových technologií za použití moderních statistických a hybridních metod. Náplň práce centra a jeho výsledky se dotýkají žady oborů – v humanitních vědách to jsou jazykověda obecná a jazykověda zabývající se konkrétními jazyky, zejména češtinou, dále překladatelství, lexikografie, sociolingvistika, částečně i obory příbuzné (psychologie, sociologie, knihovnictví, neurovědy, cognitive science) s významným přechodem do informatiky (computer science, computational linguistics), matematiky (statistika a pravděpodobnost) a elektrotechniky (zpracování akustického signálu).
- Metodika a technologie pro tvorbu odborných tezaurů a slovníků pro potřeby rozvoje národní infrastruktury pro prostorové informace (TITIMV702) MUNI
- Technology Agency of the Czech Republic / BETA2
- 5/2018 — 4/2020
- Vytvořit obecnou metodiku a podpůrné technologie pro tvorbu, správu a využívání propojitelných odborných tezaurů a slovníků z oblasti rozvoje národní infrastruktury pro prostorové informace, s vazbou na existující nadnárodní tématické tezaury, s možností využití v dalších oblastech činnosti veřejné správy a to včetně revize a zdokonalení existujících národních slovníků a tezaurů s návrhem jejich společné koordinované správy. Výstupy tohoto projektu budou přímo navazovat na výsledky předcházejícího projektu "Terminologický tezaurus pro obor zeměměřictví a katastru nemovitostí".
- Manipulativní techniky propagandy v době internetu (MUNI/G/0872/2016) MUNI
- Masaryk University / Grant Agency of Masaryk University
- 3/2017 — 12/2019
- Společný projekt výzkumníků z FSS MU, FI, MU a PrF MU „Manipulativní techniky propagandy v době internetu“ reaguje na aktuální problematiku šíření politické propagandy cizích aktérů skrze nová média a sociální sítě v České republice. Tento jev přináší výzvy pro metodologický, bezpečnostní a právní výzkum a skýtá tak příležitost vytvořit unikátní výzkumný tým. Na případu pro-ruské informační války projekt rozvíjí metody rozpoznávání, detekce a analýzy manipulativních technik propagandy, analyzuje uživatele sdílející manipulativní obsahy z hlediska jejich motivace a zhodnocuje bezpečnostní rizika pro ČR vyplývající ze šíření obsahů s manipulativním obsahem, včetně zhodnocení možných legislativních důsledků protagonistů manipulativních technik propagandy. Projekt je rozdělen do dvou oblastí výzkumu podle typu médií. První oblast se věnuje kvantitativní analýze sentimentu a manipulativním technikám pro-ruských zpravodajských serverů. Druhou oblast představuje analýza aktivit a motivací uživatelů sociální sítě Facebook, kteří se podílejí na šíření manipulativního obsahu. Výstupem projektu bude analytický software pro detekci manipulativních technik v textu a minimálně šest odborných publikací věnujících se metodologickému uchopení analýzy manipulativních technik propagandy, analýze manipulativních technik na pro-ruských zpravodajských serverech, analýze uživatelů a šiřitelů manipulativních obsahů na sociálních sítích, právním analýzám důsledků šíření manipulativních obsahů a bezpečnostním aspektům této problematiky pro ČR.
- Projekt LINDAT-Clarin - Vybudování a provoz českého uzlu pan-evropské infrastruktury pro výzkum (LM2015071) MUNI
- Ministry of Education, Youth and Sports of the CR / Large Infrastructures for Research, Development and Innovation
- 1/2016 — 12/2019
- Projekt LINDAT-Clarin je koncipován jako český „uzel“ mezinárodní sítě Clarin (Common Language Resources and Technology Infrastructure. Centrum LINDAT-Clarin bude tedy v českém jazykovém prostředí zaměřeno na sběr jazykových dat a především jejich anotaci (tj. formální manuální, poloautomatickou a automatickou jazykovou analýzu). Sběr a anotace budou probíhat v takovém rozsahu, kvalitě a technologické přípravě (specifikace, schémata, formáty), která bude přímo využitelná jak v humanitní oblasti (jazykovědný a mezioborový výzkum, kde přirozený jazyk hraje podstatnou roli), tak i pro výzkum a vývoj v oblasti jazykových technologií za použití moderních statistických a hybridních metod. Náplň práce centra a jeho výsledky se dotýkají řady oborů – v humanitních vědách to jsou jazykověda obecná a pro jazykověda zabývající se konkrétními jazyky, zejména češtinou, dále překladatelství, lexikografie, sociolingvistika, částečně i obory příbuzné (psychologie, sociologie, knihovnictví, neurovědy, cognitive science) s významným přesahem do informatiky (computer science, computational linguistics), matematiky (statistika a pravděpodobnost), a elektrotechniky (zpracování akustického signálu).
- Ověření úspěšnosti technik zpracování přirozeného jazyka pro extrakci informací ze skenovaných dokumentů (MUNI/33/55939/2017) MUNI
- Masaryk University / Internal projects of TTO
- 4/2017 — 8/2018
- Cílem projektu je ověřit možnost automatického vytěžování informací ze skenovaných textů - finančních dokumentů (faktur) a smluvních dokumentů. Ze vstupu v podobě sledu naskenovaných dokumentů ve formě částečně strukturované textu bude nejprve každý dokument automaticky klasifikován do určité kategorie. U finančních dokumentů budou extrahovány informace o dodavateli a odběrateli, datu splatnosti, jednotlivých položkách faktury (cena a popis), místu vydání faktury, číslu objednávky a faktury a také o čísle účtu a dalších platebních parametrech. U smluvních dokumentů se budou extrahovat informace o jednotlivých smluvních stranách (jména, adresy, ...), datu podpisu, typy smlouvy, závazcích smluvních stran a spisovém číslu dokumentu. Veškeré tyto informace je zatím možné efektivně získávat pouze ručně. Navrhovaný tým má v současnosti k dispozici vlastní podpůrné jazykové nástroje a v rámci projektu plánuje ověřit jejich efektivitu při zmíněných procesech automatické extrakce informací.
- Hyperintensionální logika pro analýzu přirozeného jazyka (GA15-13277S) MUNI
- Czech Science Foundation / Standard Projects
- 3/2015 — 12/2017
- Projekt má jako hlavní cíl stanovenu počítačově podporovanou lingvisticko-logickou analýzu přirozeného jazyka, a to především češtiny a angličtiny. Navrhovaný projekt bude rozvíjet logický rámec Transparentní intensionální logiky (TIL), což je jeden z hlavních představitelů systémů procedurální sémantiky, a to zejména jeho aplikací v oblasti zpracování přirozeného jazyka, komunikace a usuzování. Dokončíme úspěšně nastartovaný projekt návrhu a vývoje inferenčního stroje pro TIL s využitím jeho komputační varianty, tj. funkcionálního programovacího jazyka TIL-Script. Projekt je interdisciplinární, neboť jsme přesvědčeni, že logická analýza jazyka musí navazovat na výsledky analýzy lingvistické. Proto bude do výzkumu zahrnuto využití nástrojů komputační lingvistiky, logiky, filosofie a informatiky.
- Rozhraní pro Linked Data v systému pro editaci slovníků DEB (LD15066) MUNI
- Ministry of Education, Youth and Sports of the CR / COST CZ
- 10/2015 — 10/2017
- V projektu budou navrženy a ověřovány nové postupy pro tvorbu celoevropského slovníkového portálu v souladu s metodikou Linked Open Data (otevřená propojená data), které umožní sdílení lexikografických vědeckých zdrojů mezi zapojenými výzkumnými institucemi a také veřejné zpřístupnění zdrojů pro další využití a výzkum. Součástí projektu bude také analýza a návrh inovativních technologií pro tvorbu lexikografických zdrojů s využitím údajů z rozsáhlých jazykových databází (korpusů) a analýza možností rozšíření vlastností elektronických slovníků pro zlepšení přístupnosti pro uživatele.
- Harvesting big text data for under-resourced languages (7F14047) MUNI
- Ministry of Education, Youth and Sports of the CR / Czech-Norwegian Research Programme (CZ09)
- 6/2014 — 4/2017
- Cílem projektu je získat z webu velká textová data (korpusy) pro jazyky s nedostatečnými zdroji, mezi něž patří norština, zčásti čeština a také některé etiopské jazyky (amharština, afaan oromština, tigrinština, somálština). Data budou anotována, parsována tak, aby byla použitelná pro různé aplikace v oblasti počítačového zpracování přirozeného jazyka, např. extrakce informací, strojový překlad a další. Konsorcium bude tvořeno jedním norským týmem (NTNU Trondheim a přidruženou Universitou v Oslo), které se budou věnovat zpracování vzniklých korpusů, a jedním českým týmem (MU Brno), který využije iiž svých existujících nástrojů pro budování korpusů z webu. Projekt bude koordinován brněnským týmem. Jedním cílem projektu bude vytvoření velkého norského korpusu čítajícího miliardy slovních tvarů s použitím nástrojů vyvinutých v rámci spolupráce s NTNU v EU projektu PRESEMT ("PRESEMT: Pattern REcognition-based Statistically Enhanced MT", 2010-2012). Za druhé, NTNU spolupracuje s Universitou v Oslo a dvěma etiopskými universitami v projektu na podporujícím budování jazykových zdrojů a fundovaném organizací Norad ("Linguistic Capacity Building – tools for the inclusive development of Ethiopia", NORHED 2013-2018). Je tedy přirozené propojit tyto aktivity a zahrnout zpracování čtyř velkých etiopských jazyků do předkládaného projektu: projekt HaBiT tak může podpořit a posílit projekt NORHED důkladným testováním technologií a tím adresovat témata evaluace a verifikace a také splnit společenskou výzvu pro informační technologie (ICT). Takto získáme relevantní přidanou hodnotu rovněž po politické stránce díky kooperaci s méně rozvinutou zemí. Za třetí, budou vytvořeny aplikace pro povrchové zpracování češtiny a norštiny a aspoň jednoho etiopského jazyka, umožňující vyčlenění a zkoumání mnohoznačnosti slov v korpusech, tj. indukci slovních významů a také tvorbu vícevektorových prostorů a paralelních multilinguálních prostorů pro desambiguaci významů slov při překladu.
- Vytvoření tezauru pro obor zeměměřictví a katastru nemovitostí (TB02CUZK004) MUNI
- Technology Agency of the Czech Republic / TB
- 2/2014 — 12/2015
- Vývoj systému pro správu vícejazyčného tezauru, který umožní editaci a prohlížení tezauru, včetně importu dat z tématických databází (slovník VÚGTK, RUIAN a další) a exportu dat v konfigurovatelném formátu s možností nastavení kritérií pro předávání informací. Součástí systému bude také webová služba pro publikaci obsahu tezauru dalším aplikacím podle popsaného rozhraní (s využitím standardů WSDL a REST JSON).
- New Encyclopaedia of Czech Online (Enc-Czech online) (GAP406/11/0294) MUNI
- Czech Science Foundation / Standard Projects
- 1/2011 — 12/2015
- Total number of publications: 678
- Analýza přirozeného jazyka v prostředí internetu (VF20102014003) MUNI
- Ministry of the Interior of the CR / Other research grant projects
- 10/2010 — 12/2014
- Předmětem veřejné zakázky je vyvinout a implementovat techniky zpracování přirozeného jazyka umožňující analyzovat jazykové projevy na Internetu, které spadají do působnosti českých bezpečnostních orgánů (neonacismu, anarchismu, rasismu, terorismu) s důrazem na určování pravděpodobnosti autorství textů. Předmětem zájmu bude veškerý webový obsah produkovaný domácími i mezinárodními zájmovými skupinami nebo jednotlivci, tj. webové adresy, fóra, chaty, blogy, sociální sítě a další zdroje.
- Reliable Electric Power Network with Connected Alternative Power Sources (GA102/09/1842) MUNI
- Czech Science Foundation / Standard Projects
- 1/2009 — 12/2013
- Total number of publications: 23
- The European Digital Mathematics Library (250503) MUNI
- European Union / Competitiveness and inovation framework programme
- 2/2010 — 1/2013
- The European Digital Mathematics Library strives to make the significant corpus of mathematics scholarship published in Europe available online, in the form of an authoritative and enduring digital collection, developed and curated by a network of institutions. National efforts have led to the digitisation of large quantities of mathematical literature, primarily by partners in this project. Publishers produce new material that needs to be archived safely over the long term, made more visible, usable, and interoperable with the legacy corpus on which it settles. In EuDML, these partners will join together with leading technology providers in constructing the Europe-wide interconnections between their collections to create a document network as integrated and trans-national as the discipline of mathematics itself. They will future-proof their work by providing the organisational and technical infrastructure to accommodate new collections and mathematically rich metadata formats, and will work towards truly open access for the whole European Community to this foundational resource, thereby retaining Europe's leadership in the provision, accessibility and exploitation of electronic mathematical content.
- Pattern Recognition-based Statistically Enhanced MT (248307) MUNI
- European Union / 7th Specific RTD Programme
- 1/2010 — 12/2012
- This proposal describes PRESEMT, a flexible and adaptable MT system, based on a language-independent method, whose principles ensure easy portability to new language pairs. This method attempts to overcome well-known problems of other MT approaches, e.g. bilingual corpora compilation or creation of new rules per language pair. PRESEMT will address the issue of effectively managing multilingual content and is expected to suggest a language-independent machine-learning-based methodology. The key aspects of PRESEMT involve syntactic phrase-based modelling, pattern recognition approaches (such as extended clustering or neural networks) or game theory techniques towards the development of a language-independent analysis, evolutionary algorithms for system optimisation. It is intended to be of a hybrid nature, combining linguistic processing with the positive aspects of corpus-based approaches, such as SMT and EBMT.
- Temporální aspekty znalostí a informací (GAP401/10/0792) MUNI
- Czech Science Foundation / Standard Projects
- 1/2010 — 12/2012
- Total number of publications: 52
- 20th Century Private Correspondence. Corpus Sources Extension, New Possibilities of Linguistic Application (GAP406/10/0823) MUNI
- Czech Science Foundation / Standard Projects
- 1/2010 — 12/2012
- Total number of publications: 21
- Centrum komputační lingvistiky (LC536) MUNI
- Ministry of Education, Youth and Sports of the CR / Basic Research Center
- 1/2005 — 12/2011
- Předmětem činnosti Centra bude společný teoretický výzkum v oboru počítačové lingvistiky, a to zejména v oblasti kombinace zpracování psaného a mluveného jazyka, která bude podle našeho názoru této oblasti již v brzké době dominovat díky pokroku v obou těchto dosud oddělených oblastech.
- Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce (2C06009) MUNI
- Ministry of Education, Youth and Sports of the CR / Information technologies for knowledge society
- 7/2006 — 12/2010
- Vypracovat komplexní systém metodických a implementačních nástrojů na bázi inteligentních agentů pro vytváření uživatelsky přívětivých rozhraní k sémantickému webu umožňující, aby komunikace s uživatelem probíhala v přirozeném jazyce a též zpracovávaná data měla převážně charakter vět, resp. promluv, přirozeného jazyka. Dalším cílem pak je ověření funkčních vlastností navržených nástrojů na vhodně zvolené aplikaci.
- Intelligentmethods for incresing of reliability of electrical networks (1ET100300414) MUNI
- Academy of Sciences of the Czech Republic / Information society (National programme of research)
- 7/2004 — 12/2008
- The main objective of the research project is an increase in safety and reliability of operation of the electric power system by developing new intelligent methods. A reduction of black-out risk in the Czech Republic is very topical as well. problems of the reliability in electric power engineering have been successfuly solved at the faculty of electrical engineering and computer science for several years. There has been established the statewide research workplace for the creation and categorisation of the databases of failures of distribution equipment and outages of supply at all voltage levels. From all over the Czech Republic and Slovakia the data are send from the particular regional distribution companies and that way is created an objectively predicative environment for the reliability computations of distribution systems.
- Digital libraries (MSM 143300004) MUNI
- Ministry of Education, Youth and Sports of the CR / Research Intents
- 1/1999 — 1/2004
- Research theme belongs to the sphere of Digital Libraries (DLs) as a critical component of emerging Distributed Knowledge Environments allowing wide access practically to all fields of human base of information, knowledge, and experience. Research is aimed at the selected fields of Digital Libraries:
Older projects:
- BalkaNet - Design and Development of a Multilingual Balkan WordNet
- Members: University of Patras, Compute Technology Institut, University Alexandru Ioan Cuza, Academia Romana, Bulgarian Academy of Science, Sabanci University, Masaryk University, Memodata, University of Plovdiv, University of Athens
- Main solver from FI: doc. PhDr. Karel Pala Csc. (pala@fi.muni.cz)
- Provider: Commision of the European Communities
- Date of Duration: 36 months
- Comment: sumary of the project is available at the address: http://www.ceid.upatras.gr/Balkanet/
- VS97028 - Natural Language Processing Laboratory
- Main solver: doc. PhDr. Karel Pala Csc. (pala@fi.muni.cz)
- Provider: Ministry of Education
- Date of Opening: 1. January 1998
- Date of Duration: three years
- Final Report (2000): doc, rtf, htm, txt
- Comment: grant project, which was at the beginning Natural Language Processing Centre
- 405/96/K214 - Czech Language in the Age of Computers
- Main solver from FI: doc. PhDr. Karel Pala Csc. (pala@fi.muni.cz)
- Provider: Grant Agency of the Czech Republic
- Date of Opening: 1. January 1996
- Date of Duration: six years
- Anual Report for year 2000: doc, rtf, htm, txt
- Comment: The Holder is ÚFAL MFF UK, Centre members solve a part of this task (see Report)
- LE4-8328 - EuroWordNet 2
- Main solver: doc. PhDr. Karel Pala Csc. (pala@fi.muni.cz)
- Provider: EU, via University of Amsterdam
- Date of Opening: 1. April 1998
- Date of Duration: 15 months
- Final Report for year (1999): ps, doc, rtf, htm, txt
- Comment: sumary of the project is available at the address http://www.hum.uva.nl/~ewn/
- FRVŠ 0408/99 - Semantic Analysis of Natural Language
- Solvers: Mgr. Aleš Horák (hales@fi.muni.cz), Mgr. Leo Hadacz (hadacz@fi.muni.cz)
- Provider: Ministry of Education
- Date of Opening: 1. January 1999
- Date of Duration: 1 year
- Final Report for year (1999): ps
- 201/99/D028 - Syntactic Analysis of Natural Language
- Solver: RNDr. Pavel Smrž, Ph.D. (smrz@fi.muni.cz)
- Provider: Grant Agency of the Czech Republic
- Date of Opening: 1. September 1999
- Date of Duration: 3 years
- Anual Report for year (2000): doc, rtf, htm, txt







