Changes between Version 9 and Version 10 of cs/GrantoveProjekty


Ignore:
Timestamp:
Oct 22, 2020, 5:23:09 PM (4 years ago)
Author:
yhribik
Comment:

updated project info

Legend:

Unmodified
Added
Removed
Modified
  • cs/GrantoveProjekty

    v9 v10  
    1 {{{#!html
    2 <input type="hidden" id="lang_version" value="en/GrantProjects" />
    3 <input type="hidden" id="title_name" value="Grantové projekty"/>
    4 }}}
     1`#!html <input type="hidden" id="lang_version" value="en/GrantProjects" /> <input type="hidden" id="title_name" value="Grantové projekty"/> `
    52
    63= Grantové projekty =
    7 
    84Členové Centra zpracování přirozeného jazyka jsou spoluřešiteli následujících grantových projektů:
    95
     6 * '''LINDAT/CLARIAH-CZ - Digitální výzkumná infrastruktura pro jazykové technologie, umění a humanitní vědy (LINDAT/CLARIAH-CZ)''' [https://www.muni.cz/vyzkum/projekty/48167 MUNI]
     7   * MŠMT LM2018101 (CEP: LM2018101)
     8   * 1.1.2019 - 31.12.2022
     9   * LINDAT/CLARIAH-CZ je Digitální výzkumná infrastruktura pro jazykové technologie, umění a humanitní vědy. Umožňuje archivaci, zpracování, správu a zpřístupnění dat, zdrojů a nástrojů z oblasti umění, humanitních a společenských věd. Cílem projektu je posílit a rozšířit výzkum obohacený o digitální zdroje a nástroje a podpořit výuku digitálních humanitních věd napříč tradičními humanitními obory filozofické fakulty. Cílem projektu je posílit a propagovat přístupy k výzkumu používající digitální zdroje a výpočetní kapacity umožňující řešit tradiční problémy humanitních oborů novými metodami a z nového úhlu pohledu. CLARIAH je panevropská síť propojující lidi s informacemi, znalostmi, obsahem, metodami, nástroji a technologiemi poskytovanými členskými státy. Projekt usiluje o zviditelnění digitálních a infrastrukturních produktů a systémů, stejně jako vědeckých článků, které vznikly s jejich využitím, na globální úrovni. Tomu napomůže vytvoření lokálního uzlu infrastruktury CLARIAH a zprostředkování metadat a odkazů na jedinečné digitální zdroje tvořené vědci na FF MU. [[BR]][[BR]]
     10 * '''Historické prameny na dosah. Zpřístupnění středověkých písemných dokumentů formou kontextuální databáze. (AHISTO)''' [https://www.muni.cz/vyzkum/projekty/55607 MUNI]
     11   * TA ČR TL03000365
     12   * 1.5.2020 - 31.4.2023
     13   * Základním cílem projektu je zpřístupnit písemné prameny k českým středověkým dějinám širokému okruhu uživatelů internetu: vědcům, pracovníkům paměťových institucí, učitelům, studentům i nejširší veřejnosti. Projekt využije digitalizovaných dat portálu Czech medieval sources online, která budou převedena do nově implementovaného systému AHISTO. Ten propojí dosavadní obrazová data se semiautomaticky vytvářenou textovou databází a umožní plnotextové sémantické prohledávání textů i metadat, tvorbu pokročilých anotací a extrakci strukturních dat. Vzhledem k rozsahu textového korpusu byl pro zpracování metadat zvolen testovací vzorek v podobě úředních písemností z husitské epochy (1419–1436). [[BR]][[BR]]
     14 * '''Modelling the future: Understanding the impact of technology on adolescent’s well-being (FUTURE)''' [https://www.muni.cz/vyzkum/projekty/46292 MUNI]
     15   * GA ČR GX19-27828X
     16   * 1.1.2019 - 31.12.2023
     17   * This project aims to develop a complex evidence-based theory depicting impacts of technology usage on physical, psychological and social well-being of adolescents. We will integrate theories used by different fields, such as ecological systems theory (psychology), differential susceptibility to media effects theory (media studies), problem behavior theory (psychology) and behavioral change theory (health). Further, we plan to develop an innovative methodology integrating findings from short-term and long-term data collections. The first work package (WP) is based on the analyses of up-to-date data and aims to understand the associations of selected online risks and opportunities with well-being in the cross-culture perspective. We will use data from the project EU Kids Online, which collected representative data in 25 countries in the year 2010 and in 12 countries in the years 2017 to 2018. The second WP will assess the effects of the technology and various psycho-social factors on well-being of adolescents in longitudinal perspective. To capture the changes and to provide results in terms of causality, we will carry out the three-wave longitudinal research (with a one-year interval between each wave) on Czech adolescents aged 11-18 years. We aim for a sample of at least 1,000 adolescents and parents who attended the survey in all three waves. The third WP will comprise series of short-term studies focusing on examination of the cognitive processes related to impact of technology on well-being. We will present the stimuli on a computer/smartphone screen, and using eye-tracker, capture the pattern of eye movement. We will measure how different stimuli causes changes in well-being in relation to cognitive perceptions of the screens. The fourth WP will develop innovative research tools which will integrate short-term and long-term data collections. We will develop a software based on machine learning tools which will automatically access online behavior of adolescents. The data collection will combine intensive data collections based on real time behavior of adolescents (4x two weeks) with short surveys displayed on smart phones and two standard surveys. [[BR]][[BR]]
     18 * '''Hyperintensionální usuzování nad texty přirozeného jazyka''' [https://www.muni.cz/vyzkum/projekty/40205 MUNI]
     19   * GA ČR GA18-23891S
     20   * 1.1.2018 - 31.12.2020
     21   * Tento projekt je interdisciplinárně zaměřen, neboť zasahuje do tří příbuzných oborů, a to komputační lingvistiky, logiky a umělé inteligence. Soustředíme se na dva hlavní problémy, které dosud nejsou uspokojivě řešeny v současných systémech určených pro získávání znalostí z textů. Za prvé, dostatečně přesná lingvistická a logická analýza otázek a příslušných textů je nutnou podmínkou pro získávání adekvátních odpovědí. Za tím účelem aplikujeme procedurální sémantiku Transparentní intenisonální logiky (TIL), která umožňuje rozlišovat tři druhy kontextu, ve kterém se může daný výraz vyskytovat, a to extensionální, intensionální a hyperintensionální. Definice tří druhů kontextu nám umožnila navrhnout extensionální logiku hyperintensí, ve které jsou všechna extensionální pravidla usuzování platná ve všech kontextech. Za druhé, tuto teorii využijeme k získávání inferenčních znalostí z explicitních znalostí zakódovaných v rozsáhlých bázích textů v přirozeném jazyce tak, aby systém poskytoval inteligentní odpovědi na otázky. [[BR]][[BR]]
     22 * '''Metodika a technologie pro tvorbu odborných tezaurů a slovníků pro potřeby rozvoje národní infrastruktury pro prostorové informace''' [https://www.muni.cz/vyzkum/projekty/41786 MUNI]
     23   * TA ČR TITIMV702
     24   * 1.5.2018 - 31.4.2020
     25   * Vytvořit obecnou metodiku a podpůrné technologie pro tvorbu, správu a využívání propojitelných odborných tezaurů a slovníků z oblasti rozvoje národní infrastruktury pro prostorové informace, s vazbou na existující nadnárodní tématické tezaury, s možností využití v dalších oblastech činnosti veřejné správy a to včetně revize a zdokonalení existujících národních slovníků a tezaurů s návrhem jejich společné koordinované správy. Výstupy tohoto projektu budou přímo navazovat na výsledky předcházejícího projektu "Terminologický tezaurus pro obor zeměměřictví a katastru nemovitostí". [[BR]][[BR]]
     26 * '''LINDAT/CLARIN - Výzkumná infrastruktura pro jazykové technologie''' [https://www.muni.cz/vyzkum/projekty/38551 MUNI]
     27   * MŠMT CZ.02.1.01/0.0/0.0/16_013/0001781
     28   * 1.1.2017 - 31.12.2020
     29   * Projekt navazuje na běžící projekt LINDAT-Clarin, který koncipován jako český „uzel“ mezinárodní sítě Clarin (Common Language Resources and Technology Infrastructure). Centrum LINDAT-Clarin bude tedy v českém jazykovém prostředí zaměřeno na sběr jazykových dat a především jejich anotaci (tj. formální manuální, poloautomatickou a automatickou jazykovou analýzu). Sběr a anotace budou probíhat v takovém rozsahu, kvalitě a technologické přípravě (specifikace, schémata, formáty), která bude přímo využitelná jak v humanitní oblasti (jazykovědný a mezioborový výzkum, kde přirozený jazyk hraje podstatnou roli), tak i pro výzkum a vývoj v oblasti jazykových technologií za použití moderních statistických a hybridních metod. Náplň práce centra a jeho výsledky se dotýkají žady oborů – v humanitních vědách to jsou jazykověda obecná a jazykověda zabývající se konkrétními jazyky, zejména češtinou, dále překladatelství, lexikografie, sociolingvistika, částečně i obory příbuzné (psychologie, sociologie, knihovnictví, neurovědy, cognitive science) s významným přechodem do informatiky (computer science, computational linguistics), matematiky (statistika a pravděpodobnost) a elektrotechniky (zpracování akustického signálu). [[BR]][[BR]]
     30 * '''Projekt LINDAT-Clarin - Vybudování a provoz českého uzlu pan-evropské infrastruktury pro výzkum (LINDAT-Clarin)''' [https://www.muni.cz/vyzkum/projekty/34244 MUNI]
     31   * MŠMT LM2015071
     32   * 1.1.2016 - 31.12.2019
     33   * Projekt LINDAT-Clarin je koncipován jako český „uzel“ mezinárodní sítě Clarin (Common Language Resources and Technology Infrastructure. Centrum LINDAT-Clarin bude tedy v českém jazykovém prostředí zaměřeno na sběr jazykových dat a především jejich anotaci (tj. formální manuální, poloautomatickou a automatickou jazykovou analýzu). Sběr a anotace budou probíhat v takovém rozsahu, kvalitě a technologické přípravě (specifikace, schémata, formáty), která bude přímo využitelná jak v humanitní oblasti (jazykovědný a mezioborový výzkum, kde přirozený jazyk hraje podstatnou roli), tak i pro výzkum a vývoj v oblasti jazykových technologií za použití moderních statistických a hybridních metod. Náplň práce centra a jeho výsledky se dotýkají řady oborů – v humanitních vědách to jsou jazykověda obecná a pro jazykověda zabývající se konkrétními jazyky, zejména češtinou, dále překladatelství, lexikografie, sociolingvistika, částečně i obory příbuzné (psychologie, sociologie, knihovnictví, neurovědy, cognitive science) s významným přesahem do informatiky (computer science, computational linguistics), matematiky (statistika a pravděpodobnost), a elektrotechniky (zpracování akustického signálu). [[BR]][[BR]]
     34 * '''Hyperintensionální logika pro analýzu přirozeného jazyka''' [https://www.muni.cz/vyzkum/projekty/31445 MUNI]
     35   * GA ČR GA15-13277S
     36   * 1.3.2015 - 31.12.2017
     37   * Projekt má jako hlavní cíl stanovenu počítačově podporovanou lingvisticko-logickou analýzu přirozeného jazyka, a to především češtiny a angličtiny. Navrhovaný projekt bude rozvíjet logický rámec Transparentní intensionální logiky (TIL), což je jeden z hlavních představitelů systémů procedurální sémantiky, a to zejména jeho aplikací v oblasti zpracování přirozeného jazyka, komunikace a usuzování. Dokončíme úspěšně nastartovaný projekt návrhu a vývoje inferenčního stroje pro TIL s využitím jeho komputační varianty, tj. funkcionálního programovacího jazyka TIL-Script. Projekt je interdisciplinární, neboť jsme přesvědčeni, že logická analýza jazyka musí navazovat na výsledky analýzy lingvistické. Proto bude do výzkumu zahrnuto využití nástrojů komputační lingvistiky, logiky, filosofie a informatiky. [[BR]][[BR]]
     38 * '''Rozhraní pro Linked Data v systému pro editaci slovníků DEB (DEB LDI)''' [https://www.muni.cz/vyzkum/projekty/32526 MUNI]
     39   * MŠMT LD15066
     40   * 1.10.2015 - 31.10.2017
     41   * V projektu budou navrženy a ověřovány nové postupy pro tvorbu celoevropského slovníkového portálu v souladu s metodikou Linked Open Data (otevřená propojená data), které umožní sdílení lexikografických vědeckých zdrojů mezi zapojenými výzkumnými institucemi a také veřejné zpřístupnění zdrojů pro další využití a výzkum. Součástí projektu bude také analýza a návrh inovativních technologií pro tvorbu lexikografických zdrojů s využitím údajů z rozsáhlých jazykových databází (korpusů) a analýza možností rozšíření vlastností elektronických slovníků pro zlepšení přístupnosti pro uživatele. [[BR]][[BR]]
     42 * '''Harvesting big text data for under-resourced languages''' [https://www.muni.cz/vyzkum/projekty/29084 MUNI]
     43   * MŠMT 7F14047
     44   * 1.6.2014 - 31.4.2017
     45   * Cílem projektu je získat z webu velká textová data (korpusy) pro jazyky s nedostatečnými zdroji, mezi něž patří norština, zčásti čeština a také některé etiopské jazyky (amharština, afaan oromština, tigrinština, somálština). Data budou anotována, parsována tak, aby byla použitelná pro různé aplikace v oblasti počítačového zpracování přirozeného jazyka, např. extrakce informací, strojový překlad a další. Konsorcium bude tvořeno jedním norským týmem (NTNU Trondheim a přidruženou Universitou v Oslo), které se budou věnovat zpracování vzniklých korpusů, a jedním českým týmem (MU Brno), který využije iiž svých existujících nástrojů pro budování korpusů z webu. Projekt bude koordinován brněnským týmem. Jedním cílem projektu bude vytvoření velkého norského korpusu čítajícího miliardy slovních tvarů s použitím nástrojů vyvinutých v rámci spolupráce s NTNU v EU projektu PRESEMT ("PRESEMT: Pattern REcognition-based Statistically Enhanced MT", 2010-2012). Za druhé, NTNU spolupracuje s Universitou v Oslo a dvěma etiopskými universitami v projektu na podporujícím budování jazykových zdrojů a fundovaném organizací Norad ("Linguistic Capacity Building – tools for the inclusive development of Ethiopia", NORHED 2013-2018). Je tedy přirozené propojit tyto aktivity a zahrnout zpracování čtyř velkých etiopských jazyků do předkládaného projektu: projekt HaBiT tak může podpořit a posílit projekt NORHED důkladným testováním technologií a tím adresovat témata evaluace a verifikace a také splnit společenskou výzvu pro informační technologie (ICT). Takto získáme relevantní přidanou hodnotu rovněž po politické stránce díky kooperaci s méně rozvinutou zemí. Za třetí, budou vytvořeny aplikace pro povrchové zpracování češtiny a norštiny a aspoň jednoho etiopského jazyka, umožňující vyčlenění a zkoumání mnohoznačnosti slov v korpusech, tj. indukci slovních významů a také tvorbu vícevektorových prostorů a paralelních multilinguálních prostorů pro desambiguaci významů slov při překladu. [[BR]][[BR]]
     46 * '''Vytvoření tezauru pro obor zeměměřictví a katastru nemovitostí''' [https://www.muni.cz/vyzkum/projekty/27184 MUNI]
     47   * TA ČR TB02CUZK004
     48   * 1.2.2014 - 31.12.2015
     49   * Vývoj systému pro správu vícejazyčného tezauru, který umožní editaci a prohlížení tezauru, včetně importu dat z tématických databází (slovník VÚGTK, RUIAN a další) a exportu dat v konfigurovatelném formátu s možností nastavení kritérií pro předávání informací. Součástí systému bude také webová služba pro publikaci obsahu tezauru dalším aplikacím podle popsaného rozhraní (s využitím standardů WSDL a REST JSON). [[BR]][[BR]]
     50 * '''Nový encyklopedický slovník češtiny online (Enc-Czech online)''' [https://www.muni.cz/vyzkum/projekty/13525 MUNI]
     51   * GA ČR GAP406/11/0294
     52   * 1.1.2011 - 31.12.2015 [[BR]][[BR]]
    1053 * '''Analýza přirozeného jazyka v prostředí internetu''' [http://www.isvav.cz/projectDetail.do?rowId=VF20102014003 isVaV]
    1154   * MV ČR VF20102014003
    1255   * 1.10.2010–31.12.2014
    1356   * Předmětem  veřejné zakázky je vyvinout a implementovat techniky zpracování  přirozeného jazyka umožňující analyzovat jazykové projevy na Internetu,  které spadají do působnosti českých bezpečnostních orgánů (neonacismu,  anarchismu, rasismu, terorismu) s důrazem na určování pravděpodobnosti  autorství textů. Předmětem zájmu bude veškerý webový obsah produkovaný  domácími i mezinárodními zájmovými skupinami nebo jednotlivci, tj.  webové adresy, fóra, chaty, blogy, sociální sítě a další zdroje. [[BR]][[BR]]
     57 * '''The European Digital Mathematics Library (EuDML)''' [https://www.muni.cz/vyzkum/projekty/10067 MUNI]
     58   * EU CIP 250503
     59   * 1.2.2013 - 31.1.2013
     60   * Cílem projektu EuDML The European Digital Mathematics Library je zpřístupnit převážnou část korpusu matematické odborné literatury publikované v Evropě on-line, ve formě autoritativního a udržitelného digitálního repozitáře, vytvořeného a spravovaného sítí institucí. Dosavadní národní aktivity vedly k digitalizaci velkých objemů matematické literatury, zejména partnery tohoto projektu. Vydavatelé produkují nový materiál, který je třeba bezpečně archivovat a v dlouhodobém výhledu učinit viditelným, použitelným, interoperabilním v setrvalém korpusu. V EuDML se partneři spojí dohromady s vúdčími poskytovateli technologií, v budování propojení svých kolekcí pro vytvoření sítě dokumentů integrovaných v Evropě v matematických disciplínách.
     61Zajistí budoucnost takto vytvořené virtuální knihovny vytvořením organizační a technické infrastruktury, která umožní spojit bohatá metadata a nové kolekce matematických dokumentů a budou vyvíjet úsilí cílené na `open access' zpřístupnění této literatury celé evropské komunitě, zajišťujíce Evropě vedení v poskytování, dostupnosti a využití digitálního matematického obsahu. Konsorcium EuDML navrhne a vybuduje rozšiřitelnou elektronickou službu, která zintegruje matematický obsah poskytovatelů implementací jednoho místa přístupu k heterogenním a vícejazyčným zdrojům. Síť dokumentů bude vytvořena sloučením a rozšířením informací dostupných o dokumentech z jednotlivých kolekcí, a kombinací referencí celé sloučené knihovny. V zájmu této přidané hodnoty držitelé copyrightu souhlasí s politikou `moving wall' pro budoucí otevřený přístup k plným textům. [[BR]][[BR]]
    1462 * '''LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat''' [http://www.isvav.cz/projectDetail.do?rowId=2C06009 isVaV]
    1563   * MŠMT LM2010013