Changes between Version 1 and Version 2 of cs/GrantoveProjekty
- Timestamp:
- Feb 27, 2014, 3:07:54 PM (9 years ago)
Legend:
- Unmodified
- Added
- Removed
- Modified
-
cs/GrantoveProjekty
v1 v2 1 Členové Laboratoře zpracování přirozeného jazyka jsou spoluřešiteli následujících grantových projektů: 1 Členové Laboratoře zpracování přirozeného jazyka jsou spoluřešiteli následujících grantových projektů: 2 2 3 * '''Analýza přirozeného jazyka v prostředí internetu''' [http://www.isvav.cz/projectDetail.do?rowId=VF20102014003 isVaV] 3 * '''Analýza přirozeného jazyka v prostředí internetu''' [http://www.isvav.cz/projectDetail.do?rowId=VF20102014003 isVaV] 4 4 5 * MV ČR VF20102014003 6 * 1.10.2010–31.12.2014 5 7 6 * MV ČR VF201020140037 * 1.10.2010–31.12.20148 * Předmětem veřejné zakázky je vyvinout a implementovat techniky zpracování přirozeného jazyka umožňující analyzovat jazykové projevy na Internetu, které spadají do působnosti českých bezpečnostních orgánů (neonacismu, anarchismu, rasismu, terorismu) s důrazem na určování pravděpodobnosti autorství textů. Předmětem zájmu bude veškerý webový obsah produkovaný domácími i mezinárodními zájmovými skupinami nebo jednotlivci, tj. webové adresy, fóra, chaty, blogy, sociální sítě a další zdroje. [[BR]][[BR]] 9 * '''LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat''' [http://www.isvav.cz/projectDetail.do?rowId=2C06009 isVaV] 8 10 11 * MŠMT LM2010013 12 * 1.1.2010–31.12.2015 9 13 10 * P ředmětem veřejné zakázky je vyvinout a implementovat techniky zpracování přirozeného jazyka umožňující analyzovat jazykové projevy na Internetu, které spadají do působnosti českých bezpečnostních orgánů (neonacismu, anarchismu, rasismu, terorismu) s důrazem na určování pravděpodobnosti autorství textů. Předmětem zájmu bude veškerý webový obsah produkovaný domácími i mezinárodními zájmovými skupinami nebo jednotlivci, tj. webové adresy, fóra, chaty, blogy, sociální sítě a další zdroje.11 * ''' LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat''' [http://www.isvav.cz/projectDetail.do?rowId=2C06009 isVaV]14 * Projekt LINDAT-CLARIN je koncipován jako český uzel mezinárodní sítě Clarin (Common Language Resources and Technology Infrastructure, FP7-RI-2122230) a projektu META-NET (Technologies for the Multilingual European Information Society, NoE, 2011-2014, FP7-ICT-4-249119) pro volné sdílení jazykových dat a pokročilých technologií mezi institucemi a jednotlivci ve vědě a výzkumu. Tyto evropské projekty mají za cíl překážky volného přístupu k jazykovým datům postupně odstranit a umožnit národně distribuované, ale technologicky jednotné poskytování jazykových dat a souvisejících technologií všem zájemcům. V oblasti anotace dat je cílem projektu pořídit tato data v dostatečném rozsahu pro praktickou aplikaci statistického modelování jazyka jako nutnou podmínku pro aplikaci těchto modelů v praxi (korektory textu, automatický překlad, extrakce informací z textu, porozumění textu, dialogové systémy apod.). V oblasti distribuce dat je cílem poskytovat službu repozitáře pro úschovu, licencování a poskytování dat v rámci celoevropské sítě Clarin a META-SHARE (součást projektu META-NET). V oblasti technologické i v oblasti lidských zdrojů je cílem vybudování know-how v oblasti sběru, úschovy, tvorby a distribuce dat, které bude možno poskytovat i externím subjektům. Přitom je třeba vyškolit jazykové odborníky i odborníky z oblasti technologií (informatika, statistika, matematické modelování) tak, aby byli schopni v tomto výrazné mezioborovém projektu efektivně pracovat. Nezanedbatelným cílem projektu je vychovat další vědeckou generaci, která bude umět s jazykovými daty pracovat, správně je analyzovat a používat v národním i mezinárodním kontextu, a spolupracovat v rámci EU i mimo ni na budoucích projektech využívajících moderní jazykové technologie. [[BR]][[BR]] 15 * '''Temporální aspekty znalostí a informací''' [http://www.isvav.cz/projectDetail.do?rowId=GAP401%2F10%2F0792 isVaV] 12 16 17 * GA ČR P401/10/0792 18 * 1.1.2010–31.12.2012 13 19 14 * MŠMT LM2010013 15 * 1.1.2010–31.12.2015 20 * '''Pattern REcognition-based Statistically Enhanced MT – PRESEMT''' [http://www.isvav.cz/projectDetail.do?rowId=7E10057 isVaV] 16 21 22 * MŠMT 7E10057 23 * 1.1.2010–31.12.2012 17 24 18 * Projekt LINDAT-CLARIN je koncipován jako český uzel mezinárodní sítě Clarin (Common Language Resources and Technology Infrastructure, FP7-RI-2122230) a projektu META-NET (Technologies for the Multilingual European Information Society, NoE, 2011-2014, FP7-ICT-4-249119) pro volné sdílení jazykových dat a pokročilých technologií mezi institucemi a jednotlivci ve vědě a výzkumu. Tyto evropské projekty mají za cíl překážky volného přístupu k jazykovým datům postupně odstranit a umožnit národně distribuované, ale technologicky jednotné poskytování jazykových dat a souvisejících technologií všem zájemcům. V oblasti anotace dat je cílem projektu pořídit tato data v dostatečném rozsahu pro praktickou aplikaci statistického modelování jazyka jako nutnou podmínku pro aplikaci těchto modelů v praxi (korektory textu, automatický překlad, extrakce informací z textu, porozumění textu, dialogové systémy apod.). V oblasti distribuce dat je cílem poskytovat službu repozitáře pro úschovu, licencování a poskytování dat v rámci celoevropské sítě Clarin a META-SHARE (součást projektu META-NET). V oblasti technologické i v oblasti lidských zdrojů je cílem vybudování know-how v oblasti sběru, úschovy, tvorby a distribuce dat, které bude možno poskytovat i externím subjektům. Přitom je třeba vyškolit jazykové odborníky i odborníky z oblasti technologií (informatika, statistika, matematické modelování) tak, aby byli schopni v tomto výrazné mezioborovém projektu efektivně pracovat. Nezanedbatelným cílem projektu je vychovat další vědeckou generaci, která bude umět s jazykovými daty pracovat, správně je analyzovat a používat v národním i mezinárodním kontextu, a spolupracovat v rámci EU i mimo ni na budoucích projektech využívajících moderní jazykové technologie.19 * ''' Temporální aspekty znalostí a informací''' [http://www.isvav.cz/projectDetail.do?rowId=GAP401%2F10%2F0792 isVaV]25 * This proposal describes PRESEMT, a flexible and adaptable MT system, based on a language-independent method, whose principles ensure easy portability to new language pairs. This method attempts to overcome well-known problems of other MT approaches, e.g. bilingual corpora compilation or creation of new rules per language pair. PRESEMT will address the issue of effectively managing multilingual content and is expected to suggest a language-independent machine-learning-based methodology. The key aspects of PRESEMT involve syntactic phrase-based modelling, pattern recognition approaches (such as extended clustering or neural networks) or game theory techniques towards the development of a language-independent analysis, evolutionary algorithms for system optimisation. [[BR]][[BR]] 26 * '''Právní e-slovník - PES''' [http://www.isvav.cz/projectDetail.do?rowId=GA407%2F07%2F0679 isVaV] 20 27 28 * GA ČR 407/07/0679 29 * 1.1.2007–31.12.2011 21 30 22 * GA ČR P401/10/079223 * 1.1.2010–31.12.201231 * E-právní slovník představuje kombinaci klasického lexikálního slovníku se slovníkem kontextovým, doplněným základními vztahy mezi právními termíny. Cílem projektu je poskytnout právní i laické veřejnosti představu o lexikálním významu základních právních termínů v konfrontaci s jejich aktuálním užitím v právním řádu ČR. Výběr základních českých právních termínů je plně kompatibilní s právem EU. Projekt navazuje na dosavadní práce v oboru právní informatiky a počítačové lingvistiky v ČR a na jeho řešení se podílí ÚSP AV ČR, ÚJČ AV ČR a Fakulta informatiky MU Brno. [[BR]][[BR]] 32 * '''Centrum komputační lingvistiky''' [http://www.isvav.cz/projectDetail.do?rowId=LC536 isVaV] 24 33 34 * MŠMT LC536 35 * 1.2.2005–31.12.2011 25 36 26 * '''Pattern REcognition-based Statistically Enhanced MT – PRESEMT''' [http://www.isvav.cz/projectDetail.do?rowId=7E10057 isVaV] 37 * Předmětem činnosti Centra je společný teoretický výzkum v oboru počítačové (matematické) lingvistiky, a to zejména v oblasti kombinace zpracování psaného a mluveného jazyka, která bude podle našeho názoru této oblasti již v brzké době dominovat. Na tomto výzkumu budou těsně spolupracovat zakládající subjekty, které se v rámci svých Výzkumných záměrů a jiných výzkumných projektů zabývají různými aspekty zpracování přirozeného jazyka. Cílem Centra je prohloubit spolupráci zúčastněných subjektů a zefektivnit tak proces výzkumu v oblasti automatického zpracování přirozeného jazyka. Konkrétně se jedná o teoretické zpracování reprezentace promluv, propojení zpracování mluvené řeči a porozumění jazyku, strojový překlad, extrakce informací, generování jazyka a tvorba anotovaných korpusů a slovníků nezbytných pro řešení výše uvedených úloh. Výsledky Centra budou publikovány v oboru obvyklým způsobem; korpusy pak budou plně veřejně dostupné prostřednictvím světových distributorů lingvistických zdrojů. [[BR]][[BR]] 38 * '''Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce''' [http://www.isvav.cz/projectDetail.do?rowId=2C06009 isVaV] 27 39 40 * MŠMT 2C06009 41 * 1.7.2006–31.12.2010 28 42 29 * MŠMT 7E1005730 * 1.1.2010–31.12.201243 * Vypracovat komplexní systém metodických a implementačních nástrojů na bázi inteligentních agentů pro vytváření uživatelsky přívětivých rozhraní k sémantickému webu umožňující, aby komunikace s uživatelem probíhala v přirozeném jazyce a též zpracovávaná data měla převážně charakter vět, resp. promluv, přirozeného jazyka. Dalším cílem pak je ověření funkčních vlastností navržených nástrojů na vhodně zvolené aplikaci. [[BR]][[BR]] 44 * '''Inteligentní metody pro zvýšení spolehlivosti elektrických sítí''' [http://www.isvav.cz/projectDetail.do?rowId=1ET100300414 isVaV] 31 45 46 * AV ČR T100300414 47 * 1. 7. 2004–31. 12. 2008 32 48 33 * This proposal describes PRESEMT, a flexible and adaptable MT system, based on a language-independent method, whose principles ensure easy portability to new language pairs. This method attempts to overcome well-known problems of other MT approaches, e.g. bilingual corpora compilation or creation of new rules per language pair. PRESEMT will address the issue of effectively managing multilingual content and is expected to suggest a language-independent machine-learning-based methodology. The key aspects of PRESEMT involve syntactic phrase-based modelling, pattern recognition approaches (such as extended clustering or neural networks) or game theory techniques towards the development of a language-independent analysis, evolutionary algorithms for system optimisation.34 * ''' Právní e-slovník - PES''' [http://www.isvav.cz/projectDetail.do?rowId=GA407%2F07%2F0679 isVaV]49 * Hlavním cílem výzkumného projektu je zvýšení bezpečnosti a spolehlivosti chodu elektroenergetické soustavy rozvojem nových inteligentních metod. Vlice aktuální je rovněž snížení rizika black - out v České republice. Problematika spolehlivosti elektrických rozvodných soustav je na fakultě elektrotechniky a informatiky úspěšně řešena několik let. Vzniklo zde celostátní výzkumné pracoviště pro tvorbu a kategorizaci databáze poruch rozvodných zařízení a výpadků dodávky elektrické energie. Z celé České republiky a ze Slovenska jsou zasílány informace z jednotlivých regionálních distribučních společností a vytváří se tak objektivně vypovídající prostředí pro výpočty spolehlivosti rozvodných systémů. [[BR]][[BR]] 50 * '''Jazyková poradna na internetu''' [http://www.isvav.cz/projectDetail.do?rowId=1ET200610406 isVaV] 35 51 52 * AV ČR T200610406 53 * 1. 7. 2004–31. 12. 2008 36 54 37 * GA ČR 407/07/067938 * 1.1.2007–31.12.201155 * Cílem projektu je vytvořit první internetovou příručku českého jazyka tak, aby dosavadní (tradiční, ceněné, ale dnes již příliš se rozrůstající, časově neúnosně náročné) služby jazykové poradny Ústavu pro jazyk český AV ČR mohly být poskytovány primárně elektronickou cestou. Příručka bude obsahovat všestranné, rozsáhlé, databázově uspořádané údaje a poučení o češtině, které umožní tazatelům vyhledávat odpovědi na jazykové otázky samostatně, co nejjednodušším a pohodlným způsobem, v širokých věcných souvislostech a bez časových prodlev. Jazykovědci shromáždí potřebná jazyková data, jazykoví inženýři zformulují a ověří optimální vyhledávací programy. Takto vytvořená příručka bude mít řadu předností. Bude k dispozici nejširší laické i odborné veřejnosti domácí i uživatelům češtiny v zahraničí, bude možno ji nepřetržitě doplňovat o nové informace v souladu s aktuálními zájmy a problémy tazatelů i s vývojem jazykových norem a přinese podstatné zefektivnění poradenské činnosti. 56 * výsledek je [http://prirucka.ujc.cas.cz/ Internetová jazyková příručka] 39 57 58 * '''Inteligentní modely, algoritmy, metody a nástroje pro vytváření sémantického webu''' [http://www.isvav.cz/projectDetail.do?rowId=1ET100300419 isVaV] 40 59 41 * E-právní slovník představuje kombinaci klasického lexikálního slovníku se slovníkem kontextovým, doplněným základními vztahy mezi právními termíny. Cílem projektu je poskytnout právní i laické veřejnosti představu o lexikálním významu základních právních termínů v konfrontaci s jejich aktuálním užitím v právním řádu ČR. Výběr základních českých právních termínů je plně kompatibilní s právem EU. Projekt navazuje na dosavadní práce v oboru právní informatiky a počítačové lingvistiky v ČR a na jeho řešení se podílí ÚSP AV ČR, ÚJČ AV ČR a Fakulta informatiky MU Brno.42 * '''Centrum komputační lingvistiky''' [http://www.isvav.cz/projectDetail.do?rowId=LC536 isVaV]60 * AV ČR 1ET100300419 61 * 1. 7. 2004–31. 12. 2008 43 62 63 * Předkládaný projekt je projektem teoretického i praktického charakteru. Jeho cílem je zkoumat a rozvíjet teoretické základy sémantického webu, a následně aplikovat a experimentálně ověřit vybrané metody soft computingu v této oblasti. Výzkumné práce se soustředí hlavně na výpočetní modely a formální kalkuly reprezentace znalostí, její extrakci, manipulaci a učení, založené na fuzzy logice, neuronových sítích, genetických algoritmech, agentové technologii a pokročilé databázové teorii, s využitím speciálně v kontextu extrakce znalostí z dat. V souladu s celkovou orientaci projektu jeho očekávané výsledky budou následující: 64 * teoretické práce publikované v mezinárodních časopisech a prezentované na mezinárodních konferencích 65 * nové algoritmy pro extrakci znalostí z dat 66 * prototypové implementace těchto algoritmů v rámci multiagentního systému. 67 * Jádrem řešitelského kolektivu je 12 klíčových vědeckých pracovníků ze tří pracovišť a doplňuje ho 11 doktorandů. [[BR]][[BR]] 68 * '''Integrované centrum počítačového zpracování přirozeného jazyka''' 44 69 45 * MŠMT LC536 46 * 1. 2.2005–31.12.201170 * MŠMT LC536 71 * 1. 1. 2005–31. 12. 2009 47 72 73 * '''Překlad českých vět na konstrukce transparentní intenzionální logiky''' [http://www.isvav.cz/projectDetail.do?rowId=GA201%2F05%2F2781 isVaV] 48 74 49 * Předmětem činnosti Centra je společný teoretický výzkum v oboru počítačové (matematické) lingvistiky, a to zejména v oblasti kombinace zpracování psaného a mluveného jazyka, která bude podle našeho názoru této oblasti již v brzké době dominovat. Na tomto výzkumu budou těsně spolupracovat zakládající subjekty, které se v rámci svých Výzkumných záměrů a jiných výzkumných projektů zabývají různými aspekty zpracování přirozeného jazyka. Cílem Centra je prohloubit spolupráci zúčastněných subjektů a zefektivnit tak proces výzkumu v oblasti automatického zpracování přirozeného jazyka. Konkrétně se jedná o teoretické zpracování reprezentace promluv, propojení zpracování mluvené řeči a porozumění jazyku, strojový překlad, extrakce informací, generování jazyka a tvorba anotovaných korpusů a slovníků nezbytných pro řešení výše uvedených úloh. Výsledky Centra budou publikovány v oboru obvyklým způsobem; korpusy pak budou plně veřejně dostupné prostřednictvím světových distributorů lingvistických zdrojů.50 * '''Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce''' [http://www.isvav.cz/projectDetail.do?rowId=2C06009 isVaV]75 * GAČR 201/05/2781 76 * 1. 1. 2005–31. 12. 2007 51 77 78 * Hlavním cílem navrhovaného projektu je získání automatického systému pro zpracování textů v přirozeném jazyce (češtině) a tvorbu logické reprezentace věty ve strojově čitelné formě. Získaný logický popis bude bezprostředně využit k reprezentaci znalostí v prostředí sémantického webu. 79 * Realizace projektu spočívá v implementaci algoritmu normální translace (NTA) pro vymezenou část češtiny s cílem pokrýt většinu nejfrekventovanějších gramatických jevů. Algoritmus NTA se skládá ze dvou spolupracujících částí - efektivního syntaktického analyzátoru vět přirozeného jazyka a logické analýzy věty pomocí transparentní intenzionální logiky (TIL) jako systému temporální logiky vyššího řádu s hierarchií typů. Jako součást projektu bude vytvořen i nástroj pro testování nalezených konstrukcí TILu. Takto bude položen základ pro automatický odpovídací systém na bázi sémantického webu. [[BR]][[BR]] 80 * '''Velké jazykové korpusy a jejich automatická analýza''' [http://www.isvav.cz/projectDetail.do?rowId=GA405%2F03%2F0913 isVaV] 52 81 53 * MŠMT 2C06009 54 * 1.7.2006–31.12.2010 82 * GAČR 405/03/0913 83 * 1. 1. 2003–31. 12. 2005 [[BR]] 84 * Jazykové korpusy jsou nezastupitelnou součástí lingvistického výzkumu. Používají se za různým účelem, od jednoduchého vyhledávání daných slov až po přímé využití pro tzv. trénování v metodách automatického strojového učení; tyto metody se používají např.pro pravděpodobnostní jazykové modelování či automatickou počítačovou analýzu vět přirozeného jazyka. Použitelnost a užitečnost jazykových textových a řečových korpusů (včetně vícejazyčných) je umocněna jejich lingvistickou analýzou (anotováním). Anotacemůže odrážet jak formu, strukturu i funkci jazykových jednotek obsažených v anotovaném textu.Základním cílem projektu je obohatit naše dosavadní znalosti o jazykovém systému obecně a češtině zvlášť, a to ve smyslu vyvinutí takových metod (zejména metodstatistického strojového učení a metod symbolických, a jejich kombinací), aby bylo možno s vysokou přesností analyzovat velké jazykové korpusy jak psaného, tak mluveného textu. Bude se přitom využívat výsledků dosažené v předchozích projektech a grantech. 55 85 86 Starší projekty 56 87 57 * Vypracovat komplexní systém metodických a implementačních nástrojů na bázi inteligentních agentů pro vytváření uživatelsky přívětivých rozhraní k sémantickému webu umožňující, aby komunikace s uživatelem probíhala v přirozeném jazyce a též zpracovávaná data měla převážně charakter vět, resp. promluv, přirozeného jazyka. Dalším cílem pak je ověření funkčních vlastností navržených nástrojů na vhodně zvolené aplikaci. 58 * '''Inteligentní metody pro zvýšení spolehlivosti elektrických sítí''' [http://www.isvav.cz/projectDetail.do?rowId=1ET100300414 isVaV] 88 * '''BalkaNet - Návrh a tvorba vícejazyčného balkánského WordNetu''' 59 89 90 * Účastníci: Univerzita v Patrasu, Institut počítačových technologií, Univerzita Alexandru Ioan Cuza, Římská akademie, Bulharská akademie věd, Univerzita Sabanci, Masarykova univerzita, Memodata, Univerzita v Plovdiv, Athenská univerzita 91 * Hlavní řešitel z FI: [http://is.muni.cz/lide/?uco=455 doc. PhDr. Karel Pala Csc.] ([mailto:pala@fi.muni.cz]) 60 92 61 * AV ČR T100300414 62 * 1. 7. 2004–31. 12. 2008 93 * Poskytovatel: Komise evropského společenství 94 * Doba trvání: 36 měsíců 95 * Poznámka: shrnutí tohoto projektu je dostupné na adrese: http://www.ceid.upatras.gr/Balkanet/ 63 96 97 * '''VS97028 - Laboratoř zpracování přirozeného jazyka''' [http://www.isvav.cz/projectDetail.do?rowId=VS97028 isVaV] 98 * Hlavní řešitel: [http://is.muni.cz/lide/?uco=455 doc. PhDr. Karel Pala, CSc.] ([mailto:pala@fi.muni.cz]) 99 * Poskytovatel: Ministerstvo školství, mládeže a tělovýchovy ČR 100 * Datum zahájení: 1. ledna 1998 101 * Doba trvání: 3 roky 102 * Zpráva k závěrečné oponentuře (2000): [http://nlp.fi.muni.cz/cs/Grantove_projekty?action=AttachFile&do=view&target=vs97028.doc doc], [http://nlp.fi.muni.cz/cs/Grantove_projekty?action=AttachFile&do=view&target=vs97028.rtf rtf], [http://nlp.fi.muni.cz/nlp/files/vs97028.htm htm], [http://nlp.fi.muni.cz/cs/Grantove_projekty?action=AttachFile&do=view&target=vs97028.txt txt], 103 * Poznámka: grantový projekt, na jehož základě vznikla [http://nlp.fi.muni.cz/cs/nlplab Laboratoř zpracování přirozeného jazyka] 64 104 65 * Hlavním cílem výzkumného projektu je zvýšení bezpečnosti a spolehlivosti chodu elektroenergetické soustavy rozvojem nových inteligentních metod. Vlice aktuální je rovněž snížení rizika black - out v České republice. Problematika spolehlivosti elektrických rozvodných soustav je na fakultě elektrotechniky a informatiky úspěšně řešena několik let. Vzniklo zde celostátní výzkumné pracoviště pro tvorbu a kategorizaci databáze poruch rozvodných zařízení a výpadků dodávky elektrické energie. Z celé České republiky a ze Slovenska jsou zasílány informace z jednotlivých regionálních distribučních společností a vytváří se tak objektivně vypovídající prostředí pro výpočty spolehlivosti rozvodných systémů. 66 * '''Jazyková poradna na internetu''' [http://www.isvav.cz/projectDetail.do?rowId=1ET200610406 isVaV] 105 * '''405/96/K214 - Čeština ve věku počítačů''' [http://www.isvav.cz/projectDetail.do?rowId=GV405%2F96%2FK214 isVaV] 106 * Hlavní řešitel z FI: [http://is.muni.cz/lide/?uco=455 doc. PhDr. Karel Pala, CSc.] ([mailto:pala@fi.muni.cz]) 107 * Poskytovatel: Grantová agentura ČR 108 * Datum zahájení: 1. ledna 1996 109 * Doba trvání: 6 let 110 * Dílčí zpráva o řešení za rok 2000: [http://nlp.fi.muni.cz/cs/Grantove_projekty?action=AttachFile&do=view&target=k214.doc doc], [http://nlp.fi.muni.cz/cs/Grantove_projekty?action=AttachFile&do=view&target=k214.rtf rtf], [http://nlp.fi.muni.cz/nlp/files/k214.htm htm], [http://nlp.fi.muni.cz/cs/Grantove_projekty?action=AttachFile&do=view&target=k214.txt txt], 111 * Poznámka: nositelem grantu je ÚFAL MFF UK, členové Laboratoře zpracování přirozeného jazyka se podílejí na řešeních některých dílčích úkolů (viz zpráva)[[BR]] 112 * '''LE4-8328 - EuroWordNet 2''' 113 * Hlavní řešitel z FI: [http://is.muni.cz/lide/?uco=455 doc. PhDr. Karel Pala, CSc.] ([mailto:pala@fi.muni.cz]) 114 * Poskytovatel: Evropská unie v rámci 5. rámcového programu na podporu výzkumu a rozvoje 115 * Datum zahájení: 1. dubna 1998 116 * Doba trvání: 15 měsíců 117 * Závěrečná zpráva (1999): [http://nlp.fi.muni.cz/cs/Grantove_projekty?action=AttachFile&do=view&target=ewn_cz.ps ps], [http://nlp.fi.muni.cz/cs/Grantove_projekty?action=AttachFile&do=view&target=ewn_cz.doc doc], [http://nlp.fi.muni.cz/cs/Grantove_projekty?action=AttachFile&do=view&target=ewn_cz.rtf rtf], [http://nlp.fi.muni.cz/nlp/files/ewn_cz.htm htm], [http://nlp.fi.muni.cz/cs/Grantove_projekty?action=AttachFile&do=view&target=ewn_cz.txt txt] 118 * Poznámka: souhrnné informace o řešení celého projektu lze nalézt na adrese [http://www.hum.uva.nl/%7Eewn/ http://www.hum.uva.nl/~ewn/] 67 119 120 * '''FRVŠ 0408/99 - Sémantická analýza přirozeného jazyka''' 121 * Řešitelé: [http://is.muni.cz/lide/?uco=1648 Mgr. Aleš Horák] ([mailto:hales@fi.muni.cz]), [http://is.muni.cz/lide/?uco=976 Mgr. Leo Hadacz] ([mailto:hadacz@fi.muni.cz]) 122 * Poskytovatel: Ministerstvo školství, mládeže a tělovýchovy ČR 123 * Datum zahájení: 1. ledna 1999 124 * Doba trvání: 1 rok 125 * Závěrečná zpráva (1999): [http://nlp.fi.muni.cz/cs/Grantove_projekty?action=AttachFile&do=view&target=semanal.ps ps] 68 126 69 * AV ČR T200610406 70 * 1. 7. 2004–31. 12. 2008 71 72 73 * Cílem projektu je vytvořit první internetovou příručku českého jazyka tak, aby dosavadní (tradiční, ceněné, ale dnes již příliš se rozrůstající, časově neúnosně náročné) služby jazykové poradny Ústavu pro jazyk český AV ČR mohly být poskytovány primárně elektronickou cestou. Příručka bude obsahovat všestranné, rozsáhlé, databázově uspořádané údaje a poučení o češtině, které umožní tazatelům vyhledávat odpovědi na jazykové otázky samostatně, co nejjednodušším a pohodlným způsobem, v širokých věcných souvislostech a bez časových prodlev. Jazykovědci shromáždí potřebná jazyková data, jazykoví inženýři zformulují a ověří optimální vyhledávací programy. Takto vytvořená příručka bude mít řadu předností. Bude k dispozici nejširší laické i odborné veřejnosti domácí i uživatelům češtiny v zahraničí, bude možno ji nepřetržitě doplňovat o nové informace v souladu s aktuálními zájmy a problémy tazatelů i s vývojem jazykových norem a přinese podstatné zefektivnění poradenské činnosti. 74 * výsledek je [http://prirucka.ujc.cas.cz/ Internetová jazyková příručka] 75 76 77 * '''Inteligentní modely, algoritmy, metody a nástroje pro vytváření sémantického webu''' [http://www.isvav.cz/projectDetail.do?rowId=1ET100300419 isVaV] 78 79 80 * AV ČR 1ET100300419 81 * 1. 7. 2004–31. 12. 2008 82 83 84 * Předkládaný projekt je projektem teoretického i praktického charakteru. Jeho cílem je zkoumat a rozvíjet teoretické základy sémantického webu, a následně aplikovat a experimentálně ověřit vybrané metody soft computingu v této oblasti. Výzkumné práce se soustředí hlavně na výpočetní modely a formální kalkuly reprezentace znalostí, její extrakci, manipulaci a učení, založené na fuzzy logice, neuronových sítích, genetických algoritmech, agentové technologii a pokročilé databázové teorii, s využitím speciálně v kontextu extrakce znalostí z dat. V souladu s celkovou orientaci projektu jeho očekávané výsledky budou následující: 85 * teoretické práce publikované v mezinárodních časopisech a prezentované na mezinárodních konferencích 86 * nové algoritmy pro extrakci znalostí z dat 87 * prototypové implementace těchto algoritmů v rámci multiagentního systému. 88 * Jádrem řešitelského kolektivu je 12 klíčových vědeckých pracovníků ze tří pracovišť a doplňuje ho 11 doktorandů. 89 * '''Integrované centrum počítačového zpracování přirozeného jazyka''' 90 91 92 * MŠMT LC536 93 * 1. 1. 2005–31. 12. 2009 94 95 96 * '''Překlad českých vět na konstrukce transparentní intenzionální logiky''' [http://www.isvav.cz/projectDetail.do?rowId=GA201%2F05%2F2781 isVaV] 97 98 99 * GAČR 201/05/2781 100 * 1. 1. 2005–31. 12. 2007 101 102 103 * Hlavním cílem navrhovaného projektu je získání automatického systému pro zpracování textů v přirozeném jazyce (češtině) a tvorbu logické reprezentace věty ve strojově čitelné formě. Získaný logický popis bude bezprostředně využit k reprezentaci znalostí v prostředí sémantického webu. 104 * Realizace projektu spočívá v implementaci algoritmu normální translace (NTA) pro vymezenou část češtiny s cílem pokrýt většinu nejfrekventovanějších gramatických jevů. Algoritmus NTA se skládá ze dvou spolupracujících částí - efektivního syntaktického analyzátoru vět přirozeného jazyka a logické analýzy věty pomocí transparentní intenzionální logiky (TIL) jako systému temporální logiky vyššího řádu s hierarchií typů. Jako součást projektu bude vytvořen i nástroj pro testování nalezených konstrukcí TILu. Takto bude položen základ pro automatický odpovídací systém na bázi sémantického webu. 105 * '''Velké jazykové korpusy a jejich automatická analýza''' [http://www.isvav.cz/projectDetail.do?rowId=GA405%2F03%2F0913 isVaV] 106 107 108 * GAČR 405/03/0913 109 * 1. 1. 2003–31. 12. 2005 110 111 112 * Jazykové korpusy jsou nezastupitelnou součástí lingvistického výzkumu. Používají se za různým účelem, od jednoduchého vyhledávání daných slov až po přímé využití pro tzv. trénování v metodách automatického strojového učení; tyto metody se používají např.pro pravděpodobnostní jazykové modelování či automatickou počítačovou analýzu vět přirozeného jazyka. Použitelnost a užitečnost jazykových textových a řečových korpusů (včetně vícejazyčných) je umocněna jejich lingvistickou analýzou (anotováním). Anotacemůže odrážet jak formu, strukturu i funkci jazykových jednotek obsažených v anotovaném textu.Základním cílem projektu je obohatit naše dosavadní znalosti o jazykovém systému obecně a češtině zvlášť, a to ve smyslu vyvinutí takových metod (zejména metodstatistického strojového učení a metod symbolických, a jejich kombinací), aby bylo možno s vysokou přesností analyzovat velké jazykové korpusy jak psaného, tak mluveného textu. Bude se přitom využívat výsledků dosažené v předchozích projektech a grantech. 113 114 Starší projekty 115 116 * '''BalkaNet - Návrh a tvorba vícejazyčného balkánského WordNetu''' 117 118 119 * Účastníci: Univerzita v Patrasu, Institut počítačových technologií, Univerzita Alexandru Ioan Cuza, Římská akademie, Bulharská akademie věd, Univerzita Sabanci, Masarykova univerzita, Memodata, Univerzita v Plovdiv, Athenská univerzita 120 * Hlavní řešitel z FI: [http://is.muni.cz/lide/?uco=455 doc. PhDr. Karel Pala Csc.] ([mailto:pala@fi.muni.cz]) 121 122 123 * Poskytovatel: Komise evropského společenství 124 * Doba trvání: 36 měsíců 125 * Poznámka: shrnutí tohoto projektu je dostupné na adrese: http://www.ceid.upatras.gr/Balkanet/ 126 127 128 * '''VS97028 - Laboratoř zpracování přirozeného jazyka''' [http://www.isvav.cz/projectDetail.do?rowId=VS97028 isVaV] 129 130 131 * Hlavní řešitel: [http://is.muni.cz/lide/?uco=455 doc. PhDr. Karel Pala, CSc.] ([mailto:pala@fi.muni.cz]) 132 133 134 * Poskytovatel: Ministerstvo školství, mládeže a tělovýchovy ČR 135 * Datum zahájení: 1. ledna 1998 136 * Doba trvání: 3 roky 137 * Zpráva k závěrečné oponentuře (2000): [http://nlp.fi.muni.cz/cs/Grantove_projekty?action=AttachFile&do=view&target=vs97028.doc doc], [http://nlp.fi.muni.cz/cs/Grantove_projekty?action=AttachFile&do=view&target=vs97028.rtf rtf], [http://nlp.fi.muni.cz/nlp/files/vs97028.htm htm], [http://nlp.fi.muni.cz/cs/Grantove_projekty?action=AttachFile&do=view&target=vs97028.txt txt], 138 139 140 * Poznámka: grantový projekt, na jehož základě vznikla [http://nlp.fi.muni.cz/cs/nlplab Laboratoř zpracování přirozeného jazyka] 141 142 143 * '''405/96/K214 - Čeština ve věku počítačů''' [http://www.isvav.cz/projectDetail.do?rowId=GV405%2F96%2FK214 isVaV] 144 145 146 * Hlavní řešitel z FI: [http://is.muni.cz/lide/?uco=455 doc. PhDr. Karel Pala, CSc.] ([mailto:pala@fi.muni.cz]) 147 148 149 * Poskytovatel: Grantová agentura ČR 150 * Datum zahájení: 1. ledna 1996 151 * Doba trvání: 6 let 152 * Dílčí zpráva o řešení za rok 2000: [http://nlp.fi.muni.cz/cs/Grantove_projekty?action=AttachFile&do=view&target=k214.doc doc], [http://nlp.fi.muni.cz/cs/Grantove_projekty?action=AttachFile&do=view&target=k214.rtf rtf], [http://nlp.fi.muni.cz/nlp/files/k214.htm htm], [http://nlp.fi.muni.cz/cs/Grantove_projekty?action=AttachFile&do=view&target=k214.txt txt], 153 154 155 * Poznámka: nositelem grantu je ÚFAL MFF UK, členové Laboratoře zpracování přirozeného jazyka se podílejí na řešeních některých dílčích úkolů (viz zpráva) 156 * '''LE4-8328 - EuroWordNet 2''' 157 158 159 * Hlavní řešitel z FI: [http://is.muni.cz/lide/?uco=455 doc. PhDr. Karel Pala, CSc.] ([mailto:pala@fi.muni.cz]) 160 161 162 * Poskytovatel: Evropská unie v rámci 5. rámcového programu na podporu výzkumu a rozvoje 163 * Datum zahájení: 1. dubna 1998 164 * Doba trvání: 15 měsíců 165 * Závěrečná zpráva (1999): [http://nlp.fi.muni.cz/cs/Grantove_projekty?action=AttachFile&do=view&target=ewn_cz.ps ps], [http://nlp.fi.muni.cz/cs/Grantove_projekty?action=AttachFile&do=view&target=ewn_cz.doc doc], [http://nlp.fi.muni.cz/cs/Grantove_projekty?action=AttachFile&do=view&target=ewn_cz.rtf rtf], [http://nlp.fi.muni.cz/nlp/files/ewn_cz.htm htm], [http://nlp.fi.muni.cz/cs/Grantove_projekty?action=AttachFile&do=view&target=ewn_cz.txt txt] 166 167 168 * Poznámka: souhrnné informace o řešení celého projektu lze nalézt na adrese [http://www.hum.uva.nl/%7Eewn/ http://www.hum.uva.nl/~ewn/] 169 170 171 * '''FRVŠ 0408/99 - Sémantická analýza přirozeného jazyka''' 172 173 174 * Řešitelé: [http://is.muni.cz/lide/?uco=1648 Mgr. Aleš Horák] ([mailto:hales@fi.muni.cz]), [http://is.muni.cz/lide/?uco=976 Mgr. Leo Hadacz] ([mailto:hadacz@fi.muni.cz]) 175 176 177 * Poskytovatel: Ministerstvo školství, mládeže a tělovýchovy ČR 178 * Datum zahájení: 1. ledna 1999 179 * Doba trvání: 1 rok 180 * Závěrečná zpráva (1999): [http://nlp.fi.muni.cz/cs/Grantove_projekty?action=AttachFile&do=view&target=semanal.ps ps] 181 182 183 * '''201/99/D028 - Syntaktická analýza přirozeného jazyka''' [http://www.isvav.cz/projectDetail.do?rowId=GA201%2F99%2FD028 isVaV] 184 185 186 * Řešitel: [http://is.muni.cz/lide/?uco=1297 RNDr. Pavel Smrž, Ph.D.] ([mailto:smrz@fi.muni.cz]) 187 188 189 * Poskytovatel: Grantová agentura ČR 190 * Datum zahájení: 1. září 1999 191 * Doba trvání: 3 roky 127 * '''201/99/D028 - Syntaktická analýza přirozeného jazyka''' [http://www.isvav.cz/projectDetail.do?rowId=GA201%2F99%2FD028 isVaV] 128 * Řešitel: [http://is.muni.cz/lide/?uco=1297 RNDr. Pavel Smrž, Ph.D.] ([mailto:smrz@fi.muni.cz]) 129 * Poskytovatel: Grantová agentura ČR 130 * Datum zahájení: 1. září 1999 131 * Doba trvání: 3 roky 192 132 * Dílčí zpráva o řešení za rok 2000: [http://nlp.fi.muni.cz/cs/Grantove_projekty?action=AttachFile&do=view&target=syntanal.doc doc], [http://nlp.fi.muni.cz/cs/Grantove_projekty?action=AttachFile&do=view&target=syntanal.rtf rtf], [http://nlp.fi.muni.cz/nlp/files/syntanal.htm htm], [http://nlp.fi.muni.cz/cs/Grantove_projekty?action=AttachFile&do=view&target=syntanal.txt txt],