__group__ ticket summary component version milestone type owner status created _changetime _description _reporter Active Tickets 9 CBLM článek na ACL 2015 component1 article Vít Baisa new 2012-03-04T14:48:11+01:00 2015-01-13T17:00:24+01:00 Deadline konec února Vít Baisa Active Tickets 36 Journal paper about SET publications article xkovar3 assigned 2016-04-21T17:33:32+02:00 2016-12-05T15:36:34+01:00 Jimp -- NLE or IEEE xkovar3 Active Tickets 3 NLP projekty stránka component1 enhancement Vít Baisa assigned 2012-02-24T15:02:11+01:00 2013-03-08T09:14:04+01:00 zpřehlednit stránku s nlp projekty NLP centra Vít Baisa Active Tickets 37 Journal paper about bushbank publications article xkovar3 assigned 2016-04-21T17:34:52+02:00 2016-12-05T15:42:00+01:00 "with Marek G. Jimp -- CL?" xkovar3 Active Tickets 46 submit HonzaR's and mine paper about authorship and syntax publications article xkovar3 assigned 2016-12-05T15:40:11+01:00 2016-12-05T15:41:21+01:00 "anywhere with impact, e.g. Jan Rygl 13:10 (1 minute ago) Transactions on Information Forensics & Security https://mc.manuscriptcentral.com/tifs-ieee " xkovar3 Active Tickets 22 Daniel Kahneman - Myšlení rychlé a pomalé NLPlab defect Vít Baisa new 2013-03-21T19:49:57+01:00 2013-03-21T19:49:57+01:00 Připravit referát a přednést na lab. semináři. Vít Baisa Active Tickets 35 Chyby a nejasnosti ve vyhodnocení u metod pro rozšiřování TM NLPlab defect Ales Horak new 2015-02-18T16:51:18+01:00 2015-02-18T16:51:18+01:00 "Například: Proč u segmentu 310 (2015-01-27---22-50-41/html/2015-01-27---22-50-41-clicking0.html) chybí překlad slova ""výskytu""? Odpověď: není tam kvůli metodě SUBSTITUTE (podrobněji při rozkliknutí překladu u této metody)" xbusta1 Active Tickets 42 error in parsing numbers in SET SET defect xkovar3 new 2016-04-25T16:50:21+02:00 2016-12-05T15:43:14+01:00 "reported by Michal Rott: Koukam, ze slovo ""let"" ve spojeni s cislem dela docela problemy. Alespon si to myslim. Koukni, prosim, na tyto vety: Hanusch vedl obec od 90. let jako starosta. Podle něj je současné sucho vůbec nejhorší od 50. let minulého století. Agent Savoj se vrátil po 35 letech do Roudnice. CIM Group uzavřela smlouvu na 20 let. Moje znalosti syntaktickych vztahu jsou na velmi uzke urovni, ale mam pocit, ze by to mohlo být trošku jinak. Michal" xkovar3 Active Tickets 44 punctuation detection and correction SET project xkovar3 new 2016-05-05T23:42:00+02:00 2016-12-05T15:52:21+01:00 "recent development: - punct. grammar improved by Machura - good evaluation by Zemkova - paper submitted to TSD, accepted, contains also comparison with tools from Liberec Next: - **retry with ASR data from Marek Boháč and compare with results of their automaton (in mails)** - use from normal SET grammar - semantic information? - more negative rules? - tune for ASR data? - create a nice demo page" xkovar3 Active Tickets 7 korpusy s koreferencí component1 task Vašek accepted 2012-02-29T00:09:37+01:00 2012-07-11T21:54:49+02:00 "Vyhledat a obstarat korpusy s anotovanou koreferencí.[[BR]] V úvahu připadají například: * EN: ARRAU, GNOME, Wolverhampton NP4E corpus * DE: !TüBa, PoCoS" Vašek Active Tickets 12 clanek o manatee do VLDB component1 task Miloš Jakubíček, xkovar3, pary new 2012-06-08T18:58:11+02:00 2012-10-19T16:39:01+02:00 "== Motto: effective evaluation of complex queries == (by showing that all other systems are slower -- at least for some queries) Outline: = Intro = == Large Corpora == == Linguistically motivated queries (grammar, sketches) == = Related Work = * CQP (reverse indices) * Davies (SQL) * WordSmith, AntConc * MapReduce from LREC * show weaknesses of those = Description = == Streaming Queries == * FastStream, RangeStream * Q*node overview , And/ORnode, ConcatNode in detail = Evaluation = * tenten, Brown, BNC = Applications = == sketches alias fast dependency parsing == * parser: 20 years, SkE: 4 days :) " Miloš Jakubíček Active Tickets 15 Upravit trac pro potřeby NLP centra component1 task xkocinc new 2013-03-08T08:49:29+01:00 2013-03-08T08:49:29+01:00 Styly, logotyp aj. Vít Baisa Active Tickets 23 Stephen E. Nadeau - The neural architecture of grammar NLPlab task Vít Baisa new 2013-03-21T19:50:52+01:00 2013-03-21T19:50:52+01:00 Připravit referát a přednést na semináři. Vít Baisa Active Tickets 24 Customizace stránek projektů na google code NLPlab task Vít Baisa new 2013-03-21T19:52:30+01:00 2013-03-21T19:55:21+01:00 Přidat na stránky onion, chared a justext logo a odkazy na NLP Centre. Propagovat. Vít Baisa Active Tickets 27 Tweak game Uhádni to slovo NLPlab task Vít Baisa new 2014-03-01T09:35:14+01:00 2014-03-01T09:35:14+01:00 "https://nlp.fi.muni.cz/projekty/uhadni_to_slovo/ Save statistics, filter variants of the hidden word (test, Test, TEST) etc." Vít Baisa Active Tickets 32 Úklid v adresáři projektu Rozšiřování TM NLPlab task xbusta1 new 2015-01-13T17:43:13+01:00 2015-01-28T10:02:27+01:00 "Uklidit v adresáři /nlp/projekty/skrivanek_nda: 1. vymazat generované soubory, které jsou nepotřebné (obzvlášť 2. uklidit v gitu (git status dává hodně nepěkný výstup) 3. nastavit u generovaných souborů v gitu .gitignore 4. promazat všechny nepotřebné soubory a vygenerovaná data Prostě pořádně uklidit. :)" Vít Baisa Active Tickets 39 Rewrite EFa SET task xkovar3 assigned 2016-04-21T18:20:30+02:00 2016-12-05T15:46:12+01:00 "so that I can manage it the semantic classification should conform to the instructions here: https://nlp.fi.muni.cz/trac/research/wiki/cs/ExtractionOfFactsGoldStandard sub-task (maybe it would be faster to do it first, before rewriting): Handle dates and MWEs (detected by Zuzka's tools) well (but I think there are much more stupid mistakes)" xkovar3 Active Tickets 45 automatic regression tests for SET SET task xkovar3 new 2016-05-06T01:40:45+02:00 2016-12-05T15:46:47+01:00 xkovar3 Active Tickets 38 paper in Nature publications article xkovar3 assigned 2016-04-21T17:41:04+02:00 2016-04-21T17:42:19+02:00 "with Pary Is the P vs NP an important question? Introduction - definice: P - v poly vypočtu, NP - v poly ověřím - P vs NP one of the most important problem in computer science - P ~ prakticky řešitelný - NP ~ neřešitelný - příklady z učebnic, soutěže, nejcitovanější práce, zejména uvádějící praktický dopad (bezpečnost na tom staví) - we show that P vs NP question is not important from any practical point Practicability/Scalability of Computing - is any P-algorithm practical? [only O(n^k) for k<=2, sometimes k<=1] - in many P-NP discussion, O(n^100) is mentioned not be a feasible complexity but is O(n^3) or O(n^2) OK? - It depends on the size of our problems - Does it depend on the MB or GB of data to process? - Only partially, it also depend on the size of one item Ex: 10 MPx picture -> n=10^7, -> n^2 = 10^14 - Price of one operation - CPU instruction - fast 2GB of RAM, scanning of the whole RAM (CRC) = seconds?? - going out of main memory - order of magnitude slower --> memory boundary - Moore's law - the difference is growing NP Completeness - reducibility of one problem to other, reduction alg in P - usually the size is growing in P, going out of memory - příklady: - složitosti + změna velikosti (n -> n^2) Practical Solutions of NP (Complete) Problems - probabilistic, heuristic - příklady Discussion/Conclusion * P does not mean practical * if P=NP - one NP complete is in P (even O(n^2)) then all NP problems are in P but due to non-linear reduction they are not practical * many NP problems are solvable in practise because of problem reformulation (not best solution but good enough, additional limits on input (metrics for distances)) " xkovar3 Active Tickets 40 SET can use phrasal tokens in rules directly SET enhancement xkovar3 assigned 2016-04-21T18:21:28+02:00 2016-04-21T18:23:34+02:00 xkovar3 Active Tickets 41 pipeline and web demo of SET for English and Slovak SET enhancement xkovar3 new 2016-04-25T13:34:52+02:00 2016-04-25T13:34:52+02:00 "desamb pre slovenčinu sa mi podarilo rozbehať tu /nlp/projekty/syntax_sk/desam/desam_sk. Dáva to však niekedy k? ako tag a neviem prísť na to prečo, pritom majka by mala poskytovať správne dáta (je to predsa len desamb a neviem či vôbec niekto vie ako to funguje :D) Pr: echo 'Zlý pes je veľké zviera' | /nlp/projekty/set/unitok.py --language=czech | ./desamb_sk 2>/dev/null ======== RFTagger mám tu /nlp/projekty/syntax_sk/RFTagger/slovak_annotation/annotate_sk.sh - momentalne neviem ako ho dostať do jednoduchej pipeline -> musím pozrieť ako sa to používa v sketchengine (dám vedieť keď to bude) Pr použitia ./annotate_sk.sh vert kde vert je výstup z echo 'Zlý pes je veľké zviera' | /nlp/projekty/set/unitok.py --language=czech -> lepší by bol však ešte asi tagsenteces ak sa vo vertikále nachádza viacero viet. Používa to totiž Milošov rftagger4vert a ten to tomu RFTaggeru sype po vetách . Slovenský SET (skgrammar.set) máš z mojej diplomky (netuším však ako dokonale je to spravené)." xkovar3 Active Tickets 43 Dělení titulků SET project xkovar3 new 2016-05-05T23:19:53+02:00 2016-07-29T15:01:10+02:00 "vyzkoušet na datech z Liberce === tak jsem se konečně dokopal k těm titulkům... dost oprav spočívalo ve změně textu, překlepů, nebo změně délky titulků (dělených v čárkách), což nás nezajímá. To co zbylo je v příloze... V podstatě zbyly jen větné útvary, které se automat dělil nevhodně a člověk to pak napravoval... což nás právě zajímá. K datům... je to utf-8, co oprava to řádek. Struktura je BEG *** aaa ===>>> bbb *** END BEG je společný začátek té věty , aaa je automatem rozdělený titulek, bbb je člověkem opravená verze, END je společný konec. Svislítka značí, kde byl ten titulek rozdělen pro zobrazení... čili v aaa je to ""špatný dělicí bod"", v bbb ""dobrý""... Pokud bys dokázal SETem označit dobré/špatné body bylo by to zajímavé... Na úvod jsem přemýšlel, jestli by nepomohly vazby typu přídavné jméno - podstatné jméno atd." xkovar3