| 1 | = MASARYKOVA UNIVERZITA V BRNĚ, FILOZOFICKÁ FAKULTA = |
| 2 | |
| 3 | == PLIN021 Sémantická analýza v praxi, projekt == |
| 4 | |
| 5 | Vypracovala: Stanislava Sedláčková (118285), semestr: jaro 2013 |
| 6 | |
| 7 | === Obsah === |
| 8 | |
| 9 | 1 Analýza dotazů 3 |
| 10 | 2 Podstata analýzy dotazů 4 |
| 11 | 2.1 Syntaktická analýza (parsing) a sémantická analýza 4 |
| 12 | 2.2 Přizpůsobení analýzy dotazů 5 |
| 13 | 2.3 Účelové relace (special-purpose relations) 6 |
| 14 | 3 Implementace pravidel v Prologu 7 |
| 15 | 4 Jádro dotazu a detekce LATu 8 |
| 16 | 4.1 Zlepšování detekce uvnitř dotazu 10 |
| 17 | 4.2 Extrakce LATů z kategorií 10 |
| 18 | 4.3 Spolehlivost odhadu LATu 11 |
| 19 | 4.4 Učící se LATy z předešlých dotazů v kategorii 11 |
| 20 | 4.5 Hodnocení 12 |
| 21 | 5 Klasifikace dotazů a detekce Qsekcí (QSections) 13 |
| 22 | 5.1 Klasifikace dotazů (Question Classification) 13 |
| 23 | 5.2 Metody pro zpracování speciální otázek (Special Questions) 17 |
| 24 | 5.2.1 Rozklad otázky a syntéza odpovědí 17 |
| 25 | 5.2.2 Omezení a slovní hříčky (constraints and puns) 18 |
| 26 | 5.2.3 Lexikální omezení 18 |
| 27 | 5.2.4 Omezující objekty (constraint objects) 18 |
| 28 | 5.2.5 Slovní hříčky 19 |
| 29 | 5.3 QSekce (QSections) 20 |
| 30 | 5.4 Hodnocení 21 |
| 31 | 6 Zdroje 23 |
| 32 | |
| 33 | === Abstrakt === |
| 34 | |
| 35 | Tato práce je založena na článcích IBM Výzkumného centra pro systém Watson zabývajícími analýzou dotazů systému Watson „Question analysis: How Watson reads a clue“ [1] a speciálními otázkami a metodami jejich analýzy: „Special questions and techniques [2]“. Práce může být rozsáhlejší kvůli uvádění konkrétních příkladů, nicméně bez jejich užití mi přišlo vykládání o metodách analýzy systému Watson nedostatečně srozumitelné. Z důvodu mé omezené znalosti odborné terminologie v dané oblasti raději uvádím při překladech v závorkách také originální anglické termíny. Stejně tak uvádím některé příkladové věty jak v češtině tak v angličtině, případně pouze v angličtině – nebylo-li v mých silách zaručit korektní překlad nebo kdy se jednalo o příklady příkazů v programovacím jazyce Prolog. |
| 36 | |
| 37 | Odkazy na další články zabývajícími se systémem Watson, které jsou volně přístupné online, uvádím na konci práce, v kapitole Zdroje. |
| 38 | |
| 39 | === Text práce === |
| 40 | |
| 41 | === 6 Zdroje === |
| 42 | |
| 43 | * [1] : Lally A. et al. Question analysis: How Watson reads a clue. IBM J. RES. & DEV. NO. 3/4. Paper 2. VOL. 56. May/July 2012. URL <http://researcher.watson.ibm.com/researcher/files/us-heq/W%28%2%20QUESTION%20ANALYSIS%2006177727.pdf>. Cit. 12.5.2013. |
| 44 | * [2] : Prager J.M. et al. Special Questions and techniques. IBM J. RES. & DEV. NO. 3/4. Paper 11. VOL. 56. May/July 2012. URL <http://researcher.watson.ibm.com/researcher/files/us-heq/W%2813%29%20SPECIAL%20QUESTIONS%2006177732.pdf>. Cit. 1.6.2013. |
| 45 | * [3] : Leccos – Gramém. URL<http://leccos.com/index.php/clanky/gramem>. Cit. 23.05.2013. |
| 46 | * [4] : Erhart, A. Úvod do jazykovědy. Brno: Masarykova Univerzita, 2001. 1. vyd. ISBN 8021026693 |
| 47 | * [5] : !McCord M.C. Slot Grammars. Association for Computational Linguistics. American Journal of Computational Linguistics. Number 1. Volume 6. January - March 1980. URL <http://acl.ldc.upenn.edu/J/J80/J80-1003.pdf>. Cit. 23.05.2013. |
| 48 | * [6] : !McCord M.C. Using Slot Grammar. New York: IBM Research Division. IBM Research Report. March 24, 2010. URL <http://domino.research.ibm.com/library/cyberdig.nsf/papers/FB5445D25B7E3932852576F10047E1C2/$File/rc23978revised.pdf>. Cit. 23.05.2013. |
| 49 | * [7] : Noun phrase. Wikipedia. 27 May 2013. URL <https://en.wikipedia.org/wiki/Noun_phrase>. Cit. 25.5.2013. |
| 50 | * [8] : Wh-pronoun. An Encyclopedia of Word Grammar and English Grammar. 2002. URL <http://www.phon.ucl.ac.uk/home/dick/enc2010/frames/frameset.htm>. Cit. 23.05.2013. |
| 51 | * [9] : Feature structure. Wikipedia. 11 March 2013. URL <https://en.wikipedia.org/wiki/Feature_structure>. Cit. 25.5.2013. |
| 52 | * [10 : Precision and recall. Wikipedia. 15 May 2013. URL <https://en.wikipedia.org/wiki/Precision_and_recall>. Cit. 1.6.2013. |
| 53 | * [11] : Sensitivity and specificity. Wikipedia. 31 May 2013. URL <https://en.wikipedia.org/wiki/Sensitivity_and_specificity>. Cit. 1.6.2013. |
| 54 | |
| 55 | |
| 56 | === Další zdroje o systému Watson: === |
| 57 | |
| 58 | * Deep Parsing in Watson: http://researcher.watson.ibm.com/researcher/files/us-heq/W(5)%20DEEP%20PARSING%2006177729.pdf |
| 59 | * Automatic knowledge extraction from documents: http://www.andrew.cmu.edu/user/ooo/watson/05%20automatic%20knowledge%20extration.pdf |
| 60 | * Typing candidate answers using type coercion: http://researcher.watson.ibm.com/researcher/files/us-heq/W(9)%20TYPE%20COERCION%2006177730.pdf |
| 61 | * Relation extraction and scoring in DeepQA: http://researcher.watson.ibm.com/researcher/files/us-heq/W(11)%20RELATION%20EXTRACTION%2006177734.pdf |
| 62 | * Structured data and inference in DeepQA: http://researcher.watson.ibm.com/researcher/files/us-heq/W(12)%20STRUCTURED%20DATA%2006177725.pdf |
| 63 | * Identifying implicit relationships: http://researcher.watson.ibm.com/researcher/files/us-heq/W(14)%20IMPLICIT%20RELATIONSHIPS%2006177721.pdf |
| 64 | * Fact-based question decomposition in DeepQA: http://researcher.watson.ibm.com/researcher/files/us-heq/W(15)%20QUESTION%20DECOMPOSITION%2006177726.pdf |
| 65 | * A framework for merging and and ranking of answers in DeepQA: http://www.andrew.cmu.edu/user/ooo/watson/14%20a%20framework%20for%20merging%20and%20ranking%20answers.pdf |
| 66 | * Making Watson fast: http://www.andrew.cmu.edu/user/ooo/watson/15%20making%20watson%20fast.pdf |