Changes between Version 39 and Version 40 of cs/MainTopics
- Timestamp:
- Apr 25, 2014, 12:05:47 PM (10 years ago)
Legend:
- Unmodified
- Added
- Removed
- Modified
-
cs/MainTopics
v39 v40 29 29 }}} 30 30 31 [[Image( /trac/research/attachment/wiki/cs/MainTopics/corpora.png, align=right)]]31 [[Image(corpora.png, align=right)]] 32 32 33 33 Korpus je kolekce textových dat v elektronické podobě. Jako významný zdroj lingvistických dat slouží korpusy ke zkoumání mnoha frekvenčních jevů jazyka a v současnosti jsou již neodmyslitelným nástrojem v oblasti NLP. Kromě korpusů obsahujících libovolné texty, se vytvářejí i jiné pro zvláštní účely, např. značkované, doménové, mluvené nebo chybové.