Changes between Version 33 and Version 34 of cs/MainTopics
- Timestamp:
- Apr 15, 2014, 3:49:00 PM (10 years ago)
Legend:
- Unmodified
- Added
- Removed
- Modified
-
cs/MainTopics
v33 v34 29 29 }}} 30 30 31 [[Image( corpora.png, align=right)]]31 [[Image(/trac/research/raw-attachment/wiki/cs/MainTopics/corpora.png, align=right)]] 32 32 33 33 Korpus je kolekce textových dat v elektronické podobě. Jako významný zdroj lingvistických dat slouží korpusy ke zkoumání mnoha frekvenčních jevů jazyka a v současnosti jsou již neodmyslitelným nástrojem v oblasti NLP. Kromě korpusů obsahujících libovolné texty, se vytvářejí i jiné pro zvláštní účely, např. značkované, doménové, mluvené nebo chybové.