Changes between Version 44 and Version 45 of cs/PocitaceNerozumiNikomu
- Timestamp:
- Jul 29, 2015, 5:22:24 PM (8 years ago)
Legend:
- Unmodified
- Added
- Removed
- Modified
-
cs/PocitaceNerozumiNikomu
v44 v45 176 176 }}} 177 177 178 {{{#!html 179 <a class="single_image" href="/trac/research/raw-attachment/wiki/cs/PocitaceNerozumiNikomu/stack-of-books-man.jpg"> 180 <img src="/trac/research/raw-attachment/wiki/cs/PocitaceNerozumiNikomu/stack-of-books-man.jpg" alt="" style="float:right"/></a> 181 }}} 182 178 183 Textový korpus je soubor souvislých textů. Lingvisté na něm sledují, jak se jazyk proměňuje. Na velkých korpusech, kde už je statistický soubor dostatecný, se počítačové programy učí, jak lidé jazyk užívají. Korpusy, které vytváříme nebo spravujeme v CZPJ, obsahují miliardy 179 184 slov. 180 185 181 186 Pro srovnání: nejdelší román (zapsaný v Guinessově knize rekordů) má cca 1 200 000 slov. 182 {{{#!html183 <a class="single_image" href="/trac/research/raw-attachment/wiki/cs/PocitaceNerozumiNikomu/stack-of-books-man.jpg">184 <img src="/trac/research/raw-attachment/wiki/cs/PocitaceNerozumiNikomu/stack-of-books-man.jpg" alt=""/></a>185 }}}