| 167 | |
| 168 | |
| 169 | |
| 170 | == Corpus Engineering == |
| 171 | {{{#!html |
| 172 | <div class="box-qa"> |
| 173 | <strong>Otázka:</strong> Vejde se celá knihovna do počítače? |
| 174 | <br/> |
| 175 | <strong> Odpověď:</strong> Ano. |
| 176 | }}} |
| 177 | |
| 178 | Textový korpus je soubor souvislých textů. Lingvisté na něm sledují, jak se jazyk proměňuje. Na velkých korpusech, kde už je statistický soubor dostatecný, se počítačové programy učí, jak lidé jazyk užívají. Korpusy, které vytváříme nebo spravujeme v CZPJ, obsahují miliardy |
| 179 | slov. |
| 180 | |
| 181 | Pro srovnání: nejdelší román (zapsaný v Guinessově knize rekordů) má cca 1 200 000 slov. |
| 182 | {{{#!html |
| 183 | <a class="single_image" href="/trac/research/raw-attachment/wiki/cs/PocitaceNerozumiNikomu/stack-of-books-man.jpg"> |
| 184 | <img src="/trac/research/raw-attachment/wiki/cs/PocitaceNerozumiNikomu/stack-of-books-man.jpg" alt=""/></a> |
| 185 | }}} |