Changes between Version 38 and Version 39 of cs/PocitaceNerozumiNikomu


Ignore:
Timestamp:
Jul 29, 2015, 5:15:52 PM (5 years ago)
Author:
xkocinc
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • cs/PocitaceNerozumiNikomu

    v38 v39  
    165165<img src="/trac/research/raw-attachment/wiki/cs/PocitaceNerozumiNikomu/myslim.png" alt=""/></a>
    166166}}}
     167
     168
     169
     170== Corpus Engineering ==
     171{{{#!html
     172<div class="box-qa">
     173<strong>Otázka:</strong> Vejde se celá knihovna do počítače?
     174<br/>
     175<strong> Odpověď:</strong> Ano.
     176}}}
     177
     178Textový korpus je soubor souvislých textů. Lingvisté na něm sledují, jak se jazyk proměňuje. Na velkých korpusech, kde už je statistický soubor dostatecný, se počítačové programy učí, jak lidé jazyk užívají. Korpusy, které vytváříme nebo spravujeme v CZPJ, obsahují miliardy
     179slov.
     180
     181Pro srovnání: nejdelší román (zapsaný v Guinessově knize rekordů) má cca 1 200 000 slov.
     182{{{#!html
     183<a class="single_image" href="/trac/research/raw-attachment/wiki/cs/PocitaceNerozumiNikomu/stack-of-books-man.jpg">
     184<img src="/trac/research/raw-attachment/wiki/cs/PocitaceNerozumiNikomu/stack-of-books-man.jpg" alt=""/></a>
     185}}}