= Statistické charakteristiky češtiny = #Statistick.2BAOk_charakteristiky_.2BAQ0-e.2BAWE-tiny Na této stránce se pokusíme zachytit statistické charakteristiky češtiny zjištěné na základě použití korpusů na FI. Tuto frekvenční analýzu bylo možno provést proto, že se jedná o značkovaný korpus. == Statistiky pro DESAM == #Statistiky_pro_DESAM || Velikost korpusu (počet pozic): || 1230983 || || Počet slov: || 974537|| || Počet různých slov: || 122394|| || Počet různých lemmat: || 37588|| || Počet různých tagů: || 1858|| [[Frekvence_slov_lemmat| Frekvence slov, lemmat]] [[StatistikyGramatickychZnacek| Statistiky gramatických značek]] [[FrekvencePismenBigramu| Frekvence písmen, bigramů, trigramů, délka slov]]