| 1 | = Statistické charakteristiky češtiny = #Statistick.2BAOk_charakteristiky_.2BAQ0-e.2BAWE-tiny |
| 2 | Na této stránce se pokusíme zachytit statistické charakteristiky češtiny zjištěné na základě použití korpusů na FI. Tuto frekvenční analýzu bylo možno provést proto, že se jedná o značkovaný korpus. |
| 3 | |
| 4 | == Statistiky pro DESAM == #Statistiky_pro_DESAM |
| 5 | || Velikost korpusu (počet pozic): || 1230983 || |
| 6 | || Počet slov: || 974537|| |
| 7 | || Počet různých slov: || 122394|| |
| 8 | || Počet různých lemmat: || 37588|| |
| 9 | || Počet různých tagů: || 1858|| |
| 10 | |
| 11 | [[Frekvence_slov_lemmat| Frekvence slov, lemmat]] |
| 12 | |
| 13 | [[StatistikyGramatickychZnacek| Statistiky gramatických značek]] |
| 14 | |
| 15 | [[FrekvencePismenBigramu| Frekvence písmen, bigramů, trigramů, délka slov]] |