Stoplist základních tvarů
Následující stoplist základních tvarů je zpracován z korpusu DESAM a obsahuje několik desítek nejpoužívanějších českých slov spolu s počtem jejich výskytů a jejich slovními druhy. Počet výskytů je uveden v procentech vzhledem k celkovému počtu pozic korpusu DESAM. Slovní druhy jsou reprezentovány korpusovou značkou slovního druhu, jemuž náleží dané slovo v největším počtu případů. Zvýrazněna jsou slova patřící do otevřených kategorií.
| Slovo | Výskyty v procentech | Slovní druh |
| být | 2.25566 | k5 |
| v | 2.18909 | k7 |
| a | 2.09743 | k8 |
| sebe | 1.50986 | k3 |
| na | 1.33937 | k7 |
| ten | 0.82155 | k3 |
| s | 0.76301 | k7 |
| z | 0.70188 | k7 |
| že | 0.68434 | k8 |
| který | 0.65219 | k3 |
| o | 0.57173 | k7 |
| mít | 0.49858 | k5 |
| i | 0.49850 | k8 |
| do | 0.47341 | k7 |
| on | 0.47057 | k3 |
| k | 0.41293 | k7 |
| pro | 0.39945 | k7 |
| tento | 0.37850 | k3 |
| za | 0.32995 | k7 |
| by | 0.32825 | k5 |
| moci | 0.29699 | k5 |
| svůj | 0.28708 | k3 |
| ale | 0.28294 | k8 |
| po | 0.24332 | k7 |
| rok | 0.21385 | k1 |
| jako | 0.20135 | k6 |
| však | 0.19477 | k9 |
| od | 0.18998 | k7 |
| všechen | 0.18243 | k3 |
| dva | 0.17756 | k4 |
| nebo | 0.17683 | k8 |
| tak | 0.17431 | k6 |
| u | 0.17074 | k7 |
| při | 0.16798 | k7 |
| jeden | 0.16644 | k4 |
| podle | 0.16230 | k7 |
| Praha | 0.15832 | k1 |
| jen | 0.15734 | k9 |
| další | 0.15580 | k2 |
| jeho | 0.15272 | k3 |
| aby | 0.14784 | k8 |
| co | 0.14671 | k3 |
| český | 0.14606 | k2 |
| jak | 0.14565 | k8 |
| veliký | 0.14452 | k2 |
| nový | 0.14119 | k2 |
| až | 0.13989 | k9 |
| už | 0.13778 | k6 |
| muset | 0.13770 | k5 |
| než | 0.13672 | k8 |
| nebýt | 0.13623 | k5 |
| člověk | 0.13315 | k1 |
| jenž | 0.13218 | k3 |
| léto | 0.12990 | k1 |
| firma | 0.12828 | k1 |
| první | 0.12316 | k4 |
| náš | 0.12276 | k3 |
| také | 0.11829 | k9 |
| my | 0.11366 | k3 |
| jejich | 0.11350 | k3 |
| když | 0.11196 | k8 |
| před | 0.11009 | k7 |
| doba | 0.10790 | k1 |
| chtít | 0.10603 | k5 |
| jiný | 0.10555 | k3 |
| mezi | 0.10084 | k7 |
| ještě | 0.10035 | k6 |
| já | 0.09637 | k3 |
| ani | 0.09629 | k8 |
| cena | 0.09369 | k1 |
| již | 0.09345 | k6 |
| jít | 0.09288 | k5 |
| strana | 0.09207 | k1 |
| či | 0.09126 | k8 |
| druhý | 0.09053 | k4 |







