Changes between Initial Version and Version 1 of cs/StoplistZakladnichTvaru


Ignore:
Timestamp:
Mar 3, 2014, 3:36:29 PM (8 years ago)
Author:
xkocinc
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • cs/StoplistZakladnichTvaru

    v1 v1  
     1= Stoplist základních tvarů = #Stoplist_z.2BAOE-kladn.2BAO0-ch_tvar.2BAW8-
     2Následující  stoplist základních tvarů je zpracován z korpusu DESAM a obsahuje  několik desítek nejpoužívanějších českých slov spolu s počtem jejich  výskytů a jejich slovními druhy. Počet výskytů je uveden v procentech  vzhledem k celkovému počtu pozic korpusu DESAM. Slovní druhy jsou  reprezentovány korpusovou značkou slovního druhu, jemuž náleží dané  slovo v největším počtu případů. Zvýrazněna jsou slova patřící do  otevřených kategorií.[[BR]] [[BR]] 
     3
     4|| Slovo || Výskyty v procentech || Slovní druh ||
     5|| '''být''' || 2.25566|| k5||
     6|| v || 2.18909|| k7||
     7|| a || 2.09743|| k8||
     8|| sebe || 1.50986|| k3||
     9|| na || 1.33937|| k7||
     10|| ten || 0.82155|| k3||
     11|| s || 0.76301|| k7||
     12|| z || 0.70188|| k7||
     13|| že || 0.68434|| k8||
     14|| který || 0.65219|| k3||
     15|| o || 0.57173|| k7||
     16|| '''mít''' || 0.49858|| k5||
     17|| i || 0.49850|| k8||
     18|| do || 0.47341|| k7||
     19|| on || 0.47057|| k3||
     20|| k || 0.41293|| k7||
     21|| pro || 0.39945|| k7||
     22|| tento || 0.37850|| k3||
     23|| za || 0.32995|| k7||
     24|| '''by''' || 0.32825|| k5||
     25|| '''moci''' || 0.29699|| k5||
     26|| svůj || 0.28708|| k3||
     27|| ale || 0.28294|| k8||
     28|| po || 0.24332|| k7||
     29|| '''rok''' || 0.21385|| k1||
     30|| '''jako''' || 0.20135|| k6||
     31|| však || 0.19477|| k9||
     32|| od || 0.18998|| k7||
     33|| všechen || 0.18243|| k3||
     34|| dva || 0.17756|| k4||
     35|| nebo || 0.17683|| k8||
     36|| '''tak''' || 0.17431|| k6||
     37|| u || 0.17074|| k7||
     38|| při || 0.16798|| k7||
     39|| jeden || 0.16644|| k4||
     40|| podle || 0.16230|| k7||
     41|| '''Praha''' || 0.15832|| k1||
     42|| jen || 0.15734|| k9||
     43|| '''další''' || 0.15580|| k2||
     44|| jeho || 0.15272|| k3||
     45|| aby || 0.14784|| k8||
     46|| co || 0.14671|| k3||
     47|| '''český''' || 0.14606|| k2||
     48|| jak || 0.14565|| k8||
     49|| '''veliký''' || 0.14452|| k2||
     50|| '''nový''' || 0.14119|| k2||
     51|| až || 0.13989|| k9||
     52|| '''už''' || 0.13778|| k6||
     53|| '''muset''' || 0.13770|| k5||
     54|| než || 0.13672|| k8||
     55|| '''nebýt''' || 0.13623|| k5||
     56|| '''člověk''' || 0.13315|| k1||
     57|| jenž || 0.13218|| k3||
     58|| '''léto''' || 0.12990|| k1||
     59|| '''firma''' || 0.12828|| k1||
     60|| první || 0.12316|| k4||
     61|| náš || 0.12276|| k3||
     62|| také || 0.11829|| k9||
     63|| my || 0.11366|| k3||
     64|| jejich || 0.11350|| k3||
     65|| když || 0.11196|| k8||
     66|| před || 0.11009|| k7||
     67|| '''doba''' || 0.10790|| k1||
     68|| '''chtít''' || 0.10603|| k5||
     69|| jiný || 0.10555|| k3||
     70|| mezi || 0.10084|| k7||
     71|| '''ještě''' || 0.10035|| k6||
     72|| já || 0.09637|| k3||
     73|| ani || 0.09629|| k8||
     74|| '''cena''' || 0.09369|| k1||
     75|| '''již''' || 0.09345|| k6||
     76|| '''jít''' || 0.09288|| k5||
     77|| '''strana''' || 0.09207|| k1||
     78|| či || 0.09126|| k8||
     79|| druhý || 0.09053|| k4||