Changes between Initial Version and Version 1 of cs/FrekvenceSlovLemmat


Ignore:
Timestamp:
Mar 3, 2014, 4:05:56 PM (10 years ago)
Author:
xkocinc
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • cs/FrekvenceSlovLemmat

    v1 v1  
     1= Frekvence písmen, bigramů, trigramů, délka slov = #Frekvence_p.2BAO0-smen.2C_bigram.2BAW8.2C_trigram.2BAW8.2C_d.2BAOk-lka_slov
     2== Frekvence českých písmen == #Frekvence_.2BAQ0-esk.2BAP0-ch_p.2BAO0-smen
     3|| a ||   357907||   66.98 ‰|| i ||   244242||   45.71 ‰|| s ||   246867||   46.20 ‰||
     4|| á ||   113756||   21.29 ‰|| í ||   165786||   31.03 ‰|| š ||   43636||   8.17 ‰||
     5|| b ||   88974||   16.65 ‰|| j ||   105955||   19.83 ‰|| t ||   296779||   55.54 ‰||
     6|| c ||   85538||   16.01 ‰|| k ||   200479||   37.52 ‰|| ť ||   2057||   0.38 ‰||
     7|| č ||   54341||   10.17 ‰|| l ||   218906||   40.97 ‰|| u ||   167322||   31.31 ‰||
     8|| d ||   193038||   36.13 ‰|| m ||   174323||   32.62 ‰|| ú ||   7736||   1.45 ‰||
     9|| ď ||   1040||   0.19 ‰|| n ||   356743||   66.76 ‰|| ů ||   30430||   5.69 ‰||
     10|| e ||   418434||   78.31 ‰|| ň ||   3926||   0.73 ‰|| v ||   233960||   43.78 ‰||
     11|| é ||   62945||   11.78 ‰|| o ||   442617||   82.83 ‰|| w ||   3843||   0.72 ‰||
     12|| ě ||   79674||   14.91 ‰|| ó ||   1704||   0.32 ‰|| x ||   4942||   0.92 ‰||
     13|| f ||   21055||   3.94 ‰|| p ||   184548||   34.54 ‰|| y ||   93620||   17.52 ‰||
     14|| g ||   18319||   3.43 ‰|| q ||   308||   0.06 ‰|| ý ||   50312||   9.42 ‰||
     15|| h ||   69236||   12.96 ‰|| r ||   212533||   39.77 ‰|| z ||   113450||   21.23 ‰||
     16|| ch ||   53802||   10.07 ‰|| ř ||   63395||   11.86 ‰|| ž ||   54602||   10.22 ‰||
     17
     18== Nejfrekventovanějších 40 bigramů (dvojic písmen) == #Nejfrekventovan.2BARs-j.2BAWEA7Q-ch_40_bigram.2BAW8_.28dvojic_p.2BAO0-smen.29
     19|| st ||   74285|| en ||   50645|| le ||   38926|| to ||   36355|| ho ||   31442|| al ||   29682|| př ||   27885|| em ||   26818||
     20|| ní ||   60525|| na ||   46737|| ko ||   38688|| ou ||   35191|| do ||   30665|| ed ||   29622|| at ||   27603|| in ||   26427||
     21|| po ||   56239|| je ||   42433|| ne ||   38671|| no ||   32612|| os ||   30530|| an ||   29326|| ře ||   27181|| sk ||   26085||
     22|| ov ||   53818|| pr ||   42099|| od ||   38393|| la ||   32336|| se ||   30454|| ce ||   28280|| er ||   27168|| lo ||   25981||
     23|| ro ||   51961|| te ||   40393|| ra ||   37531|| li ||   31952|| ta ||   30177|| va ||   27987|| ti ||   26858|| ně ||   25739||
     24
     25== Nejfrekventovanějších 40 trigramů (trojic písmen) == #Nejfrekventovan.2BARs-j.2BAWEA7Q-ch_40_trigram.2BAW8_.28trojic_p.2BAO0-smen.29
     26|| pro ||   21322|| ení ||   11917|| ého ||   9475|| ick ||   8387|| edn ||   7429|| ání ||   7224|| pol ||   6704|| val ||   6256||
     27|| ost ||   18722|| ova ||   11822|| sti ||   9121|| ová ||   8139|| ské ||   7349|| ent ||   7114|| spo ||   6686|| dní ||   6251||
     28|| sta ||   12746|| pod ||   10168|| řed ||   9103|| při ||   7878|| pří ||   7348|| str ||   6903|| vat ||   6489|| sto ||   6189||
     29|| pře ||   12057|| kte ||   9603|| kon ||   9017|| sou ||   7541|| odn ||   7251|| ové ||   6810|| ním ||   6439|| tak ||   6175||
     30|| ter ||   11936|| pra ||   9521|| nos ||   8557|| ist ||   7505|| tel ||   7231|| nov ||   6783|| jak ||   6330|| lov ||   6139||
     31
     32== Délka slov == #D.2BAOk-lka_slov
     33|| Průměrná délka slov v textu: ||   5.54||
     34|| Průměrná délka slov ve slovníku (slova bez opakovani): ||   8.11||
     35
     36První  graf zachycuje percentuální závislost výskytu slov v textu podle délky.  A druhý graf zachycuje percentuální závislost výskytu slov ve slovníku  (tj. slova bez opakování) podle délky.