Frekvence slov, lemmat


Nejfrekventovanější slova (slovní formy)

a

  25125

  25.78 ‰

že

  8373

  8.59 ‰

do

  5506

  5.65 ‰

za

  3650

  3.75 ‰

v

  19788

  20.31 ‰

s

  7155

  7.34 ‰

to

  4600

  4.72 ‰

by

  3465

  3.56 ‰

se

  17879

  18.35 ‰

o

  6779

  6.96 ‰

pro

  4469

  4.59 ‰

si

  3119

  3.20 ‰

na

  15260

  15.66 ‰

z

  6512

  6.68 ‰

ve

  4139

  4.25 ‰

ale

  3093

  3.17 ‰

je

  10634

  10.91 ‰

i

  5965

  6.12 ‰

k

  3824

  3.92 ‰

V

  2944

  3.02 ‰

Nejfrekventovanější lemmata (základní tvary)

být

  27183

  29.54 ‰

ten

  10112

  10.99 ‰

o

  7039

  7.65 ‰

pro

  4921

  5.35 ‰

v

  26962

  29.30 ‰

s

  9393

  10.21 ‰

i

  6139

  6.67 ‰

tento

  4661

  5.07 ‰

a

  25822

  28.06 ‰

z

  8644

  9.39 ‰

mít

  6125

  6.66 ‰

k

  4236

  4.60 ‰

sebe

  18582

  20.19 ‰

že

  8422

  9.15 ‰

do

  5829

  6.33 ‰

za

  4064

  4.42 ‰

na

  16489

  17.92 ‰

který

  8032

  8.73 ‰

on

  5790

  6.29 ‰

by

  4042

  4.39 ‰

Prvních 100 nejčetnějších substantiv

rok

  2634

část

  729

dítě

  510

zařízení

  439

důvod

  381

Praha

  1950

skupina

  711

hodina

  510

žena

  438

zápas

  380

člověk

  1637

procento

  675

věc

  509

týden

  436

daň

  376

léto

  1599

republika

  675

činnost

  500

předseda

  434

tým

  374

firma

  1578

program

  672

objekt

  499

prostředí

  430

banka

  371

doba

  1328

město

  652

muž

  491

ředitel

  430

úroveň

  369

cena

  1154

ministr

  621

zájem

  489

klub

  419

rada

  365

strana

  1134

Evropa

  614

voda

  487

číslo

  417

základ

  365

koruna

  1064

otázka

  602

jednání

  485

stav

  416

bod

  360

země

  1063

změna

  599

volba

  485

právo

  415

Jiří

  360

společnost

  1003

výsledek

  597

cesta

  482

poslanec

  414

vývoj

  360

případ

  981

čas

  593

úřad

  482

Brno

  413

text

  353

práce

  960

řada

  583

fax

  481

hodnota

  410

politika

  352

zákon

  951

situace

  574

měsíc

  480

kolo

  410

prostředek

  351

den

  936

oblast

  564

podmínka

  474

osoba

  408

fond

  349

místo

  933

služba

  555

funkce

  472

nabídka

  405

zpráva

  348

stát

  920

smlouva

  555

návrh

  471

pracovník

  405

závod

  345

vláda

  887

prezident

  553

výroba

  471

podnikatel

  397

druh

  343

systém

  839

způsob

  540

hra

  470

Jan

  396

Německo

  343

svět

  815

kontakt

  529

dům

  467

lékař

  395

zboží

  342

možnost

  777

informace

  528

život

  467

náklad

  394

zákazník

  341

většina

  768

počet

  528

slovo

  465

škola

  390

dohoda

  340

podnik

  750

snímek

  525

peníze

  463

typ

  390

termín

  338

trh

  747

člen

  519

hráč

  450

počítač

  385

výstava

  338

problém

  733

ministerstvo

  514

konec

  442

názor

  384

výrobek

  336

Prvních 100 nejčetnějších adjektiv

další

  1920

mezinárodní

  434

minulý

  312

úspěšný

  221

vědecký

  181

český

  1801

jednotlivý

  430

životní

  307

dnešní

  219

příslušný

  180

nový

  1743

stejný

  419

olympijský

  295

jednoduchý

  219

konkrétní

  176

jiný

  1300

určitý

  406

ruský

  295

jistý

  219

následující

  175

dobrý

  1036

německý

  405

mladý

  283

běžný

  216

vnitřní

  173

vysoký

  1011

sociální

  403

lidský

  280

hospodářský

  214

demokratický

  172

celý

  992

světový

  399

sovětský

  272

těžký

  214

generální

  171

veliký

  916

starý

  398

nutný

  250

soukromý

  212

koaliční

  171

velký

  864

jediný

  391

významný

  246

jasný

  207

městský

  171

malý

  796

důležitý

  379

slovenský

  243

původní

  204

potřebný

  171

poslední

  792

nízký

  378

fotbalový

  242

daňový

  203

průměrný

  169

státní

  624

společný

  378

západní

  242

místní

  202

skutečný

  168

vlastní

  616

ostatní

  372

spojený

  239

odborný

  197

jaderný

  164

možný

  605

finanční

  371

právní

  231

závislý

  196

občanský

  164

evropský

  580

národní

  361

vhodný

  230

rychlý

  195

široký

  163

hlavní

  575

dlouhý

  353

zdravotní

  229

britský

  193

volební

  161

americký

  544

pracovní

  341

technický

  228

dosavadní

  191

kvalitní

  157

různý

  535

známý

  338

zajímavý

  228

moderní

  190

sportovní

  156

pražský

  534

ekonomický

  337

vojenský

  227

plný

  188

bezpečný

  155

základní

  511

podobný

  332

veřejný

  226

značný

  188

vládní

  154

zahraniční

  494

letošní

  331

volný

  225

zvláštní

  188

přímý

  153

politický

  490

střední

  330

osobní

  224

východní

  187

mimořádný

  150

obchodní

  488

příští

  327

silný

  223

daný

  184

podnikatelský

  150

současný

  449

domácí

  320

blízký

  222

uvedený

  184

schopen

  150

bývalý

  441

celkový

  318

loňský

  221

federální

  181

krátký

  149

Prvních 100 nejčetnějších sloves

být

  27180

pracovat

  377

dodat

  262

hledat

  213

koupit

  172

mít

  6123

najít

  375

zdát

  262

zaplatit

  211

týkat

  171

moct

  3655

potřebovat

  361

skončit

  260

žít

  211

vycházet

  171

nebýt

  2244

považovat

  357

nabízet

  259

použít

  210

odmítnout

  170

muset

  1695

zůstat

  353

prohlásit

  255

hovořit

  209

zůstávat

  167

chtít

  1302

rozhodnout

  351

snažit

  255

pokračovat

  208

uzavřít

  166

jít

  1141

dojít

  348

vzniknout

  254

činit

  202

psát

  165

říci

  1091

dokázat

  323

přijmout

  248

poskytovat

  202

řešit

  162

stát

  1015

změnit

  317

udělat

  248

potvrdit

  201

snížit

  161

dát

  697

připravit

  312

zjistit

  245

číst

  199

ukazovat

  161

vědět

  691

myslit

  304

ukázat

  236

odpovídat

  198

umožnit

  161

uvést

  657

stačit

  295

vyhrát

  234

nechat

  197

vzít

  160

začít

  655

dělat

  294

používat

  233

pomoci

  195

prodat

  159

dostat

  622

tvrdit

  292

obsahovat

  231

bývat

  192

napsat

  157

získat

  606

čekat

  291

očekávat

  231

chybět

  192

podepsat

  155

platit

  501

podařit

  290

představovat

  230

měnit

  191

dostávat

  154

hrát

  493

dosáhnout

  286

zabývat

  228

věřit

  191

zvolit

  153

znamenat

  492

jednat

  285

začínat

  224

oznámit

  188

pořádat

  152

přijít

  487

dávat

  280

trvat

  222

umožňovat

  186

smět

  152

říkat

  486

objevit

  276

vybrat

  220

označit

  184

hodlat

  151

vidět

  473

vytvořit

  275

předpokládat

  218

přinést

  182

souhlasit

  150

vést

  466

vrátit

  274

zvýšit

  218

mluvit

  179

růst

  149

telit

  431

počítat

  271

působit

  216

využít

  178

zajistit

  149

patřit

  427

znát

  271

uvádět

  215

otevřít

  174

nabídnout

  148

existovat

  402

tvořit

  268

věnovat

  214

pohybovat

  173

vznikat

  148

Nejfrekventovanějších 40 dvojic lemmat

jenž sebe

  294

více než

  140

sovětský svaz

  98

včera v

  85

práce v

  74

jenž být

  287

letošní rok

  137

ministr zahraničí

  95

akciový společnost

  82

vstup do

  74

když sebe

  222

kdy sebe

  133

mimo jiný

  94

jenž by

  82

evropský unie

  73

když být

  221

kdy být

  132

spolupráce s

  94

stát v

  82

kdyby sebe

  73

stejně jako

  214

počítat s

  119

Václav Klaus

  92

pak sebe

  81

Václav Havel

  72

kde být

  187

daň z

  116

východní Evropa

  89

změna v

  81

jednání s

  71

považovat za

  186

loňský rok

  115

vzhledem k

  88

olympijský hra

  79

kdo sebe

  71

životní prostředí

  175

současný doba

  106

hovořit o

  85

návrh na

  78

minulý týden

  69

jaký být

  155

vést k

  105

pak být

  85

dlouhý doba

  77

práce s

  69

kde sebe

  148

tisíc koruna

  101

státní rozpočet

  85

stát sebe

  77

evropský společenství

  68

Nejfrekventovanějších 40 trojic lemmat

by mít být

  149

jeden z on

  71

mít k dispozice

  52

a tak sebe

  45

v jenž být

  42

by sebe mít

  122

v tento případ

  68

sebe s on

  51

v souvislost s

  45

že být ten

  42

na druhý strana

  104

a ten i

  65

by moct být

  49

na rozdíl od

  44

že ten být

  42

v současný doba

  104

a ten být

  61

a východní Evropa

  48

od ten doba

  44

být na ten

  41

být jeden z

  91

který by mít

  61

v jenž sebe

  48

v tento směr

  44

který by sebe

  40

v český republika

  90

že jít o

  61

v tento souvislost

  48

Jan z Pomuk

  43

v příští rok

  40

který být v

  83

z on být

  60

být v tento

  47

v loňský rok

  43

v soulad s

  39

že by sebe

  81

který sebe v

  57

sebe v on

  47

v žádný případ

  43

v každý případ

  38

daň z příjem

  74

sebe na on

  56

střední a východní

  46

na první pohled

  42

v letošní rok

  38

v poslední doba

  72

v ten doba

  56

v spolupráce s

  46

sebe jednat o

  42

v poslední léto

  38

A ještě dva zajímavé grafy

První graf zachycuje závislost počtu slovních forem v dané procentuální velikosti textu a je omezen jen na prvních 100 nejčastěji se vyskytujících slov. A druhý graf zachycuje stejnou závislost jako první s tím, že osa x má logaritmickou stupnici.

word.desam.cz.1.png

word.desam.cz.0.png

A to samé pro základní tvary.

lemma.desam.cz.1.png

lemma.desam.cz.0.png


 

Frekvence_slov_lemmat (naposledy editoval localhost dne 2012-03-16 15:19:40 )