Changes between Version 58 and Version 59 of cs/PocitaceNerozumiNikomu


Ignore:
Timestamp:
Jul 29, 2015, 7:20:58 PM (5 years ago)
Author:
xkocinc
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • cs/PocitaceNerozumiNikomu

    v58 v59  
    227227[[BR]]
    228228[[BR]]
    229 [[BR]]
     229
     230
    230231
    231232== Computer Lexicography ==
     
    243244<img src="/trac/research/raw-attachment/wiki/cs/PocitaceNerozumiNikomu/ssc.PNG" alt="" /></a>
    244245}}}
     246
     247
     248
     249== Diacritics Restoration ==
     250{{{#!html
     251<div class="box-qa">
     252<strong>Otázka:</strong> Nevadi, kdyz pisu bez hacku a carek?
     253<br/>
     254<strong> Odpověď:</strong> Ne.
     255}}}
     256
     257Lidé často píššou bez diakritiky. Pokud chceme takovým textům rozumět a třeba v nich vyhledávat, musíme si diakritiku domyslet. Někdy je to snadné, protože slovo bez diakritiky ve slovníku nenajdeme (např. ''pocitac''). Jindy je třeba využžít znalostí o frekvencích výskytu a spoluvýskytu slov, které získáme z korpusu. Z nich program spočítá pravděpodobnost oháčkováného slova (např. ''měj se''} místo ''mej se'').
     258
     259{{{#!html
     260<a class="single_image" href="/trac/research/raw-attachment/wiki/cs/PocitaceNerozumiNikomu/cz_accent.PNG">
     261<img src="/trac/research/raw-attachment/wiki/cs/PocitaceNerozumiNikomu/cz_accent.PNG" alt="" /></a>
     262}}}