| 246 | |
| 247 | |
| 248 | |
| 249 | == Diacritics Restoration == |
| 250 | {{{#!html |
| 251 | <div class="box-qa"> |
| 252 | <strong>Otázka:</strong> Nevadi, kdyz pisu bez hacku a carek? |
| 253 | <br/> |
| 254 | <strong> Odpověď:</strong> Ne. |
| 255 | }}} |
| 256 | |
| 257 | Lidé často píšou bez diakritiky. Pokud chceme takovým textům rozumět a třeba v nich vyhledávat, musíme si diakritiku domyslet. Někdy je to snadné, protoe slovo bez diakritiky ve slovníku nenajdeme (např. ''pocitac''). Jindy je třeba využít znalostí o frekvencích výskytu a spoluvýskytu slov, které získáme z korpusu. Z nich program spočítá pravděpodobnost oháčkováného slova (např. ''měj se''} místo ''mej se''). |
| 258 | |
| 259 | {{{#!html |
| 260 | <a class="single_image" href="/trac/research/raw-attachment/wiki/cs/PocitaceNerozumiNikomu/cz_accent.PNG"> |
| 261 | <img src="/trac/research/raw-attachment/wiki/cs/PocitaceNerozumiNikomu/cz_accent.PNG" alt="" /></a> |
| 262 | }}} |