MISIP – Počítačová syntéza zpěvu

Téma práce

Téma: Metody a nástroje pro tvorbu syntetizovaného zpěvu pomocí syntetizátoru řeči MBROLA
Zadání: Seznámí se s formátem souborů MIDI a navrhne postup jak extrahovat z MIDI souboru text a melodii písně a tyto údaje foneticky přepsat. Výstupem fonetického přepisu bude soubor ve formátu PHO, který slouží jako vstup pro řečový syntetizér MBROLA. Požadovaným výstupem práce je jednak textová část práce, která detailně dokumentuje celý postup, a jednak implementovaná aplikace, která umožňuje (s použitím syntetizéru MBROLA) automatický převod MIDI souboru na syntetizovaný zpěv ve formátu zvukového souboru (WAV).
Práce je součástí projektů spojených s činností Laboratoře zpracování přirozeného jazyka a jako taková bude vyžadovat pravidelné zveřejňování dosažených výsledků ve formě souhrnné zprávy vždy na konci každého kalendářního měsíce po celou dobu řešení. Tyto zprávy budou vystaveny na webových stránkách Laboratoře. Řešiteli bude zřízen účet na hlavním serveru, případně i na pracovních stanicích Laboratoře.
Vedoucí: Aleš Horák, Ph.D.
Řešitel: Lukáš Rýdlo

Práce se věnuje možnostem syntézy zpěvu za použití syntetizátoru řeči Mbrola. Základním předpokladem je teze, že zpěv je jen jinak modulovaná promluva, jinak řečeno určitou modifikací prozodie řeči lze získat zpěv. Tento přístup je velmi zevrubný a zjednodušující, ale umožňuje globální pohled na problematiku syntézy zpěvu.

Syntéza zpěvu není příliš frekventovaným tématem výzkumu a tato práce si klade za cíl zmapování možností v této oblasti za použití znalostí z oblasti syntézy běžné řeči. Výsledný syntetizátor nemá ambice být kvalitativně srovnáván se školeným zpěvákem. Takovýto nástroj může sloužit jako pomůcka pro další výzkum nebo pro získání orientačního přehledu o tom, jak nějaká zazpívaná skladba může znít. Syntéza zpěvu napodobující určitý žánr (opera, jazz, chorál...) je v této fázi výzkumu těžko realizovatelná a tak lze výsledek takovéto syntézy také považovat za samostatný umělecký žánr (viz Melissa, an MBROLA-based Virtual Singer).

© Lukáš Rýdlo; Aktualizace: 1. 11. 2006; Valid XHTML 1.0; Created with VIM