22.12.2003

El Grup de Tecnologia Musical desenvolupa Vocaloid, un sintetitzador de veu cantada

logo
El Grup de Tecnologia Musical de l’ Institut Universitari de l’Audiovisual de la UPF ha desenvolupat el software Vocaloid, un sintetitzador capaç de generar veu humana cantada des d’un ordinador personal. L’usuari ha d’introduir la lletra i la música desitjades, i Vocaloid ho generarà amb la veu seleccionada -pot ser la de John Lennon o la d’Elvis Presley, entre altres. En aquesta primera fase es reprodueixen cançons en anglès i en japonès, però es preveu desenvolupar el software per a d’altres llengües.
La recerca, que ha tingut una durada de tres anys, ha estat finançada per la firma Yamaha. El prototip es comercialitzarà a partir del 2004 a tot el món, i fins avui ja ha estat adquirit per tres empreses del Japó, Alemanya i els Estats Units.
Vocaloid ha estat dissenyat a partir de la recopilació d’articulacions fonètiques de diferents registres i contextos musicals de cantants reals, els quals han estat enregistrats en una base de dades, a la manera d’una biblioteca vocal. Tota aquesta informació serveix de base al sintetitzador per interpretar la peça desitjada, que fins i tot es pot modificar amb la introducció de diferents paràmetres d’expressivitat. Això fa de Vocaloid el millor reproductor de les cordes vocals humanes.
Vocaloid ha estat objecte d’un article publicat a The New York Times, amb el títol “Could I Get That Song in Elvis, Please?” , i ha estat seleccionat entre les 100 innovacions tecnològiques que opten al premi " Best of What's New 2003" que atorga la revista Popular Science, editada per Time 4 Media. Vocaloid opta al premi en la categoria d'innovació general. Fundada l'any 1872, PopSci és la revista científica i tecnològica de més difusió mundial, amb prop de set milions de lectors.
El Grup de Tecnologia Musical de la UPF destaca per la seva recerca sobre tècniques de processament del senyal d’interès per a la producció musical i altres aplicacions multimedia. A partir dels treballs inicials en el desenvolupament de models espectrals d’àudio, l'MTG es dedica als models sonors per a la síntesi, al processament d'àudio basat en el contingut, i a altres temes relacionats amb la Tecnologia Musical.

Pàgina web de Vocaloid