Atrás

Miembros del MTG aportan la mejor solución para el reconocimiento automático de géneros musicales

Miembros del MTG aportan la mejor solución para el reconocimiento automático de géneros musicales

Se ha presentado en el congreso WWW2018, celebrado del 23 al 27 de abril en Lyon (Francia) y ha ganado el reto WWW 2018 Challenge: Learning to Recognize Musical Genre. Un trabajo en el que han participado Xavier Serra y Minz Won, junto investigadores de la Universidad Tecnológica de Delft (Holanda).

15.05.2018

El reconocimiento automático de los géneros musicales a partir de información de audio,  es un reto en tecnología musical ya que, a menudo, las etiquetas que describen los géneros musicales atribuidas manualmente por seres humanos, se consideran subjetivas y ruidosas (confusas). Por ejemplo, una canción de rock también puede ser considerada como de pop,  o muchas obras clásicas también pueden ser instrumentales. A su vez, el etiquetado depende del contexto del oyente, por ejemplo, una persona francesa, una canción en francés, no la clasificaría  como “internacional”. En general, no existe una taxonomía de género universal y su clasificación es un desafío.

Este ha sido el punto de partida de una investigación en el campo de reconocimiento automático presentada a la Conferencia WWW 2018, celebrada del 23 al 27 de abril en Lyon (Francia) y que ha sabido aportar la mejor solución al WWW 2018 Challenge: Learning to Recognize Musical Genre  a la predicción correcta de géneros musicales de segmentos de audio desconocidos utilizando el conjunto de datos FMA (Free Music Archive).

Gràfic del procés seguit pels investigadors.

Este procedimiento de reconocimiento automático a partir de información de audio se detalla en un artículo del que Xavier Serra y Minz Won, director e investigador doctoral, respectivamente, del Grupo de Investigación en Tecnología Musical (MTG) del Departamento de Tecnologías de la Información y las Comunicaciones (DTIC) de la UPF son coautores,  junto con investigadores de la Universidad Tecnológica de Delft (Holanda), Jaehun Kim, primer autor y Cynthia C.S. Liem.

El trabajo parte del hecho de que en la clasificación musical, las etiquetas que describen a los artistas son menos subjetivas y menos ruidosas (confusas) que las que describen géneros musicales y, a su vez, algunos artistas se relacionan fuertemente con determinados géneros musicales. “En este trabajo, proponemos aplicar el marco de aprendizaje de transferencia aprendiendo de diferentes tipos de información relacionada con el artista o artistas para luego utilizarla para inferir la clasificación de género”. Una solución que en el challenge ha demostrado ser la más eficiente y que aporta una mayor solidez a la etiqueta, minimizando el ruido potencial”, afirman los autores del trabajo. Participaron en el desafío o challenge seis equipos, y en dos rondas tuvieron que enviar sus predicciones de clasificación de género para 35.000 clips de 30 segundos cada uno. El equipo integrado por Minz Won y Jaehun Kim, fue el ganador.

Trabajo de referencia:

Jaehun Kim, Minz Won, Xavier Serra, Cynthia C.S. Liem (2018), “Transfer Learning of Artist Group Factors to Musical Genre Classification”, WWW ’18 The Web Conference 2018. 23-27 de abril, Lyon (Francia).

Categorías: