Vés enrere

Membres del MTG aporten la millor solució per al reconeixement automàtic de gèneres musicals

Membres del MTG aporten la millor solució per al reconeixement automàtic de gèneres musicals

S'ha presentat al congrés WWW2018, celebrat del 23 al 27 d'abril a Lió (França) i ha guanyat el repte WWW 2018 Challenge: Learning to Recognize Musical Genre. Un treball en el qual han participat Xavier Serra i Minz Won, juntament investigadors de la Universitat Tecnològica de Delft (Holanda).

15.05.2018

El reconeixement automàtic dels gèneres musicals a partir d'informació d'àudio, és un repte en tecnologia musical ja que, sovint, les etiquetes que descriuen els gèneres musicals atribuïdes manualment per éssers humans, es consideren subjectives i sorolloses (confuses). Per exemple, una cançó de rock també pot ser considerada com de pop, o moltes obres clàssiques també poden ser instrumentals. Al seu torn, l'etiquetatge depèn del context de l'oient, per exemple, una persona francesa, una cançó en francès, no la classificaria com a "internacional". En general, no hi ha una taxonomia de gènere universal i la seva classificació és un desafiament.

Aquest ha estat el punt de partida d'una investigació en el camp de reconeixement automàtic presentada a la Conferència WWW2018, celebrada del 23 al 27 d'abril a Lió (França) i que ha sabut aportar la millor solució al  WWW 2018 Challenge: Learning to Recognize Musical Genre a la predicció correcta de gèneres musicals de segments d'àudio desconeguts utilitzant el conjunt de dades FMA (Free Music Archive). 

Gràfic del procés seguit pels investigadors. Aquest procediment de reconeixement automàtic a partir d'informació d'àudio es detalla en un article del qual Xavier Serra i Minz Won, director i investigador doctoral, respectivament, del Grup de Recerca en Tecnologia Musical (MTG) del Departament de Tecnologies de la Informació i les Comunicacions (DTIC) de la UPF són coautors, juntament amb investigadors de la Universitat Tecnològica de Delft (Països Baixos ), Jaehun Kim, primer autor i Cynthia C.S. Liem.  

El treball parteix del fet que en la classificació musical, les etiquetes que descriuen els artistes són menys subjectives i menys sorolloses (confuses) que les que descriuen gèneres musicals i, al seu torn, alguns artistes es relacionen fortament amb determinats gèneres musicals. "En aquest treball, proposem aplicar el marc d'aprenentatge de transferència aprenent de diferents tipus d'informació relacionada amb l'artista o artistes,  per després utilitzar-la per inferir la classificació de gènere". Una solució que al challenge ha demostrat ser la més eficient i que aporta una major solidesa a l'etiqueta, minimitzant el soroll potencial", afirmen els autors del treball. Van participar en el desafiament o challenge sis equips, i en dues rondes van haver d'enviar les seves prediccions de classificació de gènere per 35.000 clips de 30 segons cada un d’ells. L'equip integrat per Minz Won i Jaehun Kim, va ser el guanyador.

Treball de referència:

Jaehun Kim, Minz Won, Xavier Serra, Cynthia C.S. Liem (2018), "Transfer Learning of Artist Group Factors to Musical Gènere Classification", WWW '18 The Web Conference 2018, 23-27 d’abril, Lió (França).

Categories: