Vés enrere Les fonts textuals de la musicologia, analitzades des de l'òptica de les tecnologies del llenguatge natural

Les fonts textuals de la musicologia, analitzades des de l'òptica de les tecnologies del llenguatge natural

A través d'un recurs, únic en la seva espècie, que han desenvolupat conjuntament els Grups de Recerca en Tecnologia Musical i en Tractament del Llenguatge Natural, al Departament de Tecnologies de la Informació i les Comunicacions.

12.05.2016

 

Els textos que contenen les ressenyes dels àlbums musicals, les biografies de músics i artistes, les lletres de les cançons, etc.,"tota aquesta informació és extremadament útil per als investigadors en tecnologia musical", esmenta Horacio Saggion, membre del Grup de Recerca en Tractament del Llenguatge Natural (TALN).

Efectivament, extreure de manera automàtica informació sobre entitats musicals (artistes, àlbums, cançons o companyies discogràfiques) descrites en aquestes fonts textuals és important per a la creació i / o extensió de bases de coneixement musicals que puguin ser utilitzades no només en sistemes de recomanació de artistes i cançons, sinó també i, des d'una perspectiva més genèrica, per a la investigació en musicologia.

Aquesta idea sorgeix d'una col·laboració entre el Grup de Recerca en Tecnologia Musical (MTG), que coordina Xavier Serra i el Grup de Recerca en Tractament del Llenguatge Natural (TALN), al qual pertany Horacio Saggion. Tots dos, grups d'investigació adscrits al Departament de Tecnologies de la Informació i les Comunicacions (DTIC) de la Universitat Pompeu Fabra.

92.000 artistes, àlbums, cançons i companyies discogràfiques

Una idea que ha permès unir i combinar la recerca en tecnologia musical i en processament del llenguatge natural per desenvolupar un sistema automàtic per a l'anotació semàntica d'entitats musicals a text "lliure", de manera que els textos anotats queden connectats a bases de coneixement de caràcter obert, com ara Wikipedia.

Com a part d'aquesta reeixida sinergia, els investigadors han generat un nou recurs que anomenen Entity Linking in the Music Domain (ELMD) únic en la seva espècie, un nou sistema automàtic d'anotació de termes semàntics que, a partir de les biografies de músics, actualment ja ha aconseguit recopilar més de 92.000 entrades entre noms d'artistes (64.873), àlbums (16.302), cançons (8.275) i companyies discogràfiques (3.480). Un recurs de lliure accés i per a tota la comunitat.

Sergio Oramas, Mohamed Sordo i Xavier Serra (MTG), conjuntament amb costat de Luis Espinosa-Anke i Horacio Saggion (TALN),presenten els detalls tècnics i analítics d'aquest nou recurs en una comunicació a la 10a edició del congrés Language Resources and Evaluation Conference  (LREC) que tindrà lloc del 23 al 28 de maig a Portorož (Eslovènia).

Treball de referència:

Sergio Oramas, Luis Espinosa-Anke, Mohamed Sordo, Horacio Saggion, Xavier Serra (2016), “ELMD: An Automatically Generated Entity Linking Gold Standard Dataset in the Music Domain”, 10th Edition Language Resources and Evaluation Conference, 23-28 Maig 2016, Portorož  (Slovenia).

Crédits de la imatge:

By Unknown - http://lonestarstomp.blogspot.com/2008/12/much-busier-days-in-kermit-texas-post.html, Public Domain, https://commons.wikimedia.org/w/index.php?curid=7558657

 

Multimèdia

Categories:

ODS - Objectius de desenvolupament sostenible:

Els ODS a la UPF

Contact