Otra Inteligencia Artificial Musical es posible

Otra Inteligencia Artificial Musical es posible

por Xavier Serra, Frederic Font, Martin Rocamora
19.05.2025

Imatge inicial -

 

English version

Por una IA colaborativa, abierta y ética desde y para la comunidad musical

Vivimos un momento de inflexión. La inteligencia artificial generativa está transformando todos los sectores creativos, y la música no es una excepción. Nuevas herramientas son capaces de generar paisajes sonoros, melodías o piezas completas con una sola indicación textual. Pero estas tecnologías no son neutras: los modelos que las sustentan se entrenan con grandes cantidades de datos —sonidos, músicas, voces—, a menudo obtenidos sin consentimiento ni reconocimiento a sus autores. En este contexto, el reto no es solo técnico o legal, sino profundamente cultural y político. ¿Qué tipo de inteligencia artificial queremos para la música? ¿Qué papel deben jugar los músicos, los investigadores, las comunidades creativas?

Desde el Music Technology Group (MTG) de la Universitat Pompeu Fabra de Barcelona, en el contexto de la Cátedra UPF-BMAT en en IA y Música, proponemos pensar y construir una inteligencia artificial musical distinta: una IA colaborativa, abierta y ética. No se trata solo de criticar lo que ya existe, sino de mostrar y fomentar alternativas concretas que están siendo desarrolladas desde el ámbito académico, comunitario y creativo.

Los datos como materia prima

La mayoría de los modelos generativos de audio actuales necesitan enormes volúmenes de datos para aprender: grabaciones, composiciones, textos, metadatos. Sin esta materia prima, el modelo no puede funcionar. Pero no basta con tener sonidos; es necesario que estos vengan acompañados de contexto. Los metadatos —etiquetas, descripciones, licencias— permiten a los modelos entender (o al menos, representar) aspectos fundamentales del sonido, desde su fuente hasta su uso musical. La proveniencia de estos datos, y sus permisos de uso para entrenar modelos generativos, son un factor muy importante que se debe contemplar y clarificar.

Freesound, una plataforma creada por el MTG en 2005, representa un ejemplo pionero de cómo se puede compartir sonido de forma abierta y responsable. Con más de 680.000 sonidos disponibles bajo licencias Creative Commons, Freesound no solo ha servido a millones de creadores en todo el mundo, sino que también ha alimentado investigaciones científicas y entrenamientos de modelos de IA. Lo importante es que Freesound da herramientas  a los usuarios para que puedan definir cómo quieren que se usen sus sonidos: si pueden ser reutilizados con fines comerciales o si deben mantenerse en entornos abiertos.

Aunque el caso de Freesound es tan solo un ejemplo, representa un enfoque  radicalmente diferente del que siguen muchas empresas tecnológicas, que extraen datos de forma opaca, sin permiso explícito, aprovechándose de la falta de regulación. La consecuencia es una creciente desconfianza por parte de los artistas hacia la publicación abierta de sus obras, y un riesgo de empobrecimiento del ecosistema creativo. Pero Freesound busca demostrar que otra relación con los datos es posible: una que respete la voluntad de los autores y promueva usos responsables.

 

Modelos generativos: transparencia, reutilización y comunidad

El impacto de la IA generativa en la música ya es evidente. Algunas formas de música de producción o de stock están siendo reemplazadas por contenidos generados automáticamente. Pero más allá de esta dimensión utilitaria, existe un potencial creativo enorme: los modelos pueden ser herramientas para ampliar las posibilidades expresivas de los artistas, ayudarlos a explorar nuevas sonoridades, transformar sus procesos de composición o experimentar con formas colaborativas.

Para que esto ocurra, sin embargo, es fundamental que los modelos sean abiertos. Esto significa que sus componentes principales —los datos de entrenamiento, el código para entrenar y ejecutar, y los parámetros del modelo entrenado— estén disponibles de forma transparente y reutilizable. Solo así se puede garantizar que los modelos puedan adaptarse a distintos contextos, auditarse, mejorarse, o servir de base para nuevas creaciones.

La diferencia entre un modelo abierto y uno cerrado no es solo técnica, sino política. Mientras que plataformas como Suno o Udio operan como cajas negras —con modelos entrenados en secreto y ofrecidos como servicios de pago sin posibilidad de adaptación—, los modelos abiertos permiten que la comunidad participe activamente en su desarrollo. Son tecnologías que no se imponen, sino que se construyen con y para los usuarios.

Desde el MTG promovemos activamente este enfoque. Investigadores del grupo desarrollan modelos entrenados con bases de datos abiertas como Freesound (disponibles en Essentia), y promueven modelos abiertos como RAVE, que permiten a los artistas desarrollar y personalizar sus propias herramientas. En paralelo, mantenemos un leaderboard de modelos musicales generativos abiertos, que documenta el estado del arte y promueve la evaluación colaborativa.

Ética, responsabilidad y visión de futuro

El origen de la inteligencia artificial se encuentra en contextos académicos y colaborativos, muy vinculados al software libre y la ciencia abierta. Sin embargo, el auge reciente de la IA generativa ha desplazado ese espíritu: las grandes corporaciones tecnológicas lideran el desarrollo, imponen sus reglas y capitalizan los beneficios. Frente a esto, el sector musical tiene el reto —y la oportunidad— de recuperar el liderazgo desde lo público, lo creativo y lo colaborativo.

Para avanzar en esta dirección, es necesario articular una serie de acciones concretas. En primer lugar, fomentar espacios de colaboración interdisciplinaria donde músicos, ingenieros e investigadores trabajen juntos desde el diseño de las herramientas. En segundo lugar, promover proyectos de código abierto y ciencia abierta, apoyados por infraestructuras públicas que no dependan de las grandes tecnológicas. También es urgente desarrollar mecanismos de financiación alternativos —desde becas y subvenciones públicas hasta formas de cooperación distribuida— que garanticen la sostenibilidad de estos proyectos. Y, por supuesto, formar a los agentes culturales en el uso crítico y creativo de la IA, para que no sean solo usuarios pasivos de lo que ya está dado, sino protagonistas activos del cambio.

Todo esto debe sustentarse sobre una base ética clara: una visión compartida donde la innovación tecnológica esté al servicio del bien común, de la diversidad cultural, de la creatividad colectiva. Una IA que no sustituya a los creadores, sino que los potencie. Que no compita con las obras, sino que abra nuevas formas de colaboración y experimentación.

Hacia una inteligencia artificial musical de todos y para todos

En el MTG trabajamos desde hace años para construir esta alternativa. No como una utopía lejana, sino como una práctica concreta y diaria: en nuestras plataformas, nuestros modelos, nuestras colaboraciones. Sabemos que es posible desarrollar una inteligencia artificial musical que respete a los creadores, que los sitúe en el centro, que devuelva a la comunidad lo que toma de ella.

Pero este camino no se puede recorrer en solitario. Es necesaria la participación activa de músicos, productores, investigadores, colectivos, instituciones. Necesitamos imaginar juntos qué tipo de tecnologías queremos para el futuro de la música. Y sobre todo, necesitamos actuar: subir sonidos, etiquetarlos, compartirlos, contribuir al desarrollo de modelos, exigir transparencia, crear nuevas herramientas, educar, regular, colaborar.

Porque el futuro de la música con IA no debe definirse únicamente por lo que es técnicamente posible o económicamente rentable, sino por lo que es justo, sostenible y musicalmente significativo.

Otra IA es posible. Y necesita de todos nosotros.

 

 

Cátedra UPF-BMAT en Inteligencia Articial y Música (TSI-100929-2023-1). Proyecto financiado por la Secretaría de Estado de Digitalización e Inteligencia Artificial, la Union Europea-Next Generation EU, y BMAT Music Innovators, the Music Operating System