Com conviurà la IA amb la música humana? El futur ha arribat
Com conviurà la IA amb la música humana? El futur ha arribat
Reportatge de Karma Peiró*
Imagina un món en què la propera cançó d'èxit no l'escrigui una persona que compon, sinó una màquina. Aquest futur podria haver arribat. Després dels ràpids avenços de la intel·ligència artificial i d’altres noves tecnologies, el Music Technology Group (MTG) de la Universitat Pompeu Fabra ha dirigit un projecte per analitzar els canvis en la manera de crear, distribuir i escoltar música.
La música composta per ordinador no és nova: les primeres composicions d'aquest tipus es remunten a la dècada dels 50. Però, quan el 2017 la banda MUSE va generar un vídeo per al seu nou single "Dig Down" i va utilitzar les últimes novetats en intel·ligència artificial (IA) i capacitats d'aprenentatge automàtic, la resposta dels fans va ser enorme. L'eina utilitzada per la banda va ser el rastreig per Internet per trobar centenars d'hores d'imatges de famosos, polítics i artistes. A continuació, els clips es van ‘entrellaçar’ entre ells, per a la qual cosa es van utilitzar senyals temporals de la cançó original, amb cada lletra pronunciada per una persona diferent.
"La intel·ligència artificial s'utilitza sovint de forma molt invisible, per això va ser emocionant el fet de treballar amb el grup en un projecte que la posava en primer pla", informa Branger Briz, l'agència de desenvolupament tecnològic que va col·laborar amb el grup. "Creiem que és important el debat públic sobre les promeses i els perills d'aquestes tecnologies emergents i amb una influència increïble".
Només dos anys després, el grup de pop transfronterer YACHT va anar encara més lluny. La banda es va proposar el major repte dels seus disset anys de carrera convidant la IA a participar en el seu procés creatiu. "Volíem trobar una manera de qüestionar la tecnologia més profundament", explica la vocalista Claire L. Evans. Evans i els seus companys de banda -Jona Bechtolt i Rob Kieswetter- van seleccionar a mà les seves composicions preferides d’IA i després les van incorporar a les cançons que componen l’àlbum d’èxit nominat als Grammy, Chain Tripping. "Realment, no sabíem el que era possible fer amb la intel·ligència artificial. Només sabíem que d'alguna manera havia d'anar més enllà de la música ambiental generativa", va argumentar Evans en una xerrada per a Google.
Per produir-lo, la banda primer va intentar desenterrar qualsevol fórmula existent de YACHT, a partir de la col·laboració amb enginyers i tecnòlegs creatius i explorant el seu propi catàleg de 82 cançons mitjançant eines d'aprenentatge automàtic. Melodies, lletres, il·lustracions i vídeos es van crear amb aquest sistema intel·ligent. "Aquest disc és producte d'un moment tecnològic que evoluciona ràpidament. No ens vam proposar produir música generada amb algoritmes que pogués ‘semblar’ humana. Ens va ensenyar tot el que volíem saber sobre nosaltres mateixos: com treballem, què ens mou i quins terrenys paga la pena explorar malgrat la seva ambigüitat”, explica Evans.
Tot el procés es va plasmar en el documental The Computer Accent (estrenat el 2022), que documenta la recerca, composició i enregistrament i permet a l'espectador experimentar els temors i la sorpresa de la banda davant les potencials capacitats de la IA actual. La realització d'aquest àlbum va suscitar preguntes sobre el seu paper en un futur, ja que el programari anticipa, genera i fins i tot sintetitza el treball humà, així com sobre les qüestions ètiques rellevants del moment.
Tots dos exemples, de MUSE i YACHT, ja estaran desfasats quan llegeixin aquest article. Com s’explicava al principi: la música composta per ordinador no és res de nou, però la diferència avui és que aviat, gràcies a la IA, s'obrirà la possibilitat de crear la propera cançó d'èxit sense cap coneixement o habilitat musical prèvia. Qualsevol podria fer-ho. Llavors, serà la IA una aliada de la creativitat musical? La música generada per màquines pot tenir el mateix efecte en els oients que la música feta per humans? Amb quina rapidesa adoptarà la indústria aquesta innovació i amb quina rapidesa l'adoptarem nosaltres? Quines qüestions ètiques planteja aquesta revolució? Encara no hi ha respostes concretes.
La tecnologia avança a la velocitat de la llum. Almenys, això és el que sembla. I no estem frenant, sinó volant a una súper velocitat cap a una destinació desconeguda. Estem en un avió, als núvols, sense una visió clara, amb poques pistes sobre on acabarem i moltes preguntes sense resposta. Cordeu-vos els cinturons, ens espera un viatge mogudet.
L'objectiu de reunir totes les veus
La intel·ligència artificial és avui l'estrella de les tecnologies de l'àmbit creatiu. L'any passat, ens vam quedar entusiasmats i bocabadats amb els sistemes que generen imatges a partir de descripcions de text, com Dall-E, Midjourney o Stable Diffusion. Era lògic que suposéssim que la innovació relacionada amb la música podria ser la fase següent.
En l'últim trimestre de 2022, el Music Technology Group (MTG) de la Universitat Pompeu Fabra va posar en marxa el projecte Reptes i Oportunitats en tecnologia musical per identificar com la IA i altres noves tecnologies estan canviant els processos de creació, distribució, aprenentatge i escolta de música.
Per desenvolupar solucions que donin suport a una transformació digital justa i transparent del sector, és crucial comprendre les necessitats i preocupacions de totes les parts interessades. Des del 1994, l’MTG investiga a escala internacional temes com el processament de senyals d'àudio, la recuperació d'informació musical, les interfícies musicals i la musicologia computacional. El seu objectiu principal és la contribució a la millora de les tecnologies de la informació i la comunicació relacionades amb el so i la música i, alhora, la comunicació dels seus descobriments a la societat en general: "El concepte ciència oberta és fonamental en el món acadèmic, i això significa que volem evitar l'aïllament. Durant anys, hem fet grans esforços per ser més accessibles, i aquest projecte va en aquesta direcció", explica Xavier Serra, director de l’MTG.
Amb aquest objectiu definit, de setembre a desembre de 2022, aquest grup de recerca va celebrar un debat obert entre les principals parts interessades del món de la música (executius de la indústria, creadors, oients, estudiants de música, arxivers, desenvolupadors, etc.) per analitzar els reptes i oportunitats de la IA per al sector musical, a més de l’impacte que tindrà en la societat i la cultura, probablement molt important. "Aquest canvi tindrà implicacions per a tots, no tan sols per als músics del sector. Per això ens va semblar important escoltar també les veus silencioses implicades en aquest canvi tecnològic", afegeix Serra.
"Com estan canviant la IA i altres noves tecnologies els processos de creació, distribució, aprenentatge i escolta de música?"
A través de diversos formats -enquestes, entrevistes en profunditat i un esdeveniment presencial amb el públic-, es van dedicar quatre mesos a recopilar pensaments, reflexions, preocupacions i aspiracions futures del sector musical en relació amb la intel·ligència artificial i altres tecnologies emergents com el blockchain i el metavers. Aquest article reflecteix els debats, suggeriments i comentaris de cent col·laboradors, tant del sector musical internacional com del local, compromesos amb la creativitat, l'escolta, l'educació i l'arxiu de la música que consumim a dia d’avui.
L'aprenentatge automàtic
Una de les principals conclusions del projecte MTG és que els músics "sens dubte es beneficiaran molt aviat de la IA". La IA podria ajudar els músics en tota una sèrie de tasques: composició, síntesi, cerca de mostres, mescla i masterització. Això no obstant, alguns dels enquestats van assenyalar "problemes amb interfícies poc amigables, habilitats difícils d'adquirir o simplement resultats poc convincents".
La solució podria venir de la mà de Google. El gener de 2023, es va estrenar l'última eina d’IA de la companyia tecnològica, que simplificava el que semblava un inconvenient per al sector. El sistema pot generar música, de qualsevol gènere, a partir d'una descripció de text. L'article "MusicLM: Generating music from text" descriu com es va entrenar l'algoritme amb un conjunt de dades de 280.000 hores de música per generar peces d'un minut de durada a partir d'indicacions o descripcions de text. Per als qui no desitgin cursar tres o quatre anys de carrera musical o una formació tècnica que requereixi molt de temps, tot el que necessita aquesta nova eina és una breu instrucció, per exemple: "Crea una melodia de jazz suau amb un solo de saxòfon que enganxi i un cantant solista" o "Tecno berlinès dels 90 amb un baix greu i un so fort de bombo de bateria".
Aquesta màquina pot fer música de forma tan creativa com la que fan els humans? Si és així, podria convertir-se en una inspiració, en una companya, en la solució perfecta al bloqueig de l'escriptor. Però si les composicions de la màquina compten amb l'aprovació dels oients, serà la IA una competència per als músics?
"Els músics es beneficiaran sens dubte de la IA en tasques com la composició, la síntesi, l'exploració de mostres, la mescla i la masterització"
La situació actual també planteja altres reptes derivats de la relació amb les noves tecnologies. El 71% dels participants en l'enquesta del projecte MTG creu que la IA podria conduir a una sobreproducció i a una disminució del valor musical. Sobre aquest darrer punt, ja és un fet que l'aspecte econòmic de la creació musical s'està diluint. L'estudi "Music creators' earnings in the digital era", publicat per l'Oficina de Propietat Intel·lectual del Regne Unit el 2021, confirma aquests temors. Aquest estudi pioner conclou que només aquells artistes que aconsegueixin al voltant d'un milió de streams (reproduccions en plataformes d’streaming que no requereixen descarregar la cançó) al mes durant un període prolongat podran viure de la música al Regne Unit. "Al Regne Unit, això suposa només el 0,4% dels músics de les plataformes d’streaming", diu l'informe.
S'acabaran els intermediaris?
En un context amb aquestes condicions, sorgeixen d’altres preocupacions relacionades amb la disrupció tecnològica que estem experimentant actualment. Per exemple, la reducció o desaparició de molts músics professionals. Què passarà amb els cantants d'estudi que -entre d’altres- es veuran afectats per la IA? La música funcional -com la que es pot escoltar en restaurants, balnearis, ascensors, etc., i que sovint passa desapercebuda per al públic al qual va dirigida- pot ser composta per màquines a dia d’avui. Sembla que aquest treball pot estar desapareixent com a activitat humana. Té sentit: quina empresa estaria disposada a pagar a un professional anònim quan pot obtenir centenars o milers d'hores de "muzak" (fil musical) lliure de drets a través d’una quota de subscripció?
L'homogeneïtzació i el predomini de l'estètica musical comercial occidental és una altra amenaça a la qual cal fer front. El que encara no està clar és si la música d’IA es limitarà a repetir el que ja coneixem, a l’entorn de temes trillats del pop global, o si tindrà la capacitat de treure a la llum noves joies sonores, descobrir territoris musicals inexplorats i crear nous gèneres que cap músic no hagi explorat encara.
"Ens dirigim a un món entre iguals on tota relació entre creadors i fans serà directa”
A més de la IA, altres tecnologies com blockchain/NFT o el metavers apunten a una possible transformació del sector musical, però encara amaguen moltes incògnites. Blockchain promet eliminar els intermediaris, però abans que això sigui una realitat, la qüestió és si la indústria ho permetrà. "Blockchain aportarà claredat als problemes actuals dels drets legals dels artistes. És una gran tecnologia que se centra principalment en els creadors i el públic", diu Marcelo Estrella, assessor de propietat intel·lectual d'Across Legal, especialitzat en tecnologia i innovació legal. "Facilita el procés de registre de transaccions i el seguiment d'actius en una xarxa empresarial. Als artistes, els permetrà disposar d'una completa base de dades que emmagatzemarà informació detallada sobre els drets d'autor i la propietat intel·lectual de la música. Això ajudarà els artistes a acreditar-se pel seu treball creatiu", afegeix.
"Immutable, transparent, públic i inalterable" són alguns dels qualificatius que utilitzen els partidaris del blockchain per afirmar que aquesta tecnologia està destinada a aplicar-se -en aquest àmbit- en un futur proper. "A més comptem amb l'avantatge de les NFT (representacions d'actius en les xarxes blockchain) com a vehicles, un enllaç directe entre creadors i audiències"- sosté Marcelo Estrella, que afegeix: "portarà a la inevitable eliminació dels intermediaris. Abordem un món peer-to-peer on “tota relació entre creadors i fans serà directa”. Això tindrà un fort impacte a la societat, com els pagaments instantanis a través dels contractes intel·ligents; o les dades que les audiències poden proporcionar als creadors".
Els humans al circuit d'interacció amb les màquines, sí o no?
Ningú no discuteix el fet que les actuals eines de IA tenen un enorme potencial, i es prediu que es descobriran nous sons i ritmes i s'inventaran nous gèneres gràcies a la interacció home-màquina. Els sistemes intel·ligents actuals poden crear música a una velocitat inimaginable fins ara. Però, desplaçarà la IA el creador musical i es convertiran els oients en fidels seguidors de cançons produïdes exclusivament per màquines?
"Per mi, si els humans es queden fora del circuit, serà un futur trist", diu Rob Clouth, artista multidisciplinari que treballa en els camps de la música electrònica, la sònica computacional i els nous mitjans. "Crec que sempre hi haurà músics artesans que apreciïn el procés de creació. Per mi, part del que significa fer música és pensar en allò que li agradarà a d’altres persones".
La comissària musical Antonia Folguera té una opinió diferent: "Com a oient, no m'importaria que la meva propera cançó preferida estigués feta per IA", diu. "Si és bona, per què no? Però seria una mica avorrit perquè voldria saber més sobre qui està darrere d'aquesta cançó. I si descobrís que l'autor és un programa informàtic, m'avorriria molt ràpid". No obstant això, Folguera confessa que, quan actua com a DJ, hi ha moltes ocasions en què busca un ritme o un so específic i, en aquest context, poder utilitzar la IA seria un gran avantatge. També troba bé treure als humans la càrrega d'haver de crear el que es coneix com a "música d'ascensor".
La productora de música electrònica experimental i professora titular de Tecnologia d'Àudio Musical a la Universitat De Montfort (Regne Unit) Anna Xambó, argumenta: "Per què no pensar amb originalitat i seguir les idees de l'investigador Nick Collins sobre la possibilitat d'un sistema autònom sense interacció amb els humans? Estem al principi del viatge". En aquesta línia, el AI Music Generation Challenge 2023 d'enguany, que en anys anteriors s'havia centrat en la creació de composicions tradicions musicals, se centra de fet en la creació d'una nova "tradició" de música artificial.
És normal tenir dubtes
Arribats a aquest punt, el debat deriva cap a qüestions ètiques inevitables, ja que sabem de bon inici que no existeix una resposta o solució segura. Si utilitzem la intel·ligència artificial per crear alguna cosa, qui ha de considerar-se propietari d'aquesta obra? Els programadors del model? Els autors del conjunt de dades d'entrenament? El formador, el comissari, el músic que hi ha darrere? L'empresa propietària del model o de l'eina? La pròpia IA? Hem de continuar atribuint-ne l'autoria a qualsevol? Què diuen les lleis actuals sobre aquest tema? Si encara no hem aconseguit una remuneració justa per als músics, com resoldrem aquesta ambigüitat tecnològica que analitza milions de sons per crear una cosa completament diferent?
Tots els consultats pel projecte MTG coincideixen en el fet que es tracta d'una qüestió difícil i que debatrem durant molt de temps. Tots els sistemes d'intel·ligència artificial més recents -com Dall-e i d’altres- ens donen resultats després de barrejar milions d'imatges, sons i textos sense acreditar mai un creador humà, i no ofereixen cap estímul perquè els usuaris aprofundeixin i explorin més a fons el treball dels artistes, escriptors, científics o investigadors originals. Si aquestes eines s'utilitzen a gran escala, dependrem cada vegada més dels seus resultats sense tenir l'oportunitat d'explorar el nostre passat d'una altra manera?
"Potser hauríem de reflexionar sobre la propietat col·lectiva, acceptar una multiplicitat d'autors, saltar-nos la figura romàntica del compositor"
L'artista Rob Clouth suggereix una solució: "Dall-e podria mostrar les deu imatges més semblants de la seva base de dades amb enllaços als llocs web dels seus autors. Això té més a veure amb l'atribució de l'autoria que amb la propietat, però val més això que res".
L'advocat Marcelo Estrella recorda el panorama actual a Europa. La legislació de drets d'autor de la UE preveu que les creacions d’IA es classifiquin com a "obres". Així que, tret que es pugui demostrar que la creació entra en un d'aquests supòsits, forma part directament del domini públic:
- Primer pas: La producció assistida per IA ha de ser una producció en l'àmbit literari, científic o artístic.
- Segon pas: El resultat de la IA ha de ser fruit de l'esforç intel·lectual humà.
- Tercer pas: La sortida assistida per IA ha de ser original.
- Quart pas: L'obra ha de ser identificable amb suficient precisió i objectivitat.
El domini públic significa que ningú no és propietari de l'obra, sinó que és propietat del públic. Qualsevol pot utilitzar una obra de domini públic sense permís i sense citar a l'autor original, però ningú pot ser-ne propietari. Per descomptat, aquestes possibles situacions es basen en els principis jurídics europeus. La situació és diferent en d’altres parts del món. Un llibre blanc del qual és autor Eric Sunray, passant jurídic de la Music Publishers Association i especialista del Washington College of Law de l'American University, sosté: "els generadors de música per IA violen els drets d'autor de la música en crear tapissos d'àudio coherents a partir de les obres que adquireixen en el seu entrenament, i infringeixen així el dret de reproducció de la Llei de Drets d'Autor dels Estats Units".
"Armilla salvavides sota el teu seient"
El debat ètic es va desencadenar quan, al gener d'enguany, un trio d'artistes -Sarah Andersen, Kelly McKernan i Karla Ortiz- van demandar a Stable Diffusion, Midjourney i la plataforma de carteres d'artistes DeviantArt perquè les seves obres es van utilitzar per a alimentar els algoritmes de IA. "Aquestes empreses han violat els nostres drets en entrenar les seves eines d’IA amb cinc mil milions d'imatges d'Internet sense comptar amb el consentiment dels artistes originals", informa la publicació Verge. "A mesura que aprenia més sobre com s'entrenen els models de IA per a mitjans audiovisuals, profundament explotadors, em vaig adonar que no hi havia cap precedent legal per restituir aquest dret". Karla Ortiz, va piular. "Hem de canviar això".
Karla és porto-riquenya, treballa en cinema, videojocs i televisió i és una apassionada defensora de la millora de les indústries i els drets dels artistes: "Estic orgullosa de ser una de les persones que pren part d'aquesta demanda col·lectiva. M'enorgulleix fer això amb companys, que donem veu a milers d'artistes potencialment afectades. Estic orgullosa que ara lluitem pels nostres drets no tan sols a l'esfera pública, sinó també als tribunals", afegeix.
No són els únics que denuncien la situació d’avantatge d'aquestes empreses d’IA. Getty Images també va iniciar un procediment judicial aquest mes de gener al Tribunal Superior de Justícia de Londres contra Stability AI i va al·legar que l'empresa havia infringit els drets de propietat intel·lectual. "Stability AI va copiar i va processar il·legalment milions d'imatges protegides per drets d'autor i les metadades associades, que són propietat o estan representades per Getty Images, i manca llicència per utilitzar-les en benefici dels seus interessos i en detriment dels creadors de continguts", segons recull un comunicat de Getty Images.
“A mesura que aprenia més sobre com s'entrena els models d’IA per a mitjans audiovisuals, profundament explotadors, em vaig adonar que no hi havia cap precedent legal per restituir aquest dret"
En resposta a aquesta polèmica, un altre grup d'artistes, Spawning, va llançar fa un parell de mesos la pàgina web “He estat entrenat?", que permet a qualsevol persona veure si les seves obres d'art s'han utilitzat per entrenar algoritmes de IA. "Seria poc pràctic pagar humans perquè escrivissin manualment descripcions de milers de milions d'imatges per a un conjunt de dades d'imatges", afirma el reporter d’IA i aprenentatge automàtic d'Ars Technica, Benj Edwards. "No busquen el consentiment perquè la pràctica sembla ser legal a causa de les decisions dels tribunals dels Estats Units sobre l'anàlisi de dades a Internet". Però un tema recurrent en les notícies sobre IA és que l'aprenentatge profund pot trobar noves maneres d'utilitzar dades públiques que no s'havien previst prèviament, i fer-ho de maneres que podrien violar la privacitat, les normes socials o l'ètica de la comunitat, fins i tot si el mètode és tècnicament legal".
Aquesta és la batalla lliurada fins ara en el camp de les imatges i els textos. Podem suposar que molt aviat veurem reaccions similars al sector de la música. En el seu tuit, el científic especialitzat en IA Jim Fan expressa molt clarament el moment que estem vivint: "La indústria de la música i els efectes de so no ha comprès del tot la dimensió de la tempesta que se’ns apropa. No n’hi ha un, ni dos, sinó quatre nous models (d’IA) d'àudio que han aparegut només en l'última setmana. Si el 2022 és l'any dels píxels per a la IA generativa, el 2023 és l'any de les ones sonores".
Potser hauríem de canviar les nostres expectatives sobre la propietat i buscar una iniciativa similar a les llicències Creative Commons (CC) que es van crear fa 20 anys i van ajudar a organitzar el permís per utilitzar una obra creativa, suggereix Anna Xambó. "Combino obres amb llicències CC amb els meus propis sons, i no saps de qui és cadascuna. A més, hi ha algunes peces en les quals influeix l’oient. Llavors, de qui és cada cosa? Potser hauríem de reflexionar sobre la propietat coral, acceptant una multiplicitat de creadors i saltant-nos la figura romàntica del compositor", conclou.
Dels artistes al públic
Entre els continus dilemes que planteja la tecnologia, no sempre és obvi on traçar la línia divisòria entre la producció i el consum de música, ja que totes dues parts estan interconnectades.
Com arriba la música dels creadors als oients i què passa en aquest procés quan intervé la IA? Les "recomanacions algorítmiques" no sols es descriuen com un "assoliment tecnològic excepcional", sinó també com quelcom que necessita millorar. Aquests sistemes, que estan en plataformes com Spotify o YouTube, entre d’altres, continuen sent percebuts pels professionals com a "caixes negres" i no donen cap pista sobre per què recomanen als oients una cançó i no una altra. Els músics han de dependre d'aquests algoritmes per augmentar els seus pressupostos publicitaris o arribar a nous grups objectiu. Es queixen de la manca de control sobre el funcionament d'aquests algoritmes.
Si avui ningú no s'atreveix a prescindir dels algoritmes de recomanació, el mateix passa amb les xarxes socials. Tots dos són clau per atreure noves audiències i retenir les existents, i són un gran problema per als creadors, que depenen cada vegada més de les grans empreses per presentar el seu treball al públic. D'altra banda, els participants en l'enquesta de MTG consideren que les xarxes socials són una amenaça potencial per a l'experiència auditiva, perquè destrueixen el context original de la música i fomenten una menor capacitat d'atenció. "Les cançons han anat sent cada vegada més curtes durant força temps, però recentment les durades s'han desplomat", anunciava l'informe "Durada de les cançons: Com ha canviat la tendència al llarg del temps i què significa avui?", dirigit pels investigadors Parth Sinha, Pavel Telica i Nikita Jesaibegjans.
"La tendència a la baixa de la durada de les cançons posa de manifest un clar patró de disminució de la capacitat d'atenció del consumidor mitjà de música. També suggereix que les cançons més curtes tenen més possibilitats d'arribar a més oients i captar la seva atenció. Això permet donar sortida a més material, que pot repartir-se entre un major nombre de cançons més curtes", declaren els analistes. Volen conscienciar sobre com la creativitat i la visió artística personal s'estan devaluant fortament. Quant ha de durar una cançó perquè ens agradi? Com a exemple extrem, la cançó viral de TikTok té una durada mitjana de 19,5 segons. "On està el límit entre satisfer les canviants preferències dels usuaris i, al mateix temps, deixar espai per a la innovació?", reclamen els autors d'aquest estudi. "La conclusió aquí és bastant òbvia: malgrat la innovació i l'accessibilitat, també hi ha un impacte en la mentalitat global de l'artista musical en la producció, creació i promoció", raonen.
Altres qüestions plantejades en l'enquesta de l’MTG tenien a veure amb el binomi artista-públic, per exemple se'ls preguntava per l'opinió, molt arrelada en la indústria, que els artistes necessiten ser millor compensats; una preocupació que la pandèmia i el període post pandèmic han aguditzat més a dia d’avui. Des del públic, es va fer una crida per permetre o fomentar les connexions directes amb els artistes i el seu públic local, i millorar la qualitat del so tant en streaming com en directe. Alguns enquestats també van suggerir habilitar "experiències de realitat virtual", en esdeveniments privats i col·lectius.
Sobrecàrrega i devaluació
La sobrecàrrega d'informació i la devaluació de la música en les plataformes d’streaming és un altre motiu de preocupació: "La música a tot arreu i en qualsevol moment ha empitjorat l'experiència de l'escolta com a activitat cultural", afirmen alguns participants en l'enquesta. Recentment, s'ha informat que "cada dia es pugen 100.000 cançons als serveis d’streaming", la qual cosa també dificulta cada vegada més que els artistes emergents, o fins i tot els consagrats, s'obrin pas i es facin notar. A més, gairebé el 80% dels artistes a Spotify tenen menys de 50 oients mensuals, segons l’informe anual de 2021 de l'empresa.
Al final, quins seran els reptes més importants que la IA aportarà al públic musical? Experts de plataformes d’streaming i desenvolupadors de programari d’IA tenen ara la paraula. El director sènior d’investigació de la plataforma PANDORA, Fabien Gouyon, ens insta a ser menys pessimistes, a mirar el costat positiu i a considerar també les oportunitats que presenta la tecnologia actual. "Un repte que tenim és com trobar la interactivitat adequada per oferir a l'usuari. Per això, existeixen diverses possibilitats: des de la possibilitat que els oients es limitin a prémer passivament “play” fins que tinguin la capacitat d'ajustar ells mateixos els algoritmes als seus gustos i segons la seva pròpia curiositat. Quin és l'equilibri adequat per a tots?"
"Cada dia es pugen 100.000 cançons a les plataformes , però la majoria dels artistes tenen menys de 50 oients mensuals"
El director d'Innovació de l'empresa de tecnologia musical BMAT, Gonçal Calvo, creu que el repte més important actualment és la sobreproducció de música. "La digitalització ens dona una quantitat massa abundant i aquest fet planteja problemes en relació amb la gestió dels drets d'autor o els models de negoci. És possible una economia sostenible amb 100.000 noves cançons cada dia? Preveig fortes tensions l'any vinent entorn a aquesta qüestió". Calvo opina que les empreses estan incentivant la música creada per a la plataforma: "Els compositors saben quines coses sonaran millor a la llista de reproducció i la recompensa que els espera si la cançó es reprodueix més de 30 segons. Hi ha un ganxo i l’oient queda atrapat".
Ja el 2018, l'escriptora i editora establerta a Nova York Liz Pelly va destacar aquesta qüestió en un article per a la revista Baffle: "Les tendències musicals produïdes en l'era de l’streaming estan intrínsecament connectades amb l'atenció, ja siguin ganxos per a captar l'atenció durs i ràpids, gotes de pop i tornades en bucle dissenyades per als centres de plaer dels nostres cervells, o música que estratègicament no requereix atenció en absolut: la música de fons, la música de fons emocional o temes populars de la llista de reproducció chill-pop-sad-vibe", diu. Pelly treballa actualment en el seu primer llibre, "Mood Machine: The Rise of Spotify and the Costs of the Perfect Playlist", que publicarà Astra House el 2024.
Com a enginyer musical especialitzat en IA i consultor d'empreses de tecnologia musical, Valerio Velardo creu que la relació actual entre artistes i públic pot canviar molt gràcies a les tecnologies emergents. "A dia d’avui, els oients es poden convertir en creadors de música amb eines d’IA. Poden compartir experiències musicals a través de la realitat virtual i el Metavers; i utilitzar plataformes per superar la distància entre artistes i oients, com en el cas de l'empresa xinesa Tencent, en la qual els ingressos ja no estan vinculats a l’stream, sinó que es generen principalment a través d'enfocaments basats en la participació de fons d'inversió." Un altre punt, potser no tan agradable, és que els serveis d’streaming de Tencent Music inclouen ara més de 1.000 cançons amb veus generades per IA creades per l'empresa xinesa, i totes aquestes pistes acumulen ja, no milions, sinó milers de milions de reproduccions! S'aprofitaran massa els serveis d’streaming de les seves posicions d’avantatge, fins al punt de destronar les grans discogràfiques?
"Pots dir que soc un somiador..."
O podem imaginar un futur proper en el qual el sector musical no depengui únicament de les plataformes d’streaming? És cert que aquestes empreses disposen de grans quantitats de dades, compostes per milions de dades sobre el comportament dels usuaris, i quantes més dades es tenen, millor funcionen els sistemes intel·ligents que hi ha darrere de les plataformes més populars. Però, és possible preveure que en cinc o deu anys pugui haver-hi projectes alternatius de petites empreses, grups musicals o professionals individuals que també ofereixin música per d’altres vies?
Amb aquesta idea al cap, Jordi Pons, investigador de Dolby Laboratories, explica que un objectiu futur podria ser crear un flux de treball fàcil que els artistes independents poguessin utilitzar per crear nou material amb IA sense haver d'invertir temps en aprendre com funcionen aquestes eines. Segons el director de recerca PANDORA, els grans canvis no vindran de les grans companyies. "Fins ara, tenim innumerables exemples: BMAT, que va començar com una start-up i ha trastocat completament la indústria musical en els últims 15 anys; Moises, que utilitza tècniques de separació d'àudio amb IA per eliminar o aïllar veus i instruments, ajustar la velocitat i el to, i habilitar el metrònom en qualsevol cançó; i VoctroLabs, fundada el 2011 per quatre experts en música que ha fet coses increïbles i va ser comprada per Voicemod, una empresa de veu augmentada amb IA el desembre de l'any passat", explica Fabien Gouyon.
Gonçal Calvo, de BMAT, assenyala que "ningú no està lliure de la disrupció en aquest camí de la tecnologia tan ràpid en què vivim. Si desapareixen els drets d'autor, BMAT deixarà de tenir sentit. O ens reinventem entenent el que el mercat necessita, o en vindrà un altre", afirma Calvo. "La tecnologia ha impactat sobre el sector musical. Recorda com escoltaven música els seus pares quan eres nen i pensa com ho faran els teus fills".
"Guardant les distàncies"
Un altre somni per als propers anys és millorar les connexions entre artistes i oients. Com ho podem aconseguir? Quines estratègies existeixen ja a la indústria musical que podrien veure la llum en un futur proper? "El més important és la forma amb què poden interactuar. La gran empresa xinesa Tencent està passant d'un model d'ingressos basat en fluxos a un altre basat en fons", explica Valerio Velardo. "Això permet als artistes reunir-se amb els oients en determinats moments per cobrar, per exemple, quan un artista es reuneix amb fans, o quan el públic canta en un karaoke, etc. Mitjançant aquest model, que es basa en la idea de convertir en simbòlica la relació entre artistes i oients, poden guanyar-se la vida de manera justa. Encara no ho hem explorat a Occident, però la disrupció del negoci ve del mercat xinès. Perquè el veritable valor de la música està en aquestes experiències úniques".
Les xarxes que posen en contacte artistes i aficionats no són un concepte totalment nou. Fa un parell de dècades, Last.fm, un lloc web de música creat al Regne Unit el 2002, utilitzava un sistema de recomanació de música per construir un perfil detallat dels gustos musicals de cada usuari mitjançant el registre dels detalls de les cançons que l'usuari escoltava, ja sigui d'emissores de ràdio per Internet, o de l'ordinador de l'usuari o de molts dispositius de música portàtils. Aquesta informació es transferia (a través d'un sistema per gravar les preferències musicals de cada usuari per a fer-li recomanacions similars) a la base de dades de Last.fm a través del reproductor de música (inclosos, entre d’altres, Spotify, Deezer, Tidal, MusicBee, SoundCloud i Anghami) o a través d'un plug-in instal·lat en el reproductor de música de l'usuari. Les dades es mostraven en la pàgina del perfil de l'usuari i es recopilaven per crear pàgines de referència d'artistes individuals. Anteriorment, el lloc oferia un servei d’streaming de ràdio, que va deixar de funcionar el 2014.
"La disrupció comercial ve ara del mercat xinès. El valor real de la música resideix en aquestes experiències úniques"
Pot la tecnologia actual millorar el que Last.fm podia oferir llavors? "Amb la tecnologia que s'ha desenvolupat en els últims 20 o 25 anys, tenim oportunitats que abans no teníem", opina Valero. "I no em refereixo només a la música amb IA. Hi ha milers d'artistes que han descobert Bandcamp, aquesta comunitat musical de botigues de discos online que et dona oportunitats que jo mai no vaig tenir de nen". I com afirma el director de recerca de PANDORA, Fabien Gouyon, "la gent continuarà anant físicament a un concert, i recomanarà música als seus amics sense recórrer a un ordinador. Els programes de recomanació no ho substituiran tot".
Llista de desitjos per al futur
Si féssim una llista amb allò que serà imprescindible per als propers anys en relació amb la creativitat musical i l’escolta de música, què hi hauria? I què hi voldríem evitar? "M'agradaria que hi apareguessin nous gèneres musicals, nous sons, nous balls, diferents instruments, diferents maneres d'interpretar", diu la comissària Antonia Folguera. "No m'agradaria que les plataformes d’streaming hi llancessin música barata generada per intel·ligència artificial", afegeix l'artista Rob Clouth.
"M'agradaria veure sistemes més personalitzats, experiències úniques per a cada oient humà i no humà, música que no estigui influenciada pels humans. Quant a possibles temors... la producció de música avorrida, tota produïda amb les mateixes eines, l'homogeneïtzació de la música occidental. I que els sistemes es converteixin en "caixes negres". Quan es tornen cada vegada més complexos, no hi ha transparència, i és important veure el que hi ha entre bastidors", reflexiona la investigadora Anna Xambó.
"Avui dia tenim a les nostres mans eines per democratitzar-hi l'accés, donar veu a tothom i fer possible guanyar diners de maneres que avui són impossibles. Hi ha lloc per a tots, hem d'invertir en la idea que passaran grans coses. Cal tenir coratge i conèixer les eines necessàries per avançar", conclou l'advocat Marcelo Estrella.
S'obre un món d’enormes possibilitats que la gent sabrà aprofitar. S'acosta una era d'ús i gaudi individualitzat i personalitzat de la música. O imagineu-vos la idea de música terapèutica basada en bio/neurofeedback. O música que rastreja i reacciona a les nostres emocions.
Què significa el fet de ser humà?
Finals de febrer del 2023. L’Auditori de Barcelona programa un concert íntim de música que es podria classificar com a música de cambra. Sobre l'escenari, un dels últims projectes del bateria noruec Thomas Strønen: 'Time is a blind guide'. La seva banda -el violinista Håkon Aase, Leo Svensson Sander al violoncel i Ole Morten Vågan al contrabaix- està acompanyada per l'exquisida pianista japonesa Ayumi Tanaka. És una hora de pura improvisació, on la música flueix en perfecta connexió entre els músics i el públic. Les composicions són només una guia. El llenguatge visual de mirar als ulls és suficient perquè els músics sàpiguen com fer evolucionar els temes i quan deixar de tocar. Abans d'acabar el concert, el líder del grup demana a un músic turc que pugi a l'escenari, i aquest toca una delicada flauta amb reminiscències íntimes. La mescla de cultures, sensibilitats i proeses artístiques fa que aquest concert sigui especialment singular: "Tinc la sort d'estar envoltat d'éssers humans increïbles i artistes fantàstics", diu Strønen al final, i el públic aplaudeix en agraïment per una trobada excepcional.
Pareu un moment per a reflexionar sobre el que significa la música per a la humanitat. A més del gaudi i connexió amb els altres -i com a font d'ingressos per a la indústria i els músics professionals-, té un enorme significat cultural en termes d'història, tradicions, espiritualitat i pràctiques religioses. "La música és universal, es transmet de generació en generació, sol interpretar-se en presència d'uns altres i té una antiguitat extrema", afirmen els autors de l'article científic: "Perspectives transculturals sobre la música i la musicalitat". Tindran també la IA i les tecnologies emergents aquest poder de fer-nos sentir que pertanyem a un grup social o que n’estem separats?
Per tot arreu, es creu que la música afecta les nostres emocions, que implica algun tipus d'excitació, "que va des d'un lleu plaer o disgust fins a estats de consciència profundament transformats", afirma l'article científic. Podrà la intel·ligència artificial despertar aquests sentiments, estimular els sentits i fer-nos sentir sorpresa i connexió de la mateixa manera? Si és així, dilueix o fins i tot elimina alguna cosa que ens fa humans? Continua sent pertinent aquesta pregunta en un món globalitzat en el qual la tecnologia està ja tan arrelada?
Continuem estam als núvols, amb poques pistes sobre on acabarem. Hi ha moltes preguntes sense resposta, però el que sí que sabem és que podem trobar-nos amb turbulències.
Metodologia: Com hem arribat fins aquí?
Aquest article resumeix les principals conclusions del projecte Challenges and Opportunities in Music Tech liderat per l’MTG. És només un començament, una manera d'organitzar el debat actual sobre com la IA i les noves tecnologies canviaran el sector de la música en els propers anys. L'objectiu del projecte era escoltar, recollir les opinions dels principals interessats i compartir-les.
L'equip va passar quatre mesos entrevistant executius de la indústria, creadors musicals, oients, estudiants de música, arxivers i desenvolupadors. "Volíem contribuir a la indústria organitzant aquests debats", afirma el director de l’MTG, Xavier Serra.
L'equip va partir d'un qüestionari i va intentar dividir els temes d'interès en quatre àrees: "Creació musical", "Audició musical i públic", "Educació musical" i "Arxius musicals". La primera fase va consistir en recollir respostes de més de 80 experts internacionals i locals del sector musical.
La segona fase va consistir en la selecció de deu experts perquè analitzessin aquests temes en profunditat amb creadors musicals, investigadors, desenvolupadors musicals, professors, comissaris musicals i artistes en una sèrie de 10 entrevistes de més d'una hora de durada cadascuna.
L'últim pas era organitzar un acte obert i presencial amb el públic. Per a dissenyar com havia de ser aquesta reunió, l'equip va haver de confrontar el treball ja realitzat (conclusions de les enquestes i les entrevistes) i sospesar com resumir els principals temes de debat. Era clar que el tema principal seria la intel·ligència artificial, però l’MTG també volia aportar opinions que de vegades no estan representades als mitjans de comunicació generalistes. "Al mateix temps, la nostra intenció era representar el major nombre possible de veus diferents, perquè aquest debat no es pot centrar només en un àmbit, ja sigui l'acadèmic, l'industrial o el polític. Té implicacions per a tots. Per això, és necessari que tots participin en la discussió", afirma Serra.
En tenir accés tant als coneixements com als últims avenços tecnològics, l’MTG havia d'assegurar que tots escoltessin les opinions dels altres. Així, en dos pànels de debat ("Creació musical" i "Escolta musical"), vuit representants del sector musical van compartir els seus punts de vista sobre els avantatges, oportunitats, riscos, temors i qüestions ètiques, en un debat que va durar quatre hores.
"Els oients -als quals no se sol escoltar ni tenir en compte, però que són crucials perquè són els que compren i consumeixen música i van als concerts- també han d'estar representats al nostre projecte. També volíem que la gent que no forma part de les companyies pogués donar la seva opinió", afegeix Xavier Serra.
El debat en tots els àmbits i amb totes les parts interessades no ha fet més que començar. El següent pas per l’MTG és aprendre dels resultats d'aquest debat per definir les seves prioritats de recerca. Existeixen oportunitats enormes per desenvolupar noves i millors tecnologies de IA que acompanyin totes les parts interessades en la música. Això no obstant, de les opinions plantejades es desprèn clarament que aquestes tecnologies han de donar prioritat a les preocupacions ètiques i ser transparents davant de la societat.
Un agraïment especial als professionals que han contribuït al projecte, amb la seva participació en entrevistes en profunditat i com a ponents en el debat obert:
- Malcolm Bain: advocat (Across Legal)
- Gonçal Calvo: director d'Innovació (BMAT)
- Oscar Celma: director d'Enginyeria (Spotify)
- Rob Clouth: creador de música
- Marcelo Estrella: advocat, a través de Legal
- Antonia Folguera: comissària, Festival Sónar
- Cristina Fuertes: professora de Música (Institut Obert de Catalunya -IOC-)
- Emilia Gómez: investigadora principal (Centre Comú de Recerca-Comissió Europea)
- Fabien Gouyon: director de Recerca (Pandora)
- Rujing Huang: Etnomusicòleg i músic (Universitat de Hong Kong)
- Lucca Andrea Ludovico: investigador (Laboratori d'Informàtica Musical de la Universitat de Milà)
- Jordi Pons: investigador (Dolby)
- Jordi Puy: director general (Drets d'Unison)
- Raúl Refree: creador i productor musical
- Robert Rich: creador i productor musical
- Valerio Velardo: consultor sobre IA i música
- Anna Xambó: investigadora i creadora musical (Institut de Creativitat Sonora-Universitat DeMontfort)
I també gràcies a tots els que han participat en l'enquesta d'opinió.
El Music Tecnhology Group
El Music Technology Group (MTG) de la Universitat Pompeu Fabra de Barcelona compta amb una àmplia experiència en la realització de projectes de recerca amb impacte en la societat. Creat el 1994, el grup de recerca compta amb més de 30 membres que treballen en diferents temes relacionats amb les tecnologies aplicades a la creació, comprensió, consum, educació i benestar musical. Alguns dels productes més populars sorgits dels projectes del grup de recerca són: Reactable (instrument digital interactiu), Vocaloid (sintetitzador de veu cantant) o Freesound (plataforma d'intercanvi de sons).
En concret, el grup compta amb una àmplia experiència en recerca i desenvolupament de sistemes de recomanació, i ha estudiat l'impacte de la tecnologia musical en la diversitat cultural i de gènere, publicant articles científics sobre aquests temes. El fet que l’MTG sigui un grup de recerca en la intersecció dels sectors de la música i la tecnologia, facilita que el grup pugui fomentar aquest diàleg equilibrat entre els diferents agents, i a més, gràcies als seus gairebé 30 anys de treball actiu, té una gran influència en la comunitat científica i la capacitat d'aconseguir un impacte rellevant en el futur desenvolupament de la IA.
El projecte "Challenges and Opportunities in music tech" ha estat dirigit pels investigadors Xavier Serra, Sergi Jordà, Dmitry Bogdanov, Frederic Font Corbera, Marius Miron, Perfecte Herrera, Sònia Espí i Lonce Wyse.
*Karma Peiró és col·laboradora externa de l’MTG. Està especialitzada en Tecnologies de la Informació i la Comunicació (TIC) des del 1995 i és coautora de l'Informe "Intel·ligència Artificial. Decisions automatitzades a Catalunya", de l'Autoritat Catalana de Protecció de Dades. És ponent en seminaris i debats relacionats amb el periodisme de dades, l'ètica de la intel·ligència artificial, la transparència informativa, les dades obertes i la comunicació digital.
Aquest projecte compta amb el suport de la iniciativa MusicAIRE (finançada per la Unió Europea en el marc del programa Music Moves Europe) i de l'Ajuntament de Barcelona.