5. Calidoscopi

Intel·ligència artificial, una eina imprescindible per a l’avenç de la ciència

min
Gabby Silberman

Gabby Silberman, director general del Barcelona Institute of Science and Technology (BIST), amb contribucions de Núria López, de l’Institut Català d’Investigació Química (ICIQ), Modesto Orozco, de l’Institut de Recerca Biomèdica de Barcelona (IRB Barcelona), i Gonzalo Merino, del Port d’Informació Científica i l’Institut de Física d’Altes Energies (PIC i IFAE)

La intel·ligència artificial (IA) —que de manera genèrica podem definir com la tasca desenvolupada per sistemes intel·ligents capaços de percebre el seu entorn, prendre decisions autònomes per a atènyer els seus objectius i ‘aprendre’ dels resultats d’aquestes accions per millorar el seu funcionament— és avui ja un element essencial per a la recerca científica en pràcticament tots els camps, de la biomedicina a l’astrofísica, passant per la química o les aplicacions tecnològiques de la física quàntica.

Al Barcelona Institute of Science and Technology (BIST), un gran nombre dels nostres 178 grups de recerca estan aplicant o desenvolupant sistemes d’IA per avançar en la recerca de patologies diverses, en el coneixement del cosmos o en la recerca de nous materials per a la lluita contra el canvi climàtic.

Fa pocs mesos, l’equip encapçalat per la Dra. Núria López-Bigas, professora ICREA a l’IRB Barcelona, presentava l’eina BoostDB, basada en mètodes de machine learning, que avalua la contribució potencial al desenvolupament i la progressió del càncer de totes les possibles mutacions d’un gen en un determinat tipus de tumor. L’eina és capaç d’avaluar fins a 28.000 mutacions de 66 tipus de tumor. Una informació que permet conèixer les causes del càncer a nivell molecular i prendre decisions terapèutiques més ajustades.

També a l’IRB Barcelona, l’equip del Dr. Modesto Orozco ha desenvolupat el portal web PMut, una eina que permet predir mutacions patològiques de proteïnes. El portal PMut aplega un arxiu de 725.596.928 variants analitzades, patològiques i neutres, d’un total de 106.407 proteïnes, i permet a l'usuari realitzar les seves pròpies prediccions de patologies, accedir a un dipòsit complet de prediccions pre-calculades, i generar i validar nous predictors.

En un article recent publicat a Nature Communications (https://doi.org/10.1038/s41467-021-24150-4), l’equip del programa conjunt IRBB-BSC-CRG en Biologia Computacional, encapçalat pel professor ICREA Patrick Aloy (IRB Barcelona) i el Dr. Orozco, presentava l’ús de xarxes neurals profundes (deep neural networks) per inferir la bioactivitat de molècules petites, amb l’objectiu d’accelerar el desenvolupament de nous medicaments.

Gonzalo Merino, director del PIC (Port d’Informació Científica), una infraestructura científica vinculada a l’Institut de Física d’Altes Energies (IFAE) que dona suport a investigadors de diversos àmbits que requereixen el maneig i anàlisi de grans volums de dades, assenyala que cada cop més algoritmes d’anàlisi de dades, siguin de la disciplina que siguin, empren tècniques d’intel·ligència artificial i, especialment, de machine learning. Aquest és un procés que s’ha vist afavorit, en els darrers anys per la generalització de l’ús d’acceleradors de hardware, que ha permès augmentar en diversos ordres de magnitud el volum de dades analitzades.

Dos projectes en marxa que compten amb una important participació de l’IFAE, per exemple, es beneficien de l’ús de les anomenades Convolutional Neural Networks (CNN), un tipus de xarxa neural artificial que s’utilitza sobretot per a l’anàlisi d’imatges. En concret, la intel·ligència artificial i les CNN son un component clau per a la interpretació de les imatges recollides per l’eina PAUS (Physics of Accelerating Universe Survey) i les seves 40 càmeres amb filtres de banda estreta. L’IFAE ha participat en el desenvolupament de Lumos, un mètode de deep learning per a la interpretació de la fotometria d’aquestes imatges de la galàxia.

D’altra banda, en el detector d’ones gravitacionals VIRGO, un projecte europeu amb seu a Itàlia, els investigadors de l’IFAE estan explorant l’ús de CNN per a detectar el senyal d’ones gravitacionals resultant de la col·lisió de forats negres o d’estrelles de neutrons.

L’estudi dels efectes del canvi climàtic i de les possibles respostes al seu impacte és una de les àrees més actives en l’aplicació de la IA. Els models climàtics més recents són exemples de la integració de dades i de l’ús d’algoritmes sofisticats per modelitzar nous escenaris i l’impacte de les polítiques mediambientals, com ha demostrat l’últim informe del panell de l’IPCC (Intergovernmental Panel on Climate Change).

Les mesures actives de control del canvi climàtic necessiten de la redefinició de processos i cicles complets de tractament de la matèria i l’energia, que necessàriament ha de ser renovable. En el camp de l’energia, la IA s’aplica al control i balanceig de la càrrega de la xarxa, on els models han arribat a una gran complexitat. Però les millores es necessiten a tots els nivells i, particularment, en l’estudi de nous materials, que no continguin components crítics (per la seva raresa, cost, perillositat o altres qüestions sociopolítiques o de localització en territoris llunyans i no accessibles).

En els darrers anys la recerca sobre materials s’ha beneficiat cada cop més de tècniques d’IA, aplicades sobretot a trobar nous compostos per a la conversió d’energia. Exemple d’això són l’estudi i l’optimització de cèl·lules fotovoltaiques a partir de dades experimentals, o l’anàlisi de l’estabilitat i la vida útil de bateries a partir de paràmetres d’operació bàsics, temes que han aparegut molt recentment a la literatura científica i demostren el potencial d’aquestes tècniques.

A l’Institut Català d’Investigació Química (ICIQ), el grup de la professora Núria López empra tècniques d’IA per investigar els materials i les reaccions químiques en tres àmbits principals: identificació dels paràmetres de control o descriptors de processos químics per tal de reduir costos de producció mitjançant la seva optimització; avaluació més ràpida de sistemes molt complexos, de manera que es redueixi en diversos ordres de magnitud el temps per atènyer un solució al repte plantejat (reduint, alhora, la producció de CO2 de les simulacions); screening ràpid de materials que compleixen amb els descriptors identificats.

En tots els casos, es necessiten bases de dades degudament mantingudes i anotades, com ioChem-BD, la base de dades desenvolupada per l’ICIQ que està allotjada al Barcelona Supercomputing Center (BSC), amb un ajut de la Red Española de Supercomputación (RES) i que compleix amb les normes FAIR. Sobre aquesta infraestructura és possible fer créixer diverses eines d’anàlisi, tant obertes com específicament dissenyades per als problemes de materials per a la producció i conducció d’energia.

Un dels grans reptes que es planteja el BIST es formar les noves generacions de científics amb una visió humana i tècnica que els permeti treure el millor partir d’eines com la IA, en benefici de grans reptes socials com la sostenibilitat mediambiental i la salut de les persones i del planeta.