5. Calidoscopio

Inteligencia artificial, una herramienta imprescindible para el avance de la ciencia

min
Gabby Silberman

Gabby Silberman, director general del Barcelona Institute of Science and Technology (BIST), con contribuciones de Núria López, del Instituto Catalán de Investigación Química (ICIQ), Modesto Orozco, del Instituto de Investigación Biomédica de Barcelona (IRB Barcelona), y Gonzalo Merino, del Puerto de Información Científica y el Instituto de Física de Altas Energías (PIC i IFAE)

La inteligencia artificial (IA) -que de manera genérica podemos definir como la labor desarrollada por sistemas inteligentes capaces de percibir su entorno, tomar decisiones autónomas para alcanzar sus objetivos y aprender 'de los resultados de estas acciones para mejorar su funcionamiento- es hoy ya un elemento esencial para la investigación científica en prácticamente todos los campos, de la biomedicina a la astrofísica, pasando por la química o las aplicaciones tecnológicas de la física cuántica.

En el Barcelona Institute of Science and Technology (BIST), un gran número de nuestros 178 grupos de investigación están aplicando o desarrollando sistemas de IA para avanzar en la investigación de patologías diversas, en el conocimiento del cosmos o en la investigación de nuevos materiales para a la lucha contra el cambio climático.

Hace pocos meses, el equipo encabezado por la Dra. Núria López-Bigas, profesora ICREA en el IRB Barcelona, ​​presentaba la herramienta BoostDB, basada en métodos de machine learning, que evalúa la contribución potencial al desarrollo y la progresión del cáncer de todas las posibles mutaciones de un gen en un determinado tipo de tumor. La herramienta es capaz de evaluar hasta 28.000 mutaciones de 66 tipos de tumor. Una información que permite conocer las causas del cáncer a nivel molecular y tomar decisiones terapéuticas más ajustadas.

También en el IRB Barcelona, ​​el equipo del Dr. Modesto Orozco ha desarrollado el portal web PMut, una herramienta que permite predecir mutaciones patológicas de proteínas. El portal PMut reúne un archivo de 725.596.928 variantes analizadas, patológicas y neutras, de un total de 106.407 proteínas, y permite al usuario realizar sus propias predicciones de patologías, acceder a un depósito completo de predicciones pre-calculadas, y generar y validar nuevos predictores.

En un artículo reciente publicado en Nature Communications, el equipo del programa conjunto IRBB-BSC-CRG en Biología Computacional, encabezado por el profesor ICREA Patrick Aloy (IRB Barcelona) y el Dr. Orozco, presentaba el uso de redes neurales profundas (deep neural networks) para inferir la bioactividad de moléculas pequeñas, con el objetivo de acelerar el desarrollo de nuevos medicamentos.

Gonzalo Merino, director del PIC (Puerto de Información Científica), una infraestructura científica vinculada al Instituto de Física de Altas Energías (IFAE) que da apoyo a investigadores de diversos ámbitos que requieren el manejo y análisis de grandes volúmenes de datos, señala que cada vez más algoritmos de análisis de datos, sean de la disciplina que sean, emplean técnicas de inteligencia artificial y, especialmente, de machine learning. Este es un proceso que se ha visto favorecido, en los últimos años pora la generalización del uso de aceleradores de hardware, que ha permitido aumentar en varios órdenes de magnitud el volumen de datos analizados.

Dos proyectos en marcha que cuentan con una importante participación del IFAE, por ejemplo, se benefician del uso de las llamadas Convolutional Neural Networks (CNN), un tipo de red neural artificial que se utiliza sobre todo para el análisis de imágenes. En concreto, la inteligencia artificial y las CNN son un componente clave para la interpretación de las imágenes recogidas por la herramienta PAUS (Physics of accelerating Universe Survey) y sus 40 cámaras con filtros de banda estrecha. El IFAE ha participado en el desarrollo de Lumos, un método de deep learning para la interpretación de la fotometría de estas imágenes de la galaxia.

Por otra parte, en el detector de ondas gravitacionales VIRGO, un proyecto europeo con sede en Italia, los investigadores del IFAE están explorando el uso de CNN para detectar la señal de ondas gravitacionales resultante de la colisión de agujeros negros o de estrellas de neutrones.

El estudio de los efectos del cambio climático y de las posibles respuestas a su impacto es una de las áreas más activas en la aplicación de la IA. Los modelos climáticos más recientes son ejemplos de la integración de datos y del uso de algoritmos sofisticados para modelizar nuevos escenarios y el impacto de las políticas medioambientales, como ha demostrado el último informe del panel del IPCC (Intergovernmental Panel on Climate Change).

Las medidas activas de control del cambio climático necesitan de la redefinición de procesos y ciclos completos de tratamiento de la materia y la energía, que necesariamente debe ser renovable. En el campo de la energía, la IA se aplica al control y balanceo de la carga de la red, donde los modelos han alcanzado una gran complejidad. Pero las mejoras se necesitan en todos los niveles y, particularmente, en el estudio de nuevos materiales, que no contengan componentes críticos (por su rareza, coste, peligrosidad u otras cuestiones sociopolíticas o de localización en territorios lejanos y no accesibles).

En los últimos años la investigación sobre materiales se ha beneficiado cada vez más de técnicas de IA, aplicadas sobre todo a encontrar nuevos compuestos para la conversión de energía. Ejemplo de ello son el estudio y la optimización de células fotovoltaicas a partir de datos experimentales, o el análisis de la estabilidad y la vida útil de baterías a partir de parámetros de operación básicos, temas que han aparecido muy recientemente en la literatura científica y demuestran el potencial de estas técnicas.

En el Instituto Catalán de Investigación Química (ICIQ), el grupo de la Dra. Nuria López emplea técnicas de IA para investigar los materiales y las reacciones químicas en tres ámbitos principales: identificación de los parámetros de control o descriptores de procesos químicos para reducir costes de producción mediante su optimización; evaluación más rápida de sistemas muy complejos, de manera que se reduzca en varios órdenes de magnitud el tiempo para alcanzar un solución al reto planteado (reduciendo, al mismo tiempo, la producción de CO2 de las simulaciones); screening rápido de materiales que cumplen con los descriptores identificados.

En todos los casos, se necesitan bases de datos debidamente mantenidas y anotadas, como ioChem-BD, la base de datos desarrollada por el ICIQ que está alojada en el Barcelona Supercomputing Center (BSC), con una ayuda de la Red Española de Supercomputación (RES) y que cumple con las normas FAIR. Sobre esta infraestructura es posible hacer crecer diversas herramientas de análisis, tanto abiertas como específicamente diseñadas para los problemas de materiales para la producción y conducción de energía.

Uno de los grandes retos que se plantea el BIST se formaron las nuevas generaciones de científicos con una visión humana y técnica que les permita sacar el mejor partir de herramientas como la IA, en beneficio de grandes retos sociales como la sostenibilidad medioambiental y la salud de las personas y del planeta.