•  
   

10. Caleidoscopio

Datos masivos: una oportunidad para la investigación biomédica

Ferran Sanz

Ferran Sanz, director del Programa de Investigación en Informática Biomédica (GRIB, UPF-IMIM) y catedrático del Departamento de Ciencias Experimentales y de la Salud de la UPF

El ámbito de la salud posee un gran potencial para la aplicación provechosa del concepto big data o, lo que es lo mismo, los datos masivos. En biomedicina, los datos masivos surgen de una amplia gama de fuentes de información, como los datos clínicos que actualmente se registran en todos los procesos asistenciales; los datos generados por la investigación biomédica y, en particular, por las tecnologías ómicas, y las publicaciones científicas que resumen los resultados de esa investigación, así como una fracción significativa de los posts publicados en las redes sociales y otras informaciones relacionadas, como los datos ambientales y sociales.

“La reutilitzación de datos clínicos es particularmente difícil, pues deben seguir regulaciones muy estrictas relativas a la protección de los datos personales" 

Es posible hacer un análisis integrado de estos datos para generar nuevas visiones y conocimientos sobre las enfermedades y sus causas y tratamientos. Sin embargo, este análisis integrado no es una tarea fácil por varias razones. En primer lugar, la compatibilidad de las fuentes de datos heterogéneas sigue siendo un problema. Por otro lado, la reutilización de determinados tipos de datos es particularmente difícil, como en el caso de los datos clínicos, que deben seguir regulaciones muy estrictas relativas a la protección de los datos personales,o los datos resultantes de la investigación farmacéutica, que se ven obstaculizados por las políticas de protección de la propiedad intelectual que aplica la industria farmacéutica. Una dificultad adicional a abordar es el hecho de que la mayor parte de la información útil se registra como texto libre. Este es el caso de las publicaciones científicas, una parte importante de las historias clínicas electrónicas y las publicaciones en redes sociales. La explotación de la información en formato texto libre implica el desarrollo de técnicas efectivas de minería de textos.

Ejemplos de proyectos europeos que incorporan grandes estrategias de datos son Open PHACTS, que desarrolló una infoestructura integrada de datos para facilitar la I + D en medicamentos; EMIF, que está creando una plataforma europea para la reutilización de información clínica para la investigación biomédica, y eTOX, un proyecto enfocado a la mejora de la evaluación preclínica de la seguridad de los fármacos mediante la explotación integrada de los informes toxicológicos de la industria farmacéutica. Los objetivos de eTOX pronto se ampliarán a través de un nuevo proyecto, eTRANSAFE, que estudiará desde un punto de vista traslacional la evaluación de la seguridad de los medicamentos.

“Pronto podremos sacar el máximo partido al fenómeno big data en el ámbito de la salud" 

Una iniciativa internacional clave que ciertamente facilitará la explotación de los grandes datos biomédicos son los principios FAIR para la gestión y administración de datos científicos. Estos principios, que proponen una serie de medidas para hacer que los datos científicos sean localizables, accesibles, interoperables y reutilizables, están siendo promovidos y adoptados por órganos y organizaciones importantes.

El aprovechamiento efectivo de los datos masivos en biomedicina está todavía en una fase inicial. Aún así, la gran cantidad de proyectos en desarrollo y la aparición de técnicas de análisis cada vez más potentes, indican que pronto podremos sacar el máximo partido al fenómeno big data en el ámbito de la salud aportando beneficios muy notables para la sociedad.