10. Calidoscopi

Dades massives: una oportunitat per a la recerca biomèdica

min
Ferran Sanz

Ferran Sanz, director del Programa de Recerca en Informàtica Biomèdica (GRIB, UPF-IMIM) i catedràtic del Departament de Ciències Experimentals i de la Salut de la UPF

L'àmbit de la salut té un gran potencial per a l'aplicació profitosa del concepte de big data o, el que és el mateix, les dades massives. En biomedicina, les dades massives sorgeixen d'una àmplia gamma de fonts d'informació, com les dades clíniques que actualment es registren a tots els processos assistencials; les dades generades per la recerca biomèdica i, en particular, per les tecnologies òmiques, i les publicacions científiques que resumeixen els resultats d'aquesta investigació, així com una part significativa de les aportacions publicades en les xarxes socials i altres informacions relacionades, com les dades ambientals i socials.

“La reutilització de les dades clíniques és particularment difícil, doncs han de seguir regulacions molt estrictes relatives a la protecció de les dades personals”

És possible fer una anàlisi integrada d'aquestes dades per generar noves visions i coneixements sobre les malalties i les seves causes i tractaments. Tot i així, aquesta anàlisi integrada no és una tasca fàcil per diverses raons. En primer lloc, la compatibilitat de les fonts de dades heterogènies continua sent un problema. D'altra banda, la reutilització de determinats tipus de dades és particularment difícil, com en el cas de les dades clíniques, que han de seguir regulacions molt estrictes relatives a la protecció de les dades personals, o les dades resultants de la recerca farmacèutica, que es veuen obstaculitzades per les polítiques de protecció de la propietat intel·lectual que aplica la indústria farmacèutica. Una dificultat addicional que s’ha de tractar és el fet que la major part de la informació útil es registra com a text lliure. Aquest és el cas de les publicacions científiques, una part important de les històries clíniques electròniques i les publicacions en xarxes socials. L'explotació de la informació en format de text lliure implica el desenvolupament de tècniques efectives de mineria de textos.

Com a exemples de projectes europeus que incorporen grans estratègies de dades tenim Open PHACTS, que va desenvolupar una infoestructura integrada de dades per facilitar la R + D en medicaments; EMIF, que està creant una plataforma europea per reutilitzar  la informació clínica per a la recerca biomèdica, i eTOX, un projecte enfocat a la millora de l'avaluació preclínica de la seguretat dels fàrmacs mitjançant l'explotació integrada dels informes toxicològics de la indústria farmacèutica. Els objectius d’eTOX aviat s'ampliaran a través d'un nou projecte, eTRANSAFE, que estudiarà des d'un punt de vista translacional l'avaluació de la seguretat dels medicaments.

“Aviat podrem treure el màxim partit al fenomen big data en l'àmbit de la salut”

D’una altra banda, una iniciativa internacional clau que certament facilitarà l'explotació de les grans dades biomèdiques són els principis FAIR per a la gestió i l’administració de dades científiques. Aquests principis, que proposen un seguit de mesures per fer que les dades científiques siguin localitzables, accessibles, interoperables i reutilitzables, estan sent promoguts i adoptats per òrgans i organitzacions importants.

L'aprofitament efectiu de les dades massives en biomedicina encara es troba en una fase inicial. Tot i això, la gran quantitat de projectes en desenvolupament i l'aparició de tècniques d'anàlisi cada vegada més potents indiquen que aviat podrem treure el màxim partit al fenomen big data en l'àmbit de la salut i aportar beneficis molt notables per a la societat.