10. Calidoscopi

Enginyer en ciència de dades: només una professió de futur?

min
Xavier Binefa

Xavier Binefa, cap del Grup de Recerca Cognitive Media Technologies del Departament de Tecnologies de la Informació i les Comunicacions i coordinador del grau en Enginyeria Matemàtica en Ciència de Dades de la UPF

Avui en dia és comú sentir a parlar de big data (dades massives o macrodades) i de ciència de dades. Ambdós conceptes fan referència a l’abundància de dades amb la qual ens trobem actualment: per exemple, el telescopi SKA, que entrarà en funcionament el 2020, generarà 160 terabytes per segon, dades que caldrà transportar i processar per extreure’n informació. Avui, el tràfic mòbil de tot el món és de “només” 3 terabytes per segon (dades d’Akamai i Ericson, de finals del 2016).

“Aquestes dades i el seu impacte a les xarxes socials són el petroli del qual es nodreixen les empreses de la nova economia”

Amb “Internet de les coses” ens referim als dispositius que generen dades i que a més del mòbil poden provenir de l’àmbit municipal, industrial i també familiar (cotxe, rentadora, nevera, comptadors de consum...). Aquestes dades i el seu impacte a les xarxes socials són el petroli del qual es nodreixen les empreses de la nova economia, i també han d’aprendre a gestionar tant les administracions com les empreses tradicionals. Estem veient l’impacte dels gegants de les dades com Google (amb els efectes en màrqueting, però no solament) o Amazon (amb els efectes sobre la logística, els hàbits de compra, etc.) sobre les empreses de tota mena. El mateix passa en l’àmbit públic, en temes de mobilitat i de turisme ciutadà per exemple.

En ciència de dades, s’utilitzen els èxits de tècniques que necessiten moltes dades i capacitat de còmput com són el deep learning (l’aprenentatge profund), o els graphical models (models gràfics). Entre tants d’altres, han fet possible que es puguin tractar els problemes de manera molt més resolutiva que abans. Entre aquests èxits citem la traducció automàtica, la capacitat d’extreure la semàntica dels textos, la traducció de la veu a text, l’anàlisi de les imatges i del vídeo (no sols reconeixement de persones i d’objectes, sinó també d’accions, d’emocions de les cares, de conducció automàtica), a més dels que s’acostumen a anomenar analytics i d’interès empresarial i financer. Aquestes capacitats ens permeten prendre decisions basades en informació extreta de dades del tot heterogènies.

Totes aquestes possibilitats poden i han de ser aplicades a tots els nivells i porten al que ha de ser una societat basada en decisions intel·ligents que tinguin en compte les dades de les quals es disposa. L’accés públic a les dades, amb tecnologia per defensar la privacitat, és la base perquè els innovadors puguin crear les empreses i els canvis organitzatius que definiran molts dels llocs de treball en el futur.

“La revista Harward Business Review va definir aquesta professió com “la feina més sexy del futur”

El perfil professional de científic de dades comença a ser reconegut en la indústria. De fet, la revista Harward Business Review (octubre del 2012) la va definir com “la feina més sexy del futur”. Un dels autors d’aquest article, D. J. Patil, va ser nomenat Chief Data Scientist de la Casa Blanca, fet que demostra el paper d’aquesta nova professió en la presa de decisions estratègiques. Així, moltes empreses de consultoria i molts estudis esmenten l’elevada demanda que hi ha actualment d’aquesta professió i els alts salaris que s’ofereixen. I totes coincideixen en la idea que l’elevada demanda justifica l’alt nivell dels sous per a persones formades i la capacitat de lideratge que s’associa a la professió.

En el Departament de Tecnologies de la Informació i les Comunicacions de la UPF, fa gairebé dos anys que vam arribar al convenciment de la necessitat de treballar en aquest marc de ciència de dades en els nostres programes de recerca i d’incloure’l en les nostres enginyeries. Així, l’esforç en recerca va ser reconegut amb la distinció María de Maeztu en Data Science, i és fins ara l’única enginyeria de l’Estat amb aquest reconeixement (que va acompanyat de finançament i de beques de recerca). En docència, el grau en Enginyeria Matemàtica en Ciència de Dades comença el proper curs 2017-2018, es pot seguir totalment en anglès (i així constarà en el suplement del títol que l’acompanya) i té un primer curs que és comú a les altres enginyeries en Informàtica, Sistemes Audiovisuals i Telemàtica.