•  
   

10. Caleidoscopio

Ingeniero en ciencia de datos: ¿sólo una profesión de futuro?

Xavier Binefa

Xavier Binefa, jefe del Grupo de Investigación Cognitive Media Technologies del Departamento de Tecnologías de la Información y las Comunicaciones y coordinador del grado en Ingeniería Matemática en Ciencia de Datos de la UPF

Hoy en día es común oír hablar de big data (datos masivas o macrodatos) y de ciencia de datos. Ambos conceptos se refieren a la abundancia de datos con la que nos encontramos actualmente: por ejemplo, el telescopio SKA que entrará en funcionamiento en 2020, generará 160 TeraBytes por segundo, datos que tendrán que ser transportados y procesados para extraer información. Hoy, el tráfico móvil de todo el mundo es de “sólo” 3 TeraBytes por segundo (datos de Akamai y Ericson de finales de 2016).

“Esos datos y su impacto en las redes sociales son el petróleo del que se nutren las empresas de la nueva economía"

Con “internet de las cosas” nos referimos a los dispositivos que generan datos y que además del móvil pueden provenir del ámbito municipal, industrial y también familiar (coche, lavadora, nevera, contadores de consumo…). Estos datos y su impacto en las redes sociales, son el petróleo del que se nutren las empresas de la nueva economía y también deben aprender a gestionar tanto las administraciones como las empresas tradicionales. Estamos viendo el impacto de los gigantes de los datos como Google (con los efectos en marketing, pero no solamente) o Amazon (con los efectos sobre la logística, los hábitos de compra, etc.) sobre las empresas de todo tipo. Lo mismo ocurre en el ámbito público, en temas de movilidad y turismo ciudadano por ejemplo.

En ciencia de datos, se utilizan los éxitos de técnicas que necesitan muchos datos y capacidad de cómputo como el deep learning (aprendizaje profundo), o los graphical models (modelos gráficos). Entre tantos otros, han hecho posible que se puedan abordar los problemas de manera mucho más resolutiva que antes. Entre estos logros citamos la traducción automática, la capacidad de extraer la semántica de los textos, la traducción de la voz a texto, el análisis de las imágenes y del vídeo (no sólo reconocimiento de personas y objetos, también acciones, emociones de las caras, conducción automática) además de los que se suelen denominar Analytics y de interés empresarial y financiero. Estas capacidades nos permiten tomar decisiones basadas en información extraída de datos del todo heterogéneos.

Todas estas posibilidades pueden -y deben- ser aplicadas a todos los niveles y llevan a lo que debe ser una sociedad basada en decisiones inteligentes que tengan en cuenta los datos de los que se dispone. El acceso público a los datos, con tecnología para defender la privacidad, es la base para que los innovadores puedan crear las empresas e innovaciones organizativas que definirán muchos de los puestos de trabajo en el futuro.

“La revista Harward Business Review definicó esta profesión como "el trabajo más sexy del futuro"

El perfil profesional de científico de datos comienza a ser reconocido en la industria. De hecho, la revista Harvard Business Review (Oct 2012) la definió como “el trabajo más sexy del futuro”. Uno de los autores de este artículo, D.J. Patil, fue nombrado Chief Data Scientist de la Casa Blanca demostrando el papel de esta nueva profesión en la toma de decisiones estratégicas. Muchas empresas de consultoría y estudios mencionan la elevada demanda que existe actualmente de esta profesión y los altos salarios que se ofrecen. Y todas coinciden en que la elevada demanda justifica el alto nivel de los sueldos de las ofertas por personas formadas y la capacidad de liderazgo que se asocia a la profesión.

En el Departamento de Tecnologías de la Información y de las Comunicaciones de la UPF, hace casi dos años que llegamos al convencimiento de la necesidad de trabajar en este marco de ciencia de datos en nuestros programas de investigación y de incluirlo en nuestras ingenierías. El esfuerzo en investigación fue reconocido con la distinción de "María de Maeztu" en Data Science siendo hasta ahora la única ingeniería del estado con este reconocimiento (que va acompañado de financiación y becas de investigación). En docencia, el grado en Ingeniería Matemática en Ciencia de Datos comienza el próximo curso 2017-2018, se puede seguir totalmente en inglés (y así constará en el suplemento del título que acompaña a este) y tiene un primer curso que es común a las otras ingenierías de Informática, Sistemas Audiovisuales y Telemática.