La ciencia de los datos sigue evolucionando como una de las trayectorias profesionales más prometedoras y de mayor demanda para los profesionales cualificados. Hoy en día, los profesionales exitosos de los datos entienden que deben avanzar más allá de las habilidades tradicionales de análisis de grandes cantidades de datos, la minería de datos y las habilidades de programación. A fin de descubrir inteligencia útil para sus organizaciones, los científicos de datos deben dominar todo el espectro del ciclo de vida de la ciencia de los datos y poseer un nivel de flexibilidad y comprensión para maximizar los beneficios en cada fase del proceso.

La imagen representa las cinco etapas del ciclo de vida de la ciencia de los datos: Captar, (adquisición de datos, entrada de datos, recepción de señales, extracción de datos); Mantener (almacenamiento de datos, limpieza de datos, puesta en escena de datos, procesamiento de datos, arquitectura de datos); Procesar (minería de datos, agrupación/clasificación, modelado de datos, resumen de datos); Analizar (exploración/confirmación, análisis predictivo, regresión, minería de textos, análisis cualitativo); Comunicar (presentación de datos, visualización de datos, inteligencia comercial, toma de decisiones).

El término “científico de datos” fue creado a finales de 2008, cuando las organizaciones comprendieron la necesidad de contar con expertos en información con talento para clasificar y diseccionar enormes medidas de información. 1 En un artículo de 2009 de McKinsey&Company, Hal Varian, el experto financiero central de Google y profesor de ciencias de los datos, negocios y asuntos financieros de la UC Berkeley, anticipó la importancia de ajustarse al impacto de la innovación y la reconfiguración de varias empresas.

“La capacidad de tomar información – tener la opción de obtenerla, procesarla, concentrar un incentivo de ella, visualizarla, impartirla – será una capacidad colosalmente significativa en las próximas décadas”.

– Hal Varian, jefe especialista en finanzas de Google y UC Berkeley, profesor de ciencias de la información, negocios y aspectos financieros

Los investigadores de información viable pueden distinguir las investigaciones importantes, reunir información de un gran número de diversas fuentes de información, clasificar los datos, hacer una interpretación de los resultados en arreglos, y transmitir sus descubrimientos de una manera que influye decididamente en las decisiones comerciales. Estas aptitudes son necesarias en prácticamente todas las empresas, lo que hace que los investigadores de información dotados sean progresivamente importantes para las organizaciones.

¿Qué hace un científico de datos?

En el decenio anterior, los investigadores de la información han resultado ser recursos fundamentales y están disponibles en prácticamente todas las asociaciones. Estos expertos son personas equilibradas, impulsadas por la información, con habilidades especializadas de alto nivel, aptas para estructurar complejos cálculos cuantitativos para clasificar y orquestar una gran cantidad de datos que se utilizan para abordar las preguntas y dirigir la técnica en su asociación. Esto se combina con la participación en la correspondencia y la administración que se espera que transmita resultados sustanciales a los diferentes socios de una asociación o empresa.

Los científicos de los datos deben ser curiosos y estar orientados a la obtención de resultados, con conocimientos específicos de la industria y habilidades de comunicación excepcionales que les permitan explicar resultados altamente técnicos a sus homólogos no técnicos. Poseen una sólida formación cuantitativa en estadística y álgebra lineal, así como conocimientos de programación centrados en el almacenamiento de datos, la minería y la modelización para construir y analizar algoritmos.