A ciência dos dados continua a evoluir como um dos caminhos de carreira mais promissores e procurados por profissionais qualificados. Hoje, profissionais de dados bem sucedidos entendem que eles devem avançar além das habilidades tradicionais de analisar grandes quantidades de dados, mineração de dados e habilidades de programação. A fim de descobrir inteligência útil para suas organizações, os cientistas de dados devem dominar todo o espectro do ciclo de vida da ciência dos dados e possuir um nível de flexibilidade e compreensão para maximizar os retornos em cada fase do processo.

A imagem representa as cinco fases do ciclo de vida da ciência dos dados: Captura, (aquisição de dados, entrada de dados, recepção de sinais, extração de dados); Manutenção (armazenamento de dados, limpeza de dados, preparação de dados, processamento de dados, arquitetura de dados); Processo (data mining, clustering/classificação, modelagem de dados, compactação de dados); Análise (exploratória/confirmatória, análise preditiva, regressão, mineração de texto, análise qualitativa); Comunicação (relatório de dados, visualização de dados, business intelligence, tomada de decisões).

O termo “cientista de dados foi escrito a partir de 2008, quando as organizações entenderam a necessidade de especialistas em informação talentosos em classificar e dissecar enormes medidas de informação (Big data). 1 Em um artigo de 2009 da McKinsey&Company, Hal Varian, especialista central em finanças do Google e professor de ciências de dados, negócios e assuntos financeiros da UC Berkeley, antecipou o significado do ajuste ao impacto da inovação e da reconfiguração de vários empreendimentos. 2

“A capacidade de tomar informação – de ter a opção de obtê-la, de processá-la, de concentrar um incentivo a partir dela, de visioná-la, de transmiti-la – que será uma capacidade colossalmente significativa nas décadas seguintes”.

– Hal Varian, chefe especialista em finanças no Google e na UC Berkeley, professor de ciências de dados, negócios e aspectos financeiros 3

Investigadores de informação viáveis podem distinguir inquéritos significativos, recolher informação de um grande número de várias fontes de informação, classificar os dados, fazer uma interpretação dos resultados em arranjos e transmitir as suas descobertas de uma forma que influencie decididamente as escolhas empresariais. Estas aptidões são necessárias em praticamente todos os empreendimentos, tornando os pesquisadores de informação dotados progressivamente importantes para as organizações.

O que é que um cientista de dados faz?

Na década anterior, os pesquisadores de informação revelaram-se recursos fundamentais e estão disponíveis em praticamente todas as associações. Estes especialistas são pessoas equilibradas, orientadas para a informação, com elevadas capacidades especializadas e aptas a estruturar complexos cálculos quantitativos para ordenar e orquestrar uma série de dados utilizados para abordar questões e técnicas de condução na sua associação. Isto é combinado com o envolvimento em correspondência e administração que se espera que transmita resultados substanciais a diferentes parceiros sobre uma associação ou negócio.

Os cientistas de dados precisam ser curiosos e orientados para resultados, com conhecimentos específicos da indústria e habilidades de comunicação excepcionais que lhes permitam explicar resultados altamente técnicos aos seus homólogos não técnicos. Eles possuem uma forte formação quantitativa em estatística e álgebra linear, bem como conhecimentos de programação com foco em armazenamento de dados, mineração e modelagem para construir e analisar algoritmos.