Data Science wciąż ewoluuje jako jedna z obiecujących i poszukiwanych ścieżek kariery dla wykwalifikowanych specjalistów. W dzisiejszych czasach profesjonaliści zajmujący się danymi rozumieją, że muszą wyprzedzać tradycyjne umiejętności analizowania dużych ilości danych, eksploracji danych i programowania, aby odkryć informacje przydatne dla swoich organizacji, a naukowcy zajmujący się danymi muszą opanować pełne spektrum cyklu życia nauki o danych oraz posiadać pewien poziom elastyczności i zrozumienia, aby zmaksymalizować zyski na każdym etapie procesu.

Obraz przedstawia pięć etapów cyklu życia nauki o danych: Capture, (pozyskiwanie danych, wprowadzanie danych, odbiór sygnału, ekstrakcja danych); Maintain (hurtownia danych, oczyszczanie danych, inscenizacja danych, przetwarzanie danych, architektura danych); Process (eksploracja danych, grupowanie/klasyfikacja danych, modelowanie danych, podsumowanie danych); Analyze (eksploracja/potwierdzanie, analiza prognostyczna, regresja, text mining, analiza jakościowa); Communicate (raportowanie danych, wizualizacja danych, business intelligence, podejmowanie decyzji).
Termin “data scientist” został stworzony dopiero w 2008 roku, kiedy to organizacje zrozumiały zapotrzebowanie na ekspertów w dziedzinie informacji, którzy są zdolni do sortowania i dzielenia ogromnych ilości informacji (Big data). 1 W artykule McKinsey&Company z 2009 r. Hal Varian, główny ekspert finansowy Google i UC Berkeley, nauczyciel nauk o danych, biznesu i finansów, przewidział znaczenie dostosowania się do wpływu innowacji i rekonfiguracji różnych przedsięwzięć. 2

“Zdolność do przyswajania informacji – do tego, by mieć możliwość ich zdobywania, przetwarzania, koncentrowania na nich bodźców, wyobrażania sobie ich, przekazywania – będzie kolosalnie istotną zdolnością w następnych dziesięcioleciach”.

  • Hal Varian, główny specjalista finansowy w Google i UC Berkeley, nauczyciel nauk o danych, biznesu i aspektów finansowych 3

Dobrzy badacze informacji rozróżniają istotne zapytania, gromadzą informacje z wielu różnych źródeł informacji, sortują dane, dokonują interpretacji wyników na ustalenia i przekazują swoje odkrycia w sposób, który wpływa na wybory biznesowe. Te cechy są wymagane w praktycznie wszystkich przedsięwzięciach, co sprawia, że utalentowani badacze informacji stają się stopniowo ważni dla organizacji.
Co robi naukowiec zajmujący się danymi?

W ostatniej dekadzie, badacze informacji stali się podstawowymi zasobami i są korzystni praktycznie w każdej sytuacji. Eksperci ci są wyważone, informacje napędzane ludzie o wysokich specjalistycznych umiejętności, nadają się do skomplikowanych obliczeń ilościowych w celu uporządkowania i orkiestracji dużych danych wykorzystywanych do rozwiązywania problemów i techniki napędu w ich związku. Łączy się to z zaangażowaniem w korespondencję i administrację, od których oczekuje się przekazywania istotnych wyników różnym partnerom w ramach stowarzyszenia lub przedsiębiorstwa.

Naukowcy zajmujący się danymi muszą być ciekawi i zorientowani na wyniki, dysponować wyjątkową wiedzą i umiejętnościami komunikacyjnymi właściwymi dla danej branży, które umożliwią im wyjaśnianie wysoce technicznych wyników swoim nietechnicznym odpowiednikom. Posiadają oni silne zaplecze ilościowe w zakresie statystyki i algebry liniowej, jak również wiedzę z zakresu programowania, ze szczególnym uwzględnieniem hurtowni danych, górnictwa i modelowania w celu budowania i analizowania algorytmów.