De datawetenschap blijft zich ontwikkelen als een van de meest veelbelovende en veelgevraagde carrièrepaden voor geschoolde professionals. Vandaag de dag begrijpen succesvolle dataprofessionals dat ze verder moeten gaan dan de traditionele vaardigheden van het analyseren van grote hoeveelheden data, datamining en programmeervaardigheden. Om nuttige intelligentie voor hun organisaties aan het licht te brengen, moeten datawetenschappers het volledige spectrum van de levenscyclus van de datawetenschap beheersen en over een niveau van flexibiliteit en begrip beschikken om het rendement in elke fase van het proces te maximaliseren.

Het beeld geeft de vijf stadia van de levenscyclus van de datawetenschappen weer: Capture, (data acquisitie, data entry, signaalontvangst, data extractie); Maintain (data warehousing, data cleaning, data staging, data processing, data architectuur); Process (data mining, clustering/classificatie, data modeling, data summary); Analyze (verkennende/confirmatoire, voorspellende analyse, regressie, text mining, kwalitatieve analyse); Communicate (data rapportage, data visualisatie, business intelligence, decision making).
De term “datawetenschapper” is eind 2008 ontstaan, toen organisaties de behoefte begrepen aan informatiedeskundigen met talent voor het uitzoeken en ontleden van enorme hoeveelheden informatie (Big data). 1 In een artikel van McKinsey&Company uit 2009 anticipeerde Hal Varian, de centrale financiële expert van Google en UC Berkeley-docent voor datawetenschappen, business en financiële zaken, op het belang van het aanpassen aan de impact van innovatie en het herconfigureren van verschillende ondernemingen. 2
“Het vermogen om informatie te nemen – om de mogelijkheid te hebben om het te krijgen, om het te verwerken, om er een stimulans van te maken, om het zich voor te stellen, om het te geven – dat zal een kolossaal vermogen zijn in de volgende decennia.”
– Hal Varian, baas financieel specialist bij Google en UC Berkeley docent datawetenschappen, bedrijfskunde en financiële aspecten 3
Levensvatbare informatieonderzoekers kunnen belangrijke onderzoeken onderscheiden, informatie uit een groot aantal verschillende informatiebronnen verzamelen, de gegevens sorteren, de resultaten interpreteren in arrangementen en hun ontdekkingen overbrengen op een manier die de bedrijfskeuzes onmiskenbaar beïnvloedt. Deze vaardigheden zijn vereist in vrijwel alle ondernemingen, waardoor begaafde informatieonderzoekers steeds belangrijker worden voor organisaties.
Wat doet een Data Scientist?
In het afgelopen decennium is gebleken dat informatieonderzoekers fundamentele hulpmiddelen zijn en in vrijwel alle verenigingen beschikbaar zijn. Deze experts zijn evenwichtige, informatie gedreven mensen met een hoog niveau van gespecialiseerde vaardigheden die geschikt zijn voor het structureren van complexe kwantitatieve berekeningen om veel gegevens te ordenen en te orkestreren die gebruikt worden om vragen te beantwoorden en de techniek in hun associatie aan te drijven. Dit wordt gecombineerd met de betrokkenheid bij de correspondentie en de administratie die verwacht wordt om substantiële resultaten over te brengen aan verschillende partners over een vereniging of bedrijf.
Datawetenschappers moeten nieuwsgierig en resultaatgericht zijn, met uitzonderlijke sectorspecifieke kennis en communicatieve vaardigheden die hen in staat stellen zeer technische resultaten uit te leggen aan hun niet-technische tegenhangers. Ze beschikken over een sterke kwantitatieve achtergrond in statistiek en lineaire algebra, evenals programmeerkennis met focus op datawarehousing, mining en modellering om algoritmen te bouwen en te analyseren.