Eenvoudig gezegd is het de taak van een datawetenschapper om gegevens te onderzoeken op bruikbare inzichten.

Specifieke taken zijn onder andere:

Het identificeren van de data-analytische problemen die de beste kansen voor de organisatie bieden

Het bepalen van de juiste datasets en variabelen

Het verzamelen van grote sets gestructureerde en ongestructureerde gegevens uit verschillende bronnen

Schoonmaken en valideren van de informatie om te zorgen voor nauwkeurigheid, volledigheid en uniformiteit

Het ontwerpen en toepassen van modellen en algoritmen om de opslag van massieve gegevens te ontginnen.

Het analyseren van de info om patronen en trends te spotten

Het interpreteren van de informatie om oplossingen en mogelijkheden te krijgen

Het communiceren van de bevindingen naar de belanghebbenden met behulp van visualisatie en andere middelen

In het boek, Doing Data Science, beschrijven de auteurs de taken van de infowetenschapper op deze manier:

“Meer in het algemeen is een kenniswetenschapper iemand die de manier kent om betekenis te ontlenen aan gegevens en deze te interpreteren, die zowel instrumenten als methoden nodig heeft uit de statistiek en het machinaal leren, ook als mens. Ze besteedt tonnen van je tijd binnen het proces van het verzamelen, opschonen en mungen van data, omdat data niet schoon is. Dit proces vereist persistentie, statistiek en software engineering vaardigheden – vaardigheden die ook nodig zijn voor het begrijpen van biases binnen de data en voor het debuggen van de logging output van code.

Als ze de informatie eenmaal in vorm heeft gekregen, is een belangrijk onderdeel de verkennende data-analyse, die visualisatie en datazintuiglijke waarneming mengt. Ze zal patronen vinden, modellen bouwen, en algoritmen – sommige met de bedoeling om het gebruik van het product te begrijpen en dus de algemene gezondheid van de koopwaar , et al. te functioneren prototypes die uiteindelijk terug gebakken worden naar de koopwaar . Zij kan experimenten ontwerpen, en zij of hij kan een kritisch onderdeel zijn van data-gedreven beslissingen. Ze communiceert met teamleden, ingenieurs en leidinggevenden in duidelijke taal en met datavisualisaties om ervoor te zorgen dat haar collega’s niet in de gegevens zelf worden ondergedompeld, maar dat ze de implicaties ervan begrijpen.

Bron: O’Neil, C., en Schutt, R. Doing Data Science. Eerste editie.

Zou u een eerlijke Data Scientist creëren?

Om erachter te komen, vraag je jezelf af: doet men. . .

een graad in wiskunde, statistiek, informatica, managementinformatiesystemen, of marketing?

Heb je veel werkervaring op een van die gebieden?

Heb je interesse in het verzamelen en analyseren van gegevens?

Geniet u van geïndividualiseerd werk en het oplossen van problemen?

Goed communiceren, zowel verbaal als visueel?

Wilt u uw vaardigheden verbreden en nieuwe uitdagingen aangaan?

Als je op een van die vragen ja hebt geantwoord, vind je binnen het domein van de kenniswetenschap heel wat om van te houden.

Datawetenschappers hebben kennis van wiskunde of statistiek nodig. Een natuurlijke nieuwsgierigheid is daarnaast belangrijk, net als creatief en belangrijk denken. Wat kun je met alle gegevens doen? Welke onontdekte mogelijkheden zitten er in verborgen? Je wilt een gave hebben om de puntjes op de i te zetten en je wilt de antwoorden op vragen die nog niet zijn gesteld, uitproberen als je het volledige potentieel van de data wilt begrijpen.

Datawetenschappers zijn ook hoogopgeleid. In overeenstemming met KDnuggets uit de industrie, heeft 88 procent van de kenniswetenschappers minimaal een masterdiploma en 46 procent is gepromoveerd.

Je hebt ook enige achtergrond nodig in het programmeren, zodat je de modellen en algoritmes kunt bedenken die nodig zijn om de opslagplaatsen van massieve gegevens te ontginnen. Python en R zijn twee van de belangrijkste programmeeromgevingen voor datawetenschap.

Je moet iets van een ondernemer zijn. Een hoofd voor bedrijfsstrategie is van vitaal belang. Hoewel je werkt met andere dataspecialisten of misschien met een interdisciplinair team van executs, zul je geen succes boeken als je niet je eigen methoden kunt bedenken en je eigen infrastructuren kunt bouwen om de informatie die je zal leiden tot je nieuwe ontdekkingen en nieuwe visies voor de langere termijn te slicen en te dobbelen.

U moet zelfs bereid zijn om complexe ideeën te communiceren met uw niet-technische belanghebbenden op een manier die zij gemakkelijk zullen begrijpen. Data-science software tools kunnen u helpen bij het visualiseren van uw bevindingen, maar u zult ook de verbale communicatievaardigheden nodig hebben om het verhaal duidelijk te vertellen.