La science des données continue d’évoluer comme l’une des carrières prometteuses et recherchées par les professionnels qualifiés. Aujourd’hui, les professionnels des données qui réussissent comprennent qu’ils doivent dépasser les compétences traditionnelles d’analyse de grandes quantités de données, d’exploration de données et de programmation afin de découvrir des informations utiles pour leurs organisations. Les scientifiques des données doivent maîtriser le spectre complet du cycle de vie de la science des données et posséder un niveau de flexibilité et de compréhension leur permettant de maximiser les rendements à chaque phase du processus.

L’image représente les cinq étapes du cycle de vie de la science des données : Saisir (acquisition des données, saisie des données, réception des signaux, extraction des données) ; Maintenir (entreposage des données, nettoyage des données, mise en scène des données, traitement des données, architecture des données) ; Traiter (exploration des données, classification/classement des données, modélisation des données, résumé des données) ; Analyser (exploratoire/confirmatoire, analyse prédictive, régression, exploration de textes, analyse qualitative) ; Communiquer (compte rendu des données, visualisation des données, intelligence économique, prise de décision).
Le terme “data scientist” a été créé à la fin de l’année 2008, lorsque les organisations ont compris qu’elles avaient besoin d’experts en information capables de trier et de disséquer d’énormes quantités d’informations. 1 Dans un article paru en 2009 dans McKinsey&Company, Hal Varian, expert financier central de Google et professeur de sciences des données, de commerce et de finance à l’Université de Berkeley, a anticipé l’importance de l’ajustement à l’impact de l’innovation et de la reconfiguration de diverses entreprises. 2

“La capacité de prendre l’information – d’avoir la possibilité de l’obtenir, de la traiter, d’en concentrer une incitation, de l’envisager, de la transmettre – sera une capacité colossalement importante dans les décennies à venir”.

  • Hal Varian, patron spécialiste des finances chez Google et professeur de l’UC Berkeley en sciences des données, commerce et aspects financiers 3

Les bons chercheurs d’information distinguent les enquêtes importantes, rassemblent des informations provenant de multiples sources d’information différentes, trient les données, interprètent les résultats en fonction de dispositions et transmettent leurs découvertes de manière à influencer les choix des entreprises. Ces qualités sont requises dans pratiquement toutes les entreprises, ce qui fait que les chercheurs d’informations doués sont progressivement importants pour les organisations.
Que fait un Data Scientist ?

Au cours de la dernière décennie, les chercheurs en information sont devenus des ressources fondamentales et sont utiles dans pratiquement toutes les situations. Ces experts sont des personnes équilibrées, orientées vers l’information et dotées de grandes capacités spécialisées, aptes à effectuer des calculs quantitatifs complexes et à orchestrer de grandes données utilisées pour répondre à des questions et diriger la technique dans leur association. Ils sont également impliqués dans la correspondance et l’administration, ce qui devrait permettre de transmettre des résultats substantiels à différents partenaires au sein d’une association ou d’une entreprise.

Les spécialistes des données doivent être curieux et axés sur les résultats, et posséder des connaissances exceptionnelles dans le domaine de l’industrie et des compétences en communication qui leur permettent d’expliquer des résultats très techniques à leurs homologues non techniques. Ils possèdent un solide bagage quantitatif en statistiques et en algèbre linéaire ainsi que des connaissances en programmation axées sur l’entreposage des données, l’extraction et la modélisation pour construire et analyser des algorithmes.