Ce que c’est et pourquoi c’est important

Le terme “Big data” décrit le grand volume de données – structurées et non structurées – qui inonde une entreprise au quotidien. Mais ce n’est pas la quantité de données qui est importante. Ce qui compte, c’est ce que les organisations font avec ces données. Les données importantes peuvent être analysées pour obtenir des informations qui permettent de prendre de meilleures décisions et de prendre des mesures stratégiques.

Historique des données et considérations actuelles

Si l’expression “données importantes” est modérément nouvelle, la démonstration de la mise en commun et du stockage de nombreuses données en vue d’une éventuelle enquête est ancienne. L’idée a pris de l’ampleur au milieu des années 2000, lorsque l’expert industriel Doug Laney a énoncé la signification désormais standard de l’expression “données volumineuses” comme les trois V :

Volume. Les associations rassemblent des informations provenant d’un ensemble de sources, notamment les échanges commerciaux, la vie sur Internet et les données provenant de capteurs ou d’informations de machine à machine. Auparavant, le rangement aurait été un problème – mais de nouvelles innovations (par exemple, Hadoop) ont facilité le poids.

La vitesse. Les flux de données arrivent à une vitesse sans précédent et doivent être traités en temps utile. Les étiquettes RFID, les capteurs et les compteurs intelligents rendent nécessaire le traitement de torrents de données en temps quasi réel.

Variété. L’information se présente sous des formes très diverses, allant des informations numériques organisées dans les bases de données habituelles aux enregistrements de contenu non structuré, en passant par le courrier électronique, la vidéo, le son, les informations sur les cours boursiers et les échanges budgétaires.

Au SAS, nous considérons deux dimensions supplémentaires lorsqu’il s’agit de données importantes :

La variabilité. Malgré l’expansion des vitesses et des assortiments d’informations, les flux d’informations peuvent être exceptionnellement contradictoires avec des sommets occasionnels. Y a-t-il quelque chose d’incliné dans les réseaux sociaux basés sur le web ? Jour après jour, les charges d’information de pointe, qu’elles soient régulières ou occasionnelles, peuvent tenter de s’immiscer. C’est encore plus vrai pour les informations non structurées.

Complexité Les informations actuelles proviennent de nombreuses sources, ce qui rend difficile l’interface, la coordination, la purification et la modification des informations entre les cadres. Quoi qu’il en soit, il est important d’associer et de connecter les connexions, les systèmes progressifs et les différents liens d’information, sans quoi vos informations peuvent rapidement se déchaîner.