Che cos’è e perché è importante

Big data è un termine che descrive il grande volume di dati – sia strutturati che non strutturati – che inonda un’azienda nella quotidianità. Ma non è la quantità di dati che è importante. È ciò che le organizzazioni fanno con i dati che conta. I grandi dati possono essere analizzati alla ricerca di intuizioni che portino a decisioni migliori e a mosse strategiche di business.

Storia dei grandi dati e considerazioni attuali

Mentre l’espressione “grandi dati” è moderatamente nuova, la dimostrazione di riunire e mettere via molti dati per possibili indagini è vecchia di secoli. L’idea ha preso forza a metà degli anni 2000 quando l’esperto del settore Doug Laney ha enunciato il significato ormai standard di grande informazione come le tre V:

Volume. Le associazioni raccolgono informazioni da una serie di fonti, compresi gli scambi commerciali, la vita su Internet e i dati provenienti da sensori o informazioni da macchina a macchina. Prima, metterlo da parte sarebbe stato un problema – tuttavia le nuove innovazioni (ad esempio Hadoop) ne hanno facilitato il peso.

Velocita’. I flussi di dati arrivano ad una velocità senza precedenti e devono essere gestiti in modo tempestivo. I tag RFID, i sensori e i contatori intelligenti guidano la necessità di gestire i flussi di dati in tempo quasi reale.

Varietà. Le informazioni sono disponibili in un’ampia gamma di disposizioni – da informazioni organizzate e numeriche in banche dati abituali a record di contenuti non strutturati, e-mail, video, audio, informazioni di stock ticker e scambi di bilancio.

Alla SAS, consideriamo due dimensioni aggiuntive quando si tratta di grandi dati:

Variabilità. Nonostante la velocità di espansione e l’assortimento di informazioni, i flussi di informazioni possono essere eccezionalmente in conflitto con i pinnacoli occasionali. C’è qualcosa di inclinato nei social network basati sul web? Giorno dopo giorno, il carico di informazioni di punta attivato regolarmente e occasionalmente può cercare di supervisionare il carico di informazioni. E lo è ancora di più con le informazioni non strutturate.

Complessità Le informazioni attuali provengono da numerose fonti, il che rende difficile interfacciare, coordinare, purificare e modificare le informazioni in modo trasversale rispetto ai quadri. Sia come sia, è importante associare e collegare connessioni, sistemi progressivi e collegamenti di informazioni diverse o le vostre informazioni possono rapidamente avvolgersi in modo selvaggio.