O que é e porque é importante

Grandes dados é um termo que descreve o grande volume de dados – tanto estruturados como não estruturados – que inundam um negócio no dia-a-dia. Mas não é a quantidade de dados que é importante. É o que as organizações fazem com os dados que importa. Grandes dados podem ser analisados em busca de insights que levem a melhores decisões e movimentos estratégicos de negócios.

Grande Histórico de Dados e Considerações Atuais

Enquanto a expressão “grandes dados” é moderadamente nova, a demonstração de confraternização e de guardar um monte de dados para possível investigação é antiga. A idéia ganhou força em meados dos anos 2000 quando o especialista da indústria Doug Laney enunciou o significado agora padrão de enormes informações como os três Vs:

Volume. As associações reúnem informações de uma variedade de fontes, incluindo trocas comerciais, vida baseada na Internet e dados de informações de sensor ou máquina a máquina. Antes, colocar isso de lado teria sido um problema – por mais novas inovações, (por exemplo, Hadoop) facilitaram o peso.

Velocidade. Os dados são transmitidos a uma velocidade sem precedentes e devem ser tratados de forma atempada. As etiquetas RFID, sensores e contadores inteligentes estão a impulsionar a necessidade de lidar com torrentes de dados em tempo quase real.

Variedade. A informação vem em uma ampla gama de arranjos – desde informação organizada e numérica em bases de dados habituais até registros de conteúdo não estruturado, e-mail, vídeo, som, informações de stock ticker e trocas orçamentárias.

Na SAS, consideramos duas dimensões adicionais quando se trata de grandes dados:

Variabilidade. Apesar das velocidades de expansão e dos sortimentos de informação, os fluxos de informação podem ser excepcionalmente conflitantes com pináculos ocasionais. Há algo que se inclina nas redes sociais baseadas na web? Dia após dia, a carga de informação regular e ocasionalmente ativada no pináculo pode estar tentando supervisionar. Significativamente mais com informações não estruturadas.

Complexidade A informação presente tem origem em numerosas fontes, o que dificulta a interface, coordenação, purificação e mudança de informação cruzada sobre as estruturas. Seja como for, é importante associar e ligar ligações, sistemas progressivos e diferentes ligações de informação ou a sua informação pode ser rapidamente desconexa.