¿Qué es y por qué importa?

Grandes datos es un término que describe el gran volumen de datos – tanto estructurados como no estructurados – que inundan un negocio en el día a día. Pero no es la cantidad de datos lo importante. Lo que importa es lo que las organizaciones hacen con los datos. Los grandes datos pueden ser analizados para obtener información que lleve a mejores decisiones y movimientos estratégicos de negocios.

Gran historia de datos y consideraciones actuales

Aunque la expresión “grandes datos” es moderadamente nueva, la demostración de reunir y guardar muchos datos para una posible investigación es muy antigua. La idea cobró fuerza a mediados de la década de 2000 cuando el experto de la industria Doug Laney enunciaba el significado ahora estándar de la información enorme como las tres V:

Volumen. Las asociaciones reúnen información de diversas fuentes, entre ellas los intercambios comerciales, la vida en Internet y los datos de la información de los sensores o de las máquinas. Antes, guardarlo hubiera sido un problema – sin embargo, nuevas innovaciones, (por ejemplo, Hadoop) han facilitado el peso.

Velocidad. Los flujos de datos llegan a una velocidad sin precedentes y deben ser tratados de manera oportuna. Las etiquetas RFID, los sensores y la medición inteligente están impulsando la necesidad de tratar con torrentes de datos en tiempo casi real.

Variedad. La información se presenta en una amplia gama de arreglos, desde la información numérica organizada en bases de datos habituales hasta los registros de contenido no estructurados, el correo electrónico, el vídeo, el sonido, la información de los teletipos y los intercambios presupuestarios.

En el SAS, consideramos dos dimensiones adicionales cuando se trata de grandes datos:

Variabilidad. A pesar de las crecientes velocidades y surtidos de información, los flujos de información pueden ser excepcionalmente conflictivos con los pináculos ocasionales. ¿Hay algo inclinado en las redes sociales de la web? Día a día, las cargas de información de pináculos regulares y ocasionales pueden estar tratando de supervisar. Mucho más con información no estructurada.

Complejidad La información actual se origina en numerosas fuentes, lo que dificulta la interconexión, la coordinación, la purificación y el cambio de la información en los marcos. Sea como fuere, es importante asociar y conectar las conexiones, los sistemas progresivos y los diferentes vínculos de información o su información puede desenvolverse rápidamente.