Was es ist und warum es wichtig ist?

Große Daten ist ein Begriff, der die große Menge an Daten – sowohl strukturierte als auch unstrukturierte – beschreibt, die ein Unternehmen tagtäglich überflutet. Aber es ist nicht die Menge der Daten, die wichtig ist. Es kommt darauf an, was Organisationen mit den Daten machen. Große Daten können auf Erkenntnisse hin analysiert werden, die zu besseren Entscheidungen und strategischen Geschäftsentscheidungen führen.

Große Datengeschichte und aktuelle Überlegungen

Während der Ausdruck “große Daten” mäßig neu ist, ist die Demonstration des Zusammenkommens und des Ablegens vieler Daten für mögliche Untersuchungen uralt. Die Idee gewann Mitte der 2000er Jahre an Kraft, als der Branchenexperte Doug Laney die heute übliche Bedeutung von riesigen Informationen als die drei Vs:

Band. Die Verbände sammeln Informationen aus einer Reihe von Quellen, einschließlich Geschäftsbörsen, internetbasierten Lebensdaten und Daten aus Sensor- oder Maschine-zu-Maschine-Informationen. Früher wäre es ein Problem gewesen, es wegzulegen – aber neue Innovationen (z.B. Hadoop) haben das Gewicht erleichtert.

Geschwindigkeit. Die Daten strömen in einer noch nie dagewesenen Geschwindigkeit ein und müssen zeitnah bearbeitet werden. RFID-Etiketten, Sensoren und intelligente Messgeräte treiben die Notwendigkeit voran, Datenströme nahezu in Echtzeit zu verarbeiten.

Abwechslung. Informationen kommen in einer breiten Palette von Arrangements – von organisierten, numerischen Informationen in üblichen Datenbanken bis hin zu unstrukturierten Inhaltsaufzeichnungen, E-Mail, Video, Ton, Börsentickerinformationen und Budgetaustausch.

Bei SAS berücksichtigen wir zwei zusätzliche Dimensionen, wenn es um große Daten geht:

Variabilität. Ungeachtet der sich ausweitenden Geschwindigkeiten und des wachsenden Informationssortiments können die Informationsströme außergewöhnlich konfliktträchtig sein und gelegentlich zu Spitzen führen. Ist etwas schräg in webbasierten sozialen Netzwerken? Tag für Tag können regelmäßige und gelegentlich aktivierte Spitzeninformationslasten versucht werden, zu übersehen. Bei unstrukturierten Informationen ist dies in erheblichem Maße der Fall.

Komplexität Die vorliegenden Informationen stammen aus zahlreichen Quellen, was es schwierig macht, Informationen über Rahmenwerke hinweg zu verknüpfen, zu koordinieren, zu bereinigen und zu ändern. Wie dem auch sei, es ist wichtig, Verbindungen, fortschrittliche Systeme und verschiedene Informationsverknüpfungen miteinander zu verbinden und zu verbinden, sonst können Ihre Informationen sich schnell verwinden.