Kai Grönke, Markus Kirchmann
2.1 Volume, Velocity und Variety
Ebenso wie bei der konventionellen Datenanalyse steckt auch hinter dem Konzept Big Data die Absicht, Informationen aus Daten zu extrahieren, um daraus neues Wissen zu generieren. Ein weiterer Ansatz den Begriff Big Data zu beschreiben, verwendet folgende 3 Datenmerkmale, um eine Abgrenzung zu herkömmlichen Daten und deren Analyse herzustellen:
- ein großes Datenvolumen (Volume),
- eine hohe Entstehungsgeschwindigkeit der Daten (Velocity) und
- eine große Vielfalt in der Datenbeschaffenheit (Variety) (vgl. Abb. 1).
Diese 3 Eigenschaften finden sich in zahlreichen Beschreibungen von Big Data wieder. Ein näherer Blick auf diese sollte zum besseren Verständnis des Begriffs beitragen:
Volume
Ein wichtiges Charakteristikum von Big Data ist die große Menge der betrachteten Daten. Sie beginnt typischerweise im Terabytebereich und ist nach oben nicht begrenzt. Wie bereits erwähnt, deuten Prognosen darauf hin, dass die weltweite Datenproduktion auch in den nächsten Jahren sehr stark steigen wird. Unternehmen stehen in Zukunft folglich immer mehr Daten zu Analysezwecken zur Verfügung.
Velocity
Die hohen Geschwindigkeiten, mit denen Daten erzeugt und verarbeitet werden, sind ebenso ein Merkmal von Big Data. In Abhängigkeit von ihrer Quelle können Daten mit unterschiedlichen Geschwindigkeiten erzeugt werden. Für Unternehmen ist es wichtig, auch mit sehr hohen Geschwindigkeiten umgehen zu können, um möglichst schnell auf wirtschaftlich relevante Ereignisse reagieren zu können.
Variety
Eine weitere wichtige Eigenschaft von Big Data besteht in der Heterogenität der Datenbeschaffenheit. Da die betrachteten Daten oft aus sehr verschiedenartigen Quellen stammen, wie z. B. sozialen Netzwerken, elektronischen Handelsplätzen oder Sensoren, unterscheiden sie sich insbesondere in Struktur und Format stark voneinander.
Abb. 1: "Volume", "Velocity" und "Variety" als Big Data Merkmale
2.2 Weitere Big-Data Merkmale: Veracity und Value
Neben diesen 3 Charakteristika gibt es noch 2 weitere Big Data-Merkmale, welche jedoch seltener verwendet werden. "Veracity", ein Big Data-Aspekt, der unter anderem von IBM als relevant angesehen wird, beschreibt die Datenqualität, insbesondere in Bezug auf Authentizität, Vollständigkeit und Mehrdeutigkeit. Der Begriff "Value" taucht auch als Eigenschaft in Big Data-Beschreibungen auf. Er nimmt eine wirtschaftliche Perspektive ein und setzt voraus, dass Daten einen Wert generieren müssen, um als Big Data bezeichnet werden zu können.
Der Begriff Big Data beschreibt also nicht nur die Anwendung von spezieller Technik, sondern wird ebenso für Daten verwendet, welche eine oder mehrere der 3 erstgenannten Eigenschaften aufweisen.