Prof. Dr. Ulrike Baumöl, Dipl.-Kfm. Philipp-Dennis Berlitz
Big Data als Entscheidungsunterstützung
Für Unternehmen bedeutet Big Data vor allem eine neue Art der Entscheidungsunterstützung. Neu deswegen, weil bisher ungenutzte Datenquellen sowie eine bisher nicht dagewesene Größenordnung und Vielfalt an Daten, herangezogen werden können. Dies kann zu neuen Erkenntnissen über Kunden, Märkte und sogar das eigene Unternehmen führen.
Aus anwendungsorientierter Sicht beschreibt Big Data den Gebrauch von kosteneffizienter innovativer Technik, die dazu dient, betriebswirtschaftliche Problemstellungen zu lösen. Die behandelten Problemstellungen sind dadurch gekennzeichnet, dass sie mithilfe von konventionellen Datenverarbeitungssystemen nicht gelöst werden können, da sie zu hohe Anforderungen an Ressourcen, wie z. B. die Verarbeitungsgeschwindigkeit, stellen.
Statistische Bedeutung
Diese "Negativdefinition" wird laut Markl oft von Dienstleistungsanbietern sowie Soft- und Hardwareherstellern verwendet. Er schlägt vor, Big Data von einem anderen Blickwinkel zu betrachten. Seiner Ansicht nach ist ein Hauptmerkmal von Big Data, das Vorhandensein von Datenmengen, mit einer derartigen Größe, dass auf ihrer Basis statistisch signifikante Aussagen getroffen werden können. Auf Grundlage dieser Aussagen können dann wiederum fundierte Entscheidungen getroffen werden.
Volume, Velocity und Variety
Ebenso wie bei der konventionellen Datenanalyse steckt auch hinter dem Konzept Big Data die Absicht, Informationen aus Daten zu extrahieren, um daraus neues Wissen zu generieren. Ein weiterer Ansatz den Begriff Big Data zu beschreiben, verwendet folgende 3 Datenmerkmale, um eine Abgrenzung zu herkömmlichen Daten und deren Analyse herzustellen:
- ein großes Datenvolumen (Volume),
- eine hohe Entstehungsgeschwindigkeit der Daten (Velocity) und
- eine große Vielfalt in der Datenbeschaffenheit (Variety) (vgl. Abb. 2).
Diese 3 Eigenschaften finden sich in zahlreichen Beschreibungen von Big Data wieder. Ein näherer Blick auf diese sollte zum besseren Verständnis des Begriffs beitragen:
Volume
Ein wichtiges Charakteristikum von Big Data ist die große Menge der betrachteten Daten. Sie beginnt typischerweise im Terabytebereich und ist nach oben nicht begrenzt. Wie bereits erwähnt, deuten Prognosen darauf hin, dass die weltweite Datenproduktion auch in den nächsten Jahren sehr stark steigen wird. Unternehmen stehen in Zukunft folglich immer mehr Daten zu Analysezwecken zur Verfügung.
Velocity
Die hohen Geschwindigkeiten, mit denen Daten erzeugt und verarbeitet werden, sind ebenso ein Merkmal von Big Data. In Abhängigkeit von ihrer Quelle können Daten mit unterschiedlichen Geschwindigkeiten erzeugt werden. Für Unternehmen ist es wichtig, auch mit sehr hohen Geschwindigkeiten umgehen zu können, um möglichst schnell auf wirtschaftlich relevante Ereignisse reagieren zu können.
Variety
Eine weitere wichtige Eigenschaft von Big Data besteht in der Heterogenität der Datenbeschaffenheit. Da die betrachteten Daten oft aus sehr verschiedenartigen Quellen stammen, wie z. B. sozialen Netzwerken, elektronischen Handelsplätzen oder Sensoren, unterscheiden sie sich insbesondere in Struktur und Format stark voneinander.
Abb. 2: "Volume", "Velocity" und "Variety" als Big Data Merkmale
Weitere Big-Data Merkmale: Veracity und Value
Neben diesen 3 Charakteristika gibt es noch 2 weitere Big Data-Merkmale, welche jedoch seltener verwendet werden. "Veracity", ein Big Data-Aspekt, der unter anderem von IBM als relevant angesehen wird, beschreibt die Datenqualität, insbesondere in Bezug auf Authentizität, Vollständigkeit und Mehrdeutigkeit. Der Begriff "Value" taucht auch als Eigenschaft in Big Data-Beschreibungen auf. Er nimmt eine wirtschaftliche Perspektive ein und setzt voraus, dass Daten einen Wert generieren müssen, um als Big Data bezeichnet werden zu können.
Der Begriff Big Data beschreibt also nicht nur die Anwendung von spezieller Technik, sondern wird ebenso für Daten verwendet, welche eine oder mehrere der 3 erstgenannten Eigenschaften aufweisen.