Prof. Dr. Robert Rieg, Prof. Dr. Ute Vanini
Eine wesentliche Ursache einer besseren Datenverfügbarkeit ist die Digitalisierung, die analoge Daten wie Texte, Videos oder Sensordaten in Binärcodes umwandelt und damit einer digitalen und damit effizienten Speicherung, Verarbeitung und Verbreitung zugänglich macht. Mögliche Datenquellen sind z. B. betriebliche Prozesse, die mit der Einführung von cyber-physischen Systemen Sensordaten über ihre Leistung abgeben, Kundendaten zum Nutzungsverhalten oder zu Präferenzen, die über Social Media zugänglich werden, wie auch öffentlich verfügbare Daten z. B. des Bundes und der Länder.
Die Digitalisierung ermöglicht eine bessere Datenverfügbarkeit, d. h. es stehen mehr Daten für das RC zur Verfügung, auf die einfacher und schneller zugegriffen werden kann. Dieses Phänomen wird als Big Data bezeichnet. Big Data lässt sich anhand folgender Eigenschaften charakterisieren (s. Abb. 1): Neben der Datenmenge (Volume) ist die Datenvielfalt (Variety) ein zentrales Merkmal. Daten können dabei in unstrukturierter, semistrukturierter und strukturierter Form vorliegen, z. B. als Texte, Videos, Blogs etc. Die Daten stammen dabei aus unternehmensinternen und -externen Quellen:
- Public Data umfasst Daten von Regierungen und Regierungsorganisationen, öffentlichen Verwaltungen etc.
- Private Data besteht aus Daten im Besitz von Unternehmen, Organisationen und Einzelpersonen, z. B. zum Nutzungsverhalten von Kunden.
- Data Exhaust sind Daten, die als Nebenprodukt anderer Aktivitäten erfasst werden. So lassen sich aus dem Suchverhalten von Personen im Internet Rückschlüsse auf ihre Präferenzen und Bedürfnisse ziehen.
- Community Data beinhaltet unstrukturierte Daten aus dynamischen Netzwerken, wie z. B. Social Media. Diese Daten liegen häufig in verbal-unstrukturierter Form vor.
- Self-quantification Data besteht aus Daten, die von Einzelpersonen durch Quantifizierung und Aufzeichnung persönlicher Handlungen erfasst werden.
Die Datengenerierung erfolgt permanent und in hoher Geschwindigkeit (Velocity) bzw. in Echtzeit. Aufgrund der großen Datenmengen stellt die Überprüfung und Sicherstellung der Glaubwürdigkeit (Veracity) insbesondere der externen Daten eine wesentliche Herausforderung dar. Die Auswertung von Big Data muss zudem einen wirtschaftlichen Nutzen (Value) für das Unternehmen generieren.
Abb. 1: Merkmale von Big Data
Das Vorhandensein von Big Data ist allerdings für ein datengetriebenes RC nicht ausreichend. Um Big Data auch effizient auswerten und für Entscheidungen nutzen zu können, bedarf es auch des Zugangs zu leistungsfähiger Hard- und Software für eine effiziente Datenverarbeitung und -speicherung sowie die Auswahl und Nutzung geeigneter statistischer Verfahren und mathematischer Algorithmen zur Datenanalyse.