Dr. Christian Bischof, Daniela Wilfinger
4.1 In-Memory-Plattform SAP HANA
Die In-Memory-Plattform SAP HANA wurde im Jahr 2010 erstmals vorgestellt. Zentrales Element dieser Technologie ist eine vollständig in den Arbeitsspeicher verlagerte Datenbank. Eine physische Sicherung der Daten erfolgt nur mehr für Archivierungs- und Wiederherstellungszwecke. Zudem erfolgt die Datenspeicherung nicht zeilen-, sondern spaltenorientiert. Hierbei wird der logische Aufbau eines Datensatzes im Rahmen des Speichervorgangs aufgelöst und die Inhalte spaltenbasiert abgelegt. Dadurch können Datenoperationen, die nur auf ausgewählte Spalten einer logischen Tabelle zugreifen, deutlich schneller ausgeführt werden, als dies in einem zeilenorientierten Ansatz möglich wäre. Zudem müssen keine Summentabellen mehr aufgebaut werden. Stattdessen können die Daten in Echtzeit jederzeit in der vollen Granularität verarbeitet werden. In Kombination mit der spaltenorientierten Speicherung führt dies zu einer wesentlichen Reduktion des Datenbankvolumens.
Viele zur Umsetzung von Big Data Analytics erforderlichen Verfahren sind bereits in SAP HANA integriert. Hierzu zählen z. B. die Textanalyse, die Verarbeitung von Raum- und Geodaten sowie die Verarbeitung von Streaming-Daten. Darüber hinaus werden andere Analysen in HANA-basierten Lösungen zur Verfügung gestellt, wie Verfahren für die Assoziations- oder Zeitreihenanalyse im Rahmen der Predictive Analytics Library (PAL). Schließlich werden auch Verfahren und Plattformen von Drittanbietern unterstützt.
In weiterer Folge werden mit SAP Streaming Analytics und SAP Predictive Analytics zwei ausgewählte Ansätze von Big Data Analytics am Beispiel von SAP HANA näher betrachtet. Vor allem im Bereich Streaming Analytics wird SAP eine führende Stellung am Markt beigemessen.
4.2 SAP Streaming Analytics
Unter dem Begriff Streaming Analytics werden Plattformen subsumiert, die Streaming-Daten erfassen und auf dieser Grundlage Analysen erstellen können. Derartige Plattformen sind auch in der Lage, auf Basis von Regeln oder Modellen für maschinelles Lernen unverzüglich technische Operationen oder Prozessschritte auszuführen, falls dies erforderlich ist.
In traditionellen Datenbanken werden Daten zum Zwecke der Analyse zunächst gespeichert. SAP Streaming Analytics ermöglicht es, unterschiedliche Datenquellen über Input-Adapter mit der Smart Data Streaming Engine zu verbinden, welche in der SAP-HANA-Plattform integriert ist. Auf diese Weise gelangen Daten aus einer Vielzahl von Quellen in Echtzeit ohne vorherige Zwischenspeicherung in das SAP-HANA-System.
Das wesentliche Nutzenpotenzial von SAP HANA für das Controlling besteht somit in der kombinierten Analyse unterschiedlicher interner und externer Datenquellen in Echtzeit mithilfe der integrierten Smart Data Streaming Engine (s. Abb. 1).
Abb. 1: Architektur und Funktionsweise von SAP Streaming Analytics
Eingehende Datenströme werden verarbeitet, auf Muster und Trends untersucht, fehlende Werte identifiziert und Zusammenhänge überwacht. In weiterer Folge werden Informationen in Echtzeit in Form von Live-Dashboards bereitgestellt, Warnmeldungen generiert oder Transaktionen im ERP-System angestoßen. Darüber hinaus können die Daten in der SAP-HANA-Datenbank, aber auch in NoSQL-Datenbanken für weiterführende statistische Auswertungen gespeichert werden. Auf diese Weise kann das Konzept eines Complex Event Processing etabliert und damit ein wesentlicher Beitrag zur Implementierung einer "Real-Time Enterprise" geleistet werden.
Ein wesentliches Anwendungsgebiet für Streaming Analytics im Bereich des Controllings ist das Produktionscontrolling. Immer mehr Maschinen sind – entweder originär oder mittels Retrofitting – digitalisiert und liefern somit umfangreiche Sensordaten. Im Rahmen eines automatisierten Produktionscontrollings ergeben sich weitreichende Möglichkeiten zur Überwachung und Optimierung des gesamten Produktionsprozesses. Diese umfassen z. B. die vorausschauende Wartung der Maschinen, die rechtzeitige Planung notwendiger Reparaturen, die automatische Überwachung von Kriterien, die sich negativ auf die Qualität des Endproduktes und/oder die Auftragskosten auswirken sowie die frühzeitige Identifikation von fehlerhaften Produkten infolge einer Störung. Hierzu werden die Daten von SAP Smart Data Streaming erfasst, gefiltert und transformiert sowie laufend überwacht. Bei Überschreitung gewisser Schwellwerte bei kritischen Maschinen-Parametern werden Benachrichtigungen vom System erzeugt oder Ereignisse (Instandhaltungsaufträge) im ERP-System ausgelöst. Die Speicherung von Sensordaten in SAP HANA stellt die Datenbasis für statistische Analysen z. B. zur Identifikation von Fehlermustern dar. Ein weiteres Potenzial besteht in der Verknüpfung von Sensordaten mit Auftragsdaten sowie Daten des Qualitätsmanagements.