Data Warehouse Technologien im Wandel
Bereits in heutigen Reportinglösungen liegt die Komplexität bei der Abbildung in einer technologischen Plattform häufig nicht in der Präsentationsschicht, sondern in der Datenbereitstellung und -aufbereitung. Informationssysteme – ob für analytisches oder Management Reporting – basieren auf Data Warehouse-Lösungen, die sich derzeit einem starken Wandel ausgesetzt sehen. Im Zuge der immer preiswerter werdenden Speicherkapazitäten und der höheren Verfügbarkeit an Daten und somit größeren Datenvolumina ("Big Data") sowie dem Technologiewandel (In-memory Technologien wie SAP HANA) ändern sich Data Warehouse Strukturen und Prinzipien.
Ist der fachliche Wandel zu einem integrierten Reporting zwingend mit dem technologischen Wandel verbunden und wenn ja, in welchem Ausmaß?
Unter der Prämisse, dass ein integriertes Reporting mit möglichst wenig manuellen Schritten bzw. mit höchstmöglicher Automatisierung generiert werden soll, sind für eine Implementierung in eine technologische Lösung folgende Herausforderungen zu berücksichtigen – unabhängig von der geplanten Präsentation des integrierten Reportings:
- Eine größere Datenmenge wird erzeugt.
- Neue Dateninhalte werden generiert, die in die bestehende Datenstruktur zu integrieren sind.
- Neue Datenlieferanten entstehen.
Jeder dieser drei Faktoren hat Auswirkungen auf die Systemarchitektur der Reportinglösung. Dabei ist die bestehende Systemlandschaft, Systemarchitektur sowie Struktur des jeweiligen Unternehmens als Rahmenbedingung für die Erweiterung oder den Aufbau der bestehenden IT-Lösung hin zu einem integrierten Reporting zu berücksichtigen. Abhängig von der bestehenden Ist-Situation können die genannten Faktoren einzeln oder in Kombination relevant sein.
Höhere Datenvolumina für das integrierte Reporting
Wird lediglich eine größere Datenmenge zur Erstellung eines integrierten Reports erzeugt, so ist bei einer bestehenden Data Warehouse-Lösung der Implementierungs- bzw. Anpassungsaufwand auf Applikationsebene i. d. R. überschaubar. Datenquellen sind bereits in die Architektur integriert, die Datenstrukturen sind vorhanden. Im klassischen Data Warehouse-Ansatz können Maßnahmen wie zusätzliche Partitionierung, Datenaggregation o. ä. angewendet werden, um weiterhin effiziente Zugriffe auf die Datenbasis zu gewährleisten. Abhängig von der erwarteten Wachstumsrate der Datenvolumina kann allerdings – zur Sicherstellung einer adäquaten Systemperformance, d. h. Antwortzeit des Berichtes – die Erhöhung der Hardwarekapazität oder die Nutzung von in-memory Technologien empfehlenswert sein.
Abb. 3: Klassische DWH-Architektur einer Reportinglösung
Aufnahme neuer Dateninhalte
Werden darüber hinaus neue Dateninhalte für die Data Warehouse-Lösung generiert, sind bereits applikationsseitige Anpassungen erforderlich. Bei der praktischen Anwendung bedeutet dies beispielsweise, dass Daten nicht mehr monatsweise, sondern tagesgenau zur Verfügung gestellt oder zusätzliche Attribute aus den Datenquellen angeliefert werden. In einer heterogenen Systemlandschaft kann dies mit zusätzlichen Datenharmonisierungsaktivitäten verbunden sein, die im Datenaufbereitungsprozess (ETL – Extraktion, Transformation, Ladung) abgebildet werden.
Integration zusätzlicher Datenlieferanten
Da im Zuge des integrierten Reportings Fragestellungen beantwortet werden sollen, die vielfach noch nicht mit bestehenden Reportinglösungen innerhalb einer Organisation abgedeckt werden können, ist für die Einführung des integrierten Reportings davon auszugehen, dass neue Datenlieferanten entstehen, d. h. neue Datenquellen einzubinden sind.
Erneut ist hierbei die Ausgangssituation des Unternehmens zu berücksichtigen. Im positiven Ausgangsfall besteht bereits ein Corporate Data Warehouse, über welches die für ein integriertes Reporting wesentlichen Informationen – wie Financial und Sustainability KPIs – bereits abgedeckt sind.
Für die Bereitstellung weiterer Informationen sind zusätzliche Datenquellen in das Data Warehouse zu integrieren, dabei können erneut Harmonisierungsaufwände entstehen. Abhängig von dem Datenvolumen können auch in diesem Fall erneut performance-optimierende Maßnahmen erforderlich werden. Zu definieren ist darüber hinaus die Art und der Umfang der Datenanlieferung, die wiederum Auswirkungen auf die Systemarchitektur und erforderlichen Funktionalitäten haben:
- Kann eine automatisierte Schnittstelle erzeugt werden, ist eine Flat File Anbindung möglich oder sind manuelle Eingaben erforderlich?
- Liegen strukturierte oder unstrukturierte Daten vor?
- Sind Anpassungen oder Korrekturen der Daten im Zielsystem erforderlich?
Data Warehouse versus ERP Reportinglösung
Eine integrierte Data Warehouse-Lösung bietet die zuvor genannten Funktionalitäten, jedoch wird im Zuge der Entwicklung hin zu in-memory Technologien aktuell diskutiert, ob ein Data Warehouse zukünftig überhaupt noch benötigt wird oder z. B. ein Reporting direkt aus dem transaktionalen System erfolgen kann.
Vor dem Hinblick eines ...