Angelika Grom, Norbert Grimm
Datenmodell aufbauen
Am Beginn des ETL-Prozesses steht der Aufbau eines geeigneten und passenden Datenmodells. Die Inhalte und die Verknüpfung der Daten orientieren sich daran, was berichtet, welche Kennzahlen ausgewählt und aus welchen Datenquellen die Informationen stammen sollen. Dann beginnt die Extraktion der Daten mit der Kontrolle auf die richtige und fehlerfreie Datenübernahme.
Extraktion der Daten
Bei Bürkle mussten die Daten aus mehreren Einzeltabellen der Oracle-Datenbank des ERP-Systems mit Planzahlen, Umsatzdaten usw. zusammenfügt werden. Eine SQL-Abfrage lieferte die Daten. Typische Herausforderungen bei dieser Extraktion waren u. a.
- die Kontrolle von Duplikaten,
- die Unterscheidung von Kundennummern und Niederlassungsnummern und
- die richtige Interpretation von Datumswerten wie bspw. des Monats Januar als 1. Monat im Kalenderjahr und gleichzeitig als 10. Monat im Geschäftsjahr.
Transformation der Daten
Im nächsten Schritt erfolgte die Transformation der Daten in ein Format, das vom BI-System benötigt wird. Der ETL-Prozess wird in der Jedox-Plattform durch Hilfen und Plausibilitätsprüfungen unterstützt. Das BI-System prüft die importierten Daten auf Duplikate und auf Vollständigkeit. So kommt eine Meldung, wenn z. B. beim "Umsatz an Kunden" einzelne Kunden- oder Niederlassungsdaten fehlen.
Damit die Daten später im Detail und nach unterschiedlichen Hierarchien auswertbar sind, müssen sie mit den passenden Attributen versehen und mit den richtigen Feldern verknüpft sein. Wenn z. B. bei einem Kunden unterschiedliche Werke beliefert werden, lassen sich diese Standorte als Einzelkunden einer Hauptkunden-Nr. zuordnen, sodass Umsatzzahlen sowohl für den Hauptkunden als auch für die Werke als Einzelkunden abrufbar sind. Erhält der Kunde einen Bonus, wird die Information beim Hauptkunden gespeichert und automatisch auf die Einzelkunden übertragen.
Dimensionen im Datenwürfel
Eine weitere Anforderung im ETL-Prozess von Bürkle war die Zuordnung der Kunden zu den einzelnen Unternehmensbereichen, Regionen, Niederlassungen und Außendienstmitarbeitern. Jede dieser Dimensionen wird im Datenmodell und beim Datenwürfel berücksichtigt, um bei der Analyse selektiert werden zu können. Jedox unterstützt die Auswahl der gewünschten Informationen mithilfe einer grafischen Oberfläche.
Laden der Daten
Der Aufbau des Datenwürfels und das Laden der Daten wurden zunächst vom Jedox-Berater unterstützt und beim zweiten Projekt vom Bürkle-Controlling bereits weitgehend selbstständig umgesetzt.