Lorenz Rossmann, Dr. Jan Christoph Munck
Stehen die Daten in Zeitreihen strukturiert zur Verfügung und sind beschrieben, beginnt die Exploration. Dieser Schritt, in dem die Daten statistisch und grafisch dargestellt werden, hilft in vielen Fällen, Fehler und Strukturänderungen in den Datensätzen aufzuzeigen und gemeinsam mit der Fachabteilung zu bereinigen. Wird z. B. der Cash Pool eines Konzerns umstrukturiert oder eine Planungsposition in mehrere aufgeteilt, wirkt sich dies auf die Nutzbarkeit der bis dahin verfügbaren Daten im Liquiditätsforecasting aus. Dabei werden die Daten korrigiert und bereinigt. Die Bereinigung und Korrektur wird typischerweise ebenfalls mit mathematischen Verfahren durchgeführt.
Um zusätzlich saisonale Schwankungen und Trends grafisch nachzuvollziehen eignet sich die Zeitreihenzerlegung der wichtigsten Zeitreihen. Bei der Zeitreihenzerlegung wird eine Zeitreihe in eine saisonale Komponente, einen Trend und in eine Komponente, die den Rest beschreibt, zerlegt (s. Abb. 2). Die hier dargestellte Zeitreihenzerlegung basiert auf dem Konzept des gleitenden Durchschnitts und eignet sich hauptsächlich für die grafische Darstellung. Für das Forecasting können Trend und Saisonalität mit anderen Methoden genauer berechnet werden.
Abb. 2: Zeitreihenzerlegung: Eurostat – Umsatz in der deutschen Industrie (Index 2015 = 100 %)
Sind die Schritte zur Dokumentation und Exploration durchgeführt, wird die Datenqualität beurteilt, fehlende sowie fehlerhafte Werte dokumentiert und gemeinsam im Team potenzielle Lösungsansätze diskutiert. Am Ende der zweiten Phase
- liegen die Daten strukturiert vor,
- sind dokumentiert,
- zusätzliche für den Prozess zu verwendende Daten stehen zur Verfügung,
- die Zusammenhänge zwischen diversen Datensätzen sind dokumentiert und
- ein gemeinsames Verständnis der Datenqualität wurde erarbeitet.
Ein Vorteil der genauen Analyse vorliegender Daten und Prozesse ist, dass nebenbei Optimierungspotenziale aufgezeigt werden. Im Beispielprojekt konnten Data Scientist und Controller durch das strukturierte Nachvollziehen des händischen Forecasting-Prozesses gemeinsam Schwachstellen und Fehlerquellen identifizieren. Dies gelingt allerdings nur durch die vertrauensvolle und konstruktive Zusammenarbeit von Data Scientist und Controller. Sollten zu Beginn Ressentiments und Misstrauen das Arbeitsklima prägen, wurden gute Erfahrungen damit gemacht, Arbeitsmeetings zu Beginn unter Einbezug weiterer Eskalationsstufen abzuhalten.