Max Heinzler, Edgar Kreuz
Grundlage des Data Lake für das KI-Modell bei Rothaus bilden auf der einen Seite interne Daten wie Stammdaten, Absatzmengen, Absatzzeit- punkte oder Preise (UVP). Kundenspezifisch wurden sie um externe Daten aus verschiedenen Quellen ergänzt. Bei der Badischen Staatsbrauerei waren dies zum Beispiel:
- saisonale Einflüsse auf den Bierabsatz wie die Jahreszeiten und das Wetter: Bei warmem Wetter, also vor allem im Sommer, wird in der Regel mehr Bier getrunken als bei kaltem Wetter im Winter. Verwertbare Daten liefern hier die Vorhersagen der Wetterdienste, allerdings nur für einen begrenzten Zeitraum. Um die Einflüsse genau abbilden zu können, wurden mehrere Wettermerkmale integriert. Neben der offensichtlichen Größe, der Temperatur, sorgen die Anzahl Sonnenminuten und die Niederschlagsmenge für ein detailliertes Abbild des Wetters.
- allgemein verfügbare Kalenderinformationen, wie die Termine bierfreundlicher Feiertagsfeste (1. Mai, Vatertag etc.) oder Ferien.
- Verkaufsdaten Getränkefachgroßhandel: Rothaus vertreibt den Großteil seiner Produkte über Zwischenhändler, das heißt der eigentliche Verkaufszeitpunkt an den Lebensmittel- oder Getränkeeinzelhandel ist normalerweise nicht nachvollziehbar. Einige Unternehmen haben sich auf die Datenkommunikation zwischen Hersteller und Fachgroßhandel spezialisiert und liefern genau diese Verkaufsdaten Getränkefachgroßhandel: Kunde, Produkt, Menge, Zeitpunkt, Preis.
Monat |
Brauerei 1 |
Brauerei 2 |
Brauerei 3 |
Brauerei 4 |
Januar 2022 |
1,34 EUR |
1,39 EUR |
1,59 EUR |
1,54 EUR |
Februar 2022 |
1,37 EUR |
1,36 EUR |
1,53 EUR |
1,54 EUR |
März 2022 |
1,35 EUR |
1,35 EUR |
1,61 EUR |
1,57 EUR |
April 2022 |
1,38 EUR |
1,43 EUR |
1,57 EUR |
1,59 EUR |
Mai 2022 |
1,40 EUR |
1,37 EUR |
1,58 EUR |
1,59 EUR |
Juni 2022 |
1,44 EUR |
1,42 EUR |
1,57 EUR |
1,58 EUR |
Juli 2022 |
1,44 EUR |
1,42 EUR |
1,61 EUR |
1,55 EUR |
August 2022 |
1,42 EUR |
1,44 EUR |
1,62 EUR |
1,61 EUR |
September 2022 |
1,46 EUR |
1,43 EUR |
1,61 EUR |
1,59 EUR |
Oktober 2022 |
1,38 EUR |
1,42 EUR |
1,62 EUR |
1,57 EUR |
November 2022 |
1,46 EUR |
1,36 EUR |
1,63 EUR |
1,63 EUR |
Dezember 2022 |
1,45 EUR |
1,50 EUR |
1,61 EUR |
1,67 EUR |
Januar 2023 |
1,36 EUR |
1,36 EUR |
1,53 EUR |
1,49 EUR |
Februar 2023 |
1,36 EUR |
1,41 EUR |
1,56 EUR |
1,52 EUR |
März 2023 |
1,40 EUR |
1,42 EUR |
1,56 EUR |
1,52 EUR |
Mittelwert |
1,40 EUR |
1,41 EUR |
1,59 EUR |
1,57 EUR |
Tab. 1: Durchschnittlicher Angebotspreis pro Liter für Kisten 0,33l von Rothaus und seinen Marktbegleitern in Baden-Württemberg pro Monat (aus Wettbewerbsgründen durchgehend anonymisiert)
- Angebote, Rabatte und Aktionen des Lebensmittel- und Getränkeeinzelhandels für Artikel der Staatsbrauerei und ihrer Marktbegleiter. In Abb. 1 wird der durchschnittliche Angebotspreis pro Liter für Kisten 0,33l von Rothaus und seinen Marktbegleitern pro Monat in Baden-Württemberg angegeben. Neben diesem Angebotspreis (siehe Abb. 1) und Angebotsmenge sind die Verfügbarkeit (Anzahl Läden, Region) und die Gültigkeit (Dauer, Zeitpunkt) entscheidend. So können Preisaggressivität (prozentuale Abweichung zum UVP) und Verfügbarkeit über historische und zu- künftige Zeiträume hinweg in die Prognose aufgenommen werden. Damit diese Informationen in die Analyse und Prognosen einfließen konnten, wurden Logiken entwickelt und mit macs-Regeln umgesetzt.
Entscheidend für die Auswahl der Daten- quellen sind die Verfügbarkeit, die Kosten und die Datenqualität. Für alle verfügbaren Daten wurde ein neuer Importprozess definiert, um die Daten sofort und in der gewünschten Qualität in die Software integrieren zu können. Die Datenanbindung erfolgt über ETL-Prozesse oder zusätzliche Schnitt- stellen. Die Analysemethoden zum Sicher- stellen der Datenqualität sind z. T. schon in macs integriert. Natürlich ist in jedem Projekt die Datenstruktur unterschiedlich, allerdings sind die meisten Methoden vielseitig anwendbar. macs integrierte eine Python-Engine in ihre Software, sodass zukünftig alle Methoden und Libraries, die für Python verfügbar sind, genutzt werden können.