Was ist Power Query?
Wenn Sie schon einmal mit Power BI Desktop gearbeitet haben, haben Sie mit Sicherheit Power Query verwendet, auch wenn Ihnen das vielleicht nicht bewusst war. Power Query ist ein interaktives Tool zur Datenbearbeitung, das Benutzern ermöglicht, Daten aus einer Vielzahl von Quellen zu importieren und zu transformieren. Dank seiner intuitiven Benutzeroberfläche können selbst Nutzer ohne Programmierkenntnisse komplexe Datentransformationen erstellen und anpassen, ohne auch nur eine Zeile Code zu schreiben (s. Abb. 1). Diese Zugänglichkeit ermöglicht es Fachbereichen, unabhängig von der IT oder einer BI-Abteilung, Daten direkt zu transformieren und zu verwalten.
Abb. 1: Intuitiv verständliche Menüzeilen erleichtern die Arbeit mit Power Query
Automatisierung durch Power Query
Eine der herausragendsten Eigenschaften von Power Query ist seine Fähigkeit, wiederkehrende Aufgaben zu automatisieren. Dies bedeutet, dass alle Transformationsschritte, die Sie einmal ausführen – sei es das Entfernen von Zeilen, das Hinzufügen einer berechneten Spalte oder jede andere Transformation –, automatisch auf zukünftige Datensätze angewendet werden, die den gleichen Kriterien entsprechen.
Beispiel:
Wenn Sie eine neue Datei in einen Ordner legen und in Power BI auf „Aktualisieren“ klicken, wendet Power Query die zuvor festgelegten Transformationsschritte automatisch auf diesen neuen Datensatz an. Diese Automatisierungsfunktion bietet nicht nur eine große Zeitersparnis, sondern verbessert auch die Konsistenz und Genauigkeit Ihrer Datenanalyse.
Die Kunst der Selbstdokumentation
Ein weiteres beeindruckendes Merkmal ist seine Fähigkeit zur Selbst-Dokumentation. Jedes Mal, wenn Sie Daten transformieren, generiert Power Query automatisch den entsprechenden Code. Dies erlaubt es, jede durchgeführte Änderung nachvollziehbar zu machen, was besonders nützlich ist, um die Auswirkungen bestimmter Transformationen zu verstehen. Transformationsschritte können jederzeit überarbeitet, entfernt oder ergänzt werden. Die automatisch erstellten Schritte können umbenannt und kommentiert werden, was die Nachvollziehbarkeit und Klarheit der durchgeführten Datentransformation erheblich verbessert (s. Abb. 2).
Abb. 2: Dokumentation von Transformationsschritten
Typische Transformationen
Power Query bieten eine Vielzahl von Transformationsfunktionen, die es ermöglichen, komplexe Datenmanipulationen einfach durchzuführen:
- Filtern von Daten
- Transformation von Datentypen
- Pivotieren und Entpivotieren von Tabellen
- Zusammenführen und Trennen von Spalten
- Entfernen von Zeilen und Spalten
- Ersetzen von Werten, Fehlern und leeren Zellen
- Einfügen von Spalten
- Mathematische Berechnungen über Spalten
Die Funktion "Entpivotieren" sehen Sie hier im Video.
Diese Funktionen machen Power Query zu einem unverzichtbaren Werkzeug für die Datenbearbeitung, indem sie benutzerfreundliche Lösungen für vielfältige Datenherausforderungen bieten.
Die Reihenfolge spielt eine wichtige Rolle
Die Reihenfolge der Transformationsschritte ist dabei jedoch von entscheidender Bedeutung, um sowohl die Stabilität als auch die Performance des Modells zu gewährleisten. Eine sorgfältige Planung dieser Schritte ist ausschlaggebend für die Effektivität des Datenmodells. Hier sind einige grundlegende Tipps zur Optimierung Ihrer Power Query-Vorgänge:
- Filtern: Starten Sie mit der Filterung Ihrer Daten, um die Datenmenge so früh wie möglich zu reduzieren. Dies verringert die Last für nachfolgende Transformationsschritte.
- Spaltenentfernung: Eliminieren Sie frühzeitig Spalten, die für die Analyse irrelevant sind. Dies vermindert die zu verarbeitende Datenmenge und kann die Performance steigern.
- Gruppierungen und Aggregationen: Seien Sie bedacht im Einsatz von Gruppierungen und Aggregationen, da diese ressourcenintensiv sein können. Überlegen Sie genau, ob und wann diese erforderlich sind.
- Berechnungen und Funktionen: Führen Sie Berechnungen oder benutzerdefinierte Funktionen erst nach der Reduktion der Datenmenge durch. Behalten Sie im Hinterkopf, dass die Berechnung der KPIs später mit Measures erfolgen sollte.
- Datenverschmelzung und -anhängen: Integrieren Sie das Verschmelzen (Join) und Anhängen (Append) von Datenquellen möglichst spät, um das Tragen großer Datenmengen durch den gesamten Transformationsprozess zu vermeiden. Erst die Daten aufbereiten, gruppieren und aggregieren (falls nötig), dann verschmelzen oder anhängen.
- Datentypänderungen: Nehmen Sie Datentypänderungen vor, wenn diese erforderlich sind, und setzen Sie Formate möglichst als letzten Schritt, um die korrekte Vorbereitung der Daten für die Analyse zu gewährleisten. Lediglich für die Anlage benutzerdefinierter Spalten kann es erforderlich sein, eine Formatierung schon früher festzulegen.
- Sortieren: Vermeiden Sie Sortierungen, bis diese unvermeidlich sind, da Sortieroperationen sehr ressourcenintensiv sein können. Wenn nötig, sortieren Sie die Daten erst in den letzten Schritten oder überlassen Sie das Sortieren dem Endbenutzer in Excel oder Power BI.
Durch die Umsetzung dieser allgemeinen Tipps lässt sich nicht nur die Leistungsfähigkeit Ihrer Datenmodelle in Power BI steigern, sondern auch deren Stabilität und Geschwindigkeit bei wachsenden Datenmengen sichern.
Kritische Würdigung
Trotz der beeindruckenden Flexibilität und Nutzerfreundlichkeit von Power Query sollten mit zunehmendem Verständnis und Kenntnisse über die Datentransformation sowie wachsender Datenkomplexität nicht alle Transformationen ausschließlich in Power Query durchgeführt werden. In manchen Fällen, wie bei der Nutzung einer SQL-Datenbank als Vorsystem, kann es sinnvoll sein, bestimmte Transformationen bereits im Vorsystem durchzuführen. Die einfache Bedienung von Power Query kann zwar verlockend sein, doch bei umfangreichen Transformationen kann dies zu Verzögerungen bei der Datenaktualisierung führen oder die Überschreitung der Kapazitäten.
Fazit
Power Query in Power BI ist ein unverzichtbares Werkzeug für Fachanwender ohne tiefe technische Kenntnisse und spielt eine zentrale Rolle in der modernen Datenverarbeitung. Es ermöglicht spezifische Anpassungen vor der finalen Analyse, wodurch die Daten optimal für die Visualisierung aufbereitet werden.
Tipp der Redaktion |
Online-Seminar: Excel im Controlling: Leistungsstarkes Reporting durch Kombination von POWER-QUERY mit Pivot Für Auswertungen zur Entscheidungsunterstützung müssen immer öfter Daten aus den verschiedensten Quellen integriert und formatiert werden. Dann ist der einmalige Einsatz von PowerQuery in Kombination mit Pivot-Tabellen eine effiziente Alternative zur immer wieder händischen Formatierung und Neuerstellung wiederkehrender Dashboard-Berichte. In diesem Online-Seminar erfahren Sie, wie Sie leistungsstarke Datentransformationen und anspruchsvolle Datenformatierungen mit PowerQuery passend für die weitere Analyse mit Pivot-Tabellen vorbereiten. Termin: 20.06.2024, 14 Uhr In zahlreichen Haufe-Abonnements inklusive - Teilnahmegebühr ohne Abo 98 EUR zzgl. USt./116,62 EUR inkl. USt. |