Juliane Freese, Philipp Stempfle
Die zunehmenden Anforderungen an das Datenmanagement und die Wichtigkeit der Datenanalyse in der modernen Geschäftswelt erfordern innovative Lösungen. Microsoft Fabric wurde entwickelt, um die Lücke zwischen bisherigen Datenmanagement-Tools und den Bedürfnissen der heutigen datengetriebenen Unternehmen zu schließen. Es kann als Antwort auf die aktuellen Herausforderungen des Datenmanagements betrachtet werden. Sein Funktionsumfang wird von Microsoft stets erweitert und durch regelmäßige Updates gepflegt.
Mit Microsoft Fabric lassen sich Daten einfacher verarbeiten und analysieren, weil teils zeitaufwendige ETL-Prozesse, wie sie in klassischen Data Warehouse-Strukturen Verwendung finden, durch die Einführung des OneLakes aufgebrochen und nicht mehr zwingend verwendet werden müssen. Es unterstützt Unternehmen somit, das volle Potenzial ihrer Daten auszuschöpfen. Durch die stärkere Integration bisheriger Azure-Services werden die Datenverarbeitungsprozesse auf einer Plattform gebündelt. Als End-to-End-Datenplattform deckt es alle Aspekte der Analyseanforderungen eines Unternehmens ab – von der Datenaufbereitung bis zur Erstellung aussagekräftiger Berichte. Die Lösung kommt sowohl Data Engineers als auch Data Analysts und Endanwendern zugute und ermöglicht eine effiziente Datenverarbeitung.
Microsoft Fabric verspricht, die Datenverarbeitung und -analyse zu vereinfachen und Unternehmen dabei zu unterstützen, das volle Potenzial ihrer Daten auszuschöpfen. Nichtsdestotrotz empfehlt es sich, vorab die konkreten Anforderungen zu analysieren und anhand dieser die richtige Plattform auszuwählen.
Abb. 1: Datawarehouse-Lösungen in MS Fabric
Als Ergänzung zu klassischeren Data Warehouse-Lösungen in MS Fabric dient OneLake (s. Abb. 1). OneLake ist ein einheitlicher, vereinter, logischer Data Lake für die gesamte Organisation. Ähnlich wie OneDrive wird OneLake automatisch mit jedem Microsoft Fabric-Tenant bereitgestellt und dient als zentraler Ablageort für alle Arten von Daten.
OneLake vermeidet die Notwendigkeit mehrerer separater Data Lakes und vereinfacht das Datenmanagement und die Zusammenarbeit. Durch einen zentralen Data Lake wird eine zum Teil unnötige Daten-Duplizierung vermieden. Dies vereinfacht das Datenmanagement und stellt sicher, dass alle mit denselben Daten arbeiten.
OneLake basiert auf Azure Data Lake Storage (ADLS) Gen2 und unterstützt jeden Dateityp – strukturiert oder unstrukturiert. Es speichert Daten im Delta-Parquet-Format und ist mit vorhandenen ADLS Gen2-Anwendungen kompatibel. OneLake wird als einheitlicher, vereinter Data Lake präsentiert, der die Datenverwaltung vereinfachen und die Zusammenarbeit verbessern soll. Dennoch müssen Unternehmen möglicherweise mit Einschränkungen und Unzulänglichkeiten bei der Integration und Nutzung von OneLake rechnen, da es sich um eine relativ neue Funktionalität handelt, die möglicherweise noch nicht alle Anforderungen erfüllt.
Umso einfacher die Bedienung, desto geringer ist die Hürde zur Nutzung der Tools, die zur Verfügung stehen. Der ein oder andere Nutzer versucht sich vielleicht an einem Python Notebook direkt in Fabric und baut darauf basierend eine neue Lösung für seinen Fachbereich. Durch die vereinfachte Datenintegration mit den zu nutzenden Daten für Analyse und Reporting im Parquet-Format und der integrierten Benutzeroberfläche im MS Fabric Service, nehmen wir eine klar geregelte Governance rund um die Datenbereitstellung, -verarbeitung und -veröffentlichung als immer wichtiger werdend wahr. Deshalb empfehlen wir, das Operating Modell einer Organisation im Zuge einer Einführung von MS Fabric entsprechend zu adaptieren.