Direkt zum Inhalt
HeimDer blogDatenanalyse

Was ist Microsoft Fabric?

Entdecke, wie Microsoft Fabric die Datenanalyse revolutioniert und erfahre, wie seine Kernfunktionen Unternehmen dabei helfen, datengesteuerte Entscheidungen zu treffen.
Aktualisierte 10. Sept. 2024  · 10 Min. lesen

Microsoft Fabric ist die neue vereinheitlichte Datenanalyseplattform von Microsoft und Azure Data, die eine Reihe von Daten-Tools (von denen einige bereits in der Azure-Produktpalette enthalten sind) unter einem Dach zusammenfasst. Sieh es als eine einzige Lösung, um Zahlen zu berechnen und Erkenntnisse zu gewinnen.

Das Ziel von Microsoft Fabric ist es, Unternehmen und Datenexperten in die Lage zu versetzen, das Potenzial ihrer Daten für das Zeitalter der künstlichen Intelligenz zu erschließen. Fabric hat die Art und Weise, wie Daten interpretiert werden, revolutioniert und Analysen für jeden zugänglich gemacht - nicht nur für Datenwissenschaftler.

In diesem Artikel werden wir Microsoft Fabric weiter entmystifizieren und die Kernfunktionen, einschließlich OneLake, und die verschiedenen Workloads, die auf der Plattform verfügbar sind, näher erläutern. Am Ende dieses Artikels wirst du wissen, was Stoff ist und warum er nützlich ist.

Lass dich für deine Traumrolle als Datenanalyst zertifizieren

Unsere Zertifizierungsprogramme helfen dir, dich von anderen abzuheben und potenziellen Arbeitgebern zu beweisen, dass deine Fähigkeiten für den Job geeignet sind.

Hol Dir Deine Zertifizierung
Timeline mobile.png

Was ist Microsoft Fabric?

Microsoft Fabric ist eine All-in-One-Analyseplattform, die für Unternehmen und Datenexperten entwickelt wurde. Die Plattform deckt alles ab, von Data Science und Echtzeitanalysen bis hin zu Datenspeicherung und Datenmigration. Es ist eine zusammenhängende Plattform, die verschiedene Tools und Technologien in einer einzigen Lösung vereint.

Der beste Weg, Fabric zu begreifen, ist, seinen Zweck zu verstehen: Einfachheit. Mit diesem Tool können Unternehmen Daten aus verschiedenen Quellen in einer einzigen Umgebung kombinieren. Diese Einfachheit ermöglicht es Datenexperten, sich auf die Ergebnisse zu konzentrieren und nicht auf die Technologie, die sie verwenden. Das bedeutet auch, dass Datenteams nicht stundenlang überlegen müssen, wie die Lizenzen für Synapse, Azure Data Factory und Power BI zusammenspielen.

Microsoft Fabric Merkmale

Es gibt fünf Schlüsselbereiche, die das Microsoft-Team als Unterscheidungsmerkmal zwischen Fabric und dem Rest des Marktes definiert hat. Zu diesen Bereichen gehören:

Ein Überblick über Microsoft Fabric

#1 Eine vollständige Analyseplattform

Jedes Analyseprojekt hängt von mehreren unterstützenden Systemen ab. Diese unterstützenden Systeme haben oft ganz eigene Anforderungen und erfordern oft Beiträge von mehreren anderen Anbietern. Die Integration der verschiedenen Produkte dieser Anbieter kann eine schwierige, anfällige und teure Aufgabe sein.

Hier kommt Microsoft Fabric ins Spiel.

Microsoft Fabric entschärft dieses Problem, indem es Teams eine einzige Lösung bietet, die eine einheitliche Benutzeroberfläche, eine einheitliche Architektur und eine Vielzahl anderer Werkzeuge bereitstellt, die notwendig sind, um Erkenntnisse aus Daten zu gewinnen und zu präsentieren.

#2 See-zentriert und offen

Data Lakes sind oft unübersichtlich und komplex, was ihren Aufbau, ihre Integration und ihre Verwaltung zu einem äußerst schwierigen Unterfangen macht. Wenn der Data Lake erst einmal in Betrieb ist, stellt sich auch das Problem der Datenduplizierung und der Anbieterbindung, die sich aus der Verwendung mehrerer Datenprodukte mit unterschiedlichen proprietären Datenformaten im selben Data Lake ergibt.

Fabric löst dieses Problem durch die Einführung eines integrierten Software-as-a-Service (SaaS), Multi-Cloud Data Lake namens "OneLake". Ähnlich wie alle Microsoft 365-Anwendungen automatisch mit OneDrive verbunden sind, sind auch alle Workloads von Fabric mit OneLake vernetzt.

Die eingebaute Integration von OneLake hilft dabei, allgegenwärtige und unorganisierte Datensilos zu beseitigen, die entstehen, wenn Teammitglieder ihre eigenen getrennten Speicherkonten konfigurieren. OneLake bietet dem gesamten Team eine einzige, einheitliche Speichereinheit, die das Auffinden und Teilen von Daten einfach macht.

#3 Künstliche Intelligenz

Der OpenAI-Dienst von Azure ist auf jeder Ebene in Microsoft Fabric integriert, damit Nutzer das volle Potenzial ihrer Daten ausschöpfen können. Diese Integration ermöglicht es Entwicklern auch, die Macht der generativen KI auf Kundendaten anzuwenden und Geschäftsanwendern bei ihrer Suche nach Erkenntnissen in Daten zu helfen.

Da Copilot in jedes Microsoft Fabric-Datenerlebnis integriert ist, können Nutzer/innen die Konversationssprache nutzen, um:

  • Modelle für maschinelles Lernen erstellen
  • Datenflüsse und Datenpipelines entwickeln
  • Code und ganze Funktionen generieren
  • Ergebnisse visualisieren

Es ist sogar möglich, dass Nutzer ihre eigenen benutzerdefinierten Konversationssprachenerlebnisse erstellen, die ihre Daten mit Azure OpenAI Service-Modellen kombinieren und sie dann als Plug-ins veröffentlichen.

#4 Ermächtigung für alle Geschäftsanwender

Teams in einem Unternehmen streben nach einer datengesteuerten Kultur, wenn jeder in die Lage versetzt wird, mithilfe von Daten bessere Entscheidungen zu treffen. Microsoft Fabric hilft dabei, diese Kultur zu fördern, indem es Analysen für alle zugänglich macht. Genauer gesagt ist Fabric tief in die typischen, alltäglichen Microsoft 365-Anwendungen integriert. So kannst du deine Microsoft 365-Anwendungen in einen Brennpunkt für die Aufdeckung und Anwendung von Erkenntnissen verwandeln.

#5 Kostensenkung durch vereinheitlichte Kapazitäten

Wenn verschiedene Produkte von mehreren Anbietern in einem einzigen Projekt kombiniert werden, kommt es in der Regel zu erheblichen Streuverlusten. Das liegt daran, dass die Rechenkapazitäten in verschiedenen Systemen wie Data Engineering, Data Warehousing und Business Intelligence bereitgestellt werden. Wenn eines dieser Systeme im Leerlauf ist, kann seine Kapazität nicht von einem anderen System genutzt werden, was bedeutet, dass Ressourcen verschwendet werden.

Fabric mildert dieses Problem, indem es die Komplexität des Einkaufs und der Verwaltung von Ressourcen reduziert. Mit Fabric ist es möglich, einen einzigen Pool von Rechenleistung zu erwerben, um alle Arbeitslasten zu bewältigen (z.B. Datenintegration, Data Science, etc.). Dieses All-inclusive-Modell senkt die Kosten erheblich, da alle ungenutzten Rechenressourcen eines Workloads von allen anderen Workloads genutzt werden können.

OneLake: Das Herz des Stoffes

Das Herzstück von Microsoft Fabric ist OneLake. In OneLake werden alle Daten, die in Fabric verwendet werden, gespeichert. Wie der Name schon sagt, ist OneLake ein einziger, einheitlicher, logischer Data Lake, der für die Unterstützung all deiner Fabric-Workloads verantwortlich ist.

Oft wird ein Vergleich zwischen OneLake und OneDrive gezogen. Hier ein Beispiel von Microsoft: "Ähnlich wie Office Word-, Excel- und PowerPoint-Dateien in OneDrive speichert, speichert Fabric Seehäuser, Lagerhäuser und andere Gegenstände in OneLake." Das hat viele dazu verleitet, die Analogie anzunehmen, dass OneLake für Daten das ist, was OneDrive für Dateien ist.

Bevor es OneLake gab, haben Unternehmen in der Regel mehrere Data Lakes für verschiedene Teams erstellt, anstatt gemeinsam an einem einzigen Data Lake zu arbeiten, unabhängig davon, ob dies die Verwaltung zusätzlicher Ressourcen bedeutet. OneLake wurde eingeführt, um diese Herausforderungen zu beseitigen, indem es Datensilos aufbricht und die Zusammenarbeit durch die Vereinfachung der Verwaltung von Unternehmensdaten verbessert.

Microsoft OneLake in Aktion - Bildquelle

Microsoft OneLake in Aktion - Bildquelle

Zu den wichtigsten Funktionen gehören:

Abkürzungen

Die Verknüpfungsfunktion ermöglicht es den Nutzern, Daten aus verschiedenen Unternehmensgruppen und Domänen in ihrem virtuellen Datenprodukt zu kombinieren. Das bedeutet, dass Unternehmen problemlos Daten zwischen verschiedenen Nutzern und Anwendungen austauschen können, ohne dass Informationen unnötig verschoben oder dupliziert werden müssen. Der Begriff "Verknüpfung" bezieht sich auf Daten, die an weiteren Dateispeicherorten gespeichert sind, die sich innerhalb desselben Arbeitsbereichs oder in verschiedenen Arbeitsbereichen befinden können. Unabhängig vom Speicherort lässt die Verknüpfung Dateien und Ordner so erscheinen, als ob sie lokal gespeichert wären.

Offenheit

Azure Data Lake Storage (ADLS) Gen2 von Microsoft ist eine Suite von Funktionen für Big Data-Analysen, die auf Azure Blob Storage aufbaut. ADLS Gen2 bietet nicht nur massiven Speicherplatz, sondern akzeptiert auch strukturierte und unstrukturierte Datentypen. Diese Informationen sind nützlich, da OneLake auf ADLS Gen2 aufbaut, was es auf jeder Ebene offen macht.

OneLake ist auch mit bestehenden ADLS Gen2-Anwendungen wie Azure Databricks kompatibel, da es die gleichen ADLS Gen2-APIs und SDKs unterstützt. Daher sind keine Kenntnisse über Microsoft Fabric erforderlich, um auf die zugrunde liegenden Daten zuzugreifen. Die Nutzer/innen können die Daten in OneLake ansprechen, als ob es sich um ein großes ADLS-Speicherkonto für das gesamte Unternehmen handeln würde.

Eine Kopie der Daten

Mit OneLake ist es nicht mehr nötig, Daten zu kopieren, um sie mit einer anderen Engine zu verwenden oder Silos aufzubrechen, damit die Daten mit anderen Daten analysiert werden können. Das ist nicht mehr nötig. In der Dokumentation von OneLake heißt es : "OneLake zielt darauf ab, den größtmöglichen Nutzen aus einer einzigen Datenkopie zu ziehen, ohne Daten zu verschieben oder zu duplizieren."

Governance by default

Einer der einzigartigen Vorteile von SaaS-Diensten ist das Konzept der Mieter (Tenants). Ein Tenant definiert eine Gruppe von Kunden, die einen gemeinsamen Zugang und bestimmte Privilegien zu einer Software-Instanz haben. In der OneLake-Dokumentation heißt es: "Zu wissen, wo die Organisation eines Kunden beginnt und endet, schafft eine natürliche Governance- und Compliance-Grenze, die letztlich unter der Kontrolle des Tenant-Administrators steht." Im Grunde genommen werden alle Daten, die in OneLake landen, standardmäßig geregelt.

Fabric Workloads und Nutzererfahrungen

Microsoft Fabric wird mit verschiedenen Workloads geliefert, die jeweils mit Blick auf bestimmte Personas entwickelt wurden und automatisch mit OneLake verbunden werden, um jedem Nutzer ein einzigartiges Plattformerlebnis zu bieten.

Zu diesen Arbeitsbelastungen gehören:

Datenfabrik

Die Data Factory bietet mehr als 150 Konnektoren zu Cloud- und On-Premise-Datenquellen, die Möglichkeit, Datenpipelines zu orchestrieren, und Drag-and-Drop-Erfahrungen für die Datenumwandlung.

Synapse Datentechnik

Der Data-Engineering-Workload hat coole Funktionen, die innerhalb von Fabric funktionieren, wie zum Beispiel Lakehouse. Ein Lakehouse-Artefakt existiert in seinem eigenen Arbeitsbereich und ermöglicht das, was Microsoft als "großartige Authoring-Erlebnisse" mit der Spark-Engine beschreibt. Es gibt noch andere tolle Vorteile, wie z.B. den sofortigen Start mit Live-Pools und die Möglichkeit zur Zusammenarbeit.

Synapse Data Warehouse

Der Data-Warehouse-Workload bietet Dateningenieuren und -analysten eine konvergierte Lakehouse- und Data-Warehouse-Erfahrung. Hinter dem Warehouse steht ihre branchenführende (auf offenen Datenformaten), einheitliche, serverlose und dedizierte SQL-Engine.

Synapse Echtzeit-Analysen

Der Echtzeit-Analyse-Workload ermöglicht es Entwicklern, Daten von Internet of Things (IoT)-Geräten, Telemetrie, Protokollen und mehr zu streamen. Außerdem sind sie in der Lage, große Mengen an halbstrukturierten Daten mit hoher Leistung und geringer Latenz zu analysieren, da Kusto Query Langauge (KQL) die Grundlage dafür bildet.

Synapse Datenwissenschaft

Der Data Science Workload ermöglicht es den Nutzern, den gesamten End-to-End Data Science Prozess zu durchlaufen. Dazu bietet es Datenwissenschaftlern eine Vielzahl von Tools, die sie benötigen, um anspruchsvolle KI-Modelle zu erstellen, an Projekten zusammenzuarbeiten und Modelle für maschinelles Lernen zu trainieren, einzusetzen und zu verwalten.

Daten Aktivator

Data Activator ist eine intuitive, codelose Schnittstelle innerhalb von Microsoft Fabric, die als Reaktion auf erkannte Muster oder bestimmte Bedingungen in sich entwickelnden Daten selbstständig Aktionen auslöst.

Business Intelligence (Power BI)

Das Herzstück von Fabric's Business Intelligence Workload ist Microsofts branchenführender und KI-gesteuerter Analysedienst, Power BI. Dies ermöglicht es Unternehmensanalysten und anderen Nutzern, Einblicke in die Unternehmensdaten zu erhalten. Es ist außerdem tief in Microsoft 365 integriert, was bedeutet, dass Unternehmen relevante Einblicke direkt aus jedem der 365-Produkte gewinnen können.

Werde ein Power BI Datenanalyst

Beherrsche das beliebteste Business Intelligence Tool der Welt.

Fazit

Microsoft Fabric ist eine bahnbrechende Plattform, die eine Vielzahl von Azure-Tools und -Diensten unter einem einheitlichen Dach vereint.

Seine Kernfunktionen, wie OneLake und seine verschiedenen Workloads, ermöglichen es Unternehmen und Datenexperten, intelligentere, datengesteuerte Entscheidungen zu treffen. Egal, ob du ein erfahrener Datenwissenschaftler oder ein Unternehmensanalyst bist, der die Macht der Daten nutzen möchte, Microsoft Fabric bietet eine umfassende Lösung, die komplexe Datenaufgaben vereinfacht.

Eine der wichtigsten Integrationen in Microsoft Fabric ist Power BI, Microsofts branchenführender Analysedienst. Wenn du tiefer in die Datenanalyse und -visualisierung eintauchen möchtest, schau dir unseren Power BI Fundamentals Skill Track an. Dieser Kurs vermittelt dir die Fähigkeiten, die du brauchst, um Rohdaten in aussagekräftige Erkenntnisse umzuwandeln - eine Fähigkeit, die die Möglichkeiten von Microsoft Fabric perfekt ergänzt.

Themen