Qu'est-ce que Microsoft Fabric ?
Microsoft Fabric est la nouvelle plateforme unifiée d'analyse de données de Microsoft et d'Azure Data, chargée de rassembler une série d'outils de données (dont certains existent déjà dans la gamme de produits Azure) sous un même toit. Considérez-le comme une solution unique permettant d'analyser les chiffres et de fournir des informations.
L'objectif de Microsoft Fabric est de permettre aux professionnels de l'entreprise et des données de libérer le potentiel de leurs données à l'ère de l'intelligence artificielle. Fabric a révolutionné la façon dont les données sont interprétées et a rendu l'analyse accessible à tous, et pas seulement aux experts en science des données.
Dans cet article, nous allons démystifier davantage Microsoft Fabric, en nous penchant sur ses principales fonctionnalités, notamment OneLake, et sur les différentes charges de travail disponibles sur la plateforme. À la fin de cet article, vous saurez ce qu'est le tissu et pourquoi il est bénéfique.
Obtenez une certification pour le poste d'analyste de données de vos rêves
Nos programmes de certification vous aident à vous démarquer et à prouver aux employeurs potentiels que vos compétences sont adaptées à l'emploi.
Qu'est-ce que Microsoft Fabric ?
Microsoft Fabric est une plateforme analytique tout-en-un créée pour les entreprises et les professionnels des données. La plateforme s'occupe de tout, de la science des données et de l'analyse en temps réel au stockage et à la migration des données. Il s'agit d'une plateforme cohésive combinant divers outils et technologies en une seule solution.
La meilleure façon de conceptualiser le tissu est de comprendre son objectif : la simplicité. Grâce à cet outil, les organisations peuvent combiner des données provenant de plusieurs sources dans un environnement unique. Cette simplicité permet aux professionnels des données de se concentrer sur les résultats plutôt que sur la technologie qu'ils utilisent. Cela signifie également que les équipes chargées des données n'ont pas à passer des heures à distinguer comment les licences pour Synapse, Azure Data Factory et Power BI interagiront les unes avec les autres.
Caractéristiques de Microsoft Fabric
L'équipe de Microsoft a défini cinq domaines clés qui différencient Fabric du reste du marché. Ces domaines sont les suivants
Aperçu de Microsoft Fabric
#1 Une plateforme d'analyse complète
Chaque projet d'analyse dépend de plusieurs systèmes de soutien. Ces systèmes d'appui ont souvent un ensemble unique d'exigences et nécessitent souvent l'intervention de plusieurs autres fournisseurs. L'intégration des différents produits de ces fournisseurs peut s'avérer une tâche difficile, fragile et coûteuse.
C'est là que Microsoft Fabric entre en jeu.
Microsoft Fabric atténue ce problème en fournissant aux équipes une solution unique qui offre une interface utilisateur et une architecture uniformes, ainsi qu'une variété d'autres outils nécessaires pour extraire des informations des données et les présenter.
#2 Centré sur le lac et ouvert
Les lacs de données sont souvent désordonnés et complexes, ce qui rend leur construction, leur intégration et leur gestion extrêmement difficiles. Il y a aussi le problème de la duplication des données et du verrouillage des fournisseurs qui se pose une fois que le lac de données est opérationnel ; cela provient de l'utilisation de plusieurs produits de données qui emploient divers formats de données propriétaires sur le même lac de données.
Fabric résout ce problème en introduisant un lac de données multicloud intégré sous forme de logiciel en tant que service (SaaS), appelé "OneLake". De la même manière que toutes les applications Microsoft 365 sont automatiquement connectées à OneDrive, l'ensemble des charges de travail de Fabric sont connectées à OneLake.
L'intégration de OneLake permet de supprimer les silos de données omniprésents et désorganisés, qui apparaissent lorsque les membres de l'équipe configurent leurs propres comptes de stockage séparés. OneLake offre à toute l'équipe une unité de stockage unique et unifiée qui simplifie la recherche et le partage des données.
#3 L'intelligence artificielle
Le service OpenAI d'Azure est intégré à Microsoft Fabric à tous les niveaux pour aider les utilisateurs à exploiter tout le potentiel de leurs données. Cette intégration permet également aux développeurs d'appliquer la puissance de l'IA générative aux données clients et d'aider les utilisateurs professionnels dans leur quête de découverte d'informations dans les données.
Copilot étant intégré à chaque expérience de données Microsoft Fabric, les utilisateurs peuvent utiliser le langage conversationnel pour.. :
- Construire des modèles d'apprentissage automatique
- Développer des flux de données et des pipelines de données
- Générer du code et des fonctions entières
- Visualiser les résultats
Il est même possible pour les utilisateurs de créer leurs propres expériences de langage conversationnel personnalisées qui combinent leurs données avec les modèles d'Azure OpenAI Service et les publient ensuite en tant que plug-ins.
#4 Autonomisation de tous les utilisateurs de l'entreprise
Les équipes d'une organisation aspirent à promouvoir une culture axée sur les données lorsque chacun est habilité à prendre de meilleures décisions à l'aide des données. Microsoft Fabric contribue à promouvoir cette culture en rendant l'analyse accessible à tous. Plus précisément, Fabric est profondément intégré aux applications typiques et quotidiennes de Microsoft 365. Il est ainsi possible de convertir vos applications Microsoft 365 en un point central pour la découverte et l'application d'informations.
#5 Réduction des coûts grâce à des capacités unifiées
Lorsque divers produits provenant de plusieurs fournisseurs sont combinés dans un seul projet, il y a généralement un gaspillage important. Cela s'explique par le fait que la capacité de calcul est répartie entre plusieurs systèmes, tels que l'ingénierie des données, l'entreposage des données et l'informatique décisionnelle. Dès qu'un de ces systèmes est inactif, sa capacité ne peut pas être utilisée par un autre système, ce qui signifie que des ressources sont gaspillées.
Le tissu atténue ce problème en réduisant la complexité de l'achat et de la gestion des ressources. Avec Fabric, il est possible d'acheter un seul pool de calcul pour alimenter toutes les charges de travail (par exemple, l'intégration de données, la science des données, etc.) Ce modèle "tout compris" réduit considérablement les coûts, puisque toute ressource informatique inutilisée dans une charge de travail peut être utilisée par n'importe laquelle d'entre elles.
OneLake : Le cœur du tissu
Au cœur de Microsoft Fabric se trouve OneLake. OneLake est en fait l'endroit où sont stockées toutes les données utilisées dans Fabric. Comme son nom l'indique, OneLake est un lac de données logique unique et unifié, chargé de prendre en charge toutes vos charges de travail Fabric.
Une comparaison est souvent faite entre OneLake et OneDrive. Par exemple, voici ce que Microsoft a déclaré : "Tout comme Office stocke les fichiers Word, Excel et PowerPoint dans OneDrive, Fabric stocke les lacs, les entrepôts et d'autres éléments dans OneLake". Cela a souvent conduit à adopter l'analogie selon laquelle OneLake est aux données ce que OneDrive est aux fichiers.
Avant l'arrivée de OneLake, les organisations créaient généralement plusieurs lacs pour différentes équipes au lieu de collaborer sur un seul lac de données, même si cela impliquait la gestion de ressources supplémentaires. OneLake a été introduit pour relever ces défis en brisant les silos de données et en améliorant la collaboration en simplifiant la gestion des données de l'organisation.
Microsoft OneLake en action - Source de l'image
Les principales caractéristiques sont les suivantes :
Raccourcis
La fonction de raccourci permet aux utilisateurs de combiner des données provenant de différents groupes d'entreprises et domaines dans leur produit de données virtuel. Cela signifie que les organisations peuvent facilement partager des données entre différents utilisateurs et applications sans avoir à déplacer ou dupliquer inutilement des informations. Le terme "raccourci" fait référence aux données stockées dans d'autres emplacements de fichiers, qui peuvent se trouver dans le même espace de travail ou dans des espaces différents. Quel que soit l'emplacement, la référence du raccourci fait apparaître les fichiers et les dossiers comme s'ils étaient stockés localement.
Ouverture
Azure Data Lake Storage (ADLS) Gen2 de Microsoft est une suite de fonctionnalités pour l'analyse des données volumineuses (big data) qui s'appuie sur le stockage Azure Blob. En plus d'offrir un stockage massif, ADLS Gen2 accepte les types de données structurées et non structurées. Cette information est utile car OneLake est construit sur ADLS Gen2, ce qui le rend ouvert à tous les niveaux.
OneLake est également compatible avec les applications ADLS Gen2 existantes, telles que Azure Databricks, puisqu'il prend en charge les mêmes API et SDK ADLS Gen2. Par conséquent, il n'est pas nécessaire d'être expert en Microsoft Fabric pour accéder aux données sous-jacentes ; les utilisateurs peuvent traiter les données dans OneLake comme s'il s'agissait d'un compte de stockage ADLS massif pour l'ensemble de l'organisation.
Une copie des données
Avec OneLake, le processus de copie des données pour qu'elles puissent être utilisées avec un autre moteur ou le décloisonnement des données pour qu'elles puissent être analysées avec d'autres données est obsolète. Il n'est plus nécessaire. Selon la documentation de OneLake, "OneLake vise à vous donner le plus de valeur possible à partir d'une seule copie de données sans mouvement ou duplication de données".
La gouvernance par défaut
L'un des avantages uniques des services SaaS est le concept de locataires. Un locataire définit un groupe de clients qui partagent un accès commun et des privilèges spécifiques à une instance logicielle. La documentation OneLake précise que "le fait de savoir où commence et où finit l'organisation d'un client fournit une frontière naturelle de gouvernance et de conformité, qui est en fin de compte sous le contrôle d'un administrateur locataire". Essentiellement, toutes les données qui arrivent dans OneLake sont régies par défaut.
Charges de travail et expériences des utilisateurs
Microsoft Fabric est livré avec plusieurs charges de travail, chacune d'entre elles étant développée avec des personas spécifiques à l'esprit, qui sont automatiquement connectées à OneLake pour offrir à chaque utilisateur une expérience unique de la plateforme.
Ces charges de travail sont les suivantes
Usine de données
La data factory offre plus de 150 connecteurs aux sources de données cloud et sur site, la possibilité d'orchestrer des pipelines de données et des expériences de glisser-déposer pour la transformation des données.
Ingénierie des données synapses
La charge de travail de l'ingénierie des données dispose de fonctionnalités intéressantes qui fonctionnent avec Fabric, telles que Lakehouse. Un artefact Lakehouse existe dans son propre espace de travail et permet ce que Microsoft décrit comme des "expériences de création exceptionnelles" à l'aide du moteur Spark. Il y a aussi d'autres avantages intéressants, comme le démarrage instantané avec des pools en direct et la possibilité de collaborer.
Entrepôt de données Synapse
La charge de travail de l'entrepôt de données offre aux ingénieurs de données et aux analystes une expérience convergente entre Lakehouse et l'entrepôt de données. Derrière l'entrepôt se trouve leur moteur SQL dédié, unifié, sans serveur et à la pointe de l'industrie (sur les formats de données ouverts).
Analyse en temps réel de Synapse
La charge de travail analytique en temps réel permet aux développeurs de diffuser en continu des données provenant d'appareils de l'Internet des objets (IoT), de télémétrie, de journaux, etc. Ils sont également capables d'analyser de grands volumes de données semi-structurées avec des performances élevées et une faible latence grâce au langage Kusto Query Langauge (KQL).
Synapse science des données
La charge de travail Data Science permet aux utilisateurs de travailler sur l'ensemble du processus de science des données de bout en bout. Elle le fait en offrant aux scientifiques des données une variété d'outils nécessaires pour construire des modèles d'IA sophistiqués, collaborer sur des projets, et former, déployer et gérer des modèles d'apprentissage automatique.
Activateur de données
Data Activator est une interface intuitive, sans code, au sein de Microsoft Fabric, conçue pour lancer de manière autonome des actions en réponse à des modèles identifiés ou à des conditions spécifiques dans des données évolutives.
Business Intelligence (Power BI)
Au cœur de la charge de travail de veille stratégique de Power BI se trouve Power BI, le service d'analyse de Microsoft, leader sur le marché et axé sur l'IA. Cela permet aux analystes commerciaux et aux autres utilisateurs de découvrir des informations dans les données de l'organisation. Il est également profondément intégré à Microsoft 365, ce qui signifie que les organisations peuvent obtenir des informations pertinentes directement à partir de n'importe quel produit 365.
Devenez un analyste de données Power BI
Maîtrisez l'outil de veille stratégique le plus populaire au monde.
Conclusion
Microsoft Fabric est une plateforme qui change la donne et qui rassemble une variété d'outils et de services Azure sous un même toit.
Ses principales fonctionnalités, telles que OneLake et ses différentes charges de travail, permettent aux entreprises et aux professionnels des données de prendre des décisions plus intelligentes et basées sur les données. Que vous soyez un data scientist chevronné ou un analyste commercial cherchant à exploiter la puissance des données, Microsoft Fabric offre une solution complète qui simplifie les tâches complexes liées aux données.
L'une des principales intégrations de Microsoft Fabric se fait avec Power BI, le service d'analyse de pointe de Microsoft. Si vous souhaitez plonger plus profondément dans l'analyse et la visualisation des données, consultez notre cursus de compétences Power BI Fundamentals. Ce cursus vous permettra d'acquérir les compétences nécessaires pour transformer des données brutes en informations significatives, une compétence qui complète parfaitement les capacités de Microsoft Fabric.