Accéder au contenu principal

Power BI Fusionner les tableaux : Un guide complet avec des exemples

Découvrez l'essentiel de la fusion de tableaux dans Power BI. Ce didacticiel couvre tous les aspects, depuis les fusions de base jusqu'aux techniques avancées de correspondance floue.
Actualisé 16 janv. 2025  · 9 min de lecture

À un moment donné, vos rapports Power BI seront trop volumineux pour le simple fichier Excel que vous avez peut-être utilisé pour pour apprendre et expérimenter Power BI..

En fin de compte, vous devrez importer et éventuellement fusionner quelques tableaux provenant de différentes sources pour construire un modèle de données plus robuste.

Power BI propose un outil simple et puissant pour ce faire dans l'éditeur Power Query : fusionner des tableaux.

Dans ce tutoriel, nous vous montrons comment fusionner des tableaux dans Power BI avec quelques exemples pratiques et bonnes pratiques. 

Si le concept de fusion et de jonction de tableaux vous est totalement étranger, ne vous inquiétez pas ! Ce tutoriel vous présente également les types de jointures que vous pouvez rencontrer dans Power BI. 

Si vous n'êtes pas encore prêt à vous y plonger, consultez le chapitre 2 de l'ouvrage intitulé modélisation des données dans Power BI pour une excellente introduction aux jointures dans Power BI. D'autre part, si vous souhaitez explorer plus en profondeur la logique qui sous-tend les jointures, consultez notre cours sur la la jointure de données en SQL.

Que signifie fusionner des tableaux dans Power BI ?

Fusionner des tableaux dans Power BI signifie combiner deux ou plusieurs tableaux en un seul.

L'un des arguments de vente uniques de Power BI est sa capacité à combiner des données provenant de plusieurs sources en une seule plateforme unificatrice. Que vos données proviennent d'un entrepôt, de fichiers Excel, d'applications tierces ou même d'une page web, Power BI peut y accéder et les fusionner.

La beauté de Power BI réside dans la simplicité de ce processus. Vous n'avez pas besoin d'apprendre une syntaxe complexe ou de suivre un cours de programmation pour fusionner vos données. L'expérience sur Power BI est très intuitive et facile à suivre.

Par exemple, vous pouvez disposer d'un tableau contenant les coordonnées du client et d'un autre tableau contenant l'historique de ses achats. En fusionnant ces tableaux, vous pouvez créer une vue unifiée qui présente à la fois les informations sur les clients et leurs achats en un seul endroit.

Dans Power BI, vous pouvez le faire en utilisant la fonctionnalité "Fusionner les requêtes". Il vous permet de joindre des tableaux sur la base de colonnes communes, comme ID client ou ID produit, afin que vous puissiez voir toutes les données liées ensemble.

Conservez notre Aide-mémoire Power BI à portée de main pendant que vous parcourez ce tutoriel et d'autres pour vous référer rapidement à certains concepts essentiels de Power BI.

L'aide-mémoire Power BI

L'aide-mémoire de DataCamp sur Power BI

Pourquoi fusionner des tableaux ?

Avant d'entrer dans les détails, précisons pourquoi il est nécessaire de fusionner des tableaux.

La fusion des tableaux n'est pas strictement nécessaire. En effet, nous pouvons créer des relations entre nos tableaux pour former un modèle de données complet. Grâce à ce modèle de données, nous pouvons facilement référencer les colonnes des tableaux connectés et les ajouter à nos visuels.

Supposons toutefois que votre modèle de données comporte un vaste réseau de tableaux connectés, formant un schéma Snowflake. Cela réduit la vitesse et le temps de rafraîchissement de vos rapports. Quelle est donc la solution dans cet exemple ?

En fusionnant les tableaux les plus éloignés, vous pouvez convertir votre modèle de données en un schéma en étoile, ce qui stimule les performances et améliore l'expérience de l'utilisateur (sans parler de la réduction de vos propres maux de tête).

Le chapitre 4 de notre modélisation des données dans Power BI explore en détail les concepts des schémas en étoile et Snowflake. Vous pouvez également obtenir une introduction rapide en lisant notre tutoriel sur la modélisation des données dans Power BI.

Fusion de tableaux et création de relations : Quand utiliser Which

La création de relations entre les tableaux et la fusion de tableaux sont deux approches valables dans Power BI, mais elles ont des objectifs et des avantages différents.

Utilisez les relations lorsque vous disposez d'un modèle de données bien structuré avec des relations clairement définies entre les tableaux, en particulier pour les grands ensembles de données. Cette approche est idéale pour maintenir un modèle de données propre et organisé.

Fusionnez les tableaux lorsque vous avez besoin d'un ensemble de données simplifié pour une analyse spécifique ou lorsque vous traitez des ensembles de données plus petits dont l'impact sur les performances est minime. La fusion peut également être un bon choix lorsque vous devez procéder à un nettoyage et à une transformation approfondis des données.

Dans la pratique, vous pouvez utiliser les deux techniques en fonction de vos besoins. Par exemple, vous pouvez créer des relations pour votre modèle de données global et fusionner des tableaux spécifiques pour des analyses ou des rapports particuliers.

Premiers pas avec les tableaux de fusion dans Power BI : Un exemple simple

Pour commencer, prenons un exemple simple.

Supposons que vous disposiez d'un tableau desventesquotidiennes indiquant le nombre de ventes par produit et par jour. Cependant, au lieu des noms complets, vous n'avez que l'identifiant du produit s. Cette situation n'est pas très agréable à visualiser et vos interlocuteurs risquent de ne pas savoir quelnuméro d'identification de produit correspond à quel produit.

Pour créer un rapport plus intuitif et plus efficace, nous devons fusionner les éléments suivants Produits dans le tableau Ventes afin d'avoir accès aux noms des produits.

Il s'agit de notre modèle de données actuel contenant deux tableaux (nous ignorons les relations pour les besoins de cet exemple) :

Exemple Power BI de tableaux de fusion : tableau des ventes

Tableau des ventes

Exemple de tableaux de fusion dans Power BI : tableau des produits

Tableau des produits

Pour effectuer la fusion, sélectionnez "Modifier les requêtes" dans l'onglet Accueil du ruban pour ouvrir l'éditeur Power Query. Dans le tableau Ventes, sélectionnez "Fusionner les requêtes" dans la section Transformer du ruban.

Emplacement des requêtes de fusion de Power BI dans le ruban

Emplacement des requêtes de fusion de Power BI dans le ruban

Dans le premier tableau, sélectionnez la colonneID produit. Ajoutez le tableau Produits dans le menu déroulant pour l'inclure en tant que deuxième tableau dans la fusion, et sélectionnez à nouveau la colonne Product ID.

Power BI confirmera le nombre de lignes correspondantes afin que nous puissions rapidement identifier d'éventuels problèmes avec nos données. Ici, nous constatons que les cinq lignes de nos données correspondent. Cliquez sur OK pour effectuer la fusion.

Boîte de dialogue de fusion des tableaux de Power BI

Boîte de dialogue de fusion des tableaux de Power BI

Nous devons maintenant choisir les tableaux du tableau Produits que nous souhaitons ajouter au tableauVentes. Dans cet exemple, nous ne voulons conserver que la colonneProduit .

Sélectionner les colonnes à développer après la fusion des tableaux

Sélectionner les colonnes à développer après la fusion des tableaux

Vous trouverez ci-dessous le résultat de la fusion. La colonne Product est désormais incluse dans le tableauSales.

Après la fusion : La colonne Produit est ajoutée au tableau Ventes.

Après la fusion : La colonne Produit est ajoutée au tableau Ventes.

Types de jointures dans Power BI

Lorsque vous fusionnez des tableaux dans Power BI, vous pouvez utiliser plusieurs types de jointures. Chaque type détermine la manière dont les lignes des tableaux sont combinées en fonction des colonnes correspondantes.

La bonne nouvelle, c'est que vous n'avez pas besoin d'une connaissance approfondie de la conception de bases de données ou du langage SQL pour effectuer ces jointures dans Power BI. L'interface est assez intuitive.

Voici les différents types de joints que vous pouvez utiliser :

Microsoft : Types de jointures

Microsoft : Types de jonctions

Nous nous référons aux deux tableaux suivants pour illustrer chaque jointure ci-dessous.

Exemple de jointures Power BI : Tableau des ventes

Tableau des ventes

Exemple de jointures Power BI : Tableau des produits

Tableau des produits

Jointure interne

Cette jointure ne renvoie que les lignes pour lesquelles il existe une correspondance dans les deux tableaux. Si une ligne d'un tableau n'a pas de ligne correspondante dans l'autre tableau, elle ne sera pas incluse dans le résultat.

Dans notre exemple, le tableau Ventes est réduit à 5 tableaux car l'ID de produit "P020" ne figure pas dans le tableauProduits. En outre, deux tableaux de la table Products ne sont même pas inclus dans la table Sales puisqu'aucune vente n'est enregistrée pour eux (c'est-à-dire les ID de produit 'P010' et 'P001').

Exemple de jointure interne

Exemple de jointure interne

Jointure externe

Lorsque vous fusionnez des tableaux dans Power BI, vous rencontrerez et utiliserez probablement le plus souvent des jointures externes (en particulier la jointure externe gauche).

Examinons les trois types de jointures externes :

Jointure externe gauche : Cette jointure renvoie toutes les lignes du premier tableau (gauche) et les lignes correspondantes du second tableau (droite). S'il n'y a pas de correspondance, le résultat comprendra toujours tous les tableaux du tableau de gauche avec valeursnulles pour les colonnes du tableau de droite.

Dans notre exemple, L'ID du produit 'P020' n'a pas de nom de produit associé car ce produit n'est pas présent dans la base de données des Produits et nous obtenons donc un résultat de type nulle dans le champ Produit dans la colonne Produit.

Exemple de jointure externe gauche

Exemple de jointure externe gauche

Jointure externe droite: C'est le contraire de la jointure externe gauche. Il renvoie tous les tableaux du deuxième tableau (à droite) et les lignes correspondantes du premier tableau (à gauche). S'il n'y a pas de correspondance, le résultat comprendra tous les tableaux du tableau de droite avec valeursnulles pour les colonnes du tableau de gauche.

Dans notre exemple, deux produits (Reliure et Papier) se trouvent dans le tableau Produits mais n'ont pas de ventes associées dans le tableauVentes. Par conséquent, nous avons deux tableaux supplémentaires dans notre tableau Sales qui sont complètement vides pour toutes les colonnes à l'exception de la colonneProduct.

Exemple de jointure externe droite

Exemple de jointure externe droite

Jointure extérieure complète: Cette jointure renvoie tous les tableaux lorsqu'il existe une correspondance dans le tableau de gauche ou de droite. S'il n'y a pas de correspondance, le résultat comprendra des lignes avec valeursnulles pour le côté qui ne correspond pas.

Dans notre exemple, nous voyons toutes les lignes de la base de données Ventes et Produits avec les correspondances là où elles se trouvent et les valeurs nulles partout ailleurs.

Exemple de jointure externe complète

Exemple de jointure externe complète

Anti-jonction

L'anti-joint est utile pour nettoyer ou enquêter sur tout problème suspect. Par exemple, si une jointure externe gauche renvoie un grand nombre de blancs dans les colonnes jointes, cela peut indiquer que des problèmes de qualité des données empêchent Power BI d'identifier des correspondances uniques.

Il existe deux types d'anti-jointures :

Gauche anti-rejoint: Renvoie uniquement les tableaux du tableau de gauche qui n'ont pas de correspondance dans le tableau de droite.

Dans notre exemple, seule la ligne correspondant à l'ID de produit "P020" est affichée, car il s'agit du seul produit du tableauProduits auquel aucun nom de produit n'est associé. Cela nous indique immédiatement que notre tableau Products a besoin d'attention : il manque un produit !

Exemple de jointure anti-gauche

Exemple de jointure anti-gauche

Droit anti-rejoint: Renvoie uniquement les tableaux du tableau de droite qui n'ont pas de correspondance dans le tableau de gauche.

Dans notre exemple, seules deux lignes sont renvoyées car il s'agit des produits pour lesquels nous n'avons pas de ventes associées. 

Exemple de jointure anti-droite

Exemple de jointure anti-droite

Bien qu'il ne s'agisse pas d'un problème urgent à résoudre, il est utile de savoir quels produits sont importés dans notre modèle de données mais ne servent à rien. 

Si vous disposez de grandes quantités de données et que vous cherchez un moyen d'accélérer les performances et les temps d'actualisation de vos rapports, la première chose à vérifier est de savoir si vos tableaux sont encombrés de données inutiles qui ne sont pas utilisées dans votre rapport.

Fusionner sur plusieurs colonnes dans Power BI

La fusion sur plusieurs colonnes est nécessaire lorsque vous ne pouvez pas identifier les correspondances uniques sur lesquelles effectuer la jointure lorsque vous ne spécifiez qu'une seule colonne.

Supposons par exemple que l'on vous ait demandé de créer un rapport Power BI indiquant les ventes par vendeur pour le mois par rapport à leurs objectifs. La difficulté réside dans le fait que chaque vendeur est responsable de plusieurs magasins et a des objectifs différents pour chacun d'entre eux.

Voici les tableaux que nous utiliserons pour cet exemple :

Fusion sur plusieurs tableaux exemple : tableau des ventes

Tableau des ventes

Fusion sur plusieurs colonnes exemple : tableau des cibles

Tableau des tableaux

Le tableau des ventes contient les données relatives à chaque vendeur et aux magasins qui lui sont affectés . Le tableau Targets contient les objectifs de vente pour chaque vendeur et chaque magasin.

Il n'est pas possible d'effectuer une jointure entre ces deux tableaux en utilisant uniquement l'élément Vendeur car Power BI ne serait pas en mesure de trouver des correspondances uniques (créant ainsi une jointure plusieurs-à-plusieurs).

Nous devrons donc joindre ces deux tableaux en utilisant deux colonnes dans chaque tableau : Vendeur et magasin.

Pour ce faire, nous devons sélectionner la colonne Vendeur, puis, tout en maintenant la touche ctrl enfoncée , sélectionner la colonneMagasin pour les deux tableaux. Vous devez sélectionner les colonnes de chaque tableau dans le même ordre. Power BI ajoute une petite annotation 1 et 2 à côté de chaque nom de colonne pour que vous puissiez confirmer l'ordre.

Fusion Power BI sur plusieurs colonnes : dialogue de fusion

Exemple de dialogue de fusion sur plusieurs colonnes

Aujourd'hui, l'équipe de ventes contient une vue précise et complète des ventes de chaque vendeur. ventes et objectifs.

Tableau des ventes fusionné : fusion sur plusieurs colonnes

Tableau des ventes fusionné : fusion sur plusieurs colonnes

Fusion de tableaux à l'aide d'une correspondance floue

La correspondance floue ne fonctionne que sur les colonnes textuelles et est extrêmement utile pour nettoyer les données.

Que signifie "fuzzy matching" ? Il s'agit d'une fonctionnalité des tableaux de fusion qui permet de trouver et de fusionner les lignes qui sont similaires mais pas exactement les mêmes. Par exemple, lorsqu'il y a des fautes de frappe ou des variations mineures dans les noms des clients. Les jointures ordinaires ne fusionnent que les correspondances exactes, mais la correspondance floue nous permet de fusionner les correspondances similaires en fonction du niveau de sensibilité que nous avons défini.

N'oubliez pas de toujours vérifier les résultats des correspondances floues pour vous assurer qu'ils sont exacts. Parfois, vous devrez apporter quelques modifications manuelles dans les cas où la correspondance floue ne fonctionne pas parfaitement.

Essayons avec un exemple simple.

Supposons que vous disposiez d'un tableauSales contenant des transactions de clients dont les noms sont enregistrés de manière incohérente. Vous souhaitez nettoyer ces noms pour vous assurer que chaque client est représenté de manière cohérente dans tous les enregistrements.

Tableau des ventes : exemple de noms de clients en désordre

Tableau des ventes : noms des clients en désordre

Nous pourrons nettoyer ces noms de clients en fusionnant les fichiers Clients (avec les noms de clients corrects) dans le tableau Ventes et en supprimant la colonne désordonnée des noms de clients.

Dans l'éditeur de requête, sélectionnez le tableau Sales et choisissez la colonneCustomer pour la jointure. Cochez l'option "Utiliser la correspondance floue pour effectuer la fusion" et configurez les options de correspondance floue si nécessaire (par exemple, le seuil de similarité).

Fusionnez les tableaux : Correspondance floue

Fusionnez les tableaux : Correspondance floue

Si l'on compare cette jointure avec et sans correspondance floue, on constate que les deux clients dont le nom comporte des fautes de frappe sont inclus.

Sans correspondance floue

Sans correspondance floue

Avec l'appariement flou

Avec l'appariement flou

Développez la colonne du tableau Clients pour inclure la colonne Client propre dans le tableauVentes. Nous pouvons maintenant supprimer en toute sécurité la colonne Client originale et continuer à construire notre rapport en utilisant la colonneClient nettoyée.

Utilisation de la correspondance floue pour nettoyer les données textuelles

Utilisation de la correspondance floue pour nettoyer les données textuelles

Transformations après fusion de tableaux

En reprenant notre premier exemple simple ci-dessus, explorons les transformations de données possibles après la fusion des deux tableaux.

Si vous transformez le tableau Produits après la fusion, ces transformations mettront à jour les résultats fusionnés. Par exemple, si vous nettoyez des données ou ajoutez de nouveaux tableaux dans le tableau Clients, ces modifications seront visibles dans le tableau fusionné lorsque les données seront actualisées. 

Pour cette raison, veillez à ne pas apporter de modifications susceptibles de provoquer des erreurs ou des résultats inexacts pour les tableaux qui utilisent le tableau Produits dans une fusion (comme le tableau Ventes dans notre exemple).

En revanche, vous êtes libre d'appliquer des transformations au tableau Sales dans les étapes qui suivent la fusion, car celles-ci n'affectent pas directement la fusion elle-même. Veillez toutefois à ne pas ajouter d'étapes de transformation supplémentaires avant la fusion, car cela pourrait provoquer une erreur dans la fusion et empêcher le chargement de l'ensemble du tableau.

Consultez notre cours sur les transformations transformations de données dans Power BI pour vous familiariser avec l'éditeur Power Query et tout ce que vous pouvez faire pour préparer vos données à la création de rapports.

Conclusion

La gestion et la fusion de tableaux dans Power BI peuvent s'avérer difficiles, notamment parce qu'il existe de nombreux types de jointures parmi lesquels choisir. 

Toutefois, la fusion de tableaux est une fonctionnalité trop utile pour être négligée. 

Grâce à ce tutoriel, vous pouvez désormais utiliser en toute confiance les tableaux de fusion de Power BI pour nettoyer vos données et construire des rapports capables d'intégrer des données provenant de différentes sources.

Si vous êtes prêt à passer à l'étape suivante et à démarrer votre carrière avec Power BI, notre formation complète de Analyste de données dans Power BI couvre tout ce que vous devez savoir pour décrocher votre premier emploi en tant que développeur Power BI. Il vous prépare également à obtenir une certification.


Joleen Bothma's photo
Author
Joleen Bothma
LinkedIn
Sujets

Les meilleurs cours sur Power BI

cursus

Power BI Fundamentals

17hrs hr
Gain the essential skills you need to use Power BI. Create your own visualizations and dashboards from scratch. No prior experience required.
Afficher les détailsRight Arrow
Commencer le cours
Voir plusRight Arrow
Apparenté

blog

Les 32 meilleures questions d'entretien sur AWS et leurs réponses pour 2024

Un guide complet pour explorer les questions d'entretien AWS de base, intermédiaires et avancées, ainsi que des questions basées sur des situations réelles. Il couvre tous les domaines, garantissant ainsi une stratégie de préparation bien équilibrée.
Zoumana Keita 's photo

Zoumana Keita

30 min

blog

2022-2023 Rapport annuel DataCamp Classrooms

À l'aube de la nouvelle année scolaire, DataCamp Classrooms est plus motivé que jamais pour démocratiser l'apprentissage des données, avec plus de 7 650 nouveaux Classrooms ajoutés au cours des 12 derniers mois.
Nathaniel Taylor-Leach's photo

Nathaniel Taylor-Leach

8 min

blog

Q2 2023 DataCamp Donates Digest

DataCamp Donates a offert plus de 20k bourses d'études à nos partenaires à but non lucratif au deuxième trimestre 2023. Découvrez comment des apprenants défavorisés et assidus ont transformé ces opportunités en réussites professionnelles qui ont changé leur vie.
Nathaniel Taylor-Leach's photo

Nathaniel Taylor-Leach

blog

Les 20 meilleures questions d'entretien pour les flocons de neige, à tous les niveaux

Vous êtes actuellement à la recherche d'un emploi qui utilise Snowflake ? Préparez-vous à répondre à ces 20 questions d'entretien sur le flocon de neige pour décrocher le poste !
Nisha Arya Ahmed's photo

Nisha Arya Ahmed

20 min

blog

Nous avons fait don de bourses DataCamp Premium à un million de personnes, et ce n'est pas fini.

Réparties entre nos deux programmes d'impact social, DataCamp Classrooms et #DCDonates, les bourses offrent un accès illimité à tout ce que DataCamp Premium a à offrir.
Nathaniel Taylor-Leach's photo

Nathaniel Taylor-Leach

blog

Célébration de Saghar Hazinyar : Une boursière de DataCamp Donates et une diplômée de Code to Inspire

Découvrez le parcours inspirant de Saghar Hazinyar, diplômée de Code to Inspire, qui a surmonté les défis en Afghanistan et s'est épanouie grâce à une bourse de DataCamp Donates.
Fereshteh Forough's photo

Fereshteh Forough

4 min

Voir plusVoir plus