Accéder au contenu principal

Comment nettoyer les données dans Excel : Guide du débutant

Apprenez les techniques essentielles de nettoyage des données dans Excel, notamment la suppression des doublons, le traitement des valeurs manquantes et le maintien d'un formatage cohérent.
Actualisé 16 janv. 2025  · 15 min de lecture

Dans ce tutoriel, vous apprendrez à nettoyer vos données dans Excel et à les préparer pour l'analyse. Nous aborderons des techniques essentielles telles que la suppression des doublons, la gestion des valeurs manquantes et la normalisation du formatage. À la fin de la formation, vous aurez acquis des compétences pratiques qui vous permettront de vous assurer que vos données sont exactes et prêtes pour une analyse plus approfondie.

Pour une exploration plus approfondie, envisagez de suivre le cours complémentaire complet sur la préparation des données dans Excel, qui se penche sur les techniques avancées et les meilleures pratiques pour optimiser votre flux de travail en matière de nettoyage des données.

Quelles sont les composantes des données propres ?

La garantie d'une qualité élevée des données implique plusieurs éléments clés, notamment l'exactitude, l'exhaustivité, la cohérence, l'uniformité et la validité. Ces éléments sont essentiels pour une analyse et une prise de décision fiables. Jetons un coup d'œil à chacun d'entre eux.

  • Précision : L'exactitude signifie que vos données affichent correctement les valeurs réelles qu'elles représentent. Il garantit que les informations présentées sont précises et exemptes d'erreurs, et qu'elles reflètent l'état réel des données. Par exemple, si vos données sont exactes, elles auront les caractéristiques suivantes : Des informations précises et exemptes d'erreurs, Valeurs numériques correctes, Données textuelles sans fautes de frappeet des dates précises.
  • Complétude : Les données complètes contiennent toutes les informations nécessaires à l'analyse. Si vos données sont incomplètes et qu'il manque des détails clés, cela peut fausser les résultats. Veillez à combler les lacunes ou à tenir compte des valeurs manquantes dans votre analyse. Pour traiter les données manquantes, assurez-vous de saisir des valeurs basées sur d'autres observations, de remplacer les valeurs manquantes par des caractères génériques et de supprimer les enregistrements incomplets.
  • Cohérence : La cohérence signifie que les données restent homogènes entre les différents ensembles de données et les différentes périodes. Les données propres contiennent les mêmes formats et les mêmes unités de mesure.
  • Uniformité : L'uniformité ou la normalisation signifie que toutes les données présenteront un format et une structure cohérents - elles devraient être d'un seul type ou d'une seule catégorie. Il s'agit notamment d'utiliser les mêmes unités de mesure ou de formater les dates et de les classer par catégories.
  • Validité : La validité signifie que les valeurs des données se situent dans la fourchette acceptable prédéterminée et qu'elles sont conformes aux modèles attendus. Par exemple, si un âge valide doit être compris entre 0 et 120 ans, des règles de validation et des contrôles seront appliqués pour s'assurer que les données répondent à ce critère. Cela permet d'éviter que les valeurs aberrantes et les entrées erronées ne faussent les résultats.

Comment nettoyer les données dans Excel

Nettoyer des données dans Excel signifie affiner des données brutes. Contrairement à la validation des données, qui est une fonction spécifique de la barre d'outils d'Excel, le nettoyage des données est un terme plus général qui implique une gamme plus large d'outils et de techniques. Dans la section suivante, nous aborderons chacune des idées suivantes :

  • Nettoyage de base : Le nettoyage de base consiste à traiter les problèmes courants tels que les espaces supplémentaires, les cellules vides et les fautes d'orthographe afin de garantir un ensemble de données propre et cohérent.
  • Traitement des erreurs et validation : Le traitement des erreurs et la validation se concentrent sur l'identification et la correction des erreurs et sur le maintien de l'intégrité de vos données en supprimant les doublons.
  • Opérations sur le texte : Les opérations sur le texte consistent à manipuler et à formater les données textuelles pour s'assurer qu'elles répondent à vos besoins, notamment par la concaténation et la modification des majuscules et des minuscules.
  • Transformation des données : Les techniques de transformation des données sont utilisées pour réorganiser et remodeler vos données en vue d'une meilleure analyse, notamment en analysant le texte et en utilisant des outils tels que Flash Fill.
  • Correction des chiffres et des dates : Les corrections numériques et de dates consistent à corriger et à normaliser les données numériques et les dates afin de s'assurer qu'elles sont exactes et formatées de manière cohérente.
  • Gestion avancée des données : La gestion avancée des données comprend le rapprochement et la combinaison des ensembles de données afin de créer un ensemble de données complet et cohérent pour l'analyse.

Nettoyage de données de base dans Excel

Examinons le nettoyage de base, qui consiste à résoudre des problèmes courants tels que l'élimination des espaces superflus.

Débarrassez-vous des espaces supplémentaires

Les espaces blancs qui suivent peuvent être gênants ou problématiques car ils peuvent entraîner des incohérences dans l'analyse des données et des problèmes de formatage.

Il existe deux méthodes principales pour se débarrasser des espaces supplémentaires dans Excel. Passons en revue les deux.

Débarrassez-vous des espaces supplémentaires à l'aide de la fonction Rechercher et remplacer

Voici les étapes à suivre pour se débarrasser des espaces supplémentaires.

  • Sélectionnez la plage de cellules dans laquelle vous souhaitez supprimer les espaces supplémentaires.

  • Utilisez le raccourci Ctrl + H pour ouvrir la boîte de dialogue Rechercher et remplacer.

  • Dans le champ Rechercher quoi, appuyez deux fois sur la barre d'espacement pour saisir deux espaces.

  • Dans le champ Remplacer par, appuyez une fois sur la barre d'espacement pour saisir un seul espace.

  • Cliquez sur Remplacer tout.

  • Répétez l'opération jusqu'à ce qu'il n'y ait plus d'espaces doubles.

Recherchez et remplacez la boîte de dialogue. Source : Image par l'auteur

Débarrassez-vous des espaces supplémentaires à l'aide de la fonction TRIM

  • Créez une nouvelle colonne pour les données nettoyées.

  • Saisissez la formule =TRIM(cell_with_extra_spaces) dans la première cellule de la nouvelle colonne.

  • Double-cliquez sur le coin inférieur droit de la cellule pour appliquer la formule au reste des lignes.

  • Copiez les données nettoyées et collez-les en tant que valeurs pour supprimer les formules.

Sélectionnez et traitez toutes les cellules vides

Les cellules vides peuvent causer des problèmes en interrompant les formules, en entraînant des erreurs de calcul et en produisant des résultats d'analyse inexacts. Voici comment résoudre ce problème.

  • Mettez en surbrillance la plage de cellules dans laquelle vous souhaitez rechercher et traiter les cellules vides.

  • Appuyez sur Ctrl + G pour ouvrir la boîte de dialogue Aller à.

  • Cliquez sur le bouton "Spécial...". La boîte de dialogue Aller à spécial s 'ouvre.

  • Sélectionnez l'option Blancs et cliquez sur OK. Vous verrez que toutes les cellules vides de la plage choisie sont sélectionnées.

  • Vous pouvez maintenant saisir une valeur ou une formule. Appuyez sur Ctrl + Entrée.

Sélectionnez et traitez les cellules vides. Source : Image par l'auteur

Vérification de l'orthographe

Les mots mal orthographiés peuvent donner une impression de manque de professionnalisme aux données et les rendre difficiles à comprendre, c'est pourquoi il est important de les corriger.

  • Vérifiez l'ensemble de la feuille de calcul ou une plage spécifique.

  • Accédez à l'onglet Révision sur le ruban.

  • Cliquez sur le bouton Orthographe dans le groupe Vérification.

  • La boîte de dialogue Orthographe s'ouvre, affichant le premier mot mal orthographié détecté et des suggestions de correction.

  • Révisez et corrigez les mots mal orthographiés si nécessaire.

Vérification de l'orthographe. Source : Image par l'auteur

Gestion des erreurs et validation dans Excel

Examinons la gestion des erreurs, qui consiste à résoudre des problèmes courants tels que la mise en évidence des erreurs ou la suppression des doublons.

Mettre en évidence les erreurs

Les erreurs dans vos données peuvent conduire à des résultats erronés et à une mauvaise prise de décision, il est donc essentiel de les identifier et de les corriger. Voyons comment résoudre ce problème.

  • Sélectionnez la plage de cellules dans laquelle vous souhaitez rechercher des erreurs.

  • Allez dans l'onglet Accueil du ruban.

  • Dans le groupe Styles, cliquez sur Mise en forme conditionnelle.

  • Sélectionnez Nouvelle règle dans le menu déroulant.

  • Sélectionnez Utiliser une formule pour déterminer les cellules à formater.

  • Saisissez la formule =ISERROR(cell) dans le champ Format values where this formula is true.

  • Cliquez sur le bouton Format... pour choisir les options de formatage souhaitées.

  • Cliquez sur OK après avoir sélectionné vos options de formatage.

  • Cliquez à nouveau sur OK dans la boîte de dialogue Nouvelle règle de formatage pour appliquer la règle.

Utiliser la mise en forme conditionnelleUtiliser lamise en forme conditionnelle. Source : Image par l'auteur

Supprimer les doublons

Les entrées en double peuvent fausser l'analyse et les perspectives, c'est pourquoi leur suppression garantit l'exactitude des données.

  • Sélectionnez la feuille de calcul ou la plage de cellules dont vous souhaitez supprimer les doublons.

  • Allez dans l'onglet Données du ruban.

  • Cliquez sur Supprimer les doublons dans le groupe Outils de données.

  • Dans la boîte de dialogue Supprimer les doublons, indiquez la colonne à vérifier pour les doublons.

  • Cliquez sur OK. Excel affiche un message indiquant le nombre de valeurs dupliquées supprimées.

Supprimer les lignes en double

Les lignes en double peuvent encombrer vos données et affecter la fiabilité de votre analyse. Voici comment gérer cette situation.

  • Sélectionnez la plage dans laquelle vous souhaitez supprimer les lignes en double.

  • Allez dans l'onglet Données du ruban et cliquez sur Avancé dans le groupe Trier et filtrer.

  • Dans la boîte de dialogue Filtre avancé, sélectionnez Copier vers un autre emplacement.

  • Réglez la plage de la liste sur la plage que vous avez sélectionnée.

  • Définissez le champ Copier dans la cellule dans laquelle vous souhaitez que les lignes uniques soient copiées.

  • Cochez la case Enregistrements uniques uniquement, puis cliquez sur OK.

Opérations sur le texte dans Excel

Examinons les opérations sur le texte, comme la concaténation de chaînes de caractères.

Concaténer

La combinaison de plusieurs chaînes de texte dans une cellule permet de créer des données plus significatives et mieux organisées en fusionnant des informations provenant de différentes sources dans un format unique et cohérent.

  • Sélectionnez la cellule dans laquelle vous souhaitez que le résultat concaténé apparaisse.
  • Type =CONCATENATE().
  • Sélectionnez les cellules que vous souhaitez concaténer, séparées par des virgules ou l'opérateur &.
  • Appuyez sur Entrée pour voir le résultat.

Concaténation de cellules dans ExcelConcaténation decellules. Source : Image par l'auteur

Changer la casse d'un texte

L'uniformisation du texte permet d'améliorer la lisibilité et de maintenir la cohérence de vos données. Voyons comment régler ce problème.

  • Créez une nouvelle colonne pour le texte converti.

  • Saisissez la formule dans une cellule : =UPPER() ou =LOWER() ou =PROPER()

  • Appuyez sur Entrée pour appliquer la formule.
  • Faites glisser la poignée de remplissage pour appliquer la formule à d'autres cellules si nécessaire.

Modifier la casse d'un texte dans ExcelModifierla casse d'un texte. Source : Image par l'auteur

Suppression des caractères non imprimables d'un texte

Les caractères non imprimables, tels que les tabulations, les retours à la ligne et les caractères spéciaux, peuvent causer des problèmes en perturbant le traitement des données, ce qui rend difficile l'analyse ou la visualisation correcte des données.

  • Identifiez les caractères non imprimables que vous devez supprimer.

  • Sélectionnez la cellule contenant le texte avec des caractères non imprimables.

  • Dans une nouvelle cellule, utilisez la fonction suivante : =CLEAN(text).

  • Pour supprimer les espaces supplémentaires et les caractères non imprimables, utilisez : =TRIM(CLEAN(text)).

  • Copiez et collez le texte nettoyé pour remplacer l'original.

Utiliser la fonction de nettoyage dans ExcelUtiliserla fonction de nettoyage dans Excel. Source : Image par l'auteur

Apprendre les bases d'Excel

Acquérir des compétences pour utiliser Excel de manière efficace - aucune expérience n'est requise.
Commencez à apprendre gratuitement

Transformation des données dans Excel

Les techniques de transformation des données sont utilisées pour réorganiser et remodeler vos données en vue d'une meilleure analyse, notamment en analysant le texte et en utilisant des outils tels que Flash Fill.

Analyse des données d'un texte à une colonne

La séparation des données textuelles en colonnes individuelles facilite l'analyse de composants spécifiques et garantit que chaque élément d'information est catégorisé de manière distincte. C'est le contraire de la concaténation et c'est utile pour décomposer des données complexes en parties gérables. Voici comment procéder.

  • Sélectionnez les données que vous souhaitez diviser.

  • Allez dans l'onglet Données et cliquez sur Texte en colonnes.

  • Choisissez Délimité ou Largeur fixe et cliquez sur Suivant.

  • Pour Délimité, cochez les délimiteurs utilisés par vos données et cliquez sur Suivant.

  • Pour l'option Largeur fixe, définissez les ruptures de colonnes dans la fenêtre d'aperçu des données et cliquez sur Suivant.

  • Choisissez le format des données pour chaque colonne.

  • Cliquez sur Terminer.

Utilisation de textes en colonnes pour l'analyse des donnéesUtilisation de textes en colonnes pour l'analyse des données. Source : Image par l'auteur

Remplissage du flash

Flash Fill remplit automatiquement les valeurs en fonction des modèles qu'il détecte dans vos données. Voici comment vous pouvez utiliser Flash Fill dans Excel :

  • Saisissez des données suivant un modèle dans une cellule à côté de vos données existantes.

  • Fournissez un autre exemple dans la cellule suivante pour aider Excel à détecter le modèle.

  • Sélectionnez la cellule contenant l'exemple.

  • Allez dans l'onglet Données du ruban.

  • Cliquez sur Remplissage flash dans le groupe Outils de données.

  • Excel remplira automatiquement les cellules restantes sur la base du modèle détecté.

Fusionner et scinder des colonnes

La fusion et la division de colonnes permettent d'organiser les données de la manière la plus adaptée à vos besoins d'analyse. Procédez comme suit pour fusionner des cellules :

  • Allez dans l'onglet Accueil et cliquez sur le menu déroulant Fusionner et centrer dans le groupe Alignement .
  • Sélectionnez l'option de fusion de votre choix.

Procédez comme suit pour diviser les colonnes :

  • Allez dans l'onglet Données et cliquez sur Texte en colonnes dans le groupe Outils de données.
  • Choisissez une largeur délimitée ou fixe en fonction des besoins de vos données.
  • Sélectionnez la destination des données fractionnées et cliquez sur Terminer.

Transformer et réorganiser les colonnes et les lignes

La réorganisation des données peut aider à les présenter dans un format plus logique et plus accessible. Pour transformer les lignes en lignes et les colonnes en colonnes :

  • Mettez en surbrillance les données que vous souhaitez transformer (y compris les en-têtes si nécessaire).

  • Cliquez avec le bouton droit de la souris sur la sélection et choisissez Copier ouappuyez sur Ctrl+C.

  • Sélectionnez la cellule où commencent les données transformées.

  • Cliquez avec le bouton droit de la souris sur la cellule de destination, choisissez Coller spécial, puis sélectionnez Transposer.

  • Vous pouvez également utiliser Ctrl+Alt+V pour ouvrir la boîte de dialogue Coller spécial, puis cocher l'option Transposer et cliquer sur OK.

Pour réorganiser les colonnes/lignes :

  • Cliquez sur l'en-tête de la colonne pour sélectionner l'ensemble de la colonne à déplacer.

  • Cliquez avec le bouton droit de la souris et choisissez Cutoren appuyant sur Ctrl+X.

  • Sélectionnez la colonne dans laquelle vous souhaitez déplacer la colonne coupée, cliquez avec le bouton droit de la souris sur l'en-tête de colonne et sélectionnez Insérer des cellules coupées.

  • De même, pour les lignes, sélectionnez et coupez la ligne que vous souhaitez transférer vers une autre ligne et collez-la à cet endroit.

Correction des nombres et des dates dans Excel

Les corrections numériques et de dates consistent à corriger et à normaliser les données numériques et les dates afin de s'assurer qu'elles sont exactes et formatées de manière cohérente.

Fixation des chiffres et des signes numériques

Les formats de chiffres incorrects peuvent poser des problèmes en entraînant des interprétations erronées et des erreurs de calcul, ainsi que des problèmes de tri et de comparaison des données.

  • Sélectionnez les cellules contenant les nombres à corriger.
  • Allez dans l'onglet Accueil, cliquez sur le menu déroulant Nombre dans le groupe Nombre et sélectionnez le format de nombre approprié (par exemple, Général, Nombre, Devise).

Fixer des dates et des heures

Des dates correctement formatées sont essentielles pour une analyse et un rapport précis basés sur le temps.

  • Mettez en surbrillance les cellules contenant les dates.

  • Allez dans l'onglet Accueil.

  • Cliquez sur le menu déroulant Format des nombres et sélectionnez Date courte ou Date longue.

Faites progresser votre carrière avec Excel

Acquérir les compétences nécessaires pour optimiser Excel - aucune expérience n'est requise.

Commencez aujourd'hui gratuitement

Gestion avancée des données dans Excel

La gestion avancée des données comprend le rapprochement et la combinaison des ensembles de données afin de créer un ensemble de données complet et cohérent pour l'analyse.

Rapprochement des données des tableaux par jointure ou correspondance

L'association ou la mise en correspondance de données provenant de différents tableaux garantit une analyse complète et cohérente.

Utilisation de VLOOKUP pour faire correspondre des données :

  • Assurez-vous que les deux tableaux sont accessibles sur la même feuille de calcul.

  • Sélectionnez la cellule dans laquelle vous souhaitez afficher les données comparées.

  • Utilisez la fonction suivante : =VLOOKUP(lookup_value, table_array, col_index_num, FALSE)

  • Faites glisser la poignée de remplissage pour copier la formule dans d'autres cellules si nécessaire.

Utiliser INDEX et MATCH pour plus de flexibilité

  • Sélectionnez la cellule dans laquelle vous souhaitez afficher les données comparées.

  • Utilisez la combinaison de ces fonctions : =INDEX(array, MATCH(lookup_value, lookup_array, 0))

  • Faites glisser la poignée de remplissage pour copier la formule dans d'autres cellules si nécessaire.

Réflexions finales

Il existe de nombreuses fonctions de nettoyage des données dans Excel qui vous permettent de nettoyer et de valider les données pour qu'elles répondent aux normes établies. Ils peuvent vous aider à réduire les erreurs et à améliorer la qualité de vos ensembles de données. Pour aller plus loin dans la maîtrise des fonctionnalités d'Excel, pensez à vous inscrire à notre cours d' introduction à Excel.

En outre, qu'il s'agisse d'épurer les données pour supprimer les champs en double ou de normaliser les formats des entrées de données, Excel dispose de tous les outils nécessaires pour faciliter ce processus. Si vous souhaitez améliorer vos compétences en matière de préparation des données, notre cours Préparation des données dans Excel offre une couverture complète de ce sujet.

Pour améliorer encore vos compétences analytiques, notre cours " Analyse de données dans Excel" pourrait vous être particulièrement utile. Ce cours se penche sur les subtilités de l'analyse des données après le nettoyage. En outre, si vous êtes intéressé par la manière dont les données propres soutiennent les prévisions financières, notre cours sur la modélisation financière dans Excel pourrait vous être d'un grand intérêt.

Si vous souhaitez développer vos compétences en matière de nettoyage de données, pensez à Power Query, qui est un outil flexible et efficace intégré à Excel et Power BI et qui vous permet d'importer et de transformer des données de manière transparente. Pensez également à explorer le nettoyage de données en Python ou le nettoyage de données en R. Ces cours proposent des techniques robustes et les meilleures pratiques pour le nettoyage des données en utilisant les langages de programmation les plus courants.


Laiba Siddiqui's photo
Author
Laiba Siddiqui
LinkedIn
Twitter

Je suis un stratège du contenu qui aime simplifier les sujets complexes. J'ai aidé des entreprises comme Splunk, Hackernoon et Tiiny Host à créer un contenu attrayant et informatif pour leur public.

Questions fréquemment posées

Quelles sont les cinq étapes du processus de nettoyage des données ?

Les cinq étapes sont la suppression des doublons, le traitement des données manquantes, la correction des erreurs structurelles, le filtrage des valeurs aberrantes et la validation des données.

Quelle est la différence entre le nettoyage et la transformation des données ?

Le nettoyage des données consiste à identifier et à corriger les erreurs et les inexactitudes au sein de l'ensemble de données afin d'en garantir la fiabilité. Dans la transformation des données, vous convertissez les données d'un format ou d'une structure à un autre afin de les rendre aptes à l'analyse. Ainsi, le nettoyage des données garantit l'exactitude des ensembles de données, tandis que la transformation convertit les données nettoyées dans le format nécessaire à l'analyse ou à l'établissement de rapports.

Sujets

Apprenez Excel avec DataCamp

cours

Introduction to Excel

4 hr
97.7K
Master the Excel basics and learn to use this spreadsheet tool to conduct impactful analysis.
Afficher les détailsRight Arrow
Commencer le cours
Voir plusRight Arrow
Apparenté

blog

Les 20 meilleures questions d'entretien pour les flocons de neige, à tous les niveaux

Vous êtes actuellement à la recherche d'un emploi qui utilise Snowflake ? Préparez-vous à répondre à ces 20 questions d'entretien sur le flocon de neige pour décrocher le poste !
Nisha Arya Ahmed's photo

Nisha Arya Ahmed

20 min

blog

2022-2023 Rapport annuel DataCamp Classrooms

À l'aube de la nouvelle année scolaire, DataCamp Classrooms est plus motivé que jamais pour démocratiser l'apprentissage des données, avec plus de 7 650 nouveaux Classrooms ajoutés au cours des 12 derniers mois.
Nathaniel Taylor-Leach's photo

Nathaniel Taylor-Leach

8 min

blog

Les 32 meilleures questions d'entretien sur AWS et leurs réponses pour 2024

Un guide complet pour explorer les questions d'entretien AWS de base, intermédiaires et avancées, ainsi que des questions basées sur des situations réelles. Il couvre tous les domaines, garantissant ainsi une stratégie de préparation bien équilibrée.
Zoumana Keita 's photo

Zoumana Keita

30 min

blog

Q2 2023 DataCamp Donates Digest

DataCamp Donates a offert plus de 20k bourses d'études à nos partenaires à but non lucratif au deuxième trimestre 2023. Découvrez comment des apprenants défavorisés et assidus ont transformé ces opportunités en réussites professionnelles qui ont changé leur vie.
Nathaniel Taylor-Leach's photo

Nathaniel Taylor-Leach

blog

Nous avons fait don de bourses DataCamp Premium à un million de personnes, et ce n'est pas fini.

Réparties entre nos deux programmes d'impact social, DataCamp Classrooms et #DCDonates, les bourses offrent un accès illimité à tout ce que DataCamp Premium a à offrir.
Nathaniel Taylor-Leach's photo

Nathaniel Taylor-Leach

blog

Célébration de Saghar Hazinyar : Une boursière de DataCamp Donates et une diplômée de Code to Inspire

Découvrez le parcours inspirant de Saghar Hazinyar, diplômée de Code to Inspire, qui a surmonté les défis en Afghanistan et s'est épanouie grâce à une bourse de DataCamp Donates.
Fereshteh Forough's photo

Fereshteh Forough

4 min

Voir plusVoir plus