Lernpfad
Ungenaue Daten können selbst die beste Analyse zunichte machen, und einer der Hauptgründe für ungenaue Daten sind doppelte Einträge in der Kalkulationstabelle. Ein einziges Duplikat kann deine Ergebnisse verfälschen und zu völlig falschen Schlussfolgerungen führen. Um all das zu vermeiden, musst du wissen, wie du Duplikate entfernen kannst.
In diesem Artikel stelle ich dir die fünf besten Methoden vor, um doppelte Daten in Microsoft Excel zu finden und zu entfernen. Wenn du Duplikate markieren möchtest, ohne sie zu entfernen, lies mein verwandtes Tutorial, Wie man Duplikate in Excel markiert. Wenn du dich mit den Excel-Funktionen und -Merkmalen vertraut machen willst, bevor du weitermachst, besuche unseren Lernpfad Excel-Grundlagen.
Wie man Duplikate in Excel entfernt
Hier sind die fünf beliebtesten Methoden zum Entfernen doppelter Daten aus Tabellen in Excel.
Bringe deine Karriere mit Excel voran
Erwerbe die Fähigkeiten, um Excel optimal zu nutzen - keine Erfahrung erforderlich.
Methode 1: Duplikate mit bedingter Formatierung entfernen
Du kannst die Funktion"Bedingte Formatierung" verwenden , um doppelte oder eindeutige Werte zu markieren und zu entscheiden, ob sie entfernt werden sollen. Um dies zu tun:
- Wähle den Bereich von Zellen aus, den du prüfen willst. Gehe dann zu Home > Bedingte Formatierung > Zellen markieren Regeln > Werte duplizieren.
Wähle die Option "Werte duplizieren". Bild vom Autor.
- Es erscheint ein Dialogfeld. Wähle in der Dropdown-Liste aus, wie du die Duplikate hervorheben möchtest. Hier habe ich Gelbe Füllung mit dunkelgelbem Text gewählt.
Wende das Format an. Bild vom Autor.
- Klicke auf OK und die doppelten Werte werden hervorgehoben.
Doppelte Werte werden hervorgehoben. Bild vom Autor.
Die Funktion der bedingten Formatierung ist jedoch eingeschränkt - sie kann keine doppelten Werte im Wertebereich eines PivotTable-Berichts hervorheben. In diesem Fall musst du eine andere Methode anwenden.
Methode 2: Verwende die Funktion Duplikate entfernen
Eine weitere schnelle Möglichkeit, Duplikate zu entfernen, ist die FunktionDuplikate entfernen , ein integriertes Excel-Tool, das deine Daten bereinigt, indem es Duplikate dauerhaft entfernt. Um diese Methode anzuwenden:
- Wähle den Zellbereich aus oder klicke auf eine Zelle, und Excel erkennt den Zellbereich automatisch.
Identifizieren des Bereichs der Zellen. Bild vom Autor.
- Als Nächstes gehst du auf die Registerkarte Daten > Daten-Tools und wähle Duplikate entfernen.
Funktion Duplikate entfernen. Bild vom Autor.
- Es wird ein Dialogfeld angezeigt. Hier wähle ich die Spalten aus, die auf Duplikate geprüft werden sollen. Wenn deine Daten Spaltenüberschriften enthalten, markiere das Feld Meine Daten haben Überschriften und klicke auf OK.
Dialogfeld für die Funktion Duplikate entfernen. Bild vom Autor.
- Excel zeigt in einer Meldung an, wie viele Duplikate entfernt wurden und wie viele eindeutige Einträge noch übrig sind.
Nachrichtenfeld. Bild vom Autor.
- Jetzt kannst du sehen, dass alle doppelten Zeilen entfernt wurden.
Alle doppelten Zeilen wurden entfernt. Bild vom Autor.
Methode 3: Doppelte Werte mit der Option Erweiterter Filter entfernen
Du kannst auch die FunktionErweiterter Filter in Excel verwenden , um eindeutige Werte zu extrahieren, indem du Duplikate herausfilterst und die Originaldaten beibehältst, während eindeutige Einträge angezeigt werden. Hier erfährst du, wie du sie nutzen kannst:
- Wähle einen Bereich von Zellen oder eine einzelne Zelle aus und derErweiterte Filter wird den Bereich automatisch identifizieren. Gehe dann auf dieRegisterkarte Daten > Sortieren & Filtern und klicke auf Erweitert.
Option "Erweiterte Funktion". Bild vom Autor.
- Es wird ein Dialogfeld angezeigt. Um eindeutige Werte an einen anderen Ort zu kopieren, wähle An einen anderen Ort kopieren. Im Feld Kopie an gibst du an, wo die eindeutigen Werte angezeigt werden sollen. Aktiviere dann das Feld Nur eindeutige Datensätze und klicke auf OK.
Dialogfeld für den erweiterten Filter. Bild vom Autor.
- Jetzt werden alle eindeutigen Werte in unseren angegebenen Bereich kopiert.
Filtere die eindeutigen Werte mit dem erweiterten Filter. Bild vom Autor.
Methode 4: Duplikate mit Formeln entfernen
Nachdem du nun die 3 eingebauten Funktionen zum Entfernen von Duplikaten kennst, wollen wir nun einige benutzerdefinierte Funktionen verstehen, die du erstellen kannst, um das gleiche Ergebnis zu erzielen. Ich habe zum Beispiel einen Datensatz mit denSpalten Name, Fach und Note .
Datensatz von Schülern. Bild vom Autor.
So erstellst du eine Formel zum Herausfiltern von doppelten Werten:
Zuerst fasse ich alle Spalten (A, B, C) in einer Zelle zusammen. Dafür gibt es zwei Methoden: die CONCATENATE()
Funktion oder den &
Operator. Wähle, was immer du willst, und die Ergebnisse werden die gleichen sein. Um den &
Operator zu verwenden, gibst du die folgende Formel ein:
=A2&B2&C2
Um die Funktion CONCATENATE()
zu verwenden, gibst du die folgende Formel ein:
=CONCATENATE(A2,B2,C2)
Verbinde die Spalten. Bild vom Autor.
Berechne in der nächsten Spalte mit COUNTIF()
, wie oft jeder Wert in Spalte D vorkommt:
=COUNTIF(D2:D18,D2)
Hier zählen 1 bedeutet, dass der Wert eindeutig ist, und Anzahl 2 oder mehr bedeutet, dass es sich um ein Duplikat handelt.
Wende COUNTIF() an, um die Vorkommnisse zu zählen. Bild vom Autor.
Als Nächstes gehst du zu Daten Registerkarte > Sortieren & Filtern > wähle Filter um einen Filter auf die Daten anzuwenden Anzahl Spalte anzuwenden.
Filter anwenden. Bild vom Autor.
Öffne dann das Dropdown-Menü und wähle 1 um eindeutige Werte zu erhalten und Duplikate zu eliminieren, und drücke OK.
Behalte die eindeutigen Werte. Bild vom Autor.
Jetzt kannst du sehen, dass alle doppelten Werte entfernt worden sind. Diese Methode ist komplexer, wird aber dynamisch aktualisiert, wenn sich deine Daten ändern, und eignet sich daher perfekt für alle, die eine kontinuierliche Dublettenverwaltung wünschen.
Doppelte Werte wurden mit der Filterfunktion entfernt. Bild vom Autor.
Methode 5: Duplikate mit Power Query entfernen
Du kannst Power Query auch verwenden, um deine Daten zu bereinigen und Duplikate zu entfernen. Und so geht's:
Wähle eine Zelle oder einen Bereich von Zellen aus. Gehe auf auf die Registerkarte Daten > Daten holen & transformieren und klicke auf Aus Tabelle/Bereich. Es wird ein Dialogfeld zum Erstellen einer Power Query Tabelle angezeigt und der Wertebereich wird automatisch ausgewählt. Klicke dann auf OK.
Erstellen einer Tabelle. Bild vom Autor.
Jetzt wird das Fenster des Power Query Editors angezeigt. Wähle dort die Option Duplikate entfernen, um bestimmte Spalten oder die gesamte Tabelle auszuwählen. Für die gesamte Tabelle klickst du auf die Schaltfläche in der linken oberen Ecke. Für eine bestimmte Spalte klickst du mit der rechten Maustaste auf die jeweilige Überschrift oder drückst die STRG-Taste, um mehr als eine Spalte auszuwählen. Wenn du fertig bist, klicke auf die Option Schließen & Laden in der oberen linken Ecke, um die bereinigten Daten wieder in Excel zu laden.
Entfernen von doppelten Daten. Bild vom Autor.
Du kannst sehen, dass der geänderte Datensatz wieder in Excel erscheint. Um dies besser zu verstehen, kannst du eine andere Spalte auswählen, z. B. Betreff, aus diesem Beispiel, und die Schritte zur Übung wiederholen. Auf diese Weise werden nur die Zeilen entfernt, in denen der Schülername doppelt vorkommt.
Die Daten werden in eine Excel-Tabelle geladen. Bild vom Autor.
Diese Methode ist ideal, wenn du mit großen Datensätzen arbeitest oder das Entfernen von Duplikaten für zukünftige Datenaktualisierungen automatisieren musst.
Methoden zum Entfernen von Duplikaten in Excel: Welches ist das Beste?
Wir haben uns fünf verschiedene Methoden angesehen, um Duplikate in Excel zu entfernen. Jetzt möchte ich dir helfen, die beste Lösung zu finden, aber bevor ich das tue, lass uns zuerst kurz über die beiden Arten von doppelten Daten sprechen.
Verschiedene Arten von doppelten Daten
Bis jetzt habe ich mich darauf konzentriert, wie man doppelte Werte in einer Spalte entfernt, und jede Methode, die ich bisher gezeigt habe, funktioniert, wenn das dein Problem ist. Um das klarzustellen: In Excel können Duplikate in zwei Formen auftreten - doppelte Werte und doppelte Zeilen:
- Doppelte Werte sind wiederholte Einträge in einer einzelnen Spalte. Wenn ich zum Beispiel eine Spalte mit Namen habe und Minny mehrfach vorkommt, sind das doppelte Werte.
- Doppelte Zeilen entstehen, wenn ganze Zeilen in allen Spalten identische Daten haben. Meine Tabelle hat zum Beispiel die Spalten Name, Alter und Stadt. Wenn zwei oder mehr Zeilen die gleichen Felder haben, handelt es sich um doppelte Zeilen.
Zusammenfassende Tabelle
Hier ist eine zusammenfassende Tabelle, die die spezifischen Vorteile jeder Methode aufzeigt. Hier habe ich auch eine Spalte hinzugefügt, um zu zeigen, ob die Methode auch zum Entfernen doppelter Zeilen erweitert werden kann. Wenn du eine ganze Zeile mit Duplikaten entfernen möchtest, solltest du die bedingte Formatierung, den erweiterten Filter, die Formeln oder die Power Query verwenden, aber die Funktion Duplikate entfernen nur für einfache Fälle.
Methode | Wichtige Vorteile | Am besten zum Entfernen von |
---|---|---|
Funktion Duplikate entfernen | Schnell und einfach zum Entfernen von Duplikaten | Doppelte Zeilen |
Bedingte Formatierung | Visuelle Identifizierung von Duplikaten vor dem Entfernen | Doppelte Werte oder doppelte Zeilen |
Erweiterter Filter | Behält die Originaldaten bei und filtert einzigartige Einträge | Doppelte Werte oder doppelte Zeilen |
Formeln | Dynamische Kontrolle über Duplikatkriterien | Doppelte Werte oder doppelte Zeilen |
Power Query | Automatisiert das Entfernen von Duplikaten für zukünftige Updates | Doppelte Werte oder doppelte Zeilen |
Best Practices für das Entfernen von Duplikaten
Hier sind ein paar Best Practices, die ich zu Beginn jedes Datenbereinigungsprojekts empfehle:
- Keep Backup: Lege immer ein unangetastetes Backup deiner Rohdaten an, bevor du mit der Bereinigung beginnst. Du kannst die Originalversion bei Bedarf als Referenz verwenden.
- Definiere deine Duplikate: Lege klare Kriterien dafür fest, was in deinem spezifischen Kontext eine Dublette ist. Manchmal ist es nicht so einfach, in allen Feldern exakte Übereinstimmungen zu finden.
- Standardisiere zuerst: Bereinige und standardisiere deine Daten, bevor du versuchst, Duplikate zu erkennen - normalisiere die Groß- und Kleinschreibung, trimme Leerzeichen, korrigiere Datumsformate und behandle Sonderzeichen.
- Einfach anfangen, dann verfeinern: Beginne mit exakten Übereinstimmungen, bevor du zu komplexeren Übereinstimmungen übergehst. Dieser Ansatz wird dir helfen, deine Datenqualität schrittweise zu verstehen.
- Validiere deine Ergebnisse: Überprüfe deine Ergebnisse stichprobenartig, wenn du automatische Tools verwendest, um systematische Fehler zu erkennen.
Häufige Excel-Probleme beheben
Schauen wir uns die häufigsten Probleme an, auf die du beim Entfernen von Duplikaten stoßen kannst.
Duplikate nicht entfernt
Manchmal kopieren wir Daten von Websites oder externen Quellen - diese Daten enthalten meist versteckte Zeichen oder Leerzeichen, die Excel daran hindern, doppelte Einträge zu erkennen. Um dieses Problem zu lösen, kannst du die Funktionen TRIM()
und CLEAN()
verwenden. Die Funktion TRIM()
entfernt überflüssige Leerzeichen zwischen Wörtern, und die Funktion CLEAN()
entfernt nicht druckbare Zeichen.
=CLEAN(TRIM(A1))
Daten mit Zwischensummen oder Gliederungen
Wenn deine Kalkulationstabelle Zwischensummen oder Gliederungen enthält, können diese den Prozess der Duplikatentfernung beeinträchtigen. Excel behandelt diese Zusammenfassungszeilen als eindeutige Einträge, was zu einer unvollständigen Entfernung von Duplikaten führen kann. Um dies zu vermeiden, entferne alle Zwischensummen und Gliederungen aus deinen Daten, bevor du Duplikate entfernst.
Hier erfährst du, wie du das machen kannst:
- Um Umrisse zu entfernen: Gehe auf dieRegisterkarte Daten , suche die Gruppe Gliederung und klicke auf Gliederung löschen.
- So entfernst du Zwischensummen: Gehe auf dieRegisterkarte Daten , klicke auf Zwischensumme und dann auf Alle entfernen.
Nachdem du Gliederungen und Zwischensummen entfernt hast, kannst du wie gewohnt mit dem Entfernen von Duplikaten fortfahren.
Fall-Sensibilität
Excel betrachtet Groß- und Kleinbuchstaben bei der Prüfung auf Duplikate als unterschiedliche Werte. Zum Beispiel würden Produkt und PRODUKT als unterschiedliche Einträge behandelt werden. Um dies zu vermeiden, verwende die Funktionen UPPER()
, LOWER()
oder PROPER()
, um die Groß- und Kleinschreibung in allen deinen Daten zu vereinheitlichen, bevor du mit dem Entfernen beginnst.
-
=UPPER()
Text in Großbuchstaben umwandeln. -
=LOWER()
wandelt Text in Kleinbuchstaben um. -
=PROPER()
schreibt den ersten Buchstaben eines jeden Wortes groß.
Schlussgedanken
Das Bereinigen von Duplikaten in Excel mag wie eine kleine Aufgabe erscheinen, aber es kann einen großen Unterschied in deiner Arbeit machen. Ich habe fünf Möglichkeiten vorgestellt, von schnell eingebauten Funktionen bis hin zu fortgeschrittenen Techniken. Du solltest verschiedene Methoden ausprobieren, bis du einen Ansatz gefunden hast, der sich reibungslos in deinen Arbeitsablauf einfügt und deine Daten korrekt hält.
Wenn du deine Excel-Kenntnisse weiter ausbauen möchtest, schau dir unseren Kurs Datenanalyse in Excel und den Lernpfad Datenanalyse mit Excel Power Tools an.
Excel-Grundlagen lernen
Ich bin ein Inhaltsstratege, der es liebt, komplexe Themen zu vereinfachen. Ich habe Unternehmen wie Splunk, Hackernoon und Tiiny Host geholfen, ansprechende und informative Inhalte für ihr Publikum zu erstellen.
Häufige Fragen zum Entfernen von Excel-Duplikaten
Kann ich in Excel Warnmeldungen für zukünftige Duplikate erstellen?
Excel hat zwar keine eingebauten Warnungen für Duplikate, aber du kannst bedingte Formatierungen verwenden, um Duplikate zu markieren, sobald sie eingegeben werden.
Gibt es eine Excel-Formel, um Duplikate zu entfernen?
Ja, du kannst die Funktion UNIQUE()
in Excel 365 oder ähnliche Formeln verwenden, um eindeutige Werte in Echtzeit anzuzeigen, wenn sich Daten ändern.
Wie kann ich Duplikate entfernen, aber die erste Instanz in Excel behalten?
Sortiere deine Daten nach der Spalte Änderungsdatum (absteigend), bevor du Duplikate entfernst. Auf diese Weise behält Excel das erste (jüngste) Vorkommen.