Kurs
Wie man Daten in Excel bereinigt: Ein Leitfaden für Anfänger
In diesem Lernprogramm lernst du, wie du deine Daten in Excel bereinigst und für die Analyse vorbereitest. Wir werden wichtige Techniken wie das Entfernen von Duplikaten, den Umgang mit fehlenden Werten und die Standardisierung von Formatierungen behandeln. Am Ende wirst du mit praktischen Fähigkeiten ausgestattet sein, um sicherzustellen, dass dein Datensatz genau und bereit für eine tiefergehende Analyse ist.
Wenn du tiefer in die Materie einsteigen willst, solltest du den umfassenden Kurs Datenvorbereitung in Excel besuchen, der sich mit fortgeschrittenen Techniken und Best Practices zur Optimierung deines Datenbereinigungs-Workflows befasst.
Was sind die Bestandteile von sauberen Daten?
Die Sicherstellung einer hohen Datenqualität umfasst mehrere Schlüsselkomponenten, darunter Genauigkeit, Vollständigkeit, Konsistenz, Einheitlichkeit und Gültigkeit. Diese Komponenten sind für eine zuverlässige Analyse und Entscheidungsfindung unerlässlich. Schauen wir uns beide an.
- Genauigkeit: Genauigkeit bedeutet, dass deine Daten die realen Werte, die sie darstellen, korrekt wiedergeben. Sie stellt sicher, dass die angezeigten Informationen präzise und fehlerfrei sind und den wahren Stand der Daten widerspiegeln. Wenn deine Daten korrekt sind, haben sie zum Beispiel die folgenden Eigenschaften: Präzise und fehlerfreie Informationen, Numerisch korrekte Werte, Tippfehlerfreie Textdatenund Genaue Daten.
- Vollständigkeit: Vollständige Daten enthalten alle notwendigen Informationen für die Analyse. Wenn deine Daten unvollständig sind und wichtige Details fehlen, kann das die Ergebnisse verfälschen. Achte darauf, dass du Lücken füllst oder fehlende Werte in deiner Analyse berücksichtigst. Um mit fehlenden Daten umzugehen, achte darauf, dass du Werte auf der Grundlage anderer Beobachtungen eingibst, fehlende Werte durch Platzhalter ersetzst und unvollständige Datensätze entfernst.
- Konsistenz: Konsistenz bedeutet, dass die Daten über verschiedene Datensätze und Zeiträume hinweg gleich bleiben. Saubere Daten enthalten immer die gleichen Formate und Maßeinheiten.
- Gleichmäßigkeit: Einheitlichkeit oder Standardisierung bedeutet, dass alle Daten ein einheitliches Format und eine einheitliche Struktur aufweisen - sie sollten entweder einem Datentyp oder einer Kategorie angehören. Dazu gehört, dass du dieselben Maßeinheiten verwendest oder Daten formatierst und sie in Kategorien einordnest.
- Gültigkeit: Validität bedeutet, dass die Datenwerte innerhalb des vorgegebenen akzeptablen Bereichs liegen und den erwarteten Mustern entsprechen. Wenn zum Beispiel ein gültiger Alterseintrag zwischen 0 und 120 Jahren liegen sollte, werden Validierungsregeln und -prüfungen angewendet, um sicherzustellen, dass die Daten dieses Kriterium erfüllen. Dadurch wird verhindert, dass Ausreißer und fehlerhafte Einträge die Ergebnisse verfälschen.
Wie man Daten in Excel bereinigt
Daten in Excel zu bereinigen bedeutet, Rohdaten zu verfeinern. Im Gegensatz zur Datenüberprüfung, die eine spezielle Funktion in der Excel-Symbolleiste ist, ist die Datenbereinigung ein allgemeinerer Begriff, der ein breiteres Spektrum an Tools und Techniken umfasst. Im folgenden Abschnitt werden wir jeden der folgenden Gedanken behandeln:
- Grundreinigung: Bei der grundlegenden Bereinigung geht es darum, allgemeine Probleme wie zusätzliche Leerzeichen, leere Zellen und Rechtschreibfehler zu beseitigen, um einen sauberen und konsistenten Datensatz zu gewährleisten.
- Fehlerbehandlung und Validierung: Fehlerbehandlung und Validierung konzentrieren sich auf die Identifizierung und Korrektur von Fehlern und stellen sicher, dass deine Daten ihre Integrität bewahren, indem sie Duplikate entfernen.
- Textoperationen: Textoperationen umfassen die Bearbeitung und Formatierung von Textdaten, um sicherzustellen, dass sie deinen Anforderungen entsprechen, einschließlich Verkettung und Groß-/Kleinschreibung.
- Datenumwandlung: Datenumwandlungstechniken werden verwendet, um deine Daten für eine bessere Analyse umzuorganisieren und umzugestalten, einschließlich der Analyse von Text und der Verwendung von Tools wie Flash Fill.
- Zahlen- und Datumskorrekturen: Bei der Korrektur von Zahlen und Daten geht es um die Korrektur und Standardisierung von numerischen Daten und Daten, um sicherzustellen, dass sie korrekt und einheitlich formatiert sind.
- Fortgeschrittenes Datenmanagement: Zu einem fortschrittlichen Datenmanagement gehört es, Datensätze abzugleichen und zu kombinieren, um einen umfassenden und zusammenhängenden Datensatz für die Analyse zu erstellen.
Grundlegende Datenbereinigung in Excel
Werfen wir einen Blick auf die Grundreinigung, bei der es darum geht, allgemeine Probleme zu lösen, wie z.B. das Entfernen von zusätzlichen Räumen.
Überflüssige Leerzeichen loswerden
Nachstehende Leerzeichen können lästig oder problematisch sein, weil sie zu Unstimmigkeiten bei der Datenanalyse und Formatierungsproblemen führen können.
Es gibt zwei Möglichkeiten, überflüssige Leerzeichen in Excel loszuwerden. Schauen wir uns beides an.
Überflüssige Leerzeichen mit Suchen und Ersetzen beseitigen
Hier sind die Schritte, um zusätzliche Leerzeichen loszuwerden.
Wähle den Bereich der Zellen aus, in dem du zusätzliche Leerzeichen entfernen möchtest.
Verwende die Tastenkombination Strg + H, um das Dialogfeld Suchen und Ersetzen zu öffnen.
Drücke im Feld Finde was zweimal die Leertaste, um zwei Leerzeichen einzugeben.
Im Feld Ersetzen durch drückst du einmal die Leertaste, um ein einzelnes Leerzeichen einzugeben.
Klicke auf " Alle ersetzen".
Wiederhole den Vorgang, bis keine doppelten Leerzeichen mehr gefunden werden.
Suche und ersetze das Dialogfeld. Quelle: Bild vom Autor
Überflüssige Leerzeichen mit TRIM beseitigen
Erstelle eine neue Spalte für die bereinigten Daten.
Gib die Formel
=TRIM(cell_with_extra_spaces)
in die erste Zelle der neuen Spalte ein.Doppelklicke auf die untere rechte Ecke der Zelle, um die Formel auf den Rest der Zeilen anzuwenden.
Kopiere die bereinigten Daten und füge sie als Werte ein, um die Formeln zu entfernen.
Alle leeren Zellen auswählen und behandeln
Leere Zellen können Probleme verursachen, indem sie Formeln unterbrechen, zu Fehlern in den Berechnungen führen und ungenaue Analyseergebnisse liefern. Hier erfährst du, wie du mit diesem Problem umgehen kannst.
Markiere den Bereich der Zellen, in dem du leere Zellen finden und behandeln willst.
Drücke Strg + G, um das Dialogfeld Gehe zu zu öffnen.
Klicke auf die Schaltfläche "Spezial...". Dies öffnet das Dialogfeld Gehe zu Spezial.
Wähle die Option Leerzeichen und klicke auf OK. Jetzt siehst du, dass alle leeren Zellen in dem gewählten Bereich ausgewählt sind.
Du kannst jetzt einen Wert oder eine Formel eingeben. Drücke Strg + Enter.
Wähle leere Zellen aus und behandle sie. Quelle: Bild vom Autor
Rechtschreibprüfung
Falsch geschriebene Wörter können Daten unprofessionell und schwer verständlich erscheinen lassen, deshalb ist es wichtig, sie zu korrigieren.
Überprüfe das gesamte Arbeitsblatt oder einen bestimmten Bereich.
Gehe auf die Registerkarte Überprüfung im Menüband.
Klicke auf die Schaltfläche Rechtschreibung in der Gruppe Korrekturen.
Das Dialogfeld " Rechtschreibung" wird geöffnet und zeigt das erste falsch geschriebene Wort sowie Vorschläge zur Korrektur an.
Überprüfe und korrigiere die falsch geschriebenen Wörter nach Bedarf.
Rechtschreibprüfung. Quelle: Bild vom Autor
Fehlerbehandlung und Validierung in Excel
Werfen wir einen Blick auf die Fehlerbehandlung, bei der es um häufige Probleme wie das Hervorheben von Fehlern oder das Entfernen von Duplikaten geht.
Fehler hervorheben
Fehler in deinen Daten können zu falschen Ergebnissen und schlechten Entscheidungen führen, deshalb ist es wichtig, sie zu erkennen und zu beheben. Wir wollen sehen, wie wir dieses Problem angehen können.
Wähle den Bereich von Zellen aus, den du auf Fehler prüfen willst.
Gehe auf die Registerkarte Home im Menüband.
Klicke in der Gruppe " Formatvorlagen" auf " Bedingte Formatierung".
Wähle Neue Regel aus dem Dropdown-Menü.
Wähle Formel verwenden, um die zu formatierenden Zellen zu bestimmen.
Gib die Formel
=ISERROR(cell)
in das Feld Werte formatieren, wo diese Formel wahr ist ein.Klicke auf die Schaltfläche Formatieren..., um deine gewünschten Formatierungsoptionen auszuwählen.
Klicke auf OK, nachdem du deine Formatierungsoptionen ausgewählt hast.
Klicke im Dialogfeld Neue Formatierungsregel erneut auf OK, um die Regel anzuwenden.
Formatierung . Quelle: Bild vom Autor
Duplikate entfernen
Doppelte Einträge können die Analyse und die Erkenntnisse verzerren, daher sollten sie entfernt werden, um die Genauigkeit der Daten zu gewährleisten.
Wähle das Arbeitsblatt oder den Zellbereich aus, aus dem du Duplikate entfernen möchtest.
Gehe auf die Registerkarte Daten im Menüband.
Klicke auf Duplikate entfernen in der Gruppe Datentools.
Im Dialogfeld Duplikate entfernen gibst du an, welche Spalte auf Duplikate geprüft werden soll.
Klicke auf OK. Excel zeigt in einer Meldung an, wie viele doppelte Werte entfernt wurden.
Doppelte Zeilen entfernen
Doppelte Zeilen können deine Daten unübersichtlich machen und die Zuverlässigkeit deiner Analyse beeinträchtigen. Hier erfährst du, wie du das schaffst.
Wähle den Bereich aus, aus dem du die doppelten Zeilen entfernen möchtest.
Gehe auf die Registerkarte Daten im Menüband und klicke auf Erweitert in der Gruppe Sortieren & Filtern.
Wähle im Dialogfeld " Erweiterter Filter" die Option An einen anderen Ort kopieren.
Setze den Listenbereich auf deinen ausgewählten Bereich.
Setze das Feld Kopieren nach auf die Zelle, in die die einzelnen Zeilen kopiert werden sollen.
Aktiviere das Kontrollkästchen Nur einmalige Datensätze und klicke dann auf OK.
Textoperationen in Excel
Werfen wir einen Blick auf Textoperationen wie die Verkettung von Zeichenketten.
Verketten
Das Kombinieren mehrerer Textstrings in einer Zelle kann dabei helfen, aussagekräftigere und besser organisierte Daten zu erstellen, indem Informationen aus verschiedenen Quellen in einem einzigen, zusammenhängenden Format zusammengeführt werden.
- Wähle die Zelle aus, in der das verkettete Ergebnis erscheinen soll.
- Typ
=CONCATENATE()
. - Wähle die Zellen aus, die du verketten möchtest, getrennt durch Kommas oder den Operator &.
- Drücke die Eingabetaste, um das Ergebnis zu sehen.
Zellen. Quelle: Bild vom Autor
Die Groß- und Kleinschreibung von Text ändern
Eine einheitliche Textgestaltung kann die Lesbarkeit verbessern und die Konsistenz deiner Daten gewährleisten. Schauen wir mal, wie man das einstellen kann.
Erstelle eine neue Spalte für den umgewandelten Text.
Gib die Formel in eine Zelle ein:
=UPPER()
oder=LOWER()
oder=PROPER()
- Drücke die Eingabetaste, um die Formel anzuwenden.
Ziehe den Füllgriff, um die Formel bei Bedarf auf andere Zellen anzuwenden.
Groß- und Kleinschreibung von Text. Quelle: Bild vom Autor
Nicht druckbare Zeichen aus dem Text entfernen
Nicht druckbare Zeichen wie Tabulatoren, Zeilenumbrüche und Sonderzeichen können Probleme verursachen, indem sie die Datenverarbeitung stören und eine korrekte Analyse oder Visualisierung der Daten erschweren.
Bestimme die nicht druckbaren Zeichen, die du entfernen musst.
Wähle die Zelle aus, die den Text mit den nicht druckbaren Zeichen enthält.
Verwende in einer neuen Zelle die folgende Funktion:
=CLEAN(text)
.Um zusätzliche Leerzeichen und nicht druckbare Zeichen zu entfernen, benutze:
=TRIM(CLEAN(text))
.Kopiere den bereinigten Text und füge ihn ein, um das Original zu ersetzen.
Bereinigungsfunktion in Excel. Quelle: Bild vom Autor
Excel-Grundlagen lernen
Datenumwandlung in Excel
Datenumwandlungstechniken werden verwendet, um deine Daten für eine bessere Analyse umzuorganisieren und umzugestalten, einschließlich der Analyse von Text und der Verwendung von Tools wie Flash Fill.
Datenparsing von Text zu Spalte
Die Aufteilung von Textdaten in einzelne Spalten erleichtert die Analyse bestimmter Komponenten und stellt sicher, dass jede Information eindeutig kategorisiert ist. Dies ist das Gegenteil von Verkettung und ist nützlich, um komplexe Daten in überschaubare Teile zu zerlegen. So gehst du vor.
Wähle die Daten aus, die du aufteilen möchtest.
Gehe zur Registerkarte " Daten" und klicke auf " Text in Spalten".
Wähle "Begrenzt" oder " Feste Breite" und klicke auf "Weiter".
Markiere bei Getrennt die Trennzeichen, die deine Daten verwenden, und klicke auf Weiter.
Für Feste Breite legst du im Fenster Datenvorschau Spaltenumbrüche fest und klickst auf Weiter.
Wähle das Datenformat für jede Spalte.
Klicke auf Fertigstellen.
Text in Spalten für das Parsen von Daten verwenden. Quelle: Bild vom Autor
Blitz-Füllung
Flash Fill füllt automatisch Werte aus, die auf Mustern basieren, die es in deinen Daten erkennt. Hier erfährst du, wie du Flash Fill in Excel verwenden kannst:
Gib die Daten nach einem Muster in eine Zelle neben deinen vorhandenen Daten ein.
Gib in der nächsten Zelle ein weiteres Beispiel an, damit Excel das Muster erkennen kann.
Wähle die Zelle mit dem Beispiel aus.
Gehe auf die Registerkarte Daten im Menüband.
Klicke auf Flash Fill in der Gruppe Data Tools.
Excel füllt die verbleibenden Zellen automatisch auf der Grundlage des erkannten Musters aus.
Spalten zusammenführen und aufteilen
Das Zusammenführen und Aufteilen von Spalten hilft dir, die Daten so zu organisieren, dass sie deinen Analyseanforderungen am besten entsprechen. Befolge diese Schritte, um Zellen zusammenzuführen:
- Gehe auf die Registerkarte Start und klicke auf das Dropdown-Menü Zusammenführen & Zentrieren in der Gruppe Ausrichtung .
- Wähle deine bevorzugte Zusammenführungsoption.
Befolge diese Schritte, um Spalten zu teilen:
- Gehe zur Registerkarte Daten und klicke auf Text in Spalten in der Gruppe Datentools .
- Wähle zwischen begrenzter und fester Breite , je nachdem, was deine Daten brauchen.
- Wähle das Ziel für die geteilten Daten aus und klicke auf Fertig stellen.
Spalten und Zeilen umwandeln und neu anordnen
Eine Neuordnung der Daten kann helfen, sie in einem logischeren und zugänglicheren Format darzustellen. Zum Umwandeln von Zeilen in Zeilen und von Spalten in Spalten:
Markiere die Daten, die du umwandeln möchtest (einschließlich der Kopfzeilen, falls erforderlich).
Klicke mit der rechten Maustaste auf die Auswahl und wähle Kopieren oderdrücke Strg+C.
Wähle die Zelle aus, in der die transformierten Daten beginnen.
Klicke mit der rechten Maustaste auf die Zielzelle, wähle "Einfügen Spezial" und dann " Transponieren".
Du kannst auch Strg+Alt+V verwenden, um das Dialogfeld " Einfügen Spezial" zu öffnen, dann die Option " Transponieren" aktivieren und auf OK klicken.
Um Spalten/Zeilen neu anzuordnen:
Klicke auf die Spaltenüberschrift, um die gesamte Spalte auszuwählen, die du verschieben möchtest.
Klicke mit der rechten Maustaste und wähle Ausschneiden oderdrücke Strg+X.
Markiere die Spalte, in die du die ausgeschnittene Spalte verschieben willst, klicke mit der rechten Maustaste auf die Spaltenüberschrift und wähle Ausschneidezellen einfügen.
Ähnlich verhält es sich mit den Zeilen: Markiere die Zeile, die du in eine andere Zeile übertragen möchtest, schneide sie aus und füge sie dort ein.
Zahlen- und Datumskorrekturen in Excel
Bei der Korrektur von Zahlen und Daten geht es um die Korrektur und Standardisierung von numerischen Daten und Daten, um sicherzustellen, dass sie korrekt und einheitlich formatiert sind.
Zahlen und Zahlenzeichen befestigen
Falsche Zahlenformate können Probleme verursachen, indem sie zu Fehlinterpretationen und Berechnungsfehlern sowie zu Problemen beim Sortieren und Vergleichen von Daten führen.
- Markiere die Zellen mit den Zahlen, die du korrigieren musst.
- Gehe zur Registerkarte Start, klicke auf das Dropdown-Menü Zahl in der Gruppe Zahl und wähle das entsprechende Zahlenformat (z. B. Allgemein, Zahl, Währung).
Festlegen von Daten und Zeiten
Korrekt formatierte Datumsangaben sind entscheidend für genaue zeitbasierte Analysen und Berichte.
Markiere die Zellen, die die Daten enthalten.
Gehe auf die Registerkarte Home.
Klicke auf das Dropdown-Menü Zahlenformat und wähle Kurzes Datum oder Langes Datum.
Bringe deine Karriere mit Excel voran
Erwerbe die Fähigkeiten, um Excel optimal zu nutzen - keine Erfahrung erforderlich.
Fortgeschrittenes Datenmanagement in Excel
Zu einem fortschrittlichen Datenmanagement gehört es, Datensätze abzugleichen und zu kombinieren, um einen umfassenden und zusammenhängenden Datensatz für die Analyse zu erstellen.
Abgleich von Tabellendaten durch Verbinden oder Abgleichen
Die Verknüpfung oder der Abgleich von Daten aus verschiedenen Tabellen gewährleistet eine umfassende und zusammenhängende Analyse.
VLOOKUP zum Abgleichen von Daten verwenden:
-
Stelle sicher, dass beide Tabellen auf demselben Arbeitsblatt zugänglich sind.
-
Wähle die Zelle, in der du die abgeglichenen Daten anzeigen möchtest.
-
Verwende die folgende Funktion:
=VLOOKUP(lookup_value, table_array, col_index_num, FALSE)
-
Ziehe den Füllgriff, um die Formel nach Bedarf in andere Zellen zu kopieren.
Verwendung von INDEX und MATCH für mehr Flexibilität
-
Wähle die Zelle, in der du die abgeglichenen Daten anzeigen möchtest.
-
Nutze die Kombination dieser Funktionen:
=INDEX(array, MATCH(lookup_value, lookup_array, 0))
-
Ziehe den Füllgriff, um die Formel nach Bedarf in andere Zellen zu kopieren.
Schlussgedanken
In Excel gibt es mehrere Datenbereinigungsfunktionen, mit denen du Daten bereinigen und validieren kannst, damit sie den festgelegten Standards entsprechen. Diese können dir helfen, Fehler zu reduzieren und die Qualität deiner Datensätze zu verbessern. Wenn du tiefer in die Excel-Funktionen eintauchen möchtest, solltest du dich für unseren Kurs Einführung in Excel anmelden.
Egal, ob du die Daten bereinigst, um doppelte Felder zu entfernen oder die Formate der Dateneinträge zu standardisieren, Excel hat alle Werkzeuge, die du brauchst, um diesen Prozess zu vereinfachen. Wenn du deine Fähigkeiten zur Datenvorbereitung verbessern möchtest, bietet dir unser Kurs Datenvorbereitung in Excel eine umfassende Behandlung dieses Themas.
Um deine analytischen Fähigkeiten weiter zu verbessern, könnte unser Kurs Datenanalyse in Excel besonders nützlich für dich sein. In diesem Kurs geht es um die Feinheiten der Datenauswertung nach der Reinigung. Wenn du dich außerdem dafür interessierst, wie saubere Daten die Finanzprognosen unterstützen, könnte unser Kurs Finanzmodellierung in Excel von großem Interesse sein.
Wenn du deine Fähigkeiten zur Datenbereinigung erweitern möchtest, solltest du Power Query in Betracht ziehen. Power Query ist ein flexibles und effektives Tool, das in Excel und Power BI integriert ist und mit dem du Daten nahtlos importieren und umwandeln kannst. Du kannst dich auch mit Datenbereinigung in Python oder Datenbereinigung in R beschäftigen. Diese Kurse bieten robuste Techniken und Best Practices für die Datenbereinigung mit gängigen Programmiersprachen.
Ich bin ein Inhaltsstratege, der es liebt, komplexe Themen zu vereinfachen. Ich habe Unternehmen wie Splunk, Hackernoon und Tiiny Host geholfen, ansprechende und informative Inhalte für ihr Publikum zu erstellen.
Häufig gestellte Fragen
Was sind die fünf Schritte des Datenbereinigungsprozesses?
Die fünf Schritte sind das Entfernen von Duplikaten, der Umgang mit fehlenden Daten, das Korrigieren von strukturellen Fehlern, das Filtern von Ausreißern und die Validierung der Daten.
Was ist der Unterschied zwischen Datenbereinigung und Datentransformation?
Beim Bereinigen von Daten geht es darum, Fehler und Ungenauigkeiten im Datensatz zu identifizieren und zu korrigieren, um die Zuverlässigkeit zu gewährleisten. Bei der Datentransformation konvertierst du Daten von einem Format oder einer Struktur in ein anderes, um sie für die Analyse vorzubereiten. Die Datenbereinigung stellt also sicher, dass die Datensätze korrekt sind, während die Transformation die bereinigten Daten in das für die Analyse oder Berichterstattung erforderliche Format umwandelt.
Lerne Excel mit DataCamp
Kurs
Data Analysis in Excel
Kurs
Data Preparation in Excel

Der Blog
Lehrer/innen und Schüler/innen erhalten das Premium DataCamp kostenlos für ihre gesamte akademische Laufbahn
Der Blog
2022-2023 DataCamp Classrooms Jahresbericht
Der Blog
Die 20 besten Snowflake-Interview-Fragen für alle Niveaus

Nisha Arya Ahmed
20 Min.
Der Blog
Q2 2023 DataCamp Donates Digest
Der Blog
Die 32 besten AWS-Interview-Fragen und Antworten für 2024
Der Blog
Top 30 Generative KI Interview Fragen und Antworten für 2024

Hesam Sheikh Hassani
15 Min.