Weiter zum Inhalt
StartseitePython

Kurs

Datenbereinigung in Python

MittelSchwierigkeitsgrad
Aktualisiert 12/2025
Erwirb die nötigen Fähigkeiten, um fehlerhafte Daten zu bereinigen und Rohdaten in wertvolle Erkenntnisse zu verwandeln.
Kurs kostenlos starten
PythonData Preparation
4 Std.
13 Videos
44 Übungen
3,500 XP
150K+
Leistungsnachweis

Kostenloses Konto erstellen

Mit Google fortfahrenWeitere Optionen anzeigen

oder


Durch Klick auf die Schaltfläche akzeptierst du unsere Nutzungsbedingungen, unsere Datenschutzrichtlinie und die Speicherung deiner Daten in den USA.

Beliebt bei Lernenden in Tausenden Unternehmen

Group

Ein Team schulen?

Für Unternehmen ausprobieren

Kursbeschreibung

Entdecke, wie man Daten in Python bereinigt

Man sagt, dass Datenwissenschaftler/innen 80 % ihrer Zeit mit dem Bereinigen und Bearbeiten von Daten verbringen und nur 20 % ihrer Zeit mit der Analyse. Die Datenbereinigung ist ein wichtiger Schritt für jeden Datenwissenschaftler, da die Analyse von verschmutzten Daten zu ungenauen Schlussfolgerungen führen kann.

In diesem Kurs lernst du, wie du verschiedene Probleme bei der Datenbereinigung in Python erkennen, diagnostizieren und behandeln kannst, von einfach bis fortgeschritten. Du wirst mit falschen Datentypen umgehen, überprüfen, ob deine Daten im richtigen Bereich liegen, mit fehlenden Daten umgehen, Datensatzverknüpfungen durchführen und vieles mehr!

Lernen, wie man verschiedene Datentypen bereinigt

Im ersten Kapitel des Kurses geht es um häufige Datenprobleme und wie du sie beheben kannst. Du wirst zunächst die grundlegenden Datentypen verstehen und wissen, wie du mit ihnen einzeln umgehen kannst. Danach wendest du Bereichsbeschränkungen an und entfernst doppelte Datenpunkte.

Das letzte Kapitel befasst sich mit der Datensatzverknüpfung, einem leistungsstarken Werkzeug zum Zusammenführen mehrerer Datensätze. Du lernst, wie du Datensätze miteinander verknüpfst, indem du die Ähnlichkeit zwischen Zeichenketten berechnest. Zum Schluss wendest du deine neuen Kenntnisse an, um zwei Restaurantkritiken zu einem sauberen Masterdatensatz zu verbinden.

Gewinnen Sie Vertrauen in die Datenbereinigung

Am Ende des Kurses bist du in der Lage, verschiedene Datentypen zu bereinigen und Datensätze miteinander zu verknüpfen, um mehrere Datensätze zusammenzuführen. Das Bereinigen von Daten ist eine wichtige Fähigkeit für Datenwissenschaftler. Wenn du mehr über das Bereinigen von Daten in Python und seine Anwendungen erfahren möchtest, schau dir die folgenden Lernpfade an: Data Scientist with Python und Importing & Cleaning Data with Python.

Voraussetzungen

Python ToolboxJoining Data with pandas
1

Häufige Datenprobleme

In diesem Kapitel erfährst du, wie du einige der häufigsten Probleme mit unsauberen Daten lösen kannst. Du konvertierst Datentypen, wendest Bereichsbeschränkungen an, um Datenpunkte mit einem Datum in der Zukunft zu entfernen, und entfernst doppelte Datenpunkte, um Doppelzählungen zu vermeiden.
Kapitel starten
2

Probleme mit Text und kategorialen Daten

Kategoriale Daten und Textdaten gehören oft zu den unübersichtlichsten Teilen eines Datensatzes, weil sie unstrukturiert sind. In diesem Kapitel erfährst du, wie du Unstimmigkeiten bei Leerzeichen und Großschreibung in Kategoriekennzeichnungen behebst, mehrere Kategorien zu einer zusammenfasst und Zeichenketten neu formatierst, um die Konsistenz zu gewährleisten.
Kapitel starten
3

Fortgeschrittene Datenprobleme

In diesem Kapitel beschäftigst du dich mit fortgeschrittenen Datenbereinigungsproblemen, z. B. damit wie du sicherstellen kannst, dass alle Gewichtsangaben in Kilogramm statt in Pfund angegeben werden. Du erwirbst außerdem wertvolle Fähigkeiten, mit denen du überprüfen kannst, ob Werte korrekt hinzugefügt wurden und ob fehlende Werte deine Analysen nicht negativ beeinflussen.
Kapitel starten
4

Datensatzverknüpfung

Die Datensatzverknüpfung ist eine leistungsstarke Technik, mit der mehrere Datensätze zusammengeführt werden können, wenn die Werte Tippfehler oder unterschiedliche Schreibweisen aufweisen. In diesem Kapitel lernst du, wie du Datensätze miteinander verknüpfst, indem du die Ähnlichkeit zwischen Zeichenketten berechnest, und dann deine neuen Kenntnisse einsetzt, um zwei Restaurantbewertungsdatensätze zu einem einzigen, sauberen Masterdatensatz zu verbinden.
Kapitel starten
Datenbereinigung in Python
Kurs
abgeschlossen

Leistungsnachweis verdienen

Füge diesen Fähigkeitsnachweis zu deinem LinkedIn-Profil, Anschreiben oder Lebenslauf hinzu
Teile es auf Social Media und in deiner Leistungsbeurteilung
Jetzt anmelden

Schließe dich 19 Millionen Lernenden an und starte Datenbereinigung in Python heute!

Kostenloses Konto erstellen

Mit Google fortfahrenWeitere Optionen anzeigen

oder


Durch Klick auf die Schaltfläche akzeptierst du unsere Nutzungsbedingungen, unsere Datenschutzrichtlinie und die Speicherung deiner Daten in den USA.

DataCamp gibt es auch für Mobilgeräte

Mit unseren Kursen für Mobilgeräte und täglichen Programmier-Challenges erweiterst du deine Datenkompetenz von unterwegs.