Weiter zum Inhalt
StartseiteR

Kurs

Datenbereinigung in R

MittelSchwierigkeitsgrad
Aktualisiert 08/2024
In diesem Kurs lernst du, Daten effizient und akkurat zu bereinigen, um Rohdaten in gewinnbringende Erkenntnisse zu verwandeln.
Kurs kostenlos starten
RData Preparation
4 Std.
13 Videos
44 Übungen
3,700 XP
61,009
Leistungsnachweis

Kostenloses Konto erstellen

Mit Google fortfahrenWeitere Optionen anzeigen

oder


Durch Klick auf die Schaltfläche akzeptierst du unsere Nutzungsbedingungen, unsere Datenschutzrichtlinie und die Speicherung deiner Daten in den USA.

Beliebt bei Lernenden in Tausenden Unternehmen

Group

Ein Team schulen?

Für Unternehmen ausprobieren

Kursbeschreibung

Überwinde häufige Datenprobleme wie das Entfernen von Duplikaten in R

Man sagt, dass Datenwissenschaftler/innen 80 % ihrer Zeit mit dem Bereinigen und Bearbeiten von Daten verbringen und nur 20 % ihrer Zeit mit der Analyse. Die Zeit, die du für die Bereinigung aufbringst, ist sehr wichtig, denn die Analyse verschmutzter Daten kann dich zu falschen Schlussfolgerungen verleiten.

In diesem Kurs lernst du eine Reihe von Techniken kennen, mit denen du schmutzige Daten mit R bereinigen kannst. Du beginnst mit der Konvertierung von Datentypen, der Anwendung von Bereichseinschränkungen und dem Umgang mit vollständigen und teilweisen Duplikaten, um Doppelzählungen zu vermeiden.

Sich mit fortgeschrittenen Datenherausforderungen befassen

Wenn du dich mit den üblichen Datenproblemen vertraut gemacht hast, kannst du dich fortgeschritteneren Herausforderungen zuwenden, wie z.B. der Sicherstellung der Konsistenz von Messungen und dem Umgang mit fehlenden Daten. Nach jedem neuen Konzept hast du die Möglichkeit, eine praktische Übung zu absolvieren, um dein Wissen zu festigen und deine Erfahrung zu erweitern.

Lerne die Datensatzverknüpfung bei der Datenbereinigung zu nutzen

Die Datensatzverknüpfung wird verwendet, um Datensätze zusammenzuführen, wenn die Werte Probleme wie Tippfehler oder unterschiedliche Schreibweisen aufweisen. Im letzten Kapitel lernst du diese nützliche Technik kennen und übst ihre Anwendung, indem du zwei Datensätze von Restaurantbewertungen zu einem einzigen Datensatz zusammenfügst.

Voraussetzungen

Joining Data with dplyr
1

Häufige Datenprobleme

In diesem Kapitel lernst du, einige der häufigsten Probleme mit unsauberen Daten zu beheben. Du konvertierst Datentypen, wendest Wertebereichsgrenzen an, um zukünftige Datenpunkte zu entfernen, und entfernst doppelte Datenpunkte, um Doppelzählungen zu vermeiden.
Kapitel starten
2

Kategorische und Textdaten

Kategorische und Textdaten gehören durch ihre unstrukturierte Natur oft zu den unordentlichsten Teilen eines Datensatzes. In diesem Kapitel behebst du Inkonsistenzen bei Leerzeichen und Groß-/Kleinschreibung in Kategorienamen, fasst mehrere Kategorien zusammen und formatierst Strings einheitlich um.
Kapitel starten
3

Fortgeschrittene Datenprobleme

In diesem Kapitel widmest du dich fortgeschritteneren Problemen der Datenbereinigung, zum Beispiel sicherzustellen, dass Gewichte einheitlich in Kilogramm statt in Pfund angegeben sind. Außerdem erwirbst du wichtige Fähigkeiten, mit denen du prüfen kannst, ob Werte korrekt erfasst wurden und fehlende Werte deine Analysen nicht negativ beeinflussen.
Kapitel starten
4

Record Linkage

Record Linkage ist eine leistungsstarke Technik zum Zusammenführen mehrerer Datensätze, wenn Werte Tippfehler oder unterschiedliche Schreibweisen aufweisen. In diesem Kapitel lernst du, Datensätze zu verknüpfen, indem du die Ähnlichkeit zwischen Strings berechnest — anschließend nutzt du deine neuen Fähigkeiten, um zwei Datensätze mit Restaurantbewertungen zu einem sauberen, zusammengeführten Master-Datensatz zu verbinden.
Kapitel starten
Datenbereinigung in R
Kurs
abgeschlossen

Leistungsnachweis verdienen

Füge diesen Fähigkeitsnachweis zu deinem LinkedIn-Profil, Anschreiben oder Lebenslauf hinzu
Teile es auf Social Media und in deiner Leistungsbeurteilung
Jetzt anmelden

Schließe dich 19 Millionen Lernenden an und starte Datenbereinigung in R heute!

Kostenloses Konto erstellen

Mit Google fortfahrenWeitere Optionen anzeigen

oder


Durch Klick auf die Schaltfläche akzeptierst du unsere Nutzungsbedingungen, unsere Datenschutzrichtlinie und die Speicherung deiner Daten in den USA.

DataCamp gibt es auch für Mobilgeräte

Mit unseren Kursen für Mobilgeräte und täglichen Programmier-Challenges erweiterst du deine Datenkompetenz von unterwegs.