Weiter zum Inhalt
StartseiteR

Kurs

Fortgeschrittene Reguläre Ausdrücke in R

MittelSchwierigkeitsgrad
Aktualisiert 11/2024
Dieser Kurs zeigt dir anhand authentischer Datensätze, wie du Textdaten bearbeitest, analysierst und mehr.
Kurs kostenlos starten
RProgramming
4 Std.
14 Videos
48 Übungen
3,650 XP
4,741
Leistungsnachweis

Kostenloses Konto erstellen

Mit Google fortfahrenWeitere Optionen anzeigen

oder


Durch Klick auf die Schaltfläche akzeptierst du unsere Nutzungsbedingungen, unsere Datenschutzrichtlinie und die Speicherung deiner Daten in den USA.

Beliebt bei Lernenden in Tausenden Unternehmen

Group

Ein Team schulen?

Für Unternehmen ausprobieren

Kursbeschreibung

Daten zu analysieren, die in Tabellen vorliegen, macht Spaß. Aber was, wenn das Spannendste nicht als ordentlich organisierter Datensatz vorliegt, sondern als reiner Text? Kein Grund zur Sorge: In diesem Kurs lernst du alles, was du brauchst, um leistungsstarke reguläre Ausdrücke zu erstellen, mit denen du alle Informationen findest, die du für deine Analysen brauchst – selbst aus einem Textblock. Und nicht nur das. Mithilfe von String-Distanzen lernst du, auch mit Text zu arbeiten, der Tippfehler oder Scanfehler enthält, da du ihn seinen korrekten Entsprechungen aus anderen Datenquellen zuordnen kannst (Record Linkage). Als Lernmaterial analysieren wir reale Dokumente zu Kinoeinspielergebnissen in der Schweiz.

Voraussetzungen

Introduction to the TidyverseString Manipulation with stringr in R
1

Reguläre Ausdrücke: Eigene Muster schreiben

Reguläre Ausdrücke können anfangs ziemlich einschüchternd wirken, weil sie viele Sonderzeichen enthalten. In diesem Kapitel lernst du, diese zu entschlüsseln und eigene Muster zu schreiben, um genau das zu finden, wonach du suchst.
Kapitel starten
2

Zeichenketten aus Daten erstellen

In diesem Kapitel entfernen wir uns ein wenig von regulären Ausdrücken und konzentrieren uns auf String-Manipulation, indem wir Zeichenketten aus anderen Datenstrukturen wie Vektoren oder Listen erstellen.
Kapitel starten
3

Strukturierte Daten aus Text extrahieren

Eine Aufgabe, in der reguläre Ausdrücke besonders glänzen, ist, aus einem Textblock Sinn zu gewinnen. In diesem Kapitel lernst du, Informationen aus unübersichtlichen Daten zu extrahieren, die nicht in sauber angeordneten Tabellen vorliegen, sondern als reiner Text.
Kapitel starten
4

Ähnlichkeiten zwischen Zeichenketten

Im letzten Kapitel wechseln wir den Fokus von regulären Ausdrücken hin zu String-Distanzen. Indem wir die Unterschiede zwischen mehreren Zeichenketten berechnen, können wir ähnliche zueinander in Beziehung setzen. Das hilft uns, Duplikate zu finden, selbst wenn sie kleine Fehler wie Tippfehler enthalten. Das ist ein wichtiger Teil des Record Linkage, bei dem wir Datensätze aus mehreren Quellen zusammenführen.
Kapitel starten
Fortgeschrittene Reguläre Ausdrücke in R
Kurs
abgeschlossen

Leistungsnachweis verdienen

Füge diesen Fähigkeitsnachweis zu deinem LinkedIn-Profil, Anschreiben oder Lebenslauf hinzu
Teile es auf Social Media und in deiner Leistungsbeurteilung
Jetzt anmelden

Schließe dich 19 Millionen Lernenden an und starte Fortgeschrittene Reguläre Ausdrücke in R heute!

Kostenloses Konto erstellen

Mit Google fortfahrenWeitere Optionen anzeigen

oder


Durch Klick auf die Schaltfläche akzeptierst du unsere Nutzungsbedingungen, unsere Datenschutzrichtlinie und die Speicherung deiner Daten in den USA.

DataCamp gibt es auch für Mobilgeräte

Mit unseren Kursen für Mobilgeräte und täglichen Programmier-Challenges erweiterst du deine Datenkompetenz von unterwegs.