Weiter zum Inhalt
StartseiteR

Kurs

Skalierbare Datenverarbeitung in R

ExperteSchwierigkeitsgrad
Aktualisiert 08/2024
Lerne, wie du mit den Paketen bigmemory und iotools skalierbaren Code für die Arbeit mit Big Data in R schreibst.
Kurs kostenlos starten
RProgramming
4 Std.
15 Videos
49 Übungen
3,950 XP
6,148
Leistungsnachweis

Kostenloses Konto erstellen

Mit Google fortfahrenWeitere Optionen anzeigen

oder


Durch Klick auf die Schaltfläche akzeptierst du unsere Nutzungsbedingungen, unsere Datenschutzrichtlinie und die Speicherung deiner Daten in den USA.

Beliebt bei Lernenden in Tausenden Unternehmen

Group

Ein Team schulen?

Für Unternehmen ausprobieren

Kursbeschreibung

Datensätze sind oft größer als der verfügbare Arbeitsspeicher. Das ist für R-Programmierer:innen problematisch, da standardmäßig alle Variablen im Speicher liegen. Du lernst Werkzeuge kennen, mit denen du Daten direkt von der Festplatte verarbeiten, untersuchen und analysieren kannst. Außerdem setzt du den Split-Apply-Combine-Ansatz um und lernst, wie du mit den Paketen bigmemory und iotools skalierbaren Code schreibst. In diesem Kurs nutzt du Daten der Federal Housing Finance Agency – ein frei verfügbarer Datensatz, der alle Hypotheken erfasst, die von der Federal National Mortgage Association (Fannie Mae) und der Federal Home Loan Mortgage Corporation (Freddie Mac) zwischen 2009 und 2015 gehalten oder verbrieft wurden.

Voraussetzungen

Writing Efficient R Code
1

Arbeiten mit immer größeren Datensätzen

In diesem Kapitel erfährst du, warum du neue Techniken brauchst, wenn Datensätze größer sind als der verfügbare Arbeitsspeicher. Wir zeigen, dass das Importieren und Exportieren von Daten mit Basisfunktionen in R langsam sein kann, und stellen einfache Möglichkeiten vor, das zu verbessern. Abschließend führen wir das Paket bigmemory ein.
Kapitel starten
2

Datenverarbeitung und -analyse mit bigmemory

Nachdem du nun erste Erfahrung mit bigmemory gesammelt hast, schauen wir uns einfache Methoden zur Datenexploration und -analyse an. Insbesondere siehst du, wie man Tabellen erzeugt und den Split-Apply-Combine-Ansatz umsetzt.
Kapitel starten
Skalierbare Datenverarbeitung in R
Kurs
abgeschlossen

Leistungsnachweis verdienen

Füge diesen Fähigkeitsnachweis zu deinem LinkedIn-Profil, Anschreiben oder Lebenslauf hinzu
Teile es auf Social Media und in deiner Leistungsbeurteilung
Jetzt anmelden

Schließe dich 19 Millionen Lernenden an und starte Skalierbare Datenverarbeitung in R heute!

Kostenloses Konto erstellen

Mit Google fortfahrenWeitere Optionen anzeigen

oder


Durch Klick auf die Schaltfläche akzeptierst du unsere Nutzungsbedingungen, unsere Datenschutzrichtlinie und die Speicherung deiner Daten in den USA.

DataCamp gibt es auch für Mobilgeräte

Mit unseren Kursen für Mobilgeräte und täglichen Programmier-Challenges erweiterst du deine Datenkompetenz von unterwegs.