Datentransformation mit Spark SQL in Databricks

MittelSchwierigkeitsgrad

Aktualisiert 07/2026

End-to-end-Daten-Pipelines bauen – von Bereinigung und Aggregation bis zu Streaming und Orchestrierung.

Kursbeschreibung

Bereit, reale Daten im großen Stil zu verarbeiten? In diesem Kurs lernst du, große Datensätze mit Spark SQL und PySpark in Databricks zu transformieren. Du formst und bereinigst Daten, führst Aggregationen mit optimierten Joins aus und nutzt Window-Funktionen für erweiterte Analysen. Außerdem richtest du dateibasierte Streams mit fehlertoleranten Checkpoints ein und speicherst Ergebnisse als Delta-Tabellen. Am Ende orchestrierst du mehrstufige Produktions-Pipelines mit Databricks Workflows und Lakeflow Declarative Pipelines.

Voraussetzungen

Introduction to Databricks SQL Introduction to PySpark

Daten laden und formen

In diesem Kapitel lernst du, wie du mit Databricks-Notebooks arbeitest, CSV-Daten in Spark DataFrames lädst und Daten mit PySpark und SQL formst.

Kursbeschreibung

Leistungsnachweis verdienen

Schließe dich .css-nklxlk{color:var(--wf-brand--main, #03EF62);}19 Millionen Lernenden an und starte Daten­transformation mit Spark SQL in Databricks heute!

Kostenloses Konto erstellen

DataCamp gibt es auch für Mobilgeräte

Schließe dich 19 Millionen Lernenden an und starte Datentransformation mit Spark SQL in Databricks heute!