Datatransformation med Spark SQL i Databricks

MedelnivåKunskapsnivå

Uppdaterad 2026-07

Bygg end-to-end-datapipelines – från rensning och aggregering till streaming och orkestrering.

Kursbeskrivning

Redo att hantera verkliga data i stor skala? Den här kursen lär dig att transformera stora datamängder med Spark SQL och PySpark i Databricks. Du lär dig att forma och rensa data, köra aggregeringar med optimerade joins och använda fönsterfunktioner för avancerad analys. Du ställer även in filbaserad strömning med feltoleranta kontrollpunkter och sparar resultaten som Delta-tabeller. I slutet av kursen orkestrerar du flerstegspipelines för produktion med Databricks Workflows och Lakeflow Declarative Pipelines.

Förkunskapskrav

Introduction to Databricks SQL Introduction to PySpark

Läsa in och forma data

I det här kapitlet lär du dig att arbeta med Databricks-notebooks, läsa in CSV-data i Spark DataFrames och forma data med PySpark och SQL.

Kursbeskrivning

Tjäna ett prestationsbevis

Gå med .css-nklxlk{color:var(--wf-brand--main, #03EF62);}19 miljoner lärande och börja Datatransformation med Spark SQL i Databricks idag!

Skapa ditt kostnadsfria konto

Utveckla dina datakunskaper med DataCamp för mobilen

Gå med 19 miljoner lärande och börja Datatransformation med Spark SQL i Databricks idag!