Data Transformation with Spark SQL in Databricks

ŚredniozaawansowanyPoziom umiejętności

Zaktualizowano 07.2026

Buduj kompleksowe potoki danych — od czyszczenia i agregacji po streaming i orkiestrację.

Opis kursu

Chcesz przetwarzać dane na dużą skalę w rzeczywistych projektach? Ten kurs uczy, jak przekształcać duże zbiory danych za pomocą Spark SQL i PySpark w Databricks. Nauczysz się kształtować i czyścić dane, wykonywać agregacje z optymalnymi złączeniami oraz stosować funkcje okna do zaawansowanej analizy. Skonfigurujesz też strumieniowanie plikowe z odpornymi na błędy punktami kontrolnymi i zapiszesz wyniki jako tabele Delta. Na koniec będziesz orkiestrować wieloetapowe potoki produkcyjne przy użyciu Databricks Workflows i Lakeflow Declarative Pipelines.

Wymagania wstępne

Introduction to Databricks SQL Introduction to PySpark

Wczytywanie i kształtowanie danych

W tym rozdziale nauczysz się pracować z notebookami Databricks, wczytywać dane CSV do Spark DataFrames oraz kształtować dane przy użyciu PySpark i SQL.

Opis kursu

Zdobądź zaświadczenie o ukończeniu

Dołącz do ponad .css-nklxlk{color:var(--wf-brand--main, #03EF62);}19 milionów kursantów i zacznij Data Transformation with Spark SQL in Databricks już dziś!

Utwórz bezpłatne konto

Rozwijaj swoje umiejętności w zakresie danych dzięki DataCamp dla urządzeń mobilnych

Dołącz do ponad 19 milionów kursantów i zacznij Data Transformation with Spark SQL in Databricks już dziś!