Transformarea datelor cu Spark SQL în Databricks

IntermediarNivel de competențe

Actualizat 07.2026

Construiește pipeline-uri de date end-to-end - de la curățare și agregare la streaming și orchestrare.

Descrierea cursului

Ești pregătit să lucrezi cu date reale la scară largă? Acest curs te învață să transformi seturi mari de date folosind Spark SQL și PySpark în Databricks. Vei învăța să modelezi și să cureți date, să rulezi agregări cu join-uri optimizate și să aplici funcții de fereastră pentru analize avansate. Vei configura și streaming bazat pe fișiere cu checkpoint-uri tolerante la erori și vei persista rezultatele ca tabele Delta. La final, vei orchestra pipeline-uri de producție cu mai mulți pași folosind Databricks Workflows și Lakeflow Declarative Pipelines.

Cerințe prealabile

Introduction to Databricks SQL Introduction to PySpark

Încărcarea și modelarea datelor

În acest capitol, vei învăța să lucrezi cu notebook-uri Databricks, să încarci date CSV în Spark DataFrames și să modelezi date folosind PySpark și SQL.

Descrierea cursului

Obține diploma de absolvire

Alătură-te celor peste .css-nklxlk{color:var(--wf-brand--main, #03EF62);}19 de milioane de cursanți și începe Transformarea datelor cu Spark SQL în Databricks astăzi!

Creează-ți contul gratuit

Dezvoltați-vă abilitățile de gestionare a datelor cu DataCamp pentru mobil

Alătură-te celor peste 19 de milioane de cursanți și începe Transformarea datelor cu Spark SQL în Databricks astăzi!