Trasformazione dei dati con Spark SQL in Databricks

IntermedioLivello di competenza

Aggiornato 07/2026

Crea pipeline dati end-to-end: da pulizia e aggregazione a streaming e orchestrazione.

Descrizione del corso

Pronto a gestire dati reali su larga scala? In questo corso imparerai a trasformare grandi insiemi di dati usando Spark SQL e PySpark in Databricks. Impara a modellare e pulire i dati, eseguire aggregazioni con join ottimizzati e applicare window function per analisi avanzate. Imposterai anche lo streaming basato su file con checkpoint tolleranti ai guasti e persisterai i risultati come tabelle Delta. Al termine, orchestrerai pipeline di produzione multi-step con Databricks Workflows e Lakeflow Declarative Pipelines.

Prerequisiti

Introduction to Databricks SQL Introduction to PySpark

Caricamento e modellazione dei dati

In questo capitolo imparerai a lavorare con i notebook di Databricks, caricare dati CSV in Spark DataFrame e modellare i dati usando PySpark e SQL.

Descrizione del corso

Ottieni Attestato di conseguimento

Unisciti a oltre .css-nklxlk{color:var(--wf-brand--main, #03EF62);}19 milioni di studenti e inizia Trasformazione dei dati con Spark SQL in Databricks oggi!

Crea il tuo account gratuito

Aumenta le tue competenze sui dati con l'app di DataCamp

Unisciti a oltre 19 milioni di studenti e inizia Trasformazione dei dati con Spark SQL in Databricks oggi!