Transformación de datos con Spark SQL en Databricks

IntermedioNivel de habilidad

Actualizado 7/2026

Crea canalizaciones de datos de extremo a extremo: desde la limpieza y la agregación hasta el streaming y la orquestación.

Descripción del curso

¿Listo para trabajar con datos reales a gran escala? En este curso aprenderás a transformar grandes conjuntos de datos con Spark SQL y PySpark en Databricks. Verás cómo dar forma y limpiar datos, ejecutar agregaciones con joins optimizados y aplicar funciones de ventana para analítica avanzada. También configurarás streaming basado en archivos con checkpoints tolerantes a fallos y persistirás resultados como tablas Delta. Al finalizar, orquestarás canalizaciones de producción de varios pasos con Databricks Workflows y Lakeflow Declarative Pipelines.

Requisitos previos

Introduction to Databricks SQL Introduction to PySpark

Carga y modelado de datos

En este capítulo aprenderás a trabajar con notebooks de Databricks, cargar datos CSV en DataFrames de Spark y dar forma a los datos usando PySpark y SQL.

Descripción del curso

Obtener certificado de logros

¡Únete a .css-nklxlk{color:var(--wf-brand--main, #03EF62);}19 millones de estudiantes y empieza Transformación de datos con Spark SQL en Databricks hoy mismo!

Crea tu cuenta gratuita

Desarrolla tus habilidades de datos con la aplicación móvil de DataCamp

¡Únete a 19 millones de estudiantes y empieza Transformación de datos con Spark SQL en Databricks hoy mismo!