Transformação de Dados com Spark SQL no Databricks

IntermediárioNível de habilidade

Atualizado 07/2026

Crie pipelines de dados de ponta a ponta - da limpeza e agregação ao streaming e à orquestração.

Descrição do curso

Pronto para lidar com dados do mundo real em escala? Este curso ensina você a transformar grandes conjuntos de dados usando Spark SQL e PySpark no Databricks. Aprenda a modelar e limpar dados, executar agregações com joins otimizados e aplicar funções de janela para análises avançadas. Você também vai configurar streaming baseado em arquivos com checkpoints tolerantes a falhas e persistir resultados como tabelas Delta. Ao final, você estará orquestrando pipelines de produção de múltiplas etapas com Databricks Workflows e Lakeflow Declarative Pipelines.

Pré-requisitos

Introduction to Databricks SQL Introduction to PySpark

Carregando e modelando dados

Neste capítulo, você vai aprender a trabalhar com notebooks do Databricks, carregar dados CSV em DataFrames do Spark e modelar dados usando PySpark e SQL.

Descrição do curso

Obtenha um certificado de conclusão

Faça como mais de .css-nklxlk{color:var(--wf-brand--main, #03EF62);}19 milhões de alunos e comece Transformação de Dados com Spark SQL no Databricks hoje mesmo!

Crie sua conta gratuita

Desenvolva suas habilidades em dados com o app do DataCamp

Faça como mais de 19 milhões de alunos e comece Transformação de Dados com Spark SQL no Databricks hoje mesmo!