Pular para o conteúdo principal
InícioSpark

Curso

Cleaning Data with PySpark

Avançado
Actualizado 03/2025
Learn how to clean data with Apache Spark in Python.
Iniciar curso gratuitamente

Incluído comPremium or Teams

SparkData Preparation4 horas16 vídeos53 Exercícios4,150 XP28,679Certificado de conclusão

Crie sua conta gratuita

ou

Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.
Group

Treinar 2 ou mais pessoas?

Tentar DataCamp for Business

Amado por alunos de milhares de empresas

Descrição do curso

Working with data is tricky - working with millions or even billions of rows is worse. Did you receive some data processing code written on a laptop with fairly pristine data? Chances are you’ve probably been put in charge of moving a basic data process from prototype to production. You may have worked with real world datasets, with missing fields, bizarre formatting, and orders of magnitude more data. Even if this is all new to you, this course helps you learn what’s needed to prepare data processes using Python with Apache Spark. You’ll learn terminology, methods, and some best practices to create a performant, maintainable, and understandable data processing platform.

Pré-requisitos

Intermediate PythonIntroduction to PySpark
1

DataFrame details

Iniciar capítulo
2

Manipulating DataFrames in the real world

Iniciar capítulo
3

Improving Performance

Iniciar capítulo
4

Complex processing and data pipelines

Iniciar capítulo
Cleaning Data with PySpark
Curso
Completo

Obtenha um certificado de conclusão

Adicione esta credencial ao seu perfil, currículo ou currículo do LinkedIn
Compartilhe nas redes sociais e em sua avaliação de desempenho

Incluído comPremium or Teams

Inscreva-se agora

Junte-se a mais 16 milhões de alunos e comece Cleaning Data with PySpark hoje!

Crie sua conta gratuita

ou

Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.