Pular para o conteúdo principal
InícioSpark

Curso

Fundamentos do PySpark

IntermediárioNível de habilidade
Atualizado 03/2025
Aprenda a implementar o gerenciamento de dados distribuídos e o machine learning no Spark usando o pacote PySpark.
Iniciar Curso Gratuitamente
SparkData Engineering
4 h
45 Exercícios
3,850 XP
150K+
Certificado de conclusão

Crie sua conta gratuita

Continuar Com O GoogleMostrar mais opções

ou


Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados serão armazenados nos EUA.

Preferido por alunos de milhares de empresas

Group

Training a Team?

Try for Business

Descrição do curso

Neste curso, você aprenderá a usar o Spark no Python! O Spark é uma ferramenta para fazer computação paralela com grandes conjuntos de dados e se integra bem ao Python. O PySpark é o pacote Python que faz a mágica acontecer. Você vai usar esse pacote para trabalhar com dados de voos de Portland e Seattle. Você vai aprender a preparar esses dados e criar um pipeline completo de aprendizado de máquina para prever se os voos sofrerão atrasos ou não. Prepare-se para colocar um pouco de brilho em seus códigos Python com o Spark e mergulhar no mundo do aprendizado de máquina de alto desempenho!

Pré-requisitos

Introduction to Python
1

Getting to know PySpark

In this chapter, you'll learn how Spark manages data and how can you read and write tables from Python.
Iniciar Capítulo
2

Manipulating data

In this chapter, you'll learn about the pyspark.sql module, which provides optimized data queries to your Spark session.
Iniciar Capítulo
3

Getting started with machine learning pipelines

Fundamentos do PySpark
Curso
concluído

Obtenha um certificado de conclusão

Adicione esta credencial ao seu perfil do LinkedIn, currículo ou CV
Compartilhe nas redes sociais e em sua avaliação de desempenho
Inscreva-se Agora

Faça como mais de 19 milhões de alunos e comece Fundamentos do PySpark hoje mesmo!

Crie sua conta gratuita

Continuar Com O GoogleMostrar mais opções

ou


Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados serão armazenados nos EUA.

Desenvolva suas habilidades em dados com o app do DataCamp

Continue progredindo em qualquer lugar com nossos cursos para celular e desafios diários de programação de 5 minutos.