Curso
Fundamentos de Big Data com PySpark
AvançadoNível de habilidade
Atualizado 02/2025
SparkData Engineering4 h16 vídeos55 Exercícios4,600 XP65,280Declaração de realização
Crie sua conta gratuita
Continuar com o GoogleMostrar mais opçõesou
Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados serão armazenados nos EUA.
Preferido por alunos de milhares de empresas
Treinando uma equipe?
Experimente para EmpresasDescrição do curso
Pré-requisitos
Introduction to Python1
Introdução à análise de Big Data com o Spark
Este capítulo apresenta o empolgante mundo do Big Data, bem como os vários conceitos e estruturas diferentes para o processamento de Big Data. Você entenderá por que o Apache Spark é considerado o melhor framework para BigData.
2
Programação nos RDDs do PySpark
A principal abstração que o Spark oferece é um conjunto de dados distribuídos resilientes (RDD), que é o tipo de dados fundamental e a espinha dorsal desse mecanismo. Este capítulo apresenta os RDDs e mostra como eles podem ser criados e executados usando transformações e ações do RDD.
3
PySpark SQL e DataFrames
Neste capítulo, você aprenderá sobre o Spark SQL, que é um módulo do Spark para processamento de dados estruturados. Ele fornece uma abstração de programação chamada DataFrames e também pode atuar como um mecanismo de consulta distribuído SQL. Este capítulo mostra como o Spark SQL permite que você use DataFrames em Python.
4
Aprendizado de máquina com PySpark MLlib
PySpark MLlib é a biblioteca de aprendizado de máquina escalável do Apache Spark em Python, que consiste em algoritmos e utilitários comuns de aprendizado. Ao longo deste último capítulo, você aprenderá algoritmos importantes de aprendizado de máquina. Você criará um mecanismo de recomendação de filmes e um filtro de spam e usará o k-means clustering.
Fundamentos de Big Data com PySpark
Curso concluído
Obtenha um certificado de conclusão
Adicione esta credencial ao seu perfil do LinkedIn, currículo ou CVCompartilhe nas redes sociais e em sua avaliação de desempenhoInscreva-se agora
Faça como mais de 19 milhões de alunos e comece Fundamentos de Big Data com PySpark hoje mesmo!
Crie sua conta gratuita
Continuar com o GoogleMostrar mais opçõesou
Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados serão armazenados nos EUA.
Desenvolva suas habilidades em dados com o app do DataCamp
Continue progredindo em qualquer lugar com nossos cursos para celular e desafios diários de programação de 5 minutos.