Skip to main content
HomeSparkIntrodução ao PySpark

Introdução ao PySpark

Start Course for Free
4 Horas45 Exercises
133.687 LearnersTrophyStatement of Accomplishment

Create Your Free Account

GoogleLinkedInFacebook

or

By continuing, you accept our Terms of Use, our Privacy Policy and that your data is stored in the USA.
GroupTraining 2 or more people?Try DataCamp For Business

Loved by learners at thousands of companies


Descrição do Curso

Neste curso, você aprenderá a usar o Spark com Python! O Spark é uma ferramenta para fazer computação paralela com grandes conjuntos de dados e se integra bem ao Python. O PySpark é o pacote Python que faz a mágica acontecer. Você usará esse pacote para trabalhar com dados sobre voos de Portland e Seattle. Você aprenderá a lidar com esses dados e a criar um pipeline completo de aprendizado de máquina para prever se os voos sofrerão atrasos ou não. Prepare-se para colocar um pouco de Spark em seu código Python e mergulhar no mundo do aprendizado de máquina de alto desempenho!
For Business

GroupTraining 2 or more people?

Get your team access to the full DataCamp library, with centralized reporting, assignments, projects and more
Try DataCamp for BusinessFor a bespoke solution book a demo.

Nas seguintes faixas

Big Data com PySpark

Ir para a trilha

Cientista de aprendizado de máquina com Python

Ir para a trilha
  1. 1

    Conhecendo o PySpark

    Livre

    Neste capítulo, você aprenderá como o Spark gerencia os dados e como é possível ler e gravar tabelas no Python.

    Reproduzir Capítulo Agora
    Afinal, o que é o Spark?
    50 xp
    Usando o Spark em Python
    50 xp
    Examinando o SparkContext
    100 xp
    Uso de DataFrames
    50 xp
    Criação de uma SparkSession
    100 xp
    Exibição de tabelas
    100 xp
    Você tem alguma dúvida?
    100 xp
    Pandafy a Spark DataFrame
    100 xp
    Coloque um pouco de Spark em seus dados
    100 xp
    Eliminando o intermediário
    100 xp
  2. 3

    Introdução aos pipelines de aprendizado de máquina

    O PySpark tem rotinas de aprendizado de máquina de ponta incorporadas, além de utilitários para criar pipelines completos de aprendizado de máquina. Você aprenderá sobre eles neste capítulo.

    Reproduzir Capítulo Agora
For Business

GroupTraining 2 or more people?

Get your team access to the full DataCamp library, with centralized reporting, assignments, projects and more

Nas seguintes faixas

Big Data com PySpark

Ir para a trilha

Cientista de aprendizado de máquina com Python

Ir para a trilha

Datasets

AirportsFlightsPlanes

Collaborators

Collaborator's avatar
Colin Ricardo
Lore Dirick HeadshotLore Dirick

Director of Data Science Education at Flatiron School

Veja Mais

What do other learners have to say?

Join over 13 million learners and start Introdução ao PySpark today!

Create Your Free Account

GoogleLinkedInFacebook

or

By continuing, you accept our Terms of Use, our Privacy Policy and that your data is stored in the USA.