Sariți la conținutul principal
AcasăSpark

Curs

Foundations of PySpark

IntermediarNivel de competențe
Actualizat 03.2025
Learn to implement distributed data management and machine learning in Spark using the PySpark package.
Începe cursul gratuit
SparkData Engineering
4 h
45 Exerciții
3,850 XP
150K+
Certificat de realizare

Creează-ți contul gratuit

Continuă cu GoogleArată mai multe opțiuni

sau


Continuând, accepți Termenii de utilizare, Politica de confidențialitate și faptul că datele tale sunt stocate în SUA.

Îndrăgit de cursanți din mii de companii

Group

Formare pentru o echipă?

Încearcă pentru afaceri

Descrierea cursului

In this course, you'll learn how to use Spark from Python! Spark is a tool for doing parallel computation with large datasets and it integrates well with Python. PySpark is the Python package that makes the magic happen. You'll use this package to work with data about flights from Portland and Seattle. You'll learn to wrangle this data and build a whole machine learning pipeline to predict whether or not flights will be delayed. Get ready to put some Spark in your Python code and dive into the world of high-performance machine learning!

Cerințe prealabile

Introduction to Python
1

Getting to know PySpark

In this chapter, you'll learn how Spark manages data and how can you read and write tables from Python.
Începe capitolul
2

Manipulating data

In this chapter, you'll learn about the pyspark.sql module, which provides optimized data queries to your Spark session.
Începe capitolul
3

Getting started with machine learning pipelines

Foundations of PySpark
Curs
finalizat

Obține diploma de absolvire

Adaugă această acreditare la profilul tău LinkedIn, CV sau rezumat
Distribuie pe rețelele de socializare și în evaluarea ta de performanță
Înscrie-te acum

Alătură-te celor peste 19 de milioane de cursanți și începe Foundations of PySpark astăzi!

Creează-ți contul gratuit

Continuă cu GoogleArată mai multe opțiuni

sau


Continuând, accepți Termenii de utilizare, Politica de confidențialitate și faptul că datele tale sunt stocate în SUA.

Dezvoltați-vă abilitățile de gestionare a datelor cu DataCamp pentru mobil

Fă progrese din mers cu cursurile noastre mobile și provocările zilnice de programare de 5 minute.