Cours
Introduction à PySpark
IntermédiaireNiveau de compétence
Actualisé 03/2025
SparkData Engineering4 h45 Exercices3,850 XP150K+Certificat de formation
Créez votre compte gratuitement
Continuer Avec GoogleAfficher plus d’optionsou
En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données seront hébergées aux États-Unis.
Apprécié par des utilisateurs provenant de milliers d'entreprises
Former une équipe ?
Essayez pour les entreprisesDescription du cours
Prérequis
Introduction to Python1
Getting to know PySpark
In this chapter, you'll learn how Spark manages data and how can you read and write tables from Python.
2
Manipulating data
In this chapter, you'll learn about the pyspark.sql module, which provides optimized data queries to your Spark session.
3
Getting started with machine learning pipelines
PySpark has built-in, cutting-edge machine learning routines, along with utilities to create full machine learning pipelines. You'll learn about them in this chapter.
4
Model tuning and selection
In this last chapter, you'll apply what you've learned to create a model that predicts which flights will be delayed.
Introduction à PySpark
Cours terminé
Obtenez un certificat de réussite
Ajoutez cette certification à votre profil LinkedIn, à votre CV ou à votre portfolioPartagez-la sur les réseaux sociaux et dans votre évaluation de performanceS'inscrire Maintenant
Rejoignez plus de 19 millions d'utilisateurs et commencez Introduction à PySpark dès aujourd'hui !
Créez votre compte gratuitement
Continuer Avec GoogleAfficher plus d’optionsou
En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données seront hébergées aux États-Unis.
Apprenez où que vous soyez avec l'application DataCamp
Progressez où que vous soyez grâce à nos cours conçus pour mobile et à nos défis quotidiens de 5 minutes.