Accéder au contenu principal
AccueilPython

Cursus

Big Data avec PySpark

Actualisé 05/2026
Maîtrisez la manière de traiter les big data et de les exploiter efficacement avec Apache Spark en utilisant l'API PySpark.
Démarrez Le Programme Gratuitement
PythonImportation et nettoyage des données25 h8,463

Créez votre compte gratuit

ou

En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données seront hébergées aux États-Unis.

Apprécié par des utilisateurs provenant de milliers d'entreprises

Group

Former 2 personnes ou plus ?

Essayez DataCamp for Business

Description du programme

Big Data avec PySpark

Faites progresser vos compétences en matière de données en maîtrisant Apache Spark. En utilisant l'API Python de Spark, PySpark, vous tirerez parti du calcul parallèle avec de grands ensembles de données, et vous vous préparerez à l'apprentissage automatique à haute performance. Du nettoyage des données à la création de fonctionnalités et à la mise en œuvre de modèles d'apprentissage automatique, vous exécuterez des flux de travail de bout en bout avec Spark. Le cursus se termine par la construction d'un moteur de recommandation utilisant le populaire ensemble de données MovieLens et l'ensemble de données Million Songs.

Prérequis

Il n’y a pas de prérequis pour ce programme
  • Course

    1

    Introduction à PySpark

    Maîtrisez PySpark pour traiter, analyser et optimiser de grands volumes de données et produire des analyses performantes.

  • Course

    Learn the gritty details that data scientists are spending 70-80% of their time on; data wrangling and feature engineering.

  • Course

    Apprenez à prédire à partir de données avec Apache Spark grâce aux arbres de décision, régressions logistique et linéaire, ensembles et pipelines.

  • Project

    bonus

    Building a Demand Forecasting Model

    Use PySpark to build an e-commerce forecasting model!

Big Data avec PySpark
6 Cours
Cursus
terminé

Obtenez un certificat de réussite

Ajoutez cette certification à votre profil LinkedIn, à votre CV ou à votre portfolio
Partagez-la sur les réseaux sociaux et dans votre évaluation de performance
S'inscrire Maintenant

Rejoignez plus de 19 millions d'utilisateurs et commencez Big Data avec PySpark dès aujourd'hui !

Créez votre compte gratuit

ou

En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données seront hébergées aux États-Unis.

Apprenez où que vous soyez avec l'application DataCamp

Progressez où que vous soyez grâce à nos cours conçus pour mobile et à nos défis quotidiens de 5 minutes.