Accéder au contenu principal
AccueilSpark

Cours

Apprentissage automatique avec PySpark

AvancéNiveau de compétence
Actualisé 11/2025
Apprenez à prédire à partir de données avec Apache Spark grâce aux arbres de décision, régressions logistique et linéaire, ensembles et pipelines.
Commencer le cours gratuitement
SparkMachine Learning
4 h
16 vidéos
56 Exercices
4,550 XP
29,682
Certificat de formation

Créez votre compte gratuitement

Continuer avec GoogleAfficher plus d’options

ou


En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données seront hébergées aux États-Unis.

Apprécié par des utilisateurs provenant de milliers d'entreprises

Group

Former une équipe ?

Essayez pour les entreprises

Description du cours

Apprenez à utiliser Apache Spark pour l'apprentissage automatique (Machine Learning)

Spark est un outil puissant et généraliste pour travailler avec les Big Data. Spark gère de manière transparente la répartition des tâches de calcul sur un cluster. Cela signifie que les opérations sont rapides, mais cela vous permet également de vous concentrer sur l'analyse plutôt que de vous préoccuper des détails techniques. Dans ce cours, vous apprendrez à intégrer des données dans Spark, puis à vous plonger dans les trois algorithmes fondamentaux de Spark Machine Learning : Régression linéaire, régression logistique/classificateurs et création de pipelines.

Construire et tester des arbres de décision

La construction de vos propres arbres de décision est un excellent moyen de commencer à explorer les modèles d'apprentissage automatique. Vous utiliserez un algorithme appelé "partitionnement récursif" pour diviser les données en deux classes et trouver un prédicteur dans vos données qui aboutit à la division la plus informative des deux classes, et répéter cette action avec d'autres nœuds. Vous pouvez ensuite utiliser votre arbre de décision pour faire des prévisions avec de nouvelles données.

Maîtriser la régression logistique et linéaire dans PySpark

La régression logistique et la régression linéaire sont des techniques d'apprentissage automatique essentielles prises en charge par PySpark. Vous apprendrez à construire et à évaluer des modèles de régression logistique, avant de passer à la création de modèles de régression linéaire pour vous aider à affiner vos prédicteurs en ne retenant que les options les plus pertinentes.

À la fin du cours, vous serez confiant dans l'application de vos nouvelles connaissances en matière d'apprentissage automatique, grâce aux tâches pratiques et aux ensembles de données d'entraînement que vous trouverez tout au long du cours.

Prérequis

Supervised Learning with scikit-learnIntroduction to PySpark
1

Introduction

Spark est un cadre de travail permettant de travailler avec des données massives (Big Data). Dans ce chapitre, vous aborderez quelques notions de base sur Spark et l'apprentissage automatique. Vous découvrirez ensuite comment vous connecter à Spark à l'aide de Python et charger des données CSV.
Commencer le chapitre
2

Classification

Maintenant que vous êtes familiarisé avec l'introduction de données dans Spark, vous allez passer à la construction de deux types de modèles de classification : Arbres de décision et régression logistique. Vous découvrirez également quelques approches de la préparation des données.
Commencer le chapitre
Apprentissage automatique avec PySpark
Cours
terminé

Obtenez un certificat de réussite

Ajoutez cette certification à votre profil LinkedIn, à votre CV ou à votre portfolio
Partagez-la sur les réseaux sociaux et dans votre évaluation de performance
S'inscrire maintenant

Rejoignez plus de 19 millions d'utilisateurs et commencez Apprentissage automatique avec PySpark dès aujourd'hui !

Créez votre compte gratuitement

Continuer avec GoogleAfficher plus d’options

ou


En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données seront hébergées aux États-Unis.

Apprenez où que vous soyez avec l'application DataCamp

Progressez où que vous soyez grâce à nos cours conçus pour mobile et à nos défis quotidiens de 5 minutes.