Cours
Introduction à Spark avec sparklyr en R
IntermédiaireNiveau de compétence
Actualisé 10/2024SparkData Engineering4 h4 vidéos50 Exercices4,600 XP19,974Certificat de réussite.
Créez votre compte gratuit
ou
En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données seront hébergées aux États-Unis.Apprécié par des utilisateurs provenant de milliers d'entreprises
Former 2 personnes ou plus ?
Essayez DataCamp for BusinessDescription du cours
Découvrez les avantages de R, Spark et sparklyr
R est principalement optimisé pour vous aider à écrire rapidement et lisiblement du code d'analyse de données. Apache Spark est conçu pour analyser rapidement de très grands ensembles de données. Le package sparklyr vous permet d'écrire du code R dplyr qui s'exécute sur un cluster Spark, vous offrant ainsi le meilleur des deux mondes. Ce cours de quatre heures vous enseigne comment manipuler les DataFrames Spark à l'aide de l'interface dplyr et de l'interface native de Spark, ainsi que comment expérimenter des techniques d'apprentissage automatique.Chargement de données dans Spark et manipulation de DataFrames Spark
Vous commencerez ce cours Spark en découvrant comment Spark et R fonctionnent ensemble et en vous exerçant à charger des données, prêtes à être nettoyées, transformées et analysées. Vous utiliserez les cadres Spark et la syntaxe dplyr pour manipuler vos données en filtrant et en organisant les lignes, ainsi qu'en modifiant et en résumant les colonnes.Explorez l'analyse des mégadonnées avec Spark MLib
Ce cours vise à développer vos compétences et votre assurance dans l'analyse de vastes ensembles de données. Les derniers chapitres vous présentent les fonctionnalités de transformation des données d'apprentissage automatique de Spark et vous offrent la possibilité de mettre en pratique les routines d'apprentissage automatique de sparklyr en l'utilisant pour faire des prédictions à l'aide d'arbres boostés par gradient et de forêts aléatoires.Prérequis
Supervised Learning in R: Regression1
Light My Fire : premiers pas avec Spark en syntaxe dplyr
Vous découvrez comment Spark et R se complètent, comment faire circuler des données vers et depuis Spark, et comment manipuler des data frames Spark avec la syntaxe dplyr.
2
Outils du métier : utilisation avancée de dplyr
Vous approfondissez l’utilisation de l’interface
dplyr avec Spark : sélection avancée de champs, calcul de statistiques par groupe et jointure de data frames.3
Passer en natif : manipuler les DataFrames Spark avec l’interface native
Vous découvrez les fonctionnalités de transformation de données pour le Machine Learning dans Spark, ainsi que les fonctions pour manipuler des DataFrames natifs.
4
Étude de cas : apprendre à être une machine : exécuter des modèles de Machine Learning sur Spark
Une étude de cas dans laquelle vous apprenez à utiliser les routines de Machine Learning de
sparklyr, en prédisant l’année de sortie d’une chanson.Introduction à Spark avec sparklyr en R
Cours terminé
Obtenez un certificat de réussite
Ajoutez cette certification à votre profil LinkedIn, à votre CV ou à votre portfolioPartagez-la sur les réseaux sociaux et dans votre évaluation de performance
Inclus avecPremium or Teams
S'inscrire MaintenantRejoignez plus de 19 millions d'utilisateurs et commencez Introduction à Spark avec sparklyr en R dès aujourd'hui !
Créez votre compte gratuit
ou
En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données seront hébergées aux États-Unis.