Cours
Introduction à Spark avec sparklyr en R
IntermédiaireNiveau de compétence
Actualisé 10/2024SparkData Engineering4 h4 vidéos50 Exercices4,600 XP19,913Certificat de réussite.
Créez votre compte gratuit
ou
En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données seront hébergées aux États-Unis.Formation de 2 personnes ou plus ?
Essayer DataCamp for BusinessApprécié par des utilisateurs provenant de milliers d'entreprises
Description du cours
Découvrez les avantages de R, Spark et sparklyr
R est principalement optimisé pour vous aider à écrire rapidement et lisiblement du code d'analyse de données. Apache Spark est conçu pour analyser rapidement de très grands ensembles de données. Le package sparklyr vous permet d'écrire du code R dplyr qui s'exécute sur un cluster Spark, vous offrant ainsi le meilleur des deux mondes. Ce cours de quatre heures vous enseigne comment manipuler les DataFrames Spark à l'aide de l'interface dplyr et de l'interface native de Spark, ainsi que comment expérimenter des techniques d'apprentissage automatique.Chargement de données dans Spark et manipulation de DataFrames Spark
Vous commencerez ce cours Spark en découvrant comment Spark et R fonctionnent ensemble et en vous exerçant à charger des données, prêtes à être nettoyées, transformées et analysées. Vous utiliserez les cadres Spark et la syntaxe dplyr pour manipuler vos données en filtrant et en organisant les lignes, ainsi qu'en modifiant et en résumant les colonnes.Explorez l'analyse des mégadonnées avec Spark MLib
Ce cours vise à développer vos compétences et votre assurance dans l'analyse de vastes ensembles de données. Les derniers chapitres vous présentent les fonctionnalités de transformation des données d'apprentissage automatique de Spark et vous offrent la possibilité de mettre en pratique les routines d'apprentissage automatique de sparklyr en l'utilisant pour faire des prédictions à l'aide d'arbres boostés par gradient et de forêts aléatoires.Conditions préalables
Supervised Learning in R: Regression1
Light My Fire : premiers pas avec Spark en syntaxe dplyr
2
Outils du métier : utilisation avancée de dplyr
3
Passer en natif : manipuler les DataFrames Spark avec l’interface native
4
Étude de cas : apprendre à être une machine : exécuter des modèles de Machine Learning sur Spark
Introduction à Spark avec sparklyr en R
Cours terminé
Obtenez un certificat de réussite
Ajoutez ces informations d’identification à votre profil LinkedIn, à votre CV ou à votre CVPartagez-le sur les réseaux sociaux et dans votre évaluation de performance
Inclus avecPremium or Teams
S'inscrire MaintenantRejoignez plus de 18 millions d'utilisateurs et commencez Introduction à Spark avec sparklyr en R dès aujourd'hui !
Créez votre compte gratuit
ou
En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données seront hébergées aux États-Unis.