Cours
Introduction à Spark avec sparklyr en R
IntermédiaireNiveau de compétence
Actualisé 10/2024SparkData Engineering4 h4 vidéos50 Exercices4,600 XP20,112Certificat de réussite.
Créez votre compte gratuit
ou
En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données seront hébergées aux États-Unis.Apprécié par des utilisateurs provenant de milliers d'entreprises
Former 2 personnes ou plus ?
Essayez DataCamp for BusinessDescription du cours
Découvrez les avantages de R, Spark et sparklyr
R est principalement optimisé pour vous aider à écrire rapidement et lisiblement du code d'analyse de données. Apache Spark est conçu pour analyser rapidement de très grands ensembles de données. Le package sparklyr vous permet d'écrire du code R dplyr qui s'exécute sur un cluster Spark, vous offrant ainsi le meilleur des deux mondes. Ce cours de quatre heures vous enseigne comment manipuler les DataFrames Spark à l'aide de l'interface dplyr et de l'interface native de Spark, ainsi que comment expérimenter des techniques d'apprentissage automatique.Chargement de données dans Spark et manipulation de DataFrames Spark
Vous commencerez ce cours Spark en découvrant comment Spark et R fonctionnent ensemble et en vous exerçant à charger des données, prêtes à être nettoyées, transformées et analysées. Vous utiliserez les cadres Spark et la syntaxe dplyr pour manipuler vos données en filtrant et en organisant les lignes, ainsi qu'en modifiant et en résumant les colonnes.Explorez l'analyse des mégadonnées avec Spark MLib
Ce cours vise à développer vos compétences et votre assurance dans l'analyse de vastes ensembles de données. Les derniers chapitres vous présentent les fonctionnalités de transformation des données d'apprentissage automatique de Spark et vous offrent la possibilité de mettre en pratique les routines d'apprentissage automatique de sparklyr en l'utilisant pour faire des prédictions à l'aide d'arbres boostés par gradient et de forêts aléatoires.Prérequis
Supervised Learning in R: Regression1
Light My Fire: Starting To Use Spark With dplyr Syntax
In which you learn how Spark and R complement each other, how to get data to and from Spark, and how to manipulate Spark data frames using dplyr syntax.
2
Tools of the Trade: Advanced dplyr Usage
In which you learn more about using the
dplyr interface to Spark, including advanced field selection, calculating groupwise statistics, and joining data frames.3
Going Native: Use The Native Interface to Manipulate Spark DataFrames
In which you learn about Spark's machine learning data transformation features, and functionality for manipulating native DataFrames.
4
Case Study: Learning to be a Machine: Running Machine Learning Models on Spark
A case study in which you learn to use
sparklyr's machine learning routines, by predicting the year in which a song was released.Introduction à Spark avec sparklyr en R
Cours terminé
Obtenez un certificat de réussite
Ajoutez cette certification à votre profil LinkedIn, à votre CV ou à votre portfolioPartagez-la sur les réseaux sociaux et dans votre évaluation de performance
Inclus avecPremium or Teams
S'inscrire MaintenantRejoignez plus de 19 millions d'utilisateurs et commencez Introduction à Spark avec sparklyr en R dès aujourd'hui !
Créez votre compte gratuit
ou
En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données seront hébergées aux États-Unis.