Accéder au contenu principal
AccueilSpark

Cours

Introduction à Spark avec sparklyr en R

IntermédiaireNiveau de compétence
Actualisé 10/2024
Apprenez à effectuer des analyses de mégadonnées à l'aide de Spark et du package sparklyr dans R, et découvrez Spark MLIb en seulement 4 heures.
Commencer Le Cours Gratuitement
SparkData Engineering
4 h
4 vidéos
50 Exercices
4,600 XP
20,185
Certificat de réussite.

Créez votre compte gratuit

ou

En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données seront hébergées aux États-Unis.

Apprécié par des utilisateurs provenant de milliers d'entreprises

Group

Training a Team?

Try for Business

Description du cours

Découvrez les avantages de R, Spark et sparklyr

R est principalement optimisé pour vous aider à écrire rapidement et lisiblement du code d'analyse de données. Apache Spark est conçu pour analyser rapidement de très grands ensembles de données. Le package sparklyr vous permet d'écrire du code R dplyr qui s'exécute sur un cluster Spark, vous offrant ainsi le meilleur des deux mondes. Ce cours de quatre heures vous enseigne comment manipuler les DataFrames Spark à l'aide de l'interface dplyr et de l'interface native de Spark, ainsi que comment expérimenter des techniques d'apprentissage automatique.

Chargement de données dans Spark et manipulation de DataFrames Spark

Vous commencerez ce cours Spark en découvrant comment Spark et R fonctionnent ensemble et en vous exerçant à charger des données, prêtes à être nettoyées, transformées et analysées. Vous utiliserez les cadres Spark et la syntaxe dplyr pour manipuler vos données en filtrant et en organisant les lignes, ainsi qu'en modifiant et en résumant les colonnes.

Explorez l'analyse des mégadonnées avec Spark MLib

Ce cours vise à développer vos compétences et votre assurance dans l'analyse de vastes ensembles de données. Les derniers chapitres vous présentent les fonctionnalités de transformation des données d'apprentissage automatique de Spark et vous offrent la possibilité de mettre en pratique les routines d'apprentissage automatique de sparklyr en l'utilisant pour faire des prédictions à l'aide d'arbres boostés par gradient et de forêts aléatoires.

Prérequis

Supervised Learning in R: Regression
1

Light My Fire: Starting To Use Spark With dplyr Syntax

In which you learn how Spark and R complement each other, how to get data to and from Spark, and how to manipulate Spark data frames using dplyr syntax.
Commencer Le Chapitre
2

Tools of the Trade: Advanced dplyr Usage

In which you learn more about using the dplyr interface to Spark, including advanced field selection, calculating groupwise statistics, and joining data frames.
Commencer Le Chapitre
Introduction à Spark avec sparklyr en R
Cours
terminé

Obtenez un certificat de réussite

Ajoutez cette certification à votre profil LinkedIn, à votre CV ou à votre portfolio
Partagez-la sur les réseaux sociaux et dans votre évaluation de performance
S'inscrire Maintenant

Rejoignez plus de 19 millions d'utilisateurs et commencez Introduction à Spark avec sparklyr en R dès aujourd'hui !

Créez votre compte gratuit

ou

En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données seront hébergées aux États-Unis.

Apprenez où que vous soyez avec l'application DataCamp

Progressez où que vous soyez grâce à nos cours conçus pour mobile et à nos défis quotidiens de 5 minutes.