Accéder au contenu principal
AccueilR

Cours

Traitement de données à grande échelle en R

AvancéNiveau de compétence
Actualisé 08/2024
Apprenez à écrire du code évolutif pour travailler avec des données volumineuses dans R à l'aide des packages bigmemory et iotools.
Commencer le cours gratuitement
RProgramming
4 h
15 vidéos
49 Exercices
3,950 XP
6,148
Certificat de formation

Créez votre compte gratuitement

Continuer avec GoogleAfficher plus d’options

ou


En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données seront hébergées aux États-Unis.

Apprécié par des utilisateurs provenant de milliers d'entreprises

Group

Former une équipe ?

Essayez pour les entreprises

Description du cours

Les jeux de données dépassent souvent la RAM disponible, ce qui pose problème aux programmeurs R, car par défaut toutes les variables sont stockées en mémoire. Vous allez apprendre des outils pour traiter, explorer et analyser les données directement depuis le disque. Vous mettrez également en œuvre l’approche « split-apply-combine » et verrez comment écrire du code évolutif avec les packages bigmemory et iotools. Dans ce cours, vous utiliserez les données de la Federal Housing Finance Agency, un jeu de données public répertoriant tous les prêts hypothécaires détenus ou titrisés par la Federal National Mortgage Association (Fannie Mae) et la Federal Home Loan Mortgage Corporation (Freddie Mac) de 2009 à 2015.

Prérequis

Writing Efficient R Code
1

Working with increasingly large data sets

In this chapter, we cover the reasons you need to apply new techniques when data sets are larger than available RAM. We show that importing and exporting data using the base R functions can be slow and some easy ways to remedy this. Finally, we introduce the bigmemory package.
Commencer le chapitre
2

Processing and Analyzing Data with bigmemory

Now that you've got some experience using bigmemory, we're going to go through some simple data exploration and analysis techniques. In particular, we'll see how to create tables and implement the split-apply-combine approach.
Commencer le chapitre
Traitement de données à grande échelle en R
Cours
terminé

Obtenez un certificat de réussite

Ajoutez cette certification à votre profil LinkedIn, à votre CV ou à votre portfolio
Partagez-la sur les réseaux sociaux et dans votre évaluation de performance
S'inscrire maintenant

Rejoignez plus de 19 millions d'utilisateurs et commencez Traitement de données à grande échelle en R dès aujourd'hui !

Créez votre compte gratuitement

Continuer avec GoogleAfficher plus d’options

ou


En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données seront hébergées aux États-Unis.

Apprenez où que vous soyez avec l'application DataCamp

Progressez où que vous soyez grâce à nos cours conçus pour mobile et à nos défis quotidiens de 5 minutes.