Accéder au contenu principal
AccueilR

Cours

Web scraping en R

IntermédiaireNiveau de compétence
Actualisé 04/2024
Apprenez à collecter et télécharger efficacement des données à partir de n'importe quel site web à l'aide de R.
Commencer Le Cours Gratuitement
RData Preparation4 h13 vidéos45 Exercices3,600 XP14,866Certificat de réussite.

Créez votre compte gratuit

ou

En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données seront hébergées aux États-Unis.

Apprécié par des utilisateurs provenant de milliers d'entreprises

Group

Former 2 personnes ou plus ?

Essayez DataCamp for Business

Description du cours

Vous êtes déjà tombé sur un site web qui affiche beaucoup de données — statistiques, avis produits, prix — dans un format peu adapté à l’analyse de données ? Il arrive que des organismes et autres producteurs publient leurs données dans des tableaux bien structurés. Mais tous ces sites n’offrent pas un bouton de téléchargement. Pas de panique : dans ce cours, vous apprendrez à collecter et télécharger efficacement des données depuis n’importe quel site avec R. Vous verrez comment automatiser le scraping et l’analyse de pages Wikipédia avec les packages rvest et httr. À travers des exercices pratiques, vous consoliderez aussi votre compréhension de HTML et CSS, les briques de base des pages web, pour rendre vos workflows de collecte plus fiables et plus efficaces.

Prérequis

Intermediate RIntroduction to the Tidyverse
1

Introduction to HTML and Web Scraping

In this chapter, you'll be introduced to Hyper Text Markup Language (HTML), a declarative language used to structure modern websites. Using the rvest library, you'll learn how to query simple HTML elements and scrape your first table.
Commencer Le Chapitre
2

Navigation and Selection with CSS

3

Advanced Selection with XPATH

4

Scraping Best Practices

Now that you know how to extract content from web pages, it's time to look behind the curtains. In this final chapter, you’ll learn why HTTP requests are the foundation of every scraping action and how they can be customized to comply with best practices in web scraping.
Commencer Le Chapitre
Web scraping en R
Cours
terminé

Obtenez un certificat de réussite

Ajoutez cette certification à votre profil LinkedIn, à votre CV ou à votre portfolio
Partagez-la sur les réseaux sociaux et dans votre évaluation de performance
S'inscrire Maintenant

Rejoignez plus de 19 millions d'utilisateurs et commencez Web scraping en R dès aujourd'hui !

Créez votre compte gratuit

ou

En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données seront hébergées aux États-Unis.

Apprenez où que vous soyez avec l'application DataCamp

Progressez où que vous soyez grâce à nos cours conçus pour mobile et à nos défis quotidiens de 5 minutes.