Web Scraping en Python

IntermédiaireNiveau de compétence

Actualisé 03/2026

Apprenez à récupérer et à analyser des informations provenant d'internet à l'aide de la bibliothèque Python scrapy.

Description du cours

La capacité à construire des outils capables de récupérer et d'analyser des informations stockées sur l'internet a été et continue d'être précieuse dans de nombreux domaines de la science des données. Dans ce cours, vous apprendrez à naviguer et à analyser le code html, et à construire des outils pour explorer automatiquement les sites web. Bien que notre scraping soit réalisé à l'aide de la bibliothèque polyvalente Python scrapy, de nombreuses techniques que vous apprenez dans ce cours peuvent également être appliquées à d'autres bibliothèques Python populaires, notamment BeautifulSoup et Selenium. A l'issue de ce cours, vous disposerez d'un modèle mental solide de la structure html, vous serez capable de construire des outils pour analyser le code html et accéder aux informations souhaitées, et de créer un spider scrapy simple pour explorer le web à grande échelle.

Prérequis

Intermediate Python

Introduction to HTML

Learn the structure of HTML. We begin by explaining why web scraping can be a valuable addition to your data science toolbox and then delving into some basics of HTML. We end the chapter by giving a brief introduction on XPath notation, which is used to navigate the elements within HTML code.

Web Scraping Overview

50 XP

Web-scraping is not nonsense!

50 XP

HyperText Markup Language

Description du cours

Obtenez un certificat de réussite

Rejoignez plus de .css-nklxlk{color:var(--wf-brand--main, #03EF62);}19 millions d'utilisateurs et commencez Web Scraping en Python dès aujourd'hui !

Créez votre compte gratuitement

Apprenez où que vous soyez avec l'application DataCamp

Rejoignez plus de 19 millions d'utilisateurs et commencez Web Scraping en Python dès aujourd'hui !