コース説明

インターネット上に蓄積された情報を取得・解析するツールを構築する力は、データサイエンスのさまざまな場面で今も価値があります。本コースでは、HTMLコードの構造を理解して操作し、ウェブサイトを自動でクロールするツールを作成する方法を学びます。スクレイピングには多用途なPythonライブラリであるscrapyを使用しますが、ここで学ぶ多くのテクニックはBeautifulSoupやSeleniumなど他の一般的なPythonライブラリにも応用できます。コース修了時には、HTML構造の明確なメンタルモデルを持ち、HTMLコードを解析して目的の情報にアクセスするツールを作成し、規模の大きなウェブクロールのためのシンプルなscrapyスパイダーを構築できるようになります。

前提条件

Intermediate Python

Introduction to HTML

Learn the structure of HTML. We begin by explaining why web scraping can be a valuable addition to your data science toolbox and then delving into some basics of HTML. We end the chapter by giving a brief introduction on XPath notation, which is used to navigate the elements within HTML code.

Web Scraping Overview

50 XP

Web-scraping is not nonsense!

50 XP

HyperText Markup Language

コース説明

修了証明書を取得

.css-nklxlk{color:var(--wf-brand--main, #03EF62);}19百万人を超える学習者と共にPythonで学ぶWebスクレイピングを始めましょう！

無料アカウントを作成

DataCamp for Mobileでデータスキルを磨きましょう

19百万人を超える学習者と共にPythonで学ぶWebスクレイピングを始めましょう！