Chuyển đến nội dung chính
Trang chủPython

Khóa học

Web Scraping với Python

Trung cấpTrình độ kỹ năng
Đã cập nhật tháng 03, 2026
Bắt Đầu Khóa Học Miễn Phí
PythonData Preparation4 giờ17 video56 Bài tập4,500 XP92,329Giấy Chứng Nhận Thành Tích

Tạo tài khoản miễn phí

hoặc

Bằng cách tiếp tục, bạn chấp nhận Điều khoản sử dụng, Chính sách bảo mật và việc dữ liệu của bạn được lưu trữ tại Hoa Kỳ.

Được yêu thích bởi học viên tại hàng nghìn công ty

Group

Đào tạo 2 người trở lên?

Thử DataCamp for Business

Mô tả khóa học

Khả năng xây dựng các công cụ để truy xuất và phân tích thông tin trên internet đã, đang và sẽ tiếp tục rất hữu ích trong nhiều nhánh của khoa học dữ liệu. Trong khóa học này, bạn sẽ học cách điều hướng và phân tích mã HTML, và xây dựng công cụ để tự động thu thập dữ liệu từ website. Mặc dù chúng ta sẽ thực hành scraping bằng thư viện Python linh hoạt là scrapy, nhiều kỹ thuật bạn học được cũng có thể áp dụng cho các thư viện Python phổ biến khác như BeautifulSoup và Selenium. Sau khi hoàn thành khóa học, bạn sẽ có mô hình tư duy vững chắc về cấu trúc HTML, có thể xây dựng công cụ để phân tích mã HTML và truy cập thông tin mong muốn, và tạo các spider scrapy đơn giản để thu thập dữ liệu web ở quy mô lớn.

Điều kiện tiên quyết

Intermediate Python
1

Introduction to HTML

Learn the structure of HTML. We begin by explaining why web scraping can be a valuable addition to your data science toolbox and then delving into some basics of HTML. We end the chapter by giving a brief introduction on XPath notation, which is used to navigate the elements within HTML code.
Bắt Đầu Chương
2

XPaths and Selectors

3

CSS Locators, Chaining, and Responses

Learn CSS Locator syntax and begin playing with the idea of chaining together CSS Locators with XPath. We also introduce Response objects, which behave like Selectors but give us extra tools to mobilize our scraping efforts across multiple websites.
Bắt Đầu Chương
4

Spiders

Learn to create web crawlers with scrapy. These scrapy spiders will crawl the web through multiple pages, following links to scrape each of those pages automatically according to the procedures we've learned in the previous chapters.
Bắt Đầu Chương
Web Scraping với Python
Hoàn
Thành

Nhận Giấy Chứng Nhận Hoàn Thành

Thêm chứng chỉ này vào hồ sơ LinkedIn, CV hoặc sơ yếu lý lịch của ban
Chia sẻ trên mạng xã hội và trong đánh giá hiệu suất của ban
Đăng Ký Ngay

Tham gia cùng hơn 19 triệu học viên và bắt đầu Web Scraping với Python ngay hôm nay!

Tạo tài khoản miễn phí

hoặc

Bằng cách tiếp tục, bạn chấp nhận Điều khoản sử dụng, Chính sách bảo mật và việc dữ liệu của bạn được lưu trữ tại Hoa Kỳ.

Phát triển kỹ năng dữ liệu với DataCamp cho thiết bị di động

Tiến bộ mọi lúc mọi nơi với các khóa học cho thiết bị di động và thử thách lập trình 5 phút hằng ngày.