본문으로 바로가기

강의

Python으로 하는 웹 스크레이핑

중급기술 수준

업데이트됨 2026. 3.

Python 라이브러리 Scrapy를 사용하여 인터넷에서 정보를 수집하고 파싱하는 방법을 배우세요.

무료로 강의 시작

PythonData Preparation

4시간

17 동영상

56 연습 문제

4,500 XP

93,096

성취 증명서

수천 개 기업의 학습자들이 사랑하는

팀을 교육하시나요?

비즈니스용으로 체험해 보세요

강의 설명

인터넷 전반에 저장된 정보를 가져오고 파싱하는 도구를 만드는 능력은 데이터 사이언스의 여러 분야에서 과거에도, 지금도 매우 가치가 있습니다. 이 과정에서는 HTML 코드를 탐색하고 파싱하는 방법을 배우고, 웹사이트를 자동으로 크롤링하는 도구를 만들어 봅니다. 스크레이핑은 다재다능한 Python 라이브러리인 scrapy로 진행하지만, 이 과정에서 배우는 많은 기법은 BeautifulSoup과 Selenium을 비롯한 다른 인기 있는 Python 라이브러리에도 적용할 수 있습니다. 과정을 마치면 HTML 구조에 대한 견고한 정신 모델을 갖추게 되고, HTML 코드를 파싱해 원하는 정보를 가져오는 도구를 만들 수 있으며, 대규모 웹 크롤링을 수행하는 간단한 scrapy 스파이더도 작성할 수 있게 됩니다.

선수 조건

Intermediate Python

1

HTML 소개

HTML의 구조를 배웁니다. 먼저 웹 스크레이핑이 데이터 사이언스 도구 상자에 왜 유용한지 설명한 뒤, HTML의 기본을 살펴봅니다. 마지막에는 HTML 코드 내부 요소를 탐색하는 데 쓰이는 XPath 표기법을 간단히 소개합니다.

웹 스크레이핑 개요

웹 스크레이핑은 허튼소리가 아닙니다!

HyperText Markup Language

HTML 트리 길게 풀어 쓰기 내비게이션

트리에서 HTML로

클래스를 잘 써봅시다

href 찾기

XPath 빠른 학습

Where am I?

이제 P를 선택해 볼까요

품격 있는 span

2

XPath와 셀렉터

XPath 문법을 활용해 scrapy 셀렉터를 탐색해 보세요. 이 두 가지 개념은 HTML 문서를 스크레이핑할 수 있는 단계로 여러분을 이끌어 줍니다.

야생에서 요소 개수 세기

Body의 하위 요소 찾기

Choose DataCamp!

조금 다른 XPath

Where it's @

클래스 정확히 확인하기

하이퍼(링크) 활성화

비밀 링크

셀렉터 객체

XPath 체이닝

이 연습 문제, div로 나눠 보기

소스의 근원

검사로 찾는 강좌 클래스

Selector 요청하기

3

CSS 로케이터, 체이닝, 그리고 Response

CSS 로케이터 문법을 배우고, CSS 로케이터를 XPath와 체이닝하는 아이디어를 실습해 봅니다. 또한 여러 웹사이트에 걸쳐 스크레이핑을 확장하는 데 유용한 추가 도구를 제공하면서 셀렉터처럼 동작하는 Response 객체를 소개합니다.

XPath에서 CSS로

CSS 로케이터로 가는 (X)Path

이 강의에서 "a" 받기

CSS 와일드카드

CSS 속성과 텍스트 선택

`href`에 걸렸네요

최상위 텍스트

모든 단계의 텍스트

응답해 주세요!

Response로 밝혀내기

Selector로 Response 다루기

선택 결과에서 다시 선택하기

설문조사

제목 찾기

자식 요소로 스크레이핑하기

4

스파이더

scrapy로 웹 크롤러를 만드는 방법을 배웁니다. 이 scrapy 스파이더는 이전 장에서 익힌 절차에 따라 링크를 따라가며 여러 페이지를 자동으로 크롤링합니다.

첫 번째 Spider 만들기

Spider 상속하기

URL 던져 넣기

요청 시작하기

Self Referencing is Classy

Start Requests로 시작하기

파싱과 크롤링

크롤러 시간

이제 실행해 볼 시간

DataCamp 설명

캡스톤 크롤러

대미를 장식하기

Python으로 하는 웹 스크레이핑

강의
완료

수료증 획득

LinkedIn 프로필, 이력서 또는 CV에 이 인증서를 추가하세요
소셜 미디어와 성과 평가에서 공유하세요지금 등록

19백만 명 이상의 학습자와 함께 Python으로 하는 웹 스크레이핑을(를) 시작하세요!

DataCamp for Mobile을 통해 데이터 분석 능력을 향상시키세요.

모바일 강좌와 매일 5분 코딩 챌린지를 통해 이동 중에도 학습 효과를 높이세요.