본문으로 바로가기
Python

트랙

PySpark를 활용한 빅데이터 분석

업데이트됨 2026. 3.
PySpark API를 사용하여 Apache Spark로 빅데이터를 처리하고 효율적으로 활용하는 방법을 익히세요.
무료로 트랙 시작
Python데이터 가져오기 및 정제25시간8,447

무료 계정을 만드세요

또는

계속 진행하시면 당사의 이용약관, 개인정보처리방침 및 귀하의 데이터가 미국에 저장되는 것에 동의하시는 것입니다.

수천 개 기업의 학습자들이 사랑하는

Group

2명 이상을 교육하시나요?

DataCamp for Business 체험

트랙 설명

PySpark를 활용한 빅데이터 분석

Apache Spark를 마스터하여 데이터 분석 능력을 향상시키세요. Spark Python API인 PySpark를 사용하면 대규모 데이터 세트에 대한 병렬 컴퓨팅을 활용하고 고성능 머신 러닝을 위한 준비를 갖출 수 있습니다. 데이터 정제부터 특징 생성 및 머신러닝 모델 구현에 이르기까지 Spark를 사용하여 엔드투엔드 워크플로우를 실행하게 됩니다. 이 트랙은 인기 있는 MovieLens 데이터셋과 Million Songs 데이터셋을 사용하여 추천 엔진을 구축하는 것으로 마무리됩니다.

선수 조건

이 트랙에는 선수 조건이 없습니다
  • Course

    1

    PySpark 입문

    PySpark를 마스터하여 빅데이터를 손쉽게 처리하세요—대규모 데이터셋을 처리하고 쿼리하며 최적화하여 강력한 분석을 수행하는 방법을 배우세요!

  • Course

    데이터 과학자가 시간의 70–80%를 쏟는 핵심, 데이터 정제와 피처 엔지니어링의 실무를 깊이 있게 학습하세요.

  • Course

    Apache Spark로 데이터에서 예측을 수행합니다. 의사결정나무, 로지스틱 회귀, 선형 회귀, 앙상블, 파이프라인을 다룹니다.

  • Project

    보너스

    Building a Demand Forecasting Model

    Use PySpark to build an e-commerce forecasting model!

PySpark를 활용한 빅데이터 분석
6 강의
트랙
완료

수료증 획득

LinkedIn 프로필, 이력서 또는 CV에 이 자격증을 추가하세요
소셜 미디어와 성과 평가에서 공유하세요
지금 등록

19백만 명 이상의 학습자와 함께 PySpark를 활용한 빅데이터 분석 을(를) 시작하세요!

무료 계정을 만드세요

또는

계속 진행하시면 당사의 이용약관, 개인정보처리방침 및 귀하의 데이터가 미국에 저장되는 것에 동의하시는 것입니다.

DataCamp for Mobile을 통해 데이터 분석 능력을 향상시키세요.

모바일 강좌와 매일 5분 코딩 챌린지를 통해 이동 중에도 학습 효과를 높이세요.