본문으로 바로가기
Python

tracks

PySpark를 활용한 빅데이터 분석

업데이트됨 2026. 3.
PySpark API를 사용하여 Apache Spark로 빅데이터를 처리하고 효율적으로 활용하는 방법을 익히세요.
무료로 트랙을 시작하세요

포함 사항프리미엄 or 팀

Python데이터 가져오기 및 정제257,801

무료 계정을 만드세요

또는

계속 진행하시면 당사의 이용약관, 개인정보처리방침 및 귀하의 데이터가 미국에 저장되는 것에 동의하시는 것입니다.

수천 개의 회사에서 학습자들에게 사랑받는 제품입니다.

Group

2명 이상을 교육하시나요?

DataCamp for Business 사용해 보세요

트랙 설명

PySpark를 활용한 빅데이터 분석

Apache Spark를 마스터하여 데이터 분석 능력을 향상시키세요. Spark Python API인 PySpark를 사용하면 대규모 데이터 세트에 대한 병렬 컴퓨팅을 활용하고 고성능 머신 러닝을 위한 준비를 갖출 수 있습니다. 데이터 정제부터 특징 생성 및 머신러닝 모델 구현에 이르기까지 Spark를 사용하여 엔드투엔드 워크플로우를 실행하게 됩니다. 이 트랙은 인기 있는 MovieLens 데이터셋과 Million Songs 데이터셋을 사용하여 추천 엔진을 구축하는 것으로 마무리됩니다.

필수 조건

이 과정에는 사전 요구 사항이 없습니다.
  • Course

    1

    PySpark 입문

    PySpark를 마스터하여 빅데이터를 손쉽게 처리하세요—대규모 데이터셋을 처리하고 쿼리하며 최적화하여 강력한 분석을 수행하는 방법을 배우세요!

  • Course

    데이터 과학자가 시간의 70–80%를 쏟는 핵심, 데이터 정제와 피처 엔지니어링의 실무를 깊이 있게 학습하세요.

  • Course

    Apache Spark로 데이터에서 예측을 수행합니다. 의사결정나무, 로지스틱 회귀, 선형 회귀, 앙상블, 파이프라인을 다룹니다.

  • Project

    보너스

    Building a Demand Forecasting Model

    Use PySpark to build an e-commerce forecasting model!

PySpark를 활용한 빅데이터 분석
6 courses
트랙
완료

성과 증명서 발급

이 자격증을 링크드인 프로필, 이력서 또는 자기소개서에 추가하세요.
소셜 미디어와 업무 평가에 공유하세요.

포함 사항프리미엄 or 팀

지금 등록하세요

함께 참여하세요 19 백만 명의 학습자 지금 바로 PySpark를 활용한 빅데이터 분석 시작하세요!

무료 계정을 만드세요

또는

계속 진행하시면 당사의 이용약관, 개인정보처리방침 및 귀하의 데이터가 미국에 저장되는 것에 동의하시는 것입니다.