본문으로 바로가기
Python

트랙

PySpark를 활용한 빅데이터

업데이트됨 2026. 5.
Apache Spark의 PySpark API를 사용하여 빅데이터를 처리하고 이를 효율적으로 활용하는 방법을 익히세요.
무료로 트랙 시작
Python데이터 가져오기 및 정제
25시간
9,009

무료 계정 만들기

Google에서 계속 진행더 많은 옵션 보기

또는


계속 진행하시면 당사의 이용약관개인정보처리방침에 동의하고 및 귀하의 데이터가 미국에 저장되는 것에 동의하게 됩니다.

수천 개 기업의 학습자들이 사랑하는

Group

팀을 교육하시나요?

비즈니스용으로 체험해 보세요

트랙 설명

PySpark를 활용한 빅데이터

Apache Spark를 익혀 데이터 역량을 한 단계 높이세요. Spark Python API인 PySpark를 사용하여 대규모 데이터세트에서 병렬 컴퓨팅을 활용하고, 고성능 머신 러닝을 준비하게 됩니다. 데이터 정제부터 피처 생성, 머신 러닝 모델 구현까지, Spark로 엔드투엔드 워크플로를 실행하게 됩니다. 이 트랙은 인기 있는 MovieLens 데이터세트와 Million Songs 데이터세트를 사용해 추천 엔진을 구축하는 것으로 마무리됩니다.

선수 조건

이 트랙에는 선수 조건이 없습니다
  • Course

    1

    PySpark 입문

    PySpark를 마스터하여 빅데이터를 손쉽게 처리하세요—대규모 데이터셋을 처리하고 쿼리하며 최적화하여 강력한 분석을 수행하는 방법을 배우세요!

  • Course

    데이터 과학자가 시간의 70–80%를 쏟는 핵심, 데이터 정제와 피처 엔지니어링의 실무를 깊이 있게 학습하세요.

  • Course

    Apache Spark로 데이터에서 예측을 수행합니다. 의사결정나무, 로지스틱 회귀, 선형 회귀, 앙상블, 파이프라인을 다룹니다.

  • Project

    보너스

    Building a Demand Forecasting Model

    Use PySpark to build an e-commerce forecasting model!

PySpark를 활용한 빅데이터
6 강의
트랙
완료

수료증 획득

LinkedIn 프로필, 이력서 또는 CV에 이 인증서를 추가하세요
소셜 미디어와 성과 평가에서 공유하세요
지금 등록

19백만 명 이상의 학습자와 함께 PySpark를 활용한 빅데이터 을(를) 시작하세요!

무료 계정 만들기

Google에서 계속 진행더 많은 옵션 보기

또는


계속 진행하시면 당사의 이용약관개인정보처리방침에 동의하고 및 귀하의 데이터가 미국에 저장되는 것에 동의하게 됩니다.

DataCamp for Mobile을 통해 데이터 분석 능력을 향상시키세요.

모바일 강좌와 매일 5분 코딩 챌린지를 통해 이동 중에도 학습 효과를 높이세요.