본문으로 바로가기
Spark

강의

PySpark로 하는 Feature Engineering

고급기술 수준
업데이트됨 2026. 1.
데이터 과학자가 시간의 70–80%를 쏟는 핵심, 데이터 정제와 피처 엔지니어링의 실무를 깊이 있게 학습하세요.
무료로 강의 시작
SparkData Manipulation
4시간
16 동영상
60 연습 문제
5,000 XP
17,763
성취 증명서

무료 계정 만들기

Google에서 계속 진행더 많은 옵션 보기

또는


계속 진행하시면 당사의 이용약관개인정보처리방침에 동의하고 및 귀하의 데이터가 미국에 저장되는 것에 동의하게 됩니다.

수천 개 기업의 학습자들이 사랑하는

Group

팀을 교육하시나요?

비즈니스용으로 체험해 보세요

강의 설명

현실의 데이터는 늘 지저분합니다. 우리의 일은 그 속에서 의미를 찾아내는 것이죠. MTCars나 Iris 같은 토이 데이터셋도 꼼꼼한 선별과 정제를 거쳤지만, 여전히 강력한 Machine Learning 알고리즘이 의미를 추출하고 예측·분류·군집화에 활용하려면 적절한 변환이 필요합니다. 이 과정에서는 데이터 과학자들이 시간의 70~80%를 쏟는 데이터 정리와 Feature Engineering의 실무적인 내용을 다룹니다. 데이터셋 규모가 점점 커지는 지금, PySpark로 Big Data 문제를 효율적으로 다뤄 보세요!

선수 조건

Supervised Learning with scikit-learnIntroduction to PySpark
1

Exploratory Data Analysis

Get to know a bit about your problem before you dive in! Then learn how to statistically and visually inspect your dataset!
챕터 시작
2

Wrangling with Spark Functions

Real data is rarely clean and ready for analysis. In this chapter learn to remove unneeded information, handle missing values and add additional data to your analysis.
챕터 시작
3

Feature Engineering

PySpark로 하는 Feature Engineering
강의
완료

수료증 획득

LinkedIn 프로필, 이력서 또는 CV에 이 인증서를 추가하세요
소셜 미디어와 성과 평가에서 공유하세요
지금 등록

19백만 명 이상의 학습자와 함께 PySpark로 하는 Feature Engineering을(를) 시작하세요!

무료 계정 만들기

Google에서 계속 진행더 많은 옵션 보기

또는


계속 진행하시면 당사의 이용약관개인정보처리방침에 동의하고 및 귀하의 데이터가 미국에 저장되는 것에 동의하게 됩니다.

DataCamp for Mobile을 통해 데이터 분석 능력을 향상시키세요.

모바일 강좌와 매일 5분 코딩 챌린지를 통해 이동 중에도 학습 효과를 높이세요.