본문으로 바로가기
Spark

강의

PySpark로 하는 Machine Learning

고급기술 수준
업데이트됨 2025. 11.
Apache Spark로 데이터에서 예측을 수행합니다. 의사결정나무, 로지스틱 회귀, 선형 회귀, 앙상블, 파이프라인을 다룹니다.
무료로 강의 시작
SparkMachine Learning
4시간
16 동영상
56 연습 문제
4,550 XP
29,447
성취 증명서

무료 계정을 만드세요

또는

계속 진행하시면 당사의 이용약관, 개인정보처리방침 및 귀하의 데이터가 미국에 저장되는 것에 동의하시는 것입니다.

수천 개 기업의 학습자들이 사랑하는

Group

Training a Team?

Try for Business

강의 설명

Spark는 Big Data 작업을 위한 강력한 범용 도구입니다. Spark는 클러스터 전반에 걸친 연산 작업 분산을 투명하게 처리합니다. 덕분에 연산이 빠를 뿐 아니라, 기술적인 세부사항에 매달리지 않고 분석 자체에 집중할 수 있어요. 이 강의에서는 데이터를 Spark로 불러오는 방법을 배우고, 이어서 Spark의 핵심 Machine Learning 알고리즘 세 가지(선형 회귀, 로지스틱 회귀/분류기, 파이프라인)를 살펴봅니다. 과정 중에 항공 지연과 스팸 문자 메시지라는 대규모 데이터셋을 분석해 볼 거예요. 이 배경지식을 바탕으로 Spark의 성능을 직접 활용해 여러분만의 Machine Learning 프로젝트에 적용할 수 있게 됩니다!

선수 조건

Supervised Learning with scikit-learnIntroduction to PySpark
1

Introduction

Spark is a framework for working with Big Data. In this chapter you'll cover some background about Spark and Machine Learning. You'll then find out how to connect to Spark using Python and load CSV data.
챕터 시작
2

Classification

Now that you are familiar with getting data into Spark, you'll move onto building two types of classification model: Decision Trees and Logistic Regression. You'll also find out about a few approaches to data preparation.
챕터 시작
PySpark로 하는 Machine Learning
강의
완료

수료증 획득

LinkedIn 프로필, 이력서 또는 CV에 이 자격증을 추가하세요
소셜 미디어와 성과 평가에서 공유하세요
지금 등록

19백만 명 이상의 학습자와 함께 PySpark로 하는 Machine Learning을(를) 시작하세요!

무료 계정을 만드세요

또는

계속 진행하시면 당사의 이용약관, 개인정보처리방침 및 귀하의 데이터가 미국에 저장되는 것에 동의하시는 것입니다.

DataCamp for Mobile을 통해 데이터 분석 능력을 향상시키세요.

모바일 강좌와 매일 5분 코딩 챌린지를 통해 이동 중에도 학습 효과를 높이세요.