본문으로 바로가기
Spark

무료 강의

Foundations of PySpark

중급스킬 수준
업데이트됨 2025. 3.
Learn to implement distributed data management and machine learning in Spark using the PySpark package.
무료 강의 시작

무료 포함

SparkData Engineering
4시간
45 연습 문제
3,850 XP
150K+
수료 증명서

무료 계정 만들기

Google로 계속하기옵션 더 보기

또는


계속 진행하시면 당사의 이용약관개인정보처리방침에 동의하고 및 귀하의 데이터가 미국에 저장되는 것에 동의하게 됩니다.

수천 개 기업의 학습자들이 사랑하는

Group

팀을 교육하시나요?

비즈니스용으로 체험해 보세요

강의 설명

In this course, you'll learn how to use Spark from Python! Spark is a tool for doing parallel computation with large datasets and it integrates well with Python. PySpark is the Python package that makes the magic happen. You'll use this package to work with data about flights from Portland and Seattle. You'll learn to wrangle this data and build a whole machine learning pipeline to predict whether or not flights will be delayed. Get ready to put some Spark in your Python code and dive into the world of high-performance machine learning!

선수 조건

Introduction to Python
1

Getting to know PySpark

In this chapter, you'll learn how Spark manages data and how can you read and write tables from Python.
챕터 시작
2

Manipulating data

In this chapter, you'll learn about the pyspark.sql module, which provides optimized data queries to your Spark session.
챕터 시작
3

Getting started with machine learning pipelines

4

Model tuning and selection

Foundations of PySpark
강의
완료

수료 증명서 받기

이 자격증을 LinkedIn 프로필, 이력서 또는 CV에 추가하세요
소셜 미디어에 공유하고 성과 평가에 반영하세요
지금 등록하기

19백만 명의 학습자와 함께 오늘 Foundations of PySpark을 시작하세요!

무료 계정 만들기

Google로 계속하기옵션 더 보기

또는


계속 진행하시면 당사의 이용약관개인정보처리방침에 동의하고 및 귀하의 데이터가 미국에 저장되는 것에 동의하게 됩니다.

DataCamp for Mobile을 통해 데이터 분석 능력을 향상시키세요.

모바일 강좌와 매일 5분 코딩 챌린지를 통해 이동 중에도 학습 효과를 높이세요.