강의
PySpark 입문
중급기술 수준
업데이트됨 2026. 1.
SparkData Engineering4시간11 동영상36 연습 문제2,850 XP29,195성취 증명서
무료 계정 만들기
Google에서 계속 진행더 많은 옵션 보기또는
수천 개 기업의 학습자들이 사랑하는
팀을 교육하시나요?
비즈니스용으로 체험해 보세요강의 설명
왜 Spark인가? 왜 지금인가?
Apache Spark의 속도와 확장성을 알아보세요. Apache Spark는 빅 데이터 처리를 위해 설계된 강력한 프레임워크입니다. 인터랙티브한 강의와 실습을 통해 Spark의 인메모리 처리 방식이 Hadoop과 같은 기존 프레임워크보다 어떤 강점을 제공하는지 확인하게 됩니다. 먼저 Spark 세션을 설정한 다음, Resilient Distributed Datasets(RDD)와 DataFrame 같은 핵심 구성 요소를 살펴보게 됩니다. 실제 사례를 다루면서 데이터세트를 손쉽게 필터링, 그룹화, 조인하는 방법을 배워보세요.빅 데이터용 Python 및 SQL 실력을 향상시키세요
익숙한 SQL 구문을 사용해 데이터를 조회하고 관리하는 PySpark SQL 활용법을 배워보세요. 스키마, 복잡한 데이터 유형, 사용자 정의 함수(UDF)를 다루는 동시에 분산 시스템의 캐싱 및 성능 최적화 역량을 키워 보세요.빅 데이터 기초를 다지세요
이 강의를 마치면 PySpark를 사용해 빅데이터를 다루고, 쿼리하고, 처리할 자신감을 갖게 됩니다. 이러한 기초 역량을 갖추면 머신 러닝과 빅 데이터 분석 같은 고급 주제를 탐구할 준비가 됩니다.선수 조건
Introduction to SQLData Manipulation with pandas1
Introduction to Apache Spark and PySpark
A General introduction to PySpark and distributed computing. This section introduces PySpark, PySpark DataFrames, and RDDs.
2
PySpark in Python
A continuation of DataFrames and complex datatypes. This section expands on what DataFrames offer in PySpark and introduces some Spark SQL concepts.
3
Introduction to PySpark SQL
Delve into leveraging Spark SQL and PySpark for scalable data processing, combining SQL's simplicity with PySpark's distributed computing power to handle large datasets efficiently.
PySpark 입문
강의 완료
19백만 명 이상의 학습자와 함께 PySpark 입문을(를) 시작하세요!
무료 계정 만들기
Google에서 계속 진행더 많은 옵션 보기또는
DataCamp for Mobile을 통해 데이터 분석 능력을 향상시키세요.
모바일 강좌와 매일 5분 코딩 챌린지를 통해 이동 중에도 학습 효과를 높이세요.