Chuyển đến nội dung chính
Trang chủSpark

Khóa học

Nhập môn PySpark

Trung cấpTrình độ kỹ năng
Đã cập nhật tháng 01, 2026
Thành thạo PySpark để xử lý big data dễ dàng—học cách xử lý, truy vấn và tối ưu hóa các bộ dữ liệu khổng lồ cho phân tích mạnh mẽ!
Bắt Đầu Khóa Học Miễn Phí
SparkData Engineering4 giờ11 video36 Bài tập2,850 XP27,198Giấy Chứng Nhận Thành Tích

Tạo tài khoản miễn phí

hoặc

Bằng cách tiếp tục, bạn chấp nhận Điều khoản sử dụng, Chính sách bảo mật và việc dữ liệu của bạn được lưu trữ tại Hoa Kỳ.

Được yêu thích bởi học viên tại hàng nghìn công ty

Group

Đào tạo 2 người trở lên?

Thử DataCamp for Business

Mô tả khóa học

Khóa học này dành cho kỹ sư dữ liệu, nhà khoa học dữ liệu và người làm Machine Learning muốn làm việc với tập dữ liệu lớn bằng PySpark. Bạn sẽ khám phá tốc độ và khả năng mở rộng của Apache Spark, học cách tạo Spark session, làm việc với RDD, và thao tác với DataFrame qua các bài thực hành. Khóa học cũng đề cập đến PySpark SQL, hướng dẫn bạn truy vấn dữ liệu bằng SQL, xử lý schema và kiểu dữ liệu phức tạp, cũng như tối ưu hiệu năng trong môi trường phân tán. Kết thúc khóa học, bạn sẽ có kỹ năng nền tảng để xử lý và phân tích dữ liệu lớn, làm tiền đề cho các ứng dụng nâng cao như Machine Learning và phân tích dữ liệu lớn.Video có kèm phụ đề trực tiếp, bạn có thể hiển thị bằng cách bấm "Show transcript" ở góc dưới bên trái của video. Thuật ngữ của khóa học nằm ở phần tài nguyên bên phải. Để nhận tín chỉ CPE, bạn cần hoàn thành khóa học và đạt 70% ở bài đánh giá đủ điều kiện. Bạn có thể đi tới bài đánh giá bằng cách bấm vào phần giới thiệu tín chỉ CPE ở bên phải.

Điều kiện tiên quyết

Introduction to SQLData Manipulation with pandas
1

Introduction to Apache Spark and PySpark

A General introduction to PySpark and distributed computing. This section introduces PySpark, PySpark DataFrames, and RDDs.
Bắt Đầu Chương
2

PySpark in Python

3

Introduction to PySpark SQL

Nhập môn PySpark
Hoàn
Thành

Nhận Giấy Chứng Nhận Hoàn Thành

Thêm chứng chỉ này vào hồ sơ LinkedIn, CV hoặc sơ yếu lý lịch của ban
Chia sẻ trên mạng xã hội và trong đánh giá hiệu suất của ban
Đăng Ký Ngay

Tham gia cùng hơn 19 triệu học viên và bắt đầu Nhập môn PySpark ngay hôm nay!

Tạo tài khoản miễn phí

hoặc

Bằng cách tiếp tục, bạn chấp nhận Điều khoản sử dụng, Chính sách bảo mật và việc dữ liệu của bạn được lưu trữ tại Hoa Kỳ.

Phát triển kỹ năng dữ liệu với DataCamp cho thiết bị di động

Tiến bộ mọi lúc mọi nơi với các khóa học cho thiết bị di động và thử thách lập trình 5 phút hằng ngày.