Chuyển đến nội dung chính
Trang chủSpark

Khóa học

Làm sạch dữ liệu với PySpark

Nâng caoTrình độ kỹ năng
Đã cập nhật tháng 02, 2026
Bắt Đầu Khóa Học Miễn Phí
SparkData Preparation
4 gio
16 video
53 Bài tập
4,150 XP
33,192
Giấy chứng nhận Thành tích

Tạo Tài Khoản Miễn Phí

Tiếp tục với GoogleHiển thị thêm tùy chọn

hoặc


Bằng cách tiếp tục, bạn chấp nhận Điều khoản sử dụng, Chính sách bảo mật và việc dữ liệu của bạn được lưu trữ tại Hoa Kỳ.

Được người học tại hàng ngàn công ty yêu thích

Group

Đào tạo một đội ngũ?

Dùng thử cho Doanh nghiệp

Mô tả khóa học

Làm việc với dữ liệu đã khó — làm việc với hàng triệu hay thậm chí hàng tỷ dòng còn khó hơn. Bạn có nhận được một đoạn mã xử lý dữ liệu viết trên laptop với dữ liệu khá “sạch” không? Rất có thể bạn đang được giao nhiệm vụ chuyển một quy trình dữ liệu cơ bản từ bản mẫu sang sản xuất. Bạn có thể đã từng làm việc với dữ liệu thực tế: thiếu trường, định dạng kỳ lạ và quy mô dữ liệu lớn hơn nhiều bậc. Kể cả khi đây là điều hoàn toàn mới, khóa học này sẽ giúp bạn học những gì cần thiết để chuẩn bị các quy trình dữ liệu bằng Python với Apache Spark. Bạn sẽ học về thuật ngữ, phương pháp và một số thực hành tốt để xây dựng một nền tảng xử lý dữ liệu hiệu quả, dễ bảo trì và dễ hiểu.

Điều kiện tiên quyết

Intermediate PythonIntroduction to PySpark
1

Chi tiết về DataFrame

Ôn lại các kiến thức nền tảng về DataFrame và tầm quan trọng của việc làm sạch dữ liệu.
Bắt Đầu Chương
2

Thao tác với DataFrame trong thực tế

Khám phá nhiều kỹ thuật để chỉnh sửa nội dung của DataFrame trong Spark.
Bắt Đầu Chương
Làm sạch dữ liệu với PySpark
Hoàn
Thành

Nhận Giấy Chứng Nhận Hoàn Thành

Thêm chứng chỉ này vào hồ sơ LinkedIn, CV hoặc sơ yếu lý lịch của ban
Chia sẻ trên mạng xã hội và trong đánh giá hiệu suất của ban
Đăng ký ngay

Tham gia cùng hơn 19 triệu học viên và bắt đầu Làm sạch dữ liệu với PySpark ngay hôm nay!

Tạo Tài Khoản Miễn Phí

Tiếp tục với GoogleHiển thị thêm tùy chọn

hoặc


Bằng cách tiếp tục, bạn chấp nhận Điều khoản sử dụng, Chính sách bảo mật và việc dữ liệu của bạn được lưu trữ tại Hoa Kỳ.

Phát triển kỹ năng dữ liệu với DataCamp cho thiết bị di động

Tiến bộ mọi lúc mọi nơi với các khóa học cho thiết bị di động và thử thách lập trình 5 phút hằng ngày.