Khóa học
Làm sạch dữ liệu với PySpark
Nâng caoTrình độ kỹ năng
Đã cập nhật tháng 02, 2026
SparkData Preparation4 gio16 video53 Bài tập4,150 XP33,192Giấy chứng nhận Thành tích
Tạo Tài Khoản Miễn Phí
Tiếp tục với GoogleHiển thị thêm tùy chọnhoặc
Bằng cách tiếp tục, bạn chấp nhận Điều khoản sử dụng, Chính sách bảo mật và việc dữ liệu của bạn được lưu trữ tại Hoa Kỳ.
Được người học tại hàng ngàn công ty yêu thích
Đào tạo một đội ngũ?
Dùng thử cho Doanh nghiệpMô tả khóa học
Điều kiện tiên quyết
Intermediate PythonIntroduction to PySpark1
Chi tiết về DataFrame
Ôn lại các kiến thức nền tảng về DataFrame và tầm quan trọng của việc làm sạch dữ liệu.
2
Thao tác với DataFrame trong thực tế
Khám phá nhiều kỹ thuật để chỉnh sửa nội dung của DataFrame trong Spark.
3
Cải thiện hiệu năng
Cải thiện các tác vụ làm sạch dữ liệu bằng cách tăng hiệu năng hoặc giảm nhu cầu tài nguyên.
4
Xử lý phức tạp và pipeline dữ liệu
Tìm hiểu cách xử lý dữ liệu thực tế phức tạp bằng Spark và các kiến thức cơ bản về pipeline.
Làm sạch dữ liệu với PySpark
Hoàn Thành
Nhận Giấy Chứng Nhận Hoàn Thành
Thêm chứng chỉ này vào hồ sơ LinkedIn, CV hoặc sơ yếu lý lịch của banChia sẻ trên mạng xã hội và trong đánh giá hiệu suất của banĐăng ký ngay
Tham gia cùng hơn 19 triệu học viên và bắt đầu Làm sạch dữ liệu với PySpark ngay hôm nay!
Tạo Tài Khoản Miễn Phí
Tiếp tục với GoogleHiển thị thêm tùy chọnhoặc
Bằng cách tiếp tục, bạn chấp nhận Điều khoản sử dụng, Chính sách bảo mật và việc dữ liệu của bạn được lưu trữ tại Hoa Kỳ.
Phát triển kỹ năng dữ liệu với DataCamp cho thiết bị di động
Tiến bộ mọi lúc mọi nơi với các khóa học cho thiết bị di động và thử thách lập trình 5 phút hằng ngày.