Khóa học
Nền tảng Big Data với PySpark
Nâng caoTrình độ kỹ năng
Đã cập nhật tháng 02, 2025
SparkData Engineering4 gio16 video55 Bài tập4,600 XP65,294Giấy chứng nhận Thành tích
Tạo Tài Khoản Miễn Phí
Tiếp tục với GoogleHiển thị thêm tùy chọnhoặc
Bằng cách tiếp tục, bạn chấp nhận Điều khoản sử dụng, Chính sách bảo mật và việc dữ liệu của bạn được lưu trữ tại Hoa Kỳ.
Được người học tại hàng ngàn công ty yêu thích
Đào tạo một đội ngũ?
Dùng thử cho Doanh nghiệpMô tả khóa học
Điều kiện tiên quyết
Introduction to Python1
Giới thiệu phân tích Big Data với Spark
Chương này giới thiệu thế giới Big Data đầy hứng khởi, cùng các khái niệm và những khung xử lý Big Data khác nhau. Bạn sẽ hiểu vì sao Apache Spark được xem là khung tốt nhất cho Big Data.
2
Lập trình với PySpark RDD
Trừu tượng chính mà Spark cung cấp là resilient distributed dataset (RDD), kiểu dữ liệu nền tảng và xương sống của động cơ này. Chương này giới thiệu về RDD và cách tạo, thực thi RDD thông qua các phép biến đổi (Transformations) và hành động (Actions) trên RDD.
3
PySpark SQL & DataFrame
Trong chương này, bạn sẽ học về Spark SQL, một mô-đun của Spark dành cho xử lý dữ liệu có cấu trúc. Nó cung cấp một lớp trừu tượng lập trình gọi là DataFrame và cũng có thể hoạt động như một engine truy vấn SQL phân tán. Chương này cho thấy cách Spark SQL cho phép bạn sử dụng DataFrame trong Python.
4
Machine Learning với PySpark MLlib
PySpark MLlib là thư viện Machine Learning có khả năng mở rộng của Apache Spark trong Python, bao gồm các thuật toán học máy phổ biến và các tiện ích kèm theo. Xuyên suốt chương cuối, bạn sẽ học các thuật toán Machine Learning quan trọng. Bạn sẽ xây dựng hệ gợi ý phim và bộ lọc thư rác, và sử dụng phân cụm k-means.
Nền tảng Big Data với PySpark
Hoàn Thành
Nhận Giấy Chứng Nhận Hoàn Thành
Thêm chứng chỉ này vào hồ sơ LinkedIn, CV hoặc sơ yếu lý lịch của banChia sẻ trên mạng xã hội và trong đánh giá hiệu suất của banĐăng ký ngay
Tham gia cùng hơn 19 triệu học viên và bắt đầu Nền tảng Big Data với PySpark ngay hôm nay!
Tạo Tài Khoản Miễn Phí
Tiếp tục với GoogleHiển thị thêm tùy chọnhoặc
Bằng cách tiếp tục, bạn chấp nhận Điều khoản sử dụng, Chính sách bảo mật và việc dữ liệu của bạn được lưu trữ tại Hoa Kỳ.
Phát triển kỹ năng dữ liệu với DataCamp cho thiết bị di động
Tiến bộ mọi lúc mọi nơi với các khóa học cho thiết bị di động và thử thách lập trình 5 phút hằng ngày.