Chuyển đến nội dung chính

Trang chủ Python

Khóa học

Machine Learning với mô hình dựa trên cây trong Python

Trung cấpTrình độ kỹ năng

Đã cập nhật tháng 12, 2025

Trong khóa học này, bạn sẽ học cách sử dụng các mô hình dựa trên cây và các tập hợp cho hồi quy và phân loại bằng scikit-learn.

Bắt Đầu Khóa Học Miễn Phí

PythonMachine Learning

5 gio

15 video

57 Bài tập

4,650 XP

110K+

Giấy chứng nhận Thành tích

Được người học tại hàng ngàn công ty yêu thích

Đào tạo một đội ngũ?

Dùng thử cho Doanh nghiệp

Mô tả khóa học

Cây quyết định là các mô hình học có giám sát được dùng cho bài toán phân loại và hồi quy. Mô hình cây có tính linh hoạt cao nhưng đi kèm đánh đổi: một mặt, cây có thể nắm bắt các quan hệ phi tuyến phức tạp; mặt khác, chúng dễ ghi nhớ nhiễu trong dữ liệu. Bằng cách tổng hợp dự đoán từ các cây được huấn luyện theo những cách khác nhau, các phương pháp tổ hợp tận dụng được tính linh hoạt của cây đồng thời giảm xu hướng ghi nhớ nhiễu. Phương pháp tổ hợp được dùng rộng rãi trong nhiều lĩnh vực và đã chứng minh hiệu quả khi chiến thắng nhiều cuộc thi Machine Learning. Trong khóa học này, bạn sẽ học cách dùng Python để huấn luyện cây quyết định và các mô hình dựa trên cây với thư viện Machine Learning thân thiện scikit-learn. Bạn sẽ hiểu ưu nhược điểm của cây và cách tổ hợp mô hình có thể khắc phục những nhược điểm này, đồng thời thực hành trên các tập dữ liệu thực tế. Cuối cùng, bạn cũng sẽ biết cách tinh chỉnh các siêu tham số quan trọng nhất để khai thác tối đa hiệu quả của mô hình.

Điều kiện tiên quyết

Supervised Learning with scikit-learn

1

Cây phân loại và hồi quy

Cây Phân loại và Hồi quy (CART) là nhóm mô hình học có giám sát dùng cho bài toán phân loại và hồi quy. Trong chương này, bạn sẽ được giới thiệu về thuật toán CART.

Cây quyết định cho phân loại

Huấn luyện cây phân loại đầu tiên của bạn

Đánh giá cây phân loại

Logistic regression vs classification tree

Học cây phân loại

Phát triển cây phân loại

Dùng entropy làm tiêu chí

Entropy so với chỉ số Gini

Cây quyết định cho hồi quy

Huấn luyện cây hồi quy đầu tiên của bạn

Đánh giá cây hồi quy

Hồi quy tuyến tính so với cây hồi quy

Bắt Đầu Chương

2

Đánh đổi giữa độ chệch và phương sai

Đánh đổi giữa độ chệch và phương sai là một trong những khái niệm nền tảng của học có giám sát. Trong chương này, bạn sẽ hiểu cách chẩn đoán hiện tượng quá khớp và thiếu khớp. Bạn cũng sẽ được giới thiệu về ý tưởng tổ hợp mô hình, nơi dự đoán của nhiều mô hình được gộp lại để tạo ra dự đoán vững vàng hơn.

Lỗi khái quát hóa

Độ phức tạp, bias và variance

Overfitting và underfitting

Chẩn đoán vấn đề bias và variance

Khởi tạo mô hình

Đánh giá lỗi CV 10-fold

Đánh giá lỗi huấn luyện

Bias cao hay variance cao?

Học Ensemble

Định nghĩa ensemble

Đánh giá từng bộ phân loại

Hiệu suất tốt hơn với Voting Classifier

Bắt Đầu Chương

3

Bagging và Rừng ngẫu nhiên

Bagging là một phương pháp tổ hợp trong đó cùng một thuật toán được huấn luyện nhiều lần trên các tập con khác nhau được lấy mẫu từ dữ liệu huấn luyện. Trong chương này, bạn sẽ hiểu cách dùng bagging để tạo một tổ hợp cây. Bạn cũng sẽ học cách thuật toán rừng ngẫu nhiên tạo thêm đa dạng cho tổ hợp thông qua việc ngẫu nhiên hóa ở từng phép chia trong các cây tạo nên tổ hợp.

Định nghĩa bộ phân loại bagging

Đánh giá hiệu năng của Bagging

Đánh giá Out-of-Bag

Chuẩn bị nền tảng

Điểm OOB so với điểm tập kiểm tra

Random Forests (RF)

Huấn luyện mô hình RF cho hồi quy

Đánh giá bộ hồi quy RF

Trực quan hóa mức độ quan trọng của đặc trưng

Bắt Đầu Chương

4

Boosting

Boosting là phương pháp tổ hợp trong đó nhiều mô hình được huấn luyện tuần tự và mỗi mô hình học từ lỗi của các mô hình trước đó. Trong chương này, bạn sẽ được giới thiệu hai phương pháp boosting là AdaBoost và Gradient Boosting.

Định nghĩa bộ phân loại AdaBoost

Huấn luyện bộ phân loại AdaBoost

Đánh giá bộ phân loại AdaBoost

Gradient Boosting (GB)

Định nghĩa bộ hồi quy GB

Huấn luyện GB regressor

Đánh giá bộ hồi quy GB

Stochastic Gradient Boosting (SGB)

Hồi quy với SGB

Huấn luyện bộ hồi quy SGB

Đánh giá bộ hồi quy SGB

Bắt Đầu Chương

5

Tinh chỉnh mô hình

Siêu tham số của một mô hình Machine Learning là các tham số không được học từ dữ liệu. Chúng cần được thiết lập trước khi khớp mô hình với tập huấn luyện. Trong chương này, bạn sẽ học cách tinh chỉnh siêu tham số của mô hình dựa trên cây bằng tìm kiếm lưới kèm cross validation.

Tinh chỉnh siêu tham số của CART

Siêu tham số của cây

Thiết lập lưới siêu tham số cho cây

Tìm cây tối ưu

Đánh giá cây tối ưu

Điều chỉnh siêu tham số của RF

Siêu tham số của Random Forests

Thiết lập lưới siêu tham số cho RF

Tìm kiếm rừng tối ưu

Đánh giá rừng tối ưu

Chúc mừng bạn!

Bắt Đầu Chương

Machine Learning với mô hình dựa trên cây trong Python

Hoàn
Thành

Nhận Giấy Chứng Nhận Hoàn Thành

Thêm chứng chỉ này vào hồ sơ LinkedIn, CV hoặc sơ yếu lý lịch của ban
Chia sẻ trên mạng xã hội và trong đánh giá hiệu suất của banĐăng ký ngay

Tham gia cùng hơn 19 triệu học viên và bắt đầu Machine Learning với mô hình dựa trên cây trong Python ngay hôm nay!

Phát triển kỹ năng dữ liệu với DataCamp cho thiết bị di động

Tiến bộ mọi lúc mọi nơi với các khóa học cho thiết bị di động và thử thách lập trình 5 phút hằng ngày.