Chuyển đến nội dung chính
Trang chủPython

Khóa học

Machine Learning với mô hình dựa trên cây trong Python

Trung cấpTrình độ kỹ năng
Đã cập nhật tháng 12, 2025
Trong khóa học này, bạn sẽ học cách sử dụng các mô hình dựa trên cây và các tập hợp cho hồi quy và phân loại bằng scikit-learn.
Bắt Đầu Khóa Học Miễn Phí
PythonMachine Learning5 giờ15 video57 Bài tập4,650 XP110K+Giấy Chứng Nhận Thành Tích

Tạo tài khoản miễn phí

hoặc

Bằng cách tiếp tục, bạn chấp nhận Điều khoản sử dụng, Chính sách bảo mật và việc dữ liệu của bạn được lưu trữ tại Hoa Kỳ.

Được yêu thích bởi học viên tại hàng nghìn công ty

Group

Đào tạo 2 người trở lên?

Thử DataCamp for Business

Mô tả khóa học

Cây quyết định là các mô hình học có giám sát được dùng cho bài toán phân loại và hồi quy. Mô hình cây có tính linh hoạt cao nhưng đi kèm đánh đổi: một mặt, cây có thể nắm bắt các quan hệ phi tuyến phức tạp; mặt khác, chúng dễ ghi nhớ nhiễu trong dữ liệu. Bằng cách tổng hợp dự đoán từ các cây được huấn luyện theo những cách khác nhau, các phương pháp tổ hợp tận dụng được tính linh hoạt của cây đồng thời giảm xu hướng ghi nhớ nhiễu. Phương pháp tổ hợp được dùng rộng rãi trong nhiều lĩnh vực và đã chứng minh hiệu quả khi chiến thắng nhiều cuộc thi Machine Learning. Trong khóa học này, bạn sẽ học cách dùng Python để huấn luyện cây quyết định và các mô hình dựa trên cây với thư viện Machine Learning thân thiện scikit-learn. Bạn sẽ hiểu ưu nhược điểm của cây và cách tổ hợp mô hình có thể khắc phục những nhược điểm này, đồng thời thực hành trên các tập dữ liệu thực tế. Cuối cùng, bạn cũng sẽ biết cách tinh chỉnh các siêu tham số quan trọng nhất để khai thác tối đa hiệu quả của mô hình.

Điều kiện tiên quyết

Supervised Learning with scikit-learn
1

Classification and Regression Trees

Classification and Regression Trees (CART) are a set of supervised learning models used for problems involving classification and regression. In this chapter, you'll be introduced to the CART algorithm.
Bắt Đầu Chương
2

The Bias-Variance Tradeoff

The bias-variance tradeoff is one of the fundamental concepts in supervised machine learning. In this chapter, you'll understand how to diagnose the problems of overfitting and underfitting. You'll also be introduced to the concept of ensembling where the predictions of several models are aggregated to produce predictions that are more robust.
Bắt Đầu Chương
3

Bagging and Random Forests

Bagging is an ensemble method involving training the same algorithm many times using different subsets sampled from the training data. In this chapter, you'll understand how bagging can be used to create a tree ensemble. You'll also learn how the random forests algorithm can lead to further ensemble diversity through randomization at the level of each split in the trees forming the ensemble.
Bắt Đầu Chương
4

Boosting

Boosting refers to an ensemble method in which several models are trained sequentially with each model learning from the errors of its predecessors. In this chapter, you'll be introduced to the two boosting methods of AdaBoost and Gradient Boosting.
Bắt Đầu Chương
5

Model Tuning

The hyperparameters of a machine learning model are parameters that are not learned from data. They should be set prior to fitting the model to the training set. In this chapter, you'll learn how to tune the hyperparameters of a tree-based model using grid search cross validation.
Bắt Đầu Chương
Machine Learning với mô hình dựa trên cây trong Python
Hoàn
Thành

Nhận Giấy Chứng Nhận Hoàn Thành

Thêm chứng chỉ này vào hồ sơ LinkedIn, CV hoặc sơ yếu lý lịch của ban
Chia sẻ trên mạng xã hội và trong đánh giá hiệu suất của ban
Đăng Ký Ngay

Tham gia cùng hơn 19 triệu học viên và bắt đầu Machine Learning với mô hình dựa trên cây trong Python ngay hôm nay!

Tạo tài khoản miễn phí

hoặc

Bằng cách tiếp tục, bạn chấp nhận Điều khoản sử dụng, Chính sách bảo mật và việc dữ liệu của bạn được lưu trữ tại Hoa Kỳ.

Phát triển kỹ năng dữ liệu với DataCamp cho thiết bị di động

Tiến bộ mọi lúc mọi nơi với các khóa học cho thiết bị di động và thử thách lập trình 5 phút hằng ngày.