Lộ trình

Học tăng cường trong Python

Đã cập nhật tháng 05, 2026

Nắm vững các nguyên lý cơ bản của học tăng cường (RL) để phát triển các mô hình có khả năng điều hướng trong các môi trường thực tế phức tạp và đào tạo các mô hình ngôn ngữ lớn (LLMs).

Bắt Đầu Track Miễn Phí

PythonHọc máy

12 gio

4,188

Được người học tại hàng ngàn công ty yêu thích

Đào tạo một đội ngũ?

Dùng thử cho Doanh nghiệp

Mô tả track

Học tăng cường trong Python

Nắm vững các nguyên lý cơ bản của học tăng cường (RL) và khám phá cách xây dựng mô hình để điều hướng các môi trường phức tạp thường gặp trong lĩnh vực robotics và trò chơi điện tử.Nếu quý vị mới bắt đầu tìm hiểu về học tăng cường hoặc muốn chuyên sâu vào lĩnh vực này như một nhánh của học máy, đây là điểm khởi đầu lý tưởng.Quý vị sẽ bắt đầu bằng việc tìm hiểu các khái niệm cơ bản về học tăng cường, chẳng hạn như quá trình ra quyết định Markov, sự cân bằng giữa khám phá và khai thác, và các thuật toán lập trình động. Quý vị sẽ học cách áp dụng Q-learning, SARSA và các phương pháp khác để điều hướng qua các dãy núi và hồ băng từ thư viện của Trường Trung học.Quý vị sẽ kết hợp học sâu (deep learning) và học tăng cường (reinforcement learning) để khám phá học tăng cường sâu (deep reinforcement learning), một phương pháp có thể được sử dụng để đào tạo các tác nhân (agents) điều hướng trong các môi trường phức tạp cao với sự giám sát tối thiểu.Trong quá trình học, quý vị sẽ áp dụng các kỹ thuật này để giải quyết các dự án thực tế, bao gồm tối ưu hóa lộ trình taxi và mô phỏng giao dịch chứng khoán.Với các công cụ học tăng cường này trong tay, quý vị đã sẵn sàng để bắt đầu khám phá một ứng dụng mới đầy hứa hẹn của học tăng cường: học tăng cường từ phản hồi của con người (RLHF). RLHF có thể được sử dụng để cải thiện kết quả đầu ra của LLM bằng cách đào tạo dựa trên phản hồi của con người đối với các phản hồi của nó.Hãy bắt đầu hành trình học tập về học máy tăng cường của quý vị ngay hôm nay!

Điều kiện tiên quyết

Không có điều kiện tiên quyết cho track này

Course
1
Reinforcement Learning với Gymnasium trong Python
Bắt đầu hành trình học tăng cường của bạn! Tìm hiểu cách các agent có thể học giải quyết môi trường thông qua các tương tác.
Project
thưởng
Taxi Route Optimization with Reinforcement Learning
Solve the Taxi-v3 environment using Q-learning, ensuring efficient AI-driven transportation.
Course
3
Deep Reinforcement Learning bằng Python
Project
thưởng
Stock Trading Simulation with Gymnasium
Train a simple reinforcement learning agent in stock trading simulation.
Course
5
Reinforcement Learning from Human Feedback (RLHF)
Tìm hiểu cách làm cho các mô hình GenAI thực sự phản ánh các giá trị của con người đồng thời trải nghiệm thực hành với các LLM tiên tiến.

Học tăng cường trong Python

3 Khóa học

Hoàn
Thành

Nhận Giấy Chứng Nhận Hoàn Thành

Thêm chứng chỉ này vào hồ sơ LinkedIn, CV hoặc sơ yếu lý lịch của ban
Chia sẻ trên mạng xã hội và trong đánh giá hiệu suất của banĐăng ký ngay

Tham gia cùng hơn 19 triệu học viên và bắt đầu Học tăng cường trong Python ngay hôm nay!

Phát triển kỹ năng dữ liệu với DataCamp cho thiết bị di động

Tiến bộ mọi lúc mọi nơi với các khóa học cho thiết bị di động và thử thách lập trình 5 phút hằng ngày.

Mô tả track

Học tăng cường trong Python

Nhận Giấy Chứng Nhận Hoàn Thành

Tham gia cùng .css-nklxlk{color:var(--wf-brand--main, #03EF62);}hơn 19 triệu học viên và bắt đầu Học tăng cường trong Python ngay hôm nay!

Tạo Tài Khoản Miễn Phí

Phát triển kỹ năng dữ liệu với DataCamp cho thiết bị di động

Tham gia cùng hơn 19 triệu học viên và bắt đầu Học tăng cường trong Python ngay hôm nay!