Chuyển đến nội dung chính
Trang chủPython

Lộ trình

Học tăng cường trong Python

Đã cập nhật tháng 03, 2026
Nắm vững các nguyên lý cơ bản của học tăng cường (RL) để phát triển các mô hình có khả năng điều hướng trong các môi trường thực tế phức tạp và đào tạo các mô hình ngôn ngữ lớn (LLMs).
Bắt Đầu Track Miễn Phí
PythonHọc máy12 giờ3,970

Tạo tài khoản miễn phí

hoặc

Bằng cách tiếp tục, bạn chấp nhận Điều khoản sử dụng, Chính sách bảo mật và việc dữ liệu của bạn được lưu trữ tại Hoa Kỳ.

Được yêu thích bởi học viên tại hàng nghìn công ty

Group

Đào tạo 2 người trở lên?

Thử DataCamp for Business

Mô tả track

Học tăng cường trong Python

Nắm vững các nguyên lý cơ bản của học tăng cường (RL) và khám phá cách xây dựng mô hình để điều hướng các môi trường phức tạp thường gặp trong lĩnh vực robotics và trò chơi điện tử.Nếu quý vị mới bắt đầu tìm hiểu về học tăng cường hoặc muốn chuyên sâu vào lĩnh vực này như một nhánh của học máy, đây là điểm khởi đầu lý tưởng.Quý vị sẽ bắt đầu bằng việc tìm hiểu các khái niệm cơ bản về học tăng cường, chẳng hạn như quá trình ra quyết định Markov, sự cân bằng giữa khám phá và khai thác, và các thuật toán lập trình động. Quý vị sẽ học cách áp dụng Q-learning, SARSA và các phương pháp khác để điều hướng qua các dãy núi và hồ băng từ thư viện của Trường Trung học.Quý vị sẽ kết hợp học sâu (deep learning) và học tăng cường (reinforcement learning) để khám phá học tăng cường sâu (deep reinforcement learning), một phương pháp có thể được sử dụng để đào tạo các tác nhân (agents) điều hướng trong các môi trường phức tạp cao với sự giám sát tối thiểu.Trong quá trình học, quý vị sẽ áp dụng các kỹ thuật này để giải quyết các dự án thực tế, bao gồm tối ưu hóa lộ trình taxi và mô phỏng giao dịch chứng khoán.Với các công cụ học tăng cường này trong tay, quý vị đã sẵn sàng để bắt đầu khám phá một ứng dụng mới đầy hứa hẹn của học tăng cường: học tăng cường từ phản hồi của con người (RLHF). RLHF có thể được sử dụng để cải thiện kết quả đầu ra của LLM bằng cách đào tạo dựa trên phản hồi của con người đối với các phản hồi của nó.Hãy bắt đầu hành trình học tập về học máy tăng cường của quý vị ngay hôm nay!

Điều kiện tiên quyết

Không có điều kiện tiên quyết cho track này
  • Course

    1

    Reinforcement Learning với Gymnasium trong Python

    Bắt đầu hành trình học tăng cường của bạn! Tìm hiểu cách các agent có thể học giải quyết môi trường thông qua các tương tác.

  • Project

    thưởng

    Taxi Route Optimization with Reinforcement Learning

    Solve the Taxi-v3 environment using Q-learning, ensuring efficient AI-driven transportation.

Học tăng cường trong Python
3 Khóa học
Hoàn
Thành

Nhận Giấy Chứng Nhận Hoàn Thành

Thêm chứng chỉ này vào hồ sơ LinkedIn, CV hoặc sơ yếu lý lịch của ban
Chia sẻ trên mạng xã hội và trong đánh giá hiệu suất của ban
Đăng Ký Ngay

Tham gia cùng hơn 19 triệu học viên và bắt đầu Học tăng cường trong Python ngay hôm nay!

Tạo tài khoản miễn phí

hoặc

Bằng cách tiếp tục, bạn chấp nhận Điều khoản sử dụng, Chính sách bảo mật và việc dữ liệu của bạn được lưu trữ tại Hoa Kỳ.

Phát triển kỹ năng dữ liệu với DataCamp cho thiết bị di động

Tiến bộ mọi lúc mọi nơi với các khóa học cho thiết bị di động và thử thách lập trình 5 phút hằng ngày.