Chuyển đến nội dung chính
Trang chủPython

Lộ trình

Học tăng cường trong Python

Đã cập nhật tháng 03, 2026
Nắm vững các nguyên lý cơ bản của học tăng cường (RL) để phát triển các mô hình có khả năng điều hướng trong các môi trường thực tế phức tạp và đào tạo các mô hình ngôn ngữ lớn (LLMs).
Bắt Đầu Track Miễn Phí

Bao gồm vớiCao cấp or Đội nhóm

PythonHọc máy12 giờ3,757

Tạo tài khoản miễn phí

hoặc

Bằng cách tiếp tục, bạn chấp nhận Điều khoản sử dụng, Chính sách bảo mật và việc dữ liệu của bạn được lưu trữ tại Hoa Kỳ.

Được yêu thích bởi học viên tại hàng nghìn công ty

Group

Đào tạo 2 người trở lên?

Thử DataCamp for Business

Mô tả track

Học tăng cường trong Python

Nắm vững các nguyên lý cơ bản của học tăng cường (RL) và khám phá cách xây dựng mô hình để điều hướng các môi trường phức tạp thường gặp trong lĩnh vực robotics và trò chơi điện tử.Nếu quý vị mới bắt đầu tìm hiểu về học tăng cường hoặc muốn chuyên sâu vào lĩnh vực này như một nhánh của học máy, đây là điểm khởi đầu lý tưởng.Quý vị sẽ bắt đầu bằng việc tìm hiểu các khái niệm cơ bản về học tăng cường, chẳng hạn như quá trình ra quyết định Markov, sự cân bằng giữa khám phá và khai thác, và các thuật toán lập trình động. Quý vị sẽ học cách áp dụng Q-learning, SARSA và các phương pháp khác để điều hướng qua các dãy núi và hồ băng từ thư viện của Trường Trung học.Quý vị sẽ kết hợp học sâu (deep learning) và học tăng cường (reinforcement learning) để khám phá học tăng cường sâu (deep reinforcement learning), một phương pháp có thể được sử dụng để đào tạo các tác nhân (agents) điều hướng trong các môi trường phức tạp cao với sự giám sát tối thiểu.Trong quá trình học, quý vị sẽ áp dụng các kỹ thuật này để giải quyết các dự án thực tế, bao gồm tối ưu hóa lộ trình taxi và mô phỏng giao dịch chứng khoán.Với các công cụ học tăng cường này trong tay, quý vị đã sẵn sàng để bắt đầu khám phá một ứng dụng mới đầy hứa hẹn của học tăng cường: học tăng cường từ phản hồi của con người (RLHF). RLHF có thể được sử dụng để cải thiện kết quả đầu ra của LLM bằng cách đào tạo dựa trên phản hồi của con người đối với các phản hồi của nó.Hãy bắt đầu hành trình học tập về học máy tăng cường của quý vị ngay hôm nay!

Điều kiện tiên quyết

Không có điều kiện tiên quyết cho track này
  • Course

    1

    Reinforcement Learning with Gymnasium in Python

    Start your reinforcement learning journey! Learn how agents can learn to solve environments through interactions.

  • Project

    thưởng

    Taxi Route Optimization with Reinforcement Learning

    Solve the Taxi-v3 environment using Q-learning, ensuring efficient AI-driven transportation.

Học tăng cường trong Python
3 Khóa học
Hoàn
Thành

Nhận Giấy Chứng Nhận Hoàn Thành

Thêm chứng chỉ này vào hồ sơ LinkedIn, CV hoặc sơ yếu lý lịch của ban
Chia sẻ trên mạng xã hội và trong đánh giá hiệu suất của ban

Bao gồm vớiCao cấp or Đội nhóm

Đăng Ký Ngay

Tham gia cùng hơn 19 triệu học viên và bắt đầu Học tăng cường trong Python ngay hôm nay!

Tạo tài khoản miễn phí

hoặc

Bằng cách tiếp tục, bạn chấp nhận Điều khoản sử dụng, Chính sách bảo mật và việc dữ liệu của bạn được lưu trữ tại Hoa Kỳ.