Chuyển đến nội dung chính
Trang chủPython

Khóa học

Reinforcement Learning với Gymnasium trong Python

Nâng caoTrình độ kỹ năng
Đã cập nhật tháng 09, 2024
Bắt đầu hành trình học tăng cường của bạn! Tìm hiểu cách các agent có thể học giải quyết môi trường thông qua các tương tác.
Bắt Đầu Khóa Học Miễn Phí
PythonArtificial Intelligence
4 gio
15 video
52 Bài tập
4,400 XP
12,955
Giấy chứng nhận Thành tích

Tạo Tài Khoản Miễn Phí

Tiếp tục với GoogleHiển thị thêm tùy chọn

hoặc


Bằng cách tiếp tục, bạn chấp nhận Điều khoản sử dụng, Chính sách bảo mật và việc dữ liệu của bạn được lưu trữ tại Hoa Kỳ.

Được người học tại hàng ngàn công ty yêu thích

Group

Đào tạo một đội ngũ?

Dùng thử cho Doanh nghiệp

Mô tả khóa học

Khám phá Thế giới của Reinforcement Learning

Bắt đầu hành trình khám phá đầy hứng khởi về Reinforcement Learning (RL), một nhánh quan trọng của học máy. Khóa học tương tác này sẽ đưa bạn vào một hành trình toàn diện qua các nguyên lý cốt lõi của RL, nơi bạn sẽ thành thạo nghệ thuật huấn luyện các tác nhân thông minh, dạy chúng đưa ra quyết định chiến lược và tối đa hóa phần thưởng.

Nắm Vững Các Khái Niệm và Công Cụ Cốt Lõi

Hành trình của bạn bắt đầu với việc khám phá sâu các khía cạnh độc đáo của RL. Bạn sẽ không chỉ học các khái niệm RL nền tảng mà còn áp dụng các thuật toán RL quan trọng vào các tình huống thực tiễn bằng cách sử dụng bộ công cụ OpenAI Gym nổi tiếng. Phương pháp thực hành này đảm bảo bạn nắm vững các kiến thức cơ bản về RL.

Khám Phá Các Chiến Lược và Ứng Dụng Nâng Cao

Khi hành trình của bạn tiếp tục, bạn sẽ bước vào lĩnh vực các chiến lược RL nâng cao để khám phá những điểm tinh vi của các phương pháp Monte Carlo, Học Sự Khác Biệt Thời Gian và Q-Learning. Bằng cách thành thạo các kỹ thuật này trong Python, bạn sẽ trở nên thành thạo trong việc huấn luyện các tác nhân cho nhiều nhiệm vụ phức tạp khác nhau.

Biến việc học của bạn thành tác động thực tiễn

Kết thúc khóa học này, bạn sẽ có được hiểu biết sâu sắc về lý thuyết RL, cùng với kỹ năng áp dụng nó một cách sáng tạo vào các bối cảnh thực tế. Bạn sẽ sẵn sàng xây dựng các mô hình RL trong Python, mở ra một thế giới cơ hội cho các dự án và công việc chuyên môn của mình.

Điều kiện tiên quyết

Supervised Learning with scikit-learnPython ToolboxIntroduction to NumPy
1

Giới thiệu về Reinforcement Learning

Bước vào thế giới Reinforcement Learning (RL) đầy thú vị bằng cách khám phá các khái niệm nền tảng, vai trò và ứng dụng của nó. Tìm hiểu khung RL và cách agent tương tác với môi trường. Bạn cũng sẽ học cách dùng thư viện Gymnasium để tạo môi trường, trực quan hóa trạng thái và thực hiện hành động, từ đó xây dựng nền tảng thực hành vững chắc cho các khái niệm và ứng dụng RL.
Bắt Đầu Chương
2

Học dựa trên mô hình

Đi sâu hơn vào RL với trọng tâm là học dựa trên mô hình. Tháo gỡ sự phức tạp của Markov Decision Processes (MDP) và hiểu các thành phần cốt lõi của chúng. Nâng cao kỹ năng bằng cách tìm hiểu về policy và hàm giá trị. Thành thạo tối ưu hóa policy với các kỹ thuật lặp policy (policy iteration) và lặp giá trị (value iteration).
Bắt Đầu Chương
3

Học không dựa trên mô hình

Khởi hành qua lĩnh vực năng động của Học không dựa trên mô hình trong RL. Làm quen với các phương pháp Monte Carlo nền tảng, và áp dụng thuật toán dự đoán Monte Carlo lần đầu ghé thăm (first-visit) và mọi lần ghé thăm (every-visit). Chuyển sang Học Chênh lệch Thời gian (Temporal Difference Learning), khám phá thuật toán SARSA. Cuối cùng, tìm hiểu sâu về Q-Learning và phân tích sự hội tụ của nó trong các môi trường đầy thách thức.
Bắt Đầu Chương
4

Chiến lược nâng cao trong Model-Free RL

Khám phá các chiến lược nâng cao trong Model-Free RL, tập trung vào cải thiện thuật toán ra quyết định. Tìm hiểu Expected SARSA để cập nhật policy chính xác hơn và Double Q-learning nhằm giảm thiên lệch đánh giá quá cao. Khai thác cân bằng Khám phá - Khai thác (Exploration-Exploitation Tradeoff), nắm vững chiến lược epsilon-greedy và epsilon-decay để chọn hành động tối ưu. Giải quyết Bài toán Máy đánh bạc nhiều tay (Multi-Armed Bandit), áp dụng các chiến lược để xử lý bài toán ra quyết định trong điều kiện bất định.
Bắt Đầu Chương
Reinforcement Learning với Gymnasium trong Python
Hoàn
Thành

Nhận Giấy Chứng Nhận Hoàn Thành

Thêm chứng chỉ này vào hồ sơ LinkedIn, CV hoặc sơ yếu lý lịch của ban
Chia sẻ trên mạng xã hội và trong đánh giá hiệu suất của ban
Đăng ký ngay

Tham gia cùng hơn 19 triệu học viên và bắt đầu Reinforcement Learning với Gymnasium trong Python ngay hôm nay!

Tạo Tài Khoản Miễn Phí

Tiếp tục với GoogleHiển thị thêm tùy chọn

hoặc


Bằng cách tiếp tục, bạn chấp nhận Điều khoản sử dụng, Chính sách bảo mật và việc dữ liệu của bạn được lưu trữ tại Hoa Kỳ.

Phát triển kỹ năng dữ liệu với DataCamp cho thiết bị di động

Tiến bộ mọi lúc mọi nơi với các khóa học cho thiết bị di động và thử thách lập trình 5 phút hằng ngày.