Chuyển đến nội dung chính
Trang chủPyTorch

Khóa học

Deep Reinforcement Learning bằng Python

Nâng caoTrình độ kỹ năng
Đã cập nhật tháng 09, 2024
Bắt Đầu Khóa Học Miễn Phí
PyTorchArtificial Intelligence
4 gio
15 video
49 Bài tập
4,050 XP
5,672
Giấy chứng nhận Thành tích

Tạo Tài Khoản Miễn Phí

Tiếp tục với GoogleHiển thị thêm tùy chọn

hoặc


Bằng cách tiếp tục, bạn chấp nhận Điều khoản sử dụng, Chính sách bảo mật và việc dữ liệu của bạn được lưu trữ tại Hoa Kỳ.

Được người học tại hàng ngàn công ty yêu thích

Group

Đào tạo một đội ngũ?

Dùng thử cho Doanh nghiệp

Mô tả khóa học

Bắt đầu hành trình giúp máy học thông minh hơn với Deep Reinforcement Learning (DRL). Khóa học này mang đến trải nghiệm thực hành với các thuật toán mạnh mẽ sử dụng PyTorch và Gymnasium. Khởi động với nền tảng DRL và Reinforcement Learning truyền thống, sau đó bạn sẽ hiện thực hóa Deep Q-Networks (DQN) kèm các cải tiến nâng cao như Prioritized Experience Replay. Nâng tầm kỹ năng với các phương pháp dựa trên policy và khám phá các thuật toán tiêu chuẩn trong ngành như Proximal Policy Optimization (PPO) trước khi tối ưu mô hình bằng Optuna.

Điều kiện tiên quyết

Intermediate Deep Learning with PyTorchReinforcement Learning with Gymnasium in Python
1

Giới thiệu về Deep Reinforcement Learning

Khám phá cách deep reinforcement learning cải tiến so với Reinforcement Learning truyền thống, đồng thời tìm hiểu và triển khai thuật toán Deep Q Learning đầu tiên của bạn.
Bắt Đầu Chương
2

Deep Q-learning

Đi sâu vào Deep Q-learning bằng cách triển khai thuật toán DQN gốc, với Experience Replay, epsilon-greediness và fixed Q-targets. Vượt ra ngoài DQN, bạn sẽ khám phá hai phần mở rộng thú vị giúp cải thiện hiệu năng và độ ổn định của Deep Q-learning: Double DQN và Prioritized Experience Replay.
Bắt Đầu Chương
3

Giới thiệu về các phương pháp Policy Gradient

Tìm hiểu các khái niệm nền tảng của phương pháp policy gradient trong DRL. Bạn sẽ bắt đầu với định lý policy gradient, nền tảng của các phương pháp này. Sau đó, bạn sẽ triển khai thuật toán REINFORCE, một cách tiếp cận mạnh mẽ để học policy. Chương này sẽ hướng dẫn bạn qua các phương pháp Actor-Critic, tập trung vào thuật toán Advantage Actor-Critic (A2C), kết hợp điểm mạnh của cả policy gradient và phương pháp dựa trên giá trị để tăng hiệu quả và ổn định khi học.
Bắt Đầu Chương
4

Proximal Policy Optimization và các mẹo DRL

Khám phá Proximal Policy Optimization (PPO) để đạt hiệu năng DRL vững chắc. Tiếp theo, bạn sẽ tìm hiểu việc dùng entropy bonus trong PPO, giúp khuyến khích khám phá bằng cách ngăn hội tụ sớm vào các policy tất định. Bạn cũng sẽ học về cập nhật theo lô (batch) trong các phương pháp policy gradient. Cuối cùng, bạn sẽ tìm hiểu cách tối ưu siêu tham số với Optuna, một công cụ mạnh mẽ để tối ưu hiệu năng cho các mô hình DRL của bạn.
Bắt Đầu Chương
Deep Reinforcement Learning bằng Python
Hoàn
Thành

Nhận Giấy Chứng Nhận Hoàn Thành

Thêm chứng chỉ này vào hồ sơ LinkedIn, CV hoặc sơ yếu lý lịch của ban
Chia sẻ trên mạng xã hội và trong đánh giá hiệu suất của ban
Đăng ký ngay

Tham gia cùng hơn 19 triệu học viên và bắt đầu Deep Reinforcement Learning bằng Python ngay hôm nay!

Tạo Tài Khoản Miễn Phí

Tiếp tục với GoogleHiển thị thêm tùy chọn

hoặc


Bằng cách tiếp tục, bạn chấp nhận Điều khoản sử dụng, Chính sách bảo mật và việc dữ liệu của bạn được lưu trữ tại Hoa Kỳ.

Phát triển kỹ năng dữ liệu với DataCamp cho thiết bị di động

Tiến bộ mọi lúc mọi nơi với các khóa học cho thiết bị di động và thử thách lập trình 5 phút hằng ngày.