Khóa học
Reinforcement Learning với Gymnasium trong Python
Nâng caoTrình độ kỹ năng
Đã cập nhật tháng 09, 2024
PythonArtificial Intelligence4 gio15 video52 Bài tập4,400 XP12,955Giấy chứng nhận Thành tích
Tạo Tài Khoản Miễn Phí
Tiếp tục với GoogleHiển thị thêm tùy chọnhoặc
Bằng cách tiếp tục, bạn chấp nhận Điều khoản sử dụng, Chính sách bảo mật và việc dữ liệu của bạn được lưu trữ tại Hoa Kỳ.
Được người học tại hàng ngàn công ty yêu thích
Đào tạo một đội ngũ?
Dùng thử cho Doanh nghiệpMô tả khóa học
Khám phá Thế giới của Reinforcement Learning
Bắt đầu hành trình khám phá đầy hứng khởi về Reinforcement Learning (RL), một nhánh quan trọng của học máy. Khóa học tương tác này sẽ đưa bạn vào một hành trình toàn diện qua các nguyên lý cốt lõi của RL, nơi bạn sẽ thành thạo nghệ thuật huấn luyện các tác nhân thông minh, dạy chúng đưa ra quyết định chiến lược và tối đa hóa phần thưởng.Nắm Vững Các Khái Niệm và Công Cụ Cốt Lõi
Hành trình của bạn bắt đầu với việc khám phá sâu các khía cạnh độc đáo của RL. Bạn sẽ không chỉ học các khái niệm RL nền tảng mà còn áp dụng các thuật toán RL quan trọng vào các tình huống thực tiễn bằng cách sử dụng bộ công cụ OpenAI Gym nổi tiếng. Phương pháp thực hành này đảm bảo bạn nắm vững các kiến thức cơ bản về RL.Khám Phá Các Chiến Lược và Ứng Dụng Nâng Cao
Khi hành trình của bạn tiếp tục, bạn sẽ bước vào lĩnh vực các chiến lược RL nâng cao để khám phá những điểm tinh vi của các phương pháp Monte Carlo, Học Sự Khác Biệt Thời Gian và Q-Learning. Bằng cách thành thạo các kỹ thuật này trong Python, bạn sẽ trở nên thành thạo trong việc huấn luyện các tác nhân cho nhiều nhiệm vụ phức tạp khác nhau.Biến việc học của bạn thành tác động thực tiễn
Kết thúc khóa học này, bạn sẽ có được hiểu biết sâu sắc về lý thuyết RL, cùng với kỹ năng áp dụng nó một cách sáng tạo vào các bối cảnh thực tế. Bạn sẽ sẵn sàng xây dựng các mô hình RL trong Python, mở ra một thế giới cơ hội cho các dự án và công việc chuyên môn của mình.Điều kiện tiên quyết
Supervised Learning with scikit-learnPython ToolboxIntroduction to NumPy1
Giới thiệu về Reinforcement Learning
Bước vào thế giới Reinforcement Learning (RL) đầy thú vị bằng cách khám phá các khái niệm nền tảng, vai trò và ứng dụng của nó. Tìm hiểu khung RL và cách agent tương tác với môi trường. Bạn cũng sẽ học cách dùng thư viện Gymnasium để tạo môi trường, trực quan hóa trạng thái và thực hiện hành động, từ đó xây dựng nền tảng thực hành vững chắc cho các khái niệm và ứng dụng RL.
2
Học dựa trên mô hình
Đi sâu hơn vào RL với trọng tâm là học dựa trên mô hình. Tháo gỡ sự phức tạp của Markov Decision Processes (MDP) và hiểu các thành phần cốt lõi của chúng. Nâng cao kỹ năng bằng cách tìm hiểu về policy và hàm giá trị. Thành thạo tối ưu hóa policy với các kỹ thuật lặp policy (policy iteration) và lặp giá trị (value iteration).
3
Học không dựa trên mô hình
Khởi hành qua lĩnh vực năng động của Học không dựa trên mô hình trong RL. Làm quen với các phương pháp Monte Carlo nền tảng, và áp dụng thuật toán dự đoán Monte Carlo lần đầu ghé thăm (first-visit) và mọi lần ghé thăm (every-visit). Chuyển sang Học Chênh lệch Thời gian (Temporal Difference Learning), khám phá thuật toán SARSA. Cuối cùng, tìm hiểu sâu về Q-Learning và phân tích sự hội tụ của nó trong các môi trường đầy thách thức.
4
Chiến lược nâng cao trong Model-Free RL
Khám phá các chiến lược nâng cao trong Model-Free RL, tập trung vào cải thiện thuật toán ra quyết định. Tìm hiểu Expected SARSA để cập nhật policy chính xác hơn và Double Q-learning nhằm giảm thiên lệch đánh giá quá cao. Khai thác cân bằng Khám phá - Khai thác (Exploration-Exploitation Tradeoff), nắm vững chiến lược epsilon-greedy và epsilon-decay để chọn hành động tối ưu. Giải quyết Bài toán Máy đánh bạc nhiều tay (Multi-Armed Bandit), áp dụng các chiến lược để xử lý bài toán ra quyết định trong điều kiện bất định.
Reinforcement Learning với Gymnasium trong Python
Hoàn Thành
Nhận Giấy Chứng Nhận Hoàn Thành
Thêm chứng chỉ này vào hồ sơ LinkedIn, CV hoặc sơ yếu lý lịch của banChia sẻ trên mạng xã hội và trong đánh giá hiệu suất của banĐăng ký ngay
Tham gia cùng hơn 19 triệu học viên và bắt đầu Reinforcement Learning với Gymnasium trong Python ngay hôm nay!
Tạo Tài Khoản Miễn Phí
Tiếp tục với GoogleHiển thị thêm tùy chọnhoặc
Bằng cách tiếp tục, bạn chấp nhận Điều khoản sử dụng, Chính sách bảo mật và việc dữ liệu của bạn được lưu trữ tại Hoa Kỳ.
Phát triển kỹ năng dữ liệu với DataCamp cho thiết bị di động
Tiến bộ mọi lúc mọi nơi với các khóa học cho thiết bị di động và thử thách lập trình 5 phút hằng ngày.