学习路径描述

强化学习在 Python 中

掌握强化学习（RL）的基础知识，并了解如何构建模型以应对机器人和电子游戏中常见的复杂环境。如果你刚接触强化学习，或者想将强化学习作为机器学习的一个分支进行专攻，这里是理想的起点。你将首先学习强化学习的核心概念，例如马尔可夫决策过程、探索/利用权衡以及动态规划算法。你将学习如何应用 Q-learning、SARSA 及其他方法，借助 Gymnasium 库在山脉和冰湖中导航。你将融合深度学习和强化学习，探索深度强化学习，它可用于训练智能体在几乎没有监督的情况下应对高度复杂的环境。一路上，你将把这些技术应用到实际项目中，包括优化出租车路线和股票交易模拟。有了这些强化学习工具，你就可以开始应对强化学习的一个令人兴奋的新应用：来自人类反馈的强化学习（RLHF）。 RLHF 可通过基于人类对其响应的反馈进行训练来改进 LLM 输出。今天就开始你的强化学习之旅！

先决条件

此学习路径无先决条件

Course
1
Reinforcement Learning with Gymnasium in Python
Start your reinforcement learning journey! Learn how agents can learn to solve environments through interactions.
Project
额外
Taxi Route Optimization with Reinforcement Learning
Solve the Taxi-v3 environment using Q-learning, ensuring efficient AI-driven transportation.
Course
3
Deep Reinforcement Learning in Python
Learn and use powerful Deep Reinforcement Learning algorithms, including refinement and optimization techniques.
Project
额外
Stock Trading Simulation with Gymnasium
Train a simple reinforcement learning agent in stock trading simulation.
Course
5
Reinforcement Learning from Human Feedback (RLHF)
Learn how to make GenAI models truly reflect human values while gaining hands-on experience with advanced LLMs.

强化学习在 Python 中

3 课程

学习路径完成

获得成就证明

将此证书添加到您的 LinkedIn 档案、简历或履历中
在社交媒体和绩效评估中分享立即注册

强化学习在 Python 中

需要团队培训？

学习路径描述

强化学习在 Python 中

先决条件

Reinforcement Learning with Gymnasium in Python

Taxi Route Optimization with Reinforcement Learning

Deep Reinforcement Learning in Python

Stock Trading Simulation with Gymnasium

Reinforcement Learning from Human Feedback (RLHF)

获得成就证明

加入超过19百万学习者，今天就开始强化学习在 Python 中！

通过 DataCamp for Mobile 提升您的数据技能

学习路径描述

强化学习 在 Python 中

获得成就证明

加入超过.css-nklxlk{color:var(--wf-brand--main, #03EF62);}19百万学习者，今天就开始强化学习 在 Python 中！

创建您的免费帐户

通过 DataCamp for Mobile 提升您的数据技能

强化学习在 Python 中

加入超过19百万学习者，今天就开始强化学习在 Python 中！