跳至内容
首页Python

学习路径

强化学习 在 Python 中

更新时间 2026年5月
掌握强化学习(RL)的基础,创建能够在复杂现实环境中导航并训练 LLM 的模型。
免费开始学习路径
Python机器学习
12小时
4,174

创建您的免费帐户

继续使用 Google显示更多选项


继续操作即表示您接受我们的《使用条款》和《隐私政策》,并同意您的数据存储在美国。

深受数千家公司学习者的喜爱

Group

需要团队培训?

企业版试用

学习路径描述

强化学习 在 Python 中

掌握强化学习(RL)的基础知识,并了解如何构建模型以应对机器人和电子游戏中常见的复杂环境。如果你刚接触强化学习,或者想将强化学习作为机器学习的一个分支进行专攻,这里是理想的起点。你将首先学习强化学习的核心概念,例如马尔可夫决策过程、探索/利用权衡以及动态规划算法。 你将学习如何应用 Q-learning、SARSA 及其他方法,借助 Gymnasium 库在山脉和冰湖中导航。你将融合深度学习和强化学习,探索深度强化学习,它可用于训练智能体在几乎没有监督的情况下应对高度复杂的环境。一路上,你将把这些技术应用到实际项目中,包括优化出租车路线和股票交易模拟。有了这些强化学习工具,你就可以开始应对强化学习的一个令人兴奋的新应用:来自人类反馈的强化学习(RLHF)。 RLHF 可通过基于人类对其响应的反馈进行训练来改进 LLM 输出。今天就开始你的强化学习之旅!

先决条件

此学习路径无先决条件
  • Course

    1

    Reinforcement Learning with Gymnasium in Python

    Start your reinforcement learning journey! Learn how agents can learn to solve environments through interactions.

  • Project

    额外

    Taxi Route Optimization with Reinforcement Learning

    Solve the Taxi-v3 environment using Q-learning, ensuring efficient AI-driven transportation.

强化学习 在 Python 中
3 课程
学习路径完成

获得成就证明

将此证书添加到您的 LinkedIn 档案、简历或履历中
在社交媒体和绩效评估中分享
立即注册

加入超过19百万学习者,今天就开始强化学习 在 Python 中!

创建您的免费帐户

继续使用 Google显示更多选项


继续操作即表示您接受我们的《使用条款》和《隐私政策》,并同意您的数据存储在美国。

通过 DataCamp for Mobile 提升您的数据技能

随时随地通过我们的移动课程和每日 5 分钟编程挑战提升技能。