メインコンテンツへスキップ
ホームPython

トラック

強化学習 Pythonで

更新日 2026/05
強化学習(RL)の基礎を習得し、複雑な現実世界の環境をナビゲートできるモデルやLLMをトレーニングできるようになります。
トラックを無料で開始
Python機械学習
12時間
4,174

無料アカウントを作成

Googleで続行その他のオプションを表示

または


続行すると、弊社の利用規約プライバシーポリシーに同意し、データが米国に保存されることに同意したことになります。

何千もの企業の従業員が支持

Group

チームのトレーニングを担当していますか?

Businessをお試しください

トラック概要

強化学習 Pythonで

強化学習(RL)の基礎を習得し、ロボティクスやビデオゲームでよく見られる複雑な環境を攻略するモデルの構築方法を学びます。強化学習が初めての方や、機械学習の一分野として強化学習を専門的に学びたい方にとって、ここは最適な出発点です。まず、マルコフ決定過程、探索と活用のトレードオフ、動的計画法アルゴリズムなど、強化学習の基本概念を学びます。 Gymnasiumライブラリの山岳地帯や凍った湖を進むために、Q学習、SARSA、その他の手法を適用する方法を学びます。深層学習と強化学習を組み合わせ、ほとんど監督なしでエージェントを訓練して非常に複雑な環境を移動させるために使える深層強化学習を学びます。その過程で、これらの手法を実際のプロジェクトに適用し、タクシーのルート最適化や株式取引シミュレーションなどに取り組みます。これらの強化学習ツールがあれば、強化学習の新たな刺激的な応用である人間のフィードバックからの強化学習(RLHF)に取り組み始める準備が整います。 RLHFは、人間のフィードバックをもとに応答を学習させることで、LLMの出力を改善するために使用できます。強化学習の旅を今日始めましょう!

前提条件

このトラックに受講要件はありません
  • Course

    1

    Pythonで学ぶGymnasiumによるReinforcement Learning

    強化学習の旅を始めましょう!エージェントが相互作用を通じて環境を解決する方法を学びます。

  • Project

    特典

    Taxi Route Optimization with Reinforcement Learning

    Solve the Taxi-v3 environment using Q-learning, ensuring efficient AI-driven transportation.

強化学習 Pythonで
3 コース
トラック完了

修了証明書を取得

この修了書をLinkedInや履歴書、CVに追加しましょう
ソーシャルメディアや人事評価で共有しましょう
今すぐ登録

19百万人を超える学習者と共に強化学習 Pythonでを始めましょう!

無料アカウントを作成

Googleで続行その他のオプションを表示

または


続行すると、弊社の利用規約プライバシーポリシーに同意し、データが米国に保存されることに同意したことになります。

DataCamp for Mobileでデータスキルを磨きましょう

モバイル コースと毎日の 5 分間のコーディング チャレンジで、外出先でも進歩できます。