メインコンテンツへスキップ
ホームPython

トラック

強化学習 Pythonで

更新日 2026/03
強化学習 (RL) の基礎を習得して、複雑な現実世界の環境をナビゲートし、LLM をトレーニングできるモデルを作成します。
トラックを無料で開始
Python機械学習12時間3,959

無料アカウントを作成

または

続行すると、弊社の利用規約プライバシーポリシーに同意し、データが米国に保存されることに同意したことになります。

数千の企業の学習者に愛されています

Group

2名以上のトレーニングをお考えですか?

DataCamp for Businessを試す

トラック概要

強化学習 Pythonで

強化学習 (RL) の基礎を習得し、ロボット工学やビデオ ゲームでよく見られる複雑な環境をナビゲートするモデルの構築方法を学びます。強化学習を初めて学ぶ場合、または機械学習の一分野として強化学習を専門に学びたい場合、ここから始めるのが理想的です。まず、マルコフ決定プロセス、探索/活用のトレードオフ、動的計画法アルゴリズムなどの強化学習の中心的な概念について学習します。Gymnasium ライブラリから、Q 学習、SARSA、その他の手法を適用して山脈や凍った湖を移動する方法を学びます。ディープラーニングと強化学習を統合し、ほとんど監督なしで非常に複雑な環境をナビゲートできるようにエージェントをトレーニングするために使用できるディープ強化学習について学びます。途中で、これらのテクニックを適用して、タクシールートの最適化や株式取引のシミュレーションなどの実際のプロジェクトに取り組みます。これらの強化学習ツールが手元にあれば、強化学習の新しいエキサイティングなアプリケーションである、人間からのフィードバックによる強化学習 (RLHF) に取り組む準備が整います。RLHF は、応答に対する人間のフィードバックをトレーニングすることで、LLM 出力を改善するために使用できます。今すぐ強化学習の旅を始めましょう!

前提条件

このトラックに前提条件はありません
  • Course

    1

    Pythonで学ぶGymnasiumによるReinforcement Learning

    強化学習の旅を始めましょう!エージェントが相互作用を通じて環境を解決する方法を学びます。

  • Project

    ボーナス

    Taxi Route Optimization with Reinforcement Learning

    Solve the Taxi-v3 environment using Q-learning, ensuring efficient AI-driven transportation.

強化学習 Pythonで
3 コース
トラック完了

修了証明書を取得

この資格をLinkedInプロフィール、履歴書、CVに追加しましょう
ソーシャルメディアや人事評価で共有しましょう
今すぐ登録

19百万人を超える学習者と一緒に強化学習 Pythonでを今日から始めましょう!

無料アカウントを作成

または

続行すると、弊社の利用規約プライバシーポリシーに同意し、データが米国に保存されることに同意したことになります。

DataCamp for Mobileでデータスキルを磨きましょう

モバイル コースと毎日の 5 分間のコーディング チャレンジで、外出先でも進歩できます。