メインコンテンツへスキップ
Python

Tracks

強化学習 Pythonで

更新 2026/03
強化学習 (RL) の基礎を習得して、複雑な現実世界の環境をナビゲートし、LLM をトレーニングできるモデルを作成します。
無料でトラックを開始

含まれるものプレミアム or チーム

Python機械学習12時間3,751

無料アカウントを作成

または

続行すると、弊社の利用規約プライバシーポリシーに同意し、データが米国に保存されることに同意したことになります。

数千社の学習者に愛用されています

Group

2人以上をトレーニングしますか?

DataCamp for Businessを試す

トラックの説明

強化学習 Pythonで

強化学習 (RL) の基礎を習得し、ロボット工学やビデオ ゲームでよく見られる複雑な環境をナビゲートするモデルの構築方法を学びます。強化学習を初めて学ぶ場合、または機械学習の一分野として強化学習を専門に学びたい場合、ここから始めるのが理想的です。まず、マルコフ決定プロセス、探索/活用のトレードオフ、動的計画法アルゴリズムなどの強化学習の中心的な概念について学習します。Gymnasium ライブラリから、Q 学習、SARSA、その他の手法を適用して山脈や凍った湖を移動する方法を学びます。ディープラーニングと強化学習を統合し、ほとんど監督なしで非常に複雑な環境をナビゲートできるようにエージェントをトレーニングするために使用できるディープ強化学習について学びます。途中で、これらのテクニックを適用して、タクシールートの最適化や株式取引のシミュレーションなどの実際のプロジェクトに取り組みます。これらの強化学習ツールが手元にあれば、強化学習の新しいエキサイティングなアプリケーションである、人間からのフィードバックによる強化学習 (RLHF) に取り組む準備が整います。RLHF は、応答に対する人間のフィードバックをトレーニングすることで、LLM 出力を改善するために使用できます。今すぐ強化学習の旅を始めましょう!

前提条件

このコースには前提条件はありません
  • Course

    1

    Pythonで学ぶGymnasiumによるReinforcement Learning

    強化学習の旅を始めましょう!エージェントが相互作用を通じて環境を解決する方法を学びます。

  • Project

    ボーナス

    Taxi Route Optimization with Reinforcement Learning

    Solve the Taxi-v3 environment using Q-learning, ensuring efficient AI-driven transportation.

強化学習 Pythonで
3 Courses
トラック完了

達成証明書を取得する

この資格情報をLinkedInプロフィール、履歴書、またはCVに追加してください
ソーシャルメディアや業績評価で共有する

含まれるものプレミアム or チーム

今すぐ登録

参加する 19百万人の学習者 今すぐ強化学習 Pythonでを始めましょう!

無料アカウントを作成

または

続行すると、弊社の利用規約プライバシーポリシーに同意し、データが米国に保存されることに同意したことになります。