トラック概要

強化学習 Pythonで

強化学習（RL）の基礎を習得し、ロボティクスやビデオゲームでよく見られる複雑な環境を攻略するモデルの構築方法を学びます。強化学習が初めての方や、機械学習の一分野として強化学習を専門的に学びたい方にとって、ここは最適な出発点です。まず、マルコフ決定過程、探索と活用のトレードオフ、動的計画法アルゴリズムなど、強化学習の基本概念を学びます。 Gymnasiumライブラリの山岳地帯や凍った湖を進むために、Q学習、SARSA、その他の手法を適用する方法を学びます。深層学習と強化学習を組み合わせ、ほとんど監督なしでエージェントを訓練して非常に複雑な環境を移動させるために使える深層強化学習を学びます。その過程で、これらの手法を実際のプロジェクトに適用し、タクシーのルート最適化や株式取引シミュレーションなどに取り組みます。これらの強化学習ツールがあれば、強化学習の新たな刺激的な応用である人間のフィードバックからの強化学習（RLHF）に取り組み始める準備が整います。 RLHFは、人間のフィードバックをもとに応答を学習させることで、LLMの出力を改善するために使用できます。強化学習の旅を今日始めましょう！

前提条件

このトラックに受講要件はありません

Course
1
Pythonで学ぶGymnasiumによるReinforcement Learning
強化学習の旅を始めましょう！エージェントが相互作用を通じて環境を解決する方法を学びます。
Project
特典
Taxi Route Optimization with Reinforcement Learning
Solve the Taxi-v3 environment using Q-learning, ensuring efficient AI-driven transportation.
Course
3
Pythonで学ぶDeep Reinforcement Learning
強力な Deep Reinforcement Learning のアルゴリズムを学び、洗練・最適化手法を含めて実践します。
Project
特典
Stock Trading Simulation with Gymnasium
Train a simple reinforcement learning agent in stock trading simulation.
Course
5
人間のフィードバックによる強化学習（RLHF）
人間の価値観を正確に反映するGenAIの作り方を学び、先進的なLLMで実践スキルを身につけましょう。

強化学習 Pythonで

3 コース

トラック完了

修了証明書を取得

この修了書をLinkedInや履歴書、CVに追加しましょう
ソーシャルメディアや人事評価で共有しましょう今すぐ登録

強化学習 Pythonで

チームのトレーニングを担当していますか？

トラック概要