Accéder au contenu principal
AccueilPython

Cours

Reinforcement Learning avec Gymnasium en Python

AvancéNiveau de compétence
Actualisé 09/2024
Découvrez l'apprentissage par renforcement, comment les agents peuvent apprendre à résoudre des problèmes grâce à des interactions.
Commencer le cours gratuitement
PythonArtificial Intelligence
4 h
15 vidéos
52 Exercices
4,400 XP
12,955
Certificat de formation

Créez votre compte gratuitement

Continuer avec GoogleAfficher plus d’options

ou


En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données seront hébergées aux États-Unis.

Apprécié par des utilisateurs provenant de milliers d'entreprises

Group

Former une équipe ?

Essayez pour les entreprises

Description du cours

Découvrez le domaine de l'apprentissage par renforcement

Nous vous invitons à explorer le domaine passionnant de l'apprentissage par renforcement (RL), une branche essentielle de l'apprentissage automatique. Ce cours interactif vous propose un parcours complet à travers les principes fondamentaux du RL, où vous maîtriserez l'art de former des agents intelligents, en leur apprenant à prendre des décisions stratégiques et à maximiser les récompenses.

Maîtrisez les concepts et outils essentiels

Votre aventure commence par une immersion approfondie dans les aspects uniques de RL. Vous apprendrez non seulement les concepts fondamentaux du RL, mais vous appliquerez également les principaux algorithmes RL à des scénarios pratiques à l'aide de la célèbre boîte à outils OpenAI Gym. Cette approche pratique garantit une compréhension approfondie des principes fondamentaux du RL.

Explorer les stratégies et applications avancées

Au fil de votre parcours, vous explorerez les domaines des stratégies RL avancées afin de découvrir les subtilités des méthodes Monte Carlo, de l'apprentissage par différence temporelle et du Q-Learning. En maîtrisant ces techniques en Python, vous serez en mesure de former des agents à diverses tâches complexes.

Transformez votre apprentissage en impact concret

À l'issue de ce cours, vous aurez acquis une compréhension approfondie de la théorie du RL et serez en mesure de l'appliquer de manière créative dans des contextes réels. Vous serez en mesure de créer des modèles RL en Python, ouvrant ainsi un monde de possibilités pour vos projets et vos activités professionnelles.

Prérequis

Supervised Learning with scikit-learnPython ToolboxIntroduction to NumPy
1

Introduction au Reinforcement Learning

Plongez dans l’univers du Reinforcement Learning (RL) en découvrant ses concepts, ses rôles et ses applications. Parcourez le cadre du RL et mettez en lumière l’interaction agent–environnement. Vous apprendrez aussi à utiliser la bibliothèque Gymnasium pour créer des environnements, visualiser les états et exécuter des actions, afin d’acquérir des bases pratiques en concepts et applications du RL.
Commencer le chapitre
2

Apprentissage fondé sur un modèle

Approfondissez le RL en vous concentrant sur l’apprentissage fondé sur un modèle. Démêlez la complexité des processus de décision markoviens (MDP) et comprenez leurs composants essentiels. Développez vos compétences en découvrant les politiques et les fonctions de valeur. Maîtrisez l’optimisation de politiques avec les techniques d’itération de politique et d’itération de valeur.
Commencer le chapitre
3

Apprentissage sans modèle

Explorez le domaine dynamique de l’apprentissage sans modèle en RL. Découvrez les méthodes de Monte Carlo et appliquez les algorithmes de prédiction Monte Carlo en première visite et en toutes visites. Passez ensuite à l’apprentissage par différence temporelle en explorant l’algorithme SARSA. Enfin, plongez dans le Q-Learning et analysez sa convergence dans des environnements difficiles.
Commencer le chapitre
4

Stratégies avancées en RL sans modèle

Découvrez des stratégies avancées en RL sans modèle pour améliorer les algorithmes de décision. Apprenez Expected SARSA pour des mises à jour de politique plus précises et le Double Q-learning pour réduire le biais de surestimation. Explorez le compromis exploration–exploitation et maîtrisez les stratégies epsilon-greedy et epsilon-decay pour un choix d’action optimal. Affrontez le problème du bandit manchot en appliquant des stratégies adaptées à la prise de décision sous incertitude.
Commencer le chapitre
Reinforcement Learning avec Gymnasium en Python
Cours
terminé

Obtenez un certificat de réussite

Ajoutez cette certification à votre profil LinkedIn, à votre CV ou à votre portfolio
Partagez-la sur les réseaux sociaux et dans votre évaluation de performance
S'inscrire maintenant

Rejoignez plus de 19 millions d'utilisateurs et commencez Reinforcement Learning avec Gymnasium en Python dès aujourd'hui !

Créez votre compte gratuitement

Continuer avec GoogleAfficher plus d’options

ou


En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données seront hébergées aux États-Unis.

Apprenez où que vous soyez avec l'application DataCamp

Progressez où que vous soyez grâce à nos cours conçus pour mobile et à nos défis quotidiens de 5 minutes.