Cours
Apprentissage par renforcement profond en Python
AvancéNiveau de compétence
Actualisé 09/2024PyTorchArtificial Intelligence4 h15 vidéos49 Exercices4,050 XP5,087Certificat de réussite.
Créez votre compte gratuit
ou
En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données seront hébergées aux États-Unis.Apprécié par des utilisateurs provenant de milliers d'entreprises
Former 2 personnes ou plus ?
Essayez DataCamp for BusinessDescription du cours
Maîtrisez les principes fondamentaux de l'apprentissage par renforcement profond
Notre parcours commence par les fondements du DRL et leur relation avec l'apprentissage par renforcement traditionnel. À partir de là, nous passons rapidement à la mise en œuvre des réseaux Deep Q-Networks (DQN) dans PyTorch, y compris des améliorations avancées telles que Double DQN et Prioritized Experience Replay pour optimiser vos modèles.Développez vos compétences en découvrant les méthodes basées sur les politiques. Vous apprendrez et mettrez en œuvre des techniques essentielles de gradient de politique telles que les méthodes REINFORCE et Actor-Critic.Utilisez des algorithmes de pointe
Vous découvrirez de puissants algorithmes DRL couramment utilisés dans l'industrie aujourd'hui, notamment l'optimisation de la politique proximale (PPO). Vous acquerrez une expérience pratique des techniques qui révolutionnent la robotique, l'intelligence artificielle dans les jeux vidéo et bien d'autres domaines. Enfin, vous apprendrez à optimiser vos modèles à l'aide d'Optuna pour le réglage des hyperparamètres.À la fin de ce cours, vous aurez acquis les compétences nécessaires pour appliquer ces techniques de pointe à des problèmes concrets et exploiter tout le potentiel du DRL.Prérequis
Intermediate Deep Learning with PyTorchReinforcement Learning with Gymnasium in Python1
Introduction to Deep Reinforcement Learning
Discover how deep reinforcement learning improves upon traditional Reinforcement Learning while studying and implementing your first Deep Q Learning algorithm.
2
Deep Q-learning
Dive into Deep Q-learning by implementing the original DQN algorithm, featuring Experience Replay, epsilon-greediness and fixed Q-targets. Beyond DQN, you will then explore two fascinating extensions that improve the performance and stability of Deep Q-learning: Double DQN and Prioritized Experience Replay.
3
Introduction to Policy Gradient Methods
Learn about the foundational concepts of policy gradient methods found in DRL. You will begin with the policy gradient theorem, which forms the basis for these methods. Then, you will implement the REINFORCE algorithm, a powerful approach to learning policies. The chapter will then guide you through Actor-Critic methods, focusing on the Advantage Actor-Critic (A2C) algorithm, which combines the strengths of both policy gradient and value-based methods to enhance learning efficiency and stability.
4
Proximal Policy Optimization and DRL Tips
Explore Proximal Policy Optimization (PPO) for robust DRL performance. Next, you will examine using an entropy bonus in PPO, which encourages exploration by preventing premature convergence to deterministic policies. You'll also learn about batch updates in policy gradient methods. Finally, you will learn about hyperparameter optimization with Optuna, a powerful tool for optimizing performance in your DRL models.
Apprentissage par renforcement profond en Python
Cours terminé
Obtenez un certificat de réussite
Ajoutez cette certification à votre profil LinkedIn, à votre CV ou à votre portfolioPartagez-la sur les réseaux sociaux et dans votre évaluation de performance
Inclus avecPremium or Teams
S'inscrire MaintenantRejoignez plus de 19 millions d'utilisateurs et commencez Apprentissage par renforcement profond en Python dès aujourd'hui !
Créez votre compte gratuit
ou
En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données seront hébergées aux États-Unis.