Cours
Apprentissage par renforcement profond en Python
AvancéNiveau de compétence
Actualisé 09/2024
PyTorchArtificial Intelligence4 h15 vidéos49 Exercices4,050 XP5,672Certificat de formation
Créez votre compte gratuitement
Continuer avec GoogleAfficher plus d’optionsou
En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données seront hébergées aux États-Unis.
Apprécié par des utilisateurs provenant de milliers d'entreprises
Former une équipe ?
Essayez pour les entreprisesDescription du cours
Maîtrisez les principes fondamentaux de l'apprentissage par renforcement profond
Notre parcours commence par les fondements du DRL et leur relation avec l'apprentissage par renforcement traditionnel. À partir de là, nous passons rapidement à la mise en œuvre des réseaux Deep Q-Networks (DQN) dans PyTorch, y compris des améliorations avancées telles que Double DQN et Prioritized Experience Replay pour optimiser vos modèles.Développez vos compétences en découvrant les méthodes basées sur les politiques. Vous apprendrez et mettrez en œuvre des techniques essentielles de gradient de politique telles que les méthodes REINFORCE et Actor-Critic.Utilisez des algorithmes de pointe
Vous découvrirez de puissants algorithmes DRL couramment utilisés dans l'industrie aujourd'hui, notamment l'optimisation de la politique proximale (PPO). Vous acquerrez une expérience pratique des techniques qui révolutionnent la robotique, l'intelligence artificielle dans les jeux vidéo et bien d'autres domaines. Enfin, vous apprendrez à optimiser vos modèles à l'aide d'Optuna pour le réglage des hyperparamètres.À la fin de ce cours, vous aurez acquis les compétences nécessaires pour appliquer ces techniques de pointe à des problèmes concrets et exploiter tout le potentiel du DRL.Prérequis
Intermediate Deep Learning with PyTorchReinforcement Learning with Gymnasium in Python1
Introduction à l'apprentissage par renforcement profond
Découvrez comment l'apprentissage par renforcement profond améliore l'apprentissage par renforcement traditionnel tout en étudiant et en mettant en œuvre votre premier algorithme d'apprentissage profond par Q.
2
Apprentissage profond par Q
Explorez le Deep Q-learning en mettant en œuvre l'algorithme DQN original, qui comprend la réutilisation de l'expérience, l'epsilon-greediness et des cibles Q fixes. Au-delà du DQN, vous explorerez ensuite deux extensions intéressantes qui améliorent les performances et la stabilité du Deep Q-learning : Double DQN et relecture d'expérience priorisée.
3
Introduction aux méthodes de gradient de politique
Découvrez les concepts fondamentaux des méthodes de gradient de politique dans le domaine du DRL. Vous commencerez par le théorème du gradient de la politique, qui constitue la base de ces méthodes. Ensuite, vous implémenterez l'algorithme REINFORCE, une approche puissante pour l'apprentissage des politiques. Ce chapitre vous guidera ensuite à travers les méthodes Actor-Critic, en mettant l'accent sur l'algorithme Advantage Actor-Critic (A2C), qui combine les forces des méthodes basées sur le gradient de politique et celles basées sur la valeur afin d'améliorer l'efficacité et la stabilité de l'apprentissage.
4
Optimisation de la politique proximale et conseils pour le DRL
Découvrez l'optimisation de la politique proximale (PPO) pour des performances DRL robustes. Ensuite, vous examinerez l'utilisation d'un bonus d'entropie dans le PPO, qui encourage l'exploration en empêchant la convergence prématurée vers des politiques déterministes. Vous découvrirez également les mises à jour par lots dans les méthodes de gradient de politique. Enfin, vous découvrirez l'optimisation des hyperparamètres avec Optuna, un outil puissant permettant d'optimiser les performances de vos modèles DRL.
Apprentissage par renforcement profond en Python
Cours terminé
Obtenez un certificat de réussite
Ajoutez cette certification à votre profil LinkedIn, à votre CV ou à votre portfolioPartagez-la sur les réseaux sociaux et dans votre évaluation de performanceS'inscrire maintenant
Rejoignez plus de 19 millions d'utilisateurs et commencez Apprentissage par renforcement profond en Python dès aujourd'hui !
Créez votre compte gratuitement
Continuer avec GoogleAfficher plus d’optionsou
En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données seront hébergées aux États-Unis.
Apprenez où que vous soyez avec l'application DataCamp
Progressez où que vous soyez grâce à nos cours conçus pour mobile et à nos défis quotidiens de 5 minutes.