Curso
Aprendizado por reforço profundo em Python
AvançadoNível de habilidade
Atualizado 09/2024Iniciar Curso Gratuitamente
Incluído comPremium or Teams
PyTorchArtificial Intelligence4 h15 vídeos49 Exercícios4,050 XP5,087Certificado de conclusão
Crie sua conta gratuita
ou
Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados serão armazenados nos EUA.Preferido por alunos de milhares de empresas
Treinar 2 ou mais pessoas?
Experimentar DataCamp for BusinessDescrição do curso
Domine os fundamentos da aprendizagem por reforço profundo
Nossa jornada começa com os fundamentos do DRL e sua relação com o aprendizado por reforço tradicional. A partir daí, passamos rapidamente à implementação de Deep Q-Networks (DQN) no PyTorch, incluindo refinamentos avançados, como Double DQN e Prioritized Experience Replay, para turbinar seus modelos.Leve suas habilidades para o próximo nível enquanto você explora métodos baseados em políticas. Você aprenderá e implementará técnicas essenciais de gradiente de política, como os métodos REINFORCE e Actor-Critic.Use algoritmos de ponta
Você encontrará algoritmos poderosos de DRL comumente usados no setor atualmente, incluindo o Proximal Policy Optimization (PPO). Você ganhará experiência prática com as técnicas que impulsionam as inovações em robótica, IA de jogos e muito mais. Por fim, você aprenderá a otimizar seus modelos usando o Optuna para ajuste de hiperparâmetros.Ao final deste curso, você terá adquirido as habilidades para aplicar essas técnicas de ponta a problemas do mundo real e aproveitar todo o potencial do DRL!Pré-requisitos
Intermediate Deep Learning with PyTorchReinforcement Learning with Gymnasium in Python1
Introduction to Deep Reinforcement Learning
Discover how deep reinforcement learning improves upon traditional Reinforcement Learning while studying and implementing your first Deep Q Learning algorithm.
2
Deep Q-learning
Dive into Deep Q-learning by implementing the original DQN algorithm, featuring Experience Replay, epsilon-greediness and fixed Q-targets. Beyond DQN, you will then explore two fascinating extensions that improve the performance and stability of Deep Q-learning: Double DQN and Prioritized Experience Replay.
3
Introduction to Policy Gradient Methods
Learn about the foundational concepts of policy gradient methods found in DRL. You will begin with the policy gradient theorem, which forms the basis for these methods. Then, you will implement the REINFORCE algorithm, a powerful approach to learning policies. The chapter will then guide you through Actor-Critic methods, focusing on the Advantage Actor-Critic (A2C) algorithm, which combines the strengths of both policy gradient and value-based methods to enhance learning efficiency and stability.
4
Proximal Policy Optimization and DRL Tips
Explore Proximal Policy Optimization (PPO) for robust DRL performance. Next, you will examine using an entropy bonus in PPO, which encourages exploration by preventing premature convergence to deterministic policies. You'll also learn about batch updates in policy gradient methods. Finally, you will learn about hyperparameter optimization with Optuna, a powerful tool for optimizing performance in your DRL models.
Aprendizado por reforço profundo em Python
Curso concluído
Obtenha um certificado de conclusão
Adicione esta credencial ao seu perfil do LinkedIn, currículo ou CVCompartilhe nas redes sociais e em sua avaliação de desempenho
Incluído comPremium or Teams
Inscreva-se AgoraFaça como mais de 19 milhões de alunos e comece Aprendizado por reforço profundo em Python hoje mesmo!
Crie sua conta gratuita
ou
Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados serão armazenados nos EUA.