Ir al contenido principal
InicioPyTorch

Curso

Aprendizaje profundo por refuerzo en Python

AvanzadoNivel de habilidad
Actualizado 9/2024
Aprende y utiliza potentes algoritmos de Aprendizaje Profundo por Refuerzo, incluyendo técnicas de refinamiento y optimización.
Comienza El Curso Gratis
PyTorchArtificial Intelligence4 h15 vídeos49 Ejercicios4,050 XP5,338Certificado de logros

Crea Tu Cuenta Gratuita

o

Al continuar, aceptas nuestros Términos de uso, nuestra Política de privacidad y que tus datos se almacenen en los EE. UU.

Preferido por estudiantes en miles de empresas

Group

¿Formar a 2 o más personas?

Probar DataCamp for Business

Descripción del curso

Descubre las técnicas de vanguardia que permiten a las máquinas aprender e interactuar con su entorno. Te sumergirás en el mundo del Aprendizaje por Refuerzo Profundo (DRL) y adquirirás experiencia práctica con los algoritmos más potentes que hacen avanzar este campo. Utilizarás PyTorch y el entorno Gymnasium para construir tus propios agentes.

Domina los fundamentos del aprendizaje profundo por refuerzo

Nuestro viaje comienza con los fundamentos del DRL y su relación con el Aprendizaje por Refuerzo tradicional. A partir de ahí, pasamos rápidamente a implementar Deep Q-Networks (DQN) en PyTorch, incluyendo refinamientos avanzados como Double DQN y Prioritized Experience Replay para potenciar tus modelos.Lleva tus habilidades al siguiente nivel explorando métodos basados en políticas. Aprenderás y aplicarás técnicas esenciales de gradiente de políticas, como los métodos REINFORCE y Actor-Crítico.

Utiliza algoritmos de vanguardia

Te encontrarás con potentes algoritmos DRL de uso común en la industria actual, incluida la Optimización de la Política Próxima (PPO). Adquirirás experiencia práctica con las técnicas que impulsan los avances en robótica, IA de juegos y mucho más. Por último, aprenderás a optimizar tus modelos utilizando Optuna para el ajuste de hiperparámetros.Al final de este curso, habrás adquirido los conocimientos necesarios para aplicar estas técnicas de vanguardia a problemas del mundo real y aprovechar todo el potencial de DRL.

Requisitos previos

Intermediate Deep Learning with PyTorchReinforcement Learning with Gymnasium in Python
1

Introduction to Deep Reinforcement Learning

Discover how deep reinforcement learning improves upon traditional Reinforcement Learning while studying and implementing your first Deep Q Learning algorithm.
Iniciar Capítulo
2

Deep Q-learning

3

Introduction to Policy Gradient Methods

Learn about the foundational concepts of policy gradient methods found in DRL. You will begin with the policy gradient theorem, which forms the basis for these methods. Then, you will implement the REINFORCE algorithm, a powerful approach to learning policies. The chapter will then guide you through Actor-Critic methods, focusing on the Advantage Actor-Critic (A2C) algorithm, which combines the strengths of both policy gradient and value-based methods to enhance learning efficiency and stability.
Iniciar Capítulo
4

Proximal Policy Optimization and DRL Tips

Explore Proximal Policy Optimization (PPO) for robust DRL performance. Next, you will examine using an entropy bonus in PPO, which encourages exploration by preventing premature convergence to deterministic policies. You'll also learn about batch updates in policy gradient methods. Finally, you will learn about hyperparameter optimization with Optuna, a powerful tool for optimizing performance in your DRL models.
Iniciar Capítulo
Aprendizaje profundo por refuerzo en Python
Curso
completo

Obtener certificado de logros

Añade esta certificación a tu perfil de LinkedIn o a tu currículum.
Compártelo en redes sociales y en tu evaluación de desempeño.
Inscríbete Ahora

¡Únete a 19 millones de estudiantes y empieza Aprendizaje profundo por refuerzo en Python hoy mismo!

Crea Tu Cuenta Gratuita

o

Al continuar, aceptas nuestros Términos de uso, nuestra Política de privacidad y que tus datos se almacenen en los EE. UU.

Desarrolla tus habilidades de datos con la aplicación móvil de DataCamp

Progresa desde cualquier dispositivo móvil con nuestros cursos y desafíos de programación diarios de 5 minutos.