Ir al contenido principal
InicioPython

Curso

Reinforcement Learning con Gymnasium en Python

AvanzadoNivel de habilidad
Actualizado 9/2024
¡Empieza tu viaje en el aprendizaje por refuerzo! Aprende cómo los agentes pueden aprender a resolver entornos a través de interacciones.
Comienza el curso gratis
PythonArtificial Intelligence
4 h
15 vídeos
52 Ejercicios
4,400 XP
12,967
Certificado de logros

Crea tu cuenta gratuita

Continuar con GoogleMostrar más opciones

o


Al continuar, aceptas nuestros Términos de uso, nuestra Política de privacidad y que tus datos se almacenen en los EE. UU.

Preferido por estudiantes en miles de empresas

Group

¿Formando un equipo?

Prueba para empresas

Descripción del curso

Descubre el mundo del aprendizaje por refuerzo

Embárcate en un apasionante viaje por el aprendizaje por refuerzo (RL), una rama fundamental del machine learning. Este curso interactivo te lleva a un recorrido completo por los principios básicos del aprendizaje por refuerzo, donde dominarás el arte de entrenar agentes inteligentes, enseñándoles a tomar decisiones estratégicas y a maximizar las recompensas.

Domina los conceptos y herramientas esenciales

Tu aventura empieza con una inmersión profunda en los aspectos únicos de RL. No solo aprenderás los conceptos básicos del aprendizaje por reinforcement, sino que también aplicarás algoritmos clave de este campo a situaciones prácticas utilizando el reconocido kit de herramientas OpenAI Gym. Este enfoque práctico garantiza una comprensión profunda de los fundamentos del aprendizaje por refuerzo.

Explora estrategias y aplicaciones avanzadas

A medida que avance tu viaje, te adentrarás en el mundo de las estrategias avanzadas de RL para descubrir las complejidades de los métodos de Monte Carlo, el aprendizaje por diferencias temporales y el Q-learning. Si dominas estas técnicas en Python, serás capaz de entrenar agentes para una gran variedad de tareas complejas.

Convierte lo que aprendes en un impacto real

Al terminar este curso, habrás adquirido un profundo conocimiento de la teoría del aprendizaje por refuerzo y contarás con las habilidades necesarias para aplicarla de forma creativa en situaciones reales. Estarás listo para crear modelos de RL en Python, lo que te abrirá un mundo de posibilidades en tus proyectos y en tu carrera profesional.

Requisitos previos

Supervised Learning with scikit-learnPython ToolboxIntroduction to NumPy
1

Introducción al Reinforcement Learning

Sumérgete en el mundo del Reinforcement Learning (RL) explorando sus conceptos, roles y aplicaciones fundamentales. Recorre el marco de RL, descubriendo la interacción agente-entorno. También aprenderás a usar la biblioteca Gymnasium para crear entornos, visualizar estados y ejecutar acciones, obteniendo así una base práctica en conceptos y aplicaciones de RL.
Iniciar capítulo
2

Aprendizaje basado en modelos

Profundiza en el mundo del RL centrándote en el aprendizaje basado en modelos. Desentraña la complejidad de los Procesos de Decisión de Markov (MDP) y comprende sus componentes esenciales. Amplía tus habilidades aprendiendo sobre políticas y funciones de valor. Domina la optimización de políticas con las técnicas de iteración de políticas e iteración de valores.
Iniciar capítulo
3

Aprendizaje libre de modelo

Emprende un recorrido por el dinámico ámbito del aprendizaje libre de modelo en RL. Descubre los métodos Monte Carlo fundamentales y aplica los algoritmos de predicción Monte Carlo de primera visita y de todas las visitas. Da el salto al aprendizaje por Diferencia Temporal, explorando el algoritmo SARSA. Por último, adéntrate en Q-Learning y analiza su convergencia en entornos desafiantes.
Iniciar capítulo
4

Estrategias avanzadas en RL libre de modelo

Profundiza en estrategias avanzadas en RL libre de modelo, centradas en mejorar los algoritmos de toma de decisiones. Aprende Expected SARSA para actualizar políticas con mayor precisión y Double Q-learning para mitigar el sesgo de sobreestimación. Explora la compensación exploración-explotación, dominando las estrategias epsilon-greedy y epsilon-decay para seleccionar acciones de forma óptima. Afronta el problema del bandido de varios brazos aplicando estrategias para resolver decisiones bajo incertidumbre.
Iniciar capítulo
Reinforcement Learning con Gymnasium en Python
Curso
completo

Obtener certificado de logros

Añade esta certificación a tu perfil de LinkedIn o a tu currículum.
Compártelo en redes sociales y en tu evaluación de desempeño.
Inscríbete ahora

¡Únete a 19 millones de estudiantes y empieza Reinforcement Learning con Gymnasium en Python hoy mismo!

Crea tu cuenta gratuita

Continuar con GoogleMostrar más opciones

o


Al continuar, aceptas nuestros Términos de uso, nuestra Política de privacidad y que tus datos se almacenen en los EE. UU.

Desarrolla tus habilidades de datos con la aplicación móvil de DataCamp

Progresa desde cualquier dispositivo móvil con nuestros cursos y desafíos de programación diarios de 5 minutos.