Cursus
Deep Reinforcement Learning in Python
GevorderdVaardigheidsniveau
Bijgewerkt 09-2024Start Cursus Kosteloos
Inbegrepen bijPremium or Teams
PyTorchArtificial Intelligence4 u15 videos49 Opdrachten4,050 XP5,089Prestatieverklaring
Maak je gratis account aan
of
Door verder te gaan accepteer je onze Gebruiksvoorwaarden, ons Privacybeleid en dat je gegevens worden opgeslagen in de VS.Geliefd bij leerlingen van duizenden bedrijven
Wil je 2 of meer mensen trainen?
Probeer DataCamp for BusinessCursusbeschrijving
Leer de basis van diepgaand versterkend leren
Onze reis begint met de basis van DRL en hoe dat zich verhoudt tot traditioneel reinforcement learning. Van daaruit gaan we snel verder met het implementeren van Deep Q-Networks (DQN) in PyTorch, inclusief geavanceerde verfijningen zoals Double DQN en Prioritized Experience Replay om je modellen een boost te geven.Breng je vaardigheden naar een hoger niveau terwijl je beleidsmatige methoden ontdekt. Je leert en past belangrijke policy-gradient-technieken toe, zoals REINFORCE en Actor-Critic-methoden.Gebruik geavanceerde algoritmen
Je komt krachtige DRL-algoritmen tegen die tegenwoordig veel in de industrie worden gebruikt, zoals Proximal Policy Optimization (PPO). Je doet praktijkervaring op met de technieken die zorgen voor doorbraken in robotica, game-AI en nog veel meer. Tot slot leer je hoe je je modellen kunt verbeteren met Optuna voor het afstemmen van hyperparameters.Aan het einde van deze cursus heb je de vaardigheden om deze geavanceerde technieken toe te passen op echte problemen en het volledige potentieel van DRL te benutten!Vereisten
Intermediate Deep Learning with PyTorchReinforcement Learning with Gymnasium in Python1
Introduction to Deep Reinforcement Learning
Discover how deep reinforcement learning improves upon traditional Reinforcement Learning while studying and implementing your first Deep Q Learning algorithm.
2
Deep Q-learning
Dive into Deep Q-learning by implementing the original DQN algorithm, featuring Experience Replay, epsilon-greediness and fixed Q-targets. Beyond DQN, you will then explore two fascinating extensions that improve the performance and stability of Deep Q-learning: Double DQN and Prioritized Experience Replay.
3
Introduction to Policy Gradient Methods
Learn about the foundational concepts of policy gradient methods found in DRL. You will begin with the policy gradient theorem, which forms the basis for these methods. Then, you will implement the REINFORCE algorithm, a powerful approach to learning policies. The chapter will then guide you through Actor-Critic methods, focusing on the Advantage Actor-Critic (A2C) algorithm, which combines the strengths of both policy gradient and value-based methods to enhance learning efficiency and stability.
4
Proximal Policy Optimization and DRL Tips
Explore Proximal Policy Optimization (PPO) for robust DRL performance. Next, you will examine using an entropy bonus in PPO, which encourages exploration by preventing premature convergence to deterministic policies. You'll also learn about batch updates in policy gradient methods. Finally, you will learn about hyperparameter optimization with Optuna, a powerful tool for optimizing performance in your DRL models.
Deep Reinforcement Learning in Python
Cursus voltooid
Verdien een prestatieverklaring
Voeg deze referentie toe aan je LinkedIn-profiel, cv of curriculum vitaeDeel het op sociale media en in je functioneringsgesprek
Inbegrepen bijPremium or Teams
Schrijf Je Nu inSluit je aan bij meer dan 19 miljoen leerlingen en start vandaag nog met Deep Reinforcement Learning in Python!
Maak je gratis account aan
of
Door verder te gaan accepteer je onze Gebruiksvoorwaarden, ons Privacybeleid en dat je gegevens worden opgeslagen in de VS.