Cursus
Deep Reinforcement Learning in Python
GevorderdVaardigheidsniveau
Bijgewerkt 09-2024
PyTorchArtificial Intelligence4 u15 videos49 Opdrachten4,050 XP5,672Bewijs van Prestatie
Maak je kosteloos account aan
Ga verder met GoogleMeer opties weergevenof
Door verder te gaan accepteer je onze Gebruiksvoorwaarden, ons Privacybeleid en dat je gegevens worden opgeslagen in de VS.
Geliefd bij leerlingen van duizenden bedrijven
Een team trainen?
Probeer voor bedrijvenCursusbeschrijving
Leer de basis van diepgaand versterkend leren
Onze reis begint met de basis van DRL en hoe dat zich verhoudt tot traditioneel reinforcement learning. Van daaruit gaan we snel verder met het implementeren van Deep Q-Networks (DQN) in PyTorch, inclusief geavanceerde verfijningen zoals Double DQN en Prioritized Experience Replay om je modellen een boost te geven.Breng je vaardigheden naar een hoger niveau terwijl je beleidsmatige methoden ontdekt. Je leert en past belangrijke policy-gradient-technieken toe, zoals REINFORCE en Actor-Critic-methoden.Gebruik geavanceerde algoritmen
Je komt krachtige DRL-algoritmen tegen die tegenwoordig veel in de industrie worden gebruikt, zoals Proximal Policy Optimization (PPO). Je doet praktijkervaring op met de technieken die zorgen voor doorbraken in robotica, game-AI en nog veel meer. Tot slot leer je hoe je je modellen kunt verbeteren met Optuna voor het afstemmen van hyperparameters.Aan het einde van deze cursus heb je de vaardigheden om deze geavanceerde technieken toe te passen op echte problemen en het volledige potentieel van DRL te benutten!Vereisten
Intermediate Deep Learning with PyTorchReinforcement Learning with Gymnasium in Python1
Introductie tot Deep Reinforcement Learning
Ontdek hoe deep reinforcement learning voortbouwt op traditioneel Reinforcement Learning terwijl je je eerste Deep Q Learning-algoritme bestudeert en implementeert.
2
Deep Q-learning
Duik in Deep Q-learning door het originele DQN-algoritme te implementeren, met Experience Replay, epsilon-greediness en vaste Q-doelen. Voorbij DQN verken je daarna twee fascinerende uitbreidingen die de prestaties en stabiliteit van Deep Q-learning verbeteren: Double DQN en Prioritized Experience Replay.
3
Introductie tot Policy Gradient-methoden
Leer de basisconcepten van policy gradient-methoden binnen DRL. Je begint met het policy gradient-theorema, de basis voor deze methoden. Vervolgens implementeer je het REINFORCE-algoritme, een krachtige aanpak om policies te leren. Daarna ga je door met Actor-Critic-methoden, met de focus op het Advantage Actor-Critic (A2C)-algoritme, dat de sterke punten van policy gradient- en value-based methoden combineert om leerefficiëntie en stabiliteit te vergroten.
4
Proximal Policy Optimization en DRL-tips
Verken Proximal Policy Optimization (PPO) voor robuuste DRL-prestaties. Vervolgens bekijk je het gebruik van een entropiebonus in PPO, die exploratie stimuleert door voortijdige convergentie naar deterministische policies te voorkomen. Je leert ook over batchupdates in policy gradient-methoden. Tot slot leer je hyperparameteroptimalisatie met Optuna, een krachtige tool om de prestaties van je DRL-modellen te optimaliseren.
Deep Reinforcement Learning in Python
Cursus voltooid
Verdien een prestatieverklaring
Voeg deze referentie toe aan je LinkedIn-profiel, cv of curriculum vitaeDeel het op sociale media en in je functioneringsgesprekSchrijf je nu in
Sluit je aan bij meer dan 19 miljoen leerlingen en start vandaag nog met Deep Reinforcement Learning in Python!
Maak je kosteloos account aan
Ga verder met GoogleMeer opties weergevenof
Door verder te gaan accepteer je onze Gebruiksvoorwaarden, ons Privacybeleid en dat je gegevens worden opgeslagen in de VS.
Ontwikkel je datavaardigheden met DataCamp voor Mobiel
Maak vooruitgang onderweg met onze mobiele cursussen en dagelijkse 5-minuten programmeeruitdagingen.