Corso
Deep Reinforcement Learning in Python
AvanzatoLivello di competenza
Aggiornato 09/2024
PyTorchArtificial Intelligence4 h15 video49 Esercizi4,050 XP5,678Attestato di conseguimento
Crea il tuo account gratuito
Continua con GoogleMostra più opzionio
Continuando, accetti i nostri Termini di utilizzo, la nostra Informativa sulla privacy e che i tuoi dati siano conservati negli Stati Uniti.
Preferito dagli studenti di migliaia di aziende
Formare un team?
Prova per il BusinessDescrizione del corso
Impara le basi del deep reinforcement learning
Il nostro viaggio inizia con le basi del DRL e come si collega al tradizionale Reinforcement Learning. Da lì, passiamo subito a implementare le Deep Q-Networks (DQN) in PyTorch, con alcune cose avanzate come Double DQN e Prioritized Experience Replay per potenziare i tuoi modelli.Porta le tue abilità al livello successivo mentre scopri i metodi basati sulle politiche. Imparerai e metterai in pratica tecniche essenziali di policy gradient come REINFORCE e Actor-Critic.Usa algoritmi all'avanguardia
Troverai potenti algoritmi DRL che si usano spesso nel settore oggi, tipo Proximal Policy Optimization (PPO). Acquisirai esperienza pratica con le tecniche che stanno portando a grandi innovazioni nella robotica, nell'intelligenza artificiale dei videogiochi e in altri campi. Infine, imparerai a ottimizzare i tuoi modelli usando Optuna per la regolazione degli iperparametri.Alla fine di questo corso, avrai imparato come usare queste tecniche all'avanguardia per risolvere problemi reali e sfruttare al massimo il potenziale del DRL!Prerequisiti
Intermediate Deep Learning with PyTorchReinforcement Learning with Gymnasium in Python1
Introduzione al Deep Reinforcement Learning
Scopri come il deep reinforcement learning migliora il Reinforcement Learning tradizionale mentre studi e implementi il tuo primo algoritmo di Deep Q Learning.
2
Deep Q-learning
Immergiti nel Deep Q-learning implementando l'algoritmo DQN originale, con Experience Replay, epsilon-greedy e Q-target fissi. Oltre al DQN, esplorerai poi due estensioni interessanti che migliorano le prestazioni e la stabilità del Deep Q-learning: Double DQN e Prioritized Experience Replay.
3
Introduzione ai metodi Policy Gradient
Apprendi i concetti fondamentali dei metodi policy gradient utilizzati nel DRL. Inizierai dal teorema del policy gradient, che è alla base di questi metodi. Poi implementerai l'algoritmo REINFORCE, un approccio potente per apprendere le policy. Il capitolo ti guiderà quindi nei metodi Actor-Critic, concentrandosi sull'algoritmo Advantage Actor-Critic (A2C), che unisce i punti di forza dei metodi basati su policy e di quelli basati su valore per migliorare efficienza e stabilità dell'apprendimento.
4
Proximal Policy Optimization e consigli per il DRL
Esplora Proximal Policy Optimization (PPO) per ottenere prestazioni robuste nel DRL. In seguito, analizzerai l'uso dell'entropy bonus in PPO, che incoraggia l'esplorazione prevenendo una convergenza prematura verso policy deterministic. Imparerai anche gli aggiornamenti in batch nei metodi policy gradient. Infine, scoprirai l'ottimizzazione degli iperparametri con Optuna, uno strumento potente per ottimizzare le prestazioni dei tuoi modelli di DRL.
Deep Reinforcement Learning in Python
Corso completato
Ottieni Attestato di conseguimento
Aggiungi questa certificazione al tuo profilo LinkedIn, al curriculum o al CVCondividila sui social e nella valutazione delle tue performanceIscriviti ora
Unisciti a oltre 19 milioni di studenti e inizia Deep Reinforcement Learning in Python oggi!
Crea il tuo account gratuito
Continua con GoogleMostra più opzionio
Continuando, accetti i nostri Termini di utilizzo, la nostra Informativa sulla privacy e che i tuoi dati siano conservati negli Stati Uniti.
Aumenta le tue competenze sui dati con l'app di DataCamp
Avanza ovunque ti trovi con i nostri corsi per dispositivi mobili e le nostre sfide di programmazione quotidiane da 5 minuti.