Kursus
Deep Reinforcement Learning dengan Python
LanjutanTingkat Keterampilan
Diperbarui 09/2024Mulai Kursus Gratis
Termasuk denganPremium or Team
PyTorchArtificial Intelligence4 jam15 videos49 Latihan4,050 XP5,093Bukti Prestasi
Buat Akun Gratis Anda
atau
Dengan melanjutkan, Anda menerima Ketentuan Penggunaan kami, Kebijakan Privasi kami dan bahwa data Anda disimpan di Amerika Serikat.Dipercaya oleh para pelajar di ribuan perusahaan
Pelatihan untuk 2 orang atau lebih?
Coba DataCamp for BusinessDeskripsi Kursus
Menguasai Dasar-Dasar Pembelajaran Penguatan Mendalam
Perjalanan kami dimulai dengan dasar-dasar DRL dan hubungannya dengan Reinforcement Learning tradisional. Dari sana, kita segera beralih ke implementasi Deep Q-Networks (DQN) di PyTorch, termasuk penyempurnaan lanjutan seperti Double DQN dan Prioritized Experience Replay untuk meningkatkan kinerja model Anda.Tingkatkan keterampilan Anda ke level berikutnya saat Anda menjelajahi metode berbasis kebijakan. Anda akan mempelajari dan menerapkan teknik-teknik policy-gradient yang esensial, seperti REINFORCE dan metode Actor-Critic.Gunakan Algoritma Terkini
Anda akan menemui algoritma DRL yang kuat yang umum digunakan di industri saat ini, termasuk Proximal Policy Optimization (PPO). Anda akan memperoleh pengalaman praktis dalam menerapkan teknik-teknik yang mendorong terobosan di bidang robotika, kecerdasan buatan (AI) dalam permainan, dan bidang-bidang lainnya. Akhirnya, Anda akan belajar mengoptimalkan model Anda menggunakan Optuna untuk penyesuaian hiperparameter.Pada akhir kursus ini, Anda akan menguasai keterampilan untuk menerapkan teknik-teknik mutakhir ini pada masalah dunia nyata dan memanfaatkan potensi penuh DRL!Persyaratan
Intermediate Deep Learning with PyTorchReinforcement Learning with Gymnasium in Python1
Introduction to Deep Reinforcement Learning
Discover how deep reinforcement learning improves upon traditional Reinforcement Learning while studying and implementing your first Deep Q Learning algorithm.
2
Deep Q-learning
Dive into Deep Q-learning by implementing the original DQN algorithm, featuring Experience Replay, epsilon-greediness and fixed Q-targets. Beyond DQN, you will then explore two fascinating extensions that improve the performance and stability of Deep Q-learning: Double DQN and Prioritized Experience Replay.
3
Introduction to Policy Gradient Methods
Learn about the foundational concepts of policy gradient methods found in DRL. You will begin with the policy gradient theorem, which forms the basis for these methods. Then, you will implement the REINFORCE algorithm, a powerful approach to learning policies. The chapter will then guide you through Actor-Critic methods, focusing on the Advantage Actor-Critic (A2C) algorithm, which combines the strengths of both policy gradient and value-based methods to enhance learning efficiency and stability.
4
Proximal Policy Optimization and DRL Tips
Explore Proximal Policy Optimization (PPO) for robust DRL performance. Next, you will examine using an entropy bonus in PPO, which encourages exploration by preventing premature convergence to deterministic policies. You'll also learn about batch updates in policy gradient methods. Finally, you will learn about hyperparameter optimization with Optuna, a powerful tool for optimizing performance in your DRL models.
Deep Reinforcement Learning dengan Python
Kursus Selesai
Memperoleh Surat Keterangan Prestasi
Tambahkan kredensial ini ke profil LinkedIn, resume, atau CV AndaBagikan di media sosial dan dalam penilaian kinerja Anda
Termasuk denganPremium or Team
Daftar SekarangBergabung dengan 19 juta pelajar dan mulai Deep Reinforcement Learning dengan Python Hari Ini!
Buat Akun Gratis Anda
atau
Dengan melanjutkan, Anda menerima Ketentuan Penggunaan kami, Kebijakan Privasi kami dan bahwa data Anda disimpan di Amerika Serikat.