Kursus
Deep Reinforcement Learning dengan Python
LanjutanTingkat Keterampilan
Diperbarui 09/2024
PyTorchArtificial Intelligence4 jam15 videos49 Latihan4,050 XP5,672Pernyataan Pencapaian
Buat Akun Gratis Anda
Lanjutkan dengan GoogleTampilkan opsi lainnyaatau
Dengan melanjutkan, Anda menerima Ketentuan Penggunaan kami, Kebijakan Privasi kami dan bahwa data Anda disimpan di Amerika Serikat.
Dipercaya oleh para pelajar di ribuan perusahaan
Melatih Tim?
Coba untuk BisnisDeskripsi Kursus
Menguasai Dasar-Dasar Pembelajaran Penguatan Mendalam
Perjalanan kami dimulai dengan dasar-dasar DRL dan hubungannya dengan Reinforcement Learning tradisional. Dari sana, kita segera beralih ke implementasi Deep Q-Networks (DQN) di PyTorch, termasuk penyempurnaan lanjutan seperti Double DQN dan Prioritized Experience Replay untuk meningkatkan kinerja model Anda.Tingkatkan keterampilan Anda ke level berikutnya saat Anda menjelajahi metode berbasis kebijakan. Anda akan mempelajari dan menerapkan teknik-teknik policy-gradient yang esensial, seperti REINFORCE dan metode Actor-Critic.Gunakan Algoritma Terkini
Anda akan menemui algoritma DRL yang kuat yang umum digunakan di industri saat ini, termasuk Proximal Policy Optimization (PPO). Anda akan memperoleh pengalaman praktis dalam menerapkan teknik-teknik yang mendorong terobosan di bidang robotika, kecerdasan buatan (AI) dalam permainan, dan bidang-bidang lainnya. Akhirnya, Anda akan belajar mengoptimalkan model Anda menggunakan Optuna untuk penyesuaian hiperparameter.Pada akhir kursus ini, Anda akan menguasai keterampilan untuk menerapkan teknik-teknik mutakhir ini pada masalah dunia nyata dan memanfaatkan potensi penuh DRL!Persyaratan
Intermediate Deep Learning with PyTorchReinforcement Learning with Gymnasium in Python1
Pengantar Deep Reinforcement Learning
Pelajari bagaimana deep reinforcement learning menyempurnakan Reinforcement Learning tradisional sekaligus mempelajari dan mengimplementasikan algoritma Deep Q Learning pertama Anda.
2
Deep Q-learning
Dalami Deep Q-learning dengan mengimplementasikan algoritma DQN asli, menampilkan Experience Replay, epsilon-greediness, dan fixed Q-targets. Melampaui DQN, Anda kemudian akan mengeksplorasi dua ekstensi menarik yang meningkatkan kinerja dan stabilitas Deep Q-learning: Double DQN dan Prioritized Experience Replay.
3
Pengantar Metode Policy Gradient
Pelajari konsep dasar metode policy gradient yang terdapat dalam DRL. Anda akan memulai dengan teorema policy gradient, yang menjadi dasar metode ini. Selanjutnya, Anda akan mengimplementasikan algoritma REINFORCE, sebuah pendekatan yang kuat untuk mempelajari kebijakan. Bab ini kemudian akan memandu Anda melalui metode Actor-Critic, berfokus pada algoritma Advantage Actor-Critic (A2C), yang menggabungkan kekuatan metode policy gradient dan berbasis nilai untuk meningkatkan efisiensi dan stabilitas pembelajaran.
4
Proximal Policy Optimization dan Tips DRL
Jelajahi Proximal Policy Optimization (PPO) untuk kinerja DRL yang tangguh. Selanjutnya, Anda akan mempelajari penggunaan entropy bonus dalam PPO, yang mendorong eksplorasi dengan mencegah konvergensi prematur ke kebijakan deterministik. Anda juga akan mempelajari pembaruan batch dalam metode policy gradient. Terakhir, Anda akan mempelajari pengoptimalan hiperparameter dengan Optuna, alat yang ampuh untuk mengoptimalkan kinerja pada model DRL Anda.
Deep Reinforcement Learning dengan Python
Kursus Selesai
Memperoleh Surat Keterangan Prestasi
Tambahkan kredensial ini ke profil LinkedIn, resume, atau CV AndaBagikan di media sosial dan dalam penilaian kinerja AndaDaftar sekarang
Bergabung dengan 19 juta pelajar dan mulai Deep Reinforcement Learning dengan Python Hari Ini!
Buat Akun Gratis Anda
Lanjutkan dengan GoogleTampilkan opsi lainnyaatau
Dengan melanjutkan, Anda menerima Ketentuan Penggunaan kami, Kebijakan Privasi kami dan bahwa data Anda disimpan di Amerika Serikat.
Kembangkan keterampilan data Anda dengan DataCamp untuk Mobile
Buat kemajuan di mana saja dengan kursus mobile kami dan tantangan coding harian 5 menit.