Pembelajaran Penguatan dalam Python

Diperbarui 05/2026

Kuasai dasar-dasar reinforcement learning (RL) untuk menciptakan model yang dapat menavigasi lingkungan dunia nyata yang kompleks dan melatih model bahasa besar (LLMs).

Deskripsi Track

Pembelajaran Penguatan dalam Python

Kuasai dasar-dasar reinforcement learning (RL) dan pelajari cara membangun model untuk menavigasi lingkungan kompleks yang sering ditemui dalam robotika dan permainan video.Jika Anda baru mengenal reinforcement learning atau ingin mendalami reinforcement learning sebagai cabang dari machine learning, ini adalah tempat yang ideal untuk memulai.Anda akan memulai dengan mempelajari konsep dasar pembelajaran penguatan, seperti proses keputusan Markov, keseimbangan antara eksplorasi dan eksploitasi, serta algoritma pemrograman dinamis. Anda akan belajar menerapkan Q-learning, SARSA, dan metode lain untuk menavigasi pegunungan dan danau beku dari perpustakaan Gymnasium.Anda akan menggabungkan deep learning dan reinforcement learning, dan menemukan deep reinforcement learning, yang dapat digunakan untuk melatih agen agar dapat menavigasi lingkungan yang sangat kompleks dengan sedikit pengawasan.Sepanjang perjalanan, Anda akan menerapkan teknik-teknik ini untuk menyelesaikan proyek-proyek nyata, termasuk mengoptimalkan rute taksi dan simulasi perdagangan saham.Dengan alat pembelajaran penguatan ini di tangan, Anda siap untuk mulai mengerjakan aplikasi baru yang menarik untuk pembelajaran penguatan: pembelajaran penguatan dari umpan balik manusia (RLHF). RLHF dapat digunakan untuk meningkatkan keluaran LLM dengan melatihnya berdasarkan umpan balik manusia terhadap responsnya.Mulailah perjalanan pembelajaran penguatan Anda hari ini!

Persyaratan

Tidak ada persyaratan untuk track ini

Course
1
Reinforcement Learning dengan Gymnasium di Python
Mulailah perjalanan pembelajaran penguatan Anda! Pelajari bagaimana agen dapat belajar memecahkan lingkungan melalui interaksi.
Project
bonus
Taxi Route Optimization with Reinforcement Learning
Solve the Taxi-v3 environment using Q-learning, ensuring efficient AI-driven transportation.
Course
3
Deep Reinforcement Learning dengan Python
Pelajari dan terapkan algoritma Deep Reinforcement Learning yang canggih, termasuk teknik penyempurnaan dan optimasi.
Project
bonus
Stock Trading Simulation with Gymnasium
Train a simple reinforcement learning agent in stock trading simulation.
Course
5
Reinforcement Learning from Human Feedback (RLHF)

Pembelajaran Penguatan dalam Python

3 Kursus

Track
Selesai

Memperoleh Surat Keterangan Prestasi

Tambahkan kredensial ini ke profil LinkedIn, resume, atau CV Anda
Bagikan di media sosial dan dalam penilaian kinerja AndaDaftar sekarang

Pembelajaran Penguatan dalam Python

Melatih Tim?

Deskripsi Track

Pembelajaran Penguatan dalam Python

Persyaratan

Reinforcement Learning dengan Gymnasium di Python

Taxi Route Optimization with Reinforcement Learning

Deep Reinforcement Learning dengan Python

Stock Trading Simulation with Gymnasium

Reinforcement Learning from Human Feedback (RLHF)

Memperoleh Surat Keterangan Prestasi

Bergabung dengan 19 juta pelajar dan mulai Pembelajaran Penguatan dalam Python Hari Ini!

Kembangkan keterampilan data Anda dengan DataCamp untuk Mobile

Deskripsi Track

Pembelajaran Penguatan dalam Python

Memperoleh Surat Keterangan Prestasi

Bergabung dengan .css-nklxlk{color:var(--wf-brand--main, #03EF62);}19 juta pelajar dan mulai Pembelajaran Penguatan dalam Python Hari Ini!

Buat Akun Gratis Anda

Kembangkan keterampilan data Anda dengan DataCamp untuk Mobile

Bergabung dengan 19 juta pelajar dan mulai Pembelajaran Penguatan dalam Python Hari Ini!