Lewati ke konten utama
BerandaPython

Program

Pembelajaran Penguatan dalam Python

Diperbarui 03/2026
Kuasai dasar-dasar reinforcement learning (RL) untuk menciptakan model yang dapat menavigasi lingkungan dunia nyata yang kompleks dan melatih model bahasa besar (LLMs).
Mulai Track Secara Gratis

Termasuk denganPremium or Team

PythonMachine Learning12 jam3,760

Buat Akun Gratis Anda

atau

Dengan melanjutkan, Anda menerima Ketentuan Penggunaan kami, Kebijakan Privasi kami dan bahwa data Anda disimpan di Amerika Serikat.

Dipercaya oleh para pelajar di ribuan perusahaan

Group

Pelatihan untuk 2 orang atau lebih?

Coba DataCamp for Business

Deskripsi Track

Pembelajaran Penguatan dalam Python

Kuasai dasar-dasar reinforcement learning (RL) dan pelajari cara membangun model untuk menavigasi lingkungan kompleks yang sering ditemui dalam robotika dan permainan video.Jika Anda baru mengenal reinforcement learning atau ingin mendalami reinforcement learning sebagai cabang dari machine learning, ini adalah tempat yang ideal untuk memulai.Anda akan memulai dengan mempelajari konsep dasar pembelajaran penguatan, seperti proses keputusan Markov, keseimbangan antara eksplorasi dan eksploitasi, serta algoritma pemrograman dinamis. Anda akan belajar menerapkan Q-learning, SARSA, dan metode lain untuk menavigasi pegunungan dan danau beku dari perpustakaan Gymnasium.Anda akan menggabungkan deep learning dan reinforcement learning, dan menemukan deep reinforcement learning, yang dapat digunakan untuk melatih agen agar dapat menavigasi lingkungan yang sangat kompleks dengan sedikit pengawasan.Sepanjang perjalanan, Anda akan menerapkan teknik-teknik ini untuk menyelesaikan proyek-proyek nyata, termasuk mengoptimalkan rute taksi dan simulasi perdagangan saham.Dengan alat pembelajaran penguatan ini di tangan, Anda siap untuk mulai mengerjakan aplikasi baru yang menarik untuk pembelajaran penguatan: pembelajaran penguatan dari umpan balik manusia (RLHF). RLHF dapat digunakan untuk meningkatkan keluaran LLM dengan melatihnya berdasarkan umpan balik manusia terhadap responsnya.Mulailah perjalanan pembelajaran penguatan Anda hari ini!

Persyaratan

Tidak ada persyaratan untuk track ini
  • Course

    1

    Reinforcement Learning with Gymnasium in Python

    Start your reinforcement learning journey! Learn how agents can learn to solve environments through interactions.

  • Project

    bonus

    Taxi Route Optimization with Reinforcement Learning

    Solve the Taxi-v3 environment using Q-learning, ensuring efficient AI-driven transportation.

Pembelajaran Penguatan dalam Python
3 Kursus
Track
Selesai

Memperoleh Surat Keterangan Prestasi

Tambahkan kredensial ini ke profil LinkedIn, resume, atau CV Anda
Bagikan di media sosial dan dalam penilaian kinerja Anda

Termasuk denganPremium or Team

Daftar Sekarang

Bergabung dengan 19 juta pelajar dan mulai Pembelajaran Penguatan dalam Python Hari Ini!

Buat Akun Gratis Anda

atau

Dengan melanjutkan, Anda menerima Ketentuan Penggunaan kami, Kebijakan Privasi kami dan bahwa data Anda disimpan di Amerika Serikat.