Lewati ke konten utama
BerandaPython

Program

Pembelajaran Penguatan dalam Python

Diperbarui 03/2026
Kuasai dasar-dasar reinforcement learning (RL) untuk menciptakan model yang dapat menavigasi lingkungan dunia nyata yang kompleks dan melatih model bahasa besar (LLMs).
Mulai Track Secara Gratis
PythonMachine Learning12 jam3,970

Buat Akun Gratis Anda

atau

Dengan melanjutkan, Anda menerima Ketentuan Penggunaan kami, Kebijakan Privasi kami dan bahwa data Anda disimpan di Amerika Serikat.

Dipercaya oleh para pelajar di ribuan perusahaan

Group

Pelatihan untuk 2 orang atau lebih?

Coba DataCamp for Business

Deskripsi Track

Pembelajaran Penguatan dalam Python

Kuasai dasar-dasar reinforcement learning (RL) dan pelajari cara membangun model untuk menavigasi lingkungan kompleks yang sering ditemui dalam robotika dan permainan video.Jika Anda baru mengenal reinforcement learning atau ingin mendalami reinforcement learning sebagai cabang dari machine learning, ini adalah tempat yang ideal untuk memulai.Anda akan memulai dengan mempelajari konsep dasar pembelajaran penguatan, seperti proses keputusan Markov, keseimbangan antara eksplorasi dan eksploitasi, serta algoritma pemrograman dinamis. Anda akan belajar menerapkan Q-learning, SARSA, dan metode lain untuk menavigasi pegunungan dan danau beku dari perpustakaan Gymnasium.Anda akan menggabungkan deep learning dan reinforcement learning, dan menemukan deep reinforcement learning, yang dapat digunakan untuk melatih agen agar dapat menavigasi lingkungan yang sangat kompleks dengan sedikit pengawasan.Sepanjang perjalanan, Anda akan menerapkan teknik-teknik ini untuk menyelesaikan proyek-proyek nyata, termasuk mengoptimalkan rute taksi dan simulasi perdagangan saham.Dengan alat pembelajaran penguatan ini di tangan, Anda siap untuk mulai mengerjakan aplikasi baru yang menarik untuk pembelajaran penguatan: pembelajaran penguatan dari umpan balik manusia (RLHF). RLHF dapat digunakan untuk meningkatkan keluaran LLM dengan melatihnya berdasarkan umpan balik manusia terhadap responsnya.Mulailah perjalanan pembelajaran penguatan Anda hari ini!

Persyaratan

Tidak ada persyaratan untuk track ini
  • Course

    1

    Reinforcement Learning dengan Gymnasium di Python

    Mulailah perjalanan pembelajaran penguatan Anda! Pelajari bagaimana agen dapat belajar memecahkan lingkungan melalui interaksi.

  • Project

    bonus

    Taxi Route Optimization with Reinforcement Learning

    Solve the Taxi-v3 environment using Q-learning, ensuring efficient AI-driven transportation.

Pembelajaran Penguatan dalam Python
3 Kursus
Track
Selesai

Memperoleh Surat Keterangan Prestasi

Tambahkan kredensial ini ke profil LinkedIn, resume, atau CV Anda
Bagikan di media sosial dan dalam penilaian kinerja Anda
Daftar Sekarang

Bergabung dengan 19 juta pelajar dan mulai Pembelajaran Penguatan dalam Python Hari Ini!

Buat Akun Gratis Anda

atau

Dengan melanjutkan, Anda menerima Ketentuan Penggunaan kami, Kebijakan Privasi kami dan bahwa data Anda disimpan di Amerika Serikat.

Kembangkan keterampilan data Anda dengan DataCamp untuk Mobile

Buat kemajuan di mana saja dengan kursus mobile kami dan tantangan coding harian 5 menit.