Kursus
Reinforcement Learning from Human Feedback (RLHF)
LanjutanTingkat Keterampilan
Diperbarui 10/2024
PythonArtificial Intelligence4 jam13 videos38 Latihan2,900 XP3,670Pernyataan Pencapaian
Buat Akun Gratis Anda
Lanjutkan dengan GoogleTampilkan opsi lainnyaatau
Dengan melanjutkan, Anda menerima Ketentuan Penggunaan kami, Kebijakan Privasi kami dan bahwa data Anda disimpan di Amerika Serikat.
Dipercaya oleh para pelajar di ribuan perusahaan
Melatih Tim?
Coba untuk BisnisDeskripsi Kursus
Persyaratan
Deep Reinforcement Learning in Python1
Konsep Dasar
Bab ini memperkenalkan dasar-dasar Reinforcement Learning with Human Feedback (RLHF), sebuah teknik yang menggunakan masukan manusia untuk membantu model AI belajar lebih efektif. Mulailah dengan RLHF dengan memahami perbedaannya dari reinforcement learning tradisional dan mengapa umpan balik manusia dapat meningkatkan kinerja AI di berbagai domain.
2
Mengumpulkan Umpan Balik Manusia
Pelajari cara menyiapkan sistem untuk mengumpulkan umpan balik manusia dalam Bab ini. Kuasai praktik terbaik untuk mengumpulkan data berkualitas tinggi, dari perbandingan berpasangan hingga pengambilan sampel berbasis ketidakpastian, serta jelajahi strategi untuk meningkatkan pengumpulan data Anda.
3
Penyelarasan Model dengan Umpan Balik Manusia
Dalam Bab ini, Anda akan masuk ke inti pelatihan Reinforcement Learning from Human Feedback. Ini mencakup penjelajahan fine-tuning dengan PPO, teknik untuk melatih secara efisien, dan menangani potensi penyimpangan dari tujuan metrik Anda.
4
Evaluasi Model
Jelajahi teknik-teknik kunci untuk menilai dan meningkatkan kinerja model dalam Bab terakhir Reinforcement Learning from Human Feedback (RLHF): mulai dari penyetelan metrik hingga mengintegrasikan beragam sumber umpan balik, Anda akan mendapatkan seperangkat alat komprehensif untuk menyempurnakan model secara efektif.
Reinforcement Learning from Human Feedback (RLHF)
Kursus Selesai
Memperoleh Surat Keterangan Prestasi
Tambahkan kredensial ini ke profil LinkedIn, resume, atau CV AndaBagikan di media sosial dan dalam penilaian kinerja AndaDaftar sekarang
Bergabung dengan 19 juta pelajar dan mulai Reinforcement Learning from Human Feedback (RLHF) Hari Ini!
Buat Akun Gratis Anda
Lanjutkan dengan GoogleTampilkan opsi lainnyaatau
Dengan melanjutkan, Anda menerima Ketentuan Penggunaan kami, Kebijakan Privasi kami dan bahwa data Anda disimpan di Amerika Serikat.
Kembangkan keterampilan data Anda dengan DataCamp untuk Mobile
Buat kemajuan di mana saja dengan kursus mobile kami dan tantangan coding harian 5 menit.