Kurs
İnsan Geri Bildiriminden Pekiştirmeli Öğrenme (RLHF)
İleri SeviyeBeceri Seviyesi
Güncel 10.2024
PythonArtificial Intelligence4 sa13 video38 Egzersiz2,900 XP3,670Başarı Belgesi
Ücretsiz Hesabınızı Oluşturun
Google ile devam edinDaha fazla seçenek gösterveya
Devam ederek Kullanım Şartlarımızı, Gizlilik Politikamızı ve verilerinizin ABD’de saklandığını kabul etmiş olursunuz.
Binlerce şirketten öğrencinin sevgisini kazandı
Bir Ekibi Eğitiyor musunuz?
İşletmeler için deneyinKurs Açıklaması
Önkoşullar
Deep Reinforcement Learning in Python1
Temel Kavramlar
Bu bölüm, Yapay Zekânın daha etkili öğrenmesine yardımcı olmak için insan girdisini kullanan İnsan Geri Bildiriminden Pekiştirmeli Öğrenme (RLHF) temellerini tanıtır. RLHF’ye, geleneksel pekiştirmeli öğrenmeden nasıl ayrıldığını ve insan geri bildiriminin neden farklı alanlarda yapay zekâ performansını artırabildiğini anlayarak başla.
2
İnsan Geri Bildirimi Toplama
Bu bölümde, insan geri bildirimi toplamak için sistemleri nasıl kuracağını keşfet. Eşli karşılaştırmalardan belirsizlik örneklemesine kadar yüksek kaliteli veri toplamanın en iyi uygulamalarını öğren ve veri toplamanı güçlendirecek stratejileri incele.
3
İnsan Geri Bildirimiyle Modelleri Ayarlama
Bu bölümde, İnsan Geri Bildiriminden Pekiştirmeli Öğrenme eğitiminin özüne ineceksin. Bu; PPO ile ince ayarı keşfetmeyi, verimli eğitim tekniklerini ve metrik hedeflerinden olası sapmaları yönetmeyi içerir.
4
Model Değerlendirme
İnsan Geri Bildiriminden Pekiştirmeli Öğrenme (RLHF) kursunun bu son bölümünde model performansını değerlendirme ve iyileştirme için temel teknikleri keşfet: ince ayar metriklerinden çeşitli geri bildirim kaynaklarını dahil etmeye kadar, modellerini etkili şekilde geliştirmek için kapsamlı bir araç seti sunulacak.
İnsan Geri Bildiriminden Pekiştirmeli Öğrenme (RLHF)
Kurs Tamamlandı
Başarı Belgesi Kazanın
Bu kimlik bilgisini LinkedIn profilinize, özgeçmişinize veya CV'nize ekleyinSosyal medyada ve performans incelemenizde paylaşınŞimdi kaydolun
Bugün 19 milyondan fazla öğrenciye katılın ve İnsan Geri Bildiriminden Pekiştirmeli Öğrenme (RLHF) eğitimine başlayın!
Ücretsiz Hesabınızı Oluşturun
Google ile devam edinDaha fazla seçenek gösterveya
Devam ederek Kullanım Şartlarımızı, Gizlilik Politikamızı ve verilerinizin ABD’de saklandığını kabul etmiş olursunuz.
DataCamp for Mobile ile veri becerilerinizi geliştirin
Mobil kurslarımız ve günde 5 dakikalık kodlama görevlerimizle hareket halindeyken ilerleme kaydedin.