Ana içeriğe atla
GirişPython

Kurs

İnsan Geri Bildiriminden Pekiştirmeli Öğrenme (RLHF)

İleri SeviyeBeceri Seviyesi
Güncel 10.2024
Gelişmiş LLM'lerle pratik deneyim kazanırken, GenAI modellerinin insan değerlerini gerçek anlamda yansıtmasını sağlamayı öğrenin.
Kursa Ücretsiz Başlayın
PythonArtificial Intelligence
4 sa
13 video
38 Egzersiz
2,900 XP
3,670
Başarı Belgesi

Ücretsiz Hesabınızı Oluşturun

Google ile devam edinDaha fazla seçenek göster

veya


Devam ederek Kullanım Şartlarımızı, Gizlilik Politikamızı ve verilerinizin ABD’de saklandığını kabul etmiş olursunuz.

Binlerce şirketten öğrencinin sevgisini kazandı

Group

Bir Ekibi Eğitiyor musunuz?

İşletmeler için deneyin

Kurs Açıklaması

Bu kursta Generative AI’nin verimliliğini insan uzmanlığının kavrayışıyla birleştir. GenAI modellerinin insan değerlerini ve tercihlerini gerçekten yansıtmasını nasıl sağlayacağını öğrenirken LLM’lerle uygulamalı deneyim kazanacaksın. Ayrıca ödül modellerinin karmaşıklıklarında yol alacak ve yalnızca öğrenen değil, gerçek dünyadaki senaryolara uyum sağlayan yapay zekâ üretmek için LLM’lerin üzerine nasıl inşa edileceğini keşfedeceksin.

Önkoşullar

Deep Reinforcement Learning in Python
1

Temel Kavramlar

Bu bölüm, Yapay Zekânın daha etkili öğrenmesine yardımcı olmak için insan girdisini kullanan İnsan Geri Bildiriminden Pekiştirmeli Öğrenme (RLHF) temellerini tanıtır. RLHF’ye, geleneksel pekiştirmeli öğrenmeden nasıl ayrıldığını ve insan geri bildiriminin neden farklı alanlarda yapay zekâ performansını artırabildiğini anlayarak başla.
Bölümü Başlat
2

İnsan Geri Bildirimi Toplama

Bu bölümde, insan geri bildirimi toplamak için sistemleri nasıl kuracağını keşfet. Eşli karşılaştırmalardan belirsizlik örneklemesine kadar yüksek kaliteli veri toplamanın en iyi uygulamalarını öğren ve veri toplamanı güçlendirecek stratejileri incele.
Bölümü Başlat
3

İnsan Geri Bildirimiyle Modelleri Ayarlama

Bu bölümde, İnsan Geri Bildiriminden Pekiştirmeli Öğrenme eğitiminin özüne ineceksin. Bu; PPO ile ince ayarı keşfetmeyi, verimli eğitim tekniklerini ve metrik hedeflerinden olası sapmaları yönetmeyi içerir.
Bölümü Başlat
4

Model Değerlendirme

İnsan Geri Bildiriminden Pekiştirmeli Öğrenme (RLHF) kursunun bu son bölümünde model performansını değerlendirme ve iyileştirme için temel teknikleri keşfet: ince ayar metriklerinden çeşitli geri bildirim kaynaklarını dahil etmeye kadar, modellerini etkili şekilde geliştirmek için kapsamlı bir araç seti sunulacak.
Bölümü Başlat
İnsan Geri Bildiriminden Pekiştirmeli Öğrenme (RLHF)
Kurs
Tamamlandı

Başarı Belgesi Kazanın

Bu kimlik bilgisini LinkedIn profilinize, özgeçmişinize veya CV'nize ekleyin
Sosyal medyada ve performans incelemenizde paylaşın
Şimdi kaydolun

Bugün 19 milyondan fazla öğrenciye katılın ve İnsan Geri Bildiriminden Pekiştirmeli Öğrenme (RLHF) eğitimine başlayın!

Ücretsiz Hesabınızı Oluşturun

Google ile devam edinDaha fazla seçenek göster

veya


Devam ederek Kullanım Şartlarımızı, Gizlilik Politikamızı ve verilerinizin ABD’de saklandığını kabul etmiş olursunuz.

DataCamp for Mobile ile veri becerilerinizi geliştirin

Mobil kurslarımız ve günde 5 dakikalık kodlama görevlerimizle hareket halindeyken ilerleme kaydedin.