Kurs
Python ile Deep Reinforcement Learning
İleri SeviyeBeceri Seviyesi
Güncel 09.2024
PyTorchArtificial Intelligence4 sa15 video49 Egzersiz4,050 XP5,672Başarı Belgesi
Ücretsiz Hesabınızı Oluşturun
Google ile devam edinDaha fazla seçenek gösterveya
Devam ederek Kullanım Şartlarımızı, Gizlilik Politikamızı ve verilerinizin ABD’de saklandığını kabul etmiş olursunuz.
Binlerce şirketten öğrencinin sevgisini kazandı
Bir Ekibi Eğitiyor musunuz?
İşletmeler için deneyinKurs Açıklaması
Derin Pekiştirme Öğreniminin Temellerini Öğrenin
Yolculuğumuz, DRL'nin temelleri ve bunların geleneksel Pekiştirme Öğrenimi ile olan ilişkisi ile başlıyor. Buradan, modellerinizi güçlendirmek için Double DQN ve Prioritized Experience Replay gibi gelişmiş iyileştirmeler de dahil olmak üzere Deep Q-Networks (DQN) uygulamasını PyTorch'ta hızla uygulamaya geçiyoruz.Politika tabanlı yöntemleri keşfederken becerilerinizi bir üst seviyeye taşıyın. REINFORCE ve Actor-Critic yöntemleri gibi temel politika gradyan tekniklerini öğrenecek ve uygulayacaksınız.En Son Teknoloji Algoritmalar Kullanın
Günümüzde sektörde yaygın olarak kullanılan, Proximal Policy Optimization (PPO) dahil olmak üzere güçlü DRL algoritmalarıyla karşılaşacaksınız. Robotik, oyun yapay zekası ve daha birçok alanda çığır açan tekniklerle pratik deneyim kazanacaksınız. Son olarak, hiperparametre ayarlaması için Optuna kullanarak modellerinizi optimize etmeyi öğreneceksiniz.Bu kursun sonunda, bu son teknoloji teknikleri gerçek dünyadaki sorunlara uygulamak ve DRL'nin tüm potansiyelini kullanmak için gerekli becerileri edinmiş olacaksınız!Önkoşullar
Intermediate Deep Learning with PyTorchReinforcement Learning with Gymnasium in Python1
Deep Reinforcement Learning’e Giriş
Deep reinforcement learning’in, geleneksel Reinforcement Learning’e nasıl üstünlük sağladığını keşfet ve ilk Deep Q Learning algoritmanı inceleyip uygula.
2
Deep Q-learning
Experience Replay, epsilon-greediness ve sabit Q-hedefleri içeren orijinal DQN algoritmasını uygulayarak Deep Q-learning’e dal. DQN’in ötesinde, Deep Q-learning’in performans ve kararlılığını artıran iki etkileyici genişletmeyi keşfedeceksin: Double DQN ve Prioritized Experience Replay.
3
Policy Gradient Yöntemlerine Giriş
DRL’de yer alan policy gradient yöntemlerinin temel kavramlarını öğren. Bu yöntemlerin temelini oluşturan policy gradient teoremi ile başlayacaksın. Ardından politikaları öğrenmede güçlü bir yaklaşım olan REINFORCE algoritmasını uygulayacaksın. Bölüm, policy gradient ve değer tabanlı yöntemlerin güçlü yönlerini birleştirerek öğrenme verimliliği ve kararlılığını artıran Advantage Actor-Critic (A2C) yöntemine odaklanan Actor-Critic yöntemleriyle devam edecek.
4
Proximal Policy Optimization ve DRL İpuçları
Sağlam DRL performansı için Proximal Policy Optimization (PPO)’ı keşfet. Sonraki adımda, belirleyici politikalara erken yakınsamayı önleyerek keşfi teşvik eden PPO’daki entropi bonusunu inceleyeceksin. Ayrıca policy gradient yöntemlerinde toplu (batch) güncellemeleri öğreneceksin. Son olarak, DRL modellerindeki performansı iyileştirmek için güçlü bir araç olan Optuna ile hiperparametre optimizasyonunu öğreneceksin.
Python ile Deep Reinforcement Learning
Kurs Tamamlandı
Başarı Belgesi Kazanın
Bu kimlik bilgisini LinkedIn profilinize, özgeçmişinize veya CV'nize ekleyinSosyal medyada ve performans incelemenizde paylaşınŞimdi kaydolun
Bugün 19 milyondan fazla öğrenciye katılın ve Python ile Deep Reinforcement Learning eğitimine başlayın!
Ücretsiz Hesabınızı Oluşturun
Google ile devam edinDaha fazla seçenek gösterveya
Devam ederek Kullanım Şartlarımızı, Gizlilik Politikamızı ve verilerinizin ABD’de saklandığını kabul etmiş olursunuz.
DataCamp for Mobile ile veri becerilerinizi geliştirin
Mobil kurslarımız ve günde 5 dakikalık kodlama görevlerimizle hareket halindeyken ilerleme kaydedin.