मुख्य सामग्री पर जाएं
होमPython

लर्निंग पाथ

प्रबलन अधिगम में Python

अपडेट किया गया 05/2026
मजबूत करें reinforcement learning (RL) की बुनियादी समझ, ताकि आप ऐसे मॉडल बना सकें जो जटिल वास्तविक-विश्व परिवेशों में नेविगेट कर सकें और LLMs को प्रशिक्षित कर सकें।
मुफ़्त में ट्रैक शुरू करें
Pythonमशीन लर्निंग
12 घंटे
4,174

अपना मुफ़्त खाता बनाएं

Google के साथ जारी रखेंअधिक विकल्प दिखाएँ

या


जारी रखने पर, आप हमारी उपयोग की शर्तें, हमारी गोपनीयता नीति को स्वीकार करते हैं और यह भी कि आपका डेटा संयुक्त राज्य अमेरिका में संग्रहीत किया जाता है।

हजारों कंपनियों के शिक्षार्थियों द्वारा पसंद किया गया

Group

टीम को ट्रेनिंग देना चाहते हैं?

व्यवसाय के लिए आज़माएँ

ट्रैक विवरण

प्रबलन अधिगम में Python

मजबूत करें reinforcement learning (RL) की बुनियादी समझ और जानें कि robotics और video games में अक्सर पाए जाने वाले जटिल environments को नेविगेट करने के लिए models कैसे बनाए जाएँ।यदि आप रिइनफोर्समेंट लर्निंग में नए हैं या मशीन लर्निंग की एक शाखा के रूप में रिइनफोर्समेंट लर्निंग में विशेषज्ञता हासिल करना चाहते हैं, तो यह शुरू करने के लिए एक आदर्श स्थान है।आप मार्कोव निर्णय प्रक्रियाओं, अन्वेषण/दोहन संतुलन, और डायनेमिक प्रोग्रामिंग एल्गोरिदम जैसे मुख्य रिइनफोर्समेंट लर्निंग अवधारणाओं के बारे में सीखकर शुरुआत करेंगे। आप Gymnasium लाइब्रेरी से पर्वतीय क्षेत्रों और जमी हुई झीलों में नेविगेट करने के लिए Q-learning, SARSA और अन्य तरीकों को लागू करना सीखेंगे।आप गहन शिक्षण और सुदृढीकरण शिक्षण को मिलाएँगे और गहन सुदृढीकरण शिक्षण की खोज करेंगे, जिसका उपयोग बहुत कम पर्यवेक्षण के साथ एजेंटों को अत्यंत जटिल वातावरणों में नेविगेट करने के लिए प्रशिक्षित करने में किया जा सकता है।रास्ते में, आप इन तकनीकों को वास्तविक दुनिया की परियोजनाओं पर लागू करेंगे, जिसमें टैक्सी मार्गों को अनुकूलित करना और स्टॉक ट्रेडिंग सिमुलेशन शामिल है।इन reinforcement learning टूल्स के साथ, आप reinforcement learning के एक रोमांचक नए अनुप्रयोग से निपटना शुरू करने के लिए तैयार हैं: human feedback से reinforcement learning (RLHF)। मानव प्रतिक्रिया पर इसके उत्तरों को प्रशिक्षित करके RLHF का उपयोग LLM आउटपुट को बेहतर बनाने के लिए किया जा सकता है।आज ही अपनी रिइनफोर्समेंट लर्निंग यात्रा शुरू करें!

पूर्व आवश्यकताएं

इस ट्रैक के लिए कोई पूर्व आवश्यकताएं नहीं हैं
  • Course

    1

    Reinforcement Learning with Gymnasium in Python

    Start your reinforcement learning journey! Learn how agents can learn to solve environments through interactions.

  • Project

    बोनस

    Taxi Route Optimization with Reinforcement Learning

    Solve the Taxi-v3 environment using Q-learning, ensuring efficient AI-driven transportation.

प्रबलन अधिगम में Python
3 कोर्स
ट्रैक
पूर्ण

उपलब्धि का प्रमाण पत्र अर्जित करें

इस प्रमाण पत्र को अपनी LinkedIn प्रोफ़ाइल, रिज्यूमे या CV में जोड़ें
इसे सोशल मीडिया पर और अपनी प्रदर्शन समीक्षा में साझा करें
अभी नामांकन करें

19 मिलियन से अधिक शिक्षार्थियों के साथ जुड़ें और आज ही प्रबलन अधिगम में Python शुरू करें!

अपना मुफ़्त खाता बनाएं

Google के साथ जारी रखेंअधिक विकल्प दिखाएँ

या


जारी रखने पर, आप हमारी उपयोग की शर्तें, हमारी गोपनीयता नीति को स्वीकार करते हैं और यह भी कि आपका डेटा संयुक्त राज्य अमेरिका में संग्रहीत किया जाता है।

मोबाइल के लिए DataCamp के साथ अपने डेटा कौशल को बढ़ाएं

हमारे मोबाइल कोर्स और दैनिक 5 मिनट की कोडिंग चुनौतियों के साथ चलते-फिरते प्रगति करें।