लर्निंग पाथ

प्रबलन अधिगम में Python

अपडेट किया गया 05/2026

मजबूत करें reinforcement learning (RL) की बुनियादी समझ, ताकि आप ऐसे मॉडल बना सकें जो जटिल वास्तविक-विश्व परिवेशों में नेविगेट कर सकें और LLMs को प्रशिक्षित कर सकें।

मुफ़्त में ट्रैक शुरू करें

Pythonमशीन लर्निंग

12 घंटे

4,174

अपना मुफ़्त खाता बनाएं

Google के साथ जारी रखें अधिक विकल्प दिखाएँ

या

जारी रखने पर, आप हमारी उपयोग की शर्तें, हमारी गोपनीयता नीति को स्वीकार करते हैं और यह भी कि आपका डेटा संयुक्त राज्य अमेरिका में संग्रहीत किया जाता है।

हजारों कंपनियों के शिक्षार्थियों द्वारा पसंद किया गया

टीम को ट्रेनिंग देना चाहते हैं?

व्यवसाय के लिए आज़माएँ

ट्रैक विवरण

प्रबलन अधिगम में Python

मजबूत करें reinforcement learning (RL) की बुनियादी समझ और जानें कि robotics और video games में अक्सर पाए जाने वाले जटिल environments को नेविगेट करने के लिए models कैसे बनाए जाएँ।यदि आप रिइनफोर्समेंट लर्निंग में नए हैं या मशीन लर्निंग की एक शाखा के रूप में रिइनफोर्समेंट लर्निंग में विशेषज्ञता हासिल करना चाहते हैं, तो यह शुरू करने के लिए एक आदर्श स्थान है।आप मार्कोव निर्णय प्रक्रियाओं, अन्वेषण/दोहन संतुलन, और डायनेमिक प्रोग्रामिंग एल्गोरिदम जैसे मुख्य रिइनफोर्समेंट लर्निंग अवधारणाओं के बारे में सीखकर शुरुआत करेंगे। आप Gymnasium लाइब्रेरी से पर्वतीय क्षेत्रों और जमी हुई झीलों में नेविगेट करने के लिए Q-learning, SARSA और अन्य तरीकों को लागू करना सीखेंगे।आप गहन शिक्षण और सुदृढीकरण शिक्षण को मिलाएँगे और गहन सुदृढीकरण शिक्षण की खोज करेंगे, जिसका उपयोग बहुत कम पर्यवेक्षण के साथ एजेंटों को अत्यंत जटिल वातावरणों में नेविगेट करने के लिए प्रशिक्षित करने में किया जा सकता है।रास्ते में, आप इन तकनीकों को वास्तविक दुनिया की परियोजनाओं पर लागू करेंगे, जिसमें टैक्सी मार्गों को अनुकूलित करना और स्टॉक ट्रेडिंग सिमुलेशन शामिल है।इन reinforcement learning टूल्स के साथ, आप reinforcement learning के एक रोमांचक नए अनुप्रयोग से निपटना शुरू करने के लिए तैयार हैं: human feedback से reinforcement learning (RLHF)। मानव प्रतिक्रिया पर इसके उत्तरों को प्रशिक्षित करके RLHF का उपयोग LLM आउटपुट को बेहतर बनाने के लिए किया जा सकता है।आज ही अपनी रिइनफोर्समेंट लर्निंग यात्रा शुरू करें!

पूर्व आवश्यकताएं

इस ट्रैक के लिए कोई पूर्व आवश्यकताएं नहीं हैं

Course
1
Reinforcement Learning with Gymnasium in Python
Start your reinforcement learning journey! Learn how agents can learn to solve environments through interactions.
Project
बोनस
Taxi Route Optimization with Reinforcement Learning
Solve the Taxi-v3 environment using Q-learning, ensuring efficient AI-driven transportation.
Course
3
Deep Reinforcement Learning in Python
Learn and use powerful Deep Reinforcement Learning algorithms, including refinement and optimization techniques.
Project
बोनस
Stock Trading Simulation with Gymnasium
Train a simple reinforcement learning agent in stock trading simulation.
Course
5
Reinforcement Learning from Human Feedback (RLHF)
Learn how to make GenAI models truly reflect human values while gaining hands-on experience with advanced LLMs.

प्रबलन अधिगम में Python

3 कोर्स

ट्रैक
पूर्ण

उपलब्धि का प्रमाण पत्र अर्जित करें

इस प्रमाण पत्र को अपनी LinkedIn प्रोफ़ाइल, रिज्यूमे या CV में जोड़ें
इसे सोशल मीडिया पर और अपनी प्रदर्शन समीक्षा में साझा करेंअभी नामांकन करें

19 मिलियन से अधिक शिक्षार्थियों के साथ जुड़ें और आज ही प्रबलन अधिगम में Python शुरू करें!

अपना मुफ़्त खाता बनाएं

Google के साथ जारी रखें अधिक विकल्प दिखाएँ

या

मोबाइल के लिए DataCamp के साथ अपने डेटा कौशल को बढ़ाएं

हमारे मोबाइल कोर्स और दैनिक 5 मिनट की कोडिंग चुनौतियों के साथ चलते-फिरते प्रगति करें।

ट्रैक विवरण

प्रबलन अधिगम में Python

उपलब्धि का प्रमाण पत्र अर्जित करें

.css-nklxlk{color:var(--wf-brand--main, #03EF62);}19 मिलियन से अधिक शिक्षार्थियों के साथ जुड़ें और आज ही प्रबलन अधिगम में Python शुरू करें!

अपना मुफ़्त खाता बनाएं

मोबाइल के लिए DataCamp के साथ अपने डेटा कौशल को बढ़ाएं

19 मिलियन से अधिक शिक्षार्थियों के साथ जुड़ें और आज ही प्रबलन अधिगम में Python शुरू करें!