Hoppa till huvudinnehållet
HemPython

Lärstig

Förstärkningsinlärning i Python

Uppdaterad 2026-05
Bemästra grunderna i förstärkningsinlärning (RL) för att skapa modeller som kan navigera i komplexa verkliga miljöer och träna LLM:er.
Starta inlärningsvägen gratis
PythonMachine Learning
12 tim
4,174

Skapa ditt kostnadsfria konto

Fortsätt med GoogleVisa fler alternativ

eller


Genom att fortsätta godkänner du våra Användarvillkor, vår Integritetspolicy och att dina uppgifter lagras i USA.

Omtyckt av lärande på tusentals företag

Group

Utbildar du ett team?

Prova för företag

Beskrivning av inlärningsväg

Förstärkningsinlärning i Python

Bemästra grunderna i förstärkningsinlärning (RL) och upptäck hur du bygger modeller för att navigera komplexa miljöer som ofta finns inom robotik och videospel.Om du är ny inom förstärkningsinlärning eller vill specialisera dig på förstärkningsinlärning som en gren av maskininlärning, är detta en idealisk plats att börja.Du börjar med att lära dig grundläggande koncept inom förstärkningsinlärning, som Markov-beslutsprocesser, avvägningar mellan utforskning och exploatering samt dynamiska programmeringsalgoritmer. Du kommer att lära dig att tillämpa Q-learning, SARSA och andra metoder för att navigera bergskedjor och frusna sjöar från Gymnasium-biblioteket.Du kommer att kombinera djupinlärning och förstärkningsinlärning och upptäcka djup förstärkningsinlärning, som kan användas för att träna agenter att navigera i mycket komplexa miljöer med lite övervakning.På vägen kommer du att tillämpa dessa tekniker för att ta itu med verkliga projekt, inklusive att optimera taxirutter och simulering av aktiehandel.Med dessa verktyg för förstärkningsinlärning till hands är du redo att börja ta dig an en spännande ny tillämpning av förstärkningsinlärning: förstärkningsinlärning från mänsklig feedback (RLHF). RLHF kan användas för att förbättra LLM-utdata genom att träna på mänsklig feedback till dess svar.Börja din resa inom förstärkningsinlärning idag!

Förkunskapskrav

Det finns inga förkunskapskrav för den här inlärningsvägen
  • Course

    1

    Reinforcement Learning with Gymnasium in Python

    Start your reinforcement learning journey! Learn how agents can learn to solve environments through interactions.

  • Project

    bonus

    Taxi Route Optimization with Reinforcement Learning

    Solve the Taxi-v3 environment using Q-learning, ensuring efficient AI-driven transportation.

Förstärkningsinlärning i Python
3 Kurser
Inlärningsväg
slutförd

Tjäna ett prestationsbevis

Lägg till det här beviset i din LinkedIn-profil, ditt CV eller din meritförteckning
Dela det i sociala medier och i din medarbetarutvärdering
Registrera dig nu

Gå med 19 miljoner lärande och börja Förstärkningsinlärning i Python idag!

Skapa ditt kostnadsfria konto

Fortsätt med GoogleVisa fler alternativ

eller


Genom att fortsätta godkänner du våra Användarvillkor, vår Integritetspolicy och att dina uppgifter lagras i USA.

Utveckla dina datakunskaper med DataCamp för mobilen

Gör framsteg när du är på språng med våra mobila kurser och dagliga 5-minuters kodningsutmaningar.