Sariți la conținutul principal
AcasăPython

Traseu de învățare

Învățare prin întărire în Python

Actualizat 05.2026
Stăpânește fundamentele învățării prin întărire (RL) pentru a crea modele care pot naviga în medii complexe din lumea reală și pot antrena LLM-uri.
Începe traseul gratuit
PythonÎnvățare automată
12 h
4,174

Creează-ți contul gratuit

Continuă cu GoogleArată mai multe opțiuni

sau


Continuând, accepți Termenii de utilizare, Politica de confidențialitate și faptul că datele tale sunt stocate în SUA.

Îndrăgit de cursanți din mii de companii

Group

Formare pentru o echipă?

Încearcă pentru afaceri

Descrierea traseului

Învățare prin întărire în Python

Stăpânește fundamentele învățării prin întărire (RL) și descoperă cum să construiești modele pentru a naviga în medii complexe întâlnite adesea în robotică și jocuri video.Dacă ești nou în învățarea prin întărire sau vrei să te specializezi în învățarea prin întărire ca ramură a învățării automate, acesta este locul ideal de unde să începi.Vei începe prin a învăța conceptele de bază ale învățării prin întărire, cum ar fi procesele decizionale Markov, compromisurile explorare/exploatare și algoritmii de programare dinamică. Vei învăța să aplici Q-learning, SARSA și alte metode pentru a naviga prin lanțuri muntoase și lacuri înghețate din biblioteca Gymnasium.Vei combina deep learning și reinforcement learning și vei descoperi deep reinforcement learning, care poate fi folosit pentru a antrena agenți să navigheze în medii foarte complexe cu puțină supraveghere.Pe parcurs, vei aplica aceste tehnici pentru a aborda proiecte din lumea reală, inclusiv optimizarea rutelor de taxi și simularea tranzacționării de acțiuni.Cu aceste instrumente de învățare prin întărire la îndemână, ești gata să începi să abordezi o nouă aplicație interesantă pentru învățarea prin întărire: învățarea prin întărire din feedback uman (RLHF). RLHF poate fi folosit pentru a îmbunătăți rezultatele LLM prin antrenarea pe feedback-ul uman la răspunsurile sale.Începe-ți astăzi călătoria în învățarea prin întărire!

Cerințe prealabile

Nu există prerequisite pentru acest traseu
  • Course

    1

    Reinforcement Learning with Gymnasium in Python

    Start your reinforcement learning journey! Learn how agents can learn to solve environments through interactions.

  • Project

    bonus

    Taxi Route Optimization with Reinforcement Learning

    Solve the Taxi-v3 environment using Q-learning, ensuring efficient AI-driven transportation.

Învățare prin întărire în Python
3 Cursuri
Traseu
finalizat

Obține diploma de absolvire

Adaugă această acreditare la profilul tău LinkedIn, CV sau rezumat
Distribuie pe rețelele de socializare și în evaluarea ta de performanță
Înscrie-te acum

Alătură-te celor peste 19 de milioane de cursanți și începe Învățare prin întărire în Python astăzi!

Creează-ți contul gratuit

Continuă cu GoogleArată mai multe opțiuni

sau


Continuând, accepți Termenii de utilizare, Politica de confidențialitate și faptul că datele tale sunt stocate în SUA.

Dezvoltați-vă abilitățile de gestionare a datelor cu DataCamp pentru mobil

Fă progrese din mers cu cursurile noastre mobile și provocările zilnice de programare de 5 minute.