Învățare prin întărire în Python

Actualizat 05.2026

Stăpânește fundamentele învățării prin întărire (RL) pentru a crea modele care pot naviga în medii complexe din lumea reală și pot antrena LLM-uri.

Descrierea traseului

Învățare prin întărire în Python

Stăpânește fundamentele învățării prin întărire (RL) și descoperă cum să construiești modele pentru a naviga în medii complexe întâlnite adesea în robotică și jocuri video.Dacă ești nou în învățarea prin întărire sau vrei să te specializezi în învățarea prin întărire ca ramură a învățării automate, acesta este locul ideal de unde să începi.Vei începe prin a învăța conceptele de bază ale învățării prin întărire, cum ar fi procesele decizionale Markov, compromisurile explorare/exploatare și algoritmii de programare dinamică. Vei învăța să aplici Q-learning, SARSA și alte metode pentru a naviga prin lanțuri muntoase și lacuri înghețate din biblioteca Gymnasium.Vei combina deep learning și reinforcement learning și vei descoperi deep reinforcement learning, care poate fi folosit pentru a antrena agenți să navigheze în medii foarte complexe cu puțină supraveghere.Pe parcurs, vei aplica aceste tehnici pentru a aborda proiecte din lumea reală, inclusiv optimizarea rutelor de taxi și simularea tranzacționării de acțiuni.Cu aceste instrumente de învățare prin întărire la îndemână, ești gata să începi să abordezi o nouă aplicație interesantă pentru învățarea prin întărire: învățarea prin întărire din feedback uman (RLHF). RLHF poate fi folosit pentru a îmbunătăți rezultatele LLM prin antrenarea pe feedback-ul uman la răspunsurile sale.Începe-ți astăzi călătoria în învățarea prin întărire!

Cerințe prealabile

Nu există prerequisite pentru acest traseu

Course
1
Reinforcement Learning with Gymnasium in Python
Start your reinforcement learning journey! Learn how agents can learn to solve environments through interactions.
Project
bonus
Taxi Route Optimization with Reinforcement Learning
Solve the Taxi-v3 environment using Q-learning, ensuring efficient AI-driven transportation.
Course
3
Deep Reinforcement Learning in Python
Learn and use powerful Deep Reinforcement Learning algorithms, including refinement and optimization techniques.
Project
bonus
Stock Trading Simulation with Gymnasium
Train a simple reinforcement learning agent in stock trading simulation.
Course
5
Reinforcement Learning from Human Feedback (RLHF)
Learn how to make GenAI models truly reflect human values while gaining hands-on experience with advanced LLMs.

Învățare prin întărire în Python

3 Cursuri

Traseu
finalizat

Obține diploma de absolvire

Adaugă această acreditare la profilul tău LinkedIn, CV sau rezumat
Distribuie pe rețelele de socializare și în evaluarea ta de performanțăÎnscrie-te acum

Învățare prin întărire în Python

Formare pentru o echipă?

Descrierea traseului

Învățare prin întărire în Python

Cerințe prealabile

Reinforcement Learning with Gymnasium in Python

Taxi Route Optimization with Reinforcement Learning

Deep Reinforcement Learning in Python

Stock Trading Simulation with Gymnasium

Reinforcement Learning from Human Feedback (RLHF)

Obține diploma de absolvire

Alătură-te celor peste 19 de milioane de cursanți și începe Învățare prin întărire în Python astăzi!

Dezvoltați-vă abilitățile de gestionare a datelor cu DataCamp pentru mobil

Descrierea traseului

Învățare prin întărire în Python

Obține diploma de absolvire

Alătură-te celor peste .css-nklxlk{color:var(--wf-brand--main, #03EF62);}19 de milioane de cursanți și începe Învățare prin întărire în Python astăzi!

Creează-ți contul gratuit

Dezvoltați-vă abilitățile de gestionare a datelor cu DataCamp pentru mobil

Alătură-te celor peste 19 de milioane de cursanți și începe Învățare prin întărire în Python astăzi!