Uczenie ze wzmocnieniem w Pythonie

Zaktualizowano 05.2026

Opanuj podstawy uczenia ze wzmocnieniem (RL), aby tworzyć modele, które potrafią poruszać się w złożonych rzeczywistych środowiskach i trenować LLM-y.

Opis ścieżki

Uczenie ze wzmocnieniem w Pythonie

Opanuj podstawy uczenia ze wzmocnieniem (RL) i odkryj, jak budować modele do poruszania się w złożonych środowiskach często spotykanych w robotyce i grach wideo.Jeśli dopiero zaczynasz przygodę z reinforcement learning lub chcesz specjalizować się w reinforcement learning jako gałęzi machine learning, to idealne miejsce, by zacząć.Zaczniesz od poznania podstawowych pojęć uczenia ze wzmocnieniem, takich jak procesy decyzyjne Markowa, kompromisy między eksploracją a eksploatacją oraz algorytmy programowania dynamicznego. Nauczysz się stosować Q-learning, SARSA i inne metody, aby poruszać się po pasmach górskich i zamarzniętych jeziorach z biblioteki Gymnasium.Połączysz głębokie uczenie i uczenie ze wzmocnieniem oraz odkryjesz głębokie uczenie ze wzmocnieniem, które można wykorzystać do trenowania agentów do poruszania się w bardzo złożonych środowiskach przy niewielkim nadzorze.Po drodze zastosujesz te techniki, aby realizować rzeczywiste projekty, w tym optymalizację tras taksówek i symulację handlu akcjami.Mając pod ręką te narzędzia do uczenia ze wzmocnieniem, jesteś gotowy, by zacząć mierzyć się z ekscytującym nowym zastosowaniem uczenia ze wzmocnieniem: uczeniem ze wzmocnieniem na podstawie informacji zwrotnej od ludzi (RLHF). RLHF może być używany do poprawy wyników LLM poprzez trenowanie na podstawie ludzkich opinii o jego odpowiedziach.Rozpocznij dziś swoją przygodę z uczeniem ze wzmocnieniem!

Wymagania wstępne

Ta ścieżka nie ma wymagań wstępnych

Course
1
Uczenie przez wzmacnianie z Gymnasium w Pythonie
Rozpocznij swoją przygodę z reinforcement learning! Dowiedz się, jak agenci mogą uczyć się rozwiązywać środowiska poprzez interakcje.
Project
bonus
Taxi Route Optimization with Reinforcement Learning
Solve the Taxi-v3 environment using Q-learning, ensuring efficient AI-driven transportation.
Course
3
Deep Reinforcement Learning in Python
Learn and use powerful Deep Reinforcement Learning algorithms, including refinement and optimization techniques.
Project
bonus
Stock Trading Simulation with Gymnasium
Train a simple reinforcement learning agent in stock trading simulation.
Course
5
Uczenie przez wzmacnianie z informacją zwrotną od człowieka (RLHF)
Naucz się, jak sprawić, by modele GenAI naprawdę odzwierciedlały ludzkie wartości, zdobywając praktyczne doświadczenie z zaawansowanymi LLM.

Uczenie ze wzmocnieniem w Pythonie

3 Kursy

Ścieżka
ukończona

Zdobądź zaświadczenie o ukończeniu

Dodaj to poświadczenie do swojego profilu LinkedIn, CV lub życiorysu
Udostępnij to w mediach społecznościowych i podczas oceny wyników pracyZapisz się teraz

Uczenie ze wzmocnieniem w Pythonie

Szkolisz zespół?

Opis ścieżki

Uczenie ze wzmocnieniem w Pythonie

Wymagania wstępne

Uczenie przez wzmacnianie z Gymnasium w Pythonie

Taxi Route Optimization with Reinforcement Learning

Deep Reinforcement Learning in Python

Stock Trading Simulation with Gymnasium

Uczenie przez wzmacnianie z informacją zwrotną od człowieka (RLHF)

Zdobądź zaświadczenie o ukończeniu

Dołącz do ponad 19 milionów kursantów i zacznij Uczenie ze wzmocnieniem w Pythonie już dziś!

Rozwijaj swoje umiejętności w zakresie danych dzięki DataCamp dla urządzeń mobilnych

Opis ścieżki

Uczenie ze wzmocnieniem w Pythonie

Zdobądź zaświadczenie o ukończeniu

Dołącz do ponad .css-nklxlk{color:var(--wf-brand--main, #03EF62);}19 milionów kursantów i zacznij Uczenie ze wzmocnieniem w Pythonie już dziś!

Utwórz bezpłatne konto

Rozwijaj swoje umiejętności w zakresie danych dzięki DataCamp dla urządzeń mobilnych

Dołącz do ponad 19 milionów kursantów i zacznij Uczenie ze wzmocnieniem w Pythonie już dziś!