Przejdź do głównej treści
Strona głównaPython

Ścieżka

Uczenie ze wzmocnieniem w Pythonie

Zaktualizowano 05.2026
Opanuj podstawy uczenia ze wzmocnieniem (RL), aby tworzyć modele, które potrafią poruszać się w złożonych rzeczywistych środowiskach i trenować LLM-y.
Zacznij ścieżkę za darmo
PythonUczenie maszynowe
12 godz.
4,174

Utwórz bezpłatne konto

Kontynuuj z GooglePokaż więcej opcji

lub


Kontynuując, akceptujesz nasze Warunki korzystania, naszą Politykę prywatności oraz to, że Twoje dane są przechowywane w USA.

Uwielbiany przez kursantów z tysięcy firm

Group

Szkolisz zespół?

Wypróbuj dla firm

Opis ścieżki

Uczenie ze wzmocnieniem w Pythonie

Opanuj podstawy uczenia ze wzmocnieniem (RL) i odkryj, jak budować modele do poruszania się w złożonych środowiskach często spotykanych w robotyce i grach wideo.Jeśli dopiero zaczynasz przygodę z reinforcement learning lub chcesz specjalizować się w reinforcement learning jako gałęzi machine learning, to idealne miejsce, by zacząć.Zaczniesz od poznania podstawowych pojęć uczenia ze wzmocnieniem, takich jak procesy decyzyjne Markowa, kompromisy między eksploracją a eksploatacją oraz algorytmy programowania dynamicznego. Nauczysz się stosować Q-learning, SARSA i inne metody, aby poruszać się po pasmach górskich i zamarzniętych jeziorach z biblioteki Gymnasium.Połączysz głębokie uczenie i uczenie ze wzmocnieniem oraz odkryjesz głębokie uczenie ze wzmocnieniem, które można wykorzystać do trenowania agentów do poruszania się w bardzo złożonych środowiskach przy niewielkim nadzorze.Po drodze zastosujesz te techniki, aby realizować rzeczywiste projekty, w tym optymalizację tras taksówek i symulację handlu akcjami.Mając pod ręką te narzędzia do uczenia ze wzmocnieniem, jesteś gotowy, by zacząć mierzyć się z ekscytującym nowym zastosowaniem uczenia ze wzmocnieniem: uczeniem ze wzmocnieniem na podstawie informacji zwrotnej od ludzi (RLHF). RLHF może być używany do poprawy wyników LLM poprzez trenowanie na podstawie ludzkich opinii o jego odpowiedziach.Rozpocznij dziś swoją przygodę z uczeniem ze wzmocnieniem!

Wymagania wstępne

Ta ścieżka nie ma wymagań wstępnych
  • Course

    1

    Uczenie przez wzmacnianie z Gymnasium w Pythonie

    Rozpocznij swoją przygodę z reinforcement learning! Dowiedz się, jak agenci mogą uczyć się rozwiązywać środowiska poprzez interakcje.

  • Project

    bonus

    Taxi Route Optimization with Reinforcement Learning

    Solve the Taxi-v3 environment using Q-learning, ensuring efficient AI-driven transportation.

Uczenie ze wzmocnieniem w Pythonie
3 Kursy
Ścieżka
ukończona

Zdobądź zaświadczenie o ukończeniu

Dodaj to poświadczenie do swojego profilu LinkedIn, CV lub życiorysu
Udostępnij to w mediach społecznościowych i podczas oceny wyników pracy
Zapisz się teraz

Dołącz do ponad 19 milionów kursantów i zacznij Uczenie ze wzmocnieniem w Pythonie już dziś!

Utwórz bezpłatne konto

Kontynuuj z GooglePokaż więcej opcji

lub


Kontynuując, akceptujesz nasze Warunki korzystania, naszą Politykę prywatności oraz to, że Twoje dane są przechowywane w USA.

Rozwijaj swoje umiejętności w zakresie danych dzięki DataCamp dla urządzeń mobilnych

Rób postępy w podróży dzięki naszym kursom mobilnym i codziennym 5-minutowym wyzwaniom kodowania.