Aprendizagem por reforço em Python

Atualizado 01/2025

Domine os fundamentos da aprendizagem por reforço (RL) para criar modelos que possam navegar em ambientes complexos do mundo real e treinar LLMs.

Crie sua conta gratuita

Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados serão armazenados nos EUA.

Descrição da trilha

Aprendizagem por reforço em Python

Domine os fundamentos da aprendizagem por reforço (RL) e descubra como criar modelos para navegar em ambientes complexos, frequentemente encontrados em robótica e videogames.Se você é novo no aprendizado por reforço ou deseja se especializar em aprendizado por reforço como um ramo do aprendizado de máquina, este é o lugar ideal para começar.Você começará aprendendo sobre os principais conceitos de aprendizagem por reforço, como processos de decisão de Markov, compensações de exploração/exploração e algoritmos de programação dinâmica. Você aprenderá a aplicar Q-learning, SARSA e outros métodos para navegar por cadeias de montanhas e lagos congelados na biblioteca do Gymnasium.Você mesclará a aprendizagem profunda e a aprendizagem por reforço e descobrirá a aprendizagem por reforço profundo, que pode ser usada para treinar agentes para navegar em ambientes altamente complexos com pouca supervisão.Ao longo do caminho, você aplicará essas técnicas para lidar com projetos do mundo real, incluindo a otimização de rotas de táxi e a simulação de negociação de ações.Com essas ferramentas de aprendizagem por reforço em mãos, você está pronto para começar a lidar com uma nova e empolgante aplicação da aprendizagem por reforço: a aprendizagem por reforço a partir de feedback humano (RLHF). O RLHF pode ser usado para aprimorar os resultados do LLM por meio de treinamento em feedback humano para suas respostas.Comece sua jornada de aprendizado por reforço hoje mesmo!

Pré-requisitos

Essa trilha não tem pré-requisitos

Course
1
Reinforcement Learning com Gymnasium em Python
Comece sua jornada no aprendizado por reforço! Aprenda como os agentes podem aprender a resolver ambientes por meio de interações.
Project
bônus
Taxi Route Optimization with Reinforcement Learning
Solve the Taxi-v3 environment using Q-learning, ensuring efficient AI-driven transportation.
Course
3
Aprendizado por reforço profundo em Python
Aprenda e use algoritmos avançados de Deep Reinforcement Learning, incluindo técnicas de refinamento e otimização.
Project
bônus
Stock Trading Simulation with Gymnasium
Train a simple reinforcement learning agent in stock trading simulation.
Course
5
Reinforcement Learning from Human Feedback (RLHF)
Aprenda como fazer com que os modelos GenAI realmente reflitam os valores humanos enquanto ganha experiência prática com LLMs avançados.

Aprendizagem por reforço em Python

3 Cursos

Trilha
concluída

Obtenha um certificado de conclusão

Adicione esta credencial ao seu perfil do LinkedIn, currículo ou CV
Compartilhe nas redes sociais e em sua avaliação de desempenho

Incluído comPremium or Teams

Inscreva-se Agora

Faça como mais de 18 milhões de alunos e comece Aprendizagem por reforço em Python hoje mesmo!

Crie sua conta gratuita

Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados serão armazenados nos EUA.

Descrição da trilha

Aprendizagem por reforço em Python

Obtenha um certificado de conclusão

Faça como mais de .css-nklxlk{color:var(--wf-brand--main, #03EF62);}18 milhões de alunos e comece Aprendizagem por reforço em Python hoje mesmo!

Crie sua conta gratuita

Faça como mais de 18 milhões de alunos e comece Aprendizagem por reforço em Python hoje mesmo!