Pular para o conteúdo principal
InícioPython

Programa

Aprendizagem por reforço em Python

Atualizado 01/2025
Domine os fundamentos da aprendizagem por reforço (RL) para criar modelos que possam navegar em ambientes complexos do mundo real e treinar LLMs.
Iniciar Trilha Gratuitamente

Incluído comPremium or Teams

PythonAprendizado de máquina12 h2,435

Crie sua conta gratuita

ou

Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados serão armazenados nos EUA.
Group

Treinar 2 ou mais pessoas?

Experimentar DataCamp for Business

Preferido por alunos de milhares de empresas

Descrição da trilha

Aprendizagem por reforço em Python

Domine os fundamentos da aprendizagem por reforço (RL) e descubra como criar modelos para navegar em ambientes complexos, frequentemente encontrados em robótica e videogames.Se você é novo no aprendizado por reforço ou deseja se especializar em aprendizado por reforço como um ramo do aprendizado de máquina, este é o lugar ideal para começar.Você começará aprendendo sobre os principais conceitos de aprendizagem por reforço, como processos de decisão de Markov, compensações de exploração/exploração e algoritmos de programação dinâmica. Você aprenderá a aplicar Q-learning, SARSA e outros métodos para navegar por cadeias de montanhas e lagos congelados na biblioteca do Gymnasium.Você mesclará a aprendizagem profunda e a aprendizagem por reforço e descobrirá a aprendizagem por reforço profundo, que pode ser usada para treinar agentes para navegar em ambientes altamente complexos com pouca supervisão.Ao longo do caminho, você aplicará essas técnicas para lidar com projetos do mundo real, incluindo a otimização de rotas de táxi e a simulação de negociação de ações.Com essas ferramentas de aprendizagem por reforço em mãos, você está pronto para começar a lidar com uma nova e empolgante aplicação da aprendizagem por reforço: a aprendizagem por reforço a partir de feedback humano (RLHF). O RLHF pode ser usado para aprimorar os resultados do LLM por meio de treinamento em feedback humano para suas respostas.Comece sua jornada de aprendizado por reforço hoje mesmo!

Pré-requisitos

Essa trilha não tem pré-requisitos
  • Course

    1

    Reinforcement Learning with Gymnasium in Python

    Start your reinforcement learning journey! Learn how agents can learn to solve environments through interactions.

  • Project

    bônus

    Taxi Route Optimization with Reinforcement Learning

    Solve the Taxi-v3 environment using Q-learning, ensuring efficient AI-driven transportation.

Aprendizagem por reforço em Python
3 Cursos
Trilha
concluída

Obtenha um certificado de conclusão

Adicione esta credencial ao seu perfil do LinkedIn, currículo ou CV
Compartilhe nas redes sociais e em sua avaliação de desempenho

Incluído comPremium or Teams

Inscreva-se Agora

Faça como mais de 17 milhões de alunos e comece Aprendizagem por reforço em Python hoje mesmo!

Crie sua conta gratuita

ou

Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados serão armazenados nos EUA.