Pular para o conteúdo principal
InícioPython

programa

Aprendizagem por reforço em Python

Domine os fundamentos da aprendizagem por reforço (RL) para criar modelos que possam navegar em ambientes complexos do mundo real e treinar LLMs.
Inicie a faixa gratuitamente

Incluído comPremium or Teams

PythonAprendizado de máquina12 horas

Crie sua conta gratuita

GoogleLinkedInFacebook

ou

Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.
Group

Treinar 2 ou mais pessoas?

Tentar DataCamp for Business

Amado por alunos de milhares de empresas

Descrição da Trilha

Aprendizagem por reforço em Python

Domine os fundamentos da aprendizagem por reforço (RL) e descubra como criar modelos para navegar em ambientes complexos, frequentemente encontrados em robótica e videogames. Se você é novo no aprendizado por reforço ou deseja se especializar em aprendizado por reforço como um ramo do aprendizado de máquina, este é o lugar ideal para começar. Você começará aprendendo sobre os principais conceitos de aprendizagem por reforço, como processos de decisão de Markov, compensações de exploração/exploração e algoritmos de programação dinâmica. Você aprenderá a aplicar Q-learning, SARSA e outros métodos para navegar por cadeias de montanhas e lagos congelados na biblioteca do Gymnasium. Você mesclará a aprendizagem profunda e a aprendizagem por reforço e descobrirá a aprendizagem por reforço profundo, que pode ser usada para treinar agentes para navegar em ambientes altamente complexos com pouca supervisão. Ao longo do caminho, você aplicará essas técnicas para lidar com projetos do mundo real, incluindo a otimização de rotas de táxi e a simulação de negociação de ações. Com essas ferramentas de aprendizagem por reforço em mãos, você está pronto para começar a lidar com uma nova e empolgante aplicação da aprendizagem por reforço: a aprendizagem por reforço a partir de feedback humano (RLHF). O RLHF pode ser usado para aprimorar os resultados do LLM por meio de treinamento em feedback humano para suas respostas. Comece sua jornada de aprendizado por reforço hoje mesmo!

Pré-requisitos

Não há pré-requisitos para esta faixa
  • Course

    1

    Reinforcement Learning with Gymnasium in Python

    Start your reinforcement learning journey! Learn how agents can learn to solve environments through interactions.

  • Project

    Bônus

    Taxi Route Optimization with Reinforcement Learning

    Solve the Taxi-v3 environment using Q-learning, ensuring efficient AI-driven transportation.

Aprendizagem por reforço em Python
3 cursos
Faixa
Concluída

Obtenha um certificado de conclusão

Adicione esta credencial ao seu perfil, currículo ou currículo do LinkedIn
Compartilhe nas redes sociais e em sua avaliação de desempenho

Incluído comPremium or Teams

Inscreva-se agora

Junte-se a mais 15 milhões de alunos e comece Aprendizagem por reforço em Python Hoje!

Crie sua conta gratuita

GoogleLinkedInFacebook

ou

Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.