Reinforcement Learning from Human Feedback (RLHF)

AvanzadoNivel de habilidad

Actualizado 10/2024

Aprende a crear modelos de IA generativa que reflejen los valores humanos mientras adquieres experiencia práctica con LLM avanzados.

Descripción del curso

Combina la eficiencia de la IA generativa con el criterio de la experiencia humana en este curso sobre Reinforcement Learning from Human Feedback. Aprenderás a hacer que los modelos de GenAI reflejen de verdad los valores y preferencias humanas mientras adquieres experiencia práctica con LLMs. También abordarás las complejidades de los modelos de recompensa y aprenderás a construir sobre LLMs para producir una IA que no solo aprenda, sino que también se adapte a escenarios del mundo real.

Requisitos previos

Deep Reinforcement Learning in Python

Foundational Concepts

This chapter introduces the basics of Reinforcement Learning with Human Feedback (RLHF), a technique that uses human input to help AI models learn more effectively. Get started with RLHF by understanding how it differs from traditional reinforcement learning and why human feedback can enhance AI performance in various domains.

Descripción del curso

Obtener certificado de logros

¡Únete a .css-nklxlk{color:var(--wf-brand--main, #03EF62);}19 millones de estudiantes y empieza Reinforcement Learning from Human Feedback (RLHF) hoy mismo!

Crea tu cuenta gratuita

Desarrolla tus habilidades de datos con la aplicación móvil de DataCamp

¡Únete a 19 millones de estudiantes y empieza Reinforcement Learning from Human Feedback (RLHF) hoy mismo!