트랙 설명

강화 학습 in Python

강화 학습(RL)의 기초를 익히고 로봇공학과 비디오 게임에서 흔히 볼 수 있는 복잡한 환경을 탐색하는 모델을 구축하는 방법을 알아보세요.강화 학습이 처음이거나 머신 러닝의 한 분야로서 강화 학습을 전문적으로 배우고 싶다면, 이곳이 시작하기에 이상적인 곳입니다.마르코프 결정 과정, 탐색/활용 트레이드오프, 동적 계획법 알고리즘과 같은 핵심 강화 학습 개념부터 배우게 됩니다. Gymnasium 라이브러리의 산악 지형과 얼어붙은 호수에서 탐색하기 위해 Q-learning, SARSA 및 기타 방법을 적용하는 방법을 배우게 됩니다.딥러닝과 강화학습을 결합해, 거의 감독 없이도 매우 복잡한 환경을 탐색하도록 에이전트를 훈련하는 데 사용할 수 있는 딥 강화학습을 배우게 됩니다.그 과정에서 이러한 기법을 실제 프로젝트에 적용해 택시 경로 최적화와 주식 거래 시뮬레이션을 포함한 문제를 해결하게 됩니다.이 강화 학습 도구들을 손에 넣었으니, 이제 강화 학습의 흥미로운 새로운 응용 분야인 인간 피드백 기반 강화 학습(RLHF)에 도전할 준비가 되었습니다. RLHF는 인간 피드백을 응답에 대해 학습시켜 LLM 출력물을 개선하는 데 사용할 수 있습니다.오늘 강화 학습 여정을 시작하세요!

선수 조건

이 트랙에는 선수 조건이 없습니다

Course
1
Python으로 배우는 Gymnasium 기반 Reinforcement Learning
강화 학습 여정을 시작하세요! 에이전트가 상호작용을 통해 환경을 해결하는 법을 배우는 방식을 알아보세요.
Project
보너스
Taxi Route Optimization with Reinforcement Learning
Solve the Taxi-v3 environment using Q-learning, ensuring efficient AI-driven transportation.
Course
3
Python으로 배우는 Deep Reinforcement Learning
정교화와 최적화 기법을 포함한 강력한 Deep Reinforcement Learning 알고리즘을 학습하고 활용합니다.
Project
보너스
Stock Trading Simulation with Gymnasium
Train a simple reinforcement learning agent in stock trading simulation.
Course
5
Reinforcement Learning from Human Feedback (RLHF)
인간적 가치를 충실히 반영하는 GenAI 모델을 설계하고, 최신 LLM을 직접 다루며 실무 역량을 키우십시오.

강화 학습 in Python

3 강의

트랙
완료

수료증 획득

LinkedIn 프로필, 이력서 또는 CV에 이 인증서를 추가하세요
소셜 미디어와 성과 평가에서 공유하세요지금 등록

강화 학습 in Python

팀을 교육하시나요?

트랙 설명