본문으로 바로가기
Python

트랙

강화 학습 in Python

업데이트됨 2026. 5.
복잡한 실제 환경을 탐색하고 LLM을 학습시킬 수 있는 모델을 만들기 위해 강화 학습(RL)의 기초를 익히세요.
무료로 트랙 시작
Python머신러닝
12시간
4,178

무료 계정 만들기

Google에서 계속 진행더 많은 옵션 보기

또는


계속 진행하시면 당사의 이용약관개인정보처리방침에 동의하고 및 귀하의 데이터가 미국에 저장되는 것에 동의하게 됩니다.

수천 개 기업의 학습자들이 사랑하는

Group

팀을 교육하시나요?

비즈니스용으로 체험해 보세요

트랙 설명

강화 학습 in Python

강화 학습(RL)의 기초를 익히고 로봇공학과 비디오 게임에서 흔히 볼 수 있는 복잡한 환경을 탐색하는 모델을 구축하는 방법을 알아보세요.강화 학습이 처음이거나 머신 러닝의 한 분야로서 강화 학습을 전문적으로 배우고 싶다면, 이곳이 시작하기에 이상적인 곳입니다.마르코프 결정 과정, 탐색/활용 트레이드오프, 동적 계획법 알고리즘과 같은 핵심 강화 학습 개념부터 배우게 됩니다. Gymnasium 라이브러리의 산악 지형과 얼어붙은 호수에서 탐색하기 위해 Q-learning, SARSA 및 기타 방법을 적용하는 방법을 배우게 됩니다.딥러닝과 강화학습을 결합해, 거의 감독 없이도 매우 복잡한 환경을 탐색하도록 에이전트를 훈련하는 데 사용할 수 있는 딥 강화학습을 배우게 됩니다.그 과정에서 이러한 기법을 실제 프로젝트에 적용해 택시 경로 최적화와 주식 거래 시뮬레이션을 포함한 문제를 해결하게 됩니다.이 강화 학습 도구들을 손에 넣었으니, 이제 강화 학습의 흥미로운 새로운 응용 분야인 인간 피드백 기반 강화 학습(RLHF)에 도전할 준비가 되었습니다. RLHF는 인간 피드백을 응답에 대해 학습시켜 LLM 출력물을 개선하는 데 사용할 수 있습니다.오늘 강화 학습 여정을 시작하세요!

선수 조건

이 트랙에는 선수 조건이 없습니다
  • Course

    1

    Python으로 배우는 Gymnasium 기반 Reinforcement Learning

    강화 학습 여정을 시작하세요! 에이전트가 상호작용을 통해 환경을 해결하는 법을 배우는 방식을 알아보세요.

  • Project

    보너스

    Taxi Route Optimization with Reinforcement Learning

    Solve the Taxi-v3 environment using Q-learning, ensuring efficient AI-driven transportation.

강화 학습 in Python
3 강의
트랙
완료

수료증 획득

LinkedIn 프로필, 이력서 또는 CV에 이 인증서를 추가하세요
소셜 미디어와 성과 평가에서 공유하세요
지금 등록

19백만 명 이상의 학습자와 함께 강화 학습 in Python을(를) 시작하세요!

무료 계정 만들기

Google에서 계속 진행더 많은 옵션 보기

또는


계속 진행하시면 당사의 이용약관개인정보처리방침에 동의하고 및 귀하의 데이터가 미국에 저장되는 것에 동의하게 됩니다.

DataCamp for Mobile을 통해 데이터 분석 능력을 향상시키세요.

모바일 강좌와 매일 5분 코딩 챌린지를 통해 이동 중에도 학습 효과를 높이세요.