본문으로 바로가기
Python

트랙

강화 학습 파이썬에서

업데이트됨 2026. 3.
강화 학습(RL)의 기본 원리를 숙달하여 복잡한 실제 환경을 탐색하고 학습 기반 모델(LLM)을 훈련할 수 있는 모델을 만드세요.
무료로 트랙 시작
Python머신러닝12시간3,962

무료 계정을 만드세요

또는

계속 진행하시면 당사의 이용약관, 개인정보처리방침 및 귀하의 데이터가 미국에 저장되는 것에 동의하시는 것입니다.

수천 개 기업의 학습자들이 사랑하는

Group

2명 이상을 교육하시나요?

DataCamp for Business 체험

트랙 설명

강화 학습 파이썬에서

강화 학습(RL)의 기본 원리를 익히고 로봇 공학 및 비디오 게임에서 흔히 볼 수 있는 복잡한 환경을 탐색하는 모델을 구축하는 방법을 알아보세요.강화 학습을 처음 접하거나 머신 러닝의 한 분야로서 강화 학습을 전문적으로 공부하고 싶다면, 이곳이 시작하기에 이상적인 곳입니다.이 과정에서는 마르코프 결정 과정, 탐색/활용 균형, 동적 프로그래밍 알고리즘과 같은 강화 학습의 핵심 개념을 배우는 것으로 시작합니다. 체육관 도서관에서 Q-러닝, SARSA 및 기타 방법을 적용하여 산맥과 얼어붙은 호수를 탐색하는 방법을 배우게 될 것입니다.여러분은 딥러닝과 강화 학습을 결합하여, 최소한의 감독만으로도 매우 복잡한 환경을 탐색하도록 에이전트를 훈련시키는 데 사용할 수 있는 딥 강화 학습을 발견하게 될 것입니다.이 과정에서 여러분은 택시 노선 최적화 및 주식 거래 시뮬레이션과 같은 실제 프로젝트를 해결하기 위해 이러한 기술을 적용하게 될 것입니다.이러한 강화 학습 도구를 활용하면 강화 학습의 흥미로운 새로운 응용 분야인 인간 피드백 기반 강화 학습(RLHF)을 시작할 준비가 된 것입니다. RLHF는 응답에 대한 인간의 피드백을 기반으로 학습함으로써 LLM 출력값을 개선하는 데 사용할 수 있습니다.지금 바로 강화 학습 여정을 시작하세요!

선수 조건

이 트랙에는 선수 조건이 없습니다
  • Course

    1

    Python으로 배우는 Gymnasium 기반 Reinforcement Learning

    강화 학습 여정을 시작하세요! 에이전트가 상호작용을 통해 환경을 해결하는 법을 배우는 방식을 알아보세요.

  • Project

    보너스

    Taxi Route Optimization with Reinforcement Learning

    Solve the Taxi-v3 environment using Q-learning, ensuring efficient AI-driven transportation.

강화 학습 파이썬에서
3 강의
트랙
완료

수료증 획득

LinkedIn 프로필, 이력서 또는 CV에 이 자격증을 추가하세요
소셜 미디어와 성과 평가에서 공유하세요
지금 등록

19백만 명 이상의 학습자와 함께 강화 학습 파이썬에서을(를) 시작하세요!

무료 계정을 만드세요

또는

계속 진행하시면 당사의 이용약관, 개인정보처리방침 및 귀하의 데이터가 미국에 저장되는 것에 동의하시는 것입니다.

DataCamp for Mobile을 통해 데이터 분석 능력을 향상시키세요.

모바일 강좌와 매일 5분 코딩 챌린지를 통해 이동 중에도 학습 효과를 높이세요.