본문으로 바로가기
Python

tracks

강화 학습 파이썬에서

업데이트됨 2026. 3.
강화 학습(RL)의 기본 원리를 숙달하여 복잡한 실제 환경을 탐색하고 학습 기반 모델(LLM)을 훈련할 수 있는 모델을 만드세요.
무료로 트랙을 시작하세요

포함 사항프리미엄 or 팀

Python머신러닝123,751

무료 계정을 만드세요

또는

계속 진행하시면 당사의 이용약관, 개인정보처리방침 및 귀하의 데이터가 미국에 저장되는 것에 동의하시는 것입니다.

수천 개의 회사에서 학습자들에게 사랑받는 제품입니다.

Group

2명 이상을 교육하시나요?

DataCamp for Business 사용해 보세요

트랙 설명

강화 학습 파이썬에서

강화 학습(RL)의 기본 원리를 익히고 로봇 공학 및 비디오 게임에서 흔히 볼 수 있는 복잡한 환경을 탐색하는 모델을 구축하는 방법을 알아보세요.강화 학습을 처음 접하거나 머신 러닝의 한 분야로서 강화 학습을 전문적으로 공부하고 싶다면, 이곳이 시작하기에 이상적인 곳입니다.이 과정에서는 마르코프 결정 과정, 탐색/활용 균형, 동적 프로그래밍 알고리즘과 같은 강화 학습의 핵심 개념을 배우는 것으로 시작합니다. 체육관 도서관에서 Q-러닝, SARSA 및 기타 방법을 적용하여 산맥과 얼어붙은 호수를 탐색하는 방법을 배우게 될 것입니다.여러분은 딥러닝과 강화 학습을 결합하여, 최소한의 감독만으로도 매우 복잡한 환경을 탐색하도록 에이전트를 훈련시키는 데 사용할 수 있는 딥 강화 학습을 발견하게 될 것입니다.이 과정에서 여러분은 택시 노선 최적화 및 주식 거래 시뮬레이션과 같은 실제 프로젝트를 해결하기 위해 이러한 기술을 적용하게 될 것입니다.이러한 강화 학습 도구를 활용하면 강화 학습의 흥미로운 새로운 응용 분야인 인간 피드백 기반 강화 학습(RLHF)을 시작할 준비가 된 것입니다. RLHF는 응답에 대한 인간의 피드백을 기반으로 학습함으로써 LLM 출력값을 개선하는 데 사용할 수 있습니다.지금 바로 강화 학습 여정을 시작하세요!

필수 조건

이 과정에는 사전 요구 사항이 없습니다.
  • Course

    1

    Python으로 배우는 Gymnasium 기반 Reinforcement Learning

    강화 학습 여정을 시작하세요! 에이전트가 상호작용을 통해 환경을 해결하는 법을 배우는 방식을 알아보세요.

  • Project

    보너스

    Taxi Route Optimization with Reinforcement Learning

    Solve the Taxi-v3 environment using Q-learning, ensuring efficient AI-driven transportation.

강화 학습 파이썬에서
3 courses
트랙
완료

성과 증명서 발급

이 자격증을 링크드인 프로필, 이력서 또는 자기소개서에 추가하세요.
소셜 미디어와 업무 평가에 공유하세요.

포함 사항프리미엄 or 팀

지금 등록하세요

함께 참여하세요 19 백만 명의 학습자 지금 바로 강화 학습 파이썬에서 시작하세요!

무료 계정을 만드세요

또는

계속 진행하시면 당사의 이용약관, 개인정보처리방침 및 귀하의 데이터가 미국에 저장되는 것에 동의하시는 것입니다.