본문으로 바로가기

강의

PyTorch로 AI 모델 효율적으로 학습시키기

고급기술 수준

업데이트됨 2026. 5.

Accelerator와 Trainer로 분산 학습하여 대규모 언어 모델의 학습 시간을 줄이는 방법을 배우세요

무료로 강의 시작

PythonArtificial Intelligence

4시간

13 동영상

45 연습 문제

3,850 XP

성취 증명서

수천 개 기업의 학습자들이 사랑하는

팀을 교육하시나요?

비즈니스용으로 체험해 보세요

강의 설명

분산 학습은 대규모 머신 러닝에서 필수적인 기술로, 수조 개의 매개변수를 가진 대규모 언어 모델을 학습하는 데 필요한 시간을 줄이는 데 도움이 됩니다. 이 강의에서는 PyTorch, Accelerator, Trainer를 활용한 효율적인 분산 학습에 필수적인 도구, 기법, 전략을 살펴보게 됩니다.

분산 학습을 위한 데이터 준비

분산 학습을 위해 데이터 세트를 여러 장치에 분할하고 각 장치에 모델 복사본을 배포하는 것으로 시작합니다. 분산 환경에서 이미지, 오디오, 텍스트를 포함한 데이터 전처리 실무 경험을 쌓게 됩니다.

효율성 기법 탐구

데이터가 준비되면 여러 인터페이스에서 학습과 옵티마이저 사용의 효율성을 높이는 방법을 살펴보게 됩니다. 메모리 사용량, 디바이스 간 통신, 계산 효율성을 개선하는 기법인 gradient accumulation, gradient checkpointing, local stochastic gradient descent, mixed precision training을 통해 이러한 과제를 해결하는 방법을 배우게 됩니다. 다양한 옵티마이저 간의 트레이드오프를 이해하여 모델의 메모리 사용량을 줄이는 데 도움이 됩니다. 이 강의를 마치면 분산형 AI 기반 서비스를 구축하는 데 필요한 지식과 도구를 갖추게 됩니다.

선수 조건

Intermediate Deep Learning with PyTorch Working with Hugging Face

1

Accelerator를 활용한 데이터 준비

여러 디바이스에 데이터를 분할하고 각 디바이스에 모델을 복사하여 분산 학습을 위한 데이터를 준비합니다. Accelerator는 데이터 준비를 위한 편리한 인터페이스를 제공하며, 분산 학습의 첫 단계로 이미지, 오디오, 텍스트를 전처리하는 방법을 배웁니다.

AutoModel과 Accelerator로 모델 준비하기

사전 학습된 모델 불러오기 및 검사하기

Accelerator를 사용한 자동 장치 배치

학습을 위한 이미지 및 오디오 전처리

이미지 데이터셋 전처리

오디오 데이터셋 전처리

분산 학습을 위한 데이터셋 준비

학습을 위한 텍스트 전처리

AutoTokenizer로 텍스트 전처리하기

전처리된 텍스트 상태 저장 및 불러오기

2

Accelerator와 Trainer를 활용한 분산 학습

분산 학습에서는 각 디바이스가 자신의 데이터를 병렬로 학습합니다. 분산 학습을 위한 두 가지 방법을 살펴봅니다. Accelerator는 커스텀 학습 루프를 지원하고, Trainer는 학습 인터페이스를 간소화합니다.

Trainer로 모델 파인튜닝하기

평가 메트릭 정의하기

TrainingArguments 설정하기

Trainer 설정하기

Accelerator로 모델 학습하기

분산 학습을 위한 모델 준비

Accelerator 적용 전후의 학습 루프

Accelerator로 학습 루프 구성하기

Accelerator로 모델 평가하기

모델을 평가 모드로 설정하기

평가 지표 기록하기

3

학습 효율 향상

대규모 모델과 데이터셋은 분산 학습 시 리소스에 부담을 줍니다. 메모리 사용, 디바이스 통신, 연산 효율을 개선하여 이러한 문제를 해결할 수 있습니다. 그래디언트 누적, 그래디언트 체크포인팅, 로컬 확률적 경사 하강법, 혼합 정밀도 학습 기법을 배웁니다.

그래디언트 누적

Accelerator를 활용한 그래디언트 누적

Trainer를 활용한 그래디언트 누적

그래디언트 체크포인팅과 로컬 SGD

Accelerator를 활용한 그래디언트 체크포인팅

Trainer로 그래디언트 체크포인팅 적용하기

Accelerator로 Local SGD 구현하기

혼합 정밀도 훈련

기본 PyTorch로 혼합 정밀도 훈련하기

Accelerator를 활용한 혼합 정밀도 훈련

Trainer를 활용한 혼합 정밀도 훈련

4

효율적인 옵티마이저를 활용한 학습

옵티마이저를 분산 학습 효율 향상의 도구로 활용하는 방법에 집중하며, AdamW, Adafactor, 8-bit Adam 간의 트레이드오프를 살펴봅니다. 파라미터 수를 줄이거나 낮은 정밀도를 사용하면 모델의 메모리 사용량을 줄일 수 있습니다.

AdamW로 균형 잡힌 학습하기

Trainer와 AdamW 활용

Accelerator와 함께하는 AdamW

옵티마이저 크기 계산하기

Adafactor를 활용한 메모리 효율적 학습

Trainer와 함께하는 Adafactor

Accelerator와 함께하는 Adafactor

8비트 Adam을 활용한 혼합 정밀도 학습

8-bit Adam 옵티마이저 설정하기

Trainer를 활용한 8-bit Adam

Accelerator와 8-bit Adam

어떤 옵티마이저일까요?

수고하셨습니다!

PyTorch로 AI 모델 효율적으로 학습시키기

강의
완료

수료증 획득

LinkedIn 프로필, 이력서 또는 CV에 이 인증서를 추가하세요
소셜 미디어와 성과 평가에서 공유하세요지금 등록

19백만 명 이상의 학습자와 함께 PyTorch로 AI 모델 효율적으로 학습시키기을(를) 시작하세요!

DataCamp for Mobile을 통해 데이터 분석 능력을 향상시키세요.

모바일 강좌와 매일 5분 코딩 챌린지를 통해 이동 중에도 학습 효과를 높이세요.