본문으로 바로가기
Machine Learning

강의

DVC로 배우는 데이터 버저닝 입문

중급기술 수준
업데이트됨 2025. 6.
ML 데이터 관리용 Data Version Control을 탐색하세요. 설정을 익히고, 파이프라인을 자동화하며, 모델을 원활하게 평가합니다.
무료로 강의 시작
DVCMachine Learning
3시간
12 동영상
35 연습 문제
2,500 XP
3,575
성취 증명서

무료 계정 만들기

Google에서 계속 진행더 많은 옵션 보기

또는


계속 진행하시면 당사의 이용약관개인정보처리방침에 동의하고 및 귀하의 데이터가 미국에 저장되는 것에 동의하게 됩니다.

수천 개 기업의 학습자들이 사랑하는

Group

팀을 교육하시나요?

비즈니스용으로 체험해 보세요

강의 설명

이 강의는 머신 러닝 데이터의 효율적인 관리와 버전 관리를 위해 설계된 도구인 Data Version Control(DVC)에 대한 포괄적인 입문을 제공합니다. 머신 러닝 제품 수명 주기에 대한 이해를 얻고, 데이터 버전 관리와 코드 버전 관리를 구분하며 DVC의 특성과 활용 사례를 살펴보게 됩니다.

DVC 특성 살펴보기

데이터 버전 관리의 필요성, 머신 러닝 라이프사이클, 그리고 DVC의 고유한 특성과 활용 사례를 이해하게 됩니다. DVC 설정에 대해서도 배우게 되며, 설치, 저장소 초기화, .dvcignore 파일을 다룹니다. DVC 캐시와 스테이징 파일을 살펴보고, 파일을 추가하고 제거하는 방법을 배우며, 캐시를 관리하고 그 이면의 작동 원리를 이해하게 됩니다. DVC 원격 저장소에 대해 배우고, DVC와 Git 원격 저장소의 차이점을 설명하며, 원격 저장소를 추가하고, 리스트로 확인하고, 수정하는 방법을 익히게 됩니다. 원격 저장소와 상호작용하고, 데이터를 push 및 pull하며, 특정 버전을 체크아웃하고, 데이터를 캐시에 가져오는 방법을 배우게 됩니다.

자동화 및 평가

ML 파이프라인을 자동화하도록 동기를 부여받게 되며, 코드의 모듈화와 구성 파일 생성에 중점을 두게 됩니다. DVC 파이프라인을 방향성 비순환 그래프로 소개받게 되며, 단계와 그 입력 및 출력을 추가하는 실습 경험을 쌓게 됩니다. 머신 러닝 모델 학습에서 다양한 사용 사례를 지원할 수 있도록 이러한 파이프라인을 효율적으로 실행하는 실습 문제를 진행합니다. 강의는 평가에 초점을 맞추며 마무리되며, DVC에서 지표와 그래프를 어떻게 추적하는지 보여줍니다.

선수 조건

Supervised Learning with scikit-learnIntroduction to Git
1

Introduction to DVC

This chapter provides a comprehensive introduction to Data Version Control (DVC), a tool essential for data versioning in machine learning. Learners will explore the motivation behind data versioning, understand its differences from code versioning, and experiment with a simple classification problem. They will review basic Git commands, learn about DVC, and practice setting up a repository. The chapter concludes with an overview of DVC’s features and use cases, including versioning data and models, CI/CD for machine learning, experiment tracking, pipelines, and more.
챕터 시작
2

DVC Configuration and Data Management

This chapter delves into the setup of DVC, encompassing aspects such as installation, initialization of the repository, and the utilization of the .dvcignore file. It further navigates through the exploration of DVC cache and staging files, imparting knowledge on how to add and remove files, manage caches, and comprehend the underlying mechanisms using the MD5 hash. The chapter also elucidates on DVC remotes, distinguishing them from Git remotes, and guides you on how to add, list, and modify them. Lastly, it teaches you how to interact with these remotes by pushing and pulling data, checking out specific versions, and fetching data to the cache.
챕터 시작
3

Pipelines in DVC

This chapter focuses on automating ML pipelines using DVC. Learners create a configuration file containing settings and hyperparameters. They also learn about pipeline visualization using directed acyclic graphs and use commands to describe dependencies, commands, and outputs. Execution of DVC pipelines is covered, including local model training and how Git tracks DVC metadata. Additionally, learners explore metrics and plots tracking in DVC, including how to print metrics, create plot files, and compare metrics and plots across different pipeline stages.
챕터 시작
DVC로 배우는 데이터 버저닝 입문
강의
완료

수료증 획득

LinkedIn 프로필, 이력서 또는 CV에 이 인증서를 추가하세요
소셜 미디어와 성과 평가에서 공유하세요
지금 등록

19백만 명 이상의 학습자와 함께 DVC로 배우는 데이터 버저닝 입문을(를) 시작하세요!

무료 계정 만들기

Google에서 계속 진행더 많은 옵션 보기

또는


계속 진행하시면 당사의 이용약관개인정보처리방침에 동의하고 및 귀하의 데이터가 미국에 저장되는 것에 동의하게 됩니다.

DataCamp for Mobile을 통해 데이터 분석 능력을 향상시키세요.

모바일 강좌와 매일 5분 코딩 챌린지를 통해 이동 중에도 학습 효과를 높이세요.