본문으로 바로가기
Machine Learning

강의

DVC로 배우는 데이터 버저닝 입문

중급기술 수준
업데이트됨 2025. 6.
ML 데이터 관리용 Data Version Control을 탐색하세요. 설정을 익히고, 파이프라인을 자동화하며, 모델을 원활하게 평가합니다.
무료로 강의 시작
DVCMachine Learning3시간12 동영상35 연습 문제2,500 XP3,320성취 증명서

무료 계정을 만드세요

또는

계속 진행하시면 당사의 이용약관, 개인정보처리방침 및 귀하의 데이터가 미국에 저장되는 것에 동의하시는 것입니다.

수천 개 기업의 학습자들이 사랑하는

Group

2명 이상을 교육하시나요?

DataCamp for Business 체험

강의 설명

Machine Learning 데이터를 관리하고 버전 관리하는 도구인 Data Version Control(DVC)을 자세히 알아봐요. ML 라이프사이클에서의 역할을 살펴보고, 데이터 버저닝과 코드 버전 관리의 차이를 구분하며, DVC의 기능과 활용 사례를 탐구합니다. 캐시 관리와 리모트 설정을 포함한 DVC 환경 설정 방법을 배우고, CI/CD, 실험 추적, 파이프라인에서의 활용을 알아봅니다. 코드 모듈화를 강조하며 ML 파이프라인을 자동화하고 효율적으로 실행하는 방법을 연습해 보세요. 마지막으로 DVC에서의 지표 추적을 통해 모델 평가를 수행하고, 근거 있는 의사결정을 돕는 방법을 익힙니다.

선수 조건

Supervised Learning with scikit-learnIntroduction to Git
1

Introduction to DVC

This chapter provides a comprehensive introduction to Data Version Control (DVC), a tool essential for data versioning in machine learning. Learners will explore the motivation behind data versioning, understand its differences from code versioning, and experiment with a simple classification problem. They will review basic Git commands, learn about DVC, and practice setting up a repository. The chapter concludes with an overview of DVC’s features and use cases, including versioning data and models, CI/CD for machine learning, experiment tracking, pipelines, and more.
챕터 시작
2

DVC Configuration and Data Management

This chapter delves into the setup of DVC, encompassing aspects such as installation, initialization of the repository, and the utilization of the .dvcignore file. It further navigates through the exploration of DVC cache and staging files, imparting knowledge on how to add and remove files, manage caches, and comprehend the underlying mechanisms using the MD5 hash. The chapter also elucidates on DVC remotes, distinguishing them from Git remotes, and guides you on how to add, list, and modify them. Lastly, it teaches you how to interact with these remotes by pushing and pulling data, checking out specific versions, and fetching data to the cache.
챕터 시작
3

Pipelines in DVC

This chapter focuses on automating ML pipelines using DVC. Learners create a configuration file containing settings and hyperparameters. They also learn about pipeline visualization using directed acyclic graphs and use commands to describe dependencies, commands, and outputs. Execution of DVC pipelines is covered, including local model training and how Git tracks DVC metadata. Additionally, learners explore metrics and plots tracking in DVC, including how to print metrics, create plot files, and compare metrics and plots across different pipeline stages.
챕터 시작
DVC로 배우는 데이터 버저닝 입문
강의
완료

수료증 획득

LinkedIn 프로필, 이력서 또는 CV에 이 자격증을 추가하세요
소셜 미디어와 성과 평가에서 공유하세요
지금 등록

19백만 명 이상의 학습자와 함께 DVC로 배우는 데이터 버저닝 입문을(를) 시작하세요!

무료 계정을 만드세요

또는

계속 진행하시면 당사의 이용약관, 개인정보처리방침 및 귀하의 데이터가 미국에 저장되는 것에 동의하시는 것입니다.

DataCamp for Mobile을 통해 데이터 분석 능력을 향상시키세요.

모바일 강좌와 매일 5분 코딩 챌린지를 통해 이동 중에도 학습 효과를 높이세요.