Przejdź do głównej treści
Strona głównaMachine Learning

Kurs

Wprowadzenie do wersjonowania danych z DVC

ŚredniozaawansowanyPoziom umiejętności
Zaktualizowano 06.2025
Poznaj Data Version Control do zarządzania danymi ML. Opanuj konfigurację, automatyzuj pipeline’y i oceniaj modele bezproblemowo.
Zacznij kurs za darmo
DVCMachine Learning
3 godz.
12 filmów
35 Ćwiczeń
2,500 XP
3,572
Zaświadczenie o ukończeniu

Utwórz bezpłatne konto

Kontynuuj z GooglePokaż więcej opcji

lub


Kontynuując, akceptujesz nasze Warunki korzystania, naszą Politykę prywatności oraz to, że Twoje dane są przechowywane w USA.

Uwielbiany przez kursantów z tysięcy firm

Group

Szkolisz zespół?

Wypróbuj dla firm

Opis kursu

Ten kurs oferuje kompleksowe wprowadzenie do Data Version Control (DVC), narzędzia zaprojektowanego do efektywnego zarządzania danymi do uczenia maszynowego oraz ich wersjonowania. Zdobędziesz zrozumienie cyklu życia produktu machine learning, poznasz różnice między wersjonowaniem danych a wersjonowaniem kodu oraz odkryjesz funkcje i zastosowania DVC.

Poznawanie funkcji DVC

Zrozumiesz motywacje stojące za wersjonowaniem danych, cyklem życia uczenia maszynowego oraz unikalnymi funkcjami i zastosowaniami DVC. Dowiesz się również o konfiguracji DVC, obejmującej instalację, inicjalizację repozytorium oraz plik .dvcignore. Poznasz pamięć podręczną DVC i pliki stagingowe, nauczysz się dodawać i usuwać pliki, zarządzać pamięciami podręcznymi oraz zrozumiesz mechanizmy, które za tym stoją. Nauczysz się o zdalnych repozytoriach DVC, wyjaśnisz różnicę między zdalnymi repozytoriami DVC a Git, dodasz zdalne repozytoria, wyświetlisz ich listę i zmodyfikujesz je. Nauczysz się pracować z repozytoriami zdalnymi, wysyłać i pobierać dane, sprawdzać konkretne wersje oraz pobierać dane do pamięci podręcznej.

Automatyzuj i oceniaj

Będziesz zmotywowany do automatyzacji potoków ML, ze szczególnym naciskiem na modularizację kodu i tworzenie pliku konfiguracyjnego. Zostaniesz wprowadzony do potoków DVC jako skierowanych grafów acyklicznych, z praktycznym doświadczeniem w dodawaniu etapów oraz ich danych wejściowych i wyjściowych. Będziesz ćwiczyć efektywne wykonywanie tych potoków, aby umożliwić różne zastosowania w trenowaniu modeli uczenia maszynowego. Kurs kończy się skupieniem na ewaluacji, pokazując, jak metryki i wykresy są śledzone w DVC.

Wymagania wstępne

Supervised Learning with scikit-learnIntroduction to Git
1

Introduction to DVC

This chapter provides a comprehensive introduction to Data Version Control (DVC), a tool essential for data versioning in machine learning. Learners will explore the motivation behind data versioning, understand its differences from code versioning, and experiment with a simple classification problem. They will review basic Git commands, learn about DVC, and practice setting up a repository. The chapter concludes with an overview of DVC’s features and use cases, including versioning data and models, CI/CD for machine learning, experiment tracking, pipelines, and more.
Zacznij rozdział
2

DVC Configuration and Data Management

This chapter delves into the setup of DVC, encompassing aspects such as installation, initialization of the repository, and the utilization of the .dvcignore file. It further navigates through the exploration of DVC cache and staging files, imparting knowledge on how to add and remove files, manage caches, and comprehend the underlying mechanisms using the MD5 hash. The chapter also elucidates on DVC remotes, distinguishing them from Git remotes, and guides you on how to add, list, and modify them. Lastly, it teaches you how to interact with these remotes by pushing and pulling data, checking out specific versions, and fetching data to the cache.
Zacznij rozdział
3

Pipelines in DVC

This chapter focuses on automating ML pipelines using DVC. Learners create a configuration file containing settings and hyperparameters. They also learn about pipeline visualization using directed acyclic graphs and use commands to describe dependencies, commands, and outputs. Execution of DVC pipelines is covered, including local model training and how Git tracks DVC metadata. Additionally, learners explore metrics and plots tracking in DVC, including how to print metrics, create plot files, and compare metrics and plots across different pipeline stages.
Zacznij rozdział
Wprowadzenie do wersjonowania danych z DVC
Kurs
ukończony

Zdobądź zaświadczenie o ukończeniu

Dodaj to poświadczenie do swojego profilu LinkedIn, CV lub życiorysu
Udostępnij to w mediach społecznościowych i podczas oceny wyników pracy
Zapisz się teraz

Dołącz do ponad 19 milionów kursantów i zacznij Wprowadzenie do wersjonowania danych z DVC już dziś!

Utwórz bezpłatne konto

Kontynuuj z GooglePokaż więcej opcji

lub


Kontynuując, akceptujesz nasze Warunki korzystania, naszą Politykę prywatności oraz to, że Twoje dane są przechowywane w USA.

Rozwijaj swoje umiejętności w zakresie danych dzięki DataCamp dla urządzeń mobilnych

Rób postępy w podróży dzięki naszym kursom mobilnym i codziennym 5-minutowym wyzwaniom kodowania.