Ga naar hoofdinhoud
HomeMachine Learning

Cursus

Introductie tot dataversiebeheer met DVC

GemiddeldVaardigheidsniveau
Bijgewerkt 06-2025
Check eens Data Version Control voor het beheren van ML-data. Zet je setup op, automatiseer je processen en evalueer je modellen zonder gedoe.
Start Cursus Kosteloos
DVCMachine Learning
3 u
12 videos
35 Opdrachten
2,500 XP
3,585
Bewijs van Prestatie

Maak je kosteloos account aan

Ga verder met GoogleMeer opties weergeven

of


Door verder te gaan accepteer je onze Gebruiksvoorwaarden, ons Privacybeleid en dat je gegevens worden opgeslagen in de VS.

Geliefd bij leerlingen van duizenden bedrijven

Group

Een team trainen?

Probeer voor bedrijven

Cursusbeschrijving

Deze cursus geeft je een uitgebreide introductie tot Data Version Control (DVC), een tool die is gemaakt om machine learning-data efficiënt te beheren en te versioneren. Je leert over de levenscyclus van machine learning-producten, het verschil tussen dataversies en codeversies, en je ontdekt de functies en toepassingen van DVC.

De functies van DVC ontdekken

Je leert de redenen achter dataversiebeheer, de levenscyclus van machine learning en de unieke functies en toepassingen van DVC. Je leert ook over DVC-configuratie, zoals installatie, initialisatie van de repository en het .dvcignore-bestand. Je gaat DVC-cache- en stagingbestanden bekijken, leren hoe je bestanden toevoegt en verwijdert, caches beheert en de onderliggende mechanismen begrijpt. Je leert over DVC-remotes, het verschil tussen DVC en Git-remotes, hoe je remotes toevoegt, ze opsomt en aanpast. Je leert omgaan met remotes, data pushen en pullen, specifieke versies checken en data ophalen naar de cache.

Automatiseer en evalueer

Je gaat gemotiveerd aan de slag om ML-pijplijnen te automatiseren, waarbij je de nadruk legt op het modulair maken van code en het maken van een configuratiebestand. Je leert DVC-pijplijnen kennen als gerichte acyclische grafieken, en je krijgt de kans om zelf stages en hun inputs en outputs toe te voegen. Je gaat oefenen met het efficiënt uitvoeren van deze pijplijnen om verschillende toepassingen in machine learning-modeltraining mogelijk te maken. De cursus eindigt met een focus op evaluatie, waarbij wordt laten zien hoe statistieken en grafieken worden bijgehouden in DVC.

Vereisten

Supervised Learning with scikit-learnIntroduction to Git
1

Introductie tot DVC

Dit hoofdstuk biedt een uitgebreide introductie tot Data Version Control (DVC), een essentiële tool voor dataversiebeheer in Machine Learning. Je ontdekt waarom dataversiebeheer belangrijk is, begrijpt de verschillen met codeversiebeheer en experimenteert met een eenvoudig classificatieprobleem. Je herhaalt basis-Git-commando’s, maakt kennis met DVC en oefent met het opzetten van een repository. Het hoofdstuk sluit af met een overzicht van DVC-functies en use-cases, waaronder versiebeheer van data en modellen, CI/CD voor Machine Learning, experiment tracking, pipelines en meer.
Hoofdstuk beginnen
2

DVC-configuratie en gegevensbeheer

Dit hoofdstuk gaat dieper in op het instellen van DVC, met onderwerpen als installatie, initialisatie van de repository en het gebruik van het .dvcignore-bestand. Je verkent ook de DVC-cache en staging-bestanden en leert hoe je bestanden toevoegt en verwijdert, caches beheert en de onderliggende mechanismen met de MD5-hash begrijpt. Verder worden DVC-remotes uitgelegd en onderscheiden van Git-remotes, en leer je hoe je ze toevoegt, weergeeft en wijzigt. Tot slot leer je hoe je met deze remotes werkt door data te pushen en pullen, specifieke versies te checken, en data naar de cache te fetchen.
Hoofdstuk beginnen
3

Pipelines in DVC

Dit hoofdstuk richt zich op het automatiseren van ML-pipelines met DVC. Je maakt een configuratiebestand met instellingen en hyperparameters. Je leert ook hoe je pipelines visualiseert met gerichte acyclische grafen en gebruikt commando’s om dependencies, commando’s en outputs te beschrijven. De uitvoering van DVC-pipelines komt aan bod, inclusief lokaal model trainen en hoe Git DVC-metadata bijhoudt. Daarnaast verken je het bijhouden van metrics en plots in DVC, waaronder het afdrukken van metrics, het maken van plotbestanden, en het vergelijken van metrics en plots over verschillende pipeline-stappen.
Hoofdstuk beginnen
Introductie tot dataversiebeheer met DVC
Cursus
voltooid

Verdien een prestatieverklaring

Voeg deze referentie toe aan je LinkedIn-profiel, cv of curriculum vitae
Deel het op sociale media en in je functioneringsgesprek
Schrijf je nu in

Sluit je aan bij meer dan 19 miljoen leerlingen en start vandaag nog met Introductie tot dataversiebeheer met DVC!

Maak je kosteloos account aan

Ga verder met GoogleMeer opties weergeven

of


Door verder te gaan accepteer je onze Gebruiksvoorwaarden, ons Privacybeleid en dat je gegevens worden opgeslagen in de VS.

Ontwikkel je datavaardigheden met DataCamp voor Mobiel

Maak vooruitgang onderweg met onze mobiele cursussen en dagelijkse 5-minuten programmeeruitdagingen.