Vai al contenuto principale
HomeMachine Learning

Corso

Introduzione al versionamento dei dati con DVC

IntermedioLivello di competenza
Aggiornato 06/2025
Scopri il controllo della versione dei dati per gestire i dati ML. Configura, automatizza i flussi di lavoro e valuta i modelli senza problemi.
Inizia il corso gratis
DVCMachine Learning
3 h
12 video
35 Esercizi
2,500 XP
3,585
Attestato di conseguimento

Crea il tuo account gratuito

Continua con GoogleMostra più opzioni

o


Continuando, accetti i nostri Termini di utilizzo, la nostra Informativa sulla privacy e che i tuoi dati siano conservati negli Stati Uniti.

Preferito dagli studenti di migliaia di aziende

Group

Formare un team?

Prova per il Business

Descrizione del corso

Questo corso ti dà un'idea completa del Data Version Control (DVC), uno strumento fatto apposta per gestire e controllare le versioni dei dati di machine learning in modo efficiente. Capirai come funziona il ciclo di vita dei prodotti di machine learning, imparerai a distinguere il versioning dei dati da quello del codice e scoprirai le caratteristiche e i casi d'uso di DVC.

Scopri le caratteristiche di DVC

Capirai perché si fa il versioning dei dati, come funziona il ciclo di vita dell'apprendimento automatico e quali sono le caratteristiche e i casi d'uso di DVC. Imparerai anche come configurare DVC, dall'installazione all'inizializzazione del repository, fino al file .dvcignore. Esplorerai la cache DVC e i file di staging, imparerai ad aggiungere e rimuovere file, gestire le cache e capire i meccanismi alla base. Imparerai a conoscere i remote DVC, capirai la differenza tra DVC e Git remote, aggiungerai remote, li elencherai e li modificherai. Imparerai a usare i telecomandi, a inviare e ricevere dati, a controllare versioni specifiche e a scaricare dati nella cache.

Automatizza e valuta

Sarai motivato ad automatizzare le pipeline ML, concentrandoti sulla modularizzazione del codice e sulla creazione di un file di configurazione. Ti spiegheremo le pipeline DVC come grafici aciclici diretti, con un po' di pratica nell'aggiungere fasi e i loro input e output. Ti eserciterai a usare queste pipeline in modo efficiente per gestire diversi casi d'uso nell'addestramento dei modelli di machine learning. Il corso finisce concentrandosi sulla valutazione, mostrando come si tengono traccia delle metriche e dei grafici in DVC.

Prerequisiti

Supervised Learning with scikit-learnIntroduction to Git
1

Introduzione a DVC

Questo capitolo offre un’introduzione completa a Data Version Control (DVC), uno strumento essenziale per il versionamento dei dati nel Machine Learning. Esplorerai le motivazioni del versionamento dei dati, capirai in cosa differisce dal versionamento del codice e sperimenterai con un semplice problema di classificazione. Ripasserai i comandi base di Git, conoscerai DVC e farai pratica nell’impostare un repository. Il capitolo si conclude con una panoramica delle funzionalità e dei casi d’uso di DVC, tra cui versionamento di dati e modelli, CI/CD per il Machine Learning, tracciamento degli esperimenti, pipeline e altro ancora.
Inizia il capitolo
2

Configurazione di DVC e gestione dei dati

Questo capitolo approfondisce la configurazione di DVC, includendo installazione, inizializzazione del repository e utilizzo del file .dvcignore. Prosegue con l’esplorazione della cache di DVC e dei file di staging, spiegando come aggiungere e rimuovere file, gestire le cache e comprendere i meccanismi sottostanti usando l’hash MD5. Il capitolo chiarisce anche cosa sono i remoti di DVC, come si differenziano dai remoti di Git e ti guida su come aggiungerli, elencarli e modificarli. Infine, imparerai a interagire con questi remoti eseguendo push e pull dei dati, effettuando il checkout di versioni specifiche e recuperando i dati nella cache.
Inizia il capitolo
3

Pipeline in DVC

Questo capitolo è incentrato sull’automazione delle pipeline di ML con DVC. Creerai un file di configurazione con impostazioni e iperparametri. Imparerai anche a visualizzare le pipeline usando grafi aciclici diretti e a usare i comandi per descrivere dipendenze, comandi e risultati. L’esecuzione delle pipeline DVC viene trattata includendo l’addestramento del modello in locale e come Git traccia i metadati di DVC. Inoltre, esplorerai il tracciamento di metriche e grafici in DVC, incluso come stampare le metriche, creare file di grafici e confrontare metriche e grafici tra diverse fasi della pipeline.
Inizia il capitolo
Introduzione al versionamento dei dati con DVC
Corso
completato

Ottieni Attestato di conseguimento

Aggiungi questa certificazione al tuo profilo LinkedIn, al curriculum o al CV
Condividila sui social e nella valutazione delle tue performance
Iscriviti ora

Unisciti a oltre 19 milioni di studenti e inizia Introduzione al versionamento dei dati con DVC oggi!

Crea il tuo account gratuito

Continua con GoogleMostra più opzioni

o


Continuando, accetti i nostri Termini di utilizzo, la nostra Informativa sulla privacy e che i tuoi dati siano conservati negli Stati Uniti.

Aumenta le tue competenze sui dati con l'app di DataCamp

Avanza ovunque ti trovi con i nostri corsi per dispositivi mobili e le nostre sfide di programmazione quotidiane da 5 minuti.