Corso
Introduzione al versionamento dei dati con DVC
IntermedioLivello di competenza
Aggiornato 06/2025
DVCMachine Learning3 h12 video35 Esercizi2,500 XP3,585Attestato di conseguimento
Crea il tuo account gratuito
Continua con GoogleMostra più opzionio
Continuando, accetti i nostri Termini di utilizzo, la nostra Informativa sulla privacy e che i tuoi dati siano conservati negli Stati Uniti.
Preferito dagli studenti di migliaia di aziende
Formare un team?
Prova per il BusinessDescrizione del corso
Scopri le caratteristiche di DVC
Capirai perché si fa il versioning dei dati, come funziona il ciclo di vita dell'apprendimento automatico e quali sono le caratteristiche e i casi d'uso di DVC. Imparerai anche come configurare DVC, dall'installazione all'inizializzazione del repository, fino al file .dvcignore. Esplorerai la cache DVC e i file di staging, imparerai ad aggiungere e rimuovere file, gestire le cache e capire i meccanismi alla base. Imparerai a conoscere i remote DVC, capirai la differenza tra DVC e Git remote, aggiungerai remote, li elencherai e li modificherai. Imparerai a usare i telecomandi, a inviare e ricevere dati, a controllare versioni specifiche e a scaricare dati nella cache.Automatizza e valuta
Sarai motivato ad automatizzare le pipeline ML, concentrandoti sulla modularizzazione del codice e sulla creazione di un file di configurazione. Ti spiegheremo le pipeline DVC come grafici aciclici diretti, con un po' di pratica nell'aggiungere fasi e i loro input e output. Ti eserciterai a usare queste pipeline in modo efficiente per gestire diversi casi d'uso nell'addestramento dei modelli di machine learning. Il corso finisce concentrandosi sulla valutazione, mostrando come si tengono traccia delle metriche e dei grafici in DVC.Prerequisiti
Supervised Learning with scikit-learnIntroduction to Git1
Introduzione a DVC
Questo capitolo offre un’introduzione completa a Data Version Control (DVC), uno strumento essenziale per il versionamento dei dati nel Machine Learning. Esplorerai le motivazioni del versionamento dei dati, capirai in cosa differisce dal versionamento del codice e sperimenterai con un semplice problema di classificazione. Ripasserai i comandi base di Git, conoscerai DVC e farai pratica nell’impostare un repository. Il capitolo si conclude con una panoramica delle funzionalità e dei casi d’uso di DVC, tra cui versionamento di dati e modelli, CI/CD per il Machine Learning, tracciamento degli esperimenti, pipeline e altro ancora.
2
Configurazione di DVC e gestione dei dati
Questo capitolo approfondisce la configurazione di DVC, includendo installazione, inizializzazione del repository e utilizzo del file .dvcignore. Prosegue con l’esplorazione della cache di DVC e dei file di staging, spiegando come aggiungere e rimuovere file, gestire le cache e comprendere i meccanismi sottostanti usando l’hash MD5. Il capitolo chiarisce anche cosa sono i remoti di DVC, come si differenziano dai remoti di Git e ti guida su come aggiungerli, elencarli e modificarli. Infine, imparerai a interagire con questi remoti eseguendo push e pull dei dati, effettuando il checkout di versioni specifiche e recuperando i dati nella cache.
3
Pipeline in DVC
Questo capitolo è incentrato sull’automazione delle pipeline di ML con DVC. Creerai un file di configurazione con impostazioni e iperparametri. Imparerai anche a visualizzare le pipeline usando grafi aciclici diretti e a usare i comandi per descrivere dipendenze, comandi e risultati. L’esecuzione delle pipeline DVC viene trattata includendo l’addestramento del modello in locale e come Git traccia i metadati di DVC. Inoltre, esplorerai il tracciamento di metriche e grafici in DVC, incluso come stampare le metriche, creare file di grafici e confrontare metriche e grafici tra diverse fasi della pipeline.
Introduzione al versionamento dei dati con DVC
Corso completato
Ottieni Attestato di conseguimento
Aggiungi questa certificazione al tuo profilo LinkedIn, al curriculum o al CVCondividila sui social e nella valutazione delle tue performanceIscriviti ora
Unisciti a oltre 19 milioni di studenti e inizia Introduzione al versionamento dei dati con DVC oggi!
Crea il tuo account gratuito
Continua con GoogleMostra più opzionio
Continuando, accetti i nostri Termini di utilizzo, la nostra Informativa sulla privacy e che i tuoi dati siano conservati negli Stati Uniti.
Aumenta le tue competenze sui dati con l'app di DataCamp
Avanza ovunque ti trovi con i nostri corsi per dispositivi mobili e le nostre sfide di programmazione quotidiane da 5 minuti.