CI/CD pour le Machine Learning

AvancéNiveau de compétence

Actualisé 06/2025

Améliorez votre développement en machine learning avec les CI/CD à l'aide de GitHub Actions et de Data Version Control.

Description du cours

Ce cours vous permettra de rationaliser vos processus de développement en matière d'apprentissage automatique, améliorant ainsi l'efficacité, la fiabilité et la reproductibilité de vos projets. Tout au long de ce cours, vous développerez une compréhension approfondie des workflows CI/CD et de la syntaxe YAML, en utilisant GitHub Actions (GA) pour l'automatisation, la formation de modèles dans un pipeline, la gestion des versions des ensembles de données avec DVC, le réglage des hyperparamètres et l'automatisation des tests et des pull requests.

Principes fondamentaux de CI/CD, YAML et apprentissage automatique

Vous découvrirez les concepts fondamentaux du CI/CD et du YAML, et acquerrez une compréhension du cycle de vie du développement logiciel et des termes clés tels que « build », « test » et « deploy ». Vous définirez l'intégration continue, la livraison continue et le déploiement continu tout en examinant leurs distinctions. Vous découvrirez également l'utilité du CI/CD dans l'apprentissage automatique et l'expérimentation.

Actions GitHub pour l'automatisation CI/CD

Vous découvrirez GA, une plateforme performante pour la mise en œuvre de workflows CI/CD. Vous découvrirez les différents éléments de GA, notamment les événements, les actions, les tâches, les étapes, les runners et le contexte. Vous apprendrez à définir des workflows déclenchés par des événements tels que les demandes push et pull, et à personnaliser les machines runner. Vous acquerrez également une expérience pratique en configurant des pipelines CI de base et en comprenant le journal GA.

Gestion des versions des ensembles de données avec le contrôle de version des données

Vous approfondirez vos connaissances en matière de contrôle de version des données (DVC) pour la gestion des versions des ensembles de données, l'initialisation du DVC et le suivi des ensembles de données. Grâce aux pipelines DVC, vous apprendrez à former des modèles de classification et à générer des métriques de manière reproductible.

Optimisation des performances du modèle et réglage des hyperparamètres

Vous allez maintenant vous concentrer sur l'analyse des performances des modèles et le réglage des hyperparamètres, et acquérir des compétences pratiques dans la comparaison des métriques et des graphiques entre les différentes branches afin de comparer les changements dans les performances des modèles. Vous apprendrez à télécharger des artefacts à l'aide de GA et à effectuer un réglage des hyperparamètres à l'aide de GridSearchCV de scikit-learn. De plus, vous découvrirez comment automatiser les demandes d'extraction avec la meilleure configuration de modèle.

Prérequis

MLOps Concepts Supervised Learning with scikit-learn Intermediate Git

Introduction à l’Intégration Continue/Livraison Continue et à YAML

Dans ce chapitre, vous explorerez les principes essentiels de l’Intégration Continue/Livraison Continue (CI/CD) et de YAML. Vous comprendrez le cycle de vie du développement logiciel et des termes clés comme build, test et deploy. Découvrez les différences entre Intégration Continue, Livraison Continue et Déploiement Continu. Vous étudierez également l’importance de la CI/CD pour le Machine Learning et l’expérimentation.

Introduction à l’Intégration continue/Livraison continue pour le Machine Learning

Description du cours

Principes fondamentaux de CI/CD, YAML et apprentissage automatique

Actions GitHub pour l'automatisation CI/CD

Gestion des versions des ensembles de données avec le contrôle de version des données

Optimisation des performances du modèle et réglage des hyperparamètres

Obtenez un certificat de réussite

Rejoignez plus de .css-nklxlk{color:var(--wf-brand--main, #03EF62);}19 millions d'utilisateurs et commencez CI/CD pour le Machine Learning dès aujourd'hui !

Créez votre compte gratuitement

Apprenez où que vous soyez avec l'application DataCamp

Rejoignez plus de 19 millions d'utilisateurs et commencez CI/CD pour le Machine Learning dès aujourd'hui !