CI/CD para Machine Learning

AvanzadoNivel de habilidad

Actualizado 6/2025

Mejora el desarrollo de machine learning con CI/CD utilizando GitHub Actions y el control de versiones de datos.

Descripción del curso

El curso te permitirá optimizar tus procesos de desarrollo de machine learning, mejorando la eficiencia, la fiabilidad y la reproducibilidad de tus proyectos. A lo largo del curso, desarrollarás una comprensión integral de los flujos de trabajo de CI/CD y la sintaxis YAML, utilizando GitHub Actions (GA) para la automatización, entrenando modelos en un pipeline, versionando conjuntos de datos con DVC, realizando el ajuste de hiperparámetros y automatizando las pruebas y las solicitudes de extracción.

Fundamentos de CI/CD, YAML y machine learning

Se te presentarán los conceptos fundamentales de CI/CD y YAML, y obtendrás una comprensión del ciclo de vida del desarrollo de software y términos clave como compilación, prueba e implementación. Definirás la integración continua, la entrega continua y la implementación continua, al tiempo que examinarás sus diferencias. También explorarás la utilidad de CI/CD en machine learning y la experimentación.

Acciones de GitHub para la automatización de CI/CD

Aprenderás sobre GA, una potente plataforma para implementar flujos de trabajo de CI/CD. Descubrirás los distintos elementos de GA, incluidos eventos, acciones, trabajos, pasos, ejecutores y contexto. Aprenderás a definir flujos de trabajo activados por eventos como solicitudes push y pull, y a personalizar máquinas ejecutoras. También adquirirás experiencia práctica al configurar canalizaciones básicas de CI y comprender el registro GA.

Control de versiones de conjuntos de datos con control de versiones de datos

Profundizarás en el control de versiones de datos (DVC) para versionar conjuntos de datos, inicializar DVC y realizar un seguimiento de los conjuntos de datos. Mediante el uso de canalizaciones DVC, aprenderás a entrenar modelos de clasificación y generar métricas de forma reproducible.

Optimización del rendimiento del modelo y ajuste de hiperparámetros

Ahora te centrarás en el análisis del rendimiento de los modelos y el ajuste de hiperparámetros, y adquirirás habilidades prácticas en la comparación de métricas y gráficos entre ramas para comparar los cambios en el rendimiento de los modelos. Aprenderás a descargar artefactos utilizando GA y a realizar el ajuste de hiperparámetros utilizando GridSearchCV de scikit-learn. Además, explorarás la automatización de las solicitudes de extracción con la mejor configuración del modelo.

Requisitos previos

MLOps Concepts Supervised Learning with scikit-learn Intermediate Git

Introducción a Continuous Integration/Continuous Delivery y YAML

En este capítulo, explorarás los principios esenciales de Continuous Integration/Continuous Delivery (CI/CD) y YAML. Comprenderás el ciclo de vida del desarrollo de software y términos clave como build, test y deploy. Descubre las diferencias entre Continuous Integration, Continuous Delivery y Continuous Deployment. Además, investigarás la importancia de CI/CD en Machine Learning y la experimentación.

Introducción a la Integración continua/Entrega continua para Machine Learning

Descripción del curso

Fundamentos de CI/CD, YAML y machine learning

Acciones de GitHub para la automatización de CI/CD

Control de versiones de conjuntos de datos con control de versiones de datos

Optimización del rendimiento del modelo y ajuste de hiperparámetros

Obtener certificado de logros

¡Únete a .css-nklxlk{color:var(--wf-brand--main, #03EF62);}19 millones de estudiantes y empieza CI/CD para Machine Learning hoy mismo!

Crea tu cuenta gratuita

Desarrolla tus habilidades de datos con la aplicación móvil de DataCamp

¡Únete a 19 millones de estudiantes y empieza CI/CD para Machine Learning hoy mismo!