CI/CD para Machine Learning

AvançadoNível de habilidade

Atualizado 06/2025

Eleve o desenvolvimento em aprendizado de máquina com CI/CD usando GitHub Actions e controle de versão de dados (DVC).

Descrição do curso

O curso vai te ajudar a otimizar seus processos de desenvolvimento de machine learning, aumentando a eficiência, a confiabilidade e a reprodutibilidade dos seus projetos. Ao longo do curso, você vai entender bem os fluxos de trabalho de CI/CD e a sintaxe YAML, usando o GitHub Actions (GA) pra automação, treinando modelos em um pipeline, controlando versões de conjuntos de dados com DVC, ajustando hiperparâmetros e automatizando testes e pull requests.

Fundamentos de CI/CD, YAML e machine learning

Você vai conhecer os conceitos básicos de CI/CD e YAML e entender o ciclo de vida do desenvolvimento de software e termos importantes como compilação, teste e implantação. Você vai entender o que é integração contínua, entrega contínua e implantação contínua, além de ver as diferenças entre elas. Você também vai ver como o CI/CD pode ajudar no machine learning e na experimentação.

Ações do GitHub para automação de CI/CD

Você vai aprender sobre o GA, uma plataforma poderosa para implementar fluxos de trabalho de CI/CD. Você vai descobrir os vários elementos do GA, incluindo eventos, ações, tarefas, etapas, executores e contexto. Você vai aprender a definir fluxos de trabalho acionados por eventos como solicitações push e pull e personalizar máquinas executoras. Você também vai ganhar experiência prática configurando pipelines básicos de CI e entendendo o log do GA.

Controle de versões de conjuntos de dados com controle de versão de dados

Você vai mergulhar fundo no Controle de Versão de Dados (DVC) para controlar versões de conjuntos de dados, inicializar o DVC e acompanhar conjuntos de dados. Usando pipelines DVC, você vai aprender a treinar modelos de classificação e gerar métricas de um jeito que dá pra reproduzir.

Otimizando o desempenho do modelo e ajustando os hiperparâmetros

Agora você vai se concentrar na análise de desempenho do modelo e no ajuste de hiperparâmetros, além de adquirir habilidades práticas na comparação de métricas e gráficos entre ramificações para comparar as mudanças no desempenho do modelo. Você vai aprender a baixar artefatos usando GA e fazer o ajuste de hiperparâmetros usando o GridSearchCV do scikit-learn. Além disso, você vai ver como automatizar pull requests com a melhor configuração de modelo.

Pré-requisitos

MLOps Concepts Supervised Learning with scikit-learn Intermediate Git

Introdução a Continuous Integration/Continuous Delivery e YAML

Neste capítulo, você vai explorar os princípios essenciais de Continuous Integration/Continuous Delivery (CI/CD) e YAML. Você vai entender o ciclo de vida do desenvolvimento de software e termos-chave como build, test e deploy. Descubra as diferenças entre Continuous Integration, Continuous Delivery e Continuous Deployment. Além disso, investigue a importância de CI/CD em Machine Learning e em experimentação.

Introdução a Continuous Integration/Continuous Delivery para Machine Learning

Descrição do curso

Fundamentos de CI/CD, YAML e machine learning

Ações do GitHub para automação de CI/CD

Controle de versões de conjuntos de dados com controle de versão de dados

Otimizando o desempenho do modelo e ajustando os hiperparâmetros

Obtenha um certificado de conclusão

Faça como mais de .css-nklxlk{color:var(--wf-brand--main, #03EF62);}19 milhões de alunos e comece CI/CD para Machine Learning hoje mesmo!

Crie sua conta gratuita

Desenvolva suas habilidades em dados com o app do DataCamp

Faça como mais de 19 milhões de alunos e comece CI/CD para Machine Learning hoje mesmo!