Pular para o conteúdo principal
InícioShell

Curso

CI/CD para Machine Learning

AvançadoNível de habilidade
Atualizado 06/2025
Eleve o desenvolvimento em aprendizado de máquina com CI/CD usando GitHub Actions e controle de versão de dados (DVC).
Iniciar curso gratuitamente
ShellMachine Learning
5 h
15 vídeos
46 Exercícios
3,500 XP
8,504
Declaração de realização

Crie sua conta gratuita

Continuar com o GoogleMostrar mais opções

ou


Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados serão armazenados nos EUA.

Preferido por alunos de milhares de empresas

Group

Treinando uma equipe?

Experimente para Empresas

Descrição do curso

O curso vai te ajudar a otimizar seus processos de desenvolvimento de machine learning, aumentando a eficiência, a confiabilidade e a reprodutibilidade dos seus projetos. Ao longo do curso, você vai entender bem os fluxos de trabalho de CI/CD e a sintaxe YAML, usando o GitHub Actions (GA) pra automação, treinando modelos em um pipeline, controlando versões de conjuntos de dados com DVC, ajustando hiperparâmetros e automatizando testes e pull requests.

Fundamentos de CI/CD, YAML e machine learning

Você vai conhecer os conceitos básicos de CI/CD e YAML e entender o ciclo de vida do desenvolvimento de software e termos importantes como compilação, teste e implantação. Você vai entender o que é integração contínua, entrega contínua e implantação contínua, além de ver as diferenças entre elas. Você também vai ver como o CI/CD pode ajudar no machine learning e na experimentação.

Ações do GitHub para automação de CI/CD

Você vai aprender sobre o GA, uma plataforma poderosa para implementar fluxos de trabalho de CI/CD. Você vai descobrir os vários elementos do GA, incluindo eventos, ações, tarefas, etapas, executores e contexto. Você vai aprender a definir fluxos de trabalho acionados por eventos como solicitações push e pull e personalizar máquinas executoras. Você também vai ganhar experiência prática configurando pipelines básicos de CI e entendendo o log do GA.

Controle de versões de conjuntos de dados com controle de versão de dados

Você vai mergulhar fundo no Controle de Versão de Dados (DVC) para controlar versões de conjuntos de dados, inicializar o DVC e acompanhar conjuntos de dados. Usando pipelines DVC, você vai aprender a treinar modelos de classificação e gerar métricas de um jeito que dá pra reproduzir.

Otimizando o desempenho do modelo e ajustando os hiperparâmetros

Agora você vai se concentrar na análise de desempenho do modelo e no ajuste de hiperparâmetros, além de adquirir habilidades práticas na comparação de métricas e gráficos entre ramificações para comparar as mudanças no desempenho do modelo. Você vai aprender a baixar artefatos usando GA e fazer o ajuste de hiperparâmetros usando o GridSearchCV do scikit-learn. Além disso, você vai ver como automatizar pull requests com a melhor configuração de modelo.

Pré-requisitos

MLOps ConceptsSupervised Learning with scikit-learnIntermediate Git
1

Introdução a Continuous Integration/Continuous Delivery e YAML

Neste capítulo, você vai explorar os princípios essenciais de Continuous Integration/Continuous Delivery (CI/CD) e YAML. Você vai entender o ciclo de vida do desenvolvimento de software e termos-chave como build, test e deploy. Descubra as diferenças entre Continuous Integration, Continuous Delivery e Continuous Deployment. Além disso, investigue a importância de CI/CD em Machine Learning e em experimentação.
Iniciar capítulo
2

GitHub Actions

Prepare-se para explorar o GitHub Actions (GHA), uma plataforma influente para executar fluxos de trabalho de CI/CD. Conheça os diversos componentes do GHA, abrangendo events, actions, jobs, steps, runners e context. Entenda como criar workflows que disparam com eventos como push e pull requests e como ajustar as máquinas runner. Mergulhe no aprendizado prático ao configurar pipelines fundamentais de CI e compreender os detalhes do log do GHA.
Iniciar capítulo
3

Continuous Integration em Machine Learning

Neste capítulo, você vai explorar a integração do treinamento de modelos de Machine Learning em um pipeline do GitHub Actions usando o Continuous Machine Learning GitHub Action. Você vai gerar um relatório completo em Markdown, incluindo métricas e gráficos do modelo. Também vai se aprofundar em versionamento de dados em Machine Learning adotando o Data Version Control (DVC) para acompanhar mudanças nos dados. O capítulo também aborda a configuração de remotes do DVC e a transferência de conjuntos de dados. Por fim, você vai explorar pipelines do DVC, configurando um arquivo YAML do DVC para orquestrar um treinamento de modelo reprodutível.
Iniciar capítulo
4

Comparando execuções de treino e ajuste de Hiperparâmetros (HP)

Neste capítulo, você vai direcionar sua atenção para a análise de desempenho do modelo e o ajuste de hiperparâmetros. Você vai adquirir experiência prática ao comparar métricas e visualizações entre diferentes branches para avaliar mudanças no desempenho do modelo. Você vai realizar ajuste de hiperparâmetros usando o GridSearchCV do scikit-learn. Além disso, você vai explorar a automação de pull requests usando a configuração de modelo ideal.
Iniciar capítulo
CI/CD para Machine Learning
Curso
concluído

Obtenha um certificado de conclusão

Adicione esta credencial ao seu perfil do LinkedIn, currículo ou CV
Compartilhe nas redes sociais e em sua avaliação de desempenho
Inscreva-se agora

Faça como mais de 19 milhões de alunos e comece CI/CD para Machine Learning hoje mesmo!

Crie sua conta gratuita

Continuar com o GoogleMostrar mais opções

ou


Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados serão armazenados nos EUA.

Desenvolva suas habilidades em dados com o app do DataCamp

Continue progredindo em qualquer lugar com nossos cursos para celular e desafios diários de programação de 5 minutos.