Pular para o conteúdo principal

Curso

Aprendizado Supervisionado com o scikit-learn

IntermediárioNível de habilidade

Atualizado 12/2025

Aprimore suas habilidades em aprendizado de máquina com scikit-learn e dados reais. Aprenda a fazer previsões poderosas em Python!

Iniciar curso gratuitamente

PythonMachine Learning

4 h

15 vídeos

49 Exercícios

4,050 XP

280K+

Declaração de realização

Preferido por alunos de milhares de empresas

Treinando uma equipe?

Experimente para Empresas

Descrição do curso

Desenvolva suas habilidades de aprendizado de máquina com o scikit-learn e descubra como usar essa famosa biblioteca Python para treinar modelos usando dados rotulados. Neste curso, você aprenderá a fazer previsões poderosas, como, por exemplo, se um cliente vai deixar sua empresa, se uma pessoa tem diabetes e até mesmo como classificar o gênero de uma música. Usando conjuntos de dados reais, você descobrirá como criar modelos preditivos, ajustar seus parâmetros e determinar o desempenho deles com dados não vistos.

Pré-requisitos

Introduction to Statistics in Python

1

Classificação

Neste capítulo, será feita uma introdução aos problemas de classificação e você aprenderá a resolvê-los usando técnicas de aprendizado supervisionado. Você vai aprender a dividir os dados em conjuntos de treinamento e teste, ajustar um modelo, fazer previsões e avaliar a precisão. Você descobrirá a relação entre complexidade e desempenho do modelo, aplicando o que aprendeu a um conjunto de dados de cancelamento de assinaturas, no qual classificará a situação dos cancelamentos de clientes de uma empresa de telecomunicações.

Aprendizado de máquina com o scikit-learn

Classificação binária

Fluxo de trabalho de aprendizado supervisionado

O desafio da classificação

k vizinhos mais próximos: ajuste

k vizinhos mais próximos: previsão

Avaliação do desempenho do modelo

Divisão em treinamento/teste + cálculo da precisão

Sobreajuste e subajuste

Visualização da complexidade do modelo

Iniciar capítulo

2

Regressão

Este capítulo introduz o conceito de regressão, e você vai criar modelos para prever valores de vendas usando um conjunto de dados sobre gastos com publicidade. Você aprenderá como funcionam a regressão linear e métricas de desempenho comuns, como R-quadrado e raiz do erro quadrático médio. Você vai fazer a validação cruzada com k grupos (k folds) e aplicar a regularização a modelos de regressão para reduzir o risco de sobreajuste.

Introdução à regressão

Criação de variáveis independentes

Criação de um modelo de regressão linear

Visualização de um modelo de regressão linear

Noções básicas de regressão linear

Ajuste e previsão para regressão

Desempenho da regressão

Validação cruzada

Validação cruzada com R-quadrado

Análise de métricas de validação cruzada

Regressão regularizada

Regressão regularizada: ridge

Regressão Lasso para análise da importância de variáveis independentes

Iniciar capítulo

3

Refinamento do modelo

Depois de treinar os modelos, agora você aprenderá a avaliá-los. Neste capítulo, são apresentadas várias métricas e uma técnica de visualização para analisar o desempenho do modelo de classificação usando o scikit-learn. Você também aprenderá a otimizar modelos de classificação e regressão por meio do ajuste de hiperparâmetros.

Qual é o desempenho de seu modelo?

Decisão sobre uma métrica primária

Avaliação de um classificador para previsão de diabetes

Regressão logística e curva de COR

Criação de um modelo de regressão logística

A curva de COR

Área sob a curva de COR (ROC AUC)

Ajuste de hiperparâmetros

Ajuste de hiperparâmetros com GridSearchCV

Ajuste de hiperparâmetros com RandomizedSearchCV

Iniciar capítulo

4

Pré-processamento e pipelines

Saiba como imputar valores faltantes, converter dados categóricos em valores numéricos, fazer o escalonamento de dados, avaliar vários modelos de aprendizado supervisionado de maneira simultânea e criar pipelines para otimizar o fluxo de trabalho!

Pré-processamento de dados

Criação de variáveis binárias (dummies)

Regressão com variáveis independentes categóricas

Tratamento de dados faltantes

Eliminação de dados faltantes

Pipeline para previsão do gênero de músicas: I

Pipeline para previsão do gênero de músicas: II

Centralização e escalonamento

Centralização e escalonamento para regressão

Centralização e escalonamento para classificação

Avaliação de vários modelos

Visualização do desempenho do modelo de regressão

Previsão com base no conjunto de teste

Visualização do desempenho do modelo de classificação

Pipeline para previsão da popularidade de músicas

Iniciar capítulo

Aprendizado Supervisionado com o scikit-learn

Curso
concluído

Obtenha um certificado de conclusão

Adicione esta credencial ao seu perfil do LinkedIn, currículo ou CV
Compartilhe nas redes sociais e em sua avaliação de desempenhoInscreva-se agora

Faça como mais de 19 milhões de alunos e comece Aprendizado Supervisionado com o scikit-learn hoje mesmo!

Desenvolva suas habilidades em dados com o app do DataCamp

Continue progredindo em qualquer lugar com nossos cursos para celular e desafios diários de programação de 5 minutos.