Aprendizado Supervisionado com o scikit-learn
"Aprenda machine learning com scikit-learn em Python. Use dados reais e faça previsões poderosas!"
Comece O Curso Gratuitamente4 horas15 vídeos49 exercícios
Crie sua conta gratuita
ou
Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.Treinar 2 ou mais pessoas?Experimente o DataCamp For Business
Amado por alunos de milhares de empresas
Descrição do Curso
Desenvolva suas habilidades de aprendizado de máquina com o scikit-learn e descubra como usar essa famosa biblioteca Python para treinar modelos usando dados rotulados. Neste curso, você aprenderá a fazer previsões poderosas, como, por exemplo, se um cliente vai deixar sua empresa, se uma pessoa tem diabetes e até mesmo como classificar o gênero de uma música. Usando conjuntos de dados reais, você descobrirá como criar modelos preditivos, ajustar seus parâmetros e determinar o desempenho deles com dados não vistos.
Para Empresas
Treinar 2 ou mais pessoas?
Obtenha acesso à biblioteca completa do DataCamp, com relatórios, atribuições, projetos e muito mais centralizadosNas seguintes faixas
Engenheiro associado de IA para cientistas de dados
Ir para a trilhaFundamentos de aprendizado de máquina com Python
Ir para a trilha- 1
Classificação
GratuitoNeste capítulo, será feita uma introdução aos problemas de classificação e você aprenderá a resolvê-los usando técnicas de aprendizado supervisionado. Você vai aprender a dividir os dados em conjuntos de treinamento e teste, ajustar um modelo, fazer previsões e avaliar a precisão. Você descobrirá a relação entre complexidade e desempenho do modelo, aplicando o que aprendeu a um conjunto de dados de cancelamento de assinaturas, no qual classificará a situação dos cancelamentos de clientes de uma empresa de telecomunicações.
Aprendizado de máquina com o scikit-learn50 xpClassificação binária50 xpFluxo de trabalho de aprendizado supervisionado100 xpO desafio da classificação50 xpk vizinhos mais próximos: ajuste100 xpk vizinhos mais próximos: previsão100 xpAvaliação do desempenho do modelo50 xpDivisão em treinamento/teste + cálculo da precisão100 xpSobreajuste e subajuste100 xpVisualização da complexidade do modelo100 xp - 2
Regressão
Este capítulo introduz o conceito de regressão, e você vai criar modelos para prever valores de vendas usando um conjunto de dados sobre gastos com publicidade. Você aprenderá como funcionam a regressão linear e métricas de desempenho comuns, como R-quadrado e raiz do erro quadrático médio. Você vai fazer a validação cruzada com k subgrupos (k folds) e aplicar a regularização a modelos de regressão para reduzir o risco de sobreajuste.
Introdução à regressão50 xpCriação de variáveis independentes100 xpCriação de um modelo de regressão linear100 xpVisualização de um modelo de regressão linear100 xpNoções básicas de regressão linear50 xpAjuste e previsão para regressão100 xpDesempenho da regressão100 xpValidação cruzada50 xpValidação cruzada com R-quadrado100 xpAnálise de métricas de validação cruzada100 xpRegressão regularizada50 xpRegressão regularizada: ridge100 xpRegressão Lasso para análise da importância de variáveis independentes100 xp - 3
Refinamento do modelo
Depois de treinar os modelos, agora você aprenderá a avaliá-los. Neste capítulo, são apresentadas várias métricas e uma técnica de visualização para analisar o desempenho do modelo de classificação usando o scikit-learn. Você também aprenderá a otimizar modelos de classificação e regressão por meio do ajuste de hiperparâmetros.
Qual é o desempenho de seu modelo?50 xpDecisão sobre uma métrica primária50 xpAvaliação de um classificador para previsão de diabetes100 xpRegressão logística e a curva de COR50 xpCriação de um modelo de regressão logística100 xpA curva de COR100 xpROC AUC100 xpAjuste de hiperparâmetros50 xpAjuste de hiperparâmetros com GridSearchCV100 xpAjuste de hiperparâmetros com RandomizedSearchCV100 xp - 4
Pré-processamento e pipelines
Saiba como imputar valores faltantes, converter dados categóricos em valores numéricos, fazer o escalonamento de dados, avaliar vários modelos de aprendizado supervisionado de maneira simultânea e criar pipelines para otimizar o fluxo de trabalho!
Pré-processamento de dados50 xpCriação de variáveis binárias (dummies)100 xpRegressão com variáveis independentes categóricas100 xpTratamento de dados faltantes50 xpEliminação de dados faltantes100 xpPipeline para previsão do gênero de músicas: I100 xpPipeline para previsão do gênero de músicas: II100 xpCentralização e escalonamento50 xpCentralização e escalonamento para regressão100 xpCentralização e escalonamento para classificação100 xpAvaliação de vários modelos50 xpVisualização do desempenho do modelo de regressão100 xpPrevisão com base no conjunto de teste100 xpVisualização do desempenho do modelo de classificação100 xpPipeline para previsão da popularidade de músicas100 xpParabéns!50 xp
Para Empresas
Treinar 2 ou mais pessoas?
Obtenha acesso à biblioteca completa do DataCamp, com relatórios, atribuições, projetos e muito mais centralizadosNas seguintes faixas
Engenheiro associado de IA para cientistas de dados
Ir para a trilhaFundamentos de aprendizado de máquina com Python
Ir para a trilhaEm outras faixas
Cientista de aprendizado de máquina com PythonAprendizado de máquina supervisionado em Pythoncolaboradores
pré-requisitos
Introduction to Statistics in PythonGeorge Boorman
Ver MaisCurriculum Manager, DataCamp
O que os outros alunos têm a dizer?
Junte-se a mais de 14 milhões de alunos e comece Aprendizado Supervisionado com o scikit-learn hoje mesmo!
Crie sua conta gratuita
ou
Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.