Aprendizado de máquina com modelos baseados em árvores em Python
Neste curso, você aprenderá a usar modelos de árvore e ensembles para regressão e classificação com scikit-learn.
Comece O Curso Gratuitamente5 horas15 vídeos57 exercícios
Crie sua conta gratuita
ou
Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.Treinar 2 ou mais pessoas?Experimente o DataCamp For Business
Amado por alunos de milhares de empresas
Descrição do Curso
As árvores de decisão são modelos de aprendizado supervisionado usados para problemas que envolvem classificação e regressão. Os modelos de árvore apresentam uma alta flexibilidade que tem um preço: por um lado, as árvores são capazes de capturar relações não lineares complexas; por outro lado, elas são propensas a memorizar o ruído presente em um conjunto de dados. Ao agregar as previsões de árvores treinadas de forma diferente, os métodos de agrupamento aproveitam a flexibilidade das árvores e reduzem sua tendência de memorizar ruídos. Os métodos de agrupamento são usados em uma variedade de campos e têm um histórico comprovado de vitórias em muitas competições de aprendizado de máquina.
Neste curso, você aprenderá a usar o Python para treinar árvores de decisão e modelos baseados em árvores com a biblioteca de aprendizado de máquina scikit-learn, de fácil utilização. Você entenderá as vantagens e as deficiências das árvores e demonstrará como o agrupamento pode atenuar essas deficiências, tudo isso enquanto pratica com conjuntos de dados do mundo real. Por fim, você também entenderá como ajustar os hiperparâmetros mais influentes para obter o máximo dos seus modelos.
Para Empresas
Treinar 2 ou mais pessoas?
Obtenha acesso à biblioteca completa do DataCamp, com relatórios, atribuições, projetos e muito mais centralizadosNas seguintes faixas
Cientista de aprendizado de máquina com Python
Ir para a trilhaAprendizado de máquina supervisionado em Python
Ir para a trilha- 1
Árvores de classificação e regressão
GratuitoAs árvores de classificação e regressão (CART) são um conjunto de modelos de aprendizado supervisionados usados para problemas que envolvem classificação e regressão. Neste capítulo, você conhecerá o algoritmo CART.
Árvore de decisão para classificação50 xpTreine sua primeira árvore de classificação100 xpAvaliar a árvore de classificação100 xpRegressão logística vs. árvore de classificação100 xpAprendizado de árvore de classificação50 xpCrescimento de uma árvore de classificação50 xpUsando a entropia como um critério100 xpEntropia versus índice de Gini100 xpÁrvore de decisão para regressão50 xpTreine sua primeira árvore de regressão100 xpAvaliar a árvore de regressão100 xpRegressão linear versus árvore de regressão100 xp - 2
O comprometimento entre viés e variância
A troca de viés e variância é um dos conceitos fundamentais do aprendizado de máquina supervisionado. Neste capítulo, você entenderá como diagnosticar os problemas de sobreajuste e subajuste. Você também conhecerá o conceito de agrupamento, em que as previsões de vários modelos são agregadas para produzir previsões mais robustas.
Erro de generalização50 xpComplexidade, viés e variação50 xpSobreajuste e subajuste50 xpDiagnosticar problemas de viés e variância50 xpInstanciar o modelo100 xpAvaliar o erro de 10 vezes CV100 xpAvaliar o erro de treinamento100 xpAlta tendência ou alta variação?50 xpAprendizado por agrupamento50 xpDefinir o agrupamento100 xpAvaliar classificadores individuais100 xpMelhor desempenho com um classificador de votação100 xp - 3
Agregação de Bootstrap e Florestas Aleatórias
Agregação de bootstrap é um método de agrupamento que envolve o treinamento do mesmo algoritmo várias vezes usando diferentes subconjuntos amostrados dos dados de treinamento. Neste capítulo, você entenderá como a agregação de bootstrap pode ser usada para criar um agrupamento de árvores. Você também aprenderá como o algoritmo de florestas aleatórias pode levar a uma maior diversidade de agrupamentos por meio da randomização no nível de cada divisão nas árvores que formam o agrupamento.
Agregação de bootstrap50 xpDefinir o classificador de agregação de bootstrap100 xpAvaliar o desempenho da agregação de bootstrap100 xpAvaliação Out of Bag50 xpPreparar o terreno100 xpPontuação OOB versus pontuação do conjunto de teste100 xpFlorestas aleatórias (RF)50 xpTreinar um regressor RF100 xpAvaliar o regressor RF100 xpVisualização da importância dos recursos100 xp - 4
Boosting
Boosting refere-se a um método de agrupamento no qual vários modelos são treinados sequencialmente com cada modelo aprendendo com os erros de seus predecessores. Neste capítulo, você conhecerá os dois métodos de boosting do AdaBoost e do Gradient Boosting.
Adaboost50 xpDefinir o classificador AdaBoost100 xpTreinar o classificador AdaBoost100 xpAvaliar o classificador AdaBoost100 xpGradient Boosting (GB)50 xpDefinir o regressor GB100 xpTreinar o regressor GB100 xpAvaliar o regressor GB100 xpGradient Boosting Estocástico (SGB)50 xpRegressão com SGB100 xpTreinar o regressor SGB100 xpAvaliar o regressor SGB100 xp - 5
Ajuste de modelo
Os hiperparâmetros de um modelo de aprendizado de máquina são parâmetros que não são aprendidos com os dados. Eles devem ser definidos antes de você ajustar o modelo ao conjunto de treinamento. Neste capítulo, você aprenderá a ajustar os hiperparâmetros de um modelo baseado em árvore usando a validação cruzada de pesquisa de grade.
Ajuste dos hiperparâmetros de um CART50 xpHiperparâmetros da árvore50 xpDefinir a grade de hiperparâmetros da árvore100 xpBusca da árvore ideal100 xpAvaliar a árvore ideal100 xpAjuste dos hiperparâmetros de um RF50 xpHiperparâmetros de florestas aleatórias50 xpDefinir a grade de hiperparâmetros de RF100 xpBusca da floresta ideal100 xpAvaliar a floresta ideal100 xpParabéns!50 xp
Para Empresas
Treinar 2 ou mais pessoas?
Obtenha acesso à biblioteca completa do DataCamp, com relatórios, atribuições, projetos e muito mais centralizadosNas seguintes faixas
Cientista de aprendizado de máquina com Python
Ir para a trilhaAprendizado de máquina supervisionado em Python
Ir para a trilhacolaboradores
pré-requisitos
Supervised Learning with scikit-learnElie Kawerk
Ver MaisSenior Data Scientist
O que os outros alunos têm a dizer?
Junte-se a mais de 14 milhões de alunos e comece Aprendizado de máquina com modelos baseados em árvores em Python hoje mesmo!
Crie sua conta gratuita
ou
Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.