Pular para o conteúdo principal

Curso

Aprendizado de máquina com modelos baseados em árvores em Python

IntermediárioNível de habilidade

Atualizado 12/2025

Neste curso, você aprenderá a usar modelos baseados em árvores e conjuntos para regressão e classificação usando o scikit-learn.

Iniciar curso gratuitamente

PythonMachine Learning

5 h

15 vídeos

57 Exercícios

4,650 XP

110K+

Declaração de realização

Preferido por alunos de milhares de empresas

Treinando uma equipe?

Experimente para Empresas

Descrição do curso

As árvores de decisão são modelos de aprendizado supervisionado usados para problemas que envolvem classificação e regressão. Os modelos de árvore apresentam uma alta flexibilidade que tem um preço: por um lado, as árvores são capazes de capturar relações não lineares complexas; por outro lado, elas são propensas a memorizar o ruído presente em um conjunto de dados. Ao agregar as previsões de árvores treinadas de forma diferente, os métodos de agrupamento aproveitam a flexibilidade das árvores e reduzem sua tendência de memorizar ruídos. Os métodos de agrupamento são usados em uma variedade de campos e têm um histórico comprovado de vitórias em muitas competições de aprendizado de máquina. Neste curso, você aprenderá a usar o Python para treinar árvores de decisão e modelos baseados em árvores com a biblioteca de aprendizado de máquina scikit-learn, de fácil utilização. Você entenderá as vantagens e as deficiências das árvores e demonstrará como o agrupamento pode atenuar essas deficiências, tudo isso enquanto pratica com conjuntos de dados do mundo real. Por fim, você também entenderá como ajustar os hiperparâmetros mais influentes para obter o máximo dos seus modelos.

Pré-requisitos

Supervised Learning with scikit-learn

1

Árvores de classificação e regressão

As árvores de classificação e regressão (CART) são um conjunto de modelos de aprendizado supervisionados usados para problemas que envolvem classificação e regressão. Neste capítulo, você conhecerá o algoritmo CART.

Árvore de decisão para classificação

Treine sua primeira árvore de classificação

Avaliar a árvore de classificação

Regressão logística vs. árvore de classificação

Aprendizado de árvore de classificação

Crescimento de uma árvore de classificação

Usando a entropia como um critério

Entropia versus índice de Gini

Árvore de decisão para regressão

Treine sua primeira árvore de regressão

Avaliar a árvore de regressão

Regressão linear versus árvore de regressão

Iniciar capítulo

2

O comprometimento entre viés e variância

A troca de viés e variância é um dos conceitos fundamentais do aprendizado de máquina supervisionado. Neste capítulo, você entenderá como diagnosticar os problemas de sobreajuste e subajuste. Você também conhecerá o conceito de agrupamento, em que as previsões de vários modelos são agregadas para produzir previsões mais robustas.

Erro de generalização

Complexidade, viés e variação

Sobreajuste e subajuste

Diagnosticar problemas de viés e variância

Instanciar o modelo

Avaliar o erro de 10 vezes CV

Avaliar o erro de treinamento

Alta tendência ou alta variação?

Aprendizado por agrupamento

Definir o agrupamento

Avaliar classificadores individuais

Melhor desempenho com um classificador de votação

Iniciar capítulo

3

Agregação de Bootstrap e Florestas Aleatórias

Agregação de bootstrap é um método de agrupamento que envolve o treinamento do mesmo algoritmo várias vezes usando diferentes subconjuntos amostrados dos dados de treinamento. Neste capítulo, você entenderá como a agregação de bootstrap pode ser usada para criar um agrupamento de árvores. Você também aprenderá como o algoritmo de florestas aleatórias pode levar a uma maior diversidade de agrupamentos por meio da randomização no nível de cada divisão nas árvores que formam o agrupamento.

Agregação de bootstrap

Definir o classificador de agregação de bootstrap

Avaliar o desempenho da agregação de bootstrap

Avaliação Out of Bag

Preparar o terreno

Pontuação OOB versus pontuação do conjunto de teste

Florestas aleatórias (RF)

Treinar um regressor RF

Avaliar o regressor RF

Visualização da importância dos recursos

Iniciar capítulo

4

Boosting

Boosting refere-se a um método de agrupamento no qual vários modelos são treinados sequencialmente com cada modelo aprendendo com os erros de seus predecessores. Neste capítulo, você conhecerá os dois métodos de boosting do AdaBoost e do Gradient Boosting.

Definir o classificador AdaBoost

Treinar o classificador AdaBoost

Avaliar o classificador AdaBoost

Gradient Boosting (GB)

Definir o regressor GB

Treinar o regressor GB

Avaliar o regressor GB

Gradient Boosting Estocástico (SGB)

Regressão com SGB

Treinar o regressor SGB

Avaliar o regressor SGB

Iniciar capítulo

5

Ajuste de modelo

Os hiperparâmetros de um modelo de aprendizado de máquina são parâmetros que não são aprendidos com os dados. Eles devem ser definidos antes de você ajustar o modelo ao conjunto de treinamento. Neste capítulo, você aprenderá a ajustar os hiperparâmetros de um modelo baseado em árvore usando a validação cruzada de pesquisa de grade.

Ajuste dos hiperparâmetros de um CART

Hiperparâmetros da árvore

Definir a grade de hiperparâmetros da árvore

Busca da árvore ideal

Avaliar a árvore ideal

Ajuste dos hiperparâmetros de um RF

Hiperparâmetros de florestas aleatórias

Definir a grade de hiperparâmetros de RF

Busca da floresta ideal

Avaliar a floresta ideal

Iniciar capítulo

Aprendizado de máquina com modelos baseados em árvores em Python

Curso
concluído

Obtenha um certificado de conclusão

Adicione esta credencial ao seu perfil do LinkedIn, currículo ou CV
Compartilhe nas redes sociais e em sua avaliação de desempenhoInscreva-se agora

Faça como mais de 19 milhões de alunos e comece Aprendizado de máquina com modelos baseados em árvores em Python hoje mesmo!

Desenvolva suas habilidades em dados com o app do DataCamp

Continue progredindo em qualquer lugar com nossos cursos para celular e desafios diários de programação de 5 minutos.