Pular para o conteúdo principal
InícioPython

Limpeza de dados em Python

Aprenda a diagnosticar e tratar dados sujos e transforme seus dados brutos em insights precisos!

Comece O Curso Gratuitamente
4 horas13 vídeos44 exercícios120.948 aprendizesTrophyDeclaração de Realização

Crie sua conta gratuita

GoogleLinkedInFacebook

ou

Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.
Group

Treinar 2 ou mais pessoas?

Tentar DataCamp for Business

Amado por alunos de milhares de empresas


Descrição do Curso

Descubra como limpar dados em Python

Costuma-se dizer que os cientistas de dados passam 80% do tempo limpando e manipulando dados e apenas 20% do tempo analisando-os. A limpeza de dados é uma etapa essencial para todo cientista de dados, pois a análise de dados sujos pode levar a conclusões imprecisas.

Neste curso, você aprenderá a identificar, diagnosticar e tratar vários problemas de limpeza de dados em Python, desde os mais simples até os mais avançados. Você lidará com tipos de dados inadequados, verificará se os dados estão no intervalo correto, lidará com dados ausentes, realizará a vinculação de registros e muito mais!

Saiba como limpar diferentes tipos de dados

O primeiro capítulo do curso explora problemas comuns de dados e como você pode corrigi-los. Primeiro, você entenderá os tipos de dados básicos e como lidar com eles individualmente. Depois, você aplicará restrições de intervalo e removerá pontos de dados duplicados.

O último capítulo explora a vinculação de registros, uma ferramenta poderosa para mesclar vários conjuntos de dados. Você aprenderá a vincular registros calculando a similaridade entre cadeias de caracteres. Por fim, você usará suas novas habilidades para unir dois conjuntos de dados de avaliações de restaurantes em um conjunto de dados mestre limpo.

Ganhe confiança na limpeza de dados

Ao final do curso, você terá confiança para limpar dados de vários tipos e usar a vinculação de registros para mesclar vários conjuntos de dados. A limpeza de dados é uma habilidade essencial para os cientistas de dados. Se você quiser saber mais sobre a limpeza de dados em Python e seus aplicativos, confira as seguintes faixas: Cientista de dados com Python e Importação e limpeza de dados com Python.
Para Empresas

Treinar 2 ou mais pessoas?

Obtenha acesso à sua equipe à plataforma DataCamp completa, incluindo todos os recursos.
DataCamp Para EmpresasPara uma solução sob medida , agende uma demonstração.

Nas seguintes faixas

Certificação disponível

Engenheiro de dados em Python

Ir para a trilha
Certificação disponível

Cientista de dados associado em Python

Ir para a trilha

Importação e limpeza de dados em Python

Ir para a trilha
  1. 1

    Problemas comuns de dados

    Gratuito

    Neste capítulo, você aprenderá a superar alguns dos problemas mais comuns de dados sujos. Você converterá tipos de dados, aplicará restrições de intervalo para remover pontos de dados futuros e removerá pontos de dados duplicados para evitar contagem dupla.

    Reproduzir Capítulo Agora
    Restrições de tipo de dados
    50 xp
    Tipos de dados comuns
    100 xp
    Dados numéricos ou ... ?
    100 xp
    Soma de strings e concatenação de números
    100 xp
    Restrições de intervalo de dados
    50 xp
    Restrições de tamanho de pneu
    100 xp
    De volta para o futuro
    100 xp
    Restrições de exclusividade
    50 xp
    Qual é o tamanho do seu subconjunto?
    50 xp
    Localização de duplicatas
    100 xp
    Tratamento de duplicatas
    100 xp
  2. 2

    Problemas de texto e dados categóricos

    Os dados categóricos e de texto podem ser algumas das partes mais confusas de um conjunto de dados devido à sua natureza não estruturada. Neste capítulo, você aprenderá a corrigir inconsistências de espaço em branco e de letras maiúsculas nos rótulos de categoria, a recolher várias categorias em uma só e a reformatar strings para obter consistência.

    Reproduzir Capítulo Agora
  3. 3

    Problemas avançados de dados

    Neste capítulo, você se aprofundará em problemas mais avançados de limpeza de dados, como garantir que todos os pesos sejam escritos em quilogramas em vez de libras. Você também adquirirá habilidades valiosas que o ajudarão a verificar se os valores foram adicionados corretamente e se os valores ausentes não afetam negativamente suas análises.

    Reproduzir Capítulo Agora
  4. 4

    Vinculação de registros

    A vinculação de registros é uma técnica poderosa usada para mesclar vários conjuntos de dados, usada quando os valores têm erros de digitação ou grafias diferentes. Neste capítulo, você aprenderá a vincular registros calculando a similaridade entre strings. Em seguida, usará suas novas habilidades para unir dois conjuntos de dados de avaliações de restaurantes em um conjunto de dados mestre limpo.

    Reproduzir Capítulo Agora
Para Empresas

Treinar 2 ou mais pessoas?

Obtenha acesso à sua equipe à plataforma DataCamp completa, incluindo todos os recursos.

Nas seguintes faixas

Certificação disponível

Engenheiro de dados em Python

Ir para a trilha
Certificação disponível

Cientista de dados associado em Python

Ir para a trilha

Importação e limpeza de dados em Python

Ir para a trilha

conjuntos de dados

Ride sharing datasetAirlines datasetBanking datasetRestaurants datasetRestaurants dataset II

colaboradores

Collaborator's avatar
Maggie Matsui
Collaborator's avatar
Amy Peterson
Collaborator's avatar
Richie Cotton
Adel Nehme HeadshotAdel Nehme

VP of Media, DataCamp

Ver Mais

O que os outros alunos têm a dizer?

Junte-se a mais de 15 milhões de alunos e comece Limpeza de dados em Python hoje mesmo!

Crie sua conta gratuita

GoogleLinkedInFacebook

ou

Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.