Limpeza de dados em Python
Aprenda a diagnosticar e tratar dados sujos e transforme seus dados brutos em insights precisos!
Comece O Curso Gratuitamente4 horas13 vídeos44 exercícios120.948 aprendizesDeclaração de Realização
Crie sua conta gratuita
ou
Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.Treinar 2 ou mais pessoas?
Tentar DataCamp for BusinessAmado por alunos de milhares de empresas
Descrição do Curso
Descubra como limpar dados em Python
Costuma-se dizer que os cientistas de dados passam 80% do tempo limpando e manipulando dados e apenas 20% do tempo analisando-os. A limpeza de dados é uma etapa essencial para todo cientista de dados, pois a análise de dados sujos pode levar a conclusões imprecisas.Neste curso, você aprenderá a identificar, diagnosticar e tratar vários problemas de limpeza de dados em Python, desde os mais simples até os mais avançados. Você lidará com tipos de dados inadequados, verificará se os dados estão no intervalo correto, lidará com dados ausentes, realizará a vinculação de registros e muito mais!
Saiba como limpar diferentes tipos de dados
O primeiro capítulo do curso explora problemas comuns de dados e como você pode corrigi-los. Primeiro, você entenderá os tipos de dados básicos e como lidar com eles individualmente. Depois, você aplicará restrições de intervalo e removerá pontos de dados duplicados.O último capítulo explora a vinculação de registros, uma ferramenta poderosa para mesclar vários conjuntos de dados. Você aprenderá a vincular registros calculando a similaridade entre cadeias de caracteres. Por fim, você usará suas novas habilidades para unir dois conjuntos de dados de avaliações de restaurantes em um conjunto de dados mestre limpo.
Ganhe confiança na limpeza de dados
Ao final do curso, você terá confiança para limpar dados de vários tipos e usar a vinculação de registros para mesclar vários conjuntos de dados. A limpeza de dados é uma habilidade essencial para os cientistas de dados. Se você quiser saber mais sobre a limpeza de dados em Python e seus aplicativos, confira as seguintes faixas: Cientista de dados com Python e Importação e limpeza de dados com Python.Treinar 2 ou mais pessoas?
Obtenha acesso à sua equipe à plataforma DataCamp completa, incluindo todos os recursos.Nas seguintes faixas
Importação e limpeza de dados em Python
Ir para a trilha- 1
Problemas comuns de dados
GratuitoNeste capítulo, você aprenderá a superar alguns dos problemas mais comuns de dados sujos. Você converterá tipos de dados, aplicará restrições de intervalo para remover pontos de dados futuros e removerá pontos de dados duplicados para evitar contagem dupla.
Restrições de tipo de dados50 xpTipos de dados comuns100 xpDados numéricos ou ... ?100 xpSoma de strings e concatenação de números100 xpRestrições de intervalo de dados50 xpRestrições de tamanho de pneu100 xpDe volta para o futuro100 xpRestrições de exclusividade50 xpQual é o tamanho do seu subconjunto?50 xpLocalização de duplicatas100 xpTratamento de duplicatas100 xp - 2
Problemas de texto e dados categóricos
Os dados categóricos e de texto podem ser algumas das partes mais confusas de um conjunto de dados devido à sua natureza não estruturada. Neste capítulo, você aprenderá a corrigir inconsistências de espaço em branco e de letras maiúsculas nos rótulos de categoria, a recolher várias categorias em uma só e a reformatar strings para obter consistência.
- 3
Problemas avançados de dados
Neste capítulo, você se aprofundará em problemas mais avançados de limpeza de dados, como garantir que todos os pesos sejam escritos em quilogramas em vez de libras. Você também adquirirá habilidades valiosas que o ajudarão a verificar se os valores foram adicionados corretamente e se os valores ausentes não afetam negativamente suas análises.
- 4
Vinculação de registros
A vinculação de registros é uma técnica poderosa usada para mesclar vários conjuntos de dados, usada quando os valores têm erros de digitação ou grafias diferentes. Neste capítulo, você aprenderá a vincular registros calculando a similaridade entre strings. Em seguida, usará suas novas habilidades para unir dois conjuntos de dados de avaliações de restaurantes em um conjunto de dados mestre limpo.
Comparação de strings50 xpDistância mínima de edição50 xpO ponto de corte100 xpRemapeamento de categorias II100 xpGeração de pares50 xpCriar ou não criar um link?100 xpPares de restaurantes100 xpRestaurantes similares100 xpVinculação de DataFrames50 xpObtendo o índice correto50 xpConectando-os!100 xpParabéns!50 xp
Treinar 2 ou mais pessoas?
Obtenha acesso à sua equipe à plataforma DataCamp completa, incluindo todos os recursos.Nas seguintes faixas
Importação e limpeza de dados em Python
Ir para a trilhaconjuntos de dados
Ride sharing datasetAirlines datasetBanking datasetRestaurants datasetRestaurants dataset IIcolaboradores
Adel Nehme
Ver MaisVP of Media, DataCamp
O que os outros alunos têm a dizer?
Junte-se a mais de 15 milhões de alunos e comece Limpeza de dados em Python hoje mesmo!
Crie sua conta gratuita
ou
Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.