Curso
Limpeza de dados em Python
IntermediárioNível de habilidade
Atualizado 12/2025Iniciar Curso Gratuitamente
Incluído comPremium or Teams
PythonData Preparation4 h13 vídeos44 Exercícios3,500 XP150K+Certificado de conclusão
Crie sua conta gratuita
ou
Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados serão armazenados nos EUA.Preferido por alunos de milhares de empresas
Treinar 2 ou mais pessoas?
Experimentar DataCamp for BusinessDescrição do curso
Descubra como limpar dados em Python
Costuma-se dizer que os cientistas de dados passam 80% do tempo limpando e manipulando dados e apenas 20% do tempo analisando-os. A limpeza de dados é uma etapa essencial para todo cientista de dados, pois a análise de dados sujos pode levar a conclusões imprecisas.Neste curso, você aprenderá a identificar, diagnosticar e tratar vários problemas de limpeza de dados em Python, desde os mais simples até os mais avançados. Você lidará com tipos de dados inadequados, verificará se os dados estão no intervalo correto, lidará com dados ausentes, realizará a vinculação de registros e muito mais!
Saiba como limpar diferentes tipos de dados
O primeiro capítulo do curso explora problemas comuns de dados e como você pode corrigi-los. Primeiro, você entenderá os tipos de dados básicos e como lidar com eles individualmente. Depois, você aplicará restrições de intervalo e removerá pontos de dados duplicados.O último capítulo explora a vinculação de registros, uma ferramenta poderosa para mesclar vários conjuntos de dados. Você aprenderá a vincular registros calculando a similaridade entre cadeias de caracteres. Por fim, você usará suas novas habilidades para unir dois conjuntos de dados de avaliações de restaurantes em um conjunto de dados mestre limpo.
Ganhe confiança na limpeza de dados
Ao final do curso, você terá confiança para limpar dados de vários tipos e usar a vinculação de registros para mesclar vários conjuntos de dados. A limpeza de dados é uma habilidade essencial para os cientistas de dados. Se você quiser saber mais sobre a limpeza de dados em Python e seus aplicativos, confira as seguintes faixas: Cientista de dados com Python e Importação e limpeza de dados com Python.Pré-requisitos
Python ToolboxJoining Data with pandas1
Common data problems
In this chapter, you'll learn how to overcome some of the most common dirty data problems. You'll convert data types, apply range constraints to remove future data points, and remove duplicated data points to avoid double-counting.
2
Text and categorical data problems
Categorical and text data can often be some of the messiest parts of a dataset due to their unstructured nature. In this chapter, you’ll learn how to fix whitespace and capitalization inconsistencies in category labels, collapse multiple categories into one, and reformat strings for consistency.
3
Advanced data problems
In this chapter, you'll dive into more advanced data cleaning problems, such as ensuring that weights are all written in kilograms instead of pounds. You'll also gain invaluable skills that will help you verify that values have been added correctly, and that missing values don't negatively impact your analyses.
4
Record linkage
Record linkage is a powerful technique used to merge multiple datasets together, used when values have typos or different spellings. In this chapter, you'll learn how to link records by calculating the similarity between strings—you'll then use your new skills to join two restaurant review datasets into one clean master dataset.
Limpeza de dados em Python
Curso concluído
Obtenha um certificado de conclusão
Adicione esta credencial ao seu perfil do LinkedIn, currículo ou CVCompartilhe nas redes sociais e em sua avaliação de desempenho
Incluído comPremium or Teams
Inscreva-se AgoraFaça como mais de 19 milhões de alunos e comece Limpeza de dados em Python hoje mesmo!
Crie sua conta gratuita
ou
Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados serão armazenados nos EUA.