Curso
Limpeza de dados no R
IntermediárioNível de habilidade
Atualizado 08/2024Iniciar Curso Gratuitamente
Incluído comPremium or Teams
RData Preparation4 h13 vídeos44 Exercícios3,700 XP59,932Certificado de conclusão
Crie sua conta gratuita
ou
Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados serão armazenados nos EUA.Preferido por alunos de milhares de empresas
Treinar 2 ou mais pessoas?
Experimentar DataCamp for BusinessDescrição do curso
Supere problemas comuns de dados, como a remoção de duplicatas no R
Costuma-se dizer que os cientistas de dados passam 80% do tempo limpando e manipulando dados e apenas 20% do tempo analisando-os. O tempo gasto com a limpeza é vital, pois a análise de dados sujos pode levar você a tirar conclusões imprecisas.Neste curso, você aprenderá uma variedade de técnicas para ajudá-lo a limpar dados sujos usando o R. Você começará convertendo tipos de dados, aplicando restrições de intervalo e lidando com duplicatas totais e parciais para evitar contagem dupla.
Mergulhe nos desafios dos dados avançados
Depois de praticar o trabalho com problemas comuns de dados, você passará para desafios mais avançados, como garantir a consistência das medições e lidar com dados ausentes. Após cada novo conceito, você terá a oportunidade de realizar um exercício prático para consolidar seu conhecimento e aumentar sua experiência.Aprenda a usar a vinculação de registros durante a limpeza de dados
O Record Linkage é usado para mesclar conjuntos de dados quando os valores apresentam problemas como erros de digitação ou grafias diferentes. Você explorará essa técnica útil no capítulo final e praticará o aplicativo usando-a para unir dois conjuntos de dados de avaliações de restaurantes em um único conjunto de dados.Pré-requisitos
Joining Data with dplyr1
Common Data Problems
In this chapter, you'll learn how to overcome some of the most common dirty data problems. You'll convert data types, apply range constraints to remove future data points, and remove duplicated data points to avoid double-counting.
2
Categorical and Text Data
Categorical and text data can often be some of the messiest parts of a dataset due to their unstructured nature. In this chapter, you’ll learn how to fix whitespace and capitalization inconsistencies in category labels, collapse multiple categories into one, and reformat strings for consistency.
3
Advanced Data Problems
In this chapter, you’ll dive into more advanced data cleaning problems, such as ensuring that weights are all written in kilograms instead of pounds. You’ll also gain invaluable skills that will help you verify that values have been added correctly and that missing values don’t negatively impact your analyses.
4
Record Linkage
Record linkage is a powerful technique used to merge multiple datasets together, used when values have typos or different spellings. In this chapter, you'll learn how to link records by calculating the similarity between strings—you’ll then use your new skills to join two restaurant review datasets into one clean master dataset.
Limpeza de dados no R
Curso concluído
Obtenha um certificado de conclusão
Adicione esta credencial ao seu perfil do LinkedIn, currículo ou CVCompartilhe nas redes sociais e em sua avaliação de desempenho
Incluído comPremium or Teams
Inscreva-se AgoraFaça como mais de 19 milhões de alunos e comece Limpeza de dados no R hoje mesmo!
Crie sua conta gratuita
ou
Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados serão armazenados nos EUA.