Pular para o conteúdo principal
InícioR

Curso

Limpeza de dados no R

IntermediárioNível de habilidade
Atualizado 08/2024
Aprenda a limpar dados da forma mais rápida e precisa possível para ajudar você a passar de dados brutos para insights incríveis.
Iniciar curso gratuitamente
RData Preparation
4 h
13 vídeos
44 Exercícios
3,700 XP
60,980
Declaração de realização

Crie sua conta gratuita

Continuar com o GoogleMostrar mais opções

ou


Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados serão armazenados nos EUA.

Preferido por alunos de milhares de empresas

Group

Treinando uma equipe?

Experimente para Empresas

Descrição do curso

Supere problemas comuns de dados, como a remoção de duplicatas no R

Costuma-se dizer que os cientistas de dados passam 80% do tempo limpando e manipulando dados e apenas 20% do tempo analisando-os. O tempo gasto com a limpeza é vital, pois a análise de dados sujos pode levar você a tirar conclusões imprecisas.

Neste curso, você aprenderá uma variedade de técnicas para ajudá-lo a limpar dados sujos usando o R. Você começará convertendo tipos de dados, aplicando restrições de intervalo e lidando com duplicatas totais e parciais para evitar contagem dupla.

Mergulhe nos desafios dos dados avançados

Depois de praticar o trabalho com problemas comuns de dados, você passará para desafios mais avançados, como garantir a consistência das medições e lidar com dados ausentes. Após cada novo conceito, você terá a oportunidade de realizar um exercício prático para consolidar seu conhecimento e aumentar sua experiência.

Aprenda a usar a vinculação de registros durante a limpeza de dados

O Record Linkage é usado para mesclar conjuntos de dados quando os valores apresentam problemas como erros de digitação ou grafias diferentes. Você explorará essa técnica útil no capítulo final e praticará o aplicativo usando-a para unir dois conjuntos de dados de avaliações de restaurantes em um único conjunto de dados.

Pré-requisitos

Joining Data with dplyr
1

Problemas comuns de dados

Neste capítulo, você aprenderá a superar alguns dos problemas mais comuns de dados sujos. Você converterá tipos de dados, aplicará restrições de intervalo para remover pontos de dados futuros e removerá pontos de dados duplicados para evitar contagem dupla.
Iniciar capítulo
2

Dados categóricos e de texto

Os dados categóricos e de texto podem ser algumas das partes mais confusas de um conjunto de dados devido à sua natureza não estruturada. Neste capítulo, você aprenderá a corrigir inconsistências de espaço em branco e de letras maiúsculas nos rótulos de categoria, a recolher várias categorias em uma só e a reformatar cadeias de caracteres para obter consistência.
Iniciar capítulo
3

Problemas avançados de dados

Neste capítulo, você se aprofundará em problemas mais avançados de limpeza de dados, como garantir que todos os pesos sejam escritos em quilogramas em vez de libras. Você também adquirirá habilidades valiosas que o ajudarão a verificar se os valores foram adicionados corretamente e se os valores ausentes não afetam negativamente suas análises.
Iniciar capítulo
4

Vinculação de registros

A vinculação de registros é uma técnica poderosa usada para mesclar vários conjuntos de dados, usada quando os valores têm erros de digitação ou grafias diferentes. Neste capítulo, você aprenderá a vincular registros calculando a similaridade entre cadeias de caracteres. Em seguida, usará suas novas habilidades para unir dois conjuntos de dados de avaliações de restaurantes em um conjunto de dados mestre limpo.
Iniciar capítulo
Limpeza de dados no R
Curso
concluído

Obtenha um certificado de conclusão

Adicione esta credencial ao seu perfil do LinkedIn, currículo ou CV
Compartilhe nas redes sociais e em sua avaliação de desempenho
Inscreva-se agora

Faça como mais de 19 milhões de alunos e comece Limpeza de dados no R hoje mesmo!

Crie sua conta gratuita

Continuar com o GoogleMostrar mais opções

ou


Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados serão armazenados nos EUA.

Desenvolva suas habilidades em dados com o app do DataCamp

Continue progredindo em qualquer lugar com nossos cursos para celular e desafios diários de programação de 5 minutos.