Pular para o conteúdo principal
InícioRLimpeza de dados no R

Limpeza de dados no R

Aprenda a limpar dados rápida e precisamente para transformar dados brutos em insights incríveis.

Comece O Curso Gratuitamente
4 horas13 vídeos44 exercícios51.009 aprendizesTrophyDeclaração de Realização

Crie sua conta gratuita

GoogleLinkedInFacebook

ou

Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.
Group

Treinar 2 ou mais pessoas?

Experimente o DataCamp For Business

Amado por alunos de milhares de empresas


Descrição do Curso

Supere problemas comuns de dados, como a remoção de duplicatas no R

Costuma-se dizer que os cientistas de dados passam 80% do tempo limpando e manipulando dados e apenas 20% do tempo analisando-os. O tempo gasto com a limpeza é vital, pois a análise de dados sujos pode levar você a tirar conclusões imprecisas.

Neste curso, você aprenderá uma variedade de técnicas para ajudá-lo a limpar dados sujos usando o R. Você começará convertendo tipos de dados, aplicando restrições de intervalo e lidando com duplicatas totais e parciais para evitar contagem dupla.

Mergulhe nos desafios dos dados avançados

Depois de praticar o trabalho com problemas comuns de dados, você passará para desafios mais avançados, como garantir a consistência das medições e lidar com dados ausentes. Após cada novo conceito, você terá a oportunidade de realizar um exercício prático para consolidar seu conhecimento e aumentar sua experiência.

Aprenda a usar a vinculação de registros durante a limpeza de dados

O Record Linkage é usado para mesclar conjuntos de dados quando os valores apresentam problemas como erros de digitação ou grafias diferentes. Você explorará essa técnica útil no capítulo final e praticará o aplicativo usando-a para unir dois conjuntos de dados de avaliações de restaurantes em um único conjunto de dados.
Para Empresas

GroupTreinar 2 ou mais pessoas?

Obtenha acesso à biblioteca completa do DataCamp, com relatórios, atribuições, projetos e muito mais centralizados
Experimente O DataCamp for BusinessPara uma solução sob medida , agende uma demonstração.

Nas seguintes faixas

Certificação disponível

Cientista de dados associado in R

Ir para a trilha

Importação e limpeza de dados in R

Ir para a trilha
  1. 1

    Problemas comuns de dados

    Gratuito

    Neste capítulo, você aprenderá a superar alguns dos problemas mais comuns de dados sujos. Você converterá tipos de dados, aplicará restrições de intervalo para remover pontos de dados futuros e removerá pontos de dados duplicados para evitar contagem dupla.

    Reproduzir Capítulo Agora
    Restrições de tipo de dados
    50 xp
    Tipos de dados comuns
    100 xp
    Conversão de tipos de dados
    100 xp
    Corte de cordas
    100 xp
    Restrições de alcance
    50 xp
    Restrições de duração da viagem
    100 xp
    De volta ao futuro
    100 xp
    Restrições de exclusividade
    50 xp
    Duplicatas completas
    100 xp
    Remoção de duplicatas parciais
    100 xp
    Agregação de duplicatas parciais
    100 xp
  2. 2

    Dados categóricos e de texto

    Os dados categóricos e de texto podem ser algumas das partes mais confusas de um conjunto de dados devido à sua natureza não estruturada. Neste capítulo, você aprenderá a corrigir inconsistências de espaço em branco e de letras maiúsculas nos rótulos de categoria, a recolher várias categorias em uma só e a reformatar cadeias de caracteres para obter consistência.

    Reproduzir Capítulo Agora
  3. 3

    Problemas avançados de dados

    Neste capítulo, você se aprofundará em problemas mais avançados de limpeza de dados, como garantir que todos os pesos sejam escritos em quilogramas em vez de libras. Você também adquirirá habilidades valiosas que o ajudarão a verificar se os valores foram adicionados corretamente e se os valores ausentes não afetam negativamente suas análises.

    Reproduzir Capítulo Agora
  4. 4

    Vinculação de registros

    A vinculação de registros é uma técnica poderosa usada para mesclar vários conjuntos de dados, usada quando os valores têm erros de digitação ou grafias diferentes. Neste capítulo, você aprenderá a vincular registros calculando a similaridade entre cadeias de caracteres. Em seguida, usará suas novas habilidades para unir dois conjuntos de dados de avaliações de restaurantes em um conjunto de dados mestre limpo.

    Reproduzir Capítulo Agora
Para Empresas

GroupTreinar 2 ou mais pessoas?

Obtenha acesso à biblioteca completa do DataCamp, com relatórios, atribuições, projetos e muito mais centralizados

Nas seguintes faixas

Certificação disponível

Cientista de dados associado in R

Ir para a trilha

Importação e limpeza de dados in R

Ir para a trilha

conjuntos de dados

ZagatFodor'sBike SharingSFO Satisfaction SurveyCustomer Accounts

colaboradores

Collaborator's avatar
Amy Peterson
Collaborator's avatar
Adel Nehme
Collaborator's avatar
Richie Cotton
Maggie Matsui HeadshotMaggie Matsui

Curriculum Manager at DataCamp

Ver Mais

O que os outros alunos têm a dizer?

Junte-se a mais de 14 milhões de alunos e comece Limpeza de dados no R hoje mesmo!

Crie sua conta gratuita

GoogleLinkedInFacebook

ou

Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.