curso
Como limpar dados no Excel: Um guia para iniciantes
Neste tutorial, você aprenderá a limpar seus dados no Excel e a prepará-los para análise. Abordaremos técnicas essenciais, como a remoção de duplicatas, o tratamento de valores ausentes e a padronização da formatação. Ao final, você estará equipado com habilidades práticas para garantir que seu conjunto de dados seja preciso e esteja pronto para uma análise mais profunda.
Para uma exploração mais aprofundada, considere fazer o curso complementar abrangente Preparação de dados no Excel, que se aprofunda em técnicas avançadas e práticas recomendadas para otimizar seu fluxo de trabalho de limpeza de dados.
Quais são os componentes dos dados limpos?
Garantir a alta qualidade dos dados envolve vários componentes-chave, incluindo precisão, integridade, consistência, uniformidade e validade. Esses componentes são essenciais para a análise e a tomada de decisões confiáveis. Vamos dar uma olhada em cada um deles.
- Precisão: Precisão significa que seus dados exibem corretamente os valores do mundo real que representam. Ele garante que as informações mostradas sejam precisas e livres de erros, refletindo o estado real dos dados. Por exemplo, se seus dados forem precisos, eles terão o seguinte: Informações precisas e sem erros, Valores numericamente corretos, Dados de texto sem erros de digitaçãoe Datas precisas.
- Completude: Os dados completos contêm todas as informações necessárias para a análise. Se seus dados estiverem incompletos e faltarem detalhes importantes, isso pode distorcer os resultados. Certifique-se de preencher as lacunas ou de levar em conta os valores ausentes em sua análise. Para tratar de dados ausentes, certifique-se de inserir valores com base em outras observações, substituir valores ausentes por espaços reservados e remover registros incompletos.
- Consistência: Consistência significa que os dados permanecem uniformes em diferentes conjuntos de dados e períodos. Os dados limpos conterão os mesmos formatos e unidades de medida.
- Uniformidade: Uniformidade ou padronização significa que todos os dados exibirão um formato e uma estrutura coerentes - devem ser de um tipo de dados ou de uma categoria. Isso inclui usar as mesmas unidades de medida ou formatar datas e rotulá-las em categorias.
- Validade: Validade significa que os valores dos dados estão dentro do intervalo aceitável predeterminado e estão em conformidade com os padrões esperados. Por exemplo, se uma entrada de idade válida deve estar entre 0 e 120 anos, serão aplicadas regras de validação e verificações para garantir que os dados atendam a esse critério. Isso evita que os valores discrepantes e as entradas errôneas distorçam os resultados.
Como limpar dados no Excel
Limpar os dados no Excel significa refinar os dados brutos. Diferentemente da validação de dados, que é um recurso específico da barra de ferramentas do Excel, a limpeza de dados é um termo mais geral que envolve uma gama mais ampla de ferramentas e técnicas. Na seção a seguir, abordaremos cada uma das ideias a seguir:
- Limpeza básica: A limpeza básica envolve a resolução de problemas comuns, como espaços extras, células em branco e erros de ortografia, para garantir um conjunto de dados limpo e consistente.
- Tratamento de erros e validação: O tratamento de erros e a validação se concentram na identificação e correção de erros e na garantia de que seus dados mantenham a integridade, removendo duplicatas.
- Operações de texto: As operações de texto envolvem a manipulação e a formatação de dados de texto para garantir que eles atendam aos seus requisitos, incluindo concatenação e alterações de maiúsculas e minúsculas.
- Transformação de dados: As técnicas de transformação de dados são usadas para reorganizar e remodelar seus dados para uma melhor análise, incluindo a análise de texto e o uso de ferramentas como o Flash Fill.
- Correções numéricas e de data: As correções numéricas e de datas envolvem a correção e a padronização de dados numéricos e datas para garantir que sejam precisos e formatados de forma consistente.
- Gerenciamento avançado de dados: O gerenciamento avançado de dados inclui a reconciliação e a combinação de conjuntos de dados para criar um conjunto de dados abrangente e coeso para análise.
Limpeza básica de dados no Excel
Vamos dar uma olhada na limpeza básica, que envolve a resolução de problemas comuns, como a remoção de espaços extras.
Eliminar espaços extras
Os espaços em branco finais podem ser incômodos ou problemáticos, pois podem levar a inconsistências na análise de dados e a problemas de formatação.
Há duas maneiras principais de você se livrar de espaços extras no Excel. Vamos analisar ambos.
Elimine espaços extras usando a função Localizar e Substituir
Aqui estão as etapas para você se livrar dos espaços extras.
Selecione o intervalo de células em que você deseja remover os espaços extras.
Use o atalho Ctrl + H para abrir a caixa de diálogo Localizar e substituir.
No campo Localizar o quê, pressione a barra de espaço duas vezes para inserir dois espaços.
No campo Substituir por, pressione a barra de espaço uma vez para inserir um único espaço.
Clique em Replace All (Substituir tudo).
Repita o processo até que não sejam encontrados mais espaços duplos.
Localize e substitua a caixa de diálogo. Fonte: Imagem do autor
Elimine os espaços extras usando o TRIM
Crie uma nova coluna para os dados limpos.
Digite a fórmula
=TRIM(cell_with_extra_spaces)
na primeira célula da nova coluna.Clique duas vezes no canto inferior direito da célula para aplicar a fórmula ao restante das linhas.
Copie os dados limpos e cole-os como valores para remover as fórmulas.
Selecionar e tratar todas as células em branco
As células em branco podem causar problemas ao quebrar fórmulas, levando a erros nos cálculos e produzindo resultados de análise imprecisos. Veja como você pode lidar com esse problema.
Destaque o intervalo de células onde você deseja localizar e trate as células em branco.
Pressione Ctrl + G para abrir a caixa de diálogo Ir para.
Clique no botão "Especial...". Isso abre a caixa de diálogo Ir para especial.
Selecione a opção Blanks (Espaços em branco ) e clique em OK. Agora, você verá que todas as células em branco no intervalo escolhido estão selecionadas.
Agora você pode inserir um valor ou uma fórmula. Pressione Ctrl + Enter.
Selecione e trate as células em branco. Fonte: Imagem do autor
Verificação ortográfica
Palavras com erros ortográficos podem fazer com que os dados pareçam pouco profissionais e difíceis de entender, por isso é importante corrigi-los.
Verifique a planilha inteira ou um intervalo específico.
Vá para a guia Revisão na faixa de opções.
Clique no botão Ortografia no grupo Correção.
A caixa de diálogo Ortografia será aberta, mostrando a primeira palavra com erro ortográfico detectada e sugestões de correção.
Revise e corrija as palavras com erros ortográficos conforme necessário.
Verificação ortográfica. Fonte: Imagem do autor
Tratamento de erros e validação no Excel
Vamos dar uma olhada no tratamento de erros, que envolve a abordagem de problemas comuns, como destacar erros ou remover duplicatas.
Destacar erros
Os erros em seus dados podem levar a resultados incorretos e a uma tomada de decisão ruim, portanto, é fundamental identificá-los e resolvê-los. Vamos ver como você pode resolver esse problema.
Selecione o intervalo de células que você deseja verificar se há erros.
Vá para a guia Home na faixa de opções.
No grupo Styles (Estilos ), clique em Conditional Formatting (Formatação condicional ).
Selecione New Rule ( Nova regra ) no menu suspenso.
Selecione Usar uma fórmula para determinar quais células você deve formatar.
Digite a fórmula
=ISERROR(cell)
no campo Formatar valores onde essa fórmula é verdadeira.Clique no botão Formatar... para escolher as opções de formatação que você deseja.
Clique em OK depois de selecionar suas opções de formatação.
Clique em OK novamente na caixa de diálogo Nova regra de formatação para aplicar a regra.
Usando a formatação condicional. Fonte: Imagem do autor
Remover duplicatas
As entradas duplicadas podem distorcer a análise e os insights, portanto, removê-las garante a precisão dos dados.
Selecione a planilha ou o intervalo de células do qual você deseja remover as duplicatas.
Vá para a guia Data (Dados ) na faixa de opções.
Clique em Remove Duplicates ( Remover duplicatas ) no grupo Data Tools (Ferramentas de dados ).
Na caixa de diálogo Remover duplicatas, especifique qual coluna você deve verificar se há duplicatas.
Clique em OK. O Excel exibirá uma mensagem mostrando o número de valores duplicados removidos.
Remover linhas duplicadas
As linhas duplicadas podem confundir seus dados e afetar a confiabilidade da sua análise. Veja como você pode gerenciar isso.
Selecione o intervalo do qual você deseja remover as linhas duplicadas.
Vá até a guia Data (Dados ) na faixa de opções e clique em Advanced (Avançado ) no grupo Sort & Filter (Classificar e filtrar ).
Na caixa de diálogo Filtro avançado, selecione Copiar para outro local.
Defina o intervalo da lista como o intervalo selecionado.
Defina o campo Copiar para como a célula para a qual você deseja que as linhas exclusivas sejam copiadas.
Marque a caixa Unique Records Only (Somente registros exclusivos ) e clique em OK.
Operações de texto no Excel
Vamos dar uma olhada nas operações de texto, como a concatenação de cadeias de caracteres.
Concatenar
A combinação de várias cadeias de texto em uma célula pode ajudar a criar dados mais significativos e organizados, mesclando informações de diferentes fontes em um formato único e coeso.
- Selecione a célula em que você deseja que o resultado concatenado apareça.
- Digite
=CONCATENATE()
. - Selecione as células que você deseja concatenar, separadas por vírgulas ou pelo operador &.
- Pressione Enter para ver o resultado.
células. Fonte: Imagem do autor
Alterar o caso do texto
O revestimento uniforme do texto pode melhorar a legibilidade e manter a consistência em seus dados. Vamos ver como você pode ajustar isso.
Crie uma nova coluna para o texto convertido.
Digite a fórmula em uma célula:
=UPPER()
ou=LOWER()
ou=PROPER()
- Pressione Enter para aplicar a fórmula.
Arraste a alça de preenchimento para aplicar a fórmula a outras células, se necessário.
o caso do texto. Fonte: Imagem do autor
Remoção de caracteres não impressos do texto
Caracteres não impressos, como tabulações, quebras de linha e caracteres especiais, podem causar problemas ao interromper o processamento de dados, dificultando a análise ou a visualização correta dos dados.
Identifique os caracteres não impressos que você precisa remover.
Selecione a célula que contém o texto com caracteres não imprimíveis.
Em uma nova célula, use a seguinte função:
=CLEAN(text)
.Para remover espaços extras e caracteres não impressos, use:
=TRIM(CLEAN(text))
.Copie e cole o texto limpo para substituir o original.
a função limpar no Excel. Fonte: Imagem do autor
Aprenda os fundamentos do Excel
Transformação de dados no Excel
As técnicas de transformação de dados são usadas para reorganizar e remodelar seus dados para uma melhor análise, incluindo a análise de texto e o uso de ferramentas como o Flash Fill.
Análise de dados de texto para coluna
A separação dos dados de texto em colunas individuais facilita a análise de componentes específicos e garante que cada informação seja categorizada de forma distinta. Isso é o oposto da concatenação e é útil para dividir dados complexos em partes gerenciáveis. Veja como você pode fazer isso.
Selecione os dados que você deseja dividir.
Vá para a guia Data (Dados ) e clique em Text to Columns (Texto para colunas).
Escolha Delimited (Delimitado ) ou Fixed Width (Largura fixa ) e clique em Next (Avançar).
Em Delimitado, marque os delimitadores que seus dados usam e clique em Avançar.
Para Fixed Width (Largura fixa), defina as quebras de coluna na janela Data Preview (Visualização de dados ) e clique em Next (Avançar).
Escolha o formato de dados para cada coluna.
Clique em Finish (Concluir).
Uso de texto em colunas para análise de dados. Fonte: Imagem do autor
Preenchimento de flash
O Flash Fill preenche automaticamente os valores com base nos padrões detectados em seus dados. Veja como você pode usar o Flash Fill no Excel:
Insira dados seguindo um padrão em uma célula próxima aos dados existentes.
Forneça outro exemplo na próxima célula para ajudar o Excel a detectar o padrão.
Selecione a célula com o exemplo.
Vá para a guia Data (Dados ) na faixa de opções.
Clique em Flash Fill no grupo Data Tools (Ferramentas de dados ).
O Excel preencherá automaticamente as células restantes com base no padrão detectado.
Mesclagem e divisão de colunas
A mesclagem e a divisão de colunas ajudam a organizar os dados da maneira mais adequada às suas necessidades de análise. Siga estas etapas para mesclar células:
- Vá para a guia Home e clique no menu suspenso Merge & Center (Mesclar e centralizar ) no grupo Alignment (Alinhamento ).
- Selecione a opção de mesclagem que você preferir.
Siga estas etapas para dividir colunas:
- Vá para a guia Dados e clique em Texto para colunas no grupo Ferramentas de dados .
- Escolha uma largura delimitada ou fixa com base nas necessidades de seus dados.
- Selecione o destino dos dados divididos e clique em Finish (Concluir).
Transformar e reorganizar colunas e linhas
Reorganizar os dados pode ajudar a apresentá-los em um formato mais lógico e acessível. Para transformar linhas em linhas e colunas em colunas:
Destaque os dados que você deseja transformar (incluindo os cabeçalhos, se necessário).
Clique com o botão direito do mouse na seleção e escolha Copiar oupressione Ctrl+C.
Selecione a célula onde os dados transformados começam.
Clique com o botão direito do mouse na célula de destino, escolha Colar especial e, em seguida, selecione Transpor.
Você também pode usar Ctrl+Alt+V para abrir a caixa de diálogo Colar especial e, em seguida, marcar a opção Transpor e clicar em OK.
Para reorganizar colunas/linhas:
Clique no cabeçalho da coluna para selecionar a coluna inteira que você deseja mover.
Clique com o botão direito do mouse e escolha C oupressione Ctrl+X.
Selecione a coluna para a qual você deseja mover a coluna de corte, clique com o botão direito do mouse no cabeçalho da coluna e selecione Inserir células de corte.
Da mesma forma, para linhas, selecione e corte a linha que você deseja transferir para outra linha e cole-a lá.
Correções numéricas e de data no Excel
As correções numéricas e de datas envolvem a correção e a padronização de dados numéricos e datas para garantir que sejam precisos e formatados de forma consistente.
Fixação de números e sinais numéricos
Formatos incorretos de números podem causar problemas, levando a interpretações errôneas e erros de cálculo, bem como problemas de classificação e comparação de dados.
- Selecione as células que contêm os números que você precisa corrigir.
- Vá para a guia Página inicial, clique no menu suspenso Número no grupo Número e selecione o formato de número apropriado (por exemplo, Geral, Número, Moeda).
Fixação de datas e horários
Datas formatadas corretamente são cruciais para análises e relatórios precisos com base no tempo.
Destaque as células que contêm as datas.
Vá para a guia Início.
Clique no menu suspenso Number Format (Formato de número ) e selecione Short Date (Data curta ) ou Long Date (Data longa).
Avance em sua carreira com o Excel
Adquira as habilidades para maximizar o Excel - não é necessário ter experiência.
Gerenciamento avançado de dados no Excel
O gerenciamento avançado de dados inclui a reconciliação e a combinação de conjuntos de dados para criar um conjunto de dados abrangente e coeso para análise.
Reconciliação de dados de tabela por meio de união ou correspondência
A união ou correspondência de dados de diferentes tabelas garante uma análise abrangente e coesa.
Usando o VLOOKUP para combinar dados:
-
Certifique-se de que ambas as tabelas estejam acessíveis na mesma planilha.
-
Escolha a célula em que você deseja exibir os dados correspondentes.
-
Use a seguinte função:
=VLOOKUP(lookup_value, table_array, col_index_num, FALSE)
-
Arraste a alça de preenchimento para copiar a fórmula para outras células, conforme necessário.
Usando INDEX e MATCH para obter mais flexibilidade
-
Escolha a célula em que você deseja exibir os dados correspondentes.
-
Use a combinação dessas funções:
=INDEX(array, MATCH(lookup_value, lookup_array, 0))
-
Arraste a alça de preenchimento para copiar a fórmula para outras células, conforme necessário.
Considerações finais
Há várias funções de limpeza de dados no Excel que permitem que você limpe e valide os dados para atender aos padrões definidos. Isso pode ajudar você a reduzir erros e melhorar a qualidade dos conjuntos de dados. Para se aprofundar no domínio dos recursos do Excel, considere a possibilidade de se inscrever em nosso curso Introdução ao Excel.
Além disso, se você estiver limpando os dados para remover campos duplicados ou padronizando os formatos das entradas de dados, o Excel tem todas as ferramentas necessárias para facilitar esse processo. Se você deseja aprimorar suas habilidades de preparação de dados, nosso curso Preparação de dados no Excel oferece uma cobertura abrangente sobre esse tópico.
Para aprimorar ainda mais suas habilidades analíticas, você pode achar nosso curso Análise de dados no Excel particularmente útil. Este curso aborda as complexidades da análise de dados após a limpeza. Além disso, se você estiver interessado em saber como os dados limpos dão suporte à previsão financeira, nosso curso Modelagem financeira no Excel pode ser de grande interesse.
Se você deseja expandir suas habilidades de limpeza de dados, considere o Power Query, que é uma ferramenta flexível e eficaz incorporada ao Excel e ao Power BI que permite importar e transformar dados sem problemas. Considere também explorar a limpeza de dados em Python ou a limpeza de dados em R. Esses cursos oferecem técnicas robustas e práticas recomendadas para limpeza de dados usando linguagens de programação populares.
Sou um estrategista de conteúdo que adora simplificar tópicos complexos. Ajudei empresas como Splunk, Hackernoon e Tiiny Host a criar conteúdo envolvente e informativo para seus públicos.
Perguntas frequentes
Quais são as cinco etapas do processo de limpeza de dados?
As cinco etapas são a remoção de duplicatas, o tratamento de dados ausentes, a correção de erros estruturais, a filtragem de outliers e a validação de dados.
Qual é a diferença entre limpeza e transformação de dados?
A limpeza de dados envolve a identificação e a correção de erros e imprecisões no conjunto de dados para garantir a confiabilidade. Na transformação de dados, você converte dados de um formato ou estrutura para outro para torná-los adequados para análise. Portanto, a limpeza de dados garante que os conjuntos de dados sejam precisos, enquanto a transformação converte os dados limpos no formato necessário para análise ou relatório.
Aprenda Excel com a DataCamp
curso
Data Analysis in Excel
curso
Data Preparation in Excel

blog
As 30 principais perguntas da entrevista sobre o Excel para todos os níveis
tutorial
Principais técnicas para lidar com valores ausentes que todo cientista de dados deve conhecer
tutorial
Tutorial do Python Excel: O guia definitivo
tutorial
Tutorial do Excel Regex: Dominando a correspondência de padrões com expressões regulares
tutorial
As 15 fórmulas básicas do Excel que todos precisam saber
tutorial