Programa
Sempre que trabalho com planilhas, a repetição de informações atrapalha minhas análises e relatórios. Além de ser incrivelmente frustrante descobrir duplicatas depois de já ter apresentado minhas descobertas, elas geralmente me levam a tirar conclusões erradas e a tomar decisões equivocadas.
Depois de muitos percalços com os dados, descobri algumas ferramentas excelentes do Excel para detectar e destacar duplicatas antes que elas causem problemas. Neste artigo, compartilharei os métodos exatos que você pode usar para aprimorar seu processo de limpeza de dados. Esses métodos transformarão seu processo de limpeza de dados, assim como transformaram o meu. No entanto, se você não tem experiência com o Excel, confira nossa faixa de habilidades Fundamentos do Excel para começar.
Como destacar duplicatas no Excel
O Excel oferece muitos métodos para identificar e destacar duplicatas. Vamos entender como cada um deles funciona.
Avance em sua carreira com o Excel
Adquira as habilidades para maximizar o Excel - não é necessário ter experiência.
Método 1: Destacar duplicatas no Excel usando a formatação condicional
Você pode usar a formatação condicional para identificar duplicatas em sua planilha do Excel. Veja como:
- Selecione o intervalo de células que você deseja verificar.
Selecione o intervalo de células. Imagem do autor.
- Ir para Início > Formatação condicional > Destacar regras de células > Duplicar valores.
Selecione a opção Duplicar valores. Imagem do autor.
- É exibida uma caixa de diálogo. Na lista suspensa, selecione como você deseja destacar as duplicatas. Aqui, escolhi Preenchimento verde com texto verde escuro.
Aplique o formato. Imagem do autor.
- Clique em OK e você verá os valores duplicados destacados.
Os valores duplicados são destacados. Imagem do autor.
A melhor coisa sobre essa abordagem é que você pode ver as duplicatas imediatamente. Assim que você inserir novos dados, o Excel os colorirá automaticamente se forem duplicados. Embora esse método seja rápido e fácil, ele tem alguns limites básicos. Por exemplo, se você quiser verificar se há duplicatas em várias colunas ou encontrar correspondências parciais (como apenas sobrenomes correspondentes), esse simples destaque não funcionará.
Método 2: Destacar duplicatas no Excel usando a fórmula COUNTIF()
Veja como você pode destacar apenas o segundo valor duplicado e os subsequentes. Como observação, esse método não contará a primeira ocorrência.
- Selecione o intervalo de células.
- Ir para o Início > Formatação condicional > Nova regra.
Definir uma nova regra. Imagem do autor.
- Agora, selecione a opçãoUse a formula to determine which cells to format . Em seguida, na caixa de fórmula, digite a seguinte fórmula. (Aqui,
A2
é a primeira célula do intervalo que você selecionou).
=COUNTIF($A$2:$A2,$A2)>1
- Clique no botão Formatar para escolher a cor de preenchimento ou de fonte que você deseja e, em seguida, selecione OK para aplicar as alterações.
Etapas para destacar as duplicatas. Imagem do autor.
Agora você pode ver que todas as células duplicadas estão destacadas, excluindo as primeiras ocorrências.
Duplicatas destacadas. Imagem do autor.
Assim como a opção Formatação condicional, a fórmula é recalculada automaticamente à medida que os dados são alterados e as duplicatas são identificadas em tempo real. Mas aqui está a parte mais notável: você tem mais controle sobre os dados duplicados com esse método. Suponha que você só queira verificar se há duplicatas em colunas específicas ou talvez queira contar algo como duplicata somente se o nome e o e-mail forem iguais. Esse método permite que você faça isso ajustando sua fórmula.
Método 3: Destacar duplicatas no Excel com o Power Query
Você pode usar o Power Query para importar e limpar dados de várias fontes. Ele é especialmente útil para lidar com grandes conjuntos de dados e realizar tarefas mais avançadas de manipulação de dados. Veja como você pode usá-lo para destacar duplicatas:
- Selecione uma célula ou um intervalo de células.
- Ir para Dados > Você pode obter e transformar dados Obter e transformar dados > Da tabela.
Selecionando a opção From Table. Imagem do autor.
- Você verá uma janela pop-up. Se você tiver um cabeçalho em seus dados, certifique-se de verificar a opção Minha tabela tem cabeçalhos para que você não considere o cabeçalho como dados. Em seguida, selecione OK.
Selecionando os dados automaticamente. Imagem do autor.
- Os dados selecionados aparecem no Power Query Editor. Agora, selecione a coluna que você deseja verificar se há duplicatas.
Editor do Power Query. Imagem do autor.
- Em seguida, dentro do Power Query Editor, vá para a guia Home (Início) > Keep Rows (Manter linhas ) e selecione a opçãoKeep Duplicates (Manter duplicatas ). Isso exibirá todas as linhas duplicadas da coluna selecionada.
Exibição de dados duplicados. Imagem do autor.
- Se você quiser ver os resultados no Excel em vez de no Power Query Editor, clique em Fechar e carregar na seção Fechar você poderá ver os resultados no Excel em vez de no Power Query Editor.
Fechar e carregar. Imagem do autor.
Dessa forma, você pode ver os resultados no Excel.
Dados carregados na planilha do Excel. Imagem do autor.
Essa abordagem funciona bem com grandes conjuntos de dados - centenas ou até milhares de linhas. Também é perfeito se você recebe regularmente novos dados e precisa verificar se há duplicatas com frequência. Em vez de fazer o mesmo trabalho repetidamente, você o configura uma vez, e o Power Query limpará automaticamente todas as duplicatas.
Práticas recomendadas para destacar duplicatas no Excel
Se você quiser destacar duplicatas no Excel, adote uma abordagem sistemática para manter a integridade dos seus dados. Aqui estão algumas das minhas práticas recomendadas que você pode seguir:
- Antes de fazer qualquer modificação, sempre faça backup de seus dados. Isso garante que você tenha uma rede de segurança à qual recorrer.
- Padronize todos os casos de texto, espaços, datas, números e caracteres especiais para manter a formatação consistente.
- Defina regras de validação de dados, incluindo listas suspensas, mensagens de aviso, campos obrigatórios, intervalos de valores e procedimentos documentados para evitar duplicatas no ponto de entrada.
Solução de problemas comuns de duplicatas no Excel
Mesmo com os métodos corretos, você pode encontrar alguns desafios ao destacar duplicatas. Embora as funções a seguir não sejam necessárias para que você encontre duplicatas em si, conhecê-las pode ajudá-lo a corrigir problemas comuns.
Duplicatas não destacadas
Às vezes, valores com nomes idênticos não são destacados devido a caracteres ocultos ou espaços extras. Para resolver esse problema, use as funções TRIM()
e CLEAN()
juntas. TRIM()
removerá os espaços desnecessários do início, do fim e do meio do texto, enquanto CLEAN()
eliminará os caracteres não imprimíveis.
Sensibilidade a casos
O Excel diferencia maiúsculas de minúsculas. Ele trata letras maiúsculas e minúsculas como caracteres diferentes, como, por exemplo, DATACAMP, DataCamp, Datacamp e datacamp, , que seriam consideradas entradas diferentes. Para resolver isso, você pode usar as funções UPPER()
, LOWER()
e PROPER()
. Veja a seguir o que cada função faz:
-
UPPER()
converte o texto em letras maiúsculas. -
LOWER()
converte o texto em letras minúsculas. -
PROPER()
coloca a primeira letra de cada palavra em maiúscula.
Considerações finais
Verificações regulares de duplicatas mantêm a integridade dos dados e evitam erros de análise. Embora o Excel tenha várias abordagens para destacar duplicatas, recomendo que você experimente diferentes métodos para encontrar o que melhor atende às suas necessidades.
Se você quiser aprimorar ainda mais sua experiência em manipulação de dados, confira nossa Análise de dados em Excel e o curso Análise de dados com as ferramentas elétricas do Excel você tem um histórico de habilidades.
Aprenda os fundamentos do Excel
Sou um estrategista de conteúdo que adora simplificar tópicos complexos. Ajudei empresas como Splunk, Hackernoon e Tiiny Host a criar conteúdo envolvente e informativo para seus públicos.
Perguntas comuns sobre o destaque de duplicatas no Excel
Posso remover duplicatas no Excel em vez de apenas destacá-las?
Sim, você pode. Para isso, selecione o intervalo de células e acesse a guia Data. Em seguida, selecione aopção Remove duplicates (Remover duplicatas ) na seçãoData tool (Ferramenta de dados) para eliminar as duplicatas.
Como faço para destacar duplicatas usando teclas de atalho do teclado?
Selecione o intervalo de células e pressione Alt →H→L→H→D para aplicar a regra de formatação condicional a
valores duplicados.
Como faço para filtrar valores exclusivos no Excel?
Selecione o intervalo de dados. Acesse Data > Advanced. A partir daí, escolha Filtrar a lista, opção in-place para exibir valores exclusivos no mesmo intervalo ou Copiar para outro local e especifique uma célula para colocá-los. Em seguida, marque Unique records only e clique em OK.