curso
Cómo eliminar duplicados en Excel: 5 mejores métodos
Los datos inexactos pueden arruinar incluso el mejor análisis, y una de las principales razones de los datos inexactos son las entradas duplicadas en las hojas de cálculo. Un solo duplicado puede sesgar tus resultados y producir conclusiones completamente erróneas. Para evitar todo esto, debes saber cómo eliminar duplicados.
En este artículo, compartiré los cinco mejores métodos para encontrar y eliminar datos duplicados en Microsoft Excel. Si quieres resaltar duplicados sin eliminarlos, lee mi tutorial relacionado, Cómo resaltar duplicados en Excel. Si quieres familiarizarte con las funciones y características de Excel antes de seguir adelante, realiza nuestro curso de habilidades Fundamentos de Excel.
Cómo eliminar duplicados en Excel
Conozcamos los cinco métodos preferidos para eliminar datos duplicados de tablas en Excel.
Avanza en tu carrera con Excel
Adquiere los conocimientos necesarios para sacar el máximo partido a Excel, sin necesidad de experiencia.
Método 1: Eliminar duplicados con Formato Condicional
Puedes utilizar el Formato Condicional para resaltar los valores duplicados o únicos y decidir si los eliminas o no. Para ello:
- Selecciona el rango de celdas que quieres comprobar. Después, ve a Inicio > Formato condicional > Reglas para resaltar celdas > Duplicar valores.
Selecciona la opción Duplicar valores. Imagen del autor.
- Aparece un cuadro de diálogo. En la lista desplegable, selecciona cómo quieres resaltar los duplicados. Aquí, elegí Relleno Amarillo con Texto Amarillo Oscuro.
Aplica el formato. Imagen del autor.
- Haz clic en OK y verás resaltados los valores duplicados.
Los valores duplicados aparecen resaltados. Imagen del autor.
Sin embargo, la función Formato condicional es limitada: no puede resaltar valores duplicados dentro del área Valores de un informe de Tabla dinámica. En ese caso, tienes que utilizar un método diferente.
Método 2: Utiliza la función Eliminar duplicados
Otra forma rápida de eliminar duplicados es utilizar la funciónEliminar duplicados , una herramienta integrada en Excel que limpia tus datos eliminando los duplicados de forma permanente. Para utilizar este método:
- Selecciona el rango de celdas o haz clic en una celda, y Excel identificará automáticamente el rango de celdas.
Identificar el rango de celdas. Imagen del autor.
- A continuación, ve a la pestaña pestaña Datos > Herramientas de datos y selecciona Eliminar duplicados.
Función Eliminar duplicados. Imagen del autor.
- Aparecerá un cuadro de diálogo. Aquí selecciono las columnas que deben comprobarse en busca de duplicados. Si tus datos incluyen cabeceras de columna, marca la casilla Mis datos tienen cabeceras y haz clic en Aceptar.
Cuadro de diálogo de la función Eliminar duplicados. Imagen del autor.
- Excel mostrará un mensaje indicando el número de duplicados eliminados y el número de entradas únicas restantes.
Buzón de mensajes. Imagen del autor.
- Ahora puedes ver que se han eliminado todas las filas duplicadas.
Eliminadas todas las filas duplicadas. Imagen del autor.
Método 3: Elimina los valores duplicados utilizando la opción Filtro avanzado
También puedes utilizar la funciónFiltro avanzado de Excel para extraer valores únicos filtrando los duplicados, conservando los datos originales y mostrando al mismo tiempo entradas únicas. Así es como puedes utilizarlo:
- Selecciona un rango de celdas o una sola celda y el Filtro Avanzado identificará automáticamente el rango. A continuación, ve a lapestaña Datos > Ordenar y Filtrar y haz clic en Avanzado.
Opción de función avanzada. Imagen del autor.
- Aparecerá un cuadro de diálogo. Para copiar valores únicos en una ubicación diferente, selecciona Copiar en otra ubicación. En el campo Copia a, especifica dónde mostrar los valores únicos. A continuación, selecciona la casilla Sólo registros únicos y haz clic en Aceptar.
Cuadro de diálogo del Filtro Avanzado. Imagen del autor.
- Ahora, todos los valores únicos se copian en nuestro rango especificado.
Filtra los valores únicos utilizando el Filtro Avanzado. Imagen del autor.
Método 4: Eliminar duplicados con fórmulas
Ahora que conoces 3 funciones integradas para eliminar duplicados, vamos a entender algunas funciones personalizadas que puedes crear para conseguir el mismo resultado. Por ejemplo, tengo un conjunto de datos conlas columnas Nombre, Asignatura y Grado .
Conjunto de datos de estudiantes. Imagen del autor.
Para crear una fórmula que filtre los valores duplicados:
Primero, combino todas las columnas (A,B,C) en una celda. Hay dos métodos para hacerlo: la función CONCATENATE()
o el operador &
. Elige lo que quieras y los resultados serán los mismos. Para utilizar el operador &
, escribe la siguiente fórmula:
=A2&B2&C2
Para utilizar la función CONCATENATE()
, escribe la siguiente fórmula:
=CONCATENATE(A2,B2,C2)
Concatena las columnas. Imagen del autor.
En la siguiente columna, utiliza COUNTIF()
para calcular el número de veces que aparece cada valor en la columna D:
=COUNTIF(D2:D18,D2)
Aquí, cuenta 1 significa que el valor es único, y la cuenta 2 o más indica un duplicado.
Aplica COUNTIF() para contar las ocurrencias. Imagen del autor.
A continuación, ve a Datos ficha > Ordenar y filtrar > selecciona Filtrar para aplicar un filtro al recuento de la columna.
Aplicar filtro. Imagen del autor.
A continuación, abre el menú desplegable, selecciona 1 para mantener valores únicos y eliminar duplicados, y pulsa OK.
Mantén los valores únicos. Imagen del autor.
Ahora puedes ver que se han eliminado todos los valores duplicados. Este método es más complejo, pero se actualiza dinámicamente a medida que cambian tus datos, por lo que es perfecto para quienes desean una gestión continua de los duplicados.
Valores duplicados eliminados mediante la función Filtro. Imagen del autor.
Método 5: Eliminar duplicados con Power Query
También puedes utilizar Power Query para limpiar tus datos y eliminar duplicados. He aquí cómo:
Selecciona una celda o rango de celdas. Ve a a la pestaña Datos > sección Obtener y Transformar Datos y haz clic en Desde Tabla/Rango. Aparecerá un cuadro de diálogo para crear una tabla de consulta de potencia, y se seleccionará automáticamente el rango de valores. A continuación, pulsa OK.
Crear una tabla. Imagen del autor.
Ahora aparecerá la ventana del editor de Power Query. Desde ahí, elige la opción Eliminar duplicados para seleccionar columnas concretas o toda la tabla. Para toda la tabla, haz clic en el botón de la esquina superior izquierda. Para una columna concreta, haz clic con el botón derecho del ratón en la cabecera concreta o utiliza CTRL para seleccionar más de una columna. Una vez hecho esto, haz clic en la opción Cerrar y cargar, situada en la esquina superior izquierda, para volver a cargar los datos depurados en Excel.
Eliminar datos duplicados. Imagen del autor.
Puedes ver que el conjunto de datos modificado aparece de nuevo en Excel. Para entenderlo mejor, puedes seleccionar otra columna, como Asunto, de este ejemplo, y repetir los pasos para practicar. De esta forma, sólo se eliminarán las filas en las que el nombre del alumno esté duplicado.
Datos cargados en una hoja Excel. Imagen del autor.
Este método es perfecto si trabajas con grandes conjuntos de datos o necesitas automatizar el proceso de eliminación de duplicados para futuras actualizaciones de datos.
Métodos para eliminar duplicados en Excel: ¿Cuál es el mejor?
Hemos visto cinco métodos diferentes para eliminar duplicados en Excel. Ahora quiero ayudarte a elegir cuál es el mejor, pero antes hablemos rápidamente de los dos tipos de datos duplicados.
Diferentes tipos de datos duplicados
Hasta ahora, para que quede claro, me he centrado en cómo eliminar valores duplicados en una columna, y todos los métodos que he mostrado hasta ahora funcionan si éste es tu problema. Sin embargo, para que quede claro, en Excel, los duplicados pueden aparecer de dos formas: valores duplicados y filas duplicadas:
- Valores duplicados son entradas repetidas en una misma columna. Por ejemplo, si tengo una columna de nombres y Minny aparece varias veces, se trata de valores duplicados.
- Filas duplicadas se produce cuando filas enteras tienen datos idénticos en todas las columnas. Por ejemplo, mi tabla tiene las columnas Nombre, Edad y Ciudad. Si dos o más filas tienen los mismos campos, son filas duplicadas.
Tabla resumen
Aquí tienes un cuadro resumen que muestra las ventajas específicas de cada método. Aquí también he añadido una columna para mostrar si el método puede ampliarse para eliminar también las filas duplicadas. Básicamente, si quieres eliminar toda una fila duplicada, prueba con el Formato condicional, el Filtro avanzado, las Fórmulas o Power Query, pero deja las Funciones Eliminar duplicados para casos de uso sencillos.
Método | Ventajas clave | Lo mejor para eliminar |
---|---|---|
Eliminar duplicados | Rápido y fácil para eliminar duplicados | Filas duplicadas |
Formato condicional | Identificación visual de duplicados antes de eliminarlos | Valores duplicados o filas duplicadas |
Filtro avanzado | Conserva los datos originales al filtrar las entradas únicas | Valores duplicados o filas duplicadas |
Fórmulas | Control dinámico de los criterios de duplicación | Valores duplicados o filas duplicadas |
Consulta Potente | Automatiza la eliminación de duplicados para futuras actualizaciones | Valores duplicados o filas duplicadas |
Buenas prácticas para eliminar duplicados
He aquí un par de buenas prácticas que recomiendo al iniciar cualquier proyecto de limpieza de datos:
- Mantén la copia de seguridad: Mantén siempre una copia de seguridad intacta de tus datos brutos antes de iniciar cualquier limpieza. Puedes utilizar la versión original como punto de referencia siempre que lo necesites.
- Define tus Duplicados: Establece criterios claros sobre lo que constituye un duplicado en tu contexto específico. A veces, no es tan sencillo como obtener coincidencias exactas en todos los campos.
- Normaliza primero: Limpia y estandariza tus datos antes de intentar detectar duplicados: normaliza mayúsculas y minúsculas, recorta espacios, corrige formatos de fecha y maneja caracteres especiales.
- Empieza por lo sencillo y luego refina: Empieza con coincidencias exactas antes de pasar a coincidencias más complejas. Este enfoque te ayudará a comprender gradualmente la calidad de tus datos.
- Valida tus resultados: Comprueba tus resultados cuando utilices herramientas automatizadas para detectar errores sistemáticos.
Solucionar problemas comunes de Excel
Veamos los problemas más comunes que puedes encontrarte al eliminar duplicados.
Duplicados no eliminados
A veces, copiamos datos de sitios web o fuentes externas; estos datos suelen contener caracteres ocultos o espacios que impiden que Excel identifique las entradas duplicadas. Para resolver este problema, puedes utilizar las funciones TRIM()
y CLEAN()
. La función TRIM()
eliminará los espacios excesivos entre palabras, y la función CLEAN()
eliminará los caracteres no imprimibles.
=CLEAN(TRIM(A1))
Datos con subtotales o esquemas
Si tu hoja de cálculo contiene subtotales o esquemas, pueden interferir en el proceso de eliminación de duplicados. Excel trata estas filas de resumen como entradas únicas, lo que puede llevar a una eliminación incompleta de duplicados. Para evitarlo, elimina todos los subtotales y contornos de tus datos antes de eliminar los duplicados.
He aquí cómo puedes hacerlo:
- Para eliminar los contornos: Ve a lapestaña Datos , busca el grupo Esquema y haz clic en Borrar Esquema.
- Para eliminar los subtotales: Ve a lapestaña Datos , haz clic en Subtotal y, a continuación, en Eliminar todo.
Una vez eliminados los contornos y los subtotales, puedes proceder a la eliminación de duplicados como de costumbre.
Sensibilidad a los casos
Excel considera el texto en mayúsculas y minúsculas como valores diferentes cuando comprueba si hay duplicados. Por ejemplo, Producto y PRODUCTO se tratarían como entradas diferentes. Para evitarlo, utiliza las funciones UPPER()
, LOWER()
o PROPER()
para normalizar las mayúsculas y minúsculas del texto en todos tus datos antes de iniciar el proceso de eliminación.
-
=UPPER()
convierte el texto a mayúsculas. -
=LOWER()
convierte el texto a minúsculas. -
=PROPER()
escribe en mayúsculas la primera letra de cada palabra.
Reflexiones finales
Limpiar los duplicados en Excel puede parecer una pequeña tarea, pero puede suponer una gran diferencia en tu trabajo. He cubierto cinco formas de hacerlo, desde funciones rápidas incorporadas hasta técnicas más avanzadas. Deberías probar diferentes métodos hasta que encuentres un enfoque que se adapte sin problemas a tu flujo de trabajo y mantenga la precisión de tus datos.
Si quieres reforzar aún más tus conocimientos de Excel, echa un vistazo a nuestro curso de Análisis de Datos en Excel y a nuestro curso de Análisis de Datos con Herramientas Potentes de Excel.
Aprende los fundamentos de Excel
Soy una estratega de contenidos a la que le encanta simplificar temas complejos. He ayudado a empresas como Splunk, Hackernoon y Tiiny Host a crear contenidos atractivos e informativos para su público.
Preguntas frecuentes sobre la eliminación de duplicados en Excel
¿Puedo crear alertas para futuros duplicados en Excel?
Aunque Excel no tiene alertas integradas para los duplicados, puedes utilizar el formato condicional para resaltar los duplicados en cuanto se introduzcan.
¿Existe una fórmula de Excel para eliminar duplicados?
Sí, puedes utilizar la función UNIQUE()
de Excel 365 o fórmulas similares para mostrar valores únicos en tiempo real a medida que cambian los datos.
¿Cómo elimino los duplicados pero conservo la primera instancia en Excel?
Ordena tus datos por la columna de fecha de modificación (descendente) antes de eliminar los duplicados. De esta forma, Excel conservará la primera aparición (la más reciente).
Aprende Excel con DataCamp
programa
Análisis de datos
programa