curso
Cómo limpiar datos en Excel: Guía para principiantes
En este tutorial, aprenderás a limpiar tus datos en Excel y a prepararlos para el análisis. Cubriremos técnicas esenciales como la eliminación de duplicados, el tratamiento de valores omitidos y la normalización del formato. Al final, estarás equipado con habilidades prácticas para asegurarte de que tu conjunto de datos es preciso y está listo para un análisis más profundo.
Para una exploración más profunda, considera la posibilidad de realizar el curso complementario Preparación de Datos en Excel, que se sumerge en técnicas avanzadas y mejores prácticas para optimizar tu flujo de trabajo de limpieza de datos.
¿Cuáles son los componentes de los Datos Limpios?
Garantizar una alta calidad de los datos implica varios componentes clave, como la precisión, la exhaustividad, la coherencia, la uniformidad y la validez. Estos componentes son esenciales para un análisis y una toma de decisiones fiables. Echemos un vistazo a cada uno de ellos.
- Precisión: Exactitud significa que tus datos muestran correctamente los valores del mundo real que representan. Garantiza que la información mostrada sea precisa y no contenga errores, reflejando el verdadero estado de los datos. Por ejemplo, si tus datos son exactos, tendrá lo siguiente: Información precisa y sin errores, Valores Numéricamente Correctos, Datos de texto sin errores tipográficosy Fechas precisas.
- Integridad: Los datos completos contienen toda la información necesaria para el análisis. Si tus datos están incompletos y faltan detalles clave, esto puede sesgar los resultados. Asegúrate de rellenar los huecos o de tener en cuenta los valores que faltan en tu análisis. Para tratar los datos que faltan, asegúrate de Introducir valores basados en otras observaciones, Sustituir valores que faltan por marcadores de posición y Eliminar registros incompletos.
- Coherencia: La coherencia significa que los datos se mantienen uniformes en diferentes conjuntos de datos y periodos. Los datos limpios contendrán los mismos formatos y unidades de medida en todas partes.
- Uniformidad: Uniformidad o normalización significa que todos los datos presentarán un formato y una estructura coherentes: deben ser de un tipo de datos o de una categoría. Esto incluirá utilizar las mismas unidades de medida o dar formato a las fechas y etiquetarlas en categorías.
- Validez: Validez significa que los valores de los datos están dentro del intervalo aceptable predeterminado y se ajustan a los patrones esperados. Por ejemplo, si una entrada de edad válida debe estar comprendida entre 0 y 120 años, se aplicarán reglas de validación y comprobaciones para garantizar que los datos cumplen este criterio. Esto evita que los valores atípicos y las entradas erróneas sesguen los resultados.
Cómo limpiar datos en Excel
Limpiar los datos en Excel significa refinar los datos brutos. A diferencia de la validación de datos, que es una función específica de la barra de herramientas de Excel, la limpieza de datos es un término más general que implica una gama más amplia de herramientas y técnicas. En la siguiente sección, trataremos cada una de las siguientes ideas:
- Limpieza básica: La limpieza básica consiste en solucionar problemas comunes, como los espacios sobrantes, las celdas en blanco y los errores ortográficos, para garantizar un conjunto de datos limpio y coherente.
- Tratamiento de errores y validación: El tratamiento de errores y la validación se centran en identificar y corregir errores y en garantizar que tus datos mantienen su integridad eliminando duplicados.
- Operaciones de texto: Las operaciones de texto implican manipular y dar formato a los datos de texto para garantizar que cumplen tus requisitos, incluyendo la concatenación y el cambio de mayúsculas y minúsculas.
- Transformación de datos: Las técnicas de transformación de datos se utilizan para reorganizar y remodelar tus datos para un mejor análisis, incluyendo el análisis sintáctico de texto y el uso de herramientas como Flash Fill.
- Correcciones numéricas y de fecha: Las correcciones numéricas y de fechas implican corregir y normalizar los datos numéricos y las fechas para garantizar que son precisos y tienen un formato coherente.
- Gestión avanzada de datos: La gestión avanzada de datos incluye conciliar y combinar conjuntos de datos para crear un conjunto de datos completo y cohesionado para el análisis.
Limpieza básica de datos en Excel
Echemos un vistazo a la limpieza básica, que consiste en abordar problemas comunes como eliminar los espacios sobrantes.
Elimina los espacios sobrantes
Los espacios en blanco al final pueden ser molestos o problemáticos porque pueden provocar incoherencias en el análisis de los datos y problemas de formato.
Hay dos formas principales de eliminar los espacios sobrantes en Excel. Repasemos ambos.
Elimina los espacios sobrantes con Buscar y reemplazar
Estos son los pasos para deshacerte de los espacios sobrantes.
Selecciona el rango de celdas donde quieras eliminar los espacios sobrantes.
Utiliza el atajo de teclado Ctrl + H para abrir el cuadro de diálogo Buscar y reemplazar.
En el campo Buscar qué, pulsa dos veces la barra espaciadora para introducir dos espacios.
En el campo Sustituir por, pulsa la barra espaciadora una vez para introducir un solo espacio.
Haz clic en Reemplazar todo.
Repite el proceso hasta que no se encuentren más espacios dobles.
Busca y sustituye el cuadro de diálogo. Fuente: Imagen del autor
Elimina los espacios sobrantes con TRIM
Crea una nueva columna para los datos depurados.
Introduce la fórmula
=TRIM(cell_with_extra_spaces)
en la primera celda de la nueva columna.Haz doble clic en la esquina inferior derecha de la celda para aplicar la fórmula al resto de las filas.
Copia los datos depurados y pégalos como valores para eliminar las fórmulas.
Seleccionar y tratar todas las celdas en blanco
Las celdas en blanco pueden causar problemas al romper las fórmulas, provocando errores en los cálculos y produciendo resultados de análisis inexactos. He aquí cómo manejar este asunto.
Resalta el rango de celdas donde quieras encontrar y tratar las celdas en blanco.
Pulsa Ctrl + G para abrir el cuadro de diálogo Ir a.
Haz clic en el botón "Especial...". Se abre la ventana de diálogo Ir a Especial.
Selecciona la opción Espacios en blanco y haz clic en Aceptar. Ahora verás que se seleccionan todas las celdas en blanco del rango elegido.
Ahora puedes introducir un valor o una fórmula. Pulsa Ctrl + Intro.
Selecciona y trata las celdas en blanco. Fuente: Imagen del autor
Corrección ortográfica
Las palabras mal escritas pueden hacer que los datos parezcan poco profesionales y difíciles de entender, por lo que es importante corregirlas.
Comprueba toda la hoja de cálculo o un rango concreto.
Ve a la pestaña Revisar de la cinta de opciones.
Haz clic en el botón Ortografía del grupo Revisión.
Se abrirá el cuadro de diálogo Ortografía, mostrando la primera palabra mal escrita detectada y sugerencias para corregirla.
Repasa y corrige las palabras mal escritas según sea necesario.
Corrección ortográfica. Fuente: Imagen del autor
Tratamiento de errores y validación en Excel
Echemos un vistazo a la gestión de errores, que implica abordar problemas comunes como resaltar errores o eliminar duplicados.
Resaltar errores
Los errores en tus datos pueden conducir a resultados incorrectos y a una mala toma de decisiones, por lo que es crucial identificarlos y abordarlos. Veamos cómo abordar este problema.
Selecciona el rango de celdas en el que quieres comprobar si hay errores.
Ve a la pestaña Inicio de la cinta de opciones.
En el grupo Estilos, haz clic en Formato condicional.
Selecciona Nueva regla en el menú desplegable.
Elige Utilizar una fórmula para determinar qué celdas formatear.
Introduce la fórmula
=ISERROR(cell)
en el campo Formatear valores donde esta fórmula es verdadera.Haz clic en el botón Formato... para elegir las opciones de formato que desees.
Pulsa OK después de seleccionar las opciones de formato.
Haz clic de nuevo en Aceptar en el cuadro de diálogo Nueva regla de formato para aplicar la regla.
el formato condicional. Fuente: Imagen del autor
Eliminar duplicados
Las entradas duplicadas pueden distorsionar el análisis y las perspectivas, por lo que eliminarlas garantiza la exactitud de los datos.
Selecciona la hoja de cálculo o el rango de celdas del que quieras eliminar duplicados.
Ve a la pestaña Datos de la cinta de opciones.
Haz clic en Eliminar duplicados en el grupo Herramientas de datos.
En el cuadro de diálogo Eliminar duplicados, especifica qué columna debe buscar duplicados.
Haz clic en Aceptar. Excel mostrará un mensaje indicando el número de valores duplicados eliminados.
Eliminar filas duplicadas
Las filas duplicadas pueden desordenar tus datos y afectar a la fiabilidad de tu análisis. He aquí cómo gestionarlo.
Selecciona el rango del que quieres eliminar las filas duplicadas.
Ve a la pestaña Datos de la cinta de opciones y haz clic en Avanzado en el grupo Ordenar y Filtrar.
En el cuadro de diálogo Filtro avanzado, selecciona Copiar a otra ubicación.
Ajusta el rango de la Lista al rango seleccionado.
Establece el campo Copiar a en la celda en la que quieres que se copien las filas únicas.
Marca la casilla Sólo registros únicos y haz clic en Aceptar.
Operaciones de texto en Excel
Echemos un vistazo a las operaciones de texto, como concatenar cadenas.
Concatenar
Combinar varias cadenas de texto en una celda puede ayudar a crear datos más significativos y organizados al fusionar información de distintas fuentes en un formato único y cohesionado.
- Selecciona la celda en la que quieres que aparezca el resultado concatenado.
- Tipo
=CONCATENATE()
. - Selecciona las celdas que quieras concatenar, separadas por comas o por el operador &.
- Pulsa Intro para ver el resultado.
celdas. Fuente: Imagen del autor
Cambiar el caso del texto
Un formato de texto uniforme puede mejorar la legibilidad y mantener la coherencia de tus datos. Veamos cómo ajustar esto.
Crea una nueva columna para el texto convertido.
Introduce la fórmula en una celda:
=UPPER()
o=LOWER()
o=PROPER()
- Pulsa Intro para aplicar la fórmula.
Arrastra el tirador de relleno para aplicar la fórmula a otras celdas si es necesario.
Cambio de mayúsculas y minúsculas de mayúsculas y minúsculas en el texto. Fuente: Imagen del autor
Eliminar caracteres no impresos del texto
Los caracteres que no se imprimen, como tabuladores, saltos de línea y caracteres especiales, pueden causar problemas al interrumpir el procesamiento de los datos, dificultando su correcto análisis o visualización.
Identifica los caracteres no impresos que debes eliminar.
Selecciona la celda que contiene el texto con caracteres no impresos.
En una nueva celda, utiliza la siguiente función:
=CLEAN(text)
.Para eliminar los espacios sobrantes y los caracteres no imprimibles, utiliza:
=TRIM(CLEAN(text))
.Copia y pega el texto limpiado para sustituir al original.
la función limpiar en la función limpiar en Excel. Fuente: Imagen del autor
Aprende los fundamentos de Excel
Transformación de datos en Excel
Las técnicas de transformación de datos se utilizan para reorganizar y remodelar tus datos para un mejor análisis, incluyendo el análisis sintáctico de texto y el uso de herramientas como Flash Fill.
Análisis de datos de texto a columna
Separar los datos de texto en columnas individuales facilita el análisis de componentes específicos y garantiza que cada dato se clasifique de forma distinta. Es lo contrario de la concatenación y resulta útil para descomponer datos complejos en partes manejables. He aquí cómo hacerlo.
Selecciona los datos que quieres dividir.
Ve a la pestaña Datos y haz clic en Texto a Columnas.
Elige Delimitado o Ancho fijo y haz clic en Siguiente.
En Delimitado, marca los delimitadores que utilizan tus datos y haz clic en Siguiente.
En Ancho fijo, establece los saltos de columna en la ventana Vista previa de datos y haz clic en Siguiente.
Elige el formato de datos para cada columna.
Haz clic en Finalizar.
de texto a columnas para el análisis sintáctico de datosUtilización de texto a columnas para el análisis sintáctico de datos. Fuente: Imagen del autor
Relleno de flash
Flash Fill rellena automáticamente los valores basándose en patrones que detecta en tus datos. A continuación te explicamos cómo puedes utilizar Relleno Flash en Excel:
Introduce datos siguiendo un patrón en una celda junto a tus datos existentes.
Pon otro ejemplo en la celda siguiente para ayudar a Excel a detectar el patrón.
Selecciona la celda con el ejemplo.
Ve a la pestaña Datos de la cinta de opciones.
Haz clic en Relleno Flash en el grupo Herramientas de Datos.
Excel rellenará automáticamente las celdas restantes basándose en el patrón detectado.
Fusionar y dividir columnas
Fusionar y dividir columnas ayuda a organizar los datos de la forma que mejor se adapte a tus necesidades de análisis. Sigue estos pasos para fusionar celdas:
- Ve a la pestaña Inicio y haz clic en el menú desplegable Combinar y Centrar del grupo Alineación .
- Selecciona la opción de fusión que prefieras.
Sigue estos pasos para dividir columnas:
- Ve a la pestaña Datos y haz clic en Texto a Columnas en el grupo Herramientas de Datos .
- Elige anchura delimitada o fija en función de lo que necesiten tus datos.
- Selecciona el destino de los datos divididos y haz clic en Finalizar.
Transformar y reordenar columnas y filas
Reorganizar los datos puede ayudar a presentarlos en un formato más lógico y accesible. Para transformar filas en filas y columnas en columnas:
Resalta los datos que quieras transformar (incluyendo las cabeceras si es necesario).
Haz clic con el botón derecho en la selección y elige Copiar opulsa Ctrl+C.
Selecciona la celda donde empiezan los datos transformados.
Haz clic con el botón derecho del ratón en la celda de destino, elige Pegado especial y selecciona Transponer.
También puedes utilizar Ctrl+Alt+V para abrir el cuadro de diálogo Pegado especial, luego marca la opción Transponer y haz clic en Aceptar.
Para reordenar columnas/filas:
Haz clic en la cabecera de la columna para seleccionar toda la columna que quieras mover.
Haz clic con el botón derecho del ratón y elige Cortaropulsa Ctrl+X.
Selecciona la columna a la que quieres mover la columna cortada, haz clic con el botón derecho del ratón en la cabecera de la columna y elige Insertar Celdas Cortadas.
Del mismo modo, para las filas, selecciona y corta la fila que quieras transferir a otra fila y pégala allí.
Correcciones numéricas y de fecha en Excel
Las correcciones numéricas y de fechas implican corregir y normalizar los datos numéricos y las fechas para garantizar que son precisos y tienen un formato coherente.
Fijar números y signos numéricos
Un formato incorrecto de los números puede causar problemas al provocar interpretaciones erróneas y errores de cálculo, así como problemas de ordenación y comparación de datos.
- Selecciona las celdas que contienen los números que necesitas corregir.
- Ve a la pestaña Inicio, haz clic en el menú desplegable Número del grupo Número y selecciona el formato de número adecuado (por ejemplo, General, Número, Moneda).
Fijar fechas y horas
Un formato adecuado de las fechas es crucial para realizar análisis e informes precisos basados en el tiempo.
Resalta las celdas que contienen las fechas.
Ve a la pestaña Inicio.
Haz clic en el menú desplegable Formato de número y selecciona Fecha corta o Fecha larga.
Avanza en tu carrera con Excel
Adquiere los conocimientos necesarios para sacar el máximo partido a Excel, sin necesidad de experiencia.
Gestión avanzada de datos en Excel
La gestión avanzada de datos incluye conciliar y combinar conjuntos de datos para crear un conjunto de datos completo y cohesionado para el análisis.
Conciliar datos de tablas mediante unión o correspondencia
Unir o emparejar datos de diferentes tablas garantiza un análisis completo y cohesionado.
Utilizar VLOOKUP para cotejar datos:
-
Asegúrate de que ambas tablas están accesibles en la misma hoja de cálculo.
-
Elige la celda en la que quieres mostrar los datos emparejados.
-
Utiliza la siguiente función:
=VLOOKUP(lookup_value, table_array, col_index_num, FALSE)
-
Arrastra el tirador de relleno para copiar la fórmula en otras celdas según sea necesario.
Utilizar INDEX y MATCH para más flexibilidad
-
Elige la celda en la que quieres mostrar los datos emparejados.
-
Utiliza la combinación de estas funciones:
=INDEX(array, MATCH(lookup_value, lookup_array, 0))
-
Arrastra el tirador de relleno para copiar la fórmula en otras celdas según sea necesario.
Reflexiones finales
Existen múltiples funciones de limpieza de datos en Excel que te permiten limpiar y validar los datos para que cumplan las normas establecidas. Pueden ayudarte a reducir los errores y mejorar la calidad de tus conjuntos de datos. Para profundizar en el dominio de las capacidades de Excel, considera la posibilidad de matricularte en nuestro curso Introducción a Excel.
Más allá de esto, tanto si estás depurando los datos para eliminar campos duplicados como normalizando los formatos de las entradas de datos, Excel tiene todas las herramientas que necesitas para facilitar este proceso. Si quieres mejorar tus habilidades de preparación de datos, nuestro curso Preparación de Datos en Excel ofrece una cobertura completa sobre este tema.
Para mejorar aún más tu capacidad analítica, puede que te resulte especialmente útil nuestro curso de Análisis de Datos en Excel. Este curso se sumerge en los entresijos del análisis de datos tras la limpieza. Además, si te interesa saber cómo los datos limpios apoyan las previsiones financieras, nuestro curso de Modelización Financiera en Excel podría ser de gran interés.
Si quieres ampliar tus habilidades de limpieza de datos, considera Power Query, que esuna herramienta flexible y eficaz integrada en Excel y Power BI que te permite importar y transformar datos sin problemas. Considera también explorar Limpieza de datos en Python o Limpieza de datos en R. Estos cursos ofrecen técnicas sólidas y las mejores prácticas para la limpieza de datos utilizando lenguajes de programación populares.
Soy una estratega de contenidos a la que le encanta simplificar temas complejos. He ayudado a empresas como Splunk, Hackernoon y Tiiny Host a crear contenidos atractivos e informativos para su público.
Preguntas frecuentes
¿Cuáles son los cinco pasos del proceso de limpieza de datos?
Los cinco pasos son eliminar duplicados, tratar los datos que faltan, corregir los errores estructurales, filtrar los valores atípicos y validar los datos.
¿Cuál es la diferencia entre limpieza de datos y transformación de datos?
La limpieza de datos consiste en identificar y corregir los errores e imprecisiones del conjunto de datos para garantizar su fiabilidad. En la transformación de datos, conviertes los datos de un formato o estructura a otro para hacerlos aptos para el análisis. Así, la limpieza de datos garantiza que los conjuntos de datos sean precisos, mientras que la transformación convierte los datos limpiados al formato necesario para el análisis o la elaboración de informes.
Aprende Excel con DataCamp
curso
Análisis de datos en Excel
curso