curso
Guía completa para calcular distribuciones de frecuencias en Excel
Una distribución de frecuencias, a menudo visualizada con un histograma de frecuencias, organiza los puntos de datos en rangos especificados, lo que permite comprender fácilmente con qué frecuencia se produce cada valor. Esta técnica es vital para identificar patrones, tendencias y posibles valores atípicos, proporcionando una visión más profunda de los datos.
Este tutorial explorará las distribuciones de frecuencias, su importancia en el análisis de datos y cómo crearlas. Con Microsoft Excel, recorreremos una guía paso a paso para generar una distribución de frecuencias de un conjunto de datos del mundo real e interpretar los resultados para obtener información significativa.
La respuesta rápida: Cómo crear una distribución de frecuencias en Excel
Para crear una distribución de frecuencias en Excel, utiliza la función FREQUENCY()
. La función calcula la frecuencia con la que se producen valores dentro de rangos especificados, conocidos como intervalos.
Sigue estos pasos:
- Empieza introduciendo tus datos en una columna.
- Define tus contenedores en otra columna.
- En una nueva celda, escribe
=FREQUENCY(data_array, bins_array)
, dondedata_array
es el rango de tus celdas de datos ybins_array
es el rango de tus contenedores. - Ejemplo:
=FREQUENCY(A2:A16, B2:B6)
. - Pulsa Intro para obtener la distribución de frecuencias.
la distribución de frecuencias con la función Cálculo de la distribución de frecuencias con la función FREQUENCY()
. Imagen del autor
Por qué son importantes las distribuciones de frecuencias
Una distribución de frecuencias es una técnica estadística que organiza los datos en categorías o intervalos. Generalmente, el resultado es una tabla que muestra el número de observaciones para un intervalo determinado de los datos subyacentes.
Las distribuciones de frecuencias son útiles de varias maneras:
- Resumen de datos: Las distribuciones de frecuencias resumen grandes conjuntos de datos de forma organizada y comprensible. Esto nos permite tener una visión rápida de la distribución de los valores.
- Representación visual: La distribución de frecuencias puede representarse fácilmente en forma de histogramas y gráficos circulares, lo que permite una comprensión visual de los datos.
- Identificar patrones, tendencias y valores atípicos: Revelan patrones en los datos, como picos, conglomerados y valores atípicos. Puede utilizarse en análisis estadísticos para explorar más a fondo la forma y las características de los datos.
- Comparación de datos: La distribución de valores te permite comparar distintos conjuntos de datos y comprender las similitudes y diferencias.
- Comunicación: Las distribuciones de frecuencias pueden utilizarse como una herramienta sencilla y eficaz para comunicar las percepciones de los datos a un público más amplio, incluidos los responsables de la toma de decisiones.
- Toma de decisiones: Una comprensión clara de la distribución y sus pautas ayuda en la toma de decisiones. Por ejemplo, conocer la oferta de productos por temporada ayudará a decidir cuándo realizar las compras.
Ahora que hemos comprendido las distribuciones de frecuencia y su importancia, vamos a sumergirnos en varios métodos para crearlas en Microsoft Excel.
Métodos para crear una distribución de frecuencias en Excel
Imagina que trabajas para una empresa de cosméticos que ofrece productos para una amplia gama de grupos de edad. Ahora, buscan especializarse en unos pocos productos dirigidos a un grupo de edad específico que tenga más clientes. Para entenderlo, tienes que analizar a los clientes por grupos de edad.
Para solucionarlo, han extraído datos sobre la edad de los clientes de la base de datos de clientes. Se te ha entregado la siguiente tabla:
Conjunto de datos sobre la edad de Conjunto de datos sobre la edad de los clientes. Imagen del autor
Como parte del análisis de la demanda por grupos de edad de los clientes, te has dado cuenta de que calcular la distribución de frecuencias será un buen punto de partida. Aquí tienes cuatro métodos para calcular la distribución de frecuencias utilizando Microsoft Excel.
Método 1: Utilizando la FREQUENCY()
función
La función FREQUENCY()
calcula la distribución de frecuencias de unos datos dados y devuelve una lista que muestra la frecuencia de los valores en unos intervalos determinados.
Ésta es la sintaxis de la función FREQUENCY()
:
=FREQUENCY(data_array, bins_array)
La función toma dos parámetros:
data_array
: Una matriz o referencia a un conjunto de valores para los que quieres contar frecuencias. Si la matriz_datos no contiene valores,FREQUENCY()
devuelve una matriz de ceros.bins_array
: Una matriz o referencia a los intervalos en los que quieres agrupar los valores de matriz_datos. Si bins_array no contiene valores,FREQUENCY()
devuelve el número de elementos de data_array.
Ambos parámetros son necesarios para calcular la distribución de frecuencias. Sólo te dan la data_array
, que es la Edad del Cliente. Por lo tanto, tienes que definir por tu cuenta la dirección bins_array
.
Para este caso de uso, podemos definir los intervalos como <20, 20-30, 30-40, 40-50, 50-60 y >60. Rellena la columna B de tu hoja de cálculo, como se muestra a continuación.
La fórmula de distribución de frecuencias utilizando la función La fórmula de distribución de frecuencias utilizando la función FREQUENCY()
. Imagen del autor
Una vez preparadas las páginas data_array
y bins_array
, escribe la fórmula para calcular la distribución de frecuencias en la celda C2.
=FREQUENCY(A2:A16, B2:B6)
El resultado de ejecutar la fórmula anterior tendrá el siguiente aspecto:
Distribución de frecuencias mediante la función FREQUENCY()
. Imagen del autor
Observando la distribución de frecuencias anterior, vemos:
- La empresa sólo tiene un cliente de menos de 20 años.
- Cinco clientes están en la franja de edad de 20-30 y 30-40 años.
- Tres clientes tienen entre 40 y 50 años.
- Un cliente tiene entre 50 y 60 años.
- Ningún cliente tiene más de 60 años.
A partir de la distribución de frecuencias, comprendes que la mayoría de los clientes tienen entre 20 y 40 años.
Método 2: Utilizar tablas dinámicas
Las tablas dinámicas son una forma rápida y sencilla de resumir y analizar grandes cantidades de datos. Las tablas dinámicas ofrecen funciones como la agregación, la agrupación y las rebanadoras, por nombrar algunas.
Para calcular la distribución de frecuencias utilizando Tablas Dinámicas, haz clic en Insertar en el menú y selecciona Tabla dinámica.
tabla dinámicaInsertar tabla dinámica. Imagen del autor
Especifica el rango de datos para el que deseas crear la Tabla dinámica. En tu caso, el intervalo de datos es A2:A16
. Selecciona Nueva hoja de cálculo para obtener el resultado en una hoja nueva.
Tras especificar el intervalo de datos, pulsa OK.
de los parámetros de la tabla dinámicaEspecificación de los parámetros de la tabla dinámica. Imagen del autor
Al hacer clic en Aceptar, verás el panel Campos de la tabla dinámica en la parte derecha de la ventana. Para crear una Tabla Dinámica para la Edad del Cliente, arrastra y suelta Edad del Cliente en Filas y Valores.
Personalizar la tabla dinámica. Imagen del autor
Después de arrastrar y soltar el campo Edad del Cliente, el panel derecho tendrá el siguiente aspecto:
Tabla dinámica personalizada. Imagen del autor
La Tabla dinámica generada tendrá este aspecto:
Tabla dinámica de edad de clientes. Imagen del autor
Si observas la tabla dinámica anterior, esto es distinto de lo que buscas. El caso de uso es analizar el número de clientes por grupos de edad.
Nos faltan dos cosas:
- La columna Edad del cliente no está agrupada.
- Nos interesa el número de clientes de cada grupo, no la suma de su edad.
Arreglémoslo.
Haz clic con el botón derecho en el valor de una fila y selecciona Agrupar.
Agrupa los valores de las filas en la tabla dinámica. Imagen del autor
Rellena los parámetros de agrupación. En nuestro ejemplo, elegimos los intervalos 20, 30, 40, 50 y 60. Por tanto, empezamos en 20
y terminamos en 60
con un incremento de 10
.
Agrupar tabla dinámica. Imagen del autor
Tras la agrupación, el resultado tendrá el siguiente aspecto:
Tabla dinámica agrupada. Imagen del autor
A continuación, tenemos que cambiar la Suma por la Cuenta. Para cambiarlo, haz clic con el botón derecho del ratón en la celda Suma de la Edad del Cliente y selecciona Configuración del Campo de Valor.
de campos de valor en la tabla dinámicaConfiguración de campos de valor en la tabla dinámica. Imagen del autor
En el cuadro de diálogo emergente, en Resumir valores por, cambia Suma por Recuento y pulsa Aceptar.
Ajustes del campo de Ajustes del campo de valor. Imagen del autor
Una vez que lo actualices, la salida tendrá el siguiente aspecto:
Distribución de frecuencias mediante una tabla dinámica. Imagen del autor
Buscabas este resultado: tienes la distribución de frecuencias por Edad del Cliente.
Método 3: Utilizar el Paquete de Herramientas de Análisis de Datos
El paquete de herramientas de análisis de datos es un complemento adicional para Microsoft Excel que ayuda a calcular las métricas utilizadas habitualmente en las tareas de análisis de datos.
Este complemento no está activado por defecto. Por tanto, busca en la parte superior derecha el icono de Análisis de Datos, en la pestaña Datos de tu libro de Excel.
Data Analysis ToolPak en Data Analysis ToolPak en Excel. Imagen del autor
Si no ves el icono como se muestra arriba, el complemento no se ha activado. Para activarlo, haz clic en Archivo en el menú y selecciona Opciones.
Seleccionar opciones de la ArchivoSeleccionar opciones de la pestaña Archivo. Imagen del autor
Selecciona Complementos cuando se abra el cuadro de diálogo Opciones de Excel.
el cuadro de diálogo Opciones de ExcelSelecciona Complementos en el cuadro de diálogo Opciones de Excel. Imagen del autor
A continuación, selecciona Complementos de Excel en el cuadro Gestionar de la parte inferior y haz clic en Ir.
de los complementos de ExcelGestión de los complementos de Excel. Imagen del autor
Marca Analysis ToolPak cuando se abra el cuadro de diálogo Complementos y haz clic en Aceptar.
Activación de la herramienta de análisis de datos. Imagen del autor
Ahora el icono de Análisis de Datos estará visible en la pestaña Datos, y no es necesario que repitas este proceso, ya que habilitar el complemento es una tarea que se realiza una sola vez.
Selecciona el intervalo de datos, incluida la cabecera de la columna, para calcular la distribución de frecuencias. Haz clic en el icono Análisis de Datos. Aparecerá un cuadro de diálogo. Elige en él el Histograma y haz clic en Aceptar.
del complemento Data Analysis ToolpakInvocación del complemento Data Analysis Toolpak. Imagen del autor
Aparecerá un cuadro de diálogo, como el que se muestra a continuación.
Personalizar los parámetros del Personalizar los parámetros del histograma. Imagen del autor
Rellena el Rango de entrada con el rango de datos Edad del cliente y el Rango de ubicaciones con Ubicaciones.
- Tienes los datos de la Edad del Cliente en las celdas
A2:A16
. - Tienes los datos de Bins en las celdas
B2:B6
. - En las opciones de Salida, selecciona Nueva hoja de cálculo para obtener la salida en una nueva hoja de cálculo.
- Haz clic en Aceptar.
Verás la distribución de frecuencias en una nueva hoja de cálculo como la siguiente.
Distribución de frecuencias mediante la herramienta de análisis de datos. Imagen del autor
¡Voilà! Tienes la distribución de frecuencias por grupos de edad creada con el Paquete de Herramientas de Análisis de Datos.
Método 4: Utilización de las funciones COUNTIF() y COUNTIFS()
La función COUNTIF()
cuenta el número de veces que se cumple un único criterio. La función COUNTIFS()
cuenta el número de celdas que cumplen varios criterios.
Para calcular la frecuencia de cada grupo de edad, introduce las fórmulas siguientes en las celdas D2
a D7
, respectivamente.
# In cell D2
=COUNTIF(A2:A16, "<=20")
# In cell D3
=COUNTIFS(A2:A16, ">20", A2:A16, "<=30")
# In cell D4
=COUNTIFS(A2:A16, ">30", A2:A16, "<=40")
# In cell D5
=COUNTIFS(A2:A16, ">40", A2:A16, "<=50")
# In cell D6
=COUNTIFS(A2:A16, ">50", A2:A16, "<=60")
# In cell D7
=COUNTIF(A2:A16, ">60")
Aquí tienes un ejemplo de cómo añadir la fórmula a las celdas. Una vez que los hayas calculado todos, el resultado tendrá el siguiente aspecto:
la distribución de frecuencias utilizando la Calcula la distribución de frecuencias utilizando la función COUNTIF()
. Imagen del autor
En comparación con otros métodos discutidos, una limitación del uso de COUNTIF()
es que requiere intervalos de recipientes predefinidos dentro de la ecuación.
El método más habitual para crear la tabla de distribución de frecuencias es utilizar la función FREQUENCY()
.
No obstante, siéntete libre de utilizar el método que te resulte más cómodo. Por ejemplo, utilizar el Paquete de herramientas de análisis de datos puede ser más adecuado si también vas a calcular otras medidas estadísticas, como la asimetría, el ANOVA o la matriz de correlaciones, como parte del análisis.
Reflexiones finales
En este tutorial, hemos aprendido la importancia de la distribución de frecuencias y cómo calcularla utilizando Microsoft Excel. Trabajando con un ejemplo del mundo real, aprendimos a utilizar la función FREQUENCY()
y a interpretar la distribución resultante para conocer mejor nuestros datos. Exploramos tres formas alternativas de calcular la distribución de frecuencias.
El aprendizaje no tiene por qué acabar aquí, y te animamos a que sigas aprendiendo y ampliando tus conocimientos de Excel. Considera la posibilidad de cursar la asignatura Fundamentos de Excel para construir tus cimientos con Excel. Los cursos Preparación de datos en Excel y Visualización de datos en Excel pueden ayudarte a ampliar tus conocimientos sobre estos temas. Echa un vistazo a la hoja de trucos Manipulación de datos en Excel, que puede servirte de referencia rápida.
¡Feliz aprendizaje!
Preguntas frecuentes
¿Qué son los intervalos en una distribución de frecuencias?
Los intervalos son rangos que agrupan puntos de datos en una distribución de frecuencias. Cada casilla representa un intervalo de valores, y la frecuencia es el recuento de puntos de datos dentro de cada casilla.
¿Cómo creo intervalos personalizados para mi distribución de frecuencias?
La creación de ubicaciones personalizadas difiere según el método que utilices. Las opciones incluyen utilizar la función FREQUENCY()
, utilizar tablas dinámicas, utilizar el paquete de herramientas de análisis de datos y utilizar la función COUNTIF()
.
¿Cuál es la diferencia entre COUNTIF() y COUNTIFS()?
COUNTIF()
cuenta el número de ocurrencias que cumplen una única condición. COUNTIFS()
cuenta el número de ocurrencias que cumplen varias condiciones.
¿Cómo se crea una distribución de frecuencias con tamaños de cajón desiguales?
Modifica los valores de las casillas. Por ejemplo, si antes tenías 20, 30, 40, 50 y 60 como recipientes, puedes cambiarlos a 20, 30, 50 y 60, donde el rango de 30-50 hace que los tamaños de los recipientes sean desiguales. Después, se utiliza la función FRECUENCIA() como de costumbre para calcular la distribución de frecuencias.
¿Cuáles son algunas limitaciones del uso de COUNTIF() en el cálculo de la distribución de frecuencias?
COUNTIF()
requiere intervalos de recipientes predefinidos. Cambiar el intervalo de recipientes requiere una actualización manual de cada fórmula COUNTIF()
.
Aprende con DataCamp
curso
Introduction to Statistics
programa
Excel Fundamentals
tutorial
Prueba Chi-cuadrado en hojas de cálculo
Avinash Navlani
10 min
tutorial
Cómo crear un cuadro de mando en Excel en 3 sencillos pasos
tutorial
Cómo calcular la desviación típica en Excel
tutorial
Las 15 fórmulas básicas de Excel que todo el mundo debe conocer
tutorial
Tutorial de cálculo de Power BI
tutorial
Cómo hacer un histograma en R básico: 6 pasos con ejemplos
Kevin Babitz
10 min