Saltar al contenido principal

Media aritmética: Una herramienta fundamental para el análisis de datos

Explora el papel de la media aritmética en el análisis de datos. Aprende su fórmula, sus aplicaciones y cómo se compara con otros tipos de medias y otras medidas estadísticas, y comprende cuándo es más útil cada una.
Actualizado 14 feb 2025  · 7 min de lectura

La media aritmética, comúnmente conocida como "la media", suele ser el punto de partida en estadística descriptiva. Proporciona una medida rápida e intuitiva de la tendencia central, que es una parte esencial de la interpretación de datos en cualquier campo. Aunque el concepto pueda parecer sencillo, comprender los matices de la media aritmética puede revelar verdaderos conocimientos sobre tendencias y patrones de datos más complejos.

Este artículo ofrece una visión general de la media aritmética, cubriendo su fórmula, aplicaciones y comparaciones con otros tipos de medias. Examinaremos por qué se utiliza con frecuencia en economía, ciencia de datos y otros campos, al tiempo que analizaremos escenarios en los que otras medidas alternativas podrían ser más adecuadas.

Para los que se inician en la estadística o quieren afianzar sus conocimientos, nuestro curso de Introducción a la Estadística proporciona una gran base. Nuestra Ficha de Estadística Descriptiva también proporciona un útil glosario de términos relacionados con este tema.

¿Qué es la media aritmética?

La media aritmética es la suma de todos los números de un conjunto de datos dividida por el recuento de esos números. Este sencillo cálculo la convierte en una de las medidas de tendencia central más intuitivas y utilizadas.

Para ilustrarlo, veamos un ejemplo sencillo. Supongamos que tenemos tres números: 5, 10 y 15. Para calcular su media aritmética:

  1. Suma los números: 5 + 10 + 15 = 30
  2. Cuenta los números: Tenemos 3 números
  3. Divide la suma por el recuento: 30 ÷ 3 = 10

Así, la media aritmética de 5, 10 y 15 es 10.

Propiedades clave de la media aritmética

La media aritmética posee varias propiedades importantes que resultan más intrigantes si se examinan más de cerca. 

La suma de las desviaciones es igual a cero

Una propiedad fundamental de la media aritmética es que la suma de las desviaciones respecto a ella siempre es igual a cero. En otras palabras, si restas el valor medio de cada punto de datos y sumas estas diferencias, el resultado será cero. Matemáticamente, esto puede expresarse como:

ecuación para el centrado medio

Donde x representa cada valor del conjunto de datos, y x̄ es la media aritmética.

Sensibilidad a los valores atípicos

En conjuntos de datos con valores extremos, la media aritmética puede acercarse mucho a estos valores atípicos, lo que puede llevar a interpretaciones erróneas, especialmente en distribuciones sesgadas. Por ejemplo, considera un conjunto de datos de salarios en una pequeña empresa: {$30,000, $35,000, $40,000, $45,000, $1,000,000}. La media aritmética (230.000 $) es significativamente superior a la mayoría de los salarios debido al valor atípico de 1.000.000 $.

Esta sensibilidad hace que la media aritmética sea menos robusta que medidas como la mediana en presencia de valores atípicos o para distribuciones sesgadas. Sin embargo, también puede hacer que la media sea útil para detectar la presencia de valores atípicos o comprender el impacto de los valores extremos en un conjunto de datos.

Impacto de los cambios en los datos

La media aritmética responde de forma predecible a los cambios en el conjunto de datos, lo que puede ser útil en diversos escenarios analíticos:

  1. Sumar o restar una constante: Si sumas o restas el mismo valor de cada punto de datos, la media aumentará o disminuirá en esa cantidad exacta. Por ejemplo, si añades 5 a cada valor de un conjunto de datos, la nueva media será 5 más que la media original.
  2. Multiplicar o dividir por una constante: Si multiplicas o divides cada punto de datos por la misma constante distinta de cero, la media se multiplicará o dividirá por esa constante. Por ejemplo, si duplicas todos los valores de un conjunto de datos, la nueva media será el doble de la media original.

Estas propiedades hacen que la media aritmética sea especialmente útil en situaciones que implican cambios uniformes en un conjunto de datos, como el ajuste de la inflación en datos económicos o el escalado de medidas en experimentos científicos.

Cuándo utilizar la media aritmética

La media aritmética es una herramienta estadística versátil, pero es especialmente eficaz en determinadas situaciones. En primer lugar, debemos decir que la media aritmética es especialmente útil para los conjuntos de datos que implican procesos aditivos. Por ejemplo, si calculas la temperatura media diaria, el salario medio en una empresa o la puntuación media en un examen, la media aritmética proporciona una representación significativa del valor central.

Además, debemos decir que la media aritmética es más fiable cuando los puntos de datos están distribuidos uniformemente, y no hay valores atípicos extremos. Veamos algunos ejemplos específicos del sector:

  • Finanzas: En finanzas, las empresas se basan en la media aritmética para obtener información y establecer puntos de referencia. Por ejemplo, las empresas lo utilizan para determinar los salarios medios, los gastos mensuales y los beneficios trimestrales.
  • Economía: Los economistas utilizan la media aritmética para analizar las tendencias del consumo y la estabilidad de los precios. Las aplicaciones clave incluyen el cálculo del consumo medio de los hogares y la creación de índices como el Índice de Precios al Consumo (IPC) para controlar la inflación a lo largo del tiempo.
  • Sanidad e Investigación Médica: En sanidad, la media aritmética desempeña un papel fundamental en la evaluación de los tratamientos y el estudio de las tendencias sanitarias. Por ejemplo, los investigadores calculan los tiempos medios de recuperación y la eficacia de los fármacos, mientras que los epidemiólogos evalúan las tasas medias de infección y los tiempos de supervivencia.

Cómo calcular la media aritmética

Aunque ya hemos cubierto el concepto básico, vamos a explorar cómo calcular la media aritmética utilizando herramientas como R, Python y Excel, que es prácticamente necesario para conjuntos de datos más grandes.

Fórmula de la media aritmética

La fórmula de la media aritmética es:

fórmula de la media aritmética

Donde x̄ es la media aritmética, Σx es la suma de todos los valores, y n es el número de valores.

Media aritmética en Excel, Python y R

Para conjuntos de datos más grandes, las herramientas informáticas facilitan mucho el cálculo. He aquí cómo calcular la media aritmética en Excel, Python y R. 

Excel

En Excel, puedes utilizar la función AVERAGE():

  1. Introduce tus datos en una columna o fila.

  2. En una nueva celda, escribe =AVERAGE().

  3. Selecciona el rango de celdas que contiene tus datos.

  4. Cierra el paréntesis y pulsa Introduce.

Por ejemplo, si tus datos están en las celdas A1:A10, utilizarías: =AVERAGE(A1:A10).

Python

El módulo estadístico de Python proporciona una función mean():

from statistics import mean

data = [5, 10, 15, 20, 25]

result = mean(data)
print(result)  # Output: 15

Para conjuntos de datos más grandes, quizá prefieras la función mean() de NumPy, más eficiente:

import numpy as np

data = np.array([5, 10, 15])

result = np.mean(data)
print(result)  # Output: 10.0

R

En R, puedes utilizar la función incorporada mean() de la base R:

data <- c(5, 10, 15)

result <- mean(data)
print(result)  # Output: [1] 10

Estas herramientas agilizan el proceso de cálculo de la media aritmética para conjuntos de datos de cualquier tamaño, permitiéndote centrarte en la interpretación de los datos en lugar del cálculo manual.

Media aritmética en ciencia de datos, aprendizaje automático y estadística

Las aplicaciones de la media aritmética en la ciencia de datos y el aprendizaje automático abarcan desde el preprocesamiento de datos hasta la evaluación de modelos. Exploremos algunas áreas clave en las que la media aritmética es especialmente importante. 

Escalado de características

Una de las aplicaciones más comunes de la media aritmética en el preprocesamiento de datos es el escalado de características, sobre todo en el centrado de medias:

  • Centrado medio: Este proceso consiste en restar la media aritmética de cada punto de datos de una característica. El resultado es un conjunto de datos centrado en el que la media de cada característica es cero. Se puede representar como: x_centered = x - x̄ donde x es el valor original y x̄ es la media aritmética de la característica.

  • Normalización: Utilizada a menudo junto con el centrado de la media, la normalización consiste en dividir por la desviación típica después de restar la media: x_standardized = (x - x̄) / σ donde σ es la desviación típica de la característica.

Estas técnicas ayudan a normalizar la escala de las características, lo que es especialmente importante para muchos algoritmos de aprendizaje automático. Si quieres saber más sobre la diferencia entre normalización y estandarización, puedes explorar el tutorial completo.

Evaluación del modelo

La media aritmética es fundamental en varias métricas de evaluación de modelos:

  • Error cuadrático medio (ECM): Esta métrica habitual en los problemas de regresión calcula la media de las diferencias al cuadrado entre los valores predichos y los reales.
  • Error medio absoluto (MAE): Similar al MSE, pero utiliza la diferencia absoluta en lugar de la diferencia al cuadrado.
  • Precisión: En los problemas de clasificación, la precisión se suele expresar como la media de predicciones correctas en todas las muestras.

Estadística y comprobación de hipótesis

En el análisis estadístico, la media aritmética se utiliza a menudo en la comprobación de hipótesis. Por ejemplo:

  • Pruebas T: La media aritmética es crucial en las pruebas t, que comparan las medias de dos grupos para determinar si son estadísticamente diferentes. Al comparar las medias muestrales, las pruebas t ayudan a validar las hipótesis sobre las características de la población.
  • Intervalos de confianza: La media aritmética se utiliza para calcular los intervalos de confianza, que indican la fiabilidad de la media estimada. Esto da una idea de lo representativa que es la media de la muestra para toda la población.

Otras aplicaciones

  • Métodos de conjunto: Muchas técnicas de ensemble, como el bagging y el boosting, utilizan la media aritmética para combinar las predicciones de varios modelos.
  • Descenso Gradiente: La media aritmética se utiliza para calcular el gradiente medio entre minilotes en el descenso de gradiente estocástico.
  • Detección de anomalías: Las desviaciones de la media pueden utilizarse para identificar valores atípicos o anomalías en los conjuntos de datos. Por ejemplo, una heurística habitual es utilizar tres desviaciones típicas como umbral, de modo que cualquier punto de datos que se aleje tres o más desviaciones típicas de la media aritmética se consideraría un valor atípico.
  • Reducción de la dimensionalidad: Técnicas como el análisis de componentes principales (ACP) utilizan la media aritmética en sus cálculos para centrar los datos antes de calcular la matriz de covarianzas.
  • Redes neuronales: En el algoritmo de retropropagación, se utiliza la media aritmética para calcular el error medio entre los ejemplos de entrenamiento.
  • Validación cruzada: Cuando se realiza una validación cruzada de k pliegues, la media aritmética de las métricas de rendimiento de todos los pliegues suele indicarse como estimación del rendimiento global.

Como ya te habrás dado cuenta, la media aritmética es importante tanto para interpretar el resultado de los datos como para realizar un preprocesamiento necesario para el rendimiento óptimo del modelo. Para profundizar en el conocimiento de estos conceptos y sus aplicaciones prácticas, considera la posibilidad de cursar nuestro itinerario profesional de Científico de Aprendizaje Automático en Python, que cubre estos temas en mayor profundidad.

Conviértete en un Científico ML

Mejora tus conocimientos de Python para convertirte en un científico del aprendizaje automático.
Empieza a aprender gratis

Media aritmética vs. Otros medios

Aunque la media aritmética se utiliza mucho, no siempre es la medida de tendencia central más adecuada. Diferentes tipos de medias, como la media geométrica y la media armónica, pueden proporcionar análisis más precisos en situaciones concretas. Entender cuándo utilizar cada tipo de media puede conducir a resultados más significativos, sobre todo cuando se trata de determinados tipos de datos o necesidades analíticas específicas. Exploremos brevemente cómo se compara la media aritmética con estos otros tipos de medias y cuándo es más apropiada cada una de ellas.

Media aritmética vs. media geométrica

La media aritmética funciona mejor para los procesos aditivos, mientras que la media geométrica es más adecuada para los multiplicativos.

  • Media aritmética: (a + b) / 2 
  • Media geométrica: √(a * b)

Por ejemplo, considera una acción que sube un 50% un año y cae un 50% el siguiente:

  • Media aritmética: (50% + (-50%)) / 2 = 0% 
  • Media geométrica: √(1.5 * 0.5) - 1 ≈ -13.4%

En este caso, la media geométrica proporciona una representación más exacta de la tasa media de crecimiento, ya que tiene en cuenta el efecto compuesto. Por lo tanto, utiliza media aritmética al sumar cantidades (por ejemplo, temperaturas diarias, resultados de exámenes) y utiliza la media geométrica al multiplicar cantidades (por ejemplo, tasas de crecimiento, rendimientos de inversiones).

Media aritmética vs. media armónica

La media armónica se utiliza cuando los valores más pequeños necesitan más énfasis, especialmente en tasas o ratios.

  • Media aritmética: (a + b) / 2 
  • Media armónica: 2 / (1/a + 1/b)

Por ejemplo, considera la posibilidad de calcular la velocidad media en dos distancias iguales. Distancia 1 = 60 mph, y distancia 2 = 65 km/h.

  • Media aritmética: (60 + 40) / 2 = 80 km/h 
  • Media armónica: 2 / (1/60 + 1/40) ≈ 48 mph

La media armónica da la velocidad media correcta, ya que tiene en cuenta el hecho de que se pasa más tiempo a la velocidad más lenta. Por tanto, utiliza lamedia aritmética cuando los valores representen cantidades, y la media armónica cuando los valores representen tasas o velocidades.

Consideraciones clave para utilizar la media aritmética

Aunque la media aritmética es una herramienta estadística muy utilizada, es importante comprender sus puntos fuertes y sus limitaciones. Aquí tienes algunas consideraciones clave que debes tener en cuenta cuando utilices la media aritmética.

Puntos fuertes

  1. Simplicidad: La media aritmética es fácil de calcular y comprender, lo que la hace accesible a un amplio abanico de usuarios.
  2. Ideal para datos distribuidos uniformemente: Proporciona una representación precisa de la tendencia central para datos distribuidos simétricamente.
  3. Incorpora todos los puntos de datos: A diferencia de la mediana o la moda, la media aritmética tiene en cuenta todos los valores del conjunto de datos.

Limitaciones

  1. Sensibilidad a los valores atípicos: Los valores extremos pueden sesgar significativamente la media aritmética, lo que puede dar lugar a una representación errónea de la tendencia central de los datos.
  2. No apto para datos no numéricos: La media aritmética no puede calcularse para datos categóricos o no numéricos.
  3. Puede no representar el valor "típico": En las distribuciones sesgadas, la media aritmética puede no reflejar el valor más común o central del conjunto de datos.

Media aritmética vs. mediana

Consideremos un conjunto de datos que representa los salarios anuales (en miles de dólares) de los empleados de una pequeña empresa:

{30, 35, 40, 45, 50, 200}
  • Media aritmética: (30 + 35 + 40 + 45 + 50 + 200) / 6 ≈ 66.67 
  • Mediana: 42.5 
  • Modo: Sin modo de borrado (todos los valores ocurren una vez)

En este caso, el único salario alto de 200.000 $ eleva significativamente la media aritmética, haciéndola mucho más alta que la mayoría de los salarios del conjunto de datos. La mediana de 42.500 $ podría ser una medida más representativa del salario "típico" en esta empresa.

Cuándo ser prudente

  1. Distribuciones sesgadas: Cuando los datos no estén distribuidos simétricamente, considera la posibilidad de utilizar la mediana en su lugar.
  2. Presencia de valores atípicos: Si tu conjunto de datos contiene valores extremos, examina su impacto y considera la posibilidad de utilizar medidas robustas como la mediana o la media recortada.
  3. Muestras pequeñas: Con conjuntos de datos pequeños, un solo valor inusual puede tener un gran impacto en la media aritmética.
  4. Datos categóricos u ordinales: La media aritmética no tiene sentido para datos no numéricos o con una escala no lineal.

Si tienes en cuenta estas consideraciones, podrás tomar decisiones informadas sobre cuándo utilizar la media aritmética y cuándo otras medidas alternativas de tendencia central pueden ser más apropiadas para tu análisis.

Conclusión: El significado de la media aritmética

La media aritmética, como hemos explorado, es una medida estadística versátil con amplias aplicaciones. Su naturaleza directa lo convierte en un punto de partida accesible para la interpretación de los datos, ya que proporciona un valor representativo del centro de un conjunto de datos. Desde el análisis financiero a la investigación científica, la media aritmética se aplica habitualmente en diversos campos.

Entender cuándo aplicar la media aritmética -y cuándo considerar alternativas- es fundamental para una interpretación precisa de los datos. Hemos hablado de su sensibilidad a los valores atípicos y de situaciones en las que otras medidas podrían ser más apropiadas. 

La media aritmética desvela narrativas dentro de los conjuntos de datos, revelando tendencias y pautas que de otro modo permanecerían ocultas. Cuando apliques esta herramienta estadística a tu trabajo -ya sea en análisis de mercado, investigación científica o cualquier campo rico en datos- descubrirás historias convincentes. Cada cálculo de la media abre una ventana a la estructura subyacente de tus datos, invitando a una exploración más profunda.

Para ayudarte en tu viaje por los datos, DataCamp ofrece muchos cursos para todos los niveles. Nuestro curso de Introducción a la Estadística explora la estadística descriptiva e inferencial, incluidas las medidas de tendencia central y dispersión, y nuestro curso de carrera completa de Científico de Aprendizaje Automático en Python te ayudará a comprenderlo todo, desde el aprendizaje supervisado hasta los clasificadores lineales.

Conviértete en un Científico ML

Domina las habilidades de Python para convertirte en un científico del aprendizaje automático

Vinod Chugani's photo
Author
Vinod Chugani
LinkedIn

Como profesional experto en Ciencia de Datos, Aprendizaje Automático e IA Generativa, Vinod se dedica a compartir conocimientos y a capacitar a los aspirantes a científicos de datos para que tengan éxito en este dinámico campo.

Preguntas frecuentes sobre la media aritmética

¿Cuál es la diferencia entre media aritmética y mediana?

La media aritmética es la suma de todos los valores dividida por el recuento de valores, mientras que la mediana es el valor medio cuando los datos están ordenados. La mediana se ve menos afectada por los valores atípicos, por lo que es más adecuada para distribuciones sesgadas.

¿Puede ser negativa la media aritmética?

Sí, la media aritmética puede ser negativa si la suma de los valores es negativa. Esto suele ocurrir cuando se trata de cifras negativas, como cambios de temperatura o pérdidas económicas.

¿Cómo afecta el tamaño de la muestra a la fiabilidad de la media aritmética?

Las muestras de mayor tamaño suelen dar lugar a medias aritméticas más fiables. A medida que aumenta el tamaño de la muestra, es menos probable que la media se vea influida por valores extremos o errores de muestreo.

¿Es siempre la media aritmética la mejor medida de tendencia central?

No, la media aritmética no siempre es la mejor opción. Para distribuciones sesgadas o datos con valores atípicos, la mediana o la moda pueden ser más representativas del valor típico.

¿Cómo se relaciona la media aritmética con el concepto de valor esperado en probabilidad?

La media aritmética está estrechamente relacionada con el valor esperado en la teoría de la probabilidad. De hecho, para una distribución de probabilidad discreta, el valor esperado se calcula como la suma de cada resultado posible multiplicada por su probabilidad, que es esencialmente una media aritmética ponderada.

¿Puede utilizarse la media aritmética con datos categóricos?

No, la media aritmética no es adecuada para los datos categóricos. Requiere valores numéricos para realizar cálculos y proporcionar resultados significativos.

Temas

Aprende con DataCamp

Certificación disponible

Curso

Introducción a la visualización de datos con ggplot2

4 hr
155.1K
Aprende a producir visualizaciones de datos significativas y bellas con ggplot2 comprendiendo la gramática de los gráficos.
Ver detallesRight Arrow
Comienza el curso
Ver másRight Arrow