curso
Media geométrica: Una medida para el crecimiento y la capitalización
¿Has calculado alguna vez la media de los rendimientos anuales de tus inversiones, sólo para descubrir que tu rendimiento global real no coincide del todo? Este escenario habitual en finanzas pone de relieve la importancia de comprender y aplicar la media geométrica, una medida útil que a menudo resulta más apropiada que la media aritmética, ampliamente utilizada, cuando se trata de tasas de cambio y efectos compuestos.
En este tutorial, exploraremos el concepto de media geométrica y su papel en el análisis de datos, especialmente en campos como las finanzas, la biología y la ciencia de datos. También examinaremos los escenarios en los que supera a otras medidas de tendencia central.
¿Qué es la media geométrica?
La media geométrica es un tipo de media especialmente útil cuando se trabaja con conjuntos de números positivos, sobre todo los que implican multiplicación o crecimiento exponencial. A diferencia de la media aritmética más común, que suma números y los divide por el recuento, la media geométrica es especialmente adecuada para manejar conjuntos de datos que implican relaciones multiplicativas o crecimiento exponencial.
He aquí algunos campos en los que la media geométrica es valiosa:
- Finanzas: Se suele utilizar para calcular tasas medias de rentabilidad a lo largo de varios periodos. A diferencia de la media aritmética, la media geométrica tiene en cuenta la capitalización, lo que la hace más precisa para los cálculos financieros.
- Biología: En los estudios sobre el crecimiento de la población, se utiliza la media geométrica para calcular las tasas medias de crecimiento a lo largo del tiempo.
- Geometría: Una de sus apariciones más elegantes es en los triángulos rectángulos, donde la altura a la hipotenusa encarna la media geométrica de los segmentos que crea en esa hipotenusa. Además, la media geométrica representa la longitud lateral de un cuadrado que tendría la misma área que un rectángulo dado, proporcionando una forma de "cuadrar" áreas rectangulares.
Como puedes ver, la media geométrica es una herramienta valiosa tanto en los cálculos cotidianos como en conceptos matemáticos más abstractos.
Cómo calcular la media geométrica
Existen varios métodos para calcular la media geométrica, cada uno con sus propias ventajas según la situación.
La fórmula de la media geométrica
La forma más sencilla de calcular la media geométrica es utilizando la fórmula estándar:
Aquí, x₁, x₂, ..., xₙ son los números positivos del conjunto de datos, y n es el recuento de números. Para obtener la media geométrica multiplicamos todos los valores juntos y tomamos la raíz enésima del producto, donde n es el número de valores. Veámoslo con un ejemplo. Considera los números 2, 4 y 8. Para hallar su media geométrica:
- Multiplica los números: 2 * 4 * 8 = 64
- Saca la raíz cúbica (ya que hay 3 números): ∛64 ≈ 4
La media geométrica de 2, 4 y 8 es 4. Este resultado nos dice que si tuviéramos tres números iguales, cada uno igual a 4, su producto sería igual al producto de los números originales. Esencialmente, 4 es el factor de crecimiento constante en los tres valores.
Calcular la media geométrica sumando logaritmos
Para conjuntos de datos más grandes o para evitar errores de desbordamiento al tratar con números muy grandes, podemos utilizar logaritmos. Este método simplifica la multiplicación en suma y hace que los cálculos sean más manejables. Aquí, primero tomamos el logaritmo de cada número, calculamos la media aritmética de estos logaritmos y, a continuación, tomamos el antilog (exponencial) de esta media. Utilicemos el mismo ejemplo anterior.
- Toma logaritmos (base 10): log(2) ≈ 0,3010, log(4) ≈ 0,6021, log(8) ≈ 0,9031
- Calcula la media aritmética: (0.3010 + 0.6021 + 0.9031) / 3 ≈ 0.6021
- Toma el antilog: (10^x) = 10^0.6021 ≈ 4
Este método nos da el mismo resultado que el método de cálculo directo. Puedes utilizar logaritmos de cualquier base (como los logaritmos naturales de base e), siempre que utilices la misma base en todo el cálculo. La media geométrica final será la misma.
La media geométrica en la ciencia de datos y el aprendizaje automático
La media geométrica es una medida estadística útil con varias aplicaciones importantes en la ciencia de datos y el aprendizaje automático. He aquí tres casos de uso clave en los que la media geométrica resulta valiosa.
Tasas de crecimiento y análisis de series temporales
En la ciencia de datos, a menudo analizamos las tasas de crecimiento a lo largo del tiempo, como en la dinámica de la población, las tendencias del mercado o las tasas de adopción de usuarios. La media geométrica es ideal para estas situaciones porque capta con precisión la naturaleza compuesta del crecimiento. A diferencia de la media aritmética, que simplemente promedia las tasas sin tener en cuenta cómo el crecimiento de cada año se basa en el anterior, la media geométrica tiene en cuenta este efecto compuesto.
Imagina que estás analizando la tasa de crecimiento anual de la base de usuarios de una startup durante cinco años: 20%, 15%, 25%, 10% y 30%. Aunque la media aritmética (20%) pueda parecer una solución rápida, no tiene en cuenta el efecto compuesto. La media geométrica ((1,20 * 1,15 * 1,25 * 1,10 * 1,30)^(1/5) - 1 ≈ 19,77%) proporciona una tasa de crecimiento medio más precisa que, si se aplicara sistemáticamente cada año, daría como resultado el mismo valor final que las tasas de crecimiento variadas reales.
Análisis estadístico de datos sesgados
En la ciencia de datos, a menudo tratamos con conjuntos de datos que están sesgados positivamente debido a procesos multiplicativos, como los niveles de ingresos, las mediciones biológicas o determinados indicadores financieros. En estos casos, utilizar la media aritmética puede ser engañoso porque es sensible a los valores extremos (valores atípicos), que pueden distorsionar la representación de la tendencia central.
La media geométrica es especialmente útil cuando se trata de datos que siguen una distribución log-normal. He aquí por qué:
- Minimiza la influencia de los valores atípicos: La media geométrica reduce el impacto de los valores extremadamente altos o bajos, proporcionando un valor central más representativo para los datos sesgados.
- Maneja relaciones multiplicativas: Es adecuado para datos en los que los valores se combinan multiplicativamente en lugar de aditivamente.
Considera un conjunto de datos de ingresos familiares en una región donde la mayoría de los hogares ganan entre 30.000 y 60.000 $, pero unos pocos ganan más de 1 millón de $.
- Media aritmética de los ingresos: Esto se verá muy influido por los valores atípicos de ingresos elevados, lo que podría sugerir unos ingresos medios muy superiores a los que gana la mayoría de la gente.
- Ingresos medios geométricos: Así se obtiene un valor central que refleja la renta típica con mayor precisión, al minimizar la influencia de los valores extremos.
Al utilizar la media geométrica en estos casos, los científicos de datos pueden obtener una medida más precisa de la tendencia central, lo que permite obtener mejores perspectivas y análisis más fiables. Esto hace que la media geométrica sea una herramienta esencial cuando se trabaja con distribuciones de datos sesgadas en diversos campos.
Métricas de evaluación para conjuntos de datos desequilibrados
En las tareas de clasificación, a menudo nos encontramos con conjuntos de datos desequilibrados en los que algunos grupos están representados por un número de ejemplos mucho mayor que otros. En estos casos, las métricas de evaluación tradicionales, como la precisión, pueden ser engañosas. Aquí es donde la puntuación media geométrica, o media G, se convierte en una herramienta valiosa.
La media G es la raíz del producto de la sensibilidad por clases (recall). Para la clasificación binaria, es la raíz cuadrada del producto de la sensibilidad y la especificidad. Para los problemas multiclase, es una raíz superior del producto de la sensibilidad de cada clase.
G-Mean pretende equilibrar la precisión entre todas las clases, por lo que resulta especialmente útil para conjuntos de datos desequilibrados. Sin embargo, es importante tener en cuenta que la Media-G es indefinida cuando cualquier clase tiene sensibilidad cero, lo que limita su aplicabilidad en escenarios de desequilibrio extremo. En la práctica, pueden utilizarse versiones modificadas o métricas alternativas para abordar esta limitación.
Para saber más sobre cómo se aplican la media geométrica y otras medidas estadísticas en el aprendizaje automático, considera explorar nuestra trayectoria profesional de Científico de Aprendizaje Automático con Python, que ofrece una lección en profundidad que cubre conceptos y técnicas esenciales de aprendizaje automático, con conocimientos prácticos y experiencia práctica.
Conviértete en un Científico ML
Media geométrica vs. Otros medios
Al analizar los datos, el tipo de media que elijas influirá en la representación e interpretación de tus resultados. La media aritmética, la media geométrica y la media armónica son tres tipos diferentes de medias, cada una adecuada para tipos de datos y contextos específicos. Comprender las diferencias entre ellas ayuda a seleccionar la medida adecuada para tu conjunto de datos.
Media geométrica frente a media aritmética
La media aritmética es la media más utilizada y se calcula sumando todos los números de un conjunto de datos y dividiéndolos por el recuento de números. Es el más adecuado para procesos aditivos en los que los valores se combinan mediante adición. Es adecuado para conjuntos de datos que no contengan valores atípicos extremos ni distribuciones sesgadas. Esta media se utiliza habitualmente en el cálculo de puntuaciones medias, temperaturas y otras cantidades en las que los valores se suman para formar un total.
En cambio, la media geométrica es ideal para procesos multiplicativos en los que los valores se interrelacionan multiplicativamente. Es adecuado para analizar tasas de crecimiento, porcentajes y ratios. La media geométrica se utiliza a menudo en cálculos financieros como las tasas medias de rendimiento, las tasas de crecimiento biológico y los escenarios que implican la capitalización, ya que tiene en cuenta con precisión los efectos del crecimiento exponencial o la decadencia.
Media geométrica frente a media armónica
La media armónica se calcula como el recíproco de la media aritmética de los recíprocos de los valores de los datos. Es especialmente útil cuando se trata de datos que son tasas o proporciones, y cuando los valores más pequeños necesitan más énfasis. La media armónica se aplica mejor en situaciones en las que los puntos de datos se definen en relación con alguna unidad (como el tiempo o la distancia), y quieres encontrar una tasa media.
Por ejemplo, la media armónica es ideal para calcular velocidades medias cuando se recorre la misma distancia a distintas velocidades. Como el tiempo varía inversamente con la velocidad, la media armónica tiene en cuenta con precisión el tiempo empleado en viajar a cada velocidad, dando una media real. Enfatiza la influencia de los valores más bajos, asegurando que las velocidades más lentas (que requieren más tiempo) tengan un mayor impacto en la velocidad media global.
En cambio, mientras que la media geométrica maneja relaciones multiplicativas y es adecuada para tasas de crecimiento y cambios proporcionales, la media armónica se centra en tasas y ratios en las que la relación recíproca es clave.
Aspectos a tener en cuenta con la media geométrica
Al decidir si utilizar la media geométrica para analizar los datos, es importante comprender tanto sus ventajas como sus posibles limitaciones. La media geométrica es una herramienta potente para determinados tipos de datos, pero puede no ser adecuada en todas las situaciones.
Ventajas de la media geométrica
- Lo mejor para conjuntos de datos multiplicativos: La media geométrica es ideal para datos que implican procesos multiplicativos, como tasas de crecimiento, porcentajes, ratios e índices. Capta con precisión el efecto compuesto de los cambios a lo largo del tiempo o a través de distintos factores.
- Mitiga el impacto de los valores atípicos: Comparada con la media aritmética, la media geométrica reduce la influencia de valores extremadamente grandes (valores atípicos) en un conjunto de datos. Esto hace que sea una mejor medida de la tendencia central para distribuciones de datos sesgadas, especialmente cuando los datos están sesgados positivamente debido a unos pocos valores grandes.
Limitaciones de la media geométrica
- No se pueden manejar números negativos o valores cero: La media geométrica sólo está definida para números reales positivos. No puede calcularse si algún valor del conjunto de datos es cero o negativo, porque implica sacar raíces del producto de los valores, y el logaritmo de cero o de un número negativo no está definido en el sistema de números reales.
- Puede no ser intuitivo para todos los conjuntos de datos: En algunos contextos, la media geométrica puede no proporcionar una medida de tendencia central fácilmente interpretable, especialmente para conjuntos de datos que no implican relaciones multiplicativas. Para procesos aditivos o datos en los que los valores se combinan mediante sumas, la media aritmética puede ser más intuitiva y adecuada.
Sensibilidad a los valores extremos
Para entender cómo la media geométrica trata los valores atípicos de forma diferente a la media aritmética, comparemos dos conjuntos de datos de rentabilidad de las inversiones a lo largo de cinco años: Conjunto A con rendimientos del 5%, 7%, 9%, 6% y 8%, y Conjunto B con un rendimiento extremo del 50% en el último año.
- Media aritmética
- Conjunto A: 7% de rendimiento medio.
- Conjunto B: El elevado rendimiento del 50% infla la media hasta el 15,4%, demostrando cómo las medias aritméticas se ven fácilmente sesgadas por los valores atípicos.
- Media geométrica
- Conjunto A: Tasa media de crecimiento del 6,83%.
- Conjunto B: El rendimiento extremo eleva la media de forma más moderada hasta el 14,84%, lo que demuestra la capacidad de la media geométrica para equilibrar los valores extremos haciendo hincapié en el crecimiento constante.
Puede parecer pequeña, pero en el análisis financiero, esta diferencia es grande. A diferencia de la media aritmética, que puede exagerar las medias cuando hay valores atípicos, la media geométrica proporciona una tasa de crecimiento equilibrada que respeta los efectos compuestos.
Conclusión: Por qué es importante la media geométrica
Espero que después de leer esto aprecies la media geométrica, que es especialmente valiosa en campos que tratan con relaciones multiplicativas y efectos compuestos. Como has visto, puede representar con precisión la tendencia central en escenarios que implican tasas, proporciones y crecimiento exponencial, y esta característica la distingue de la media aritmética. Esto hace que sea importante en finanzas a la hora de calcular los rendimientos de las inversiones, en biología al considerar el análisis del crecimiento de la población, y en la ciencia de datos en general, siempre que tengamos que manejar conjuntos de datos sesgados y evaluar modelos de aprendizaje automático en datos desequilibrados.
Inscríbete en nuestro itinerario profesional de Científico de Aprendizaje Automático con Python para seguir aprendiendo y conseguir un puesto en los apasionantes campos de la ciencia de datos y el aprendizaje automático.
Como profesional experto en Ciencia de Datos, Aprendizaje Automático e IA Generativa, Vinod se dedica a compartir conocimientos y a capacitar a los aspirantes a científicos de datos para que tengan éxito en este dinámico campo.
Preguntas frecuentes sobre la media geométrica
¿Cuál es la definición más sencilla de media geométrica?
La media geométrica es la raíz enésima del producto de n números.
¿En qué se diferencia la media geométrica de la media aritmética?
Mientras que la media aritmética se calcula sumando números y dividiendo por la cuenta, la media geométrica se calcula multiplicando números y tomando la enésima raíz.
¿Cuándo debo utilizar la media geométrica en lugar de la media aritmética?
Utiliza la media geométrica cuando se trate de ratios, porcentajes o tasas de crecimiento, especialmente a lo largo de varios periodos. Es especialmente útil para conjuntos de datos con crecimiento o decrecimiento exponencial.
¿Se puede utilizar la media geométrica con números negativos?
No, la media geométrica sólo está definida para los números reales positivos. No puede calcularse si algún valor del conjunto de datos es cero o negativo, porque implica sacar raíces del producto de los valores.
¿Qué relación hay entre la media geométrica y los logaritmos?
La media geométrica puede calcularse utilizando logaritmos, lo que resulta especialmente útil para grandes conjuntos de datos o cuando se trata de números muy grandes. Tomando el logaritmo de cada número, calculando su media aritmética y, a continuación, tomando el antilogo del resultado, puedes obtener la media geométrica.
¿Cómo gestiona la media geométrica los valores atípicos en comparación con la media aritmética?
La media geométrica es menos sensible a los valores extremos o atípicos que la media aritmética. Tiende a amortiguar el efecto de los valores muy grandes, lo que la convierte en una medida de tendencia central más robusta para las distribuciones de datos sesgadas, especialmente las que tienen asimetría positiva.
Aprende con DataCamp
curso
Introduction to Data Visualization with ggplot2
curso
Introduction to Statistics
blog
ROI de la Ciencia de Datos: Cómo calcularlo y maximizarlo
blog
11 técnicas de visualización de datos para cada caso de uso con ejemplos
tutorial
Comprender la asimetría y la curtosis y cómo trazarlas
tutorial
Tutorial de cálculo de Power BI
tutorial
Prueba Chi-cuadrado en hojas de cálculo
Avinash Navlani
10 min
tutorial