Accéder au contenu principal

Moyenne géométrique : Une mesure de la croissance et de l'effet d'entraînement

Découvrez la puissance de la moyenne géométrique en finance, en biologie et en science des données. Découvrez comment le calculer, quand l'utiliser et pourquoi il est utile pour analyser les taux de croissance.
Actualisé 14 févr. 2025  · 8 min de lecture

Vous est-il déjà arrivé de calculer la moyenne des rendements annuels de vos investissements et de constater que votre rendement global réel ne correspondait pas tout à fait à cette moyenne ? Ce scénario courant en finance souligne l'importance de comprendre et d'appliquer la moyenne géométrique - une mesure utile qui s'avère souvent plus appropriée que la moyenne arithmétique largement utilisée lorsqu'il s'agit de taux de changement et d'effets composés.

Dans ce tutoriel, nous allons explorer le concept de moyenne géométrique et son rôle dans l'analyse des données, en particulier dans des domaines tels que la finance, la biologie et la science des données. Nous examinerons également les scénarios dans lesquels elle est plus performante que d'autres mesures de la tendance centrale.

Qu'est-ce que la moyenne géométrique ?

La moyenne géométrique est un type de moyenne particulièrement utile lorsque l'on travaille avec des ensembles de nombres positifs, notamment ceux qui impliquent une multiplication ou une croissance exponentielle. Contrairement à la moyenne arithmétique, plus courante, qui additionne les nombres et les divise par le nombre, la moyenne géométrique est particulièrement adaptée au traitement d'ensembles de données impliquant des relations multiplicatives ou une croissance exponentielle.

Voici quelques-uns des domaines dans lesquels la moyenne géométrique est utile :

  1. Finance: Il est couramment utilisé pour calculer les taux de rendement moyens sur plusieurs périodes. Contrairement à la moyenne arithmétique, la moyenne géométrique tient compte de la capitalisation, ce qui la rend plus précise pour les calculs financiers.
  2. Biologie: Dans les études sur la croissance démographique, la moyenne géométrique est utilisée pour calculer les taux de croissance moyens dans le temps.
  3. Géométrie: L'un de ses aspects les plus élégants se trouve dans les triangles droits, où l'altitude de l'hypoténuse incarne la moyenne géométrique des segments qu'elle crée sur cette hypoténuse. En outre, la moyenne géométrique représente la longueur du côté d'un carré qui aurait la même surface qu'un rectangle donné, ce qui permet de "quadriller" les surfaces rectangulaires.

Comme vous pouvez le constater, la moyenne géométrique est un outil précieux pour les calculs quotidiens, mais aussi pour des concepts mathématiques plus abstraits.

Comment calculer la moyenne géométrique

Il existe plusieurs méthodes pour calculer la moyenne géométrique, chacune ayant ses propres avantages en fonction de la situation.

La formule de la moyenne géométrique

La façon la plus simple de calculer la moyenne géométrique est d'utiliser la formule standard : 

Ici, x₁, x₂, ..., xₙ sont les nombres positifs de l'ensemble de données, et n est le nombre de nombres. Pour obtenir la moyenne géométrique, nous multiplions toutes les valeurs et prenons la racine nième du produit, où n est le nombre de valeurs. Voyons cela à travers un exemple. Considérez les nombres 2, 4 et 8. Trouver leur moyenne géométrique :

  1. Multipliez les chiffres : 2 * 4 * 8 = 64
  2. Prenez la racine cubique (puisqu'il y a 3 nombres) : ∛64 ≈ 4

La moyenne géométrique de 2, 4 et 8 est 4. Ce résultat nous indique que si nous avions trois nombres égaux, chacun égal à 4, leur produit serait le même que le produit des nombres initiaux. Essentiellement, 4 est le facteur de croissance cohérent pour les trois valeurs.

Calcul de la moyenne géométrique par addition des logarithmes

Pour les ensembles de données plus importants ou pour éviter les erreurs de débordement lorsque l'on traite de très grands nombres, nous pouvons utiliser des logarithmes. Cette méthode simplifie la multiplication en addition et rend les calculs plus faciles à gérer. Ici, nous prenons d'abord le logarithme de chaque nombre, nous calculons la moyenne arithmétique de ces logarithmes, puis nous prenons l'antilog (exponentielle) de cette moyenne. Reprenons l'exemple précédent. 

  1. Prenez des logarithmes (base 10) : log(2) ≈ 0.3010, log(4) ≈ 0.6021, log(8) ≈ 0.9031
  2. Calculez la moyenne arithmétique : (0.3010 + 0.6021 + 0.9031) / 3 ≈ 0.6021
  3. Prenez l'antilog : (10^x) = 10^0.6021 ≈ 4

Cette méthode nous donne le même résultat que la méthode de calcul direct. Vous pouvez utiliser des logarithmes de n'importe quelle base (tels que les logarithmes naturels de base e), à condition d'utiliser la même base tout au long du calcul. La moyenne géométrique finale sera la même.

Moyenne géométrique dans la science des données et l'apprentissage automatique

La moyenne géométrique est une mesure statistique utile qui a plusieurs applications importantes en science des données et en apprentissage automatique. Voici trois cas d'utilisation clés où la moyenne géométrique s'avère précieuse. 

Taux de croissance et analyse des séries chronologiques

En science des données, nous analysons souvent les taux de croissance au fil du temps, comme dans la dynamique des populations, les tendances du marché ou les taux d'adoption par les utilisateurs. La moyenne géométrique est idéale pour ces situations, car elle rend compte avec précision de la nature composée de la croissance. Contrairement à la moyenne arithmétique, qui se contente de faire la moyenne des taux sans tenir compte de la façon dont la croissance de chaque année s'ajoute à celle de la précédente, la moyenne géométrique tient compte de cet effet de composition.

Imaginez que vous analysiez le taux de croissance annuel de la base d'utilisateurs d'une startup sur cinq ans : 20 %, 15 %, 25 %, 10 % et 30 %. Si la moyenne arithmétique (20 %) peut sembler une solution rapide, elle ne tient pas compte de l'effet de composition. La moyenne géométrique ((1,20 * 1,15 * 1,25 * 1,10 * 1,30)^(1/5) - 1 ≈ 19,77%) fournit un taux de croissance moyen plus précis qui, s'il était appliqué de manière cohérente chaque année, donnerait la même valeur finale que les différents taux de croissance réels.

Analyse statistique des données asymétriques

En science des données, nous avons souvent affaire à des ensembles de données qui sont positivement asymétriques en raison de processus multiplicatifs, tels que les niveaux de revenus, les mesures biologiques ou certains indicateurs financiers. Dans ce cas, l'utilisation de la moyenne arithmétique peut être trompeuse car elle est sensible aux valeurs extrêmes (aberrations), qui peuvent fausser la représentation de la tendance centrale.

La moyenne géométrique est particulièrement utile lorsqu'il s'agit de données qui suivent une distribution log-normale. Voici pourquoi :

  • Minimise l'influence des valeurs aberrantes : La moyenne géométrique réduit l'impact des valeurs extrêmement élevées ou faibles et fournit une valeur centrale plus représentative pour les données asymétriques.
  • Gère les relations multiplicatives : Elle est appropriée pour les données où les valeurs sont combinées de manière multiplicative plutôt qu'additive.

Considérez un ensemble de données sur les revenus des ménages dans une région où la plupart des ménages gagnent entre 30 000 et 60 000 dollars, mais où quelques-uns gagnent plus d'un million de dollars.

  • Moyenne arithmétique des revenus : Ce chiffre sera fortement influencé par les valeurs aberrantes des hauts revenus, ce qui pourrait suggérer un revenu moyen beaucoup plus élevé que celui de la plupart des gens.
  • Moyenne géométrique des revenus : On obtient ainsi une valeur centrale qui reflète plus précisément le revenu type en minimisant l'influence des valeurs extrêmes.

En utilisant la moyenne géométrique dans de tels cas, les scientifiques des données peuvent obtenir une mesure plus précise de la tendance centrale, ce qui permet d'obtenir de meilleures informations et des analyses plus fiables. La moyenne géométrique est donc un outil essentiel lorsque l'on travaille avec des distributions de données asymétriques dans différents domaines.

Mesures d'évaluation pour les ensembles de données déséquilibrés

Dans les tâches de classification, nous rencontrons souvent des ensembles de données déséquilibrés où certains groupes sont représentés par un nombre beaucoup plus important d'exemples que d'autres. Dans ce cas, les mesures d'évaluation traditionnelles telles que la précision peuvent être trompeuses. C'est là que la moyenne géométrique, ou G-Mean, devient un outil précieux.

La moyenne G est la racine du produit de la sensibilité par classe (rappel). Pour la classification binaire, c'est la racine carrée du produit de la sensibilité et de la spécificité. Pour les problèmes multi-classes, il s'agit d'une racine supérieure du produit de la sensibilité pour chaque classe.

G-Mean vise à équilibrer la précision entre toutes les classes, ce qui le rend particulièrement utile pour les ensembles de données déséquilibrés. Cependant, il est important de noter que le G-Mean n'est pas défini lorsqu'une classe a une sensibilité nulle, ce qui limite son applicabilité dans les scénarios de déséquilibre extrême. Dans la pratique, des versions modifiées ou des mesures alternatives peuvent être utilisées pour remédier à cette limitation.

Pour en savoir plus sur la façon dont la moyenne géométrique et d'autres mesures statistiques sont appliquées dans l'apprentissage automatique, envisagez d'explorer notre piste de carrière Machine Learning Scientist with Python, qui offre des cours approfondis qui couvrent les concepts et les techniques essentiels de l'apprentissage automatique, avec des aperçus pratiques et une expérience concrète.

Devenez un scientifique ML

Améliorez vos connaissances en Python pour devenir un scientifique spécialisé dans l'apprentissage automatique.
Commencez à apprendre gratuitement

Moyenne géométrique vs. Autres moyens

Lorsque vous analysez des données, le type de moyenne que vous choisissez a un impact sur la représentation et l'interprétation de vos résultats. La moyenne arithmétique, la moyenne géométrique et la moyenne harmonique sont trois types de moyennes différentes, chacune adaptée à des types de données et à des contextes spécifiques. Comprendre les différences entre elles permet de sélectionner la bonne mesure pour votre ensemble de données.

Moyenne géométrique et moyenne arithmétique

La moyenne arithmétique est la moyenne la plus couramment utilisée. Elle est calculée en additionnant tous les nombres d'un ensemble de données et en les divisant par le nombre de nombres. Il convient mieux aux processus additifs où les valeurs sont combinées par addition. Il convient aux ensembles de données qui ne contiennent pas de valeurs aberrantes extrêmes ou de distributions asymétriques. Cette moyenne est couramment utilisée pour calculer la moyenne des scores, des températures et d'autres quantités dont les valeurs s'additionnent pour former un total.

En revanche, la moyenne géométrique est idéale pour les processus multiplicatifs où les valeurs sont reliées entre elles de manière multiplicative. Il permet d'analyser les taux de croissance, les pourcentages et les ratios. La moyenne géométrique est souvent utilisée dans les calculs financiers tels que les taux de rendement moyens, les taux de croissance biologique et les scénarios impliquant la capitalisation, car elle tient compte avec précision des effets de la croissance ou de la décroissance exponentielle.

Moyenne géométrique ou moyenne harmonique

La moyenne harmonique est calculée comme la réciproque de la moyenne arithmétique des réciproques des valeurs des données. Elle est particulièrement utile lorsqu'il s'agit de données qui sont des taux ou des ratios, et lorsque des valeurs plus petites doivent être mises en évidence. La moyenne harmonique s'applique le mieux dans les situations où les points de données sont définis par rapport à une unité (comme le temps ou la distance) et où vous souhaitez trouver un taux moyen.

Par exemple, la moyenne harmonique est idéale pour calculer les vitesses moyennes lorsque l'on parcourt la même distance à des vitesses différentes. Comme le temps varie inversement à la vitesse, la moyenne harmonique tient compte avec précision du temps passé à voyager à chaque vitesse, ce qui donne une véritable moyenne. Il met l'accent sur l'influence des valeurs les plus basses, en veillant à ce que les vitesses plus lentes (qui prennent plus de temps) aient un impact plus important sur la vitesse moyenne globale.

En revanche, alors que la moyenne géométrique traite les relations multiplicatives et convient aux taux de croissance et aux changements proportionnels, la moyenne harmonique se concentre sur les taux et les rapports où la relation réciproque est essentielle. 

Éléments à prendre en compte pour la moyenne géométrique

Lorsque vous décidez d'utiliser la moyenne géométrique pour analyser des données, il est important de comprendre ses avantages et ses limites potentielles. La moyenne géométrique est un outil puissant pour certains types de données, mais elle n'est pas forcément appropriée dans toutes les situations.

Avantages de la moyenne géométrique

  • Meilleur pour les ensembles de données multiplicatives: La moyenne géométrique est idéale pour les données qui impliquent des processus multiplicatifs, tels que les taux de croissance, les pourcentages, les ratios et les indices. Il saisit avec précision l'effet composé des changements au fil du temps ou entre différents facteurs.
  • Atténue l'impact des valeurs aberrantes : Par rapport à la moyenne arithmétique, la moyenne géométrique réduit l'influence des valeurs extrêmement élevées (valeurs aberrantes) dans un ensemble de données. Cela en fait une meilleure mesure de la tendance centrale pour les distributions de données asymétriques, en particulier lorsque les données sont positivement asymétriques en raison de quelques grandes valeurs.

Limites de la moyenne géométrique

  • Impossible de traiter des nombres négatifs ou des valeurs nulles: La moyenne géométrique n'est définie que pour les nombres réels positifs. Il ne peut pas être calculé si l'une des valeurs de l'ensemble de données est nulle ou négative, car cela implique de prendre les racines du produit des valeurs, et le logarithme de zéro ou d'un nombre négatif n'est pas défini dans le système des nombres réels.
  • Peut ne pas être intuitif pour tous les ensembles de données : Dans certains contextes, la moyenne géométrique peut ne pas constituer une mesure facilement interprétable de la tendance centrale, en particulier pour les ensembles de données qui n'impliquent pas de relations multiplicatives. Pour les processus additifs ou les données où les valeurs sont combinées par addition, la moyenne arithmétique peut être plus intuitive et appropriée.

Sensibilité aux valeurs extrêmes

Pour comprendre comment la moyenne géométrique traite les valeurs aberrantes différemment de la moyenne arithmétique, comparons deux ensembles de données sur le rendement des investissements sur cinq ans : L'ensemble A avec des rendements de 5 %, 7 %, 9 %, 6 % et 8 %, et l'ensemble B avec un rendement extrême de 50 % la dernière année.

  • Moyenne arithmétique
    • Ensemble A : Rendement moyen de 7 %.
    • Ensemble B : Le rendement élevé de 50 % gonfle la moyenne à 15,4 %, ce qui montre que les moyennes arithmétiques sont facilement faussées par des valeurs aberrantes.
  • Moyenne géométrique
    • Ensemble A : Taux de croissance moyen de 6,83%.
    • Ensemble B : Le rendement extrême augmente la moyenne de façon plus modérée à 14,84%, ce qui montre la capacité de la moyenne géométrique à équilibrer les valeurs extrêmes en mettant l'accent sur une croissance constante.

Cette différence peut sembler minime, mais en analyse financière, elle est considérable. Contrairement à la moyenne arithmétique, qui peut exagérer les moyennes en présence de valeurs aberrantes, la moyenne géométrique fournit un taux de croissance équilibré qui respecte les effets de composition. 

Conclusion : L'importance de la moyenne géométrique

J'espère qu'à l'issue de cette lecture, vous apprécierez la moyenne géométrique, qui est particulièrement utile dans les domaines traitant des relations multiplicatives et des effets de composition. Comme vous l'avez vu, elle peut représenter avec précision la tendance centrale dans des scénarios impliquant des taux, des ratios et une croissance exponentielle, et cette caractéristique la distingue de la moyenne arithmétique. C'est pourquoi elle est importante en finance pour le calcul du rendement des investissements, en biologie pour l'analyse de la croissance démographique et, plus généralement, en science des données, chaque fois qu'il s'agit de traiter des ensembles de données asymétriques et d'évaluer des modèles d'apprentissage automatique sur des données déséquilibrées.

Inscrivez-vous à notre cursus de carrière Machine Learning Scientist with Python pour continuer à apprendre et vous décrocher un rôle dans les domaines passionnants de la science des données et de l'apprentissage automatique. 


Vinod Chugani's photo
Author
Vinod Chugani
LinkedIn

En tant que professionnel de la science des données, de l'apprentissage automatique et de l'IA générative, Vinod se consacre au partage des connaissances et à l'autonomisation des scientifiques des données en herbe pour qu'ils réussissent dans ce domaine dynamique.

Moyenne géométrique FAQ

Quelle est la définition la plus simple de la moyenne géométrique ?

La moyenne géométrique est la racine nième du produit de n nombres.

En quoi la moyenne géométrique diffère-t-elle de la moyenne arithmétique ?

Alors que la moyenne arithmétique est calculée en additionnant des nombres et en les divisant par le nombre, la moyenne géométrique est calculée en multipliant des nombres et en prenant la racine nième.

Quand dois-je utiliser la moyenne géométrique au lieu de la moyenne arithmétique ?

Utilisez la moyenne géométrique lorsque vous traitez de ratios, de pourcentages ou de taux de croissance, en particulier sur plusieurs périodes. Elle est particulièrement utile pour les ensembles de données présentant une croissance ou une décroissance exponentielle.

La moyenne géométrique peut-elle être utilisée avec des nombres négatifs ?

Non, la moyenne géométrique n'est définie que pour les nombres réels positifs. Elle ne peut pas être calculée si l'une des valeurs de l'ensemble de données est nulle ou négative, car elle implique de prendre les racines du produit des valeurs.

Quelle est la relation entre la moyenne géométrique et les logarithmes ?

La moyenne géométrique peut être calculée à l'aide de logarithmes, ce qui est particulièrement utile pour les grands ensembles de données ou lorsque l'on traite de très grands nombres. En prenant le logarithme de chaque nombre, en calculant leur moyenne arithmétique, puis en prenant l'antilog du résultat, vous pouvez obtenir la moyenne géométrique.

Comment la moyenne géométrique traite-t-elle les valeurs aberrantes par rapport à la moyenne arithmétique ?

La moyenne géométrique est moins sensible aux valeurs extrêmes ou aberrantes que la moyenne arithmétique. Elle tend à atténuer l'effet des valeurs très élevées, ce qui en fait une mesure plus robuste de la tendance centrale pour les distributions de données asymétriques, en particulier celles qui présentent une asymétrie positive.

Sujets

Apprenez avec DataCamp

Certification disponible

cours

Analyse de données exploratoires en Python

4 hr
53.1K
Apprenez à explorer, visualiser et extraire des informations des données à l'aide de l'analyse exploratoire des données (AED) en Python.
Afficher les détailsRight Arrow
Commencer le cours
Voir plusRight Arrow