Accéder au contenu principal

Propagation des erreurs : Comprendre comment l'incertitude se propage à travers les calculs

Comprenez comment les incertitudes dans les mesures affectent les résultats calculés et apprenez les formules et les méthodes permettant de les quantifier à travers diverses opérations mathématiques.
Actualisé 5 nov. 2025  · 9 min de lecture

Lorsque nous effectuons des calculs à partir de valeurs mesurées, nous travaillons avec des incertitudes. Chaque mesure comporte une certaine incertitude, souvent exprimée sous forme d'erreur absolue ou relative. Ces incertitudes ne disparaissent pas simplement lorsque nous utilisons des mesures dans des calculs ; au contraire, elles se combinent et peuvent s'amplifier en fonction des opérations mathématiques effectuées. 

La propagation des erreurs, également appelée propagation de l'incertitude, est le processus qui consiste à déterminer comment les incertitudes liées aux variables mesurées affectent l'incertitude d'un résultat calculé.

Dans ce tutoriel, nous examinerons les règles mathématiques qui régissent la propagation des incertitudes à travers différentes opérations et explorerons les méthodes permettant de quantifier l'incertitude. Nous examinerons des exemples pratiques illustrant comment calculer les incertitudes dans des scénarios réels, depuis les opérations arithmétiques simples jusqu'aux fonctions complexes impliquant la corrélation et des techniques de simulation avancées.

Concepts clés dans la propagation des erreurs

Avant d'aborder les règles mathématiques, examinons quelques concepts liés à la propagation des erreurs :

  • L'erreur absolue représente l'écart réel par rapport à la valeur réelle, exprimé dans les mêmes unités que la mesure. Si nous mesurons une longueur de 10,0 ± 0,2 cm, l'erreur absolue est de 0,2 cm.
  • L'erreur relative exprime l'incertitude sous forme de fraction ou de pourcentage de la valeur mesurée. Pour notre mesure de longueur, l'erreur relative serait de 0,2/10,0 = 0,02, soit 2 %.
  • L'écart type est notre principale mesure de l'incertitude dans la plupart des contextes scientifiques, représentant la dispersion des valeurs autour de la moyenne. Lorsque nous exprimons une mesure sous la forme x ± σ, le σ représente un écart type.
  • L'de la variance correspond au carré de l'écart type. Les variances des variables aléatoires indépendantes s'additionnent directement, une propriété qui simplifie de nombreux calculs.
  • La covariance mesure la façon dont deux variables évoluent l'une par rapport à l'autre. Lorsque les incertitudes sont corrélées, il est nécessaire d'inclure des termes de covariance dans nos formules de propagation afin d'obtenir des résultats précis.

Il est également important de comprendre la différence entre les incertitudes indépendantes et corrélées. Les incertitudes indépendantes proviennent de sources distinctes et sans rapport entre elles, telles que les erreurs de lecture de différents instruments. Les incertitudes corrélées partagent une source commune, telle que l'utilisation de la même norme d'étalonnage pour plusieurs mesures.

Bien que ce tutoriel se concentre sur les erreurs aléatoires qui suivent des modèles statistiques, il convient de noter que les erreurs systématiques (biais constants) nécessitent un traitement différent.

Règles mathématiques pour la propagation des erreurs

La propagation de l'incertitude suit des règles spécifiques qui dépendent de l'opération mathématique. Examinons chacune de ces opérations :

Addition et soustraction

Lorsqu'on additionne ou soustrait des mesures comportant des incertitudes, on additionne les incertitudes absolues en quadrature (racine carrée de la somme des carrés) pour obtenir les écarts types.

Pour z = x ± y, où x a une incertitude σₓ et y a une incertitude σᵧ :

σz = √(σₓ² + σᵧ²)

Prenons un exemple où nous mesurons la longueur totale de deux tiges. La tige A mesure 15,3 ± 0,2 cm et la tige B mesure 8,7 ± 0,1 cm. La longueur totale est de :

Length = 15.3 + 8.7 = 24.0 cm
Uncertainty = √(0.2² + 0.1²) = √(0.04 + 0.01) = √0.05 = 0.22 cm

Par conséquent, la longueur totale est de 24,0 ± 0,22 cm.

Multiplication et division

Pour la multiplication et la division, nous travaillons avec des incertitudes relatives. L'incertitude relative du résultat est égale à la somme en quadrature des incertitudes relatives des données d'entrée.

Pour z = xy ou z = x/y :

(σz/z)² = (σₓ/x)² + (σᵧ/y)²

Supposons que nous souhaitions calculer l'aire d'un rectangle dont la longueur est de 5,0 ± 0,1 m et la largeur de 3,0 ± 0,05 m.

Area = 5.0 × 3.0 = 15.0 m²
Relative uncertainty in length = 0.1/5.0 = 0.02
Relative uncertainty in width = 0.05/3.0 = 0.0167
Relative uncertainty in area = √(0.02² + 0.0167²) = √(0.0004 + 0.000278) = 0.026
Absolute uncertainty in area = 15.0 × 0.026 = 0.39 m²

Par conséquent, la superficie est de 15,0 ± 0,39 m².

Pouvoirs et racines

Lorsqu'on élève une mesure à une puissance n, l'incertitude relative est multipliée par la valeur absolue de la puissance.

Pour z = xⁿ :

σz/z = |n| × (σₓ/x)

Considérons un scénario dans lequel nous mesurons le rayon d'une sphère à 2,5 ± 0,05 cm et souhaitons calculer son volume à l'aide de la formule V = (4/3)πr³.

Volume = (4/3)π(2.5)³ = 65.45 cm³
Relative uncertainty in radius = 0.05/2.5 = 0.02
Relative uncertainty in volume = 3 × 0.02 = 0.06
Absolute uncertainty in volume = 65.45 × 0.06 = 3.93 cm³

Par conséquent, le volume est de 65,5 ± 3,9 cm³.

Fonctions logarithmiques et exponentielles

Pour le logarithme naturel : 

If z = ln(x), then σz = σₓ/x

Pour les fonctions exponentielles : 

If z = eˣ, then σz/z = σₓ

Supposons que nous mesurions une valeur x = 10,0 ± 0,3 et que nous calculions y = ln(x).

y = ln(10.0) = 2.303
Uncertainty in y = 0.3/10.0 = 0.03

Par conséquent, ln(10,0) = 2,303 ± 0,030.

Maintenant que nous avons examiné les règles spécifiques à différentes opérations, nous allons comprendre les fondements mathématiques unifiés qui sous-tendent chacune d'entre elles.

Dérivation à l'aide du calcul différentiel

Pour développer votre intuition, considérez les dérivées partielles comme la réponse à la question suivante : Si je modifie légèrement cette entrée, dans quelle mesure ma sortie sera-t-elle affectée ? 

Cette sensibilité au changement est précisément ce dont nous avons besoin pour comprendre comment les incertitudes se propagent. Une dérivée partielle importante signifie que l'entrée influence fortement la sortie, de sorte que son incertitude contribue davantage à l'incertitude finale.

Commençons par les fondements mathématiques. Pour une fonction z = f(x, y), la différentielle totale nous indique :

dz = (∂f/∂x)dx + (∂f/∂y)dy

Lorsque nous interprétons dx et dy comme de petites incertitudes et que nous souhaitons déterminer la variance (σz²), nous élevons les deux côtés au carré et calculons la valeur attendue. 

Cela nous conduit à la formule générale de propagation des erreurs :

σz² = (∂f/∂x)² σₓ² + (∂f/∂y)² σᵧ² + 2(∂f/∂x)(∂f/∂y)σₓᵧ

Ici, σₓᵧ représente la covariance entre x et y. Pour les variables indépendantes, ce terme disparaît, ce qui nous donne la forme plus simple que nous utilisons habituellement.

Vérifions cette formule en dérivant notre règle de multiplication. 

Pour z = xy :

  • Dérivée partielle par rapport à x : ∂z/∂x = y
  • Dérivée partielle par rapport à y : ∂z/∂y = x

En substituant dans notre formule générale (en supposant que x et y sont indépendants) :

σz² = y²σₓ² + x²σᵧ²

En divisant les deux côtés par = (xy)²:

σz²/z² = σₓ²/x² + σᵧ²/y²

En calculant la racine carrée, nous obtenons :

(σz/z)² = (σₓ/x)² + (σᵧ/y)²

ce qui correspond exactement à notre règle de multiplication pour additionner les incertitudes relatives en quadrature.

Cette approche générale s'avère utile lorsqu'il s'agit de fonctions complexes auxquelles les règles mémorisées ne s'appliquent pas. 

Par exemple, si nous devons calculer l'incertitude dans z =x²sin(y) +exy, nous pouvons appliquer systématiquement des dérivées partielles plutôt que d'essayer de combiner plusieurs règles. La formule traite toute fonction différentiable, ce qui en fait notre outil le plus utile pour l'analyse d'incertitude dans les calculs complexes.

Corrélation et covariance dans la propagation des erreurs

Nos formules de propagation d'erreurs supposent jusqu'à présent que les incertitudes sont indépendantes, mais que se passe-t-il lorsqu'elles ne le sont pas ? 

La corrélation entre les incertitudes est plus fréquente que nous pourrions le penser et peut influencer considérablement nos résultats. Une corrélation apparaît lorsque les mesures partagent une source d'incertitude commune. 

Veuillez mesurer la longueur et la largeur d'un bloc métallique à l'aide de la même règle. Si cette règle est effectivement trop courte de 1 %, les deux mesures seront systématiquement affectées de la même manière et seront corrélées positivement. De même, si la température affecte plusieurs capteurs dans une expérience, toutes les mesures prises au même moment partagent cette influence environnementale.

Lorsqu'une mesure a tendance à être élevée tandis qu'une autre a tendance à être élevée (corrélation positive), ou lorsqu'une mesure a tendance à être élevée tandis qu'une autre a tendance à être faible (corrélation négative), il est nécessaire de tenir compte de cette relation dans nos calculs d'incertitude.

Lorsque les variables sont corrélées, nous introduisons le terme de covariance σₓᵧ dans notre formule de propagation. Pour deux variables corrélées avec un coefficient de corrélation ρ :

σₓᵧ = ρσₓσᵧ

La formule complète pour l'addition devient :

σz² = σₓ² + σᵧ² + 2ρσₓσᵧ

Nous comprendrons mieux ce concept à l'aide d'un exemple. 

Veuillez mesurer le périmètre d'une plaque métallique rectangulaire à une température élevée. Nous mesurons une longueur L = 10,0 ± 0,1 cm et une largeur W = 5,0 ± 0,05 cm. Le périmètre est P = 2L + 2W.

Sans tenir compte de la corrélation :

P = 2(10.0) + 2(5.0) = 30.0 cm
σₚ = √[(2 × 0.1)² + (2 × 0.05)²] = √[0.04 + 0.01] = 0.22 cm

Cependant, la dilatation thermique affecte les deux dimensions de manière similaire. Si nous déterminons que le coefficient de corrélation est ρ = 0,7 (forte corrélation positive) :

Covariance term: 2 × 2 × 2 × 0.7 × 0.1 × 0.05 = 0.028
σₚ = √[0.04 + 0.01 + 0.028] = √0.078 = 0.28 cm

En négligeant la corrélation, nous avons sous-estimé notre incertitude d'environ 25 %, une différence significative qui pourrait influencer nos conclusions.

Nous devrions inclure la covariance lorsque :

  • Plusieurs mesures utilisent le même instrument ou la même norme d'étalonnage.
  • Les conditions environnementales (température, pression, humidité) influencent simultanément toutes les mesures.
  • Les variables ont des relations physiques connues (telles que des dimensions qui s'étendent ensemble).

Nous pouvons omettre la covariance en toute sécurité lorsque les mesures sont véritablement indépendantes, lorsqu'elles sont prises avec des instruments différents, à des moments différents, ou lorsque la corrélation est négligeable par rapport à d'autres sources d'incertitude. En cas de doute, si des conditions changeantes affectent les deux mesures dans le même sens, elles sont probablement corrélées, et cela doit être pris en compte dans notre analyse.

Méthodes avancées pour gérer l'incertitude

Lorsque les fonctions impliquent une logique conditionnelle, des calculs itératifs oudes relations non linéaires complexes, la simulation de Monte Carlo constitue unealternative efficace.

Simulations de Monte-Carlo

La simulation de Monte Carlo adopte une approche directe : au lieu de propager les incertitudes à travers des formules, nous simulons des milliers de scénarios possibles et observons la distribution des résultats. 

Le processus est le suivant :

  1. Générer des échantillons aléatoires à partir de la distribution de chaque variable d'entrée.
  2. Veuillez calculer le résultat pour chaque ensemble d'échantillons.
  3. Veuillez analyser la distribution des résultats afin de déterminer le degré d'incertitude.

Vous pouvez apprendre à réaliser une simulation de Monte-Carlo dans Excel grâce à notre guide détaillé. Toutefois, pour que ce tutoriel soit complet, examinons à nouveau un scénario dans lequel les méthodes analytiques deviennent complexes. 

Considérons z =x²/y où x = 10,0 ± 0,5 et y = 2,0 ± 0,2. Bien que nous puissions utiliser des dérivées partielles, examinons une approche conceptuelle de la manière dont Monte Carlo traite cette question :

for each of 10,000 iterations:
   x_sample = random value from normal(mean=10.0, std=0.5)
   y_sample = random value from normal(mean=2.0, std=0.2)
   z_sample = x_sample² / y_sample
  
result = mean of all z_samples = 50.2
uncertainty = standard deviation of z_samples = 5.3

La beauté de cette approche réside dans le fait qu'elle :

  • Gère tous les types de distribution: Nos données n'ont pas besoin d'être distribuées normalement.
  • de gestion des corrélations naturelles: Vous vous souvenez de notre mesure de périmètre corrélée ? Monte Carlo peut générer directement des échantillons aléatoires corrélés.
  • s complètes sur l'image de sortie: Nous obtenons la distribution complète des résultats, révélant des asymétries ou des pics multiples que l'écart type seul ne permettrait pas de prendre en compte.
  • Fonctionne avec des logiques complexes: Les fonctions avec des conditions if/then ou des opérations min/max peuvent être gérées.

Dans quels cas est-il préférable d'opter pour la méthode Monte Carlo plutôt que pour des méthodes analytiques ? Nous pouvons envisager cette option lorsque :

  • Notre fonction implique des instructions conditionnelles ou des calculs itératifs.
  • Les variables suivent des distributions non normales (uniforme, exponentielle, etc.).
  • Nous avons besoin de la distribution complète des résultats, et pas seulement de son écart type.
  • L'approche analytique nécessite des dérivés complexes que nous ne sommes pas en mesure de calculer avec certitude.

Dans la pratique, 10 000 échantillons fournissent généralement de bonnes estimations pour la plupart des applications, tandis que 100 000 échantillons offrent une grande précision. Les ordinateurs modernes peuvent exécuter ces simulations en quelques secondes pour des fonctions simples.

Considérations informatiques

Pour les modèles nécessitant des calculs intensifs, tels que les simulations par éléments finis ou les modèles climatiques, où un seul calcul peut prendre des heures, les modèles de substitution sont particulièrement adaptés. 

Les modèles de substitution sont des fonctions mathématiques simplifiées qui reproduisent approximativement le comportement de modèles complexes. Il s'agit d'un substitut plus rapide qui capture les relations d'entrée-sortie du modèle original.

Cependant, pour la plupart des tâches d'analyse de données, la simulation Monte Carlo directe offre un équilibre idéal entre précision et simplicité.

Conclusion

Cet article a présenté la propagation des erreurs, le cadre mathématique permettant de comprendre comment les incertitudes dans les mesures affectent les résultats calculés. Nous avons appris les règles fondamentales de propagation des incertitudes à travers différentes opérations mathématiques, compris comment la corrélation entre les variables influe sur les calculs d'incertitude et exploré la simulation de Monte Carlo comme alternative computationnelle pour les scénarios complexes.

Pour approfondir vos compétences en matière de gestion de l'incertitude et d'analyse statistique dans des applications concrètes, nous vous invitons à explorer notrecursus Machine Learning Scientist with Python. Ce cursus aborde l'apprentissage supervisé et non supervisé, l'ingénierie des caractéristiques, l'analyse des séries chronologiques et l'apprentissage profond, où la compréhension de l'incertitude et l'analyse des erreurs deviennent importantes pour évaluer les performances des modèles, les intervalles de confiance et faire des prédictions fiables dans les projets de science des données.


Arunn Thevapalan's photo
Author
Arunn Thevapalan
LinkedIn
Twitter

En tant que data scientist senior, je conçois, développe et déploie des solutions d'apprentissage automatique à grande échelle pour aider les entreprises à prendre de meilleures décisions basées sur les données. En tant que rédacteur spécialisé dans la science des données, je partage mes apprentissages, mes conseils de carrière et des tutoriels pratiques approfondis.

Questions fréquentes

Lorsque j'ajoute des mesures comportant des incertitudes, dois-je ajouter directement les incertitudes ?

Non, vous les ajoutez en quadrature (racine carrée de la somme des carrés). Pour z = x + y, l'incertitude est σz = √(σₓ² +σᵧ²), et non σₓ + σᵧ.

Quelle opération mathématique amplifie le plus les incertitudes ?

Les pouvoirs et les racines peuvent considérablement amplifier les incertitudes. Pour z =xⁿ, l'incertitude relative est multipliée par |n|, de sorte que le cube d'une valeur triple son incertitude relative.

Quand est-il préférable d'utiliser une simulation de Monte Carlo plutôt que des formules analytiques ?

Veuillez utiliser Monte Carlo lorsque vous traitez avec une logique conditionnelle, des distributions non normales ou des fonctions non linéaires complexes. Il est également idéal lorsque vous avez besoin d'une distribution complète de la puissance.

Quand puis-je ignorer la corrélation entre les mesures ?

Il est possible de ne pas tenir compte de la corrélation lorsque les mesures sont effectuées à l'aide d'instruments différents, à des moments différents, ou lorsque la corrélation est négligeable par rapport à d'autres sources d'incertitude.

La corrélation augmente-t-elle toujours l'incertitude ?

Non, une corrélation positive augmente l'incertitude, mais une corrélation négative peut en réalité la réduire. L'effet dépend du signe et de l'amplitude du coefficient de corrélation.

Sujets

Apprenez avec DataCamp

Cours

Error and Uncertainty in Google Sheets

4 h
8.9K
Learn to distinguish real differences from random noise, and explore psychological crutches we use that interfere with our rational decision making.
Afficher les détailsRight Arrow
Commencer le cours
Voir plusRight Arrow