Curso
Quando fazemos cálculos com valores medidos, estamos lidando com incertezas. Toda medição tem um pouco de incerteza, que geralmente é mostrada como erro absoluto ou relativo. Essas incertezas não desaparecem simplesmente quando usamos medições nos cálculos; em vez disso, elas se combinam e podem se amplificar dependendo das operações matemáticas envolvidas.
A propagação de erros, também conhecida como propagação de incertezas, é o processo de determinar como as incertezas nas variáveis medidas afetam a incerteza em um resultado calculado.
Neste tutorial, vamos aprender sobre as regras matemáticas que controlam como as incertezas se espalham por diferentes operações e explorar métodos para quantificar a incerteza. Vamos trabalhar com exemplos práticos que mostram como calcular incertezas em cenários reais, desde aritmética simples até funções complexas que envolvem correlação e técnicas avançadas de simulação.
Conceitos-chave na propagação de erros
Antes de mergulhar nas regras matemáticas, vamos entender alguns conceitos por trás da propagação de erros:
- O erro absoluto mostra o desvio real do valor verdadeiro, expresso nas mesmas unidades da medição. Se medirmos um comprimento como 10,0 ± 0,2 cm, o erro absoluto é de 0,2 cm.
- O erro relativo mostra a incerteza como uma fração ou porcentagem do valor medido. Para a nossa medição de comprimento, o erro relativo seria 0,2/10,0 = 0,02 ou 2%.
- O desvio padrão é a nossa principal medida de incerteza na maioria dos contextos científicos, representando a dispersão dos valores em torno da média. Quando a gente fala de uma medida como x ± σ, o σ é um desvio padrão.
- A variância é o quadrado do desvio padrão. As variações das variáveis aleatórias independentes somam-se diretamente, uma propriedade que simplifica muitos cálculos.
- A covariância mede como duas variáveis mudam em relação uma à outra. Quando as incertezas estão relacionadas, a gente precisa incluir termos de covariância nas nossas fórmulas de propagação para conseguir resultados precisos.
Entender a diferença entre incertezas independentes e correlacionadas também é importante. As incertezas independentes vêm de fontes separadas e não relacionadas, como erros de leitura de diferentes instrumentos. As incertezas correlacionadas têm uma origem comum, como usar o mesmo padrão de calibração para várias medições.
Embora o foco deste tutorial seja erros aleatórios que seguem padrões estatísticos, vale a pena notar que erros sistemáticos (viéses consistentes) precisam de um tratamento diferente.
Regras matemáticas para a propagação de erros
A propagação da incerteza segue regras específicas dependendo da operação matemática. Vamos ver cada uma dessas operações:
Adição e subtração
Quando somamos ou tiramos medidas com incertezas, juntamos as incertezas absolutas em quadratura (a raiz quadrada da soma dos quadrados) para os desvios padrão.
Para z = x ± y, onde x tem incerteza σₓ e y tem incerteza σᵧ:
σz = √(σₓ² + σᵧ²)
Pense num exemplo em que medimos o comprimento total de duas hastes. A haste A mede 15,3 ± 0,2 cm e a haste B mede 8,7 ± 0,1 cm. O comprimento total é:
Length = 15.3 + 8.7 = 24.0 cm
Uncertainty = √(0.2² + 0.1²) = √(0.04 + 0.01) = √0.05 = 0.22 cm
Então, o comprimento total é de 24,0 ± 0,22 cm.
Multiplicação e divisão
Para multiplicação e divisão, a gente trabalha com incertezas relativas. A incerteza relativa do resultado é igual à soma quadrática das incertezas relativas das entradas.
Para z = xy ou z = x/y:
(σz/z)² = (σₓ/x)² + (σᵧ/y)²
Digamos que a gente queira calcular a área de um retângulo com comprimento de 5,0 ± 0,1 m e largura de 3,0 ± 0,05 m.
Area = 5.0 × 3.0 = 15.0 m²
Relative uncertainty in length = 0.1/5.0 = 0.02
Relative uncertainty in width = 0.05/3.0 = 0.0167
Relative uncertainty in area = √(0.02² + 0.0167²) = √(0.0004 + 0.000278) = 0.026
Absolute uncertainty in area = 15.0 × 0.026 = 0.39 m²
Então, a área é de 15,0 ± 0,39 m².
Poderes e raízes
Quando elevamos uma medição à potência n, a incerteza relativa é multiplicada pelo valor absoluto da potência.
Para z = xⁿ:
σz/z = |n| × (σₓ/x)
Imagina um cenário em que medimos o raio de uma esfera como 2,5 ± 0,05 cm e queremos calcular seu volume usando V = (4/3)πr³.
Volume = (4/3)π(2.5)³ = 65.45 cm³
Relative uncertainty in radius = 0.05/2.5 = 0.02
Relative uncertainty in volume = 3 × 0.02 = 0.06
Absolute uncertainty in volume = 65.45 × 0.06 = 3.93 cm³
Então, o volume é de 65,5 ± 3,9 cm³.
Funções logarítmicas e exponenciais
Para logaritmo natural:
If z = ln(x), then σz = σₓ/x
Para exponencial:
If z = eˣ, then σz/z = σₓ
Digamos que a gente mede um valor x = 10,0 ± 0,3 e calcula y = ln(x).
y = ln(10.0) = 2.303
Uncertainty in y = 0.3/10.0 = 0.03
Então, ln(10,0) = 2,303 ± 0,030.
Agora que já vimos as regras específicas para diferentes operações, vamos entender a base matemática unificada que está por trás de todas elas.
Derivação usando cálculo
Para desenvolver a intuição, pense nas derivadas parciais como respostas à pergunta: Se eu mudar essa entrada só um pouquinho, quanto minha saída vai mudar?
Essa sensibilidade à mudança é exatamente o que precisamos para entender como as incertezas se espalham. Uma derivada parcial grande significa que a entrada influencia fortemente a saída, portanto, sua incerteza contribui mais para a incerteza final.
Vamos começar com a base matemática. Para uma função z = f(x, y), o diferencial total nos diz:
dz = (∂f/∂x)dx + (∂f/∂y)dy
Quando a gente interpreta dx e dy como pequenas incertezas e quer achar a variância (σz²), a gente eleva ao quadrado os dois lados e pega o valor esperado.
Isso nos leva à fórmula geral de propagação de erros:
σz² = (∂f/∂x)² σₓ² + (∂f/∂y)² σᵧ² + 2(∂f/∂x)(∂f/∂y)σₓᵧ
Aqui, σₓᵧ representa a covariância entre x e y. Para variáveis independentes, esse termo desaparece, dando-nos a forma mais simples que normalmente usamos.
Vamos conferir essa fórmula derivando nossa regra de multiplicação.
Para z = xy:
- Derivada parcial em relação a x: ∂z/∂x = y
- Derivada parcial em relação a y: ∂z/∂y = x
Substituindo na nossa fórmula geral (supondo que x e y são independentes):
σz² = y²σₓ² + x²σᵧ²
Dividindo os dois lados porz² = (xy)²:
σz²/z² = σₓ²/x² + σᵧ²/y²
Calculando a raiz quadrada, temos:
(σz/z)² = (σₓ/x)² + (σᵧ/y)²
que é exatamente a nossa regra de multiplicação para somar incertezas relativas em quadratura.
Essa abordagem geral é útil quando a gente lida com funções complexas, onde as regras decoradas não funcionam.
Por exemplo, se precisarmos calcular a incerteza em z =x²sin(y) +exy, podemos aplicar derivadas parciais de forma sistemática, em vez de tentar combinar várias regras. A fórmula lida com qualquer função diferenciável, tornando-a nossa ferramenta mais útil para análise de incerteza em cálculos complexos.
Correlação e covariância na propagação de erros
Nossas fórmulas de propagação de erros até agora assumem que as incertezas são independentes, mas o que acontece quando elas não são?
A correlação entre incertezas é mais comum do que a gente imagina e pode afetar bastante nossos resultados. A correlação surge quando as medições têm uma fonte comum de incerteza.
Pense em medir o comprimento e a largura de um bloco de metal com a mesma régua. Se essa régua estiver realmente 1% mais curta, as duas medições vão ser afetadas da mesma maneira e vão ficar positivamente correlacionadas. Da mesma forma, se a temperatura afetar vários sensores em um experimento, todas as leituras feitas ao mesmo tempo vão ter essa influência do ambiente.
Quando uma medição tende a ser alta enquanto outra tende a ser alta (correlação positiva), ou quando uma tende a ser alta enquanto outra tende a ser baixa (correlação negativa), precisamos levar em conta essa relação nos nossos cálculos de incerteza.
Quando as variáveis estão correlacionadas, a gente coloca o termo de covariância σₓᵧ na nossa fórmula de propagação. Para duas variáveis correlacionadas com um coeficiente de correlação ρ:
σₓᵧ = ρσₓσᵧ
A fórmula completa para adição fica assim:
σz² = σₓ² + σᵧ² + 2ρσₓσᵧ
Vamos entender melhor esse conceito com um exemplo.
Vamos medir o perímetro de uma placa metálica retangular a uma temperatura elevada. Medimos o comprimento L = 10,0 ± 0,1 cm e a largura W = 5,0 ± 0,05 cm. O perímetro é P = 2L + 2W.
Sem pensar na correlação:
P = 2(10.0) + 2(5.0) = 30.0 cm
σₚ = √[(2 × 0.1)² + (2 × 0.05)²] = √[0.04 + 0.01] = 0.22 cm
Mas, a expansão térmica afeta as duas dimensões da mesma forma. Se a gente achar que o coeficiente de correlação é ρ = 0,7 (correlação positiva forte):
Covariance term: 2 × 2 × 2 × 0.7 × 0.1 × 0.05 = 0.028
σₚ = √[0.04 + 0.01 + 0.028] = √0.078 = 0.28 cm
Ignorar a correlação subestimou nossa incerteza em cerca de 25%, uma diferença significativa que poderia afetar nossas conclusões.
A gente deve incluir a covariância quando:
- Várias medições usam o mesmo instrumento ou padrão de calibração.
- As condições ambientais (temperatura, pressão, umidade) afetam todas as medições ao mesmo tempo.
- As variáveis têm relações físicas conhecidas (como dimensões que se expandem juntas).
Podemos ignorar a covariância com segurança quando as medições são realmente independentes, quando feitas com instrumentos diferentes, em momentos diferentes, ou quando a correlação é insignificante em comparação com outras fontes de incerteza. Quando tiver dúvidas, se as mudanças nas condições afetarem as duas medições da mesma forma, é provável que elas estejam relacionadas, e isso deve ser levado em conta na nossa análise.
Métodos avançados para lidar com a incerteza
Quando as funções envolvem lógica condicional, cálculos iterativos ourelações não lineares complexas,a simulação de Monte Carlo é umaboa alternativa.
Simulações de Monte Carlo
A simulação de Monte Carlo usa uma abordagem direta: em vez de espalhar incertezas por meio de fórmulas, a gente simula milhares de cenários possíveis e observa como os resultados se distribuem.
O processo é o seguinte:
- Crie amostras aleatórias a partir da distribuição de cada variável de entrada.
- Calcule o resultado para cada conjunto de amostras.
- Analise a distribuição da saída para ver a incerteza.
Você pode aprender a fazer uma simulação de Monte Carlo no Excel com o nosso guia detalhado. Mas, pra deixar esse tutorial completo, vamos dar uma olhada em um cenário onde os métodos analíticos ficam mais complicados.
Considere z =x²/y, onde x = 10,0 ± 0,5 e y = 2,0 ± 0,2. Embora possamos usar derivadas parciais, vamos ver uma abordagem conceitual de como o Monte Carlo lida com isso:
for each of 10,000 iterations:
x_sample = random value from normal(mean=10.0, std=0.5)
y_sample = random value from normal(mean=2.0, std=0.2)
z_sample = x_sample² / y_sample
result = mean of all z_samples = 50.2
uncertainty = standard deviation of z_samples = 5.3
O legal dessa abordagem é que ela:
- Lida com qualquer tipo de distribuição: Nossas entradas não precisam ser distribuídas normalmente.
- Tratamento natural de correlação: Lembra da nossa medição do perímetro correlacionado? O Monte Carlo pode gerar amostras aleatórias correlacionadas diretamente.
- Imagem completa da saída: A gente consegue a distribuição completa dos resultados, mostrando assim assimetria ou vários picos que o desvio padrão sozinho talvez não consiga explicar.
- Funciona com lógica complexa: Funções com condições if/then ou operações min/max podem ser tratadas.
Então, quando devemos escolher Monte Carlo em vez de métodos analíticos? Podemos pensar nisso quando:
- Nossa função envolve instruções condicionais ou cálculos iterativos.
- As variáveis seguem distribuições não normais (uniforme, exponencial, etc.)
- Precisamos da distribuição completa da produção, não só do desvio padrão.
- A abordagem analítica precisa de derivados complexos que a gente não tem certeza de como calcular.
Na prática, 10.000 amostras geralmente dão boas estimativas para a maioria das aplicações, enquanto 100.000 amostras oferecem alta precisão. Os computadores modernos podem fazer essas simulações em segundos para funções simples.
Considerações computacionais
Para modelos que exigem muito processamento, como simulações de elementos finitos ou modelos climáticos, onde um único cálculo pode levar horas, os modelos substitutos são uma boa pedida.
Modelos substitutos são funções matemáticas simplificadas que aproximam o comportamento de modelos complexos, um substituto mais rápido que captura as relações de entrada-saída do modelo original.
Mas, pra maioria das tarefas de análise de dados, a simulação direta de Monte Carlo dá o equilíbrio ideal entre precisão e simplicidade.
Conclusão
Este artigo apresentou a propagação de erros, a estrutura matemática para entender como as incertezas nas medições afetam os resultados calculados. A gente aprendeu as regras básicas pra propagar incertezas através de diferentes operações matemáticas, entendeu como a correlação entre variáveis afeta os cálculos de incerteza e explorou a simulação de Monte Carlo como uma alternativa computacional pra cenários complexos.
Para aprofundar suas habilidades no manejo da incerteza e análise estatística em aplicações do mundo real, considere explorar nossoprograma de Cientista de Machine Learning com Python. Esse programa fala sobre aprendizado supervisionado e não supervisionado, engenharia de recursos, análise de séries temporais e aprendizado profundo, onde entender a incerteza e a análise de erros é importante pra avaliar o desempenho do modelo, os intervalos de confiança e fazer previsões confiáveis em projetos de ciência de dados.

Como cientista de dados sênior, eu projeto, desenvolvo e implanto soluções de aprendizado de máquina em larga escala para ajudar as empresas a tomar melhores decisões baseadas em dados. Como redator de ciência de dados, compartilho aprendizados, conselhos de carreira e tutoriais práticos e detalhados.
Perguntas frequentes
Quando adiciono medições com incertezas, devo adicionar as incertezas diretamente?
Não, você soma em quadratura (raiz quadrada da soma dos quadrados). Para z = x + y, a incerteza é σz = √(σₓ² +σᵧ²), e não σₓ + σᵧ.
Qual operação matemática aumenta mais as incertezas?
Poderes e raízes podem aumentar bastante as incertezas. Para z =xⁿ, a incerteza relativa é multiplicada por |n|, então elevar um valor ao cubo triplica sua incerteza relativa.
Quando devo usar uma simulação de Monte Carlo em vez de fórmulas analíticas?
Use Monte Carlo quando estiver lidando com lógica condicional, distribuições não normais ou funções não lineares complexas. Também é ideal quando você precisa de uma distribuição completa da saída.
Quando posso ignorar a correlação entre as medições?
Você pode ignorar a correlação quando as medições são feitas com instrumentos diferentes, em momentos diferentes ou quando a correlação é insignificante em comparação com outras fontes de incerteza.
A correlação sempre aumenta a incerteza?
Não, a correlação positiva aumenta a incerteza, mas a correlação negativa pode realmente reduzi-la. O efeito depende do sinal e da magnitude do coeficiente de correlação.



