curso
Teste T vs. Z-test: Quando usar cada um deles
Como profissional de ciência de dados, você precisa analisar, testar e estabelecer relações entre variáveis em um conjunto de dados para tirar conclusões significativas. Um conceito chamado teste de hipótese, juntamente com vários testes, incluindo testes t e testes z, são algumas das ferramentas comumente usadas em análise para estabelecer relações entre pontos de dados.
Este tutorial ensinará a você a diferença entre um teste t e um teste Z com exemplos reais. Também fornecerei recursos adicionais para que você possa aprender mais.
Um resumo rápido: testes t vs. testes de resposta. Testes Z
A escolha entre um teste t e um teste Z pode ser resumida com estas diretrizes:
- Use um teste t: Quando o tamanho da amostra é pequeno (n < 30) e/ou a variação da população é desconhecida.
- Use um teste Z: Quando o tamanho da amostra é grande (n ≥ 30) e a variância da população é conhecida, você pode usar o tamanho da amostra para obter uma amostra de tamanho grande.
Em ambos os casos, esperamos que os dados sejam distribuídos normalmente. Continue lendo para saber mais sobre cada um dos testes e suas diferenças em detalhes. Primeiro, começaremos com uma rápida introdução ao teste de hipóteses.
Uma introdução ao teste de hipóteses
O teste de hipóteses é um método estatístico fundamental para inferir parâmetros populacionais com base em dados de amostra. Ele fornece uma abordagem estruturada para avaliar afirmações ou suposições sobre uma população usando evidências empíricas.
No centro do teste de hipóteses estão duas declarações complementares:
- A hipótese nula (H₀) é uma declaração de que não há efeito, diferença ou relação. Ele representa o status quo ou o entendimento atual.
- A hipótese alternativa (H₁) é uma afirmação que contradiz a hipótese nula. Representa a afirmação ou o novo entendimento que o pesquisador deseja provar.
Por exemplo, suponha que você queira determinar se um novo método de ensino melhora as pontuações dos testes dos alunos. Você pode formular as seguintes hipóteses:
- Hipótese nula (H₀): O novo método de ensino não tem efeito sobre os resultados dos testes dos alunos.
- Hipótese alternativa (H₁): O novo método de ensino melhora os resultados dos testes dos alunos.
O teste de hipótese envolve a coleta de dados de amostra, o cálculo de estatísticas de teste e a determinação da probabilidade de observar esses resultados se a hipótese nula for verdadeira. Com base nessa probabilidade, podemos decidir se rejeitamos a hipótese nula em favor da alternativa ou se não a rejeitamos.
Dependendo dos tipos de dados e das perguntas de pesquisa testadas, vários testes estatísticos estão disponíveis para o teste de hipóteses. Neste tutorial, vamos nos concentrar no teste t e no teste Z.
O que é um teste t?
O teste t é um teste estatístico usado para determinar se há uma diferença significativa entre as médias de dois grupos ou entre a média de uma amostra e um valor conhecido. É particularmente útil ao lidar com amostras pequenas ou quando o desvio padrão da população é desconhecido.
A estatística do teste t para um teste t de uma amostra é calculada usando a fórmula:
Equação do teste t. Imagem do autor.
onde:
- Xˉ é a média da amostra
- μ é a média da população (ou a média do grupo de comparação)
- s é o desvio padrão da amostra, e
- n é o tamanho da amostra.
Tipos de testes t
Existem três tipos principais de testes t. Cada um compara as médias sob diferentes condições:
- Teste t de uma amostra: Esse teste compara a média de uma única amostra a um valor conhecido ou à média da população. Ele determina se a média da amostra se desvia significativamente de um benchmark específico. Por exemplo, podemos usar um teste t de uma amostra para avaliar se a pontuação média do teste de uma turma pequena difere da média nacional.
- Teste t independente para duas amostras: Esse teste compara as médias de dois grupos independentes para determinar se há uma diferença estatisticamente significativa entre eles. É comumente usado em experimentos em que dois grupos são submetidos a tratamentos ou condições diferentes. Por exemplo, poderíamos usar um teste t independente de duas amostras para comparar as pontuações dos testes entre alunos ensinados com dois métodos de ensino diferentes para verificar se um método é mais eficaz.
- Teste t pareado: Esse teste compara médias do mesmo grupo em momentos diferentes ou sob condições diferentes. Ele avalia se há uma mudança significativa no mesmo grupo após uma intervenção ou ao longo do tempo. Um exemplo é medir o desempenho dos alunos antes e depois da implementação de uma nova estratégia de ensino para avaliar seu impacto.
Premissas do teste t
O teste t se baseia em determinadas suposições para fornecer resultados válidos:
- Normalidade dos dados: O teste t pressupõe que os dados em cada grupo são aproximadamente distribuídos normalmente. Isso é especialmente importante quando você lida com amostras pequenas. Se os dados não forem distribuídos normalmente, os resultados do teste t podem não ser confiáveis.
- Homogeneidade de variâncias: Para um teste t independente de duas amostras, presume-se que as variâncias dos dois grupos que estão sendo comparados sejam iguais. Essa suposição garante que o teste t considere corretamente a variabilidade dentro de cada grupo. Se as variações não forem iguais, isso pode afetar a precisão do teste.
- Independência das observações: As observações em cada grupo devem ser independentes. Isso significa que o valor de uma observação não deve influenciar ou estar relacionado ao valor de outra observação. A violação dessa suposição pode levar a conclusões incorretas.
É importante verificar essas suposições antes de aplicar o teste t em qualquer análise para garantir a validade dos resultados. Leia nosso Tutorial de testes T em R ou nossa Introdução aos testes T em Python para saber como realizar testes t em R ou Python.
O que é um teste Z?
O teste Z é um teste estatístico usado para determinar se há uma diferença significativa entre a média da amostra e a média da população ou entre as médias de dois grupos quando a variação da população é conhecida e o tamanho da amostra é grande.
Ele é usado principalmente quando o tamanho da amostra excede 30, permitindo o uso da distribuição normal para aproximar a distribuição da estatística de teste.
A estatística do teste Z para um teste Z de uma amostra é calculada usando a fórmula:
Equação de teste Z. Imagem do autor.
onde:
- Xˉ é a média da amostra,
- μ é a média da população,
- σ é o desvio padrão da população, e
- n é o tamanho da amostra.
Tipos de testes Z
Existem três tipos principais de testes Z:
- Teste Z para uma amostra: Esse teste compara a média de uma única amostra com uma média populacional conhecida. É usado quando você deseja avaliar se a média da amostra se desvia significativamente da média da população, supondo que a variação da população seja conhecida. Por exemplo, um teste z de uma amostra pode ser usado para determinar se a altura média de um grupo de mais de 30 pessoas difere da altura média nacional conhecida.
- Teste Z para duas amostras: Esse teste compara as médias de duas amostras independentes para determinar se há uma diferença significativa entre elas. É usado quando as duas amostras são grandes e as variações da população são conhecidas. Um exemplo disso seria comparar as pontuações médias de testes de alunos de duas escolas diferentes para ver se há uma diferença significativa no desempenho entre as duas escolas.
- Teste Z de proporção: Esse teste compara a proporção de uma determinada característica em uma amostra com uma proporção conhecida da população ou entre duas proporções de amostra. É usado para avaliar se a proporção observada na amostra difere significativamente do que é esperado com base na proporção da população. Por exemplo, um teste Z de proporção pode ser usado para comparar a proporção de eleitores que favorecem um determinado candidato em uma amostra com a proporção observada em eleições anteriores.
Há outras variações do teste, como o teste Z pareado, o teste Z para coeficientes de regressão e o teste Z para diferenças nas médias.
Premissas do teste Z
O teste Z se baseia em determinadas suposições para fornecer resultados válidos:
- Variância da população conhecida: O teste Z pressupõe que a variação da população seja conhecida. Essa é uma distinção importante do teste t, em que a variação da população é normalmente desconhecida. A variância conhecida permite o uso da distribuição z para avaliar a significância da estatística de teste.
- Tamanho grande da amostra: O teste Z pressupõe um tamanho de amostra grande, normalmente superior a 30. Com amostras maiores, a distribuição de amostragem da média da amostra se aproxima de uma distribuição normal, mesmo que os dados originais não sejam distribuídos normalmente, de acordo com o Teorema do Limite Central.
- Distribuição normal da população: Presume-se que os dados sejam extraídos de uma população normalmente distribuída. Essa suposição é menos crítica para amostras grandes, mas ainda é importante quando o tamanho da amostra é moderado.
Principais diferenças entre os testes t e os testes Z
O teste t e o teste Z são usados para comparar estatísticas de amostra com parâmetros populacionais, mas eles diferem em suas suposições subjacentes, aplicações e condições em que são mais apropriados. Vamos analisar e entender as diferenças entre os dois testes:
Considerações sobre o tamanho da amostra
- Teste t: O teste t é normalmente usado quando o tamanho da amostra é pequeno, geralmente menor que 30. Ele foi projetado para ser robusto quando o tamanho da amostra não atingir o limite necessário para aplicar o Teorema do Limite Central.
- Teste Z: O teste Z é usado quando o tamanho da amostra é grande, normalmente maior que 30. Em amostras grandes, a distribuição amostral da média é aproximadamente normal, o que justifica o uso do teste Z.
Conhecimento da variância da população
- Teste t: O teste t é usado quando a variação da população é desconhecida. Em vez da variância da população, a variância da amostra é usada para calcular a estatística do teste. A distribuição t, que tem caudas mais pesadas do que a distribuição normal, leva em conta a incerteza adicional devido à estimativa da variação da população.
- Teste Z: O teste Z requer que a variação da população seja conhecida. Essa é uma suposição importante porque permite o uso da distribuição normal padrão para calcular a estatística de teste. Quando a variação da população é conhecida, o teste Z fornece estimativas mais precisas.
Premissas de distribuição
- Teste t: O teste t pressupõe que os dados dentro de cada grupo são aproximadamente distribuídos normalmente. Isso é particularmente importante quando você lida com amostras pequenas. A estatística de teste em um teste t segue uma distribuição t, que tem caudas mais largas do que a distribuição normal. Isso leva em conta a variabilidade e a incerteza adicionais ao estimar o desvio padrão da população a partir de uma amostra pequena.
- Teste Z: O teste Z pressupõe que os dados sejam normalmente distribuídos ou que o tamanho da amostra seja grande o suficiente para que você possa aplicar o Teorema do Limite Central. O Teorema do Limite Central garante que, para amostras grandes, a distribuição amostral da média seja aproximadamente normal, mesmo que os dados subjacentes não sejam perfeitamente normais.
Aplicações práticas e casos de uso
- Teste t: O teste t é comumente usado em estudos de amostras pequenas, como estudos-piloto, em que a variação da população é desconhecida. Os exemplos incluem a comparação da eficácia de dois tratamentos em um grupo pequeno ou a avaliação de mudanças no mesmo grupo ao longo do tempo.
- Teste Z: O teste Z é usado em estudos com amostras grandes ou ao lidar com populações bem estabelecidas em que a variação é conhecida. É frequentemente aplicado em controle de qualidade, análise de pesquisas e estudos experimentais em larga escala.
Aqui está uma tabela com as principais diferenças:
Principais diferenças entre o Principais diferenças entre o teste t e o teste Z. Imagem do autor.
Conclusão
Este tutorial apresentou a você o teste de hipóteses e dois testes comumente usados - testes e testes z. Também aprendemos as definições, os diferentes tipos e as suposições de cada teste e compreendemos melhor suas principais diferenças. Concluímos qual teste é melhor para ser usado em cada cenário, permitindo que você estabeleça relações entre variáveis com confiança por meio de testes de hipóteses.
Depois de solidificar os conceitos estatísticos por trás dos testes de hipóteses com o nosso curso de Introdução à Estatística, eu incentivaria você a implementar esses conceitos por meio de qualquer uma das tecnologias populares por meio dos seguintes recursos:
- Teste de hipóteses no curso Python
- Curso de teste de hipóteses em R
- Teste de hipóteses (teste qui-quadrado) no tutorial do Excel
Feliz aprendizado!
Torne-se um cientista de ML

Como cientista de dados sênior, eu projeto, desenvolvo e implanto soluções de aprendizado de máquina em larga escala para ajudar as empresas a tomar melhores decisões baseadas em dados. Como redator de ciência de dados, compartilho aprendizados, conselhos de carreira e tutoriais práticos e detalhados.
Perguntas frequentes
Qual é a principal diferença entre um teste t e um teste Z?
A principal diferença é que o teste t é usado para amostras pequenas (n <30) ou quando a variação da população é desconhecida e usa a distribuição t. O teste Z é usado para amostras grandes (n > 30) com variância populacional conhecida e se baseia na distribuição normal.
Quando devo usar um teste t de uma amostra em vez de um teste Z?
Use um teste t para uma amostra quando você estiver comparando a média de uma única amostra com a média de uma população conhecida e a variação da população for desconhecida. Se o tamanho da amostra for grande e a variação da população for conhecida, você deverá usar um teste Z para uma amostra.
Qual é a função da distribuição t em um teste t?
A distribuição t é usada em um teste t para levar em conta a variabilidade adicional e a incerteza na estatística do teste quando o tamanho da amostra é pequeno e a variação da população é desconhecida.
Posso usar um teste Z se não souber a variação da população?
Não, um teste Z exige que você conheça a variação da população. Se a variância da população não for conhecida, você deverá usar um teste t, que estima a variância a partir dos dados da amostra.
Como faço para determinar se devo usar um teste t pareado ou um teste t independente para duas amostras?
Use um teste t pareado quando você estiver comparando médias do mesmo grupo em momentos diferentes ou sob condições diferentes (por exemplo, antes e depois de uma intervenção). Use um teste t independente de duas amostras ao comparar médias de dois grupos diferentes e não relacionados (por exemplo, comparar pontuações de duas classes ou tratamentos diferentes).
Aprenda com a DataCamp
curso
Introdução à estatística em R
programa