Saltar al contenido principal

Prueba T vs. Prueba Z: Cuándo utilizar cada uno

Utiliza las pruebas t cuando se trate de muestras pequeñas o varianza desconocida, y las pruebas Z cuando las muestras sean grandes y se conozca la varianza.
Actualizado 16 ene 2025  · 10 min de lectura

Como profesional de la ciencia de datos, a menudo debes analizar, probar y establecer relaciones entre las variables de un conjunto de datos para sacar conclusiones significativas. Un concepto llamado prueba de hipótesis, junto con varias pruebas, como las pruebas t y las pruebas z, son algunas de las herramientas más utilizadas en analítica para establecer relaciones entre puntos de datos. 

Este tutorial te enseñará la diferencia entre una prueba t y una prueba Z con ejemplos reales. También proporcionaré recursos adicionales para seguir aprendiendo.

Un resumen rápido: las pruebas t frente a... Pruebas Z

Elegir entre una prueba t y una prueba Z puede resumirse con estas pautas:

  • Utiliza una prueba t: Cuando el tamaño de la muestra es pequeño (n < 30) y/o se desconoce la varianza de la población.
  • Utiliza una prueba Z: Cuando el tamaño de la muestra es grande (n ≥ 30) y se conoce la varianza de la población.

En ambos casos, esperamos que los datos se distribuyan normalmente. Sigue leyendo para conocer en detalle cada una de las pruebas y sus diferencias. En primer lugar, empezaremos con una rápida introducción a la comprobación de hipótesis.

Introducción a la comprobación de hipótesis

La comprobación de hipótesis es un método estadístico fundamental para inferir parámetros poblacionales a partir de datos muestrales. Proporciona un enfoque estructurado para evaluar afirmaciones o suposiciones sobre una población utilizando pruebas empíricas.

En el núcleo de la comprobación de hipótesis hay dos afirmaciones complementarias:

  • La hipótesis nula (H₀) es una afirmación de ausencia de efecto, diferencia o relación. Representa el statu quo o la comprensión actual.
  • La hipótesis alternativa (H₁) es una afirmación que contradice la hipótesis nula. Representa la afirmación o la nueva comprensión que el investigador quiere demostrar.

Por ejemplo, supongamos que quieres determinar si un nuevo método de enseñanza mejora los resultados de los alumnos en los exámenes. Podrías formular las siguientes hipótesis:

  • Hipótesis nula (H₀): El nuevo método de enseñanza no tiene ningún efecto sobre los resultados de los alumnos en los exámenes.
  • Hipótesis alternativa (H₁): El nuevo método de enseñanza mejora los resultados de los alumnos en los exámenes.

La comprobación de hipótesis implica recoger datos de la muestra, calcular los estadísticos de la prueba y determinar la probabilidad de observar dichos resultados si la hipótesis nula es cierta. Basándonos en esta probabilidad, podemos decidir si rechazar la hipótesis nula a favor de la alternativa o no rechazarla.

Dependiendo de los tipos de datos y de las preguntas de investigación que se comprueben, hay varias pruebas estadísticas disponibles para la comprobación de hipótesis. En este tutorial, nos centraremos en las pruebas t y Z.

¿Qué es una prueba t?

Una prueba t es una prueba estadística utilizada para determinar si existe una diferencia significativa entre las medias de dos grupos o entre la media de una muestra y un valor conocido. Es especialmente útil cuando se trata de muestras de pequeño tamaño o cuando se desconoce la desviación típica de la población. 

El estadístico de la prueba t para una prueba t de una muestra se calcula mediante la fórmula:

Ecuación de la prueba t

Ecuación de la prueba t. Imagen del autor.

donde:

  • Xˉ es la media muestral
  • μ es la media de la población (o la media del grupo de comparación)
  • s es la desviación típica de la muestra, y 
  • n es el tamaño de la muestra.

Tipos de pruebas t

Hay tres tipos principales de pruebas t. Cada uno compara los medios en condiciones diferentes:

  • Prueba t de una muestra: Esta prueba compara la media de una sola muestra con un valor conocido o media poblacional. Determina si la media de la muestra se desvía significativamente de un valor de referencia específico. Por ejemplo, podemos utilizar una prueba t de una muestra para evaluar si la puntuación media de los exámenes de una clase pequeña difiere de la media nacional.
  • Prueba t independiente de dos muestras: Esta prueba compara las medias de dos grupos independientes para determinar si existe una diferencia estadísticamente significativa entre ellos. Se suele utilizar en experimentos en los que dos grupos se someten a tratamientos o condiciones diferentes. Por ejemplo, podríamos utilizar una prueba t independiente de dos muestras para comparar las puntuaciones en los exámenes de alumnos a los que se enseña con dos métodos de enseñanza distintos, para ver si uno de ellos es más eficaz.
  • Prueba t pareada: Esta prueba compara medias del mismo grupo en momentos diferentes o en condiciones diferentes. Evalúa si hay un cambio significativo dentro del mismo grupo tras una intervención o a lo largo del tiempo. Un ejemplo es medir el rendimiento de los alumnos antes y después de aplicar una nueva estrategia de enseñanza para evaluar su impacto.

Supuestos de la prueba t

La prueba t se basa en ciertos supuestos para proporcionar resultados válidos:

  • Normalidad de los datos: La prueba t supone que los datos de cada grupo tienen una distribución aproximadamente normal. Esto es especialmente importante cuando se trata de muestras de pequeño tamaño. Si los datos no se distribuyen normalmente, los resultados de la prueba t pueden no ser fiables.
  • Homogeneidad de varianzas: Para una prueba t independiente de dos muestras, se supone que las varianzas de los dos grupos que se comparan son iguales. Este supuesto garantiza que la prueba t tiene en cuenta correctamente la variabilidad dentro de cada grupo. Si las varianzas no son iguales, puede afectar a la precisión de la prueba.
  • Independencia de las observaciones: Las observaciones dentro de cada grupo deben ser independientes. Esto significa que el valor de una observación no debe influir ni estar relacionado con el valor de otra observación. La violación de este supuesto puede llevar a conclusiones incorrectas.

Es importante comprobar estos supuestos antes de aplicar la prueba t en cualquier análisis para garantizar la validez de los resultados. Lee nuestro Tutorial de Pruebas T en R o nuestra Introducción a las Pruebas T en Python para aprender a realizar pruebas t en R o Python. 

¿Qué es una prueba Z?

Una prueba Z es una prueba estadística utilizada para determinar si existe una diferencia significativa entre la media de la muestra y la media de la población o entre las medias de dos grupos cuando se conoce la varianza de la población y el tamaño de la muestra es grande.

Se utiliza principalmente cuando el tamaño de la muestra es superior a 30, lo que permite utilizar la distribución normal para aproximar la distribución del estadístico de la prueba.

El estadístico de la prueba Z para una prueba Z de una muestra se calcula mediante la fórmula:

Ecuación de la prueba Z

Ecuación de la prueba Z. Imagen del autor.

donde: 

  • Xˉ es la media muestral, 
  • μ es la media de la población, 
  • σ es la desviación típica de la población, y 
  • n es el tamaño de la muestra.

Tipos de pruebas Z

Hay tres tipos principales de pruebas Z:

  • Prueba Z de una muestra: Esta prueba compara la media de una sola muestra con una media poblacional conocida. Se utiliza cuando quieres evaluar si la media muestral se desvía significativamente de la media poblacional, suponiendo que se conoce la varianza poblacional. Por ejemplo, podría utilizarse una prueba z de una muestra para determinar si la estatura media de un grupo de más de 30 personas difiere de la estatura media nacional conocida.
  • Prueba Z de dos muestras: Esta prueba compara las medias de dos muestras independientes para determinar si existe una diferencia significativa entre ellas. Se utiliza cuando ambas muestras son grandes y se conocen las varianzas de la población. Un ejemplo de esto sería comparar las puntuaciones medias de los exámenes de los alumnos de dos escuelas diferentes para ver si hay una diferencia significativa en el rendimiento entre las dos escuelas.
  • Proporción Prueba Z: Esta prueba compara la proporción de una determinada característica en una muestra con una proporción poblacional conocida o entre dos proporciones muestrales. Se utiliza para evaluar si la proporción observada en la muestra difiere significativamente de lo que se espera basándose en la proporción de la población. Por ejemplo, podría utilizarse una prueba Z de proporción para comparar la proporción de votantes que favorecen a un candidato concreto en una muestra con la proporción observada en elecciones anteriores.

Existen variaciones adicionales de la prueba, como la prueba Z pareada, la prueba Z para coeficientes de regresión y la prueba Z para diferencias de medias.

Supuestos de la prueba Z

La prueba Z se basa en ciertos supuestos para proporcionar resultados válidos:

  • Varianza de la población conocida: La prueba Z supone que se conoce la varianza de la población. Esta es una distinción clave con respecto a la prueba t, en la que la varianza de la población suele ser desconocida. La varianza conocida permite utilizar la distribución z para evaluar la significación de la estadística de la prueba.
  • Muestra de gran tamaño: La prueba Z presupone un tamaño de muestra grande, normalmente superior a 30. Con muestras más grandes, la distribución muestral de la media muestral se aproxima a una distribución normal, aunque los datos originales no estén distribuidos normalmente, según el Teorema Central del Límite.
  • Distribución normal de la población: Se supone que los datos proceden de una población con distribución normal. Este supuesto es menos crítico para las muestras grandes, pero sigue siendo importante cuando el tamaño de la muestra es moderado.

Diferencias clave entre las pruebas t y las pruebas Z

La prueba t y la prueba Z se utilizan para comparar estadísticas muestrales con parámetros poblacionales, pero difieren en sus supuestos subyacentes, aplicaciones y condiciones en las que son más apropiadas. Analicemos y comprendamos las diferencias entre ambas pruebas:

Consideraciones sobre el tamaño de la muestra

  • Prueba t: La prueba t se suele utilizar cuando el tamaño de la muestra es pequeño, generalmente inferior a 30. Está diseñado para ser robusto cuando el tamaño de la muestra no alcanza el umbral necesario para aplicar el Teorema Central del Límite.
  • Prueba Z: La prueba Z se utiliza cuando el tamaño de la muestra es grande, normalmente superior a 30. En muestras grandes, la distribución muestral de la media es aproximadamente normal, lo que justifica el uso de la prueba Z.

Conocimiento de la varianza de la población

  • Prueba t: La prueba t se utiliza cuando se desconoce la varianza de la población. En lugar de la varianza de la población, se utiliza la varianza de la muestra para calcular el estadístico de la prueba. La distribución t, que tiene colas más pesadas que la distribución normal, tiene en cuenta la incertidumbre adicional debida a la estimación de la varianza de la población.
  • Prueba Z: La prueba Z requiere que se conozca la varianza de la población. Se trata de un supuesto clave porque permite utilizar la distribución normal estándar para calcular el estadístico de la prueba. Cuando se conoce la varianza de la población, la prueba Z proporciona estimaciones más precisas.

Supuestos de distribución

  • Prueba t: La prueba t supone que los datos dentro de cada grupo tienen una distribución aproximadamente normal. Esto es especialmente importante cuando se trata de muestras de pequeño tamaño. El estadístico de una prueba t sigue una distribución t, que tiene colas más anchas que la distribución normal. Esto tiene en cuenta la variabilidad e incertidumbre adicionales al estimar la desviación típica de la población a partir de una muestra pequeña.
  • Prueba Z: La prueba Z supone que los datos se distribuyen normalmente o que el tamaño de la muestra es lo suficientemente grande como para aplicar el Teorema Central del Límite. El Teorema del Límite Central garantiza que, para muestras grandes, la distribución muestral de la media es aproximadamente normal, aunque los datos subyacentes no sean perfectamente normales.

Aplicaciones prácticas y casos de uso

  • Prueba t: La prueba t se suele utilizar en estudios con muestras pequeñas, como los estudios piloto, en los que se desconoce la varianza de la población. Algunos ejemplos son la comparación de la eficacia de dos tratamientos en un grupo pequeño o la evaluación de los cambios dentro del mismo grupo a lo largo del tiempo.
  • Prueba Z: La prueba Z se utiliza en estudios de muestras grandes o cuando se trata de poblaciones bien establecidas en las que se conoce la varianza. Suele aplicarse en el control de calidad, el análisis de encuestas y los estudios experimentales a gran escala.

Aquí tienes una tabla con las principales diferencias:

yDiferencias clave entre la prueba T la prueba Diferencias clave entre la prueba t y la prueba Z. Imagen del autor.

Conclusión

Este tutorial te ha introducido en las pruebas de hipótesis y en dos pruebas de uso común: las pruebas-t y las pruebas-z. También aprendimos las definiciones, los distintos tipos y los supuestos de cada prueba, y comprendimos mejor sus principales diferencias. Llegamos a la conclusión de qué prueba es mejor utilizar en cada escenario, lo que te permitirá establecer relaciones entre variables con confianza mediante la comprobación de hipótesis.

Después de solidificar los conceptos estadísticos que subyacen a las pruebas de hipótesis con nuestro curso de Introducción a la Estadística, te animo a que pongas en práctica estos conceptos mediante cualquiera de las tecnologías populares a través de los siguientes recursos:

¡Feliz aprendizaje!

Conviértete en un Científico ML

Mejora tus conocimientos de Python para convertirte en un científico del aprendizaje automático.
Empieza a aprender gratis

Arunn Thevapalan's photo
Author
Arunn Thevapalan
LinkedIn
Twitter

Como científico de datos senior, diseño, desarrollo e implanto soluciones de aprendizaje automático a gran escala para ayudar a las empresas a tomar mejores decisiones basadas en datos. Como escritora de ciencia de datos, comparto aprendizajes, consejos profesionales y tutoriales prácticos en profundidad.

Preguntas frecuentes

¿Cuál es la principal diferencia entre una prueba t y una prueba Z?

La principal diferencia es que la prueba t se utiliza para tamaños de muestra pequeños (n <30) o cuando se desconoce la varianza de la población y utiliza la distribución t. La prueba Z se utiliza para muestras de gran tamaño ( n>30) con varianza poblacional conocida y se basa en la distribución normal.

¿Cuándo debo utilizar una prueba t de una muestra frente a una prueba Z?

Utiliza una prueba t de una muestra cuando estés comparando la media de una sola muestra con una media poblacional conocida y la varianza poblacional sea desconocida. Si el tamaño de la muestra es grande y se conoce la varianza de la población, debes utilizar en su lugar una prueba Z de una muestra.

¿Cuál es la función de la distribución t en una prueba t?

La distribución t se utiliza en una prueba t para tener en cuenta la variabilidad adicional y la incertidumbre en la estadística de la prueba cuando el tamaño de la muestra es pequeño y se desconoce la varianza de la población.

¿Puedo utilizar una prueba Z si no conozco la varianza de la población?

No, una prueba Z requiere que se conozca la varianza de la población. Si no se conoce la varianza de la población, debes utilizar una prueba t, que estima la varianza a partir de los datos de la muestra.

¿Cómo determino si debo utilizar una prueba t pareada o una prueba t independiente de dos muestras?

Utiliza una prueba t pareada cuando compares medias del mismo grupo en momentos diferentes o en condiciones diferentes (por ejemplo, antes y después de una intervención). Utiliza una prueba t independiente de dos muestras cuando compares medias de dos grupos diferentes no relacionados (por ejemplo, comparar puntuaciones de dos clases o tratamientos diferentes).

Temas

Aprende con DataCamp

curso

Introduction to Statistics

4 hr
89.1K
Learn the fundamentals of statistics, including measures of center and spread, probability distributions, and hypothesis testing with no coding involved!
Ver detallesRight Arrow
Comienza el curso
Ver másRight Arrow
Relacionado

blog

Intervalos de confianza frente a intervalos de predicción: Comprender la diferencia

Este artículo te enseña el significado, las diferencias y los casos de uso adecuados de los intervalos de predicción y los intervalos de confianza en los análisis estadísticos y de regresión. También te muestra cómo implementar estos intervalos en R.
Arun Nanda's photo

Arun Nanda

25 min

tutorial

Tutorial de pruebas T en R: Aprende a realizar pruebas T

Determina si existe una diferencia significativa entre las medias de los dos grupos utilizando t.test() en R.
Abid Ali Awan's photo

Abid Ali Awan

10 min

tutorial

Pruebas de hipótesis fáciles

La comprobación de hipótesis es un método estadístico utilizado para evaluar afirmaciones sobre poblaciones basadas en datos muestrales.
Vinod Chugani's photo

Vinod Chugani

9 min

tutorial

Cómo calcular la desviación típica en Excel

Para calcular la desviación típica en Excel, introduce tus datos en un rango de celdas y utiliza =STDEV.S() para datos de muestra o =STDEV.P() para datos de población.
Arunn Thevapalan's photo

Arunn Thevapalan

10 min

tutorial

Tutorial de tablas de contingencia en R

En este tutorial, aprenderás a crear tablas de contingencia y a probar y cuantificar las relaciones visibles en ellas.
Łukasz Deryło's photo

Łukasz Deryło

10 min

Ver másVer más