Ir al contenido principal

Prueba U de Mann-Whitney: alternativa no paramétrica a la t de Student

La U de Mann-Whitney es una prueba no paramétrica basada en rangos para comparar dos grupos independientes cuando los datos no cumplen la normalidad requerida por la t de Student.
Actualizado 4 may 2026  · 10 min leer

¿Alguna vez has hecho una t de Student, te ha salido un p-valor raro y luego has descubierto que tus datos no eran ni de lejos normales?

A todos nos ha pasado alguna vez. El problema de la t de Student es que asume que tus datos siguen una distribución normal. Cuando no es así, los resultados pueden inducir a error. Datos sesgados y muestras pequeñas incumplen esa suposición de normalidad. Y los datos del mundo real rara vez se comportan como dicen los libros.

La prueba U de Mann-Whitney viene a solucionar el problema. Es una alternativa no paramétrica a la t de Student que compara dos grupos a partir de rangos en vez de medias, así que no le importa la forma de la distribución.

En este artículo verás qué es la prueba U de Mann-Whitney, cuándo usarla, cómo funciona la parte matemática y cómo ejecutarla e interpretarla tanto en Python como en R.

Pero ¿qué es exactamente una t de Student? Si te lo preguntas, lee nuestro artículo de introducción a las t de Student en Python: resolverá todas tus dudas.

¿Qué es la prueba U de Mann-Whitney?

La U de Mann-Whitney es una prueba estadística no paramétrica que se utiliza para comparar dos grupos independientes.

A diferencia de la t de Student, no asume que tus datos sigan una distribución normal. Compara las distribuciones de dos grupos convirtiendo los valores en rangos y analizándolos. Es una buena opción cuando los datos están sesgados, tienen valores atípicos o, por cualquier motivo, no cumplen la normalidad.

También la verás como prueba de suma de rangos de Wilcoxon. A efectos prácticos, son sinónimos.

Cuándo usar la prueba U de Mann-Whitney

La U de Mann-Whitney requiere que se cumplan unas condiciones concretas. Úsala solo cuando se den todas estas:

  • Dos grupos independientes: Las muestras no se solapan y los valores de un grupo no influyen en los del otro
  • Datos ordinales o continuos: Por ejemplo, notas de exámenes, tiempos de respuesta o cualquier medida cuantitativa
  • Distribución no normal: Tus datos están sesgados, tienen colas pesadas o no puedes confirmar la normalidad por el tamaño muestral
  • Muestras pequeñas: Cuando no tienes suficientes datos para apoyarte en el teorema central del límite

Veamos un ejemplo.

Imagina dos clases impartidas con métodos distintos y quieres saber cuál logró mejores resultados en el examen. Representas las notas y ves que no son normales: una clase tiene unos cuantos atípicos que tiran de la distribución hacia la derecha. La t de Student compara medias, así que esos atípicos elevan la media y hacen que esa clase parezca mejor de lo que es.

Esa media sesgada entra en el cálculo de la t, y el p-valor que obtienes no refleja bien la diferencia entre grupos. La U de Mann-Whitney no tiene ese problema porque trabaja con rangos en lugar de puntuaciones brutas. Un único atípico solo puede ser el valor con mayor rango, así que no deforma el resultado como sí lo haría con la media.

También es la opción preferida cuando trabajas con datos ordinales, como respuestas de encuestas en una escala del 1 al 5. Esos valores no son realmente continuos, por lo que calcular una media no tiene mucho sentido.

Fórmula de la U de Mann-Whitney

La prueba produce dos estadísticas U, una por grupo. Esta es la fórmula:

Fórmula de la prueba U de Mann-Whitney

Fórmula de la prueba U de Mann-Whitney

Donde:

  • n1 y n2 son los tamaños muestrales del grupo 1 y del grupo 2

  • R1 y R2 son las sumas de rangos de cada grupo: la suma de todos los rangos asignados a las observaciones de cada grupo

La suma de rangos se calcula combinando todos los valores de ambos grupos, ordenándolos de menor a mayor y asignando un rango a cada valor. El menor recibe el rango 1, el siguiente el 2, y así sucesivamente. Luego sumas por separado los rangos de cada grupo.

La estadística de prueba es el menor de U1 y U2. Luego la comparas con un valor crítico o la usas para calcular un p-valor.

La buena noticia es que no tienes que hacerlo a mano. Python y R lo calculan por ti, como verás enseguida.

Suposiciones de la prueba U de Mann-Whitney

La U de Mann-Whitney es más flexible que la t de Student, pero aun así tiene tres supuestos que debes respetar:

  • Muestras independientes: Los dos grupos no se influyen entre sí. Las observaciones de un grupo no están relacionadas con las del otro
  • Datos ordinales o continuos: Tus datos deben tener un orden natural: puedes decir que un valor es mayor o menor que otro
  • Formas de distribución similares: Si quieres interpretar los resultados como una comparación de medianas, ambos grupos deberían tener distribuciones con una forma parecida. Si las formas difieren, la prueba sigue siendo válida, pero comparas rangos medios, no medianas

El tercer supuesto es el que más confunde.

A menudo se describe la U de Mann-Whitney como una prueba de medianas, pero eso solo es cierto cuando las dos distribuciones tienen una forma similar. Si no es el caso, el resultado te dice algo más general: si los valores de un grupo tienden a ser mayores que los del otro.

Prueba U de Mann-Whitney en Python

El módulo scipy.stats de Python incluye una función para la U de Mann-Whitney. Aquí tienes un ejemplo sencillo con notas de examen de dos clases.

from scipy.stats import mannwhitneyu

class_a = [72, 85, 90, 65, 78, 88, 95, 70, 83, 76]
class_b = [60, 55, 74, 68, 80, 58, 63, 71, 66, 59]

stat, p_value = mannwhitneyu(class_a, class_b, alternative="two-sided")

print(f"U statistic: {stat}")
print(f"P-value: {p_value:.4f}")

Prueba U de Mann-Whitney en Python

Prueba U de Mann-Whitney en Python

El argumento alternative="two-sided" indica que compruebas si los grupos difieren en cualquier dirección. No presupones de antemano que uno sea mayor. Si tu hipótesis fuera direccional, usarías "less" o "greater".

Aquí el p-valor es 0.0046, por debajo del umbral habitual de 0.05. Puedes rechazar la hipótesis nula: hay una diferencia estadísticamente significativa entre las distribuciones de notas de las dos clases.

La U en sí dice poco sin contexto. Céntrate en el p-valor para decidir si la diferencia es significativa y mira los datos brutos o las medianas para entender en qué dirección va.

Prueba U de Mann-Whitney en R

R ejecuta la U de Mann-Whitney con la función wilcox.test(). Usaré el mismo ejemplo de notas que antes.

class_a <- c(72, 85, 90, 65, 78, 88, 95, 70, 83, 76)
class_b <- c(60, 55, 74, 68, 80, 58, 63, 71, 66, 59)

wilcox.test(class_a, class_b, alternative = "two.sided")

Prueba U de Mann-Whitney en R

Prueba U de Mann-Whitney en R

La estadística W es la misma que la U; R simplemente la etiqueta de otra manera. La interpretación es idéntica a la de Python: un p-valor de 0.0029 está por debajo de 0.05, así que existe una diferencia estadísticamente significativa entre los dos grupos.

También puedes ver un aviso sobre empates en los datos.

Ocurre cuando dos o más valores son idénticos entre grupos, lo que afecta a cómo se asignan los rangos. R lo gestiona por ti, pero si hay muchos empates, conviene revisar si tus datos cumplen los supuestos de la prueba.

Cómo interpretar los resultados de la U de Mann-Whitney

La hipótesis nula de la U de Mann-Whitney es que ambos grupos proceden de la misma distribución; en otras palabras, que no hay diferencias entre ellos. Tu tarea es buscar evidencias en contra.

El p-valor es la clave:

  • p < 0.05: Rechazas la hipótesis nula. Las dos distribuciones difieren y la diferencia es estadísticamente significativa
  • p ≥ 0.05: No hay evidencia suficiente para rechazar la hipótesis nula. No significa que los grupos sean idénticos, sino que los datos no muestran una diferencia clara

Recuerda que la U de Mann-Whitney compara distribuciones. Un resultado significativo indica que los valores de un grupo tienden a situarse por encima de los del otro, no que la media sea mayor. Si quieres describir la dirección de la diferencia, fíjate en las medianas de cada grupo, no en las medias.

U de Mann-Whitney vs t de Student

Ambas pruebas resuelven el mismo problema (comparar dos grupos), pero lo hacen de forma distinta, y elegir mal afectará a tus resultados.

t de Student

La t de Student compara las medias de dos grupos. Parte de la suposición de normalidad, y cuando se cumple, es una buena prueba.

El problema es esa suposición. Si los datos están sesgados o provienen de una muestra pequeña en la que es difícil confirmar la normalidad, los resultados pueden volverse poco fiables. La media se ve arrastrada por valores extremos, y el p-valor lo refleja.

Usa la t de Student cuando:

  • Tus datos siguen una distribución normal
  • Tienes un tamaño muestral suficientemente grande
  • Trabajas con datos continuos sin sesgo acusado ni atípicos

Prueba U de Mann-Whitney

La U de Mann-Whitney compara distribuciones en lugar de medias. Ordena conjuntamente todos los valores de ambos grupos y comprueba si uno de ellos se sitúa sistemáticamente por encima del otro. Al trabajar con rangos, los atípicos y el sesgo no distorsionan el resultado del mismo modo.

Si tus datos son realmente normales, la t de Student detectará diferencias con mayor fiabilidad. La U de Mann-Whitney es más flexible, pero sacrificas algo de sensibilidad.

Usa la U de Mann-Whitney cuando:

  • Tus datos no son normales
  • Trabajas con datos ordinales
  • Tienes una muestra pequeña y no puedes confirmar la normalidad
  • Hay atípicos y no puedes eliminarlos

Aquí tienes una comparativa rápida:

t de Student frente a U de Mann-Whitney

t de Student frente a U de Mann-Whitney

En caso de duda, mira primero la distribución. Si es más o menos normal, usa la t de Student. Si no lo es, la U de Mann-Whitney es la opción más segura.

Errores comunes con la U de Mann-Whitney

La mayoría de los errores con esta prueba se deben a no entender bien qué hace. Estos son los más frecuentes:

Suponer que compara medias

Este es el más habitual. La U de Mann-Whitney compara distribuciones, no medias. Un resultado significativo indica que los valores de un grupo tienden a situarse por encima, no que la media sea mayor. Si necesitas describir la diferencia, informa de las medianas, no de las medias.

Ignorar las diferencias en la forma de las distribuciones

Si los dos grupos tienen formas de distribución distintas —uno sesgado a la derecha y otro simétrico— no puedes interpretar el resultado como una comparación de medianas. La prueba se ejecuta, pero el resultado refleja una diferencia global de distribuciones, no un desplazamiento del centro. Revisa las distribuciones antes de sacar conclusiones sobre medianas.

Malinterpretar los p-valores

Un p-valor por debajo de 0.05 significa que la diferencia es estadísticamente significativa. No te dice cuán grande es ni si importa en la práctica. Con muestras muy grandes, un efecto minúsculo puede dar un p-valor significativo. Si el tamaño del efecto es relevante, calcúlalo aparte.

Usarla con datos pareados

La U de Mann-Whitney es para dos grupos independientes. Si tus datos están pareados —las mismas personas medidas dos veces o parejas emparejadas—, necesitas la prueba de rangos con signo de Wilcoxon.

Cuándo no debes usar la U de Mann-Whitney

La U de Mann-Whitney no es la herramienta adecuada para todo. En estos casos, usa otra cosa:

Tus datos están pareados

Si las mismas personas aparecen en ambos grupos —mediciones antes y después, o parejas emparejadas—, las muestras no son independientes. La U de Mann-Whitney asume independencia, así que ignorar esa relación te dará resultados poco fiables. Usa la prueba de rangos con signo de Wilcoxon.

Tienes más de dos grupos

La U de Mann-Whitney solo compara dos grupos a la vez. Si comparas tres o más, utiliza la prueba de Kruskal-Wallis, el equivalente no paramétrico de un ANOVA de una vía que admite múltiples grupos.

Tienes una muestra grande con datos normales

La gran ventaja de la U de Mann-Whitney es que no asume normalidad. Si tus datos son normales y tu muestra es lo bastante grande como para confirmarlo, la t de Student es mejor opción. Tiene más potencia estadística en ese escenario, es decir, más probabilidad de detectar una diferencia real cuando existe.

Conclusión

La U de Mann-Whitney es una gran solución cuando tus datos no son normales y la t de Student no encaja bien.

Trabaja con rangos en lugar de valores brutos, evitando las suposiciones que hacen poco fiables las pruebas paramétricas en datos sesgados o con muestras pequeñas. Es una prueba muy útil para análisis del mundo real, donde los datos rara vez se comportan como te gustaría.

La lección de fondo es la elección de la prueba. No existe una prueba válida para todos los conjuntos de datos. Revisa siempre primero tus datos —su distribución, estructura y tamaño muestral— y deja que esas características guíen tu elección. La correcta es la que mejor se ajusta a tus datos.

Si estás empezando en estadística o quieres profundizar de verdad, nuestro itinerario Statistician in R te ayudará a estar listo para el trabajo con solo 52 horas de contenido.


Dario Radečić's photo
Author
Dario Radečić
LinkedIn
Científico de Datos Senior con base en Croacia. Top Tech Writer con más de 700 artículos publicados, generando más de 10M de visitas. Autor del libro Automatización del aprendizaje automático con TPOT.

FAQs

¿Para qué se utiliza la U de Mann-Whitney?

La U de Mann-Whitney se usa para comparar dos grupos independientes cuando no puedes asumir que los datos sigan una distribución normal. Ordena conjuntamente todos los valores de ambos grupos y comprueba si uno de ellos se sitúa de forma consistente por encima del otro. Funciona con datos ordinales y continuos.

¿En qué se diferencia la U de Mann-Whitney de la t de Student?

La t de Student compara las medias de dos grupos y asume normalidad. La U de Mann-Whitney compara distribuciones usando rangos, por lo que no hace esa suposición. Cuando los datos están sesgados o la muestra es pequeña, la U de Mann-Whitney es la opción más segura.

¿Cuándo debería usar la U de Mann-Whitney?

Úsala cuando tengas dos grupos independientes, tus datos sean ordinales o continuos y no puedas confirmar la normalidad. También encaja bien si la muestra es pequeña y hay atípicos. Si los datos son normales y la muestra es grande, la t de Student suele dar mejores resultados.

¿Qué te dice el p-valor en una U de Mann-Whitney?

Un p-valor por debajo de 0.05 indica que hay una diferencia estadísticamente significativa entre las distribuciones de los dos grupos. No te dice cuán grande es esa diferencia ni si es relevante en la práctica. Para eso, deberías calcular el tamaño del efecto por separado y mirar las medianas de cada grupo.

¿Puedo usar la U de Mann-Whitney con datos pareados?

No. La U de Mann-Whitney asume que los dos grupos son independientes, es decir, que los valores de uno no influyen en los del otro. Si tus datos están pareados —por ejemplo, mediciones antes y después en las mismas personas—, usa en su lugar la prueba de rangos con signo de Wilcoxon. Aplicar la U de Mann-Whitney a datos pareados ignora la relación entre observaciones y produce resultados poco fiables.

Temas

Aprende con DataCamp

programa

Analista de datos en R

36 h
Desde el análisis exploratorio de datos con dplyr hasta la visualización de datos con ggplot2, ¡adquiere los conocimientos de R que necesitas para tener éxito como analista de datos!
Ver detallesRight Arrow
Iniciar curso
Ver másRight Arrow
Relacionado

Tutorial

Tutorial de pruebas T en R: Aprende a realizar pruebas T

Determina si existe una diferencia significativa entre las medias de los dos grupos utilizando t.test() en R.
Abid Ali Awan's photo

Abid Ali Awan

Tutorial

Prueba Chi-cuadrado en hojas de cálculo

En este tutorial, aprenderás a realizar la prueba chi-cuadrado en hojas de cálculo.
Avinash Navlani's photo

Avinash Navlani

Tutorial

Pruebas de hipótesis fáciles

La comprobación de hipótesis es un método estadístico utilizado para evaluar afirmaciones sobre poblaciones basadas en datos muestrales.

Tutorial

Prueba de normalidad: cómo comprobar si tus datos siguen una distribución normal

Descubre qué es una prueba de normalidad, por qué importa y cómo usar pruebas como Shapiro-Wilk, Kolmogorov-Smirnov y métodos visuales para comprobar tus datos, con ejemplos en Python y R.
Dario Radečić's photo

Dario Radečić

Tutorial

Cómo calcular la desviación estándar en Excel

Para calcular la desviación estándar en Excel, introduce tus datos en un rango de celdas y utiliza =STDEV.S() para datos de muestra o =STDEV.P() para datos de población.
Arunn Thevapalan's photo

Arunn Thevapalan

Tutorial

Guía completa para utilizar ANOVA en Excel

Aprende el proceso simplificado de realizar ANOVA en Excel, e interpretar los resultados con instrucciones claras, paso a paso.
Arunn Thevapalan's photo

Arunn Thevapalan

Ver másVer más