Saltar al contenido principal
InicioTutorialesAnálisis de datos

Desviación típica de la muestra: Las ideas clave

Aprende a calcular la desviación típica muestral y comprende su importancia en el análisis estadístico. Explora ejemplos y buenas prácticas para la interpretación de datos del mundo real.
Actualizado 1 oct 2024  · 6 min leer

La desviación típica muestral es una medida estadística utilizada para cuantificar la variación dentro de un conjunto de datos. Concretamente, nos dice cuánto difieren los puntos de datos individuales de una muestra de la media muestral.

La desviación típica de la muestra es importante en estadística inferencial si quieres sacar conclusiones sobre una población determinada o, como dirían los estadísticos, hacer inferencias de una muestra a una población. Para comprender estas distinciones, te recomiendo que sigas los cursos Introducción a la Estadística y Estadística Básica de DataCamp para familiarizarte con los conceptos estadísticos. Como nota final, si te tomas en serio la estadística y estás interesado en una carrera profesional utilizando la estadística, consulta la guía de DataCamp sobre Cómo convertirse en estadístico.

¿Qué es la desviación típica de la muestra?

La desviación típica muestral es una medida estadística que cuantifica la variación o dispersión de un conjunto de datos. La desviación típica de la muestra se calcula como la raíz cuadrada de la varianza de la muestra, donde la varianza de la muestra es la suma de las diferencias al cuadrado respecto a la media, dividida por el tamaño de la muestra menos uno. Utilizamos la desviación típica muestral cuando queremos saber cuánto difieren los puntos de datos de una muestra de la media muestral.

Cómo calcular la desviación típica de la muestra

Utilizamos una fórmula específica para calcular la desviación típica de la muestra.

Fórmula para la desviación típica de la muestra

Aquí tienes la fórmula de la desviación típica de muestra:

Fórmula de la desviación típica de la muestra.

Fórmula de la desviación típica de la muestra. Imagen del autor.

Dónde:

  • s = desviación típica de la muestra
  • n = número de puntos de datos de la muestra
  • x = punto de datos individual
  • x̄ = media muestral
  • n-1 = el factor de corrección para los datos de la muestra

Ten en cuenta que al calcular la desviación típica de la muestra, utilizamos n-1 en el denominador para corregir el sesgo de la muestra. Esto se conoce como corrección de Bessel. Si nos interesara la desviación típica de la población, utilizaríamos n en el denominador .

Cómo calcular a mano la desviación típica muestral

Veamos en el siguiente ejemplo cómo calcular la desviación típica muestral utilizando la fórmula. Supón que tienes un subconjunto de datos con los siguientes valores:

Debes seguir estos pasos:

Paso 1: Calcula la media muestral

Halla la media de los puntos de datos.

Paso 2: Halla las diferencias al cuadrado respecto a la media

Resta la media y eleva al cuadrado el resultado de cada punto de datos

Paso 3: Suma las desviaciones al cuadrado

Suma las diferencias al cuadrado respecto a la media.

Paso 4: Introduce las variables calculadas en la fórmula

Sustituye los valores en la fórmula para obtener la desviación típica muestral.

A partir del cálculo anterior, vemos que la desviación típica de los datos es de aproximadamente 2,28. Ahora bien, si calcular la desviación típica muestral a mano no te resulta práctico ni útil, y necesitas utilizar una herramienta como Excel, consulta nuestro tutorial sobre Cómo calcular la desviación típica en Excel.

¿Por qué utilizar la desviación típica muestral?

La desviación típica de la muestra es una medida preferida de la variabilidad cuando se necesita una estimación de la desviación típica de la población basada en una muestra. La corrección de Bessel(n-1) en la fórmula ajusta el sesgo y mejora la precisión de la estimación, ya que la muestra puede no representar perfectamente a la población. Si el denominador es menor, aumentan la varianza y la desviación típica calculadas. Esto compensa la tendencia de las muestras más pequeñas a subestimar la variabilidad.

Importancia de la desviación típica de la muestra

La desviación típica de la muestra es importante para estimar los parámetros de la población. Echemos un vistazo.

Cálculo de intervalos de confianza 

Los intervalos de confianza pueden calcularse utilizando la desviación típica de la muestra o la desviación típica de la población, según cuál esté disponible. Si se desconoce la desviación típica de la población, se utiliza la desviación típica de la muestra y se aplica una distribución t para estimar el intervalo de valores que probablemente contenga la media de la población. Una desviación típica menor de la muestra o la población conduce a un intervalo de confianza más estrecho, lo que indica una mayor precisión en la estimación.

Comprobación de hipótesis 

En las pruebas de hipótesis, se puede utilizar la desviación típica de la muestra o la desviación típica de la población, dependiendo de cuál se conozca. Si se desconoce la desviación típica de la población, se aplica la desviación típica de la muestra, y se suele utilizar la distribución t para evaluar la estadística de la prueba. Cuando se conoce la desviación típica de la población, se utiliza en su lugar la distribución z, que proporciona más precisión. Una desviación típica menor, ya sea de la muestra o de la población, da lugar a una prueba más sensible, que facilita la detección de diferencias significativas.

Desviación típica de la muestra y términos relacionados

Veamos algunos términos relacionados con la desviación típica muestral. Confundir estos términos puede conducir a errores comunes. 

Desviación típica frente a varianza

Tanto la desviación típica de la muestra como la varianza miden la variabilidad de un conjunto de datos. Sin embargo, expresan la variabilidad de forma diferente. La varianza de un conjunto de datos mide la media de las diferencias al cuadrado entre cada punto de datos y la media. Así, la varianza se expresa en unidades al cuadrado. En cambio, la desviación típica se calcula como la raíz cuadrada de la varianza, por lo que la desviación típica se expresa en las mismas unidades que los datos.

Desviación típica de la muestra vs. desviación típica de la población

Veamos dos supuestos que nos ayudarán a diferenciar entre desviación típica muestral y desviación típica poblacional.

Trabajar con datos de muestra

La desviación típica muestral se utiliza cuando utilizas un subconjunto de una población grande. Imagina que estás realizando una encuesta de satisfacción del cliente para una empresa minorista. Recoges las respuestas de unos 200 clientes para hacer inferencias sobre la satisfacción de la clientela de la cadena minorista. En este caso, utilizarás la desviación típica muestral para hacer inferencias, ya que estás trabajando con un subconjunto de una población grande.

Trabajar con datos de población

La desviación típica poblacional es adecuada cuando tienes los datos completos de toda una población. En este caso, no necesitarás tener en cuenta el sesgo, ya que se tendrían en cuenta todos los puntos de datos. Ahora, imagina que eres el RRHH de una empresa con 50 empleados y quieres calcular la variabilidad de sus salarios. Utilizarás la desviación típica de la población, ya que conoces el salario de cada empleado.

Muestra de desviación estándar en Python y R

Cuando se utiliza R para calcular la desviación típica, la función sd() calcula por defecto la desviación típica de la muestra con n-1 en el denominador.

# Sample standard deviation
data <- c(10, 12, 15, 18, 20)
sample_sd <- sd(data)
print(round(sample_sd, 2))
4.12

Sin embargo, los paquetes de Python como NumPy y Pandas asumen la desviación típica de la población a menos que se especifique lo contrario. Por ejemplo, numpy.std() utiliza n en el denominador por defecto, tratando los datos como una población. 

# Import numpy library
import numpy as np
data = [10, 12, 15, 18, 20]
population_sd = np.std(data)  # Population standard deviation
print(round(population_sd, 2))
3.69

Si quieres la desviación típica muestral en su lugar, puedes pasar ddof=1 para ajustar los grados de libertad.

sample_sd = np.std(data, ddof=1)  # Sample standard deviation
print(round(sample_sd, 2))
4.12

Si trabajas con estadística en un entorno de programación, te recomendaría nuestro curso de habilidades Inferencia estadística con R o el curso Fundamentos de la inferencia en Python para desarrollar un conjunto básico de habilidades. 

Conclusión

La desviación típica de la muestra es una medida estadística importante para cuantificar la variación y hacer inferencias. Si quieres avanzar en tus conocimientos de estadística y análisis de datos, te recomiendo que eches un vistazo a los itinerarios profesionales de Analista de Datos con R y Analista de Datos con Python de DataCamp, que ofrecen conocimientos exhaustivos y relevantes para el sector. Nuestro curso de Análisis de Datos en Excel también es adecuado si quieres convertirte en un analista empresarial centrado en la toma de decisiones basadas en datos.


Photo of Allan Ouko
Author
Allan Ouko
LinkedIn
Creo artículos que simplifican la ciencia de los datos y la analítica, haciéndolos fáciles de entender y accesibles.

Preguntas frecuentes

¿Cuál es la diferencia entre desviación típica muestral y poblacional?

La desviación típica de la muestra se utiliza cuando se calcula la variabilidad de un subconjunto de datos para hacer inferencias sobre la población. La desviación típica poblacional se utiliza cuando tienes datos de cada miembro de la población.

¿Por qué utilizamos n-1 en lugar de n al calcular la desviación típica muestral?

Utilizamos n-1 para tener en cuenta que estamos trabajando con una muestra, no con toda la población. Este ajuste ayuda a reducir el sesgo y proporciona una estimación más precisa de la desviación típica de la población.

¿En qué se diferencia la desviación típica muestral de la varianza?

La varianza es la media de las diferencias al cuadrado respecto a la media, expresada en unidades al cuadrado. La desviación típica es la raíz cuadrada de la varianza y se expresa en las mismas unidades que los datos.

¿Puede ser negativa la desviación típica de la muestra?

No, la desviación típica muestral no puede ser negativa porque es la raíz cuadrada de la varianza, que siempre es un número no negativo.

¿Qué tipos de datos son apropiados para calcular la desviación típica?

La desviación típica es adecuada para datos numéricos continuos que siguen una distribución normal. No es adecuado para datos categóricos o distribuciones muy sesgadas.

Temas

Aprende Estadística con DataCamp

Course

Introduction to Statistics

4 hr
77.6K
Learn the fundamentals of statistics, including measures of center and spread, probability distributions, and hypothesis testing with no coding involved!
See DetailsRight Arrow
Start Course
Ver másRight Arrow
Relacionado

blog

¿Qué es el análisis de datos? Una guía experta con ejemplos

Explora el mundo del análisis de datos con nuestra completa guía. Conoce su importancia, proceso, tipos, técnicas, herramientas y principales carreras en 2023
Matt Crabtree's photo

Matt Crabtree

15 min

blog

¿Qué es la gestión de datos? Guía práctica con ejemplos

Aprende los conceptos y teorías fundamentales de la gestión de datos, junto con algunos ejemplos prácticos. Utiliza estas habilidades en tu trabajo diario de ciencia de datos para generar datos limpios y útiles para tus modelos.
Tim Lu's photo

Tim Lu

12 min

blog

11 técnicas de visualización de datos para cada caso de uso con ejemplos

Descubra los análisis, técnicas y herramientas más populares para dominar el arte de la visualización de datos.

tutorial

Cómo calcular la desviación típica en Excel

Para calcular la desviación típica en Excel, introduce tus datos en un rango de celdas y utiliza =STDEV.S() para datos de muestra o =STDEV.P() para datos de población.
Arunn Thevapalan's photo

Arunn Thevapalan

10 min

tutorial

Tutorial de pruebas T en R: Aprende a realizar pruebas T

Determina si existe una diferencia significativa entre las medias de los dos grupos utilizando t.test() en R.
Abid Ali Awan's photo

Abid Ali Awan

10 min

tutorial

Comprender la asimetría y la curtosis y cómo trazarlas

Una completa guía visual sobre la asimetría/curtosis y cómo afectan a las distribuciones y, en última instancia, a tu proyecto de ciencia de datos.
Bex Tuychiev's photo

Bex Tuychiev

10 min

See MoreSee More