Saltar al contenido principal
Documentos
Gestión de datos en RGráficos en RR DocumentaciónInterfaz REstadística en RIntroducción de datos en R

Estadísticas descriptivas en R

R proporciona una amplia gama de funciones para obtener estadísticas de resumen. Un método para obtener estadísticas descriptivas es utilizar la función sapply( ) con una estadística de resumen especificada.

# get means for variables in data frame mydata
# excluding missing values

sapply(mydata, mean, na.rm=TRUE)

Las posibles funciones utilizadas en sapply son media, sd, var, min, max, mediana, rango y cuantil.

También hay numerosas funciones de R diseñadas para proporcionar una serie de estadísticas descriptivas a la vez. Por ejemplo

# mean,median,25th and 75th quartiles,min,max
summary(mydata)

# Tukey min,lower-hinge, median,upper-hinge,max
fivenum(x)

Utilizar el paquete Hmisc

library(Hmisc)
describe(mydata)
# n, nmiss, unique, mean, 5,10,25,50,75,90,95th percentiles
# 5 lowest and 5 highest scores

Utilizando los pastecs paquete

library(pastecs)
stat.desc(mydata)

# nbr.val, nbr.null, nbr.na, min max, range, sum,
#
median, mean, SE.mean, CI.mean, var, std.dev, coef.var

Utilizar el paquete psicológico

library(psych)
describe(mydata)
# item name ,item number, nvalid,
mean, sd,
#
median, mad, min, max, skew, kurtosis, se

Estadísticas resumidas por grupo

En el paquete psicológico existe una forma sencilla de generar estadísticas de resumen mediante la agrupación de variables.

library(psych)
describe.by(mydata, group,...)

El paquete doBy proporciona gran parte de la funcionalidad de SAS PROC RESUMEN. Define la tabla deseada utilizando una fórmula modelo y una función. He aquí un ejemplo sencillo.

library(doBy)
summaryBy(mpg + wt ~ cyl + vs, data = mtcars,
  FUN = function(x) {
c(m = mean(x), s = sd(x))
} )
# produces mpg.m wt.m mpg.s wt.s for each
# combination of the levels of cyl and vs

Ver también: agregación de datos.

Practicar

¿Quieres practicar de forma interactiva? Prueba este curso gratuito sobre estadística y R

Aprende lo esencial de R

Domina los fundamentos del análisis de datos en R, incluyendo vectores, listas y marcos de datos, y practica R con conjuntos de datos reales.
Empieza a aprender R gratis