R proporciona una amplia gama de funciones para obtener estadísticas de resumen. Un método para obtener estadísticas descriptivas es utilizar la función sapply( ) con una estadística de resumen especificada.
# get means for variables in data frame mydata
# excluding missing values
sapply(mydata, mean, na.rm=TRUE)
Las posibles funciones utilizadas en sapply son media, sd, var, min, max, mediana, rango y cuantil.
También hay numerosas funciones de R diseñadas para proporcionar una serie de estadísticas descriptivas a la vez. Por ejemplo
library(psych)
describe(mydata)
# item name ,item number, nvalid,
mean, sd,
#
median, mad, min, max, skew, kurtosis, se
Estadísticas resumidas por grupo
En el paquete psicológico existe una forma sencilla de generar estadísticas de resumen mediante la agrupación de variables.
library(psych)
describe.by(mydata, group,...)
El paquete doBy proporciona gran parte de la funcionalidad de SAS PROC RESUMEN. Define la tabla deseada utilizando una fórmula modelo y una función. He aquí un ejemplo sencillo.
library(doBy)
summaryBy(mpg + wt ~ cyl + vs, data = mtcars,
FUN = function(x) {
c(m = mean(x), s = sd(x))
} )
# produces mpg.m wt.m mpg.s wt.s for each
# combination of the levels of cyl and vs