Graphiques en boîte en R
Les diagrammes en boîte peuvent être créés pour des variables individuelles ou pour des variables par groupe. Le format est boxplot(x</em>, data=), où x est une formule et data= désigne le cadre de données fournissant les données. Un exemple de formule est y~groupe où un boxplot séparé pour la variable numérique y est généré pour chaque valeur de groupe. Ajoutez varwidth=TRUE pour que la largeur des boxplots soit proportionnelle à la racine carrée de la taille des échantillons. Ajoutez horizontal=TRUE pour inverser l'orientation de l'axe.
# Boxplot of MPG by Car Cylinders
boxplot(mpg~cyl,data=mtcars, main="Car Milage Data",
xlab="Number of Cylinders", ylab="Miles Per Gallon")
# Notched Boxplot of Tooth Growth Against 2 Crossed Factors
# boxes colored for ease of interpretation
boxplot(len~supp*dose, data=ToothGrowth, notch=TRUE,
col=(c("gold","darkgreen")),
main="Tooth Growth", xlab="Suppliment and Dose")
Dans le diagramme à encoches, si les encoches de deux boîtes ne se chevauchent pas, il s'agit d'une "preuve solide" que leurs médianes sont différentes (Chambers et al., 1983, p. 62).
Les couleurs se recyclent. Dans l'exemple ci-dessus, si j'avais listé 6 couleurs, chaque case aurait sa propre couleur. Earl F. Glynn a créé une liste de couleurs facile à utiliser</a > au format PDF.
Autres options
La fonction boxplot.matrix( ) du paquet sfsmisc</a > dessine un boxplot pour chaque colonne (ligne) d'une matrice. La fonction boxplot.n( ) du paquet gplots</a > annote chaque boxplot avec la taille de l'échantillon. La fonction bplot( ) de l'application Rlab offre de nombreuses autres options permettant de contrôler le positionnement et l'étiquetage des boîtes dans le résultat.
Les intrigues au violon
Un diagramme de violon est une combinaison d'un diagramme en boîte et d'un diagramme de densité de noyau. Ils peuvent être créés à l'aide de la fonction vioplot( ) du paquet vioplot</a >.
# Violin Plots
library(vioplot)
x1 <- mtcars$mpg[mtcars$cyl==4]
x2 <- mtcars$mpg[mtcars$cyl==6]
x3 <- mtcars$mpg[mtcars$cyl==8]
vioplot(x1, x2, x3, names=c("4 cyl", "6 cyl", "8 cyl"),
col="gold")
title("Violin Plots of Miles Per Gallon")
Bagplot - Une extension de diagramme en boîte 2D
La fonction bagplot(x, y) du paquet aplpack</a > fournit une version bivariée du boxplot univarié. Le sac contient 50% de tous les points. La médiane bivariée est approximée. La clôture sépare les points situés à l'intérieur de la clôture des points situés à l'extérieur. Les valeurs aberrantes sont affichées.
# Example of a Bagplot
library(aplpack)
attach(mtcars)
bagplot(wt,mpg, xlab="Car Weight", ylab="Miles Per Gallon",
main="Bagplot Example")
Pratiquer
Essayez les exercices de boxplot dans ce cours sur le tracé et la visualisation de données en R.</a >