Accéder au contenu principal
Documents
Partager
LinkedIn
Facebook
Twitter
Copy
R DocumentationEntrée de données en RGestion des données en RGraphiques en RR InterfaceStatistiques en R

Graphiques en boîte en R

Les diagrammes en boîte peuvent être créés pour des variables individuelles ou pour des variables par groupe. Le format est boxplot(x</em>, data=), où x est une formule et data= désigne le cadre de données fournissant les données. Un exemple de formule est y~groupe où un boxplot séparé pour la variable numérique y est généré pour chaque valeur de groupe. Ajoutez varwidth=TRUE pour que la largeur des boxplots soit proportionnelle à la racine carrée de la taille des échantillons. Ajoutez horizontal=TRUE pour inverser l'orientation de l'axe.

# Boxplot of MPG by Car Cylinders

boxplot(mpg~cyl,data=mtcars, main="Car Milage Data",
   xlab="Number of Cylinders", ylab="Miles Per Gallon")

diagramme en boîte simple

# Notched Boxplot of Tooth Growth Against 2 Crossed Factors
# boxes colored for ease of interpretation

boxplot(len~supp*dose, data=ToothGrowth, notch=TRUE,
  col=(c("gold","darkgreen")),
  main="Tooth Growth", xlab="Suppliment and Dose")

diagramme en boîte coloré

Dans le diagramme à encoches, si les encoches de deux boîtes ne se chevauchent pas, il s'agit d'une "preuve solide" que leurs médianes sont différentes (Chambers et al., 1983, p. 62).

Les couleurs se recyclent. Dans l'exemple ci-dessus, si j'avais listé 6 couleurs, chaque case aurait sa propre couleur. Earl F. Glynn a créé une liste de couleurs facile à utiliser</a > au format PDF.

Autres options

La fonction boxplot.matrix( ) du paquet sfsmisc</a > dessine un boxplot pour chaque colonne (ligne) d'une matrice. La fonction boxplot.n( ) du paquet gplots</a > annote chaque boxplot avec la taille de l'échantillon. La fonction bplot( ) de l'application Rlab offre de nombreuses autres options permettant de contrôler le positionnement et l'étiquetage des boîtes dans le résultat.

Les intrigues au violon

Un diagramme de violon est une combinaison d'un diagramme en boîte et d'un diagramme de densité de noyau. Ils peuvent être créés à l'aide de la fonction vioplot( ) du paquet vioplot</a >.

# Violin Plots
library(vioplot)
x1 <- mtcars$mpg[mtcars$cyl==4]
x2 <- mtcars$mpg[mtcars$cyl==6]
x3 <- mtcars$mpg[mtcars$cyl==8]
vioplot(x1, x2, x3, names=c("4 cyl", "6 cyl", "8 cyl"),
   col="gold")
title("Violin Plots of Miles Per Gallon")

parcelles de violon

Bagplot - Une extension de diagramme en boîte 2D

La fonction bagplot(x, y) du paquet aplpack</a > fournit une version bivariée du boxplot univarié. Le sac contient 50% de tous les points. La médiane bivariée est approximée. La clôture sépare les points situés à l'intérieur de la clôture des points situés à l'extérieur. Les valeurs aberrantes sont affichées.

# Example of a Bagplot
library(aplpack)
attach(mtcars)
bagplot(wt,mpg, xlab="Car Weight", ylab="Miles Per Gallon",
  main="Bagplot Example")

bagplot

Pratiquer

Essayez les exercices de boxplot dans ce cours sur le tracé et la visualisation de données en R.</a >