Boxplots in R
Boxplots können für einzelne Variablen oder für Variablen nach Gruppen erstellt werden. Das Format ist Boxplot(x</em>, data=), wobei x eine Formel ist und data= den Datenrahmen bezeichnet, der die Daten liefert. Ein Beispiel für eine Formel ist y~group, bei der für jeden Wert von group ein eigener Boxplot für die numerische Variable y erstellt wird. Füge varwidth=TRUE hinzu, damit die Breite der Boxplots proportional zur Quadratwurzel der Stichprobengröße ist. Füge horizontal=TRUE hinzu, um die Ausrichtung der Achse umzukehren.
# Boxplot of MPG by Car Cylinders
boxplot(mpg~cyl,data=mtcars, main="Car Milage Data",
xlab="Number of Cylinders", ylab="Miles Per Gallon")
# Notched Boxplot of Tooth Growth Against 2 Crossed Factors
# boxes colored for ease of interpretation
boxplot(len~supp*dose, data=ToothGrowth, notch=TRUE,
col=(c("gold","darkgreen")),
main="Tooth Growth", xlab="Suppliment and Dose")
Wenn sich die Kerben zweier Boxen nicht überschneiden, ist das ein "starker Hinweis" darauf, dass sich ihre Mediane unterscheiden (Chambers et al., 1983, S. 62).
Farben recyceln. Wenn ich im obigen Beispiel 6 Farben aufgelistet hätte, hätte jedes Feld seine eigene Farbe. Earl F. Glynn hat eine einfach zu verwendende Liste von Farben</a > im PDF-Format erstellt.
Andere Optionen
Die Funktion boxplot.matrix( ) aus dem Paket sfsmisc</a > zeichnet einen Boxplot für jede Spalte (Zeile) in einer Matrix. Die Funktion boxplot.n( ) im Paket gplots</a > versieht jeden Boxplot mit seinem Stichprobenumfang. Die Funktion bplot( ) im Rlab-Paket bietet viele weitere Optionen, um die Positionierung und Beschriftung der Boxen in der Ausgabe zu steuern .
Violine Plots
Ein Violinplot ist eine Kombination aus einem Boxplot und einem Kernel-Density-Plot. Sie können mit der Funktion vioplot( ) aus dem Paket vioplot</a > erstellt werden.
# Violin Plots
library(vioplot)
x1 <- mtcars$mpg[mtcars$cyl==4]
x2 <- mtcars$mpg[mtcars$cyl==6]
x3 <- mtcars$mpg[mtcars$cyl==8]
vioplot(x1, x2, x3, names=c("4 cyl", "6 cyl", "8 cyl"),
col="gold")
title("Violin Plots of Miles Per Gallon")
Bagplot - Eine 2D Boxplot-Erweiterung
Die Funktion bagplot(x, y) aus dem aplpack</a >Paket bietet eine bivariate Version des univariaten Boxplots. Die Tasche enthält 50% aller Punkte. Der bivariate Median wird angenähert. Der Zaun trennt Punkte innerhalb des Zauns von Punkten außerhalb. Ausreißer werden angezeigt.
# Example of a Bagplot
library(aplpack)
attach(mtcars)
bagplot(wt,mpg, xlab="Car Weight", ylab="Miles Per Gallon",
main="Bagplot Example")
Zum Üben
Probiere die Boxplot-Übungen in diesem Kurs über Plotten und Datenvisualisierung in R aus.</a >