R bietet eine Vielzahl von Methoden, um Daten vor der Analyse umzugestalten.
Transponieren
Verwende die Funktion t(), um eine Matrix oder einen Datenrahmen zu transponieren. Im letzteren Fall werden die Rownamen zu Variablennamen (Spalten).
# example using built-in dataset
mtcars
t(mtcars)
Das Reshape-Paket
Hadley Wickham hat ein umfassendes Paket namens reshape entwickelt, um Daten zu massieren. Sowohl eine Einleitung als auch ein Artikel sind verfügbar. Es gibt sogar ein Video!
Im Grunde genommen "verschmilzt" du die Daten so, dass jede Zeile eine eindeutige ID-Variablen-Kombination ist. Dann "gießt" du die geschmolzenen Daten in jede beliebige Form, die du möchtest. Hier ist ein sehr einfaches Beispiel.
mydata
id
Zeit
x1
x2
1
1
5
6
1
2
3
5
2
1
6
1
2
2
2
4
# example of melt function
library(reshape)
mdata <- melt(mydata, id=c("id","time"))
newdata
id
Zeit
variabel
Wert
1
1
x1
5
1
2
x1
3
2
1
x1
6
2
2
x1
2
1
1
x2
6
1
2
x2
5
2
1
x2
1
2
2
x2
4
# cast the melted data
# cast(data, formula, function)
subjmeans <- cast(mdata, id~variable, mean)
timemeans <- cast(mdata, time~variable, mean)
subjmeans
id
x1
x2
1
4
5.5
2
4
2.5
Die Zeit bedeutet
Zeit
x1
x2
1
5.5
3.5
2
2.5
4.5
Es gibt noch viel mehr, was du mit den Funktionen melt( ) und cast( ) machen kannst. In der Dokumentation findest du weitere Informationen.