Direkt zum Inhalt
Urkunden
Datenmanagement in RDateneingabe in RGraphen in RR DokumentationR SchnittstelleStatistik in R

R Tutorial

Gewinnung von R

R ist für Linux, MacOS und Windows verfügbar. Die Software kann vom Comprehensive R Archive Network (CRAN) heruntergeladen werden.

Startup

Nachdem du R heruntergeladen und installiert hast, suchst du einfach nach R in deinem Programme-Ordner und startest es.

r Programm

Befehle eingeben

R ist ein kommandozeilengesteuertes Programm. Der Benutzer gibt die Befehle an der Eingabeaufforderung ein ( > standardmäßig) und jeder Befehl wird nacheinander ausgeführt.

r Konsole

Der Arbeitsbereich

Der Arbeitsbereich ist deine aktuelle R-Arbeitsumgebung und enthält alle benutzerdefinierten Objekte (Vektoren, Matrizen, Datenrahmen, Listen, Funktionen). Am Ende einer R-Sitzung kann der Nutzer ein Bild des aktuellen Arbeitsbereichs speichern, das beim nächsten Start von R automatisch wieder geladen wird.

Grafische Benutzeroberflächen

Abgesehen von der integrierten R-Konsole ist RStudio der beliebteste R-Code-Editor und bietet Schnittstellen zu R für Windows-, MacOS- und Linux-Plattformen.

Operatoren in R

Die binären und logischen Operatoren von R werden Programmierern sehr vertraut vorkommen. Beachte, dass binäre Operatoren nicht nur auf Skalare, sondern auch auf Vektoren und Matrizen wirken.

Zu den arithmetischen Operatoren gehören:

   
Betreiber Beschreibung
+ Zusatz
- Subtraktion
* Multiplikation
/ division
^ oder ** Potenzierung

Zu den logischen Operatoren gehören:

   
Betreiber Beschreibung
> größer als
>= größer als oder gleich
== genau gleich
!= nicht gleich

Datenarten

R verfügt über eine Vielzahl von Datentypen, darunter Skalare, Vektoren (numerisch, zeichenweise, logisch), Matrizen, Datenrahmen und Listen.

Neue Variablen erstellen

Verwende den Zuweisungsoperator <-, um neue Variablen zu erstellen.

# An example of computing the mean with variables

mydata$sum <- mydata$x1 + mydata$x2
mydata$mean <- (mydata$x1 + mydata$x2)/2

Funktionen

Fast alles in R wird über Funktionen erledigt. Eine Funktion ist ein Stück Code, das geschrieben wurde, um eine bestimmte Aufgabe auszuführen; sie kann Argumente oder Parameter akzeptieren (oder auch nicht) und sie kann einen oder mehrere Werte zurückgeben (oder auch nicht!). In R wird eine Funktion mit dem Konstrukt definiert:

function ( arglist ) {body}

Der Code zwischen den geschweiften Klammern ist der Körper der Funktion. Wenn du eingebaute Funktionen verwendest, musst du dich nur darum kümmern, wie du die richtigen Eingabeargumente (arglist) und den/die Rückgabewert/e (falls vorhanden) effektiv übermitteln kannst.

Daten importieren

Der Import von Daten in R ist ziemlich einfach. R bietet die Möglichkeit, viele Dateitypen zu importieren, von CSV-Dateien bis hin zu Datenbanken.

So kannst du zum Beispiel eine CSV-Datei in R importieren.

# first row contains variable names, comma is separator
# assign the variable id to row names
# note the / instead of \ on mswindows systems

mydata <- read.table("c:/mydata.csv", header=TRUE,
  sep=",", row.names="id")

Deskriptive Statistik

R bietet eine breite Palette von Funktionen, um zusammenfassende Statistiken zu erstellen. Eine Möglichkeit, deskriptive Statistiken zu erhalten, ist die Verwendung der Funktion sapply( ) mit einer bestimmten zusammenfassenden Statistik.

Im Folgenden wird beschrieben, wie du den Mittelwert mit der Funktion sapply( ) ermittelst:

# get means for variables in data frame mydata
# excluding missing values
sapply(mydata, mean, na.rm=TRUE)

Mögliche Funktionen, die in sapply verwendet werden, sind mean, sd, var, min, max, median, range und quantile.

Plotten in R

In R werden Diagramme normalerweise interaktiv erstellt. Hier ist ein Beispiel:

# Creating a Graph
attach(mtcars)
plot(wt, mpg)
abline(lm(mpg~wt))
title("Regression of MPG on Weight")

Die Funktion plot( ) öffnet ein Grafikfenster und stellt das Gewicht im Verhältnis zu den gefahrenen Kilometern pro Gallone dar. Die nächste Codezeile fügt eine Regressionslinie zu diesem Diagramm hinzu. In der letzten Zeile wird ein Titel hinzugefügt.

Plot in r

Pakete

Pakete sind Sammlungen von R-Funktionen, Daten und kompiliertem Code in einem genau definierten Format. Das Verzeichnis, in dem die Pakete gespeichert werden, heißt Bibliothek. R wird mit einer Reihe von Standardpaketen geliefert. Andere stehen zum Download und zur Installation zur Verfügung. Sobald sie installiert sind, müssen sie in die Sitzung geladen werden, damit sie verwendet werden können.

.libPaths() # get library location
library()   # see all packages installed
search()    # see packages currently loaded

Hilfe bekommen

Sobald R installiert ist, gibt es ein umfassendes eingebautes Hilfesystem. In der Eingabeaufforderung des Programms kannst du eine der folgenden Möglichkeiten verwenden:

help.start()   # general help
help(foo)      # help about function foo
?foo           # same thing
apropos("foo") # list all functions containing string foo
example(foo)   # show an example of function foo

Weiter gehen

Wenn du eine interaktive Online-Umgebung bevorzugst, um R zu lernen, ist dieses kostenlose R-Tutorial von DataCamp eine gute Möglichkeit, um loszulegen.

R Grundlagen lernen

Beherrsche die Grundlagen der Datenanalyse in R, einschließlich Vektoren, Listen und Datenrahmen, und übe R mit echten Datensätzen.
Beginne R kostenlos zu lernen