Direkt zum Inhalt
Urkunden
Datenmanagement in RDateneingabe in RGraphen in RR DokumentationR SchnittstelleStatistik in R

Neue Variablen in R erstellen

Verwende den Zuweisungsoperator <-, um neue Variablen zu erstellen. Hier gibt es eine breite Palette von Operatoren und Funktionen.

# Three examples for doing the same computations

mydata$sum <- mydata$x1 + mydata$x2
mydata$mean <- (mydata$x1 + mydata$x2)/2

attach(mydata)
mydata$sum <- x1 + x2
mydata$mean <- (x1 + x2)/2
detach(mydata)

mydata <- transform( mydata,
sum = x1 + x2,
mean = (x1 + x2)/2
)

(Um die Arbeit mit Variablen in R zu üben, kannst du das erste Kapitel dieses kostenlosen interaktiven Kurses ausprobieren).

Variablen neu kodieren

Um Daten umzukodieren, wirst du wahrscheinlich eine oder mehrere der Kontrollstrukturen von R verwenden.

# create 2 age categories

mydata$agecat <- ifelse(mydata$age > 70,
c("older"), c("younger"))

# another example: create 3 age categories

attach(mydata)
mydata$agecat[age > 75] <- "Elder"
mydata$agecat[age > 45 & age <= 75] <- "Middle Aged"
mydata$agecat[age <= 45] <- "Young"
detach(mydata)

Variablen umbenennen

Du kannst Variablen programmatisch oder interaktiv umbenennen.

# rename interactively
fix(mydata) # results are saved on close

# rename programmatically
library(reshape)
mydata <- rename(mydata, c(oldname="newname"))

# you can re-enter all the variable names in order
# changing the ones you need to change.the limitation
#
is that you need to enter all of them!
names(mydata) <- c("x1","age","y", "ses")

Variablentypen in R

R unterstützt eine Vielzahl von Variablentypen, die jeweils auf bestimmte Datenformen zugeschnitten sind:

  • Numerisch: Diese stellen Zahlen dar und können entweder ganze Zahlen oder Dezimalzahlen sein.
  • Charakter: Dieser Typ ist für Textdaten oder Zeichenketten gedacht.
  • Logisch: Diese sind binär und können die Werte TRUE oder FALSE annehmen.
  • Factor: Faktoren sind ideal für kategoriale Daten und können helfen, verschiedene Kategorien in einem Datensatz darzustellen.
  • Datum: Wie der Name schon sagt, wird dieser Typ für Datumswerte verwendet.

Wenn du neue Variablen erstellst, musst du sicherstellen, dass sie den richtigen Typ für deine Analyse haben. Wenn du dir nicht sicher bist, kannst du die Funktion class() verwenden, um den Typ einer Variablen zu überprüfen.

Überprüfen und Ändern von Variablentypen

Für eine genaue Analyse ist es wichtig, dass deine Variablen vom richtigen Typ sind:

  • Prüfen Variablenart: Die Funktion class() kann dir helfen, den Typ einer Variablen zu bestimmen.
  • Variablentyp ändern: Wenn du eine Variable von einem Typ in einen anderen umwandeln musst, bietet R Funktionen wie as.numeric(), as.character() und as.logical().

Variabler Umfang

Es ist wichtig, den Umfang einer Variablen zu verstehen:

  • Globale Variablen: Diese sind während deines gesamten Skripts oder deiner Sitzung zugänglich.
  • Lokale Variablen: Sie sind auf die Funktion oder die Umgebung beschränkt, in der sie erstellt wurden, und können nicht außerhalb davon aufgerufen werden. Wenn du neue Variablen erstellst, vor allem innerhalb von Funktionen, achte immer auf ihren Geltungsbereich, um unerwartetes Verhalten zu vermeiden.

Verwendung von Variablen mit Funktionen

Variablen spielen eine zentrale Rolle bei der Arbeit mit Funktionen:

  • Übergabe von Variablen: Du kannst Variablen als Argumente für Funktionen angeben, um dynamische Berechnungen auf der Grundlage von Variablenwerten zu ermöglichen.
  • Speichern von Funktionsausgängen: Funktionen können Werte zurückgeben, und du kannst diese Werte neuen oder bestehenden Variablen für weitere Analysen zuweisen.

Variable Operationen

Abhängig von ihrem Typ kannst du verschiedene Operationen mit Variablen durchführen:

  • Arithmetische Operationen: Für numerische Variablen kannst du die üblichen mathematischen Operationen wie Addition, Subtraktion, Multiplikation und Division durchführen.
  • String-Operationen: Bei Zeichenvariablen kannst du mit Operationen wie der Verkettung mehrere Zeichenketten zu einer einzigen kombinieren.

Variablen neu kodieren

Bei der Umkodierung werden die Werte einer Variablen unter bestimmten Bedingungen geändert. Du könntest zum Beispiel das Alter in Kategorien wie "jung", "mittleres Alter" und "Senior" einteilen. R bietet verschiedene Kontrollstrukturen, um diesen Prozess zu erleichtern. Achte beim Umkodieren immer darauf, dass die neuen Kategorien oder Werte logisch sinnvoll sind und dem Zweck deiner Analyse dienen.

Variablen umbenennen

Es kann vorkommen, dass du Variablen aus Gründen der Übersichtlichkeit oder Konsistenz umbenennen möchtest. R bietet zwei Möglichkeiten, um Variablen umzubenennen:

  • Interaktiv: Mit der Funktion fix() kannst du einen Dateneditor öffnen, in dem du Variablen direkt umbenennen kannst.
  • Programmatisch: Es gibt verschiedene Pakete und Funktionen in R, mit denen du Variablen innerhalb deines Skripts umbenennen kannst. Achte bei der Umbenennung darauf, dass die neuen Namen aussagekräftig sind und den Konventionen für die Benennung von Variablen in R entsprechen.

Häufig gestellte Fragen (FAQs) zu Variablen in R

Q: Was ist der Unterschied zwischen <- und = bei Zuweisungen in R?

A: Sowohl <- als auch = können für Zuweisungen in R verwendet werden. <- ist jedoch die traditionellere und bevorzugte Methode, besonders in Skripten und Funktionen. Der =-Operator wird oft in Funktionsaufrufen verwendet, um benannte Argumente anzugeben.

Q: Wie kann ich den Typ einer Variablen in R überprüfen?

A: Du kannst die Funktion class() verwenden, um den Typ oder die Klasse einer Variablen zu bestimmen. Diese Funktion gibt Werte wie "numerisch", "Zeichen", "Faktor" und so weiter zurück, je nach Typ der Variablen.

Q: Ich habe einer numerischen Variablen versehentlich einen Zeichenwert zugewiesen. Wie kann ich das korrigieren?

A: R bietet Typumwandlungsfunktionen wie as.numeric(), as.character() und as.logical(). Du kannst diese Funktionen verwenden, um eine Variable in den gewünschten Typ umzuwandeln.

Q: Was bedeutet "Variablen neu kodieren"?

A: Unter Umkodierung versteht man den Prozess der Veränderung oder Umwandlung der Werte einer Variablen anhand bestimmter Kriterien. Die Umwandlung einer kontinuierlichen Altersvariable in Alterskategorien (z. B. "jung", "mittleres Alter", "Senior") ist ein Beispiel für eine Umkodierung.

Q: Wie kann ich eine Variable in meinem Datensatz umbenennen?

A: R bietet mehrere Möglichkeiten, Variablen umzubenennen. Du kannst es interaktiv mit der Funktion fix() machen, die einen Dateneditor öffnet. Alternativ gibt es verschiedene R-Pakete und -Funktionen, die eine programmatische Umbenennung von Variablen ermöglichen.

Q: Wird bei Variablennamen in R zwischen Groß- und Kleinschreibung unterschieden?

A: Ja, bei Variablennamen in R wird zwischen Groß- und Kleinschreibung unterschieden. Das bedeutet, dass myVariable, MyVariable und myvariable als drei verschiedene Variablen behandelt werden würden.

Q: Kann ich Leerzeichen in Variablennamen verwenden?

A: Es wird nicht empfohlen, Leerzeichen in Variablennamen in R zu verwenden. Stattdessen kannst du Unterstriche (_) oder Punkte (.) verwenden, um Wörter in Variablennamen zu trennen, z. B. my_variable oder my.variable.

Q: Wie kann ich eine Variable aus meinem Arbeitsbereich löschen oder entfernen?

A: Du kannst die Funktion rm() gefolgt von dem Variablennamen verwenden, um sie aus deinem Arbeitsbereich zu entfernen. Es ist eine gute Praxis, unnötige Variablen zu löschen, um Speicherplatz freizugeben.

Q: Was ist der Unterschied zwischen lokalen und globalen Variablen?

A: Lokale Variablen sind auf die Funktion oder die Umgebung beschränkt, in der sie erstellt wurden, und können nicht außerhalb davon aufgerufen werden. Im Gegensatz dazu sind globale Variablen in deinem gesamten Skript oder deiner R-Sitzung zugänglich.

Q: Wie kann ich alle Variablen in meinem Arbeitsbereich anzeigen?

A: Du kannst die Funktion ls() verwenden, um alle Variablen aufzulisten, die sich derzeit in deinem Arbeitsbereich befinden.

R Grundlagen lernen

Beherrsche die Grundlagen der Datenanalyse in R, einschließlich Vektoren, Listen und Datenrahmen, und übe R mit echten Datensätzen.
Beginne R kostenlos zu lernen