R mean() Funktion: Beginne mit Durchschnittswerten

Berechne den Durchschnitt von numerischen, logischen und gewichteten Daten mit den eingebauten Mittelwertfunktionen von R. Verstehe, wie man mit fehlenden Werten umgeht und wende die Funktion auf Vektoren und Datenrahmen an.

Aktualisiert 19. Juni 2025 · 4 Min. lesen

Wenn es darum geht, numerische Daten in R zusammenzufassen, ist die Berechnung des Durchschnitts oft der erste Schritt. Das ist sowieso oft das Erste, was ich mache.

Der Begriff "Durchschnitt" muss sich nicht unbedingt auf den Mittelwert beziehen, aber in diesem Artikel gehe ich davon aus, dass er das tut, weil ich dir zeigen werde, wie du mit der Funktion mean() in R arbeitest, die das Standardwerkzeug von R für diesen Zweck ist.

Was macht mean() in R?

Die Funktion mean() berechnet den arithmetischen Durchschnitt von numerischen Daten. Mit anderen Worten: Sie summiert alle Werte in deinem Vektor oder deiner Spalte und teilt sie durch die Gesamtzahl der vorhandenen Werte. Da mean() Teil von R ist, musst du keine zusätzlichen Pakete laden. Es ist also sofort einsatzbereit, sobald du R öffnest.

Die mean()-Funktion Syntax

Wir wissen also, was mean() alles kann, aber schauen wir uns die grundlegende Syntax an, damit du sie anwenden kannst:

mean(x, na.rm = FALSE, ...)

x: Ein numerischer Vektor oder ein Objekt.
na.rm: Logisch. Wenn TRUE, mean(), werden die Werte von NA ignoriert.

Wenn wir weitermachen, solltest du wissen, dass der Umgang mit fehlenden Daten und die Arbeit mit verschiedenen Datenstrukturen einige Feinheiten mit sich bringt.

Berechnen des Mittelwerts eines numerischen Vektors in R

Am einfachsten ist es wahrscheinlich, den Mittelwert eines Vektors zu berechnen:

daily_temperatures <- c(72, 68, 75, 70, 69)
mean(daily_temperatures)

Diese Zeile ergibt den Durchschnitt von 72, 68, 75, 70 und 69, also 70,8.

Behandlung von fehlenden Werten mit na.rm in R

Echte Datensätze haben fehlende Werte. Wenn deine Daten fehlende Elemente enthalten, gibt mean() als Standardverhalten NA zurück. Das könnte dich überraschen, wenn du es nicht erwartest. Deshalb nehmen wir uns die Zeit, etwas über das na.rm Argument zu erfahren.

survey_scores <- c(82, 90, NA, 88, 85)
mean(survey_scores)

Wenn du dies ausführst, erhältst du NA. Um R anzuweisen, fehlende Werte zu ignorieren, setzt du einfach na.rm = TRUE:

mean(survey_scores, na.rm = TRUE)

Jetzt berechnet mean() den Durchschnitt nur anhand der verfügbaren Zahlen.

Verwendung von mean() mit Data Frames in R

Erweitern wir seine Anwendung auf Datenrahmen, die eine typische Struktur für Datensätze in R sind. Wenn du den Mittelwert einer bestimmten Spalte suchst, verwende einfach den Operator $:

student_scores <- data.frame(
  student_name = c("Amir", "Bianca", "Carlos"),
  math_score = c(92, 85, 88)
)

mean(student_scores$math_score)

Damit wird die durchschnittliche Punktzahl für alle Schüler in deinem Datenrahmen berechnet. Du kannst diesen Ansatz auf jede numerische Spalte anwenden (aber es muss eine numerische Spalte sein).

Mittelwert der logischen Werte in R

Bisher haben wir uns auf numerische Daten konzentriert, aber du wirst vielleicht überrascht sein zu erfahren, dass mean() auch mit logischen Vektoren funktioniert. Das ist ein kleines, aber wichtiges Detail, das ich bisher übersehen habe.

Du kannst mean() mit logischen Werten verwenden, weil TRUE in R als 1 und FALSE als 0 behandelt wird. Wenn du also den Mittelwert eines logischen Vektors nimmst, erhältst du den Anteil der TRUE Werte. Das kann hilfreich sein, wenn du binäre Ergebnisse zusammenfassen musst.

quiz_passed_flags <- c(TRUE, FALSE, TRUE, TRUE)
mean(quiz_passed_flags)

Hier ist das Ergebnis 0,75, da 3 von 4 Werten TRUE sind.

Ermittlung des gewichteten Mittelwerts in R

Manchmal brauchst du einen gewichteten Durchschnitt, wenn du denkst, dass verschiedene Werte ungleich zum Ergebnis beitragen. Gib weighted.mean() ein:

course_grades <- c(88, 92, 75)
assignment_weights <- c(0.3, 0.4, 0.3)

weighted.mean(course_grades, assignment_weights)

Wenn du weighted.mean() verwendest, kannst du die unterschiedliche Wichtigkeit oder Häufigkeit deiner Werte berücksichtigen. mean() tut dies nicht von alleine.

Einige Dinge, auf die du achten solltest

Die meisten dieser Dinge habe ich bereits erwähnt, aber lass mich mögliche Probleme oder Anmerkungen an einem Ort notieren:

Nicht-numerische Daten: Wenn dein Vektor oder deine Spalte nicht numerisch oder logisch ist, wird mean() einen Fehler ausgeben.
NA Handhabung: Wenn du vergisst, na.rm = TRUE zu benutzen, wenn dir Daten fehlen, wirst du jedes Mal auf die Nase fallen.
Leere Vektoren: mean(numeric(0)) gibt NA mit einer Warnung zurück.

Fazit

Bei den meisten grundlegenden Datenanalyseaufgaben ist mean() deine erste Anlaufstelle, um Zahlen zusammenzufassen.

Lerne weiter mit unseren Kursen, wie Einführung in R und Explorative Datenanalyse in R.

Author

Josef Waples

Themen

Datenanalyse

R lernen mit DataCamp

Kurs

Einführung in R

4 Std.

Beherrsche die Grundlagen der Datenanalyse in R, einschließlich Vektoren, Listen und Datenrahmen, und übe R mit echten Datensätzen.

Details anzeigen

Kurs starten

Kurs

Explorative Datenanalyse in R

4 Std.

117.8K

Hier erfährst du, wie du mit grafischen und numerischen Techniken die Struktur deiner Daten ermittelst.

Details anzeigen

Kurs starten

Kurs

Einführung in Regression mit R

4 Std.

77.2K

Sag die Immobilienpreise und die Klickrate von Anzeigen voraus, indem du Regressionsanalysen in R machst, analysierst und interpretierst.

Details anzeigen

Kurs starten

Verwandt

Blog

2022-2023 DataCamp Classrooms Jahresbericht

Zu Beginn des neuen Schuljahres ist DataCamp Classrooms motivierter denn je, das Lernen mit Daten zu demokratisieren. In den letzten 12 Monaten sind über 7.650 neue Klassenzimmer hinzugekommen.

Nathaniel Taylor-Leach

8 Min.

Blog

Lehrer/innen und Schüler/innen erhalten das Premium DataCamp kostenlos für ihre gesamte akademische Laufbahn

Keine Hacks, keine Tricks. Schüler/innen und Lehrer/innen, lest weiter, um zu erfahren, wie ihr die Datenerziehung, die euch zusteht, kostenlos bekommen könnt.

Nathaniel Taylor-Leach

4 Min.

Blog

Q2 2023 DataCamp Donates Digest

DataCamp Donates hat im zweiten Quartal 2023 über 20.000 Stipendien an unsere gemeinnützigen Partner vergeben. Erfahre, wie fleißige benachteiligte Lernende diese Chancen in lebensverändernde berufliche Erfolge verwandelt haben.

Nathaniel Taylor-Leach

Blog

Die 20 besten Snowflake-Interview-Fragen für alle Niveaus

Bist du gerade auf der Suche nach einem Job, der Snowflake nutzt? Bereite dich mit diesen 20 besten Snowflake-Interview-Fragen vor, damit du den Job bekommst!

Nisha Arya Ahmed

15 Min.

Mehr anzeigen Mehr anzeigen

Was macht mean() in R?

Die mean()-Funktion Syntax

Berechnen des Mittelwerts eines numerischen Vektors in R

Behandlung von fehlenden Werten mit na.rm in R

Verwendung von mean() mit Data Frames in R

Mittelwert der logischen Werte in R

Ermittlung des gewichteten Mittelwerts in R

Einige Dinge, auf die du achten solltest

Ähnliche Funktionen in R

Fazit

2022-2023 DataCamp Classrooms Jahresbericht

Lehrer/innen und Schüler/innen erhalten das Premium DataCamp kostenlos für ihre gesamte akademische Laufbahn

Q2 2023 DataCamp Donates Digest

Die 20 besten Snowflake-Interview-Fragen für alle Niveaus

.css-1531qan{-webkit-text-decoration:none;text-decoration:none;color:inherit;}Einführung in R

Explorative Datenanalyse in R

Einführung in Regression mit R

2022-2023 DataCamp Classrooms Jahresbericht

Lehrer/innen und Schüler/innen erhalten das Premium DataCamp kostenlos für ihre gesamte akademische Laufbahn

Q2 2023 DataCamp Donates Digest

Die 20 besten Snowflake-Interview-Fragen für alle Niveaus

Einführung in R