Kurs
Ein umfassender Leitfaden zur Berechnung von Häufigkeitsverteilungen in Excel
Eine Häufigkeitsverteilung, die oft mit einem Häufigkeitshistogramm visualisiert wird, ordnet die Datenpunkte in bestimmte Bereiche ein und ermöglicht so ein einfaches Verständnis dafür, wie oft jeder Wert auftritt. Diese Technik ist wichtig, um Muster, Trends und potenzielle Ausreißer zu erkennen und tiefere Einblicke in die Daten zu erhalten.
In diesem Tutorium geht es um Häufigkeitsverteilungen, ihre Bedeutung für die Datenanalyse und wie man sie erstellt. Mit Microsoft Excel werden wir Schritt für Schritt eine Häufigkeitsverteilung für einen realen Datensatz erstellen und die Ergebnisse interpretieren, um aussagekräftige Erkenntnisse zu gewinnen.
Die schnelle Antwort: Wie man eine Häufigkeitsverteilung in Excel erstellt
Um eine Häufigkeitsverteilung in Excel zu erstellen, verwendest du die Funktion FREQUENCY()
. Die Funktion berechnet, wie oft Werte innerhalb bestimmter Bereiche, so genannter Bins, vorkommen.
Befolge diese Schritte:
- Beginne damit, deine Daten in eine Spalte einzutragen.
- Definiere deine Bins in einer anderen Spalte.
- Gib in eine neue Zelle
=FREQUENCY(data_array, bins_array)
ein, wobeidata_array
für den Bereich deiner Datenzellen undbins_array
für den Bereich deiner Bins steht. - Beispiel:
=FREQUENCY(A2:A16, B2:B6)
. - Drücke die Eingabetaste, um die Häufigkeitsverteilung zu erhalten.
Berechnung der Häufigkeitsverteilung mit der Funktion
FREQUENCY()
. Bild vom Autor
Warum Häufigkeitsverteilungen wichtig sind
Eine Häufigkeitsverteilung ist eine statistische Technik, die Daten in Kategorien oder Intervalle einteilt. Das Ergebnis ist in der Regel eine Tabelle, in der die Anzahl der Beobachtungen für ein bestimmtes Intervall der zugrunde liegenden Daten angezeigt wird.
Häufigkeitsverteilungen sind in mehrfacher Hinsicht hilfreich:
- Zusammenfassung der Daten: Häufigkeitsverteilungen fassen große Datensätze auf organisierte und verständliche Weise zusammen. So können wir uns schnell einen Überblick über die Verteilung der Werte verschaffen.
- Visuelle Repräsentation: Die Häufigkeitsverteilung kann leicht in Form von Histogrammen und Tortendiagrammen dargestellt werden, um ein visuelles Verständnis der Daten zu vermitteln.
- Erkennen von Mustern, Trends und Ausreißern: Sie zeigen Muster in den Daten auf, z. B. Spitzenwerte, Cluster und Ausreißer. Sie kann in der statistischen Analyse verwendet werden, um die Form und die Merkmale der Daten weiter zu untersuchen.
- Vergleich der Daten: Die Verteilung der Werte ermöglicht es dir, verschiedene Datensätze zu vergleichen und die Gemeinsamkeiten und Unterschiede zu verstehen.
- Kommunikation: Häufigkeitsverteilungen können als einfaches und effektives Instrument genutzt werden, um die Erkenntnisse aus den Daten einem breiteren Publikum, einschließlich Entscheidungsträgern, zu vermitteln.
- Entscheidungsfindung: Ein klares Verständnis der Verteilung und ihrer Muster hilft bei der Entscheidungsfindung. Wenn du z.B. das Warenangebot nach Jahreszeiten kennst, kannst du besser entscheiden, wann du einkaufst.
Nachdem wir nun die Häufigkeitsverteilungen und ihre Bedeutung verstanden haben, wollen wir uns mit verschiedenen Methoden beschäftigen, um sie in Microsoft Excel zu erstellen.
Methoden zur Erstellung einer Häufigkeitsverteilung in Excel
Stell dir vor, du arbeitest für ein Kosmetikunternehmen, das Produkte für eine breite Palette von Altersgruppen anbietet. Jetzt wollen sie sich auf ein paar Produkte spezialisieren, die auf eine bestimmte Altersgruppe abzielen, die mehr Kunden hat. Um das zu verstehen, sollst du die Kunden nach Altersgruppen analysieren.
Um dieses Problem zu lösen, haben sie Daten zum Alter der Kunden aus der Kundendatenbank entnommen. Die folgende Tabelle wurde dir zur Verfügung gestellt:
Datensatz zum Kundenalter. Bild vom Autor
Bei der Analyse der Nachfrage nach Kundenaltersgruppen hast du festgestellt, dass die Berechnung der Häufigkeitsverteilung ein guter Ausgangspunkt ist. Hier sind vier Methoden zur Berechnung der Häufigkeitsverteilung mit Microsoft Excel.
Methode 1: Mit dem FREQUENCY()
Funktion
Die Funktion FREQUENCY()
berechnet die Häufigkeitsverteilung der gegebenen Daten und gibt eine Liste zurück, die die Häufigkeit der Werte in bestimmten Intervallen zeigt.
Hier ist die Syntax der Funktion FREQUENCY()
:
=FREQUENCY(data_array, bins_array)
Die Funktion benötigt zwei Parameter:
data_array
: Ein Array oder ein Verweis auf eine Reihe von Werten, für die du die Häufigkeiten zählen möchtest. Wenn data_array keine Werte enthält, gibtFREQUENCY()
ein Array mit Nullen zurück.bins_array
: Ein Array von oder ein Verweis auf Intervalle, in die du die Werte in data_array gruppieren willst. Wenn bins_array keine Werte enthält, gibtFREQUENCY()
die Anzahl der Elemente in data_array zurück.
Beide Parameter werden benötigt, um die Häufigkeitsverteilung zu berechnen. Du erhältst nur die data_array
, also das Kundenalter. Deshalb musst du die bins_array
selbst definieren.
Für diesen Anwendungsfall können wir die Bins als <20, 20-30, 30-40, 40-50, 50-60 und >60 definieren. Fülle die Spalte B in deinem Arbeitsblatt aus, wie unten gezeigt.
Die Formel für die Häufigkeitsverteilung mit der Funktion
FREQUENCY()
. Bild vom Autor
Nachdem du die data_array
und bins_array
vorbereitet hast, schreibe die Formel zur Berechnung der Häufigkeitsverteilung in Zelle C2.
=FREQUENCY(A2:A16, B2:B6)
Die Ausgabe bei der Ausführung der obigen Formel sieht wie folgt aus:
Häufigkeitsverteilung mit der Funktion FREQUENCY()
. Bild vom Autor
Wenn wir uns die Häufigkeitsverteilung oben ansehen, sehen wir:
- Das Unternehmen hat nur einen Kunden, der weniger als 20 Jahre alt ist.
- Fünf Kunden sind im Alter von 20-30 und 30-40 Jahren.
- Drei Kunden sind im Alter von 40-50 Jahren.
- Ein Kunde ist im Alter von 50-60 Jahren.
- Kein Kunde ist älter als 60 Jahre.
Aus der Häufigkeitsverteilung kannst du ablesen, dass die meisten Kunden zwischen 20 und 40 Jahre alt sind.
Methode 2: Pivot-Tabellen verwenden
Pivot-Tabellen sind eine schnelle und einfache Möglichkeit, große Datenmengen zusammenzufassen und zu analysieren. Pivot-Tabellen bieten Funktionen wie Aggregation, Gruppierung und Slicer, um nur einige zu nennen.
Um die Häufigkeitsverteilung mithilfe von Pivot-Tabellen zu berechnen, klicke im Menü auf Einfügen und wähle PivotTable.
Insert PivotTable. Bild vom Autor
Gib den Datenbereich an, für den du die Pivot-Tabelle erstellen möchtest. In deinem Fall ist der Datenbereich A2:A16
. Wähle Neues Arbeitsblatt, um die Ausgabe in einem neuen Blatt zu erhalten.
Nachdem du den Datenbereich festgelegt hast, drücke OK.
Angeben von Pivot-Tabellenparametern. Bild vom Autor
Wenn du auf OK klickst, siehst du den Bereich PivotTable-Felder auf der rechten Seite des Fensters. Um eine Pivot-Tabelle für das Kundenalter zu erstellen, ziehe das Kundenalter per Drag & Drop unter Zeilen und Werte.
Anpassen der Pivot-Tabelle. Bild vom Autor
Nachdem du das Feld Kundenalter gezogen und abgelegt hast, sieht der rechte Bereich wie folgt aus:
Maßgeschneiderte Pivot-Tabelle. Bild vom Autor
Die erzeugte Pivot-Tabelle sieht dann so aus:
Pivot-Tabelle des Kundenalters. Bild vom Autor
Wenn du die obige Pivot-Tabelle betrachtest, ist das etwas anderes als das, wonach du suchst. Der Anwendungsfall ist, die Anzahl der Kunden nach Altersgruppen zu analysieren.
Uns fehlen zwei Dinge:
- Die Spalte Kundenalter ist nicht gruppiert.
- Wir sind an der Anzahl der Kunden in jeder Gruppe interessiert, nicht an der Summe ihres Alters.
Bringen wir es in Ordnung.
Klicke mit der rechten Maustaste auf einen Zeilenwert und wähle Gruppieren.
Gruppiere die Zeilenwerte in der Pivot-Tabelle. Bild vom Autor
Fülle die Parameter für die Gruppierung aus. In unserem Beispiel haben wir die Bins 20, 30, 40, 50 und 60 gewählt. Deshalb beginnen wir bei 20
und enden bei 60
mit einem Inkrement von 10
.
Gruppieren von Pivot-Tabellen. Bild vom Autor
Nach der Gruppierung wird die Ausgabe wie folgt aussehen:
Gruppierte Pivot-Tabelle. Bild vom Autor
Als Nächstes müssen wir die Summe in Count ändern. Um dies zu ändern, klicke mit der rechten Maustaste auf die Zelle Summe des Kundenalters und wähle Wertfeldeinstellungen.
Wertfeldeinstellungen in Pivot-Tabellen. Bild vom Autor
Ändere im Popup-Dialog unter Werte zusammenfassen nach die Summe in Anzahl und drücke OK.
Wertfeldeinstellungen. Bild vom Autor
Sobald du sie aktualisiert hast, sieht die Ausgabe wie folgt aus:
Häufigkeitsverteilung mithilfe einer Pivot-Tabelle. Bild vom Autor
Du hast nach dieser Ausgabe gesucht - du hast die Häufigkeitsverteilung nach Kundenalter erhalten.
Methode 3: Verwendung des Datenanalyse-ToolPak
Das Data Analysis Toolpak ist ein zusätzliches Add-in für Microsoft Excel, das bei der Berechnung von Metriken hilft, die häufig bei Datenanalyseaufgaben verwendet werden.
Dieses Add-in ist standardmäßig nicht aktiviert. Überprüfe daher in deiner Excel-Arbeitsmappe oben rechts unter der Registerkarte Daten das Symbol Datenanalyse.
Datenanalyse-ToolPak in Excel. Bild vom Autor
Wenn du das oben gezeigte Symbol nicht siehst, ist das Add-in nicht aktiviert worden. Um sie zu aktivieren, klicke im Menü auf Datei und wähle Optionen.
Auswählen von Optionen auf der Registerkarte Datei. Bild vom Autor
Wähle Add-ins, wenn sich das Dialogfeld Excel-Optionen öffnet.
Wählen Sie Add-ins im Dialogfeld Excel-Optionen. Bild vom Autor
Als Nächstes wählst du im Feld Verwalten unten Excel-Add-ins aus und klickst auf Los.
Excel-Add-ins verwalten. Bild vom Autor
Aktiviere Analysis ToolPak, sobald sich das Dialogfeld Add-Ins öffnet, und klicke auf OK.
Aktivieren des Data Analysis ToolPak. Bild vom Autor
Das Symbol für die Datenanalyse wird nun auf der Registerkarte Daten angezeigt. Du musst diesen Vorgang nicht wiederholen, da die Aktivierung des Add-ins eine einmalige Aufgabe ist.
Wähle den Datenbereich, einschließlich der Spaltenüberschrift, um die Häufigkeitsverteilung zu berechnen. Klicke auf das Symbol Datenanalyse. Es wird ein Dialogfeld angezeigt. Wähle das Histogramm aus und klicke auf OK.
Aufrufen des Add-Ins Data Analysis Toolpak. Bild vom Autor
Es wird ein Dialogfeld angezeigt, wie unten abgebildet.
Anpassen der Histogrammparameter. Bild vom Autor
Fülle den Eingabebereich mit dem Datenbereich Kundenalter und den Bin-Bereich mit Bins aus.
- Du hast die Daten des Kundenalters in den Zellen
A2:A16
. - Du hast die Bins-Daten in den Zellen
B2:B6
. - Bei den Ausgabeoptionen wählst du Neues Arbeitsblatt, um die Ausgabe in einem neuen Arbeitsblatt zu erhalten.
- Klicke auf OK.
Du siehst die Häufigkeitsverteilung in einem neuen Arbeitsblatt wie dem untenstehenden.
Häufigkeitsverteilung mit Data Analysis Toolpak. Bild vom Autor
Voila! Du hast die Häufigkeitsverteilung nach Altersgruppen mit dem Datenanalyse-ToolPak erstellt.
Methode 4: Verwendung der Funktionen COUNTIF() und COUNTIFS()
Die Funktion COUNTIF()
zählt, wie oft ein einzelnes Kriterium erfüllt ist. Die Funktion COUNTIFS()
zählt die Anzahl der Zellen, die mehrere Kriterien erfüllen.
Um die Häufigkeit für jede Altersgruppe zu berechnen, gibst du die folgenden Formeln in die Zellen D2
bis D7
ein.
# In cell D2
=COUNTIF(A2:A16, "<=20")
# In cell D3
=COUNTIFS(A2:A16, ">20", A2:A16, "<=30")
# In cell D4
=COUNTIFS(A2:A16, ">30", A2:A16, "<=40")
# In cell D5
=COUNTIFS(A2:A16, ">40", A2:A16, "<=50")
# In cell D6
=COUNTIFS(A2:A16, ">50", A2:A16, "<=60")
# In cell D7
=COUNTIF(A2:A16, ">60")
Hier ist ein Beispiel dafür, wie du die Formel in die Zellen einfügst. Wenn du sie alle berechnet hast, sieht die Ausgabe wie folgt aus:
Berechnung der Häufigkeitsverteilung mit der Funktion
COUNTIF()
. Bild vom Autor
Im Vergleich zu den anderen besprochenen Methoden besteht eine Einschränkung bei der Verwendung von COUNTIF()
darin, dass sie vordefinierte Bin-Bereiche innerhalb der Gleichung erfordert.
Die gebräuchlichste Methode, um eine Tabelle der Häufigkeitsverteilung zu erstellen, ist die Funktion FREQUENCY()
.
Du kannst aber jede Methode verwenden, die dir gefällt. Die Verwendung des Datenanalyse-Toolpak ist zum Beispiel besser geeignet, wenn du im Rahmen der Analyse auch andere statistische Maße wie Schiefe, ANOVA oder Korrelationsmatrix berechnest.
Schlussgedanken
In diesem Lernprogramm haben wir gelernt, wie wichtig die Häufigkeitsverteilung ist und wie man sie mit Microsoft Excel berechnet. Anhand eines realen Beispiels lernten wir, die Funktion FREQUENCY()
zu verwenden und die daraus resultierende Verteilung zu interpretieren, um Einblicke in unsere Daten zu erhalten. Wir haben drei alternative Möglichkeiten zur Berechnung der Häufigkeitsverteilung untersucht.
Das Lernen muss hier nicht aufhören, und wir ermutigen dich, weiter zu lernen und deine Excel-Kenntnisse zu erweitern. Mit dem Lernpfad Excel-Grundlagen kannst du deine Excel-Kenntnisse vertiefen. Die Kurse Datenaufbereitung in Excel und Datenvisualisierung in Excel können dir dabei helfen, dein Wissen über diese Themen zu erweitern. Wirf einen Blick auf den Spickzettel zur Datenbearbeitung in Excel, der dir als schnelle Referenz dienen kann.
Viel Spaß beim Lernen!!!

Als Senior Data Scientist konzipiere, entwickle und implementiere ich umfangreiche Machine-Learning-Lösungen, um Unternehmen dabei zu helfen, bessere datengestützte Entscheidungen zu treffen. Als Data-Science-Autorin teile ich Erfahrungen, Karrieretipps und ausführliche praktische Anleitungen.
Häufig gestellte Fragen
Was sind Bins in einer Häufigkeitsverteilung?
Bins sind Bereiche, die Datenpunkte in einer Häufigkeitsverteilung gruppieren. Jedes Bin steht für einen Wertebereich, und die Häufigkeit ist die Anzahl der Datenpunkte innerhalb jedes Bin.
Wie erstelle ich benutzerdefinierte Bins für meine Häufigkeitsverteilung?
Die Erstellung von benutzerdefinierten Behältern hängt von der Methode ab, die du verwendest. Zu den Optionen gehören die Funktion FREQUENCY()
, die Verwendung von Pivot-Tabellen, die Verwendung des Datenanalyse-Toolpak und die Verwendung der Funktion COUNTIF()
.
Was ist der Unterschied zwischen COUNTIF() und COUNTIFS()?
COUNTIF()
zählt die Anzahl der Vorkommnisse, die eine einzelne Bedingung erfüllen. COUNTIFS()
zählt die Anzahl der Vorkommnisse, die mehrere Bedingungen erfüllen.
Wie erstellst du eine Häufigkeitsverteilung mit ungleichen Bin-Größen?
Ändere die Werte der Bins. Wenn du z. B. vorher 20, 30, 40, 50 und 60 als Behälter hattest, kannst du sie in 20, 30, 50 und 60 ändern, wobei der Bereich von 30-50 ungleiche Behältergrößen ergibt. Anschließend wird wie üblich die Funktion FREQUENCY() verwendet, um die Häufigkeitsverteilung zu berechnen.
Welche Einschränkungen gibt es bei der Verwendung von COUNTIF() zur Berechnung der Häufigkeitsverteilung?
COUNTIF()
erfordert vordefinierte Bin-Bereiche. Das Ändern des Platzbereichs erfordert eine manuelle Aktualisierung jeder COUNTIF()
Formel.
Lernen mit DataCamp
Kurs
Einführung in die Statistik
Lernpfad