Leerpad
Een frequentieverdeling, vaak gevisualiseerd met een frequentiehistogram, ordent datapunten in opgegeven bereiken, zodat je eenvoudig ziet hoe vaak elke waarde voorkomt. Deze techniek is cruciaal om patronen, trends en mogelijke uitschieters te identificeren en zo meer inzicht in de data te krijgen.
In deze tutorial verkennen we frequentieverdelingen, hun betekenis in data-analyse en hoe je ze maakt. Met Microsoft Excel doorlopen we stap voor stap hoe je een frequentieverdeling voor een real-world dataset genereert en hoe je de resultaten interpreteert om zinvolle inzichten te krijgen.
Het snelle antwoord: zo maak je een frequentieverdeling in Excel
Om een frequentieverdeling in Excel te maken, gebruik je de functie FREQUENCY(). De functie berekent hoe vaak waarden voorkomen binnen opgegeven bereiken, zogenaamde bins.
Volg deze stappen:
- Begin met het invoeren van je data in één kolom.
- Definieer je bins in een andere kolom.
- Typ in een nieuwe cel
=FREQUENCY(data_array, bins_array), waarbijdata_arrayhet bereik van je datacellen is enbins_arrayhet bereik van je bins. - Voorbeeld:
=FREQUENCY(A2:A16, B2:B6). - Druk op Enter om de frequentieverdeling te krijgen.
Frequentieverdeling berekenen met de functie FREQUENCY(). Afbeelding door de auteur
Waarom frequentieverdelingen belangrijk zijn
Een frequentieverdeling is een statistische techniek die data indeelt in categorieën of intervallen. Meestal resulteert dit in een tabel die het aantal waarnemingen toont voor een opgegeven interval van de onderliggende data.
Frequentieverdelingen zijn op meerdere manieren nuttig:
- Samenvatting van data: Frequentieverdelingen vatten grote datasets samen op een overzichtelijke en begrijpelijke manier. Zo krijg je snel een beeld van de verdeling van waarden.
- Visuele weergave: De frequentieverdeling is eenvoudig weer te geven als histogrammen en cirkeldiagrammen, wat een visueel begrip van de data geeft.
- Patronen, trends en uitschieters identificeren: Ze laten patronen in de data zien, zoals pieken, clusters en uitschieters. Je kunt ze gebruiken in statistische analyses om de vorm en kenmerken van data verder te onderzoeken.
- Data vergelijken: De verdeling van waarden maakt het mogelijk om verschillende datasets te vergelijken en overeenkomsten en verschillen te begrijpen.
- Communicatie: Frequentieverdelingen zijn een eenvoudig en effectief hulpmiddel om inzichten uit data te communiceren naar een breder publiek, waaronder besluitvormers.
- Besluitvorming: Een duidelijk begrip van de verdeling en de patronen helpt bij het nemen van beslissingen. Begrijpen hoe de voorraad goederen per seizoen schommelt, helpt bijvoorbeeld te bepalen wanneer je moet inkopen.
Nu we frequentieverdelingen en hun belang begrijpen, duiken we in verschillende methoden om ze te maken in Microsoft Excel.
Methoden om een frequentieverdeling in Excel te maken
Stel, je werkt bij een cosmeticabedrijf dat producten aanbiedt voor een brede reeks leeftijdsgroepen. Ze willen zich nu specialiseren in een paar producten voor specifieke leeftijdsgroepen met de meeste klanten. Om dat te begrijpen, krijg jij de taak om klanten per leeftijdsgroep te analyseren.
Hiervoor hebben ze steekproefdata over klantenleeftijd uit de klanten database gehaald. De volgende tabel is aan jou gegeven:
Dataset klantenleeftijd. Afbeelding door de auteur
Als onderdeel van het analyseren van de vraag per leeftijdsgroep van klanten, heb je geconcludeerd dat het berekenen van de frequentieverdeling een goed startpunt is. Hier zijn vier methoden om de frequentieverdeling te berekenen met Microsoft Excel.
Methode 1: met de functie FREQUENCY()
De functie FREQUENCY() berekent de frequentieverdeling van opgegeven data en geeft een lijst terug die de frequentie van waarden binnen opgegeven intervallen toont.
Dit is de syntaxis van de functie FREQUENCY():
=FREQUENCY(data_array, bins_array)
De functie neemt twee parameters:
data_array: Een array of verwijzing naar een set waarden waarvoor je de frequenties wilt tellen. Als data_array geen waarden bevat, retourneertFREQUENCY()een array met nullen.bins_array: Een array of verwijzing naar intervallen waarin je de waarden in data_array wilt groeperen. Als bins_array geen waarden bevat, retourneertFREQUENCY()het aantal elementen in data_array.
Beide parameters zijn vereist om de frequentieverdeling te berekenen. Je krijgt alleen de data_array, namelijk Customer Age. Daarom moet je zelf de bins_array definiëren.
Voor dit usecase kunnen we de bins definiëren als <20, 20–30, 30–40, 40–50, 50–60 en >60. Vul kolom B in je werkblad in, zoals hieronder weergegeven.
De formule voor een frequentieverdeling met de functie FREQUENCY(). Afbeelding door de auteur
Met de data_array en bins_array voorbereid, schrijf je de formule om de frequentieverdeling te berekenen in cel C2.
=FREQUENCY(A2:A16, B2:B6)
De output van het uitvoeren van de bovenstaande formule ziet er als volgt uit:

Frequentieverdeling met de functie FREQUENCY(). Afbeelding door de auteur
Als we naar de bovenstaande frequentieverdeling kijken, zien we:
- Het bedrijf heeft slechts één klant die jonger is dan 20 jaar.
- Vijf klanten zitten in de leeftijdscategorie 20–30 en 30–40.
- Drie klanten zitten in de leeftijdscategorie 40–50.
- Één klant zit in de leeftijdscategorie 50–60.
- Er zijn geen klanten ouder dan 60.
Uit de frequentieverdeling begrijp je dat de meeste klanten tussen 20 en 40 jaar oud zijn.
Methode 2: met draaitabellen
Draaitabellen zijn een snelle en makkelijke manier om grote hoeveelheden data samen te vatten en te analyseren. Draaitabellen bieden functies zoals aggregatie, groeperen en slicers, om er een paar te noemen.
Om de frequentieverdeling met draaitabellen te berekenen, klik je op Invoegen in het menu en selecteer je Draaitabel.
Draaitabel invoegen. Afbeelding door de auteur
Geef het databereik op waarvoor je de draaitabel wilt maken. In jouw geval is het databereik A2:A16. Selecteer Nieuw werkblad om de output in een nieuw blad te krijgen.
Klik na het opgeven van het databereik op OK.
Parameters voor draaitabel opgeven. Afbeelding door de auteur
Na het klikken op OK zie je het venster Veldenlijst draaitabel aan de rechterkant. Om een draaitabel voor Customer Age te maken, sleep je Customer Age naar Rijen en Waarden.

Draaitabel aanpassen. Afbeelding door de auteur
Nadat je het veld Customer Age hebt gesleept, ziet het rechterpaneel er zo uit:

Aangepaste draaitabel. Afbeelding door de auteur
De gegenereerde draaitabel ziet er zo uit:

Draaitabel van klantenleeftijd. Afbeelding door de auteur
Als je naar de bovenstaande draaitabel kijkt, zie je dat dit anders is dan wat je zoekt. De usecase is het analyseren van het aantal klanten per leeftijdsgroep.
We missen twee dingen:
- De kolom Customer Age is niet gegroepeerd.
- We zijn geïnteresseerd in het aantal klanten per groep, niet in de som van hun leeftijd.
Laten we dat oplossen.
Klik met de rechtermuisknop op een rijwaarde en selecteer Groeperen.

Groepeer de rijwaarden in de draaitabel. Afbeelding door de auteur
Vul de groeperingsparameters in. In ons voorbeeld kozen we de bins als 20, 30, 40, 50 en 60. We beginnen dus bij 20 en eindigen bij 60 met een incrementele stap van 10.

Draaitabel groeperen. Afbeelding door de auteur
Na het groeperen ziet de output er zo uit:

Gegroepeerde draaitabel. Afbeelding door de auteur
Vervolgens moeten we Som wijzigen in Aantal. Om dit te wijzigen, klik je met de rechtermuisknop op de cel Som van Customer Age en selecteer je Waardeveldinstellingen.
Waardeveldinstellingen in een draaitabel. Afbeelding door de auteur
Wijzig in het pop-upvenster onder Waarden samenvatten per Som in Aantal en klik op OK.
Waardeveldinstellingen. Afbeelding door de auteur
Zodra je dit hebt bijgewerkt, ziet de output er zo uit:

Frequentieverdeling met een draaitabel. Afbeelding door de auteur
Dit is de output waar je naar zocht — je hebt de frequentieverdeling per Customer Age.
Methode 3: met de Data Analysis ToolPak
De Data Analysis ToolPak is een extra invoegtoepassing voor Microsoft Excel die helpt bij het berekenen van veelgebruikte statistieken in data-analyses.
Deze add-in is niet standaard ingeschakeld. Controleer daarom rechtsboven of het pictogram Gegevensanalyse zichtbaar is op het tabblad Gegevens in je Excel-werkmap.
Data Analysis ToolPak in Excel. Afbeelding door de auteur
Als je het pictogram hierboven niet ziet, is de add-in niet ingeschakeld. Om deze in te schakelen, klik je op Bestand in het menu en selecteer je Opties.
Opties selecteren via het tabblad Bestand. Afbeelding door de auteur
Selecteer Invoegtoepassingen wanneer het dialoogvenster Excel Opties wordt geopend.
Selecteer Invoegtoepassingen in het dialoogvenster Excel-opties. Afbeelding door de auteur
Selecteer vervolgens onderaan in het vak Beheren de optie Excel-invoegtoepassingen en klik op Start.
Excel-invoegtoepassingen beheren. Afbeelding door de auteur
Vink Analysis ToolPak aan zodra het dialoogvenster Invoegtoepassingen opent en klik op OK.

Data Analysis ToolPak inschakelen. Afbeelding door de auteur
Het pictogram Gegevensanalyse is nu zichtbaar op het tabblad Gegevens, en je hoeft dit proces niet te herhalen, want het inschakelen van de add-in is een eenmalige taak.
Selecteer het databereik, inclusief de kolomkop, om de frequentieverdeling te berekenen. Klik op het pictogram Gegevensanalyse. Er verschijnt een dialoogvenster. Kies Histogram en klik op OK.
De invoegtoepassing Data Analysis ToolPak starten. Afbeelding door de auteur
Je krijgt een dialoogvenster te zien, zoals hieronder weergegeven.
Histogramparameters aanpassen. Afbeelding door de auteur
Vul het invoerbereik in met het databereik van Customer Age en het Bin bereik met Bins.
- Je hebt de data Customer Age in cellen
A2:A16. - Je hebt de data Bins in cellen
B2:B6. - Selecteer voor de Uitvoer-opties Nieuw werkblad om de output in een nieuw werkblad te krijgen.
- Klik op OK.
Je ziet de frequentieverdeling in een nieuw werkblad, zoals hieronder.

Frequentieverdeling met de Data Analysis ToolPak. Afbeelding door de auteur
Voilà! Je hebt de frequentieverdeling per leeftijdsgroep gemaakt met de Data Analysis ToolPak.
Methode 4: met de functies COUNTIF() en COUNTIFS()
De functie COUNTIF() telt hoe vaak aan één criterium wordt voldaan. De functie COUNTIFS() telt het aantal cellen dat aan meerdere criteria voldoet.
Om de frequentie voor elke leeftijdsgroep te berekenen, voer je de onderstaande formules in de cellen D2 tot en met D7 in.
# In cell D2
=COUNTIF(A2:A16, "<=20")
# In cell D3
=COUNTIFS(A2:A16, ">20", A2:A16, "<=30")
# In cell D4
=COUNTIFS(A2:A16, ">30", A2:A16, "<=40")
# In cell D5
=COUNTIFS(A2:A16, ">40", A2:A16, "<=50")
# In cell D6
=COUNTIFS(A2:A16, ">50", A2:A16, "<=60")
# In cell D7
=COUNTIF(A2:A16, ">60")
Hier is een voorbeeld van hoe je de formule aan de cellen toevoegt. Zodra je ze allemaal hebt berekend, ziet de output er zo uit:
Frequentieverdeling berekenen met de functie COUNTIF(). Afbeelding door de auteur
In vergelijking met andere besproken methoden is een beperking van COUNTIF() dat vooraf gedefinieerde bin-bereiken in de vergelijking nodig zijn.
De meest gangbare methode om de frequentieverdelingstabel te maken is met de functie FREQUENCY().
Voel je echter vrij om de methode te gebruiken die jij prettig vindt. Als je bijvoorbeeld ook andere statistische maten berekent, zoals scheefheid, ANOVA of een correlatiematrix als onderdeel van de analyse, kan de Data Analysis ToolPak beter passen.
Tot slot
In deze tutorial hebben we het belang van frequentieverdeling besproken en hoe je deze berekent met Microsoft Excel. Aan de hand van een praktijkvoorbeeld leerden we de functie FREQUENCY() gebruiken en de resulterende verdeling te interpreteren om inzichten uit onze data te halen. We hebben drie alternatieve manieren verkend om de frequentieverdeling te berekenen.
Het leren hoeft hier niet te stoppen. We moedigen je aan om verder te leren en je Excel-vaardigheden uit te breiden. Overweeg de Excel Fundamentals-track om je basis in Excel te versterken. De cursussen Data Preparation in Excel en Data Visualization in Excel helpen je je kennis over deze onderwerpen uit te breiden. Bekijk ook de Data Manipulation in Excel Cheat Sheet als snel naslagwerk.
Veel leerplezier!!!
Als senior data scientist ontwerp, ontwikkel en implementeer ik grootschalige machinelearningsoplossingen om bedrijven te helpen betere, datagedreven beslissingen te nemen. Als schrijver over data science deel ik inzichten, carrièreadvies en diepgaande, praktijkgerichte tutorials.
Veelgestelde vragen
Wat zijn bins in een frequentieverdeling?
Bins zijn bereiken die datapunten groeperen in een frequentieverdeling. Elke bin vertegenwoordigt een waardebereik en de frequentie is het aantal datapunten binnen elke bin.
Hoe maak ik aangepaste bins voor mijn frequentieverdeling?
Het maken van aangepaste bins verschilt per methode. Opties zijn onder meer de functie FREQUENCY() gebruiken, draaitabellen gebruiken, de Data Analysis ToolPak gebruiken en de functie COUNTIF() gebruiken.
Wat is het verschil tussen COUNTIF() en COUNTIFS()?
COUNTIF() telt het aantal voorkomens dat aan één voorwaarde voldoet. COUNTIFS() telt het aantal voorkomens dat aan meerdere voorwaarden voldoet.
Hoe maak je een frequentieverdeling met ongelijke bin-groottes?
Wijzig de waarden van de bins. Als je bijvoorbeeld eerder 20, 30, 40, 50 en 60 als bins had, kun je die wijzigen naar 20, 30, 50 en 60, waarbij het bereik 30–50 ongelijke bin-groottes oplevert. Daarna gebruik je de FREQUENCY()-functie zoals gebruikelijk om de frequentieverdeling te berekenen.
Wat zijn enkele beperkingen van het gebruik van COUNTIF() bij het berekenen van een frequentieverdeling?
COUNTIF() vereist vooraf gedefinieerde bin-bereiken. Het wijzigen van het bin-bereik vereist een handmatige update van elke COUNTIF()-formule.

