Cursus
ANOVA biedt een manier om te testen of er significante verschillen zijn tussen groepsgemiddelden. Zo kunnen onderzoekers bepalen of de variatie in gegevens het gevolg is van werkelijke verschillen tussen groepen of slechts van toeval. Deze methode is nuttig bij experimenten of studies met meer dan twee groepen, waar traditionele t-toetsen mogelijk niet geschikt of efficiënt zijn.
In dit artikel bespreken we de basisprincipes van de ANOVA-toets, het doel, de twee hoofdtypen en een stapsgewijze handleiding voor het uitvoeren van ANOVA. Inzicht in deze concepten helpt je de juiste test voor je data te kiezen en resultaten met vertrouwen te interpreteren. We nemen ook een voorbeeld door om het concept beter te begrijpen. Ben je nieuw met hypothesetoetsing in het algemeen, lees dan onze tutorial Hypothesis Testing Made Easy.
Wat is een ANOVA-toets?
ANOVA staat voor Analysis of Variance, een statistische toets die wordt gebruikt om de gemiddelden van drie of meer groepen te vergelijken. De toets analyseert de variantie binnen groepen en tussen groepen. Het primaire doel is te beoordelen of de waargenomen variantie tussen groepsgemiddelden groter is dan die binnen de groepen. Als de waargenomen variantie tussen de groepsgemiddelden significant is, suggereert dat dat de verschillen betekenisvol zijn.
Wiskundig gezien splitst ANOVA de totale variabiliteit in de data op in twee componenten:
- Variabiliteit binnen groepen: Variabiliteit veroorzaakt door verschillen binnen individuele groepen, die willekeurige schommelingen weergeeft.
- Variabiliteit tussen groepen: Variabiliteit veroorzaakt door verschillen tussen de gemiddelden van de verschillende groepen.

F-statistiek om ANOVA te berekenen. Afbeelding door de auteur
De toets levert een F-statistiek op, die de verhouding weergeeft tussen de variabiliteit tussen groepen en binnen groepen. Als de F-statistiek voldoende groot is, duidt dat erop dat ten minste één van de groepsgemiddelden significant afwijkt van de andere.
Om dit beter te begrijpen, stel je een scenario voor waarin je de prestaties van een student (examenscores) moet beoordelen op basis van drie onderwijsmethoden: hoorcollege, interactieve workshop en online leren. ANOVA kan ons helpen beoordelen of de onderwijsmethode statistisch invloed heeft op de examenscore van de student.
De twee typen ANOVA-toets
Er zijn twee typen ANOVA: one-way en two-way. Afhankelijk van het aantal onafhankelijke variabelen en hoe die met elkaar interageren, worden ze in verschillende scenario's gebruikt.
1. One-way ANOVA
Een one-way ANOVA-toets wordt gebruikt wanneer er één onafhankelijke variabele is met twee of meer groepen. Het doel is te bepalen of er een significant verschil bestaat tussen de gemiddelden van verschillende groepen.
In ons voorbeeld kunnen we one-way ANOVA gebruiken om de effectiviteit van de drie verschillende onderwijsmethoden (hoorcollege, workshop en online leren) op examenscores van studenten te vergelijken. De onderwijsmethode is de onafhankelijke variabele met drie groepen en de examenscore is de afhankelijke variabele.
- Nulhypothese (H₀): De gemiddelde examenscores van studenten over de drie onderwijsmethoden zijn gelijk (geen verschil in gemiddelden).
- Alternatieve hypothese (H₁): Ten minste één groepsgemiddelde verschilt significant.
Vergelijking van de nul- en alternatieve hypothese. Afbeelding door de auteur
De one-way ANOVA-toets vertelt ons of de variatie in examenscores van studenten kan worden toegeschreven aan de verschillen in onderwijsmethoden of waarschijnlijk aan toeval te wijten is.
One-way ANOVA is effectief bij het analyseren van de impact van één factor over meerdere groepen, waardoor het eenvoudiger te interpreteren is. Het houdt echter geen rekening met mogelijke interacties tussen meerdere onafhankelijke variabelen; daarvoor is two-way ANOVA nodig.
2. Two-way ANOVA
Two-way ANOVA wordt gebruikt wanneer er twee onafhankelijke variabelen zijn, elk met twee of meer groepen. Het doel is te analyseren hoe beide onafhankelijke variabelen de afhankelijke variabele beïnvloeden.
Stel dat je geïnteresseerd bent in de relatie tussen onderwijsmethoden en studietechnieken en hoe ze samen de prestaties van studenten beïnvloeden. Two-way ANOVA is geschikt voor dit scenario. We testen hier drie hypothesen:
- Het hoofdeffect van factor 1 (onderwijsmethode): Heeft de onderwijsmethode invloed op examenscores van studenten?
- Het hoofdeffect van factor 2 (studietechniek): Heeft de studietechniek effect op examenscores?
- Interactiewerking: Hangt de effectiviteit van de onderwijsmethode af van de gebruikte studietechniek?
Two-way ANOVA kan bijvoorbeeld laten zien dat studenten die de hoorcollege-methode gebruiken beter presteren bij groepsstudie, terwijl zij die online leren juist beter presteren bij individueel studeren. Inzicht in deze interacties geeft een dieper begrip van hoe verschillende factoren samen de uitkomsten beïnvloeden.
ANOVA vs. t-toets
Je vraagt je misschien af: wanneer kies ik voor ANOVA in plaats van een t-toets? De t-toets en ANOVA worden beide gebruikt om gemiddelden tussen groepen te vergelijken, maar de keuze ertussen hangt af van het aantal te vergelijken groepen en de complexiteit van de datastructuur.
Wanneer gebruik je een t-toets
Een t-toets is geschikt bij het vergelijken van de gemiddelden van twee groepen. Als we bijvoorbeeld alleen de examenscores van studenten met twee onderwijsmethoden willen vergelijken — hoorcollege en workshop — volstaat een t-toets. Er zijn twee typen t-toetsen:
- Onafhankelijke t-toets: Vergelijkt twee onafhankelijke groepen (bijv. hoorcollege vs. workshop).
- Gepaarde t-toets: Vergelijkt gemiddelden van dezelfde groep op verschillende tijdstippen (bijv. prestaties van studenten vóór en na gebruik van een bepaalde onderwijsmethode).
Wanneer gebruik je ANOVA
ANOVA wordt daarentegen gebruikt bij het vergelijken van de gemiddelden van drie of meer groepen. Onze studie omvat drie onderwijsmethoden (hoorcollege, workshop en online leren), dus is meer dan een t-toets nodig. Het gebruik van meerdere t-toetsen voor elk paar groepen zou het risico op een type I-fout (vals-positieven) vergroten, terwijl ANOVA de vergelijking in één test afhandelt en voor deze fout corrigeert.
Aannames van de ANOVA-toets
Alle statistische toetsen hebben aannames die moeten worden vervuld om geldige resultaten te garanderen.
Dit zijn de aannames waaraan voor ANOVA moet worden voldaan:
1. Onafhankelijkheid van observaties
De observaties (datapunten) moeten onafhankelijk van elkaar zijn. In het voorbeeld mogen de examenscores van studenten bij de ene onderwijsmethode de scores van studenten bij een andere methode niet beïnvloeden.
2. Homogeniteit van varianties
De varianties binnen elke groep moeten ongeveer gelijk zijn. ANOVA gaat ervan uit dat de variabiliteit van examenscores binnen elke groep van onderwijsmethode ongeveer hetzelfde is. Dit kan worden getest met Levene's test, die gelijke varianties controleert.
3. Normale verdeling
De data binnen elke groep moeten een normale verdeling volgen. In ons voorbeeld met onderwijsmethoden zouden de examenscores van studenten in elke onderwijsgroep (hoorcollege, workshop, online leren) idealiter normaal verdeeld moeten zijn.
Als aan een van de aannames niet wordt voldaan, kunnen de testresultaten ongeldig zijn. In zulke gevallen is het belangrijk om een niet-parametrische test te overwegen.
Een ANOVA-toets uitvoeren
We gebruiken hetzelfde voorbeeld van het vergelijken van verschillende onderwijsmethoden om te onderzoeken hoe ze examenscores van studenten beïnvloeden. Stel dat je de volgende gegevens krijgt met examenscores (afhankelijke variabele) op basis van de onderwijsmethode (onafhankelijke variabele).
Examenscores per onderwijsmethode voor elk vier studenten. Afbeelding door de auteur
Stap 1: Formuleer de hypothese
De eerste stap in het proces is het formuleren van de hypothese. Geef de nul- en alternatieve hypothesen:
- Nulhypothese (H₀): De gemiddelden van examenscores van studenten over de drie onderwijsmethoden zijn gelijk.
- Alternatieve hypothese (H₁): Ten minste één onderwijsmethode heeft een andere gemiddelde examenscore.

Nulhypothese en alternatieve hypothese. Afbeelding door de auteur
Stap 2: Controleer de ANOVA-aannames
Controleer voordat je ANOVA uitvoert of aan de aannames is voldaan: normaliteit, onafhankelijkheid en homogeniteit van varianties. Voor de eenvoud gaan we ervan uit dat aan alle aannames is voldaan.
Stap 3: Bereken ANOVA
Zodra de aannames zijn gecontroleerd, bereken je de ANOVA.
De formule voor de F-statistiek in one-way ANOVA is hieronder gedefinieerd.

F-statistiek in one-way ANOVA. Afbeelding door de auteur
De F-statistiek in one-way ANOVA is de verhouding tussen de gemiddelden van de kwadratensommen tussen de groepen en de gemiddelden van de kwadratensommen binnen de groepen.
Om hiertoe te komen, gaan we stap voor stap.
1. Bereken het gemiddelde voor elke groep en het overall-gemiddelde.
Gebruik de onderstaande vergelijking om het gemiddelde voor elke onderwijsmethode (Ai) te berekenen. Deel de som van de examenscores per groep door het aantal studenten in elke groep.

Gemiddelde voor elke groep (onderwijsmethode). Afbeelding door de auteur
Bereken vervolgens het overall-gemiddelde (G) door de som van alle waarnemingen te delen door het totale aantal studenten.

Overall-gemiddelde van de examenscores. Afbeelding door de auteur
2. Bereken de som van de kwadraten voor elke groep
De vergelijking om de som van de kwadraten voor elke groep te berekenen is als volgt.

De som van de kwadraten voor elke onderwijsmethode. Afbeelding door de auteur
Vul na het berekenen deze tabel met de waarden voor snelle raadpleging.
Overzicht van de prestaties van studenten per onderwijsmethode. Afbeelding door de auteur
3. Bereken de som van de kwadraten tussen de groepen, de som van de kwadraten binnen de groepen en de totale som van de kwadraten.
Gebruik de onderstaande vergelijking om de som van de kwadraten tussen de groepen te berekenen. In de vergelijking:
- Ai: Gemiddelde van de groep
- G: Overall-gemiddelde
- ni: aantal waarnemingen in elke groep
Gebruik voor de berekening de waarden uit de samenvattingstabel.
Som van de kwadraten tussen de groepen
Bereken vervolgens de som van de kwadraten binnen de groep. Dit is de som van de kwadratensommen (SS) voor elke groep.

Som van de kwadraten binnen de groep. Afbeelding door de auteur
Gebruik de onderstaande vergelijking om de totale som van de kwadraten te berekenen
Totale som van de kwadraten. Afbeelding door de auteur
Controleer de berekening door na te gaan of de totale som van de kwadraten gelijk is aan de som van de kwadraten tussen de groepen plus de som van de kwadraten binnen de groep. Ga na het verifiëren verder met het berekenen van de gemiddelde kwadraten.
4. Bereken de gemiddelde kwadraten
Gemiddelde kwadraten is de verhouding van kwadratensommen tot de vrijheidsgraden.
De vrijheidsgraad tussen groepen df_between is gelijk aan het aantal groepen min één, en de vrijheidsgraad binnen groepen df_w is gelijk aan het totale aantal deelnemers min het aantal groepen.
Met de waarden die in de vorige stap zijn berekend, bepaal je de gemiddelde kwadraten.
Gemiddelde kwadraten tussen de groepen en binnen de groepen. Afbeelding door de auteur
5. Bereken de F-statistiek met de onderstaande vergelijking
De F-statistiek is de verhouding van het gemiddelde kwadraat tussen de groepen tot het gemiddelde kwadraat binnen de groepen.

F-statistiek. Afbeelding door de auteur
De berekende waarde van de F-statistiek is 28,747.
Tot slot wordt de p-waarde berekend met behulp van de F-statistiek, de vrijheidsgraad df en de F-verdelingstabel.
In dit voorbeeld is de teller-df 2, de noemer-df 9 en de F-statistiek 28,747. Daarom is de p-waarde uit de F-verdelingstabel 0,000123.
Stap 4: Interpreteer de resultaten
- F-statistiek: De F-statistiek meet de verhouding van variatie tussen groepen tot variatie binnen groepen. Een hogere F-statistiek wijst op een groter verschil tussen groepsgemiddelden ten opzichte van willekeurige variatie.
- P-waarde: De p-waarde bepaalt of de verschillen tussen groepsgemiddelden statistisch significant zijn. Als de p-waarde onder een vooraf ingestelde drempel ligt (meestal 0,05), verwerp je de nulhypothese en concludeer je dat ten minste één groep een significant ander gemiddelde heeft.
De p-waarde is 0,000123, en we zouden de nulhypothese verwerpen en concluderen dat de onderwijsmethode een significante invloed heeft op examenscores.
Post-hoc-toetsen na ANOVA
ANOVA vertelt ons of er een statistisch significant verschil is tussen groepsgemiddelden, maar specificeert niet welke groepen significant van elkaar verschillen. Dat is de rol van post-hoc-toetsen — ze voeren paarsgewijze vergelijkingen tussen de groepen uit om precies te identificeren waar de verschillen zitten. Wanneer je meer dan twee groepen hebt en de ANOVA-uitkomst significant is, zijn deze toetsen essentieel.
In ons voorbeeld toont de toets een significant verschil in examenscores van studenten na het uitvoeren van de one-way ANOVA op de drie onderwijsmethoden (hoorcollege, workshop en online leren). Een post-hoc-toets helpt ons bepalen welke onderwijsmethoden verschillend op de examencijfers inwerken.
Tukey's Honestly Significant Difference (HSD) en de Bonferroni-correctie zijn veelgebruikte post-hoc-toetsen.
Alternatieven voor ANOVA
Als aan de aannames van ANOVA niet wordt voldaan, of wanneer ANOVA niet geschikt is voor de dataset, overweeg dan de volgende alternatieven.
- Kruskal-Wallis-toets: Dit is een niet-parametrisch alternatief voor one-way ANOVA wanneer de normaliteitsaannames zijn geschonden. Het is een uitgebreide versie van de Mann-Whitney U-toets.
- MANOVA (Multivariate Analysis of Variance): Breidt de principes van ANOVA uit naar meerdere afhankelijke variabelen. Het test of de gemiddelde vectoren van meerdere afhankelijke variabelen tussen groepen verschillen.
Conclusie
Dit artikel introduceerde de kernconcepten van ANOVA en gaf aan wanneer je het gebruikt in plaats van een t-toets. We leerden dat ANOVA een robuuste statistische analyse is die meerdere groepen tegelijk vergelijkt. We boden een stapsgewijze handleiding voor het uitvoeren van ANOVA, met details over het formuleren van hypothesen, het controleren van aannames en het interpreteren van resultaten.
Wil je praktisch aan de slag met ANOVA in Excel, bekijk dan de tutorial Comprehensive Guide to Using ANOVA in Excel. Overweeg ook de cursussen Foundations of Inference in Python en Inferential Statistics om je statistiekkennis te verbreden.
Als senior data scientist ontwerp, ontwikkel en implementeer ik grootschalige machinelearningsoplossingen om bedrijven te helpen betere, datagedreven beslissingen te nemen. Als schrijver over data science deel ik inzichten, carrièreadvies en diepgaande, praktijkgerichte tutorials.
Veelgestelde vragen
Wat is ANOVA en waarom wordt het gebruikt?
ANOVA, of Analysis of Variance, is een statistische toets die de gemiddelden van drie of meer groepen vergelijkt. Het helpt bepalen of waargenomen verschillen tussen groepen significant zijn of aan toeval te wijten.
Wat is het verschil tussen one-way en two-way ANOVA?
One-way ANOVA vergelijkt de gemiddelden van groepen op basis van één onafhankelijke variabele. Two-way ANOVA onderzoekt de impact van twee onafhankelijke variabelen en hun interactie.
Wanneer moet ik ANOVA gebruiken in plaats van een t-toets?
Gebruik ANOVA wanneer je de gemiddelden van drie of meer groepen vergelijkt. Een t-toets is geschikt om de gemiddelden van twee groepen te vergelijken.
Wat zijn de belangrijkste aannames voor het uitvoeren van ANOVA?
ANOVA vereist onafhankelijkheid van observaties, homogeniteit van varianties (gelijke varianties tussen groepen) en een normale verdeling van de data binnen elke groep.
Wat geeft een significante F-statistiek aan in ANOVA?
Een significante F-statistiek betekent dat ten minste één groepsgemiddelde significant verschilt, wat aangeeft dat de verschillen tussen groepen niet aan toeval te wijten zijn.

