Corso
L’ANOVA offre un modo per verificare se esistono differenze significative tra le medie dei gruppi, aiutando i ricercatori a stabilire se la variazione nei dati è dovuta a reali differenze tra i gruppi o solo al caso. Questo metodo è utile quando si conducono esperimenti o studi che coinvolgono più di due gruppi, dove i tradizionali t-test potrebbero non essere appropriati o efficienti.
In questo articolo esploreremo i fondamenti del test ANOVA, il suo scopo, i due principali tipi e una guida passo passo per eseguire l’ANOVA. Capire questi concetti può aiutarti a scegliere il test corretto per i tuoi dati e a interpretare i risultati con sicurezza. Considereremo anche un esempio per comprendere meglio il concetto. Se sei alle prime armi con l’idea del test d’ipotesi in generale, leggi il nostro tutorial Hypothesis Testing Made Easy.
Che cos’è un test ANOVA?
ANOVA sta per Analysis of Variance, un test statistico usato per confrontare le medie di tre o più gruppi. Analizza la varianza all’interno del gruppo e tra i gruppi. L’obiettivo principale è valutare se la varianza osservata tra le medie dei gruppi è più grande di quella all’interno dei gruppi. Se la varianza osservata tra le medie dei gruppi è significativa, suggerisce che le differenze sono sostanziali.
Matematicamente, l’ANOVA scompone la variabilità totale nei dati in due componenti:
- Variabilità intra-gruppo: Variabilità causata da differenze all’interno dei singoli gruppi, che riflette fluttuazioni casuali.
- Variabilità inter-gruppo: Variabilità causata da differenze tra le medie dei diversi gruppi.

Statistica F per calcolare l’ANOVA. Immagine dell’autore
Il test produce una statistica F, che mostra il rapporto tra la variabilità inter-gruppo e quella intra-gruppo. Se la statistica F è sufficientemente grande, indica che almeno una delle medie dei gruppi è significativamente diversa dalle altre.
Per capirlo meglio, considera uno scenario in cui ti viene chiesto di valutare il rendimento di uno studente (punteggi d’esame) in base a tre metodi di insegnamento: lezione frontale, workshop interattivo e apprendimento online. L’ANOVA può aiutarci a valutare se il metodo di insegnamento incide statisticamente sulla performance d’esame dello studente.
I due tipi di test ANOVA
Esistono due tipi di ANOVA: a una via (one-way) e a due vie (two-way). A seconda del numero di variabili indipendenti e di come interagiscono tra loro, si usano in scenari diversi.
1. ANOVA a una via
Un test ANOVA a una via si usa quando c’è una sola variabile indipendente con due o più gruppi. L’obiettivo è determinare se esiste una differenza significativa tra le medie dei diversi gruppi.
Nel nostro esempio, possiamo usare l’ANOVA a una via per confrontare l’efficacia dei tre diversi metodi di insegnamento (lezione, workshop e apprendimento online) sui punteggi d’esame degli studenti. Il metodo di insegnamento è la variabile indipendente con tre gruppi e il punteggio d’esame è la variabile dipendente.
- Ipotesi nulla (H₀): Le medie dei punteggi d’esame degli studenti nei tre metodi di insegnamento sono uguali (nessuna differenza tra le medie).
- Ipotesi alternativa (H₁): La media di almeno un gruppo è significativamente diversa.
Confronto tra ipotesi nulla e alternativa. Immagine dell’autore
Il test ANOVA a una via ci dirà se la variazione nei punteggi d’esame degli studenti può essere attribuita alle differenze nei metodi di insegnamento o se è probabilmente dovuta al caso.
L’ANOVA a una via è efficace quando si analizza l’impatto di un singolo fattore su più gruppi, rendendo l’interpretazione più semplice. Tuttavia, non considera la possibilità di interazione tra più variabili indipendenti, situazione in cui diventa necessaria l’ANOVA a due vie.
2. ANOVA a due vie
L’ANOVA a due vie si usa quando ci sono due variabili indipendenti, ciascuna con due o più gruppi. L’obiettivo è analizzare come entrambe le variabili indipendenti influenzano la variabile dipendente.
Supponiamo che tu sia interessato alla relazione tra metodi di insegnamento e tecniche di studio e a come influiscano congiuntamente sul rendimento degli studenti. L’ANOVA a due vie è adatta a questo scenario. Qui testiamo tre ipotesi:
- L’effetto principale del fattore 1 (metodo di insegnamento): Il metodo di insegnamento influenza i punteggi d’esame degli studenti?
- L’effetto principale del fattore 2 (tecnica di studio): La tecnica di studio incide sui punteggi d’esame?
- Effetto di interazione: L’efficacia del metodo di insegnamento dipende dalla tecnica di studio utilizzata?
Per esempio, l’ANOVA a due vie potrebbe rivelare che gli studenti che seguono lezioni frontali rendono meglio nello studio di gruppo, mentre chi segue l’apprendimento online potrebbe rendere meglio nello studio individuale. Comprendere queste interazioni offre una visione più profonda di come diversi fattori, insieme, influenzino i risultati.
ANOVA vs. T-test
Potresti chiederti: quando scegliere l’ANOVA invece di un t-test? Il t-test e l’ANOVA servono per confrontare le medie tra gruppi, ma la scelta dipende dal numero di gruppi confrontati e dalla complessità della struttura dei dati.
Quando usare un T-test
Un t-test è appropriato quando si confrontano le medie di due gruppi. Ad esempio, se volessimo confrontare i punteggi d’esame degli studenti usando solo due metodi di insegnamento — lezione e workshop — un t-test sarebbe sufficiente. Esistono due tipi di t-test:
- T-test per campioni indipendenti: Confronta due gruppi indipendenti (es., lezione vs workshop).
- T-test per campioni appaiati: Confronta le medie dello stesso gruppo in momenti diversi (es., rendimento dello studente prima e dopo l’uso di un particolare metodo di insegnamento).
Quando usare l’ANOVA
L’ANOVA, invece, si usa quando si confrontano le medie di tre o più gruppi. Il nostro studio include tre metodi di insegnamento (lezione, workshop e apprendimento online), quindi serve qualcosa di più di un t-test. Usare più t-test per ogni coppia di gruppi aumenterebbe il rischio di errore di Tipo I (falsi positivi), mentre l’ANOVA gestisce il confronto in un unico test e controlla questo errore.
Assunzioni del test ANOVA
Tutti i test statistici hanno delle assunzioni che devono essere soddisfatte per garantire risultati validi.
Ecco le assunzioni che devono essere rispettate per l’ANOVA:
1. Indipendenza delle osservazioni
Le osservazioni (punti dati) devono essere indipendenti tra loro. Nell’esempio, i punteggi d’esame degli studenti in un metodo di insegnamento non dovrebbero influenzare i punteggi degli studenti in un altro metodo.
2. Omogeneità delle varianze
Le varianze all’interno di ciascun gruppo dovrebbero essere approssimativamente uguali. L’ANOVA presume che la variabilità dei punteggi d’esame all’interno di ciascun gruppo di metodo di insegnamento sia all’incirca la stessa. Questo può essere verificato con il test di Levene, che controlla l’uguaglianza delle varianze.
3. Distribuzione normale
I dati all’interno di ciascun gruppo dovrebbero seguire una distribuzione normale. Nel nostro esempio sui metodi di insegnamento, i punteggi d’esame degli studenti in ciascun gruppo (lezione, workshop, apprendimento online) idealmente dovrebbero essere distribuiti normalmente.
Se una qualsiasi assunzione è violata, i risultati del test potrebbero non essere validi. In tali casi, è importante considerare l’uso di un test non parametrico.
Eseguire un test ANOVA
Useremo lo stesso esempio del confronto tra diversi metodi di insegnamento per esaminare come influenzano i punteggi d’esame degli studenti. Supponiamo che ti vengano forniti i seguenti dati che mostrano i punteggi d’esame (variabile dipendente) in base al metodo di insegnamento (variabile indipendente).
Punteggi d’esame per ciascun metodo di insegnamento per quattro studenti ciascuno. Immagine dell’autore
Passo 1: definire l’ipotesi
Il primo passo del processo è definire l’ipotesi. Indica l’ipotesi nulla e l’ipotesi alternativa:
- Ipotesi nulla (H₀): Le medie dei punteggi d’esame degli studenti nei tre metodi di insegnamento sono uguali.
- Ipotesi alternativa (H₁): Almeno un metodo di insegnamento ha una media dei punteggi d’esame diversa.

Ipotesi nulla e ipotesi alternativa. Immagine dell’autore
Passo 2: verificare le assunzioni dell’ANOVA
Prima di eseguire l’ANOVA, assicurati che le assunzioni siano rispettate: normalità, indipendenza e omogeneità delle varianze. Per semplicità, supponiamo che tutte le assunzioni siano soddisfatte.
Passo 3: calcolare l’ANOVA
Una volta verificate le assunzioni, calcola l’ANOVA.
La formula della statistica F nell’ANOVA a una via è definita di seguito.

Statistica F nell’ANOVA a una via. Immagine dell’autore
La statistica F nell’ANOVA a una via è il rapporto tra la media dei quadrati tra i gruppi e la media dei quadrati all’interno dei gruppi.
Per arrivarci, andiamo passo per passo.
1. Calcolare la media per ciascun gruppo e la media complessiva.
Usa l’equazione seguente per calcolare la media per ciascun metodo di insegnamento (Ai). Dividi la somma dei punteggi d’esame per ciascun gruppo per il numero di studenti in ciascun gruppo.

Media per ciascun gruppo (metodo di insegnamento). Immagine dell’autore
Poi calcola la media complessiva (G) dividendo la somma di tutte le osservazioni per il numero totale di studenti.

Media complessiva dei punteggi d’esame. Immagine dell’autore
2. Calcolare la somma dei quadrati per ciascun gruppo
L’equazione seguente serve a calcolare la somma dei quadrati per ciascun gruppo.

Somma dei quadrati per ciascun metodo di insegnamento. Immagine dell’autore
Dopo il calcolo, riempi questa tabella con i valori per averli a portata di mano.
Riepilogo del rendimento degli studenti per metodo di insegnamento. Immagine dell’autore
3. Calcolare la somma dei quadrati tra i gruppi, la somma dei quadrati entro i gruppi e la somma dei quadrati totale.
Usando l’equazione seguente, calcola la somma dei quadrati tra i gruppi. Nell’equazione,
- Ai: media del gruppo
- G: media complessiva
- ni: numero di osservazioni in ciascun gruppo
Usa i valori della tabella di riepilogo per il calcolo.
Somma dei quadrati tra i gruppi
Poi calcola la somma dei quadrati entro i gruppi. È la somma delle somme dei quadrati (SS) per ciascun gruppo.

Somma dei quadrati entro i gruppi. Immagine dell’autore
Usa l’equazione seguente per calcolare la somma dei quadrati totale
Somma dei quadrati totale. Immagine dell’autore
Verifica il calcolo controllando se la somma dei quadrati totale è la somma della somma dei quadrati tra i gruppi e della somma dei quadrati entro i gruppi. Dopo la verifica, passa al calcolo delle medie dei quadrati.
4. Calcolare le medie dei quadrati
La media dei quadrati è il rapporto tra la somma dei quadrati e i gradi di libertà.
I gradi di libertà tra i gruppi df_between sono pari al numero di gruppi meno uno, e i gradi di libertà entro i gruppi df_w sono pari al numero totale di partecipanti meno il numero di gruppi.
Con i valori calcolati nel passaggio precedente, calcola le medie dei quadrati.
Medie dei quadrati tra i gruppi e entro i gruppi. Immagine dell’autore
5. Calcolare la statistica F usando l’equazione seguente
La statistica F è il rapporto tra la media dei quadrati tra i gruppi e la media dei quadrati entro i gruppi.

Statistica F. Immagine dell’autore
Il valore calcolato della statistica F è 28,747.
Infine, il p-value si calcola usando la statistica F, i gradi di libertà df e la tavola della distribuzione F.
In questo esempio, il df del numeratore è 2, il df del denominatore è 9 e la statistica F è 28,747. Pertanto, il p-value dalla tavola della distribuzione F è 0,000123.
Passo 4: interpretare i risultati
- Statistica F: La statistica F misura il rapporto tra la variazione inter-gruppo e quella intra-gruppo. Un valore F più alto indica una differenza più marcata tra le medie dei gruppi rispetto alla variazione casuale.
- P-value: Il p-value determina se le differenze tra le medie dei gruppi sono statisticamente significative. Se il p-value è al di sotto di una soglia predefinita (comunemente 0,05), rifiuta l’ipotesi nulla e concludi che almeno un gruppo ha una media significativamente diversa.
Il p-value è 0,000123 e rifiuteremmo l’ipotesi nulla, concludendo che il metodo di insegnamento influisce significativamente sui punteggi d’esame.
Test post-hoc dopo l’ANOVA
L’ANOVA ci dice se esiste una differenza statisticamente significativa tra le medie dei gruppi, ma non specifica quali gruppi differiscono tra loro. Questo è il ruolo dei test post‑hoc: eseguono confronti a coppie tra i gruppi per identificare con precisione dove esistono le differenze. Quando hai più di due gruppi e il risultato dell’ANOVA è significativo, questi test sono essenziali.
Proseguendo con il nostro esempio, il test rivela una differenza significativa nei punteggi d’esame degli studenti dopo aver eseguito l’ANOVA a una via sui tre metodi di insegnamento (lezione, workshop e apprendimento online). Un test post‑hoc ci aiuterà a determinare quali metodi di insegnamento incidono in modo diverso sulla performance agli esami.
L’Honest Significant Difference (HSD) di Tukey e la correzione di Bonferroni sono test post‑hoc ampiamente utilizzati.
Alternative all’ANOVA
Se le assunzioni dell’ANOVA non sono rispettate, o quando l’ANOVA non è adatta al set di dati, considera le seguenti alternative.
- Test di Kruskal-Wallis: è un’alternativa non parametrica all’ANOVA a una via quando l’assunzione di normalità è violata. È una versione estesa del test di Mann-Whitney U.
- MANOVA (Multivariate Analysis of Variance): estende i principi dell’ANOVA a più variabili dipendenti. Verifica se i vettori medi di più variabili dipendenti differiscono tra i gruppi.
Conclusione
Questo articolo ha introdotto i concetti base dell’ANOVA e ha evidenziato quando usarla rispetto a un t-test. Abbiamo visto che l’ANOVA è un’analisi statistica robusta che confronta contemporaneamente più gruppi. Abbiamo fornito una guida passo passo per eseguire l’ANOVA, dettagliando come formulare le ipotesi, verificare le assunzioni e interpretare i risultati.
Per fare pratica con l’ANOVA in Excel, dai un’occhiata al tutorial Comprehensive Guide to Using ANOVA in Excel. Prendi in considerazione i corsi Foundations of Inference in Python e Inferential Statistics per ampliare le tue conoscenze di statistica.
Come senior data scientist, progetto, sviluppo e distribuisco soluzioni di machine learning su larga scala per aiutare le aziende a prendere decisioni migliori basate sui dati. Come autore nell'ambito della data science, condivido ciò che ho imparato, consigli di carriera e tutorial pratici approfonditi.
Domande frequenti
Che cos’è l’ANOVA e perché si usa?
ANOVA, o Analysis of Variance, è un test statistico che confronta le medie di tre o più gruppi. Aiuta a determinare se le differenze osservate tra i gruppi sono significative o dovute al caso.
Qual è la differenza tra ANOVA a una via e a due vie?
L’ANOVA a una via confronta le medie dei gruppi in base a una variabile indipendente. L’ANOVA a due vie esamina l’impatto di due variabili indipendenti e la loro interazione.
Quando dovrei usare l’ANOVA invece di un t-test?
Usa l’ANOVA quando confronti le medie di tre o più gruppi. Un t-test è appropriato per confrontare le medie di due gruppi.
Quali sono le principali assunzioni per eseguire l’ANOVA?
L’ANOVA richiede indipendenza delle osservazioni, omogeneità delle varianze (varianze uguali tra i gruppi) e distribuzione normale dei dati all’interno di ciascun gruppo.
Cosa indica una statistica F significativa nell’ANOVA?
Una statistica F significativa significa che la media di almeno un gruppo è significativamente diversa, indicando che le differenze tra i gruppi non sono dovute al caso.


