Chuyển đến nội dung chính

Kiểm định ANOVA: Hướng dẫn chuyên sâu kèm ví dụ

Tìm hiểu cách dùng kiểm định ANOVA để so sánh trung bình của nhiều nhóm với ví dụ rõ ràng, ứng dụng thực tế và mẹo phân tích dữ liệu.
Đã cập nhật 5 thg 6, 2026  · 11 phút đọc

ANOVA cung cấp một cách để kiểm tra xem có sự khác biệt đáng kể giữa các trung bình nhóm hay không, giúp nhà nghiên cứu xác định liệu biến thiên trong dữ liệu đến từ khác biệt thực sự giữa các nhóm hay chỉ do ngẫu nhiên. Phương pháp này hữu ích khi làm việc với thí nghiệm hoặc nghiên cứu có hơn hai nhóm, nơi các kiểm định t truyền thống có thể không phù hợp hoặc không hiệu quả.

Bài viết này sẽ tìm hiểu những điều căn bản về kiểm định ANOVA, mục đích của nó, hai loại chính và hướng dẫn từng bước để thực hiện ANOVA. Hiểu các khái niệm này sẽ giúp bạn chọn đúng kiểm định cho dữ liệu và tự tin diễn giải kết quả. Chúng tôi cũng sẽ xét một ví dụ để hiểu rõ hơn. Nếu bạn mới làm quen với kiểm định giả thuyết nói chung, hãy đọc hướng dẫn Hypothesis Testing Made Easy.

Kiểm định ANOVA là gì?

ANOVA là viết tắt của Analysis of Variance (Phân tích phương sai), một kiểm định thống kê dùng để so sánh trung bình của ba nhóm trở lên. Nó phân tích phương sai trong nội bộ nhóm và giữa các nhóm. Mục tiêu chính là đánh giá liệu phương sai quan sát được giữa các trung bình nhóm có lớn hơn phương sai trong nội bộ nhóm hay không. Nếu phương sai giữa các trung bình nhóm là đáng kể, điều đó gợi ý rằng sự khác biệt là có ý nghĩa.

Về mặt toán học, ANOVA phân rã tổng biến thiên trong dữ liệu thành hai thành phần:

  • Biến thiên trong nội bộ nhóm: Biến thiên do khác biệt trong từng nhóm, phản ánh dao động ngẫu nhiên.
  • Biến thiên giữa các nhóm: Biến thiên do khác biệt giữa các trung bình của các nhóm khác nhau.

Thống kê F để tính ANOVA. Hình do Tác giả thực hiện

Kiểm định tạo ra một thống kê F, cho thấy tỷ lệ giữa biến thiên giữa nhóm và trong nội bộ nhóm. Nếu thống kê F đủ lớn, điều đó cho thấy ít nhất một trung bình nhóm khác biệt đáng kể so với các nhóm còn lại.

Để hiểu rõ hơn, hãy xét tình huống bạn được yêu cầu đánh giá kết quả học tập (điểm thi) của sinh viên dựa trên ba phương pháp giảng dạy: thuyết giảng, hội thảo tương tác và học trực tuyến. ANOVA có thể giúp chúng ta đánh giá liệu phương pháp giảng dạy có ảnh hưởng thống kê đến điểm thi của sinh viên hay không.

Hai loại kiểm định ANOVA

Có hai loại ANOVA: một nhân tố (one-way) và hai nhân tố (two-way). Tùy vào số lượng biến độc lập và cách chúng tương tác, mỗi loại được dùng trong các bối cảnh khác nhau.

1. ANOVA một nhân tố

ANOVA một nhân tố được dùng khi có một biến độc lập với hai nhóm trở lên. Mục tiêu là xác định liệu tồn tại khác biệt đáng kể giữa các trung bình nhóm hay không.

Trong ví dụ của chúng ta, có thể dùng ANOVA một nhân tố để so sánh hiệu quả của ba phương pháp giảng dạy khác nhau (thuyết giảng, hội thảo và học trực tuyến) đối với điểm thi của sinh viên. Phương pháp giảng dạy là biến độc lập với ba nhóm, và điểm thi là biến phụ thuộc.

  • Giả thuyết không (H₀): Trung bình điểm thi của sinh viên ở ba phương pháp giảng dạy là bằng nhau (không có khác biệt về trung bình).
  • Giả thuyết đối (H₁): Ít nhất một trung bình nhóm khác biệt đáng kể.

Comparison of null and alternative hypothesisSo sánh giả thuyết không và giả thuyết đối. Hình do Tác giả thực hiện

Kiểm định ANOVA một nhân tố sẽ cho biết liệu biến thiên trong điểm thi của sinh viên có thể quy cho khác biệt giữa các phương pháp giảng dạy hay nhiều khả năng chỉ do ngẫu nhiên.

ANOVA một nhân tố hiệu quả khi phân tích tác động của một yếu tố trên nhiều nhóm, giúp diễn giải đơn giản hơn. Tuy nhiên, nó không xét đến khả năng tương tác giữa nhiều biến độc lập, khi đó ANOVA hai nhân tố là cần thiết.

2. ANOVA hai nhân tố

ANOVA hai nhân tố được dùng khi có hai biến độc lập, mỗi biến có hai nhóm trở lên. Mục tiêu là phân tích cách cả hai biến độc lập ảnh hưởng đến biến phụ thuộc.

Giả sử bạn quan tâm đến mối quan hệ giữa phương pháp giảng dạy và kỹ thuật học, và cách chúng cùng nhau tác động đến kết quả học tập. ANOVA hai nhân tố phù hợp cho tình huống này. Ở đây chúng ta kiểm định ba giả thuyết:

  • Hiệu ứng chính của nhân tố 1 (phương pháp giảng dạy): Phương pháp giảng dạy có ảnh hưởng đến điểm thi của sinh viên không?
  • Hiệu ứng chính của nhân tố 2 (kỹ thuật học): Kỹ thuật học có ảnh hưởng đến điểm thi không?
  • Hiệu ứng tương tác: Hiệu quả của phương pháp giảng dạy có phụ thuộc vào kỹ thuật học được sử dụng không?

Ví dụ, ANOVA hai nhân tố có thể cho thấy sinh viên theo phương pháp thuyết giảng học tốt hơn khi học nhóm, còn học trực tuyến có thể hiệu quả hơn khi học cá nhân. Hiểu các tương tác này giúp có cái nhìn sâu hơn về cách các yếu tố khác nhau cùng tác động đến kết quả.

ANOVA so với kiểm định t

Bạn có thể thắc mắc: Khi nào nên chọn ANOVA thay vì kiểm định t? Kiểm định t và ANOVA đều dùng để so sánh trung bình giữa các nhóm, nhưng việc lựa chọn phụ thuộc vào số lượng nhóm được so sánh và độ phức tạp của cấu trúc dữ liệu.

Khi nào dùng kiểm định t

Kiểm định t phù hợp khi so sánh trung bình của hai nhóm. Chẳng hạn, nếu chúng ta muốn so sánh điểm thi của sinh viên chỉ với hai phương pháp giảng dạy — thuyết giảng và hội thảo — kiểm định t là đủ. Có hai loại kiểm định t:

  • Kiểm định t độc lập: So sánh hai nhóm độc lập (ví dụ: thuyết giảng so với hội thảo).
  • Kiểm định t có ghép cặp: So sánh trung bình của cùng một nhóm tại các thời điểm khác nhau (ví dụ: hiệu quả học tập của sinh viên trước và sau khi áp dụng một phương pháp giảng dạy cụ thể).

Khi nào dùng ANOVA

Ngược lại, ANOVA được dùng khi so sánh trung bình của ba nhóm trở lên. Nghiên cứu của chúng ta bao gồm ba phương pháp giảng dạy (thuyết giảng, hội thảo và học trực tuyến), do đó cần nhiều hơn một kiểm định t. Việc dùng nhiều kiểm định t cho từng cặp nhóm sẽ làm tăng rủi ro sai lầm loại I (dương tính giả), trong khi ANOVA xử lý so sánh trong một kiểm định và kiểm soát lỗi này.

Các giả định của kiểm định ANOVA

Mọi kiểm định thống kê đều có các giả định cần được đáp ứng để đảm bảo kết quả hợp lệ. 

Dưới đây là các giả định cần thỏa mãn đối với ANOVA:

1. Tính độc lập của quan sát

Các quan sát (điểm dữ liệu) phải độc lập với nhau. Trong ví dụ, điểm thi của sinh viên ở một phương pháp giảng dạy không được ảnh hưởng đến điểm của sinh viên ở phương pháp khác.

2. Đồng nhất phương sai

Phương sai trong mỗi nhóm nên xấp xỉ bằng nhau. ANOVA giả định rằng mức độ biến thiên điểm thi trong mỗi nhóm phương pháp giảng dạy là tương tự nhau. Có thể kiểm tra bằng kiểm định Levene, nhằm kiểm tra sự bằng nhau của phương sai.

3. Phân phối chuẩn

Dữ liệu trong mỗi nhóm nên tuân theo phân phối chuẩn. Trong ví dụ phương pháp giảng dạy, điểm thi của sinh viên trong mỗi nhóm (Thuyết giảng, Hội thảo, Học trực tuyến) lý tưởng là phân phối gần chuẩn.

Nếu bất kỳ giả định nào bị vi phạm, kết quả kiểm định có thể không hợp lệ. Khi đó, cần cân nhắc dùng kiểm định phi tham số.

Thực hiện kiểm định ANOVA

Chúng ta sẽ tiếp tục ví dụ so sánh các phương pháp giảng dạy khác nhau để xem chúng ảnh hưởng đến điểm thi của sinh viên như thế nào. Giả sử bạn có dữ liệu sau thể hiện điểm thi (biến phụ thuộc) theo phương pháp giảng dạy (biến độc lập).

Exam scores for each teaching method for four students eachĐiểm thi cho mỗi phương pháp giảng dạy, mỗi nhóm gồm bốn sinh viên. Hình do Tác giả thực hiện

Bước 1: Xác định giả thuyết

Bước đầu tiên là xác định giả thuyết. Nêu giả thuyết không và giả thuyết đối:

  • Giả thuyết không (H₀): Trung bình điểm thi của sinh viên ở ba phương pháp giảng dạy là bằng nhau.
  • Giả thuyết đối (H₁): Ít nhất một phương pháp giảng dạy có trung bình điểm thi khác biệt.

Giả thuyết không và Giả thuyết đối. Hình do Tác giả thực hiện

Bước 2: Kiểm tra các giả định của ANOVA

Trước khi thực hiện ANOVA, hãy đảm bảo các giả định được đáp ứng: chuẩn tính, độc lập và đồng nhất phương sai. Để đơn giản, giả sử mọi giả định đều được thỏa mãn.

Bước 3: Tính ANOVA

Sau khi kiểm tra các giả định, hãy tính ANOVA.

Công thức cho thống kê F trong ANOVA một nhân tố được nêu dưới đây.

Thống kê F trong ANOVA một nhân tố. Hình do Tác giả thực hiện

Thống kê F trong ANOVA một nhân tố là tỷ lệ giữa trung bình bình phương giữa các nhóm và trung bình bình phương trong nội bộ nhóm.

Để đạt được điều này, hãy đi từng bước.

1. Tính trung bình cho mỗi nhóm và trung bình tổng thể.

Dùng công thức dưới đây để tính trung bình cho mỗi phương pháp giảng dạy (Ai). Chia tổng điểm thi của mỗi nhóm cho số sinh viên trong nhóm đó.

Trung bình cho mỗi nhóm (phương pháp giảng dạy). Hình do Tác giả thực hiện

Tiếp theo, tính trung bình tổng thể (G) bằng cách chia tổng của tất cả quan sát cho tổng số sinh viên.

Trung bình tổng thể của điểm thi. Hình do Tác giả thực hiện

2. Tính tổng bình phương cho mỗi nhóm

Công thức sau được dùng để tính tổng bình phương cho mỗi nhóm.

Tổng bình phương cho mỗi phương pháp giảng dạy. Hình do Tác giả thực hiện

Sau khi tính toán, hãy điền các giá trị vào bảng này để tiện tra cứu.

Tóm tắt kết quả học tập theo phương pháp giảng dạy. Hình do Tác giả thực hiện

3. Tính tổng bình phương giữa các nhóm, tổng bình phương trong nhóm và tổng bình phương toàn phần.

Dùng công thức dưới đây để tính tổng bình phương giữa các nhóm. Trong công thức,

  • Ai: Trung bình của nhóm
  • G: Trung bình tổng thể
  • ni: số quan sát trong mỗi nhóm

Hãy dùng các giá trị từ bảng tóm tắt để tính toán.

The sum of squares between the groupTổng bình phương giữa các nhóm

Tiếp theo, tính tổng bình phương trong nhóm. Đây là tổng của tổng bình phương (SS) cho mỗi nhóm.

Tổng bình phương trong nhóm. Hình do Tác giả thực hiện

Dùng công thức dưới đây để tính tổng bình phương toàn phần
Tổng bình phương toàn phần. Hình do Tác giả thực hiện

Xác minh phép tính bằng cách kiểm tra xem tổng bình phương toàn phần có bằng tổng của tổng bình phương giữa các nhóm và tổng bình phương trong nhóm hay không. Sau khi xác minh, chuyển sang tính trung bình bình phương.

4. Tính trung bình bình phương

Trung bình bình phương là tỷ lệ giữa tổng bình phương và bậc tự do.

Bậc tự do giữa các nhóm df_between bằng số nhóm trừ một, và bậc tự do trong nhóm df_w bằng tổng số đối tượng trừ số nhóm.

Với các giá trị đã tính ở bước trước, hãy tính trung bình bình phương.

Mean squares between the groups and within the groupsTrung bình bình phương giữa các nhóm và trong nhóm. Hình do Tác giả thực hiện

5. Tính thống kê F bằng công thức dưới đây

Thống kê F là tỷ lệ giữa trung bình bình phương giữa nhóm và trung bình bình phương trong nhóm.

Thống kê F. Hình do Tác giả thực hiện

Giá trị thống kê F tính được là 28,747.

Cuối cùng, p-value được tính dựa trên thống kê F, bậc tự do df và bảng phân phối F.

Trong ví dụ này, df của tử số là 2, df của mẫu số là 9, và thống kê F là 28,747. Do đó, p-value từ bảng phân phối F là 0,000123.

Bước 4: Diễn giải kết quả

  • Thống kê F: Thống kê F đo tỷ lệ giữa biến thiên giữa nhóm và biến thiên trong nhóm. F càng cao cho thấy khác biệt giữa các trung bình nhóm càng lớn so với biến thiên ngẫu nhiên.
  • P-value: P-value xác định liệu sự khác biệt giữa các trung bình nhóm có ý nghĩa thống kê hay không. Nếu p-value thấp hơn ngưỡng định trước (thường là 0,05), hãy bác bỏ giả thuyết không và kết luận rằng ít nhất một nhóm có trung bình khác biệt đáng kể.

P-value là 0,000123, và chúng ta sẽ bác bỏ giả thuyết không để kết luận rằng phương pháp giảng dạy ảnh hưởng đáng kể đến điểm thi.

Kiểm định hậu nghiệm sau ANOVA

ANOVA cho biết liệu có sự khác biệt có ý nghĩa thống kê giữa các trung bình nhóm hay không, nhưng không chỉ ra cụ thể nhóm nào khác biệt so với nhóm nào. Đây là vai trò của các kiểm định hậu nghiệm — chúng thực hiện so sánh từng cặp nhóm để xác định chính xác sự khác biệt nằm ở đâu. Khi có hơn hai nhóm và kết quả ANOVA là có ý nghĩa, các kiểm định này là thiết yếu.

Tiếp tục với ví dụ của chúng ta, sau khi thực hiện ANOVA một nhân tố cho ba phương pháp giảng dạy (Thuyết giảng, Hội thảo và Học trực tuyến), kiểm định cho thấy có sự khác biệt đáng kể về điểm thi. Kiểm định hậu nghiệm sẽ giúp xác định phương pháp giảng dạy nào ảnh hưởng đến kết quả thi theo cách khác biệt.

Tukey’s Honestly Significant Difference (HSD) và hiệu chỉnh Bonferroni là các kiểm định hậu nghiệm được dùng rộng rãi.

Các lựa chọn thay thế ANOVA

Nếu các giả định của ANOVA không được đáp ứng, hoặc khi ANOVA không phù hợp với bộ dữ liệu, hãy cân nhắc các lựa chọn thay thế sau.

  1. Kiểm định Kruskal–Wallis: Một lựa chọn phi tham số thay thế cho ANOVA một nhân tố khi giả định chuẩn tính bị vi phạm. Đây là phiên bản mở rộng của kiểm định Mann–Whitney U.
  2. MANOVA (Phân tích phương sai đa biến): Mở rộng nguyên lý của ANOVA cho nhiều biến phụ thuộc. Kiểm tra xem các véc-tơ trung bình của nhiều biến phụ thuộc có khác nhau giữa các nhóm hay không.

Kết luận

Bài viết này đã giới thiệu các khái niệm cốt lõi của ANOVA và nêu bật khi nào nên dùng nó thay vì kiểm định t. Chúng ta đã thấy ANOVA là một phân tích thống kê mạnh mẽ cho phép so sánh đồng thời nhiều nhóm. Chúng tôi đã cung cấp hướng dẫn từng bước để thực hiện ANOVA, chi tiết cách xây dựng giả thuyết, kiểm tra giả định và diễn giải kết quả.

Để thực hành ANOVA trong Excel, hãy xem hướng dẫn Comprehensive Guide to Using ANOVA in Excel. Cân nhắc tham gia các khóa học Foundations of Inference in PythonInferential Statistics để mở rộng kiến thức thống kê.


Arunn Thevapalan's photo
Author
Arunn Thevapalan
LinkedIn
Twitter

Với vai trò nhà khoa học dữ liệu cao cấp, tôi thiết kế, phát triển và triển khai các giải pháp học máy quy mô lớn để giúp doanh nghiệp ra quyết định dựa trên dữ liệu hiệu quả hơn. Với vai trò tác giả về khoa học dữ liệu, tôi chia sẻ những bài học kinh nghiệm, lời khuyên nghề nghiệp và các hướng dẫn thực hành chuyên sâu.

Câu hỏi thường gặp

ANOVA là gì và vì sao được sử dụng?

ANOVA, hay Phân tích phương sai, là một kiểm định thống kê so sánh trung bình của ba nhóm trở lên. Nó giúp xác định liệu các khác biệt quan sát được giữa các nhóm là có ý nghĩa hay chỉ do ngẫu nhiên.

Sự khác nhau giữa ANOVA một nhân tố và hai nhân tố là gì?

ANOVA một nhân tố so sánh trung bình các nhóm dựa trên một biến độc lập. ANOVA hai nhân tố xem xét tác động của hai biến độc lập và tương tác giữa chúng.

Khi nào tôi nên dùng ANOVA thay vì kiểm định t?

Hãy dùng ANOVA khi so sánh trung bình của ba nhóm trở lên. Kiểm định t phù hợp để so sánh trung bình của hai nhóm.

Các giả định chính khi thực hiện ANOVA là gì?

ANOVA yêu cầu tính độc lập của quan sát, đồng nhất phương sai (phương sai bằng nhau giữa các nhóm) và dữ liệu trong mỗi nhóm có phân phối gần chuẩn.

Thống kê F có ý nghĩa trong ANOVA cho biết điều gì?

Một thống kê F có ý nghĩa cho thấy ít nhất một trung bình nhóm khác biệt đáng kể, ngụ ý rằng khác biệt giữa các nhóm không chỉ do ngẫu nhiên.

Chủ đề

Học cùng DataCamp

Courses

Kiểm định giả thuyết trong R

4 giờ
33.6K
Xem chi tiếtRight Arrow
Bắt đầu khóa học
Xem thêmRight Arrow