Lewati ke konten utama

Uji Mann-Whitney U: Alternatif Nonparametrik untuk uji t

Uji Mann-Whitney U adalah uji nonparametrik berbasis peringkat untuk membandingkan dua kelompok independen ketika data tidak memenuhi asumsi kenormalan yang disyaratkan uji t.
Diperbarui 4 Mei 2026  · 10 mnt baca

Pernahkah Anda menjalankan uji t, mendapatkan nilai p yang aneh, dan belakangan tahu bahwa data Anda sama sekali tidak berdistribusi normal?

Hal ini pernah terjadi pada semua orang. Masalah dengan uji t adalah asumsi bahwa data Anda mengikuti distribusi normal. Ketika tidak, hasilnya bisa menyesatkan. Data miring dan ukuran sampel kecil semuanya melanggar asumsi kenormalan itu. Dan data dunia nyata jarang berperilaku seperti yang dikatakan buku teks.

Uji Mann-Whitney U hadir untuk mengatasi masalah tersebut. Ini adalah alternatif nonparametrik untuk uji t yang membandingkan dua kelompok berdasarkan peringkat, bukan rata-rata, sehingga tidak peduli dengan bentuk distribusi Anda.

Dalam artikel ini, saya akan membahas apa itu uji Mann-Whitney U, kapan menggunakannya, bagaimana matematikanya bekerja, serta cara menjalankan dan menafsirkannya di Python dan R.

Namun, apa sebenarnya uji t itu? Jika Anda punya pertanyaan tersebut, bacalah postingan blog kami Pengantar Uji t di Python - itu akan menjawab semua pertanyaan Anda.

Apa Itu Uji Mann-Whitney U?

Uji Mann-Whitney U adalah uji statistik nonparametrik yang digunakan untuk membandingkan dua kelompok independen.

Berbeda dengan uji t, uji ini tidak berasumsi bahwa data Anda mengikuti distribusi normal. Uji ini membandingkan distribusi dua kelompok dengan mengonversi nilai mentah menjadi peringkat dan menganalisisnya. Itu membuatnya cocok ketika data Anda miring, memiliki pencilan, atau tidak memenuhi asumsi kenormalan dengan cara apa pun.

Anda juga akan melihatnya disebut sebagai uji jumlah peringkat Wilcoxon (Wilcoxon rank-sum). Untuk semua tujuan praktis, keduanya sinonim.

Kapan Menggunakan Uji Mann-Whitney U

Uji Mann-Whitney U memerlukan serangkaian kondisi tertentu. Anda hanya boleh menggunakannya ketika semua hal berikut terpenuhi:

  • Dua kelompok independen: Sampel tidak saling tumpang tindih, dan nilai pada satu kelompok tidak memengaruhi kelompok lainnya
  • Data ordinal atau kontinu: Misalnya nilai ujian, waktu respons, atau nilai terukur apa pun
  • Distribusi tidak normal: Data Anda miring, berekor tebal, atau Anda tidak dapat mengonfirmasi kenormalan dengan sampel kecil
  • Ukuran sampel kecil: Ketika Anda tidak memiliki cukup data untuk mengandalkan teorema limit pusat

Mari kita bahas sebuah contoh.

Misalkan Anda memiliki dua kelas yang diajar dengan metode berbeda dan Anda ingin mengetahui mana yang menghasilkan nilai ujian lebih baik. Anda memplot skor dan melihat bahwa nilainya tidak berdistribusi normal - satu kelas memiliki beberapa pencilan yang menarik distribusi ke kanan. Uji t membandingkan rata-rata kelompok, sehingga pencilan tersebut menaikkan rata-rata dan membuat satu kelas terlihat lebih baik dari sebenarnya.

Rata-rata yang miring itu masuk ke perhitungan uji t, dan nilai p yang Anda dapatkan tidak mencerminkan perbedaan antar kelompok. Uji Mann-Whitney U tidak menunjukkan masalah itu karena bekerja dengan peringkat, bukan skor mentah. Satu pencilan hanya bisa menjadi nilai dengan peringkat tertinggi, sehingga tidak dapat mendistorsi hasil seperti halnya terhadap rata-rata.

Uji ini juga menjadi andalan saat Anda bekerja dengan data ordinal, seperti respons survei pada skala 1-5. Nilai-nilai tersebut tidak benar-benar kontinu, sehingga menghitung rata-rata kurang masuk akal.

Rumus Uji Mann-Whitney U

Uji ini menghasilkan dua statistik U, masing-masing untuk setiap kelompok. Berikut rumusnya:

Rumus uji Mann-Whitney u

Rumus uji Mann-Whitney U

Di mana:

  • n1 dan n2 adalah ukuran sampel kelompok 1 dan kelompok 2

  • R1 dan R2 adalah jumlah peringkat untuk setiap kelompok - jumlah semua peringkat yang diberikan pada observasi masing-masing kelompok

Jumlah peringkat dihitung dengan menggabungkan semua nilai dari kedua kelompok, mengurutkannya dari yang terendah ke tertinggi, dan memberikan peringkat pada tiap nilai. Nilai terkecil mendapat peringkat 1, berikutnya peringkat 2, dan seterusnya. Lalu Anda menjumlahkan secara terpisah peringkat-peringkat yang termasuk ke masing-masing kelompok.

Statistik uji adalah nilai yang lebih kecil dari U1 dan U2. Anda kemudian membandingkannya dengan nilai kritis atau menggunakannya untuk menghitung nilai p.

Kabar baiknya, Anda tidak perlu menghitungnya secara manual. Python dan R sama-sama dapat melakukannya untuk Anda, yang akan segera saya tunjukkan.

Asumsi Uji Mann-Whitney U

Uji Mann-Whitney U lebih fleksibel dibanding uji t, tetapi tetap memiliki tiga asumsi yang harus Anda patuhi:

  • Sampel independen: Dua kelompok tidak saling memengaruhi. Observasi pada satu kelompok tidak memiliki hubungan dengan observasi pada kelompok lain
  • Data ordinal atau kontinu: Data Anda harus memiliki urutan alami - Anda bisa mengatakan satu nilai lebih tinggi atau lebih rendah dari yang lain
  • Bentuk distribusi serupa: Jika Anda ingin menafsirkan hasil sebagai perbandingan median, kedua kelompok sebaiknya memiliki bentuk distribusi yang kurang lebih sama. Jika bentuknya berbeda, uji tetap berjalan, tetapi Anda membandingkan rata-rata peringkat, bukan median

Asumsi ketiga adalah yang paling sering membingungkan orang.

Uji Mann-Whitney U sering digambarkan sebagai uji untuk median, tetapi itu hanya benar ketika kedua distribusi memiliki bentuk serupa. Jika tidak, hasilnya memberi tahu Anda sesuatu yang lebih umum - apakah nilai pada satu kelompok cenderung lebih tinggi daripada nilai pada kelompok lain.

Uji Mann-Whitney U di Python

Modul scipy.stats di Python memiliki fungsi untuk uji Mann-Whitney U. Berikut contoh sederhana menggunakan nilai ujian dari dua kelas.

from scipy.stats import mannwhitneyu

class_a = [72, 85, 90, 65, 78, 88, 95, 70, 83, 76]
class_b = [60, 55, 74, 68, 80, 58, 63, 71, 66, 59]

stat, p_value = mannwhitneyu(class_a, class_b, alternative="two-sided")

print(f"U statistic: {stat}")
print(f"P-value: {p_value:.4f}")

Uji Mann-Whitney u di Python

Uji Mann-Whitney U di Python

Argumen alternative="two-sided" memberi tahu uji bahwa Anda memeriksa apakah kedua kelompok berbeda ke salah satu arah. Anda tidak mengasumsikan sejak awal bahwa satu kelompok bernilai lebih tinggi daripada yang lain. Jika Anda memiliki hipotesis arah, Anda akan menggunakan "less" atau "greater" sebagai gantinya.

Nilai p di sini adalah 0,0046, yang berada di bawah ambang standar 0,05. Itu berarti Anda dapat menolak hipotesis nol, karena terdapat perbedaan yang signifikan secara statistik antara distribusi skor kedua kelas.

Statistik U sendiri tidak banyak memberi tahu tanpa konteks. Anda dapat berfokus pada nilai p untuk memutuskan apakah perbedaannya signifikan secara statistik, dan melihat data mentah atau median untuk memahami arah perbedaan tersebut.

Uji Mann-Whitney U di R

R menjalankan uji Mann-Whitney U melalui fungsi wilcox.test(). Saya akan menggunakan contoh nilai ujian yang sama seperti sebelumnya.

class_a <- c(72, 85, 90, 65, 78, 88, 95, 70, 83, 76)
class_b <- c(60, 55, 74, 68, 80, 58, 63, 71, 66, 59)

wilcox.test(class_a, class_b, alternative = "two.sided")

Uji Mann-Whitney u di R

Uji Mann-Whitney U di R

Statistik W sama dengan statistik U - R hanya memberi label berbeda. Penafsirannya sama seperti di Python: nilai p sebesar 0,0029 berada di bawah 0,05, sehingga ada perbedaan yang signifikan secara statistik antara kedua kelompok.

Anda juga mungkin melihat peringatan tentang ties pada data Anda.

Itu terjadi ketika dua atau lebih nilai identik di kedua kelompok, yang memengaruhi cara peringkat diberikan. R menangani ini untuk Anda, tetapi jika Anda memiliki banyak ties, ada baiknya memeriksa apakah data Anda memenuhi asumsi uji.

Cara Menafsirkan Hasil Uji Mann-Whitney U

Hipotesis nol dari uji Mann-Whitney U adalah bahwa kedua kelompok berasal dari distribusi yang sama - dengan kata lain, tidak ada perbedaan di antara keduanya. Tugas Anda adalah mencari bukti yang menentangnya.

Nilai p adalah caranya:

  • p < 0,05: Anda menolak hipotesis nol. Kedua kelompok terdistribusi berbeda, dan perbedaannya signifikan secara statistik
  • p >= 0,05: Anda tidak memiliki bukti yang cukup untuk menolak hipotesis nol. Itu tidak berarti kelompok-kelompok tersebut identik, hanya saja data tidak menunjukkan perbedaan yang jelas

Ingat saja, uji Mann-Whitney U membandingkan distribusi. Hasil yang signifikan memberi tahu Anda bahwa nilai pada satu kelompok cenderung berperingkat lebih tinggi daripada nilai pada kelompok lain - bukan bahwa rata-ratanya lebih tinggi. Jika Anda ingin menggambarkan arah perbedaan, lihat median setiap kelompok, bukan rata-ratanya.

Uji Mann-Whitney U vs uji t

Kedua uji ini memecahkan masalah yang sama (membandingkan dua kelompok) tetapi melakukannya dengan cara berbeda, dan memilih yang salah akan memengaruhi hasil Anda.

uji t

Uji t membandingkan rata-rata dari dua kelompok. Uji ini dibangun atas asumsi bahwa data Anda mengikuti distribusi normal, dan ketika itu benar, ini adalah uji yang baik.

Masalahnya adalah asumsi tersebut. Jika data Anda miring atau berasal dari sampel kecil di mana kenormalan sulit dikonfirmasi, hasil uji t dapat menjadi tidak andal. Rata-rata ditarik oleh nilai ekstrem, dan nilai p mencerminkan hal itu.

Gunakan uji t ketika:

  • Data Anda berdistribusi normal
  • Anda memiliki ukuran sampel yang cukup besar
  • Anda bekerja dengan data kontinu tanpa kemencengan berat atau pencilan

Uji Mann-Whitney U

Uji Mann-Whitney U membandingkan distribusi alih-alih rata-rata. Uji ini memberi peringkat semua nilai dari kedua kelompok bersama-sama dan memeriksa apakah satu kelompok secara konsisten memiliki peringkat lebih tinggi daripada yang lain. Karena bekerja dengan peringkat, pencilan dan kemencengan tidak mendistorsi hasil dengan cara yang sama.

Saat data Anda benar-benar berdistribusi normal, uji t akan lebih andal dalam mendeteksi perbedaan. Uji Mann-Whitney U lebih fleksibel, tetapi Anda mengorbankan sedikit sensitivitas.

Gunakan uji Mann-Whitney U ketika:

  • Data Anda tidak berdistribusi normal
  • Anda bekerja dengan data ordinal
  • Anda memiliki sampel kecil dan tidak dapat mengonfirmasi kenormalan
  • Ada pencilan dan Anda tidak dapat menghapusnya

Berikut perbandingan singkat keduanya:

uji t dibandingkan dengan uji Mann-Whitney U

uji t dibandingkan dengan uji Mann-Whitney U

Jika ragu, periksa distribusi Anda terlebih dahulu. Jika agak normal, gunakan uji t. Jika tidak, uji Mann-Whitney U adalah pilihan yang lebih aman.

Kesalahan Umum dengan Uji Mann-Whitney U

Sebagian besar kesalahan pada uji ini terjadi karena tidak memahami apa yang sebenarnya dilakukan. Berikut yang paling sering muncul.

Menganggap uji ini membandingkan rata-rata

Ini yang paling umum. Uji Mann-Whitney U membandingkan distribusi, bukan rata-rata. Hasil signifikan memberi tahu Anda bahwa nilai pada satu kelompok cenderung berperingkat lebih tinggi - bukan bahwa rata-ratanya lebih tinggi. Jika Anda perlu menggambarkan perbedaannya, laporkan median, bukan rata-rata.

Mengabaikan perbedaan bentuk distribusi

Jika kedua kelompok memiliki bentuk distribusi berbeda - satu miring ke kanan, yang lain simetris - Anda tidak dapat menafsirkan hasilnya sebagai perbandingan median. Uji tetap berjalan, tetapi keluarannya menunjukkan perbedaan pada distribusi keseluruhan, bukan pergeseran pusat. Periksa distribusi Anda sebelum menarik kesimpulan tentang median.

Salah menafsirkan nilai p

Nilai p di bawah 0,05 berarti perbedaannya signifikan secara statistik. Itu tidak memberi tahu Anda seberapa besar perbedaannya atau apakah itu bermakna dalam praktik. Sampel yang sangat besar dapat menghasilkan nilai p signifikan bahkan ketika perbedaan aktual antarkelompok sangat kecil. Jika ukuran efek penting dalam analisis Anda, hitung secara terpisah.

Menggunakannya untuk data berpasangan

Uji Mann-Whitney U ditujukan untuk dua kelompok independen. Jika data Anda berpasangan - subjek yang sama diukur dua kali, atau pasangan yang dicocokkan - Anda memerlukan uji tanda peringkat Wilcoxon (Wilcoxon signed-rank) sebagai gantinya.

Kapan Anda Tidak Boleh Menggunakan Uji Mann-Whitney U

Uji Mann-Whitney U bukan alat yang tepat untuk setiap situasi. Berikut kapan Anda sebaiknya memilih yang lain.

Data Anda berpasangan

Jika subjek yang sama muncul di kedua kelompok - pengukuran sebelum dan sesudah, atau pasangan yang dicocokkan - kedua sampel tidak independen. Uji Mann-Whitney U mengasumsikan keduanya independen, sehingga menggunakannya di sini mengabaikan hubungan antarobservasi dan memberikan hasil yang tidak andal. Gunakan uji tanda peringkat Wilcoxon sebagai gantinya.

Anda memiliki lebih dari dua kelompok

Uji Mann-Whitney U hanya membandingkan dua kelompok sekaligus. Jika Anda membandingkan tiga atau lebih kelompok, gunakan uji Kruskal-Wallis, yang merupakan padanan nonparametrik dari ANOVA satu arah dan dapat menangani banyak kelompok.

Anda memiliki sampel besar dengan data normal

Keunggulan utama uji Mann-Whitney U adalah tidak berasumsi kenormalan. Jika data Anda berdistribusi normal dan sampel cukup besar untuk mengonfirmasinya, uji t adalah pilihan yang lebih baik. Uji t memiliki daya statistik lebih besar dalam situasi tersebut, yang berarti lebih mungkin mendeteksi perbedaan nyata ketika memang ada.

Kesimpulan

Uji Mann-Whitney U adalah solusi yang sangat baik ketika data Anda tidak berdistribusi normal, sehingga uji t kurang cocok.

Uji ini bekerja dengan peringkat alih-alih nilai mentah, sehingga menghindari asumsi yang membuat uji parametrik tidak andal pada data yang miring atau bersampel kecil. Itu menjadikannya uji yang baik untuk analisis dunia nyata, di mana data jarang berperilaku seperti yang Anda inginkan.

Pelajaran besarnya di sini adalah pemilihan uji. Tidak ada satu uji pun yang cocok untuk setiap dataset. Anda harus selalu memeriksa data terlebih dahulu - distribusi, struktur, dan ukuran sampelnya - dan biarkan karakteristik tersebut memandu pilihan Anda. Yang tepat adalah yang sesuai dengan data Anda.

Jika Anda baru dalam statistik atau ingin mendalami topiknya, jalur Statistician in R kami akan membantu Anda siap kerja hanya dengan 52 jam materi.


Dario Radečić's photo
Author
Dario Radečić
LinkedIn
Senior Data Scientist yang berbasis di Kroasia. Penulis Tekno Teratas dengan lebih dari 700 artikel yang telah diterbitkan, menghasilkan lebih dari 10 juta tayangan. Penulis buku Machine Learning Automation with TPOT.

FAQ

Untuk apa uji Mann-Whitney U digunakan?

Uji Mann-Whitney U digunakan untuk membandingkan dua kelompok independen ketika Anda tidak dapat berasumsi data mengikuti distribusi normal. Uji ini memberi peringkat semua nilai dari kedua kelompok secara bersama dan memeriksa apakah satu kelompok secara konsisten memiliki peringkat lebih tinggi daripada yang lain. Uji ini bekerja untuk data ordinal maupun kontinu.

Apa perbedaan uji Mann-Whitney U dengan uji t?

Uji t membandingkan rata-rata dua kelompok dan berasumsi distribusi normal. Uji Mann-Whitney U membandingkan distribusi menggunakan peringkat, sehingga tidak membuat asumsi tersebut. Ketika data Anda miring atau berasal dari sampel kecil, uji Mann-Whitney U adalah pilihan yang lebih aman.

Kapan saya harus menggunakan uji Mann-Whitney U?

Gunakan ketika Anda memiliki dua kelompok independen, data Anda bersifat ordinal atau kontinu, dan Anda tidak dapat mengonfirmasi kenormalan. Ini juga cocok ketika ukuran sampel kecil dan terdapat pencilan. Jika data Anda berdistribusi normal dan sampel besar, uji t umumnya akan memberikan hasil yang lebih baik.

Apa yang diberitahukan nilai p dalam uji Mann-Whitney U?

Nilai p di bawah 0,05 berarti ada perbedaan yang signifikan secara statistik antara distribusi kedua kelompok. Itu tidak memberi tahu Anda seberapa besar perbedaannya atau apakah itu bermakna dalam praktik. Untuk itu, Anda perlu menghitung ukuran efek secara terpisah dan melihat median masing-masing kelompok.

Bisakah saya menggunakan uji Mann-Whitney U untuk data berpasangan?

Tidak. Uji Mann-Whitney U berasumsi kedua kelompok independen, artinya nilai satu kelompok tidak memengaruhi yang lain. Jika data Anda berpasangan - pikirkan pengukuran sebelum dan sesudah pada subjek yang sama - gunakan uji tanda peringkat Wilcoxon sebagai gantinya. Menggunakan uji Mann-Whitney U pada data berpasangan mengabaikan hubungan antarobservasi dan menghasilkan hasil yang tidak andal.

Topik

Belajar dengan DataCamp

Program

Analis Data di R

36 Hr
Dari analisis data eksploratori dengan dplyr hingga visualisasi data dengan ggplot2—dapatkan keterampilan R yang Anda butuhkan untuk membangun karier sebagai analis data!
Lihat DetailRight Arrow
Mulai Kursus
Lihat Lebih BanyakRight Arrow
Terkait

blogs

Tutorial Korelasi di R

Dapatkan pengenalan dasar-dasar korelasi di R: pelajari lebih lanjut tentang koefisien korelasi, matriks korelasi, plotting korelasi, dan sebagainya.
David Woods's photo

David Woods

13 mnt

blogs

Spaghetti Plot dan Jalur Badai

Temukan alasan mengapa Anda sebaiknya (tidak) menggunakan spaghetti plot untuk menyampaikan ketidakpastian jalur prediksi badai serta dampaknya terhadap interpretasi.
Hugo Bowne-Anderson's photo

Hugo Bowne-Anderson

13 mnt

blogs

40 Pertanyaan Wawancara DBMS Teratas di 2026

Kuasai pertanyaan wawancara basis data, dari konsep SQL dasar hingga skenario desain sistem tingkat lanjut. Panduan mendalam ini mencakup semua yang Anda perlukan untuk sukses di wawancara DBMS dan meraih peran berikutnya.
Dario Radečić's photo

Dario Radečić

15 mnt

blogs

12 Alternatif ChatGPT Terbaik yang Bisa Anda Coba pada 2026

Artikel ini menyajikan daftar alternatif ChatGPT yang akan meningkatkan produktivitas Anda.
Javier Canales Luna's photo

Javier Canales Luna

14 mnt

Lihat Lebih BanyakLihat Lebih Banyak