Program
Hiç bir t-testi çalıştırıp garip bir p-değeri elde ettiniz ve sonra verilerinizin normal dağılıma uzaktan yakından uymadığını mı fark ettiniz?
Bu, bir noktada herkesin başına gelmiştir. t-testinin sorunu, verilerinizin normal dağılımı takip ettiğini varsaymasıdır. Bu koşul sağlanmadığında sonuçlar yanıltıcı olabilir. Çarpık veriler ve küçük örneklemler normal dağılım varsayımını ihlal eder. Üstelik gerçek dünya verileri, ders kitaplarının söylediği gibi davranmayı pek sevmez.
Mann-Whitney U testi bu sorunu çözmek için burada. Ortalama yerine sıralamalara dayanan, t-testine parametrik olmayan bir alternatiftir; bu nedenle dağılımınızın şekliyle ilgilenmez.
Bu yazıda Mann-Whitney U testinin ne olduğunu, ne zaman kullanılacağını, matematiğinin nasıl çalıştığını ve hem Python hem de R ile nasıl uygulanıp yorumlanacağını ele alacağım.
Peki t-testi tam olarak nedir? Bu soruyu soruyorsanız, Python T-Testlerine Giriş blog yazımızı okuyun – tüm sorularınızı yanıtlayacaktır.
Mann-Whitney U Testi Nedir?
Mann-Whitney U testi, iki bağımsız grubu karşılaştırmak için kullanılan parametrik olmayan bir istatistiksel testtir.
t-testinden farklı olarak, verilerinizin normal dağıldığını varsaymaz. Ham değerleri sıralamalara dönüştürüp bunları analiz ederek iki grubun dağılımlarını karşılaştırır. Bu da, verileriniz çarpıksa, aykırı değerler içeriyorsa veya başka bir şekilde normallik şartını karşılamıyorsa iyi bir seçenek olmasını sağlar.
Ayrıca Wilcoxon sıralama-toplam testi olarak da adlandırıldığını göreceksiniz. Pratikte bu iki isim eşanlamlıdır.
Mann-Whitney U Testi Ne Zaman Kullanılır
Mann-Whitney U testinin belirli koşulları vardır. Aşağıdakilerin tamamı sağlandığında kullanmalısınız:
- İki bağımsız grup: Örneklemler örtüşmez ve bir grubun değerleri diğerini etkilemez
- Sıralı veya sürekli veri: Test puanları, tepki süreleri veya herhangi bir ölçülen değer gibi düşünün
- Normal olmayan dağılım: Verileriniz çarpık, kuyrukları ağır ya da küçük örneklem nedeniyle normalliği doğrulayamıyorsunuz
- Küçük örneklem büyüklükleri: Merkezi limit teoremine güvenmek için yeterli veri olmadığında
Bir örnek üzerinden gidelim.
Diyelim ki farklı yöntemlerle öğretilen iki sınıfınız var ve hangisinin daha iyi sınav sonuçları verdiğini bilmek istiyorsunuz. Puanları çizdiniz ve normal dağılmadıklarını gördünüz – bir sınıfta dağılımı sağa çeken birkaç aykırı değer var. t-testi grup ortalamalarını karşılaştırır, dolayısıyla bu aykırı değerler ortalamayı yukarı çeker ve bir sınıfı gerçekte olduğundan daha iyi gösterir.
Bu çarpık ortalama t-testinin hesaplamasına girer ve elde ettiğiniz p-değeri gruplar arasındaki farkı yansıtmaz. Mann-Whitney U testi bu sorunu göstermez, çünkü ham puanlar yerine sıralamalarla çalışır. Tek bir aykırı değer en fazla en yüksek sırayı alabilir, bu yüzden ortalamada olduğu gibi sonucu çarpıtamaz.
Ayrıca 1-5 ölçeğindeki anket yanıtları gibi sıralı verilerle çalışırken de başvurulur. Bu değerler gerçekten sürekli değildir, bu nedenle ortalama hesaplamak pek anlamlı olmaz.
Mann-Whitney U Testi Formülü
Test, her grup için birer tane olmak üzere iki U istatistiği üretir. Formül şöyledir:

Mann-Whitney U test formülü
Burada:
-
n1ven2sırasıyla 1. ve 2. grubun örneklem büyüklükleridir -
R1veR2her bir grup için sıralama toplamlarıdır – her grubun gözlemlerine atanan sıralamaların toplamı
Sıralama toplamı, her iki gruptaki tüm değerleri birleştirip en küçüğünden en büyüğüne sıralayarak ve her değere bir sıra atayarak hesaplanır. En küçük değer 1. sırayı alır, sonraki 2. sırayı alır ve bu şekilde devam eder. Ardından her gruba ait sıralamaları ayrı ayrı toplayabilirsiniz.
Test istatistiği, U1 ve U2 değerlerinden daha küçük olanıdır. Daha sonra bunu bir kritik değerle karşılaştırırsınız veya bir p-değeri hesaplamak için kullanırsınız.
İyi haber şu ki bunu elle hesaplamanız gerekmiyor. Hem Python hem de R bunu sizin için yapıyor – birazdan göstereceğim.
Mann-Whitney U Testinin Varsayımları
Mann-Whitney U testi t-testinden daha esnektir, ancak yine de uymanız gereken üç varsayımı vardır:
- Bağımsız örneklemler: İki grup birbirini etkilemez. Bir gruptaki gözlemlerin, diğer gruptaki gözlemlerle ilişkisi yoktur
- Sıralı veya sürekli veri: Verilerinizin doğal bir sırası olmalı – bir değerin diğerinden daha yüksek veya düşük olduğunu söyleyebilmelisiniz
- Benzer dağılım şekilleri: Sonuçları medyanların karşılaştırması olarak yorumlamak istiyorsanız her iki grubun dağılımlarının kabaca aynı şekle sahip olması gerekir. Şekiller farklıysa test yine çalışır, ancak medyanlar yerine ortalama sıralamaları karşılaştırırsınız
Üçüncü varsayım insanları en çok şaşırtır.
Mann-Whitney U testi sıklıkla medyanlar için bir test olarak tanımlanır, ancak bu yalnızca iki dağılım benzer şekle sahip olduğunda doğrudur. Değilse, sonuç daha genel bir şeyi söyler – bir gruptaki değerlerin diğer gruptakilerden daha yüksek olma eğiliminde olup olmadığını.
Python ile Mann-Whitney U Testi
Python'ın scipy.stats modülünde Mann-Whitney U testi için bir fonksiyon vardır. İşte iki sınıfın sınav puanlarını kullanan basit bir örnek.
from scipy.stats import mannwhitneyu
class_a = [72, 85, 90, 65, 78, 88, 95, 70, 83, 76]
class_b = [60, 55, 74, 68, 80, 58, 63, 71, 66, 59]
stat, p_value = mannwhitneyu(class_a, class_b, alternative="two-sided")
print(f"U statistic: {stat}")
print(f"P-value: {p_value:.4f}")

Python'da Mann-Whitney U testi
The alternative="two-sided" argümanı, iki grubun her iki yönde de farklı olup olmadığını kontrol ettiğinizi belirtir. Baştan bir grubun diğerinden daha yüksek puan alacağını varsaymıyorsunuz. Yönlü bir hipoteziniz olsaydı bunun yerine "less" veya "greater" kullanırdınız.
Buradaki p-değeri 0,0046’dır ve standart 0,05 eşiğinin altındadır. Bu da, iki sınıfın puan dağılımları arasında istatistiksel olarak anlamlı bir fark olduğundan, sıfır hipotezini reddedebileceğiniz anlamına gelir.
U istatistiği tek başına bağlam olmadan çok şey söylemez. Farkın istatistiksel olarak anlamlı olup olmadığına karar vermek için p-değerine odaklanabilir ve farkın yönünü anlamak için ham verilere veya medyanlara bakabilirsiniz.
R ile Mann-Whitney U Testi
R, Mann-Whitney U testini wilcox.test() fonksiyonu ile çalıştırır. Aynı sınav puanı örneğini kullanacağım.
class_a <- c(72, 85, 90, 65, 78, 88, 95, 70, 83, 76)
class_b <- c(60, 55, 74, 68, 80, 58, 63, 71, 66, 59)
wilcox.test(class_a, class_b, alternative = "two.sided")

R'da Mann-Whitney U testi
Buradaki W istatistiği U istatistiği ile aynıdır – R sadece farklı etiketler. Yorumlama Python ile aynıdır: 0,0029’luk bir p-değeri 0,05’in altındadır, dolayısıyla iki grup arasında istatistiksel olarak anlamlı bir fark vardır.
Verilerinizde bağlar (tie) olduğuna dair bir uyarı da görebilirsiniz.
Bu, her iki grupta da özdeş iki veya daha fazla değer olduğunda ortaya çıkar ve sıralamaların nasıl atandığını etkiler. R bunu sizin için ele alır, ancak çok sayıda bağ varsa verilerinizin test varsayımlarını karşılayıp karşılamadığını kontrol etmeye değer.
Mann-Whitney U Testi Sonuçları Nasıl Yorumlanır
Mann-Whitney U testinin sıfır hipotezi, iki grubun aynı dağılımdan geldiğidir – başka bir deyişle aralarında fark olmadığıdır. Sizin göreviniz buna karşı kanıt bulmaktır.
Bunu p-değeri ile yaparsınız:
- p < 0,05: Sıfır hipotezini reddedersiniz. İki grup farklı şekilde dağılmıştır ve fark istatistiksel olarak anlamlıdır
- p >= 0,05: Sıfır hipotezini reddetmek için yeterli kanıtınız yok. Bu, grupların özdeş olduğu anlamına gelmez; sadece verilerin belirgin bir fark göstermediği anlamına gelir
Mann-Whitney U testinin dağılımları karşılaştırdığını unutmayın. Anlamlı bir sonuç, bir gruptaki değerlerin diğer gruptakilerden daha yüksek sıralanma eğiliminde olduğunu söyler – ortalamanın daha yüksek olduğunu değil. Farkın yönünü betimlemek istiyorsanız, ortalamalara değil her grubun medyanına bakın.
Mann-Whitney U Testi vs t-Testi
Bu iki test aynı problemi (iki grubu karşılaştırma) çözer, ancak bunu farklı yollarla yaparlar ve yanlış olanı seçmek sonuçlarınızı etkiler.
t-testi
t-testi iki grubun ortalamalarını karşılaştırır. Verilerinizin normal dağıldığı varsayımına dayanır ve bu doğru olduğunda iyi bir testtir.
Sorun bu varsayımdır. Verileriniz çarpıksa veya normalliğin doğrulanmasının zor olduğu küçük bir örneklemden geliyorsa, t-testinin sonuçları güvenilirliğini yitirebilir. Ortalama, aşırı değerler tarafından çekilir ve p-değeri bunu yansıtır.
t-testini şu durumlarda kullanın:
- Verileriniz normal dağılmışsa
- Yeterince büyük bir örnekleme sahipseniz
- Ağır çarpıklık veya aykırı değerler olmadan sürekli verilerle çalışıyorsanız
Mann-Whitney U testi
Mann-Whitney U testi ortalamalar yerine dağılımları karşılaştırır. Her iki grubun tüm değerlerini birlikte sıralar ve bir grubun sürekli olarak diğerinden daha yüksek sıralanıp sıralanmadığını kontrol eder. Sıralamalarla çalıştığı için aykırı değerler ve çarpıklık sonucu aynı şekilde bozmaz.
Verileriniz gerçekten normal dağılmışsa t-testi farkları daha güvenilir biçimde saptar. Mann-Whitney U testi daha esnektir, ancak biraz duyarlılıktan vazgeçersiniz.
Mann-Whitney U testini şu durumlarda kullanın:
- Verileriniz normal dağılmıyorsa
- Sıralı verilerle çalışıyorsanız
- Küçük bir örnekleme sahipseniz ve normalliği doğrulayamıyorsanız
- Aykırı değerler varsa ve bunları çıkaramıyorsanız
İkisine ilişkin hızlı bir karşılaştırma:

t-testi ile Mann-Whitney U testinin karşılaştırması
Emin değilseniz önce dağılımınızı kontrol edin. Biraz da olsa normal ise t-testini tercih edin. Değilse Mann-Whitney U testi daha güvenli bir seçimdir.
Mann-Whitney U Testinde Yaygın Hatalar
Bu testle ilgili hataların çoğu, gerçekte ne yaptığını anlamamaktan kaynaklanır. En sık görülenler şunlardır.
Ortalamaları karşılaştırdığını varsaymak
En yaygını budur. Mann-Whitney U testi ortalamaları değil, dağılımları karşılaştırır. Anlamlı bir sonuç, bir gruptaki değerlerin daha yüksek sıralanma eğiliminde olduğunu söyler – ortalamanın daha yüksek olduğunu değil. Farkı betimlemeniz gerekiyorsa medyanları raporlayın, ortalamaları değil.
Dağılım şekli farklarını göz ardı etmek
İki grubun dağılım şekilleri farklıysa – biri sağa çarpık, diğeri simetrik – sonucu medyanların karşılaştırması olarak yorumlayamazsınız. Test yine çalışır, ancak çıktı merkezdeki bir kaymadan ziyade genel dağılımlardaki farkı gösterir. Medyanlar hakkında sonuç çıkarmadan önce dağılımlarınızı kontrol edin.
p-değerlerini yanlış yorumlamak
0,05’in altındaki bir p-değeri farkın istatistiksel olarak anlamlı olduğunu gösterir. Farkın ne kadar büyük olduğunu ya da pratikte anlamlı olup olmadığını söylemez. Çok büyük bir örneklem, gruplar arasındaki gerçek fark çok küçük olsa bile anlamlı bir p-değeri üretebilir. Analizinizde etki büyüklüğü önemliyse, bunu ayrıca hesaplayın.
Eşleştirilmiş veriler için kullanmak
Mann-Whitney U testi iki bağımsız grup içindir. Verileriniz eşleştirilmişse – aynı deneklerin iki kez ölçülmesi veya eşleştirilmiş çiftler – bunun yerine Wilcoxon işaretli-sıralar testine ihtiyacınız var.
Mann-Whitney U Testini Ne Zaman Kullanmamalısınız
Mann-Whitney U testi her durum için doğru araç değildir. Şu durumlarda başka bir yöntemi tercih edin.
Verileriniz eşleştirilmiş
Aynı denekler her iki grupta da yer alıyorsa – önce/sonra ölçümleri veya eşleştirilmiş çiftler – iki örneklem bağımsız değildir. Mann-Whitney U testi bağımsızlık varsayar; burada kullanmak gözlemler arası ilişkiyi yok sayar ve güvenilmez sonuçlar verir. Bunun yerine Wilcoxon işaretli-sıralar testini kullanın.
İkiden fazla grubunuz var
Mann-Whitney U testi yalnızca iki grubu karşılaştırır. Üç veya daha fazla grubu karşılaştırıyorsanız, tek yönlü ANOVA’nın parametrik olmayan eşdeğeri olan ve birden fazla grubu ele alabilen Kruskal-Wallis testini kullanın.
Normal verili büyük bir örnekleme sahipsiniz
Mann-Whitney U testinin temel avantajı normalliği varsaymamasıdır. Verileriniz normal dağılmışsa ve örnekleminiz bunu doğrulayacak kadar büyükse, t-testi daha iyi bir seçimdir. Bu durumda daha yüksek istatistiksel güce sahiptir; yani gerçek bir fark olduğunda bunu saptama olasılığı daha yüksektir.
Sonuç
Mann-Whitney U testi, verileriniz normal dağılmadığında ve t-testinin uygun olmadığı durumlarda harika bir çözümdür.
Ham değerler yerine sıralamalarla çalıştığı için, parametrik testleri çarpık ya da küçük örneklemli verilerde güvenilmez kılan varsayımlardan kaçınır. Bu da, verilerin nadiren istediğiniz gibi davrandığı gerçek dünya analizleri için iyi bir test olmasını sağlar.
Buradaki daha büyük ders test seçimidir. Tek bir test her veri kümesinde işe yaramaz. Her zaman önce verilerinizi – dağılımını, yapısını ve örneklem büyüklüğünü – kontrol edin ve bu özelliklerin seçiminizi yönlendirmesine izin verin. Doğru test, verinize uyan testtir.
İstatistiğe yeni başladıysanız ya da konuyu derinlemesine öğrenmek istiyorsanız, R ile İstatistikçi programımız yalnızca 52 saatlik içerikle sizi işe hazır hale getirecek.
SSS
Mann-Whitney U testi ne için kullanılır?
Mann-Whitney U testi, verilerin normal dağılıma uyduğunu varsayamadığınız durumlarda iki bağımsız grubu karşılaştırmak için kullanılır. Her iki grubun tüm değerlerini birlikte sıralar ve bir grubun diğerinden sürekli olarak daha yüksek sıralanıp sıralanmadığını kontrol eder. Hem sıralı hem de sürekli verilerle çalışır.
Mann-Whitney U testi t-testinden nasıl farklıdır?
t-testi iki grubun ortalamalarını karşılaştırır ve normal dağılım varsayar. Mann-Whitney U testi ise sıralamaları kullanarak dağılımları karşılaştırır, bu nedenle bu varsayımı yapmaz. Verileriniz çarpıksa veya küçük bir örneklemden geliyorsa Mann-Whitney U testi daha güvenli bir seçimdir.
Mann-Whitney U testini ne zaman kullanmalıyım?
İki bağımsız grubunuz olduğunda, verileriniz sıralı veya süreklidir ve normalliği doğrulayamadığınızda kullanın. Ayrıca örneklem boyutunuz küçük ve aykırı değerler varsa da uygundur. Verileriniz normal dağılmışsa ve örnekleminiz büyükse, genellikle t-testi daha iyi sonuç verir.
Mann-Whitney U testinde p-değeri size ne söyler?
0,05’in altındaki bir p-değeri, iki grubun dağılımları arasında istatistiksel olarak anlamlı bir fark olduğunu gösterir. Farkın ne kadar büyük olduğunu veya pratikte anlamlı olup olmadığını söylemez. Bunun için etki büyüklüğünü ayrıca hesaplamalı ve grupların medyanlarına bakmalısınız.
Mann-Whitney U testini eşleştirilmiş veriler için kullanabilir miyim?
Hayır. Mann-Whitney U testi iki grubun bağımsız olduğunu varsayar; yani bir grubun değerleri diğerini etkilemez. Verileriniz eşleştirilmişse – aynı deneklerde önce/sonra ölçümleri gibi – bunun yerine Wilcoxon işaretli-sıralar testini kullanın. Mann-Whitney U testini eşleştirilmiş verilerde kullanmak, gözlemler arasındaki ilişkiyi yok sayar ve güvenilmez sonuçlar üretir.

