मुख्य सामग्री पर जाएं

Mann-Whitney U परीक्षण: t-परीक्षण का नॉन-पैरामीट्रिक विकल्प

Mann-Whitney U परीक्षण दो स्वतंत्र समूहों की तुलना के लिए रैंक-आधारित नॉन-पैरामीट्रिक परीक्षण है, जब डेटा t-परीक्षण के लिए आवश्यक सामान्यता धारणा को पूरा नहीं करता।
अद्यतन 4 मई 2026  · 10 मि॰ पढ़ना

क्या आपने कभी t-परीक्षण चलाया, अजीब p-मूल्य मिला, और बाद में पता चला कि आपका डेटा सामान्य वितरण के पास भी नहीं था?

ऐसा कभी-न-कभी सभी के साथ हुआ है। t-परीक्षण की समस्या यह है कि यह मान लेता है कि आपका डेटा सामान्य वितरण का पालन करता है। जब ऐसा नहीं होता, तो परिणाम भ्रामक हो सकते हैं। टेढ़ा (skewed) डेटा और छोटे सैंपल आकार सामान्यता की उस धारणा का उल्लंघन करते हैं। और वास्तविक दुनिया का डेटा शायद ही कभी वैसे व्यवहार करता है जैसा पाठ्यपुस्तकें बताती हैं।

Mann-Whitney U परीक्षण इस समस्या को सुलझाने आता है। यह t-परीक्षण का एक नॉन-पैरामीट्रिक विकल्प है जो माध्य (means) के बजाय रैंकों के आधार पर दो समूहों की तुलना करता है, इसलिए इसे आपके वितरण के आकार की परवाह नहीं होती।

इस लेख में, मैं बताऊंगा कि Mann-Whitney U परीक्षण क्या है, इसे कब उपयोग करना चाहिए, इसका गणित कैसे काम करता है, और Python तथा R में इसे चलाकर परिणामों की व्याख्या कैसे करें।

पर t-परीक्षण है क्या? यदि आपके मन में यह प्रश्न है, तो हमारा Introduction to Python T-Tests ब्लॉग पोस्ट पढ़ें - यह आपके सभी प्रश्नों का उत्तर देगा।

Mann-Whitney U परीक्षण क्या है?

Mann-Whitney U परीक्षण दो स्वतंत्र समूहों की तुलना के लिए उपयोग किया जाने वाला एक नॉन-पैरामीट्रिक सांख्यिकीय परीक्षण है।

t-परीक्षण के विपरीत, यह यह नहीं मानता कि आपका डेटा सामान्य वितरण का पालन करता है। यह कच्चे मानों को रैंकों में बदलकर और उनका विश्लेषण करके दो समूहों के वितरणों की तुलना करता है। यह तब एक अच्छा विकल्प बन जाता है जब आपका डेटा टेढ़ा हो, उसमें आउट्लायर हों, या किसी भी अन्य तरीके से सामान्यता की शर्त पूरी न करता हो।

आप इसे Wilcoxon रैंक-सम परीक्षण के नाम से भी देखेंगे। व्यावहारिक रूप से ये समानार्थी हैं।

Mann-Whitney U परीक्षण कब उपयोग करें

Mann-Whitney U परीक्षण के लिए कुछ विशिष्ट शर्तें होती हैं। इसे तभी उपयोग करें जब ये सभी लागू हों:

  • दो स्वतंत्र समूह: नमूने ओवरलैप न करें, और एक समूह के मान दूसरे पर प्रभाव न डालें
  • क्रमिक (ordinal) या सतत (continuous) डेटा: जैसे टेस्ट स्कोर, प्रतिक्रिया समय, या कोई भी मापा गया मान
  • गैर-सामान्य वितरण: आपका डेटा टेढ़ा है, भारी टेल्स हैं, या छोटे सैंपल के कारण सामान्यता की पुष्टि नहीं कर सकते
  • छोटे सैंपल आकार: जब आपके पास केंद्रीय सीमा प्रमेय पर भरोसा करने लायक डेटा नहीं है

आइए एक उदाहरण देखते हैं।

मान लीजिए आपके पास दो कक्षाएं हैं जिन्हें अलग-अलग तरीकों से पढ़ाया गया, और आप जानना चाहते हैं कि किसमें परीक्षा परिणाम बेहतर रहे। आप स्कोर प्लॉट करते हैं और दिखता है कि वे सामान्य रूप से वितरित नहीं हैं—एक कक्षा में कुछ आउट्लायर वितरण को दाहिने खींच रहे हैं। t-परीक्षण समूह माध्यों की तुलना करता है, इसलिए वे आउट्लायर माध्य को ऊपर खींचते हैं और कक्षा को वास्तविकता से बेहतर दिखाते हैं।

वह टेढ़ा माध्य t-परीक्षण की गणना में चला जाता है, और जो p-मूल्य लौटता है, वह समूहों के बीच के अंतर को परिलक्षित नहीं करता। Mann-Whitney U परीक्षण यह समस्या नहीं दिखाता क्योंकि यह कच्चे स्कोर के बजाय रैंकों के साथ काम करता है। कोई भी एक आउट्लायर अधिकतम उच्चतम रैंक ही ले सकता है, इसलिए वह परिणाम को वैसे नहीं बिगाड़ सकता जैसे माध्य को करता है।

यह क्रमिक डेटा के साथ काम करते समय भी एक पसंदीदा विकल्प है, जैसे 1-5 स्केल पर सर्वे प्रतिक्रियाएँ। वे मान वास्तव में सतत नहीं होते, इसलिए माध्य निकालना विशेष अर्थ नहीं रखता।

Mann-Whitney U परीक्षण का सूत्र

यह परीक्षण प्रत्येक समूह के लिए दो U सांख्यिकी देता है। सूत्र यह है:

Mann-Whitney u test formula

Mann-Whitney U परीक्षण का सूत्र

जहाँ:

  • n1 और n2 क्रमशः समूह 1 और समूह 2 के सैंपल आकार हैं

  • R1 और R2 प्रत्येक समूह के रैंक सम (rank sums) हैं—प्रत्येक समूह के प्रेक्षणों को दी गई रैंकों का योग

रैंक सम निकालने के लिए दोनों समूहों के सभी मानों को मिलाया जाता है, उन्हें न्यूनतम से अधिकतम तक क्रमबद्ध किया जाता है, और प्रत्येक मान को एक रैंक दी जाती है। सबसे छोटा मान रैंक 1 लेता है, अगला रैंक 2, और इसी तरह। फिर आप अलग-अलग प्रत्येक समूह से संबंधित रैंकों का योग करते हैं।

परीक्षण सांख्यिकी U1 और U2 में से छोटी होती है। फिर आप इसे एक क्रिटिकल मान से तुलना करते हैं या p-मूल्य निकालने के लिए उपयोग करते हैं।

अच्छी खबर यह है कि आपको यह हाथ से नहीं निकालना पड़ता। Python और R दोनों आपके लिए यह कर देते हैं, जिसे मैं अभी दिखाऊंगा।

Mann-Whitney U परीक्षण की धारणाएँ

Mann-Whitney U परीक्षण t-परीक्षण से अधिक लचीला है, लेकिन फिर भी इसकी तीन धारणाएँ हैं जिनका पालन करना आवश्यक है:

  • स्वतंत्र नमूने: दोनों समूह एक-दूसरे को प्रभावित नहीं करते। एक समूह के प्रेक्षणों का दूसरे समूह के प्रेक्षणों से कोई संबंध नहीं होता
  • क्रमिक या सतत डेटा: आपके डेटा में स्वाभाविक क्रम होना चाहिए—आप कह सकें कि एक मान दूसरे से अधिक या कम है
  • वितरण आकार समान हों: यदि आप परिणाम को मध्यकों (medians) की तुलना के रूप में व्याख्यायित करना चाहते हैं, तो दोनों समूहों के वितरणों का आकार लगभग समान होना चाहिए। यदि आकार अलग हैं, तो परीक्षण काम करता है, पर आप मध्यकों के बजाय औसत रैंकों की तुलना कर रहे होते हैं

तीसरी धारणा अधिकतर लोगों को उलझाती है।

Mann-Whitney U परीक्षण को अक्सर मध्यकों के परीक्षण के रूप में बताया जाता है, लेकिन यह तभी सत्य है जब दोनों वितरणों के आकार समान हों। यदि वे समान नहीं हैं, तो परिणाम कुछ अधिक सामान्य बात बताता है—क्या एक समूह के मान दूसरे समूह के मानों से ऊँचे रहने की प्रवृत्ति रखते हैं।

Python में Mann-Whitney U परीक्षण

Python के scipy.stats मॉड्यूल में Mann-Whitney U परीक्षण के लिए एक फ़ंक्शन है। यहाँ दो कक्षाओं के परीक्षा स्कोर का एक सरल उदाहरण है।

from scipy.stats import mannwhitneyu

class_a = [72, 85, 90, 65, 78, 88, 95, 70, 83, 76]
class_b = [60, 55, 74, 68, 80, 58, 63, 71, 66, 59]

stat, p_value = mannwhitneyu(class_a, class_b, alternative="two-sided")

print(f"U statistic: {stat}")
print(f"P-value: {p_value:.4f}")

Mann-Whitney u test in Python

Python में Mann-Whitney U परीक्षण

आर्ग्युमेंट alternative="two-sided" परीक्षण को बताता है कि आप देख रहे हैं कि क्या दोनों समूह किसी भी दिशा में भिन्न हैं। आप पहले से यह नहीं मान रहे कि एक समूह दूसरे से अधिक स्कोर करेगा। यदि आपके पास दिशात्मक परिकल्पना होती, तो आप "less" या "greater" का उपयोग करते।

यहाँ p-मूल्य 0.0046 है, जो 0.05 की मानक सीमा से कम है। इसका अर्थ है कि आप शून्य परिकल्पना को अस्वीकार कर सकते हैं, क्योंकि दोनों कक्षाओं के स्कोर वितरणों में सांख्यिकीय रूप से महत्वपूर्ण अंतर है।

U सांख्यिकी अपने आप में संदर्भ के बिना बहुत कुछ नहीं बताता। आप p-मूल्य पर ध्यान केंद्रित कर सकते हैं यह तय करने के लिए कि अंतर सांख्यिकीय रूप से महत्वपूर्ण है या नहीं, और उस अंतर की दिशा समझने के लिए कच्चे डेटा या मध्यकों को देखें।

R में Mann-Whitney U परीक्षण

R में Mann-Whitney U परीक्षण wilcox.test() फ़ंक्शन से चलता है। मैं पहले वाले परीक्षा स्कोर उदाहरण का ही उपयोग करूँगा।

class_a <- c(72, 85, 90, 65, 78, 88, 95, 70, 83, 76)
class_b <- c(60, 55, 74, 68, 80, 58, 63, 71, 66, 59)

wilcox.test(class_a, class_b, alternative = "two.sided")

Mann-Whitney u test in R

R में Mann-Whitney U परीक्षण

यहाँ W सांख्यिकी U सांख्यिकी के समान ही है—R बस लेबल अलग देता है। व्याख्या Python जैसी ही है: 0.0029 का p-मूल्य 0.05 से कम है, इसलिए दोनों समूहों के बीच सांख्यिकीय रूप से महत्वपूर्ण अंतर है।

आप अपने डेटा में टाईज़ के बारे में एक चेतावनी भी देख सकते हैं।

यह तब होता है जब दोनों समूहों में दो या अधिक मान समान होते हैं, जो रैंकों के आवंटन को प्रभावित करता है। R यह आपके लिए संभाल लेता है, लेकिन यदि बहुत अधिक टाईज़ हैं, तो यह जाँचना उचित है कि आपका डेटा परीक्षण की धारणाओं को पूरा करता है या नहीं।

Mann-Whitney U परीक्षण के परिणामों की व्याख्या कैसे करें

Mann-Whitney U परीक्षण की शून्य परिकल्पना यह है कि दोनों समूह एक ही वितरण से आते हैं—दूसरे शब्दों में, उनके बीच कोई अंतर नहीं है। आपका कार्य इसके खिलाफ साक्ष्य ढूँढना है।

आप यह p-मूल्य से करते हैं:

  • p < 0.05: आप शून्य परिकल्पना अस्वीकार करते हैं। दोनों समूहों का वितरण अलग है, और अंतर सांख्यिकीय रूप से महत्वपूर्ण है
  • p >= 0.05: आपके पास शून्य परिकल्पना अस्वीकार करने के लिए पर्याप्त साक्ष्य नहीं हैं। इसका अर्थ यह नहीं कि समूह समान हैं, बस इतना कि डेटा स्पष्ट अंतर नहीं दिखाता

ध्यान रखें कि Mann-Whitney U परीक्षण वितरणों की तुलना करता है। एक महत्वपूर्ण परिणाम बताता है कि एक समूह के मान दूसरे समूह के मानों की तुलना में ऊँची रैंक लेने की प्रवृत्ति रखते हैं—यह नहीं कि औसत अधिक है। यदि आप अंतर की दिशा बताना चाहते हैं, तो समूहों के मध्यकों को देखें, माध्यों को नहीं।

Mann-Whitney U परीक्षण बनाम t-परीक्षण

ये दोनों परीक्षण एक ही समस्या (दो समूहों की तुलना) हल करते हैं, लेकिन अलग तरीके से, और गलत परीक्षण चुनना आपके परिणामों को प्रभावित करेगा।

t-परीक्षण

t-परीक्षण दो समूहों के माध्यों की तुलना करता है। यह इस धारणा पर बना है कि आपका डेटा सामान्य वितरण का पालन करता है, और जब यह सत्य है, यह अच्छा परीक्षण है।

समस्या उस धारणा में है। यदि आपका डेटा टेढ़ा है या छोटा नमूना है जहाँ सामान्यता की पुष्टि कठिन है, तो t-परीक्षण के परिणाम अविश्वसनीय हो सकते हैं। माध्य चरम मानों से खिंच जाता है, और p-मूल्य यह दिखाता है।

t-परीक्षण का उपयोग करें जब:

  • आपका डेटा सामान्य रूप से वितरित हो
  • आपके पास पर्याप्त बड़ा सैंपल आकार हो
  • आप ऐसा सतत डेटा उपयोग कर रहे हों जिसमें भारी टेढ़ापन या आउट्लायर न हों

Mann-Whitney U परीक्षण

Mann-Whitney U परीक्षण माध्यों के बजाय वितरणों की तुलना करता है। यह दोनों समूहों के सभी मानों को साथ रैंक करता है और जाँचता है कि क्या एक समूह लगातार दूसरे से ऊँची रैंक लेता है। क्योंकि यह रैंकों के साथ काम करता है, आउट्लायर और टेढ़ापन परिणाम को उसी तरह नहीं बिगाड़ते।

जब आपका डेटा वास्तव में सामान्य रूप से वितरित हो, t-परीक्षण अंतर को अधिक विश्वसनीय रूप से पकड़ता है। Mann-Whitney U परीक्षण अधिक लचीला है, लेकिन आप कुछ संवेदनशीलता छोड़ते हैं।

Mann-Whitney U परीक्षण का उपयोग करें जब:

  • आपका डेटा सामान्य रूप से वितरित नहीं है
  • आप क्रमिक डेटा के साथ काम कर रहे हैं
  • आपके पास छोटा सैंपल आकार है और सामान्यता की पुष्टि नहीं कर सकते
  • आउट्लायर मौजूद हैं और आप उन्हें हटा नहीं सकते

यहाँ दोनों का एक त्वरित तुलना चार्ट है:

t-test compared to Mann-Whitney U test

t-परीक्षण बनाम Mann-Whitney U परीक्षण

संदेह होने पर, पहले अपना वितरण जाँचें। यदि वह कुछ हद तक सामान्य है, तो t-परीक्षण लें। यदि नहीं, तो Mann-Whitney U परीक्षण अधिक सुरक्षित विकल्प है।

Mann-Whitney U परीक्षण के साथ आम गलतियाँ

इस परीक्षण से जुड़ी अधिकतर गलतियाँ इस बात को न समझने से आती हैं कि यह वास्तव में करता क्या है। यहाँ वे हैं जो सबसे अधिक दिखती हैं।

यह मान लेना कि यह माध्यों की तुलना करता है

यह सबसे आम है। Mann-Whitney U परीक्षण वितरणों की तुलना करता है, माध्यों की नहीं। एक महत्वपूर्ण परिणाम बताता है कि एक समूह के मान ऊँची रैंक लेने की प्रवृत्ति रखते हैं—यह नहीं कि औसत अधिक है। यदि आपको अंतर का वर्णन करना हो, तो माध्यों के बजाय मध्यकों की रिपोर्ट करें।

वितरण आकार के अंतर को नजरअंदाज करना

यदि दोनों समूहों के वितरण आकार अलग हैं—एक दाएँ टेढ़ा है, दूसरा सममित—तो आप परिणाम की व्याख्या मध्यकों की तुलना के रूप में नहीं कर सकते। परीक्षण चलता है, पर आउटपुट समग्र वितरणों में अंतर दिखाता है, केंद्र में शिफ्ट नहीं। मध्यकों पर निष्कर्ष निकालने से पहले अपने वितरणों की जाँच करें।

p-मूल्यों की गलत व्याख्या

0.05 से कम p-मूल्य का अर्थ है कि दोनों समूहों के वितरणों के बीच सांख्यिकीय रूप से महत्वपूर्ण अंतर है। यह नहीं बताता कि अंतर कितना बड़ा है या व्यावहारिक रूप से मायने रखता है या नहीं। इसके लिए, आपको प्रभाव आकार (effect size) अलग से निकालना होगा और प्रत्येक समूह के मध्यकों को देखना होगा।

युग्मित (paired) डेटा पर इसका उपयोग करना

Mann-Whitney U परीक्षण दो स्वतंत्र समूहों के लिए है। यदि आपका डेटा युग्मित है—एक ही विषयों को दो बार मापा गया, या मेल खाते जोड़े—तो आपको इसके बजाय Wilcoxon signed-rank परीक्षण की आवश्यकता है।

कब आपको Mann-Whitney U परीक्षण का उपयोग नहीं करना चाहिए

Mann-Whitney U परीक्षण हर स्थिति के लिए सही उपकरण नहीं है। यहाँ वे परिस्थितियाँ हैं जब आपको कुछ और अपनाना चाहिए।

आपका डेटा युग्मित है

यदि वही विषय दोनों समूहों में आते हैं—पहले और बाद के माप, या मेल खाते जोड़े—तो दोनों नमूने स्वतंत्र नहीं हैं। Mann-Whitney U परीक्षण स्वतंत्रता मानता है, इसलिए यहाँ इसका उपयोग प्रेक्षणों के संबंध को नजरअंदाज कर देता है और अविश्वसनीय परिणाम देता है। इसके बजाय Wilcoxon signed-rank परीक्षण का उपयोग करें।

आपके पास दो से अधिक समूह हैं

Mann-Whitney U परीक्षण एक समय में केवल दो समूहों की तुलना करता है। यदि आप तीन या अधिक समूहों की तुलना कर रहे हैं, तो Kruskal-Wallis परीक्षण का उपयोग करें, जो एक-मार्ग ANOVA का नॉन-पैरामीट्रिक समकक्ष है और कई समूहों को संभाल सकता है।

आपके पास सामान्य डेटा के साथ बड़ा सैंपल है

Mann-Whitney U परीक्षण का मुख्य लाभ यह है कि यह सामान्यता नहीं मानता। यदि आपका डेटा सामान्य रूप से वितरित है और आपका सैंपल इतना बड़ा है कि इसे पुष्टि कर सके, तो t-परीक्षण बेहतर विकल्प है। ऐसी स्थिति में इसकी सांख्यिकीय शक्ति अधिक होती है, यानी वास्तविक अंतर होने पर उसे पकड़ने की संभावना अधिक होती है।

निष्कर्ष

जब आपका डेटा सामान्य रूप से वितरित नहीं होता, तब Mann-Whitney U परीक्षण एक बेहतरीन समाधान है, जबकि t-परीक्षण वहाँ उपयुक्त नहीं होता।

यह कच्चे मानों के बजाय रैंकों के साथ काम करता है, इसलिए वे धारणाएँ टाल देता है जो टेढ़े या छोटे सैंपल वाले डेटा पर पैरामीट्रिक परीक्षणों को अविश्वसनीय बनाती हैं। यही इसे वास्तविक-जीवन विश्लेषण के लिए अच्छा परीक्षण बनाता है, जहाँ डेटा शायद ही मनमुताबिक व्यवहार करता है।

यहाँ बड़ा सबक है—परीक्षण का चयन। कोई एक परीक्षण हर डेटासेट पर काम नहीं करता। हमेशा पहले अपने डेटा की जाँच करें—उसका वितरण, संरचना और सैंपल आकार—और इन्हीं विशेषताओं के आधार पर चुनाव करें। सही परीक्षण वही है जो आपके डेटा के अनुरूप हो।

यदि आप सांख्यिकी में नए हैं या विषय में गहराई से जाना चाहते हैं, तो हमारा Statistician in R ट्रैक आपको केवल 52 घंटों की सामग्री में नौकरी-तैयार बना देगा।

FAQs

Mann-Whitney U परीक्षण का उपयोग किस लिए किया जाता है?

Mann-Whitney U परीक्षण का उपयोग दो स्वतंत्र समूहों की तुलना के लिए तब किया जाता है जब आप यह नहीं मान सकते कि डेटा सामान्य वितरण का अनुसरण करता है। यह दोनों समूहों के सभी मानों को साथ रैंक करता है और जाँचता है कि क्या एक समूह लगातार दूसरे से ऊँची रैंक लेता है। यह क्रमिक और सतत—दोनों प्रकार के डेटा पर काम करता है।

Mann-Whitney U परीक्षण t-परीक्षण से कैसे अलग है?

t-परीक्षण दो समूहों के माध्यों की तुलना करता है और सामान्य वितरण मानता है। Mann-Whitney U परीक्षण रैंकों के जरिए वितरणों की तुलना करता है, इसलिए वह धारणा नहीं बनाता। जब आपका डेटा टेढ़ा हो या सैंपल छोटा हो, Mann-Whitney U परीक्षण अधिक सुरक्षित विकल्प है।

मुझे Mann-Whitney U परीक्षण कब उपयोग करना चाहिए?

इसे तब उपयोग करें जब आपके पास दो स्वतंत्र समूह हों, आपका डेटा क्रमिक या सतत हो, और आप सामान्यता की पुष्टि न कर सकें। यह तब भी उपयुक्त है जब आपका सैंपल छोटा हो और आउट्लायर मौजूद हों। यदि आपका डेटा सामान्य रूप से वितरित है और सैंपल बड़ा है, तो सामान्यतः t-परीक्षण बेहतर परिणाम देगा।

Mann-Whitney U परीक्षण में p-मूल्य आपको क्या बताता है?

0.05 से कम p-मूल्य का अर्थ है कि दोनों समूहों के वितरणों के बीच सांख्यिकीय रूप से महत्वपूर्ण अंतर है। यह नहीं बताता कि वह अंतर कितना बड़ा है या व्यावहारिक रूप से कितना मायने रखता है। इसके लिए आपको प्रभाव आकार अलग से निकालना होगा और प्रत्येक समूह के मध्यकों को देखना होगा।

क्या मैं युग्मित डेटा के लिए Mann-Whitney U परीक्षण उपयोग कर सकता/सकती हूँ?

नहीं। Mann-Whitney U परीक्षण यह मानता है कि दोनों समूह स्वतंत्र हैं, यानी एक समूह के मान दूसरे पर प्रभाव नहीं डालते। यदि आपका डेटा युग्मित है—जैसे एक ही विषयों पर पहले और बाद के माप—तो इसके बजाय Wilcoxon signed-rank परीक्षण का उपयोग करें। युग्मित डेटा पर Mann-Whitney U परीक्षण का उपयोग प्रेक्षणों के संबंध को नजरअंदाज करता है और अविश्वसनीय परिणाम देता है।

विषय

DataCamp के साथ सीखें

Track

डेटा विश्लेषक in R

36 घंटा
dplyr के साथ खोजपरक डेटा विश्लेषण से लेकर ggplot2 के साथ डेटा विज़ुअलाइज़ेशन तक—डेटा विश्लेषक के रूप में सफल होने के लिए आवश्यक करियर-निर्माण R कौशल हासिल करें!
विस्तृत जानकारी देखेंRight Arrow
कोर्स शुरू करें
और देखेंRight Arrow