मान-व्हिटनी यू परीक्षण: Difference between revisions

From Vigyanwiki
(Created page with "{{italic title|string=U}} {{short description|Nonparametric test of the null hypothesis}} आँकड़ों में, मान-व्हिटनी ''यू'' परी...")
 
No edit summary
 
(9 intermediate revisions by 4 users not shown)
Line 1: Line 1:
{{italic title|string=U}}
आँकड़ों में, '''मान-व्हिटनी ''U'' परीक्षण''' (जिसे '''मान-व्हिटनी-विलकॉक्सन''' ('''एमडब्ल्यूडब्ल्यू/एमडब्ल्यूयू'''), '''विल्कोक्सन क्रम-योग परीक्षण या विल्कोक्सन-मान-व्हिटनी परीक्षण''' भी कहा जाता है) शून्य परिकल्पना का एक अप्राचली सांख्यिकी [[सांख्यिकीय परिकल्पना परीक्षण|परीक्षण]] है। जो यादृच्छिक रूप से, दो जनों से चयनित मान X और Y, X के Y से अधिक होने की संभावना, Y के X से अधिक होने की संभावना के बराबर है।
{{short description|Nonparametric test of the null hypothesis}}
आँकड़ों में, मान-व्हिटनी ''यू'' परीक्षण (जिसे मान-व्हिटनी-विलकॉक्सन (MWW/MWU), विलकॉक्सन रैंक-सम टेस्ट या विलकॉक्सन-मान-व्हिटनी परीक्षण भी कहा जाता है) एक गैर पैरामीट्रिक सांख्यिकी [[सांख्यिकीय परिकल्पना परीक्षण]] है। अशक्त परिकल्पना कि, दो आबादी से यादृच्छिक रूप से चयनित मूल्यों ''X'' और ''Y'' के लिए, ''X'' की संभावना ''Y'' से अधिक होने की संभावना ''Y'' की संभावना के बराबर है '''X'' से बड़ा होना।


दो ''आश्रित'' नमूनों पर उपयोग किए जाने वाले गैर-पैरामीट्रिक परीक्षण [[ साइन परीक्षण ]] और [[विलकॉक्सन साइन-रैंक टेस्ट]] हैं।
दो ''आश्रित'' प्रतिदर्शो पर उपयोग किए जाने वाले अप्राचली परीक्षण [[ साइन परीक्षण |चिह्न परीक्षण]] और विल्कोक्सन [[ साइन परीक्षण |चिह्न]]-क्रम परीक्षण हैं।
 
== धारणाएं और परिकल्पनाओं का औपचारिक विवरण ==
यद्यपि मान और व्हिटनी<ref name="mannwhitney1947" />ने वैकल्पिक परिकल्पना के साथ निरंतर प्रतिक्रियाओं की धारणा के अंतर्गत मान-व्हिटनी U परीक्षण विकसित किया है कि एक वितरण दूसरे की तुलना में स्टोकेस्टिक रूप से अधिक है, शून्य परिकल्पना और वैकल्पिक परिकल्पना तैयार करने के कई अन्य तरीके हैं जैसे मान-व्हिटनी U परीक्षण एक वैध परीक्षण देगा।<ref name="FayProschan2010">{{cite journal |last1=Fay |first1=Michael&nbsp;P. |last2=Proschan |first2=Michael&nbsp;A. |journal=[[Statistics Surveys]] |year=2010 |pages=1–39 |volume=4 |doi=10.1214/09-SS051 |title=Wilcoxon–Mann–Whitney or ''t''-test? On assumptions for hypothesis tests and multiple interpretations of decision rules |pmc=2857732 |mr=2595125 |pmid=20414472 }}</ref>


== धारणाएं और परिकल्पनाओं का औपचारिक बयान ==
हालांकि [[हेनरी मान]] और व्हिटनी<ref name="mannwhitney1947" />मान-व्हिटनी यू परीक्षण को [[वैकल्पिक परिकल्पना]] के साथ सतत संभाव्यता वितरण प्रतिक्रियाओं की धारणा के तहत विकसित किया गया है कि एक वितरण दूसरे की तुलना में [[स्टोचैस्टिक ऑर्डरिंग]] है, शून्य परिकल्पना और वैकल्पिक परिकल्पना तैयार करने के कई अन्य तरीके हैं जैसे मान-व्हिटनी यू परीक्षण एक वैध परीक्षण देगा।<ref name="FayProschan2010">{{cite journal |last1=Fay |first1=Michael&nbsp;P. |last2=Proschan |first2=Michael&nbsp;A. |journal=[[Statistics Surveys]] |year=2010 |pages=1–39 |volume=4 |doi=10.1214/09-SS051 |title=Wilcoxon–Mann–Whitney or ''t''-test? On assumptions for hypothesis tests and multiple interpretations of decision rules |pmc=2857732 |mr=2595125 |pmid=20414472 }}</ref>
एक बहुत ही सामान्य सूत्रीकरण यह मान लेना है कि:
एक बहुत ही सामान्य सूत्रीकरण यह मान लेना है कि:


# दोनों समूहों के सभी अवलोकन एक दूसरे की [[सांख्यिकीय स्वतंत्रता]] हैं,
# दोनों समूहों के सभी अवलोकन एक दूसरे से स्वतंत्र हैं,
# प्रतिक्रियाएँ कम से कम क्रमसूचक माप हैं (अर्थात्, कम से कम यह कह सकते हैं कि किन्हीं दो प्रेक्षणों में से कौन अधिक है),
# प्रतिक्रियाएँ कम-से-कम क्रमिक हैं (अर्थात्, कम-से-कम यह कह सकते हैं कि किन्हीं दो प्रेक्षणों में से कौन अधिक है),
# शून्य परिकल्पना के तहत एच<sub>0</sub>, दोनों आबादी का वितरण समान है।<ref>[https://www.jstor.org/stable/2283092], See Table 2.1 of Pratt (1964) "Robustness of Some Procedures for the Two-Sample Location Problem." ''Journal of the American Statistical Association.'' 59 (307): 655–680. If the two distributions are normal with the same mean but different variances, then Pr[''X''&nbsp;>&nbsp;''Y'']&nbsp;=&nbsp;Pr[''Y''&nbsp;<&nbsp;''X''] but the size of the Mann–Whitney test can be larger than the nominal level. So we cannot define the null hypothesis as Pr[''X''&nbsp;>&nbsp;''Y'']&nbsp;=&nbsp;Pr[''Y''&nbsp;<&nbsp;''X''] and get a valid test.</ref>
# शून्य परिकल्पना के अंतर्गत H<sub>0</sub>, दोनों जनों का वितरण समान है।<ref>[https://www.jstor.org/stable/2283092], See Table 2.1 of Pratt (1964) "Robustness of Some Procedures for the Two-Sample Location Problem." ''Journal of the American Statistical Association.'' 59 (307): 655–680. If the two distributions are normal with the same mean but different variances, then Pr[''X''&nbsp;>&nbsp;''Y'']&nbsp;=&nbsp;Pr[''Y''&nbsp;<&nbsp;''X''] but the size of the Mann–Whitney test can be larger than the nominal level. So we cannot define the null hypothesis as Pr[''X''&nbsp;>&nbsp;''Y'']&nbsp;=&nbsp;Pr[''Y''&nbsp;<&nbsp;''X''] and get a valid test.</ref>
# वैकल्पिक परिकल्पना एच<sub>1</sub> यह है कि वितरण समान नहीं हैं।
# वैकल्पिक परिकल्पना H<sub>1</sub> यह है कि वितरण समान नहीं हैं।


सामान्य सूत्रीकरण के तहत, परीक्षण केवल संगति (सांख्यिकी) # परीक्षण है जब निम्नलिखित एच के तहत होता है<sub>1</sub>:
सामान्य सूत्रीकरण के अंतर्गत, परीक्षण केवल तभी सुसंगत होता है जब H<sub>1</sub> के अंतर्गत निम्नलिखित होता है:


# जनसंख्या X से अवलोकन की संभावना जनसंख्या Y से अवलोकन से अधिक है, Y से अवलोकन की संभावना X से अवलोकन से अधिक है; अर्थात।,  {{math|1=P(''X'' > ''Y'') ≠ P(''Y'' > ''X'')}} या {{math|1=P(''X'' > ''Y'') + 0.5 · P(''X'' = ''Y'') ≠ 0.5}}.
# जनसंख्या X के किसी अवलोकन की जनसंख्या Y के अवलोकन से अधिक होने की संभावना Y के किसी अवलोकन की जनसंख्या; अर्थात,  {{math|1=P(''X'' > ''Y'') ≠ P(''Y'' > ''X'')}} या {{math|1=P(''X'' > ''Y'') + 0.5 · P(''X'' = ''Y'') ≠ 0.5}} हैं।
#उपरोक्त सामान्य सूत्रीकरण की तुलना में अधिक पूर्णतः मान्यताओं के अंतर्गत, उदाहरण के लिए, यदि प्रतिक्रियाओं को निरंतर माना जाता है और विकल्प को स्थान परिवर्तन तक सीमित रखा जाता है, अर्थात, {{math|1=''F''<sub>1</sub>(''x'') = ''F''<sub>2</sub>(''x'' + ''δ'')}}, तो हम एक महत्वपूर्ण व्याख्या कर सकते हैं मान-व्हिटनी U परीक्षण मध्यस्थों में अंतर दर्शाता है। इस स्थान परिवर्तन की धारणा के अंतर्गत, हम मान-व्हिटनी U परीक्षण की व्याख्या यह आकलन करने के लिए भी कर सकते हैं कि क्या दो जनों के मध्य केंद्रीय प्रवृत्ति में अंतर का होजेस-लेहमैन अनुमान शून्य से भिन्न है। इस दो-प्रतिदर्श समस्याओं के लिए होजेस-लेहमैन का अनुमान पहले प्रतिदर्श में एक अवलोकन और दूसरे प्रतिदर्श में एक अवलोकन के मध्य सभी संभावित अंतरों का माध्य है।


उपरोक्त सामान्य सूत्रीकरण की तुलना में अधिक सख्त मान्यताओं के तहत, उदाहरण के लिए, यदि प्रतिक्रियाओं को निरंतर माना जाता है और विकल्प को स्थान परिवर्तन तक सीमित रखा जाता है, अर्थात, {{math|1=''F''<sub>1</sub>(''x'') = ''F''<sub>2</sub>(''x'' + ''δ'')}}, हम एक महत्वपूर्ण मान-व्हिटनी यू परीक्षण की व्याख्या माध्यिका में अंतर दिखाने के रूप में कर सकते हैं। इस स्थान परिवर्तन की धारणा के तहत, हम मान-व्हिटनी यू परीक्षण की व्याख्या यह आकलन करने के लिए भी कर सकते हैं कि क्या हॉजेस-लेहमैन दो आबादी के बीच केंद्रीय प्रवृत्ति में अंतर का अनुमान शून्य से अलग है। इस दो-नमूना समस्या के लिए होजेस-लेहमैन का अनुमान पहले नमूने में एक अवलोकन और दूसरे नमूने में एक अवलोकन के बीच सभी संभावित अंतरों का औसत है।
अन्यथा, यदि दोनों प्रतिदर्शों के परिक्षेपण और वितरण के आकार भिन्न हैं, तो मान-व्हिटनी U परीक्षण मध्यस्थों के परीक्षण में विफल रहता है। ऐसे उदाहरण दिखाना संभव है जहां माध्यिकाएं संख्यात्मक रूप से बराबर होती हैं, जबकि परीक्षण एक छोटे p-मान के साथ शून्य परिकल्पना को अस्वीकार करता है।<ref>{{cite journal |last1=Divine |first1=George W. |last2=Norton |first2=H. James |last3=Barón |first3=Anna E. |last4=Juarez-Colunga |first4=Elizabeth |title=The Wilcoxon–Mann–Whitney Procedure Fails as a Test of Medians |journal=The American Statistician |date=2018 |volume=72 |issue=3 |pages=278–286 |doi=10.1080/00031305.2017.1305291 |doi-access=free }}</ref> <ref>{{cite journal |last1=Conroy |first1=Ronán  |title=What Hypotheses do "Nonparametric" Two-Group Tests Actually Test? |journal=Stata Journal |date=2012 |volume=12 |issue=2 |pages=182–190 |doi=10.1177/1536867X1201200202 |s2cid=118445807 |url=https://www.researchgate.net/publication/279580873 |access-date=24 May 2021}}</ref> <ref>{{cite journal |last1=Hart |first1=Anna |title=Mann–Whitney test is not just a test of medians: differences in spread can be important |journal=BMJ |date=2001 |volume=323 |issue=7309 |pages=391–393 |doi=10.1136/bmj.323.7309.391 |doi-access=free }}</ref>


अन्यथा, यदि दोनों नमूनों के वितरण के फैलाव और आकार दोनों अलग-अलग हैं, तो मान-व्हिटनी यू परीक्षण माध्यिका के परीक्षण में विफल रहता है। ऐसे उदाहरण दिखाना संभव है जहां मध्यिकाएं संख्यात्मक रूप से बराबर हों, जबकि परीक्षण एक छोटे पी-मान के साथ शून्य परिकल्पना को अस्वीकार करता है।<ref>{{cite journal |last1=Divine |first1=George W. |last2=Norton |first2=H. James |last3=Barón |first3=Anna E. |last4=Juarez-Colunga |first4=Elizabeth |title=The Wilcoxon–Mann–Whitney Procedure Fails as a Test of Medians |journal=The American Statistician |date=2018 |volume=72 |issue=3 |pages=278–286 |doi=10.1080/00031305.2017.1305291 |doi-access=free }}</ref> <ref>{{cite journal |last1=Conroy |first1=Ronán  |title=What Hypotheses do "Nonparametric" Two-Group Tests Actually Test? |journal=Stata Journal |date=2012 |volume=12 |issue=2 |pages=182–190 |doi=10.1177/1536867X1201200202 |s2cid=118445807 |url=https://www.researchgate.net/publication/279580873 |access-date=24 May 2021}}</ref> <ref>{{cite journal |last1=Hart |first1=Anna |title=Mann–Whitney test is not just a test of medians: differences in spread can be important |journal=BMJ |date=2001 |volume=323 |issue=7309 |pages=391–393 |doi=10.1136/bmj.323.7309.391 |doi-access=free }}</ref> मान-व्हिटनी यू टेस्ट / विलकॉक्सन रैंक-सम टेस्ट विलकॉक्सन साइन-रैंक टेस्ट के समान नहीं है | मान-व्हिटनी यू परीक्षण स्वतंत्र नमूनों पर लागू होता है। विलकॉक्सन हस्ताक्षरित-रैंक परीक्षण मिलान या आश्रित नमूनों पर लागू होता है।
मान-व्हिटनी U परीक्षण/विल्कोक्सन क्रम-योग परीक्षण विल्कोक्सन चिह्न-क्रम परीक्षण के समान नहीं है, हालांकि दोनों अप्राचली सांख्यिकी हैं और इसमें क्रमों का योग सम्मिलित है। मान-व्हिटनी U परीक्षण स्वतंत्र प्रतिदर्शों पर अनुप्रयुक्त किया जाता है। विल्कोक्सन चिह्न-क्रम परीक्षण सुमेलित या आश्रित प्रतिदर्शों पर अनुप्रयुक्त किया जाता है।


== यू आँकड़ा ==
== U प्रतिदर्शज ==
होने देना <math>X_1,\ldots, X_n</math> एक स्वतंत्र और समान रूप से वितरित यादृच्छिक चर |i.i.d. से नमूना <math>X</math>, और <math>Y_1,\ldots, Y_m</math> एक आई.आई.डी. से नमूना <math>Y</math>, और दोनों नमूने एक दूसरे से स्वतंत्र हैं। इसी मान-व्हिटनी यू सांख्यिकी को इस प्रकार परिभाषित किया गया है:
मान लीजिए कि <math>X_1,\ldots, X_n</math> एक आई.आई.डी <math>X</math> से प्रतिदर्श और <math>Y_1,\ldots, Y_m</math> एक आई.आई.डी. <math>Y</math> से प्रतिदर्श है सेऔर दोनों प्रतिदर्श एक दूसरे से स्वतंत्र हैं। संबंधित मान-व्हिटनी U सांख्यिकी को इस प्रकार परिभाषित किया गया हैː


:<math>U = \sum_{i=1}^n \sum_{j=1}^m S(X_i,Y_j),</math>
:<math>U = \sum_{i=1}^n \sum_{j=1}^m S(X_i,Y_j),</math>
साथ
के साथ
:<math>S(X,Y) = \begin{cases}
:<math>S(X,Y) = \begin{cases}
1, &\text{if } X > Y, \\
1, &\text{if } X > Y, \\
Line 34: Line 34:




=== आरओसी वक्रों के लिए वक्र-अंडर-वक्र (एयूसी) आँकड़ा ===
=== आरओसी वक्रों के लिए क्षेत्र के अंतर्गत वक्र (AUC) प्रतिदर्शज ===
यू आंकड़ा 'रिसीवर ऑपरेटिंग विशेषता वक्र के तहत क्षेत्र' (रिसीवर ऑपरेटिंग विशेषता # वक्र के तहत क्षेत्र) के बराबर है जिसे आसानी से गणना की जा सकती है।<ref name="Hanley">{{cite journal |last1=Hanley |first1=James&nbsp;A. |last2=McNeil |first2=Barbara&nbsp;J. |author-link2=Barbara Joyce McNeil |year=1982 |title=एक रिसीवर ऑपरेटिंग (आरओसी) वक्र विशेषता के तहत क्षेत्र का अर्थ और उपयोग|journal=Radiology |volume=143 |pages=29–36 |doi=10.1148/radiology.143.1.7063747 |pmid=7063747 |number=1}}</ref><ref name="Mason">{{cite journal |last1=Mason |first1=Simon&nbsp;J. |last2=Graham |first2=Nicholas&nbsp;E. |year=2002 |title=Areas beneath the relative operating characteristics (ROC) and relative operating levels (ROL) curves: Statistical significance and interpretation |url=http://www.inmet.gov.br/documentos/cursoI_INMET_IRI/Climate_Information_Course/References/Mason+Graham_2002.pdf |journal=Quarterly Journal of the Royal Meteorological Society |volume=128 |issue=584 |pages=2145–2166 |bibcode=2002QJRMS.128.2145M |citeseerx=10.1.1.458.8392 |doi=10.1256/003590002320603584 |s2cid=121841664}}</ref>
U प्रतिदर्शज गृहीता प्रचालन विशेषता वक्र (AUC) के अंतर्गत क्षेत्र के बराबर है जिसकी गणना सरलता से की जा सकती है।<ref name="Hanley">{{cite journal |last1=Hanley |first1=James&nbsp;A. |last2=McNeil |first2=Barbara&nbsp;J. |author-link2=Barbara Joyce McNeil |year=1982 |title=एक रिसीवर ऑपरेटिंग (आरओसी) वक्र विशेषता के तहत क्षेत्र का अर्थ और उपयोग|journal=Radiology |volume=143 |pages=29–36 |doi=10.1148/radiology.143.1.7063747 |pmid=7063747 |number=1}}</ref><ref name="Mason">{{cite journal |last1=Mason |first1=Simon&nbsp;J. |last2=Graham |first2=Nicholas&nbsp;E. |year=2002 |title=Areas beneath the relative operating characteristics (ROC) and relative operating levels (ROL) curves: Statistical significance and interpretation |url=http://www.inmet.gov.br/documentos/cursoI_INMET_IRI/Climate_Information_Course/References/Mason+Graham_2002.pdf |journal=Quarterly Journal of the Royal Meteorological Society |volume=128 |issue=584 |pages=2145–2166 |bibcode=2002QJRMS.128.2145M |citeseerx=10.1.1.458.8392 |doi=10.1256/003590002320603584 |s2cid=121841664}}</ref>
:<math>\mathrm{AUC}_1 = {U_1 \over n_1n_2}</math>
:<math>\mathrm{AUC}_1 = {U_1 \over n_1n_2}</math>
ध्यान दें कि यह उपरोक्त अनुभाग से सामान्य भाषा प्रभाव आकार के समान परिभाषा है। यानी: संभावना है कि एक क्लासिफायरियर यादृच्छिक रूप से चुने गए नकारात्मक से अधिक यादृच्छिक रूप से चुने गए सकारात्मक उदाहरण को रैंक करेगा (मान लें कि 'सकारात्मक' रैंक 'नकारात्मक' से अधिक है)।<ref name="fawcett">Fawcett, Tom (2006); ''[https://www.math.ucdavis.edu/~saito/data/roc/fawcett-roc.pdf An introduction to ROC analysis]'', Pattern Recognition Letters, 27, 861–874.</ref>
ध्यान दें कि यह उपरोक्त अनुभाग से सामान्य भाषा प्रभाव आकार के समान परिभाषा है। अर्थात: संभावना है कि एक वर्गीकरणकर्ता यादृच्छिक रूप से चुने गए धनात्मक उदाहरण को यादृच्छिक रूप से चुने गए ऋणात्मक से अधिक क्रम देगा (यह मानते हुए कि 'धनात्मक' क्रम 'ऋणात्मक' से अधिक है)।<ref name="fawcett">Fawcett, Tom (2006); ''[https://www.math.ucdavis.edu/~saito/data/roc/fawcett-roc.pdf An introduction to ROC analysis]'', Pattern Recognition Letters, 27, 861–874.</ref>
इसके संभाव्य रूप के कारण, U सांख्यिकी को दो से अधिक वर्गों के लिए क्लासिफायर की पृथक्करण शक्ति के माप के लिए सामान्यीकृत किया जा सकता है:<ref>{{cite journal |last1=Hand |first1=David&nbsp;J. |last2=Till |first2=Robert&nbsp;J. |year=2001 |title=एकाधिक वर्ग वर्गीकरण समस्याओं के लिए आरओसी वक्र के तहत क्षेत्र का एक सरल सामान्यीकरण|journal=Machine Learning |volume=45 |pages=171–186 |doi=10.1023/A:1010920819831 |doi-access=free |number=2}}</ref>
 
इसके संभाव्य रूप के कारण, U सांख्यिकी को दो से अधिक वर्गों के लिए वर्गीकरणकर्ता की पृथक्करण शक्ति के माप के लिए सामान्यीकृत किया जा सकता है:<ref>{{cite journal |last1=Hand |first1=David&nbsp;J. |last2=Till |first2=Robert&nbsp;J. |year=2001 |title=एकाधिक वर्ग वर्गीकरण समस्याओं के लिए आरओसी वक्र के तहत क्षेत्र का एक सरल सामान्यीकरण|journal=Machine Learning |volume=45 |pages=171–186 |doi=10.1023/A:1010920819831 |doi-access=free |number=2}}</ref>
:<math>M = {1 \over c(c-1)} \sum \mathrm{AUC}_{k,\ell}</math>
:<math>M = {1 \over c(c-1)} \sum \mathrm{AUC}_{k,\ell}</math>
जहाँ c वर्गों की संख्या है, और R<sub>''k'',''ℓ''</sub> एयूसी की अवधि<sub>''k'',''ℓ''</sub> वर्ग k और ℓ से संबंधित वस्तुओं की केवल रैंकिंग पर विचार करता है (अर्थात, अन्य सभी वर्गों से संबंधित वस्तुओं को अनदेखा कर दिया जाता है) क्लासिफायर के वर्ग k से संबंधित उन वस्तुओं की संभावना के अनुमान के अनुसार। एयूसी<sub>''k'',''k''</sub> हमेशा शून्य रहेगा लेकिन, दो-वर्ग के मामले के विपरीत, आम तौर पर {{math|1=AUC<sub>''k'',''ℓ''</sub> ≠ AUC<sub>''ℓ'',''k''</sub>}}, यही कारण है कि एयूसी के औसत का उपयोग करके एम माप सभी (के, ℓ) जोड़े पर योग करता है<sub>''k'',''''</sub> और एयूसी<sub>'''',''k''</sub>.
जहाँ c वर्गों की संख्या है और R<sub>''k'',''ℓ ,''</sub> AUC<sub>''k'',''ℓ''</sub> का पद, ℓ केवल वर्ग k और ℓ से संबंधित वस्तुओं के श्रेणीक्रम पर विचार करता है (अर्थात, अन्य सभी वर्गों से संबंधित वस्तुओं को अवहेलना कर दिया जाता है) वर्गीकरणकर्ता के अनुमान के अनुसार कक्षा k से संबंधित उन वस्तुओं की संभावना है। AUC<sub>''k'',''k''</sub> सदैव शून्य होगा, परन्तु, दो-वर्गों की स्थिति के विपरीत, सामान्यतः {{math|1=AUC<sub>''k'',''ℓ''</sub> ≠ AUC<sub>''ℓ'',''k''</sub>}}, यही कारण है कि M, AUC<sub>'''',''k''</sub> और AUC<sub>''k'',''''</sub> के औसत का उपयोग करते हुए, सभी (k,ℓ) युग्मों का योग मापता है।


== गणना ==
== गणना ==
परीक्षण में एक आंकड़े की गणना शामिल है, जिसे आमतौर पर यू कहा जाता है, जिसका वितरण शून्य परिकल्पना के तहत जाना जाता है। छोटे नमूनों के मामले में, वितरण सारणीबद्ध है, लेकिन ~20 से ऊपर के नमूने के आकार के लिए, [[सामान्य वितरण]] का उपयोग करके सन्निकटन काफी अच्छा है। कुछ पुस्तकें यू के समतुल्य आँकड़ों को सारणीबद्ध करती हैं, जैसे कि यू के बजाय नमूनों में से एक में [[रैंक (सेट सिद्धांत)]] का योग।
परीक्षण में एक प्रतिदर्शज की गणना सम्मिलित है, जिसे सामान्यतः U कहा जाता है, जिसका वितरण शून्य परिकल्पना के अंतर्गत जाना जाता है। छोटे प्रतिदर्शों की स्थिति में, वितरण सारणीबद्ध है, परन्तु ~20 से ऊपर के प्रतिदर्श आकारों के लिए, [[सामान्य वितरण]] का उपयोग करके अनुमान लगाना काफी अच्छा है। कुछ पुस्तकें U के समतुल्य आँकड़ों को सारणीबद्ध करती हैं, जैसे कि U के बजाय प्रतिदर्शों में से एक में [[रैंक (सेट सिद्धांत)|क्रम]] का योग हैं।


मान-व्हिटनी यू परीक्षण [[सांख्यिकीय]] पैकेजों की सबसे आधुनिक सूची में शामिल है। यह आसानी से हाथ से भी गणना की जाती है, खासकर छोटे नमूनों के लिए। इसे करने के दो तरीके हैं।
मान-व्हिटनी U अधिकांश आधुनिक सांख्यिकीय संवेष्टको में सम्मिलित है। विशेषकर छोटे प्रतिदर्शों के लिए, इसकी गणना हाथ से भी सरलता से की जा सकती है। इसे करने की दो विधियाँ हैं।


'पहला तरीका:'
==== पहली विधिː ====
प्रेक्षणों के दो छोटे समुच्चयों की तुलना करने के लिए, एक प्रत्यक्ष विधि त्वरित है और U सांख्यिकी के अर्थ में अंतर्दृष्टि देती है, जो सभी युग्‍मानूसार प्रतियोगिताओं में जीत की संख्या से मेल खाती है (नीचे दिए गए उदाहरणों के अंतर्गत कछुआ और खरगोश का उदाहरण देखें)। एक समुच्चय में प्रत्येक अवलोकन के लिए, दूसरे समुच्चय में किसी भी अवलोकन पर यह पहला मान जीतने की संख्या की गणना करें (यदि यह पहला बड़ा है तो दूसरा मान हार जाता है)। किसी भी प्रतियोगिता के लिए 0.5 की गणना करें। पहले समुच्चय के लिए, जीत और प्रतियोगिता का योग U (अर्थात: <math>U_1</math>) है। दूसरे समुच्चय के लिए U (अर्थात: <math>U_2</math>) इसका विपरीत है।


प्रेक्षणों के दो छोटे सेटों की तुलना करने के लिए, एक सीधा तरीका त्वरित है, और यू स्टेटिस्टिक के अर्थ में अंतर्दृष्टि देता है, जो सभी जोड़ीदार प्रतियोगिताओं में से जीत की संख्या से मेल खाता है (नीचे दिए गए उदाहरणों के तहत कछुआ और खरगोश का उदाहरण देखें)। एक सेट में प्रत्येक अवलोकन के लिए, दूसरे सेट में किसी भी अवलोकन पर यह पहला मान जीतने की संख्या की गणना करें (यदि यह पहला बड़ा है तो दूसरा मान हार जाता है)। किसी भी टाई के लिए 0.5 की गिनती करें। जीत और टाई का योग U है (अर्थात: <math>U_1</math>) पहले सेट के लिए। दूसरे सेट के लिए U विलोम है (अर्थात: <math>U_2</math>).
==== द्वितीय विधि: ====
 
बड़े प्रतिदर्शों के लिए:
विधि दो:
# सभी अवलोकनों के लिए संख्यात्मक क्रम निर्दिष्ट करें (दोनों समूहों से अवलोकनों को एक समुच्चय में रखें), सबसे छोटे मान के लिए 1 से प्रारंभ करें। जहां बंधे हुए मानों के समूह हैं, असमायोजित श्रेणीक्रम के मध्य बिंदु के बराबर एक क्रम निर्दिष्ट करें (उदाहरण के लिए, {{math|(3, 5, 5, 5, 5, 8)}} का क्रम {{math|(1, 3.5, 3.5, 3.5, 3.5, 6)}} हैं, जहां असमायोजित क्रम {{math|(1, 2, 3, 4, 5, 6)}}) होगा।
 
# अब, प्रतिदर्श 1 से प्राप्त अवलोकनों के लिए क्रम जोड़ें। प्रतिदर्श 2 में क्रमों का योग अब निर्धारित किया गया है, क्योंकि सभी क्रमों का योग {{math|''N''(''N'' + 1)/2}} के बराबर है जहां N प्रेक्षणों की कुल संख्या है।
बड़े नमूनों के लिए:
# फिर U द्वारा दिया गया है:<ref>{{cite book|last=Zar|first=Jerrold&nbsp;H.|title=बायोस्टैटिस्टिकल विश्लेषण|year=1998|publisher=Prentice Hall International, INC.|location=New Jersey|isbn=978-0-13-082390-8|page=147}}</ref>
# सभी अवलोकनों के लिए संख्यात्मक रैंक असाइन करें (दोनों समूहों से अवलोकनों को एक सेट में रखें), सबसे छोटे मान के लिए 1 से शुरू करें। जहां बंधे हुए मूल्यों के समूह हैं, असमायोजित रैंकिंग के मध्य बिंदु के बराबर एक रैंक असाइन करें (उदाहरण के लिए, की रैंक {{math|(3, 5, 5, 5, 5, 8)}} हैं {{math|(1, 3.5, 3.5, 3.5, 3.5, 6)}}, जहां असमायोजित रैंक होगी {{math|(1, 2, 3, 4, 5, 6)}}).
# अब, नमूना 1 से प्राप्त टिप्पणियों के लिए रैंक जोड़ें। नमूना 2 में रैंकों का योग अब निर्धारित किया गया है, क्योंकि सभी रैंकों का योग बराबर है {{math|''N''(''N'' + 1)/2}} जहां N प्रेक्षणों की कुल संख्या है।
# यू तब दिया जाता है:<ref>{{cite book|last=Zar|first=Jerrold&nbsp;H.|title=बायोस्टैटिस्टिकल विश्लेषण|year=1998|publisher=Prentice Hall International, INC.|location=New Jersey|isbn=978-0-13-082390-8|page=147}}</ref>
:::<math>U_1=R_1 - {n_1(n_1+1) \over 2} \,\!</math>
:::<math>U_1=R_1 - {n_1(n_1+1) \over 2} \,\!</math>
:: जहां एन<sub>1</sub> नमूना 1 के लिए नमूना आकार है, और आर<sub>1</sub> नमूना 1 में रैंकों का योग है।
:: जहां n<sub>1</sub> प्रतिदर्श 1 के लिए प्रतिदर्श आकार है और R<sub>1</sub> प्रतिदर्श 1 में क्रमों का योग है।


::ध्यान दें कि इससे कोई फर्क नहीं पड़ता कि दो नमूनों में से कौन सा नमूना माना जाता है 1. U के लिए एक समान रूप से मान्य सूत्र है
::ध्यान दें कि इससे कोई फर्क नहीं पड़ता कि दो प्रतिदर्शों में से किसे प्रतिदर्श 1 माना जाता है। U के लिए एक समान रूप से मान्य सूत्र है


:::<math>U_2= R_2 - {n_2(n_2+1) \over 2} \,\!</math>
:::<math>U_2= R_2 - {n_2(n_2+1) \over 2} \,\!</math>
:: U का छोटा मान<sub>1</sub> और आप<sub>2</sub> महत्व सारणी से परामर्श करते समय उपयोग किया जाता है। दो मानों का योग द्वारा दिया गया है
:: ''U''<sub>1</sub> और ''U''<sub>2</sub> का छोटा मान महत्व तालिकाओं से परामर्श करते समय उपयोग किया जाता है। दो मानों का योग किसके द्वारा दिया गया हैː
:::<math>U_1 + U_2 = R_1 - {n_1(n_1+1) \over 2} + R_2 - {n_2(n_2+1) \over 2}. \,\!</math>
:::<math>U_1 + U_2 = R_1 - {n_1(n_1+1) \over 2} + R_2 - {n_2(n_2+1) \over 2} \,\!</math>
:: जानते हुए भी {{math|1=''R''<sub>1</sub> + ''R''<sub>2</sub> = ''N''(''N'' + 1)/2}} और {{math|1=''N'' = ''n''<sub>1</sub> + ''n''<sub>2</sub>}}, और कुछ [[बीजगणित]] करने पर, हम पाते हैं कि योग है
:: यह जानते हुए कि {{math|1=''R''<sub>1</sub> + ''R''<sub>2</sub> = ''N''(''N'' + 1)/2}} और {{math|1=''N'' = ''n''<sub>1</sub> + ''n''<sub>2</sub>}}, और कुछ [[बीजगणित]] करने पर, हम पाते हैं कि योग हैː
:::{{math|1=''U''<sub>1</sub> + ''U''<sub>2</sub> = ''n''<sub>1</sub>''n''<sub>2</sub>}}.
:::{{math|1=''U''<sub>1</sub> + ''U''<sub>2</sub> = ''n''<sub>1</sub>''n''<sub>2</sub>}}.


== गुण ==
== गुणधर्म ==


यू का अधिकतम मूल्य दो नमूनों के लिए नमूना आकार का उत्पाद है (यानी: <math>U_i = n_1 n_2</math>). ऐसी स्थिति में, अन्य U 0 होगा।
U का अधिकतम मान दो प्रतिदर्शों (अर्थात: <math>U_i = n_1 n_2</math>) के लिए प्रतिदर्श आकार का उत्पाद है, ऐसी स्थिति में, अन्य U, 0 होगा।


== उदाहरण ==
== उदाहरण ==
Line 76: Line 75:
===गणना विधियों का उदाहरण===
===गणना विधियों का उदाहरण===


मान लीजिए कि [[ईसप]] अपने द [[कछुआ]] और [[खरगोश]] से असंतुष्ट है जिसमें एक कछुआ एक दौड़ में एक खरगोश को हरा पाया था, और यह पता लगाने के लिए कि क्या परिणाम सामान्य रूप से कछुओं और खरगोशों तक बढ़ाए जा सकते हैं, एक महत्व परीक्षण करने का फैसला करता है। वह 6 कछुओं और 6 खरगोशों का एक नमूना इकट्ठा करता है, और उन सभी को एक ही बार में अपनी दौड़ में लगा देता है। जिस क्रम में वे फिनिशिंग पोस्ट तक पहुँचते हैं (उनका रैंक ऑर्डर, फिनिश लाइन को पार करने वाली पहली से आखिरी तक) इस प्रकार है, एक कछुए के लिए टी और एक खरगोश के लिए एच लिखना:
मान लीजिए कि [[ईसप]] अपने उत्कृष्ट प्रयोग से असंतुष्ट है जिसमें एक कछुआ दौड़ में एक खरगोश को हराता पाया गया था और यह पता लगाने के लिए एक महत्व परीक्षण करने का निश्चय करता है कि क्या परिणाम सामान्य रूप से कछुओं और खरगोशों तक बढ़ाए जा सकते हैं। वह 6 कछुओं और 6 खरगोशों का एक प्रतिदर्श एकत्र करता है और उन सभी को एक ही बार में अपनी दौड़ में दौड़ाता है। जिस क्रम में वे समापन पद तक पहुँचते हैं (उनका स्थिति क्रम, समापन रेखा को पार करने वाली पहली से आखिरी तक) इस प्रकार है, एक कछुए के लिए T और एक खरगोश के लिए H लिखना है:
: टी एच एच एच एच एच टी टी टी टी टी टी एच
: T H H H H H T T T T T H
यू का मान क्या है?
U का मान क्या है?
* प्रत्यक्ष विधि का उपयोग करते हुए, हम प्रत्येक कछुए को बारी-बारी से लेते हैं, और 6, 1, 1, 1, 1, 1 प्राप्त करने वाले खरगोशों की संख्या की गणना करते हैं, जिसका अर्थ है कि {{math|1=''U<sub>T</sub>'' = 11}}. वैकल्पिक रूप से, हम प्रत्येक खरगोश को बारी-बारी से ले सकते हैं, और यह गिन सकते हैं कि यह कितने कछुओं को हराता है। इस मामले में, हमें 5, 5, 5, 5, 5, 0, इसलिए मिलता है {{math|1=''U<sub>H</sub>'' = 25}}. ध्यान दें कि इन दो मानों का योग के लिए {{math|1=''U'' = 36}}, जो है {{math|6×6}}.
* प्रत्यक्ष विधि का उपयोग करते हुए, हम प्रत्येक कछुए को बारी-बारी से लेते हैं और उसके द्वारा मारे गए खरगोशों की संख्या गिनते हैं, जिससे 6, 1, 1, 1, 1, 1 प्राप्त होता है, जिसका अर्थ, {{math|1=''U<sub>T</sub>'' = 11}} है। वैकल्पिक रूप से, हम प्रत्येक खरगोश को बारी-बारी से ले सकते हैं और यह गणना करें कि यह कितने कछुओं को हराता है। इस स्थिति में, हमें 5, 5, 5, 5, 5, 0 मिलता है इसलिए {{math|1=''U<sub>H</sub>'' = 25}} है। ध्यान दें कि U के लिए इन दो मानों का योग = 36 है, जो 6×6 है।
* अप्रत्यक्ष विधि का उपयोग करना:
* अप्रत्यक्ष विधि का उपयोग करना:
: जानवरों को पाठ्यक्रम पूरा करने में लगने वाले समय तक रैंक दें, इसलिए पहले जानवर को होम रैंक 12, दूसरे रैंक को 11 और इसी तरह आगे दें।
: जानवरों को पाठ्यक्रम पूर्ण करने में लगने वाले समय तक क्रम दें, इसलिए पहले जानवर को आवास क्रम 12, दूसरे क्रम को 11 दें, इत्यादि।
: कछुओं द्वारा प्राप्त रैंकों का योग है {{math|1=12 + 6 + 5 + 4 + 3 + 2 = 32}}.
: कछुओं द्वारा प्राप्त क्रमों का योग {{math|1=12 + 6 + 5 + 4 + 3 + 2 = 32}} है।
:: इसलिए {{math|1=''U<sub>T</sub>'' = 32 − (6×7)/2 = 32 − 21 = 11}} (विधि एक के समान)
:इसलिए {{math|1=''U<sub>T</sub>'' = 32 − (6×7)/2 = 32 − 21 = 11}} (विधि एक के समान) है।
:: खरगोशों द्वारा प्राप्त रैंकों का योग है {{math|1=11 + 10 + 9 + 8 + 7 + 1 = 46}}, के लिए अग्रणी {{math|1=''U<sub>H</sub>'' = 46 − 21 = 25}}.
:: खरगोशों द्वारा प्राप्त क्रमों का योग {{math|1=11 + 10 + 9 + 8 + 7 + 1 = 46}} है, जिससे {{math|1=''U<sub>H</sub>'' = 46 − 21 = 25}} होता है।
<!--
<!--


Line 138: Line 137:


====ρ आँकड़ा ====
====ρ आँकड़ा ====
एक आँकड़ा जिसे ρ कहा जाता है जो यू से रैखिक रूप से संबंधित है और वर्गीकरण के अध्ययन में व्यापक रूप से उपयोग किया जाता है ([[अवधारणा]]ओं से युक्त भेदभाव सीखना), और अन्यत्र,<ref name="H1976" />दिए गए नमूना आकारों के लिए यू को इसके अधिकतम मूल्य से विभाजित करके गणना की जाती है, जो कि सरल है {{math|1=''n''<sub>1</sub>×''n''<sub>2</sub>}}. ρ इस प्रकार दो वितरणों के बीच ओवरलैप का एक गैर-पैरामीट्रिक माप है; यह 0 और 1 के बीच मान ले सकता है, और यह एक अनुमान है {{math|1=P(''Y'' > ''X'') + 0.5 P(''Y'' = ''X'')}}, जहां X और Y दो वितरणों से बेतरतीब ढंग से चुने गए अवलोकन हैं। दोनों चरम मान वितरण के पूर्ण पृथक्करण का प्रतिनिधित्व करते हैं, जबकि 0.5 का ρ पूर्ण ओवरलैप का प्रतिनिधित्व करता है। ρ आँकड़ों की उपयोगिता ऊपर उपयोग किए गए विषम उदाहरण के मामले में देखी जा सकती है, जहाँ दो वितरण जो मान-व्हिटनी यू परीक्षण पर काफी भिन्न थे, फिर भी लगभग समान माध्यक थे: इस मामले में ρ मान लगभग 0.723 के पक्ष में है खरगोशों का, इस तथ्य को सही ढंग से दर्शाता है कि भले ही मध्य कछुआ मध्य खरगोश को हरा देता है, सामूहिक रूप से कछुओं की तुलना में सामूहिक रूप से खरगोशों ने बेहतर किया।{{citation needed|date=February 2012}}
एक आँकड़ा जिसे ρ कहा जाता है जो यू से रैखिक रूप से संबंधित है और वर्गीकरण के अध्ययन में व्यापक रूप से उपयोग किया जाता है ([[discrimination learning]] involving [[concept]]s)ओं से युक्त भेदभाव सीखना), और अन्यत्र,<ref name="H1976" />दिए गए नमूना आकारों के लिए यू को इसके अधिकतम मूल्य से विभाजित करके गणना की जाती है, जो कि सरल है {{math|1=''n''<sub>1</sub>×''n''<sub>2</sub>}}. ρ इस प्रकार दो वितरणों के बीच ओवरलैप का एक गैर-पैरामीट्रिक माप है; यह 0 और 1 के बीच मान ले सकता है, और यह एक अनुमान है {{math|1=P(''Y'' > ''X'') + 0.5 P(''Y'' = ''X'')}}, जहां X और Y दो वितरणों से बेतरतीब ढंग से चुने गए अवलोकन हैं। दोनों चरम मान वितरण के पूर्ण पृथक्करण का प्रतिनिधित्व करते हैं, जबकि 0.5 का ρ पूर्ण ओवरलैप का प्रतिनिधित्व करता है। ρ आँकड़ों की उपयोगिता ऊपर उपयोग किए गए विषम उदाहरण के मामले में देखी जा सकती है, जहाँ दो वितरण जो मान-व्हिटनी यू परीक्षण पर काफी भिन्न थे, फिर भी लगभग समान माध्यक थे: इस मामले में ρ मान लगभग 0.723 के पक्ष में है खरगोशों का, इस तथ्य को सही ढंग से दर्शाता है कि भले ही मध्य कछुआ मध्य खरगोश को हरा देता है, सामूहिक रूप से कछुओं की तुलना में सामूहिक रूप से खरगोशों ने बेहतर किया।{{citation needed|date=February 2012}}


=== रैंक-द्विक्रमिक सहसंबंध ===
=== रैंक-द्विक्रमिक सहसंबंध ===
Line 190: Line 189:
* आर पैकेज [https://rdrr.io/cran/rcompanion/man/wilcoxonZ.html {{mono|wilcoxonZ}}] विलकॉक्सन दो-नमूना, युग्मित, या एक-नमूना परीक्षण के लिए z आँकड़ा की गणना करेगा।
* आर पैकेज [https://rdrr.io/cran/rcompanion/man/wilcoxonZ.html {{mono|wilcoxonZ}}] विलकॉक्सन दो-नमूना, युग्मित, या एक-नमूना परीक्षण के लिए z आँकड़ा की गणना करेगा।
* SAS (सॉफ्टवेयर) अपनी PROC NPAR1WAY प्रक्रिया में परीक्षण को लागू करता है।
* SAS (सॉफ्टवेयर) अपनी PROC NPAR1WAY प्रक्रिया में परीक्षण को लागू करता है।
* [[पायथन (प्रोग्रामिंग भाषा)]] में [[SciPy]] द्वारा प्रदान किए गए इस परीक्षण का कार्यान्वयन है<ref>{{cite web |url=http://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.mannwhitneyu.html |title=scipy.stats.mannwhitneyu|work=SciPy v0.16.0 Reference Guide |author=<!--Staff writer(s); no by-line.--> |date=24 July 2015 |publisher=The Scipy community |access-date=11 September 2015 |quote=scipy.stats.mannwhitneyu(x, y, use_continuity=True): Computes the Mann–Whitney rank test on samples&nbsp;x and&nbsp;y.}}</ref>
* [[पायथन (प्रोग्रामिंग भाषा)]] में [[SciPy]] द्वारा प्रदान किए गए इस परीक्षण का कार्यान्वयन है<ref>{{cite web |url=http://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.mannwhitneyu.html |title=scipy.stats.mannwhitneyu|work=SciPy v0.16.0 Reference Guide |author=<!--Staff writer(s); no by-line.-->
* [[सिग्मास्टैट]] (एसपीएसएस इंक, शिकागो, आईएल)
== सॉफ्टवेयर कार्यान्वयन ==
* SYSTAT (सांख्यिकी) (SPSS Inc., शिकागो, IL)
कई सॉफ़्टवेयर संवेष्टको में, मैन-व्हिटनी U परीक्षण (उचित विकल्पों के विरुद्ध समान वितरण की परिकल्पना) को अनुचित तरीके से प्रलेखित किया गया है। कुछ संवेष्टक संबंधों का अनुचित तरीके से विवेचन करते हैं या स्पर्शोन्मुख तकनीकों (उदाहरण के लिए, निरंतरता के लिए सुधार) का दस्तावेज़ीकरण करने में विफल रहते हैं। 2000 की समीक्षा में निम्नलिखित कुछ संवेष्टको पर चर्चा की गईː
*[[सिग्मास्टैट]] (एसपीएसएस इंक, शिकागो, आईएल)
* सिस्टैट (एसपीएसएस इंक., शिकागो, आईएल)
* [[जावा (प्रोग्रामिंग भाषा)]] में [[अपाचे कॉमन्स]] द्वारा प्रदान किए गए इस परीक्षण का कार्यान्वयन है<ref>{{Cite web|url=http://commons.apache.org/proper/commons-math/javadocs/api-3.3/org/apache/commons/math3/stat/inference/MannWhitneyUTest.html|title=MannWhitneyUTest (Apache Commons Math 3.3 API)|website=commons.apache.org}}</ref>
* [[जावा (प्रोग्रामिंग भाषा)]] में [[अपाचे कॉमन्स]] द्वारा प्रदान किए गए इस परीक्षण का कार्यान्वयन है<ref>{{Cite web|url=http://commons.apache.org/proper/commons-math/javadocs/api-3.3/org/apache/commons/math3/stat/inference/MannWhitneyUTest.html|title=MannWhitneyUTest (Apache Commons Math 3.3 API)|website=commons.apache.org}}</ref>
*[[ जूलिया (प्रोग्रामिंग भाषा) ]] के पास कई पैकेजों के माध्यम से इस परीक्षण का कार्यान्वयन है। पैकेज HypothesisTests.jl में, यह pvalue(MannWhitneyUTest(X, Y)) के रूप में पाया जाता है<ref>{{Cite web|url=https://github.com/JuliaStats/HypothesisTests.jl|title=JuliaStats/HypothesisTests.jl|website=GitHub|date=30 May 2021}}</ref>
*[[ जूलिया (प्रोग्रामिंग भाषा) | जूलिया (प्रोग्रामिंग भाषा)]] के पास कई संवेष्टको के माध्यम से इस परीक्षण का कार्यान्वयन है। हाइपोथिसिसटेस्ट.जेएल संवेष्टक में, यह p मान (मैनव्हिटनी U परीक्षण(X, Y)) के रूप में पाया जाता है<ref>{{Cite web|url=https://github.com/JuliaStats/HypothesisTests.jl|title=JuliaStats/HypothesisTests.jl|website=GitHub|date=30 May 2021}}</ref>
* [[जेएमपी (सांख्यिकीय सॉफ्टवेयर)]] (एसएएस इंस्टीट्यूट इंक, कैरी, एनसी)
* [[जेएमपी (सांख्यिकीय सॉफ्टवेयर)|जेएमपी]] (एसएएस इंस्टीट्यूट इंक, कैरी, एनसी)
* [[ एस प्लस ]] (मैथसॉफ्ट, इंक।, सिएटल, डब्ल्यूए)
* [[ एस प्लस | S-प्लस]] (मैथसॉफ्ट, इंक, सिएटल, डब्ल्यूए)
* [[आंकड़े]] (स्टेटसॉफ्ट, इंक।, तुलसा, ओके)
* [[आंकड़े|स्टेटिस्टिका]] (स्टेटसॉफ्ट, इंक, तुलसा, ओके)
* [[सपना देखना]] (यूनिस्टैट लिमिटेड, लंदन)
* यूनिस्टैट (यूनिस्टैट लिमिटेड, लंदन)
* [[एसपीएसएस]] (एसपीएसएस इंक, शिकागो)
* [[एसपीएसएस]] (एसपीएसएस इंक, शिकागो)
* [[ आँकड़े प्रत्यक्ष ]] (स्टैट्सडायरेक्ट लिमिटेड, मैनचेस्टर, यूके) [http://www.statsdirect.com/help/Default.htm#nonparametric_methods/mann_whitney.htm सभी सामान्य संस्करण] लागू करता है।
* [[ आँकड़े प्रत्यक्ष |स्टैट्सडायरेक्ट]] (स्टैट्सडायरेक्ट लिमिटेड, मैनचेस्टर, यूके) [http://www.statsdirect.com/help/Default.htm#nonparametric_methods/mann_whitney.htm सभी सामान्य संस्करण] अनुप्रयुक्त करता है।
* [[था]] (स्टाटा कॉर्पोरेशन, कॉलेज स्टेशन, TX) अपने [https://www.stata.com/help.cgi?ranksum रैंकसम] कमांड में परीक्षण को लागू करता है।
* स्टाटा (स्टाटा निगम, विद्यापीठ स्थान, टीएक्स) अपने [https://www.stata.com/help.cgi?ranksum रैंकसम] संकेत में परीक्षण को अनुप्रयुक्त करता है।
* [[स्टेटएक्सएक्ट]] (साइटेल सॉफ्टवेयर कॉर्पोरेशन, कैम्ब्रिज, मैसाचुसेट्स)
* [[स्टेटएक्सएक्ट]] (साइटेल सॉफ्टवेयर निगम, कैम्ब्रिज, मैसाचुसेट्स)
* [[PSPP]] अपने [https://www.gnu.org/software/pspp/manual/html_node/WILCOXON.html WILCOXON] फंक्शन में परीक्षण को लागू करता है।
* पीएसपीपी और विलकॉक्सन प्रकार्य में परीक्षण को अनुप्रयुक्त करता है।
* [[KNIME]] अपने [https://hub.knime.com/knime/extensions/org.knime.features.stats2/latest/org.knime.base.node.stats.testing.wilcoxonmannwhitney.WilcoxonMannWhitneyNodeFactory Wilcoxon-Mann में परीक्षण लागू करता है। -व्हिटनी टेस्ट] नोड।
* [[KNIME|केएनआईएमई]] अपने [https://hub.knime.com/knime/extensions/org.knime.features.stats2/latest/org.knime.base.node.stats.testing.wilcoxonmannwhitney.WilcoxonMannWhitneyNodeFactory विलकॉक्सन-मैन-व्हिटनी नोड में परीक्षण]  अनुप्रयुक्त करता है।


== इतिहास ==
== इतिहास ==


आँकड़ा 1914 के एक लेख में दिखाई दिया<ref name="Kruskal57">{{cite journal |jstor=2280906 |title=विलकॉक्सन अनपेयर्ड टू-सैंपल टेस्ट पर ऐतिहासिक नोट्स|last=Kruskal |first=William&nbsp;H. |journal=Journal of the American Statistical Association |date=September 1957 |volume=52 |issue=279 |pages=356–360 |doi=10.2307/2280906}}</ref> जर्मन गुस्ताव ड्यूक्लर द्वारा (विचरण में लापता शब्द के साथ)।
यह प्रतिदर्शज 1914 में जर्मन गुस्ताव देउक्लर के लेख<ref name="Kruskal57">{{cite journal |jstor=2280906 |title=Historical Notes on the Wilcoxon Unpaired Two-Sample Test |last=Kruskal |first=William&nbsp;H. |journal=Journal of the American Statistical Association |date=September 1957 |volume=52 |issue=279 |pages=356–360 |doi=10.2307/2280906}}</ref>में छपा (विचरण में एक लुप्त शब्द के साथ) है।
 
1945 में एक एकल पत्र में, फ्रैंक विलकॉक्सन ने <ref name="wilcoxon1945">{{cite journal |doi=10.2307/3001968 |last=Wilcoxon |first=Frank |author-link=Frank Wilcoxon |year=1945 |title=Individual comparisons by ranking methods |journal=[[Biometrics Bulletin]] |volume=1 |issue=6 |pages=80–83 |jstor=3001968 |hdl=10338.dmlcz/135688 |hdl-access=free }}</ref> एक-प्रतिदर्श चिह्‍नत क्रम और दो-प्रतिदर्श क्रम योग परीक्षण दोनों का प्रस्ताव रखा, इसके पूरक विकल्प के विरुद्ध एक बिंदु शून्य-परिकल्पना के साथ महत्व के परीक्षण में (अर्थात्, बराबर बनाम बराबर नहीं) है। हालाँकि, उन्होंने उस लेख्य में समान-प्रतिदर्श आकार की स्थिति के लिए केवल कुछ बिंदुओं को सारणीबद्ध किया था (हालांकि बाद के एक लेख्य में उन्होंने बड़ी तालिकाएँ दी थीं)।
 
प्रतिदर्शज का गहन विश्लेषण, जिसमें यादृच्छिक रूप से प्रतिदर्श आकारों के लिए पश्च संभावनाओं की गणना की अनुमति देने वाली पुनरावृत्ति सम्मिलित थी और आठ या उससे कम के प्रतिदर्श आकारों के लिए तालिकाएँ 1947 में हेनरी मान और उनके छात्र डोनाल्ड रैनसम व्हिटनी के लेख में दिखाई दीं।<!-- source: Olson, cited with url link in Mann article --><ref name="mannwhitney1947">{{cite journal |first1=Henry&nbsp;B. |last1=Mann |author-link=Henry Mann |first2=Donald&nbsp;R. |last2=Whitney |title=On a Test of Whether one of Two Random Variables is Stochastically Larger than the Other |journal=[[Annals of Mathematical Statistics]] |volume=18 |issue=1 |year=1947 |pages=50–60 |doi=10.1214/aoms/1177730491 |mr=22058 |zbl=0041.26103 |doi-access=free }}</ref> इस लेख में वैकल्पिक परिकल्पनाओं पर चर्चा की गई है, जिसमें एक प्रसंभाव्य क्रमीकरण सम्मिलित है (जहां [[संचयी वितरण कार्य]] बिंदुवार असमानता {{math|1=''F''<sub>''X''</sub>(''t'') < ''F''<sub>''Y''</sub>(''t'')}}) को संतुष्ट करते हैं। इस लेख्य ने पहले चार क्षणों की भी गणना की और अशक्त परिकल्पना के अंतर्गत सांख्यिकी की सीमित सामान्यता को स्थापित किया, ताकि यह स्थापित हो सके कि यह असमान रूप से वितरण-मुक्त है।
 
 
 
 
 
 
 
 
 


1945 में एक एकल पत्र में, [[फ्रैंक विलकॉक्सन]] ने प्रस्तावित किया था <ref name="wilcoxon1945">{{cite journal |doi=10.2307/3001968 |last=Wilcoxon |first=Frank |author-link=Frank Wilcoxon |year=1945 |title=रैंकिंग विधियों द्वारा व्यक्तिगत तुलना|journal=[[Biometrics Bulletin]] |volume=1 |issue=6 |pages=80–83 |jstor=3001968 |hdl=10338.dmlcz/135688 |hdl-access=free }}</ref> एक-नमूना हस्ताक्षरित रैंक और दो-नमूना रैंक योग परीक्षण, इसके पूरक विकल्प के खिलाफ एक बिंदु शून्य-परिकल्पना के साथ महत्व के परीक्षण में (यानी, बराबर बनाम बराबर नहीं)। हालाँकि, उन्होंने उस पेपर में समान-नमूना आकार के मामले के लिए केवल कुछ बिंदुओं को सारणीबद्ध किया (हालांकि बाद के एक पेपर में उन्होंने बड़ी टेबल दी)।


आँकड़ों का गहन विश्लेषण, जिसमें आठ या उससे कम के नमूने के आकार के लिए मनमाना नमूना आकार और तालिकाओं के लिए पूंछ की संभावनाओं की गणना की अनुमति देने वाली पुनरावृत्ति शामिल थी, हेनरी मान और उनके छात्र द्वारा लेख में दिखाई दिया।<!-- source: Olson, cited with url link in Mann article --> 1947 में डोनाल्ड रैनसम व्हिटनी।<ref name="mannwhitney1947">{{cite journal |first1=Henry&nbsp;B. |last1=Mann |author-link=Henry Mann |first2=Donald&nbsp;R. |last2=Whitney |title=दो रैंडम वेरिएबल्स में से एक दूसरे की तुलना में स्टोचैस्टिक रूप से बड़ा है या नहीं, इसके परीक्षण पर|journal=[[Annals of Mathematical Statistics]] |volume=18 |issue=1 |year=1947 |pages=50–60 |doi=10.1214/aoms/1177730491 |mr=22058 |zbl=0041.26103 |doi-access=free }}</ref> इस लेख में वैकल्पिक परिकल्पनाओं पर चर्चा की गई है, जिसमें एक स्टोकेस्टिक ऑर्डरिंग शामिल है (जहां [[संचयी वितरण कार्य]] बिंदुवार असमानता को संतुष्ट करते हैं {{math|1=''F''<sub>''X''</sub>(''t'') < ''F''<sub>''Y''</sub>(''t'')}}). इस पेपर ने पहले चार क्षणों की भी गणना की और अशक्त परिकल्पना के तहत सांख्यिकी की सीमित सामान्यता को स्थापित किया, ताकि यह स्थापित हो सके कि यह असमान रूप से वितरण-मुक्त है।


== यह भी देखें ==
== यह भी देखें ==
Line 218: Line 230:
* [[कुकोनी परीक्षण]]
* [[कुकोनी परीक्षण]]
* कोलमोगोरोव-स्मिर्नोव परीक्षण
* कोलमोगोरोव-स्मिर्नोव परीक्षण
* विलकॉक्सन साइन-रैंक टेस्ट
* विलकॉक्सन चिह्‍नत-क्रम परीक्षण
* क्रुस्कल-वालिस विचरण का एकतरफा विश्लेषण
* क्रुस्कल-वालिस विचरण का एकदिशिक विश्लेषण
* ब्रूनर-मुंजेल परीक्षण
* ब्रूनर-मुंजेल परीक्षण
* आनुपातिक बाधाओं मॉडल
* आनुपातिक अंतर प्रतिरूप


==टिप्पणियाँ==
==टिप्पणियाँ==
Line 245: Line 257:
* [http://core.ecu.edu/psyc/wuenschk/docs30/Nonparametric-EffectSize.pdf Brief guide by experimental psychologist Karl&nbsp;L. Weunsch] – Nonparametric effect size estimators (Copyright 2015 by Karl&nbsp;L. Weunsch)
* [http://core.ecu.edu/psyc/wuenschk/docs30/Nonparametric-EffectSize.pdf Brief guide by experimental psychologist Karl&nbsp;L. Weunsch] – Nonparametric effect size estimators (Copyright 2015 by Karl&nbsp;L. Weunsch)


{{statistics|inference}}
{{DEFAULTSORT:Mann-Whitney U}}
 
{{DEFAULTSORT:Mann-Whitney U}}[[Category: सांख्यिकीय परीक्षण]] [[Category: गैर पैरामीट्रिक आँकड़े]] [[Category: यू-सांख्यिकी]]
 
 


[[Category: Machine Translated Page]]
[[Category:Collapse templates|Mann-Whitney U]]
[[Category:Created On 31/05/2023]]
[[Category:Created On 31/05/2023|Mann-Whitney U]]
[[Category:Lua-based templates|Mann-Whitney U]]
[[Category:Machine Translated Page|Mann-Whitney U]]
[[Category:Navigational boxes| ]]
[[Category:Navigational boxes without horizontal lists|Mann-Whitney U]]
[[Category:Pages with empty portal template|Mann-Whitney U]]
[[Category:Pages with reference errors|Mann-Whitney U]]
[[Category:Pages with script errors|Mann-Whitney U]]
[[Category:Portal-inline template with redlinked portals|Mann-Whitney U]]
[[Category:Short description with empty Wikidata description|Mann-Whitney U]]
[[Category:Sidebars with styles needing conversion|Mann-Whitney U]]
[[Category:Template documentation pages|Documentation/doc]]
[[Category:Templates Vigyan Ready|Mann-Whitney U]]
[[Category:Templates generating microformats|Mann-Whitney U]]
[[Category:Templates that add a tracking category|Mann-Whitney U]]
[[Category:Templates that are not mobile friendly|Mann-Whitney U]]
[[Category:Templates that generate short descriptions|Mann-Whitney U]]
[[Category:Templates using TemplateData|Mann-Whitney U]]
[[Category:Wikipedia metatemplates|Mann-Whitney U]]

Latest revision as of 16:44, 7 November 2023

आँकड़ों में, मान-व्हिटनी U परीक्षण (जिसे मान-व्हिटनी-विलकॉक्सन (एमडब्ल्यूडब्ल्यू/एमडब्ल्यूयू), विल्कोक्सन क्रम-योग परीक्षण या विल्कोक्सन-मान-व्हिटनी परीक्षण भी कहा जाता है) शून्य परिकल्पना का एक अप्राचली सांख्यिकी परीक्षण है। जो यादृच्छिक रूप से, दो जनों से चयनित मान X और Y, X के Y से अधिक होने की संभावना, Y के X से अधिक होने की संभावना के बराबर है।

दो आश्रित प्रतिदर्शो पर उपयोग किए जाने वाले अप्राचली परीक्षण चिह्न परीक्षण और विल्कोक्सन चिह्न-क्रम परीक्षण हैं।

धारणाएं और परिकल्पनाओं का औपचारिक विवरण

यद्यपि मान और व्हिटनी[1]ने वैकल्पिक परिकल्पना के साथ निरंतर प्रतिक्रियाओं की धारणा के अंतर्गत मान-व्हिटनी U परीक्षण विकसित किया है कि एक वितरण दूसरे की तुलना में स्टोकेस्टिक रूप से अधिक है, शून्य परिकल्पना और वैकल्पिक परिकल्पना तैयार करने के कई अन्य तरीके हैं जैसे मान-व्हिटनी U परीक्षण एक वैध परीक्षण देगा।[2]

एक बहुत ही सामान्य सूत्रीकरण यह मान लेना है कि:

  1. दोनों समूहों के सभी अवलोकन एक दूसरे से स्वतंत्र हैं,
  2. प्रतिक्रियाएँ कम-से-कम क्रमिक हैं (अर्थात्, कम-से-कम यह कह सकते हैं कि किन्हीं दो प्रेक्षणों में से कौन अधिक है),
  3. शून्य परिकल्पना के अंतर्गत H0, दोनों जनों का वितरण समान है।[3]
  4. वैकल्पिक परिकल्पना H1 यह है कि वितरण समान नहीं हैं।

सामान्य सूत्रीकरण के अंतर्गत, परीक्षण केवल तभी सुसंगत होता है जब H1 के अंतर्गत निम्नलिखित होता है:

  1. जनसंख्या X के किसी अवलोकन की जनसंख्या Y के अवलोकन से अधिक होने की संभावना Y के किसी अवलोकन की जनसंख्या; अर्थात, P(X > Y) ≠ P(Y > X) या P(X > Y) + 0.5 · P(X = Y) ≠ 0.5 हैं।
  2. उपरोक्त सामान्य सूत्रीकरण की तुलना में अधिक पूर्णतः मान्यताओं के अंतर्गत, उदाहरण के लिए, यदि प्रतिक्रियाओं को निरंतर माना जाता है और विकल्प को स्थान परिवर्तन तक सीमित रखा जाता है, अर्थात, F1(x) = F2(x + δ), तो हम एक महत्वपूर्ण व्याख्या कर सकते हैं मान-व्हिटनी U परीक्षण मध्यस्थों में अंतर दर्शाता है। इस स्थान परिवर्तन की धारणा के अंतर्गत, हम मान-व्हिटनी U परीक्षण की व्याख्या यह आकलन करने के लिए भी कर सकते हैं कि क्या दो जनों के मध्य केंद्रीय प्रवृत्ति में अंतर का होजेस-लेहमैन अनुमान शून्य से भिन्न है। इस दो-प्रतिदर्श समस्याओं के लिए होजेस-लेहमैन का अनुमान पहले प्रतिदर्श में एक अवलोकन और दूसरे प्रतिदर्श में एक अवलोकन के मध्य सभी संभावित अंतरों का माध्य है।

अन्यथा, यदि दोनों प्रतिदर्शों के परिक्षेपण और वितरण के आकार भिन्न हैं, तो मान-व्हिटनी U परीक्षण मध्यस्थों के परीक्षण में विफल रहता है। ऐसे उदाहरण दिखाना संभव है जहां माध्यिकाएं संख्यात्मक रूप से बराबर होती हैं, जबकि परीक्षण एक छोटे p-मान के साथ शून्य परिकल्पना को अस्वीकार करता है।[4] [5] [6]

मान-व्हिटनी U परीक्षण/विल्कोक्सन क्रम-योग परीक्षण विल्कोक्सन चिह्न-क्रम परीक्षण के समान नहीं है, हालांकि दोनों अप्राचली सांख्यिकी हैं और इसमें क्रमों का योग सम्मिलित है। मान-व्हिटनी U परीक्षण स्वतंत्र प्रतिदर्शों पर अनुप्रयुक्त किया जाता है। विल्कोक्सन चिह्न-क्रम परीक्षण सुमेलित या आश्रित प्रतिदर्शों पर अनुप्रयुक्त किया जाता है।

U प्रतिदर्शज

मान लीजिए कि एक आई.आई.डी से प्रतिदर्श और एक आई.आई.डी. से प्रतिदर्श है सेऔर दोनों प्रतिदर्श एक दूसरे से स्वतंत्र हैं। संबंधित मान-व्हिटनी U सांख्यिकी को इस प्रकार परिभाषित किया गया हैː

के साथ


आरओसी वक्रों के लिए क्षेत्र के अंतर्गत वक्र (AUC) प्रतिदर्शज

U प्रतिदर्शज गृहीता प्रचालन विशेषता वक्र (AUC) के अंतर्गत क्षेत्र के बराबर है जिसकी गणना सरलता से की जा सकती है।[7][8]

ध्यान दें कि यह उपरोक्त अनुभाग से सामान्य भाषा प्रभाव आकार के समान परिभाषा है। अर्थात: संभावना है कि एक वर्गीकरणकर्ता यादृच्छिक रूप से चुने गए धनात्मक उदाहरण को यादृच्छिक रूप से चुने गए ऋणात्मक से अधिक क्रम देगा (यह मानते हुए कि 'धनात्मक' क्रम 'ऋणात्मक' से अधिक है)।[9]

इसके संभाव्य रूप के कारण, U सांख्यिकी को दो से अधिक वर्गों के लिए वर्गीकरणकर्ता की पृथक्करण शक्ति के माप के लिए सामान्यीकृत किया जा सकता है:[10]

जहाँ c वर्गों की संख्या है और Rk,ℓ , AUCk, का पद, ℓ केवल वर्ग k और ℓ से संबंधित वस्तुओं के श्रेणीक्रम पर विचार करता है (अर्थात, अन्य सभी वर्गों से संबंधित वस्तुओं को अवहेलना कर दिया जाता है) वर्गीकरणकर्ता के अनुमान के अनुसार कक्षा k से संबंधित उन वस्तुओं की संभावना है। AUCk,k सदैव शून्य होगा, परन्तु, दो-वर्गों की स्थिति के विपरीत, सामान्यतः AUCk, ≠ AUC,k, यही कारण है कि M, AUC,k और AUCk, के औसत का उपयोग करते हुए, सभी (k,ℓ) युग्मों का योग मापता है।

गणना

परीक्षण में एक प्रतिदर्शज की गणना सम्मिलित है, जिसे सामान्यतः U कहा जाता है, जिसका वितरण शून्य परिकल्पना के अंतर्गत जाना जाता है। छोटे प्रतिदर्शों की स्थिति में, वितरण सारणीबद्ध है, परन्तु ~20 से ऊपर के प्रतिदर्श आकारों के लिए, सामान्य वितरण का उपयोग करके अनुमान लगाना काफी अच्छा है। कुछ पुस्तकें U के समतुल्य आँकड़ों को सारणीबद्ध करती हैं, जैसे कि U के बजाय प्रतिदर्शों में से एक में क्रम का योग हैं।

मान-व्हिटनी U अधिकांश आधुनिक सांख्यिकीय संवेष्टको में सम्मिलित है। विशेषकर छोटे प्रतिदर्शों के लिए, इसकी गणना हाथ से भी सरलता से की जा सकती है। इसे करने की दो विधियाँ हैं।

पहली विधिː

प्रेक्षणों के दो छोटे समुच्चयों की तुलना करने के लिए, एक प्रत्यक्ष विधि त्वरित है और U सांख्यिकी के अर्थ में अंतर्दृष्टि देती है, जो सभी युग्‍मानूसार प्रतियोगिताओं में जीत की संख्या से मेल खाती है (नीचे दिए गए उदाहरणों के अंतर्गत कछुआ और खरगोश का उदाहरण देखें)। एक समुच्चय में प्रत्येक अवलोकन के लिए, दूसरे समुच्चय में किसी भी अवलोकन पर यह पहला मान जीतने की संख्या की गणना करें (यदि यह पहला बड़ा है तो दूसरा मान हार जाता है)। किसी भी प्रतियोगिता के लिए 0.5 की गणना करें। पहले समुच्चय के लिए, जीत और प्रतियोगिता का योग U (अर्थात: ) है। दूसरे समुच्चय के लिए U (अर्थात: ) इसका विपरीत है।

द्वितीय विधि:

बड़े प्रतिदर्शों के लिए:

  1. सभी अवलोकनों के लिए संख्यात्मक क्रम निर्दिष्ट करें (दोनों समूहों से अवलोकनों को एक समुच्चय में रखें), सबसे छोटे मान के लिए 1 से प्रारंभ करें। जहां बंधे हुए मानों के समूह हैं, असमायोजित श्रेणीक्रम के मध्य बिंदु के बराबर एक क्रम निर्दिष्ट करें (उदाहरण के लिए, (3, 5, 5, 5, 5, 8) का क्रम (1, 3.5, 3.5, 3.5, 3.5, 6) हैं, जहां असमायोजित क्रम (1, 2, 3, 4, 5, 6)) होगा।
  2. अब, प्रतिदर्श 1 से प्राप्त अवलोकनों के लिए क्रम जोड़ें। प्रतिदर्श 2 में क्रमों का योग अब निर्धारित किया गया है, क्योंकि सभी क्रमों का योग N(N + 1)/2 के बराबर है जहां N प्रेक्षणों की कुल संख्या है।
  3. फिर U द्वारा दिया गया है:[11]
जहां n1 प्रतिदर्श 1 के लिए प्रतिदर्श आकार है और R1 प्रतिदर्श 1 में क्रमों का योग है।
ध्यान दें कि इससे कोई फर्क नहीं पड़ता कि दो प्रतिदर्शों में से किसे प्रतिदर्श 1 माना जाता है। U के लिए एक समान रूप से मान्य सूत्र है
U1 और U2 का छोटा मान महत्व तालिकाओं से परामर्श करते समय उपयोग किया जाता है। दो मानों का योग किसके द्वारा दिया गया हैː
यह जानते हुए कि R1 + R2 = N(N + 1)/2 और N = n1 + n2, और कुछ बीजगणित करने पर, हम पाते हैं कि योग हैː
U1 + U2 = n1n2.

गुणधर्म

U का अधिकतम मान दो प्रतिदर्शों (अर्थात: ) के लिए प्रतिदर्श आकार का उत्पाद है, ऐसी स्थिति में, अन्य U, 0 होगा।

उदाहरण

गणना विधियों का उदाहरण

मान लीजिए कि ईसप अपने उत्कृष्ट प्रयोग से असंतुष्ट है जिसमें एक कछुआ दौड़ में एक खरगोश को हराता पाया गया था और यह पता लगाने के लिए एक महत्व परीक्षण करने का निश्चय करता है कि क्या परिणाम सामान्य रूप से कछुओं और खरगोशों तक बढ़ाए जा सकते हैं। वह 6 कछुओं और 6 खरगोशों का एक प्रतिदर्श एकत्र करता है और उन सभी को एक ही बार में अपनी दौड़ में दौड़ाता है। जिस क्रम में वे समापन पद तक पहुँचते हैं (उनका स्थिति क्रम, समापन रेखा को पार करने वाली पहली से आखिरी तक) इस प्रकार है, एक कछुए के लिए T और एक खरगोश के लिए H लिखना है:

T H H H H H T T T T T H

U का मान क्या है?

  • प्रत्यक्ष विधि का उपयोग करते हुए, हम प्रत्येक कछुए को बारी-बारी से लेते हैं और उसके द्वारा मारे गए खरगोशों की संख्या गिनते हैं, जिससे 6, 1, 1, 1, 1, 1 प्राप्त होता है, जिसका अर्थ, UT = 11 है। वैकल्पिक रूप से, हम प्रत्येक खरगोश को बारी-बारी से ले सकते हैं और यह गणना करें कि यह कितने कछुओं को हराता है। इस स्थिति में, हमें 5, 5, 5, 5, 5, 0 मिलता है इसलिए UH = 25 है। ध्यान दें कि U के लिए इन दो मानों का योग = 36 है, जो 6×6 है।
  • अप्रत्यक्ष विधि का उपयोग करना:
जानवरों को पाठ्यक्रम पूर्ण करने में लगने वाले समय तक क्रम दें, इसलिए पहले जानवर को आवास क्रम 12, दूसरे क्रम को 11 दें, इत्यादि।
कछुओं द्वारा प्राप्त क्रमों का योग 12 + 6 + 5 + 4 + 3 + 2 = 32 है।
इसलिए UT = 32 − (6×7)/2 = 32 − 21 = 11 (विधि एक के समान) है।
खरगोशों द्वारा प्राप्त क्रमों का योग 11 + 10 + 9 + 8 + 7 + 1 = 46 है, जिससे UH = 46 − 21 = 25 होता है।

सॉफ्टवेयर कार्यान्वयन

कई सॉफ़्टवेयर संवेष्टको में, मैन-व्हिटनी U परीक्षण (उचित विकल्पों के विरुद्ध समान वितरण की परिकल्पना) को अनुचित तरीके से प्रलेखित किया गया है। कुछ संवेष्टक संबंधों का अनुचित तरीके से विवेचन करते हैं या स्पर्शोन्मुख तकनीकों (उदाहरण के लिए, निरंतरता के लिए सुधार) का दस्तावेज़ीकरण करने में विफल रहते हैं। 2000 की समीक्षा में निम्नलिखित कुछ संवेष्टको पर चर्चा की गईː

इतिहास

यह प्रतिदर्शज 1914 में जर्मन गुस्ताव देउक्लर के लेख[14]में छपा (विचरण में एक लुप्त शब्द के साथ) है।

1945 में एक एकल पत्र में, फ्रैंक विलकॉक्सन ने [15] एक-प्रतिदर्श चिह्‍नत क्रम और दो-प्रतिदर्श क्रम योग परीक्षण दोनों का प्रस्ताव रखा, इसके पूरक विकल्प के विरुद्ध एक बिंदु शून्य-परिकल्पना के साथ महत्व के परीक्षण में (अर्थात्, बराबर बनाम बराबर नहीं) है। हालाँकि, उन्होंने उस लेख्य में समान-प्रतिदर्श आकार की स्थिति के लिए केवल कुछ बिंदुओं को सारणीबद्ध किया था (हालांकि बाद के एक लेख्य में उन्होंने बड़ी तालिकाएँ दी थीं)।

प्रतिदर्शज का गहन विश्लेषण, जिसमें यादृच्छिक रूप से प्रतिदर्श आकारों के लिए पश्च संभावनाओं की गणना की अनुमति देने वाली पुनरावृत्ति सम्मिलित थी और आठ या उससे कम के प्रतिदर्श आकारों के लिए तालिकाएँ 1947 में हेनरी मान और उनके छात्र डोनाल्ड रैनसम व्हिटनी के लेख में दिखाई दीं।[1] इस लेख में वैकल्पिक परिकल्पनाओं पर चर्चा की गई है, जिसमें एक प्रसंभाव्य क्रमीकरण सम्मिलित है (जहां संचयी वितरण कार्य बिंदुवार असमानता FX(t) < FY(t)) को संतुष्ट करते हैं। इस लेख्य ने पहले चार क्षणों की भी गणना की और अशक्त परिकल्पना के अंतर्गत सांख्यिकी की सीमित सामान्यता को स्थापित किया, ताकि यह स्थापित हो सके कि यह असमान रूप से वितरण-मुक्त है।







यह भी देखें

  • लेपेज परीक्षण
  • कुकोनी परीक्षण
  • कोलमोगोरोव-स्मिर्नोव परीक्षण
  • विलकॉक्सन चिह्‍नत-क्रम परीक्षण
  • क्रुस्कल-वालिस विचरण का एकदिशिक विश्लेषण
  • ब्रूनर-मुंजेल परीक्षण
  • आनुपातिक अंतर प्रतिरूप

टिप्पणियाँ

  1. 1.0 1.1 Mann, Henry B.; Whitney, Donald R. (1947). "On a Test of Whether one of Two Random Variables is Stochastically Larger than the Other". Annals of Mathematical Statistics. 18 (1): 50–60. doi:10.1214/aoms/1177730491. MR 0022058. Zbl 0041.26103.
  2. Fay, Michael P.; Proschan, Michael A. (2010). "Wilcoxon–Mann–Whitney or t-test? On assumptions for hypothesis tests and multiple interpretations of decision rules". Statistics Surveys. 4: 1–39. doi:10.1214/09-SS051. MR 2595125. PMC 2857732. PMID 20414472.
  3. [1], See Table 2.1 of Pratt (1964) "Robustness of Some Procedures for the Two-Sample Location Problem." Journal of the American Statistical Association. 59 (307): 655–680. If the two distributions are normal with the same mean but different variances, then Pr[X > Y] = Pr[Y < X] but the size of the Mann–Whitney test can be larger than the nominal level. So we cannot define the null hypothesis as Pr[X > Y] = Pr[Y < X] and get a valid test.
  4. Divine, George W.; Norton, H. James; Barón, Anna E.; Juarez-Colunga, Elizabeth (2018). "The Wilcoxon–Mann–Whitney Procedure Fails as a Test of Medians". The American Statistician. 72 (3): 278–286. doi:10.1080/00031305.2017.1305291.
  5. Conroy, Ronán (2012). "What Hypotheses do "Nonparametric" Two-Group Tests Actually Test?". Stata Journal. 12 (2): 182–190. doi:10.1177/1536867X1201200202. S2CID 118445807. Retrieved 24 May 2021.
  6. Hart, Anna (2001). "Mann–Whitney test is not just a test of medians: differences in spread can be important". BMJ. 323 (7309): 391–393. doi:10.1136/bmj.323.7309.391.
  7. Hanley, James A.; McNeil, Barbara J. (1982). "एक रिसीवर ऑपरेटिंग (आरओसी) वक्र विशेषता के तहत क्षेत्र का अर्थ और उपयोग". Radiology. 143 (1): 29–36. doi:10.1148/radiology.143.1.7063747. PMID 7063747.
  8. Mason, Simon J.; Graham, Nicholas E. (2002). "Areas beneath the relative operating characteristics (ROC) and relative operating levels (ROL) curves: Statistical significance and interpretation" (PDF). Quarterly Journal of the Royal Meteorological Society. 128 (584): 2145–2166. Bibcode:2002QJRMS.128.2145M. CiteSeerX 10.1.1.458.8392. doi:10.1256/003590002320603584. S2CID 121841664.
  9. Fawcett, Tom (2006); An introduction to ROC analysis, Pattern Recognition Letters, 27, 861–874.
  10. Hand, David J.; Till, Robert J. (2001). "एकाधिक वर्ग वर्गीकरण समस्याओं के लिए आरओसी वक्र के तहत क्षेत्र का एक सरल सामान्यीकरण". Machine Learning. 45 (2): 171–186. doi:10.1023/A:1010920819831.
  11. Zar, Jerrold H. (1998). बायोस्टैटिस्टिकल विश्लेषण. New Jersey: Prentice Hall International, INC. p. 147. ISBN 978-0-13-082390-8.
  12. "MannWhitneyUTest (Apache Commons Math 3.3 API)". commons.apache.org.
  13. "JuliaStats/HypothesisTests.jl". GitHub. 30 May 2021.
  14. Kruskal, William H. (September 1957). "Historical Notes on the Wilcoxon Unpaired Two-Sample Test". Journal of the American Statistical Association. 52 (279): 356–360. doi:10.2307/2280906. JSTOR 2280906.
  15. Wilcoxon, Frank (1945). "Individual comparisons by ranking methods". Biometrics Bulletin. 1 (6): 80–83. doi:10.2307/3001968. hdl:10338.dmlcz/135688. JSTOR 3001968.
Cite error: <ref> tag with name "H1976" defined in <references> is not used in prior text.


संदर्भ


बाहरी संबंध