मान-व्हिटनी यू परीक्षण: Difference between revisions
(Created page with "{{italic title|string=U}} {{short description|Nonparametric test of the null hypothesis}} आँकड़ों में, मान-व्हिटनी ''यू'' परी...") |
No edit summary |
||
Line 1: | Line 1: | ||
{{italic title|string=U}} | {{italic title|string=U}} | ||
{{short description|Nonparametric test of the null hypothesis}} | {{short description|Nonparametric test of the null hypothesis}} | ||
आँकड़ों में, मान-व्हिटनी '' | आँकड़ों में, मान-व्हिटनी ''U'' परीक्षण (जिसे मान-व्हिटनी-विलकॉक्सन (एमडब्ल्यूडब्ल्यू/एमडब्ल्यूयू), विल्कोक्सन क्रम-योग परीक्षण या विल्कोक्सन-मान-व्हिटनी परीक्षण भी कहा जाता है) शून्य परिकल्पना का एक अप्राचली सांख्यिकी [[सांख्यिकीय परिकल्पना परीक्षण|परीक्षण]] है। जो यादृच्छिक रूप से, दो जनों से चयनित मान X और Y, X के Y से अधिक होने की संभावना, Y के X से अधिक होने की संभावना के बराबर है। | ||
दो ''आश्रित'' | दो ''आश्रित'' प्रतिदर्शो पर उपयोग किए जाने वाले अप्राचली परीक्षण [[ साइन परीक्षण |चिह्न परीक्षण]] और विल्कोक्सन [[ साइन परीक्षण |चिह्न]]-क्रम परीक्षण हैं। | ||
== धारणाएं और परिकल्पनाओं का औपचारिक विवरण == | |||
यद्यपि मान और व्हिटनी<ref name="mannwhitney1947" />ने वैकल्पिक परिकल्पना के साथ निरंतर प्रतिक्रियाओं की धारणा के अंतर्गत मान-व्हिटनी U परीक्षण विकसित किया है कि एक वितरण दूसरे की तुलना में स्टोकेस्टिक रूप से अधिक है, शून्य परिकल्पना और वैकल्पिक परिकल्पना तैयार करने के कई अन्य तरीके हैं जैसे मान-व्हिटनी U परीक्षण एक वैध परीक्षण देगा।<ref name="FayProschan2010">{{cite journal |last1=Fay |first1=Michael P. |last2=Proschan |first2=Michael A. |journal=[[Statistics Surveys]] |year=2010 |pages=1–39 |volume=4 |doi=10.1214/09-SS051 |title=Wilcoxon–Mann–Whitney or ''t''-test? On assumptions for hypothesis tests and multiple interpretations of decision rules |pmc=2857732 |mr=2595125 |pmid=20414472 }}</ref> | |||
एक बहुत ही सामान्य सूत्रीकरण यह मान लेना है कि: | एक बहुत ही सामान्य सूत्रीकरण यह मान लेना है कि: | ||
# दोनों समूहों के सभी अवलोकन एक दूसरे | # दोनों समूहों के सभी अवलोकन एक दूसरे से स्वतंत्र हैं, | ||
# प्रतिक्रियाएँ कम से कम | # प्रतिक्रियाएँ कम-से-कम क्रमिक हैं (अर्थात्, कम-से-कम यह कह सकते हैं कि किन्हीं दो प्रेक्षणों में से कौन अधिक है), | ||
# शून्य परिकल्पना के | # शून्य परिकल्पना के अंतर्गत H<sub>0</sub>, दोनों जनों का वितरण समान है।<ref>[https://www.jstor.org/stable/2283092], See Table 2.1 of Pratt (1964) "Robustness of Some Procedures for the Two-Sample Location Problem." ''Journal of the American Statistical Association.'' 59 (307): 655–680. If the two distributions are normal with the same mean but different variances, then Pr[''X'' > ''Y''] = Pr[''Y'' < ''X''] but the size of the Mann–Whitney test can be larger than the nominal level. So we cannot define the null hypothesis as Pr[''X'' > ''Y''] = Pr[''Y'' < ''X''] and get a valid test.</ref> | ||
# वैकल्पिक परिकल्पना | # वैकल्पिक परिकल्पना H<sub>1</sub> यह है कि वितरण समान नहीं हैं। | ||
सामान्य सूत्रीकरण के | सामान्य सूत्रीकरण के अंतर्गत, परीक्षण केवल तभी सुसंगत होता है जब H<sub>1</sub> के अंतर्गत निम्नलिखित होता है: | ||
# जनसंख्या X | # जनसंख्या X के किसी अवलोकन की जनसंख्या Y के अवलोकन से अधिक होने की संभावना Y के किसी अवलोकन की जनसंख्या; अर्थात।, {{math|1=P(''X'' > ''Y'') ≠ P(''Y'' > ''X'')}} या {{math|1=P(''X'' > ''Y'') + 0.5 · P(''X'' = ''Y'') ≠ 0.5}} हैं। | ||
#उपरोक्त सामान्य सूत्रीकरण की तुलना में अधिक पूर्णतः मान्यताओं के अंतर्गत, उदाहरण के लिए, यदि प्रतिक्रियाओं को निरंतर माना जाता है और विकल्प को स्थान परिवर्तन तक सीमित रखा जाता है, अर्थात, {{math|1=''F''<sub>1</sub>(''x'') = ''F''<sub>2</sub>(''x'' + ''δ'')}}, तो हम एक महत्वपूर्ण व्याख्या कर सकते हैं मान-व्हिटनी U परीक्षण मध्यस्थों में अंतर दर्शाता है। इस स्थान परिवर्तन की धारणा के अंतर्गत, हम मान-व्हिटनी U परीक्षण की व्याख्या यह आकलन करने के लिए भी कर सकते हैं कि क्या दो जनों के मध्य केंद्रीय प्रवृत्ति में अंतर का होजेस-लेहमैन अनुमान शून्य से भिन्न है। इस दो-प्रतिदर्श समस्याओं के लिए होजेस-लेहमैन का अनुमान पहले प्रतिदर्श में एक अवलोकन और दूसरे प्रतिदर्श में एक अवलोकन के मध्य सभी संभावित अंतरों का माध्य है। | |||
अन्यथा, यदि दोनों प्रतिदर्शों के परिक्षेपण और वितरण के आकार भिन्न हैं, तो मान-व्हिटनी U परीक्षण मध्यस्थों के परीक्षण में विफल रहता है। ऐसे उदाहरण दिखाना संभव है जहां माध्यिकाएं संख्यात्मक रूप से बराबर होती हैं, जबकि परीक्षण एक छोटे p-मान के साथ शून्य परिकल्पना को अस्वीकार करता है।<ref>{{cite journal |last1=Divine |first1=George W. |last2=Norton |first2=H. James |last3=Barón |first3=Anna E. |last4=Juarez-Colunga |first4=Elizabeth |title=The Wilcoxon–Mann–Whitney Procedure Fails as a Test of Medians |journal=The American Statistician |date=2018 |volume=72 |issue=3 |pages=278–286 |doi=10.1080/00031305.2017.1305291 |doi-access=free }}</ref> <ref>{{cite journal |last1=Conroy |first1=Ronán |title=What Hypotheses do "Nonparametric" Two-Group Tests Actually Test? |journal=Stata Journal |date=2012 |volume=12 |issue=2 |pages=182–190 |doi=10.1177/1536867X1201200202 |s2cid=118445807 |url=https://www.researchgate.net/publication/279580873 |access-date=24 May 2021}}</ref> <ref>{{cite journal |last1=Hart |first1=Anna |title=Mann–Whitney test is not just a test of medians: differences in spread can be important |journal=BMJ |date=2001 |volume=323 |issue=7309 |pages=391–393 |doi=10.1136/bmj.323.7309.391 |doi-access=free }}</ref> | |||
मान-व्हिटनी U परीक्षण/विल्कोक्सन क्रम-योग परीक्षण विल्कोक्सन चिह्न-क्रम परीक्षण के समान नहीं है, हालांकि दोनों अप्राचली सांख्यिकी हैं और इसमें क्रमों का योग सम्मिलित है। मान-व्हिटनी U परीक्षण स्वतंत्र प्रतिदर्शों पर अनुप्रयुक्त किया जाता है। विल्कोक्सन चिह्न-क्रम परीक्षण सुमेलित या आश्रित प्रतिदर्शों पर अनुप्रयुक्त किया जाता है। | |||
== | == U प्रतिदर्शज == | ||
मान लीजिए कि <math>X_1,\ldots, X_n</math> एक आई.आई.डी <math>X</math> से प्रतिदर्श और <math>Y_1,\ldots, Y_m</math> एक आई.आई.डी. <math>Y</math> से प्रतिदर्श है सेऔर दोनों प्रतिदर्श एक दूसरे से स्वतंत्र हैं। संबंधित मान-व्हिटनी U सांख्यिकी को इस प्रकार परिभाषित किया गया हैː | |||
:<math>U = \sum_{i=1}^n \sum_{j=1}^m S(X_i,Y_j),</math> | :<math>U = \sum_{i=1}^n \sum_{j=1}^m S(X_i,Y_j),</math> | ||
साथ | के साथ | ||
:<math>S(X,Y) = \begin{cases} | :<math>S(X,Y) = \begin{cases} | ||
1, &\text{if } X > Y, \\ | 1, &\text{if } X > Y, \\ | ||
Line 34: | Line 36: | ||
=== आरओसी वक्रों के लिए | === आरओसी वक्रों के लिए क्षेत्र के अंतर्गत वक्र (AUC) प्रतिदर्शज === | ||
U प्रतिदर्शज गृहीता प्रचालन विशेषता वक्र (AUC) के अंतर्गत क्षेत्र के बराबर है जिसकी गणना सरलता से की जा सकती है।<ref name="Hanley">{{cite journal |last1=Hanley |first1=James A. |last2=McNeil |first2=Barbara J. |author-link2=Barbara Joyce McNeil |year=1982 |title=एक रिसीवर ऑपरेटिंग (आरओसी) वक्र विशेषता के तहत क्षेत्र का अर्थ और उपयोग|journal=Radiology |volume=143 |pages=29–36 |doi=10.1148/radiology.143.1.7063747 |pmid=7063747 |number=1}}</ref><ref name="Mason">{{cite journal |last1=Mason |first1=Simon J. |last2=Graham |first2=Nicholas E. |year=2002 |title=Areas beneath the relative operating characteristics (ROC) and relative operating levels (ROL) curves: Statistical significance and interpretation |url=http://www.inmet.gov.br/documentos/cursoI_INMET_IRI/Climate_Information_Course/References/Mason+Graham_2002.pdf |journal=Quarterly Journal of the Royal Meteorological Society |volume=128 |issue=584 |pages=2145–2166 |bibcode=2002QJRMS.128.2145M |citeseerx=10.1.1.458.8392 |doi=10.1256/003590002320603584 |s2cid=121841664}}</ref> | |||
:<math>\mathrm{AUC}_1 = {U_1 \over n_1n_2}</math> | :<math>\mathrm{AUC}_1 = {U_1 \over n_1n_2}</math> | ||
ध्यान दें कि यह उपरोक्त अनुभाग से सामान्य भाषा प्रभाव आकार के समान परिभाषा है। | ध्यान दें कि यह उपरोक्त अनुभाग से सामान्य भाषा प्रभाव आकार के समान परिभाषा है। अर्थात: संभावना है कि एक वर्गीकरणकर्ता यादृच्छिक रूप से चुने गए धनात्मक उदाहरण को यादृच्छिक रूप से चुने गए ऋणात्मक से अधिक क्रम देगा (यह मानते हुए कि 'धनात्मक' क्रम 'ऋणात्मक' से अधिक है)।<ref name="fawcett">Fawcett, Tom (2006); ''[https://www.math.ucdavis.edu/~saito/data/roc/fawcett-roc.pdf An introduction to ROC analysis]'', Pattern Recognition Letters, 27, 861–874.</ref> | ||
इसके संभाव्य रूप के कारण, U सांख्यिकी को दो से अधिक वर्गों के लिए | |||
इसके संभाव्य रूप के कारण, U सांख्यिकी को दो से अधिक वर्गों के लिए वर्गीकरणकर्ता की पृथक्करण शक्ति के माप के लिए सामान्यीकृत किया जा सकता है:<ref>{{cite journal |last1=Hand |first1=David J. |last2=Till |first2=Robert J. |year=2001 |title=एकाधिक वर्ग वर्गीकरण समस्याओं के लिए आरओसी वक्र के तहत क्षेत्र का एक सरल सामान्यीकरण|journal=Machine Learning |volume=45 |pages=171–186 |doi=10.1023/A:1010920819831 |doi-access=free |number=2}}</ref> | |||
:<math>M = {1 \over c(c-1)} \sum \mathrm{AUC}_{k,\ell}</math> | :<math>M = {1 \over c(c-1)} \sum \mathrm{AUC}_{k,\ell}</math> | ||
जहाँ c वर्गों की संख्या है | जहाँ c वर्गों की संख्या है और R<sub>''k'',''ℓ ,''</sub> AUC<sub>''k'',''ℓ''</sub> का पद, ℓ केवल वर्ग k और ℓ से संबंधित वस्तुओं के श्रेणीक्रम पर विचार करता है (अर्थात, अन्य सभी वर्गों से संबंधित वस्तुओं को अवहेलना कर दिया जाता है) वर्गीकरणकर्ता के अनुमान के अनुसार कक्षा k से संबंधित उन वस्तुओं की संभावना है। AUC<sub>''k'',''k''</sub> सदैव शून्य होगा, परन्तु, दो-वर्गों की स्थिति के विपरीत, सामान्यतः {{math|1=AUC<sub>''k'',''ℓ''</sub> ≠ AUC<sub>''ℓ'',''k''</sub>}}, यही कारण है कि M, AUC<sub>''ℓ'',''k''</sub> और AUC<sub>''k'',''ℓ''</sub> के औसत का उपयोग करते हुए, सभी (k,ℓ) युग्मों का योग मापता है। | ||
== गणना == | == गणना == | ||
परीक्षण में एक आंकड़े की गणना | परीक्षण में एक आंकड़े की गणना सम्मिलित है, जिसे आमतौर पर यू कहा जाता है, जिसका वितरण शून्य परिकल्पना के अंतर्गत जाना जाता है। छोटे प्रतिदर्शों के स्थिति में, वितरण सारणीबद्ध है, परन्तु ~20 से ऊपर के प्रतिदर्श के आकार के लिए, [[सामान्य वितरण]] का उपयोग करके सन्निकटन काफी अच्छा है। कुछ पुस्तकें यू के समतुल्य आँकड़ों को सारणीबद्ध करती हैं, जैसे कि यू के बजाय प्रतिदर्शों में से एक में [[रैंक (सेट सिद्धांत)|क्रम (समुच्चय सिद्धांत)]] का योग। | ||
मान-व्हिटनी यू परीक्षण [[सांख्यिकीय]] पैकेजों की सबसे आधुनिक सूची में | मान-व्हिटनी यू परीक्षण [[सांख्यिकीय]] पैकेजों की सबसे आधुनिक सूची में सम्मिलित है। यह आसानी से हाथ से भी गणना की जाती है, खासकर छोटे प्रतिदर्शों के लिए। इसे करने के दो तरीके हैं। | ||
'पहला तरीका:' | 'पहला तरीका:' | ||
प्रेक्षणों के दो छोटे | प्रेक्षणों के दो छोटे समुच्चयों की तुलना करने के लिए, एक सीधा तरीका त्वरित है, और यू स्टेटिस्टिक के अर्थ में अंतर्दृष्टि देता है, जो सभी जोड़ीदार प्रतियोगिताओं में से जीत की संख्या से मेल खाता है (नीचे दिए गए उदाहरणों के अंतर्गत कछुआ और खरगोश का उदाहरण देखें)। एक समुच्चय में प्रत्येक अवलोकन के लिए, दूसरे समुच्चय में किसी भी अवलोकन पर यह पहला मान जीतने की संख्या की गणना करें (यदि यह पहला बड़ा है तो दूसरा मान हार जाता है)। किसी भी टाई के लिए 0.5 की गिनती करें। जीत और टाई का योग U है (अर्थात: <math>U_1</math>) पहले समुच्चय के लिए। दूसरे समुच्चय के लिए U विलोम है (अर्थात: <math>U_2</math>). | ||
विधि दो: | विधि दो: | ||
बड़े | बड़े प्रतिदर्शों के लिए: | ||
# सभी अवलोकनों के लिए संख्यात्मक | # सभी अवलोकनों के लिए संख्यात्मक क्रम निर्दिष्ट करें (दोनों समूहों से अवलोकनों को एक समुच्चय में रखें), सबसे छोटे मान के लिए 1 से शुरू करें। जहां बंधे हुए मानों के समूह हैं, असमायोजित श्रेणीक्रम के मध्य बिंदु के बराबर एक क्रम निर्दिष्ट करें (उदाहरण के लिए, की क्रम {{math|(3, 5, 5, 5, 5, 8)}} हैं {{math|(1, 3.5, 3.5, 3.5, 3.5, 6)}}, जहां असमायोजित क्रम होगी {{math|(1, 2, 3, 4, 5, 6)}}). | ||
# अब, | # अब, प्रतिदर्श 1 से प्राप्त टिप्पणियों के लिए क्रम जोड़ें। प्रतिदर्श 2 में क्रमों का योग अब निर्धारित किया गया है, क्योंकि सभी क्रमों का योग बराबर है {{math|''N''(''N'' + 1)/2}} जहां N प्रेक्षणों की कुल संख्या है। | ||
# यू तब दिया जाता है:<ref>{{cite book|last=Zar|first=Jerrold H.|title=बायोस्टैटिस्टिकल विश्लेषण|year=1998|publisher=Prentice Hall International, INC.|location=New Jersey|isbn=978-0-13-082390-8|page=147}}</ref> | # यू तब दिया जाता है:<ref>{{cite book|last=Zar|first=Jerrold H.|title=बायोस्टैटिस्टिकल विश्लेषण|year=1998|publisher=Prentice Hall International, INC.|location=New Jersey|isbn=978-0-13-082390-8|page=147}}</ref> | ||
:::<math>U_1=R_1 - {n_1(n_1+1) \over 2} \,\!</math> | :::<math>U_1=R_1 - {n_1(n_1+1) \over 2} \,\!</math> | ||
:: जहां एन<sub>1</sub> | :: जहां एन<sub>1</sub> प्रतिदर्श 1 के लिए प्रतिदर्श आकार है, और आर<sub>1</sub> प्रतिदर्श 1 में क्रमों का योग है। | ||
::ध्यान दें कि इससे कोई फर्क नहीं पड़ता कि दो | ::ध्यान दें कि इससे कोई फर्क नहीं पड़ता कि दो प्रतिदर्शों में से कौन सा प्रतिदर्श माना जाता है 1. U के लिए एक समान रूप से मान्य सूत्र है | ||
:::<math>U_2= R_2 - {n_2(n_2+1) \over 2} \,\!</math> | :::<math>U_2= R_2 - {n_2(n_2+1) \over 2} \,\!</math> | ||
Line 68: | Line 71: | ||
:::{{math|1=''U''<sub>1</sub> + ''U''<sub>2</sub> = ''n''<sub>1</sub>''n''<sub>2</sub>}}. | :::{{math|1=''U''<sub>1</sub> + ''U''<sub>2</sub> = ''n''<sub>1</sub>''n''<sub>2</sub>}}. | ||
== | == गुणधर्म == | ||
यू का अधिकतम | यू का अधिकतम मान दो प्रतिदर्शों के लिए प्रतिदर्श आकार का उत्पाद है (अर्थात: <math>U_i = n_1 n_2</math>). ऐसी स्थिति में, अन्य U 0 होगा। | ||
== उदाहरण == | == उदाहरण == | ||
Line 76: | Line 79: | ||
===गणना विधियों का उदाहरण=== | ===गणना विधियों का उदाहरण=== | ||
मान लीजिए कि [[ईसप]] अपने द [[कछुआ]] और [[खरगोश]] से असंतुष्ट है जिसमें एक कछुआ एक दौड़ में एक खरगोश को हरा पाया था, और यह पता लगाने के लिए कि क्या परिणाम सामान्य रूप से कछुओं और खरगोशों तक बढ़ाए जा सकते हैं, एक महत्व परीक्षण करने का फैसला करता है। वह 6 कछुओं और 6 खरगोशों का एक | मान लीजिए कि [[ईसप]] अपने द [[कछुआ]] और [[खरगोश]] से असंतुष्ट है जिसमें एक कछुआ एक दौड़ में एक खरगोश को हरा पाया था, और यह पता लगाने के लिए कि क्या परिणाम सामान्य रूप से कछुओं और खरगोशों तक बढ़ाए जा सकते हैं, एक महत्व परीक्षण करने का फैसला करता है। वह 6 कछुओं और 6 खरगोशों का एक प्रतिदर्श इकट्ठा करता है, और उन सभी को एक ही बार में अपनी दौड़ में लगा देता है। जिस क्रम में वे फिनिशिंग पोस्ट तक पहुँचते हैं (उनका क्रम ऑर्डर, समापन रेखा को पार करने वाली पहली से आखिरी तक) इस प्रकार है, एक कछुए के लिए टी और एक खरगोश के लिए एच लिखना: | ||
: टी एच एच एच एच एच टी टी टी टी टी टी एच | : टी एच एच एच एच एच टी टी टी टी टी टी एच | ||
यू का मान क्या है? | यू का मान क्या है? | ||
* प्रत्यक्ष विधि का उपयोग करते हुए, हम प्रत्येक कछुए को बारी-बारी से लेते हैं, और 6, 1, 1, 1, 1, 1 प्राप्त करने वाले खरगोशों की संख्या की गणना करते हैं, जिसका अर्थ है कि {{math|1=''U<sub>T</sub>'' = 11}}. वैकल्पिक रूप से, हम प्रत्येक खरगोश को बारी-बारी से ले सकते हैं, और यह गिन सकते हैं कि यह कितने कछुओं को हराता है। इस | * प्रत्यक्ष विधि का उपयोग करते हुए, हम प्रत्येक कछुए को बारी-बारी से लेते हैं, और 6, 1, 1, 1, 1, 1 प्राप्त करने वाले खरगोशों की संख्या की गणना करते हैं, जिसका अर्थ है कि {{math|1=''U<sub>T</sub>'' = 11}}. वैकल्पिक रूप से, हम प्रत्येक खरगोश को बारी-बारी से ले सकते हैं, और यह गिन सकते हैं कि यह कितने कछुओं को हराता है। इस स्थिति में, हमें 5, 5, 5, 5, 5, 0, इसलिए मिलता है {{math|1=''U<sub>H</sub>'' = 25}}. ध्यान दें कि इन दो मानों का योग के लिए {{math|1=''U'' = 36}}, जो है {{math|6×6}}. | ||
* अप्रत्यक्ष विधि का उपयोग करना: | * अप्रत्यक्ष विधि का उपयोग करना: | ||
: जानवरों को पाठ्यक्रम | : जानवरों को पाठ्यक्रम पूर्ण करने में लगने वाले समय तक क्रम दें, इसलिए पहले जानवर को होम क्रम 12, दूसरे क्रम को 11 और इसी तरह आगे दें। | ||
: कछुओं द्वारा प्राप्त | : कछुओं द्वारा प्राप्त क्रमों का योग है {{math|1=12 + 6 + 5 + 4 + 3 + 2 = 32}}. | ||
:: इसलिए {{math|1=''U<sub>T</sub>'' = 32 − (6×7)/2 = 32 − 21 = 11}} (विधि एक के समान)। | :: इसलिए {{math|1=''U<sub>T</sub>'' = 32 − (6×7)/2 = 32 − 21 = 11}} (विधि एक के समान)। | ||
:: खरगोशों द्वारा प्राप्त | :: खरगोशों द्वारा प्राप्त क्रमों का योग है {{math|1=11 + 10 + 9 + 8 + 7 + 1 = 46}}, के लिए अग्रणी {{math|1=''U<sub>H</sub>'' = 46 − 21 = 25}}. | ||
<!-- | <!-- | ||
Line 190: | Line 193: | ||
* आर पैकेज [https://rdrr.io/cran/rcompanion/man/wilcoxonZ.html {{mono|wilcoxonZ}}] विलकॉक्सन दो-नमूना, युग्मित, या एक-नमूना परीक्षण के लिए z आँकड़ा की गणना करेगा। | * आर पैकेज [https://rdrr.io/cran/rcompanion/man/wilcoxonZ.html {{mono|wilcoxonZ}}] विलकॉक्सन दो-नमूना, युग्मित, या एक-नमूना परीक्षण के लिए z आँकड़ा की गणना करेगा। | ||
* SAS (सॉफ्टवेयर) अपनी PROC NPAR1WAY प्रक्रिया में परीक्षण को लागू करता है। | * SAS (सॉफ्टवेयर) अपनी PROC NPAR1WAY प्रक्रिया में परीक्षण को लागू करता है। | ||
* [[पायथन (प्रोग्रामिंग भाषा)]] में [[SciPy]] द्वारा प्रदान किए गए इस परीक्षण का कार्यान्वयन है<ref>{{cite web |url=http://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.mannwhitneyu.html |title=scipy.stats.mannwhitneyu|work=SciPy v0.16.0 Reference Guide |author=<!--Staff writer(s); no by-line.--> | * [[पायथन (प्रोग्रामिंग भाषा)]] में [[SciPy]] द्वारा प्रदान किए गए इस परीक्षण का कार्यान्वयन है<ref>{{cite web |url=http://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.mannwhitneyu.html |title=scipy.stats.mannwhitneyu|work=SciPy v0.16.0 Reference Guide |author=<!--Staff writer(s); no by-line.--> | ||
* [[सिग्मास्टैट]] (एसपीएसएस इंक, शिकागो, आईएल) | == सॉफ्टवेयर कार्यान्वयन == | ||
कई सॉफ़्टवेयर पैकेजों में, मैन-व्हिटनी यू परीक्षण (उचित विकल्पों के विरुद्ध समान वितरण की परिकल्पना) को खराब तरीके से प्रलेखित किया गया है। कुछ पैकेज संबंधों का ग़लत ढंग से इलाज करते हैं या स्पर्शोन्मुख तकनीकों (उदाहरण के लिए, निरंतरता के लिए सुधार) का दस्तावेज़ीकरण करने में विफल रहते हैं। 2000 की समीक्षा में निम्नलिखित कुछ पैकेजों पर चर्चा की गई | |||
*[[सिग्मास्टैट]] (एसपीएसएस इंक, शिकागो, आईएल) | |||
* SYSTAT (सांख्यिकी) (SPSS Inc., शिकागो, IL) | * SYSTAT (सांख्यिकी) (SPSS Inc., शिकागो, IL) | ||
* [[जावा (प्रोग्रामिंग भाषा)]] में [[अपाचे कॉमन्स]] द्वारा प्रदान किए गए इस परीक्षण का कार्यान्वयन है<ref>{{Cite web|url=http://commons.apache.org/proper/commons-math/javadocs/api-3.3/org/apache/commons/math3/stat/inference/MannWhitneyUTest.html|title=MannWhitneyUTest (Apache Commons Math 3.3 API)|website=commons.apache.org}}</ref> | * [[जावा (प्रोग्रामिंग भाषा)]] में [[अपाचे कॉमन्स]] द्वारा प्रदान किए गए इस परीक्षण का कार्यान्वयन है<ref>{{Cite web|url=http://commons.apache.org/proper/commons-math/javadocs/api-3.3/org/apache/commons/math3/stat/inference/MannWhitneyUTest.html|title=MannWhitneyUTest (Apache Commons Math 3.3 API)|website=commons.apache.org}}</ref> | ||
*[[ जूलिया (प्रोग्रामिंग भाषा) ]] के पास कई पैकेजों के माध्यम से इस परीक्षण का कार्यान्वयन है। पैकेज HypothesisTests.jl में, यह pvalue(MannWhitneyUTest(X, Y)) के रूप में पाया जाता है<ref>{{Cite web|url=https://github.com/JuliaStats/HypothesisTests.jl|title=JuliaStats/HypothesisTests.jl|website=GitHub|date=30 May 2021}}</ref> | *[[ जूलिया (प्रोग्रामिंग भाषा) | जूलिया (प्रोग्रामिंग भाषा)]] के पास कई पैकेजों के माध्यम से इस परीक्षण का कार्यान्वयन है। पैकेज HypothesisTests.jl में, यह pvalue(MannWhitneyUTest(X, Y)) के रूप में पाया जाता है<ref>{{Cite web|url=https://github.com/JuliaStats/HypothesisTests.jl|title=JuliaStats/HypothesisTests.jl|website=GitHub|date=30 May 2021}}</ref> | ||
* [[जेएमपी (सांख्यिकीय सॉफ्टवेयर)]] (एसएएस इंस्टीट्यूट इंक, कैरी, एनसी) | * [[जेएमपी (सांख्यिकीय सॉफ्टवेयर)]] (एसएएस इंस्टीट्यूट इंक, कैरी, एनसी) | ||
* [[ एस प्लस ]] (मैथसॉफ्ट, इंक।, सिएटल, डब्ल्यूए) | * [[ एस प्लस | एस प्लस]] (मैथसॉफ्ट, इंक।, सिएटल, डब्ल्यूए) | ||
* [[आंकड़े]] (स्टेटसॉफ्ट, इंक।, तुलसा, ओके) | * [[आंकड़े]] (स्टेटसॉफ्ट, इंक।, तुलसा, ओके) | ||
* [[सपना देखना]] (यूनिस्टैट लिमिटेड, लंदन) | * [[सपना देखना]] (यूनिस्टैट लिमिटेड, लंदन) | ||
* [[एसपीएसएस]] (एसपीएसएस इंक, शिकागो) | * [[एसपीएसएस]] (एसपीएसएस इंक, शिकागो) | ||
* [[ आँकड़े प्रत्यक्ष ]] (स्टैट्सडायरेक्ट लिमिटेड, मैनचेस्टर, यूके) [http://www.statsdirect.com/help/Default.htm#nonparametric_methods/mann_whitney.htm सभी सामान्य संस्करण] | * [[ आँकड़े प्रत्यक्ष | आँकड़े प्रत्यक्ष]] (स्टैट्सडायरेक्ट लिमिटेड, मैनचेस्टर, यूके) [http://www.statsdirect.com/help/Default.htm#nonparametric_methods/mann_whitney.htm सभी सामान्य संस्करण] अनुप्रयुक्त करता है। | ||
* [[था]] (स्टाटा कॉर्पोरेशन, कॉलेज स्टेशन, TX) अपने [https://www.stata.com/help.cgi?ranksum | * [[था]] (स्टाटा कॉर्पोरेशन, कॉलेज स्टेशन, TX) अपने [https://www.stata.com/help.cgi?ranksum क्रमसम] कमांड में परीक्षण को अनुप्रयुक्त करता है। | ||
* [[स्टेटएक्सएक्ट]] (साइटेल सॉफ्टवेयर कॉर्पोरेशन, कैम्ब्रिज, | * [[स्टेटएक्सएक्ट]] (साइटेल सॉफ्टवेयर कॉर्पोरेशन, कैम्ब्रिज, मैसाचुसमुच्चय्स) | ||
* [[PSPP]] अपने [https://www.gnu.org/software/pspp/manual/html_node/WILCOXON.html WILCOXON] फंक्शन में परीक्षण को | * [[PSPP]] अपने [https://www.gnu.org/software/pspp/manual/html_node/WILCOXON.html WILCOXON] फंक्शन में परीक्षण को अनुप्रयुक्त करता है। | ||
* [[KNIME]] अपने [https://hub.knime.com/knime/extensions/org.knime.features.stats2/latest/org.knime.base.node.stats.testing.wilcoxonmannwhitney.WilcoxonMannWhitneyNodeFactory Wilcoxon-Mann में परीक्षण | * [[KNIME]] अपने [https://hub.knime.com/knime/extensions/org.knime.features.stats2/latest/org.knime.base.node.stats.testing.wilcoxonmannwhitney.WilcoxonMannWhitneyNodeFactory Wilcoxon-Mann में परीक्षण अनुप्रयुक्त करता है। -व्हिटनी टेस्ट] नोड। | ||
== इतिहास == | == इतिहास == | ||
प्रतिदर्शज 1914 के एक लेख में दिखाई दिया<ref name="Kruskal57">{{cite journal |jstor=2280906 |title=विलकॉक्सन अनपेयर्ड टू-सैंपल टेस्ट पर ऐतिहासिक नोट्स|last=Kruskal |first=William H. |journal=Journal of the American Statistical Association |date=September 1957 |volume=52 |issue=279 |pages=356–360 |doi=10.2307/2280906}}</ref> जर्मन गुस्ताव ड्यूक्लर द्वारा (विचरण में लापता शब्द के साथ)। | |||
1945 में एक एकल पत्र में, [[फ्रैंक विलकॉक्सन]] ने प्रस्तावित किया था <ref name="wilcoxon1945">{{cite journal |doi=10.2307/3001968 |last=Wilcoxon |first=Frank |author-link=Frank Wilcoxon |year=1945 |title=रैंकिंग विधियों द्वारा व्यक्तिगत तुलना|journal=[[Biometrics Bulletin]] |volume=1 |issue=6 |pages=80–83 |jstor=3001968 |hdl=10338.dmlcz/135688 |hdl-access=free }}</ref> एक- | 1945 में एक एकल पत्र में, [[फ्रैंक विलकॉक्सन|फ्क्रमविल्कोक्सन]] ने प्रस्तावित किया था <ref name="wilcoxon1945">{{cite journal |doi=10.2307/3001968 |last=Wilcoxon |first=Frank |author-link=Frank Wilcoxon |year=1945 |title=रैंकिंग विधियों द्वारा व्यक्तिगत तुलना|journal=[[Biometrics Bulletin]] |volume=1 |issue=6 |pages=80–83 |jstor=3001968 |hdl=10338.dmlcz/135688 |hdl-access=free }}</ref> एक-प्रतिदर्श हस्ताक्षरित क्रम और दो-प्रतिदर्श क्रम योग परीक्षण, इसके पूरक विकल्प के विरुद्ध एक बिंदु शून्य-परिकल्पना के साथ महत्व के परीक्षण में (अर्थात, बराबर बनाम बराबर नहीं)। हालाँकि, उन्होंने उस लेख्य में समान-प्रतिदर्श आकार के स्थिति के लिए केवल कुछ बिंदुओं को सारणीबद्ध किया (हालांकि बाद के एक लेख्य में उन्होंने बड़ी तालिका दी)। | ||
आँकड़ों का गहन विश्लेषण, जिसमें आठ या उससे कम के | आँकड़ों का गहन विश्लेषण, जिसमें आठ या उससे कम के प्रतिदर्श के आकार के लिए मनमाना प्रतिदर्श आकार और तालिकाओं के लिए पूंछ की संभावनाओं की गणना की अनुमति देने वाली पुनरावृत्ति सम्मिलित थी, हेनरी मान और उनके छात्र द्वारा लेख में दिखाई दिया।<!-- source: Olson, cited with url link in Mann article --> 1947 में डोनाल्ड रैनसम व्हिटनी।<ref name="mannwhitney1947">{{cite journal |first1=Henry B. |last1=Mann |author-link=Henry Mann |first2=Donald R. |last2=Whitney |title=दो रैंडम वेरिएबल्स में से एक दूसरे की तुलना में स्टोचैस्टिक रूप से बड़ा है या नहीं, इसके परीक्षण पर|journal=[[Annals of Mathematical Statistics]] |volume=18 |issue=1 |year=1947 |pages=50–60 |doi=10.1214/aoms/1177730491 |mr=22058 |zbl=0041.26103 |doi-access=free }}</ref> इस लेख में वैकल्पिक परिकल्पनाओं पर चर्चा की गई है, जिसमें एक स्टोकेस्टिक क्रमीकरण सम्मिलित है (जहां [[संचयी वितरण कार्य]] बिंदुवार असमानता को संतुष्ट करते हैं {{math|1=''F''<sub>''X''</sub>(''t'') < ''F''<sub>''Y''</sub>(''t'')}}). इस लेख्य ने पहले चार क्षणों की भी गणना की और अशक्त परिकल्पना के अंतर्गत सांख्यिकी की सीमित सामान्यता को स्थापित किया, ताकि यह स्थापित हो सके कि यह असमान रूप से वितरण-मुक्त है। | ||
== यह भी देखें == | == यह भी देखें == | ||
Line 218: | Line 223: | ||
* [[कुकोनी परीक्षण]] | * [[कुकोनी परीक्षण]] | ||
* कोलमोगोरोव-स्मिर्नोव परीक्षण | * कोलमोगोरोव-स्मिर्नोव परीक्षण | ||
* विलकॉक्सन साइन- | * विलकॉक्सन साइन-क्रम टेस्ट | ||
* क्रुस्कल-वालिस विचरण का एकतरफा विश्लेषण | * क्रुस्कल-वालिस विचरण का एकतरफा विश्लेषण | ||
* ब्रूनर-मुंजेल परीक्षण | * ब्रूनर-मुंजेल परीक्षण |
Revision as of 09:25, 22 June 2023
आँकड़ों में, मान-व्हिटनी U परीक्षण (जिसे मान-व्हिटनी-विलकॉक्सन (एमडब्ल्यूडब्ल्यू/एमडब्ल्यूयू), विल्कोक्सन क्रम-योग परीक्षण या विल्कोक्सन-मान-व्हिटनी परीक्षण भी कहा जाता है) शून्य परिकल्पना का एक अप्राचली सांख्यिकी परीक्षण है। जो यादृच्छिक रूप से, दो जनों से चयनित मान X और Y, X के Y से अधिक होने की संभावना, Y के X से अधिक होने की संभावना के बराबर है।
दो आश्रित प्रतिदर्शो पर उपयोग किए जाने वाले अप्राचली परीक्षण चिह्न परीक्षण और विल्कोक्सन चिह्न-क्रम परीक्षण हैं।
धारणाएं और परिकल्पनाओं का औपचारिक विवरण
यद्यपि मान और व्हिटनी[1]ने वैकल्पिक परिकल्पना के साथ निरंतर प्रतिक्रियाओं की धारणा के अंतर्गत मान-व्हिटनी U परीक्षण विकसित किया है कि एक वितरण दूसरे की तुलना में स्टोकेस्टिक रूप से अधिक है, शून्य परिकल्पना और वैकल्पिक परिकल्पना तैयार करने के कई अन्य तरीके हैं जैसे मान-व्हिटनी U परीक्षण एक वैध परीक्षण देगा।[2]
एक बहुत ही सामान्य सूत्रीकरण यह मान लेना है कि:
- दोनों समूहों के सभी अवलोकन एक दूसरे से स्वतंत्र हैं,
- प्रतिक्रियाएँ कम-से-कम क्रमिक हैं (अर्थात्, कम-से-कम यह कह सकते हैं कि किन्हीं दो प्रेक्षणों में से कौन अधिक है),
- शून्य परिकल्पना के अंतर्गत H0, दोनों जनों का वितरण समान है।[3]
- वैकल्पिक परिकल्पना H1 यह है कि वितरण समान नहीं हैं।
सामान्य सूत्रीकरण के अंतर्गत, परीक्षण केवल तभी सुसंगत होता है जब H1 के अंतर्गत निम्नलिखित होता है:
- जनसंख्या X के किसी अवलोकन की जनसंख्या Y के अवलोकन से अधिक होने की संभावना Y के किसी अवलोकन की जनसंख्या; अर्थात।, P(X > Y) ≠ P(Y > X) या P(X > Y) + 0.5 · P(X = Y) ≠ 0.5 हैं।
- उपरोक्त सामान्य सूत्रीकरण की तुलना में अधिक पूर्णतः मान्यताओं के अंतर्गत, उदाहरण के लिए, यदि प्रतिक्रियाओं को निरंतर माना जाता है और विकल्प को स्थान परिवर्तन तक सीमित रखा जाता है, अर्थात, F1(x) = F2(x + δ), तो हम एक महत्वपूर्ण व्याख्या कर सकते हैं मान-व्हिटनी U परीक्षण मध्यस्थों में अंतर दर्शाता है। इस स्थान परिवर्तन की धारणा के अंतर्गत, हम मान-व्हिटनी U परीक्षण की व्याख्या यह आकलन करने के लिए भी कर सकते हैं कि क्या दो जनों के मध्य केंद्रीय प्रवृत्ति में अंतर का होजेस-लेहमैन अनुमान शून्य से भिन्न है। इस दो-प्रतिदर्श समस्याओं के लिए होजेस-लेहमैन का अनुमान पहले प्रतिदर्श में एक अवलोकन और दूसरे प्रतिदर्श में एक अवलोकन के मध्य सभी संभावित अंतरों का माध्य है।
अन्यथा, यदि दोनों प्रतिदर्शों के परिक्षेपण और वितरण के आकार भिन्न हैं, तो मान-व्हिटनी U परीक्षण मध्यस्थों के परीक्षण में विफल रहता है। ऐसे उदाहरण दिखाना संभव है जहां माध्यिकाएं संख्यात्मक रूप से बराबर होती हैं, जबकि परीक्षण एक छोटे p-मान के साथ शून्य परिकल्पना को अस्वीकार करता है।[4] [5] [6]
मान-व्हिटनी U परीक्षण/विल्कोक्सन क्रम-योग परीक्षण विल्कोक्सन चिह्न-क्रम परीक्षण के समान नहीं है, हालांकि दोनों अप्राचली सांख्यिकी हैं और इसमें क्रमों का योग सम्मिलित है। मान-व्हिटनी U परीक्षण स्वतंत्र प्रतिदर्शों पर अनुप्रयुक्त किया जाता है। विल्कोक्सन चिह्न-क्रम परीक्षण सुमेलित या आश्रित प्रतिदर्शों पर अनुप्रयुक्त किया जाता है।
U प्रतिदर्शज
मान लीजिए कि एक आई.आई.डी से प्रतिदर्श और एक आई.आई.डी. से प्रतिदर्श है सेऔर दोनों प्रतिदर्श एक दूसरे से स्वतंत्र हैं। संबंधित मान-व्हिटनी U सांख्यिकी को इस प्रकार परिभाषित किया गया हैː
के साथ
आरओसी वक्रों के लिए क्षेत्र के अंतर्गत वक्र (AUC) प्रतिदर्शज
U प्रतिदर्शज गृहीता प्रचालन विशेषता वक्र (AUC) के अंतर्गत क्षेत्र के बराबर है जिसकी गणना सरलता से की जा सकती है।[7][8]
ध्यान दें कि यह उपरोक्त अनुभाग से सामान्य भाषा प्रभाव आकार के समान परिभाषा है। अर्थात: संभावना है कि एक वर्गीकरणकर्ता यादृच्छिक रूप से चुने गए धनात्मक उदाहरण को यादृच्छिक रूप से चुने गए ऋणात्मक से अधिक क्रम देगा (यह मानते हुए कि 'धनात्मक' क्रम 'ऋणात्मक' से अधिक है)।[9]
इसके संभाव्य रूप के कारण, U सांख्यिकी को दो से अधिक वर्गों के लिए वर्गीकरणकर्ता की पृथक्करण शक्ति के माप के लिए सामान्यीकृत किया जा सकता है:[10]
जहाँ c वर्गों की संख्या है और Rk,ℓ , AUCk,ℓ का पद, ℓ केवल वर्ग k और ℓ से संबंधित वस्तुओं के श्रेणीक्रम पर विचार करता है (अर्थात, अन्य सभी वर्गों से संबंधित वस्तुओं को अवहेलना कर दिया जाता है) वर्गीकरणकर्ता के अनुमान के अनुसार कक्षा k से संबंधित उन वस्तुओं की संभावना है। AUCk,k सदैव शून्य होगा, परन्तु, दो-वर्गों की स्थिति के विपरीत, सामान्यतः AUCk,ℓ ≠ AUCℓ,k, यही कारण है कि M, AUCℓ,k और AUCk,ℓ के औसत का उपयोग करते हुए, सभी (k,ℓ) युग्मों का योग मापता है।
गणना
परीक्षण में एक आंकड़े की गणना सम्मिलित है, जिसे आमतौर पर यू कहा जाता है, जिसका वितरण शून्य परिकल्पना के अंतर्गत जाना जाता है। छोटे प्रतिदर्शों के स्थिति में, वितरण सारणीबद्ध है, परन्तु ~20 से ऊपर के प्रतिदर्श के आकार के लिए, सामान्य वितरण का उपयोग करके सन्निकटन काफी अच्छा है। कुछ पुस्तकें यू के समतुल्य आँकड़ों को सारणीबद्ध करती हैं, जैसे कि यू के बजाय प्रतिदर्शों में से एक में क्रम (समुच्चय सिद्धांत) का योग।
मान-व्हिटनी यू परीक्षण सांख्यिकीय पैकेजों की सबसे आधुनिक सूची में सम्मिलित है। यह आसानी से हाथ से भी गणना की जाती है, खासकर छोटे प्रतिदर्शों के लिए। इसे करने के दो तरीके हैं।
'पहला तरीका:'
प्रेक्षणों के दो छोटे समुच्चयों की तुलना करने के लिए, एक सीधा तरीका त्वरित है, और यू स्टेटिस्टिक के अर्थ में अंतर्दृष्टि देता है, जो सभी जोड़ीदार प्रतियोगिताओं में से जीत की संख्या से मेल खाता है (नीचे दिए गए उदाहरणों के अंतर्गत कछुआ और खरगोश का उदाहरण देखें)। एक समुच्चय में प्रत्येक अवलोकन के लिए, दूसरे समुच्चय में किसी भी अवलोकन पर यह पहला मान जीतने की संख्या की गणना करें (यदि यह पहला बड़ा है तो दूसरा मान हार जाता है)। किसी भी टाई के लिए 0.5 की गिनती करें। जीत और टाई का योग U है (अर्थात: ) पहले समुच्चय के लिए। दूसरे समुच्चय के लिए U विलोम है (अर्थात: ).
विधि दो:
बड़े प्रतिदर्शों के लिए:
- सभी अवलोकनों के लिए संख्यात्मक क्रम निर्दिष्ट करें (दोनों समूहों से अवलोकनों को एक समुच्चय में रखें), सबसे छोटे मान के लिए 1 से शुरू करें। जहां बंधे हुए मानों के समूह हैं, असमायोजित श्रेणीक्रम के मध्य बिंदु के बराबर एक क्रम निर्दिष्ट करें (उदाहरण के लिए, की क्रम (3, 5, 5, 5, 5, 8) हैं (1, 3.5, 3.5, 3.5, 3.5, 6), जहां असमायोजित क्रम होगी (1, 2, 3, 4, 5, 6)).
- अब, प्रतिदर्श 1 से प्राप्त टिप्पणियों के लिए क्रम जोड़ें। प्रतिदर्श 2 में क्रमों का योग अब निर्धारित किया गया है, क्योंकि सभी क्रमों का योग बराबर है N(N + 1)/2 जहां N प्रेक्षणों की कुल संख्या है।
- यू तब दिया जाता है:[11]
- जहां एन1 प्रतिदर्श 1 के लिए प्रतिदर्श आकार है, और आर1 प्रतिदर्श 1 में क्रमों का योग है।
- ध्यान दें कि इससे कोई फर्क नहीं पड़ता कि दो प्रतिदर्शों में से कौन सा प्रतिदर्श माना जाता है 1. U के लिए एक समान रूप से मान्य सूत्र है
- U का छोटा मान1 और आप2 महत्व सारणी से परामर्श करते समय उपयोग किया जाता है। दो मानों का योग द्वारा दिया गया है
- जानते हुए भी R1 + R2 = N(N + 1)/2 और N = n1 + n2, और कुछ बीजगणित करने पर, हम पाते हैं कि योग है
- U1 + U2 = n1n2.
गुणधर्म
यू का अधिकतम मान दो प्रतिदर्शों के लिए प्रतिदर्श आकार का उत्पाद है (अर्थात: ). ऐसी स्थिति में, अन्य U 0 होगा।
उदाहरण
गणना विधियों का उदाहरण
मान लीजिए कि ईसप अपने द कछुआ और खरगोश से असंतुष्ट है जिसमें एक कछुआ एक दौड़ में एक खरगोश को हरा पाया था, और यह पता लगाने के लिए कि क्या परिणाम सामान्य रूप से कछुओं और खरगोशों तक बढ़ाए जा सकते हैं, एक महत्व परीक्षण करने का फैसला करता है। वह 6 कछुओं और 6 खरगोशों का एक प्रतिदर्श इकट्ठा करता है, और उन सभी को एक ही बार में अपनी दौड़ में लगा देता है। जिस क्रम में वे फिनिशिंग पोस्ट तक पहुँचते हैं (उनका क्रम ऑर्डर, समापन रेखा को पार करने वाली पहली से आखिरी तक) इस प्रकार है, एक कछुए के लिए टी और एक खरगोश के लिए एच लिखना:
- टी एच एच एच एच एच टी टी टी टी टी टी एच
यू का मान क्या है?
- प्रत्यक्ष विधि का उपयोग करते हुए, हम प्रत्येक कछुए को बारी-बारी से लेते हैं, और 6, 1, 1, 1, 1, 1 प्राप्त करने वाले खरगोशों की संख्या की गणना करते हैं, जिसका अर्थ है कि UT = 11. वैकल्पिक रूप से, हम प्रत्येक खरगोश को बारी-बारी से ले सकते हैं, और यह गिन सकते हैं कि यह कितने कछुओं को हराता है। इस स्थिति में, हमें 5, 5, 5, 5, 5, 0, इसलिए मिलता है UH = 25. ध्यान दें कि इन दो मानों का योग के लिए U = 36, जो है 6×6.
- अप्रत्यक्ष विधि का उपयोग करना:
- जानवरों को पाठ्यक्रम पूर्ण करने में लगने वाले समय तक क्रम दें, इसलिए पहले जानवर को होम क्रम 12, दूसरे क्रम को 11 और इसी तरह आगे दें।
- कछुओं द्वारा प्राप्त क्रमों का योग है 12 + 6 + 5 + 4 + 3 + 2 = 32.
- इसलिए UT = 32 − (6×7)/2 = 32 − 21 = 11 (विधि एक के समान)।
- खरगोशों द्वारा प्राप्त क्रमों का योग है 11 + 10 + 9 + 8 + 7 + 1 = 46, के लिए अग्रणी UH = 46 − 21 = 25.
सॉफ्टवेयर कार्यान्वयन
कई सॉफ़्टवेयर पैकेजों में, मैन-व्हिटनी यू परीक्षण (उचित विकल्पों के विरुद्ध समान वितरण की परिकल्पना) को खराब तरीके से प्रलेखित किया गया है। कुछ पैकेज संबंधों का ग़लत ढंग से इलाज करते हैं या स्पर्शोन्मुख तकनीकों (उदाहरण के लिए, निरंतरता के लिए सुधार) का दस्तावेज़ीकरण करने में विफल रहते हैं। 2000 की समीक्षा में निम्नलिखित कुछ पैकेजों पर चर्चा की गई
- सिग्मास्टैट (एसपीएसएस इंक, शिकागो, आईएल)
- SYSTAT (सांख्यिकी) (SPSS Inc., शिकागो, IL)
- जावा (प्रोग्रामिंग भाषा) में अपाचे कॉमन्स द्वारा प्रदान किए गए इस परीक्षण का कार्यान्वयन है[12]
- जूलिया (प्रोग्रामिंग भाषा) के पास कई पैकेजों के माध्यम से इस परीक्षण का कार्यान्वयन है। पैकेज HypothesisTests.jl में, यह pvalue(MannWhitneyUTest(X, Y)) के रूप में पाया जाता है[13]
- जेएमपी (सांख्यिकीय सॉफ्टवेयर) (एसएएस इंस्टीट्यूट इंक, कैरी, एनसी)
- एस प्लस (मैथसॉफ्ट, इंक।, सिएटल, डब्ल्यूए)
- आंकड़े (स्टेटसॉफ्ट, इंक।, तुलसा, ओके)
- सपना देखना (यूनिस्टैट लिमिटेड, लंदन)
- एसपीएसएस (एसपीएसएस इंक, शिकागो)
- आँकड़े प्रत्यक्ष (स्टैट्सडायरेक्ट लिमिटेड, मैनचेस्टर, यूके) सभी सामान्य संस्करण अनुप्रयुक्त करता है।
- था (स्टाटा कॉर्पोरेशन, कॉलेज स्टेशन, TX) अपने क्रमसम कमांड में परीक्षण को अनुप्रयुक्त करता है।
- स्टेटएक्सएक्ट (साइटेल सॉफ्टवेयर कॉर्पोरेशन, कैम्ब्रिज, मैसाचुसमुच्चय्स)
- PSPP अपने WILCOXON फंक्शन में परीक्षण को अनुप्रयुक्त करता है।
- KNIME अपने Wilcoxon-Mann में परीक्षण अनुप्रयुक्त करता है। -व्हिटनी टेस्ट नोड।
इतिहास
प्रतिदर्शज 1914 के एक लेख में दिखाई दिया[14] जर्मन गुस्ताव ड्यूक्लर द्वारा (विचरण में लापता शब्द के साथ)।
1945 में एक एकल पत्र में, फ्क्रमविल्कोक्सन ने प्रस्तावित किया था [15] एक-प्रतिदर्श हस्ताक्षरित क्रम और दो-प्रतिदर्श क्रम योग परीक्षण, इसके पूरक विकल्प के विरुद्ध एक बिंदु शून्य-परिकल्पना के साथ महत्व के परीक्षण में (अर्थात, बराबर बनाम बराबर नहीं)। हालाँकि, उन्होंने उस लेख्य में समान-प्रतिदर्श आकार के स्थिति के लिए केवल कुछ बिंदुओं को सारणीबद्ध किया (हालांकि बाद के एक लेख्य में उन्होंने बड़ी तालिका दी)।
आँकड़ों का गहन विश्लेषण, जिसमें आठ या उससे कम के प्रतिदर्श के आकार के लिए मनमाना प्रतिदर्श आकार और तालिकाओं के लिए पूंछ की संभावनाओं की गणना की अनुमति देने वाली पुनरावृत्ति सम्मिलित थी, हेनरी मान और उनके छात्र द्वारा लेख में दिखाई दिया। 1947 में डोनाल्ड रैनसम व्हिटनी।[1] इस लेख में वैकल्पिक परिकल्पनाओं पर चर्चा की गई है, जिसमें एक स्टोकेस्टिक क्रमीकरण सम्मिलित है (जहां संचयी वितरण कार्य बिंदुवार असमानता को संतुष्ट करते हैं FX(t) < FY(t)). इस लेख्य ने पहले चार क्षणों की भी गणना की और अशक्त परिकल्पना के अंतर्गत सांख्यिकी की सीमित सामान्यता को स्थापित किया, ताकि यह स्थापित हो सके कि यह असमान रूप से वितरण-मुक्त है।
यह भी देखें
- लेपेज परीक्षण
- कुकोनी परीक्षण
- कोलमोगोरोव-स्मिर्नोव परीक्षण
- विलकॉक्सन साइन-क्रम टेस्ट
- क्रुस्कल-वालिस विचरण का एकतरफा विश्लेषण
- ब्रूनर-मुंजेल परीक्षण
- आनुपातिक बाधाओं मॉडल
टिप्पणियाँ
- ↑ 1.0 1.1 Mann, Henry B.; Whitney, Donald R. (1947). "दो रैंडम वेरिएबल्स में से एक दूसरे की तुलना में स्टोचैस्टिक रूप से बड़ा है या नहीं, इसके परीक्षण पर". Annals of Mathematical Statistics. 18 (1): 50–60. doi:10.1214/aoms/1177730491. MR 0022058. Zbl 0041.26103.
- ↑ Fay, Michael P.; Proschan, Michael A. (2010). "Wilcoxon–Mann–Whitney or t-test? On assumptions for hypothesis tests and multiple interpretations of decision rules". Statistics Surveys. 4: 1–39. doi:10.1214/09-SS051. MR 2595125. PMC 2857732. PMID 20414472.
- ↑ [1], See Table 2.1 of Pratt (1964) "Robustness of Some Procedures for the Two-Sample Location Problem." Journal of the American Statistical Association. 59 (307): 655–680. If the two distributions are normal with the same mean but different variances, then Pr[X > Y] = Pr[Y < X] but the size of the Mann–Whitney test can be larger than the nominal level. So we cannot define the null hypothesis as Pr[X > Y] = Pr[Y < X] and get a valid test.
- ↑ Divine, George W.; Norton, H. James; Barón, Anna E.; Juarez-Colunga, Elizabeth (2018). "The Wilcoxon–Mann–Whitney Procedure Fails as a Test of Medians". The American Statistician. 72 (3): 278–286. doi:10.1080/00031305.2017.1305291.
- ↑ Conroy, Ronán (2012). "What Hypotheses do "Nonparametric" Two-Group Tests Actually Test?". Stata Journal. 12 (2): 182–190. doi:10.1177/1536867X1201200202. S2CID 118445807. Retrieved 24 May 2021.
- ↑ Hart, Anna (2001). "Mann–Whitney test is not just a test of medians: differences in spread can be important". BMJ. 323 (7309): 391–393. doi:10.1136/bmj.323.7309.391.
- ↑ Hanley, James A.; McNeil, Barbara J. (1982). "एक रिसीवर ऑपरेटिंग (आरओसी) वक्र विशेषता के तहत क्षेत्र का अर्थ और उपयोग". Radiology. 143 (1): 29–36. doi:10.1148/radiology.143.1.7063747. PMID 7063747.
- ↑ Mason, Simon J.; Graham, Nicholas E. (2002). "Areas beneath the relative operating characteristics (ROC) and relative operating levels (ROL) curves: Statistical significance and interpretation" (PDF). Quarterly Journal of the Royal Meteorological Society. 128 (584): 2145–2166. Bibcode:2002QJRMS.128.2145M. CiteSeerX 10.1.1.458.8392. doi:10.1256/003590002320603584. S2CID 121841664.
- ↑ Fawcett, Tom (2006); An introduction to ROC analysis, Pattern Recognition Letters, 27, 861–874.
- ↑ Hand, David J.; Till, Robert J. (2001). "एकाधिक वर्ग वर्गीकरण समस्याओं के लिए आरओसी वक्र के तहत क्षेत्र का एक सरल सामान्यीकरण". Machine Learning. 45 (2): 171–186. doi:10.1023/A:1010920819831.
- ↑ Zar, Jerrold H. (1998). बायोस्टैटिस्टिकल विश्लेषण. New Jersey: Prentice Hall International, INC. p. 147. ISBN 978-0-13-082390-8.
- ↑ "MannWhitneyUTest (Apache Commons Math 3.3 API)". commons.apache.org.
- ↑ "JuliaStats/HypothesisTests.jl". GitHub. 30 May 2021.
- ↑ Kruskal, William H. (September 1957). "विलकॉक्सन अनपेयर्ड टू-सैंपल टेस्ट पर ऐतिहासिक नोट्स". Journal of the American Statistical Association. 52 (279): 356–360. doi:10.2307/2280906. JSTOR 2280906.
- ↑ Wilcoxon, Frank (1945). "रैंकिंग विधियों द्वारा व्यक्तिगत तुलना". Biometrics Bulletin. 1 (6): 80–83. doi:10.2307/3001968. hdl:10338.dmlcz/135688. JSTOR 3001968.
<ref>
tag with name "H1976" defined in <references>
is not used in prior text.
संदर्भ
- Hettmansperger, T.P.; McKean, J.W. (1998). Robust nonparametric statistical methods. Kendall's Library of Statistics. Vol. 5 (First ed., rather than Taylor and Francis (2010) second ed.). London; New York: Edward Arnold; John Wiley and Sons, Inc. pp. xiv+467. ISBN 978-0-340-54937-7. MR 1604954.
- Corder, G.W.; Foreman, D.I. (2014). Nonparametric Statistics: A Step-by-Step Approach. Wiley. ISBN 978-1118840313.
- Hodges, J.L.; Lehmann, E.L. (1963). "Estimation of location based on ranks". Annals of Mathematical Statistics. 34 (2): 598–611. doi:10.1214/aoms/1177704172. JSTOR 2238406. MR 0152070. Zbl 0203.21105. PE euclid.aoms/1177704172.
- Kerby, D.S. (2014). "The simple difference formula: An approach to teaching nonparametric correlation". Comprehensive Psychology. 3: 11.IT.3.1. doi:10.2466/11.IT.3.1. S2CID 120622013.
- Lehmann, Erich L. (2006). Nonparametrics: Statistical methods based on ranks. With the special assistance of H.J.M. D'Abrera (Reprinting of 1988 revision of 1975 Holden-Day ed.). New York: Springer. pp. xvi+463. ISBN 978-0-387-35212-1. MR 0395032.
- Oja, Hannu (2010). Multivariate nonparametric methods with R: An approach based on spatial signs and ranks. Lecture Notes in Statistics. Vol. 199. New York: Springer. pp. xiv+232. doi:10.1007/978-1-4419-0468-3. ISBN 978-1-4419-0467-6. MR 2598854.
- Sen, Pranab Kumar (December 1963). "On the estimation of relative potency in dilution(-direct) assays by distribution-free methods". Biometrics. 19 (4): 532–552. doi:10.2307/2527532. JSTOR 2527532. Zbl 0119.15604.
बाहरी संबंध
- Table of critical values of U (pdf)
- Interactive calculator for U and its significance
- Brief guide by experimental psychologist Karl L. Weunsch – Nonparametric effect size estimators (Copyright 2015 by Karl L. Weunsch)