क्रुस्कल-वालिस विचरण का एकतरफा विश्लेषण: Difference between revisions

From Vigyanwiki
(Created page with "{{Short description|Non-parametric method for testing whether samples originate from the same distribution}} क्रुस्कल-वालिस रैंकों द्...")
 
No edit summary
Line 1: Line 1:
{{Short description|Non-parametric method for testing whether samples originate from the same distribution}}
{{Short description|Non-parametric method for testing whether samples originate from the same distribution}}
क्रुस्कल-वालिस रैंकों द्वारा परीक्षण, क्रुस्कल-वालिस ''एच'' परीक्षण<ref name="Laerd">[https://statistics.laerd.com/spss-tutorials/kruskal-wallis-h-test-using-spss-statistics.php Kruskal–Wallis H Test using SPSS Statistics], Laerd Statistics</ref> ([[विलियम क्रुस्कल]] और डब्ल्यू एलन वालिस के नाम पर), या रैंकों पर एक तरफ़ा एनोवा<ref name="Laerd" />एक गैर-पैरामीट्रिक सांख्यिकी है। यह परीक्षण करने के लिए गैर-पैरामीट्रिक विधि है कि नमूने एक ही वितरण से उत्पन्न होते हैं या नहीं।<ref>{{cite journal |last=Kruskal |last2=Wallis |year=1952 |title=एक-मानदंड विचरण विश्लेषण में रैंकों का उपयोग|journal=[[Journal of the American Statistical Association]] |volume=47 |issue=260 |pages=583–621 |doi=10.1080/01621459.1952.10483441 }}</ref><ref>{{cite book |last=Corder |first=Gregory W. |first2=Dale I. |last2=Foreman |year=2009 |title=गैर-सांख्यिकीविदों के लिए गैरपारंपरिक सांख्यिकी|url=https://archive.org/details/nonparametricsta00cord |url-access=limited |location=Hoboken |publisher=John Wiley & Sons |pages=[https://archive.org/details/nonparametricsta00cord/page/n114 99]–105 |isbn=9780470454619 }}</ref><ref>{{cite book |last=Siegel |last2=Castellan |year=1988 |title=स्वभावजन्य विज्ञान के लिए नॉनपैरामीट्रिक आंकड़े|edition=Second |location=New York |publisher=McGraw–Hill |isbn=0070573573 }}</ref> इसका उपयोग समान या भिन्न नमूना आकार के दो या दो से अधिक स्वतंत्र नमूनों की तुलना करने के लिए किया जाता है। यह मान-व्हिटनी यू परीक्षण | मान-व्हिटनी यू परीक्षण का विस्तार करता है, जिसका उपयोग केवल दो समूहों की तुलना करने के लिए किया जाता है। क्रुस्कल-वालिस परीक्षण का पैरामीट्रिक समतुल्य एकतरफा एनोवा है। विचरण का एकतरफा विश्लेषण (एनोवा)।
क्रुस्कल-वालिस रैंकों द्वारा परीक्षण, क्रुस्कल-वालिस ''एच'' परीक्षण<ref name="Laerd">[https://statistics.laerd.com/spss-tutorials/kruskal-wallis-h-test-using-spss-statistics.php Kruskal–Wallis H Test using SPSS Statistics], Laerd Statistics</ref> ([[विलियम क्रुस्कल]] और डब्ल्यू एलन वालिस के नाम पर), या रैंकों पर एक तरफ़ा एनोवा<ref name="Laerd" /> गैर-पैरामीट्रिक सांख्यिकी है। यह परीक्षण करने के लिए गैर-पैरामीट्रिक विधि है कि नमूने एक ही वितरण से उत्पन्न होते हैं या नहीं।<ref>{{cite journal |last=Kruskal |last2=Wallis |year=1952 |title=एक-मानदंड विचरण विश्लेषण में रैंकों का उपयोग|journal=[[Journal of the American Statistical Association]] |volume=47 |issue=260 |pages=583–621 |doi=10.1080/01621459.1952.10483441 }}</ref><ref>{{cite book |last=Corder |first=Gregory W. |first2=Dale I. |last2=Foreman |year=2009 |title=गैर-सांख्यिकीविदों के लिए गैरपारंपरिक सांख्यिकी|url=https://archive.org/details/nonparametricsta00cord |url-access=limited |location=Hoboken |publisher=John Wiley & Sons |pages=[https://archive.org/details/nonparametricsta00cord/page/n114 99]–105 |isbn=9780470454619 }}</ref><ref>{{cite book |last=Siegel |last2=Castellan |year=1988 |title=स्वभावजन्य विज्ञान के लिए नॉनपैरामीट्रिक आंकड़े|edition=Second |location=New York |publisher=McGraw–Hill |isbn=0070573573 }}</ref> इसका उपयोग समान या भिन्न नमूना आकार के दो या दो से अधिक स्वतंत्र नमूनों की तुलना करने के लिए किया जाता है। यह मान-व्हिटनी यू परीक्षण | मान-व्हिटनी यू परीक्षण का विस्तार करता है, जिसका उपयोग केवल दो समूहों की तुलना करने के लिए किया जाता है। क्रुस्कल-वालिस परीक्षण का पैरामीट्रिक समतुल्य एकतरफा एनोवा है। विचरण का एकतरफा विश्लेषण (एनोवा)।


एक महत्वपूर्ण क्रुस्कल-वालिस परीक्षण इंगित करता है कि कम से कम एक नमूना स्टोचैस्टिक प्रभुत्व एक अन्य नमूना है। परीक्षण यह नहीं पहचानता है कि यह स्टोकास्टिक प्रभुत्व कहां होता है या स्टोकास्टिक प्रभुत्व कितने समूहों के जोड़े के लिए प्राप्त होता है। [[स्टोकेस्टिक प्रभुत्व]] के लिए विशिष्ट नमूना जोड़े का विश्लेषण करने के लिए, डन का परीक्षण,<ref name=Dunn>{{cite journal |last=Dunn |first=Olive Jean |year=1964 |title=रैंक योगों का उपयोग करके एकाधिक तुलना| journal=Technometrics |volume=6 |issue=3 |pages=241–252 |doi=10.2307/1266041}}</ref> बोन्फेरोनी सुधार के साथ जोड़ीदार मान-व्हिटनी परीक्षण,<ref name=Conover>{{cite report | last1=Conover | first1=W. Jay | last2=Iman | first2=Ronald L. |date=1979 |title="बहु-तुलना प्रक्रियाओं पर"|url=http://library.lanl.gov/cgi-bin/getfile?00209046.pdf |publisher=Los Alamos Scientific Laboratory |access-date=2016-10-28}}</ref> या अधिक शक्तिशाली लेकिन कम प्रसिद्ध कोनोवर-ईमान परीक्षण<ref name=Conover>{{cite report | last1=Conover | first1=W. Jay | last2=Iman | first2=Ronald L. |date=1979 |title="बहु-तुलना प्रक्रियाओं पर"|url=http://library.lanl.gov/cgi-bin/getfile?00209046.pdf |publisher=Los Alamos Scientific Laboratory |access-date=2016-10-28}}</ref> कभी-कभी उपयोग किए जाते हैं।
महत्वपूर्ण क्रुस्कल-वालिस परीक्षण इंगित करता है कि कम से कम नमूना स्टोचैस्टिक प्रभुत्व अन्य नमूना है। परीक्षण यह नहीं पहचानता है कि यह स्टोकास्टिक प्रभुत्व कहां होता है या स्टोकास्टिक प्रभुत्व कितने समूहों के जोड़े के लिए प्राप्त होता है। [[स्टोकेस्टिक प्रभुत्व]] के लिए विशिष्ट नमूना जोड़े का विश्लेषण करने के लिए, डन का परीक्षण,<ref name=Dunn>{{cite journal |last=Dunn |first=Olive Jean |year=1964 |title=रैंक योगों का उपयोग करके एकाधिक तुलना| journal=Technometrics |volume=6 |issue=3 |pages=241–252 |doi=10.2307/1266041}}</ref> बोन्फेरोनी सुधार के साथ जोड़ीदार मान-व्हिटनी परीक्षण,<ref name=Conover>{{cite report | last1=Conover | first1=W. Jay | last2=Iman | first2=Ronald L. |date=1979 |title="बहु-तुलना प्रक्रियाओं पर"|url=http://library.lanl.gov/cgi-bin/getfile?00209046.pdf |publisher=Los Alamos Scientific Laboratory |access-date=2016-10-28}}</ref> या अधिक शक्तिशाली लेकिन कम प्रसिद्ध कोनोवर-ईमान परीक्षण<ref name=Conover>{{cite report | last1=Conover | first1=W. Jay | last2=Iman | first2=Ronald L. |date=1979 |title="बहु-तुलना प्रक्रियाओं पर"|url=http://library.lanl.gov/cgi-bin/getfile?00209046.pdf |publisher=Los Alamos Scientific Laboratory |access-date=2016-10-28}}</ref> कभी-कभी उपयोग किए जाते हैं।


चूंकि यह एक गैरपारंपरिक विधि है, क्रुस्कल-वालिस परीक्षण विचरण के समान एकतरफा विश्लेषण के विपरीत, अवशिष्टों के [[सामान्य वितरण]] को नहीं मानता है। यदि शोधकर्ता माध्यिका में किसी भी अंतर को छोड़कर, सभी समूहों के लिए एक समान आकार और मापित वितरण की धारणा बना सकता है, तो अशक्त परिकल्पना यह है कि सभी समूहों की माध्यिकाएँ समान हैं, और वैकल्पिक परिकल्पना यह है कि कम से कम एक जनसंख्या माध्यक एक समूह का कम से कम एक अन्य समूह की जनसंख्या माध्यिका से भिन्न है। अन्यथा, यह कहना असंभव है कि शून्य परिकल्पना की अस्वीकृति स्थान या समूह फैलाव में बदलाव से आती है या नहीं। यही समस्या मान-व्हिटनी परीक्षण के साथ भी होती है।<ref>{{cite news|last=Divine |last2=Norton | last3=Barón | last4= Juarez-Colunga |year=2018 |title=The Wilcoxon–Mann–Whitney Procedure Fails as a Test of Medians | publisher=The American Statistician |doi=10.1080/00031305.2017.1305291}}</ref><ref>{{cite news|last= Hart |year=2001 |title=Mann-Whitney test is not just a test of medians: differences in spread can be important | publisher=BMJ |doi=10.1136/bmj.323.7309.391}}</ref><ref>{{cite news|last=Bruin | year=2006 | title=FAQ: Why is the Mann-Whitney significant when the medians are equal?| publisher=UCLA: Statistical Consulting Group}}</ref>
चूंकि यह गैरपारंपरिक विधि है, क्रुस्कल-वालिस परीक्षण विचरण के समान एकतरफा विश्लेषण के विपरीत, अवशिष्टों के [[सामान्य वितरण]] को नहीं मानता है। यदि शोधकर्ता माध्यिका में किसी भी अंतर को छोड़कर, सभी समूहों के लिए समान आकार और मापित वितरण की धारणा बना सकता है, तो अशक्त परिकल्पना यह है कि सभी समूहों की माध्यिकाएँ समान हैं, और वैकल्पिक परिकल्पना यह है कि कम से कम जनसंख्या माध्यक समूह का कम से कम अन्य समूह की जनसंख्या माध्यिका से भिन्न है। अन्यथा, यह कहना असंभव है कि शून्य परिकल्पना की अस्वीकृति स्थान या समूह फैलाव में बदलाव से आती है या नहीं। यही समस्या मान-व्हिटनी परीक्षण के साथ भी होती है।<ref>{{cite news|last=Divine |last2=Norton | last3=Barón | last4= Juarez-Colunga |year=2018 |title=The Wilcoxon–Mann–Whitney Procedure Fails as a Test of Medians | publisher=The American Statistician |doi=10.1080/00031305.2017.1305291}}</ref><ref>{{cite news|last= Hart |year=2001 |title=Mann-Whitney test is not just a test of medians: differences in spread can be important | publisher=BMJ |doi=10.1136/bmj.323.7309.391}}</ref><ref>{{cite news|last=Bruin | year=2006 | title=FAQ: Why is the Mann-Whitney significant when the medians are equal?| publisher=UCLA: Statistical Consulting Group}}</ref>




Line 23: Line 23:
\end{align}
\end{align}
</math><br />अंतिम सूत्र में केवल औसत रैंक के वर्ग शामिल हैं।
</math><br />अंतिम सूत्र में केवल औसत रैंक के वर्ग शामिल हैं।
# संबंधों के लिए एक सुधार यदि पिछले बिंदु में वर्णित शॉर्ट-कट सूत्र का उपयोग करके विभाजित करके किया जा सकता है <math>H</math> द्वारा <math>1 - \frac{\sum_{i=1}^G (t_i^3 - t_i)}{N^3-N}</math>, जहां G अलग-अलग बंधी रैंकों के समूहों की संख्या है, और t<sub>''i''</sub> समूह i के भीतर बंधे हुए मानों की संख्या है जो एक विशेष मूल्य पर बंधे हैं। यह सुधार आमतौर पर एच के मूल्य में थोड़ा अंतर करता है जब तक कि बड़ी संख्या में संबंध न हों।
# संबंधों के लिए सुधार यदि पिछले बिंदु में वर्णित शॉर्ट-कट सूत्र का उपयोग करके विभाजित करके किया जा सकता है <math>H</math> द्वारा <math>1 - \frac{\sum_{i=1}^G (t_i^3 - t_i)}{N^3-N}</math>, जहां G अलग-अलग बंधी रैंकों के समूहों की संख्या है, और t<sub>''i''</sub> समूह i के भीतर बंधे हुए मानों की संख्या है जो विशेष मूल्य पर बंधे हैं। यह सुधार आमतौर पर एच के मूल्य में थोड़ा अंतर करता है जब तक कि बड़ी संख्या में संबंध न हों।
# अंत में, अशक्त परिकल्पना को अस्वीकार करने या न करने का निर्णय तुलना करके किया जाता है <math>H</math> एक महत्वपूर्ण मूल्य के लिए <math>H_c</math> किसी दिए गए महत्व या अल्फा स्तर के लिए किसी तालिका या सॉफ़्टवेयर से प्राप्त किया गया। अगर <math>H</math> के अपेक्षा बड़ा है <math>H_c</math>, शून्य परिकल्पना अस्वीकृत की जाती है। यदि संभव हो (कोई संबंध नहीं, नमूना बहुत बड़ा नहीं है) तो तुलना करनी चाहिए <math>H</math> के सटीक वितरण से प्राप्त महत्वपूर्ण मूल्य के लिए <math>H</math>. अन्यथा, एच के वितरण को स्वतंत्रता की जी-1 डिग्री के साथ [[ची-वर्ग वितरण]] द्वारा अनुमानित किया जा सकता है। यदि कुछ <math>n_i</math> मान छोटे हैं (अर्थात, 5 से कम) का सटीक संभाव्यता वितरण <math>H</math> इस ची-स्क्वायर वितरण से काफी अलग हो सकता है। यदि ची-वर्ग संभाव्यता बंटन की तालिका उपलब्ध है, तो ची-वर्ग का महत्वपूर्ण मान, <math>\chi^2_{\alpha: g-1}</math>, g − 1 [[स्वतंत्रता की डिग्री (सांख्यिकी)]] पर तालिका दर्ज करके और वांछित सांख्यिकीय महत्व या अल्फा स्तर के तहत देख कर पाया जा सकता है।
# अंत में, अशक्त परिकल्पना को अस्वीकार करने या न करने का निर्णय तुलना करके किया जाता है <math>H</math> महत्वपूर्ण मूल्य के लिए <math>H_c</math> किसी दिए गए महत्व या अल्फा स्तर के लिए किसी तालिका या सॉफ़्टवेयर से प्राप्त किया गया। अगर <math>H</math> के अपेक्षा बड़ा है <math>H_c</math>, शून्य परिकल्पना अस्वीकृत की जाती है। यदि संभव हो (कोई संबंध नहीं, नमूना बहुत बड़ा नहीं है) तो तुलना करनी चाहिए <math>H</math> के सटीक वितरण से प्राप्त महत्वपूर्ण मूल्य के लिए <math>H</math>. अन्यथा, एच के वितरण को स्वतंत्रता की जी-1 डिग्री के साथ [[ची-वर्ग वितरण]] द्वारा अनुमानित किया जा सकता है। यदि कुछ <math>n_i</math> मान छोटे हैं (अर्थात, 5 से कम) का सटीक संभाव्यता वितरण <math>H</math> इस ची-स्क्वायर वितरण से काफी अलग हो सकता है। यदि ची-वर्ग संभाव्यता बंटन की तालिका उपलब्ध है, तो ची-वर्ग का महत्वपूर्ण मान, <math>\chi^2_{\alpha: g-1}</math>, g − 1 [[स्वतंत्रता की डिग्री (सांख्यिकी)]] पर तालिका दर्ज करके और वांछित सांख्यिकीय महत्व या अल्फा स्तर के तहत देख कर पाया जा सकता है।
# यदि आँकड़ा महत्वपूर्ण नहीं है, तो नमूनों के बीच स्टोचैस्टिक प्रभुत्व का कोई प्रमाण नहीं है। हालांकि, यदि परीक्षण महत्वपूर्ण है तो कम से कम एक नमूना दूसरे नमूने पर स्थिर रूप से हावी हो जाता है। इसलिए, एक शोधकर्ता अलग-अलग नमूना जोड़े के बीच नमूना विरोधाभासों का उपयोग कर सकता है, या डन के परीक्षण का उपयोग करके पोस्ट हॉक परीक्षण कर सकता है, जो (1) क्रुस्कल-वालिस परीक्षण के समान रैंकिंग को ठीक से नियोजित करता है, और (2) शून्य द्वारा निहित पूलित भिन्नता को ठीक से नियोजित करता है। क्रुस्कल-वालिस परीक्षण की परिकल्पना यह निर्धारित करने के लिए कि कौन से नमूना जोड़े महत्वपूर्ण रूप से भिन्न हैं।<ref name=Dunn />एकाधिक नमूना विरोधाभास या परीक्षण करते समय, टाइप I त्रुटि दर बढ़ जाती है, जिससे [[एकाधिक तुलना समस्या]] के बारे में चिंता बढ़ जाती है।
# यदि आँकड़ा महत्वपूर्ण नहीं है, तो नमूनों के बीच स्टोचैस्टिक प्रभुत्व का कोई प्रमाण नहीं है। हालांकि, यदि परीक्षण महत्वपूर्ण है तो कम से कम नमूना दूसरे नमूने पर स्थिर रूप से हावी हो जाता है। इसलिए, शोधकर्ता अलग-अलग नमूना जोड़े के बीच नमूना विरोधाभासों का उपयोग कर सकता है, या डन के परीक्षण का उपयोग करके पोस्ट हॉक परीक्षण कर सकता है, जो (1) क्रुस्कल-वालिस परीक्षण के समान रैंकिंग को ठीक से नियोजित करता है, और (2) शून्य द्वारा निहित पूलित भिन्नता को ठीक से नियोजित करता है। क्रुस्कल-वालिस परीक्षण की परिकल्पना यह निर्धारित करने के लिए कि कौन से नमूना जोड़े महत्वपूर्ण रूप से भिन्न हैं।<ref name=Dunn />एकाधिक नमूना विरोधाभास या परीक्षण करते समय, टाइप I त्रुटि दर बढ़ जाती है, जिससे [[एकाधिक तुलना समस्या]] के बारे में चिंता बढ़ जाती है।


== सटीक संभाव्यता तालिका ==
== सटीक संभाव्यता तालिका ==
Line 43: Line 43:
|doi=10.1081/SAC-120023876
|doi=10.1081/SAC-120023876
}}</ref>
}}</ref>
के सटीक वितरण की गणना करने के लिए विकसित की गई दो विधियों की समीक्षा की <math>H</math>, एक नया प्रस्तावित किया, और सटीक वितरण की तुलना इसके ची-स्क्वायर सन्निकटन से की।
के सटीक वितरण की गणना करने के लिए विकसित की गई दो विधियों की समीक्षा की <math>H</math>, नया प्रस्तावित किया, और सटीक वितरण की तुलना इसके ची-स्क्वायर सन्निकटन से की।


== उदाहरण ==
== उदाहरण ==
Line 57: Line 57:
न्यूयॉर्क शहर में 1 मई से 30 सितंबर, 1973 तक ओजोन की दैनिक रीडिंग पर। डेटा R डेटा सेट वायु गुणवत्ता में हैं, और विश्लेषण R फ़ंक्शन kruskal.test के लिए प्रलेखन में शामिल है। महीने के अनुसार ओजोन मूल्यों के बॉक्सप्लॉट चित्र में दिखाए गए हैं।
न्यूयॉर्क शहर में 1 मई से 30 सितंबर, 1973 तक ओजोन की दैनिक रीडिंग पर। डेटा R डेटा सेट वायु गुणवत्ता में हैं, और विश्लेषण R फ़ंक्शन kruskal.test के लिए प्रलेखन में शामिल है। महीने के अनुसार ओजोन मूल्यों के बॉक्सप्लॉट चित्र में दिखाए गए हैं।


[[File:Ozone_by_month_boxplots.svg|300px|]]क्रुस्कल-वालिस परीक्षण में एक महत्वपूर्ण अंतर (p = 6.901e-06) मिलता है जो दर्शाता है कि ओजोन 5 महीनों के बीच भिन्न होता है।
[[File:Ozone_by_month_boxplots.svg|300px|]]क्रुस्कल-वालिस परीक्षण में महत्वपूर्ण अंतर (p = 6.901e-06) मिलता है जो दर्शाता है कि ओजोन 5 महीनों के बीच भिन्न होता है।


<syntaxhighlight lang="R">
<syntaxhighlight lang="R">
Line 104: Line 104:
==बाहरी संबंध==
==बाहरी संबंध==
* [https://web.archive.org/web/20170513093000/http://faculty.vassar.edu/lowry/kw3.html An online version of the test]
* [https://web.archive.org/web/20170513093000/http://faculty.vassar.edu/lowry/kw3.html An online version of the test]
{{statistics|inference|collapsed}}


{{DEFAULTSORT:Kruskal-Wallis one-way analysis of variance}}[[Category: सांख्यिकीय परीक्षण]] [[Category: भिन्नता का विश्लेषण]] [[Category: गैर पैरामीट्रिक आँकड़े]]  
{{DEFAULTSORT:Kruskal-Wallis one-way analysis of variance}}[[Category: सांख्यिकीय परीक्षण]] [[Category: भिन्नता का विश्लेषण]] [[Category: गैर पैरामीट्रिक आँकड़े]]  

Revision as of 09:31, 21 June 2023

क्रुस्कल-वालिस रैंकों द्वारा परीक्षण, क्रुस्कल-वालिस एच परीक्षण[1] (विलियम क्रुस्कल और डब्ल्यू एलन वालिस के नाम पर), या रैंकों पर एक तरफ़ा एनोवा[1] गैर-पैरामीट्रिक सांख्यिकी है। यह परीक्षण करने के लिए गैर-पैरामीट्रिक विधि है कि नमूने एक ही वितरण से उत्पन्न होते हैं या नहीं।[2][3][4] इसका उपयोग समान या भिन्न नमूना आकार के दो या दो से अधिक स्वतंत्र नमूनों की तुलना करने के लिए किया जाता है। यह मान-व्हिटनी यू परीक्षण | मान-व्हिटनी यू परीक्षण का विस्तार करता है, जिसका उपयोग केवल दो समूहों की तुलना करने के लिए किया जाता है। क्रुस्कल-वालिस परीक्षण का पैरामीट्रिक समतुल्य एकतरफा एनोवा है। विचरण का एकतरफा विश्लेषण (एनोवा)।

महत्वपूर्ण क्रुस्कल-वालिस परीक्षण इंगित करता है कि कम से कम नमूना स्टोचैस्टिक प्रभुत्व अन्य नमूना है। परीक्षण यह नहीं पहचानता है कि यह स्टोकास्टिक प्रभुत्व कहां होता है या स्टोकास्टिक प्रभुत्व कितने समूहों के जोड़े के लिए प्राप्त होता है। स्टोकेस्टिक प्रभुत्व के लिए विशिष्ट नमूना जोड़े का विश्लेषण करने के लिए, डन का परीक्षण,[5] बोन्फेरोनी सुधार के साथ जोड़ीदार मान-व्हिटनी परीक्षण,[6] या अधिक शक्तिशाली लेकिन कम प्रसिद्ध कोनोवर-ईमान परीक्षण[6] कभी-कभी उपयोग किए जाते हैं।

चूंकि यह गैरपारंपरिक विधि है, क्रुस्कल-वालिस परीक्षण विचरण के समान एकतरफा विश्लेषण के विपरीत, अवशिष्टों के सामान्य वितरण को नहीं मानता है। यदि शोधकर्ता माध्यिका में किसी भी अंतर को छोड़कर, सभी समूहों के लिए समान आकार और मापित वितरण की धारणा बना सकता है, तो अशक्त परिकल्पना यह है कि सभी समूहों की माध्यिकाएँ समान हैं, और वैकल्पिक परिकल्पना यह है कि कम से कम जनसंख्या माध्यक समूह का कम से कम अन्य समूह की जनसंख्या माध्यिका से भिन्न है। अन्यथा, यह कहना असंभव है कि शून्य परिकल्पना की अस्वीकृति स्थान या समूह फैलाव में बदलाव से आती है या नहीं। यही समस्या मान-व्हिटनी परीक्षण के साथ भी होती है।[7][8][9]


विधि

  1. सभी समूहों के सभी डेटा को एक साथ रैंक करें; यानी समूह सदस्यता को अनदेखा करते हुए डेटा को 1 से N तक रैंक करें। किसी भी बंधे हुए मूल्यों को असाइन करें, उन्हें प्राप्त होने वाले रैंकों का औसत अगर वे बंधे नहीं होते।
  2. परीक्षण आँकड़ा इसके द्वारा दिया गया है
    कहाँ
    • सभी समूहों में प्रेक्षणों की कुल संख्या है
    • समूहों की संख्या है
    • समूह में टिप्पणियों की संख्या है
    • प्रेक्षण की कोटि (सभी प्रेक्षणों के बीच) है समूह से
    • समूह में सभी अवलोकनों का औसत रैंक है
    • सभी का औसत है .
  3. यदि डेटा में अभिव्यक्ति के भाजक के लिए कोई संबंध नहीं है बिल्कुल सही है और . इस प्रकार

    अंतिम सूत्र में केवल औसत रैंक के वर्ग शामिल हैं।
  4. संबंधों के लिए सुधार यदि पिछले बिंदु में वर्णित शॉर्ट-कट सूत्र का उपयोग करके विभाजित करके किया जा सकता है द्वारा , जहां G अलग-अलग बंधी रैंकों के समूहों की संख्या है, और ti समूह i के भीतर बंधे हुए मानों की संख्या है जो विशेष मूल्य पर बंधे हैं। यह सुधार आमतौर पर एच के मूल्य में थोड़ा अंतर करता है जब तक कि बड़ी संख्या में संबंध न हों।
  5. अंत में, अशक्त परिकल्पना को अस्वीकार करने या न करने का निर्णय तुलना करके किया जाता है महत्वपूर्ण मूल्य के लिए किसी दिए गए महत्व या अल्फा स्तर के लिए किसी तालिका या सॉफ़्टवेयर से प्राप्त किया गया। अगर के अपेक्षा बड़ा है , शून्य परिकल्पना अस्वीकृत की जाती है। यदि संभव हो (कोई संबंध नहीं, नमूना बहुत बड़ा नहीं है) तो तुलना करनी चाहिए के सटीक वितरण से प्राप्त महत्वपूर्ण मूल्य के लिए . अन्यथा, एच के वितरण को स्वतंत्रता की जी-1 डिग्री के साथ ची-वर्ग वितरण द्वारा अनुमानित किया जा सकता है। यदि कुछ मान छोटे हैं (अर्थात, 5 से कम) का सटीक संभाव्यता वितरण इस ची-स्क्वायर वितरण से काफी अलग हो सकता है। यदि ची-वर्ग संभाव्यता बंटन की तालिका उपलब्ध है, तो ची-वर्ग का महत्वपूर्ण मान, , g − 1 स्वतंत्रता की डिग्री (सांख्यिकी) पर तालिका दर्ज करके और वांछित सांख्यिकीय महत्व या अल्फा स्तर के तहत देख कर पाया जा सकता है।
  6. यदि आँकड़ा महत्वपूर्ण नहीं है, तो नमूनों के बीच स्टोचैस्टिक प्रभुत्व का कोई प्रमाण नहीं है। हालांकि, यदि परीक्षण महत्वपूर्ण है तो कम से कम नमूना दूसरे नमूने पर स्थिर रूप से हावी हो जाता है। इसलिए, शोधकर्ता अलग-अलग नमूना जोड़े के बीच नमूना विरोधाभासों का उपयोग कर सकता है, या डन के परीक्षण का उपयोग करके पोस्ट हॉक परीक्षण कर सकता है, जो (1) क्रुस्कल-वालिस परीक्षण के समान रैंकिंग को ठीक से नियोजित करता है, और (2) शून्य द्वारा निहित पूलित भिन्नता को ठीक से नियोजित करता है। क्रुस्कल-वालिस परीक्षण की परिकल्पना यह निर्धारित करने के लिए कि कौन से नमूना जोड़े महत्वपूर्ण रूप से भिन्न हैं।[5]एकाधिक नमूना विरोधाभास या परीक्षण करते समय, टाइप I त्रुटि दर बढ़ जाती है, जिससे एकाधिक तुलना समस्या के बारे में चिंता बढ़ जाती है।

सटीक संभाव्यता तालिका

क्रस्कल-वालिस परीक्षण के लिए सटीक संभावनाओं की गणना करने के लिए बड़ी मात्रा में कंप्यूटिंग संसाधनों की आवश्यकता होती है। मौजूदा सॉफ़्टवेयर लगभग 30 प्रतिभागियों से कम नमूना आकार के लिए केवल सटीक संभावनाएं प्रदान करता है। ये सॉफ़्टवेयर प्रोग्राम बड़े नमूना आकार के लिए स्पर्शोन्मुख सन्निकटन पर निर्भर करते हैं।

बड़े नमूना आकारों के लिए सटीक संभाव्यता मान उपलब्ध हैं। स्परियर (2003) ने 45 प्रतिभागियों के रूप में बड़े नमूनों के लिए सटीक संभाव्यता सारणी प्रकाशित की।[10] मेयर और सीमैन (2006) ने 105 प्रतिभागियों के रूप में बड़े नमूनों के लिए सटीक संभाव्यता वितरण का उत्पादन किया।[11]


== एच == का सटीक वितरण चोई एट अल।[12] के सटीक वितरण की गणना करने के लिए विकसित की गई दो विधियों की समीक्षा की , नया प्रस्तावित किया, और सटीक वितरण की तुलना इसके ची-स्क्वायर सन्निकटन से की।

उदाहरण

महीने के अनुसार ओजोन के स्तर में अंतर के लिए परीक्षण

निम्न उदाहरण चेम्बर्स एट अल से डेटा का उपयोग करता है।[13] न्यूयॉर्क शहर में 1 मई से 30 सितंबर, 1973 तक ओजोन की दैनिक रीडिंग पर। डेटा R डेटा सेट वायु गुणवत्ता में हैं, और विश्लेषण R फ़ंक्शन kruskal.test के लिए प्रलेखन में शामिल है। महीने के अनुसार ओजोन मूल्यों के बॉक्सप्लॉट चित्र में दिखाए गए हैं।

Ozone by month boxplots.svgक्रुस्कल-वालिस परीक्षण में महत्वपूर्ण अंतर (p = 6.901e-06) मिलता है जो दर्शाता है कि ओजोन 5 महीनों के बीच भिन्न होता है।

kruskal.test(Ozone ~ Month, data = airquality)

	Kruskal-Wallis rank sum test

data:  Ozone by Month
Kruskal-Wallis chi-squared = 29.267, df = 4, p-value = 6.901e-06

यह निर्धारित करने के लिए कि कौन से महीने अलग-अलग हैं, कई परिकल्पना परीक्षण के लिए बोनफेरोनी (या अन्य) सुधार के साथ, महीनों की प्रत्येक जोड़ी के लिए विलकॉक्सन परीक्षण का उपयोग करके पोस्ट-हॉक परीक्षण किया जा सकता है।

pairwise.wilcox.test(airquality$Ozone, airquality$Month, p.adjust.method = "bonferroni")


	Pairwise comparisons using Wilcoxon rank sum test 

data:  airquality$Ozone and airquality$Month 

  5      6      7      8     
6 1.0000 -      -      -     
7 0.0003 0.1414 -      -     
8 0.0012 0.2591 1.0000 -     
9 1.0000 1.0000 0.0074 0.0325

P value adjustment method: bonferroni

पोस्ट-हॉक परीक्षणों से संकेत मिलता है कि, कई परीक्षण के लिए बोनफेरोनी सुधार के बाद, निम्नलिखित अंतर महत्वपूर्ण हैं (समायोजित पी <0.05)।

  • माह 5 बनाम माह 7 और 8
  • माह 9 बनाम माह 7 और 8

यह भी देखें

संदर्भ

  1. 1.0 1.1 Kruskal–Wallis H Test using SPSS Statistics, Laerd Statistics
  2. Kruskal; Wallis (1952). "एक-मानदंड विचरण विश्लेषण में रैंकों का उपयोग". Journal of the American Statistical Association. 47 (260): 583–621. doi:10.1080/01621459.1952.10483441.
  3. Corder, Gregory W.; Foreman, Dale I. (2009). गैर-सांख्यिकीविदों के लिए गैरपारंपरिक सांख्यिकी. Hoboken: John Wiley & Sons. pp. 99–105. ISBN 9780470454619.
  4. Siegel; Castellan (1988). स्वभावजन्य विज्ञान के लिए नॉनपैरामीट्रिक आंकड़े (Second ed.). New York: McGraw–Hill. ISBN 0070573573.
  5. 5.0 5.1 Dunn, Olive Jean (1964). "रैंक योगों का उपयोग करके एकाधिक तुलना". Technometrics. 6 (3): 241–252. doi:10.2307/1266041.
  6. 6.0 6.1 Conover, W. Jay; Iman, Ronald L. (1979). "बहु-तुलना प्रक्रियाओं पर" (PDF) (Report). Los Alamos Scientific Laboratory. Retrieved 2016-10-28.
  7. Divine; Norton; Barón; Juarez-Colunga (2018). "The Wilcoxon–Mann–Whitney Procedure Fails as a Test of Medians". The American Statistician. doi:10.1080/00031305.2017.1305291.
  8. Hart (2001). "Mann-Whitney test is not just a test of medians: differences in spread can be important". BMJ. doi:10.1136/bmj.323.7309.391.
  9. Bruin (2006). "FAQ: Why is the Mann-Whitney significant when the medians are equal?". UCLA: Statistical Consulting Group.
  10. Spurrier, J. D. (2003). "On the null distribution of the Kruskal–Wallis statistic". Journal of Nonparametric Statistics. 15 (6): 685–691. doi:10.1080/10485250310001634719.
  11. Meyer; Seaman (April 2006). "Expanded tables of critical values for the Kruskal–Wallis H statistic". Paper presented at the annual meeting of the American Educational Research Association, San Francisco. Critical value tables and exact probabilities from Meyer and Seaman are available for download at http://faculty.virginia.edu/kruskal-wallis/ Archived 2018-10-17 at the Wayback Machine. A paper describing their work may also be found there.
  12. Won Choi, Jae Won Lee, Myung-Hoe Huh, and Seung-Ho Kang (2003). "An Algorithm for Computing the Exact Distribution of the Kruskal–Wallis Test". Communications in Statistics - Simulation and Computation (32, number 4): 1029–1040. doi:10.1081/SAC-120023876.{{cite journal}}: CS1 maint: multiple names: authors list (link)
  13. John M. Chambers, William S. Cleveland, Beat Kleiner, and Paul A. Tukey (1983). Graphical Methods for Data Analysis. Belmont, Calif: Wadsworth International Group, Duxbury Press. ISBN 053498052X.{{cite book}}: CS1 maint: multiple names: authors list (link)


अग्रिम पठन


बाहरी संबंध