क्रुस्कल-वालिस विचरण का एकतरफा विश्लेषण: Difference between revisions
No edit summary |
No edit summary |
||
Line 1: | Line 1: | ||
{{Short description|Non-parametric method for testing whether samples originate from the same distribution}} | {{Short description|Non-parametric method for testing whether samples originate from the same distribution}} | ||
'''क्रस्कल-वालिस एच परीक्षण''' <ref name="Laerd">[https://statistics.laerd.com/spss-tutorials/kruskal-wallis-h-test-using-spss-statistics.php Kruskal–Wallis H Test using SPSS Statistics], Laerd Statistics</ref> ([[विलियम क्रुस्कल]] और डब्ल्यू एलन वालिस के नाम पर) या रैंकों पर वन-वे एनोवा द्वारा क्रस्कल-वालिस परीक्षण होता है <ref name="Laerd" /> यह परीक्षण करने के लिए एक गैर-पैरामीट्रिक विधि है कि प्रतिरूप उसी से उत्पन्न होते हैं या नहीं वितरण होते है। <ref>{{cite journal |last=Kruskal |last2=Wallis |year=1952 |title=एक-मानदंड विचरण विश्लेषण में रैंकों का उपयोग|journal=[[Journal of the American Statistical Association]] |volume=47 |issue=260 |pages=583–621 |doi=10.1080/01621459.1952.10483441 }}</ref><ref>{{cite book |last=Corder |first=Gregory W. |first2=Dale I. |last2=Foreman |year=2009 |title=गैर-सांख्यिकीविदों के लिए गैरपारंपरिक सांख्यिकी|url=https://archive.org/details/nonparametricsta00cord |url-access=limited |location=Hoboken |publisher=John Wiley & Sons |pages=[https://archive.org/details/nonparametricsta00cord/page/n114 99]–105 |isbn=9780470454619 }}</ref><ref>{{cite book |last=Siegel |last2=Castellan |year=1988 |title=स्वभावजन्य विज्ञान के लिए नॉनपैरामीट्रिक आंकड़े|edition=Second |location=New York |publisher=McGraw–Hill |isbn=0070573573 }}</ref> इसका उपयोग समान या भिन्न प्रतिरूप आकार के दो या दो से अधिक स्वतंत्र प्रतिरूपों की तुलना करने के लिए किया जाता है। यह मान-व्हिटनी यू परीक्षण का विस्तार करता है जिसका उपयोग केवल दो समूहों की तुलना करने के लिए किया जाता है। क्रुस्कल-वालिस परीक्षण का पैरामीट्रिक समकक्ष विचरण (एनोवा) का एकतरफा विश्लेषण है। | |||
महत्वपूर्ण क्रुस्कल-वालिस परीक्षण | महत्वपूर्ण क्रुस्कल-वालिस परीक्षण संकेत करता है कि कम से कम प्रतिरूप स्टोचैस्टिक प्रभुत्व अन्य प्रतिरूप है। परीक्षण यह नहीं पहचानता है कि यह स्टोकास्टिक प्रभुत्व कहां होता है या स्टोकास्टिक प्रभुत्व कितने समूहों के जोड़े के लिए प्राप्त होता है। [[स्टोकेस्टिक प्रभुत्व]] के लिए विशिष्ट प्रतिरूप जोड़े का विश्लेषण करने के लिए, डन का परीक्षण,<ref name=Dunn>{{cite journal |last=Dunn |first=Olive Jean |year=1964 |title=रैंक योगों का उपयोग करके एकाधिक तुलना| journal=Technometrics |volume=6 |issue=3 |pages=241–252 |doi=10.2307/1266041}}</ref> बोन्फेरोनी सुधार के साथ जोड़ीदार मान-व्हिटनी परीक्षण,<ref name=Conover>{{cite report | last1=Conover | first1=W. Jay | last2=Iman | first2=Ronald L. |date=1979 |title="बहु-तुलना प्रक्रियाओं पर"|url=http://library.lanl.gov/cgi-bin/getfile?00209046.pdf |publisher=Los Alamos Scientific Laboratory |access-date=2016-10-28}}</ref> या अधिक शक्तिशाली किन्तु कम प्रसिद्ध कोनोवर-ईमान परीक्षण <ref name=Conover>{{cite report | last1=Conover | first1=W. Jay | last2=Iman | first2=Ronald L. |date=1979 |title="बहु-तुलना प्रक्रियाओं पर"|url=http://library.lanl.gov/cgi-bin/getfile?00209046.pdf |publisher=Los Alamos Scientific Laboratory |access-date=2016-10-28}}</ref> कभी-कभी उपयोग किए जाते हैं। | ||
चूंकि यह गैरपारंपरिक विधि है, क्रुस्कल-वालिस परीक्षण विचरण के समान एकतरफा विश्लेषण के विपरीत, अवशिष्टों के [[सामान्य वितरण]] को नहीं मानता है। यदि शोधकर्ता माध्यिका में किसी भी अंतर को छोड़कर, सभी समूहों के लिए समान आकार और मापित वितरण की धारणा बना सकता है, | चूंकि यह गैरपारंपरिक विधि है, क्रुस्कल-वालिस परीक्षण विचरण के समान एकतरफा विश्लेषण के विपरीत, अवशिष्टों के [[सामान्य वितरण]] को नहीं मानता है। इस प्रकार यदि शोधकर्ता माध्यिका में किसी भी अंतर को छोड़कर, सभी समूहों के लिए समान आकार और मापित वितरण की धारणा बना सकता है, जिससे अशक्त परिकल्पना यह है कि सभी समूहों की माध्यिकाएँ समान हैं, और वैकल्पिक परिकल्पना यह है कि कम से कम जनसंख्या माध्यक समूह का कम से कम अन्य समूह की जनसंख्या माध्यिका से भिन्न है। अन्यथा, यह कहना असंभव है कि शून्य परिकल्पना की अस्वीकृति स्थान या समूह फैलाव में बदलाव से आती है या नहीं आती है। यही समस्या मान-व्हिटनी परीक्षण के साथ भी होती है।<ref>{{cite news|last=Divine |last2=Norton | last3=Barón | last4= Juarez-Colunga |year=2018 |title=The Wilcoxon–Mann–Whitney Procedure Fails as a Test of Medians | publisher=The American Statistician |doi=10.1080/00031305.2017.1305291}}</ref><ref>{{cite news|last= Hart |year=2001 |title=Mann-Whitney test is not just a test of medians: differences in spread can be important | publisher=BMJ |doi=10.1136/bmj.323.7309.391}}</ref><ref>{{cite news|last=Bruin | year=2006 | title=FAQ: Why is the Mann-Whitney significant when the medians are equal?| publisher=UCLA: Statistical Consulting Group}}</ref> | ||
'''। यह मान-व्हिटनी यू परीक्षण | मान-व्हिटनी यू परीक्षण का विस्तार करता है, जिसका उपयोग केवल दो समूहों की तुलना करने के लिए किया जाता है।<br />''' | '''। यह मान-व्हिटनी यू परीक्षण | मान-व्हिटनी यू परीक्षण का विस्तार करता है, जिसका उपयोग केवल दो समूहों की तुलना करने के लिए किया जाता है।<br />''' | ||
== विधि == | == विधि == | ||
# सभी समूहों के सभी डेटा को एक साथ रैंक | # सभी समूहों के सभी डेटा को एक साथ रैंक करता है; अर्थात समूह सदस्यता को नजरअंदाज करते हुए डेटा को 1 से N तक रैंक करता है। इस प्रकार किसी भी बंधे हुए मूल्यों को असाइन करें और उन्हें प्राप्त होने वाले रैंकों का औसत यदि वे बंधे नहीं होते है। | ||
# परीक्षण आँकड़ा इसके द्वारा दिया गया है | # परीक्षण आँकड़ा इसके द्वारा दिया गया है | ||
#:<math>H = (N-1)\frac{\sum_{i=1}^g n_i(\bar{r}_{i\cdot} - \bar{r})^2}{\sum_{i=1}^g\sum_{j=1}^{n_i}(r_{ij} - \bar{r})^2},</math> कहाँ | #:<math>H = (N-1)\frac{\sum_{i=1}^g n_i(\bar{r}_{i\cdot} - \bar{r})^2}{\sum_{i=1}^g\sum_{j=1}^{n_i}(r_{ij} - \bar{r})^2},</math> कहाँ | ||
#*<math>N</math> सभी समूहों में प्रेक्षणों की कुल संख्या है | #*<math>N</math> सभी समूहों में प्रेक्षणों की कुल संख्या है | ||
#*<math>g</math> समूहों की संख्या है | #*<math>g</math> समूहों की संख्या है | ||
#*<math>n_i</math> समूह में टिप्पणियों | #*<math>n_i</math> समूह में टिप्पणियों <math>i</math> की संख्या है | ||
#*<math>r_{ij}</math> | #*<math>r_{ij}</math> समूह <math>i</math> से अवलोकन <math>j</math> का रैंक (सभी अवलोकनों के बीच) है | ||
#*<math>\bar{r}_{i\cdot} = \frac{\sum_{j=1}^{n_i}{r_{ij}}}{n_i}</math> समूह | #*<math>\bar{r}_{i\cdot} = \frac{\sum_{j=1}^{n_i}{r_{ij}}}{n_i}</math> समूह <math>i</math> में सभी अवलोकनों का औसत रैंक है | ||
#*<math>\bar{r} =\tfrac 12 (N+1)</math> सभी | #*<math>\bar{r} =\tfrac 12 (N+1)</math> सभी <math>r_{ij}</math> का औसत है | ||
# यदि डेटा में | #यदि डेटा में कोई संबंध नहीं है तो <math>H</math> के लिए अभिव्यक्ति के प्रत्येक पूर्ण रूप से <math>(N-1)N(N+1)/12</math> और <math>\bar{r}=\tfrac{N+1}{2}</math> सही है। इस प्रकार | ||
#:<math> | #:<math> | ||
\begin{align} | \begin{align} | ||
H & = \frac{12}{N(N+1)}\sum_{i=1}^g n_i \left(\bar{r}_{i\cdot} - \frac{N+1}{2}\right)^2 \\ & = \frac{12}{N(N+1)}\sum_{i=1}^g n_i \bar{r}_{i\cdot }^2 -\ 3(N+1) | H & = \frac{12}{N(N+1)}\sum_{i=1}^g n_i \left(\bar{r}_{i\cdot} - \frac{N+1}{2}\right)^2 \\ & = \frac{12}{N(N+1)}\sum_{i=1}^g n_i \bar{r}_{i\cdot }^2 -\ 3(N+1) | ||
\end{align} | \end{align} | ||
</math><br />अंतिम सूत्र में केवल औसत | </math><br /> | ||
# संबंधों के लिए सुधार यदि पिछले बिंदु में वर्णित शॉर्ट-कट सूत्र का उपयोग करके | #:अंतिम सूत्र में केवल औसत रैंकों के वर्ग होते हैं। | ||
# अंत में, अशक्त परिकल्पना को अस्वीकार करने या न करने का निर्णय | #संबंधों के लिए एक सुधार यदि पिछले बिंदु में वर्णित शॉर्ट-कट सूत्र का उपयोग करके <math>H</math> को <math>1 - \frac{\sum_{i=1}^G (t_i^3 - t_i)}{N^3-N}</math> से विभाजित करके बनाया जा सकता है जहां G विभिन्न बंधे हुए रैंकों के समूहों की संख्या है और ti समूह i के अन्दर बंधे मूल्यों की संख्या है जो एक विशेष मूल्य पर बंधे हैं। यह सुधार सामान्यतः एच के मूल्य में थोड़ा अंतर करता है जब तक कि बड़ी संख्या में कोई संबंध नही होंता है। | ||
# यदि आँकड़ा महत्वपूर्ण नहीं है, | #इस प्रकार अंत में, अशक्त परिकल्पना को अस्वीकार करने या न करने का निर्णय किसी दिए गए महत्व या अल्फा स्तर के लिए तालिका या सॉफ़्टवेयर से प्राप्त महत्वपूर्ण मान <math>H</math> से <math>H_c</math> की तुलना करके किया जाता है। यदि <math>H</math>, <math>H_c</math> से बड़ा है, जिससे शून्य परिकल्पना को अस्वीकार कर दिया जाता है। यदि संभव हो (कोई संबंध प्रतिरूप बहुत बड़ा नहीं है) तो एच की तुलना एच के स्पष्ट वितरण से प्राप्त महत्वपूर्ण मूल्य से करनी चाहिए। अन्यथा, <math>H</math> के वितरण को g-1 डिग्री स्वतंत्रता के साथ [[ची-वर्ग वितरण]] द्वारा अनुमानित किया जा सकता है। यदि कुछ <math>n_i</math> मान छोटे हैं (अर्थात्, 5 से कम) <math>H</math> का स्पष्ट संभाव्यता वितरण इस ची-स्क्वायर वितरण से अधिक भिन्न हो सकता है। इस प्रकार यदि ची-स्क्वायर संभाव्यता वितरण की एक तालिका उपलब्ध है, जिससे ची-स्क्वेर्ड <math>\chi^2_{\alpha: g-1}</math> का महत्वपूर्ण मान g - 1 [[स्वतंत्रता की डिग्री (सांख्यिकी)]] पर तालिका में प्रवेश करके और वांछित के अनुसार देख कर पाया जा सकता है। | ||
# यदि आँकड़ा महत्वपूर्ण नहीं है, जिससे प्रतिरूपो के बीच स्टोचैस्टिक प्रभुत्व का कोई प्रमाण नहीं है। चूँकि, यदि परीक्षण महत्वपूर्ण है जिससे कम से कम प्रतिरूप दूसरे प्रतिरूप पर स्थिर रूप से हावी हो जाता है। इसलिए, शोधकर्ता अलग-अलग प्रतिरूप जोड़े के बीच प्रतिरूप विरोधाभासों का उपयोग कर सकता है, या इस प्रकार डन के परीक्षण का उपयोग करके पोस्ट हॉक परीक्षण कर सकता है, जो (1) क्रुस्कल-वालिस परीक्षण के समान रैंकिंग को ठीक से नियोजित करता है, और (2) शून्य द्वारा निहित पूलित भिन्नता को ठीक से नियोजित करता है। क्रुस्कल-वालिस परीक्षण की परिकल्पना यह निर्धारित करने के लिए कि कौन से प्रतिरूप जोड़े महत्वपूर्ण रूप से भिन्न हैं।<ref name=Dunn /> इस प्रकार एकाधिक प्रतिरूप विरोधाभास या परीक्षण करते समय, टाइप त्रुटि दर बढ़ जाती है, जिससे [[एकाधिक तुलना समस्या]] के बारे में चिंता बढ़ जाती है। | |||
== | == स्पष्ट संभाव्यता तालिका == | ||
क्रस्कल-वालिस परीक्षण के लिए | क्रस्कल-वालिस परीक्षण के लिए स्पष्ट संभावनाओं की गणना करने के लिए बड़ी मात्रा में कंप्यूटिंग संसाधनों की आवश्यकता होती है। इस प्रकार स्पष्टता सॉफ़्टवेयर लगभग 30 प्रतिभागियों से कम प्रतिरूप आकार के लिए केवल स्पष्ट संभावनाएं प्रदान करता है। ये सॉफ़्टवेयर प्रोग्राम बड़े प्रतिरूप आकार के लिए स्पर्शोन्मुख सन्निकटन पर निर्भर करते हैं। | ||
बड़े | बड़े प्रतिरूप आकारों के लिए स्पष्ट संभाव्यता मान उपलब्ध हैं। स्परियर (2003) ने 45 प्रतिभागियों के रूप में बड़े प्रतिरूपो के लिए स्पष्ट संभाव्यता सारणी प्रकाशित किया था।<ref>{{cite journal |last=Spurrier |first=J. D. |year=2003 |title=On the null distribution of the Kruskal–Wallis statistic |journal=Journal of Nonparametric Statistics |volume=15 |issue=6 |pages=685–691 |doi=10.1080/10485250310001634719 }}</ref> मेयर और सीमैन (2006) ने 105 प्रतिभागियों के रूप में बड़े प्रतिरूपो के लिए स्पष्ट संभाव्यता वितरण का उत्पादन किया था।<ref>{{cite journal |last=Meyer |last2=Seaman |date=April 2006 |title=Expanded tables of critical values for the Kruskal–Wallis H statistic |work=Paper presented at the annual meeting of the American Educational Research Association, San Francisco }} Critical value tables and exact probabilities from Meyer and Seaman are available for download at http://faculty.virginia.edu/kruskal-wallis/ {{Webarchive|url=https://web.archive.org/web/20181017173535/http://faculty.virginia.edu/kruskal-wallis/ |date=2018-10-17 }}. A paper describing their work may also be found there.</ref> | ||
== एच का स्पष्ट वितरण == | |||
चोई एट अल <ref>{{cite journal | |||
चोई एट | |||
|author=Won Choi, Jae Won Lee, Myung-Hoe Huh, and Seung-Ho Kang | |author=Won Choi, Jae Won Lee, Myung-Hoe Huh, and Seung-Ho Kang | ||
|title=An Algorithm for Computing the Exact Distribution of the Kruskal–Wallis Test | |title=An Algorithm for Computing the Exact Distribution of the Kruskal–Wallis Test | ||
Line 42: | Line 43: | ||
|pages=1029–1040 | |pages=1029–1040 | ||
|doi=10.1081/SAC-120023876 | |doi=10.1081/SAC-120023876 | ||
}}</ref> | }}</ref> ने <math>H</math> के स्पष्ट वितरण की गणना करने के लिए विकसित की गई दो विधियों की समीक्षा की थी और इस प्रकार नया वितरण प्रस्तावित किया और स्पष्ट वितरण की तुलना इसके ची-स्क्वायर सन्निकटन से हुई थी। | ||
के | |||
== उदाहरण == | == उदाहरण == | ||
Line 54: | Line 54: | ||
|location=Belmont, Calif |publisher=Wadsworth International Group, Duxbury Press | |location=Belmont, Calif |publisher=Wadsworth International Group, Duxbury Press | ||
|isbn=053498052X | |isbn=053498052X | ||
}}</ref> | }}</ref> न्यूयॉर्क शहर में 1 मई से 30 सितंबर, 1973 तक ओजोन की दैनिक रीडिंग पर डेटा R डेटा सेट वायु गुणवत्ता में हैं, और विश्लेषण R फलन क्रुस्कल.परीक्षण के लिए प्रलेखन में साम्मिलित है। महीने के अनुसार ओजोन मूल्यों के बॉक्सप्लॉट चित्र में दिखाए गए हैं। | ||
न्यूयॉर्क शहर में 1 मई से 30 सितंबर, 1973 तक ओजोन की दैनिक रीडिंग | |||
[[File:Ozone_by_month_boxplots.svg|300px|]]क्रुस्कल-वालिस परीक्षण में महत्वपूर्ण अंतर (p = 6.901e-06) मिलता है जो दर्शाता है कि ओजोन 5 महीनों के बीच भिन्न होता है। | [[File:Ozone_by_month_boxplots.svg|300px|]] | ||
क्रुस्कल-वालिस परीक्षण में महत्वपूर्ण अंतर (p = 6.901e-06) मिलता है जो दर्शाता है कि ओजोन 5 महीनों के बीच भिन्न होता है। | |||
<syntaxhighlight lang="R"> | <syntaxhighlight lang="R"> | ||
Line 67: | Line 68: | ||
Kruskal-Wallis chi-squared = 29.267, df = 4, p-value = 6.901e-06 | Kruskal-Wallis chi-squared = 29.267, df = 4, p-value = 6.901e-06 | ||
</syntaxhighlight> | </syntaxhighlight> | ||
यह निर्धारित करने के लिए कि कौन से महीने अलग-अलग हैं, कई परिकल्पना परीक्षण के लिए बोनफेरोनी (या अन्य) सुधार के साथ, महीनों की प्रत्येक जोड़ी के लिए विलकॉक्सन परीक्षण का उपयोग करके पोस्ट-हॉक परीक्षण किया जा सकता है। | यह निर्धारित करने के लिए कि कौन से महीने अलग-अलग हैं, इस प्रकार कई परिकल्पना परीक्षण के लिए बोनफेरोनी (या अन्य) सुधार के साथ, महीनों की प्रत्येक जोड़ी के लिए विलकॉक्सन परीक्षण का उपयोग करके पोस्ट-हॉक परीक्षण किया जा सकता है। | ||
<syntaxhighlight lang="R"> | <syntaxhighlight lang="R"> | ||
Line 92: | Line 93: | ||
== यह भी देखें == | == यह भी देखें == | ||
* [[फ्रीडमैन परीक्षण]] | * [[फ्रीडमैन परीक्षण]] | ||
* जोंखीरे का | * जोंखीरे का ट्रेंड परीक्षण | ||
==संदर्भ== | ==संदर्भ== |
Revision as of 10:15, 21 June 2023
क्रस्कल-वालिस एच परीक्षण [1] (विलियम क्रुस्कल और डब्ल्यू एलन वालिस के नाम पर) या रैंकों पर वन-वे एनोवा द्वारा क्रस्कल-वालिस परीक्षण होता है [1] यह परीक्षण करने के लिए एक गैर-पैरामीट्रिक विधि है कि प्रतिरूप उसी से उत्पन्न होते हैं या नहीं वितरण होते है। [2][3][4] इसका उपयोग समान या भिन्न प्रतिरूप आकार के दो या दो से अधिक स्वतंत्र प्रतिरूपों की तुलना करने के लिए किया जाता है। यह मान-व्हिटनी यू परीक्षण का विस्तार करता है जिसका उपयोग केवल दो समूहों की तुलना करने के लिए किया जाता है। क्रुस्कल-वालिस परीक्षण का पैरामीट्रिक समकक्ष विचरण (एनोवा) का एकतरफा विश्लेषण है।
महत्वपूर्ण क्रुस्कल-वालिस परीक्षण संकेत करता है कि कम से कम प्रतिरूप स्टोचैस्टिक प्रभुत्व अन्य प्रतिरूप है। परीक्षण यह नहीं पहचानता है कि यह स्टोकास्टिक प्रभुत्व कहां होता है या स्टोकास्टिक प्रभुत्व कितने समूहों के जोड़े के लिए प्राप्त होता है। स्टोकेस्टिक प्रभुत्व के लिए विशिष्ट प्रतिरूप जोड़े का विश्लेषण करने के लिए, डन का परीक्षण,[5] बोन्फेरोनी सुधार के साथ जोड़ीदार मान-व्हिटनी परीक्षण,[6] या अधिक शक्तिशाली किन्तु कम प्रसिद्ध कोनोवर-ईमान परीक्षण [6] कभी-कभी उपयोग किए जाते हैं।
चूंकि यह गैरपारंपरिक विधि है, क्रुस्कल-वालिस परीक्षण विचरण के समान एकतरफा विश्लेषण के विपरीत, अवशिष्टों के सामान्य वितरण को नहीं मानता है। इस प्रकार यदि शोधकर्ता माध्यिका में किसी भी अंतर को छोड़कर, सभी समूहों के लिए समान आकार और मापित वितरण की धारणा बना सकता है, जिससे अशक्त परिकल्पना यह है कि सभी समूहों की माध्यिकाएँ समान हैं, और वैकल्पिक परिकल्पना यह है कि कम से कम जनसंख्या माध्यक समूह का कम से कम अन्य समूह की जनसंख्या माध्यिका से भिन्न है। अन्यथा, यह कहना असंभव है कि शून्य परिकल्पना की अस्वीकृति स्थान या समूह फैलाव में बदलाव से आती है या नहीं आती है। यही समस्या मान-व्हिटनी परीक्षण के साथ भी होती है।[7][8][9]
। यह मान-व्हिटनी यू परीक्षण | मान-व्हिटनी यू परीक्षण का विस्तार करता है, जिसका उपयोग केवल दो समूहों की तुलना करने के लिए किया जाता है।
विधि
- सभी समूहों के सभी डेटा को एक साथ रैंक करता है; अर्थात समूह सदस्यता को नजरअंदाज करते हुए डेटा को 1 से N तक रैंक करता है। इस प्रकार किसी भी बंधे हुए मूल्यों को असाइन करें और उन्हें प्राप्त होने वाले रैंकों का औसत यदि वे बंधे नहीं होते है।
- परीक्षण आँकड़ा इसके द्वारा दिया गया है
- कहाँ
- सभी समूहों में प्रेक्षणों की कुल संख्या है
- समूहों की संख्या है
- समूह में टिप्पणियों की संख्या है
- समूह से अवलोकन का रैंक (सभी अवलोकनों के बीच) है
- समूह में सभी अवलोकनों का औसत रैंक है
- सभी का औसत है
- यदि डेटा में कोई संबंध नहीं है तो के लिए अभिव्यक्ति के प्रत्येक पूर्ण रूप से और सही है। इस प्रकार
- अंतिम सूत्र में केवल औसत रैंकों के वर्ग होते हैं।
- संबंधों के लिए एक सुधार यदि पिछले बिंदु में वर्णित शॉर्ट-कट सूत्र का उपयोग करके को से विभाजित करके बनाया जा सकता है जहां G विभिन्न बंधे हुए रैंकों के समूहों की संख्या है और ti समूह i के अन्दर बंधे मूल्यों की संख्या है जो एक विशेष मूल्य पर बंधे हैं। यह सुधार सामान्यतः एच के मूल्य में थोड़ा अंतर करता है जब तक कि बड़ी संख्या में कोई संबंध नही होंता है।
- इस प्रकार अंत में, अशक्त परिकल्पना को अस्वीकार करने या न करने का निर्णय किसी दिए गए महत्व या अल्फा स्तर के लिए तालिका या सॉफ़्टवेयर से प्राप्त महत्वपूर्ण मान से की तुलना करके किया जाता है। यदि , से बड़ा है, जिससे शून्य परिकल्पना को अस्वीकार कर दिया जाता है। यदि संभव हो (कोई संबंध प्रतिरूप बहुत बड़ा नहीं है) तो एच की तुलना एच के स्पष्ट वितरण से प्राप्त महत्वपूर्ण मूल्य से करनी चाहिए। अन्यथा, के वितरण को g-1 डिग्री स्वतंत्रता के साथ ची-वर्ग वितरण द्वारा अनुमानित किया जा सकता है। यदि कुछ मान छोटे हैं (अर्थात्, 5 से कम) का स्पष्ट संभाव्यता वितरण इस ची-स्क्वायर वितरण से अधिक भिन्न हो सकता है। इस प्रकार यदि ची-स्क्वायर संभाव्यता वितरण की एक तालिका उपलब्ध है, जिससे ची-स्क्वेर्ड का महत्वपूर्ण मान g - 1 स्वतंत्रता की डिग्री (सांख्यिकी) पर तालिका में प्रवेश करके और वांछित के अनुसार देख कर पाया जा सकता है।
- यदि आँकड़ा महत्वपूर्ण नहीं है, जिससे प्रतिरूपो के बीच स्टोचैस्टिक प्रभुत्व का कोई प्रमाण नहीं है। चूँकि, यदि परीक्षण महत्वपूर्ण है जिससे कम से कम प्रतिरूप दूसरे प्रतिरूप पर स्थिर रूप से हावी हो जाता है। इसलिए, शोधकर्ता अलग-अलग प्रतिरूप जोड़े के बीच प्रतिरूप विरोधाभासों का उपयोग कर सकता है, या इस प्रकार डन के परीक्षण का उपयोग करके पोस्ट हॉक परीक्षण कर सकता है, जो (1) क्रुस्कल-वालिस परीक्षण के समान रैंकिंग को ठीक से नियोजित करता है, और (2) शून्य द्वारा निहित पूलित भिन्नता को ठीक से नियोजित करता है। क्रुस्कल-वालिस परीक्षण की परिकल्पना यह निर्धारित करने के लिए कि कौन से प्रतिरूप जोड़े महत्वपूर्ण रूप से भिन्न हैं।[5] इस प्रकार एकाधिक प्रतिरूप विरोधाभास या परीक्षण करते समय, टाइप त्रुटि दर बढ़ जाती है, जिससे एकाधिक तुलना समस्या के बारे में चिंता बढ़ जाती है।
स्पष्ट संभाव्यता तालिका
क्रस्कल-वालिस परीक्षण के लिए स्पष्ट संभावनाओं की गणना करने के लिए बड़ी मात्रा में कंप्यूटिंग संसाधनों की आवश्यकता होती है। इस प्रकार स्पष्टता सॉफ़्टवेयर लगभग 30 प्रतिभागियों से कम प्रतिरूप आकार के लिए केवल स्पष्ट संभावनाएं प्रदान करता है। ये सॉफ़्टवेयर प्रोग्राम बड़े प्रतिरूप आकार के लिए स्पर्शोन्मुख सन्निकटन पर निर्भर करते हैं।
बड़े प्रतिरूप आकारों के लिए स्पष्ट संभाव्यता मान उपलब्ध हैं। स्परियर (2003) ने 45 प्रतिभागियों के रूप में बड़े प्रतिरूपो के लिए स्पष्ट संभाव्यता सारणी प्रकाशित किया था।[10] मेयर और सीमैन (2006) ने 105 प्रतिभागियों के रूप में बड़े प्रतिरूपो के लिए स्पष्ट संभाव्यता वितरण का उत्पादन किया था।[11]
एच का स्पष्ट वितरण
चोई एट अल [12] ने के स्पष्ट वितरण की गणना करने के लिए विकसित की गई दो विधियों की समीक्षा की थी और इस प्रकार नया वितरण प्रस्तावित किया और स्पष्ट वितरण की तुलना इसके ची-स्क्वायर सन्निकटन से हुई थी।
उदाहरण
महीने के अनुसार ओजोन के स्तर में अंतर के लिए परीक्षण
निम्न उदाहरण चेम्बर्स एट अल से डेटा का उपयोग करता है।[13] न्यूयॉर्क शहर में 1 मई से 30 सितंबर, 1973 तक ओजोन की दैनिक रीडिंग पर डेटा R डेटा सेट वायु गुणवत्ता में हैं, और विश्लेषण R फलन क्रुस्कल.परीक्षण के लिए प्रलेखन में साम्मिलित है। महीने के अनुसार ओजोन मूल्यों के बॉक्सप्लॉट चित्र में दिखाए गए हैं।
क्रुस्कल-वालिस परीक्षण में महत्वपूर्ण अंतर (p = 6.901e-06) मिलता है जो दर्शाता है कि ओजोन 5 महीनों के बीच भिन्न होता है।
kruskal.test(Ozone ~ Month, data = airquality)
Kruskal-Wallis rank sum test
data: Ozone by Month
Kruskal-Wallis chi-squared = 29.267, df = 4, p-value = 6.901e-06
यह निर्धारित करने के लिए कि कौन से महीने अलग-अलग हैं, इस प्रकार कई परिकल्पना परीक्षण के लिए बोनफेरोनी (या अन्य) सुधार के साथ, महीनों की प्रत्येक जोड़ी के लिए विलकॉक्सन परीक्षण का उपयोग करके पोस्ट-हॉक परीक्षण किया जा सकता है।
pairwise.wilcox.test(airquality$Ozone, airquality$Month, p.adjust.method = "bonferroni")
Pairwise comparisons using Wilcoxon rank sum test
data: airquality$Ozone and airquality$Month
5 6 7 8
6 1.0000 - - -
7 0.0003 0.1414 - -
8 0.0012 0.2591 1.0000 -
9 1.0000 1.0000 0.0074 0.0325
P value adjustment method: bonferroni
पोस्ट-हॉक परीक्षणों से संकेत मिलता है कि, कई परीक्षण के लिए बोनफेरोनी सुधार के बाद, निम्नलिखित अंतर महत्वपूर्ण हैं (समायोजित पी <0.05)।
- माह 5 बनाम माह 7 और 8
- माह 9 बनाम माह 7 और 8
यह भी देखें
- फ्रीडमैन परीक्षण
- जोंखीरे का ट्रेंड परीक्षण
संदर्भ
- ↑ 1.0 1.1 Kruskal–Wallis H Test using SPSS Statistics, Laerd Statistics
- ↑ Kruskal; Wallis (1952). "एक-मानदंड विचरण विश्लेषण में रैंकों का उपयोग". Journal of the American Statistical Association. 47 (260): 583–621. doi:10.1080/01621459.1952.10483441.
- ↑ Corder, Gregory W.; Foreman, Dale I. (2009). गैर-सांख्यिकीविदों के लिए गैरपारंपरिक सांख्यिकी. Hoboken: John Wiley & Sons. pp. 99–105. ISBN 9780470454619.
- ↑ Siegel; Castellan (1988). स्वभावजन्य विज्ञान के लिए नॉनपैरामीट्रिक आंकड़े (Second ed.). New York: McGraw–Hill. ISBN 0070573573.
- ↑ 5.0 5.1 Dunn, Olive Jean (1964). "रैंक योगों का उपयोग करके एकाधिक तुलना". Technometrics. 6 (3): 241–252. doi:10.2307/1266041.
- ↑ 6.0 6.1 Conover, W. Jay; Iman, Ronald L. (1979). "बहु-तुलना प्रक्रियाओं पर" (PDF) (Report). Los Alamos Scientific Laboratory. Retrieved 2016-10-28.
- ↑ Divine; Norton; Barón; Juarez-Colunga (2018). "The Wilcoxon–Mann–Whitney Procedure Fails as a Test of Medians". The American Statistician. doi:10.1080/00031305.2017.1305291.
- ↑ Hart (2001). "Mann-Whitney test is not just a test of medians: differences in spread can be important". BMJ. doi:10.1136/bmj.323.7309.391.
- ↑ Bruin (2006). "FAQ: Why is the Mann-Whitney significant when the medians are equal?". UCLA: Statistical Consulting Group.
- ↑ Spurrier, J. D. (2003). "On the null distribution of the Kruskal–Wallis statistic". Journal of Nonparametric Statistics. 15 (6): 685–691. doi:10.1080/10485250310001634719.
- ↑ Meyer; Seaman (April 2006). "Expanded tables of critical values for the Kruskal–Wallis H statistic". Paper presented at the annual meeting of the American Educational Research Association, San Francisco. Critical value tables and exact probabilities from Meyer and Seaman are available for download at http://faculty.virginia.edu/kruskal-wallis/ Archived 2018-10-17 at the Wayback Machine. A paper describing their work may also be found there.
- ↑ Won Choi, Jae Won Lee, Myung-Hoe Huh, and Seung-Ho Kang (2003). "An Algorithm for Computing the Exact Distribution of the Kruskal–Wallis Test". Communications in Statistics - Simulation and Computation (32, number 4): 1029–1040. doi:10.1081/SAC-120023876.
{{cite journal}}
: CS1 maint: multiple names: authors list (link) - ↑ John M. Chambers, William S. Cleveland, Beat Kleiner, and Paul A. Tukey (1983). Graphical Methods for Data Analysis. Belmont, Calif: Wadsworth International Group, Duxbury Press. ISBN 053498052X.
{{cite book}}
: CS1 maint: multiple names: authors list (link)
अग्रिम पठन
- Daniel, Wayne W. (1990). "Kruskal–Wallis one-way analysis of variance by ranks". Applied Nonparametric Statistics (2nd ed.). Boston: PWS-Kent. pp. 226–234. ISBN 0-534-91976-6.