क्रुस्कल-वालिस विचरण का एकतरफा विश्लेषण: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 1: Line 1:
{{Short description|Non-parametric method for testing whether samples originate from the same distribution}}
{{Short description|Non-parametric method for testing whether samples originate from the same distribution}}
क्रुस्कल-वालिस रैंकों द्वारा परीक्षण, क्रुस्कल-वालिस ''एच'' परीक्षण <ref name="Laerd">[https://statistics.laerd.com/spss-tutorials/kruskal-wallis-h-test-using-spss-statistics.php Kruskal–Wallis H Test using SPSS Statistics], Laerd Statistics</ref> ([[विलियम क्रुस्कल]] और डब्ल्यू एलन वालिस के नाम पर), या रैंकों पर एक तरफ़ा एनोवा <ref name="Laerd" /> गैर-पैरामीट्रिक सांख्यिकी है। यह परीक्षण करने के लिए गैर-पैरामीट्रिक विधि है कि नमूने एक ही वितरण से उत्पन्न होते हैं या नहीं।<ref>{{cite journal |last=Kruskal |last2=Wallis |year=1952 |title=एक-मानदंड विचरण विश्लेषण में रैंकों का उपयोग|journal=[[Journal of the American Statistical Association]] |volume=47 |issue=260 |pages=583–621 |doi=10.1080/01621459.1952.10483441 }}</ref><ref>{{cite book |last=Corder |first=Gregory W. |first2=Dale I. |last2=Foreman |year=2009 |title=गैर-सांख्यिकीविदों के लिए गैरपारंपरिक सांख्यिकी|url=https://archive.org/details/nonparametricsta00cord |url-access=limited |location=Hoboken |publisher=John Wiley & Sons |pages=[https://archive.org/details/nonparametricsta00cord/page/n114 99]–105 |isbn=9780470454619 }}</ref><ref>{{cite book |last=Siegel |last2=Castellan |year=1988 |title=स्वभावजन्य विज्ञान के लिए नॉनपैरामीट्रिक आंकड़े|edition=Second |location=New York |publisher=McGraw–Hill |isbn=0070573573 }}</ref> इसका उपयोग समान या भिन्न नमूना आकार के दो या दो से अधिक स्वतंत्र नमूनों की तुलना करने के लिए किया जाता है। यह मान-व्हिटनी यू परीक्षण | मान-व्हिटनी यू परीक्षण का विस्तार करता है, जिसका उपयोग केवल दो समूहों की तुलना करने के लिए किया जाता है। क्रुस्कल-वालिस परीक्षण का पैरामीट्रिक समतुल्य एकतरफा एनोवा है। विचरण का एकतरफा विश्लेषण (एनोवा)।
'''क्रस्कल-वालिस एच परीक्षण''' <ref name="Laerd">[https://statistics.laerd.com/spss-tutorials/kruskal-wallis-h-test-using-spss-statistics.php Kruskal–Wallis H Test using SPSS Statistics], Laerd Statistics</ref> ([[विलियम क्रुस्कल]] और डब्ल्यू एलन वालिस के नाम पर) या रैंकों पर वन-वे एनोवा द्वारा क्रस्कल-वालिस परीक्षण होता है <ref name="Laerd" /> यह परीक्षण करने के लिए एक गैर-पैरामीट्रिक विधि है कि प्रतिरूप उसी से उत्पन्न होते हैं या नहीं वितरण होते है। <ref>{{cite journal |last=Kruskal |last2=Wallis |year=1952 |title=एक-मानदंड विचरण विश्लेषण में रैंकों का उपयोग|journal=[[Journal of the American Statistical Association]] |volume=47 |issue=260 |pages=583–621 |doi=10.1080/01621459.1952.10483441 }}</ref><ref>{{cite book |last=Corder |first=Gregory W. |first2=Dale I. |last2=Foreman |year=2009 |title=गैर-सांख्यिकीविदों के लिए गैरपारंपरिक सांख्यिकी|url=https://archive.org/details/nonparametricsta00cord |url-access=limited |location=Hoboken |publisher=John Wiley & Sons |pages=[https://archive.org/details/nonparametricsta00cord/page/n114 99]–105 |isbn=9780470454619 }}</ref><ref>{{cite book |last=Siegel |last2=Castellan |year=1988 |title=स्वभावजन्य विज्ञान के लिए नॉनपैरामीट्रिक आंकड़े|edition=Second |location=New York |publisher=McGraw–Hill |isbn=0070573573 }}</ref> इसका उपयोग समान या भिन्न प्रतिरूप आकार के दो या दो से अधिक स्वतंत्र प्रतिरूपों की तुलना करने के लिए किया जाता है। यह मान-व्हिटनी यू परीक्षण का विस्तार करता है जिसका उपयोग केवल दो समूहों की तुलना करने के लिए किया जाता है। क्रुस्कल-वालिस परीक्षण का पैरामीट्रिक समकक्ष विचरण (एनोवा) का एकतरफा विश्लेषण है।


महत्वपूर्ण क्रुस्कल-वालिस परीक्षण इंगित करता है कि कम से कम नमूना स्टोचैस्टिक प्रभुत्व अन्य नमूना है। परीक्षण यह नहीं पहचानता है कि यह स्टोकास्टिक प्रभुत्व कहां होता है या स्टोकास्टिक प्रभुत्व कितने समूहों के जोड़े के लिए प्राप्त होता है। [[स्टोकेस्टिक प्रभुत्व]] के लिए विशिष्ट नमूना जोड़े का विश्लेषण करने के लिए, डन का परीक्षण,<ref name=Dunn>{{cite journal |last=Dunn |first=Olive Jean |year=1964 |title=रैंक योगों का उपयोग करके एकाधिक तुलना| journal=Technometrics |volume=6 |issue=3 |pages=241–252 |doi=10.2307/1266041}}</ref> बोन्फेरोनी सुधार के साथ जोड़ीदार मान-व्हिटनी परीक्षण,<ref name=Conover>{{cite report | last1=Conover | first1=W. Jay | last2=Iman | first2=Ronald L. |date=1979 |title="बहु-तुलना प्रक्रियाओं पर"|url=http://library.lanl.gov/cgi-bin/getfile?00209046.pdf |publisher=Los Alamos Scientific Laboratory |access-date=2016-10-28}}</ref> या अधिक शक्तिशाली लेकिन कम प्रसिद्ध कोनोवर-ईमान परीक्षण<ref name=Conover>{{cite report | last1=Conover | first1=W. Jay | last2=Iman | first2=Ronald L. |date=1979 |title="बहु-तुलना प्रक्रियाओं पर"|url=http://library.lanl.gov/cgi-bin/getfile?00209046.pdf |publisher=Los Alamos Scientific Laboratory |access-date=2016-10-28}}</ref> कभी-कभी उपयोग किए जाते हैं।
महत्वपूर्ण क्रुस्कल-वालिस परीक्षण संकेत करता है कि कम से कम प्रतिरूप स्टोचैस्टिक प्रभुत्व अन्य प्रतिरूप है। परीक्षण यह नहीं पहचानता है कि यह स्टोकास्टिक प्रभुत्व कहां होता है या स्टोकास्टिक प्रभुत्व कितने समूहों के जोड़े के लिए प्राप्त होता है। [[स्टोकेस्टिक प्रभुत्व]] के लिए विशिष्ट प्रतिरूप जोड़े का विश्लेषण करने के लिए, डन का परीक्षण,<ref name=Dunn>{{cite journal |last=Dunn |first=Olive Jean |year=1964 |title=रैंक योगों का उपयोग करके एकाधिक तुलना| journal=Technometrics |volume=6 |issue=3 |pages=241–252 |doi=10.2307/1266041}}</ref> बोन्फेरोनी सुधार के साथ जोड़ीदार मान-व्हिटनी परीक्षण,<ref name=Conover>{{cite report | last1=Conover | first1=W. Jay | last2=Iman | first2=Ronald L. |date=1979 |title="बहु-तुलना प्रक्रियाओं पर"|url=http://library.lanl.gov/cgi-bin/getfile?00209046.pdf |publisher=Los Alamos Scientific Laboratory |access-date=2016-10-28}}</ref> या अधिक शक्तिशाली किन्तु कम प्रसिद्ध कोनोवर-ईमान परीक्षण <ref name=Conover>{{cite report | last1=Conover | first1=W. Jay | last2=Iman | first2=Ronald L. |date=1979 |title="बहु-तुलना प्रक्रियाओं पर"|url=http://library.lanl.gov/cgi-bin/getfile?00209046.pdf |publisher=Los Alamos Scientific Laboratory |access-date=2016-10-28}}</ref> कभी-कभी उपयोग किए जाते हैं।


चूंकि यह गैरपारंपरिक विधि है, क्रुस्कल-वालिस परीक्षण विचरण के समान एकतरफा विश्लेषण के विपरीत, अवशिष्टों के [[सामान्य वितरण]] को नहीं मानता है। यदि शोधकर्ता माध्यिका में किसी भी अंतर को छोड़कर, सभी समूहों के लिए समान आकार और मापित वितरण की धारणा बना सकता है, तो अशक्त परिकल्पना यह है कि सभी समूहों की माध्यिकाएँ समान हैं, और वैकल्पिक परिकल्पना यह है कि कम से कम जनसंख्या माध्यक समूह का कम से कम अन्य समूह की जनसंख्या माध्यिका से भिन्न है। अन्यथा, यह कहना असंभव है कि शून्य परिकल्पना की अस्वीकृति स्थान या समूह फैलाव में बदलाव से आती है या नहीं। यही समस्या मान-व्हिटनी परीक्षण के साथ भी होती है।<ref>{{cite news|last=Divine |last2=Norton | last3=Barón | last4= Juarez-Colunga |year=2018 |title=The Wilcoxon–Mann–Whitney Procedure Fails as a Test of Medians | publisher=The American Statistician |doi=10.1080/00031305.2017.1305291}}</ref><ref>{{cite news|last= Hart |year=2001 |title=Mann-Whitney test is not just a test of medians: differences in spread can be important | publisher=BMJ |doi=10.1136/bmj.323.7309.391}}</ref><ref>{{cite news|last=Bruin | year=2006 | title=FAQ: Why is the Mann-Whitney significant when the medians are equal?| publisher=UCLA: Statistical Consulting Group}}</ref>
चूंकि यह गैरपारंपरिक विधि है, क्रुस्कल-वालिस परीक्षण विचरण के समान एकतरफा विश्लेषण के विपरीत, अवशिष्टों के [[सामान्य वितरण]] को नहीं मानता है। इस प्रकार यदि शोधकर्ता माध्यिका में किसी भी अंतर को छोड़कर, सभी समूहों के लिए समान आकार और मापित वितरण की धारणा बना सकता है, जिससे अशक्त परिकल्पना यह है कि सभी समूहों की माध्यिकाएँ समान हैं, और वैकल्पिक परिकल्पना यह है कि कम से कम जनसंख्या माध्यक समूह का कम से कम अन्य समूह की जनसंख्या माध्यिका से भिन्न है। अन्यथा, यह कहना असंभव है कि शून्य परिकल्पना की अस्वीकृति स्थान या समूह फैलाव में बदलाव से आती है या नहीं आती है। यही समस्या मान-व्हिटनी परीक्षण के साथ भी होती है।<ref>{{cite news|last=Divine |last2=Norton | last3=Barón | last4= Juarez-Colunga |year=2018 |title=The Wilcoxon–Mann–Whitney Procedure Fails as a Test of Medians | publisher=The American Statistician |doi=10.1080/00031305.2017.1305291}}</ref><ref>{{cite news|last= Hart |year=2001 |title=Mann-Whitney test is not just a test of medians: differences in spread can be important | publisher=BMJ |doi=10.1136/bmj.323.7309.391}}</ref><ref>{{cite news|last=Bruin | year=2006 | title=FAQ: Why is the Mann-Whitney significant when the medians are equal?| publisher=UCLA: Statistical Consulting Group}}</ref>


'''। यह मान-व्हिटनी यू परीक्षण | मान-व्हिटनी यू परीक्षण का विस्तार करता है, जिसका उपयोग केवल दो समूहों की तुलना करने के लिए किया जाता है।<br />'''
'''। यह मान-व्हिटनी यू परीक्षण | मान-व्हिटनी यू परीक्षण का विस्तार करता है, जिसका उपयोग केवल दो समूहों की तुलना करने के लिए किया जाता है।<br />'''
== विधि ==
== विधि ==
# सभी समूहों के सभी डेटा को एक साथ रैंक करें; यानी समूह सदस्यता को अनदेखा करते हुए डेटा को 1 से N तक रैंक करें। किसी भी बंधे हुए मूल्यों को असाइन करें, उन्हें प्राप्त होने वाले रैंकों का औसत अगर वे बंधे नहीं होते।
# सभी समूहों के सभी डेटा को एक साथ रैंक करता है; अर्थात समूह सदस्यता को नजरअंदाज करते हुए डेटा को 1 से N तक रैंक करता है। इस प्रकार किसी भी बंधे हुए मूल्यों को असाइन करें और उन्हें प्राप्त होने वाले रैंकों का औसत यदि वे बंधे नहीं होते है।
# परीक्षण आँकड़ा इसके द्वारा दिया गया है
# परीक्षण आँकड़ा इसके द्वारा दिया गया है
#:<math>H = (N-1)\frac{\sum_{i=1}^g n_i(\bar{r}_{i\cdot} - \bar{r})^2}{\sum_{i=1}^g\sum_{j=1}^{n_i}(r_{ij} - \bar{r})^2},</math> कहाँ
#:<math>H = (N-1)\frac{\sum_{i=1}^g n_i(\bar{r}_{i\cdot} - \bar{r})^2}{\sum_{i=1}^g\sum_{j=1}^{n_i}(r_{ij} - \bar{r})^2},</math> कहाँ
#*<math>N</math> सभी समूहों में प्रेक्षणों की कुल संख्या है
#*<math>N</math> सभी समूहों में प्रेक्षणों की कुल संख्या है
#*<math>g</math> समूहों की संख्या है
#*<math>g</math> समूहों की संख्या है
#*<math>n_i</math> समूह में टिप्पणियों की संख्या है <math>i</math>
#*<math>n_i</math> समूह में टिप्पणियों <math>i</math> की संख्या है
#*<math>r_{ij}</math> प्रेक्षण की कोटि (सभी प्रेक्षणों के बीच) है <math>j</math> समूह से <math>i</math>
#*<math>r_{ij}</math> समूह <math>i</math> से अवलोकन <math>j</math> का रैंक (सभी अवलोकनों के बीच) है
#*<math>\bar{r}_{i\cdot} = \frac{\sum_{j=1}^{n_i}{r_{ij}}}{n_i}</math> समूह में सभी अवलोकनों का औसत रैंक है <math>i</math>
#*<math>\bar{r}_{i\cdot} = \frac{\sum_{j=1}^{n_i}{r_{ij}}}{n_i}</math> समूह <math>i</math> में सभी अवलोकनों का औसत रैंक है
#*<math>\bar{r} =\tfrac 12 (N+1)</math> सभी का औसत है <math>r_{ij}</math>.
#*<math>\bar{r} =\tfrac 12 (N+1)</math> सभी <math>r_{ij}</math> का औसत है
# यदि डेटा में अभिव्यक्ति के भाजक के लिए कोई संबंध नहीं है <math>H</math> बिल्कुल सही है <math>(N-1)N(N+1)/12</math> और <math>\bar{r}=\tfrac{N+1}{2}</math>. इस प्रकार
#यदि डेटा में कोई संबंध नहीं है तो <math>H</math> के लिए अभिव्यक्ति के प्रत्येक पूर्ण रूप से <math>(N-1)N(N+1)/12</math> और <math>\bar{r}=\tfrac{N+1}{2}</math> सही है। इस प्रकार
#:<math>
#:<math>
\begin{align}
\begin{align}
H & = \frac{12}{N(N+1)}\sum_{i=1}^g n_i \left(\bar{r}_{i\cdot} - \frac{N+1}{2}\right)^2 \\ & = \frac{12}{N(N+1)}\sum_{i=1}^g n_i \bar{r}_{i\cdot }^2 -\ 3(N+1)
H & = \frac{12}{N(N+1)}\sum_{i=1}^g n_i \left(\bar{r}_{i\cdot} - \frac{N+1}{2}\right)^2 \\ & = \frac{12}{N(N+1)}\sum_{i=1}^g n_i \bar{r}_{i\cdot }^2 -\ 3(N+1)
\end{align}
\end{align}
</math><br />अंतिम सूत्र में केवल औसत रैंक के वर्ग शामिल हैं।
</math><br />
# संबंधों के लिए सुधार यदि पिछले बिंदु में वर्णित शॉर्ट-कट सूत्र का उपयोग करके विभाजित करके किया जा सकता है <math>H</math> द्वारा <math>1 - \frac{\sum_{i=1}^G (t_i^3 - t_i)}{N^3-N}</math>, जहां G अलग-अलग बंधी रैंकों के समूहों की संख्या है, और t<sub>''i''</sub> समूह i के भीतर बंधे हुए मानों की संख्या है जो विशेष मूल्य पर बंधे हैं। यह सुधार आमतौर पर एच के मूल्य में थोड़ा अंतर करता है जब तक कि बड़ी संख्या में संबंध न हों।
#:अंतिम सूत्र में केवल औसत रैंकों के वर्ग होते हैं।
# अंत में, अशक्त परिकल्पना को अस्वीकार करने या न करने का निर्णय तुलना करके किया जाता है <math>H</math> महत्वपूर्ण मूल्य के लिए <math>H_c</math> किसी दिए गए महत्व या अल्फा स्तर के लिए किसी तालिका या सॉफ़्टवेयर से प्राप्त किया गया। अगर <math>H</math> के अपेक्षा बड़ा है <math>H_c</math>, शून्य परिकल्पना अस्वीकृत की जाती है। यदि संभव हो (कोई संबंध नहीं, नमूना बहुत बड़ा नहीं है) तो तुलना करनी चाहिए <math>H</math> के सटीक वितरण से प्राप्त महत्वपूर्ण मूल्य के लिए <math>H</math>. अन्यथा, एच के वितरण को स्वतंत्रता की जी-1 डिग्री के साथ [[ची-वर्ग वितरण]] द्वारा अनुमानित किया जा सकता है। यदि कुछ <math>n_i</math> मान छोटे हैं (अर्थात, 5 से कम) का सटीक संभाव्यता वितरण <math>H</math> इस ची-स्क्वायर वितरण से काफी अलग हो सकता है। यदि ची-वर्ग संभाव्यता बंटन की तालिका उपलब्ध है, तो ची-वर्ग का महत्वपूर्ण मान, <math>\chi^2_{\alpha: g-1}</math>, g − 1 [[स्वतंत्रता की डिग्री (सांख्यिकी)]] पर तालिका दर्ज करके और वांछित सांख्यिकीय महत्व या अल्फा स्तर के तहत देख कर पाया जा सकता है।
#संबंधों के लिए एक सुधार यदि पिछले बिंदु में वर्णित शॉर्ट-कट सूत्र का उपयोग करके <math>H</math> को <math>1 - \frac{\sum_{i=1}^G (t_i^3 - t_i)}{N^3-N}</math> से विभाजित करके बनाया जा सकता है जहां G विभिन्न बंधे हुए रैंकों के समूहों की संख्या है और ti समूह i के अन्दर बंधे मूल्यों की संख्या है जो एक विशेष मूल्य पर बंधे हैं। यह सुधार सामान्यतः एच के मूल्य में थोड़ा अंतर करता है जब तक कि बड़ी संख्या में कोई संबंध नही होंता है।
# यदि आँकड़ा महत्वपूर्ण नहीं है, तो नमूनों के बीच स्टोचैस्टिक प्रभुत्व का कोई प्रमाण नहीं है। हालांकि, यदि परीक्षण महत्वपूर्ण है तो कम से कम नमूना दूसरे नमूने पर स्थिर रूप से हावी हो जाता है। इसलिए, शोधकर्ता अलग-अलग नमूना जोड़े के बीच नमूना विरोधाभासों का उपयोग कर सकता है, या डन के परीक्षण का उपयोग करके पोस्ट हॉक परीक्षण कर सकता है, जो (1) क्रुस्कल-वालिस परीक्षण के समान रैंकिंग को ठीक से नियोजित करता है, और (2) शून्य द्वारा निहित पूलित भिन्नता को ठीक से नियोजित करता है। क्रुस्कल-वालिस परीक्षण की परिकल्पना यह निर्धारित करने के लिए कि कौन से नमूना जोड़े महत्वपूर्ण रूप से भिन्न हैं।<ref name=Dunn />एकाधिक नमूना विरोधाभास या परीक्षण करते समय, टाइप I त्रुटि दर बढ़ जाती है, जिससे [[एकाधिक तुलना समस्या]] के बारे में चिंता बढ़ जाती है।
#इस प्रकार अंत में, अशक्त परिकल्पना को अस्वीकार करने या न करने का निर्णय किसी दिए गए महत्व या अल्फा स्तर के लिए तालिका या सॉफ़्टवेयर से प्राप्त महत्वपूर्ण मान <math>H</math> से <math>H_c</math> की तुलना करके किया जाता है। यदि <math>H</math>, <math>H_c</math> से बड़ा है, जिससे शून्य परिकल्पना को अस्वीकार कर दिया जाता है। यदि संभव हो (कोई संबंध प्रतिरूप बहुत बड़ा नहीं है) तो एच की तुलना एच के स्पष्ट वितरण से प्राप्त महत्वपूर्ण मूल्य से करनी चाहिए। अन्यथा, <math>H</math> के वितरण को g-1 डिग्री स्वतंत्रता के साथ [[ची-वर्ग वितरण]] द्वारा अनुमानित किया जा सकता है। यदि कुछ <math>n_i</math> मान छोटे हैं (अर्थात्, 5 से कम) <math>H</math> का स्पष्ट संभाव्यता वितरण इस ची-स्क्वायर वितरण से अधिक भिन्न हो सकता है। इस प्रकार यदि ची-स्क्वायर संभाव्यता वितरण की एक तालिका उपलब्ध है, जिससे ची-स्क्वेर्ड <math>\chi^2_{\alpha: g-1}</math> का महत्वपूर्ण मान g - 1 [[स्वतंत्रता की डिग्री (सांख्यिकी)]] पर तालिका में प्रवेश करके और वांछित के अनुसार देख कर पाया जा सकता है।  
# यदि आँकड़ा महत्वपूर्ण नहीं है, जिससे प्रतिरूपो के बीच स्टोचैस्टिक प्रभुत्व का कोई प्रमाण नहीं है। चूँकि, यदि परीक्षण महत्वपूर्ण है जिससे कम से कम प्रतिरूप दूसरे प्रतिरूप पर स्थिर रूप से हावी हो जाता है। इसलिए, शोधकर्ता अलग-अलग प्रतिरूप जोड़े के बीच प्रतिरूप विरोधाभासों का उपयोग कर सकता है, या इस प्रकार डन के परीक्षण का उपयोग करके पोस्ट हॉक परीक्षण कर सकता है, जो (1) क्रुस्कल-वालिस परीक्षण के समान रैंकिंग को ठीक से नियोजित करता है, और (2) शून्य द्वारा निहित पूलित भिन्नता को ठीक से नियोजित करता है। क्रुस्कल-वालिस परीक्षण की परिकल्पना यह निर्धारित करने के लिए कि कौन से प्रतिरूप जोड़े महत्वपूर्ण रूप से भिन्न हैं।<ref name=Dunn /> इस प्रकार एकाधिक प्रतिरूप विरोधाभास या परीक्षण करते समय, टाइप त्रुटि दर बढ़ जाती है, जिससे [[एकाधिक तुलना समस्या]] के बारे में चिंता बढ़ जाती है।


== सटीक संभाव्यता तालिका ==
== स्पष्ट संभाव्यता तालिका ==
क्रस्कल-वालिस परीक्षण के लिए सटीक संभावनाओं की गणना करने के लिए बड़ी मात्रा में कंप्यूटिंग संसाधनों की आवश्यकता होती है। मौजूदा सॉफ़्टवेयर लगभग 30 प्रतिभागियों से कम नमूना आकार के लिए केवल सटीक संभावनाएं प्रदान करता है। ये सॉफ़्टवेयर प्रोग्राम बड़े नमूना आकार के लिए स्पर्शोन्मुख सन्निकटन पर निर्भर करते हैं।
क्रस्कल-वालिस परीक्षण के लिए स्पष्ट संभावनाओं की गणना करने के लिए बड़ी मात्रा में कंप्यूटिंग संसाधनों की आवश्यकता होती है। इस प्रकार स्पष्टता सॉफ़्टवेयर लगभग 30 प्रतिभागियों से कम प्रतिरूप आकार के लिए केवल स्पष्ट संभावनाएं प्रदान करता है। ये सॉफ़्टवेयर प्रोग्राम बड़े प्रतिरूप आकार के लिए स्पर्शोन्मुख सन्निकटन पर निर्भर करते हैं।


बड़े नमूना आकारों के लिए सटीक संभाव्यता मान उपलब्ध हैं। स्परियर (2003) ने 45 प्रतिभागियों के रूप में बड़े नमूनों के लिए सटीक संभाव्यता सारणी प्रकाशित की।<ref>{{cite journal |last=Spurrier |first=J. D. |year=2003 |title=On the null distribution of the Kruskal–Wallis statistic |journal=Journal of Nonparametric Statistics |volume=15 |issue=6 |pages=685–691 |doi=10.1080/10485250310001634719 }}</ref> मेयर और सीमैन (2006) ने 105 प्रतिभागियों के रूप में बड़े नमूनों के लिए सटीक संभाव्यता वितरण का उत्पादन किया।<ref>{{cite journal |last=Meyer |last2=Seaman |date=April 2006 |title=Expanded tables of critical values for the Kruskal–Wallis H statistic |work=Paper presented at the annual meeting of the American Educational Research Association, San Francisco }} Critical value tables and exact probabilities from Meyer and Seaman are available for download at http://faculty.virginia.edu/kruskal-wallis/ {{Webarchive|url=https://web.archive.org/web/20181017173535/http://faculty.virginia.edu/kruskal-wallis/ |date=2018-10-17 }}. A paper describing their work may also be found there.</ref>
बड़े प्रतिरूप आकारों के लिए स्पष्ट संभाव्यता मान उपलब्ध हैं। स्परियर (2003) ने 45 प्रतिभागियों के रूप में बड़े प्रतिरूपो के लिए स्पष्ट संभाव्यता सारणी प्रकाशित किया था।<ref>{{cite journal |last=Spurrier |first=J. D. |year=2003 |title=On the null distribution of the Kruskal–Wallis statistic |journal=Journal of Nonparametric Statistics |volume=15 |issue=6 |pages=685–691 |doi=10.1080/10485250310001634719 }}</ref> मेयर और सीमैन (2006) ने 105 प्रतिभागियों के रूप में बड़े प्रतिरूपो के लिए स्पष्ट संभाव्यता वितरण का उत्पादन किया था।<ref>{{cite journal |last=Meyer |last2=Seaman |date=April 2006 |title=Expanded tables of critical values for the Kruskal–Wallis H statistic |work=Paper presented at the annual meeting of the American Educational Research Association, San Francisco }} Critical value tables and exact probabilities from Meyer and Seaman are available for download at http://faculty.virginia.edu/kruskal-wallis/ {{Webarchive|url=https://web.archive.org/web/20181017173535/http://faculty.virginia.edu/kruskal-wallis/ |date=2018-10-17 }}. A paper describing their work may also be found there.</ref>


== एच का स्पष्ट वितरण ==


== एच == का सटीक वितरण
चोई एट अल <ref>{{cite journal
चोई एट अल।<ref>{{cite journal
|author=Won Choi, Jae Won Lee, Myung-Hoe Huh, and Seung-Ho Kang
|author=Won Choi, Jae Won Lee, Myung-Hoe Huh, and Seung-Ho Kang
|title=An Algorithm for Computing the Exact Distribution of the Kruskal–Wallis Test
|title=An Algorithm for Computing the Exact Distribution of the Kruskal–Wallis Test
Line 42: Line 43:
|pages=1029–1040
|pages=1029–1040
|doi=10.1081/SAC-120023876
|doi=10.1081/SAC-120023876
}}</ref>
}}</ref> ने <math>H</math> के स्पष्ट वितरण की गणना करने के लिए विकसित की गई दो विधियों की समीक्षा की थी और इस प्रकार नया वितरण प्रस्तावित किया और स्पष्ट वितरण की तुलना इसके ची-स्क्वायर सन्निकटन से हुई थी।
के सटीक वितरण की गणना करने के लिए विकसित की गई दो विधियों की समीक्षा की <math>H</math>, नया प्रस्तावित किया, और सटीक वितरण की तुलना इसके ची-स्क्वायर सन्निकटन से की।


== उदाहरण ==
== उदाहरण ==
Line 54: Line 54:
|location=Belmont, Calif |publisher=Wadsworth International Group, Duxbury Press
|location=Belmont, Calif |publisher=Wadsworth International Group, Duxbury Press
|isbn=053498052X
|isbn=053498052X
}}</ref>
}}</ref> न्यूयॉर्क शहर में 1 मई से 30 सितंबर, 1973 तक ओजोन की दैनिक रीडिंग पर डेटा R डेटा सेट वायु गुणवत्ता में हैं, और विश्लेषण R फलन क्रुस्कल.परीक्षण के लिए प्रलेखन में साम्मिलित है। महीने के अनुसार ओजोन मूल्यों के बॉक्सप्लॉट चित्र में दिखाए गए हैं।
न्यूयॉर्क शहर में 1 मई से 30 सितंबर, 1973 तक ओजोन की दैनिक रीडिंग पर। डेटा R डेटा सेट वायु गुणवत्ता में हैं, और विश्लेषण R फ़ंक्शन kruskal.test के लिए प्रलेखन में शामिल है। महीने के अनुसार ओजोन मूल्यों के बॉक्सप्लॉट चित्र में दिखाए गए हैं।


[[File:Ozone_by_month_boxplots.svg|300px|]]क्रुस्कल-वालिस परीक्षण में महत्वपूर्ण अंतर (p = 6.901e-06) मिलता है जो दर्शाता है कि ओजोन 5 महीनों के बीच भिन्न होता है।
[[File:Ozone_by_month_boxplots.svg|300px|]]
 
क्रुस्कल-वालिस परीक्षण में महत्वपूर्ण अंतर (p = 6.901e-06) मिलता है जो दर्शाता है कि ओजोन 5 महीनों के बीच भिन्न होता है।


<syntaxhighlight lang="R">
<syntaxhighlight lang="R">
Line 67: Line 68:
Kruskal-Wallis chi-squared = 29.267, df = 4, p-value = 6.901e-06
Kruskal-Wallis chi-squared = 29.267, df = 4, p-value = 6.901e-06
</syntaxhighlight>
</syntaxhighlight>
यह निर्धारित करने के लिए कि कौन से महीने अलग-अलग हैं, कई परिकल्पना परीक्षण के लिए बोनफेरोनी (या अन्य) सुधार के साथ, महीनों की प्रत्येक जोड़ी के लिए विलकॉक्सन परीक्षण का उपयोग करके पोस्ट-हॉक परीक्षण किया जा सकता है।
यह निर्धारित करने के लिए कि कौन से महीने अलग-अलग हैं, इस प्रकार कई परिकल्पना परीक्षण के लिए बोनफेरोनी (या अन्य) सुधार के साथ, महीनों की प्रत्येक जोड़ी के लिए विलकॉक्सन परीक्षण का उपयोग करके पोस्ट-हॉक परीक्षण किया जा सकता है।


<syntaxhighlight lang="R">
<syntaxhighlight lang="R">
Line 92: Line 93:
== यह भी देखें ==
== यह भी देखें ==
* [[फ्रीडमैन परीक्षण]]
* [[फ्रीडमैन परीक्षण]]
* जोंखीरे का चलन परीक्षण
* जोंखीरे का ट्रेंड परीक्षण


==संदर्भ==
==संदर्भ==

Revision as of 10:15, 21 June 2023

क्रस्कल-वालिस एच परीक्षण [1] (विलियम क्रुस्कल और डब्ल्यू एलन वालिस के नाम पर) या रैंकों पर वन-वे एनोवा द्वारा क्रस्कल-वालिस परीक्षण होता है [1] यह परीक्षण करने के लिए एक गैर-पैरामीट्रिक विधि है कि प्रतिरूप उसी से उत्पन्न होते हैं या नहीं वितरण होते है। [2][3][4] इसका उपयोग समान या भिन्न प्रतिरूप आकार के दो या दो से अधिक स्वतंत्र प्रतिरूपों की तुलना करने के लिए किया जाता है। यह मान-व्हिटनी यू परीक्षण का विस्तार करता है जिसका उपयोग केवल दो समूहों की तुलना करने के लिए किया जाता है। क्रुस्कल-वालिस परीक्षण का पैरामीट्रिक समकक्ष विचरण (एनोवा) का एकतरफा विश्लेषण है।

महत्वपूर्ण क्रुस्कल-वालिस परीक्षण संकेत करता है कि कम से कम प्रतिरूप स्टोचैस्टिक प्रभुत्व अन्य प्रतिरूप है। परीक्षण यह नहीं पहचानता है कि यह स्टोकास्टिक प्रभुत्व कहां होता है या स्टोकास्टिक प्रभुत्व कितने समूहों के जोड़े के लिए प्राप्त होता है। स्टोकेस्टिक प्रभुत्व के लिए विशिष्ट प्रतिरूप जोड़े का विश्लेषण करने के लिए, डन का परीक्षण,[5] बोन्फेरोनी सुधार के साथ जोड़ीदार मान-व्हिटनी परीक्षण,[6] या अधिक शक्तिशाली किन्तु कम प्रसिद्ध कोनोवर-ईमान परीक्षण [6] कभी-कभी उपयोग किए जाते हैं।

चूंकि यह गैरपारंपरिक विधि है, क्रुस्कल-वालिस परीक्षण विचरण के समान एकतरफा विश्लेषण के विपरीत, अवशिष्टों के सामान्य वितरण को नहीं मानता है। इस प्रकार यदि शोधकर्ता माध्यिका में किसी भी अंतर को छोड़कर, सभी समूहों के लिए समान आकार और मापित वितरण की धारणा बना सकता है, जिससे अशक्त परिकल्पना यह है कि सभी समूहों की माध्यिकाएँ समान हैं, और वैकल्पिक परिकल्पना यह है कि कम से कम जनसंख्या माध्यक समूह का कम से कम अन्य समूह की जनसंख्या माध्यिका से भिन्न है। अन्यथा, यह कहना असंभव है कि शून्य परिकल्पना की अस्वीकृति स्थान या समूह फैलाव में बदलाव से आती है या नहीं आती है। यही समस्या मान-व्हिटनी परीक्षण के साथ भी होती है।[7][8][9]

। यह मान-व्हिटनी यू परीक्षण | मान-व्हिटनी यू परीक्षण का विस्तार करता है, जिसका उपयोग केवल दो समूहों की तुलना करने के लिए किया जाता है।

विधि

  1. सभी समूहों के सभी डेटा को एक साथ रैंक करता है; अर्थात समूह सदस्यता को नजरअंदाज करते हुए डेटा को 1 से N तक रैंक करता है। इस प्रकार किसी भी बंधे हुए मूल्यों को असाइन करें और उन्हें प्राप्त होने वाले रैंकों का औसत यदि वे बंधे नहीं होते है।
  2. परीक्षण आँकड़ा इसके द्वारा दिया गया है
    कहाँ
    • सभी समूहों में प्रेक्षणों की कुल संख्या है
    • समूहों की संख्या है
    • समूह में टिप्पणियों की संख्या है
    • समूह से अवलोकन का रैंक (सभी अवलोकनों के बीच) है
    • समूह में सभी अवलोकनों का औसत रैंक है
    • सभी का औसत है
  3. यदि डेटा में कोई संबंध नहीं है तो के लिए अभिव्यक्ति के प्रत्येक पूर्ण रूप से और सही है। इस प्रकार

    अंतिम सूत्र में केवल औसत रैंकों के वर्ग होते हैं।
  4. संबंधों के लिए एक सुधार यदि पिछले बिंदु में वर्णित शॉर्ट-कट सूत्र का उपयोग करके को से विभाजित करके बनाया जा सकता है जहां G विभिन्न बंधे हुए रैंकों के समूहों की संख्या है और ti समूह i के अन्दर बंधे मूल्यों की संख्या है जो एक विशेष मूल्य पर बंधे हैं। यह सुधार सामान्यतः एच के मूल्य में थोड़ा अंतर करता है जब तक कि बड़ी संख्या में कोई संबंध नही होंता है।
  5. इस प्रकार अंत में, अशक्त परिकल्पना को अस्वीकार करने या न करने का निर्णय किसी दिए गए महत्व या अल्फा स्तर के लिए तालिका या सॉफ़्टवेयर से प्राप्त महत्वपूर्ण मान से की तुलना करके किया जाता है। यदि , से बड़ा है, जिससे शून्य परिकल्पना को अस्वीकार कर दिया जाता है। यदि संभव हो (कोई संबंध प्रतिरूप बहुत बड़ा नहीं है) तो एच की तुलना एच के स्पष्ट वितरण से प्राप्त महत्वपूर्ण मूल्य से करनी चाहिए। अन्यथा, के वितरण को g-1 डिग्री स्वतंत्रता के साथ ची-वर्ग वितरण द्वारा अनुमानित किया जा सकता है। यदि कुछ मान छोटे हैं (अर्थात्, 5 से कम) का स्पष्ट संभाव्यता वितरण इस ची-स्क्वायर वितरण से अधिक भिन्न हो सकता है। इस प्रकार यदि ची-स्क्वायर संभाव्यता वितरण की एक तालिका उपलब्ध है, जिससे ची-स्क्वेर्ड का महत्वपूर्ण मान g - 1 स्वतंत्रता की डिग्री (सांख्यिकी) पर तालिका में प्रवेश करके और वांछित के अनुसार देख कर पाया जा सकता है।
  6. यदि आँकड़ा महत्वपूर्ण नहीं है, जिससे प्रतिरूपो के बीच स्टोचैस्टिक प्रभुत्व का कोई प्रमाण नहीं है। चूँकि, यदि परीक्षण महत्वपूर्ण है जिससे कम से कम प्रतिरूप दूसरे प्रतिरूप पर स्थिर रूप से हावी हो जाता है। इसलिए, शोधकर्ता अलग-अलग प्रतिरूप जोड़े के बीच प्रतिरूप विरोधाभासों का उपयोग कर सकता है, या इस प्रकार डन के परीक्षण का उपयोग करके पोस्ट हॉक परीक्षण कर सकता है, जो (1) क्रुस्कल-वालिस परीक्षण के समान रैंकिंग को ठीक से नियोजित करता है, और (2) शून्य द्वारा निहित पूलित भिन्नता को ठीक से नियोजित करता है। क्रुस्कल-वालिस परीक्षण की परिकल्पना यह निर्धारित करने के लिए कि कौन से प्रतिरूप जोड़े महत्वपूर्ण रूप से भिन्न हैं।[5] इस प्रकार एकाधिक प्रतिरूप विरोधाभास या परीक्षण करते समय, टाइप त्रुटि दर बढ़ जाती है, जिससे एकाधिक तुलना समस्या के बारे में चिंता बढ़ जाती है।

स्पष्ट संभाव्यता तालिका

क्रस्कल-वालिस परीक्षण के लिए स्पष्ट संभावनाओं की गणना करने के लिए बड़ी मात्रा में कंप्यूटिंग संसाधनों की आवश्यकता होती है। इस प्रकार स्पष्टता सॉफ़्टवेयर लगभग 30 प्रतिभागियों से कम प्रतिरूप आकार के लिए केवल स्पष्ट संभावनाएं प्रदान करता है। ये सॉफ़्टवेयर प्रोग्राम बड़े प्रतिरूप आकार के लिए स्पर्शोन्मुख सन्निकटन पर निर्भर करते हैं।

बड़े प्रतिरूप आकारों के लिए स्पष्ट संभाव्यता मान उपलब्ध हैं। स्परियर (2003) ने 45 प्रतिभागियों के रूप में बड़े प्रतिरूपो के लिए स्पष्ट संभाव्यता सारणी प्रकाशित किया था।[10] मेयर और सीमैन (2006) ने 105 प्रतिभागियों के रूप में बड़े प्रतिरूपो के लिए स्पष्ट संभाव्यता वितरण का उत्पादन किया था।[11]

एच का स्पष्ट वितरण

चोई एट अल [12] ने के स्पष्ट वितरण की गणना करने के लिए विकसित की गई दो विधियों की समीक्षा की थी और इस प्रकार नया वितरण प्रस्तावित किया और स्पष्ट वितरण की तुलना इसके ची-स्क्वायर सन्निकटन से हुई थी।

उदाहरण

महीने के अनुसार ओजोन के स्तर में अंतर के लिए परीक्षण

निम्न उदाहरण चेम्बर्स एट अल से डेटा का उपयोग करता है।[13] न्यूयॉर्क शहर में 1 मई से 30 सितंबर, 1973 तक ओजोन की दैनिक रीडिंग पर डेटा R डेटा सेट वायु गुणवत्ता में हैं, और विश्लेषण R फलन क्रुस्कल.परीक्षण के लिए प्रलेखन में साम्मिलित है। महीने के अनुसार ओजोन मूल्यों के बॉक्सप्लॉट चित्र में दिखाए गए हैं।

Ozone by month boxplots.svg

क्रुस्कल-वालिस परीक्षण में महत्वपूर्ण अंतर (p = 6.901e-06) मिलता है जो दर्शाता है कि ओजोन 5 महीनों के बीच भिन्न होता है।

kruskal.test(Ozone ~ Month, data = airquality)

	Kruskal-Wallis rank sum test

data:  Ozone by Month
Kruskal-Wallis chi-squared = 29.267, df = 4, p-value = 6.901e-06

यह निर्धारित करने के लिए कि कौन से महीने अलग-अलग हैं, इस प्रकार कई परिकल्पना परीक्षण के लिए बोनफेरोनी (या अन्य) सुधार के साथ, महीनों की प्रत्येक जोड़ी के लिए विलकॉक्सन परीक्षण का उपयोग करके पोस्ट-हॉक परीक्षण किया जा सकता है।

pairwise.wilcox.test(airquality$Ozone, airquality$Month, p.adjust.method = "bonferroni")


	Pairwise comparisons using Wilcoxon rank sum test 

data:  airquality$Ozone and airquality$Month 

  5      6      7      8     
6 1.0000 -      -      -     
7 0.0003 0.1414 -      -     
8 0.0012 0.2591 1.0000 -     
9 1.0000 1.0000 0.0074 0.0325

P value adjustment method: bonferroni

पोस्ट-हॉक परीक्षणों से संकेत मिलता है कि, कई परीक्षण के लिए बोनफेरोनी सुधार के बाद, निम्नलिखित अंतर महत्वपूर्ण हैं (समायोजित पी <0.05)।

  • माह 5 बनाम माह 7 और 8
  • माह 9 बनाम माह 7 और 8

यह भी देखें

संदर्भ

  1. 1.0 1.1 Kruskal–Wallis H Test using SPSS Statistics, Laerd Statistics
  2. Kruskal; Wallis (1952). "एक-मानदंड विचरण विश्लेषण में रैंकों का उपयोग". Journal of the American Statistical Association. 47 (260): 583–621. doi:10.1080/01621459.1952.10483441.
  3. Corder, Gregory W.; Foreman, Dale I. (2009). गैर-सांख्यिकीविदों के लिए गैरपारंपरिक सांख्यिकी. Hoboken: John Wiley & Sons. pp. 99–105. ISBN 9780470454619.
  4. Siegel; Castellan (1988). स्वभावजन्य विज्ञान के लिए नॉनपैरामीट्रिक आंकड़े (Second ed.). New York: McGraw–Hill. ISBN 0070573573.
  5. 5.0 5.1 Dunn, Olive Jean (1964). "रैंक योगों का उपयोग करके एकाधिक तुलना". Technometrics. 6 (3): 241–252. doi:10.2307/1266041.
  6. 6.0 6.1 Conover, W. Jay; Iman, Ronald L. (1979). "बहु-तुलना प्रक्रियाओं पर" (PDF) (Report). Los Alamos Scientific Laboratory. Retrieved 2016-10-28.
  7. Divine; Norton; Barón; Juarez-Colunga (2018). "The Wilcoxon–Mann–Whitney Procedure Fails as a Test of Medians". The American Statistician. doi:10.1080/00031305.2017.1305291.
  8. Hart (2001). "Mann-Whitney test is not just a test of medians: differences in spread can be important". BMJ. doi:10.1136/bmj.323.7309.391.
  9. Bruin (2006). "FAQ: Why is the Mann-Whitney significant when the medians are equal?". UCLA: Statistical Consulting Group.
  10. Spurrier, J. D. (2003). "On the null distribution of the Kruskal–Wallis statistic". Journal of Nonparametric Statistics. 15 (6): 685–691. doi:10.1080/10485250310001634719.
  11. Meyer; Seaman (April 2006). "Expanded tables of critical values for the Kruskal–Wallis H statistic". Paper presented at the annual meeting of the American Educational Research Association, San Francisco. Critical value tables and exact probabilities from Meyer and Seaman are available for download at http://faculty.virginia.edu/kruskal-wallis/ Archived 2018-10-17 at the Wayback Machine. A paper describing their work may also be found there.
  12. Won Choi, Jae Won Lee, Myung-Hoe Huh, and Seung-Ho Kang (2003). "An Algorithm for Computing the Exact Distribution of the Kruskal–Wallis Test". Communications in Statistics - Simulation and Computation (32, number 4): 1029–1040. doi:10.1081/SAC-120023876.{{cite journal}}: CS1 maint: multiple names: authors list (link)
  13. John M. Chambers, William S. Cleveland, Beat Kleiner, and Paul A. Tukey (1983). Graphical Methods for Data Analysis. Belmont, Calif: Wadsworth International Group, Duxbury Press. ISBN 053498052X.{{cite book}}: CS1 maint: multiple names: authors list (link)


अग्रिम पठन


बाहरी संबंध