श्रेणी सहसंबंध: Difference between revisions

From Vigyanwiki
(Created page with "{{Short description|Statistic comparing ordinal rankings}} आंकड़ों में, रैंक सहसंबंध कई आँकड़ों में से...")
 
No edit summary
Line 1: Line 1:
{{Short description|Statistic comparing ordinal rankings}}
{{Short description|Statistic comparing ordinal rankings}}
आंकड़ों में, रैंक सहसंबंध कई आँकड़ों में से एक है जो एक क्रमिक संघ को मापता है - विभिन्न [[क्रमिक डेटा]] चर की [[रैंकिंग]] या एक ही चर की विभिन्न रैंकिंग के बीच संबंध, जहां रैंकिंग पहले, दूसरे, तीसरे क्रम के लेबल का असाइनमेंट है। आदि किसी विशेष चर के विभिन्न अवलोकनों के लिए। रैंक सहसंबंध गुणांक दो रैंकिंग के बीच समानता की डिग्री को मापता है, और इसका उपयोग उनके बीच संबंध के सांख्यिकीय महत्व का आकलन करने के लिए किया जा सकता है। उदाहरण के लिए, रैंक सहसंबंध का उपयोग करने वाले महत्व के दो सामान्य गैर-पैरामीट्रिक तरीके मैन-व्हिटनी यू परीक्षण और [[विलकॉक्सन हस्ताक्षरित-रैंक परीक्षण]] हैं।
आंकड़ों में, '''श्रेणी सहसंबंध''' कई आँकड़ों में से एक है जो एक क्रमिक संघ को मापता है - विभिन्न [[क्रमिक डेटा|क्रमिक आंकड़े]] चर की [[रैंकिंग|श्रेणी]] या एक ही चर की विभिन्न श्रेणी के बीच संबंध, जहां "श्रेणी" किसी विशेष चर के विभिन्न अवलोकनों के लिए क्रम वर्गीकरण "प्रथम", "दूसरा", "तीसरा" आदि का समनुदेशन है। श्रेणी सहसंबंध गुणांक दो श्रेणी के बीच समानता की डिग्री को मापता है, और इसका उपयोग उनके बीच संबंध के सांख्यिकीय महत्व का आकलन करने के लिए किया जा सकता है। उदाहरण के लिए, श्रेणी सहसंबंध का उपयोग करने वाले महत्व के दो सामान्य गैर-पैरामीट्रिक तरीके मैन-व्हिटनी यू परीक्षण और [[विलकॉक्सन हस्ताक्षरित-रैंक परीक्षण]] हैं।


==संदर्भ==
==संदर्भ==


यदि, उदाहरण के लिए, एक चर कॉलेज बास्केटबॉल कार्यक्रम की पहचान है और दूसरा चर कॉलेज फुटबॉल कार्यक्रम की पहचान है, तो कोई दो प्रकार के कार्यक्रम की पोल रैंकिंग के बीच संबंध का परीक्षण कर सकता है: क्या उच्च रैंक वाले बास्केटबॉल कार्यक्रम वाले कॉलेजों में उच्च रैंक वाले फुटबॉल कार्यक्रम होते हैं? एक रैंक सहसंबंध गुणांक उस रिश्ते को माप सकता है, और रैंक सहसंबंध गुणांक के महत्व का माप यह दिखा सकता है कि क्या मापा गया संबंध एक संयोग होने के लिए काफी छोटा है।
यदि, उदाहरण के लिए, एक चर कॉलेज बास्केटबॉल कार्यक्रम की पहचान है और दूसरा चर कॉलेज फुटबॉल कार्यक्रम की पहचान है, तो कोई दो प्रकार के कार्यक्रम की पोल श्रेणी के बीच संबंध का परीक्षण कर सकता है: क्या उच्च रैंक वाले बास्केटबॉल कार्यक्रम वाले कॉलेजों में उच्च रैंक वाले फुटबॉल कार्यक्रम होते हैं? एक श्रेणी सहसंबंध गुणांक उस रिश्ते को माप सकता है, और श्रेणी सहसंबंध गुणांक के महत्व का माप यह दिखा सकता है कि क्या मापा गया संबंध एक संयोग होने के लिए काफी छोटा है।


यदि केवल एक ही चर है, एक कॉलेज फुटबॉल कार्यक्रम की पहचान, लेकिन यह दो अलग-अलग पोल रैंकिंग (जैसे, एक कोच द्वारा और एक खेल लेखकों द्वारा) के अधीन है, तो दो अलग-अलग पोल की रैंकिंग की समानता को रैंक सहसंबंध गुणांक के साथ मापा जा सकता है।
यदि केवल एक ही चर है, एक कॉलेज फुटबॉल कार्यक्रम की पहचान, लेकिन यह दो अलग-अलग पोल श्रेणी (जैसे, एक कोच द्वारा और एक खेल लेखकों द्वारा) के अधीन है, तो दो अलग-अलग पोल की श्रेणी की समानता को श्रेणी सहसंबंध गुणांक के साथ मापा जा सकता है।


एक अन्य उदाहरण के रूप में, कम आय, मध्यम आय, और पंक्ति चर में उच्च आय और शैक्षिक स्तर के साथ एक [[आकस्मिक तालिका]] में - कॉलम चर में कोई हाई स्कूल, हाई स्कूल, विश्वविद्यालय नहीं),<ref>{{cite journal |last=Kruskal |author-link=William Kruskal |first=William H. |year=1958 |title=एसोसिएशन के सामान्य उपाय|journal=[[Journal of the American Statistical Association]] |volume=53 |issue=284 |pages=814–861 |jstor=2281954 |doi=10.2307/2281954}}</ref> रैंक सहसंबंध आय और शैक्षिक स्तर के बीच संबंध को मापता है।
एक अन्य उदाहरण के रूप में, कम आय, मध्यम आय, और पंक्ति चर में उच्च आय और शैक्षिक स्तर के साथ एक [[आकस्मिक तालिका|आसंग सारणी]] में - कॉलम चर में कोई हाई स्कूल, हाई स्कूल, विश्वविद्यालय नहीं),<ref>{{cite journal |last=Kruskal |author-link=William Kruskal |first=William H. |year=1958 |title=एसोसिएशन के सामान्य उपाय|journal=[[Journal of the American Statistical Association]] |volume=53 |issue=284 |pages=814–861 |jstor=2281954 |doi=10.2307/2281954}}</ref> श्रेणी सहसंबंध आय और शैक्षिक स्तर के बीच संबंध को मापता है।


==सहसंबंध गुणांक==
==सहसंबंध गुणांक==


कुछ अधिक लोकप्रिय रैंक सहसंबंध आँकड़े शामिल हैं
कुछ अधिक प्रचलित श्रेणी सहसंबंध आँकड़े सम्मिलित हैं
# स्पीयरमैन का रैंक सहसंबंध गुणांक|स्पीयरमैन का ρ
# स्पीयरमैन का श्रेणी सहसंबंध गुणांक
# केंडल का ताउ रैंक सहसंबंध गुणांक|केंडल का τ
# केंडल का ताउ श्रेणी सहसंबंध गुणांक
# गुडमैन और क्रुस्कल का गामा|गुडमैन और क्रुस्कल का γ
# गुडमैन और क्रुस्कल का गामा
#सोमर्स डी
#सोमर्स डी


बढ़ते रैंक सहसंबंध गुणांक का तात्पर्य रैंकिंग के बीच बढ़ते समझौते से है। गुणांक अंतराल [−1, 1] के अंदर है और मान मानता है:
बढ़ते श्रेणी सहसंबंध गुणांक का तात्पर्य श्रेणी के बीच बढ़ते समझौते से है। गुणांक अंतराल [−1, 1] के अंदर है और मान मानता है:


*1 यदि दोनों रैंकिंग के बीच समझौता सही है; दोनों रैंकिंग समान हैं.
*1 यदि दोनों श्रेणी के बीच समझौता सही है; दोनों श्रेणी समान हैं।
* 0 यदि रैंकिंग पूरी तरह से स्वतंत्र है।
* 0 यदि श्रेणी पूरी तरह से स्वतंत्र है।
* −1 यदि दो रैंकिंग के बीच असहमति सही है; एक रैंकिंग दूसरे से उलट है।
* −1 यदि दो श्रेणी के बीच असहमति सही है; एक श्रेणी दूसरे से उलट है।


अगले {{harvtxt|Diaconis|1988}}, रैंकिंग को वस्तुओं के एक [[सेट (गणित)]] के क्रम[[परिवर्तन]] के रूप में देखा जा सकता है। इस प्रकार हम प्रेक्षित रैंकिंग को उस डेटा के रूप में देख सकते हैं जब नमूना स्थान एक [[सममित समूह]] (के साथ पहचाना जाता है) प्राप्त होता है। फिर हम एक मीट्रिक (गणित) का परिचय दे सकते हैं, जिससे सममित समूह को एक [[मीट्रिक स्थान]] में बदल दिया जा सकता है। अलग-अलग मेट्रिक्स अलग-अलग रैंक सहसंबंधों के अनुरूप होंगे।
अगले {{harvtxt|डायकोनिस|1988}}, श्रेणी को वस्तुओं के एक [[सेट (गणित)|सम्मुच्चय (गणित)]] के क्रम[[परिवर्तन]] के रूप में देखा जा सकता है। इस प्रकार हम प्रेक्षित श्रेणी को उस आंकड़े के रूप में देख सकते हैं जब प्रतिरूप स्थान एक [[सममित समूह]] (के साथ पहचाना जाता है) प्राप्त होता है। फिर हम एक आव्यूह (गणित) का परिचय दे सकते हैं, जिससे सममित समूह को एक [[मीट्रिक स्थान]] में बदल दिया जा सकता है। अलग-अलग आव्यूह अलग-अलग श्रेणी सहसंबंधों के अनुरूप होंगे।


==सामान्य सहसंबंध गुणांक==
==सामान्य सहसंबंध गुणांक==
केंडल 1970<ref name="kendall1970">{{cite book |last1=Kendall |first1=Maurice G |title=रैंक सहसंबंध विधियाँ|date=1970 |publisher=Griffin |isbn=9780852641996 |edition=4}}</ref> दिखाया कि उसका <math>\tau</math> (ताऊ) और स्पीयरमैन का <math>\rho</math> (आरएचओ) सामान्य सहसंबंध गुणांक के विशेष मामले हैं।
केंडल 1970 <ref name="kendall1970">{{cite book |last1=Kendall |first1=Maurice G |title=रैंक सहसंबंध विधियाँ|date=1970 |publisher=Griffin |isbn=9780852641996 |edition=4}}</ref> दिखाया कि उसका <math>\tau</math> (तउ) और स्पीयरमैन का <math>\rho</math> (आरएचओ) सामान्य सहसंबंध गुणांक की विशेष स्तिथि हैं।


मान लीजिए हमारे पास एक सेट है <math>n</math> जिन वस्तुओं पर दो गुणों के संबंध में विचार किया जा रहा है, उनका प्रतिनिधित्व किया जाता है <math>x</math> और <math>y</math>, मूल्यों के सेट का निर्माण <math>\{x_i\}_{i\le n}</math> और <math>\{y_i\}_{i\le n}</math>. व्यक्तियों के किसी भी जोड़े के लिए, कहें <math>i</math>-वें और द <math>j</math>-वें हम असाइन करते हैं <math>x</math>-स्कोर, द्वारा निरूपित <math>a_{ij}</math>, और ए <math>y</math>-स्कोर, द्वारा निरूपित <math>b_{ij}</math>. इन कार्यों के लिए एकमात्र आवश्यकता यह है कि वे सममित-विरोधी हों, इसलिए <math>a_{ij}=-a_{ji}</math> और <math>b_{ij}=-b_{ji}</math>. (ध्यान दें कि विशेष रूप से <math>a_{ij}=b_{ij}=0</math> अगर <math>i = j</math>.) फिर सामान्यीकृत सहसंबंध गुणांक <math>\Gamma</math> परिभाषित किया जाता है
मान लीजिए हमारे पास एक सम्मुच्चय <math>n</math> है जिन वस्तुओं पर दो गुणों के संबंध में विचार किया जा रहा है, उनका प्रतिनिधित्व <math>x</math> और <math>y</math> द्वारा किया जाता है, '''मूल्यों के सम्मुच्चय का निर्माण''' <math>\{x_i\}_{i\le n}</math> और <math>\{y_i\}_{i\le n}</math>. व्यक्तियों के किसी भी जोड़े के लिए, कहें <math>i</math>-वें और द <math>j</math>-वें हम असाइन करते हैं <math>x</math>-स्कोर, द्वारा निरूपित <math>a_{ij}</math>, और ए <math>y</math>-स्कोर, द्वारा निरूपित <math>b_{ij}</math>. इन कार्यों के लिए एकमात्र आवश्यकता यह है कि वे सममित-विरोधी हों, इसलिए <math>a_{ij}=-a_{ji}</math> और <math>b_{ij}=-b_{ji}</math>. (ध्यान दें कि विशेष रूप से <math>a_{ij}=b_{ij}=0</math> अगर <math>i = j</math>.) फिर सामान्यीकृत सहसंबंध गुणांक <math>\Gamma</math> परिभाषित किया जाता है


: <math>\Gamma = \frac{\sum_{i,j = 1}^n a_{ij}b_{ij}}{\sqrt{\sum_{i,j = 1}^n a_{ij}^2 \sum_{i,j = 1}^n b_{ij}^2}} </math>
: <math>\Gamma = \frac{\sum_{i,j = 1}^n a_{ij}b_{ij}}{\sqrt{\sum_{i,j = 1}^n a_{ij}^2 \sum_{i,j = 1}^n b_{ij}^2}} </math>
Line 43: Line 43:


: <math>a_{ij} = \sgn(r_j-r_i),\quad  b_{ij} = \sgn(s_j-s_i).</math>
: <math>a_{ij} = \sgn(r_j-r_i),\quad  b_{ij} = \sgn(s_j-s_i).</math>
योग <math>\sum a_{ij}b_{ij} </math> सुसंगत जोड़ियों की संख्या घटाकर असंगत जोड़ियों की संख्या है (केंडल ताऊ रैंक सहसंबंध गुणांक देखें)। योग <math>\sum a_{ij}^2</math> बस है <math>n(n-1)/2</math>, पदों की संख्या <math>a_{ij}</math>, जैसा है <math>\sum b_{ij}^2</math>. इस प्रकार इस मामले में,
योग <math>\sum a_{ij}b_{ij} </math> सुसंगत जोड़ियों की संख्या घटाकर असंगत जोड़ियों की संख्या है (केंडल ताऊ श्रेणी सहसंबंध गुणांक देखें)। योग <math>\sum a_{ij}^2</math> बस है <math>n(n-1)/2</math>, पदों की संख्या <math>a_{ij}</math>, जैसा है <math>\sum b_{ij}^2</math>. इस प्रकार इस मामले में,


: <math>\Gamma = \frac{2\,((\text{number of concordant pairs}) - (\text{number of discordant pairs}))}{n(n-1)} = \text{Kendall's }\tau</math>
: <math>\Gamma = \frac{2\,((\text{number of concordant pairs}) - (\text{number of discordant pairs}))}{n(n-1)} = \text{Kendall's }\tau</math>
Line 110: Line 110:
:<math>\Gamma = 1 - \frac{\sum_{i = 1}^{n} d_{i}^{2}}{2n\mathrm{Var}(U)} = 1 - \frac{6\sum_{i = 1}^{n} d_{i}^{2}}{n(n^{2}-1)}</math>
:<math>\Gamma = 1 - \frac{\sum_{i = 1}^{n} d_{i}^{2}}{2n\mathrm{Var}(U)} = 1 - \frac{6\sum_{i = 1}^{n} d_{i}^{2}}{n(n^{2}-1)}</math>
कहाँ <math>d_{i} = r_{i} - s_{i}</math> रैंकों के बीच अंतर है,
कहाँ <math>d_{i} = r_{i} - s_{i}</math> रैंकों के बीच अंतर है,
जो बिल्कुल स्पीयरमैन का रैंक सहसंबंध गुणांक है <math>\rho</math>.
जो बिल्कुल स्पीयरमैन का श्रेणी सहसंबंध गुणांक है <math>\rho</math>.


==रैंक-द्विक्रमिक सहसंबंध==
==रैंक-द्विक्रमिक सहसंबंध==
{{Main|Mann–Whitney_U_test#Rank-biserial_correlation}}
{{Main|Mann–Whitney_U_test#Rank-biserial_correlation}}


जीन ग्लास (1965) ने कहा कि रैंक-द्विधारावाहिक स्पीयरमैन से प्राप्त किया जा सकता है <math>\rho</math>. कोई व्यक्ति एक्स, द्विभाजित चर और वाई, रैंकिंग चर पर परिभाषित गुणांक प्राप्त कर सकता है, जो एक्स और वाई के बीच स्पीयरमैन के आरएचओ का उसी तरह अनुमान लगाता है जैसे द्विक्रमिक आर दो सामान्य चर के बीच पियर्सन के आर का अनुमान लगाता है" (पी. 91)। रैंक-द्विक्रमिक सहसंबंध को नौ साल पहले एडवर्ड क्यूरटन (1956) द्वारा रैंक सहसंबंध के एक उपाय के रूप में पेश किया गया था जब रैंक दो समूहों में होते हैं।
जीन ग्लास (1965) ने कहा कि रैंक-द्विधारावाहिक स्पीयरमैन से प्राप्त किया जा सकता है <math>\rho</math>. कोई व्यक्ति एक्स, द्विभाजित चर और वाई, श्रेणी चर पर परिभाषित गुणांक प्राप्त कर सकता है, जो एक्स और वाई के बीच स्पीयरमैन के आरएचओ का उसी तरह अनुमान लगाता है जैसे द्विक्रमिक आर दो सामान्य चर के बीच पियर्सन के आर का अनुमान लगाता है" (पी. 91)। रैंक-द्विक्रमिक सहसंबंध को नौ साल पहले एडवर्ड क्यूरटन (1956) द्वारा श्रेणी सहसंबंध के एक उपाय के रूप में पेश किया गया था जब रैंक दो समूहों में होते हैं।


===केर्बी सरल अंतर सूत्र===
===केर्बी सरल अंतर सूत्र===
डेव केर्बी (2014) ने छात्रों को रैंक सहसंबंध से परिचित कराने के उपाय के रूप में रैंक-द्विक्रमिक की सिफारिश की, क्योंकि सामान्य तर्क को परिचयात्मक स्तर पर समझाया जा सकता है। रैंक-द्विधारावाहिक मान-व्हिटनी यू परीक्षण के साथ उपयोग किया जाने वाला सहसंबंध है, जो आमतौर पर सांख्यिकी पर परिचयात्मक कॉलेज पाठ्यक्रमों में शामिल एक विधि है। इस परीक्षण के डेटा में दो समूह शामिल हैं; और समूहों के प्रत्येक सदस्य के लिए, परिणाम को समग्र रूप से अध्ययन के लिए क्रमबद्ध किया जाता है।
डेव केर्बी (2014) ने छात्रों को श्रेणी सहसंबंध से परिचित कराने के उपाय के रूप में रैंक-द्विक्रमिक की सिफारिश की, क्योंकि सामान्य तर्क को परिचयात्मक स्तर पर समझाया जा सकता है। रैंक-द्विधारावाहिक मान-व्हिटनी यू परीक्षण के साथ उपयोग किया जाने वाला सहसंबंध है, जो आमतौर पर सांख्यिकी पर परिचयात्मक कॉलेज पाठ्यक्रमों में सम्मिलित एक विधि है। इस परीक्षण के आंकड़े में दो समूह सम्मिलित हैं; और समूहों के प्रत्येक सदस्य के लिए, परिणाम को समग्र रूप से अध्ययन के लिए क्रमबद्ध किया जाता है।


केर्बी ने दिखाया कि इस रैंक सहसंबंध को दो अवधारणाओं के संदर्भ में व्यक्त किया जा सकता है: डेटा का प्रतिशत जो किसी बताई गई परिकल्पना का समर्थन करता है, और डेटा का प्रतिशत जो इसका समर्थन नहीं करता है। केर्बी सरल अंतर सूत्र में कहा गया है कि रैंक सहसंबंध को अनुकूल साक्ष्य (एफ) के अनुपात से प्रतिकूल साक्ष्य (यू) के अनुपात के बीच अंतर के रूप में व्यक्त किया जा सकता है।
केर्बी ने दिखाया कि इस श्रेणी सहसंबंध को दो अवधारणाओं के संदर्भ में व्यक्त किया जा सकता है: आंकड़े का प्रतिशत जो किसी बताई गई परिकल्पना का समर्थन करता है, और आंकड़े का प्रतिशत जो इसका समर्थन नहीं करता है। केर्बी सरल अंतर सूत्र में कहा गया है कि श्रेणी सहसंबंध को अनुकूल साक्ष्य (एफ) के अनुपात से प्रतिकूल साक्ष्य (यू) के अनुपात के बीच अंतर के रूप में व्यक्त किया जा सकता है।
:<math>r = f - u </math>
:<math>r = f - u </math>


Line 127: Line 127:
गणना को स्पष्ट करने के लिए, मान लीजिए कि एक कोच दो तरीकों का उपयोग करके एक महीने के लिए लंबी दूरी के धावकों को प्रशिक्षित करता है। ग्रुप ए में 5 धावक हैं, और ग्रुप बी में 4 धावक हैं। बताई गई परिकल्पना यह है कि विधि ए तेज़ धावक पैदा करती है। परिणामों का आकलन करने की दौड़ में पाया गया कि समूह ए के धावक वास्तव में तेज़ दौड़ते हैं, निम्नलिखित रैंक के साथ: 1, 2, 3, 4, और 6। समूह बी के धीमे धावकों की रैंक 5, 7, 8 है। और 9.
गणना को स्पष्ट करने के लिए, मान लीजिए कि एक कोच दो तरीकों का उपयोग करके एक महीने के लिए लंबी दूरी के धावकों को प्रशिक्षित करता है। ग्रुप ए में 5 धावक हैं, और ग्रुप बी में 4 धावक हैं। बताई गई परिकल्पना यह है कि विधि ए तेज़ धावक पैदा करती है। परिणामों का आकलन करने की दौड़ में पाया गया कि समूह ए के धावक वास्तव में तेज़ दौड़ते हैं, निम्नलिखित रैंक के साथ: 1, 2, 3, 4, और 6। समूह बी के धीमे धावकों की रैंक 5, 7, 8 है। और 9.


विश्लेषण जोड़ियों पर किया जाता है, जिन्हें एक समूह के सदस्य की तुलना में दूसरे समूह के सदस्य के रूप में परिभाषित किया जाता है। उदाहरण के लिए, अध्ययन में सबसे तेज़ धावक चार जोड़ियों का सदस्य है: (1,5), (1,7), (1,8), और (1,9)। ये चारों जोड़े परिकल्पना का समर्थन करते हैं, क्योंकि प्रत्येक जोड़ी में समूह ए का धावक समूह बी के धावक से तेज़ है। कुल 20 जोड़े हैं, और 19 जोड़े परिकल्पना का समर्थन करते हैं। एकमात्र जोड़ी जो परिकल्पना का समर्थन नहीं करती वह रैंक 5 और 6 वाले दो धावक हैं, क्योंकि इस जोड़ी में ग्रुप बी के धावक का समय सबसे तेज़ था। केर्बी सरल अंतर सूत्र के अनुसार, 95% डेटा परिकल्पना का समर्थन करता है (20 जोड़े में से 19), और 5% समर्थन नहीं करता है (20 जोड़े में से 1), इसलिए रैंक सहसंबंध r = .95 - .05 = .90 है .
विश्लेषण जोड़ियों पर किया जाता है, जिन्हें एक समूह के सदस्य की तुलना में दूसरे समूह के सदस्य के रूप में परिभाषित किया जाता है। उदाहरण के लिए, अध्ययन में सबसे तेज़ धावक चार जोड़ियों का सदस्य है: (1,5), (1,7), (1,8), और (1,9)। ये चारों जोड़े परिकल्पना का समर्थन करते हैं, क्योंकि प्रत्येक जोड़ी में समूह ए का धावक समूह बी के धावक से तेज़ है। कुल 20 जोड़े हैं, और 19 जोड़े परिकल्पना का समर्थन करते हैं। एकमात्र जोड़ी जो परिकल्पना का समर्थन नहीं करती वह रैंक 5 और 6 वाले दो धावक हैं, क्योंकि इस जोड़ी में ग्रुप बी के धावक का समय सबसे तेज़ था। केर्बी सरल अंतर सूत्र के अनुसार, 95% आंकड़े परिकल्पना का समर्थन करता है (20 जोड़े में से 19), और 5% समर्थन नहीं करता है (20 जोड़े में से 1), इसलिए श्रेणी सहसंबंध r = .95 - .05 = .90 है .


सहसंबंध का अधिकतम मान r = 1 है, जिसका अर्थ है कि 100% जोड़े परिकल्पना के पक्ष में हैं। r = 0 का सहसंबंध इंगित करता है कि आधे जोड़े परिकल्पना का समर्थन करते हैं और आधे नहीं; दूसरे शब्दों में, नमूना समूह रैंक में भिन्न नहीं होते हैं, इसलिए इसका कोई सबूत नहीं है कि वे दो अलग-अलग आबादी से आते हैं। कहा जा सकता है कि r = 0 का प्रभाव आकार समूह सदस्यता और सदस्यों के रैंक के बीच कोई संबंध नहीं बताता है।
सहसंबंध का अधिकतम मान r = 1 है, जिसका अर्थ है कि 100% जोड़े परिकल्पना के पक्ष में हैं। r = 0 का सहसंबंध इंगित करता है कि आधे जोड़े परिकल्पना का समर्थन करते हैं और आधे नहीं; दूसरे शब्दों में, प्रतिरूप समूह रैंक में भिन्न नहीं होते हैं, इसलिए इसका कोई सबूत नहीं है कि वे दो अलग-अलग आबादी से आते हैं। कहा जा सकता है कि r = 0 का प्रभाव आकार समूह सदस्यता और सदस्यों के रैंक के बीच कोई संबंध नहीं बताता है।


==संदर्भ==
==संदर्भ==

Revision as of 11:51, 2 August 2023

आंकड़ों में, श्रेणी सहसंबंध कई आँकड़ों में से एक है जो एक क्रमिक संघ को मापता है - विभिन्न क्रमिक आंकड़े चर की श्रेणी या एक ही चर की विभिन्न श्रेणी के बीच संबंध, जहां "श्रेणी" किसी विशेष चर के विभिन्न अवलोकनों के लिए क्रम वर्गीकरण "प्रथम", "दूसरा", "तीसरा" आदि का समनुदेशन है। श्रेणी सहसंबंध गुणांक दो श्रेणी के बीच समानता की डिग्री को मापता है, और इसका उपयोग उनके बीच संबंध के सांख्यिकीय महत्व का आकलन करने के लिए किया जा सकता है। उदाहरण के लिए, श्रेणी सहसंबंध का उपयोग करने वाले महत्व के दो सामान्य गैर-पैरामीट्रिक तरीके मैन-व्हिटनी यू परीक्षण और विलकॉक्सन हस्ताक्षरित-रैंक परीक्षण हैं।

संदर्भ

यदि, उदाहरण के लिए, एक चर कॉलेज बास्केटबॉल कार्यक्रम की पहचान है और दूसरा चर कॉलेज फुटबॉल कार्यक्रम की पहचान है, तो कोई दो प्रकार के कार्यक्रम की पोल श्रेणी के बीच संबंध का परीक्षण कर सकता है: क्या उच्च रैंक वाले बास्केटबॉल कार्यक्रम वाले कॉलेजों में उच्च रैंक वाले फुटबॉल कार्यक्रम होते हैं? एक श्रेणी सहसंबंध गुणांक उस रिश्ते को माप सकता है, और श्रेणी सहसंबंध गुणांक के महत्व का माप यह दिखा सकता है कि क्या मापा गया संबंध एक संयोग होने के लिए काफी छोटा है।

यदि केवल एक ही चर है, एक कॉलेज फुटबॉल कार्यक्रम की पहचान, लेकिन यह दो अलग-अलग पोल श्रेणी (जैसे, एक कोच द्वारा और एक खेल लेखकों द्वारा) के अधीन है, तो दो अलग-अलग पोल की श्रेणी की समानता को श्रेणी सहसंबंध गुणांक के साथ मापा जा सकता है।

एक अन्य उदाहरण के रूप में, कम आय, मध्यम आय, और पंक्ति चर में उच्च आय और शैक्षिक स्तर के साथ एक आसंग सारणी में - कॉलम चर में कोई हाई स्कूल, हाई स्कूल, विश्वविद्यालय नहीं),[1] श्रेणी सहसंबंध आय और शैक्षिक स्तर के बीच संबंध को मापता है।

सहसंबंध गुणांक

कुछ अधिक प्रचलित श्रेणी सहसंबंध आँकड़े सम्मिलित हैं

  1. स्पीयरमैन का श्रेणी सहसंबंध गुणांक
  2. केंडल का ताउ श्रेणी सहसंबंध गुणांक
  3. गुडमैन और क्रुस्कल का गामा
  4. सोमर्स डी

बढ़ते श्रेणी सहसंबंध गुणांक का तात्पर्य श्रेणी के बीच बढ़ते समझौते से है। गुणांक अंतराल [−1, 1] के अंदर है और मान मानता है:

  • 1 यदि दोनों श्रेणी के बीच समझौता सही है; दोनों श्रेणी समान हैं।
  • 0 यदि श्रेणी पूरी तरह से स्वतंत्र है।
  • −1 यदि दो श्रेणी के बीच असहमति सही है; एक श्रेणी दूसरे से उलट है।

अगले डायकोनिस (1988), श्रेणी को वस्तुओं के एक सम्मुच्चय (गणित) के क्रमपरिवर्तन के रूप में देखा जा सकता है। इस प्रकार हम प्रेक्षित श्रेणी को उस आंकड़े के रूप में देख सकते हैं जब प्रतिरूप स्थान एक सममित समूह (के साथ पहचाना जाता है) प्राप्त होता है। फिर हम एक आव्यूह (गणित) का परिचय दे सकते हैं, जिससे सममित समूह को एक मीट्रिक स्थान में बदल दिया जा सकता है। अलग-अलग आव्यूह अलग-अलग श्रेणी सहसंबंधों के अनुरूप होंगे।

सामान्य सहसंबंध गुणांक

केंडल 1970 [2] दिखाया कि उसका (तउ) और स्पीयरमैन का (आरएचओ) सामान्य सहसंबंध गुणांक की विशेष स्तिथि हैं।

मान लीजिए हमारे पास एक सम्मुच्चय है जिन वस्तुओं पर दो गुणों के संबंध में विचार किया जा रहा है, उनका प्रतिनिधित्व और द्वारा किया जाता है, मूल्यों के सम्मुच्चय का निर्माण और . व्यक्तियों के किसी भी जोड़े के लिए, कहें -वें और द -वें हम असाइन करते हैं -स्कोर, द्वारा निरूपित , और ए -स्कोर, द्वारा निरूपित . इन कार्यों के लिए एकमात्र आवश्यकता यह है कि वे सममित-विरोधी हों, इसलिए और . (ध्यान दें कि विशेष रूप से अगर .) फिर सामान्यीकृत सहसंबंध गुणांक परिभाषित किया जाता है

समान रूप से, यदि सभी गुणांक मैट्रिक्स में एकत्र किए जाते हैं और , साथ और , तब

कहाँ फ्रोबेनियस आंतरिक उत्पाद है और फ्रोबेनियस मानदंड. विशेष रूप से, सामान्य सहसंबंध गुणांक आव्यूहों के बीच के कोण की कोज्या है और .

केंडल का τ एक विशेष मामले के रूप में

अगर , की रैंक हैं -सदस्य के अनुसार -गुणवत्ता और -गुणवत्ता क्रमशः, तो हम परिभाषित कर सकते हैं

योग सुसंगत जोड़ियों की संख्या घटाकर असंगत जोड़ियों की संख्या है (केंडल ताऊ श्रेणी सहसंबंध गुणांक देखें)। योग बस है , पदों की संख्या , जैसा है . इस प्रकार इस मामले में,


एक विशेष मामले के रूप में स्पीयरमैन का ρ

अगर , की रैंक हैं

-सदस्य के अनुसार  और यह -गुणवत्ता क्रमशः,

हम मैट्रिक्स पर विचार कर सकते हैं द्वारा परिभाषित

रकम और बराबर हैं, चूंकि दोनों और से रेंज को . इस तरह

इस अभिव्यक्ति को सरल बनाने के लिए, होने देना प्रत्येक के लिए रैंक में अंतर दर्शाएं . आगे, चलो एक समान रूप से वितरित असतत यादृच्छिक चर बनें . रैंकों के बाद से के केवल क्रमपरिवर्तन हैं , हम दोनों को वितरित यादृच्छिक चर के रूप में देख सकते हैं . असतत गणित से बुनियादी योग#शक्तियाँ_और_अंकगणित_प्रगति_का_लघुगणक_का उपयोग करना, यह देखना आसान है कि समान रूप से वितरित यादृच्छिक चर के लिए, , अपने पास और और इस तरह . अब, समरूपता का अवलोकन हमें इसके भागों की गणना करने की अनुमति देता है निम्नलिखित नुसार:

और

इस तरह

कहाँ रैंकों के बीच अंतर है, जो बिल्कुल स्पीयरमैन का श्रेणी सहसंबंध गुणांक है .

रैंक-द्विक्रमिक सहसंबंध

जीन ग्लास (1965) ने कहा कि रैंक-द्विधारावाहिक स्पीयरमैन से प्राप्त किया जा सकता है . कोई व्यक्ति एक्स, द्विभाजित चर और वाई, श्रेणी चर पर परिभाषित गुणांक प्राप्त कर सकता है, जो एक्स और वाई के बीच स्पीयरमैन के आरएचओ का उसी तरह अनुमान लगाता है जैसे द्विक्रमिक आर दो सामान्य चर के बीच पियर्सन के आर का अनुमान लगाता है" (पी. 91)। रैंक-द्विक्रमिक सहसंबंध को नौ साल पहले एडवर्ड क्यूरटन (1956) द्वारा श्रेणी सहसंबंध के एक उपाय के रूप में पेश किया गया था जब रैंक दो समूहों में होते हैं।

केर्बी सरल अंतर सूत्र

डेव केर्बी (2014) ने छात्रों को श्रेणी सहसंबंध से परिचित कराने के उपाय के रूप में रैंक-द्विक्रमिक की सिफारिश की, क्योंकि सामान्य तर्क को परिचयात्मक स्तर पर समझाया जा सकता है। रैंक-द्विधारावाहिक मान-व्हिटनी यू परीक्षण के साथ उपयोग किया जाने वाला सहसंबंध है, जो आमतौर पर सांख्यिकी पर परिचयात्मक कॉलेज पाठ्यक्रमों में सम्मिलित एक विधि है। इस परीक्षण के आंकड़े में दो समूह सम्मिलित हैं; और समूहों के प्रत्येक सदस्य के लिए, परिणाम को समग्र रूप से अध्ययन के लिए क्रमबद्ध किया जाता है।

केर्बी ने दिखाया कि इस श्रेणी सहसंबंध को दो अवधारणाओं के संदर्भ में व्यक्त किया जा सकता है: आंकड़े का प्रतिशत जो किसी बताई गई परिकल्पना का समर्थन करता है, और आंकड़े का प्रतिशत जो इसका समर्थन नहीं करता है। केर्बी सरल अंतर सूत्र में कहा गया है कि श्रेणी सहसंबंध को अनुकूल साक्ष्य (एफ) के अनुपात से प्रतिकूल साक्ष्य (यू) के अनुपात के बीच अंतर के रूप में व्यक्त किया जा सकता है।


उदाहरण और व्याख्या

गणना को स्पष्ट करने के लिए, मान लीजिए कि एक कोच दो तरीकों का उपयोग करके एक महीने के लिए लंबी दूरी के धावकों को प्रशिक्षित करता है। ग्रुप ए में 5 धावक हैं, और ग्रुप बी में 4 धावक हैं। बताई गई परिकल्पना यह है कि विधि ए तेज़ धावक पैदा करती है। परिणामों का आकलन करने की दौड़ में पाया गया कि समूह ए के धावक वास्तव में तेज़ दौड़ते हैं, निम्नलिखित रैंक के साथ: 1, 2, 3, 4, और 6। समूह बी के धीमे धावकों की रैंक 5, 7, 8 है। और 9.

विश्लेषण जोड़ियों पर किया जाता है, जिन्हें एक समूह के सदस्य की तुलना में दूसरे समूह के सदस्य के रूप में परिभाषित किया जाता है। उदाहरण के लिए, अध्ययन में सबसे तेज़ धावक चार जोड़ियों का सदस्य है: (1,5), (1,7), (1,8), और (1,9)। ये चारों जोड़े परिकल्पना का समर्थन करते हैं, क्योंकि प्रत्येक जोड़ी में समूह ए का धावक समूह बी के धावक से तेज़ है। कुल 20 जोड़े हैं, और 19 जोड़े परिकल्पना का समर्थन करते हैं। एकमात्र जोड़ी जो परिकल्पना का समर्थन नहीं करती वह रैंक 5 और 6 वाले दो धावक हैं, क्योंकि इस जोड़ी में ग्रुप बी के धावक का समय सबसे तेज़ था। केर्बी सरल अंतर सूत्र के अनुसार, 95% आंकड़े परिकल्पना का समर्थन करता है (20 जोड़े में से 19), और 5% समर्थन नहीं करता है (20 जोड़े में से 1), इसलिए श्रेणी सहसंबंध r = .95 - .05 = .90 है .

सहसंबंध का अधिकतम मान r = 1 है, जिसका अर्थ है कि 100% जोड़े परिकल्पना के पक्ष में हैं। r = 0 का सहसंबंध इंगित करता है कि आधे जोड़े परिकल्पना का समर्थन करते हैं और आधे नहीं; दूसरे शब्दों में, प्रतिरूप समूह रैंक में भिन्न नहीं होते हैं, इसलिए इसका कोई सबूत नहीं है कि वे दो अलग-अलग आबादी से आते हैं। कहा जा सकता है कि r = 0 का प्रभाव आकार समूह सदस्यता और सदस्यों के रैंक के बीच कोई संबंध नहीं बताता है।

संदर्भ

  1. Kruskal, William H. (1958). "एसोसिएशन के सामान्य उपाय". Journal of the American Statistical Association. 53 (284): 814–861. doi:10.2307/2281954. JSTOR 2281954.
  2. Kendall, Maurice G (1970). रैंक सहसंबंध विधियाँ (4 ed.). Griffin. ISBN 9780852641996.


अग्रिम पठन


बाहरी संबंध