श्रेणी सहसंबंध: Difference between revisions
(Created page with "{{Short description|Statistic comparing ordinal rankings}} आंकड़ों में, रैंक सहसंबंध कई आँकड़ों में से...") |
No edit summary |
||
Line 1: | Line 1: | ||
{{Short description|Statistic comparing ordinal rankings}} | {{Short description|Statistic comparing ordinal rankings}} | ||
आंकड़ों में, | आंकड़ों में, '''श्रेणी सहसंबंध''' कई आँकड़ों में से एक है जो एक क्रमिक संघ को मापता है - विभिन्न [[क्रमिक डेटा|क्रमिक आंकड़े]] चर की [[रैंकिंग|श्रेणी]] या एक ही चर की विभिन्न श्रेणी के बीच संबंध, जहां "श्रेणी" किसी विशेष चर के विभिन्न अवलोकनों के लिए क्रम वर्गीकरण "प्रथम", "दूसरा", "तीसरा" आदि का समनुदेशन है। श्रेणी सहसंबंध गुणांक दो श्रेणी के बीच समानता की डिग्री को मापता है, और इसका उपयोग उनके बीच संबंध के सांख्यिकीय महत्व का आकलन करने के लिए किया जा सकता है। उदाहरण के लिए, श्रेणी सहसंबंध का उपयोग करने वाले महत्व के दो सामान्य गैर-पैरामीट्रिक तरीके मैन-व्हिटनी यू परीक्षण और [[विलकॉक्सन हस्ताक्षरित-रैंक परीक्षण]] हैं। | ||
==संदर्भ== | ==संदर्भ== | ||
यदि, उदाहरण के लिए, एक चर कॉलेज बास्केटबॉल कार्यक्रम की पहचान है और दूसरा चर कॉलेज फुटबॉल कार्यक्रम की पहचान है, तो कोई दो प्रकार के कार्यक्रम की पोल | यदि, उदाहरण के लिए, एक चर कॉलेज बास्केटबॉल कार्यक्रम की पहचान है और दूसरा चर कॉलेज फुटबॉल कार्यक्रम की पहचान है, तो कोई दो प्रकार के कार्यक्रम की पोल श्रेणी के बीच संबंध का परीक्षण कर सकता है: क्या उच्च रैंक वाले बास्केटबॉल कार्यक्रम वाले कॉलेजों में उच्च रैंक वाले फुटबॉल कार्यक्रम होते हैं? एक श्रेणी सहसंबंध गुणांक उस रिश्ते को माप सकता है, और श्रेणी सहसंबंध गुणांक के महत्व का माप यह दिखा सकता है कि क्या मापा गया संबंध एक संयोग होने के लिए काफी छोटा है। | ||
यदि केवल एक ही चर है, एक कॉलेज फुटबॉल कार्यक्रम की पहचान, लेकिन यह दो अलग-अलग पोल | यदि केवल एक ही चर है, एक कॉलेज फुटबॉल कार्यक्रम की पहचान, लेकिन यह दो अलग-अलग पोल श्रेणी (जैसे, एक कोच द्वारा और एक खेल लेखकों द्वारा) के अधीन है, तो दो अलग-अलग पोल की श्रेणी की समानता को श्रेणी सहसंबंध गुणांक के साथ मापा जा सकता है। | ||
एक अन्य उदाहरण के रूप में, कम आय, मध्यम आय, और पंक्ति चर में उच्च आय और शैक्षिक स्तर के साथ एक [[आकस्मिक तालिका]] में - कॉलम चर में कोई हाई स्कूल, हाई स्कूल, विश्वविद्यालय नहीं),<ref>{{cite journal |last=Kruskal |author-link=William Kruskal |first=William H. |year=1958 |title=एसोसिएशन के सामान्य उपाय|journal=[[Journal of the American Statistical Association]] |volume=53 |issue=284 |pages=814–861 |jstor=2281954 |doi=10.2307/2281954}}</ref> | एक अन्य उदाहरण के रूप में, कम आय, मध्यम आय, और पंक्ति चर में उच्च आय और शैक्षिक स्तर के साथ एक [[आकस्मिक तालिका|आसंग सारणी]] में - कॉलम चर में कोई हाई स्कूल, हाई स्कूल, विश्वविद्यालय नहीं),<ref>{{cite journal |last=Kruskal |author-link=William Kruskal |first=William H. |year=1958 |title=एसोसिएशन के सामान्य उपाय|journal=[[Journal of the American Statistical Association]] |volume=53 |issue=284 |pages=814–861 |jstor=2281954 |doi=10.2307/2281954}}</ref> श्रेणी सहसंबंध आय और शैक्षिक स्तर के बीच संबंध को मापता है। | ||
==सहसंबंध गुणांक== | ==सहसंबंध गुणांक== | ||
कुछ अधिक | कुछ अधिक प्रचलित श्रेणी सहसंबंध आँकड़े सम्मिलित हैं | ||
# स्पीयरमैन का | # स्पीयरमैन का श्रेणी सहसंबंध गुणांक | ||
# केंडल का ताउ | # केंडल का ताउ श्रेणी सहसंबंध गुणांक | ||
# गुडमैन और क्रुस्कल का गामा | # गुडमैन और क्रुस्कल का गामा | ||
#सोमर्स डी | #सोमर्स डी | ||
बढ़ते | बढ़ते श्रेणी सहसंबंध गुणांक का तात्पर्य श्रेणी के बीच बढ़ते समझौते से है। गुणांक अंतराल [−1, 1] के अंदर है और मान मानता है: | ||
*1 यदि दोनों | *1 यदि दोनों श्रेणी के बीच समझौता सही है; दोनों श्रेणी समान हैं। | ||
* 0 यदि | * 0 यदि श्रेणी पूरी तरह से स्वतंत्र है। | ||
* −1 यदि दो | * −1 यदि दो श्रेणी के बीच असहमति सही है; एक श्रेणी दूसरे से उलट है। | ||
अगले {{harvtxt| | अगले {{harvtxt|डायकोनिस|1988}}, श्रेणी को वस्तुओं के एक [[सेट (गणित)|सम्मुच्चय (गणित)]] के क्रम[[परिवर्तन]] के रूप में देखा जा सकता है। इस प्रकार हम प्रेक्षित श्रेणी को उस आंकड़े के रूप में देख सकते हैं जब प्रतिरूप स्थान एक [[सममित समूह]] (के साथ पहचाना जाता है) प्राप्त होता है। फिर हम एक आव्यूह (गणित) का परिचय दे सकते हैं, जिससे सममित समूह को एक [[मीट्रिक स्थान]] में बदल दिया जा सकता है। अलग-अलग आव्यूह अलग-अलग श्रेणी सहसंबंधों के अनुरूप होंगे। | ||
==सामान्य सहसंबंध गुणांक== | ==सामान्य सहसंबंध गुणांक== | ||
केंडल 1970<ref name="kendall1970">{{cite book |last1=Kendall |first1=Maurice G |title=रैंक सहसंबंध विधियाँ|date=1970 |publisher=Griffin |isbn=9780852641996 |edition=4}}</ref> दिखाया कि उसका <math>\tau</math> ( | केंडल 1970 <ref name="kendall1970">{{cite book |last1=Kendall |first1=Maurice G |title=रैंक सहसंबंध विधियाँ|date=1970 |publisher=Griffin |isbn=9780852641996 |edition=4}}</ref> दिखाया कि उसका <math>\tau</math> (तउ) और स्पीयरमैन का <math>\rho</math> (आरएचओ) सामान्य सहसंबंध गुणांक की विशेष स्तिथि हैं। | ||
मान लीजिए हमारे पास एक | मान लीजिए हमारे पास एक सम्मुच्चय <math>n</math> है जिन वस्तुओं पर दो गुणों के संबंध में विचार किया जा रहा है, उनका प्रतिनिधित्व <math>x</math> और <math>y</math> द्वारा किया जाता है, '''मूल्यों के सम्मुच्चय का निर्माण''' <math>\{x_i\}_{i\le n}</math> और <math>\{y_i\}_{i\le n}</math>. व्यक्तियों के किसी भी जोड़े के लिए, कहें <math>i</math>-वें और द <math>j</math>-वें हम असाइन करते हैं <math>x</math>-स्कोर, द्वारा निरूपित <math>a_{ij}</math>, और ए <math>y</math>-स्कोर, द्वारा निरूपित <math>b_{ij}</math>. इन कार्यों के लिए एकमात्र आवश्यकता यह है कि वे सममित-विरोधी हों, इसलिए <math>a_{ij}=-a_{ji}</math> और <math>b_{ij}=-b_{ji}</math>. (ध्यान दें कि विशेष रूप से <math>a_{ij}=b_{ij}=0</math> अगर <math>i = j</math>.) फिर सामान्यीकृत सहसंबंध गुणांक <math>\Gamma</math> परिभाषित किया जाता है | ||
: <math>\Gamma = \frac{\sum_{i,j = 1}^n a_{ij}b_{ij}}{\sqrt{\sum_{i,j = 1}^n a_{ij}^2 \sum_{i,j = 1}^n b_{ij}^2}} </math> | : <math>\Gamma = \frac{\sum_{i,j = 1}^n a_{ij}b_{ij}}{\sqrt{\sum_{i,j = 1}^n a_{ij}^2 \sum_{i,j = 1}^n b_{ij}^2}} </math> | ||
Line 43: | Line 43: | ||
: <math>a_{ij} = \sgn(r_j-r_i),\quad b_{ij} = \sgn(s_j-s_i).</math> | : <math>a_{ij} = \sgn(r_j-r_i),\quad b_{ij} = \sgn(s_j-s_i).</math> | ||
योग <math>\sum a_{ij}b_{ij} </math> सुसंगत जोड़ियों की संख्या घटाकर असंगत जोड़ियों की संख्या है (केंडल ताऊ | योग <math>\sum a_{ij}b_{ij} </math> सुसंगत जोड़ियों की संख्या घटाकर असंगत जोड़ियों की संख्या है (केंडल ताऊ श्रेणी सहसंबंध गुणांक देखें)। योग <math>\sum a_{ij}^2</math> बस है <math>n(n-1)/2</math>, पदों की संख्या <math>a_{ij}</math>, जैसा है <math>\sum b_{ij}^2</math>. इस प्रकार इस मामले में, | ||
: <math>\Gamma = \frac{2\,((\text{number of concordant pairs}) - (\text{number of discordant pairs}))}{n(n-1)} = \text{Kendall's }\tau</math> | : <math>\Gamma = \frac{2\,((\text{number of concordant pairs}) - (\text{number of discordant pairs}))}{n(n-1)} = \text{Kendall's }\tau</math> | ||
Line 110: | Line 110: | ||
:<math>\Gamma = 1 - \frac{\sum_{i = 1}^{n} d_{i}^{2}}{2n\mathrm{Var}(U)} = 1 - \frac{6\sum_{i = 1}^{n} d_{i}^{2}}{n(n^{2}-1)}</math> | :<math>\Gamma = 1 - \frac{\sum_{i = 1}^{n} d_{i}^{2}}{2n\mathrm{Var}(U)} = 1 - \frac{6\sum_{i = 1}^{n} d_{i}^{2}}{n(n^{2}-1)}</math> | ||
कहाँ <math>d_{i} = r_{i} - s_{i}</math> रैंकों के बीच अंतर है, | कहाँ <math>d_{i} = r_{i} - s_{i}</math> रैंकों के बीच अंतर है, | ||
जो बिल्कुल स्पीयरमैन का | जो बिल्कुल स्पीयरमैन का श्रेणी सहसंबंध गुणांक है <math>\rho</math>. | ||
==रैंक-द्विक्रमिक सहसंबंध== | ==रैंक-द्विक्रमिक सहसंबंध== | ||
{{Main|Mann–Whitney_U_test#Rank-biserial_correlation}} | {{Main|Mann–Whitney_U_test#Rank-biserial_correlation}} | ||
जीन ग्लास (1965) ने कहा कि रैंक-द्विधारावाहिक स्पीयरमैन से प्राप्त किया जा सकता है <math>\rho</math>. कोई व्यक्ति एक्स, द्विभाजित चर और वाई, | जीन ग्लास (1965) ने कहा कि रैंक-द्विधारावाहिक स्पीयरमैन से प्राप्त किया जा सकता है <math>\rho</math>. कोई व्यक्ति एक्स, द्विभाजित चर और वाई, श्रेणी चर पर परिभाषित गुणांक प्राप्त कर सकता है, जो एक्स और वाई के बीच स्पीयरमैन के आरएचओ का उसी तरह अनुमान लगाता है जैसे द्विक्रमिक आर दो सामान्य चर के बीच पियर्सन के आर का अनुमान लगाता है" (पी. 91)। रैंक-द्विक्रमिक सहसंबंध को नौ साल पहले एडवर्ड क्यूरटन (1956) द्वारा श्रेणी सहसंबंध के एक उपाय के रूप में पेश किया गया था जब रैंक दो समूहों में होते हैं। | ||
===केर्बी सरल अंतर सूत्र=== | ===केर्बी सरल अंतर सूत्र=== | ||
डेव केर्बी (2014) ने छात्रों को | डेव केर्बी (2014) ने छात्रों को श्रेणी सहसंबंध से परिचित कराने के उपाय के रूप में रैंक-द्विक्रमिक की सिफारिश की, क्योंकि सामान्य तर्क को परिचयात्मक स्तर पर समझाया जा सकता है। रैंक-द्विधारावाहिक मान-व्हिटनी यू परीक्षण के साथ उपयोग किया जाने वाला सहसंबंध है, जो आमतौर पर सांख्यिकी पर परिचयात्मक कॉलेज पाठ्यक्रमों में सम्मिलित एक विधि है। इस परीक्षण के आंकड़े में दो समूह सम्मिलित हैं; और समूहों के प्रत्येक सदस्य के लिए, परिणाम को समग्र रूप से अध्ययन के लिए क्रमबद्ध किया जाता है। | ||
केर्बी ने दिखाया कि इस | केर्बी ने दिखाया कि इस श्रेणी सहसंबंध को दो अवधारणाओं के संदर्भ में व्यक्त किया जा सकता है: आंकड़े का प्रतिशत जो किसी बताई गई परिकल्पना का समर्थन करता है, और आंकड़े का प्रतिशत जो इसका समर्थन नहीं करता है। केर्बी सरल अंतर सूत्र में कहा गया है कि श्रेणी सहसंबंध को अनुकूल साक्ष्य (एफ) के अनुपात से प्रतिकूल साक्ष्य (यू) के अनुपात के बीच अंतर के रूप में व्यक्त किया जा सकता है। | ||
:<math>r = f - u </math> | :<math>r = f - u </math> | ||
Line 127: | Line 127: | ||
गणना को स्पष्ट करने के लिए, मान लीजिए कि एक कोच दो तरीकों का उपयोग करके एक महीने के लिए लंबी दूरी के धावकों को प्रशिक्षित करता है। ग्रुप ए में 5 धावक हैं, और ग्रुप बी में 4 धावक हैं। बताई गई परिकल्पना यह है कि विधि ए तेज़ धावक पैदा करती है। परिणामों का आकलन करने की दौड़ में पाया गया कि समूह ए के धावक वास्तव में तेज़ दौड़ते हैं, निम्नलिखित रैंक के साथ: 1, 2, 3, 4, और 6। समूह बी के धीमे धावकों की रैंक 5, 7, 8 है। और 9. | गणना को स्पष्ट करने के लिए, मान लीजिए कि एक कोच दो तरीकों का उपयोग करके एक महीने के लिए लंबी दूरी के धावकों को प्रशिक्षित करता है। ग्रुप ए में 5 धावक हैं, और ग्रुप बी में 4 धावक हैं। बताई गई परिकल्पना यह है कि विधि ए तेज़ धावक पैदा करती है। परिणामों का आकलन करने की दौड़ में पाया गया कि समूह ए के धावक वास्तव में तेज़ दौड़ते हैं, निम्नलिखित रैंक के साथ: 1, 2, 3, 4, और 6। समूह बी के धीमे धावकों की रैंक 5, 7, 8 है। और 9. | ||
विश्लेषण जोड़ियों पर किया जाता है, जिन्हें एक समूह के सदस्य की तुलना में दूसरे समूह के सदस्य के रूप में परिभाषित किया जाता है। उदाहरण के लिए, अध्ययन में सबसे तेज़ धावक चार जोड़ियों का सदस्य है: (1,5), (1,7), (1,8), और (1,9)। ये चारों जोड़े परिकल्पना का समर्थन करते हैं, क्योंकि प्रत्येक जोड़ी में समूह ए का धावक समूह बी के धावक से तेज़ है। कुल 20 जोड़े हैं, और 19 जोड़े परिकल्पना का समर्थन करते हैं। एकमात्र जोड़ी जो परिकल्पना का समर्थन नहीं करती वह रैंक 5 और 6 वाले दो धावक हैं, क्योंकि इस जोड़ी में ग्रुप बी के धावक का समय सबसे तेज़ था। केर्बी सरल अंतर सूत्र के अनुसार, 95% | विश्लेषण जोड़ियों पर किया जाता है, जिन्हें एक समूह के सदस्य की तुलना में दूसरे समूह के सदस्य के रूप में परिभाषित किया जाता है। उदाहरण के लिए, अध्ययन में सबसे तेज़ धावक चार जोड़ियों का सदस्य है: (1,5), (1,7), (1,8), और (1,9)। ये चारों जोड़े परिकल्पना का समर्थन करते हैं, क्योंकि प्रत्येक जोड़ी में समूह ए का धावक समूह बी के धावक से तेज़ है। कुल 20 जोड़े हैं, और 19 जोड़े परिकल्पना का समर्थन करते हैं। एकमात्र जोड़ी जो परिकल्पना का समर्थन नहीं करती वह रैंक 5 और 6 वाले दो धावक हैं, क्योंकि इस जोड़ी में ग्रुप बी के धावक का समय सबसे तेज़ था। केर्बी सरल अंतर सूत्र के अनुसार, 95% आंकड़े परिकल्पना का समर्थन करता है (20 जोड़े में से 19), और 5% समर्थन नहीं करता है (20 जोड़े में से 1), इसलिए श्रेणी सहसंबंध r = .95 - .05 = .90 है . | ||
सहसंबंध का अधिकतम मान r = 1 है, जिसका अर्थ है कि 100% जोड़े परिकल्पना के पक्ष में हैं। r = 0 का सहसंबंध इंगित करता है कि आधे जोड़े परिकल्पना का समर्थन करते हैं और आधे नहीं; दूसरे शब्दों में, | सहसंबंध का अधिकतम मान r = 1 है, जिसका अर्थ है कि 100% जोड़े परिकल्पना के पक्ष में हैं। r = 0 का सहसंबंध इंगित करता है कि आधे जोड़े परिकल्पना का समर्थन करते हैं और आधे नहीं; दूसरे शब्दों में, प्रतिरूप समूह रैंक में भिन्न नहीं होते हैं, इसलिए इसका कोई सबूत नहीं है कि वे दो अलग-अलग आबादी से आते हैं। कहा जा सकता है कि r = 0 का प्रभाव आकार समूह सदस्यता और सदस्यों के रैंक के बीच कोई संबंध नहीं बताता है। | ||
==संदर्भ== | ==संदर्भ== |
Revision as of 11:51, 2 August 2023
आंकड़ों में, श्रेणी सहसंबंध कई आँकड़ों में से एक है जो एक क्रमिक संघ को मापता है - विभिन्न क्रमिक आंकड़े चर की श्रेणी या एक ही चर की विभिन्न श्रेणी के बीच संबंध, जहां "श्रेणी" किसी विशेष चर के विभिन्न अवलोकनों के लिए क्रम वर्गीकरण "प्रथम", "दूसरा", "तीसरा" आदि का समनुदेशन है। श्रेणी सहसंबंध गुणांक दो श्रेणी के बीच समानता की डिग्री को मापता है, और इसका उपयोग उनके बीच संबंध के सांख्यिकीय महत्व का आकलन करने के लिए किया जा सकता है। उदाहरण के लिए, श्रेणी सहसंबंध का उपयोग करने वाले महत्व के दो सामान्य गैर-पैरामीट्रिक तरीके मैन-व्हिटनी यू परीक्षण और विलकॉक्सन हस्ताक्षरित-रैंक परीक्षण हैं।
संदर्भ
यदि, उदाहरण के लिए, एक चर कॉलेज बास्केटबॉल कार्यक्रम की पहचान है और दूसरा चर कॉलेज फुटबॉल कार्यक्रम की पहचान है, तो कोई दो प्रकार के कार्यक्रम की पोल श्रेणी के बीच संबंध का परीक्षण कर सकता है: क्या उच्च रैंक वाले बास्केटबॉल कार्यक्रम वाले कॉलेजों में उच्च रैंक वाले फुटबॉल कार्यक्रम होते हैं? एक श्रेणी सहसंबंध गुणांक उस रिश्ते को माप सकता है, और श्रेणी सहसंबंध गुणांक के महत्व का माप यह दिखा सकता है कि क्या मापा गया संबंध एक संयोग होने के लिए काफी छोटा है।
यदि केवल एक ही चर है, एक कॉलेज फुटबॉल कार्यक्रम की पहचान, लेकिन यह दो अलग-अलग पोल श्रेणी (जैसे, एक कोच द्वारा और एक खेल लेखकों द्वारा) के अधीन है, तो दो अलग-अलग पोल की श्रेणी की समानता को श्रेणी सहसंबंध गुणांक के साथ मापा जा सकता है।
एक अन्य उदाहरण के रूप में, कम आय, मध्यम आय, और पंक्ति चर में उच्च आय और शैक्षिक स्तर के साथ एक आसंग सारणी में - कॉलम चर में कोई हाई स्कूल, हाई स्कूल, विश्वविद्यालय नहीं),[1] श्रेणी सहसंबंध आय और शैक्षिक स्तर के बीच संबंध को मापता है।
सहसंबंध गुणांक
कुछ अधिक प्रचलित श्रेणी सहसंबंध आँकड़े सम्मिलित हैं
- स्पीयरमैन का श्रेणी सहसंबंध गुणांक
- केंडल का ताउ श्रेणी सहसंबंध गुणांक
- गुडमैन और क्रुस्कल का गामा
- सोमर्स डी
बढ़ते श्रेणी सहसंबंध गुणांक का तात्पर्य श्रेणी के बीच बढ़ते समझौते से है। गुणांक अंतराल [−1, 1] के अंदर है और मान मानता है:
- 1 यदि दोनों श्रेणी के बीच समझौता सही है; दोनों श्रेणी समान हैं।
- 0 यदि श्रेणी पूरी तरह से स्वतंत्र है।
- −1 यदि दो श्रेणी के बीच असहमति सही है; एक श्रेणी दूसरे से उलट है।
अगले डायकोनिस (1988) , श्रेणी को वस्तुओं के एक सम्मुच्चय (गणित) के क्रमपरिवर्तन के रूप में देखा जा सकता है। इस प्रकार हम प्रेक्षित श्रेणी को उस आंकड़े के रूप में देख सकते हैं जब प्रतिरूप स्थान एक सममित समूह (के साथ पहचाना जाता है) प्राप्त होता है। फिर हम एक आव्यूह (गणित) का परिचय दे सकते हैं, जिससे सममित समूह को एक मीट्रिक स्थान में बदल दिया जा सकता है। अलग-अलग आव्यूह अलग-अलग श्रेणी सहसंबंधों के अनुरूप होंगे।
सामान्य सहसंबंध गुणांक
केंडल 1970 [2] दिखाया कि उसका (तउ) और स्पीयरमैन का (आरएचओ) सामान्य सहसंबंध गुणांक की विशेष स्तिथि हैं।
मान लीजिए हमारे पास एक सम्मुच्चय है जिन वस्तुओं पर दो गुणों के संबंध में विचार किया जा रहा है, उनका प्रतिनिधित्व और द्वारा किया जाता है, मूल्यों के सम्मुच्चय का निर्माण और . व्यक्तियों के किसी भी जोड़े के लिए, कहें -वें और द -वें हम असाइन करते हैं -स्कोर, द्वारा निरूपित , और ए -स्कोर, द्वारा निरूपित . इन कार्यों के लिए एकमात्र आवश्यकता यह है कि वे सममित-विरोधी हों, इसलिए और . (ध्यान दें कि विशेष रूप से अगर .) फिर सामान्यीकृत सहसंबंध गुणांक परिभाषित किया जाता है
समान रूप से, यदि सभी गुणांक मैट्रिक्स में एकत्र किए जाते हैं और , साथ और , तब
कहाँ फ्रोबेनियस आंतरिक उत्पाद है और फ्रोबेनियस मानदंड. विशेष रूप से, सामान्य सहसंबंध गुणांक आव्यूहों के बीच के कोण की कोज्या है और .
केंडल का τ एक विशेष मामले के रूप में
अगर , की रैंक हैं -सदस्य के अनुसार -गुणवत्ता और -गुणवत्ता क्रमशः, तो हम परिभाषित कर सकते हैं
योग सुसंगत जोड़ियों की संख्या घटाकर असंगत जोड़ियों की संख्या है (केंडल ताऊ श्रेणी सहसंबंध गुणांक देखें)। योग बस है , पदों की संख्या , जैसा है . इस प्रकार इस मामले में,
एक विशेष मामले के रूप में स्पीयरमैन का ρ
अगर , की रैंक हैं
-सदस्य के अनुसार और यह -गुणवत्ता क्रमशः,
हम मैट्रिक्स पर विचार कर सकते हैं द्वारा परिभाषित
रकम और बराबर हैं, चूंकि दोनों और से रेंज को . इस तरह
इस अभिव्यक्ति को सरल बनाने के लिए, होने देना प्रत्येक के लिए रैंक में अंतर दर्शाएं . आगे, चलो एक समान रूप से वितरित असतत यादृच्छिक चर बनें . रैंकों के बाद से के केवल क्रमपरिवर्तन हैं , हम दोनों को वितरित यादृच्छिक चर के रूप में देख सकते हैं . असतत गणित से बुनियादी योग#शक्तियाँ_और_अंकगणित_प्रगति_का_लघुगणक_का उपयोग करना, यह देखना आसान है कि समान रूप से वितरित यादृच्छिक चर के लिए, , अपने पास और और इस तरह . अब, समरूपता का अवलोकन हमें इसके भागों की गणना करने की अनुमति देता है निम्नलिखित नुसार:
और
इस तरह
कहाँ रैंकों के बीच अंतर है, जो बिल्कुल स्पीयरमैन का श्रेणी सहसंबंध गुणांक है .
रैंक-द्विक्रमिक सहसंबंध
जीन ग्लास (1965) ने कहा कि रैंक-द्विधारावाहिक स्पीयरमैन से प्राप्त किया जा सकता है . कोई व्यक्ति एक्स, द्विभाजित चर और वाई, श्रेणी चर पर परिभाषित गुणांक प्राप्त कर सकता है, जो एक्स और वाई के बीच स्पीयरमैन के आरएचओ का उसी तरह अनुमान लगाता है जैसे द्विक्रमिक आर दो सामान्य चर के बीच पियर्सन के आर का अनुमान लगाता है" (पी. 91)। रैंक-द्विक्रमिक सहसंबंध को नौ साल पहले एडवर्ड क्यूरटन (1956) द्वारा श्रेणी सहसंबंध के एक उपाय के रूप में पेश किया गया था जब रैंक दो समूहों में होते हैं।
केर्बी सरल अंतर सूत्र
डेव केर्बी (2014) ने छात्रों को श्रेणी सहसंबंध से परिचित कराने के उपाय के रूप में रैंक-द्विक्रमिक की सिफारिश की, क्योंकि सामान्य तर्क को परिचयात्मक स्तर पर समझाया जा सकता है। रैंक-द्विधारावाहिक मान-व्हिटनी यू परीक्षण के साथ उपयोग किया जाने वाला सहसंबंध है, जो आमतौर पर सांख्यिकी पर परिचयात्मक कॉलेज पाठ्यक्रमों में सम्मिलित एक विधि है। इस परीक्षण के आंकड़े में दो समूह सम्मिलित हैं; और समूहों के प्रत्येक सदस्य के लिए, परिणाम को समग्र रूप से अध्ययन के लिए क्रमबद्ध किया जाता है।
केर्बी ने दिखाया कि इस श्रेणी सहसंबंध को दो अवधारणाओं के संदर्भ में व्यक्त किया जा सकता है: आंकड़े का प्रतिशत जो किसी बताई गई परिकल्पना का समर्थन करता है, और आंकड़े का प्रतिशत जो इसका समर्थन नहीं करता है। केर्बी सरल अंतर सूत्र में कहा गया है कि श्रेणी सहसंबंध को अनुकूल साक्ष्य (एफ) के अनुपात से प्रतिकूल साक्ष्य (यू) के अनुपात के बीच अंतर के रूप में व्यक्त किया जा सकता है।
उदाहरण और व्याख्या
गणना को स्पष्ट करने के लिए, मान लीजिए कि एक कोच दो तरीकों का उपयोग करके एक महीने के लिए लंबी दूरी के धावकों को प्रशिक्षित करता है। ग्रुप ए में 5 धावक हैं, और ग्रुप बी में 4 धावक हैं। बताई गई परिकल्पना यह है कि विधि ए तेज़ धावक पैदा करती है। परिणामों का आकलन करने की दौड़ में पाया गया कि समूह ए के धावक वास्तव में तेज़ दौड़ते हैं, निम्नलिखित रैंक के साथ: 1, 2, 3, 4, और 6। समूह बी के धीमे धावकों की रैंक 5, 7, 8 है। और 9.
विश्लेषण जोड़ियों पर किया जाता है, जिन्हें एक समूह के सदस्य की तुलना में दूसरे समूह के सदस्य के रूप में परिभाषित किया जाता है। उदाहरण के लिए, अध्ययन में सबसे तेज़ धावक चार जोड़ियों का सदस्य है: (1,5), (1,7), (1,8), और (1,9)। ये चारों जोड़े परिकल्पना का समर्थन करते हैं, क्योंकि प्रत्येक जोड़ी में समूह ए का धावक समूह बी के धावक से तेज़ है। कुल 20 जोड़े हैं, और 19 जोड़े परिकल्पना का समर्थन करते हैं। एकमात्र जोड़ी जो परिकल्पना का समर्थन नहीं करती वह रैंक 5 और 6 वाले दो धावक हैं, क्योंकि इस जोड़ी में ग्रुप बी के धावक का समय सबसे तेज़ था। केर्बी सरल अंतर सूत्र के अनुसार, 95% आंकड़े परिकल्पना का समर्थन करता है (20 जोड़े में से 19), और 5% समर्थन नहीं करता है (20 जोड़े में से 1), इसलिए श्रेणी सहसंबंध r = .95 - .05 = .90 है .
सहसंबंध का अधिकतम मान r = 1 है, जिसका अर्थ है कि 100% जोड़े परिकल्पना के पक्ष में हैं। r = 0 का सहसंबंध इंगित करता है कि आधे जोड़े परिकल्पना का समर्थन करते हैं और आधे नहीं; दूसरे शब्दों में, प्रतिरूप समूह रैंक में भिन्न नहीं होते हैं, इसलिए इसका कोई सबूत नहीं है कि वे दो अलग-अलग आबादी से आते हैं। कहा जा सकता है कि r = 0 का प्रभाव आकार समूह सदस्यता और सदस्यों के रैंक के बीच कोई संबंध नहीं बताता है।
संदर्भ
- ↑ Kruskal, William H. (1958). "एसोसिएशन के सामान्य उपाय". Journal of the American Statistical Association. 53 (284): 814–861. doi:10.2307/2281954. JSTOR 2281954.
- ↑ Kendall, Maurice G (1970). रैंक सहसंबंध विधियाँ (4 ed.). Griffin. ISBN 9780852641996.
अग्रिम पठन
- Cureton, Edward E. (1956). "Rank-biserial correlation". Psychometrika. 21 (3): 287–290. doi:10.1007/BF02289138. S2CID 122500836.
- Everitt, B. S. (2002), The Cambridge Dictionary of Statistics, Cambridge: Cambridge University Press, ISBN 0-521-81099-X
- Diaconis, P. (1988), Group Representations in Probability and Statistics, Lecture Notes-Monograph Series, Hayward, CA: Institute of Mathematical Statistics, ISBN 0-940600-14-5
- Glass, Gene V. (1965). "A ranking variable analogue of biserial correlation: implications for short-cut item analysis". Journal of Educational Measurement. 2 (1): 91–95. doi:10.1111/j.1745-3984.1965.tb00396.x.
- Kendall, M. G. (1970), Rank Correlation Methods, London: Griffin, ISBN 0-85264-199-0
- Kerby, Dave S. (2014). "The Simple Difference Formula: An Approach to Teaching Nonparametric Correlation". Comprehensive Psychology. 3 (1): 11.IT.3.1. doi:10.2466/11.IT.3.1.
बाहरी संबंध
- Brief guide by experimental psychologist Karl L. Weunsch - Nonparametric effect sizes (Copyright 2015 by Karl L. Weunsch)