श्रेणी सहसंबंध: Difference between revisions

From Vigyanwiki
No edit summary
(text)
Line 1: Line 1:
{{Short description|Statistic comparing ordinal rankings}}
{{Short description|Statistic comparing ordinal rankings}}
आंकड़ों में, '''श्रेणी सहसंबंध''' कई आँकड़ों में से एक है जो एक क्रमिक संघ को मापता है - विभिन्न [[क्रमिक डेटा|क्रमिक आंकड़े]] चर की [[रैंकिंग|श्रेणी]] या एक ही चर की विभिन्न श्रेणी के बीच संबंध, जहां "श्रेणी" किसी विशेष चर के विभिन्न अवलोकनों के लिए क्रम वर्गीकरण "प्रथम", "दूसरा", "तीसरा" आदि का समनुदेशन है। श्रेणी सहसंबंध गुणांक दो श्रेणी के बीच समानता की डिग्री को मापता है, और इसका उपयोग उनके बीच संबंध के सांख्यिकीय महत्व का आकलन करने के लिए किया जा सकता है। उदाहरण के लिए, श्रेणी सहसंबंध का उपयोग करने वाले महत्व के दो सामान्य गैर-पैरामीट्रिक तरीके मैन-व्हिटनी यू परीक्षण और [[विलकॉक्सन हस्ताक्षरित-रैंक परीक्षण]] हैं।
आंकड़ों में, '''श्रेणी सहसंबंध''' कई आँकड़ों में से एक है जो एक क्रमिक संघ को मापता है - विभिन्न [[क्रमिक डेटा|क्रमिक आंकड़े]] चर की [[रैंकिंग|श्रेणी]] या एक ही चर की विभिन्न श्रेणी के बीच संबंध, जहां "श्रेणी" किसी विशेष चर के विभिन्न अवलोकनों के लिए क्रम वर्गीकरण "प्रथम", "दूसरा", "तीसरा" आदि का समनुदेशन है। श्रेणी सहसंबंध गुणांक दो श्रेणी के बीच समानता की डिग्री को मापता है, और इसका उपयोग उनके बीच संबंध के सांख्यिकीय महत्व का आकलन करने के लिए किया जा सकता है। उदाहरण के लिए, श्रेणी सहसंबंध का उपयोग करने वाले महत्व के दो सामान्य गैर-पैरामीट्रिक तरीके मैन-व्हिटनी यू परीक्षण और [[विलकॉक्सन हस्ताक्षरित-रैंक परीक्षण|विलकॉक्सन हस्ताक्षरित-श्रेणी परीक्षण]] हैं।


==संदर्भ==
==संदर्भ==


यदि, उदाहरण के लिए, एक चर कॉलेज बास्केटबॉल कार्यक्रम की पहचान है और दूसरा चर कॉलेज फुटबॉल कार्यक्रम की पहचान है, तो कोई दो प्रकार के कार्यक्रम की पोल श्रेणी के बीच संबंध का परीक्षण कर सकता है: क्या उच्च रैंक वाले बास्केटबॉल कार्यक्रम वाले कॉलेजों में उच्च रैंक वाले फुटबॉल कार्यक्रम होते हैं? एक श्रेणी सहसंबंध गुणांक उस रिश्ते को माप सकता है, और श्रेणी सहसंबंध गुणांक के महत्व का माप यह दिखा सकता है कि क्या मापा गया संबंध एक संयोग होने के लिए काफी छोटा है।
यदि, उदाहरण के लिए, एक चर कॉलेज बास्केटबॉल कार्यक्रम की पहचान है और दूसरा चर कॉलेज फुटबॉल कार्यक्रम की पहचान है, तो कोई दो प्रकार के कार्यक्रम की पोल श्रेणी के बीच संबंध का परीक्षण कर सकता है: क्या उच्च श्रेणी वाले बास्केटबॉल कार्यक्रम वाले कॉलेजों में उच्च श्रेणी वाले फुटबॉल कार्यक्रम होते हैं? एक श्रेणी सहसंबंध गुणांक उस रिश्ते को माप सकता है, और श्रेणी सहसंबंध गुणांक के महत्व का माप यह दिखा सकता है कि क्या मापा गया संबंध एक संयोग होने के लिए काफी छोटा है।


यदि केवल एक ही चर है, एक कॉलेज फुटबॉल कार्यक्रम की पहचान, लेकिन यह दो अलग-अलग पोल श्रेणी (जैसे, एक कोच द्वारा और एक खेल लेखकों द्वारा) के अधीन है, तो दो अलग-अलग पोल की श्रेणी की समानता को श्रेणी सहसंबंध गुणांक के साथ मापा जा सकता है।
यदि केवल एक ही चर है, एक कॉलेज फुटबॉल कार्यक्रम की पहचान, लेकिन यह दो अलग-अलग पोल श्रेणी (जैसे, एक प्रशिक्षक द्वारा और एक खेल लेखकों द्वारा) के अधीन है, तो दो अलग-अलग पोल की श्रेणी की समानता को श्रेणी सहसंबंध गुणांक के साथ मापा जा सकता है।


एक अन्य उदाहरण के रूप में, कम आय, मध्यम आय, और पंक्ति चर में उच्च आय और शैक्षिक स्तर के साथ एक [[आकस्मिक तालिका|आसंग सारणी]] में - कॉलम चर में कोई हाई स्कूल, हाई स्कूल, विश्वविद्यालय नहीं),<ref>{{cite journal |last=Kruskal |author-link=William Kruskal |first=William H. |year=1958 |title=एसोसिएशन के सामान्य उपाय|journal=[[Journal of the American Statistical Association]] |volume=53 |issue=284 |pages=814–861 |jstor=2281954 |doi=10.2307/2281954}}</ref> श्रेणी सहसंबंध आय और शैक्षिक स्तर के बीच संबंध को मापता है।
एक अन्य उदाहरण के रूप में, कम आय, मध्यम आय, और पंक्ति चर में उच्च आय और शैक्षिक स्तर के साथ एक [[आकस्मिक तालिका|आसंग सारणी]] में - कॉलम चर में कोई हाई स्कूल, हाई स्कूल, विश्वविद्यालय नहीं),<ref>{{cite journal |last=Kruskal |author-link=William Kruskal |first=William H. |year=1958 |title=एसोसिएशन के सामान्य उपाय|journal=[[Journal of the American Statistical Association]] |volume=53 |issue=284 |pages=814–861 |jstor=2281954 |doi=10.2307/2281954}}</ref> श्रेणी सहसंबंध आय और शैक्षिक स्तर के बीच संबंध को मापता है।
Line 29: Line 29:
केंडल 1970 <ref name="kendall1970">{{cite book |last1=Kendall |first1=Maurice G |title=रैंक सहसंबंध विधियाँ|date=1970 |publisher=Griffin |isbn=9780852641996 |edition=4}}</ref> दिखाया कि उसका <math>\tau</math> (तउ) और स्पीयरमैन का <math>\rho</math> (आरएचओ) सामान्य सहसंबंध गुणांक की विशेष स्तिथि हैं।
केंडल 1970 <ref name="kendall1970">{{cite book |last1=Kendall |first1=Maurice G |title=रैंक सहसंबंध विधियाँ|date=1970 |publisher=Griffin |isbn=9780852641996 |edition=4}}</ref> दिखाया कि उसका <math>\tau</math> (तउ) और स्पीयरमैन का <math>\rho</math> (आरएचओ) सामान्य सहसंबंध गुणांक की विशेष स्तिथि हैं।


मान लीजिए हमारे पास एक सम्मुच्चय <math>n</math> है जिन वस्तुओं पर दो गुणों के संबंध में विचार किया जा रहा है, उनका प्रतिनिधित्व <math>x</math> और <math>y</math> द्वारा किया जाता है, '''मूल्यों के सम्मुच्चय का निर्माण''' <math>\{x_i\}_{i\le n}</math> और <math>\{y_i\}_{i\le n}</math>. व्यक्तियों के किसी भी जोड़े के लिए, कहें <math>i</math>-वें और द <math>j</math>-वें हम असाइन करते हैं <math>x</math>-स्कोर, द्वारा निरूपित <math>a_{ij}</math>, और ए <math>y</math>-स्कोर, द्वारा निरूपित <math>b_{ij}</math>. इन कार्यों के लिए एकमात्र आवश्यकता यह है कि वे सममित-विरोधी हों, इसलिए <math>a_{ij}=-a_{ji}</math> और <math>b_{ij}=-b_{ji}</math>. (ध्यान दें कि विशेष रूप से <math>a_{ij}=b_{ij}=0</math> अगर <math>i = j</math>.) फिर सामान्यीकृत सहसंबंध गुणांक <math>\Gamma</math> परिभाषित किया जाता है
मान लीजिए हमारे पास एक सम्मुच्चय <math>n</math> है जिन वस्तुओं पर दो गुणों के संबंध में विचार किया जा रहा है, उनका प्रतिनिधित्व <math>x</math> और <math>y</math> द्वारा किया जाता है, <math>\{x_i\}_{i\le n}</math> और <math>\{y_i\}_{i\le n}</math> मूल्यों के सम्मुच्चय का निर्माण करता है। वैयक्तिक व्यक्तियों के किसी भी जोड़े को, मान लें कि i-वें और j-वें को हम एक x-स्कोर निर्दिष्ट करते हैं, जिसे <math>a_{ij}</math> द्वारा दर्शाया जाता है, और एक y-स्कोर, जिसे <math>b_{ij}</math> द्वारा दर्शाया जाता है। इन कार्यों के लिए एकमात्र आवश्यकता यह है कि वे सममित-विरोधी हों, इसलिए <math>a_{ij}=-a_{ji}</math> और <math>b_{ij}=-b_{ji}</math> है (ध्यान दें कि विशेष रूप से <math>a_{ij}=b_{ij}=0</math> अगर <math>i = j</math>) फिर सामान्यीकृत सहसंबंध गुणांक <math>\Gamma</math> परिभाषित किया जाता है


: <math>\Gamma = \frac{\sum_{i,j = 1}^n a_{ij}b_{ij}}{\sqrt{\sum_{i,j = 1}^n a_{ij}^2 \sum_{i,j = 1}^n b_{ij}^2}} </math>
: <math>\Gamma = \frac{\sum_{i,j = 1}^n a_{ij}b_{ij}}{\sqrt{\sum_{i,j = 1}^n a_{ij}^2 \sum_{i,j = 1}^n b_{ij}^2}} </math>
समान रूप से, यदि सभी गुणांक मैट्रिक्स में एकत्र किए जाते हैं <math>A = (a_{ij})</math> और <math>B = (b_{ij})</math>, साथ <math> A^{\textsf T} = -A </math> और <math> B^{\textsf T} = -B </math>, तब
समान रूप से, यदि सभी गुणांक मैट्रिक्स <math>A = (a_{ij})</math> और <math>B = (b_{ij})</math>, साथ <math> A^{\textsf T} = -A </math> और <math> B^{\textsf T} = -B </math> में एकत्र किए जाते हैं, तब


:<math>\Gamma = \frac{ \langle A, B \rangle_{\rm F}}{\|A\|_{\rm F} \|B\|_{\rm F}}</math>
:<math>\Gamma = \frac{ \langle A, B \rangle_{\rm F}}{\|A\|_{\rm F} \|B\|_{\rm F}}</math>
कहाँ <math>\langle A, B \rangle_{\rm F}</math> [[फ्रोबेनियस आंतरिक उत्पाद]] है और <math>\|A\|_{\rm F} = \sqrt{\langle A, A \rangle_{\rm F}}</math> [[फ्रोबेनियस मानदंड]]. विशेष रूप से, सामान्य सहसंबंध गुणांक आव्यूहों के बीच के कोण की कोज्या है <math>A</math> और <math>B</math>.
जहाँ <math>\langle A, B \rangle_{\rm F}</math> [[फ्रोबेनियस आंतरिक उत्पाद]] है और <math>\|A\|_{\rm F} = \sqrt{\langle A, A \rangle_{\rm F}}</math> फ्रोबेनियस मानदंड है। विशेष रूप से, सामान्य सहसंबंध गुणांक आव्यूह <math>A</math> और <math>B</math> के बीच के कोण की कोज्या है।


{{see also|Inner product space#Norms on inner product spaces}}
{{see also|आंतरिक उत्पाद स्थान#आंतरिक उत्पाद स्थानों पर मानदंड}}


===केंडल का τ एक विशेष मामले के रूप में===
===केंडल का τ एक विशेष स्तिथि के रूप में===
अगर <math>r_i</math>, <math>s_i</math> की रैंक हैं <math>i</math>-सदस्य के अनुसार <math>x</math>-गुणवत्ता और <math>y</math>-गुणवत्ता क्रमशः, तो हम परिभाषित कर सकते हैं
अगर <math>r_i</math>, <math>s_i</math> की श्रेणी <math>i</math>-घटक के अनुसार क्रमशः <math>x</math>-गुणवत्ता और <math>y</math>-गुणवत्ता हैं, तो हम निम्न परिभाषित कर सकते हैं


: <math>a_{ij} = \sgn(r_j-r_i),\quad  b_{ij} = \sgn(s_j-s_i).</math>
: <math>a_{ij} = \sgn(r_j-r_i),\quad  b_{ij} = \sgn(s_j-s_i).</math>
योग <math>\sum a_{ij}b_{ij} </math> सुसंगत जोड़ियों की संख्या घटाकर असंगत जोड़ियों की संख्या है (केंडल ताऊ श्रेणी सहसंबंध गुणांक देखें)। योग <math>\sum a_{ij}^2</math> बस है <math>n(n-1)/2</math>, पदों की संख्या <math>a_{ij}</math>, जैसा है <math>\sum b_{ij}^2</math>. इस प्रकार इस मामले में,
योग <math>\sum a_{ij}b_{ij} </math> सुसंगत जोड़ियों की संख्या घटाकर असंगत जोड़ियों की संख्या है (केंडल टाउ श्रेणी सहसंबंध गुणांक देखें)। योग <math>\sum a_{ij}^2</math> बस <math>n(n-1)/2</math> है, पदों की संख्या <math>a_{ij}</math> है, जैसे <math>\sum b_{ij}^2</math>इस प्रकार इस स्तिथि में,


: <math>\Gamma = \frac{2\,((\text{number of concordant pairs}) - (\text{number of discordant pairs}))}{n(n-1)} = \text{Kendall's }\tau</math>
: <math>\Gamma = \frac{2\,((\text{number of concordant pairs}) - (\text{number of discordant pairs}))}{n(n-1)} = \text{Kendall's }\tau</math>




=== एक विशेष मामले के रूप में स्पीयरमैन का ρ ===
=== एक विशेष स्तिथि के रूप में स्पीयरमैन का ρ ===
अगर <math>r_i</math>, <math>s_i</math> की रैंक हैं
अगर <math>r_i</math>, <math>s_i</math> की श्रेणी हैं, <math>i</math>-घटक के अनुसार <math>x</math> और यह <math>y</math>-गुणवत्ता क्रमशः, हम मैट्रिक्स <math>a,b \in M(n\times n; \mathbb{R})</math> पर विचार कर सकते हैं  जो निम्न द्वारा परिभाषित है
<math>i</math>-सदस्य के अनुसार <math>x</math> और यह <math>y</math>-गुणवत्ता क्रमशः,
हम मैट्रिक्स पर विचार कर सकते हैं <math>a,b \in M(n\times n; \mathbb{R})</math> द्वारा परिभाषित
 
: <math>a_{ij} := r_j-r_i </math>
: <math>a_{ij} := r_j-r_i </math>
: <math>b_{ij} := s_j-s_i </math>
: <math>b_{ij} := s_j-s_i </math>
रकम <math>\sum a_{ij}^2</math> और <math>\sum b_{ij}^2</math> बराबर हैं,
योग <math>\sum a_{ij}^2</math> और <math>\sum b_{ij}^2</math> बराबर हैं,
चूंकि दोनों <math>r_i</math> और <math>s_i</math> से रेंज <math>1</math> को <math>n</math>.
 
चूंकि दोनों <math>r_i</math> और <math>s_i</math> से श्रेणी <math>1</math> को <math>n</math>.
 
इस तरह
इस तरह


:<math>\Gamma = \frac{\sum (r_j-r_i)(s_j-s_i)}{\sum(r_j-r_i)^2} </math>
:<math>\Gamma = \frac{\sum (r_j-r_i)(s_j-s_i)}{\sum(r_j-r_i)^2} </math>
इस अभिव्यक्ति को सरल बनाने के लिए,
इस अभिव्यक्ति को सरल बनाने के लिए, मान लीजिये <math>d_{i} := r_{i} - s_{i} </math> प्रत्येक के लिए श्रेणी <math>i</math> में अंतर दर्शाएं। आगे, मान लीजिये <math>U</math> एक समान रूप से वितरित असतत यादृच्छिक चर <math>\{1,2,\ldots,n\}</math> है।
होने देना <math>d_{i} := r_{i} - s_{i} </math> प्रत्येक के लिए रैंक में अंतर दर्शाएं <math>i</math>.
 
आगे, चलो <math>U</math> एक समान रूप से वितरित असतत यादृच्छिक चर बनें <math>\{1,2,\ldots,n\}</math>.
श्रेणी के बाद से <math>r,s</math> के केवल क्रमपरिवर्तन <math>1,2,\ldots,n</math> हैं, हम दोनों को वितरित यादृच्छिक चर <math>U</math> के रूप में देख सकते हैं। असतत गणित से मूल योग परिणामों का उपयोग करना, यह देखना आसान है कि समान रूप से वितरित यादृच्छिक चर <math>U</math> के लिए, हमारे पास <math>\mathbb{E}[U]=\textstyle\frac{n+1}{2}</math> और <math>\mathbb{E}[U^{2}]=\textstyle\frac{(n+1)(2n+1)}{6}</math> है और इस तरह
रैंकों के बाद से <math>r,s</math> के केवल क्रमपरिवर्तन हैं <math>1,2,\ldots,n</math>,
<math>\mathrm{Var}(U) = \textstyle\frac{(n+1)(2n+1)}{6} - \textstyle\frac{(n+1)(n+1)}{4} = \textstyle\frac{n^{2}-1}{12}</math> होता है। अब, समरूपता का अवलोकन हमें इसके भागों की गणना <math>\Gamma</math> करने की अनुमति देता है निम्नलिखित नुसार:
हम दोनों को वितरित यादृच्छिक चर के रूप में देख सकते हैं <math>U</math>.
असतत गणित से बुनियादी योग#शक्तियाँ_और_अंकगणित_प्रगति_का_लघुगणक_का उपयोग करना,
यह देखना आसान है कि समान रूप से वितरित यादृच्छिक चर के लिए, <math>U</math>,
अपने पास
<math>\mathbb{E}[U]=\textstyle\frac{n+1}{2}</math>
और
<math>\mathbb{E}[U^{2}]=\textstyle\frac{(n+1)(2n+1)}{6}</math>
और इस तरह
<math>\mathrm{Var}(U) = \textstyle\frac{(n+1)(2n+1)}{6} - \textstyle\frac{(n+1)(n+1)}{4} = \textstyle\frac{n^{2}-1}{12}</math>.
अब, समरूपता का अवलोकन हमें इसके भागों की गणना करने की अनुमति देता है <math>\Gamma</math>
निम्नलिखित नुसार:


:<math>
:<math>
Line 109: Line 97:


:<math>\Gamma = 1 - \frac{\sum_{i = 1}^{n} d_{i}^{2}}{2n\mathrm{Var}(U)} = 1 - \frac{6\sum_{i = 1}^{n} d_{i}^{2}}{n(n^{2}-1)}</math>
:<math>\Gamma = 1 - \frac{\sum_{i = 1}^{n} d_{i}^{2}}{2n\mathrm{Var}(U)} = 1 - \frac{6\sum_{i = 1}^{n} d_{i}^{2}}{n(n^{2}-1)}</math>
कहाँ <math>d_{i} = r_{i} - s_{i}</math> रैंकों के बीच अंतर है,
जहाँ <math>d_{i} = r_{i} - s_{i}</math> श्रेणी के बीच अंतर है, जो बिल्कुल स्पीयरमैन का श्रेणी सहसंबंध गुणांक <math>\rho</math> है।
जो बिल्कुल स्पीयरमैन का श्रेणी सहसंबंध गुणांक है <math>\rho</math>.


==रैंक-द्विक्रमिक सहसंबंध==
==श्रेणी-द्विक्रमिक सहसंबंध==
{{Main|Mann–Whitney_U_test#Rank-biserial_correlation}}
{{Main|मान-व्हिटनी यू परीक्षण#रैंक-द्विक्रमिक सहसंबंध}}


जीन ग्लास (1965) ने कहा कि रैंक-द्विधारावाहिक स्पीयरमैन से प्राप्त किया जा सकता है <math>\rho</math>. कोई व्यक्ति एक्स, द्विभाजित चर और वाई, श्रेणी चर पर परिभाषित गुणांक प्राप्त कर सकता है, जो एक्स और वाई के बीच स्पीयरमैन के आरएचओ का उसी तरह अनुमान लगाता है जैसे द्विक्रमिक आर दो सामान्य चर के बीच पियर्सन के आर का अनुमान लगाता है" (पी. 91)रैंक-द्विक्रमिक सहसंबंध को नौ साल पहले एडवर्ड क्यूरटन (1956) द्वारा श्रेणी सहसंबंध के एक उपाय के रूप में पेश किया गया था जब रैंक दो समूहों में होते हैं।
जीन ग्लास (1965) ने कहा कि श्रेणी-द्विपंक्तिक स्पीयरमैन <math>\rho</math> से प्राप्त किया जा सकता है। कोई एक्स, द्विभाजित चर और वाई, श्रेणी चर पर परिभाषित गुणांक प्राप्त कर सकता है, जो एक्स और वाई के बीच स्पीयरमैन के आरएचओ का उसी तरह अनुमान लगाता है जैसे द्विक्रमिक आर दो सामान्य चर (पी. 91) के बीच पियर्सन के आर का अनुमान लगाता है"। श्रेणी-द्विक्रमिक सहसंबंध को नौ साल पहले एडवर्ड क्यूरटन (1956) द्वारा श्रेणी सहसंबंध के एक उपाय के रूप में प्रस्तुत किया गया था जब श्रेणी दो समूहों में होते हैं।


===केर्बी सरल अंतर सूत्र===
===केर्बी सरल अंतर सूत्र===
डेव केर्बी (2014) ने छात्रों को श्रेणी सहसंबंध से परिचित कराने के उपाय के रूप में रैंक-द्विक्रमिक की सिफारिश की, क्योंकि सामान्य तर्क को परिचयात्मक स्तर पर समझाया जा सकता है। रैंक-द्विधारावाहिक मान-व्हिटनी यू परीक्षण के साथ उपयोग किया जाने वाला सहसंबंध है, जो आमतौर पर सांख्यिकी पर परिचयात्मक कॉलेज पाठ्यक्रमों में सम्मिलित एक विधि है। इस परीक्षण के आंकड़े में दो समूह सम्मिलित हैं; और समूहों के प्रत्येक सदस्य के लिए, परिणाम को समग्र रूप से अध्ययन के लिए क्रमबद्ध किया जाता है।
डेव केर्बी (2014) ने छात्रों को श्रेणी सहसंबंध से परिचित कराने के उपाय के रूप में श्रेणी-द्विक्रमिक का अनुग्रह किया, क्योंकि सामान्य तर्क को परिचयात्मक स्तर पर समझाया जा सकता है। श्रेणी-द्विपंक्तिक मान-व्हिटनी यू परीक्षण के साथ उपयोग किया जाने वाला सहसंबंध है, जो सामान्यतः सांख्यिकी पर परिचयात्मक कॉलेज पाठ्यक्रमों में सम्मिलित एक विधि है। इस परीक्षण के आंकड़े में दो समूह सम्मिलित हैं; और समूहों के प्रत्येक घटक के लिए, परिणाम को समग्र रूप से अध्ययन के लिए क्रमबद्ध किया जाता है।


केर्बी ने दिखाया कि इस श्रेणी सहसंबंध को दो अवधारणाओं के संदर्भ में व्यक्त किया जा सकता है: आंकड़े का प्रतिशत जो किसी बताई गई परिकल्पना का समर्थन करता है, और आंकड़े का प्रतिशत जो इसका समर्थन नहीं करता है। केर्बी सरल अंतर सूत्र में कहा गया है कि श्रेणी सहसंबंध को अनुकूल साक्ष्य (एफ) के अनुपात से प्रतिकूल साक्ष्य (यू) के अनुपात के बीच अंतर के रूप में व्यक्त किया जा सकता है।
केर्बी ने दिखाया कि इस श्रेणी सहसंबंध को दो अवधारणाओं के संदर्भ में व्यक्त किया जा सकता है: आंकड़े का प्रतिशत जो किसी बताई गई परिकल्पना का समर्थन करता है, और आंकड़े का प्रतिशत जो इसका समर्थन नहीं करता है। केर्बी सरल अंतर सूत्र में कहा गया है कि श्रेणी सहसंबंध को अनुकूल साक्ष्य (f) के अनुपात से प्रतिकूल साक्ष्य (u) के अनुपात के बीच अंतर के रूप में व्यक्त किया जा सकता है।
:<math>r = f - u </math>
:<math>r = f - u </math>




===उदाहरण और व्याख्या===
===उदाहरण और व्याख्या===
गणना को स्पष्ट करने के लिए, मान लीजिए कि एक कोच दो तरीकों का उपयोग करके एक महीने के लिए लंबी दूरी के धावकों को प्रशिक्षित करता है। ग्रुप ए में 5 धावक हैं, और ग्रुप बी में 4 धावक हैं। बताई गई परिकल्पना यह है कि विधि ए तेज़ धावक पैदा करती है। परिणामों का आकलन करने की दौड़ में पाया गया कि समूह ए के धावक वास्तव में तेज़ दौड़ते हैं, निम्नलिखित रैंक के साथ: 1, 2, 3, 4, और 6। समूह बी के धीमे धावकों की रैंक 5, 7, 8 है। और 9.
गणना को स्पष्ट करने के लिए, मान लीजिए कि एक प्रशिक्षक दो तरीकों का उपयोग करके एक महीने के लिए लंबी दूरी के धावकों को प्रशिक्षित करता है। समूह ए में 5 धावक हैं, और समूह बी में 4 धावक हैं। बताई गई परिकल्पना यह है कि विधि ए तीव्र धावक उत्पन्न करती है। परिणामों का आकलन करने की दौड़ में पाया गया कि समूह ए के धावक वास्तव में, निम्नलिखित श्रेणी के साथ: 1, 2, 3, 4, और 6 तीव्र दौड़ते हैं। समूह बी के धीमे धावकों की श्रेणी 5, 7, 8 और 9 है।


विश्लेषण जोड़ियों पर किया जाता है, जिन्हें एक समूह के सदस्य की तुलना में दूसरे समूह के सदस्य के रूप में परिभाषित किया जाता है। उदाहरण के लिए, अध्ययन में सबसे तेज़ धावक चार जोड़ियों का सदस्य है: (1,5), (1,7), (1,8), और (1,9)ये चारों जोड़े परिकल्पना का समर्थन करते हैं, क्योंकि प्रत्येक जोड़ी में समूह ए का धावक समूह बी के धावक से तेज़ है। कुल 20 जोड़े हैं, और 19 जोड़े परिकल्पना का समर्थन करते हैं। एकमात्र जोड़ी जो परिकल्पना का समर्थन नहीं करती वह रैंक 5 और 6 वाले दो धावक हैं, क्योंकि इस जोड़ी में ग्रुप बी के धावक का समय सबसे तेज़ था। केर्बी सरल अंतर सूत्र के अनुसार, 95% आंकड़े परिकल्पना का समर्थन करता है (20 जोड़े में से 19), और 5% समर्थन नहीं करता है (20 जोड़े में से 1), इसलिए श्रेणी सहसंबंध r = .95 - .05 = .90 है .
विश्लेषण जोड़ियों पर किया जाता है, जिन्हें एक समूह के घटक की तुलना में दूसरे समूह के घटक के रूप में परिभाषित किया जाता है। उदाहरण के लिए, अध्ययन में सबसे तीव्र धावक चार जोड़ियों का घटक (1,5), (1,7), (1,8), और (1,9) है। ये चारों जोड़े परिकल्पना का समर्थन करते हैं, क्योंकि प्रत्येक जोड़ी में समूह ए का धावक समूह बी के धावक से तीव्र है। कुल 20 जोड़े हैं, और 19 जोड़े परिकल्पना का समर्थन करते हैं। एकमात्र जोड़ी जो परिकल्पना का समर्थन नहीं करती वह श्रेणी 5 और 6 वाले दो धावक हैं, क्योंकि इस जोड़ी में समूह बी के धावक का समय सबसे तीव्र था। केर्बी सरल अंतर सूत्र के अनुसार, 95% आंकड़े परिकल्पना का समर्थन करता है (20 जोड़े में से 19), और 5% समर्थन नहीं करता है (20 जोड़े में से 1), इसलिए श्रेणी सहसंबंध r = .95 - .05 = .90 है।


सहसंबंध का अधिकतम मान r = 1 है, जिसका अर्थ है कि 100% जोड़े परिकल्पना के पक्ष में हैं। r = 0 का सहसंबंध इंगित करता है कि आधे जोड़े परिकल्पना का समर्थन करते हैं और आधे नहीं; दूसरे शब्दों में, प्रतिरूप समूह रैंक में भिन्न नहीं होते हैं, इसलिए इसका कोई सबूत नहीं है कि वे दो अलग-अलग आबादी से आते हैं। कहा जा सकता है कि r = 0 का प्रभाव आकार समूह सदस्यता और सदस्यों के रैंक के बीच कोई संबंध नहीं बताता है।
सहसंबंध का अधिकतम मान r = 1 है, जिसका अर्थ है कि 100% जोड़े परिकल्पना के पक्ष में हैं। r = 0 का सहसंबंध इंगित करता है कि आधे जोड़े परिकल्पना का समर्थन करते हैं और आधे नहीं; दूसरे शब्दों में, प्रतिरूप समूह श्रेणी में भिन्न नहीं होते हैं, इसलिए इसका कोई प्रमाण नहीं है कि वे दो अलग-अलग आबादी से आते हैं। कहा जा सकता है कि r = 0 का प्रभाव आकार समूह घटकता और घटकों के श्रेणी के बीच कोई संबंध नहीं बताता है।


==संदर्भ==
==संदर्भ==

Revision as of 14:38, 2 August 2023

आंकड़ों में, श्रेणी सहसंबंध कई आँकड़ों में से एक है जो एक क्रमिक संघ को मापता है - विभिन्न क्रमिक आंकड़े चर की श्रेणी या एक ही चर की विभिन्न श्रेणी के बीच संबंध, जहां "श्रेणी" किसी विशेष चर के विभिन्न अवलोकनों के लिए क्रम वर्गीकरण "प्रथम", "दूसरा", "तीसरा" आदि का समनुदेशन है। श्रेणी सहसंबंध गुणांक दो श्रेणी के बीच समानता की डिग्री को मापता है, और इसका उपयोग उनके बीच संबंध के सांख्यिकीय महत्व का आकलन करने के लिए किया जा सकता है। उदाहरण के लिए, श्रेणी सहसंबंध का उपयोग करने वाले महत्व के दो सामान्य गैर-पैरामीट्रिक तरीके मैन-व्हिटनी यू परीक्षण और विलकॉक्सन हस्ताक्षरित-श्रेणी परीक्षण हैं।

संदर्भ

यदि, उदाहरण के लिए, एक चर कॉलेज बास्केटबॉल कार्यक्रम की पहचान है और दूसरा चर कॉलेज फुटबॉल कार्यक्रम की पहचान है, तो कोई दो प्रकार के कार्यक्रम की पोल श्रेणी के बीच संबंध का परीक्षण कर सकता है: क्या उच्च श्रेणी वाले बास्केटबॉल कार्यक्रम वाले कॉलेजों में उच्च श्रेणी वाले फुटबॉल कार्यक्रम होते हैं? एक श्रेणी सहसंबंध गुणांक उस रिश्ते को माप सकता है, और श्रेणी सहसंबंध गुणांक के महत्व का माप यह दिखा सकता है कि क्या मापा गया संबंध एक संयोग होने के लिए काफी छोटा है।

यदि केवल एक ही चर है, एक कॉलेज फुटबॉल कार्यक्रम की पहचान, लेकिन यह दो अलग-अलग पोल श्रेणी (जैसे, एक प्रशिक्षक द्वारा और एक खेल लेखकों द्वारा) के अधीन है, तो दो अलग-अलग पोल की श्रेणी की समानता को श्रेणी सहसंबंध गुणांक के साथ मापा जा सकता है।

एक अन्य उदाहरण के रूप में, कम आय, मध्यम आय, और पंक्ति चर में उच्च आय और शैक्षिक स्तर के साथ एक आसंग सारणी में - कॉलम चर में कोई हाई स्कूल, हाई स्कूल, विश्वविद्यालय नहीं),[1] श्रेणी सहसंबंध आय और शैक्षिक स्तर के बीच संबंध को मापता है।

सहसंबंध गुणांक

कुछ अधिक प्रचलित श्रेणी सहसंबंध आँकड़े सम्मिलित हैं

  1. स्पीयरमैन का श्रेणी सहसंबंध गुणांक
  2. केंडल का ताउ श्रेणी सहसंबंध गुणांक
  3. गुडमैन और क्रुस्कल का गामा
  4. सोमर्स डी

बढ़ते श्रेणी सहसंबंध गुणांक का तात्पर्य श्रेणी के बीच बढ़ते समझौते से है। गुणांक अंतराल [−1, 1] के अंदर है और मान मानता है:

  • 1 यदि दोनों श्रेणी के बीच समझौता सही है; दोनों श्रेणी समान हैं।
  • 0 यदि श्रेणी पूरी तरह से स्वतंत्र है।
  • −1 यदि दो श्रेणी के बीच असहमति सही है; एक श्रेणी दूसरे से उलट है।

अगले डायकोनिस (1988), श्रेणी को वस्तुओं के एक सम्मुच्चय (गणित) के क्रमपरिवर्तन के रूप में देखा जा सकता है। इस प्रकार हम प्रेक्षित श्रेणी को उस आंकड़े के रूप में देख सकते हैं जब प्रतिरूप स्थान एक सममित समूह (के साथ पहचाना जाता है) प्राप्त होता है। फिर हम एक आव्यूह (गणित) का परिचय दे सकते हैं, जिससे सममित समूह को एक मीट्रिक स्थान में बदल दिया जा सकता है। अलग-अलग आव्यूह अलग-अलग श्रेणी सहसंबंधों के अनुरूप होंगे।

सामान्य सहसंबंध गुणांक

केंडल 1970 [2] दिखाया कि उसका (तउ) और स्पीयरमैन का (आरएचओ) सामान्य सहसंबंध गुणांक की विशेष स्तिथि हैं।

मान लीजिए हमारे पास एक सम्मुच्चय है जिन वस्तुओं पर दो गुणों के संबंध में विचार किया जा रहा है, उनका प्रतिनिधित्व और द्वारा किया जाता है, और मूल्यों के सम्मुच्चय का निर्माण करता है। वैयक्तिक व्यक्तियों के किसी भी जोड़े को, मान लें कि i-वें और j-वें को हम एक x-स्कोर निर्दिष्ट करते हैं, जिसे द्वारा दर्शाया जाता है, और एक y-स्कोर, जिसे द्वारा दर्शाया जाता है। इन कार्यों के लिए एकमात्र आवश्यकता यह है कि वे सममित-विरोधी हों, इसलिए और है (ध्यान दें कि विशेष रूप से अगर ।) फिर सामान्यीकृत सहसंबंध गुणांक परिभाषित किया जाता है

समान रूप से, यदि सभी गुणांक मैट्रिक्स और , साथ और में एकत्र किए जाते हैं, तब

जहाँ फ्रोबेनियस आंतरिक उत्पाद है और फ्रोबेनियस मानदंड है। विशेष रूप से, सामान्य सहसंबंध गुणांक आव्यूह और के बीच के कोण की कोज्या है।

केंडल का τ एक विशेष स्तिथि के रूप में

अगर , की श्रेणी -घटक के अनुसार क्रमशः -गुणवत्ता और -गुणवत्ता हैं, तो हम निम्न परिभाषित कर सकते हैं

योग सुसंगत जोड़ियों की संख्या घटाकर असंगत जोड़ियों की संख्या है (केंडल टाउ श्रेणी सहसंबंध गुणांक देखें)। योग बस है, पदों की संख्या है, जैसे । इस प्रकार इस स्तिथि में,


एक विशेष स्तिथि के रूप में स्पीयरमैन का ρ

अगर , की श्रेणी हैं, -घटक के अनुसार और यह -गुणवत्ता क्रमशः, हम मैट्रिक्स पर विचार कर सकते हैं जो निम्न द्वारा परिभाषित है

योग और बराबर हैं,

चूंकि दोनों और से श्रेणी को .

इस तरह

इस अभिव्यक्ति को सरल बनाने के लिए, मान लीजिये प्रत्येक के लिए श्रेणी में अंतर दर्शाएं। आगे, मान लीजिये एक समान रूप से वितरित असतत यादृच्छिक चर है।

श्रेणी के बाद से के केवल क्रमपरिवर्तन हैं, हम दोनों को वितरित यादृच्छिक चर के रूप में देख सकते हैं। असतत गणित से मूल योग परिणामों का उपयोग करना, यह देखना आसान है कि समान रूप से वितरित यादृच्छिक चर के लिए, हमारे पास और है और इस तरह होता है। अब, समरूपता का अवलोकन हमें इसके भागों की गणना करने की अनुमति देता है निम्नलिखित नुसार:

और

इस तरह

जहाँ श्रेणी के बीच अंतर है, जो बिल्कुल स्पीयरमैन का श्रेणी सहसंबंध गुणांक है।

श्रेणी-द्विक्रमिक सहसंबंध

जीन ग्लास (1965) ने कहा कि श्रेणी-द्विपंक्तिक स्पीयरमैन से प्राप्त किया जा सकता है। कोई एक्स, द्विभाजित चर और वाई, श्रेणी चर पर परिभाषित गुणांक प्राप्त कर सकता है, जो एक्स और वाई के बीच स्पीयरमैन के आरएचओ का उसी तरह अनुमान लगाता है जैसे द्विक्रमिक आर दो सामान्य चर (पी. 91) के बीच पियर्सन के आर का अनुमान लगाता है"। श्रेणी-द्विक्रमिक सहसंबंध को नौ साल पहले एडवर्ड क्यूरटन (1956) द्वारा श्रेणी सहसंबंध के एक उपाय के रूप में प्रस्तुत किया गया था जब श्रेणी दो समूहों में होते हैं।

केर्बी सरल अंतर सूत्र

डेव केर्बी (2014) ने छात्रों को श्रेणी सहसंबंध से परिचित कराने के उपाय के रूप में श्रेणी-द्विक्रमिक का अनुग्रह किया, क्योंकि सामान्य तर्क को परिचयात्मक स्तर पर समझाया जा सकता है। श्रेणी-द्विपंक्तिक मान-व्हिटनी यू परीक्षण के साथ उपयोग किया जाने वाला सहसंबंध है, जो सामान्यतः सांख्यिकी पर परिचयात्मक कॉलेज पाठ्यक्रमों में सम्मिलित एक विधि है। इस परीक्षण के आंकड़े में दो समूह सम्मिलित हैं; और समूहों के प्रत्येक घटक के लिए, परिणाम को समग्र रूप से अध्ययन के लिए क्रमबद्ध किया जाता है।

केर्बी ने दिखाया कि इस श्रेणी सहसंबंध को दो अवधारणाओं के संदर्भ में व्यक्त किया जा सकता है: आंकड़े का प्रतिशत जो किसी बताई गई परिकल्पना का समर्थन करता है, और आंकड़े का प्रतिशत जो इसका समर्थन नहीं करता है। केर्बी सरल अंतर सूत्र में कहा गया है कि श्रेणी सहसंबंध को अनुकूल साक्ष्य (f) के अनुपात से प्रतिकूल साक्ष्य (u) के अनुपात के बीच अंतर के रूप में व्यक्त किया जा सकता है।


उदाहरण और व्याख्या

गणना को स्पष्ट करने के लिए, मान लीजिए कि एक प्रशिक्षक दो तरीकों का उपयोग करके एक महीने के लिए लंबी दूरी के धावकों को प्रशिक्षित करता है। समूह ए में 5 धावक हैं, और समूह बी में 4 धावक हैं। बताई गई परिकल्पना यह है कि विधि ए तीव्र धावक उत्पन्न करती है। परिणामों का आकलन करने की दौड़ में पाया गया कि समूह ए के धावक वास्तव में, निम्नलिखित श्रेणी के साथ: 1, 2, 3, 4, और 6 तीव्र दौड़ते हैं। समूह बी के धीमे धावकों की श्रेणी 5, 7, 8 और 9 है।

विश्लेषण जोड़ियों पर किया जाता है, जिन्हें एक समूह के घटक की तुलना में दूसरे समूह के घटक के रूप में परिभाषित किया जाता है। उदाहरण के लिए, अध्ययन में सबसे तीव्र धावक चार जोड़ियों का घटक (1,5), (1,7), (1,8), और (1,9) है। ये चारों जोड़े परिकल्पना का समर्थन करते हैं, क्योंकि प्रत्येक जोड़ी में समूह ए का धावक समूह बी के धावक से तीव्र है। कुल 20 जोड़े हैं, और 19 जोड़े परिकल्पना का समर्थन करते हैं। एकमात्र जोड़ी जो परिकल्पना का समर्थन नहीं करती वह श्रेणी 5 और 6 वाले दो धावक हैं, क्योंकि इस जोड़ी में समूह बी के धावक का समय सबसे तीव्र था। केर्बी सरल अंतर सूत्र के अनुसार, 95% आंकड़े परिकल्पना का समर्थन करता है (20 जोड़े में से 19), और 5% समर्थन नहीं करता है (20 जोड़े में से 1), इसलिए श्रेणी सहसंबंध r = .95 - .05 = .90 है।

सहसंबंध का अधिकतम मान r = 1 है, जिसका अर्थ है कि 100% जोड़े परिकल्पना के पक्ष में हैं। r = 0 का सहसंबंध इंगित करता है कि आधे जोड़े परिकल्पना का समर्थन करते हैं और आधे नहीं; दूसरे शब्दों में, प्रतिरूप समूह श्रेणी में भिन्न नहीं होते हैं, इसलिए इसका कोई प्रमाण नहीं है कि वे दो अलग-अलग आबादी से आते हैं। कहा जा सकता है कि r = 0 का प्रभाव आकार समूह घटकता और घटकों के श्रेणी के बीच कोई संबंध नहीं बताता है।

संदर्भ

  1. Kruskal, William H. (1958). "एसोसिएशन के सामान्य उपाय". Journal of the American Statistical Association. 53 (284): 814–861. doi:10.2307/2281954. JSTOR 2281954.
  2. Kendall, Maurice G (1970). रैंक सहसंबंध विधियाँ (4 ed.). Griffin. ISBN 9780852641996.


अग्रिम पठन


बाहरी संबंध