श्रेणी सहसंबंध

From Vigyanwiki
Revision as of 07:05, 26 July 2023 by alpha>Indicwiki (Created page with "{{Short description|Statistic comparing ordinal rankings}} आंकड़ों में, रैंक सहसंबंध कई आँकड़ों में से...")
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

आंकड़ों में, रैंक सहसंबंध कई आँकड़ों में से एक है जो एक क्रमिक संघ को मापता है - विभिन्न क्रमिक डेटा चर की रैंकिंग या एक ही चर की विभिन्न रैंकिंग के बीच संबंध, जहां रैंकिंग पहले, दूसरे, तीसरे क्रम के लेबल का असाइनमेंट है। आदि किसी विशेष चर के विभिन्न अवलोकनों के लिए। रैंक सहसंबंध गुणांक दो रैंकिंग के बीच समानता की डिग्री को मापता है, और इसका उपयोग उनके बीच संबंध के सांख्यिकीय महत्व का आकलन करने के लिए किया जा सकता है। उदाहरण के लिए, रैंक सहसंबंध का उपयोग करने वाले महत्व के दो सामान्य गैर-पैरामीट्रिक तरीके मैन-व्हिटनी यू परीक्षण और विलकॉक्सन हस्ताक्षरित-रैंक परीक्षण हैं।

संदर्भ

यदि, उदाहरण के लिए, एक चर कॉलेज बास्केटबॉल कार्यक्रम की पहचान है और दूसरा चर कॉलेज फुटबॉल कार्यक्रम की पहचान है, तो कोई दो प्रकार के कार्यक्रम की पोल रैंकिंग के बीच संबंध का परीक्षण कर सकता है: क्या उच्च रैंक वाले बास्केटबॉल कार्यक्रम वाले कॉलेजों में उच्च रैंक वाले फुटबॉल कार्यक्रम होते हैं? एक रैंक सहसंबंध गुणांक उस रिश्ते को माप सकता है, और रैंक सहसंबंध गुणांक के महत्व का माप यह दिखा सकता है कि क्या मापा गया संबंध एक संयोग होने के लिए काफी छोटा है।

यदि केवल एक ही चर है, एक कॉलेज फुटबॉल कार्यक्रम की पहचान, लेकिन यह दो अलग-अलग पोल रैंकिंग (जैसे, एक कोच द्वारा और एक खेल लेखकों द्वारा) के अधीन है, तो दो अलग-अलग पोल की रैंकिंग की समानता को रैंक सहसंबंध गुणांक के साथ मापा जा सकता है।

एक अन्य उदाहरण के रूप में, कम आय, मध्यम आय, और पंक्ति चर में उच्च आय और शैक्षिक स्तर के साथ एक आकस्मिक तालिका में - कॉलम चर में कोई हाई स्कूल, हाई स्कूल, विश्वविद्यालय नहीं),[1] रैंक सहसंबंध आय और शैक्षिक स्तर के बीच संबंध को मापता है।

सहसंबंध गुणांक

कुछ अधिक लोकप्रिय रैंक सहसंबंध आँकड़े शामिल हैं

  1. स्पीयरमैन का रैंक सहसंबंध गुणांक|स्पीयरमैन का ρ
  2. केंडल का ताउ रैंक सहसंबंध गुणांक|केंडल का τ
  3. गुडमैन और क्रुस्कल का गामा|गुडमैन और क्रुस्कल का γ
  4. सोमर्स डी

बढ़ते रैंक सहसंबंध गुणांक का तात्पर्य रैंकिंग के बीच बढ़ते समझौते से है। गुणांक अंतराल [−1, 1] के अंदर है और मान मानता है:

  • 1 यदि दोनों रैंकिंग के बीच समझौता सही है; दोनों रैंकिंग समान हैं.
  • 0 यदि रैंकिंग पूरी तरह से स्वतंत्र है।
  • −1 यदि दो रैंकिंग के बीच असहमति सही है; एक रैंकिंग दूसरे से उलट है।

अगले Diaconis (1988), रैंकिंग को वस्तुओं के एक सेट (गणित) के क्रमपरिवर्तन के रूप में देखा जा सकता है। इस प्रकार हम प्रेक्षित रैंकिंग को उस डेटा के रूप में देख सकते हैं जब नमूना स्थान एक सममित समूह (के साथ पहचाना जाता है) प्राप्त होता है। फिर हम एक मीट्रिक (गणित) का परिचय दे सकते हैं, जिससे सममित समूह को एक मीट्रिक स्थान में बदल दिया जा सकता है। अलग-अलग मेट्रिक्स अलग-अलग रैंक सहसंबंधों के अनुरूप होंगे।

सामान्य सहसंबंध गुणांक

केंडल 1970[2] दिखाया कि उसका (ताऊ) और स्पीयरमैन का (आरएचओ) सामान्य सहसंबंध गुणांक के विशेष मामले हैं।

मान लीजिए हमारे पास एक सेट है जिन वस्तुओं पर दो गुणों के संबंध में विचार किया जा रहा है, उनका प्रतिनिधित्व किया जाता है और , मूल्यों के सेट का निर्माण और . व्यक्तियों के किसी भी जोड़े के लिए, कहें -वें और द -वें हम असाइन करते हैं -स्कोर, द्वारा निरूपित , और ए -स्कोर, द्वारा निरूपित . इन कार्यों के लिए एकमात्र आवश्यकता यह है कि वे सममित-विरोधी हों, इसलिए और . (ध्यान दें कि विशेष रूप से अगर .) फिर सामान्यीकृत सहसंबंध गुणांक परिभाषित किया जाता है

समान रूप से, यदि सभी गुणांक मैट्रिक्स में एकत्र किए जाते हैं और , साथ और , तब

कहाँ फ्रोबेनियस आंतरिक उत्पाद है और फ्रोबेनियस मानदंड. विशेष रूप से, सामान्य सहसंबंध गुणांक आव्यूहों के बीच के कोण की कोज्या है और .

केंडल का τ एक विशेष मामले के रूप में

अगर , की रैंक हैं -सदस्य के अनुसार -गुणवत्ता और -गुणवत्ता क्रमशः, तो हम परिभाषित कर सकते हैं

योग सुसंगत जोड़ियों की संख्या घटाकर असंगत जोड़ियों की संख्या है (केंडल ताऊ रैंक सहसंबंध गुणांक देखें)। योग बस है , पदों की संख्या , जैसा है . इस प्रकार इस मामले में,


एक विशेष मामले के रूप में स्पीयरमैन का ρ

अगर , की रैंक हैं

-सदस्य के अनुसार  और यह -गुणवत्ता क्रमशः,

हम मैट्रिक्स पर विचार कर सकते हैं द्वारा परिभाषित

रकम और बराबर हैं, चूंकि दोनों और से रेंज को . इस तरह

इस अभिव्यक्ति को सरल बनाने के लिए, होने देना प्रत्येक के लिए रैंक में अंतर दर्शाएं . आगे, चलो एक समान रूप से वितरित असतत यादृच्छिक चर बनें . रैंकों के बाद से के केवल क्रमपरिवर्तन हैं , हम दोनों को वितरित यादृच्छिक चर के रूप में देख सकते हैं . असतत गणित से बुनियादी योग#शक्तियाँ_और_अंकगणित_प्रगति_का_लघुगणक_का उपयोग करना, यह देखना आसान है कि समान रूप से वितरित यादृच्छिक चर के लिए, , अपने पास और और इस तरह . अब, समरूपता का अवलोकन हमें इसके भागों की गणना करने की अनुमति देता है निम्नलिखित नुसार:

और

इस तरह

कहाँ रैंकों के बीच अंतर है, जो बिल्कुल स्पीयरमैन का रैंक सहसंबंध गुणांक है .

रैंक-द्विक्रमिक सहसंबंध

जीन ग्लास (1965) ने कहा कि रैंक-द्विधारावाहिक स्पीयरमैन से प्राप्त किया जा सकता है . कोई व्यक्ति एक्स, द्विभाजित चर और वाई, रैंकिंग चर पर परिभाषित गुणांक प्राप्त कर सकता है, जो एक्स और वाई के बीच स्पीयरमैन के आरएचओ का उसी तरह अनुमान लगाता है जैसे द्विक्रमिक आर दो सामान्य चर के बीच पियर्सन के आर का अनुमान लगाता है" (पी. 91)। रैंक-द्विक्रमिक सहसंबंध को नौ साल पहले एडवर्ड क्यूरटन (1956) द्वारा रैंक सहसंबंध के एक उपाय के रूप में पेश किया गया था जब रैंक दो समूहों में होते हैं।

केर्बी सरल अंतर सूत्र

डेव केर्बी (2014) ने छात्रों को रैंक सहसंबंध से परिचित कराने के उपाय के रूप में रैंक-द्विक्रमिक की सिफारिश की, क्योंकि सामान्य तर्क को परिचयात्मक स्तर पर समझाया जा सकता है। रैंक-द्विधारावाहिक मान-व्हिटनी यू परीक्षण के साथ उपयोग किया जाने वाला सहसंबंध है, जो आमतौर पर सांख्यिकी पर परिचयात्मक कॉलेज पाठ्यक्रमों में शामिल एक विधि है। इस परीक्षण के डेटा में दो समूह शामिल हैं; और समूहों के प्रत्येक सदस्य के लिए, परिणाम को समग्र रूप से अध्ययन के लिए क्रमबद्ध किया जाता है।

केर्बी ने दिखाया कि इस रैंक सहसंबंध को दो अवधारणाओं के संदर्भ में व्यक्त किया जा सकता है: डेटा का प्रतिशत जो किसी बताई गई परिकल्पना का समर्थन करता है, और डेटा का प्रतिशत जो इसका समर्थन नहीं करता है। केर्बी सरल अंतर सूत्र में कहा गया है कि रैंक सहसंबंध को अनुकूल साक्ष्य (एफ) के अनुपात से प्रतिकूल साक्ष्य (यू) के अनुपात के बीच अंतर के रूप में व्यक्त किया जा सकता है।


उदाहरण और व्याख्या

गणना को स्पष्ट करने के लिए, मान लीजिए कि एक कोच दो तरीकों का उपयोग करके एक महीने के लिए लंबी दूरी के धावकों को प्रशिक्षित करता है। ग्रुप ए में 5 धावक हैं, और ग्रुप बी में 4 धावक हैं। बताई गई परिकल्पना यह है कि विधि ए तेज़ धावक पैदा करती है। परिणामों का आकलन करने की दौड़ में पाया गया कि समूह ए के धावक वास्तव में तेज़ दौड़ते हैं, निम्नलिखित रैंक के साथ: 1, 2, 3, 4, और 6। समूह बी के धीमे धावकों की रैंक 5, 7, 8 है। और 9.

विश्लेषण जोड़ियों पर किया जाता है, जिन्हें एक समूह के सदस्य की तुलना में दूसरे समूह के सदस्य के रूप में परिभाषित किया जाता है। उदाहरण के लिए, अध्ययन में सबसे तेज़ धावक चार जोड़ियों का सदस्य है: (1,5), (1,7), (1,8), और (1,9)। ये चारों जोड़े परिकल्पना का समर्थन करते हैं, क्योंकि प्रत्येक जोड़ी में समूह ए का धावक समूह बी के धावक से तेज़ है। कुल 20 जोड़े हैं, और 19 जोड़े परिकल्पना का समर्थन करते हैं। एकमात्र जोड़ी जो परिकल्पना का समर्थन नहीं करती वह रैंक 5 और 6 वाले दो धावक हैं, क्योंकि इस जोड़ी में ग्रुप बी के धावक का समय सबसे तेज़ था। केर्बी सरल अंतर सूत्र के अनुसार, 95% डेटा परिकल्पना का समर्थन करता है (20 जोड़े में से 19), और 5% समर्थन नहीं करता है (20 जोड़े में से 1), इसलिए रैंक सहसंबंध r = .95 - .05 = .90 है .

सहसंबंध का अधिकतम मान r = 1 है, जिसका अर्थ है कि 100% जोड़े परिकल्पना के पक्ष में हैं। r = 0 का सहसंबंध इंगित करता है कि आधे जोड़े परिकल्पना का समर्थन करते हैं और आधे नहीं; दूसरे शब्दों में, नमूना समूह रैंक में भिन्न नहीं होते हैं, इसलिए इसका कोई सबूत नहीं है कि वे दो अलग-अलग आबादी से आते हैं। कहा जा सकता है कि r = 0 का प्रभाव आकार समूह सदस्यता और सदस्यों के रैंक के बीच कोई संबंध नहीं बताता है।

संदर्भ

  1. Kruskal, William H. (1958). "एसोसिएशन के सामान्य उपाय". Journal of the American Statistical Association. 53 (284): 814–861. doi:10.2307/2281954. JSTOR 2281954.
  2. Kendall, Maurice G (1970). रैंक सहसंबंध विधियाँ (4 ed.). Griffin. ISBN 9780852641996.


अग्रिम पठन


बाहरी संबंध