दूरी सहसंबंध: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 1: Line 1:
सांख्यिकी और प्रायिकता सिद्धांत में, '''दूरी सहसंबंध या दूरी सहसंयोजक''', यादृच्छिक के दो युग्मित यादृच्छिक वैक्टर के बीच निर्भरता का एक माप है। जनसंख्या सहसंबंध गुणांक शून्य है अगर और केवल अगर यादृच्छिक वेक्टर स्वतंत्र है। इस प्रकार, दूरी सहसंबंध दो यादृच्छिक चर या यादृच्छिक वेक्टर के बीच रैखिक और गैर-रेखीय संबंध दोनों को मापता है। यह पियर्सन के सहसंबंध के विपरीत है,जो केवल दो यादृच्छिक चर के बीच रैखिक संबंध का आकलन कर सकता है।
सांख्यिकी और प्रायिकता सिद्धांत में, '''दूरी सहसंबंध या दूरी सहसंयोजक''', यादृच्छिक के दो युग्मित यादृच्छिक सदिश के बीच निर्भरता का एक माप है। जनसंख्या सहसंबंध गुणांक शून्य है यदि और केवल यदि यादृच्छिक सदिश स्वतंत्र है। इस प्रकार, दूरी सहसंबंध दो यादृच्छिक चर या यादृच्छिक सदिश के बीच रैखिक और गैर-रेखीय संबंधों को मापता है। यह पियर्सन के सहसंबंध के विपरीत है, जो केवल दो यादृच्छिक चर के बीच रैखिक संबंध का आकलन कर सकता है।


दूरी सहसंबंध का उपयोग क्रमपरिवर्तन परीक्षण के साथ निर्भरता का [[सांख्यिकीय परिकल्पना परीक्षण|सांख्यिकीय परीक्षण]] करने के लिए किया जा सकता है। सबसे पहले दो यादृच्छिक वैक्टरों के बीच दूरी सहसंबंध ([[यूक्लिडियन वेक्टर|यूक्लिडियन]] दूरी मैट्रिक्स के पुन: केंद्रित होने सहित) की गणना करता है और फिर इस मान की तुलना डेटा के कई फेरबदल के दूरी सहसंबंधों से करता है।[[Image:Distance Correlation Examples.svg|thumb|upright=1.8|right|प्रत्येक सेट के लिए x और y के दूरी सहसंबंध गुणांक के साथ (x, y) बिंदुओं के कई सेट। सहसंबंध पर ग्राफ की तुलना करें]]
दूरी सहसंबंध का उपयोग क्रमपरिवर्तन परीक्षण के साथ निर्भरता का [[सांख्यिकीय परिकल्पना परीक्षण|सांख्यिकीय परीक्षण]] करने के लिए किया जा सकता है। पहले दो यादृच्छिक सदिश के बीच दूरी सहसंबंध ([[यूक्लिडियन वेक्टर|यूक्लिडियन]] दूरी आव्यूह के पुन: केंद्रित होने सहित) की गणना करता है और फिर इस मान की तुलना डेटा के कई क्रमपरिवर्तनों के दूरी सहसंबंधों से करता है।[[Image:Distance Correlation Examples.svg|thumb|upright=1.8|right|प्रत्येक सेट के लिए x और y के दूरी सहसंबंध गुणांक के साथ (x, y) बिंदुओं के कई सेट। सहसंबंध पर ग्राफ की तुलना करें]]


== पृष्ठभूमि ==
== पृष्ठभूमि ==


निर्भरता का संरचनात्मक माप, पियर्सन सहसंबंध गुणांक, <ref>{{harvs|nb|last=Pearson|year=1895a|year2=1895b}}</ref> दो चर के बीच एक रैखिक संबंध के लिए मुख्य संवेदनशील है. दूरी सहसंबंध 2005 में गैबोर जे द्वारा पेश किया गया था. पियर्सन के सहसंबंध के इस घाटे को दूर करने के लिए कई व्याख्यानों में स्ज़ेकली, अर्थात् यह निर्भर चर के लिए आसानी से शून्य हो सकता है. सहसंबंध = 0 ( असंबद्धता ) स्वतंत्रता का अर्थ नहीं है जबकि दूरी सहसंबंध = 0 स्वतंत्रता का अर्थ है. दूरी सहसंबंध पर पहला परिणाम 2007 और 2009 में प्रकाशित हुआ था।{{sfn|Székely|Rizzo|Bakirov|2007}}{{sfn|Székely|Rizzo|2009a}} यह प्रचारित किया गया था कि दूरी सहसंयोजक ब्राउनियन सहसंयोजक के समान है।{{sfn|Székely|Rizzo|2009a}} ये उपाय ऊर्जा दूरी के उदाहरण हैं.
निर्भरता का संरचनात्मक माप, [[पियर्सन उत्पाद-आघूर्ण सहसंबंध गुणांक|पियर्सन]] [[पियर्सन उत्पाद-आघूर्ण सहसंबंध गुणांक|सहसंबंध गुणांक]], <ref>{{harvs|nb|last=Pearson|year=1895a|year2=1895b}}</ref> दो चर के बीच एक रैखिक संबंध के लिए मुख्य संवेदनशील है। दूरी सहसंबंध 2005 में गैबोर जे द्वारा पेश किया गया था। पियर्सन के सहसंबंध के इस घाटे को दूर करने के लिए कई व्याख्यानों में स्ज़ेकली, अर्थात् यह निर्भर चर के लिए आसानी से शून्य हो सकता है। सहसंबंध = 0 ( असंबद्धता ) स्वतंत्रता का अर्थ नहीं है जबकि दूरी सहसंबंध = 0 स्वतंत्रता का अर्थ है। दूरी सहसंबंध पर पहला परिणाम 2007 और 2009 में प्रकाशित हुआ था।{{sfn|Székely|Rizzo|Bakirov|2007}}{{sfn|Székely|Rizzo|2009a}} यह प्रचारित किया गया था कि दूरी सहसंयोजक ब्राउनियन सहसंयोजक के समान है।{{sfn|Székely|Rizzo|2009a}} ये उपाय ऊर्जा दूरी के उदाहरण हैं।


निर्भरता का संरचनात्मक माप, [[पियर्सन उत्पाद-आघूर्ण सहसंबंध गुणांक|पियर्सन]] [[पियर्सन उत्पाद-आघूर्ण सहसंबंध गुणांक|सहसंबंध गुणांक]], मुख्य रूप से दो चर के बीच एक रैखिक संबंध के प्रति संवेदनशील है. दूरी सहसंबंध 2005 में गैबोर जे द्वारा प्रस्तुत किया गया था. पियर्सन के सहसंबंध की इस कमी को दूर करने के लिए कई व्याख्यानों में स्ज़ेकली, अर्थात् यह निर्भर चर के लिए आसानी से शून्य हो सकता है. सहसंबंध = 0 ( असंबद्धता ) स्वतंत्रता का अर्थ नहीं है जबकि दूरी सहसंबंध = 0 स्वतंत्रता का अर्थ है. दूरी सहसंबंध पर पहला परिणाम 2007 और 2009 में प्रकाशित हुआ था। यह साबित हो गया था कि दूरी सहसंयोजक ब्राउनियन सहसंयोजक के समान है। ये माप ऊर्जा दूरियों के उदाहरण हैं।
दूरी सहसंबंध कई अन्य मात्राओं से लिया गया है जो इसके विनिर्देशन में उपयोग किए जाते हैं, विशेष रूप से: '''दूरी विचरण''', '''दूरी मानक''' '''विचलन''', और '''दूरी सहसंयोजक'''ये मात्राएं पियर्सन गुणक सहसंबंध गुणांक के विनिर्देशन में संबंधित नामों के साथ सामान्य क्षणों के समान भूमिका निभाती हैं।
 
दूरी सहसंबंध कई अन्य मात्राओं से लिया गया है जो इसके विनिर्देशन में उपयोग किए जाते हैं, विशेष रूप से: '''दूरी विचरण''', '''दूरी मानक''' '''विचलन''', और '''दूरी सहसंयोजक'''. ये मात्रा पियरसन गुणक सहसंबंध गुणांक के विनिर्देशन में संबंधित नामों के साथ सामान्य क्षणों के समान भूमिका निभाती हैं।


== परिभाषाएँ ==
== परिभाषाएँ ==
Line 15: Line 13:
=== दूरी सहप्रसरण ===
=== दूरी सहप्रसरण ===


आइए हम दृष्टांत दूरी की परिभाषा के साथ प्रारंभ करें। मान लें (''X<sub>k</sub>'', ''Y<sub>k</sub>''), ''k'' = 1, 2, ..., ''n'' वास्तविक मूल्यवान या वेक्टर मूल्यवान यादृच्छिक चर की एक युग्म से [[सांख्यिकीय नमूना|सांख्यिकीय दृष्टांत]] (''X'', ''Y'') हो। सबसे पहले, ''n'' दूरी की मैट्रिसेस द्वारा ''n'' की गणना करें (''a<sub>j</sub>''<sub>, ''k''</sub>) और (''b<sub>j</sub>''<sub>, ''k''</sub>) जिसमें सभी युग्मन दूरी हैं।
आइए हम दृष्टांत दूरी की परिभाषा के साथ प्रारंभ करें। मान लें (''X<sub>k</sub>'', ''Y<sub>k</sub>''), ''k'' = 1, 2, ..., ''n'' वास्तविक मूल्यवान या सदिश मूल्यवान यादृच्छिक चर की एक युग्म से [[सांख्यिकीय नमूना|सांख्यिकीय दृष्टांत]] (''X'', ''Y'') हो। सबसे पहले, ''n'' दूरी की आव्यूह द्वारा ''n'' की गणना करें (''a<sub>j</sub>''<sub>, ''k''</sub>) और (''b<sub>j</sub>''<sub>, ''k''</sub>) जिसमें सभी युग्मन दूरी हैं।


:<math>
:<math>
Line 23: Line 21:
\end{align}
\end{align}
</math>
</math>
जहां || ⋅ || यूक्लिडियन मानक को दर्शाता है. फिर सभी दोगुनी केंद्रित दूरी लें
जहां || ⋅ || यूक्लिडियन मानक को दर्शाता है। फिर सभी दोगुनी केंद्रित दूरी लें


:<math>
:<math>
Line 29: Line 27:
B_{j, k} := b_{j, k} - \overline{b}_{j\cdot} -\overline{b}_{\cdot k} + \overline{b}_{\cdot\cdot},
B_{j, k} := b_{j, k} - \overline{b}_{j\cdot} -\overline{b}_{\cdot k} + \overline{b}_{\cdot\cdot},
</math>
</math>
जहां <math>\textstyle \overline{a}_{j\cdot}</math> j-वें पंक्ति का माध्य है, <math>\textstyle \overline{a}_{\cdot k}</math> k-वें स्तंभ का माध्य है, और <math>\textstyle \overline{a}_{\cdot\cdot}</math> {{math|''X''}} नमूने की दूरी मैट्रिक्स का भव्य माध्य है। {{math|''b''}} मानों के लिए अंकन समान है। (केंद्रित दूरियों (''A<sub>j</sub>''<sub>, ''k''</sub>) और (''B<sub>j</sub>''<sub>,''k''</sub>) के आव्यूहों में सभी पंक्तियों और सभी स्तंभों का योग शून्य होता है।) वर्गित दृष्टांत दूरी सहप्रसरण (एक अदिश राशि) केवल गुणनों ''A<sub>j</sub>''<sub>, ''k''</sub> ''B<sub>j</sub>''<sub>, ''k''</sub>: का अंकगणितीय औसत है:
जहां <math>\textstyle \overline{a}_{j\cdot}</math> j-वें पंक्ति का माध्य है, <math>\textstyle \overline{a}_{\cdot k}</math> k-वें स्तंभ का माध्य है, और <math>\textstyle \overline{a}_{\cdot\cdot}</math> {{math|''X''}} नमूने की दूरी आव्यूह का भव्य माध्य है। {{math|''b''}} मानों के लिए अंकन समान है। (केंद्रित दूरियों (''A<sub>j</sub>''<sub>, ''k''</sub>) और (''B<sub>j</sub>''<sub>,''k''</sub>) के आव्यूहों में सभी पंक्तियों और सभी स्तंभों का योग शून्य होता है।) वर्गित दृष्टांत दूरी सहप्रसरण (एक अदिश राशि) केवल गुणनों ''A<sub>j</sub>''<sub>, ''k''</sub> ''B<sub>j</sub>''<sub>, ''k''</sub>: का अंकगणितीय औसत है:


:<math>
:<math>
\operatorname{dCov}^2_n(X,Y) := \frac 1 {n^2} \sum_{j = 1}^n \sum_{k = 1}^n A_{j, k} \, B_{j, k}.
\operatorname{dCov}^2_n(X,Y) := \frac 1 {n^2} \sum_{j = 1}^n \sum_{k = 1}^n A_{j, k} \, B_{j, k}.
</math>
</math>
सांख्यिकीय ''T<sub>n</sub>'' = ''n'' dCov<sup>2</sup><sub>''n''</sub>(''X'', ''Y'') यादृच्छिकआयामों में यादृच्छिक वैक्टर की स्वतंत्रता का सुसंगत बहुभिन्नरूपी परीक्षण निर्धारित करता है. कार्यान्वयन के लिए R  के लिए ऊर्जा पैकेज में dcov.test फ़ंक्शन देखें।<sup>{{sfn|Rizzo|Székely|2021}}
सांख्यिकीय ''T<sub>n</sub>'' = ''n'' dCov<sup>2</sup><sub>''n''</sub>(''X'', ''Y'') यादृच्छिकआयामों में यादृच्छिक सदिश की स्वतंत्रता का सुसंगत बहुभिन्नरूपी परीक्षण निर्धारित करता है। कार्यान्वयन के लिए R  के लिए ऊर्जा पैकेज में dcov.test फ़ंक्शन देखें।<sup>{{sfn|Rizzo|Székely|2021}}


'''दूरी सहप्रसरण''' के जनसंख्या मान को उसी तर्ज पर परिभाषित किया जा सकता है। मान X यादृच्छिक चर है जो संभाव्यता वितरण μ के साथ p-आयामी यूक्लिडियन स्थान में मान लेता है और Y को एक यादृच्छिक चर होने देता है जो एक q-आयामी यूक्लिडियन स्थान में मान लेता है संभाव्यता वितरण ν के साथ, और मान लीजिए कि X और Y की सीमित अपेक्षाएँ हैं। लिखें
'''दूरी सहप्रसरण''' के जनसंख्या मान को उसी तर्ज पर परिभाषित किया जा सकता है। मान X यादृच्छिक चर है जो संभाव्यता वितरण μ के साथ p-आयामी यूक्लिडियन स्थान में मान लेता है और Y को एक यादृच्छिक चर होने देता है जो एक q-आयामी यूक्लिडियन स्थान में मान लेता है संभाव्यता वितरण ν के साथ, और मान लीजिए कि X और Y की सीमित अपेक्षाएँ हैं। लिखें
Line 69: Line 67:
=== दूरी विचरण और दूरी मानक विस्थापन ===
=== दूरी विचरण और दूरी मानक विस्थापन ===


दूरी ''विचरण दूरी'' के सहसंयोजक का विशेष स्तिथि है जब दो चर समान होते हैं. दूरी विचरण का जनसंख्या मूल्य वर्गमूल है
दूरी ''विचरण दूरी'' के सहसंयोजक का विशेष स्तिथि है जब दो चर समान होते हैं। दूरी विचरण का जनसंख्या मूल्य वर्गमूल है


:<math>
:<math>
\operatorname{dVar}^2(X) := \operatorname{E}[\|X-X'\|^2] + \operatorname{E}^2[\|X-X'\|] - 2\operatorname{E}[\|X-X'\|\,\|X-X''\|],
\operatorname{dVar}^2(X) := \operatorname{E}[\|X-X'\|^2] + \operatorname{E}^2[\|X-X'\|] - 2\operatorname{E}[\|X-X'\|\,\|X-X''\|],
</math>
</math>
जहाँ <math>X</math>, <math>X'</math>, और <math>X''</math> [[स्वतंत्र और समान रूप से वितरित यादृच्छिक चर]] हैं, <math>\operatorname{E}</math> [[अपेक्षित मूल्य]] को दर्शाता है, और <math>f^2(\cdot)=(f(\cdot))^2</math> फलन के लिए <math>f(\cdot)</math>, जैसे, <math>\operatorname{E}^2[\cdot] = (\operatorname{E}[\cdot])^2</math>.
जहाँ <math>X</math>, <math>X'</math>, और <math>X''</math> [[स्वतंत्र और समान रूप से वितरित यादृच्छिक चर]] हैं, <math>\operatorname{E}</math> [[अपेक्षित मूल्य]] को दर्शाता है, और <math>f^2(\cdot)=(f(\cdot))^2</math> फलन के लिए <math>f(\cdot)</math>, जैसे, <math>\operatorname{E}^2[\cdot] = (\operatorname{E}[\cdot])^2</math>


दृष्टांत दूरी प्रसरण का वर्गमूल है
दृष्टांत दूरी प्रसरण का वर्गमूल है
Line 87: Line 85:
=== दूरी सहसंबंध ===
=== दूरी सहसंबंध ===


दो यादृच्छिक चर के ''दूरी सहसंबंध''{{sfn|Székely|Rizzo|Bakirov|2007}} उनकी दूरी मानक विचलन के गुणन द्वारा उनकी ''दूरी के सहसंयोजक'' को विभाजित करके प्राप्त किया जाता है. दूरी सहसंबंध वर्गमूल है।
दो यादृच्छिक चर के ''दूरी सहसंबंध''{{sfn|Székely|Rizzo|Bakirov|2007}} उनकी दूरी मानक विचलन के गुणन द्वारा उनकी ''दूरी के सहसंयोजक'' को विभाजित करके प्राप्त किया जाता है। दूरी सहसंबंध वर्गमूल है।


:<math>
:<math>
Line 155: Line 153:
\end{align}
\end{align}
</math>
</math>
फिर प्रत्येक के लिए <math>0<\alpha<2</math>, <math>X</math> और <math>Y</math> स्वतंत्र हैं अगर और केवल अगर <math>\operatorname{dCov}^2(X, Y; \alpha) = 0</math>. यह ध्यान रखना महत्वपूर्ण है कि यह लक्षण वर्णन प्रतिपादक के लिए नहीं है <math>\alpha=2</math>; इस स्तिथि में द्विचर के लिए <math>(X, Y)</math>, <math>\operatorname{dCor}(X, Y; \alpha=2)</math> पियर्सन सहसंबंध का एक नियतात्मक कार्य है।{{sfn|Székely|Rizzo|Bakirov|2007}} अगर <math>a_{k,\ell}</math> और <math>b_{k,\ell}</math> हैं <math>\alpha</math> संबंधित दूरियों की शक्तियां, <math>0<\alpha\leq2</math>,  तब <math>\alpha</math> दृष्टांत दूरी सहप्रसरण को ऋणात्मक संख्या के रूप में परिभाषित किया जा सकता है।
फिर प्रत्येक के लिए <math>0<\alpha<2</math>, <math>X</math> और <math>Y</math> स्वतंत्र हैं अगर और केवल अगर <math>\operatorname{dCov}^2(X, Y; \alpha) = 0</math>यह ध्यान रखना महत्वपूर्ण है कि यह लक्षण वर्णन प्रतिपादक के लिए नहीं है <math>\alpha=2</math>; इस स्तिथि में द्विचर के लिए <math>(X, Y)</math>, <math>\operatorname{dCor}(X, Y; \alpha=2)</math> पियर्सन सहसंबंध का एक नियतात्मक कार्य है।{{sfn|Székely|Rizzo|Bakirov|2007}} अगर <math>a_{k,\ell}</math> और <math>b_{k,\ell}</math> हैं <math>\alpha</math> संबंधित दूरियों की शक्तियां, <math>0<\alpha\leq2</math>,  तब <math>\alpha</math> दृष्टांत दूरी सहप्रसरण को ऋणात्मक संख्या के रूप में परिभाषित किया जा सकता है।
:<math>
:<math>
\operatorname{dCov}^2_n(X, Y; \alpha):= \frac{1}{n^2}\sum_{k,\ell}A_{k,\ell}\,B_{k,\ell}.
\operatorname{dCov}^2_n(X, Y; \alpha):= \frac{1}{n^2}\sum_{k,\ell}A_{k,\ell}\,B_{k,\ell}.
Line 192: Line 190:
\operatorname{cov}_{U,V}^2(X,Y) := \operatorname{E}\left[X_U X_U^\mathrm{'} Y_V Y_V^\mathrm{'}\right]
\operatorname{cov}_{U,V}^2(X,Y) := \operatorname{E}\left[X_U X_U^\mathrm{'} Y_V Y_V^\mathrm{'}\right]
</math>
</math>
जब भी दाहिने हाथ की तरफ नॉनगेटिव और परिमित हो. सबसे महत्वपूर्ण उदाहरण है जब यू और वी दो तरफा स्वतंत्र ब्राउनियन गति / हैं /अपेक्षा शून्य और सहसंयोजक के साथ [[वीनर प्रक्रिया]] {{nowrap|1={{abs|''s''}} + {{abs|''t''}} − {{abs|''s'' − ''t''}} = 2 min(''s'',''t'')}} ( केवल ऋणात्मक s के लिए, t. ( यह मानक वीनर प्रक्रिया के सहसंयोजक से दोगुना है; यहाँ कारक 2 संगणना को सरल करता है।) इस स्तिथि में ( U, V ) सहसंयोजक को ब्राउनियन सहसंयोजक कहा जाता है और इसके द्वारा निरूपित किया जाता है।
जब भी दाहिने हाथ की तरफ नॉनगेटिव और परिमित हो। सबसे महत्वपूर्ण उदाहरण है जब यू और वी दो तरफा स्वतंत्र ब्राउनियन गति / हैं /अपेक्षा शून्य और सहसंयोजक के साथ [[वीनर प्रक्रिया]] {{nowrap|1={{abs|''s''}} + {{abs|''t''}} − {{abs|''s'' − ''t''}} = 2 min(''s'',''t'')}} ( केवल ऋणात्मक s के लिए, t. ( यह मानक वीनर प्रक्रिया के सहसंयोजक से दोगुना है; यहाँ कारक 2 संगणना को सरल करता है।) इस स्तिथि में ( U, V ) सहसंयोजक को ब्राउनियन सहसंयोजक कहा जाता है और इसके द्वारा निरूपित किया जाता है।
:<math>
:<math>
\operatorname{cov}_W(X,Y).  
\operatorname{cov}_W(X,Y).  
Line 207: Line 205:
</math>
</math>


== संबंधित मैट्रिक्स ==
== संबंधित आव्यूह ==
कर्नेल-आधारित सहसंबंधी मैट्रिक्स (जैसे हिल्बर्ट-श्मिट इंडिपेंडेंस मानदंड या एचएसआईसी) सहित अन्य सहसंबंधी मीट्रिक भी रैखिक और nonlinear इंटरैक्शन का पता लगा सकते हैं. दूरी सहसंबंध और कर्नेल-आधारित मेट्रिक्स दोनों का उपयोग [[विहित सहसंबंध विश्लेषण|विहित]] [[सांख्यिकीय शक्ति|सांख्यिकीय]] विश्लेषण और [[स्वतंत्र घटक विश्लेषण]] जैसे तरीकों से किया जा सकता है ताकि स्थिर सांख्यिकीय शक्ति प्राप्त की सकती है।
कर्नेल-आधारित सहसंबंधी आव्यूह (जैसे हिल्बर्ट-श्मिट इंडिपेंडेंस मानदंड या एचएसआईसी) सहित अन्य सहसंबंधी मीट्रिक भी रैखिक और nonlinear इंटरैक्शन का पता लगा सकते हैं। दूरी सहसंबंध और कर्नेल-आधारित मेट्रिक्स दोनों का उपयोग [[विहित सहसंबंध विश्लेषण|विहित]] [[सांख्यिकीय शक्ति|सांख्यिकीय]] विश्लेषण और [[स्वतंत्र घटक विश्लेषण]] जैसे तरीकों से किया जा सकता है ताकि स्थिर सांख्यिकीय शक्ति प्राप्त की सकती है।


== यह भी देखें ==
== यह भी देखें ==

Revision as of 05:25, 27 June 2023

सांख्यिकी और प्रायिकता सिद्धांत में, दूरी सहसंबंध या दूरी सहसंयोजक, यादृच्छिक के दो युग्मित यादृच्छिक सदिश के बीच निर्भरता का एक माप है। जनसंख्या सहसंबंध गुणांक शून्य है यदि और केवल यदि यादृच्छिक सदिश स्वतंत्र है। इस प्रकार, दूरी सहसंबंध दो यादृच्छिक चर या यादृच्छिक सदिश के बीच रैखिक और गैर-रेखीय संबंधों को मापता है। यह पियर्सन के सहसंबंध के विपरीत है, जो केवल दो यादृच्छिक चर के बीच रैखिक संबंध का आकलन कर सकता है।

दूरी सहसंबंध का उपयोग क्रमपरिवर्तन परीक्षण के साथ निर्भरता का सांख्यिकीय परीक्षण करने के लिए किया जा सकता है। पहले दो यादृच्छिक सदिश के बीच दूरी सहसंबंध (यूक्लिडियन दूरी आव्यूह के पुन: केंद्रित होने सहित) की गणना करता है और फिर इस मान की तुलना डेटा के कई क्रमपरिवर्तनों के दूरी सहसंबंधों से करता है।

प्रत्येक सेट के लिए x और y के दूरी सहसंबंध गुणांक के साथ (x, y) बिंदुओं के कई सेट। सहसंबंध पर ग्राफ की तुलना करें

पृष्ठभूमि

निर्भरता का संरचनात्मक माप, पियर्सन सहसंबंध गुणांक, [1] दो चर के बीच एक रैखिक संबंध के लिए मुख्य संवेदनशील है। दूरी सहसंबंध 2005 में गैबोर जे द्वारा पेश किया गया था। पियर्सन के सहसंबंध के इस घाटे को दूर करने के लिए कई व्याख्यानों में स्ज़ेकली, अर्थात् यह निर्भर चर के लिए आसानी से शून्य हो सकता है। सहसंबंध = 0 ( असंबद्धता ) स्वतंत्रता का अर्थ नहीं है जबकि दूरी सहसंबंध = 0 स्वतंत्रता का अर्थ है। दूरी सहसंबंध पर पहला परिणाम 2007 और 2009 में प्रकाशित हुआ था।[2][3] यह प्रचारित किया गया था कि दूरी सहसंयोजक ब्राउनियन सहसंयोजक के समान है।[3] ये उपाय ऊर्जा दूरी के उदाहरण हैं।

दूरी सहसंबंध कई अन्य मात्राओं से लिया गया है जो इसके विनिर्देशन में उपयोग किए जाते हैं, विशेष रूप से: दूरी विचरण, दूरी मानक विचलन, और दूरी सहसंयोजक। ये मात्राएं पियर्सन गुणक सहसंबंध गुणांक के विनिर्देशन में संबंधित नामों के साथ सामान्य क्षणों के समान भूमिका निभाती हैं।

परिभाषाएँ

दूरी सहप्रसरण

आइए हम दृष्टांत दूरी की परिभाषा के साथ प्रारंभ करें। मान लें (Xk, Yk), k = 1, 2, ..., n वास्तविक मूल्यवान या सदिश मूल्यवान यादृच्छिक चर की एक युग्म से सांख्यिकीय दृष्टांत (X, Y) हो। सबसे पहले, n दूरी की आव्यूह द्वारा n की गणना करें (aj, k) और (bj, k) जिसमें सभी युग्मन दूरी हैं।

जहां || ⋅ || यूक्लिडियन मानक को दर्शाता है। फिर सभी दोगुनी केंद्रित दूरी लें

जहां j-वें पंक्ति का माध्य है, k-वें स्तंभ का माध्य है, और X नमूने की दूरी आव्यूह का भव्य माध्य है। b मानों के लिए अंकन समान है। (केंद्रित दूरियों (Aj, k) और (Bj,k) के आव्यूहों में सभी पंक्तियों और सभी स्तंभों का योग शून्य होता है।) वर्गित दृष्टांत दूरी सहप्रसरण (एक अदिश राशि) केवल गुणनों Aj, k Bj, k: का अंकगणितीय औसत है:

सांख्यिकीय Tn = n dCov2n(X, Y) यादृच्छिकआयामों में यादृच्छिक सदिश की स्वतंत्रता का सुसंगत बहुभिन्नरूपी परीक्षण निर्धारित करता है। कार्यान्वयन के लिए R के लिए ऊर्जा पैकेज में dcov.test फ़ंक्शन देखें।[4]

दूरी सहप्रसरण के जनसंख्या मान को उसी तर्ज पर परिभाषित किया जा सकता है। मान X यादृच्छिक चर है जो संभाव्यता वितरण μ के साथ p-आयामी यूक्लिडियन स्थान में मान लेता है और Y को एक यादृच्छिक चर होने देता है जो एक q-आयामी यूक्लिडियन स्थान में मान लेता है संभाव्यता वितरण ν के साथ, और मान लीजिए कि X और Y की सीमित अपेक्षाएँ हैं। लिखें

अंत में, X और Y के वर्ग दूरी सहप्रसरण के जनसंख्या मान को इस प्रकार परिभाषित करें

कोई दिखा सकता है कि यह निम्नलिखित परिभाषा के बराबर है:

जहां E अपेक्षित मान दर्शाता है, और और स्वतंत्र और समान रूप से वितरित हैं। प्राथमिक यादृच्छिक चर और निरूपित चर की स्वतंत्र और समान रूप से वितरित (iid) प्रतियां और और इसी तरह iid हैं।[5] दूरी सहप्रसरण को पारम्परिक पियर्सन सहप्रसरण के संदर्भ में व्यक्त किया जा सकता है, सीओवी, इस प्रकार है:

यह पहचान दर्शाती है कि दूरी सहप्रसरण दूरियों के सहप्रसरण के समान नहीं है, cov(||XX' ||, ||YY' ||)। यह शून्य हो सकता है भले ही X और Y स्वतंत्र न हों।

वैकल्पिक रूप से, दूरी सहप्रसरण को यादृच्छिक चर के संयुक्त विशेषता फ़ंक्शन और उनके सीमांत विशिष्ट कार्यों के गुणन के बीच दूरी के भारित l2 मानक के रूप में परिभाषित किया जा सकता है:[6]

जहां और क्रमशः (X, Y), X और Y के विशिष्ट फलन हैं, p, q, X और Y के यूक्लिडियन आयाम को दर्शाते हैं, और इस प्रकार s और t,और cp, cq स्थिरांक हैं। भार फलन एक पैमाने पर समतुल्य और घूर्णन अपरिवर्तनीय माप का गुणनन करने के लिए चुना जाता है जो निर्भर चर के लिए शून्य पर नहीं जाता है।[6][7] अभिलाक्षणिक फलन परिभाषा की एक व्याख्या यह है कि चर eisX और eitY द्वारा दी गई विभिन्न अवधियों के साथ X और Y का चक्रीय निरूपण है, और व्यंजक ϕX, Y(s, t) − ϕX(s) ϕY(t) विशेषता फ़ंक्शन के अंश में दूरी सहप्रसरण की परिभाषा केवल eisX और eitY वर्गीय सहसंयोजक है। विशेषता फ़ंक्शन परिभाषा स्पष्ट रूप से दिखाती है कि dCov2(X, Y) = 0 यदि और केवल X और Y स्वतंत्र हैं।

दूरी विचरण और दूरी मानक विस्थापन

दूरी विचरण दूरी के सहसंयोजक का विशेष स्तिथि है जब दो चर समान होते हैं। दूरी विचरण का जनसंख्या मूल्य वर्गमूल है

जहाँ , , और स्वतंत्र और समान रूप से वितरित यादृच्छिक चर हैं, अपेक्षित मूल्य को दर्शाता है, और फलन के लिए , जैसे,

दृष्टांत दूरी प्रसरण का वर्गमूल है

जो 1912 में प्रारम्भ किए गए कोराडो गिन्नी के औसत अंतर का संबंध है ( लेकिन गिन्नी केंद्रित दूरी ) के साथ काम नहीं करती थी।[8]

दूरी मानक विचलन दूरी विचरण का वर्गमूल है।

दूरी सहसंबंध

दो यादृच्छिक चर के दूरी सहसंबंध[2] उनकी दूरी मानक विचलन के गुणन द्वारा उनकी दूरी के सहसंयोजक को विभाजित करके प्राप्त किया जाता है। दूरी सहसंबंध वर्गमूल है।

और दृष्टांत दूरी सहसंबंध को उपरोक्त जनसंख्या गुणांक के लिए दृष्टांत दूरी सहप्रसरण और दूरी प्रसरण को प्रतिस्थापित करके परिभाषित किया गया है।

दृष्टांत दूरी सहसंबंध की आसान गणना के लिए R के लिए ऊर्जा पैकेज में डीसीओआर फलन देखें।[4]

गुण

दूरी सहसंबंध

  1. and ; यह पियर्सन के सहसंबंध के विपरीत है, जो ऋणात्मक हो सकता है।
  2. यदि और केवल यदि X और Y स्वतंत्र हैं।
  3. तात्पर्य है कि रैखिक उप-स्थानों के आयामों द्वारा प्रायोजित X और Y नमूने क्रमशः लगभग निश्चित रूप से समान हैं और यदि हम मानते हैं कि ये उप-स्थान समान हैं, तो इस उप-स्थान में f या कुछ सदिश A, अदिश b, और ऑर्थोनॉर्मल मैट्रिक्स

दूरी सहप्रसरण

  1. और ;
  2. सभी स्थिर सदिशों के लिए , अदिश , और ऑर्थोनॉर्मल मैट्रिक्स.
  3. यदि यादृच्छिक सदिश and फिर स्वतंत्र हैं
    समानता यदि और केवल यदि ही मान्य है and दोनों स्थिरांक हैं, या और दोनों स्थिरांक हैं, या पारस्परिक रूप से स्वतंत्र हैं।
  4. यदि और केवल यदि X और Y स्वतन्त्र हैं।

यह अंतिम गुण केंद्रित दूरियों के साथ काम करने का सबसे महत्वपूर्ण प्रभाव है।

सांख्यिकी का पक्षपाती अनुमानक है X और Y की स्वतंत्रता के अंतर्गत है। [9]

का एक निष्पक्ष अनुमानक शेकेली और रिज़ो द्वारा दिया गया है।[10]

दूरी विचरण

  1. यदि और केवल यदि लगभग निश्चित रूप से।
  2. यदि और केवल यदि प्रत्येक दृष्टांत अवलोकन समान है।
  3. सभी स्थिर सदिशों के लिए A, scalars b, और ऑर्थोनॉर्मल मैट्रिक्स .
  4. If X और Y फिर स्वतंत्र हैं .

समानता (iv) में होती है यदि और केवल यदि यादृच्छिक चर में से एक X या Y स्थिरांक है।

सामान्यीकरण

यूक्लिडियन दूरी की शक्तियों को सम्मिलित करने के लिए दूरी सहप्रसरण को सामान्यीकृत किया जा सकता है।

फिर प्रत्येक के लिए , और स्वतंत्र हैं अगर और केवल अगर । यह ध्यान रखना महत्वपूर्ण है कि यह लक्षण वर्णन प्रतिपादक के लिए नहीं है ; इस स्तिथि में द्विचर के लिए , पियर्सन सहसंबंध का एक नियतात्मक कार्य है।[2] अगर और हैं संबंधित दूरियों की शक्तियां, , तब दृष्टांत दूरी सहप्रसरण को ऋणात्मक संख्या के रूप में परिभाषित किया जा सकता है।

कोई विस्तार कर सकता है मीट्रिक स्थान के लिए | मेट्रिक-स्पेस-वैल्यू यादृच्छिक चर और : अगर कानून है मीट्रिक के साथ एक मीट्रिक स्थान में , फिर परिभाषित करें , , और (प्रदान किया गया परिमित है, अर्थात्, पहला क्षण परिमित है), . तो अगर कानून है (परिमित पहले क्षण के साथ संभावित रूप से भिन्न मीट्रिक स्थान में), परिभाषित करें

यह ऐसे सभी के लिए ऋणात्मक है यदि दोनों मीट्रिक रिक्त स्थान ऋणात्मक प्रकार के होते हैं।[11] यहां, एक मीट्रिक स्थान यदि ऋणात्मक प्रकार है हिल्बर्ट स्पेस के एक सबसेट के लिए आइसोमेट्री है।[12] अगर दोनों मेट्रिक स्पेस में स्ट्रॉन्ग नेगेटिव टाइप है, तो आईएफएफ स्वतंत्र हैं।[11]

दूरी सहप्रसरण की वैकल्पिक परिभाषा

मूल दूरी सहसंबंध दूरी सहप्रसरण को के वर्गमूल के रूप में परिभाषित किया गया है। , वर्ग गुणांक के बल्कि संयुक्त वितरण के बीच ऊर्जा की दूरी है और इसके अंतर का गुणन है। इस परिभाषा के तहत, हालांकि, दूरी मानक विचलन के बजाय दूरी भिन्नता को उसी इकाइयों में मापा जाता है।

वैकल्पिक रूप से, ऊर्जा दूरी के वर्ग के रूप में 'दूरी सहप्रसरण' को परिभाषित किया जा सकता है: इस स्तिथि में, की दूरी मानक विचलन के समान इकाइयों में मापा जाता है दूरी, और जनसंख्या दूरी सहप्रसरण के लिए एक निष्पक्ष अनुमानक उपस्थित है।[10]

इन वैकल्पिक परिभाषाओं के अंतर्गत, दूरी सहसंबंध को वर्ग के रूप में भी परिभाषित किया गया है।

वैकल्पिक सूत्रीकरण: ब्राउनियन सहप्रसरण

ब्राउनियन कोवैरियंस स्टोचैस्टिक प्रक्रियाओं के लिए कॉन्वर्सिस की धारणा के सामान्यीकरण से प्रेरित है। यादृच्छिक चर X और Y के सहप्रसरण के वर्ग को निम्न रूप में लिखा जा सकता है:

जहां E अपेक्षित मूल्य को दर्शाता है और अभाज्य स्वतंत्र और समान रूप से वितरित प्रतियों को दर्शाता है। हमें इस सूत्र के निम्नलिखित सामान्यीकरण की आवश्यकता है। यदि U(s),V(t) मनमानी यादृच्छिक प्रक्रियाएं हैं जो सभी वास्तविक s और t के लिए परिभाषित हैं तो X के U-केंद्रित संस्करण को परिभाषित करें

जब भी घटाया सशर्त अपेक्षित मान विद्यमान हो और Y द्वारा निरूपित होता हैV Y का V-केंद्रित संस्करण।[3][13][14] (u, v) सहप्रसरण (X, Y) को ऋणात्मक संख्या के रूप में परिभाषित किया गया है जिसका वर्ग है:

जब भी दाहिने हाथ की तरफ नॉनगेटिव और परिमित हो। सबसे महत्वपूर्ण उदाहरण है जब यू और वी दो तरफा स्वतंत्र ब्राउनियन गति / हैं /अपेक्षा शून्य और सहसंयोजक के साथ वीनर प्रक्रिया |s| + |t| − |st| = 2 min(s,t) ( केवल ऋणात्मक s के लिए, t. ( यह मानक वीनर प्रक्रिया के सहसंयोजक से दोगुना है; यहाँ कारक 2 संगणना को सरल करता है।) इस स्तिथि में ( U, V ) सहसंयोजक को ब्राउनियन सहसंयोजक कहा जाता है और इसके द्वारा निरूपित किया जाता है।

एक आश्चर्यजनक संयोग है: ब्राउनियन सहप्रसरण दूरी सहप्रसरण के समान है:

और इस प्रकार ब्राउनियन सहसंबंध दूरी सहसंबंध के समान है।

दूसरी ओर, यदि हम ब्राउनियन गति को नियतात्मक पहचान फलन आईडी से प्रतिस्थापित करते हैं तो Covid(X,Y) चिरसम्मत पियर्सन सहप्रसरण का केवल निरपेक्ष मान है:

संबंधित आव्यूह

कर्नेल-आधारित सहसंबंधी आव्यूह (जैसे हिल्बर्ट-श्मिट इंडिपेंडेंस मानदंड या एचएसआईसी) सहित अन्य सहसंबंधी मीट्रिक भी रैखिक और nonlinear इंटरैक्शन का पता लगा सकते हैं। दूरी सहसंबंध और कर्नेल-आधारित मेट्रिक्स दोनों का उपयोग विहित सांख्यिकीय विश्लेषण और स्वतंत्र घटक विश्लेषण जैसे तरीकों से किया जा सकता है ताकि स्थिर सांख्यिकीय शक्ति प्राप्त की सकती है।

यह भी देखें

  • आरवी गुणांक
  • संबंधित तृतीय-क्रम आँकड़ों के लिए, दूरी विषमता देखें।

टिप्पणियाँ


संदर्भ


बाहरी संबंध