भारित न्यूनतम वर्ग: Difference between revisions
No edit summary |
No edit summary |
||
Line 52: | Line 52: | ||
==समाधान== | ==समाधान== | ||
=== | ===मापदंड त्रुटियां और सहसंबंध=== | ||
अनुमानित | अनुमानित मापदंड मान प्रेक्षित मानों के रैखिक संयोजन हैं: | ||
<math display="block">\hat{\boldsymbol{\beta}} = (X^\textsf{T} W X)^{-1} X^\textsf{T} W \mathbf{y}. </math> | <math display="block">\hat{\boldsymbol{\beta}} = (X^\textsf{T} W X)^{-1} X^\textsf{T} W \mathbf{y}. </math> | ||
इसलिए | इसलिए मापदंड अनुमानों के अनुमानित विचरण-सहप्रसरण आव्युह के रूप मे अभिव्यक्ति टिप्पणियों में त्रुटियों से [[त्रुटि प्रसार]] के माध्यम से प्राप्त की जा सकती है। मान लें कि प्रेक्षणों के रूप मे प्रसरण-सहप्रसरण आव्युह को M के माध्यम से और अनुमानित मापदंडों को M<sup>β</sup> के माध्यम से निरूपित किया जाता है। | ||
तब | तब | ||
Line 70: | Line 70: | ||
प्रत्येक, <math>\nu = n - m</math>, [[स्वतंत्रता की डिग्री (सांख्यिकी)|स्वतंत्रता की उपाधि (सांख्यिकी)]] की संख्या है, सहसंबंधित टिप्पणियों के स्थितिे में सामान्यीकरण के रूप मे स्वतंत्रता (सांख्यिकी) की प्रभावी उपाधि देखें। | प्रत्येक, <math>\nu = n - m</math>, [[स्वतंत्रता की डिग्री (सांख्यिकी)|स्वतंत्रता की उपाधि (सांख्यिकी)]] की संख्या है, सहसंबंधित टिप्पणियों के स्थितिे में सामान्यीकरण के रूप मे स्वतंत्रता (सांख्यिकी) की प्रभावी उपाधि देखें। | ||
समस्त स्थितियों में, | समस्त स्थितियों में, मापदंड अनुमान <math>\hat\beta_i</math> का विचरण <math>M^\beta_{ii}</math> के माध्यम से प्रस्तुत गया है और मापदंड अनुमान <math>\hat\beta_i</math> और <math>\hat\beta_j</math> के मध्य [[सहप्रसरण]] <math>M^\beta_{ij}</math> के माध्यम से प्रस्तुत गया है। | ||
[[मानक विचलन]] विचरण <math>\sigma_i = \sqrt{M^\beta_{ii}}</math> का वर्गमूल है, और सहसंबंध गुणांक <math>\rho_{ij} = M^\beta_{ij}/(\sigma_i \sigma_j)</math> के माध्यम से प्रस्तुत गया है। ये त्रुटि अनुमान माप में मात्र यादृच्छिक त्रुटियों को दर्शाते हैं। मापदंडों में वास्तविक अनिश्चितता व्यवस्थित त्रुटियों की उपस्थिति के कारण दीर्घतर है, जिसे परिभाषा के अनुसार निर्धारित नहीं किया जा सकता है। ध्यान दें कि तथापि अवलोकन असंबंधित हो सकते हैं, | [[मानक विचलन]] विचरण <math>\sigma_i = \sqrt{M^\beta_{ii}}</math> का वर्गमूल है, और सहसंबंध गुणांक <math>\rho_{ij} = M^\beta_{ij}/(\sigma_i \sigma_j)</math> के माध्यम से प्रस्तुत गया है। ये त्रुटि अनुमान माप में मात्र यादृच्छिक त्रुटियों को दर्शाते हैं। मापदंडों में वास्तविक अनिश्चितता व्यवस्थित त्रुटियों की उपस्थिति के कारण दीर्घतर है, जिसे परिभाषा के अनुसार निर्धारित नहीं किया जा सकता है। ध्यान दें कि तथापि अवलोकन असंबंधित हो सकते हैं, मापदंड सामान्यतः [[पियर्सन उत्पाद-क्षण सहसंबंध गुणांक|पियर्सन परिणाम महत्व सहसंबंध गुणांक(पीपीएमसीसी)]] होते हैं। | ||
=== | ===मापदंड विश्वास्यता सीमाएँ=== | ||
{{Main article| विश्वास्यता अंतराल}} | {{Main article| विश्वास्यता अंतराल}} | ||
यह अधिकांशतः किसी ठोस प्रमाण के अभाव में, किन्तु अधिकांशतः [[केंद्रीय सीमा प्रमेय]] के लिए स्वीकृत माना जाता है। [[सामान्य वितरण]] वृत्तांत और अनुप्रयोग देखें - कि प्रत्येक अवलोकन पर त्रुटि शून्य और मानक विचलन <math>\sigma</math> के मध्य सामान्य वितरण से संबंधित है। उस धारणा के अनुसार एकल अदिष्ट | यह अधिकांशतः किसी ठोस प्रमाण के अभाव में, किन्तु अधिकांशतः [[केंद्रीय सीमा प्रमेय]] के लिए स्वीकृत माना जाता है। [[सामान्य वितरण]] वृत्तांत और अनुप्रयोग देखें - कि प्रत्येक अवलोकन पर त्रुटि शून्य और मानक विचलन <math>\sigma</math> के मध्य सामान्य वितरण से संबंधित है। उस धारणा के अनुसार एकल अदिष्ट मापदंड अनुमान के लिए इसकी अनुमानित मानक त्रुटि <math>se_{\beta}</math> (सामान्य न्यूनतम वर्ग) के संदर्भ में निम्नलिखित संभावनाएं प्राप्त की जा सकती हैं: | ||
* 68% कि अंतराल <math>\hat\beta \pm se_\beta</math> वास्तविक गुणांक मान को समाहित करता है। | * 68% कि अंतराल <math>\hat\beta \pm se_\beta</math> वास्तविक गुणांक मान को समाहित करता है। | ||
* 95% कि अंतराल <math>\hat\beta \pm 2se_\beta</math> वास्तविक गुणांक मान को समाहित करता है। | * 95% कि अंतराल <math>\hat\beta \pm 2se_\beta</math> वास्तविक गुणांक मान को समाहित करता है। | ||
* 99% कि अंतराल <math>\hat\beta \pm 2.5se_\beta</math> वास्तविक गुणांक मान को समाहित करता है। | * 99% कि अंतराल <math>\hat\beta \pm 2.5se_\beta</math> वास्तविक गुणांक मान को समाहित करता है। | ||
जब n >> m हो तब यह धारणा अनुचित नहीं है। यदि प्रयोगात्मक त्रुटियों को सामान्य रूप से वितरित किया जाता है, तब | जब n >> m हो तब यह धारणा अनुचित नहीं है। यदि प्रयोगात्मक त्रुटियों को सामान्य रूप से वितरित किया जाता है, तब मापदंड n-m उपाधि की स्वतंत्रता (सांख्यिकी) के साथ एक विद्यार्थी के टी-वितरण से संबंधित होंगे। जब n ≫ m विद्यार्थी का टी-वितरण सामान्य वितरण का अनुमान लगाता है। चूंकि ध्यान दें कि ये विश्वास्यता सीमाएँ व्यवस्थित त्रुटि को ध्यान में नहीं रख सकती हैं। साथ ही, मापदंड त्रुटियों को मात्र महत्वपूर्ण अंक तक उद्धृत किया जाना चाहिए, क्योंकि वे [[नमूनाकरण त्रुटि]] के अधीन हैं।<ref>{{cite book |title=प्रायोगिक डेटा का सांख्यिकीय विश्लेषण|last=Mandel |first=John |year=1964 |publisher=Interscience |location=New York }}</ref> | ||
जब अवलोकनों की संख्या अपेक्षाकृत कम होती है, तब प्रायोगिक त्रुटियों के वितरण के विषय में किसी भी धारणा का ध्यान दिए बिना, चेबीचेव की असमानता का उपयोग संभावनाओं की उच्चतर परिबंध के लिए किया जा सकता है। अधिकतम संभावनाएँ कि | जब अवलोकनों की संख्या अपेक्षाकृत कम होती है, तब प्रायोगिक त्रुटियों के वितरण के विषय में किसी भी धारणा का ध्यान दिए बिना, चेबीचेव की असमानता का उपयोग संभावनाओं की उच्चतर परिबंध के लिए किया जा सकता है। अधिकतम संभावनाएँ कि मापदंड 1, 2, या 3 मानक विचलन से अधिक होगा इसकी अपेक्षा से दूर मान क्रमशः 100%, 25% और 11% हैं। | ||
=== अवशिष्ट मान और सहसंबंध === | === अवशिष्ट मान और सहसंबंध === |
Revision as of 15:36, 27 July 2023
एक श्रृंखला का हिस्सा |
प्रतिगमन विश्लेषण |
---|
मॉडल |
अनुमान |
पार्श्वभूमि |
|
भारित न्यूनतम वर्ग (डब्ल्यूएलएस), जिसे भारित रैखिक प्रतिगमन के रूप में भी जाना जाता है,[1][2] सामान्य न्यूनतम वर्गों और रैखिक प्रतिगमन का सामान्यीकरण है, जिसमें अवलोकनों के असमान विचरण (विषमलैंगिकता) का ज्ञान प्रतिगमन में सम्मिलित किया जाता है। डब्लूएलएस भी सामान्यीकृत न्यूनतम वर्ग की विशेषज्ञता है, जब त्रुटियों के सहप्रसरण आव्युह की समस्त संवृत विकर्ण प्रविष्टियां शून्य होती हैं।
सूत्रीकरण
किसी डेटा बिंदु पर आदर्श की उपयुक्त को उसके अवशिष्ट , के माध्यम से मापा जाता है, जिसे आश्रित चर के मापीय मान , और आदर्श के माध्यम से अनुमानित मान, : के मध्य अंतर के रूप में परिभाषित किया गया है।
गॉस-मार्कोव प्रमेय से पता चलता है कि, जब ऐसा होता है तब सर्वोत्तम रैखिक निष्पक्ष अनुमानक (सर्वोत्तम लीनियर निष्पक्ष अनुमानक) है।चूंकि यदि माप असंबंधित हैं। किन्तु अलग-अलग अनिश्चितताएँ हैं, तब एक संशोधित दृष्टिकोण ग्रहण किया जा सकता है। अलेक्जेंडर ऐटकेन ने दिखाया कि जब वर्ग अवशिष्टों का भारित योग न्यूनतम किया जाता है, तब 1 नीला होता है यदि प्रत्येक वजन माप के विचरण के व्युत्क्रम के अनुरूप होता है,
जब अवलोकन संबंधी त्रुटियां असंबंधित होती हैं, और भार आव्युह, W=Ω−1, विकर्ण होता है, तब इन्हें इस प्रकार लिखा जा सकता है:
जिस स्थान पर हम निम्नलिखित चिह्नित आव्युह और सदिश को परिभाषित करते हैं:
अ-रेखीय न्यूनतम वर्ग प्रणालियों के रूप मे एक समान तर्क से ज्ञात होता है, कि सामान्य समीकरणों को निम्नानुसार संशोधित किया जाना चाहिए।
यदि अवलोकनों की अनिश्चितता बाह्य स्रोतबं से ज्ञात नहीं है, तब दिए गए अवलोकनों से भार का अनुमान लगाया जा सकता है। उदाहरण के रूप मे बाह्य प्रभाव की अभिज्ञान करने के रूप मे यह उपयोगी हो सकता है। डेटा समुच्चय से बाह्य प्रभाव निष्काषित कर जाने के पश्चात् भार को एक पर पुनः स्थापित किया जाना चाहिए।[3]
प्रेरणा
कुछ स्थितियों में टिप्पणियों को महत्व प्रस्तुत जा सकता है - उदाहरण के रूप मे , वे समान रूप से विश्वसनीय नहीं हो सकते हैं। इस स्थितिे में, कोई भी वर्गों के भारित योग को कम कर सकता है:
आदर्श रूप से, भार माप के विचरण के गुणात्मक व्युत्क्रम के समकक्ष होना चाहिए। (इसका तात्पर्य यह है कि अवलोकन असंबद्ध हैं। यदि अवलोकन सहसंबद्ध हैं, तब अभिव्यक्ति प्रयुक्त होता है। इस स्थितिे में भार आव्युह आदर्श रूप से अवलोकनों के विचरण-सहप्रसरण आव्युह के व्युत्क्रम के समकक्ष होना चाहिए)।[3]
सामान्य समीकरण तब हैं:
समाधान
मापदंड त्रुटियां और सहसंबंध
अनुमानित मापदंड मान प्रेक्षित मानों के रैखिक संयोजन हैं:
तब
समस्त स्थितियों में, मापदंड अनुमान का विचरण के माध्यम से प्रस्तुत गया है और मापदंड अनुमान और के मध्य सहप्रसरण के माध्यम से प्रस्तुत गया है।
मानक विचलन विचरण का वर्गमूल है, और सहसंबंध गुणांक के माध्यम से प्रस्तुत गया है। ये त्रुटि अनुमान माप में मात्र यादृच्छिक त्रुटियों को दर्शाते हैं। मापदंडों में वास्तविक अनिश्चितता व्यवस्थित त्रुटियों की उपस्थिति के कारण दीर्घतर है, जिसे परिभाषा के अनुसार निर्धारित नहीं किया जा सकता है। ध्यान दें कि तथापि अवलोकन असंबंधित हो सकते हैं, मापदंड सामान्यतः पियर्सन परिणाम महत्व सहसंबंध गुणांक(पीपीएमसीसी) होते हैं।
मापदंड विश्वास्यता सीमाएँ
यह अधिकांशतः किसी ठोस प्रमाण के अभाव में, किन्तु अधिकांशतः केंद्रीय सीमा प्रमेय के लिए स्वीकृत माना जाता है। सामान्य वितरण वृत्तांत और अनुप्रयोग देखें - कि प्रत्येक अवलोकन पर त्रुटि शून्य और मानक विचलन के मध्य सामान्य वितरण से संबंधित है। उस धारणा के अनुसार एकल अदिष्ट मापदंड अनुमान के लिए इसकी अनुमानित मानक त्रुटि (सामान्य न्यूनतम वर्ग) के संदर्भ में निम्नलिखित संभावनाएं प्राप्त की जा सकती हैं:
- 68% कि अंतराल वास्तविक गुणांक मान को समाहित करता है।
- 95% कि अंतराल वास्तविक गुणांक मान को समाहित करता है।
- 99% कि अंतराल वास्तविक गुणांक मान को समाहित करता है।
जब n >> m हो तब यह धारणा अनुचित नहीं है। यदि प्रयोगात्मक त्रुटियों को सामान्य रूप से वितरित किया जाता है, तब मापदंड n-m उपाधि की स्वतंत्रता (सांख्यिकी) के साथ एक विद्यार्थी के टी-वितरण से संबंधित होंगे। जब n ≫ m विद्यार्थी का टी-वितरण सामान्य वितरण का अनुमान लगाता है। चूंकि ध्यान दें कि ये विश्वास्यता सीमाएँ व्यवस्थित त्रुटि को ध्यान में नहीं रख सकती हैं। साथ ही, मापदंड त्रुटियों को मात्र महत्वपूर्ण अंक तक उद्धृत किया जाना चाहिए, क्योंकि वे नमूनाकरण त्रुटि के अधीन हैं।[4]
जब अवलोकनों की संख्या अपेक्षाकृत कम होती है, तब प्रायोगिक त्रुटियों के वितरण के विषय में किसी भी धारणा का ध्यान दिए बिना, चेबीचेव की असमानता का उपयोग संभावनाओं की उच्चतर परिबंध के लिए किया जा सकता है। अधिकतम संभावनाएँ कि मापदंड 1, 2, या 3 मानक विचलन से अधिक होगा इसकी अपेक्षा से दूर मान क्रमशः 100%, 25% और 11% हैं।
अवशिष्ट मान और सहसंबंध
सांख्यिकी में त्रुटियाँ एवं अवशिष्ट किसके के माध्यम से किये गये प्रेक्षणों से सम्बन्धित हैं:
जब ,
यदि प्रयोगात्मक त्रुटि सामान्य वितरण का अनुसरण करती है, तब, अवशिष्टों और अवलोकनों के मध्य रैखिक संबंध के कारण, अवशिष्टों को भी ऐसा ही होना चाहिए,[5] किन्तु चूँकि अवलोकन समस्त संभावित अवलोकनों की जनसंख्या का एक नमूना मात्र हैं, इसलिए अवशिष्ट एक विद्यार्थी के टी-वितरण से संबंधित होने चाहिए। जब कोई विशेष अवशिष्ट अत्यधिक उच्चतर प्रतीत होता है, तब विद्यार्थीकृत अवशिष्ट किसी बाह्य के रूप मे सांख्यिकीय परीक्षण करने में उपयोगी होते हैं।
यह भी देखें
- न्यूनतम वर्गों को पुनरावृत्त रूप से पुनः भारित किया गया
- विषमलैंगिकता-संगत मानक त्रुटियाँ
- भारित माध्य
संदर्भ
- ↑ "Weighted regression".
- ↑ "Visualize a weighted regression".
- ↑ 3.0 3.1 Strutz, T. (2016). "3". डेटा फिटिंग और अनिश्चितता (भारित न्यूनतम वर्ग और उससे आगे का व्यावहारिक परिचय). Springer Vieweg. ISBN 978-3-658-11455-8.
- ↑ Mandel, John (1964). प्रायोगिक डेटा का सांख्यिकीय विश्लेषण. New York: Interscience.
- ↑ Mardia, K. V.; Kent, J. T.; Bibby, J. M. (1979). बहुभिन्नरूपी विश्लेषण. New York: Academic Press. ISBN 0-12-471250-9.