भारित न्यूनतम वर्ग (डब्ल्यूएलएस), जिसे भारित रैखिक प्रतिगमन के रूप में भी जाना जाता है,[1][2] सामान्य न्यूनतम वर्गों और रैखिक प्रतिगमन का सामान्यीकरण है, जिसमें अवलोकनों के असमान विचरण (विषमलैंगिकता) का ज्ञान प्रतिगमन में सम्मिलित किया जाता है। डब्लूएलएस भी सामान्यीकृत न्यूनतम वर्ग की विशेषज्ञता है, जब त्रुटियों के सहप्रसरण आव्युह की समस्त संवृत विकर्ण प्रविष्टियां शून्य होती हैं।
सूत्रीकरण
किसी डेटा बिंदु पर आदर्श की उपयुक्त को उसके अवशिष्ट
, के माध्यम से मापा जाता है, जिसे आश्रित चर के मापीय मान ,
और आदर्श के माध्यम से अनुमानित मान,
: के मध्य अंतर के रूप में परिभाषित किया गया है।
![{\displaystyle r_{i}({\boldsymbol {\beta }})=y_{i}-f(x_{i},{\boldsymbol {\beta }}).}](/index.php?title=Special:MathShowImage&hash=1c71640e981a617ccc3cb76add60b88f&mode=mathml)
यदि त्रुटियाँ असंबंधित हैं और उनमें समान भिन्नता है, तब फलन
![{\displaystyle S({\boldsymbol {\beta }})=\sum _{i}r_{i}({\boldsymbol {\beta }})^{2},}](/index.php?title=Special:MathShowImage&hash=91c2d694fe7bba778a57bb8a2c5244cb&mode=mathml)
![{\displaystyle {\boldsymbol {\hat {\beta }}}}](/index.php?title=Special:MathShowImage&hash=df1c2d60f563d80d717b4713acfea4d9&mode=mathml)
पर इस प्रकार न्यूनतम किया जाता है कि
![{\displaystyle {\frac {\partial S}{\partial \beta _{j}}}({\hat {\boldsymbol {\beta }}})=0}](/index.php?title=Special:MathShowImage&hash=60be61f8ea87165b1fe759a575512eb3&mode=mathml)
है।
गॉस-मार्कोव प्रमेय से पता चलता है कि, जब ऐसा होता है तब
सर्वोत्तम रैखिक निष्पक्ष अनुमानक (सर्वोत्तम लीनियर निष्पक्ष अनुमानक) है।चूंकि यदि माप असंबंधित हैं। किन्तु अलग-अलग अनिश्चितताएँ हैं, तब एक संशोधित दृष्टिकोण ग्रहण किया जा सकता है। अलेक्जेंडर ऐटकेन ने दिखाया कि जब वर्ग अवशिष्टों का भारित योग न्यूनतम किया जाता है, तब 1 नीला होता है यदि प्रत्येक वजन माप के विचरण के व्युत्क्रम के अनुरूप होता है,
![{\displaystyle {\begin{aligned}S&=\sum _{i=1}^{n}W_{ii}{r_{i}}^{2},&W_{ii}&={\frac {1}{{\sigma _{i}}^{2}}}\end{aligned}}}](/index.php?title=Special:MathShowImage&hash=c9ccf74f819f0929d80d0ef513f48000&mode=mathml)
वर्गों के इस योग के रूप मे क्रमिक समीकरण हैं
![{\displaystyle -2\sum _{i}W_{ii}{\frac {\partial f(x_{i},{\boldsymbol {\beta }})}{\partial \beta _{j}}}r_{i}=0,\quad j=1,\ldots ,m}](/index.php?title=Special:MathShowImage&hash=dcd32006c19c80f220d2a55c0f2ef81c&mode=mathml)
जो एक रैखिक न्यूनतम वर्ग प्रणाली में संशोधित सामान्य समीकरण देते हैं:
![{\displaystyle \sum _{i=1}^{n}\sum _{k=1}^{m}X_{ij}W_{ii}X_{ik}{\hat {\beta }}_{k}=\sum _{i=1}^{n}X_{ij}W_{ii}y_{i},\quad j=1,\ldots ,m\,.}](/index.php?title=Special:MathShowImage&hash=63b59b6169b052aba9fd22f930591afc&mode=mathml)
जब अवलोकन संबंधी त्रुटियां असंबंधित होती हैं, और भार आव्युह, W=Ω−1, विकर्ण होता है, तब इन्हें इस प्रकार लिखा जा सकता है:
![{\displaystyle \mathbf {\left(X^{\textsf {T}}WX\right){\hat {\boldsymbol {\beta }}}=X^{\textsf {T}}Wy} .}](/index.php?title=Special:MathShowImage&hash=0a96a684262a3e52e7e1ce243f879e31&mode=mathml)
यदि त्रुटियों को सहसंबद्ध किया जाता है, तब परिणामी अनुमानक नीला होता है यदि भार आव्युह अवलोकनों के
विचरण-सहप्रसरण आव्युह के व्युत्क्रम के सामान्य है। जब त्रुटियां असंबंधित होती हैं, तब भार आव्युह को
![{\displaystyle w_{ii}={\sqrt {W_{ii}}}}](/index.php?title=Special:MathShowImage&hash=a7118b368a51081edc7ac61d08a942f0&mode=mathml)
. के रूप में कारक करने के रूप मे गणना को सहज बनाना सुविधाजनक होता है। तत्पश्चात सामान्य समीकरणों को सामान्य न्यूनतम वर्गों के समान रूप में लिखा जा सकता है:
![{\displaystyle \mathbf {\left(X'^{\textsf {T}}X'\right){\hat {\boldsymbol {\beta }}}=X'^{\textsf {T}}y'} \,}](/index.php?title=Special:MathShowImage&hash=86bfa936293114a4ed6a9c50508ffa03&mode=mathml)
जिस स्थान पर हम निम्नलिखित चिह्नित आव्युह और सदिश को परिभाषित करते हैं:
![{\displaystyle {\begin{aligned}\mathbf {X'} &=\operatorname {diag} \left(\mathbf {w} \right)\mathbf {X} ,\\\mathbf {y'} &=\operatorname {diag} \left(\mathbf {w} \right)\mathbf {y} =\mathbf {y} \oslash \mathbf {\sigma } .\end{aligned}}}](/index.php?title=Special:MathShowImage&hash=9ec22dd4984e7162454dc16679925b42&mode=mathml)
यह एक प्रकार का श्वेतक परिवर्तन है; अंतिम अभिव्यक्ति में
प्रविष्टि सतर्कता विभाजन सम्मिलित है।
अ-रेखीय न्यूनतम वर्ग प्रणालियों के रूप मे एक समान तर्क से ज्ञात होता है, कि सामान्य समीकरणों को निम्नानुसार संशोधित किया जाना चाहिए।
![{\displaystyle \mathbf {\left(J^{\textsf {T}}WJ\right)\,{\boldsymbol {\Delta }}\beta =J^{\textsf {T}}W\,{\boldsymbol {\Delta }}y} .\,}](/index.php?title=Special:MathShowImage&hash=a07b387bd9c4f0fdc5ea8a2928a37e67&mode=mathml)
ध्यान दें कि अनुभवजन्य परीक्षणों के रूप मे, उपयुक्त W निश्चित रूप से ज्ञात नहीं है, और इसका अनुमान लगाया जाना चाहिए। इसके रूप मे
व्यवहार्य सामान्यीकृत न्यूनतम वर्ग (एफजीएलएस) विधियों का उपयोग किया जा सकता है, इस स्थिति में यह विकर्ण सहप्रसरण आव्युह के रूप मे विशिष्ट है, जिससे व्यवहार्य भारित न्यूनतम वर्ग मे समाधान प्राप्त होता है।
यदि अवलोकनों की अनिश्चितता बाह्य स्रोतबं से ज्ञात नहीं है, तब दिए गए अवलोकनों से भार का अनुमान लगाया जा सकता है। उदाहरण के रूप मे बाह्य प्रभाव की अभिज्ञान करने के रूप मे यह उपयोगी हो सकता है। डेटा समुच्चय से बाह्य प्रभाव निष्काषित कर जाने के पश्चात् भार को एक पर पुनः स्थापित किया जाना चाहिए।[3]
प्रेरणा
कुछ स्थितियों में टिप्पणियों को महत्व प्रस्तुत जा सकता है - उदाहरण के रूप मे , वे समान रूप से विश्वसनीय नहीं हो सकते हैं। इस स्थितिे में, कोई भी वर्गों के भारित योग को कम कर सकता है:
![{\displaystyle {\underset {\boldsymbol {\beta }}{\operatorname {arg\ min} }}\,\sum _{i=1}^{n}w_{i}\left|y_{i}-\sum _{j=1}^{m}X_{ij}\beta _{j}\right|^{2}={\underset {\boldsymbol {\beta }}{\operatorname {arg\ min} }}\,\left\|W^{\frac {1}{2}}\left(\mathbf {y} -X{\boldsymbol {\beta }}\right)\right\|^{2}.}](/index.php?title=Special:MathShowImage&hash=62c261920dbcce1a9c8dbc48ca9be0a3&mode=mathml)
जिस स्थान पर w
i> 0 वें अवलोकन का भार है, और W ऐसे भारों का
विकर्ण आव्युह है।
आदर्श रूप से, भार माप के विचरण के गुणात्मक व्युत्क्रम के समकक्ष होना चाहिए। (इसका तात्पर्य यह है कि अवलोकन असंबद्ध हैं। यदि अवलोकन सहसंबद्ध हैं, तब अभिव्यक्ति
प्रयुक्त होता है। इस स्थितिे में भार आव्युह आदर्श रूप से अवलोकनों के विचरण-सहप्रसरण आव्युह के व्युत्क्रम के समकक्ष होना चाहिए)।[3]
सामान्य समीकरण तब हैं:
![{\displaystyle \left(X^{\textsf {T}}WX\right){\hat {\boldsymbol {\beta }}}=X^{\textsf {T}}W\mathbf {y} .}](/index.php?title=Special:MathShowImage&hash=fad962c35e67b934b5eb8eac827bdcc6&mode=mathml)
इस पद्धति का उपयोग पुनरावृत्तीय रूप से पुनर्भारित न्यूनतम वर्गों में किया जाता है।
समाधान
मापदंड त्रुटियां और सहसंबंध
अनुमानित मापदंड मान प्रेक्षित मानों के रैखिक संयोजन हैं:
![{\displaystyle {\hat {\boldsymbol {\beta }}}=(X^{\textsf {T}}WX)^{-1}X^{\textsf {T}}W\mathbf {y} .}](/index.php?title=Special:MathShowImage&hash=dfe87f3ddd943ec0e82e1ac451e1fadc&mode=mathml)
इसलिए मापदंड अनुमानों के अनुमानित विचरण-सहप्रसरण आव्युह के रूप मे अभिव्यक्ति टिप्पणियों में त्रुटियों से
त्रुटि प्रसार के माध्यम से प्राप्त की जा सकती है। मान लें कि प्रेक्षणों के रूप मे प्रसरण-सहप्रसरण आव्युह को M के माध्यम से और अनुमानित मापदंडों को M
β के माध्यम से निरूपित किया जाता है।
तब
![{\displaystyle M^{\beta }=\left(X^{\textsf {T}}WX\right)^{-1}X^{\textsf {T}}WMW^{\textsf {T}}X\left(X^{\textsf {T}}W^{\textsf {T}}X\right)^{-1}.}](/index.php?title=Special:MathShowImage&hash=e10a750dafb1344977445ff243eb90c2&mode=mathml)
जब
W = M−1, तब यह सहज हो जाता है:
![{\displaystyle M^{\beta }=\left(X^{\textsf {T}}WX\right)^{-1}.}](/index.php?title=Special:MathShowImage&hash=01f255356c59a87145a80e0226d3897b&mode=mathml)
जब इकाई भार का उपयोग किया जाता है (
W = I, अभिज्ञान आव्युह), यह निहित है कि प्रयोगात्मक त्रुटियां असंबद्ध हैं और समस्त समान हैं:
M = σ2I है, जिस स्थान पर
σ2 अवलोकन का प्राथमिक विचरण है। किसी भी स्थिति में, σ
2 का अनुमान
कम ची-वर्ग ![{\displaystyle \chi _{\nu }^{2}}](/index.php?title=Special:MathShowImage&hash=19cf9e131a73c44f4a4bcc6c6d340b9a&mode=mathml)
के माध्यम से लगाया जाता है
![{\displaystyle {\begin{aligned}M^{\beta }&=\chi _{\nu }^{2}\left(X^{\textsf {T}}WX\right)^{-1},\\\chi _{\nu }^{2}&=S/\nu ,\end{aligned}}}](/index.php?title=Special:MathShowImage&hash=af40e90ea35b0e4c8460805fba6c07ee&mode=mathml)
जिस स्थान पर S भारित उद्देश्य फलन का न्यूनतम मान है:
![{\displaystyle S=r^{\textsf {T}}Wr=\left\|W^{\frac {1}{2}}\left(\mathbf {y} -X{\hat {\boldsymbol {\beta }}}\right)\right\|^{2}.}](/index.php?title=Special:MathShowImage&hash=2b05058ced2b4f27a6a8616280cdfe50&mode=mathml)
प्रत्येक,
![{\displaystyle \nu =n-m}](/index.php?title=Special:MathShowImage&hash=5c04bdc6123a98dd5bac7427eec09004&mode=mathml)
,
स्वतंत्रता की उपाधि (सांख्यिकी) की संख्या है, सहसंबंधित टिप्पणियों के स्थितिे में सामान्यीकरण के रूप मे स्वतंत्रता (सांख्यिकी) की प्रभावी उपाधि देखें।
समस्त स्थितियों में, मापदंड अनुमान
का विचरण
के माध्यम से प्रस्तुत गया है और मापदंड अनुमान
और
के मध्य सहप्रसरण
के माध्यम से प्रस्तुत गया है।
मानक विचलन विचरण
का वर्गमूल है, और सहसंबंध गुणांक
के माध्यम से प्रस्तुत गया है। ये त्रुटि अनुमान माप में मात्र यादृच्छिक त्रुटियों को दर्शाते हैं। मापदंडों में वास्तविक अनिश्चितता व्यवस्थित त्रुटियों की उपस्थिति के कारण दीर्घतर है, जिसे परिभाषा के अनुसार निर्धारित नहीं किया जा सकता है। ध्यान दें कि तथापि अवलोकन असंबंधित हो सकते हैं, मापदंड सामान्यतः पियर्सन परिणाम महत्व सहसंबंध गुणांक(पीपीएमसीसी) होते हैं।
मापदंड विश्वास्यता सीमाएँ
यह अधिकांशतः किसी ठोस प्रमाण के अभाव में, किन्तु अधिकांशतः केंद्रीय सीमा प्रमेय के लिए स्वीकृत माना जाता है। सामान्य वितरण वृत्तांत और अनुप्रयोग देखें - कि प्रत्येक अवलोकन पर त्रुटि शून्य और मानक विचलन
के मध्य सामान्य वितरण से संबंधित है। उस धारणा के अनुसार एकल अदिष्ट मापदंड अनुमान के लिए इसकी अनुमानित मानक त्रुटि
(सामान्य न्यूनतम वर्ग) के संदर्भ में निम्नलिखित संभावनाएं प्राप्त की जा सकती हैं:
- 68% कि अंतराल
वास्तविक गुणांक मान को समाहित करता है।
- 95% कि अंतराल
वास्तविक गुणांक मान को समाहित करता है।
- 99% कि अंतराल
वास्तविक गुणांक मान को समाहित करता है।
जब n >> m हो तब यह धारणा अनुचित नहीं है। यदि प्रयोगात्मक त्रुटियों को सामान्य रूप से वितरित किया जाता है, तब मापदंड n-m उपाधि की स्वतंत्रता (सांख्यिकी) के साथ एक विद्यार्थी के टी-वितरण से संबंधित होंगे। जब n ≫ m विद्यार्थी का टी-वितरण सामान्य वितरण का अनुमान लगाता है। चूंकि ध्यान दें कि ये विश्वास्यता सीमाएँ व्यवस्थित त्रुटि को ध्यान में नहीं रख सकती हैं। साथ ही, मापदंड त्रुटियों को मात्र महत्वपूर्ण अंक तक उद्धृत किया जाना चाहिए, क्योंकि वे नमूनाकरण त्रुटि के अधीन हैं।[4]
जब अवलोकनों की संख्या अपेक्षाकृत कम होती है, तब प्रायोगिक त्रुटियों के वितरण के विषय में किसी भी धारणा का ध्यान दिए बिना, चेबीचेव की असमानता का उपयोग संभावनाओं की उच्चतर परिबंध के लिए किया जा सकता है। अधिकतम संभावनाएँ कि मापदंड 1, 2, या 3 मानक विचलन से अधिक होगा इसकी अपेक्षा से दूर मान क्रमशः 100%, 25% और 11% हैं।
अवशिष्ट मान और सहसंबंध
सांख्यिकी में त्रुटियाँ एवं अवशिष्ट किसके के माध्यम से किये गये प्रेक्षणों से सम्बन्धित हैं:
![{\displaystyle \mathbf {\hat {r}} =\mathbf {y} -X{\hat {\boldsymbol {\beta }}}=\mathbf {y} -H\mathbf {y} =(I-H)\mathbf {y} ,}](/index.php?title=Special:MathShowImage&hash=20513fed5baf854294e0bcfd94a9304d&mode=mathml)
जिस स्थान पर H
निष्क्रिय आव्युह है जिसे
हैट आव्युह के रूप में जाना जाता है:
![{\displaystyle H=X\left(X^{\textsf {T}}WX\right)^{-1}X^{\textsf {T}}W,}](/index.php?title=Special:MathShowImage&hash=93c350e0b08615173b5dfa1898249250&mode=mathml)
और I अभिज्ञान आव्युह है। अवशिष्ट M
r का प्रसरण-सहप्रसरण आव्युह के माध्यम से प्रस्तुत करा गया है:
![{\displaystyle M^{\mathbf {r} }=(I-H)M(I-H)^{\textsf {T}}.}](/index.php?title=Special:MathShowImage&hash=1ae6dad68d05b615aa91c898342cfd11&mode=mathml)
इस प्रकार अवलोकन न होने पर भी अवशिष्ट सहसंबद्ध होते हैं:
जब
,
![{\displaystyle M^{\mathbf {r} }=(I-H)M.}](/index.php?title=Special:MathShowImage&hash=73f7171d8b59e8599805f4f99e333246&mode=mathml)
जब भी आदर्श फलन में स्थिर पद होता है, तब भारित अवशिष्ट मानों का योग शून्य के समकक्ष होता है। अवशिष्टों के लिए अभिव्यक्ति को X
T W
T से बाएँ ओर से गुणा करें:
![{\displaystyle X^{\textsf {T}}W{\hat {\mathbf {r} }}=X^{\textsf {T}}W\mathbf {y} -X^{\textsf {T}}WX{\hat {\boldsymbol {\beta }}}=X^{\textsf {T}}W\mathbf {y} -\left(X^{\rm {T}}WX\right)\left(X^{\textsf {T}}WX\right)^{-1}X^{\textsf {T}}W\mathbf {y} =\mathbf {0} .}](/index.php?title=Special:MathShowImage&hash=a45d307f13cd51d92f7f0eb4690425a9&mode=mathml)
उदाहरण के रूप मे, मान लें कि आदर्श का प्रथम पद स्थिरांक है। जिससे समस्त i के लिए
![{\displaystyle X_{i1}=1}](/index.php?title=Special:MathShowImage&hash=3b16cceb62739a2fb75d24421a161faf&mode=mathml)
है। उस स्थिति में यह उसका अनुसरण करता है:
![{\displaystyle \sum _{i}^{m}X_{i1}W_{i}{\hat {r}}_{i}=\sum _{i}^{m}W_{i}{\hat {r}}_{i}=0.}](/index.php?title=Special:MathShowImage&hash=9efdb10f3652a27e4c23bc67e49af5b3&mode=mathml)
इस प्रकार, उपरोक्त प्रेरक उदाहरण में, यह तथ्य कि अवशिष्ट मानों का योग शून्य के समकक्ष है, यह आकस्मिक नहीं है, किन्तु आदर्श में स्थिर पद α की उपस्थिति का परिणाम है।
यदि प्रयोगात्मक त्रुटि सामान्य वितरण का अनुसरण करती है, तब, अवशिष्टों और अवलोकनों के मध्य रैखिक संबंध के कारण, अवशिष्टों को भी ऐसा ही होना चाहिए,[5] किन्तु चूँकि अवलोकन समस्त संभावित अवलोकनों की जनसंख्या का एक नमूना मात्र हैं, इसलिए अवशिष्ट एक विद्यार्थी के टी-वितरण से संबंधित होने चाहिए। जब कोई विशेष अवशिष्ट अत्यधिक उच्चतर प्रतीत होता है, तब विद्यार्थीकृत अवशिष्ट किसी बाह्य के रूप मे सांख्यिकीय परीक्षण करने में उपयोगी होते हैं।
यह भी देखें
संदर्भ