कुल न्यूनतम वर्ग: Difference between revisions
(Created page with "{{Regression bar}} Image:Total least squares.svg|right|thumb|200px| कुल न्यूनतम वर्गों का द्विचर (डेमिंग प्...") |
No edit summary |
||
Line 1: | Line 1: | ||
{{Regression bar}} | {{Regression bar}} | ||
[[Image:Total least squares.svg|right|thumb|200px| कुल न्यूनतम वर्गों का द्विचर (डेमिंग प्रतिगमन) | [[Image:Total least squares.svg|right|thumb|200px| कुल न्यूनतम वर्गों का द्विचर (डेमिंग प्रतिगमन) स्थिति। लाल रेखाएँ x और y दोनों में त्रुटि दिखाती है। यह पारंपरिक न्यूनतम वर्ग विधि से भिन्न है जो y अक्ष के समानांतर त्रुटि को मापता है। दिखाया गया स्थिति, लंबवत रूप से मापे गए विचलन के साथ, तब उत्पन्न होता है जब x और y में त्रुटियों में समान भिन्नताएं होती है।]]लागू आँकड़ों में, '''कुल न्यूनतम वर्ग''' एक प्रकार का [[चर-में-त्रुटि प्रतिगमन]] होता है, एक न्यूनतम वर्ग डेटा नमूने तकनीक जिसमें आश्रित और स्वतंत्र दोनों चर पर अवलोकन संबंधी त्रुटियों को ध्यान में रखा जाता है। यह [[ मांग प्रतिगमन |मांग प्रतिगमन]] और [[ ओर्थोगोनल प्रतिगमन |ओर्थोगोनल प्रतिगमन]] का सामान्यीकरण है, और इसे रैखिक और गैर-रेखीय दोनों नमूनों पर लागू किया जा सकता है।ka | ||
डेटा का कुल न्यूनतम वर्ग सन्निकटन सामान्यतः [[फ्रोबेनियस मानदंड]] में, डेटा | डेटा का कुल न्यूनतम वर्ग सन्निकटन सामान्यतः [[फ्रोबेनियस मानदंड]] में, डेटा आव्यूह के निम्न-रैंक सन्निकटन के सर्वोत्तम के बराबर होता है।<ref>I. Markovsky and [[Sabine Van Huffel|S. Van Huffel]], ''Overview of total least squares methods.'' Signal Processing, vol. 87, pp. 2283–2302, 2007. [http://eprints.ecs.soton.ac.uk/13855/1/tls_overview.pdf preprint]</ref> | ||
==रेखीय नमूना == | |||
==रेखीय | |||
===पृष्ठभूमि=== | ===पृष्ठभूमि=== | ||
डेटा | डेटा नमूने की न्यूनतम वर्ग विधि में, उद्देश्य फलन, एस, | ||
:<math>S=\mathbf{r^TWr},</math> | :<math>S=\mathbf{r^TWr},</math> | ||
न्यूनतम किया गया है, जहां r आंकड़ों में त्रुटियों और अवशेषों का वेक्टर है और W एक वेटिंग | न्यूनतम किया गया है, जहां r आंकड़ों में त्रुटियों और अवशेषों का वेक्टर है और W एक वेटिंग आव्यूह है। [[रैखिक न्यूनतम वर्ग (गणित)]] में नमूना में ऐसे समीकरण होते है जो पैरामीटर वेक्टर में दिखाई देने वाले मापदंडों में रैखिक होते है <math>\boldsymbol\beta</math>, इसलिए अवशेष दिए गए है | ||
:<math>\mathbf{r=y-X\boldsymbol\beta}.</math> | :<math>\mathbf{r=y-X\boldsymbol\beta}.</math> | ||
'y' में m अवलोकन और 'β' में m>n के साथ n पैरामीटर | 'y' में m अवलोकन और 'β' में m>n के साथ n पैरामीटर है। 'X' एक m×n आव्यूह है जिसके तत्व या तो स्थिरांक है या स्वतंत्र चर, 'x' के फलन है। भार आव्यूह 'डब्ल्यू', आदर्श रूप से, [[विचरण-सहप्रसरण मैट्रिक्स|विचरण-सहप्रसरण आव्यूह]] का व्युत्क्रम है <math>\mathbf M_y</math> अवलोकनों में से y. स्वतंत्र चर को त्रुटि रहित माना जाता है। ग्रेडिएंट समीकरणों को शून्य पर सेट करके पैरामीटर अनुमान पाए जाते है, जिसके परिणामस्वरूप सामान्य समीकरण बनते है<ref group="note">An alternative form is <math>\mathbf{X^TWX\boldsymbol\Delta \boldsymbol\beta=X^T W \boldsymbol\Delta y}</math>, where <math>\boldsymbol\Delta \boldsymbol\beta</math> is the parameter shift from some starting estimate of <math>\boldsymbol\beta</math> and <math>\boldsymbol\Delta \mathbf y</math> is the difference between '''y''' and the value calculated using the starting value of <math>\boldsymbol\beta</math></ref> : | ||
<ref group="note">An alternative form is <math>\mathbf{X^TWX\boldsymbol\Delta \boldsymbol\beta=X^T W \boldsymbol\Delta y}</math>, where <math>\boldsymbol\Delta \boldsymbol\beta</math> is the parameter shift from some starting estimate of <math>\boldsymbol\beta</math> and <math>\boldsymbol\Delta \mathbf y</math> is the difference between '''y''' and the value calculated using the starting value of <math>\boldsymbol\beta</math></ref> : | |||
<math>\mathbf{X^TWX\boldsymbol\beta=X^T Wy}.</math> | |||
===सभी चरों में अवलोकन त्रुटियों की अनुमति देना=== | ===सभी चरों में अवलोकन त्रुटियों की अनुमति देना=== | ||
अब, मान लीजिए कि x और y दोनों को भिन्नता-सहप्रसरण | अब, मान लीजिए कि x और y दोनों को भिन्नता-सहप्रसरण आव्यूह के साथ त्रुटि के अधीन देखा जाता है <math>\mathbf M_x</math> और <math>\mathbf M_y</math> क्रमश। इस स्थिति में वस्तुनिष्ठ फलन को इस प्रकार लिखा जा सकता है | ||
:<math>S=\mathbf{r_x^TM_x^{-1}r_x+r_y^TM_y^{-1}r_y},</math> | :<math>S=\mathbf{r_x^TM_x^{-1}r_x+r_y^TM_y^{-1}r_y},</math> | ||
जहाँ <math>\mathbf r_x</math> और <math>\mathbf r_y</math> क्रमशः x और y में अवशेष है। स्पष्ट रूप से{{Explain|date=February 2021}} ये अवशेष एक-दूसरे से स्वतंत्र नहीं हो सकते, लेकिन इन्हें किसी प्रकार के रिश्ते से बाधित होना चाहिए। नमूना फलन को इस रूप में लिखना <math>\mathbf{f(r_x,r_y,\boldsymbol\beta)}</math>, बाधाओं को एम स्थिति समीकरणों द्वारा व्यक्त किया जाता है।<ref>W.E. Deming, Statistical Adjustment of Data, Wiley, 1943</ref> | |||
:<math>\mathbf{F=\Delta y -\frac{\partial f}{\partial r_x} r_x-\frac{\partial f}{\partial r_y} r_y -X\Delta\boldsymbol\beta=0}.</math> | :<math>\mathbf{F=\Delta y -\frac{\partial f}{\partial r_x} r_x-\frac{\partial f}{\partial r_y} r_y -X\Delta\boldsymbol\beta=0}.</math> | ||
इस प्रकार, समस्या एम बाधाओं के अधीन उद्देश्य | इस प्रकार, समस्या एम बाधाओं के अधीन उद्देश्य फलन को कम करने की है। इसे [[लैग्रेंज गुणक]] के उपयोग से हल किया जाता है। कुछ बीजीय जोड़-तोड़ के बाद,<ref>{{cite book |last=Gans |first=Peter |title=रासायनिक विज्ञान में डेटा फिटिंग|year=1992 |publisher=Wiley |isbn=9780471934127 |url=http://www.wiley.com/WileyCDA/WileyTitle/productCd-0471934127.html |access-date=4 December 2012}}</ref> परिणाम प्राप्त होता है. | ||
:<math>\mathbf{X^TM^{-1}X\Delta \boldsymbol\beta=X^T M^{-1} \Delta y}, </math> | :<math>\mathbf{X^TM^{-1}X\Delta \boldsymbol\beta=X^T M^{-1} \Delta y}, </math> | ||
या वैकल्पिक रूप से <math>\mathbf{X^TM^{-1}X \boldsymbol\beta=X^T M^{-1} y},</math> | या वैकल्पिक रूप से <math>\mathbf{X^TM^{-1}X \boldsymbol\beta=X^T M^{-1} y},</math> | ||
जहां एम स्वतंत्र और आश्रित दोनों चर के सापेक्ष विचरण-सहप्रसरण | जहां एम स्वतंत्र और आश्रित दोनों चर के सापेक्ष विचरण-सहप्रसरण आव्यूह है। | ||
:<math>\mathbf{M=K_xM_xK_x^T+K_yM_yK_y^T;\ K_x=-\frac{\partial f}{\partial r_x},\ K_y=-\frac{\partial f}{\partial r_y}}.</math> | :<math>\mathbf{M=K_xM_xK_x^T+K_yM_yK_y^T;\ K_x=-\frac{\partial f}{\partial r_x},\ K_y=-\frac{\partial f}{\partial r_y}}.</math> | ||
=== उदाहरण === | === उदाहरण === | ||
जब डेटा त्रुटियां असंबद्ध होती | जब डेटा त्रुटियां असंबद्ध होती है, तो सभी आव्यूह M और W विकर्ण होते है। फिर, सीधी रेखा फिटिंग का उदाहरण लें। | ||
:<math>f(x_i,\beta)=\alpha + \beta x_i</math> | :<math>f(x_i,\beta)=\alpha + \beta x_i</math> | ||
इस | इस स्थिति में | ||
:<math>M_{ii}=\sigma^2_{y,i}+\beta^2 \sigma^2_{x,i}</math> | :<math>M_{ii}=\sigma^2_{y,i}+\beta^2 \sigma^2_{x,i}</math> | ||
यह दर्शाता है कि किस प्रकार iवें बिंदु पर विचरण स्वतंत्र और आश्रित दोनों चरों के विचरण और डेटा को फिट करने के लिए उपयोग किए जा रहे | यह दर्शाता है कि किस प्रकार iवें बिंदु पर विचरण स्वतंत्र और आश्रित दोनों चरों के विचरण और डेटा को फिट करने के लिए उपयोग किए जा रहे नमूना द्वारा निर्धारित किया जाता है। पैरामीटर को नोट करके अभिव्यक्ति को सामान्यीकृत किया जा सकता है <math>\beta</math> रेखा का ढलान है. | ||
:<math>M_{ii}=\sigma^2_{y,i}+\left(\frac{dy}{dx}\right)^2_i \sigma^2_{x,i}</math> | :<math>M_{ii}=\sigma^2_{y,i}+\left(\frac{dy}{dx}\right)^2_i \sigma^2_{x,i}</math> | ||
इस प्रकार की अभिव्यक्ति का उपयोग संतुलन स्थिरांक | इस प्रकार की अभिव्यक्ति का उपयोग संतुलन स्थिरांक पैरामीटर त्रुटियों और सहसंबंध के निर्धारण में किया जाता है, जहां ढलान बड़ा होने पर x पर एक छोटी त्रुटि y पर एक बड़ी त्रुटि में बदल जाती है। | ||
=== बीजगणितीय दृष्टिकोण === | === बीजगणितीय दृष्टिकोण === | ||
जैसा कि 1980 में गोलूब और वैन लोन द्वारा दिखाया गया था, टीएलएस समस्या का सामान्य रूप से कोई समाधान नहीं है।<ref>G. H. Golub and C. F. Van Loan, An analysis of the total least squares problem. Numer. Anal., 17, 1980, pp. 883–893.</ref> निम्नलिखित उस साधारण | जैसा कि 1980 में गोलूब और वैन लोन द्वारा दिखाया गया था, टीएलएस समस्या का सामान्य रूप से कोई समाधान नहीं है।<ref>G. H. Golub and C. F. Van Loan, An analysis of the total least squares problem. Numer. Anal., 17, 1980, pp. 883–893.</ref> निम्नलिखित उस साधारण स्थिति पर विचार करता है जहां कोई विशेष धारणा बनाए बिना एक अनूठा समाधान उपस्थित है। | ||
एकल मूल्य अपघटन (एसवीडी) का उपयोग करके टीएलएस की गणना मानक ग्रंथों में वर्णित है।<ref>{{Cite book | एकल मूल्य अपघटन (एसवीडी) का उपयोग करके टीएलएस की गणना मानक ग्रंथों में वर्णित है।<ref>{{Cite book | ||
Line 51: | Line 46: | ||
| publisher = [[The Johns Hopkins University Press]] | | publisher = [[The Johns Hopkins University Press]] | ||
| year = 1996 | | year = 1996 | ||
}} pp 596.</ref> हम समीकरण हल कर सकते | }} pp 596.</ref> हम समीकरण हल कर सकते है | ||
:<math>XB \approx Y</math> | :<math>XB \approx Y</math> | ||
बी के लिए जहां एक्स एम-बाय-एन है और वाई एम-बाय-के है। <ref group="note">The notation ''XB'' ≈ ''Y'' is used here to reflect the notation used in the earlier part of the article. In the computational literature the problem has been more commonly presented as ''AX'' ≈ ''B'', i.e. with the letter ''X'' used for the ''n''-by-''k'' matrix of unknown regression coefficients.</ref> | बी के लिए जहां एक्स एम-बाय-एन है और वाई एम-बाय-के है। <ref group="note">The notation ''XB'' ≈ ''Y'' is used here to reflect the notation used in the earlier part of the article. In the computational literature the problem has been more commonly presented as ''AX'' ≈ ''B'', i.e. with the letter ''X'' used for the ''n''-by-''k'' matrix of unknown regression coefficients.</ref>अर्थात, हम बी को ढूंढना चाहते है जो क्रमशः एक्स और वाई के लिए त्रुटि आव्यूह ई और एफ को कम करता है। वह है, | ||
:<math>\mathrm{argmin}_{B,E,F} \| [E\; F] \|_F, \qquad (X+E) B = Y+F</math> | :<math>\mathrm{argmin}_{B,E,F} \| [E\; F] \|_F, \qquad (X+E) B = Y+F</math> | ||
जहाँ <math>[E\; F]</math> ई और एफ के साथ-साथ [[संवर्धित मैट्रिक्स|संवर्धित आव्यूह]] है <math>\|\cdot\|_F</math> फ्रोबेनियस मानदंड है, एक आव्यूह में सभी प्रविष्टियों के वर्गों के योग का वर्गमूल और इसी तरह आव्यूह की पंक्तियों या स्तंभों की लंबाई के वर्गों के योग का वर्गमूल। | |||
इसे इस प्रकार पुनः लिखा जा सकता है | इसे इस प्रकार पुनः लिखा जा सकता है | ||
:<math>[(X+E) \; (Y+F)] \begin{bmatrix} B\\ -I_k\end{bmatrix} = 0.</math> | :<math>[(X+E) \; (Y+F)] \begin{bmatrix} B\\ -I_k\end{bmatrix} = 0.</math> | ||
जहाँ <math>I_k</math> है <math>k\times k</math> शिनाख्त सांचा। | |||
फिर लक्ष्य खोजना है <math>[E\; F]</math> जिससे रैंक कम हो जाती है <math>[X\; Y]</math> के द्वारा. परिभाषित करना <math>[U] [\Sigma] [V]^*</math> संवर्धित | फिर लक्ष्य खोजना है <math>[E\; F]</math> जिससे रैंक कम हो जाती है <math>[X\; Y]</math> के द्वारा. परिभाषित करना <math>[U] [\Sigma] [V]^*</math> संवर्धित आव्यूह का एकवचन मूल्य अपघटन होना <math>[X\; Y]</math>. | ||
:<math>[X\; Y] = [U_X\; U_Y] \begin{bmatrix}\Sigma_X &0 \\ 0 & \Sigma_Y\end{bmatrix}\begin{bmatrix}V_{XX} & V_{XY} \\ V_{YX} & V_{YY}\end{bmatrix}^* = [U_X\; U_Y] \begin{bmatrix}\Sigma_X &0 \\ 0 & \Sigma_Y\end{bmatrix} \begin{bmatrix} V_{XX}^* & V_{YX}^* \\ V_{XY}^* & V_{YY}^*\end{bmatrix}</math> | :<math>[X\; Y] = [U_X\; U_Y] \begin{bmatrix}\Sigma_X &0 \\ 0 & \Sigma_Y\end{bmatrix}\begin{bmatrix}V_{XX} & V_{XY} \\ V_{YX} & V_{YY}\end{bmatrix}^* = [U_X\; U_Y] \begin{bmatrix}\Sigma_X &0 \\ 0 & \Sigma_Y\end{bmatrix} \begin{bmatrix} V_{XX}^* & V_{YX}^* \\ V_{XY}^* & V_{YY}^*\end{bmatrix}</math> | ||
जहां V को X और Y के आकार के अनुरूप ब्लॉकों में विभाजित किया गया है। | जहां V को X और Y के आकार के अनुरूप ब्लॉकों में विभाजित किया गया है। | ||
एकार्ट-यंग प्रमेय का उपयोग करते हुए, त्रुटि के मानदंड को न्यूनतम करने वाला सन्निकटन ऐसा है कि | एकार्ट-यंग प्रमेय का उपयोग करते हुए, त्रुटि के मानदंड को न्यूनतम करने वाला सन्निकटन ऐसा है कि आव्यूह <math>U</math> और <math>V</math> अपरिवर्तित है, जबकि सबसे छोटे है <math>k</math> एकवचन मानों को शून्य से बदल दिया जाता है। अर्थात हम चाहते है | ||
:<math>[(X+E)\; (Y+F)] = [U_X\; U_Y] \begin{bmatrix}\Sigma_X &0 \\ 0 & 0_{k\times k}\end{bmatrix}\begin{bmatrix}V_{XX} & V_{XY} \\ V_{YX} & V_{YY}\end{bmatrix}^*</math> | :<math>[(X+E)\; (Y+F)] = [U_X\; U_Y] \begin{bmatrix}\Sigma_X &0 \\ 0 & 0_{k\times k}\end{bmatrix}\begin{bmatrix}V_{XX} & V_{XY} \\ V_{YX} & V_{YY}\end{bmatrix}^*</math> | ||
तो रैखिकता से, | तो रैखिकता से, | ||
:<math>[E\; F] = -[U_X\; U_Y] \begin{bmatrix}0_{n\times n} &0 \\ 0 & \Sigma_Y\end{bmatrix}\begin{bmatrix}V_{XX} & V_{XY} \\ V_{YX} & V_{YY}\end{bmatrix}^*. </math> | :<math>[E\; F] = -[U_X\; U_Y] \begin{bmatrix}0_{n\times n} &0 \\ 0 & \Sigma_Y\end{bmatrix}\begin{bmatrix}V_{XX} & V_{XY} \\ V_{YX} & V_{YY}\end{bmatrix}^*. </math> | ||
फिर हम इसे सरल बनाते हुए यू और Σ मैट्रिसेस से ब्लॉक हटा सकते | फिर हम इसे सरल बनाते हुए यू और Σ मैट्रिसेस से ब्लॉक हटा सकते है | ||
:<math>[E\; F] = -U_Y\Sigma_Y \begin{bmatrix}V_{XY}\\V_{YY}\end{bmatrix}^*= -[X\; Y] \begin{bmatrix}V_{XY}\\V_{YY}\end{bmatrix}\begin{bmatrix}V_{XY}\\ V_{YY}\end{bmatrix}^*.</math> | :<math>[E\; F] = -U_Y\Sigma_Y \begin{bmatrix}V_{XY}\\V_{YY}\end{bmatrix}^*= -[X\; Y] \begin{bmatrix}V_{XY}\\V_{YY}\end{bmatrix}\begin{bmatrix}V_{XY}\\ V_{YY}\end{bmatrix}^*.</math> | ||
यह E और F प्रदान करता है | यह E और F प्रदान करता है जिससे कि | ||
:<math>[(X+E) \; (Y+F)] \begin{bmatrix}V_{XY}\\ V_{YY}\end{bmatrix} = 0.</math> | :<math>[(X+E) \; (Y+F)] \begin{bmatrix}V_{XY}\\ V_{YY}\end{bmatrix} = 0.</math> | ||
अब | अब यदि <math>V_{YY}</math> निरर्थक है, जो हमेशा स्थिति नहीं होती है (ध्यान दें कि | ||
टीएलएस का व्यवहार कब होता है <math>V_{YY}</math> क्या एकवचन अभी तक अच्छी तरह से समझ में नहीं आया है), फिर हम दोनों पक्षों को सही से गुणा कर सकते है <math>-V_{YY}^{-1}</math> सही आव्यूह के निचले ब्लॉक को नकारात्मक पहचान में लाने के लिए, देना<ref>Bjõrck, Ake (1996) ''Numerical Methods for Least Squares Problems'', Society for Industrial and Applied Mathematics. {{ISBN|978-0898713602}} {{page needed|date=June 2012}}</ref> | |||
: <math>[(X+E) \; (Y+F)] \begin{bmatrix} -V_{XY} V_{YY}^{-1} \\ -V_{YY} V_{YY}^{-1}\end{bmatrix} = [(X+E) \; (Y+F)] \begin{bmatrix} B\\ -I_k\end{bmatrix} = 0 ,</math> | : <math>[(X+E) \; (Y+F)] \begin{bmatrix} -V_{XY} V_{YY}^{-1} \\ -V_{YY} V_{YY}^{-1}\end{bmatrix} = [(X+E) \; (Y+F)] \begin{bmatrix} B\\ -I_k\end{bmatrix} = 0 ,</math> | ||
इसलिए | इसलिए | ||
Line 91: | Line 87: | ||
end | end | ||
</syntaxhighlight> | </syntaxhighlight> | ||
समस्या को हल करने | समस्या को हल करने की विधि ऊपर वर्णित है, जिसके लिए आव्यूह की आवश्यकता होती है <math>V_{YY}</math> यह एकवचन नहीं है, इसे तथाकथित मौलिक टीएलएस कलन विधि द्वारा थोड़ा बढ़ाया जा सकता है।<ref>[[Sabine Van Huffel|S. Van Huffel]] and J. Vandewalle (1991) ''The Total Least Squares Problems: Computational Aspects and Analysis''. SIAM Publications, Philadelphia PA.</ref> | ||
=== गणना === | === गणना === | ||
मौलिक टीएलएस कलन विधि का मानक कार्यान्वयन [http://www.netlib.org/vanhuffel/index.html नेटलिब] के माध्यम से उपलब्ध है, यह भी देखें।<ref>[[Sabine Van Huffel|S. Van Huffel]], Documented Fortran 77 programs of the extended classical total least squares algorithm, the partial singular value decomposition algorithm and the partial total least squares algorithm, Internal Report ESAT-KUL 88/1, ESAT Lab., Dept. of Electrical Engineering, Katholieke Universiteit Leuven, 1988.</ref><ref>[[Sabine Van Huffel|S. Van Huffel]], The extended classical total least squares algorithm, J. Comput. Appl. Math., 25, pp. 111–119, 1989.</ref> सभी आधुनिक कार्यान्वयन, उदाहरण के लिए, सामान्य न्यूनतम वर्ग समस्याओं के अनुक्रम को हल करने पर आधारित, आव्यूह का अनुमान लगाते है <math>B</math> (संकेतित <math>X</math> साहित्य में), जैसा कि [[सबाइन वान हफेल]] और वांडेवेले द्वारा प्रस्तुत किया गया है। गौरतलब है कि यह <math>B</math> चूँकि, कई स्थितियों में टीएलएस समाधान नहीं है।<ref>M. Plešinger, The Total Least Squares Problem and Reduction of Data in AX ≈ B. Doctoral Thesis, TU of Liberec and Institute of Computer Science, AS CR Prague, 2008. Ph.D. Thesis</ref><ref>I. Hnětynková, M. Plešinger, D. M. Sima, Z. Strakoš, and [[Sabine Van Huffel|S. Van Huffel]], The total least squares problem in AX ≈ B. A new classification with the relationship to the classical works. SIMAX vol. 32 issue 3 (2011), pp. 748–770.</ref> | |||
== अरैखिक नमूना == | |||
== अरैखिक | |||
गैर-रेखीय न्यूनतम वर्गों के लिए | गैर-रेखीय प्रणालियों के समान तर्क से पता चलता है कि पुनरावृत्ति चक्र के लिए सामान्य समीकरणों को इस प्रकार लिखा जा सकता है | गैर-रेखीय न्यूनतम वर्गों के लिए | गैर-रेखीय प्रणालियों के समान तर्क से पता चलता है कि पुनरावृत्ति चक्र के लिए सामान्य समीकरणों को इस प्रकार लिखा जा सकता है | ||
:<math>\mathbf{J^TM^{-1}J\Delta \boldsymbol\beta=J^T M^{-1} \Delta y}, </math> | :<math>\mathbf{J^TM^{-1}J\Delta \boldsymbol\beta=J^T M^{-1} \Delta y}, </math> | ||
जहाँ <math>\mathbf{J}</math> [[जैकोबियन मैट्रिक्स और निर्धारक|जैकोबियन आव्यूह और निर्धारक]] है। | |||
==ज्यामितीय व्याख्या== | ==ज्यामितीय व्याख्या== | ||
{{main| | {{main|वक्र फिटिंग#बीजगणितीय फिट बनाम वक्रों के लिए ज्यामितीय फिट}} | ||
{{further| | {{further|ऑर्थोगोनल प्रतिगमन}} | ||
जब स्वतंत्र चर त्रुटि-मुक्त होता है तो एक अवशिष्ट प्रेक्षित डेटा बिंदु और फिट किए गए वक्र (या सतह) के बीच ऊर्ध्वाधर दूरी का प्रतिनिधित्व करता है। कुल न्यूनतम वर्गों में एक अवशिष्ट डेटा बिंदु और किसी दिशा में मापे गए फिट किए गए वक्र के बीच की दूरी को दर्शाता है। वास्तव में, यदि दोनों चर एक ही इकाइयों में मापे जाते | |||
जब स्वतंत्र चर त्रुटि-मुक्त होता है तो एक अवशिष्ट प्रेक्षित डेटा बिंदु और फिट किए गए वक्र (या सतह) के बीच ऊर्ध्वाधर दूरी का प्रतिनिधित्व करता है। कुल न्यूनतम वर्गों में एक अवशिष्ट डेटा बिंदु और किसी दिशा में मापे गए फिट किए गए वक्र के बीच की दूरी को दर्शाता है। वास्तव में, यदि दोनों चर एक ही इकाइयों में मापे जाते है और दोनों चर पर त्रुटियां समान है, तो अवशिष्ट एक बिंदु से एक रेखा तक की दूरी को दर्शाता है, अर्थात, अवशिष्ट वेक्टर वक्र के स्पर्शरेखा के लंबवत है। इस कारण से, इस प्रकार के प्रतिगमन को कभी-कभी दो आयामी यूक्लिडियन प्रतिगमन कहा जाता है (स्टीन, 1983)<ref>{{cite journal |last=Stein |first=Yaakov J. |title=दो आयामी यूक्लिडियन प्रतिगमन|url =http://www.dspcsp.com/pubs/euclreg.pdf }}</ref> या ओर्थोगोनल प्रतिगमन। | |||
== स्केल अपरिवर्तनीय विधियाँ == | == स्केल अपरिवर्तनीय विधियाँ == | ||
यदि चरों को समान इकाइयों में नहीं मापा जाता है तो एक गंभीर कठिनाई उत्पन्न होती है। पहले डेटा बिंदु और रेखा के बीच की दूरी मापने पर विचार करें: इस दूरी के लिए माप इकाइयाँ क्या | यदि चरों को समान इकाइयों में नहीं मापा जाता है तो एक गंभीर कठिनाई उत्पन्न होती है। पहले डेटा बिंदु और रेखा के बीच की दूरी मापने पर विचार करें: इस दूरी के लिए माप इकाइयाँ क्या है? यदि हम पाइथागोरस प्रमेय के आधार पर दूरी मापने पर विचार करते है तो यह स्पष्ट है कि हम विभिन्न इकाइयों में मापी गई मात्राओं को जोड़ देंगे, जो अर्थहीन है। दूसरे, यदि हम किसी एक चर को दोबारा मापते है, उदाहरण के लिए, किलोग्राम के अतिरिक्त ग्राम में मापते है, तो हम अलग-अलग परिणाम (एक अलग रेखा) के साथ समाप्त होंगे। इन समस्याओं से बचने के लिए कभी-कभी यह सुझाव दिया जाता है कि हम आयामहीन चर में परिवर्तित हो जाएं - इसे सामान्यीकरण या मानकीकरण कहा जा सकता है। चूँकि, ऐसा करने के कई विधियां होती है, और इनसे ऐसे फिट नमूना बनते है जो एक-दूसरे के समकक्ष नहीं होते है। एक दृष्टिकोण ज्ञात (या अनुमानित) माप परिशुद्धता द्वारा सामान्यीकरण करना है, जिससे बिंदुओं से रेखा तक महालनोबिस की दूरी कम हो जाती है, अधिकतम संभावना समाधान प्रदान होता है;{{Citation needed|date=July 2009}} विचरण के विश्लेषण के माध्यम से अज्ञात त्रुटिहीनता प्राप्त की जा सकती है। | ||
संक्षेप में, कुल न्यूनतम वर्गों में इकाइयों-अपरिवर्तनीय की संपत्ति नहीं होती है - अर्थात। यह [[स्केल अपरिवर्तनीयता]] नहीं है। एक सार्थक | संक्षेप में, कुल न्यूनतम वर्गों में इकाइयों-अपरिवर्तनीय की संपत्ति नहीं होती है - अर्थात। यह [[स्केल अपरिवर्तनीयता]] नहीं है। एक सार्थक नमूना के लिए हमें इस संपत्ति को धारण करने की आवश्यकता है। आगे बढ़ने की एक विधि यह समझना होता है कि यदि जोड़ के अतिरिक्त गुणा का उपयोग किया जाए तो विभिन्न इकाइयों में मापे गए अवशेषों (दूरियों) को जोड़ा जा सकता है। एक रेखा फ़िट करने पर विचार करें: प्रत्येक डेटा बिंदु के लिए ऊर्ध्वाधर और क्षैतिज अवशेषों का उत्पाद अवशिष्ट रेखाओं और फिट की गई रेखा द्वारा निर्मित त्रिभुज के क्षेत्रफल के दोगुने के बराबर होता है। हम वह रेखा चुनते है जो इन क्षेत्रों के योग को न्यूनतम करती है। नोबेल पुरस्कार विजेता [[पॉल सैमुएलसन]] ने 1942 में सिद्ध किया कि, दो आयामों में, यह एकमात्र रेखा है जिसे केवल मानक विचलन के अनुपात और सहसंबंध गुणांक के संदर्भ में व्यक्त किया जा सकता है, जो (1) सही समीकरण में फिट बैठता है जब अवलोकन एक सीधी रेखा पर आते है, ( 2) स्केल इनवेरिएंस प्रदर्शित करता है, और (3) चरों के आदान-प्रदान के अनुसार इनवेरिएंस प्रदर्शित करता है।<ref>{{cite journal |last=Samuelson |first=Paul A. |year=1942 |title=वैकल्पिक प्रतिगमन पर एक नोट|journal=Econometrica |doi=10.2307/1907024 |jstor=1907024 |volume=10 |issue=1 |pages=80–83}}</ref> इस समाधान को विभिन्न विषयों में फिर से खोजा गया है और इसे मानकीकृत प्रमुख अक्ष (रिकर 1975, वार्टन एट अल., 2006) के रूप में जाना जाता है।<ref>{{cite journal |last=Ricker |first=W. E. |year=1975 |title=प्रोफेसर जोलिकोयूर की टिप्पणियों से संबंधित एक नोट|journal=Journal of the Fisheries Research Board of Canada |doi=10.1139/f75-172 |volume=32 |issue=8 |pages=1494–1498}}</ref><ref>{{cite journal |last1=Warton |first1=David I. |last2=Wright |first2=Ian J. |last3=Falster |first3=Daniel S. |last4=Westoby |first4=Mark |year=2006 |title=एलोमेट्री के लिए द्विचर रेखा-फिटिंग विधियाँ|journal=Biological Reviews |doi=10.1017/S1464793106007007 |volume=81 |issue=2 |pages=259–291|pmid=16573844 |citeseerx=10.1.1.461.9154 |s2cid=16462731 }}</ref> कम प्रमुख अक्ष, ज्यामितीय माध्य कार्यात्मक संबंध (ड्रेपर और स्मिथ, 1998),<ref>Draper, NR and Smith, H. ''Applied Regression Analysis'', 3rd edition, pp. 92–96. 1998</ref> न्यूनतम उत्पाद प्रतिगमन, विकर्ण प्रतिगमन, कार्बनिक सहसंबंध की रेखा, और न्यूनतम क्षेत्र रेखा (टोफालिस, 2002)।<ref>{{cite book |last=Tofallis |first=Chris |editor1-last=Van Huffel |editor1-first=Sabine |editor1-link= Sabine Van Huffel |editor2-last=Lemmerling |editor2-first=P. |year=2002 |title=Total Least Squares and Errors-in-Variables Modeling: Analysis, Algorithms and Applications |chapter=Model Fitting for Multiple Variables by Minimising the Geometric Mean Deviation |publisher=Kluwer Academic Publ. |location=Dordrecht |isbn=978-1402004766 |ssrn=1077322}}</ref> टोफलिस (2015)<ref>{{ Cite ssrn |last=Tofallis|first=Chris|year=2015|title=पूर्ण सहसंबंध संबंध के साथ डेटा में समीकरणों को फिट करना|ssrn=2707593}}</ref> अनेक चरों से निपटने के लिए इस दृष्टिकोण का विस्तार किया है। | ||
== यह भी देखें == | == यह भी देखें == | ||
* डेमिंग रिग्रेशन, दो भविष्यवक्ताओं और स्वतंत्र त्रुटियों वाला एक विशेष | * डेमिंग रिग्रेशन, दो भविष्यवक्ताओं और स्वतंत्र त्रुटियों वाला एक विशेष स्थिति। | ||
* चर | * चर नमूना में त्रुटियाँ | ||
* [[गॉस-हेल्मर्ट मॉडल]] | * [[गॉस-हेल्मर्ट मॉडल|गॉस-हेल्मर्ट नमूना]] | ||
* [[रेखीय प्रतिगमन]] | * [[रेखीय प्रतिगमन]] | ||
* कम से कम वर्गों | * कम से कम वर्गों | ||
Line 134: | Line 127: | ||
===अन्य=== | ===अन्य=== | ||
* आई. ह्नतिनकोवा, एम. प्लेज़िंगर, डी. एम. सिमा, ज़ेड स्ट्रैकोस, और सबाइन वान हफ़ेल|एस। वैन हफ़ेल, AX ≈ B में कुल न्यूनतम वर्ग समस्या। | * आई. ह्नतिनकोवा, एम. प्लेज़िंगर, डी. एम. सिमा, ज़ेड स्ट्रैकोस, और सबाइन वान हफ़ेल|एस। वैन हफ़ेल, AX ≈ B में कुल न्यूनतम वर्ग समस्या। मौलिक कार्यों के संबंध में एक नया वर्गीकरण। सिमैक्स वॉल्यूम. 32 अंक 3 (2011), पृष्ठ 748-770। [ftp://ftp.sam.math.ethz.ch/pub/sam-reports/reports/reports2010/2010-38.pdf प्रीप्रिंट] के रूप में उपलब्ध है। | ||
* एम. प्लेसिंगर, द टोटल लीस्ट स्क्वेयर्स प्रॉब्लम एंड रिडक्शन ऑफ डेटा इन एएक्स ≈ बी. डॉक्टोरल थीसिस, टीयू ऑफ लिबरेक एंड इंस्टीट्यूट ऑफ कंप्यूटर साइंस, एएस सीआर प्राग, 2008। [https://web.archive.org/web/ 20120724080908/http://www.fp.tul.cz/~plesinger/my_publications/doctoral_thsis/thsis.pdf पीएच.डी. थीसिस] | * एम. प्लेसिंगर, द टोटल लीस्ट स्क्वेयर्स प्रॉब्लम एंड रिडक्शन ऑफ डेटा इन एएक्स ≈ बी. डॉक्टोरल थीसिस, टीयू ऑफ लिबरेक एंड इंस्टीट्यूट ऑफ कंप्यूटर साइंस, एएस सीआर प्राग, 2008। [https://web.archive.org/web/ 20120724080908/http://www.fp.tul.cz/~plesinger/my_publications/doctoral_thsis/thsis.pdf पीएच.डी. थीसिस] | ||
* सी. सी. पेगे, जेड. स्ट्रैकोस, रैखिक बीजगणितीय प्रणालियों में मुख्य समस्याएं। सियाम जे. | * सी. सी. पेगे, जेड. स्ट्रैकोस, रैखिक बीजगणितीय प्रणालियों में मुख्य समस्याएं। सियाम जे. आव्यूह गुदा. आवेदन. 27, 2006, पृ. 861-875. {{doi|10.1137/040616991}} | ||
* सबाइन वान हफ़ेल|एस. वैन हफ़ेल और पी. लेमरलिंग, कुल न्यूनतम वर्ग और चर में त्रुटियाँ | * सबाइन वान हफ़ेल|एस. वैन हफ़ेल और पी. लेमरलिंग, कुल न्यूनतम वर्ग और चर में त्रुटियाँ नमूने: विश्लेषण, कलन विधि और अनुप्रयोग। डॉर्ड्रेक्ट, नीदरलैंड्स: क्लूवर एकेडमिक पब्लिशर्स, 2002। | ||
* एस. जो और एस. डब्ल्यू. किम, शोर डेटा | * एस. जो और एस. डब्ल्यू. किम, शोर डेटा आव्यूह के साथ लगातार सामान्यीकृत न्यूनतम माध्य वर्ग फ़िल्टरिंग। आईईईई ट्रांस. सिग्नल प्रोसेस., वॉल्यूम. 53, नहीं. 6, पृ. 2112-2123, जून 2005। | ||
* आर. डी. डीग्रोट और ई. एम. डाउलिंग, डेटा न्यूनतम वर्ग समस्या और चैनल समीकरण। आईईईई ट्रांस. सिग्नल प्रोसेस., वॉल्यूम. 41, नहीं. 1, पृ. 407-411, जनवरी 1993। | * आर. डी. डीग्रोट और ई. एम. डाउलिंग, डेटा न्यूनतम वर्ग समस्या और चैनल समीकरण। आईईईई ट्रांस. सिग्नल प्रोसेस., वॉल्यूम. 41, नहीं. 1, पृ. 407-411, जनवरी 1993। | ||
* सबाइन वान हफ़ेल|एस. वैन हफ़ेल और जे. वंदेवाले, कुल न्यूनतम वर्ग समस्याएं: कम्प्यूटेशनल पहलू और विश्लेषण। सियाम प्रकाशन, फिलाडेल्फिया पीए, 1991। {{doi|10.1137/1.9781611971002}} | * सबाइन वान हफ़ेल|एस. वैन हफ़ेल और जे. वंदेवाले, कुल न्यूनतम वर्ग समस्याएं: कम्प्यूटेशनल पहलू और विश्लेषण। सियाम प्रकाशन, फिलाडेल्फिया पीए, 1991। {{doi|10.1137/1.9781611971002}} | ||
Line 150: | Line 143: | ||
{{DEFAULTSORT:Total Least Squares}} | {{DEFAULTSORT:Total Least Squares}} | ||
श्रेणी:अनुप्रयुक्त गणित | श्रेणी:अनुप्रयुक्त गणित | ||
श्रेणी:वक्र फिटिंग | श्रेणी:वक्र फिटिंग | ||
श्रेणी:न्यूनतम वर्ग | श्रेणी:न्यूनतम वर्ग | ||
श्रेणी:प्रतिगमन | श्रेणी:प्रतिगमन नमूना | ||
[[Category: Machine Translated Page]] | [[Category: Machine Translated Page]] | ||
[[Category:Created On 07/07/2023]] | [[Category:Created On 07/07/2023]] |
Revision as of 09:21, 12 July 2023
एक श्रृंखला का हिस्सा |
प्रतिगमन विश्लेषण |
---|
मॉडल |
अनुमान |
पार्श्वभूमि |
|
लागू आँकड़ों में, कुल न्यूनतम वर्ग एक प्रकार का चर-में-त्रुटि प्रतिगमन होता है, एक न्यूनतम वर्ग डेटा नमूने तकनीक जिसमें आश्रित और स्वतंत्र दोनों चर पर अवलोकन संबंधी त्रुटियों को ध्यान में रखा जाता है। यह मांग प्रतिगमन और ओर्थोगोनल प्रतिगमन का सामान्यीकरण है, और इसे रैखिक और गैर-रेखीय दोनों नमूनों पर लागू किया जा सकता है।ka
डेटा का कुल न्यूनतम वर्ग सन्निकटन सामान्यतः फ्रोबेनियस मानदंड में, डेटा आव्यूह के निम्न-रैंक सन्निकटन के सर्वोत्तम के बराबर होता है।[1]
रेखीय नमूना
पृष्ठभूमि
डेटा नमूने की न्यूनतम वर्ग विधि में, उद्देश्य फलन, एस,
न्यूनतम किया गया है, जहां r आंकड़ों में त्रुटियों और अवशेषों का वेक्टर है और W एक वेटिंग आव्यूह है। रैखिक न्यूनतम वर्ग (गणित) में नमूना में ऐसे समीकरण होते है जो पैरामीटर वेक्टर में दिखाई देने वाले मापदंडों में रैखिक होते है , इसलिए अवशेष दिए गए है
'y' में m अवलोकन और 'β' में m>n के साथ n पैरामीटर है। 'X' एक m×n आव्यूह है जिसके तत्व या तो स्थिरांक है या स्वतंत्र चर, 'x' के फलन है। भार आव्यूह 'डब्ल्यू', आदर्श रूप से, विचरण-सहप्रसरण आव्यूह का व्युत्क्रम है अवलोकनों में से y. स्वतंत्र चर को त्रुटि रहित माना जाता है। ग्रेडिएंट समीकरणों को शून्य पर सेट करके पैरामीटर अनुमान पाए जाते है, जिसके परिणामस्वरूप सामान्य समीकरण बनते है[note 1] :
सभी चरों में अवलोकन त्रुटियों की अनुमति देना
अब, मान लीजिए कि x और y दोनों को भिन्नता-सहप्रसरण आव्यूह के साथ त्रुटि के अधीन देखा जाता है और क्रमश। इस स्थिति में वस्तुनिष्ठ फलन को इस प्रकार लिखा जा सकता है
जहाँ और क्रमशः x और y में अवशेष है। स्पष्ट रूप से[further explanation needed] ये अवशेष एक-दूसरे से स्वतंत्र नहीं हो सकते, लेकिन इन्हें किसी प्रकार के रिश्ते से बाधित होना चाहिए। नमूना फलन को इस रूप में लिखना , बाधाओं को एम स्थिति समीकरणों द्वारा व्यक्त किया जाता है।[2]
इस प्रकार, समस्या एम बाधाओं के अधीन उद्देश्य फलन को कम करने की है। इसे लैग्रेंज गुणक के उपयोग से हल किया जाता है। कुछ बीजीय जोड़-तोड़ के बाद,[3] परिणाम प्राप्त होता है.
या वैकल्पिक रूप से जहां एम स्वतंत्र और आश्रित दोनों चर के सापेक्ष विचरण-सहप्रसरण आव्यूह है।
उदाहरण
जब डेटा त्रुटियां असंबद्ध होती है, तो सभी आव्यूह M और W विकर्ण होते है। फिर, सीधी रेखा फिटिंग का उदाहरण लें।
इस स्थिति में
यह दर्शाता है कि किस प्रकार iवें बिंदु पर विचरण स्वतंत्र और आश्रित दोनों चरों के विचरण और डेटा को फिट करने के लिए उपयोग किए जा रहे नमूना द्वारा निर्धारित किया जाता है। पैरामीटर को नोट करके अभिव्यक्ति को सामान्यीकृत किया जा सकता है रेखा का ढलान है.
इस प्रकार की अभिव्यक्ति का उपयोग संतुलन स्थिरांक पैरामीटर त्रुटियों और सहसंबंध के निर्धारण में किया जाता है, जहां ढलान बड़ा होने पर x पर एक छोटी त्रुटि y पर एक बड़ी त्रुटि में बदल जाती है।
बीजगणितीय दृष्टिकोण
जैसा कि 1980 में गोलूब और वैन लोन द्वारा दिखाया गया था, टीएलएस समस्या का सामान्य रूप से कोई समाधान नहीं है।[4] निम्नलिखित उस साधारण स्थिति पर विचार करता है जहां कोई विशेष धारणा बनाए बिना एक अनूठा समाधान उपस्थित है।
एकल मूल्य अपघटन (एसवीडी) का उपयोग करके टीएलएस की गणना मानक ग्रंथों में वर्णित है।[5] हम समीकरण हल कर सकते है
बी के लिए जहां एक्स एम-बाय-एन है और वाई एम-बाय-के है। [note 2]अर्थात, हम बी को ढूंढना चाहते है जो क्रमशः एक्स और वाई के लिए त्रुटि आव्यूह ई और एफ को कम करता है। वह है,
जहाँ ई और एफ के साथ-साथ संवर्धित आव्यूह है फ्रोबेनियस मानदंड है, एक आव्यूह में सभी प्रविष्टियों के वर्गों के योग का वर्गमूल और इसी तरह आव्यूह की पंक्तियों या स्तंभों की लंबाई के वर्गों के योग का वर्गमूल।
इसे इस प्रकार पुनः लिखा जा सकता है
जहाँ है शिनाख्त सांचा। फिर लक्ष्य खोजना है जिससे रैंक कम हो जाती है के द्वारा. परिभाषित करना संवर्धित आव्यूह का एकवचन मूल्य अपघटन होना .
जहां V को X और Y के आकार के अनुरूप ब्लॉकों में विभाजित किया गया है।
एकार्ट-यंग प्रमेय का उपयोग करते हुए, त्रुटि के मानदंड को न्यूनतम करने वाला सन्निकटन ऐसा है कि आव्यूह और अपरिवर्तित है, जबकि सबसे छोटे है एकवचन मानों को शून्य से बदल दिया जाता है। अर्थात हम चाहते है
तो रैखिकता से,
फिर हम इसे सरल बनाते हुए यू और Σ मैट्रिसेस से ब्लॉक हटा सकते है
यह E और F प्रदान करता है जिससे कि
अब यदि निरर्थक है, जो हमेशा स्थिति नहीं होती है (ध्यान दें कि
टीएलएस का व्यवहार कब होता है क्या एकवचन अभी तक अच्छी तरह से समझ में नहीं आया है), फिर हम दोनों पक्षों को सही से गुणा कर सकते है सही आव्यूह के निचले ब्लॉक को नकारात्मक पहचान में लाने के लिए, देना[6]
इसलिए
इसका एक सरल जीएनयू ऑक्टेव कार्यान्वयन है:
function B = tls(X, Y)
[m n] = size(X); % n is the width of X (X is m by n)
Z = [X Y]; % Z is X augmented with Y.
[U S V] = svd(Z, 0); % find the SVD of Z.
VXY = V(1:n, 1+n:end); % Take the block of V consisting of the first n rows and the n+1 to last column
VYY = V(1+n:end, 1+n:end); % Take the bottom-right block of V.
B = -VXY / VYY;
end
समस्या को हल करने की विधि ऊपर वर्णित है, जिसके लिए आव्यूह की आवश्यकता होती है यह एकवचन नहीं है, इसे तथाकथित मौलिक टीएलएस कलन विधि द्वारा थोड़ा बढ़ाया जा सकता है।[7]
गणना
मौलिक टीएलएस कलन विधि का मानक कार्यान्वयन नेटलिब के माध्यम से उपलब्ध है, यह भी देखें।[8][9] सभी आधुनिक कार्यान्वयन, उदाहरण के लिए, सामान्य न्यूनतम वर्ग समस्याओं के अनुक्रम को हल करने पर आधारित, आव्यूह का अनुमान लगाते है (संकेतित साहित्य में), जैसा कि सबाइन वान हफेल और वांडेवेले द्वारा प्रस्तुत किया गया है। गौरतलब है कि यह चूँकि, कई स्थितियों में टीएलएस समाधान नहीं है।[10][11]
अरैखिक नमूना
गैर-रेखीय न्यूनतम वर्गों के लिए | गैर-रेखीय प्रणालियों के समान तर्क से पता चलता है कि पुनरावृत्ति चक्र के लिए सामान्य समीकरणों को इस प्रकार लिखा जा सकता है
जहाँ जैकोबियन आव्यूह और निर्धारक है।
ज्यामितीय व्याख्या
जब स्वतंत्र चर त्रुटि-मुक्त होता है तो एक अवशिष्ट प्रेक्षित डेटा बिंदु और फिट किए गए वक्र (या सतह) के बीच ऊर्ध्वाधर दूरी का प्रतिनिधित्व करता है। कुल न्यूनतम वर्गों में एक अवशिष्ट डेटा बिंदु और किसी दिशा में मापे गए फिट किए गए वक्र के बीच की दूरी को दर्शाता है। वास्तव में, यदि दोनों चर एक ही इकाइयों में मापे जाते है और दोनों चर पर त्रुटियां समान है, तो अवशिष्ट एक बिंदु से एक रेखा तक की दूरी को दर्शाता है, अर्थात, अवशिष्ट वेक्टर वक्र के स्पर्शरेखा के लंबवत है। इस कारण से, इस प्रकार के प्रतिगमन को कभी-कभी दो आयामी यूक्लिडियन प्रतिगमन कहा जाता है (स्टीन, 1983)[12] या ओर्थोगोनल प्रतिगमन।
स्केल अपरिवर्तनीय विधियाँ
यदि चरों को समान इकाइयों में नहीं मापा जाता है तो एक गंभीर कठिनाई उत्पन्न होती है। पहले डेटा बिंदु और रेखा के बीच की दूरी मापने पर विचार करें: इस दूरी के लिए माप इकाइयाँ क्या है? यदि हम पाइथागोरस प्रमेय के आधार पर दूरी मापने पर विचार करते है तो यह स्पष्ट है कि हम विभिन्न इकाइयों में मापी गई मात्राओं को जोड़ देंगे, जो अर्थहीन है। दूसरे, यदि हम किसी एक चर को दोबारा मापते है, उदाहरण के लिए, किलोग्राम के अतिरिक्त ग्राम में मापते है, तो हम अलग-अलग परिणाम (एक अलग रेखा) के साथ समाप्त होंगे। इन समस्याओं से बचने के लिए कभी-कभी यह सुझाव दिया जाता है कि हम आयामहीन चर में परिवर्तित हो जाएं - इसे सामान्यीकरण या मानकीकरण कहा जा सकता है। चूँकि, ऐसा करने के कई विधियां होती है, और इनसे ऐसे फिट नमूना बनते है जो एक-दूसरे के समकक्ष नहीं होते है। एक दृष्टिकोण ज्ञात (या अनुमानित) माप परिशुद्धता द्वारा सामान्यीकरण करना है, जिससे बिंदुओं से रेखा तक महालनोबिस की दूरी कम हो जाती है, अधिकतम संभावना समाधान प्रदान होता है;[citation needed] विचरण के विश्लेषण के माध्यम से अज्ञात त्रुटिहीनता प्राप्त की जा सकती है।
संक्षेप में, कुल न्यूनतम वर्गों में इकाइयों-अपरिवर्तनीय की संपत्ति नहीं होती है - अर्थात। यह स्केल अपरिवर्तनीयता नहीं है। एक सार्थक नमूना के लिए हमें इस संपत्ति को धारण करने की आवश्यकता है। आगे बढ़ने की एक विधि यह समझना होता है कि यदि जोड़ के अतिरिक्त गुणा का उपयोग किया जाए तो विभिन्न इकाइयों में मापे गए अवशेषों (दूरियों) को जोड़ा जा सकता है। एक रेखा फ़िट करने पर विचार करें: प्रत्येक डेटा बिंदु के लिए ऊर्ध्वाधर और क्षैतिज अवशेषों का उत्पाद अवशिष्ट रेखाओं और फिट की गई रेखा द्वारा निर्मित त्रिभुज के क्षेत्रफल के दोगुने के बराबर होता है। हम वह रेखा चुनते है जो इन क्षेत्रों के योग को न्यूनतम करती है। नोबेल पुरस्कार विजेता पॉल सैमुएलसन ने 1942 में सिद्ध किया कि, दो आयामों में, यह एकमात्र रेखा है जिसे केवल मानक विचलन के अनुपात और सहसंबंध गुणांक के संदर्भ में व्यक्त किया जा सकता है, जो (1) सही समीकरण में फिट बैठता है जब अवलोकन एक सीधी रेखा पर आते है, ( 2) स्केल इनवेरिएंस प्रदर्शित करता है, और (3) चरों के आदान-प्रदान के अनुसार इनवेरिएंस प्रदर्शित करता है।[13] इस समाधान को विभिन्न विषयों में फिर से खोजा गया है और इसे मानकीकृत प्रमुख अक्ष (रिकर 1975, वार्टन एट अल., 2006) के रूप में जाना जाता है।[14][15] कम प्रमुख अक्ष, ज्यामितीय माध्य कार्यात्मक संबंध (ड्रेपर और स्मिथ, 1998),[16] न्यूनतम उत्पाद प्रतिगमन, विकर्ण प्रतिगमन, कार्बनिक सहसंबंध की रेखा, और न्यूनतम क्षेत्र रेखा (टोफालिस, 2002)।[17] टोफलिस (2015)[18] अनेक चरों से निपटने के लिए इस दृष्टिकोण का विस्तार किया है।
यह भी देखें
- डेमिंग रिग्रेशन, दो भविष्यवक्ताओं और स्वतंत्र त्रुटियों वाला एक विशेष स्थिति।
- चर नमूना में त्रुटियाँ
- गॉस-हेल्मर्ट नमूना
- रेखीय प्रतिगमन
- कम से कम वर्गों
- प्रमुख कंपोनेंट विश्लेषण
- प्रमुख घटक प्रतिगमन
टिप्पणियाँ
- ↑ An alternative form is , where is the parameter shift from some starting estimate of and is the difference between y and the value calculated using the starting value of
- ↑ The notation XB ≈ Y is used here to reflect the notation used in the earlier part of the article. In the computational literature the problem has been more commonly presented as AX ≈ B, i.e. with the letter X used for the n-by-k matrix of unknown regression coefficients.
संदर्भ
- ↑ I. Markovsky and S. Van Huffel, Overview of total least squares methods. Signal Processing, vol. 87, pp. 2283–2302, 2007. preprint
- ↑ W.E. Deming, Statistical Adjustment of Data, Wiley, 1943
- ↑ Gans, Peter (1992). रासायनिक विज्ञान में डेटा फिटिंग. Wiley. ISBN 9780471934127. Retrieved 4 December 2012.
- ↑ G. H. Golub and C. F. Van Loan, An analysis of the total least squares problem. Numer. Anal., 17, 1980, pp. 883–893.
- ↑ Golub, Gene H.; Van Loan, Charles F. (1996). Matrix Computations (3rd ed.). The Johns Hopkins University Press. pp 596.
- ↑ Bjõrck, Ake (1996) Numerical Methods for Least Squares Problems, Society for Industrial and Applied Mathematics. ISBN 978-0898713602[page needed]
- ↑ S. Van Huffel and J. Vandewalle (1991) The Total Least Squares Problems: Computational Aspects and Analysis. SIAM Publications, Philadelphia PA.
- ↑ S. Van Huffel, Documented Fortran 77 programs of the extended classical total least squares algorithm, the partial singular value decomposition algorithm and the partial total least squares algorithm, Internal Report ESAT-KUL 88/1, ESAT Lab., Dept. of Electrical Engineering, Katholieke Universiteit Leuven, 1988.
- ↑ S. Van Huffel, The extended classical total least squares algorithm, J. Comput. Appl. Math., 25, pp. 111–119, 1989.
- ↑ M. Plešinger, The Total Least Squares Problem and Reduction of Data in AX ≈ B. Doctoral Thesis, TU of Liberec and Institute of Computer Science, AS CR Prague, 2008. Ph.D. Thesis
- ↑ I. Hnětynková, M. Plešinger, D. M. Sima, Z. Strakoš, and S. Van Huffel, The total least squares problem in AX ≈ B. A new classification with the relationship to the classical works. SIMAX vol. 32 issue 3 (2011), pp. 748–770.
- ↑ Stein, Yaakov J. "दो आयामी यूक्लिडियन प्रतिगमन" (PDF).
{{cite journal}}
: Cite journal requires|journal=
(help) - ↑ Samuelson, Paul A. (1942). "वैकल्पिक प्रतिगमन पर एक नोट". Econometrica. 10 (1): 80–83. doi:10.2307/1907024. JSTOR 1907024.
- ↑ Ricker, W. E. (1975). "प्रोफेसर जोलिकोयूर की टिप्पणियों से संबंधित एक नोट". Journal of the Fisheries Research Board of Canada. 32 (8): 1494–1498. doi:10.1139/f75-172.
- ↑ Warton, David I.; Wright, Ian J.; Falster, Daniel S.; Westoby, Mark (2006). "एलोमेट्री के लिए द्विचर रेखा-फिटिंग विधियाँ". Biological Reviews. 81 (2): 259–291. CiteSeerX 10.1.1.461.9154. doi:10.1017/S1464793106007007. PMID 16573844. S2CID 16462731.
- ↑ Draper, NR and Smith, H. Applied Regression Analysis, 3rd edition, pp. 92–96. 1998
- ↑ Tofallis, Chris (2002). "Model Fitting for Multiple Variables by Minimising the Geometric Mean Deviation". In Van Huffel, Sabine; Lemmerling, P. (eds.). Total Least Squares and Errors-in-Variables Modeling: Analysis, Algorithms and Applications. Dordrecht: Kluwer Academic Publ. ISBN 978-1402004766. SSRN 1077322.
- ↑ Tofallis, Chris (2015). "पूर्ण सहसंबंध संबंध के साथ डेटा में समीकरणों को फिट करना". SSRN 2707593.
अन्य
- आई. ह्नतिनकोवा, एम. प्लेज़िंगर, डी. एम. सिमा, ज़ेड स्ट्रैकोस, और सबाइन वान हफ़ेल|एस। वैन हफ़ेल, AX ≈ B में कुल न्यूनतम वर्ग समस्या। मौलिक कार्यों के संबंध में एक नया वर्गीकरण। सिमैक्स वॉल्यूम. 32 अंक 3 (2011), पृष्ठ 748-770। प्रीप्रिंट के रूप में उपलब्ध है।
- एम. प्लेसिंगर, द टोटल लीस्ट स्क्वेयर्स प्रॉब्लम एंड रिडक्शन ऑफ डेटा इन एएक्स ≈ बी. डॉक्टोरल थीसिस, टीयू ऑफ लिबरेक एंड इंस्टीट्यूट ऑफ कंप्यूटर साइंस, एएस सीआर प्राग, 2008। 20120724080908/http://www.fp.tul.cz/~plesinger/my_publications/doctoral_thsis/thsis.pdf पीएच.डी. थीसिस
- सी. सी. पेगे, जेड. स्ट्रैकोस, रैखिक बीजगणितीय प्रणालियों में मुख्य समस्याएं। सियाम जे. आव्यूह गुदा. आवेदन. 27, 2006, पृ. 861-875. doi:10.1137/040616991
- सबाइन वान हफ़ेल|एस. वैन हफ़ेल और पी. लेमरलिंग, कुल न्यूनतम वर्ग और चर में त्रुटियाँ नमूने: विश्लेषण, कलन विधि और अनुप्रयोग। डॉर्ड्रेक्ट, नीदरलैंड्स: क्लूवर एकेडमिक पब्लिशर्स, 2002।
- एस. जो और एस. डब्ल्यू. किम, शोर डेटा आव्यूह के साथ लगातार सामान्यीकृत न्यूनतम माध्य वर्ग फ़िल्टरिंग। आईईईई ट्रांस. सिग्नल प्रोसेस., वॉल्यूम. 53, नहीं. 6, पृ. 2112-2123, जून 2005।
- आर. डी. डीग्रोट और ई. एम. डाउलिंग, डेटा न्यूनतम वर्ग समस्या और चैनल समीकरण। आईईईई ट्रांस. सिग्नल प्रोसेस., वॉल्यूम. 41, नहीं. 1, पृ. 407-411, जनवरी 1993।
- सबाइन वान हफ़ेल|एस. वैन हफ़ेल और जे. वंदेवाले, कुल न्यूनतम वर्ग समस्याएं: कम्प्यूटेशनल पहलू और विश्लेषण। सियाम प्रकाशन, फिलाडेल्फिया पीए, 1991। doi:10.1137/1.9781611971002
- टी. अबत्ज़ोग्लू और जे. मेंडल, प्रोक में कुल न्यूनतम वर्ग बाधित। आईईईई इंट. कॉन्फ़. ध्वनि, भाषण, सिग्नल प्रक्रिया। (आईसीएएसएसपी'87), अप्रैल 1987, खंड। 12, पृ. 1485-1488.
- पी. डी ग्रोएन एन इंट्रोडक्शन टू टोटल मिनिस्ट स्क्वेर्स, इन न्यू आर्कीफ वूर विस्कुंडे, विएर्डे सीरी, डील 14, 1996, पीपी. 237-253 arxiv. संगठन.
- जी. एच. गोलूब और सी. एफ. वैन लोन, कुल न्यूनतम वर्ग समस्या का विश्लेषण। संख्या पर सियाम जे. एनल., 17, 1980, पृ. 883-893. doi:10.1137/0717073
- एक रेखा का लंबवत प्रतिगमन MathPages पर
- ए. आर. अमिरी-सिमकूई और एस. जाज़ेरी, जर्नल ऑफ जियोडेटिक साइंस, 2 (2): 113-124, 2012 में मानक न्यूनतम वर्ग सिद्धांत द्वारा तैयार भारित कुल न्यूनतम वर्ग अमीरी/JGS_Amiri_Jazaeri_2012.pdf।
श्रेणी:अनुप्रयुक्त गणित श्रेणी:वक्र फिटिंग श्रेणी:न्यूनतम वर्ग श्रेणी:प्रतिगमन नमूना