कुल न्यूनतम वर्ग: Difference between revisions
m (6 revisions imported from alpha:कुल_न्यूनतम_वर्ग) |
No edit summary |
||
Line 151: | Line 151: | ||
श्रेणी:प्रतिगमन नमूना | श्रेणी:प्रतिगमन नमूना | ||
[[Category:Articles with hatnote templates targeting a nonexistent page|Total Least Squares]] | |||
[[Category: | [[Category:Articles with invalid date parameter in template]] | ||
[[Category:Created On 07/07/2023]] | [[Category:CS1 errors]] | ||
[[Category:Vigyan Ready]] | [[Category:Collapse templates|Total Least Squares]] | ||
[[Category:Created On 07/07/2023|Total Least Squares]] | |||
[[Category:Machine Translated Page|Total Least Squares]] | |||
[[Category:Navigational boxes| ]] | |||
[[Category:Navigational boxes without horizontal lists|Total Least Squares]] | |||
[[Category:Pages with empty portal template|Total Least Squares]] | |||
[[Category:Pages with maths render errors|Total Least Squares]] | |||
[[Category:Pages with script errors|Total Least Squares]] | |||
[[Category:Portal-inline template with redlinked portals|Total Least Squares]] | |||
[[Category:Sidebars with styles needing conversion|Total Least Squares]] | |||
[[Category:Template documentation pages|Documentation/doc]] | |||
[[Category:Templates Vigyan Ready|Total Least Squares]] | |||
[[Category:Templates generating microformats|Total Least Squares]] | |||
[[Category:Templates that are not mobile friendly|Total Least Squares]] | |||
[[Category:Templates using TemplateData|Total Least Squares]] | |||
[[Category:Wikipedia articles needing page number citations from June 2012]] | |||
[[Category:Wikipedia metatemplates|Total Least Squares]] |
Revision as of 20:47, 15 July 2023
एक श्रृंखला का हिस्सा |
प्रतिगमन विश्लेषण |
---|
मॉडल |
अनुमान |
पार्श्वभूमि |
|
प्रयुक्त सांख्यिकी में, कुल न्यूनतम वर्ग एक प्रकार का चर-त्रुटि प्रतिगमन होता है, एक न्यूनतम वर्ग डेटा नमूना तकनीक आश्रित और स्वतंत्र दोनों चर पर अवलोकन संबंधी त्रुटियों को ध्यान में रखता है। यह डेमिंग प्रतिगमन और ओर्थोगोनल प्रतिगमन का सामान्यीकरण होता है, और इसे रैखिक और गैर-रेखीय दोनों नमूनों पर प्रयुक्त किया जा सकता है।
डेटा का कुल न्यूनतम वर्ग सन्निकटन सामान्यतः फ्रोबेनियस मानदंड में, डेटा आव्यूह के निम्न-वर्ग सन्निकटन के सर्वोत्तम के बराबर होता है।[1]
रेखीय नमूना
पृष्ठभूमि
डेटा नमूने की न्यूनतम वर्ग विधि में, उद्देश्य फलन, एस,
जहां r सांख्यिकी में त्रुटियों और अवशेषों का वेक्टर है और W एक आव्यूह है। रैखिक न्यूनतम वर्ग (गणित) में नमूने में ऐसे समीकरण होते है जो पैरामीटर वेक्टर में दिखाई देने वाले मापदंडों में रैखिक होते है , इसलिए अवशेष दिए गए है
'y' में m अवलोकन और 'β' में m>n के साथ n पैरामीटर है। 'X' एक m×n आव्यूह है जिसके तत्व या तो स्थिरांक है या स्वतंत्र चर, 'x' के फलन है। आव्यूह W, आदर्श रूप से, विचरण-सहप्रसरण आव्यूह का व्युत्क्रम है अवलोकनों में से y. स्वतंत्र चर को त्रुटि रहित माना जाता है। प्रवणता समीकरणों को शून्य पर सेट करके पैरामीटर अनुमान प्राप्त किया जाता है, जिसके परिणामस्वरूप सामान्य समीकरण बनते है[note 1] :
सभी चरों में अवलोकन त्रुटियों की अनुमति
मान लेते है x और y दोनों को भिन्नता-सहप्रसरण आव्यूह के साथ त्रुटि के अधीन देखा जाता है और । इस स्थिति में वस्तुनिष्ठ फलन को इस प्रकार लिखा जा सकता है
जहाँ और क्रमशः x और y में अवशेष है। स्पष्ट रूप से यह अवशेष एक-दूसरे से स्वतंत्र नहीं हो सकते है। नमूना फलन को इस रूप में लिखा जाता है , समस्याओं को M स्थिति समीकरणों द्वारा व्यक्त किया जाता है।[2]
इस प्रकार, M समस्याओं के अधीन उद्देश्य फलन को कम करते है। इसे लैग्रेंज गुणक के उपयोग से हल किया जाता है। तब यह,[3] परिणाम प्राप्त होता है.
या वैकल्पिक रूप से
जहां M स्वतंत्र और आश्रित दोनों चर के सापेक्ष विचरण-सहप्रसरण आव्यूह है।
उदाहरण
जब डेटा त्रुटियां असंबद्ध होती है, तो सभी आव्यूह M और W विकर्ण होते है
इस स्थिति में
यह दर्शाता है कि किस प्रकार यह बिंदु उपयोग किए जा रहे नमूना द्वारा निर्धारित किया जाता है। पैरामीटर को अंकित करके अभिव्यक्ति को सामान्यीकृत किया जा सकता है
इस प्रकार की अभिव्यक्ति का उपयोग संतुलन स्थिरांक पैरामीटर त्रुटियों और सहसंबंध के निर्धारण में किया जाता है, जहां x पर एक छोटी त्रुटि y पर एक बड़ी त्रुटि में बदल जाती है।
बीजगणितीय दृष्टिकोण
जैसा कि 1980 में गोलूब और वैन लोन द्वारा प्रस्तुत किया था, कि टीएलएस समस्या का सामान्य रूप से कोई समाधान नहीं होता है।[4] निम्नलिखित उस साधारण स्थिति पर विचार करता है जहां कोई विशेष धारणा बनाए बिना एक अनूठा समाधान उपस्थित होता है।
एकल मूल्य अपघटन (एसवीडी) का उपयोग करके टीएलएस की गणना मानक पुस्तकों में वर्णित है।[5] ईस् तरह से समीकरण हल कर सकते है
B के लिए जहां x m-n है और y m-k है।[note 2] अर्थात, हम B को प्राप्त करते है जो क्रमशः x और y के लिए त्रुटि आव्यूह e और f को कम करता है। वह है,
जहाँ ई और f के साथ-साथ संवर्धित आव्यूह है फ्रोबेनियस मानदंड एक आव्यूह में सभी प्रविष्टियों के वर्गों के योग का वर्गमूल और आव्यूह की पंक्तियों की लंबाई के वर्गों के योग का वर्गमूल होता है।
इसे इस प्रकार पुनः लिखा जा सकता है
जहाँ है
फिर संख्या प्राप्त होती है जिससे वर्गमूल कम हो जाता है परिभाषित करने के लिए संवर्धित आव्यूह का एकवचन मूल्य अपघटन होता है .
जहां V को X और Y के अनुरूप संख्याओं में विभाजित किया जाता है।
एकार्ट-यंग प्रमेय का उपयोग करते हुए, त्रुटि के मानदंड को न्यूनतम करने वाला सन्निकटन आव्यूह और अपरिवर्तित रहता है, जबकि सबसे छोटा एकवचन मानों को शून्य से बदल दिया जाता है। अर्थात हम चाहते है
तो रैखिकता से,
फिर हम इसे सरल बनाते हुए U और Σ आव्यूह से संख्याओं को हटा सकते है
यह E और F प्रदान करते है जिससे कि
अब यदि निरर्थक है, जो हमेशा सामान्य नहीं होते है
(ध्यान दें कि टीएलएस का व्यवहार तब होता है जब अच्छी तरह से समझ में नहीं आता है), फिर हम दोनों पक्षों को सही से गुणा कर सकते है [6]
इसलिए
इसका एक सरल जीएनयू सप्तक कार्यान्वयन है:
function B = tls(X, Y)
[m n] = size(X); % n is the width of X (X is m by n)
Z = [X Y]; % Z is X augmented with Y.
[U S V] = svd(Z, 0); % find the SVD of Z.
VXY = V(1:n, 1+n:end); % Take the block of V consisting of the first n rows and the n+1 to last column
VYY = V(1+n:end, 1+n:end); % Take the bottom-right block of V.
B = -VXY / VYY;
end
समस्या को हल करने की विधि ऊपर वर्णित है, जिसके लिए आव्यूह की आवश्यकता होती है इसे तथाकथित मौलिक टीएलएस कलन विधि द्वारा थोड़ा बढ़ाया जा सकता है।[7]
गणना
मौलिक टीएलएस कलन विधि का मानक कार्यान्वयन नेटलिब के माध्यम से उपलब्ध होता है।[8][9] सभी आधुनिक कार्यान्वयन, उदाहरण के लिए, सामान्य न्यूनतम वर्ग समस्याओं के अनुक्रम को हल करने पर आधारित, आव्यूह का अनुमान लगाते है (संकेतित साहित्य में), जैसा कि सबाइन वान हफेल और वांडेवेले द्वारा प्रस्तुत किया गया है। चूँकि, कई स्थितियों में टीएलएस समाधान नहीं होता है।[10][11]
अरैखिक नमूना
गैर-रेखीय न्यूनतम वर्गों के लिए पुनरावृत्ति चक्र के लिए सामान्य समीकरणों को इस प्रकार लिखा जा सकता है
जहाँ जैकोबियन आव्यूह और निर्धारक है।
ज्यामितीय व्याख्या
जब स्वतंत्र चर त्रुटि-मुक्त होता है तो एक अवशिष्ट प्रेक्षित डेटा बिंदु और फिट किए गए वक्र (या सतह) के बीच ऊर्ध्वाधर दूरी का प्रतिनिधित्व करता है। कुल न्यूनतम वर्गों में एक अवशिष्ट डेटा बिंदु और किसी दिशा में मापे गए फिट किए गए वक्र के बीच की दूरी को दर्शाता है। वास्तव में, यदि दोनों चर एक ही इकाइयों में मापे जाते है और दोनों चर पर त्रुटियां समान होती है, तो अवशिष्ट एक बिंदु से एक रेखा तक की दूरी को दर्शाता है, अर्थात, अवशिष्ट वेक्टर वक्र के स्पर्शरेखा के लंबवत होता है। इस कारण से, इस प्रकार के प्रतिगमन को कभी-कभी दो आयामी यूक्लिडियन प्रतिगमन कहा जाता है (स्टीन, 1983)[12] या ओर्थोगोनल प्रतिगमन।
स्केल अपरिवर्तनीय विधियाँ
यदि चरों को समान इकाइयों में नहीं मापा जाता है तो कठिनाई उत्पन्न होती है। पहले डेटा बिंदु और रेखा के बीच की दूरी मापने पर विचार करते है: इस दूरी के लिए माप इकाइयाँ क्या है? यदि हम पाइथागोरस प्रमेय के आधार पर दूरी मापने पर विचार करते है तो यह स्पष्ट होता है कि हम विभिन्न इकाइयों में मापी गई मात्राओं को जोड़ते है, जो अर्थहीन होते है। दूसरे, यदि हम किसी एक चर को दोबारा मापते है, उदाहरण के लिए, किलोग्राम के अतिरिक्त ग्राम में मापते है, तो अलग-अलग परिणाम (एक अलग रेखा) के साथ समाप्त होते है। इन समस्याओं से बचने के लिए कभी-कभी यह उपदेश दिया जाता है कि हम आयामहीन चर में परिवर्तित करते है - इसे सामान्यीकरण या मानकीकरण कहा जा सकता है। चूँकि, ऐसा करने की कई विधियां होती है, जो एक-दूसरे के समकक्ष नहीं होते है। एक दृष्टिकोण ज्ञात (या अनुमानित) माप परिशुद्धता द्वारा सामान्यीकरण करते है, विचरण के विश्लेषण के माध्यम से अज्ञात त्रुटिहीनता प्राप्त की जा सकती है।
संक्षेप में, कुल न्यूनतम वर्गों में इकाइयों-अपरिवर्तनीय की स्थिति नहीं होती है। यह स्केल अपरिवर्तनीयता नहीं होता है। यदि जोड़ के अतिरिक्त गुणा का उपयोग किया जाता है तो विभिन्न इकाइयों में मापे गए अवशेषों (दूरियों) को जोड़ा जाता है। एक रेखा फ़िट करने पर विचार करते है: प्रत्येक डेटा बिंदु के लिए ऊर्ध्वाधर और क्षैतिज अवशेषों का उत्पाद अवशिष्ट रेखाओं और फिट की गई रेखा द्वारा निर्मित त्रिभुज के क्षेत्रफल के दोगुने के बराबर होता है। हम वह रेखा प्राप्त करते है जो इन क्षेत्रों के योग को न्यूनतम करती है। नोबेल पुरस्कार विजेता पॉल सैमुएलसन ने 1942 में सिद्ध किया कि, दो आयामों में, यह एकमात्र रेखा होती है जिसे केवल मानक विचलन के अनुपात और सहसंबंध गुणांक के संदर्भ में व्यक्त किया जा सकता है, जो (1) सही समीकरण में फिट बैठता है, ( 2) स्केल अपरिवर्तनीय प्रदर्शित करता है, और (3) चरों के आदान-प्रदान के अनुसार अपरिवर्तनीय प्रदर्शित करता है।[13] इस समाधान को विभिन्न विषयों में फिर से प्राप्त किया जाता है और इसे मानकीकृत प्रमुख अक्ष (रिकर 1975, वार्टन एट अल., 2006) के रूप में जाना जाता है।[14][15] कम प्रमुख अक्ष, ज्यामितीय माध्य कार्यात्मक संबंध (ड्रेपर और स्मिथ, 1998),[16] न्यूनतम उत्पाद प्रतिगमन, विकर्ण प्रतिगमन, कार्बनिक सहसंबंध की रेखा, और न्यूनतम क्षेत्र रेखा (टोफालिस, 2002) होते है।[17] टोफलिस (2015)[18] अनेक चरों के समाधानों के लिए इस दृष्टिकोण का उपयोग करते है।
यह भी देखें
- डेमिंग रिग्रेशन, दो भविष्यवक्ताओं और स्वतंत्र त्रुटियों वाला एक विशेष स्थिति।
- चर नमूना में त्रुटियाँ
- गॉस-हेल्मर्ट नमूना
- रेखीय प्रतिगमन
- कम से कम वर्गों
- प्रमुख कंपोनेंट विश्लेषण
- प्रमुख घटक प्रतिगमन
टिप्पणियाँ
- ↑ An alternative form is , where is the parameter shift from some starting estimate of and is the difference between y and the value calculated using the starting value of
- ↑ The notation XB ≈ Y is used here to reflect the notation used in the earlier part of the article. In the computational literature the problem has been more commonly presented as AX ≈ B, i.e. with the letter X used for the n-by-k matrix of unknown regression coefficients.
संदर्भ
- ↑ I. Markovsky and S. Van Huffel, Overview of total least squares methods. Signal Processing, vol. 87, pp. 2283–2302, 2007. preprint
- ↑ W.E. Deming, Statistical Adjustment of Data, Wiley, 1943
- ↑ Gans, Peter (1992). रासायनिक विज्ञान में डेटा फिटिंग. Wiley. ISBN 9780471934127. Retrieved 4 December 2012.
- ↑ G. H. Golub and C. F. Van Loan, An analysis of the total least squares problem. Numer. Anal., 17, 1980, pp. 883–893.
- ↑ Golub, Gene H.; Van Loan, Charles F. (1996). Matrix Computations (3rd ed.). The Johns Hopkins University Press. pp 596.
- ↑ Bjõrck, Ake (1996) Numerical Methods for Least Squares Problems, Society for Industrial and Applied Mathematics. ISBN 978-0898713602[page needed]
- ↑ S. Van Huffel and J. Vandewalle (1991) The Total Least Squares Problems: Computational Aspects and Analysis. SIAM Publications, Philadelphia PA.
- ↑ S. Van Huffel, Documented Fortran 77 programs of the extended classical total least squares algorithm, the partial singular value decomposition algorithm and the partial total least squares algorithm, Internal Report ESAT-KUL 88/1, ESAT Lab., Dept. of Electrical Engineering, Katholieke Universiteit Leuven, 1988.
- ↑ S. Van Huffel, The extended classical total least squares algorithm, J. Comput. Appl. Math., 25, pp. 111–119, 1989.
- ↑ M. Plešinger, The Total Least Squares Problem and Reduction of Data in AX ≈ B. Doctoral Thesis, TU of Liberec and Institute of Computer Science, AS CR Prague, 2008. Ph.D. Thesis
- ↑ I. Hnětynková, M. Plešinger, D. M. Sima, Z. Strakoš, and S. Van Huffel, The total least squares problem in AX ≈ B. A new classification with the relationship to the classical works. SIMAX vol. 32 issue 3 (2011), pp. 748–770.
- ↑ Stein, Yaakov J. "दो आयामी यूक्लिडियन प्रतिगमन" (PDF).
{{cite journal}}
: Cite journal requires|journal=
(help) - ↑ Samuelson, Paul A. (1942). "वैकल्पिक प्रतिगमन पर एक नोट". Econometrica. 10 (1): 80–83. doi:10.2307/1907024. JSTOR 1907024.
- ↑ Ricker, W. E. (1975). "प्रोफेसर जोलिकोयूर की टिप्पणियों से संबंधित एक नोट". Journal of the Fisheries Research Board of Canada. 32 (8): 1494–1498. doi:10.1139/f75-172.
- ↑ Warton, David I.; Wright, Ian J.; Falster, Daniel S.; Westoby, Mark (2006). "एलोमेट्री के लिए द्विचर रेखा-फिटिंग विधियाँ". Biological Reviews. 81 (2): 259–291. CiteSeerX 10.1.1.461.9154. doi:10.1017/S1464793106007007. PMID 16573844. S2CID 16462731.
- ↑ Draper, NR and Smith, H. Applied Regression Analysis, 3rd edition, pp. 92–96. 1998
- ↑ Tofallis, Chris (2002). "Model Fitting for Multiple Variables by Minimising the Geometric Mean Deviation". In Van Huffel, Sabine; Lemmerling, P. (eds.). Total Least Squares and Errors-in-Variables Modeling: Analysis, Algorithms and Applications. Dordrecht: Kluwer Academic Publ. ISBN 978-1402004766. SSRN 1077322.
- ↑ Tofallis, Chris (2015). "पूर्ण सहसंबंध संबंध के साथ डेटा में समीकरणों को फिट करना". SSRN 2707593.
अन्य
- आई. ह्नतिनकोवा, एम. प्लेज़िंगर, डी. एम. सिमा, ज़ेड स्ट्रैकोस, और सबाइन वान हफ़ेल|एस। वैन हफ़ेल, AX ≈ B में कुल न्यूनतम वर्ग समस्या। मौलिक कार्यों के संबंध में एक नया वर्गीकरण। सिमैक्स वॉल्यूम. 32 अंक 3 (2011), पृष्ठ 748-770। प्रीप्रिंट के रूप में उपलब्ध है।
- एम. प्लेसिंगर, द टोटल लीस्ट स्क्वेयर्स प्रॉब्लम एंड रिडक्शन ऑफ डेटा इन एएक्स ≈ बी. डॉक्टोरल थीसिस, टीयू ऑफ लिबरेक एंड इंस्टीट्यूट ऑफ कंप्यूटर साइंस, एएस सीआर प्राग, 2008। 20120724080908/http://www.fp.tul.cz/~plesinger/my_publications/doctoral_thsis/thsis.pdf पीएच.डी. थीसिस
- सी. सी. पेगे, जेड. स्ट्रैकोस, रैखिक बीजगणितीय प्रणालियों में मुख्य समस्याएं। सियाम जे. आव्यूह गुदा. आवेदन. 27, 2006, पृ. 861-875. doi:10.1137/040616991
- सबाइन वान हफ़ेल|एस. वैन हफ़ेल और पी. लेमरलिंग, कुल न्यूनतम वर्ग और चर में त्रुटियाँ नमूने: विश्लेषण, कलन विधि और अनुप्रयोग। डॉर्ड्रेक्ट, नीदरलैंड्स: क्लूवर एकेडमिक पब्लिशर्स, 2002।
- एस. जो और एस. डब्ल्यू. किम, शोर डेटा आव्यूह के साथ लगातार सामान्यीकृत न्यूनतम माध्य वर्ग फ़िल्टरिंग। आईईईई ट्रांस. सिग्नल प्रोसेस., वॉल्यूम. 53, नहीं. 6, पृ. 2112-2123, जून 2005।
- आर. डी. डीग्रोट और ई. एम. डाउलिंग, डेटा न्यूनतम वर्ग समस्या और चैनल समीकरण। आईईईई ट्रांस. सिग्नल प्रोसेस., वॉल्यूम. 41, नहीं. 1, पृ. 407-411, जनवरी 1993।
- सबाइन वान हफ़ेल|एस. वैन हफ़ेल और जे. वंदेवाले, कुल न्यूनतम वर्ग समस्याएं: कम्प्यूटेशनल पहलू और विश्लेषण। सियाम प्रकाशन, फिलाडेल्फिया पीए, 1991। doi:10.1137/1.9781611971002
- टी. अबत्ज़ोग्लू और जे. मेंडल, प्रोक में कुल न्यूनतम वर्ग बाधित। आईईईई इंट. कॉन्फ़. ध्वनि, भाषण, सिग्नल प्रक्रिया। (आईसीएएसएसपी'87), अप्रैल 1987, खंड। 12, पृ. 1485-1488.
- पी. डी ग्रोएन एन इंट्रोडक्शन टू टोटल मिनिस्ट स्क्वेर्स, इन न्यू आर्कीफ वूर विस्कुंडे, विएर्डे सीरी, डील 14, 1996, पीपी. 237-253 arxiv. संगठन.
- जी. एच. गोलूब और सी. एफ. वैन लोन, कुल न्यूनतम वर्ग समस्या का विश्लेषण। संख्या पर सियाम जे. एनल., 17, 1980, पृ. 883-893. doi:10.1137/0717073
- एक रेखा का लंबवत प्रतिगमन MathPages पर
- ए. आर. अमिरी-सिमकूई और एस. जाज़ेरी, जर्नल ऑफ जियोडेटिक साइंस, 2 (2): 113-124, 2012 में मानक न्यूनतम वर्ग सिद्धांत द्वारा तैयार भारित कुल न्यूनतम वर्ग अमीरी/JGS_Amiri_Jazaeri_2012.pdf।
श्रेणी:अनुप्रयुक्त गणित श्रेणी:वक्र फिटिंग श्रेणी:न्यूनतम वर्ग श्रेणी:प्रतिगमन नमूना