बहुपद प्रतिगमन: Difference between revisions
No edit summary |
|||
Line 2: | Line 2: | ||
{{Regression bar}} | {{Regression bar}} | ||
'''[[बहुपद]] प्रतिगमन,''' सांख्यिकी में, [[प्रतिगमन विश्लेषण]] का रूप है जिसमें [[स्वतंत्र चर]] ''x'' और आश्रित चर ''y'' के बीच संबंध को ''x'' में ''n''वीं कोटि बहुपद के रूप में तैयार किया जाता है। बहुपद प्रतिगमन ''x'' के मान और ''y'' की संगत [[सशर्त अपेक्षा|सशर्त माध्य,]] E(''y'' |''x'') के बीच अरैखिक संबंध के अनुरूप है। यद्यपि ''बहुपद प्रतिगमन'' [[आंकड़े]] के लिए अरैखिक मॉडल के अनुरूप है, [[अनुमान सिद्धांत|सांख्यिकीय अनुमान]] समस्या के रूप में यह रैखिक है, इस अर्थ में कि प्रतिगमन फलन E(''y'' | ''x'') आंकड़े से अनुमानित अज्ञात [[पैरामीटर|मापदंड]] में रैखिक है। इस कारण से, बहुपद प्रतिगमन को एकाधिक रैखिक प्रतिगमन का विशेष मामला माना जाता है। | |||
आधारभूत चर के बहुपद विस्तार से उत्पन्न "व्याख्यात्मक (स्वतंत्र)" चर को उच्च-कोटि शब्दों के रूप में जाना जाता है। ऐसे चर का उपयोग [[सांख्यिकीय वर्गीकरण]] समायोजन में भी किया जाता है।<ref name="Chang2010">{{cite journal |author1=Yin-Wen Chang |author2=Cho-Jui Hsieh |author3=Kai-Wei Chang |author4=Michael Ringgaard |author5=Chih-Jen Lin |year=2010 |url=http://jmlr.csail.mit.edu/papers/v11/chang10a.html |title=रैखिक एसवीएम के माध्यम से निम्न-डिग्री बहुपद डेटा मैपिंग का प्रशिक्षण और परीक्षण|journal=[[Journal of Machine Learning Research]] |volume=11 |pages=1471–1490}}</ref> | आधारभूत चर के बहुपद विस्तार से उत्पन्न "व्याख्यात्मक (स्वतंत्र)" चर को उच्च-कोटि शब्दों के रूप में जाना जाता है। ऐसे चर का उपयोग [[सांख्यिकीय वर्गीकरण]] समायोजन में भी किया जाता है।<ref name="Chang2010">{{cite journal |author1=Yin-Wen Chang |author2=Cho-Jui Hsieh |author3=Kai-Wei Chang |author4=Michael Ringgaard |author5=Chih-Jen Lin |year=2010 |url=http://jmlr.csail.mit.edu/papers/v11/chang10a.html |title=रैखिक एसवीएम के माध्यम से निम्न-डिग्री बहुपद डेटा मैपिंग का प्रशिक्षण और परीक्षण|journal=[[Journal of Machine Learning Research]] |volume=11 |pages=1471–1490}}</ref> | ||
Line 74: | Line 74: | ||
* Microsoft Excel makes use of polynomial regression when fitting a trendline to data points on an X Y scatter plot.<ref>{{cite web|last1=Stevenson|first1=Christopher|title=Tutorial: Polynomial Regression in Excel|url=https://facultystaff.richmond.edu/~cstevens/301/Excel4.html|website=facultystaff.richmond.edu|access-date=22 January 2017}}</ref> | * Microsoft Excel makes use of polynomial regression when fitting a trendline to data points on an X Y scatter plot.<ref>{{cite web|last1=Stevenson|first1=Christopher|title=Tutorial: Polynomial Regression in Excel|url=https://facultystaff.richmond.edu/~cstevens/301/Excel4.html|website=facultystaff.richmond.edu|access-date=22 January 2017}}</ref> | ||
== संदर्भ == | == संदर्भ == | ||
{{Reflist|30em}} | {{Reflist|30em}} | ||
==बाहरी संबंध== | ==बाहरी संबंध== | ||
*[https://phet.colorado.edu/en/simulation/curve-fitting Curve Fitting], [[PhET]] Interactive simulations, University of Colorado at Boulder | *[https://phet.colorado.edu/en/simulation/curve-fitting Curve Fitting], [[PhET]] Interactive simulations, University of Colorado at Boulder |
Revision as of 13:02, 17 July 2023
एक श्रृंखला का हिस्सा |
प्रतिगमन विश्लेषण |
---|
मॉडल |
अनुमान |
पार्श्वभूमि |
|
बहुपद प्रतिगमन, सांख्यिकी में, प्रतिगमन विश्लेषण का रूप है जिसमें स्वतंत्र चर x और आश्रित चर y के बीच संबंध को x में nवीं कोटि बहुपद के रूप में तैयार किया जाता है। बहुपद प्रतिगमन x के मान और y की संगत सशर्त माध्य, E(y |x) के बीच अरैखिक संबंध के अनुरूप है। यद्यपि बहुपद प्रतिगमन आंकड़े के लिए अरैखिक मॉडल के अनुरूप है, सांख्यिकीय अनुमान समस्या के रूप में यह रैखिक है, इस अर्थ में कि प्रतिगमन फलन E(y | x) आंकड़े से अनुमानित अज्ञात मापदंड में रैखिक है। इस कारण से, बहुपद प्रतिगमन को एकाधिक रैखिक प्रतिगमन का विशेष मामला माना जाता है।
आधारभूत चर के बहुपद विस्तार से उत्पन्न "व्याख्यात्मक (स्वतंत्र)" चर को उच्च-कोटि शब्दों के रूप में जाना जाता है। ऐसे चर का उपयोग सांख्यिकीय वर्गीकरण समायोजन में भी किया जाता है।[1]
इतिहास
बहुपद प्रतिगमन मॉडल सामान्यतः न्यूनतम वर्ग की विधि का उपयोग के अनुरूप होते हैं। न्यूनतम-वर्ग विधि अनुमानक के पूर्वाग्रह के विचरण को कम करती है| गॉस-मार्कोव प्रमेय की शर्तों के अनुसार, न्यूनतम-वर्ग विधि गुणांक के निष्पक्ष अनुमानकों के विचरण को कम करती है। न्यूनतम-वर्ग विधि 1805 में एड्रियन मैरी लीजेंड्रे द्वारा और 1809 में गॉस द्वारा प्रकाशित की गई थी। बहुपद प्रतिगमन के लिए प्रयोग का पहला डिज़ाइन 1815 में इष्टतम डिज़ाइन जोसेफ़ डियाज़ गेर्गोन के पेपर में दिखाई दिया था।[2][3] बीसवीं सदी में, बहुपद प्रतिगमन ने डिजाइन और अनुमान के मुद्दों पर अधिक जोर देने के साथ, प्रतिगमन विश्लेषण के विकास में एक महत्वपूर्ण भूमिका निभाई थी।[4] हाल ही में, बहुपद मॉडल के उपयोग को अन्य तरीकों से पूरक किया गया है, गैर-बहुपद मॉडल में कुछ वर्गों की समस्याओं के लिए फायदे हैं।
परिभाषा और उदाहरण
प्रतिगमन विश्लेषण का लक्ष्य स्वतंत्र चर (या स्वतंत्र चर के सदिश) x के मान के संदर्भ में आश्रित चर y के अपेक्षित मान को मॉडल करना है। सरल रैखिक प्रतिगमन में, मॉडल
का उपयोग किया जाता है, जहां ε अदिश (गणित) चर x पर प्रतिबंधित माध्य शून्य के साथ अप्राप्य यादृच्छिक त्रुटि है। इस मॉडल में, x के मान में प्रत्येक इकाई वृद्धि के लिए, y की सशर्त अपेक्षा β1 इकाइयाँ से बढ़ जाती है।
कई समायोजन में, ऐसा रैखिक संबंध कायम नहीं रह सकता है। उदाहरण के लिए, यदि हम रासायनिक संश्लेषण की उत्पन्न को उस तापमान के संदर्भ में मॉडलिंग कर रहे हैं जिस पर संश्लेषण होता है, तो हम पा सकते हैं कि तापमान में प्रत्येक इकाई वृद्धि के लिए मात्रा में वृद्धि से उत्पन्न में सुधार होता है। इस मामले में, हम विधि का द्विघात मॉडल प्रस्तावित कर सकते हैं
इस मॉडल में, जब तापमान x से x + 1 इकाई तक बढ़ाया जाता है, तो अपेक्षित उत्पन्न में परिवर्तन होता है। (इसे इस समीकरण में x को x+1 से प्रतिस्थापित करके और x+1 में समीकरण से x में समीकरण घटाकर देखा जा सकता है।) x में अनंत परिवर्तन के लिए, y पर प्रभाव x के संबंध में कुल व्युत्पन्न द्वारा दिया जाता है। : तथ्य यह है कि उत्पन्न में परिवर्तन x पर निर्भर करता है, जो x और y के बीच संबंध को अरेखीय बनाता है, भले ही मॉडल अनुमानित मापदंडों में रैखिक हो।
सामान्य तौर पर, हम y के अपेक्षित मान को nवीं कोटि बहुपद के रूप में मॉडल कर सकते हैं, जिससे सामान्य बहुपद प्रतिगमन मॉडल प्राप्त होता है
ये मॉडल आसानी से अनुमान सिद्धांत के दृष्टिकोण से सभी रैखिक हैं, क्योंकि प्रतिगमन फलन अज्ञात मापदंड β0, β1, ...के संदर्भ में रैखिक है इसलिए, न्यूनतम वर्ग विश्लेषण के लिए, बहुपद प्रतिगमन की संगणनात्मक और अनुमानित समस्याओं को रैखिक प्रतिगमन की तकनीकों का उपयोग करके पूरी तरह से संबोधित किया जा सकता है। यह एकाधिक प्रतिगमन मॉडल में विशिष्ट स्वतंत्र चर के रूप में x, x2, ..का उपचार करके किया जाता है।
आव्यूह विधि और अनुमानों की गणना
बहुपद प्रतिगमन मॉडल
डिज़ाइन आव्यूह प्रतिक्रिया सदिश , मापदंड सदिश , और सदिश यादृच्छिक त्रुटियो के संदर्भ में आव्यूह रूप में व्यक्त किया जा सकता है। i-वीं पंक्ति और i-वें आंकड़े नमूने के लिए x और y मान सम्मिलित होंगे। तब मॉडल को रैखिक समीकरणों क प्रणाली के रूप में लिखा जा सकता है:
जिसे शुद्ध आव्यूह संकेतन का उपयोग करते समय इस प्रकार लिखा जाता है
अनुमान बहुपद प्रतिगमन गुणांक का सदिश (साधारण न्यूनतम वर्ग अनुमान का उपयोग करके) है
यह मानते हुए कि m < n जो आव्यूह के व्युत्क्रमणीय होने के लिए आवश्यक है; तब से वेंडरमोंडे आव्यूह है, यदि सभी हो तो व्युत्क्रमणीयता की स्थिति कायम रहने की गारंटी है मान भिन्न हैं। यह अद्वितीय न्यूनतम-वर्ग समाधान है।
व्याख्या
यद्यपि बहुपद प्रतिगमन तकनीकी रूप से एकाधिक रैखिक प्रतिगमन का विशेष मामला है, अनुरूप बहुपद प्रतिगमन मॉडल की व्याख्या के लिए कुछ अलग परिप्रेक्ष्य की आवश्यकता होती है। बहुपद प्रतिगमन अनुरूप में व्यक्तिगत गुणांकों की व्याख्या करना अधिकांशतः मुश्किल होता है, क्योंकि अंतर्निहित एकपदी अत्यधिक सहसंबद्ध हो सकते हैं। उदाहरण के लिए, x और x2 का सहसंबंध 0.97 के आसपास होता है जब x अंतराल (0, 1) पर समान वितरण (निरंतर) होता है। यद्यपि लांबिक बहुपद का उपयोग करके सहसंबंध को कम किया जा सकता है, लेकिन समग्र रूप से अनुरूप किए गए प्रतिगमन फलन पर विचार करना सामान्यतः अधिक जानकारीपूर्ण होता है। प्रतिगमन फलन के अनुमान में अनिश्चितता की भावना प्रदान करने के लिए बिंदु-वार या एक साथ विश्वास्यता बैंड का उपयोग किया जाता है।
वैकल्पिक दृष्टिकोण
बहुपद प्रतिगमन दो मात्राओं के बीच कार्यात्मक संबंध को मॉडल करने के लिए आधार फलन का उपयोग, प्रतिगमन विश्लेषण का उदाहरण है। विशेष रूप से, यह बहुपद आधार के साथ रैखिक प्रतिगमन में प्रतिस्थापित करता है उदाहरण । बहुपद आधारों का कमी यह है कि आधार फलन "गैर-स्थानीय" हैं, जिसका अर्थ है कि किसी दिए गए मान पर y का अनुरूप मान x = x0, x से दूर x वाले आंकड़े मानों पर दृढ़ता से निर्भर करता है।[5] आधुनिक आँकड़ों में, बहुपद आधार-फलन का उपयोग नए आधार फलन, जैसे स्पलाइन (गणित), रेडियल आधार फलन और तरंगिका के साथ किया जाता है। आधार फलन के ये वर्ग कई प्रकार के आंकड़े के लिए अधिक अनुकूल अनुरूप प्रदान करते हैं।
बहुपद प्रतिगमन का लक्ष्य स्वतंत्र और आश्रित चर (तकनीकी रूप से, स्वतंत्र चर और आश्रित चर के सशर्त माध्य के बीच) के बीच गैर-रैखिक संबंध को मॉडल करना है। यह अप्राचल प्रतिगमन के लक्ष्य के समान है, जिसका उद्देश्य अरैखिक प्रतिगमन संबंधों को पकड़ना है।इसलिए, अप्राचल प्रतिगमन दृष्टिकोण जैसे समरेखण बहुपद प्रतिगमन के लिए उपयोगी विकल्प हो सकते हैं। इनमें से कुछ विधियाँ शास्त्रीय बहुपद प्रतिगमन के स्थानीयकृत रूप का उपयोग करती हैं।[6] पारंपरिक बहुपद प्रतिगमन का फायदा यह है कि एकाधिक प्रतिगमन के अनुमानित ढांचे का उपयोग किया जा सकता है (यह आधार कार्यों के अन्य वर्ग जैसे स्प्लिंस का उपयोग करते समय भी लागू होता है)।
एक अंतिम विकल्प कर्नेल विधि मॉडल का उपयोग करना है जैसे बहुपद कर्नेल के साथ सदिश प्रतिगमन का समर्थन करना है।
यदि अवशिष्टों (सांख्यिकी) में असमान भिन्नता है, तो उसके लिए भारित न्यूनतम वर्ग अनुमानक का उपयोग किया जा सकता है।[7]
यह भी देखें
- वक्र फिटिंग
- रेखा प्रतिगमन
- स्थानीय बहुपद प्रतिगमन
- बहुपद और तर्कसंगत फलन मॉडलिंग
- बहुपद प्रक्षेप
- प्रतिक्रिया सतह कार्यप्रणाली
- तख़्ता को समरेखण करना
टिप्पणियाँ
- Microsoft Excel makes use of polynomial regression when fitting a trendline to data points on an X Y scatter plot.[8]
संदर्भ
- ↑ Yin-Wen Chang; Cho-Jui Hsieh; Kai-Wei Chang; Michael Ringgaard; Chih-Jen Lin (2010). "रैखिक एसवीएम के माध्यम से निम्न-डिग्री बहुपद डेटा मैपिंग का प्रशिक्षण और परीक्षण". Journal of Machine Learning Research. 11: 1471–1490.
- ↑ Gergonne, J. D. (November 1974) [1815]. "अनुक्रमों के प्रक्षेप के लिए न्यूनतम वर्गों की विधि का अनुप्रयोग". Historia Mathematica (Translated by Ralph St. John and S. M. Stigler from the 1815 French ed.). 1 (4): 439–447. doi:10.1016/0315-0860(74)90034-2.
- ↑ Stigler, Stephen M. (November 1974). "Gergonne's 1815 paper on the design and analysis of polynomial regression experiments". Historia Mathematica. 1 (4): 431–439. doi:10.1016/0315-0860(74)90033-0.
- ↑ Smith, Kirstine (1918). "एक प्रेक्षित बहुपद फलन और उसके स्थिरांकों के समायोजित और अंतर्वेशित मूल्यों के मानक विचलन और प्रेक्षणों के वितरण के उचित विकल्प के लिए उनके द्वारा दिए जाने वाले मार्गदर्शन पर". Biometrika. 12 (1/2): 1–85. doi:10.2307/2331929. JSTOR 2331929.
- ↑
Such "non-local" behavior is a property of analytic functions that are not constant (everywhere). Such "non-local" behavior has been widely discussed in statistics:
- Magee, Lonnie (1998). "Nonlocal Behavior in Polynomial Regressions". The American Statistician. 52 (1): 20–22. doi:10.2307/2685560. JSTOR 2685560.
- ↑ Fan, Jianqing (1996). Local Polynomial Modelling and Its Applications: From linear regression to nonlinear regression. Monographs on Statistics and Applied Probability. Chapman & Hall/CRC. ISBN 978-0-412-98321-4.
- ↑ Conte, S.D.; De Boor, C. (2018). Elementary Numerical Analysis: An Algorithmic Approach. Classics in Applied Mathematics. Society for Industrial and Applied Mathematics (SIAM, 3600 Market Street, Floor 6, Philadelphia, PA 19104). p. 259. ISBN 978-1-61197-520-8. Retrieved 2020-08-28.
- ↑ Stevenson, Christopher. "Tutorial: Polynomial Regression in Excel". facultystaff.richmond.edu. Retrieved 22 January 2017.
बाहरी संबंध
- Curve Fitting, PhET Interactive simulations, University of Colorado at Boulder