गैर-रेखीय प्रतिगमन

From Vigyanwiki
Revision as of 19:55, 7 July 2023 by alpha>Indicwiki (Created page with "{{Short description|Regression analysis}} {{Regression bar}} Image:Michaelis-Menten saturation curve of an enzyme reaction.svg|thumb|300 पिक्सल| विवरण...")
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
विवरण के लिए माइकलिस-मेंटेन कैनेटीक्स देखें

आंकड़ों में, नॉनलाइनियर रिग्रेशन, रिग्रेशन विश्लेषण का एक रूप है जिसमें अवलोकन संबंधी डेटा को एक फ़ंक्शन द्वारा मॉडल किया जाता है जो मॉडल मापदंडों का एक नॉनलाइनियर संयोजन है और एक या अधिक स्वतंत्र चर पर निर्भर करता है। डेटा को क्रमिक सन्निकटन की विधि द्वारा फिट किया जाता है।

सामान्य

अरेखीय प्रतिगमन में, प्रपत्र का एक सांख्यिकीय मॉडल,

स्वतंत्र चरों के एक वेक्टर से संबंधित है, , और इससे जुड़े अवलोकित आश्रित चर, . कार्यक्रम पैरामीटर्स के वेक्टर के घटकों में अरेखीय है , लेकिन अन्यथा मनमाना। उदाहरण के लिए, एंजाइम कैनेटीक्स के लिए माइकलिस-मेंटेन मॉडल में दो पैरामीटर और एक स्वतंत्र चर है, जो इससे संबंधित है द्वारा:[lower-alpha 1]

यह फ़ंक्शन अरैखिक है क्योंकि इसे दोनों के रैखिक संयोजन के रूप में व्यक्त नहीं किया जा सकता हैएस।

स्वतंत्र चर में व्यवस्थित त्रुटि मौजूद हो सकती है लेकिन इसका उपचार प्रतिगमन विश्लेषण के दायरे से बाहर है। यदि स्वतंत्र चर त्रुटि-मुक्त नहीं हैं, तो यह एक त्रुटि-में-चर मॉडल है, जो इस दायरे से बाहर भी है।

गैर-रेखीय कार्यों के अन्य उदाहरणों में घातांकीय कार्य, लघुगणकीय वृद्धि, त्रिकोणमितीय कार्य, घातांक, गाऊसी फ़ंक्शन और कॉची वितरण शामिल हैं। कुछ फ़ंक्शन, जैसे कि घातीय या लघुगणकीय फ़ंक्शन, को रूपांतरित किया जा सकता है ताकि वे रैखिक हों। इस प्रकार परिवर्तित होने पर, मानक रैखिक प्रतिगमन किया जा सकता है लेकिन इसे सावधानी के साथ लागू किया जाना चाहिए। अधिक विवरण के लिए नीचे #Transformation|Linearization§Transformation देखें।

सामान्य तौर पर, सर्वोत्तम-फिटिंग मापदंडों के लिए कोई बंद-रूप अभिव्यक्ति नहीं होती है, जैसा कि रैखिक प्रतिगमन में होता है। आमतौर पर संख्यात्मक अनुकूलन (गणित) एल्गोरिदम सर्वोत्तम-फिटिंग पैरामीटर निर्धारित करने के लिए लागू किए जाते हैं। फिर से रैखिक प्रतिगमन के विपरीत, अनुकूलित किए जाने वाले फ़ंक्शन के कई स्थानीय अधिकतम हो सकते हैं और यहां तक ​​कि वैश्विक न्यूनतम भी एक अनुमानक अनुमान का पूर्वाग्रह उत्पन्न कर सकता है। व्यवहार में, वर्गों के योग के वैश्विक न्यूनतम को खोजने का प्रयास करने के लिए, अनुकूलन एल्गोरिथ्म के साथ मिलकर, मापदंडों के अनुमानित मूल्य का उपयोग किया जाता है।

अरेखीय डेटा मॉडलिंग से संबंधित विवरण के लिए न्यूनतम वर्ग और अरेखीय न्यूनतम वर्ग देखें।

प्रतिगमन आँकड़े

इस प्रक्रिया में अंतर्निहित धारणा यह है कि मॉडल को एक रैखिक फ़ंक्शन, अर्थात् प्रथम-क्रम टेलर श्रृंखला द्वारा अनुमानित किया जा सकता है:

कहाँ . इससे यह निष्कर्ष निकलता है कि न्यूनतम वर्ग अनुमानक द्वारा दिये गये हैं

इकाई मैट्रिक्स के आनुपातिक सहप्रसरण मैट्रिक्स के साथ सामान्यीकृत न्यूनतम वर्गों की तुलना करें। अरेखीय प्रतिगमन आँकड़ों की गणना और उपयोग रैखिक प्रतिगमन आँकड़ों की तरह किया जाता है, लेकिन सूत्रों में X के स्थान पर J का उपयोग किया जाता है।

जब समारोह स्वयं विश्लेषणात्मक रूप से ज्ञात नहीं है, लेकिन रेखीय प्रतिगमन की आवश्यकता है , या अधिक, ज्ञात मान (जहाँ अनुमानकों की संख्या है), सबसे अच्छा अनुमानक सीधे रैखिक टेम्पलेट फ़िट से प्राप्त किया जाता है [1]

(Linear_least_squares#Alternative_formulations भी देखें)।

रैखिक सन्निकटन आंकड़ों में पूर्वाग्रह (सांख्यिकी) का परिचय देता है। इसलिए, गैर-रेखीय मॉडल से प्राप्त आँकड़ों की व्याख्या करने में सामान्य से अधिक सावधानी की आवश्यकता होती है।

साधारण और भारित न्यूनतम वर्ग

सबसे उपयुक्त वक्र अक्सर वह माना जाता है जो आँकड़ों में वर्ग त्रुटियों और अवशेषों के योग को कम करता है। यह सामान्य न्यूनतम वर्ग (ओएलएस) दृष्टिकोण है। हालाँकि, ऐसे मामलों में जहां आश्रित चर में निरंतर भिन्नता नहीं होती है, भारित वर्ग अवशेषों का योग कम किया जा सकता है; भारित न्यूनतम वर्ग देखें. प्रत्येक भार आदर्श रूप से अवलोकन के विचरण के व्युत्क्रम के बराबर होना चाहिए, लेकिन पुनरावृत्त रूप से भारित न्यूनतम वर्ग एल्गोरिथ्म में, प्रत्येक पुनरावृत्ति पर भार की पुनर्गणना की जा सकती है।

रैखिकीकरण

परिवर्तन

मॉडल फॉर्मूलेशन के उपयुक्त परिवर्तन द्वारा कुछ गैर-रेखीय प्रतिगमन समस्याओं को एक रैखिक डोमेन में ले जाया जा सकता है।

उदाहरण के लिए, अरेखीय प्रतिगमन समस्या पर विचार करें

पैरामीटर ए और बी के साथ और गुणक त्रुटि पद यू के साथ। यदि हम दोनों पक्षों का लघुगणक लेते हैं, तो यह बन जाता है

जहां u = ln(U), x पर ln(y) के रैखिक प्रतिगमन द्वारा अज्ञात मापदंडों के अनुमान का सुझाव देता है, एक गणना जिसमें पुनरावृत्त अनुकूलन की आवश्यकता नहीं होती है। हालाँकि, अरेखीय परिवर्तन के उपयोग में सावधानी की आवश्यकता होती है। डेटा मानों का प्रभाव बदल जाएगा, साथ ही मॉडल की त्रुटि संरचना और किसी भी अनुमानित परिणाम की व्याख्या भी बदल जाएगी। ये वांछित प्रभाव नहीं हो सकते हैं. दूसरी ओर, त्रुटि का सबसे बड़ा स्रोत क्या है, इस पर निर्भर करते हुए, एक गैर-रेखीय परिवर्तन गाऊसी फैशन में त्रुटियों को वितरित कर सकता है, इसलिए एक गैर-रेखीय परिवर्तन करने का विकल्प मॉडलिंग विचारों द्वारा सूचित किया जाना चाहिए।

माइकलिस-मेंटेन कैनेटीक्स के लिए, रैखिक लाइनवीवर-बर्क प्लॉट

1/[S] के विरुद्ध 1/v का बहुत अधिक उपयोग किया गया है। हालाँकि, चूंकि यह डेटा त्रुटि के प्रति बहुत संवेदनशील है और डेटा को स्वतंत्र चर, [एस] की एक विशेष श्रेणी में फिट करने के प्रति दृढ़ता से पक्षपाती है, इसलिए इसके उपयोग को दृढ़ता से हतोत्साहित किया जाता है।

घातीय परिवार से संबंधित त्रुटि वितरण के लिए, सामान्यीकृत रैखिक मॉडल ढांचे के तहत मापदंडों को बदलने के लिए एक लिंक फ़ंक्शन का उपयोग किया जा सकता है।

विभाजन

सरसों की उपज और मिट्टी की लवणता

स्वतंत्र चर (मान लीजिए X) को वर्गों या खंडों में विभाजित किया जा सकता है और प्रति खंड रैखिक प्रतिगमन किया जा सकता है। विश्वास अंतराल के साथ खंडित प्रतिगमन का परिणाम यह हो सकता है कि आश्रित चर (जैसे Y) विभिन्न खंडों में अलग-अलग व्यवहार करता है।[2] आंकड़े से पता चलता है कि मिट्टी की लवणता (एक्स) शुरू में सरसों की फसल की उपज (वाई) पर कोई प्रभाव नहीं डालती है, जब तक कि एक महत्वपूर्ण या सीमा मूल्य (ब्रेकपॉइंट) नहीं हो जाता, जिसके बाद उपज नकारात्मक रूप से प्रभावित होती है।[3]


यह भी देखें

संदर्भ

  1. Britzger, Daniel (2022). "रैखिक टेम्पलेट फ़िट". Eur. Phys. J. C. 82: 731. arXiv:2112.01548. doi:10.1140/epjc/s10052-022-10581-w.
  2. R.J.Oosterbaan, 1994, Frequency and Regression Analysis. In: H.P.Ritzema (ed.), Drainage Principles and Applications, Publ. 16, pp. 175-224, International Institute for Land Reclamation and Improvement (ILRI), Wageningen, The Netherlands. ISBN 90-70754-33-9 . Download as PDF : [1]
  3. R.J.Oosterbaan, 2002. Drainage research in farmers' fields: analysis of data. Part of project “Liquid Gold” of the International Institute for Land Reclamation and Improvement (ILRI), Wageningen, The Netherlands. Download as PDF : [2]. The figure was made with the SegReg program, which can be downloaded freely from [3]


टिप्पणियाँ

  1. This model can also be expressed in the conventional biological notation:


अग्रिम पठन

  • Bethea, R. M.; Duran, B. S.; Boullion, T. L. (1985). Statistical Methods for Engineers and Scientists. New York: Marcel Dekker. ISBN 0-8247-7227-X.
  • Meade, N.; Islam, T. (1995). "Prediction Intervals for Growth Curve Forecasts". Journal of Forecasting. 14 (5): 413–430. doi:10.1002/for.3980140502.
  • Schittkowski, K. (2002). Data Fitting in Dynamical Systems. Boston: Kluwer. ISBN 1402010796.
  • Seber, G. A. F.; Wild, C. J. (1989). Nonlinear Regression. New York: John Wiley and Sons. ISBN 0471617601.