डेमिंग प्रतिगमन: Difference between revisions

From Vigyanwiki
(Created page with "{{Short description|Algorithm for the line of best fit for a two-dimensional dataset}} Image:Total least squares.svg|thumb|डेमिंग प्रतिगमन। ल...")
 
No edit summary
Line 1: Line 1:
{{Short description|Algorithm for the line of best fit for a two-dimensional dataset}}
{{Short description|Algorithm for the line of best fit for a two-dimensional dataset}}
[[Image:Total least squares.svg|thumb|डेमिंग प्रतिगमन। लाल रेखाएँ x और y दोनों में त्रुटि दर्शाती हैं। यह परंपरागत कम से कम वर्ग विधि से अलग है जो y अक्ष के समानांतर त्रुटि को मापता है। दिखाया गया मामला, लंबवत रूप से मापे गए विचलन के साथ, तब उत्पन्न होता है जब x और y में समान भिन्नताएँ होती हैं।]]आंकड़ों में, डेमिंग प्रतिगमन, डब्ल्यू एडवर्ड्स डेमिंग के नाम पर, एक त्रुटि-इन-चर मॉडल है जो दो-आयामी डेटासेट के लिए सर्वोत्तम फिट की रेखा खोजने का प्रयास करता है। यह [[सरल रेखीय प्रतिगमन]] से अलग है जिसमें यह ''x''- और ''y''-अक्ष दोनों पर टिप्पणियों में आंकड़ों में त्रुटियों और अवशिष्टों के लिए खाता है। यह [[कुल न्यूनतम वर्ग]]ों का एक विशेष मामला है, जो भविष्यवक्ताओं की किसी भी संख्या और अधिक जटिल त्रुटि संरचना की अनुमति देता है।
[[Image:Total least squares.svg|thumb|डेमिंग प्रतिगमन, लाल रेखाएँ x और y दोनों में त्रुटि दर्शाती हैं। यह परंपरागत कम से कम वर्ग विधि से अलग है जो y अक्ष के समानांतर त्रुटि को मापता है। दिखाई गयी स्थिति, लंबवत रूप से मापे गए विचलन के साथ, तब उत्पन्न होती है जब x और y में समान भिन्नताएँ होती हैं।]]आंकड़ों में, डेमिंग प्रतिगमन, डब्ल्यू एडवर्ड्स डेमिंग के नाम पर, एक एरर-इन-वैरिएबल मॉडल है जो दो-आयामी डेटासेट के लिए सर्वोत्तम फिट की रेखा ढूंढने का प्रयास करता है। यह [[सरल रेखीय प्रतिगमन]] से भिन्न है जिसमें यह ''x''- और ''y''-अक्ष दोनों पर टिप्पणियों में आंकड़ों में त्रुटियों और अवशिष्टों के लिए खाता है। यह [[कुल न्यूनतम वर्ग|कुल न्यूनतम वर्गों]] का एक विशेष स्थिति है, जो भविष्यवक्ताओं की किसी भी संख्या और अधिक जटिल त्रुटि संरचना की अनुमति देता है।


डेमिंग प्रतिगमन एक [[एरर-इन-वैरिएबल मॉडल]] के अधिकतम संभावना अनुमान के बराबर है जिसमें दो वेरिएबल्स के लिए त्रुटियों को स्वतंत्र और [[सामान्य वितरण]] माना जाता है, और उनके प्रसरण का अनुपात, जिसे ''δ'' के रूप में जाना जाता है, जाना जाता है .{{sfn|Linnet|1993}} व्यवहार में, इस अनुपात का अनुमान संबंधित डेटा-स्रोतों से लगाया जा सकता है; हालाँकि, इस अनुपात का अनुमान लगाने में संभावित त्रुटियों के लिए प्रतिगमन प्रक्रिया कोई हिसाब नहीं रखती है।
डेमिंग प्रतिगमन एक [[एरर-इन-वैरिएबल मॉडल]] के अधिकतम संभावना अनुमान के बराबर है जिसमें दो चर के लिए त्रुटियों को स्वतंत्र और [[सामान्य वितरण|सामान्य]] रूप से वितरित माना जाता है, और उनके प्रसरण का अनुपात, जिसे ''δ'' के रूप में निरुपित किया जाता है।''', जाना जाता है''' .{{sfn|Linnet|1993}} व्यवहार में, इस अनुपात का अनुमान संबंधित डेटा-स्रोतों से लगाया जा सकता है; चूँकि, इस अनुपात का अनुमान लगाने में संभावित त्रुटियों के लिए प्रतिगमन प्रक्रिया कोई ध्यान नहीं देती है।


साधारण रेखीय प्रतिगमन की तुलना में डेमिंग प्रतिगमन की गणना करना थोड़ा अधिक कठिन है। क्लिनिकल केमिस्ट्री में उपयोग किए जाने वाले अधिकांश सांख्यिकीय सॉफ़्टवेयर पैकेज डेमिंग रिग्रेशन प्रदान करते हैं।
साधारण रेखीय प्रतिगमन की तुलना में डेमिंग प्रतिगमन की गणना करना थोड़ा अधिक कठिन है। क्लिनिकल केमिस्ट्री में उपयोग किए जाने वाले अधिकांश सांख्यिकीय सॉफ़्टवेयर पैकेज डेमिंग प्रतिगमन प्रदान करते हैं।


मॉडल मूल रूप से द्वारा पेश किया गया था {{harvtxt|Adcock|1878}} जिन्होंने मामले पर विचार किया δ = 1, और फिर अधिक सामान्य रूप से {{harvtxt|Kummell|1879}} मनमाने δ के साथ। हालाँकि, उनके विचारों को 50 से अधिक वर्षों तक काफी हद तक किसी का ध्यान नहीं गया, जब तक कि उन्हें {{harvtxt|Koopmans|1936}} और बाद में और भी प्रचारित किया {{harvtxt|Deming|1943}}. बाद की किताब [[ नैदानिक ​​रसायन विज्ञान ]] और संबंधित क्षेत्रों में इतनी लोकप्रिय हो गई कि इस पद्धति को उन क्षेत्रों में डेमिंग रिग्रेशन भी करार दिया गया।{{sfn|Cornbleet|Gochman|1979}}
मॉडल मूल रूप से {{harvtxt|एडकॉक|1878}} द्वारा प्रस्तुत किया गया था, जिन्होंने स्थिति δ = 1 पर विचार किया, और फिर अधिक सामान्य रूप से {{harvtxt|Kummell|1879}} मनमाने δ के साथ। चूँकि, उनके विचार 50 से अधिक वर्षों तक बड़े पैमाने पर किसी के ध्यान नहीं रहे, जब तक कि उन्हें {{harvtxt|कोपमैन्स|1936}} द्वारा पुनर्जीवित नहीं किया गया और बाद में {{harvtxt|डेमिंग|1943}} द्वारा और भी अधिक प्रचारित किया गया। '''उनके''' '''विचारों को 50 से अधिक वर्षों तक काफी हद तक किसी का ध्यान नहीं गया, जब तक कि उन्हें  और बाद में और भी प्रचारित किया .''' बाद की पुस्तक [[ नैदानिक ​​रसायन विज्ञान ]] और संबंधित क्षेत्रों में इतनी लोकप्रिय हो गई कि इस पद्धति को उन क्षेत्रों में डेमिंग प्रतिगमन भी कहा जाने लगा।।{{sfn|Cornbleet|Gochman|1979}}


== विशिष्टता ==
== विशिष्टता ==


मान लें कि उपलब्ध डेटा (y<sub>i</sub>, एक्स<sub>i</sub>) वास्तविक मानों के अवलोकनों को मापा जाता है (y<sub>i</sub>*, एक्स<sub>i</sub>*), जो प्रतिगमन रेखा पर स्थित हैं:
मान लें कि उपलब्ध डेटा (''y<sub>i</sub>'', ''x<sub>i</sub>'') "वास्तविक" मानों (''y<sub>i</sub>*'', ''x<sub>i</sub>*'') के मापित अवलोकन हैं, जो प्रतिगमन रेखा पर स्थित हैं:
: <math>\begin{align}
: <math>\begin{align}
   y_i &= y^*_i + \varepsilon_i, \\
   y_i &= y^*_i + \varepsilon_i, \\
Line 42: Line 42:


==ऑर्थोगोनल प्रतिगमन==
==ऑर्थोगोनल प्रतिगमन==
समान त्रुटि प्रसरण के मामले में, अर्थात कब <math>\delta=1</math>, डेमिंग रिग्रेशन ऑर्थोगोनल रिग्रेशन बन जाता है: यह एक बिंदु से एक रेखा तक वर्ग दूरी के योग को कम करता है। इस मामले में, प्रत्येक अवलोकन को बिंदु z के रूप में निरूपित करें<sub>''j''</sub> जटिल विमान में (यानी, बिंदु (x<sub>''j''</sub>, और<sub>''j''</sub>) को z के रूप में लिखा जाता है<sub>''j''</sub> = एक्स<sub>''j''</sub> + गंध<sub>''j''</sub> जहां मैं [[काल्पनिक इकाई]] है)। जेड के रूप में निरूपित करें केंद्र से डेटा बिंदुओं के वर्ग अंतर का योग (जटिल निर्देशांक में भी चिह्नित), जो कि बिंदु है जिसका क्षैतिज और ऊर्ध्वाधर स्थान डेटा बिंदुओं के औसत हैं। तब:{{sfn|Minda|Phelps|2008|loc=Theorem 2.3}}
समान त्रुटि प्रसरण के मामले में, अर्थात कब <math>\delta=1</math>, डेमिंग प्रतिगमन ऑर्थोगोनल प्रतिगमन बन जाता है: यह एक बिंदु से एक रेखा तक वर्ग दूरी के योग को कम करता है। इस मामले में, प्रत्येक अवलोकन को बिंदु z के रूप में निरूपित करें<sub>''j''</sub> जटिल विमान में (यानी, बिंदु (x<sub>''j''</sub>, और<sub>''j''</sub>) को z के रूप में लिखा जाता है<sub>''j''</sub> = एक्स<sub>''j''</sub> + गंध<sub>''j''</sub> जहां मैं [[काल्पनिक इकाई]] है)। जेड के रूप में निरूपित करें केंद्र से डेटा बिंदुओं के वर्ग अंतर का योग (जटिल निर्देशांक में भी चिह्नित), जो कि बिंदु है जिसका क्षैतिज और ऊर्ध्वाधर स्थान डेटा बिंदुओं के औसत हैं। तब:{{sfn|Minda|Phelps|2008|loc=Theorem 2.3}}


*यदि Z = 0, तो केन्द्रक के माध्यम से प्रत्येक रेखा सर्वश्रेष्ठ ऑर्थोगोनल फिट की एक रेखा है।
*यदि Z = 0, तो केन्द्रक के माध्यम से प्रत्येक रेखा सर्वश्रेष्ठ ऑर्थोगोनल फिट की एक रेखा है।
*यदि Z ≠ 0, ओर्थोगोनल प्रतिगमन रेखा केन्द्रक के माध्यम से जाती है और मूल से सदिश के समानांतर है <math>\sqrt{Z}</math>.
*यदि Z ≠ 0, ओर्थोगोनल प्रतिगमन रेखा केन्द्रक के माध्यम से जाती है और मूल से सदिश के समानांतर है <math>\sqrt{Z}</math>.


1913 में कूलिज द्वारा ऑर्थोगोनल रिग्रेशन लाइन का [[त्रिकोणमिति]] प्रतिनिधित्व दिया गया था।{{sfn|Coolidge|1913}}
1913 में कूलिज द्वारा ऑर्थोगोनल प्रतिगमन लाइन का [[त्रिकोणमिति]] प्रतिनिधित्व दिया गया था।{{sfn|Coolidge|1913}}


=== आवेदन ===
=== आवेदन ===

Revision as of 00:32, 12 March 2023

डेमिंग प्रतिगमन, लाल रेखाएँ x और y दोनों में त्रुटि दर्शाती हैं। यह परंपरागत कम से कम वर्ग विधि से अलग है जो y अक्ष के समानांतर त्रुटि को मापता है। दिखाई गयी स्थिति, लंबवत रूप से मापे गए विचलन के साथ, तब उत्पन्न होती है जब x और y में समान भिन्नताएँ होती हैं।

आंकड़ों में, डेमिंग प्रतिगमन, डब्ल्यू एडवर्ड्स डेमिंग के नाम पर, एक एरर-इन-वैरिएबल मॉडल है जो दो-आयामी डेटासेट के लिए सर्वोत्तम फिट की रेखा ढूंढने का प्रयास करता है। यह सरल रेखीय प्रतिगमन से भिन्न है जिसमें यह x- और y-अक्ष दोनों पर टिप्पणियों में आंकड़ों में त्रुटियों और अवशिष्टों के लिए खाता है। यह कुल न्यूनतम वर्गों का एक विशेष स्थिति है, जो भविष्यवक्ताओं की किसी भी संख्या और अधिक जटिल त्रुटि संरचना की अनुमति देता है।

डेमिंग प्रतिगमन एक एरर-इन-वैरिएबल मॉडल के अधिकतम संभावना अनुमान के बराबर है जिसमें दो चर के लिए त्रुटियों को स्वतंत्र और सामान्य रूप से वितरित माना जाता है, और उनके प्रसरण का अनुपात, जिसे δ के रूप में निरुपित किया जाता है।, जाना जाता है .[1] व्यवहार में, इस अनुपात का अनुमान संबंधित डेटा-स्रोतों से लगाया जा सकता है; चूँकि, इस अनुपात का अनुमान लगाने में संभावित त्रुटियों के लिए प्रतिगमन प्रक्रिया कोई ध्यान नहीं देती है।

साधारण रेखीय प्रतिगमन की तुलना में डेमिंग प्रतिगमन की गणना करना थोड़ा अधिक कठिन है। क्लिनिकल केमिस्ट्री में उपयोग किए जाने वाले अधिकांश सांख्यिकीय सॉफ़्टवेयर पैकेज डेमिंग प्रतिगमन प्रदान करते हैं।

मॉडल मूल रूप से एडकॉक (1878) द्वारा प्रस्तुत किया गया था, जिन्होंने स्थिति δ = 1 पर विचार किया, और फिर अधिक सामान्य रूप से Kummell (1879) मनमाने δ के साथ। चूँकि, उनके विचार 50 से अधिक वर्षों तक बड़े पैमाने पर किसी के ध्यान नहीं रहे, जब तक कि उन्हें कोपमैन्स (1936) द्वारा पुनर्जीवित नहीं किया गया और बाद में डेमिंग (1943) द्वारा और भी अधिक प्रचारित किया गया। उनके विचारों को 50 से अधिक वर्षों तक काफी हद तक किसी का ध्यान नहीं गया, जब तक कि उन्हें और बाद में और भी प्रचारित किया . बाद की पुस्तक नैदानिक ​​रसायन विज्ञान और संबंधित क्षेत्रों में इतनी लोकप्रिय हो गई कि इस पद्धति को उन क्षेत्रों में डेमिंग प्रतिगमन भी कहा जाने लगा।।[2]

विशिष्टता

मान लें कि उपलब्ध डेटा (yi, xi) "वास्तविक" मानों (yi*, xi*) के मापित अवलोकन हैं, जो प्रतिगमन रेखा पर स्थित हैं:

जहां त्रुटियां ε और η स्वतंत्र हैं और उनके भिन्नताओं का अनुपात ज्ञात माना जाता है:

व्यवहार में, के भिन्न और पैरामीटर अक्सर अज्ञात होते हैं, जो अनुमान को जटिल बनाता है . ध्यान दें कि जब माप पद्धति के लिए और समान है, ये प्रसरण समान होने की संभावना है, इसलिए इस मामले के लिए।

हम सर्वोत्तम फिट की रेखा खोजना चाहते हैं

जैसे कि मॉडल के वर्गित अवशेषों का भारित योग कम से कम हो:[3]

देखना Jensen (2007) पूर्ण व्युत्पत्ति के लिए।

समाधान

समाधान को दूसरी डिग्री के नमूना क्षणों के रूप में व्यक्त किया जा सकता है। यानी, हम पहले निम्नलिखित मात्राओं की गणना करते हैं (सभी योग i = 1 से n तक जाते हैं):

अंत में, मॉडल के मापदंडों का न्यूनतम-वर्ग अनुमान होगा[4]


ऑर्थोगोनल प्रतिगमन

समान त्रुटि प्रसरण के मामले में, अर्थात कब , डेमिंग प्रतिगमन ऑर्थोगोनल प्रतिगमन बन जाता है: यह एक बिंदु से एक रेखा तक वर्ग दूरी के योग को कम करता है। इस मामले में, प्रत्येक अवलोकन को बिंदु z के रूप में निरूपित करेंj जटिल विमान में (यानी, बिंदु (xj, औरj) को z के रूप में लिखा जाता हैj = एक्सj + गंधj जहां मैं काल्पनिक इकाई है)। जेड के रूप में निरूपित करें केंद्र से डेटा बिंदुओं के वर्ग अंतर का योग (जटिल निर्देशांक में भी चिह्नित), जो कि बिंदु है जिसका क्षैतिज और ऊर्ध्वाधर स्थान डेटा बिंदुओं के औसत हैं। तब:[5]

  • यदि Z = 0, तो केन्द्रक के माध्यम से प्रत्येक रेखा सर्वश्रेष्ठ ऑर्थोगोनल फिट की एक रेखा है।
  • यदि Z ≠ 0, ओर्थोगोनल प्रतिगमन रेखा केन्द्रक के माध्यम से जाती है और मूल से सदिश के समानांतर है .

1913 में कूलिज द्वारा ऑर्थोगोनल प्रतिगमन लाइन का त्रिकोणमिति प्रतिनिधित्व दिया गया था।[6]

आवेदन

तीन रेखा (ज्यामिति) के मामले में | समतल में गैर-संरेख बिंदु, इन बिंदुओं वाले त्रिकोण को इसके शीर्ष (ज्यामिति) के रूप में एक अद्वितीय स्टाइनर इनलिप्स होता है जो त्रिभुज के किनारों पर उनके मध्य बिंदुओं पर स्पर्शरेखा होता है। दीर्घवृत्त # दीर्घवृत्त के तत्व तीन शीर्षों के लिए ऑर्थोगोनल प्रतिगमन रेखा पर आते हैं।[7] दो रिपोर्टर सिंथेटिक जैविक सर्किट के देखे गए व्यवहार के लिए डेमिंग प्रतिगमन लागू करने पर एक जैविक कोशिका के आंतरिक सेलुलर शोर की मात्रा निर्धारित की जा सकती है।[8]

यह भी देखें

संदर्भ

Notes
Bibliography