डेमिंग प्रतिगमन

From Vigyanwiki
डेमिंग प्रतिगमन, लाल रेखाएँ x और y दोनों में त्रुटि दर्शाती हैं। यह परंपरागत कम से कम वर्ग विधि से अलग है जो y अक्ष के समानांतर त्रुटि को मापता है। दिखाई गयी स्थिति, लंबवत रूप से मापे गए विचलन के साथ, तब उत्पन्न होती है जब x और y में समान भिन्नताएँ होती हैं।

आंकड़ों में, डेमिंग प्रतिगमन, डब्ल्यू एडवर्ड्स डेमिंग के नाम पर, एक एरर-इन-वैरिएबल मॉडल है जो दो-आयामी डेटासेट के लिए सर्वोत्तम फिट की रेखा ढूंढने का प्रयास करता है। यह सरल रेखीय प्रतिगमन से भिन्न है जिसमें यह x- और y-अक्ष दोनों पर टिप्पणियों में आंकड़ों में त्रुटियों और अवशिष्टों के लिए खाता है। यह कुल न्यूनतम वर्गों का एक विशेष स्थिति है, जो भविष्यवक्ताओं की किसी भी संख्या और अधिक जटिल त्रुटि संरचना की अनुमति देता है।

डेमिंग प्रतिगमन एक एरर-इन-वैरिएबल मॉडल के अधिकतम संभावना अनुमान के बराबर है जिसमें दो चर के लिए त्रुटियों को स्वतंत्र और सामान्य रूप से वितरित माना जाता है, और उनके प्रसरण का अनुपात, जिसे δ के रूप में निरुपित किया जाता है।, जाना जाता है .[1] व्यवहार में, इस अनुपात का अनुमान संबंधित डेटा-स्रोतों से लगाया जा सकता है; चूँकि, इस अनुपात का अनुमान लगाने में संभावित त्रुटियों के लिए प्रतिगमन प्रक्रिया कोई ध्यान नहीं देती है।

साधारण रेखीय प्रतिगमन की तुलना में डेमिंग प्रतिगमन की गणना करना थोड़ा अधिक कठिन है। क्लिनिकल केमिस्ट्री में उपयोग किए जाने वाले अधिकांश सांख्यिकीय सॉफ़्टवेयर पैकेज डेमिंग प्रतिगमन प्रदान करते हैं।

मॉडल मूल रूप से एडकॉक (1878) द्वारा प्रस्तुत किया गया था, जिन्होंने स्थिति δ = 1 पर विचार किया, और फिर अधिक सामान्य रूप से Kummell (1879) मनमाने δ के साथ। चूँकि, उनके विचार 50 से अधिक वर्षों तक बड़े पैमाने पर किसी के ध्यान नहीं रहे, जब तक कि उन्हें कोपमैन्स (1936) द्वारा पुनर्जीवित नहीं किया गया और बाद में डेमिंग (1943) द्वारा और भी अधिक प्रचारित किया गया। उनके विचारों को 50 से अधिक वर्षों तक काफी हद तक किसी का ध्यान नहीं गया, जब तक कि उन्हें और बाद में और भी प्रचारित किया . बाद की पुस्तक नैदानिक ​​रसायन विज्ञान और संबंधित क्षेत्रों में इतनी लोकप्रिय हो गई कि इस पद्धति को उन क्षेत्रों में डेमिंग प्रतिगमन भी कहा जाने लगा।।[2]

विशिष्टता

मान लें कि उपलब्ध डेटा (yi, xi) "वास्तविक" मानों (yi*, xi*) के मापित अवलोकन हैं, जो प्रतिगमन रेखा पर स्थित हैं:

जहां त्रुटियां ε और η स्वतंत्र हैं और उनके भिन्नताओं का अनुपात ज्ञात माना जाता है:

व्यवहार में, के भिन्न और पैरामीटर अक्सर अज्ञात होते हैं, जो अनुमान को जटिल बनाता है . ध्यान दें कि जब माप पद्धति के लिए और समान है, ये प्रसरण समान होने की संभावना है, इसलिए इस मामले के लिए।

हम सर्वोत्तम फिट की रेखा खोजना चाहते हैं

जैसे कि मॉडल के वर्गित अवशेषों का भारित योग कम से कम हो:[3]

देखना Jensen (2007) पूर्ण व्युत्पत्ति के लिए।

समाधान

समाधान को दूसरी डिग्री के नमूना क्षणों के रूप में व्यक्त किया जा सकता है। यानी, हम पहले निम्नलिखित मात्राओं की गणना करते हैं (सभी योग i = 1 से n तक जाते हैं):

अंत में, मॉडल के मापदंडों का न्यूनतम-वर्ग अनुमान होगा[4]


ऑर्थोगोनल प्रतिगमन

समान त्रुटि प्रसरण के मामले में, अर्थात कब , डेमिंग प्रतिगमन ऑर्थोगोनल प्रतिगमन बन जाता है: यह एक बिंदु से एक रेखा तक वर्ग दूरी के योग को कम करता है। इस मामले में, प्रत्येक अवलोकन को बिंदु z के रूप में निरूपित करेंj जटिल विमान में (यानी, बिंदु (xj, औरj) को z के रूप में लिखा जाता हैj = एक्सj + गंधj जहां मैं काल्पनिक इकाई है)। जेड के रूप में निरूपित करें केंद्र से डेटा बिंदुओं के वर्ग अंतर का योग (जटिल निर्देशांक में भी चिह्नित), जो कि बिंदु है जिसका क्षैतिज और ऊर्ध्वाधर स्थान डेटा बिंदुओं के औसत हैं। तब:[5]

  • यदि Z = 0, तो केन्द्रक के माध्यम से प्रत्येक रेखा सर्वश्रेष्ठ ऑर्थोगोनल फिट की एक रेखा है।
  • यदि Z ≠ 0, ओर्थोगोनल प्रतिगमन रेखा केन्द्रक के माध्यम से जाती है और मूल से सदिश के समानांतर है .

1913 में कूलिज द्वारा ऑर्थोगोनल प्रतिगमन लाइन का त्रिकोणमिति प्रतिनिधित्व दिया गया था।[6]

आवेदन

तीन रेखा (ज्यामिति) के मामले में | समतल में गैर-संरेख बिंदु, इन बिंदुओं वाले त्रिकोण को इसके शीर्ष (ज्यामिति) के रूप में एक अद्वितीय स्टाइनर इनलिप्स होता है जो त्रिभुज के किनारों पर उनके मध्य बिंदुओं पर स्पर्शरेखा होता है। दीर्घवृत्त # दीर्घवृत्त के तत्व तीन शीर्षों के लिए ऑर्थोगोनल प्रतिगमन रेखा पर आते हैं।[7] दो रिपोर्टर सिंथेटिक जैविक सर्किट के देखे गए व्यवहार के लिए डेमिंग प्रतिगमन लागू करने पर एक जैविक कोशिका के आंतरिक सेलुलर शोर की मात्रा निर्धारित की जा सकती है।[8]

यह भी देखें

संदर्भ

Notes
Bibliography