डेमिंग प्रतिगमन: Difference between revisions
(Created page with "{{Short description|Algorithm for the line of best fit for a two-dimensional dataset}} Image:Total least squares.svg|thumb|डेमिंग प्रतिगमन। ल...") |
No edit summary |
||
Line 1: | Line 1: | ||
{{Short description|Algorithm for the line of best fit for a two-dimensional dataset}} | {{Short description|Algorithm for the line of best fit for a two-dimensional dataset}} | ||
[[Image:Total least squares.svg|thumb|डेमिंग | [[Image:Total least squares.svg|thumb|डेमिंग प्रतिगमन, लाल रेखाएँ x और y दोनों में त्रुटि दर्शाती हैं। यह परंपरागत कम से कम वर्ग विधि से अलग है जो y अक्ष के समानांतर त्रुटि को मापता है। दिखाई गयी स्थिति, लंबवत रूप से मापे गए विचलन के साथ, तब उत्पन्न होती है जब x और y में समान भिन्नताएँ होती हैं।]]आंकड़ों में, डेमिंग प्रतिगमन, डब्ल्यू एडवर्ड्स डेमिंग के नाम पर, एक एरर-इन-वैरिएबल मॉडल है जो दो-आयामी डेटासेट के लिए सर्वोत्तम फिट की रेखा ढूंढने का प्रयास करता है। यह [[सरल रेखीय प्रतिगमन]] से भिन्न है जिसमें यह ''x''- और ''y''-अक्ष दोनों पर टिप्पणियों में आंकड़ों में त्रुटियों और अवशिष्टों के लिए खाता है। यह [[कुल न्यूनतम वर्ग|कुल न्यूनतम वर्गों]] का एक विशेष स्थिति है, जो भविष्यवक्ताओं की किसी भी संख्या और अधिक जटिल त्रुटि संरचना की अनुमति देता है। | ||
डेमिंग प्रतिगमन एक [[एरर-इन-वैरिएबल मॉडल]] के अधिकतम संभावना अनुमान के बराबर है जिसमें दो | डेमिंग प्रतिगमन एक [[एरर-इन-वैरिएबल मॉडल]] के अधिकतम संभावना अनुमान के बराबर है जिसमें दो चर के लिए त्रुटियों को स्वतंत्र और [[सामान्य वितरण|सामान्य]] रूप से वितरित माना जाता है, और उनके प्रसरण का अनुपात, जिसे ''δ'' के रूप में निरुपित किया जाता है।''', जाना जाता है''' .{{sfn|Linnet|1993}} व्यवहार में, इस अनुपात का अनुमान संबंधित डेटा-स्रोतों से लगाया जा सकता है; चूँकि, इस अनुपात का अनुमान लगाने में संभावित त्रुटियों के लिए प्रतिगमन प्रक्रिया कोई ध्यान नहीं देती है। | ||
साधारण रेखीय प्रतिगमन की तुलना में डेमिंग प्रतिगमन की गणना करना थोड़ा अधिक कठिन है। क्लिनिकल केमिस्ट्री में उपयोग किए जाने वाले अधिकांश सांख्यिकीय सॉफ़्टवेयर पैकेज डेमिंग | साधारण रेखीय प्रतिगमन की तुलना में डेमिंग प्रतिगमन की गणना करना थोड़ा अधिक कठिन है। क्लिनिकल केमिस्ट्री में उपयोग किए जाने वाले अधिकांश सांख्यिकीय सॉफ़्टवेयर पैकेज डेमिंग प्रतिगमन प्रदान करते हैं। | ||
मॉडल मूल रूप से | मॉडल मूल रूप से {{harvtxt|एडकॉक|1878}} द्वारा प्रस्तुत किया गया था, जिन्होंने स्थिति δ = 1 पर विचार किया, और फिर अधिक सामान्य रूप से {{harvtxt|Kummell|1879}} मनमाने δ के साथ। चूँकि, उनके विचार 50 से अधिक वर्षों तक बड़े पैमाने पर किसी के ध्यान नहीं रहे, जब तक कि उन्हें {{harvtxt|कोपमैन्स|1936}} द्वारा पुनर्जीवित नहीं किया गया और बाद में {{harvtxt|डेमिंग|1943}} द्वारा और भी अधिक प्रचारित किया गया। '''उनके''' '''विचारों को 50 से अधिक वर्षों तक काफी हद तक किसी का ध्यान नहीं गया, जब तक कि उन्हें और बाद में और भी प्रचारित किया .''' बाद की पुस्तक [[ नैदानिक रसायन विज्ञान ]] और संबंधित क्षेत्रों में इतनी लोकप्रिय हो गई कि इस पद्धति को उन क्षेत्रों में डेमिंग प्रतिगमन भी कहा जाने लगा।।{{sfn|Cornbleet|Gochman|1979}} | ||
== विशिष्टता == | == विशिष्टता == | ||
मान लें कि उपलब्ध डेटा (y<sub>i</sub>, | मान लें कि उपलब्ध डेटा (''y<sub>i</sub>'', ''x<sub>i</sub>'') "वास्तविक" मानों (''y<sub>i</sub>*'', ''x<sub>i</sub>*'') के मापित अवलोकन हैं, जो प्रतिगमन रेखा पर स्थित हैं: | ||
: <math>\begin{align} | : <math>\begin{align} | ||
y_i &= y^*_i + \varepsilon_i, \\ | y_i &= y^*_i + \varepsilon_i, \\ | ||
Line 42: | Line 42: | ||
==ऑर्थोगोनल प्रतिगमन== | ==ऑर्थोगोनल प्रतिगमन== | ||
समान त्रुटि प्रसरण के मामले में, अर्थात कब <math>\delta=1</math>, डेमिंग | समान त्रुटि प्रसरण के मामले में, अर्थात कब <math>\delta=1</math>, डेमिंग प्रतिगमन ऑर्थोगोनल प्रतिगमन बन जाता है: यह एक बिंदु से एक रेखा तक वर्ग दूरी के योग को कम करता है। इस मामले में, प्रत्येक अवलोकन को बिंदु z के रूप में निरूपित करें<sub>''j''</sub> जटिल विमान में (यानी, बिंदु (x<sub>''j''</sub>, और<sub>''j''</sub>) को z के रूप में लिखा जाता है<sub>''j''</sub> = एक्स<sub>''j''</sub> + गंध<sub>''j''</sub> जहां मैं [[काल्पनिक इकाई]] है)। जेड के रूप में निरूपित करें केंद्र से डेटा बिंदुओं के वर्ग अंतर का योग (जटिल निर्देशांक में भी चिह्नित), जो कि बिंदु है जिसका क्षैतिज और ऊर्ध्वाधर स्थान डेटा बिंदुओं के औसत हैं। तब:{{sfn|Minda|Phelps|2008|loc=Theorem 2.3}} | ||
*यदि Z = 0, तो केन्द्रक के माध्यम से प्रत्येक रेखा सर्वश्रेष्ठ ऑर्थोगोनल फिट की एक रेखा है। | *यदि Z = 0, तो केन्द्रक के माध्यम से प्रत्येक रेखा सर्वश्रेष्ठ ऑर्थोगोनल फिट की एक रेखा है। | ||
*यदि Z ≠ 0, ओर्थोगोनल प्रतिगमन रेखा केन्द्रक के माध्यम से जाती है और मूल से सदिश के समानांतर है <math>\sqrt{Z}</math>. | *यदि Z ≠ 0, ओर्थोगोनल प्रतिगमन रेखा केन्द्रक के माध्यम से जाती है और मूल से सदिश के समानांतर है <math>\sqrt{Z}</math>. | ||
1913 में कूलिज द्वारा ऑर्थोगोनल | 1913 में कूलिज द्वारा ऑर्थोगोनल प्रतिगमन लाइन का [[त्रिकोणमिति]] प्रतिनिधित्व दिया गया था।{{sfn|Coolidge|1913}} | ||
=== आवेदन === | === आवेदन === |
Revision as of 00:32, 12 March 2023
आंकड़ों में, डेमिंग प्रतिगमन, डब्ल्यू एडवर्ड्स डेमिंग के नाम पर, एक एरर-इन-वैरिएबल मॉडल है जो दो-आयामी डेटासेट के लिए सर्वोत्तम फिट की रेखा ढूंढने का प्रयास करता है। यह सरल रेखीय प्रतिगमन से भिन्न है जिसमें यह x- और y-अक्ष दोनों पर टिप्पणियों में आंकड़ों में त्रुटियों और अवशिष्टों के लिए खाता है। यह कुल न्यूनतम वर्गों का एक विशेष स्थिति है, जो भविष्यवक्ताओं की किसी भी संख्या और अधिक जटिल त्रुटि संरचना की अनुमति देता है।
डेमिंग प्रतिगमन एक एरर-इन-वैरिएबल मॉडल के अधिकतम संभावना अनुमान के बराबर है जिसमें दो चर के लिए त्रुटियों को स्वतंत्र और सामान्य रूप से वितरित माना जाता है, और उनके प्रसरण का अनुपात, जिसे δ के रूप में निरुपित किया जाता है।, जाना जाता है .[1] व्यवहार में, इस अनुपात का अनुमान संबंधित डेटा-स्रोतों से लगाया जा सकता है; चूँकि, इस अनुपात का अनुमान लगाने में संभावित त्रुटियों के लिए प्रतिगमन प्रक्रिया कोई ध्यान नहीं देती है।
साधारण रेखीय प्रतिगमन की तुलना में डेमिंग प्रतिगमन की गणना करना थोड़ा अधिक कठिन है। क्लिनिकल केमिस्ट्री में उपयोग किए जाने वाले अधिकांश सांख्यिकीय सॉफ़्टवेयर पैकेज डेमिंग प्रतिगमन प्रदान करते हैं।
मॉडल मूल रूप से एडकॉक (1878) द्वारा प्रस्तुत किया गया था, जिन्होंने स्थिति δ = 1 पर विचार किया, और फिर अधिक सामान्य रूप से Kummell (1879) मनमाने δ के साथ। चूँकि, उनके विचार 50 से अधिक वर्षों तक बड़े पैमाने पर किसी के ध्यान नहीं रहे, जब तक कि उन्हें कोपमैन्स (1936) द्वारा पुनर्जीवित नहीं किया गया और बाद में डेमिंग (1943) द्वारा और भी अधिक प्रचारित किया गया। उनके विचारों को 50 से अधिक वर्षों तक काफी हद तक किसी का ध्यान नहीं गया, जब तक कि उन्हें और बाद में और भी प्रचारित किया . बाद की पुस्तक नैदानिक रसायन विज्ञान और संबंधित क्षेत्रों में इतनी लोकप्रिय हो गई कि इस पद्धति को उन क्षेत्रों में डेमिंग प्रतिगमन भी कहा जाने लगा।।[2]
विशिष्टता
मान लें कि उपलब्ध डेटा (yi, xi) "वास्तविक" मानों (yi*, xi*) के मापित अवलोकन हैं, जो प्रतिगमन रेखा पर स्थित हैं:
जहां त्रुटियां ε और η स्वतंत्र हैं और उनके भिन्नताओं का अनुपात ज्ञात माना जाता है:
व्यवहार में, के भिन्न और पैरामीटर अक्सर अज्ञात होते हैं, जो अनुमान को जटिल बनाता है . ध्यान दें कि जब माप पद्धति के लिए और समान है, ये प्रसरण समान होने की संभावना है, इसलिए इस मामले के लिए।
हम सर्वोत्तम फिट की रेखा खोजना चाहते हैं
जैसे कि मॉडल के वर्गित अवशेषों का भारित योग कम से कम हो:[3]
देखना Jensen (2007) पूर्ण व्युत्पत्ति के लिए।
समाधान
समाधान को दूसरी डिग्री के नमूना क्षणों के रूप में व्यक्त किया जा सकता है। यानी, हम पहले निम्नलिखित मात्राओं की गणना करते हैं (सभी योग i = 1 से n तक जाते हैं):
अंत में, मॉडल के मापदंडों का न्यूनतम-वर्ग अनुमान होगा[4]
ऑर्थोगोनल प्रतिगमन
समान त्रुटि प्रसरण के मामले में, अर्थात कब , डेमिंग प्रतिगमन ऑर्थोगोनल प्रतिगमन बन जाता है: यह एक बिंदु से एक रेखा तक वर्ग दूरी के योग को कम करता है। इस मामले में, प्रत्येक अवलोकन को बिंदु z के रूप में निरूपित करेंj जटिल विमान में (यानी, बिंदु (xj, औरj) को z के रूप में लिखा जाता हैj = एक्सj + गंधj जहां मैं काल्पनिक इकाई है)। जेड के रूप में निरूपित करें केंद्र से डेटा बिंदुओं के वर्ग अंतर का योग (जटिल निर्देशांक में भी चिह्नित), जो कि बिंदु है जिसका क्षैतिज और ऊर्ध्वाधर स्थान डेटा बिंदुओं के औसत हैं। तब:[5]
- यदि Z = 0, तो केन्द्रक के माध्यम से प्रत्येक रेखा सर्वश्रेष्ठ ऑर्थोगोनल फिट की एक रेखा है।
- यदि Z ≠ 0, ओर्थोगोनल प्रतिगमन रेखा केन्द्रक के माध्यम से जाती है और मूल से सदिश के समानांतर है .
1913 में कूलिज द्वारा ऑर्थोगोनल प्रतिगमन लाइन का त्रिकोणमिति प्रतिनिधित्व दिया गया था।[6]
आवेदन
तीन रेखा (ज्यामिति) के मामले में | समतल में गैर-संरेख बिंदु, इन बिंदुओं वाले त्रिकोण को इसके शीर्ष (ज्यामिति) के रूप में एक अद्वितीय स्टाइनर इनलिप्स होता है जो त्रिभुज के किनारों पर उनके मध्य बिंदुओं पर स्पर्शरेखा होता है। दीर्घवृत्त # दीर्घवृत्त के तत्व तीन शीर्षों के लिए ऑर्थोगोनल प्रतिगमन रेखा पर आते हैं।[7] दो रिपोर्टर सिंथेटिक जैविक सर्किट के देखे गए व्यवहार के लिए डेमिंग प्रतिगमन लागू करने पर एक जैविक कोशिका के आंतरिक सेलुलर शोर की मात्रा निर्धारित की जा सकती है।[8]
यह भी देखें
संदर्भ
- Notes
- ↑ Linnet 1993.
- ↑ Cornbleet & Gochman 1979.
- ↑ Fuller 1987, Ch. 1.3.3.
- ↑ Glaister 2001.
- ↑ Minda & Phelps 2008, Theorem 2.3.
- ↑ Coolidge 1913.
- ↑ Minda & Phelps 2008, Corollary 2.4.
- ↑ Quarton 2020.
- Bibliography
- Adcock, R. J. (1878). "A problem in least squares". The Analyst. 5 (2): 53–54. doi:10.2307/2635758. JSTOR 2635758.
- Coolidge, J. L. (1913). "Two geometrical applications of the mathematics of least squares". The American Mathematical Monthly. 20 (6): 187–190. doi:10.2307/2973072. JSTOR 2973072.
- Cornbleet, P.J.; Gochman, N. (1979). "Incorrect Least–Squares Regression Coefficients". Clinical Chemistry. 25 (3): 432–438. doi:10.1093/clinchem/25.3.432. PMID 262186.
- Deming, W. E. (1943). Statistical adjustment of data. Wiley, NY (Dover Publications edition, 1985). ISBN 0-486-64685-8.
- Fuller, Wayne A. (1987). Measurement error models. John Wiley & Sons, Inc. ISBN 0-471-86187-1.
- Glaister, P. (2001). "Least squares revisited". The Mathematical Gazette. 85: 104–107. doi:10.2307/3620485. JSTOR 3620485. S2CID 125949467.
- Jensen, Anders Christian (2007). "Deming regression, MethComp package" (PDF). Gentofte, Denmark: Steno Diabetes Center.
- Koopmans, T. C. (1936). Linear regression analysis of economic time series. DeErven F. Bohn, Haarlem, Netherlands.
- Kummell, C. H. (1879). "Reduction of observation equations which contain more than one observed quantity". The Analyst. 6 (4): 97–105. doi:10.2307/2635646. JSTOR 2635646.
- Linnet, K. (1993). "Evaluation of regression procedures for method comparison studies". Clinical Chemistry. 39 (3): 424–432. doi:10.1093/clinchem/39.3.424. PMID 8448852.
- Minda, D.; Phelps, S. (2008). "Triangles, ellipses, and cubic polynomials". American Mathematical Monthly. 115 (8): 679–689. doi:10.1080/00029890.2008.11920581. MR 2456092. S2CID 15049234.
- Quarton, T. G. (2020). "Uncoupling gene expression noise along the central dogma using genome engineered human cell lines". Nucleic Acids Research. 48 (16): 9406–9413. doi:10.1093/nar/gkaa668. PMC 7498316. PMID 32810265.