एरर-इन-वैरिएबल मॉडल: Difference between revisions

From Vigyanwiki
(Created page with "{{Short description|Regression models accounting for possible errors in independent variables}}{{Regression bar}} आँकड़ों में, एरर-इन-वैर...")
 
No edit summary
Line 1: Line 1:
{{Short description|Regression models accounting for possible errors in independent variables}}{{Regression bar}}
{{Short description|Regression models accounting for possible errors in independent variables}}{{Regression bar}}
आँकड़ों में, एरर-इन-वैरिएबल मॉडल या माप त्रुटि मॉडल [[प्रतिगमन मॉडल]] हैं जो स्वतंत्र चर में माप त्रुटियों के लिए खाते हैं। इसके विपरीत, मानक प्रतिगमन मॉडल मानते हैं कि उन प्रतिगमनकर्ताओं को सटीक रूप से मापा गया है, या त्रुटि के बिना मनाया गया है; जैसे, वे मॉडल केवल निर्भर चर, या प्रतिक्रियाओं में त्रुटियों के लिए खाते हैं।{{cn|date=November 2015}}
आँकड़ों में, एरर-इन-वैरिएबल मॉडल या माप त्रुटि मॉडल [[प्रतिगमन मॉडल]] हैं जो स्वतंत्र चर में माप त्रुटियों के लिए खाते हैं। इसके विपरीत, मानक प्रतिगमन मॉडल मानते हैं कि उन प्रतिगमनकर्ताओं को यथार्थ रूप से मापा गया है, या त्रुटि के बिना मनाया गया है; जैसे, वे मॉडल मात्र निर्भर चर, या प्रतिक्रियाओं में त्रुटियों के लिए खाते हैं।{{cn|date=November 2015}}


[[File:Visualization of errors-in-variables linear regression.png|thumb|right|260px|एरर-इन-वैरिएबल मॉडल में प्रतिगमन अनुमानों की एक श्रृंखला द्वारा प्रतिगमन कमजोर पड़ने (या क्षीणन पूर्वाग्रह) का चित्रण। दो प्रतिगमन रेखाएँ (लाल) रैखिक प्रतिगमन संभावनाओं की सीमा को बाध्य करती हैं। उथला ढलान तब प्राप्त होता है जब स्वतंत्र चर (या भविष्यवक्ता) भुज (एक्स-अक्ष) पर होता है। तीव्र ढलान तब प्राप्त होता है जब स्वतंत्र चर कोटि (y-अक्ष) पर होता है। परिपाटी से, x-अक्ष पर स्वतंत्र चर के साथ, उथला ढलान प्राप्त होता है। हरे रंग की संदर्भ रेखाएँ प्रत्येक धुरी के साथ मनमाने डिब्बे के भीतर औसत होती हैं। ध्यान दें कि तेज हरे और लाल प्रतिगमन अनुमान y-अक्ष चर में छोटी त्रुटियों के साथ अधिक संगत हैं।]]ऐसे मामले में जब कुछ रजिस्टरों को त्रुटियों के साथ मापा गया है, मानक धारणा के आधार पर अनुमान [[लगातार अनुमानक]] अनुमानों की ओर जाता है, जिसका अर्थ है कि पैरामीटर अनुमान बहुत बड़े नमूनों में भी सही मूल्यों की ओर नहीं जाते हैं। [[सरल रेखीय प्रतिगमन]] के लिए प्रभाव गुणांक का कम अनुमान है, जिसे [[क्षीणन पूर्वाग्रह]] के रूप में जाना जाता है। अरैखिक प्रतिरूपण|अरैखिक प्रतिरूपों में पूर्वाग्रह की दिशा अधिक जटिल होने की संभावना है।<ref>{{Cite journal |last1=Griliches |first1 = Zvi |last2=Ringstad |first2=Vidar |year=1970 |title=गैर-रैखिक संदर्भों में चर-में-त्रुटियां|journal=[[Econometrica]] |volume=38 |issue=2 |pages=368–370 |jstor=1913020 |doi=10.2307/1913020 }}</ref><ref>{{Cite journal |last=Chesher |first=Andrew |year=1991 |title=माप त्रुटि का प्रभाव|journal=[[Biometrika]] |volume=78 |issue=3 |pages=451–462 |jstor=2337015 |doi= 10.1093/biomet/78.3.451 }}</ref><ref>{{Cite book |first1=Raymond J. |last1=Carroll |first2=David |last2=Ruppert |first3=Leonard A. |last3=Stefanski |first4=Ciprian |last4=Crainiceanu |title=Measurement Error in Nonlinear Models: A Modern Perspective |edition=Second |isbn=978-1-58488-633-4 |year=2006 |url=https://books.google.com/books?id=9kBx5CPZCqkC&pg=PA41 }}</ref>
[[File:Visualization of errors-in-variables linear regression.png|thumb|right|260px|एरर-इन-वैरिएबल मॉडल में प्रतिगमन अनुमानों की एक श्रृंखला द्वारा प्रतिगमन तनुता (या क्षीणन पूर्वाग्रह) का चित्रण। दो प्रतिगमन रेखाएँ (लाल) रैखिक प्रतिगमन संभावनाओं की सीमा को बाध्य करती हैं। उथला ढलान तब प्राप्त होता है जब स्वतंत्र चर (या भविष्यवक्ता) भुज (एक्स-अक्ष) पर होता है। तीव्र ढलान तब प्राप्त होता है जब स्वतंत्र चर कोटि (y-अक्ष) पर होता है। परिपाटी से, x-अक्ष पर स्वतंत्र चर के साथ, उथला ढलान प्राप्त होता है। हरे रंग की संदर्भ रेखाएँ प्रत्येक धुरी के साथ मनमाने डिब्बे के भीतर औसत होती हैं। ध्यान दें कि तेज हरे और लाल प्रतिगमन अनुमान y-अक्ष चर में छोटी त्रुटियों के साथ अधिक संगत हैं।]]ऐसी स्थिति में जब कुछ रजिस्टरों को त्रुटियों के साथ मापा गया है, मानक धारणा के आधार पर अनुमान [[लगातार अनुमानक|निरंतर अनुमानक]] अनुमानों की ओर जाता है, जिसका अर्थ है कि पैरामीटर अनुमान बहुत बड़े प्रतिदर्शों में भी सत्य मानों की ओर नहीं जाते हैं। [[सरल रेखीय प्रतिगमन]] के लिए प्रभाव गुणांक का कम अनुमान है, जिसे [[क्षीणन पूर्वाग्रह]] के रूप में जाना जाता है। अरैखिक प्रतिरूपण में पूर्वाग्रह की दिशा अधिक जटिल होने की संभावना है।<ref>{{Cite journal |last1=Griliches |first1 = Zvi |last2=Ringstad |first2=Vidar |year=1970 |title=गैर-रैखिक संदर्भों में चर-में-त्रुटियां|journal=[[Econometrica]] |volume=38 |issue=2 |pages=368–370 |jstor=1913020 |doi=10.2307/1913020 }}</ref><ref>{{Cite journal |last=Chesher |first=Andrew |year=1991 |title=माप त्रुटि का प्रभाव|journal=[[Biometrika]] |volume=78 |issue=3 |pages=451–462 |jstor=2337015 |doi= 10.1093/biomet/78.3.451 }}</ref><ref>{{Cite book |first1=Raymond J. |last1=Carroll |first2=David |last2=Ruppert |first3=Leonard A. |last3=Stefanski |first4=Ciprian |last4=Crainiceanu |title=Measurement Error in Nonlinear Models: A Modern Perspective |edition=Second |isbn=978-1-58488-633-4 |year=2006 |url=https://books.google.com/books?id=9kBx5CPZCqkC&pg=PA41 }}</ref>




== प्रेरक उदाहरण ==
== प्रेरक उदाहरण ==
प्रपत्र के एक साधारण रेखीय प्रतिगमन मॉडल पर विचार करें
प्रपत्र  
:<math>
:<math>
     y_{t} = \alpha + \beta x_{t}^{*} + \varepsilon_t\,, \quad t=1,\ldots,T,
     y_{t} = \alpha + \beta x_{t}^{*} + \varepsilon_t\,, \quad t=1,\ldots,T,
  </math>
  </math>
कहाँ <math>x_{t}^{*}</math> सही लेकिन [[अव्यक्त चर]] को दर्शाता है। इसके बजाय हम इस मान को एक त्रुटि के साथ देखते हैं:
के एक साधारण रेखीय प्रतिगमन मॉडल पर विचार करें जहां <math>x_{t}^{*}</math> सत्य परन्तु [[अव्यक्त चर]] को दर्शाता है। इसके अतिरिक्त हम इस मान को एक त्रुटि के साथ देखते हैं:
:<math>
:<math>
     x_{t} = x_{t}^{*} + \eta_{t}\,
     x_{t} = x_{t}^{*} + \eta_{t}\,
  </math>
  </math>
जहां माप त्रुटि <math>\eta_{t}</math> वास्तविक मूल्य से स्वतंत्र माना जाता है <math>x_{t}^{*}</math>.
जहां माप त्रुटि <math>\eta_{t}</math> को वास्तविक मान <math>x_{t}^{*}</math> से स्वतंत्र माना जाता है।


अगर <math>y_{t}</math>एस बस पर पछता रहे हैं <math>x_{t}</math>′s (सरल रेखीय प्रतिगमन देखें), तो ढलान गुणांक के लिए अनुमानक है
यदि <math>y_{t}</math>पर बस प्रतिगमन किया जाता है <math>x_{t}</math> (सरल रेखीय प्रतिगमन देखें), तो ढलान गुणांक के लिए अनुमानक
: <math>
: <math>
     \hat{\beta} = \frac{\tfrac{1}{T}\sum_{t=1}^T(x_t-\bar{x})(y_t-\bar{y})}
     \hat{\beta} = \frac{\tfrac{1}{T}\sum_{t=1}^T(x_t-\bar{x})(y_t-\bar{y})}
                     {\tfrac{1}{T}\sum_{t=1}^T(x_t-\bar{x})^2}\,,
                     {\tfrac{1}{T}\sum_{t=1}^T(x_t-\bar{x})^2}\,,
   </math>
   </math>
जो नमूना आकार के रूप में अभिसरण करता है <math>T</math> बिना सीमा के बढ़ता है:
है, जो प्रतिदर्श आकार के रूप में अभिसरण करता है <math>T</math> बिना सीमा के बढ़ता है:
: <math>
: <math>
     \hat{\beta} \xrightarrow{p}
     \hat{\beta} \xrightarrow{p}
Line 28: Line 28:
       = \frac{\beta} {1 + \sigma_\eta^2/\sigma_{x^*}^2}\,.
       = \frac{\beta} {1 + \sigma_\eta^2/\sigma_{x^*}^2}\,.
   </math>
   </math>
प्रसरण गैर-ऋणात्मक होते हैं, इसलिए सीमा में अनुमान के वास्तविक मान की तुलना में परिमाण में छोटा होता है <math>\beta</math>, एक प्रभाव जिसे सांख्यिकीविद् क्षीणन या प्रतिगमन कमजोर पड़ने कहते हैं।<ref>{{Cite book |last=Greene |first=William H. |year=2003 |title=अर्थमितीय विश्लेषण|edition=5th |publisher=Prentice Hall |location=New Jersey |isbn=978-0-13-066189-0 |at=Chapter 5.6.1 |url=https://books.google.com/books?id=JJkWAQAAMAAJ }}</ref> इस प्रकार 'भोले' कम से कम वर्ग अनुमानक इस सेटिंग में सुसंगत अनुमानक है। हालाँकि, अनुमानक एक सर्वश्रेष्ठ रैखिक भविष्यवक्ता के लिए आवश्यक पैरामीटर का एक सुसंगत अनुमानक है <math>y</math> दिया गया <math>x</math>: कुछ अनुप्रयोगों में 'सही' प्रतिगमन गुणांक के अनुमान के बजाय यह आवश्यक हो सकता है, हालांकि यह मान लिया जाएगा कि अवलोकन में त्रुटियों का विचरण <math>x^{*}</math> स्थिर रहता है। यह तुरंत ऊपर उद्धृत परिणाम से सीधे आता है, और तथ्य यह है कि प्रतिगमन गुणांक संबंधित है <math>y_{t}</math>वास्तव में देखा गया है <math>x_{t}</math>′s, एक साधारण रेखीय प्रतिगमन में, द्वारा दिया जाता है
प्रसरण गैर-ऋणात्मक होते हैं, इसलिए सीमा में अनुमान <math>\beta</math> के वास्तविक मान की तुलना में परिमाण में छोटा होता है, एक प्रभाव जिसे सांख्यिकीविद् क्षीणन या प्रतिगमन तनुता कहते हैं।<ref>{{Cite book |last=Greene |first=William H. |year=2003 |title=अर्थमितीय विश्लेषण|edition=5th |publisher=Prentice Hall |location=New Jersey |isbn=978-0-13-066189-0 |at=Chapter 5.6.1 |url=https://books.google.com/books?id=JJkWAQAAMAAJ }}</ref> इस प्रकार 'अनुभवहीन ' कम से कम वर्ग अनुमानक इस व्यवस्था में सुसंगत अनुमानक है। यद्यपि, अनुमानक <math>y</math> दिए गए <math>x</math> के सर्वश्रेष्ठ रैखिक भविष्यवक्ता के लिए आवश्यक पैरामीटर का एक सुसंगत अनुमानक है: कुछ अनुप्रयोगों में यह वही हो सकता है जो 'सत्य' प्रतिगमन गुणांक के अनुमान के अतिरिक्त आवश्यक हो, यद्यपि यह मान लिया जाएगा कि <math>x^{*}</math> देखने में त्रुटियों का विचलन स्थिर रहता है। यह तुरंत ऊपर उद्धृत परिणाम से सीधे आता है, और तथ्य यह है कि <math>y_{t}</math> से संबंधित प्रतिगमन गुणांक वस्तुतः मनाया गया <math>x_{t}</math>, एक साधारण रेखीय प्रतिगमन में,  
: <math>
: <math>
     \beta_x =      \frac{\operatorname{Cov}[\,x_t,y_t\,]}{\operatorname{Var}[\,x_t\,]} .
     \beta_x =      \frac{\operatorname{Cov}[\,x_t,y_t\,]}{\operatorname{Var}[\,x_t\,]}  
   </math>
   </math> द्वारा दिया जाता है।
यह गुणांक है, बजाय <math>\beta</math>, जो कि भविष्यवक्ता के निर्माण के लिए आवश्यक होगा <math>y</math> एक अवलोकन के आधार पर <math>x</math> जो शोर के अधीन है।
यह गुणांक है, <math>\beta</math> के अतिरिक्त, जो एक देखे गए <math>x</math> के आधार पर <math>y</math> के भविष्यवक्ता के निर्माण के लिए आवश्यक होगा जो शोर के अधीन है।


यह तर्क दिया जा सकता है कि लगभग सभी मौजूदा डेटा सेट में विभिन्न प्रकृति और परिमाण की त्रुटियां होती हैं, जिससे कि क्षीणन पूर्वाग्रह बहुत बार-बार होता है (हालांकि बहुभिन्नरूपी प्रतिगमन में पूर्वाग्रह की दिशा अस्पष्ट है<ref>{{Cite book |year=2000 |chapter=Measurement Error and Latent Variables |ref=CITEREFWansbeek_and_Meijer2000 |last1=Wansbeek |first1=T. |last2=Meijer |first2=E. |editor-last=Baltagi |editor-first=B. H. |publisher=Blackwell |isbn= 9781405106764|pages=162–179 |chapter-url=https://books.google.com/books?id=xs55E7FsMHMC&pg=PA162 |doi=10.1111/b.9781405106764.2003.00013.x |title=A Companion to Theoretical Econometrics }}</ref>). [[जेरी हॉसमैन]] इसे अर्थमिति के लोहे के नियम के रूप में देखते हैं: अनुमान का परिमाण आमतौर पर अपेक्षा से छोटा होता है।<ref>{{Cite journal |doi=10.1257/jep.15.4.57 |last=Hausman |first=Jerry A. |year=2001 |title=Mismeasured variables in econometric analysis: problems from the right and problems from the left |journal=[[Journal of Economic Perspectives]] |volume=15 |issue=4 |pages=57–67 [p. 58] |jstor=2696516 |doi-access=free }}</ref>
यह तर्क दिया जा सकता है कि लगभग सभी वर्तमान डेटा समूह में विभिन्न प्रकृति और परिमाण की त्रुटियां होती हैं, जिससे कि क्षीणन पूर्वाग्रह बहुत बार-बार होता है (यद्यपि बहुभिन्नरूपी प्रतिगमन में पूर्वाग्रह की दिशा अस्पष्ट है<ref>{{Cite book |year=2000 |chapter=Measurement Error and Latent Variables |ref=CITEREFWansbeek_and_Meijer2000 |last1=Wansbeek |first1=T. |last2=Meijer |first2=E. |editor-last=Baltagi |editor-first=B. H. |publisher=Blackwell |isbn= 9781405106764|pages=162–179 |chapter-url=https://books.google.com/books?id=xs55E7FsMHMC&pg=PA162 |doi=10.1111/b.9781405106764.2003.00013.x |title=A Companion to Theoretical Econometrics }}</ref>)[[जेरी हॉसमैन]] इसे अर्थमिति के लोहे के नियम के रूप में देखते हैं: अनुमान का परिमाण सामान्यतः अपेक्षा से छोटा होता है।<ref>{{Cite journal |doi=10.1257/jep.15.4.57 |last=Hausman |first=Jerry A. |year=2001 |title=Mismeasured variables in econometric analysis: problems from the right and problems from the left |journal=[[Journal of Economic Perspectives]] |volume=15 |issue=4 |pages=57–67 [p. 58] |jstor=2696516 |doi-access=free }}</ref>




== विशिष्टता ==
== विशिष्टता ==
आमतौर पर माप त्रुटि मॉडल को [[अव्यक्त चर मॉडल]] दृष्टिकोण का उपयोग करके वर्णित किया जाता है। अगर <math>y</math> प्रतिक्रिया चर है और <math>x</math> प्रतिगमनकर्ताओं के देखे गए मान हैं, तो यह माना जाता है कि कुछ अव्यक्त चर मौजूद हैं <math>y^{*}</math> और <math>x^{*}</math> जो मॉडल के "ट्रू" फंक्शन (गणित) का पालन करते हैं <math>g(\cdot)</math>, और ऐसा कि देखी गई मात्राएँ उनके शोर अवलोकन हैं:
सामान्यतः माप त्रुटि मॉडल को [[अव्यक्त चर मॉडल]] दृष्टिकोण का उपयोग करके वर्णित किया जाता है। यदि <math>y</math> प्रतिक्रिया चर है और <math>x</math> प्रतिगमनकर्ताओं के देखे गए मान हैं, तो यह माना जाता है कि कुछ अव्यक्त चर <math>y^{*}</math> और <math>x^{*}</math>स्थित हैं जो मॉडल के "सत्य " फलन (गणित) <math>g(\cdot)</math> का अनुसरण करते हैं, और ऐसी देखी गई मात्राएँ उनके शोर अवलोकन हैं:
: <math>\begin{cases}
: <math>\begin{cases}
   y^* = g(x^*\!,w\,|\,\theta),\\   
   y^* = g(x^*\!,w\,|\,\theta),\\   
Line 44: Line 44:
   x = x^{*} + \eta,  
   x = x^{*} + \eta,  
   \end{cases}</math>
   \end{cases}</math>
कहाँ <math>\theta</math> मॉडल का [[पैरामीटर]] है और <math>w</math> वे प्रतिगामी हैं जिन्हें त्रुटि-मुक्त माना जाता है (उदाहरण के लिए जब रैखिक प्रतिगमन में एक अवरोधन होता है, तो स्थिरांक से संबंधित प्रतिगामी में निश्चित रूप से कोई माप त्रुटि नहीं होती है)। विशिष्टताओं के आधार पर इन त्रुटि रहित रजिस्टरों के साथ अलग से व्यवहार किया जा सकता है या नहीं भी किया जा सकता है; बाद के मामले में यह केवल माना जाता है कि के विचरण मैट्रिक्स में संबंधित प्रविष्टियाँ <math>\eta</math>शून्य हैं।
जहां <math>\theta</math> मॉडल का [[पैरामीटर]] है और <math>w</math> वे प्रतिगामी हैं जिन्हें त्रुटि-मुक्त माना जाता है (उदाहरण के लिए जब रैखिक प्रतिगमन में एक अवरोधन होता है, तो स्थिरांक से संबंधित प्रतिगामी में निश्चित रूप से कोई माप त्रुटि नहीं होती है)। विशिष्टताओं के आधार पर इन त्रुटि रहित रजिस्टरों के साथ अलग से व्यवहार किया जा सकता है या नहीं भी किया जा सकता है; बाद की स्थिति में यह मात्र माना जाता है कि <math>\eta</math> के विचरण आव्यूह में संबंधित प्रविष्टियाँ शून्य हैं।


चर <math>y</math>, <math>x</math>, <math>w</math> सभी देखे गए हैं, जिसका अर्थ है कि सांख्यिकीविद के पास [[डेटा सेट]] है <math>n</math> सांख्यिकीय इकाइयाँ <math>\left\{ y_{i}, x_{i}, w_{i} \right\}_{i = 1, \dots, n}</math> जो ऊपर वर्णित डेटा संग्रह का पालन करते हैं; अव्यक्त चर <math>x^*</math>, <math>y^*</math>, <math>\varepsilon</math>, और <math>\eta</math> हालांकि मनाया नहीं जाता है।
चर <math>y</math>, <math>x</math>, <math>w</math> सभी देखे गए हैं, जिसका अर्थ है कि सांख्यिकीविद के समीप <math>n</math> सांख्यिकीय इकाइयों <math>\left\{ y_{i}, x_{i}, w_{i} \right\}_{i = 1, \dots, n}</math> का [[डेटा सेट|डेटा समूह]] है जो ऊपर वर्णित डेटा संग्रह का पालन करता है; यद्यपि अव्यक्त चर <math>x^*</math>, <math>y^*</math>, <math>\varepsilon</math>, और <math>\eta</math> नहीं देखे गए हैं।


यह विनिर्देश सभी मौजूदा त्रुटियों-में-चर मॉडल को शामिल नहीं करता है। उदाहरण के लिए उनमें से कुछ कार्य करते हैं <math>g(\cdot)</math> गैर-पैरामीट्रिक आँकड़े हो सकते हैं | गैर-पैरामीट्रिक या अर्ध-पैरामीट्रिक। अन्य दृष्टिकोण बीच के संबंध को मॉडल करते हैं <math>y^*</math> और <math>x^*</math> कार्यात्मक के बजाय वितरणात्मक के रूप में, यही वे मानते हैं <math>y^*</math> सशर्त रूप से <math>x^*</math> एक निश्चित (आमतौर पर पैरामीट्रिक) वितरण का अनुसरण करता है।
यह विनिर्देश सभी वर्तमान त्रुटियों-में-चर मॉडल को शामिल नहीं करता है। उदाहरण के लिए उनमें से कुछ कार्य करते हैं <math>g(\cdot)</math> गैर-पैरामीट्रिक आँकड़े हो सकते हैं | गैर-पैरामीट्रिक या अर्ध-पैरामीट्रिक। अन्य दृष्टिकोण बीच के संबंध को मॉडल करते हैं <math>y^*</math> और <math>x^*</math> कार्यात्मक के अतिरिक्त वितरणात्मक के रूप में, यही वे मानते हैं <math>y^*</math> सशर्त रूप से <math>x^*</math> एक निश्चित (सामान्यतः पैरामीट्रिक) वितरण का अनुसरण करता है।


=== शब्दावली और धारणाएं ===
=== शब्दावली और धारणाएं ===
Line 54: Line 54:
* अप्राप्य चर <math>x^*</math> अव्यक्त या सत्य चर कहा जा सकता है। इसे या तो एक अज्ञात स्थिरांक के रूप में माना जा सकता है (जिस स्थिति में मॉडल को एक कार्यात्मक मॉडल कहा जाता है), या एक यादृच्छिक चर (तदनुसार एक संरचनात्मक मॉडल) के रूप में।<ref>{{Cite book |last=Fuller |first=Wayne A. |year=1987 |title=मापन त्रुटि मॉडल|publisher=John Wiley & Sons |isbn=978-0-471-86187-4 |page=2 |url=https://books.google.com/books?id=Nalc0DkAJRYC&pg=PA2 }}</ref>
* अप्राप्य चर <math>x^*</math> अव्यक्त या सत्य चर कहा जा सकता है। इसे या तो एक अज्ञात स्थिरांक के रूप में माना जा सकता है (जिस स्थिति में मॉडल को एक कार्यात्मक मॉडल कहा जाता है), या एक यादृच्छिक चर (तदनुसार एक संरचनात्मक मॉडल) के रूप में।<ref>{{Cite book |last=Fuller |first=Wayne A. |year=1987 |title=मापन त्रुटि मॉडल|publisher=John Wiley & Sons |isbn=978-0-471-86187-4 |page=2 |url=https://books.google.com/books?id=Nalc0DkAJRYC&pg=PA2 }}</ref>
* माप त्रुटि के बीच संबंध <math>\eta</math> और अव्यक्त चर <math>x^*</math> अलग-अलग तरीकों से मॉडलिंग की जा सकती है:
* माप त्रुटि के बीच संबंध <math>\eta</math> और अव्यक्त चर <math>x^*</math> अलग-अलग तरीकों से मॉडलिंग की जा सकती है:
** शास्त्रीय त्रुटियां: <math>\eta \perp x^*</math> त्रुटियां अव्यक्त चर की स्वतंत्रता (संभाव्यता सिद्धांत) हैं। यह सबसे आम धारणा है, इसका तात्पर्य है कि मापने वाले उपकरण द्वारा त्रुटियां पेश की जाती हैं और उनका परिमाण मापे जाने वाले मान पर निर्भर नहीं करता है।
** शास्त्रीय त्रुटियां: <math>\eta \perp x^*</math> त्रुटियां अव्यक्त चर की स्वतंत्रता (संभाव्यता सिद्धांत) हैं। यह सबसे सामान्य धारणा है, इसका तात्पर्य है कि मापने वाले उपकरण द्वारा त्रुटियां पेश की जाती हैं और उनका परिमाण मापे जाने वाले मान पर निर्भर नहीं करता है।
** माध्य-स्वतंत्रता: <math>\operatorname{E}[\eta|x^*]\,=\,0,</math> त्रुटियाँ अव्यक्त प्रतिगामी के प्रत्येक मान के लिए माध्य-शून्य हैं। यह शास्त्रीय की तुलना में कम प्रतिबंधात्मक धारणा है,<ref>{{cite book |first=Fumio |last=Hayashi |title=अर्थमिति|publisher=Princeton University Press |year=2000 |pages=7–8 |url=https://books.google.com/books?id=QyIW8WUIyzcC&pg=PA7 |isbn=978-1400823833 }}</ref> क्योंकि यह माप त्रुटियों में [[विषमलैंगिकता]] या अन्य प्रभावों की उपस्थिति की अनुमति देता है।
** माध्य-स्वतंत्रता: <math>\operatorname{E}[\eta|x^*]\,=\,0,</math> त्रुटियाँ अव्यक्त प्रतिगामी के प्रत्येक मान के लिए माध्य-शून्य हैं। यह शास्त्रीय की तुलना में कम प्रतिबंधात्मक धारणा है,<ref>{{cite book |first=Fumio |last=Hayashi |title=अर्थमिति|publisher=Princeton University Press |year=2000 |pages=7–8 |url=https://books.google.com/books?id=QyIW8WUIyzcC&pg=PA7 |isbn=978-1400823833 }}</ref> क्योंकि यह माप त्रुटियों में [[विषमलैंगिकता]] या अन्य प्रभावों की उपस्थिति की अनुमति देता है।
** बर्कसन त्रुटि मॉडल | बर्कसन की त्रुटियां: <math>\eta\,\perp\,x,</math> त्रुटियाँ देखे गए प्रतिगामी x से स्वतंत्र हैं।<ref>{{Cite journal |last1=Koul |first1=Hira |last2=Song |first2=Weixing |year=2008 |title=बर्कसन माप त्रुटियों के साथ प्रतिगमन मॉडल की जाँच|journal=Journal of Statistical Planning and Inference |volume=138 |issue=6 |pages=1615–1628 |doi=10.1016/j.jspi.2007.05.048 }}</ref> इस धारणा की बहुत सीमित प्रयोज्यता है। एक उदाहरण राउंड-ऑफ त्रुटियां हैं: उदाहरण के लिए यदि किसी व्यक्ति की <span style= font-variant:small-caps>age*</span> एक सतत और असतत चर है, जबकि मनाया गया <span style= font-variant:small -caps>age</span> को अगले सबसे छोटे पूर्णांक तक छोटा कर दिया जाता है, फिर ट्रंकेशन त्रुटि देखी गई <span style= font-variant:small-caps>age</span> से लगभग स्वतंत्र होती है। एक और संभावना निश्चित डिजाइन प्रयोग के साथ है: उदाहरण के लिए यदि कोई वैज्ञानिक समय के एक निश्चित पूर्व निर्धारित क्षण पर माप करने का निर्णय लेता है <math>x</math>, साया टी <math>x = 10 s</math>, तब वास्तविक माप किसी अन्य मान पर हो सकता है <math>x^*</math> (उदाहरण के लिए उसके परिमित प्रतिक्रिया समय के कारण) और ऐसी माप त्रुटि आम तौर पर प्रतिगामी के देखे गए मान से स्वतंत्र होगी।
** बर्कसन त्रुटि मॉडल | बर्कसन की त्रुटियां: <math>\eta\,\perp\,x,</math> त्रुटियाँ देखे गए प्रतिगामी x से स्वतंत्र हैं।<ref>{{Cite journal |last1=Koul |first1=Hira |last2=Song |first2=Weixing |year=2008 |title=बर्कसन माप त्रुटियों के साथ प्रतिगमन मॉडल की जाँच|journal=Journal of Statistical Planning and Inference |volume=138 |issue=6 |pages=1615–1628 |doi=10.1016/j.jspi.2007.05.048 }}</ref> इस धारणा की बहुत सीमित प्रयोज्यता है। एक उदाहरण राउंड-ऑफ त्रुटियां हैं: उदाहरण के लिए यदि किसी व्यक्ति की <span style= font-variant:small-caps>age*</span> एक सतत और असतत चर है, जबकि मनाया गया <span style= font-variant:small -caps>age</span> को अगले सबसे छोटे पूर्णांक तक छोटा कर दिया जाता है, फिर ट्रंकेशन त्रुटि देखी गई <span style= font-variant:small-caps>age</span> से लगभग स्वतंत्र होती है। एक और संभावना निश्चित डिजाइन प्रयोग के साथ है: उदाहरण के लिए यदि कोई वैज्ञानिक समय के एक निश्चित पूर्व निर्धारित क्षण पर माप करने का निर्णय लेता है <math>x</math>, साया टी <math>x = 10 s</math>, तब वास्तविक माप किसी अन्य मान पर हो सकता है <math>x^*</math> (उदाहरण के लिए उसके परिमित प्रतिक्रिया समय के कारण) और ऐसी माप त्रुटि सामान्यतः प्रतिगामी के देखे गए मान से स्वतंत्र होगी।
** गलत वर्गीकरण त्रुटियां: [[डमी चर (सांख्यिकी)]] के लिए प्रयुक्त विशेष मामला। अगर <math>x^*</math> एक निश्चित घटना या स्थिति का सूचक है (जैसे कि व्यक्ति पुरुष/महिला है, कुछ चिकित्सा उपचार दिया गया है/नहीं, आदि), तो ऐसे प्रतिगामी में माप त्रुटि टाइप I और टाइप II त्रुटियों के समान गलत वर्गीकरण के अनुरूप होगी सांख्यिकीय परीक्षण में। इस मामले में त्रुटि <math>\eta</math> केवल 3 संभावित मान ले सकते हैं, और इसका वितरण सशर्त है <math>x^*</math> दो मापदंडों के साथ मॉडलिंग की जाती है: <math>\alpha = \operatorname{Pr}[\eta = -1 | x^* = 1]</math>, और <math>\beta =\operatorname{Pr}[\eta = 1 | x^*=0]</math>. पहचान के लिए आवश्यक शर्त यह है कि <math>\alpha + \beta < 1</math>यानी गलत वर्गीकरण बार-बार नहीं होना चाहिए। (इस विचार को दो से अधिक संभावित मानों वाले असतत चरों के लिए सामान्यीकृत किया जा सकता है।)
** गलत वर्गीकरण त्रुटियां: [[डमी चर (सांख्यिकी)]] के लिए प्रयुक्त विशेष मामला। यदि <math>x^*</math> एक निश्चित घटना या स्थिति का सूचक है (जैसे कि व्यक्ति पुरुष/महिला है, कुछ चिकित्सा उपचार दिया गया है/नहीं, आदि), तो ऐसे प्रतिगामी में माप त्रुटि टाइप I और टाइप II त्रुटियों के समान गलत वर्गीकरण के अनुरूप होगी सांख्यिकीय परीक्षण में। इस स्थिति में त्रुटि <math>\eta</math> मात्र 3 संभावित मान ले सकते हैं, और इसका वितरण सशर्त है <math>x^*</math> दो मापदंडों के साथ मॉडलिंग की जाती है: <math>\alpha = \operatorname{Pr}[\eta = -1 | x^* = 1]</math>, और <math>\beta =\operatorname{Pr}[\eta = 1 | x^*=0]</math>पहचान के लिए आवश्यक शर्त यह है कि <math>\alpha + \beta < 1</math>यानी गलत वर्गीकरण बार-बार नहीं होना चाहिए। (इस विचार को दो से अधिक संभावित मानों वाले असतत चरों के लिए सामान्यीकृत किया जा सकता है।)


== [[रैखिक मॉडल]] ==
== [[रैखिक मॉडल]] ==
रैखिक त्रुटियों-में-चर मॉडल का पहले अध्ययन किया गया था, शायद इसलिए कि रैखिक मॉडल इतने व्यापक रूप से उपयोग किए गए थे और वे गैर-रैखिक वाले की तुलना में आसान हैं। मानक साधारण न्यूनतम वर्ग प्रतिगमन (OLS) के विपरीत, चर प्रतिगमन (EiV) में त्रुटियों को सरल से बहुभिन्नरूपी मामले में विस्तारित करना सीधा नहीं है।
रैखिक त्रुटियों-में-चर मॉडल का पहले अध्ययन किया गया था, शायद इसलिए कि रैखिक मॉडल इतने व्यापक रूप से उपयोग किए गए थे और वे गैर-रैखिक वाले की तुलना में आसान हैं। मानक साधारण न्यूनतम वर्ग प्रतिगमन (OLS) के विपरीत, चर प्रतिगमन (EiV) में त्रुटियों को सरल से बहुभिन्नरूपी स्थिति में विस्तारित करना सीधा नहीं है।


=== सरल रैखिक मॉडल ===
=== सरल रैखिक मॉडल ===
Line 70: Line 70:
जहाँ सभी चर [[अदिश (गणित)]] हैं। यहाँ α और β ब्याज के पैरामीटर हैं, जबकि σ<sub>ε</sub>और पी<sub>η</sub>-त्रुटि शर्तों के मानक विचलन-[[उपद्रव पैरामीटर]] हैं। वास्तविक प्रतिगामी x* को एक यादृच्छिक चर (संरचनात्मक मॉडल) के रूप में माना जाता है, माप त्रुटि η (क्लासिक धारणा) से स्वतंत्र।
जहाँ सभी चर [[अदिश (गणित)]] हैं। यहाँ α और β ब्याज के पैरामीटर हैं, जबकि σ<sub>ε</sub>और पी<sub>η</sub>-त्रुटि शर्तों के मानक विचलन-[[उपद्रव पैरामीटर]] हैं। वास्तविक प्रतिगामी x* को एक यादृच्छिक चर (संरचनात्मक मॉडल) के रूप में माना जाता है, माप त्रुटि η (क्लासिक धारणा) से स्वतंत्र।


यह मॉडल दो मामलों में पहचाना जा सकता है: (1) या तो अव्यक्त प्रतिगामी x* [[सामान्य वितरण]] नहीं है, (2) या x* का सामान्य वितरण है, लेकिन न तो ε<sub>t</sub>न ही एच<sub>t</sub>एक सामान्य वितरण से विभाज्य हैं।<ref>{{Cite journal |last=Reiersøl |first=Olav |year=1950 |title=त्रुटि के अधीन चर के बीच एक रैखिक संबंध की पहचान|journal=[[Econometrica]] |volume=18 |issue=4
यह मॉडल दो मामलों में पहचाना जा सकता है: (1) या तो अव्यक्त प्रतिगामी x* [[सामान्य वितरण]] नहीं है, (2) या x* का सामान्य वितरण है, परन्तु न तो ε<sub>t</sub>न ही एच<sub>t</sub>एक सामान्य वितरण से विभाज्य हैं।<ref>{{Cite journal |last=Reiersøl |first=Olav |year=1950 |title=त्रुटि के अधीन चर के बीच एक रैखिक संबंध की पहचान|journal=[[Econometrica]] |volume=18 |issue=4
  |pages=375–389 [p. 383] |jstor=1907835 |doi=10.2307/1907835 }} A somewhat more restrictive result was established earlier by {{cite journal |first=R. C. |last=Geary |title=Inherent relations between random variables |journal=[[Proceedings of the Royal Irish Academy]] |volume=47 |year=1942 |pages=63–76 |jstor=20488436 }} He showed that under the additional assumption that (''ε, η'') are jointly normal, the model is not identified if and only if ''x*''s are normal.</ref> यही है, पैरामीटर α, β डेटा सेट से लगातार अनुमान लगाया जा सकता है <math>\scriptstyle(x_t,\,y_t)_{t=1}^T</math> बिना किसी अतिरिक्त जानकारी के, बशर्ते अव्यक्त प्रतिगामी गाऊसी नहीं है।
  |pages=375–389 [p. 383] |jstor=1907835 |doi=10.2307/1907835 }} A somewhat more restrictive result was established earlier by {{cite journal |first=R. C. |last=Geary |title=Inherent relations between random variables |journal=[[Proceedings of the Royal Irish Academy]] |volume=47 |year=1942 |pages=63–76 |jstor=20488436 }} He showed that under the additional assumption that (''ε, η'') are jointly normal, the model is not identified if and only if ''x*''s are normal.</ref> यही है, पैरामीटर α, β डेटा समूह से निरंतर अनुमान लगाया जा सकता है <math>\scriptstyle(x_t,\,y_t)_{t=1}^T</math> बिना किसी अतिरिक्त जानकारी के, बशर्ते अव्यक्त प्रतिगामी गाऊसी नहीं है।


इस पहचान योग्य परिणाम के स्थापित होने से पहले, सांख्यिकीविदों ने यह मानकर अधिकतम संभावना तकनीक लागू करने का प्रयास किया कि सभी चर सामान्य हैं, और फिर निष्कर्ष निकाला कि मॉडल की पहचान नहीं की गई है। सुझाया गया उपाय यह मानना ​​था कि मॉडल के कुछ पैरामीटर ज्ञात हैं या बाहरी स्रोत से अनुमान लगाया जा सकता है। इस तरह के आकलन के तरीकों में शामिल हैं<ref>{{Cite book |last=Fuller |first=Wayne A. |year=1987 |chapter=A Single Explanatory Variable |title=मापन त्रुटि मॉडल|publisher=John Wiley & Sons |isbn=978-0-471-86187-4 |pages=1–99 |chapter-url=https://books.google.com/books?id=Nalc0DkAJRYC&pg=PA1 }}</ref>
इस पहचान योग्य परिणाम के स्थापित होने से पहले, सांख्यिकीविदों ने यह मानकर अधिकतम संभावना तकनीक लागू करने का प्रयास किया कि सभी चर सामान्य हैं, और फिर निष्कर्ष निकाला कि मॉडल की पहचान नहीं की गई है। सुझाया गया उपाय यह मानना ​​था कि मॉडल के कुछ पैरामीटर ज्ञात हैं या बाहरी स्रोत से अनुमान लगाया जा सकता है। इस तरह के आकलन के तरीकों में शामिल हैं<ref>{{Cite book |last=Fuller |first=Wayne A. |year=1987 |chapter=A Single Explanatory Variable |title=मापन त्रुटि मॉडल|publisher=John Wiley & Sons |isbn=978-0-471-86187-4 |pages=1–99 |chapter-url=https://books.google.com/books?id=Nalc0DkAJRYC&pg=PA1 }}</ref>
* [[डेमिंग प्रतिगमन]] - मानता है कि अनुपात δ = σ²<उप शैली= स्थिति:सापेक्ष;बाएं:-.4em >ε</sub>/σ²<उप शैली= स्थिति:सापेक्ष;बाएं:-.4em >η</sub > जाना जाता है। यह उदाहरण के लिए उपयुक्त हो सकता है जब y और x दोनों में त्रुटियाँ माप के कारण होती हैं, और माप उपकरणों या प्रक्रियाओं की सटीकता ज्ञात होती है। मामला जब δ = 1 को [[ऑर्थोगोनल प्रतिगमन]] के रूप में भी जाना जाता है।
* [[डेमिंग प्रतिगमन]] - मानता है कि अनुपात δ = σ²<उप शैली= स्थिति:सापेक्ष;बाएं:-.4em >ε</sub>/σ²<उप शैली= स्थिति:सापेक्ष;बाएं:-.4em >η</sub > जाना जाता है। यह उदाहरण के लिए उपयुक्त हो सकता है जब y और x दोनों में त्रुटियाँ माप के कारण होती हैं, और माप उपकरणों या प्रक्रियाओं की सटीकता ज्ञात होती है। मामला जब δ = 1 को [[ऑर्थोगोनल प्रतिगमन]] के रूप में भी जाना जाता है।
* ज्ञात [[विश्वसनीयता (सांख्यिकी)]] के साथ प्रतिगमन λ = σ²<उप शैली= स्थिति:सापेक्ष;बाएं:-.6em >∗</उप>/ ( σ²<उप शैली= स्थिति:सापेक्ष;बाएं:-.4em >η</ उप> + σ²<उप शैली= स्थिति: सापेक्ष;बाएं:-.6em >∗</उप>), जहां σ²<उप शैली= स्थिति: सापेक्ष;बाएं:-.6em >∗</उप> का प्रसरण है अव्यक्त प्रतिगामी। इस तरह के दृष्टिकोण उदाहरण के लिए लागू हो सकते हैं जब एक ही इकाई के दोहराए गए माप उपलब्ध हों, या जब स्वतंत्र अध्ययन से विश्वसनीयता अनुपात ज्ञात हो। इस मामले में ढलान का सुसंगत अनुमान λ द्वारा विभाजित न्यूनतम वर्ग अनुमान के बराबर है।
* ज्ञात [[विश्वसनीयता (सांख्यिकी)]] के साथ प्रतिगमन λ = σ²<उप शैली= स्थिति:सापेक्ष;बाएं:-.6em >∗</उप>/ ( σ²<उप शैली= स्थिति:सापेक्ष;बाएं:-.4em >η</ उप> + σ²<उप शैली= स्थिति: सापेक्ष;बाएं:-.6em >∗</उप>), जहां σ²<उप शैली= स्थिति: सापेक्ष;बाएं:-.6em >∗</उप> का प्रसरण है अव्यक्त प्रतिगामी। इस तरह के दृष्टिकोण उदाहरण के लिए लागू हो सकते हैं जब एक ही इकाई के दोहराए गए माप उपलब्ध हों, या जब स्वतंत्र अध्ययन से विश्वसनीयता अनुपात ज्ञात हो। इस स्थिति में ढलान का सुसंगत अनुमान λ द्वारा विभाजित न्यूनतम वर्ग अनुमान के बराबर है।
* ज्ञात σ²<उप शैली= स्थिति:सापेक्ष;बाएं:-.4em >η</उप> के साथ प्रतिगमन तब हो सकता है जब x में त्रुटियों का स्रोत ज्ञात हो और उनके प्रसरण की गणना की जा सके। इसमें राउंडिंग एरर, या मापने वाले उपकरण द्वारा पेश की गई त्रुटियां शामिल हो सकती हैं। जब σ²<उप शैली= स्थिति:सापेक्ष;बाएं:-.4em >η</उप> ज्ञात हो जाता है तो हम विश्वसनीयता अनुपात की गणना λ = ( σ²<उप शैली= स्थिति: सापेक्ष;बाएं:-.4em >x<) के रूप में कर सकते हैं /उप> − σ²<उप शैली= स्थिति:सापेक्ष;बाएं:-.4em >η</उप>) / σ²<उप शैली= स्थिति: सापेक्ष;बाएं:-.4em>x</उप> और समस्या को कम करें पिछले मामले के लिए।
* ज्ञात σ²<उप शैली= स्थिति:सापेक्ष;बाएं:-.4em >η</उप> के साथ प्रतिगमन तब हो सकता है जब x में त्रुटियों का स्रोत ज्ञात हो और उनके प्रसरण की गणना की जा सके। इसमें राउंडिंग एरर, या मापने वाले उपकरण द्वारा पेश की गई त्रुटियां शामिल हो सकती हैं। जब σ²<उप शैली= स्थिति:सापेक्ष;बाएं:-.4em >η</उप> ज्ञात हो जाता है तो हम विश्वसनीयता अनुपात की गणना λ = ( σ²<उप शैली= स्थिति: सापेक्ष;बाएं:-.4em >x<) के रूप में कर सकते हैं /उप> − σ²<उप शैली= स्थिति:सापेक्ष;बाएं:-.4em >η</उप>) / σ²<उप शैली= स्थिति: सापेक्ष;बाएं:-.4em>x</उप> और समस्या को कम करें पिछले मामले के लिए।


Line 96: Line 96:


=== बहुभिन्नरूपी रैखिक मॉडल ===
=== बहुभिन्नरूपी रैखिक मॉडल ===
बहुभिन्नरूपी मॉडल बिल्कुल साधारण रैखिक मॉडल जैसा दिखता है, केवल इस बार β, η<sub>''t''</sub>, एक्स<sub>''t''</sub> और x*<sub style= position:relative;left:-.4em >t</sub> k×1 सदिश हैं।
बहुभिन्नरूपी मॉडल बिल्कुल साधारण रैखिक मॉडल जैसा दिखता है, मात्र इस बार β, η<sub>''t''</sub>, एक्स<sub>''t''</sub> और x*<sub style= position:relative;left:-.4em >t</sub> k×1 सदिश हैं।
: <math>\begin{cases}
: <math>\begin{cases}
     y_t = \alpha + \beta'x_t^* + \varepsilon_t, \\
     y_t = \alpha + \beta'x_t^* + \varepsilon_t, \\
     x_t = x_t^* + \eta_t.
     x_t = x_t^* + \eta_t.
   \end{cases}</math>
   \end{cases}</math>
मामले में जब (ε<sub>''t''</sub>, द<sub>''t''</sub>) संयुक्त रूप से सामान्य है, पैरामीटर β की पहचान नहीं की जाती है अगर और केवल अगर कोई गैर-एकवचन k×k ब्लॉक मैट्रिक्स [a A] है, जहां a k×1 वेक्टर है जैसे कि a′x* सामान्य रूप से और स्वतंत्र रूप से वितरित किया जाता है एक्स *। मामले में जब ε<sub>''t''</sub>, द<sub>''t1''</sub>,..., द<sub>''tk''</sub> पारस्परिक रूप से स्वतंत्र हैं, पैरामीटर β की पहचान नहीं की जाती है अगर और केवल अगर उपरोक्त शर्तों के अतिरिक्त कुछ त्रुटियां दो स्वतंत्र चर के योग के रूप में लिखी जा सकती हैं जिनमें से एक सामान्य है।<ref>{{Cite journal |last=Ben-Moshe |first=Dan |year=2020 |title=सभी चरों में त्रुटियों के साथ रेखीय प्रतिगमन की पहचान|journal=[[Econometric Theory]] |volume=37 |issue=4 |pages=1–31 |doi=10.1017/S0266466620000250|arxiv=1404.1473 |s2cid=225653359 }}</ref>
स्थिति में जब (ε<sub>''t''</sub>, द<sub>''t''</sub>) संयुक्त रूप से सामान्य है, पैरामीटर β की पहचान नहीं की जाती है यदि और मात्र यदि कोई गैर-एकवचन k×k ब्लॉक आव्यूह [a A] है, जहां a k×1 वेक्टर है जैसे कि a′x* सामान्य रूप से और स्वतंत्र रूप से वितरित किया जाता है एक्स *। स्थिति में जब ε<sub>''t''</sub>, द<sub>''t1''</sub>,..., द<sub>''tk''</sub> पारस्परिक रूप से स्वतंत्र हैं, पैरामीटर β की पहचान नहीं की जाती है यदि और मात्र यदि उपरोक्त शर्तों के अतिरिक्त कुछ त्रुटियां दो स्वतंत्र चर के योग के रूप में लिखी जा सकती हैं जिनमें से एक सामान्य है।<ref>{{Cite journal |last=Ben-Moshe |first=Dan |year=2020 |title=सभी चरों में त्रुटियों के साथ रेखीय प्रतिगमन की पहचान|journal=[[Econometric Theory]] |volume=37 |issue=4 |pages=1–31 |doi=10.1017/S0266466620000250|arxiv=1404.1473 |s2cid=225653359 }}</ref>
बहुभिन्नरूपी रेखीय मॉडल के लिए कुछ आकलन विधियाँ हैं
बहुभिन्नरूपी रेखीय मॉडल के लिए कुछ आकलन विधियाँ हैं
{{unordered list
{{unordered list
Line 135: Line 135:
यहाँ फलन g पैरामीट्रिक या गैर-पैरामीट्रिक हो सकता है। जब फ़ंक्शन जी पैरामीट्रिक होता है तो इसे जी (एक्स *, β) के रूप में लिखा जाएगा।
यहाँ फलन g पैरामीट्रिक या गैर-पैरामीट्रिक हो सकता है। जब फ़ंक्शन जी पैरामीट्रिक होता है तो इसे जी (एक्स *, β) के रूप में लिखा जाएगा।


एक सामान्य वेक्टर-मूल्यवान प्रतिगामी x* के लिए मॉडल की [[पहचान]] के लिए शर्तें ज्ञात नहीं हैं। हालाँकि स्केलर x* के मामले में मॉडल की पहचान तब तक की जाती है जब तक कि फ़ंक्शन g लॉग-एक्सपोनेंशियल फॉर्म का न हो <ref>{{Cite journal |year=2007 |title=बिना साइड जानकारी के क्लासिकल एरर-इन-वैरिएबल मॉडल की गैर पैरामीट्रिक पहचान|journal=Working Paper |url=http://escholarship.bc.edu/cgi/viewcontent.cgi?article=1433&context=econ_papers |last1=Schennach |first1=S. |author-link1=Susanne Schennach |last2=Hu |first2=Y. |last3=Lewbel |first3=A. }}</ref>
एक सामान्य वेक्टर-मानवान प्रतिगामी x* के लिए मॉडल की [[पहचान]] के लिए शर्तें ज्ञात नहीं हैं। यद्यपि स्केलर x* की स्थिति में मॉडल की पहचान तब तक की जाती है जब तक कि फ़ंक्शन g लॉग-एक्सपोनेंशियल फॉर्म का न हो <ref>{{Cite journal |year=2007 |title=बिना साइड जानकारी के क्लासिकल एरर-इन-वैरिएबल मॉडल की गैर पैरामीट्रिक पहचान|journal=Working Paper |url=http://escholarship.bc.edu/cgi/viewcontent.cgi?article=1433&context=econ_papers |last1=Schennach |first1=S. |author-link1=Susanne Schennach |last2=Hu |first2=Y. |last3=Lewbel |first3=A. }}</ref>
: <math>g(x^*) = a + b \ln\big(e^{cx^*} + d\big)</math>
: <math>g(x^*) = a + b \ln\big(e^{cx^*} + d\big)</math>
और अव्यक्त प्रतिगामी x* का घनत्व है
और अव्यक्त प्रतिगामी x* का घनत्व है
Line 146: Line 146:
जहां स्थिरांक A,B,C,D,E,F a,b,c,d पर निर्भर हो सकते हैं।
जहां स्थिरांक A,B,C,D,E,F a,b,c,d पर निर्भर हो सकते हैं।


इस आशावादी परिणाम के बावजूद, अब तक बिना किसी बाहरी जानकारी के गैर-रैखिक त्रुटियों-में-चर मॉडल का अनुमान लगाने के लिए कोई तरीका मौजूद नहीं है। हालाँकि ऐसी कई तकनीकें हैं जो कुछ अतिरिक्त डेटा का उपयोग करती हैं: या तो उपकरण चर, या बार-बार अवलोकन।
इस आशावादी परिणाम के बावजूद, अब तक बिना किसी बाहरी जानकारी के गैर-रैखिक त्रुटियों-में-चर मॉडल का अनुमान लगाने के लिए कोई तरीका स्थित नहीं है। यद्यपि ऐसी कई तकनीकें हैं जो कुछ अतिरिक्त डेटा का उपयोग करती हैं: या तो उपकरण चर, या बार-बार अवलोकन।


=== वाद्य चर विधियाँ ===
=== वाद्य चर विधियाँ ===
Line 168: Line 168:


=== दोहराए गए अवलोकन ===
=== दोहराए गए अवलोकन ===
इस दृष्टिकोण में प्रतिगामी x* के दो (या शायद अधिक) बार-बार अवलोकन उपलब्ध हैं। दोनों अवलोकनों में अपनी माप त्रुटियां होती हैं, हालांकि उन त्रुटियों को स्वतंत्र होने की आवश्यकता होती है:
इस दृष्टिकोण में प्रतिगामी x* के दो (या शायद अधिक) बार-बार अवलोकन उपलब्ध हैं। दोनों अवलोकनों में अपनी माप त्रुटियां होती हैं, यद्यपि उन त्रुटियों को स्वतंत्र होने की आवश्यकता होती है:
: <math>\begin{cases}
: <math>\begin{cases}
     x_{1t} = x^*_t + \eta_{1t}, \\
     x_{1t} = x^*_t + \eta_{1t}, \\
     x_{2t} = x^*_t + \eta_{2t},
     x_{2t} = x^*_t + \eta_{2t},
   \end{cases}</math>
   \end{cases}</math>
जहाँ x* ⊥ η<sub>1</sub> ⊥ एच<sub>2</sub>. चर एच<sub>1</sub>, द<sub>2</sub> समान रूप से वितरित करने की आवश्यकता नहीं है (हालांकि यदि वे अनुमानक की दक्षता में थोड़ा सुधार कर सकते हैं)। केवल इन दो प्रेक्षणों के साथ कोटलार्स्की की विसंक्रमण तकनीक का प्रयोग करके x* के घनत्व फलन का लगातार अनुमान लगाना संभव है।<ref>{{Cite journal |last1=Li |first1=Tong |last2=Vuong |first2=Quang |year=1998 |title=कई संकेतकों का उपयोग करके माप त्रुटि मॉडल का गैर पैरामीट्रिक अनुमान|journal=[[Journal of Multivariate Analysis]] |volume=65 |issue=2 |pages=139–165 |doi=10.1006/jmva.1998.1741 |doi-access=free }}</ref>
जहाँ x* ⊥ η<sub>1</sub> ⊥ एच<sub>2</sub>चर एच<sub>1</sub>, द<sub>2</sub> समान रूप से वितरित करने की आवश्यकता नहीं है (यद्यपि यदि वे अनुमानक की दक्षता में थोड़ा सुधार कर सकते हैं)। मात्र इन दो प्रेक्षणों के साथ कोटलार्स्की की विसंक्रमण तकनीक का प्रयोग करके x* के घनत्व फलन का निरंतर अनुमान लगाना संभव है।<ref>{{Cite journal |last1=Li |first1=Tong |last2=Vuong |first2=Quang |year=1998 |title=कई संकेतकों का उपयोग करके माप त्रुटि मॉडल का गैर पैरामीट्रिक अनुमान|journal=[[Journal of Multivariate Analysis]] |volume=65 |issue=2 |pages=139–165 |doi=10.1006/jmva.1998.1741 |doi-access=free }}</ref>
{{unordered list
{{unordered list
|1= '''Li's conditional density method''' for parametric models.<ref>{{Cite journal |last=Li |first=Tong |year=2002 |title=Robust and consistent estimation of nonlinear errors-in-variables models |journal=[[Journal of Econometrics]] |volume=110 |issue=1 |pages=1–26 |doi=10.1016/S0304-4076(02)00120-3 }}</ref> The regression equation can be written in terms of the observable variables as
|1= '''Li's conditional density method''' for parametric models.<ref>{{Cite journal |last=Li |first=Tong |year=2002 |title=Robust and consistent estimation of nonlinear errors-in-variables models |journal=[[Journal of Econometrics]] |volume=110 |issue=1 |pages=1–26 |doi=10.1016/S0304-4076(02)00120-3 }}</ref> The regression equation can be written in terms of the observable variables as

Revision as of 20:53, 29 March 2023

आँकड़ों में, एरर-इन-वैरिएबल मॉडल या माप त्रुटि मॉडल प्रतिगमन मॉडल हैं जो स्वतंत्र चर में माप त्रुटियों के लिए खाते हैं। इसके विपरीत, मानक प्रतिगमन मॉडल मानते हैं कि उन प्रतिगमनकर्ताओं को यथार्थ रूप से मापा गया है, या त्रुटि के बिना मनाया गया है; जैसे, वे मॉडल मात्र निर्भर चर, या प्रतिक्रियाओं में त्रुटियों के लिए खाते हैं।[citation needed]

एरर-इन-वैरिएबल मॉडल में प्रतिगमन अनुमानों की एक श्रृंखला द्वारा प्रतिगमन तनुता (या क्षीणन पूर्वाग्रह) का चित्रण। दो प्रतिगमन रेखाएँ (लाल) रैखिक प्रतिगमन संभावनाओं की सीमा को बाध्य करती हैं। उथला ढलान तब प्राप्त होता है जब स्वतंत्र चर (या भविष्यवक्ता) भुज (एक्स-अक्ष) पर होता है। तीव्र ढलान तब प्राप्त होता है जब स्वतंत्र चर कोटि (y-अक्ष) पर होता है। परिपाटी से, x-अक्ष पर स्वतंत्र चर के साथ, उथला ढलान प्राप्त होता है। हरे रंग की संदर्भ रेखाएँ प्रत्येक धुरी के साथ मनमाने डिब्बे के भीतर औसत होती हैं। ध्यान दें कि तेज हरे और लाल प्रतिगमन अनुमान y-अक्ष चर में छोटी त्रुटियों के साथ अधिक संगत हैं।

ऐसी स्थिति में जब कुछ रजिस्टरों को त्रुटियों के साथ मापा गया है, मानक धारणा के आधार पर अनुमान निरंतर अनुमानक अनुमानों की ओर जाता है, जिसका अर्थ है कि पैरामीटर अनुमान बहुत बड़े प्रतिदर्शों में भी सत्य मानों की ओर नहीं जाते हैं। सरल रेखीय प्रतिगमन के लिए प्रभाव गुणांक का कम अनुमान है, जिसे क्षीणन पूर्वाग्रह के रूप में जाना जाता है। अरैखिक प्रतिरूपण में पूर्वाग्रह की दिशा अधिक जटिल होने की संभावना है।[1][2][3]


प्रेरक उदाहरण

प्रपत्र

के एक साधारण रेखीय प्रतिगमन मॉडल पर विचार करें जहां सत्य परन्तु अव्यक्त चर को दर्शाता है। इसके अतिरिक्त हम इस मान को एक त्रुटि के साथ देखते हैं:

जहां माप त्रुटि को वास्तविक मान से स्वतंत्र माना जाता है।

यदि पर बस प्रतिगमन किया जाता है (सरल रेखीय प्रतिगमन देखें), तो ढलान गुणांक के लिए अनुमानक

है, जो प्रतिदर्श आकार के रूप में अभिसरण करता है बिना सीमा के बढ़ता है:

प्रसरण गैर-ऋणात्मक होते हैं, इसलिए सीमा में अनुमान के वास्तविक मान की तुलना में परिमाण में छोटा होता है, एक प्रभाव जिसे सांख्यिकीविद् क्षीणन या प्रतिगमन तनुता कहते हैं।[4] इस प्रकार 'अनुभवहीन ' कम से कम वर्ग अनुमानक इस व्यवस्था में सुसंगत अनुमानक है। यद्यपि, अनुमानक दिए गए के सर्वश्रेष्ठ रैखिक भविष्यवक्ता के लिए आवश्यक पैरामीटर का एक सुसंगत अनुमानक है: कुछ अनुप्रयोगों में यह वही हो सकता है जो 'सत्य' प्रतिगमन गुणांक के अनुमान के अतिरिक्त आवश्यक हो, यद्यपि यह मान लिया जाएगा कि देखने में त्रुटियों का विचलन स्थिर रहता है। यह तुरंत ऊपर उद्धृत परिणाम से सीधे आता है, और तथ्य यह है कि से संबंधित प्रतिगमन गुणांक वस्तुतः मनाया गया , एक साधारण रेखीय प्रतिगमन में,

द्वारा दिया जाता है।

यह गुणांक है, के अतिरिक्त, जो एक देखे गए के आधार पर के भविष्यवक्ता के निर्माण के लिए आवश्यक होगा जो शोर के अधीन है।

यह तर्क दिया जा सकता है कि लगभग सभी वर्तमान डेटा समूह में विभिन्न प्रकृति और परिमाण की त्रुटियां होती हैं, जिससे कि क्षीणन पूर्वाग्रह बहुत बार-बार होता है (यद्यपि बहुभिन्नरूपी प्रतिगमन में पूर्वाग्रह की दिशा अस्पष्ट है[5])। जेरी हॉसमैन इसे अर्थमिति के लोहे के नियम के रूप में देखते हैं: अनुमान का परिमाण सामान्यतः अपेक्षा से छोटा होता है।[6]


विशिष्टता

सामान्यतः माप त्रुटि मॉडल को अव्यक्त चर मॉडल दृष्टिकोण का उपयोग करके वर्णित किया जाता है। यदि प्रतिक्रिया चर है और प्रतिगमनकर्ताओं के देखे गए मान हैं, तो यह माना जाता है कि कुछ अव्यक्त चर और स्थित हैं जो मॉडल के "सत्य " फलन (गणित) का अनुसरण करते हैं, और ऐसी देखी गई मात्राएँ उनके शोर अवलोकन हैं:

जहां मॉडल का पैरामीटर है और वे प्रतिगामी हैं जिन्हें त्रुटि-मुक्त माना जाता है (उदाहरण के लिए जब रैखिक प्रतिगमन में एक अवरोधन होता है, तो स्थिरांक से संबंधित प्रतिगामी में निश्चित रूप से कोई माप त्रुटि नहीं होती है)। विशिष्टताओं के आधार पर इन त्रुटि रहित रजिस्टरों के साथ अलग से व्यवहार किया जा सकता है या नहीं भी किया जा सकता है; बाद की स्थिति में यह मात्र माना जाता है कि के विचरण आव्यूह में संबंधित प्रविष्टियाँ शून्य हैं।

चर , , सभी देखे गए हैं, जिसका अर्थ है कि सांख्यिकीविद के समीप सांख्यिकीय इकाइयों का डेटा समूह है जो ऊपर वर्णित डेटा संग्रह का पालन करता है; यद्यपि अव्यक्त चर , , , और नहीं देखे गए हैं।

यह विनिर्देश सभी वर्तमान त्रुटियों-में-चर मॉडल को शामिल नहीं करता है। उदाहरण के लिए उनमें से कुछ कार्य करते हैं गैर-पैरामीट्रिक आँकड़े हो सकते हैं | गैर-पैरामीट्रिक या अर्ध-पैरामीट्रिक। अन्य दृष्टिकोण बीच के संबंध को मॉडल करते हैं और कार्यात्मक के अतिरिक्त वितरणात्मक के रूप में, यही वे मानते हैं सशर्त रूप से एक निश्चित (सामान्यतः पैरामीट्रिक) वितरण का अनुसरण करता है।

शब्दावली और धारणाएं

  • मनाया चर मेनिफेस्ट, संकेतक, या प्रॉक्सी (सांख्यिकी) कहा जा सकता है।
  • अप्राप्य चर अव्यक्त या सत्य चर कहा जा सकता है। इसे या तो एक अज्ञात स्थिरांक के रूप में माना जा सकता है (जिस स्थिति में मॉडल को एक कार्यात्मक मॉडल कहा जाता है), या एक यादृच्छिक चर (तदनुसार एक संरचनात्मक मॉडल) के रूप में।[7]
  • माप त्रुटि के बीच संबंध और अव्यक्त चर अलग-अलग तरीकों से मॉडलिंग की जा सकती है:
    • शास्त्रीय त्रुटियां: त्रुटियां अव्यक्त चर की स्वतंत्रता (संभाव्यता सिद्धांत) हैं। यह सबसे सामान्य धारणा है, इसका तात्पर्य है कि मापने वाले उपकरण द्वारा त्रुटियां पेश की जाती हैं और उनका परिमाण मापे जाने वाले मान पर निर्भर नहीं करता है।
    • माध्य-स्वतंत्रता: त्रुटियाँ अव्यक्त प्रतिगामी के प्रत्येक मान के लिए माध्य-शून्य हैं। यह शास्त्रीय की तुलना में कम प्रतिबंधात्मक धारणा है,[8] क्योंकि यह माप त्रुटियों में विषमलैंगिकता या अन्य प्रभावों की उपस्थिति की अनुमति देता है।
    • बर्कसन त्रुटि मॉडल | बर्कसन की त्रुटियां: त्रुटियाँ देखे गए प्रतिगामी x से स्वतंत्र हैं।[9] इस धारणा की बहुत सीमित प्रयोज्यता है। एक उदाहरण राउंड-ऑफ त्रुटियां हैं: उदाहरण के लिए यदि किसी व्यक्ति की age* एक सतत और असतत चर है, जबकि मनाया गया age को अगले सबसे छोटे पूर्णांक तक छोटा कर दिया जाता है, फिर ट्रंकेशन त्रुटि देखी गई age से लगभग स्वतंत्र होती है। एक और संभावना निश्चित डिजाइन प्रयोग के साथ है: उदाहरण के लिए यदि कोई वैज्ञानिक समय के एक निश्चित पूर्व निर्धारित क्षण पर माप करने का निर्णय लेता है , साया टी , तब वास्तविक माप किसी अन्य मान पर हो सकता है (उदाहरण के लिए उसके परिमित प्रतिक्रिया समय के कारण) और ऐसी माप त्रुटि सामान्यतः प्रतिगामी के देखे गए मान से स्वतंत्र होगी।
    • गलत वर्गीकरण त्रुटियां: डमी चर (सांख्यिकी) के लिए प्रयुक्त विशेष मामला। यदि एक निश्चित घटना या स्थिति का सूचक है (जैसे कि व्यक्ति पुरुष/महिला है, कुछ चिकित्सा उपचार दिया गया है/नहीं, आदि), तो ऐसे प्रतिगामी में माप त्रुटि टाइप I और टाइप II त्रुटियों के समान गलत वर्गीकरण के अनुरूप होगी सांख्यिकीय परीक्षण में। इस स्थिति में त्रुटि मात्र 3 संभावित मान ले सकते हैं, और इसका वितरण सशर्त है दो मापदंडों के साथ मॉडलिंग की जाती है: , और । पहचान के लिए आवश्यक शर्त यह है कि यानी गलत वर्गीकरण बार-बार नहीं होना चाहिए। (इस विचार को दो से अधिक संभावित मानों वाले असतत चरों के लिए सामान्यीकृत किया जा सकता है।)

रैखिक मॉडल

रैखिक त्रुटियों-में-चर मॉडल का पहले अध्ययन किया गया था, शायद इसलिए कि रैखिक मॉडल इतने व्यापक रूप से उपयोग किए गए थे और वे गैर-रैखिक वाले की तुलना में आसान हैं। मानक साधारण न्यूनतम वर्ग प्रतिगमन (OLS) के विपरीत, चर प्रतिगमन (EiV) में त्रुटियों को सरल से बहुभिन्नरूपी स्थिति में विस्तारित करना सीधा नहीं है।

सरल रैखिक मॉडल

प्रेरणा अनुभाग में सरल रैखिक त्रुटियों-में-चर मॉडल पहले से ही प्रस्तुत किया गया था:

जहाँ सभी चर अदिश (गणित) हैं। यहाँ α और β ब्याज के पैरामीटर हैं, जबकि σεऔर पीη-त्रुटि शर्तों के मानक विचलन-उपद्रव पैरामीटर हैं। वास्तविक प्रतिगामी x* को एक यादृच्छिक चर (संरचनात्मक मॉडल) के रूप में माना जाता है, माप त्रुटि η (क्लासिक धारणा) से स्वतंत्र।

यह मॉडल दो मामलों में पहचाना जा सकता है: (1) या तो अव्यक्त प्रतिगामी x* सामान्य वितरण नहीं है, (2) या x* का सामान्य वितरण है, परन्तु न तो εtन ही एचtएक सामान्य वितरण से विभाज्य हैं।[10] यही है, पैरामीटर α, β डेटा समूह से निरंतर अनुमान लगाया जा सकता है बिना किसी अतिरिक्त जानकारी के, बशर्ते अव्यक्त प्रतिगामी गाऊसी नहीं है।

इस पहचान योग्य परिणाम के स्थापित होने से पहले, सांख्यिकीविदों ने यह मानकर अधिकतम संभावना तकनीक लागू करने का प्रयास किया कि सभी चर सामान्य हैं, और फिर निष्कर्ष निकाला कि मॉडल की पहचान नहीं की गई है। सुझाया गया उपाय यह मानना ​​था कि मॉडल के कुछ पैरामीटर ज्ञात हैं या बाहरी स्रोत से अनुमान लगाया जा सकता है। इस तरह के आकलन के तरीकों में शामिल हैं[11]

  • डेमिंग प्रतिगमन - मानता है कि अनुपात δ = σ²<उप शैली= स्थिति:सापेक्ष;बाएं:-.4em >ε/σ²<उप शैली= स्थिति:सापेक्ष;बाएं:-.4em >η जाना जाता है। यह उदाहरण के लिए उपयुक्त हो सकता है जब y और x दोनों में त्रुटियाँ माप के कारण होती हैं, और माप उपकरणों या प्रक्रियाओं की सटीकता ज्ञात होती है। मामला जब δ = 1 को ऑर्थोगोनल प्रतिगमन के रूप में भी जाना जाता है।
  • ज्ञात विश्वसनीयता (सांख्यिकी) के साथ प्रतिगमन λ = σ²<उप शैली= स्थिति:सापेक्ष;बाएं:-.6em >∗</उप>/ ( σ²<उप शैली= स्थिति:सापेक्ष;बाएं:-.4em >η</ उप> + σ²<उप शैली= स्थिति: सापेक्ष;बाएं:-.6em >∗</उप>), जहां σ²<उप शैली= स्थिति: सापेक्ष;बाएं:-.6em >∗</उप> का प्रसरण है अव्यक्त प्रतिगामी। इस तरह के दृष्टिकोण उदाहरण के लिए लागू हो सकते हैं जब एक ही इकाई के दोहराए गए माप उपलब्ध हों, या जब स्वतंत्र अध्ययन से विश्वसनीयता अनुपात ज्ञात हो। इस स्थिति में ढलान का सुसंगत अनुमान λ द्वारा विभाजित न्यूनतम वर्ग अनुमान के बराबर है।
  • ज्ञात σ²<उप शैली= स्थिति:सापेक्ष;बाएं:-.4em >η</उप> के साथ प्रतिगमन तब हो सकता है जब x में त्रुटियों का स्रोत ज्ञात हो और उनके प्रसरण की गणना की जा सके। इसमें राउंडिंग एरर, या मापने वाले उपकरण द्वारा पेश की गई त्रुटियां शामिल हो सकती हैं। जब σ²<उप शैली= स्थिति:सापेक्ष;बाएं:-.4em >η</उप> ज्ञात हो जाता है तो हम विश्वसनीयता अनुपात की गणना λ = ( σ²<उप शैली= स्थिति: सापेक्ष;बाएं:-.4em >x<) के रूप में कर सकते हैं /उप> − σ²<उप शैली= स्थिति:सापेक्ष;बाएं:-.4em >η</उप>) / σ²<उप शैली= स्थिति: सापेक्ष;बाएं:-.4em>x</उप> और समस्या को कम करें पिछले मामले के लिए।

नए आकलन के तरीके जो मॉडल के कुछ मापदंडों के ज्ञान को नहीं मानते हैं, उनमें शामिल हैं

  • Method of moments — the GMM estimator based on the third- (or higher-) order joint cumulants of observable variables. The slope coefficient can be estimated from [12]

    where (n1,n2) are such that K(n1+1,n2) — the joint cumulant of (x,y) — is not zero. In the case when the third central moment of the latent regressor x* is non-zero, the formula reduces to

  • Instrumental variables — a regression which requires that certain additional data variables z, called instruments, were available. These variables should be uncorrelated with the errors in the equation for the dependent (outcome) variable (valid), and they should also be correlated (relevant) with the true regressors x*. If such variables can be found then the estimator takes form

बहुभिन्नरूपी रैखिक मॉडल

बहुभिन्नरूपी मॉडल बिल्कुल साधारण रैखिक मॉडल जैसा दिखता है, मात्र इस बार β, ηt, एक्सt और x*t k×1 सदिश हैं।

स्थिति में जब (εt, दt) संयुक्त रूप से सामान्य है, पैरामीटर β की पहचान नहीं की जाती है यदि और मात्र यदि कोई गैर-एकवचन k×k ब्लॉक आव्यूह [a A] है, जहां a k×1 वेक्टर है जैसे कि a′x* सामान्य रूप से और स्वतंत्र रूप से वितरित किया जाता है एक्स *। स्थिति में जब εt, दt1,..., दtk पारस्परिक रूप से स्वतंत्र हैं, पैरामीटर β की पहचान नहीं की जाती है यदि और मात्र यदि उपरोक्त शर्तों के अतिरिक्त कुछ त्रुटियां दो स्वतंत्र चर के योग के रूप में लिखी जा सकती हैं जिनमें से एक सामान्य है।[13] बहुभिन्नरूपी रेखीय मॉडल के लिए कुछ आकलन विधियाँ हैं

  • Total least squares is an extension of Deming regression to the multivariable setting. When all the k+1 components of the vector (ε,η) have equal variances and are independent, this is equivalent to running the orthogonal regression of y on the vector x — that is, the regression which minimizes the sum of squared distances between points (yt,xt) and the k-dimensional hyperplane of "best fit".
  • The method of moments estimator [14] can be constructed based on the moment conditions E[zt·(ytαβ'xt)] = 0, where the (5k+3)-dimensional vector of instruments zt is defined as

    where designates the Hadamard product of matrices, and variables xt, yt have been preliminarily de-meaned. The authors of the method suggest to use Fuller's modified IV estimator.[15]

    This method can be extended to use moments higher than the third order, if necessary, and to accommodate variables measured without error.[16]
  • The instrumental variables approach requires us to find additional data variables zt that serve as instruments for the mismeasured regressors xt. This method is the simplest from the implementation point of view, however its disadvantage is that it requires collecting additional data, which may be costly or even impossible. When the instruments can be found, the estimator takes standard form

गैर रेखीय मॉडल

एक सामान्य गैर-रैखिक माप त्रुटि मॉडल बनता है

यहाँ फलन g पैरामीट्रिक या गैर-पैरामीट्रिक हो सकता है। जब फ़ंक्शन जी पैरामीट्रिक होता है तो इसे जी (एक्स *, β) के रूप में लिखा जाएगा।

एक सामान्य वेक्टर-मानवान प्रतिगामी x* के लिए मॉडल की पहचान के लिए शर्तें ज्ञात नहीं हैं। यद्यपि स्केलर x* की स्थिति में मॉडल की पहचान तब तक की जाती है जब तक कि फ़ंक्शन g लॉग-एक्सपोनेंशियल फॉर्म का न हो [17]

और अव्यक्त प्रतिगामी x* का घनत्व है

जहां स्थिरांक A,B,C,D,E,F a,b,c,d पर निर्भर हो सकते हैं।

इस आशावादी परिणाम के बावजूद, अब तक बिना किसी बाहरी जानकारी के गैर-रैखिक त्रुटियों-में-चर मॉडल का अनुमान लगाने के लिए कोई तरीका स्थित नहीं है। यद्यपि ऐसी कई तकनीकें हैं जो कुछ अतिरिक्त डेटा का उपयोग करती हैं: या तो उपकरण चर, या बार-बार अवलोकन।

वाद्य चर विधियाँ

  • Newey's simulated moments method[18] for parametric models — requires that there is an additional set of observed predictor variables zt, such that the true regressor can be expressed as

    where π0 and σ0 are (unknown) constant matrices, and ζtzt. The coefficient π0 can be estimated using standard least squares regression of x on z. The distribution of ζt is unknown, however we can model it as belonging to a flexible parametric family — the Edgeworth series:

    where ϕ is the standard normal distribution.

    Simulated moments can be computed using the importance sampling algorithm: first we generate several random variables {vts ~ ϕ, s = 1,…,S, t = 1,…,T} from the standard normal distribution, then we compute the moments at t-th observation as

    where θ = (β, σ, γ), A is just some function of the instrumental variables z, and H is a two-component vector of moments

    With moment functions mt one can apply standard GMM technique to estimate the unknown parameter θ.

दोहराए गए अवलोकन

इस दृष्टिकोण में प्रतिगामी x* के दो (या शायद अधिक) बार-बार अवलोकन उपलब्ध हैं। दोनों अवलोकनों में अपनी माप त्रुटियां होती हैं, यद्यपि उन त्रुटियों को स्वतंत्र होने की आवश्यकता होती है:

जहाँ x* ⊥ η1 ⊥ एच2। चर एच1, द2 समान रूप से वितरित करने की आवश्यकता नहीं है (यद्यपि यदि वे अनुमानक की दक्षता में थोड़ा सुधार कर सकते हैं)। मात्र इन दो प्रेक्षणों के साथ कोटलार्स्की की विसंक्रमण तकनीक का प्रयोग करके x* के घनत्व फलन का निरंतर अनुमान लगाना संभव है।[19]