हेटेरोस्केडेस्टीसिटी -संगत मानक त्रुटियाँ: Difference between revisions

From Vigyanwiki
No edit summary
Line 1: Line 1:
{{Short description|Asymptotic variances under heteroskedasticity}}
{{Short description|Asymptotic variances under heteroskedasticity}}
[[रेखीय प्रतिगमन]] और [[समय श्रृंखला विश्लेषण]] के संदर्भ में सांख्यिकी और [[अर्थमिति]] में विषमलैंगिकता-संगत (एचसी) मानक त्रुटियों का विषय उत्पन्न होता है। इन्हें विषमलैंगिकता-शक्तिशाली मानक त्रुटियां (या केवल शक्तिशाली मानक त्रुटियां), ईकर-ह्यूबर-श्वेत मानक त्रुटियां (ह्यूबर-श्वेत मानक त्रुटियां या श्वेत मानक त्रुटियां भी) के रूप में जाना जाता है।<ref>{{cite web|last1=Kleiber |first1=C. |last2=Zeileis |first2=A. |year=2006 |url=http://www.r-project.org/useR-2006/Slides/Kleiber+Zeileis.pdf |title=आर के साथ एप्लाइड अर्थमिति|work=UseR-2006 conference |archive-url=https://web.archive.org/web/20070422030316/http://www.r-project.org/useR-2006/Slides/Kleiber%2BZeileis.pdf |archive-date=April 22, 2007 |url-status=dead }}</ref> [[फ्रीडेलम इकर]] के योगदान को पहचानने के लिए,<ref>{{Cite book |last=Eicker |first=Friedhelm |chapter=Limit Theorems for Regression with Unequal and Dependent Errors |title=गणितीय सांख्यिकी और संभाव्यता पर पांचवें बर्कले संगोष्ठी की कार्यवाही|year=1967 |volume=5 |issue=1 |pages=59–82 |chapter-url=http://projecteuclid.org/euclid.bsmsp/1200512981 |mr=0214223 |zbl=0217.51201 }}</ref> पीटर जे ह्यूबर,<ref>{{Cite book | last=Huber| first=Peter J.| chapter=The behavior of maximum likelihood estimates under nonstandard conditions| title=गणितीय सांख्यिकी और संभाव्यता पर पांचवें बर्कले संगोष्ठी की कार्यवाही| year=1967| volume=5| issue=1| pages=221–233| chapter-url=http://projecteuclid.org/euclid.bsmsp/1200512988|  mr = 0216620| zbl=0212.21504}}</ref> और [[हलबर्ट व्हाइट]] थे।<ref>{{Cite journal |last=White |first=Halbert |title=एक विषमलैंगिकता-संगत सहप्रसरण मैट्रिक्स अनुमानक और विषमलैंगिकता के लिए एक प्रत्यक्ष परीक्षण|journal=[[Econometrica]] |volume=48 |pages=817–838 |year=1980 |doi=10.2307/1912934 |issue=4 |mr=575027 |jstor=1912934 |citeseerx=10.1.1.11.7646 }}</ref>
[[रेखीय प्रतिगमन]] और [[समय श्रृंखला विश्लेषण]] के संदर्भ में सांख्यिकी और [[अर्थमिति]] में हेटेरोस्केडेस्टीसिटी -संगत (एचसी) मानक त्रुटियों का विषय उत्पन्न होता है। इन्हें हेटेरोस्केडेस्टीसिटी -शक्तिशाली मानक त्रुटियां (या केवल शक्तिशाली मानक त्रुटियां), ईकर-ह्यूबर-श्वेत मानक त्रुटियां (ह्यूबर-श्वेत मानक त्रुटियां या श्वेत मानक त्रुटियां भी) के रूप में जाना जाता है।<ref>{{cite web|last1=Kleiber |first1=C. |last2=Zeileis |first2=A. |year=2006 |url=http://www.r-project.org/useR-2006/Slides/Kleiber+Zeileis.pdf |title=आर के साथ एप्लाइड अर्थमिति|work=UseR-2006 conference |archive-url=https://web.archive.org/web/20070422030316/http://www.r-project.org/useR-2006/Slides/Kleiber%2BZeileis.pdf |archive-date=April 22, 2007 |url-status=dead }}</ref> [[फ्रीडेलम इकर]] के योगदान को पहचानने के लिए,<ref>{{Cite book |last=Eicker |first=Friedhelm |chapter=Limit Theorems for Regression with Unequal and Dependent Errors |title=गणितीय सांख्यिकी और संभाव्यता पर पांचवें बर्कले संगोष्ठी की कार्यवाही|year=1967 |volume=5 |issue=1 |pages=59–82 |chapter-url=http://projecteuclid.org/euclid.bsmsp/1200512981 |mr=0214223 |zbl=0217.51201 }}</ref> पीटर जे ह्यूबर,<ref>{{Cite book | last=Huber| first=Peter J.| chapter=The behavior of maximum likelihood estimates under nonstandard conditions| title=गणितीय सांख्यिकी और संभाव्यता पर पांचवें बर्कले संगोष्ठी की कार्यवाही| year=1967| volume=5| issue=1| pages=221–233| chapter-url=http://projecteuclid.org/euclid.bsmsp/1200512988|  mr = 0216620| zbl=0212.21504}}</ref> और [[हलबर्ट व्हाइट]] थे।<ref>{{Cite journal |last=White |first=Halbert |title=एक विषमलैंगिकता-संगत सहप्रसरण मैट्रिक्स अनुमानक और विषमलैंगिकता के लिए एक प्रत्यक्ष परीक्षण|journal=[[Econometrica]] |volume=48 |pages=817–838 |year=1980 |doi=10.2307/1912934 |issue=4 |mr=575027 |jstor=1912934 |citeseerx=10.1.1.11.7646 }}</ref>


प्रतिगमन और समय-श्रृंखला मॉडलिंग में, मॉडल के मूल रूप इस धारणा का उपयोग करते हैं कि सभी अवलोकन बिंदुओं में त्रुटियां या अस्तव्यस्तता u<sub>''i''</sub> समान भिन्नता है। जब ऐसा नहीं होता है, तो त्रुटियों को विषमलैंगिक कहा जाता है, या [[विषमलैंगिकता]] होती है, और यह व्यवहार अवशिष्टों में परिलक्षित होगा <math dispaly="inline">\widehat{u}_i </math> एक फिटेड मॉडल से अनुमान लगाया गया है। विषमलैंगिकता-संगत मानक त्रुटियों का उपयोग उस मॉडल की फिटिंग की अनुमति देने के लिए किया जाता है। जिसमें विषमलैंगिक अवशेष होते हैं। इस तरह का पहला दृष्टिकोण ह्यूबर (1967) द्वारा प्रस्तावित किया गया था, और क्रॉस-सेक्शनल डेटा, [[ समय श्रृंखला |समय श्रृंखला]] डेटा और [[GARCH|गर्च]] के बाद से और उत्तम प्रक्रियाओं का उत्पादन किया गया है।
प्रतिगमन और समय-श्रृंखला मॉडलिंग में, मॉडल के मूल रूप इस धारणा का उपयोग करते हैं कि सभी अवलोकन बिंदुओं में त्रुटियां या अस्तव्यस्तता u<sub>''i''</sub> समान भिन्नता है। जब ऐसा नहीं होता है, तो त्रुटियों को विषमलैंगिक कहा जाता है, या [[विषमलैंगिकता|हेटेरोस्केडेस्टीसिटी]] होती है, और यह व्यवहार अवशिष्टों में परिलक्षित होगा <math dispaly="inline">\widehat{u}_i </math> एक फिटेड मॉडल से अनुमान लगाया गया है। हेटेरोस्केडेस्टीसिटी -संगत मानक त्रुटियों का उपयोग उस मॉडल की फिटिंग की अनुमति देने के लिए किया जाता है। जिसमें विषमलैंगिक अवशेष होते हैं। इस तरह का पहला दृष्टिकोण ह्यूबर (1967) द्वारा प्रस्तावित किया गया था, और क्रॉस-सेक्शनल डेटा, [[ समय श्रृंखला |समय श्रृंखला]] डेटा और [[GARCH|गर्च]] के बाद से और उत्तम प्रक्रियाओं का उत्पादन किया गया है।


विषमलैंगिकता-संगत मानक त्रुटियाँ जो मौलिक मानक त्रुटियों से भिन्न होती हैं | मॉडल के गलत विवरण का संकेत दे सकती हैं। विषमलैंगिकता-संगत मानक त्रुटियों को प्रतिस्थापित करने से यह गलत विशिष्टता हल नहीं होती है। जिससे गुणांक में पूर्वाग्रह हो सकता है। अधिकतर स्थितियों में, समस्या को खोजना और सही करना चाहिए।<ref name=":0">{{Cite journal|last1=King|first1=Gary|last2=Roberts|first2=Margaret E.|date=2015|title=मजबूत मानक त्रुटियाँ पद्धति संबंधी समस्याओं को कैसे प्रकट करती हैं जिन्हें वे ठीक नहीं कर सकते हैं, और इसके बारे में क्या करना है|url=https://www.cambridge.org/core/product/identifier/S1047198700011670/type/journal_article|journal=Political Analysis|language=en|volume=23|issue=2|pages=159–179|doi=10.1093/pan/mpu015|issn=1047-1987}}</ref> अन्य प्रकार के मानक त्रुटि समायोजन, जैसे संकुलित मानक त्रुटियाँ या नेवी-वेस्ट एस्टिमेटर, को एचसी मानक त्रुटियों के विस्तार के रूप में माना जा सकता है।
हेटेरोस्केडेस्टीसिटी -संगत मानक त्रुटियाँ जो मौलिक मानक त्रुटियों से भिन्न होती हैं | मॉडल के गलत विवरण का संकेत दे सकती हैं। हेटेरोस्केडेस्टीसिटी -संगत मानक त्रुटियों को प्रतिस्थापित करने से यह गलत विशिष्टता हल नहीं होती है। जिससे गुणांक में पूर्वाग्रह हो सकता है। अधिकतर स्थितियों में, समस्या को खोजना और सही करना चाहिए।<ref name=":0">{{Cite journal|last1=King|first1=Gary|last2=Roberts|first2=Margaret E.|date=2015|title=मजबूत मानक त्रुटियाँ पद्धति संबंधी समस्याओं को कैसे प्रकट करती हैं जिन्हें वे ठीक नहीं कर सकते हैं, और इसके बारे में क्या करना है|url=https://www.cambridge.org/core/product/identifier/S1047198700011670/type/journal_article|journal=Political Analysis|language=en|volume=23|issue=2|pages=159–179|doi=10.1093/pan/mpu015|issn=1047-1987}}</ref> अन्य प्रकार के मानक त्रुटि समायोजन, जैसे संकुलित मानक त्रुटियाँ या नेवी-वेस्ट एस्टिमेटर, को एचसी मानक त्रुटियों के विस्तार के रूप में माना जा सकता है।
== इतिहास ==
== इतिहास ==
फ्रिडेलम इकर द्वारा हेटेरोस्केडैस्टिकिटी-सुसंगत मानक त्रुटियां प्रस्तुत की जाती हैं,<ref>{{Cite journal|title=रैखिक प्रतिगमन के परिवारों के लिए स्पर्शोन्मुख सामान्यता और कम से कम वर्गों की संगति|year=1963|doi=10.1214/aoms/1177704156|url=https://projecteuclid.org/euclid.aoms/1177704156|last1=Eicker|first1=F.|journal=The Annals of Mathematical Statistics|volume=34|issue=2|pages=447–456|doi-access=free}}</ref><ref>{{Cite journal|title=असमान और निर्भर त्रुटियों के साथ प्रतिगमन के लिए सीमा प्रमेय|journal=Proceedings of the Fifth Berkeley Symposium on Mathematical Statistics and Probability, Volume 1: Statistics|date=January 1967|volume=5|issue=1|pages=59–83|url=https://projecteuclid.org/euclid.bsmsp/1200512981|last1=Eicker|first1=Friedhelm}}</ref> और हैल्बर्ट व्हाइट द्वारा अर्थमिति में लोकप्रिय किया गया था।
फ्रिडेलम इकर द्वारा हेटेरोस्केडेस्टीसिटी -सुसंगत मानक त्रुटियां प्रस्तुत की जाती हैं,<ref>{{Cite journal|title=रैखिक प्रतिगमन के परिवारों के लिए स्पर्शोन्मुख सामान्यता और कम से कम वर्गों की संगति|year=1963|doi=10.1214/aoms/1177704156|url=https://projecteuclid.org/euclid.aoms/1177704156|last1=Eicker|first1=F.|journal=The Annals of Mathematical Statistics|volume=34|issue=2|pages=447–456|doi-access=free}}</ref><ref>{{Cite journal|title=असमान और निर्भर त्रुटियों के साथ प्रतिगमन के लिए सीमा प्रमेय|journal=Proceedings of the Fifth Berkeley Symposium on Mathematical Statistics and Probability, Volume 1: Statistics|date=January 1967|volume=5|issue=1|pages=59–83|url=https://projecteuclid.org/euclid.bsmsp/1200512981|last1=Eicker|first1=Friedhelm}}</ref> और हैल्बर्ट व्हाइट द्वारा अर्थमिति में लोकप्रिय किया गया था।


== समस्या ==
== समस्या ==
Line 31: Line 31:
जहां <math> \mathbf{\Sigma} = \mathbb{V}[\mathbf{u}].</math> जबकि ओएलएस बिंदु अनुमानक निष्पक्ष रहता है, यह न्यूनतम औसत वर्ग त्रुटि और ओएलएस भिन्नता अनुमानक होने के अर्थ में "सर्वश्रेष्ठ" नहीं है। <math>\hat{\mathbb{V}} \left[ \widehat \boldsymbol{\beta}_\mathrm{OLS} \right]</math> ओएलएस अनुमानों के विचरण का एक सुसंगत अनुमान प्रदान नहीं करता है।
जहां <math> \mathbf{\Sigma} = \mathbb{V}[\mathbf{u}].</math> जबकि ओएलएस बिंदु अनुमानक निष्पक्ष रहता है, यह न्यूनतम औसत वर्ग त्रुटि और ओएलएस भिन्नता अनुमानक होने के अर्थ में "सर्वश्रेष्ठ" नहीं है। <math>\hat{\mathbb{V}} \left[ \widehat \boldsymbol{\beta}_\mathrm{OLS} \right]</math> ओएलएस अनुमानों के विचरण का एक सुसंगत अनुमान प्रदान नहीं करता है।


किसी भी गैर-रैखिक मॉडल (उदाहरण के लिए [[ logit |लॉगिट]] और [[ probit |प्रोबिट]] मॉडल) के लिए, चूँकि विषमलैंगिकता के अधिक गंभीर परिणाम होते हैं | मापदंडों का [[अधिकतम संभावना अनुमान]] पक्षपाती (अज्ञात दिशा में) होगा, साथ ही असंगत (जब तक कि संभावना कार्य संशोधित न हो) विषमलैंगिकता के स्पष्ट रूप को सही विधि से ध्यान में रखना) <ref>{{cite web |first=Dave |last=Giles |title=अरैखिक मॉडल के लिए मजबूत मानक त्रुटियां|work=Econometrics Beat |date=May 8, 2013 |url=http://davegiles.blogspot.com/2013/05/robust-standard-errors-for-nonlinear.html }}</ref> <ref>{{cite journal |first=Michael |last=Guggisberg |title=गलत निर्दिष्ट असतत विकल्प मॉडल और ह्यूबर-व्हाइट मानक त्रुटियाँ|journal=[[Journal of Econometric Methods]] |year=2019 |volume=8 |issue=1 |doi=10.1515/jem-2016-0002 }}</ref> जैसा कि [[विलियम ग्रीन (अर्थशास्त्री)]] द्वारा इंगित किया गया है "अन्यथा असंगत अनुमानक के लिए केवल एक शक्तिशाली सहप्रसरण मैट्रिक्स की गणना करना इसे मोचन नहीं देता है।" <ref>{{cite book |last=Greene |first=William H. |author-link=William Greene (economist) |title=अर्थमितीय विश्लेषण|edition=Seventh |location=Boston |publisher=Pearson Education |year=2012 |isbn=978-0-273-75356-8 |pages=692–693 }}</ref>
किसी भी गैर-रैखिक मॉडल (उदाहरण के लिए [[ logit |लॉगिट]] और [[ probit |प्रोबिट]] मॉडल) के लिए, चूँकि हेटेरोस्केडेस्टीसिटी  के अधिक गंभीर परिणाम होते हैं | मापदंडों का [[अधिकतम संभावना अनुमान]] पक्षपाती (अज्ञात दिशा में) होगा, साथ ही असंगत (जब तक कि संभावना कार्य संशोधित न हो) हेटेरोस्केडेस्टीसिटी  के स्पष्ट रूप को सही विधि से ध्यान में रखना) <ref>{{cite web |first=Dave |last=Giles |title=अरैखिक मॉडल के लिए मजबूत मानक त्रुटियां|work=Econometrics Beat |date=May 8, 2013 |url=http://davegiles.blogspot.com/2013/05/robust-standard-errors-for-nonlinear.html }}</ref> <ref>{{cite journal |first=Michael |last=Guggisberg |title=गलत निर्दिष्ट असतत विकल्प मॉडल और ह्यूबर-व्हाइट मानक त्रुटियाँ|journal=[[Journal of Econometric Methods]] |year=2019 |volume=8 |issue=1 |doi=10.1515/jem-2016-0002 }}</ref> जैसा कि [[विलियम ग्रीन (अर्थशास्त्री)]] द्वारा इंगित किया गया है "अन्यथा असंगत अनुमानक के लिए केवल एक शक्तिशाली सहप्रसरण मैट्रिक्स की गणना करना इसे मोचन नहीं देता है।" <ref>{{cite book |last=Greene |first=William H. |author-link=William Greene (economist) |title=अर्थमितीय विश्लेषण|edition=Seventh |location=Boston |publisher=Pearson Education |year=2012 |isbn=978-0-273-75356-8 |pages=692–693 }}</ref>
== समाधान ==
== समाधान ==


यदि प्रतिगमन त्रुटियां <math>\varepsilon_i</math> स्वतंत्र हैं, किन्तु उनके अलग-अलग <math>\sigma^2_i</math> संस्करण हैं | तब <math>\mathbf{\Sigma} = \operatorname{diag}(\sigma_1^2, \ldots, \sigma_n^2)</math> जिसका अनुमान <math>\widehat\sigma_i^2 = \widehat \varepsilon_i^2</math> लगाया जा सकता है। यह व्हाइट का (1980) अनुमानक प्रदान करता है, जिसे अधिकांशतः एचसीई (विषमलैंगिकता-सुसंगत अनुमानक) के रूप में संदर्भित किया जाता है।
यदि प्रतिगमन त्रुटियां <math>\varepsilon_i</math> स्वतंत्र हैं, किन्तु उनके अलग-अलग <math>\sigma^2_i</math> संस्करण हैं | तब <math>\mathbf{\Sigma} = \operatorname{diag}(\sigma_1^2, \ldots, \sigma_n^2)</math> जिसका अनुमान <math>\widehat\sigma_i^2 = \widehat \varepsilon_i^2</math> लगाया जा सकता है। यह व्हाइट का (1980) अनुमानक प्रदान करता है, जिसे अधिकांशतः एचसीई (हेटेरोस्केडेस्टीसिटी -सुसंगत अनुमानक) के रूप में संदर्भित किया जाता है।


: <math>
: <math>
Line 78: Line 78:
व्यापक रूप से उपलब्ध चार अलग-अलग विकल्पों में से, जिन्हें अधिकांशतः HC0-HC3 के रूप में दर्शाया जाता है। HC3 विनिर्देश सबसे अच्छा काम करता प्रतीत होता है। अनुमानक HC3 पर निर्भर परीक्षणों में उत्तम शक्ति और लक्षित सांख्यिकीय परिकल्पना परीक्षण शब्दों की परिभाषा, विशेष रूप से छोटे में प्रतिरूप जितना बड़ा होगा, विभिन्न आकलनकर्ताओं के बीच का अंतर उतना ही कम होता है।<ref>{{Cite journal |last=Long |first=J. Scott |last2=Ervin |first2=Laurie H. |date=2000 |title=रैखिक प्रतिगमन मॉडल में हेटेरोसेडेसिटी संगत मानक त्रुटियों का उपयोग करना|url=https://www.jstor.org/stable/2685594 |journal=The American Statistician |volume=54 |issue=3 |pages=217–224 |doi=10.2307/2685594 |issn=0003-1305}}</ref>
व्यापक रूप से उपलब्ध चार अलग-अलग विकल्पों में से, जिन्हें अधिकांशतः HC0-HC3 के रूप में दर्शाया जाता है। HC3 विनिर्देश सबसे अच्छा काम करता प्रतीत होता है। अनुमानक HC3 पर निर्भर परीक्षणों में उत्तम शक्ति और लक्षित सांख्यिकीय परिकल्पना परीक्षण शब्दों की परिभाषा, विशेष रूप से छोटे में प्रतिरूप जितना बड़ा होगा, विभिन्न आकलनकर्ताओं के बीच का अंतर उतना ही कम होता है।<ref>{{Cite journal |last=Long |first=J. Scott |last2=Ervin |first2=Laurie H. |date=2000 |title=रैखिक प्रतिगमन मॉडल में हेटेरोसेडेसिटी संगत मानक त्रुटियों का उपयोग करना|url=https://www.jstor.org/stable/2685594 |journal=The American Statistician |volume=54 |issue=3 |pages=217–224 |doi=10.2307/2685594 |issn=0003-1305}}</ref>


विषमलैंगिकता को स्पष्ट रूप से मॉडलिंग करने का एक विकल्प रीसैंपलिंग (सांख्यिकी) जैसे बूटस्ट्रैपिंग (सांख्यिकी) वाइल्ड बूटस्ट्रैप का उपयोग कर रहा है। यह देखते हुए कि बूटस्ट्रैप विश्वास अंतराल के लिए बूटस्ट्रैपिंग (सांख्यिकी) विधियाँ, जो अपनी मानक त्रुटि द्वारा पुनर्नमूना आँकड़ों को मानकीकृत करती है, एक स्पर्शोन्मुख शोधन प्राप्त करती है।<ref>{{Cite book |last=C. |first=Davison, Anthony |url=http://worldcat.org/oclc/740960962 |title=बूटस्ट्रैप विधियाँ और उनका अनुप्रयोग|date=2010 |publisher=Cambridge Univ. Press |isbn=978-0-521-57391-7 |oclc=740960962}}</ref> विषमलैंगिकता-शक्तिशाली मानक त्रुटियाँ फिर भी उपयोगी हैं।
हेटेरोस्केडेस्टीसिटी  को स्पष्ट रूप से मॉडलिंग करने का एक विकल्प रीसैंपलिंग (सांख्यिकी) जैसे बूटस्ट्रैपिंग (सांख्यिकी) वाइल्ड बूटस्ट्रैप का उपयोग कर रहा है। यह देखते हुए कि बूटस्ट्रैप विश्वास अंतराल के लिए बूटस्ट्रैपिंग (सांख्यिकी) विधियाँ, जो अपनी मानक त्रुटि द्वारा पुनर्नमूना आँकड़ों को मानकीकृत करती है, एक स्पर्शोन्मुख शोधन प्राप्त करती है।<ref>{{Cite book |last=C. |first=Davison, Anthony |url=http://worldcat.org/oclc/740960962 |title=बूटस्ट्रैप विधियाँ और उनका अनुप्रयोग|date=2010 |publisher=Cambridge Univ. Press |isbn=978-0-521-57391-7 |oclc=740960962}}</ref> हेटेरोस्केडेस्टीसिटी -शक्तिशाली मानक त्रुटियाँ फिर भी उपयोगी हैं।


हेटेरोस्केडैस्टिक त्रुटियों के लिए लेखांकन के अतिरिक्त, अधिकांश रेखीय मॉडल को होमोस्केडैस्टिक त्रुटि नियमो में परिवर्तित किया जा सकता है (जब तक कि निर्माण द्वारा त्रुटि शब्द हेटेरोस्केडैस्टिक न हो, उदाहरण के लिए एक रैखिक संभावना मॉडल में)। ऐसा करने का एक विधि भारित कम से कम वर्गों का उपयोग करना है, जिसमें उत्तम दक्षता गुण भी सम्मिलित हैं।
हेटेरोस्केडैस्टिक त्रुटियों के लिए लेखांकन के अतिरिक्त, अधिकांश रेखीय मॉडल को होमोस्केडैस्टिक त्रुटि नियमो में परिवर्तित किया जा सकता है (जब तक कि निर्माण द्वारा त्रुटि शब्द हेटेरोस्केडैस्टिक न हो, उदाहरण के लिए एक रैखिक संभावना मॉडल में)। ऐसा करने का एक विधि भारित कम से कम वर्गों का उपयोग करना है, जिसमें उत्तम दक्षता गुण भी सम्मिलित हैं।

Revision as of 17:16, 12 June 2023

रेखीय प्रतिगमन और समय श्रृंखला विश्लेषण के संदर्भ में सांख्यिकी और अर्थमिति में हेटेरोस्केडेस्टीसिटी -संगत (एचसी) मानक त्रुटियों का विषय उत्पन्न होता है। इन्हें हेटेरोस्केडेस्टीसिटी -शक्तिशाली मानक त्रुटियां (या केवल शक्तिशाली मानक त्रुटियां), ईकर-ह्यूबर-श्वेत मानक त्रुटियां (ह्यूबर-श्वेत मानक त्रुटियां या श्वेत मानक त्रुटियां भी) के रूप में जाना जाता है।[1] फ्रीडेलम इकर के योगदान को पहचानने के लिए,[2] पीटर जे ह्यूबर,[3] और हलबर्ट व्हाइट थे।[4]

प्रतिगमन और समय-श्रृंखला मॉडलिंग में, मॉडल के मूल रूप इस धारणा का उपयोग करते हैं कि सभी अवलोकन बिंदुओं में त्रुटियां या अस्तव्यस्तता ui समान भिन्नता है। जब ऐसा नहीं होता है, तो त्रुटियों को विषमलैंगिक कहा जाता है, या हेटेरोस्केडेस्टीसिटी होती है, और यह व्यवहार अवशिष्टों में परिलक्षित होगा एक फिटेड मॉडल से अनुमान लगाया गया है। हेटेरोस्केडेस्टीसिटी -संगत मानक त्रुटियों का उपयोग उस मॉडल की फिटिंग की अनुमति देने के लिए किया जाता है। जिसमें विषमलैंगिक अवशेष होते हैं। इस तरह का पहला दृष्टिकोण ह्यूबर (1967) द्वारा प्रस्तावित किया गया था, और क्रॉस-सेक्शनल डेटा, समय श्रृंखला डेटा और गर्च के बाद से और उत्तम प्रक्रियाओं का उत्पादन किया गया है।

हेटेरोस्केडेस्टीसिटी -संगत मानक त्रुटियाँ जो मौलिक मानक त्रुटियों से भिन्न होती हैं | मॉडल के गलत विवरण का संकेत दे सकती हैं। हेटेरोस्केडेस्टीसिटी -संगत मानक त्रुटियों को प्रतिस्थापित करने से यह गलत विशिष्टता हल नहीं होती है। जिससे गुणांक में पूर्वाग्रह हो सकता है। अधिकतर स्थितियों में, समस्या को खोजना और सही करना चाहिए।[5] अन्य प्रकार के मानक त्रुटि समायोजन, जैसे संकुलित मानक त्रुटियाँ या नेवी-वेस्ट एस्टिमेटर, को एचसी मानक त्रुटियों के विस्तार के रूप में माना जा सकता है।

इतिहास

फ्रिडेलम इकर द्वारा हेटेरोस्केडेस्टीसिटी -सुसंगत मानक त्रुटियां प्रस्तुत की जाती हैं,[6][7] और हैल्बर्ट व्हाइट द्वारा अर्थमिति में लोकप्रिय किया गया था।

समस्या

स्केलर के लिए रेखीय प्रतिगमन मॉडल पर विचार करें।

जहाँ व्याख्यात्मक चरों (विशेषताओं) का एक k x 1 स्तंभ सदिश है अनुमानित किए जाने वाले मापदंडों का एक k × 1 स्तंभ सदिश है और त्रुटियां और अवशेष है। सामान्य न्यूनतम वर्ग (ओएलएस) ) अनुमानक है।

जहाँ प्रेक्षणों का सदिश है, और डेटा में देखे गए मानों के ढेर के मैट्रिक्स को दर्शाता है।

यदि आँकड़ों में त्रुटियाँ समान भिन्नता है और असहसंबद्ध हैं तो का न्यूनतम-वर्ग अनुमान ब्लू (सर्वश्रेष्ठ रैखिक निष्पक्ष अनुमानक) है और इसके भिन्नता का अनुमान लगाया गया है।

जहाँ प्रतिगमन अवशेष हैं।

जब त्रुटि नियमो में निरंतर भिन्नता नहीं होती है (अर्थात, की धारणा असत्य है), तो ओएलएस अनुमानक अपने वांछित गुणों को खो देता है। विचरण के सूत्र को अब सरल नहीं किया जा सकता है।

जहां जबकि ओएलएस बिंदु अनुमानक निष्पक्ष रहता है, यह न्यूनतम औसत वर्ग त्रुटि और ओएलएस भिन्नता अनुमानक होने के अर्थ में "सर्वश्रेष्ठ" नहीं है। ओएलएस अनुमानों के विचरण का एक सुसंगत अनुमान प्रदान नहीं करता है।

किसी भी गैर-रैखिक मॉडल (उदाहरण के लिए लॉगिट और प्रोबिट मॉडल) के लिए, चूँकि हेटेरोस्केडेस्टीसिटी के अधिक गंभीर परिणाम होते हैं | मापदंडों का अधिकतम संभावना अनुमान पक्षपाती (अज्ञात दिशा में) होगा, साथ ही असंगत (जब तक कि संभावना कार्य संशोधित न हो) हेटेरोस्केडेस्टीसिटी के स्पष्ट रूप को सही विधि से ध्यान में रखना) [8] [9] जैसा कि विलियम ग्रीन (अर्थशास्त्री) द्वारा इंगित किया गया है "अन्यथा असंगत अनुमानक के लिए केवल एक शक्तिशाली सहप्रसरण मैट्रिक्स की गणना करना इसे मोचन नहीं देता है।" [10]

समाधान

यदि प्रतिगमन त्रुटियां स्वतंत्र हैं, किन्तु उनके अलग-अलग संस्करण हैं | तब जिसका अनुमान लगाया जा सकता है। यह व्हाइट का (1980) अनुमानक प्रदान करता है, जिसे अधिकांशतः एचसीई (हेटेरोस्केडेस्टीसिटी -सुसंगत अनुमानक) के रूप में संदर्भित किया जाता है।

जहां उपरोक्त डेटा से स्टैक्ड मानों के मैट्रिक्स को दर्शाता है। अनुमानक को क्षणों की सामान्यीकृत विधि (जीएमएम) के संदर्भ में प्राप्त किया जा सकता है।

इसके अतिरिक्त साहित्य में अधिकांशतः चर्चा की जाती है (व्हाइट के पेपर सहित) का सहप्रसरण मैट्रिक्स संगत सीमित वितरण है।

जहाँ

और

इस प्रकार,

और

स्पष्ट रूप से कौन सा सहप्रसरण मैट्रिक्स चिंता का विषय है, यह संदर्भ का विषय है।

मैकिनॉन एंड व्हाइट (1985) में वैकल्पिक अनुमानक प्रस्तावित किए गए हैं | जो विभिन्न उत्तोलन (सांख्यिकी) के कारण प्रतिगमन अवशिष्टों के असमान प्रसरणों के लिए सही हैं।[11] स्पर्शोन्मुख व्हाइट के अनुमानक के विपरीत, उनके अनुमानक निष्पक्ष होते हैं जब डेटा समरूपतावादी होते हैं।

व्यापक रूप से उपलब्ध चार अलग-अलग विकल्पों में से, जिन्हें अधिकांशतः HC0-HC3 के रूप में दर्शाया जाता है। HC3 विनिर्देश सबसे अच्छा काम करता प्रतीत होता है। अनुमानक HC3 पर निर्भर परीक्षणों में उत्तम शक्ति और लक्षित सांख्यिकीय परिकल्पना परीक्षण शब्दों की परिभाषा, विशेष रूप से छोटे में प्रतिरूप जितना बड़ा होगा, विभिन्न आकलनकर्ताओं के बीच का अंतर उतना ही कम होता है।[12]

हेटेरोस्केडेस्टीसिटी को स्पष्ट रूप से मॉडलिंग करने का एक विकल्प रीसैंपलिंग (सांख्यिकी) जैसे बूटस्ट्रैपिंग (सांख्यिकी) वाइल्ड बूटस्ट्रैप का उपयोग कर रहा है। यह देखते हुए कि बूटस्ट्रैप विश्वास अंतराल के लिए बूटस्ट्रैपिंग (सांख्यिकी) विधियाँ, जो अपनी मानक त्रुटि द्वारा पुनर्नमूना आँकड़ों को मानकीकृत करती है, एक स्पर्शोन्मुख शोधन प्राप्त करती है।[13] हेटेरोस्केडेस्टीसिटी -शक्तिशाली मानक त्रुटियाँ फिर भी उपयोगी हैं।

हेटेरोस्केडैस्टिक त्रुटियों के लिए लेखांकन के अतिरिक्त, अधिकांश रेखीय मॉडल को होमोस्केडैस्टिक त्रुटि नियमो में परिवर्तित किया जा सकता है (जब तक कि निर्माण द्वारा त्रुटि शब्द हेटेरोस्केडैस्टिक न हो, उदाहरण के लिए एक रैखिक संभावना मॉडल में)। ऐसा करने का एक विधि भारित कम से कम वर्गों का उपयोग करना है, जिसमें उत्तम दक्षता गुण भी सम्मिलित हैं।

यह भी देखें

सॉफ्टवेयर

  • ईव्यूज़: ईव्यूज़ संस्करण 8 शक्तिशाली कम से कम वर्गों के लिए तीन अलग-अलग विधियों की प्रस्तुति करता है: एम-अनुमान (ह्यूबर, 1973), एस-अनुमान (रूसीव और योहाई, 1984), और एमएम-अनुमान (योहाई 1987)।[14]
  • जूलिया (प्रोग्रामिंग भाषा): द CovarianceMatrices पैकेज हेटेरोस्केडैस्टिक शक्तिशाली वैरियंस कोवैरियंस मैट्रिसेस के लिए कई विधि प्रदान करता है।[15] * मैटलैब: देखें hac इकोनोमेट्रिक्स टूलबॉक्स में कार्य करता है।[16]
  • पायथन (प्रोग्रामिंग भाषा): स्टैट्समॉडल्स पैकेज विभिन्न शक्तिशाली मानक त्रुटि अनुमान प्रदान करता है, देखें statsmodels.regression.linear_model.RegressionResults आगे के विवरण के लिए
  • आर (प्रोग्रामिंग भाषा): द vcovHC() से आदेश sandwich पैकेट।[17][18]
  • रेट्स (सांख्यिकीय पैकेज): robusterrors विकल्प कई प्रतिगमन और अनुकूलन आदेशों में उपलब्ध है (linreg, nlls, वगैरह।)।
  • स्टाटा robust विकल्प कई छद्म-संभावना आधारित प्रक्रियाओं में प्रयुक्त होता है।[19]
  • ग्रेटल: विकल्प --robust कई अनुमान आदेशों के लिए (जैसे ols) क्रॉस-सेक्शनल डेटासेट के संदर्भ में शक्तिशाली मानक त्रुटियां उत्पन्न करता है।[20]

संदर्भ

  1. Kleiber, C.; Zeileis, A. (2006). "आर के साथ एप्लाइड अर्थमिति" (PDF). UseR-2006 conference. Archived from the original (PDF) on April 22, 2007.
  2. Eicker, Friedhelm (1967). "Limit Theorems for Regression with Unequal and Dependent Errors". गणितीय सांख्यिकी और संभाव्यता पर पांचवें बर्कले संगोष्ठी की कार्यवाही. Vol. 5. pp. 59–82. MR 0214223. Zbl 0217.51201.
  3. Huber, Peter J. (1967). "The behavior of maximum likelihood estimates under nonstandard conditions". गणितीय सांख्यिकी और संभाव्यता पर पांचवें बर्कले संगोष्ठी की कार्यवाही. Vol. 5. pp. 221–233. MR 0216620. Zbl 0212.21504.
  4. White, Halbert (1980). "एक विषमलैंगिकता-संगत सहप्रसरण मैट्रिक्स अनुमानक और विषमलैंगिकता के लिए एक प्रत्यक्ष परीक्षण". Econometrica. 48 (4): 817–838. CiteSeerX 10.1.1.11.7646. doi:10.2307/1912934. JSTOR 1912934. MR 0575027.
  5. King, Gary; Roberts, Margaret E. (2015). "मजबूत मानक त्रुटियाँ पद्धति संबंधी समस्याओं को कैसे प्रकट करती हैं जिन्हें वे ठीक नहीं कर सकते हैं, और इसके बारे में क्या करना है". Political Analysis (in English). 23 (2): 159–179. doi:10.1093/pan/mpu015. ISSN 1047-1987.
  6. Eicker, F. (1963). "रैखिक प्रतिगमन के परिवारों के लिए स्पर्शोन्मुख सामान्यता और कम से कम वर्गों की संगति". The Annals of Mathematical Statistics. 34 (2): 447–456. doi:10.1214/aoms/1177704156.
  7. Eicker, Friedhelm (January 1967). "असमान और निर्भर त्रुटियों के साथ प्रतिगमन के लिए सीमा प्रमेय". Proceedings of the Fifth Berkeley Symposium on Mathematical Statistics and Probability, Volume 1: Statistics. 5 (1): 59–83.
  8. Giles, Dave (May 8, 2013). "अरैखिक मॉडल के लिए मजबूत मानक त्रुटियां". Econometrics Beat.
  9. Guggisberg, Michael (2019). "गलत निर्दिष्ट असतत विकल्प मॉडल और ह्यूबर-व्हाइट मानक त्रुटियाँ". Journal of Econometric Methods. 8 (1). doi:10.1515/jem-2016-0002.
  10. Greene, William H. (2012). अर्थमितीय विश्लेषण (Seventh ed.). Boston: Pearson Education. pp. 692–693. ISBN 978-0-273-75356-8.
  11. MacKinnon, James G.; White, Halbert (1985). "बेहतर परिमित नमूना गुणों के साथ कुछ हेटेरोस्केडैस्टिक-कंसिस्टेंट कोवैरियंस मैट्रिक्स एस्टिमेटर्स". Journal of Econometrics. 29 (3): 305–325. doi:10.1016/0304-4076(85)90158-7. hdl:10419/189084.
  12. Long, J. Scott; Ervin, Laurie H. (2000). "रैखिक प्रतिगमन मॉडल में हेटेरोसेडेसिटी संगत मानक त्रुटियों का उपयोग करना". The American Statistician. 54 (3): 217–224. doi:10.2307/2685594. ISSN 0003-1305.
  13. C., Davison, Anthony (2010). बूटस्ट्रैप विधियाँ और उनका अनुप्रयोग. Cambridge Univ. Press. ISBN 978-0-521-57391-7. OCLC 740960962.{{cite book}}: CS1 maint: multiple names: authors list (link)
  14. "EViews 8 Robust Regression".
  15. CovarianceMatrices: Robust Covariance Matrix Estimators
  16. "विषमलैंगिकता और स्वसहसंबंध सुसंगत सहप्रसरण अनुमानक". Econometrics Toolbox.
  17. sandwich: Robust Covariance Matrix Estimators
  18. Kleiber, Christian; Zeileis, Achim (2008). आर के साथ एप्लाइड अर्थमिति. New York: Springer. pp. 106–110. ISBN 978-0-387-77316-2.
  19. See online help for _robust option and regress command.
  20. "मजबूत सहप्रसरण मैट्रिक्स अनुमान" (PDF). Gretl User's Guide, chapter 19.

अग्रिम पठन