हेटेरोस्केडेस्टीसिटी -संगत मानक त्रुटियाँ: Difference between revisions
(Created page with "{{Short description|Asymptotic variances under heteroskedasticity}} रेखीय प्रतिगमन और समय श्रृंखला विश्ले...") |
No edit summary |
||
Line 1: | Line 1: | ||
{{Short description|Asymptotic variances under heteroskedasticity}} | {{Short description|Asymptotic variances under heteroskedasticity}} | ||
[[रेखीय प्रतिगमन]] और [[समय श्रृंखला विश्लेषण]] के संदर्भ में सांख्यिकी और [[अर्थमिति]] में विषमलैंगिकता-संगत (एचसी) मानक त्रुटियों का विषय उत्पन्न होता है। इन्हें विषमलैंगिकता- | [[रेखीय प्रतिगमन]] और [[समय श्रृंखला विश्लेषण]] के संदर्भ में सांख्यिकी और [[अर्थमिति]] में विषमलैंगिकता-संगत (एचसी) मानक त्रुटियों का विषय उत्पन्न होता है। इन्हें विषमलैंगिकता-शक्तिशाली मानक त्रुटियां (या केवल शक्तिशाली मानक त्रुटियां), ईकर-ह्यूबर-श्वेत मानक त्रुटियां (ह्यूबर-श्वेत मानक त्रुटियां या श्वेत मानक त्रुटियां भी) के रूप में जाना जाता है।<ref>{{cite web|last1=Kleiber |first1=C. |last2=Zeileis |first2=A. |year=2006 |url=http://www.r-project.org/useR-2006/Slides/Kleiber+Zeileis.pdf |title=आर के साथ एप्लाइड अर्थमिति|work=UseR-2006 conference |archive-url=https://web.archive.org/web/20070422030316/http://www.r-project.org/useR-2006/Slides/Kleiber%2BZeileis.pdf |archive-date=April 22, 2007 |url-status=dead }}</ref> [[फ्रीडेलम इकर]] के योगदान को पहचानने के लिए,<ref>{{Cite book |last=Eicker |first=Friedhelm |chapter=Limit Theorems for Regression with Unequal and Dependent Errors |title=गणितीय सांख्यिकी और संभाव्यता पर पांचवें बर्कले संगोष्ठी की कार्यवाही|year=1967 |volume=5 |issue=1 |pages=59–82 |chapter-url=http://projecteuclid.org/euclid.bsmsp/1200512981 |mr=0214223 |zbl=0217.51201 }}</ref> पीटर जे ह्यूबर,<ref>{{Cite book | last=Huber| first=Peter J.| chapter=The behavior of maximum likelihood estimates under nonstandard conditions| title=गणितीय सांख्यिकी और संभाव्यता पर पांचवें बर्कले संगोष्ठी की कार्यवाही| year=1967| volume=5| issue=1| pages=221–233| chapter-url=http://projecteuclid.org/euclid.bsmsp/1200512988| mr = 0216620| zbl=0212.21504}}</ref> और [[हलबर्ट व्हाइट]] थे।<ref>{{Cite journal |last=White |first=Halbert |title=एक विषमलैंगिकता-संगत सहप्रसरण मैट्रिक्स अनुमानक और विषमलैंगिकता के लिए एक प्रत्यक्ष परीक्षण|journal=[[Econometrica]] |volume=48 |pages=817–838 |year=1980 |doi=10.2307/1912934 |issue=4 |mr=575027 |jstor=1912934 |citeseerx=10.1.1.11.7646 }}</ref> | ||
विषमलैंगिकता-संगत मानक त्रुटियाँ जो | |||
प्रतिगमन और समय-श्रृंखला मॉडलिंग में, मॉडल के मूल रूप इस धारणा का उपयोग करते हैं कि सभी अवलोकन बिंदुओं में त्रुटियां या अस्तव्यस्तता u<sub>''i''</sub> समान भिन्नता है। जब ऐसा नहीं होता है, तो त्रुटियों को विषमलैंगिक कहा जाता है, या [[विषमलैंगिकता]] होती है, और यह व्यवहार अवशिष्टों में परिलक्षित होगा <math dispaly="inline">\widehat{u}_i </math> एक फिटेड मॉडल से अनुमान लगाया गया है। विषमलैंगिकता-संगत मानक त्रुटियों का उपयोग उस मॉडल की फिटिंग की अनुमति देने के लिए किया जाता है | जिसमें विषमलैंगिक अवशेष होते हैं। इस तरह का पहला दृष्टिकोण ह्यूबर (1967) द्वारा प्रस्तावित किया गया था, और क्रॉस-सेक्शनल डेटा, [[ समय श्रृंखला |समय श्रृंखला]] डेटा और [[GARCH|गर्च]] के बाद से और उत्तम प्रक्रियाओं का उत्पादन किया गया है। | |||
विषमलैंगिकता-संगत मानक त्रुटियाँ जो मौलिक मानक त्रुटियों से भिन्न होती हैं | मॉडल के गलत विवरण का संकेत दे सकती हैं। विषमलैंगिकता-संगत मानक त्रुटियों को प्रतिस्थापित करने से यह गलत विशिष्टता हल नहीं होती है | जिससे गुणांक में पूर्वाग्रह हो सकता है। अधिकतर स्थितियों में, समस्या को खोजना और सही करना चाहिए।<ref>{{Cite journal|last1=King|first1=Gary|last2=Roberts|first2=Margaret E.|date=2015|title=मजबूत मानक त्रुटियाँ पद्धति संबंधी समस्याओं को कैसे प्रकट करती हैं जिन्हें वे ठीक नहीं कर सकते हैं, और इसके बारे में क्या करना है|url=https://www.cambridge.org/core/product/identifier/S1047198700011670/type/journal_article|journal=Political Analysis|language=en|volume=23|issue=2|pages=159–179|doi=10.1093/pan/mpu015|issn=1047-1987}}</ref> अन्य प्रकार के मानक त्रुटि समायोजन, जैसे संकुलित मानक त्रुटियाँ या नेवी-वेस्ट एस्टिमेटर, को एचसी मानक त्रुटियों के विस्तार के रूप में माना जा सकता है। | |||
== इतिहास == | == इतिहास == | ||
फ्रिडेलम इकर द्वारा हेटेरोस्केडैस्टिकिटी-सुसंगत मानक त्रुटियां | फ्रिडेलम इकर द्वारा हेटेरोस्केडैस्टिकिटी-सुसंगत मानक त्रुटियां प्रस्तुत की जाती हैं,<ref>{{Cite journal|title=रैखिक प्रतिगमन के परिवारों के लिए स्पर्शोन्मुख सामान्यता और कम से कम वर्गों की संगति|year=1963|doi=10.1214/aoms/1177704156|url=https://projecteuclid.org/euclid.aoms/1177704156|last1=Eicker|first1=F.|journal=The Annals of Mathematical Statistics|volume=34|issue=2|pages=447–456|doi-access=free}}</ref><ref>{{Cite journal|title=असमान और निर्भर त्रुटियों के साथ प्रतिगमन के लिए सीमा प्रमेय|journal=Proceedings of the Fifth Berkeley Symposium on Mathematical Statistics and Probability, Volume 1: Statistics|date=January 1967|volume=5|issue=1|pages=59–83|url=https://projecteuclid.org/euclid.bsmsp/1200512981|last1=Eicker|first1=Friedhelm}}</ref> और हैल्बर्ट व्हाइट द्वारा अर्थमिति में लोकप्रिय किया गया था। | ||
== समस्या == | == समस्या == | ||
स्केलर के लिए रेखीय प्रतिगमन मॉडल पर विचार करें | स्केलर <math>y</math> के लिए रेखीय प्रतिगमन मॉडल पर विचार करें | | ||
: <math> | : <math> | ||
y = \mathbf{x}^{\top} \boldsymbol{\beta} + \varepsilon, \, | y = \mathbf{x}^{\top} \boldsymbol{\beta} + \varepsilon, \, | ||
</math> | </math> | ||
जहाँ <math>\mathbf{x}</math> व्याख्यात्मक चरों (विशेषताओं) का एक k x 1 स्तंभ सदिश है <math>\boldsymbol{\beta}</math> अनुमानित किए जाने वाले मापदंडों का एक k × 1 स्तंभ सदिश है और <math>\varepsilon</math> [[त्रुटियां और अवशेष]] है। सामान्य न्यूनतम वर्ग (ओएलएस) ) अनुमानक है | | |||
: <math> | : <math> | ||
\widehat \boldsymbol{\beta}_\mathrm{OLS} = (\mathbf{X}^{\top} \mathbf{X})^{-1} \mathbf{X}^{\top} \mathbf{y}. \, | \widehat \boldsymbol{\beta}_\mathrm{OLS} = (\mathbf{X}^{\top} \mathbf{X})^{-1} \mathbf{X}^{\top} \mathbf{y}. \, | ||
</math> | </math> | ||
जहाँ <math>\mathbf{y}</math> प्रेक्षणों <math>y_i</math> का सदिश है, और <math>\mathbf{X}</math> डेटा में देखे गए <math>\mathbf{x}_i</math> मानों के ढेर के मैट्रिक्स को दर्शाता है। | |||
यदि आँकड़ों में त्रुटियाँ | यदि आँकड़ों में त्रुटियाँ समान भिन्नता <math>\sigma^2</math> है और असहसंबद्ध हैं तो <math>\boldsymbol{\beta}</math> का न्यूनतम-वर्ग अनुमान [[BLUE|ब्लू]] (सर्वश्रेष्ठ रैखिक निष्पक्ष अनुमानक) है और इसके भिन्नता का अनुमान लगाया गया है | | ||
: <math>\hat{\mathbb{V}}\left[\widehat\boldsymbol\beta_\mathrm{OLS}\right] = s^2 (\mathbf{X}^{\top}\mathbf{X})^{-1}, \quad s^2 = \frac{\sum_i \widehat \varepsilon_i^2}{n-k} </math> | : <math>\hat{\mathbb{V}}\left[\widehat\boldsymbol\beta_\mathrm{OLS}\right] = s^2 (\mathbf{X}^{\top}\mathbf{X})^{-1}, \quad s^2 = \frac{\sum_i \widehat \varepsilon_i^2}{n-k} </math> | ||
जहाँ <math>\widehat \varepsilon_i = y_i - \mathbf{x}_i^{\top} \widehat \boldsymbol{\beta}_\mathrm{OLS}</math> प्रतिगमन अवशेष हैं। | |||
जब त्रुटि | जब त्रुटि नियमो में निरंतर भिन्नता नहीं होती है (अर्थात,<math> \mathbb{E}[\mathbf{u}\mathbf{u}^{\top}] = \sigma^2 \mathbf{I}_n</math> की धारणा असत्य है), तो ओएलएस अनुमानक अपने वांछित गुणों को खो देता है। विचरण के सूत्र को अब सरल नहीं किया जा सकता है: | ||
: <math> \mathbb{V}\left[\widehat\boldsymbol\beta_\mathrm{OLS}\right] = \mathbb{V}\big[ (\mathbf{X}^{\top}\mathbf{X})^{-1} \mathbf{X}^{\top}\mathbf{y} \big] = (\mathbf{X}^{\top}\mathbf{X})^{-1} \mathbf{X}^{\top} \mathbf{\Sigma} \mathbf{X} (\mathbf{X}^{\top}\mathbf{X})^{-1}</math> | : <math> \mathbb{V}\left[\widehat\boldsymbol\beta_\mathrm{OLS}\right] = \mathbb{V}\big[ (\mathbf{X}^{\top}\mathbf{X})^{-1} \mathbf{X}^{\top}\mathbf{y} \big] = (\mathbf{X}^{\top}\mathbf{X})^{-1} \mathbf{X}^{\top} \mathbf{\Sigma} \mathbf{X} (\mathbf{X}^{\top}\mathbf{X})^{-1}</math> | ||
जहां <math> \mathbf{\Sigma} = \mathbb{V}[\mathbf{u}].</math> जबकि ओएलएस बिंदु अनुमानक निष्पक्ष रहता है, यह न्यूनतम औसत वर्ग त्रुटि और ओएलएस भिन्नता अनुमानक होने के अर्थ में "सर्वश्रेष्ठ" नहीं है | <math>\hat{\mathbb{V}} \left[ \widehat \boldsymbol{\beta}_\mathrm{OLS} \right]</math> ओएलएस अनुमानों के विचरण का एक सुसंगत अनुमान प्रदान नहीं करता है। | |||
जबकि | |||
किसी भी गैर-रैखिक मॉडल (उदाहरण के लिए [[ logit |लॉगिट]] और [[ probit | प्रोबिट]] मॉडल) के लिए, चूँकि विषमलैंगिकता के अधिक गंभीर परिणाम होते हैं | मापदंडों का [[अधिकतम संभावना अनुमान]] पक्षपाती (अज्ञात दिशा में) होगा, साथ ही असंगत (जब तक कि संभावना कार्य संशोधित न हो) विषमलैंगिकता के स्पष्ट रूप को सही विधि से ध्यान में रखना) <ref>{{cite web |first=Dave |last=Giles |title=अरैखिक मॉडल के लिए मजबूत मानक त्रुटियां|work=Econometrics Beat |date=May 8, 2013 |url=http://davegiles.blogspot.com/2013/05/robust-standard-errors-for-nonlinear.html }}</ref> <ref>{{cite journal |first=Michael |last=Guggisberg |title=गलत निर्दिष्ट असतत विकल्प मॉडल और ह्यूबर-व्हाइट मानक त्रुटियाँ|journal=[[Journal of Econometric Methods]] |year=2019 |volume=8 |issue=1 |doi=10.1515/jem-2016-0002 }}</ref> जैसा कि [[विलियम ग्रीन (अर्थशास्त्री)]] द्वारा इंगित किया गया है "अन्यथा असंगत अनुमानक के लिए केवल एक शक्तिशाली सहप्रसरण मैट्रिक्स की गणना करना इसे मोचन नहीं देता है।" <ref>{{cite book |last=Greene |first=William H. |author-link=William Greene (economist) |title=अर्थमितीय विश्लेषण|edition=Seventh |location=Boston |publisher=Pearson Education |year=2012 |isbn=978-0-273-75356-8 |pages=692–693 }}</ref> | |||
== समाधान == | == समाधान == | ||
यदि प्रतिगमन त्रुटियां <math>\varepsilon_i</math> स्वतंत्र हैं, | यदि प्रतिगमन त्रुटियां <math>\varepsilon_i</math> स्वतंत्र हैं, किन्तु उनके अलग-अलग <math>\sigma^2_i</math> संस्करण हैं | तब <math>\mathbf{\Sigma} = \operatorname{diag}(\sigma_1^2, \ldots, \sigma_n^2)</math> जिसका अनुमान <math>\widehat\sigma_i^2 = \widehat \varepsilon_i^2</math> लगाया जा सकता है | यह व्हाइट का (1980) अनुमानक प्रदान करता है, जिसे अधिकांशतः एचसीई (विषमलैंगिकता-सुसंगत अनुमानक) के रूप में संदर्भित किया जाता है | | ||
: <math> | : <math> | ||
Line 47: | Line 45: | ||
\end{align} | \end{align} | ||
</math> | </math> | ||
जहां | जहां उपरोक्त <math>\mathbf{X}</math> डेटा से स्टैक्ड <math>\mathbf{x}_i^{\top}</math> मानों के मैट्रिक्स को दर्शाता है। अनुमानक को [[क्षणों की सामान्यीकृत विधि]] (जीएमएम) के संदर्भ में प्राप्त किया जा सकता है। | ||
इसके अतिरिक्त साहित्य में अधिकांशतः चर्चा की जाती है (व्हाइट के पेपर सहित) <math>\widehat\mathbf{\Omega}_n</math> का सहप्रसरण मैट्रिक्स <math>\sqrt{n}</math> संगत सीमित वितरण है | | |||
: <math> | : <math> | ||
\sqrt{n}(\widehat \boldsymbol{\beta}_n - \boldsymbol{\beta}) \, \xrightarrow{d} \, \mathcal{N}(\mathbf{0}, \mathbf{\Omega}), | \sqrt{n}(\widehat \boldsymbol{\beta}_n - \boldsymbol{\beta}) \, \xrightarrow{d} \, \mathcal{N}(\mathbf{0}, \mathbf{\Omega}), | ||
</math> | </math> | ||
जहाँ | |||
: <math> | : <math> | ||
Line 77: | Line 75: | ||
\widehat \mathbb{V}[\mathbf{X} \boldsymbol{\varepsilon}] = \frac{1}{n} \sum_i \mathbf{x}_i \mathbf{x}_i^{\top} \widehat \varepsilon_i^2 = \frac{1}{n} \mathbf{X}^{\top} \operatorname{diag}(\widehat \varepsilon_1^2, \ldots, \widehat \varepsilon_n^2) \mathbf{X}. | \widehat \mathbb{V}[\mathbf{X} \boldsymbol{\varepsilon}] = \frac{1}{n} \sum_i \mathbf{x}_i \mathbf{x}_i^{\top} \widehat \varepsilon_i^2 = \frac{1}{n} \mathbf{X}^{\top} \operatorname{diag}(\widehat \varepsilon_1^2, \ldots, \widehat \varepsilon_n^2) \mathbf{X}. | ||
</math> | </math> | ||
स्पष्ट रूप से कौन सा सहप्रसरण मैट्रिक्स चिंता का विषय है, यह संदर्भ का विषय है। | |||
मैकिनॉन एंड व्हाइट (1985) में वैकल्पिक अनुमानक प्रस्तावित किए गए हैं | जो विभिन्न [[उत्तोलन (सांख्यिकी)]] के कारण प्रतिगमन अवशिष्टों के असमान प्रसरणों के लिए सही हैं।<ref>{{Cite journal |last1=MacKinnon |first1=James G. |author-link=James G. MacKinnon |last2=White |first2=Halbert |author2-link=Halbert White |title=बेहतर परिमित नमूना गुणों के साथ कुछ हेटेरोस्केडैस्टिक-कंसिस्टेंट कोवैरियंस मैट्रिक्स एस्टिमेटर्स|journal=[[Journal of Econometrics]] |volume=29 |issue=3 |pages=305–325 |year=1985 |doi=10.1016/0304-4076(85)90158-7 |hdl=10419/189084 |hdl-access=free }}</ref> स्पर्शोन्मुख व्हाइट के अनुमानक के विपरीत, उनके अनुमानक निष्पक्ष होते हैं जब डेटा समरूपतावादी होते हैं। | |||
व्यापक रूप से उपलब्ध चार अलग-अलग विकल्पों में से, जिन्हें अधिकांशतः HC0-HC3 के रूप में दर्शाया जाता है | HC3 विनिर्देश सबसे अच्छा काम करता प्रतीत होता है | अनुमानक HC3 पर निर्भर परीक्षणों में उत्तम शक्ति और लक्षित सांख्यिकीय परिकल्पना परीक्षण शब्दों की परिभाषा, विशेष रूप से छोटे में प्रतिरूप जितना बड़ा होगा, विभिन्न आकलनकर्ताओं के बीच का अंतर उतना ही कम होता है।<ref>{{Cite journal |last=Long |first=J. Scott |last2=Ervin |first2=Laurie H. |date=2000 |title=रैखिक प्रतिगमन मॉडल में हेटेरोसेडेसिटी संगत मानक त्रुटियों का उपयोग करना|url=https://www.jstor.org/stable/2685594 |journal=The American Statistician |volume=54 |issue=3 |pages=217–224 |doi=10.2307/2685594 |issn=0003-1305}}</ref> | |||
विषमलैंगिकता को स्पष्ट रूप से मॉडलिंग करने का एक विकल्प रीसैंपलिंग (सांख्यिकी) जैसे बूटस्ट्रैपिंग (सांख्यिकी) वाइल्ड बूटस्ट्रैप का उपयोग कर रहा है। यह देखते हुए कि बूटस्ट्रैप विश्वास अंतराल के लिए बूटस्ट्रैपिंग (सांख्यिकी) विधियाँ, जो अपनी मानक त्रुटि द्वारा पुनर्नमूना आँकड़ों को मानकीकृत करती है, एक स्पर्शोन्मुख शोधन प्राप्त करती है |<ref>{{Cite book |last=C. |first=Davison, Anthony |url=http://worldcat.org/oclc/740960962 |title=बूटस्ट्रैप विधियाँ और उनका अनुप्रयोग|date=2010 |publisher=Cambridge Univ. Press |isbn=978-0-521-57391-7 |oclc=740960962}}</ref> विषमलैंगिकता-शक्तिशाली मानक त्रुटियाँ फिर भी उपयोगी हैं। | |||
विषमलैंगिकता को स्पष्ट रूप से मॉडलिंग करने का एक विकल्प रीसैंपलिंग (सांख्यिकी) जैसे बूटस्ट्रैपिंग (सांख्यिकी) | |||
हेटेरोस्केडैस्टिक त्रुटियों के लिए लेखांकन के | हेटेरोस्केडैस्टिक त्रुटियों के लिए लेखांकन के अतिरिक्त, अधिकांश रेखीय मॉडल को होमोस्केडैस्टिक त्रुटि नियमो में परिवर्तित किया जा सकता है (जब तक कि निर्माण द्वारा त्रुटि शब्द हेटेरोस्केडैस्टिक न हो, उदाहरण के लिए एक रैखिक संभावना मॉडल में)। ऐसा करने का एक विधि भारित कम से कम वर्गों का उपयोग करना है, जिसमें उत्तम दक्षता गुण भी सम्मिलित हैं। | ||
== यह भी देखें == | == यह भी देखें == | ||
Line 98: | Line 97: | ||
== सॉफ्टवेयर == | == सॉफ्टवेयर == | ||
* [[EViews]]: | * [[EViews|ईव्यूज़]]: ईव्यूज़ संस्करण 8 शक्तिशाली कम से कम वर्गों के लिए तीन अलग-अलग विधियों की प्रस्तुति करता है: एम-अनुमान (ह्यूबर, 1973), एस-अनुमान (रूसीव और योहाई, 1984), और एमएम-अनुमान (योहाई 1987)।<ref>{{Cite web|url=http://www.eviews.com/EViews8/ev8ecrobust_n.html|title=EViews 8 Robust Regression}}</ref> | ||
* [[जूलिया (प्रोग्रामिंग भाषा)]]: द <code>CovarianceMatrices</code> पैकेज हेटेरोस्केडैस्टिक | * [[जूलिया (प्रोग्रामिंग भाषा)]]: द <code>CovarianceMatrices</code> पैकेज हेटेरोस्केडैस्टिक शक्तिशाली वैरियंस कोवैरियंस मैट्रिसेस के लिए कई विधि प्रदान करता है।<ref>[https://github.com/gragusa/CovarianceMatrices.jl CovarianceMatrices: Robust Covariance Matrix Estimators]</ref> * [[MATLAB|मैटलैब]]: देखें <code>hac</code> इकोनोमेट्रिक्स टूलबॉक्स में कार्य करता है।<ref>{{cite web |title=विषमलैंगिकता और स्वसहसंबंध सुसंगत सहप्रसरण अनुमानक|work=Econometrics Toolbox |url=https://www.mathworks.com/help/econ/hac.html}}</ref> | ||
* [[पायथन (प्रोग्रामिंग भाषा)]]: | * [[पायथन (प्रोग्रामिंग भाषा)]]: स्टैट्समॉडल्स पैकेज विभिन्न शक्तिशाली मानक त्रुटि अनुमान प्रदान करता है, देखें [http://www.statsmodels.org/dev/generated/statsmodels.regression.linear_model.RegressionResults.html statsmodels.regression.linear_model.RegressionResults] आगे के विवरण के लिए | ||
* [[आर (प्रोग्रामिंग भाषा)]]: द <code>vcovHC()</code> से आदेश {{mono|sandwich}} पैकेट।<ref>[https://cran.r-project.org/web/packages/sandwich/index.html sandwich: Robust Covariance Matrix Estimators]</ref><ref>{{cite book |first1=Christian |last1=Kleiber |first2=Achim |last2=Zeileis |title=आर के साथ एप्लाइड अर्थमिति|location=New York |publisher=Springer |year=2008 |isbn=978-0-387-77316-2 |pages=106–110 |url=https://books.google.com/books?id=86rWI7WzFScC&pg=PA106 }}</ref> | * [[आर (प्रोग्रामिंग भाषा)]]: द <code>vcovHC()</code> से आदेश {{mono|sandwich}} पैकेट।<ref>[https://cran.r-project.org/web/packages/sandwich/index.html sandwich: Robust Covariance Matrix Estimators]</ref><ref>{{cite book |first1=Christian |last1=Kleiber |first2=Achim |last2=Zeileis |title=आर के साथ एप्लाइड अर्थमिति|location=New York |publisher=Springer |year=2008 |isbn=978-0-387-77316-2 |pages=106–110 |url=https://books.google.com/books?id=86rWI7WzFScC&pg=PA106 }}</ref> | ||
* [[RATS (सांख्यिकीय पैकेज)]]: {{mono|robusterrors}} विकल्प कई प्रतिगमन और अनुकूलन आदेशों में उपलब्ध है ({{mono|linreg}}, {{mono|nlls}}, वगैरह।)। | * [[RATS (सांख्यिकीय पैकेज)|रेट्स (सांख्यिकीय पैकेज)]]: {{mono|robusterrors}} विकल्प कई प्रतिगमन और अनुकूलन आदेशों में उपलब्ध है ({{mono|linreg}}, {{mono|nlls}}, वगैरह।)। | ||
* | * स्टाटा <code>robust</code> विकल्प कई छद्म-संभावना आधारित प्रक्रियाओं में प्रयुक्त होता है।<ref>See online help for [https://www.stata.com/manuals15/p_robust.pdf <code>_robust</code>] option and [https://www.stata.com/manuals15/rregress.pdf <code>regress</code>] command.</ref> | ||
* [[ग्रेटल]]: विकल्प <code>--robust</code> कई अनुमान आदेशों के लिए (जैसे <code>ols</code>) क्रॉस-सेक्शनल डेटासेट के संदर्भ में | * [[ग्रेटल]]: विकल्प <code>--robust</code> कई अनुमान आदेशों के लिए (जैसे <code>ols</code>) क्रॉस-सेक्शनल डेटासेट के संदर्भ में शक्तिशाली मानक त्रुटियां उत्पन्न करता है।<ref>{{cite web |title=मजबूत सहप्रसरण मैट्रिक्स अनुमान|work=Gretl User's Guide, chapter 19 |url=http://gretl.sourceforge.net/gretl-help/gretl-guide.pdf }}</ref> | ||
Revision as of 10:19, 10 June 2023
रेखीय प्रतिगमन और समय श्रृंखला विश्लेषण के संदर्भ में सांख्यिकी और अर्थमिति में विषमलैंगिकता-संगत (एचसी) मानक त्रुटियों का विषय उत्पन्न होता है। इन्हें विषमलैंगिकता-शक्तिशाली मानक त्रुटियां (या केवल शक्तिशाली मानक त्रुटियां), ईकर-ह्यूबर-श्वेत मानक त्रुटियां (ह्यूबर-श्वेत मानक त्रुटियां या श्वेत मानक त्रुटियां भी) के रूप में जाना जाता है।[1] फ्रीडेलम इकर के योगदान को पहचानने के लिए,[2] पीटर जे ह्यूबर,[3] और हलबर्ट व्हाइट थे।[4]
प्रतिगमन और समय-श्रृंखला मॉडलिंग में, मॉडल के मूल रूप इस धारणा का उपयोग करते हैं कि सभी अवलोकन बिंदुओं में त्रुटियां या अस्तव्यस्तता ui समान भिन्नता है। जब ऐसा नहीं होता है, तो त्रुटियों को विषमलैंगिक कहा जाता है, या विषमलैंगिकता होती है, और यह व्यवहार अवशिष्टों में परिलक्षित होगा एक फिटेड मॉडल से अनुमान लगाया गया है। विषमलैंगिकता-संगत मानक त्रुटियों का उपयोग उस मॉडल की फिटिंग की अनुमति देने के लिए किया जाता है | जिसमें विषमलैंगिक अवशेष होते हैं। इस तरह का पहला दृष्टिकोण ह्यूबर (1967) द्वारा प्रस्तावित किया गया था, और क्रॉस-सेक्शनल डेटा, समय श्रृंखला डेटा और गर्च के बाद से और उत्तम प्रक्रियाओं का उत्पादन किया गया है।
विषमलैंगिकता-संगत मानक त्रुटियाँ जो मौलिक मानक त्रुटियों से भिन्न होती हैं | मॉडल के गलत विवरण का संकेत दे सकती हैं। विषमलैंगिकता-संगत मानक त्रुटियों को प्रतिस्थापित करने से यह गलत विशिष्टता हल नहीं होती है | जिससे गुणांक में पूर्वाग्रह हो सकता है। अधिकतर स्थितियों में, समस्या को खोजना और सही करना चाहिए।[5] अन्य प्रकार के मानक त्रुटि समायोजन, जैसे संकुलित मानक त्रुटियाँ या नेवी-वेस्ट एस्टिमेटर, को एचसी मानक त्रुटियों के विस्तार के रूप में माना जा सकता है।
इतिहास
फ्रिडेलम इकर द्वारा हेटेरोस्केडैस्टिकिटी-सुसंगत मानक त्रुटियां प्रस्तुत की जाती हैं,[6][7] और हैल्बर्ट व्हाइट द्वारा अर्थमिति में लोकप्रिय किया गया था।
समस्या
स्केलर के लिए रेखीय प्रतिगमन मॉडल पर विचार करें |
जहाँ व्याख्यात्मक चरों (विशेषताओं) का एक k x 1 स्तंभ सदिश है अनुमानित किए जाने वाले मापदंडों का एक k × 1 स्तंभ सदिश है और त्रुटियां और अवशेष है। सामान्य न्यूनतम वर्ग (ओएलएस) ) अनुमानक है |
जहाँ प्रेक्षणों का सदिश है, और डेटा में देखे गए मानों के ढेर के मैट्रिक्स को दर्शाता है।
यदि आँकड़ों में त्रुटियाँ समान भिन्नता है और असहसंबद्ध हैं तो का न्यूनतम-वर्ग अनुमान ब्लू (सर्वश्रेष्ठ रैखिक निष्पक्ष अनुमानक) है और इसके भिन्नता का अनुमान लगाया गया है |
जहाँ प्रतिगमन अवशेष हैं।
जब त्रुटि नियमो में निरंतर भिन्नता नहीं होती है (अर्थात, की धारणा असत्य है), तो ओएलएस अनुमानक अपने वांछित गुणों को खो देता है। विचरण के सूत्र को अब सरल नहीं किया जा सकता है:
जहां जबकि ओएलएस बिंदु अनुमानक निष्पक्ष रहता है, यह न्यूनतम औसत वर्ग त्रुटि और ओएलएस भिन्नता अनुमानक होने के अर्थ में "सर्वश्रेष्ठ" नहीं है | ओएलएस अनुमानों के विचरण का एक सुसंगत अनुमान प्रदान नहीं करता है।
किसी भी गैर-रैखिक मॉडल (उदाहरण के लिए लॉगिट और प्रोबिट मॉडल) के लिए, चूँकि विषमलैंगिकता के अधिक गंभीर परिणाम होते हैं | मापदंडों का अधिकतम संभावना अनुमान पक्षपाती (अज्ञात दिशा में) होगा, साथ ही असंगत (जब तक कि संभावना कार्य संशोधित न हो) विषमलैंगिकता के स्पष्ट रूप को सही विधि से ध्यान में रखना) [8] [9] जैसा कि विलियम ग्रीन (अर्थशास्त्री) द्वारा इंगित किया गया है "अन्यथा असंगत अनुमानक के लिए केवल एक शक्तिशाली सहप्रसरण मैट्रिक्स की गणना करना इसे मोचन नहीं देता है।" [10]
समाधान
यदि प्रतिगमन त्रुटियां स्वतंत्र हैं, किन्तु उनके अलग-अलग संस्करण हैं | तब जिसका अनुमान लगाया जा सकता है | यह व्हाइट का (1980) अनुमानक प्रदान करता है, जिसे अधिकांशतः एचसीई (विषमलैंगिकता-सुसंगत अनुमानक) के रूप में संदर्भित किया जाता है |
जहां उपरोक्त डेटा से स्टैक्ड मानों के मैट्रिक्स को दर्शाता है। अनुमानक को क्षणों की सामान्यीकृत विधि (जीएमएम) के संदर्भ में प्राप्त किया जा सकता है।
इसके अतिरिक्त साहित्य में अधिकांशतः चर्चा की जाती है (व्हाइट के पेपर सहित) का सहप्रसरण मैट्रिक्स संगत सीमित वितरण है |
जहाँ
और
इस प्रकार,
और
स्पष्ट रूप से कौन सा सहप्रसरण मैट्रिक्स चिंता का विषय है, यह संदर्भ का विषय है।
मैकिनॉन एंड व्हाइट (1985) में वैकल्पिक अनुमानक प्रस्तावित किए गए हैं | जो विभिन्न उत्तोलन (सांख्यिकी) के कारण प्रतिगमन अवशिष्टों के असमान प्रसरणों के लिए सही हैं।[11] स्पर्शोन्मुख व्हाइट के अनुमानक के विपरीत, उनके अनुमानक निष्पक्ष होते हैं जब डेटा समरूपतावादी होते हैं।
व्यापक रूप से उपलब्ध चार अलग-अलग विकल्पों में से, जिन्हें अधिकांशतः HC0-HC3 के रूप में दर्शाया जाता है | HC3 विनिर्देश सबसे अच्छा काम करता प्रतीत होता है | अनुमानक HC3 पर निर्भर परीक्षणों में उत्तम शक्ति और लक्षित सांख्यिकीय परिकल्पना परीक्षण शब्दों की परिभाषा, विशेष रूप से छोटे में प्रतिरूप जितना बड़ा होगा, विभिन्न आकलनकर्ताओं के बीच का अंतर उतना ही कम होता है।[12]
विषमलैंगिकता को स्पष्ट रूप से मॉडलिंग करने का एक विकल्प रीसैंपलिंग (सांख्यिकी) जैसे बूटस्ट्रैपिंग (सांख्यिकी) वाइल्ड बूटस्ट्रैप का उपयोग कर रहा है। यह देखते हुए कि बूटस्ट्रैप विश्वास अंतराल के लिए बूटस्ट्रैपिंग (सांख्यिकी) विधियाँ, जो अपनी मानक त्रुटि द्वारा पुनर्नमूना आँकड़ों को मानकीकृत करती है, एक स्पर्शोन्मुख शोधन प्राप्त करती है |[13] विषमलैंगिकता-शक्तिशाली मानक त्रुटियाँ फिर भी उपयोगी हैं।
हेटेरोस्केडैस्टिक त्रुटियों के लिए लेखांकन के अतिरिक्त, अधिकांश रेखीय मॉडल को होमोस्केडैस्टिक त्रुटि नियमो में परिवर्तित किया जा सकता है (जब तक कि निर्माण द्वारा त्रुटि शब्द हेटेरोस्केडैस्टिक न हो, उदाहरण के लिए एक रैखिक संभावना मॉडल में)। ऐसा करने का एक विधि भारित कम से कम वर्गों का उपयोग करना है, जिसमें उत्तम दक्षता गुण भी सम्मिलित हैं।
यह भी देखें
- डेल्टा विधि
- सामान्यीकृत कम से कम वर्ग
- सामान्यीकृत अनुमान समीकरण
- भारित न्यूनतम वर्ग, एक वैकल्पिक सूत्रीकरण
- श्वेत परीक्षण - विषमलैंगिकता मौजूद है या नहीं इसके लिए एक परीक्षण।
- नेवी-वेस्ट एस्टिमेटर
- अर्ध-अधिकतम संभावना अनुमान
सॉफ्टवेयर
- ईव्यूज़: ईव्यूज़ संस्करण 8 शक्तिशाली कम से कम वर्गों के लिए तीन अलग-अलग विधियों की प्रस्तुति करता है: एम-अनुमान (ह्यूबर, 1973), एस-अनुमान (रूसीव और योहाई, 1984), और एमएम-अनुमान (योहाई 1987)।[14]
- जूलिया (प्रोग्रामिंग भाषा): द
CovarianceMatrices
पैकेज हेटेरोस्केडैस्टिक शक्तिशाली वैरियंस कोवैरियंस मैट्रिसेस के लिए कई विधि प्रदान करता है।[15] * मैटलैब: देखेंhac
इकोनोमेट्रिक्स टूलबॉक्स में कार्य करता है।[16] - पायथन (प्रोग्रामिंग भाषा): स्टैट्समॉडल्स पैकेज विभिन्न शक्तिशाली मानक त्रुटि अनुमान प्रदान करता है, देखें statsmodels.regression.linear_model.RegressionResults आगे के विवरण के लिए
- आर (प्रोग्रामिंग भाषा): द
vcovHC()
से आदेश sandwich पैकेट।[17][18] - रेट्स (सांख्यिकीय पैकेज): robusterrors विकल्प कई प्रतिगमन और अनुकूलन आदेशों में उपलब्ध है (linreg, nlls, वगैरह।)।
- स्टाटा
robust
विकल्प कई छद्म-संभावना आधारित प्रक्रियाओं में प्रयुक्त होता है।[19] - ग्रेटल: विकल्प
--robust
कई अनुमान आदेशों के लिए (जैसेols
) क्रॉस-सेक्शनल डेटासेट के संदर्भ में शक्तिशाली मानक त्रुटियां उत्पन्न करता है।[20]
संदर्भ
- ↑ Kleiber, C.; Zeileis, A. (2006). "आर के साथ एप्लाइड अर्थमिति" (PDF). UseR-2006 conference. Archived from the original (PDF) on April 22, 2007.
- ↑ Eicker, Friedhelm (1967). "Limit Theorems for Regression with Unequal and Dependent Errors". गणितीय सांख्यिकी और संभाव्यता पर पांचवें बर्कले संगोष्ठी की कार्यवाही. Vol. 5. pp. 59–82. MR 0214223. Zbl 0217.51201.
- ↑ Huber, Peter J. (1967). "The behavior of maximum likelihood estimates under nonstandard conditions". गणितीय सांख्यिकी और संभाव्यता पर पांचवें बर्कले संगोष्ठी की कार्यवाही. Vol. 5. pp. 221–233. MR 0216620. Zbl 0212.21504.
- ↑ White, Halbert (1980). "एक विषमलैंगिकता-संगत सहप्रसरण मैट्रिक्स अनुमानक और विषमलैंगिकता के लिए एक प्रत्यक्ष परीक्षण". Econometrica. 48 (4): 817–838. CiteSeerX 10.1.1.11.7646. doi:10.2307/1912934. JSTOR 1912934. MR 0575027.
- ↑ King, Gary; Roberts, Margaret E. (2015). "मजबूत मानक त्रुटियाँ पद्धति संबंधी समस्याओं को कैसे प्रकट करती हैं जिन्हें वे ठीक नहीं कर सकते हैं, और इसके बारे में क्या करना है". Political Analysis (in English). 23 (2): 159–179. doi:10.1093/pan/mpu015. ISSN 1047-1987.
- ↑ Eicker, F. (1963). "रैखिक प्रतिगमन के परिवारों के लिए स्पर्शोन्मुख सामान्यता और कम से कम वर्गों की संगति". The Annals of Mathematical Statistics. 34 (2): 447–456. doi:10.1214/aoms/1177704156.
- ↑ Eicker, Friedhelm (January 1967). "असमान और निर्भर त्रुटियों के साथ प्रतिगमन के लिए सीमा प्रमेय". Proceedings of the Fifth Berkeley Symposium on Mathematical Statistics and Probability, Volume 1: Statistics. 5 (1): 59–83.
- ↑ Giles, Dave (May 8, 2013). "अरैखिक मॉडल के लिए मजबूत मानक त्रुटियां". Econometrics Beat.
- ↑ Guggisberg, Michael (2019). "गलत निर्दिष्ट असतत विकल्प मॉडल और ह्यूबर-व्हाइट मानक त्रुटियाँ". Journal of Econometric Methods. 8 (1). doi:10.1515/jem-2016-0002.
- ↑ Greene, William H. (2012). अर्थमितीय विश्लेषण (Seventh ed.). Boston: Pearson Education. pp. 692–693. ISBN 978-0-273-75356-8.
- ↑ MacKinnon, James G.; White, Halbert (1985). "बेहतर परिमित नमूना गुणों के साथ कुछ हेटेरोस्केडैस्टिक-कंसिस्टेंट कोवैरियंस मैट्रिक्स एस्टिमेटर्स". Journal of Econometrics. 29 (3): 305–325. doi:10.1016/0304-4076(85)90158-7. hdl:10419/189084.
- ↑ Long, J. Scott; Ervin, Laurie H. (2000). "रैखिक प्रतिगमन मॉडल में हेटेरोसेडेसिटी संगत मानक त्रुटियों का उपयोग करना". The American Statistician. 54 (3): 217–224. doi:10.2307/2685594. ISSN 0003-1305.
- ↑ C., Davison, Anthony (2010). बूटस्ट्रैप विधियाँ और उनका अनुप्रयोग. Cambridge Univ. Press. ISBN 978-0-521-57391-7. OCLC 740960962.
{{cite book}}
: CS1 maint: multiple names: authors list (link) - ↑ "EViews 8 Robust Regression".
- ↑ CovarianceMatrices: Robust Covariance Matrix Estimators
- ↑ "विषमलैंगिकता और स्वसहसंबंध सुसंगत सहप्रसरण अनुमानक". Econometrics Toolbox.
- ↑ sandwich: Robust Covariance Matrix Estimators
- ↑ Kleiber, Christian; Zeileis, Achim (2008). आर के साथ एप्लाइड अर्थमिति. New York: Springer. pp. 106–110. ISBN 978-0-387-77316-2.
- ↑ See online help for
_robust
option andregress
command. - ↑ "मजबूत सहप्रसरण मैट्रिक्स अनुमान" (PDF). Gretl User's Guide, chapter 19.
अग्रिम पठन
- Freedman, David A. (2006). "On The So-Called 'Huber Sandwich Estimator' and 'Robust Standard Errors'". The American Statistician. 60 (4): 299–302. doi:10.1198/000313006X152207. S2CID 6222876.
- Hardin, James W. (2003). "The Sandwich Estimate of Variance". In Fomby, Thomas B.; Hill, R. Carter (eds.). Maximum Likelihood Estimation of Misspecified Models: Twenty Years Later. Amsterdam: Elsevier. pp. 45–74. ISBN 0-7623-1075-8.
- Hayes, Andrew F.; Cai, Li (2007). "Using heteroskedasticity-consistent standard error estimators in OLS regression: An introduction and software implementation". Behavior Research Methods. 39 (4): 709–722. doi:10.3758/BF03192961. PMID 18183883.
- King, Gary; Roberts, Margaret E. (2015). "How Robust Standard Errors Expose Methodological Problems They Do Not Fix, and What to Do About It". Political Analysis. 23 (2): 159–179. doi:10.1093/pan/mpu015.
- Wooldridge, Jeffrey M. (2009). "Heteroskedasticity-Robust Inference after OLS Estimation". Introductory Econometrics : A Modern Approach (Fourth ed.). Mason: South-Western. pp. 265–271. ISBN 978-0-324-66054-8.
- Buja, Andreas, et al. "Models as approximations-a conspiracy of random regressors and model deviations against classical inference in regression." Statistical Science (2015): 1. pdf