हेटेरोस्केडेस्टीसिटी -संगत मानक त्रुटियाँ
रेखीय प्रतिगमन और समय श्रृंखला विश्लेषण के संदर्भ में सांख्यिकी और अर्थमिति में हेटेरोस्केडेस्टीसिटी -संगत (एचसी) मानक त्रुटियों का विषय उत्पन्न होता है। इन्हें हेटेरोस्केडेस्टीसिटी -शक्तिशाली मानक त्रुटियां (या केवल शक्तिशाली मानक त्रुटियां), ईकर-ह्यूबर-श्वेत मानक त्रुटियां (ह्यूबर-श्वेत मानक त्रुटियां या श्वेत मानक त्रुटियां भी) के रूप में जाना जाता है।[1] फ्रीडेलम इकर के योगदान को पहचानने के लिए,[2] पीटर जे ह्यूबर,[3] और हलबर्ट व्हाइट थे।[4]
प्रतिगमन और समय-श्रृंखला मॉडलिंग में, मॉडल के मूल रूप इस धारणा का उपयोग करते हैं कि सभी अवलोकन बिंदुओं में त्रुटियां या अस्तव्यस्तता ui समान भिन्नता है। जब ऐसा नहीं होता है, तो त्रुटियों को विषमलैंगिक कहा जाता है, या हेटेरोस्केडेस्टीसिटी होती है, और यह व्यवहार अवशिष्टों में परिलक्षित होगा एक फिटेड मॉडल से अनुमान लगाया गया है। हेटेरोस्केडेस्टीसिटी -संगत मानक त्रुटियों का उपयोग उस मॉडल की फिटिंग की अनुमति देने के लिए किया जाता है। जिसमें विषमलैंगिक अवशेष होते हैं। इस तरह का पहला दृष्टिकोण ह्यूबर (1967) द्वारा प्रस्तावित किया गया था, और क्रॉस-सेक्शनल डेटा, समय श्रृंखला डेटा और गर्च के बाद से और उत्तम प्रक्रियाओं का उत्पादन किया गया है।
हेटेरोस्केडेस्टीसिटी -संगत मानक त्रुटियाँ जो मौलिक मानक त्रुटियों से भिन्न होती हैं | मॉडल के गलत विवरण का संकेत दे सकती हैं। हेटेरोस्केडेस्टीसिटी -संगत मानक त्रुटियों को प्रतिस्थापित करने से यह गलत विशिष्टता हल नहीं होती है। जिससे गुणांक में पूर्वाग्रह हो सकता है। अधिकतर स्थितियों में, समस्या को खोजना और सही करना चाहिए।[5] अन्य प्रकार के मानक त्रुटि समायोजन, जैसे संकुलित मानक त्रुटियाँ या नेवी-वेस्ट एस्टिमेटर, को एचसी मानक त्रुटियों के विस्तार के रूप में माना जा सकता है।
इतिहास
फ्रिडेलम इकर द्वारा हेटेरोस्केडैस्टिकिटी-सुसंगत मानक त्रुटियां प्रस्तुत की जाती हैं,[6][7] और हैल्बर्ट व्हाइट द्वारा अर्थमिति में लोकप्रिय किया गया था।
समस्या
स्केलर के लिए रेखीय प्रतिगमन मॉडल पर विचार करें।
जहाँ व्याख्यात्मक चरों (विशेषताओं) का एक k x 1 स्तंभ सदिश है अनुमानित किए जाने वाले मापदंडों का एक k × 1 स्तंभ सदिश है और त्रुटियां और अवशेष है। सामान्य न्यूनतम वर्ग (ओएलएस) ) अनुमानक है।
जहाँ प्रेक्षणों का सदिश है, और डेटा में देखे गए मानों के ढेर के मैट्रिक्स को दर्शाता है।
यदि आँकड़ों में त्रुटियाँ समान भिन्नता है और असहसंबद्ध हैं तो का न्यूनतम-वर्ग अनुमान ब्लू (सर्वश्रेष्ठ रैखिक निष्पक्ष अनुमानक) है और इसके भिन्नता का अनुमान लगाया गया है।
जहाँ प्रतिगमन अवशेष हैं।
जब त्रुटि नियमो में निरंतर भिन्नता नहीं होती है (अर्थात, की धारणा असत्य है), तो ओएलएस अनुमानक अपने वांछित गुणों को खो देता है। विचरण के सूत्र को अब सरल नहीं किया जा सकता है।
जहां जबकि ओएलएस बिंदु अनुमानक निष्पक्ष रहता है, यह न्यूनतम औसत वर्ग त्रुटि और ओएलएस भिन्नता अनुमानक होने के अर्थ में "सर्वश्रेष्ठ" नहीं है। ओएलएस अनुमानों के विचरण का एक सुसंगत अनुमान प्रदान नहीं करता है।
किसी भी गैर-रैखिक मॉडल (उदाहरण के लिए लॉगिट और प्रोबिट मॉडल) के लिए, चूँकि हेटेरोस्केडेस्टीसिटी के अधिक गंभीर परिणाम होते हैं | मापदंडों का अधिकतम संभावना अनुमान पक्षपाती (अज्ञात दिशा में) होगा, साथ ही असंगत (जब तक कि संभावना कार्य संशोधित न हो) हेटेरोस्केडेस्टीसिटी के स्पष्ट रूप को सही विधि से ध्यान में रखना) [8] [9] जैसा कि विलियम ग्रीन (अर्थशास्त्री) द्वारा इंगित किया गया है "अन्यथा असंगत अनुमानक के लिए केवल एक शक्तिशाली सहप्रसरण मैट्रिक्स की गणना करना इसे मोचन नहीं देता है।" [10]
समाधान
यदि प्रतिगमन त्रुटियां स्वतंत्र हैं, किन्तु उनके अलग-अलग संस्करण हैं | तब जिसका अनुमान लगाया जा सकता है। यह व्हाइट का (1980) अनुमानक प्रदान करता है, जिसे अधिकांशतः एचसीई (हेटेरोस्केडेस्टीसिटी -सुसंगत अनुमानक) के रूप में संदर्भित किया जाता है।
जहां उपरोक्त डेटा से स्टैक्ड मानों के मैट्रिक्स को दर्शाता है। अनुमानक को क्षणों की सामान्यीकृत विधि (जीएमएम) के संदर्भ में प्राप्त किया जा सकता है।
इसके अतिरिक्त साहित्य में अधिकांशतः चर्चा की जाती है (व्हाइट के पेपर सहित) का सहप्रसरण मैट्रिक्स संगत सीमित वितरण है।
जहाँ
और
इस प्रकार,
और
स्पष्ट रूप से कौन सा सहप्रसरण मैट्रिक्स चिंता का विषय है, यह संदर्भ का विषय है।
मैकिनॉन एंड व्हाइट (1985) में वैकल्पिक अनुमानक प्रस्तावित किए गए हैं | जो विभिन्न उत्तोलन (सांख्यिकी) के कारण प्रतिगमन अवशिष्टों के असमान प्रसरणों के लिए सही हैं।[11] स्पर्शोन्मुख व्हाइट के अनुमानक के विपरीत, उनके अनुमानक निष्पक्ष होते हैं जब डेटा समरूपतावादी होते हैं।
व्यापक रूप से उपलब्ध चार अलग-अलग विकल्पों में से, जिन्हें अधिकांशतः HC0-HC3 के रूप में दर्शाया जाता है। HC3 विनिर्देश सबसे अच्छा काम करता प्रतीत होता है। अनुमानक HC3 पर निर्भर परीक्षणों में उत्तम शक्ति और लक्षित सांख्यिकीय परिकल्पना परीक्षण शब्दों की परिभाषा, विशेष रूप से छोटे में प्रतिरूप जितना बड़ा होगा, विभिन्न आकलनकर्ताओं के बीच का अंतर उतना ही कम होता है।[12]
हेटेरोस्केडेस्टीसिटी को स्पष्ट रूप से मॉडलिंग करने का एक विकल्प रीसैंपलिंग (सांख्यिकी) जैसे बूटस्ट्रैपिंग (सांख्यिकी) वाइल्ड बूटस्ट्रैप का उपयोग कर रहा है। यह देखते हुए कि बूटस्ट्रैप विश्वास अंतराल के लिए बूटस्ट्रैपिंग (सांख्यिकी) विधियाँ, जो अपनी मानक त्रुटि द्वारा पुनर्नमूना आँकड़ों को मानकीकृत करती है, एक स्पर्शोन्मुख शोधन प्राप्त करती है।[13] हेटेरोस्केडेस्टीसिटी -शक्तिशाली मानक त्रुटियाँ फिर भी उपयोगी हैं।
हेटेरोस्केडैस्टिक त्रुटियों के लिए लेखांकन के अतिरिक्त, अधिकांश रेखीय मॉडल को होमोस्केडैस्टिक त्रुटि नियमो में परिवर्तित किया जा सकता है (जब तक कि निर्माण द्वारा त्रुटि शब्द हेटेरोस्केडैस्टिक न हो, उदाहरण के लिए एक रैखिक संभावना मॉडल में)। ऐसा करने का एक विधि भारित कम से कम वर्गों का उपयोग करना है, जिसमें उत्तम दक्षता गुण भी सम्मिलित हैं।
यह भी देखें
- डेल्टा विधि
- सामान्यीकृत कम से कम वर्ग
- सामान्यीकृत अनुमान समीकरण
- भारित न्यूनतम वर्ग, एक वैकल्पिक सूत्रीकरण
- श्वेत परीक्षण - विषमलैंगिकता मौजूद है या नहीं इसके लिए एक परीक्षण।
- नेवी-वेस्ट एस्टिमेटर
- अर्ध-अधिकतम संभावना अनुमान
सॉफ्टवेयर
- ईव्यूज़: ईव्यूज़ संस्करण 8 शक्तिशाली कम से कम वर्गों के लिए तीन अलग-अलग विधियों की प्रस्तुति करता है: एम-अनुमान (ह्यूबर, 1973), एस-अनुमान (रूसीव और योहाई, 1984), और एमएम-अनुमान (योहाई 1987)।[14]
- जूलिया (प्रोग्रामिंग भाषा): द
CovarianceMatrices
पैकेज हेटेरोस्केडैस्टिक शक्तिशाली वैरियंस कोवैरियंस मैट्रिसेस के लिए कई विधि प्रदान करता है।[15] * मैटलैब: देखेंhac
इकोनोमेट्रिक्स टूलबॉक्स में कार्य करता है।[16] - पायथन (प्रोग्रामिंग भाषा): स्टैट्समॉडल्स पैकेज विभिन्न शक्तिशाली मानक त्रुटि अनुमान प्रदान करता है, देखें statsmodels.regression.linear_model.RegressionResults आगे के विवरण के लिए
- आर (प्रोग्रामिंग भाषा): द
vcovHC()
से आदेश sandwich पैकेट।[17][18] - रेट्स (सांख्यिकीय पैकेज): robusterrors विकल्प कई प्रतिगमन और अनुकूलन आदेशों में उपलब्ध है (linreg, nlls, वगैरह।)।
- स्टाटा
robust
विकल्प कई छद्म-संभावना आधारित प्रक्रियाओं में प्रयुक्त होता है।[19] - ग्रेटल: विकल्प
--robust
कई अनुमान आदेशों के लिए (जैसेols
) क्रॉस-सेक्शनल डेटासेट के संदर्भ में शक्तिशाली मानक त्रुटियां उत्पन्न करता है।[20]
संदर्भ
- ↑ Kleiber, C.; Zeileis, A. (2006). "आर के साथ एप्लाइड अर्थमिति" (PDF). UseR-2006 conference. Archived from the original (PDF) on April 22, 2007.
- ↑ Eicker, Friedhelm (1967). "Limit Theorems for Regression with Unequal and Dependent Errors". गणितीय सांख्यिकी और संभाव्यता पर पांचवें बर्कले संगोष्ठी की कार्यवाही. Vol. 5. pp. 59–82. MR 0214223. Zbl 0217.51201.
- ↑ Huber, Peter J. (1967). "The behavior of maximum likelihood estimates under nonstandard conditions". गणितीय सांख्यिकी और संभाव्यता पर पांचवें बर्कले संगोष्ठी की कार्यवाही. Vol. 5. pp. 221–233. MR 0216620. Zbl 0212.21504.
- ↑ White, Halbert (1980). "एक विषमलैंगिकता-संगत सहप्रसरण मैट्रिक्स अनुमानक और विषमलैंगिकता के लिए एक प्रत्यक्ष परीक्षण". Econometrica. 48 (4): 817–838. CiteSeerX 10.1.1.11.7646. doi:10.2307/1912934. JSTOR 1912934. MR 0575027.
- ↑ King, Gary; Roberts, Margaret E. (2015). "मजबूत मानक त्रुटियाँ पद्धति संबंधी समस्याओं को कैसे प्रकट करती हैं जिन्हें वे ठीक नहीं कर सकते हैं, और इसके बारे में क्या करना है". Political Analysis (in English). 23 (2): 159–179. doi:10.1093/pan/mpu015. ISSN 1047-1987.
- ↑ Eicker, F. (1963). "रैखिक प्रतिगमन के परिवारों के लिए स्पर्शोन्मुख सामान्यता और कम से कम वर्गों की संगति". The Annals of Mathematical Statistics. 34 (2): 447–456. doi:10.1214/aoms/1177704156.
- ↑ Eicker, Friedhelm (January 1967). "असमान और निर्भर त्रुटियों के साथ प्रतिगमन के लिए सीमा प्रमेय". Proceedings of the Fifth Berkeley Symposium on Mathematical Statistics and Probability, Volume 1: Statistics. 5 (1): 59–83.
- ↑ Giles, Dave (May 8, 2013). "अरैखिक मॉडल के लिए मजबूत मानक त्रुटियां". Econometrics Beat.
- ↑ Guggisberg, Michael (2019). "गलत निर्दिष्ट असतत विकल्प मॉडल और ह्यूबर-व्हाइट मानक त्रुटियाँ". Journal of Econometric Methods. 8 (1). doi:10.1515/jem-2016-0002.
- ↑ Greene, William H. (2012). अर्थमितीय विश्लेषण (Seventh ed.). Boston: Pearson Education. pp. 692–693. ISBN 978-0-273-75356-8.
- ↑ MacKinnon, James G.; White, Halbert (1985). "बेहतर परिमित नमूना गुणों के साथ कुछ हेटेरोस्केडैस्टिक-कंसिस्टेंट कोवैरियंस मैट्रिक्स एस्टिमेटर्स". Journal of Econometrics. 29 (3): 305–325. doi:10.1016/0304-4076(85)90158-7. hdl:10419/189084.
- ↑ Long, J. Scott; Ervin, Laurie H. (2000). "रैखिक प्रतिगमन मॉडल में हेटेरोसेडेसिटी संगत मानक त्रुटियों का उपयोग करना". The American Statistician. 54 (3): 217–224. doi:10.2307/2685594. ISSN 0003-1305.
- ↑ C., Davison, Anthony (2010). बूटस्ट्रैप विधियाँ और उनका अनुप्रयोग. Cambridge Univ. Press. ISBN 978-0-521-57391-7. OCLC 740960962.
{{cite book}}
: CS1 maint: multiple names: authors list (link) - ↑ "EViews 8 Robust Regression".
- ↑ CovarianceMatrices: Robust Covariance Matrix Estimators
- ↑ "विषमलैंगिकता और स्वसहसंबंध सुसंगत सहप्रसरण अनुमानक". Econometrics Toolbox.
- ↑ sandwich: Robust Covariance Matrix Estimators
- ↑ Kleiber, Christian; Zeileis, Achim (2008). आर के साथ एप्लाइड अर्थमिति. New York: Springer. pp. 106–110. ISBN 978-0-387-77316-2.
- ↑ See online help for
_robust
option andregress
command. - ↑ "मजबूत सहप्रसरण मैट्रिक्स अनुमान" (PDF). Gretl User's Guide, chapter 19.
अग्रिम पठन
- Freedman, David A. (2006). "On The So-Called 'Huber Sandwich Estimator' and 'Robust Standard Errors'". The American Statistician. 60 (4): 299–302. doi:10.1198/000313006X152207. S2CID 6222876.
- Hardin, James W. (2003). "The Sandwich Estimate of Variance". In Fomby, Thomas B.; Hill, R. Carter (eds.). Maximum Likelihood Estimation of Misspecified Models: Twenty Years Later. Amsterdam: Elsevier. pp. 45–74. ISBN 0-7623-1075-8.
- Hayes, Andrew F.; Cai, Li (2007). "Using heteroskedasticity-consistent standard error estimators in OLS regression: An introduction and software implementation". Behavior Research Methods. 39 (4): 709–722. doi:10.3758/BF03192961. PMID 18183883.
- King, Gary; Roberts, Margaret E. (2015). "How Robust Standard Errors Expose Methodological Problems They Do Not Fix, and What to Do About It". Political Analysis. 23 (2): 159–179. doi:10.1093/pan/mpu015.
- Wooldridge, Jeffrey M. (2009). "Heteroskedasticity-Robust Inference after OLS Estimation". Introductory Econometrics : A Modern Approach (Fourth ed.). Mason: South-Western. pp. 265–271. ISBN 978-0-324-66054-8.
- Buja, Andreas, et al. "Models as approximations-a conspiracy of random regressors and model deviations against classical inference in regression." Statistical Science (2015): 1. pdf