हेटेरोस्केडेस्टीसिटी -संगत मानक त्रुटियाँ

From Vigyanwiki

रेखीय प्रतिगमन और समय श्रृंखला विश्लेषण के संदर्भ में सांख्यिकी और अर्थमिति में हेटेरोस्केडेस्टीसिटी -संगत (एचसी) मानक त्रुटियों का विषय उत्पन्न होता है। इन्हें हेटेरोस्केडेस्टीसिटी -शक्तिशाली मानक त्रुटियां (या केवल शक्तिशाली मानक त्रुटियां), ईकर-ह्यूबर-श्वेत मानक त्रुटियां (ह्यूबर-श्वेत मानक त्रुटियां या श्वेत मानक त्रुटियां भी) के रूप में जाना जाता है।[1] फ्रीडेलम इकर के योगदान को पहचानने के लिए,[2] पीटर जे ह्यूबर,[3] और हलबर्ट व्हाइट थे।[4]

प्रतिगमन और समय-श्रृंखला मॉडलिंग में, मॉडल के मूल रूप इस धारणा का उपयोग करते हैं कि सभी अवलोकन बिंदुओं में त्रुटियां या अस्तव्यस्तता ui समान भिन्नता है। जब ऐसा नहीं होता है, तो त्रुटियों को विषमलैंगिक कहा जाता है, या हेटेरोस्केडेस्टीसिटी होती है, और यह व्यवहार अवशिष्टों में परिलक्षित होगा एक फिटेड मॉडल से अनुमान लगाया गया है। हेटेरोस्केडेस्टीसिटी -संगत मानक त्रुटियों का उपयोग उस मॉडल की फिटिंग की अनुमति देने के लिए किया जाता है। जिसमें विषमलैंगिक अवशेष होते हैं। इस तरह का पहला दृष्टिकोण ह्यूबर (1967) द्वारा प्रस्तावित किया गया था, और क्रॉस-सेक्शनल डेटा, समय श्रृंखला डेटा और गर्च के बाद से और उत्तम प्रक्रियाओं का उत्पादन किया गया है।

हेटेरोस्केडेस्टीसिटी -संगत मानक त्रुटियाँ जो मौलिक मानक त्रुटियों से भिन्न होती हैं | मॉडल के गलत विवरण का संकेत दे सकती हैं। हेटेरोस्केडेस्टीसिटी -संगत मानक त्रुटियों को प्रतिस्थापित करने से यह गलत विशिष्टता हल नहीं होती है। जिससे गुणांक में पूर्वाग्रह हो सकता है। अधिकतर स्थितियों में, समस्या को खोजना और सही करना चाहिए।[5] अन्य प्रकार के मानक त्रुटि समायोजन, जैसे संकुलित मानक त्रुटियाँ या नेवी-वेस्ट एस्टिमेटर, को एचसी मानक त्रुटियों के विस्तार के रूप में माना जा सकता है।

इतिहास

फ्रिडेलम इकर द्वारा हेटेरोस्केडैस्टिकिटी-सुसंगत मानक त्रुटियां प्रस्तुत की जाती हैं,[6][7] और हैल्बर्ट व्हाइट द्वारा अर्थमिति में लोकप्रिय किया गया था।

समस्या

स्केलर के लिए रेखीय प्रतिगमन मॉडल पर विचार करें।

जहाँ व्याख्यात्मक चरों (विशेषताओं) का एक k x 1 स्तंभ सदिश है अनुमानित किए जाने वाले मापदंडों का एक k × 1 स्तंभ सदिश है और त्रुटियां और अवशेष है। सामान्य न्यूनतम वर्ग (ओएलएस) ) अनुमानक है।

जहाँ प्रेक्षणों का सदिश है, और डेटा में देखे गए मानों के ढेर के मैट्रिक्स को दर्शाता है।

यदि आँकड़ों में त्रुटियाँ समान भिन्नता है और असहसंबद्ध हैं तो का न्यूनतम-वर्ग अनुमान ब्लू (सर्वश्रेष्ठ रैखिक निष्पक्ष अनुमानक) है और इसके भिन्नता का अनुमान लगाया गया है।

जहाँ प्रतिगमन अवशेष हैं।

जब त्रुटि नियमो में निरंतर भिन्नता नहीं होती है (अर्थात, की धारणा असत्य है), तो ओएलएस अनुमानक अपने वांछित गुणों को खो देता है। विचरण के सूत्र को अब सरल नहीं किया जा सकता है।

जहां जबकि ओएलएस बिंदु अनुमानक निष्पक्ष रहता है, यह न्यूनतम औसत वर्ग त्रुटि और ओएलएस भिन्नता अनुमानक होने के अर्थ में "सर्वश्रेष्ठ" नहीं है। ओएलएस अनुमानों के विचरण का एक सुसंगत अनुमान प्रदान नहीं करता है।

किसी भी गैर-रैखिक मॉडल (उदाहरण के लिए लॉगिट और प्रोबिट मॉडल) के लिए, चूँकि हेटेरोस्केडेस्टीसिटी के अधिक गंभीर परिणाम होते हैं | मापदंडों का अधिकतम संभावना अनुमान पक्षपाती (अज्ञात दिशा में) होगा, साथ ही असंगत (जब तक कि संभावना कार्य संशोधित न हो) हेटेरोस्केडेस्टीसिटी के स्पष्ट रूप को सही विधि से ध्यान में रखना) [8] [9] जैसा कि विलियम ग्रीन (अर्थशास्त्री) द्वारा इंगित किया गया है "अन्यथा असंगत अनुमानक के लिए केवल एक शक्तिशाली सहप्रसरण मैट्रिक्स की गणना करना इसे मोचन नहीं देता है।" [10]

समाधान

यदि प्रतिगमन त्रुटियां स्वतंत्र हैं, किन्तु उनके अलग-अलग संस्करण हैं | तब जिसका अनुमान लगाया जा सकता है। यह व्हाइट का (1980) अनुमानक प्रदान करता है, जिसे अधिकांशतः एचसीई (हेटेरोस्केडेस्टीसिटी -सुसंगत अनुमानक) के रूप में संदर्भित किया जाता है।

जहां उपरोक्त डेटा से स्टैक्ड मानों के मैट्रिक्स को दर्शाता है। अनुमानक को क्षणों की सामान्यीकृत विधि (जीएमएम) के संदर्भ में प्राप्त किया जा सकता है।

इसके अतिरिक्त साहित्य में अधिकांशतः चर्चा की जाती है (व्हाइट के पेपर सहित) का सहप्रसरण मैट्रिक्स संगत सीमित वितरण है।

जहाँ

और

इस प्रकार,

और

स्पष्ट रूप से कौन सा सहप्रसरण मैट्रिक्स चिंता का विषय है, यह संदर्भ का विषय है।

मैकिनॉन एंड व्हाइट (1985) में वैकल्पिक अनुमानक प्रस्तावित किए गए हैं | जो विभिन्न उत्तोलन (सांख्यिकी) के कारण प्रतिगमन अवशिष्टों के असमान प्रसरणों के लिए सही हैं।[11] स्पर्शोन्मुख व्हाइट के अनुमानक के विपरीत, उनके अनुमानक निष्पक्ष होते हैं जब डेटा समरूपतावादी होते हैं।

व्यापक रूप से उपलब्ध चार अलग-अलग विकल्पों में से, जिन्हें अधिकांशतः HC0-HC3 के रूप में दर्शाया जाता है। HC3 विनिर्देश सबसे अच्छा काम करता प्रतीत होता है। अनुमानक HC3 पर निर्भर परीक्षणों में उत्तम शक्ति और लक्षित सांख्यिकीय परिकल्पना परीक्षण शब्दों की परिभाषा, विशेष रूप से छोटे में प्रतिरूप जितना बड़ा होगा, विभिन्न आकलनकर्ताओं के बीच का अंतर उतना ही कम होता है।[12]

हेटेरोस्केडेस्टीसिटी को स्पष्ट रूप से मॉडलिंग करने का एक विकल्प रीसैंपलिंग (सांख्यिकी) जैसे बूटस्ट्रैपिंग (सांख्यिकी) वाइल्ड बूटस्ट्रैप का उपयोग कर रहा है। यह देखते हुए कि बूटस्ट्रैप विश्वास अंतराल के लिए बूटस्ट्रैपिंग (सांख्यिकी) विधियाँ, जो अपनी मानक त्रुटि द्वारा पुनर्नमूना आँकड़ों को मानकीकृत करती है, एक स्पर्शोन्मुख शोधन प्राप्त करती है।[13] हेटेरोस्केडेस्टीसिटी -शक्तिशाली मानक त्रुटियाँ फिर भी उपयोगी हैं।

हेटेरोस्केडैस्टिक त्रुटियों के लिए लेखांकन के अतिरिक्त, अधिकांश रेखीय मॉडल को होमोस्केडैस्टिक त्रुटि नियमो में परिवर्तित किया जा सकता है (जब तक कि निर्माण द्वारा त्रुटि शब्द हेटेरोस्केडैस्टिक न हो, उदाहरण के लिए एक रैखिक संभावना मॉडल में)। ऐसा करने का एक विधि भारित कम से कम वर्गों का उपयोग करना है, जिसमें उत्तम दक्षता गुण भी सम्मिलित हैं।

यह भी देखें

सॉफ्टवेयर

  • ईव्यूज़: ईव्यूज़ संस्करण 8 शक्तिशाली कम से कम वर्गों के लिए तीन अलग-अलग विधियों की प्रस्तुति करता है: एम-अनुमान (ह्यूबर, 1973), एस-अनुमान (रूसीव और योहाई, 1984), और एमएम-अनुमान (योहाई 1987)।[14]
  • जूलिया (प्रोग्रामिंग भाषा): द CovarianceMatrices पैकेज हेटेरोस्केडैस्टिक शक्तिशाली वैरियंस कोवैरियंस मैट्रिसेस के लिए कई विधि प्रदान करता है।[15] * मैटलैब: देखें hac इकोनोमेट्रिक्स टूलबॉक्स में कार्य करता है।[16]
  • पायथन (प्रोग्रामिंग भाषा): स्टैट्समॉडल्स पैकेज विभिन्न शक्तिशाली मानक त्रुटि अनुमान प्रदान करता है, देखें statsmodels.regression.linear_model.RegressionResults आगे के विवरण के लिए
  • आर (प्रोग्रामिंग भाषा): द vcovHC() से आदेश sandwich पैकेट।[17][18]
  • रेट्स (सांख्यिकीय पैकेज): robusterrors विकल्प कई प्रतिगमन और अनुकूलन आदेशों में उपलब्ध है (linreg, nlls, वगैरह।)।
  • स्टाटा robust विकल्प कई छद्म-संभावना आधारित प्रक्रियाओं में प्रयुक्त होता है।[19]
  • ग्रेटल: विकल्प --robust कई अनुमान आदेशों के लिए (जैसे ols) क्रॉस-सेक्शनल डेटासेट के संदर्भ में शक्तिशाली मानक त्रुटियां उत्पन्न करता है।[20]

संदर्भ

  1. Kleiber, C.; Zeileis, A. (2006). "आर के साथ एप्लाइड अर्थमिति" (PDF). UseR-2006 conference. Archived from the original (PDF) on April 22, 2007.
  2. Eicker, Friedhelm (1967). "Limit Theorems for Regression with Unequal and Dependent Errors". गणितीय सांख्यिकी और संभाव्यता पर पांचवें बर्कले संगोष्ठी की कार्यवाही. Vol. 5. pp. 59–82. MR 0214223. Zbl 0217.51201.
  3. Huber, Peter J. (1967). "The behavior of maximum likelihood estimates under nonstandard conditions". गणितीय सांख्यिकी और संभाव्यता पर पांचवें बर्कले संगोष्ठी की कार्यवाही. Vol. 5. pp. 221–233. MR 0216620. Zbl 0212.21504.
  4. White, Halbert (1980). "एक विषमलैंगिकता-संगत सहप्रसरण मैट्रिक्स अनुमानक और विषमलैंगिकता के लिए एक प्रत्यक्ष परीक्षण". Econometrica. 48 (4): 817–838. CiteSeerX 10.1.1.11.7646. doi:10.2307/1912934. JSTOR 1912934. MR 0575027.
  5. King, Gary; Roberts, Margaret E. (2015). "मजबूत मानक त्रुटियाँ पद्धति संबंधी समस्याओं को कैसे प्रकट करती हैं जिन्हें वे ठीक नहीं कर सकते हैं, और इसके बारे में क्या करना है". Political Analysis (in English). 23 (2): 159–179. doi:10.1093/pan/mpu015. ISSN 1047-1987.
  6. Eicker, F. (1963). "रैखिक प्रतिगमन के परिवारों के लिए स्पर्शोन्मुख सामान्यता और कम से कम वर्गों की संगति". The Annals of Mathematical Statistics. 34 (2): 447–456. doi:10.1214/aoms/1177704156.
  7. Eicker, Friedhelm (January 1967). "असमान और निर्भर त्रुटियों के साथ प्रतिगमन के लिए सीमा प्रमेय". Proceedings of the Fifth Berkeley Symposium on Mathematical Statistics and Probability, Volume 1: Statistics. 5 (1): 59–83.
  8. Giles, Dave (May 8, 2013). "अरैखिक मॉडल के लिए मजबूत मानक त्रुटियां". Econometrics Beat.
  9. Guggisberg, Michael (2019). "गलत निर्दिष्ट असतत विकल्प मॉडल और ह्यूबर-व्हाइट मानक त्रुटियाँ". Journal of Econometric Methods. 8 (1). doi:10.1515/jem-2016-0002.
  10. Greene, William H. (2012). अर्थमितीय विश्लेषण (Seventh ed.). Boston: Pearson Education. pp. 692–693. ISBN 978-0-273-75356-8.
  11. MacKinnon, James G.; White, Halbert (1985). "बेहतर परिमित नमूना गुणों के साथ कुछ हेटेरोस्केडैस्टिक-कंसिस्टेंट कोवैरियंस मैट्रिक्स एस्टिमेटर्स". Journal of Econometrics. 29 (3): 305–325. doi:10.1016/0304-4076(85)90158-7. hdl:10419/189084.
  12. Long, J. Scott; Ervin, Laurie H. (2000). "रैखिक प्रतिगमन मॉडल में हेटेरोसेडेसिटी संगत मानक त्रुटियों का उपयोग करना". The American Statistician. 54 (3): 217–224. doi:10.2307/2685594. ISSN 0003-1305.
  13. C., Davison, Anthony (2010). बूटस्ट्रैप विधियाँ और उनका अनुप्रयोग. Cambridge Univ. Press. ISBN 978-0-521-57391-7. OCLC 740960962.{{cite book}}: CS1 maint: multiple names: authors list (link)
  14. "EViews 8 Robust Regression".
  15. CovarianceMatrices: Robust Covariance Matrix Estimators
  16. "विषमलैंगिकता और स्वसहसंबंध सुसंगत सहप्रसरण अनुमानक". Econometrics Toolbox.
  17. sandwich: Robust Covariance Matrix Estimators
  18. Kleiber, Christian; Zeileis, Achim (2008). आर के साथ एप्लाइड अर्थमिति. New York: Springer. pp. 106–110. ISBN 978-0-387-77316-2.
  19. See online help for _robust option and regress command.
  20. "मजबूत सहप्रसरण मैट्रिक्स अनुमान" (PDF). Gretl User's Guide, chapter 19.

अग्रिम पठन