हेटेरोस्केडेस्टीसिटी -संगत मानक त्रुटियाँ: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 3: Line 3:




प्रतिगमन और समय-श्रृंखला मॉडलिंग में, मॉडल के मूल रूप इस धारणा का उपयोग करते हैं कि सभी अवलोकन बिंदुओं में त्रुटियां या अस्तव्यस्तता u<sub>''i''</sub>  समान भिन्नता है। जब ऐसा नहीं होता है, तो त्रुटियों को विषमलैंगिक कहा जाता है, या [[विषमलैंगिकता]] होती है, और यह व्यवहार अवशिष्टों में परिलक्षित होगा <math dispaly="inline">\widehat{u}_i </math> एक फिटेड मॉडल से अनुमान लगाया गया है। विषमलैंगिकता-संगत मानक त्रुटियों का उपयोग उस मॉडल की फिटिंग की अनुमति देने के लिए किया जाता है | जिसमें विषमलैंगिक अवशेष होते हैं। इस तरह का पहला दृष्टिकोण ह्यूबर (1967) द्वारा प्रस्तावित किया गया था, और क्रॉस-सेक्शनल डेटा, [[ समय श्रृंखला |समय श्रृंखला]] डेटा और [[GARCH|गर्च]] के बाद से और उत्तम प्रक्रियाओं का उत्पादन किया गया है।


प्रतिगमन और समय-श्रृंखला मॉडलिंग में, मॉडल के मूल रूप इस धारणा का उपयोग करते हैं कि सभी अवलोकन बिंदुओं में त्रुटियां या अस्तव्यस्तता u<sub>''i''</sub> समान भिन्नता है। जब ऐसा नहीं होता है, तो त्रुटियों को विषमलैंगिक कहा जाता है, या [[विषमलैंगिकता]] होती है, और यह व्यवहार अवशिष्टों में परिलक्षित होगा <math dispaly="inline">\widehat{u}_i </math> एक फिटेड मॉडल से अनुमान लगाया गया है। विषमलैंगिकता-संगत मानक त्रुटियों का उपयोग उस मॉडल की फिटिंग की अनुमति देने के लिए किया जाता है। जिसमें विषमलैंगिक अवशेष होते हैं। इस तरह का पहला दृष्टिकोण ह्यूबर (1967) द्वारा प्रस्तावित किया गया था, और क्रॉस-सेक्शनल डेटा, [[ समय श्रृंखला |समय श्रृंखला]] डेटा और [[GARCH|गर्च]] के बाद से और उत्तम प्रक्रियाओं का उत्पादन किया गया है।


विषमलैंगिकता-संगत मानक त्रुटियाँ जो मौलिक मानक त्रुटियों से भिन्न होती हैं | मॉडल के गलत विवरण का संकेत दे सकती हैं। विषमलैंगिकता-संगत मानक त्रुटियों को प्रतिस्थापित करने से यह गलत विशिष्टता हल नहीं होती है | जिससे गुणांक में पूर्वाग्रह हो सकता है। अधिकतर स्थितियों में, समस्या को खोजना और सही करना चाहिए।<ref>{{Cite journal|last1=King|first1=Gary|last2=Roberts|first2=Margaret E.|date=2015|title=मजबूत मानक त्रुटियाँ पद्धति संबंधी समस्याओं को कैसे प्रकट करती हैं जिन्हें वे ठीक नहीं कर सकते हैं, और इसके बारे में क्या करना है|url=https://www.cambridge.org/core/product/identifier/S1047198700011670/type/journal_article|journal=Political Analysis|language=en|volume=23|issue=2|pages=159–179|doi=10.1093/pan/mpu015|issn=1047-1987}}</ref> अन्य प्रकार के मानक त्रुटि समायोजन, जैसे संकुलित मानक त्रुटियाँ या नेवी-वेस्ट एस्टिमेटर, को एचसी मानक त्रुटियों के विस्तार के रूप में माना जा सकता है।
विषमलैंगिकता-संगत मानक त्रुटियाँ जो मौलिक मानक त्रुटियों से भिन्न होती हैं | मॉडल के गलत विवरण का संकेत दे सकती हैं। विषमलैंगिकता-संगत मानक त्रुटियों को प्रतिस्थापित करने से यह गलत विशिष्टता हल नहीं होती है। जिससे गुणांक में पूर्वाग्रह हो सकता है। अधिकतर स्थितियों में, समस्या को खोजना और सही करना चाहिए।<ref>{{Cite journal|last1=King|first1=Gary|last2=Roberts|first2=Margaret E.|date=2015|title=मजबूत मानक त्रुटियाँ पद्धति संबंधी समस्याओं को कैसे प्रकट करती हैं जिन्हें वे ठीक नहीं कर सकते हैं, और इसके बारे में क्या करना है|url=https://www.cambridge.org/core/product/identifier/S1047198700011670/type/journal_article|journal=Political Analysis|language=en|volume=23|issue=2|pages=159–179|doi=10.1093/pan/mpu015|issn=1047-1987}}</ref> अन्य प्रकार के मानक त्रुटि समायोजन, जैसे संकुलित मानक त्रुटियाँ या नेवी-वेस्ट एस्टिमेटर, को एचसी मानक त्रुटियों के विस्तार के रूप में माना जा सकता है।


== इतिहास ==
== इतिहास ==
Line 12: Line 12:


== समस्या ==
== समस्या ==
स्केलर <math>y</math> के लिए रेखीय प्रतिगमन मॉडल पर विचार करें |
स्केलर <math>y</math> के लिए रेखीय प्रतिगमन मॉडल पर विचार करें।


: <math>
: <math>
y = \mathbf{x}^{\top} \boldsymbol{\beta} + \varepsilon, \,
y = \mathbf{x}^{\top} \boldsymbol{\beta} + \varepsilon, \,
</math>
</math>
जहाँ <math>\mathbf{x}</math> व्याख्यात्मक चरों (विशेषताओं) का एक k x 1 स्तंभ सदिश है <math>\boldsymbol{\beta}</math> अनुमानित किए जाने वाले मापदंडों का एक k × 1 स्तंभ सदिश है और <math>\varepsilon</math> [[त्रुटियां और अवशेष]] है। सामान्य न्यूनतम वर्ग (ओएलएस) ) अनुमानक है |
जहाँ <math>\mathbf{x}</math> व्याख्यात्मक चरों (विशेषताओं) का एक k x 1 स्तंभ सदिश है <math>\boldsymbol{\beta}</math> अनुमानित किए जाने वाले मापदंडों का एक k × 1 स्तंभ सदिश है और <math>\varepsilon</math> [[त्रुटियां और अवशेष]] है। सामान्य न्यूनतम वर्ग (ओएलएस) ) अनुमानक है।


: <math>
: <math>
Line 24: Line 24:
जहाँ <math>\mathbf{y}</math> प्रेक्षणों <math>y_i</math> का सदिश है, और <math>\mathbf{X}</math> डेटा में देखे गए <math>\mathbf{x}_i</math> मानों के ढेर के मैट्रिक्स को दर्शाता है।
जहाँ <math>\mathbf{y}</math> प्रेक्षणों <math>y_i</math> का सदिश है, और <math>\mathbf{X}</math> डेटा में देखे गए <math>\mathbf{x}_i</math> मानों के ढेर के मैट्रिक्स को दर्शाता है।


यदि आँकड़ों में त्रुटियाँ समान भिन्नता <math>\sigma^2</math> है और असहसंबद्ध हैं तो <math>\boldsymbol{\beta}</math> का न्यूनतम-वर्ग अनुमान [[BLUE|ब्लू]] (सर्वश्रेष्ठ रैखिक निष्पक्ष अनुमानक) है और इसके भिन्नता का अनुमान लगाया गया है |
यदि आँकड़ों में त्रुटियाँ समान भिन्नता <math>\sigma^2</math> है और असहसंबद्ध हैं तो <math>\boldsymbol{\beta}</math> का न्यूनतम-वर्ग अनुमान [[BLUE|ब्लू]] (सर्वश्रेष्ठ रैखिक निष्पक्ष अनुमानक) है और इसके भिन्नता का अनुमान लगाया गया है।


: <math>\hat{\mathbb{V}}\left[\widehat\boldsymbol\beta_\mathrm{OLS}\right] = s^2 (\mathbf{X}^{\top}\mathbf{X})^{-1}, \quad s^2 = \frac{\sum_i \widehat \varepsilon_i^2}{n-k} </math>
: <math>\hat{\mathbb{V}}\left[\widehat\boldsymbol\beta_\mathrm{OLS}\right] = s^2 (\mathbf{X}^{\top}\mathbf{X})^{-1}, \quad s^2 = \frac{\sum_i \widehat \varepsilon_i^2}{n-k} </math>
जहाँ <math>\widehat \varepsilon_i = y_i - \mathbf{x}_i^{\top} \widehat \boldsymbol{\beta}_\mathrm{OLS}</math> प्रतिगमन अवशेष हैं।
जहाँ <math>\widehat \varepsilon_i = y_i - \mathbf{x}_i^{\top} \widehat \boldsymbol{\beta}_\mathrm{OLS}</math> प्रतिगमन अवशेष हैं।


जब त्रुटि नियमो में निरंतर भिन्नता नहीं होती है (अर्थात,<math> \mathbb{E}[\mathbf{u}\mathbf{u}^{\top}] = \sigma^2 \mathbf{I}_n</math> की धारणा असत्य है), तो ओएलएस अनुमानक अपने वांछित गुणों को खो देता है। विचरण के सूत्र को अब सरल नहीं किया जा सकता है:
जब त्रुटि नियमो में निरंतर भिन्नता नहीं होती है (अर्थात,<math> \mathbb{E}[\mathbf{u}\mathbf{u}^{\top}] = \sigma^2 \mathbf{I}_n</math> की धारणा असत्य है), तो ओएलएस अनुमानक अपने वांछित गुणों को खो देता है। विचरण के सूत्र को अब सरल नहीं किया जा सकता है।


: <math> \mathbb{V}\left[\widehat\boldsymbol\beta_\mathrm{OLS}\right] = \mathbb{V}\big[ (\mathbf{X}^{\top}\mathbf{X})^{-1} \mathbf{X}^{\top}\mathbf{y} \big] = (\mathbf{X}^{\top}\mathbf{X})^{-1} \mathbf{X}^{\top} \mathbf{\Sigma} \mathbf{X} (\mathbf{X}^{\top}\mathbf{X})^{-1}</math>
: <math> \mathbb{V}\left[\widehat\boldsymbol\beta_\mathrm{OLS}\right] = \mathbb{V}\big[ (\mathbf{X}^{\top}\mathbf{X})^{-1} \mathbf{X}^{\top}\mathbf{y} \big] = (\mathbf{X}^{\top}\mathbf{X})^{-1} \mathbf{X}^{\top} \mathbf{\Sigma} \mathbf{X} (\mathbf{X}^{\top}\mathbf{X})^{-1}</math>
जहां <math> \mathbf{\Sigma} = \mathbb{V}[\mathbf{u}].</math> जबकि ओएलएस बिंदु अनुमानक निष्पक्ष रहता है, यह न्यूनतम औसत वर्ग त्रुटि और ओएलएस भिन्नता अनुमानक होने के अर्थ में "सर्वश्रेष्ठ" नहीं है | <math>\hat{\mathbb{V}} \left[ \widehat \boldsymbol{\beta}_\mathrm{OLS} \right]</math> ओएलएस अनुमानों के विचरण का एक सुसंगत अनुमान प्रदान नहीं करता है।
जहां <math> \mathbf{\Sigma} = \mathbb{V}[\mathbf{u}].</math> जबकि ओएलएस बिंदु अनुमानक निष्पक्ष रहता है, यह न्यूनतम औसत वर्ग त्रुटि और ओएलएस भिन्नता अनुमानक होने के अर्थ में "सर्वश्रेष्ठ" नहीं है। <math>\hat{\mathbb{V}} \left[ \widehat \boldsymbol{\beta}_\mathrm{OLS} \right]</math> ओएलएस अनुमानों के विचरण का एक सुसंगत अनुमान प्रदान नहीं करता है।


किसी भी गैर-रैखिक मॉडल (उदाहरण के लिए [[ logit |लॉगिट]] और [[ probit | प्रोबिट]] मॉडल) के लिए, चूँकि विषमलैंगिकता के अधिक गंभीर परिणाम होते हैं | मापदंडों का [[अधिकतम संभावना अनुमान]] पक्षपाती (अज्ञात दिशा में) होगा, साथ ही असंगत (जब तक कि संभावना कार्य संशोधित न हो) विषमलैंगिकता के स्पष्ट रूप को सही विधि से ध्यान में रखना) <ref>{{cite web |first=Dave |last=Giles |title=अरैखिक मॉडल के लिए मजबूत मानक त्रुटियां|work=Econometrics Beat |date=May 8, 2013 |url=http://davegiles.blogspot.com/2013/05/robust-standard-errors-for-nonlinear.html }}</ref> <ref>{{cite journal |first=Michael |last=Guggisberg |title=गलत निर्दिष्ट असतत विकल्प मॉडल और ह्यूबर-व्हाइट मानक त्रुटियाँ|journal=[[Journal of Econometric Methods]] |year=2019 |volume=8 |issue=1 |doi=10.1515/jem-2016-0002 }}</ref> जैसा कि [[विलियम ग्रीन (अर्थशास्त्री)]] द्वारा इंगित किया गया है "अन्यथा असंगत अनुमानक के लिए केवल एक शक्तिशाली सहप्रसरण मैट्रिक्स की गणना करना इसे मोचन नहीं देता है।" <ref>{{cite book |last=Greene |first=William H. |author-link=William Greene (economist) |title=अर्थमितीय विश्लेषण|edition=Seventh |location=Boston |publisher=Pearson Education |year=2012 |isbn=978-0-273-75356-8 |pages=692–693 }}</ref>
किसी भी गैर-रैखिक मॉडल (उदाहरण के लिए [[ logit |लॉगिट]] और [[ probit |प्रोबिट]] मॉडल) के लिए, चूँकि विषमलैंगिकता के अधिक गंभीर परिणाम होते हैं | मापदंडों का [[अधिकतम संभावना अनुमान]] पक्षपाती (अज्ञात दिशा में) होगा, साथ ही असंगत (जब तक कि संभावना कार्य संशोधित न हो) विषमलैंगिकता के स्पष्ट रूप को सही विधि से ध्यान में रखना) <ref>{{cite web |first=Dave |last=Giles |title=अरैखिक मॉडल के लिए मजबूत मानक त्रुटियां|work=Econometrics Beat |date=May 8, 2013 |url=http://davegiles.blogspot.com/2013/05/robust-standard-errors-for-nonlinear.html }}</ref> <ref>{{cite journal |first=Michael |last=Guggisberg |title=गलत निर्दिष्ट असतत विकल्प मॉडल और ह्यूबर-व्हाइट मानक त्रुटियाँ|journal=[[Journal of Econometric Methods]] |year=2019 |volume=8 |issue=1 |doi=10.1515/jem-2016-0002 }}</ref> जैसा कि [[विलियम ग्रीन (अर्थशास्त्री)]] द्वारा इंगित किया गया है "अन्यथा असंगत अनुमानक के लिए केवल एक शक्तिशाली सहप्रसरण मैट्रिक्स की गणना करना इसे मोचन नहीं देता है।" <ref>{{cite book |last=Greene |first=William H. |author-link=William Greene (economist) |title=अर्थमितीय विश्लेषण|edition=Seventh |location=Boston |publisher=Pearson Education |year=2012 |isbn=978-0-273-75356-8 |pages=692–693 }}</ref>
== समाधान ==
== समाधान ==


यदि प्रतिगमन त्रुटियां <math>\varepsilon_i</math> स्वतंत्र हैं, किन्तु उनके अलग-अलग <math>\sigma^2_i</math> संस्करण हैं | तब <math>\mathbf{\Sigma} = \operatorname{diag}(\sigma_1^2, \ldots, \sigma_n^2)</math> जिसका अनुमान <math>\widehat\sigma_i^2 = \widehat \varepsilon_i^2</math> लगाया जा सकता है | यह व्हाइट का (1980) अनुमानक प्रदान करता है, जिसे अधिकांशतः एचसीई (विषमलैंगिकता-सुसंगत अनुमानक) के रूप में संदर्भित किया जाता है |
यदि प्रतिगमन त्रुटियां <math>\varepsilon_i</math> स्वतंत्र हैं, किन्तु उनके अलग-अलग <math>\sigma^2_i</math> संस्करण हैं | तब <math>\mathbf{\Sigma} = \operatorname{diag}(\sigma_1^2, \ldots, \sigma_n^2)</math> जिसका अनुमान <math>\widehat\sigma_i^2 = \widehat \varepsilon_i^2</math> लगाया जा सकता है। यह व्हाइट का (1980) अनुमानक प्रदान करता है, जिसे अधिकांशतः एचसीई (विषमलैंगिकता-सुसंगत अनुमानक) के रूप में संदर्भित किया जाता है।


: <math>
: <math>
Line 47: Line 47:
जहां उपरोक्त <math>\mathbf{X}</math> डेटा से स्टैक्ड <math>\mathbf{x}_i^{\top}</math> मानों के मैट्रिक्स को दर्शाता है। अनुमानक को [[क्षणों की सामान्यीकृत विधि]] (जीएमएम) के संदर्भ में प्राप्त किया जा सकता है।
जहां उपरोक्त <math>\mathbf{X}</math> डेटा से स्टैक्ड <math>\mathbf{x}_i^{\top}</math> मानों के मैट्रिक्स को दर्शाता है। अनुमानक को [[क्षणों की सामान्यीकृत विधि]] (जीएमएम) के संदर्भ में प्राप्त किया जा सकता है।


इसके अतिरिक्त साहित्य में अधिकांशतः चर्चा की जाती है (व्हाइट के पेपर सहित) <math>\widehat\mathbf{\Omega}_n</math> का सहप्रसरण मैट्रिक्स <math>\sqrt{n}</math> संगत सीमित वितरण है |
इसके अतिरिक्त साहित्य में अधिकांशतः चर्चा की जाती है (व्हाइट के पेपर सहित) <math>\widehat\mathbf{\Omega}_n</math> का सहप्रसरण मैट्रिक्स <math>\sqrt{n}</math> संगत सीमित वितरण है।


: <math>
: <math>
Line 79: Line 79:
मैकिनॉन एंड व्हाइट (1985) में वैकल्पिक अनुमानक प्रस्तावित किए गए हैं | जो विभिन्न [[उत्तोलन (सांख्यिकी)]] के कारण प्रतिगमन अवशिष्टों के असमान प्रसरणों के लिए सही हैं।<ref>{{Cite journal |last1=MacKinnon |first1=James G. |author-link=James G. MacKinnon |last2=White |first2=Halbert |author2-link=Halbert White |title=बेहतर परिमित नमूना गुणों के साथ कुछ हेटेरोस्केडैस्टिक-कंसिस्टेंट कोवैरियंस मैट्रिक्स एस्टिमेटर्स|journal=[[Journal of Econometrics]] |volume=29 |issue=3 |pages=305–325 |year=1985 |doi=10.1016/0304-4076(85)90158-7 |hdl=10419/189084 |hdl-access=free }}</ref> स्पर्शोन्मुख व्हाइट के अनुमानक के विपरीत, उनके अनुमानक निष्पक्ष होते हैं जब डेटा समरूपतावादी होते हैं।
मैकिनॉन एंड व्हाइट (1985) में वैकल्पिक अनुमानक प्रस्तावित किए गए हैं | जो विभिन्न [[उत्तोलन (सांख्यिकी)]] के कारण प्रतिगमन अवशिष्टों के असमान प्रसरणों के लिए सही हैं।<ref>{{Cite journal |last1=MacKinnon |first1=James G. |author-link=James G. MacKinnon |last2=White |first2=Halbert |author2-link=Halbert White |title=बेहतर परिमित नमूना गुणों के साथ कुछ हेटेरोस्केडैस्टिक-कंसिस्टेंट कोवैरियंस मैट्रिक्स एस्टिमेटर्स|journal=[[Journal of Econometrics]] |volume=29 |issue=3 |pages=305–325 |year=1985 |doi=10.1016/0304-4076(85)90158-7 |hdl=10419/189084 |hdl-access=free }}</ref> स्पर्शोन्मुख व्हाइट के अनुमानक के विपरीत, उनके अनुमानक निष्पक्ष होते हैं जब डेटा समरूपतावादी होते हैं।


व्यापक रूप से उपलब्ध चार अलग-अलग विकल्पों में से, जिन्हें अधिकांशतः HC0-HC3 के रूप में दर्शाया जाता है | HC3 विनिर्देश सबसे अच्छा काम करता प्रतीत होता है | अनुमानक HC3 पर निर्भर परीक्षणों में उत्तम शक्ति और लक्षित सांख्यिकीय परिकल्पना परीक्षण शब्दों की परिभाषा, विशेष रूप से छोटे में प्रतिरूप जितना बड़ा होगा, विभिन्न आकलनकर्ताओं के बीच का अंतर उतना ही कम होता है।<ref>{{Cite journal |last=Long |first=J. Scott |last2=Ervin |first2=Laurie H. |date=2000 |title=रैखिक प्रतिगमन मॉडल में हेटेरोसेडेसिटी संगत मानक त्रुटियों का उपयोग करना|url=https://www.jstor.org/stable/2685594 |journal=The American Statistician |volume=54 |issue=3 |pages=217–224 |doi=10.2307/2685594 |issn=0003-1305}}</ref>
व्यापक रूप से उपलब्ध चार अलग-अलग विकल्पों में से, जिन्हें अधिकांशतः HC0-HC3 के रूप में दर्शाया जाता है। HC3 विनिर्देश सबसे अच्छा काम करता प्रतीत होता है। अनुमानक HC3 पर निर्भर परीक्षणों में उत्तम शक्ति और लक्षित सांख्यिकीय परिकल्पना परीक्षण शब्दों की परिभाषा, विशेष रूप से छोटे में प्रतिरूप जितना बड़ा होगा, विभिन्न आकलनकर्ताओं के बीच का अंतर उतना ही कम होता है।<ref>{{Cite journal |last=Long |first=J. Scott |last2=Ervin |first2=Laurie H. |date=2000 |title=रैखिक प्रतिगमन मॉडल में हेटेरोसेडेसिटी संगत मानक त्रुटियों का उपयोग करना|url=https://www.jstor.org/stable/2685594 |journal=The American Statistician |volume=54 |issue=3 |pages=217–224 |doi=10.2307/2685594 |issn=0003-1305}}</ref>


विषमलैंगिकता को स्पष्ट रूप से मॉडलिंग करने का एक विकल्प रीसैंपलिंग (सांख्यिकी) जैसे बूटस्ट्रैपिंग (सांख्यिकी) वाइल्ड बूटस्ट्रैप का उपयोग कर रहा है। यह देखते हुए कि बूटस्ट्रैप विश्वास अंतराल के लिए बूटस्ट्रैपिंग (सांख्यिकी) विधियाँ, जो अपनी मानक त्रुटि द्वारा पुनर्नमूना आँकड़ों को मानकीकृत करती है, एक स्पर्शोन्मुख शोधन प्राप्त करती है |<ref>{{Cite book |last=C. |first=Davison, Anthony |url=http://worldcat.org/oclc/740960962 |title=बूटस्ट्रैप विधियाँ और उनका अनुप्रयोग|date=2010 |publisher=Cambridge Univ. Press |isbn=978-0-521-57391-7 |oclc=740960962}}</ref> विषमलैंगिकता-शक्तिशाली मानक त्रुटियाँ फिर भी उपयोगी हैं।
विषमलैंगिकता को स्पष्ट रूप से मॉडलिंग करने का एक विकल्प रीसैंपलिंग (सांख्यिकी) जैसे बूटस्ट्रैपिंग (सांख्यिकी) वाइल्ड बूटस्ट्रैप का उपयोग कर रहा है। यह देखते हुए कि बूटस्ट्रैप विश्वास अंतराल के लिए बूटस्ट्रैपिंग (सांख्यिकी) विधियाँ, जो अपनी मानक त्रुटि द्वारा पुनर्नमूना आँकड़ों को मानकीकृत करती है, एक स्पर्शोन्मुख शोधन प्राप्त करती है।<ref>{{Cite book |last=C. |first=Davison, Anthony |url=http://worldcat.org/oclc/740960962 |title=बूटस्ट्रैप विधियाँ और उनका अनुप्रयोग|date=2010 |publisher=Cambridge Univ. Press |isbn=978-0-521-57391-7 |oclc=740960962}}</ref> विषमलैंगिकता-शक्तिशाली मानक त्रुटियाँ फिर भी उपयोगी हैं।


हेटेरोस्केडैस्टिक त्रुटियों के लिए लेखांकन के अतिरिक्त, अधिकांश रेखीय मॉडल को होमोस्केडैस्टिक त्रुटि नियमो में परिवर्तित किया जा सकता है (जब तक कि निर्माण द्वारा त्रुटि शब्द हेटेरोस्केडैस्टिक न हो, उदाहरण के लिए एक रैखिक संभावना मॉडल में)। ऐसा करने का एक विधि भारित कम से कम वर्गों का उपयोग करना है, जिसमें उत्तम दक्षता गुण भी सम्मिलित हैं।
हेटेरोस्केडैस्टिक त्रुटियों के लिए लेखांकन के अतिरिक्त, अधिकांश रेखीय मॉडल को होमोस्केडैस्टिक त्रुटि नियमो में परिवर्तित किया जा सकता है (जब तक कि निर्माण द्वारा त्रुटि शब्द हेटेरोस्केडैस्टिक न हो, उदाहरण के लिए एक रैखिक संभावना मॉडल में)। ऐसा करने का एक विधि भारित कम से कम वर्गों का उपयोग करना है, जिसमें उत्तम दक्षता गुण भी सम्मिलित हैं।

Revision as of 10:21, 10 June 2023

रेखीय प्रतिगमन और समय श्रृंखला विश्लेषण के संदर्भ में सांख्यिकी और अर्थमिति में विषमलैंगिकता-संगत (एचसी) मानक त्रुटियों का विषय उत्पन्न होता है। इन्हें विषमलैंगिकता-शक्तिशाली मानक त्रुटियां (या केवल शक्तिशाली मानक त्रुटियां), ईकर-ह्यूबर-श्वेत मानक त्रुटियां (ह्यूबर-श्वेत मानक त्रुटियां या श्वेत मानक त्रुटियां भी) के रूप में जाना जाता है।[1] फ्रीडेलम इकर के योगदान को पहचानने के लिए,[2] पीटर जे ह्यूबर,[3] और हलबर्ट व्हाइट थे।[4]


प्रतिगमन और समय-श्रृंखला मॉडलिंग में, मॉडल के मूल रूप इस धारणा का उपयोग करते हैं कि सभी अवलोकन बिंदुओं में त्रुटियां या अस्तव्यस्तता ui समान भिन्नता है। जब ऐसा नहीं होता है, तो त्रुटियों को विषमलैंगिक कहा जाता है, या विषमलैंगिकता होती है, और यह व्यवहार अवशिष्टों में परिलक्षित होगा एक फिटेड मॉडल से अनुमान लगाया गया है। विषमलैंगिकता-संगत मानक त्रुटियों का उपयोग उस मॉडल की फिटिंग की अनुमति देने के लिए किया जाता है। जिसमें विषमलैंगिक अवशेष होते हैं। इस तरह का पहला दृष्टिकोण ह्यूबर (1967) द्वारा प्रस्तावित किया गया था, और क्रॉस-सेक्शनल डेटा, समय श्रृंखला डेटा और गर्च के बाद से और उत्तम प्रक्रियाओं का उत्पादन किया गया है।

विषमलैंगिकता-संगत मानक त्रुटियाँ जो मौलिक मानक त्रुटियों से भिन्न होती हैं | मॉडल के गलत विवरण का संकेत दे सकती हैं। विषमलैंगिकता-संगत मानक त्रुटियों को प्रतिस्थापित करने से यह गलत विशिष्टता हल नहीं होती है। जिससे गुणांक में पूर्वाग्रह हो सकता है। अधिकतर स्थितियों में, समस्या को खोजना और सही करना चाहिए।[5] अन्य प्रकार के मानक त्रुटि समायोजन, जैसे संकुलित मानक त्रुटियाँ या नेवी-वेस्ट एस्टिमेटर, को एचसी मानक त्रुटियों के विस्तार के रूप में माना जा सकता है।

इतिहास

फ्रिडेलम इकर द्वारा हेटेरोस्केडैस्टिकिटी-सुसंगत मानक त्रुटियां प्रस्तुत की जाती हैं,[6][7] और हैल्बर्ट व्हाइट द्वारा अर्थमिति में लोकप्रिय किया गया था।

समस्या

स्केलर के लिए रेखीय प्रतिगमन मॉडल पर विचार करें।

जहाँ व्याख्यात्मक चरों (विशेषताओं) का एक k x 1 स्तंभ सदिश है अनुमानित किए जाने वाले मापदंडों का एक k × 1 स्तंभ सदिश है और त्रुटियां और अवशेष है। सामान्य न्यूनतम वर्ग (ओएलएस) ) अनुमानक है।

जहाँ प्रेक्षणों का सदिश है, और डेटा में देखे गए मानों के ढेर के मैट्रिक्स को दर्शाता है।

यदि आँकड़ों में त्रुटियाँ समान भिन्नता है और असहसंबद्ध हैं तो का न्यूनतम-वर्ग अनुमान ब्लू (सर्वश्रेष्ठ रैखिक निष्पक्ष अनुमानक) है और इसके भिन्नता का अनुमान लगाया गया है।

जहाँ प्रतिगमन अवशेष हैं।

जब त्रुटि नियमो में निरंतर भिन्नता नहीं होती है (अर्थात, की धारणा असत्य है), तो ओएलएस अनुमानक अपने वांछित गुणों को खो देता है। विचरण के सूत्र को अब सरल नहीं किया जा सकता है।

जहां जबकि ओएलएस बिंदु अनुमानक निष्पक्ष रहता है, यह न्यूनतम औसत वर्ग त्रुटि और ओएलएस भिन्नता अनुमानक होने के अर्थ में "सर्वश्रेष्ठ" नहीं है। ओएलएस अनुमानों के विचरण का एक सुसंगत अनुमान प्रदान नहीं करता है।

किसी भी गैर-रैखिक मॉडल (उदाहरण के लिए लॉगिट और प्रोबिट मॉडल) के लिए, चूँकि विषमलैंगिकता के अधिक गंभीर परिणाम होते हैं | मापदंडों का अधिकतम संभावना अनुमान पक्षपाती (अज्ञात दिशा में) होगा, साथ ही असंगत (जब तक कि संभावना कार्य संशोधित न हो) विषमलैंगिकता के स्पष्ट रूप को सही विधि से ध्यान में रखना) [8] [9] जैसा कि विलियम ग्रीन (अर्थशास्त्री) द्वारा इंगित किया गया है "अन्यथा असंगत अनुमानक के लिए केवल एक शक्तिशाली सहप्रसरण मैट्रिक्स की गणना करना इसे मोचन नहीं देता है।" [10]

समाधान

यदि प्रतिगमन त्रुटियां स्वतंत्र हैं, किन्तु उनके अलग-अलग संस्करण हैं | तब जिसका अनुमान लगाया जा सकता है। यह व्हाइट का (1980) अनुमानक प्रदान करता है, जिसे अधिकांशतः एचसीई (विषमलैंगिकता-सुसंगत अनुमानक) के रूप में संदर्भित किया जाता है।

जहां उपरोक्त डेटा से स्टैक्ड मानों के मैट्रिक्स को दर्शाता है। अनुमानक को क्षणों की सामान्यीकृत विधि (जीएमएम) के संदर्भ में प्राप्त किया जा सकता है।

इसके अतिरिक्त साहित्य में अधिकांशतः चर्चा की जाती है (व्हाइट के पेपर सहित) का सहप्रसरण मैट्रिक्स संगत सीमित वितरण है।

जहाँ

और

इस प्रकार,

और

स्पष्ट रूप से कौन सा सहप्रसरण मैट्रिक्स चिंता का विषय है, यह संदर्भ का विषय है।

मैकिनॉन एंड व्हाइट (1985) में वैकल्पिक अनुमानक प्रस्तावित किए गए हैं | जो विभिन्न उत्तोलन (सांख्यिकी) के कारण प्रतिगमन अवशिष्टों के असमान प्रसरणों के लिए सही हैं।[11] स्पर्शोन्मुख व्हाइट के अनुमानक के विपरीत, उनके अनुमानक निष्पक्ष होते हैं जब डेटा समरूपतावादी होते हैं।

व्यापक रूप से उपलब्ध चार अलग-अलग विकल्पों में से, जिन्हें अधिकांशतः HC0-HC3 के रूप में दर्शाया जाता है। HC3 विनिर्देश सबसे अच्छा काम करता प्रतीत होता है। अनुमानक HC3 पर निर्भर परीक्षणों में उत्तम शक्ति और लक्षित सांख्यिकीय परिकल्पना परीक्षण शब्दों की परिभाषा, विशेष रूप से छोटे में प्रतिरूप जितना बड़ा होगा, विभिन्न आकलनकर्ताओं के बीच का अंतर उतना ही कम होता है।[12]

विषमलैंगिकता को स्पष्ट रूप से मॉडलिंग करने का एक विकल्प रीसैंपलिंग (सांख्यिकी) जैसे बूटस्ट्रैपिंग (सांख्यिकी) वाइल्ड बूटस्ट्रैप का उपयोग कर रहा है। यह देखते हुए कि बूटस्ट्रैप विश्वास अंतराल के लिए बूटस्ट्रैपिंग (सांख्यिकी) विधियाँ, जो अपनी मानक त्रुटि द्वारा पुनर्नमूना आँकड़ों को मानकीकृत करती है, एक स्पर्शोन्मुख शोधन प्राप्त करती है।[13] विषमलैंगिकता-शक्तिशाली मानक त्रुटियाँ फिर भी उपयोगी हैं।

हेटेरोस्केडैस्टिक त्रुटियों के लिए लेखांकन के अतिरिक्त, अधिकांश रेखीय मॉडल को होमोस्केडैस्टिक त्रुटि नियमो में परिवर्तित किया जा सकता है (जब तक कि निर्माण द्वारा त्रुटि शब्द हेटेरोस्केडैस्टिक न हो, उदाहरण के लिए एक रैखिक संभावना मॉडल में)। ऐसा करने का एक विधि भारित कम से कम वर्गों का उपयोग करना है, जिसमें उत्तम दक्षता गुण भी सम्मिलित हैं।

यह भी देखें

सॉफ्टवेयर

  • ईव्यूज़: ईव्यूज़ संस्करण 8 शक्तिशाली कम से कम वर्गों के लिए तीन अलग-अलग विधियों की प्रस्तुति करता है: एम-अनुमान (ह्यूबर, 1973), एस-अनुमान (रूसीव और योहाई, 1984), और एमएम-अनुमान (योहाई 1987)।[14]
  • जूलिया (प्रोग्रामिंग भाषा): द CovarianceMatrices पैकेज हेटेरोस्केडैस्टिक शक्तिशाली वैरियंस कोवैरियंस मैट्रिसेस के लिए कई विधि प्रदान करता है।[15] * मैटलैब: देखें hac इकोनोमेट्रिक्स टूलबॉक्स में कार्य करता है।[16]
  • पायथन (प्रोग्रामिंग भाषा): स्टैट्समॉडल्स पैकेज विभिन्न शक्तिशाली मानक त्रुटि अनुमान प्रदान करता है, देखें statsmodels.regression.linear_model.RegressionResults आगे के विवरण के लिए
  • आर (प्रोग्रामिंग भाषा): द vcovHC() से आदेश sandwich पैकेट।[17][18]
  • रेट्स (सांख्यिकीय पैकेज): robusterrors विकल्प कई प्रतिगमन और अनुकूलन आदेशों में उपलब्ध है (linreg, nlls, वगैरह।)।
  • स्टाटा robust विकल्प कई छद्म-संभावना आधारित प्रक्रियाओं में प्रयुक्त होता है।[19]
  • ग्रेटल: विकल्प --robust कई अनुमान आदेशों के लिए (जैसे ols) क्रॉस-सेक्शनल डेटासेट के संदर्भ में शक्तिशाली मानक त्रुटियां उत्पन्न करता है।[20]


संदर्भ

  1. Kleiber, C.; Zeileis, A. (2006). "आर के साथ एप्लाइड अर्थमिति" (PDF). UseR-2006 conference. Archived from the original (PDF) on April 22, 2007.
  2. Eicker, Friedhelm (1967). "Limit Theorems for Regression with Unequal and Dependent Errors". गणितीय सांख्यिकी और संभाव्यता पर पांचवें बर्कले संगोष्ठी की कार्यवाही. Vol. 5. pp. 59–82. MR 0214223. Zbl 0217.51201.
  3. Huber, Peter J. (1967). "The behavior of maximum likelihood estimates under nonstandard conditions". गणितीय सांख्यिकी और संभाव्यता पर पांचवें बर्कले संगोष्ठी की कार्यवाही. Vol. 5. pp. 221–233. MR 0216620. Zbl 0212.21504.
  4. White, Halbert (1980). "एक विषमलैंगिकता-संगत सहप्रसरण मैट्रिक्स अनुमानक और विषमलैंगिकता के लिए एक प्रत्यक्ष परीक्षण". Econometrica. 48 (4): 817–838. CiteSeerX 10.1.1.11.7646. doi:10.2307/1912934. JSTOR 1912934. MR 0575027.
  5. King, Gary; Roberts, Margaret E. (2015). "मजबूत मानक त्रुटियाँ पद्धति संबंधी समस्याओं को कैसे प्रकट करती हैं जिन्हें वे ठीक नहीं कर सकते हैं, और इसके बारे में क्या करना है". Political Analysis (in English). 23 (2): 159–179. doi:10.1093/pan/mpu015. ISSN 1047-1987.
  6. Eicker, F. (1963). "रैखिक प्रतिगमन के परिवारों के लिए स्पर्शोन्मुख सामान्यता और कम से कम वर्गों की संगति". The Annals of Mathematical Statistics. 34 (2): 447–456. doi:10.1214/aoms/1177704156.
  7. Eicker, Friedhelm (January 1967). "असमान और निर्भर त्रुटियों के साथ प्रतिगमन के लिए सीमा प्रमेय". Proceedings of the Fifth Berkeley Symposium on Mathematical Statistics and Probability, Volume 1: Statistics. 5 (1): 59–83.
  8. Giles, Dave (May 8, 2013). "अरैखिक मॉडल के लिए मजबूत मानक त्रुटियां". Econometrics Beat.
  9. Guggisberg, Michael (2019). "गलत निर्दिष्ट असतत विकल्प मॉडल और ह्यूबर-व्हाइट मानक त्रुटियाँ". Journal of Econometric Methods. 8 (1). doi:10.1515/jem-2016-0002.
  10. Greene, William H. (2012). अर्थमितीय विश्लेषण (Seventh ed.). Boston: Pearson Education. pp. 692–693. ISBN 978-0-273-75356-8.
  11. MacKinnon, James G.; White, Halbert (1985). "बेहतर परिमित नमूना गुणों के साथ कुछ हेटेरोस्केडैस्टिक-कंसिस्टेंट कोवैरियंस मैट्रिक्स एस्टिमेटर्स". Journal of Econometrics. 29 (3): 305–325. doi:10.1016/0304-4076(85)90158-7. hdl:10419/189084.
  12. Long, J. Scott; Ervin, Laurie H. (2000). "रैखिक प्रतिगमन मॉडल में हेटेरोसेडेसिटी संगत मानक त्रुटियों का उपयोग करना". The American Statistician. 54 (3): 217–224. doi:10.2307/2685594. ISSN 0003-1305.
  13. C., Davison, Anthony (2010). बूटस्ट्रैप विधियाँ और उनका अनुप्रयोग. Cambridge Univ. Press. ISBN 978-0-521-57391-7. OCLC 740960962.{{cite book}}: CS1 maint: multiple names: authors list (link)
  14. "EViews 8 Robust Regression".
  15. CovarianceMatrices: Robust Covariance Matrix Estimators
  16. "विषमलैंगिकता और स्वसहसंबंध सुसंगत सहप्रसरण अनुमानक". Econometrics Toolbox.
  17. sandwich: Robust Covariance Matrix Estimators
  18. Kleiber, Christian; Zeileis, Achim (2008). आर के साथ एप्लाइड अर्थमिति. New York: Springer. pp. 106–110. ISBN 978-0-387-77316-2.
  19. See online help for _robust option and regress command.
  20. "मजबूत सहप्रसरण मैट्रिक्स अनुमान" (PDF). Gretl User's Guide, chapter 19.


अग्रिम पठन