हेकमैन सुधार: Difference between revisions

From Vigyanwiki
(Created page with "{{Short description|Statistical technique correcting sampling bias}} गैर-यादृच्छिक रूप से चयनित नमूने या अन्य...")
 
No edit summary
Line 1: Line 1:
{{Short description|Statistical technique correcting sampling bias}}
{{Short description|Statistical technique correcting sampling bias}}
गैर-यादृच्छिक रूप से चयनित नमूने या अन्यथा आकस्मिक रूप से काटे गए प्रतिगमन मॉडल, अवलोकन संबंधी डेटा का उपयोग करते समय मात्रात्मक [[सामाजिक विज्ञान]] में एक व्यापक मुद्दा, [[चयन पूर्वाग्रह]] से बायस (सांख्यिकी) को सही करने के लिए हेकमैन सुधार एक सांख्यिकीय तकनीक है।<ref>{{cite journal |first1=Christopher |last1=Winship |first2=Robert D. |last2=Mare |title=नमूना चयन पूर्वाग्रह के लिए मॉडल|journal=[[Annual Review of Sociology]] |volume=18 |pages=327–350 |year=1992 |doi=10.1146/annurev.so.18.080192.001551 }}</ref> संकल्पनात्मक रूप से, यह आश्रित चर (तथाकथित परिणाम समीकरण) की [[सशर्त अपेक्षा]] के साथ प्रत्येक अवलोकन (तथाकथित चयन समीकरण) की व्यक्तिगत [[नमूना संभावना]] को स्पष्ट रूप से मॉडलिंग करके प्राप्त किया जाता है। परिणामी संभावना फलन गणितीय रूप से [[सेंसरिंग (सांख्यिकी)]] के लिए [[टोबिट मॉडल]] के समान है, जो पहली बार 1974 में [[जेम्स हेकमैन]] द्वारा तैयार किया गया एक संबंध है।<ref>{{cite journal |first=James |last=Heckman |title=छाया मूल्य, बाजार मजदूरी और श्रम आपूर्ति|journal=[[Econometrica]] |volume=42 |issue=4 |year=1974 |pages=679–694 |doi=10.2307/1913937 |jstor=1913937 }}</ref> हेकमैन ने इस मॉडल का अनुमान लगाने के लिए एक दो-चरण नियंत्रण फ़ंक्शन (अर्थमिति) दृष्टिकोण भी विकसित किया,<ref>{{cite journal |first=James |last=Heckman |title=ट्रंकेशन, नमूना चयन और सीमित आश्रित चर के सांख्यिकीय मॉडल की सामान्य संरचना और ऐसे मॉडल के लिए एक साधारण अनुमानक|journal=Annals of Economic and Social Measurement |year=1976 |volume=5 |issue=4 |pages=475–492 |url=https://www.nber.org/chapters/c10491 }}</ref> जो एक साथ समीकरण मॉडल का अनुमान लगाने की कम्प्यूटेशनल जटिलता से बचा जाता है, यद्यपि [[कुशल अनुमानक]] की कीमत पर।<ref>{{cite journal |first=Kazumitsu |last=Nawata |title=अधिकतम संभावना अनुमानक और हेकमैन के दो-चरण अनुमानक द्वारा नमूना चयन पूर्वाग्रह मॉडल का अनुमान|journal=[[Economics Letters]] |volume=45 |issue=1 |year=1994 |pages=33–40 |doi=10.1016/0165-1765(94)90053-1 }}</ref> हेकमैन को इस क्षेत्र में उनके काम के लिए 2000 में [[आर्थिक विज्ञान में नोबेल मेमोरियल पुरस्कार]] मिला।<ref>{{cite news |title=2 Americans Win the Nobel For Economics |first=Louis |last=Uchitelle |date=October 12, 2000 |work=[[New York Times]] |url=https://www.nytimes.com/2000/10/12/business/2-americans-win-the-nobel-for-economics.html }}</ref>
गैर-यादृच्छिक रूप से चयनित नमूने या अन्यथा आकस्मिक रूप से काटे गए गए आश्रित चर से पूर्वाग्रह को ठीक करने के लिए एक सांख्यिकीय तकनीक है, '''प्रतिगमन मॉडल,''' जो अवलोकन संबंधी डेटा का उपयोग करते समय मात्रात्मक [[सामाजिक विज्ञान]] में एक व्यापक मुद्दा है '''वैचारिक रूप से, यह आश्रित चर (तथाकथित परिणाम समीकरण) की सशर्त अपेक्षा के साथ प्रत्येक अवलोकन (तथाकथित चयन समीकरण) की व्यक्तिगत नमूना संभावना को स्पष्ट रूप से मॉडलिंग करके प्राप्त किया जाता है।, [[चयन पूर्वाग्रह]] से बायस (सांख्यिकी) को सही करने के लिए हेकमैन सुधार एक सांख्यिकीय तकनीक है।<ref>{{cite journal |first1=Christopher |last1=Winship |first2=Robert D. |last2=Mare |title=नमूना चयन पूर्वाग्रह के लिए मॉडल|journal=[[Annual Review of Sociology]] |volume=18 |pages=327–350 |year=1992 |doi=10.1146/annurev.so.18.080192.001551 }}</ref>''' संकल्पनात्मक रूप से, यह आश्रित चर (तथाकथित परिणाम समीकरण) की [[सशर्त अपेक्षा]] के साथ प्रत्येक अवलोकन (तथाकथित चयन समीकरण) की व्यक्तिगत [[नमूना संभावना]] को स्पष्ट रूप से मॉडलिंग करके प्राप्त किया जाता है। परिणामी संभावना फलन गणितीय रूप से [[सेंसरिंग (सांख्यिकी)]] के लिए [[टोबिट मॉडल]] के समान है, जो पहली बार 1974 में [[जेम्स हेकमैन]] द्वारा तैयार किया गया एक संबंध है।<ref>{{cite journal |first=James |last=Heckman |title=छाया मूल्य, बाजार मजदूरी और श्रम आपूर्ति|journal=[[Econometrica]] |volume=42 |issue=4 |year=1974 |pages=679–694 |doi=10.2307/1913937 |jstor=1913937 }}</ref> हेकमैन ने इस मॉडल का अनुमान लगाने के लिए एक दो-चरण नियंत्रण फलन  (अर्थमिति) दृष्टिकोण भी विकसित किया,<ref>{{cite journal |first=James |last=Heckman |title=ट्रंकेशन, नमूना चयन और सीमित आश्रित चर के सांख्यिकीय मॉडल की सामान्य संरचना और ऐसे मॉडल के लिए एक साधारण अनुमानक|journal=Annals of Economic and Social Measurement |year=1976 |volume=5 |issue=4 |pages=475–492 |url=https://www.nber.org/chapters/c10491 }}</ref> जो एक साथ समीकरण मॉडल का अनुमान लगाने की कम्प्यूटेशनल जटिलता से बचा जाता है, यद्यपि [[कुशल अनुमानक]] के मूल्य पर।<ref>{{cite journal |first=Kazumitsu |last=Nawata |title=अधिकतम संभावना अनुमानक और हेकमैन के दो-चरण अनुमानक द्वारा नमूना चयन पूर्वाग्रह मॉडल का अनुमान|journal=[[Economics Letters]] |volume=45 |issue=1 |year=1994 |pages=33–40 |doi=10.1016/0165-1765(94)90053-1 }}</ref> हेकमैन को इस क्षेत्र में उनके काम के लिए 2000 में [[आर्थिक विज्ञान में नोबेल मेमोरियल पुरस्कार]] मिला।<ref>{{cite news |title=2 Americans Win the Nobel For Economics |first=Louis |last=Uchitelle |date=October 12, 2000 |work=[[New York Times]] |url=https://www.nytimes.com/2000/10/12/business/2-americans-win-the-nobel-for-economics.html }}</ref>




== विधि ==
== विधि ==
गैर-यादृच्छिक रूप से चयनित नमूनों पर आधारित सांख्यिकीय विश्लेषण से गलत निष्कर्ष निकल सकते हैं। Heckman सुधार, एक दो-चरणीय सांख्यिकीय दृष्टिकोण, गैर-यादृच्छिक रूप से चयनित नमूनों के लिए सुधार का एक साधन प्रदान करता है।
गैर-यादृच्छिक रूप से चयनित नमूनों पर आधारित सांख्यिकीय विश्लेषण से गलत निष्कर्ष निकल सकते हैं। हेकमैन सुधार, एक दो-चरणीय सांख्यिकीय दृष्टिकोण, गैर-यादृच्छिक रूप से चयनित नमूनों के लिए सुधार का एक साधन प्रदान करता है।


हेकमैन ने विनिर्देश त्रुटि के रूप में व्यवहार संबंधों का अनुमान लगाने के लिए गैर-यादृच्छिक चयनित नमूनों का उपयोग करने से पूर्वाग्रह पर चर्चा की। वह पूर्वाग्रह को ठीक करने के लिए दो-चरणीय आकलन पद्धति का सुझाव देता है। सुधार एक नियंत्रण समारोह (अर्थमिति) विचार का उपयोग करता है और इसे लागू करना आसान है। हेकमैन के सुधार में एक [[सामान्य वितरण]] धारणा शामिल है, नमूना चयन पूर्वाग्रह के लिए एक परीक्षण और पूर्वाग्रह सुधार मॉडल के लिए सूत्र प्रदान करता है।
हेकमैन ने विनिर्देश त्रुटि के रूप में व्यवहार संबंधों का अनुमान लगाने के लिए गैर-यादृच्छिक चयनित नमूनों का उपयोग करने से पूर्वाग्रह पर चर्चा की। वह पूर्वाग्रह को ठीक करने के लिए दो-चरणीय आकलन पद्धति का सुझाव देता है। सुधार एक नियंत्रण फलन  (अर्थमिति) विचार का उपयोग करता है और इसे प्रयुक्त  करना सरल  है। हेकमैन के सुधार में एक [[सामान्य वितरण]] धारणा सम्मिलित  है, नमूना चयन पूर्वाग्रह के लिए एक परीक्षण और पूर्वाग्रह सुधार मॉडल के लिए सूत्र प्रदान करता है।


मान लीजिए कि एक शोधकर्ता मजदूरी प्रस्तावों के निर्धारकों का अनुमान लगाना चाहता है, लेकिन केवल काम करने वालों के लिए वेतन टिप्पणियों तक पहुंच है। चूंकि काम करने वाले लोगों को आबादी से गैर-यादृच्छिक रूप से चुना जाता है, इसलिए काम करने वाले उप-जनसंख्या से मजदूरी के निर्धारकों का अनुमान लगाने से पक्षपात हो सकता है। हेक्मैन सुधार दो चरणों में होता है।
मान लीजिए कि एक शोधकर्ता मजदूरी प्रस्तावों के निर्धारकों का अनुमान लगाना चाहता है, लेकिन केवल काम करने वालों के लिए वेतन टिप्पणियों तक पहुंच है। चूंकि काम करने वाले लोगों को आबादी से गैर-यादृच्छिक रूप से चुना जाता है, इसलिए काम करने वाले उप-जनसंख्या से मजदूरी के निर्धारकों का अनुमान लगाने से पक्षपात हो सकता है। हेक्मैन सुधार दो चरणों में होता है।
Line 13: Line 13:


: <math> \operatorname{Prob}( D = 1 | Z ) = \Phi(Z\gamma),</math>
: <math> \operatorname{Prob}( D = 1 | Z ) = \Phi(Z\gamma),</math>
जहां डी रोजगार को इंगित करता है (डी = 1 यदि उत्तरदाता कार्यरत है और डी = 0 अन्यथा), जेड व्याख्यात्मक चर का एक वेक्टर है, <math>\gamma</math> अज्ञात पैरामीटर का वेक्टर है, और Φ मानक सामान्य वितरण का [[संचयी वितरण कार्य]] है। मॉडल के अनुमान से ऐसे परिणाम मिलते हैं जिनका उपयोग प्रत्येक व्यक्ति के लिए इस रोजगार संभावना की भविष्यवाणी करने के लिए किया जा सकता है।
जहां ''D'' रोजगार को इंगित करता है (''D'' = 1 यदि उत्तरदाता कार्यरत है और ''D'' = 0 अन्यथा), Z व्याख्यात्मक चर का एक वेक्टर है, <math>\gamma</math> अज्ञात पैरामीटर का वेक्टर है, और Φ मानक सामान्य वितरण का [[संचयी वितरण कार्य]] है। मॉडल के अनुमान से ऐसे परिणाम मिलते हैं जिनका उपयोग प्रत्येक व्यक्ति के लिए इस रोजगार संभावना की भविष्यवाणी करने के लिए किया जा सकता है।


दूसरे चरण में, शोधकर्ता एक अतिरिक्त व्याख्यात्मक चर के रूप में इन अनुमानित व्यक्तिगत संभावनाओं के परिवर्तन को शामिल करके स्व-चयन के लिए सुधार करता है। वेतन समीकरण निर्दिष्ट किया जा सकता है,
दूसरे चरण में, शोधकर्ता एक अतिरिक्त व्याख्यात्मक चर के रूप में इन अनुमानित व्यक्तिगत संभावनाओं के परिवर्तन को सम्मिलित  करके स्व-चयन के लिए सुधार करता है। वेतन समीकरण निर्दिष्ट किया जा सकता है,


: <math> w^* = X\beta + u</math>
: <math> w^* = X\beta + u</math>
कहाँ <math>w^*</math> एक अंतर्निहित मजदूरी प्रस्ताव को दर्शाता है, जो कि प्रतिवादी के काम नहीं करने पर मनाया नहीं जाता है। काम करने वाले व्यक्ति को दी गई मजदूरी की सशर्त अपेक्षा तब होती है
जहां <math>w^*</math> एक अंतर्निहित मजदूरी प्रस्ताव को दर्शाता है, जो कि प्रतिवादी के काम नहीं करने पर मनाया नहीं जाता है। काम करने वाले व्यक्ति को दी गई मजदूरी की सशर्त अपेक्षा तब होती है


: <math> E [ w | X, D=1 ] = X\beta + E [ u | X, D=1 ].</math>
: <math> E [ w | X, D=1 ] = X\beta + E [ u | X, D=1 ].</math>
इस धारणा के तहत कि आँकड़ों में त्रुटियाँ और अवशेष [[बहुभिन्नरूपी सामान्य वितरण]] हैं, हमारे पास है
इस धारणा के अंतर्गत कि आँकड़ों में त्रुटियाँ और अवशेष [[बहुभिन्नरूपी सामान्य वितरण]] हैं, हमारे पास है


: <math> E [ w | X, D=1 ] = X\beta + \rho\sigma_u \lambda(Z\gamma),</math>
: <math> E [ w | X, D=1 ] = X\beta + \rho\sigma_u \lambda(Z\gamma),</math>
जहां ρ काम करने की प्रवृत्ति के अप्राप्य निर्धारकों के बीच संबंध है <math>\varepsilon</math> और मजदूरी के अप्रमाणित निर्धारक यू, σ प्रदान करते हैं<sub>&nbsp;''u''</sub> का मानक विचलन है <math> u </math>, और <math>\lambda</math> व्युत्क्रम मिल्स अनुपात पर मूल्यांकन किया गया है <math> Z\gamma </math>. यह समीकरण हेकमैन की अंतर्दृष्टि को प्रदर्शित करता है कि नमूना चयन को [[लोप-चर पूर्वाग्रह]] के रूप में देखा जा सकता है, दोनों एक्स और पर सशर्त के रूप में <math>\lambda</math> यह ऐसा है जैसे नमूना यादृच्छिक रूप से चुना गया हो। वेतन समीकरण को बदलकर अनुमान लगाया जा सकता है <math>\gamma</math> पहले चरण से प्रोबिट अनुमानों के साथ, निर्माण करना <math>\lambda</math> अवधि, और इसे वेतन समीकरण के साधारण न्यूनतम वर्ग अनुमान में एक अतिरिक्त व्याख्यात्मक चर के रूप में शामिल करना। तब से <math>\sigma_u > 0</math>, पर गुणांक <math>\lambda</math> केवल शून्य हो सकता है अगर <math>\rho=0</math>, इसलिए अशक्त परीक्षण करना कि गुणांक चालू है <math>\lambda</math> शून्य है नमूना चयनात्मकता के परीक्षण के बराबर है।
जहां ρ काम करने की प्रवृत्ति के अप्राप्य निर्धारकों के बीच संबंध है <math>\varepsilon</math> और मजदूरी के अप्रमाणित निर्धारक ''u'', ''σ'' <sub>''u''</sub>  प्रदान करते हैं <sub>'''&nbsp; ''u'''''</sub> का मानक विचलन है <math> u </math>, और <math>\lambda</math> व्युत्क्रम मिल्स अनुपात पर मूल्यांकन किया गया है <math> Z\gamma </math>. यह समीकरण हेकमैन की अंतर्दृष्टि को प्रदर्शित करता है कि नमूना चयन को [[लोप-चर पूर्वाग्रह]] के रूप में देखा जा सकता है, दोनों ''X'' और पर सशर्त के रूप में <math>\lambda</math> यह ऐसा है जैसे नमूना यादृच्छिक रूप से चुना गया हो। वेतन समीकरण को बदलकर अनुमान लगाया जा सकता है <math>\gamma</math> पहले चरण से प्रोबिट अनुमानों के साथ, निर्माण करना <math>\lambda</math> अवधि, और इसे वेतन समीकरण के साधारण न्यूनतम वर्ग अनुमान में एक अतिरिक्त व्याख्यात्मक चर के रूप में सम्मिलित  करना। तब से <math>\sigma_u > 0</math>, पर गुणांक <math>\lambda</math> केवल शून्य हो सकता है अगर <math>\rho=0</math>, इसलिए अशक्त परीक्षण करना कि गुणांक चालू है <math>\lambda</math> शून्य है नमूना चयनात्मकता के परीक्षण के बराबर है।


हेकमैन की उपलब्धियों ने अर्थशास्त्र के साथ-साथ अन्य सामाजिक विज्ञानों में बड़ी संख्या में अनुभवजन्य अनुप्रयोगों को उत्पन्न किया है। हेकमैन और अन्य लोगों द्वारा मूल पद्धति को बाद में सामान्यीकृत किया गया है।<ref>{{cite book |last=Lee |first=Lung-Fei |year=2001 |chapter=Self-selection |editor-first=B. |editor1-last=Baltagi |title=सैद्धांतिक अर्थमिति का एक साथी|pages=383–409 |location=Oxford |publisher=Blackwell |isbn= 9780470996249|doi=10.1002/9780470996249.ch19 }}</ref>
हेकमैन की उपलब्धियों ने अर्थशास्त्र के साथ-साथ अन्य सामाजिक विज्ञानों में बड़ी संख्या में अनुभवजन्य अनुप्रयोगों को उत्पन्न किया है। हेकमैन और अन्य लोगों द्वारा मूल पद्धति को बाद में सामान्यीकृत किया गया है।<ref>{{cite book |last=Lee |first=Lung-Fei |year=2001 |chapter=Self-selection |editor-first=B. |editor1-last=Baltagi |title=सैद्धांतिक अर्थमिति का एक साथी|pages=383–409 |location=Oxford |publisher=Blackwell |isbn= 9780470996249|doi=10.1002/9780470996249.ch19 }}</ref>
Line 30: Line 30:


== सांख्यिकीय निष्कर्ष ==
== सांख्यिकीय निष्कर्ष ==
हेकमैन सुधार एक दो-चरणीय एम-अनुमानक है जहां दूसरे चरण के ओएलएस अनुमान द्वारा उत्पन्न सहप्रसरण मैट्रिक्स असंगत है।<ref>{{cite book |first=Takeshi |last=Amemiya |title=उन्नत अर्थमिति|location=Cambridge |publisher=Harvard University Press |year=1985 |isbn=0-674-00560-0 |pages=[https://archive.org/details/advancedeconomet00amem/page/368 368]–372 |url=https://archive.org/details/advancedeconomet00amem |url-access=registration }}</ref> सही मानक त्रुटियां और अन्य आँकड़े एक स्पर्शोन्मुख सन्निकटन से या पुन: प्रतिचयन द्वारा उत्पन्न किए जा सकते हैं, जैसे [[बूटस्ट्रैप (सांख्यिकी)]] के माध्यम से।<ref>{{cite book |first1=A. Colin |last1=Cameron |author-link=A. Colin Cameron |first2=Pravin K. |last2=Trivedi |title=Microeconometrics: Methods and Applications |chapter=Sequential Two-Step m-Estimation |location=New York |publisher=Cambridge University Press |year=2005 |isbn=0-521-84805-9 |pages=200–202 |chapter-url=https://books.google.com/books?id=Zf0gCwxC9ocC&pg=PA200 }}</ref>
हेकमैन सुधार एक दो-चरणीय M-अनुमानक है जहां दूसरे चरण के OLS अनुमान द्वारा उत्पन्न सहप्रसरण मैट्रिक्स असंगत है।<ref>{{cite book |first=Takeshi |last=Amemiya |title=उन्नत अर्थमिति|location=Cambridge |publisher=Harvard University Press |year=1985 |isbn=0-674-00560-0 |pages=[https://archive.org/details/advancedeconomet00amem/page/368 368]–372 |url=https://archive.org/details/advancedeconomet00amem |url-access=registration }}</ref> सही मानक त्रुटियां और अन्य आँकड़े एक स्पर्शोन्मुख सन्निकटन से या पुन: प्रतिचयन द्वारा उत्पन्न किए जा सकते हैं, जैसे [[बूटस्ट्रैप (सांख्यिकी)]] के माध्यम से।<ref>{{cite book |first1=A. Colin |last1=Cameron |author-link=A. Colin Cameron |first2=Pravin K. |last2=Trivedi |title=Microeconometrics: Methods and Applications |chapter=Sequential Two-Step m-Estimation |location=New York |publisher=Cambridge University Press |year=2005 |isbn=0-521-84805-9 |pages=200–202 |chapter-url=https://books.google.com/books?id=Zf0gCwxC9ocC&pg=PA200 }}</ref>




== नुकसान ==
== हानि ==
* ऊपर चर्चा किया गया द्वि-चरणीय अनुमानक एक सीमित सूचना अधिकतम संभावना (LIML) अनुमानक है। स्पर्शोन्मुख सिद्धांत और परिमित नमूनों में जैसा कि मोंटे कार्लो सिमुलेशन द्वारा प्रदर्शित किया गया है, पूर्ण सूचना (FIML) अनुमानक बेहतर सांख्यिकीय गुण प्रदर्शित करता है। हालाँकि, FIML अनुमानक को लागू करना कम्प्यूटेशनल रूप से अधिक कठिन है।<ref name=puhani>{{cite journal | doi = 10.1111/1467-6419.00104 | last1 = Puhani | first1 = P. | year = 2000 | title = नमूना चयन और इसकी आलोचना के लिए हेक्मैन सुधार| journal = Journal of Economic Surveys | volume = 14 | issue = 1| pages = 53–68 }}</ref>
* ऊपर चर्चा किया गया द्वि-चरणीय अनुमानक एक सीमित सूचना अधिकतम संभावना (LIML) अनुमानक है। स्पर्शोन्मुख सिद्धांत और परिमित नमूनों में जैसा कि मोंटे कार्लो सिमुलेशन द्वारा प्रदर्शित किया गया है, पूर्ण सूचना (FIML) अनुमानक अच्छा सांख्यिकीय गुण प्रदर्शित करता है। चुकीं , FIML अनुमानक को प्रयुक्त  करना कम्प्यूटेशनल रूप से अधिक कठिन है।<ref name=puhani>{{cite journal | doi = 10.1111/1467-6419.00104 | last1 = Puhani | first1 = P. | year = 2000 | title = नमूना चयन और इसकी आलोचना के लिए हेक्मैन सुधार| journal = Journal of Economic Surveys | volume = 14 | issue = 1| pages = 53–68 }}</ref>
* विहित मॉडल मानता है कि त्रुटियां संयुक्त रूप से सामान्य हैं। यदि वह धारणा विफल हो जाती है, तो अनुमानक आम तौर पर असंगत होता है और छोटे नमूनों में भ्रामक अनुमान प्रदान कर सकता है।<ref>{{cite book |last=Goldberger |first=A. |author-link=Arthur Goldberger |year=1983 |chapter=Abnormal Selection Bias |pages=[https://archive.org/details/studiesineconome0000unse/page/67 67–84] |editor-last=Karlin |editor-first=Samuel |editor1-link=Samuel Karlin |editor2-first=Takeshi |editor2-last=Amemiya |editor2-link=Takeshi Amemiya |editor3-link=Leo Goodman |editor3-first=Leo |editor3-last=Goodman |title=अर्थमिति, समय श्रृंखला, और बहुभिन्नरूपी सांख्यिकी में अध्ययन|location=New York |publisher=Academic Press |isbn=0-12-398750-4 |chapter-url=https://archive.org/details/studiesineconome0000unse/page/67 }}</ref> ऐसे मामलों में सेमीपैरामेट्रिक और अन्य मजबूत विकल्पों का उपयोग किया जा सकता है।<ref>{{cite journal | last1 = Newey | first1 = Whitney | last2 = Powell | first2 = J. | last3 = Walker | first3 = James R. | year = 1990 | title = Semiparametric Estimation of Selection Models: Some Empirical Results | journal = [[American Economic Review]] | volume = 80 | issue = 2| pages = 324–28 |jstor=2006593 }}</ref>
* विहित मॉडल मानता है कि त्रुटियां संयुक्त रूप से सामान्य हैं। यदि वह धारणा विफल हो जाती है, तो अनुमानक सामान्यतः  असंगत होता है और छोटे नमूनों में भ्रामक अनुमान प्रदान कर सकता है।<ref>{{cite book |last=Goldberger |first=A. |author-link=Arthur Goldberger |year=1983 |chapter=Abnormal Selection Bias |pages=[https://archive.org/details/studiesineconome0000unse/page/67 67–84] |editor-last=Karlin |editor-first=Samuel |editor1-link=Samuel Karlin |editor2-first=Takeshi |editor2-last=Amemiya |editor2-link=Takeshi Amemiya |editor3-link=Leo Goodman |editor3-first=Leo |editor3-last=Goodman |title=अर्थमिति, समय श्रृंखला, और बहुभिन्नरूपी सांख्यिकी में अध्ययन|location=New York |publisher=Academic Press |isbn=0-12-398750-4 |chapter-url=https://archive.org/details/studiesineconome0000unse/page/67 }}</ref> ऐसे स्थितियों  में सेमीपैरामेट्रिक और अन्य मजबूत विकल्पों का उपयोग किया जा सकता है।<ref>{{cite journal | last1 = Newey | first1 = Whitney | last2 = Powell | first2 = J. | last3 = Walker | first3 = James R. | year = 1990 | title = Semiparametric Estimation of Selection Models: Some Empirical Results | journal = [[American Economic Review]] | volume = 80 | issue = 2| pages = 324–28 |jstor=2006593 }}</ref>
* मॉडल सामान्यता की धारणा से औपचारिक पहचान प्राप्त करता है जब चयन समीकरण और ब्याज के समीकरण में समान सहसंयोजक दिखाई देते हैं, लेकिन पहचान तब तक कम होगी जब तक कि पूंछ में कई अवलोकन न हों जहां व्युत्क्रम मिल्स अनुपात में पर्याप्त गैर-रैखिकता हो। आम तौर पर, विश्वसनीय अनुमान उत्पन्न करने के लिए एक बहिष्करण प्रतिबंध की आवश्यकता होती है: कम से कम एक चर होना चाहिए जो चयन समीकरण में गैर-शून्य गुणांक के साथ प्रकट होता है लेकिन ब्याज के समीकरण में प्रकट नहीं होता है, अनिवार्य रूप से एक सहायक चर। यदि ऐसा कोई चर उपलब्ध नहीं है, तो नमूना चयनात्मकता के लिए सही करना मुश्किल हो सकता है।<ref name=puhani/>इसका कारण दो गुना है: एक उपकरण के बिना, पहचान कार्यात्मक रूप धारणा पर निर्भर करती है जिसे आम तौर पर बहुत कमजोर माना जाता है।<ref>{{Cite journal |last=Lewbel |first=Arthur |date=2019-12-01 |title=The Identification Zoo: Meanings of Identification in Econometrics |url=http://dx.doi.org/10.1257/jel.20181361 |journal=Journal of Economic Literature |volume=57 |issue=4 |pages=835–903 |doi=10.1257/jel.20181361 |issn=0022-0515}}</ref> इसके अलावा, भले ही धारणा बनी रहती है, चुना हुआ कार्य जांच के तहत क्षेत्र में एक रैखिक कार्यात्मक रूप के बहुत करीब हो सकता है, जिससे दूसरे चरण में बहुकोलिनियरिटी समस्या हो सकती है।
* मॉडल सामान्यता की धारणा से औपचारिक पहचान प्राप्त करता है जब चयन समीकरण और ब्याज के समीकरण में समान सहसंयोजक दिखाई देते हैं, लेकिन पहचान तब तक कम होगी जब तक कि पूंछ में कई अवलोकन न हों जहां व्युत्क्रम मिल्स अनुपात में पर्याप्त गैर-रैखिकता हो। सामान्यतः , विश्वसनीय अनुमान उत्पन्न करने के लिए एक बहिष्करण प्रतिबंध की आवश्यकता होती है: कम से कम एक चर होना चाहिए जो चयन समीकरण में गैर-शून्य गुणांक के साथ प्रकट होता है लेकिन ब्याज के समीकरण में प्रकट नहीं होता है, अनिवार्य रूप से एक सहायक चर। यदि ऐसा कोई चर उपलब्ध नहीं है, तो नमूना चयनात्मकता के लिए सही करना कठिन हो सकता है।<ref name=puhani/> इसका कारण दो गुना है: एक उपकरण के बिना, पहचान कार्यात्मक रूप धारणा पर निर्भर करती है जिसे सामान्यतः  बहुत असक्त माना जाता है।<ref>{{Cite journal |last=Lewbel |first=Arthur |date=2019-12-01 |title=The Identification Zoo: Meanings of Identification in Econometrics |url=http://dx.doi.org/10.1257/jel.20181361 |journal=Journal of Economic Literature |volume=57 |issue=4 |pages=835–903 |doi=10.1257/jel.20181361 |issn=0022-0515}}</ref> इसके अतिरिक्त, भले ही धारणा बनी रहती है, चुना हुआ कार्य जांच के अंतर्गत क्षेत्र में एक रैखिक कार्यात्मक रूप के बहुत समीप हो सकता है, जिससे दूसरे चरण में बहुकोलिनियरिटी समस्या हो सकती है।


== सांख्यिकी पैकेज में कार्यान्वयन ==
== सांख्यिकी पैकेज में कार्यान्वयन ==
* [[आर (प्रोग्रामिंग भाषा)]]: हेकमैन-प्रकार की प्रक्रियाएँ इसके भाग के रूप में उपलब्ध हैं <code>sampleSelection</code> पैकेट।<ref>{{cite journal |first1=O. |last1=Toomet |first2=A. |last2=Henningsen |year=2008 |title=Sample Selection Models in R: Package sampleSelection |journal=[[Journal of Statistical Software]] |volume=27 |issue=7 |pages=1–23 |url=http://www.jstatsoft.org/v27/i07/ |doi=10.18637/jss.v027.i07|doi-access=free }}</ref><ref>{{cite web |title=sampleSelection: Sample Selection Models |work=R Project |date= 3 May 2019|url=https://cran.r-project.org/web/packages/sampleSelection/index.html }}</ref>
* [[आर (प्रोग्रामिंग भाषा)|R: (प्रोग्रामिंग भाषा)]]: हेकमैन-प्रकार की प्रक्रियाएँ इसके भाग के रूप में उपलब्ध हैं <code>sampleSelection</code> पैकेट।<ref>{{cite journal |first1=O. |last1=Toomet |first2=A. |last2=Henningsen |year=2008 |title=Sample Selection Models in R: Package sampleSelection |journal=[[Journal of Statistical Software]] |volume=27 |issue=7 |pages=1–23 |url=http://www.jstatsoft.org/v27/i07/ |doi=10.18637/jss.v027.i07|doi-access=free }}</ref><ref>{{cite web |title=sampleSelection: Sample Selection Models |work=R Project |date= 3 May 2019|url=https://cran.r-project.org/web/packages/sampleSelection/index.html }}</ref>
* [[था]]: आज्ञा <code>heckman</code> हेकमैन चयन मॉडल प्रदान करता है।<ref>{{cite web |title=heckman — Heckman selection model |work=Stata Manual |url=https://www.stata.com/manuals15/rheckman.pdf }}</ref><ref>{{cite book |first1=A. Colin |last1=Cameron |first2=Pravin K. |last2=Trivedi |title=सूक्ष्मअर्थशास्त्र स्टाटा का उपयोग करना|location=College Station |publisher=Stata Press |edition=Revised |year=2010 |isbn=978-1-59718-073-3 |pages=556–562 |url=https://books.google.com/books?id=UkKQRAAACAAJ&pg=PA556 }}</ref>
* Stata: आज्ञा <code>heckman</code> हेकमैन चयन मॉडल प्रदान करता है।<ref>{{cite web |title=heckman — Heckman selection model |work=Stata Manual |url=https://www.stata.com/manuals15/rheckman.pdf }}</ref><ref>{{cite book |first1=A. Colin |last1=Cameron |first2=Pravin K. |last2=Trivedi |title=सूक्ष्मअर्थशास्त्र स्टाटा का उपयोग करना|location=College Station |publisher=Stata Press |edition=Revised |year=2010 |isbn=978-1-59718-073-3 |pages=556–562 |url=https://books.google.com/books?id=UkKQRAAACAAJ&pg=PA556 }}</ref>





Revision as of 18:45, 4 July 2023

गैर-यादृच्छिक रूप से चयनित नमूने या अन्यथा आकस्मिक रूप से काटे गए गए आश्रित चर से पूर्वाग्रह को ठीक करने के लिए एक सांख्यिकीय तकनीक है, प्रतिगमन मॉडल, जो अवलोकन संबंधी डेटा का उपयोग करते समय मात्रात्मक सामाजिक विज्ञान में एक व्यापक मुद्दा है वैचारिक रूप से, यह आश्रित चर (तथाकथित परिणाम समीकरण) की सशर्त अपेक्षा के साथ प्रत्येक अवलोकन (तथाकथित चयन समीकरण) की व्यक्तिगत नमूना संभावना को स्पष्ट रूप से मॉडलिंग करके प्राप्त किया जाता है।, चयन पूर्वाग्रह से बायस (सांख्यिकी) को सही करने के लिए हेकमैन सुधार एक सांख्यिकीय तकनीक है।[1] संकल्पनात्मक रूप से, यह आश्रित चर (तथाकथित परिणाम समीकरण) की सशर्त अपेक्षा के साथ प्रत्येक अवलोकन (तथाकथित चयन समीकरण) की व्यक्तिगत नमूना संभावना को स्पष्ट रूप से मॉडलिंग करके प्राप्त किया जाता है। परिणामी संभावना फलन गणितीय रूप से सेंसरिंग (सांख्यिकी) के लिए टोबिट मॉडल के समान है, जो पहली बार 1974 में जेम्स हेकमैन द्वारा तैयार किया गया एक संबंध है।[2] हेकमैन ने इस मॉडल का अनुमान लगाने के लिए एक दो-चरण नियंत्रण फलन (अर्थमिति) दृष्टिकोण भी विकसित किया,[3] जो एक साथ समीकरण मॉडल का अनुमान लगाने की कम्प्यूटेशनल जटिलता से बचा जाता है, यद्यपि कुशल अनुमानक के मूल्य पर।[4] हेकमैन को इस क्षेत्र में उनके काम के लिए 2000 में आर्थिक विज्ञान में नोबेल मेमोरियल पुरस्कार मिला।[5]


विधि

गैर-यादृच्छिक रूप से चयनित नमूनों पर आधारित सांख्यिकीय विश्लेषण से गलत निष्कर्ष निकल सकते हैं। हेकमैन सुधार, एक दो-चरणीय सांख्यिकीय दृष्टिकोण, गैर-यादृच्छिक रूप से चयनित नमूनों के लिए सुधार का एक साधन प्रदान करता है।

हेकमैन ने विनिर्देश त्रुटि के रूप में व्यवहार संबंधों का अनुमान लगाने के लिए गैर-यादृच्छिक चयनित नमूनों का उपयोग करने से पूर्वाग्रह पर चर्चा की। वह पूर्वाग्रह को ठीक करने के लिए दो-चरणीय आकलन पद्धति का सुझाव देता है। सुधार एक नियंत्रण फलन (अर्थमिति) विचार का उपयोग करता है और इसे प्रयुक्त करना सरल है। हेकमैन के सुधार में एक सामान्य वितरण धारणा सम्मिलित है, नमूना चयन पूर्वाग्रह के लिए एक परीक्षण और पूर्वाग्रह सुधार मॉडल के लिए सूत्र प्रदान करता है।

मान लीजिए कि एक शोधकर्ता मजदूरी प्रस्तावों के निर्धारकों का अनुमान लगाना चाहता है, लेकिन केवल काम करने वालों के लिए वेतन टिप्पणियों तक पहुंच है। चूंकि काम करने वाले लोगों को आबादी से गैर-यादृच्छिक रूप से चुना जाता है, इसलिए काम करने वाले उप-जनसंख्या से मजदूरी के निर्धारकों का अनुमान लगाने से पक्षपात हो सकता है। हेक्मैन सुधार दो चरणों में होता है।

पहले चरण में, शोधकर्ता काम करने की संभावना के लिए आर्थिक सिद्धांत के आधार पर एक मॉडल तैयार करता है। इस संबंध के लिए विहित विनिर्देश प्रपत्र का प्रोबिट प्रतिगमन है

जहां D रोजगार को इंगित करता है (D = 1 यदि उत्तरदाता कार्यरत है और D = 0 अन्यथा), Z व्याख्यात्मक चर का एक वेक्टर है, अज्ञात पैरामीटर का वेक्टर है, और Φ मानक सामान्य वितरण का संचयी वितरण कार्य है। मॉडल के अनुमान से ऐसे परिणाम मिलते हैं जिनका उपयोग प्रत्येक व्यक्ति के लिए इस रोजगार संभावना की भविष्यवाणी करने के लिए किया जा सकता है।

दूसरे चरण में, शोधकर्ता एक अतिरिक्त व्याख्यात्मक चर के रूप में इन अनुमानित व्यक्तिगत संभावनाओं के परिवर्तन को सम्मिलित करके स्व-चयन के लिए सुधार करता है। वेतन समीकरण निर्दिष्ट किया जा सकता है,

जहां एक अंतर्निहित मजदूरी प्रस्ताव को दर्शाता है, जो कि प्रतिवादी के काम नहीं करने पर मनाया नहीं जाता है। काम करने वाले व्यक्ति को दी गई मजदूरी की सशर्त अपेक्षा तब होती है

इस धारणा के अंतर्गत कि आँकड़ों में त्रुटियाँ और अवशेष बहुभिन्नरूपी सामान्य वितरण हैं, हमारे पास है

जहां ρ काम करने की प्रवृत्ति के अप्राप्य निर्धारकों के बीच संबंध है और मजदूरी के अप्रमाणित निर्धारक u, σ u प्रदान करते हैं   u का मानक विचलन है , और व्युत्क्रम मिल्स अनुपात पर मूल्यांकन किया गया है . यह समीकरण हेकमैन की अंतर्दृष्टि को प्रदर्शित करता है कि नमूना चयन को लोप-चर पूर्वाग्रह के रूप में देखा जा सकता है, दोनों X और पर सशर्त के रूप में यह ऐसा है जैसे नमूना यादृच्छिक रूप से चुना गया हो। वेतन समीकरण को बदलकर अनुमान लगाया जा सकता है पहले चरण से प्रोबिट अनुमानों के साथ, निर्माण करना अवधि, और इसे वेतन समीकरण के साधारण न्यूनतम वर्ग अनुमान में एक अतिरिक्त व्याख्यात्मक चर के रूप में सम्मिलित करना। तब से , पर गुणांक केवल शून्य हो सकता है अगर , इसलिए अशक्त परीक्षण करना कि गुणांक चालू है शून्य है नमूना चयनात्मकता के परीक्षण के बराबर है।

हेकमैन की उपलब्धियों ने अर्थशास्त्र के साथ-साथ अन्य सामाजिक विज्ञानों में बड़ी संख्या में अनुभवजन्य अनुप्रयोगों को उत्पन्न किया है। हेकमैन और अन्य लोगों द्वारा मूल पद्धति को बाद में सामान्यीकृत किया गया है।[6]


सांख्यिकीय निष्कर्ष

हेकमैन सुधार एक दो-चरणीय M-अनुमानक है जहां दूसरे चरण के OLS अनुमान द्वारा उत्पन्न सहप्रसरण मैट्रिक्स असंगत है।[7] सही मानक त्रुटियां और अन्य आँकड़े एक स्पर्शोन्मुख सन्निकटन से या पुन: प्रतिचयन द्वारा उत्पन्न किए जा सकते हैं, जैसे बूटस्ट्रैप (सांख्यिकी) के माध्यम से।[8]


हानि

  • ऊपर चर्चा किया गया द्वि-चरणीय अनुमानक एक सीमित सूचना अधिकतम संभावना (LIML) अनुमानक है। स्पर्शोन्मुख सिद्धांत और परिमित नमूनों में जैसा कि मोंटे कार्लो सिमुलेशन द्वारा प्रदर्शित किया गया है, पूर्ण सूचना (FIML) अनुमानक अच्छा सांख्यिकीय गुण प्रदर्शित करता है। चुकीं , FIML अनुमानक को प्रयुक्त करना कम्प्यूटेशनल रूप से अधिक कठिन है।[9]
  • विहित मॉडल मानता है कि त्रुटियां संयुक्त रूप से सामान्य हैं। यदि वह धारणा विफल हो जाती है, तो अनुमानक सामान्यतः असंगत होता है और छोटे नमूनों में भ्रामक अनुमान प्रदान कर सकता है।[10] ऐसे स्थितियों में सेमीपैरामेट्रिक और अन्य मजबूत विकल्पों का उपयोग किया जा सकता है।[11]
  • मॉडल सामान्यता की धारणा से औपचारिक पहचान प्राप्त करता है जब चयन समीकरण और ब्याज के समीकरण में समान सहसंयोजक दिखाई देते हैं, लेकिन पहचान तब तक कम होगी जब तक कि पूंछ में कई अवलोकन न हों जहां व्युत्क्रम मिल्स अनुपात में पर्याप्त गैर-रैखिकता हो। सामान्यतः , विश्वसनीय अनुमान उत्पन्न करने के लिए एक बहिष्करण प्रतिबंध की आवश्यकता होती है: कम से कम एक चर होना चाहिए जो चयन समीकरण में गैर-शून्य गुणांक के साथ प्रकट होता है लेकिन ब्याज के समीकरण में प्रकट नहीं होता है, अनिवार्य रूप से एक सहायक चर। यदि ऐसा कोई चर उपलब्ध नहीं है, तो नमूना चयनात्मकता के लिए सही करना कठिन हो सकता है।[9] इसका कारण दो गुना है: एक उपकरण के बिना, पहचान कार्यात्मक रूप धारणा पर निर्भर करती है जिसे सामान्यतः बहुत असक्त माना जाता है।[12] इसके अतिरिक्त, भले ही धारणा बनी रहती है, चुना हुआ कार्य जांच के अंतर्गत क्षेत्र में एक रैखिक कार्यात्मक रूप के बहुत समीप हो सकता है, जिससे दूसरे चरण में बहुकोलिनियरिटी समस्या हो सकती है।

सांख्यिकी पैकेज में कार्यान्वयन

  • R: (प्रोग्रामिंग भाषा): हेकमैन-प्रकार की प्रक्रियाएँ इसके भाग के रूप में उपलब्ध हैं sampleSelection पैकेट।[13][14]
  • Stata: आज्ञा heckman हेकमैन चयन मॉडल प्रदान करता है।[15][16]


यह भी देखें

संदर्भ

  1. Winship, Christopher; Mare, Robert D. (1992). "नमूना चयन पूर्वाग्रह के लिए मॉडल". Annual Review of Sociology. 18: 327–350. doi:10.1146/annurev.so.18.080192.001551.
  2. Heckman, James (1974). "छाया मूल्य, बाजार मजदूरी और श्रम आपूर्ति". Econometrica. 42 (4): 679–694. doi:10.2307/1913937. JSTOR 1913937.
  3. Heckman, James (1976). "ट्रंकेशन, नमूना चयन और सीमित आश्रित चर के सांख्यिकीय मॉडल की सामान्य संरचना और ऐसे मॉडल के लिए एक साधारण अनुमानक". Annals of Economic and Social Measurement. 5 (4): 475–492.
  4. Nawata, Kazumitsu (1994). "अधिकतम संभावना अनुमानक और हेकमैन के दो-चरण अनुमानक द्वारा नमूना चयन पूर्वाग्रह मॉडल का अनुमान". Economics Letters. 45 (1): 33–40. doi:10.1016/0165-1765(94)90053-1.
  5. Uchitelle, Louis (October 12, 2000). "2 Americans Win the Nobel For Economics". New York Times.
  6. Lee, Lung-Fei (2001). "Self-selection". In Baltagi, B. (ed.). सैद्धांतिक अर्थमिति का एक साथी. Oxford: Blackwell. pp. 383–409. doi:10.1002/9780470996249.ch19. ISBN 9780470996249.
  7. Amemiya, Takeshi (1985). उन्नत अर्थमिति. Cambridge: Harvard University Press. pp. 368–372. ISBN 0-674-00560-0.
  8. Cameron, A. Colin; Trivedi, Pravin K. (2005). "Sequential Two-Step m-Estimation". Microeconometrics: Methods and Applications. New York: Cambridge University Press. pp. 200–202. ISBN 0-521-84805-9.
  9. 9.0 9.1 Puhani, P. (2000). "नमूना चयन और इसकी आलोचना के लिए हेक्मैन सुधार". Journal of Economic Surveys. 14 (1): 53–68. doi:10.1111/1467-6419.00104.
  10. Goldberger, A. (1983). "Abnormal Selection Bias". In Karlin, Samuel; Amemiya, Takeshi; Goodman, Leo (eds.). अर्थमिति, समय श्रृंखला, और बहुभिन्नरूपी सांख्यिकी में अध्ययन. New York: Academic Press. pp. 67–84. ISBN 0-12-398750-4.
  11. Newey, Whitney; Powell, J.; Walker, James R. (1990). "Semiparametric Estimation of Selection Models: Some Empirical Results". American Economic Review. 80 (2): 324–28. JSTOR 2006593.
  12. Lewbel, Arthur (2019-12-01). "The Identification Zoo: Meanings of Identification in Econometrics". Journal of Economic Literature. 57 (4): 835–903. doi:10.1257/jel.20181361. ISSN 0022-0515.
  13. Toomet, O.; Henningsen, A. (2008). "Sample Selection Models in R: Package sampleSelection". Journal of Statistical Software. 27 (7): 1–23. doi:10.18637/jss.v027.i07.
  14. "sampleSelection: Sample Selection Models". R Project. 3 May 2019.
  15. "heckman — Heckman selection model" (PDF). Stata Manual.
  16. Cameron, A. Colin; Trivedi, Pravin K. (2010). सूक्ष्मअर्थशास्त्र स्टाटा का उपयोग करना (Revised ed.). College Station: Stata Press. pp. 556–562. ISBN 978-1-59718-073-3.


अग्रिम पठन


बाहरी संबंध