हेकमैन सुधार: Difference between revisions
No edit summary |
m (added Category:Vigyan Ready using HotCat) |
||
Line 70: | Line 70: | ||
[[Category: Machine Translated Page]] | [[Category: Machine Translated Page]] | ||
[[Category:Created On 20/06/2023]] | [[Category:Created On 20/06/2023]] | ||
[[Category:Vigyan Ready]] |
Revision as of 15:54, 11 July 2023
गैर-यादृच्छिक रूप से चयनित नमूने या अन्यथा आकस्मिक रूप से काटे गए गए आश्रित चर से पूर्वाग्रह को ठीक करने के लिए सांख्यिकीय तकनीक है। जो अवलोकन संबंधी डेटा का उपयोग करते समय मात्रात्मक सामाजिक विज्ञान में व्यापक मुद्दा है।[1] संकल्पनात्मक रूप से, यह आश्रित चर (तथाकथित परिणाम समीकरण) की सशर्त अपेक्षा के साथ प्रत्येक अवलोकन (तथाकथित चयन समीकरण) की व्यक्तिगत नमूना संभावना को स्पष्ट रूप से मॉडलिंग करके प्राप्त किया जाता है। परिणामी संभावना फलन गणितीय रूप से सेंसरिंग (सांख्यिकी) के लिए टोबिट मॉडल के समान है, जो पहली बार 1974 में जेम्स हेकमैन द्वारा तैयार किया गया संबंध है।[2] हेकमैन ने इस मॉडल का अनुमान लगाने के लिए दो-चरण नियंत्रण फलन (अर्थमिति) दृष्टिकोण भी विकसित किया।[3] जो एक साथ समीकरण मॉडल का अनुमान लगाने की कम्प्यूटेशनल जटिलता से बचा जाता है, यद्यपि कुशल अनुमानक के मूल्य पर[4] हेकमैन को इस क्षेत्र में उनके काम के लिए 2000 में आर्थिक विज्ञान में नोबेल मेमोरियल पुरस्कार मिला।[5]
विधि
गैर-यादृच्छिक रूप से चयनित नमूनों पर आधारित सांख्यिकीय विश्लेषण से गलत निष्कर्ष निकल सकते हैं। हेकमैन सुधार दो-चरणीय सांख्यिकीय दृष्टिकोण, गैर-यादृच्छिक रूप से चयनित नमूनों के लिए सुधार का साधन प्रदान करता है।
हेकमैन ने विनिर्देश त्रुटि के रूप में व्यवहार संबंधों का अनुमान लगाने के लिए गैर-यादृच्छिक चयनित नमूनों का उपयोग करने से पूर्वाग्रह पर चर्चा की वह पूर्वाग्रह को ठीक करने के लिए दो-चरणीय आकलन पद्धति का सुझाव देता है। सुधार नियंत्रण फलन (अर्थमिति) विचार का उपयोग करता है और इसे प्रयुक्त करना सरल है। हेकमैन के सुधार में सामान्य वितरण धारणा सम्मिलित है, नमूना चयन पूर्वाग्रह के लिए परीक्षण और पूर्वाग्रह सुधार मॉडल के लिए सूत्र प्रदान करता है।
मान लीजिए कि शोधकर्ता मजदूरी प्रस्तावों के निर्धारकों का अनुमान लगाना चाहता है, लेकिन केवल काम करने वालों के लिए वेतन टिप्पणियों तक पहुंच है। चूंकि काम करने वाले लोगों को आबादी से गैर-यादृच्छिक रूप से चुना जाता है, इसलिए काम करने वाले उप-जनसंख्या से मजदूरी के निर्धारकों का अनुमान लगाने से पक्षपात हो सकता है। हेक्मैन सुधार दो चरणों में होता है।
पहले चरण में, शोधकर्ता काम करने की संभावना के लिए आर्थिक सिद्धांत के आधार पर मॉडल तैयार करता है। इस संबंध के लिए विहित विनिर्देश प्रपत्र का प्रोबिट प्रतिगमन है
जहां D रोजगार को इंगित करता है (D = 1 यदि उत्तरदाता कार्यरत है और D = 0 अन्यथा), Z व्याख्यात्मक चर का वेक्टर है अज्ञात पैरामीटर का वेक्टर है, और Φ मानक सामान्य वितरण का संचयी वितरण कार्य है। मॉडल के अनुमान से ऐसे परिणाम मिलते हैं जिनका उपयोग प्रत्येक व्यक्ति के लिए इस रोजगार संभावना की भविष्यवाणी करने के लिए किया जा सकता है।
दूसरे चरण में, शोधकर्ता अतिरिक्त व्याख्यात्मक चर के रूप में इन अनुमानित व्यक्तिगत संभावनाओं के परिवर्तन को सम्मिलित करके स्व-चयन के लिए सुधार करता है। वेतन समीकरण निर्दिष्ट किया जा सकता है,
जहां अंतर्निहित मजदूरी प्रस्ताव को दर्शाता है, जो कि प्रतिवादी के काम नहीं करने पर मनाया नहीं जाता है। काम करने वाले व्यक्ति को दी गई मजदूरी की सशर्त अपेक्षा तब होती है।
इस धारणा के अंतर्गत कि आँकड़ों में त्रुटियाँ और अवशेष बहुभिन्नरूपी सामान्य वितरण हमारे पास है।
जहां ρ काम करने की प्रवृत्ति के अप्राप्य निर्धारकों के बीच संबंध है। और मजदूरी के अप्रमाणित निर्धारक u, σ u प्रदान करते हैं का मानक विचलन , और व्युत्क्रम मिल्स अनुपात पर मूल्यांकन किया गया है। यह समीकरण हेकमैन की अंतर्दृष्टि को प्रदर्शित करता है कि नमूना चयन को लोप-चर पूर्वाग्रह के रूप में देखा जा सकता है, दोनों X और पर सशर्त के रूप में यह ऐसा है जैसे नमूना यादृच्छिक रूप से चुना गया हो। वेतन समीकरण को बदलकर अनुमान लगाया जा सकता है पहले चरण से प्रोबिट अनुमानों के साथ, निर्माण करना अवधि, और इसे वेतन समीकरण के साधारण न्यूनतम वर्ग अनुमान में अतिरिक्त व्याख्यात्मक चर के रूप में सम्मिलित करना तब से , पर गुणांक केवल शून्य हो सकता है। अगर , इसलिए अशक्त परीक्षण करना कि गुणांक चालू है शून्य है नमूना चयनात्मकता के परीक्षण के बराबर है।
हेकमैन की उपलब्धियों ने अर्थशास्त्र के साथ-साथ अन्य सामाजिक विज्ञानों में बड़ी संख्या में अनुभवजन्य अनुप्रयोगों को उत्पन्न किया है। हेकमैन और अन्य लोगों द्वारा मूल पद्धति को बाद में सामान्यीकृत किया गया है।[6]
सांख्यिकीय निष्कर्ष
हेकमैन सुधार दो-चरणीय M-अनुमानक है जहां दूसरे चरण के OLS अनुमान द्वारा उत्पन्न सहप्रसरण मैट्रिक्स असंगत है।[7] सही मानक त्रुटियां और अन्य आँकड़े स्पर्शोन्मुख सन्निकटन से या पुन: प्रतिचयन द्वारा उत्पन्न किए जा सकते हैं, जैसे बूटस्ट्रैप (सांख्यिकी) के माध्यम से।[8]
हानि
- ऊपर चर्चा किया गया द्वि-चरणीय अनुमानक सीमित सूचना अधिकतम संभावना (एलआईएमएल) अनुमानक है। स्पर्शोन्मुख सिद्धांत और परिमित नमूनों में जैसा कि मोंटे कार्लो सिमुलेशन द्वारा प्रदर्शित किया गया है, पूर्ण सूचना (एफआईएमएल) अनुमानक अच्छा सांख्यिकीय गुण प्रदर्शित करता है। चुकीं , एफआईएमएल अनुमानक को प्रयुक्त करना कम्प्यूटेशनल रूप से अधिक कठिन है।[9]
- विहित मॉडल मानता है कि त्रुटियां संयुक्त रूप से सामान्य हैं। यदि वह धारणा विफल हो जाती है, तो अनुमानक सामान्यतः असंगत होता है और छोटे नमूनों में भ्रामक अनुमान प्रदान कर सकता है।[10] ऐसे स्थितियों में सेमीपैरामेट्रिक और अन्य मजबूत विकल्पों का उपयोग किया जा सकता है।[11]
- मॉडल सामान्यता की धारणा से औपचारिक पहचान प्राप्त करता है जब चयन समीकरण और ब्याज के समीकरण में समान सहसंयोजक दिखाई देते हैं, लेकिन पहचान तब तक कम होगी जब तक कि पूंछ में कई अवलोकन न हों जहां व्युत्क्रम मिल्स अनुपात में पर्याप्त गैर-रैखिकता हो। सामान्यतः , विश्वसनीय अनुमान उत्पन्न करने के लिए बहिष्करण प्रतिबंध की आवश्यकता होती है: कम से कम चर होना चाहिए जो चयन समीकरण में गैर-शून्य गुणांक के साथ प्रकट होता है लेकिन ब्याज के समीकरण में प्रकट नहीं होता है, अनिवार्य रूप से सहायक चर यदि ऐसा कोई चर उपलब्ध नहीं है, तो नमूना चयनात्मकता के लिए सही करना कठिन हो सकता है।[9] इसका कारण दो गुना है: उपकरण के बिना, पहचान कार्यात्मक रूप धारणा पर निर्भर करती है जिसे सामान्यतः बहुत असक्त माना जाता है।[12] इसके अतिरिक्त, भले ही धारणा बनी रहती है, चुना हुआ कार्य जांच के अंतर्गत क्षेत्र में रैखिक कार्यात्मक रूप के बहुत समीप हो सकता है, जिससे दूसरे चरण में बहुकोलिनियरिटी समस्या हो सकती है।
सांख्यिकी पैकेज में कार्यान्वयन
- R: (प्रोग्रामिंग भाषा): हेकमैन-प्रकार की प्रक्रियाएँ इसके भाग के रूप में उपलब्ध हैं
sampleSelection
पैकेट।[13][14] - Stata: आज्ञा
heckman
हेकमैन चयन मॉडल प्रदान करता है।[15][16]
यह भी देखें
संदर्भ
- ↑ Winship, Christopher; Mare, Robert D. (1992). "नमूना चयन पूर्वाग्रह के लिए मॉडल". Annual Review of Sociology. 18: 327–350. doi:10.1146/annurev.so.18.080192.001551.
- ↑ Heckman, James (1974). "छाया मूल्य, बाजार मजदूरी और श्रम आपूर्ति". Econometrica. 42 (4): 679–694. doi:10.2307/1913937. JSTOR 1913937.
- ↑ Heckman, James (1976). "ट्रंकेशन, नमूना चयन और सीमित आश्रित चर के सांख्यिकीय मॉडल की सामान्य संरचना और ऐसे मॉडल के लिए एक साधारण अनुमानक". Annals of Economic and Social Measurement. 5 (4): 475–492.
- ↑ Nawata, Kazumitsu (1994). "अधिकतम संभावना अनुमानक और हेकमैन के दो-चरण अनुमानक द्वारा नमूना चयन पूर्वाग्रह मॉडल का अनुमान". Economics Letters. 45 (1): 33–40. doi:10.1016/0165-1765(94)90053-1.
- ↑ Uchitelle, Louis (October 12, 2000). "2 Americans Win the Nobel For Economics". New York Times.
- ↑ Lee, Lung-Fei (2001). "Self-selection". In Baltagi, B. (ed.). सैद्धांतिक अर्थमिति का एक साथी. Oxford: Blackwell. pp. 383–409. doi:10.1002/9780470996249.ch19. ISBN 9780470996249.
- ↑ Amemiya, Takeshi (1985). उन्नत अर्थमिति. Cambridge: Harvard University Press. pp. 368–372. ISBN 0-674-00560-0.
- ↑ Cameron, A. Colin; Trivedi, Pravin K. (2005). "Sequential Two-Step m-Estimation". Microeconometrics: Methods and Applications. New York: Cambridge University Press. pp. 200–202. ISBN 0-521-84805-9.
- ↑ 9.0 9.1 Puhani, P. (2000). "नमूना चयन और इसकी आलोचना के लिए हेक्मैन सुधार". Journal of Economic Surveys. 14 (1): 53–68. doi:10.1111/1467-6419.00104.
- ↑ Goldberger, A. (1983). "Abnormal Selection Bias". In Karlin, Samuel; Amemiya, Takeshi; Goodman, Leo (eds.). अर्थमिति, समय श्रृंखला, और बहुभिन्नरूपी सांख्यिकी में अध्ययन. New York: Academic Press. pp. 67–84. ISBN 0-12-398750-4.
- ↑ Newey, Whitney; Powell, J.; Walker, James R. (1990). "Semiparametric Estimation of Selection Models: Some Empirical Results". American Economic Review. 80 (2): 324–28. JSTOR 2006593.
- ↑ Lewbel, Arthur (2019-12-01). "The Identification Zoo: Meanings of Identification in Econometrics". Journal of Economic Literature. 57 (4): 835–903. doi:10.1257/jel.20181361. ISSN 0022-0515.
- ↑ Toomet, O.; Henningsen, A. (2008). "Sample Selection Models in R: Package sampleSelection". Journal of Statistical Software. 27 (7): 1–23. doi:10.18637/jss.v027.i07.
- ↑ "sampleSelection: Sample Selection Models". R Project. 3 May 2019.
- ↑ "heckman — Heckman selection model" (PDF). Stata Manual.
- ↑ Cameron, A. Colin; Trivedi, Pravin K. (2010). सूक्ष्मअर्थशास्त्र स्टाटा का उपयोग करना (Revised ed.). College Station: Stata Press. pp. 556–562. ISBN 978-1-59718-073-3.
अग्रिम पठन
- Achen, Christopher H. (1986). "Estimating Treatment Effects in Quasi-Experiments : The Case of Censored Data". The Statistical Analysis of Quasi-Experiments. Berkeley: University of California Press. pp. 97–137. ISBN 0-520-04723-0.
- Breen, Richard (1996). Regression Models : Censored, Sample Selected, or Truncated Data. Thousand Oaks: Sage. pp. 33–48. ISBN 0-8039-5710-6.
- Fu, Vincent Kang; Winship, Christopher; Mare, Robert D. (2004). "Sample Selection Bias Models". In Hardy, Melissa; Bryman, Alan (eds.). Handbook of Data Analysis. London: Sage. pp. 409–430. doi:10.4135/9781848608184.n18. ISBN 0-7619-6652-8.
- Greene, William H. (2012). "Incidental Truncation and Sample Selection". Econometric Analysis (Seventh ed.). Boston: Pearson. pp. 912–27. ISBN 978-0-273-75356-8.
- Vella, Francis (1998). "Estimating Models with Sample Selection Bias: A Survey". Journal of Human Resources. 33 (1): 127–169. doi:10.2307/146317. JSTOR 146317.