समुच्चय पहचान: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 1: Line 1:
सांख्यिकी और [[अर्थमिति]] में, सेट [[पहचान]] (या आंशिक पहचान) [[सांख्यिकीय मॉडल]] में पहचान क्षमता (या बिंदु पहचान) की अवधारणा को उन स्थितियों तक विस्तारित करती है जहां अवलोकन योग्य चर का वितरण [[सांख्यिकीय पैरामीटर]] के सटीक मान की जानकारी नहीं देता है, बल्कि पैरामीटर को बाधित करता है पैरामीटर स्थान के [[सख्त उपसमुच्चय]] में स्थित होना। जिन सांख्यिकीय मॉडलों की पहचान की गई है, वे [[अर्थशास्त्र]] में विभिन्न प्रकार की समायोजन में उत्पन्न होते हैं, जिनमें [[ खेल सिद्धांत ]] और [[रुबिन कारण मॉडल]] सम्मलित हैं।
सांख्यिकी और [[अर्थमिति]] में, समुच्चय [[पहचान]] (या आंशिक पहचान) [[सांख्यिकीय मॉडल]] में पहचान क्षमता (या बिंदु पहचान) की अवधारणा को उन स्थितियों तक विस्तारित करती है जहां अवलोकन योग्य चर का वितरण [[सांख्यिकीय पैरामीटर]] के सटीक मान की जानकारी नहीं देता है, बल्कि पैरामीटर को बाधित करता है पैरामीटर स्थान के प्रबल उपसमुच्चय में स्थित होना। जिन सांख्यिकीय मॉडलों की पहचान की गई है, वे [[अर्थशास्त्र]] में विभिन्न प्रकार की समायोजन में उत्पन्न होते हैं, जिनमें [[ खेल सिद्धांत ]] और [[रुबिन कारण मॉडल]] सम्मलित हैं।


चूंकि निर्धारित पहचान का उपयोग [[राग्नार ताजा]] के 1934 के लेख से होता है, लेकिन इन विधियों को 1990 के दशक में [[चार्ल्स मैन्स्की]] द्वारा महत्वपूर्ण रूप से विकसित और प्रचारित किया गया था। {{sfn|Lewbel|2019}} मैन्स्की ने [[चयन पूर्वाग्रह]] के लेखांकन के लिए सबसे निकृष्टतम स्थिति की एक विधि विकसित की। [[हेकमैन सुधार]] जैसी अतिरिक्त सांख्यिकीय धारणाएं बनाने वाली विधियों के विपरीत, सबसे निकृष्टतम स्थिति वाली सीमाएं समर्थित पैरामीटर मानों की एक श्रृंखला उत्पन्न करने के लिए केवल डेटा पर निर्भर करती हैं। {{sfn|Tamer|2010}}
चूंकि निर्धारित पहचान का उपयोग [[राग्नार ताजा]] के 1934 के लेख से होता है, लेकिन इन विधियों को 1990 के दशक में [[चार्ल्स मैन्स्की]] द्वारा महत्वपूर्ण रूप से विकसित और प्रचारित किया गया था। {{sfn|Lewbel|2019}} मैन्स्की ने [[चयन पूर्वाग्रह]] के लेखांकन के लिए सबसे निकृष्टतम स्थिति की एक विधि विकसित की थी। [[हेकमैन सुधार]] जैसी अतिरिक्त सांख्यिकीय धारणाएं बनाने वाली विधियों के विपरीत, सबसे निकृष्टतम स्थिति वाली सीमाएं समर्थित पैरामीटर मानों की एक श्रृंखला उत्पन्न करने के लिए केवल डेटा पर निर्भर करती हैं। {{sfn|Tamer|2010}}


== परिभाषा ==
== परिभाषा ==
होने देना <math> \mathcal{P}=\{P_\theta:\theta\in\Theta\} </math> एक सांख्यिकीय मॉडल बनें जहां पैरामीटर स्थान <math>\Theta</math> या तो परिमित है या अनंत-आयामी है। कल्पना करना <math>\theta_0</math> सही पैरामीटर मान है. हम ऐसा कहते हैं <math>\theta_0</math> यदि सम्मलित है तो उसकी पहचान की जाती है <math>\theta \in \Theta</math> ऐसा है कि <math>P_\theta \neq P_{\theta_0}</math>; अर्थात्, इसमें कुछ पैरामीटर मान हैं <math>\Theta</math> अवलोकन की दृष्टि से समकक्ष नहीं हैं <math>\theta_0</math>. उस स्थिति में, पहचाना गया सेट पैरामीटर मानों का सेट है जो अवलोकन के बराबर है <math>\theta_0</math>.{{sfn|Lewbel|2019}}
होने देना <math> \mathcal{P}=\{P_\theta:\theta\in\Theta\} </math> एक सांख्यिकीय मॉडल बनें जहां पैरामीटर स्थान <math>\Theta</math> या तो परिमित है या अनंत-आयामी है। कल्पना करना <math>\theta_0</math> सही पैरामीटर मान है. हम ऐसा कहते हैं <math>\theta_0</math> यदि सम्मलित है तो उसकी पहचान की जाती है <math>\theta \in \Theta</math> ऐसा है कि <math>P_\theta \neq P_{\theta_0}</math>; अर्थात्, इसमें कुछ पैरामीटर मान हैं <math>\Theta</math> अवलोकन की दृष्टि से समकक्ष नहीं हैं <math>\theta_0</math>. उस स्थिति में, पहचाना गया समुच्चय पैरामीटर मानों का समुच्चय है जो अवलोकन के बराबर है <math>\theta_0</math>.{{sfn|Lewbel|2019}}


== उदाहरण: गुम डेटा ==
== उदाहरण: गुम डेटा ==
Line 11: Line 11:
कुल संभाव्यता के नियम के अनुसार,
कुल संभाव्यता के नियम के अनुसार,
:<math>\mathrm P(Y = 1) = \mathrm P(Y = 1 \mid Z = 1) \mathrm P(Z = 1) + \mathrm P(Y = 1 \mid Z = 0) \mathrm P(Z = 0).</math>
:<math>\mathrm P(Y = 1) = \mathrm P(Y = 1 \mid Z = 1) \mathrm P(Z = 1) + \mathrm P(Y = 1 \mid Z = 0) \mathrm P(Z = 0).</math>
एकमात्र अज्ञात वस्तु है <math>\mathrm P(Y = 1 \mid Z = 0)</math>, जो 0 और 1 के बीच स्थित होने के लिए बाध्य है। इसलिए, पहचाना गया सेट है
एकमात्र अज्ञात वस्तु है <math>\mathrm P(Y = 1 \mid Z = 0)</math>, जो 0 और 1 के बीच स्थित होने के लिए बाध्य है। इसलिए, पहचाना गया समुच्चय है
:<math>\Theta_I = \{ p \in [0, 1] : p = \mathrm P(Y = 1 \mid Z = 1) \mathrm P(Z = 1) + q \mathrm P(Z = 0), \text{ for some } q \in [0,1]\}.</math>
:<math>\Theta_I = \{ p \in [0, 1] : p = \mathrm P(Y = 1 \mid Z = 1) \mathrm P(Z = 1) + q \mathrm P(Z = 0), \text{ for some } q \in [0,1]\}.</math>
लुप्त डेटा बाधा को देखते हुए, अर्थशास्त्री केवल यही कह सकते हैं <math>\mathrm P(Y = 1) \in \Theta_I</math>. यह सभी उपलब्ध जानकारी का उपयोग करता है।
लुप्त डेटा बाधा को देखते हुए, अर्थशास्त्री केवल यही कह सकते हैं <math>\mathrm P(Y = 1) \in \Theta_I</math>. यह सभी उपलब्ध जानकारी का उपयोग करता है।


==सांख्यिकीय अनुमान ==
==सांख्यिकीय अनुमान ==
सेट अनुमान [[बिंदु अनुमान]] के लिए विकसित सांख्यिकीय अनुमान के सामान्य उपकरणों पर भरोसा नहीं कर सकता है। सांख्यिकी और अर्थमिति में एक साहित्य सेट-पहचाने गए मॉडल के संदर्भ में सांख्यिकीय अनुमान के लिए तरीकों का अध्ययन करता है, जो उचित गुणों के साथ आत्म[[विश्वास अंतराल]] या आत्मविश्वास क्षेत्रों के निर्माण पर ध्यान केंद्रित करता है। उदाहरण के लिए, द्वारा विकसित एक विधि {{harvtxt|चेर्नोज़ुकोव|हांग|तमेर|2007}} (और क्या {{harvtxt|लेउबेल|2019}} जटिल के रूप में वर्णन करता है) आत्मविश्वास क्षेत्रों का निर्माण करता है जो किसी दिए गए संभावना के साथ पहचाने गए सेट को कवर करते हैं।
समुच्चय अनुमान [[बिंदु अनुमान]] के लिए विकसित सांख्यिकीय अनुमान के सामान्य उपकरणों पर भरोसा नहीं कर सकता है। सांख्यिकी और अर्थमिति में एक साहित्य समुच्चय-पहचाने गए मॉडल के संदर्भ में सांख्यिकीय अनुमान के लिए तरीकों का अध्ययन करता है, जो उचित गुणों के साथ आत्म[[विश्वास अंतराल]] या आत्मविश्वास क्षेत्रों के निर्माण पर ध्यान केंद्रित करता है। उदाहरण के लिए, द्वारा विकसित एक विधि {{harvtxt|चेर्नोज़ुकोव|हांग|तमेर|2007}} (और क्या {{harvtxt|लेउबेल|2019}} जटिल के रूप में वर्णन करता है) आत्मविश्वास क्षेत्रों का निर्माण करता है जो किसी दिए गए संभावना के साथ पहचाने गए समुच्चय को कवर करते हैं।


== टिप्पणियाँ ==
== टिप्पणियाँ ==

Revision as of 16:57, 13 July 2023

सांख्यिकी और अर्थमिति में, समुच्चय पहचान (या आंशिक पहचान) सांख्यिकीय मॉडल में पहचान क्षमता (या बिंदु पहचान) की अवधारणा को उन स्थितियों तक विस्तारित करती है जहां अवलोकन योग्य चर का वितरण सांख्यिकीय पैरामीटर के सटीक मान की जानकारी नहीं देता है, बल्कि पैरामीटर को बाधित करता है पैरामीटर स्थान के प्रबल उपसमुच्चय में स्थित होना। जिन सांख्यिकीय मॉडलों की पहचान की गई है, वे अर्थशास्त्र में विभिन्न प्रकार की समायोजन में उत्पन्न होते हैं, जिनमें खेल सिद्धांत और रुबिन कारण मॉडल सम्मलित हैं।

चूंकि निर्धारित पहचान का उपयोग राग्नार ताजा के 1934 के लेख से होता है, लेकिन इन विधियों को 1990 के दशक में चार्ल्स मैन्स्की द्वारा महत्वपूर्ण रूप से विकसित और प्रचारित किया गया था। [1] मैन्स्की ने चयन पूर्वाग्रह के लेखांकन के लिए सबसे निकृष्टतम स्थिति की एक विधि विकसित की थी। हेकमैन सुधार जैसी अतिरिक्त सांख्यिकीय धारणाएं बनाने वाली विधियों के विपरीत, सबसे निकृष्टतम स्थिति वाली सीमाएं समर्थित पैरामीटर मानों की एक श्रृंखला उत्पन्न करने के लिए केवल डेटा पर निर्भर करती हैं। [2]

परिभाषा

होने देना एक सांख्यिकीय मॉडल बनें जहां पैरामीटर स्थान या तो परिमित है या अनंत-आयामी है। कल्पना करना सही पैरामीटर मान है. हम ऐसा कहते हैं यदि सम्मलित है तो उसकी पहचान की जाती है ऐसा है कि ; अर्थात्, इसमें कुछ पैरामीटर मान हैं अवलोकन की दृष्टि से समकक्ष नहीं हैं . उस स्थिति में, पहचाना गया समुच्चय पैरामीटर मानों का समुच्चय है जो अवलोकन के बराबर है .[1]

उदाहरण: गुम डेटा

इस उदाहरण के कारण है तमेर (2010). मान लीजिए कि दो द्विआधारी यादृच्छिक चर हैं, Y और Z. अर्थशास्त्री की रुचि है . चूंकि, डेटा गुम होने की समस्या है: Y केवल तभी देखा जा सकता है यदि .

कुल संभाव्यता के नियम के अनुसार,

एकमात्र अज्ञात वस्तु है , जो 0 और 1 के बीच स्थित होने के लिए बाध्य है। इसलिए, पहचाना गया समुच्चय है

लुप्त डेटा बाधा को देखते हुए, अर्थशास्त्री केवल यही कह सकते हैं . यह सभी उपलब्ध जानकारी का उपयोग करता है।

सांख्यिकीय अनुमान

समुच्चय अनुमान बिंदु अनुमान के लिए विकसित सांख्यिकीय अनुमान के सामान्य उपकरणों पर भरोसा नहीं कर सकता है। सांख्यिकी और अर्थमिति में एक साहित्य समुच्चय-पहचाने गए मॉडल के संदर्भ में सांख्यिकीय अनुमान के लिए तरीकों का अध्ययन करता है, जो उचित गुणों के साथ आत्मविश्वास अंतराल या आत्मविश्वास क्षेत्रों के निर्माण पर ध्यान केंद्रित करता है। उदाहरण के लिए, द्वारा विकसित एक विधि चेर्नोज़ुकोव, हांग & तमेर (2007) (और क्या लेउबेल (2019) जटिल के रूप में वर्णन करता है) आत्मविश्वास क्षेत्रों का निर्माण करता है जो किसी दिए गए संभावना के साथ पहचाने गए समुच्चय को कवर करते हैं।

टिप्पणियाँ


संदर्भ

  • Chernozhukov, Victor; Hong, Han; Tamer, Elie (2007). "Estimation and Confidence Regions for Parameter Sets in Econometric Models". Econometrica. The Econometric Society. 75 (5): 1243–1284. doi:10.1111/j.1468-0262.2007.00794.x. hdl:1721.1/63545. ISSN 0012-9682.
  • Lewbel, Arthur (2019-12-01). "The Identification Zoo: Meanings of Identification in Econometrics". Journal of Economic Literature. American Economic Association. 57 (4): 835–903. doi:10.1257/jel.20181361. ISSN 0022-0515.
  • Tamer, Elie (2010). "Partial Identification in Econometrics". Annual Review of Economics. 2 (1): 167–195. doi:10.1146/annurev.economics.050708.143401.


अग्रिम पठन