सांख्यिकीय अनुमिति: Difference between revisions

From Vigyanwiki
(text)
(text)
Line 61: Line 61:
{{See also| यादृच्छिक नमूना| निरुद्देश्य  समनुदेशन }}
{{See also| यादृच्छिक नमूना| निरुद्देश्य  समनुदेशन }}


'''किसी दिए गए आँकड़ा'''सम्मुच्चय के लिए जो एक यादृच्छिककरण डिज़ाइन द्वारा निर्मित किया गया था, एक सांख्यिकीय (शून्य-परिकल्पना के तहत) के यादृच्छिककरण वितरण को सभी योजनाओं के लिए परीक्षण आंकड़े का मूल्यांकन करके परिभाषित किया गया है जो कि यादृच्छिककरण डिज़ाइन द्वारा उत्पन्न किया जा सकता था। बारंबारतावादी धारणा में, यादृच्छिककरण एक व्यक्तिपरक प्रतिरूप के बजाय यादृच्छिककरण वितरण पर आधारित होने की अनुमति देता है, और यह विशेष रूप से सर्वेक्षण नमूनाकरण और प्रयोगों के डिजाइन में महत्वपूर्ण है।<ref>[[Jerzy Neyman|Neyman, J.]](1934) "On the two different aspects of the representative method: The method of stratified sampling and the method of purposive selection", ''[[Journal of the Royal Statistical Society]]'', 97 (4), 557–625 {{jstor|2342192}}</ref><ref name="Hinkelmann and Kempthorne">Hinkelmann and Kempthorne(2008) {{page needed|date=June 2011}}</ref> यादृच्छिक अध्ययन से सांख्यिकीय निष्कर्ष भी कई अन्य स्थितियों की तुलना में अधिक सीधा है।<ref>ASA Guidelines for the first course in statistics for non-statisticians. (available at the ASA website)</ref><ref>[[David A. Freedman]] et alia's ''Statistics''.</ref><ref>Moore et al. (2015).</ref> बायेसियन धारणा में, यादृच्छिककरण भी महत्वपूर्ण है: [[सर्वेक्षण नमूनाकरण]] में, प्रतिस्थापन के बिना नमूने का उपयोग जनसंख्या के साथ नमूने की विनिमयशीलता सुनिश्चित करता है; यादृच्छिक प्रयोगों में, यादृच्छिककरण [[कोवरिएट]] जानकारी के लिए यादृच्छिक धारणा पर लापता होने का वारंट करता है।<ref>[[Andrew Gelman|Gelman A.]] et al. (2013). ''Bayesian Data Analysis'' ([[Chapman & Hall]]).</ref>
किसी दिए गए आँकड़ासम्मुच्चय के लिए जो एक यादृच्छिककरण अभिकल्पना द्वारा निर्मित किया गया था, एक सांख्यिकीय (शून्य-परिकल्पना के तहत) के यादृच्छिककरण वितरण को सभी योजनाओं के लिए परीक्षण आंकड़े का मूल्यांकन करके परिभाषित किया गया है जो कि यादृच्छिककरण अभिकल्पना द्वारा उत्पन्न किया जा सकता था। बारंबारतावादी धारणा में, यादृच्छिककरण एक व्यक्तिपरक प्रतिरूप के बजाय यादृच्छिककरण वितरण पर आधारित होने की अनुमति देता है, और यह विशेष रूप से सर्वेक्षण नमूनाकरण और प्रयोगों के अभिकल्पना में महत्वपूर्ण है।<ref>[[Jerzy Neyman|Neyman, J.]](1934) "On the two different aspects of the representative method: The method of stratified sampling and the method of purposive selection", ''[[Journal of the Royal Statistical Society]]'', 97 (4), 557–625 {{jstor|2342192}}</ref><ref name="Hinkelmann and Kempthorne">Hinkelmann and Kempthorne(2008) {{page needed|date=June 2011}}</ref> यादृच्छिक अध्ययन से सांख्यिकीय निष्कर्ष भी कई अन्य स्थितियों की तुलना में अधिक सीधा है।<ref>ASA Guidelines for the first course in statistics for non-statisticians. (available at the ASA website)</ref><ref>[[David A. Freedman]] et alia's ''Statistics''.</ref><ref>Moore et al. (2015).</ref> बायेसियन धारणा में, यादृच्छिककरण भी महत्वपूर्ण है: [[सर्वेक्षण नमूनाकरण]] में, प्रतिस्थापन के बिना नमूने का उपयोग जनसंख्या के साथ नमूने की विनिमयशीलता सुनिश्चित करता है; यादृच्छिक प्रयोगों में, यादृच्छिककरण [[कोवरिएट|सहविचर]] जानकारी के लिए यादृच्छिक धारणा पर लापता होने का वारंट करता है।<ref>[[Andrew Gelman|Gelman A.]] et al. (2013). ''Bayesian Data Analysis'' ([[Chapman & Hall]]).</ref>
वस्तुनिष्ठ यादृच्छिककरण ठीक से आगमनात्मक प्रक्रियाओं की अनुमति देता है।<ref>Peirce (1877-1878)</ref><ref>Peirce (1883)</ref>{{sfn|Freedman|Pisani|Purves|1978}}<ref>[[David A. Freedman]] ''Statistical Models''.</ref><ref>
वस्तुनिष्ठ यादृच्छिककरण ठीक से आगमनात्मक प्रक्रियाओं की अनुमति देता है।<ref>Peirce (1877-1878)</ref><ref>Peirce (1883)</ref>{{sfn|Freedman|Pisani|Purves|1978}}<ref>[[David A. Freedman]] ''Statistical Models''.</ref><ref>
[[C. R. Rao|Rao, C.R.]] (1997) ''Statistics and Truth: Putting Chance to Work'', World Scientific. {{isbn|981-02-3111-3}}</ref>
[[C. R. Rao|Rao, C.R.]] (1997) ''Statistics and Truth: Putting Chance to Work'', World Scientific. {{isbn|981-02-3111-3}}</ref>
कई सांख्यिकीविद् आँकड़ा के यादृच्छिककरण-आधारित विश्लेषण को पसंद करते हैं जो कि अच्छी तरह से परिभाषित यादृच्छिकीकरण प्रक्रियाओं द्वारा उत्पन्न किया गया था।<ref>Peirce; Freedman; Moore et al. (2015).{{Citation needed|date=March 2010}}</ref> (हालांकि, यह सच है कि विज्ञान के क्षेत्रों में विकसित सैद्धांतिक ज्ञान और प्रयोगात्मक नियंत्रण के साथ, यादृच्छिक प्रयोग अनुमानों की गुणवत्ता में सुधार किए बिना प्रयोग की लागत बढ़ा सकते हैं।<ref>Box, G.E.P. and Friends (2006) ''Improving Almost Anything: Ideas and Essays, Revised Edition'', Wiley. {{isbn|978-0-471-72755-2}}</ref><ref>
कई सांख्यिकीविद् आंकड़ों के यादृच्छिककरण-आधारित विश्लेषण को पसंद करते हैं जो कि अच्छी तरह से परिभाषित यादृच्छिकीकरण प्रक्रियाओं द्वारा उत्पन्न किया गया था।<ref>Peirce; Freedman; Moore et al. (2015).{{Citation needed|date=March 2010}}</ref> (हालांकि, यह सच है कि विज्ञान के क्षेत्रों में विकसित सैद्धांतिक ज्ञान और प्रयोगात्मक नियंत्रण के साथ, यादृच्छिक प्रयोग अनुमानों की गुणवत्ता में सुधार किए बिना प्रयोग की लागत बढ़ा सकते हैं।<ref>Box, G.E.P. and Friends (2006) ''Improving Almost Anything: Ideas and Essays, Revised Edition'', Wiley. {{isbn|978-0-471-72755-2}}</ref><ref>
Cox (2006), p.&nbsp;196.</ref>)
Cox (2006), p.&nbsp;196.</ref>)
इसी तरह, प्रमुख सांख्यिकीय अधिकारियों द्वारा [[यादृच्छिक प्रयोग]]ों के परिणामों की सिफारिश की जाती है क्योंकि समान घटनाओं के अवलोकन संबंधी अध्ययनों की तुलना में अधिक विश्वसनीयता वाले अनुमानों की अनुमति होती है।<ref>ASA Guidelines for the first course in statistics for non-statisticians. (available at the ASA website)
इसी तरह, प्रमुख सांख्यिकीय अधिकारियों द्वारा [[यादृच्छिक प्रयोग|यादृच्छिक प्रयोगों]] के परिणामों की अनुशंसा की जाती है क्योंकि समान घटनाओं के अवलोकन संबंधी अध्ययनों की तुलना में अधिक विश्वसनीयता वाले अनुमानों की अनुमति होती है।<ref>ASA Guidelines for the first course in statistics for non-statisticians. (available at the ASA website)
* David A. Freedman et alias ''Statistics''.
* David A. Freedman et alias ''Statistics''.
* Moore et al. (2015).
* Moore et al. (2015).
Line 72: Line 72:
हालांकि, एक अच्छा अवलोकन संबंधी अध्ययन एक खराब यादृच्छिक प्रयोग से बेहतर हो सकता है।
हालांकि, एक अच्छा अवलोकन संबंधी अध्ययन एक खराब यादृच्छिक प्रयोग से बेहतर हो सकता है।


एक यादृच्छिक प्रयोग का सांख्यिकीय विश्लेषण प्रायोगिक प्रोटोकॉल में वर्णित यादृच्छिकीकरण योजना पर आधारित हो सकता है और इसके लिए व्यक्तिपरक प्रतिरूप की आवश्यकता नहीं होती है।<ref>Neyman, Jerzy. 1923 [1990]. "On the Application of Probability Theory to AgriculturalExperiments. Essay on Principles. Section 9." ''Statistical Science'' 5 (4): 465–472. Trans. [[Dorota Dabrowska|Dorota M. Dabrowska]] and Terence P. Speed.</ref><ref>Hinkelmann & Kempthorne (2008) {{page needed|date=June 2011}}</ref>
एक यादृच्छिक प्रयोग का सांख्यिकीय विश्लेषण प्रायोगिक विज्ञप्ति में वर्णित यादृच्छिकीकरण योजना पर आधारित हो सकता है और इसके लिए व्यक्तिपरक प्रतिरूप की आवश्यकता नहीं होती है।<ref>Neyman, Jerzy. 1923 [1990]. "On the Application of Probability Theory to AgriculturalExperiments. Essay on Principles. Section 9." ''Statistical Science'' 5 (4): 465–472. Trans. [[Dorota Dabrowska|Dorota M. Dabrowska]] and Terence P. Speed.</ref><ref>Hinkelmann & Kempthorne (2008) {{page needed|date=June 2011}}</ref>
हालाँकि, किसी भी समय, कुछ परिकल्पनाओं का वस्तुनिष्ठ सांख्यिकीय प्रतिरूप का उपयोग करके परीक्षण नहीं किया जा सकता है, जो यादृच्छिक प्रयोगों या यादृच्छिक नमूनों का सटीक वर्णन करते हैं। कुछ मामलों में, ऐसे यादृच्छिक अध्ययन असंवैधानिक या अनैतिक हैं।
हालाँकि, किसी भी समय, कुछ परिकल्पनाओं का वस्तुनिष्ठ सांख्यिकीय प्रतिरूप का उपयोग करके परीक्षण नहीं किया जा सकता है, जो यादृच्छिक प्रयोगों या यादृच्छिक नमूनों का सटीक वर्णन करते हैं। कुछ मामलों में, ऐसे यादृच्छिक अध्ययन असंवैधानिक या अनैतिक हैं।


==== यादृच्छिक प्रयोगों का प्रतिरूप-आधारित विश्लेषण ====
==== यादृच्छिक प्रयोगों का प्रतिरूप-आधारित विश्लेषण ====
यादृच्छिक प्रयोगों से आँकड़ा का विश्लेषण करते समय एक सांख्यिकीय प्रतिरूप, उदाहरण के लिए, एक रैखिक या रसद प्रतिरूप को संदर्भित करना मानक अभ्यास है।<ref name="Dinov Palanimalai Khare Christou 2018">
यादृच्छिक प्रयोगों से आंकड़ों का विश्लेषण करते समय एक सांख्यिकीय प्रतिरूप, उदाहरण के लिए, एक रैखिक या रसद प्रतिरूप को संदर्भित करना मानक अभ्यास है।<ref name="Dinov Palanimalai Khare Christou 2018">
{{cite journal
{{cite journal
|last1= Dinov | first1=Ivo
|last1= Dinov | first1=Ivo
Line 91: Line 91:
| pmid=30270947
| pmid=30270947
|pmc= 6155997
|pmc= 6155997
}}</ref> हालाँकि, यादृच्छिककरण योजना एक सांख्यिकीय प्रतिरूप की पसंद का मार्गदर्शन करती है। यादृच्छिकीकरण योजना को जाने बिना उपयुक्त प्रतिरूप का चयन करना संभव नहीं है।<ref name="Hinkelmann and Kempthorne" />प्रयोगात्मक प्रोटोकॉल की अनदेखी करते हुए यादृच्छिक प्रयोगों से आँकड़ा का विश्लेषण करके गंभीर रूप से भ्रामक परिणाम प्राप्त किए जा सकते हैं; सामान्य गलतियों में एक प्रयोग में उपयोग किए गए अवरोधन को भूल जाना और एक ही प्रायोगिक इकाई पर बार-बार माप को अलग-अलग प्रायोगिक इकाइयों पर लागू उपचार की स्वतंत्र प्रतिकृति के साथ भ्रमित करना सम्मिलित है।<ref>Hinkelmann and Kempthorne (2008) Chapter 6.</ref>
}}</ref> हालाँकि, यादृच्छिककरण योजना एक सांख्यिकीय प्रतिरूप की पसंद का मार्गदर्शन करती है। यादृच्छिकीकरण योजना को जाने बिना उपयुक्त प्रतिरूप का चयन करना संभव नहीं है।<ref name="Hinkelmann and Kempthorne" />प्रयोगात्मक विज्ञप्ति की अनदेखी करते हुए यादृच्छिक प्रयोगों से आंकड़ों का विश्लेषण करके गंभीर रूप से भ्रामक परिणाम प्राप्त किए जा सकते हैं; सामान्य गलतियों में एक प्रयोग में उपयोग किए गए अवरोधन को भूल जाना और एक ही प्रायोगिक इकाई पर बार-बार माप को अलग-अलग प्रायोगिक इकाइयों पर लागू उपचार की स्वतंत्र प्रतिकृति के साथ भ्रमित करना सम्मिलित है।<ref>Hinkelmann and Kempthorne (2008) Chapter 6.</ref>




==== प्रतिरूप-मुक्त यादृच्छिककरण अनुमान ====
==== प्रतिरूप-मुक्त यादृच्छिककरण अनुमान ====
प्रतिरूप-मुक्त तकनीकें प्रतिरूप-आधारित विधियों का पूरक प्रदान करती हैं, जो वास्तविकता-सरलीकरण की न्यूनीकरणवादी रणनीतियों को नियोजित करती हैं। पूर्व संयोजन, विकास, पहनावा और एल्गोरिदम को गतिशील रूप से एक प्रक्रिया के प्रासंगिक समानता के अनुकूल बनाने और टिप्पणियों की आंतरिक विशेषताओं को सीखने के लिए।<ref name="Dinov Palanimalai Khare Christou 2018"/><ref name="Tang model-based Model-Free 2019">
प्रतिरूप-मुक्त तकनीकें प्रतिरूप-आधारित विधियों का पूरक प्रदान करती हैं, जो वास्तविकता-सरलीकरण की न्यूनीकरणवादी रणनीतियों को नियोजित करती हैं। पूर्व संयोजन, विकास, पहनावा और कलन विधि को गतिशील रूप से एक प्रक्रिया के प्रासंगिक समानता के अनुकूल बनाने और टिप्पणियों की आंतरिक विशेषताओं को सीखने के लिए नियोजित करती हैं।<ref name="Dinov Palanimalai Khare Christou 2018"/><ref name="Tang model-based Model-Free 2019">
{{cite journal
{{cite journal
|last1= Tang | first1=Ming
|last1= Tang | first1=Ming
Line 113: Line 113:
| pmid=30460455 | pmc= 6527505
| pmid=30460455 | pmc= 6527505
}}</ref>
}}</ref>
उदाहरण के लिए, प्रतिरूप-मुक्त सरल रेखीय प्रतिगमन या तो पर आधारित है
उदाहरण के लिए, प्रतिरूप-मुक्त सरल रेखीय प्रतिगमन निम्न पर आधारित है।
* एक यादृच्छिक डिजाइन, जहां टिप्पणियों के जोड़े <math>(X_1,Y_1), (X_2,Y_2), \cdots , (X_n,Y_n)</math> स्वतंत्र और समान रूप से वितरित (आईआईडी) हैं, या
* एक यादृच्छिक अभिकल्पना, जहां टिप्पणियों के जोड़े <math>(X_1,Y_1), (X_2,Y_2), \cdots , (X_n,Y_n)</math> स्वतंत्र और समान रूप से वितरित (iid) हैं, या
* एक नियतात्मक डिजाइन, जहां चर <math>X_1, X_2, \cdots, X_n</math> नियतात्मक हैं, लेकिन संबंधित प्रतिक्रिया चर <math>Y_1,Y_2, \cdots, Y_n</math> एक सामान्य सशर्त वितरण के साथ यादृच्छिक और स्वतंत्र हैं, अर्थात, <math>P\left (Y_j \leq y | X_j =x\right ) = D_x(y)</math>, जो सूचकांक से स्वतंत्र है <math>j</math>.
* एक नियतात्मक अभिकल्पना, जहां चर <math>X_1, X_2, \cdots, X_n</math> नियतात्मक हैं, लेकिन संबंधित प्रतिक्रिया चर <math>Y_1,Y_2, \cdots, Y_n</math> एक सामान्य सशर्त वितरण के साथ यादृच्छिक और स्वतंत्र हैं, अर्थात, <math>P\left (Y_j \leq y | X_j =x\right ) = D_x(y)</math>, जो सूचकांक <math>j</math> से स्वतंत्र है।


किसी भी मामले में, सामान्य सशर्त वितरण की सुविधाओं के लिए प्रतिरूप-मुक्त यादृच्छिककरण धारणा <math>D_x(.)</math> कुछ नियमितता स्थितियों पर निर्भर करता है, उदा। कार्यात्मक चिकनाई। उदाहरण के लिए, जनसंख्या सुविधा सशर्त माध्य के लिए प्रतिरूप-मुक्त यादृच्छिककरण अनुमान, <math>\mu(x)=E(Y | X = x)</math>, धारणा के तहत स्थानीय औसत या स्थानीय बहुपद फिटिंग के माध्यम से लगातार धारणा लगाया जा सकता है <math>\mu(x)</math> चिकना है। इसके अलावा, स्पर्शोन्मुख सामान्यता या पुनरुत्पादन पर भरोसा करते हुए, हम जनसंख्या विशेषता के लिए विश्वास अंतराल का निर्माण कर सकते हैं, इस मामले में, सशर्त माध्य, <math>\mu(x)</math>.<ref name="Politis Model-Free Inference 2019">
किसी भी मामले में, सामान्य सशर्त वितरण की सुविधाओं के लिए प्रतिरूप-मुक्त यादृच्छिककरण धारणा <math>D_x(.)</math> कुछ नियमितता स्थितियों पर निर्भर करता है, उदा। कार्यात्मक सहजता। उदाहरण के लिए, जनसंख्या सुविधा सशर्त माध्य के लिए प्रतिरूप-मुक्त यादृच्छिककरण अनुमान, <math>\mu(x)=E(Y | X = x)</math>, धारणा के तहत स्थानीय औसत या स्थानीय बहुपद उपयुक्त के माध्यम से लगातार धारणा लगाई जा सकती है कि <math>\mu(x)</math>निर्बाध है। इसके अलावा, स्पर्शोन्मुख सामान्यता या पुनरुत्पादन पर भरोसा करते हुए, हम जनसंख्या विशेषता के लिए विश्वास अंतराल का निर्माण कर सकते हैं, इस मामले में, सशर्त माध्य, <math>\mu(x)</math>.<ref name="Politis Model-Free Inference 2019">
{{cite journal
{{cite journal
|last1= Politis | first1=D.N.
|last1= Politis | first1=D.N.
Line 129: Line 129:


== धारणा के प्रतिमान ==
== धारणा के प्रतिमान ==
सांख्यिकीय धारणा के विभिन्न स्कूल स्थापित हो गए हैं। ये स्कूल-या प्रतिमान-पारस्परिक रूप से अनन्य नहीं हैं, और जो तरीके एक प्रतिमान के तहत अच्छी तरह से काम करते हैं, उनकी प्रायः अन्य प्रतिमानों के तहत आकर्षक व्याख्या होती है।
सांख्यिकीय धारणा के विभिन्न विद्यालय स्थापित हो गए हैं। ये विद्यालय-या प्रतिमान-पारस्परिक रूप से अनन्य नहीं हैं, और जो तरीके एक प्रतिमान के तहत अच्छी तरह से काम करते हैं, उनकी प्रायः अन्य प्रतिमानों के तहत आकर्षक व्याख्या होती है।


बंद्योपाध्याय और फोस्टर चार प्रतिमानों का वर्णन करते हैं: क्लासिकल (या [[आवृत्तिवादी अनुमान]]) प्रतिमान, बायेसियन धारणा प्रतिमान, [[संभावनावाद]] प्रतिमान, और एकाइके सूचना मानदंड | अकाइकेन-सूचना मानदंड-आधारित प्रतिमान।<ref>Bandyopadhyay & Forster (2011). See the book's Introduction (p.3) and "Section&nbsp;III: Four Paradigms of Statistics".</ref>
बंद्योपाध्याय और फोस्टर चार प्रतिमानों का वर्णन करते हैं: पारम्परिक (या [[आवृत्तिवादी अनुमान]]) प्रतिमान, बायेसियन धारणा प्रतिमान, [[संभावनावाद]] प्रतिमान, और एकाइके सूचना मानदंड | अकाइकेन-सूचना मानदंड-आधारित प्रतिमान।<ref>Bandyopadhyay & Forster (2011). See the book's Introduction (p.3) and "Section&nbsp;III: Four Paradigms of Statistics".</ref>




=== आवृत्तिवादी अनुमान ===
=== आवृत्तिवादी अनुमान ===
{{Main|Frequentist inference}}
{{Main|आवृत्तिवादी अनुमान}}
यह प्रतिमान हाथ में एक के समान आँकड़ासम्मुच्चय बनाने के लिए जनसंख्या वितरण के बार-बार नमूने पर विचार करके प्रस्तावों की संभाव्यता को जांचता है। दोहराए गए नमूने के तहत आँकड़ासम्मुच्चय की विशेषताओं पर विचार करके, एक सांख्यिकीय प्रस्ताव के फ़्रीक्वेंटिस्ट गुणों को परिमाणित किया जा सकता है - हालांकि व्यवहार में यह परिमाणीकरण चुनौतीपूर्ण हो सकता है।


==== फ़्रीक्वेंटिस्ट धारणा के उदाहरण ====
यह प्रतिमान हाथ में एक के समान आँकड़ासम्मुच्चय बनाने के लिए जनसंख्या वितरण के बार-बार नमूने पर विचार करके प्रस्तावों की संभाव्यता को जांचता है। दोहराए गए नमूने के तहत आँकड़ासम्मुच्चय की विशेषताओं पर विचार करके, एक सांख्यिकीय प्रस्ताव के आवृत्तिवादी गुणों को परिमाणित किया जा सकता है - हालांकि व्यवहार में यह परिमाणीकरण चुनौतीपूर्ण हो सकता है।
* पी-वैल्यू | पी-वैल्यू
 
* विश्वास अंतराल
==== आवृत्तिवादी धारणा के उदाहरण ====
* p- मूल्य 
* निराकरणीय परिकल्पना अंतराल
* अशक्त परिकल्पना महत्व परीक्षण
* अशक्त परिकल्पना महत्व परीक्षण


Line 146: Line 147:
बारंबारतावादी धारणा (या शास्त्रीय अनुमान) की एक व्याख्या यह है कि यह केवल आवृत्ति संभावना के संदर्भ में लागू होता है; यानी, किसी आबादी से बार-बार नमूने लेने के संदर्भ में। हालांकि, नेमन का दृष्टिकोण<ref>{{cite journal | last = Neyman | first = J. | author-link = Jerzy Neyman | year = 1937 | title = संभाव्यता के शास्त्रीय सिद्धांत के आधार पर सांख्यिकीय अनुमान के सिद्धांत की रूपरेखा| jstor = 91337 | journal = Philosophical Transactions of the Royal Society of London A | volume = 236 | issue = 767| pages = 333–380 | doi=10.1098/rsta.1937.0005 | bibcode = 1937RSPTA.236..333N | doi-access = free }}</ref> पूर्व-प्रयोग संभावनाओं के संदर्भ में इन प्रक्रियाओं को विकसित करता है। अर्थात्, एक प्रयोग करने से पहले, एक निष्कर्ष पर आने के लिए एक नियम तय करता है जैसे कि सही होने की संभावना को एक उपयुक्त तरीके से नियंत्रित किया जाता है: इस तरह की संभावना को बारंबारतावादी या बार-बार नमूना व्याख्या की आवश्यकता नहीं होती है। इसके विपरीत, बायेसियन धारणा सशर्त संभावनाओं के संदर्भ में काम करता है (अर्थात देखे गए आँकड़ा पर सशर्त संभावनाएं), सीमांत (लेकिन अज्ञात मापदंडों पर सशर्त) संभावनाओं की तुलना में लगातार दृष्टिकोण में उपयोग किया जाता है।
बारंबारतावादी धारणा (या शास्त्रीय अनुमान) की एक व्याख्या यह है कि यह केवल आवृत्ति संभावना के संदर्भ में लागू होता है; यानी, किसी आबादी से बार-बार नमूने लेने के संदर्भ में। हालांकि, नेमन का दृष्टिकोण<ref>{{cite journal | last = Neyman | first = J. | author-link = Jerzy Neyman | year = 1937 | title = संभाव्यता के शास्त्रीय सिद्धांत के आधार पर सांख्यिकीय अनुमान के सिद्धांत की रूपरेखा| jstor = 91337 | journal = Philosophical Transactions of the Royal Society of London A | volume = 236 | issue = 767| pages = 333–380 | doi=10.1098/rsta.1937.0005 | bibcode = 1937RSPTA.236..333N | doi-access = free }}</ref> पूर्व-प्रयोग संभावनाओं के संदर्भ में इन प्रक्रियाओं को विकसित करता है। अर्थात्, एक प्रयोग करने से पहले, एक निष्कर्ष पर आने के लिए एक नियम तय करता है जैसे कि सही होने की संभावना को एक उपयुक्त तरीके से नियंत्रित किया जाता है: इस तरह की संभावना को बारंबारतावादी या बार-बार नमूना व्याख्या की आवश्यकता नहीं होती है। इसके विपरीत, बायेसियन धारणा सशर्त संभावनाओं के संदर्भ में काम करता है (अर्थात देखे गए आँकड़ा पर सशर्त संभावनाएं), सीमांत (लेकिन अज्ञात मापदंडों पर सशर्त) संभावनाओं की तुलना में लगातार दृष्टिकोण में उपयोग किया जाता है।


उपयोगिता कार्यों के संबंध में महत्व परीक्षण और विश्वास अंतराल की लगातार प्रक्रियाओं का निर्माण किया जा सकता है। हालाँकि, फ़्रीक्वेंटिस्ट सांख्यिकी के कुछ तत्व, जैसे कि [[सांख्यिकीय निर्णय सिद्धांत]], उपयोगिता कार्यों को सम्मिलित करते हैं।{{Citation needed|date=April 2012}} विशेष रूप से, इष्टतम धारणा (जैसे [[न्यूनतम-विचरण निष्पक्ष अनुमानक]], या [[समान रूप से सबसे शक्तिशाली परीक्षण]]) के लगातार विकास हानि कार्यों का उपयोग करते हैं, जो (नकारात्मक) उपयोगिता कार्यों की भूमिका निभाते हैं। सांख्यिकीय सिद्धांतकारों को यह साबित करने के लिए हानि कार्यों को स्पष्ट रूप से नहीं बताया जाना चाहिए कि एक सांख्यिकीय प्रक्रिया में इष्टतमता संपत्ति है।<ref>Preface to Pfanzagl.</ref> हालांकि, नुकसान-फ़ंक्शन प्रायः इष्टतम गुणों को बताते हुए उपयोगी होते हैं: उदाहरण के लिए, औसत-निष्पक्ष अनुमानक पूर्ण मूल्य हानि कार्यों के तहत इष्टतम होते हैं, जिसमें वे अपेक्षित हानि को कम करते हैं, और कम से कम वर्ग अनुमानक वर्ग त्रुटि हानि कार्यों के तहत इष्टतम होते हैं, जिसमें वे अपेक्षित नुकसान को कम करें।
उपयोगिता कार्यों के संबंध में महत्व परीक्षण और विश्वास अंतराल की लगातार प्रक्रियाओं का निर्माण किया जा सकता है। हालाँकि, आवृत्तिवादी सांख्यिकी के कुछ तत्व, जैसे कि [[सांख्यिकीय निर्णय सिद्धांत]], उपयोगिता कार्यों को सम्मिलित करते हैं।{{Citation needed|date=April 2012}} विशेष रूप से, इष्टतम धारणा (जैसे [[न्यूनतम-विचरण निष्पक्ष अनुमानक]], या [[समान रूप से सबसे शक्तिशाली परीक्षण]]) के लगातार विकास हानि कार्यों का उपयोग करते हैं, जो (नकारात्मक) उपयोगिता कार्यों की भूमिका निभाते हैं। सांख्यिकीय सिद्धांतकारों को यह साबित करने के लिए हानि कार्यों को स्पष्ट रूप से नहीं बताया जाना चाहिए कि एक सांख्यिकीय प्रक्रिया में इष्टतमता संपत्ति है।<ref>Preface to Pfanzagl.</ref> हालांकि, नुकसान-प्रकार्य प्रायः इष्टतम गुणों को बताते हुए उपयोगी होते हैं: उदाहरण के लिए, औसत-निष्पक्ष अनुमानक पूर्ण मूल्य हानि कार्यों के तहत इष्टतम होते हैं, जिसमें वे अपेक्षित हानि को कम करते हैं, और कम से कम वर्ग अनुमानक वर्ग त्रुटि हानि कार्यों के तहत इष्टतम होते हैं, जिसमें वे अपेक्षित नुकसान को कम करें।


जबकि बारंबारतावादी धारणा का उपयोग करने वाले सांख्यिकीविदों को स्वयं के लिए रुचि के मापदंडों का चयन करना चाहिए, और उपयोग किए जाने वाले अनुमानक/परीक्षण आंकड़े#सामान्य परीक्षण आंकड़े, स्पष्ट रूप से स्पष्ट उपयोगिताओं और पूर्व वितरण की अनुपस्थिति ने आवृत्तिवादी प्रक्रियाओं को व्यापक रूप से 'उद्देश्य' के रूप में देखने में मदद की है।<ref>{{Cite journal|last=Little|first=Roderick J.|date=2006|title=कैलिब्रेटेड बेयस: ए बेयस/फ्रीक्वेंटिस्ट रोडमैप|journal=The American Statistician|volume=60|issue=3|pages=213–223|issn=0003-1305|jstor=27643780|doi=10.1198/000313006X117837|s2cid=53505632}}</ref>
जबकि बारंबारतावादी धारणा का उपयोग करने वाले सांख्यिकीविदों को स्वयं के लिए रुचि के मापदंडों का चयन करना चाहिए, और उपयोग किए जाने वाले अनुमानक/परीक्षण आंकड़े, स्पष्ट रूप से स्पष्ट उपयोगिताओं और पूर्व वितरण की अनुपस्थिति ने आवृत्तिवादी प्रक्रियाओं को व्यापक रूप से 'उद्देश्य' के रूप में देखने में मदद की है।<ref>{{Cite journal|last=Little|first=Roderick J.|date=2006|title=कैलिब्रेटेड बेयस: ए बेयस/फ्रीक्वेंटिस्ट रोडमैप|journal=The American Statistician|volume=60|issue=3|pages=213–223|issn=0003-1305|jstor=27643780|doi=10.1198/000313006X117837|s2cid=53505632}}</ref>




Line 163: Line 164:
कई अनौपचारिक बायेसियन संदर्भ पश्च के सहज रूप से उचित सारांश पर आधारित हैं। उदाहरण के लिए, पश्च माध्य, मध्य और विधा, उच्चतम पश्च घनत्व अंतराल, और बेयस कारक सभी इस तरह से प्रेरित हो सकते हैं। हालांकि इस प्रकार के धारणा के लिए एक उपयोगकर्ता के उपयोगिता कार्य को बताने की आवश्यकता नहीं है, ये सारांश पहले बताए गए विश्वासों पर निर्भर करते हैं (कुछ हद तक), और सामान्यतः  व्यक्तिपरक निष्कर्ष के रूप में देखे जाते हैं। (पूर्व निर्माण की विधियाँ जिनमें बाहरी इनपुट की आवश्यकता नहीं होती है बायेसियन संभाव्यता # व्यक्तिगत संभावनाएँ और पुरोहितों के निर्माण के लिए वस्तुनिष्ठ विधियाँ हैं लेकिन अभी तक पूरी तरह से विकसित नहीं हुई हैं।)
कई अनौपचारिक बायेसियन संदर्भ पश्च के सहज रूप से उचित सारांश पर आधारित हैं। उदाहरण के लिए, पश्च माध्य, मध्य और विधा, उच्चतम पश्च घनत्व अंतराल, और बेयस कारक सभी इस तरह से प्रेरित हो सकते हैं। हालांकि इस प्रकार के धारणा के लिए एक उपयोगकर्ता के उपयोगिता कार्य को बताने की आवश्यकता नहीं है, ये सारांश पहले बताए गए विश्वासों पर निर्भर करते हैं (कुछ हद तक), और सामान्यतः  व्यक्तिपरक निष्कर्ष के रूप में देखे जाते हैं। (पूर्व निर्माण की विधियाँ जिनमें बाहरी इनपुट की आवश्यकता नहीं होती है बायेसियन संभाव्यता # व्यक्तिगत संभावनाएँ और पुरोहितों के निर्माण के लिए वस्तुनिष्ठ विधियाँ हैं लेकिन अभी तक पूरी तरह से विकसित नहीं हुई हैं।)


औपचारिक रूप से, बायेसियन इंट्रेंस को स्पष्ट रूप से बताई गई उपयोगिता, या हानि फ़ंक्शन के संदर्भ में कैलिब्रेट किया जाता है; 'बेयस नियम' वह है जो अपेक्षित उपयोगिता को अधिकतम करता है, पश्च अनिश्चितता पर औसत। इसलिए औपचारिक बायेसियन धारणा स्वचालित रूप से एक निर्णय सिद्धांत अर्थ में [[इष्टतम निर्णय]] प्रदान करता है। मान्यताओं, आँकड़ा और उपयोगिता को देखते हुए, बायेसियन धारणा अनिवार्य रूप से किसी भी समस्या के लिए बनाया जा सकता है, हालांकि हर सांख्यिकीय धारणा की बायेसियन व्याख्या की आवश्यकता नहीं है। विश्लेषण जो औपचारिक रूप से बायेसियन नहीं हैं (तार्किक रूप से) सुसंगतता (सांख्यिकी) हो सकते हैं; बायेसियन प्रक्रियाओं की एक विशेषता जो उचित पुरोहितों का उपयोग करती है (अर्थात वे जो एक के लिए पूर्णांक हैं) यह है कि उन्हें सुसंगतता (सांख्यिकी) होने की गारंटी दी जाती है। बायेसियन धारणा के कुछ पैरोकार दावा करते हैं कि इस निर्णय-सैद्धांतिक ढांचे में धारणा लगाया जाना चाहिए, और बायेसियन धारणा को बाद के विश्वासों के मूल्यांकन और सारांश के साथ समाप्त नहीं करना चाहिए।
औपचारिक रूप से, बायेसियन इंट्रेंस को स्पष्ट रूप से बताई गई उपयोगिता, या हानि प्रकार्य  के संदर्भ में कैलिब्रेट किया जाता है; 'बेयस नियम' वह है जो अपेक्षित उपयोगिता को अधिकतम करता है, पश्च अनिश्चितता पर औसत। इसलिए औपचारिक बायेसियन धारणा स्वचालित रूप से एक निर्णय सिद्धांत अर्थ में [[इष्टतम निर्णय]] प्रदान करता है। मान्यताओं, आँकड़ा और उपयोगिता को देखते हुए, बायेसियन धारणा अनिवार्य रूप से किसी भी समस्या के लिए बनाया जा सकता है, हालांकि हर सांख्यिकीय धारणा की बायेसियन व्याख्या की आवश्यकता नहीं है। विश्लेषण जो औपचारिक रूप से बायेसियन नहीं हैं (तार्किक रूप से) सुसंगतता (सांख्यिकी) हो सकते हैं; बायेसियन प्रक्रियाओं की एक विशेषता जो उचित पुरोहितों का उपयोग करती है (अर्थात वे जो एक के लिए पूर्णांक हैं) यह है कि उन्हें सुसंगतता (सांख्यिकी) होने की गारंटी दी जाती है। बायेसियन धारणा के कुछ पैरोकार दावा करते हैं कि इस निर्णय-सैद्धांतिक ढांचे में धारणा लगाया जाना चाहिए, और बायेसियन धारणा को बाद के विश्वासों के मूल्यांकन और सारांश के साथ समाप्त नहीं करना चाहिए।


=== संभावना आधारित अनुमान ===
=== संभावना आधारित अनुमान ===
{{Main|Likelihoodism}}
{{Main|Likelihoodism}}
{{expand section|date=March 2019}}
{{expand section|date=March 2019}}
संभावना फ़ंक्शन का उपयोग करके संभावनावाद आंकड़ों तक पहुंचता है। कुछ संभाव्यवादी आँकड़ों को साक्ष्य से केवल कंप्यूटिंग समर्थन के रूप में मानते हुए, धारणा को अस्वीकार करते हैं। अन्य, हालांकि, संभावना समारोह के आधार पर धारणा का प्रस्ताव करते हैं, जिनमें से सबसे प्रसिद्ध [[अधिकतम संभावना अनुमान|अधिकतम संभावना]] धारणा है।
संभावना प्रकार्य  का उपयोग करके संभावनावाद आंकड़ों तक पहुंचता है। कुछ संभाव्यवादी आँकड़ों को साक्ष्य से केवल कंप्यूटिंग समर्थन के रूप में मानते हुए, धारणा को अस्वीकार करते हैं। अन्य, हालांकि, संभावना समारोह के आधार पर धारणा का प्रस्ताव करते हैं, जिनमें से सबसे प्रसिद्ध [[अधिकतम संभावना अनुमान|अधिकतम संभावना]] धारणा है।


=== एआईसी आधारित अनुमान ===
=== एआईसी आधारित अनुमान ===
Line 181: Line 182:
==== न्यूनतम विवरण लंबाई ====
==== न्यूनतम विवरण लंबाई ====
{{Main|Minimum description length}}
{{Main|Minimum description length}}
सूचना सिद्धांत में विचारों से न्यूनतम विवरण लंबाई (एमडीएल) सिद्धांत विकसित किया गया है <रेफरी नाम = सोफी 2000 1349-1353> सूफी (2000) </ रेफ> और [[कोलमोगोरोव जटिलता]] का सिद्धांत। रेफरी नाम=एचवाई>हैनसेन एंड यू (2001)</रेफ> (एमडीएल) सिद्धांत सांख्यिकीय प्रतिरूप का चयन करता है जो आँकड़ा को अधिकतम रूप से संपीड़ित करता है; आँकड़ा के लिए प्रतितथ्यात्मक या गैर-मिथ्या आँकड़ा-उत्पादक तंत्र या [[संभाव्यता मॉडल|संभाव्यता प्रतिरूप]] को ग्रहण किए बिना धारणा आगे बढ़ता है, जैसा कि फ़्रीक्वेंटिस्ट या बायेसियन दृष्टिकोणों में किया जा सकता है।
सूचना सिद्धांत में विचारों से न्यूनतम विवरण लंबाई (एमडीएल) सिद्धांत विकसित किया गया है <रेफरी नाम = सोफी 2000 1349-1353> सूफी (2000) </ रेफ> और [[कोलमोगोरोव जटिलता]] का सिद्धांत। रेफरी नाम=एचवाई>हैनसेन एंड यू (2001)</रेफ> (एमडीएल) सिद्धांत सांख्यिकीय प्रतिरूप का चयन करता है जो आँकड़ा को अधिकतम रूप से संपीड़ित करता है; आँकड़ा के लिए प्रतितथ्यात्मक या गैर-मिथ्या आँकड़ा-उत्पादक तंत्र या [[संभाव्यता मॉडल|संभाव्यता प्रतिरूप]] को ग्रहण किए बिना धारणा आगे बढ़ता है, जैसा कि आवृत्तिवादी या बायेसियन दृष्टिकोणों में किया जा सकता है।


हालांकि, यदि कोई आँकड़ा उत्पादक तंत्र वास्तविकता में मौजूद है, तो [[क्लाउड शैनन]] के [[स्रोत कोडिंग प्रमेय]] के अनुसार यह आँकड़ा का एमडीएल विवरण प्रदान करता है, औसत और विषम रूप से। रेफ नाम = HY747> हैनसेन और यू (2001), पृष्ठ 747। </ रेफ> विवरण लंबाई (या वर्णनात्मक जटिलता) को कम करने में, एमडीएल धारणा अधिकतम संभावना धारणा और अधिकतम पोस्टरियरी धारणा के समान है (अधिकतम एंट्रॉपी संभाव्यता वितरण का उपयोग करके। अधिकतम) -एन्ट्रॉपी बायेसियन प्रायिकता)। हालाँकि, MDL यह मानने से बचता है कि अंतर्निहित संभावना प्रतिरूप ज्ञात है; एमडीएल सिद्धांत को बिना किसी धारणा के भी लागू किया जा सकता है, जैसे आँकड़ा स्वतंत्र नमूने से उत्पन्न हुआ।<ref name=HY747/><ref name=JR>Rissanen (1989), page 84</ref>
हालांकि, यदि कोई आँकड़ा उत्पादक तंत्र वास्तविकता में मौजूद है, तो [[क्लाउड शैनन]] के [[स्रोत कोडिंग प्रमेय]] के अनुसार यह आँकड़ा का एमडीएल विवरण प्रदान करता है, औसत और विषम रूप से। रेफ नाम = HY747> हैनसेन और यू (2001), पृष्ठ 747। </ रेफ> विवरण लंबाई (या वर्णनात्मक जटिलता) को कम करने में, एमडीएल धारणा अधिकतम संभावना धारणा और अधिकतम पोस्टरियरी धारणा के समान है (अधिकतम एंट्रॉपी संभाव्यता वितरण का उपयोग करके। अधिकतम) -एन्ट्रॉपी बायेसियन प्रायिकता)। हालाँकि, MDL यह मानने से बचता है कि अंतर्निहित संभावना प्रतिरूप ज्ञात है; एमडीएल सिद्धांत को बिना किसी धारणा के भी लागू किया जा सकता है, जैसे आँकड़ा स्वतंत्र नमूने से उत्पन्न हुआ।<ref name=HY747/><ref name=JR>Rissanen (1989), page 84</ref>
Line 196: Line 197:
==== संरचनात्मक अनुमान ====
==== संरचनात्मक अनुमान ====


1938 से 1939 तक फिशर और पिटमैन के विचारों का विकास,<ref>Davison, page 12. {{full citation needed|date=November 2012}}</ref> जॉर्ज ए बरनार्ड ने संरचनात्मक धारणा या निर्णायक धारणा विकसित किया,<ref>Barnard, G.A. (1995) "Pivotal Models and the Fiducial Argument", International Statistical Review, 63 (3), 309–323. {{jstor|1403482}}</ref> [[समूह परिवार]] पर हार उपाय का उपयोग कर एक दृष्टिकोण। बरनार्ड ने प्रतिरूपों के एक प्रतिबंधित वर्ग पर प्रत्ययी धारणा के पीछे के तर्कों को सुधारा, जिस पर प्रत्ययी प्रक्रियाएं अच्छी तरह से परिभाषित और उपयोगी होंगी। डोनाल्ड ए एस फ्रेजर ने संरचनात्मक धारणा के लिए एक सामान्य सिद्धांत विकसित किया<ref>{{Cite book|last=Fraser|first=D. A. S.|url=https://www.worldcat.org/oclc/440926|title=अनुमान की संरचना|date=1968|publisher=Wiley|isbn=0-471-27548-4|location=New York|oclc=440926}}</ref> [[समूह सिद्धांत]] के आधार पर और इसे रैखिक प्रतिरूप पर लागू किया।<ref>{{Cite book|last=Fraser|first=D. A. S.|url=https://www.worldcat.org/oclc/3559629|title=निष्कर्ष और रैखिक मॉडल|date=1979|publisher=McGraw-Hill|isbn=0-07-021910-9|location=London|oclc=3559629}}</ref> फ्रेजर द्वारा तैयार किए गए सिद्धांत में निर्णय सिद्धांत और बायेसियन सांख्यिकी के निकट संबंध हैं और यदि वे मौजूद हैं तो इष्टतम फ़्रीक्वेंटिस्ट निर्णय नियम प्रदान कर सकते हैं।<ref>{{Cite journal|last1=Taraldsen|first1=Gunnar|last2=Lindqvist|first2=Bo Henry|date=2013-02-01|title=प्रत्ययी सिद्धांत और इष्टतम अनुमान|url=https://projecteuclid.org/journals/annals-of-statistics/volume-41/issue-1/Fiducial-theory-and-optimal-inference/10.1214/13-AOS1083.full|journal=The Annals of Statistics|volume=41|issue=1|doi=10.1214/13-AOS1083|arxiv=1301.1717|s2cid=88520957|issn=0090-5364}}</ref>
1938 से 1939 तक फिशर और पिटमैन के विचारों का विकास,<ref>Davison, page 12. {{full citation needed|date=November 2012}}</ref> जॉर्ज ए बरनार्ड ने संरचनात्मक धारणा या निर्णायक धारणा विकसित किया,<ref>Barnard, G.A. (1995) "Pivotal Models and the Fiducial Argument", International Statistical Review, 63 (3), 309–323. {{jstor|1403482}}</ref> [[समूह परिवार]] पर हार उपाय का उपयोग कर एक दृष्टिकोण। बरनार्ड ने प्रतिरूपों के एक प्रतिबंधित वर्ग पर प्रत्ययी धारणा के पीछे के तर्कों को सुधारा, जिस पर प्रत्ययी प्रक्रियाएं अच्छी तरह से परिभाषित और उपयोगी होंगी। डोनाल्ड ए एस फ्रेजर ने संरचनात्मक धारणा के लिए एक सामान्य सिद्धांत विकसित किया<ref>{{Cite book|last=Fraser|first=D. A. S.|url=https://www.worldcat.org/oclc/440926|title=अनुमान की संरचना|date=1968|publisher=Wiley|isbn=0-471-27548-4|location=New York|oclc=440926}}</ref> [[समूह सिद्धांत]] के आधार पर और इसे रैखिक प्रतिरूप पर लागू किया।<ref>{{Cite book|last=Fraser|first=D. A. S.|url=https://www.worldcat.org/oclc/3559629|title=निष्कर्ष और रैखिक मॉडल|date=1979|publisher=McGraw-Hill|isbn=0-07-021910-9|location=London|oclc=3559629}}</ref> फ्रेजर द्वारा तैयार किए गए सिद्धांत में निर्णय सिद्धांत और बायेसियन सांख्यिकी के निकट संबंध हैं और यदि वे मौजूद हैं तो इष्टतम आवृत्तिवादी निर्णय नियम प्रदान कर सकते हैं।<ref>{{Cite journal|last1=Taraldsen|first1=Gunnar|last2=Lindqvist|first2=Bo Henry|date=2013-02-01|title=प्रत्ययी सिद्धांत और इष्टतम अनुमान|url=https://projecteuclid.org/journals/annals-of-statistics/volume-41/issue-1/Fiducial-theory-and-optimal-inference/10.1214/13-AOS1083.full|journal=The Annals of Statistics|volume=41|issue=1|doi=10.1214/13-AOS1083|arxiv=1301.1717|s2cid=88520957|issn=0090-5364}}</ref>




Line 206: Line 207:
# सांख्यिकीय परिकल्पना परीक्षण
# सांख्यिकीय परिकल्पना परीक्षण
# आंकड़ों में राय संशोधित करना
# आंकड़ों में राय संशोधित करना
# प्रयोगों का डिजाइन, विचरण का विश्लेषण और [[प्रतिगमन विश्लेषण]]
# प्रयोगों का अभिकल्पना, विचरण का विश्लेषण और [[प्रतिगमन विश्लेषण]]
# सर्वे सैंपलिंग
# सर्वे सैंपलिंग
# [[सांख्यिकीय डेटा का सारांश|सांख्यिकीय आँकड़ा का सारांश]]
# [[सांख्यिकीय डेटा का सारांश|सांख्यिकीय आँकड़ा का सारांश]]

Revision as of 12:20, 12 December 2022

सांख्यिकीय धारणा एक अंतर्निहित संभाव्यता वितरण के गुणों का धारणा लगाने के लिए आँकड़ा विश्लेषण का उपयोग करने की प्रक्रिया है।[1] आनुमानिक सांख्यिकीय विश्लेषण एक सांख्यिकीय आबादी के गुणों का धारणा लगाता है, उदाहरण के लिए परिकल्पनाओं का परीक्षण करके और धारणा प्राप्त करके। यह माना जाता है कि देखा गया आँकड़ा समुच्चय एक बड़ी आबादी से नमूनाकरण (सांख्यिकी) है।

अनुमानात्मक सांख्यिकी की तुलना वर्णनात्मक सांख्यिकी से की जा सकती है। वर्णनात्मक आँकड़े केवल देखे गए आंकड़ों के गुणों से संबंधित हैं, और यह इस धारणा पर आधारित नहीं है कि आंकड़ा एक बड़ी आबादी से आता है। यंत्र अधिगम में, शब्द निष्कर्ष का उपयोग कभी-कभी पहले से प्रशिक्षित प्रतिरूप का मूल्यांकन करके भविष्यवाणी करने के लिए किया जाता है;[2] इस संदर्भ में प्रतिरूप के गुणों का उल्लेख प्रशिक्षण या सीखने (धारणा के बजाय) के रूप में किया जाता है, और भविष्यवाणी के लिए एक प्रतिरूप का उपयोग करने के लिए धारणा (भविष्यवाणी के बजाय) के रूप में संदर्भित किया जाता है; भविष्यसूचक धारणा भी देखें।

परिचय

सांख्यिकीय धारणा जनसंख्या के किसी प्रकार के नमूने (सांख्यिकी) के साथ जनसंख्या से प्राप्त आंकड़ों का उपयोग करके जनसंख्या के बारे में प्रस्ताव बनाता है। आबादी के बारे में एक परिकल्पना को देखते हुए, जिसके लिए हम धारणा लगाना चाहते हैं, सांख्यिकीय धारणा में (पहले) प्रतिरूप चयन प्रक्रिया का एक सांख्यिकीय प्रतिरूप होता है जो आँकड़ा उत्पन्न करता है और (दूसरा) प्रतिरूप से प्रस्तावों को घटाता है।[3]

कोनिशी और कितागावा ने स्पष्ट किया कि, सांख्यिकीय धारणा में अधिकांश समस्याओं को सांख्यिकीय प्रतिरूपण से संबंधित समस्याओं के रूप में माना जा सकता है।[4] संबंधित रूप से, डेविड कॉक्स (सांख्यिकीविद्) ने कहा है, विषय-वस्तु समस्या से सांख्यिकीय प्रतिरूप में अनुवाद कैसे किया जाता है, यह प्रायः एक विश्लेषण का सबसे महत्वपूर्ण हिस्सा होता है।[5]

एक सांख्यिकीय धारणा का तार्किक परिणाम एक सांख्यिकीय प्रस्ताव है।[6] सांख्यिकीय प्रस्ताव के कुछ सामान्य रूप निम्नलिखित हैं:

प्रतिरूप और धारणाएँ

किसी भी सांख्यिकीय धारणा के लिए कुछ मान्यताओं की आवश्यकता होती है। एक सांख्यिकीय प्रतिरूप देखे गए आंकड़े और समान आंकड़ों की पीढ़ी से संबंधित मान्यताओं का एक समूह है। सांख्यिकीय प्रतिरूप के विवरण सामान्यतः हित की जनसंख्या मात्रा की उस भूमिका पर जोर देता है, जिसके बारे में हम धारणा लगाना चाहते हैं।[7] अधिक औपचारिक निष्कर्ष निकाले जाने से पहले वर्णनात्मक आँकड़े सामान्यतः प्रारंभिक चरण के रूप में उपयोग किए जाते हैं।[8]


प्रतिरूप/धारणाओं की घात

सांख्यिकीविद् प्रतिरूपिंग मान्यताओं के तीन स्तरों के बीच अंतर करते हैं;

  • प्राचलिक प्रतिरूप: आँकड़ा-जनन प्रक्रिया का वर्णन करने वाले प्रायिकता वितरण को संभाव्यता वितरण के एक परिवार द्वारा पूरी तरह से वर्णित माना जाता है जिसमें केवल अज्ञात मापदण्ड सम्मिलित होते हैं।[7]उदाहरण के लिए, कोई यह मान सकता है कि जनसंख्या मूल्यों का वितरण वास्तव में सामान्य है, अज्ञात माध्य और विचरण के साथ है, और यह कि आंकड़ेसम्मुच्चय 'सरल' यादृच्छिक नमूनाकरण द्वारा उत्पन्न होते हैं। सामान्यीकृत रैखिक घटकों का परिवार प्राचलिक प्रतिरूप का व्यापक रूप से उपयोग किया जाने वाला और लचीला वर्ग है।
  • गैर-प्राचलिक : आंकड़े उत्पन्न करने की प्रक्रिया के बारे में धारणा प्राचलिक आंकड़ों की तुलना में बहुत कम है और न्यूनतम हो सकती है। [9] उदाहरण के लिए, प्रत्येक निरंतर संभाव्यता वितरण में एक माध्यिका होती है, जिसका अनुमान नमूना माध्यिका या हॉजेस-लेहमन-सेन अनुमानक का उपयोग करके लगाया जा सकता है, जब डेटा सरल यादृच्छिक नमूनाकरण से उत्पन्न होता है तो इसमें अच्छे गुण होते हैं ।
  • अल्प-प्राचलिक: यह शब्द सामान्यतः 'बीच में' पूरी तरह से और गैर-प्राचलिक दृष्टिकोणों की धारणाओं को दर्शाता है। उदाहरण के लिए, कोई यह मान सकता है कि जनसंख्या वितरण का एक परिमित माध्य है। इसके अलावा, कोई यह मान सकता है कि जनसंख्या में औसत प्रतिक्रिया स्तर कुछ सहसंयोजक (एक प्राचलिक धारणा) पर वास्तव में रैखिक तरीके से निर्भर करता है, लेकिन उस माध्य के आसपास के विचरण का वर्णन करने वाला कोई प्राचलिक धारणा नहीं बनाता है (अर्थात किसी विषमलैंगिकता की उपस्थिति या संभावित रूप के बारे में) अधिक सामान्यतः, अर्ध-प्राचलिक प्रतिरूप को प्रायः 'संरचनात्मक' और 'यादृच्छिक भिन्नता' घटकों में अलग किया जा सकता है। एक घटक को प्राचलिक रूप से और दूसरे को गैर-प्राचलिक रूप से व्यवहार किया जाता है। प्रसिद्ध कॉक्स प्रतिरूप अर्ध-प्राचलिक मान्यताओं का एक समूह है।

मान्य प्रतिरूप/धारणाओं का महत्व

उपरोक्त छवि सामान्यता की धारणा का आकलन करने वाला एक हिस्टोग्राम दिखाती है, जिसे बेल कर्व के नीचे समान प्रसार के माध्यम से चित्रित किया जा सकता है।

किसी भी स्तर की धारणा बनाई जाती है, सामान्य रूप से सही ढंग से व्यवस्थित अनुमान, इन धारणाओं को सही होने की आवश्यकता होती है; यानी कि आँकड़ा-उत्पादक प्रक्रिया को वास्तव में सही ढंग से निर्दिष्ट किया गया है।

' सरल 'यादृच्छिक नमूनाकरण सांख्यिकीय धारणा को अमान्य कर सकता है।[9] अधिक जटिल अर्ध- और पूरी तरह से प्राचलिक धारणाएं भी चिंता का कारण हैं। उदाहरण के लिए, गलत तरीके से कॉक्स प्रतिरूप को मानने से कुछ मामलों में गलत निष्कर्ष निकल सकते हैं।[10] जनसंख्या में सामान्यता की गलत धारणाएं प्रतिगमन-आधारित धारणा के कुछ रूपों को भी अमान्य कर देती हैं।[11] किसी भी प्राचलिक प्रतिरूप के उपयोग को मानव जनसंख्या के नमूने लेने में अधिकांश विशेषज्ञों द्वारा संशय की दृष्टि से देखा जाता है: अधिकांश नमूना सांख्यिकीविद, जब वे विश्वास्यता अंतराल से निपटते हैं, तो खुद को बहुत बड़े नमूनों के आधार पर [अनुमानकों] के बारे में बयानों तक सीमित रखते हैं, जहां केंद्रीय सीमा प्रमेय सुनिश्चित करता है। कि इन [अनुमानकों] के वितरण लगभग सामान्य होंगे।[12] विशेष रूप से, एक सामान्य वितरण पूरी तरह से अवास्तविक और भयावह रूप से नासमझ धारणा होगी यदि हम किसी भी प्रकार की आर्थिक आबादी के साथ काम कर रहे हों।[12]यहां, केंद्रीय सीमा प्रमेय बताता है कि बहुत बड़े नमूनों के लिए नमूना माध्य का वितरण लगभग सामान्य रूप से वितरित किया जाता है, यदि वितरण भारी-सपुच्छ वाला नहीं है।

अनुमानित वितरण

नमूना आँकड़ों के सटीक वितरण को निर्दिष्ट करने में कठिनाई को देखते हुए, इनकी धारणा लगाने के लिए कई तरीके विकसित किए गए हैं।

परिमित नमूनों के साथ, सन्निकटन सिद्धांत यह मापता है कि एक सीमित वितरण आँकड़ों के नमूना वितरण के कितने करीब है: उदाहरण के लिए, 10,000 स्वतंत्र नमूनों के साथ, बेरी-एस्सेन प्रमेय द्वारा, सामान्य वितरण अनुमानित (सटीकता के दो अंकों तक) कई जनसंख्या वितरणों के लिए नमूना माध्य का वितरण है।[13]फिर भी कई व्यावहारिक उद्देश्यों के लिए, अनुकरण अध्ययन और सांख्यिकीविदों के अनुभव के अनुसार, 10 (या अधिक) स्वतंत्र नमूने होने पर सामान्य सन्निकटन नमूना-माध्य के वितरण के लिए एक अच्छा सन्निकटन प्रदान करता है।[13]1950 के दशक में कोलमोगोरोव के काम के बाद, उन्नत सांख्यिकी सन्निकटन की त्रुटि को निर्धारित करने के लिए सन्निकटन सिद्धांत और कार्यात्मक विश्लेषण का उपयोग करती है। इस दृष्टिकोण में, प्रायिकता वितरण की मापीय ज्यामिति का अध्ययन किया जाता है; यह दृष्टिकोण अनुमानित त्रुटि को मापता है, उदाहरण के लिए, कुल्बैक-लीब्लर विचलन, ब्रैगमैन विचलन, और हेलिंगर दूरी[14][15][16]

अनिश्चित रूप से बड़े नमूनों के साथ, स्पर्शोन्मुख सिद्धांत (सांख्यिकी) केंद्रीय सीमा प्रमेय की तरह नमूना आँकड़ों के सीमित वितरण का वर्णन करता है, यदि कोई मौजूद है। सीमित परिणाम परिमित नमूनों के बारे में कथन नहीं हैं, और वास्तव में परिमित नमूनों के लिए अप्रासंगिक हैं।[17][18][19] हालांकि, परिमित नमूनों के साथ काम करने के लिए वितरण को सीमित करने के स्पर्शोन्मुख सिद्धांत को प्रायः लागू किया जाता है। उदाहरण के लिए, सीमित परिणाम प्रायः क्षणों की सामान्यीकृत विधि और सामान्यीकृत धारणा समीकरणों के उपयोग को सही ठहराने के लिए लागू होते हैं, जो कि अर्थमिति और जैव-सांख्यिकी में लोकप्रिय हैं। सीमित वितरण और वास्तविक वितरण (औपचारिक रूप से, सन्निकटन की 'त्रुटि') के बीच अंतर के परिमाण का मूल्यांकन अनुकरण का उपयोग करके किया जा सकता है.[20] परिमित नमूनों के परिणामों को सीमित करने का अनुमानी अनुप्रयोग कई अनुप्रयोगों में आम चलन है, विशेष रूप से लॉग-अवतल संभावना वाले कम-आयामी प्रतिरूप के साथ (जैसे कि एक- मापदण्ड घातीय परिवारों के साथ)।

यादृच्छिकीकरण आधारित प्रतिरूप

किसी दिए गए आँकड़ासम्मुच्चय के लिए जो एक यादृच्छिककरण अभिकल्पना द्वारा निर्मित किया गया था, एक सांख्यिकीय (शून्य-परिकल्पना के तहत) के यादृच्छिककरण वितरण को सभी योजनाओं के लिए परीक्षण आंकड़े का मूल्यांकन करके परिभाषित किया गया है जो कि यादृच्छिककरण अभिकल्पना द्वारा उत्पन्न किया जा सकता था। बारंबारतावादी धारणा में, यादृच्छिककरण एक व्यक्तिपरक प्रतिरूप के बजाय यादृच्छिककरण वितरण पर आधारित होने की अनुमति देता है, और यह विशेष रूप से सर्वेक्षण नमूनाकरण और प्रयोगों के अभिकल्पना में महत्वपूर्ण है।[21][22] यादृच्छिक अध्ययन से सांख्यिकीय निष्कर्ष भी कई अन्य स्थितियों की तुलना में अधिक सीधा है।[23][24][25] बायेसियन धारणा में, यादृच्छिककरण भी महत्वपूर्ण है: सर्वेक्षण नमूनाकरण में, प्रतिस्थापन के बिना नमूने का उपयोग जनसंख्या के साथ नमूने की विनिमयशीलता सुनिश्चित करता है; यादृच्छिक प्रयोगों में, यादृच्छिककरण सहविचर जानकारी के लिए यादृच्छिक धारणा पर लापता होने का वारंट करता है।[26] वस्तुनिष्ठ यादृच्छिककरण ठीक से आगमनात्मक प्रक्रियाओं की अनुमति देता है।[27][28][29][30][31] कई सांख्यिकीविद् आंकड़ों के यादृच्छिककरण-आधारित विश्लेषण को पसंद करते हैं जो कि अच्छी तरह से परिभाषित यादृच्छिकीकरण प्रक्रियाओं द्वारा उत्पन्न किया गया था।[32] (हालांकि, यह सच है कि विज्ञान के क्षेत्रों में विकसित सैद्धांतिक ज्ञान और प्रयोगात्मक नियंत्रण के साथ, यादृच्छिक प्रयोग अनुमानों की गुणवत्ता में सुधार किए बिना प्रयोग की लागत बढ़ा सकते हैं।[33][34]) इसी तरह, प्रमुख सांख्यिकीय अधिकारियों द्वारा यादृच्छिक प्रयोगों के परिणामों की अनुशंसा की जाती है क्योंकि समान घटनाओं के अवलोकन संबंधी अध्ययनों की तुलना में अधिक विश्वसनीयता वाले अनुमानों की अनुमति होती है।[35] हालांकि, एक अच्छा अवलोकन संबंधी अध्ययन एक खराब यादृच्छिक प्रयोग से बेहतर हो सकता है।

एक यादृच्छिक प्रयोग का सांख्यिकीय विश्लेषण प्रायोगिक विज्ञप्ति में वर्णित यादृच्छिकीकरण योजना पर आधारित हो सकता है और इसके लिए व्यक्तिपरक प्रतिरूप की आवश्यकता नहीं होती है।[36][37] हालाँकि, किसी भी समय, कुछ परिकल्पनाओं का वस्तुनिष्ठ सांख्यिकीय प्रतिरूप का उपयोग करके परीक्षण नहीं किया जा सकता है, जो यादृच्छिक प्रयोगों या यादृच्छिक नमूनों का सटीक वर्णन करते हैं। कुछ मामलों में, ऐसे यादृच्छिक अध्ययन असंवैधानिक या अनैतिक हैं।

यादृच्छिक प्रयोगों का प्रतिरूप-आधारित विश्लेषण

यादृच्छिक प्रयोगों से आंकड़ों का विश्लेषण करते समय एक सांख्यिकीय प्रतिरूप, उदाहरण के लिए, एक रैखिक या रसद प्रतिरूप को संदर्भित करना मानक अभ्यास है।[38] हालाँकि, यादृच्छिककरण योजना एक सांख्यिकीय प्रतिरूप की पसंद का मार्गदर्शन करती है। यादृच्छिकीकरण योजना को जाने बिना उपयुक्त प्रतिरूप का चयन करना संभव नहीं है।[22]प्रयोगात्मक विज्ञप्ति की अनदेखी करते हुए यादृच्छिक प्रयोगों से आंकड़ों का विश्लेषण करके गंभीर रूप से भ्रामक परिणाम प्राप्त किए जा सकते हैं; सामान्य गलतियों में एक प्रयोग में उपयोग किए गए अवरोधन को भूल जाना और एक ही प्रायोगिक इकाई पर बार-बार माप को अलग-अलग प्रायोगिक इकाइयों पर लागू उपचार की स्वतंत्र प्रतिकृति के साथ भ्रमित करना सम्मिलित है।[39]


प्रतिरूप-मुक्त यादृच्छिककरण अनुमान

प्रतिरूप-मुक्त तकनीकें प्रतिरूप-आधारित विधियों का पूरक प्रदान करती हैं, जो वास्तविकता-सरलीकरण की न्यूनीकरणवादी रणनीतियों को नियोजित करती हैं। पूर्व संयोजन, विकास, पहनावा और कलन विधि को गतिशील रूप से एक प्रक्रिया के प्रासंगिक समानता के अनुकूल बनाने और टिप्पणियों की आंतरिक विशेषताओं को सीखने के लिए नियोजित करती हैं।[38][40] उदाहरण के लिए, प्रतिरूप-मुक्त सरल रेखीय प्रतिगमन निम्न पर आधारित है।

  • एक यादृच्छिक अभिकल्पना, जहां टिप्पणियों के जोड़े स्वतंत्र और समान रूप से वितरित (iid) हैं, या
  • एक नियतात्मक अभिकल्पना, जहां चर नियतात्मक हैं, लेकिन संबंधित प्रतिक्रिया चर एक सामान्य सशर्त वितरण के साथ यादृच्छिक और स्वतंत्र हैं, अर्थात, , जो सूचकांक से स्वतंत्र है।

किसी भी मामले में, सामान्य सशर्त वितरण की सुविधाओं के लिए प्रतिरूप-मुक्त यादृच्छिककरण धारणा कुछ नियमितता स्थितियों पर निर्भर करता है, उदा। कार्यात्मक सहजता। उदाहरण के लिए, जनसंख्या सुविधा सशर्त माध्य के लिए प्रतिरूप-मुक्त यादृच्छिककरण अनुमान, , धारणा के तहत स्थानीय औसत या स्थानीय बहुपद उपयुक्त के माध्यम से लगातार धारणा लगाई जा सकती है कि निर्बाध है। इसके अलावा, स्पर्शोन्मुख सामान्यता या पुनरुत्पादन पर भरोसा करते हुए, हम जनसंख्या विशेषता के लिए विश्वास अंतराल का निर्माण कर सकते हैं, इस मामले में, सशर्त माध्य, .[41]


धारणा के प्रतिमान

सांख्यिकीय धारणा के विभिन्न विद्यालय स्थापित हो गए हैं। ये विद्यालय-या प्रतिमान-पारस्परिक रूप से अनन्य नहीं हैं, और जो तरीके एक प्रतिमान के तहत अच्छी तरह से काम करते हैं, उनकी प्रायः अन्य प्रतिमानों के तहत आकर्षक व्याख्या होती है।

बंद्योपाध्याय और फोस्टर चार प्रतिमानों का वर्णन करते हैं: पारम्परिक (या आवृत्तिवादी अनुमान) प्रतिमान, बायेसियन धारणा प्रतिमान, संभावनावाद प्रतिमान, और एकाइके सूचना मानदंड | अकाइकेन-सूचना मानदंड-आधारित प्रतिमान।[42]


आवृत्तिवादी अनुमान

यह प्रतिमान हाथ में एक के समान आँकड़ासम्मुच्चय बनाने के लिए जनसंख्या वितरण के बार-बार नमूने पर विचार करके प्रस्तावों की संभाव्यता को जांचता है। दोहराए गए नमूने के तहत आँकड़ासम्मुच्चय की विशेषताओं पर विचार करके, एक सांख्यिकीय प्रस्ताव के आवृत्तिवादी गुणों को परिमाणित किया जा सकता है - हालांकि व्यवहार में यह परिमाणीकरण चुनौतीपूर्ण हो सकता है।

आवृत्तिवादी धारणा के उदाहरण

  • p- मूल्य
  • निराकरणीय परिकल्पना अंतराल
  • अशक्त परिकल्पना महत्व परीक्षण

आवृत्तिवादी अनुमान, वस्तुनिष्ठता और निर्णय सिद्धांत

बारंबारतावादी धारणा (या शास्त्रीय अनुमान) की एक व्याख्या यह है कि यह केवल आवृत्ति संभावना के संदर्भ में लागू होता है; यानी, किसी आबादी से बार-बार नमूने लेने के संदर्भ में। हालांकि, नेमन का दृष्टिकोण[43] पूर्व-प्रयोग संभावनाओं के संदर्भ में इन प्रक्रियाओं को विकसित करता है। अर्थात्, एक प्रयोग करने से पहले, एक निष्कर्ष पर आने के लिए एक नियम तय करता है जैसे कि सही होने की संभावना को एक उपयुक्त तरीके से नियंत्रित किया जाता है: इस तरह की संभावना को बारंबारतावादी या बार-बार नमूना व्याख्या की आवश्यकता नहीं होती है। इसके विपरीत, बायेसियन धारणा सशर्त संभावनाओं के संदर्भ में काम करता है (अर्थात देखे गए आँकड़ा पर सशर्त संभावनाएं), सीमांत (लेकिन अज्ञात मापदंडों पर सशर्त) संभावनाओं की तुलना में लगातार दृष्टिकोण में उपयोग किया जाता है।

उपयोगिता कार्यों के संबंध में महत्व परीक्षण और विश्वास अंतराल की लगातार प्रक्रियाओं का निर्माण किया जा सकता है। हालाँकि, आवृत्तिवादी सांख्यिकी के कुछ तत्व, जैसे कि सांख्यिकीय निर्णय सिद्धांत, उपयोगिता कार्यों को सम्मिलित करते हैं।[citation needed] विशेष रूप से, इष्टतम धारणा (जैसे न्यूनतम-विचरण निष्पक्ष अनुमानक, या समान रूप से सबसे शक्तिशाली परीक्षण) के लगातार विकास हानि कार्यों का उपयोग करते हैं, जो (नकारात्मक) उपयोगिता कार्यों की भूमिका निभाते हैं। सांख्यिकीय सिद्धांतकारों को यह साबित करने के लिए हानि कार्यों को स्पष्ट रूप से नहीं बताया जाना चाहिए कि एक सांख्यिकीय प्रक्रिया में इष्टतमता संपत्ति है।[44] हालांकि, नुकसान-प्रकार्य प्रायः इष्टतम गुणों को बताते हुए उपयोगी होते हैं: उदाहरण के लिए, औसत-निष्पक्ष अनुमानक पूर्ण मूल्य हानि कार्यों के तहत इष्टतम होते हैं, जिसमें वे अपेक्षित हानि को कम करते हैं, और कम से कम वर्ग अनुमानक वर्ग त्रुटि हानि कार्यों के तहत इष्टतम होते हैं, जिसमें वे अपेक्षित नुकसान को कम करें।

जबकि बारंबारतावादी धारणा का उपयोग करने वाले सांख्यिकीविदों को स्वयं के लिए रुचि के मापदंडों का चयन करना चाहिए, और उपयोग किए जाने वाले अनुमानक/परीक्षण आंकड़े, स्पष्ट रूप से स्पष्ट उपयोगिताओं और पूर्व वितरण की अनुपस्थिति ने आवृत्तिवादी प्रक्रियाओं को व्यापक रूप से 'उद्देश्य' के रूप में देखने में मदद की है।[45]


बायेसियन अनुमान

बायेसियन कलन संभाव्यता की 'भाषा' का उपयोग करके विश्वास की डिग्री का वर्णन करता है; विश्वास सकारात्मक हैं, एक में एकीकृत होते हैं, और संभाव्यता स्वयंसिद्धों का पालन करते हैं। बायेसियन धारणा सांख्यिकीय प्रस्ताव बनाने के आधार के रूप में उपलब्ध पश्च विश्वासों का उपयोग करता है।[46] बायेसियन प्रायिकता हैं # बायेसियन दृष्टिकोण का उपयोग करने के लिए बायेसियन संभावनाओं का औचित्य।

बायेसियन धारणा के उदाहरण

बायेसियन अनुमान, व्यक्तिपरकता और निर्णय सिद्धांत

कई अनौपचारिक बायेसियन संदर्भ पश्च के सहज रूप से उचित सारांश पर आधारित हैं। उदाहरण के लिए, पश्च माध्य, मध्य और विधा, उच्चतम पश्च घनत्व अंतराल, और बेयस कारक सभी इस तरह से प्रेरित हो सकते हैं। हालांकि इस प्रकार के धारणा के लिए एक उपयोगकर्ता के उपयोगिता कार्य को बताने की आवश्यकता नहीं है, ये सारांश पहले बताए गए विश्वासों पर निर्भर करते हैं (कुछ हद तक), और सामान्यतः व्यक्तिपरक निष्कर्ष के रूप में देखे जाते हैं। (पूर्व निर्माण की विधियाँ जिनमें बाहरी इनपुट की आवश्यकता नहीं होती है बायेसियन संभाव्यता # व्यक्तिगत संभावनाएँ और पुरोहितों के निर्माण के लिए वस्तुनिष्ठ विधियाँ हैं लेकिन अभी तक पूरी तरह से विकसित नहीं हुई हैं।)

औपचारिक रूप से, बायेसियन इंट्रेंस को स्पष्ट रूप से बताई गई उपयोगिता, या हानि प्रकार्य के संदर्भ में कैलिब्रेट किया जाता है; 'बेयस नियम' वह है जो अपेक्षित उपयोगिता को अधिकतम करता है, पश्च अनिश्चितता पर औसत। इसलिए औपचारिक बायेसियन धारणा स्वचालित रूप से एक निर्णय सिद्धांत अर्थ में इष्टतम निर्णय प्रदान करता है। मान्यताओं, आँकड़ा और उपयोगिता को देखते हुए, बायेसियन धारणा अनिवार्य रूप से किसी भी समस्या के लिए बनाया जा सकता है, हालांकि हर सांख्यिकीय धारणा की बायेसियन व्याख्या की आवश्यकता नहीं है। विश्लेषण जो औपचारिक रूप से बायेसियन नहीं हैं (तार्किक रूप से) सुसंगतता (सांख्यिकी) हो सकते हैं; बायेसियन प्रक्रियाओं की एक विशेषता जो उचित पुरोहितों का उपयोग करती है (अर्थात वे जो एक के लिए पूर्णांक हैं) यह है कि उन्हें सुसंगतता (सांख्यिकी) होने की गारंटी दी जाती है। बायेसियन धारणा के कुछ पैरोकार दावा करते हैं कि इस निर्णय-सैद्धांतिक ढांचे में धारणा लगाया जाना चाहिए, और बायेसियन धारणा को बाद के विश्वासों के मूल्यांकन और सारांश के साथ समाप्त नहीं करना चाहिए।

संभावना आधारित अनुमान

संभावना प्रकार्य का उपयोग करके संभावनावाद आंकड़ों तक पहुंचता है। कुछ संभाव्यवादी आँकड़ों को साक्ष्य से केवल कंप्यूटिंग समर्थन के रूप में मानते हुए, धारणा को अस्वीकार करते हैं। अन्य, हालांकि, संभावना समारोह के आधार पर धारणा का प्रस्ताव करते हैं, जिनमें से सबसे प्रसिद्ध अधिकतम संभावना धारणा है।

एआईसी आधारित अनुमान

Akaike सूचना मानदंड (AIC) आँकड़ा के दिए गए सम्मुच्चय के लिए सांख्यिकीय प्रतिरूप की सापेक्ष गुणवत्ता का एक अनुमानक है। आँकड़ा के लिए प्रतिरूपों के संग्रह को देखते हुए, एआईसी प्रत्येक प्रतिरूप की गुणवत्ता का धारणा लगाता है, प्रत्येक अन्य प्रतिरूप के सापेक्ष। इस प्रकार, एआईसी प्रतिरूप चयन के लिए एक साधन प्रदान करता है।

एआईसी सूचना सिद्धांत पर आधारित है: यह आँकड़ा उत्पन्न करने वाली प्रक्रिया का प्रतिनिधित्व करने के लिए दिए गए प्रतिरूप का उपयोग करते समय खोई हुई सापेक्ष जानकारी का धारणा प्रदान करता है। (ऐसा करने में, यह प्रतिरूप के फिट होने की अच्छाई और प्रतिरूप की सादगी के बीच व्यापार-बंद से संबंधित है।)

धारणा के लिए अन्य प्रतिमान

न्यूनतम विवरण लंबाई

सूचना सिद्धांत में विचारों से न्यूनतम विवरण लंबाई (एमडीएल) सिद्धांत विकसित किया गया है <रेफरी नाम = सोफी 2000 1349-1353> सूफी (2000) </ रेफ> और कोलमोगोरोव जटिलता का सिद्धांत। रेफरी नाम=एचवाई>हैनसेन एंड यू (2001)</रेफ> (एमडीएल) सिद्धांत सांख्यिकीय प्रतिरूप का चयन करता है जो आँकड़ा को अधिकतम रूप से संपीड़ित करता है; आँकड़ा के लिए प्रतितथ्यात्मक या गैर-मिथ्या आँकड़ा-उत्पादक तंत्र या संभाव्यता प्रतिरूप को ग्रहण किए बिना धारणा आगे बढ़ता है, जैसा कि आवृत्तिवादी या बायेसियन दृष्टिकोणों में किया जा सकता है।

हालांकि, यदि कोई आँकड़ा उत्पादक तंत्र वास्तविकता में मौजूद है, तो क्लाउड शैनन के स्रोत कोडिंग प्रमेय के अनुसार यह आँकड़ा का एमडीएल विवरण प्रदान करता है, औसत और विषम रूप से। रेफ नाम = HY747> हैनसेन और यू (2001), पृष्ठ 747। </ रेफ> विवरण लंबाई (या वर्णनात्मक जटिलता) को कम करने में, एमडीएल धारणा अधिकतम संभावना धारणा और अधिकतम पोस्टरियरी धारणा के समान है (अधिकतम एंट्रॉपी संभाव्यता वितरण का उपयोग करके। अधिकतम) -एन्ट्रॉपी बायेसियन प्रायिकता)। हालाँकि, MDL यह मानने से बचता है कि अंतर्निहित संभावना प्रतिरूप ज्ञात है; एमडीएल सिद्धांत को बिना किसी धारणा के भी लागू किया जा सकता है, जैसे आँकड़ा स्वतंत्र नमूने से उत्पन्न हुआ।[47][48] एमडीएल सिद्धांत संचार-कोडिंग सिद्धांत में सूचना सिद्धांत में, रैखिक प्रतिगमन में लागू किया गया है,[48]और आँकड़ा माइनिंग में।[49]

एमडीएल-आधारित अनुमानित प्रक्रियाओं का मूल्यांकन प्रायः कम्प्यूटेशनल जटिलता सिद्धांत से तकनीकों या मानदंडों का उपयोग करता है।[50]


प्रत्ययी अनुमान

प्रत्ययी अनुमान, प्रत्ययी संभाव्यता पर आधारित सांख्यिकीय धारणा के लिए एक दृष्टिकोण था, जिसे प्रत्ययी वितरण के रूप में भी जाना जाता है। बाद के काम में, इस दृष्टिकोण को खराब परिभाषित, प्रयोज्यता में बेहद सीमित और यहां तक ​​कि भ्रामक कहा गया है।[51][52] हालाँकि यह तर्क वही है जो दिखाता है[53] कि एक तथाकथित विश्वास वितरण एक वैध प्रायिकता डिस्ट्रीब्यूशन नहीं है और चूंकि इसने विश्वास्यता अंतराल्स के आवेदन को अमान्य नहीं किया है, यह आवश्यक रूप से फिडुशियल तर्कों से निकाले गए निष्कर्षों को अमान्य नहीं करता है। ऊपरी और निचली संभावनाओं का उपयोग करते हुए एक धारणा सिद्धांत के एक विशेष मामले के रूप में फिशर की फिदुकियल संभावना के शुरुआती कार्य की पुनर्व्याख्या करने का प्रयास किया गया था।[54]


संरचनात्मक अनुमान

1938 से 1939 तक फिशर और पिटमैन के विचारों का विकास,[55] जॉर्ज ए बरनार्ड ने संरचनात्मक धारणा या निर्णायक धारणा विकसित किया,[56] समूह परिवार पर हार उपाय का उपयोग कर एक दृष्टिकोण। बरनार्ड ने प्रतिरूपों के एक प्रतिबंधित वर्ग पर प्रत्ययी धारणा के पीछे के तर्कों को सुधारा, जिस पर प्रत्ययी प्रक्रियाएं अच्छी तरह से परिभाषित और उपयोगी होंगी। डोनाल्ड ए एस फ्रेजर ने संरचनात्मक धारणा के लिए एक सामान्य सिद्धांत विकसित किया[57] समूह सिद्धांत के आधार पर और इसे रैखिक प्रतिरूप पर लागू किया।[58] फ्रेजर द्वारा तैयार किए गए सिद्धांत में निर्णय सिद्धांत और बायेसियन सांख्यिकी के निकट संबंध हैं और यदि वे मौजूद हैं तो इष्टतम आवृत्तिवादी निर्णय नियम प्रदान कर सकते हैं।[59]


निष्कर्ष विषय

नीचे दिए गए विषयों को आमतौर पर सांख्यिकीय धारणा के क्षेत्र में सम्मिलित किया जाता है।

  1. सांख्यिकीय धारणाएँ
  2. सांख्यिकीय निर्णय सिद्धांत
  3. धारणा सिद्धांत
  4. सांख्यिकीय परिकल्पना परीक्षण
  5. आंकड़ों में राय संशोधित करना
  6. प्रयोगों का अभिकल्पना, विचरण का विश्लेषण और प्रतिगमन विश्लेषण
  7. सर्वे सैंपलिंग
  8. सांख्यिकीय आँकड़ा का सारांश

भविष्य कहनेवाला धारणा

भविष्य कहनेवाला निष्कर्ष सांख्यिकीय धारणा के लिए एक दृष्टिकोण है जो पिछले टिप्पणियों के आधार पर भविष्य की टिप्पणियों की भविष्यवाणी पर जोर देता है।

प्रारंभ में, भविष्य कहनेवाला धारणा अवलोकन योग्य मापदंडों पर आधारित था और यह संभाव्यता का अध्ययन करने का मुख्य उद्देश्य था,[citation needed] लेकिन 20वीं शताब्दी में ब्रूनो डी फिनेची द्वारा पेश किए गए एक नए प्राचलिक दृष्टिकोण के कारण यह समर्थन से बाहर हो गया। त्रुटि के साथ देखी गई भौतिक प्रणाली के रूप में दृष्टिकोण ने घटना को प्रतिरूपित किया (उदाहरण के लिए, आकाशीय यांत्रिकी)। डि फिनेटी का विनिमेयता का विचार - कि भविष्य की टिप्पणियों को पिछली टिप्पणियों की तरह व्यवहार करना चाहिए - उनके 1937 के पेपर के फ्रेंच से 1974 के अनुवाद के साथ अंग्रेजी बोलने वाली दुनिया का ध्यान आया,[60] और तब से सीमोर गीजर जैसे सांख्यिकीविदों द्वारा प्रतिपादित किया गया है।[61]


यह भी देखें

टिप्पणियाँ

  1. According to Peirce, acceptance means that inquiry on this question ceases for the time being. In science, all scientific theories are revisable.


संदर्भ

उद्धरण

  1. Upton, G., Cook, I. (2008) Oxford Dictionary of Statistics, OUP. ISBN 978-0-19-954145-4.
  2. "TensorFlow लाइट अनुमान". शब्द अनुमान इनपुट डेटा के आधार पर भविष्यवाणी करने के लिए डिवाइस पर TensorFlow Lite मॉडल को निष्पादित करने की प्रक्रिया को संदर्भित करता है।
  3. Johnson, Richard (12 March 2016). "सांख्यिकीय निष्कर्ष". Encyclopedia of Mathematics. Springer: The European Mathematical Society. Retrieved 26 October 2022.
  4. Konishi & Kitagawa (2008), p. 75.
  5. Cox (2006), p. 197.
  6. "सांख्यिकीय अनुमान - गणित का विश्वकोश". www.encyclopediaofmath.org. Retrieved 2019-01-23.
  7. 7.0 7.1 Cox (2006) page 2
  8. Evans, Michael; et al. (2004). संभाव्यता और सांख्यिकी: अनिश्चितता का विज्ञान. Freeman and Company. p. 267. ISBN 9780716747420.
  9. Kruskal 1988
  10. Freedman, D.A. (2008) "Survival analysis: An Epidemiological hazard?". The American Statistician (2008) 62: 110-119. (Reprinted as Chapter 11 (pages 169–192) of Freedman (2010)).
  11. Berk, R. (2003) Regression Analysis: A Constructive Critique (Advanced Quantitative Techniques in the Social Sciences) (v. 11) Sage Publications. ISBN 0-7619-2904-5
  12. 12.0 12.1 Brewer, Ken (2002). संयुक्त सर्वेक्षण नमूना निष्कर्ष: बसु के हाथियों का वजन. Hodder Arnold. p. 6. ISBN 978-0340692295.
  13. 13.0 13.1 Jörgen Hoffman-Jörgensen's Probability With a View Towards Statistics, Volume I. Page 399[full citation needed]
  14. Le Cam (1986)[page needed]
  15. Erik Torgerson (1991) Comparison of Statistical Experiments, volume 36 of Encyclopedia of Mathematics. Cambridge University Press.[full citation needed]
  16. Liese, Friedrich & Miescke, Klaus-J. (2008). सांख्यिकीय निर्णय सिद्धांत: अनुमान, परीक्षण और चयन. Springer. ISBN 978-0-387-73193-3.
  17. Kolmogorov (1963, p.369): "The frequency concept, based on the notion of limiting frequency as the number of trials increases to infinity, does not contribute anything to substantiate the applicability of the results of probability theory to real practical problems where we have always to deal with a finite number of trials".
  18. "Indeed, limit theorems 'as  tends to infinity' are logically devoid of content about what happens at any particular . All they can do is suggest certain approaches whose performance must then be checked on the case at hand." — Le Cam (1986) (page xiv)
  19. Pfanzagl (1994): "The crucial drawback of asymptotic theory: What we expect from asymptotic theory are results which hold approximately . . . . What asymptotic theory has to offer are limit theorems."(page ix) "What counts for applications are approximations, not limits." (page 188)
  20. Pfanzagl (1994) : "By taking a limit theorem as being approximately true for large sample sizes, we commit an error the size of which is unknown. [. . .] Realistic information about the remaining errors may be obtained by simulations." (page ix)
  21. Neyman, J.(1934) "On the two different aspects of the representative method: The method of stratified sampling and the method of purposive selection", Journal of the Royal Statistical Society, 97 (4), 557–625 JSTOR 2342192
  22. 22.0 22.1 Hinkelmann and Kempthorne(2008)[page needed]
  23. ASA Guidelines for the first course in statistics for non-statisticians. (available at the ASA website)
  24. David A. Freedman et alia's Statistics.
  25. Moore et al. (2015).
  26. Gelman A. et al. (2013). Bayesian Data Analysis (Chapman & Hall).
  27. Peirce (1877-1878)
  28. Peirce (1883)
  29. Freedman, Pisani & Purves 1978.
  30. David A. Freedman Statistical Models.
  31. Rao, C.R. (1997) Statistics and Truth: Putting Chance to Work, World Scientific. ISBN 981-02-3111-3
  32. Peirce; Freedman; Moore et al. (2015).[citation needed]
  33. Box, G.E.P. and Friends (2006) Improving Almost Anything: Ideas and Essays, Revised Edition, Wiley. ISBN 978-0-471-72755-2
  34. Cox (2006), p. 196.
  35. ASA Guidelines for the first course in statistics for non-statisticians. (available at the ASA website)
    • David A. Freedman et alias Statistics.
    • Moore et al. (2015).
  36. Neyman, Jerzy. 1923 [1990]. "On the Application of Probability Theory to AgriculturalExperiments. Essay on Principles. Section 9." Statistical Science 5 (4): 465–472. Trans. Dorota M. Dabrowska and Terence P. Speed.
  37. Hinkelmann & Kempthorne (2008)[page needed]
  38. 38.0 38.1 Dinov, Ivo; Palanimalai, Selvam; Khare, Ashwini; Christou, Nicolas (2018). "Randomization‐based statistical inference: A resampling and simulation infrastructure". Teaching Statistics. 40 (2): 64–73. doi:10.1111/test.12156. PMC 6155997. PMID 30270947.
  39. Hinkelmann and Kempthorne (2008) Chapter 6.
  40. Tang, Ming; Gao, Chao; Goutman, Stephen; Kalinin, Alexandr; Mukherjee, Bhramar; Guan, Yuanfang; Dinov, Ivo (2019). "Model-Based and Model-Free Techniques for Amyotrophic Lateral Sclerosis Diagnostic Prediction and Patient Clustering". Neuroinformatics. 17 (3): 407–421. doi:10.1007/s12021-018-9406-9. PMC 6527505. PMID 30460455.
  41. Politis, D.N. (2019). "Model-free inference in statistics: how and why". IMS Bulletin. 48.
  42. Bandyopadhyay & Forster (2011). See the book's Introduction (p.3) and "Section III: Four Paradigms of Statistics".
  43. Neyman, J. (1937). "संभाव्यता के शास्त्रीय सिद्धांत के आधार पर सांख्यिकीय अनुमान के सिद्धांत की रूपरेखा". Philosophical Transactions of the Royal Society of London A. 236 (767): 333–380. Bibcode:1937RSPTA.236..333N. doi:10.1098/rsta.1937.0005. JSTOR 91337.
  44. Preface to Pfanzagl.
  45. Little, Roderick J. (2006). "कैलिब्रेटेड बेयस: ए बेयस/फ्रीक्वेंटिस्ट रोडमैप". The American Statistician. 60 (3): 213–223. doi:10.1198/000313006X117837. ISSN 0003-1305. JSTOR 27643780. S2CID 53505632.
  46. Lee, Se Yoon (2021). "Gibbs sampler and coordinate ascent variational inference: A set-theoretical review". Communications in Statistics - Theory and Methods. 51 (6): 1549–1568. arXiv:2008.01006. doi:10.1080/03610926.2021.1921214. S2CID 220935477.
  47. Cite error: Invalid <ref> tag; no text was provided for refs named HY747
  48. 48.0 48.1 Rissanen (1989), page 84
  49. Cite error: Invalid <ref> tag; no text was provided for refs named HY
  50. Joseph F. Traub, G. W. Wasilkowski, and H. Wozniakowski. (1988)[page needed]
  51. Neyman (1956)
  52. Zabell (1992)
  53. Cox (2006) page 66
  54. Hampel 2003.
  55. Davison, page 12.[full citation needed]
  56. Barnard, G.A. (1995) "Pivotal Models and the Fiducial Argument", International Statistical Review, 63 (3), 309–323. JSTOR 1403482
  57. Fraser, D. A. S. (1968). अनुमान की संरचना. New York: Wiley. ISBN 0-471-27548-4. OCLC 440926.
  58. Fraser, D. A. S. (1979). निष्कर्ष और रैखिक मॉडल. London: McGraw-Hill. ISBN 0-07-021910-9. OCLC 3559629.
  59. Taraldsen, Gunnar; Lindqvist, Bo Henry (2013-02-01). "प्रत्ययी सिद्धांत और इष्टतम अनुमान". The Annals of Statistics. 41 (1). arXiv:1301.1717. doi:10.1214/13-AOS1083. ISSN 0090-5364. S2CID 88520957.
  60. De Finetti, Bruno (1937). "पूर्वानुमान: इसके तार्किक कानून, इसके व्यक्तिपरक स्रोत". Annales de l'Institut Henri Poincaré. 7 (1): 1–68. ISSN 0365-320X. Translated in De Finetti, Bruno (1992). "Foresight: Its Logical Laws, Its Subjective Sources". Breakthroughs in Statistics. Springer Series in Statistics. pp. 134–174. doi:10.1007/978-1-4612-0919-5_10. ISBN 978-0-387-94037-3.
  61. Geisser, Seymour (1993) Predictive Inference: An Introduction, CRC Press. ISBN 0-412-03471-9


स्रोत


अग्रिम पठन


इस पेज में लापता आंतरिक लिंक की सूची

  • प्रायिकता वितरण
  • सांख्यिकीय जनसंख्या
  • बिंदु लागत
  • आवृत्ति संभावना
  • नमूना माध्य
  • ब्रेगमैन विचलन
  • जैव सांख्यिकी
  • संभावना समारोह
  • लघुगणकीय रूप से अवतल कार्य
  • बायेसियन निष्कर्ष
  • यादृच्छिक रूप से लापता
  • विनिमय योग्यता
  • प्रतिस्थापन के बिना नमूनाकरण
  • एकैके सूचना मानदंड
  • शून्य परिकल्पना
  • उपयोगिता समारोह
  • लॉस फंकशन
  • आकलनकर्ता
  • निरपेक्ष मूल्य
  • कम से कम वर्गों
  • बायस कारक
  • जुटना (सांख्यिकी)
  • स्वस्थ रहने के फायदे
  • क़ीमत लगानेवाला
  • पश्च धारणा से अधिकतम
  • बायेसियन संभावना
  • अधिकतम एन्ट्रापी संभाव्यता वितरण
  • रेखीय प्रतिगमन
  • प्रत्ययी संभावना
  • ऊपरी और निचली संभावनाएँ
  • उसका नाप
  • सांख्यिकी में राय को संशोधित करना
  • भिन्नता का विश्लेषण
  • प्रयोगों की रूप रेखा
  • संभावना

बाहरी संबंध