सांख्यिकीय अनुमिति: Difference between revisions

From Vigyanwiki
(text)
Line 189: Line 189:
{{Main|न्यूनतम विवरण लंबाई}}
{{Main|न्यूनतम विवरण लंबाई}}


सूचना सिद्धांत [48] और कोलमोगोरोव जटिलता के सिद्धांत में विचारों से न्यूनतम विवरण लंबाई (MDL) सिद्धांत विकसित किया गया है।(MDL) सिद्धांत सांख्यिकीय प्रतिरूप का चयन करता है जो आंकड़े  को अधिकतम रूप से संपीड़ित करता है; आंकड़ों के लिए प्रतितथ्यात्मक या गैर-मिथ्या आंकड़े -उत्पादक तंत्र या [[संभाव्यता मॉडल|संभाव्यता प्रतिरूप]] को ग्रहण किए बिना अनुमान आगे बढ़ती है, जैसा कि आवृत्तिवादी या बायेसियन दृष्टिकोणों में किया जा सकता है।
सूचना सिद्धांत [48] और कोलमोगोरोव जटिलता के सिद्धांत में विचारों से न्यूनतम विवरण लंबाई (MDL) सिद्धांत विकसित किया गया है।(MDL) सिद्धांत सांख्यिकीय प्रतिरूप का चयन करता है जो आंकड़े  को अधिकतम रूप से संपीड़ित करता है; आंकड़ों के लिए प्रतितथ्यात्मक या गैर-मिथ्या आंकड़े -उत्पादक तंत्र या [[संभाव्यता मॉडल|संभाव्यता प्रतिरूप]] को ग्रहण किए बिना अनुमान आगे बढ़ती है, जैसा कि आवृत्तिवादी या बायेसियन दृष्टिकोणों में किया जा सकता है।<ref name=HY747>


हालांकि, यदि कोई आंकड़े  उत्पादक तंत्र वास्तविकता में मौजूद है, तो [[क्लाउड शैनन]] के [[स्रोत कोडिंग प्रमेय|स्रोत कूटलेखन प्रमेय]] के अनुसार यह आंकड़े  MDL का औसत और विषम रूप से विवरण प्रदान करता है।  विवरण लंबाई (या वर्णनात्मक जटिलता) को कम करने में, MDL अनुमान अधिकतम संभावना अनुमान और अधिकतम पोस्टरियरी अनुमान के समान है (अधिकतम परिक्षय संभाव्यता वितरण का उपयोग करके। अधिकतम) -परिक्षय बायेसियन प्रायिकता)। हालाँकि, MDL यह मानने से बचता है कि अंतर्निहित संभावना प्रतिरूप ज्ञात है; MDL सिद्धांत को बिना किसी अनुमान के भी लागू किया जा सकता है, जैसे आंकड़े  स्वतंत्र नमूने से उत्पन्न हुआ।<ref name=HY747/><ref name=JR>Rissanen (1989), page 84</ref>
हालांकि, यदि कोई आंकड़े  उत्पादक तंत्र वास्तविकता में मौजूद है, तो [[क्लाउड शैनन]] के [[स्रोत कोडिंग प्रमेय|स्रोत कूटलेखन प्रमेय]] के अनुसार यह आंकड़े  MDL का औसत और विषम रूप से विवरण प्रदान करता है।  विवरण लंबाई (या वर्णनात्मक जटिलता) को कम करने में, MDL अनुमान अधिकतम संभावना अनुमान और अधिकतम पोस्टरियरी अनुमान के समान है (अधिकतम परिक्षय संभाव्यता वितरण का उपयोग करके। अधिकतम) -परिक्षय बायेसियन प्रायिकता)। हालाँकि, MDL यह मानने से बचता है कि अंतर्निहित संभावना प्रतिरूप ज्ञात है; MDL सिद्धांत को बिना किसी अनुमान के भी लागू किया जा सकता है, जैसे आंकड़े  स्वतंत्र नमूने से उत्पन्न हुआ।<ref name=HY747/><ref name=JR>Rissanen (1989), page 84</ref>
Line 196: Line 196:
MDL-आधारित अनुमानित प्रक्रियाओं का मूल्यांकन प्रायः [[कम्प्यूटेशनल जटिलता सिद्धांत|संगणनात्मक जटिलता सिद्धांत]] से तकनीकों या मानदंडों का उपयोग करता है।<ref>Joseph F. Traub, G. W. Wasilkowski, and H. Wozniakowski. (1988) {{page needed|date=June 2011}}</ref>
MDL-आधारित अनुमानित प्रक्रियाओं का मूल्यांकन प्रायः [[कम्प्यूटेशनल जटिलता सिद्धांत|संगणनात्मक जटिलता सिद्धांत]] से तकनीकों या मानदंडों का उपयोग करता है।<ref>Joseph F. Traub, G. W. Wasilkowski, and H. Wozniakowski. (1988) {{page needed|date=June 2011}}</ref>


[[Category:All articles with incomplete citations]]
[[Category:All articles with unsourced statements]]
[[Category:Articles using small message boxes]]
[[Category:Articles with hatnote templates targeting a nonexistent page]]
[[Category:Articles with incomplete citations from November 2012]]
[[Category:Articles with invalid date parameter in template]]
[[Category:Articles with short description]]
[[Category:Articles with unsourced statements from April 2012]]
[[Category:Articles with unsourced statements from March 2010]]
[[Category:Articles with unsourced statements from November 2011]]


==== प्रत्ययी अनुमान ====
==== प्रत्ययी अनुमान ====

Revision as of 20:48, 21 December 2022

सांख्यिकीय अनुमान एक अंतर्निहित संभाव्यता वितरण के गुणों का अनुमान लगाने के लिए आंकड़े विश्लेषण का उपयोग करने की प्रक्रिया है।[1] आनुमानिक सांख्यिकीय विश्लेषण एक सांख्यिकीय आबादी के गुणों की अनुमान लगाता है, उदाहरण के लिए परिकल्पनाओं का परीक्षण करके और अनुमान प्राप्त करके। यह माना जाता है कि देखे गए आंकड़े समुच्चय एक बड़ी आबादी का नमूनाकरण (सांख्यिकी) है।

अनुमानात्मक सांख्यिकी की तुलना वर्णनात्मक सांख्यिकी से की जा सकती है। वर्णनात्मक आँकड़े केवल देखे गए आंकड़ों के गुणों से संबंधित हैं, और यह इस अनुमान पर आधारित नहीं है कि आंकड़ा एक बड़ी आबादी से आता है। यंत्र अधिगम में, शब्द निष्कर्ष का उपयोग कभी-कभी पहले से प्रशिक्षित प्रतिरूप का मूल्यांकन करके भविष्यवाणी करने के लिए किया जाता है;[2] इस संदर्भ में प्रतिरूप के गुणों का उल्लेख प्रशिक्षण या सीखने (अनुमान के बजाय) के रूप में किया जाता है, और भविष्यवाणी के लिए एक प्रतिरूप का उपयोग करने के लिए अनुमान (भविष्यवाणी के बजाय) के रूप में संदर्भित किया जाता है; भविष्यसूचक अनुमान भी देखें।

परिचय

सांख्यिकीय अनुमान जनसंख्या के किसी प्रकार के नमूने (सांख्यिकी) के साथ जनसंख्या से प्राप्त आंकड़ों का उपयोग करके जनसंख्या के बारे में प्रस्ताव बनाता है। आबादी के बारे में एक परिकल्पना को देखते हुए, जिसके लिए हम अनुमान लगाना चाहते हैं, सांख्यिकीय अनुमान में (पहले) प्रतिरूप चयन प्रक्रिया का एक सांख्यिकीय प्रतिरूप होता है जो आंकड़े उत्पन्न करता है और (दूसरा) प्रतिरूप से प्रस्तावों को घटाता है।[3]

कोनिशी और कितागावा ने स्पष्ट किया कि, सांख्यिकीय अनुमान में अधिकांश समस्याओं को सांख्यिकीय प्रतिरूपण से संबंधित समस्याओं के रूप में माना जा सकता है।[4] संबंधित रूप से, डेविड कॉक्स (सांख्यिकीविद्) ने कहा है, विषय-वस्तु समस्या से सांख्यिकीय प्रतिरूप में अनुवाद कैसे किया जाता है, यह प्रायः एक विश्लेषण का सबसे महत्वपूर्ण हिस्सा होता है।[5]

एक सांख्यिकीय अनुमान का तार्किक परिणाम एक सांख्यिकीय प्रस्ताव है।[6] सांख्यिकीय प्रस्ताव के कुछ सामान्य रूप निम्नलिखित हैं:

प्रतिरूप और अनुमानएँ

किसी भी सांख्यिकीय अनुमान के लिए कुछ मान्यताओं की आवश्यकता होती है। एक सांख्यिकीय प्रतिरूप देखे गए आंकड़े और समान आंकड़ों की पीढ़ी से संबंधित मान्यताओं का एक समूह है। सांख्यिकीय प्रतिरूप के विवरण सामान्यतः हित की जनसंख्या मात्रा की उस भूमिका पर जोर देता है, जिसके बारे में हम अनुमान लगाना चाहते हैं।[7] अधिक औपचारिक निष्कर्ष निकाले जाने से पहले वर्णनात्मक आँकड़े सामान्यतः प्रारंभिक चरण के रूप में उपयोग किए जाते हैं।[8]


प्रतिरूप/अनुमानओं की घात

सांख्यिकीविद् प्रतिरूपण मान्यताओं के तीन स्तरों के बीच अंतर करते हैं;

  • प्राचलिक प्रतिरूप: आंकड़े -जनन प्रक्रिया का वर्णन करने वाले प्रायिकता वितरण को संभाव्यता वितरण के एक परिवार द्वारा पूरी तरह से वर्णित माना जाता है जिसमें केवल अज्ञात मापदण्ड सम्मिलित होते हैं।[7]उदाहरण के लिए, कोई यह मान सकता है कि जनसंख्या मूल्यों का वितरण वास्तव में सामान्य है, अज्ञात माध्य और विचरण के साथ है, और यह कि आंकड़े सम्मुच्चय 'सरल' यादृच्छिक नमूनाकरण द्वारा उत्पन्न होते हैं। सामान्यीकृत रैखिक घटकों का परिवार प्राचलिक प्रतिरूप का व्यापक रूप से उपयोग किया जाने वाला और लचीला वर्ग है।
  • गैर-प्राचलिक: आंकड़े उत्पन्न करने की प्रक्रिया के बारे में अनुमान प्राचलिक आंकड़ों की तुलना में बहुत कम है और न्यूनतम हो सकती है। [9] उदाहरण के लिए, प्रत्येक निरंतर संभाव्यता वितरण में एक माध्यिका होती है, जिसका अनुमान नमूना माध्यिका या हॉजेस-लेहमन-सेन अनुमानक का उपयोग करके लगाया जा सकता है, जब डेटा सरल यादृच्छिक नमूनाकरण से उत्पन्न होता है तो इसमें अच्छे गुण होते हैं ।
  • अल्प-प्राचलिक: यह शब्द सामान्यतः 'बीच में' पूरी तरह से और गैर-प्राचलिक दृष्टिकोणों की अनुमानओं को दर्शाता है। उदाहरण के लिए, कोई यह मान सकता है कि जनसंख्या वितरण का एक परिमित माध्य है। इसके अलावा, कोई यह मान सकता है कि जनसंख्या में औसत प्रतिक्रिया स्तर कुछ सहसंयोजक (एक प्राचलिक अनुमान) पर वास्तव में रैखिक तरीके से निर्भर करता है, लेकिन उस माध्य के आसपास के विचरण का वर्णन करने वाला कोई प्राचलिक अनुमान नहीं बनाता है (अर्थात किसी विषमलैंगिकता की उपस्थिति या संभावित रूप के बारे में) अधिक सामान्यतः, अर्ध-प्राचलिक प्रतिरूप को प्रायः 'संरचनात्मक' और 'यादृच्छिक भिन्नता' घटकों में अलग किया जा सकता है। एक घटक को प्राचलिक रूप से और दूसरे को गैर-प्राचलिक रूप से व्यवहार किया जाता है। प्रसिद्ध कॉक्स प्रतिरूप अर्ध-प्राचलिक मान्यताओं का एक समूह है।

मान्य प्रतिरूप/अनुमानओं का महत्व

उपरोक्त छवि सामान्यता की अनुमान का आकलन करने वाला एक हिस्टोग्राम दिखाती है, जिसे बेल कर्व के नीचे समान प्रसार के माध्यम से चित्रित किया जा सकता है।

जिस भी स्तर का अनुमान लगाया जाता है, सामान्य रूप से सही ढंग से व्यवस्थित अनुमान होते हैं, इन अनुमानों को सही होने की आवश्यकता होती है; यानी कि आंकड़े -उत्पादक प्रक्रिया को वास्तव में सही ढंग से निर्दिष्ट किया गया है।

' सरल 'यादृच्छिक नमूनाकरण सांख्यिकीय अनुमान को अमान्य कर सकता है।[9] अधिक जटिल अर्ध- और पूरी तरह से प्राचलिक अनुमानएं भी चिंता का कारण हैं। उदाहरण के लिए, गलत तरीके से कॉक्स प्रतिरूप को मानने से कुछ मामलों में गलत निष्कर्ष निकल सकते हैं।[10] जनसंख्या में सामान्यता की गलत अनुमानएं प्रतिगमन-आधारित अनुमान के कुछ रूपों को भी अमान्य कर देती हैं।[11] किसी भी प्राचलिक प्रतिरूप के उपयोग को मानव जनसंख्या के नमूने लेने में अधिकांश विशेषज्ञों द्वारा संशय की दृष्टि से देखा जाता है: अधिकांश सांख्यिकीविद नमूने, जब विश्वास्यता अंतराल से निपटते हैं, तो खुद को बहुत बड़े नमूनों के आधार पर [अनुमानकों] के बारे में बयानों तक सीमित रखते हैं, जहां केंद्रीय सीमा प्रमेय सुनिश्चित करता है। कि इन [अनुमानकों] के वितरण लगभग सामान्य होंगे।[12] विशेष रूप से, एक सामान्य वितरण पूरी तरह से अवास्तविक और भयावह रूप से नासमझ अनुमान होगी यदि हम किसी भी प्रकार की आर्थिक आबादी के साथ काम कर रहे हों।[12]यहां, केंद्रीय सीमा प्रमेय बताता है कि बहुत बड़े नमूनों के लिए नमूना माध्य का वितरण लगभग सामान्य रूप से वितरित किया जाता है, यदि वितरण भारी-सपुच्छ वाला नहीं है।

अनुमानित वितरण

नमूना आँकड़ों के सटीक वितरण को निर्दिष्ट करने में कठिनाई को देखते हुए, इनकी अनुमान लगाने के लिए कई तरीके विकसित किए गए हैं।

परिमित नमूनों के साथ, सन्निकटन सिद्धांत यह मापता है कि एक सीमित वितरण आँकड़ों के नमूना वितरण के कितने करीब है: उदाहरण के लिए, 10,000 स्वतंत्र नमूनों के साथ, बेरी-एस्सेन प्रमेय द्वारा, सामान्य वितरण अनुमानित (सटीकता के दो अंकों तक) कई जनसंख्या वितरणों के लिए नमूना माध्य का वितरण है।[13]फिर भी कई व्यावहारिक उद्देश्यों के लिए, अनुकरण अध्ययन और सांख्यिकीविदों के अनुभव के अनुसार, 10 (या अधिक) स्वतंत्र नमूने होने पर सामान्य सन्निकटन नमूना-माध्य के वितरण के लिए एक अच्छा सन्निकटन प्रदान करता है।[13]1950 के दशक में कोलमोगोरोव के काम के बाद, उन्नत सांख्यिकी सन्निकटन की त्रुटि को निर्धारित करने के लिए सन्निकटन सिद्धांत और कार्यात्मक विश्लेषण का उपयोग करती है। इस दृष्टिकोण में, प्रायिकता वितरण की मापीय ज्यामिति का अध्ययन किया जाता है; यह दृष्टिकोण अनुमानित त्रुटि को मापता है, उदाहरण के लिए, कुल्बैक-लीब्लर विचलन, ब्रैगमैन विचलन, और हेलिंगर दूरी[14][15][16]

अनिश्चित रूप से बड़े नमूनों के साथ, स्पर्शोन्मुख सिद्धांत (सांख्यिकी) केंद्रीय सीमा प्रमेय की तरह नमूना आँकड़ों के सीमित वितरण का वर्णन करता है, यदि कोई मौजूद है। सीमित परिणाम परिमित नमूनों के बारे में कथन नहीं हैं, और वास्तव में परिमित नमूनों के लिए अप्रासंगिक हैं।[17][18][19] हालांकि, परिमित नमूनों के साथ काम करने के लिए वितरण को सीमित करने के स्पर्शोन्मुख सिद्धांत को प्रायः लागू किया जाता है। उदाहरण के लिए, सीमित परिणाम प्रायः क्षणों की सामान्यीकृत विधि और सामान्यीकृत अनुमान समीकरणों के उपयोग को सही ठहराने के लिए लागू होते हैं, जो कि अर्थमिति और जैव-सांख्यिकी में लोकप्रिय हैं। सीमित वितरण और वास्तविक वितरण (औपचारिक रूप से, सन्निकटन की 'त्रुटि') के बीच अंतर के परिमाण का मूल्यांकन अनुकरण का उपयोग करके किया जा सकता है।[20] परिमित नमूनों के परिणामों को सीमित करने का अनुमानी अनुप्रयोग कई अनुप्रयोगों में आम चलन है, विशेष रूप से लॉग-अवतल संभावना वाले कम-आयामी प्रतिरूप के साथ (जैसे कि एक- मापदण्ड घातीय परिवारों के साथ)।

यादृच्छिकीकरण आधारित प्रतिरूप

किसी दिए गए आंकड़े सम्मुच्चय के लिए जो एक यादृच्छिककरण अभिकल्पना द्वारा निर्मित किया गया था, एक सांख्यिकीय (शून्य-परिकल्पना के तहत) के यादृच्छिककरण वितरण को सभी योजनाओं के लिए परीक्षण आंकड़े का मूल्यांकन करके परिभाषित किया गया है जो कि यादृच्छिककरण अभिकल्पना द्वारा उत्पन्न किया जा सकता था। बारंबारतावादी अनुमान में, यादृच्छिककरण एक व्यक्तिपरक प्रतिरूप के बजाय यादृच्छिककरण वितरण पर आधारित होने की अनुमति देता है, और यह विशेष रूप से सर्वेक्षण नमूनाकरण और प्रयोगों के अभिकल्पना में महत्वपूर्ण है।[21][22] यादृच्छिक अध्ययन से सांख्यिकीय निष्कर्ष भी कई अन्य स्थितियों की तुलना में अधिक सीधा है।[23][24][25] बायेसियन अनुमान में, यादृच्छिककरण भी महत्वपूर्ण है: सर्वेक्षण नमूनाकरण में, प्रतिस्थापन के बिना नमूने का उपयोग जनसंख्या के साथ नमूने की विनिमयशीलता सुनिश्चित करता है; यादृच्छिक प्रयोगों में, यादृच्छिककरण सहविचर जानकारी के लिए यादृच्छिक अनुमान पर लापता होने का वारंट करता है।[26] वस्तुनिष्ठ यादृच्छिककरण ठीक से आगमनात्मक प्रक्रियाओं की अनुमति देता है।[27][28][29][30][31] कई सांख्यिकीविद् आंकड़ों के यादृच्छिककरण-आधारित विश्लेषण को पसंद करते हैं जो कि अच्छी तरह से परिभाषित यादृच्छिकीकरण प्रक्रियाओं द्वारा उत्पन्न किया गया था।[32] (हालांकि, यह सच है कि विज्ञान के क्षेत्रों में विकसित सैद्धांतिक ज्ञान और प्रयोगात्मक नियंत्रण के साथ, यादृच्छिक प्रयोग अनुमानों की गुणवत्ता में सुधार किए बिना प्रयोग की लागत बढ़ा सकते हैं।[33][34])

इसी तरह, प्रमुख सांख्यिकीय अधिकारियों द्वारा यादृच्छिक प्रयोगों के परिणामों की अनुशंसा की जाती है क्योंकि समान घटनाओं के अवलोकन संबंधी अध्ययनों की तुलना में अधिक विश्वसनीयता वाले अनुमानों की अनुमति होती है।[35]

हालांकि, एक अच्छा अवलोकन संबंधी अध्ययन एक खराब यादृच्छिक प्रयोग से बेहतर हो सकता है।

एक यादृच्छिक प्रयोग का सांख्यिकीय विश्लेषण प्रायोगिक विज्ञप्ति में वर्णित यादृच्छिकीकरण योजना पर आधारित हो सकता है और इसके लिए व्यक्तिपरक प्रतिरूप की आवश्यकता नहीं होती है।[36][37]

हालाँकि, किसी भी समय, कुछ परिकल्पनाओं का वस्तुनिष्ठ सांख्यिकीय प्रतिरूप का उपयोग करके परीक्षण नहीं किया जा सकता है, जो यादृच्छिक प्रयोगों या यादृच्छिक नमूनों का सटीक वर्णन करते हैं। कुछ मामलों में, ऐसे यादृच्छिक अध्ययन असंवैधानिक या अनैतिक हैं।

यादृच्छिक प्रयोगों का प्रतिरूप-आधारित विश्लेषण

यादृच्छिक प्रयोगों से आंकड़ों का विश्लेषण करते समय एक सांख्यिकीय प्रतिरूप, उदाहरण के लिए, एक रैखिक या रसद प्रतिरूप को संदर्भित करना मानक अभ्यास है।[38] हालाँकि, यादृच्छिककरण योजना एक सांख्यिकीय प्रतिरूप की पसंद का मार्गदर्शन करती है। यादृच्छिकीकरण योजना को जाने बिना उपयुक्त प्रतिरूप का चयन करना संभव नहीं है।[22]प्रयोगात्मक विज्ञप्ति की अनदेखी करते हुए यादृच्छिक प्रयोगों से आंकड़ों का विश्लेषण करके गंभीर रूप से भ्रामक परिणाम प्राप्त किए जा सकते हैं; सामान्य गलतियों में एक प्रयोग में उपयोग किए गए अवरोधन को भूल जाना और एक ही प्रायोगिक इकाई पर बार-बार माप को अलग-अलग प्रायोगिक इकाइयों पर लागू उपचार की स्वतंत्र प्रतिकृति के साथ भ्रमित करना सम्मिलित है।[39]


प्रतिरूप-मुक्त यादृच्छिककरण अनुमान

प्रतिरूप-मुक्त तकनीकें प्रतिरूप-आधारित विधियों का पूरक प्रदान करती हैं, जो वास्तविकता-सरलीकरण की न्यूनीकरणवादी रणनीतियों को नियोजित करती हैं। पूर्व संयोजन, विकास, पहनावा और कलन विधि को गतिशील रूप से एक प्रक्रिया के प्रासंगिक समानता के अनुकूल बनाने और टिप्पणियों की आंतरिक विशेषताओं को सीखने के लिए नियोजित करती हैं।[38][40]

उदाहरण के लिए, प्रतिरूप-मुक्त सरल रेखीय प्रतिगमन निम्न पर आधारित है।

  • एक यादृच्छिक अभिकल्पना, जहां टिप्पणियों के जोड़े स्वतंत्र और समान रूप से वितरित (iid) हैं, या
  • एक नियतात्मक अभिकल्पना, जहां चर नियतात्मक हैं, लेकिन संबंधित प्रतिक्रिया चर एक सामान्य सशर्त वितरण के साथ यादृच्छिक और स्वतंत्र हैं, अर्थात, , जो सूचकांक से स्वतंत्र है।

किसी भी मामले में, सामान्य सशर्त वितरण की सुविधाओं के लिए प्रतिरूप-मुक्त यादृच्छिककरण अनुमान कुछ नियमितता स्थितियों पर निर्भर करता है, उदा। कार्यात्मक सहजता। उदाहरण के लिए, जनसंख्या सुविधा सशर्त माध्य के लिए प्रतिरूप-मुक्त यादृच्छिककरण अनुमान, , अनुमान के तहत स्थानीय औसत या स्थानीय बहुपद उपयुक्त के माध्यम से लगातार अनुमान लगाई जा सकती है कि निर्बाध है। इसके अलावा, स्पर्शोन्मुख सामान्यता या पुनरुत्पादन पर भरोसा करते हुए, हम जनसंख्या विशेषता के लिए विश्वास अंतराल का निर्माण कर सकते हैं, इस मामले में, सशर्त माध्य, है।[41]


अनुमान के प्रतिमान

सांख्यिकीय अनुमान के विभिन्न विद्यालय स्थापित हो गए हैं। ये विद्यालय-या प्रतिमान-पारस्परिक रूप से अनन्य नहीं हैं, और जो तरीके एक प्रतिमान के तहत अच्छी तरह से काम करते हैं, उनकी प्रायः अन्य प्रतिमानों के तहत आकर्षक व्याख्या होती है।

बंद्योपाध्याय और फोस्टर चार प्रतिमानों का वर्णन करते हैं: पारम्परिक (या आवृत्तिवादी अनुमान) प्रतिमान, बायेसियन अनुमान प्रतिमान, संभावनावाद प्रतिमान, और एकाइके सूचना मानदंड| अकाइकेन-सूचना मानदंड-आधारित प्रतिमान।[42]


आवृत्तिवादी अनुमान

यह प्रतिमान हाथ में एक के समान आंकड़े सम्मुच्चय बनाने के लिए जनसंख्या वितरण के बार-बार नमूने पर विचार करके प्रस्तावों की संभाव्यता को जांचता है। दोहराए गए नमूने के तहत आंकड़े सम्मुच्चय की विशेषताओं पर विचार करके, एक सांख्यिकीय प्रस्ताव के आवृत्तिवादी गुणों को परिमाणित किया जा सकता है - हालांकि व्यवहार में यह परिमाणीकरण चुनौतीपूर्ण हो सकता है।

आवृत्तिवादी अनुमान के उदाहरण

  • p- मूल्य
  • निराकरणीय परिकल्पना अंतराल
  • अशक्त परिकल्पना महत्व परीक्षण

आवृत्तिवादी अनुमान, वस्तुनिष्ठता और निर्णय सिद्धांत

बारंबारतावादी अनुमान (या शास्त्रीय अनुमान) की एक व्याख्या यह है कि यह केवल आवृत्ति संभावना के संदर्भ में लागू होता है; यानी, किसी आबादी से बार-बार नमूने लेने के संदर्भ में। हालांकि, नेमन का दृष्टिकोण[43] पूर्व-प्रयोग संभावनाओं के संदर्भ में इन प्रक्रियाओं को विकसित करता है। अर्थात्, एक प्रयोग करने से पहले, एक निष्कर्ष पर आने के लिए एक नियम तय करता है जैसे कि सही होने की संभावना को एक उपयुक्त तरीके से नियंत्रित किया जाता है: इस तरह की संभावना को बारंबारतावादी या बार-बार नमूना व्याख्या की आवश्यकता नहीं होती है। इसके विपरीत, बायेसियन अनुमान सशर्त संभावनाओं के संदर्भ में काम करता है (अर्थात देखे गए आंकड़े पर सशर्त संभावनाएं), सीमांत (लेकिन अज्ञात मापदंडों पर सशर्त) संभावनाओं की तुलना में लगातार दृष्टिकोण में उपयोग किया जाता है।

उपयोगिता कार्यों के संबंध में महत्व परीक्षण और विश्वास अंतराल की लगातार प्रक्रियाओं का निर्माण किया जा सकता है। हालाँकि, आवृत्तिवादी सांख्यिकी के कुछ तत्व, जैसे कि सांख्यिकीय निर्णय सिद्धांत, उपयोगिता कार्यों को सम्मिलित करते हैं।[citation needed] विशेष रूप से, इष्टतम अनुमान (जैसे न्यूनतम-विचरण निष्पक्ष अनुमानक, या समान रूप से सबसे शक्तिशाली परीक्षण) के लगातार विकास हानि कार्यों का उपयोग करते हैं, जो (नकारात्मक) उपयोगिता कार्यों की भूमिका निभाते हैं। सांख्यिकीय सिद्धांतकारों को यह साबित करने के लिए हानि कार्यों को स्पष्ट रूप से नहीं बताया जाना चाहिए कि एक सांख्यिकीय प्रक्रिया में इष्टतमता संपत्ति है।[44] हालांकि, नुकसान-प्रकार्य प्रायः इष्टतम गुणों को बताते हुए उपयोगी होते हैं: उदाहरण के लिए, औसत-निष्पक्ष अनुमानक पूर्ण मूल्य हानि कार्यों के तहत इष्टतम होते हैं, जिसमें वे अपेक्षित हानि को कम करते हैं, और कम से कम वर्ग अनुमानक वर्ग त्रुटि हानि कार्यों के तहत इष्टतम होते हैं, जिसमें वे अपेक्षित नुकसान को कम करें।

जबकि बारंबारतावादी अनुमान का उपयोग करने वाले सांख्यिकीविदों को स्वयं के लिए रुचि के मापदंडों का चयन करना चाहिए, और उपयोग किए जाने वाले अनुमानक/परीक्षण आंकड़े, स्पष्ट रूप से स्पष्ट उपयोगिताओं और पूर्व वितरण की अनुपस्थिति ने आवृत्तिवादी प्रक्रियाओं को व्यापक रूप से 'उद्देश्य' के रूप में देखने में मदद की है।[45]


बेजअनुमिति

बायेसियन कलन संभाव्यता की 'भाषा' का उपयोग करके विश्वास की घात का वर्णन करता है; विश्वास सकारात्मक हैं, एक में एकीकृत होते हैं, और संभाव्यता स्वयंसिद्धों का पालन करते हैं। बायेसियन अनुमान सांख्यिकीय प्रस्ताव बनाने के आधार के रूप में उपलब्ध पश्च विश्वासों का उपयोग करता है।[46] बायेसियन दृष्टिकोण का उपयोग करने के लिए कई अलग-अलग औचित्य हैं।

बायेसियन अनुमान के उदाहरण

बायेसियन अनुमान, व्यक्तिपरकता और निर्णय सिद्धांत

कई अनौपचारिक बायेसियन संदर्भ पश्च के सहज रूप से उचित सारांश पर आधारित हैं। उदाहरण के लिए, पश्च माध्य, मध्य और विधा, उच्चतम पश्च घनत्व अंतराल, और बेयस कारक सभी इस तरह से प्रेरित हो सकते हैं। हालांकि इस प्रकार के अनुमान के लिए एक उपयोगकर्ता के उपयोगिता कार्य को बताने की आवश्यकता नहीं है, ये सारांश पहले बताए गए विश्वासों पर निर्भर करते हैं (कुछ हद तक), और सामान्यतः व्यक्तिपरक निष्कर्ष के रूप में देखे जाते हैं। (पूर्व निर्माण की विधियाँ जिनमें बाहरी निविष्ट की आवश्यकता नहीं होती है बायेसियन संभाव्यता और पूर्ववर्ती निर्माण के लिए वस्तुनिष्ठ विधियाँ हैं लेकिन अभी तक पूरी तरह से विकसित नहीं हुई हैं।)

औपचारिक रूप से, बायेसियन निष्कष को स्पष्ट रूप से बताई गई उपयोगिता, या हानि प्रकार्य के संदर्भ में व्यवस्थित किया जाता है; 'बेयस नियम' वह है जो अपेक्षित उपयोगिता को अधिकतम करता है, पश्च अनिश्चितता पर औसत किये हुए। इसलिए औपचारिक बायेसियन अनुमान स्वचालित रूप से एक निर्णय सिद्धांत अर्थ में इष्टतम निर्णय प्रदान करता है। मान्यताओं, आंकड़ों और उपयोगिता को देखते हुए, बायेसियन अनुमान अनिवार्य रूप से किसी भी समस्या के लिए बनाया जा सकता है, हालांकि हर सांख्यिकीय अनुमान की बायेसियन व्याख्या की आवश्यकता नहीं है। विश्लेषण जो औपचारिक रूप से बायेसियन नहीं हैं (तार्किक रूप से) सुसंगतता (सांख्यिकी) हो सकते हैं; बायेसियन प्रक्रियाओं की एक विशेषता जो उचित पुरोहितों का उपयोग करती है (अर्थात वे जो एक के लिए पूर्णांक हैं) यह है कि उन्हें सुसंगतता (सांख्यिकी) होने की प्रत्याभुति दी जाती है। बायेसियन अनुमान के कुछ पैरोकार दावा करते हैं कि इस निर्णय-सैद्धांतिक ढांचे में अनुमान लगाया जाना चाहिए, और बायेसियन अनुमान को बाद के विश्वासों के मूल्यांकन और सारांश के साथ समाप्त नहीं करना चाहिए।

संभावना आधारित अनुमान

संभावना प्रकार्य का उपयोग करके संभावनावाद आंकड़ों तक पहुंचता है। कुछ संभाव्यवादी आँकड़ों को साक्ष्य से केवल संगणना समर्थन के रूप में मानते हुए, अनुमान को अस्वीकार करते हैं। अन्य, हालांकि, संभावना प्रकार्य के आधार पर अनुमान का प्रस्ताव करते हैं, जिनमें से सबसे प्रसिद्ध अधिकतम संभावना अनुमान है।

AIC आधारित अनुमान

एकैके सूचना मानदंड (AIC) आंकड़ों के दिए गए सम्मुच्चय के लिए सांख्यिकीय प्रतिरूप की सापेक्ष गुणवत्ता का एक अनुमानक है। आंकड़ों के लिए प्रतिरूपों के संग्रह को देखते हुए, प्रत्येक अन्य प्रतिरूप के सापेक्ष AIC प्रत्येक प्रतिरूप की गुणवत्ता की अनुमान लगाता है। इस प्रकार, AIC प्रतिरूप चयन के लिए एक साधन प्रदान करता है।

AIC सूचना सिद्धांत पर आधारित है: यह आंकड़े उत्पन्न करने वाली प्रक्रिया का प्रतिनिधित्व करने के लिए दिए गए प्रतिरूप का उपयोग करते समय खोई हुई सापेक्ष जानकारी का अनुमान प्रदान करता है। (ऐसा करने में, यह प्रतिरूप के फिट होने की अच्छाई और प्रतिरूप की सादगी के बीच व्यापार-बंद से संबंधित है।)

अनुमान के लिए अन्य प्रतिमान

न्यूनतम विवरण लंबाई

सूचना सिद्धांत [48] और कोलमोगोरोव जटिलता के सिद्धांत में विचारों से न्यूनतम विवरण लंबाई (MDL) सिद्धांत विकसित किया गया है।(MDL) सिद्धांत सांख्यिकीय प्रतिरूप का चयन करता है जो आंकड़े को अधिकतम रूप से संपीड़ित करता है; आंकड़ों के लिए प्रतितथ्यात्मक या गैर-मिथ्या आंकड़े -उत्पादक तंत्र या संभाव्यता प्रतिरूप को ग्रहण किए बिना अनुमान आगे बढ़ती है, जैसा कि आवृत्तिवादी या बायेसियन दृष्टिकोणों में किया जा सकता है।Cite error: Closing </ref> missing for <ref> tag MDL सिद्धांत संचार- कूटलेखन सिद्धांत में सूचना सिद्धांत में, रैखिक प्रतिगमन में [47] और आंकड़े माइनिंग में लागू किया गया है।[48]

MDL-आधारित अनुमानित प्रक्रियाओं का मूल्यांकन प्रायः संगणनात्मक जटिलता सिद्धांत से तकनीकों या मानदंडों का उपयोग करता है।[49]

प्रत्ययी अनुमान

प्रत्ययी अनुमान, प्रत्ययी संभाव्यता पर आधारित सांख्यिकीय अनुमान के लिए एक दृष्टिकोण था, जिसे प्रत्ययी वितरण के रूप में भी जाना जाता है। बाद के काम में, इस दृष्टिकोण को खराब परिभाषित, प्रयोज्यता में बेहद सीमित और यहां तक ​​कि भ्रामक कहा गया है। [50][51] हालाँकि यह तर्क वही है जो दिखाता है [52] कि एक तथाकथित आत्मविश्वास वितरण एक वैध प्रायिकता वितरण नहीं है और चूंकि इसने विश्वास्यता अंतराल के आवेदन को अमान्य नहीं किया है, यह आवश्यक रूप से विश्वस्त तर्कों से निकाले गए निष्कर्षों को अमान्य नहीं करता है। ऊपरी और निचली संभावनाओं का उपयोग करते हुए एक अनुमान सिद्धांत के एक विशेष मामले के रूप में फिशर की फिदुकियल संभावना के शुरुआती कार्य की पुनर्व्याख्या करने का प्रयास किया गया था।[53]


संरचनात्मक अनुमान

1938 से 1939 तक फिशर और पिटमैन के विचारों का विकास करते हुए, [54] जॉर्ज ए बरनार्ड ने संरचनात्मक अनुमान या निर्णायक अनुमान ,[55] समूह परिवार पर निश्चर संभावनाओं का उपयोग कर एक दृष्टिकोण विकसित किया। बरनार्ड ने प्रतिरूपों के एक प्रतिबंधित वर्ग पर प्रत्ययी अनुमान के पीछे के तर्कों को सुधारा, जिस पर प्रत्ययी प्रक्रियाएं अच्छी तरह से परिभाषित और उपयोगी होंगी। डोनाल्ड ए एस फ्रेजर ने संरचनात्मक अनुमान के लिए एक सामान्य सिद्धांत विकसित किया [56] समूह सिद्धांत के आधार पर और इसे रैखिक प्रतिरूप पर लागू किया। [57] फ्रेजर द्वारा तैयार किए गए सिद्धांत में निर्णय सिद्धांत और बायेसियन सांख्यिकी के निकट संबंध हैं और यदि वे मौजूद हैं तो इष्टतम आवृत्तिवादी निर्णय नियम प्रदान कर सकते हैं।[58]


निष्कर्ष विषय

नीचे दिए गए विषयों को सामान्यतः सांख्यिकीय अनुमान के क्षेत्र में सम्मिलित किया जाता है।

  1. सांख्यिकीय अनुमानएँ
  2. सांख्यिकीय निर्णय सिद्धांत
  3. अनुमान सिद्धांत
  4. सांख्यिकीय परिकल्पना परीक्षण
  5. आंकड़ों में राय संशोधित करना
  6. प्रयोगों का अभिकल्पना, विचरण का विश्लेषण और प्रतिगमन विश्लेषण
  7. सर्वेक्षण प्रतिदर्श
  8. सांख्यिकीय आंकड़ों का सारांश

भविष्यसूचक अनुमान

भविष्यसूचक निष्कर्ष सांख्यिकीय अनुमान के लिए एक दृष्टिकोण है जो पिछले टिप्पणियों के आधार पर भविष्य की टिप्पणियों की भविष्यवाणी पर जोर देता है।

प्रारंभ में, भविष्यसूचक अनुमान अवलोकन योग्य मापदंडों पर आधारित था और इसका संभाव्यता का अध्ययन करने का मुख्य उद्देश्य था,[citation needed] लेकिन 20वीं शताब्दी में ब्रूनो डी फिनेची द्वारा पेश किए गए एक नए प्राचलिक दृष्टिकोण के कारण यह समर्थन से बाहर हो गया। त्रुटि के साथ देखी गई भौतिक प्रणाली के रूप में दृष्टिकोण ने घटना को प्रतिरूपित किया (उदाहरण के लिए, आकाशीय यांत्रिकी)। डि फिनेटी का विनिमेयता का विचार - कि भविष्य की टिप्पणियों को पिछली टिप्पणियों की तरह व्यवहार करना चाहिए - उनके 1937 के लेख के 1974 फ़्रांसीसी से अनुवाद के साथ अंग्रेजी बोलने वाली दुनिया का ध्यान आया,[59] और तब से सीमोर गीजर जैसे सांख्यिकीविदों द्वारा प्रतिपादित किया गया है।[60]


यह भी देखें

टिप्पणियाँ

  1. According to Peirce, acceptance means that inquiry on this question ceases for the time being. In science, all scientific theories are revisable.


संदर्भ

उद्धरण

  1. Upton, G., Cook, I. (2008) Oxford Dictionary of Statistics, OUP. ISBN 978-0-19-954145-4.
  2. "TensorFlow लाइट अनुमान". शब्द अनुमान इनपुट डेटा के आधार पर भविष्यवाणी करने के लिए डिवाइस पर TensorFlow Lite मॉडल को निष्पादित करने की प्रक्रिया को संदर्भित करता है।
  3. Johnson, Richard (12 March 2016). "सांख्यिकीय निष्कर्ष". Encyclopedia of Mathematics. Springer: The European Mathematical Society. Retrieved 26 October 2022.
  4. Konishi & Kitagawa (2008), p. 75.
  5. Cox (2006), p. 197.
  6. "सांख्यिकीय अनुमान - गणित का विश्वकोश". www.encyclopediaofmath.org. Retrieved 2019-01-23.
  7. 7.0 7.1 Cox (2006) page 2
  8. Evans, Michael; et al. (2004). संभाव्यता और सांख्यिकी: अनिश्चितता का विज्ञान. Freeman and Company. p. 267. ISBN 9780716747420.
  9. Kruskal 1988
  10. Freedman, D.A. (2008) "Survival analysis: An Epidemiological hazard?". The American Statistician (2008) 62: 110-119. (Reprinted as Chapter 11 (pages 169–192) of Freedman (2010)).
  11. Berk, R. (2003) Regression Analysis: A Constructive Critique (Advanced Quantitative Techniques in the Social Sciences) (v. 11) Sage Publications. ISBN 0-7619-2904-5
  12. 12.0 12.1 Brewer, Ken (2002). संयुक्त सर्वेक्षण नमूना निष्कर्ष: बसु के हाथियों का वजन. Hodder Arnold. p. 6. ISBN 978-0340692295.
  13. 13.0 13.1 Jörgen Hoffman-Jörgensen's Probability With a View Towards Statistics, Volume I. Page 399[full citation needed]
  14. Le Cam (1986)[page needed]
  15. Erik Torgerson (1991) Comparison of Statistical Experiments, volume 36 of Encyclopedia of Mathematics. Cambridge University Press.[full citation needed]
  16. Liese, Friedrich & Miescke, Klaus-J. (2008). सांख्यिकीय निर्णय सिद्धांत: अनुमान, परीक्षण और चयन. Springer. ISBN 978-0-387-73193-3.
  17. Kolmogorov (1963, p.369): "The frequency concept, based on the notion of limiting frequency as the number of trials increases to infinity, does not contribute anything to substantiate the applicability of the results of probability theory to real practical problems where we have always to deal with a finite number of trials".
  18. "Indeed, limit theorems 'as  tends to infinity' are logically devoid of content about what happens at any particular . All they can do is suggest certain approaches whose performance must then be checked on the case at hand." — Le Cam (1986) (page xiv)
  19. Pfanzagl (1994): "The crucial drawback of asymptotic theory: What we expect from asymptotic theory are results which hold approximately . . . . What asymptotic theory has to offer are limit theorems."(page ix) "What counts for applications are approximations, not limits." (page 188)
  20. Pfanzagl (1994) : "By taking a limit theorem as being approximately true for large sample sizes, we commit an error the size of which is unknown. [. . .] Realistic information about the remaining errors may be obtained by simulations." (page ix)
  21. Neyman, J.(1934) "On the two different aspects of the representative method: The method of stratified sampling and the method of purposive selection", Journal of the Royal Statistical Society, 97 (4), 557–625 JSTOR 2342192
  22. 22.0 22.1 Hinkelmann and Kempthorne(2008)[page needed]
  23. ASA Guidelines for the first course in statistics for non-statisticians. (available at the ASA website)
  24. David A. Freedman et alia's Statistics.
  25. Moore et al. (2015).
  26. Gelman A. et al. (2013). Bayesian Data Analysis (Chapman & Hall).
  27. Peirce (1877-1878)
  28. Peirce (1883)
  29. Freedman, Pisani & Purves 1978.
  30. David A. Freedman Statistical Models.
  31. Rao, C.R. (1997) Statistics and Truth: Putting Chance to Work, World Scientific. ISBN 981-02-3111-3
  32. Peirce; Freedman; Moore et al. (2015).[citation needed]
  33. Box, G.E.P. and Friends (2006) Improving Almost Anything: Ideas and Essays, Revised Edition, Wiley. ISBN 978-0-471-72755-2
  34. Cox (2006), p. 196.
  35. ASA Guidelines for the first course in statistics for non-statisticians. (available at the ASA website)
    • David A. Freedman et alias Statistics.
    • Moore et al. (2015).
  36. Neyman, Jerzy. 1923 [1990]. "On the Application of Probability Theory to AgriculturalExperiments. Essay on Principles. Section 9." Statistical Science 5 (4): 465–472. Trans. Dorota M. Dabrowska and Terence P. Speed.
  37. Hinkelmann & Kempthorne (2008)[page needed]
  38. 38.0 38.1 Dinov, Ivo; Palanimalai, Selvam; Khare, Ashwini; Christou, Nicolas (2018). "Randomization‐based statistical inference: A resampling and simulation infrastructure". Teaching Statistics. 40 (2): 64–73. doi:10.1111/test.12156. PMC 6155997. PMID 30270947.
  39. Hinkelmann and Kempthorne (2008) Chapter 6.
  40. Tang, Ming; Gao, Chao; Goutman, Stephen; Kalinin, Alexandr; Mukherjee, Bhramar; Guan, Yuanfang; Dinov, Ivo (2019). "Model-Based and Model-Free Techniques for Amyotrophic Lateral Sclerosis Diagnostic Prediction and Patient Clustering". Neuroinformatics. 17 (3): 407–421. doi:10.1007/s12021-018-9406-9. PMC 6527505. PMID 30460455.
  41. Politis, D.N. (2019). "Model-free inference in statistics: how and why". IMS Bulletin. 48.
  42. Bandyopadhyay & Forster (2011). See the book's Introduction (p.3) and "Section III: Four Paradigms of Statistics".
  43. Neyman, J. (1937). "संभाव्यता के शास्त्रीय सिद्धांत के आधार पर सांख्यिकीय अनुमान के सिद्धांत की रूपरेखा". Philosophical Transactions of the Royal Society of London A. 236 (767): 333–380. Bibcode:1937RSPTA.236..333N. doi:10.1098/rsta.1937.0005. JSTOR 91337.
  44. Preface to Pfanzagl.
  45. Little, Roderick J. (2006). "कैलिब्रेटेड बेयस: ए बेयस/फ्रीक्वेंटिस्ट रोडमैप". The American Statistician. 60 (3): 213–223. doi:10.1198/000313006X117837. ISSN 0003-1305. JSTOR 27643780. S2CID 53505632.
  46. Lee, Se Yoon (2021). "Gibbs sampler and coordinate ascent variational inference: A set-theoretical review". Communications in Statistics - Theory and Methods. 51 (6): 1549–1568. arXiv:2008.01006. doi:10.1080/03610926.2021.1921214. S2CID 220935477.
  47. Cite error: Invalid <ref> tag; no text was provided for refs named JR
  48. Cite error: Invalid <ref> tag; no text was provided for refs named HY
  49. Joseph F. Traub, G. W. Wasilkowski, and H. Wozniakowski. (1988)[page needed]
  50. Neyman (1956)
  51. Zabell (1992)
  52. Cox (2006) page 66
  53. Hampel 2003.
  54. Davison, page 12.[full citation needed]
  55. Barnard, G.A. (1995) "Pivotal Models and the Fiducial Argument", International Statistical Review, 63 (3), 309–323. JSTOR 1403482
  56. Fraser, D. A. S. (1968). अनुमान की संरचना. New York: Wiley. ISBN 0-471-27548-4. OCLC 440926.
  57. Fraser, D. A. S. (1979). निष्कर्ष और रैखिक मॉडल. London: McGraw-Hill. ISBN 0-07-021910-9. OCLC 3559629.
  58. Taraldsen, Gunnar; Lindqvist, Bo Henry (2013-02-01). "प्रत्ययी सिद्धांत और इष्टतम अनुमान". The Annals of Statistics. 41 (1). arXiv:1301.1717. doi:10.1214/13-AOS1083. ISSN 0090-5364. S2CID 88520957.
  59. De Finetti, Bruno (1937). "पूर्वानुमान: इसके तार्किक कानून, इसके व्यक्तिपरक स्रोत". Annales de l'Institut Henri Poincaré. 7 (1): 1–68. ISSN 0365-320X. Translated in De Finetti, Bruno (1992). "Foresight: Its Logical Laws, Its Subjective Sources". Breakthroughs in Statistics. Springer Series in Statistics. pp. 134–174. doi:10.1007/978-1-4612-0919-5_10. ISBN 978-0-387-94037-3.
  60. Geisser, Seymour (1993) Predictive Inference: An Introduction, CRC Press. ISBN 0-412-03471-9


स्रोत


अग्रिम पठन

बाहरी संबंध