सांख्यिकीय अनुमिति: Difference between revisions

From Vigyanwiki
(text)
Line 2: Line 2:
{{Research}}
{{Research}}
{{short description|Process of using data analysis}}
{{short description|Process of using data analysis}}
सांख्यिकीय धारणा एक अंतर्निहित संभाव्यता वितरण के गुणों का धारणा लगाने के लिए [[डेटा विश्लेषण|आँकड़ा विश्लेषण]] का उपयोग करने की प्रक्रिया है।<ref name="Oxford">Upton, G., Cook, I. (2008) ''Oxford Dictionary of Statistics'', OUP. {{ISBN|978-0-19-954145-4}}.</ref> आनुमानिक सांख्यिकीय विश्लेषण एक सांख्यिकीय आबादी के गुणों का धारणा लगाता है, उदाहरण के लिए परिकल्पनाओं का परीक्षण करके और धारणा प्राप्त करके। यह माना जाता है कि देखा गया आँकड़ा समुच्चय एक बड़ी आबादी से [[नमूनाकरण (सांख्यिकी)]] है।
सांख्यिकीय अनुमान एक अंतर्निहित संभाव्यता वितरण के गुणों का अनुमान लगाने के लिए [[डेटा विश्लेषण|आंकड़े विश्लेषण]] का उपयोग करने की प्रक्रिया है।<ref name="Oxford">Upton, G., Cook, I. (2008) ''Oxford Dictionary of Statistics'', OUP. {{ISBN|978-0-19-954145-4}}.</ref> आनुमानिक सांख्यिकीय विश्लेषण एक सांख्यिकीय आबादी के गुणों की अनुमान लगाता है, उदाहरण के लिए परिकल्पनाओं का परीक्षण करके और अनुमान प्राप्त करके। यह माना जाता है कि देखे गए आंकड़े समुच्चय एक बड़ी आबादी का [[नमूनाकरण (सांख्यिकी)]] है।


अनुमानात्मक सांख्यिकी की तुलना वर्णनात्मक सांख्यिकी से की जा सकती है। [[वर्णनात्मक आँकड़े]] केवल देखे गए आंकड़ों के गुणों से संबंधित हैं, और यह इस धारणा पर आधारित नहीं है कि आंकड़ा एक बड़ी आबादी से आता है। [[मशीन लर्निंग|यंत्र अधिगम]] में, शब्द ''निष्कर्ष'' का उपयोग कभी-कभी पहले से प्रशिक्षित प्रतिरूप का मूल्यांकन करके भविष्यवाणी करने के लिए किया जाता है;<ref>{{cite web |url=https://www.tensorflow.org/lite/guide/inference |title=TensorFlow लाइट अनुमान|quote=शब्द ''अनुमान'' इनपुट डेटा के आधार पर भविष्यवाणी करने के लिए डिवाइस पर TensorFlow Lite मॉडल को निष्पादित करने की प्रक्रिया को संदर्भित करता है।}}</ref> इस संदर्भ में प्रतिरूप के गुणों का उल्लेख प्रशिक्षण या सीखने (धारणा के बजाय) के रूप में किया जाता है, और भविष्यवाणी के लिए एक प्रतिरूप का उपयोग करने के लिए धारणा (भविष्यवाणी के बजाय) के रूप में संदर्भित किया जाता है; [[भविष्य कहनेवाला अनुमान|भविष्यसूचक]] धारणा भी देखें।
अनुमानात्मक सांख्यिकी की तुलना वर्णनात्मक सांख्यिकी से की जा सकती है। [[वर्णनात्मक आँकड़े]] केवल देखे गए आंकड़ों के गुणों से संबंधित हैं, और यह इस अनुमान पर आधारित नहीं है कि आंकड़ा एक बड़ी आबादी से आता है। [[मशीन लर्निंग|यंत्र अधिगम]] में, शब्द ''निष्कर्ष'' का उपयोग कभी-कभी पहले से प्रशिक्षित प्रतिरूप का मूल्यांकन करके भविष्यवाणी करने के लिए किया जाता है;<ref>{{cite web |url=https://www.tensorflow.org/lite/guide/inference |title=TensorFlow लाइट अनुमान|quote=शब्द ''अनुमान'' इनपुट डेटा के आधार पर भविष्यवाणी करने के लिए डिवाइस पर TensorFlow Lite मॉडल को निष्पादित करने की प्रक्रिया को संदर्भित करता है।}}</ref> इस संदर्भ में प्रतिरूप के गुणों का उल्लेख प्रशिक्षण या सीखने (अनुमान के बजाय) के रूप में किया जाता है, और भविष्यवाणी के लिए एक प्रतिरूप का उपयोग करने के लिए अनुमान (भविष्यवाणी के बजाय) के रूप में संदर्भित किया जाता है; [[भविष्य कहनेवाला अनुमान|भविष्यसूचक]] अनुमान भी देखें।


== परिचय ==
== परिचय ==
सांख्यिकीय धारणा जनसंख्या के किसी प्रकार के नमूने (सांख्यिकी) के साथ जनसंख्या से प्राप्त आंकड़ों का उपयोग करके जनसंख्या के बारे में प्रस्ताव बनाता है। आबादी के बारे में एक परिकल्पना को देखते हुए, जिसके लिए हम धारणा लगाना चाहते हैं, सांख्यिकीय धारणा में (पहले) [[मॉडल चयन|प्रतिरूप चयन]] प्रक्रिया का एक [[सांख्यिकीय मॉडल|सांख्यिकीय प्रतिरूप]] होता है जो आँकड़ा उत्पन्न करता है और (दूसरा) प्रतिरूप से प्रस्तावों को घटाता है।<ref>{{cite web|last=Johnson|first=Richard|title=सांख्यिकीय निष्कर्ष|website=Encyclopedia of Mathematics|publisher=Springer: The European Mathematical Society|date=12 March 2016|url=https://encyclopediaofmath.org/wiki/Statistical_inference|access-date=26 October 2022}}</ref>
सांख्यिकीय अनुमान जनसंख्या के किसी प्रकार के नमूने (सांख्यिकी) के साथ जनसंख्या से प्राप्त आंकड़ों का उपयोग करके जनसंख्या के बारे में प्रस्ताव बनाता है। आबादी के बारे में एक परिकल्पना को देखते हुए, जिसके लिए हम अनुमान लगाना चाहते हैं, सांख्यिकीय अनुमान में (पहले) [[मॉडल चयन|प्रतिरूप चयन]] प्रक्रिया का एक [[सांख्यिकीय मॉडल|सांख्यिकीय प्रतिरूप]] होता है जो आंकड़े उत्पन्न करता है और (दूसरा) प्रतिरूप से प्रस्तावों को घटाता है।<ref>{{cite web|last=Johnson|first=Richard|title=सांख्यिकीय निष्कर्ष|website=Encyclopedia of Mathematics|publisher=Springer: The European Mathematical Society|date=12 March 2016|url=https://encyclopediaofmath.org/wiki/Statistical_inference|access-date=26 October 2022}}</ref>


कोनिशी और कितागावा ने स्पष्ट किया कि, सांख्यिकीय धारणा में अधिकांश समस्याओं को सांख्यिकीय प्रतिरूपण से संबंधित समस्याओं के रूप में माना जा सकता है।<ref>Konishi & Kitagawa (2008), p. 75.</ref> संबंधित रूप से, [[डेविड कॉक्स (सांख्यिकीविद्)]] ने कहा है, विषय-वस्तु समस्या से सांख्यिकीय प्रतिरूप में अनुवाद कैसे किया जाता है, यह प्रायः एक विश्लेषण का सबसे महत्वपूर्ण हिस्सा होता है।<ref>Cox (2006), p. 197.</ref>
कोनिशी और कितागावा ने स्पष्ट किया कि, सांख्यिकीय अनुमान में अधिकांश समस्याओं को सांख्यिकीय प्रतिरूपण से संबंधित समस्याओं के रूप में माना जा सकता है।<ref>Konishi & Kitagawa (2008), p. 75.</ref> संबंधित रूप से, [[डेविड कॉक्स (सांख्यिकीविद्)]] ने कहा है, विषय-वस्तु समस्या से सांख्यिकीय प्रतिरूप में अनुवाद कैसे किया जाता है, यह प्रायः एक विश्लेषण का सबसे महत्वपूर्ण हिस्सा होता है।<ref>Cox (2006), p. 197.</ref>


एक सांख्यिकीय धारणा का [[तार्किक परिणाम]] एक सांख्यिकीय [[प्रस्ताव]] है।<ref>{{Cite web |url = https://www.encyclopediaofmath.org/index.php/Statistical_inference |title=सांख्यिकीय अनुमान - गणित का विश्वकोश|website=www.encyclopediaofmath.org |access-date=2019-01-23 }}</ref> सांख्यिकीय प्रस्ताव के कुछ सामान्य रूप निम्नलिखित हैं:
एक सांख्यिकीय अनुमान का [[तार्किक परिणाम]] एक सांख्यिकीय [[प्रस्ताव]] है।<ref>{{Cite web |url = https://www.encyclopediaofmath.org/index.php/Statistical_inference |title=सांख्यिकीय अनुमान - गणित का विश्वकोश|website=www.encyclopediaofmath.org |access-date=2019-01-23 }}</ref> सांख्यिकीय प्रस्ताव के कुछ सामान्य रूप निम्नलिखित हैं:
* एक बिंदु अनुमान, यानी एक विशेष मूल्य जो हित के कुछ मापदण्ड का सबसे अच्छा धारणा लगाता है;
* एक बिंदु अनुमान, यानी एक विशेष मूल्य जो हित के कुछ मापदण्ड का सबसे अच्छा अनुमान लगाता है;
* एक [[अंतराल अनुमान]], उदा। एक [[विश्वास अंतराल|विश्वास्यता अंतराल]] (या निर्धारित आकलन), यानी एक आबादी से तैयार किए गए आँकड़ा सम्मुच्चय का उपयोग करके बनाया गया एक अंतराल, ताकि ऐसे आंकड़े सम्मुच्चय के बार-बार नमूने के तहत, ऐसे अंतराल में बताए गए  [[आत्मविश्वास का स्तर|विश्वस्यता स्तर]] पर आवृति प्रायिकता के साथ सही मापदण्ड मान हो;
* एक [[अंतराल अनुमान]], उदा। एक [[विश्वास अंतराल|विश्वास्यता अंतराल]] (या निर्धारित आकलन), यानी एक आबादी से तैयार किए गए आंकड़े  सम्मुच्चय का उपयोग करके बनाया गया एक अंतराल, ताकि ऐसे आंकड़े सम्मुच्चय के बार-बार नमूने के तहत, ऐसे अंतराल में बताए गए  [[आत्मविश्वास का स्तर|विश्वस्यता स्तर]] पर आवृति प्रायिकता के साथ सही मापदण्ड मान हो;
* एक [[विश्वसनीय अंतराल]], यानी मूल्यों का एक सम्मुच्चय जिसमें उदाहरण के लिए, पश्च विश्वास का 95% हो;
* एक [[विश्वसनीय अंतराल]], यानी मूल्यों का एक सम्मुच्चय जिसमें उदाहरण के लिए, पश्च विश्वास का 95% हो;
* एक [[सांख्यिकीय परिकल्पना परीक्षण]] की अस्वीकृति;{{NoteTag|According to Peirce, acceptance means that inquiry on this question ceases for the time being. In science, all scientific theories are revisable.}}
* एक [[सांख्यिकीय परिकल्पना परीक्षण]] की अस्वीकृति;{{NoteTag|According to Peirce, acceptance means that inquiry on this question ceases for the time being. In science, all scientific theories are revisable.}}
* समूहों में आंकड़े बिंदुओं का [[क्लस्टर विश्लेषण|झुण्ड विश्लेषण]] या [[सांख्यिकीय वर्गीकरण]]।
* समूहों में आंकड़े बिंदुओं का [[क्लस्टर विश्लेषण|झुण्ड विश्लेषण]] या [[सांख्यिकीय वर्गीकरण]]।


== प्रतिरूप और धारणाएँ ==
== प्रतिरूप और अनुमानएँ ==
{{Main|सांख्यिकीय प्रतिरूप|सांख्यिकीय धारणा }}
{{Main|सांख्यिकीय प्रतिरूप|सांख्यिकीय धारणा }}


किसी भी सांख्यिकीय धारणा के लिए कुछ मान्यताओं की आवश्यकता होती है। एक सांख्यिकीय प्रतिरूप देखे गए आंकड़े और समान आंकड़ों की पीढ़ी से संबंधित मान्यताओं का एक समूह है। सांख्यिकीय प्रतिरूप के विवरण सामान्यतः हित की जनसंख्या मात्रा की उस भूमिका पर जोर देता है, जिसके बारे में हम धारणा लगाना चाहते हैं।<ref name=Cox2006>Cox (2006) page 2</ref> अधिक औपचारिक निष्कर्ष निकाले जाने से पहले वर्णनात्मक आँकड़े सामान्यतः प्रारंभिक चरण के रूप में उपयोग किए जाते हैं।<ref>{{cite book |last=Evans |first=Michael |title=संभाव्यता और सांख्यिकी: अनिश्चितता का विज्ञान|year=2004 |publisher=Freeman and Company|page=267|display-authors=etal |url = https://books.google.com/books?id=hkWK8kFzXWIC |isbn=9780716747420 }}</ref>
किसी भी सांख्यिकीय अनुमान के लिए कुछ मान्यताओं की आवश्यकता होती है। एक सांख्यिकीय प्रतिरूप देखे गए आंकड़े और समान आंकड़ों की पीढ़ी से संबंधित मान्यताओं का एक समूह है। सांख्यिकीय प्रतिरूप के विवरण सामान्यतः हित की जनसंख्या मात्रा की उस भूमिका पर जोर देता है, जिसके बारे में हम अनुमान लगाना चाहते हैं।<ref name=Cox2006>Cox (2006) page 2</ref> अधिक औपचारिक निष्कर्ष निकाले जाने से पहले वर्णनात्मक आँकड़े सामान्यतः प्रारंभिक चरण के रूप में उपयोग किए जाते हैं।<ref>{{cite book |last=Evans |first=Michael |title=संभाव्यता और सांख्यिकी: अनिश्चितता का विज्ञान|year=2004 |publisher=Freeman and Company|page=267|display-authors=etal |url = https://books.google.com/books?id=hkWK8kFzXWIC |isbn=9780716747420 }}</ref>




=== प्रतिरूप/धारणाओं की घात ===
=== प्रतिरूप/अनुमानओं की घात ===
सांख्यिकीविद् प्रतिरूपिंग मान्यताओं के तीन स्तरों के बीच अंतर करते हैं;
सांख्यिकीविद् प्रतिरूपण मान्यताओं के तीन स्तरों के बीच अंतर करते हैं;
* [[पैरामीट्रिक मॉडल|प्राचलिक प्रतिरूप]]: आँकड़ा-जनन प्रक्रिया का वर्णन करने वाले प्रायिकता वितरण को संभाव्यता वितरण के एक परिवार द्वारा पूरी तरह से वर्णित माना जाता है जिसमें केवल अज्ञात मापदण्ड सम्मिलित होते हैं।<ref name=Cox2006/>उदाहरण के लिए, कोई यह मान सकता है कि जनसंख्या मूल्यों का वितरण वास्तव में सामान्य है, अज्ञात माध्य और विचरण के साथ है, और यह कि आंकड़ेसम्मुच्चय 'सरल' यादृच्छिक नमूनाकरण द्वारा उत्पन्न होते हैं। सामान्यीकृत रैखिक घटकों का परिवार प्राचलिक प्रतिरूप का व्यापक रूप से उपयोग किया जाने वाला और लचीला वर्ग है।
* [[पैरामीट्रिक मॉडल|प्राचलिक प्रतिरूप]]: आंकड़े -जनन प्रक्रिया का वर्णन करने वाले प्रायिकता वितरण को संभाव्यता वितरण के एक परिवार द्वारा पूरी तरह से वर्णित माना जाता है जिसमें केवल अज्ञात मापदण्ड सम्मिलित होते हैं।<ref name=Cox2006/>उदाहरण के लिए, कोई यह मान सकता है कि जनसंख्या मूल्यों का वितरण वास्तव में सामान्य है, अज्ञात माध्य और विचरण के साथ है, और यह कि आंकड़े सम्मुच्चय 'सरल' यादृच्छिक नमूनाकरण द्वारा उत्पन्न होते हैं। सामान्यीकृत रैखिक घटकों का परिवार प्राचलिक प्रतिरूप का व्यापक रूप से उपयोग किया जाने वाला और लचीला वर्ग है।
* गैर-प्राचलिक : आंकड़े उत्पन्न करने की प्रक्रिया के बारे में धारणा प्राचलिक आंकड़ों की तुलना में बहुत कम है और न्यूनतम हो सकती है। [9] उदाहरण के लिए, प्रत्येक निरंतर संभाव्यता वितरण में एक माध्यिका होती है, जिसका अनुमान नमूना माध्यिका या हॉजेस-लेहमन-सेन अनुमानक का उपयोग करके लगाया जा सकता है, जब डेटा सरल यादृच्छिक नमूनाकरण से उत्पन्न होता है तो इसमें अच्छे गुण होते हैं ।
* गैर-प्राचलिक: आंकड़े उत्पन्न करने की प्रक्रिया के बारे में अनुमान प्राचलिक आंकड़ों की तुलना में बहुत कम है और न्यूनतम हो सकती है। [9] उदाहरण के लिए, प्रत्येक निरंतर संभाव्यता वितरण में एक माध्यिका होती है, जिसका अनुमान नमूना माध्यिका या हॉजेस-लेहमन-सेन अनुमानक का उपयोग करके लगाया जा सकता है, जब डेटा सरल यादृच्छिक नमूनाकरण से उत्पन्न होता है तो इसमें अच्छे गुण होते हैं ।
* अल्प-प्राचलिक: यह शब्द सामान्यतः 'बीच में' पूरी तरह से और गैर-प्राचलिक दृष्टिकोणों की धारणाओं को दर्शाता है। उदाहरण के लिए, कोई यह मान सकता है कि जनसंख्या वितरण का एक परिमित माध्य है। इसके अलावा, कोई यह मान सकता है कि जनसंख्या में औसत प्रतिक्रिया स्तर कुछ सहसंयोजक (एक प्राचलिक धारणा) पर वास्तव में रैखिक तरीके से निर्भर करता है, लेकिन उस माध्य के आसपास के विचरण का वर्णन करने वाला कोई प्राचलिक धारणा नहीं बनाता है (अर्थात किसी [[विषमलैंगिकता]] की उपस्थिति या संभावित रूप के बारे में) अधिक सामान्यतः, अर्ध-प्राचलिक प्रतिरूप को प्रायः 'संरचनात्मक' और 'यादृच्छिक भिन्नता' घटकों में अलग किया जा सकता है। एक घटक को प्राचलिक रूप से और दूसरे को गैर-प्राचलिक रूप से व्यवहार किया जाता है। प्रसिद्ध [[कॉक्स मॉडल|कॉक्स प्रतिरूप]] अर्ध-प्राचलिक मान्यताओं का एक समूह है।
* अल्प-प्राचलिक: यह शब्द सामान्यतः 'बीच में' पूरी तरह से और गैर-प्राचलिक दृष्टिकोणों की अनुमानओं को दर्शाता है। उदाहरण के लिए, कोई यह मान सकता है कि जनसंख्या वितरण का एक परिमित माध्य है। इसके अलावा, कोई यह मान सकता है कि जनसंख्या में औसत प्रतिक्रिया स्तर कुछ सहसंयोजक (एक प्राचलिक अनुमान) पर वास्तव में रैखिक तरीके से निर्भर करता है, लेकिन उस माध्य के आसपास के विचरण का वर्णन करने वाला कोई प्राचलिक अनुमान नहीं बनाता है (अर्थात किसी [[विषमलैंगिकता]] की उपस्थिति या संभावित रूप के बारे में) अधिक सामान्यतः, अर्ध-प्राचलिक प्रतिरूप को प्रायः 'संरचनात्मक' और 'यादृच्छिक भिन्नता' घटकों में अलग किया जा सकता है। एक घटक को प्राचलिक रूप से और दूसरे को गैर-प्राचलिक रूप से व्यवहार किया जाता है। प्रसिद्ध [[कॉक्स मॉडल|कॉक्स प्रतिरूप]] अर्ध-प्राचलिक मान्यताओं का एक समूह है।


=== मान्य प्रतिरूप/धारणाओं का महत्व ===
=== मान्य प्रतिरूप/अनुमानओं का महत्व ===
{{See also| सांख्यिकीय प्रतिदर्श पुष्टीकरण }}
{{See also| सांख्यिकीय प्रतिदर्श पुष्टीकरण }}
[[File:Normality Histogram.png|thumb|उपरोक्त छवि सामान्यता की धारणा का आकलन करने वाला एक हिस्टोग्राम दिखाती है, जिसे बेल कर्व के नीचे समान प्रसार के माध्यम से चित्रित किया जा सकता है।]]किसी भी स्तर की धारणा बनाई जाती है, सामान्य रूप से सही ढंग से व्यवस्थित अनुमान, इन धारणाओं को सही होने की आवश्यकता होती है; यानी कि आँकड़ा-उत्पादक प्रक्रिया को वास्तव में सही ढंग से निर्दिष्ट किया गया है।
[[File:Normality Histogram.png|thumb|उपरोक्त छवि सामान्यता की अनुमान का आकलन करने वाला एक हिस्टोग्राम दिखाती है, जिसे बेल कर्व के नीचे समान प्रसार के माध्यम से चित्रित किया जा सकता है।]]जिस भी स्तर का अनुमान लगाया जाता है, सामान्य रूप से सही ढंग से व्यवस्थित अनुमान होते हैं, इन अनुमानों को सही होने की आवश्यकता होती है; यानी कि आंकड़े -उत्पादक प्रक्रिया को वास्तव में सही ढंग से निर्दिष्ट किया गया है।


' सरल 'यादृच्छिक नमूनाकरण सांख्यिकीय धारणा को अमान्य कर सकता है।<ref>Kruskal 1988</ref> अधिक जटिल अर्ध- और पूरी तरह से प्राचलिक धारणाएं भी चिंता का कारण हैं। उदाहरण के लिए, गलत तरीके से कॉक्स प्रतिरूप को मानने से कुछ मामलों में गलत निष्कर्ष निकल सकते हैं।<ref>
' सरल 'यादृच्छिक नमूनाकरण सांख्यिकीय अनुमान को अमान्य कर सकता है।<ref>Kruskal 1988</ref> अधिक जटिल अर्ध- और पूरी तरह से प्राचलिक अनुमानएं भी चिंता का कारण हैं। उदाहरण के लिए, गलत तरीके से कॉक्स प्रतिरूप को मानने से कुछ मामलों में गलत निष्कर्ष निकल सकते हैं।<ref>
[[David A. Freedman|Freedman, D.A.]] (2008) "Survival analysis: An Epidemiological hazard?". ''The American Statistician'' (2008) 62: 110-119. (Reprinted as Chapter 11 (pages 169–192) of Freedman (2010)).</ref> जनसंख्या में सामान्यता की गलत धारणाएं प्रतिगमन-आधारित धारणा के कुछ रूपों को भी अमान्य कर देती हैं।<ref>Berk, R. (2003) ''Regression Analysis: A Constructive Critique (Advanced Quantitative Techniques in the Social Sciences) (v. 11)'' Sage Publications. {{ISBN|0-7619-2904-5}}</ref> किसी भी प्राचलिक प्रतिरूप के उपयोग को मानव जनसंख्या के नमूने लेने में अधिकांश विशेषज्ञों द्वारा संशय की दृष्टि से देखा जाता है: अधिकांश नमूना सांख्यिकीविद, जब वे विश्वास्यता अंतराल से निपटते हैं, तो खुद को बहुत बड़े नमूनों के आधार पर [अनुमानकों] के बारे में बयानों तक सीमित रखते हैं, जहां केंद्रीय सीमा प्रमेय सुनिश्चित करता है। कि इन [अनुमानकों] के वितरण लगभग सामान्य होंगे।<ref name=Brewer>{{cite book|first=Ken |last=Brewer| title=संयुक्त सर्वेक्षण नमूना निष्कर्ष: बसु के हाथियों का वजन| publisher=Hodder Arnold|page=6|year= 2002|isbn=978-0340692295}}</ref> विशेष रूप से, एक सामान्य वितरण पूरी तरह से अवास्तविक और भयावह रूप से नासमझ धारणा होगी यदि हम किसी भी प्रकार की आर्थिक आबादी के साथ काम कर रहे हों।<ref name=Brewer/>यहां, केंद्रीय सीमा प्रमेय बताता है कि बहुत बड़े नमूनों के लिए नमूना माध्य का वितरण लगभग सामान्य रूप से वितरित किया जाता है, यदि वितरण भारी-सपुच्छ वाला नहीं है।
[[David A. Freedman|Freedman, D.A.]] (2008) "Survival analysis: An Epidemiological hazard?". ''The American Statistician'' (2008) 62: 110-119. (Reprinted as Chapter 11 (pages 169–192) of Freedman (2010)).</ref> जनसंख्या में सामान्यता की गलत अनुमानएं प्रतिगमन-आधारित अनुमान के कुछ रूपों को भी अमान्य कर देती हैं।<ref>Berk, R. (2003) ''Regression Analysis: A Constructive Critique (Advanced Quantitative Techniques in the Social Sciences) (v. 11)'' Sage Publications. {{ISBN|0-7619-2904-5}}</ref> किसी भी प्राचलिक प्रतिरूप के उपयोग को मानव जनसंख्या के नमूने लेने में अधिकांश विशेषज्ञों द्वारा संशय की दृष्टि से देखा जाता है: अधिकांश सांख्यिकीविद नमूने, जब विश्वास्यता अंतराल से निपटते हैं, तो खुद को बहुत बड़े नमूनों के आधार पर [अनुमानकों] के बारे में बयानों तक सीमित रखते हैं, जहां केंद्रीय सीमा प्रमेय सुनिश्चित करता है। कि इन [अनुमानकों] के वितरण लगभग सामान्य होंगे।<ref name=Brewer>{{cite book|first=Ken |last=Brewer| title=संयुक्त सर्वेक्षण नमूना निष्कर्ष: बसु के हाथियों का वजन| publisher=Hodder Arnold|page=6|year= 2002|isbn=978-0340692295}}</ref> विशेष रूप से, एक सामान्य वितरण पूरी तरह से अवास्तविक और भयावह रूप से नासमझ अनुमान होगी यदि हम किसी भी प्रकार की आर्थिक आबादी के साथ काम कर रहे हों।<ref name=Brewer/>यहां, केंद्रीय सीमा प्रमेय बताता है कि बहुत बड़े नमूनों के लिए नमूना माध्य का वितरण लगभग सामान्य रूप से वितरित किया जाता है, यदि वितरण भारी-सपुच्छ वाला नहीं है।


==== अनुमानित वितरण ====
==== अनुमानित वितरण ====
{{Main|सांख्यिकीय दूरी| उपगामी सिद्धांत (अंकशास्त्र)| सन्निकटन सिद्धांत}}
{{Main|सांख्यिकीय दूरी| उपगामी सिद्धांत (अंकशास्त्र)| सन्निकटन सिद्धांत}}


नमूना आँकड़ों के सटीक वितरण को निर्दिष्ट करने में कठिनाई को देखते हुए, इनकी धारणा लगाने के लिए कई तरीके विकसित किए गए हैं।
नमूना आँकड़ों के सटीक वितरण को निर्दिष्ट करने में कठिनाई को देखते हुए, इनकी अनुमान लगाने के लिए कई तरीके विकसित किए गए हैं।


परिमित नमूनों के साथ, [[सन्निकटन सिद्धांत]] यह मापता है कि एक सीमित वितरण आँकड़ों के [[नमूना वितरण]] के कितने करीब है: उदाहरण के लिए, 10,000 स्वतंत्र नमूनों के साथ, बेरी-एस्सेन प्रमेय द्वारा, सामान्य वितरण अनुमानित (सटीकता के दो अंकों तक) कई जनसंख्या वितरणों के लिए नमूना माध्य का वितरण है।<ref name=JHJ>
परिमित नमूनों के साथ, [[सन्निकटन सिद्धांत]] यह मापता है कि एक सीमित वितरण आँकड़ों के [[नमूना वितरण]] के कितने करीब है: उदाहरण के लिए, 10,000 स्वतंत्र नमूनों के साथ, बेरी-एस्सेन प्रमेय द्वारा, सामान्य वितरण अनुमानित (सटीकता के दो अंकों तक) कई जनसंख्या वितरणों के लिए नमूना माध्य का वितरण है।<ref name=JHJ>
Line 54: Line 54:


अनिश्चित रूप से बड़े नमूनों के साथ, [[स्पर्शोन्मुख सिद्धांत (सांख्यिकी)]] [[केंद्रीय सीमा प्रमेय]] की तरह नमूना आँकड़ों के सीमित वितरण का वर्णन करता है, यदि कोई मौजूद है। सीमित परिणाम परिमित नमूनों के बारे में कथन नहीं हैं, और वास्तव में परिमित नमूनों के लिए अप्रासंगिक हैं।<ref>Kolmogorov (1963, p.369): "The frequency concept, <!-- comma missing in original --> based on the notion of limiting frequency as the number of trials increases to infinity, does not contribute anything to substantiate the applicability of the results of probability theory to real practical problems where we have always to deal with a finite number of trials".</ref><ref>"Indeed, limit theorems 'as&nbsp;<math>n</math> tends to infinity' are logically devoid of content about what happens at any particular&nbsp;<math>n</math>. All they can do is suggest certain approaches whose performance must then be checked on the case at hand." — Le Cam (1986) (page xiv)</ref><ref>Pfanzagl (1994): "The crucial drawback of asymptotic theory: What we expect from asymptotic theory are results which hold approximately . . . . What asymptotic theory has to offer are limit theorems."(page ix) "What counts for applications are approximations, not limits." (page 188)
अनिश्चित रूप से बड़े नमूनों के साथ, [[स्पर्शोन्मुख सिद्धांत (सांख्यिकी)]] [[केंद्रीय सीमा प्रमेय]] की तरह नमूना आँकड़ों के सीमित वितरण का वर्णन करता है, यदि कोई मौजूद है। सीमित परिणाम परिमित नमूनों के बारे में कथन नहीं हैं, और वास्तव में परिमित नमूनों के लिए अप्रासंगिक हैं।<ref>Kolmogorov (1963, p.369): "The frequency concept, <!-- comma missing in original --> based on the notion of limiting frequency as the number of trials increases to infinity, does not contribute anything to substantiate the applicability of the results of probability theory to real practical problems where we have always to deal with a finite number of trials".</ref><ref>"Indeed, limit theorems 'as&nbsp;<math>n</math> tends to infinity' are logically devoid of content about what happens at any particular&nbsp;<math>n</math>. All they can do is suggest certain approaches whose performance must then be checked on the case at hand." — Le Cam (1986) (page xiv)</ref><ref>Pfanzagl (1994): "The crucial drawback of asymptotic theory: What we expect from asymptotic theory are results which hold approximately . . . . What asymptotic theory has to offer are limit theorems."(page ix) "What counts for applications are approximations, not limits." (page 188)
</ref> हालांकि, परिमित नमूनों के साथ काम करने के लिए वितरण को सीमित करने के स्पर्शोन्मुख सिद्धांत को प्रायः लागू किया जाता है। उदाहरण के लिए, सीमित परिणाम प्रायः [[क्षणों की सामान्यीकृत विधि]] और [[सामान्यीकृत अनुमान समीकरण|सामान्यीकृत धारणा समीकरण]]ों के उपयोग को सही ठहराने के लिए लागू होते हैं, जो कि [[अर्थमिति]] और जैव-सांख्यिकी में लोकप्रिय हैं। सीमित वितरण और वास्तविक वितरण (औपचारिक रूप से, सन्निकटन की 'त्रुटि') के बीच अंतर के परिमाण का मूल्यांकन अनुकरण का उपयोग करके किया जा सकता है<!-- and approximation results -->.<ref>Pfanzagl (1994) : "By taking a limit theorem as being approximately true for large sample sizes, we commit an error the size of which is unknown. [. . .] Realistic information about the remaining errors may be obtained by simulations." (page ix)
</ref> हालांकि, परिमित नमूनों के साथ काम करने के लिए वितरण को सीमित करने के स्पर्शोन्मुख सिद्धांत को प्रायः लागू किया जाता है। उदाहरण के लिए, सीमित परिणाम प्रायः [[क्षणों की सामान्यीकृत विधि]] और [[सामान्यीकृत अनुमान समीकरण]]ों के उपयोग को सही ठहराने के लिए लागू होते हैं, जो कि [[अर्थमिति]] और जैव-सांख्यिकी में लोकप्रिय हैं। सीमित वितरण और वास्तविक वितरण (औपचारिक रूप से, सन्निकटन की 'त्रुटि') के बीच अंतर के परिमाण का मूल्यांकन अनुकरण का उपयोग करके किया जा सकता है।<ref>Pfanzagl (1994) : "By taking a limit theorem as being approximately true for large sample sizes, we commit an error the size of which is unknown. [. . .] Realistic information about the remaining errors may be obtained by simulations." (page ix)
</ref> परिमित नमूनों के परिणामों को सीमित करने का अनुमानी अनुप्रयोग कई अनुप्रयोगों में आम चलन है, विशेष रूप से लॉग-अवतल संभावना वाले कम-आयामी प्रतिरूप के साथ (जैसे कि एक- मापदण्ड घातीय परिवारों के साथ)।
</ref> परिमित नमूनों के परिणामों को सीमित करने का अनुमानी अनुप्रयोग कई अनुप्रयोगों में आम चलन है, विशेष रूप से लॉग-अवतल संभावना वाले कम-आयामी प्रतिरूप के साथ (जैसे कि एक- मापदण्ड घातीय परिवारों के साथ)।


Line 61: Line 61:
{{See also| यादृच्छिक नमूना| निरुद्देश्य  समनुदेशन }}
{{See also| यादृच्छिक नमूना| निरुद्देश्य  समनुदेशन }}


किसी दिए गए आँकड़ासम्मुच्चय के लिए जो एक यादृच्छिककरण अभिकल्पना द्वारा निर्मित किया गया था, एक सांख्यिकीय (शून्य-परिकल्पना के तहत) के यादृच्छिककरण वितरण को सभी योजनाओं के लिए परीक्षण आंकड़े का मूल्यांकन करके परिभाषित किया गया है जो कि यादृच्छिककरण अभिकल्पना द्वारा उत्पन्न किया जा सकता था। बारंबारतावादी धारणा में, यादृच्छिककरण एक व्यक्तिपरक प्रतिरूप के बजाय यादृच्छिककरण वितरण पर आधारित होने की अनुमति देता है, और यह विशेष रूप से सर्वेक्षण नमूनाकरण और प्रयोगों के अभिकल्पना में महत्वपूर्ण है।<ref>[[Jerzy Neyman|Neyman, J.]](1934) "On the two different aspects of the representative method: The method of stratified sampling and the method of purposive selection", ''[[Journal of the Royal Statistical Society]]'', 97 (4), 557–625 {{jstor|2342192}}</ref><ref name="Hinkelmann and Kempthorne">Hinkelmann and Kempthorne(2008) {{page needed|date=June 2011}}</ref> यादृच्छिक अध्ययन से सांख्यिकीय निष्कर्ष भी कई अन्य स्थितियों की तुलना में अधिक सीधा है।<ref>ASA Guidelines for the first course in statistics for non-statisticians. (available at the ASA website)</ref><ref>[[David A. Freedman]] et alia's ''Statistics''.</ref><ref>Moore et al. (2015).</ref> बायेसियन धारणा में, यादृच्छिककरण भी महत्वपूर्ण है: [[सर्वेक्षण नमूनाकरण]] में, प्रतिस्थापन के बिना नमूने का उपयोग जनसंख्या के साथ नमूने की विनिमयशीलता सुनिश्चित करता है; यादृच्छिक प्रयोगों में, यादृच्छिककरण [[कोवरिएट|सहविचर]] जानकारी के लिए यादृच्छिक धारणा पर लापता होने का वारंट करता है।<ref>[[Andrew Gelman|Gelman A.]] et al. (2013). ''Bayesian Data Analysis'' ([[Chapman & Hall]]).</ref>
किसी दिए गए आंकड़े सम्मुच्चय के लिए जो एक यादृच्छिककरण अभिकल्पना द्वारा निर्मित किया गया था, एक सांख्यिकीय (शून्य-परिकल्पना के तहत) के यादृच्छिककरण वितरण को सभी योजनाओं के लिए परीक्षण आंकड़े का मूल्यांकन करके परिभाषित किया गया है जो कि यादृच्छिककरण अभिकल्पना द्वारा उत्पन्न किया जा सकता था। बारंबारतावादी अनुमान में, यादृच्छिककरण एक व्यक्तिपरक प्रतिरूप के बजाय यादृच्छिककरण वितरण पर आधारित होने की अनुमति देता है, और यह विशेष रूप से सर्वेक्षण नमूनाकरण और प्रयोगों के अभिकल्पना में महत्वपूर्ण है।<ref>[[Jerzy Neyman|Neyman, J.]](1934) "On the two different aspects of the representative method: The method of stratified sampling and the method of purposive selection", ''[[Journal of the Royal Statistical Society]]'', 97 (4), 557–625 {{jstor|2342192}}</ref><ref name="Hinkelmann and Kempthorne">Hinkelmann and Kempthorne(2008) {{page needed|date=June 2011}}</ref> यादृच्छिक अध्ययन से सांख्यिकीय निष्कर्ष भी कई अन्य स्थितियों की तुलना में अधिक सीधा है।<ref>ASA Guidelines for the first course in statistics for non-statisticians. (available at the ASA website)</ref><ref>[[David A. Freedman]] et alia's ''Statistics''.</ref><ref>Moore et al. (2015).</ref> बायेसियन अनुमान में, यादृच्छिककरण भी महत्वपूर्ण है: [[सर्वेक्षण नमूनाकरण]] में, प्रतिस्थापन के बिना नमूने का उपयोग जनसंख्या के साथ नमूने की विनिमयशीलता सुनिश्चित करता है; यादृच्छिक प्रयोगों में, यादृच्छिककरण [[कोवरिएट|सहविचर]] जानकारी के लिए यादृच्छिक अनुमान पर लापता होने का वारंट करता है।<ref>[[Andrew Gelman|Gelman A.]] et al. (2013). ''Bayesian Data Analysis'' ([[Chapman & Hall]]).</ref>
वस्तुनिष्ठ यादृच्छिककरण ठीक से आगमनात्मक प्रक्रियाओं की अनुमति देता है।<ref>Peirce (1877-1878)</ref><ref>Peirce (1883)</ref>{{sfn|Freedman|Pisani|Purves|1978}}<ref>[[David A. Freedman]] ''Statistical Models''.</ref><ref>
वस्तुनिष्ठ यादृच्छिककरण ठीक से आगमनात्मक प्रक्रियाओं की अनुमति देता है।<ref>Peirce (1877-1878)</ref><ref>Peirce (1883)</ref>{{sfn|Freedman|Pisani|Purves|1978}}<ref>[[David A. Freedman]] ''Statistical Models''.</ref><ref>
[[C. R. Rao|Rao, C.R.]] (1997) ''Statistics and Truth: Putting Chance to Work'', World Scientific. {{isbn|981-02-3111-3}}</ref>
[[C. R. Rao|Rao, C.R.]] (1997) ''Statistics and Truth: Putting Chance to Work'', World Scientific. {{isbn|981-02-3111-3}}</ref>
कई सांख्यिकीविद् आंकड़ों के यादृच्छिककरण-आधारित विश्लेषण को पसंद करते हैं जो कि अच्छी तरह से परिभाषित यादृच्छिकीकरण प्रक्रियाओं द्वारा उत्पन्न किया गया था।<ref>Peirce; Freedman; Moore et al. (2015).{{Citation needed|date=March 2010}}</ref> (हालांकि, यह सच है कि विज्ञान के क्षेत्रों में विकसित सैद्धांतिक ज्ञान और प्रयोगात्मक नियंत्रण के साथ, यादृच्छिक प्रयोग अनुमानों की गुणवत्ता में सुधार किए बिना प्रयोग की लागत बढ़ा सकते हैं।<ref>Box, G.E.P. and Friends (2006) ''Improving Almost Anything: Ideas and Essays, Revised Edition'', Wiley. {{isbn|978-0-471-72755-2}}</ref><ref>
कई सांख्यिकीविद् आंकड़ों के यादृच्छिककरण-आधारित विश्लेषण को पसंद करते हैं जो कि अच्छी तरह से परिभाषित यादृच्छिकीकरण प्रक्रियाओं द्वारा उत्पन्न किया गया था।<ref>Peirce; Freedman; Moore et al. (2015).{{Citation needed|date=March 2010}}</ref> (हालांकि, यह सच है कि विज्ञान के क्षेत्रों में विकसित सैद्धांतिक ज्ञान और प्रयोगात्मक नियंत्रण के साथ, यादृच्छिक प्रयोग अनुमानों की गुणवत्ता में सुधार किए बिना प्रयोग की लागत बढ़ा सकते हैं।<ref>Box, G.E.P. and Friends (2006) ''Improving Almost Anything: Ideas and Essays, Revised Edition'', Wiley. {{isbn|978-0-471-72755-2}}</ref><ref>
Cox (2006), p.&nbsp;196.</ref>)
Cox (2006), p.&nbsp;196.</ref>)
इसी तरह, प्रमुख सांख्यिकीय अधिकारियों द्वारा [[यादृच्छिक प्रयोग|यादृच्छिक प्रयोगों]] के परिणामों की अनुशंसा की जाती है क्योंकि समान घटनाओं के अवलोकन संबंधी अध्ययनों की तुलना में अधिक विश्वसनीयता वाले अनुमानों की अनुमति होती है।<ref>ASA Guidelines for the first course in statistics for non-statisticians. (available at the ASA website)
इसी तरह, प्रमुख सांख्यिकीय अधिकारियों द्वारा [[यादृच्छिक प्रयोग|यादृच्छिक प्रयोगों]] के परिणामों की अनुशंसा की जाती है क्योंकि समान घटनाओं के अवलोकन संबंधी अध्ययनों की तुलना में अधिक विश्वसनीयता वाले अनुमानों की अनुमति होती है।<ref>ASA Guidelines for the first course in statistics for non-statisticians. (available at the ASA website)
* David A. Freedman et alias ''Statistics''.
*David A. Freedman et alias ''Statistics''.
* Moore et al. (2015).
*Moore et al. (2015).
</ref>
</ref>
हालांकि, एक अच्छा अवलोकन संबंधी अध्ययन एक खराब यादृच्छिक प्रयोग से बेहतर हो सकता है।
हालांकि, एक अच्छा अवलोकन संबंधी अध्ययन एक खराब यादृच्छिक प्रयोग से बेहतर हो सकता है।


एक यादृच्छिक प्रयोग का सांख्यिकीय विश्लेषण प्रायोगिक विज्ञप्ति में वर्णित यादृच्छिकीकरण योजना पर आधारित हो सकता है और इसके लिए व्यक्तिपरक प्रतिरूप की आवश्यकता नहीं होती है।<ref>Neyman, Jerzy. 1923 [1990]. "On the Application of Probability Theory to AgriculturalExperiments. Essay on Principles. Section 9." ''Statistical Science'' 5 (4): 465–472. Trans. [[Dorota Dabrowska|Dorota M. Dabrowska]] and Terence P. Speed.</ref><ref>Hinkelmann & Kempthorne (2008) {{page needed|date=June 2011}}</ref>
एक यादृच्छिक प्रयोग का सांख्यिकीय विश्लेषण प्रायोगिक विज्ञप्ति में वर्णित यादृच्छिकीकरण योजना पर आधारित हो सकता है और इसके लिए व्यक्तिपरक प्रतिरूप की आवश्यकता नहीं होती है।<ref>Neyman, Jerzy. 1923 [1990]. "On the Application of Probability Theory to AgriculturalExperiments. Essay on Principles. Section 9." ''Statistical Science'' 5 (4): 465–472. Trans. [[Dorota Dabrowska|Dorota M. Dabrowska]] and Terence P. Speed.</ref><ref>Hinkelmann & Kempthorne (2008) {{page needed|date=June 2011}}</ref>
हालाँकि, किसी भी समय, कुछ परिकल्पनाओं का वस्तुनिष्ठ सांख्यिकीय प्रतिरूप का उपयोग करके परीक्षण नहीं किया जा सकता है, जो यादृच्छिक प्रयोगों या यादृच्छिक नमूनों का सटीक वर्णन करते हैं। कुछ मामलों में, ऐसे यादृच्छिक अध्ययन असंवैधानिक या अनैतिक हैं।
हालाँकि, किसी भी समय, कुछ परिकल्पनाओं का वस्तुनिष्ठ सांख्यिकीय प्रतिरूप का उपयोग करके परीक्षण नहीं किया जा सकता है, जो यादृच्छिक प्रयोगों या यादृच्छिक नमूनों का सटीक वर्णन करते हैं। कुछ मामलों में, ऐसे यादृच्छिक अध्ययन असंवैधानिक या अनैतिक हैं।


Line 113: Line 116:
| pmid=30460455 | pmc= 6527505
| pmid=30460455 | pmc= 6527505
}}</ref>
}}</ref>
उदाहरण के लिए, प्रतिरूप-मुक्त सरल रेखीय प्रतिगमन निम्न पर आधारित है।
उदाहरण के लिए, प्रतिरूप-मुक्त सरल रेखीय प्रतिगमन निम्न पर आधारित है।
* एक यादृच्छिक अभिकल्पना, जहां टिप्पणियों के जोड़े <math>(X_1,Y_1), (X_2,Y_2), \cdots , (X_n,Y_n)</math> स्वतंत्र और समान रूप से वितरित (iid) हैं, या
* एक यादृच्छिक अभिकल्पना, जहां टिप्पणियों के जोड़े <math>(X_1,Y_1), (X_2,Y_2), \cdots , (X_n,Y_n)</math> स्वतंत्र और समान रूप से वितरित (iid) हैं, या
* एक नियतात्मक अभिकल्पना, जहां चर <math>X_1, X_2, \cdots, X_n</math> नियतात्मक हैं, लेकिन संबंधित प्रतिक्रिया चर <math>Y_1,Y_2, \cdots, Y_n</math> एक सामान्य सशर्त वितरण के साथ यादृच्छिक और स्वतंत्र हैं, अर्थात, <math>P\left (Y_j \leq y | X_j =x\right ) = D_x(y)</math>, जो सूचकांक <math>j</math> से स्वतंत्र है।
* एक नियतात्मक अभिकल्पना, जहां चर <math>X_1, X_2, \cdots, X_n</math> नियतात्मक हैं, लेकिन संबंधित प्रतिक्रिया चर <math>Y_1,Y_2, \cdots, Y_n</math> एक सामान्य सशर्त वितरण के साथ यादृच्छिक और स्वतंत्र हैं, अर्थात, <math>P\left (Y_j \leq y | X_j =x\right ) = D_x(y)</math>, जो सूचकांक <math>j</math> से स्वतंत्र है।


किसी भी मामले में, सामान्य सशर्त वितरण की सुविधाओं के लिए प्रतिरूप-मुक्त यादृच्छिककरण धारणा <math>D_x(.)</math> कुछ नियमितता स्थितियों पर निर्भर करता है, उदा। कार्यात्मक सहजता। उदाहरण के लिए, जनसंख्या सुविधा सशर्त माध्य के लिए प्रतिरूप-मुक्त यादृच्छिककरण अनुमान, <math>\mu(x)=E(Y | X = x)</math>, धारणा के तहत स्थानीय औसत या स्थानीय बहुपद उपयुक्त के माध्यम से लगातार धारणा लगाई जा सकती है कि <math>\mu(x)</math>निर्बाध है। इसके अलावा, स्पर्शोन्मुख सामान्यता या पुनरुत्पादन पर भरोसा करते हुए, हम जनसंख्या विशेषता के लिए विश्वास अंतराल का निर्माण कर सकते हैं, इस मामले में, सशर्त माध्य, <math>\mu(x)</math>.<ref name="Politis Model-Free Inference 2019">
किसी भी मामले में, सामान्य सशर्त वितरण की सुविधाओं के लिए प्रतिरूप-मुक्त यादृच्छिककरण अनुमान <math>D_x(.)</math> कुछ नियमितता स्थितियों पर निर्भर करता है, उदा। कार्यात्मक सहजता। उदाहरण के लिए, जनसंख्या सुविधा सशर्त माध्य के लिए प्रतिरूप-मुक्त यादृच्छिककरण अनुमान, <math>\mu(x)=E(Y | X = x)</math>, अनुमान के तहत स्थानीय औसत या स्थानीय बहुपद उपयुक्त के माध्यम से लगातार अनुमान लगाई जा सकती है कि <math>\mu(x)</math>निर्बाध है। इसके अलावा, स्पर्शोन्मुख सामान्यता या पुनरुत्पादन पर भरोसा करते हुए, हम जनसंख्या विशेषता के लिए विश्वास अंतराल का निर्माण कर सकते हैं, इस मामले में, सशर्त माध्य, <math>\mu(x)</math> है।<ref name="Politis Model-Free Inference 2019">
{{cite journal
{{cite journal
|last1= Politis | first1=D.N.
|last1= Politis | first1=D.N.
Line 128: Line 132:




== धारणा के प्रतिमान ==
सांख्यिकीय धारणा के विभिन्न विद्यालय स्थापित हो गए हैं। ये विद्यालय-या प्रतिमान-पारस्परिक रूप से अनन्य नहीं हैं, और जो तरीके एक प्रतिमान के तहत अच्छी तरह से काम करते हैं, उनकी प्रायः अन्य प्रतिमानों के तहत आकर्षक व्याख्या होती है।


बंद्योपाध्याय और फोस्टर चार प्रतिमानों का वर्णन करते हैं: पारम्परिक (या [[आवृत्तिवादी अनुमान]]) प्रतिमान, बायेसियन धारणा प्रतिमान, [[संभावनावाद]] प्रतिमान, और एकाइके सूचना मानदंड | अकाइकेन-सूचना मानदंड-आधारित प्रतिमान।<ref>Bandyopadhyay & Forster (2011). See the book's Introduction (p.3) and "Section&nbsp;III: Four Paradigms of Statistics".</ref>
== अनुमान के प्रतिमान ==
सांख्यिकीय अनुमान के विभिन्न विद्यालय स्थापित हो गए हैं। ये विद्यालय-या प्रतिमान-पारस्परिक रूप से अनन्य नहीं हैं, और जो तरीके एक प्रतिमान के तहत अच्छी तरह से काम करते हैं, उनकी प्रायः अन्य प्रतिमानों के तहत आकर्षक व्याख्या होती है।
 
बंद्योपाध्याय और फोस्टर चार प्रतिमानों का वर्णन करते हैं: पारम्परिक (या [[आवृत्तिवादी अनुमान]]) प्रतिमान, बायेसियन अनुमान प्रतिमान, [[संभावनावाद]] प्रतिमान, और एकाइके सूचना मानदंड| अकाइकेन-सूचना मानदंड-आधारित प्रतिमान।<ref>Bandyopadhyay & Forster (2011). See the book's Introduction (p.3) and "Section&nbsp;III: Four Paradigms of Statistics".</ref>




Line 137: Line 142:
{{Main|आवृत्तिवादी अनुमान}}
{{Main|आवृत्तिवादी अनुमान}}


यह प्रतिमान हाथ में एक के समान आँकड़ासम्मुच्चय बनाने के लिए जनसंख्या वितरण के बार-बार नमूने पर विचार करके प्रस्तावों की संभाव्यता को जांचता है। दोहराए गए नमूने के तहत आँकड़ासम्मुच्चय की विशेषताओं पर विचार करके, एक सांख्यिकीय प्रस्ताव के आवृत्तिवादी गुणों को परिमाणित किया जा सकता है - हालांकि व्यवहार में यह परिमाणीकरण चुनौतीपूर्ण हो सकता है।
यह प्रतिमान हाथ में एक के समान आंकड़े सम्मुच्चय बनाने के लिए जनसंख्या वितरण के बार-बार नमूने पर विचार करके प्रस्तावों की संभाव्यता को जांचता है। दोहराए गए नमूने के तहत आंकड़े सम्मुच्चय की विशेषताओं पर विचार करके, एक सांख्यिकीय प्रस्ताव के आवृत्तिवादी गुणों को परिमाणित किया जा सकता है - हालांकि व्यवहार में यह परिमाणीकरण चुनौतीपूर्ण हो सकता है।


==== आवृत्तिवादी धारणा के उदाहरण ====
==== आवृत्तिवादी अनुमान के उदाहरण ====
* p- मूल्य   
* p- मूल्य   
* निराकरणीय परिकल्पना अंतराल
* निराकरणीय परिकल्पना अंतराल
Line 145: Line 150:


==== आवृत्तिवादी अनुमान, वस्तुनिष्ठता और निर्णय सिद्धांत ====
==== आवृत्तिवादी अनुमान, वस्तुनिष्ठता और निर्णय सिद्धांत ====
बारंबारतावादी धारणा (या शास्त्रीय अनुमान) की एक व्याख्या यह है कि यह केवल आवृत्ति संभावना के संदर्भ में लागू होता है; यानी, किसी आबादी से बार-बार नमूने लेने के संदर्भ में। हालांकि, नेमन का दृष्टिकोण<ref>{{cite journal | last = Neyman | first = J. | author-link = Jerzy Neyman | year = 1937 | title = संभाव्यता के शास्त्रीय सिद्धांत के आधार पर सांख्यिकीय अनुमान के सिद्धांत की रूपरेखा| jstor = 91337 | journal = Philosophical Transactions of the Royal Society of London A | volume = 236 | issue = 767| pages = 333–380 | doi=10.1098/rsta.1937.0005 | bibcode = 1937RSPTA.236..333N | doi-access = free }}</ref> पूर्व-प्रयोग संभावनाओं के संदर्भ में इन प्रक्रियाओं को विकसित करता है। अर्थात्, एक प्रयोग करने से पहले, एक निष्कर्ष पर आने के लिए एक नियम तय करता है जैसे कि सही होने की संभावना को एक उपयुक्त तरीके से नियंत्रित किया जाता है: इस तरह की संभावना को बारंबारतावादी या बार-बार नमूना व्याख्या की आवश्यकता नहीं होती है। इसके विपरीत, बायेसियन धारणा सशर्त संभावनाओं के संदर्भ में काम करता है (अर्थात देखे गए आँकड़ा पर सशर्त संभावनाएं), सीमांत (लेकिन अज्ञात मापदंडों पर सशर्त) संभावनाओं की तुलना में लगातार दृष्टिकोण में उपयोग किया जाता है।
बारंबारतावादी अनुमान (या शास्त्रीय अनुमान) की एक व्याख्या यह है कि यह केवल आवृत्ति संभावना के संदर्भ में लागू होता है; यानी, किसी आबादी से बार-बार नमूने लेने के संदर्भ में। हालांकि, नेमन का दृष्टिकोण<ref>{{cite journal | last = Neyman | first = J. | author-link = Jerzy Neyman | year = 1937 | title = संभाव्यता के शास्त्रीय सिद्धांत के आधार पर सांख्यिकीय अनुमान के सिद्धांत की रूपरेखा| jstor = 91337 | journal = Philosophical Transactions of the Royal Society of London A | volume = 236 | issue = 767| pages = 333–380 | doi=10.1098/rsta.1937.0005 | bibcode = 1937RSPTA.236..333N | doi-access = free }}</ref> पूर्व-प्रयोग संभावनाओं के संदर्भ में इन प्रक्रियाओं को विकसित करता है। अर्थात्, एक प्रयोग करने से पहले, एक निष्कर्ष पर आने के लिए एक नियम तय करता है जैसे कि सही होने की संभावना को एक उपयुक्त तरीके से नियंत्रित किया जाता है: इस तरह की संभावना को बारंबारतावादी या बार-बार नमूना व्याख्या की आवश्यकता नहीं होती है। इसके विपरीत, बायेसियन अनुमान सशर्त संभावनाओं के संदर्भ में काम करता है (अर्थात देखे गए आंकड़े  पर सशर्त संभावनाएं), सीमांत (लेकिन अज्ञात मापदंडों पर सशर्त) संभावनाओं की तुलना में लगातार दृष्टिकोण में उपयोग किया जाता है।


उपयोगिता कार्यों के संबंध में महत्व परीक्षण और विश्वास अंतराल की लगातार प्रक्रियाओं का निर्माण किया जा सकता है। हालाँकि, आवृत्तिवादी सांख्यिकी के कुछ तत्व, जैसे कि [[सांख्यिकीय निर्णय सिद्धांत]], उपयोगिता कार्यों को सम्मिलित करते हैं।{{Citation needed|date=April 2012}} विशेष रूप से, इष्टतम धारणा (जैसे [[न्यूनतम-विचरण निष्पक्ष अनुमानक]], या [[समान रूप से सबसे शक्तिशाली परीक्षण]]) के लगातार विकास हानि कार्यों का उपयोग करते हैं, जो (नकारात्मक) उपयोगिता कार्यों की भूमिका निभाते हैं। सांख्यिकीय सिद्धांतकारों को यह साबित करने के लिए हानि कार्यों को स्पष्ट रूप से नहीं बताया जाना चाहिए कि एक सांख्यिकीय प्रक्रिया में इष्टतमता संपत्ति है।<ref>Preface to Pfanzagl.</ref> हालांकि, नुकसान-प्रकार्य प्रायः इष्टतम गुणों को बताते हुए उपयोगी होते हैं: उदाहरण के लिए, औसत-निष्पक्ष अनुमानक पूर्ण मूल्य हानि कार्यों के तहत इष्टतम होते हैं, जिसमें वे अपेक्षित हानि को कम करते हैं, और कम से कम वर्ग अनुमानक वर्ग त्रुटि हानि कार्यों के तहत इष्टतम होते हैं, जिसमें वे अपेक्षित नुकसान को कम करें।
उपयोगिता कार्यों के संबंध में महत्व परीक्षण और विश्वास अंतराल की लगातार प्रक्रियाओं का निर्माण किया जा सकता है। हालाँकि, आवृत्तिवादी सांख्यिकी के कुछ तत्व, जैसे कि [[सांख्यिकीय निर्णय सिद्धांत]], उपयोगिता कार्यों को सम्मिलित करते हैं।{{Citation needed|date=April 2012}} विशेष रूप से, इष्टतम अनुमान (जैसे [[न्यूनतम-विचरण निष्पक्ष अनुमानक]], या [[समान रूप से सबसे शक्तिशाली परीक्षण]]) के लगातार विकास हानि कार्यों का उपयोग करते हैं, जो (नकारात्मक) उपयोगिता कार्यों की भूमिका निभाते हैं। सांख्यिकीय सिद्धांतकारों को यह साबित करने के लिए हानि कार्यों को स्पष्ट रूप से नहीं बताया जाना चाहिए कि एक सांख्यिकीय प्रक्रिया में इष्टतमता संपत्ति है।<ref>Preface to Pfanzagl.</ref> हालांकि, नुकसान-प्रकार्य प्रायः इष्टतम गुणों को बताते हुए उपयोगी होते हैं: उदाहरण के लिए, औसत-निष्पक्ष अनुमानक पूर्ण मूल्य हानि कार्यों के तहत इष्टतम होते हैं, जिसमें वे अपेक्षित हानि को कम करते हैं, और कम से कम वर्ग अनुमानक वर्ग त्रुटि हानि कार्यों के तहत इष्टतम होते हैं, जिसमें वे अपेक्षित नुकसान को कम करें।


जबकि बारंबारतावादी धारणा का उपयोग करने वाले सांख्यिकीविदों को स्वयं के लिए रुचि के मापदंडों का चयन करना चाहिए, और उपयोग किए जाने वाले अनुमानक/परीक्षण आंकड़े, स्पष्ट रूप से स्पष्ट उपयोगिताओं और पूर्व वितरण की अनुपस्थिति ने आवृत्तिवादी प्रक्रियाओं को व्यापक रूप से 'उद्देश्य' के रूप में देखने में मदद की है।<ref>{{Cite journal|last=Little|first=Roderick J.|date=2006|title=कैलिब्रेटेड बेयस: ए बेयस/फ्रीक्वेंटिस्ट रोडमैप|journal=The American Statistician|volume=60|issue=3|pages=213–223|issn=0003-1305|jstor=27643780|doi=10.1198/000313006X117837|s2cid=53505632}}</ref>
जबकि बारंबारतावादी अनुमान का उपयोग करने वाले सांख्यिकीविदों को स्वयं के लिए रुचि के मापदंडों का चयन करना चाहिए, और उपयोग किए जाने वाले अनुमानक/परीक्षण आंकड़े, स्पष्ट रूप से स्पष्ट उपयोगिताओं और पूर्व वितरण की अनुपस्थिति ने आवृत्तिवादी प्रक्रियाओं को व्यापक रूप से 'उद्देश्य' के रूप में देखने में मदद की है।<ref>{{Cite journal|last=Little|first=Roderick J.|date=2006|title=कैलिब्रेटेड बेयस: ए बेयस/फ्रीक्वेंटिस्ट रोडमैप|journal=The American Statistician|volume=60|issue=3|pages=213–223|issn=0003-1305|jstor=27643780|doi=10.1198/000313006X117837|s2cid=53505632}}</ref>




Line 155: Line 160:
{{See also| बेजअनुमिति}}
{{See also| बेजअनुमिति}}


बायेसियन कलन संभाव्यता की 'भाषा' का उपयोग करके विश्वास की घात का वर्णन करता है; विश्वास सकारात्मक हैं, एक में एकीकृत होते हैं, और संभाव्यता स्वयंसिद्धों का पालन करते हैं। बायेसियन धारणा सांख्यिकीय प्रस्ताव बनाने के आधार के रूप में उपलब्ध पश्च विश्वासों का उपयोग करता है।<ref>{{Cite journal |last=Lee|first=Se Yoon|  title = Gibbs sampler and coordinate ascent variational inference: A set-theoretical review|journal=Communications in Statistics - Theory and Methods|year=2021|volume=51|issue=6|pages=1549–1568|doi=10.1080/03610926.2021.1921214|arxiv=2008.01006|s2cid=220935477}}</ref> बायेसियन दृष्टिकोण का उपयोग करने के लिए कई अलग-अलग औचित्य हैं।
बायेसियन कलन संभाव्यता की 'भाषा' का उपयोग करके विश्वास की घात का वर्णन करता है; विश्वास सकारात्मक हैं, एक में एकीकृत होते हैं, और संभाव्यता स्वयंसिद्धों का पालन करते हैं। बायेसियन अनुमान सांख्यिकीय प्रस्ताव बनाने के आधार के रूप में उपलब्ध पश्च विश्वासों का उपयोग करता है।<ref>{{Cite journal |last=Lee|first=Se Yoon|  title = Gibbs sampler and coordinate ascent variational inference: A set-theoretical review|journal=Communications in Statistics - Theory and Methods|year=2021|volume=51|issue=6|pages=1549–1568|doi=10.1080/03610926.2021.1921214|arxiv=2008.01006|s2cid=220935477}}</ref> बायेसियन दृष्टिकोण का उपयोग करने के लिए कई अलग-अलग औचित्य हैं।


==== बायेसियन धारणा के उदाहरण ====
==== बायेसियन अनुमान के उदाहरण ====
* [[अंतराल अनुमान|अंतराल]] धारणा के लिए [[विश्वसनीय अंतराल]]
* [[अंतराल अनुमान|अंतराल]] अनुमान के लिए [[विश्वसनीय अंतराल]]
* प्रतिरूप तुलना के लिए बेयस कारक
* प्रतिरूप तुलना के लिए बेयस कारक


==== बायेसियन अनुमान, व्यक्तिपरकता और [[निर्णय सिद्धांत]] ====
==== बायेसियन अनुमान, व्यक्तिपरकता और [[निर्णय सिद्धांत]] ====


कई अनौपचारिक बायेसियन संदर्भ पश्च के सहज रूप से उचित सारांश पर आधारित हैं। उदाहरण के लिए, पश्च माध्य, मध्य और विधा, उच्चतम पश्च घनत्व अंतराल, और बेयस कारक सभी इस तरह से प्रेरित हो सकते हैं। हालांकि इस प्रकार के धारणा के लिए एक उपयोगकर्ता के उपयोगिता कार्य को बताने की आवश्यकता नहीं है, ये सारांश पहले बताए गए विश्वासों पर निर्भर करते हैं (कुछ हद तक), और सामान्यतः  व्यक्तिपरक निष्कर्ष के रूप में देखे जाते हैं। (पूर्व निर्माण की विधियाँ जिनमें बाहरी  निविष्ट की आवश्यकता नहीं होती है बायेसियन संभाव्यता और पूर्ववर्ती  निर्माण के लिए वस्तुनिष्ठ विधियाँ हैं लेकिन अभी तक पूरी तरह से विकसित नहीं हुई हैं।)
कई अनौपचारिक बायेसियन संदर्भ पश्च के सहज रूप से उचित सारांश पर आधारित हैं। उदाहरण के लिए, पश्च माध्य, मध्य और विधा, उच्चतम पश्च घनत्व अंतराल, और बेयस कारक सभी इस तरह से प्रेरित हो सकते हैं। हालांकि इस प्रकार के अनुमान के लिए एक उपयोगकर्ता के उपयोगिता कार्य को बताने की आवश्यकता नहीं है, ये सारांश पहले बताए गए विश्वासों पर निर्भर करते हैं (कुछ हद तक), और सामान्यतः  व्यक्तिपरक निष्कर्ष के रूप में देखे जाते हैं। (पूर्व निर्माण की विधियाँ जिनमें बाहरी  निविष्ट की आवश्यकता नहीं होती है बायेसियन संभाव्यता और पूर्ववर्ती  निर्माण के लिए वस्तुनिष्ठ विधियाँ हैं लेकिन अभी तक पूरी तरह से विकसित नहीं हुई हैं।)


औपचारिक रूप से, बायेसियन निष्कष को स्पष्ट रूप से बताई गई उपयोगिता, या हानि प्रकार्य  के संदर्भ में व्यवस्थित किया जाता है; 'बेयस नियम' वह है जो अपेक्षित उपयोगिता को अधिकतम करता है, पश्च अनिश्चितता पर औसत किये हुए। इसलिए औपचारिक बायेसियन धारणा स्वचालित रूप से एक निर्णय सिद्धांत अर्थ में [[इष्टतम निर्णय]] प्रदान करता है। मान्यताओं, आंकड़ों और उपयोगिता को देखते हुए, बायेसियन धारणा अनिवार्य रूप से किसी भी समस्या के लिए बनाया जा सकता है, हालांकि हर सांख्यिकीय धारणा की बायेसियन व्याख्या की आवश्यकता नहीं है। विश्लेषण जो औपचारिक रूप से बायेसियन नहीं हैं (तार्किक रूप से) सुसंगतता (सांख्यिकी) हो सकते हैं; बायेसियन प्रक्रियाओं की एक विशेषता जो उचित पुरोहितों का उपयोग करती है (अर्थात वे जो एक के लिए पूर्णांक हैं) यह है कि उन्हें सुसंगतता (सांख्यिकी) होने की प्रत्याभुति दी जाती है। बायेसियन धारणा के कुछ पैरोकार दावा करते हैं कि इस निर्णय-सैद्धांतिक ढांचे में धारणा लगाया जाना चाहिए, और बायेसियन धारणा को बाद के विश्वासों के मूल्यांकन और सारांश के साथ समाप्त नहीं करना चाहिए।
औपचारिक रूप से, बायेसियन निष्कष को स्पष्ट रूप से बताई गई उपयोगिता, या हानि प्रकार्य  के संदर्भ में व्यवस्थित किया जाता है; 'बेयस नियम' वह है जो अपेक्षित उपयोगिता को अधिकतम करता है, पश्च अनिश्चितता पर औसत किये हुए। इसलिए औपचारिक बायेसियन अनुमान स्वचालित रूप से एक निर्णय सिद्धांत अर्थ में [[इष्टतम निर्णय]] प्रदान करता है। मान्यताओं, आंकड़ों और उपयोगिता को देखते हुए, बायेसियन अनुमान अनिवार्य रूप से किसी भी समस्या के लिए बनाया जा सकता है, हालांकि हर सांख्यिकीय अनुमान की बायेसियन व्याख्या की आवश्यकता नहीं है। विश्लेषण जो औपचारिक रूप से बायेसियन नहीं हैं (तार्किक रूप से) सुसंगतता (सांख्यिकी) हो सकते हैं; बायेसियन प्रक्रियाओं की एक विशेषता जो उचित पुरोहितों का उपयोग करती है (अर्थात वे जो एक के लिए पूर्णांक हैं) यह है कि उन्हें सुसंगतता (सांख्यिकी) होने की प्रत्याभुति दी जाती है। बायेसियन अनुमान के कुछ पैरोकार दावा करते हैं कि इस निर्णय-सैद्धांतिक ढांचे में अनुमान लगाया जाना चाहिए, और बायेसियन अनुमान को बाद के विश्वासों के मूल्यांकन और सारांश के साथ समाप्त नहीं करना चाहिए।


=== संभावना आधारित अनुमान ===
=== संभावना आधारित अनुमान ===
{{Main|संभावनावाद}}
{{Main|संभावनावाद}}
{{expand section|date=March 2019}}
{{expand section|date=March 2019}}
संभावना प्रकार्य  का उपयोग करके संभावनावाद आंकड़ों तक पहुंचता है। कुछ संभाव्यवादी आँकड़ों को साक्ष्य से केवल संगणना समर्थन के रूप में मानते हुए, धारणा को अस्वीकार करते हैं। अन्य, हालांकि, संभावना प्रकार्य के आधार पर धारणा का प्रस्ताव करते हैं, जिनमें से सबसे प्रसिद्ध [[अधिकतम संभावना अनुमान|अधिकतम संभावना]] धारणा है।
संभावना प्रकार्य  का उपयोग करके संभावनावाद आंकड़ों तक पहुंचता है। कुछ संभाव्यवादी आँकड़ों को साक्ष्य से केवल संगणना समर्थन के रूप में मानते हुए, अनुमान को अस्वीकार करते हैं। अन्य, हालांकि, संभावना प्रकार्य के आधार पर अनुमान का प्रस्ताव करते हैं, जिनमें से सबसे प्रसिद्ध [[अधिकतम संभावना अनुमान|अधिकतम संभावना]] अनुमान है।


=== AIC आधारित अनुमान ===
=== AIC आधारित अनुमान ===
{{Main|एकैके सूचना मानदंड}}
{{Main|एकैके सूचना मानदंड}}
{{expand section|date=November 2017}}
{{expand section|date=November 2017}}
एकैके सूचना मानदंड (AIC) आंकड़ों के दिए गए सम्मुच्चय के लिए सांख्यिकीय प्रतिरूप की सापेक्ष गुणवत्ता का एक अनुमानक है। आंकड़ों के लिए प्रतिरूपों के संग्रह को देखते हुए, प्रत्येक अन्य प्रतिरूप के सापेक्ष AIC प्रत्येक प्रतिरूप की गुणवत्ता की धारणा लगाता है। इस प्रकार, AIC प्रतिरूप चयन के लिए एक साधन प्रदान करता है।
एकैके सूचना मानदंड (AIC) आंकड़ों के दिए गए सम्मुच्चय के लिए सांख्यिकीय प्रतिरूप की सापेक्ष गुणवत्ता का एक अनुमानक है। आंकड़ों के लिए प्रतिरूपों के संग्रह को देखते हुए, प्रत्येक अन्य प्रतिरूप के सापेक्ष AIC प्रत्येक प्रतिरूप की गुणवत्ता की अनुमान लगाता है। इस प्रकार, AIC प्रतिरूप चयन के लिए एक साधन प्रदान करता है।


AIC [[सूचना सिद्धांत]] पर आधारित है: यह आँकड़ा उत्पन्न करने वाली प्रक्रिया का प्रतिनिधित्व करने के लिए दिए गए प्रतिरूप का उपयोग करते समय खोई हुई सापेक्ष जानकारी का धारणा प्रदान करता है। (ऐसा करने में, यह प्रतिरूप के फिट होने की अच्छाई और प्रतिरूप की सादगी के बीच व्यापार-बंद से संबंधित है।)
AIC [[सूचना सिद्धांत]] पर आधारित है: यह आंकड़े  उत्पन्न करने वाली प्रक्रिया का प्रतिनिधित्व करने के लिए दिए गए प्रतिरूप का उपयोग करते समय खोई हुई सापेक्ष जानकारी का अनुमान प्रदान करता है। (ऐसा करने में, यह प्रतिरूप के फिट होने की अच्छाई और प्रतिरूप की सादगी के बीच व्यापार-बंद से संबंधित है।)


=== धारणा के लिए अन्य प्रतिमान ===
=== अनुमान के लिए अन्य प्रतिमान ===


==== न्यूनतम विवरण लंबाई ====
==== न्यूनतम विवरण लंबाई ====
{{Main|न्यूनतम विवरण लंबाई}}
{{Main|न्यूनतम विवरण लंबाई}}


सूचना सिद्धांत [48] और कोलमोगोरोव जटिलता के सिद्धांत में विचारों से न्यूनतम विवरण लंबाई (MDL) सिद्धांत विकसित किया गया है।(MDL) सिद्धांत सांख्यिकीय प्रतिरूप का चयन करता है जो आँकड़ा को अधिकतम रूप से संपीड़ित करता है; आंकड़ों के लिए प्रतितथ्यात्मक या गैर-मिथ्या आँकड़ा-उत्पादक तंत्र या [[संभाव्यता मॉडल|संभाव्यता प्रतिरूप]] को ग्रहण किए बिना धारणा आगे बढ़ती है, जैसा कि आवृत्तिवादी या बायेसियन दृष्टिकोणों में किया जा सकता है।
सूचना सिद्धांत [48] और कोलमोगोरोव जटिलता के सिद्धांत में विचारों से न्यूनतम विवरण लंबाई (MDL) सिद्धांत विकसित किया गया है।(MDL) सिद्धांत सांख्यिकीय प्रतिरूप का चयन करता है जो आंकड़े  को अधिकतम रूप से संपीड़ित करता है; आंकड़ों के लिए प्रतितथ्यात्मक या गैर-मिथ्या आंकड़े -उत्पादक तंत्र या [[संभाव्यता मॉडल|संभाव्यता प्रतिरूप]] को ग्रहण किए बिना अनुमान आगे बढ़ती है, जैसा कि आवृत्तिवादी या बायेसियन दृष्टिकोणों में किया जा सकता है।


हालांकि, यदि कोई आँकड़ा उत्पादक तंत्र वास्तविकता में मौजूद है, तो [[क्लाउड शैनन]] के [[स्रोत कोडिंग प्रमेय|स्रोत कूटलेखन प्रमेय]] के अनुसार यह आँकड़ा MDL का औसत और विषम रूप से विवरण प्रदान करता है।  विवरण लंबाई (या वर्णनात्मक जटिलता) को कम करने में, MDL धारणा अधिकतम संभावना धारणा और अधिकतम पोस्टरियरी धारणा के समान है (अधिकतम परिक्षय संभाव्यता वितरण का उपयोग करके। अधिकतम) -परिक्षय बायेसियन प्रायिकता)। हालाँकि, MDL यह मानने से बचता है कि अंतर्निहित संभावना प्रतिरूप ज्ञात है; MDL सिद्धांत को बिना किसी धारणा के भी लागू किया जा सकता है, जैसे आँकड़ा स्वतंत्र नमूने से उत्पन्न हुआ।<ref name=HY747/><ref name=JR>Rissanen (1989), page 84</ref>
हालांकि, यदि कोई आंकड़े  उत्पादक तंत्र वास्तविकता में मौजूद है, तो [[क्लाउड शैनन]] के [[स्रोत कोडिंग प्रमेय|स्रोत कूटलेखन प्रमेय]] के अनुसार यह आंकड़े  MDL का औसत और विषम रूप से विवरण प्रदान करता है।  विवरण लंबाई (या वर्णनात्मक जटिलता) को कम करने में, MDL अनुमान अधिकतम संभावना अनुमान और अधिकतम पोस्टरियरी अनुमान के समान है (अधिकतम परिक्षय संभाव्यता वितरण का उपयोग करके। अधिकतम) -परिक्षय बायेसियन प्रायिकता)। हालाँकि, MDL यह मानने से बचता है कि अंतर्निहित संभावना प्रतिरूप ज्ञात है; MDL सिद्धांत को बिना किसी अनुमान के भी लागू किया जा सकता है, जैसे आंकड़े  स्वतंत्र नमूने से उत्पन्न हुआ।<ref name=HY747/><ref name=JR>Rissanen (1989), page 84</ref>
MDL सिद्धांत संचार- [[कोडिंग सिद्धांत|कूटलेखन सिद्धांत]] में सूचना सिद्धांत में, रैखिक प्रतिगमन में <ref name=JR/> और [[डेटा माइनिंग|आँकड़ा माइनिंग]] में लागू किया गया है।<ref name=HY/>
MDL सिद्धांत संचार- [[कोडिंग सिद्धांत|कूटलेखन सिद्धांत]] में सूचना सिद्धांत में, रैखिक प्रतिगमन में <ref name=JR/> और [[डेटा माइनिंग|आंकड़े  माइनिंग]] में लागू किया गया है।<ref name=HY/>


MDL-आधारित अनुमानित प्रक्रियाओं का मूल्यांकन प्रायः [[कम्प्यूटेशनल जटिलता सिद्धांत|संगणनात्मक जटिलता सिद्धांत]] से तकनीकों या मानदंडों का उपयोग करता है।<ref>Joseph F. Traub, G. W. Wasilkowski, and H. Wozniakowski. (1988) {{page needed|date=June 2011}}</ref>
MDL-आधारित अनुमानित प्रक्रियाओं का मूल्यांकन प्रायः [[कम्प्यूटेशनल जटिलता सिद्धांत|संगणनात्मक जटिलता सिद्धांत]] से तकनीकों या मानदंडों का उपयोग करता है।<ref>Joseph F. Traub, G. W. Wasilkowski, and H. Wozniakowski. (1988) {{page needed|date=June 2011}}</ref>
Line 194: Line 199:
==== प्रत्ययी अनुमान ====
==== प्रत्ययी अनुमान ====
{{Main| विश्वस्त  निष्कष}}
{{Main| विश्वस्त  निष्कष}}
[[प्रत्ययी अनुमान]], प्रत्ययी संभाव्यता पर आधारित सांख्यिकीय धारणा के लिए एक दृष्टिकोण था, जिसे प्रत्ययी वितरण के रूप में भी जाना जाता है। बाद के काम में, इस दृष्टिकोण को खराब परिभाषित, प्रयोज्यता में बेहद सीमित और यहां तक ​​कि भ्रामक कहा गया है।<ref>Neyman (1956)</ref><ref>Zabell (1992)</ref> हालाँकि यह तर्क वही है जो दिखाता है<ref>Cox (2006) page 66</ref> कि एक तथाकथित [[विश्वास वितरण|आत्मविश्वास वितरण]] एक वैध प्रायिकता वितरण नहीं है और चूंकि इसने विश्वास्यता अंतराल के आवेदन को अमान्य नहीं किया है, यह आवश्यक रूप से विश्वस्त तर्कों से निकाले गए निष्कर्षों को अमान्य नहीं करता है। ऊपरी और निचली संभावनाओं का उपयोग करते हुए एक धारणा सिद्धांत के एक विशेष मामले के रूप में फिशर की फिदुकियल संभावना के शुरुआती कार्य की पुनर्व्याख्या करने का प्रयास किया गया था।{{sfn|Hampel|2003}}
[[प्रत्ययी अनुमान]], प्रत्ययी संभाव्यता पर आधारित सांख्यिकीय अनुमान के लिए एक दृष्टिकोण था, जिसे प्रत्ययी वितरण के रूप में भी जाना जाता है। बाद के काम में, इस दृष्टिकोण को खराब परिभाषित, प्रयोज्यता में बेहद सीमित और यहां तक ​​कि भ्रामक कहा गया है। <ref>Neyman (1956)</ref><ref>Zabell (1992)</ref> हालाँकि यह तर्क वही है जो दिखाता है <ref>Cox (2006) page 66</ref> कि एक तथाकथित [[विश्वास वितरण|आत्मविश्वास वितरण]] एक वैध प्रायिकता वितरण नहीं है और चूंकि इसने विश्वास्यता अंतराल के आवेदन को अमान्य नहीं किया है, यह आवश्यक रूप से विश्वस्त तर्कों से निकाले गए निष्कर्षों को अमान्य नहीं करता है। ऊपरी और निचली संभावनाओं का उपयोग करते हुए एक अनुमान सिद्धांत के एक विशेष मामले के रूप में फिशर की फिदुकियल संभावना के शुरुआती कार्य की पुनर्व्याख्या करने का प्रयास किया गया था।{{sfn|Hampel|2003}}




==== संरचनात्मक अनुमान ====
==== संरचनात्मक अनुमान ====


1938 से 1939 तक फिशर और पिटमैन के विचारों का विकास  करते हुए,<ref>Davison, page 12. {{full citation needed|date=November 2012}}</ref> जॉर्ज ए बरनार्ड ने संरचनात्मक धारणा या निर्णायक धारणा ,<ref>Barnard, G.A. (1995) "Pivotal Models and the Fiducial Argument", International Statistical Review, 63 (3), 309–323. {{jstor|1403482}}</ref> [[समूह परिवार]] पर निश्चर संभावनाओं का उपयोग कर एक दृष्टिकोण विकसित किया। बरनार्ड ने प्रतिरूपों के एक प्रतिबंधित वर्ग पर प्रत्ययी धारणा के पीछे के तर्कों को सुधारा, जिस पर प्रत्ययी प्रक्रियाएं अच्छी तरह से परिभाषित और उपयोगी होंगी। डोनाल्ड ए एस फ्रेजर ने संरचनात्मक धारणा के लिए एक सामान्य सिद्धांत विकसित किया<ref>{{Cite book|last=Fraser|first=D. A. S.|url=https://www.worldcat.org/oclc/440926|title=अनुमान की संरचना|date=1968|publisher=Wiley|isbn=0-471-27548-4|location=New York|oclc=440926}}</ref> [[समूह सिद्धांत]] के आधार पर और इसे रैखिक प्रतिरूप पर लागू किया।<ref>{{Cite book|last=Fraser|first=D. A. S.|url=https://www.worldcat.org/oclc/3559629|title=निष्कर्ष और रैखिक मॉडल|date=1979|publisher=McGraw-Hill|isbn=0-07-021910-9|location=London|oclc=3559629}}</ref> फ्रेजर द्वारा तैयार किए गए सिद्धांत में निर्णय सिद्धांत और बायेसियन सांख्यिकी के निकट संबंध हैं और यदि वे मौजूद हैं तो इष्टतम आवृत्तिवादी निर्णय नियम प्रदान कर सकते हैं।<ref>{{Cite journal|last1=Taraldsen|first1=Gunnar|last2=Lindqvist|first2=Bo Henry|date=2013-02-01|title=प्रत्ययी सिद्धांत और इष्टतम अनुमान|url=https://projecteuclid.org/journals/annals-of-statistics/volume-41/issue-1/Fiducial-theory-and-optimal-inference/10.1214/13-AOS1083.full|journal=The Annals of Statistics|volume=41|issue=1|doi=10.1214/13-AOS1083|arxiv=1301.1717|s2cid=88520957|issn=0090-5364}}</ref>
1938 से 1939 तक फिशर और पिटमैन के विचारों का विकास  करते हुए, <ref>Davison, page 12. {{full citation needed|date=November 2012}}</ref> जॉर्ज ए बरनार्ड ने संरचनात्मक अनुमान या निर्णायक अनुमान ,<ref>Barnard, G.A. (1995) "Pivotal Models and the Fiducial Argument", International Statistical Review, 63 (3), 309–323. {{jstor|1403482}}</ref> [[समूह परिवार]] पर निश्चर संभावनाओं का उपयोग कर एक दृष्टिकोण विकसित किया। बरनार्ड ने प्रतिरूपों के एक प्रतिबंधित वर्ग पर प्रत्ययी अनुमान के पीछे के तर्कों को सुधारा, जिस पर प्रत्ययी प्रक्रियाएं अच्छी तरह से परिभाषित और उपयोगी होंगी। डोनाल्ड ए एस फ्रेजर ने संरचनात्मक अनुमान के लिए एक सामान्य सिद्धांत विकसित किया <ref>{{Cite book|last=Fraser|first=D. A. S.|url=https://www.worldcat.org/oclc/440926|title=अनुमान की संरचना|date=1968|publisher=Wiley|isbn=0-471-27548-4|location=New York|oclc=440926}}</ref> [[समूह सिद्धांत]] के आधार पर और इसे रैखिक प्रतिरूप पर लागू किया। <ref>{{Cite book|last=Fraser|first=D. A. S.|url=https://www.worldcat.org/oclc/3559629|title=निष्कर्ष और रैखिक मॉडल|date=1979|publisher=McGraw-Hill|isbn=0-07-021910-9|location=London|oclc=3559629}}</ref> फ्रेजर द्वारा तैयार किए गए सिद्धांत में निर्णय सिद्धांत और बायेसियन सांख्यिकी के निकट संबंध हैं और यदि वे मौजूद हैं तो इष्टतम आवृत्तिवादी निर्णय नियम प्रदान कर सकते हैं।<ref>{{Cite journal|last1=Taraldsen|first1=Gunnar|last2=Lindqvist|first2=Bo Henry|date=2013-02-01|title=प्रत्ययी सिद्धांत और इष्टतम अनुमान|url=https://projecteuclid.org/journals/annals-of-statistics/volume-41/issue-1/Fiducial-theory-and-optimal-inference/10.1214/13-AOS1083.full|journal=The Annals of Statistics|volume=41|issue=1|doi=10.1214/13-AOS1083|arxiv=1301.1717|s2cid=88520957|issn=0090-5364}}</ref>




== निष्कर्ष विषय ==
== निष्कर्ष विषय ==
नीचे दिए गए विषयों को सामान्यतः सांख्यिकीय धारणा के क्षेत्र में सम्मिलित किया जाता है।
नीचे दिए गए विषयों को सामान्यतः सांख्यिकीय अनुमान के क्षेत्र में सम्मिलित किया जाता है।
# [[सांख्यिकीय धारणाएँ]]
# [[सांख्यिकीय धारणाएँ|सांख्यिकीय अनुमानएँ]]
# सांख्यिकीय निर्णय सिद्धांत
# सांख्यिकीय निर्णय सिद्धांत
# [[अनुमान सिद्धांत|धारणा सिद्धांत]]
# [[अनुमान सिद्धांत]]
# सांख्यिकीय परिकल्पना परीक्षण
# सांख्यिकीय परिकल्पना परीक्षण
# आंकड़ों में राय संशोधित करना
# आंकड़ों में राय संशोधित करना
Line 213: Line 218:
# [[सांख्यिकीय डेटा का सारांश|सांख्यिकीय आंकड़ों का सारांश]]
# [[सांख्यिकीय डेटा का सारांश|सांख्यिकीय आंकड़ों का सारांश]]


== भविष्यसूचक धारणा {{anchor|Prediction}} ==
== भविष्यसूचक अनुमान ==
भविष्यसूचक निष्कर्ष सांख्यिकीय धारणा के लिए एक दृष्टिकोण है जो पिछले टिप्पणियों के आधार पर भविष्य की टिप्पणियों की [[भविष्यवाणी]] पर जोर देता है।
भविष्यसूचक निष्कर्ष सांख्यिकीय अनुमान के लिए एक दृष्टिकोण है जो पिछले टिप्पणियों के आधार पर भविष्य की टिप्पणियों की [[भविष्यवाणी]] पर जोर देता है।


प्रारंभ में, भविष्यसूचक धारणा अवलोकन योग्य मापदंडों पर आधारित था और इसका संभाव्यता का अध्ययन करने का मुख्य उद्देश्य था,{{citation needed|date=November 2011}} लेकिन 20वीं शताब्दी में [[ब्रूनो डी फिनेची]] द्वारा पेश किए गए एक नए प्राचलिक दृष्टिकोण के कारण यह समर्थन से बाहर हो गया। त्रुटि के साथ देखी गई भौतिक प्रणाली के रूप में दृष्टिकोण ने घटना को प्रतिरूपित किया (उदाहरण के लिए, [[आकाशीय यांत्रिकी]])। डि फिनेटी का विनिमेयता का विचार - कि भविष्य की टिप्पणियों को पिछली टिप्पणियों की तरह व्यवहार करना चाहिए - उनके 1937 के लेख के 1974 फ़्रांसीसी से अनुवाद के साथ अंग्रेजी बोलने वाली दुनिया का ध्यान आया,<ref>{{cite journal |last=De Finetti |first=Bruno |title=पूर्वानुमान: इसके तार्किक कानून, इसके व्यक्तिपरक स्रोत|journal=Annales de l'Institut Henri Poincaré |year=1937 |volume=7 |issue=1 |pages=1–68 |issn=0365-320X }} Translated in {{cite book |chapter=Foresight: Its Logical Laws, Its Subjective Sources |title=Breakthroughs in Statistics |series=Springer Series in Statistics |year=1992 |pages=134–174 |doi=10.1007/978-1-4612-0919-5_10 |last1=De Finetti |first1=Bruno |isbn=978-0-387-94037-3 }}</ref> और तब से [[सीमोर गीजर]] जैसे सांख्यिकीविदों द्वारा प्रतिपादित किया गया है।<ref name="geisser">[[Seymour Geisser|Geisser, Seymour]] (1993) ''[https://books.google.com/books?id=wfdlBZ_iwZoC Predictive Inference: An Introduction]'', CRC Press. {{isbn|0-412-03471-9}}</ref>
प्रारंभ में, भविष्यसूचक अनुमान अवलोकन योग्य मापदंडों पर आधारित था और इसका संभाव्यता का अध्ययन करने का मुख्य उद्देश्य था,{{citation needed|date=November 2011}} लेकिन 20वीं शताब्दी में [[ब्रूनो डी फिनेची]] द्वारा पेश किए गए एक नए प्राचलिक दृष्टिकोण के कारण यह समर्थन से बाहर हो गया। त्रुटि के साथ देखी गई भौतिक प्रणाली के रूप में दृष्टिकोण ने घटना को प्रतिरूपित किया (उदाहरण के लिए, [[आकाशीय यांत्रिकी]])। डि फिनेटी का विनिमेयता का विचार - कि भविष्य की टिप्पणियों को पिछली टिप्पणियों की तरह व्यवहार करना चाहिए - उनके 1937 के लेख के 1974 फ़्रांसीसी से अनुवाद के साथ अंग्रेजी बोलने वाली दुनिया का ध्यान आया,<ref>{{cite journal |last=De Finetti |first=Bruno |title=पूर्वानुमान: इसके तार्किक कानून, इसके व्यक्तिपरक स्रोत|journal=Annales de l'Institut Henri Poincaré |year=1937 |volume=7 |issue=1 |pages=1–68 |issn=0365-320X }} Translated in {{cite book |chapter=Foresight: Its Logical Laws, Its Subjective Sources |title=Breakthroughs in Statistics |series=Springer Series in Statistics |year=1992 |pages=134–174 |doi=10.1007/978-1-4612-0919-5_10 |last1=De Finetti |first1=Bruno |isbn=978-0-387-94037-3 }}</ref> और तब से [[सीमोर गीजर]] जैसे सांख्यिकीविदों द्वारा प्रतिपादित किया गया है।<ref name="geisser">[[Seymour Geisser|Geisser, Seymour]] (1993) ''[https://books.google.com/books?id=wfdlBZ_iwZoC Predictive Inference: An Introduction]'', CRC Press. {{isbn|0-412-03471-9}}</ref>




Line 222: Line 227:
* [[एल्गोरिथम निष्कर्ष|कलन विधि निष्कर्ष]]
* [[एल्गोरिथम निष्कर्ष|कलन विधि निष्कर्ष]]
* [[प्रेरण (दर्शन)]]
* [[प्रेरण (दर्शन)]]
* [[अनौपचारिक अनुमान तर्क|अनौपचारिक धारणा तर्क]]
* [[अनौपचारिक अनुमान तर्क]]
* [[सूचना क्षेत्र सिद्धांत]]
* [[सूचना क्षेत्र सिद्धांत]]
* [[जनसंख्या अनुपात]]
* [[जनसंख्या अनुपात]]

Revision as of 17:58, 13 December 2022

सांख्यिकीय अनुमान एक अंतर्निहित संभाव्यता वितरण के गुणों का अनुमान लगाने के लिए आंकड़े विश्लेषण का उपयोग करने की प्रक्रिया है।[1] आनुमानिक सांख्यिकीय विश्लेषण एक सांख्यिकीय आबादी के गुणों की अनुमान लगाता है, उदाहरण के लिए परिकल्पनाओं का परीक्षण करके और अनुमान प्राप्त करके। यह माना जाता है कि देखे गए आंकड़े समुच्चय एक बड़ी आबादी का नमूनाकरण (सांख्यिकी) है।

अनुमानात्मक सांख्यिकी की तुलना वर्णनात्मक सांख्यिकी से की जा सकती है। वर्णनात्मक आँकड़े केवल देखे गए आंकड़ों के गुणों से संबंधित हैं, और यह इस अनुमान पर आधारित नहीं है कि आंकड़ा एक बड़ी आबादी से आता है। यंत्र अधिगम में, शब्द निष्कर्ष का उपयोग कभी-कभी पहले से प्रशिक्षित प्रतिरूप का मूल्यांकन करके भविष्यवाणी करने के लिए किया जाता है;[2] इस संदर्भ में प्रतिरूप के गुणों का उल्लेख प्रशिक्षण या सीखने (अनुमान के बजाय) के रूप में किया जाता है, और भविष्यवाणी के लिए एक प्रतिरूप का उपयोग करने के लिए अनुमान (भविष्यवाणी के बजाय) के रूप में संदर्भित किया जाता है; भविष्यसूचक अनुमान भी देखें।

परिचय

सांख्यिकीय अनुमान जनसंख्या के किसी प्रकार के नमूने (सांख्यिकी) के साथ जनसंख्या से प्राप्त आंकड़ों का उपयोग करके जनसंख्या के बारे में प्रस्ताव बनाता है। आबादी के बारे में एक परिकल्पना को देखते हुए, जिसके लिए हम अनुमान लगाना चाहते हैं, सांख्यिकीय अनुमान में (पहले) प्रतिरूप चयन प्रक्रिया का एक सांख्यिकीय प्रतिरूप होता है जो आंकड़े उत्पन्न करता है और (दूसरा) प्रतिरूप से प्रस्तावों को घटाता है।[3]

कोनिशी और कितागावा ने स्पष्ट किया कि, सांख्यिकीय अनुमान में अधिकांश समस्याओं को सांख्यिकीय प्रतिरूपण से संबंधित समस्याओं के रूप में माना जा सकता है।[4] संबंधित रूप से, डेविड कॉक्स (सांख्यिकीविद्) ने कहा है, विषय-वस्तु समस्या से सांख्यिकीय प्रतिरूप में अनुवाद कैसे किया जाता है, यह प्रायः एक विश्लेषण का सबसे महत्वपूर्ण हिस्सा होता है।[5]

एक सांख्यिकीय अनुमान का तार्किक परिणाम एक सांख्यिकीय प्रस्ताव है।[6] सांख्यिकीय प्रस्ताव के कुछ सामान्य रूप निम्नलिखित हैं:

प्रतिरूप और अनुमानएँ

किसी भी सांख्यिकीय अनुमान के लिए कुछ मान्यताओं की आवश्यकता होती है। एक सांख्यिकीय प्रतिरूप देखे गए आंकड़े और समान आंकड़ों की पीढ़ी से संबंधित मान्यताओं का एक समूह है। सांख्यिकीय प्रतिरूप के विवरण सामान्यतः हित की जनसंख्या मात्रा की उस भूमिका पर जोर देता है, जिसके बारे में हम अनुमान लगाना चाहते हैं।[7] अधिक औपचारिक निष्कर्ष निकाले जाने से पहले वर्णनात्मक आँकड़े सामान्यतः प्रारंभिक चरण के रूप में उपयोग किए जाते हैं।[8]


प्रतिरूप/अनुमानओं की घात

सांख्यिकीविद् प्रतिरूपण मान्यताओं के तीन स्तरों के बीच अंतर करते हैं;

  • प्राचलिक प्रतिरूप: आंकड़े -जनन प्रक्रिया का वर्णन करने वाले प्रायिकता वितरण को संभाव्यता वितरण के एक परिवार द्वारा पूरी तरह से वर्णित माना जाता है जिसमें केवल अज्ञात मापदण्ड सम्मिलित होते हैं।[7]उदाहरण के लिए, कोई यह मान सकता है कि जनसंख्या मूल्यों का वितरण वास्तव में सामान्य है, अज्ञात माध्य और विचरण के साथ है, और यह कि आंकड़े सम्मुच्चय 'सरल' यादृच्छिक नमूनाकरण द्वारा उत्पन्न होते हैं। सामान्यीकृत रैखिक घटकों का परिवार प्राचलिक प्रतिरूप का व्यापक रूप से उपयोग किया जाने वाला और लचीला वर्ग है।
  • गैर-प्राचलिक: आंकड़े उत्पन्न करने की प्रक्रिया के बारे में अनुमान प्राचलिक आंकड़ों की तुलना में बहुत कम है और न्यूनतम हो सकती है। [9] उदाहरण के लिए, प्रत्येक निरंतर संभाव्यता वितरण में एक माध्यिका होती है, जिसका अनुमान नमूना माध्यिका या हॉजेस-लेहमन-सेन अनुमानक का उपयोग करके लगाया जा सकता है, जब डेटा सरल यादृच्छिक नमूनाकरण से उत्पन्न होता है तो इसमें अच्छे गुण होते हैं ।
  • अल्प-प्राचलिक: यह शब्द सामान्यतः 'बीच में' पूरी तरह से और गैर-प्राचलिक दृष्टिकोणों की अनुमानओं को दर्शाता है। उदाहरण के लिए, कोई यह मान सकता है कि जनसंख्या वितरण का एक परिमित माध्य है। इसके अलावा, कोई यह मान सकता है कि जनसंख्या में औसत प्रतिक्रिया स्तर कुछ सहसंयोजक (एक प्राचलिक अनुमान) पर वास्तव में रैखिक तरीके से निर्भर करता है, लेकिन उस माध्य के आसपास के विचरण का वर्णन करने वाला कोई प्राचलिक अनुमान नहीं बनाता है (अर्थात किसी विषमलैंगिकता की उपस्थिति या संभावित रूप के बारे में) अधिक सामान्यतः, अर्ध-प्राचलिक प्रतिरूप को प्रायः 'संरचनात्मक' और 'यादृच्छिक भिन्नता' घटकों में अलग किया जा सकता है। एक घटक को प्राचलिक रूप से और दूसरे को गैर-प्राचलिक रूप से व्यवहार किया जाता है। प्रसिद्ध कॉक्स प्रतिरूप अर्ध-प्राचलिक मान्यताओं का एक समूह है।

मान्य प्रतिरूप/अनुमानओं का महत्व

उपरोक्त छवि सामान्यता की अनुमान का आकलन करने वाला एक हिस्टोग्राम दिखाती है, जिसे बेल कर्व के नीचे समान प्रसार के माध्यम से चित्रित किया जा सकता है।

जिस भी स्तर का अनुमान लगाया जाता है, सामान्य रूप से सही ढंग से व्यवस्थित अनुमान होते हैं, इन अनुमानों को सही होने की आवश्यकता होती है; यानी कि आंकड़े -उत्पादक प्रक्रिया को वास्तव में सही ढंग से निर्दिष्ट किया गया है।

' सरल 'यादृच्छिक नमूनाकरण सांख्यिकीय अनुमान को अमान्य कर सकता है।[9] अधिक जटिल अर्ध- और पूरी तरह से प्राचलिक अनुमानएं भी चिंता का कारण हैं। उदाहरण के लिए, गलत तरीके से कॉक्स प्रतिरूप को मानने से कुछ मामलों में गलत निष्कर्ष निकल सकते हैं।[10] जनसंख्या में सामान्यता की गलत अनुमानएं प्रतिगमन-आधारित अनुमान के कुछ रूपों को भी अमान्य कर देती हैं।[11] किसी भी प्राचलिक प्रतिरूप के उपयोग को मानव जनसंख्या के नमूने लेने में अधिकांश विशेषज्ञों द्वारा संशय की दृष्टि से देखा जाता है: अधिकांश सांख्यिकीविद नमूने, जब विश्वास्यता अंतराल से निपटते हैं, तो खुद को बहुत बड़े नमूनों के आधार पर [अनुमानकों] के बारे में बयानों तक सीमित रखते हैं, जहां केंद्रीय सीमा प्रमेय सुनिश्चित करता है। कि इन [अनुमानकों] के वितरण लगभग सामान्य होंगे।[12] विशेष रूप से, एक सामान्य वितरण पूरी तरह से अवास्तविक और भयावह रूप से नासमझ अनुमान होगी यदि हम किसी भी प्रकार की आर्थिक आबादी के साथ काम कर रहे हों।[12]यहां, केंद्रीय सीमा प्रमेय बताता है कि बहुत बड़े नमूनों के लिए नमूना माध्य का वितरण लगभग सामान्य रूप से वितरित किया जाता है, यदि वितरण भारी-सपुच्छ वाला नहीं है।

अनुमानित वितरण

नमूना आँकड़ों के सटीक वितरण को निर्दिष्ट करने में कठिनाई को देखते हुए, इनकी अनुमान लगाने के लिए कई तरीके विकसित किए गए हैं।

परिमित नमूनों के साथ, सन्निकटन सिद्धांत यह मापता है कि एक सीमित वितरण आँकड़ों के नमूना वितरण के कितने करीब है: उदाहरण के लिए, 10,000 स्वतंत्र नमूनों के साथ, बेरी-एस्सेन प्रमेय द्वारा, सामान्य वितरण अनुमानित (सटीकता के दो अंकों तक) कई जनसंख्या वितरणों के लिए नमूना माध्य का वितरण है।[13]फिर भी कई व्यावहारिक उद्देश्यों के लिए, अनुकरण अध्ययन और सांख्यिकीविदों के अनुभव के अनुसार, 10 (या अधिक) स्वतंत्र नमूने होने पर सामान्य सन्निकटन नमूना-माध्य के वितरण के लिए एक अच्छा सन्निकटन प्रदान करता है।[13]1950 के दशक में कोलमोगोरोव के काम के बाद, उन्नत सांख्यिकी सन्निकटन की त्रुटि को निर्धारित करने के लिए सन्निकटन सिद्धांत और कार्यात्मक विश्लेषण का उपयोग करती है। इस दृष्टिकोण में, प्रायिकता वितरण की मापीय ज्यामिति का अध्ययन किया जाता है; यह दृष्टिकोण अनुमानित त्रुटि को मापता है, उदाहरण के लिए, कुल्बैक-लीब्लर विचलन, ब्रैगमैन विचलन, और हेलिंगर दूरी[14][15][16]

अनिश्चित रूप से बड़े नमूनों के साथ, स्पर्शोन्मुख सिद्धांत (सांख्यिकी) केंद्रीय सीमा प्रमेय की तरह नमूना आँकड़ों के सीमित वितरण का वर्णन करता है, यदि कोई मौजूद है। सीमित परिणाम परिमित नमूनों के बारे में कथन नहीं हैं, और वास्तव में परिमित नमूनों के लिए अप्रासंगिक हैं।[17][18][19] हालांकि, परिमित नमूनों के साथ काम करने के लिए वितरण को सीमित करने के स्पर्शोन्मुख सिद्धांत को प्रायः लागू किया जाता है। उदाहरण के लिए, सीमित परिणाम प्रायः क्षणों की सामान्यीकृत विधि और सामान्यीकृत अनुमान समीकरणों के उपयोग को सही ठहराने के लिए लागू होते हैं, जो कि अर्थमिति और जैव-सांख्यिकी में लोकप्रिय हैं। सीमित वितरण और वास्तविक वितरण (औपचारिक रूप से, सन्निकटन की 'त्रुटि') के बीच अंतर के परिमाण का मूल्यांकन अनुकरण का उपयोग करके किया जा सकता है।[20] परिमित नमूनों के परिणामों को सीमित करने का अनुमानी अनुप्रयोग कई अनुप्रयोगों में आम चलन है, विशेष रूप से लॉग-अवतल संभावना वाले कम-आयामी प्रतिरूप के साथ (जैसे कि एक- मापदण्ड घातीय परिवारों के साथ)।

यादृच्छिकीकरण आधारित प्रतिरूप

किसी दिए गए आंकड़े सम्मुच्चय के लिए जो एक यादृच्छिककरण अभिकल्पना द्वारा निर्मित किया गया था, एक सांख्यिकीय (शून्य-परिकल्पना के तहत) के यादृच्छिककरण वितरण को सभी योजनाओं के लिए परीक्षण आंकड़े का मूल्यांकन करके परिभाषित किया गया है जो कि यादृच्छिककरण अभिकल्पना द्वारा उत्पन्न किया जा सकता था। बारंबारतावादी अनुमान में, यादृच्छिककरण एक व्यक्तिपरक प्रतिरूप के बजाय यादृच्छिककरण वितरण पर आधारित होने की अनुमति देता है, और यह विशेष रूप से सर्वेक्षण नमूनाकरण और प्रयोगों के अभिकल्पना में महत्वपूर्ण है।[21][22] यादृच्छिक अध्ययन से सांख्यिकीय निष्कर्ष भी कई अन्य स्थितियों की तुलना में अधिक सीधा है।[23][24][25] बायेसियन अनुमान में, यादृच्छिककरण भी महत्वपूर्ण है: सर्वेक्षण नमूनाकरण में, प्रतिस्थापन के बिना नमूने का उपयोग जनसंख्या के साथ नमूने की विनिमयशीलता सुनिश्चित करता है; यादृच्छिक प्रयोगों में, यादृच्छिककरण सहविचर जानकारी के लिए यादृच्छिक अनुमान पर लापता होने का वारंट करता है।[26] वस्तुनिष्ठ यादृच्छिककरण ठीक से आगमनात्मक प्रक्रियाओं की अनुमति देता है।[27][28][29][30][31] कई सांख्यिकीविद् आंकड़ों के यादृच्छिककरण-आधारित विश्लेषण को पसंद करते हैं जो कि अच्छी तरह से परिभाषित यादृच्छिकीकरण प्रक्रियाओं द्वारा उत्पन्न किया गया था।[32] (हालांकि, यह सच है कि विज्ञान के क्षेत्रों में विकसित सैद्धांतिक ज्ञान और प्रयोगात्मक नियंत्रण के साथ, यादृच्छिक प्रयोग अनुमानों की गुणवत्ता में सुधार किए बिना प्रयोग की लागत बढ़ा सकते हैं।[33][34])

इसी तरह, प्रमुख सांख्यिकीय अधिकारियों द्वारा यादृच्छिक प्रयोगों के परिणामों की अनुशंसा की जाती है क्योंकि समान घटनाओं के अवलोकन संबंधी अध्ययनों की तुलना में अधिक विश्वसनीयता वाले अनुमानों की अनुमति होती है।[35]

हालांकि, एक अच्छा अवलोकन संबंधी अध्ययन एक खराब यादृच्छिक प्रयोग से बेहतर हो सकता है।

एक यादृच्छिक प्रयोग का सांख्यिकीय विश्लेषण प्रायोगिक विज्ञप्ति में वर्णित यादृच्छिकीकरण योजना पर आधारित हो सकता है और इसके लिए व्यक्तिपरक प्रतिरूप की आवश्यकता नहीं होती है।[36][37]

हालाँकि, किसी भी समय, कुछ परिकल्पनाओं का वस्तुनिष्ठ सांख्यिकीय प्रतिरूप का उपयोग करके परीक्षण नहीं किया जा सकता है, जो यादृच्छिक प्रयोगों या यादृच्छिक नमूनों का सटीक वर्णन करते हैं। कुछ मामलों में, ऐसे यादृच्छिक अध्ययन असंवैधानिक या अनैतिक हैं।

यादृच्छिक प्रयोगों का प्रतिरूप-आधारित विश्लेषण

यादृच्छिक प्रयोगों से आंकड़ों का विश्लेषण करते समय एक सांख्यिकीय प्रतिरूप, उदाहरण के लिए, एक रैखिक या रसद प्रतिरूप को संदर्भित करना मानक अभ्यास है।[38] हालाँकि, यादृच्छिककरण योजना एक सांख्यिकीय प्रतिरूप की पसंद का मार्गदर्शन करती है। यादृच्छिकीकरण योजना को जाने बिना उपयुक्त प्रतिरूप का चयन करना संभव नहीं है।[22]प्रयोगात्मक विज्ञप्ति की अनदेखी करते हुए यादृच्छिक प्रयोगों से आंकड़ों का विश्लेषण करके गंभीर रूप से भ्रामक परिणाम प्राप्त किए जा सकते हैं; सामान्य गलतियों में एक प्रयोग में उपयोग किए गए अवरोधन को भूल जाना और एक ही प्रायोगिक इकाई पर बार-बार माप को अलग-अलग प्रायोगिक इकाइयों पर लागू उपचार की स्वतंत्र प्रतिकृति के साथ भ्रमित करना सम्मिलित है।[39]


प्रतिरूप-मुक्त यादृच्छिककरण अनुमान

प्रतिरूप-मुक्त तकनीकें प्रतिरूप-आधारित विधियों का पूरक प्रदान करती हैं, जो वास्तविकता-सरलीकरण की न्यूनीकरणवादी रणनीतियों को नियोजित करती हैं। पूर्व संयोजन, विकास, पहनावा और कलन विधि को गतिशील रूप से एक प्रक्रिया के प्रासंगिक समानता के अनुकूल बनाने और टिप्पणियों की आंतरिक विशेषताओं को सीखने के लिए नियोजित करती हैं।[38][40]

उदाहरण के लिए, प्रतिरूप-मुक्त सरल रेखीय प्रतिगमन निम्न पर आधारित है।

  • एक यादृच्छिक अभिकल्पना, जहां टिप्पणियों के जोड़े स्वतंत्र और समान रूप से वितरित (iid) हैं, या
  • एक नियतात्मक अभिकल्पना, जहां चर नियतात्मक हैं, लेकिन संबंधित प्रतिक्रिया चर एक सामान्य सशर्त वितरण के साथ यादृच्छिक और स्वतंत्र हैं, अर्थात, , जो सूचकांक से स्वतंत्र है।

किसी भी मामले में, सामान्य सशर्त वितरण की सुविधाओं के लिए प्रतिरूप-मुक्त यादृच्छिककरण अनुमान कुछ नियमितता स्थितियों पर निर्भर करता है, उदा। कार्यात्मक सहजता। उदाहरण के लिए, जनसंख्या सुविधा सशर्त माध्य के लिए प्रतिरूप-मुक्त यादृच्छिककरण अनुमान, , अनुमान के तहत स्थानीय औसत या स्थानीय बहुपद उपयुक्त के माध्यम से लगातार अनुमान लगाई जा सकती है कि निर्बाध है। इसके अलावा, स्पर्शोन्मुख सामान्यता या पुनरुत्पादन पर भरोसा करते हुए, हम जनसंख्या विशेषता के लिए विश्वास अंतराल का निर्माण कर सकते हैं, इस मामले में, सशर्त माध्य, है।[41]


अनुमान के प्रतिमान

सांख्यिकीय अनुमान के विभिन्न विद्यालय स्थापित हो गए हैं। ये विद्यालय-या प्रतिमान-पारस्परिक रूप से अनन्य नहीं हैं, और जो तरीके एक प्रतिमान के तहत अच्छी तरह से काम करते हैं, उनकी प्रायः अन्य प्रतिमानों के तहत आकर्षक व्याख्या होती है।

बंद्योपाध्याय और फोस्टर चार प्रतिमानों का वर्णन करते हैं: पारम्परिक (या आवृत्तिवादी अनुमान) प्रतिमान, बायेसियन अनुमान प्रतिमान, संभावनावाद प्रतिमान, और एकाइके सूचना मानदंड| अकाइकेन-सूचना मानदंड-आधारित प्रतिमान।[42]


आवृत्तिवादी अनुमान

यह प्रतिमान हाथ में एक के समान आंकड़े सम्मुच्चय बनाने के लिए जनसंख्या वितरण के बार-बार नमूने पर विचार करके प्रस्तावों की संभाव्यता को जांचता है। दोहराए गए नमूने के तहत आंकड़े सम्मुच्चय की विशेषताओं पर विचार करके, एक सांख्यिकीय प्रस्ताव के आवृत्तिवादी गुणों को परिमाणित किया जा सकता है - हालांकि व्यवहार में यह परिमाणीकरण चुनौतीपूर्ण हो सकता है।

आवृत्तिवादी अनुमान के उदाहरण

  • p- मूल्य
  • निराकरणीय परिकल्पना अंतराल
  • अशक्त परिकल्पना महत्व परीक्षण

आवृत्तिवादी अनुमान, वस्तुनिष्ठता और निर्णय सिद्धांत

बारंबारतावादी अनुमान (या शास्त्रीय अनुमान) की एक व्याख्या यह है कि यह केवल आवृत्ति संभावना के संदर्भ में लागू होता है; यानी, किसी आबादी से बार-बार नमूने लेने के संदर्भ में। हालांकि, नेमन का दृष्टिकोण[43] पूर्व-प्रयोग संभावनाओं के संदर्भ में इन प्रक्रियाओं को विकसित करता है। अर्थात्, एक प्रयोग करने से पहले, एक निष्कर्ष पर आने के लिए एक नियम तय करता है जैसे कि सही होने की संभावना को एक उपयुक्त तरीके से नियंत्रित किया जाता है: इस तरह की संभावना को बारंबारतावादी या बार-बार नमूना व्याख्या की आवश्यकता नहीं होती है। इसके विपरीत, बायेसियन अनुमान सशर्त संभावनाओं के संदर्भ में काम करता है (अर्थात देखे गए आंकड़े पर सशर्त संभावनाएं), सीमांत (लेकिन अज्ञात मापदंडों पर सशर्त) संभावनाओं की तुलना में लगातार दृष्टिकोण में उपयोग किया जाता है।

उपयोगिता कार्यों के संबंध में महत्व परीक्षण और विश्वास अंतराल की लगातार प्रक्रियाओं का निर्माण किया जा सकता है। हालाँकि, आवृत्तिवादी सांख्यिकी के कुछ तत्व, जैसे कि सांख्यिकीय निर्णय सिद्धांत, उपयोगिता कार्यों को सम्मिलित करते हैं।[citation needed] विशेष रूप से, इष्टतम अनुमान (जैसे न्यूनतम-विचरण निष्पक्ष अनुमानक, या समान रूप से सबसे शक्तिशाली परीक्षण) के लगातार विकास हानि कार्यों का उपयोग करते हैं, जो (नकारात्मक) उपयोगिता कार्यों की भूमिका निभाते हैं। सांख्यिकीय सिद्धांतकारों को यह साबित करने के लिए हानि कार्यों को स्पष्ट रूप से नहीं बताया जाना चाहिए कि एक सांख्यिकीय प्रक्रिया में इष्टतमता संपत्ति है।[44] हालांकि, नुकसान-प्रकार्य प्रायः इष्टतम गुणों को बताते हुए उपयोगी होते हैं: उदाहरण के लिए, औसत-निष्पक्ष अनुमानक पूर्ण मूल्य हानि कार्यों के तहत इष्टतम होते हैं, जिसमें वे अपेक्षित हानि को कम करते हैं, और कम से कम वर्ग अनुमानक वर्ग त्रुटि हानि कार्यों के तहत इष्टतम होते हैं, जिसमें वे अपेक्षित नुकसान को कम करें।

जबकि बारंबारतावादी अनुमान का उपयोग करने वाले सांख्यिकीविदों को स्वयं के लिए रुचि के मापदंडों का चयन करना चाहिए, और उपयोग किए जाने वाले अनुमानक/परीक्षण आंकड़े, स्पष्ट रूप से स्पष्ट उपयोगिताओं और पूर्व वितरण की अनुपस्थिति ने आवृत्तिवादी प्रक्रियाओं को व्यापक रूप से 'उद्देश्य' के रूप में देखने में मदद की है।[45]


बेजअनुमिति

बायेसियन कलन संभाव्यता की 'भाषा' का उपयोग करके विश्वास की घात का वर्णन करता है; विश्वास सकारात्मक हैं, एक में एकीकृत होते हैं, और संभाव्यता स्वयंसिद्धों का पालन करते हैं। बायेसियन अनुमान सांख्यिकीय प्रस्ताव बनाने के आधार के रूप में उपलब्ध पश्च विश्वासों का उपयोग करता है।[46] बायेसियन दृष्टिकोण का उपयोग करने के लिए कई अलग-अलग औचित्य हैं।

बायेसियन अनुमान के उदाहरण

बायेसियन अनुमान, व्यक्तिपरकता और निर्णय सिद्धांत

कई अनौपचारिक बायेसियन संदर्भ पश्च के सहज रूप से उचित सारांश पर आधारित हैं। उदाहरण के लिए, पश्च माध्य, मध्य और विधा, उच्चतम पश्च घनत्व अंतराल, और बेयस कारक सभी इस तरह से प्रेरित हो सकते हैं। हालांकि इस प्रकार के अनुमान के लिए एक उपयोगकर्ता के उपयोगिता कार्य को बताने की आवश्यकता नहीं है, ये सारांश पहले बताए गए विश्वासों पर निर्भर करते हैं (कुछ हद तक), और सामान्यतः व्यक्तिपरक निष्कर्ष के रूप में देखे जाते हैं। (पूर्व निर्माण की विधियाँ जिनमें बाहरी निविष्ट की आवश्यकता नहीं होती है बायेसियन संभाव्यता और पूर्ववर्ती निर्माण के लिए वस्तुनिष्ठ विधियाँ हैं लेकिन अभी तक पूरी तरह से विकसित नहीं हुई हैं।)

औपचारिक रूप से, बायेसियन निष्कष को स्पष्ट रूप से बताई गई उपयोगिता, या हानि प्रकार्य के संदर्भ में व्यवस्थित किया जाता है; 'बेयस नियम' वह है जो अपेक्षित उपयोगिता को अधिकतम करता है, पश्च अनिश्चितता पर औसत किये हुए। इसलिए औपचारिक बायेसियन अनुमान स्वचालित रूप से एक निर्णय सिद्धांत अर्थ में इष्टतम निर्णय प्रदान करता है। मान्यताओं, आंकड़ों और उपयोगिता को देखते हुए, बायेसियन अनुमान अनिवार्य रूप से किसी भी समस्या के लिए बनाया जा सकता है, हालांकि हर सांख्यिकीय अनुमान की बायेसियन व्याख्या की आवश्यकता नहीं है। विश्लेषण जो औपचारिक रूप से बायेसियन नहीं हैं (तार्किक रूप से) सुसंगतता (सांख्यिकी) हो सकते हैं; बायेसियन प्रक्रियाओं की एक विशेषता जो उचित पुरोहितों का उपयोग करती है (अर्थात वे जो एक के लिए पूर्णांक हैं) यह है कि उन्हें सुसंगतता (सांख्यिकी) होने की प्रत्याभुति दी जाती है। बायेसियन अनुमान के कुछ पैरोकार दावा करते हैं कि इस निर्णय-सैद्धांतिक ढांचे में अनुमान लगाया जाना चाहिए, और बायेसियन अनुमान को बाद के विश्वासों के मूल्यांकन और सारांश के साथ समाप्त नहीं करना चाहिए।

संभावना आधारित अनुमान

संभावना प्रकार्य का उपयोग करके संभावनावाद आंकड़ों तक पहुंचता है। कुछ संभाव्यवादी आँकड़ों को साक्ष्य से केवल संगणना समर्थन के रूप में मानते हुए, अनुमान को अस्वीकार करते हैं। अन्य, हालांकि, संभावना प्रकार्य के आधार पर अनुमान का प्रस्ताव करते हैं, जिनमें से सबसे प्रसिद्ध अधिकतम संभावना अनुमान है।

AIC आधारित अनुमान

एकैके सूचना मानदंड (AIC) आंकड़ों के दिए गए सम्मुच्चय के लिए सांख्यिकीय प्रतिरूप की सापेक्ष गुणवत्ता का एक अनुमानक है। आंकड़ों के लिए प्रतिरूपों के संग्रह को देखते हुए, प्रत्येक अन्य प्रतिरूप के सापेक्ष AIC प्रत्येक प्रतिरूप की गुणवत्ता की अनुमान लगाता है। इस प्रकार, AIC प्रतिरूप चयन के लिए एक साधन प्रदान करता है।

AIC सूचना सिद्धांत पर आधारित है: यह आंकड़े उत्पन्न करने वाली प्रक्रिया का प्रतिनिधित्व करने के लिए दिए गए प्रतिरूप का उपयोग करते समय खोई हुई सापेक्ष जानकारी का अनुमान प्रदान करता है। (ऐसा करने में, यह प्रतिरूप के फिट होने की अच्छाई और प्रतिरूप की सादगी के बीच व्यापार-बंद से संबंधित है।)

अनुमान के लिए अन्य प्रतिमान

न्यूनतम विवरण लंबाई

सूचना सिद्धांत [48] और कोलमोगोरोव जटिलता के सिद्धांत में विचारों से न्यूनतम विवरण लंबाई (MDL) सिद्धांत विकसित किया गया है।(MDL) सिद्धांत सांख्यिकीय प्रतिरूप का चयन करता है जो आंकड़े को अधिकतम रूप से संपीड़ित करता है; आंकड़ों के लिए प्रतितथ्यात्मक या गैर-मिथ्या आंकड़े -उत्पादक तंत्र या संभाव्यता प्रतिरूप को ग्रहण किए बिना अनुमान आगे बढ़ती है, जैसा कि आवृत्तिवादी या बायेसियन दृष्टिकोणों में किया जा सकता है।

हालांकि, यदि कोई आंकड़े उत्पादक तंत्र वास्तविकता में मौजूद है, तो क्लाउड शैनन के स्रोत कूटलेखन प्रमेय के अनुसार यह आंकड़े MDL का औसत और विषम रूप से विवरण प्रदान करता है। विवरण लंबाई (या वर्णनात्मक जटिलता) को कम करने में, MDL अनुमान अधिकतम संभावना अनुमान और अधिकतम पोस्टरियरी अनुमान के समान है (अधिकतम परिक्षय संभाव्यता वितरण का उपयोग करके। अधिकतम) -परिक्षय बायेसियन प्रायिकता)। हालाँकि, MDL यह मानने से बचता है कि अंतर्निहित संभावना प्रतिरूप ज्ञात है; MDL सिद्धांत को बिना किसी अनुमान के भी लागू किया जा सकता है, जैसे आंकड़े स्वतंत्र नमूने से उत्पन्न हुआ।[47][48] MDL सिद्धांत संचार- कूटलेखन सिद्धांत में सूचना सिद्धांत में, रैखिक प्रतिगमन में [48] और आंकड़े माइनिंग में लागू किया गया है।[49]

MDL-आधारित अनुमानित प्रक्रियाओं का मूल्यांकन प्रायः संगणनात्मक जटिलता सिद्धांत से तकनीकों या मानदंडों का उपयोग करता है।[50]


प्रत्ययी अनुमान

प्रत्ययी अनुमान, प्रत्ययी संभाव्यता पर आधारित सांख्यिकीय अनुमान के लिए एक दृष्टिकोण था, जिसे प्रत्ययी वितरण के रूप में भी जाना जाता है। बाद के काम में, इस दृष्टिकोण को खराब परिभाषित, प्रयोज्यता में बेहद सीमित और यहां तक ​​कि भ्रामक कहा गया है। [51][52] हालाँकि यह तर्क वही है जो दिखाता है [53] कि एक तथाकथित आत्मविश्वास वितरण एक वैध प्रायिकता वितरण नहीं है और चूंकि इसने विश्वास्यता अंतराल के आवेदन को अमान्य नहीं किया है, यह आवश्यक रूप से विश्वस्त तर्कों से निकाले गए निष्कर्षों को अमान्य नहीं करता है। ऊपरी और निचली संभावनाओं का उपयोग करते हुए एक अनुमान सिद्धांत के एक विशेष मामले के रूप में फिशर की फिदुकियल संभावना के शुरुआती कार्य की पुनर्व्याख्या करने का प्रयास किया गया था।[54]


संरचनात्मक अनुमान

1938 से 1939 तक फिशर और पिटमैन के विचारों का विकास करते हुए, [55] जॉर्ज ए बरनार्ड ने संरचनात्मक अनुमान या निर्णायक अनुमान ,[56] समूह परिवार पर निश्चर संभावनाओं का उपयोग कर एक दृष्टिकोण विकसित किया। बरनार्ड ने प्रतिरूपों के एक प्रतिबंधित वर्ग पर प्रत्ययी अनुमान के पीछे के तर्कों को सुधारा, जिस पर प्रत्ययी प्रक्रियाएं अच्छी तरह से परिभाषित और उपयोगी होंगी। डोनाल्ड ए एस फ्रेजर ने संरचनात्मक अनुमान के लिए एक सामान्य सिद्धांत विकसित किया [57] समूह सिद्धांत के आधार पर और इसे रैखिक प्रतिरूप पर लागू किया। [58] फ्रेजर द्वारा तैयार किए गए सिद्धांत में निर्णय सिद्धांत और बायेसियन सांख्यिकी के निकट संबंध हैं और यदि वे मौजूद हैं तो इष्टतम आवृत्तिवादी निर्णय नियम प्रदान कर सकते हैं।[59]


निष्कर्ष विषय

नीचे दिए गए विषयों को सामान्यतः सांख्यिकीय अनुमान के क्षेत्र में सम्मिलित किया जाता है।

  1. सांख्यिकीय अनुमानएँ
  2. सांख्यिकीय निर्णय सिद्धांत
  3. अनुमान सिद्धांत
  4. सांख्यिकीय परिकल्पना परीक्षण
  5. आंकड़ों में राय संशोधित करना
  6. प्रयोगों का अभिकल्पना, विचरण का विश्लेषण और प्रतिगमन विश्लेषण
  7. सर्वेक्षण प्रतिदर्श
  8. सांख्यिकीय आंकड़ों का सारांश

भविष्यसूचक अनुमान

भविष्यसूचक निष्कर्ष सांख्यिकीय अनुमान के लिए एक दृष्टिकोण है जो पिछले टिप्पणियों के आधार पर भविष्य की टिप्पणियों की भविष्यवाणी पर जोर देता है।

प्रारंभ में, भविष्यसूचक अनुमान अवलोकन योग्य मापदंडों पर आधारित था और इसका संभाव्यता का अध्ययन करने का मुख्य उद्देश्य था,[citation needed] लेकिन 20वीं शताब्दी में ब्रूनो डी फिनेची द्वारा पेश किए गए एक नए प्राचलिक दृष्टिकोण के कारण यह समर्थन से बाहर हो गया। त्रुटि के साथ देखी गई भौतिक प्रणाली के रूप में दृष्टिकोण ने घटना को प्रतिरूपित किया (उदाहरण के लिए, आकाशीय यांत्रिकी)। डि फिनेटी का विनिमेयता का विचार - कि भविष्य की टिप्पणियों को पिछली टिप्पणियों की तरह व्यवहार करना चाहिए - उनके 1937 के लेख के 1974 फ़्रांसीसी से अनुवाद के साथ अंग्रेजी बोलने वाली दुनिया का ध्यान आया,[60] और तब से सीमोर गीजर जैसे सांख्यिकीविदों द्वारा प्रतिपादित किया गया है।[61]


यह भी देखें

टिप्पणियाँ

  1. According to Peirce, acceptance means that inquiry on this question ceases for the time being. In science, all scientific theories are revisable.


संदर्भ

उद्धरण

  1. Upton, G., Cook, I. (2008) Oxford Dictionary of Statistics, OUP. ISBN 978-0-19-954145-4.
  2. "TensorFlow लाइट अनुमान". शब्द अनुमान इनपुट डेटा के आधार पर भविष्यवाणी करने के लिए डिवाइस पर TensorFlow Lite मॉडल को निष्पादित करने की प्रक्रिया को संदर्भित करता है।
  3. Johnson, Richard (12 March 2016). "सांख्यिकीय निष्कर्ष". Encyclopedia of Mathematics. Springer: The European Mathematical Society. Retrieved 26 October 2022.
  4. Konishi & Kitagawa (2008), p. 75.
  5. Cox (2006), p. 197.
  6. "सांख्यिकीय अनुमान - गणित का विश्वकोश". www.encyclopediaofmath.org. Retrieved 2019-01-23.
  7. 7.0 7.1 Cox (2006) page 2
  8. Evans, Michael; et al. (2004). संभाव्यता और सांख्यिकी: अनिश्चितता का विज्ञान. Freeman and Company. p. 267. ISBN 9780716747420.
  9. Kruskal 1988
  10. Freedman, D.A. (2008) "Survival analysis: An Epidemiological hazard?". The American Statistician (2008) 62: 110-119. (Reprinted as Chapter 11 (pages 169–192) of Freedman (2010)).
  11. Berk, R. (2003) Regression Analysis: A Constructive Critique (Advanced Quantitative Techniques in the Social Sciences) (v. 11) Sage Publications. ISBN 0-7619-2904-5
  12. 12.0 12.1 Brewer, Ken (2002). संयुक्त सर्वेक्षण नमूना निष्कर्ष: बसु के हाथियों का वजन. Hodder Arnold. p. 6. ISBN 978-0340692295.
  13. 13.0 13.1 Jörgen Hoffman-Jörgensen's Probability With a View Towards Statistics, Volume I. Page 399[full citation needed]
  14. Le Cam (1986)[page needed]
  15. Erik Torgerson (1991) Comparison of Statistical Experiments, volume 36 of Encyclopedia of Mathematics. Cambridge University Press.[full citation needed]
  16. Liese, Friedrich & Miescke, Klaus-J. (2008). सांख्यिकीय निर्णय सिद्धांत: अनुमान, परीक्षण और चयन. Springer. ISBN 978-0-387-73193-3.
  17. Kolmogorov (1963, p.369): "The frequency concept, based on the notion of limiting frequency as the number of trials increases to infinity, does not contribute anything to substantiate the applicability of the results of probability theory to real practical problems where we have always to deal with a finite number of trials".
  18. "Indeed, limit theorems 'as  tends to infinity' are logically devoid of content about what happens at any particular . All they can do is suggest certain approaches whose performance must then be checked on the case at hand." — Le Cam (1986) (page xiv)
  19. Pfanzagl (1994): "The crucial drawback of asymptotic theory: What we expect from asymptotic theory are results which hold approximately . . . . What asymptotic theory has to offer are limit theorems."(page ix) "What counts for applications are approximations, not limits." (page 188)
  20. Pfanzagl (1994) : "By taking a limit theorem as being approximately true for large sample sizes, we commit an error the size of which is unknown. [. . .] Realistic information about the remaining errors may be obtained by simulations." (page ix)
  21. Neyman, J.(1934) "On the two different aspects of the representative method: The method of stratified sampling and the method of purposive selection", Journal of the Royal Statistical Society, 97 (4), 557–625 JSTOR 2342192
  22. 22.0 22.1 Hinkelmann and Kempthorne(2008)[page needed]
  23. ASA Guidelines for the first course in statistics for non-statisticians. (available at the ASA website)
  24. David A. Freedman et alia's Statistics.
  25. Moore et al. (2015).
  26. Gelman A. et al. (2013). Bayesian Data Analysis (Chapman & Hall).
  27. Peirce (1877-1878)
  28. Peirce (1883)
  29. Freedman, Pisani & Purves 1978.
  30. David A. Freedman Statistical Models.
  31. Rao, C.R. (1997) Statistics and Truth: Putting Chance to Work, World Scientific. ISBN 981-02-3111-3
  32. Peirce; Freedman; Moore et al. (2015).[citation needed]
  33. Box, G.E.P. and Friends (2006) Improving Almost Anything: Ideas and Essays, Revised Edition, Wiley. ISBN 978-0-471-72755-2
  34. Cox (2006), p. 196.
  35. ASA Guidelines for the first course in statistics for non-statisticians. (available at the ASA website)
    • David A. Freedman et alias Statistics.
    • Moore et al. (2015).
  36. Neyman, Jerzy. 1923 [1990]. "On the Application of Probability Theory to AgriculturalExperiments. Essay on Principles. Section 9." Statistical Science 5 (4): 465–472. Trans. Dorota M. Dabrowska and Terence P. Speed.
  37. Hinkelmann & Kempthorne (2008)[page needed]
  38. 38.0 38.1 Dinov, Ivo; Palanimalai, Selvam; Khare, Ashwini; Christou, Nicolas (2018). "Randomization‐based statistical inference: A resampling and simulation infrastructure". Teaching Statistics. 40 (2): 64–73. doi:10.1111/test.12156. PMC 6155997. PMID 30270947.
  39. Hinkelmann and Kempthorne (2008) Chapter 6.
  40. Tang, Ming; Gao, Chao; Goutman, Stephen; Kalinin, Alexandr; Mukherjee, Bhramar; Guan, Yuanfang; Dinov, Ivo (2019). "Model-Based and Model-Free Techniques for Amyotrophic Lateral Sclerosis Diagnostic Prediction and Patient Clustering". Neuroinformatics. 17 (3): 407–421. doi:10.1007/s12021-018-9406-9. PMC 6527505. PMID 30460455.
  41. Politis, D.N. (2019). "Model-free inference in statistics: how and why". IMS Bulletin. 48.
  42. Bandyopadhyay & Forster (2011). See the book's Introduction (p.3) and "Section III: Four Paradigms of Statistics".
  43. Neyman, J. (1937). "संभाव्यता के शास्त्रीय सिद्धांत के आधार पर सांख्यिकीय अनुमान के सिद्धांत की रूपरेखा". Philosophical Transactions of the Royal Society of London A. 236 (767): 333–380. Bibcode:1937RSPTA.236..333N. doi:10.1098/rsta.1937.0005. JSTOR 91337.
  44. Preface to Pfanzagl.
  45. Little, Roderick J. (2006). "कैलिब्रेटेड बेयस: ए बेयस/फ्रीक्वेंटिस्ट रोडमैप". The American Statistician. 60 (3): 213–223. doi:10.1198/000313006X117837. ISSN 0003-1305. JSTOR 27643780. S2CID 53505632.
  46. Lee, Se Yoon (2021). "Gibbs sampler and coordinate ascent variational inference: A set-theoretical review". Communications in Statistics - Theory and Methods. 51 (6): 1549–1568. arXiv:2008.01006. doi:10.1080/03610926.2021.1921214. S2CID 220935477.
  47. Cite error: Invalid <ref> tag; no text was provided for refs named HY747
  48. 48.0 48.1 Rissanen (1989), page 84
  49. Cite error: Invalid <ref> tag; no text was provided for refs named HY
  50. Joseph F. Traub, G. W. Wasilkowski, and H. Wozniakowski. (1988)[page needed]
  51. Neyman (1956)
  52. Zabell (1992)
  53. Cox (2006) page 66
  54. Hampel 2003.
  55. Davison, page 12.[full citation needed]
  56. Barnard, G.A. (1995) "Pivotal Models and the Fiducial Argument", International Statistical Review, 63 (3), 309–323. JSTOR 1403482
  57. Fraser, D. A. S. (1968). अनुमान की संरचना. New York: Wiley. ISBN 0-471-27548-4. OCLC 440926.
  58. Fraser, D. A. S. (1979). निष्कर्ष और रैखिक मॉडल. London: McGraw-Hill. ISBN 0-07-021910-9. OCLC 3559629.
  59. Taraldsen, Gunnar; Lindqvist, Bo Henry (2013-02-01). "प्रत्ययी सिद्धांत और इष्टतम अनुमान". The Annals of Statistics. 41 (1). arXiv:1301.1717. doi:10.1214/13-AOS1083. ISSN 0090-5364. S2CID 88520957.
  60. De Finetti, Bruno (1937). "पूर्वानुमान: इसके तार्किक कानून, इसके व्यक्तिपरक स्रोत". Annales de l'Institut Henri Poincaré. 7 (1): 1–68. ISSN 0365-320X. Translated in De Finetti, Bruno (1992). "Foresight: Its Logical Laws, Its Subjective Sources". Breakthroughs in Statistics. Springer Series in Statistics. pp. 134–174. doi:10.1007/978-1-4612-0919-5_10. ISBN 978-0-387-94037-3.
  61. Geisser, Seymour (1993) Predictive Inference: An Introduction, CRC Press. ISBN 0-412-03471-9


स्रोत


अग्रिम पठन

बाहरी संबंध