गणितीय सांख्यिकी: Difference between revisions

From Vigyanwiki
No edit summary
 
(6 intermediate revisions by 3 users not shown)
Line 1: Line 1:
{{Short description|Branch of statistics}}
{{Short description|Branch of statistics}}
[[Image:Linear regression.svg|thumb|right|300px|डेटा सेट पर रैखिक प्रतिगमन का चित्रण। [[प्रतिगमन विश्लेषण]] गणितीय सांख्यिकी का महत्वपूर्ण हिस्सा है।]]
[[Image:Linear regression.svg|thumb|right|300px|डेटा सेट पर रैखिक प्रतिगमन का चित्रण। [[प्रतिगमन विश्लेषण]] गणितीय सांख्यिकी का महत्वपूर्ण भाग है।]]'''गणितीय सांख्यिकी''' सांख्यिकीय डेटा एकत्र करने की तकनीकों के विपरीत, संभाव्यता सिद्धांत, गणित की शाखा, का सांख्यिकी में अनुप्रयोग है। इस प्रकार इसके लिए जो विशिष्ट गणितीय तकनीकों का उपयोग किया जाता है उनमें [[गणितीय विश्लेषण]], रैखिक बीजगणित, [[स्टोकेस्टिक विश्लेषण]], अंतर समीकरण और [[माप सिद्धांत]] सम्मिलित हैं।<ref>{{cite book|editor1-last=Kannan|editor1-first=D.|editor2-last=Lakshmikantham|editor2-first=V.|title=स्टोकेस्टिक विश्लेषण और अनुप्रयोगों की पुस्तिका|date=2002|publisher=M. Dekker|location=New York|isbn=0824706609}}</ref><ref>{{cite book|last=Schervish|first=Mark J.|title=सांख्यिकी का सिद्धांत|date=1995|publisher=Springer|location=New York|isbn=0387945466|edition=Corr. 2nd print.}}</ref>
{{Statistics topics sidebar}}
{{Math topics TOC}}
 
गणितीय आँकड़े सांख्यिकीय डेटा एकत्र करने की तकनीकों के विपरीत, संभाव्यता सिद्धांत, गणित की शाखा, का सांख्यिकी में अनुप्रयोग है। इसके लिए जिन विशिष्ट गणितीय तकनीकों का उपयोग किया जाता है उनमें [[गणितीय विश्लेषण]], रैखिक बीजगणित, [[स्टोकेस्टिक विश्लेषण]], अंतर समीकरण और [[माप सिद्धांत]] शामिल हैं।<ref>{{cite book|editor1-last=Kannan|editor1-first=D.|editor2-last=Lakshmikantham|editor2-first=V.|title=स्टोकेस्टिक विश्लेषण और अनुप्रयोगों की पुस्तिका|date=2002|publisher=M. Dekker|location=New York|isbn=0824706609}}</ref><ref>{{cite book|last=Schervish|first=Mark J.|title=सांख्यिकी का सिद्धांत|date=1995|publisher=Springer|location=New York|isbn=0387945466|edition=Corr. 2nd print.}}</ref>
 
 
==परिचय==
==परिचय==
सांख्यिकीय डेटा संग्रह का संबंध अध्ययन की योजना, विशेष रूप से प्रयोगों के डिजाइन और यादृच्छिक नमूने का उपयोग करके [[सांख्यिकीय सर्वेक्षण]] की योजना से है। डेटा का प्रारंभिक विश्लेषण अक्सर अध्ययन किए जाने से पहले निर्दिष्ट अध्ययन प्रोटोकॉल का पालन करता है। किसी अध्ययन के डेटा का विश्लेषण प्रारंभिक परिणामों से प्रेरित माध्यमिक परिकल्पनाओं पर विचार करने या नए अध्ययनों का सुझाव देने के लिए भी किया जा सकता है। नियोजित अध्ययन से प्राप्त डेटा का द्वितीयक विश्लेषण [[डेटा विश्लेषण]] के उपकरणों का उपयोग करता है, और ऐसा करने की प्रक्रिया गणितीय आँकड़े हैं।
इस प्रकार सांख्यिकीय डेटा संग्रह का संबंध अध्ययन की योजना, विशेष रूप से प्रयोगों के डिजाइन और यादृच्छिक प्रारूप का उपयोग करके [[सांख्यिकीय सर्वेक्षण]] की योजना से है। डेटा का प्रारंभिक विश्लेषण अधिकांशतः अध्ययन किए जाने से पहले निर्दिष्ट अध्ययन प्रोटोकॉल का पालन करता है। इस प्रकार किसी अध्ययन के डेटा का विश्लेषण प्रारंभिक परिणामों से प्रेरित माध्यमिक परिकल्पनाओं पर विचार करने या नए अध्ययनों का विचार देने के लिए भी किया जा सकता है। नियोजित अध्ययन से प्राप्त डेटा का द्वितीयक विश्लेषण [[डेटा विश्लेषण]] के उपकरणों का उपयोग करता है, और ऐसा करने की प्रक्रिया गणितीय सांख्यिकी हैं।


डेटा विश्लेषण को इसमें विभाजित किया गया है:
डेटा विश्लेषण को इसमें विभाजित किया गया है:


* [[वर्णनात्मक आँकड़े]] - आँकड़ों का वह भाग जो डेटा का वर्णन करता है, अर्थात डेटा और उनके विशिष्ट गुणों का सारांश देता है।
* [[वर्णनात्मक आँकड़े|वर्णनात्मक]] सांख्यिकी - सांख्यिकी का वह भाग जो डेटा का वर्णन करता है, अर्थात डेटा और उनके विशिष्ट गुणों का सारांश देता है।
* अनुमानात्मक आँकड़े - आँकड़ों का वह भाग जो डेटा से निष्कर्ष निकालता है (डेटा के लिए कुछ मॉडल का उपयोग करके): उदाहरण के लिए, अनुमानात्मक आँकड़ों में डेटा के लिए मॉडल का चयन करना, यह जाँचना कि क्या डेटा किसी विशेष मॉडल की शर्तों को पूरा करता है, और मात्रा निर्धारित करना शामिल है इसमें शामिल अनिश्चितता (उदाहरण के लिए आत्म[[विश्वास अंतराल]] का उपयोग करना)।
* अनुमानात्मक सांख्यिकी - सांख्यिकी का वह भाग जो डेटा से निष्कर्ष निकालता है (डेटा के लिए कुछ मॉडल का उपयोग करके): उदाहरण के लिए, अनुमानात्मक सांख्यिकी में डेटा के लिए मॉडल का चयन करता है, यह जाँचना कि क्या डेटा किसी विशेष मॉडल की नियमो को पूर्ण करता है, और मात्रा निर्धारित करना सम्मिलित है इसमें सम्मिलित अनिश्चितता (उदाहरण के लिए कॉन्फिडेंस [[विश्वास अंतराल|अंतराल]] का उपयोग करना)।
 
जबकि डेटा विश्लेषण के उपकरण यादृच्छिक अध्ययन से प्राप्त डेटा पर सबसे अच्छा काम करते हैं, वे अन्य प्रकार के डेटा पर भी लागू होते हैं। उदाहरण के लिए, [[प्राकृतिक प्रयोग]]ों और अवलोकन संबंधी अध्ययनों से, इस मामले में अनुमान सांख्यिकीविद् द्वारा चुने गए मॉडल पर निर्भर होता है, और इसलिए व्यक्तिपरक होता है।<ref>[[David A. Freedman (statistician)|Freedman, D.A.]] (2005) ''Statistical Models: Theory and Practice'', Cambridge University Press. {{isbn|978-0-521-67105-7}}</ref><ref name=Freedman>{{cite book |last1=Freedman |first1=David A. |editor1-last=Collier |editor1-first=David |editor2-last=Sekhon |editor2-first=Jasjeet S. |editor3-last=Stark |editor3-first=Philp B. |title=Statistical Models and Causal Inference: A Dialogue with the Social Sciences |date=2010 |publisher=Cambridge University Press |isbn=978-0-521-12390-7 |url=http://www.cambridge.org/9780521123907}}</ref>
 


जबकि डेटा विश्लेषण के उपकरण यादृच्छिक अध्ययन से प्राप्त डेटा पर सबसे अच्छा कार्य करते हैं, वह अन्य प्रकार के डेटा पर भी प्रयुक्त होते हैं। उदाहरण के लिए, [[प्राकृतिक प्रयोग]] और अवलोकन संबंधी अध्ययनों से, इस स्थिति में अनुमान सांख्यिकीविद् द्वारा चुने गए मॉडल पर निर्भर होता है, और इसलिए सब्जेक्टिव होता है।<ref>[[David A. Freedman (statistician)|Freedman, D.A.]] (2005) ''Statistical Models: Theory and Practice'', Cambridge University Press. {{isbn|978-0-521-67105-7}}</ref><ref name=Freedman>{{cite book |last1=Freedman |first1=David A. |editor1-last=Collier |editor1-first=David |editor2-last=Sekhon |editor2-first=Jasjeet S. |editor3-last=Stark |editor3-first=Philp B. |title=Statistical Models and Causal Inference: A Dialogue with the Social Sciences |date=2010 |publisher=Cambridge University Press |isbn=978-0-521-12390-7 |url=http://www.cambridge.org/9780521123907}}</ref>
==विषय==
==विषय==
गणितीय सांख्यिकी में कुछ महत्वपूर्ण विषय निम्नलिखित हैं:<ref>Hogg, R. V., A. Craig, and J. W. McKean. "Intro to Mathematical Statistics." (2005).</ref><ref>Larsen, Richard J. and Marx, Morris L. "An Introduction to Mathematical Statistics and Its Applications" (2012). Prentice Hall.</ref>
गणितीय सांख्यिकी में कुछ महत्वपूर्ण विषय निम्नलिखित हैं:<ref>Hogg, R. V., A. Craig, and J. W. McKean. "Intro to Mathematical Statistics." (2005).</ref><ref>Larsen, Richard J. and Marx, Morris L. "An Introduction to Mathematical Statistics and Its Applications" (2012). Prentice Hall.</ref>
===संभाव्यता वितरण===
{{main|संभाव्यता वितरण}}
इस प्रकार संभाव्यता वितरण [[फ़ंक्शन (गणित)|फलन (गणित)]] है जो यादृच्छिक प्रयोग ([[संभावना|संभाव्यता]] सिद्धांत), [[सर्वेक्षण पद्धति]], या सांख्यिकीय अनुमान की प्रक्रिया के संभावित परिणामों के प्रत्येक [[माप (गणित)]] के लिए संभाव्यता प्रदान करता है। ऐसे प्रयोगों में उदाहरण पाए जाते हैं जिनका प्रारूप समष्टि गैर-संख्यात्मक है, जहां वितरण [[श्रेणीबद्ध वितरण]] होगा; ऐसे प्रयोग जिनका प्रारूप समष्टि असतत [[यादृच्छिक चर|यादृच्छिक]] वैरिएबल द्वारा एन्कोड किया गया है, जहां वितरण को संभाव्यता द्रव्यमान फलन द्वारा निर्दिष्ट किया जा सकता है; और निरंतर यादृच्छिक वैरिएबल द्वारा एन्कोड किए गए प्रारूप समष्टि के साथ प्रयोग, जहां वितरण को संभाव्यता घनत्व फलन द्वारा निर्दिष्ट किया जा सकता है। इस प्रकार अधिक सम्मिश्र प्रयोग, जैसे कि [[निरंतर समय|सतत समय]] में परिभाषित स्टोकेस्टिक प्रक्रियाओं से जुड़े प्रयोग, अधिक सामान्य संभाव्यता उपायों के उपयोग की मांग कर सकते हैं।


 
इस प्रकार संभाव्यता वितरण या तो यूनीवेरिएट वितरण या [[बहुभिन्नरूपी वितरण|बहुविकल्पीय वितरण]] हो सकता है। इस प्रकार [[अविभाज्य वितरण]] एकल यादृच्छिक वैरिएबल के विभिन्न वैकल्पिक मान लेने की संभाव्यताएँ देता है; बहुभिन्नरूपी वितरण ( [[संयुक्त संभाव्यता वितरण]]) [[यादृच्छिक वेक्टर|यादृच्छिक सदिश]] की संभाव्यताएं देता है - दो या दो से अधिक यादृच्छिक वैरिएबल का सेट - मानों के विभिन्न संयोजनों पर आधारित महत्वपूर्ण और समष्टि सामने आने वाले अविभाज्य संभाव्यता वितरण में [[द्विपद वितरण]], [[हाइपरज्यामितीय वितरण]] और [[सामान्य वितरण]] सम्मिलित हैं। [[बहुभिन्नरूपी सामान्य वितरण]] सामान्यतः पाया जाने वाला बहुभिन्नरूपी वितरण है।
===संभावना वितरण===
{{main|Probability distribution}}
संभाव्यता वितरण [[फ़ंक्शन (गणित)]] है जो यादृच्छिक [[प्रयोग ([[संभावना]] सिद्धांत)]], [[सर्वेक्षण पद्धति]], या सांख्यिकीय अनुमान की प्रक्रिया के संभावित परिणामों के प्रत्येक [[माप (गणित)]] के लिए संभावना प्रदान करता है। ऐसे प्रयोगों में उदाहरण पाए जाते हैं जिनका नमूना स्थान गैर-संख्यात्मक है, जहां वितरण [[श्रेणीबद्ध वितरण]] होगा; ऐसे प्रयोग जिनका नमूना स्थान असतत [[यादृच्छिक चर]] द्वारा एन्कोड किया गया है, जहां वितरण को संभाव्यता द्रव्यमान फ़ंक्शन द्वारा निर्दिष्ट किया जा सकता है; और निरंतर यादृच्छिक चर द्वारा एन्कोड किए गए नमूना स्थानों के साथ प्रयोग, जहां वितरण को संभाव्यता घनत्व फ़ंक्शन द्वारा निर्दिष्ट किया जा सकता है। अधिक जटिल प्रयोग, जैसे कि [[निरंतर समय]] में परिभाषित स्टोकेस्टिक प्रक्रियाओं से जुड़े प्रयोग, अधिक सामान्य संभाव्यता उपायों के उपयोग की मांग कर सकते हैं।
 
संभाव्यता वितरण या तो यूनीवेरिएट वितरण या [[बहुभिन्नरूपी वितरण]] हो सकता है। [[अविभाज्य वितरण]] एकल यादृच्छिक चर के विभिन्न वैकल्पिक मान लेने की संभावनाएँ देता है; बहुभिन्नरूपी वितरण ( [[संयुक्त संभाव्यता वितरण]]) [[यादृच्छिक वेक्टर]] की संभावनाएं देता है - दो या दो से अधिक यादृच्छिक चर का सेट - मानों के विभिन्न संयोजनों पर आधारित। महत्वपूर्ण और आम तौर पर सामने आने वाले अविभाज्य संभाव्यता वितरण में [[द्विपद वितरण]], [[हाइपरज्यामितीय वितरण]] और [[सामान्य वितरण]] शामिल हैं। [[बहुभिन्नरूपी सामान्य वितरण]] आमतौर पर पाया जाने वाला बहुभिन्नरूपी वितरण है।


====विशेष वितरण====
====विशेष वितरण====
*सामान्य वितरण, सबसे सामान्य सतत वितरण
*सामान्य वितरण सबसे सामान्य सतत वितरण है
*[[बर्नौली वितरण]], एकल बर्नौली परीक्षण के परिणाम के लिए (जैसे सफलता/असफलता, हाँ/नहीं)
*इस प्रकार [[बर्नौली वितरण]], एकल बर्नौली परीक्षण के परिणाम के लिए (जैसे सफलता/असफलता, हाँ/नहीं)
*[[स्वतंत्र (सांख्यिकी)]] घटनाओं की निश्चित कुल संख्या दी गई सकारात्मक घटनाओं (जैसे सफलताएं, हां वोट इत्यादि) की संख्या के लिए द्विपद वितरण
*[[स्वतंत्र (सांख्यिकी)]] घटनाओं की निश्चित कुल संख्या दी गई धनात्मक घटनाओं (जैसे सफलताएं, हां वोट इत्यादि) की संख्या के लिए द्विपद वितरण है
*[[नकारात्मक द्विपद वितरण]], द्विपद-प्रकार के अवलोकनों के लिए लेकिन जहां ब्याज की मात्रा दी गई सफलताओं की संख्या होने से पहले विफलताओं की संख्या है
*इस प्रकार [[नकारात्मक द्विपद वितरण|ऋणात्मक द्विपद वितरण]], द्विपद-प्रकार के अवलोकनों के लिए किन्तु जहां ब्याज की मात्रा दी गई सफलताओं की संख्या होने से पहले विफलताओं की संख्या है
*[[ज्यामितीय वितरण]], द्विपद-प्रकार के अवलोकनों के लिए, लेकिन जहां रुचि की मात्रा पहली सफलता से पहले विफलताओं की संख्या है; नकारात्मक द्विपद वितरण का विशेष मामला, जहां सफलताओं की संख्या है।
*इस प्रकार [[ज्यामितीय वितरण]], द्विपद-प्रकार के अवलोकनों के लिए, किन्तु जहां इंटरेस्ट की मात्रा पहली सफलता से पहले विफलताओं की संख्या है; ऋणात्मक द्विपद वितरण का विशेष मामला, जहां सफलताओं की संख्या है।
*मूल्यों के सीमित सेट के लिए असतत समान वितरण (उदाहरण के लिए निष्पक्ष पासे का परिणाम)
*इस प्रकार मानो के सीमित सेट के लिए असतत समान वितरण है (उदाहरण के लिए निष्पक्ष पासे का परिणाम)
*निरंतर वितरित मूल्यों के लिए निरंतर समान वितरण
*निरंतर वितरित मानो के लिए निरंतर समान वितरण है
*पॉइसन वितरण, किसी निश्चित समयावधि में पॉइसन-प्रकार की घटना की घटनाओं की संख्या के लिए
*पॉइसन वितरण, किसी निश्चित समयावधि में पॉइसन-प्रकार की घटना की घटनाओं की संख्या के लिए है
*अगली पॉइसन-प्रकार की घटना घटित होने से पहले के समय के लिए घातीय वितरण
*इस प्रकार पॉइसन-प्रकार की घटना घटित होने से पहले के समय के लिए घातीय वितरण है
*[[गामा वितरण]], अगले के पॉइसन-प्रकार की घटनाओं के घटित होने से पहले के समय के लिए
*[[गामा वितरण]], पॉइसन-प्रकार की घटनाओं के घटित होने से पहले के समय के लिए
*[[ची-वर्ग वितरण]], वर्ग [[मानक सामान्य]] चर के योग का वितरण; उपयोगी उदा. सामान्य रूप से वितरित नमूनों के नमूना भिन्नता के संबंध में अनुमान के लिए (ची-स्क्वेर्ड परीक्षण देखें)
*[[ची-वर्ग वितरण]], वर्ग [[मानक सामान्य]] वैरिएबल के योग का वितरण है; उपयोगी उदाहरन सामान्य रूप से वितरित प्रारूपो के प्रारूप भिन्नता के संबंध में अनुमान के लिए (ची-स्क्वेर्ड परीक्षण देखें)
*छात्र का टी वितरण, मानक सामान्य चर के अनुपात का वितरण और स्केल किए गए [[ची वर्ग वितरण]] चर का वर्गमूल; अज्ञात विचरण के साथ सामान्य रूप से वितरित नमूनों के माध्य के बारे में अनुमान लगाने के लिए उपयोगी (छात्र का टी-परीक्षण देखें)
*इस प्रकार स्टूडेंट टी वितरण, मानक सामान्य वैरिएबल के अनुपात का वितरण और स्केल किए गए [[ची वर्ग वितरण]] वैरिएबल का वर्गमूल; अज्ञात विचरण के साथ सामान्य रूप से वितरित प्रारूपो के माध्य के बारे में अनुमान लगाने के लिए उपयोगी (स्टूडेंट टी-परीक्षण देखें)
*[[बीटा वितरण]], एकल संभाव्यता के लिए (0 और 1 के बीच वास्तविक संख्या); बर्नौली वितरण और द्विपद वितरण से संयुग्मित
*[[बीटा वितरण]], एकल संभाव्यता के लिए (0 और 1 के मध्य वास्तविक संख्या); बर्नौली वितरण और द्विपद वितरण से संयुग्मित है


===सांख्यिकीय अनुमान===
===सांख्यिकीय अनुमान===
{{main|Statistical inference}}
{{main|सांख्यिकीय निष्कर्ष}}
सांख्यिकीय अनुमान डेटा से निष्कर्ष निकालने की प्रक्रिया है जो यादृच्छिक भिन्नता के अधीन है, उदाहरण के लिए, अवलोकन संबंधी त्रुटियां या नमूना भिन्नता।<ref name="Oxford">Upton, G., Cook, I. (2008) ''Oxford Dictionary of Statistics'', OUP. {{isbn|978-0-19-954145-4}}</ref> [[अनुमान]] और आगमनात्मक तर्क के लिए प्रक्रियाओं की ऐसी प्रणाली की प्रारंभिक आवश्यकताएं यह हैं कि सिस्टम को अच्छी तरह से परिभाषित स्थितियों पर लागू होने पर उचित उत्तर देना चाहिए और यह कई स्थितियों में लागू होने के लिए पर्याप्त सामान्य होना चाहिए। अनुमानित आँकड़ों का उपयोग परिकल्पनाओं का परीक्षण करने और नमूना डेटा का उपयोग करके अनुमान लगाने के लिए किया जाता है। जबकि वर्णनात्मक आँकड़े नमूने का वर्णन करते हैं, अनुमानात्मक आँकड़े उस बड़ी आबादी के बारे में भविष्यवाणियाँ करते हैं जिसका नमूना प्रतिनिधित्व करता है।
 
इस प्रकार सांख्यिकीय अनुमान डेटा से निष्कर्ष निकालने की प्रक्रिया है जो यादृच्छिक भिन्नता के अधीन है, उदाहरण के लिए, अवलोकन संबंधी त्रुटियां या प्रारूप भिन्नता <ref name="Oxford">Upton, G., Cook, I. (2008) ''Oxford Dictionary of Statistics'', OUP. {{isbn|978-0-19-954145-4}}</ref> [[अनुमान]] और प्रेरक तर्क के लिए प्रक्रियाओं की ऐसी प्रणाली की प्रारंभिक आवश्यकताएं यह हैं कि प्रणाली को अच्छी तरह से परिभाषित स्थितियों पर प्रयुक्त होने पर उचित उत्तर देना चाहिए और यह विभिन्न स्थितियों में प्रयुक्त होने के लिए पर्याप्त सामान्य होना चाहिए। इस प्रकार अनुमानित सांख्यिकी का उपयोग परिकल्पनाओं का परीक्षण करने और प्रारूप डेटा का उपयोग करके अनुमान लगाने के लिए किया जाता है। जबकि वर्णनात्मक सांख्यिकी प्रारूप का वर्णन करते हैं, अनुमानात्मक सांख्यिकी उस बड़ी जनसंख्या के बारे में पूर्वानुमान करते हैं जिसका प्रारूप प्रतिनिधित्व करता है।


सांख्यिकीय अनुमान का परिणाम इस प्रश्न का उत्तर हो सकता है कि आगे क्या किया जाना चाहिए? , जहां यह आगे के प्रयोग या सर्वेक्षण करने, या किसी संगठनात्मक या सरकारी नीति को लागू करने से पहले निष्कर्ष निकालने के बारे में निर्णय हो सकता है।
इस प्रकार सांख्यिकीय अनुमान का परिणाम इस प्रश्न का उत्तर हो सकता है कि आगे क्या किया जाना चाहिए? , जहां यह आगे के प्रयोग या सर्वेक्षण करने, या किसी संगठनात्मक या सरकारी नीति को प्रयुक्त करने से पहले निष्कर्ष निकालने के बारे में निर्णय हो सकता है। अधिकांश भाग के लिए, सांख्यिकीय अनुमान कुछ प्रकार के यादृच्छिक प्रारूप के माध्यम से इंटरेस्ट की जनसंख्या से निकाले गए डेटा का उपयोग करके जनसंख्या के बारे में प्रस्ताव देता है। इस प्रकार अधिक सामान्यतः, यादृच्छिक प्रक्रिया के बारे में डेटा सीमित अवधि के समय उसके देखे गए व्यवहार से प्राप्त किया जाता है। किसी मापदंड या परिकल्पना को देखते हुए जिसके बारे में कोई अनुमान लगाना चाहता है, सांख्यिकीय अनुमान सबसे अधिक बार उपयोग किया जाता है:
अधिकांश भाग के लिए, सांख्यिकीय अनुमान कुछ प्रकार के यादृच्छिक नमूने के माध्यम से रुचि की आबादी से निकाले गए डेटा का उपयोग करके आबादी के बारे में प्रस्ताव देता है। अधिक सामान्यतः, यादृच्छिक प्रक्रिया के बारे में डेटा सीमित अवधि के दौरान उसके देखे गए व्यवहार से प्राप्त किया जाता है। किसी पैरामीटर या परिकल्पना को देखते हुए जिसके बारे में कोई अनुमान लगाना चाहता है, सांख्यिकीय अनुमान सबसे अधिक बार उपयोग किया जाता है:
* इस प्रकार यादृच्छिक प्रक्रिया का [[सांख्यिकीय मॉडल]] जो डेटा उत्पन्न करने वाला होता है, जिसे तब जाना जाता है जब यादृच्छिककरण का उपयोग किया गया हो, और
* यादृच्छिक प्रक्रिया का [[सांख्यिकीय मॉडल]] जो डेटा उत्पन्न करने वाला होता है, जिसे तब जाना जाता है जब यादृच्छिककरण का उपयोग किया गया हो, और
*इस प्रकार यादृच्छिक प्रक्रिया का एक विशेष अनुभव अर्थात डेटा का एक सेट है।
* यादृच्छिक प्रक्रिया का विशेष अहसास; यानी, डेटा का सेट।


===प्रतिगमन===
===प्रतिगमन===
{{main|Regression analysis}}
{{main|प्रतिगमन विश्लेषण}}
 
इस प्रकार सांख्यिकी में, प्रतिगमन विश्लेषण वैरिएबल के मध्य संबंधों का अनुमान लगाने के लिए सांख्यिकीय प्रक्रिया है। इसमें विभिन्न वैरिएबल के मॉडलिंग और विश्लेषण के विभिन्न विधि सम्मिलित हैं, जब फोकस डिपेन्डेन्ट वैरिएबल और या अधिक [[स्वतंत्र चर|स्वतंत्र]] वैरिएबल के मध्य संबंध पर होता है। अधिक विशेष रूप से, प्रतिगमन विश्लेषण यह समझने में सहायता करता है कि डिपेन्डेन्ट वैरिएबल (या 'मानदंड वैरिएबल') का विशिष्ट मूल्य कैसे परिवर्तित होता है जब किसी स्वतंत्र वैरिएबल में भिन्नता होती है, जबकि अन्य स्वतंत्र वैरिएबल स्थिर रहते हैं। सामान्यतः, प्रतिगमन विश्लेषण स्वतंत्र वैरिएबल को देखते हुए डिपेन्डेन्ट वैरिएबल की [[सशर्त अपेक्षा|नियमबद्ध अपेक्षा]] का अनुमान लगाता है - अर्थात, स्वतंत्र वैरिएबल तय होने पर डिपेन्डेन्ट वैरिएबल का [[औसत मूल्य]] सामान्यतः, ध्यान स्वतंत्र वैरिएबल को देखते हुए डिपेन्डेन्ट वैरिएबल के नियमबद्ध वितरण के [[ मात्रात्मक |मात्रात्मक]] या अन्य समष्टि [[पैरामीटर|मापदंड]] पर होता है। सभी स्थितियों में, अनुमान लक्ष्य स्वतंत्र वैरिएबल का फलन (गणित) है जिसे प्रतिगमन फलन कहा जाता है। इस प्रकार प्रतिगमन विश्लेषण में, प्रतिगमन फलन के निकट डिपेन्डेन्ट वैरिएबल की भिन्नता को चिह्नित करना भी रोचक है जिसे संभाव्यता वितरण द्वारा वर्णित किया जा सकता है।
 
इस प्रकार प्रतिगमन विश्लेषण करने के लिए विभिन्न तकनीकें विकसित की गई हैं। परिचित विधियाँ, जैसे कि रैखिक प्रतिगमन, [[पैरामीट्रिक आँकड़े|पैरामीट्रिक]] सांख्यिकी हैं, जिसमें प्रतिगमन फलन को अज्ञात मापदंडों की सीमित संख्या के संदर्भ में परिभाषित किया जाता है जो [[डेटा]] से अनुमानित होते हैं (उदाहरण के लिए सामान्य न्यूनतम वर्गों का उपयोग करके)। [[गैरपैरामीट्रिक प्रतिगमन|नॉनपैरामीट्रिक प्रतिगमन]] उन तकनीकों को संदर्भित करता है जो प्रतिगमन फलन को फलन (गणित) के निर्दिष्ट सेट में असत्य बोलने की अनुमति देता है, जो [[आयाम]] या अनंत-आयामी हो सकता है।


सांख्यिकी में, प्रतिगमन विश्लेषण चर के बीच संबंधों का अनुमान लगाने के लिए सांख्यिकीय प्रक्रिया है। इसमें कई चरों के मॉडलिंग और विश्लेषण के कई तरीके शामिल हैं, जब फोकस आश्रित चर और या अधिक [[स्वतंत्र चर]] के बीच संबंध पर होता है। अधिक विशेष रूप से, प्रतिगमन विश्लेषण यह समझने में मदद करता है कि आश्रित चर (या 'मानदंड चर') का विशिष्ट मूल्य कैसे बदलता है जब किसी स्वतंत्र चर में भिन्नता होती है, जबकि अन्य स्वतंत्र चर स्थिर रहते हैं। आमतौर पर, प्रतिगमन विश्लेषण स्वतंत्र चर को देखते हुए आश्रित चर की [[सशर्त अपेक्षा]] का अनुमान लगाता है - यानी, स्वतंत्र चर तय होने पर आश्रित चर का [[औसत मूल्य]]। आमतौर पर, ध्यान स्वतंत्र चर को देखते हुए आश्रित चर के सशर्त वितरण के [[ मात्रात्मक |मात्रात्मक]] या अन्य [[स्थान [[पैरामीटर]]]] पर होता है। सभी मामलों में, अनुमान लक्ष्य स्वतंत्र चर का फ़ंक्शन (गणित) है जिसे रिग्रेशन फ़ंक्शन कहा जाता है। प्रतिगमन विश्लेषण में, प्रतिगमन फ़ंक्शन के आसपास आश्रित चर की भिन्नता को चिह्नित करना भी दिलचस्प है जिसे संभाव्यता वितरण द्वारा वर्णित किया जा सकता है।
===नॉनपैरामीट्रिक सांख्यिकी===
{{main|नॉनपैरामीट्रिक सांख्यिकी}}


प्रतिगमन विश्लेषण करने के लिए कई तकनीकें विकसित की गई हैं। परिचित विधियाँ, जैसे कि रैखिक प्रतिगमन, [[पैरामीट्रिक आँकड़े]] हैं, जिसमें प्रतिगमन फ़ंक्शन को अज्ञात मापदंडों की सीमित संख्या के संदर्भ में परिभाषित किया जाता है जो [[डेटा]] से अनुमानित होते हैं (उदाहरण के लिए सामान्य न्यूनतम वर्गों का उपयोग करके)। [[गैरपैरामीट्रिक प्रतिगमन]] उन तकनीकों को संदर्भित करता है जो रिग्रेशन फ़ंक्शन को फ़ंक्शन (गणित) के निर्दिष्ट सेट में झूठ बोलने की अनुमति देता है, जो [[आयाम]] | अनंत-आयामी हो सकता है।
इस प्रकार नॉन-पैरामीट्रिक सांख्यिकी डेटा से इस तरह से गणना किए गए मान हैं जो संभाव्यता वितरण के [[सांख्यिकीय पैरामीटर|सांख्यिकीय मापदंड]] वर्गों पर आधारित नहीं हैं। इनमें वर्णनात्मक सांख्यिकी और सांख्यिकीय अनुमान सांख्यिकी दोनों सम्मिलित हैं। विशिष्ट मापदंड माध्य, विचरण आदि हैं। इस प्रकार पैरामीट्रिक सांख्यिकी के विपरीत, नॉन-पैरामीट्रिक सांख्यिकी मूल्यांकन किए जा रहे वैरिएबल के संभाव्यता वितरण के बारे में कोई धारणा नहीं बनाते हैं।<ref>{{Cite web |title=गैर-पैरामीट्रिक तरीकों पर शोध करें|url=https://d8.stat.cmu.edu/research-areas/nonparametric-methods |access-date=August 30, 2022 |website=Carnegie Mellon University}}</ref>


===गैरपैरामीट्रिक आँकड़े===
इस प्रकार नॉन-पैरामीट्रिक विधियों का व्यापक रूप से उन जनसंख्या का अध्ययन करने के लिए उपयोग किया जाता है जो क्रमबद्ध क्रम में होती हैं (जैसे कि से चार स्टार प्राप्त करने वाली फिल्म समीक्षा)। नॉन-पैरामीट्रिक विधियों का उपयोग तब आवश्यक हो सकता है जब डेटा की [[रैंकिंग]] हो किन्तु कोई स्पष्ट संख्यात्मक व्याख्या न हो, जैसे कि प्राथमिकताओं का आकलन करते समय माप के स्तर के संदर्भ में, नॉन-पैरामीट्रिक विधियों से क्रमिक डेटा प्राप्त होता है।
{{main|Nonparametric statistics}}
गैर-पैरामीट्रिक आँकड़े डेटा से इस तरह से गणना किए गए मान हैं जो संभाव्यता वितरण के [[सांख्यिकीय पैरामीटर]] परिवारों पर आधारित नहीं हैं। इनमें वर्णनात्मक आँकड़े और सांख्यिकीय अनुमान आँकड़े दोनों शामिल हैं। विशिष्ट पैरामीटर माध्य, विचरण आदि हैं। पैरामीट्रिक आँकड़ों के विपरीत, गैर-पैरामीट्रिक आँकड़े मूल्यांकन किए जा रहे चर के संभाव्यता वितरण के बारे में कोई धारणा नहीं बनाते हैं।<ref>{{Cite web |title=गैर-पैरामीट्रिक तरीकों पर शोध करें|url=https://d8.stat.cmu.edu/research-areas/nonparametric-methods |access-date=August 30, 2022 |website=Carnegie Mellon University}}</ref>
गैर-पैरामीट्रिक तरीकों का व्यापक रूप से उन आबादी का अध्ययन करने के लिए उपयोग किया जाता है जो क्रमबद्ध क्रम में होती हैं (जैसे कि से चार स्टार प्राप्त करने वाली फिल्म समीक्षा)। गैर-पैरामीट्रिक तरीकों का उपयोग तब आवश्यक हो सकता है जब डेटा की [[रैंकिंग]] हो लेकिन कोई स्पष्ट संख्यात्मक व्याख्या न हो, जैसे कि प्राथमिकताओं का आकलन करते समय। माप के स्तर के संदर्भ में, गैर-पैरामीट्रिक तरीकों से क्रमिक डेटा प्राप्त होता है।


चूंकि गैर-पैरामीट्रिक विधियां कम धारणाएं बनाती हैं, इसलिए उनकी प्रयोज्यता संबंधित पैरामीट्रिक विधियों की तुलना में बहुत व्यापक है। विशेष रूप से, उन्हें उन स्थितियों में लागू किया जा सकता है जहां प्रश्न में आवेदन के बारे में कम जानकारी है। साथ ही, कम मान्यताओं पर निर्भरता के कारण, गैर-पैरामीट्रिक विधियाँ अधिक मजबूत आँकड़े#परिचय हैं।
चूंकि नॉन-पैरामीट्रिक विधियां कम धारणाएं बनाती हैं, इसलिए उनकी प्रयोज्यता संबंधित पैरामीट्रिक विधियों की तुलना में बहुत व्यापक है। विशेष रूप से, उन्हें उन स्थितियों में प्रयुक्त किया जा सकता है जहां प्रश्न में आवेदन के बारे में कम जानकारी है। साथ ही, कम मान्यताओं पर निर्भरता के कारण, नॉन-पैरामीट्रिक विधियाँ अधिक सशक्त सांख्यिकी परिचय हैं।


गैर-पैरामीट्रिक तरीकों का दोष यह है कि चूंकि वे मान्यताओं पर भरोसा नहीं करते हैं, इसलिए वे आम तौर पर अपने पैरामीट्रिक समकक्षों की तुलना में परीक्षण की कम शक्ति वाले होते हैं।<ref name=":0">{{Cite web |title=गैरपैरामीट्रिक परीक्षण|url=https://sphweb.bumc.bu.edu/otlt/MPH-Modules/BS/BS704_Nonparametric/BS704_Nonparametric_print.html |access-date=2022-08-31 |website=sphweb.bumc.bu.edu}}</ref> कम शक्ति वाले गैर-पैरामीट्रिक परीक्षण समस्याग्रस्त हैं क्योंकि इन विधियों का सामान्य उपयोग तब होता है जब किसी नमूने का नमूना आकार कम होता है।<ref name=":0" /> नेमैन-पियर्सन लेम्मा और [[संभावना-अनुपात परीक्षण]] जैसी विधियों के माध्यम से कई पैरामीट्रिक विधियां सबसे शक्तिशाली परीक्षण साबित हुई हैं।
इस प्रकार नॉन-पैरामीट्रिक विधियों का दोष यह है कि चूंकि वह मान्यताओं पर विश्वास नहीं करते हैं, इसलिए वह समष्टि अपने पैरामीट्रिक समकक्षों की तुलना में परीक्षण की कम शक्ति वाले होते हैं।<ref name=":0">{{Cite web |title=गैरपैरामीट्रिक परीक्षण|url=https://sphweb.bumc.bu.edu/otlt/MPH-Modules/BS/BS704_Nonparametric/BS704_Nonparametric_print.html |access-date=2022-08-31 |website=sphweb.bumc.bu.edu}}</ref> कम शक्ति वाले नॉन-पैरामीट्रिक परीक्षण समस्याग्रस्त हैं क्योंकि इन विधियों का सामान्य उपयोग तब होता है जब किसी प्रारूप का प्रारूप आकार कम होता है।<ref name=":0" /> नेमैन-पियर्सन लेम्मा और [[संभावना-अनुपात परीक्षण|संभाव्यता-अनुपात परीक्षण]] जैसी विधियों के माध्यम से विभिन्न पैरामीट्रिक विधियां सबसे शक्तिशाली परीक्षण सिद्ध हुई हैं।


गैर-पैरामीट्रिक तरीकों के उपयोग का अन्य औचित्य सरलता है। कुछ मामलों में, भले ही पैरामीट्रिक विधियों का उपयोग उचित हो, गैर-पैरामीट्रिक विधियों का उपयोग करना आसान हो सकता है। इस सरलता और उनकी अधिक मजबूती दोनों के कारण, कुछ सांख्यिकीविदों द्वारा गैर-पैरामीट्रिक तरीकों को अनुचित उपयोग और गलतफहमी के लिए कम जगह छोड़ने के रूप में देखा जाता है।
इस प्रकार नॉन-पैरामीट्रिक विधियों के उपयोग का अन्य औचित्य सरलता है। कुछ स्थितियों में, तथापि पैरामीट्रिक विधियों का उपयोग उचित हो, नॉन-पैरामीट्रिक विधियों का उपयोग करना सरल हो सकता है। इस सरलता और उनकी अधिक सशक्त दोनों के कारण, कुछ सांख्यिकीविदों द्वारा नॉन-पैरामीट्रिक विधियों को अनुचित उपयोग और गलतफहमी के लिए कम समष्टि छोड़ने के रूप में देखा जाता है।


==सांख्यिकी, गणित, और गणितीय सांख्यिकी==
==सांख्यिकी, गणित, और गणितीय सांख्यिकी==
गणितीय आँकड़े सांख्यिकी के अनुशासन का प्रमुख उपसमुच्चय है। सांख्यिकीविद् गणित के साथ सांख्यिकीय प्रक्रियाओं का अध्ययन और सुधार करते हैं, और सांख्यिकीय अनुसंधान अक्सर गणितीय प्रश्न उठाते हैं।
इस प्रकार गणितीय सांख्यिकी सांख्यिकी के अनुशासन का प्रमुख उपसमुच्चय है। सांख्यिकीविद् गणित के साथ सांख्यिकीय प्रक्रियाओं का अध्ययन और सुधार करते हैं, और सांख्यिकीय अनुसंधान अधिकांशतः गणितीय प्रश्न उठाते हैं।


[[गॉस]], [[लाप्लास]] और चार्ल्स सैंडर्स पीयर्स|सी जैसे गणितज्ञ और सांख्यिकीविद्। एस. पीयर्स ने संभाव्यता वितरण और हानि कार्यों (या उपयोगिता कार्यों) के साथ [[इष्टतम निर्णय]] का उपयोग किया। सांख्यिकीय अनुमान के लिए निर्णय-सैद्धांतिक दृष्टिकोण को [[ इब्राहीम का जन्म हुआ |इब्राहीम का जन्म हुआ]] और उनके उत्तराधिकारियों द्वारा पुनर्जीवित किया गया था,<ref>{{Cite book
इस प्रकार [[गॉस]], [[लाप्लास]] और चार्ल्स सैंडर्स पीयर्स या सी जैसे गणितज्ञ और सांख्यिकीविद् एस. पीयर्स ने संभाव्यता वितरण और हानि कार्यों (या उपयोगिता कार्यों) के साथ [[इष्टतम निर्णय]] का उपयोग किया था। सांख्यिकीय अनुमान के लिए निर्णय-सैद्धांतिक दृष्टिकोण को [[ इब्राहीम का जन्म हुआ |इब्राहीम का जन्म हुआ]] और उनके उत्तराधिकारियों द्वारा पुनर्जीवित किया गया था,<ref>{{Cite book
  | first = Abraham
  | first = Abraham
  | last = Wald |author-link=Abraham Wald
  | last = Wald |author-link=Abraham Wald
Line 121: Line 113:
|publisher=Springer
|publisher=Springer
}}
}}
</ref> और [[वैज्ञानिक कंप्यूटिंग]], गणितीय विश्लेषण और [[अनुकूलन (गणित)]] का व्यापक उपयोग करता है; प्रयोगों के डिज़ाइन के लिए, सांख्यिकीविद् बीजगणितीय सांख्यिकी और संयोजनात्मक डिज़ाइन का उपयोग करते हैं। लेकिन जबकि सांख्यिकीय अभ्यास अक्सर संभाव्यता सिद्धांत और इष्टतम निर्णय पर निर्भर करता है, उनका अनुप्रयोग विवादास्पद हो सकता है <ref name=Freedman/>
</ref> और [[वैज्ञानिक कंप्यूटिंग]], गणितीय विश्लेषण और [[अनुकूलन (गणित)]] का व्यापक उपयोग करता है; इस प्रकार प्रयोगों के डिज़ाइन के लिए, सांख्यिकीविद् बीजगणितीय सांख्यिकी और संयोजनात्मक डिज़ाइन का उपयोग करते हैं। किन्तु जबकि सांख्यिकीय अभ्यास अधिकांशतः संभाव्यता सिद्धांत और इष्टतम निर्णय पर निर्भर करता है, उनका अनुप्रयोग विवादास्पद हो सकता है <ref name=Freedman/>
 
==यह भी देखें{{portal|Mathematics}}==
 
*[[स्पर्शोन्मुख सिद्धांत (सांख्यिकी)|असममित सिद्धांत (सांख्यिकी)]]
==यह भी देखें==
{{portal|Mathematics}}
*[[स्पर्शोन्मुख सिद्धांत (सांख्यिकी)]]


==संदर्भ==
==संदर्भ==
<references/>
<references/>
== अग्रिम पठन ==
== अग्रिम पठन ==
* [[Aleksandr Alekseevich Borovkov|Borovkov, A. A.]] (1999). ''Mathematical Statistics''. CRC Press. {{isbn|90-5699-018-7}}
* [[Aleksandr Alekseevich Borovkov|Borovkov, A. A.]] (1999). ''Mathematical Statistics''. CRC Press. {{isbn|90-5699-018-7}}
Line 137: Line 124:
* [http://www.trigonella.ch/statibot/english/ StatiBot], interactive online expert system on statistical tests.
* [http://www.trigonella.ch/statibot/english/ StatiBot], interactive online expert system on statistical tests.
* {{Cite book|last1=Ray|first1=Manohar|url=https://books.google.com/books?id=NXGpYgEACAAJ|title=Mathematical Statistics|last2=Sharma|first2=Har Swarup|date=1966|publisher=Ram Prasad & Sons}} {{ISBN|978-9383385188}}
* {{Cite book|last1=Ray|first1=Manohar|url=https://books.google.com/books?id=NXGpYgEACAAJ|title=Mathematical Statistics|last2=Sharma|first2=Har Swarup|date=1966|publisher=Ram Prasad & Sons}} {{ISBN|978-9383385188}}
{{Areas of mathematics}}
[[Category:Articles with hatnote templates targeting a nonexistent page|Mathematical Statistics]]
 
[[Category:Created On 30/11/2023|Mathematical Statistics]]
{{DEFAULTSORT:Mathematical Statistics}}[[Category: सांख्यिकीय सिद्धांत]] [[Category: जिवानांकिकी]]  
[[Category:Machine Translated Page|Mathematical Statistics]]
 
[[Category:Pages with empty portal template|Mathematical Statistics]]
 
[[Category:Pages with script errors|Short description/doc]]
 
[[Category:Portal-inline template with redlinked portals|Mathematical Statistics]]
[[Category: Machine Translated Page]]
[[Category:Portal templates with redlinked portals|Mathematical Statistics]]
[[Category:Created On 30/11/2023]]
[[Category:Short description with empty Wikidata description|Mathematical Statistics]]
[[Category:Template documentation pages|Short description/doc]]
[[Category:Templates Translated in Hindi|Mathematical Statistics]]
[[Category:Vigyan Ready]]

Latest revision as of 10:50, 11 December 2023

डेटा सेट पर रैखिक प्रतिगमन का चित्रण। प्रतिगमन विश्लेषण गणितीय सांख्यिकी का महत्वपूर्ण भाग है।

गणितीय सांख्यिकी सांख्यिकीय डेटा एकत्र करने की तकनीकों के विपरीत, संभाव्यता सिद्धांत, गणित की शाखा, का सांख्यिकी में अनुप्रयोग है। इस प्रकार इसके लिए जो विशिष्ट गणितीय तकनीकों का उपयोग किया जाता है उनमें गणितीय विश्लेषण, रैखिक बीजगणित, स्टोकेस्टिक विश्लेषण, अंतर समीकरण और माप सिद्धांत सम्मिलित हैं।[1][2]

परिचय

इस प्रकार सांख्यिकीय डेटा संग्रह का संबंध अध्ययन की योजना, विशेष रूप से प्रयोगों के डिजाइन और यादृच्छिक प्रारूप का उपयोग करके सांख्यिकीय सर्वेक्षण की योजना से है। डेटा का प्रारंभिक विश्लेषण अधिकांशतः अध्ययन किए जाने से पहले निर्दिष्ट अध्ययन प्रोटोकॉल का पालन करता है। इस प्रकार किसी अध्ययन के डेटा का विश्लेषण प्रारंभिक परिणामों से प्रेरित माध्यमिक परिकल्पनाओं पर विचार करने या नए अध्ययनों का विचार देने के लिए भी किया जा सकता है। नियोजित अध्ययन से प्राप्त डेटा का द्वितीयक विश्लेषण डेटा विश्लेषण के उपकरणों का उपयोग करता है, और ऐसा करने की प्रक्रिया गणितीय सांख्यिकी हैं।

डेटा विश्लेषण को इसमें विभाजित किया गया है:

  • वर्णनात्मक सांख्यिकी - सांख्यिकी का वह भाग जो डेटा का वर्णन करता है, अर्थात डेटा और उनके विशिष्ट गुणों का सारांश देता है।
  • अनुमानात्मक सांख्यिकी - सांख्यिकी का वह भाग जो डेटा से निष्कर्ष निकालता है (डेटा के लिए कुछ मॉडल का उपयोग करके): उदाहरण के लिए, अनुमानात्मक सांख्यिकी में डेटा के लिए मॉडल का चयन करता है, यह जाँचना कि क्या डेटा किसी विशेष मॉडल की नियमो को पूर्ण करता है, और मात्रा निर्धारित करना सम्मिलित है इसमें सम्मिलित अनिश्चितता (उदाहरण के लिए कॉन्फिडेंस अंतराल का उपयोग करना)।

जबकि डेटा विश्लेषण के उपकरण यादृच्छिक अध्ययन से प्राप्त डेटा पर सबसे अच्छा कार्य करते हैं, वह अन्य प्रकार के डेटा पर भी प्रयुक्त होते हैं। उदाहरण के लिए, प्राकृतिक प्रयोग और अवलोकन संबंधी अध्ययनों से, इस स्थिति में अनुमान सांख्यिकीविद् द्वारा चुने गए मॉडल पर निर्भर होता है, और इसलिए सब्जेक्टिव होता है।[3][4]

विषय

गणितीय सांख्यिकी में कुछ महत्वपूर्ण विषय निम्नलिखित हैं:[5][6]

संभाव्यता वितरण

इस प्रकार संभाव्यता वितरण फलन (गणित) है जो यादृच्छिक प्रयोग (संभाव्यता सिद्धांत), सर्वेक्षण पद्धति, या सांख्यिकीय अनुमान की प्रक्रिया के संभावित परिणामों के प्रत्येक माप (गणित) के लिए संभाव्यता प्रदान करता है। ऐसे प्रयोगों में उदाहरण पाए जाते हैं जिनका प्रारूप समष्टि गैर-संख्यात्मक है, जहां वितरण श्रेणीबद्ध वितरण होगा; ऐसे प्रयोग जिनका प्रारूप समष्टि असतत यादृच्छिक वैरिएबल द्वारा एन्कोड किया गया है, जहां वितरण को संभाव्यता द्रव्यमान फलन द्वारा निर्दिष्ट किया जा सकता है; और निरंतर यादृच्छिक वैरिएबल द्वारा एन्कोड किए गए प्रारूप समष्टि के साथ प्रयोग, जहां वितरण को संभाव्यता घनत्व फलन द्वारा निर्दिष्ट किया जा सकता है। इस प्रकार अधिक सम्मिश्र प्रयोग, जैसे कि सतत समय में परिभाषित स्टोकेस्टिक प्रक्रियाओं से जुड़े प्रयोग, अधिक सामान्य संभाव्यता उपायों के उपयोग की मांग कर सकते हैं।

इस प्रकार संभाव्यता वितरण या तो यूनीवेरिएट वितरण या बहुविकल्पीय वितरण हो सकता है। इस प्रकार अविभाज्य वितरण एकल यादृच्छिक वैरिएबल के विभिन्न वैकल्पिक मान लेने की संभाव्यताएँ देता है; बहुभिन्नरूपी वितरण ( संयुक्त संभाव्यता वितरण) यादृच्छिक सदिश की संभाव्यताएं देता है - दो या दो से अधिक यादृच्छिक वैरिएबल का सेट - मानों के विभिन्न संयोजनों पर आधारित महत्वपूर्ण और समष्टि सामने आने वाले अविभाज्य संभाव्यता वितरण में द्विपद वितरण, हाइपरज्यामितीय वितरण और सामान्य वितरण सम्मिलित हैं। बहुभिन्नरूपी सामान्य वितरण सामान्यतः पाया जाने वाला बहुभिन्नरूपी वितरण है।

विशेष वितरण

  • सामान्य वितरण सबसे सामान्य सतत वितरण है
  • इस प्रकार बर्नौली वितरण, एकल बर्नौली परीक्षण के परिणाम के लिए (जैसे सफलता/असफलता, हाँ/नहीं)
  • स्वतंत्र (सांख्यिकी) घटनाओं की निश्चित कुल संख्या दी गई धनात्मक घटनाओं (जैसे सफलताएं, हां वोट इत्यादि) की संख्या के लिए द्विपद वितरण है
  • इस प्रकार ऋणात्मक द्विपद वितरण, द्विपद-प्रकार के अवलोकनों के लिए किन्तु जहां ब्याज की मात्रा दी गई सफलताओं की संख्या होने से पहले विफलताओं की संख्या है
  • इस प्रकार ज्यामितीय वितरण, द्विपद-प्रकार के अवलोकनों के लिए, किन्तु जहां इंटरेस्ट की मात्रा पहली सफलता से पहले विफलताओं की संख्या है; ऋणात्मक द्विपद वितरण का विशेष मामला, जहां सफलताओं की संख्या है।
  • इस प्रकार मानो के सीमित सेट के लिए असतत समान वितरण है (उदाहरण के लिए निष्पक्ष पासे का परिणाम)
  • निरंतर वितरित मानो के लिए निरंतर समान वितरण है
  • पॉइसन वितरण, किसी निश्चित समयावधि में पॉइसन-प्रकार की घटना की घटनाओं की संख्या के लिए है
  • इस प्रकार पॉइसन-प्रकार की घटना घटित होने से पहले के समय के लिए घातीय वितरण है
  • गामा वितरण, पॉइसन-प्रकार की घटनाओं के घटित होने से पहले के समय के लिए
  • ची-वर्ग वितरण, वर्ग मानक सामान्य वैरिएबल के योग का वितरण है; उपयोगी उदाहरन सामान्य रूप से वितरित प्रारूपो के प्रारूप भिन्नता के संबंध में अनुमान के लिए (ची-स्क्वेर्ड परीक्षण देखें)
  • इस प्रकार स्टूडेंट टी वितरण, मानक सामान्य वैरिएबल के अनुपात का वितरण और स्केल किए गए ची वर्ग वितरण वैरिएबल का वर्गमूल; अज्ञात विचरण के साथ सामान्य रूप से वितरित प्रारूपो के माध्य के बारे में अनुमान लगाने के लिए उपयोगी (स्टूडेंट टी-परीक्षण देखें)
  • बीटा वितरण, एकल संभाव्यता के लिए (0 और 1 के मध्य वास्तविक संख्या); बर्नौली वितरण और द्विपद वितरण से संयुग्मित है

सांख्यिकीय अनुमान

इस प्रकार सांख्यिकीय अनुमान डेटा से निष्कर्ष निकालने की प्रक्रिया है जो यादृच्छिक भिन्नता के अधीन है, उदाहरण के लिए, अवलोकन संबंधी त्रुटियां या प्रारूप भिन्नता [7] अनुमान और प्रेरक तर्क के लिए प्रक्रियाओं की ऐसी प्रणाली की प्रारंभिक आवश्यकताएं यह हैं कि प्रणाली को अच्छी तरह से परिभाषित स्थितियों पर प्रयुक्त होने पर उचित उत्तर देना चाहिए और यह विभिन्न स्थितियों में प्रयुक्त होने के लिए पर्याप्त सामान्य होना चाहिए। इस प्रकार अनुमानित सांख्यिकी का उपयोग परिकल्पनाओं का परीक्षण करने और प्रारूप डेटा का उपयोग करके अनुमान लगाने के लिए किया जाता है। जबकि वर्णनात्मक सांख्यिकी प्रारूप का वर्णन करते हैं, अनुमानात्मक सांख्यिकी उस बड़ी जनसंख्या के बारे में पूर्वानुमान करते हैं जिसका प्रारूप प्रतिनिधित्व करता है।

इस प्रकार सांख्यिकीय अनुमान का परिणाम इस प्रश्न का उत्तर हो सकता है कि आगे क्या किया जाना चाहिए? , जहां यह आगे के प्रयोग या सर्वेक्षण करने, या किसी संगठनात्मक या सरकारी नीति को प्रयुक्त करने से पहले निष्कर्ष निकालने के बारे में निर्णय हो सकता है। अधिकांश भाग के लिए, सांख्यिकीय अनुमान कुछ प्रकार के यादृच्छिक प्रारूप के माध्यम से इंटरेस्ट की जनसंख्या से निकाले गए डेटा का उपयोग करके जनसंख्या के बारे में प्रस्ताव देता है। इस प्रकार अधिक सामान्यतः, यादृच्छिक प्रक्रिया के बारे में डेटा सीमित अवधि के समय उसके देखे गए व्यवहार से प्राप्त किया जाता है। किसी मापदंड या परिकल्पना को देखते हुए जिसके बारे में कोई अनुमान लगाना चाहता है, सांख्यिकीय अनुमान सबसे अधिक बार उपयोग किया जाता है:

  • इस प्रकार यादृच्छिक प्रक्रिया का सांख्यिकीय मॉडल जो डेटा उत्पन्न करने वाला होता है, जिसे तब जाना जाता है जब यादृच्छिककरण का उपयोग किया गया हो, और
  • इस प्रकार यादृच्छिक प्रक्रिया का एक विशेष अनुभव अर्थात डेटा का एक सेट है।

प्रतिगमन

इस प्रकार सांख्यिकी में, प्रतिगमन विश्लेषण वैरिएबल के मध्य संबंधों का अनुमान लगाने के लिए सांख्यिकीय प्रक्रिया है। इसमें विभिन्न वैरिएबल के मॉडलिंग और विश्लेषण के विभिन्न विधि सम्मिलित हैं, जब फोकस डिपेन्डेन्ट वैरिएबल और या अधिक स्वतंत्र वैरिएबल के मध्य संबंध पर होता है। अधिक विशेष रूप से, प्रतिगमन विश्लेषण यह समझने में सहायता करता है कि डिपेन्डेन्ट वैरिएबल (या 'मानदंड वैरिएबल') का विशिष्ट मूल्य कैसे परिवर्तित होता है जब किसी स्वतंत्र वैरिएबल में भिन्नता होती है, जबकि अन्य स्वतंत्र वैरिएबल स्थिर रहते हैं। सामान्यतः, प्रतिगमन विश्लेषण स्वतंत्र वैरिएबल को देखते हुए डिपेन्डेन्ट वैरिएबल की नियमबद्ध अपेक्षा का अनुमान लगाता है - अर्थात, स्वतंत्र वैरिएबल तय होने पर डिपेन्डेन्ट वैरिएबल का औसत मूल्य सामान्यतः, ध्यान स्वतंत्र वैरिएबल को देखते हुए डिपेन्डेन्ट वैरिएबल के नियमबद्ध वितरण के मात्रात्मक या अन्य समष्टि मापदंड पर होता है। सभी स्थितियों में, अनुमान लक्ष्य स्वतंत्र वैरिएबल का फलन (गणित) है जिसे प्रतिगमन फलन कहा जाता है। इस प्रकार प्रतिगमन विश्लेषण में, प्रतिगमन फलन के निकट डिपेन्डेन्ट वैरिएबल की भिन्नता को चिह्नित करना भी रोचक है जिसे संभाव्यता वितरण द्वारा वर्णित किया जा सकता है।

इस प्रकार प्रतिगमन विश्लेषण करने के लिए विभिन्न तकनीकें विकसित की गई हैं। परिचित विधियाँ, जैसे कि रैखिक प्रतिगमन, पैरामीट्रिक सांख्यिकी हैं, जिसमें प्रतिगमन फलन को अज्ञात मापदंडों की सीमित संख्या के संदर्भ में परिभाषित किया जाता है जो डेटा से अनुमानित होते हैं (उदाहरण के लिए सामान्य न्यूनतम वर्गों का उपयोग करके)। नॉनपैरामीट्रिक प्रतिगमन उन तकनीकों को संदर्भित करता है जो प्रतिगमन फलन को फलन (गणित) के निर्दिष्ट सेट में असत्य बोलने की अनुमति देता है, जो आयाम या अनंत-आयामी हो सकता है।

नॉनपैरामीट्रिक सांख्यिकी

इस प्रकार नॉन-पैरामीट्रिक सांख्यिकी डेटा से इस तरह से गणना किए गए मान हैं जो संभाव्यता वितरण के सांख्यिकीय मापदंड वर्गों पर आधारित नहीं हैं। इनमें वर्णनात्मक सांख्यिकी और सांख्यिकीय अनुमान सांख्यिकी दोनों सम्मिलित हैं। विशिष्ट मापदंड माध्य, विचरण आदि हैं। इस प्रकार पैरामीट्रिक सांख्यिकी के विपरीत, नॉन-पैरामीट्रिक सांख्यिकी मूल्यांकन किए जा रहे वैरिएबल के संभाव्यता वितरण के बारे में कोई धारणा नहीं बनाते हैं।[8]

इस प्रकार नॉन-पैरामीट्रिक विधियों का व्यापक रूप से उन जनसंख्या का अध्ययन करने के लिए उपयोग किया जाता है जो क्रमबद्ध क्रम में होती हैं (जैसे कि से चार स्टार प्राप्त करने वाली फिल्म समीक्षा)। नॉन-पैरामीट्रिक विधियों का उपयोग तब आवश्यक हो सकता है जब डेटा की रैंकिंग हो किन्तु कोई स्पष्ट संख्यात्मक व्याख्या न हो, जैसे कि प्राथमिकताओं का आकलन करते समय माप के स्तर के संदर्भ में, नॉन-पैरामीट्रिक विधियों से क्रमिक डेटा प्राप्त होता है।

चूंकि नॉन-पैरामीट्रिक विधियां कम धारणाएं बनाती हैं, इसलिए उनकी प्रयोज्यता संबंधित पैरामीट्रिक विधियों की तुलना में बहुत व्यापक है। विशेष रूप से, उन्हें उन स्थितियों में प्रयुक्त किया जा सकता है जहां प्रश्न में आवेदन के बारे में कम जानकारी है। साथ ही, कम मान्यताओं पर निर्भरता के कारण, नॉन-पैरामीट्रिक विधियाँ अधिक सशक्त सांख्यिकी परिचय हैं।

इस प्रकार नॉन-पैरामीट्रिक विधियों का दोष यह है कि चूंकि वह मान्यताओं पर विश्वास नहीं करते हैं, इसलिए वह समष्टि अपने पैरामीट्रिक समकक्षों की तुलना में परीक्षण की कम शक्ति वाले होते हैं।[9] कम शक्ति वाले नॉन-पैरामीट्रिक परीक्षण समस्याग्रस्त हैं क्योंकि इन विधियों का सामान्य उपयोग तब होता है जब किसी प्रारूप का प्रारूप आकार कम होता है।[9] नेमैन-पियर्सन लेम्मा और संभाव्यता-अनुपात परीक्षण जैसी विधियों के माध्यम से विभिन्न पैरामीट्रिक विधियां सबसे शक्तिशाली परीक्षण सिद्ध हुई हैं।

इस प्रकार नॉन-पैरामीट्रिक विधियों के उपयोग का अन्य औचित्य सरलता है। कुछ स्थितियों में, तथापि पैरामीट्रिक विधियों का उपयोग उचित हो, नॉन-पैरामीट्रिक विधियों का उपयोग करना सरल हो सकता है। इस सरलता और उनकी अधिक सशक्त दोनों के कारण, कुछ सांख्यिकीविदों द्वारा नॉन-पैरामीट्रिक विधियों को अनुचित उपयोग और गलतफहमी के लिए कम समष्टि छोड़ने के रूप में देखा जाता है।

सांख्यिकी, गणित, और गणितीय सांख्यिकी

इस प्रकार गणितीय सांख्यिकी सांख्यिकी के अनुशासन का प्रमुख उपसमुच्चय है। सांख्यिकीविद् गणित के साथ सांख्यिकीय प्रक्रियाओं का अध्ययन और सुधार करते हैं, और सांख्यिकीय अनुसंधान अधिकांशतः गणितीय प्रश्न उठाते हैं।

इस प्रकार गॉस, लाप्लास और चार्ल्स सैंडर्स पीयर्स या सी जैसे गणितज्ञ और सांख्यिकीविद् एस. पीयर्स ने संभाव्यता वितरण और हानि कार्यों (या उपयोगिता कार्यों) के साथ इष्टतम निर्णय का उपयोग किया था। सांख्यिकीय अनुमान के लिए निर्णय-सैद्धांतिक दृष्टिकोण को इब्राहीम का जन्म हुआ और उनके उत्तराधिकारियों द्वारा पुनर्जीवित किया गया था,[10][11][12][13][14][15][16] और वैज्ञानिक कंप्यूटिंग, गणितीय विश्लेषण और अनुकूलन (गणित) का व्यापक उपयोग करता है; इस प्रकार प्रयोगों के डिज़ाइन के लिए, सांख्यिकीविद् बीजगणितीय सांख्यिकी और संयोजनात्मक डिज़ाइन का उपयोग करते हैं। किन्तु जबकि सांख्यिकीय अभ्यास अधिकांशतः संभाव्यता सिद्धांत और इष्टतम निर्णय पर निर्भर करता है, उनका अनुप्रयोग विवादास्पद हो सकता है [4]

यह भी देखें

संदर्भ

  1. Kannan, D.; Lakshmikantham, V., eds. (2002). स्टोकेस्टिक विश्लेषण और अनुप्रयोगों की पुस्तिका. New York: M. Dekker. ISBN 0824706609.
  2. Schervish, Mark J. (1995). सांख्यिकी का सिद्धांत (Corr. 2nd print. ed.). New York: Springer. ISBN 0387945466.
  3. Freedman, D.A. (2005) Statistical Models: Theory and Practice, Cambridge University Press. ISBN 978-0-521-67105-7
  4. 4.0 4.1 Freedman, David A. (2010). Collier, David; Sekhon, Jasjeet S.; Stark, Philp B. (eds.). Statistical Models and Causal Inference: A Dialogue with the Social Sciences. Cambridge University Press. ISBN 978-0-521-12390-7.
  5. Hogg, R. V., A. Craig, and J. W. McKean. "Intro to Mathematical Statistics." (2005).
  6. Larsen, Richard J. and Marx, Morris L. "An Introduction to Mathematical Statistics and Its Applications" (2012). Prentice Hall.
  7. Upton, G., Cook, I. (2008) Oxford Dictionary of Statistics, OUP. ISBN 978-0-19-954145-4
  8. "गैर-पैरामीट्रिक तरीकों पर शोध करें". Carnegie Mellon University. Retrieved August 30, 2022.
  9. 9.0 9.1 "गैरपैरामीट्रिक परीक्षण". sphweb.bumc.bu.edu. Retrieved 2022-08-31.
  10. Wald, Abraham (1947). Sequential analysis. New York: John Wiley and Sons. ISBN 0-471-91806-7. See Dover reprint, 2004: ISBN 0-486-43912-7
  11. Wald, Abraham (1950). Statistical Decision Functions. John Wiley and Sons, New York.
  12. Lehmann, Erich (1997). सांख्यिकीय परिकल्पनाओं का परीक्षण (2nd ed.). ISBN 0-387-94919-4.
  13. Lehmann, Erich; Cassella, George (1998). Theory of Point Estimation (2nd ed.). ISBN 0-387-98502-6.
  14. Bickel, Peter J.; Doksum, Kjell A. (2001). Mathematical Statistics: Basic and Selected Topics. Vol. 1 (Second (updated printing 2007) ed.). Pearson Prentice-Hall.
  15. Le Cam, Lucien (1986). Asymptotic Methods in Statistical Decision Theory. Springer-Verlag. ISBN 0-387-96307-3.
  16. Liese, Friedrich & Miescke, Klaus-J. (2008). Statistical Decision Theory: Estimation, Testing, and Selection. Springer.

अग्रिम पठन