गणितीय सांख्यिकी: Difference between revisions
No edit summary |
m (8 revisions imported from alpha:गणितीय_सांख्यिकी) |
||
(5 intermediate revisions by 3 users not shown) | |||
Line 1: | Line 1: | ||
{{Short description|Branch of statistics}} | {{Short description|Branch of statistics}} | ||
[[Image:Linear regression.svg|thumb|right|300px|डेटा सेट पर रैखिक प्रतिगमन का चित्रण। [[प्रतिगमन विश्लेषण]] गणितीय सांख्यिकी का महत्वपूर्ण भाग है।]] | [[Image:Linear regression.svg|thumb|right|300px|डेटा सेट पर रैखिक प्रतिगमन का चित्रण। [[प्रतिगमन विश्लेषण]] गणितीय सांख्यिकी का महत्वपूर्ण भाग है।]]'''गणितीय सांख्यिकी''' सांख्यिकीय डेटा एकत्र करने की तकनीकों के विपरीत, संभाव्यता सिद्धांत, गणित की शाखा, का सांख्यिकी में अनुप्रयोग है। इस प्रकार इसके लिए जो विशिष्ट गणितीय तकनीकों का उपयोग किया जाता है उनमें [[गणितीय विश्लेषण]], रैखिक बीजगणित, [[स्टोकेस्टिक विश्लेषण]], अंतर समीकरण और [[माप सिद्धांत]] सम्मिलित हैं।<ref>{{cite book|editor1-last=Kannan|editor1-first=D.|editor2-last=Lakshmikantham|editor2-first=V.|title=स्टोकेस्टिक विश्लेषण और अनुप्रयोगों की पुस्तिका|date=2002|publisher=M. Dekker|location=New York|isbn=0824706609}}</ref><ref>{{cite book|last=Schervish|first=Mark J.|title=सांख्यिकी का सिद्धांत|date=1995|publisher=Springer|location=New York|isbn=0387945466|edition=Corr. 2nd print.}}</ref> | ||
'''गणितीय सांख्यिकी''' सांख्यिकीय डेटा एकत्र करने की तकनीकों के विपरीत, संभाव्यता सिद्धांत, गणित की शाखा, का सांख्यिकी में अनुप्रयोग है। इसके लिए जो विशिष्ट गणितीय तकनीकों का उपयोग किया जाता है उनमें [[गणितीय विश्लेषण]], रैखिक बीजगणित, [[स्टोकेस्टिक विश्लेषण]], अंतर समीकरण और [[माप सिद्धांत]] सम्मिलित हैं।<ref>{{cite book|editor1-last=Kannan|editor1-first=D.|editor2-last=Lakshmikantham|editor2-first=V.|title=स्टोकेस्टिक विश्लेषण और अनुप्रयोगों की पुस्तिका|date=2002|publisher=M. Dekker|location=New York|isbn=0824706609}}</ref><ref>{{cite book|last=Schervish|first=Mark J.|title=सांख्यिकी का सिद्धांत|date=1995|publisher=Springer|location=New York|isbn=0387945466|edition=Corr. 2nd print.}}</ref> | |||
==परिचय== | ==परिचय== | ||
सांख्यिकीय डेटा संग्रह का संबंध अध्ययन की योजना, विशेष रूप से प्रयोगों के डिजाइन और यादृच्छिक प्रारूप का उपयोग करके [[सांख्यिकीय सर्वेक्षण]] की योजना से है। डेटा का प्रारंभिक विश्लेषण अधिकांशतः अध्ययन किए जाने से पहले निर्दिष्ट अध्ययन प्रोटोकॉल का पालन करता है। किसी अध्ययन के डेटा का विश्लेषण प्रारंभिक परिणामों से प्रेरित माध्यमिक परिकल्पनाओं पर विचार करने या नए अध्ययनों का विचार देने के लिए भी किया जा सकता है। नियोजित अध्ययन से प्राप्त डेटा का द्वितीयक विश्लेषण [[डेटा विश्लेषण]] के उपकरणों का उपयोग करता है, और ऐसा करने की प्रक्रिया गणितीय सांख्यिकी हैं। | इस प्रकार सांख्यिकीय डेटा संग्रह का संबंध अध्ययन की योजना, विशेष रूप से प्रयोगों के डिजाइन और यादृच्छिक प्रारूप का उपयोग करके [[सांख्यिकीय सर्वेक्षण]] की योजना से है। डेटा का प्रारंभिक विश्लेषण अधिकांशतः अध्ययन किए जाने से पहले निर्दिष्ट अध्ययन प्रोटोकॉल का पालन करता है। इस प्रकार किसी अध्ययन के डेटा का विश्लेषण प्रारंभिक परिणामों से प्रेरित माध्यमिक परिकल्पनाओं पर विचार करने या नए अध्ययनों का विचार देने के लिए भी किया जा सकता है। नियोजित अध्ययन से प्राप्त डेटा का द्वितीयक विश्लेषण [[डेटा विश्लेषण]] के उपकरणों का उपयोग करता है, और ऐसा करने की प्रक्रिया गणितीय सांख्यिकी हैं। | ||
डेटा विश्लेषण को इसमें विभाजित किया गया है: | डेटा विश्लेषण को इसमें विभाजित किया गया है: | ||
Line 16: | Line 10: | ||
जबकि डेटा विश्लेषण के उपकरण यादृच्छिक अध्ययन से प्राप्त डेटा पर सबसे अच्छा कार्य करते हैं, वह अन्य प्रकार के डेटा पर भी प्रयुक्त होते हैं। उदाहरण के लिए, [[प्राकृतिक प्रयोग]] और अवलोकन संबंधी अध्ययनों से, इस स्थिति में अनुमान सांख्यिकीविद् द्वारा चुने गए मॉडल पर निर्भर होता है, और इसलिए सब्जेक्टिव होता है।<ref>[[David A. Freedman (statistician)|Freedman, D.A.]] (2005) ''Statistical Models: Theory and Practice'', Cambridge University Press. {{isbn|978-0-521-67105-7}}</ref><ref name=Freedman>{{cite book |last1=Freedman |first1=David A. |editor1-last=Collier |editor1-first=David |editor2-last=Sekhon |editor2-first=Jasjeet S. |editor3-last=Stark |editor3-first=Philp B. |title=Statistical Models and Causal Inference: A Dialogue with the Social Sciences |date=2010 |publisher=Cambridge University Press |isbn=978-0-521-12390-7 |url=http://www.cambridge.org/9780521123907}}</ref> | जबकि डेटा विश्लेषण के उपकरण यादृच्छिक अध्ययन से प्राप्त डेटा पर सबसे अच्छा कार्य करते हैं, वह अन्य प्रकार के डेटा पर भी प्रयुक्त होते हैं। उदाहरण के लिए, [[प्राकृतिक प्रयोग]] और अवलोकन संबंधी अध्ययनों से, इस स्थिति में अनुमान सांख्यिकीविद् द्वारा चुने गए मॉडल पर निर्भर होता है, और इसलिए सब्जेक्टिव होता है।<ref>[[David A. Freedman (statistician)|Freedman, D.A.]] (2005) ''Statistical Models: Theory and Practice'', Cambridge University Press. {{isbn|978-0-521-67105-7}}</ref><ref name=Freedman>{{cite book |last1=Freedman |first1=David A. |editor1-last=Collier |editor1-first=David |editor2-last=Sekhon |editor2-first=Jasjeet S. |editor3-last=Stark |editor3-first=Philp B. |title=Statistical Models and Causal Inference: A Dialogue with the Social Sciences |date=2010 |publisher=Cambridge University Press |isbn=978-0-521-12390-7 |url=http://www.cambridge.org/9780521123907}}</ref> | ||
==विषय== | ==विषय== | ||
गणितीय सांख्यिकी में कुछ महत्वपूर्ण विषय निम्नलिखित हैं:<ref>Hogg, R. V., A. Craig, and J. W. McKean. "Intro to Mathematical Statistics." (2005).</ref><ref>Larsen, Richard J. and Marx, Morris L. "An Introduction to Mathematical Statistics and Its Applications" (2012). Prentice Hall.</ref> | गणितीय सांख्यिकी में कुछ महत्वपूर्ण विषय निम्नलिखित हैं:<ref>Hogg, R. V., A. Craig, and J. W. McKean. "Intro to Mathematical Statistics." (2005).</ref><ref>Larsen, Richard J. and Marx, Morris L. "An Introduction to Mathematical Statistics and Its Applications" (2012). Prentice Hall.</ref> | ||
===संभाव्यता वितरण=== | ===संभाव्यता वितरण=== | ||
{{main|संभाव्यता वितरण}} | {{main|संभाव्यता वितरण}} | ||
संभाव्यता वितरण [[फ़ंक्शन (गणित)|फलन (गणित)]] है जो यादृच्छिक प्रयोग ([[संभावना|संभाव्यता]] सिद्धांत), [[सर्वेक्षण पद्धति]], या सांख्यिकीय अनुमान की प्रक्रिया के संभावित परिणामों के प्रत्येक [[माप (गणित)]] के लिए संभाव्यता प्रदान करता है। ऐसे प्रयोगों में उदाहरण पाए जाते हैं जिनका प्रारूप समष्टि गैर-संख्यात्मक है, जहां वितरण [[श्रेणीबद्ध वितरण]] होगा; ऐसे प्रयोग जिनका प्रारूप समष्टि असतत [[यादृच्छिक चर|यादृच्छिक]] वैरिएबल द्वारा एन्कोड किया गया है, जहां वितरण को संभाव्यता द्रव्यमान फलन द्वारा निर्दिष्ट किया जा सकता है; और निरंतर यादृच्छिक वैरिएबल द्वारा एन्कोड किए गए प्रारूप समष्टि के साथ प्रयोग, जहां वितरण को संभाव्यता घनत्व फलन द्वारा निर्दिष्ट किया जा सकता है। अधिक सम्मिश्र प्रयोग, जैसे कि [[निरंतर समय|सतत समय]] में परिभाषित स्टोकेस्टिक प्रक्रियाओं से जुड़े प्रयोग, अधिक सामान्य संभाव्यता उपायों के उपयोग की मांग कर सकते हैं। | इस प्रकार संभाव्यता वितरण [[फ़ंक्शन (गणित)|फलन (गणित)]] है जो यादृच्छिक प्रयोग ([[संभावना|संभाव्यता]] सिद्धांत), [[सर्वेक्षण पद्धति]], या सांख्यिकीय अनुमान की प्रक्रिया के संभावित परिणामों के प्रत्येक [[माप (गणित)]] के लिए संभाव्यता प्रदान करता है। ऐसे प्रयोगों में उदाहरण पाए जाते हैं जिनका प्रारूप समष्टि गैर-संख्यात्मक है, जहां वितरण [[श्रेणीबद्ध वितरण]] होगा; ऐसे प्रयोग जिनका प्रारूप समष्टि असतत [[यादृच्छिक चर|यादृच्छिक]] वैरिएबल द्वारा एन्कोड किया गया है, जहां वितरण को संभाव्यता द्रव्यमान फलन द्वारा निर्दिष्ट किया जा सकता है; और निरंतर यादृच्छिक वैरिएबल द्वारा एन्कोड किए गए प्रारूप समष्टि के साथ प्रयोग, जहां वितरण को संभाव्यता घनत्व फलन द्वारा निर्दिष्ट किया जा सकता है। इस प्रकार अधिक सम्मिश्र प्रयोग, जैसे कि [[निरंतर समय|सतत समय]] में परिभाषित स्टोकेस्टिक प्रक्रियाओं से जुड़े प्रयोग, अधिक सामान्य संभाव्यता उपायों के उपयोग की मांग कर सकते हैं। | ||
संभाव्यता वितरण या तो यूनीवेरिएट वितरण या [[बहुभिन्नरूपी वितरण|बहुविकल्पीय वितरण]] हो सकता है। [[अविभाज्य वितरण]] एकल यादृच्छिक वैरिएबल के विभिन्न वैकल्पिक मान लेने की संभाव्यताएँ देता है; बहुभिन्नरूपी वितरण ( [[संयुक्त संभाव्यता वितरण]]) [[यादृच्छिक वेक्टर|यादृच्छिक सदिश]] की संभाव्यताएं देता है - दो या दो से अधिक यादृच्छिक वैरिएबल का सेट - मानों के विभिन्न संयोजनों पर आधारित महत्वपूर्ण और समष्टि सामने आने वाले अविभाज्य संभाव्यता वितरण में [[द्विपद वितरण]], [[हाइपरज्यामितीय वितरण]] और [[सामान्य वितरण]] सम्मिलित हैं। [[बहुभिन्नरूपी सामान्य वितरण]] सामान्यतः पाया जाने वाला बहुभिन्नरूपी वितरण है। | इस प्रकार संभाव्यता वितरण या तो यूनीवेरिएट वितरण या [[बहुभिन्नरूपी वितरण|बहुविकल्पीय वितरण]] हो सकता है। इस प्रकार [[अविभाज्य वितरण]] एकल यादृच्छिक वैरिएबल के विभिन्न वैकल्पिक मान लेने की संभाव्यताएँ देता है; बहुभिन्नरूपी वितरण ( [[संयुक्त संभाव्यता वितरण]]) [[यादृच्छिक वेक्टर|यादृच्छिक सदिश]] की संभाव्यताएं देता है - दो या दो से अधिक यादृच्छिक वैरिएबल का सेट - मानों के विभिन्न संयोजनों पर आधारित महत्वपूर्ण और समष्टि सामने आने वाले अविभाज्य संभाव्यता वितरण में [[द्विपद वितरण]], [[हाइपरज्यामितीय वितरण]] और [[सामान्य वितरण]] सम्मिलित हैं। [[बहुभिन्नरूपी सामान्य वितरण]] सामान्यतः पाया जाने वाला बहुभिन्नरूपी वितरण है। | ||
====विशेष वितरण==== | ====विशेष वितरण==== | ||
*सामान्य वितरण सबसे सामान्य सतत वितरण है | *सामान्य वितरण सबसे सामान्य सतत वितरण है | ||
*[[बर्नौली वितरण]], एकल बर्नौली परीक्षण के परिणाम के लिए (जैसे सफलता/असफलता, हाँ/नहीं) | *इस प्रकार [[बर्नौली वितरण]], एकल बर्नौली परीक्षण के परिणाम के लिए (जैसे सफलता/असफलता, हाँ/नहीं) | ||
*[[स्वतंत्र (सांख्यिकी)]] घटनाओं की निश्चित कुल संख्या दी गई धनात्मक घटनाओं (जैसे सफलताएं, हां वोट इत्यादि) की संख्या के लिए द्विपद वितरण है | *[[स्वतंत्र (सांख्यिकी)]] घटनाओं की निश्चित कुल संख्या दी गई धनात्मक घटनाओं (जैसे सफलताएं, हां वोट इत्यादि) की संख्या के लिए द्विपद वितरण है | ||
*[[नकारात्मक द्विपद वितरण|ऋणात्मक द्विपद वितरण]], द्विपद-प्रकार के अवलोकनों के लिए किन्तु जहां ब्याज की मात्रा दी गई सफलताओं की संख्या होने से पहले विफलताओं की संख्या है | *इस प्रकार [[नकारात्मक द्विपद वितरण|ऋणात्मक द्विपद वितरण]], द्विपद-प्रकार के अवलोकनों के लिए किन्तु जहां ब्याज की मात्रा दी गई सफलताओं की संख्या होने से पहले विफलताओं की संख्या है | ||
*[[ज्यामितीय वितरण]], द्विपद-प्रकार के अवलोकनों के लिए, किन्तु जहां इंटरेस्ट की मात्रा पहली सफलता से पहले विफलताओं की संख्या है; ऋणात्मक द्विपद वितरण का विशेष मामला, जहां सफलताओं की संख्या है। | *इस प्रकार [[ज्यामितीय वितरण]], द्विपद-प्रकार के अवलोकनों के लिए, किन्तु जहां इंटरेस्ट की मात्रा पहली सफलता से पहले विफलताओं की संख्या है; ऋणात्मक द्विपद वितरण का विशेष मामला, जहां सफलताओं की संख्या है। | ||
* | *इस प्रकार मानो के सीमित सेट के लिए असतत समान वितरण है (उदाहरण के लिए निष्पक्ष पासे का परिणाम) | ||
*निरंतर वितरित | *निरंतर वितरित मानो के लिए निरंतर समान वितरण है | ||
*पॉइसन वितरण, किसी निश्चित समयावधि में पॉइसन-प्रकार की घटना की घटनाओं की संख्या के लिए है | *पॉइसन वितरण, किसी निश्चित समयावधि में पॉइसन-प्रकार की घटना की घटनाओं की संख्या के लिए है | ||
* | *इस प्रकार पॉइसन-प्रकार की घटना घटित होने से पहले के समय के लिए घातीय वितरण है | ||
*[[गामा वितरण]], पॉइसन-प्रकार की घटनाओं के घटित होने से पहले के समय के लिए | *[[गामा वितरण]], पॉइसन-प्रकार की घटनाओं के घटित होने से पहले के समय के लिए | ||
*[[ची-वर्ग वितरण]], वर्ग [[मानक सामान्य]] वैरिएबल के योग का वितरण है; उपयोगी उदाहरन सामान्य रूप से वितरित प्रारूपो के प्रारूप भिन्नता के संबंध में अनुमान के लिए (ची-स्क्वेर्ड परीक्षण देखें) | *[[ची-वर्ग वितरण]], वर्ग [[मानक सामान्य]] वैरिएबल के योग का वितरण है; उपयोगी उदाहरन सामान्य रूप से वितरित प्रारूपो के प्रारूप भिन्नता के संबंध में अनुमान के लिए (ची-स्क्वेर्ड परीक्षण देखें) | ||
*स्टूडेंट टी वितरण, मानक सामान्य वैरिएबल के अनुपात का वितरण और स्केल किए गए [[ची वर्ग वितरण]] वैरिएबल का वर्गमूल; अज्ञात विचरण के साथ सामान्य रूप से वितरित प्रारूपो के माध्य के बारे में अनुमान लगाने के लिए उपयोगी (स्टूडेंट टी-परीक्षण देखें) | *इस प्रकार स्टूडेंट टी वितरण, मानक सामान्य वैरिएबल के अनुपात का वितरण और स्केल किए गए [[ची वर्ग वितरण]] वैरिएबल का वर्गमूल; अज्ञात विचरण के साथ सामान्य रूप से वितरित प्रारूपो के माध्य के बारे में अनुमान लगाने के लिए उपयोगी (स्टूडेंट टी-परीक्षण देखें) | ||
*[[बीटा वितरण]], एकल संभाव्यता के लिए (0 और 1 के मध्य वास्तविक संख्या); बर्नौली वितरण और द्विपद वितरण से संयुग्मित है | *[[बीटा वितरण]], एकल संभाव्यता के लिए (0 और 1 के मध्य वास्तविक संख्या); बर्नौली वितरण और द्विपद वितरण से संयुग्मित है | ||
Line 46: | Line 36: | ||
{{main|सांख्यिकीय निष्कर्ष}} | {{main|सांख्यिकीय निष्कर्ष}} | ||
सांख्यिकीय अनुमान डेटा से निष्कर्ष निकालने की प्रक्रिया है जो यादृच्छिक भिन्नता के अधीन है, उदाहरण के लिए, अवलोकन संबंधी त्रुटियां या प्रारूप भिन्नता <ref name="Oxford">Upton, G., Cook, I. (2008) ''Oxford Dictionary of Statistics'', OUP. {{isbn|978-0-19-954145-4}}</ref> [[अनुमान]] और प्रेरक तर्क के लिए प्रक्रियाओं की ऐसी प्रणाली की प्रारंभिक आवश्यकताएं यह हैं कि प्रणाली को अच्छी तरह से परिभाषित स्थितियों पर प्रयुक्त होने पर उचित उत्तर देना चाहिए और यह विभिन्न स्थितियों में प्रयुक्त होने के लिए पर्याप्त सामान्य होना चाहिए। अनुमानित सांख्यिकी का उपयोग परिकल्पनाओं का परीक्षण करने और प्रारूप डेटा का उपयोग करके अनुमान लगाने के लिए किया जाता है। जबकि वर्णनात्मक सांख्यिकी प्रारूप का वर्णन करते हैं, अनुमानात्मक सांख्यिकी उस बड़ी जनसंख्या के बारे में पूर्वानुमान करते हैं जिसका प्रारूप प्रतिनिधित्व करता है। | इस प्रकार सांख्यिकीय अनुमान डेटा से निष्कर्ष निकालने की प्रक्रिया है जो यादृच्छिक भिन्नता के अधीन है, उदाहरण के लिए, अवलोकन संबंधी त्रुटियां या प्रारूप भिन्नता <ref name="Oxford">Upton, G., Cook, I. (2008) ''Oxford Dictionary of Statistics'', OUP. {{isbn|978-0-19-954145-4}}</ref> [[अनुमान]] और प्रेरक तर्क के लिए प्रक्रियाओं की ऐसी प्रणाली की प्रारंभिक आवश्यकताएं यह हैं कि प्रणाली को अच्छी तरह से परिभाषित स्थितियों पर प्रयुक्त होने पर उचित उत्तर देना चाहिए और यह विभिन्न स्थितियों में प्रयुक्त होने के लिए पर्याप्त सामान्य होना चाहिए। इस प्रकार अनुमानित सांख्यिकी का उपयोग परिकल्पनाओं का परीक्षण करने और प्रारूप डेटा का उपयोग करके अनुमान लगाने के लिए किया जाता है। जबकि वर्णनात्मक सांख्यिकी प्रारूप का वर्णन करते हैं, अनुमानात्मक सांख्यिकी उस बड़ी जनसंख्या के बारे में पूर्वानुमान करते हैं जिसका प्रारूप प्रतिनिधित्व करता है। | ||
सांख्यिकीय अनुमान का परिणाम इस प्रश्न का उत्तर हो सकता है कि आगे क्या किया जाना चाहिए? , जहां यह आगे के प्रयोग या सर्वेक्षण करने, या किसी संगठनात्मक या सरकारी नीति को प्रयुक्त करने से पहले निष्कर्ष निकालने के बारे में निर्णय हो सकता है। अधिकांश भाग के लिए, सांख्यिकीय अनुमान कुछ प्रकार के यादृच्छिक प्रारूप के माध्यम से इंटरेस्ट की जनसंख्या से निकाले गए डेटा का उपयोग करके जनसंख्या के बारे में प्रस्ताव देता है। अधिक सामान्यतः, यादृच्छिक प्रक्रिया के बारे में डेटा सीमित अवधि के समय उसके देखे गए व्यवहार से प्राप्त किया जाता है। किसी मापदंड या परिकल्पना को देखते हुए जिसके बारे में कोई अनुमान लगाना चाहता है, सांख्यिकीय अनुमान सबसे अधिक बार उपयोग किया जाता है: | इस प्रकार सांख्यिकीय अनुमान का परिणाम इस प्रश्न का उत्तर हो सकता है कि आगे क्या किया जाना चाहिए? , जहां यह आगे के प्रयोग या सर्वेक्षण करने, या किसी संगठनात्मक या सरकारी नीति को प्रयुक्त करने से पहले निष्कर्ष निकालने के बारे में निर्णय हो सकता है। अधिकांश भाग के लिए, सांख्यिकीय अनुमान कुछ प्रकार के यादृच्छिक प्रारूप के माध्यम से इंटरेस्ट की जनसंख्या से निकाले गए डेटा का उपयोग करके जनसंख्या के बारे में प्रस्ताव देता है। इस प्रकार अधिक सामान्यतः, यादृच्छिक प्रक्रिया के बारे में डेटा सीमित अवधि के समय उसके देखे गए व्यवहार से प्राप्त किया जाता है। किसी मापदंड या परिकल्पना को देखते हुए जिसके बारे में कोई अनुमान लगाना चाहता है, सांख्यिकीय अनुमान सबसे अधिक बार उपयोग किया जाता है: | ||
* यादृच्छिक प्रक्रिया का [[सांख्यिकीय मॉडल]] जो डेटा उत्पन्न करने वाला होता है, जिसे तब जाना जाता है जब यादृच्छिककरण का उपयोग किया गया हो, और | * इस प्रकार यादृच्छिक प्रक्रिया का [[सांख्यिकीय मॉडल]] जो डेटा उत्पन्न करने वाला होता है, जिसे तब जाना जाता है जब यादृच्छिककरण का उपयोग किया गया हो, और | ||
*यादृच्छिक प्रक्रिया का एक विशेष अनुभव अर्थात डेटा का एक सेट है। | *इस प्रकार यादृच्छिक प्रक्रिया का एक विशेष अनुभव अर्थात डेटा का एक सेट है। | ||
===प्रतिगमन=== | ===प्रतिगमन=== | ||
{{main|प्रतिगमन विश्लेषण}} | {{main|प्रतिगमन विश्लेषण}} | ||
सांख्यिकी में, प्रतिगमन विश्लेषण वैरिएबल के मध्य संबंधों का अनुमान लगाने के लिए सांख्यिकीय प्रक्रिया है। इसमें विभिन्न वैरिएबल के मॉडलिंग और विश्लेषण के विभिन्न विधि सम्मिलित हैं, जब फोकस डिपेन्डेन्ट वैरिएबल और या अधिक [[स्वतंत्र चर|स्वतंत्र]] वैरिएबल के मध्य संबंध पर होता है। अधिक विशेष रूप से, प्रतिगमन विश्लेषण यह समझने में सहायता करता है कि डिपेन्डेन्ट वैरिएबल (या 'मानदंड वैरिएबल') का विशिष्ट मूल्य कैसे परिवर्तित होता है जब किसी स्वतंत्र वैरिएबल में भिन्नता होती है, जबकि अन्य स्वतंत्र वैरिएबल स्थिर रहते हैं। सामान्यतः, प्रतिगमन विश्लेषण स्वतंत्र वैरिएबल को देखते हुए डिपेन्डेन्ट वैरिएबल की [[सशर्त अपेक्षा|नियमबद्ध अपेक्षा]] का अनुमान लगाता है - अर्थात, स्वतंत्र वैरिएबल तय होने पर डिपेन्डेन्ट वैरिएबल का [[औसत मूल्य]] सामान्यतः, ध्यान स्वतंत्र वैरिएबल को देखते हुए डिपेन्डेन्ट वैरिएबल के नियमबद्ध वितरण के [[ मात्रात्मक |मात्रात्मक]] या अन्य समष्टि [[पैरामीटर|मापदंड]] पर होता है। सभी स्थितियों में, अनुमान लक्ष्य स्वतंत्र वैरिएबल का फलन (गणित) है जिसे प्रतिगमन फलन कहा जाता है। प्रतिगमन विश्लेषण में, प्रतिगमन फलन के | इस प्रकार सांख्यिकी में, प्रतिगमन विश्लेषण वैरिएबल के मध्य संबंधों का अनुमान लगाने के लिए सांख्यिकीय प्रक्रिया है। इसमें विभिन्न वैरिएबल के मॉडलिंग और विश्लेषण के विभिन्न विधि सम्मिलित हैं, जब फोकस डिपेन्डेन्ट वैरिएबल और या अधिक [[स्वतंत्र चर|स्वतंत्र]] वैरिएबल के मध्य संबंध पर होता है। अधिक विशेष रूप से, प्रतिगमन विश्लेषण यह समझने में सहायता करता है कि डिपेन्डेन्ट वैरिएबल (या 'मानदंड वैरिएबल') का विशिष्ट मूल्य कैसे परिवर्तित होता है जब किसी स्वतंत्र वैरिएबल में भिन्नता होती है, जबकि अन्य स्वतंत्र वैरिएबल स्थिर रहते हैं। सामान्यतः, प्रतिगमन विश्लेषण स्वतंत्र वैरिएबल को देखते हुए डिपेन्डेन्ट वैरिएबल की [[सशर्त अपेक्षा|नियमबद्ध अपेक्षा]] का अनुमान लगाता है - अर्थात, स्वतंत्र वैरिएबल तय होने पर डिपेन्डेन्ट वैरिएबल का [[औसत मूल्य]] सामान्यतः, ध्यान स्वतंत्र वैरिएबल को देखते हुए डिपेन्डेन्ट वैरिएबल के नियमबद्ध वितरण के [[ मात्रात्मक |मात्रात्मक]] या अन्य समष्टि [[पैरामीटर|मापदंड]] पर होता है। सभी स्थितियों में, अनुमान लक्ष्य स्वतंत्र वैरिएबल का फलन (गणित) है जिसे प्रतिगमन फलन कहा जाता है। इस प्रकार प्रतिगमन विश्लेषण में, प्रतिगमन फलन के निकट डिपेन्डेन्ट वैरिएबल की भिन्नता को चिह्नित करना भी रोचक है जिसे संभाव्यता वितरण द्वारा वर्णित किया जा सकता है। | ||
प्रतिगमन विश्लेषण करने के लिए विभिन्न तकनीकें विकसित की गई हैं। परिचित विधियाँ, जैसे कि रैखिक प्रतिगमन, [[पैरामीट्रिक आँकड़े|पैरामीट्रिक]] सांख्यिकी हैं, जिसमें प्रतिगमन फलन को अज्ञात मापदंडों की सीमित संख्या के संदर्भ में परिभाषित किया जाता है जो [[डेटा]] से अनुमानित होते हैं (उदाहरण के लिए सामान्य न्यूनतम वर्गों का उपयोग करके)। [[गैरपैरामीट्रिक प्रतिगमन|नॉनपैरामीट्रिक प्रतिगमन]] उन तकनीकों को संदर्भित करता है जो प्रतिगमन फलन को फलन (गणित) के निर्दिष्ट सेट में असत्य बोलने की अनुमति देता है, जो [[आयाम]] या अनंत-आयामी हो सकता है। | इस प्रकार प्रतिगमन विश्लेषण करने के लिए विभिन्न तकनीकें विकसित की गई हैं। परिचित विधियाँ, जैसे कि रैखिक प्रतिगमन, [[पैरामीट्रिक आँकड़े|पैरामीट्रिक]] सांख्यिकी हैं, जिसमें प्रतिगमन फलन को अज्ञात मापदंडों की सीमित संख्या के संदर्भ में परिभाषित किया जाता है जो [[डेटा]] से अनुमानित होते हैं (उदाहरण के लिए सामान्य न्यूनतम वर्गों का उपयोग करके)। [[गैरपैरामीट्रिक प्रतिगमन|नॉनपैरामीट्रिक प्रतिगमन]] उन तकनीकों को संदर्भित करता है जो प्रतिगमन फलन को फलन (गणित) के निर्दिष्ट सेट में असत्य बोलने की अनुमति देता है, जो [[आयाम]] या अनंत-आयामी हो सकता है। | ||
===नॉनपैरामीट्रिक सांख्यिकी=== | ===नॉनपैरामीट्रिक सांख्यिकी=== | ||
{{main|नॉनपैरामीट्रिक सांख्यिकी}} | {{main|नॉनपैरामीट्रिक सांख्यिकी}} | ||
नॉन-पैरामीट्रिक सांख्यिकी डेटा से इस तरह से गणना किए गए मान हैं जो संभाव्यता वितरण के [[सांख्यिकीय पैरामीटर|सांख्यिकीय मापदंड]] वर्गों पर आधारित नहीं हैं। इनमें वर्णनात्मक सांख्यिकी और सांख्यिकीय अनुमान सांख्यिकी दोनों सम्मिलित हैं। विशिष्ट मापदंड माध्य, विचरण आदि हैं। पैरामीट्रिक सांख्यिकी के विपरीत, नॉन-पैरामीट्रिक सांख्यिकी मूल्यांकन किए जा रहे वैरिएबल के संभाव्यता वितरण के बारे में कोई धारणा नहीं बनाते हैं।<ref>{{Cite web |title=गैर-पैरामीट्रिक तरीकों पर शोध करें|url=https://d8.stat.cmu.edu/research-areas/nonparametric-methods |access-date=August 30, 2022 |website=Carnegie Mellon University}}</ref> | इस प्रकार नॉन-पैरामीट्रिक सांख्यिकी डेटा से इस तरह से गणना किए गए मान हैं जो संभाव्यता वितरण के [[सांख्यिकीय पैरामीटर|सांख्यिकीय मापदंड]] वर्गों पर आधारित नहीं हैं। इनमें वर्णनात्मक सांख्यिकी और सांख्यिकीय अनुमान सांख्यिकी दोनों सम्मिलित हैं। विशिष्ट मापदंड माध्य, विचरण आदि हैं। इस प्रकार पैरामीट्रिक सांख्यिकी के विपरीत, नॉन-पैरामीट्रिक सांख्यिकी मूल्यांकन किए जा रहे वैरिएबल के संभाव्यता वितरण के बारे में कोई धारणा नहीं बनाते हैं।<ref>{{Cite web |title=गैर-पैरामीट्रिक तरीकों पर शोध करें|url=https://d8.stat.cmu.edu/research-areas/nonparametric-methods |access-date=August 30, 2022 |website=Carnegie Mellon University}}</ref> | ||
नॉन-पैरामीट्रिक विधियों का व्यापक रूप से उन जनसंख्या का अध्ययन करने के लिए उपयोग किया जाता है जो क्रमबद्ध क्रम में होती हैं (जैसे कि से चार स्टार प्राप्त करने वाली फिल्म समीक्षा)। नॉन-पैरामीट्रिक विधियों का उपयोग तब आवश्यक हो सकता है जब डेटा की [[रैंकिंग]] हो किन्तु कोई स्पष्ट संख्यात्मक व्याख्या न हो, जैसे कि प्राथमिकताओं का आकलन करते समय माप के स्तर के संदर्भ में, नॉन-पैरामीट्रिक विधियों से क्रमिक डेटा प्राप्त होता है। | इस प्रकार नॉन-पैरामीट्रिक विधियों का व्यापक रूप से उन जनसंख्या का अध्ययन करने के लिए उपयोग किया जाता है जो क्रमबद्ध क्रम में होती हैं (जैसे कि से चार स्टार प्राप्त करने वाली फिल्म समीक्षा)। नॉन-पैरामीट्रिक विधियों का उपयोग तब आवश्यक हो सकता है जब डेटा की [[रैंकिंग]] हो किन्तु कोई स्पष्ट संख्यात्मक व्याख्या न हो, जैसे कि प्राथमिकताओं का आकलन करते समय माप के स्तर के संदर्भ में, नॉन-पैरामीट्रिक विधियों से क्रमिक डेटा प्राप्त होता है। | ||
चूंकि नॉन-पैरामीट्रिक विधियां कम धारणाएं बनाती हैं, इसलिए उनकी प्रयोज्यता संबंधित पैरामीट्रिक विधियों की तुलना में बहुत व्यापक है। विशेष रूप से, उन्हें उन स्थितियों में प्रयुक्त किया जा सकता है जहां प्रश्न में आवेदन के बारे में कम जानकारी है। साथ ही, कम मान्यताओं पर निर्भरता के कारण, नॉन-पैरामीट्रिक विधियाँ अधिक सशक्त सांख्यिकी परिचय हैं। | चूंकि नॉन-पैरामीट्रिक विधियां कम धारणाएं बनाती हैं, इसलिए उनकी प्रयोज्यता संबंधित पैरामीट्रिक विधियों की तुलना में बहुत व्यापक है। विशेष रूप से, उन्हें उन स्थितियों में प्रयुक्त किया जा सकता है जहां प्रश्न में आवेदन के बारे में कम जानकारी है। साथ ही, कम मान्यताओं पर निर्भरता के कारण, नॉन-पैरामीट्रिक विधियाँ अधिक सशक्त सांख्यिकी परिचय हैं। | ||
नॉन-पैरामीट्रिक विधियों का दोष यह है कि चूंकि वह मान्यताओं पर विश्वास नहीं करते हैं, इसलिए वह समष्टि अपने पैरामीट्रिक समकक्षों की तुलना में परीक्षण की कम शक्ति वाले होते हैं।<ref name=":0">{{Cite web |title=गैरपैरामीट्रिक परीक्षण|url=https://sphweb.bumc.bu.edu/otlt/MPH-Modules/BS/BS704_Nonparametric/BS704_Nonparametric_print.html |access-date=2022-08-31 |website=sphweb.bumc.bu.edu}}</ref> कम शक्ति वाले नॉन-पैरामीट्रिक परीक्षण समस्याग्रस्त हैं क्योंकि इन विधियों का सामान्य उपयोग तब होता है जब किसी प्रारूप का प्रारूप आकार कम होता है।<ref name=":0" /> नेमैन-पियर्सन लेम्मा और [[संभावना-अनुपात परीक्षण|संभाव्यता-अनुपात परीक्षण]] जैसी विधियों के माध्यम से विभिन्न पैरामीट्रिक विधियां सबसे शक्तिशाली परीक्षण सिद्ध हुई हैं। | इस प्रकार नॉन-पैरामीट्रिक विधियों का दोष यह है कि चूंकि वह मान्यताओं पर विश्वास नहीं करते हैं, इसलिए वह समष्टि अपने पैरामीट्रिक समकक्षों की तुलना में परीक्षण की कम शक्ति वाले होते हैं।<ref name=":0">{{Cite web |title=गैरपैरामीट्रिक परीक्षण|url=https://sphweb.bumc.bu.edu/otlt/MPH-Modules/BS/BS704_Nonparametric/BS704_Nonparametric_print.html |access-date=2022-08-31 |website=sphweb.bumc.bu.edu}}</ref> कम शक्ति वाले नॉन-पैरामीट्रिक परीक्षण समस्याग्रस्त हैं क्योंकि इन विधियों का सामान्य उपयोग तब होता है जब किसी प्रारूप का प्रारूप आकार कम होता है।<ref name=":0" /> नेमैन-पियर्सन लेम्मा और [[संभावना-अनुपात परीक्षण|संभाव्यता-अनुपात परीक्षण]] जैसी विधियों के माध्यम से विभिन्न पैरामीट्रिक विधियां सबसे शक्तिशाली परीक्षण सिद्ध हुई हैं। | ||
नॉन-पैरामीट्रिक विधियों के उपयोग का अन्य औचित्य सरलता है। कुछ स्थितियों में, तथापि पैरामीट्रिक विधियों का उपयोग उचित हो, नॉन-पैरामीट्रिक विधियों का उपयोग करना सरल हो सकता है। इस सरलता और उनकी अधिक सशक्त दोनों के कारण, कुछ सांख्यिकीविदों द्वारा नॉन-पैरामीट्रिक विधियों को अनुचित उपयोग और गलतफहमी के लिए कम समष्टि छोड़ने के रूप में देखा जाता है। | इस प्रकार नॉन-पैरामीट्रिक विधियों के उपयोग का अन्य औचित्य सरलता है। कुछ स्थितियों में, तथापि पैरामीट्रिक विधियों का उपयोग उचित हो, नॉन-पैरामीट्रिक विधियों का उपयोग करना सरल हो सकता है। इस सरलता और उनकी अधिक सशक्त दोनों के कारण, कुछ सांख्यिकीविदों द्वारा नॉन-पैरामीट्रिक विधियों को अनुचित उपयोग और गलतफहमी के लिए कम समष्टि छोड़ने के रूप में देखा जाता है। | ||
==सांख्यिकी, गणित, और गणितीय सांख्यिकी== | ==सांख्यिकी, गणित, और गणितीय सांख्यिकी== | ||
गणितीय सांख्यिकी सांख्यिकी के अनुशासन का प्रमुख उपसमुच्चय है। सांख्यिकीविद् गणित के साथ सांख्यिकीय प्रक्रियाओं का अध्ययन और सुधार करते हैं, और सांख्यिकीय अनुसंधान अधिकांशतः गणितीय प्रश्न उठाते हैं। | इस प्रकार गणितीय सांख्यिकी सांख्यिकी के अनुशासन का प्रमुख उपसमुच्चय है। सांख्यिकीविद् गणित के साथ सांख्यिकीय प्रक्रियाओं का अध्ययन और सुधार करते हैं, और सांख्यिकीय अनुसंधान अधिकांशतः गणितीय प्रश्न उठाते हैं। | ||
[[गॉस]], [[लाप्लास]] और चार्ल्स सैंडर्स पीयर्स | इस प्रकार [[गॉस]], [[लाप्लास]] और चार्ल्स सैंडर्स पीयर्स या सी जैसे गणितज्ञ और सांख्यिकीविद् एस. पीयर्स ने संभाव्यता वितरण और हानि कार्यों (या उपयोगिता कार्यों) के साथ [[इष्टतम निर्णय]] का उपयोग किया था। सांख्यिकीय अनुमान के लिए निर्णय-सैद्धांतिक दृष्टिकोण को [[ इब्राहीम का जन्म हुआ |इब्राहीम का जन्म हुआ]] और उनके उत्तराधिकारियों द्वारा पुनर्जीवित किया गया था,<ref>{{Cite book | ||
| first = Abraham | | first = Abraham | ||
| last = Wald |author-link=Abraham Wald | | last = Wald |author-link=Abraham Wald | ||
Line 123: | Line 113: | ||
|publisher=Springer | |publisher=Springer | ||
}} | }} | ||
</ref> और [[वैज्ञानिक कंप्यूटिंग]], गणितीय विश्लेषण और [[अनुकूलन (गणित)]] का व्यापक उपयोग करता है; प्रयोगों के डिज़ाइन के लिए, सांख्यिकीविद् बीजगणितीय सांख्यिकी और संयोजनात्मक डिज़ाइन का उपयोग करते हैं। किन्तु जबकि सांख्यिकीय अभ्यास अधिकांशतः संभाव्यता सिद्धांत और इष्टतम निर्णय पर निर्भर करता है, उनका अनुप्रयोग विवादास्पद हो सकता है <ref name=Freedman/> | </ref> और [[वैज्ञानिक कंप्यूटिंग]], गणितीय विश्लेषण और [[अनुकूलन (गणित)]] का व्यापक उपयोग करता है; इस प्रकार प्रयोगों के डिज़ाइन के लिए, सांख्यिकीविद् बीजगणितीय सांख्यिकी और संयोजनात्मक डिज़ाइन का उपयोग करते हैं। किन्तु जबकि सांख्यिकीय अभ्यास अधिकांशतः संभाव्यता सिद्धांत और इष्टतम निर्णय पर निर्भर करता है, उनका अनुप्रयोग विवादास्पद हो सकता है <ref name=Freedman/> | ||
==यह भी देखें{{portal|Mathematics}}== | ==यह भी देखें{{portal|Mathematics}}== | ||
*[[स्पर्शोन्मुख सिद्धांत (सांख्यिकी)|असममित सिद्धांत (सांख्यिकी)]] | *[[स्पर्शोन्मुख सिद्धांत (सांख्यिकी)|असममित सिद्धांत (सांख्यिकी)]] | ||
Line 131: | Line 119: | ||
==संदर्भ== | ==संदर्भ== | ||
<references/> | <references/> | ||
== अग्रिम पठन == | == अग्रिम पठन == | ||
* [[Aleksandr Alekseevich Borovkov|Borovkov, A. A.]] (1999). ''Mathematical Statistics''. CRC Press. {{isbn|90-5699-018-7}} | * [[Aleksandr Alekseevich Borovkov|Borovkov, A. A.]] (1999). ''Mathematical Statistics''. CRC Press. {{isbn|90-5699-018-7}} | ||
Line 138: | Line 124: | ||
* [http://www.trigonella.ch/statibot/english/ StatiBot], interactive online expert system on statistical tests. | * [http://www.trigonella.ch/statibot/english/ StatiBot], interactive online expert system on statistical tests. | ||
* {{Cite book|last1=Ray|first1=Manohar|url=https://books.google.com/books?id=NXGpYgEACAAJ|title=Mathematical Statistics|last2=Sharma|first2=Har Swarup|date=1966|publisher=Ram Prasad & Sons}} {{ISBN|978-9383385188}} | * {{Cite book|last1=Ray|first1=Manohar|url=https://books.google.com/books?id=NXGpYgEACAAJ|title=Mathematical Statistics|last2=Sharma|first2=Har Swarup|date=1966|publisher=Ram Prasad & Sons}} {{ISBN|978-9383385188}} | ||
[[Category:Articles with hatnote templates targeting a nonexistent page|Mathematical Statistics]] | |||
[[Category:Created On 30/11/2023|Mathematical Statistics]] | |||
[[Category:Machine Translated Page|Mathematical Statistics]] | |||
[[Category:Pages with empty portal template|Mathematical Statistics]] | |||
[[Category:Pages with script errors|Short description/doc]] | |||
[[Category:Portal-inline template with redlinked portals|Mathematical Statistics]] | |||
[[Category: | [[Category:Portal templates with redlinked portals|Mathematical Statistics]] | ||
[[Category: | [[Category:Short description with empty Wikidata description|Mathematical Statistics]] | ||
[[Category:Template documentation pages|Short description/doc]] | |||
[[Category:Templates Translated in Hindi|Mathematical Statistics]] | |||
[[Category:Vigyan Ready]] |
Latest revision as of 10:50, 11 December 2023
गणितीय सांख्यिकी सांख्यिकीय डेटा एकत्र करने की तकनीकों के विपरीत, संभाव्यता सिद्धांत, गणित की शाखा, का सांख्यिकी में अनुप्रयोग है। इस प्रकार इसके लिए जो विशिष्ट गणितीय तकनीकों का उपयोग किया जाता है उनमें गणितीय विश्लेषण, रैखिक बीजगणित, स्टोकेस्टिक विश्लेषण, अंतर समीकरण और माप सिद्धांत सम्मिलित हैं।[1][2]
परिचय
इस प्रकार सांख्यिकीय डेटा संग्रह का संबंध अध्ययन की योजना, विशेष रूप से प्रयोगों के डिजाइन और यादृच्छिक प्रारूप का उपयोग करके सांख्यिकीय सर्वेक्षण की योजना से है। डेटा का प्रारंभिक विश्लेषण अधिकांशतः अध्ययन किए जाने से पहले निर्दिष्ट अध्ययन प्रोटोकॉल का पालन करता है। इस प्रकार किसी अध्ययन के डेटा का विश्लेषण प्रारंभिक परिणामों से प्रेरित माध्यमिक परिकल्पनाओं पर विचार करने या नए अध्ययनों का विचार देने के लिए भी किया जा सकता है। नियोजित अध्ययन से प्राप्त डेटा का द्वितीयक विश्लेषण डेटा विश्लेषण के उपकरणों का उपयोग करता है, और ऐसा करने की प्रक्रिया गणितीय सांख्यिकी हैं।
डेटा विश्लेषण को इसमें विभाजित किया गया है:
- वर्णनात्मक सांख्यिकी - सांख्यिकी का वह भाग जो डेटा का वर्णन करता है, अर्थात डेटा और उनके विशिष्ट गुणों का सारांश देता है।
- अनुमानात्मक सांख्यिकी - सांख्यिकी का वह भाग जो डेटा से निष्कर्ष निकालता है (डेटा के लिए कुछ मॉडल का उपयोग करके): उदाहरण के लिए, अनुमानात्मक सांख्यिकी में डेटा के लिए मॉडल का चयन करता है, यह जाँचना कि क्या डेटा किसी विशेष मॉडल की नियमो को पूर्ण करता है, और मात्रा निर्धारित करना सम्मिलित है इसमें सम्मिलित अनिश्चितता (उदाहरण के लिए कॉन्फिडेंस अंतराल का उपयोग करना)।
जबकि डेटा विश्लेषण के उपकरण यादृच्छिक अध्ययन से प्राप्त डेटा पर सबसे अच्छा कार्य करते हैं, वह अन्य प्रकार के डेटा पर भी प्रयुक्त होते हैं। उदाहरण के लिए, प्राकृतिक प्रयोग और अवलोकन संबंधी अध्ययनों से, इस स्थिति में अनुमान सांख्यिकीविद् द्वारा चुने गए मॉडल पर निर्भर होता है, और इसलिए सब्जेक्टिव होता है।[3][4]
विषय
गणितीय सांख्यिकी में कुछ महत्वपूर्ण विषय निम्नलिखित हैं:[5][6]
संभाव्यता वितरण
इस प्रकार संभाव्यता वितरण फलन (गणित) है जो यादृच्छिक प्रयोग (संभाव्यता सिद्धांत), सर्वेक्षण पद्धति, या सांख्यिकीय अनुमान की प्रक्रिया के संभावित परिणामों के प्रत्येक माप (गणित) के लिए संभाव्यता प्रदान करता है। ऐसे प्रयोगों में उदाहरण पाए जाते हैं जिनका प्रारूप समष्टि गैर-संख्यात्मक है, जहां वितरण श्रेणीबद्ध वितरण होगा; ऐसे प्रयोग जिनका प्रारूप समष्टि असतत यादृच्छिक वैरिएबल द्वारा एन्कोड किया गया है, जहां वितरण को संभाव्यता द्रव्यमान फलन द्वारा निर्दिष्ट किया जा सकता है; और निरंतर यादृच्छिक वैरिएबल द्वारा एन्कोड किए गए प्रारूप समष्टि के साथ प्रयोग, जहां वितरण को संभाव्यता घनत्व फलन द्वारा निर्दिष्ट किया जा सकता है। इस प्रकार अधिक सम्मिश्र प्रयोग, जैसे कि सतत समय में परिभाषित स्टोकेस्टिक प्रक्रियाओं से जुड़े प्रयोग, अधिक सामान्य संभाव्यता उपायों के उपयोग की मांग कर सकते हैं।
इस प्रकार संभाव्यता वितरण या तो यूनीवेरिएट वितरण या बहुविकल्पीय वितरण हो सकता है। इस प्रकार अविभाज्य वितरण एकल यादृच्छिक वैरिएबल के विभिन्न वैकल्पिक मान लेने की संभाव्यताएँ देता है; बहुभिन्नरूपी वितरण ( संयुक्त संभाव्यता वितरण) यादृच्छिक सदिश की संभाव्यताएं देता है - दो या दो से अधिक यादृच्छिक वैरिएबल का सेट - मानों के विभिन्न संयोजनों पर आधारित महत्वपूर्ण और समष्टि सामने आने वाले अविभाज्य संभाव्यता वितरण में द्विपद वितरण, हाइपरज्यामितीय वितरण और सामान्य वितरण सम्मिलित हैं। बहुभिन्नरूपी सामान्य वितरण सामान्यतः पाया जाने वाला बहुभिन्नरूपी वितरण है।
विशेष वितरण
- सामान्य वितरण सबसे सामान्य सतत वितरण है
- इस प्रकार बर्नौली वितरण, एकल बर्नौली परीक्षण के परिणाम के लिए (जैसे सफलता/असफलता, हाँ/नहीं)
- स्वतंत्र (सांख्यिकी) घटनाओं की निश्चित कुल संख्या दी गई धनात्मक घटनाओं (जैसे सफलताएं, हां वोट इत्यादि) की संख्या के लिए द्विपद वितरण है
- इस प्रकार ऋणात्मक द्विपद वितरण, द्विपद-प्रकार के अवलोकनों के लिए किन्तु जहां ब्याज की मात्रा दी गई सफलताओं की संख्या होने से पहले विफलताओं की संख्या है
- इस प्रकार ज्यामितीय वितरण, द्विपद-प्रकार के अवलोकनों के लिए, किन्तु जहां इंटरेस्ट की मात्रा पहली सफलता से पहले विफलताओं की संख्या है; ऋणात्मक द्विपद वितरण का विशेष मामला, जहां सफलताओं की संख्या है।
- इस प्रकार मानो के सीमित सेट के लिए असतत समान वितरण है (उदाहरण के लिए निष्पक्ष पासे का परिणाम)
- निरंतर वितरित मानो के लिए निरंतर समान वितरण है
- पॉइसन वितरण, किसी निश्चित समयावधि में पॉइसन-प्रकार की घटना की घटनाओं की संख्या के लिए है
- इस प्रकार पॉइसन-प्रकार की घटना घटित होने से पहले के समय के लिए घातीय वितरण है
- गामा वितरण, पॉइसन-प्रकार की घटनाओं के घटित होने से पहले के समय के लिए
- ची-वर्ग वितरण, वर्ग मानक सामान्य वैरिएबल के योग का वितरण है; उपयोगी उदाहरन सामान्य रूप से वितरित प्रारूपो के प्रारूप भिन्नता के संबंध में अनुमान के लिए (ची-स्क्वेर्ड परीक्षण देखें)
- इस प्रकार स्टूडेंट टी वितरण, मानक सामान्य वैरिएबल के अनुपात का वितरण और स्केल किए गए ची वर्ग वितरण वैरिएबल का वर्गमूल; अज्ञात विचरण के साथ सामान्य रूप से वितरित प्रारूपो के माध्य के बारे में अनुमान लगाने के लिए उपयोगी (स्टूडेंट टी-परीक्षण देखें)
- बीटा वितरण, एकल संभाव्यता के लिए (0 और 1 के मध्य वास्तविक संख्या); बर्नौली वितरण और द्विपद वितरण से संयुग्मित है
सांख्यिकीय अनुमान
इस प्रकार सांख्यिकीय अनुमान डेटा से निष्कर्ष निकालने की प्रक्रिया है जो यादृच्छिक भिन्नता के अधीन है, उदाहरण के लिए, अवलोकन संबंधी त्रुटियां या प्रारूप भिन्नता [7] अनुमान और प्रेरक तर्क के लिए प्रक्रियाओं की ऐसी प्रणाली की प्रारंभिक आवश्यकताएं यह हैं कि प्रणाली को अच्छी तरह से परिभाषित स्थितियों पर प्रयुक्त होने पर उचित उत्तर देना चाहिए और यह विभिन्न स्थितियों में प्रयुक्त होने के लिए पर्याप्त सामान्य होना चाहिए। इस प्रकार अनुमानित सांख्यिकी का उपयोग परिकल्पनाओं का परीक्षण करने और प्रारूप डेटा का उपयोग करके अनुमान लगाने के लिए किया जाता है। जबकि वर्णनात्मक सांख्यिकी प्रारूप का वर्णन करते हैं, अनुमानात्मक सांख्यिकी उस बड़ी जनसंख्या के बारे में पूर्वानुमान करते हैं जिसका प्रारूप प्रतिनिधित्व करता है।
इस प्रकार सांख्यिकीय अनुमान का परिणाम इस प्रश्न का उत्तर हो सकता है कि आगे क्या किया जाना चाहिए? , जहां यह आगे के प्रयोग या सर्वेक्षण करने, या किसी संगठनात्मक या सरकारी नीति को प्रयुक्त करने से पहले निष्कर्ष निकालने के बारे में निर्णय हो सकता है। अधिकांश भाग के लिए, सांख्यिकीय अनुमान कुछ प्रकार के यादृच्छिक प्रारूप के माध्यम से इंटरेस्ट की जनसंख्या से निकाले गए डेटा का उपयोग करके जनसंख्या के बारे में प्रस्ताव देता है। इस प्रकार अधिक सामान्यतः, यादृच्छिक प्रक्रिया के बारे में डेटा सीमित अवधि के समय उसके देखे गए व्यवहार से प्राप्त किया जाता है। किसी मापदंड या परिकल्पना को देखते हुए जिसके बारे में कोई अनुमान लगाना चाहता है, सांख्यिकीय अनुमान सबसे अधिक बार उपयोग किया जाता है:
- इस प्रकार यादृच्छिक प्रक्रिया का सांख्यिकीय मॉडल जो डेटा उत्पन्न करने वाला होता है, जिसे तब जाना जाता है जब यादृच्छिककरण का उपयोग किया गया हो, और
- इस प्रकार यादृच्छिक प्रक्रिया का एक विशेष अनुभव अर्थात डेटा का एक सेट है।
प्रतिगमन
इस प्रकार सांख्यिकी में, प्रतिगमन विश्लेषण वैरिएबल के मध्य संबंधों का अनुमान लगाने के लिए सांख्यिकीय प्रक्रिया है। इसमें विभिन्न वैरिएबल के मॉडलिंग और विश्लेषण के विभिन्न विधि सम्मिलित हैं, जब फोकस डिपेन्डेन्ट वैरिएबल और या अधिक स्वतंत्र वैरिएबल के मध्य संबंध पर होता है। अधिक विशेष रूप से, प्रतिगमन विश्लेषण यह समझने में सहायता करता है कि डिपेन्डेन्ट वैरिएबल (या 'मानदंड वैरिएबल') का विशिष्ट मूल्य कैसे परिवर्तित होता है जब किसी स्वतंत्र वैरिएबल में भिन्नता होती है, जबकि अन्य स्वतंत्र वैरिएबल स्थिर रहते हैं। सामान्यतः, प्रतिगमन विश्लेषण स्वतंत्र वैरिएबल को देखते हुए डिपेन्डेन्ट वैरिएबल की नियमबद्ध अपेक्षा का अनुमान लगाता है - अर्थात, स्वतंत्र वैरिएबल तय होने पर डिपेन्डेन्ट वैरिएबल का औसत मूल्य सामान्यतः, ध्यान स्वतंत्र वैरिएबल को देखते हुए डिपेन्डेन्ट वैरिएबल के नियमबद्ध वितरण के मात्रात्मक या अन्य समष्टि मापदंड पर होता है। सभी स्थितियों में, अनुमान लक्ष्य स्वतंत्र वैरिएबल का फलन (गणित) है जिसे प्रतिगमन फलन कहा जाता है। इस प्रकार प्रतिगमन विश्लेषण में, प्रतिगमन फलन के निकट डिपेन्डेन्ट वैरिएबल की भिन्नता को चिह्नित करना भी रोचक है जिसे संभाव्यता वितरण द्वारा वर्णित किया जा सकता है।
इस प्रकार प्रतिगमन विश्लेषण करने के लिए विभिन्न तकनीकें विकसित की गई हैं। परिचित विधियाँ, जैसे कि रैखिक प्रतिगमन, पैरामीट्रिक सांख्यिकी हैं, जिसमें प्रतिगमन फलन को अज्ञात मापदंडों की सीमित संख्या के संदर्भ में परिभाषित किया जाता है जो डेटा से अनुमानित होते हैं (उदाहरण के लिए सामान्य न्यूनतम वर्गों का उपयोग करके)। नॉनपैरामीट्रिक प्रतिगमन उन तकनीकों को संदर्भित करता है जो प्रतिगमन फलन को फलन (गणित) के निर्दिष्ट सेट में असत्य बोलने की अनुमति देता है, जो आयाम या अनंत-आयामी हो सकता है।
नॉनपैरामीट्रिक सांख्यिकी
इस प्रकार नॉन-पैरामीट्रिक सांख्यिकी डेटा से इस तरह से गणना किए गए मान हैं जो संभाव्यता वितरण के सांख्यिकीय मापदंड वर्गों पर आधारित नहीं हैं। इनमें वर्णनात्मक सांख्यिकी और सांख्यिकीय अनुमान सांख्यिकी दोनों सम्मिलित हैं। विशिष्ट मापदंड माध्य, विचरण आदि हैं। इस प्रकार पैरामीट्रिक सांख्यिकी के विपरीत, नॉन-पैरामीट्रिक सांख्यिकी मूल्यांकन किए जा रहे वैरिएबल के संभाव्यता वितरण के बारे में कोई धारणा नहीं बनाते हैं।[8]
इस प्रकार नॉन-पैरामीट्रिक विधियों का व्यापक रूप से उन जनसंख्या का अध्ययन करने के लिए उपयोग किया जाता है जो क्रमबद्ध क्रम में होती हैं (जैसे कि से चार स्टार प्राप्त करने वाली फिल्म समीक्षा)। नॉन-पैरामीट्रिक विधियों का उपयोग तब आवश्यक हो सकता है जब डेटा की रैंकिंग हो किन्तु कोई स्पष्ट संख्यात्मक व्याख्या न हो, जैसे कि प्राथमिकताओं का आकलन करते समय माप के स्तर के संदर्भ में, नॉन-पैरामीट्रिक विधियों से क्रमिक डेटा प्राप्त होता है।
चूंकि नॉन-पैरामीट्रिक विधियां कम धारणाएं बनाती हैं, इसलिए उनकी प्रयोज्यता संबंधित पैरामीट्रिक विधियों की तुलना में बहुत व्यापक है। विशेष रूप से, उन्हें उन स्थितियों में प्रयुक्त किया जा सकता है जहां प्रश्न में आवेदन के बारे में कम जानकारी है। साथ ही, कम मान्यताओं पर निर्भरता के कारण, नॉन-पैरामीट्रिक विधियाँ अधिक सशक्त सांख्यिकी परिचय हैं।
इस प्रकार नॉन-पैरामीट्रिक विधियों का दोष यह है कि चूंकि वह मान्यताओं पर विश्वास नहीं करते हैं, इसलिए वह समष्टि अपने पैरामीट्रिक समकक्षों की तुलना में परीक्षण की कम शक्ति वाले होते हैं।[9] कम शक्ति वाले नॉन-पैरामीट्रिक परीक्षण समस्याग्रस्त हैं क्योंकि इन विधियों का सामान्य उपयोग तब होता है जब किसी प्रारूप का प्रारूप आकार कम होता है।[9] नेमैन-पियर्सन लेम्मा और संभाव्यता-अनुपात परीक्षण जैसी विधियों के माध्यम से विभिन्न पैरामीट्रिक विधियां सबसे शक्तिशाली परीक्षण सिद्ध हुई हैं।
इस प्रकार नॉन-पैरामीट्रिक विधियों के उपयोग का अन्य औचित्य सरलता है। कुछ स्थितियों में, तथापि पैरामीट्रिक विधियों का उपयोग उचित हो, नॉन-पैरामीट्रिक विधियों का उपयोग करना सरल हो सकता है। इस सरलता और उनकी अधिक सशक्त दोनों के कारण, कुछ सांख्यिकीविदों द्वारा नॉन-पैरामीट्रिक विधियों को अनुचित उपयोग और गलतफहमी के लिए कम समष्टि छोड़ने के रूप में देखा जाता है।
सांख्यिकी, गणित, और गणितीय सांख्यिकी
इस प्रकार गणितीय सांख्यिकी सांख्यिकी के अनुशासन का प्रमुख उपसमुच्चय है। सांख्यिकीविद् गणित के साथ सांख्यिकीय प्रक्रियाओं का अध्ययन और सुधार करते हैं, और सांख्यिकीय अनुसंधान अधिकांशतः गणितीय प्रश्न उठाते हैं।
इस प्रकार गॉस, लाप्लास और चार्ल्स सैंडर्स पीयर्स या सी जैसे गणितज्ञ और सांख्यिकीविद् एस. पीयर्स ने संभाव्यता वितरण और हानि कार्यों (या उपयोगिता कार्यों) के साथ इष्टतम निर्णय का उपयोग किया था। सांख्यिकीय अनुमान के लिए निर्णय-सैद्धांतिक दृष्टिकोण को इब्राहीम का जन्म हुआ और उनके उत्तराधिकारियों द्वारा पुनर्जीवित किया गया था,[10][11][12][13][14][15][16] और वैज्ञानिक कंप्यूटिंग, गणितीय विश्लेषण और अनुकूलन (गणित) का व्यापक उपयोग करता है; इस प्रकार प्रयोगों के डिज़ाइन के लिए, सांख्यिकीविद् बीजगणितीय सांख्यिकी और संयोजनात्मक डिज़ाइन का उपयोग करते हैं। किन्तु जबकि सांख्यिकीय अभ्यास अधिकांशतः संभाव्यता सिद्धांत और इष्टतम निर्णय पर निर्भर करता है, उनका अनुप्रयोग विवादास्पद हो सकता है [4]
यह भी देखें
संदर्भ
- ↑ Kannan, D.; Lakshmikantham, V., eds. (2002). स्टोकेस्टिक विश्लेषण और अनुप्रयोगों की पुस्तिका. New York: M. Dekker. ISBN 0824706609.
- ↑ Schervish, Mark J. (1995). सांख्यिकी का सिद्धांत (Corr. 2nd print. ed.). New York: Springer. ISBN 0387945466.
- ↑ Freedman, D.A. (2005) Statistical Models: Theory and Practice, Cambridge University Press. ISBN 978-0-521-67105-7
- ↑ 4.0 4.1 Freedman, David A. (2010). Collier, David; Sekhon, Jasjeet S.; Stark, Philp B. (eds.). Statistical Models and Causal Inference: A Dialogue with the Social Sciences. Cambridge University Press. ISBN 978-0-521-12390-7.
- ↑ Hogg, R. V., A. Craig, and J. W. McKean. "Intro to Mathematical Statistics." (2005).
- ↑ Larsen, Richard J. and Marx, Morris L. "An Introduction to Mathematical Statistics and Its Applications" (2012). Prentice Hall.
- ↑ Upton, G., Cook, I. (2008) Oxford Dictionary of Statistics, OUP. ISBN 978-0-19-954145-4
- ↑ "गैर-पैरामीट्रिक तरीकों पर शोध करें". Carnegie Mellon University. Retrieved August 30, 2022.
- ↑ 9.0 9.1 "गैरपैरामीट्रिक परीक्षण". sphweb.bumc.bu.edu. Retrieved 2022-08-31.
- ↑ Wald, Abraham (1947). Sequential analysis. New York: John Wiley and Sons. ISBN 0-471-91806-7.
See Dover reprint, 2004: ISBN 0-486-43912-7
- ↑ Wald, Abraham (1950). Statistical Decision Functions. John Wiley and Sons, New York.
- ↑ Lehmann, Erich (1997). सांख्यिकीय परिकल्पनाओं का परीक्षण (2nd ed.). ISBN 0-387-94919-4.
- ↑ Lehmann, Erich; Cassella, George (1998). Theory of Point Estimation (2nd ed.). ISBN 0-387-98502-6.
- ↑ Bickel, Peter J.; Doksum, Kjell A. (2001). Mathematical Statistics: Basic and Selected Topics. Vol. 1 (Second (updated printing 2007) ed.). Pearson Prentice-Hall.
- ↑ Le Cam, Lucien (1986). Asymptotic Methods in Statistical Decision Theory. Springer-Verlag. ISBN 0-387-96307-3.
- ↑ Liese, Friedrich & Miescke, Klaus-J. (2008). Statistical Decision Theory: Estimation, Testing, and Selection. Springer.
अग्रिम पठन
- Borovkov, A. A. (1999). Mathematical Statistics. CRC Press. ISBN 90-5699-018-7
- Virtual Laboratories in Probability and Statistics (Univ. of Ala.-Huntsville)
- StatiBot, interactive online expert system on statistical tests.
- Ray, Manohar; Sharma, Har Swarup (1966). Mathematical Statistics. Ram Prasad & Sons. ISBN 978-9383385188