गणितीय सांख्यिकी: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 4: Line 4:
{{Math topics TOC}}
{{Math topics TOC}}


'''गणितीय सांख्यिकी''' सांख्यिकीय डेटा एकत्र करने की तकनीकों के विपरीत, संभाव्यता सिद्धांत, गणित की शाखा, का सांख्यिकी में अनुप्रयोग है। इसके लिए जो विशिष्ट गणितीय तकनीकों का उपयोग किया जाता है उनमें [[गणितीय विश्लेषण]], रैखिक बीजगणित, [[स्टोकेस्टिक विश्लेषण]], अंतर समीकरण और [[माप सिद्धांत]] सम्मिलित हैं।<ref>{{cite book|editor1-last=Kannan|editor1-first=D.|editor2-last=Lakshmikantham|editor2-first=V.|title=स्टोकेस्टिक विश्लेषण और अनुप्रयोगों की पुस्तिका|date=2002|publisher=M. Dekker|location=New York|isbn=0824706609}}</ref><ref>{{cite book|last=Schervish|first=Mark J.|title=सांख्यिकी का सिद्धांत|date=1995|publisher=Springer|location=New York|isbn=0387945466|edition=Corr. 2nd print.}}</ref>
'''गणितीय सांख्यिकी''' सांख्यिकीय डेटा एकत्र करने की तकनीकों के विपरीत, संभाव्यता सिद्धांत, गणित की शाखा, का सांख्यिकी में अनुप्रयोग है। इस प्रकार इसके लिए जो विशिष्ट गणितीय तकनीकों का उपयोग किया जाता है उनमें [[गणितीय विश्लेषण]], रैखिक बीजगणित, [[स्टोकेस्टिक विश्लेषण]], अंतर समीकरण और [[माप सिद्धांत]] सम्मिलित हैं।<ref>{{cite book|editor1-last=Kannan|editor1-first=D.|editor2-last=Lakshmikantham|editor2-first=V.|title=स्टोकेस्टिक विश्लेषण और अनुप्रयोगों की पुस्तिका|date=2002|publisher=M. Dekker|location=New York|isbn=0824706609}}</ref><ref>{{cite book|last=Schervish|first=Mark J.|title=सांख्यिकी का सिद्धांत|date=1995|publisher=Springer|location=New York|isbn=0387945466|edition=Corr. 2nd print.}}</ref>
 
 
==परिचय==
==परिचय==
सांख्यिकीय डेटा संग्रह का संबंध अध्ययन की योजना, विशेष रूप से प्रयोगों के डिजाइन और यादृच्छिक प्रारूप का उपयोग करके [[सांख्यिकीय सर्वेक्षण]] की योजना से है। डेटा का प्रारंभिक विश्लेषण अधिकांशतः अध्ययन किए जाने से पहले निर्दिष्ट अध्ययन प्रोटोकॉल का पालन करता है। किसी अध्ययन के डेटा का विश्लेषण प्रारंभिक परिणामों से प्रेरित माध्यमिक परिकल्पनाओं पर विचार करने या नए अध्ययनों का विचार देने के लिए भी किया जा सकता है। नियोजित अध्ययन से प्राप्त डेटा का द्वितीयक विश्लेषण [[डेटा विश्लेषण]] के उपकरणों का उपयोग करता है, और ऐसा करने की प्रक्रिया गणितीय सांख्यिकी हैं।
इस प्रकार सांख्यिकीय डेटा संग्रह का संबंध अध्ययन की योजना, विशेष रूप से प्रयोगों के डिजाइन और यादृच्छिक प्रारूप का उपयोग करके [[सांख्यिकीय सर्वेक्षण]] की योजना से है। डेटा का प्रारंभिक विश्लेषण अधिकांशतः अध्ययन किए जाने से पहले निर्दिष्ट अध्ययन प्रोटोकॉल का पालन करता है। इस प्रकार किसी अध्ययन के डेटा का विश्लेषण प्रारंभिक परिणामों से प्रेरित माध्यमिक परिकल्पनाओं पर विचार करने या नए अध्ययनों का विचार देने के लिए भी किया जा सकता है। नियोजित अध्ययन से प्राप्त डेटा का द्वितीयक विश्लेषण [[डेटा विश्लेषण]] के उपकरणों का उपयोग करता है, और ऐसा करने की प्रक्रिया गणितीय सांख्यिकी हैं।


डेटा विश्लेषण को इसमें विभाजित किया गया है:
डेटा विश्लेषण को इसमें विभाजित किया गया है:
Line 16: Line 14:


जबकि डेटा विश्लेषण के उपकरण यादृच्छिक अध्ययन से प्राप्त डेटा पर सबसे अच्छा कार्य करते हैं, वह अन्य प्रकार के डेटा पर भी प्रयुक्त होते हैं। उदाहरण के लिए, [[प्राकृतिक प्रयोग]] और अवलोकन संबंधी अध्ययनों से, इस स्थिति में अनुमान सांख्यिकीविद् द्वारा चुने गए मॉडल पर निर्भर होता है, और इसलिए सब्जेक्टिव होता है।<ref>[[David A. Freedman (statistician)|Freedman, D.A.]] (2005) ''Statistical Models: Theory and Practice'', Cambridge University Press. {{isbn|978-0-521-67105-7}}</ref><ref name=Freedman>{{cite book |last1=Freedman |first1=David A. |editor1-last=Collier |editor1-first=David |editor2-last=Sekhon |editor2-first=Jasjeet S. |editor3-last=Stark |editor3-first=Philp B. |title=Statistical Models and Causal Inference: A Dialogue with the Social Sciences |date=2010 |publisher=Cambridge University Press |isbn=978-0-521-12390-7 |url=http://www.cambridge.org/9780521123907}}</ref>
जबकि डेटा विश्लेषण के उपकरण यादृच्छिक अध्ययन से प्राप्त डेटा पर सबसे अच्छा कार्य करते हैं, वह अन्य प्रकार के डेटा पर भी प्रयुक्त होते हैं। उदाहरण के लिए, [[प्राकृतिक प्रयोग]] और अवलोकन संबंधी अध्ययनों से, इस स्थिति में अनुमान सांख्यिकीविद् द्वारा चुने गए मॉडल पर निर्भर होता है, और इसलिए सब्जेक्टिव होता है।<ref>[[David A. Freedman (statistician)|Freedman, D.A.]] (2005) ''Statistical Models: Theory and Practice'', Cambridge University Press. {{isbn|978-0-521-67105-7}}</ref><ref name=Freedman>{{cite book |last1=Freedman |first1=David A. |editor1-last=Collier |editor1-first=David |editor2-last=Sekhon |editor2-first=Jasjeet S. |editor3-last=Stark |editor3-first=Philp B. |title=Statistical Models and Causal Inference: A Dialogue with the Social Sciences |date=2010 |publisher=Cambridge University Press |isbn=978-0-521-12390-7 |url=http://www.cambridge.org/9780521123907}}</ref>
==विषय==
==विषय==
गणितीय सांख्यिकी में कुछ महत्वपूर्ण विषय निम्नलिखित हैं:<ref>Hogg, R. V., A. Craig, and J. W. McKean. "Intro to Mathematical Statistics." (2005).</ref><ref>Larsen, Richard J. and Marx, Morris L. "An Introduction to Mathematical Statistics and Its Applications" (2012). Prentice Hall.</ref>
गणितीय सांख्यिकी में कुछ महत्वपूर्ण विषय निम्नलिखित हैं:<ref>Hogg, R. V., A. Craig, and J. W. McKean. "Intro to Mathematical Statistics." (2005).</ref><ref>Larsen, Richard J. and Marx, Morris L. "An Introduction to Mathematical Statistics and Its Applications" (2012). Prentice Hall.</ref>
===संभाव्यता वितरण===
===संभाव्यता वितरण===
{{main|संभाव्यता वितरण}}
{{main|संभाव्यता वितरण}}
संभाव्यता वितरण [[फ़ंक्शन (गणित)|फलन (गणित)]] है जो यादृच्छिक प्रयोग ([[संभावना|संभाव्यता]] सिद्धांत), [[सर्वेक्षण पद्धति]], या सांख्यिकीय अनुमान की प्रक्रिया के संभावित परिणामों के प्रत्येक [[माप (गणित)]] के लिए संभाव्यता प्रदान करता है। ऐसे प्रयोगों में उदाहरण पाए जाते हैं जिनका प्रारूप समष्टि गैर-संख्यात्मक है, जहां वितरण [[श्रेणीबद्ध वितरण]] होगा; ऐसे प्रयोग जिनका प्रारूप समष्टि असतत [[यादृच्छिक चर|यादृच्छिक]] वैरिएबल द्वारा एन्कोड किया गया है, जहां वितरण को संभाव्यता द्रव्यमान फलन द्वारा निर्दिष्ट किया जा सकता है; और निरंतर यादृच्छिक वैरिएबल द्वारा एन्कोड किए गए प्रारूप समष्टि के साथ प्रयोग, जहां वितरण को संभाव्यता घनत्व फलन द्वारा निर्दिष्ट किया जा सकता है। अधिक सम्मिश्र प्रयोग, जैसे कि [[निरंतर समय|सतत समय]] में परिभाषित स्टोकेस्टिक प्रक्रियाओं से जुड़े प्रयोग, अधिक सामान्य संभाव्यता उपायों के उपयोग की मांग कर सकते हैं।
इस प्रकार संभाव्यता वितरण [[फ़ंक्शन (गणित)|फलन (गणित)]] है जो यादृच्छिक प्रयोग ([[संभावना|संभाव्यता]] सिद्धांत), [[सर्वेक्षण पद्धति]], या सांख्यिकीय अनुमान की प्रक्रिया के संभावित परिणामों के प्रत्येक [[माप (गणित)]] के लिए संभाव्यता प्रदान करता है। ऐसे प्रयोगों में उदाहरण पाए जाते हैं जिनका प्रारूप समष्टि गैर-संख्यात्मक है, जहां वितरण [[श्रेणीबद्ध वितरण]] होगा; ऐसे प्रयोग जिनका प्रारूप समष्टि असतत [[यादृच्छिक चर|यादृच्छिक]] वैरिएबल द्वारा एन्कोड किया गया है, जहां वितरण को संभाव्यता द्रव्यमान फलन द्वारा निर्दिष्ट किया जा सकता है; और निरंतर यादृच्छिक वैरिएबल द्वारा एन्कोड किए गए प्रारूप समष्टि के साथ प्रयोग, जहां वितरण को संभाव्यता घनत्व फलन द्वारा निर्दिष्ट किया जा सकता है। इस प्रकार अधिक सम्मिश्र प्रयोग, जैसे कि [[निरंतर समय|सतत समय]] में परिभाषित स्टोकेस्टिक प्रक्रियाओं से जुड़े प्रयोग, अधिक सामान्य संभाव्यता उपायों के उपयोग की मांग कर सकते हैं।


संभाव्यता वितरण या तो यूनीवेरिएट वितरण या [[बहुभिन्नरूपी वितरण|बहुविकल्पीय वितरण]] हो सकता है। [[अविभाज्य वितरण]] एकल यादृच्छिक वैरिएबल के विभिन्न वैकल्पिक मान लेने की संभाव्यताएँ देता है; बहुभिन्नरूपी वितरण ( [[संयुक्त संभाव्यता वितरण]]) [[यादृच्छिक वेक्टर|यादृच्छिक सदिश]] की संभाव्यताएं देता है - दो या दो से अधिक यादृच्छिक वैरिएबल का सेट - मानों के विभिन्न संयोजनों पर आधारित महत्वपूर्ण और समष्टि सामने आने वाले अविभाज्य संभाव्यता वितरण में [[द्विपद वितरण]], [[हाइपरज्यामितीय वितरण]] और [[सामान्य वितरण]] सम्मिलित हैं। [[बहुभिन्नरूपी सामान्य वितरण]] सामान्यतः पाया जाने वाला बहुभिन्नरूपी वितरण है।
इस प्रकार संभाव्यता वितरण या तो यूनीवेरिएट वितरण या [[बहुभिन्नरूपी वितरण|बहुविकल्पीय वितरण]] हो सकता है। इस प्रकार [[अविभाज्य वितरण]] एकल यादृच्छिक वैरिएबल के विभिन्न वैकल्पिक मान लेने की संभाव्यताएँ देता है; बहुभिन्नरूपी वितरण ( [[संयुक्त संभाव्यता वितरण]]) [[यादृच्छिक वेक्टर|यादृच्छिक सदिश]] की संभाव्यताएं देता है - दो या दो से अधिक यादृच्छिक वैरिएबल का सेट - मानों के विभिन्न संयोजनों पर आधारित महत्वपूर्ण और समष्टि सामने आने वाले अविभाज्य संभाव्यता वितरण में [[द्विपद वितरण]], [[हाइपरज्यामितीय वितरण]] और [[सामान्य वितरण]] सम्मिलित हैं। [[बहुभिन्नरूपी सामान्य वितरण]] सामान्यतः पाया जाने वाला बहुभिन्नरूपी वितरण है।


====विशेष वितरण====
====विशेष वितरण====
*सामान्य वितरण सबसे सामान्य सतत वितरण है
*सामान्य वितरण सबसे सामान्य सतत वितरण है
*[[बर्नौली वितरण]], एकल बर्नौली परीक्षण के परिणाम के लिए (जैसे सफलता/असफलता, हाँ/नहीं)
*इस प्रकार [[बर्नौली वितरण]], एकल बर्नौली परीक्षण के परिणाम के लिए (जैसे सफलता/असफलता, हाँ/नहीं)
*[[स्वतंत्र (सांख्यिकी)]] घटनाओं की निश्चित कुल संख्या दी गई धनात्मक घटनाओं (जैसे सफलताएं, हां वोट इत्यादि) की संख्या के लिए द्विपद वितरण है
*[[स्वतंत्र (सांख्यिकी)]] घटनाओं की निश्चित कुल संख्या दी गई धनात्मक घटनाओं (जैसे सफलताएं, हां वोट इत्यादि) की संख्या के लिए द्विपद वितरण है
*[[नकारात्मक द्विपद वितरण|ऋणात्मक द्विपद वितरण]], द्विपद-प्रकार के अवलोकनों के लिए किन्तु जहां ब्याज की मात्रा दी गई सफलताओं की संख्या होने से पहले विफलताओं की संख्या है
*इस प्रकार [[नकारात्मक द्विपद वितरण|ऋणात्मक द्विपद वितरण]], द्विपद-प्रकार के अवलोकनों के लिए किन्तु जहां ब्याज की मात्रा दी गई सफलताओं की संख्या होने से पहले विफलताओं की संख्या है
*[[ज्यामितीय वितरण]], द्विपद-प्रकार के अवलोकनों के लिए, किन्तु जहां इंटरेस्ट की मात्रा पहली सफलता से पहले विफलताओं की संख्या है; ऋणात्मक द्विपद वितरण का विशेष मामला, जहां सफलताओं की संख्या है।
*इस प्रकार [[ज्यामितीय वितरण]], द्विपद-प्रकार के अवलोकनों के लिए, किन्तु जहां इंटरेस्ट की मात्रा पहली सफलता से पहले विफलताओं की संख्या है; ऋणात्मक द्विपद वितरण का विशेष मामला, जहां सफलताओं की संख्या है।
*मूल्यों के सीमित सेट के लिए असतत समान वितरण है (उदाहरण के लिए निष्पक्ष पासे का परिणाम)
*इस प्रकार मानो के सीमित सेट के लिए असतत समान वितरण है (उदाहरण के लिए निष्पक्ष पासे का परिणाम)
*निरंतर वितरित मूल्यों के लिए निरंतर समान वितरण है
*निरंतर वितरित मानो के लिए निरंतर समान वितरण है
*पॉइसन वितरण, किसी निश्चित समयावधि में पॉइसन-प्रकार की घटना की घटनाओं की संख्या के लिए है
*पॉइसन वितरण, किसी निश्चित समयावधि में पॉइसन-प्रकार की घटना की घटनाओं की संख्या के लिए है
*अगली पॉइसन-प्रकार की घटना घटित होने से पहले के समय के लिए घातीय वितरण है
*इस प्रकार पॉइसन-प्रकार की घटना घटित होने से पहले के समय के लिए घातीय वितरण है
*[[गामा वितरण]], पॉइसन-प्रकार की घटनाओं के घटित होने से पहले के समय के लिए
*[[गामा वितरण]], पॉइसन-प्रकार की घटनाओं के घटित होने से पहले के समय के लिए
*[[ची-वर्ग वितरण]], वर्ग [[मानक सामान्य]] वैरिएबल के योग का वितरण है; उपयोगी उदाहरन सामान्य रूप से वितरित प्रारूपो के प्रारूप भिन्नता के संबंध में अनुमान के लिए (ची-स्क्वेर्ड परीक्षण देखें)
*[[ची-वर्ग वितरण]], वर्ग [[मानक सामान्य]] वैरिएबल के योग का वितरण है; उपयोगी उदाहरन सामान्य रूप से वितरित प्रारूपो के प्रारूप भिन्नता के संबंध में अनुमान के लिए (ची-स्क्वेर्ड परीक्षण देखें)
*स्टूडेंट टी वितरण, मानक सामान्य वैरिएबल के अनुपात का वितरण और स्केल किए गए [[ची वर्ग वितरण]] वैरिएबल का वर्गमूल; अज्ञात विचरण के साथ सामान्य रूप से वितरित प्रारूपो के माध्य के बारे में अनुमान लगाने के लिए उपयोगी (स्टूडेंट टी-परीक्षण देखें)
*इस प्रकार स्टूडेंट टी वितरण, मानक सामान्य वैरिएबल के अनुपात का वितरण और स्केल किए गए [[ची वर्ग वितरण]] वैरिएबल का वर्गमूल; अज्ञात विचरण के साथ सामान्य रूप से वितरित प्रारूपो के माध्य के बारे में अनुमान लगाने के लिए उपयोगी (स्टूडेंट टी-परीक्षण देखें)
*[[बीटा वितरण]], एकल संभाव्यता के लिए (0 और 1 के मध्य वास्तविक संख्या); बर्नौली वितरण और द्विपद वितरण से संयुग्मित है
*[[बीटा वितरण]], एकल संभाव्यता के लिए (0 और 1 के मध्य वास्तविक संख्या); बर्नौली वितरण और द्विपद वितरण से संयुग्मित है


Line 46: Line 40:
{{main|सांख्यिकीय निष्कर्ष}}
{{main|सांख्यिकीय निष्कर्ष}}


सांख्यिकीय अनुमान डेटा से निष्कर्ष निकालने की प्रक्रिया है जो यादृच्छिक भिन्नता के अधीन है, उदाहरण के लिए, अवलोकन संबंधी त्रुटियां या प्रारूप भिन्नता <ref name="Oxford">Upton, G., Cook, I. (2008) ''Oxford Dictionary of Statistics'', OUP. {{isbn|978-0-19-954145-4}}</ref> [[अनुमान]] और प्रेरक तर्क के लिए प्रक्रियाओं की ऐसी प्रणाली की प्रारंभिक आवश्यकताएं यह हैं कि प्रणाली को अच्छी तरह से परिभाषित स्थितियों पर प्रयुक्त होने पर उचित उत्तर देना चाहिए और यह विभिन्न स्थितियों में प्रयुक्त होने के लिए पर्याप्त सामान्य होना चाहिए। अनुमानित सांख्यिकी का उपयोग परिकल्पनाओं का परीक्षण करने और प्रारूप डेटा का उपयोग करके अनुमान लगाने के लिए किया जाता है। जबकि वर्णनात्मक सांख्यिकी प्रारूप का वर्णन करते हैं, अनुमानात्मक सांख्यिकी उस बड़ी जनसंख्या के बारे में पूर्वानुमान करते हैं जिसका प्रारूप प्रतिनिधित्व करता है।
इस प्रकार सांख्यिकीय अनुमान डेटा से निष्कर्ष निकालने की प्रक्रिया है जो यादृच्छिक भिन्नता के अधीन है, उदाहरण के लिए, अवलोकन संबंधी त्रुटियां या प्रारूप भिन्नता <ref name="Oxford">Upton, G., Cook, I. (2008) ''Oxford Dictionary of Statistics'', OUP. {{isbn|978-0-19-954145-4}}</ref> [[अनुमान]] और प्रेरक तर्क के लिए प्रक्रियाओं की ऐसी प्रणाली की प्रारंभिक आवश्यकताएं यह हैं कि प्रणाली को अच्छी तरह से परिभाषित स्थितियों पर प्रयुक्त होने पर उचित उत्तर देना चाहिए और यह विभिन्न स्थितियों में प्रयुक्त होने के लिए पर्याप्त सामान्य होना चाहिए। इस प्रकार अनुमानित सांख्यिकी का उपयोग परिकल्पनाओं का परीक्षण करने और प्रारूप डेटा का उपयोग करके अनुमान लगाने के लिए किया जाता है। जबकि वर्णनात्मक सांख्यिकी प्रारूप का वर्णन करते हैं, अनुमानात्मक सांख्यिकी उस बड़ी जनसंख्या के बारे में पूर्वानुमान करते हैं जिसका प्रारूप प्रतिनिधित्व करता है।


सांख्यिकीय अनुमान का परिणाम इस प्रश्न का उत्तर हो सकता है कि आगे क्या किया जाना चाहिए? , जहां यह आगे के प्रयोग या सर्वेक्षण करने, या किसी संगठनात्मक या सरकारी नीति को प्रयुक्त करने से पहले निष्कर्ष निकालने के बारे में निर्णय हो सकता है। अधिकांश भाग के लिए, सांख्यिकीय अनुमान कुछ प्रकार के यादृच्छिक प्रारूप के माध्यम से इंटरेस्ट की जनसंख्या से निकाले गए डेटा का उपयोग करके जनसंख्या के बारे में प्रस्ताव देता है। अधिक सामान्यतः, यादृच्छिक प्रक्रिया के बारे में डेटा सीमित अवधि के समय उसके देखे गए व्यवहार से प्राप्त किया जाता है। किसी मापदंड या परिकल्पना को देखते हुए जिसके बारे में कोई अनुमान लगाना चाहता है, सांख्यिकीय अनुमान सबसे अधिक बार उपयोग किया जाता है:
इस प्रकार सांख्यिकीय अनुमान का परिणाम इस प्रश्न का उत्तर हो सकता है कि आगे क्या किया जाना चाहिए? , जहां यह आगे के प्रयोग या सर्वेक्षण करने, या किसी संगठनात्मक या सरकारी नीति को प्रयुक्त करने से पहले निष्कर्ष निकालने के बारे में निर्णय हो सकता है। अधिकांश भाग के लिए, सांख्यिकीय अनुमान कुछ प्रकार के यादृच्छिक प्रारूप के माध्यम से इंटरेस्ट की जनसंख्या से निकाले गए डेटा का उपयोग करके जनसंख्या के बारे में प्रस्ताव देता है। इस प्रकार अधिक सामान्यतः, यादृच्छिक प्रक्रिया के बारे में डेटा सीमित अवधि के समय उसके देखे गए व्यवहार से प्राप्त किया जाता है। किसी मापदंड या परिकल्पना को देखते हुए जिसके बारे में कोई अनुमान लगाना चाहता है, सांख्यिकीय अनुमान सबसे अधिक बार उपयोग किया जाता है:
* यादृच्छिक प्रक्रिया का [[सांख्यिकीय मॉडल]] जो डेटा उत्पन्न करने वाला होता है, जिसे तब जाना जाता है जब यादृच्छिककरण का उपयोग किया गया हो, और
* इस प्रकार यादृच्छिक प्रक्रिया का [[सांख्यिकीय मॉडल]] जो डेटा उत्पन्न करने वाला होता है, जिसे तब जाना जाता है जब यादृच्छिककरण का उपयोग किया गया हो, और
*यादृच्छिक प्रक्रिया का एक विशेष अनुभव अर्थात डेटा का एक सेट है।
*इस प्रकार यादृच्छिक प्रक्रिया का एक विशेष अनुभव अर्थात डेटा का एक सेट है।


===प्रतिगमन===
===प्रतिगमन===
{{main|प्रतिगमन विश्लेषण}}
{{main|प्रतिगमन विश्लेषण}}


सांख्यिकी में, प्रतिगमन विश्लेषण वैरिएबल के मध्य संबंधों का अनुमान लगाने के लिए सांख्यिकीय प्रक्रिया है। इसमें विभिन्न वैरिएबल के मॉडलिंग और विश्लेषण के विभिन्न विधि सम्मिलित हैं, जब फोकस डिपेन्डेन्ट वैरिएबल और या अधिक [[स्वतंत्र चर|स्वतंत्र]] वैरिएबल के मध्य संबंध पर होता है। अधिक विशेष रूप से, प्रतिगमन विश्लेषण यह समझने में सहायता करता है कि डिपेन्डेन्ट वैरिएबल (या 'मानदंड वैरिएबल') का विशिष्ट मूल्य कैसे परिवर्तित होता है जब किसी स्वतंत्र वैरिएबल में भिन्नता होती है, जबकि अन्य स्वतंत्र वैरिएबल स्थिर रहते हैं। सामान्यतः, प्रतिगमन विश्लेषण स्वतंत्र वैरिएबल को देखते हुए डिपेन्डेन्ट वैरिएबल की [[सशर्त अपेक्षा|नियमबद्ध अपेक्षा]] का अनुमान लगाता है - अर्थात, स्वतंत्र वैरिएबल तय होने पर डिपेन्डेन्ट वैरिएबल का [[औसत मूल्य]] सामान्यतः, ध्यान स्वतंत्र वैरिएबल को देखते हुए डिपेन्डेन्ट वैरिएबल के नियमबद्ध वितरण के [[ मात्रात्मक |मात्रात्मक]] या अन्य समष्टि [[पैरामीटर|मापदंड]] पर होता है। सभी स्थितियों में, अनुमान लक्ष्य स्वतंत्र वैरिएबल का फलन (गणित) है जिसे प्रतिगमन फलन कहा जाता है। प्रतिगमन विश्लेषण में, प्रतिगमन फलन के आसपास डिपेन्डेन्ट वैरिएबल की भिन्नता को चिह्नित करना भी रोचक है जिसे संभाव्यता वितरण द्वारा वर्णित किया जा सकता है।
इस प्रकार सांख्यिकी में, प्रतिगमन विश्लेषण वैरिएबल के मध्य संबंधों का अनुमान लगाने के लिए सांख्यिकीय प्रक्रिया है। इसमें विभिन्न वैरिएबल के मॉडलिंग और विश्लेषण के विभिन्न विधि सम्मिलित हैं, जब फोकस डिपेन्डेन्ट वैरिएबल और या अधिक [[स्वतंत्र चर|स्वतंत्र]] वैरिएबल के मध्य संबंध पर होता है। अधिक विशेष रूप से, प्रतिगमन विश्लेषण यह समझने में सहायता करता है कि डिपेन्डेन्ट वैरिएबल (या 'मानदंड वैरिएबल') का विशिष्ट मूल्य कैसे परिवर्तित होता है जब किसी स्वतंत्र वैरिएबल में भिन्नता होती है, जबकि अन्य स्वतंत्र वैरिएबल स्थिर रहते हैं। सामान्यतः, प्रतिगमन विश्लेषण स्वतंत्र वैरिएबल को देखते हुए डिपेन्डेन्ट वैरिएबल की [[सशर्त अपेक्षा|नियमबद्ध अपेक्षा]] का अनुमान लगाता है - अर्थात, स्वतंत्र वैरिएबल तय होने पर डिपेन्डेन्ट वैरिएबल का [[औसत मूल्य]] सामान्यतः, ध्यान स्वतंत्र वैरिएबल को देखते हुए डिपेन्डेन्ट वैरिएबल के नियमबद्ध वितरण के [[ मात्रात्मक |मात्रात्मक]] या अन्य समष्टि [[पैरामीटर|मापदंड]] पर होता है। सभी स्थितियों में, अनुमान लक्ष्य स्वतंत्र वैरिएबल का फलन (गणित) है जिसे प्रतिगमन फलन कहा जाता है। इस प्रकार प्रतिगमन विश्लेषण में, प्रतिगमन फलन के निकट डिपेन्डेन्ट वैरिएबल की भिन्नता को चिह्नित करना भी रोचक है जिसे संभाव्यता वितरण द्वारा वर्णित किया जा सकता है।


प्रतिगमन विश्लेषण करने के लिए विभिन्न तकनीकें विकसित की गई हैं। परिचित विधियाँ, जैसे कि रैखिक प्रतिगमन, [[पैरामीट्रिक आँकड़े|पैरामीट्रिक]] सांख्यिकी हैं, जिसमें प्रतिगमन फलन को अज्ञात मापदंडों की सीमित संख्या के संदर्भ में परिभाषित किया जाता है जो [[डेटा]] से अनुमानित होते हैं (उदाहरण के लिए सामान्य न्यूनतम वर्गों का उपयोग करके)। [[गैरपैरामीट्रिक प्रतिगमन|नॉनपैरामीट्रिक प्रतिगमन]] उन तकनीकों को संदर्भित करता है जो प्रतिगमन फलन को फलन (गणित) के निर्दिष्ट सेट में असत्य बोलने की अनुमति देता है, जो [[आयाम]] या अनंत-आयामी हो सकता है।
इस प्रकार प्रतिगमन विश्लेषण करने के लिए विभिन्न तकनीकें विकसित की गई हैं। परिचित विधियाँ, जैसे कि रैखिक प्रतिगमन, [[पैरामीट्रिक आँकड़े|पैरामीट्रिक]] सांख्यिकी हैं, जिसमें प्रतिगमन फलन को अज्ञात मापदंडों की सीमित संख्या के संदर्भ में परिभाषित किया जाता है जो [[डेटा]] से अनुमानित होते हैं (उदाहरण के लिए सामान्य न्यूनतम वर्गों का उपयोग करके)। [[गैरपैरामीट्रिक प्रतिगमन|नॉनपैरामीट्रिक प्रतिगमन]] उन तकनीकों को संदर्भित करता है जो प्रतिगमन फलन को फलन (गणित) के निर्दिष्ट सेट में असत्य बोलने की अनुमति देता है, जो [[आयाम]] या अनंत-आयामी हो सकता है।


===नॉनपैरामीट्रिक सांख्यिकी===
===नॉनपैरामीट्रिक सांख्यिकी===
{{main|नॉनपैरामीट्रिक सांख्यिकी}}
{{main|नॉनपैरामीट्रिक सांख्यिकी}}


नॉन-पैरामीट्रिक सांख्यिकी डेटा से इस तरह से गणना किए गए मान हैं जो संभाव्यता वितरण के [[सांख्यिकीय पैरामीटर|सांख्यिकीय मापदंड]] वर्गों पर आधारित नहीं हैं। इनमें वर्णनात्मक सांख्यिकी और सांख्यिकीय अनुमान सांख्यिकी दोनों सम्मिलित हैं। विशिष्ट मापदंड माध्य, विचरण आदि हैं। पैरामीट्रिक सांख्यिकी के विपरीत, नॉन-पैरामीट्रिक सांख्यिकी मूल्यांकन किए जा रहे वैरिएबल के संभाव्यता वितरण के बारे में कोई धारणा नहीं बनाते हैं।<ref>{{Cite web |title=गैर-पैरामीट्रिक तरीकों पर शोध करें|url=https://d8.stat.cmu.edu/research-areas/nonparametric-methods |access-date=August 30, 2022 |website=Carnegie Mellon University}}</ref>
इस प्रकार नॉन-पैरामीट्रिक सांख्यिकी डेटा से इस तरह से गणना किए गए मान हैं जो संभाव्यता वितरण के [[सांख्यिकीय पैरामीटर|सांख्यिकीय मापदंड]] वर्गों पर आधारित नहीं हैं। इनमें वर्णनात्मक सांख्यिकी और सांख्यिकीय अनुमान सांख्यिकी दोनों सम्मिलित हैं। विशिष्ट मापदंड माध्य, विचरण आदि हैं। इस प्रकार पैरामीट्रिक सांख्यिकी के विपरीत, नॉन-पैरामीट्रिक सांख्यिकी मूल्यांकन किए जा रहे वैरिएबल के संभाव्यता वितरण के बारे में कोई धारणा नहीं बनाते हैं।<ref>{{Cite web |title=गैर-पैरामीट्रिक तरीकों पर शोध करें|url=https://d8.stat.cmu.edu/research-areas/nonparametric-methods |access-date=August 30, 2022 |website=Carnegie Mellon University}}</ref>


नॉन-पैरामीट्रिक विधियों का व्यापक रूप से उन जनसंख्या का अध्ययन करने के लिए उपयोग किया जाता है जो क्रमबद्ध क्रम में होती हैं (जैसे कि से चार स्टार प्राप्त करने वाली फिल्म समीक्षा)। नॉन-पैरामीट्रिक विधियों का उपयोग तब आवश्यक हो सकता है जब डेटा की [[रैंकिंग]] हो किन्तु कोई स्पष्ट संख्यात्मक व्याख्या न हो, जैसे कि प्राथमिकताओं का आकलन करते समय माप के स्तर के संदर्भ में, नॉन-पैरामीट्रिक विधियों से क्रमिक डेटा प्राप्त होता है।
इस प्रकार नॉन-पैरामीट्रिक विधियों का व्यापक रूप से उन जनसंख्या का अध्ययन करने के लिए उपयोग किया जाता है जो क्रमबद्ध क्रम में होती हैं (जैसे कि से चार स्टार प्राप्त करने वाली फिल्म समीक्षा)। नॉन-पैरामीट्रिक विधियों का उपयोग तब आवश्यक हो सकता है जब डेटा की [[रैंकिंग]] हो किन्तु कोई स्पष्ट संख्यात्मक व्याख्या न हो, जैसे कि प्राथमिकताओं का आकलन करते समय माप के स्तर के संदर्भ में, नॉन-पैरामीट्रिक विधियों से क्रमिक डेटा प्राप्त होता है।


चूंकि नॉन-पैरामीट्रिक विधियां कम धारणाएं बनाती हैं, इसलिए उनकी प्रयोज्यता संबंधित पैरामीट्रिक विधियों की तुलना में बहुत व्यापक है। विशेष रूप से, उन्हें उन स्थितियों में प्रयुक्त किया जा सकता है जहां प्रश्न में आवेदन के बारे में कम जानकारी है। साथ ही, कम मान्यताओं पर निर्भरता के कारण, नॉन-पैरामीट्रिक विधियाँ अधिक सशक्त सांख्यिकी परिचय हैं।
चूंकि नॉन-पैरामीट्रिक विधियां कम धारणाएं बनाती हैं, इसलिए उनकी प्रयोज्यता संबंधित पैरामीट्रिक विधियों की तुलना में बहुत व्यापक है। विशेष रूप से, उन्हें उन स्थितियों में प्रयुक्त किया जा सकता है जहां प्रश्न में आवेदन के बारे में कम जानकारी है। साथ ही, कम मान्यताओं पर निर्भरता के कारण, नॉन-पैरामीट्रिक विधियाँ अधिक सशक्त सांख्यिकी परिचय हैं।


नॉन-पैरामीट्रिक विधियों का दोष यह है कि चूंकि वह मान्यताओं पर विश्वास नहीं करते हैं, इसलिए वह समष्टि अपने पैरामीट्रिक समकक्षों की तुलना में परीक्षण की कम शक्ति वाले होते हैं।<ref name=":0">{{Cite web |title=गैरपैरामीट्रिक परीक्षण|url=https://sphweb.bumc.bu.edu/otlt/MPH-Modules/BS/BS704_Nonparametric/BS704_Nonparametric_print.html |access-date=2022-08-31 |website=sphweb.bumc.bu.edu}}</ref> कम शक्ति वाले नॉन-पैरामीट्रिक परीक्षण समस्याग्रस्त हैं क्योंकि इन विधियों का सामान्य उपयोग तब होता है जब किसी प्रारूप का प्रारूप आकार कम होता है।<ref name=":0" /> नेमैन-पियर्सन लेम्मा और [[संभावना-अनुपात परीक्षण|संभाव्यता-अनुपात परीक्षण]] जैसी विधियों के माध्यम से विभिन्न पैरामीट्रिक विधियां सबसे शक्तिशाली परीक्षण सिद्ध हुई हैं।
इस प्रकार नॉन-पैरामीट्रिक विधियों का दोष यह है कि चूंकि वह मान्यताओं पर विश्वास नहीं करते हैं, इसलिए वह समष्टि अपने पैरामीट्रिक समकक्षों की तुलना में परीक्षण की कम शक्ति वाले होते हैं।<ref name=":0">{{Cite web |title=गैरपैरामीट्रिक परीक्षण|url=https://sphweb.bumc.bu.edu/otlt/MPH-Modules/BS/BS704_Nonparametric/BS704_Nonparametric_print.html |access-date=2022-08-31 |website=sphweb.bumc.bu.edu}}</ref> कम शक्ति वाले नॉन-पैरामीट्रिक परीक्षण समस्याग्रस्त हैं क्योंकि इन विधियों का सामान्य उपयोग तब होता है जब किसी प्रारूप का प्रारूप आकार कम होता है।<ref name=":0" /> नेमैन-पियर्सन लेम्मा और [[संभावना-अनुपात परीक्षण|संभाव्यता-अनुपात परीक्षण]] जैसी विधियों के माध्यम से विभिन्न पैरामीट्रिक विधियां सबसे शक्तिशाली परीक्षण सिद्ध हुई हैं।


नॉन-पैरामीट्रिक विधियों के उपयोग का अन्य औचित्य सरलता है। कुछ स्थितियों में, तथापि पैरामीट्रिक विधियों का उपयोग उचित हो, नॉन-पैरामीट्रिक विधियों का उपयोग करना सरल हो सकता है। इस सरलता और उनकी अधिक सशक्त दोनों के कारण, कुछ सांख्यिकीविदों द्वारा नॉन-पैरामीट्रिक विधियों को अनुचित उपयोग और गलतफहमी के लिए कम समष्टि छोड़ने के रूप में देखा जाता है।
इस प्रकार नॉन-पैरामीट्रिक विधियों के उपयोग का अन्य औचित्य सरलता है। कुछ स्थितियों में, तथापि पैरामीट्रिक विधियों का उपयोग उचित हो, नॉन-पैरामीट्रिक विधियों का उपयोग करना सरल हो सकता है। इस सरलता और उनकी अधिक सशक्त दोनों के कारण, कुछ सांख्यिकीविदों द्वारा नॉन-पैरामीट्रिक विधियों को अनुचित उपयोग और गलतफहमी के लिए कम समष्टि छोड़ने के रूप में देखा जाता है।


==सांख्यिकी, गणित, और गणितीय सांख्यिकी==
==सांख्यिकी, गणित, और गणितीय सांख्यिकी==
गणितीय सांख्यिकी सांख्यिकी के अनुशासन का प्रमुख उपसमुच्चय है। सांख्यिकीविद् गणित के साथ सांख्यिकीय प्रक्रियाओं का अध्ययन और सुधार करते हैं, और सांख्यिकीय अनुसंधान अधिकांशतः गणितीय प्रश्न उठाते हैं।
इस प्रकार गणितीय सांख्यिकी सांख्यिकी के अनुशासन का प्रमुख उपसमुच्चय है। सांख्यिकीविद् गणित के साथ सांख्यिकीय प्रक्रियाओं का अध्ययन और सुधार करते हैं, और सांख्यिकीय अनुसंधान अधिकांशतः गणितीय प्रश्न उठाते हैं।


[[गॉस]], [[लाप्लास]] और चार्ल्स सैंडर्स पीयर्स|सी जैसे गणितज्ञ और सांख्यिकीविद् एस. पीयर्स ने संभाव्यता वितरण और हानि कार्यों (या उपयोगिता कार्यों) के साथ [[इष्टतम निर्णय]] का उपयोग किया था। सांख्यिकीय अनुमान के लिए निर्णय-सैद्धांतिक दृष्टिकोण को [[ इब्राहीम का जन्म हुआ |इब्राहीम का जन्म हुआ]] और उनके उत्तराधिकारियों द्वारा पुनर्जीवित किया गया था,<ref>{{Cite book
इस प्रकार [[गॉस]], [[लाप्लास]] और चार्ल्स सैंडर्स पीयर्स या सी जैसे गणितज्ञ और सांख्यिकीविद् एस. पीयर्स ने संभाव्यता वितरण और हानि कार्यों (या उपयोगिता कार्यों) के साथ [[इष्टतम निर्णय]] का उपयोग किया था। सांख्यिकीय अनुमान के लिए निर्णय-सैद्धांतिक दृष्टिकोण को [[ इब्राहीम का जन्म हुआ |इब्राहीम का जन्म हुआ]] और उनके उत्तराधिकारियों द्वारा पुनर्जीवित किया गया था,<ref>{{Cite book
  | first = Abraham
  | first = Abraham
  | last = Wald |author-link=Abraham Wald
  | last = Wald |author-link=Abraham Wald
Line 123: Line 117:
|publisher=Springer
|publisher=Springer
}}
}}
</ref> और [[वैज्ञानिक कंप्यूटिंग]], गणितीय विश्लेषण और [[अनुकूलन (गणित)]] का व्यापक उपयोग करता है; प्रयोगों के डिज़ाइन के लिए, सांख्यिकीविद् बीजगणितीय सांख्यिकी और संयोजनात्मक डिज़ाइन का उपयोग करते हैं। किन्तु जबकि सांख्यिकीय अभ्यास अधिकांशतः संभाव्यता सिद्धांत और इष्टतम निर्णय पर निर्भर करता है, उनका अनुप्रयोग विवादास्पद हो सकता है <ref name=Freedman/>
</ref> और [[वैज्ञानिक कंप्यूटिंग]], गणितीय विश्लेषण और [[अनुकूलन (गणित)]] का व्यापक उपयोग करता है; इस प्रकार प्रयोगों के डिज़ाइन के लिए, सांख्यिकीविद् बीजगणितीय सांख्यिकी और संयोजनात्मक डिज़ाइन का उपयोग करते हैं। किन्तु जबकि सांख्यिकीय अभ्यास अधिकांशतः संभाव्यता सिद्धांत और इष्टतम निर्णय पर निर्भर करता है, उनका अनुप्रयोग विवादास्पद हो सकता है <ref name=Freedman/>
 
 
==यह भी देखें{{portal|Mathematics}}==
==यह भी देखें{{portal|Mathematics}}==
*[[स्पर्शोन्मुख सिद्धांत (सांख्यिकी)|असममित सिद्धांत (सांख्यिकी)]]
*[[स्पर्शोन्मुख सिद्धांत (सांख्यिकी)|असममित सिद्धांत (सांख्यिकी)]]
Line 131: Line 123:
==संदर्भ==
==संदर्भ==
<references/>
<references/>
== अग्रिम पठन ==
== अग्रिम पठन ==
* [[Aleksandr Alekseevich Borovkov|Borovkov, A. A.]] (1999). ''Mathematical Statistics''. CRC Press. {{isbn|90-5699-018-7}}
* [[Aleksandr Alekseevich Borovkov|Borovkov, A. A.]] (1999). ''Mathematical Statistics''. CRC Press. {{isbn|90-5699-018-7}}

Revision as of 21:13, 4 December 2023

डेटा सेट पर रैखिक प्रतिगमन का चित्रण। प्रतिगमन विश्लेषण गणितीय सांख्यिकी का महत्वपूर्ण भाग है।

गणितीय सांख्यिकी सांख्यिकीय डेटा एकत्र करने की तकनीकों के विपरीत, संभाव्यता सिद्धांत, गणित की शाखा, का सांख्यिकी में अनुप्रयोग है। इस प्रकार इसके लिए जो विशिष्ट गणितीय तकनीकों का उपयोग किया जाता है उनमें गणितीय विश्लेषण, रैखिक बीजगणित, स्टोकेस्टिक विश्लेषण, अंतर समीकरण और माप सिद्धांत सम्मिलित हैं।[1][2]

परिचय

इस प्रकार सांख्यिकीय डेटा संग्रह का संबंध अध्ययन की योजना, विशेष रूप से प्रयोगों के डिजाइन और यादृच्छिक प्रारूप का उपयोग करके सांख्यिकीय सर्वेक्षण की योजना से है। डेटा का प्रारंभिक विश्लेषण अधिकांशतः अध्ययन किए जाने से पहले निर्दिष्ट अध्ययन प्रोटोकॉल का पालन करता है। इस प्रकार किसी अध्ययन के डेटा का विश्लेषण प्रारंभिक परिणामों से प्रेरित माध्यमिक परिकल्पनाओं पर विचार करने या नए अध्ययनों का विचार देने के लिए भी किया जा सकता है। नियोजित अध्ययन से प्राप्त डेटा का द्वितीयक विश्लेषण डेटा विश्लेषण के उपकरणों का उपयोग करता है, और ऐसा करने की प्रक्रिया गणितीय सांख्यिकी हैं।

डेटा विश्लेषण को इसमें विभाजित किया गया है:

  • वर्णनात्मक सांख्यिकी - सांख्यिकी का वह भाग जो डेटा का वर्णन करता है, अर्थात डेटा और उनके विशिष्ट गुणों का सारांश देता है।
  • अनुमानात्मक सांख्यिकी - सांख्यिकी का वह भाग जो डेटा से निष्कर्ष निकालता है (डेटा के लिए कुछ मॉडल का उपयोग करके): उदाहरण के लिए, अनुमानात्मक सांख्यिकी में डेटा के लिए मॉडल का चयन करता है, यह जाँचना कि क्या डेटा किसी विशेष मॉडल की नियमो को पूर्ण करता है, और मात्रा निर्धारित करना सम्मिलित है इसमें सम्मिलित अनिश्चितता (उदाहरण के लिए कॉन्फिडेंस अंतराल का उपयोग करना)।

जबकि डेटा विश्लेषण के उपकरण यादृच्छिक अध्ययन से प्राप्त डेटा पर सबसे अच्छा कार्य करते हैं, वह अन्य प्रकार के डेटा पर भी प्रयुक्त होते हैं। उदाहरण के लिए, प्राकृतिक प्रयोग और अवलोकन संबंधी अध्ययनों से, इस स्थिति में अनुमान सांख्यिकीविद् द्वारा चुने गए मॉडल पर निर्भर होता है, और इसलिए सब्जेक्टिव होता है।[3][4]

विषय

गणितीय सांख्यिकी में कुछ महत्वपूर्ण विषय निम्नलिखित हैं:[5][6]

संभाव्यता वितरण

इस प्रकार संभाव्यता वितरण फलन (गणित) है जो यादृच्छिक प्रयोग (संभाव्यता सिद्धांत), सर्वेक्षण पद्धति, या सांख्यिकीय अनुमान की प्रक्रिया के संभावित परिणामों के प्रत्येक माप (गणित) के लिए संभाव्यता प्रदान करता है। ऐसे प्रयोगों में उदाहरण पाए जाते हैं जिनका प्रारूप समष्टि गैर-संख्यात्मक है, जहां वितरण श्रेणीबद्ध वितरण होगा; ऐसे प्रयोग जिनका प्रारूप समष्टि असतत यादृच्छिक वैरिएबल द्वारा एन्कोड किया गया है, जहां वितरण को संभाव्यता द्रव्यमान फलन द्वारा निर्दिष्ट किया जा सकता है; और निरंतर यादृच्छिक वैरिएबल द्वारा एन्कोड किए गए प्रारूप समष्टि के साथ प्रयोग, जहां वितरण को संभाव्यता घनत्व फलन द्वारा निर्दिष्ट किया जा सकता है। इस प्रकार अधिक सम्मिश्र प्रयोग, जैसे कि सतत समय में परिभाषित स्टोकेस्टिक प्रक्रियाओं से जुड़े प्रयोग, अधिक सामान्य संभाव्यता उपायों के उपयोग की मांग कर सकते हैं।

इस प्रकार संभाव्यता वितरण या तो यूनीवेरिएट वितरण या बहुविकल्पीय वितरण हो सकता है। इस प्रकार अविभाज्य वितरण एकल यादृच्छिक वैरिएबल के विभिन्न वैकल्पिक मान लेने की संभाव्यताएँ देता है; बहुभिन्नरूपी वितरण ( संयुक्त संभाव्यता वितरण) यादृच्छिक सदिश की संभाव्यताएं देता है - दो या दो से अधिक यादृच्छिक वैरिएबल का सेट - मानों के विभिन्न संयोजनों पर आधारित महत्वपूर्ण और समष्टि सामने आने वाले अविभाज्य संभाव्यता वितरण में द्विपद वितरण, हाइपरज्यामितीय वितरण और सामान्य वितरण सम्मिलित हैं। बहुभिन्नरूपी सामान्य वितरण सामान्यतः पाया जाने वाला बहुभिन्नरूपी वितरण है।

विशेष वितरण

  • सामान्य वितरण सबसे सामान्य सतत वितरण है
  • इस प्रकार बर्नौली वितरण, एकल बर्नौली परीक्षण के परिणाम के लिए (जैसे सफलता/असफलता, हाँ/नहीं)
  • स्वतंत्र (सांख्यिकी) घटनाओं की निश्चित कुल संख्या दी गई धनात्मक घटनाओं (जैसे सफलताएं, हां वोट इत्यादि) की संख्या के लिए द्विपद वितरण है
  • इस प्रकार ऋणात्मक द्विपद वितरण, द्विपद-प्रकार के अवलोकनों के लिए किन्तु जहां ब्याज की मात्रा दी गई सफलताओं की संख्या होने से पहले विफलताओं की संख्या है
  • इस प्रकार ज्यामितीय वितरण, द्विपद-प्रकार के अवलोकनों के लिए, किन्तु जहां इंटरेस्ट की मात्रा पहली सफलता से पहले विफलताओं की संख्या है; ऋणात्मक द्विपद वितरण का विशेष मामला, जहां सफलताओं की संख्या है।
  • इस प्रकार मानो के सीमित सेट के लिए असतत समान वितरण है (उदाहरण के लिए निष्पक्ष पासे का परिणाम)
  • निरंतर वितरित मानो के लिए निरंतर समान वितरण है
  • पॉइसन वितरण, किसी निश्चित समयावधि में पॉइसन-प्रकार की घटना की घटनाओं की संख्या के लिए है
  • इस प्रकार पॉइसन-प्रकार की घटना घटित होने से पहले के समय के लिए घातीय वितरण है
  • गामा वितरण, पॉइसन-प्रकार की घटनाओं के घटित होने से पहले के समय के लिए
  • ची-वर्ग वितरण, वर्ग मानक सामान्य वैरिएबल के योग का वितरण है; उपयोगी उदाहरन सामान्य रूप से वितरित प्रारूपो के प्रारूप भिन्नता के संबंध में अनुमान के लिए (ची-स्क्वेर्ड परीक्षण देखें)
  • इस प्रकार स्टूडेंट टी वितरण, मानक सामान्य वैरिएबल के अनुपात का वितरण और स्केल किए गए ची वर्ग वितरण वैरिएबल का वर्गमूल; अज्ञात विचरण के साथ सामान्य रूप से वितरित प्रारूपो के माध्य के बारे में अनुमान लगाने के लिए उपयोगी (स्टूडेंट टी-परीक्षण देखें)
  • बीटा वितरण, एकल संभाव्यता के लिए (0 और 1 के मध्य वास्तविक संख्या); बर्नौली वितरण और द्विपद वितरण से संयुग्मित है

सांख्यिकीय अनुमान

इस प्रकार सांख्यिकीय अनुमान डेटा से निष्कर्ष निकालने की प्रक्रिया है जो यादृच्छिक भिन्नता के अधीन है, उदाहरण के लिए, अवलोकन संबंधी त्रुटियां या प्रारूप भिन्नता [7] अनुमान और प्रेरक तर्क के लिए प्रक्रियाओं की ऐसी प्रणाली की प्रारंभिक आवश्यकताएं यह हैं कि प्रणाली को अच्छी तरह से परिभाषित स्थितियों पर प्रयुक्त होने पर उचित उत्तर देना चाहिए और यह विभिन्न स्थितियों में प्रयुक्त होने के लिए पर्याप्त सामान्य होना चाहिए। इस प्रकार अनुमानित सांख्यिकी का उपयोग परिकल्पनाओं का परीक्षण करने और प्रारूप डेटा का उपयोग करके अनुमान लगाने के लिए किया जाता है। जबकि वर्णनात्मक सांख्यिकी प्रारूप का वर्णन करते हैं, अनुमानात्मक सांख्यिकी उस बड़ी जनसंख्या के बारे में पूर्वानुमान करते हैं जिसका प्रारूप प्रतिनिधित्व करता है।

इस प्रकार सांख्यिकीय अनुमान का परिणाम इस प्रश्न का उत्तर हो सकता है कि आगे क्या किया जाना चाहिए? , जहां यह आगे के प्रयोग या सर्वेक्षण करने, या किसी संगठनात्मक या सरकारी नीति को प्रयुक्त करने से पहले निष्कर्ष निकालने के बारे में निर्णय हो सकता है। अधिकांश भाग के लिए, सांख्यिकीय अनुमान कुछ प्रकार के यादृच्छिक प्रारूप के माध्यम से इंटरेस्ट की जनसंख्या से निकाले गए डेटा का उपयोग करके जनसंख्या के बारे में प्रस्ताव देता है। इस प्रकार अधिक सामान्यतः, यादृच्छिक प्रक्रिया के बारे में डेटा सीमित अवधि के समय उसके देखे गए व्यवहार से प्राप्त किया जाता है। किसी मापदंड या परिकल्पना को देखते हुए जिसके बारे में कोई अनुमान लगाना चाहता है, सांख्यिकीय अनुमान सबसे अधिक बार उपयोग किया जाता है:

  • इस प्रकार यादृच्छिक प्रक्रिया का सांख्यिकीय मॉडल जो डेटा उत्पन्न करने वाला होता है, जिसे तब जाना जाता है जब यादृच्छिककरण का उपयोग किया गया हो, और
  • इस प्रकार यादृच्छिक प्रक्रिया का एक विशेष अनुभव अर्थात डेटा का एक सेट है।

प्रतिगमन

इस प्रकार सांख्यिकी में, प्रतिगमन विश्लेषण वैरिएबल के मध्य संबंधों का अनुमान लगाने के लिए सांख्यिकीय प्रक्रिया है। इसमें विभिन्न वैरिएबल के मॉडलिंग और विश्लेषण के विभिन्न विधि सम्मिलित हैं, जब फोकस डिपेन्डेन्ट वैरिएबल और या अधिक स्वतंत्र वैरिएबल के मध्य संबंध पर होता है। अधिक विशेष रूप से, प्रतिगमन विश्लेषण यह समझने में सहायता करता है कि डिपेन्डेन्ट वैरिएबल (या 'मानदंड वैरिएबल') का विशिष्ट मूल्य कैसे परिवर्तित होता है जब किसी स्वतंत्र वैरिएबल में भिन्नता होती है, जबकि अन्य स्वतंत्र वैरिएबल स्थिर रहते हैं। सामान्यतः, प्रतिगमन विश्लेषण स्वतंत्र वैरिएबल को देखते हुए डिपेन्डेन्ट वैरिएबल की नियमबद्ध अपेक्षा का अनुमान लगाता है - अर्थात, स्वतंत्र वैरिएबल तय होने पर डिपेन्डेन्ट वैरिएबल का औसत मूल्य सामान्यतः, ध्यान स्वतंत्र वैरिएबल को देखते हुए डिपेन्डेन्ट वैरिएबल के नियमबद्ध वितरण के मात्रात्मक या अन्य समष्टि मापदंड पर होता है। सभी स्थितियों में, अनुमान लक्ष्य स्वतंत्र वैरिएबल का फलन (गणित) है जिसे प्रतिगमन फलन कहा जाता है। इस प्रकार प्रतिगमन विश्लेषण में, प्रतिगमन फलन के निकट डिपेन्डेन्ट वैरिएबल की भिन्नता को चिह्नित करना भी रोचक है जिसे संभाव्यता वितरण द्वारा वर्णित किया जा सकता है।

इस प्रकार प्रतिगमन विश्लेषण करने के लिए विभिन्न तकनीकें विकसित की गई हैं। परिचित विधियाँ, जैसे कि रैखिक प्रतिगमन, पैरामीट्रिक सांख्यिकी हैं, जिसमें प्रतिगमन फलन को अज्ञात मापदंडों की सीमित संख्या के संदर्भ में परिभाषित किया जाता है जो डेटा से अनुमानित होते हैं (उदाहरण के लिए सामान्य न्यूनतम वर्गों का उपयोग करके)। नॉनपैरामीट्रिक प्रतिगमन उन तकनीकों को संदर्भित करता है जो प्रतिगमन फलन को फलन (गणित) के निर्दिष्ट सेट में असत्य बोलने की अनुमति देता है, जो आयाम या अनंत-आयामी हो सकता है।

नॉनपैरामीट्रिक सांख्यिकी

इस प्रकार नॉन-पैरामीट्रिक सांख्यिकी डेटा से इस तरह से गणना किए गए मान हैं जो संभाव्यता वितरण के सांख्यिकीय मापदंड वर्गों पर आधारित नहीं हैं। इनमें वर्णनात्मक सांख्यिकी और सांख्यिकीय अनुमान सांख्यिकी दोनों सम्मिलित हैं। विशिष्ट मापदंड माध्य, विचरण आदि हैं। इस प्रकार पैरामीट्रिक सांख्यिकी के विपरीत, नॉन-पैरामीट्रिक सांख्यिकी मूल्यांकन किए जा रहे वैरिएबल के संभाव्यता वितरण के बारे में कोई धारणा नहीं बनाते हैं।[8]

इस प्रकार नॉन-पैरामीट्रिक विधियों का व्यापक रूप से उन जनसंख्या का अध्ययन करने के लिए उपयोग किया जाता है जो क्रमबद्ध क्रम में होती हैं (जैसे कि से चार स्टार प्राप्त करने वाली फिल्म समीक्षा)। नॉन-पैरामीट्रिक विधियों का उपयोग तब आवश्यक हो सकता है जब डेटा की रैंकिंग हो किन्तु कोई स्पष्ट संख्यात्मक व्याख्या न हो, जैसे कि प्राथमिकताओं का आकलन करते समय माप के स्तर के संदर्भ में, नॉन-पैरामीट्रिक विधियों से क्रमिक डेटा प्राप्त होता है।

चूंकि नॉन-पैरामीट्रिक विधियां कम धारणाएं बनाती हैं, इसलिए उनकी प्रयोज्यता संबंधित पैरामीट्रिक विधियों की तुलना में बहुत व्यापक है। विशेष रूप से, उन्हें उन स्थितियों में प्रयुक्त किया जा सकता है जहां प्रश्न में आवेदन के बारे में कम जानकारी है। साथ ही, कम मान्यताओं पर निर्भरता के कारण, नॉन-पैरामीट्रिक विधियाँ अधिक सशक्त सांख्यिकी परिचय हैं।

इस प्रकार नॉन-पैरामीट्रिक विधियों का दोष यह है कि चूंकि वह मान्यताओं पर विश्वास नहीं करते हैं, इसलिए वह समष्टि अपने पैरामीट्रिक समकक्षों की तुलना में परीक्षण की कम शक्ति वाले होते हैं।[9] कम शक्ति वाले नॉन-पैरामीट्रिक परीक्षण समस्याग्रस्त हैं क्योंकि इन विधियों का सामान्य उपयोग तब होता है जब किसी प्रारूप का प्रारूप आकार कम होता है।[9] नेमैन-पियर्सन लेम्मा और संभाव्यता-अनुपात परीक्षण जैसी विधियों के माध्यम से विभिन्न पैरामीट्रिक विधियां सबसे शक्तिशाली परीक्षण सिद्ध हुई हैं।

इस प्रकार नॉन-पैरामीट्रिक विधियों के उपयोग का अन्य औचित्य सरलता है। कुछ स्थितियों में, तथापि पैरामीट्रिक विधियों का उपयोग उचित हो, नॉन-पैरामीट्रिक विधियों का उपयोग करना सरल हो सकता है। इस सरलता और उनकी अधिक सशक्त दोनों के कारण, कुछ सांख्यिकीविदों द्वारा नॉन-पैरामीट्रिक विधियों को अनुचित उपयोग और गलतफहमी के लिए कम समष्टि छोड़ने के रूप में देखा जाता है।

सांख्यिकी, गणित, और गणितीय सांख्यिकी

इस प्रकार गणितीय सांख्यिकी सांख्यिकी के अनुशासन का प्रमुख उपसमुच्चय है। सांख्यिकीविद् गणित के साथ सांख्यिकीय प्रक्रियाओं का अध्ययन और सुधार करते हैं, और सांख्यिकीय अनुसंधान अधिकांशतः गणितीय प्रश्न उठाते हैं।

इस प्रकार गॉस, लाप्लास और चार्ल्स सैंडर्स पीयर्स या सी जैसे गणितज्ञ और सांख्यिकीविद् एस. पीयर्स ने संभाव्यता वितरण और हानि कार्यों (या उपयोगिता कार्यों) के साथ इष्टतम निर्णय का उपयोग किया था। सांख्यिकीय अनुमान के लिए निर्णय-सैद्धांतिक दृष्टिकोण को इब्राहीम का जन्म हुआ और उनके उत्तराधिकारियों द्वारा पुनर्जीवित किया गया था,[10][11][12][13][14][15][16] और वैज्ञानिक कंप्यूटिंग, गणितीय विश्लेषण और अनुकूलन (गणित) का व्यापक उपयोग करता है; इस प्रकार प्रयोगों के डिज़ाइन के लिए, सांख्यिकीविद् बीजगणितीय सांख्यिकी और संयोजनात्मक डिज़ाइन का उपयोग करते हैं। किन्तु जबकि सांख्यिकीय अभ्यास अधिकांशतः संभाव्यता सिद्धांत और इष्टतम निर्णय पर निर्भर करता है, उनका अनुप्रयोग विवादास्पद हो सकता है [4]

यह भी देखें

संदर्भ

  1. Kannan, D.; Lakshmikantham, V., eds. (2002). स्टोकेस्टिक विश्लेषण और अनुप्रयोगों की पुस्तिका. New York: M. Dekker. ISBN 0824706609.
  2. Schervish, Mark J. (1995). सांख्यिकी का सिद्धांत (Corr. 2nd print. ed.). New York: Springer. ISBN 0387945466.
  3. Freedman, D.A. (2005) Statistical Models: Theory and Practice, Cambridge University Press. ISBN 978-0-521-67105-7
  4. 4.0 4.1 Freedman, David A. (2010). Collier, David; Sekhon, Jasjeet S.; Stark, Philp B. (eds.). Statistical Models and Causal Inference: A Dialogue with the Social Sciences. Cambridge University Press. ISBN 978-0-521-12390-7.
  5. Hogg, R. V., A. Craig, and J. W. McKean. "Intro to Mathematical Statistics." (2005).
  6. Larsen, Richard J. and Marx, Morris L. "An Introduction to Mathematical Statistics and Its Applications" (2012). Prentice Hall.
  7. Upton, G., Cook, I. (2008) Oxford Dictionary of Statistics, OUP. ISBN 978-0-19-954145-4
  8. "गैर-पैरामीट्रिक तरीकों पर शोध करें". Carnegie Mellon University. Retrieved August 30, 2022.
  9. 9.0 9.1 "गैरपैरामीट्रिक परीक्षण". sphweb.bumc.bu.edu. Retrieved 2022-08-31.
  10. Wald, Abraham (1947). Sequential analysis. New York: John Wiley and Sons. ISBN 0-471-91806-7. See Dover reprint, 2004: ISBN 0-486-43912-7
  11. Wald, Abraham (1950). Statistical Decision Functions. John Wiley and Sons, New York.
  12. Lehmann, Erich (1997). सांख्यिकीय परिकल्पनाओं का परीक्षण (2nd ed.). ISBN 0-387-94919-4.
  13. Lehmann, Erich; Cassella, George (1998). Theory of Point Estimation (2nd ed.). ISBN 0-387-98502-6.
  14. Bickel, Peter J.; Doksum, Kjell A. (2001). Mathematical Statistics: Basic and Selected Topics. Vol. 1 (Second (updated printing 2007) ed.). Pearson Prentice-Hall.
  15. Le Cam, Lucien (1986). Asymptotic Methods in Statistical Decision Theory. Springer-Verlag. ISBN 0-387-96307-3.
  16. Liese, Friedrich & Miescke, Klaus-J. (2008). Statistical Decision Theory: Estimation, Testing, and Selection. Springer.

अग्रिम पठन

{{Navbox

| name =गणित के क्षेत्र

|state = autocollapse


| title =अंक शास्त्र | bodyclass = hlist

|above =


| group1 = नींव | list1 =* श्रेणी सिद्धांत

| group2 =बीजगणित | list2 =* सार

| group3 = विश्लेषण | list3 =* पथरी

| group4 = असतत | list4 =* कॉम्बीनेटरिक्स

| group5 =ज्यामिति | list5 =* बीजगणितीय

| group6 =संख्या सिद्धांत | list6 =* अंकगणित

| group7 =टोपोलॉजी | list7 =* सामान्य

| group8 = लागू | list8 =* इंजीनियरिंग गणित

| group9 = कम्प्यूटेशनल | list9 =* कंप्यूटर विज्ञान

| group10 = संबंधित विषय | list10 =* अनौपचारिक गणित

| below =* '

}}