गणितीय सांख्यिकी

From Vigyanwiki
डेटा सेट पर रैखिक प्रतिगमन का चित्रण। प्रतिगमन विश्लेषण गणितीय सांख्यिकी का महत्वपूर्ण भाग है।

गणितीय सांख्यिकी सांख्यिकीय डेटा एकत्र करने की तकनीकों के विपरीत, संभाव्यता सिद्धांत, गणित की शाखा, का सांख्यिकी में अनुप्रयोग है। इस प्रकार इसके लिए जो विशिष्ट गणितीय तकनीकों का उपयोग किया जाता है उनमें गणितीय विश्लेषण, रैखिक बीजगणित, स्टोकेस्टिक विश्लेषण, अंतर समीकरण और माप सिद्धांत सम्मिलित हैं।[1][2]

परिचय

इस प्रकार सांख्यिकीय डेटा संग्रह का संबंध अध्ययन की योजना, विशेष रूप से प्रयोगों के डिजाइन और यादृच्छिक प्रारूप का उपयोग करके सांख्यिकीय सर्वेक्षण की योजना से है। डेटा का प्रारंभिक विश्लेषण अधिकांशतः अध्ययन किए जाने से पहले निर्दिष्ट अध्ययन प्रोटोकॉल का पालन करता है। इस प्रकार किसी अध्ययन के डेटा का विश्लेषण प्रारंभिक परिणामों से प्रेरित माध्यमिक परिकल्पनाओं पर विचार करने या नए अध्ययनों का विचार देने के लिए भी किया जा सकता है। नियोजित अध्ययन से प्राप्त डेटा का द्वितीयक विश्लेषण डेटा विश्लेषण के उपकरणों का उपयोग करता है, और ऐसा करने की प्रक्रिया गणितीय सांख्यिकी हैं।

डेटा विश्लेषण को इसमें विभाजित किया गया है:

  • वर्णनात्मक सांख्यिकी - सांख्यिकी का वह भाग जो डेटा का वर्णन करता है, अर्थात डेटा और उनके विशिष्ट गुणों का सारांश देता है।
  • अनुमानात्मक सांख्यिकी - सांख्यिकी का वह भाग जो डेटा से निष्कर्ष निकालता है (डेटा के लिए कुछ मॉडल का उपयोग करके): उदाहरण के लिए, अनुमानात्मक सांख्यिकी में डेटा के लिए मॉडल का चयन करता है, यह जाँचना कि क्या डेटा किसी विशेष मॉडल की नियमो को पूर्ण करता है, और मात्रा निर्धारित करना सम्मिलित है इसमें सम्मिलित अनिश्चितता (उदाहरण के लिए कॉन्फिडेंस अंतराल का उपयोग करना)।

जबकि डेटा विश्लेषण के उपकरण यादृच्छिक अध्ययन से प्राप्त डेटा पर सबसे अच्छा कार्य करते हैं, वह अन्य प्रकार के डेटा पर भी प्रयुक्त होते हैं। उदाहरण के लिए, प्राकृतिक प्रयोग और अवलोकन संबंधी अध्ययनों से, इस स्थिति में अनुमान सांख्यिकीविद् द्वारा चुने गए मॉडल पर निर्भर होता है, और इसलिए सब्जेक्टिव होता है।[3][4]

विषय

गणितीय सांख्यिकी में कुछ महत्वपूर्ण विषय निम्नलिखित हैं:[5][6]

संभाव्यता वितरण

इस प्रकार संभाव्यता वितरण फलन (गणित) है जो यादृच्छिक प्रयोग (संभाव्यता सिद्धांत), सर्वेक्षण पद्धति, या सांख्यिकीय अनुमान की प्रक्रिया के संभावित परिणामों के प्रत्येक माप (गणित) के लिए संभाव्यता प्रदान करता है। ऐसे प्रयोगों में उदाहरण पाए जाते हैं जिनका प्रारूप समष्टि गैर-संख्यात्मक है, जहां वितरण श्रेणीबद्ध वितरण होगा; ऐसे प्रयोग जिनका प्रारूप समष्टि असतत यादृच्छिक वैरिएबल द्वारा एन्कोड किया गया है, जहां वितरण को संभाव्यता द्रव्यमान फलन द्वारा निर्दिष्ट किया जा सकता है; और निरंतर यादृच्छिक वैरिएबल द्वारा एन्कोड किए गए प्रारूप समष्टि के साथ प्रयोग, जहां वितरण को संभाव्यता घनत्व फलन द्वारा निर्दिष्ट किया जा सकता है। इस प्रकार अधिक सम्मिश्र प्रयोग, जैसे कि सतत समय में परिभाषित स्टोकेस्टिक प्रक्रियाओं से जुड़े प्रयोग, अधिक सामान्य संभाव्यता उपायों के उपयोग की मांग कर सकते हैं।

इस प्रकार संभाव्यता वितरण या तो यूनीवेरिएट वितरण या बहुविकल्पीय वितरण हो सकता है। इस प्रकार अविभाज्य वितरण एकल यादृच्छिक वैरिएबल के विभिन्न वैकल्पिक मान लेने की संभाव्यताएँ देता है; बहुभिन्नरूपी वितरण ( संयुक्त संभाव्यता वितरण) यादृच्छिक सदिश की संभाव्यताएं देता है - दो या दो से अधिक यादृच्छिक वैरिएबल का सेट - मानों के विभिन्न संयोजनों पर आधारित महत्वपूर्ण और समष्टि सामने आने वाले अविभाज्य संभाव्यता वितरण में द्विपद वितरण, हाइपरज्यामितीय वितरण और सामान्य वितरण सम्मिलित हैं। बहुभिन्नरूपी सामान्य वितरण सामान्यतः पाया जाने वाला बहुभिन्नरूपी वितरण है।

विशेष वितरण

  • सामान्य वितरण सबसे सामान्य सतत वितरण है
  • इस प्रकार बर्नौली वितरण, एकल बर्नौली परीक्षण के परिणाम के लिए (जैसे सफलता/असफलता, हाँ/नहीं)
  • स्वतंत्र (सांख्यिकी) घटनाओं की निश्चित कुल संख्या दी गई धनात्मक घटनाओं (जैसे सफलताएं, हां वोट इत्यादि) की संख्या के लिए द्विपद वितरण है
  • इस प्रकार ऋणात्मक द्विपद वितरण, द्विपद-प्रकार के अवलोकनों के लिए किन्तु जहां ब्याज की मात्रा दी गई सफलताओं की संख्या होने से पहले विफलताओं की संख्या है
  • इस प्रकार ज्यामितीय वितरण, द्विपद-प्रकार के अवलोकनों के लिए, किन्तु जहां इंटरेस्ट की मात्रा पहली सफलता से पहले विफलताओं की संख्या है; ऋणात्मक द्विपद वितरण का विशेष मामला, जहां सफलताओं की संख्या है।
  • इस प्रकार मानो के सीमित सेट के लिए असतत समान वितरण है (उदाहरण के लिए निष्पक्ष पासे का परिणाम)
  • निरंतर वितरित मानो के लिए निरंतर समान वितरण है
  • पॉइसन वितरण, किसी निश्चित समयावधि में पॉइसन-प्रकार की घटना की घटनाओं की संख्या के लिए है
  • इस प्रकार पॉइसन-प्रकार की घटना घटित होने से पहले के समय के लिए घातीय वितरण है
  • गामा वितरण, पॉइसन-प्रकार की घटनाओं के घटित होने से पहले के समय के लिए
  • ची-वर्ग वितरण, वर्ग मानक सामान्य वैरिएबल के योग का वितरण है; उपयोगी उदाहरन सामान्य रूप से वितरित प्रारूपो के प्रारूप भिन्नता के संबंध में अनुमान के लिए (ची-स्क्वेर्ड परीक्षण देखें)
  • इस प्रकार स्टूडेंट टी वितरण, मानक सामान्य वैरिएबल के अनुपात का वितरण और स्केल किए गए ची वर्ग वितरण वैरिएबल का वर्गमूल; अज्ञात विचरण के साथ सामान्य रूप से वितरित प्रारूपो के माध्य के बारे में अनुमान लगाने के लिए उपयोगी (स्टूडेंट टी-परीक्षण देखें)
  • बीटा वितरण, एकल संभाव्यता के लिए (0 और 1 के मध्य वास्तविक संख्या); बर्नौली वितरण और द्विपद वितरण से संयुग्मित है

सांख्यिकीय अनुमान

इस प्रकार सांख्यिकीय अनुमान डेटा से निष्कर्ष निकालने की प्रक्रिया है जो यादृच्छिक भिन्नता के अधीन है, उदाहरण के लिए, अवलोकन संबंधी त्रुटियां या प्रारूप भिन्नता [7] अनुमान और प्रेरक तर्क के लिए प्रक्रियाओं की ऐसी प्रणाली की प्रारंभिक आवश्यकताएं यह हैं कि प्रणाली को अच्छी तरह से परिभाषित स्थितियों पर प्रयुक्त होने पर उचित उत्तर देना चाहिए और यह विभिन्न स्थितियों में प्रयुक्त होने के लिए पर्याप्त सामान्य होना चाहिए। इस प्रकार अनुमानित सांख्यिकी का उपयोग परिकल्पनाओं का परीक्षण करने और प्रारूप डेटा का उपयोग करके अनुमान लगाने के लिए किया जाता है। जबकि वर्णनात्मक सांख्यिकी प्रारूप का वर्णन करते हैं, अनुमानात्मक सांख्यिकी उस बड़ी जनसंख्या के बारे में पूर्वानुमान करते हैं जिसका प्रारूप प्रतिनिधित्व करता है।

इस प्रकार सांख्यिकीय अनुमान का परिणाम इस प्रश्न का उत्तर हो सकता है कि आगे क्या किया जाना चाहिए? , जहां यह आगे के प्रयोग या सर्वेक्षण करने, या किसी संगठनात्मक या सरकारी नीति को प्रयुक्त करने से पहले निष्कर्ष निकालने के बारे में निर्णय हो सकता है। अधिकांश भाग के लिए, सांख्यिकीय अनुमान कुछ प्रकार के यादृच्छिक प्रारूप के माध्यम से इंटरेस्ट की जनसंख्या से निकाले गए डेटा का उपयोग करके जनसंख्या के बारे में प्रस्ताव देता है। इस प्रकार अधिक सामान्यतः, यादृच्छिक प्रक्रिया के बारे में डेटा सीमित अवधि के समय उसके देखे गए व्यवहार से प्राप्त किया जाता है। किसी मापदंड या परिकल्पना को देखते हुए जिसके बारे में कोई अनुमान लगाना चाहता है, सांख्यिकीय अनुमान सबसे अधिक बार उपयोग किया जाता है:

  • इस प्रकार यादृच्छिक प्रक्रिया का सांख्यिकीय मॉडल जो डेटा उत्पन्न करने वाला होता है, जिसे तब जाना जाता है जब यादृच्छिककरण का उपयोग किया गया हो, और
  • इस प्रकार यादृच्छिक प्रक्रिया का एक विशेष अनुभव अर्थात डेटा का एक सेट है।

प्रतिगमन

इस प्रकार सांख्यिकी में, प्रतिगमन विश्लेषण वैरिएबल के मध्य संबंधों का अनुमान लगाने के लिए सांख्यिकीय प्रक्रिया है। इसमें विभिन्न वैरिएबल के मॉडलिंग और विश्लेषण के विभिन्न विधि सम्मिलित हैं, जब फोकस डिपेन्डेन्ट वैरिएबल और या अधिक स्वतंत्र वैरिएबल के मध्य संबंध पर होता है। अधिक विशेष रूप से, प्रतिगमन विश्लेषण यह समझने में सहायता करता है कि डिपेन्डेन्ट वैरिएबल (या 'मानदंड वैरिएबल') का विशिष्ट मूल्य कैसे परिवर्तित होता है जब किसी स्वतंत्र वैरिएबल में भिन्नता होती है, जबकि अन्य स्वतंत्र वैरिएबल स्थिर रहते हैं। सामान्यतः, प्रतिगमन विश्लेषण स्वतंत्र वैरिएबल को देखते हुए डिपेन्डेन्ट वैरिएबल की नियमबद्ध अपेक्षा का अनुमान लगाता है - अर्थात, स्वतंत्र वैरिएबल तय होने पर डिपेन्डेन्ट वैरिएबल का औसत मूल्य सामान्यतः, ध्यान स्वतंत्र वैरिएबल को देखते हुए डिपेन्डेन्ट वैरिएबल के नियमबद्ध वितरण के मात्रात्मक या अन्य समष्टि मापदंड पर होता है। सभी स्थितियों में, अनुमान लक्ष्य स्वतंत्र वैरिएबल का फलन (गणित) है जिसे प्रतिगमन फलन कहा जाता है। इस प्रकार प्रतिगमन विश्लेषण में, प्रतिगमन फलन के निकट डिपेन्डेन्ट वैरिएबल की भिन्नता को चिह्नित करना भी रोचक है जिसे संभाव्यता वितरण द्वारा वर्णित किया जा सकता है।

इस प्रकार प्रतिगमन विश्लेषण करने के लिए विभिन्न तकनीकें विकसित की गई हैं। परिचित विधियाँ, जैसे कि रैखिक प्रतिगमन, पैरामीट्रिक सांख्यिकी हैं, जिसमें प्रतिगमन फलन को अज्ञात मापदंडों की सीमित संख्या के संदर्भ में परिभाषित किया जाता है जो डेटा से अनुमानित होते हैं (उदाहरण के लिए सामान्य न्यूनतम वर्गों का उपयोग करके)। नॉनपैरामीट्रिक प्रतिगमन उन तकनीकों को संदर्भित करता है जो प्रतिगमन फलन को फलन (गणित) के निर्दिष्ट सेट में असत्य बोलने की अनुमति देता है, जो आयाम या अनंत-आयामी हो सकता है।

नॉनपैरामीट्रिक सांख्यिकी

इस प्रकार नॉन-पैरामीट्रिक सांख्यिकी डेटा से इस तरह से गणना किए गए मान हैं जो संभाव्यता वितरण के सांख्यिकीय मापदंड वर्गों पर आधारित नहीं हैं। इनमें वर्णनात्मक सांख्यिकी और सांख्यिकीय अनुमान सांख्यिकी दोनों सम्मिलित हैं। विशिष्ट मापदंड माध्य, विचरण आदि हैं। इस प्रकार पैरामीट्रिक सांख्यिकी के विपरीत, नॉन-पैरामीट्रिक सांख्यिकी मूल्यांकन किए जा रहे वैरिएबल के संभाव्यता वितरण के बारे में कोई धारणा नहीं बनाते हैं।[8]

इस प्रकार नॉन-पैरामीट्रिक विधियों का व्यापक रूप से उन जनसंख्या का अध्ययन करने के लिए उपयोग किया जाता है जो क्रमबद्ध क्रम में होती हैं (जैसे कि से चार स्टार प्राप्त करने वाली फिल्म समीक्षा)। नॉन-पैरामीट्रिक विधियों का उपयोग तब आवश्यक हो सकता है जब डेटा की रैंकिंग हो किन्तु कोई स्पष्ट संख्यात्मक व्याख्या न हो, जैसे कि प्राथमिकताओं का आकलन करते समय माप के स्तर के संदर्भ में, नॉन-पैरामीट्रिक विधियों से क्रमिक डेटा प्राप्त होता है।

चूंकि नॉन-पैरामीट्रिक विधियां कम धारणाएं बनाती हैं, इसलिए उनकी प्रयोज्यता संबंधित पैरामीट्रिक विधियों की तुलना में बहुत व्यापक है। विशेष रूप से, उन्हें उन स्थितियों में प्रयुक्त किया जा सकता है जहां प्रश्न में आवेदन के बारे में कम जानकारी है। साथ ही, कम मान्यताओं पर निर्भरता के कारण, नॉन-पैरामीट्रिक विधियाँ अधिक सशक्त सांख्यिकी परिचय हैं।

इस प्रकार नॉन-पैरामीट्रिक विधियों का दोष यह है कि चूंकि वह मान्यताओं पर विश्वास नहीं करते हैं, इसलिए वह समष्टि अपने पैरामीट्रिक समकक्षों की तुलना में परीक्षण की कम शक्ति वाले होते हैं।[9] कम शक्ति वाले नॉन-पैरामीट्रिक परीक्षण समस्याग्रस्त हैं क्योंकि इन विधियों का सामान्य उपयोग तब होता है जब किसी प्रारूप का प्रारूप आकार कम होता है।[9] नेमैन-पियर्सन लेम्मा और संभाव्यता-अनुपात परीक्षण जैसी विधियों के माध्यम से विभिन्न पैरामीट्रिक विधियां सबसे शक्तिशाली परीक्षण सिद्ध हुई हैं।

इस प्रकार नॉन-पैरामीट्रिक विधियों के उपयोग का अन्य औचित्य सरलता है। कुछ स्थितियों में, तथापि पैरामीट्रिक विधियों का उपयोग उचित हो, नॉन-पैरामीट्रिक विधियों का उपयोग करना सरल हो सकता है। इस सरलता और उनकी अधिक सशक्त दोनों के कारण, कुछ सांख्यिकीविदों द्वारा नॉन-पैरामीट्रिक विधियों को अनुचित उपयोग और गलतफहमी के लिए कम समष्टि छोड़ने के रूप में देखा जाता है।

सांख्यिकी, गणित, और गणितीय सांख्यिकी

इस प्रकार गणितीय सांख्यिकी सांख्यिकी के अनुशासन का प्रमुख उपसमुच्चय है। सांख्यिकीविद् गणित के साथ सांख्यिकीय प्रक्रियाओं का अध्ययन और सुधार करते हैं, और सांख्यिकीय अनुसंधान अधिकांशतः गणितीय प्रश्न उठाते हैं।

इस प्रकार गॉस, लाप्लास और चार्ल्स सैंडर्स पीयर्स या सी जैसे गणितज्ञ और सांख्यिकीविद् एस. पीयर्स ने संभाव्यता वितरण और हानि कार्यों (या उपयोगिता कार्यों) के साथ इष्टतम निर्णय का उपयोग किया था। सांख्यिकीय अनुमान के लिए निर्णय-सैद्धांतिक दृष्टिकोण को इब्राहीम का जन्म हुआ और उनके उत्तराधिकारियों द्वारा पुनर्जीवित किया गया था,[10][11][12][13][14][15][16] और वैज्ञानिक कंप्यूटिंग, गणितीय विश्लेषण और अनुकूलन (गणित) का व्यापक उपयोग करता है; इस प्रकार प्रयोगों के डिज़ाइन के लिए, सांख्यिकीविद् बीजगणितीय सांख्यिकी और संयोजनात्मक डिज़ाइन का उपयोग करते हैं। किन्तु जबकि सांख्यिकीय अभ्यास अधिकांशतः संभाव्यता सिद्धांत और इष्टतम निर्णय पर निर्भर करता है, उनका अनुप्रयोग विवादास्पद हो सकता है [4]

यह भी देखें

संदर्भ

  1. Kannan, D.; Lakshmikantham, V., eds. (2002). स्टोकेस्टिक विश्लेषण और अनुप्रयोगों की पुस्तिका. New York: M. Dekker. ISBN 0824706609.
  2. Schervish, Mark J. (1995). सांख्यिकी का सिद्धांत (Corr. 2nd print. ed.). New York: Springer. ISBN 0387945466.
  3. Freedman, D.A. (2005) Statistical Models: Theory and Practice, Cambridge University Press. ISBN 978-0-521-67105-7
  4. 4.0 4.1 Freedman, David A. (2010). Collier, David; Sekhon, Jasjeet S.; Stark, Philp B. (eds.). Statistical Models and Causal Inference: A Dialogue with the Social Sciences. Cambridge University Press. ISBN 978-0-521-12390-7.
  5. Hogg, R. V., A. Craig, and J. W. McKean. "Intro to Mathematical Statistics." (2005).
  6. Larsen, Richard J. and Marx, Morris L. "An Introduction to Mathematical Statistics and Its Applications" (2012). Prentice Hall.
  7. Upton, G., Cook, I. (2008) Oxford Dictionary of Statistics, OUP. ISBN 978-0-19-954145-4
  8. "गैर-पैरामीट्रिक तरीकों पर शोध करें". Carnegie Mellon University. Retrieved August 30, 2022.
  9. 9.0 9.1 "गैरपैरामीट्रिक परीक्षण". sphweb.bumc.bu.edu. Retrieved 2022-08-31.
  10. Wald, Abraham (1947). Sequential analysis. New York: John Wiley and Sons. ISBN 0-471-91806-7. See Dover reprint, 2004: ISBN 0-486-43912-7
  11. Wald, Abraham (1950). Statistical Decision Functions. John Wiley and Sons, New York.
  12. Lehmann, Erich (1997). सांख्यिकीय परिकल्पनाओं का परीक्षण (2nd ed.). ISBN 0-387-94919-4.
  13. Lehmann, Erich; Cassella, George (1998). Theory of Point Estimation (2nd ed.). ISBN 0-387-98502-6.
  14. Bickel, Peter J.; Doksum, Kjell A. (2001). Mathematical Statistics: Basic and Selected Topics. Vol. 1 (Second (updated printing 2007) ed.). Pearson Prentice-Hall.
  15. Le Cam, Lucien (1986). Asymptotic Methods in Statistical Decision Theory. Springer-Verlag. ISBN 0-387-96307-3.
  16. Liese, Friedrich & Miescke, Klaus-J. (2008). Statistical Decision Theory: Estimation, Testing, and Selection. Springer.

अग्रिम पठन