बायेसियन सांख्यिकी

From Vigyanwiki

बायेसियन सांख्यिकी बायेसियन संभाव्यता पर आधारित सांख्यिकी के क्षेत्र में सिद्धांत है जहां संभाव्यता घटना (प्रायिकता सिद्धांत) में धारणा का परिमाण व्यक्त करती है। धारणा का परिमाण घटना के बारे में पूर्व ज्ञान पर आधारित हो सकती है, जैसे कि पिछले प्रयोगों के परिणाम, या घटना के बारे में व्यक्तिगत धारणाओं पर यह कई अन्य प्रायिकता व्याख्याओं से भिन्न है। जैसे फ़्रीक्वेंटिस्ट प्रायिकता व्याख्या जो प्रायिकता को कई परीक्षणों के बाद किसी घटना की सापेक्ष आवृत्ति के अनुक्रम की सीमा के रूप में देखती है।[1]

बायेसियन सांख्यिकीय विधियां नया डेटा प्राप्त करने के बाद संभावनाओं की गणना और अद्यतन करने के लिए बेयस प्रमेय का उपयोग करती हैं। बेयस प्रमेय डेटा के साथ-साथ घटना या घटना से संबंधित स्थितियों के बारे में पूर्व सूचना या मान्यताओं के आधार पर किसी घटना की सशर्त प्रायिकता का वर्णन करता है।[2][3] उदाहरण के लिए, बायेसियन निष्कर्ष में, बेयस प्रमेय का उपयोग संभाव्यता वितरण या सांख्यिकीय मॉडल के मापदंडो का निष्कर्ष लगाने के लिए किया जा सकता है। चूंकि बेयसियन सांख्यिकी संभाव्यता को धारणा का परिमाण के रूप में मानते हैं, बेयस प्रमेय सीधे संभाव्यता वितरण प्रदान कर सकता है जो मापदंड या मापदंड के समुच्चय को धारणा को मापता है।[1][2]

बायेसियन सांख्यिकी का नाम थॉमस बेयस के नाम पर रखा गया है। जिन्होंने 1763 में प्रकाशित डॉक्ट्रिन ऑफ चांस में समस्या को हल करने की दिशा में निबंध में बेयस प्रमेय का विशिष्ट स्थिति तैयार किया था। लाप्लास ने संभाव्यता की बायेसियन व्याख्या विकसित की थी।[4] लाप्लास ने कई सांख्यिकीय समस्याओं को हल करने के लिए उन विधियों का उपयोग किया जिन्हें अब बायेसियन माना जाता है। कई बायेसियन विधियों को बाद के लेखकों द्वारा विकसित किया गया था। किन्तु 1950 के दशक तक इस तरह के विधियों का वर्णन करने के लिए सामान्यतः इस शब्द का उपयोग नहीं किया गया था। 20वीं शताब्दी के अधिकांश समय के पश्चात्, दार्शनिक और व्यावहारिक विचारों के कारण कई सांख्यिकीविदों द्वारा बायेसियन विधियों को प्रतिकूल रूप से देखा गया था। कई बायेसियन विधियों को पूरा करने के लिए बहुत अधिक संगणना की आवश्यकता होती है, और शताब्दी के पश्चात् व्यापक रूप से उपयोग की जाने वाली अधिकांश विधियाँ बारंबारतावादी व्याख्या पर आधारित थीं। चूँकि, मार्कोव चेन मोंटे कार्लो जैसे शक्तिशाली कंप्यूटरों और नए कलन विधि के आगमन के साथ, 21वीं सदी में बायेसियन विधियों का सांख्यिकी में उपयोग बढ़ता हुआ देखा गया है।[1][5]

बेयस प्रमेय

बेयस प्रमेय का उपयोग बायेसियन विधियों में संभावनाओं को अद्यतन करने के लिए किया जाता है, जो नए डेटा प्राप्त करने के बाद धारणा का परिमाण हैं। दो घटनाओं और को देखते हुए की सशर्त प्रायिकता दी गई है कि सत्य है, इस प्रकार व्यक्त किया गया है। [6]

जहां चूँकि बेयस प्रमेय संभाव्यता सिद्धांत का मौलिक परिणाम है, किन्तु बायेसियन सांख्यिकी में इसकी विशिष्ट व्याख्या है। उपरोक्त समीकरण में, सामान्यतः प्रस्ताव का प्रतिनिधित्व करता है (जैसे कथन है कि एक सिक्का पचास प्रतिशत समय पर सिर पर पड़ता है) और प्रमाण का प्रतिनिधित्व करता है, या नया डेटा जिसे ध्यान में रखा जाना है (जैसे परिणाम सिक्का फ़्लिप की श्रृंखला)। की पूर्व प्रायिकता है जो प्रमाण को ध्यान में रखे जाने से पहले के बारे में किसी के विश्वास को व्यक्त करता है। पूर्व संभाव्यता भी . के बारे में जानकारी की मात्रा निर्धारित कर सकती है, प्रायिकता कार्य है, जिसे प्रमाण की प्रायिकता के रूप में व्याख्या किया जा सकता है कि सच है। प्रायिकता यह निर्धारित करती है कि प्रमाण किस सीमा तक प्रस्ताव का समर्थन करता है . पश्च संभाव्यता है, प्रमाण को ध्यान में रखने के बाद प्रस्ताव की प्रायिकता नए प्रमाण पर विचार करने के बाद अनिवार्य रूप से, बेयस प्रमेय किसी के पूर्व विश्वास को अद्यतन करता है।[1]

प्रमाण की प्रायिकता कुल संभाव्यता के नियम का उपयोग करके गणना की जा सकती है। यदि प्रतिरूप स्थान के एक समुच्चय का विभाजन है, जो एक प्रयोग के सभी परिणाम (संभाव्यता) का समुच्चय है, फिर,[1][6]

जब अनंत संख्या में परिणाम हों तो कुल संभाव्यता के नियम का उपयोग करके की गणना करने के लिए सभी परिणामों को एकीकृत करना आवश्यक है। अधिकांशतः की गणना करना कठिन होता है क्योंकि गणना में रकम या इंटीग्रल सम्मिलित होते हैं जो मूल्यांकन करने के लिए समय लेने वाली होती हैं | इसलिए अधिकांशतः केवल पूर्व और संभावना के उत्पाद पर विचार किया जाता है क्योंकि प्रमाण उसी विश्लेषण में नहीं बदलते हैं। पश्च भाग इस उत्पाद के समानुपाती होता है। [1]

अधिकतम पोस्टरियोरी, जो कि पोस्टीरियर का मोड (सांख्यिकी) है और अधिकांशतः गणितीय अनुकूलन विधियों का उपयोग करके बायेसियन आँकड़ों में गणना की जाती है, वही रहता है। मार्कोव श्रृंखला मोंटे कार्लो या परिवर्तनशील बायेसियन विधियों जैसे विधियों के साथ के स्पष्ट मान की गणना किए बिना भी पश्च का निष्कर्ष लगाया जा सकता है। [1]

बायेसियन विधियों की रूपरेखा

सांख्यिकीय विधियों के सामान्य समुच्चय को कई गतिविधियों में विभाजित किया जा सकता है। जिनमें से कई विशेष बायेसियन संस्करण हैं।

बायेसियन निष्कर्ष

बायेसियन निष्कर्ष सांख्यिकीय निष्कर्ष को संदर्भित करता है जहां संभाव्यता का उपयोग करके अनुमानों में अनिश्चितता की मात्रा निर्धारित की जाती है।[7] मौलिक आवृत्तिवादी निष्कर्ष में, मॉडल मापदंड और परिकल्पना को निश्चित माना जाता है। प्रायिकतावादी निष्कर्ष में प्रायिकताओं को प्राचलों या परिकल्पनाओं के लिए निर्दिष्ट नहीं किया जाता है। उदाहरण के लिए, बारंबारतावादी निष्कर्ष में किसी घटना को स्पष्ट रूप से प्रायिकता निर्दिष्ट करने का कोई कारण नहीं होगा जो केवल एक बार हो सकती है, जैसे कि निष्पक्ष सिक्के के अगले फ्लिप का परिणाम चूँकि, यह कहना समझदारी होगी कि बड़ी संख्या के नियम के प्रमुखों का अनुपात सिक्का उछालने की संख्या बढ़ने पर आधा हो जाता है।[8]

सांख्यिकीय मॉडल सांख्यिकीय मान्यताओं और प्रक्रियाओं का समुच्चय निर्दिष्ट करते हैं | जो दर्शाते हैं कि प्रतिरूप डेटा कैसे उत्पन्न होता है। सांख्यिकीय मॉडल में कई मापदंड होते हैं जिन्हें संशोधित किया जा सकता है। उदाहरण के लिए, एक सिक्के को बर्नौली वितरण से प्रतिरूप के रूप में दर्शाया जा सकता है, जो दो संभावित परिणामों को मॉडल करता है। बर्नौली वितरण में परिणाम की प्रायिकता के समान एकल मापदंड है। जो अधिकतर स्थितियों में सिर पर उतरने की प्रायिकता है। बायेसियन निष्कर्ष में डेटा के लिए अच्छा मॉडल तैयार करना केंद्रीय है। अधिकतर स्थितियों में, मॉडल केवल वास्तविक प्रक्रिया का निष्कर्ष लगाते हैं, और डेटा को प्रभावित करने वाले कुछ कारकों को ध्यान में नहीं रख सकते हैं।[1] बायेसियन निष्कर्ष में, प्रायिकताएं मॉडल पैरामीटर्स को असाइन की जा सकती हैं। मापदंडों को यादृच्छिक चर के रूप में दर्शाया जा सकता है। बायेसियन निष्कर्ष अधिक प्रमाण प्राप्त या ज्ञात होने के बाद संभावनाओं को अद्यतन करने के लिए बेयस प्रमेय का उपयोग करता है।[1][9]

सांख्यिकीय मॉडलिंग

बायेसियन आँकड़ों का उपयोग करते हुए सांख्यिकीय मॉडल के निर्माण में किसी भी अज्ञात मापदंडों के लिए पूर्व वितरण के विनिर्देश की आवश्यकता की पहचान करने की विशेषता है। वास्तव में, पूर्व वितरण के मापदंडों में स्वयं पूर्व वितरण हो सकते हैं, जिससे बायेसियन पदानुक्रमित मॉडलिंग हो सकती है।[10][11][12] बहु-स्तरीय मॉडलिंग के रूप में भी जाना जाता है। विशेष स्थिति बायेसियन नेटवर्क है।

बायेसियन सांख्यिकीय विश्लेषण करने के लिए, वैन डी शूट एट अल द्वारा सर्वोत्तम प्रथाओं पर चर्चा की जाती है।[13] बायेसियन सांख्यिकीय विश्लेषण के परिणामों की रिपोर्टिंग के लिए, बायेसियन विश्लेषण रिपोर्टिंग दिशानिर्देश (बर्ग) जॉन के. क्रुश्के द्वारा एक ओपन-एक्सेस लेख में प्रदान किए गए हैं।[14]

प्रयोगों की रचना

प्रयोगों के बेयसियन रचना में 'पूर्व मान्यताओं का प्रभाव' नामक अवधारणा सम्मिलित है। यह दृष्टिकोण अगले प्रयोग के रचना में पहले के प्रयोगों के परिणाम को सम्मिलित करने के लिए अनुक्रमिक विश्लेषण विधियों का उपयोग करता है। यह पूर्व और पश्च वितरण के उपयोग के माध्यम से 'धारणाओं' को अद्यतन करके प्राप्त किया जाता है। यह प्रयोगों के रचना को सभी प्रकार के संसाधनों का अच्छा उपयोग करने की अनुमति देता है। इसका उदाहरण मल्टी-आर्म्ड बैंडिट समस्या है।

बायेसियन मॉडल का अन्वेषणात्मक विश्लेषण

बायेसियन मॉडल का अन्वेषणात्मक विश्लेषण बायेसियन मॉडलिंग की आवश्यकताओं और विशिष्टताओं के लिए अन्वेषणात्मक डेटा विश्लेषण दृष्टिकोण का अनुकूलन या विस्तार है। फारसी डायकोनिस के शब्दों में:[15]

खोजपूर्ण डेटा विश्लेषण संरचना, या डेटा में सरल विवरण प्रकट करना चाहता है। हम संख्याओं या ग्राफ़ को देखते हैं और पैटर्न खोजने का प्रयास करते हैं। हम पृष्ठभूमि की जानकारी, कल्पना, कथित पैटर्न और अन्य डेटा विश्लेषणों के साथ अनुभव द्वारा सुझाए गए लीड का पीछा करते हैं

बायेसियन इंट्रेंस पोस्टीरियर डिस्ट्रीब्यूशन उत्पन्न करता है। जिसमें बायेसियन स्टैटिस्टिक्स में केंद्रीय भूमिका होती है, साथ में अन्य डिस्ट्रीब्यूशन जैसे पोस्टीरियर प्रेडिक्टिव डिस्ट्रीब्यूशन और प्री प्रेडिक्टिव डिस्ट्रीब्यूशन इन वितरणों का सही विज़ुअलाइज़ेशन, विश्लेषण और व्याख्या उन सवालों के सही उत्तर देने के लिए महत्वपूर्ण है जो निष्कर्ष प्रक्रिया को प्रेरित करते हैं।[16]

बायेसियन मॉडल के साथ काम करते समय संबंधित कार्यों की श्रृंखला होती है। जिसे स्वयं निष्कर्ष के अलावा संबोधित करने की आवश्यकता होती है।

  • निष्कर्ष की गुणवत्ता का निदान, मार्कोव श्रृंखला मोंटे कार्लो विधियों जैसे संख्यात्मक विधियों का उपयोग करते समय इसकी आवश्यकता होती है।
  • मॉडल आलोचना, जिसमें मॉडल मान्यताओं और मॉडल पूर्वानुमानो दोनों का मूल्यांकन सम्मिलित है।
  • मॉडल चयन या मॉडल औसत सहित मॉडलों की तुलना करती है।
  • किसी विशेष दर्शक वर्ग के लिए परिणामों की तैयारी होती है।

ये सभी कार्य बायेसियन मॉडल दृष्टिकोण के अन्वेषणात्मक विश्लेषण का भाग हैं और उनका सफलतापूर्वक प्रदर्शन करना पुनरावृत्त और इंटरैक्टिव मॉडलिंग प्रक्रिया का केंद्र है। इन कार्यों के लिए संख्यात्मक और दृश्य सारांश दोनों की आवश्यकता होती है।[17][18][19]

यह भी देखें

संदर्भ

  1. 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 Gelman, Andrew; Carlin, John B.; Stern, Hal S.; Dunson, David B.; Vehtari, Aki; Rubin, Donald B. (2013). बायेसियन डेटा विश्लेषण (Third ed.). Chapman and Hall/CRC. ISBN 978-1-4398-4095-5.
  2. 2.0 2.1 McElreath, Richard (2020). Statistical Rethinking : A Bayesian Course with Examples in R and Stan (2nd ed.). Chapman and Hall/CRC. ISBN 978-0-367-13991-9.
  3. Kruschke, John (2014). Doing Bayesian Data Analysis: A Tutorial with R, JAGS, and Stan (2nd ed.). Academic Press. ISBN 978-0-12-405888-0.
  4. McGrayne, Sharon (2012). The Theory That Would Not Die: How Bayes' Rule Cracked the Enigma Code, Hunted Down Russian Submarines, and Emerged Triumphant from Two Centuries of Controversy (First ed.). Chapman and Hall/CRC. ISBN 978-0-3001-8822-6.
  5. Fienberg, Stephen E. (2006). "When Did Bayesian Inference Become "Bayesian"?". Bayesian Analysis. 1 (1): 1–40. doi:10.1214/06-BA101.
  6. 6.0 6.1 Grinstead, Charles M.; Snell, J. Laurie (2006). संभाव्यता का परिचय (2nd ed.). Providence, RI: American Mathematical Society. ISBN 978-0-8218-9414-9.
  7. Lee, Se Yoon (2021). "Gibbs sampler and coordinate ascent variational inference: A set-theoretical review". Communications in Statistics - Theory and Methods. 51 (6): 1549–1568. arXiv:2008.01006. doi:10.1080/03610926.2021.1921214. S2CID 220935477.
  8. Wakefield, Jon (2013). बायेसियन और फ़्रीक्वेंटिस्ट रिग्रेशन के तरीके. New York, NY: Springer. ISBN 978-1-4419-0924-4.
  9. Congdon, Peter (2014). एप्लाइड बायेसियन मॉडलिंग (2nd ed.). Wiley. ISBN 978-1119951513.
  10. Kruschke, J K; Vanpaemel, W (2015). "Bayesian Estimation in Hierarchical Models". In Busemeyer, J R; Wang, Z; Townsend, J T; Eidels, A (eds.). कम्प्यूटेशनल और गणितीय मनोविज्ञान की ऑक्सफोर्ड हैंडबुक (PDF). Oxford University Press. pp. 279–299.
  11. Hajiramezanali, E. & Dadaneh, S. Z. & Karbalayghareh, A. & Zhou, Z. & Qian, X. Bayesian multi-domain learning for cancer subtype discovery from next-generation sequencing count data. 32nd Conference on Neural Information Processing Systems (NIPS 2018), Montréal, Canada. arXiv:1810.09433
  12. Lee, Se Yoon; Mallick, Bani (2021). "Bayesian Hierarchical Modeling: Application Towards Production Results in the Eagle Ford Shale of South Texas". Sankhya B. 84: 1–43. doi:10.1007/s13571-020-00245-8.
  13. van de Schoot, Rens; Depaoli, Sarah; King, Ruth; Kramer, Bianca; Märtens, Kaspar; Tadesse, Mahlet G.; Vannucci, Marina; Gelman, Andrew; Veen, Duco; Willemsen, Joukje; Yau, Christopher (January 14, 2021). "बायेसियन सांख्यिकी और मॉडलिंग". Nature Reviews Methods Primers. 1 (1): 1–26. doi:10.1038/s43586-020-00001-2. hdl:1874/415909. S2CID 234108684.
  14. Kruschke, J K (Aug 16, 2021). "बायेसियन विश्लेषण रिपोर्टिंग दिशानिर्देश". Nature Human Behaviour. 5 (10): 1282–1291. doi:10.1038/s41562-021-01177-7. PMC 8526359. PMID 34400814.
  15. Diaconis, Persi (2011) Theories of Data Analysis: From Magical Thinking Through Classical Statistics. John Wiley & Sons, Ltd 2:e55 doi:10.1002/9781118150702.ch1
  16. Kumar, Ravin; Carroll, Colin; Hartikainen, Ari; Martin, Osvaldo (2019). "ArviZ Python में बायेसियन मॉडल के अन्वेषणात्मक विश्लेषण के लिए एक एकीकृत पुस्तकालय है". Journal of Open Source Software. 4 (33): 1143. Bibcode:2019JOSS....4.1143K. doi:10.21105/joss.01143.
  17. Gabry, Jonah; Simpson, Daniel; Vehtari, Aki; Betancourt, Michael; Gelman, Andrew (2019). "बायेसियन वर्कफ़्लो में विज़ुअलाइज़ेशन". Journal of the Royal Statistical Society, Series A (Statistics in Society). 182 (2): 389–402. arXiv:1709.01449. doi:10.1111/rssa.12378. S2CID 26590874.
  18. Vehtari, Aki; Gelman, Andrew; Simpson, Daniel; Carpenter, Bob; Bürkner, Paul-Christian (2021). "Rank-Normalization, Folding, and Localization: An Improved Rˆ for Assessing Convergence of MCMC (With Discussion)". Bayesian Analysis. 16 (2). arXiv:1903.08008. doi:10.1214/20-BA1221. S2CID 88522683.
  19. Martin, Osvaldo (2018). Bayesian Analysis with Python: Introduction to statistical modeling and probabilistic programming using PyMC3 and ArviZ (in English). Packt Publishing Ltd. ISBN 9781789341652.


अग्रिम पठन


बाहरी संबंध