पश्च पूर्वानुमानित वितरण: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
 
(5 intermediate revisions by 3 users not shown)
Line 2: Line 2:
{{Bayesian statistics}}
{{Bayesian statistics}}


बायेसियन आँकड़ों में, पश्च पूर्वानुमानित  वितरण देखे गए मूल्यों पर नियमानुसार संभावित न देखे गए मूल्यों का वितरण है।<ref>{{cite web|title=पश्च भविष्य कहनेवाला वितरण|url=http://support.sas.com/documentation/cdl/en/statug/63033/HTML/default/viewer.htm#statug_mcmc_sect034.htm|publisher=SAS|accessdate=19 July 2014}}</ref><ref name="BDA32">{{Cite book|last1=Gelman|first1=Andrew|title=बायेसियन डेटा विश्लेषण|edition=Third|last2=Carlin|first2=John B.|last3=Stern|first3=Hal S.|last4=Dunson|first4=David B.|last5=Vehtari|first5=Aki|last6=Rubin|first6=Donald B.|publisher=Chapman and Hall/CRC|year=2013|isbn=978-1-4398-4095-5|author-link1=Andrew Gelman|author-link2=John Carlin (professor)|author-link6=Donald Rubin|page=7}}</ref>
बायेसियन आँकड़ों में, पश्च पूर्वानुमानित  वितरण देखे गए मानों  पर नियमानुसार संभावित न देखे गए मानों  का वितरण है।<ref>{{cite web|title=पश्च भविष्य कहनेवाला वितरण|url=http://support.sas.com/documentation/cdl/en/statug/63033/HTML/default/viewer.htm#statug_mcmc_sect034.htm|publisher=SAS|accessdate=19 July 2014}}</ref><ref name="BDA32">{{Cite book|last1=Gelman|first1=Andrew|title=बायेसियन डेटा विश्लेषण|edition=Third|last2=Carlin|first2=John B.|last3=Stern|first3=Hal S.|last4=Dunson|first4=David B.|last5=Vehtari|first5=Aki|last6=Rubin|first6=Donald B.|publisher=Chapman and Hall/CRC|year=2013|isbn=978-1-4398-4095-5|author-link1=Andrew Gelman|author-link2=John Carlin (professor)|author-link6=Donald Rubin|page=7}}</ref>


''N'' आई.आई.डी. का एक सेट दिया गया अवलोकन <math>\mathbf{X} = \{x_1, \dots, x_N\}</math> एक नया मान https://alpha.indicwiki.in/index.php?title=Special:MathShowImage&hash=086c1c983eef5f4ec1e9183b80dea13e&mode=mathml एक वितरण से निकाला जाएगा जो एक पैरामीटर <math>\theta \in \Theta</math> पर निर्भर करता है, जहां <math>\Theta</math> पैरामीटर स्पेस है.
''N'' आई.आई.डी. का एक समुच्चय दिया गया अवलोकन <math>\mathbf{X} = \{x_1, \dots, x_N\}</math> एक नया मान एक वितरण से निकाला जाएगा जो एक पैरामीटर <math>\theta \in \Theta</math> पर निर्भर करता है, जहां <math>\Theta</math> पैरामीटर स्पेस है.
:<math>p(\tilde{x}|\theta)</math>
:<math>p(\tilde{x}|\theta)</math>
<math>\theta</math> के लिए एक सर्वोत्तम अनुमान <math>\hat{\theta}</math> जोड़ना आकर्षक लग सकता है, किंतु  यह <math>\theta</math> के बारे में अनिश्चितता को अनदेखा कर देता है, और क्योंकि अनिश्चितता के स्रोत को अनदेखा कर दिया जाता है, इसलिए पूर्वानुमानित वितरण बहुत संकीर्ण होता है । दूसरे विधि से कहें तो, यदि उनके पश्च वितरण द्वारा दिए गए मापदंडों में अनिश्चितता को ध्यान में रखा जाए, तो <math>\tilde{x}</math> के चरम मूल्यों की भविष्यवाणियों की संभावना कम होगी।
<math>\theta</math> के लिए एक सर्वोत्तम अनुमान <math>\hat{\theta}</math> जोड़ना आकर्षक लग सकता है, किंतु  यह <math>\theta</math> के बारे में अनिश्चितता को अनदेखा कर देता है, और क्योंकि अनिश्चितता के स्रोत को अनदेखा कर दिया जाता है, इसलिए पूर्वानुमानित वितरण बहुत संकीर्ण होता है । दूसरे विधि से कहें तो, यदि उनके पश्च वितरण द्वारा दिए गए मापदंडों में अनिश्चितता को ध्यान में रखा जाए, तो <math>\tilde{x}</math> के वेरिएबल म मानों  की भविष्यवाणियों की संभावना कम होगी।


एक पश्च पूर्वानुमानित   वितरण <math>\theta</math> के बारे में अनिश्चितता का कारण बनता है। संभावित <math>\theta</math> मानों का पश्च वितरण <math>\mathbf{X}</math> पर निर्भर करता है।: <math>
एक पश्च पूर्वानुमानित वितरण <math>\theta</math> के बारे में अनिश्चितता का कारण बनता है। संभावित <math>\theta</math> मानों का पश्च वितरण <math>\mathbf{X}</math> पर निर्भर करता है।:
 
<math>
p(\theta|\mathbf{X})
p(\theta|\mathbf{X})
</math>
</math>  
 
और दिए गए <math>\tilde{x}</math> के <math>\mathbf{X}</math> के पश्च पूर्वानुमानित वितरण की गणना <math>\mathbf{X}</math> दिए गए <math>\theta</math> के पश्च वितरण की तुलना में दिए गए <math>\theta</math> के <math>\tilde{x}</math> के वितरण को मर्जीनिलाइज्द पर रखकर की जाती है।
और दिए गए <math>\tilde{x}</math> के <math>\mathbf{X}</math> के पश्च पूर्वानुमानित वितरण की गणना <math>\mathbf{X}</math> दिए गए <math>\theta</math> के पश्च वितरण की तुलना में दिए गए <math>\theta</math> के <math>\tilde{x}</math> के वितरण को मर्जीनिलाइज्द पर रखकर की जाती है।
:<math>p(\tilde{x}|\mathbf{X}) = \int_{\Theta} p(\tilde{x}|\theta) \, p(\theta|\mathbf{X}) \operatorname{d}\!\theta</math>
:<math>p(\tilde{x}|\mathbf{X}) = \int_{\Theta} p(\tilde{x}|\theta) \, p(\theta|\mathbf{X}) \operatorname{d}\!\theta                                                     </math>
क्योंकि यह <math>\theta</math> के बारे में अनिश्चितता का कारण बनता है, पश्च पूर्वानुमानित  वितरण समान्यत: एक पूर्वानुमानित वितरण से अधिक व्यापक होगा जो <math>\theta</math> के लिए एकल सर्वोत्तम अनुमान में प्लग करता है।
क्योंकि यह <math>\theta</math> के बारे में अनिश्चितता का कारण बनता है, पश्च पूर्वानुमानित  वितरण समान्यत: एक पूर्वानुमानित वितरण से अधिक व्यापक होगा जो <math>\theta</math> के लिए एकल सर्वोत्तम अनुमान में प्लग करता है।
==पूर्व बनाम पश्च पूर्वानुमानित  वितरण==
==पूर्व बनाम पश्च पूर्वानुमानित  वितरण==
Line 31: Line 34:
इसलिए, पश्च पूर्वानुमानित वितरण पूर्व पूर्वानुमानित वितरण के समान वितरण एच का अनुसरण करता है, किंतु पूर्व वाले के लिए प्रतिस्थापित हाइपरपैरामीटर के पश्च मानों के साथ अनुसरण करता है ।
इसलिए, पश्च पूर्वानुमानित वितरण पूर्व पूर्वानुमानित वितरण के समान वितरण एच का अनुसरण करता है, किंतु पूर्व वाले के लिए प्रतिस्थापित हाइपरपैरामीटर के पश्च मानों के साथ अनुसरण करता है ।


पूर्व पूर्वानुमानित वितरण एक मिश्रित वितरण के रूप में होता है, और वास्तव में इसका उपयोग  अधिकांशतः एक मिश्रित वितरण को परिभाषित करने के लिए किया जाता है, क्योंकि किसी भी जटिल कारकों की कमी होती है जैसे कि डेटा पर निर्भरता <math>\mathbf{X}</math> और संयुग्मता का उद्देश्य उदाहरण के लिए, छात्र के T-वितरण को ज्ञात माध्य μ किंतु अज्ञात विचरण ''σ<sub>x</sub><sup>2</sup>''के साथ एक सामान्य वितरण के पूर्व पूर्वानुमानित वितरण के रूप में परिभाषित किया जा सकता है, हाइपरपैरामीटर ν और σ2 के साथ ''σ<sub>x</sub><sup>2</sup>'' पर रखे गए संयुग्मित पूर्व स्केल-व्युत्क्रम-ची-वर्ग वितरण के साथ यह परिणामी यौगिक वितरण <math>t(x|\mu,\nu,\sigma^2)</math> वास्तव में एक गैर-मानकीकृत छात्र का t-वितरण है, और इस वितरण के दो सबसे सामान्य मापदंडों में से एक का अनुसरण करता है। फिर, संबंधित पश्च पूर्वानुमानित  वितरण फिर से छात्र का T होगा, अद्यतन हाइपरपैरामीटर <math>\nu', {\sigma^2}'</math> के साथ जो पश्च वितरण में दिखाई देते हैं, वे सीधे पश्च पूर्वानुमानित वितरण में भी दिखाई देते हैं।।
पूर्व पूर्वानुमानित वितरण एक मिश्रित वितरण के रूप में होता है, और वास्तव में इसका उपयोग  अधिकांशतः एक मिश्रित वितरण को परिभाषित करने के लिए किया जाता है, क्योंकि किसी भी सम्मिश्र कारकों की कमी होती है जैसे कि डेटा पर निर्भरता <math>\mathbf{X}</math> और संयुग्मता का उद्देश्य उदाहरण के लिए, छात्र के T-वितरण को ज्ञात माध्य μ किंतु अज्ञात विवेरिएबल ण ''σ<sub>x</sub><sup>2</sup>'' के साथ एक सामान्य वितरण के पूर्व पूर्वानुमानित वितरण के रूप में परिभाषित किया जा सकता है, हाइपरपैरामीटर ν और σ2 के साथ ''σ<sub>x</sub><sup>2</sup>'' पर रखे गए संयुग्मित पूर्व स्केल-व्युत्क्रम-ची-वर्ग वितरण के साथ यह परिणामी यौगिक वितरण <math>t(x|\mu,\nu,\sigma^2)</math> वास्तव में एक गैर-मानकीकृत छात्र का t-वितरण है, और इस वितरण के दो सबसे सामान्य मापदंडों में से एक का अनुसरण करता है। फिर, संबंधित पश्च पूर्वानुमानित  वितरण फिर से छात्र का T होगा, अद्यतन हाइपरपैरामीटर <math>\nu', {\sigma^2}'</math> के साथ जो पश्च वितरण में दिखाई देते हैं, वे सीधे पश्च पूर्वानुमानित वितरण में भी दिखाई देते हैं।।


कुछ स्थिति में उपयुक्त यौगिक वितरण को उस पैरामीटर से भिन्न पैरामीटरीकरण का उपयोग करके परिभाषित किया जाता है जो वर्तमान समस्या में पूर्वानुमानित वितरण के लिए सबसे स्वाभाविक होगा।  अधिकांशतः इसका परिणाम यह होता है क्योंकि मिश्रित वितरण को परिभाषित करने के लिए उपयोग किया गया पूर्व वितरण वर्तमान समस्या में उपयोग किए गए वितरण से भिन्न होता है। उदाहरण के लिए, जैसा कि ऊपर बताया गया है, छात्र के T-वितरण को विचरण पर रखे गए स्केल-व्युत्क्रम-ची-वर्ग वितरण के संदर्भ में परिभाषित किया गया था। चूँकि  इस स्थिति में संयुग्म पूर्व के रूप में व्युत्क्रम गामा वितरण का उपयोग करना अधिक सामान्य है। पैरामीटरीकरण को छोड़कर दोनों वास्तव में समतुल्य हैं; इसलिए, छात्र के T-वितरण का उपयोग अभी भी पूर्वानुमानित वितरण के लिए किया जा सकता है, किंतु  हाइपरपैरामीटर को प्लग इन करने से पहले पुन: पैरामीटराइज़ किया जाना चाहिए।
कुछ स्थिति में उपयुक्त यौगिक वितरण को उस पैरामीटर से भिन्न पैरामीटरीकरण का उपयोग करके परिभाषित किया जाता है जो वर्तमान समस्या में पूर्वानुमानित वितरण के लिए सबसे स्वाभाविक होगा।  अधिकांशतः इसका परिणाम यह होता है क्योंकि मिश्रित वितरण को परिभाषित करने के लिए उपयोग किया गया पूर्व वितरण वर्तमान समस्या में उपयोग किए गए वितरण से भिन्न होता है। उदाहरण के लिए, जैसा कि ऊपर बताया गया है, छात्र के T-वितरण को विवेरिएबल ण पर रखे गए स्केल-व्युत्क्रम-ची-वर्ग वितरण के संदर्भ में परिभाषित किया गया था। चूँकि  इस स्थिति में संयुग्म पूर्व के रूप में व्युत्क्रम गामा वितरण का उपयोग करना अधिक सामान्य है। पैरामीटरीकरण को छोड़कर दोनों वास्तव में समतुल्य हैं; इसलिए, छात्र के T-वितरण का उपयोग अभी भी पूर्वानुमानित वितरण के लिए किया जा सकता है, किंतु  हाइपरपैरामीटर को प्लग इन करने से पहले पुन: पैरामीटराइज़ किया जाना चाहिए।
==घातांकीय वर्गों में==
==घातांकीय वर्गों में==
अधिकांश किंतु  सभी नहीं वितरण के सामान्य वर्ग [[घातीय परिवार|घातीय]] वर्ग हैं। घातीय वर्गों में बड़ी संख्या में उपयोगी गुण होते हैं। इनमें से एक यह है कि सभी सदस्यों में संयुग्मित पूर्व वितरण होते हैं - जबकि बहुत कम अन्य वितरणों में संयुग्मित पूर्व होते हैं।
अधिकांश किंतु  सभी नहीं वितरण के सामान्य वर्ग [[घातीय परिवार|घातीय]] वर्ग हैं। घातीय वर्गों में बड़ी संख्या में उपयोगी गुण होते हैं। इनमें से एक यह है कि सभी सदस्यों में संयुग्मित पूर्व वितरण होते हैं - जबकि बहुत कम अन्य वितरणों में संयुग्मित पूर्व होते हैं।
===घातांकीय परिवारों में पूर्व पूर्वानुमानित वितरण===
===घातांकीय वर्गों में पूर्व पूर्वानुमानित वितरण===
ए'''क अन्य उपयोगी संपत्ति यह है कि एक घातीय पारिवारिक''' वितरण के पूर्व पूर्वानुमानित वितरण के अनुरूप यौगिक वितरण की संभाव्यता घनत्व फ़ंक्शन, इसके संयुग्मित पूर्व वितरण पर सीमांत वितरण को विश्लेषणात्मक रूप से निर्धारित किया जा सकता है। ये मान लीजिए <math>F(x|\boldsymbol{\theta})</math> पैरामीटर वाले घातीय परिवार का सदस्य है <math>\boldsymbol{\theta}</math> जो कि [[प्राकृतिक पैरामीटर]] के अनुसार पैरामीट्रिज्ड है <math>\boldsymbol{\eta} = \boldsymbol{\eta}(\boldsymbol{\theta})</math>, और के रूप में वितरित किया जाता है
अन्य उपयोगी संपत्ति यह है कि इसके संयुग्मित पूर्व वितरण पर सीमांत वितरण पर रखे गए एक घातांकीय पारिवारिक वितरण के पूर्व पूर्वानुमानित वितरण के अनुरूप यौगिक वितरण की संभाव्यता घनत्व फलन को विश्लेषणात्मक रूप से निर्धारित किया जा सकता है। मान लें कि <math>F(x|\boldsymbol{\theta})</math> पैरामीटर <math>\boldsymbol{\theta}</math> के साथ घातीय वर्ग  का सदस्य है जो प्राकृतिक पैरामीटर <math>\boldsymbol{\eta} = \boldsymbol{\eta}(\boldsymbol{\theta})</math> के अनुसार पैरामीट्रिज्ड है, और इसे इस प्रकार वितरित किया गया है


:<math>p_F(x|\boldsymbol{\eta}) = h(x)g(\boldsymbol{\eta})e^{\boldsymbol{\eta}^{\rm T}\mathbf{T}(x)}</math>
:<math>p_F(x|\boldsymbol{\eta}) = h(x)g(\boldsymbol{\eta})e^{\boldsymbol{\eta}^{\rm T}\mathbf{T}(x)}</math>
Line 51: Line 54:
                           &= {\displaystyle h(x) f(\boldsymbol{\chi},\nu) \int\limits_\boldsymbol{\eta} g(\boldsymbol{\eta})^{\nu+1} e^{\boldsymbol{\eta}^{\rm T}(\boldsymbol{\chi} + \mathbf{T}(x))} \,\operatorname{d}\boldsymbol{\eta}} \\
                           &= {\displaystyle h(x) f(\boldsymbol{\chi},\nu) \int\limits_\boldsymbol{\eta} g(\boldsymbol{\eta})^{\nu+1} e^{\boldsymbol{\eta}^{\rm T}(\boldsymbol{\chi} + \mathbf{T}(x))} \,\operatorname{d}\boldsymbol{\eta}} \\
                           &= h(x) \dfrac{f(\boldsymbol{\chi},\nu)}{f(\boldsymbol{\chi} + \mathbf{T}(x), \nu+1)}
                           &= h(x) \dfrac{f(\boldsymbol{\chi},\nu)}{f(\boldsymbol{\chi} + \mathbf{T}(x), \nu+1)}
\end{align}
\end{align}                                                                                              
</math>
</math>
अंतिम पंक्ति पिछले एक से अनुसरण करती है, यह पहचान कर कि इंटीग्रल के अंदर का फ़ंक्शन एक यादृच्छिक चर का घनत्व फ़ंक्शन है जिसे वितरित किया गया है <math>G(\boldsymbol{\eta}| \boldsymbol{\chi} + \mathbf{T}(x), \nu+1)</math>, [[सामान्यीकरण स्थिरांक]] फ़ंक्शन को छोड़कर <math>f(\dots)\,</math>. इसलिए एकीकरण का परिणाम सामान्यीकरण कार्य का व्युत्क्रम होगा।


उपरोक्त परिणाम पैरामीट्रिजेशन की पसंद से स्वतंत्र है <math>\boldsymbol{\theta}</math>, किसी के रूप में नहीं <math>\boldsymbol{\theta}</math>, <math>\boldsymbol{\eta}</math> और <math>g(\dots)\,</math> दिखाई पड़ना। (<math>g(\dots)\,</math> पैरामीटर का एक फ़ंक्शन है और इसलिए यह पैरामीट्रिज़ेशन की पसंद के आधार पर अलग-अलग रूप धारण करेगा।) के मानक विकल्पों के लिए <math>F</math> और <math>G</math>, प्राकृतिक मापदंडों के संदर्भ में फिर से लिखने के बजाय सामान्य मापदंडों के साथ सीधे काम करना अक्सर आसान होता है।


इंटीग्रल के ट्रैक्टेबल होने का कारण यह है कि इसमें [[पूर्व वितरण]] और [[संभावना]] के उत्पाद द्वारा परिभाषित घनत्व के [[सामान्यीकरण स्थिरांक]] की गणना करना शामिल है। जब दोनों पहले संयुग्मित होते हैं, तो उत्पाद एक [[पश्च वितरण]] होता है, और धारणा से, इस वितरण का सामान्यीकरण स्थिरांक ज्ञात होता है। जैसा कि ऊपर दिखाया गया है, यौगिक वितरण का घनत्व फ़ंक्शन एक विशेष रूप का अनुसरण करता है, जिसमें फ़ंक्शन का उत्पाद शामिल होता है <math>h(x)</math> यह घनत्व फ़ंक्शन का हिस्सा बनता है <math>F</math>, सामान्यीकरण स्थिरांक के दो रूपों के भागफल के साथ <math>G</math>, एक पूर्व वितरण से प्राप्त हुआ और दूसरा पश्च वितरण से। [[बीटा-[[द्विपद वितरण]]]] इस बात का एक अच्छा उदाहरण है कि यह प्रक्रिया कैसे काम करती है।


ऐसे वितरणों की विश्लेषणात्मक सुगमता के बावजूद, वे स्वयं आमतौर पर घातीय परिवार के सदस्य नहीं होते हैं। उदाहरण के लिए, तीन-पैरामीटर छात्र का टी वितरण, बीटा-द्विपद वितरण और [[डिरिचलेट-बहुपद वितरण]] सभी घातीय-पारिवारिक वितरण (क्रमशः सामान्य वितरण, द्विपद वितरण और [[बहुपद वितरण]]) के पूर्वानुमानित वितरण हैं, लेकिन कोई भी घातांक का सदस्य नहीं है परिवार। कार्यात्मक निर्भरता की उपस्थिति के कारण इसे ऊपर देखा जा सकता है <math>\boldsymbol{\chi} + \mathbf{T}(x)</math>. एक घातीय-पारिवारिक वितरण में, संपूर्ण घनत्व फ़ंक्शन को तीन प्रकार के गुणक कारकों में अलग करना संभव होना चाहिए: (1) केवल चर वाले कारक, (2) केवल पैरामीटर वाले कारक, और (3) ऐसे कारक जिनका लघुगणक चर के बीच कारक होता है और पैरामीटर. की उपस्थिति <math>\boldsymbol{\chi} + \mathbf{T}(x){\chi}</math> सामान्यीकरण कार्य होने तक यह असंभव हो जाता है <math>f(\dots)\,</math>या तो संबंधित तर्क को पूरी तरह से अनदेखा कर देता है या केवल अभिव्यक्ति के प्रतिपादक में इसका उपयोग करता है।
अंतिम पंक्ति पिछली पंक्ति का अनुसरण करती है, यह पहचान कर कि इंटीग्रल के अंदर का फलन सामान्यीकृत फलन <math>f(\dots)\,</math> को छोड़कर,<math>G(\boldsymbol{\eta}| \boldsymbol{\chi} + \mathbf{T}(x), \nu+1)</math> के रूप में वितरित एक यादृच्छिक वेरिएबल  का घनत्व फलन है। इसलिए एकीकरण का परिणाम सामान्यीकरण कार्य का व्युत्क्रम होगा।
 
उपरोक्त परिणाम <math>\boldsymbol{\theta}</math> के पैरामीट्रिज़ेशन की पसंद से स्वतंत्र है, क्योंकि <math>\boldsymbol{\theta}</math> <math>\boldsymbol{\eta}</math> और <math>g(\dots)\,</math> में से कोई भी दिखाई नहीं देता है। <math>g(\dots)\,</math>, पैरामीटर का एक फलन है और इसलिए पैरामीट्रिजेशन की पसंद के आधार पर अलग-अलग रूप धारण करेगा।)  <math>F</math> और <math>G</math> के मानक विकल्पों के लिए, प्राकृतिक मापदंडों के संदर्भ में फिर से लिखने के अतिरीक्त सामान्य मापदंडों के साथ सीधे काम करना अधिकांशतः आसान होता है।
 
इंटीग्रल के ट्रैक्टेबल होने का कारण यह है कि इसमें पूर्व वितरण और संभावना के उत्पाद द्वारा परिभाषित घनत्व के सामान्यीकरण स्थिरांक की गणना करना सम्मिलित है। जब दोनों संयुग्मित होते हैं, तो उत्पाद एक पश्च वितरण होता है, और धारणा से, इस वितरण का सामान्यीकरण स्थिरांक ज्ञात होता है। जैसा कि ऊपर दिखाया गया है, यौगिक वितरण का घनत्व फलन एक विशेष रूप का अनुसरण करता है, जिसमें फलन <math>h(x)</math> का उत्पाद सम्मिलित होता है जो <math>F</math> के लिए घनत्व फलन का भाग बनता है, सामान्यीकरण के दो रूपों के भागफल के साथ "स्थिर" <math>G</math>, एक पूर्व वितरण से और दूसरा पश्च वितरण से प्राप्त हुआ है। बीटा-द्विपद वितरण इस बात का एक अच्छा उदाहरण है कि यह प्रक्रिया कैसे काम करती है।
 


===घातांकीय परिवारों में पश्च पूर्वानुमानित वितरण===
ऐसे वितरणों की विश्लेषणात्मक सुगमता के बावजूद, वे स्वयं सामान्यतः घातीय वर्ग  के सदस्य नहीं होते हैं। उदाहरण के लिए, तीन-पैरामीटर छात्र का T वितरण, बीटा-द्विपद वितरण और डिरिचलेट-मल्टीनोमियल वितरण सभी घातीय-पारिवारिक वितरण (क्रमशः सामान्य वितरण, द्विपद वितरण और बहुपद वितरण) के पूर्वानुमानित वितरण हैं, किंतु कोई भी घातांक का सदस्य नहीं है वर्ग । इसे <math>\boldsymbol{\chi} + \mathbf{T}(x)</math> पर कार्यात्मक निर्भरता की उपस्थिति के कारण ऊपर देखा जा सकता है। एक घातीय-पारिवारिक वितरण में, संपूर्ण घनत्व फलन को तीन प्रकार के गुणक कारकों में अलग करना संभव होना चाहिए: (1) केवल वेरिएबल  वाले कारक, (2) केवल पैरामीटर वाले कारक, और (3) ऐसे कारक जिनका लघुगणक वेरिएबल  के बीच कारक होता है और पैरामीटर. <math>\boldsymbol{\chi} + \mathbf{T}(x){\chi}</math> की उपस्थिति इसे असंभव बनाती है जब तक कि "सामान्यीकरण" फलन <math>f(\dots)\,</math>, या तो संबंधित तर्क को पूरी तरह से अनदेखा नहीं करता है या केवल अभिव्यक्ति के प्रतिपादक में इसका उपयोग करता है।
जब एक संयुग्मित पूर्व का उपयोग किया जा रहा है, तो पश्च भविष्य कहनेवाला वितरण पूर्व पूर्वानुमानित वितरण के समान परिवार से संबंधित होता है, और पूर्व पूर्वानुमानित वितरण के सूत्र में पैरामीटर के पश्च वितरण के लिए अद्यतन हाइपरपैरामीटर को प्लग करके निर्धारित किया जाता है। . घातीय-पारिवारिक वितरण के लिए पश्च अद्यतन समीकरणों के सामान्य रूप का उपयोग करते हुए (घातांकीय परिवार#बायेसियन अनुमान देखें: संयुग्म वितरण), हम पश्च भविष्य कहनेवाला वितरण के लिए एक स्पष्ट सूत्र लिख सकते हैं:
 
===घातांकीय वर्ग ों में पश्च पूर्वानुमानित वितरण                             ===
जब एक संयुग्मित पूर्व का उपयोग किया जा रहा है, तो पश्च पूर्वानुमानित वितरण पूर्व पूर्वानुमानित वितरण के समान वर्ग  से संबंधित होता है, और पूर्व पूर्वानुमानित वितरण के सूत्र में पैरामीटर के पश्च वितरण के लिए अद्यतन हाइपरपैरामीटर को प्लग करके निर्धारित किया जाता है। . घातीय-पारिवारिक वितरण के लिए पश्च अद्यतन समीकरणों के सामान्य रूप का उपयोग करते हुए (घातांकीय वर्ग  या बायेसियन अनुमान देखें: संयुग्म वितरण), हम पश्च पूर्वानुमानित वितरण के लिए एक स्पष्ट सूत्र लिख सकते हैं:


: <math>
: <math>
Line 70: Line 77:
\end{array}
\end{array}
</math>
</math>
कहाँ
जहाँ


:<math>\mathbf{T}(\mathbf{X}) = \sum_{i=1}^N \mathbf{T}(x_i)</math>
:<math>\mathbf{T}(\mathbf{X}) = \sum_{i=1}^N \mathbf{T}(x_i)</math>
इससे पता चलता है कि अवलोकनों की एक श्रृंखला का पिछला पूर्वानुमानित वितरण, ऐसे मामले में जहां अवलोकन उचित संयुग्मित पूर्व के साथ एक घातीय परिवार का पालन करते हैं, ऊपर निर्दिष्ट पैरामीटर के साथ, यौगिक वितरण के समान ही संभाव्यता घनत्व होता है।
इससे पता चलता है कि अवलोकनों की एक श्रृंखला का पिछला पूर्वानुमानित वितरण, ऐसे स्थिति  में जहां अवलोकन उचित संयुग्मित पूर्व के साथ एक घातीय वर्ग  का पालन करते हैं, ऊपर निर्दिष्ट पैरामीटर के साथ, यौगिक वितरण के समान ही संभाव्यता घनत्व होता है।
अवलोकन स्वयं केवल रूप में ही प्रविष्ट होते हैं <math>\mathbf{T}(\mathbf{X}) = \sum_{i=1}^N \mathbf{T}(x_i) .</math>
 
इसे प्रेक्षणों का [[पर्याप्त आँकड़ा]] कहा जाता है, क्योंकि यह हमें वह सब कुछ बताता है जो हमें प्रेक्षणों के बारे में जानने की आवश्यकता है ताकि उनके आधार पर पश्च या पश्च भविष्य कहनेवाला वितरण की गणना की जा सके (या, उस मामले के लिए, संभावना फ़ंक्शन के आधार पर कुछ और भी) अवलोकन, जैसे कि [[सीमांत संभावना]])।
अवलोकन स्वयं केवल रूप में <math>\mathbf{T}(\mathbf{X}) = \sum_{i=1}^N \mathbf{T}(x_i) .</math> ही प्रविष्ट होते हैं
 
इसे प्रेक्षणों का [[पर्याप्त आँकड़ा|पर्याप्त डेटा]] कहा जाता है, क्योंकि यह हमें वह सब कुछ बताता है जो हमें प्रेक्षणों के बारे में जानने की आवश्यकता है जिससे  उनके आधार पर पश्च या पश्च पूर्वानुमानित वितरण की गणना की जा सकता है (या, उस स्थिति  के लिए, संभावना फलन के आधार पर कुछ और भी) अवलोकन, जैसे कि [[सीमांत संभावना]])।


===संयुक्त पूर्वानुमानित वितरण, सीमांत संभावना===
===संयुक्त पूर्वानुमानित वितरण, सीमांत संभावना===
एक साझा पैरामीटर पर पूर्व वितरण के साथ स्वतंत्र समान रूप से वितरित नमूनों की एक निश्चित संख्या पर संयुक्त वितरण को संयोजित करने के परिणाम पर विचार करना भी संभव है। बायेसियन सेटिंग में, यह विभिन्न संदर्भों में सामने आता है: कई नए अवलोकनों के पूर्व या पश्च पूर्वानुमान वितरण की गणना करना, और देखे गए डेटा की सीमांत संभावना की गणना करना (बेयस कानून में हर)। जब नमूनों का वितरण घातीय परिवार से होता है और पूर्व वितरण संयुग्मित होता है, तो परिणामी यौगिक वितरण सुव्यवस्थित होगा और उपरोक्त अभिव्यक्ति के समान रूप का पालन करेगा। वास्तव में, यह दिखाना आसान है कि किसी सेट का संयुक्त यौगिक वितरण <math>\mathbf{X} = \{x_1, \dots, x_N\}</math> के लिए <math>N</math> अवलोकन है
एक साझा पैरामीटर पर पूर्व वितरण के साथ स्वतंत्र समान रूप से वितरित प्रतिरूपों  की एक निश्चित संख्या पर संयुक्त वितरण को संयोजित करने के परिणाम पर विचार करना भी संभव है। बायेसियन सेटिंग में, यह विभिन्न संदर्भों में सामने आता है: अनेक नए अवलोकनों के पूर्व या पश्च पूर्वानुमान वितरण की गणना करना, और देखे गए डेटा की सीमांत संभावना की गणना करना (बेयस नियम में हर)। जब प्रतिरूपों  का वितरण घातीय वर्ग से होता है और पूर्व वितरण संयुग्मित होता है, तो परिणामी यौगिक वितरण सुव्यवस्थित होगा और उपरोक्त अभिव्यक्ति के समान रूप का पालन करेगा। वास्तव में, यह दिखाना आसान है कि <math>N</math> अवलोकनों के लिए एक समुच्चय  <math>\mathbf{X} = \{x_1, \dots, x_N\}</math> का संयुक्त यौगिक वितरण है


:<math>p_H(\mathbf{X}|\boldsymbol{\chi},\nu) = \left( \prod_{i=1}^N h(x_i) \right) \dfrac{f(\boldsymbol{\chi},\nu)}{f\left(\boldsymbol{\chi} + \mathbf{T}(\mathbf{X}), \nu+N \right)}</math>
:<math>p_H(\mathbf{X}|\boldsymbol{\chi},\nu) = \left( \prod_{i=1}^N h(x_i) \right) \dfrac{f(\boldsymbol{\chi},\nu)}{f\left(\boldsymbol{\chi} + \mathbf{T}(\mathbf{X}), \nu+N \right)}</math>
यह परिणाम और एकल यौगिक वितरण के लिए उपरोक्त परिणाम वेक्टर-मूल्य वाले अवलोकन पर वितरण के मामले में तुच्छ रूप से विस्तारित होता है, जैसे कि [[बहुभिन्नरूपी गाऊसी वितरण]]
यह परिणाम और एकल यौगिक वितरण के लिए उपरोक्त परिणाम सदिश-मान वाले अवलोकन पर वितरण के स्थिति  में तुच्छ रूप से विस्तारित होता है, जैसे कि [[बहुभिन्नरूपी गाऊसी वितरण]] होता है।


==गिब्स सैंपलिंग से संबंध==
==गिब्स सैंपलिंग से संबंध                                                                                                     ==
ढहे हुए गिब्स सैंपलर में एक नोड को ढहाना यौगिक वितरण के बराबर है। परिणामस्वरूप, जब स्वतंत्र समान रूप से वितरित (i.i.d.) नोड्स का एक सेट सभी एक ही पूर्व नोड पर निर्भर करता है, और वह नोड ढह जाता है, तो एक नोड की परिणामी सशर्त संभावना दूसरों के साथ-साथ ढहे हुए आउट के माता-पिता को भी देती है। नोड (लेकिन किसी अन्य नोड पर कंडीशनिंग नहीं, उदाहरण के लिए कोई चाइल्ड नोड) सभी शेष आईआईडी के पश्च पूर्वानुमानित वितरण के समान है। नोड्स (या अधिक सही ढंग से, पूर्व में आई.आई.डी. नोड्स, चूंकि ढहने से नोड्स के बीच निर्भरता का परिचय होता है)। अर्थात्, नोड के सभी माता-पिता को सीधे सभी बच्चों से जोड़कर, और प्रत्येक बच्चे से जुड़े पूर्व [[सशर्त संभाव्यता]] वितरण को उसके आधार पर वातानुकूलित बच्चे के लिए संबंधित पश्च भविष्य कहनेवाला वितरण के साथ प्रतिस्थापित करके एक नोड से ढहने को लागू करना आम तौर पर संभव है। माता-पिता और अन्य पूर्व आई.आई.डी. नोड्स जो हटाए गए नोड के बच्चे भी थे। उदाहरण के लिए, अधिक विशिष्ट चर्चा के लिए और कुछ पेचीदा मुद्दों के बारे में कुछ सावधानियों के लिए, डिरिचलेट-मल्टीनोमियल वितरण लेख देखें।
संक्षिप्त हुए गिब्स सैंपलर में एक नोड को संक्षिप्त यौगिक वितरण के समान  है। परिणामस्वरूप, जब स्वतंत्र समान रूप से वितरित (i.i.d.) नोड्स का एक समुच्चय  सभी एक ही पूर्व नोड पर निर्भर करता है, और वह नोड संक्षिप्त जाता है, तो एक नोड की परिणामी नियमित संभावना दूसरों के साथ-साथ संक्षिप्तहुए आउट के माता-पिता को भी देती है। नोड (किंतु किसी अन्य नोड पर कंडीशनिंग नहीं, उदाहरण के लिए कोई चाइल्ड नोड) सभी शेष आईआईडी के पश्च पूर्वानुमानित वितरण के समान है। नोड्स (या अधिक सही रूप से, पूर्व में आई.आई.डी. नोड्स, चूंकि संक्षिप्त से नोड्स के बीच निर्भरता का परिचय होता है)। अर्थात्, नोड के सभी माता-पिता को सीधे सभी बच्चों से जोड़कर, और प्रत्येक बच्चे से जुड़े पूर्व [[सशर्त संभाव्यता|नियमित संभाव्यता]] वितरण को उसके आधार पर वातानुकूलित बच्चे के लिए संबंधित पश्च पूर्वानुमानित वितरण के साथ प्रतिस्थापित करके एक नोड से संक्षिप्त को प्रयुक्त करना सामान्यतः संभव है। माता-पिता और अन्य पूर्व आई.आई.डी. नोड्स जो हटाए गए नोड के बच्चे भी थे। उदाहरण के लिए, अधिक विशिष्ट चर्चा के लिए और कुछ मुश्किल उद्देश्य के बारे में कुछ सावधानियों के लिए, डिरिचलेट-मल्टीनोमियल वितरण लेख देखें।


==यह भी देखें==
==यह भी देखें==
Line 98: Line 107:
==अग्रिम पठन==
==अग्रिम पठन==
*{{cite book |first=Ioannis |last=Ntzoufras |year=2009 |chapter=The Predictive Distribution and Model Checking |title=Bayesian Modeling Using WinBUGS |publisher=Wiley |location= |isbn=978-0-470-14114-4 }}
*{{cite book |first=Ioannis |last=Ntzoufras |year=2009 |chapter=The Predictive Distribution and Model Checking |title=Bayesian Modeling Using WinBUGS |publisher=Wiley |location= |isbn=978-0-470-14114-4 }}
[[Category: संभाव्यता वितरण का सिद्धांत]] [[Category: बायेसियन आँकड़े]]


[[Category: Machine Translated Page]]
[[Category:Created On 07/07/2023]]
[[Category:Created On 07/07/2023]]
[[Category:Lua-based templates]]
[[Category:Machine Translated Page]]
[[Category:Pages with empty portal template]]
[[Category:Pages with script errors]]
[[Category:Portal-inline template with redlinked portals]]
[[Category:Short description with empty Wikidata description]]
[[Category:Templates Vigyan Ready]]
[[Category:Templates that add a tracking category]]
[[Category:Templates that generate short descriptions]]
[[Category:Templates using TemplateData]]
[[Category:बायेसियन आँकड़े]]
[[Category:संभाव्यता वितरण का सिद्धांत]]

Latest revision as of 13:22, 3 August 2023

बायेसियन आँकड़ों में, पश्च पूर्वानुमानित वितरण देखे गए मानों पर नियमानुसार संभावित न देखे गए मानों का वितरण है।[1][2]

N आई.आई.डी. का एक समुच्चय दिया गया अवलोकन एक नया मान एक वितरण से निकाला जाएगा जो एक पैरामीटर पर निर्भर करता है, जहां पैरामीटर स्पेस है.

के लिए एक सर्वोत्तम अनुमान जोड़ना आकर्षक लग सकता है, किंतु यह के बारे में अनिश्चितता को अनदेखा कर देता है, और क्योंकि अनिश्चितता के स्रोत को अनदेखा कर दिया जाता है, इसलिए पूर्वानुमानित वितरण बहुत संकीर्ण होता है । दूसरे विधि से कहें तो, यदि उनके पश्च वितरण द्वारा दिए गए मापदंडों में अनिश्चितता को ध्यान में रखा जाए, तो के वेरिएबल म मानों की भविष्यवाणियों की संभावना कम होगी।

एक पश्च पूर्वानुमानित वितरण के बारे में अनिश्चितता का कारण बनता है। संभावित मानों का पश्च वितरण पर निर्भर करता है।:

और दिए गए के के पश्च पूर्वानुमानित वितरण की गणना दिए गए के पश्च वितरण की तुलना में दिए गए के के वितरण को मर्जीनिलाइज्द पर रखकर की जाती है।

क्योंकि यह के बारे में अनिश्चितता का कारण बनता है, पश्च पूर्वानुमानित वितरण समान्यत: एक पूर्वानुमानित वितरण से अधिक व्यापक होगा जो के लिए एकल सर्वोत्तम अनुमान में प्लग करता है।

पूर्व बनाम पश्च पूर्वानुमानित वितरण

बायेसियन संदर्भ में, पूर्व पूर्वानुमानित वितरण, अपने पूर्व वितरण पर मर्जीनिलाइज्द पर रखे गए डेटा बिंदु का वितरण है। अर्थात्, यदि और तो पूर्व पूर्वानुमानित वितरण संगत वितरण है, जहाँ

यह पश्चवर्ती पूर्वानुमानित वितरण के समान है, इसके अतिरिक्त कि सीमांतीकरण (या समतुल्य, अपेक्षा) को पश्च वितरण के अतिरिक्त पूर्व वितरण के संबंध में लिया जाता है।

इसके अतिरिक्त यदि पूर्व वितरण एक संयुग्मित पूर्व है, तो पश्च पूर्वानुमानित वितरण पूर्व पूर्वानुमानित वितरण के समान वितरण वर्ग से संबंधित होगा। यह देखना आसान है. यदि पूर्व वितरण संयुग्मी है, तो

अथार्त पिछला वितरण भी से संबंधित है, किंतु मूल पैरामीटर के अतिरिक्त बस एक अलग पैरामीटर ' के साथ। तब,

इसलिए, पश्च पूर्वानुमानित वितरण पूर्व पूर्वानुमानित वितरण के समान वितरण एच का अनुसरण करता है, किंतु पूर्व वाले के लिए प्रतिस्थापित हाइपरपैरामीटर के पश्च मानों के साथ अनुसरण करता है ।

पूर्व पूर्वानुमानित वितरण एक मिश्रित वितरण के रूप में होता है, और वास्तव में इसका उपयोग अधिकांशतः एक मिश्रित वितरण को परिभाषित करने के लिए किया जाता है, क्योंकि किसी भी सम्मिश्र कारकों की कमी होती है जैसे कि डेटा पर निर्भरता और संयुग्मता का उद्देश्य उदाहरण के लिए, छात्र के T-वितरण को ज्ञात माध्य μ किंतु अज्ञात विवेरिएबल ण σx2 के साथ एक सामान्य वितरण के पूर्व पूर्वानुमानित वितरण के रूप में परिभाषित किया जा सकता है, हाइपरपैरामीटर ν और σ2 के साथ σx2 पर रखे गए संयुग्मित पूर्व स्केल-व्युत्क्रम-ची-वर्ग वितरण के साथ यह परिणामी यौगिक वितरण वास्तव में एक गैर-मानकीकृत छात्र का t-वितरण है, और इस वितरण के दो सबसे सामान्य मापदंडों में से एक का अनुसरण करता है। फिर, संबंधित पश्च पूर्वानुमानित वितरण फिर से छात्र का T होगा, अद्यतन हाइपरपैरामीटर के साथ जो पश्च वितरण में दिखाई देते हैं, वे सीधे पश्च पूर्वानुमानित वितरण में भी दिखाई देते हैं।।

कुछ स्थिति में उपयुक्त यौगिक वितरण को उस पैरामीटर से भिन्न पैरामीटरीकरण का उपयोग करके परिभाषित किया जाता है जो वर्तमान समस्या में पूर्वानुमानित वितरण के लिए सबसे स्वाभाविक होगा। अधिकांशतः इसका परिणाम यह होता है क्योंकि मिश्रित वितरण को परिभाषित करने के लिए उपयोग किया गया पूर्व वितरण वर्तमान समस्या में उपयोग किए गए वितरण से भिन्न होता है। उदाहरण के लिए, जैसा कि ऊपर बताया गया है, छात्र के T-वितरण को विवेरिएबल ण पर रखे गए स्केल-व्युत्क्रम-ची-वर्ग वितरण के संदर्भ में परिभाषित किया गया था। चूँकि इस स्थिति में संयुग्म पूर्व के रूप में व्युत्क्रम गामा वितरण का उपयोग करना अधिक सामान्य है। पैरामीटरीकरण को छोड़कर दोनों वास्तव में समतुल्य हैं; इसलिए, छात्र के T-वितरण का उपयोग अभी भी पूर्वानुमानित वितरण के लिए किया जा सकता है, किंतु हाइपरपैरामीटर को प्लग इन करने से पहले पुन: पैरामीटराइज़ किया जाना चाहिए।

घातांकीय वर्गों में

अधिकांश किंतु सभी नहीं वितरण के सामान्य वर्ग घातीय वर्ग हैं। घातीय वर्गों में बड़ी संख्या में उपयोगी गुण होते हैं। इनमें से एक यह है कि सभी सदस्यों में संयुग्मित पूर्व वितरण होते हैं - जबकि बहुत कम अन्य वितरणों में संयुग्मित पूर्व होते हैं।

घातांकीय वर्गों में पूर्व पूर्वानुमानित वितरण

अन्य उपयोगी संपत्ति यह है कि इसके संयुग्मित पूर्व वितरण पर सीमांत वितरण पर रखे गए एक घातांकीय पारिवारिक वितरण के पूर्व पूर्वानुमानित वितरण के अनुरूप यौगिक वितरण की संभाव्यता घनत्व फलन को विश्लेषणात्मक रूप से निर्धारित किया जा सकता है। मान लें कि पैरामीटर के साथ घातीय वर्ग का सदस्य है जो प्राकृतिक पैरामीटर के अनुसार पैरामीट्रिज्ड है, और इसे इस प्रकार वितरित किया गया है

जबकि पूर्व उपयुक्त संयुग्म है, के रूप में वितरित किया गया

फिर पूर्व पूर्वानुमानित वितरण (कंपाउंडिंग का परिणाम साथ ) है


अंतिम पंक्ति पिछली पंक्ति का अनुसरण करती है, यह पहचान कर कि इंटीग्रल के अंदर का फलन सामान्यीकृत फलन को छोड़कर, के रूप में वितरित एक यादृच्छिक वेरिएबल का घनत्व फलन है। इसलिए एकीकरण का परिणाम सामान्यीकरण कार्य का व्युत्क्रम होगा।

उपरोक्त परिणाम के पैरामीट्रिज़ेशन की पसंद से स्वतंत्र है, क्योंकि और में से कोई भी दिखाई नहीं देता है। , पैरामीटर का एक फलन है और इसलिए पैरामीट्रिजेशन की पसंद के आधार पर अलग-अलग रूप धारण करेगा।) और के मानक विकल्पों के लिए, प्राकृतिक मापदंडों के संदर्भ में फिर से लिखने के अतिरीक्त सामान्य मापदंडों के साथ सीधे काम करना अधिकांशतः आसान होता है।

इंटीग्रल के ट्रैक्टेबल होने का कारण यह है कि इसमें पूर्व वितरण और संभावना के उत्पाद द्वारा परिभाषित घनत्व के सामान्यीकरण स्थिरांक की गणना करना सम्मिलित है। जब दोनों संयुग्मित होते हैं, तो उत्पाद एक पश्च वितरण होता है, और धारणा से, इस वितरण का सामान्यीकरण स्थिरांक ज्ञात होता है। जैसा कि ऊपर दिखाया गया है, यौगिक वितरण का घनत्व फलन एक विशेष रूप का अनुसरण करता है, जिसमें फलन का उत्पाद सम्मिलित होता है जो के लिए घनत्व फलन का भाग बनता है, सामान्यीकरण के दो रूपों के भागफल के साथ "स्थिर" , एक पूर्व वितरण से और दूसरा पश्च वितरण से प्राप्त हुआ है। बीटा-द्विपद वितरण इस बात का एक अच्छा उदाहरण है कि यह प्रक्रिया कैसे काम करती है।


ऐसे वितरणों की विश्लेषणात्मक सुगमता के बावजूद, वे स्वयं सामान्यतः घातीय वर्ग के सदस्य नहीं होते हैं। उदाहरण के लिए, तीन-पैरामीटर छात्र का T वितरण, बीटा-द्विपद वितरण और डिरिचलेट-मल्टीनोमियल वितरण सभी घातीय-पारिवारिक वितरण (क्रमशः सामान्य वितरण, द्विपद वितरण और बहुपद वितरण) के पूर्वानुमानित वितरण हैं, किंतु कोई भी घातांक का सदस्य नहीं है वर्ग । इसे पर कार्यात्मक निर्भरता की उपस्थिति के कारण ऊपर देखा जा सकता है। एक घातीय-पारिवारिक वितरण में, संपूर्ण घनत्व फलन को तीन प्रकार के गुणक कारकों में अलग करना संभव होना चाहिए: (1) केवल वेरिएबल वाले कारक, (2) केवल पैरामीटर वाले कारक, और (3) ऐसे कारक जिनका लघुगणक वेरिएबल के बीच कारक होता है और पैरामीटर. की उपस्थिति इसे असंभव बनाती है जब तक कि "सामान्यीकरण" फलन , या तो संबंधित तर्क को पूरी तरह से अनदेखा नहीं करता है या केवल अभिव्यक्ति के प्रतिपादक में इसका उपयोग करता है।

घातांकीय वर्ग ों में पश्च पूर्वानुमानित वितरण

जब एक संयुग्मित पूर्व का उपयोग किया जा रहा है, तो पश्च पूर्वानुमानित वितरण पूर्व पूर्वानुमानित वितरण के समान वर्ग से संबंधित होता है, और पूर्व पूर्वानुमानित वितरण के सूत्र में पैरामीटर के पश्च वितरण के लिए अद्यतन हाइपरपैरामीटर को प्लग करके निर्धारित किया जाता है। . घातीय-पारिवारिक वितरण के लिए पश्च अद्यतन समीकरणों के सामान्य रूप का उपयोग करते हुए (घातांकीय वर्ग या बायेसियन अनुमान देखें: संयुग्म वितरण), हम पश्च पूर्वानुमानित वितरण के लिए एक स्पष्ट सूत्र लिख सकते हैं:

जहाँ

इससे पता चलता है कि अवलोकनों की एक श्रृंखला का पिछला पूर्वानुमानित वितरण, ऐसे स्थिति में जहां अवलोकन उचित संयुग्मित पूर्व के साथ एक घातीय वर्ग का पालन करते हैं, ऊपर निर्दिष्ट पैरामीटर के साथ, यौगिक वितरण के समान ही संभाव्यता घनत्व होता है।

अवलोकन स्वयं केवल रूप में ही प्रविष्ट होते हैं

इसे प्रेक्षणों का पर्याप्त डेटा कहा जाता है, क्योंकि यह हमें वह सब कुछ बताता है जो हमें प्रेक्षणों के बारे में जानने की आवश्यकता है जिससे उनके आधार पर पश्च या पश्च पूर्वानुमानित वितरण की गणना की जा सकता है (या, उस स्थिति के लिए, संभावना फलन के आधार पर कुछ और भी) अवलोकन, जैसे कि सीमांत संभावना)।

संयुक्त पूर्वानुमानित वितरण, सीमांत संभावना

एक साझा पैरामीटर पर पूर्व वितरण के साथ स्वतंत्र समान रूप से वितरित प्रतिरूपों की एक निश्चित संख्या पर संयुक्त वितरण को संयोजित करने के परिणाम पर विचार करना भी संभव है। बायेसियन सेटिंग में, यह विभिन्न संदर्भों में सामने आता है: अनेक नए अवलोकनों के पूर्व या पश्च पूर्वानुमान वितरण की गणना करना, और देखे गए डेटा की सीमांत संभावना की गणना करना (बेयस नियम में हर)। जब प्रतिरूपों का वितरण घातीय वर्ग से होता है और पूर्व वितरण संयुग्मित होता है, तो परिणामी यौगिक वितरण सुव्यवस्थित होगा और उपरोक्त अभिव्यक्ति के समान रूप का पालन करेगा। वास्तव में, यह दिखाना आसान है कि अवलोकनों के लिए एक समुच्चय का संयुक्त यौगिक वितरण है

यह परिणाम और एकल यौगिक वितरण के लिए उपरोक्त परिणाम सदिश-मान वाले अवलोकन पर वितरण के स्थिति में तुच्छ रूप से विस्तारित होता है, जैसे कि बहुभिन्नरूपी गाऊसी वितरण होता है।

गिब्स सैंपलिंग से संबंध

संक्षिप्त हुए गिब्स सैंपलर में एक नोड को संक्षिप्त यौगिक वितरण के समान है। परिणामस्वरूप, जब स्वतंत्र समान रूप से वितरित (i.i.d.) नोड्स का एक समुच्चय सभी एक ही पूर्व नोड पर निर्भर करता है, और वह नोड संक्षिप्त जाता है, तो एक नोड की परिणामी नियमित संभावना दूसरों के साथ-साथ संक्षिप्तहुए आउट के माता-पिता को भी देती है। नोड (किंतु किसी अन्य नोड पर कंडीशनिंग नहीं, उदाहरण के लिए कोई चाइल्ड नोड) सभी शेष आईआईडी के पश्च पूर्वानुमानित वितरण के समान है। नोड्स (या अधिक सही रूप से, पूर्व में आई.आई.डी. नोड्स, चूंकि संक्षिप्त से नोड्स के बीच निर्भरता का परिचय होता है)। अर्थात्, नोड के सभी माता-पिता को सीधे सभी बच्चों से जोड़कर, और प्रत्येक बच्चे से जुड़े पूर्व नियमित संभाव्यता वितरण को उसके आधार पर वातानुकूलित बच्चे के लिए संबंधित पश्च पूर्वानुमानित वितरण के साथ प्रतिस्थापित करके एक नोड से संक्षिप्त को प्रयुक्त करना सामान्यतः संभव है। माता-पिता और अन्य पूर्व आई.आई.डी. नोड्स जो हटाए गए नोड के बच्चे भी थे। उदाहरण के लिए, अधिक विशिष्ट चर्चा के लिए और कुछ मुश्किल उद्देश्य के बारे में कुछ सावधानियों के लिए, डिरिचलेट-मल्टीनोमियल वितरण लेख देखें।

यह भी देखें

संदर्भ

  1. "पश्च भविष्य कहनेवाला वितरण". SAS. Retrieved 19 July 2014.
  2. Gelman, Andrew; Carlin, John B.; Stern, Hal S.; Dunson, David B.; Vehtari, Aki; Rubin, Donald B. (2013). बायेसियन डेटा विश्लेषण (Third ed.). Chapman and Hall/CRC. p. 7. ISBN 978-1-4398-4095-5.


अग्रिम पठन

  • Ntzoufras, Ioannis (2009). "The Predictive Distribution and Model Checking". Bayesian Modeling Using WinBUGS. Wiley. ISBN 978-0-470-14114-4.