गिब्स सैंपलिंग: Difference between revisions

From Vigyanwiki
No edit summary
 
(43 intermediate revisions by 5 users not shown)
Line 1: Line 1:
{{short description|Monte Carlo algorithm}}
{{Bayesian statistics}}
{{Bayesian statistics}}


[[आंकड़ों]] में, गिब्स प्रतिचयन या गिब्स प्रतिदर्शी एक [[मार्कोव चेन मोंटे कार्लो|मार्कोव शृंखला मोंटे कार्लो]] (एमसीएमसी)[[ कलन विधि ]]है, जो अवलोकनों का एक क्रम प्राप्त करने के लिए होता है, तथा जो तब एक निर्दिष्ट [[बहुभिन्नरूपी वितरण|बहुभिन्नरूपी]] [[संभाव्यता वितरण]] से अनुमानित होता है, जब प्रत्यक्ष प्रतिचयन कठिन होता है। इस अनुक्रम का उपयोग संयुक्त वितरण को अनुमानित करने के लिए किया जा सकता है (उदाहरण के लिए, वितरण का आयत चित्र उत्पन्न करने के लिए), किसी एक चर, या चर के कुछ उपसमुच्चय (उदाहरण के लिए, अज्ञात [[पैरामीटर|प्राचल]] या [[अव्यक्त चर|अंतर्निहित चर]]) के [[सीमांत वितरण]] का अनुमान लगाने के लिए, या एक [[अभिन्न]] की गणना करने के लिए (जैसे चर में से एक का [[अपेक्षित मूल्य|प्रत्याशित मान]])। आमतौर पर, कुछ चर उन टिप्पणियों के अनुरूप होते हैं जिनके मान ज्ञात होते हैं, और इसलिए उन्हें प्रतिदर्श लेने की आवश्यकता नहीं होती है।
[[आंकड़ों]] में, गिब्स सैंपलिंग या गिब्स सैम्पलर एक [[मार्कोव चेन मोंटे कार्लो|मार्कोव शृंखला मोंटे कार्लो]] (एमसीएमसी)[[ कलन विधि ]]है, जो अवलोकनों का एक क्रम प्राप्त करने के लिए होती है, तथा जो तब एक निर्दिष्ट [[बहुभिन्नरूपी वितरण|बहुभिन्नरूपी]] [[संभाव्यता वितरण]] से अनुमानित होती है, जब प्रत्यक्ष सैंपलिंग कठिन होता है। इस अनुक्रम का उपयोग संयुक्त वितरण (उदाहरण के लिए, वितरण का आयत चित्र उत्पन्न करने के लिए), जैसे किसी एक चर, या चर के कुछ उपसमुच्चय (उदाहरण के लिए, अज्ञात [[पैरामीटर|प्राचल]] या [[अव्यक्त चर|अंतर्निहित चर]]) के [[सीमांत वितरण]] का अनुमान लगाने के लिए, या एक [[अभिन्न]] की गणना करने के लिए, (जैसे चर में से एक का [[अपेक्षित मूल्य|प्रत्याशित मान]]) आदि को अनुमानित करने के लिए किया जा सकता है। सामान्यतः कुछ चर उन टिप्पणियों के अनुरूप होते हैं जिनके मान ज्ञात होते हैं, और इसलिए उन्हें प्रतिचयित लेने की आवश्यकता नहीं होती है।


गिब्स प्रतिचयन आमतौर पर [[सांख्यिकीय अनुमिती]] यानी विशेष रूप से [[बेजअनुमिति]] के साधन के रूप में प्रयोग किया जाता है। यह एक [[यादृच्छिक कलन विधि]] है (अर्थात एक कलन विधि जो [[यादृच्छिक संख्याओं]] का उपयोग करता है), और [[अपेक्षा-अधिकतमकरण कलन विधि]] (ईएम) जैसे सांख्यिकीय अनुमिती के लिए [[नियतात्मक कलन विधि]] का एक विकल्प है।
गिब्स सैंपलिंग सामान्यतः [[सांख्यिकीय अनुमिती]] यानी विशेष रूप से [[बेजअनुमिति|बेज अनुमिति]] के साधन के रूप में प्रयोग किया जाता है। यह एक [[यादृच्छिक कलन विधि]] है (अर्थात एक कलन विधि जो [[यादृच्छिक संख्याओं]] का उपयोग करती है), जो [[अपेक्षा-अधिकतमकरण कलन विधि|अपेक्षा-अधिकतमीकरण कलन विधि]] (ईएम) जैसे सांख्यिकीय अनुमिती के लिए [[नियतात्मक कलन विधि]] का एक विकल्प है।


अन्य एमसीएमसी कलन विधि के साथ, गिब्स प्रतिचयन प्रतिदर्श की [[मार्कोव श्रृंखला]] उत्पन्न करता है, जिनमें से प्रत्येक पास के प्रतिदर्श से [[संबंधित|सहसंबंधित]] है। नतीजतन, अगर स्वतंत्र प्रतिदर्श वांछित हैं तो देखभाल की जानी चाहिए। आम तौर पर, श्रृंखला की शुरुआत ("अमिट होने की अवधि") से प्रतिदर्श वांछित वितरण का सटीक रूप से प्रतिनिधित्व नहीं कर सकते हैं और आमतौर पर पदच्युत कर दिए जाते हैं।
अन्य एमसीएमसी कलन विधि के साथ, गिब्स सैंपलिंग सैंपलिंग की [[मार्कोव श्रृंखला]] उत्पन्न करता है, जिनमें से प्रत्येक पास के सैंपलिंग से [[संबंधित|सहसंबंधित]] है। जिसके फलस्वरूप, अगर स्वतंत्र सैंपलिंग वांछित हैं तो देखभाल की जानी चाहिए। सामान्यतः श्रृंखला की प्रारम्भ ("बर्न-इन अवधि") से सैंपलिंग वांछित वितरण का सटीक रूप से प्रतिनिधित्व नहीं कर सकते हैं और सामान्यतः निराकृत कर दिए जाते हैं।


== परिचय ==
== परिचय ==
[[प्रतिचयन]] कलन विधि और [[सांख्यिकीय भौतिकी]] के बीच समानता के संदर्भ में, गिब्स प्रतिचयन का नाम भौतिक विज्ञानी [[योशिय्याह विलार्ड गिब्स|जोशियाह विलार्ड गिब्स]] के नाम पर रखा गया है। गिब्स की मृत्यु के लगभग आठ दशक बाद 1984 में दो भाइयों [[ स्टुअर्ट जेमन |स्टुअर्ट जेमन]] और [[ डोनाल्ड जेमन |डोनाल्ड जेमन]] द्वारा कलन विधि का वर्णन किया गया था।<ref>{{Cite journal
सैंपलिंग कलन विधि और [[सांख्यिकीय भौतिकी]] के बीच समानता के संदर्भ में, गिब्स सैंपलिंग का नाम भौतिक विज्ञानी [[योशिय्याह विलार्ड गिब्स|जोशियाह विलार्ड गिब्स]] के नाम पर रखा गया है। गिब्स की मृत्यु के लगभग आठ दशक बाद 1984 में दो भाइयों [[ स्टुअर्ट जेमन |स्टुअर्ट जेमन]] और [[ डोनाल्ड जेमन |डोनाल्ड जेमन]] द्वारा कलन विधि का वर्णन किया गया था,<ref>{{Cite journal
  | first1=S. |last1=Geman |author-link1=Stuart Geman
  | first1=S. |last1=Geman |author-link1=Stuart Geman
  | first2=D. |last2=Geman |author-link2=Donald Geman
  | first2=D. |last2=Geman |author-link2=Donald Geman
Line 18: Line 17:
  | year = 1984
  | year = 1984
  | doi = 10.1109/TPAMI.1984.4767596 | pmid=22499653
  | doi = 10.1109/TPAMI.1984.4767596 | pmid=22499653
}}</ref> और सीमांत प्रायिकता वितरण, विशेष रूप से पश्च वितरण की गणना के लिए सांख्यिकी समुदाय में लोकप्रिय हो गया।<ref>{{Cite journal |last=Gelfand |first=Alan E. |last2=Smith |first2=Adrian F. M. |date=1990-06-01 |title=सीमांत घनत्व की गणना करने के लिए नमूना-आधारित दृष्टिकोण|url=https://www.tandfonline.com/doi/abs/10.1080/01621459.1990.10476213 |journal=Journal of the American Statistical Association |volume=85 |issue=410 |pages=398–409 |doi=10.1080/01621459.1990.10476213 |issn=0162-1459}}</ref>
}}</ref> और सीमांत प्रायिकता वितरण, विशेष रूप से उत्‍तरबंटन की गणना के लिए सांख्यिकी समुदाय में लोकप्रिय हो गया।<ref>{{Cite journal |last=Gelfand |first=Alan E. |last2=Smith |first2=Adrian F. M. |date=1990-06-01 |title=सीमांत घनत्व की गणना करने के लिए नमूना-आधारित दृष्टिकोण|url=https://www.tandfonline.com/doi/abs/10.1080/01621459.1990.10476213 |journal=Journal of the American Statistical Association |volume=85 |issue=410 |pages=398–409 |doi=10.1080/01621459.1990.10476213 |issn=0162-1459}}</ref>


अपने मूल संस्करण में, गिब्स प्रतिचयन [[मेट्रोपोलिस-हेस्टिंग्स कलन विधि]] की एक विशेष स्थिति है। हालांकि, इसके विस्तारित संस्करणों (नीचे देखें) में, इसे प्रत्येक चर (या कुछ स्थितयो में, चर के प्रत्येक समूह) को बदले में प्रतिचयित करके चर के एक बड़े सेट से प्रतिदर्श के लिए एक सामान्य रूपरेखा माना जा सकता है, और प्रतिचयन के एक या अधिक चरणों को लागू करने के लिए [[मेट्रोपोलिस-हेस्टिंग्स कलन विधि]] (या [[ टुकड़ा नमूनाकरण |अंशअ प्रतिचयन]] जैसी विधियाँ) को सम्मिलित कर सकते हैं।
अपने मूल संस्करण में, गिब्स सैंपलिंग [[मेट्रोपोलिस-हेस्टिंग्स कलन विधि]] की एक विशेष स्थिति है। हालांकि, इसके विस्तारित संस्करणों (नीचे देखें) में, इसे प्रत्येक चर (या कुछ स्थितयो में, चर के प्रत्येक समूह) को बदले में प्रतिचयित करके चर के एक बड़े सेट से सैंपलिंग के लिए एक सामान्य रूपरेखा माना जा सकता है, और सैंपलिंग के एक या अधिक चरणों को लागू करने के लिए [[मेट्रोपोलिस-हेस्टिंग्स कलन विधि]] (या [[ टुकड़ा नमूनाकरण |अंशअ]] सैंपलिंग जैसी विधियाँ) को सम्मिलित कर सकते हैं।


गिब्स प्रतिचयन तब लागू होता है जब संयुक्त वितरण स्पष्ट रूप से ज्ञात नहीं होता है या प्रत्यक्ष रूप से प्रतिदर्श लेना मुश्किल होता है, लेकिन प्रत्येक चर का [[सशर्त वितरण]] ज्ञात होता है और प्रतिदर्श के लिए आसान (या कम से कम, आसान) होता है। गिब्स प्रतिचयन कलन विधि बदले में प्रत्येक चर के वितरण से एक अन्य चर के वर्तमान मूल्यों पर सशर्त उदाहरण उत्पन्न करता है। यह दिखाया जा सकता है किप्रतिदर्शो का अनुक्रम एक [[मार्कोव श्रृंखला]] का गठन करता है, और उस मार्कोव श्रृंखला का स्थिर वितरण केवल वांछित संयुक्त वितरण है।<ref>{{Cite book|title=बायेसियन डेटा विश्लेषण|last=Gelman|first=Andrew and Carlin, John B and Stern, Hal S and Dunson, David B and Vehtari, Aki and Rubin, Donald B|publisher=CRC press Boca Raton|year=2014|volume=2|location=FL}}</ref>
गिब्स सैंपलिंग तब लागू होता है जब संयुक्त वितरण स्पष्ट रूप से ज्ञात नहीं होता है या प्रत्यक्ष रूप से सैंपलिंग लेना मुश्किल होता है, लेकिन प्रत्येक चर का [[सशर्त वितरण]] ज्ञात होता है और सैंपलिंग के लिए आसान (या कम से कम, आसान) होता है। गिब्स सैंपलिंग कलन विधि बदले में प्रत्येक चर के वितरण से एक अन्य चर के वर्तमान मूल्यों पर सशर्त उदाहरण उत्पन्न करता है। यह दिखाया जा सकता है कि प्रतिदर्शो का अनुक्रम एक [[मार्कोव श्रृंखला]] का गठन करता है, और उस मार्कोव श्रृंखला का स्थिर वितरण केवल वांछित संयुक्त वितरण है।<ref>{{Cite book|title=बायेसियन डेटा विश्लेषण|last=Gelman|first=Andrew and Carlin, John B and Stern, Hal S and Dunson, David B and Vehtari, Aki and Rubin, Donald B|publisher=CRC press Boca Raton|year=2014|volume=2|location=FL}}</ref>


गिब्स प्रतिचयन विशेष रूप से [[बायेसियन नेटवर्क]] के [[पश्च वितरण]] के प्रतिदर्श के लिए अनुकूलित है, क्योंकि बायेसियन नेटवर्क आमतौर पर सशर्त वितरण के संग्रह के रूप में निर्दिष्ट होते हैं।
गिब्स सैंपलिंग विशेष रूप से [[बायेसियन नेटवर्क]] के [[पश्च वितरण|उत्‍तरबंटन]] के सैंपलिंग के लिए अनुकूलित है, क्योंकि बायेसियन नेटवर्क सामान्यतः सशर्त वितरण के संग्रह के रूप में निर्दिष्ट होते हैं।


== कार्यान्वयन ==
== कार्यान्वयन ==


गिब्स प्रतिचयन, अपने मूल अवतार में, [[मेट्रोपोलिस-हेस्टिंग्स कलन विधि]] की एक विशेष स्थिति है। गिब्स प्रतिचयन का मुद्दा यह है कि एक बहुचर वितरण को देखते हुए एक [[संयुक्त वितरण]] पर एकीकृत करके [[सीमांत वितरण]] की तुलना में एक [[सशर्त वितरण]] से प्रतिदर्श लेना आसान है। मान लीजिए हम एक संयुक्त वितरण  <math> p(x_1, \dots, x_n) </math> से  <math>\mathbf{X} = (x_1, \dots, x_n)</math> के <math>\left.k\right.</math> प्रतिदर्श प्राप्त करना चाहते हैं।  <math>i</math>वें प्रतिदर्श को <math>\mathbf{X}^{(i)} = \left(x_1^{(i)}, \dots, x_n^{(i)}\right)</math>से निरूपित करें। हम निम्नानुसार आगे बढ़ते हैं,
गिब्स प्रतिचयन, अपने मूल अवतार में, [[मेट्रोपोलिस-हेस्टिंग्स कलन विधि]] की एक विशेष स्थिति है। गिब्स सैंपलिंग का सारांश यह है कि एक बहुचर वितरण को देखते हुए एक [[संयुक्त वितरण]] पर एकीकृत करके [[सीमांत वितरण]] की तुलना में एक [[सशर्त वितरण]] से सैंपलिंग लेना आसान है। मान लीजिए हम एक संयुक्त वितरण  <math> p(x_1, \dots, x_n) </math> से  <math>\mathbf{X} = (x_1, \dots, x_n)</math> के <math>\left.k\right.</math> सैंपलिंग प्राप्त करना चाहते हैं।  <math>i</math>वें सैंपलिंग को <math>\mathbf{X}^{(i)} = \left(x_1^{(i)}, \dots, x_n^{(i)}\right)</math>से निरूपित करें। हम निम्नानुसार आगे बढ़ते हैं,


# हम कुछ प्रारंभिक मान <math>\mathbf{X}^{(0)}</math> से शुरू करते हैं।  
# हम कुछ प्रारंभिक मान <math>\mathbf{X}^{(0)}</math> से शुरू करते हैं।  
#हम अगला प्रतिदर्श चाहते हैं। इस अगले प्रतिदर्श को  <math>\mathbf{X}^{(i+1)}</math>कहते है। चूँकि <math>\mathbf{X}^{(i+1)} = \left(x_1^{(i+1)}, x_2^{(i+1)}, \dots, x_n^{(i+1)}\right)</math> एक सदिश है, हम सदिश के प्रत्येक घटक का प्रतिदर्श <math>x_j^{(i+1)}</math> लेते हैं, उस घटक के वितरण से जो अब तक प्रतिदर्श लिए गए वो अन्य सभी घटकों पर सशर्त है। लेकिन यहां एक कैच है, हम  <math>\mathbf{X}^{(i+1)}</math>, घटकों पर <math>x_{j-1}^{(i+1)}</math>तक प्रतिबंध लगाते हैं, और उसके बाद <math>\mathbf{X}^{(i)}</math> के घटकों पर <math>x_{j+1}^{(i)}</math> से <math>x_n^{(i)}</math> तक प्रतिबंध लगाते हैं। इसे प्राप्त करने के लिए, हम पहले घटक से शुरू करते हुए, क्रम में घटकों का प्रतिदर्श लेते हैं। अधिक औपचारिक रूप से, प्रतिदर्श <math>x_j^{(i+1)}</math> लेने के लिए, हम <math>p\left(x_j^{(i+1)}|x_1^{(i+1)},\dots,x_{j-1}^{(i+1)},x_{j+1}^{(i)},\dots,x_n^{(i)}\right)</math>द्वारा निर्दिष्ट वितरण के अनुसार इसे अद्यतन करते हैं।
#हम अगला सैंपलिंग चाहते हैं। इस अगले सैंपलिंग को  <math>\mathbf{X}^{(i+1)}</math>कहते है। चूँकि <math>\mathbf{X}^{(i+1)} = \left(x_1^{(i+1)}, x_2^{(i+1)}, \dots, x_n^{(i+1)}\right)</math> एक सदिश है, तो हम सदिश के प्रत्येक घटक का सैंपलिंग <math>x_j^{(i+1)}</math> लेते हैं, उस घटक के वितरण से जो अब तक सैंपलिंग लिए गए वो अन्य सभी घटकों पर सशर्त है। लेकिन यहां एक जाल है, हम  <math>\mathbf{X}^{(i+1)}</math>, घटकों पर <math>x_{j-1}^{(i+1)}</math>तक प्रतिबंध लगाते हैं, और उसके बाद <math>\mathbf{X}^{(i)}</math> के घटकों पर <math>x_{j+1}^{(i)}</math> से <math>x_n^{(i)}</math> तक प्रतिबंध लगाते हैं। इसे प्राप्त करने के लिए, हम पहले घटक से शुरू करते हुए, क्रम में घटकों का सैंपलिंग लेते हैं। अधिक औपचारिक रूप से, सैंपलिंग <math>x_j^{(i+1)}</math> लेने के लिए, हम <math>p\left(x_j^{(i+1)}|x_1^{(i+1)},\dots,x_{j-1}^{(i+1)},x_{j+1}^{(i)},\dots,x_n^{(i)}\right)</math>द्वारा निर्दिष्ट वितरण के अनुसार इसे अद्यतन करते हैं।
#हम <math>i</math>वें प्रतिदर्श में  <math>(j+1)</math>वें घटक के मान का उपयोग करते हैं, न कि<math>(i+1)</math>वें प्रतिदर्श का।
#हम <math>i</math>वें सैंपलिंग में  <math>(j+1)</math>वें घटक के मान का उपयोग करते हैं, न कि<math>(i+1)</math>वें सैंपलिंग का।
#उपरोक्त चरण को <math>k</math> बार दोहराएं ।
#उपरोक्त चरण को <math>k</math> बार दोहराएं ।


== गुण ==
== गुण ==
यदि इस तरह का प्रतिदर्श लिया जाता है, तो ये महत्वपूर्ण तथ्य हैं,
यदि इस तरह का सैंपलिंग लिया जाता है, तो ये महत्वपूर्ण तथ्य हैं,
* प्रतिदर्श सभी चरों के संयुक्त वितरण का अनुमान लगाते हैं।
* सैंपलिंग सभी चरों के संयुक्त वितरण का अनुमान लगाते हैं।
* चर के किसी भी उपसमुच्चय के सीमांत वितरण को चर के उस उपसमुच्चय केप्रतिदर्शो पर विचार करके अनुमानित किया जा सकता है, शेष को अनदेखा कर सकते हैं।
* चर के किसी भी उपसमुच्चय के सीमांत वितरण को चर के उस उपसमुच्चय के प्रतिदर्शो पर विचार करके अनुमानित किया जा सकता है, जो शेष को अनदेखा कर सकते हैं।
* किसी भी चर के [[अपेक्षित मूल्य|प्रत्याशित मान]] को सभीप्रतिदर्शो के औसत से अनुमानित किया जा सकता है।
* किसी भी चर के [[अपेक्षित मूल्य|प्रत्याशित मान]] को सभी प्रतिदर्शो के औसत से अनुमानित किया जा सकता है।


प्रतिचयन करते समय,
सैंपलिंग करते समय,
*चर के प्रारंभिक मूल्यों को बेतरतीब ढंग से या कुछ अन्य कलन विधि जैसे कि [[अपेक्षा-अधिकतमकरण]] द्वारा निर्धारित किया जा सकता है।
*चर के प्रारंभिक मूल्यों को बेतरतीब ढंग से या कुछ अन्य कलन विधि जैसे कि [[अपेक्षा-अधिकतमकरण]] द्वारा निर्धारित किया जा सकता है।
* पहले चर के प्रतिदर्श के लिए प्रारंभिक मान निर्धारित करना वास्तव में आवश्यक नहीं है।
* पहले चर के सैंपलिंग के लिए प्रारंभिक मान निर्धारित करना वास्तव में आवश्यक नहीं है।
*शुरुआत (तथाकथित अमिट होने की अवधि) में कुछप्रतिदर्शो की संख्या को अनदेखा करना सामान्य बात है, और फिर केवल प्रत्येक <math>n</math>वें प्रतिदर्श पर विचार करें जब एक अपेक्षा की गणना करने के लिए मूल्यों का औसत निकाला जाता है। उदाहरण के लिए, पहले 1,000प्रतिदर्शो को नजरअंदाज किया जा सकता है, और फिर हर 100वें प्रतिदर्श का औसत निकाला जाता है, बाकी सभी को निकाल दिया जाता है। इसका कारण यह है कि (1) मार्कोव श्रृंखला का [[स्थिर वितरण]] चरों पर वांछित संयुक्त वितरण है, लेकिन उस स्थिर वितरण तक पहुंचने में कुछ समय लग सकता है, (2) क्रमिक प्रतिदर्श एक दूसरे से स्वतंत्र नहीं होते हैं लेकिन कुछ मात्रा में सहसंबंध के साथ एक [[मार्कोव श्रृंखला]] बनाते हैं। कभी-कभी, कलन विधि का उपयोगप्रतिदर्शो के बीच स्वसंबंध की मात्रा और इससे गणना की गई <math>n</math> (सैम्पल के बीच की अवधि जो वास्तव में उपयोग की जाती है) के मान को निर्धारित करने के लिए किया जा सकता है, लेकिन व्यवहार में इसमें उचित मात्रा में [[काला जादू (प्रोग्रामिंग)|अनिष्टकारी या काला जादू]] सम्मिलित होता है।
*प्रारम्भ (तथाकथित बर्न-इन अवधि) में कुछ प्रतिदर्शो की संख्या को अनदेखा करना सामान्य बात है, और फिर केवल प्रत्येक <math>n</math>वें सैंपलिंग पर विचार करें जब एक अपेक्षा की गणना करने के लिए मूल्यों का औसत निकाला जाता है। उदाहरण के लिए, पहले 1,000 प्रतिदर्शो को नजरअंदाज किया जा सकता है, और फिर हर 100वें सैंपलिंग का औसत निकाला जाता है, बाकी सभी को प्रक्षेपित कर दिया जाता है। इसका कारण यह है कि (1) मार्कोव श्रृंखला का [[स्थिर वितरण]] चरों पर वांछित संयुक्त वितरण है, लेकिन उस स्थिर वितरण तक पहुंचने में कुछ समय लग सकता है, (2) क्रमिक सैंपलिंग एक दूसरे से स्वतंत्र नहीं होते हैं लेकिन कुछ मात्रा में सहसंबंध के साथ एक [[मार्कोव श्रृंखला]] बनाते हैं। कभी-कभी, कलन विधि का उपयोग प्रतिदर्शो के बीच स्वसंबंध की मात्रा और इससे गणना की गई <math>n</math> (सैम्पल के बीच की अवधि जो वास्तव में उपयोग की जाती है) के मान को निर्धारित करने के लिए किया जा सकता है, लेकिन व्यवहार में इसमें उचित मात्रा में [[काला जादू (प्रोग्रामिंग)|अनिष्टकारी या काला जादू]] सम्मिलित होता है।
* प्रतिचयन प्रक्रिया के शुरुआती भाग में[[ यादृच्छिक चाल | यादृच्छिक भ्रमण]] व्यवहार को कम करने के लिए अनुकारित अनीलन की प्रक्रिया का उपयोग अक्सर किया जाता है (यानी प्रतिदर्श समष्टि के चारों ओर धीरे-धीरे घूमने की प्रवृत्ति, प्रतिदर्शो के बीच उच्च मात्रा में [[स्वतः सहसंबंध]] की उच्च मात्रा के साथ, वांछित के रूप में जल्दी से घूमने की बजाय)। अन्य तकनीकें जो स्वत:सहसंबंध को कम कर सकती हैं, उन्हें गिब्स प्रतिचयन, अवरुद्ध गिब्स प्रतिचयन, और अतिविश्राम में सुव्यवस्थित किया गया है, नीचे देखें।
* सैंपलिंग प्रक्रिया के प्रारंभिक भाग में[[ यादृच्छिक चाल | यादृच्छिक भ्रमण]] व्यवहार को कम करने के लिए अनुकारित अनीलन की प्रक्रिया का उपयोग प्रायः किया जाता है (यानी सैंपलिंग समष्टि के चारों ओर धीरे-धीरे घूमने की प्रवृत्ति, जल्दी से घूमने के बजाय, प्रतिदर्शो के बीच उच्च मात्रा में [[स्वतः सहसंबंध]] के साथ, वांछित है)। अन्य तकनीकें जो स्वत:सहसंबंध को कम कर सकती हैं, उन्हें गिब्स प्रतिचयन, अवरुद्ध गिब्स प्रतिचयन, और अतिविश्राम में सुव्यवस्थित किया गया है, नीचे देखें।


=== सशर्त वितरण और संयुक्त वितरण का संबंध ===
=== सशर्त वितरण और संयुक्त वितरण का संबंध ===
Line 51: Line 50:


:<math>p(x_j\mid x_1,\dots,x_{j-1},x_{j+1},\dots,x_n) = \frac{p(x_1,\dots,x_n)}{p(x_1,\dots,x_{j-1},x_{j+1},\dots,x_n)} \propto p(x_1,\dots,x_n)</math>
:<math>p(x_j\mid x_1,\dots,x_{j-1},x_{j+1},\dots,x_n) = \frac{p(x_1,\dots,x_n)}{p(x_1,\dots,x_{j-1},x_{j+1},\dots,x_n)} \propto p(x_1,\dots,x_n)</math>
इस स्थिति में समानुपाती का अर्थ है कि भाजक <math>x_j</math> का फलन नहीं है और इस प्रकार <math>x_j</math>के सभी मानों के लिए समान है, यह <math>x_j</math>पर वितरण के लिए [[सामान्यीकरण स्थिरांक]] का हिस्सा बनता है। व्यवहार में, एक कारक <math>x_j</math> के सशर्त वितरण की प्रकृति का निर्धारण करने के लिए, चर पर [[ग्राफिकल मॉडल|आलेखीय प्रतिरूप]] द्वारा परिभाषित व्यक्तिगत सशर्त वितरण के अनुसार संयुक्त वितरण को कारक बनाना सबसे आसान है, उन सभी कारकों को अनदेखा करें जो <math>x_j</math> के फलन नहीं हैं, (जिनमें से सभी, उपरोक्त भाजक के साथ मिलकर सामान्यीकरण स्थिरांक का निर्माण करते हैं), और फिर आवश्यकतानुसार सामान्यीकरण स्थिरांक को अंत में पुनर्स्थापित करते हैं। व्यवहार में, इसका मतलब तीन चीजों में से एक करना है,
इस स्थिति में समानुपाती का अर्थ है कि भाजक <math>x_j</math> का फलन नहीं है और इस प्रकार <math>x_j</math>के सभी मानों के लिए समान है, तथा यह <math>x_j</math>पर वितरण के लिए [[सामान्यीकरण स्थिरांक]] का हिस्सा बनता है। व्यवहार में, एक कारक <math>x_j</math> के सशर्त वितरण की प्रकृति का निर्धारण करने के लिए, चर पर [[ग्राफिकल मॉडल|आलेखीय प्रतिरूप]] द्वारा परिभाषित व्यक्तिगत सशर्त वितरण के अनुसार संयुक्त वितरण को कारक बनाना सबसे आसान है, उन सभी कारकों को अनदेखा करें जो <math>x_j</math> के फलन नहीं हैं, (जिनमें से सभी, उपरोक्त भाजक के साथ मिलकर सामान्यीकरण स्थिरांक का निर्माण करते हैं), और फिर आवश्यकतानुसार सामान्यीकरण स्थिरांक को अंत में पुनर्स्थापित करते हैं। व्यवहार में, इसका मतलब तीन चीजों में से एक को करना है,
# यदि वितरण असतत है, तो <math>x_j</math> के सभी संभावित मानों की अलग-अलग संभावनाओं की गणना की जाती है, और फिर सामान्यीकरण स्थिरांक खोजने के लिए योग किया जाता है।
# यदि वितरण असतत है, तो <math>x_j</math> के सभी संभावित मानों की अलग-अलग संभावनाओं की गणना की जाती है, और फिर सामान्यीकरण स्थिरांक खोजने के लिए योग किया जाता है।
#यदि वितरण निरंतर है और ज्ञात रूप का है, तो सामान्यीकरण स्थिरांक भी ज्ञात होगा।
#यदि वितरण निरंतर है और ज्ञात रूप का है, तो सामान्यीकरण स्थिरांक भी ज्ञात होगा।
# अन्य स्थितियों में, सामान्यीकरण स्थिरांक को आमतौर पर अनदेखा किया जा सकता है, क्योंकि अधिकांश प्रतिचयन विधियों को इसकी आवश्यकता नहीं होती है।
# अन्य स्थितियों में, सामान्यीकरण स्थिरांक को सामान्यतः अनदेखा किया जा सकता है, क्योंकि अधिकांश सैंपलिंग विधियों को इसकी आवश्यकता नहीं होती है।


== निष्कर्ष ==
== निष्कर्ष ==
गिब्स प्रतिचयन आमतौर पर [[सांख्यिकीय अनुमिती]] के लिए उपयोग किया जाता है (उदाहरण के लिए पैरामीटर का सर्वोत्तम मूल्य निर्धारित करना, जैसे कि किसी विशेष स्टोर पर किसी विशेष स्टोर पर खरीदारी करने वाले लोगों की संख्या का निर्धारण करना, तथा वह उम्मीदवार जिसे मतदाता सबसे अधिक वोट देगा, मतदाताओ की संख्या का निर्धारण करना, आदि)। विचार यह है कि देखे गए डेटा के प्रत्येक टुकड़े के लिए अलग-अलग चर बनाकर और उन चरों से प्रतिदर्श लेने के बजाय, उनके देखे गए मूल्यों के लिए चर को ठीक करके प्रतिचयन प्रक्रिया में सम्मिलित किया गया है। शेष चरों का वितरण प्रभावी रूप से प्रेक्षित डेटा पर वातानुकूलित [[पश्च वितरण]] है।
गिब्स सैंपलिंग सामान्यतः [[सांख्यिकीय अनुमिती]] के लिए उपयोग किया जाता है (उदाहरण के लिए मापदण्ड का सर्वोत्तम मूल्य निर्धारित करना, जैसे कि किसी विशेष स्टोर पर किसी दिए गए दिनखरीदारी करने वाले लोगों की संख्या निर्धारित करना, तथा एक मतदाता जिस उम्मीदवार को सबसे अधिक वोट देगा, का निर्धारण करना, आदि)। विचार यह है कि देखे गए डेटा के प्रत्येक टुकड़े के लिए अलग-अलग चर बनाकर और उन चरों से सैंपलिंग लेने के बजाय, उनके देखे गए मूल्यों के लिए चर को ठीक करके सैंपलिंग प्रक्रिया में सम्मिलित किया गया है। शेष चरों का वितरण प्रभावी रूप से प्रेक्षित डेटा पर वातानुकूलित [[पश्च वितरण|उत्‍तरबंटन]] है।


एक वांछित पैरामीटर ([[मोड (सांख्यिकी)]]) का सबसे संभावित मूल्य तब प्रतिदर्श मान चुनकर चुना जा सकता है जो आमतौर पर सबसे अधिक होता है; यह अनिवार्य रूप से एक पैरामीटर के अधिकतम पोस्टीरियर अनुमान के बराबर है। (चूंकि पैरामीटर आमतौर पर निरंतर होते हैं, इसलिए मोड का एक सार्थक अनुमान प्राप्त करने के लिए नमूनाकृत मानों को परिमित संख्या में श्रेणियों या बिनों में से एक में बिन करना आवश्यक होता है।) अधिक सामान्यतः, हालांकि, अपेक्षित मूल्य (माध्य या औसत) प्रतिदर्श मूल्यों का चयन किया जाता है; यह एक [[बेयस अनुमानक]] है जो पूरे वितरण के बारे में अतिरिक्त डेटा का लाभ उठाता है जो कि बायेसियन प्रतिचयन से उपलब्ध है, जबकि [[ अपेक्षा अधिकतमकरण ]] (ईएम) जैसे अधिकतमकरण कलन विधि वितरण से केवल एक बिंदु वापस करने में सक्षम है। उदाहरण के लिए, एक असमान वितरण के लिए माध्य (अपेक्षित मान) आमतौर पर मोड (सबसे सामान्य मान) के समान होता है, लेकिन यदि वितरण एक दिशा में तिरछा है, तो माध्य उस दिशा में ले जाया जाएगा, जो प्रभावी रूप से अतिरिक्त उस दिशा में संभाव्यता द्रव्यमान। (यदि कोई वितरण मल्टीमोडल है, तो अपेक्षित मान सार्थक बिंदु नहीं लौटा सकता है, और कोई भी मोड आमतौर पर बेहतर विकल्प होता है।)
एक वांछित मापदण्ड ([[मोड (सांख्यिकी)|मोड]]) का सबसे संभावित मूल्य तब केवल उस सैंपलिंग मान को  चुनकर चयनित किया जा सकता है जो सामान्यतः सबसे अधिक होता है, यह अनिवार्य रूप से एक मापदण्ड के [[अधिकतम पश्चात]] के अनुमान के बराबर है। (चूंकि मापदण्ड सामान्यतः निरंतर होते हैं, इसलिए मोड का एक सार्थक अनुमान प्राप्त करने के लिए प्रतिचयित मानों को परिमित संख्या में से किसी एक श्रेणी या "बिन" में "बिन" करना प्रायः आवश्यक होता है।) अधिक सामान्यतः, हालांकि, सैंपलिंग मूल्यों का [[अपेक्षित मूल्य]] ([[माध्य]] या औसत) चुना जाता है, यह एक [[बेयस अनुमानक]] है जो पूरे वितरण के बारे में अतिरिक्त डेटा का लाभ उठाता है जो कि बायेसियन सैंपलिंग से उपलब्ध है, जबकि[[ अपेक्षा अधिकतमकरण ]] (ईएम) जैसे अधिकतमकरण कलन विधि वितरण से केवल एक बिंदु वापस करने में सक्षम है। उदाहरण के लिए, एक असमान वितरण के लिए माध्य (अपेक्षित मान) सामान्यतः मोड (सबसे सामान्य मान) के समान होता है, लेकिन यदि वितरण एक दिशा में [[तिरछा|विषमतलीय]] है, तो माध्य उस दिशा में चला जाएगा, जो उस दिशा में अतिरिक्त संभावना द्रव्यमान के लिए प्रभावी रूप से जिम्मेदार है। (यदि कोई वितरण बहुविध है, तो अपेक्षित मान सार्थक बिंदु नहीं लौटा सकता है, और कोई भी मोड सामान्यतः बेहतर विकल्प होता है।)


हालाँकि कुछ चर आम तौर पर रुचि के मापदंडों के अनुरूप होते हैं, अन्य चर के बीच संबंधों को ठीक से व्यक्त करने के लिए मॉडल में पेश किए गए अरुचिकर (उपद्रव) चर हैं। हालांकि प्रतिदर्श मूल्य सभी चर पर संयुक्त वितरण का प्रतिनिधित्व करते हैं, अपेक्षित मूल्यों या मोड की गणना करते समय उपद्रव चर को आसानी से अनदेखा किया जा सकता है; यह उपद्रव चर पर सीमांत वितरण के बराबर है। जब एकाधिक चर के लिए एक मान वांछित होता है, तो अपेक्षित मान की गणना प्रत्येक चर पर अलग से की जाती है। (मोड की गणना करते समय, हालांकि, सभी चरों को एक साथ माना जाना चाहिए।)
हालाँकि कुछ चर सामान्य तौर पर रुचि के मापदंडों के अनुरूप होते हैं, अन्य चर के बीच संबंधों को ठीक से व्यक्त करने के लिए प्रतिरूप में पेश किए गए अरुचिकर (उपद्रव) चर हैं। हालांकि सैंपलिंग मूल्य सभी चर पर [[संयुक्त वितरण]] का प्रतिनिधित्व करते हैं, तथा अपेक्षित मूल्यों या मोड की गणना करते समय उपद्रव चर को आसानी से अनदेखा किया जा सकता है, यह उपद्रव चर पर [[सीमांत वितरण]] के बराबर है। जब एकाधिक चर के लिए एक मान वांछित होता है, तो अपेक्षित मान की गणना प्रत्येक चर पर अलग से की जाती है। (हालांकि, मोड की गणना करते समय, सभी चरों को एक साथ माना जाना चाहिए।)


[[ पर्यवेक्षित अध्ययन ]], [[ अनियंत्रित शिक्षा ]] और [[ अर्ध-पर्यवेक्षित शिक्षा ]] (उर्फ लर्निंग विद मिसिंग वैल्यूज) सभी को उन सभी वेरिएबल्स के मानों को ठीक करके नियंत्रित किया जा सकता है, जिनके मूल्य ज्ञात हैं, और शेष से प्रतिदर्श लेना।
[[ पर्यवेक्षित अध्ययन |पर्यवेक्षित अध्ययन]], [[ अनियंत्रित शिक्षा |अनियंत्रित शिक्षा]] और [[ अर्ध-पर्यवेक्षित शिक्षा |अर्ध-पर्यवेक्षित शिक्षा]] (विलुप्त मूल्यों के साथ सीखना) सभी को उन सभी चरो के मानों को ठीक करके नियंत्रित किया जा सकता है, जिनके मूल्य ज्ञात हैं, और जो शेष सैंपलिंग लेते है।


अवलोकन किए गए डेटा के लिए, प्रत्येक अवलोकन के लिए एक चर होगा- उदाहरण के लिए, अवलोकन के एक सेट के [[नमूना माध्य|प्रतिदर्श माध्य]] या प्रतिदर्श भिन्नता के अनुरूप एक चर। वास्तव में, आम तौर पर प्रतिदर्श माध्य या प्रतिदर्श भिन्नता जैसी अवधारणाओं के अनुरूप कोई भी चर नहीं होगा। इसके बजाय, ऐसे मामले में अज्ञात वास्तविक माध्य और वास्तविक भिन्नता का प्रतिनिधित्व करने वाले चर होंगे, और इन चरों के लिए प्रतिदर्श मानों का निर्धारण स्वचालित रूप से गिब्स सैम्पलर के संचालन से होता है।
अवलोकन किए गए डेटा के लिए, प्रत्येक अवलोकन के लिए एक चर होगा- उदाहरण के लिए, अवलोकन के एक सेट के [[नमूना माध्य|सैंपलिंग माध्य]] या [[प्रतिदर्श प्रसरण|सैंपलिंग प्रसरण]] के अनुरूप एक चर। वास्तव में, सामान्यतः सैंपलिंग माध्य या सैंपलिंग प्रसरण जैसी अवधारणाओं के अनुरूप कोई भी चर नहीं होगा। इसके बजाय, ऐसी स्थिति में अज्ञात वास्तविक माध्य और वास्तविक प्रसरण का प्रतिनिधित्व करने वाले चर होंगे, और इन चरों के लिए सैंपलिंग मानों का निर्धारण स्वचालित रूप से गिब्स प्रतिदर्शित्र के संचालन से होता है।


[[सामान्यीकृत रैखिक मॉडल]] (यानी रैखिक प्रतिगमन की विविधताएं) कभी-कभी गिब्स प्रतिचयन द्वारा भी नियंत्रित किए जा सकते हैं। उदाहरण के लिए, दिए गए बाइनरी (हां/नहीं) विकल्प की संभावना निर्धारित करने के लिए [[ प्रोबिट प्रतिगमन ]], प्रतिगमन गुणांकों पर रखे गए [[सामान्य वितरण]] पुरोहितों के साथ, गिब्स प्रतिचयन के साथ लागू किया जा सकता है क्योंकि अतिरिक्त चर जोड़ना और [[पूर्व संयुग्मन]] का लाभ उठाना संभव है। . हालाँकि, [[ संभार तन्त्र परावर्तन ]] को इस तरह से हैंडल नहीं किया जा सकता है। एक संभावना सामान्य वितरण के मिश्रण (आमतौर पर 7-9) के साथ [[रसद समारोह]] को अनुमानित करना है। अधिक सामान्यतः, कैसेकभी, गिब्स प्रतिदर्श के बजाय मेट्रोपोलिस-हेस्टिंग्स का उपयोग किया जाता है।
[[सामान्यीकृत रैखिक मॉडल|सामान्यीकृत रैखिक प्रतिरूप]] (यानी [[रैखिक प्रतिगमन]] की विविधताएं) कभी-कभी गिब्स सैंपलिंग द्वारा भी नियंत्रित किए जा सकते हैं। उदाहरण के लिए, दिए गए द्विआधारी (हां/नहीं) विकल्प की संभावना निर्धारित करने के लिए[[ प्रोबिट प्रतिगमन | प्रोबिट प्रतिगमन]], [[सामान्य वितरण]] पुरोहितों को साथ समाश्रयण गुणांकों पर रखा जाता है, तथा इसे गिब्स सैंपलिंग के साथ लागू किया जा सकता है क्योंकि अतिरिक्त चर को जोड़ना और [[पूर्व संयुग्मन|संयुग्मन]] का लाभ उठाना संभव है। हालाँकि,[[ संभार तन्त्र परावर्तन ]]को इस तरह से संभाला नहीं जा सकता है। एक संभावना सामान्य वितरण के मिश्रण (सामान्यतः 7-9) के साथ [[रसद समारोह|तार्किक फलन]] को अनुमानित करना है। अधिक सामान्यतः, गिब्स सैंपलिंग के बजाय [[मेट्रोपोलिस-हेस्टिंग्स]] का उपयोग किया जाता है।


== गणितीय पृष्ठभूमि ==
== गणितीय पृष्ठभूमि ==


मान लीजिए कि एक प्रतिदर्श <math>\left.X\right.</math> पैरामीटर सदिश के आधार पर वितरण से लिया जाता है <math>\theta \in \Theta \,\!</math> लंबाई का <math>\left.d\right.</math>, पूर्व वितरण के साथ <math>g(\theta_1, \ldots , \theta_d)</math>. यह हो सकता है कि <math>\left.d\right.</math> बहुत बड़ा है और उस संख्यात्मक एकीकरण के सीमांत घनत्व को खोजने के लिए <math>\left.\theta_i\right.</math> कम्प्यूटेशनल रूप से महंगा होगा। फिर सीमांत घनत्व की गणना करने का एक वैकल्पिक तरीका अंतरिक्ष पर एक मार्कोव श्रृंखला बनाना है <math>\left.\Theta\right.</math> इन दो चरणों को दोहरा कर:
मान लीजिए कि एक सैंपलिंग <math>\left.X\right.</math> वितरण से लिया गया है जो पूर्व वितरण <math>g(\theta_1, \ldots , \theta_d)</math> के साथ लंबाई <math>\left.d\right.</math> के मापदण्ड सदिश <math>\theta \in \Theta \,\!</math> पर निर्भर करता है। यह हो सकता है कि <math>\left.d\right.</math> बहुत बड़ा होगा और <math>\left.\theta_i\right.</math> के सीमांत घनत्वों को खोजने के लिए एकीकरण अभिकलनीयत रूप से महंगा होगा। फिर इन दो चरणों को दोहराते हुए सीमांत घनत्व की गणना करने का एक वैकल्पिक तरीका समष्टि <math>\left.\Theta\right.</math> पर एक मार्कोव श्रृंखला बनाना है,


# एक यादृच्छिक सूचकांक चुनें <math>1 \leq j \leq d</math>
# एक यादृच्छिक सूचकांक चुनें <math>1 \leq j \leq d</math>
# के लिए एक नया मान चुनें <math>\left.\theta_j\right.</math> के अनुसार <math>g(\theta_1, \ldots , \theta_{j-1} , \, \cdot \, , \theta_{j+1} , \ldots , \theta_d )</math>
# <math>g(\theta_1, \ldots , \theta_{j-1} , \, \cdot \, , \theta_{j+1} , \ldots , \theta_d )</math> के अनुसार <math>\left.\theta_j\right.</math>के लिए एक नया मान चुनें
ये चरण वांछित अपरिवर्तनीय वितरण के साथ एक मार्कोव श्रृंखला#प्रतिवर्ती मार्कोव श्रृंखला को परिभाषित करते हैं <math>\left.g\right.</math>. यह
ये चरण वांछित [[अपरिवर्तनीय]] वितरण <math>\left.g\right.</math> के साथ एक [[मार्कोव श्रृंखला]] को परिभाषित करते हैं । इसे इस प्रकार सिद्ध किया जा सकता है। सभी <math>i \neq j</math> के लिए <math>x \sim_j y</math> यदि  <math>\left.x_i = y_i\right.</math>को परिभाषित करें और मान लें कि  <math>\left.p_{xy}\right.</math> <math>x \in \Theta</math> से <math>y \in \Theta</math> तक छलांग लगाने की संभावना को दर्शाता है। फिर, संक्रमण प्रायिकता
निम्नानुसार सिद्ध किया जा सकता है। परिभाषित करना <math>x \sim_j y</math> अगर <math>\left.x_i = y_i\right.</math> सभी के लिए <math>i \neq j</math> और जाने <math>\left.p_{xy}\right.</math> से कूदने की संभावना को निरूपित करें <math>x \in \Theta</math> को <math>y \in \Theta</math>. फिर, संक्रमण संभावनाएं हैं


:<math>p_{xy} = \begin{cases}
:<math>p_{xy} = \begin{cases}
Line 83: Line 81:
\end{cases}
\end{cases}
  </math>
  </math>
इसलिए
हैं अतः
:<math>
:<math>
g(x) p_{xy} = \frac{1}{d}\frac{ g(x) g(y)}{\sum_{z \in \Theta: z \sim_j x} g(z) }
g(x) p_{xy} = \frac{1}{d}\frac{ g(x) g(y)}{\sum_{z \in \Theta: z \sim_j x} g(z) }
Line 89: Line 87:
= g(y) p_{yx}
= g(y) p_{yx}
</math>
</math>
तब से <math>x \sim_j y</math> एक [[तुल्यता संबंध]] है। इस प्रकार [[विस्तृत संतुलन समीकरण]] संतुष्ट हैं, जिसका अर्थ है कि श्रृंखला उत्क्रमणीय है और इसमें अपरिवर्तनीय वितरण है <math>\left.g\right.</math>.
चूँकि <math>x \sim_j y</math> एक [[तुल्यता संबंध]] है। इस प्रकार [[विस्तृत संतुलन समीकरण]] संतुष्ट हैं, जिसका अर्थ है कि श्रृंखला प्रतिवर्ती है और इसमें अपरिवर्तनीय वितरण <math>\left.g\right.</math> है।


व्यवहार में, index <math>\left.j\right.</math> यादृच्छिक रूप से नहीं चुना जाता है, और अनुक्रमित के माध्यम से श्रृंखला चक्र क्रम में होता है। सामान्य तौर पर यह एक गैर-स्थिर मार्कोव प्रक्रिया देता है, लेकिन प्रत्येक व्यक्तिगत चरण अभी भी प्रतिवर्ती होगा, और समग्र प्रक्रिया में अभी भी वांछित स्थिर वितरण होगा (जब तक कि श्रृंखला निश्चित क्रम के तहत सभी राज्यों तक पहुंच सकती है)।
व्यवहार में, अनुक्रमित <math>\left.j\right.</math> को यादृच्छिक रूप से नहीं चुना जाता है, और अनुक्रमित के माध्यम से श्रृंखला चक्र क्रम में होती है। सामान्य तौर पर यह एक गैर-स्थिर मार्कोव प्रक्रिया देता है, लेकिन प्रत्येक व्यक्तिगत चरण अभी भी प्रतिवर्ती होगा, और समग्र प्रक्रिया में अभी भी वांछित स्थिर वितरण होगा (जब तक कि श्रृंखला निश्चित क्रम के तहत सभी अवस्थाओ तक पहुंच सकती है)।


== बायेसियन अनुमान में गिब्स सैम्पलर और सूचना सिद्धांत से इसका संबंध ==
== बायेसियन अनुमान में गिब्स प्रतिदर्शित्र और सूचना सिद्धांत के संबंध ==
होने देना <math>y</math> प्रतिदर्श वितरण से उत्पन्न टिप्पणियों को निरूपित करें <math>f(y|\theta)</math> और <math>\pi(\theta)</math> पैरामीटर स्पेस पर पूर्व समर्थित हो <math>\Theta</math>. फिर बायेसियन आँकड़ों का एक केंद्रीय लक्ष्य पश्च घनत्व का अनुमान लगाना है
मान लीजिए  <math>y</math> सैंपलिंग वितरण से उत्पन्न टिप्पणियों को निरूपित करता है तब <math>f(y|\theta)</math> और <math>\pi(\theta)</math> प्राचल समष्टि <math>\Theta</math> पर पूर्व समर्थित हैं। फिर बायेसियन आँकड़ों के केंद्रीय लक्ष्यों में से एक पश्च घनत्व


:<math>\pi(\theta|y) = \frac{f(y|\theta) \cdot \pi(\theta)}{m(y)}</math>
:<math>\pi(\theta|y) = \frac{f(y|\theta) \cdot \pi(\theta)}{m(y)}</math>
जहां मामूली संभावना है <math> m(y)  = \int_{\Theta} f(y|\theta) \cdot \pi(\theta) d\theta </math> सभी के लिए परिमित माना जाता है <math>y</math>.
का अनुमान लगाना है जहां सीमांत संभावना <math> m(y)  = \int_{\Theta} f(y|\theta) \cdot \pi(\theta) d\theta </math> को सभी <math>y</math> के लिए परिमित माना जाता है।


गिब्स सैंपलर की व्याख्या करने के लिए, हम अतिरिक्त रूप से मान लेते हैं कि पैरामीटर स्पेस <math>\Theta</math> रूप में विघटित हो जाता है
गिब्स प्रतिदर्शित्र की व्याख्या करने के लिए, हम अतिरिक्त रूप से मान लेते हैं कि मापदण्ड समष्टि <math>\Theta</math> रूप में विघटित हो जाता है


:<math>\Theta = \prod_{i=1}^{K}\Theta_{i} = \Theta_1 \times \cdots \Theta_i \times \cdots \times \Theta_K, \quad\quad (K>1)</math>,
:<math>\Theta = \prod_{i=1}^{K}\Theta_{i} = \Theta_1 \times \cdots \Theta_i \times \cdots \times \Theta_K, \quad\quad (K>1)</math>,
कहाँ <math>\times</math> कार्टेशियन उत्पाद का प्रतिनिधित्व करता है। प्रत्येक घटक पैरामीटर स्थान <math>\Theta_i</math> स्केलर घटकों, सबसदिश या मैट्रिसेस का एक सेट हो सकता है।
जहाँ <math>\times</math> [[कार्तीय गुणनफल]] को प्रदर्शित करता है। प्रत्येक घटक प्राचल समष्टि <math>\Theta_i</math> अदिश घटकों, उपसदिश या मैट्रिसेस का एक समुच्चय हो सकता है।


समुच्चय को परिभाषित कीजिए <math>\Theta_{-i}</math> जो पूरक करता है <math>\Theta_i</math>. गिब्स सैम्पलर की आवश्यक सामग्री है <math>i</math>प्रत्येक के लिए -वाँ पूर्ण सशर्त पश्च वितरण <math>i=1,\cdots, K</math>
एक समुच्चय <math>\Theta_{-i}</math> को परिभाषित करें जो <math>\Theta_i</math>को पूरा करें। गिब्स प्रतिदर्शित्र की आवश्यक सामग्री प्रत्येक <math>i=1,\cdots, K</math>
:<math>\pi(\theta_i|\theta_{-i},y)=\pi(\theta_i|\theta_1, \cdots, \theta_{i-1},\theta_{i+1},\cdots, \theta_{K},y)</math>.
:<math>\pi(\theta_i|\theta_{-i},y)=\pi(\theta_i|\theta_1, \cdots, \theta_{i-1},\theta_{i+1},\cdots, \theta_{K},y)</math>के लिए <math>i</math>-वाँ पूर्ण सशर्त उत्‍तरबंटन है


[[File:Gibbs sampler picture.jpg|thumb|500px|गिब्स प्रतिचयन कलन विधि का सचित्र विवरण <ref name="Lee2008">{{Cite journal |last=Lee|first=Se Yoon|  title = Gibbs sampler and coordinate ascent variational inference: A set-theoretical review|journal=Communications in Statistics - Theory and Methods|year=2021|doi=10.1080/03610926.2021.1921214|arxiv=2008.01006}}</ref>]]
[[File:Gibbs sampler picture.jpg|thumb|500px|गिब्स सैंपलिंग कलन विधि का सचित्र विवरण <ref name="Lee2008">{{Cite journal |last=Lee|first=Se Yoon|  title = Gibbs sampler and coordinate ascent variational inference: A set-theoretical review|journal=Communications in Statistics - Theory and Methods|year=2021|doi=10.1080/03610926.2021.1921214|arxiv=2008.01006}}</ref>]]
[[File:Gibbs sampling info eq.jpg|thumb|500px|एक चक्र के भीतर i-वें चरण में गिब्स सैम्पलर से जुड़ी सूचना समानता का योजनाबद्ध विवरण <ref name="Lee2008" />]]निम्नलिखित कलन विधि एक सामान्य गिब्स सैंपलर का विवरण देता है:
[[File:Gibbs sampling info eq.jpg|thumb|500px|एक चक्र के भीतर i-वें चरण में गिब्स प्रतिदर्शित्र से जुड़ी सूचना समानता का योजनाबद्ध विवरण <ref name="Lee2008" />]]निम्नलिखित कलन विधि एक सामान्य गिब्स प्रतिदर्शित्र का विवरण देता है,


<math>\text{Initialize: pick arbitrary starting value}\,\, \theta^{(1)} = (\theta_1^{(1)},\theta_2^{(1)},\cdots,\theta_i^{(1)},\theta_{i+1}^{(1)},\cdots,\theta_K^{(1)}) </math>
<math>\text{Initialize: pick arbitrary starting value}\,\, \theta^{(1)} = (\theta_1^{(1)},\theta_2^{(1)},\cdots,\theta_i^{(1)},\theta_{i+1}^{(1)},\cdots,\theta_K^{(1)}) </math>
Line 131: Line 129:


<math>\text{end Iterate}</math>
<math>\text{end Iterate}</math>
ध्यान दें कि गिब्स सैम्पलर एक चक्र के भीतर पुनरावृत्त मोंटे कार्लो योजना द्वारा संचालित होता है। <math>S</math> एच>प्रतिदर्शो की संख्या <math>\{\theta^{(s)} \}_{s=1}^{S}</math> उपरोक्त कलन विधि द्वारा तैयार किए गए मार्कोव चेन को लक्ष्य घनत्व के रूप में अपरिवर्तनीय वितरण के साथ तैयार किया गया है <math>\pi(\theta|y)</math>.


अब, प्रत्येक के लिए <math>i=1,\cdots,K</math>, निम्नलिखित सूचना सैद्धांतिक मात्रा को परिभाषित करें:
ध्यान दें कि गिब्स प्रतिदर्शित्र एक चक्र के भीतर पुनरावृत्त मोंटे कार्लो योजना द्वारा संचालित होता है। उपरोक्त कलन विधि द्वारा तैयार किए गए प्रतिदर्शो  <math>\{\theta^{(s)} \}_{s=1}^{S}</math> की <math>S</math> संख्या लक्ष्य घनत्व <math>\pi(\theta|y)</math> होने के लिए अपरिवर्तनीय वितरण के साथ मार्कोव शृंखला तैयार करती है।
 
अब, प्रत्येक <math>i=1,\cdots,K</math>, के लिए निम्नलिखित सूचना सैद्धांतिक मात्राओ को परिभाषित करें,


<math>I(\theta_i ; \theta_{-i}) = \text{KL}(\pi(\theta|y)||\pi(\theta_i|y) \cdot \pi(\theta_{-i}|y) )
<math>I(\theta_i ; \theta_{-i}) = \text{KL}(\pi(\theta|y)||\pi(\theta_i|y) \cdot \pi(\theta_{-i}|y) )
Line 143: Line 142:


<math>H(\theta_{-i}|\theta_{i}) = -\int_{\Theta} \pi(\theta|y) \log \pi(\theta_{-i}|\theta_{i},y) d\theta,
<math>H(\theta_{-i}|\theta_{i}) = -\int_{\Theta} \pi(\theta|y) \log \pi(\theta_{-i}|\theta_{i},y) d\theta,
</math> अर्थात्, पश्च पारस्परिक सूचना, पश्च अंतर एन्ट्रापी, और पश्च सशर्त अंतर एन्ट्रापी, क्रमशः। हम इसी तरह सूचना सिद्धांतिक मात्राओं को परिभाषित कर सकते हैं <math>I(\theta_{-i} ; \theta_{i})</math>, <math>H(\theta_{i})</math>, और <math>H(\theta_{i}|\theta_{-i})</math> अदला-बदली करके <math>i</math> और <math>-i</math> परिभाषित मात्रा में। फिर, निम्नलिखित <math>K</math> समीकरण कायम हैं।<ref name="Lee2008" />
</math>  
 
अर्थात्, क्रमशः उत्तर पारस्परिक सूचना, उत्तर अंतर एन्ट्रापी, और उत्तर सशर्त अंतर एन्ट्रापी, हम इसी प्रकार परिभाषित मात्राओं में  <math>i</math> और <math>-i</math> को बदलकर सूचना सिद्धांतिक मात्राओं <math>I(\theta_{-i} ; \theta_{i})</math>, <math>H(\theta_{i})</math>, और <math>H(\theta_{i}|\theta_{-i})</math> को परिभाषित कर सकते हैं। फिर, निम्नलिखित <math>K</math> समीकरण लागू होता हैं।<ref name="Lee2008" />


<math>I(\theta_i ; \theta_{-i}) = H(\theta_{-i}) - H(\theta_{-i}|\theta_{i})  
<math>I(\theta_i ; \theta_{-i}) = H(\theta_{-i}) - H(\theta_{-i}|\theta_{i})  
=  H(\theta_{i}) - H(\theta_{i}|\theta_{-i}) = I(\theta_{-i} ; \theta_{i}), \quad (i=1,\cdots,K) </math>.
=  H(\theta_{i}) - H(\theta_{i}|\theta_{-i}) = I(\theta_{-i} ; \theta_{i}), \quad (i=1,\cdots,K) </math>
 
आपसी जानकारी <math>I(\theta_i ; \theta_{-i}) </math> यादृच्छिक मात्रा की अनिश्चितता में कमी की मात्रा निर्धारित करता है <math>\theta_{i}</math> एक बार हम जानते हैं <math>\theta_{-i}</math>, वापस। यह गायब हो जाता है अगर और केवल अगर <math>\theta_{i}</math> और <math>\theta_{-i}</math> आंशिक रूप से स्वतंत्र हैं, एक पश्च। आपसी जानकारी <math>I(\theta_i ; \theta_{-i})</math> से प्रसारित होने वाली मात्रा के रूप में व्याख्या की जा सकती है <math>i</math>-वें चरण के लिए <math>i+1</math>गिब्स सैम्पलर के एकल चक्र के भीतर -वाँ चरण।
 
== रूपांतर और विस्तार ==
 
बुनियादी गिब्स सैम्पलर के कई रूप मौजूद हैं। इन विविधताओं का लक्ष्य किसी भी अतिरिक्त कम्प्यूटेशनल लागतों को दूर करने के लिए पर्याप्त रूप सेप्रतिदर्शो के बीच स्वत: संबंध को कम करना है।


=== अवरुद्ध गिब्स नमूना ===
पारस्परिक सूचना <math>I(\theta_i ; \theta_{-i}) </math> यादृच्छिक मात्रा <math>\theta_{i}</math> की अनिश्चितता में कमी की मात्रा निर्धारित करती है, जब हम <math>\theta_{-i}</math>, का अनुमान लगाते हैं। यह गायब हो जाता है अगर केवल <math>\theta_{i}</math> और <math>\theta_{-i}</math> आंशिक रूप से स्वतंत्र हैं, और केवल अनुमान लगाते हैं। पारस्परिक सूचना <math>I(\theta_i ; \theta_{-i})</math> की व्याख्या उस मात्रा के रूप में की जा सकती है जो गिब्स प्रतिदर्शित्र के एकल चक्र के भीतर <math>i</math>-वें चरण से <math>i+1</math> चरण तक प्रेषित होती है।
*एक अवरुद्ध गिब्स सैम्पलर दो या दो से अधिक चरों को एक साथ समूहित करता है और उनके संयुक्त वितरण से प्रतिदर्श अलग-अलग प्रत्येक से प्रतिदर्श लेने के बजाय अन्य सभी चरों पर सशर्त होता है। उदाहरण के लिए, एक छिपे [[छिपा हुआ मार्कोव मॉडल]] में, एक अवरुद्ध गिब्स सैम्पलर [[ आगे-पीछे एल्गोरिदम | आगे-पीछे कलन विधि]]  का उपयोग करके मार्कोव श्रृंखला बनाने वाले सभी अव्यक्त चर से प्रतिदर्श ले सकता है।


=== संकुचित गिब्स नमूना ===
== विविधता और विस्तार ==
*किसी अन्य चर के लिए प्रतिदर्श लेते समय एक ढह गया गिब्स प्रतिदर्श एक या अधिक चर (सीमांत वितरण) को एकीकृत करता है। उदाहरण के लिए, कल्पना करें कि एक मॉडल में तीन चर ''ए'', ''बी'' और ''सी'' सम्मिलित हैं। एक साधारण गिब्स सैम्पलर ''p''(''A'' | ''B'',''C''), फिर ''p''(''B'' | ''A'' से प्रतिदर्श लेगा ,''C''), फिर ''p''(''C'' | ''A'',''B'')। एक संक्षिप्त गिब्स सैंपलर ''A'' के लिए प्रतिदर्श चरण को सीमांत वितरण ''p''(''A'' | ''C'') से लिए गए प्रतिदर्श से बदल सकता है, जिसमें वेरिएबल 'B'' एकीकृत है इस मामले में बाहर। वैकल्पिक रूप से, चर ''B'' को पूरी तरह से संक्षिप्त किया जा सकता है, वैकल्पिक रूप से ''p''(''A'' | ''C'') और ''p''(''C'' | '' से प्रतिदर्श लिया जा सकता है A'') और ''B'' पर प्रतिचयन बिल्कुल नहीं। एक चर ''ए'' पर वितरण जो मूल चर ''बी'' के ढहने पर उत्पन्न होता है, एक [[यौगिक वितरण]] कहलाता है; इस वितरण से प्रतिदर्श आम तौर पर ट्रैक्टेबल होता है जब 'बी' 'ए' के ​​​​लिए पूर्ववर्ती संयुग्म होता है, खासकर जब 'ए' और 'बी' [[घातीय परिवार]] के सदस्य होते हैं। अधिक जानकारी के लिए, यौगिक वितरण या लियू (1994) पर लेख देखें।<ref>{{cite journal | last        = Liu | first      = Jun S. |date=September 1994 | title      = The Collapsed Gibbs Sampler in Bayesian Computations with Applications to a Gene Regulation Problem | jstor        = 2290921 | journal    = Journal of the American Statistical Association | volume      = 89 | issue      = 427 | pages      = 958–966 | doi        = 10.2307/2290921 }}</ref>''


मूल गिब्स प्रतिदर्शित्र के कई रूप मौजूद हैं। इन विविधताओं का लक्ष्य किसी भी अतिरिक्त संगणनात्मक लागतों को दूर करने के लिए पर्याप्त रूप से प्रतिदर्शो के बीच [[स्वत: संबंध]] को कम करना है।


==== एक ढह चुके गिब्स सैंपलर को लागू करना ====
=== अवरुद्ध गिब्स प्रतिदर्शित्र ===
*एक अवरुद्ध गिब्स प्रतिदर्शित्र दो या दो से अधिक चरों को एक साथ समूहित करता है और उनके [[संयुक्त वितरण]] से सैंपलिंग अलग-अलग प्रत्येक से सैंपलिंग लेने के बजाय अन्य सभी चरों पर सशर्त होता है। उदाहरण के लिए, एक [[छिपे]] [[छिपा हुआ मार्कोव मॉडल|हुए मार्कोव प्रारूप]] में, एक अवरुद्ध गिब्स प्रतिदर्शित्र[[ आगे-पीछे एल्गोरिदम | अग्र पश्‍च कलन विधि]] का उपयोग करके [[मार्कोव श्रृंखला]] बनाने वाले सभी [[अव्यक्त चर]] से सैंपलिंग ले सकता है।


===== [[डिरिचलेट वितरण]] का ढहना =====
=== संकुचित गिब्स प्रतिदर्शित्र ===
*किसी अन्य चर के लिए सैंपलिंग लेते समय एक संकुचित गिब्स सैंपलिंग एक या अधिक चर ([[सीमांत वितरण]]) को एकीकृत करता है। उदाहरण के लिए, कल्पना करें कि एक प्रारुप में तीन चर ''A'', ''B'' और ''C'' होते हैं। एक साधारण गिब्स प्रतिदर्शित्र ''p''(''A'' | ''B'',''C''), तब ''p''(''B'' | ''A'' ,''C''), फिर ''p''(''C'' | ''A'',''B'') से सैंपलिंग लेगा। एक संकुचित गिब्स प्रतिदर्शित्र ''A'' के लिए सैंपलिंग चरण को सीमांत वितरण ''p''(''A'' | ''C'') से लिए गए सैंपलिंग से बदल सकता है, इस स्थिति में चर 'B'' को एकीकृत किया गया है। वैकल्पिक रूप से, चर ''B'' को पूरी तरह से संकुचित किया जा सकता है, वैकल्पिक रूप से ''p''(''A'' | ''C'') और ''p''(''C'' | ''A'') से सैंपलिंग लिया जा सकता है और ''B पर बिल्कुल भी ''सैंपलिंग नहीं लिया जा सकता है। एक चर A पर वितरण जो मूल चर  ''B ''के संकुचित होने पर उत्पन्न होता है, एक [[यौगिक वितरण|मिश्रित वितरण]] कहलाता है, इस वितरण से सैंपलिंग सामान्यतः सुविधाजनक होता है जब 'B' 'A ' के ​​​​लिए [[पूर्ववर्ती संयुग्म]] होता है, खासकर तब 'A' और 'B' [[घातीय परिवार]] के सदस्य होते हैं। अधिक जानकारी के लिए, [[यौगिक वितरण]] या लियू (1994) पर लेख देखें।<ref>{{cite journal | last        = Liu | first      = Jun S. |date=September 1994 | title      = The Collapsed Gibbs Sampler in Bayesian Computations with Applications to a Gene Regulation Problem | jstor        = 2290921 | journal    = Journal of the American Statistical Association | volume      = 89 | issue      = 427 | pages      = 958–966 | doi        = 10.2307/2290921 }}</ref>''
==== एक संकुचित गिब्स प्रतिदर्शित्र को लागू करना ====
==== संकुचित डिरिक्ले वितरण ====


[[श्रेणीबद्ध वितरण]] के साथ [[पदानुक्रमित बायेसियन मॉडल]] में, जैसे [[अव्यक्त डिरिचलेट आवंटन]] और [[प्राकृतिक भाषा प्रसंस्करण]] में उपयोग किए जाने वाले विभिन्न अन्य मॉडल, डिरिचलेट वितरण को समाप्त करना काफी आम है जो आमतौर पर श्रेणीबद्ध चर पर [[पूर्व वितरण]] के रूप में उपयोग किया जाता है। इस ढहने का परिणाम किसी दिए गए डिरिचलेट पर निर्भर सभी स्पष्ट चर के बीच निर्भरता का परिचय देता है, और ढहने के बाद इन चरों का संयुक्त वितरण एक [[डिरिचलेट-बहुराष्ट्रीय वितरण]] है। इस वितरण में दिए गए श्रेणीबद्ध चर का सशर्त वितरण, दूसरों पर वातानुकूलित, एक अत्यंत सरल रूप ग्रहण करता है जो गिब्स प्रतिचयन को और भी आसान बना देता है, यदि ढहना नहीं किया गया होता। नियम इस प्रकार हैं:
[[श्रेणीबद्ध वितरण|सुस्पष्ट चर]] के साथ [[पदानुक्रमित बायेसियन मॉडल|पदानुक्रमित बायेसियन]] प्रारूप में, जैसे [[अव्यक्त डिरिचलेट आवंटन]] और [[प्राकृतिक भाषा प्रसंस्करण]] में उपयोग किए जाने वाले विभिन्न अन्य प्रारूप, [[डिरिचलेट वितरण]] को समाप्त करना काफी सामान्य है जो सामान्यतः श्रेणीबद्ध चर पर [[पूर्व वितरण]] के रूप में उपयोग किया जाता है। इस संकुचित का परिणाम किसी दिए गए डिरिचलेट पर निर्भर सभी सुस्पष्ट चर के बीच निर्भरता का परिचय देता है, और संकुचित के बाद इन चरों का संयुक्त वितरण एक [[डिरिचलेट-बहुराष्ट्रीय वितरण]] है। यदि संकुचित नहीं किया गया होता तो इस वितरण में दिए गए श्रेणीबद्ध चर का सशर्त वितरण, दूसरों पर वातानुकूलित, एक अत्यंत सरल रूप ग्रहण करता है जो गिब्स सैंपलिंग को और भी आसान बना देता है। नियम इस प्रकार हैं,
# एक डिरिचलेट पूर्व नोड को समाप्त करने से केवल पूर्व के माता-पिता और बच्चों के नोड प्रभावित होते हैं। चूंकि माता-पिता अक्सर स्थिर होते हैं, आमतौर पर केवल बच्चों के बारे में हमें चिंता करने की आवश्यकता होती है।
# एक डिरिचलेट पूर्व नोड को संकुचित करने से केवल पूर्व के माता-पिता और बच्चों के नोड प्रभावित होते हैं। चूंकि माता-पिता प्रायः स्थिर होते हैं, इसलिए सामान्यतः केवल बच्चों के बारे में हमें चिंता करने की आवश्यकता होती है।
#Collapsing a Dirichlet प्रायर उस पूर्व पर निर्भर सभी स्पष्ट बच्चों के बीच निर्भरता का परिचय देता है - लेकिन किसी भी अन्य श्रेणीबद्ध बच्चों के बीच कोई अतिरिक्त निर्भरता नहीं है। (यह ध्यान रखना महत्वपूर्ण है, उदाहरण के लिए, जब एक ही हाइपरप्रियर से संबंधित कई डिरिचलेट प्रीयर होते हैं। प्रत्येक डिरिचलेट पूर्व को स्वतंत्र रूप से ध्वस्त किया जा सकता है और केवल इसके प्रत्यक्ष बच्चों को प्रभावित करता है।)
#एक डिरिचलेट पूर्व को समाप्त करने से उस पूर्व पर निर्भर सभी स्पष्ट बच्चों के बीच निर्भरता का परिचय मिलता है - लेकिन किसी भी अन्य श्रेणीबद्ध बच्चों के बीच कोई अतिरिक्त निर्भरता नहीं होती है। (यह ध्यान रखना महत्वपूर्ण है, उदाहरण के लिए, जब एक ही हाइपरप्रियर से संबंधित कई डिरिचलेट पूर्ववर्ती होते हैं। प्रत्येक डिरिचलेट पूर्व को स्वतंत्र रूप से ध्वस्त किया जा सकता है और केवल इसके प्रत्यक्ष बच्चों को प्रभावित करता है।)
# ढहने के बाद, एक आश्रित बच्चों का दूसरों पर सशर्त वितरण एक बहुत ही सरल रूप ग्रहण करता है: किसी दिए गए मूल्य को देखने की संभावना इस मूल्य के लिए संबंधित हाइपरप्रियर के योग के समानुपाती होती है, और अन्य सभी आश्रित नोड्स की गिनती समान मान मानकर। समान पूर्व पर निर्भर नहीं होने वाले नोड्स की गणना नहीं की जानी चाहिए। यही नियम अन्य पुनरावृत्त अनुमान विधियों में भी लागू होता है, जैसे वैरिएबल बेज़ या अपेक्षा अधिकतमीकरण; हालाँकि, यदि विधि में आंशिक गणना रखना सम्मिलित है, तो विचाराधीन मान के लिए आंशिक गणना को अन्य सभी आश्रित नोड्स में सम्मिलित किया जाना चाहिए। कभी-कभी इस सारांशित आंशिक गणना को अपेक्षित गणना या समान कहा जाता है। संभाव्यता परिणामी मान के समानुपाती होती है; वास्तविक संभाव्यता को उन सभी संभावित मानों के सामान्यीकरण द्वारा निर्धारित किया जाना चाहिए जो श्रेणीबद्ध चर ले सकते हैं (अर्थात श्रेणीबद्ध चर के प्रत्येक संभावित मान के लिए परिकलित परिणाम जोड़ना, और इस योग से सभी परिकलित परिणामों को विभाजित करना)।
# ढहने के बाद, एक आश्रित बच्चों का दूसरों पर सशर्त वितरण एक बहुत ही सरल रूप धारण कर लेता है, किसी दिए गए मूल्य को देखने की संभावना इस मूल्य के लिए संबंधित हाइपरप्रियर के योग के समानुपाती होती है, और समान मान मानने वाले अन्य सभी आश्रित नोड्स की गिनती होती है। समान पूर्व पर निर्भर नहीं होने वाले नोड्स की गणना नहीं की जानी चाहिए। यही नियम अन्य पुनरावृत्त अनुमान विधियों जैसे [[परिवर्तन संबंधी बेज़]] या [[अपेक्षा अधिकतमीकरण]] में भी लागू होता है, हालाँकि, यदि विधि में आंशिक गणना रखना सम्मिलित है, तो विचाराधीन मान के लिए आंशिक गणना को अन्य सभी आश्रित नोड्स में सम्मिलित किया जाना चाहिए। कभी-कभी इस सारांशित आंशिक गणना को अपेक्षित गणना या समान कहा जाता है। संभाव्यता परिणामी मान के समानुपाती होती है, वास्तविक संभाव्यता को उन सभी संभावित मानों के सामान्यीकरण द्वारा निर्धारित किया जाना चाहिए जो श्रेणीबद्ध चर ले सकते हैं (अर्थात श्रेणीबद्ध चर के प्रत्येक संभावित मान के लिए परिकलित परिणाम जोड़ना, और इस योग से सभी परिकलित परिणामों को विभाजित करना)।
# यदि किसी दिए गए श्रेणीबद्ध नोड में आश्रित बच्चे हैं (उदाहरण के लिए जब यह [[मिश्रण मॉडल]] में एक अव्यक्त चर है), पिछले चरण में गणना की गई मान (अपेक्षित गणना प्लस पूर्व, या जो कुछ भी गणना की गई है) को वास्तविक सशर्त संभावनाओं से गुणा किया जाना चाहिए ( सभी बच्चों को उनके माता-पिता को दिए गए संभाव्यता के समानुपातिक नहीं है। विस्तृत चर्चा के लिए डिरिचलेट-बहुराष्ट्रीय बंटन पर लेख देखें।
# यदि किसी दिए गए श्रेणीबद्ध नोड में आश्रित बच्चे (उदाहरण के लिए जब यह [[मिश्रण मॉडल|मिश्रण]] [[प्रारूप]] में एक [[अव्यक्त चर]] होता है) हैं, तो पिछले चरण (अपेक्षित गणना प्लस पूर्व, या जो कुछ भी गणना की जाती है) में गणना किए गए मान को वास्तविक सशर्त संभावनाओं (एक गणना मूल्य नहीं है जो संभावना के समानुपाती है!) से गुणा किया जाना चाहिए। विस्तृत चर्चा के लिए [[डिरिचलेट-बहुराष्ट्रीय बंटन]] पर लेख देखें।
# ऐसे मामले में जहां किसी दिए गए डिरिचलेट पूर्व पर निर्भर नोड्स की समूह सदस्यता कुछ अन्य चर के आधार पर गतिशील रूप से बदल सकती है (उदाहरण के लिए एक [[विषय मॉडल]] के रूप में एक अन्य अव्यक्त श्रेणीबद्ध चर द्वारा अनुक्रमित एक श्रेणीबद्ध चर), वही अपेक्षित गणना अभी भी हैं परिकलित, लेकिन सावधानी से करने की आवश्यकता है ताकि चरों का सही सेट सम्मिलित किया जा सके। विषय मॉडल के संदर्भ सहित, अधिक चर्चा के लिए डिरिचलेट-बहुराष्ट्रीय वितरण पर लेख देखें।
# ऐसे स्थिति में जहां किसी दिए गए डिरिचलेट पूर्व पर निर्भर नोड्स की समूह सदस्यता कुछ अन्य चर के आधार पर गतिशील रूप से बदल सकती है (उदाहरण के लिए एक [[विषय मॉडल|विषय]] [[प्रारूप]] के रूप में एक अन्य अव्यक्त श्रेणीबद्ध चर द्वारा अनुक्रमित एक श्रेणीबद्ध चर), वही अपेक्षित गणना की अभी भी गणना की जाती है, लेकिन सावधानी से करने की आवश्यकता है ताकि चरों का सही सेट सम्मिलित किया जा सके। विषय प्रारूप के संदर्भ सहित, अधिक चर्चा के लिए डिरिचलेट-बहुराष्ट्रीय वितरण पर लेख देखें।


===== अन्य संयुग्मी पुरोहितों का समाप्‍त होना =====
===== अन्य संयुग्मी पूर्ववर्तियो का समाप्‍त होना =====


सामान्य तौर पर, किसी भी संयुग्म को पूर्व में ध्वस्त किया जा सकता है, यदि उसके एकमात्र बच्चों के वितरण संयुग्म हैं। यौगिक वितरण पर लेख में प्रासंगिक गणित पर चर्चा की गई है। यदि केवल एक चाइल्ड नोड है, तो परिणाम अक्सर एक ज्ञात वितरण मान लेगा। उदाहरण के लिए, एक एकल [[पॉसों वितरण]] चाइल्ड के साथ एक नेटवर्क के बाहर एक [[उलटा गामा वितरण]]|इनवर्स-गामा-डिस्ट्रीब्यूटेड [[झगड़ा]] को कोलैप्स करने से स्टूडेंट का टी-डिस्ट्रीब्यूशन मिलेगा। (उस मामले के लिए, एक एकल गॉसियन बच्चे के माध्य और विचरण दोनों को ढहाने से अभी भी एक छात्र का टी-वितरण प्राप्त होगा, बशर्ते दोनों संयुग्मित हों, यानी गॉसियन माध्य, व्युत्क्रम-गामा विचरण।)
सामान्य तौर पर, किसी भी संयुग्म को पूर्व में ध्वस्त किया जा सकता है, यदि उसके एकमात्र बच्चों के वितरण संयुग्म हैं। [[यौगिक वितरण]] पर लेख में प्रासंगिक गणित पर चर्चा की गई है। यदि केवल एक चाइल्ड नोड है, तो परिणाम प्रायः एक ज्ञात वितरण मान लेगा। उदाहरण के लिए, एक एकल [[पॉसों वितरण|सामान्य वितरण]] बच्चे के साथ एक नेटवर्क से बाहर एक [[उलटा गामा वितरण|विपरीत गामा वितरित]] भिन्नता को ध्वस्त करने से [[छात्र का टी-वितरण]] प्राप्त होगा। (उस स्थिति के लिए, एक एकल सामान्य वितरण बच्चे के माध्य और विचरण दोनों को ढहाने से अभी भी एक छात्र का टी-वितरण प्राप्त होगा, बशर्ते दोनों, यानी सामान्य वितरण माध्य, व्युत्क्रम-गामा विचरण संयुग्मित हों।)


यदि कई बच्चे नोड हैं, तो वे सभी निर्भर हो जाएंगे, जैसा कि डिरिचलेट वितरण-श्रेणीबद्ध वितरण मामले में है। परिणामी संयुक्त वितरण का एक बंद रूप होगा जो कुछ मायनों में यौगिक वितरण जैसा दिखता है, हालांकि इसमें कई कारकों का उत्पाद होगा, प्रत्येक बच्चे के नोड के लिए एक।
यदि कई बच्चे नोड हैं, तो वे सभी निर्भर हो जाएंगे, जैसा कि [[डिरिचलेट -श्रेणीबद्ध|डिरिचलेट-श्रेणीबद्ध]] स्थिति में है। परिणामी [[संयुक्त वितरण]] का एक बंद रूप होगा जो कुछ मायनों में यौगिक वितरण जैसा दिखता है, हालांकि इसमें प्रत्येक बच्चे के नोड के लिए एक कई कारकों का उत्पाद होगा।


इसके अलावा, और सबसे महत्वपूर्ण बात यह है कि दूसरों को दिए गए चाइल्ड नोड्स में से एक के परिणामस्वरूप सशर्त वितरण (और ढह गए नोड के माता-पिता को भी दिया गया है, लेकिन चाइल्ड नोड्स के बच्चों को नहीं दिया गया है) के समान घनत्व होगा शेष सभी चाइल्ड नोड्स का [[ पश्च भविष्य कहनेवाला वितरण ]]इसके अलावा, पश्च भविष्यवाणिय वितरण में एकल नोड के मूल यौगिक वितरण के समान घनत्व है, हालांकि विभिन्न मापदंडों के साथ। यौगिक वितरण पर लेख में सामान्य सूत्र दिया गया है।
इसके अलावा, और सबसे महत्वपूर्ण बात यह है कि अन्य (और ढह गए नोड के माता-पिता को भी दिया गया है, लेकिन चाइल्ड नोड्स के बच्चों को नहीं दिया गया है) दिए गए चाइल्ड नोड्स में से एक के [[परिणामी सशर्त वितरण]] में सभी शेष चाइल्ड नोड्स के[[ पश्च भविष्य कहनेवाला वितरण | पश्च पूर्वानुमानित वितरण]] के समान घनत्व होगा। इसके अलावा, पश्च पूर्वानुमानित वितरण में एकल नोड के मूल यौगिक वितरण के, विभिन्न मापदंडों के साथ समान घनत्व है। [[यौगिक वितरण]] पर लेख में सामान्य सूत्र दिया गया है।


उदाहरण के लिए, सशर्त रूप से [[स्वतंत्र समान रूप से वितरित]] गॉसियन वितरण के एक सेट के साथ एक बेयस नेटवर्क दिया गया है। गाऊसी-वितरित नोड्स के साथ संयुग्मित पूर्व वितरण माध्य और भिन्नता पर रखा गया है, एक नोड का सशर्त वितरण दूसरों को माध्य और विचरण दोनों को संयोजित करने के बाद दिया गया है। एक छात्र का टी-वितरण होगा। इसी तरह, कई पॉसॉन वितरण से पहले [[[[गाऊसी वितरण]]]] को कंपाउंडिंग करने का परिणाम | पॉइसन-वितरित नोड्स एक नोड के सशर्त वितरण का कारण बनता है, जिससे अन्य एक [[नकारात्मक द्विपद वितरण]] मान लेते हैं।
उदाहरण के लिए, सशर्त रूप से [[स्वतंत्र समान रूप से वितरित]] गॉसियन वितरित नोड्स के एक सेट के साथ एक बेयस नेटवर्क दिया गया है जिसमें माध्य और विचरण पर [[संयुग्मित पूर्व]] वितरण हैं, माध्य और प्रसरण दोनों को संयोजित करने के बाद अन्य को दिए गए एक नोड का सशर्त वितरण एक [[छात्र का टी-वितरण]] होगा। इसी तरह, कई पॉसों वितरित नोड्स से पहले [[गामा]] को संयुक्तीकरण करने का परिणाम एक नोड के [[सशर्त वितरण]] का कारण बनता है, जो दूसरों को एक [[नकारात्मक द्विपद वितरण]] मानने के लिए दिया जाता है।


इन स्थितियों में जहां कंपाउंडिंग एक प्रसिद्ध वितरण का उत्पादन करता है, कुशल प्रतिचयन प्रक्रियाएं अक्सर मौजूद होती हैं, और उनका उपयोग करना अक्सर (हालांकि जरूरी नहीं) ढहने से अधिक कुशल होगा, और इसके बजाय पूर्व और बच्चे दोनों नोड्स को अलग-अलग प्रतिदर्श लेना होगा। हालाँकि, ऐसे मामले में जहां यौगिक वितरण अच्छी तरह से ज्ञात नहीं है, इसका प्रतिदर्श लेना आसान नहीं हो सकता है, क्योंकि यह आम तौर पर घातीय परिवार से संबंधित नहीं होगा और आमतौर पर [[लघुगणकीय रूप से अवतल कार्य]] नहीं होगा। [[अनुकूली अस्वीकृति नमूनाकरण|अनुकूली अस्वीकृति प्रतिचयन]] का उपयोग करके प्रतिदर्श लेना आसान है, क्योंकि एक बंद रूप हमेशा मौजूद रहता है)।
इन स्थितियों में जहां संयुक्तीकरण एक प्रसिद्ध वितरण का उत्पादन करता है, वहां कुशल सैंपलिंग प्रक्रियाएं प्रायः मौजूद होती हैं, और उनका उपयोग करना प्रायः (हालांकि जरूरी नहीं) ढहने से अधिक कुशल होगा, और इसके बजाय पूर्व और बच्चे दोनों नोड्स को अलग-अलग सैंपलिंग लेना होगा। हालाँकि, ऐसे स्थिति में जहां यौगिक वितरण अच्छी तरह से ज्ञात नहीं है, इसका सैंपलिंग लेना आसान नहीं हो सकता है, क्योंकि यह सामान्यतः [[घातीय परिवार]] से संबंधित नहीं होगा और सामान्यतः [[लघुगणकीय रूप से अवतल कार्य|लॉग-अवतल]] नहीं होगा (जो [[अनुकूली अस्वीकृति नमूनाकरण|अनुकूली अस्वीकृति]] सैंपलिंग का उपयोग करके सैंपलिंग लेना आसान बना देगा, क्योंकि एक बंद रूप हमेशा मौजूद रहता है)।


ऐसे मामले में जहां ढह गए नोड्स के बच्चे नोड्स में बच्चे हैं, इन बच्चों के नोड्स में से एक का सशर्त वितरण ग्राफ में अन्य सभी नोड्स को इन दूसरे स्तर के बच्चों के वितरण को ध्यान में रखना होगा। विशेष रूप से, परिणामी सशर्त वितरण संयुक्त वितरण के एक उत्पाद के समानुपाती होगा जैसा कि ऊपर परिभाषित किया गया है, और सभी बच्चे नोड्स के सशर्त वितरण उनके माता-पिता को दिए गए हैं (लेकिन अपने स्वयं के बच्चों को नहीं दिए गए हैं)। यह इस तथ्य से अनुसरण करता है कि पूर्ण सशर्त वितरण संयुक्त वितरण के समानुपाती होता है। यदि ढह गए नोड्स के बच्चे के नोड्स [[निरंतर वितरण]] हैं, तो यह वितरण आम तौर पर एक ज्ञात रूप का नहीं होगा, और इस तथ्य के बावजूद प्रतिदर्श बनाना मुश्किल हो सकता है कि एक बंद फॉर्म लिखा जा सकता है, ऊपर वर्णित कारणों के लिए गैर-ज्ञात यौगिक वितरण। हालाँकि, विशेष मामले में कि बच्चे के नोड [[असतत वितरण]] हैं, प्रतिदर्श संभव है, भले ही इन बच्चे के नोड के बच्चे निरंतर होंअसतत या असतत। वास्तव में, यहां सम्मिलित सिद्धांत को डिरिचलेट-बहुराष्ट्रीय वितरण पर लेख में उचित विवरण में वर्णित किया गया है।
ऐसे स्थिति में जहां ढह गए नोड्स के बच्चे नोड्स में बच्चे हैं, इन बच्चों के नोड्स में से एक का सशर्त वितरण ग्राफ में अन्य सभी नोड्स को इन दूसरे स्तर के बच्चों के वितरण को ध्यान में रखना होगा। विशेष रूप से, परिणामी सशर्त वितरण संयुक्त वितरण के एक उत्पाद के समानुपाती होगा जैसा कि ऊपर परिभाषित किया गया है, और सभी बच्चे नोड्स के सशर्त वितरण उनके माता-पिता को दिए गए हैं (लेकिन अपने स्वयं के बच्चों को नहीं दिए गए हैं)। यह इस तथ्य से अनुसरण करता है कि पूर्ण सशर्त वितरण संयुक्त वितरण के समानुपाती होता है। यदि ढह गए नोड्स के बच्चे के नोड्स [[निरंतर वितरण|निरंतर]] हैं, तो यह वितरण सामान्यतः एक ज्ञात रूप का नहीं होगा, और इस तथ्य के बावजूद सैंपलिंग बनाना मुश्किल हो सकता है तथा गैर-ज्ञात यौगिक वितरणों के लिए ऊपर वर्णित समान कारणों से एक बंद रूप लिखा जा सकता है। हालाँकि, विशेष स्थिति में कि बच्चे के नोड [[असतत वितरण|असतत]] हैं, सैंपलिंग संभव है, भले ही इन बच्चे के नोड के बच्चे निरंतर हों या असतत हों।  वास्तव में, यहां सम्मिलित सिद्धांत को [[डिरिचलेट-बहुराष्ट्रीय वितरण]] पर लेख में उचित विवरण में वर्णित किया गया है।


=== ऑर्डर किए गए ओवररिलैक्सेशन के साथ गिब्स सैंपलर ===
=== आदेशित अतिश्रांति के साथ गिब्स प्रतिदर्शित्र ===
* एक गिब्स सैम्पलर ने आदेशित ओवररिलैक्सेशन के लिए एक विषम संख्या में उम्मीदवार मूल्यों के लिए प्रतिदर्श लिए <math>x_j^{(i)}</math> किसी दिए गए चरण पर और उन्हें एकल मान के साथ क्रमबद्ध करें <math>x_j^{(i-1)}</math> कुछ अच्छी तरह से परिभाषित आदेश के अनुसार। अगर <math>x_j^{(i-1)}</math> एस है<sup>th</sup> क्रमबद्ध सूची में सबसे छोटा तो the <math>x_j^{(i)}</math> एस के रूप में चुना गया है<sup>वें</sup> क्रमबद्ध सूची में सबसे बड़ा। अधिक जानकारी के लिए, नील (1995) देखें।<ref>{{cite techreport
* आदेशित अतिश्रांति के साथ एक गिब्स प्रतिदर्शित्र किसी भी चरण में <math>x_j^{(i)}</math> के लिए दिए गए विषम संख्या के उम्मीदवार मूल्यों का सैंपलिंग लेता है और कुछ अच्छी तरह से परिभाषित क्रम के अनुसार  <math>x_j^{(i-1)}</math> के लिए एकल मान के साथ उन्हें वर्गीकृत करता है। यदि <math>x_j^{(i-1)}</math> क्रमबद्ध सूची में s<sup>वां</sup> सबसे छोटा है तो <math>x_j^{(i)}</math> को क्रमबद्ध सूची में s<sup>वां</sup> सबसे बड़ा चुना गया है। अधिक जानकारी के लिए, नील (1995) देखें।<ref>{{cite techreport
| first      = Radford M.
| first      = Radford M.
| last        = Neal
| last        = Neal
Line 196: Line 194:
| bibcode= 1995bayes.an..6004N
| bibcode= 1995bayes.an..6004N
}}</ref>
}}</ref>
=== अन्य विस्तारण ===
गिब्स सैंपलिंग को विभिन्न तरीकों से विस्तारित करना भी संभव है। उदाहरण के लिए, चरो की स्थिति में जिनके सशर्त वितरण से सैंपलिंग लेना आसान नहीं है, [[अंशअ प्रतिचयन|अंशअ]] सैंपलिंग या [[मेट्रोपोलिस-हेस्टिंग्स कलन विधि]] का एक एकल पुनरावृत्ति प्रश्न में चरो से सैंपलिंग लेने के लिए उपयोग किया जा सकता है। उन चरों को सम्मिलित करना भी संभव है जो [[यादृच्छिक चर]] नहीं हैं, लेकिन जिनका मान [[निश्चित]] रूप से अन्य चरों से गणना किया जाता है। [[सामान्यीकृत रैखिक मॉडल|सामान्यीकृत रैखिक प्रारूप]], उदा, [[रसद प्रतिगमन]] (उर्फ [[अधिकतम एन्ट्रापी वर्गीकारक|अधिकतम एन्ट्रापी]]  प्रारूप), इस कार्य प्रणाली में सम्मिलित किया जा सकता है। (बीयूजीएस, उदाहरण के लिए, प्रारूप के इस प्रकार के मिश्रण की अनुमति देता है।)


== विफलता मोड ==


=== अन्य एक्सटेंशन ===
गिब्स सैंपलिंग दो तरीकों से विफल हो सकता है। पहला तब होता है जब उच्च-क्षमता वाली स्थितियों के द्वीप होते हैं, जिनके बीच कोई रास्ता नहीं होता है। उदाहरण के लिए, 2-बिट सदिशों पर प्रायिकता वितरण पर विचार करें, जहाँ सदिशों (0,0) और (1,1) प्रत्येक की प्रायिकता ½ है, लेकिन अन्य दो सदिशों (0,1) और (1,0) की प्रायिकता शून्य है। गिब्स सैंपलिंग दो उच्च संभावना वाले सदिशों में से एक में प्रगृहीत हो जाएगा, और दूसरे तक कभी नहीं पहुंचेगा। सामान्यतः अधिक, उच्च-आयामी, वास्तविक-मूल्य वाले सदिश पर किसी भी वितरण के लिए, यदि सदिश के दो विशेष तत्व पूरी तरह से सहसंबद्ध (या पूरी तरह से विरोधी-सहसंबंध) हैं, तो वे दो तत्व अटक जाएंगे, और गिब्स सैंपलिंग उन्हें कभी भी बदलने में सक्षम नहीं होगा।
गिब्स प्रतिचयन को विभिन्न तरीकों से विस्तारित करना भी संभव है। उदाहरण के लिए, वेरिएबल्स के मामले में जिनके सशर्त वितरण से प्रतिदर्श लेना आसान नहीं है, स्लाइस प्रतिचयन या मेट्रोपोलिस-हेस्टिंग्स कलन विधि का एक एकल पुनरावृत्ति प्रश्न में वेरिएबल्स से प्रतिदर्श लेने के लिए इस्तेमाल किया जा सकता है।
उन चरों को सम्मिलित करना भी संभव है जो [[यादृच्छिक चर]] नहीं हैं, लेकिन जिनका मान निश्चित रूप से अन्य चरों से गणना किया जाता है। [[सामान्यीकृत रैखिक मॉडल]], उदा। लॉजिस्टिक रिग्रेशन (उर्फ [[अधिकतम एन्ट्रापी वर्गीकारक]] मॉडल), इस तरह से सम्मिलित किया जा सकता है। (बीयूजीएस, उदाहरण के लिए, मॉडल के इस प्रकार के मिश्रण की अनुमति देता है।)


== विफलता मोड ==
दूसरी समस्या तब भी हो सकती है जब सभी अवस्थाओ में संभावना शून्य न हो और उच्च संभावना वाले राज्यों का केवल एक ही द्वीप हो। उदाहरण के लिए, 100-बिट सदिशों पर प्रायिकता वितरण पर विचार करें, जहां सभी शून्य सदिश संभाव्यता ½ के साथ होता है, और अन्य सभी सदिश समान रूप से संभावित हैं, और इसलिए प्रत्येक की प्रायिकता <math>\frac{1}{2(2^{100}-1)}</math> है। यदि आप शून्य सदिश की प्रायिकता का अनुमान लगाना चाहते हैं, तो सही वितरण से 100 या 1000 सैंपलिंग लेना पर्याप्त होगा। यह लगभग ½ के करीब उत्तर देने की संभावना है। लेकिन समान परिणाम प्राप्त करने के लिए आपको संभवतः गिब्स सैंपलिंग से <math>2^{100}</math> से अधिक सैंपलिंग लेने होंगे। कोई भी कंप्यूटर जीवन भर ऐसा नहीं कर सकता था।


गिब्स प्रतिचयन दो तरीकों से विफल हो सकता है। पहला तब होता है जब उच्च-संभावना वाले राज्यों के द्वीप होते हैं, जिनके बीच कोई रास्ता नहीं होता है। उदाहरण के लिए, 2-बिट सदिशों पर प्रायिकता वितरण पर विचार करें, जहाँ सदिशों (0,0) और (1,1) प्रत्येक की प्रायिकता ½ है, लेकिन अन्य दो सदिशों (0,1) और (1,0) की प्रायिकता है शून्य। गिब्स प्रतिचयन दो उच्च संभावना वाले वैक्टर में से एक में फंस जाएगा, और दूसरे तक कभी नहीं पहुंचेगा। अधिक आम तौर पर, उच्च-आयामी, वास्तविक-मूल्य वाले वैक्टर पर किसी भी वितरण के लिए, यदि सदिश के दो विशेष तत्व पूरी तरह से सहसंबद्ध (या पूरी तरह से विरोधी-सहसंबंध) हैं, तो वे दो तत्व अटक जाएंगे, और गिब्स प्रतिचयन कभी भी बदलने में सक्षम नहीं होगा उन्हें।
यह समस्या तब होती है जब बर्न-इन अवधि कितनी भी लंबी हो। ऐसा इसलिए है क्योंकि सही वितरण में, शून्य सदिश आधा समय होता है, और उन घटनाओं को गैर-शून्य सदिशो के साथ यादृच्छिक रूप से मिश्रित किया जाता है। यहां तक ​​कि एक छोटा सा सैंपलिंग भी शून्य और अशून्य दोनों सदिशों को देखेगा। लेकिन गिब्स सैंपलिंग लंबी अवधि के लिए केवल शून्य सदिश (लगभग <math>2^{99}</math> एक पंक्ति में) को वापस करने के बीच वैकल्पिक होगा, फिर लंबी अवधि के लिए केवल गैर शून्य सदिश (लगभग <math>2^{99}</math> एक पंक्ति में) को वापस करने के बीच वैकल्पिक होगा। इस प्रकार सही वितरण के लिए अभिसरण बेहद धीमा है, जिसके लिए <math>2^{99}</math> चरणों से अधिक की आवश्यकता होती है, उचित समय अवधि में इतने सारे कदम उठाना अभिकलनीय रूप से संभव नहीं है। यहाँ धीमे अभिसरण को [[आयामीता के अभिशाप]] के परिणाम के रूप में देखा जा सकता है।


दूसरी समस्या तब भी हो सकती है जब सभी राज्यों में संभावना शून्य न हो और उच्च संभावना वाले राज्यों का केवल एक ही द्वीप हो। उदाहरण के लिए, 100-बिट सदिशों पर प्रायिकता वितरण पर विचार करें, जहां सभी शून्य सदिश संभाव्यता ½ के साथ होता है, और अन्य सभी सदिश समान रूप से संभाव्य हैं, और इसलिए इसकी प्रायिकता है <math>\frac{1}{2(2^{100}-1)}</math> प्रत्येक। यदि आप शून्य सदिश की प्रायिकता का अनुमान लगाना चाहते हैं, तो सही वितरण से 100 या 1000 प्रतिदर्श लेना पर्याप्त होगा। यह लगभग ½ के करीब उत्तर देने की संभावना है। लेकिन आपको शायद इससे ज्यादा लेना होगा <math>2^{100}</math> समान परिणाम प्राप्त करने के लिए गिब्स के प्रतिदर्श से प्रतिदर्श। कोई भी कंप्यूटर जीवन भर ऐसा नहीं कर सकता था।
इस तरह की समस्या को एक बार में पूरे 100-बिट सदिश को ब्लॉक सैंपलिंग द्वारा हल किया जा सकता है। (यह मानता है कि 100-बिट सदिश चर के एक बड़े सेट का हिस्सा है। यदि यह सदिश केवल एक चीज है जिसका सैंपलिंग लिया जा रहा है, तो ब्लॉक सैंपलिंग गिब्स सैंपलिंग बिल्कुल नहीं करने के बराबर है, जो परिकल्पना द्वारा कठिन होगा।)
 
यह समस्या तब होती है जब बर्न-इन अवधि कितनी भी लंबी हो। ऐसा इसलिए है क्योंकि सही वितरण में, शून्य सदिश आधा समय होता है, और उन घटनाओं को गैर-शून्य वैक्टरों के साथ यादृच्छिक रूप से मिश्रित किया जाता है। यहां तक ​​कि एक छोटा सा प्रतिदर्श भी शून्य और अशून्य दोनों सदिशों को देखेगा। लेकिन गिब्स प्रतिचयन लंबी अवधि के लिए केवल शून्य सदिश वापस करने के बीच वैकल्पिक होगा (लगभग <math>2^{99}</math> एक पंक्ति में), फिर लंबी अवधि के लिए केवल अशून्य वैक्टर (लगभग <math>2^{99}</math> एक पंक्ति में)। इस प्रकार सही वितरण के लिए अभिसरण बेहद धीमा है, इसके लिए बहुत अधिक की आवश्यकता होती है <math>2^{99}</math> कदम; उचित समय अवधि में इतने सारे कदम उठाना कम्प्यूटेशनल रूप से संभव नहीं है। यहाँ धीमे अभिसरण को आयामीता के अभिशाप के परिणाम के रूप में देखा जा सकता है।
इस तरह की समस्या को एक बार में पूरे 100-बिट सदिश को ब्लॉक प्रतिचयन द्वारा हल किया जा सकता है। (यह मानता है कि 100-बिट सदिश चर के एक बड़े सेट का हिस्सा है। यदि यह सदिश केवल एक चीज है जिसका प्रतिदर्श लिया जा रहा है, तो ब्लॉक प्रतिचयन गिब्स प्रतिचयन बिल्कुल नहीं करने के बराबर है, जो परिकल्पना द्वारा कठिन होगा।)


== सॉफ्टवेयर ==
== सॉफ्टवेयर ==
* [[OpenBUGS]] सॉफ़्टवेयर (गिब्स सैम्पलिंग का उपयोग करके बायेसियन अनुमान) मार्कोव श्रृंखला मोंटे कार्लो का उपयोग करके जटिल सांख्यिकीय मॉडल का [[बायेसियन विश्लेषण]] करता है।
* [[OpenBUGS|ओपनबग्स]] सॉफ़्टवेयर (गिब्स सैंपलिंग का उपयोग करके बायेसियन अनुमान) [[मार्कोव श्रृंखला मोंटे कार्लो]] का उपयोग करके जटिल सांख्यिकीय प्रारूप का [[बायेसियन विश्लेषण]] करता है।


* बस एक और गिब्स सैंपलर ([[बस एक और गिब्स नमूना]]) मार्कोव चेन मोंटे कार्लो का उपयोग करके बायेसियन पदानुक्रमित मॉडल के विश्लेषण के लिए एक जीपीएल कार्यक्रम है।
* [[जेएजीएस]] ([[बस एक और गिब्स नमूना|बस एक और गिब्स प्रतिदर्शित्र]]) मार्कोव चेन मोंटे कार्लो का उपयोग करके बायेसियन पदानुक्रमित प्रारूप के विश्लेषण के लिए एक जीपीएल कार्यक्रम है।


* [[ चर्च (प्रोग्रामिंग भाषा) ]] मनमाना वितरण पर गिब्स अनुमान लगाने के लिए मुफ्त सॉफ्टवेयर है जो कि संभाव्य कार्यक्रमों के रूप में निर्दिष्ट हैं।
* संभाव्य कार्यक्रमों के रूप में निर्दिष्ट यादृच्छिक वितरण पर गिब्स अनुमान लगाने के लिए [[ चर्च (प्रोग्रामिंग भाषा) |चर्च]] मुफ्त सॉफ्टवेयर है।


* [[PyMC]] सामान्य ग्राफिकल मॉडल के बायेसियन सीखने के लिए एक ओपन सोर्स पायथन (प्रोग्रामिंग लैंग्वेज) लाइब्रेरी है।
* [[PyMC|पीवाईएमसी]] सामान्य संभाव्य ग्राफिकल प्रारूप के [[बायेसियन सीखने]] के लिए एक खुला स्त्रोत [[पायथन]] पुस्तकालय है।
*[https://turing.ml/ Turing] [[संभाव्य प्रोग्रामिंग]] का उपयोग करके बायेसियन अनुमान के लिए एक खुला स्रोत [[जूलिया (प्रोग्रामिंग भाषा)]] पुस्तकालय है।
*[https://turing.ml/ ट्यूरिंग] [[संभाव्य प्रोग्रामिंग|प्रायिकतात्मक प्रोग्रामिंग]] का उपयोग करके [[बेजअनुमिति]] के लिए एक खुला स्रोत [[जूलिया (प्रोग्रामिंग भाषा)|जूलिया]] पुस्तकालय है।


== टिप्पणियाँ ==
== टिप्पणियाँ ==
Line 247: Line 243:
* Levin, David A.; [[Yuval Peres|Peres, Yuval]]; [[Elizabeth Wilmer|Wilmer, Elizabeth L.]] (2008), "[[Markov Chains and Mixing Times]]", [[American Mathematical Society]].
* Levin, David A.; [[Yuval Peres|Peres, Yuval]]; [[Elizabeth Wilmer|Wilmer, Elizabeth L.]] (2008), "[[Markov Chains and Mixing Times]]", [[American Mathematical Society]].
* Robert, C. P.; Casella, G. (2004), ''Monte Carlo Statistical Methods'' (second edition), Springer-Verlag.
* Robert, C. P.; Casella, G. (2004), ''Monte Carlo Statistical Methods'' (second edition), Springer-Verlag.
[[Category: मार्कोव चेन मोंटे कार्लो]]


[[Category: Machine Translated Page]]
[[Category:Created On 31/05/2023]]
[[Category:Created On 31/05/2023]]
[[Category:Lua-based templates]]
[[Category:Machine Translated Page]]
[[Category:Pages with empty portal template]]
[[Category:Pages with script errors]]
[[Category:Portal-inline template with redlinked portals]]
[[Category:Templates Vigyan Ready]]
[[Category:Templates that add a tracking category]]
[[Category:Templates that generate short descriptions]]
[[Category:Templates using TemplateData]]
[[Category:मार्कोव चेन मोंटे कार्लो]]

Latest revision as of 17:00, 16 October 2023

आंकड़ों में, गिब्स सैंपलिंग या गिब्स सैम्पलर एक मार्कोव शृंखला मोंटे कार्लो (एमसीएमसी)कलन विधि है, जो अवलोकनों का एक क्रम प्राप्त करने के लिए होती है, तथा जो तब एक निर्दिष्ट बहुभिन्नरूपी संभाव्यता वितरण से अनुमानित होती है, जब प्रत्यक्ष सैंपलिंग कठिन होता है। इस अनुक्रम का उपयोग संयुक्त वितरण (उदाहरण के लिए, वितरण का आयत चित्र उत्पन्न करने के लिए), जैसे किसी एक चर, या चर के कुछ उपसमुच्चय (उदाहरण के लिए, अज्ञात प्राचल या अंतर्निहित चर) के सीमांत वितरण का अनुमान लगाने के लिए, या एक अभिन्न की गणना करने के लिए, (जैसे चर में से एक का प्रत्याशित मान) आदि को अनुमानित करने के लिए किया जा सकता है। सामान्यतः कुछ चर उन टिप्पणियों के अनुरूप होते हैं जिनके मान ज्ञात होते हैं, और इसलिए उन्हें प्रतिचयित लेने की आवश्यकता नहीं होती है।

गिब्स सैंपलिंग सामान्यतः सांख्यिकीय अनुमिती यानी विशेष रूप से बेज अनुमिति के साधन के रूप में प्रयोग किया जाता है। यह एक यादृच्छिक कलन विधि है (अर्थात एक कलन विधि जो यादृच्छिक संख्याओं का उपयोग करती है), जो अपेक्षा-अधिकतमीकरण कलन विधि (ईएम) जैसे सांख्यिकीय अनुमिती के लिए नियतात्मक कलन विधि का एक विकल्प है।

अन्य एमसीएमसी कलन विधि के साथ, गिब्स सैंपलिंग सैंपलिंग की मार्कोव श्रृंखला उत्पन्न करता है, जिनमें से प्रत्येक पास के सैंपलिंग से सहसंबंधित है। जिसके फलस्वरूप, अगर स्वतंत्र सैंपलिंग वांछित हैं तो देखभाल की जानी चाहिए। सामान्यतः श्रृंखला की प्रारम्भ ("बर्न-इन अवधि") से सैंपलिंग वांछित वितरण का सटीक रूप से प्रतिनिधित्व नहीं कर सकते हैं और सामान्यतः निराकृत कर दिए जाते हैं।

परिचय

सैंपलिंग कलन विधि और सांख्यिकीय भौतिकी के बीच समानता के संदर्भ में, गिब्स सैंपलिंग का नाम भौतिक विज्ञानी जोशियाह विलार्ड गिब्स के नाम पर रखा गया है। गिब्स की मृत्यु के लगभग आठ दशक बाद 1984 में दो भाइयों स्टुअर्ट जेमन और डोनाल्ड जेमन द्वारा कलन विधि का वर्णन किया गया था,[1] और सीमांत प्रायिकता वितरण, विशेष रूप से उत्‍तरबंटन की गणना के लिए सांख्यिकी समुदाय में लोकप्रिय हो गया।[2]

अपने मूल संस्करण में, गिब्स सैंपलिंग मेट्रोपोलिस-हेस्टिंग्स कलन विधि की एक विशेष स्थिति है। हालांकि, इसके विस्तारित संस्करणों (नीचे देखें) में, इसे प्रत्येक चर (या कुछ स्थितयो में, चर के प्रत्येक समूह) को बदले में प्रतिचयित करके चर के एक बड़े सेट से सैंपलिंग के लिए एक सामान्य रूपरेखा माना जा सकता है, और सैंपलिंग के एक या अधिक चरणों को लागू करने के लिए मेट्रोपोलिस-हेस्टिंग्स कलन विधि (या अंशअ सैंपलिंग जैसी विधियाँ) को सम्मिलित कर सकते हैं।

गिब्स सैंपलिंग तब लागू होता है जब संयुक्त वितरण स्पष्ट रूप से ज्ञात नहीं होता है या प्रत्यक्ष रूप से सैंपलिंग लेना मुश्किल होता है, लेकिन प्रत्येक चर का सशर्त वितरण ज्ञात होता है और सैंपलिंग के लिए आसान (या कम से कम, आसान) होता है। गिब्स सैंपलिंग कलन विधि बदले में प्रत्येक चर के वितरण से एक अन्य चर के वर्तमान मूल्यों पर सशर्त उदाहरण उत्पन्न करता है। यह दिखाया जा सकता है कि प्रतिदर्शो का अनुक्रम एक मार्कोव श्रृंखला का गठन करता है, और उस मार्कोव श्रृंखला का स्थिर वितरण केवल वांछित संयुक्त वितरण है।[3]

गिब्स सैंपलिंग विशेष रूप से बायेसियन नेटवर्क के उत्‍तरबंटन के सैंपलिंग के लिए अनुकूलित है, क्योंकि बायेसियन नेटवर्क सामान्यतः सशर्त वितरण के संग्रह के रूप में निर्दिष्ट होते हैं।

कार्यान्वयन

गिब्स प्रतिचयन, अपने मूल अवतार में, मेट्रोपोलिस-हेस्टिंग्स कलन विधि की एक विशेष स्थिति है। गिब्स सैंपलिंग का सारांश यह है कि एक बहुचर वितरण को देखते हुए एक संयुक्त वितरण पर एकीकृत करके सीमांत वितरण की तुलना में एक सशर्त वितरण से सैंपलिंग लेना आसान है। मान लीजिए हम एक संयुक्त वितरण से के सैंपलिंग प्राप्त करना चाहते हैं। वें सैंपलिंग को से निरूपित करें। हम निम्नानुसार आगे बढ़ते हैं,

  1. हम कुछ प्रारंभिक मान से शुरू करते हैं।
  2. हम अगला सैंपलिंग चाहते हैं। इस अगले सैंपलिंग को कहते है। चूँकि एक सदिश है, तो हम सदिश के प्रत्येक घटक का सैंपलिंग लेते हैं, उस घटक के वितरण से जो अब तक सैंपलिंग लिए गए वो अन्य सभी घटकों पर सशर्त है। लेकिन यहां एक जाल है, हम , घटकों पर तक प्रतिबंध लगाते हैं, और उसके बाद के घटकों पर से तक प्रतिबंध लगाते हैं। इसे प्राप्त करने के लिए, हम पहले घटक से शुरू करते हुए, क्रम में घटकों का सैंपलिंग लेते हैं। अधिक औपचारिक रूप से, सैंपलिंग लेने के लिए, हम द्वारा निर्दिष्ट वितरण के अनुसार इसे अद्यतन करते हैं।
  3. हम वें सैंपलिंग में वें घटक के मान का उपयोग करते हैं, न किवें सैंपलिंग का।
  4. उपरोक्त चरण को बार दोहराएं ।

गुण

यदि इस तरह का सैंपलिंग लिया जाता है, तो ये महत्वपूर्ण तथ्य हैं,

  • सैंपलिंग सभी चरों के संयुक्त वितरण का अनुमान लगाते हैं।
  • चर के किसी भी उपसमुच्चय के सीमांत वितरण को चर के उस उपसमुच्चय के प्रतिदर्शो पर विचार करके अनुमानित किया जा सकता है, जो शेष को अनदेखा कर सकते हैं।
  • किसी भी चर के प्रत्याशित मान को सभी प्रतिदर्शो के औसत से अनुमानित किया जा सकता है।

सैंपलिंग करते समय,

  • चर के प्रारंभिक मूल्यों को बेतरतीब ढंग से या कुछ अन्य कलन विधि जैसे कि अपेक्षा-अधिकतमकरण द्वारा निर्धारित किया जा सकता है।
  • पहले चर के सैंपलिंग के लिए प्रारंभिक मान निर्धारित करना वास्तव में आवश्यक नहीं है।
  • प्रारम्भ (तथाकथित बर्न-इन अवधि) में कुछ प्रतिदर्शो की संख्या को अनदेखा करना सामान्य बात है, और फिर केवल प्रत्येक वें सैंपलिंग पर विचार करें जब एक अपेक्षा की गणना करने के लिए मूल्यों का औसत निकाला जाता है। उदाहरण के लिए, पहले 1,000 प्रतिदर्शो को नजरअंदाज किया जा सकता है, और फिर हर 100वें सैंपलिंग का औसत निकाला जाता है, बाकी सभी को प्रक्षेपित कर दिया जाता है। इसका कारण यह है कि (1) मार्कोव श्रृंखला का स्थिर वितरण चरों पर वांछित संयुक्त वितरण है, लेकिन उस स्थिर वितरण तक पहुंचने में कुछ समय लग सकता है, (2) क्रमिक सैंपलिंग एक दूसरे से स्वतंत्र नहीं होते हैं लेकिन कुछ मात्रा में सहसंबंध के साथ एक मार्कोव श्रृंखला बनाते हैं। कभी-कभी, कलन विधि का उपयोग प्रतिदर्शो के बीच स्वसंबंध की मात्रा और इससे गणना की गई (सैम्पल के बीच की अवधि जो वास्तव में उपयोग की जाती है) के मान को निर्धारित करने के लिए किया जा सकता है, लेकिन व्यवहार में इसमें उचित मात्रा में अनिष्टकारी या काला जादू सम्मिलित होता है।
  • सैंपलिंग प्रक्रिया के प्रारंभिक भाग में यादृच्छिक भ्रमण व्यवहार को कम करने के लिए अनुकारित अनीलन की प्रक्रिया का उपयोग प्रायः किया जाता है (यानी सैंपलिंग समष्टि के चारों ओर धीरे-धीरे घूमने की प्रवृत्ति, जल्दी से घूमने के बजाय, प्रतिदर्शो के बीच उच्च मात्रा में स्वतः सहसंबंध के साथ, वांछित है)। अन्य तकनीकें जो स्वत:सहसंबंध को कम कर सकती हैं, उन्हें गिब्स प्रतिचयन, अवरुद्ध गिब्स प्रतिचयन, और अतिविश्राम में सुव्यवस्थित किया गया है, नीचे देखें।

सशर्त वितरण और संयुक्त वितरण का संबंध

इसके अलावा, अन्य सभी दिए गए एक चर का सशर्त वितरण संयुक्त वितरण के समानुपाती होता है,

इस स्थिति में समानुपाती का अर्थ है कि भाजक का फलन नहीं है और इस प्रकार के सभी मानों के लिए समान है, तथा यह पर वितरण के लिए सामान्यीकरण स्थिरांक का हिस्सा बनता है। व्यवहार में, एक कारक के सशर्त वितरण की प्रकृति का निर्धारण करने के लिए, चर पर आलेखीय प्रतिरूप द्वारा परिभाषित व्यक्तिगत सशर्त वितरण के अनुसार संयुक्त वितरण को कारक बनाना सबसे आसान है, उन सभी कारकों को अनदेखा करें जो के फलन नहीं हैं, (जिनमें से सभी, उपरोक्त भाजक के साथ मिलकर सामान्यीकरण स्थिरांक का निर्माण करते हैं), और फिर आवश्यकतानुसार सामान्यीकरण स्थिरांक को अंत में पुनर्स्थापित करते हैं। व्यवहार में, इसका मतलब तीन चीजों में से एक को करना है,

  1. यदि वितरण असतत है, तो के सभी संभावित मानों की अलग-अलग संभावनाओं की गणना की जाती है, और फिर सामान्यीकरण स्थिरांक खोजने के लिए योग किया जाता है।
  2. यदि वितरण निरंतर है और ज्ञात रूप का है, तो सामान्यीकरण स्थिरांक भी ज्ञात होगा।
  3. अन्य स्थितियों में, सामान्यीकरण स्थिरांक को सामान्यतः अनदेखा किया जा सकता है, क्योंकि अधिकांश सैंपलिंग विधियों को इसकी आवश्यकता नहीं होती है।

निष्कर्ष

गिब्स सैंपलिंग सामान्यतः सांख्यिकीय अनुमिती के लिए उपयोग किया जाता है (उदाहरण के लिए मापदण्ड का सर्वोत्तम मूल्य निर्धारित करना, जैसे कि किसी विशेष स्टोर पर किसी दिए गए दिनखरीदारी करने वाले लोगों की संख्या निर्धारित करना, तथा एक मतदाता जिस उम्मीदवार को सबसे अधिक वोट देगा, का निर्धारण करना, आदि)। विचार यह है कि देखे गए डेटा के प्रत्येक टुकड़े के लिए अलग-अलग चर बनाकर और उन चरों से सैंपलिंग लेने के बजाय, उनके देखे गए मूल्यों के लिए चर को ठीक करके सैंपलिंग प्रक्रिया में सम्मिलित किया गया है। शेष चरों का वितरण प्रभावी रूप से प्रेक्षित डेटा पर वातानुकूलित उत्‍तरबंटन है।

एक वांछित मापदण्ड (मोड) का सबसे संभावित मूल्य तब केवल उस सैंपलिंग मान को चुनकर चयनित किया जा सकता है जो सामान्यतः सबसे अधिक होता है, यह अनिवार्य रूप से एक मापदण्ड के अधिकतम पश्चात के अनुमान के बराबर है। (चूंकि मापदण्ड सामान्यतः निरंतर होते हैं, इसलिए मोड का एक सार्थक अनुमान प्राप्त करने के लिए प्रतिचयित मानों को परिमित संख्या में से किसी एक श्रेणी या "बिन" में "बिन" करना प्रायः आवश्यक होता है।) अधिक सामान्यतः, हालांकि, सैंपलिंग मूल्यों का अपेक्षित मूल्य (माध्य या औसत) चुना जाता है, यह एक बेयस अनुमानक है जो पूरे वितरण के बारे में अतिरिक्त डेटा का लाभ उठाता है जो कि बायेसियन सैंपलिंग से उपलब्ध है, जबकिअपेक्षा अधिकतमकरण (ईएम) जैसे अधिकतमकरण कलन विधि वितरण से केवल एक बिंदु वापस करने में सक्षम है। उदाहरण के लिए, एक असमान वितरण के लिए माध्य (अपेक्षित मान) सामान्यतः मोड (सबसे सामान्य मान) के समान होता है, लेकिन यदि वितरण एक दिशा में विषमतलीय है, तो माध्य उस दिशा में चला जाएगा, जो उस दिशा में अतिरिक्त संभावना द्रव्यमान के लिए प्रभावी रूप से जिम्मेदार है। (यदि कोई वितरण बहुविध है, तो अपेक्षित मान सार्थक बिंदु नहीं लौटा सकता है, और कोई भी मोड सामान्यतः बेहतर विकल्प होता है।)

हालाँकि कुछ चर सामान्य तौर पर रुचि के मापदंडों के अनुरूप होते हैं, अन्य चर के बीच संबंधों को ठीक से व्यक्त करने के लिए प्रतिरूप में पेश किए गए अरुचिकर (उपद्रव) चर हैं। हालांकि सैंपलिंग मूल्य सभी चर पर संयुक्त वितरण का प्रतिनिधित्व करते हैं, तथा अपेक्षित मूल्यों या मोड की गणना करते समय उपद्रव चर को आसानी से अनदेखा किया जा सकता है, यह उपद्रव चर पर सीमांत वितरण के बराबर है। जब एकाधिक चर के लिए एक मान वांछित होता है, तो अपेक्षित मान की गणना प्रत्येक चर पर अलग से की जाती है। (हालांकि, मोड की गणना करते समय, सभी चरों को एक साथ माना जाना चाहिए।)

पर्यवेक्षित अध्ययन, अनियंत्रित शिक्षा और अर्ध-पर्यवेक्षित शिक्षा (विलुप्त मूल्यों के साथ सीखना) सभी को उन सभी चरो के मानों को ठीक करके नियंत्रित किया जा सकता है, जिनके मूल्य ज्ञात हैं, और जो शेष सैंपलिंग लेते है।

अवलोकन किए गए डेटा के लिए, प्रत्येक अवलोकन के लिए एक चर होगा- उदाहरण के लिए, अवलोकन के एक सेट के सैंपलिंग माध्य या सैंपलिंग प्रसरण के अनुरूप एक चर। वास्तव में, सामान्यतः सैंपलिंग माध्य या सैंपलिंग प्रसरण जैसी अवधारणाओं के अनुरूप कोई भी चर नहीं होगा। इसके बजाय, ऐसी स्थिति में अज्ञात वास्तविक माध्य और वास्तविक प्रसरण का प्रतिनिधित्व करने वाले चर होंगे, और इन चरों के लिए सैंपलिंग मानों का निर्धारण स्वचालित रूप से गिब्स प्रतिदर्शित्र के संचालन से होता है।

सामान्यीकृत रैखिक प्रतिरूप (यानी रैखिक प्रतिगमन की विविधताएं) कभी-कभी गिब्स सैंपलिंग द्वारा भी नियंत्रित किए जा सकते हैं। उदाहरण के लिए, दिए गए द्विआधारी (हां/नहीं) विकल्प की संभावना निर्धारित करने के लिए प्रोबिट प्रतिगमन, सामान्य वितरण पुरोहितों को साथ समाश्रयण गुणांकों पर रखा जाता है, तथा इसे गिब्स सैंपलिंग के साथ लागू किया जा सकता है क्योंकि अतिरिक्त चर को जोड़ना और संयुग्मन का लाभ उठाना संभव है। हालाँकि,संभार तन्त्र परावर्तन को इस तरह से संभाला नहीं जा सकता है। एक संभावना सामान्य वितरण के मिश्रण (सामान्यतः 7-9) के साथ तार्किक फलन को अनुमानित करना है। अधिक सामान्यतः, गिब्स सैंपलिंग के बजाय मेट्रोपोलिस-हेस्टिंग्स का उपयोग किया जाता है।

गणितीय पृष्ठभूमि

मान लीजिए कि एक सैंपलिंग वितरण से लिया गया है जो पूर्व वितरण के साथ लंबाई के मापदण्ड सदिश पर निर्भर करता है। यह हो सकता है कि बहुत बड़ा होगा और के सीमांत घनत्वों को खोजने के लिए एकीकरण अभिकलनीयत रूप से महंगा होगा। फिर इन दो चरणों को दोहराते हुए सीमांत घनत्व की गणना करने का एक वैकल्पिक तरीका समष्टि पर एक मार्कोव श्रृंखला बनाना है,

  1. एक यादृच्छिक सूचकांक चुनें
  2. के अनुसार के लिए एक नया मान चुनें

ये चरण वांछित अपरिवर्तनीय वितरण के साथ एक मार्कोव श्रृंखला को परिभाषित करते हैं । इसे इस प्रकार सिद्ध किया जा सकता है। सभी के लिए यदि को परिभाषित करें और मान लें कि से तक छलांग लगाने की संभावना को दर्शाता है। फिर, संक्रमण प्रायिकता

हैं अतः

चूँकि एक तुल्यता संबंध है। इस प्रकार विस्तृत संतुलन समीकरण संतुष्ट हैं, जिसका अर्थ है कि श्रृंखला प्रतिवर्ती है और इसमें अपरिवर्तनीय वितरण है।

व्यवहार में, अनुक्रमित को यादृच्छिक रूप से नहीं चुना जाता है, और अनुक्रमित के माध्यम से श्रृंखला चक्र क्रम में होती है। सामान्य तौर पर यह एक गैर-स्थिर मार्कोव प्रक्रिया देता है, लेकिन प्रत्येक व्यक्तिगत चरण अभी भी प्रतिवर्ती होगा, और समग्र प्रक्रिया में अभी भी वांछित स्थिर वितरण होगा (जब तक कि श्रृंखला निश्चित क्रम के तहत सभी अवस्थाओ तक पहुंच सकती है)।

बायेसियन अनुमान में गिब्स प्रतिदर्शित्र और सूचना सिद्धांत के संबंध

मान लीजिए सैंपलिंग वितरण से उत्पन्न टिप्पणियों को निरूपित करता है तब और प्राचल समष्टि पर पूर्व समर्थित हैं। फिर बायेसियन आँकड़ों के केंद्रीय लक्ष्यों में से एक पश्च घनत्व

का अनुमान लगाना है जहां सीमांत संभावना को सभी के लिए परिमित माना जाता है।

गिब्स प्रतिदर्शित्र की व्याख्या करने के लिए, हम अतिरिक्त रूप से मान लेते हैं कि मापदण्ड समष्टि रूप में विघटित हो जाता है

,

जहाँ कार्तीय गुणनफल को प्रदर्शित करता है। प्रत्येक घटक प्राचल समष्टि अदिश घटकों, उपसदिश या मैट्रिसेस का एक समुच्चय हो सकता है।

एक समुच्चय को परिभाषित करें जो को पूरा करें। गिब्स प्रतिदर्शित्र की आवश्यक सामग्री प्रत्येक

के लिए -वाँ पूर्ण सशर्त उत्‍तरबंटन है
गिब्स सैंपलिंग कलन विधि का सचित्र विवरण [4]
एक चक्र के भीतर i-वें चरण में गिब्स प्रतिदर्शित्र से जुड़ी सूचना समानता का योजनाबद्ध विवरण [4]

निम्नलिखित कलन विधि एक सामान्य गिब्स प्रतिदर्शित्र का विवरण देता है,

ध्यान दें कि गिब्स प्रतिदर्शित्र एक चक्र के भीतर पुनरावृत्त मोंटे कार्लो योजना द्वारा संचालित होता है। उपरोक्त कलन विधि द्वारा तैयार किए गए प्रतिदर्शो की संख्या लक्ष्य घनत्व होने के लिए अपरिवर्तनीय वितरण के साथ मार्कोव शृंखला तैयार करती है।

अब, प्रत्येक , के लिए निम्नलिखित सूचना सैद्धांतिक मात्राओ को परिभाषित करें,

अर्थात्, क्रमशः उत्तर पारस्परिक सूचना, उत्तर अंतर एन्ट्रापी, और उत्तर सशर्त अंतर एन्ट्रापी, । हम इसी प्रकार परिभाषित मात्राओं में और को बदलकर सूचना सिद्धांतिक मात्राओं , , और को परिभाषित कर सकते हैं। फिर, निम्नलिखित समीकरण लागू होता हैं।[4]

पारस्परिक सूचना यादृच्छिक मात्रा की अनिश्चितता में कमी की मात्रा निर्धारित करती है, जब हम , का अनुमान लगाते हैं। यह गायब हो जाता है अगर केवल और आंशिक रूप से स्वतंत्र हैं, और केवल अनुमान लगाते हैं। पारस्परिक सूचना की व्याख्या उस मात्रा के रूप में की जा सकती है जो गिब्स प्रतिदर्शित्र के एकल चक्र के भीतर -वें चरण से चरण तक प्रेषित होती है।

विविधता और विस्तार

मूल गिब्स प्रतिदर्शित्र के कई रूप मौजूद हैं। इन विविधताओं का लक्ष्य किसी भी अतिरिक्त संगणनात्मक लागतों को दूर करने के लिए पर्याप्त रूप से प्रतिदर्शो के बीच स्वत: संबंध को कम करना है।

अवरुद्ध गिब्स प्रतिदर्शित्र

संकुचित गिब्स प्रतिदर्शित्र

  • किसी अन्य चर के लिए सैंपलिंग लेते समय एक संकुचित गिब्स सैंपलिंग एक या अधिक चर (सीमांत वितरण) को एकीकृत करता है। उदाहरण के लिए, कल्पना करें कि एक प्रारुप में तीन चर A, B और C होते हैं। एक साधारण गिब्स प्रतिदर्शित्र p(A | B,C), तब p(B | A ,C), फिर p(C | A,B) से सैंपलिंग लेगा। एक संकुचित गिब्स प्रतिदर्शित्र A के लिए सैंपलिंग चरण को सीमांत वितरण p(A | C) से लिए गए सैंपलिंग से बदल सकता है, इस स्थिति में चर 'B को एकीकृत किया गया है। वैकल्पिक रूप से, चर B को पूरी तरह से संकुचित किया जा सकता है, वैकल्पिक रूप से p(A | C) और p(C | A) से सैंपलिंग लिया जा सकता है और B पर बिल्कुल भी सैंपलिंग नहीं लिया जा सकता है। एक चर A पर वितरण जो मूल चर B के संकुचित होने पर उत्पन्न होता है, एक मिश्रित वितरण कहलाता है, इस वितरण से सैंपलिंग सामान्यतः सुविधाजनक होता है जब 'B' 'A ' के ​​​​लिए पूर्ववर्ती संयुग्म होता है, खासकर तब 'A' और 'B' घातीय परिवार के सदस्य होते हैं। अधिक जानकारी के लिए, यौगिक वितरण या लियू (1994) पर लेख देखें।[5]

एक संकुचित गिब्स प्रतिदर्शित्र को लागू करना

संकुचित डिरिक्ले वितरण

सुस्पष्ट चर के साथ पदानुक्रमित बायेसियन प्रारूप में, जैसे अव्यक्त डिरिचलेट आवंटन और प्राकृतिक भाषा प्रसंस्करण में उपयोग किए जाने वाले विभिन्न अन्य प्रारूप, डिरिचलेट वितरण को समाप्त करना काफी सामान्य है जो सामान्यतः श्रेणीबद्ध चर पर पूर्व वितरण के रूप में उपयोग किया जाता है। इस संकुचित का परिणाम किसी दिए गए डिरिचलेट पर निर्भर सभी सुस्पष्ट चर के बीच निर्भरता का परिचय देता है, और संकुचित के बाद इन चरों का संयुक्त वितरण एक डिरिचलेट-बहुराष्ट्रीय वितरण है। यदि संकुचित नहीं किया गया होता तो इस वितरण में दिए गए श्रेणीबद्ध चर का सशर्त वितरण, दूसरों पर वातानुकूलित, एक अत्यंत सरल रूप ग्रहण करता है जो गिब्स सैंपलिंग को और भी आसान बना देता है। नियम इस प्रकार हैं,

  1. एक डिरिचलेट पूर्व नोड को संकुचित करने से केवल पूर्व के माता-पिता और बच्चों के नोड प्रभावित होते हैं। चूंकि माता-पिता प्रायः स्थिर होते हैं, इसलिए सामान्यतः केवल बच्चों के बारे में हमें चिंता करने की आवश्यकता होती है।
  2. एक डिरिचलेट पूर्व को समाप्त करने से उस पूर्व पर निर्भर सभी स्पष्ट बच्चों के बीच निर्भरता का परिचय मिलता है - लेकिन किसी भी अन्य श्रेणीबद्ध बच्चों के बीच कोई अतिरिक्त निर्भरता नहीं होती है। (यह ध्यान रखना महत्वपूर्ण है, उदाहरण के लिए, जब एक ही हाइपरप्रियर से संबंधित कई डिरिचलेट पूर्ववर्ती होते हैं। प्रत्येक डिरिचलेट पूर्व को स्वतंत्र रूप से ध्वस्त किया जा सकता है और केवल इसके प्रत्यक्ष बच्चों को प्रभावित करता है।)
  3. ढहने के बाद, एक आश्रित बच्चों का दूसरों पर सशर्त वितरण एक बहुत ही सरल रूप धारण कर लेता है, किसी दिए गए मूल्य को देखने की संभावना इस मूल्य के लिए संबंधित हाइपरप्रियर के योग के समानुपाती होती है, और समान मान मानने वाले अन्य सभी आश्रित नोड्स की गिनती होती है। समान पूर्व पर निर्भर नहीं होने वाले नोड्स की गणना नहीं की जानी चाहिए। यही नियम अन्य पुनरावृत्त अनुमान विधियों जैसे परिवर्तन संबंधी बेज़ या अपेक्षा अधिकतमीकरण में भी लागू होता है, हालाँकि, यदि विधि में आंशिक गणना रखना सम्मिलित है, तो विचाराधीन मान के लिए आंशिक गणना को अन्य सभी आश्रित नोड्स में सम्मिलित किया जाना चाहिए। कभी-कभी इस सारांशित आंशिक गणना को अपेक्षित गणना या समान कहा जाता है। संभाव्यता परिणामी मान के समानुपाती होती है, वास्तविक संभाव्यता को उन सभी संभावित मानों के सामान्यीकरण द्वारा निर्धारित किया जाना चाहिए जो श्रेणीबद्ध चर ले सकते हैं (अर्थात श्रेणीबद्ध चर के प्रत्येक संभावित मान के लिए परिकलित परिणाम जोड़ना, और इस योग से सभी परिकलित परिणामों को विभाजित करना)।
  4. यदि किसी दिए गए श्रेणीबद्ध नोड में आश्रित बच्चे (उदाहरण के लिए जब यह मिश्रण प्रारूप में एक अव्यक्त चर होता है) हैं, तो पिछले चरण (अपेक्षित गणना प्लस पूर्व, या जो कुछ भी गणना की जाती है) में गणना किए गए मान को वास्तविक सशर्त संभावनाओं (एक गणना मूल्य नहीं है जो संभावना के समानुपाती है!) से गुणा किया जाना चाहिए। विस्तृत चर्चा के लिए डिरिचलेट-बहुराष्ट्रीय बंटन पर लेख देखें।
  5. ऐसे स्थिति में जहां किसी दिए गए डिरिचलेट पूर्व पर निर्भर नोड्स की समूह सदस्यता कुछ अन्य चर के आधार पर गतिशील रूप से बदल सकती है (उदाहरण के लिए एक विषय प्रारूप के रूप में एक अन्य अव्यक्त श्रेणीबद्ध चर द्वारा अनुक्रमित एक श्रेणीबद्ध चर), वही अपेक्षित गणना की अभी भी गणना की जाती है, लेकिन सावधानी से करने की आवश्यकता है ताकि चरों का सही सेट सम्मिलित किया जा सके। विषय प्रारूप के संदर्भ सहित, अधिक चर्चा के लिए डिरिचलेट-बहुराष्ट्रीय वितरण पर लेख देखें।
अन्य संयुग्मी पूर्ववर्तियो का समाप्‍त होना

सामान्य तौर पर, किसी भी संयुग्म को पूर्व में ध्वस्त किया जा सकता है, यदि उसके एकमात्र बच्चों के वितरण संयुग्म हैं। यौगिक वितरण पर लेख में प्रासंगिक गणित पर चर्चा की गई है। यदि केवल एक चाइल्ड नोड है, तो परिणाम प्रायः एक ज्ञात वितरण मान लेगा। उदाहरण के लिए, एक एकल सामान्य वितरण बच्चे के साथ एक नेटवर्क से बाहर एक विपरीत गामा वितरित भिन्नता को ध्वस्त करने से छात्र का टी-वितरण प्राप्त होगा। (उस स्थिति के लिए, एक एकल सामान्य वितरण बच्चे के माध्य और विचरण दोनों को ढहाने से अभी भी एक छात्र का टी-वितरण प्राप्त होगा, बशर्ते दोनों, यानी सामान्य वितरण माध्य, व्युत्क्रम-गामा विचरण संयुग्मित हों।)

यदि कई बच्चे नोड हैं, तो वे सभी निर्भर हो जाएंगे, जैसा कि डिरिचलेट-श्रेणीबद्ध स्थिति में है। परिणामी संयुक्त वितरण का एक बंद रूप होगा जो कुछ मायनों में यौगिक वितरण जैसा दिखता है, हालांकि इसमें प्रत्येक बच्चे के नोड के लिए एक कई कारकों का उत्पाद होगा।

इसके अलावा, और सबसे महत्वपूर्ण बात यह है कि अन्य (और ढह गए नोड के माता-पिता को भी दिया गया है, लेकिन चाइल्ड नोड्स के बच्चों को नहीं दिया गया है) दिए गए चाइल्ड नोड्स में से एक के परिणामी सशर्त वितरण में सभी शेष चाइल्ड नोड्स के पश्च पूर्वानुमानित वितरण के समान घनत्व होगा। इसके अलावा, पश्च पूर्वानुमानित वितरण में एकल नोड के मूल यौगिक वितरण के, विभिन्न मापदंडों के साथ समान घनत्व है। यौगिक वितरण पर लेख में सामान्य सूत्र दिया गया है।

उदाहरण के लिए, सशर्त रूप से स्वतंत्र समान रूप से वितरित गॉसियन वितरित नोड्स के एक सेट के साथ एक बेयस नेटवर्क दिया गया है जिसमें माध्य और विचरण पर संयुग्मित पूर्व वितरण हैं, माध्य और प्रसरण दोनों को संयोजित करने के बाद अन्य को दिए गए एक नोड का सशर्त वितरण एक छात्र का टी-वितरण होगा। इसी तरह, कई पॉसों वितरित नोड्स से पहले गामा को संयुक्तीकरण करने का परिणाम एक नोड के सशर्त वितरण का कारण बनता है, जो दूसरों को एक नकारात्मक द्विपद वितरण मानने के लिए दिया जाता है।

इन स्थितियों में जहां संयुक्तीकरण एक प्रसिद्ध वितरण का उत्पादन करता है, वहां कुशल सैंपलिंग प्रक्रियाएं प्रायः मौजूद होती हैं, और उनका उपयोग करना प्रायः (हालांकि जरूरी नहीं) ढहने से अधिक कुशल होगा, और इसके बजाय पूर्व और बच्चे दोनों नोड्स को अलग-अलग सैंपलिंग लेना होगा। हालाँकि, ऐसे स्थिति में जहां यौगिक वितरण अच्छी तरह से ज्ञात नहीं है, इसका सैंपलिंग लेना आसान नहीं हो सकता है, क्योंकि यह सामान्यतः घातीय परिवार से संबंधित नहीं होगा और सामान्यतः लॉग-अवतल नहीं होगा (जो अनुकूली अस्वीकृति सैंपलिंग का उपयोग करके सैंपलिंग लेना आसान बना देगा, क्योंकि एक बंद रूप हमेशा मौजूद रहता है)।

ऐसे स्थिति में जहां ढह गए नोड्स के बच्चे नोड्स में बच्चे हैं, इन बच्चों के नोड्स में से एक का सशर्त वितरण ग्राफ में अन्य सभी नोड्स को इन दूसरे स्तर के बच्चों के वितरण को ध्यान में रखना होगा। विशेष रूप से, परिणामी सशर्त वितरण संयुक्त वितरण के एक उत्पाद के समानुपाती होगा जैसा कि ऊपर परिभाषित किया गया है, और सभी बच्चे नोड्स के सशर्त वितरण उनके माता-पिता को दिए गए हैं (लेकिन अपने स्वयं के बच्चों को नहीं दिए गए हैं)। यह इस तथ्य से अनुसरण करता है कि पूर्ण सशर्त वितरण संयुक्त वितरण के समानुपाती होता है। यदि ढह गए नोड्स के बच्चे के नोड्स निरंतर हैं, तो यह वितरण सामान्यतः एक ज्ञात रूप का नहीं होगा, और इस तथ्य के बावजूद सैंपलिंग बनाना मुश्किल हो सकता है तथा गैर-ज्ञात यौगिक वितरणों के लिए ऊपर वर्णित समान कारणों से एक बंद रूप लिखा जा सकता है। हालाँकि, विशेष स्थिति में कि बच्चे के नोड असतत हैं, सैंपलिंग संभव है, भले ही इन बच्चे के नोड के बच्चे निरंतर हों या असतत हों। वास्तव में, यहां सम्मिलित सिद्धांत को डिरिचलेट-बहुराष्ट्रीय वितरण पर लेख में उचित विवरण में वर्णित किया गया है।

आदेशित अतिश्रांति के साथ गिब्स प्रतिदर्शित्र

  • आदेशित अतिश्रांति के साथ एक गिब्स प्रतिदर्शित्र किसी भी चरण में के लिए दिए गए विषम संख्या के उम्मीदवार मूल्यों का सैंपलिंग लेता है और कुछ अच्छी तरह से परिभाषित क्रम के अनुसार के लिए एकल मान के साथ उन्हें वर्गीकृत करता है। यदि क्रमबद्ध सूची में sवां सबसे छोटा है तो को क्रमबद्ध सूची में sवां सबसे बड़ा चुना गया है। अधिक जानकारी के लिए, नील (1995) देखें।[6]

अन्य विस्तारण

गिब्स सैंपलिंग को विभिन्न तरीकों से विस्तारित करना भी संभव है। उदाहरण के लिए, चरो की स्थिति में जिनके सशर्त वितरण से सैंपलिंग लेना आसान नहीं है, अंशअ सैंपलिंग या मेट्रोपोलिस-हेस्टिंग्स कलन विधि का एक एकल पुनरावृत्ति प्रश्न में चरो से सैंपलिंग लेने के लिए उपयोग किया जा सकता है। उन चरों को सम्मिलित करना भी संभव है जो यादृच्छिक चर नहीं हैं, लेकिन जिनका मान निश्चित रूप से अन्य चरों से गणना किया जाता है। सामान्यीकृत रैखिक प्रारूप, उदा, रसद प्रतिगमन (उर्फ अधिकतम एन्ट्रापी प्रारूप), इस कार्य प्रणाली में सम्मिलित किया जा सकता है। (बीयूजीएस, उदाहरण के लिए, प्रारूप के इस प्रकार के मिश्रण की अनुमति देता है।)

विफलता मोड

गिब्स सैंपलिंग दो तरीकों से विफल हो सकता है। पहला तब होता है जब उच्च-क्षमता वाली स्थितियों के द्वीप होते हैं, जिनके बीच कोई रास्ता नहीं होता है। उदाहरण के लिए, 2-बिट सदिशों पर प्रायिकता वितरण पर विचार करें, जहाँ सदिशों (0,0) और (1,1) प्रत्येक की प्रायिकता ½ है, लेकिन अन्य दो सदिशों (0,1) और (1,0) की प्रायिकता शून्य है। गिब्स सैंपलिंग दो उच्च संभावना वाले सदिशों में से एक में प्रगृहीत हो जाएगा, और दूसरे तक कभी नहीं पहुंचेगा। सामान्यतः अधिक, उच्च-आयामी, वास्तविक-मूल्य वाले सदिश पर किसी भी वितरण के लिए, यदि सदिश के दो विशेष तत्व पूरी तरह से सहसंबद्ध (या पूरी तरह से विरोधी-सहसंबंध) हैं, तो वे दो तत्व अटक जाएंगे, और गिब्स सैंपलिंग उन्हें कभी भी बदलने में सक्षम नहीं होगा।

दूसरी समस्या तब भी हो सकती है जब सभी अवस्थाओ में संभावना शून्य न हो और उच्च संभावना वाले राज्यों का केवल एक ही द्वीप हो। उदाहरण के लिए, 100-बिट सदिशों पर प्रायिकता वितरण पर विचार करें, जहां सभी शून्य सदिश संभाव्यता ½ के साथ होता है, और अन्य सभी सदिश समान रूप से संभावित हैं, और इसलिए प्रत्येक की प्रायिकता है। यदि आप शून्य सदिश की प्रायिकता का अनुमान लगाना चाहते हैं, तो सही वितरण से 100 या 1000 सैंपलिंग लेना पर्याप्त होगा। यह लगभग ½ के करीब उत्तर देने की संभावना है। लेकिन समान परिणाम प्राप्त करने के लिए आपको संभवतः गिब्स सैंपलिंग से से अधिक सैंपलिंग लेने होंगे। कोई भी कंप्यूटर जीवन भर ऐसा नहीं कर सकता था।

यह समस्या तब होती है जब बर्न-इन अवधि कितनी भी लंबी हो। ऐसा इसलिए है क्योंकि सही वितरण में, शून्य सदिश आधा समय होता है, और उन घटनाओं को गैर-शून्य सदिशो के साथ यादृच्छिक रूप से मिश्रित किया जाता है। यहां तक ​​कि एक छोटा सा सैंपलिंग भी शून्य और अशून्य दोनों सदिशों को देखेगा। लेकिन गिब्स सैंपलिंग लंबी अवधि के लिए केवल शून्य सदिश (लगभग एक पंक्ति में) को वापस करने के बीच वैकल्पिक होगा, फिर लंबी अवधि के लिए केवल गैर शून्य सदिश (लगभग एक पंक्ति में) को वापस करने के बीच वैकल्पिक होगा। इस प्रकार सही वितरण के लिए अभिसरण बेहद धीमा है, जिसके लिए चरणों से अधिक की आवश्यकता होती है, उचित समय अवधि में इतने सारे कदम उठाना अभिकलनीय रूप से संभव नहीं है। यहाँ धीमे अभिसरण को आयामीता के अभिशाप के परिणाम के रूप में देखा जा सकता है।

इस तरह की समस्या को एक बार में पूरे 100-बिट सदिश को ब्लॉक सैंपलिंग द्वारा हल किया जा सकता है। (यह मानता है कि 100-बिट सदिश चर के एक बड़े सेट का हिस्सा है। यदि यह सदिश केवल एक चीज है जिसका सैंपलिंग लिया जा रहा है, तो ब्लॉक सैंपलिंग गिब्स सैंपलिंग बिल्कुल नहीं करने के बराबर है, जो परिकल्पना द्वारा कठिन होगा।)

सॉफ्टवेयर

  • संभाव्य कार्यक्रमों के रूप में निर्दिष्ट यादृच्छिक वितरण पर गिब्स अनुमान लगाने के लिए चर्च मुफ्त सॉफ्टवेयर है।

टिप्पणियाँ

  1. Geman, S.; Geman, D. (1984). "Stochastic Relaxation, Gibbs Distributions, and the Bayesian Restoration of Images". IEEE Transactions on Pattern Analysis and Machine Intelligence. 6 (6): 721–741. doi:10.1109/TPAMI.1984.4767596. PMID 22499653.
  2. Gelfand, Alan E.; Smith, Adrian F. M. (1990-06-01). "सीमांत घनत्व की गणना करने के लिए नमूना-आधारित दृष्टिकोण". Journal of the American Statistical Association. 85 (410): 398–409. doi:10.1080/01621459.1990.10476213. ISSN 0162-1459.
  3. Gelman, Andrew and Carlin, John B and Stern, Hal S and Dunson, David B and Vehtari, Aki and Rubin, Donald B (2014). बायेसियन डेटा विश्लेषण. Vol. 2. FL: CRC press Boca Raton.{{cite book}}: CS1 maint: multiple names: authors list (link)
  4. 4.0 4.1 4.2 Lee, Se Yoon (2021). "Gibbs sampler and coordinate ascent variational inference: A set-theoretical review". Communications in Statistics - Theory and Methods. arXiv:2008.01006. doi:10.1080/03610926.2021.1921214.
  5. Liu, Jun S. (September 1994). "The Collapsed Gibbs Sampler in Bayesian Computations with Applications to a Gene Regulation Problem". Journal of the American Statistical Association. 89 (427): 958–966. doi:10.2307/2290921. JSTOR 2290921.
  6. Neal, Radford M. (1995). Suppressing Random Walks in Markov Chain Monte Carlo Using Ordered Overrelaxation (Technical report). University of Toronto, Department of Statistics. arXiv:bayes-an/9506004. Bibcode:1995bayes.an..6004N.


संदर्भ