गिब्स सैंपलिंग: Difference between revisions
No edit summary |
|||
Line 2: | Line 2: | ||
{{Bayesian statistics}} | {{Bayesian statistics}} | ||
[[आंकड़ों]] में, गिब्स | [[आंकड़ों]] में, गिब्स प्रतिदर्शी या गिब्स प्रतिदर्शित्र एक [[मार्कोव चेन मोंटे कार्लो|मार्कोव शृंखला मोंटे कार्लो]] (एमसीएमसी)[[ कलन विधि ]]है, जो अवलोकनों का एक क्रम प्राप्त करने के लिए होती है, तथा जो तब एक निर्दिष्ट [[बहुभिन्नरूपी वितरण|बहुभिन्नरूपी]] [[संभाव्यता वितरण]] से अनुमानित होती है, जब प्रत्यक्ष प्रतिदर्शी कठिन होता है। इस अनुक्रम का उपयोग संयुक्त वितरण को अनुमानित करने के लिए किया जा सकता है (उदाहरण के लिए, वितरण का आयत चित्र उत्पन्न करने के लिए), किसी एक चर, या चर के कुछ उपसमुच्चय (उदाहरण के लिए, अज्ञात [[पैरामीटर|प्राचल]] या [[अव्यक्त चर|अंतर्निहित चर]]) के [[सीमांत वितरण]] का अनुमान लगाने के लिए, या एक [[अभिन्न]] की गणना करने के लिए (जैसे चर में से एक का [[अपेक्षित मूल्य|प्रत्याशित मान]])। आमतौर पर, कुछ चर उन टिप्पणियों के अनुरूप होते हैं जिनके मान ज्ञात होते हैं, और इसलिए उन्हें प्रतिदर्श लेने की आवश्यकता नहीं होती है। | ||
गिब्स | गिब्स प्रतिदर्शी आमतौर पर [[सांख्यिकीय अनुमिती]] यानी विशेष रूप से [[बेजअनुमिति]] के साधन के रूप में प्रयोग किया जाता है। यह एक [[यादृच्छिक कलन विधि]] है (अर्थात एक कलन विधि जो [[यादृच्छिक संख्याओं]] का उपयोग करता है), और [[अपेक्षा-अधिकतमकरण कलन विधि]] (ईएम) जैसे सांख्यिकीय अनुमिती के लिए [[नियतात्मक कलन विधि]] का एक विकल्प है। | ||
अन्य एमसीएमसी कलन विधि के साथ, गिब्स | अन्य एमसीएमसी कलन विधि के साथ, गिब्स प्रतिदर्शी प्रतिदर्श की [[मार्कोव श्रृंखला]] उत्पन्न करता है, जिनमें से प्रत्येक पास के प्रतिदर्श से [[संबंधित|सहसंबंधित]] है। नतीजतन, अगर स्वतंत्र प्रतिदर्श वांछित हैं तो देखभाल की जानी चाहिए। आम तौर पर, श्रृंखला की शुरुआत ("अमिट होने की अवधि") से प्रतिदर्श वांछित वितरण का सटीक रूप से प्रतिनिधित्व नहीं कर सकते हैं और आमतौर पर पदच्युत कर दिए जाते हैं। | ||
== परिचय == | == परिचय == | ||
प्रतिदर्शी कलन विधि और [[सांख्यिकीय भौतिकी]] के बीच समानता के संदर्भ में, गिब्स प्रतिदर्शी का नाम भौतिक विज्ञानी [[योशिय्याह विलार्ड गिब्स|जोशियाह विलार्ड गिब्स]] के नाम पर रखा गया है। गिब्स की मृत्यु के लगभग आठ दशक बाद 1984 में दो भाइयों [[ स्टुअर्ट जेमन |स्टुअर्ट जेमन]] और [[ डोनाल्ड जेमन |डोनाल्ड जेमन]] द्वारा कलन विधि का वर्णन किया गया था।<ref>{{Cite journal | |||
| first1=S. |last1=Geman |author-link1=Stuart Geman | | first1=S. |last1=Geman |author-link1=Stuart Geman | ||
| first2=D. |last2=Geman |author-link2=Donald Geman | | first2=D. |last2=Geman |author-link2=Donald Geman | ||
Line 20: | Line 20: | ||
}}</ref> और सीमांत प्रायिकता वितरण, विशेष रूप से पश्च वितरण की गणना के लिए सांख्यिकी समुदाय में लोकप्रिय हो गया।<ref>{{Cite journal |last=Gelfand |first=Alan E. |last2=Smith |first2=Adrian F. M. |date=1990-06-01 |title=सीमांत घनत्व की गणना करने के लिए नमूना-आधारित दृष्टिकोण|url=https://www.tandfonline.com/doi/abs/10.1080/01621459.1990.10476213 |journal=Journal of the American Statistical Association |volume=85 |issue=410 |pages=398–409 |doi=10.1080/01621459.1990.10476213 |issn=0162-1459}}</ref> | }}</ref> और सीमांत प्रायिकता वितरण, विशेष रूप से पश्च वितरण की गणना के लिए सांख्यिकी समुदाय में लोकप्रिय हो गया।<ref>{{Cite journal |last=Gelfand |first=Alan E. |last2=Smith |first2=Adrian F. M. |date=1990-06-01 |title=सीमांत घनत्व की गणना करने के लिए नमूना-आधारित दृष्टिकोण|url=https://www.tandfonline.com/doi/abs/10.1080/01621459.1990.10476213 |journal=Journal of the American Statistical Association |volume=85 |issue=410 |pages=398–409 |doi=10.1080/01621459.1990.10476213 |issn=0162-1459}}</ref> | ||
अपने मूल संस्करण में, गिब्स | अपने मूल संस्करण में, गिब्स प्रतिदर्शी [[मेट्रोपोलिस-हेस्टिंग्स कलन विधि]] की एक विशेष स्थिति है। हालांकि, इसके विस्तारित संस्करणों (नीचे देखें) में, इसे प्रत्येक चर (या कुछ स्थितयो में, चर के प्रत्येक समूह) को बदले में प्रतिचयित करके चर के एक बड़े सेट से प्रतिदर्श के लिए एक सामान्य रूपरेखा माना जा सकता है, और प्रतिदर्शी के एक या अधिक चरणों को लागू करने के लिए [[मेट्रोपोलिस-हेस्टिंग्स कलन विधि]] (या [[ टुकड़ा नमूनाकरण |अंशअ]] प्रतिदर्शी जैसी विधियाँ) को सम्मिलित कर सकते हैं। | ||
गिब्स | गिब्स प्रतिदर्शी तब लागू होता है जब संयुक्त वितरण स्पष्ट रूप से ज्ञात नहीं होता है या प्रत्यक्ष रूप से प्रतिदर्श लेना मुश्किल होता है, लेकिन प्रत्येक चर का [[सशर्त वितरण]] ज्ञात होता है और प्रतिदर्श के लिए आसान (या कम से कम, आसान) होता है। गिब्स प्रतिदर्शी कलन विधि बदले में प्रत्येक चर के वितरण से एक अन्य चर के वर्तमान मूल्यों पर सशर्त उदाहरण उत्पन्न करता है। यह दिखाया जा सकता है किप्रतिदर्शो का अनुक्रम एक [[मार्कोव श्रृंखला]] का गठन करता है, और उस मार्कोव श्रृंखला का स्थिर वितरण केवल वांछित संयुक्त वितरण है।<ref>{{Cite book|title=बायेसियन डेटा विश्लेषण|last=Gelman|first=Andrew and Carlin, John B and Stern, Hal S and Dunson, David B and Vehtari, Aki and Rubin, Donald B|publisher=CRC press Boca Raton|year=2014|volume=2|location=FL}}</ref> | ||
गिब्स | गिब्स प्रतिदर्शी विशेष रूप से [[बायेसियन नेटवर्क]] के [[पश्च वितरण]] के प्रतिदर्श के लिए अनुकूलित है, क्योंकि बायेसियन नेटवर्क आमतौर पर सशर्त वितरण के संग्रह के रूप में निर्दिष्ट होते हैं। | ||
== कार्यान्वयन == | == कार्यान्वयन == | ||
गिब्स प्रतिचयन, अपने मूल अवतार में, [[मेट्रोपोलिस-हेस्टिंग्स कलन विधि]] की एक विशेष स्थिति है। गिब्स | गिब्स प्रतिचयन, अपने मूल अवतार में, [[मेट्रोपोलिस-हेस्टिंग्स कलन विधि]] की एक विशेष स्थिति है। गिब्स प्रतिदर्शी का मुद्दा यह है कि एक बहुचर वितरण को देखते हुए एक [[संयुक्त वितरण]] पर एकीकृत करके [[सीमांत वितरण]] की तुलना में एक [[सशर्त वितरण]] से प्रतिदर्श लेना आसान है। मान लीजिए हम एक संयुक्त वितरण <math> p(x_1, \dots, x_n) </math> से <math>\mathbf{X} = (x_1, \dots, x_n)</math> के <math>\left.k\right.</math> प्रतिदर्श प्राप्त करना चाहते हैं। <math>i</math>वें प्रतिदर्श को <math>\mathbf{X}^{(i)} = \left(x_1^{(i)}, \dots, x_n^{(i)}\right)</math>से निरूपित करें। हम निम्नानुसार आगे बढ़ते हैं, | ||
# हम कुछ प्रारंभिक मान <math>\mathbf{X}^{(0)}</math> से शुरू करते हैं। | # हम कुछ प्रारंभिक मान <math>\mathbf{X}^{(0)}</math> से शुरू करते हैं। | ||
Line 41: | Line 41: | ||
* किसी भी चर के [[अपेक्षित मूल्य|प्रत्याशित मान]] को सभीप्रतिदर्शो के औसत से अनुमानित किया जा सकता है। | * किसी भी चर के [[अपेक्षित मूल्य|प्रत्याशित मान]] को सभीप्रतिदर्शो के औसत से अनुमानित किया जा सकता है। | ||
प्रतिदर्शी करते समय, | |||
*चर के प्रारंभिक मूल्यों को बेतरतीब ढंग से या कुछ अन्य कलन विधि जैसे कि [[अपेक्षा-अधिकतमकरण]] द्वारा निर्धारित किया जा सकता है। | *चर के प्रारंभिक मूल्यों को बेतरतीब ढंग से या कुछ अन्य कलन विधि जैसे कि [[अपेक्षा-अधिकतमकरण]] द्वारा निर्धारित किया जा सकता है। | ||
* पहले चर के प्रतिदर्श के लिए प्रारंभिक मान निर्धारित करना वास्तव में आवश्यक नहीं है। | * पहले चर के प्रतिदर्श के लिए प्रारंभिक मान निर्धारित करना वास्तव में आवश्यक नहीं है। | ||
*शुरुआत (तथाकथित अमिट होने की अवधि) में कुछप्रतिदर्शो की संख्या को अनदेखा करना सामान्य बात है, और फिर केवल प्रत्येक <math>n</math>वें प्रतिदर्श पर विचार करें जब एक अपेक्षा की गणना करने के लिए मूल्यों का औसत निकाला जाता है। उदाहरण के लिए, पहले 1,000प्रतिदर्शो को नजरअंदाज किया जा सकता है, और फिर हर 100वें प्रतिदर्श का औसत निकाला जाता है, बाकी सभी को निकाल दिया जाता है। इसका कारण यह है कि (1) मार्कोव श्रृंखला का [[स्थिर वितरण]] चरों पर वांछित संयुक्त वितरण है, लेकिन उस स्थिर वितरण तक पहुंचने में कुछ समय लग सकता है, (2) क्रमिक प्रतिदर्श एक दूसरे से स्वतंत्र नहीं होते हैं लेकिन कुछ मात्रा में सहसंबंध के साथ एक [[मार्कोव श्रृंखला]] बनाते हैं। कभी-कभी, कलन विधि का उपयोगप्रतिदर्शो के बीच स्वसंबंध की मात्रा और इससे गणना की गई <math>n</math> (सैम्पल के बीच की अवधि जो वास्तव में उपयोग की जाती है) के मान को निर्धारित करने के लिए किया जा सकता है, लेकिन व्यवहार में इसमें उचित मात्रा में [[काला जादू (प्रोग्रामिंग)|अनिष्टकारी या काला जादू]] सम्मिलित होता है। | *शुरुआत (तथाकथित अमिट होने की अवधि) में कुछप्रतिदर्शो की संख्या को अनदेखा करना सामान्य बात है, और फिर केवल प्रत्येक <math>n</math>वें प्रतिदर्श पर विचार करें जब एक अपेक्षा की गणना करने के लिए मूल्यों का औसत निकाला जाता है। उदाहरण के लिए, पहले 1,000प्रतिदर्शो को नजरअंदाज किया जा सकता है, और फिर हर 100वें प्रतिदर्श का औसत निकाला जाता है, बाकी सभी को निकाल दिया जाता है। इसका कारण यह है कि (1) मार्कोव श्रृंखला का [[स्थिर वितरण]] चरों पर वांछित संयुक्त वितरण है, लेकिन उस स्थिर वितरण तक पहुंचने में कुछ समय लग सकता है, (2) क्रमिक प्रतिदर्श एक दूसरे से स्वतंत्र नहीं होते हैं लेकिन कुछ मात्रा में सहसंबंध के साथ एक [[मार्कोव श्रृंखला]] बनाते हैं। कभी-कभी, कलन विधि का उपयोगप्रतिदर्शो के बीच स्वसंबंध की मात्रा और इससे गणना की गई <math>n</math> (सैम्पल के बीच की अवधि जो वास्तव में उपयोग की जाती है) के मान को निर्धारित करने के लिए किया जा सकता है, लेकिन व्यवहार में इसमें उचित मात्रा में [[काला जादू (प्रोग्रामिंग)|अनिष्टकारी या काला जादू]] सम्मिलित होता है। | ||
* | * प्रतिदर्शी प्रक्रिया के शुरुआती भाग में[[ यादृच्छिक चाल | यादृच्छिक भ्रमण]] व्यवहार को कम करने के लिए अनुकारित अनीलन की प्रक्रिया का उपयोग अक्सर किया जाता है (यानी प्रतिदर्श समष्टि के चारों ओर धीरे-धीरे घूमने की प्रवृत्ति, प्रतिदर्शो के बीच उच्च मात्रा में [[स्वतः सहसंबंध]] की उच्च मात्रा के साथ, वांछित के रूप में जल्दी से घूमने की बजाय)। अन्य तकनीकें जो स्वत:सहसंबंध को कम कर सकती हैं, उन्हें गिब्स प्रतिचयन, अवरुद्ध गिब्स प्रतिचयन, और अतिविश्राम में सुव्यवस्थित किया गया है, नीचे देखें। | ||
=== सशर्त वितरण और संयुक्त वितरण का संबंध === | === सशर्त वितरण और संयुक्त वितरण का संबंध === | ||
Line 54: | Line 54: | ||
# यदि वितरण असतत है, तो <math>x_j</math> के सभी संभावित मानों की अलग-अलग संभावनाओं की गणना की जाती है, और फिर सामान्यीकरण स्थिरांक खोजने के लिए योग किया जाता है। | # यदि वितरण असतत है, तो <math>x_j</math> के सभी संभावित मानों की अलग-अलग संभावनाओं की गणना की जाती है, और फिर सामान्यीकरण स्थिरांक खोजने के लिए योग किया जाता है। | ||
#यदि वितरण निरंतर है और ज्ञात रूप का है, तो सामान्यीकरण स्थिरांक भी ज्ञात होगा। | #यदि वितरण निरंतर है और ज्ञात रूप का है, तो सामान्यीकरण स्थिरांक भी ज्ञात होगा। | ||
# अन्य स्थितियों में, सामान्यीकरण स्थिरांक को आमतौर पर अनदेखा किया जा सकता है, क्योंकि अधिकांश | # अन्य स्थितियों में, सामान्यीकरण स्थिरांक को आमतौर पर अनदेखा किया जा सकता है, क्योंकि अधिकांश प्रतिदर्शी विधियों को इसकी आवश्यकता नहीं होती है। | ||
== निष्कर्ष == | == निष्कर्ष == | ||
गिब्स | गिब्स प्रतिदर्शी आमतौर पर [[सांख्यिकीय अनुमिती]] के लिए उपयोग किया जाता है (उदाहरण के लिए पैरामीटर का सर्वोत्तम मूल्य निर्धारित करना, जैसे कि किसी विशेष स्टोर पर किसी विशेष स्टोर पर खरीदारी करने वाले लोगों की संख्या का निर्धारण करना, तथा वह उम्मीदवार जिसे मतदाता सबसे अधिक वोट देगा, मतदाताओ की संख्या का निर्धारण करना, आदि)। विचार यह है कि देखे गए डेटा के प्रत्येक टुकड़े के लिए अलग-अलग चर बनाकर और उन चरों से प्रतिदर्श लेने के बजाय, उनके देखे गए मूल्यों के लिए चर को ठीक करके प्रतिदर्शी प्रक्रिया में सम्मिलित किया गया है। शेष चरों का वितरण प्रभावी रूप से प्रेक्षित डेटा पर वातानुकूलित [[पश्च वितरण]] है। | ||
एक वांछित पैरामीटर ([[मोड (सांख्यिकी)|मोड]]) का सबसे संभावित मूल्य तब केवल उस प्रतिदर्श मान को चुनकर चयनित किया जा सकता है जो आमतौर पर सबसे अधिक होता है, यह अनिवार्य रूप से एक पैरामीटर के [[अधिकतम पश्चात]] के अनुमान के बराबर है। (चूंकि पैरामीटर आमतौर पर निरंतर होते हैं, इसलिए मोड का एक सार्थक अनुमान प्राप्त करने के लिए प्रतिचयित मानों को परिमित संख्या में से किसी एक श्रेणी या "बिन" में "बिन" करना अक्सर आवश्यक होता है।) अधिक सामान्यतः, हालांकि, प्रतिदर्श मूल्यों का [[अपेक्षित मूल्य]] ([[माध्य]] या औसत) चुना जाता है, यह एक [[बेयस अनुमानक]] है जो पूरे वितरण के बारे में अतिरिक्त डेटा का लाभ उठाता है जो कि बायेसियन | एक वांछित पैरामीटर ([[मोड (सांख्यिकी)|मोड]]) का सबसे संभावित मूल्य तब केवल उस प्रतिदर्श मान को चुनकर चयनित किया जा सकता है जो आमतौर पर सबसे अधिक होता है, यह अनिवार्य रूप से एक पैरामीटर के [[अधिकतम पश्चात]] के अनुमान के बराबर है। (चूंकि पैरामीटर आमतौर पर निरंतर होते हैं, इसलिए मोड का एक सार्थक अनुमान प्राप्त करने के लिए प्रतिचयित मानों को परिमित संख्या में से किसी एक श्रेणी या "बिन" में "बिन" करना अक्सर आवश्यक होता है।) अधिक सामान्यतः, हालांकि, प्रतिदर्श मूल्यों का [[अपेक्षित मूल्य]] ([[माध्य]] या औसत) चुना जाता है, यह एक [[बेयस अनुमानक]] है जो पूरे वितरण के बारे में अतिरिक्त डेटा का लाभ उठाता है जो कि बायेसियन प्रतिदर्शी से उपलब्ध है, जबकि[[ अपेक्षा अधिकतमकरण ]] (ईएम) जैसे अधिकतमकरण कलन विधि वितरण से केवल एक बिंदु वापस करने में सक्षम है। उदाहरण के लिए, एक असमान वितरण के लिए माध्य (अपेक्षित मान) आमतौर पर मोड (सबसे सामान्य मान) के समान होता है, लेकिन यदि वितरण एक दिशा में [[तिरछा|विषमतलीय]] है, तो माध्य उस दिशा चला जाएगा, जो उस दिशा में अतिरिक्त संभावना द्रव्यमान के लिए प्रभावी रूप से जिम्मेदार है। (यदि कोई वितरण बहुविध है, तो अपेक्षित मान सार्थक बिंदु नहीं लौटा सकता है, और कोई भी मोड आमतौर पर बेहतर विकल्प होता है।) | ||
हालाँकि कुछ चर सामान्य तौर पर रुचि के मापदंडों के अनुरूप होते हैं, अन्य चर के बीच संबंधों को ठीक से व्यक्त करने के लिए प्रतिरूप में पेश किए गए अरुचिकर (उपद्रव) चर हैं। हालांकि प्रतिदर्श मूल्य सभी चर पर [[संयुक्त वितरण]] का प्रतिनिधित्व करते हैं, तथा अपेक्षित मूल्यों या मोड की गणना करते समय उपद्रव चर को आसानी से अनदेखा किया जा सकता है, यह उपद्रव चर पर [[सीमांत वितरण]] के बराबर है। जब एकाधिक चर के लिए एक मान वांछित होता है, तो अपेक्षित मान की गणना प्रत्येक चर पर अलग से की जाती है। (मोड की गणना करते समय, हालांकि, सभी चरों को एक साथ माना जाना चाहिए।) | हालाँकि कुछ चर सामान्य तौर पर रुचि के मापदंडों के अनुरूप होते हैं, अन्य चर के बीच संबंधों को ठीक से व्यक्त करने के लिए प्रतिरूप में पेश किए गए अरुचिकर (उपद्रव) चर हैं। हालांकि प्रतिदर्श मूल्य सभी चर पर [[संयुक्त वितरण]] का प्रतिनिधित्व करते हैं, तथा अपेक्षित मूल्यों या मोड की गणना करते समय उपद्रव चर को आसानी से अनदेखा किया जा सकता है, यह उपद्रव चर पर [[सीमांत वितरण]] के बराबर है। जब एकाधिक चर के लिए एक मान वांछित होता है, तो अपेक्षित मान की गणना प्रत्येक चर पर अलग से की जाती है। (मोड की गणना करते समय, हालांकि, सभी चरों को एक साथ माना जाना चाहिए।) | ||
Line 65: | Line 65: | ||
[[ पर्यवेक्षित अध्ययन | पर्यवेक्षित अध्ययन]], [[ अनियंत्रित शिक्षा |अनियंत्रित शिक्षा]] और [[ अर्ध-पर्यवेक्षित शिक्षा |अर्ध-पर्यवेक्षित शिक्षा]] (विलुप्त मूल्यों के साथ सीखना) सभी को उन सभी चरो के मानों को ठीक करके नियंत्रित किया जा सकता है, जिनके मूल्य ज्ञात हैं, और जो शेष प्रतिदर्श देते है। | [[ पर्यवेक्षित अध्ययन | पर्यवेक्षित अध्ययन]], [[ अनियंत्रित शिक्षा |अनियंत्रित शिक्षा]] और [[ अर्ध-पर्यवेक्षित शिक्षा |अर्ध-पर्यवेक्षित शिक्षा]] (विलुप्त मूल्यों के साथ सीखना) सभी को उन सभी चरो के मानों को ठीक करके नियंत्रित किया जा सकता है, जिनके मूल्य ज्ञात हैं, और जो शेष प्रतिदर्श देते है। | ||
अवलोकन किए गए डेटा के लिए, प्रत्येक अवलोकन के लिए एक चर होगा- उदाहरण के लिए, अवलोकन के एक सेट के [[नमूना माध्य|प्रतिदर्श माध्य]] या [[प्रतिदर्श प्रसरण]] के अनुरूप एक चर। वास्तव में, आम तौर पर प्रतिदर्श माध्य या प्रतिदर्श प्रसरण जैसी अवधारणाओं के अनुरूप कोई भी चर नहीं होगा। इसके बजाय, ऐसी स्थिति में अज्ञात वास्तविक माध्य और वास्तविक प्रसरण का प्रतिनिधित्व करने वाले चर होंगे, और इन चरों के लिए प्रतिदर्श मानों का निर्धारण स्वचालित रूप से गिब्स | अवलोकन किए गए डेटा के लिए, प्रत्येक अवलोकन के लिए एक चर होगा- उदाहरण के लिए, अवलोकन के एक सेट के [[नमूना माध्य|प्रतिदर्श माध्य]] या [[प्रतिदर्श प्रसरण]] के अनुरूप एक चर। वास्तव में, आम तौर पर प्रतिदर्श माध्य या प्रतिदर्श प्रसरण जैसी अवधारणाओं के अनुरूप कोई भी चर नहीं होगा। इसके बजाय, ऐसी स्थिति में अज्ञात वास्तविक माध्य और वास्तविक प्रसरण का प्रतिनिधित्व करने वाले चर होंगे, और इन चरों के लिए प्रतिदर्श मानों का निर्धारण स्वचालित रूप से गिब्स प्रतिदर्शित्र के संचालन से होता है। | ||
[[सामान्यीकृत रैखिक मॉडल|सामान्यीकृत रैखिक प्रतिरूप]] (यानी [[रैखिक प्रतिगमन]] की विविधताएं) कभी-कभी गिब्स | [[सामान्यीकृत रैखिक मॉडल|सामान्यीकृत रैखिक प्रतिरूप]] (यानी [[रैखिक प्रतिगमन]] की विविधताएं) कभी-कभी गिब्स प्रतिदर्शी द्वारा भी नियंत्रित किए जा सकते हैं। उदाहरण के लिए, दिए गए द्विआधारी (हां/नहीं) विकल्प की संभावना निर्धारित करने के लिए[[ प्रोबिट प्रतिगमन | प्रोबिट प्रतिगमन]], [[सामान्य वितरण]] पुरोहितों को साथ समाश्रयण गुणांकों पर रखा जाता है, तथा इसे गिब्स प्रतिदर्शी के साथ लागू किया जा सकता है क्योंकि अतिरिक्त चर को जोड़ना और [[पूर्व संयुग्मन|संयुग्मन]] का लाभ उठाना संभव है। हालाँकि,[[ संभार तन्त्र परावर्तन ]]को इस तरह से संभाला नहीं जा सकता है। एक संभावना सामान्य वितरण के मिश्रण (आमतौर पर 7-9) के साथ [[रसद समारोह|तार्किक फलन]] को अनुमानित करना है। अधिक सामान्यतः, गिब्स प्रतिदर्श के बजाय [[मेट्रोपोलिस-हेस्टिंग्स]] का उपयोग किया जाता है। | ||
== गणितीय पृष्ठभूमि == | == गणितीय पृष्ठभूमि == | ||
Line 92: | Line 92: | ||
व्यवहार में, अनुक्रमित <math>\left.j\right.</math> को यादृच्छिक रूप से नहीं चुना जाता है, और अनुक्रमित के माध्यम से श्रृंखला चक्र क्रम में होती है। सामान्य तौर पर यह एक गैर-स्थिर मार्कोव प्रक्रिया देता है, लेकिन प्रत्येक व्यक्तिगत चरण अभी भी प्रतिवर्ती होगा, और समग्र प्रक्रिया में अभी भी वांछित स्थिर वितरण होगा (जब तक कि श्रृंखला निश्चित क्रम के तहत सभी अवस्थाओ तक पहुंच सकती है)। | व्यवहार में, अनुक्रमित <math>\left.j\right.</math> को यादृच्छिक रूप से नहीं चुना जाता है, और अनुक्रमित के माध्यम से श्रृंखला चक्र क्रम में होती है। सामान्य तौर पर यह एक गैर-स्थिर मार्कोव प्रक्रिया देता है, लेकिन प्रत्येक व्यक्तिगत चरण अभी भी प्रतिवर्ती होगा, और समग्र प्रक्रिया में अभी भी वांछित स्थिर वितरण होगा (जब तक कि श्रृंखला निश्चित क्रम के तहत सभी अवस्थाओ तक पहुंच सकती है)। | ||
== बायेसियन अनुमान में गिब्स | == बायेसियन अनुमान में गिब्स प्रतिदर्शित्र और सूचना सिद्धांत के संबंध == | ||
मान लीजिए <math>y</math> | मान लीजिए <math>y</math> प्रतिदर्शी वितरण से उत्पन्न टिप्पणियों को निरूपित करता है तब <math>f(y|\theta)</math> और <math>\pi(\theta)</math> प्राचल समष्टि <math>\Theta</math> पर पूर्व समर्थित हैं। फिर बायेसियन आँकड़ों के केंद्रीय लक्ष्यों में से एक पश्च घनत्व | ||
:<math>\pi(\theta|y) = \frac{f(y|\theta) \cdot \pi(\theta)}{m(y)}</math> | :<math>\pi(\theta|y) = \frac{f(y|\theta) \cdot \pi(\theta)}{m(y)}</math> | ||
का अनुमान लगाना है जहां सीमांत संभावना <math> m(y) = \int_{\Theta} f(y|\theta) \cdot \pi(\theta) d\theta </math> को सभी <math>y</math> के लिए परिमित माना जाता है। | का अनुमान लगाना है जहां सीमांत संभावना <math> m(y) = \int_{\Theta} f(y|\theta) \cdot \pi(\theta) d\theta </math> को सभी <math>y</math> के लिए परिमित माना जाता है। | ||
गिब्स | गिब्स प्रतिदर्शित्र की व्याख्या करने के लिए, हम अतिरिक्त रूप से मान लेते हैं कि पैरामीटर स्पेस <math>\Theta</math> रूप में विघटित हो जाता है | ||
:<math>\Theta = \prod_{i=1}^{K}\Theta_{i} = \Theta_1 \times \cdots \Theta_i \times \cdots \times \Theta_K, \quad\quad (K>1)</math>, | :<math>\Theta = \prod_{i=1}^{K}\Theta_{i} = \Theta_1 \times \cdots \Theta_i \times \cdots \times \Theta_K, \quad\quad (K>1)</math>, | ||
कहाँ <math>\times</math> [[कार्तीय गुणनफल]] को प्रदर्शित करता है। प्रत्येक घटक प्राचल समष्टि <math>\Theta_i</math> अदिश घटकों, उपसदिश या मैट्रिसेस का एक सेट हो सकता है। | कहाँ <math>\times</math> [[कार्तीय गुणनफल]] को प्रदर्शित करता है। प्रत्येक घटक प्राचल समष्टि <math>\Theta_i</math> अदिश घटकों, उपसदिश या मैट्रिसेस का एक सेट हो सकता है। | ||
एक समुच्चय <math>\Theta_{-i}</math> को परिभाषित करें जो <math>\Theta_i</math>को पूरा करता है। गिब्स | एक समुच्चय <math>\Theta_{-i}</math> को परिभाषित करें जो <math>\Theta_i</math>को पूरा करता है। गिब्स प्रतिदर्शित्र की आवश्यक सामग्री प्रत्येक <math>i=1,\cdots, K</math> | ||
:<math>\pi(\theta_i|\theta_{-i},y)=\pi(\theta_i|\theta_1, \cdots, \theta_{i-1},\theta_{i+1},\cdots, \theta_{K},y)</math>के लिए <math>i</math>-वाँ पूर्ण सशर्त पश्च वितरण है | :<math>\pi(\theta_i|\theta_{-i},y)=\pi(\theta_i|\theta_1, \cdots, \theta_{i-1},\theta_{i+1},\cdots, \theta_{K},y)</math>के लिए <math>i</math>-वाँ पूर्ण सशर्त पश्च वितरण है | ||
[[File:Gibbs sampler picture.jpg|thumb|500px|गिब्स | [[File:Gibbs sampler picture.jpg|thumb|500px|गिब्स प्रतिदर्शी कलन विधि का सचित्र विवरण <ref name="Lee2008">{{Cite journal |last=Lee|first=Se Yoon| title = Gibbs sampler and coordinate ascent variational inference: A set-theoretical review|journal=Communications in Statistics - Theory and Methods|year=2021|doi=10.1080/03610926.2021.1921214|arxiv=2008.01006}}</ref>]] | ||
[[File:Gibbs sampling info eq.jpg|thumb|500px|एक चक्र के भीतर i-वें चरण में गिब्स | [[File:Gibbs sampling info eq.jpg|thumb|500px|एक चक्र के भीतर i-वें चरण में गिब्स प्रतिदर्शित्र से जुड़ी सूचना समानता का योजनाबद्ध विवरण <ref name="Lee2008" />]]निम्नलिखित कलन विधि एक सामान्य गिब्स प्रतिदर्शित्र का विवरण देता है: | ||
<math>\text{Initialize: pick arbitrary starting value}\,\, \theta^{(1)} = (\theta_1^{(1)},\theta_2^{(1)},\cdots,\theta_i^{(1)},\theta_{i+1}^{(1)},\cdots,\theta_K^{(1)}) </math> | <math>\text{Initialize: pick arbitrary starting value}\,\, \theta^{(1)} = (\theta_1^{(1)},\theta_2^{(1)},\cdots,\theta_i^{(1)},\theta_{i+1}^{(1)},\cdots,\theta_K^{(1)}) </math> | ||
Line 131: | Line 131: | ||
<math>\text{end Iterate}</math> | <math>\text{end Iterate}</math> | ||
ध्यान दें कि गिब्स | ध्यान दें कि गिब्स प्रतिदर्शित्र एक चक्र के भीतर पुनरावृत्त मोंटे कार्लो योजना द्वारा संचालित होता है। उपरोक्त कलन विधि द्वारा तैयार किए गए प्रतिदर्शो की <math>S</math> संख्या <math>\{\theta^{(s)} \}_{s=1}^{S}</math> लक्ष्य घनत्व <math>\pi(\theta|y)</math> होने के लिए अपरिवर्तनीय वितरण के साथ मार्कोव शृंखला तैयार करती है। | ||
अब, प्रत्येक <math>i=1,\cdots,K</math>, के लिए निम्नलिखित सूचना सैद्धांतिक मात्राओ को परिभाषित करें, | अब, प्रत्येक <math>i=1,\cdots,K</math>, के लिए निम्नलिखित सूचना सैद्धांतिक मात्राओ को परिभाषित करें, | ||
Line 150: | Line 150: | ||
= H(\theta_{i}) - H(\theta_{i}|\theta_{-i}) = I(\theta_{-i} ; \theta_{i}), \quad (i=1,\cdots,K) </math>. | = H(\theta_{i}) - H(\theta_{i}|\theta_{-i}) = I(\theta_{-i} ; \theta_{i}), \quad (i=1,\cdots,K) </math>. | ||
पारस्परिक सूचना <math>I(\theta_i ; \theta_{-i}) </math> यादृच्छिक मात्रा <math>\theta_{i}</math> की अनिश्चितता में कमी की मात्रा निर्धारित करती है, जब हम <math>\theta_{-i}</math>, का अनुमान लगाते हैं। यह गायब हो जाता है अगर केवल <math>\theta_{i}</math> और <math>\theta_{-i}</math> आंशिक रूप से स्वतंत्र हैं, और केवल अनुमान लगाते हैं। पारस्परिक सूचना <math>I(\theta_i ; \theta_{-i})</math> की व्याख्या उस मात्रा के रूप में की जा सकती है जो गिब्स | पारस्परिक सूचना <math>I(\theta_i ; \theta_{-i}) </math> यादृच्छिक मात्रा <math>\theta_{i}</math> की अनिश्चितता में कमी की मात्रा निर्धारित करती है, जब हम <math>\theta_{-i}</math>, का अनुमान लगाते हैं। यह गायब हो जाता है अगर केवल <math>\theta_{i}</math> और <math>\theta_{-i}</math> आंशिक रूप से स्वतंत्र हैं, और केवल अनुमान लगाते हैं। पारस्परिक सूचना <math>I(\theta_i ; \theta_{-i})</math> की व्याख्या उस मात्रा के रूप में की जा सकती है जो गिब्स प्रतिदर्शित्र के एकल चक्र के भीतर <math>i</math>-वें चरण से <math>i+1</math> चरण तक प्रेषित होती है। | ||
== विविधता और विस्तार == | == विविधता और विस्तार == | ||
बुनियादी गिब्स | बुनियादी गिब्स प्रतिदर्शित्र के कई रूप मौजूद हैं। इन विविधताओं का लक्ष्य किसी भी अतिरिक्त संगणनात्मक लागतों को दूर करने के लिए पर्याप्त रूप से प्रतिदर्शो के बीच [[स्वत: संबंध]] को कम करना है। | ||
=== अवरुद्ध गिब्स | === अवरुद्ध गिब्स प्रतिदर्शित्र === | ||
*एक अवरुद्ध गिब्स | *एक अवरुद्ध गिब्स प्रतिदर्शित्र दो या दो से अधिक चरों को एक साथ समूहित करता है और उनके [[संयुक्त वितरण]] से प्रतिदर्श अलग-अलग प्रत्येक से प्रतिदर्श लेने के बजाय अन्य सभी चरों पर सशर्त होता है। उदाहरण के लिए, एक [[छिपे]] [[छिपा हुआ मार्कोव मॉडल|हुआ मार्कोव प्रारूप]] में, एक अवरुद्ध गिब्स प्रतिदर्शित्र[[ आगे-पीछे एल्गोरिदम | अग्र पश्च कलन विधि]] का उपयोग करके [[मार्कोव श्रृंखला]] बनाने वाले सभी [[अव्यक्त चर]] से प्रतिदर्श ले सकता है। | ||
=== संकुचित गिब्स | === संकुचित गिब्स प्रतिदर्शित्र === | ||
*किसी अन्य चर के लिए प्रतिदर्श लेते समय एक संकुचित गिब्स प्रतिदर्श एक या अधिक चर ([[सीमांत वितरण]]) को एकीकृत करता है। उदाहरण के लिए, कल्पना करें कि एक प्रारुप में तीन चर ''A'', ''B'' और ''C'' होते हैं। एक साधारण गिब्स | *किसी अन्य चर के लिए प्रतिदर्श लेते समय एक संकुचित गिब्स प्रतिदर्श एक या अधिक चर ([[सीमांत वितरण]]) को एकीकृत करता है। उदाहरण के लिए, कल्पना करें कि एक प्रारुप में तीन चर ''A'', ''B'' और ''C'' होते हैं। एक साधारण गिब्स प्रतिदर्शित्र ''p''(''A'' | ''B'',''C''), तब ''p''(''B'' | ''A'' ,''C''), फिर ''p''(''C'' | ''A'',''B'') से प्रतिदर्श लेगा। एक संकुचित गिब्स प्रतिदर्शित्र ''A'' के लिए प्रतिदर्श चरण को सीमांत वितरण ''p''(''A'' | ''C'') से लिए गए प्रतिदर्श से बदल सकता है, इस स्थिति में चर 'B'' को एकीकृत किया गया है। वैकल्पिक रूप से, चर ''B'' को पूरी तरह से संकुचित किया जा सकता है, वैकल्पिक रूप से ''p''(''A'' | ''C'') और ''p''(''C'' | ''A'') से प्रतिदर्श लिया जा सकता है और ''B पर बिल्कुल '' प्रतिदर्शी नहीं लिया जा सकता है। एक चर A पर वितरण जो मूल चर ''B ''के संकुचित होने पर उत्पन्न होता है, एक [[यौगिक वितरण|मिश्रित वितरण]] कहलाता है, इस वितरण से प्रतिदर्श आम तौर पर सुविधाजनक होता है जब 'B' 'A ' के लिए [[पूर्ववर्ती संयुग्म]] होता है, खासकर तब 'A' और 'B' [[घातीय परिवार]] के सदस्य होते हैं। अधिक जानकारी के लिए, [[यौगिक वितरण]] या लियू (1994) पर लेख देखें।<ref>{{cite journal | last = Liu | first = Jun S. |date=September 1994 | title = The Collapsed Gibbs Sampler in Bayesian Computations with Applications to a Gene Regulation Problem | jstor = 2290921 | journal = Journal of the American Statistical Association | volume = 89 | issue = 427 | pages = 958–966 | doi = 10.2307/2290921 }}</ref>'' | ||
==== एक संकुचित गिब्स | ==== एक संकुचित गिब्स प्रतिदर्शित्र को लागू करना ==== | ||
==== संकुचित डिरिक्ले वितरण ==== | ==== संकुचित डिरिक्ले वितरण ==== | ||
[[श्रेणीबद्ध वितरण|स्पष्ट चर]] के साथ [[पदानुक्रमित बायेसियन मॉडल|पदानुक्रमित बायेसियन]] प्रारूप में, जैसे [[अव्यक्त डिरिचलेट आवंटन]] और [[प्राकृतिक भाषा प्रसंस्करण]] में उपयोग किए जाने वाले विभिन्न अन्य प्रारूप, [[डिरिचलेट वितरण]] को समाप्त करना काफी सामान्य है जो आमतौर पर श्रेणीबद्ध चर पर [[पूर्व वितरण]] के रूप में उपयोग किया जाता है। इस संकुचित का परिणाम किसी दिए गए डिरिचलेट पर निर्भर सभी स्पष्ट चर के बीच निर्भरता का परिचय देता है, और संकुचित के बाद इन चरों का संयुक्त वितरण एक [[डिरिचलेट-बहुराष्ट्रीय वितरण]] है। यदि संकुचित नहीं किया गया होता तो इस वितरण में दिए गए श्रेणीबद्ध चर का सशर्त वितरण, दूसरों पर वातानुकूलित, एक अत्यंत सरल रूप ग्रहण करता है जो गिब्स | [[श्रेणीबद्ध वितरण|स्पष्ट चर]] के साथ [[पदानुक्रमित बायेसियन मॉडल|पदानुक्रमित बायेसियन]] प्रारूप में, जैसे [[अव्यक्त डिरिचलेट आवंटन]] और [[प्राकृतिक भाषा प्रसंस्करण]] में उपयोग किए जाने वाले विभिन्न अन्य प्रारूप, [[डिरिचलेट वितरण]] को समाप्त करना काफी सामान्य है जो आमतौर पर श्रेणीबद्ध चर पर [[पूर्व वितरण]] के रूप में उपयोग किया जाता है। इस संकुचित का परिणाम किसी दिए गए डिरिचलेट पर निर्भर सभी स्पष्ट चर के बीच निर्भरता का परिचय देता है, और संकुचित के बाद इन चरों का संयुक्त वितरण एक [[डिरिचलेट-बहुराष्ट्रीय वितरण]] है। यदि संकुचित नहीं किया गया होता तो इस वितरण में दिए गए श्रेणीबद्ध चर का सशर्त वितरण, दूसरों पर वातानुकूलित, एक अत्यंत सरल रूप ग्रहण करता है जो गिब्स प्रतिदर्शी को और भी आसान बना देता है। नियम इस प्रकार हैं, | ||
# एक डिरिचलेट पूर्व नोड को संकुचित करने से केवल पूर्व के माता-पिता और बच्चों के नोड प्रभावित होते हैं। चूंकि माता-पिता अक्सर स्थिर होते हैं, आमतौर पर केवल बच्चों के बारे में हमें चिंता करने की आवश्यकता होती है। | # एक डिरिचलेट पूर्व नोड को संकुचित करने से केवल पूर्व के माता-पिता और बच्चों के नोड प्रभावित होते हैं। चूंकि माता-पिता अक्सर स्थिर होते हैं, आमतौर पर केवल बच्चों के बारे में हमें चिंता करने की आवश्यकता होती है। | ||
#क डिरिचलेट पूर्व को समाप्त करने से उस पूर्व पर निर्भर सभी स्पष्ट बच्चों के बीच निर्भरता का परिचय मिलता है - लेकिन किसी भी अन्य श्रेणीबद्ध बच्चों के बीच कोई अतिरिक्त निर्भरता नहीं होती है। (यह ध्यान रखना महत्वपूर्ण है, उदाहरण के लिए, जब एक ही हाइपरप्रियर से संबंधित कई डिरिचलेट पूर्ववर्ती होते हैं। प्रत्येक डिरिचलेट पूर्व को स्वतंत्र रूप से ध्वस्त किया जा सकता है और केवल इसके प्रत्यक्ष बच्चों को प्रभावित करता है।) | #क डिरिचलेट पूर्व को समाप्त करने से उस पूर्व पर निर्भर सभी स्पष्ट बच्चों के बीच निर्भरता का परिचय मिलता है - लेकिन किसी भी अन्य श्रेणीबद्ध बच्चों के बीच कोई अतिरिक्त निर्भरता नहीं होती है। (यह ध्यान रखना महत्वपूर्ण है, उदाहरण के लिए, जब एक ही हाइपरप्रियर से संबंधित कई डिरिचलेट पूर्ववर्ती होते हैं। प्रत्येक डिरिचलेट पूर्व को स्वतंत्र रूप से ध्वस्त किया जा सकता है और केवल इसके प्रत्यक्ष बच्चों को प्रभावित करता है।) | ||
Line 181: | Line 181: | ||
उदाहरण के लिए, सशर्त रूप से [[स्वतंत्र समान रूप से वितरित]] गॉसियन वितरित नोड्स के एक सेट के साथ एक बेयस नेटवर्क दिया गया है जिसमें माध्य और विचरण पर [[संयुग्मित पूर्व]] वितरण हैं, माध्य और प्रसरण दोनों को संयोजित करने के बाद अन्य को दिए गए एक नोड का सशर्त वितरण एक [[छात्र का टी-वितरण]] होगा। इसी तरह, कई पॉसों वितरित नोड्स से पहले [[गामा]] को संयुक्तीकरण करने का परिणाम एक नोड के [[सशर्त वितरण]] का कारण बनता है, जो दूसरों को एक [[नकारात्मक द्विपद वितरण]] मानने के लिए दिया जाता है। | उदाहरण के लिए, सशर्त रूप से [[स्वतंत्र समान रूप से वितरित]] गॉसियन वितरित नोड्स के एक सेट के साथ एक बेयस नेटवर्क दिया गया है जिसमें माध्य और विचरण पर [[संयुग्मित पूर्व]] वितरण हैं, माध्य और प्रसरण दोनों को संयोजित करने के बाद अन्य को दिए गए एक नोड का सशर्त वितरण एक [[छात्र का टी-वितरण]] होगा। इसी तरह, कई पॉसों वितरित नोड्स से पहले [[गामा]] को संयुक्तीकरण करने का परिणाम एक नोड के [[सशर्त वितरण]] का कारण बनता है, जो दूसरों को एक [[नकारात्मक द्विपद वितरण]] मानने के लिए दिया जाता है। | ||
इन स्थितियों में जहां संयुक्तीकरण एक प्रसिद्ध वितरण का उत्पादन करता है, वहां कुशल | इन स्थितियों में जहां संयुक्तीकरण एक प्रसिद्ध वितरण का उत्पादन करता है, वहां कुशल प्रतिदर्शी प्रक्रियाएं अक्सर मौजूद होती हैं, और उनका उपयोग करना अक्सर (हालांकि जरूरी नहीं) ढहने से अधिक कुशल होगा, और इसके बजाय पूर्व और बच्चे दोनों नोड्स को अलग-अलग प्रतिदर्श लेना होगा। हालाँकि, ऐसे स्थिति में जहां यौगिक वितरण अच्छी तरह से ज्ञात नहीं है, इसका प्रतिदर्श लेना आसान नहीं हो सकता है, क्योंकि यह आम तौर पर [[घातीय परिवार]] से संबंधित नहीं होगा और आमतौर पर [[लघुगणकीय रूप से अवतल कार्य|लॉग-अवतल]] नहीं होगा (जो [[अनुकूली अस्वीकृति नमूनाकरण|अनुकूली अस्वीकृति]] प्रतिदर्शी का उपयोग करके प्रतिदर्श लेना आसान बना देगा, क्योंकि एक बंद रूप हमेशा मौजूद रहता है)। | ||
ऐसे स्थिति में जहां ढह गए नोड्स के बच्चे नोड्स में बच्चे हैं, इन बच्चों के नोड्स में से एक का सशर्त वितरण ग्राफ में अन्य सभी नोड्स को इन दूसरे स्तर के बच्चों के वितरण को ध्यान में रखना होगा। विशेष रूप से, परिणामी सशर्त वितरण संयुक्त वितरण के एक उत्पाद के समानुपाती होगा जैसा कि ऊपर परिभाषित किया गया है, और सभी बच्चे नोड्स के सशर्त वितरण उनके माता-पिता को दिए गए हैं (लेकिन अपने स्वयं के बच्चों को नहीं दिए गए हैं)। यह इस तथ्य से अनुसरण करता है कि पूर्ण सशर्त वितरण संयुक्त वितरण के समानुपाती होता है। यदि ढह गए नोड्स के बच्चे के नोड्स [[निरंतर वितरण|निरंतर]] हैं, तो यह वितरण आम तौर पर एक ज्ञात रूप का नहीं होगा, और इस तथ्य के बावजूद प्रतिदर्श बनाना मुश्किल हो सकता है तथा गैर-ज्ञात यौगिक वितरणों के लिए ऊपर वर्णित समान कारणों से एक बंद रूप लिखा जा सकता है। हालाँकि, विशेष स्थिति में कि बच्चे के नोड [[असतत वितरण|असतत]] हैं, प्रतिदर्श संभव है, भले ही इन बच्चे के नोड के बच्चे निरंतर हों या असतत हों। वास्तव में, यहां सम्मिलित सिद्धांत को [[डिरिचलेट-बहुराष्ट्रीय वितरण]] पर लेख में उचित विवरण में वर्णित किया गया है। | ऐसे स्थिति में जहां ढह गए नोड्स के बच्चे नोड्स में बच्चे हैं, इन बच्चों के नोड्स में से एक का सशर्त वितरण ग्राफ में अन्य सभी नोड्स को इन दूसरे स्तर के बच्चों के वितरण को ध्यान में रखना होगा। विशेष रूप से, परिणामी सशर्त वितरण संयुक्त वितरण के एक उत्पाद के समानुपाती होगा जैसा कि ऊपर परिभाषित किया गया है, और सभी बच्चे नोड्स के सशर्त वितरण उनके माता-पिता को दिए गए हैं (लेकिन अपने स्वयं के बच्चों को नहीं दिए गए हैं)। यह इस तथ्य से अनुसरण करता है कि पूर्ण सशर्त वितरण संयुक्त वितरण के समानुपाती होता है। यदि ढह गए नोड्स के बच्चे के नोड्स [[निरंतर वितरण|निरंतर]] हैं, तो यह वितरण आम तौर पर एक ज्ञात रूप का नहीं होगा, और इस तथ्य के बावजूद प्रतिदर्श बनाना मुश्किल हो सकता है तथा गैर-ज्ञात यौगिक वितरणों के लिए ऊपर वर्णित समान कारणों से एक बंद रूप लिखा जा सकता है। हालाँकि, विशेष स्थिति में कि बच्चे के नोड [[असतत वितरण|असतत]] हैं, प्रतिदर्श संभव है, भले ही इन बच्चे के नोड के बच्चे निरंतर हों या असतत हों। वास्तव में, यहां सम्मिलित सिद्धांत को [[डिरिचलेट-बहुराष्ट्रीय वितरण]] पर लेख में उचित विवरण में वर्णित किया गया है। | ||
=== आदेशित अतिश्रांति के साथ गिब्स | === आदेशित अतिश्रांति के साथ गिब्स प्रतिदर्शित्र === | ||
* आदेशित अतिश्रांति के साथ एक गिब्स | * आदेशित अतिश्रांति के साथ एक गिब्स प्रतिदर्शित्र किसी भी चरण में <math>x_j^{(i)}</math> के लिए दिए गए विषम संख्या के उम्मीदवार मूल्यों का प्रतिदर्श लेता है और कुछ अच्छी तरह से परिभाषित क्रम के अनुसार <math>x_j^{(i-1)}</math> के लिए एकल मान के साथ उन्हें वर्गीकृत करता है। यदि <math>x_j^{(i-1)}</math> क्रमबद्ध सूची में s<sup>वां</sup> सबसे छोटा है तो <math>x_j^{(i)}</math> को क्रमबद्ध सूची में s<sup>वां</sup> सबसे बड़ा चुना गया है। क्रमबद्ध सूची में सबसे बड़ा। अधिक जानकारी के लिए, नील (1995) देखें।<ref>{{cite techreport | ||
| first = Radford M. | | first = Radford M. | ||
| last = Neal | | last = Neal | ||
Line 196: | Line 196: | ||
}}</ref> | }}</ref> | ||
=== अन्य विस्तारण === | === अन्य विस्तारण === | ||
गिब्स | गिब्स प्रतिदर्शी को विभिन्न तरीकों से विस्तारित करना भी संभव है। उदाहरण के लिए, चरो की स्थिति में जिनके सशर्त वितरण से प्रतिदर्श लेना आसान नहीं है, [[अंशअ प्रतिचयन|अंशअ]] प्रतिदर्शी या [[मेट्रोपोलिस-हेस्टिंग्स कलन विधि]] का एक एकल पुनरावृत्ति प्रश्न में चरो से प्रतिदर्श लेने के लिए उपयोग किया जा सकता है। उन चरों को सम्मिलित करना भी संभव है जो [[यादृच्छिक चर]] नहीं हैं, लेकिन जिनका मान [[निश्चित]] रूप से अन्य चरों से गणना किया जाता है। [[सामान्यीकृत रैखिक मॉडल|सामान्यीकृत रैखिक प्रारूप]], उदा, [[रसद प्रतिगमन]] (उर्फ [[अधिकतम एन्ट्रापी वर्गीकारक|अधिकतम एन्ट्रापी]] प्रारूप), इस कार्य प्रणाली में सम्मिलित किया जा सकता है। (बीयूजीएस, उदाहरण के लिए, प्रारूप के इस प्रकार के मिश्रण की अनुमति देता है।) | ||
== विफलता मोड == | == विफलता मोड == | ||
गिब्स | गिब्स प्रतिदर्शी दो तरीकों से विफल हो सकता है। पहला तब होता है जब उच्च-क्षमता वाली स्थितियों के द्वीप होते हैं, जिनके बीच कोई रास्ता नहीं होता है। उदाहरण के लिए, 2-बिट सदिशों पर प्रायिकता वितरण पर विचार करें, जहाँ सदिशों (0,0) और (1,1) प्रत्येक की प्रायिकता ½ है, लेकिन अन्य दो सदिशों (0,1) और (1,0) की प्रायिकता शून्य है। गिब्स प्रतिदर्शी दो उच्च संभावना वाले सदिशों में से एक में प्रगृहीत हो जाएगा, और दूसरे तक कभी नहीं पहुंचेगा। अधिक आम तौर पर, उच्च-आयामी, वास्तविक-मूल्य वाले सदिश पर किसी भी वितरण के लिए, यदि सदिश के दो विशेष तत्व पूरी तरह से सहसंबद्ध (या पूरी तरह से विरोधी-सहसंबंध) हैं, तो वे दो तत्व अटक जाएंगे, और गिब्स प्रतिदर्शी उन्हें कभी भी बदलने में सक्षम नहीं होगा। | ||
दूसरी समस्या तब भी हो सकती है जब सभी अवस्थाओ में संभावना शून्य न हो और उच्च संभावना वाले राज्यों का केवल एक ही द्वीप हो। उदाहरण के लिए, 100-बिट सदिशों पर प्रायिकता वितरण पर विचार करें, जहां सभी शून्य सदिश संभाव्यता ½ के साथ होता है, और अन्य सभी सदिश समान रूप से संभावित हैं, और इसलिए प्रत्येक की प्रायिकता <math>\frac{1}{2(2^{100}-1)}</math> है। यदि आप शून्य सदिश की प्रायिकता का अनुमान लगाना चाहते हैं, तो सही वितरण से 100 या 1000 प्रतिदर्श लेना पर्याप्त होगा। यह लगभग ½ के करीब उत्तर देने की संभावना है। लेकिन समान परिणाम प्राप्त करने के लिए आपको संभवतः गिब्स प्रतिदर्श से <math>2^{100}</math> से अधिक प्रतिदर्श लेने होंगे। कोई भी कंप्यूटर जीवन भर ऐसा नहीं कर सकता था। | दूसरी समस्या तब भी हो सकती है जब सभी अवस्थाओ में संभावना शून्य न हो और उच्च संभावना वाले राज्यों का केवल एक ही द्वीप हो। उदाहरण के लिए, 100-बिट सदिशों पर प्रायिकता वितरण पर विचार करें, जहां सभी शून्य सदिश संभाव्यता ½ के साथ होता है, और अन्य सभी सदिश समान रूप से संभावित हैं, और इसलिए प्रत्येक की प्रायिकता <math>\frac{1}{2(2^{100}-1)}</math> है। यदि आप शून्य सदिश की प्रायिकता का अनुमान लगाना चाहते हैं, तो सही वितरण से 100 या 1000 प्रतिदर्श लेना पर्याप्त होगा। यह लगभग ½ के करीब उत्तर देने की संभावना है। लेकिन समान परिणाम प्राप्त करने के लिए आपको संभवतः गिब्स प्रतिदर्श से <math>2^{100}</math> से अधिक प्रतिदर्श लेने होंगे। कोई भी कंप्यूटर जीवन भर ऐसा नहीं कर सकता था। | ||
यह समस्या तब होती है जब बर्न-इन अवधि कितनी भी लंबी हो। ऐसा इसलिए है क्योंकि सही वितरण में, शून्य सदिश आधा समय होता है, और उन घटनाओं को गैर-शून्य सदिशो के साथ यादृच्छिक रूप से मिश्रित किया जाता है। यहां तक कि एक छोटा सा प्रतिदर्श भी शून्य और अशून्य दोनों सदिशों को देखेगा। लेकिन गिब्स | यह समस्या तब होती है जब बर्न-इन अवधि कितनी भी लंबी हो। ऐसा इसलिए है क्योंकि सही वितरण में, शून्य सदिश आधा समय होता है, और उन घटनाओं को गैर-शून्य सदिशो के साथ यादृच्छिक रूप से मिश्रित किया जाता है। यहां तक कि एक छोटा सा प्रतिदर्श भी शून्य और अशून्य दोनों सदिशों को देखेगा। लेकिन गिब्स प्रतिदर्शी लंबी अवधि के लिए केवल शून्य सदिश (लगभग <math>2^{99}</math> एक पंक्ति में) को वापस करने के बीच वैकल्पिक होगा, फिर लंबी अवधि के लिए केवल गैर शून्य सदिश (लगभग <math>2^{99}</math> एक पंक्ति में )को वापस करने के बीच वैकल्पिक होगा। इस प्रकार सही वितरण के लिए अभिसरण बेहद धीमा है, जिसके लिए <math>2^{99}</math> चरणों से अधिक की आवश्यकता होती है, उचित समय अवधि में इतने सारे कदम उठाना अभिकलनीय रूप से संभव नहीं है। यहाँ धीमे अभिसरण को [[आयामीता के अभिशाप]] के परिणाम के रूप में देखा जा सकता है। | ||
इस तरह की समस्या को एक बार में पूरे 100-बिट सदिश को ब्लॉक | इस तरह की समस्या को एक बार में पूरे 100-बिट सदिश को ब्लॉक प्रतिदर्शी द्वारा हल किया जा सकता है। (यह मानता है कि 100-बिट सदिश चर के एक बड़े सेट का हिस्सा है। यदि यह सदिश केवल एक चीज है जिसका प्रतिदर्श लिया जा रहा है, तो ब्लॉक प्रतिदर्शी गिब्स प्रतिदर्शी बिल्कुल नहीं करने के बराबर है, जो परिकल्पना द्वारा कठिन होगा।) | ||
== सॉफ्टवेयर == | == सॉफ्टवेयर == | ||
* [[OpenBUGS|ओपनबग्स]] सॉफ़्टवेयर (गिब्स | * [[OpenBUGS|ओपनबग्स]] सॉफ़्टवेयर (गिब्स प्रतिदर्शी का उपयोग करके बायेसियन अनुमान) [[मार्कोव श्रृंखला मोंटे कार्लो]] का उपयोग करके जटिल सांख्यिकीय प्रारूप का [[बायेसियन विश्लेषण]] करता है। | ||
* [[जेएजीएस]] ([[बस एक और गिब्स नमूना|बस एक और गिब्स | * [[जेएजीएस]] ([[बस एक और गिब्स नमूना|बस एक और गिब्स प्रतिदर्शित्र]]) मार्कोव चेन मोंटे कार्लो का उपयोग करके बायेसियन पदानुक्रमित प्रारूप के विश्लेषण के लिए एक जीपीएल कार्यक्रम है। | ||
* संभाव्य कार्यक्रमों के रूप में निर्दिष्ट यादृच्छिक वितरण पर गिब्स अनुमान लगाने के लिए [[ चर्च (प्रोग्रामिंग भाषा) |चर्च]] मुफ्त सॉफ्टवेयर है। | * संभाव्य कार्यक्रमों के रूप में निर्दिष्ट यादृच्छिक वितरण पर गिब्स अनुमान लगाने के लिए [[ चर्च (प्रोग्रामिंग भाषा) |चर्च]] मुफ्त सॉफ्टवेयर है। |
Revision as of 12:18, 14 June 2023
Part of a series on |
Bayesian statistics |
---|
![]() |
Posterior = Likelihood × Prior ÷ Evidence |
Background |
Model building |
Posterior approximation |
Estimators |
Evidence approximation |
Model evaluation |
|
आंकड़ों में, गिब्स प्रतिदर्शी या गिब्स प्रतिदर्शित्र एक मार्कोव शृंखला मोंटे कार्लो (एमसीएमसी)कलन विधि है, जो अवलोकनों का एक क्रम प्राप्त करने के लिए होती है, तथा जो तब एक निर्दिष्ट बहुभिन्नरूपी संभाव्यता वितरण से अनुमानित होती है, जब प्रत्यक्ष प्रतिदर्शी कठिन होता है। इस अनुक्रम का उपयोग संयुक्त वितरण को अनुमानित करने के लिए किया जा सकता है (उदाहरण के लिए, वितरण का आयत चित्र उत्पन्न करने के लिए), किसी एक चर, या चर के कुछ उपसमुच्चय (उदाहरण के लिए, अज्ञात प्राचल या अंतर्निहित चर) के सीमांत वितरण का अनुमान लगाने के लिए, या एक अभिन्न की गणना करने के लिए (जैसे चर में से एक का प्रत्याशित मान)। आमतौर पर, कुछ चर उन टिप्पणियों के अनुरूप होते हैं जिनके मान ज्ञात होते हैं, और इसलिए उन्हें प्रतिदर्श लेने की आवश्यकता नहीं होती है।
गिब्स प्रतिदर्शी आमतौर पर सांख्यिकीय अनुमिती यानी विशेष रूप से बेजअनुमिति के साधन के रूप में प्रयोग किया जाता है। यह एक यादृच्छिक कलन विधि है (अर्थात एक कलन विधि जो यादृच्छिक संख्याओं का उपयोग करता है), और अपेक्षा-अधिकतमकरण कलन विधि (ईएम) जैसे सांख्यिकीय अनुमिती के लिए नियतात्मक कलन विधि का एक विकल्प है।
अन्य एमसीएमसी कलन विधि के साथ, गिब्स प्रतिदर्शी प्रतिदर्श की मार्कोव श्रृंखला उत्पन्न करता है, जिनमें से प्रत्येक पास के प्रतिदर्श से सहसंबंधित है। नतीजतन, अगर स्वतंत्र प्रतिदर्श वांछित हैं तो देखभाल की जानी चाहिए। आम तौर पर, श्रृंखला की शुरुआत ("अमिट होने की अवधि") से प्रतिदर्श वांछित वितरण का सटीक रूप से प्रतिनिधित्व नहीं कर सकते हैं और आमतौर पर पदच्युत कर दिए जाते हैं।
परिचय
प्रतिदर्शी कलन विधि और सांख्यिकीय भौतिकी के बीच समानता के संदर्भ में, गिब्स प्रतिदर्शी का नाम भौतिक विज्ञानी जोशियाह विलार्ड गिब्स के नाम पर रखा गया है। गिब्स की मृत्यु के लगभग आठ दशक बाद 1984 में दो भाइयों स्टुअर्ट जेमन और डोनाल्ड जेमन द्वारा कलन विधि का वर्णन किया गया था।[1] और सीमांत प्रायिकता वितरण, विशेष रूप से पश्च वितरण की गणना के लिए सांख्यिकी समुदाय में लोकप्रिय हो गया।[2]
अपने मूल संस्करण में, गिब्स प्रतिदर्शी मेट्रोपोलिस-हेस्टिंग्स कलन विधि की एक विशेष स्थिति है। हालांकि, इसके विस्तारित संस्करणों (नीचे देखें) में, इसे प्रत्येक चर (या कुछ स्थितयो में, चर के प्रत्येक समूह) को बदले में प्रतिचयित करके चर के एक बड़े सेट से प्रतिदर्श के लिए एक सामान्य रूपरेखा माना जा सकता है, और प्रतिदर्शी के एक या अधिक चरणों को लागू करने के लिए मेट्रोपोलिस-हेस्टिंग्स कलन विधि (या अंशअ प्रतिदर्शी जैसी विधियाँ) को सम्मिलित कर सकते हैं।
गिब्स प्रतिदर्शी तब लागू होता है जब संयुक्त वितरण स्पष्ट रूप से ज्ञात नहीं होता है या प्रत्यक्ष रूप से प्रतिदर्श लेना मुश्किल होता है, लेकिन प्रत्येक चर का सशर्त वितरण ज्ञात होता है और प्रतिदर्श के लिए आसान (या कम से कम, आसान) होता है। गिब्स प्रतिदर्शी कलन विधि बदले में प्रत्येक चर के वितरण से एक अन्य चर के वर्तमान मूल्यों पर सशर्त उदाहरण उत्पन्न करता है। यह दिखाया जा सकता है किप्रतिदर्शो का अनुक्रम एक मार्कोव श्रृंखला का गठन करता है, और उस मार्कोव श्रृंखला का स्थिर वितरण केवल वांछित संयुक्त वितरण है।[3]
गिब्स प्रतिदर्शी विशेष रूप से बायेसियन नेटवर्क के पश्च वितरण के प्रतिदर्श के लिए अनुकूलित है, क्योंकि बायेसियन नेटवर्क आमतौर पर सशर्त वितरण के संग्रह के रूप में निर्दिष्ट होते हैं।
कार्यान्वयन
गिब्स प्रतिचयन, अपने मूल अवतार में, मेट्रोपोलिस-हेस्टिंग्स कलन विधि की एक विशेष स्थिति है। गिब्स प्रतिदर्शी का मुद्दा यह है कि एक बहुचर वितरण को देखते हुए एक संयुक्त वितरण पर एकीकृत करके सीमांत वितरण की तुलना में एक सशर्त वितरण से प्रतिदर्श लेना आसान है। मान लीजिए हम एक संयुक्त वितरण से के प्रतिदर्श प्राप्त करना चाहते हैं। वें प्रतिदर्श को से निरूपित करें। हम निम्नानुसार आगे बढ़ते हैं,
- हम कुछ प्रारंभिक मान से शुरू करते हैं।
- हम अगला प्रतिदर्श चाहते हैं। इस अगले प्रतिदर्श को कहते है। चूँकि एक सदिश है, हम सदिश के प्रत्येक घटक का प्रतिदर्श लेते हैं, उस घटक के वितरण से जो अब तक प्रतिदर्श लिए गए वो अन्य सभी घटकों पर सशर्त है। लेकिन यहां एक कैच है, हम , घटकों पर तक प्रतिबंध लगाते हैं, और उसके बाद के घटकों पर से तक प्रतिबंध लगाते हैं। इसे प्राप्त करने के लिए, हम पहले घटक से शुरू करते हुए, क्रम में घटकों का प्रतिदर्श लेते हैं। अधिक औपचारिक रूप से, प्रतिदर्श लेने के लिए, हम द्वारा निर्दिष्ट वितरण के अनुसार इसे अद्यतन करते हैं।
- हम वें प्रतिदर्श में वें घटक के मान का उपयोग करते हैं, न किवें प्रतिदर्श का।
- उपरोक्त चरण को बार दोहराएं ।
गुण
यदि इस तरह का प्रतिदर्श लिया जाता है, तो ये महत्वपूर्ण तथ्य हैं,
- प्रतिदर्श सभी चरों के संयुक्त वितरण का अनुमान लगाते हैं।
- चर के किसी भी उपसमुच्चय के सीमांत वितरण को चर के उस उपसमुच्चय केप्रतिदर्शो पर विचार करके अनुमानित किया जा सकता है, शेष को अनदेखा कर सकते हैं।
- किसी भी चर के प्रत्याशित मान को सभीप्रतिदर्शो के औसत से अनुमानित किया जा सकता है।
प्रतिदर्शी करते समय,
- चर के प्रारंभिक मूल्यों को बेतरतीब ढंग से या कुछ अन्य कलन विधि जैसे कि अपेक्षा-अधिकतमकरण द्वारा निर्धारित किया जा सकता है।
- पहले चर के प्रतिदर्श के लिए प्रारंभिक मान निर्धारित करना वास्तव में आवश्यक नहीं है।
- शुरुआत (तथाकथित अमिट होने की अवधि) में कुछप्रतिदर्शो की संख्या को अनदेखा करना सामान्य बात है, और फिर केवल प्रत्येक वें प्रतिदर्श पर विचार करें जब एक अपेक्षा की गणना करने के लिए मूल्यों का औसत निकाला जाता है। उदाहरण के लिए, पहले 1,000प्रतिदर्शो को नजरअंदाज किया जा सकता है, और फिर हर 100वें प्रतिदर्श का औसत निकाला जाता है, बाकी सभी को निकाल दिया जाता है। इसका कारण यह है कि (1) मार्कोव श्रृंखला का स्थिर वितरण चरों पर वांछित संयुक्त वितरण है, लेकिन उस स्थिर वितरण तक पहुंचने में कुछ समय लग सकता है, (2) क्रमिक प्रतिदर्श एक दूसरे से स्वतंत्र नहीं होते हैं लेकिन कुछ मात्रा में सहसंबंध के साथ एक मार्कोव श्रृंखला बनाते हैं। कभी-कभी, कलन विधि का उपयोगप्रतिदर्शो के बीच स्वसंबंध की मात्रा और इससे गणना की गई (सैम्पल के बीच की अवधि जो वास्तव में उपयोग की जाती है) के मान को निर्धारित करने के लिए किया जा सकता है, लेकिन व्यवहार में इसमें उचित मात्रा में अनिष्टकारी या काला जादू सम्मिलित होता है।
- प्रतिदर्शी प्रक्रिया के शुरुआती भाग में यादृच्छिक भ्रमण व्यवहार को कम करने के लिए अनुकारित अनीलन की प्रक्रिया का उपयोग अक्सर किया जाता है (यानी प्रतिदर्श समष्टि के चारों ओर धीरे-धीरे घूमने की प्रवृत्ति, प्रतिदर्शो के बीच उच्च मात्रा में स्वतः सहसंबंध की उच्च मात्रा के साथ, वांछित के रूप में जल्दी से घूमने की बजाय)। अन्य तकनीकें जो स्वत:सहसंबंध को कम कर सकती हैं, उन्हें गिब्स प्रतिचयन, अवरुद्ध गिब्स प्रतिचयन, और अतिविश्राम में सुव्यवस्थित किया गया है, नीचे देखें।
सशर्त वितरण और संयुक्त वितरण का संबंध
इसके अलावा, अन्य सभी दिए गए एक चर का सशर्त वितरण संयुक्त वितरण के समानुपाती होता है,
इस स्थिति में समानुपाती का अर्थ है कि भाजक का फलन नहीं है और इस प्रकार के सभी मानों के लिए समान है, यह पर वितरण के लिए सामान्यीकरण स्थिरांक का हिस्सा बनता है। व्यवहार में, एक कारक के सशर्त वितरण की प्रकृति का निर्धारण करने के लिए, चर पर आलेखीय प्रतिरूप द्वारा परिभाषित व्यक्तिगत सशर्त वितरण के अनुसार संयुक्त वितरण को कारक बनाना सबसे आसान है, उन सभी कारकों को अनदेखा करें जो के फलन नहीं हैं, (जिनमें से सभी, उपरोक्त भाजक के साथ मिलकर सामान्यीकरण स्थिरांक का निर्माण करते हैं), और फिर आवश्यकतानुसार सामान्यीकरण स्थिरांक को अंत में पुनर्स्थापित करते हैं। व्यवहार में, इसका मतलब तीन चीजों में से एक करना है,
- यदि वितरण असतत है, तो के सभी संभावित मानों की अलग-अलग संभावनाओं की गणना की जाती है, और फिर सामान्यीकरण स्थिरांक खोजने के लिए योग किया जाता है।
- यदि वितरण निरंतर है और ज्ञात रूप का है, तो सामान्यीकरण स्थिरांक भी ज्ञात होगा।
- अन्य स्थितियों में, सामान्यीकरण स्थिरांक को आमतौर पर अनदेखा किया जा सकता है, क्योंकि अधिकांश प्रतिदर्शी विधियों को इसकी आवश्यकता नहीं होती है।
निष्कर्ष
गिब्स प्रतिदर्शी आमतौर पर सांख्यिकीय अनुमिती के लिए उपयोग किया जाता है (उदाहरण के लिए पैरामीटर का सर्वोत्तम मूल्य निर्धारित करना, जैसे कि किसी विशेष स्टोर पर किसी विशेष स्टोर पर खरीदारी करने वाले लोगों की संख्या का निर्धारण करना, तथा वह उम्मीदवार जिसे मतदाता सबसे अधिक वोट देगा, मतदाताओ की संख्या का निर्धारण करना, आदि)। विचार यह है कि देखे गए डेटा के प्रत्येक टुकड़े के लिए अलग-अलग चर बनाकर और उन चरों से प्रतिदर्श लेने के बजाय, उनके देखे गए मूल्यों के लिए चर को ठीक करके प्रतिदर्शी प्रक्रिया में सम्मिलित किया गया है। शेष चरों का वितरण प्रभावी रूप से प्रेक्षित डेटा पर वातानुकूलित पश्च वितरण है।
एक वांछित पैरामीटर (मोड) का सबसे संभावित मूल्य तब केवल उस प्रतिदर्श मान को चुनकर चयनित किया जा सकता है जो आमतौर पर सबसे अधिक होता है, यह अनिवार्य रूप से एक पैरामीटर के अधिकतम पश्चात के अनुमान के बराबर है। (चूंकि पैरामीटर आमतौर पर निरंतर होते हैं, इसलिए मोड का एक सार्थक अनुमान प्राप्त करने के लिए प्रतिचयित मानों को परिमित संख्या में से किसी एक श्रेणी या "बिन" में "बिन" करना अक्सर आवश्यक होता है।) अधिक सामान्यतः, हालांकि, प्रतिदर्श मूल्यों का अपेक्षित मूल्य (माध्य या औसत) चुना जाता है, यह एक बेयस अनुमानक है जो पूरे वितरण के बारे में अतिरिक्त डेटा का लाभ उठाता है जो कि बायेसियन प्रतिदर्शी से उपलब्ध है, जबकिअपेक्षा अधिकतमकरण (ईएम) जैसे अधिकतमकरण कलन विधि वितरण से केवल एक बिंदु वापस करने में सक्षम है। उदाहरण के लिए, एक असमान वितरण के लिए माध्य (अपेक्षित मान) आमतौर पर मोड (सबसे सामान्य मान) के समान होता है, लेकिन यदि वितरण एक दिशा में विषमतलीय है, तो माध्य उस दिशा चला जाएगा, जो उस दिशा में अतिरिक्त संभावना द्रव्यमान के लिए प्रभावी रूप से जिम्मेदार है। (यदि कोई वितरण बहुविध है, तो अपेक्षित मान सार्थक बिंदु नहीं लौटा सकता है, और कोई भी मोड आमतौर पर बेहतर विकल्प होता है।)
हालाँकि कुछ चर सामान्य तौर पर रुचि के मापदंडों के अनुरूप होते हैं, अन्य चर के बीच संबंधों को ठीक से व्यक्त करने के लिए प्रतिरूप में पेश किए गए अरुचिकर (उपद्रव) चर हैं। हालांकि प्रतिदर्श मूल्य सभी चर पर संयुक्त वितरण का प्रतिनिधित्व करते हैं, तथा अपेक्षित मूल्यों या मोड की गणना करते समय उपद्रव चर को आसानी से अनदेखा किया जा सकता है, यह उपद्रव चर पर सीमांत वितरण के बराबर है। जब एकाधिक चर के लिए एक मान वांछित होता है, तो अपेक्षित मान की गणना प्रत्येक चर पर अलग से की जाती है। (मोड की गणना करते समय, हालांकि, सभी चरों को एक साथ माना जाना चाहिए।)
पर्यवेक्षित अध्ययन, अनियंत्रित शिक्षा और अर्ध-पर्यवेक्षित शिक्षा (विलुप्त मूल्यों के साथ सीखना) सभी को उन सभी चरो के मानों को ठीक करके नियंत्रित किया जा सकता है, जिनके मूल्य ज्ञात हैं, और जो शेष प्रतिदर्श देते है।
अवलोकन किए गए डेटा के लिए, प्रत्येक अवलोकन के लिए एक चर होगा- उदाहरण के लिए, अवलोकन के एक सेट के प्रतिदर्श माध्य या प्रतिदर्श प्रसरण के अनुरूप एक चर। वास्तव में, आम तौर पर प्रतिदर्श माध्य या प्रतिदर्श प्रसरण जैसी अवधारणाओं के अनुरूप कोई भी चर नहीं होगा। इसके बजाय, ऐसी स्थिति में अज्ञात वास्तविक माध्य और वास्तविक प्रसरण का प्रतिनिधित्व करने वाले चर होंगे, और इन चरों के लिए प्रतिदर्श मानों का निर्धारण स्वचालित रूप से गिब्स प्रतिदर्शित्र के संचालन से होता है।
सामान्यीकृत रैखिक प्रतिरूप (यानी रैखिक प्रतिगमन की विविधताएं) कभी-कभी गिब्स प्रतिदर्शी द्वारा भी नियंत्रित किए जा सकते हैं। उदाहरण के लिए, दिए गए द्विआधारी (हां/नहीं) विकल्प की संभावना निर्धारित करने के लिए प्रोबिट प्रतिगमन, सामान्य वितरण पुरोहितों को साथ समाश्रयण गुणांकों पर रखा जाता है, तथा इसे गिब्स प्रतिदर्शी के साथ लागू किया जा सकता है क्योंकि अतिरिक्त चर को जोड़ना और संयुग्मन का लाभ उठाना संभव है। हालाँकि,संभार तन्त्र परावर्तन को इस तरह से संभाला नहीं जा सकता है। एक संभावना सामान्य वितरण के मिश्रण (आमतौर पर 7-9) के साथ तार्किक फलन को अनुमानित करना है। अधिक सामान्यतः, गिब्स प्रतिदर्श के बजाय मेट्रोपोलिस-हेस्टिंग्स का उपयोग किया जाता है।
गणितीय पृष्ठभूमि
मान लीजिए कि एक प्रतिदर्श वितरण से लिया गया है जो पूर्व वितरण के साथ लंबाई के पैरामीटर सदिश पर निर्भर करता है। यह हो सकता है कि बहुत बड़ा है और के सीमांत घनत्वों को खोजने के लिए एकीकरण अभिकलनीयत रूप से महंगा होगा। फिर इन दो चरणों को दोहराते हुए सीमांत घनत्व की गणना करने का एक वैकल्पिक तरीका अंतरिक्ष पर एक मार्कोव श्रृंखला बनाना है,
- एक यादृच्छिक सूचकांक चुनें
- के अनुसार के लिए एक नया मान चुनें
ये चरण वांछित अपरिवर्तनीय वितरण के साथ एक मार्कोव श्रृंखला को परिभाषित करते हैं । इसे इस प्रकार सिद्ध किया जा सकता है। को परिभाषित करें यदि सभी के लिए और मान लें कि से तक छलांग लगाने की संभावना को दर्शाता है। फिर, संक्रमण प्रायिकता
हैं अतः
चूँकि एक तुल्यता संबंध है। इस प्रकार विस्तृत संतुलन समीकरण संतुष्ट हैं, जिसका अर्थ है कि श्रृंखला प्रतिवर्ती है और इसमें अपरिवर्तनीय वितरण है।
व्यवहार में, अनुक्रमित को यादृच्छिक रूप से नहीं चुना जाता है, और अनुक्रमित के माध्यम से श्रृंखला चक्र क्रम में होती है। सामान्य तौर पर यह एक गैर-स्थिर मार्कोव प्रक्रिया देता है, लेकिन प्रत्येक व्यक्तिगत चरण अभी भी प्रतिवर्ती होगा, और समग्र प्रक्रिया में अभी भी वांछित स्थिर वितरण होगा (जब तक कि श्रृंखला निश्चित क्रम के तहत सभी अवस्थाओ तक पहुंच सकती है)।
बायेसियन अनुमान में गिब्स प्रतिदर्शित्र और सूचना सिद्धांत के संबंध
मान लीजिए प्रतिदर्शी वितरण से उत्पन्न टिप्पणियों को निरूपित करता है तब और प्राचल समष्टि पर पूर्व समर्थित हैं। फिर बायेसियन आँकड़ों के केंद्रीय लक्ष्यों में से एक पश्च घनत्व
का अनुमान लगाना है जहां सीमांत संभावना को सभी के लिए परिमित माना जाता है।
गिब्स प्रतिदर्शित्र की व्याख्या करने के लिए, हम अतिरिक्त रूप से मान लेते हैं कि पैरामीटर स्पेस रूप में विघटित हो जाता है
- ,
कहाँ कार्तीय गुणनफल को प्रदर्शित करता है। प्रत्येक घटक प्राचल समष्टि अदिश घटकों, उपसदिश या मैट्रिसेस का एक सेट हो सकता है।
एक समुच्चय को परिभाषित करें जो को पूरा करता है। गिब्स प्रतिदर्शित्र की आवश्यक सामग्री प्रत्येक
- के लिए -वाँ पूर्ण सशर्त पश्च वितरण है
![](https://upload.wikimedia.org/wikipedia/commons/thumb/3/37/Gibbs_sampler_picture.jpg/500px-Gibbs_sampler_picture.jpg)
![](https://upload.wikimedia.org/wikipedia/commons/thumb/6/62/Gibbs_sampling_info_eq.jpg/500px-Gibbs_sampling_info_eq.jpg)
निम्नलिखित कलन विधि एक सामान्य गिब्स प्रतिदर्शित्र का विवरण देता है:
ध्यान दें कि गिब्स प्रतिदर्शित्र एक चक्र के भीतर पुनरावृत्त मोंटे कार्लो योजना द्वारा संचालित होता है। उपरोक्त कलन विधि द्वारा तैयार किए गए प्रतिदर्शो की संख्या लक्ष्य घनत्व होने के लिए अपरिवर्तनीय वितरण के साथ मार्कोव शृंखला तैयार करती है।
अब, प्रत्येक , के लिए निम्नलिखित सूचना सैद्धांतिक मात्राओ को परिभाषित करें,
अर्थात्, क्रमशः पश्च पारस्परिक सूचना, पश्च अंतर एन्ट्रापी, और पश्च सशर्त अंतर एन्ट्रापी, । हम इसी प्रकार परिभाषित मात्राओं में और को बदलकर सूचना सिद्धांतिक मात्राओं , , और को परिभाषित कर सकते हैं। फिर, निम्नलिखित समीकरण लागू होता हैं।[4]
.
पारस्परिक सूचना यादृच्छिक मात्रा की अनिश्चितता में कमी की मात्रा निर्धारित करती है, जब हम , का अनुमान लगाते हैं। यह गायब हो जाता है अगर केवल और आंशिक रूप से स्वतंत्र हैं, और केवल अनुमान लगाते हैं। पारस्परिक सूचना की व्याख्या उस मात्रा के रूप में की जा सकती है जो गिब्स प्रतिदर्शित्र के एकल चक्र के भीतर -वें चरण से चरण तक प्रेषित होती है।
विविधता और विस्तार
बुनियादी गिब्स प्रतिदर्शित्र के कई रूप मौजूद हैं। इन विविधताओं का लक्ष्य किसी भी अतिरिक्त संगणनात्मक लागतों को दूर करने के लिए पर्याप्त रूप से प्रतिदर्शो के बीच स्वत: संबंध को कम करना है।
अवरुद्ध गिब्स प्रतिदर्शित्र
- एक अवरुद्ध गिब्स प्रतिदर्शित्र दो या दो से अधिक चरों को एक साथ समूहित करता है और उनके संयुक्त वितरण से प्रतिदर्श अलग-अलग प्रत्येक से प्रतिदर्श लेने के बजाय अन्य सभी चरों पर सशर्त होता है। उदाहरण के लिए, एक छिपे हुआ मार्कोव प्रारूप में, एक अवरुद्ध गिब्स प्रतिदर्शित्र अग्र पश्च कलन विधि का उपयोग करके मार्कोव श्रृंखला बनाने वाले सभी अव्यक्त चर से प्रतिदर्श ले सकता है।
संकुचित गिब्स प्रतिदर्शित्र
- किसी अन्य चर के लिए प्रतिदर्श लेते समय एक संकुचित गिब्स प्रतिदर्श एक या अधिक चर (सीमांत वितरण) को एकीकृत करता है। उदाहरण के लिए, कल्पना करें कि एक प्रारुप में तीन चर A, B और C होते हैं। एक साधारण गिब्स प्रतिदर्शित्र p(A | B,C), तब p(B | A ,C), फिर p(C | A,B) से प्रतिदर्श लेगा। एक संकुचित गिब्स प्रतिदर्शित्र A के लिए प्रतिदर्श चरण को सीमांत वितरण p(A | C) से लिए गए प्रतिदर्श से बदल सकता है, इस स्थिति में चर 'B को एकीकृत किया गया है। वैकल्पिक रूप से, चर B को पूरी तरह से संकुचित किया जा सकता है, वैकल्पिक रूप से p(A | C) और p(C | A) से प्रतिदर्श लिया जा सकता है और B पर बिल्कुल प्रतिदर्शी नहीं लिया जा सकता है। एक चर A पर वितरण जो मूल चर B के संकुचित होने पर उत्पन्न होता है, एक मिश्रित वितरण कहलाता है, इस वितरण से प्रतिदर्श आम तौर पर सुविधाजनक होता है जब 'B' 'A ' के लिए पूर्ववर्ती संयुग्म होता है, खासकर तब 'A' और 'B' घातीय परिवार के सदस्य होते हैं। अधिक जानकारी के लिए, यौगिक वितरण या लियू (1994) पर लेख देखें।[5]
एक संकुचित गिब्स प्रतिदर्शित्र को लागू करना
संकुचित डिरिक्ले वितरण
स्पष्ट चर के साथ पदानुक्रमित बायेसियन प्रारूप में, जैसे अव्यक्त डिरिचलेट आवंटन और प्राकृतिक भाषा प्रसंस्करण में उपयोग किए जाने वाले विभिन्न अन्य प्रारूप, डिरिचलेट वितरण को समाप्त करना काफी सामान्य है जो आमतौर पर श्रेणीबद्ध चर पर पूर्व वितरण के रूप में उपयोग किया जाता है। इस संकुचित का परिणाम किसी दिए गए डिरिचलेट पर निर्भर सभी स्पष्ट चर के बीच निर्भरता का परिचय देता है, और संकुचित के बाद इन चरों का संयुक्त वितरण एक डिरिचलेट-बहुराष्ट्रीय वितरण है। यदि संकुचित नहीं किया गया होता तो इस वितरण में दिए गए श्रेणीबद्ध चर का सशर्त वितरण, दूसरों पर वातानुकूलित, एक अत्यंत सरल रूप ग्रहण करता है जो गिब्स प्रतिदर्शी को और भी आसान बना देता है। नियम इस प्रकार हैं,
- एक डिरिचलेट पूर्व नोड को संकुचित करने से केवल पूर्व के माता-पिता और बच्चों के नोड प्रभावित होते हैं। चूंकि माता-पिता अक्सर स्थिर होते हैं, आमतौर पर केवल बच्चों के बारे में हमें चिंता करने की आवश्यकता होती है।
- क डिरिचलेट पूर्व को समाप्त करने से उस पूर्व पर निर्भर सभी स्पष्ट बच्चों के बीच निर्भरता का परिचय मिलता है - लेकिन किसी भी अन्य श्रेणीबद्ध बच्चों के बीच कोई अतिरिक्त निर्भरता नहीं होती है। (यह ध्यान रखना महत्वपूर्ण है, उदाहरण के लिए, जब एक ही हाइपरप्रियर से संबंधित कई डिरिचलेट पूर्ववर्ती होते हैं। प्रत्येक डिरिचलेट पूर्व को स्वतंत्र रूप से ध्वस्त किया जा सकता है और केवल इसके प्रत्यक्ष बच्चों को प्रभावित करता है।)
- ढहने के बाद, एक आश्रित बच्चों का दूसरों पर सशर्त वितरण एक बहुत ही सरल रूप धारण कर लेता है, किसी दिए गए मूल्य को देखने की संभावना इस मूल्य के लिए संबंधित हाइपरप्रियर के योग के समानुपाती होती है, और समान मान मानने वाले अन्य सभी आश्रित नोड्स की गिनती होती है। समान पूर्व पर निर्भर नहीं होने वाले नोड्स की गणना नहीं की जानी चाहिए। यही नियम अन्य पुनरावृत्त अनुमान विधियों जैसे परिवर्तन संबंधी बेज़ या अपेक्षा अधिकतमीकरण में भी लागू होता है, हालाँकि, यदि विधि में आंशिक गणना रखना सम्मिलित है, तो विचाराधीन मान के लिए आंशिक गणना को अन्य सभी आश्रित नोड्स में सम्मिलित किया जाना चाहिए। कभी-कभी इस सारांशित आंशिक गणना को अपेक्षित गणना या समान कहा जाता है। संभाव्यता परिणामी मान के समानुपाती होती है, वास्तविक संभाव्यता को उन सभी संभावित मानों के सामान्यीकरण द्वारा निर्धारित किया जाना चाहिए जो श्रेणीबद्ध चर ले सकते हैं (अर्थात श्रेणीबद्ध चर के प्रत्येक संभावित मान के लिए परिकलित परिणाम जोड़ना, और इस योग से सभी परिकलित परिणामों को विभाजित करना)।
- यदि किसी दिए गए श्रेणीबद्ध नोड में आश्रित बच्चे (उदाहरण के लिए जब यह मिश्रण प्रारूप में एक अव्यक्त चर होता है) हैं, तो पिछले चरण (अपेक्षित गणना प्लस पूर्व, या जो कुछ भी गणना की जाती है) में गणना किए गए मान को वास्तविक सशर्त संभावनाओं (एक गणना मूल्य नहीं है जो संभावना के समानुपाती है!) से गुणा किया जाना चाहिए। विस्तृत चर्चा के लिए डिरिचलेट-बहुराष्ट्रीय बंटन पर लेख देखें।
- ऐसे स्थिति में जहां किसी दिए गए डिरिचलेट पूर्व पर निर्भर नोड्स की समूह सदस्यता कुछ अन्य चर के आधार पर गतिशील रूप से बदल सकती है (उदाहरण के लिए एक विषय प्रारूप के रूप में एक अन्य अव्यक्त श्रेणीबद्ध चर द्वारा अनुक्रमित एक श्रेणीबद्ध चर), वही अपेक्षित गणना की अभी भी गणना की जाती है, लेकिन सावधानी से करने की आवश्यकता है ताकि चरों का सही सेट सम्मिलित किया जा सके। विषय प्रारूप के संदर्भ सहित, अधिक चर्चा के लिए डिरिचलेट-बहुराष्ट्रीय वितरण पर लेख देखें।
अन्य संयुग्मी पुरोहितों का समाप्त होना
सामान्य तौर पर, किसी भी संयुग्म को पूर्व में ध्वस्त किया जा सकता है, यदि उसके एकमात्र बच्चों के वितरण संयुग्म हैं। यौगिक वितरण पर लेख में प्रासंगिक गणित पर चर्चा की गई है। यदि केवल एक चाइल्ड नोड है, तो परिणाम अक्सर एक ज्ञात वितरण मान लेगा। उदाहरण के लिए, एक एकल सामान्य वितरण बच्चे के साथ एक नेटवर्क से बाहर एक विपरीत गामा वितरित भिन्नता को ध्वस्त करने से छात्र का टी-वितरण प्राप्त होगा।। (उस स्थिति के लिए, एक एकल सामान्य वितरण बच्चे के माध्य और विचरण दोनों को ढहाने से अभी भी एक छात्र का टी-वितरण प्राप्त होगा, बशर्ते दोनों, यानी सामान्य वितरण माध्य, व्युत्क्रम-गामा विचरण संयुग्मित हों।)
यदि कई बच्चे नोड हैं, तो वे सभी निर्भर हो जाएंगे, जैसा कि डिरिचलेट-श्रेणीबद्ध स्थिति में है। परिणामी संयुक्त वितरण का एक बंद रूप होगा जो कुछ मायनों में यौगिक वितरण जैसा दिखता है, हालांकि इसमें प्रत्येक बच्चे के नोड के लिए एक कई कारकों का उत्पाद होगा।
इसके अलावा, और सबसे महत्वपूर्ण बात यह है कि अन्य (और ढह गए नोड के माता-पिता को भी दिया गया है, लेकिन चाइल्ड नोड्स के बच्चों को नहीं दिया गया है) दिए गए चाइल्ड नोड्स में से एक के परिणामी सशर्त वितरण में सभी शेष चाइल्ड नोड्स के पश्च पूर्वानुमानित वितरण के समान घनत्व होगा। इसके अलावा, पश्च पूर्वानुमानित वितरण में एकल नोड के मूल यौगिक वितरण के, विभिन्न मापदंडों के साथ समान घनत्व है। यौगिक वितरण पर लेख में सामान्य सूत्र दिया गया है।
उदाहरण के लिए, सशर्त रूप से स्वतंत्र समान रूप से वितरित गॉसियन वितरित नोड्स के एक सेट के साथ एक बेयस नेटवर्क दिया गया है जिसमें माध्य और विचरण पर संयुग्मित पूर्व वितरण हैं, माध्य और प्रसरण दोनों को संयोजित करने के बाद अन्य को दिए गए एक नोड का सशर्त वितरण एक छात्र का टी-वितरण होगा। इसी तरह, कई पॉसों वितरित नोड्स से पहले गामा को संयुक्तीकरण करने का परिणाम एक नोड के सशर्त वितरण का कारण बनता है, जो दूसरों को एक नकारात्मक द्विपद वितरण मानने के लिए दिया जाता है।
इन स्थितियों में जहां संयुक्तीकरण एक प्रसिद्ध वितरण का उत्पादन करता है, वहां कुशल प्रतिदर्शी प्रक्रियाएं अक्सर मौजूद होती हैं, और उनका उपयोग करना अक्सर (हालांकि जरूरी नहीं) ढहने से अधिक कुशल होगा, और इसके बजाय पूर्व और बच्चे दोनों नोड्स को अलग-अलग प्रतिदर्श लेना होगा। हालाँकि, ऐसे स्थिति में जहां यौगिक वितरण अच्छी तरह से ज्ञात नहीं है, इसका प्रतिदर्श लेना आसान नहीं हो सकता है, क्योंकि यह आम तौर पर घातीय परिवार से संबंधित नहीं होगा और आमतौर पर लॉग-अवतल नहीं होगा (जो अनुकूली अस्वीकृति प्रतिदर्शी का उपयोग करके प्रतिदर्श लेना आसान बना देगा, क्योंकि एक बंद रूप हमेशा मौजूद रहता है)।
ऐसे स्थिति में जहां ढह गए नोड्स के बच्चे नोड्स में बच्चे हैं, इन बच्चों के नोड्स में से एक का सशर्त वितरण ग्राफ में अन्य सभी नोड्स को इन दूसरे स्तर के बच्चों के वितरण को ध्यान में रखना होगा। विशेष रूप से, परिणामी सशर्त वितरण संयुक्त वितरण के एक उत्पाद के समानुपाती होगा जैसा कि ऊपर परिभाषित किया गया है, और सभी बच्चे नोड्स के सशर्त वितरण उनके माता-पिता को दिए गए हैं (लेकिन अपने स्वयं के बच्चों को नहीं दिए गए हैं)। यह इस तथ्य से अनुसरण करता है कि पूर्ण सशर्त वितरण संयुक्त वितरण के समानुपाती होता है। यदि ढह गए नोड्स के बच्चे के नोड्स निरंतर हैं, तो यह वितरण आम तौर पर एक ज्ञात रूप का नहीं होगा, और इस तथ्य के बावजूद प्रतिदर्श बनाना मुश्किल हो सकता है तथा गैर-ज्ञात यौगिक वितरणों के लिए ऊपर वर्णित समान कारणों से एक बंद रूप लिखा जा सकता है। हालाँकि, विशेष स्थिति में कि बच्चे के नोड असतत हैं, प्रतिदर्श संभव है, भले ही इन बच्चे के नोड के बच्चे निरंतर हों या असतत हों। वास्तव में, यहां सम्मिलित सिद्धांत को डिरिचलेट-बहुराष्ट्रीय वितरण पर लेख में उचित विवरण में वर्णित किया गया है।
आदेशित अतिश्रांति के साथ गिब्स प्रतिदर्शित्र
- आदेशित अतिश्रांति के साथ एक गिब्स प्रतिदर्शित्र किसी भी चरण में के लिए दिए गए विषम संख्या के उम्मीदवार मूल्यों का प्रतिदर्श लेता है और कुछ अच्छी तरह से परिभाषित क्रम के अनुसार के लिए एकल मान के साथ उन्हें वर्गीकृत करता है। यदि क्रमबद्ध सूची में sवां सबसे छोटा है तो को क्रमबद्ध सूची में sवां सबसे बड़ा चुना गया है। क्रमबद्ध सूची में सबसे बड़ा। अधिक जानकारी के लिए, नील (1995) देखें।[6]
अन्य विस्तारण
गिब्स प्रतिदर्शी को विभिन्न तरीकों से विस्तारित करना भी संभव है। उदाहरण के लिए, चरो की स्थिति में जिनके सशर्त वितरण से प्रतिदर्श लेना आसान नहीं है, अंशअ प्रतिदर्शी या मेट्रोपोलिस-हेस्टिंग्स कलन विधि का एक एकल पुनरावृत्ति प्रश्न में चरो से प्रतिदर्श लेने के लिए उपयोग किया जा सकता है। उन चरों को सम्मिलित करना भी संभव है जो यादृच्छिक चर नहीं हैं, लेकिन जिनका मान निश्चित रूप से अन्य चरों से गणना किया जाता है। सामान्यीकृत रैखिक प्रारूप, उदा, रसद प्रतिगमन (उर्फ अधिकतम एन्ट्रापी प्रारूप), इस कार्य प्रणाली में सम्मिलित किया जा सकता है। (बीयूजीएस, उदाहरण के लिए, प्रारूप के इस प्रकार के मिश्रण की अनुमति देता है।)
विफलता मोड
गिब्स प्रतिदर्शी दो तरीकों से विफल हो सकता है। पहला तब होता है जब उच्च-क्षमता वाली स्थितियों के द्वीप होते हैं, जिनके बीच कोई रास्ता नहीं होता है। उदाहरण के लिए, 2-बिट सदिशों पर प्रायिकता वितरण पर विचार करें, जहाँ सदिशों (0,0) और (1,1) प्रत्येक की प्रायिकता ½ है, लेकिन अन्य दो सदिशों (0,1) और (1,0) की प्रायिकता शून्य है। गिब्स प्रतिदर्शी दो उच्च संभावना वाले सदिशों में से एक में प्रगृहीत हो जाएगा, और दूसरे तक कभी नहीं पहुंचेगा। अधिक आम तौर पर, उच्च-आयामी, वास्तविक-मूल्य वाले सदिश पर किसी भी वितरण के लिए, यदि सदिश के दो विशेष तत्व पूरी तरह से सहसंबद्ध (या पूरी तरह से विरोधी-सहसंबंध) हैं, तो वे दो तत्व अटक जाएंगे, और गिब्स प्रतिदर्शी उन्हें कभी भी बदलने में सक्षम नहीं होगा।
दूसरी समस्या तब भी हो सकती है जब सभी अवस्थाओ में संभावना शून्य न हो और उच्च संभावना वाले राज्यों का केवल एक ही द्वीप हो। उदाहरण के लिए, 100-बिट सदिशों पर प्रायिकता वितरण पर विचार करें, जहां सभी शून्य सदिश संभाव्यता ½ के साथ होता है, और अन्य सभी सदिश समान रूप से संभावित हैं, और इसलिए प्रत्येक की प्रायिकता है। यदि आप शून्य सदिश की प्रायिकता का अनुमान लगाना चाहते हैं, तो सही वितरण से 100 या 1000 प्रतिदर्श लेना पर्याप्त होगा। यह लगभग ½ के करीब उत्तर देने की संभावना है। लेकिन समान परिणाम प्राप्त करने के लिए आपको संभवतः गिब्स प्रतिदर्श से से अधिक प्रतिदर्श लेने होंगे। कोई भी कंप्यूटर जीवन भर ऐसा नहीं कर सकता था।
यह समस्या तब होती है जब बर्न-इन अवधि कितनी भी लंबी हो। ऐसा इसलिए है क्योंकि सही वितरण में, शून्य सदिश आधा समय होता है, और उन घटनाओं को गैर-शून्य सदिशो के साथ यादृच्छिक रूप से मिश्रित किया जाता है। यहां तक कि एक छोटा सा प्रतिदर्श भी शून्य और अशून्य दोनों सदिशों को देखेगा। लेकिन गिब्स प्रतिदर्शी लंबी अवधि के लिए केवल शून्य सदिश (लगभग एक पंक्ति में) को वापस करने के बीच वैकल्पिक होगा, फिर लंबी अवधि के लिए केवल गैर शून्य सदिश (लगभग एक पंक्ति में )को वापस करने के बीच वैकल्पिक होगा। इस प्रकार सही वितरण के लिए अभिसरण बेहद धीमा है, जिसके लिए चरणों से अधिक की आवश्यकता होती है, उचित समय अवधि में इतने सारे कदम उठाना अभिकलनीय रूप से संभव नहीं है। यहाँ धीमे अभिसरण को आयामीता के अभिशाप के परिणाम के रूप में देखा जा सकता है।
इस तरह की समस्या को एक बार में पूरे 100-बिट सदिश को ब्लॉक प्रतिदर्शी द्वारा हल किया जा सकता है। (यह मानता है कि 100-बिट सदिश चर के एक बड़े सेट का हिस्सा है। यदि यह सदिश केवल एक चीज है जिसका प्रतिदर्श लिया जा रहा है, तो ब्लॉक प्रतिदर्शी गिब्स प्रतिदर्शी बिल्कुल नहीं करने के बराबर है, जो परिकल्पना द्वारा कठिन होगा।)
सॉफ्टवेयर
- ओपनबग्स सॉफ़्टवेयर (गिब्स प्रतिदर्शी का उपयोग करके बायेसियन अनुमान) मार्कोव श्रृंखला मोंटे कार्लो का उपयोग करके जटिल सांख्यिकीय प्रारूप का बायेसियन विश्लेषण करता है।
- जेएजीएस (बस एक और गिब्स प्रतिदर्शित्र) मार्कोव चेन मोंटे कार्लो का उपयोग करके बायेसियन पदानुक्रमित प्रारूप के विश्लेषण के लिए एक जीपीएल कार्यक्रम है।
- संभाव्य कार्यक्रमों के रूप में निर्दिष्ट यादृच्छिक वितरण पर गिब्स अनुमान लगाने के लिए चर्च मुफ्त सॉफ्टवेयर है।
- पीवाईएमसी सामान्य संभाव्य ग्राफिकल प्रारूप के बायेसियन सीखने के लिए एक खुला स्त्रोत पायथन पुस्तकालय है।
- ट्यूरिंग प्रायिकतात्मक प्रोग्रामिंग का उपयोग करके बेजअनुमिति के लिए एक खुला स्रोत जूलिया पुस्तकालय है।
टिप्पणियाँ
- ↑ Geman, S.; Geman, D. (1984). "Stochastic Relaxation, Gibbs Distributions, and the Bayesian Restoration of Images". IEEE Transactions on Pattern Analysis and Machine Intelligence. 6 (6): 721–741. doi:10.1109/TPAMI.1984.4767596. PMID 22499653.
- ↑ Gelfand, Alan E.; Smith, Adrian F. M. (1990-06-01). "सीमांत घनत्व की गणना करने के लिए नमूना-आधारित दृष्टिकोण". Journal of the American Statistical Association. 85 (410): 398–409. doi:10.1080/01621459.1990.10476213. ISSN 0162-1459.
- ↑ Gelman, Andrew and Carlin, John B and Stern, Hal S and Dunson, David B and Vehtari, Aki and Rubin, Donald B (2014). बायेसियन डेटा विश्लेषण. Vol. 2. FL: CRC press Boca Raton.
{{cite book}}
: CS1 maint: multiple names: authors list (link) - ↑ 4.0 4.1 4.2 Lee, Se Yoon (2021). "Gibbs sampler and coordinate ascent variational inference: A set-theoretical review". Communications in Statistics - Theory and Methods. arXiv:2008.01006. doi:10.1080/03610926.2021.1921214.
- ↑ Liu, Jun S. (September 1994). "The Collapsed Gibbs Sampler in Bayesian Computations with Applications to a Gene Regulation Problem". Journal of the American Statistical Association. 89 (427): 958–966. doi:10.2307/2290921. JSTOR 2290921.
- ↑ Neal, Radford M. (1995). Suppressing Random Walks in Markov Chain Monte Carlo Using Ordered Overrelaxation (Technical report). University of Toronto, Department of Statistics. arXiv:bayes-an/9506004. Bibcode:1995bayes.an..6004N.
संदर्भ
- Bishop, Christopher M. (2006), Pattern Recognition and Machine Learning, Springer, ISBN 978-0-387-31073-2
- Bolstad, William M. (2010), Understanding Computational Bayesian Statistics, John Wiley ISBN 978-0-470-04609-8
- Casella, G.; George, E. I. (1992). "Explaining the Gibbs Sampler". The American Statistician. 46 (3): 167. CiteSeerX 10.1.1.554.3993. doi:10.2307/2685208. JSTOR 2685208. (Contains a basic summary and many references.)
- Gelfand, Alan E.; Smith, Adrian F. M. (1990), "Sampling-Based Approaches to Calculating Marginal Densities", Journal of the American Statistical Association, 85 (410): 398–409, doi:10.2307/2289776, JSTOR 2289776, MR 1141740
- Gelman, A., Carlin J. B., Stern H. S., Dunson D., Vehtari A., Rubin D. B. (2013), Bayesian Data Analysis, third edition. London: Chapman & Hall.
- Levin, David A.; Peres, Yuval; Wilmer, Elizabeth L. (2008), "Markov Chains and Mixing Times", American Mathematical Society.
- Robert, C. P.; Casella, G. (2004), Monte Carlo Statistical Methods (second edition), Springer-Verlag.