मेट्रोपोलिस-हेस्टिंग्स एल्गोरिदम: Difference between revisions
No edit summary |
m (10 revisions imported from alpha:मेट्रोपोलिस-हेस्टिंग्स_एल्गोरिदम) |
||
(5 intermediate revisions by 2 users not shown) | |||
Line 2: | Line 2: | ||
[[Image:Metropolis hastings algorithm.png|thumb|450px|प्रस्ताव संभाव्यता वितरण Q अगले बिंदु का प्रस्ताव करता है जिस पर [[यादृच्छिक चाल]] चल सकती है।]] | [[Image:Metropolis hastings algorithm.png|thumb|450px|प्रस्ताव संभाव्यता वितरण Q अगले बिंदु का प्रस्ताव करता है जिस पर [[यादृच्छिक चाल]] चल सकती है।]] | ||
सांख्यिकी और [[सांख्यिकीय भौतिकी]] में, '''मेट्रोपोलिस-हेस्टिंग्स''' ऐल्गरिदम संभाव्यता वितरण से यादृच्छिक प्रतिरूप का अनुक्रम प्राप्त करने के लिए [[मार्कोव श्रृंखला मोंटे कार्लो]] (एमसीएमसी) विधि है, जहां से प्रत्यक्ष प्रतिरूपीकरण कठिन होता है। इस अनुक्रम का उपयोग वितरण का अनुमान लगाने के लिए किया जा सकता है| इसका उपयोग (उदाहरण के लिए [[हिस्टोग्राम]] उत्पन्न करने के लिए) या [[मोंटे कार्लो एकीकरण]] (उदाहरण के लिए [[अपेक्षित मूल्य]]) के अभिन्न अंग की गणना करने के लिए किया जा सकता हैं। मेट्रोपोलिस-हेस्टिंग्स और अन्य एमसीएमसी ऐल्गरिदम का उपयोग सामान्यतः बहु-आयामी वितरण से प्रतिरूप लेने के लिए किया जाता है, अधिकांश जब आयामों की संख्या अधिक होती है। तब एकल-आयामी वितरण के लिए, सामान्यतः अन्य विधियां होती हैं (उदाहरण के लिए [[अनुकूली अस्वीकृति नमूनाकरण|अनुकूली अस्वीकृति प्रतिरूपीकरण]]) जो सीधे वितरण से स्वतंत्र प्रतिरूप वापस कर सकती हैं, और जो एमसीएमसी विधियों में निहित स्वत: सहसंबद्ध प्रतिरूप की समस्या से मुक्त हैं। | सांख्यिकी और [[सांख्यिकीय भौतिकी]] में, '''मेट्रोपोलिस-हेस्टिंग्स''' ऐल्गरिदम संभाव्यता वितरण से यादृच्छिक प्रतिरूप का अनुक्रम प्राप्त करने के लिए [[मार्कोव श्रृंखला मोंटे कार्लो]] (एमसीएमसी) विधि है, जहां से प्रत्यक्ष प्रतिरूपीकरण कठिन होता है। इस अनुक्रम का उपयोग वितरण का अनुमान लगाने के लिए किया जा सकता है| इसका उपयोग (उदाहरण के लिए [[हिस्टोग्राम]] उत्पन्न करने के लिए) या [[मोंटे कार्लो एकीकरण]] (उदाहरण के लिए [[अपेक्षित मूल्य|अपेक्षित मान]]) के अभिन्न अंग की गणना करने के लिए किया जा सकता हैं। मेट्रोपोलिस-हेस्टिंग्स और अन्य एमसीएमसी ऐल्गरिदम का उपयोग सामान्यतः बहु-आयामी वितरण से प्रतिरूप लेने के लिए किया जाता है, अधिकांश जब आयामों की संख्या अधिक होती है। तब एकल-आयामी वितरण के लिए, सामान्यतः अन्य विधियां होती हैं (उदाहरण के लिए [[अनुकूली अस्वीकृति नमूनाकरण|अनुकूली अस्वीकृति प्रतिरूपीकरण]]) जो सीधे वितरण से स्वतंत्र प्रतिरूप वापस कर सकती हैं, और जो एमसीएमसी विधियों में निहित स्वत: सहसंबद्ध प्रतिरूप की समस्या से मुक्त हैं। | ||
==इतिहास== | ==इतिहास== | ||
Line 9: | Line 9: | ||
मेट्रोपोलिस एल्गोरिथम के विकास के श्रेय के संबंध में कुछ तर्क उपस्तिथ हैं। मेट्रोपोलिस, जो विधि के कम्प्यूटेशनल पहलुओं से परिचित थे, इन्होने स्टैनिस्लाव उलम के साथ प्राचीन लेख में मोंटे कार्लो शब्दों को गढ़ा था, और सैद्धांतिक प्रभाग में उस समूह का नेतृत्व किया था जिसने 1952 में प्रयोगों में उपयोग किए गए [[MANIAC I|मनियाक आई]] कंप्यूटर को डिजाइन और निर्मित किया था। चूँकि, 2003 से पूर्व एल्गोरिथम के विकास का कोई विस्तृत विवरण नहीं था। अपनी मृत्यु से कुछ समय पहले, मार्शल रोसेनब्लुथ ने 1953 के प्रकाशन की 50वीं वर्षगांठ के अवसर पर लैनएल में 2003 के सम्मेलन में भाग लिया। इस सम्मेलन में, रोसेनब्लुथ ने सांख्यिकीय यांत्रिकी के लिए मोंटे कार्लो ऐल्गरिदम की उत्पत्ति नामक प्रस्तुति में ऐल्गरिदम और उसके विकास का वर्णन किया।<ref name=Rosenbluth/> 2005 के जर्नल लेख में गुबर्नैटिस द्वारा और अधिक ऐतिहासिक स्पष्टीकरण दिया गया है<ref name=Gubernatis/> 50वीं वर्षगांठ सम्मेलन का विवरण देते हुए आगे की ऐतिहासिक व्याख्या की गई है। रोसेनब्लुथ ने यह स्पष्ट किया कि उन्होंने और उनकी पत्नी एरियाना ने यह कार्य किया, और मेट्रोपोलिस ने कंप्यूटर समय प्रदान करने के अतिरिक्त विकास में कोई भूमिका नहीं निभाई हैं। | मेट्रोपोलिस एल्गोरिथम के विकास के श्रेय के संबंध में कुछ तर्क उपस्तिथ हैं। मेट्रोपोलिस, जो विधि के कम्प्यूटेशनल पहलुओं से परिचित थे, इन्होने स्टैनिस्लाव उलम के साथ प्राचीन लेख में मोंटे कार्लो शब्दों को गढ़ा था, और सैद्धांतिक प्रभाग में उस समूह का नेतृत्व किया था जिसने 1952 में प्रयोगों में उपयोग किए गए [[MANIAC I|मनियाक आई]] कंप्यूटर को डिजाइन और निर्मित किया था। चूँकि, 2003 से पूर्व एल्गोरिथम के विकास का कोई विस्तृत विवरण नहीं था। अपनी मृत्यु से कुछ समय पहले, मार्शल रोसेनब्लुथ ने 1953 के प्रकाशन की 50वीं वर्षगांठ के अवसर पर लैनएल में 2003 के सम्मेलन में भाग लिया। इस सम्मेलन में, रोसेनब्लुथ ने सांख्यिकीय यांत्रिकी के लिए मोंटे कार्लो ऐल्गरिदम की उत्पत्ति नामक प्रस्तुति में ऐल्गरिदम और उसके विकास का वर्णन किया।<ref name=Rosenbluth/> 2005 के जर्नल लेख में गुबर्नैटिस द्वारा और अधिक ऐतिहासिक स्पष्टीकरण दिया गया है<ref name=Gubernatis/> 50वीं वर्षगांठ सम्मेलन का विवरण देते हुए आगे की ऐतिहासिक व्याख्या की गई है। रोसेनब्लुथ ने यह स्पष्ट किया कि उन्होंने और उनकी पत्नी एरियाना ने यह कार्य किया, और मेट्रोपोलिस ने कंप्यूटर समय प्रदान करने के अतिरिक्त विकास में कोई भूमिका नहीं निभाई हैं। | ||
यह एडवर्ड टेलर के लेख का खंडन करता है, जिन्होंने अपने संस्मरणों में कहा है कि 1953 के लेख के पांच लेखकों ने दिनों (और रातों) के लिए साथ कार्य किया।<ref name=Teller/>इसके विपरीत, रोसेनब्लुथ का विस्तृत विवरण टेलर को [[सांख्यिकीय यांत्रिकी]] का लाभ उठाने और विस्तृत [[गतिकी]] का पालन करने के अतिरिक्त समग्र औसत लेने के लिए महत्वपूर्ण किन्तु प्रारंभिक सुझाव का श्रेय देता है। रोसेनब्लुथ कहते हैं, इसने उन्हें सामान्यीकृत मोंटे कार्लो दृष्टिकोण के बारे में सोचना प्रारंभ कर दिया - वह विषय जिसके बारे में उनका कहना है कि उन्होंने [[जॉन वॉन न्यूमैन]] के साथ प्रायः चर्चा की थी। एरियाना रोसेनब्लुथ ने बताया (2003 में गुबर्नैटिस को) कि ऑगस्टा टेलर ने कंप्यूटर का कार्य प्रारंभ किया था, किन्तु एरियाना ने स्वयं इसे अपने हाथ में ले लिया और स्क्रैच से कोड लिखा। उनकी मृत्यु से कुछ समय पूर्व अंकित मौखिक इतिहास में,<ref name=Barth/> रोसेनब्लुथ ने फिर से मूल समस्या प्रस्तुत करने के लिए टेलर को,इसका समाधान करने के लिए स्वयं को, और कंप्यूटर प्रोग्रामिंग के लिए एरियाना को श्रेय दिया गया हैं। | यह एडवर्ड टेलर के लेख का खंडन करता है, जिन्होंने अपने संस्मरणों में कहा है कि 1953 के लेख के पांच लेखकों ने दिनों (और रातों) के लिए साथ कार्य किया।<ref name=Teller/> इसके विपरीत, रोसेनब्लुथ का विस्तृत विवरण टेलर को [[सांख्यिकीय यांत्रिकी]] का लाभ उठाने और विस्तृत [[गतिकी]] का पालन करने के अतिरिक्त समग्र औसत लेने के लिए महत्वपूर्ण किन्तु प्रारंभिक सुझाव का श्रेय देता है। रोसेनब्लुथ कहते हैं, इसने उन्हें सामान्यीकृत मोंटे कार्लो दृष्टिकोण के बारे में सोचना प्रारंभ कर दिया - वह विषय जिसके बारे में उनका कहना है कि उन्होंने [[जॉन वॉन न्यूमैन]] के साथ प्रायः चर्चा की थी। एरियाना रोसेनब्लुथ ने बताया (2003 में गुबर्नैटिस को) कि ऑगस्टा टेलर ने कंप्यूटर का कार्य प्रारंभ किया था, किन्तु एरियाना ने स्वयं इसे अपने हाथ में ले लिया और स्क्रैच से कोड लिखा। उनकी मृत्यु से कुछ समय पूर्व अंकित मौखिक इतिहास में,<ref name=Barth/> रोसेनब्लुथ ने फिर से मूल समस्या प्रस्तुत करने के लिए टेलर को,इसका समाधान करने के लिए स्वयं को, और कंप्यूटर प्रोग्रामिंग के लिए एरियाना को श्रेय दिया गया हैं। | ||
==अंतर्ज्ञान== | ==अंतर्ज्ञान== | ||
मेट्रोपोलिस-हेस्टिंग्स एल्गोरिदम संभाव्यता घनत्व <math>P(x)</math> के साथ किसी भी संभाव्यता वितरण से प्रतिरूप खींच सकता है, परंतु कि हम घनत्व <math>P </math> और मानों के आनुपातिक | मेट्रोपोलिस-हेस्टिंग्स एल्गोरिदम संभाव्यता घनत्व <math>P(x)</math> के साथ किसी भी संभाव्यता वितरण से प्रतिरूप खींच सकता है, परंतु कि हम घनत्व <math>P </math> और मानों के आनुपातिक फलन<math>f(x)</math> को जानते हों। और <math>f(x)</math> की गणना की जा सकती है। यह आवश्यकता कि <math>f(x)</math> घनत्व के बिल्कुल समान्य होने केअतिरिक्त केवल आनुपातिक होना चाहिए, मेट्रोपोलिस-हेस्टिंग्स एल्गोरिथ्म को विशेष रूप से उपयोगी बनाता है, क्योंकि आवश्यक सामान्यीकरण कारक की गणना करना प्रायः वास्तव में अत्यधिक कठिन होता है। | ||
मेट्रोपोलिस-हेस्टिंग्स ऐल्गरिदम प्रतिरूप | मेट्रोपोलिस-हेस्टिंग्स ऐल्गरिदम प्रतिरूप मानों का क्रम इस प्रकार से उत्पन्न करता है कि, जैसे-जैसे अधिक से अधिक प्रतिरूप मान उत्पन्न होते हैं, मानों का वितरण वांछित वितरण के अधिक समीप होता है। यह प्रतिरूप मान पुनरावृत्त रूप से उत्पन्न होते हैं, अगले प्रतिरूप का वितरण केवल वर्तमान प्रतिरूप मान पर निर्भर होता है, इस प्रकार प्रतिरूप का अनुक्रम [[मार्कोव श्रृंखला]] में बन जाता है। विशेष रूप से, प्रत्येक पुनरावृत्ति पर, ऐल्गरिदम वर्तमान प्रतिरूप मान के आधार पर अगले प्रतिरूप मान के लिए प्रतियोगी चुनता है। फिर, कुछ संभावना के साथ, प्रतियोगी को या तब स्वीकार कर लिया जाता है, जिस स्थिति में प्रतियोगी मान का उपयोग अगले पुनरावृत्ति में किया जाता है, या इसे अस्वीकार कर दिया जाता है, जिस स्थिति में प्रतियोगी मान को अस्वीकार कर दिया जाता है, और वर्तमान मान को अगले पुनरावृत्ति में पुन: उपयोग किया जाता है।स्वीकृति की संभावना वांछित वितरण के संबंध में वर्तमान और प्रतियोगी प्रतिरूप मानों के फलन <math>f(x)</math> के मानों की तुलना करके निर्धारित की जाती है। | ||
चित्रण के प्रयोजन के लिए, मेट्रोपोलिस ऐल्गरिदम, मेट्रोपोलिस-हेस्टिंग्स ऐल्गरिदम का विशेष स्थिति जहां प्रस्ताव | चित्रण के प्रयोजन के लिए, मेट्रोपोलिस ऐल्गरिदम, मेट्रोपोलिस-हेस्टिंग्स ऐल्गरिदम का विशेष स्थिति जहां प्रस्ताव फलन सममित है, नीचे वर्णित है। | ||
;मेट्रोपोलिस ऐल्गरिदम (सममित प्रस्ताव वितरण) | ;मेट्रोपोलिस ऐल्गरिदम (सममित प्रस्ताव वितरण) | ||
# आरंभीकरण: | मान लीजिए कि <math>f(x)</math> ऐसा फलन है जो वांछित संभाव्यता घनत्व फलन <math>P(x)</math> (ए.के.ए. लक्ष्य वितरण) के समानुपाती है।{{efn|In the original paper by Metropolis et al. (1953), <math>f</math> was taken to be the [[Boltzmann distribution]] as the specific application considered was [[Monte Carlo integration]] of [[equation of state|equations of state]] in [[physical chemistry]]; the extension by Hastings generalized to an arbitrary distribution <math>f</math>.}} | ||
#आरंभीकरण: प्रतिरूप में प्रथम अवलोकन होने के लिए इच्छानुसार बिंदु <math>x_t</math> चुनें और इच्छानुसार संभाव्यता घनत्व चुनें <math>g(x\mid y)</math> (कभी-कभी <math>Q(x\mid y)</math> लिखा जाता है) जो पूर्व प्रतिरूप मान <math>y</math> को देखते हुए अगले प्रतिरूप मान <math>x</math> के लिए प्रतियोगी का सुझाव देता है। इस खंड में, <math>g</math> को सममित माना गया है; दूसरे शब्दों में, इसे <math>g(x\mid y) = g(y\mid x)</math> को संतुष्ट करना होगा। सामान्य विकल्प यह है कि <math>g(x\mid y)</math> को <math>y</math> पर केन्द्रित [[गाऊसी वितरण]] बनाया जाए, जिससे कि <math>y</math> के समीप के बिंदुओं पर अगली बार जाने की अधिक संभावना हो, जिससे प्रतिरूपों का क्रम यादृच्छिक रूप से चल सके। {{efn|In the original paper by Metropolis et al. (1953), <math>g(x\mid y)</math> was suggested to be a random translation with uniform density over some prescribed range.}} फलन <math>g</math> को प्रस्ताव घनत्व या जंपिंग वितरण के रूप में जाना जाता है। | |||
# प्रत्येक पुनरावृत्ति के लिए t: | # प्रत्येक पुनरावृत्ति के लिए t: | ||
#* | #*वितरण <math>g(x'\mid x_t)</math> से चुनकर अगले प्रतिरूप के लिए प्रतियोगी <math>x'</math> उत्पन्न करें। | ||
#* स्वीकृति अनुपात | #* स्वीकृति अनुपात <math>\alpha = f(x')/f(x_t)</math> की गणना करें, जिसका उपयोग यह निश्चित करने के लिए किया जाएगा कि प्रतियोगी को स्वीकार करना है या अस्वीकार करना है {{efn|In the original paper by Metropolis et al. (1953), <math>f</math> was actually the [[Boltzmann distribution]], as it was applied to physical systems in the context of [[statistical mechanics]] (e.g., a maximal-entropy distribution of microstates for a given temperature at thermal equilibrium). Consequently, the acceptance ratio was itself an exponential of the difference in the parameters of the numerator and denominator of this ratio.}}. क्योंकि f, P के घनत्व के समानुपाती है,और हमारे समीप वह <math>\alpha = f(x')/f(x_t) = P(x')/P(x_t)</math> है . | ||
#* स्वीकार करें या अस्वीकार करें: | #* स्वीकार करें या अस्वीकार करें: | ||
#** | #** इस समान यादृच्छिक संख्या <math>u \in [0, 1]</math> को उत्पन्न करें . | ||
#* | #*यदि <math>u \le \alpha</math> है, तब <math>x_{t+1} = x'</math> समुच्चय करके प्रतियोगी को स्वीकार करें, | ||
#* | #*यदि <math>u > \alpha</math> है, तब प्रतियोगी को अस्वीकार करें और उसके स्थान पर {<math>x_{t+1} = x_t</math> समुच्चय करें। | ||
यह ऐल्गरिदम प्रतिरूप स्थान के बारे में | यह ऐल्गरिदम प्रतिरूप स्थान के बारे में उत्तम विधियों से आगे बढ़ने का प्रयास करके आगे बढ़ता है, कभी-कभी चालों को स्वीकार करता है और कभी-कभी जगह पर बना रहता है। ध्यान दें कि स्वीकृति अनुपात <math>\alpha</math> यह इंगित करता है कि नवीन प्रस्तावित प्रतिरूप वर्तमान प्रतिरूप के संबंध में कितना संभावित है, वितरण के अनुसार जिसका घनत्व <math>P(x)</math> है. यदि हम किसी ऐसे बिंदु पर जाने का प्रयास करते हैं जो उपस्ति बिंदु से अधिक संभावित है (अर्थात उच्च-घनत्व वाले क्षेत्र में बिंदु) <math>P(x)</math> के अनुरूप <math>\alpha > 1 \ge u</math>) हैं, हम इस कदम को सदैव स्वीकार करेंगे। चूँकि, यदि हम कम संभावित बिंदु पर जाने का प्रयास करते हैं, तब हम कभी-कभी इस कदम को अस्वीकार कर देंगे, और संभावना में सापेक्ष गिरावट जितनी अधिक होगी, उतनी अधिक संभावना है कि हम नए बिंदु को अस्वीकार कर देंगे। इस प्रकार, हम <math>P(x)</math> के उच्च-घनत्व वाले क्षेत्रों में बने रहेंगे (और वहां से बड़ी संख्या में प्रतिरूप वापस लाएंगे)।, जबकि यह केवल कभी-कभी ही कम घनत्व वाले क्षेत्रों का दौरा करते हैं। यही कारण है सहज रूप से कि यह ऐल्गरिदम कार्य करता है और प्रतिरूप लौटाता है जो घनत्व <math>P(x)</math> के साथ वांछित वितरण का पालन करते हैं . | ||
अनुकूली अस्वीकृति प्रतिरूपीकरण जैसे ऐल्गरिदम की तुलना में<ref name=":0">{{Cite journal |last=Gilks |first=W. R. |last2=Wild |first2=P. |date=1992-01-01 |title=गिब्स सैम्पलिंग के लिए अनुकूली अस्वीकृति सैम्पलिंग|journal=Journal of the Royal Statistical Society. Series C (Applied Statistics) |volume=41 |issue=2 |pages=337–348 |doi=10.2307/2347565 |jstor=2347565}}</ref> जो सीधे वितरण से स्वतंत्र प्रतिरूप उत्पन्न करता है, मेट्रोपोलिस-हेस्टिंग्स और अन्य एमसीएमसी ऐल्गरिदम के अनेक | अनुकूली अस्वीकृति प्रतिरूपीकरण जैसे ऐल्गरिदम की तुलना में <ref name=":0">{{Cite journal |last=Gilks |first=W. R. |last2=Wild |first2=P. |date=1992-01-01 |title=गिब्स सैम्पलिंग के लिए अनुकूली अस्वीकृति सैम्पलिंग|journal=Journal of the Royal Statistical Society. Series C (Applied Statistics) |volume=41 |issue=2 |pages=337–348 |doi=10.2307/2347565 |jstor=2347565}}</ref> जो सीधे वितरण से स्वतंत्र प्रतिरूप उत्पन्न करता है, मेट्रोपोलिस-हेस्टिंग्स और अन्य एमसीएमसी ऐल्गरिदम के अनेक हानि हैं: | ||
* प्रतिरूप सहसंबद्ध हैं। चूंकि लंबी अवधि में | * प्रतिरूप सहसंबद्ध हैं। चूंकि लंबी अवधि में वह <math>P(x) </math> सही विधि से पालन करते हैं, आस-समीप के प्रतिरूप का समुच्चय दूसरे के साथ सहसंबद्ध होगा और वितरण को सही विधि से प्रतिबिंबित नहीं करेगा। इसका कारण यह है कि प्रभावी प्रतिरूप आकार वास्तव में लिए गए प्रतिरूप की संख्या से अधिक कम हो सकता है, जिससे बड़ी त्रुटियां हो सकती हैं। | ||
* यद्यपि मार्कोव श्रृंखला अंततः वांछित वितरण में परिवर्तित हो जाती है, प्रारंभिक प्रतिरूप बहुत | * यद्यपि मार्कोव श्रृंखला अंततः वांछित वितरण में परिवर्तित हो जाती है, प्रारंभिक प्रतिरूप बहुत भिन्न वितरण का पालन कर सकते हैं, अधिकांश यदि प्रारंभिक बिंदु कम घनत्व वाले क्षेत्र में है। परिणामस्वरूप, बर्न-इन अवधि की सामान्यतः अधिक आवश्यक होती है,<ref>{{Cite book |title=बायेसियन डेटा विश्लेषण|date=2004 |publisher=Chapman & Hall / CRC |others=Gelman, Andrew |isbn=978-1584883883 |edition=2nd |location=Boca Raton, Fla. |oclc=51991499}}</ref> जहां प्रारंभिक संख्या में प्रतिरूप फेंक दिए जाते हैं। | ||
दूसरी ओर, अधिकांश सरल [[अस्वीकृति नमूनाकरण|अस्वीकृति प्रतिरूपीकरण]] विधियां आयामीता के अभिशाप से ग्रस्त हैं, जहां आयामों की संख्या के | दूसरी ओर, अधिकांश सरल [[अस्वीकृति नमूनाकरण|अस्वीकृति प्रतिरूपीकरण]] विधियां आयामीता के अभिशाप से ग्रस्त हैं, जहां आयामों की संख्या के फलन के रूप में अस्वीकृति की संभावना शीघ्रता से बढ़ जाती है। मेट्रोपोलिस-हेस्टिंग्स, अन्य एमसीएमसी विधियों के साथ, इस सीमा तक यह समस्या नहीं है, और इस प्रकार प्रायः एकमात्र समाधान उपलब्ध होता है जब प्रतिरूप किए जाने वाले वितरण के आयामों की संख्या अधिक होती है। परिणामस्वरूप, आजकल अनेक विषयों में उपयोग किए जाने वाले [[पदानुक्रमित बायेसियन मॉडल]] और अन्य उच्च-आयामी सांख्यिकीय मॉडल से प्रतिरूप तैयार करने के लिए एमसीएमसी विधियां प्रायः चुनाव की विधियां होती हैं। | ||
[[बहुभिन्नरूपी वितरण]] वितरण में, जैसा कि ऊपर वर्णित है, क्लासिक मेट्रोपोलिस-हेस्टिंग्स ऐल्गरिदम में | [[बहुभिन्नरूपी वितरण]] वितरण में, जैसा कि ऊपर वर्णित है, क्लासिक मेट्रोपोलिस-हेस्टिंग्स ऐल्गरिदम में नवीन बहु-आयामी प्रतिरूप बिंदु चुनना सम्मिलित है। जब आयामों की संख्या अधिक होती है, तब उपयोग करने के लिए उपयुक्त जंपिंग वितरण खोजना कठिन हो सकता है, क्योंकि भिन्न-भिन्न व्यक्तिगत आयाम बहुत भिन्न-भिन्न विधियों से व्यवहार करते हैं, और जंपिंग चौड़ाई (ऊपर देखें) सामान्य समय में सभी आयामों के लिए "बिल्कुल सही" होनी चाहिए। अत्यधिक धीमी गति से मिश्रण करने से बचें. वैकल्पिक दृष्टिकोण जो प्रायः ऐसी स्थितियों में उत्तम कार्य करता है, जिसे [[ गिब्स नमूनाकरण |गिब्स सैंपलिंग]] के रूप में जाना जाता है, इसमें ही बार में सभी आयामों के लिए प्रतिरूप चुनने के अतिरिक्त, प्रत्येक आयाम के लिए दूसरों से भिन्न नवीन प्रतिरूप चुनना सम्मिलित है। इस प्रकार, संभावित उच्च-आयामी स्थान से प्रतिरूप लेने की समस्या छोटी आयामीता से प्रतिरूप लेने के लिए समस्याओं के संग्रह में कम हो जाएगी।<ref>{{Cite journal |last=Lee |first=Se Yoon |year=2021 |title=Gibbs sampler and coordinate ascent variational inference: A set-theoretical review |journal=Communications in Statistics - Theory and Methods |volume=51 |issue=6 |pages=1549–1568 |arxiv=2008.01006 |doi=10.1080/03610926.2021.1921214 |s2cid=220935477}}</ref> यह विशेष रूप से तब प्रयुक्त होता है जब बहुभिन्नरूपी वितरण व्यक्तिगत यादृच्छिक वेरिएबल के समुच्चय से बना होता है जिसमें प्रत्येक वेरिएबल केवल अन्य वेरिएबल की छोटी संख्या पर आधारित होता है, जैसा कि अधिकांश विशिष्ट पदानुक्रमित बायेसियन मॉडल में होता है। फिर भिन्न-भिन्न वेरिएबल का एक-एक करके प्रतिरूप लिया जाता है, प्रत्येक वेरिएबल को अन्य सभी के नवीनतम मानों पर आधारित किया जाता है। बहुभिन्नरूपी वितरण के स्पष्ट रूप के आधार पर, इन व्यक्तिगत प्रतिरूप को चुनने के लिए विभिन्न ऐल्गरिदम का उपयोग किया जा सकता है: कुछ संभावनाएं अनुकूली अस्वीकृति प्रतिरूपीकरण विधियां हैं,<ref name=":0" /> अनुकूली अस्वीकृति मेट्रोपोलिस प्रतिरूपीकरण ऐल्गरिदम,<ref>{{Cite journal |last=Gilks |first=W. R. |last2=Best |first2=N. G. |author-link2=Nicky Best |last3=Tan |first3=K. K. C. |date=1995-01-01 |title=गिब्स सैम्पलिंग के भीतर अनुकूली अस्वीकृति मेट्रोपोलिस सैम्पलिंग|journal=Journal of the Royal Statistical Society. Series C (Applied Statistics) |volume=44 |issue=4 |pages=455–472 |doi=10.2307/2986138 |jstor=2986138}}</ref> सरल एक-आयामी मेट्रोपोलिस-हेस्टिंग्स चरण, या स्लाइस प्रतिरूपीकरण होता हैं । | ||
==औपचारिक व्युत्पत्ति== | ==औपचारिक व्युत्पत्ति== | ||
मेट्रोपोलिस-हेस्टिंग्स ऐल्गरिदम का उद्देश्य वांछित वितरण के अनुसार | मेट्रोपोलिस-हेस्टिंग्स ऐल्गरिदम का उद्देश्य वांछित वितरण के अनुसार <math>P(x)</math> स्थानों का संग्रह उत्पन्न करना है. इसे पूर्ण करने के लिए, ऐल्गरिदम [[मार्कोव प्रक्रिया]] का उपयोग करता है, जो असम्बद्ध रूप से अद्वितीय मार्कोव श्रृंखला या स्थिर-स्थान विश्लेषण और सीमित वितरण <math>\pi(x)</math> तक पहुंचता है| जैसे कि <math>\pi(x) = P(x)</math> हैं.<ref name=Roberts_Casella/> | ||
मार्कोव प्रक्रिया को उसकी संक्रमण संभावनाओं <math>P(x' \mid x)</math> द्वारा विशिष्ट रूप से परिभाषित किया गया है, किसी भी दिए गए स्थान <math>x</math> से किसी अन्य दिए गए स्थान <math>x'</math> के लिए संक्रमण की संभावना होती हैं. निम्नलिखित दो निम्नलिखित दो नियमें पूर्ण होने पर इसका अद्वितीय स्थिर वितरण <math>\pi(x)</math> होता हैं :<ref name=Roberts_Casella/> | |||
# स्थिर वितरण की विशिष्टता: स्थिर वितरण <math>\pi(x)</math> अद्वितीय होना चाहिए। इसकी गारंटी मार्कोव प्रक्रिया की मार्कोव चेन | # स्थिर वितरण का अस्तित्व: स्थिर वितरण <math>\pi(x)</math> का अस्तित्व होना चाहिए . यह पर्याप्त किन्तु आवश्यक नियम [[विस्तृत संतुलन]] है जिसके लिए आवश्यक है कि प्रत्येक संक्रमण <math>x \to x'</math> प्रतिवर्ती है: इसमें स्थानों की प्रत्येक जोड़ी के लिए <math>x, x'</math>, स्थान <math>x</math> में होने और स्थान <math>x'</math>में संक्रमण की संभावना सामान्य होनी चाहिए | इस स्थान <math>x'</math> में होने और स्थान <math>x</math> में परिवर्तित होने की संभावना के लिए <math>\pi(x) P(x' \mid x) = \pi(x') P(x \mid x')</math> आवश्यक हैं . | ||
#स्थिर वितरण की विशिष्टता: स्थिर वितरण <math>\pi(x)</math> अद्वितीय होना चाहिए। इसकी गारंटी मार्कोव प्रक्रिया की मार्कोव चेन या एर्गोडिसिटी द्वारा दी गई है, जिसके लिए आवश्यक है कि प्रत्येक स्थान को (1) एपेरियोडिक होना चाहिए -सिस्टम निश्चित अंतराल पर उसी स्थिति में वापस नहीं आता है; और (2) सकारात्मक आवर्ती होना - उसी स्थिति में लौटने के लिए चरणों की अपेक्षित संख्या सीमित है। | |||
मेट्रोपोलिस-हेस्टिंग्स ऐल्गरिदम में मार्कोव प्रक्रिया (संक्रमण संभावनाओं का निर्माण करके) को डिजाइन करना | मेट्रोपोलिस-हेस्टिंग्स ऐल्गरिदम में मार्कोव प्रक्रिया (संक्रमण संभावनाओं का निर्माण करके) को डिजाइन करना सम्मिलित है जो उपरोक्त दो नियमों को पूर्ण करता है, जैसे कि इसका स्थिर वितरण <math>\pi(x)</math> होना चुना गया है इस प्रकार <math>P(x)</math>. ऐल्गरिदम की व्युत्पत्ति विस्तृत संतुलन की स्थिति से प्रारंभ होती है: | ||
: <math>P(x' \mid x) P(x) = P(x \mid x') P(x'),</math> | : <math>P(x' \mid x) P(x) = P(x \mid x') P(x'),</math> | ||
Line 51: | Line 53: | ||
: <math>\frac{P(x' \mid x)}{P(x \mid x')} = \frac{P(x')}{P(x)}.</math> | : <math>\frac{P(x' \mid x)}{P(x \mid x')} = \frac{P(x')}{P(x)}.</math> | ||
दृष्टिकोण संक्रमण को दो उप-चरणों में | इस दृष्टिकोण संक्रमण को दो उप-चरणों में भिन्न करना है; प्रस्ताव और स्वीकृति-अस्वीकृति. प्रस्ताव वितरण <math>g(x' \mid x)</math> दिए गए <math>x</math> किसी स्थान <math>x'</math> को प्रस्तावित करने की सनियम संभावना है, और स्वीकृति वितरण <math>A(x', x)</math> प्रस्तावित स्थान <math>x'</math> को स्वीकार करने की संभावना है. संक्रमण संभाव्यता को उनके उत्पाद के रूप में लिखा जा सकता है: | ||
: <math>P(x'\mid x) = g(x' \mid x) A(x', x).</math> | : <math>P(x'\mid x) = g(x' \mid x) A(x', x).</math> | ||
इस संबंध को | इस संबंध को पूर्व समीकरण में डालने पर, हमारे समीप है | ||
: <math>\frac{A(x', x)}{A(x, x')} = \frac{P(x')}{P(x)}\frac{g(x \mid x')}{g(x' \mid x)}.</math> | : <math>\frac{A(x', x)}{A(x, x')} = \frac{P(x')}{P(x)}\frac{g(x \mid x')}{g(x' \mid x)}.</math> | ||
व्युत्पत्ति में अगला कदम स्वीकृति अनुपात चुनना है जो उपरोक्त | व्युत्पत्ति में अगला कदम स्वीकृति अनुपात चुनना है जो उपरोक्त नियम को पूर्ण करता है। सामान्य विकल्प मेट्रोपोलिस विकल्प है: | ||
: <math>A(x', x) = \min\left(1, \frac{P(x')}{P(x)} \frac{g(x \mid x')}{g(x' \mid x)}\right).</math> | : <math>A(x', x) = \min\left(1, \frac{P(x')}{P(x)} \frac{g(x \mid x')}{g(x' \mid x)}\right).</math> | ||
इसके लिए मेट्रोपोलिस स्वीकृति अनुपात <math>A</math>, दोनों में से <math>A(x', x) = 1</math> या <math>A(x, x') = 1</math> और, किसी भी प्रकार, | इसके लिए मेट्रोपोलिस स्वीकृति अनुपात <math>A</math>, दोनों में से <math>A(x', x) = 1</math> या <math>A(x, x') = 1</math> और, किसी भी प्रकार, नियम पूर्ण होती है। | ||
मेट्रोपोलिस-हेस्टिंग्स ऐल्गरिदम को इस प्रकार लिखा जा सकता है: | मेट्रोपोलिस-हेस्टिंग्स ऐल्गरिदम को इस प्रकार लिखा जा सकता है: | ||
# आरंभ करें | # आरंभ करें | ||
## एक प्रारंभिक अवस्था | ## एक प्रारंभिक अवस्था <math>x_0</math> चुनें . | ||
## | ## <math>t = 0</math> निश्चित करना . | ||
# पुनरावृति | # पुनरावृति | ||
## | ## <math>g(x' \mid x_t)</math> के अनुसार यादृच्छिक प्रतियोगी स्थान <math>x'</math> उत्पन्न करें. | ||
## स्वीकृति संभावना | ## स्वीकृति संभावना <math>A(x', x_t) = \min\left(1, \frac{P(x')}{P(x_t)} \frac{g(x_t \mid x')}{g(x' \mid x_t)}\right)</math> की गणना करें . | ||
## स्वीकार करें या अस्वीकार करें: | ## स्वीकार करें या अस्वीकार करें: | ||
### एक समान यादृच्छिक संख्या | ### एक समान यादृच्छिक संख्या <math>u \in [0, 1]</math> उत्पन्न करें ; | ||
### | ### यदि <math>u \le A(x' , x_t)</math>, फिर नए स्थान को स्वीकार करें और <math>x_{t+1} = x'</math> समुच्चय करें ; | ||
### | ### यदि <math>u > A(x' , x_t)</math>, फिर नए स्थान को अस्वीकार करें, और प्राचीन स्थान <math>x_{t+1} = x_{t}</math> को आगे कॉपी करें . | ||
## वृद्धि: | ## वृद्धि: समुच्चय <math>t = t + 1</math>. | ||
परंतु कि निर्दिष्ट नियम पूर्ण हों, सहेजे गए स्थानों का अनुभवजन्य वितरण <math>x_0, \ldots, x_T</math>, <math>P(x)</math> तक पहुंच जाएगा | प्रभावी विधि से अनुमान <math>P(x)</math> लगाने के लिए आवश्यक पुनरावृत्तियों (<math>T</math>) की संख्या कारकों की संख्या पर निर्भर करती है, जिसमे <math>P(x)</math> और प्रस्ताव वितरण के मध्य संबंध और अनुमान की वांछित स्पष्टता सम्मिलित है।<ref>Raftery, Adrian E., and Steven Lewis. "How Many Iterations in the Gibbs Sampler?" ''In Bayesian Statistics 4''. 1992.</ref> असतत स्थान स्थानों पर वितरण के लिए, इसे मार्कोव प्रक्रिया के स्वत: सहसंबंध समय के क्रम का होना चाहिए।<ref name=Newman_Barkema/> | |||
यह ध्यान रखना महत्वपूर्ण है कि | यह ध्यान रखना महत्वपूर्ण है कि यह स्पष्ट नहीं है, सामान्य समस्या में, किस वितरण <math>g(x' \mid x)</math> का उपयोग करना चाहिए या उचित अनुमान के लिए आवश्यक पुनरावृत्तियों की संख्या का उपयोग करना चाहिए; दोनों विधि के निःशुल्क पैरामीटर हैं, जिन्हें उपिस्थित विशेष समस्या के अनुसार समायोजित किया जाना चाहिए। | ||
==संख्यात्मक एकीकरण में उपयोग== | ==संख्यात्मक एकीकरण में उपयोग== | ||
{{main| | {{main|मोंटे कार्लो एकीकरण}} | ||
मेट्रोपोलिस-हेस्टिंग्स ऐल्गरिदम का सामान्य उपयोग अभिन्न की गणना करना है। विशेष रूप से, | मेट्रोपोलिस-हेस्टिंग्स ऐल्गरिदम का सामान्य उपयोग अभिन्न की गणना करना है। विशेष रूप से, <math>\Omega \subset \mathbb{R}</math> स्थान पर विचार करें और संभाव्यता वितरण <math>P(x) </math> में ऊपर <math>\Omega</math>, <math>x \in \Omega</math>. मेट्रोपोलिस-हेस्टिंग्स के रूप के अभिन्न अंग का अनुमान लगा सकते हैं | ||
: <math>P(E) = \int_\Omega A(x) P(x) \,dx,</math> | : <math>P(E) = \int_\Omega A(x) P(x) \,dx,</math> | ||
जहाँ <math>A(x)</math> रुचि को (मापने योग्य) का कार्य है। | |||
उदाहरण के लिए, | उदाहरण के लिए, आँकड़ा <math>E(x)</math> और उसके संभाव्यता वितरण <math>P(E)</math> पर विचार करें, जो जिसको [[सीमांत वितरण]] के नाम से जाना जाता है। मान लीजिए कि लक्ष्य <math>P(E)</math> की टेल पर <math>E </math> के लिए <math>P(E)</math> का अनुमान लगाना है। औपचारिक रूप से, <math>P(E) </math> को इस प्रकार लिखा जा सकता है | ||
: <math> | : <math> | ||
P(E) = \int_\Omega P(E\mid x) P(x) \,dx = \int_\Omega \delta\big(E - E(x)\big) P(x) \,dx = E \big(P(E\mid X)\big) | P(E) = \int_\Omega P(E\mid x) P(x) \,dx = \int_\Omega \delta\big(E - E(x)\big) P(x) \,dx = E \big(P(E\mid X)\big) | ||
</math> | </math> | ||
और, इस प्रकार, | और, इस प्रकार, <math>P(E)</math> का आकलन सूचक फलन <math>A_E(x) \equiv \mathbf{1}_E(x)</math> के अपेक्षित मान का अनुमान लगाकर पूर्ण किया जा सकता है, जो कि <math>E(x) \in [E, E + \Delta E]</math> होने पर 1 है और अन्यथा शून्य है। चूँकि <math>E</math>, <math>P(E) </math> की टेल पर होता है, और <math>P(E)</math> की टेल पर <math>E(x)</math> के साथ अवस्था <math>x</math> बनाने की संभावना <math>P(E)</math> के समानुपाती होती है, जो परिभाषा के अनुसार छोटी होती है। मेट्रोपोलिस-हेस्टिंग्स एल्गोरिदम का उपयोग यहां (दुर्लभ) स्थितियों का अधिक संभावित प्रतिरूप लेने के लिए किया जा सकता है और इस प्रकार टेलों पर <math>P(E)</math> का अनुमान लगाने के लिए उपयोग किए जाने वाले प्रतिरूपों की संख्या में वृद्धि हो सकती है। यह कहाँ जा सकता है कि उदा. उन स्थानों का पक्ष लेने के लिए प्रतिरूप वितरण <math>\pi(x)</math> का उपयोग करके (उदाहरण के लिए <math>a > 0</math> के साथ <math>\pi(x) \propto e^{a E}</math>) होता हैं। | ||
== | ==क्रमश: निर्देश== | ||
मान लीजिए कि प्रतिरूप लिया गया सबसे | मान लीजिए कि प्रतिरूप लिया गया सबसे वर्तमान <math>x_t</math> मान है . मेट्रोपोलिस-हेस्टिंग्स ऐल्गरिदम का पालन करने के लिए, हम आगे नवीन प्रस्ताव स्थान <math>x'</math> बनाते हैं और संभाव्यता घनत्व के साथ <math>g(x' \mid x_t)</math> और मान की गणना करें | ||
: <math>a = a_1 a_2,</math> | : <math>a = a_1 a_2,</math> | ||
जहाँ | |||
: <math>a_1 = \frac{P(x')}{P(x_t)}</math> | : <math>a_1 = \frac{P(x')}{P(x_t)}</math> | ||
प्रस्तावित प्रतिरूप | प्रस्तावित प्रतिरूप <math>x'</math>और पूर्व प्रतिरूप <math>x_t</math> के मध्य संभाव्यता (जैसे, बायेसियन पोस्टीरियर) अनुपात है, और | ||
: <math>a_2 = \frac{g(x_t \mid x')}{g(x' \mid x_t)}</math> | : <math>a_2 = \frac{g(x_t \mid x')}{g(x' \mid x_t)}</math> | ||
दो दिशाओं में प्रस्ताव घनत्व का अनुपात है ( | दो दिशाओं में प्रस्ताव घनत्व का अनुपात है (इससे <math>x_t</math> से <math>x'</math> और इसके विपरीत होते हैं)। यदि प्रस्ताव घनत्व सममित है तब यह 1 के समान्य है। उसके पश्चात् फिर निम्नलिखित नियमों के अनुसार स्थान <math>x_{t+1}</math>को चुना जाता है। | ||
यदि प्रस्ताव घनत्व सममित है तब यह 1 के समान्य है। | |||
फिर | |||
: | : यदि <math>a \geq 1{:}</math> | ||
:: <math>x_{t+1} = x',</math> | :: <math>x_{t+1} = x',</math> | ||
: अन्य: | : अन्य: | ||
Line 118: | Line 117: | ||
\end{cases} | \end{cases} | ||
</math> | </math> | ||
मार्कोव श्रृंखला | मार्कोव श्रृंखला इच्छानुसार प्रारंभिक मान <math>x_0</math> से प्रारंभ की गई है , और इसको ऐल्गरिदम को अनेक पुनरावृत्तियों तक चलाया जाता है जब तक कि यह प्रारंभिक स्थिति को भूल नही जाता है। यह प्रतिरूप , जिन्हें त्याग दिया जाता है, वह बर्न-इन के रूप में जाने जाते हैं। इसके स्वीकृत मानों का शेष समुच्चय <math>x</math> वितरण से [[नमूना (सांख्यिकी)|प्रतिरूप (सांख्यिकी)]] <math>P(x)</math> को प्रस्तुत करता हैं . | ||
एल्गोरिदम सबसे अच्छा काम करता है यदि प्रस्ताव घनत्व लक्ष्य वितरण <math>P(x)</math> के आकार से मेल खाता है, जहां से प्रत्यक्ष प्रतिरूप लेना कठिन होता है, अर्थात वह <math>g(x' \mid x_t) \approx P(x')</math> हैं। यदि गॉसियन प्रस्ताव घनत्व <math>g</math> का उपयोग किया जाता है, तब बर्न-इन अवधि के समय विचरण पैरामीटर <math>\sigma^2</math> को ट्यून करना होता हैं। यह सामान्यतः स्वीकृति दर की गणना करके किया जाता है, जो प्रस्तावित प्रतिरूप का अंश होता है जो अंतिम <math>N</math> प्रतिरूपों की विंडो में स्वीकार किया जाता है। इसकी वांछित स्वीकृति दर लक्ष्य वितरण पर निर्भर करती है, चूंकि यह सैद्धांतिक रूप से दिखाया गया है कि इस एक-आयामी गाऊसी वितरण के लिए आदर्श स्वीकृति दर लगभग 50% है, जो <math>N</math>-आयामी गाऊसी लक्ष्य वितरण के लिए घटकर लगभग 23% हो जाती है। <ref name=Roberts/> इसमें पर्याप्त रूप से नियमित बायेसियन पोस्टीरियर से प्रतिरूप लेने पर यह दिशानिर्देश सही प्रकार से कार्य कर सकते हैं क्योंकि वह प्रायः बहुभिन्नरूपी सामान्य वितरण का पालन करते हैं जैसे कि इसको बर्नस्टीन-वॉन मिसेस प्रमेय का उपयोग करके स्थापित किया जा सकता है।<ref>{{Cite journal |last=Schmon |first=Sebastian M. |last2=Gagnon |first2=Philippe |date=2022-04-15 |title=बायेसियन लार्ज-सैंपल एसिम्प्टोटिक्स का उपयोग करके रैंडम वॉक मेट्रोपोलिस एल्गोरिदम की इष्टतम स्केलिंग|journal=Statistics and Computing |language=en |volume=32 |issue=2 |pages=28 |doi=10.1007/s11222-022-10080-8 |issn=0960-3174 |pmc=8924149 |pmid=35310543}}</ref> | |||
यदि | यदि <math>\sigma^2</math> बहुत छोटा होता है, तब इसमें श्रृंखला धीरे-धीरे मिश्रित होती हैं (अर्थात, स्वीकृति दर अधिक होगी, किन्तु क्रमिक प्रतिरूप धीरे-धीरे स्पेस के चारों ओर परिवर्तित होगी, और श्रृंखला केवल धीरे-धीरे <math>P(x)</math>) में परिवर्तित होती हैं)। दूसरी ओर, यदि <math>\sigma^2</math> बहुत बड़ा है, तब स्वीकृति दर बहुत कम होगी क्योंकि प्रस्तावों के बहुत कम संभावना घनत्व वाले क्षेत्रों में आने की संभावना होती है, इसलिए <math>a_1</math> बहुत छोटा होता हैं, और फिर से वह श्रृंखला बहुत धीरे-धीरे एकत्रित होते हैं। इसमें सामान्यतः प्रस्ताव वितरण को ट्यून किया जाता है जिससे एल्गोरिदम सभी प्रतिरूपों को 30% के क्रम पर स्वीकार कर सके - यह पूर्व पैराग्राफ में उल्लिखित सैद्धांतिक अनुमानों के अनुरूप होता हैं। | ||
[[Image:3dRosenbrock.png|thumb|मेट्रोपोलिस-हेस्टिंग्स एल्गोरिथम का उपयोग करके 3डी [[रोसेनब्रॉक फ़ंक्शन|रोसेनब्रॉक]] | [[Image:3dRosenbrock.png|thumb|मेट्रोपोलिस-हेस्टिंग्स एल्गोरिथम का उपयोग करके 3डी [[रोसेनब्रॉक फ़ंक्शन|रोसेनब्रॉक]] फलन पर चलने वाली तीन [[मार्कोव श्रृंखला|मार्कोव श्रृंखलाओं]] का परिणाम हैं। ऐल्गरिदम उन क्षेत्रों से प्रतिरूप लेता है जहां पश्चवर्ती संभावना अधिक होती है, और इन क्षेत्रों में श्रृंखलाएं मिश्रित होने लगती हैं। अधिकतम की अनुमानित स्थिति पर प्रकाश डाला गया है। लाल बिंदु वह हैं जो बर्न-इन प्रक्रिया के पश्चात् बने रहते हैं।और इसमें पूर्व वालों को हटा दिया जाता है.]] | ||
== बायेसियन अनुमान == | == बायेसियन अनुमान == | ||
{{main article| | {{main article|बायेसियन अनुमान}} | ||
[[File:Flowchart-of-Metropolis-Hastings-M-H-algorithm-for-the-parameter-estimation-using-the.png|thumb|मार्कोव चेन मोंटे कार्लो (एमसीएमसी) दृष्टिकोण का उपयोग करके पैरामीटर अनुमान के लिए मेट्रोपोलिस-हेस्टिंग्स (एम-एच) ऐल्गरिदम का फ़्लोचार्ट।]]एमसीएमसी का उपयोग सांख्यिकीय मॉडल के | [[File:Flowchart-of-Metropolis-Hastings-M-H-algorithm-for-the-parameter-estimation-using-the.png|thumb|मार्कोव चेन मोंटे कार्लो (एमसीएमसी) दृष्टिकोण का उपयोग करके पैरामीटर अनुमान के लिए मेट्रोपोलिस-हेस्टिंग्स (एम-एच) ऐल्गरिदम का फ़्लोचार्ट।]]एमसीएमसी का उपयोग सांख्यिकीय मॉडल के पूर्व वितरण से प्रतिरूप लेने के लिए किया जा सकता है। | ||
स्वीकृति की संभावना इस प्रकार दी गई है: | स्वीकृति की संभावना इस प्रकार दी गई है:<math>P_{acc}(\theta_i \to \theta^*)=\min\left(1, \frac{\mathcal{L}(y|\theta^*)P(\theta^*)}{\mathcal{L}(y|\theta_i)P(\theta_i)}\frac{Q(\theta_i|\theta^*)}{Q(\theta^*|\theta_i)}\right),</math> जहाँ <math>\mathcal{L}</math> [[संभावना]] है, <math>P(\theta)</math> पूर्व संभाव्यता घनत्व और <math>Q</math> (सशर्त) प्रस्ताव संभावना होती हैं। | ||
<math>P_{acc}(\theta_i \to \theta^*)=\min\left(1, \frac{\mathcal{L}(y|\theta^*)P(\theta^*)}{\mathcal{L}(y|\theta_i)P(\theta_i)}\frac{Q(\theta_i|\theta^*)}{Q(\theta^*|\theta_i)}\right),</math> | |||
==यह भी देखें== | ==यह भी देखें== | ||
Line 143: | Line 137: | ||
* [[माध्य-क्षेत्र कण विधियाँ]] | * [[माध्य-क्षेत्र कण विधियाँ]] | ||
* [[मेट्रोपोलिस-समायोजित लैंग्विन एल्गोरिदम|मेट्रोपोलिस-समायोजित लैंग्विन ऐल्गरिदम]] | * [[मेट्रोपोलिस-समायोजित लैंग्विन एल्गोरिदम|मेट्रोपोलिस-समायोजित लैंग्विन ऐल्गरिदम]] | ||
* [[महानगर प्रकाश परिवहन]] | * [[महानगर प्रकाश परिवहन|मेट्रोपोलिस लाइट ट्रांसपोर्ट]] | ||
* [[ बहु-प्रयास महानगर ]] | * [[ बहु-प्रयास महानगर | मल्टीपल-ट्राई मेट्रोपोलिस]] | ||
* [[समानांतर तड़का]] | * [[समानांतर तड़का|समानांतर टेम्परिंग]] | ||
* पूर्वनिर्धारित क्रैंक-निकोलसन ऐल्गरिदम | * पूर्वनिर्धारित क्रैंक-निकोलसन ऐल्गरिदम | ||
* [[कण फिल्टर]] | * [[कण फिल्टर|अनुक्रमिक मोंटे कार्लो]] | ||
* [[तैयार किए हुयी धातु पे पानी चढाने की कला]] | * [[तैयार किए हुयी धातु पे पानी चढाने की कला|सिम्युलेटेड अनीलिंग]] | ||
==संदर्भ== | ==संदर्भ== | ||
Line 181: | Line 175: | ||
[[Category: Machine Translated Page]] | [[Category: Machine Translated Page]] | ||
[[Category:Created On 28/11/2023]] | [[Category:Created On 28/11/2023]] | ||
[[Category:Vigyan Ready]] |
Latest revision as of 10:22, 11 December 2023
सांख्यिकी और सांख्यिकीय भौतिकी में, मेट्रोपोलिस-हेस्टिंग्स ऐल्गरिदम संभाव्यता वितरण से यादृच्छिक प्रतिरूप का अनुक्रम प्राप्त करने के लिए मार्कोव श्रृंखला मोंटे कार्लो (एमसीएमसी) विधि है, जहां से प्रत्यक्ष प्रतिरूपीकरण कठिन होता है। इस अनुक्रम का उपयोग वितरण का अनुमान लगाने के लिए किया जा सकता है| इसका उपयोग (उदाहरण के लिए हिस्टोग्राम उत्पन्न करने के लिए) या मोंटे कार्लो एकीकरण (उदाहरण के लिए अपेक्षित मान) के अभिन्न अंग की गणना करने के लिए किया जा सकता हैं। मेट्रोपोलिस-हेस्टिंग्स और अन्य एमसीएमसी ऐल्गरिदम का उपयोग सामान्यतः बहु-आयामी वितरण से प्रतिरूप लेने के लिए किया जाता है, अधिकांश जब आयामों की संख्या अधिक होती है। तब एकल-आयामी वितरण के लिए, सामान्यतः अन्य विधियां होती हैं (उदाहरण के लिए अनुकूली अस्वीकृति प्रतिरूपीकरण) जो सीधे वितरण से स्वतंत्र प्रतिरूप वापस कर सकती हैं, और जो एमसीएमसी विधियों में निहित स्वत: सहसंबद्ध प्रतिरूप की समस्या से मुक्त हैं।
इतिहास
एल्गोरिथम का नाम आंशिक रूप से निकोलस मेट्रोपोलिस के नाम पर रखा गया है, जो 1953 के पेपर के पूर्व सह-लेखक थे, जिसका शीर्षक एरियाना डब्ल्यू. रोसेनब्लुथ, मार्शल रोसेनब्लथ, ऑगस्टा एच. टेलर और एडवर्ड टेलर के साथ फास्ट कंप्यूटिंग मशीनों द्वारा स्थान की गणना का समीकरण था। अनेक वर्षों तक एल्गोरिथम को केवल मेट्रोपोलिस एल्गोरिथम के रूप में जाना जाता था। [1][2] पेपर ने सममित प्रस्ताव वितरण के स्थितियों के लिए ऐल्गरिदम का प्रस्ताव दिया, किन्तु 1970 में, डब्ल्यू.के. हेस्टिंग्स ने इसे अधिक सामान्य स्थितियों तक विस्तारित किया।[3] सामान्यीकृत विधि को अंततः दोनों नामों से पहचाना गया हैं, चूंकि मेट्रोपोलिस-हेस्टिंग्स ऐल्गरिदम शब्द का प्रथम उपयोग अस्पष्ट है।
मेट्रोपोलिस एल्गोरिथम के विकास के श्रेय के संबंध में कुछ तर्क उपस्तिथ हैं। मेट्रोपोलिस, जो विधि के कम्प्यूटेशनल पहलुओं से परिचित थे, इन्होने स्टैनिस्लाव उलम के साथ प्राचीन लेख में मोंटे कार्लो शब्दों को गढ़ा था, और सैद्धांतिक प्रभाग में उस समूह का नेतृत्व किया था जिसने 1952 में प्रयोगों में उपयोग किए गए मनियाक आई कंप्यूटर को डिजाइन और निर्मित किया था। चूँकि, 2003 से पूर्व एल्गोरिथम के विकास का कोई विस्तृत विवरण नहीं था। अपनी मृत्यु से कुछ समय पहले, मार्शल रोसेनब्लुथ ने 1953 के प्रकाशन की 50वीं वर्षगांठ के अवसर पर लैनएल में 2003 के सम्मेलन में भाग लिया। इस सम्मेलन में, रोसेनब्लुथ ने सांख्यिकीय यांत्रिकी के लिए मोंटे कार्लो ऐल्गरिदम की उत्पत्ति नामक प्रस्तुति में ऐल्गरिदम और उसके विकास का वर्णन किया।[4] 2005 के जर्नल लेख में गुबर्नैटिस द्वारा और अधिक ऐतिहासिक स्पष्टीकरण दिया गया है[5] 50वीं वर्षगांठ सम्मेलन का विवरण देते हुए आगे की ऐतिहासिक व्याख्या की गई है। रोसेनब्लुथ ने यह स्पष्ट किया कि उन्होंने और उनकी पत्नी एरियाना ने यह कार्य किया, और मेट्रोपोलिस ने कंप्यूटर समय प्रदान करने के अतिरिक्त विकास में कोई भूमिका नहीं निभाई हैं।
यह एडवर्ड टेलर के लेख का खंडन करता है, जिन्होंने अपने संस्मरणों में कहा है कि 1953 के लेख के पांच लेखकों ने दिनों (और रातों) के लिए साथ कार्य किया।[6] इसके विपरीत, रोसेनब्लुथ का विस्तृत विवरण टेलर को सांख्यिकीय यांत्रिकी का लाभ उठाने और विस्तृत गतिकी का पालन करने के अतिरिक्त समग्र औसत लेने के लिए महत्वपूर्ण किन्तु प्रारंभिक सुझाव का श्रेय देता है। रोसेनब्लुथ कहते हैं, इसने उन्हें सामान्यीकृत मोंटे कार्लो दृष्टिकोण के बारे में सोचना प्रारंभ कर दिया - वह विषय जिसके बारे में उनका कहना है कि उन्होंने जॉन वॉन न्यूमैन के साथ प्रायः चर्चा की थी। एरियाना रोसेनब्लुथ ने बताया (2003 में गुबर्नैटिस को) कि ऑगस्टा टेलर ने कंप्यूटर का कार्य प्रारंभ किया था, किन्तु एरियाना ने स्वयं इसे अपने हाथ में ले लिया और स्क्रैच से कोड लिखा। उनकी मृत्यु से कुछ समय पूर्व अंकित मौखिक इतिहास में,[7] रोसेनब्लुथ ने फिर से मूल समस्या प्रस्तुत करने के लिए टेलर को,इसका समाधान करने के लिए स्वयं को, और कंप्यूटर प्रोग्रामिंग के लिए एरियाना को श्रेय दिया गया हैं।
अंतर्ज्ञान
मेट्रोपोलिस-हेस्टिंग्स एल्गोरिदम संभाव्यता घनत्व के साथ किसी भी संभाव्यता वितरण से प्रतिरूप खींच सकता है, परंतु कि हम घनत्व और मानों के आनुपातिक फलन को जानते हों। और की गणना की जा सकती है। यह आवश्यकता कि घनत्व के बिल्कुल समान्य होने केअतिरिक्त केवल आनुपातिक होना चाहिए, मेट्रोपोलिस-हेस्टिंग्स एल्गोरिथ्म को विशेष रूप से उपयोगी बनाता है, क्योंकि आवश्यक सामान्यीकरण कारक की गणना करना प्रायः वास्तव में अत्यधिक कठिन होता है।
मेट्रोपोलिस-हेस्टिंग्स ऐल्गरिदम प्रतिरूप मानों का क्रम इस प्रकार से उत्पन्न करता है कि, जैसे-जैसे अधिक से अधिक प्रतिरूप मान उत्पन्न होते हैं, मानों का वितरण वांछित वितरण के अधिक समीप होता है। यह प्रतिरूप मान पुनरावृत्त रूप से उत्पन्न होते हैं, अगले प्रतिरूप का वितरण केवल वर्तमान प्रतिरूप मान पर निर्भर होता है, इस प्रकार प्रतिरूप का अनुक्रम मार्कोव श्रृंखला में बन जाता है। विशेष रूप से, प्रत्येक पुनरावृत्ति पर, ऐल्गरिदम वर्तमान प्रतिरूप मान के आधार पर अगले प्रतिरूप मान के लिए प्रतियोगी चुनता है। फिर, कुछ संभावना के साथ, प्रतियोगी को या तब स्वीकार कर लिया जाता है, जिस स्थिति में प्रतियोगी मान का उपयोग अगले पुनरावृत्ति में किया जाता है, या इसे अस्वीकार कर दिया जाता है, जिस स्थिति में प्रतियोगी मान को अस्वीकार कर दिया जाता है, और वर्तमान मान को अगले पुनरावृत्ति में पुन: उपयोग किया जाता है।स्वीकृति की संभावना वांछित वितरण के संबंध में वर्तमान और प्रतियोगी प्रतिरूप मानों के फलन के मानों की तुलना करके निर्धारित की जाती है।
चित्रण के प्रयोजन के लिए, मेट्रोपोलिस ऐल्गरिदम, मेट्रोपोलिस-हेस्टिंग्स ऐल्गरिदम का विशेष स्थिति जहां प्रस्ताव फलन सममित है, नीचे वर्णित है।
- मेट्रोपोलिस ऐल्गरिदम (सममित प्रस्ताव वितरण)
मान लीजिए कि ऐसा फलन है जो वांछित संभाव्यता घनत्व फलन (ए.के.ए. लक्ष्य वितरण) के समानुपाती है।[lower-alpha 1]
- आरंभीकरण: प्रतिरूप में प्रथम अवलोकन होने के लिए इच्छानुसार बिंदु चुनें और इच्छानुसार संभाव्यता घनत्व चुनें (कभी-कभी लिखा जाता है) जो पूर्व प्रतिरूप मान को देखते हुए अगले प्रतिरूप मान के लिए प्रतियोगी का सुझाव देता है। इस खंड में, को सममित माना गया है; दूसरे शब्दों में, इसे को संतुष्ट करना होगा। सामान्य विकल्प यह है कि को पर केन्द्रित गाऊसी वितरण बनाया जाए, जिससे कि के समीप के बिंदुओं पर अगली बार जाने की अधिक संभावना हो, जिससे प्रतिरूपों का क्रम यादृच्छिक रूप से चल सके। [lower-alpha 2] फलन को प्रस्ताव घनत्व या जंपिंग वितरण के रूप में जाना जाता है।
- प्रत्येक पुनरावृत्ति के लिए t:
- वितरण से चुनकर अगले प्रतिरूप के लिए प्रतियोगी उत्पन्न करें।
- स्वीकृति अनुपात की गणना करें, जिसका उपयोग यह निश्चित करने के लिए किया जाएगा कि प्रतियोगी को स्वीकार करना है या अस्वीकार करना है [lower-alpha 3]. क्योंकि f, P के घनत्व के समानुपाती है,और हमारे समीप वह है .
- स्वीकार करें या अस्वीकार करें:
- इस समान यादृच्छिक संख्या को उत्पन्न करें .
- यदि है, तब समुच्चय करके प्रतियोगी को स्वीकार करें,
- यदि है, तब प्रतियोगी को अस्वीकार करें और उसके स्थान पर { समुच्चय करें।
यह ऐल्गरिदम प्रतिरूप स्थान के बारे में उत्तम विधियों से आगे बढ़ने का प्रयास करके आगे बढ़ता है, कभी-कभी चालों को स्वीकार करता है और कभी-कभी जगह पर बना रहता है। ध्यान दें कि स्वीकृति अनुपात यह इंगित करता है कि नवीन प्रस्तावित प्रतिरूप वर्तमान प्रतिरूप के संबंध में कितना संभावित है, वितरण के अनुसार जिसका घनत्व है. यदि हम किसी ऐसे बिंदु पर जाने का प्रयास करते हैं जो उपस्ति बिंदु से अधिक संभावित है (अर्थात उच्च-घनत्व वाले क्षेत्र में बिंदु) के अनुरूप ) हैं, हम इस कदम को सदैव स्वीकार करेंगे। चूँकि, यदि हम कम संभावित बिंदु पर जाने का प्रयास करते हैं, तब हम कभी-कभी इस कदम को अस्वीकार कर देंगे, और संभावना में सापेक्ष गिरावट जितनी अधिक होगी, उतनी अधिक संभावना है कि हम नए बिंदु को अस्वीकार कर देंगे। इस प्रकार, हम के उच्च-घनत्व वाले क्षेत्रों में बने रहेंगे (और वहां से बड़ी संख्या में प्रतिरूप वापस लाएंगे)।, जबकि यह केवल कभी-कभी ही कम घनत्व वाले क्षेत्रों का दौरा करते हैं। यही कारण है सहज रूप से कि यह ऐल्गरिदम कार्य करता है और प्रतिरूप लौटाता है जो घनत्व के साथ वांछित वितरण का पालन करते हैं .
अनुकूली अस्वीकृति प्रतिरूपीकरण जैसे ऐल्गरिदम की तुलना में [8] जो सीधे वितरण से स्वतंत्र प्रतिरूप उत्पन्न करता है, मेट्रोपोलिस-हेस्टिंग्स और अन्य एमसीएमसी ऐल्गरिदम के अनेक हानि हैं:
- प्रतिरूप सहसंबद्ध हैं। चूंकि लंबी अवधि में वह सही विधि से पालन करते हैं, आस-समीप के प्रतिरूप का समुच्चय दूसरे के साथ सहसंबद्ध होगा और वितरण को सही विधि से प्रतिबिंबित नहीं करेगा। इसका कारण यह है कि प्रभावी प्रतिरूप आकार वास्तव में लिए गए प्रतिरूप की संख्या से अधिक कम हो सकता है, जिससे बड़ी त्रुटियां हो सकती हैं।
- यद्यपि मार्कोव श्रृंखला अंततः वांछित वितरण में परिवर्तित हो जाती है, प्रारंभिक प्रतिरूप बहुत भिन्न वितरण का पालन कर सकते हैं, अधिकांश यदि प्रारंभिक बिंदु कम घनत्व वाले क्षेत्र में है। परिणामस्वरूप, बर्न-इन अवधि की सामान्यतः अधिक आवश्यक होती है,[9] जहां प्रारंभिक संख्या में प्रतिरूप फेंक दिए जाते हैं।
दूसरी ओर, अधिकांश सरल अस्वीकृति प्रतिरूपीकरण विधियां आयामीता के अभिशाप से ग्रस्त हैं, जहां आयामों की संख्या के फलन के रूप में अस्वीकृति की संभावना शीघ्रता से बढ़ जाती है। मेट्रोपोलिस-हेस्टिंग्स, अन्य एमसीएमसी विधियों के साथ, इस सीमा तक यह समस्या नहीं है, और इस प्रकार प्रायः एकमात्र समाधान उपलब्ध होता है जब प्रतिरूप किए जाने वाले वितरण के आयामों की संख्या अधिक होती है। परिणामस्वरूप, आजकल अनेक विषयों में उपयोग किए जाने वाले पदानुक्रमित बायेसियन मॉडल और अन्य उच्च-आयामी सांख्यिकीय मॉडल से प्रतिरूप तैयार करने के लिए एमसीएमसी विधियां प्रायः चुनाव की विधियां होती हैं।
बहुभिन्नरूपी वितरण वितरण में, जैसा कि ऊपर वर्णित है, क्लासिक मेट्रोपोलिस-हेस्टिंग्स ऐल्गरिदम में नवीन बहु-आयामी प्रतिरूप बिंदु चुनना सम्मिलित है। जब आयामों की संख्या अधिक होती है, तब उपयोग करने के लिए उपयुक्त जंपिंग वितरण खोजना कठिन हो सकता है, क्योंकि भिन्न-भिन्न व्यक्तिगत आयाम बहुत भिन्न-भिन्न विधियों से व्यवहार करते हैं, और जंपिंग चौड़ाई (ऊपर देखें) सामान्य समय में सभी आयामों के लिए "बिल्कुल सही" होनी चाहिए। अत्यधिक धीमी गति से मिश्रण करने से बचें. वैकल्पिक दृष्टिकोण जो प्रायः ऐसी स्थितियों में उत्तम कार्य करता है, जिसे गिब्स सैंपलिंग के रूप में जाना जाता है, इसमें ही बार में सभी आयामों के लिए प्रतिरूप चुनने के अतिरिक्त, प्रत्येक आयाम के लिए दूसरों से भिन्न नवीन प्रतिरूप चुनना सम्मिलित है। इस प्रकार, संभावित उच्च-आयामी स्थान से प्रतिरूप लेने की समस्या छोटी आयामीता से प्रतिरूप लेने के लिए समस्याओं के संग्रह में कम हो जाएगी।[10] यह विशेष रूप से तब प्रयुक्त होता है जब बहुभिन्नरूपी वितरण व्यक्तिगत यादृच्छिक वेरिएबल के समुच्चय से बना होता है जिसमें प्रत्येक वेरिएबल केवल अन्य वेरिएबल की छोटी संख्या पर आधारित होता है, जैसा कि अधिकांश विशिष्ट पदानुक्रमित बायेसियन मॉडल में होता है। फिर भिन्न-भिन्न वेरिएबल का एक-एक करके प्रतिरूप लिया जाता है, प्रत्येक वेरिएबल को अन्य सभी के नवीनतम मानों पर आधारित किया जाता है। बहुभिन्नरूपी वितरण के स्पष्ट रूप के आधार पर, इन व्यक्तिगत प्रतिरूप को चुनने के लिए विभिन्न ऐल्गरिदम का उपयोग किया जा सकता है: कुछ संभावनाएं अनुकूली अस्वीकृति प्रतिरूपीकरण विधियां हैं,[8] अनुकूली अस्वीकृति मेट्रोपोलिस प्रतिरूपीकरण ऐल्गरिदम,[11] सरल एक-आयामी मेट्रोपोलिस-हेस्टिंग्स चरण, या स्लाइस प्रतिरूपीकरण होता हैं ।
औपचारिक व्युत्पत्ति
मेट्रोपोलिस-हेस्टिंग्स ऐल्गरिदम का उद्देश्य वांछित वितरण के अनुसार स्थानों का संग्रह उत्पन्न करना है. इसे पूर्ण करने के लिए, ऐल्गरिदम मार्कोव प्रक्रिया का उपयोग करता है, जो असम्बद्ध रूप से अद्वितीय मार्कोव श्रृंखला या स्थिर-स्थान विश्लेषण और सीमित वितरण तक पहुंचता है| जैसे कि हैं.[12]
मार्कोव प्रक्रिया को उसकी संक्रमण संभावनाओं द्वारा विशिष्ट रूप से परिभाषित किया गया है, किसी भी दिए गए स्थान से किसी अन्य दिए गए स्थान के लिए संक्रमण की संभावना होती हैं. निम्नलिखित दो निम्नलिखित दो नियमें पूर्ण होने पर इसका अद्वितीय स्थिर वितरण होता हैं :[12]
- स्थिर वितरण का अस्तित्व: स्थिर वितरण का अस्तित्व होना चाहिए . यह पर्याप्त किन्तु आवश्यक नियम विस्तृत संतुलन है जिसके लिए आवश्यक है कि प्रत्येक संक्रमण प्रतिवर्ती है: इसमें स्थानों की प्रत्येक जोड़ी के लिए , स्थान में होने और स्थान में संक्रमण की संभावना सामान्य होनी चाहिए | इस स्थान में होने और स्थान में परिवर्तित होने की संभावना के लिए आवश्यक हैं .
- स्थिर वितरण की विशिष्टता: स्थिर वितरण अद्वितीय होना चाहिए। इसकी गारंटी मार्कोव प्रक्रिया की मार्कोव चेन या एर्गोडिसिटी द्वारा दी गई है, जिसके लिए आवश्यक है कि प्रत्येक स्थान को (1) एपेरियोडिक होना चाहिए -सिस्टम निश्चित अंतराल पर उसी स्थिति में वापस नहीं आता है; और (2) सकारात्मक आवर्ती होना - उसी स्थिति में लौटने के लिए चरणों की अपेक्षित संख्या सीमित है।
मेट्रोपोलिस-हेस्टिंग्स ऐल्गरिदम में मार्कोव प्रक्रिया (संक्रमण संभावनाओं का निर्माण करके) को डिजाइन करना सम्मिलित है जो उपरोक्त दो नियमों को पूर्ण करता है, जैसे कि इसका स्थिर वितरण होना चुना गया है इस प्रकार . ऐल्गरिदम की व्युत्पत्ति विस्तृत संतुलन की स्थिति से प्रारंभ होती है:
जिसे पुनः इस रूप में लिखा गया है
इस दृष्टिकोण संक्रमण को दो उप-चरणों में भिन्न करना है; प्रस्ताव और स्वीकृति-अस्वीकृति. प्रस्ताव वितरण दिए गए किसी स्थान को प्रस्तावित करने की सनियम संभावना है, और स्वीकृति वितरण प्रस्तावित स्थान को स्वीकार करने की संभावना है. संक्रमण संभाव्यता को उनके उत्पाद के रूप में लिखा जा सकता है:
इस संबंध को पूर्व समीकरण में डालने पर, हमारे समीप है
व्युत्पत्ति में अगला कदम स्वीकृति अनुपात चुनना है जो उपरोक्त नियम को पूर्ण करता है। सामान्य विकल्प मेट्रोपोलिस विकल्प है:
इसके लिए मेट्रोपोलिस स्वीकृति अनुपात , दोनों में से या और, किसी भी प्रकार, नियम पूर्ण होती है।
मेट्रोपोलिस-हेस्टिंग्स ऐल्गरिदम को इस प्रकार लिखा जा सकता है:
- आरंभ करें
- एक प्रारंभिक अवस्था चुनें .
- निश्चित करना .
- पुनरावृति
- के अनुसार यादृच्छिक प्रतियोगी स्थान उत्पन्न करें.
- स्वीकृति संभावना की गणना करें .
- स्वीकार करें या अस्वीकार करें:
- एक समान यादृच्छिक संख्या उत्पन्न करें ;
- यदि , फिर नए स्थान को स्वीकार करें और समुच्चय करें ;
- यदि , फिर नए स्थान को अस्वीकार करें, और प्राचीन स्थान को आगे कॉपी करें .
- वृद्धि: समुच्चय .
परंतु कि निर्दिष्ट नियम पूर्ण हों, सहेजे गए स्थानों का अनुभवजन्य वितरण , तक पहुंच जाएगा | प्रभावी विधि से अनुमान लगाने के लिए आवश्यक पुनरावृत्तियों () की संख्या कारकों की संख्या पर निर्भर करती है, जिसमे और प्रस्ताव वितरण के मध्य संबंध और अनुमान की वांछित स्पष्टता सम्मिलित है।[13] असतत स्थान स्थानों पर वितरण के लिए, इसे मार्कोव प्रक्रिया के स्वत: सहसंबंध समय के क्रम का होना चाहिए।[14]
यह ध्यान रखना महत्वपूर्ण है कि यह स्पष्ट नहीं है, सामान्य समस्या में, किस वितरण का उपयोग करना चाहिए या उचित अनुमान के लिए आवश्यक पुनरावृत्तियों की संख्या का उपयोग करना चाहिए; दोनों विधि के निःशुल्क पैरामीटर हैं, जिन्हें उपिस्थित विशेष समस्या के अनुसार समायोजित किया जाना चाहिए।
संख्यात्मक एकीकरण में उपयोग
मेट्रोपोलिस-हेस्टिंग्स ऐल्गरिदम का सामान्य उपयोग अभिन्न की गणना करना है। विशेष रूप से, स्थान पर विचार करें और संभाव्यता वितरण में ऊपर , . मेट्रोपोलिस-हेस्टिंग्स के रूप के अभिन्न अंग का अनुमान लगा सकते हैं
जहाँ रुचि को (मापने योग्य) का कार्य है।
उदाहरण के लिए, आँकड़ा और उसके संभाव्यता वितरण पर विचार करें, जो जिसको सीमांत वितरण के नाम से जाना जाता है। मान लीजिए कि लक्ष्य की टेल पर के लिए का अनुमान लगाना है। औपचारिक रूप से, को इस प्रकार लिखा जा सकता है
और, इस प्रकार, का आकलन सूचक फलन के अपेक्षित मान का अनुमान लगाकर पूर्ण किया जा सकता है, जो कि होने पर 1 है और अन्यथा शून्य है। चूँकि , की टेल पर होता है, और की टेल पर के साथ अवस्था बनाने की संभावना के समानुपाती होती है, जो परिभाषा के अनुसार छोटी होती है। मेट्रोपोलिस-हेस्टिंग्स एल्गोरिदम का उपयोग यहां (दुर्लभ) स्थितियों का अधिक संभावित प्रतिरूप लेने के लिए किया जा सकता है और इस प्रकार टेलों पर का अनुमान लगाने के लिए उपयोग किए जाने वाले प्रतिरूपों की संख्या में वृद्धि हो सकती है। यह कहाँ जा सकता है कि उदा. उन स्थानों का पक्ष लेने के लिए प्रतिरूप वितरण का उपयोग करके (उदाहरण के लिए के साथ ) होता हैं।
क्रमश: निर्देश
मान लीजिए कि प्रतिरूप लिया गया सबसे वर्तमान मान है . मेट्रोपोलिस-हेस्टिंग्स ऐल्गरिदम का पालन करने के लिए, हम आगे नवीन प्रस्ताव स्थान बनाते हैं और संभाव्यता घनत्व के साथ और मान की गणना करें
जहाँ
प्रस्तावित प्रतिरूप और पूर्व प्रतिरूप के मध्य संभाव्यता (जैसे, बायेसियन पोस्टीरियर) अनुपात है, और
दो दिशाओं में प्रस्ताव घनत्व का अनुपात है (इससे से और इसके विपरीत होते हैं)। यदि प्रस्ताव घनत्व सममित है तब यह 1 के समान्य है। उसके पश्चात् फिर निम्नलिखित नियमों के अनुसार स्थान को चुना जाता है।
- यदि
- अन्य:
मार्कोव श्रृंखला इच्छानुसार प्रारंभिक मान से प्रारंभ की गई है , और इसको ऐल्गरिदम को अनेक पुनरावृत्तियों तक चलाया जाता है जब तक कि यह प्रारंभिक स्थिति को भूल नही जाता है। यह प्रतिरूप , जिन्हें त्याग दिया जाता है, वह बर्न-इन के रूप में जाने जाते हैं। इसके स्वीकृत मानों का शेष समुच्चय वितरण से प्रतिरूप (सांख्यिकी) को प्रस्तुत करता हैं .
एल्गोरिदम सबसे अच्छा काम करता है यदि प्रस्ताव घनत्व लक्ष्य वितरण के आकार से मेल खाता है, जहां से प्रत्यक्ष प्रतिरूप लेना कठिन होता है, अर्थात वह हैं। यदि गॉसियन प्रस्ताव घनत्व का उपयोग किया जाता है, तब बर्न-इन अवधि के समय विचरण पैरामीटर को ट्यून करना होता हैं। यह सामान्यतः स्वीकृति दर की गणना करके किया जाता है, जो प्रस्तावित प्रतिरूप का अंश होता है जो अंतिम प्रतिरूपों की विंडो में स्वीकार किया जाता है। इसकी वांछित स्वीकृति दर लक्ष्य वितरण पर निर्भर करती है, चूंकि यह सैद्धांतिक रूप से दिखाया गया है कि इस एक-आयामी गाऊसी वितरण के लिए आदर्श स्वीकृति दर लगभग 50% है, जो -आयामी गाऊसी लक्ष्य वितरण के लिए घटकर लगभग 23% हो जाती है। [15] इसमें पर्याप्त रूप से नियमित बायेसियन पोस्टीरियर से प्रतिरूप लेने पर यह दिशानिर्देश सही प्रकार से कार्य कर सकते हैं क्योंकि वह प्रायः बहुभिन्नरूपी सामान्य वितरण का पालन करते हैं जैसे कि इसको बर्नस्टीन-वॉन मिसेस प्रमेय का उपयोग करके स्थापित किया जा सकता है।[16]
यदि बहुत छोटा होता है, तब इसमें श्रृंखला धीरे-धीरे मिश्रित होती हैं (अर्थात, स्वीकृति दर अधिक होगी, किन्तु क्रमिक प्रतिरूप धीरे-धीरे स्पेस के चारों ओर परिवर्तित होगी, और श्रृंखला केवल धीरे-धीरे ) में परिवर्तित होती हैं)। दूसरी ओर, यदि बहुत बड़ा है, तब स्वीकृति दर बहुत कम होगी क्योंकि प्रस्तावों के बहुत कम संभावना घनत्व वाले क्षेत्रों में आने की संभावना होती है, इसलिए बहुत छोटा होता हैं, और फिर से वह श्रृंखला बहुत धीरे-धीरे एकत्रित होते हैं। इसमें सामान्यतः प्रस्ताव वितरण को ट्यून किया जाता है जिससे एल्गोरिदम सभी प्रतिरूपों को 30% के क्रम पर स्वीकार कर सके - यह पूर्व पैराग्राफ में उल्लिखित सैद्धांतिक अनुमानों के अनुरूप होता हैं।
बायेसियन अनुमान
एमसीएमसी का उपयोग सांख्यिकीय मॉडल के पूर्व वितरण से प्रतिरूप लेने के लिए किया जा सकता है।
स्वीकृति की संभावना इस प्रकार दी गई है: जहाँ संभावना है, पूर्व संभाव्यता घनत्व और (सशर्त) प्रस्ताव संभावना होती हैं।
यह भी देखें
- विस्तृत संतुलन
- आनुवंशिक ऐल्गरिदम
- गिब्स प्रतिरूपीकरण
- हैमिल्टनियन मोंटे कार्लो
- माध्य-क्षेत्र कण विधियाँ
- मेट्रोपोलिस-समायोजित लैंग्विन ऐल्गरिदम
- मेट्रोपोलिस लाइट ट्रांसपोर्ट
- मल्टीपल-ट्राई मेट्रोपोलिस
- समानांतर टेम्परिंग
- पूर्वनिर्धारित क्रैंक-निकोलसन ऐल्गरिदम
- अनुक्रमिक मोंटे कार्लो
- सिम्युलेटेड अनीलिंग
संदर्भ
- ↑ Kalos, Malvin H.; Whitlock, Paula A. (1986). Monte Carlo Methods Volume I: Basics. New York: Wiley. pp. 78–88.
- ↑ Tierney, Luke (1994). "पश्च वितरणों की खोज के लिए मार्कोव श्रृंखलाएँ". The Annals of Statistics. 22 (4): 1701–1762.
- ↑ Hastings, W.K. (1970). "Monte Carlo Sampling Methods Using Markov Chains and Their Applications". Biometrika. 57 (1): 97–109. Bibcode:1970Bimka..57...97H. doi:10.1093/biomet/57.1.97. JSTOR 2334940. Zbl 0219.65008.
- ↑ M.N. Rosenbluth (2003). "Genesis of the Monte Carlo Algorithm for Statistical Mechanics". AIP Conference Proceedings. 690: 22–30. Bibcode:2003AIPC..690...22R. doi:10.1063/1.1632112.
- ↑ J.E. Gubernatis (2005). "Marshall Rosenbluth and the Metropolis Algorithm". Physics of Plasmas. 12 (5): 057303. Bibcode:2005PhPl...12e7303G. doi:10.1063/1.1887186.
- ↑ Teller, Edward. Memoirs: A Twentieth-Century Journey in Science and Politics. Perseus Publishing, 2001, p. 328
- ↑ Rosenbluth, Marshall. "Oral History Transcript". American Institute of Physics
- ↑ 8.0 8.1 Gilks, W. R.; Wild, P. (1992-01-01). "गिब्स सैम्पलिंग के लिए अनुकूली अस्वीकृति सैम्पलिंग". Journal of the Royal Statistical Society. Series C (Applied Statistics). 41 (2): 337–348. doi:10.2307/2347565. JSTOR 2347565.
- ↑ बायेसियन डेटा विश्लेषण. Gelman, Andrew (2nd ed.). Boca Raton, Fla.: Chapman & Hall / CRC. 2004. ISBN 978-1584883883. OCLC 51991499.
{{cite book}}
: CS1 maint: others (link) - ↑ Lee, Se Yoon (2021). "Gibbs sampler and coordinate ascent variational inference: A set-theoretical review". Communications in Statistics - Theory and Methods. 51 (6): 1549–1568. arXiv:2008.01006. doi:10.1080/03610926.2021.1921214. S2CID 220935477.
- ↑ Gilks, W. R.; Best, N. G.; Tan, K. K. C. (1995-01-01). "गिब्स सैम्पलिंग के भीतर अनुकूली अस्वीकृति मेट्रोपोलिस सैम्पलिंग". Journal of the Royal Statistical Society. Series C (Applied Statistics). 44 (4): 455–472. doi:10.2307/2986138. JSTOR 2986138.
- ↑ 12.0 12.1 Robert, Christian; Casella, George (2004). Monte Carlo Statistical Methods. Springer. ISBN 978-0387212395.
- ↑ Raftery, Adrian E., and Steven Lewis. "How Many Iterations in the Gibbs Sampler?" In Bayesian Statistics 4. 1992.
- ↑ Newman, M. E. J.; Barkema, G. T. (1999). Monte Carlo Methods in Statistical Physics. USA: Oxford University Press. ISBN 978-0198517979.
- ↑ Roberts, G.O.; Gelman, A.; Gilks, W.R. (1997). "Weak convergence and optimal scaling of random walk Metropolis algorithms". Ann. Appl. Probab. 7 (1): 110–120. CiteSeerX 10.1.1.717.2582. doi:10.1214/aoap/1034625254.
- ↑ Schmon, Sebastian M.; Gagnon, Philippe (2022-04-15). "बायेसियन लार्ज-सैंपल एसिम्प्टोटिक्स का उपयोग करके रैंडम वॉक मेट्रोपोलिस एल्गोरिदम की इष्टतम स्केलिंग". Statistics and Computing (in English). 32 (2): 28. doi:10.1007/s11222-022-10080-8. ISSN 0960-3174. PMC 8924149. PMID 35310543.
टिप्पणियाँ
- ↑ In the original paper by Metropolis et al. (1953), was taken to be the Boltzmann distribution as the specific application considered was Monte Carlo integration of equations of state in physical chemistry; the extension by Hastings generalized to an arbitrary distribution .
- ↑ In the original paper by Metropolis et al. (1953), was suggested to be a random translation with uniform density over some prescribed range.
- ↑ In the original paper by Metropolis et al. (1953), was actually the Boltzmann distribution, as it was applied to physical systems in the context of statistical mechanics (e.g., a maximal-entropy distribution of microstates for a given temperature at thermal equilibrium). Consequently, the acceptance ratio was itself an exponential of the difference in the parameters of the numerator and denominator of this ratio.
अग्रिम पठन
- Bernd A. Berg. Markov Chain Monte Carlo Simulations and Their Statistical Analysis. Singapore, World Scientific, 2004.
- Siddhartha Chib and Edward Greenberg: "Understanding the Metropolis–Hastings Algorithm". American Statistician, 49(4), 327–335, 1995
- David D. L. Minh and Do Le Minh. "Understanding the Hastings Algorithm." Communications in Statistics - Simulation and Computation, 44:2 332-349, 2015
- Bolstad, William M. (2010) Understanding Computational Bayesian Statistics, John Wiley & Sons ISBN 0-470-04609-0