अस्वीकृति नमूनाकरण: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
 
(5 intermediate revisions by 3 users not shown)
Line 1: Line 1:
{{Short description|Computational statistics technique}}
{{Short description|Computational statistics technique}}
संख्यात्मक विश्लेषण और कम्प्यूटेशनल आंकड़ों में, अस्वीकृति नमूनाकरण मूल तकनीक है जिसका उपयोग संभाव्यता वितरण से अवलोकन उत्पन्न करने के लिए किया जाता है। इसे सामान्यतः स्वीकृति-अस्वीकृति विधि या स्वीकार-अस्वीकार एल्गोरिथम भी कहा जाता है और यह एक प्रकार की स्पष्ट सिमुलेशन विधि है। यह विधि किसी भी वितरण <math>\mathbb{R}^m</math> संभाव्यता घनत्व फलन के साथ के लिए काम करती है '''<math>\mathbb{R}^m</math> संभाव्यता घनत्व फलन के साथ।'''
संख्यात्मक विश्लेषण और कम्प्यूटेशनल आंकड़ों में, अस्वीकृति नमूनाकरण मूल तकनीक है जिसका उपयोग संभाव्यता वितरण से अवलोकन उत्पन्न करने के लिए किया जाता है। इसे सामान्यतः स्वीकृति-अस्वीकृति विधि या स्वीकार-अस्वीकार एल्गोरिथम भी कहा जाता है और यह एक प्रकार की स्पष्ट सिमुलेशन विधि है। यह विधि किसी भी वितरण <math>\mathbb{R}^m</math> संभाव्यता घनत्व फलन के साथ के लिए काम करती है।


अस्वीकृति नमूनाकरण अवलोकन पर आधारित है कि आयाम में यादृच्छिक चर का नमूना लेने के लिए, द्वि-आयामी कार्टेशियन ग्राफ का समान रूप से यादृच्छिक नमूनाकरण कर सकता है, और इसके घनत्व फलन के ग्राफ के तहत क्षेत्र में नमूने रख सकता है।<ref>{{Cite book|title = सामान्यीकृत स्वीकार-अस्वीकार नमूना योजनाएँ|pages = 342–347|doi = 10.1214/lnms/1196285403|first = George|last = Casella|first2 = Christian P.|last2 = Robert|first3 = Martin T.|last3 = Wells|isbn = 9780940600614|publisher = Institute of Mathematical Statistics|year = 2004}}</ref><ref name="radford03">{{cite journal
अस्वीकृति नमूनाकरण अवलोकन पर आधारित है कि आयाम में यादृच्छिक चर का नमूना लेने के लिए, द्वि-आयामी कार्टेशियन ग्राफ का समान रूप से यादृच्छिक नमूनाकरण कर सकता है, और इसके घनत्व फलन के ग्राफ के अंतर्गत क्षेत्र में नमूने रख सकता है।<ref>{{Cite book|title = सामान्यीकृत स्वीकार-अस्वीकार नमूना योजनाएँ|pages = 342–347|doi = 10.1214/lnms/1196285403|first = George|last = Casella|first2 = Christian P.|last2 = Robert|first3 = Martin T.|last3 = Wells|isbn = 9780940600614|publisher = Institute of Mathematical Statistics|year = 2004}}</ref><ref name="radford03">{{cite journal
  |first=Radford M. |last=Neal
  |first=Radford M. |last=Neal
  |title=Slice Sampling
  |title=Slice Sampling
Line 17: Line 17:
   | chapter = 11.4: Slice sampling
   | chapter = 11.4: Slice sampling
   | isbn = 978-0-387-31073-2
   | isbn = 978-0-387-31073-2
}}</ref> ध्यान दें कि इस संपत्ति को n-आयाम कार्यों तक बढ़ाया जा सकता है। '''अस्वीकृति विधि या स्वीकार-अस्वीकार एल्गोरिथम भी कहा जाता है और यह एक प्रकार की स्पष्ट सिमुलेशन विधि है।  यह विधि किसी भी वितरण <math>\mathbb{R}^m</math> संभाव्यता घनत्व फलन के साथ के लिए काम करती है <math>\mathbb{R}^m</math> संभाव्यता घनत्व फलन के साथ।'''
}}</ref> ध्यान दें कि इस संपत्ति को n-आयाम कार्यों तक बढ़ाया जा सकता है।  


== विवरण ==
== विवरण ==
Line 33: Line 33:


== सिद्धांत ==
== सिद्धांत ==
रिजेक्शन सैंपलिंग पद्धति लक्ष्य वितरण से सैंपलिंग मान उत्पन्न करती है <math>X</math> मनमाने ढंग से संभाव्यता घनत्व फलन के साथ <math>f(x)</math> प्रस्ताव वितरण का उपयोग करके <math>Y</math> संभाव्यता घनत्व के साथ <math>g(x)</math>. विचार यह है कि कोई नमूना मूल्य उत्पन्न कर सकता है <math>X</math> इसके अतिरिक्त से नमूना लेना <math>Y</math> और से नमूना स्वीकार करना <math>Y</math> संभावना के साथ <math>f(x)/(M g(x))</math>, ड्रॉ को दोहराते हुए <math>Y</math> जब तक कोई मान स्वीकार नहीं किया जाता। <math>M</math> यहाँ संभावना अनुपात पर स्थिर, परिमित सीमा है <math>f(x)/g(x)</math>, संतुष्टि देने वाला <math>1 < M < \infty</math> के [[समर्थन (गणित)]] पर <math>X</math>; दूसरे शब्दों में, एम को संतुष्ट करना चाहिए <math>f(x) \leq M g(x)</math> के सभी मूल्यों के लिए <math>x</math>. ध्यान दें कि इसके लिए समर्थन की आवश्यकता है <math>Y</math> का समर्थन सम्मिलित करना चाहिए <math>X</math>-दूसरे शब्दों में, <math>g(x) > 0</math> जब कभी भी <math>f(x) > 0</math>.है
रिजेक्शन सैंपलिंग पद्धति लक्ष्य वितरण से सैंपलिंग मान उत्पन्न करती है <math>X</math> मनमाने ढंग से संभाव्यता घनत्व फलन के साथ <math>f(x)</math> प्रस्ताव वितरण का उपयोग करके <math>Y</math> संभाव्यता घनत्व के साथ <math>g(x)</math>. विचार यह है कि कोई नमूना मूल्य उत्पन्न कर सकता है <math>X</math> इसके अतिरिक्त से नमूना लेना <math>Y</math> और से नमूना स्वीकार करना <math>Y</math> संभावना के साथ <math>f(x)/(M g(x))</math>, ड्रॉ को दोहराते हुए <math>Y</math> जब तक कोई मान स्वीकार नहीं किया जाता। <math>M</math> यहाँ संभावना अनुपात पर स्थिर, परिमित सीमा है <math>f(x)/g(x)</math>, संतुष्टि देने वाला <math>1 < M < \infty</math> के [[समर्थन (गणित)]] पर <math>X</math>; दूसरे शब्दों में, एम को संतुष्ट करना चाहिए <math>f(x) \leq M g(x)</math> के सभी मूल्यों के लिए <math>x</math>. ध्यान दें कि इसके लिए समर्थन की आवश्यकता है <math>Y</math> का समर्थन सम्मिलित करना चाहिए <math>X</math>-दूसरे शब्दों में, <math>g(x) > 0</math> जब कभी भी <math>f(x) > 0</math>.है।


इस पद्धति का सत्यापन आवरण सिद्धांत है: जोड़ी का अनुकरण करते समय <math display="inline">(x,v=u\cdot Mg(x))</math>, एक के सबग्राफ पर समान सिमुलेशन का उत्पादन करता है <math display="inline">Mg(x)</math>. केवल ऐसी जोड़ियों को स्वीकार करना <math display="inline">u<f(x)/(Mg(x))</math> फिर जोड़े उत्पन करता है <math>(x,v)</math> के सबग्राफ पर समान रूप से वितरित <math>f(x)</math> और इस प्रकार, आंशिक रूप से, अनुकरण <math>f(x).</math>
इस पद्धति का सत्यापन आवरण सिद्धांत है: जोड़ी का अनुकरण करते समय <math display="inline">(x,v=u\cdot Mg(x))</math>, एक के सबग्राफ पर समान सिमुलेशन का उत्पादन करता है <math display="inline">Mg(x)</math>. केवल ऐसी जोड़ियों को स्वीकार करना <math display="inline">u<f(x)/(Mg(x))</math> फिर जोड़े उत्पन करता है <math>(x,v)</math> के सबग्राफ पर समान रूप से वितरित <math>f(x)</math> और इस प्रकार, आंशिक रूप से, अनुकरण <math>f(x).</math>
इसका मतलब यह है कि, पर्याप्त प्रतिकृति के साथ, एल्गोरिथम वांछित वितरण से नमूना उत्पन्न करता है <math>f(x)</math>. इस एल्गोरिथम के लिए कई एक्सटेंशन हैं, जैसे [[ महानगर एल्गोरिथम ]]
इसका मतलब यह है कि, पर्याप्त प्रतिकृति के साथ, एल्गोरिथम वांछित वितरण से नमूना उत्पन्न करता है <math>f(x)</math>. इस एल्गोरिथम के लिए कई एक्सटेंशन हैं, जैसे [[ महानगर एल्गोरिथम |मेट्रोपोलिटन एल्गोरिथम]] कहते है।


यह विधि मोंटे कार्लो पद्धति तकनीकों के सामान्य क्षेत्र से संबंधित है, जिसमें [[मार्कोव चेन मोंटे कार्लो]] एल्गोरिदम सम्मिलित हैं जो लक्ष्य वितरण से अनुकरण प्राप्त करने के लिए प्रॉक्सी वितरण का भी उपयोग करते हैं। <math>f(x)</math>. यह मेट्रोपोलिस एल्गोरिथम जैसे एल्गोरिदम के लिए आधार बनाता है।
यह विधि मोंटे कार्लो पद्धति तकनीकों के सामान्य क्षेत्र से संबंधित है, जिसमें [[मार्कोव चेन मोंटे कार्लो]] एल्गोरिदम सम्मिलित हैं जो लक्ष्य वितरण से अनुकरण प्राप्त करने के लिए प्रॉक्सी वितरण का भी उपयोग करते हैं। <math>f(x)</math>. यह मेट्रोपोलिस एल्गोरिथम जैसे एल्गोरिदम के लिए आधार बनाता है।


बिना शर्त स्वीकृति संभावना प्रस्तावित नमूनों का अनुपात है जो स्वीकार किए जाते हैं, जो है <math display="block">
बिना शर्त स्वीकृति संभावना प्रस्तावित नमूनों का अनुपात है जो स्वीकार किए जाते हैं, जो है। <math display="block">
\begin{align}
\begin{align}
\mathbb{P}\left(U\le\frac{f(Y)}{M g(Y)}\right) &= \operatorname{E}\mathbf{1}_{\left[U\le\frac{f(Y)}{M g(Y)}\right]}\\[6pt]
\mathbb{P}\left(U\le\frac{f(Y)}{M g(Y)}\right) &= \operatorname{E}\mathbf{1}_{\left[U\le\frac{f(Y)}{M g(Y)}\right]}\\[6pt]
Line 55: Line 55:


उपरोक्त समीकरण को फिर से लिखें, <math display="block">M=\frac{1}{\mathbb{P}\left(U\le\frac{f(Y)}{M g(Y)}\right)}</math>
उपरोक्त समीकरण को फिर से लिखें, <math display="block">M=\frac{1}{\mathbb{P}\left(U\le\frac{f(Y)}{M g(Y)}\right)}</math>
ध्यान दें कि <math display="inline">1 \le M<\infty</math>, उपरोक्त सूत्र के कारण, जहाँ <math display="inline">\mathbb{P}\left(U\le\frac{f(Y)}{M g(Y)}\right)</math> प्रायिकता है जो अंतराल में केवल मान ले सकती है <math>[0,1]</math>. कब <math>M</math> के समीप चुना जाता है, बिना शर्त स्वीकृति की संभावना उतनी ही अधिक होती है, जितना कम अनुपात भिन्न होता है, क्योंकि <math>M</math> संभावना अनुपात के लिए ऊपरी सीमा '''है''' <math display="inline">f(x)/g(x)</math>. व्यवहार में, का मूल्य के करीब को प्राथमिकता दी जाती है क्योंकि इसका तात्पर्य कम अस्वीकृत नमूनों से है, औसतन, और इस प्रकार एल्गोरिथम के कम पुनरावृत्तियों। इस अर्थ में, कोई लेना पसंद करता है <math>M</math> जितना संभव हो उतना छोटा (अभी भी संतुष्ट करते हुए <math>f(x) \leq M g(x)</math>, जिससे पता चलता है <math>g(x)</math> सम्मिलित समान होना चाहिए <math>f(x)</math> किसी तरह। चूंकि, ध्यान दें <math>M</math> 1 के बराबर नहीं हो सकता: ऐसा इसका मतलब होगा <math>f(x)=g(x)</math>, यानी कि लक्ष्य और प्रस्ताव वितरण वास्तव में समान वितरण हैं।
ध्यान दें कि <math display="inline">1 \le M<\infty</math>, उपरोक्त सूत्र के कारण, जहाँ <math display="inline">\mathbb{P}\left(U\le\frac{f(Y)}{M g(Y)}\right)</math> प्रायिकता है जो अंतराल में केवल मान ले सकती है <math>[0,1]</math>. कब <math>M</math> के समीप चुना जाता है, बिना शर्त स्वीकृति की संभावना उतनी ही अधिक होती है, जितना कम अनुपात भिन्न होता है, क्योंकि <math>M</math> संभावना अनुपात के लिए ऊपरी सीमा '''है''' <math display="inline">f(x)/g(x)</math>. व्यवहार में, का मूल्य के करीब को प्राथमिकता दी जाती है क्योंकि इसका तात्पर्य कम अस्वीकृत नमूनों से है, औसतन, और इस प्रकार एल्गोरिथम के कम पुनरावृत्तियों। इस अर्थ में, कोई लेना पसंद करता है <math>M</math> जितना संभव हो उतना छोटा (अभी भी संतुष्ट करते हुए <math>f(x) \leq M g(x)</math>, जिससे पता चलता है <math>g(x)</math> सम्मिलित समान होना चाहिए <math>f(x)</math> किसी तरह। चूंकि, ध्यान दें <math>M</math> 1 के बराबर नहीं हो सकता: ऐसा इसका अर्थ होगा <math>f(x)=g(x)</math>, यानी कि लक्ष्य और प्रस्ताव वितरण वास्तव में समान वितरण हैं।


अस्वीकृति नमूनाकरण का उपयोग अधिकांशतः उन स्थितियों में किया जाता है जहां प्रपत्र <math>f(x)</math> नमूनाकरण को कठिन बनाता है। अस्वीकृति एल्गोरिथम के एकल पुनरावृत्ति के लिए प्रस्ताव वितरण से नमूने लेने, समान वितरण से आरेखण करने और प्रस्ताव का मूल्यांकन करने की आवश्यकता होती है <math>f(x)/(M g(x))</math> अभिव्यक्ति। इस प्रकार अस्वीकृति नमूनाकरण किसी अन्य विधि की तुलना में अधिक कुशल होता है जब भी इन कार्यों की m गुना लागत - जो अस्वीकृति नमूनाकरण के साथ नमूना प्राप्त करने की अपेक्षित लागत होती है - अन्य विधि का उपयोग करके नमूना प्राप्त करने की लागत से कम होती है।
अस्वीकृति नमूनाकरण का उपयोग अधिकांशतः उन स्थितियों में किया जाता है जहां प्रपत्र <math>f(x)</math> नमूनाकरण को कठिन बनाता है। अस्वीकृति एल्गोरिथम के एकल पुनरावृत्ति के लिए प्रस्ताव वितरण से नमूने लेने, समान वितरण से आरेखण करने और प्रस्ताव का मूल्यांकन करने की आवश्यकता होती है <math>f(x)/(M g(x))</math> अभिव्यक्ति। इस प्रकार अस्वीकृति नमूनाकरण किसी अन्य विधि की तुलना में अधिक कुशल होता है जब भी इन कार्यों की m गुना लागत - जो अस्वीकृति नमूनाकरण के साथ नमूना प्राप्त करने की अपेक्षित लागत होती है - अन्य विधि का उपयोग करके नमूना प्राप्त करने की लागत से कम होती है।


== एल्गोरिथम ==
== एल्गोरिथम ==
एल्गोरिथम, जिसका उपयोग [[जॉन वॉन न्यूमैन]] द्वारा किया गया था<ref>{{Cite journal |last=Forsythe |first=George E. |date=1972 |title=सामान्य और अन्य वितरणों से यादृच्छिक नमूनाकरण के लिए वॉन न्यूमैन की तुलना विधि|url=https://www.jstor.org/stable/2005864 |journal=Mathematics of Computation |volume=26 |issue=120 |pages=817–826 |doi=10.2307/2005864 |issn=0025-5718}}</ref> और जॉर्जेस-लुई लेक्लेर, कॉम्टे डे बफन और बफन की सुई के समय से है,<ref>{{Cite journal |last=Legault |first=Geoffrey |last2=Melbourne |first2=Brett A. |date=2019-03-01 |title=निरंतर समय के स्टोकेस्टिक जनसंख्या मॉडल में पर्यावरण परिवर्तन के लिए लेखांकन|url=https://doi.org/10.1007/s12080-018-0386-z |journal=Theoretical Ecology |language=en |volume=12 |issue=1 |pages=31–48 |doi=10.1007/s12080-018-0386-z |issn=1874-1746}}</ref> वितरण से नमूना प्राप्त करता है <math>X</math> घनत्व के साथ <math>f</math> वितरण से नमूने का उपयोग करना <math>Y</math> घनत्व के साथ <math>g</math> निम्नलिखित नुसार:
एल्गोरिथम, जिसका उपयोग [[जॉन वॉन न्यूमैन]] द्वारा किया गया था<ref>{{Cite journal |last=Forsythe |first=George E. |date=1972 |title=सामान्य और अन्य वितरणों से यादृच्छिक नमूनाकरण के लिए वॉन न्यूमैन की तुलना विधि|url=https://www.jstor.org/stable/2005864 |journal=Mathematics of Computation |volume=26 |issue=120 |pages=817–826 |doi=10.2307/2005864 |issn=0025-5718}}</ref> और जॉर्जेस-लुई लेक्लेर, कॉम्टे डे बफन और बफन की सुई के समय से है,<ref>{{Cite journal |last=Legault |first=Geoffrey |last2=Melbourne |first2=Brett A. |date=2019-03-01 |title=निरंतर समय के स्टोकेस्टिक जनसंख्या मॉडल में पर्यावरण परिवर्तन के लिए लेखांकन|url=https://doi.org/10.1007/s12080-018-0386-z |journal=Theoretical Ecology |language=en |volume=12 |issue=1 |pages=31–48 |doi=10.1007/s12080-018-0386-z |issn=1874-1746}}</ref> वितरण से नमूना प्राप्त करता है <math>X</math> घनत्व के साथ <math>f</math> वितरण से नमूने का उपयोग करना <math>Y</math> घनत्व के साथ <math>g</math> निम्नलिखित :
* नमूना प्राप्त करें <math>y</math> वितरण से <math>Y</math> और नमूना <math>u</math> से <math>\mathrm{Unif}(0,1)</math> (इकाई अंतराल पर समान वितरण)।
* नमूना प्राप्त करें <math>y</math> वितरण से <math>Y</math> और नमूना <math>u</math> से <math>\mathrm{Unif}(0,1)</math> (इकाई अंतराल पर समान वितरण)।
* चेक करें या नहीं <math display="inline">u<f(y)/Mg(y)</math>.
* चेक करें या नहीं <math display="inline">u<f(y)/Mg(y)</math>.
** यदि यह मान्य है, तो स्वीकार करें <math>y</math> से लिए गए नमूने के रूप में <math>f</math>;
** यदि यह मान्य है, तो स्वीकार करें <math>y</math> से लिए गए नमूने के रूप में <math>f</math>;है।
** यदि नहीं, के मूल्य को अस्वीकार करें <math>y</math> और नमूनाकरण चरण पर लौटें।
** यदि नहीं, के मूल्य को अस्वीकार करें <math>y</math> और नमूनाकरण चरण पर लौटें।


एल्गोरिदम औसत लेगा <math>M</math> पुनरावृत्तियाँ नमूना प्राप्त करने के लिए '''पुनरावृत्तियाँ'''
एल्गोरिदम औसत लेगा <math>M</math> पुनरावृत्तियाँ नमूना प्राप्त करने के लिए ।


== सहज विधियों का उपयोग करके नमूनाकरण पर लाभ ==
== सहज विधियों का उपयोग करके नमूनाकरण पर लाभ ==
Line 79: Line 79:
&=\int^x_{-\infty}e^{\theta y-\psi(\theta)}f(y)dy\\
&=\int^x_{-\infty}e^{\theta y-\psi(\theta)}f(y)dy\\
g_\theta(x)&=F'_\theta(x)=e^{\theta x-\psi(\theta)}f(x)
g_\theta(x)&=F'_\theta(x)=e^{\theta x-\psi(\theta)}f(x)
\end{align}</math>जहाँ <math>\psi(\theta) = \log\left(\mathbb{E}\exp(\theta X)\right)</math> और <math>\Theta = \{\theta :\psi(\theta)<\infty\}</math>. स्पष्ट रूप से, <math>\{F_\theta (\cdot)\}_{\theta \in \Theta}</math>, [[प्राकृतिक घातीय परिवार]] से है। इसके अतिरिक्त, संभावना अनुपात है <math display="block">Z(x)=\frac{f(x)}{g_\theta(x)}=\frac{f(x)}{e^{\theta x-\psi(\theta)}f(x)}=e^{-\theta x+\psi(\theta)}</math>ध्यान दें कि <math>\psi (\theta)<\infty</math> तात्पर्य यह है कि यह वास्तव में लॉग [[क्षण-उत्पन्न करने वाला कार्य]] है। मोमेंट-जेनरेशन फलन, यानी <math>\psi(\theta)=\log\mathbb{E}{\exp(tX)}|_{t=\theta}=\log M_X(t)|_{t=\theta}</math>. और प्रस्ताव के लॉग क्षण-सृजन फलन को प्राप्त करना आसान है और इसलिए प्रस्ताव के क्षण।<math display="block">\begin{align}
\end{align}</math>जहाँ <math>\psi(\theta) = \log\left(\mathbb{E}\exp(\theta X)\right)</math> और <math>\Theta = \{\theta :\psi(\theta)<\infty\}</math>. स्पष्ट रूप से, <math>\{F_\theta (\cdot)\}_{\theta \in \Theta}</math>, [[प्राकृतिक घातीय परिवार]] से है। इसके अतिरिक्त, संभावना अनुपात है। <math display="block">Z(x)=\frac{f(x)}{g_\theta(x)}=\frac{f(x)}{e^{\theta x-\psi(\theta)}f(x)}=e^{-\theta x+\psi(\theta)}</math>ध्यान दें कि <math>\psi (\theta)<\infty</math> तात्पर्य यह है कि यह वास्तव में लॉग [[क्षण-उत्पन्न करने वाला कार्य]] है। मोमेंट-जेनरेशन फलन, यानी <math>\psi(\theta)=\log\mathbb{E}{\exp(tX)}|_{t=\theta}=\log M_X(t)|_{t=\theta}</math>. और प्रस्ताव के लॉग क्षण-सृजन फलन को प्राप्त करना आसान है और इसलिए प्रस्ताव के क्षण।<math display="block">\begin{align}
\psi_\theta(\eta)&=\log\left(\mathbb{E}_\theta\exp(\eta X)\right)=\psi(\theta+\eta)-\psi(\theta)<\infty\\
\psi_\theta(\eta)&=\log\left(\mathbb{E}_\theta\exp(\eta X)\right)=\psi(\theta+\eta)-\psi(\theta)<\infty\\
\mathbb{E}_\theta(X)&= \left.\frac{\partial \psi_\theta(\eta)}{\partial\eta}\right|_{\eta=0}\\
\mathbb{E}_\theta(X)&= \left.\frac{\partial \psi_\theta(\eta)}{\partial\eta}\right|_{\eta=0}\\
Line 100: Line 100:
== कमियां ==
== कमियां ==


यदि नमूना लिया जा रहा कार्य निश्चित क्षेत्र में अत्यधिक केंद्रित है, उदाहरण के लिए फलन जिसमें किसी स्थान पर स्पाइक है, तो अस्वीकृति नमूनाकरण से बहुत सारे अवांछित नमूने लिए जा सकते हैं। कई वितरणों के लिए, इस समस्या को अनुकूली विस्तार (देखें # अनुकूली अस्वीकृति नमूनाकरण) का उपयोग करके या यूनिफार्म के अनुपात की विधि के साथ चर के उचित परिवर्तन के साथ हल किया जा सकता है। इसके अतिरिक्त, जैसे-जैसे समस्या का आयाम बड़ा होता जाता है, एम्बेडिंग वॉल्यूम के कोनों में एम्बेडेड वॉल्यूम का अनुपात शून्य की ओर बढ़ता जाता है, इस प्रकार उपयोगी नमूना उत्पन्न होने से पहले बहुत सारे अस्वीकरण हो सकते हैं, इस प्रकार एल्गोरिथम को अक्षम बना दिया जाता है और अव्यावहारिक। आयामीता का अपवाद देखें। उच्च आयामों में, अलग दृष्टिकोण का उपयोग करना आवश्यक है, सामान्यतः मार्कोव श्रृंखला मोंटे कार्लो विधि जैसे मेट्रोपोलिस नमूनाकरण या [[गिब्स नमूनाकरण]]। (चूंकि, गिब्स नमूनाकरण, जो बहु-आयामी नमूनाकरण समस्या को निम्न-आयामी नमूनों की श्रृंखला में विभाजित करता है, इसके चरण के रूप में अस्वीकृति नमूनाकरण का उपयोग कर सकता है।)
यदि नमूना लिया जा रहा कार्य निश्चित क्षेत्र में अत्यधिक केंद्रित है, उदाहरण के लिए फलन जिसमें किसी स्थान पर स्पाइक है, तो अस्वीकृति नमूनाकरण से बहुत सारे अवांछित नमूने लिए जा सकते हैं। कई वितरणों के लिए, इस समस्या को अनुकूली विस्तार (देखें अनुकूली अस्वीकृति नमूनाकरण) का उपयोग करके या यूनिफार्म के अनुपात की विधि के साथ चर के उचित परिवर्तन के साथ हल किया जा सकता है। इसके अतिरिक्त, जैसे-जैसे समस्या का आयाम बड़ा होता जाता है, एम्बेडिंग वॉल्यूम के कोनों में एम्बेडेड वॉल्यूम का अनुपात शून्य की ओर बढ़ता जाता है, इस प्रकार उपयोगी नमूना उत्पन्न होने से पहले बहुत सारे अस्वीकरण हो सकते हैं, इस प्रकार एल्गोरिथम को अक्षम बना दिया जाता है और अव्यावहारिक। आयामीता का अपवाद देखें। उच्च आयामों में, अलग दृष्टिकोण का उपयोग करना आवश्यक है, सामान्यतः मार्कोव श्रृंखला मोंटे कार्लो विधि जैसे मेट्रोपोलिस नमूनाकरण या [[गिब्स नमूनाकरण]]। (चूंकि, गिब्स नमूनाकरण, जो बहु-आयामी नमूनाकरण समस्या को निम्न-आयामी नमूनों की श्रृंखला में विभाजित करता है, इसके चरण के रूप में अस्वीकृति नमूनाकरण का उपयोग कर सकता है।)


== अनुकूली अस्वीकृति नमूनाकरण ==
== अनुकूली अस्वीकृति नमूनाकरण ==


कई वितरणों के लिए, ऐसा प्रस्ताव वितरण खोजना मुश्किल है जिसमें बहुत अधिक बर्बाद जगह के बिना दिए गए वितरण को सम्मिलित किया गया हो। अस्वीकृति नमूनाकरण का विस्तार जिसका उपयोग इस कठिनाई को दूर करने के लिए किया जा सकता है और विभिन्न प्रकार के वितरणों से कुशलता से नमूना लिया जा सकता है (बशर्ते कि उनके पास लॉगरिदमिक रूप से अवतल कार्य हो। लॉग-अवतल घनत्व कार्य, जो वास्तव में अधिकांश सामान्य वितरणों के स्थितियों में है- यहां तक ​​​​कि जिनके घनत्व कार्य स्वयं अवतल नहीं हैं) को 'अनुकूली अस्वीकृति नमूनाकरण (एआरएस)' के रूप में जाना जाता है।
कई वितरणों के लिए, ऐसा प्रस्ताव वितरण खोजना मुश्किल है जिसमें बहुत अधिक बर्बाद जगह के बिना दिए गए वितरण को सम्मिलित किया गया हो। अस्वीकृति नमूनाकरण का विस्तार जिसका उपयोग इस कठिनाई को दूर करने के लिए किया जा सकता है और विभिन्न प्रकार के वितरणों से कुशलता से नमूना लिया जा सकता है (बशर्ते कि उनके पास लॉगरिदमिक रूप से अवतल कार्य हो। लॉग-अवतल घनत्व कार्य, जो वास्तव में अधिकांश सामान्य वितरणों के स्थितियों में है- यहां तक ​​​​कि जिनके घनत्व कार्य स्वयं अवतल नहीं हैं) को 'अनुकूली अस्वीकृति नमूनाकरण (एआरएस)' के रूप में जाना जाता है।


1992 में गिल्क्स द्वारा अंततः पेश की गई इस तकनीक के लिए तीन मूल विचार हैं:<ref>{{cite journal |first=W. R. |last=Gilks |first2=P. |last2=Wild |title=गिब्स नमूनाकरण के लिए अनुकूली अस्वीकृति नमूनाकरण|journal=Journal of the Royal Statistical Society |series=Series C (Applied Statistics) |volume=41 |issue=2 |year=1992 |pages=337–348 |doi=10.2307/2347565 }}</ref>
1992 में गिल्क्स द्वारा अंततः पेश की गई इस तकनीक के लिए तीन मूल विचार हैं:<ref>{{cite journal |first=W. R. |last=Gilks |first2=P. |last2=Wild |title=गिब्स नमूनाकरण के लिए अनुकूली अस्वीकृति नमूनाकरण|journal=Journal of the Royal Statistical Society |series=Series C (Applied Statistics) |volume=41 |issue=2 |year=1992 |pages=337–348 |doi=10.2307/2347565 }}</ref>
Line 121: Line 121:
इस पद्धति में अनिवार्य रूप से सीधी-रेखा खंडों के लिफाफे को क्रमिक रूप से निर्धारित करना सम्मिलित है जो लघुगणक को बेहतर और अच्छा बनाता है, जबकि अभी भी वक्र के ऊपर शेष है, निश्चित संख्या में खंडों (संभवतः केवल स्पर्शरेखा रेखा) से प्रारंभ होता है। छोटे घातीय यादृच्छिक चर से नमूनाकरण सीधा है। बस समान यादृच्छिक चर का लॉग लें (उचित अंतराल और संबंधित ट्रंकेशन के साथ)।
इस पद्धति में अनिवार्य रूप से सीधी-रेखा खंडों के लिफाफे को क्रमिक रूप से निर्धारित करना सम्मिलित है जो लघुगणक को बेहतर और अच्छा बनाता है, जबकि अभी भी वक्र के ऊपर शेष है, निश्चित संख्या में खंडों (संभवतः केवल स्पर्शरेखा रेखा) से प्रारंभ होता है। छोटे घातीय यादृच्छिक चर से नमूनाकरण सीधा है। बस समान यादृच्छिक चर का लॉग लें (उचित अंतराल और संबंधित ट्रंकेशन के साथ)।


दुर्भाग्य से, एआरएस को केवल लॉग-अवतल लक्ष्य घनत्व से नमूनाकरण से ही प्रयुक्त किया जा सकता है। इस कारण से, गैर-लॉग-अवतल लक्ष्य वितरण से निपटने के लिए साहित्य में एआरएस के कई विस्तार प्रस्तावित किए गए हैं।<ref>{{Cite journal|title = टी-अवतल वितरण से नमूनाकरण के लिए एक अस्वीकृति तकनीक|journal = ACM Trans. Math. Softw.|date = 1995-06-01|issn = 0098-3500|pages = 182–193|volume = 21|issue = 2|doi = 10.1145/203082.203089|first = Wolfgang|last = Hörmann|citeseerx = 10.1.1.56.6055}}</ref><ref>{{Cite journal|title = रूपांतरित घनत्वों के अवतल गुणों का उपयोग करते हुए यादृच्छिक चर उत्पादन|jstor = 1390680|journal = Journal of Computational and Graphical Statistics|date = 1998-12-01|pages = 514–528|volume = 7|issue = 4|doi = 10.2307/1390680|first = M.|last = Evans|first2 = T.|last2 = Swartz|citeseerx = 10.1.1.53.9001}}</ref><ref>{{Cite journal|title = अवतल-उत्तल अनुकूली अस्वीकृति नमूनाकरण|journal = Journal of Computational and Graphical Statistics|date = 2011-01-01|issn = 1061-8600|pages = 670–691|volume = 20|issue = 3|doi = 10.1198/jcgs.2011.09058|first = Dilan|last = Görür|first2 = Yee Whye|last2 = Teh}}</ref> इसके अतिरिक्त, एआरएस और मेट्रोपोलिस-हेस्टिंग्स पद्धति के विभिन्न संयोजनों को सार्वभौमिक सैम्पलर प्राप्त करने के लिए डिज़ाइन किया गया है जो स्व-ट्यूनिंग प्रस्ताव घनत्व बनाता है (यानी, प्रस्ताव स्वचालित रूप से निर्मित और लक्ष्य के लिए अनुकूलित)। विधियों के इस वर्ग को अधिकांशतः एडेप्टिव रिजेक्शन मेट्रोपोलिस सैंपलिंग (एआरएमएस) एल्गोरिदम कहा जाता है।<ref>{{Cite journal|title = गिब्स सैंपलिंग के भीतर अनुकूली अस्वीकृति मेट्रोपोलिस नमूनाकरण|jstor = 2986138|journal = Journal of the Royal Statistical Society |series=Series C (Applied Statistics)|date = 1995-01-01|pages = 455–472|volume = 44|issue = 4|doi = 10.2307/2986138|first = W. R.|last = Gilks|first2 = N. G.|last2 = Best|author2-link= Nicky Best |first3 = K. K. C.|last3 = Tan}}</ref><ref>{{Cite journal|title = Adaptive rejection Metropolis sampling using Lagrange interpolation polynomials of degree 2|journal = Computational Statistics & Data Analysis|date = 2008-03-15|pages = 3408–3423|volume = 52|issue = 7|doi = 10.1016/j.csda.2008.01.005|first = Renate|last = Meyer|first2 = Bo|last2 = Cai|first3 = François|last3 = Perron}}</ref> परिणामी अनुकूली तकनीकों को हमेशा प्रयुक्त किया जा सकता है लेकिन उत्पन्न नमूने इस मामले में सहसंबद्ध होते हैं (हालांकि पुनरावृत्तियों की संख्या बढ़ने पर सहसंबंध जल्दी से शून्य हो जाता है)।
दुर्भाग्य से, एआरएस को केवल लॉग-अवतल लक्ष्य घनत्व से नमूनाकरण से ही प्रयुक्त किया जा सकता है। इस कारण से, गैर-लॉग-अवतल लक्ष्य वितरण से निपटने के लिए साहित्य में एआरएस के कई विस्तार प्रस्तावित किए गए हैं।<ref>{{Cite journal|title = टी-अवतल वितरण से नमूनाकरण के लिए एक अस्वीकृति तकनीक|journal = ACM Trans. Math. Softw.|date = 1995-06-01|issn = 0098-3500|pages = 182–193|volume = 21|issue = 2|doi = 10.1145/203082.203089|first = Wolfgang|last = Hörmann|citeseerx = 10.1.1.56.6055}}</ref><ref>{{Cite journal|title = रूपांतरित घनत्वों के अवतल गुणों का उपयोग करते हुए यादृच्छिक चर उत्पादन|jstor = 1390680|journal = Journal of Computational and Graphical Statistics|date = 1998-12-01|pages = 514–528|volume = 7|issue = 4|doi = 10.2307/1390680|first = M.|last = Evans|first2 = T.|last2 = Swartz|citeseerx = 10.1.1.53.9001}}</ref><ref>{{Cite journal|title = अवतल-उत्तल अनुकूली अस्वीकृति नमूनाकरण|journal = Journal of Computational and Graphical Statistics|date = 2011-01-01|issn = 1061-8600|pages = 670–691|volume = 20|issue = 3|doi = 10.1198/jcgs.2011.09058|first = Dilan|last = Görür|first2 = Yee Whye|last2 = Teh}}</ref> इसके अतिरिक्त, एआरएस और मेट्रोपोलिस-हेस्टिंग्स पद्धति के विभिन्न संयोजनों को सार्वभौमिक सैम्पलर प्राप्त करने के लिए डिज़ाइन किया गया है जो स्व-ट्यूनिंग प्रस्ताव घनत्व बनाता है (यानी, प्रस्ताव स्वचालित रूप से निर्मित और लक्ष्य के लिए अनुकूलित)। विधियों के इस वर्ग को अधिकांशतः एडेप्टिव रिजेक्शन मेट्रोपोलिस सैंपलिंग (एआरएमएस) एल्गोरिदम कहा जाता है।<ref>{{Cite journal|title = गिब्स सैंपलिंग के भीतर अनुकूली अस्वीकृति मेट्रोपोलिस नमूनाकरण|jstor = 2986138|journal = Journal of the Royal Statistical Society |series=Series C (Applied Statistics)|date = 1995-01-01|pages = 455–472|volume = 44|issue = 4|doi = 10.2307/2986138|first = W. R.|last = Gilks|first2 = N. G.|last2 = Best|author2-link= Nicky Best |first3 = K. K. C.|last3 = Tan}}</ref><ref>{{Cite journal|title = Adaptive rejection Metropolis sampling using Lagrange interpolation polynomials of degree 2|journal = Computational Statistics & Data Analysis|date = 2008-03-15|pages = 3408–3423|volume = 52|issue = 7|doi = 10.1016/j.csda.2008.01.005|first = Renate|last = Meyer|first2 = Bo|last2 = Cai|first3 = François|last3 = Perron}}</ref> परिणामी अनुकूली तकनीकों को हमेशा प्रयुक्त किया जा सकता है लेकिन उत्पन्न नमूने इस स्थितियों में सहसंबद्ध होते हैं (हालांकि पुनरावृत्तियों की संख्या बढ़ने पर सहसंबंध जल्दी से शून्य हो जाता है)।


== यह भी देखें ==
== यह भी देखें ==
Line 135: Line 135:
==अग्रिम पठन==
==अग्रिम पठन==
*{{cite book |last=Robert |first=C. P. |last2=Casella |first2=G. |title=Monte Carlo Statistical Methods |edition=Second |location=New York |publisher=Springer-Verlag |year=2004 }}
*{{cite book |last=Robert |first=C. P. |last2=Casella |first2=G. |title=Monte Carlo Statistical Methods |edition=Second |location=New York |publisher=Springer-Verlag |year=2004 }}
[[Category: मोंटे कार्लो के तरीके]] [[Category: गैर-समान यादृच्छिक संख्याएँ]]


 
[[Category:CS1 English-language sources (en)]]
 
[[Category: Machine Translated Page]]
[[Category:Created On 21/03/2023]]
[[Category:Created On 21/03/2023]]
[[Category:Lua-based templates]]
[[Category:Machine Translated Page]]
[[Category:Pages with script errors]]
[[Category:Short description with empty Wikidata description]]
[[Category:Templates Vigyan Ready]]
[[Category:Templates that add a tracking category]]
[[Category:Templates that generate short descriptions]]
[[Category:Templates using TemplateData]]
[[Category:गैर-समान यादृच्छिक संख्याएँ]]
[[Category:मोंटे कार्लो के तरीके]]

Latest revision as of 10:40, 17 April 2023

संख्यात्मक विश्लेषण और कम्प्यूटेशनल आंकड़ों में, अस्वीकृति नमूनाकरण मूल तकनीक है जिसका उपयोग संभाव्यता वितरण से अवलोकन उत्पन्न करने के लिए किया जाता है। इसे सामान्यतः स्वीकृति-अस्वीकृति विधि या स्वीकार-अस्वीकार एल्गोरिथम भी कहा जाता है और यह एक प्रकार की स्पष्ट सिमुलेशन विधि है। यह विधि किसी भी वितरण संभाव्यता घनत्व फलन के साथ के लिए काम करती है।

अस्वीकृति नमूनाकरण अवलोकन पर आधारित है कि आयाम में यादृच्छिक चर का नमूना लेने के लिए, द्वि-आयामी कार्टेशियन ग्राफ का समान रूप से यादृच्छिक नमूनाकरण कर सकता है, और इसके घनत्व फलन के ग्राफ के अंतर्गत क्षेत्र में नमूने रख सकता है।[1][2][3] ध्यान दें कि इस संपत्ति को n-आयाम कार्यों तक बढ़ाया जा सकता है।

विवरण

रिजेक्शन सैंपलिंग के पीछे की प्रेरणा की कल्पना करने के लिए, बड़े आयताकार बोर्ड पर यादृच्छिक चर के घनत्व फलन को ग्राफ़ करने और उस पर डार्ट्स फेंकने की कल्पना करें। मान लें कि डार्ट्स समान रूप से बोर्ड के चारों ओर वितरित किए जाते हैं। अब उन सभी डार्ट्स को हटा दें जो वक्र के नीचे के क्षेत्र से बाहर हैं। शेष डार्ट्स वक्र के अंतर्गत क्षेत्र के अन्दर समान रूप से वितरित किए जाएंगे, और इन डार्ट्स के x-पोजिशन को यादृच्छिक चर के घनत्व के अनुसार वितरित किया जाएगा। ऐसा इसलिए है क्योंकि डार्ट्स के लिए सबसे अधिक जगह है जहां वक्र उच्चतम है और इस प्रकार संभाव्यता घनत्व सबसे बड़ा है।

दृश्य जैसा कि अभी वर्णित किया गया है, अस्वीकृति नमूनाकरण के विशेष रूप के बराबर है जहाँ प्रस्ताव वितरण समान है (इसलिए इसका ग्राफ़ आयत है)। अस्वीकृति नमूनाकरण का सामान्य रूप मानता है कि बोर्ड आवश्यक रूप से आयताकार नहीं है, लेकिन कुछ प्रस्ताव वितरण के घनत्व के अनुसार आकार दिया गया है, जिसे हम जानते हैं कि कैसे नमूना लेना है (उदाहरण के लिए, उल्टा नमूनाकरण का उपयोग करके), और जो कम से कम हर बार उच्च है उस वितरण के रूप में इंगित करें जिससे हम नमूना लेना चाहते हैं, ताकि पूर्व पूरी तरह से उत्तरार्द्ध को घेर ले। (अन्यथा, घुमावदार क्षेत्र के कुछ भाग होंगे जिनसे हम नमूना लेना चाहते हैं, कभी नहीं पहुंचा जा सकता।)

अस्वीकृति नमूना निम्नानुसार काम करता है:

  1. प्रस्ताव वितरण से x-अक्ष पर बिंदु का नमूना लें।
  2. प्रस्ताव वितरण के प्रायिकता घनत्व फलन के अधिकतम y- मान तक, इस x- स्थिति पर लंबवत रेखा बनाएं।
  3. इस रेखा के साथ समान रूप से 0 से अधिकतम संभाव्यता घनत्व फलन का नमूना लें। यदि नमूनाकृत मान इस लंबवत रेखा पर वांछित वितरण के मान से अधिक है, तो x-मान को अस्वीकार करें और चरण 1 पर वापस लौटें; अन्यथा x-मान वांछित वितरण से नमूना है।

इस एल्गोरिथ्म का उपयोग किसी भी वक्र के अंतर्गत क्षेत्र से नमूना लेने के लिए किया जा सकता है, भले ही फलन 1 को एकीकृत करता हो या नहीं। वास्तव में, किसी फलन को स्थिरांक द्वारा स्केल करने से नमूना x-स्थितियों पर कोई प्रभाव नहीं पड़ता है। इस प्रकार, एल्गोरिथ्म का उपयोग ऐसे वितरण से नमूना लेने के लिए किया जा सकता है जिसका सामान्यीकरण स्थिरांक अज्ञात है, जो कम्प्यूटेशनल आंकड़ों में सामान्य है।

सिद्धांत

रिजेक्शन सैंपलिंग पद्धति लक्ष्य वितरण से सैंपलिंग मान उत्पन्न करती है मनमाने ढंग से संभाव्यता घनत्व फलन के साथ प्रस्ताव वितरण का उपयोग करके संभाव्यता घनत्व के साथ . विचार यह है कि कोई नमूना मूल्य उत्पन्न कर सकता है इसके अतिरिक्त से नमूना लेना और से नमूना स्वीकार करना संभावना के साथ , ड्रॉ को दोहराते हुए जब तक कोई मान स्वीकार नहीं किया जाता। यहाँ संभावना अनुपात पर स्थिर, परिमित सीमा है , संतुष्टि देने वाला के समर्थन (गणित) पर ; दूसरे शब्दों में, एम को संतुष्ट करना चाहिए के सभी मूल्यों के लिए . ध्यान दें कि इसके लिए समर्थन की आवश्यकता है का समर्थन सम्मिलित करना चाहिए -दूसरे शब्दों में, जब कभी भी .है।

इस पद्धति का सत्यापन आवरण सिद्धांत है: जोड़ी का अनुकरण करते समय , एक के सबग्राफ पर समान सिमुलेशन का उत्पादन करता है . केवल ऐसी जोड़ियों को स्वीकार करना फिर जोड़े उत्पन करता है के सबग्राफ पर समान रूप से वितरित और इस प्रकार, आंशिक रूप से, अनुकरण इसका मतलब यह है कि, पर्याप्त प्रतिकृति के साथ, एल्गोरिथम वांछित वितरण से नमूना उत्पन्न करता है . इस एल्गोरिथम के लिए कई एक्सटेंशन हैं, जैसे मेट्रोपोलिटन एल्गोरिथम कहते है।

यह विधि मोंटे कार्लो पद्धति तकनीकों के सामान्य क्षेत्र से संबंधित है, जिसमें मार्कोव चेन मोंटे कार्लो एल्गोरिदम सम्मिलित हैं जो लक्ष्य वितरण से अनुकरण प्राप्त करने के लिए प्रॉक्सी वितरण का भी उपयोग करते हैं। . यह मेट्रोपोलिस एल्गोरिथम जैसे एल्गोरिदम के लिए आधार बनाता है।

बिना शर्त स्वीकृति संभावना प्रस्तावित नमूनों का अनुपात है जो स्वीकार किए जाते हैं, जो है।

कहाँ , और का मूल्य हर बार घनत्व फलन के अंतर्गत उत्पन्न होता है प्रस्ताव वितरण के संबंध में है.

से आवश्यक नमूनों की संख्या स्वीकृत मूल्य प्राप्त करने के लिए इस प्रकार संभाव्यता के साथ ज्यामितीय वितरण होता है , जिसका मतलब है . सहज रूप से, एल्गोरिथम की कम्प्यूटेशनल जटिलता के माप के रूप में आवश्यक पुनरावृत्तियों की अपेक्षित संख्या है।

उपरोक्त समीकरण को फिर से लिखें,

ध्यान दें कि , उपरोक्त सूत्र के कारण, जहाँ प्रायिकता है जो अंतराल में केवल मान ले सकती है . कब के समीप चुना जाता है, बिना शर्त स्वीकृति की संभावना उतनी ही अधिक होती है, जितना कम अनुपात भिन्न होता है, क्योंकि संभावना अनुपात के लिए ऊपरी सीमा है . व्यवहार में, का मूल्य के करीब को प्राथमिकता दी जाती है क्योंकि इसका तात्पर्य कम अस्वीकृत नमूनों से है, औसतन, और इस प्रकार एल्गोरिथम के कम पुनरावृत्तियों। इस अर्थ में, कोई लेना पसंद करता है जितना संभव हो उतना छोटा (अभी भी संतुष्ट करते हुए , जिससे पता चलता है सम्मिलित समान होना चाहिए किसी तरह। चूंकि, ध्यान दें 1 के बराबर नहीं हो सकता: ऐसा इसका अर्थ होगा , यानी कि लक्ष्य और प्रस्ताव वितरण वास्तव में समान वितरण हैं।

अस्वीकृति नमूनाकरण का उपयोग अधिकांशतः उन स्थितियों में किया जाता है जहां प्रपत्र नमूनाकरण को कठिन बनाता है। अस्वीकृति एल्गोरिथम के एकल पुनरावृत्ति के लिए प्रस्ताव वितरण से नमूने लेने, समान वितरण से आरेखण करने और प्रस्ताव का मूल्यांकन करने की आवश्यकता होती है अभिव्यक्ति। इस प्रकार अस्वीकृति नमूनाकरण किसी अन्य विधि की तुलना में अधिक कुशल होता है जब भी इन कार्यों की m गुना लागत - जो अस्वीकृति नमूनाकरण के साथ नमूना प्राप्त करने की अपेक्षित लागत होती है - अन्य विधि का उपयोग करके नमूना प्राप्त करने की लागत से कम होती है।

एल्गोरिथम

एल्गोरिथम, जिसका उपयोग जॉन वॉन न्यूमैन द्वारा किया गया था[4] और जॉर्जेस-लुई लेक्लेर, कॉम्टे डे बफन और बफन की सुई के समय से है,[5] वितरण से नमूना प्राप्त करता है घनत्व के साथ वितरण से नमूने का उपयोग करना घनत्व के साथ निम्नलिखित :

  • नमूना प्राप्त करें वितरण से और नमूना से (इकाई अंतराल पर समान वितरण)।
  • चेक करें या नहीं .
    • यदि यह मान्य है, तो स्वीकार करें से लिए गए नमूने के रूप में ;है।
    • यदि नहीं, के मूल्य को अस्वीकार करें और नमूनाकरण चरण पर लौटें।

एल्गोरिदम औसत लेगा पुनरावृत्तियाँ नमूना प्राप्त करने के लिए ।

सहज विधियों का उपयोग करके नमूनाकरण पर लाभ

कुछ स्थितियों में सरल तरीकों की तुलना में अस्वीकृति नमूनाकरण कहीं अधिक कुशल हो सकता है। उदाहरण के लिए, नमूनाकरण के रूप में समस्या दी गई है सशर्त रूप से सेट दिया , अर्थात।, , कभी-कभी भोली विधियों का उपयोग करके आसानी से अनुकरण किया जा सकता है (उदाहरण के लिए प्रतिलोम रूपांतरण नमूनाकरण द्वारा):

  • नमूना स्वतंत्र रूप से, और उन्हें संतुष्ट करने वालों को छोड़ दें * आउटपुट:

समस्या यह है कि यह नमूनाकरण कठिन और अक्षम हो सकता है, यदि . पुनरावृत्तियों की अपेक्षित संख्या होगी , जो अनंत के करीब हो सकता है। इसके अतिरिक्त, जब आप अस्वीकृति नमूनाकरण विधि प्रयुक्त करते हैं, तब भी बाउंड को अनुकूलित करना हमेशा कठिन होता है संभावना अनुपात के लिए अधिक से अधिक, बड़ा है और अस्वीकृति दर अधिक है, एल्गोरिथ्म बहुत अक्षम हो सकता है। प्राकृतिक घातीय परिवार (यदि यह उपस्थित है), जिसे घातीय झुकाव के रूप में भी जाना जाता है, प्रस्ताव वितरण का वर्ग प्रदान करता है जो गणना जटिलता को कम कर सकता है, का मान और संगणनाओं को गति दें (उदाहरण देखें: प्राकृतिक घातीय परिवारों के साथ काम करना)।

उदाहरण: प्राकृतिक घातीय परिवारों के साथ काम करना

यादृच्छिक चर दिया , लक्ष्य वितरण है। सादगी के लिए मान लें, घनत्व फलन स्पष्ट रूप से लिखा जा सकता है . प्रस्ताव को इस रूप में चुनें

जहाँ और . स्पष्ट रूप से, , प्राकृतिक घातीय परिवार से है। इसके अतिरिक्त, संभावना अनुपात है।
ध्यान दें कि तात्पर्य यह है कि यह वास्तव में लॉग क्षण-उत्पन्न करने वाला कार्य है। मोमेंट-जेनरेशन फलन, यानी . और प्रस्ताव के लॉग क्षण-सृजन फलन को प्राप्त करना आसान है और इसलिए प्रस्ताव के क्षण।
साधारण उदाहरण के रूप में, मान लीजिए , , साथ . लक्ष्य नमूना लेना है , . विश्लेषण इस प्रकार है।

  • प्रस्ताव वितरण का रूप चुनें , लॉग मोमेंट-जेनरेटिंग फलन के रूप में , जिसका अर्थ है कि यह सामान्य वितरण है .
  • अच्छी तरह से चुने गए का फैसला करें प्रस्ताव वितरण के लिए इस सेटअप में, चुनने का सहज विधि लगाना है , वह है
  • स्पष्ट रूप से लक्ष्य, प्रस्ताव और संभावना अनुपात लिखें
  • सीमा प्राप्त करें संभावना अनुपात के लिए , जो कि घटता हुआ कार्य है , इसलिए
  • अस्वीकृति नमूनाकरण मानदंड: के लिए , अगर
    रखता है, का मान स्वीकार करता है ; यदि नहीं, तो नया नमूना लेना जारी रखें और नया स्वीकृति तक।

उपरोक्त उदाहरण के लिए, दक्षता की माप के रूप में, पुनरावृत्तियों की अपेक्षित संख्या एनईएफ-आधारित अस्वीकृति नमूना पद्धति क्रम b की है, अर्थात , जबकि भोली पद्धति के अंतर्गत, पुनरावृत्तियों की अपेक्षित संख्या है , जो कहीं अधिक अक्षम है।

सामान्यतः, घातीय झुकाव, प्रस्ताव वितरण का पैरामीट्रिक वर्ग, अपने उपयोगी गुणों के साथ अनुकूलन समस्याओं को आसानी से हल करता है जो सीधे प्रस्ताव के वितरण की विशेषता बताते हैं। इस प्रकार की समस्या के लिए अनुकरण करना सशर्त रूप से , सरल वितरण के वर्ग के बीच, एनईएफ का उपयोग करने की चाल है, जो जटिलता पर कुछ नियंत्रण प्राप्त करने में सहायता करती है और गणना को काफी तेज करती है। दरअसल, एनईएफ का उपयोग करने के गहरे गणितीय कारण हैं।

कमियां

यदि नमूना लिया जा रहा कार्य निश्चित क्षेत्र में अत्यधिक केंद्रित है, उदाहरण के लिए फलन जिसमें किसी स्थान पर स्पाइक है, तो अस्वीकृति नमूनाकरण से बहुत सारे अवांछित नमूने लिए जा सकते हैं। कई वितरणों के लिए, इस समस्या को अनुकूली विस्तार (देखें अनुकूली अस्वीकृति नमूनाकरण) का उपयोग करके या यूनिफार्म के अनुपात की विधि के साथ चर के उचित परिवर्तन के साथ हल किया जा सकता है। इसके अतिरिक्त, जैसे-जैसे समस्या का आयाम बड़ा होता जाता है, एम्बेडिंग वॉल्यूम के कोनों में एम्बेडेड वॉल्यूम का अनुपात शून्य की ओर बढ़ता जाता है, इस प्रकार उपयोगी नमूना उत्पन्न होने से पहले बहुत सारे अस्वीकरण हो सकते हैं, इस प्रकार एल्गोरिथम को अक्षम बना दिया जाता है और अव्यावहारिक। आयामीता का अपवाद देखें। उच्च आयामों में, अलग दृष्टिकोण का उपयोग करना आवश्यक है, सामान्यतः मार्कोव श्रृंखला मोंटे कार्लो विधि जैसे मेट्रोपोलिस नमूनाकरण या गिब्स नमूनाकरण। (चूंकि, गिब्स नमूनाकरण, जो बहु-आयामी नमूनाकरण समस्या को निम्न-आयामी नमूनों की श्रृंखला में विभाजित करता है, इसके चरण के रूप में अस्वीकृति नमूनाकरण का उपयोग कर सकता है।)

अनुकूली अस्वीकृति नमूनाकरण

कई वितरणों के लिए, ऐसा प्रस्ताव वितरण खोजना मुश्किल है जिसमें बहुत अधिक बर्बाद जगह के बिना दिए गए वितरण को सम्मिलित किया गया हो। अस्वीकृति नमूनाकरण का विस्तार जिसका उपयोग इस कठिनाई को दूर करने के लिए किया जा सकता है और विभिन्न प्रकार के वितरणों से कुशलता से नमूना लिया जा सकता है (बशर्ते कि उनके पास लॉगरिदमिक रूप से अवतल कार्य हो। लॉग-अवतल घनत्व कार्य, जो वास्तव में अधिकांश सामान्य वितरणों के स्थितियों में है- यहां तक ​​​​कि जिनके घनत्व कार्य स्वयं अवतल नहीं हैं) को 'अनुकूली अस्वीकृति नमूनाकरण (एआरएस)' के रूप में जाना जाता है।

1992 में गिल्क्स द्वारा अंततः पेश की गई इस तकनीक के लिए तीन मूल विचार हैं:[6]

  1. यदि यह सहायता करता है, तो इसके अतिरिक्त लॉग स्पेस (जैसे लॉग-प्रायिकता या लॉग-घनत्व) में अपने लिफाफा वितरण को परिभाषित करें। यानी साथ काम करें के अतिरिक्त सीधे।
    • अधिकांशतः, जिन वितरणों में बीजगणितीय रूप से गड़बड़ घनत्व कार्य होते हैं, उनके पास यथोचित सरल लॉग घनत्व कार्य होते हैं (अर्थात जब गन्दा है, के साथ काम करना सरल हो सकता है या कम से कम, टुकड़ों में रैखिक के करीब)।
  2. समान लिफ़ाफ़ा घनत्व फलन के अतिरिक्त, अपने लिफाफे के रूप में टुकड़ा-वार रैखिक घनत्व फलन का उपयोग करें।
    • हर बार जब आपको किसी नमूने को अस्वीकार करना हो, तो आप के मान का उपयोग कर सकते हैं जिसका आपने मूल्यांकन किया है, टुकड़ों के सन्निकटन में सुधार करने के लिए . इससे आपके अगले प्रयास के अस्वीकृत होने की संभावना कम हो जाती है। असम्बद्ध रूप से, आपके नमूने को अस्वीकार करने की आवश्यकता की संभावना शून्य हो जानी चाहिए, और व्यवहार में, अधिकांशतः बहुत तेज़ी से।
    • जैसा कि प्रस्तावित है, किसी भी समय हम ऐसा बिंदु चुनते हैं जिसे अस्वीकार कर दिया जाता है, हम लिफाफे को अन्य रेखा खंड के साथ कसते हैं जो उस बिंदु पर स्पर्शरेखा है जो चुने गए बिंदु के समान x-निर्देशांक के साथ है।
    • प्रस्ताव लॉग वितरण का टुकड़ावार रेखीय मॉडल टुकड़ेवार घातीय वितरण के सेट में परिणाम देता है (यानी एक या अधिक घातीय वितरण के खंड, अंत से अंत तक संलग्न)। घातीय वितरण अच्छी तरह से व्यवहार किया जाता है और अच्छी तरह से समझा जाता है। घातीय वितरण का लघुगणक सीधी रेखा है, और इसलिए इस पद्धति में अनिवार्य रूप से रेखा खंडों की श्रृंखला में घनत्व के लघुगणक को सम्मिलित करना सम्मिलित है। यह लॉग-अवतल प्रतिबंध का स्रोत है: यदि कोई वितरण लॉग-अवतल है, तो इसका लघुगणक अवतल (उल्टा-नीचे U जैसा आकार) है, जिसका अर्थ है कि वक्र के लिए स्पर्शरेखा रेखा खंड हमेशा वक्र के ऊपर से गुजरेगा।
    • यदि लॉग स्पेस में काम नहीं कर रहा है, तो टुकड़े के अनुसार रैखिक घनत्व फलन को त्रिकोण वितरण के माध्यम से भी नमूना लिया जा सकता है[7]
  3. मूल्यांकन की लागत से संभावित रूप से बचने के लिए हम (लॉग) समतलता आवश्यकता का और भी लाभ उठा सकते हैं जब आपका नमूना स्वीकार किया जाता है।
    • जैसे हम के मानों का उपयोग करके टुकड़े की रैखिक ऊपरी सीमा (लिफ़ाफ़ा फलन) का निर्माण कर सकते हैं कि हमें अस्वीकृति की वर्तमान श्रृंखला में मूल्यांकन करना था, हम इन मूल्यों का उपयोग करके टुकड़े की रैखिक निचली सीमा (निचोड़ने का कार्य) भी बना सकते हैं।
    • मूल्यांकन करने से पहले (संभावित महंगा) यह देखने के लिए कि आपका नमूना स्वीकार किया जाएगा या नहीं, हम पहले से ही जान सकते हैं कि यह (आदर्श रूप से सस्ता) के खिलाफ तुलना करके स्वीकार किया जाएगा या नहीं (या इस स्थितियों में) निचोड़ने का कार्य जो उपलब्ध है।
    • गिलक्स द्वारा सुझाए जाने पर भी यह निचोड़ने वाला कदम वैकल्पिक है। सर्वोत्तम रूप से यह आपको आपके (गड़बड़ और/या महंगे) लक्ष्य घनत्व के केवल अतिरिक्त मूल्यांकन से बचाता है। चूंकि, संभवतः विशेष रूप से महंगे घनत्व कार्यों के लिए (और शून्य की ओर अस्वीकृति दर के तेजी से अभिसरण को मानते हुए) यह अंतिम रनटाइम में बड़ा अंतर बना सकता है।

इस पद्धति में अनिवार्य रूप से सीधी-रेखा खंडों के लिफाफे को क्रमिक रूप से निर्धारित करना सम्मिलित है जो लघुगणक को बेहतर और अच्छा बनाता है, जबकि अभी भी वक्र के ऊपर शेष है, निश्चित संख्या में खंडों (संभवतः केवल स्पर्शरेखा रेखा) से प्रारंभ होता है। छोटे घातीय यादृच्छिक चर से नमूनाकरण सीधा है। बस समान यादृच्छिक चर का लॉग लें (उचित अंतराल और संबंधित ट्रंकेशन के साथ)।

दुर्भाग्य से, एआरएस को केवल लॉग-अवतल लक्ष्य घनत्व से नमूनाकरण से ही प्रयुक्त किया जा सकता है। इस कारण से, गैर-लॉग-अवतल लक्ष्य वितरण से निपटने के लिए साहित्य में एआरएस के कई विस्तार प्रस्तावित किए गए हैं।[8][9][10] इसके अतिरिक्त, एआरएस और मेट्रोपोलिस-हेस्टिंग्स पद्धति के विभिन्न संयोजनों को सार्वभौमिक सैम्पलर प्राप्त करने के लिए डिज़ाइन किया गया है जो स्व-ट्यूनिंग प्रस्ताव घनत्व बनाता है (यानी, प्रस्ताव स्वचालित रूप से निर्मित और लक्ष्य के लिए अनुकूलित)। विधियों के इस वर्ग को अधिकांशतः एडेप्टिव रिजेक्शन मेट्रोपोलिस सैंपलिंग (एआरएमएस) एल्गोरिदम कहा जाता है।[11][12] परिणामी अनुकूली तकनीकों को हमेशा प्रयुक्त किया जा सकता है लेकिन उत्पन्न नमूने इस स्थितियों में सहसंबद्ध होते हैं (हालांकि पुनरावृत्तियों की संख्या बढ़ने पर सहसंबंध जल्दी से शून्य हो जाता है)।

यह भी देखें

संदर्भ

  1. Casella, George; Robert, Christian P.; Wells, Martin T. (2004). सामान्यीकृत स्वीकार-अस्वीकार नमूना योजनाएँ. Institute of Mathematical Statistics. pp. 342–347. doi:10.1214/lnms/1196285403. ISBN 9780940600614.
  2. Neal, Radford M. (2003). "Slice Sampling". Annals of Statistics. 31 (3): 705–767. doi:10.1214/aos/1056562461. MR 1994729. Zbl 1051.65007.
  3. Bishop, Christopher (2006). "11.4: Slice sampling". Pattern Recognition and Machine Learning. Springer. ISBN 978-0-387-31073-2.
  4. Forsythe, George E. (1972). "सामान्य और अन्य वितरणों से यादृच्छिक नमूनाकरण के लिए वॉन न्यूमैन की तुलना विधि". Mathematics of Computation. 26 (120): 817–826. doi:10.2307/2005864. ISSN 0025-5718.
  5. Legault, Geoffrey; Melbourne, Brett A. (2019-03-01). "निरंतर समय के स्टोकेस्टिक जनसंख्या मॉडल में पर्यावरण परिवर्तन के लिए लेखांकन". Theoretical Ecology (in English). 12 (1): 31–48. doi:10.1007/s12080-018-0386-z. ISSN 1874-1746.
  6. Gilks, W. R.; Wild, P. (1992). "गिब्स नमूनाकरण के लिए अनुकूली अस्वीकृति नमूनाकरण". Journal of the Royal Statistical Society. Series C (Applied Statistics). 41 (2): 337–348. doi:10.2307/2347565.
  7. Thomas, D. B.; Luk, W. (2007). "टुकड़े-टुकड़े रैखिक अनुमानों के माध्यम से गैर-समान यादृच्छिक संख्या पीढ़ी". IET Computers & Digital Techniques. 1 (4): 312–321. doi:10.1049/iet-cdt:20060188.
  8. Hörmann, Wolfgang (1995-06-01). "टी-अवतल वितरण से नमूनाकरण के लिए एक अस्वीकृति तकनीक". ACM Trans. Math. Softw. 21 (2): 182–193. CiteSeerX 10.1.1.56.6055. doi:10.1145/203082.203089. ISSN 0098-3500.
  9. Evans, M.; Swartz, T. (1998-12-01). "रूपांतरित घनत्वों के अवतल गुणों का उपयोग करते हुए यादृच्छिक चर उत्पादन". Journal of Computational and Graphical Statistics. 7 (4): 514–528. CiteSeerX 10.1.1.53.9001. doi:10.2307/1390680. JSTOR 1390680.
  10. Görür, Dilan; Teh, Yee Whye (2011-01-01). "अवतल-उत्तल अनुकूली अस्वीकृति नमूनाकरण". Journal of Computational and Graphical Statistics. 20 (3): 670–691. doi:10.1198/jcgs.2011.09058. ISSN 1061-8600.
  11. Gilks, W. R.; Best, N. G.; Tan, K. K. C. (1995-01-01). "गिब्स सैंपलिंग के भीतर अनुकूली अस्वीकृति मेट्रोपोलिस नमूनाकरण". Journal of the Royal Statistical Society. Series C (Applied Statistics). 44 (4): 455–472. doi:10.2307/2986138. JSTOR 2986138.
  12. Meyer, Renate; Cai, Bo; Perron, François (2008-03-15). "Adaptive rejection Metropolis sampling using Lagrange interpolation polynomials of degree 2". Computational Statistics & Data Analysis. 52 (7): 3408–3423. doi:10.1016/j.csda.2008.01.005.


अग्रिम पठन

  • Robert, C. P.; Casella, G. (2004). Monte Carlo Statistical Methods (Second ed.). New York: Springer-Verlag.