अस्वीकृति नमूनाकरण: Difference between revisions

From Vigyanwiki
(Created page with "{{Short description|Computational statistics technique}} संख्यात्मक विश्लेषण और कम्प्यूटेशनल आंकड़ो...")
 
No edit summary
Line 1: Line 1:
{{Short description|Computational statistics technique}}
{{Short description|Computational statistics technique}}
संख्यात्मक विश्लेषण और कम्प्यूटेशनल आंकड़ों में, अस्वीकृति नमूनाकरण एक मूल तकनीक है जिसका उपयोग संभाव्यता वितरण से अवलोकन उत्पन्न करने के लिए किया जाता है। इसे आमतौर पर स्वीकृति-अस्वीकृति विधि या स्वीकार-अस्वीकार एल्गोरिथम भी कहा जाता है और यह एक प्रकार की सटीक सिमुलेशन विधि है। विधि किसी भी वितरण के लिए काम करती है <math>\mathbb{R}^m</math> संभाव्यता घनत्व समारोह के साथ।
संख्यात्मक विश्लेषण और कम्प्यूटेशनल आंकड़ों में, अस्वीकृति नमूनाकरण एक मूल तकनीक है जिसका उपयोग संभाव्यता वितरण से अवलोकन उत्पन्न करने के लिए किया जाता है। इसे सामान्यतः स्वीकृति-अस्वीकृति विधि या स्वीकार-अस्वीकार एल्गोरिथम भी कहा जाता है और यह एक प्रकार की सटीक सिमुलेशन विधि है। विधि किसी भी वितरण के लिए काम करती है <math>\mathbb{R}^m</math> संभाव्यता घनत्व फलन के साथ।


अस्वीकृति नमूनाकरण अवलोकन पर आधारित है कि एक आयाम में एक यादृच्छिक चर का नमूना लेने के लिए, द्वि-आयामी कार्टेशियन ग्राफ का एक समान रूप से यादृच्छिक नमूनाकरण कर सकता है, और इसके घनत्व समारोह के ग्राफ के तहत क्षेत्र में नमूने रख सकता है।<ref>{{Cite book|title = सामान्यीकृत स्वीकार-अस्वीकार नमूना योजनाएँ|pages = 342–347|doi = 10.1214/lnms/1196285403|first = George|last = Casella|first2 = Christian P.|last2 = Robert|first3 = Martin T.|last3 = Wells|isbn = 9780940600614|publisher = Institute of Mathematical Statistics|year = 2004}}</ref><ref name="radford03">{{cite journal
अस्वीकृति नमूनाकरण अवलोकन पर आधारित है कि एक आयाम में एक यादृच्छिक चर का नमूना लेने के लिए, द्वि-आयामी कार्टेशियन ग्राफ का एक समान रूप से यादृच्छिक नमूनाकरण कर सकता है, और इसके घनत्व समारोह के ग्राफ के तहत क्षेत्र में नमूने रख सकता है।<ref>{{Cite book|title = सामान्यीकृत स्वीकार-अस्वीकार नमूना योजनाएँ|pages = 342–347|doi = 10.1214/lnms/1196285403|first = George|last = Casella|first2 = Christian P.|last2 = Robert|first3 = Martin T.|last3 = Wells|isbn = 9780940600614|publisher = Institute of Mathematical Statistics|year = 2004}}</ref><ref name="radford03">{{cite journal
Line 17: Line 17:
   | chapter = 11.4: Slice sampling
   | chapter = 11.4: Slice sampling
   | isbn = 978-0-387-31073-2
   | isbn = 978-0-387-31073-2
}}</ref> ध्यान दें कि इस संपत्ति को एन-आयाम कार्यों तक बढ़ाया जा सकता है।
}}</ref> ध्यान दें कि इस संपत्ति को n-आयाम कार्यों तक बढ़ाया जा सकता है।


== विवरण ==
== विवरण ==
Line 100: Line 100:
== कमियां ==
== कमियां ==


यदि नमूना लिया जा रहा कार्य एक निश्चित क्षेत्र में अत्यधिक केंद्रित है, उदाहरण के लिए एक समारोह जिसमें किसी स्थान पर स्पाइक है, तो अस्वीकृति नमूनाकरण से बहुत सारे अवांछित नमूने लिए जा सकते हैं। कई वितरणों के लिए, इस समस्या को एक अनुकूली विस्तार (देखें # अनुकूली अस्वीकृति नमूनाकरण) का उपयोग करके या वर्दी के अनुपात की विधि के साथ चर के उचित परिवर्तन के साथ हल किया जा सकता है। इसके अलावा, जैसे-जैसे समस्या का आयाम बड़ा होता जाता है, एम्बेडिंग वॉल्यूम के कोनों में एम्बेडेड वॉल्यूम का अनुपात शून्य की ओर बढ़ता जाता है, इस प्रकार एक उपयोगी नमूना उत्पन्न होने से पहले बहुत सारे अस्वीकरण हो सकते हैं, इस प्रकार एल्गोरिथम को अक्षम बना दिया जाता है और अव्यावहारिक। आयामीता का अभिशाप देखें। उच्च आयामों में, एक अलग दृष्टिकोण का उपयोग करना आवश्यक है, आमतौर पर एक मार्कोव श्रृंखला मोंटे कार्लो विधि जैसे मेट्रोपोलिस नमूनाकरण या [[गिब्स नमूनाकरण]]। (हालांकि, गिब्स नमूनाकरण, जो एक बहु-आयामी नमूनाकरण समस्या को निम्न-आयामी नमूनों की एक श्रृंखला में विभाजित करता है, इसके एक चरण के रूप में अस्वीकृति नमूनाकरण का उपयोग कर सकता है।)
यदि नमूना लिया जा रहा कार्य एक निश्चित क्षेत्र में अत्यधिक केंद्रित है, उदाहरण के लिए एक समारोह जिसमें किसी स्थान पर स्पाइक है, तो अस्वीकृति नमूनाकरण से बहुत सारे अवांछित नमूने लिए जा सकते हैं। कई वितरणों के लिए, इस समस्या को एक अनुकूली विस्तार (देखें # अनुकूली अस्वीकृति नमूनाकरण) का उपयोग करके या वर्दी के अनुपात की विधि के साथ चर के उचित परिवर्तन के साथ हल किया जा सकता है। इसके अलावा, जैसे-जैसे समस्या का आयाम बड़ा होता जाता है, एम्बेडिंग वॉल्यूम के कोनों में एम्बेडेड वॉल्यूम का अनुपात शून्य की ओर बढ़ता जाता है, इस प्रकार एक उपयोगी नमूना उत्पन्न होने से पहले बहुत सारे अस्वीकरण हो सकते हैं, इस प्रकार एल्गोरिथम को अक्षम बना दिया जाता है और अव्यावहारिक। आयामीता का अभिशाप देखें। उच्च आयामों में, एक अलग दृष्टिकोण का उपयोग करना आवश्यक है, सामान्यतः एक मार्कोव श्रृंखला मोंटे कार्लो विधि जैसे मेट्रोपोलिस नमूनाकरण या [[गिब्स नमूनाकरण]]। (हालांकि, गिब्स नमूनाकरण, जो एक बहु-आयामी नमूनाकरण समस्या को निम्न-आयामी नमूनों की एक श्रृंखला में विभाजित करता है, इसके एक चरण के रूप में अस्वीकृति नमूनाकरण का उपयोग कर सकता है।)


== अनुकूली अस्वीकृति नमूनाकरण ==
== अनुकूली अस्वीकृति नमूनाकरण ==

Revision as of 16:24, 26 March 2023

संख्यात्मक विश्लेषण और कम्प्यूटेशनल आंकड़ों में, अस्वीकृति नमूनाकरण एक मूल तकनीक है जिसका उपयोग संभाव्यता वितरण से अवलोकन उत्पन्न करने के लिए किया जाता है। इसे सामान्यतः स्वीकृति-अस्वीकृति विधि या स्वीकार-अस्वीकार एल्गोरिथम भी कहा जाता है और यह एक प्रकार की सटीक सिमुलेशन विधि है। विधि किसी भी वितरण के लिए काम करती है संभाव्यता घनत्व फलन के साथ।

अस्वीकृति नमूनाकरण अवलोकन पर आधारित है कि एक आयाम में एक यादृच्छिक चर का नमूना लेने के लिए, द्वि-आयामी कार्टेशियन ग्राफ का एक समान रूप से यादृच्छिक नमूनाकरण कर सकता है, और इसके घनत्व समारोह के ग्राफ के तहत क्षेत्र में नमूने रख सकता है।[1][2][3] ध्यान दें कि इस संपत्ति को n-आयाम कार्यों तक बढ़ाया जा सकता है।

विवरण

रिजेक्शन सैंपलिंग के पीछे की प्रेरणा की कल्पना करने के लिए, एक बड़े आयताकार बोर्ड पर एक यादृच्छिक चर के घनत्व फ़ंक्शन को ग्राफ़ करने और उस पर डार्ट्स फेंकने की कल्पना करें। मान लें कि डार्ट्स समान रूप से बोर्ड के चारों ओर वितरित किए जाते हैं। अब उन सभी डार्ट्स को हटा दें जो वक्र के नीचे के क्षेत्र से बाहर हैं। शेष डार्ट्स वक्र के अंतर्गत क्षेत्र के भीतर समान रूप से वितरित किए जाएंगे, और इन डार्ट्स के एक्स-पोजिशन को यादृच्छिक चर के घनत्व के अनुसार वितरित किया जाएगा। ऐसा इसलिए है क्योंकि डार्ट्स के लिए सबसे अधिक जगह है जहां वक्र उच्चतम है और इस प्रकार संभाव्यता घनत्व सबसे बड़ा है।

विज़ुअलाइज़ेशन जैसा कि अभी वर्णित किया गया है, अस्वीकृति नमूनाकरण के एक विशेष रूप के बराबर है जहाँ प्रस्ताव वितरण एक समान है (इसलिए इसका ग्राफ़ एक आयत है)। अस्वीकृति नमूनाकरण का सामान्य रूप मानता है कि बोर्ड आवश्यक रूप से आयताकार नहीं है, लेकिन कुछ प्रस्ताव वितरण के घनत्व के अनुसार आकार दिया गया है, जिसे हम जानते हैं कि कैसे नमूना लेना है (उदाहरण के लिए, उलटा नमूनाकरण का उपयोग करके), और जो कम से कम हर बार उच्च है उस वितरण के रूप में इंगित करें जिससे हम नमूना लेना चाहते हैं, ताकि पूर्व पूरी तरह से उत्तरार्द्ध को घेर ले। (अन्यथा, घुमावदार क्षेत्र के कुछ हिस्से होंगे जिनसे हम नमूना लेना चाहते हैं, कभी नहीं पहुंचा जा सकता।)

अस्वीकृति नमूना निम्नानुसार काम करता है:

  1. प्रस्ताव वितरण से x-अक्ष पर एक बिंदु का नमूना लें।
  2. प्रस्ताव वितरण के प्रायिकता घनत्व फ़ंक्शन के अधिकतम y- मान तक, इस x- स्थिति पर एक लंबवत रेखा बनाएं।
  3. इस रेखा के साथ समान रूप से 0 से अधिकतम संभाव्यता घनत्व फ़ंक्शन का नमूना लें। यदि नमूनाकृत मान इस लंबवत रेखा पर वांछित वितरण के मान से अधिक है, तो x-मान को अस्वीकार करें और चरण 1 पर वापस लौटें; अन्यथा x-मान वांछित वितरण से एक नमूना है।

इस एल्गोरिथ्म का उपयोग किसी भी वक्र के तहत क्षेत्र से नमूना लेने के लिए किया जा सकता है, भले ही फ़ंक्शन 1 को एकीकृत करता हो या नहीं। वास्तव में, किसी फ़ंक्शन को स्थिरांक द्वारा स्केल करने से नमूना x-स्थितियों पर कोई प्रभाव नहीं पड़ता है। इस प्रकार, एल्गोरिथ्म का उपयोग एक ऐसे वितरण से नमूना लेने के लिए किया जा सकता है जिसका सामान्यीकरण स्थिरांक अज्ञात है, जो कम्प्यूटेशनल आंकड़ों में आम है।

सिद्धांत

रिजेक्शन सैंपलिंग पद्धति लक्ष्य वितरण से सैंपलिंग मान उत्पन्न करती है मनमाने ढंग से संभाव्यता घनत्व समारोह के साथ प्रस्ताव वितरण का उपयोग करके संभाव्यता घनत्व के साथ . विचार यह है कि कोई एक नमूना मूल्य उत्पन्न कर सकता है इसके बजाय से नमूना लेना और से नमूना स्वीकार करना संभावना के साथ , ड्रॉ को दोहराते हुए जब तक कोई मान स्वीकार नहीं किया जाता। यहाँ संभावना अनुपात पर एक स्थिर, परिमित सीमा है , संतुष्टि देने वाला के समर्थन (गणित) पर ; दूसरे शब्दों में, एम को संतुष्ट करना चाहिए के सभी मूल्यों के लिए . ध्यान दें कि इसके लिए समर्थन की आवश्यकता है का समर्थन शामिल करना चाहिए -दूसरे शब्दों में, जब कभी भी .

इस पद्धति का सत्यापन लिफाफा सिद्धांत है: जोड़ी का अनुकरण करते समय , एक के सबग्राफ पर एक समान सिमुलेशन का उत्पादन करता है . केवल ऐसी जोड़ियों को स्वीकार करना फिर जोड़े पैदा करता है के सबग्राफ पर समान रूप से वितरित और इस प्रकार, आंशिक रूप से, एक अनुकरण इसका मतलब यह है कि, पर्याप्त प्रतिकृति के साथ, एल्गोरिथम वांछित वितरण से एक नमूना उत्पन्न करता है . इस एल्गोरिथम के लिए कई एक्सटेंशन हैं, जैसे महानगर एल्गोरिथम

यह विधि मोंटे कार्लो पद्धति तकनीकों के सामान्य क्षेत्र से संबंधित है, जिसमें मार्कोव चेन मोंटे कार्लो एल्गोरिदम शामिल हैं जो लक्ष्य वितरण से अनुकरण प्राप्त करने के लिए प्रॉक्सी वितरण का भी उपयोग करते हैं। . यह मेट्रोपोलिस एल्गोरिथम जैसे एल्गोरिदम के लिए आधार बनाता है।

बिना शर्त स्वीकृति संभावना प्रस्तावित नमूनों का अनुपात है जो स्वीकार किए जाते हैं, जो है

कहाँ , और का मूल्य हर बार घनत्व समारोह के तहत उत्पन्न होता है प्रस्ताव वितरण के संबंध में .

से आवश्यक नमूनों की संख्या एक स्वीकृत मूल्य प्राप्त करने के लिए इस प्रकार संभाव्यता के साथ एक ज्यामितीय वितरण होता है , जिसका मतलब है . सहज रूप से, एल्गोरिथम की कम्प्यूटेशनल जटिलता के माप के रूप में आवश्यक पुनरावृत्तियों की अपेक्षित संख्या है।

उपरोक्त समीकरण को फिर से लिखें,

ध्यान दें कि , उपरोक्त सूत्र के कारण, जहाँ एक प्रायिकता है जो अंतराल में केवल मान ले सकती है . कब एक के करीब चुना जाता है, बिना शर्त स्वीकृति की संभावना उतनी ही अधिक होती है, जितना कम अनुपात भिन्न होता है, क्योंकि संभावना अनुपात के लिए ऊपरी सीमा है . व्यवहार में, का एक मूल्य 1 के करीब को प्राथमिकता दी जाती है क्योंकि इसका तात्पर्य कम अस्वीकृत नमूनों से है, औसतन, और इस प्रकार एल्गोरिथम के कम पुनरावृत्तियों। इस अर्थ में, कोई लेना पसंद करता है जितना संभव हो उतना छोटा (अभी भी संतुष्ट करते हुए , जिससे पता चलता है आम तौर पर समान होना चाहिए किसी तरह। हालाँकि, ध्यान दें 1 के बराबर नहीं हो सकता: ऐसा इसका मतलब होगा , यानी कि लक्ष्य और प्रस्ताव वितरण वास्तव में समान वितरण हैं।

अस्वीकृति नमूनाकरण का उपयोग अक्सर उन मामलों में किया जाता है जहां प्रपत्र नमूनाकरण को कठिन बनाता है। अस्वीकृति एल्गोरिथम के एकल पुनरावृत्ति के लिए प्रस्ताव वितरण से नमूने लेने, एक समान वितरण से आरेखण करने और प्रस्ताव का मूल्यांकन करने की आवश्यकता होती है अभिव्यक्ति। इस प्रकार अस्वीकृति नमूनाकरण किसी अन्य विधि की तुलना में अधिक कुशल होता है जब भी इन कार्यों की एम गुना लागत - जो अस्वीकृति नमूनाकरण के साथ नमूना प्राप्त करने की अपेक्षित लागत होती है - अन्य विधि का उपयोग करके नमूना प्राप्त करने की लागत से कम होती है।

एल्गोरिथम

एल्गोरिथम, जिसका उपयोग जॉन वॉन न्यूमैन द्वारा किया गया था[4] और जॉर्जेस-लुई लेक्लेर, कॉम्टे डे बफन और बफन की सुई के समय से है,[5] वितरण से एक नमूना प्राप्त करता है घनत्व के साथ वितरण से नमूने का उपयोग करना घनत्व के साथ निम्नलिखित नुसार:

  • नमूना प्राप्त करें वितरण से और एक नमूना से (इकाई अंतराल पर समान वितरण)।
  • चेक करें या नहीं .
    • यदि यह मान्य है, तो स्वीकार करें से लिए गए नमूने के रूप में ;
    • यदि नहीं, के मूल्य को अस्वीकार करें और नमूनाकरण कदम पर लौटें।

एल्गोरिदम औसत लेगा नमूना प्राप्त करने के लिए पुनरावृत्तियाँ।

भोली विधियों का उपयोग करके नमूनाकरण पर लाभ

कुछ स्थितियों में सरल तरीकों की तुलना में अस्वीकृति नमूनाकरण कहीं अधिक कुशल हो सकता है। उदाहरण के लिए, नमूनाकरण के रूप में एक समस्या दी गई है सशर्त रूप से सेट दिया , अर्थात।, , कभी-कभी भोली विधियों का उपयोग करके आसानी से अनुकरण किया जा सकता है (उदाहरण के लिए प्रतिलोम रूपांतरण नमूनाकरण द्वारा):

  • नमूना स्वतंत्र रूप से, और उन्हें संतुष्ट करने वालों को छोड़ दें * आउटपुट:

समस्या यह है कि यह नमूनाकरण कठिन और अक्षम हो सकता है, यदि . पुनरावृत्तियों की अपेक्षित संख्या होगी , जो अनंत के करीब हो सकता है। इसके अलावा, जब आप अस्वीकृति नमूनाकरण विधि लागू करते हैं, तब भी बाउंड को अनुकूलित करना हमेशा कठिन होता है संभावना अनुपात के लिए अधिक से अधिक, बड़ा है और अस्वीकृति दर अधिक है, एल्गोरिथ्म बहुत अक्षम हो सकता है। प्राकृतिक घातीय परिवार (यदि यह मौजूद है), जिसे घातीय झुकाव के रूप में भी जाना जाता है, प्रस्ताव वितरण का एक वर्ग प्रदान करता है जो गणना जटिलता को कम कर सकता है, का मान और संगणनाओं को गति दें (उदाहरण देखें: प्राकृतिक घातीय परिवारों के साथ काम करना)।

उदाहरण: प्राकृतिक घातीय परिवारों के साथ काम करना

एक यादृच्छिक चर दिया , लक्ष्य वितरण है। सादगी के लिए मान लें, घनत्व समारोह स्पष्ट रूप से लिखा जा सकता है . प्रस्ताव को इस रूप में चुनें

कहाँ और . स्पष्ट रूप से, , एक प्राकृतिक घातीय परिवार से है। इसके अलावा, संभावना अनुपात है
ध्यान दें कि तात्पर्य यह है कि यह वास्तव में एक लॉग क्षण-उत्पन्न करने वाला कार्य है। मोमेंट-जेनरेशन फंक्शन, यानी . और प्रस्ताव के लॉग क्षण-सृजन समारोह को प्राप्त करना आसान है और इसलिए प्रस्ताव के क्षण।
एक साधारण उदाहरण के रूप में, मान लीजिए , , साथ . लक्ष्य नमूना लेना है , . विश्लेषण इस प्रकार है।

  • प्रस्ताव वितरण का रूप चुनें , लॉग मोमेंट-जेनरेटिंग फ़ंक्शन के रूप में , जिसका अर्थ है कि यह एक सामान्य वितरण है .
  • अच्छी तरह से चुने गए का फैसला करें प्रस्ताव वितरण के लिए इस सेटअप में, चुनने का सहज तरीका लगाना है , वह है
  • स्पष्ट रूप से लक्ष्य, प्रस्ताव और संभावना अनुपात लिखें
  • सीमा प्राप्त करें संभावना अनुपात के लिए , जो कि एक घटता हुआ कार्य है , इसलिए
  • अस्वीकृति नमूनाकरण मानदंड: के लिए , अगर
    रखता है, का मान स्वीकार करता है ; यदि नहीं, तो नया नमूना लेना जारी रखें और नया स्वीकृति तक।

उपरोक्त उदाहरण के लिए, दक्षता की माप के रूप में, पुनरावृत्तियों की अपेक्षित संख्या एनईएफ-आधारित अस्वीकृति नमूना पद्धति क्रम बी की है, अर्थात , जबकि भोली पद्धति के तहत, पुनरावृत्तियों की अपेक्षित संख्या है , जो कहीं अधिक अक्षम है।

सामान्य तौर पर, घातीय झुकाव, प्रस्ताव वितरण का एक पैरामीट्रिक वर्ग, अपने उपयोगी गुणों के साथ अनुकूलन समस्याओं को आसानी से हल करता है जो सीधे प्रस्ताव के वितरण की विशेषता बताते हैं। इस प्रकार की समस्या के लिए अनुकरण करना सशर्त रूप से , सरल वितरण के वर्ग के बीच, एनईएफ का उपयोग करने की चाल है, जो जटिलता पर कुछ नियंत्रण हासिल करने में मदद करती है और गणना को काफी तेज करती है। दरअसल, एनईएफ का उपयोग करने के गहरे गणितीय कारण हैं।

कमियां

यदि नमूना लिया जा रहा कार्य एक निश्चित क्षेत्र में अत्यधिक केंद्रित है, उदाहरण के लिए एक समारोह जिसमें किसी स्थान पर स्पाइक है, तो अस्वीकृति नमूनाकरण से बहुत सारे अवांछित नमूने लिए जा सकते हैं। कई वितरणों के लिए, इस समस्या को एक अनुकूली विस्तार (देखें # अनुकूली अस्वीकृति नमूनाकरण) का उपयोग करके या वर्दी के अनुपात की विधि के साथ चर के उचित परिवर्तन के साथ हल किया जा सकता है। इसके अलावा, जैसे-जैसे समस्या का आयाम बड़ा होता जाता है, एम्बेडिंग वॉल्यूम के कोनों में एम्बेडेड वॉल्यूम का अनुपात शून्य की ओर बढ़ता जाता है, इस प्रकार एक उपयोगी नमूना उत्पन्न होने से पहले बहुत सारे अस्वीकरण हो सकते हैं, इस प्रकार एल्गोरिथम को अक्षम बना दिया जाता है और अव्यावहारिक। आयामीता का अभिशाप देखें। उच्च आयामों में, एक अलग दृष्टिकोण का उपयोग करना आवश्यक है, सामान्यतः एक मार्कोव श्रृंखला मोंटे कार्लो विधि जैसे मेट्रोपोलिस नमूनाकरण या गिब्स नमूनाकरण। (हालांकि, गिब्स नमूनाकरण, जो एक बहु-आयामी नमूनाकरण समस्या को निम्न-आयामी नमूनों की एक श्रृंखला में विभाजित करता है, इसके एक चरण के रूप में अस्वीकृति नमूनाकरण का उपयोग कर सकता है।)

अनुकूली अस्वीकृति नमूनाकरण

कई वितरणों के लिए, एक ऐसा प्रस्ताव वितरण खोजना मुश्किल है जिसमें बहुत अधिक बर्बाद जगह के बिना दिए गए वितरण को शामिल किया गया हो। अस्वीकृति नमूनाकरण का एक विस्तार जिसका उपयोग इस कठिनाई को दूर करने के लिए किया जा सकता है और विभिन्न प्रकार के वितरणों से कुशलता से नमूना लिया जा सकता है (बशर्ते कि उनके पास लॉगरिदमिक रूप से अवतल कार्य हो। लॉग-अवतल घनत्व कार्य, जो वास्तव में अधिकांश सामान्य वितरणों के मामले में है- यहां तक ​​​​कि जिनके घनत्व कार्य स्वयं अवतल नहीं हैं) को 'अनुकूली अस्वीकृति नमूनाकरण (ARS)' के रूप में जाना जाता है।

1992 में गिल्क्स द्वारा अंततः पेश की गई इस तकनीक के लिए तीन मूल विचार हैं:[6]

  1. यदि यह मदद करता है, तो इसके बजाय लॉग स्पेस (जैसे लॉग-प्रायिकता या लॉग-घनत्व) में अपने लिफाफा वितरण को परिभाषित करें। यानी साथ काम करें के बजाय सीधे।
    • अक्सर, जिन वितरणों में बीजगणितीय रूप से गड़बड़ घनत्व कार्य होते हैं, उनके पास यथोचित सरल लॉग घनत्व कार्य होते हैं (अर्थात जब गन्दा है, के साथ काम करना आसान हो सकता है या कम से कम, टुकड़ों में रैखिक के करीब)।
  2. एक समान लिफ़ाफ़ा घनत्व फ़ंक्शन के बजाय, अपने लिफाफे के रूप में एक टुकड़ा-वार रैखिक घनत्व फ़ंक्शन का उपयोग करें।
    • हर बार जब आपको किसी नमूने को अस्वीकार करना हो, तो आप के मान का उपयोग कर सकते हैं जिसका आपने मूल्यांकन किया है, टुकड़ों के सन्निकटन में सुधार करने के लिए . इससे आपके अगले प्रयास के अस्वीकृत होने की संभावना कम हो जाती है। असम्बद्ध रूप से, आपके नमूने को अस्वीकार करने की आवश्यकता की संभावना शून्य हो जानी चाहिए, और व्यवहार में, अक्सर बहुत तेज़ी से।
    • जैसा कि प्रस्तावित है, किसी भी समय हम एक ऐसा बिंदु चुनते हैं जिसे अस्वीकार कर दिया जाता है, हम लिफाफे को एक अन्य रेखा खंड के साथ कसते हैं जो उस बिंदु पर स्पर्शरेखा है जो चुने गए बिंदु के समान x-निर्देशांक के साथ है।
    • प्रस्ताव लॉग वितरण का टुकड़ावार रेखीय मॉडल टुकड़ेवार घातीय वितरण के एक सेट में परिणाम देता है (यानी एक या अधिक घातीय वितरण के खंड, अंत से अंत तक संलग्न)। घातीय वितरण अच्छी तरह से व्यवहार किया जाता है और अच्छी तरह से समझा जाता है। एक घातीय वितरण का लघुगणक एक सीधी रेखा है, और इसलिए इस पद्धति में अनिवार्य रूप से रेखा खंडों की एक श्रृंखला में घनत्व के लघुगणक को शामिल करना शामिल है। यह लॉग-अवतल प्रतिबंध का स्रोत है: यदि कोई वितरण लॉग-अवतल है, तो इसका लघुगणक अवतल (उल्टा-नीचे U जैसा आकार) है, जिसका अर्थ है कि वक्र के लिए स्पर्शरेखा रेखा खंड हमेशा वक्र के ऊपर से गुजरेगा।
    • यदि लॉग स्पेस में काम नहीं कर रहा है, तो एक टुकड़े के अनुसार रैखिक घनत्व फ़ंक्शन को त्रिकोण वितरण के माध्यम से भी नमूना लिया जा सकता है[7]
  3. मूल्यांकन की लागत से संभावित रूप से बचने के लिए हम (लॉग) समतलता आवश्यकता का और भी लाभ उठा सकते हैं जब आपका नमूना स्वीकार किया जाता है।
    • जैसे हम के मानों का उपयोग करके एक टुकड़े की रैखिक ऊपरी सीमा (लिफ़ाफ़ा फ़ंक्शन) का निर्माण कर सकते हैं कि हमें अस्वीकृति की वर्तमान श्रृंखला में मूल्यांकन करना था, हम इन मूल्यों का उपयोग करके एक टुकड़े की रैखिक निचली सीमा (निचोड़ने का कार्य) भी बना सकते हैं।
    • मूल्यांकन करने से पहले (संभावित महंगा) यह देखने के लिए कि आपका नमूना स्वीकार किया जाएगा या नहीं, हम पहले से ही जान सकते हैं कि यह (आदर्श रूप से सस्ता) के खिलाफ तुलना करके स्वीकार किया जाएगा या नहीं (या इस मामले में) निचोड़ने का कार्य जो उपलब्ध है।
    • गिलक्स द्वारा सुझाए जाने पर भी यह निचोड़ने वाला कदम वैकल्पिक है। सर्वोत्तम रूप से यह आपको आपके (गड़बड़ और/या महंगे) लक्ष्य घनत्व के केवल एक अतिरिक्त मूल्यांकन से बचाता है। हालाँकि, संभवतः विशेष रूप से महंगे घनत्व कार्यों के लिए (और शून्य की ओर अस्वीकृति दर के तेजी से अभिसरण को मानते हुए) यह अंतिम रनटाइम में एक बड़ा अंतर बना सकता है।

इस पद्धति में अनिवार्य रूप से सीधी-रेखा खंडों के एक लिफाफे को क्रमिक रूप से निर्धारित करना शामिल है जो लघुगणक को बेहतर और बेहतर बनाता है, जबकि अभी भी वक्र के ऊपर शेष है, निश्चित संख्या में खंडों (संभवतः केवल एक स्पर्शरेखा रेखा) से शुरू होता है। एक छोटे घातीय यादृच्छिक चर से नमूनाकरण सीधा है। बस एक समान यादृच्छिक चर का लॉग लें (उचित अंतराल और संबंधित ट्रंकेशन के साथ)।

दुर्भाग्य से, एआरएस को केवल लॉग-अवतल लक्ष्य घनत्व से नमूनाकरण से ही लागू किया जा सकता है। इस कारण से, गैर-लॉग-अवतल लक्ष्य वितरण से निपटने के लिए साहित्य में एआरएस के कई विस्तार प्रस्तावित किए गए हैं।[8][9][10] इसके अलावा, एआरएस और मेट्रोपोलिस-हेस्टिंग्स पद्धति के विभिन्न संयोजनों को एक सार्वभौमिक सैम्पलर प्राप्त करने के लिए डिज़ाइन किया गया है जो एक स्व-ट्यूनिंग प्रस्ताव घनत्व बनाता है (यानी, एक प्रस्ताव स्वचालित रूप से निर्मित और लक्ष्य के लिए अनुकूलित)। विधियों के इस वर्ग को अक्सर एडेप्टिव रिजेक्शन मेट्रोपोलिस सैंपलिंग (एआरएमएस) एल्गोरिदम कहा जाता है।[11][12] परिणामी अनुकूली तकनीकों को हमेशा लागू किया जा सकता है लेकिन उत्पन्न नमूने इस मामले में सहसंबद्ध होते हैं (हालांकि पुनरावृत्तियों की संख्या बढ़ने पर सहसंबंध जल्दी से शून्य हो जाता है)।

यह भी देखें

संदर्भ

  1. Casella, George; Robert, Christian P.; Wells, Martin T. (2004). सामान्यीकृत स्वीकार-अस्वीकार नमूना योजनाएँ. Institute of Mathematical Statistics. pp. 342–347. doi:10.1214/lnms/1196285403. ISBN 9780940600614.
  2. Neal, Radford M. (2003). "Slice Sampling". Annals of Statistics. 31 (3): 705–767. doi:10.1214/aos/1056562461. MR 1994729. Zbl 1051.65007.
  3. Bishop, Christopher (2006). "11.4: Slice sampling". Pattern Recognition and Machine Learning. Springer. ISBN 978-0-387-31073-2.
  4. Forsythe, George E. (1972). "सामान्य और अन्य वितरणों से यादृच्छिक नमूनाकरण के लिए वॉन न्यूमैन की तुलना विधि". Mathematics of Computation. 26 (120): 817–826. doi:10.2307/2005864. ISSN 0025-5718.
  5. Legault, Geoffrey; Melbourne, Brett A. (2019-03-01). "निरंतर समय के स्टोकेस्टिक जनसंख्या मॉडल में पर्यावरण परिवर्तन के लिए लेखांकन". Theoretical Ecology (in English). 12 (1): 31–48. doi:10.1007/s12080-018-0386-z. ISSN 1874-1746.
  6. Gilks, W. R.; Wild, P. (1992). "गिब्स नमूनाकरण के लिए अनुकूली अस्वीकृति नमूनाकरण". Journal of the Royal Statistical Society. Series C (Applied Statistics). 41 (2): 337–348. doi:10.2307/2347565.
  7. Thomas, D. B.; Luk, W. (2007). "टुकड़े-टुकड़े रैखिक अनुमानों के माध्यम से गैर-समान यादृच्छिक संख्या पीढ़ी". IET Computers & Digital Techniques. 1 (4): 312–321. doi:10.1049/iet-cdt:20060188.
  8. Hörmann, Wolfgang (1995-06-01). "टी-अवतल वितरण से नमूनाकरण के लिए एक अस्वीकृति तकनीक". ACM Trans. Math. Softw. 21 (2): 182–193. CiteSeerX 10.1.1.56.6055. doi:10.1145/203082.203089. ISSN 0098-3500.
  9. Evans, M.; Swartz, T. (1998-12-01). "रूपांतरित घनत्वों के अवतल गुणों का उपयोग करते हुए यादृच्छिक चर उत्पादन". Journal of Computational and Graphical Statistics. 7 (4): 514–528. CiteSeerX 10.1.1.53.9001. doi:10.2307/1390680. JSTOR 1390680.
  10. Görür, Dilan; Teh, Yee Whye (2011-01-01). "अवतल-उत्तल अनुकूली अस्वीकृति नमूनाकरण". Journal of Computational and Graphical Statistics. 20 (3): 670–691. doi:10.1198/jcgs.2011.09058. ISSN 1061-8600.
  11. Gilks, W. R.; Best, N. G.; Tan, K. K. C. (1995-01-01). "गिब्स सैंपलिंग के भीतर अनुकूली अस्वीकृति मेट्रोपोलिस नमूनाकरण". Journal of the Royal Statistical Society. Series C (Applied Statistics). 44 (4): 455–472. doi:10.2307/2986138. JSTOR 2986138.
  12. Meyer, Renate; Cai, Bo; Perron, François (2008-03-15). "Adaptive rejection Metropolis sampling using Lagrange interpolation polynomials of degree 2". Computational Statistics & Data Analysis. 52 (7): 3408–3423. doi:10.1016/j.csda.2008.01.005.


अग्रिम पठन

  • Robert, C. P.; Casella, G. (2004). Monte Carlo Statistical Methods (Second ed.). New York: Springer-Verlag.