स्टोकेस्टिक प्रोग्रामिंग: Difference between revisions
No edit summary |
No edit summary |
||
(7 intermediate revisions by 2 users not shown) | |||
Line 1: | Line 1: | ||
{{Short description|Framework for modeling optimization problems that involve uncertainty}} | {{Short description|Framework for modeling optimization problems that involve uncertainty}} | ||
{{For|नियंत्रण सिद्धांत का संदर्भ|प्रसंभाव्य नियंत्रण}} | {{For|नियंत्रण सिद्धांत का संदर्भ|प्रसंभाव्य नियंत्रण}} | ||
[[गणितीय अनुकूलन]] के क्षेत्र में, ''' | [[गणितीय अनुकूलन]] के क्षेत्र में, '''स्टोकेस्टिक प्रोग्रामिंग''' या '''स्टोकेस्टिक प्रोग्रामिंग''' प्रतिरूपण [[अनुकूलन (गणित)|अनुकूलन]] समस्याओं के लिए एक ऐसी संरचना है जिसमें [[अनिश्चितता]] सम्मिलित है। '''स्टोकेस्टिक प्रोग्राम''' एक ऐसी अनुकूलन समस्या है जिसमें कुछ या सभी समस्या प्राचल अनिश्चित हैं, लेकिन ज्ञात प्रायिकता वितरणों का अनुसरण करते हैं।<ref>{{cite book|last1=Shapiro|first1=Alexander|url=http://www2.isye.gatech.edu/people/faculty/Alex_Shapiro/SPbook.pdf|title=Lectures on stochastic programming: Modeling and theory|last2=Dentcheva|first2=Darinka|last3=Ruszczyński|first3=Andrzej|publisher=Society for Industrial and Applied Mathematics (SIAM)|year=2009|isbn=978-0-89871-687-0|series=MPS/SIAM Series on Optimization|volume=9|location=Philadelphia, PA|pages=xvi+436|mr=2562798|author2-link=Darinka Dentcheva|author3-link=Andrzej Piotr Ruszczyński|agency=Mathematical Programming Society (MPS)}}</ref><ref>{{Cite book|last1=Birge|first1=John R.|last2=Louveaux|first2=François|date=2011|title=Introduction to Stochastic Programming|url=https://doi.org/10.1007/978-1-4614-0237-4|series=Springer Series in Operations Research and Financial Engineering|language=en-gb|doi=10.1007/978-1-4614-0237-4|isbn=978-1-4614-0236-7|issn=1431-8598}}</ref> यह संरचना निर्धारणात्मक अनुकूलन के विपरीत है, जिसमें सभी समस्या प्राचलों को यथार्थ रूप से ज्ञात माना जाता है। स्टोकेस्टिक प्रोग्रामिंग का लक्ष्य एक ऐसा निर्णय प्राप्त करना है जो निर्णायक द्वारा चयनित कुछ प्राचलों का अनुकूलन करता है, और समस्या के प्राचलों की अनिश्चितता के लिए उचित रूप से ध्यान देने योग्य है। क्योंकि कई वास्तविक जगत के निर्णयों में अनिश्चितता सम्मिलित है, अतः स्टोकेस्टिक प्रोग्रामिंग का अनुप्रयोग [[वित्त]] से लेकर परिवहन तक ऊर्जा अनुकूलन के क्षेत्रों की एक विस्तृत श्रृंखला में देखा जाता है।<ref> | ||
Stein W. Wallace and William T. Ziemba (eds.). ''[https://books.google.com/books?id=KAI0jsuyDPsC&printsec=frontcover&dq=%22Applications+of+Stochastic+Programming%22&hl=en&sa=X&ved=0ahUKEwivt-nn2OfiAhURXa0KHYJMC9UQ6AEIKjAA#v=onepage&q=%22Applications%20of%20Stochastic%20Programming%22&f=false Applications of Stochastic Programming]''. MPS-SIAM Book Series on Optimization 5, 2005. | Stein W. Wallace and William T. Ziemba (eds.). ''[https://books.google.com/books?id=KAI0jsuyDPsC&printsec=frontcover&dq=%22Applications+of+Stochastic+Programming%22&hl=en&sa=X&ved=0ahUKEwivt-nn2OfiAhURXa0KHYJMC9UQ6AEIKjAA#v=onepage&q=%22Applications%20of%20Stochastic%20Programming%22&f=false Applications of Stochastic Programming]''. MPS-SIAM Book Series on Optimization 5, 2005. | ||
</ref><ref> | </ref><ref> | ||
Applications of stochastic programming are described at the following website, [http://stoprog.org Stochastic Programming Community]. | Applications of stochastic programming are described at the following website, [http://stoprog.org Stochastic Programming Community]. | ||
</ref> | </ref> | ||
== | == द्वि-चरणीय समस्याएँ == | ||
द्वि-चरणीय स्टोकेस्टिक प्रोग्रामिंग का मूल विचार यह है कि (इष्टतम) निर्णय, निर्णय लिए जाने के समय उपलब्ध आंकड़ों पर आधारित होने चाहिए और ये निर्णय भविष्य के प्रेक्षणों पर निर्भर नहीं हो सकते हैं। स्टोकेस्टिक प्रोग्रामिंग में द्वि-चरणीय सूत्रीकरण का उपयोग व्यापक रूप से किया जाता है। द्वि-चरणीय स्टोकेस्टिक प्रोग्रामिंग समस्या का सामान्य सूत्रीकरण निम्न द्वारा दिया जाता है:<math display="block"> | |||
\min_{x\in X}\{ g(x)= f(x) + E_{\xi}[Q(x,\xi)]\} | \min_{x\in X}\{ g(x)= f(x) + E_{\xi}[Q(x,\xi)]\} | ||
</math> | </math>जहाँ <math>Q(x,\xi)</math> द्वितीय-चरण की समस्या का इष्टतम मान है<math display="block"> | ||
\min_{y}\{ q(y,\xi) \,|\,T(\xi)x+W(\xi) y = h(\xi)\}. | \min_{y}\{ q(y,\xi) \,|\,T(\xi)x+W(\xi) y = h(\xi)\}. | ||
</math> | </math>चिरसम्मत द्वि-चरणीय रैखिक स्टोकेस्टिक प्रोग्रामिंग समस्याओं को निम्न रूप में सूत्रित किया जा सकता है<math display="block"> | ||
<math display="block"> | |||
\begin{array}{llr} | \begin{array}{llr} | ||
\min\limits_{x\in \mathbb{R}^n} &g(x)= c^T x + E_{\xi}[Q(x,\xi)] & \\ | \min\limits_{x\in \mathbb{R}^n} &g(x)= c^T x + E_{\xi}[Q(x,\xi)] & \\ | ||
Line 18: | Line 17: | ||
& x \geq 0 & | & x \geq 0 & | ||
\end{array} | \end{array} | ||
</math> | </math>जहाँ <math> Q(x,\xi)</math> द्वितीय-चरण की समस्या का इष्टतम मान है<math display="block"> | ||
<math display="block"> | |||
\begin{array}{llr} | \begin{array}{llr} | ||
\min\limits_{y\in \mathbb{R}^m} & q(\xi)^T y & \\ | \min\limits_{y\in \mathbb{R}^m} & q(\xi)^T y & \\ | ||
Line 27: | Line 24: | ||
\end{array} | \end{array} | ||
</math> | </math> | ||
=== | ऐसे सूत्रीकरण में, <math>x\in \mathbb{R}^n</math> प्रथम-चरण निर्णय चर सदिश है, <math>y\in \mathbb{R}^m</math> द्वितीय-चरण निर्णय चर सदिश है, और <math>\xi(q,T,W,h)</math> द्वितीय चरण की समस्या के आँकड़े को समाहित करता है। इस सूत्रीकरण में, प्रथम चरण में हमें अनिश्चित आँकड़े <math>\xi</math> (इसे एक यादृच्छिक सदिश के रूप में देखा जाता है) की प्राप्ति से पहले "यहीं और अभी (तत्काल)" निर्णय <math>x</math> लेना होता है। द्वितीय चरण में, <math>\xi</math> की प्राप्ति के उपलब्ध होने के बाद, हम उपयुक्त अनुकूलन समस्या को हल करके अपने व्यवहार को अनुकूलित करते हैं। | ||
प्रथम चरण में हम प्रथम चरण के निर्णय की लागत <math>c^Tx</math> के साथ-साथ (इष्टतम) द्वितीय चरण के निर्णय की अपेक्षित लागत का अनुकूलन (उपर्युक्त सूत्रीकरण में न्यूनीकृत) करते हैं। हम द्वितीय चरण की समस्या को केवल एक ऐसी अनुकूलन समस्या के रूप में देख सकते हैं जो अनिश्चित आंकड़ों के प्रकट होने पर हमारे अनुमानित इष्टतम व्यवहार का वर्णन करती है, या हम इसके हल को एक ऐसी आश्रय क्रिया के रूप में मान सकते हैं जहाँ शब्द <math>Wy</math> निकाय <math>Tx\leq h</math> की संभावित असंगति की क्षतिपूर्ति करता है और <math>q^Ty</math> इस आश्रय क्रिया की लागत है। | |||
विचार की गयी द्वि-चरणीय समस्या ''रैखिक'' है क्योंकि उद्देश्य फलन और व्यवरोध रैखिक हैं। संकल्पनात्मक रूप से यह आवश्यक नहीं है और अधिक सामान्य द्वि-चरणीय स्टोकेस्टिक प्रोग्रामों पर विचार किया जा सकता है। उदाहरण के लिए, यदि प्रथम-चरण की समस्या पूर्णांक है, तो प्रथम-चरण की समस्या में समाकलनीय व्यवरोधों को इस प्रकार जोड़ा जा सकता है कि सुसंगत समुच्चय असतत हो जाये। आवश्यकतानुसार अरैखिक उद्देश्यों और व्यवरोधों को भी सम्मिलित किया जा सकता है।<ref>{{cite book| last1=Shapiro|first1=Alexander|last2=Philpott|first2=Andy|title=A tutorial on Stochastic Programming| url=http://www2.isye.gatech.edu/people/faculty/Alex_Shapiro/TutorialSP.pdf}}</ref> | |||
=== बंटनात्मक कल्पना === | |||
उपरोक्त द्वि-चरणीय समस्या का सूत्रीकरण यह मानता है कि द्वितीय-चरण के डेटा <math>\xi</math> को '''''ज्ञात''''' प्रायिकता वितरण वाले एक यादृच्छिक सदिश के रूप में प्रतिरूपित किया गया है। यह कई स्थितियों में उचित होता है। उदाहरण के लिए, <math>\xi</math> के बंटन को ऐतिहासिक आँकड़े से अनुमानित किया जा सकता है यदि मान जाता है कि वितरण किसी समयावधि में प्रभावशाली रूप से परिवर्तित नहीं होता है। इसके अतिरिक्त, प्रतिदर्श के प्रयोगसिद्ध बंटन का उपयोग <math>\xi</math> के अग्रिम मानों के बंटन के सन्निकटन के रूप में किया जा सकता है। यदि <math>\xi</math> का पूर्व मॉडल उपलब्ध है, तो बेज़ के अपडेट द्वारा पश्चवर्ती बंटन प्राप्त किया जा सकता है। | |||
=== असततीकरण === | |||
द्वि-चरणीय की स्टोकेस्टिक समस्या को संख्यात्मक रूप से हल करने के लिए, प्रायः यह मानने की आवश्यकता होती है कि यादृच्छिक सदिश <math>\xi</math> में ''परिदृश्य'' नामक संभावित प्राप्तियों की संख्या सीमित है, माना ये <math>\xi_1,\dots,\xi_K</math> हैं, जिनके संगत प्रायिकता द्रव्यमान <math>p_1,\dots,p_K</math> हैं। तब प्रथम चरण की समस्या के उद्देश्य फलन में प्रत्याशा को निम्न योग के रूप में लिखा जा सकता है:<math display="block"> | |||
E[Q(x,\xi)]=\sum\limits_{k=1}^{K} p_kQ(x,\xi_k) | E[Q(x,\xi)]=\sum\limits_{k=1}^{K} p_kQ(x,\xi_k) | ||
</math>और | </math>और इसके अतिरिक्त, द्वि-चरणीय समस्या को एक बड़ी रैखिक प्रोग्रामन समस्या के रूप में सूत्रित किया जा सकता है (इसे मूल समस्या का निर्धारणात्मक समतुल्य कहा जाता है, {{Section link||§ यादृच्छिक समस्या का निर्धारक समतुल्य}} अनुभाग देखें)। | ||
जब <math>\xi</math> में संभावित प्राप्तियों की संख्या अपरिमित (या बहुत बड़ी) है, तो इस बंटन का निरूपण परिदृश्यों द्वारा करने के लिए मानक दृष्टिकोण है। यह दृष्टिकोण तीन प्रश्न उठाता है, अर्थात्: | |||
# परिदृश्यों का निर्माण कैसे करें, देखें {{Section link||परिदृश्य निर्माण}}; | |||
#निर्धारणात्मक समतुल्य को कैसे हल करें। [[सीप्लेक्स|सीपीएलईएक्स]], और [[जीएनयू रैखिक प्रोग्रामिंग किट|जीएनयू रैखिक प्रोग्रामिंग किट (जीएलपीके)]] जैसे अनुकूलक बड़ी रैखिक/अरैखिक समस्याओं को हल कर सकते हैं। विस्कॉन्सिन विश्वविद्यालय, मैडिसन में आयोजित एनईओएस सर्वर<ref name="neos">{{Cite web|url=http://www.neos-server.org/neos/|title = NEOS Server for Optimization}}</ref> कई आधुनिक हलकर्ताओं तक मुफ्त पहुँच की अनुमति प्रदान करता है। निर्धारणात्मक समतुल्य की संरचना बेंडर्स अपघटन या परिदृश्य अपघटन जैसी अपघटन विधियों को लागू करने के लिए विशेष रूप से उत्तरदायी है,<ref>{{cite book|first2=Alexander|last2=Shapiro|last1=Ruszczyński|first1=Andrzej|title=Stochastic Programming|publisher=[[Elsevier]]|year=2003|isbn=978-0444508546|series=Handbooks in Operations Research and Management Science|volume=10|location=Philadelphia|pages=700|author1-link=Andrzej Piotr Ruszczyński}}</ref> | |||
#"सही" इष्टतम के सापेक्ष प्राप्त हल की गुणवत्ता को कैसे मापें। | |||
ये प्रश्न स्वतंत्र नहीं हैं। उदाहरण के लिए, निर्मित परिदृश्यों की संख्या निर्धारणात्मक समतुल्य की वश्यता और प्राप्त हलों की गुणवत्ता दोनों को प्रभावित करती है। | |||
== स्टोकेस्टिक रैखिक प्रोग्राम == | |||
स्टोकेस्टिक [[रैखिक कार्यक्रम|रैखिक प्रोग्राम]] चिरसम्मत द्वि-चरणीय स्टोकेस्टिक प्रोग्राम का एक विशिष्ट उदाहरण है। एक स्टोकेस्टिक एलपी, बहु-आवधिक रैखिक प्रोग्रामों (एलपी) के संग्रह से बनाई गयी है, जिनमें से प्रत्येक की संरचना समान लेकिन आँकड़े कुछ अलग हैं। <math>k^{th}</math> परिदृश्य को निरूपित करने वाली <math>k^{th}</math> द्वि-आवधिक एलपी को निम्नलिखित रूप में माना जा सकता है: | |||
== | |||
<math> | <math> | ||
Line 61: | Line 60: | ||
</math> | </math> | ||
सदिश <math>x</math> और <math>y</math> में प्रथम-आवधिक चर होते हैं, जिनके मानों का चयन तत्काल किया जाना चाहिए। सदिश <math>z_k</math> अनुक्रमिक अवधियों के लिए सभी चरों को समाहित करता है। व्यवरोध <math>Tx + Uy = r</math> केवल प्रथम-आवधिक चरों को सम्मिलित करता है और ये प्रत्येक परिदृश्य में समान होते हैं। अन्य व्यवरोधों में बाद की अवधियों के चर सम्मिलित हैं और अग्रिम अनिश्चितता को दर्शाते हुए परिदृश्य से परिदृश्य में कुछ स्थितियों में भिन्न हैं। | |||
ध्यान दें कि | ध्यान दें कि <math>k^{th}</math> द्वि-आवधिक एलपी को हल करना, बिना किसी अनिश्चितता के द्वितीय अवधि में <math>k^{th}</math> परिदृश्य को मानने के बराबर है। द्वितीय चरण में अनिश्चितताओं को समाविष्ट करने के लिए, भिन्न परिदृश्यों के लिए प्रायिकताओं को आवंटित करना चाहिए और संगत निर्धारणात्मक समतुल्य को हल करना चाहिए। | ||
=== | === स्टोकेस्टिक समस्या के निर्धारणात्मक समकक्ष === | ||
परिमित संख्या | परिदृश्यों की परिमित संख्या के साथ, द्वि-चरणीय स्टोकेस्टिक रैखिक प्रोग्रामों को बड़ी रैखिक प्रोग्रामन समस्याओं के रूप में प्रतिरूपित किया जा सकता है। इस सूत्रीकरण को प्रायः निर्धारणात्मक समतुल्य रैखिक प्रोग्राम या संक्षिप्त रूप में निर्धारणात्मक समतुल्य कहा जाता है। (निष्पक्ष रूप से कहने पर, निर्धारणात्मक समतुल्य एक ऐसा गणितीय प्रोग्राम है जिसका उपयोग इष्टतम प्रथम-चरण के निर्णय की गणना करने के लिए किया जा सकता है, इसलिए ये तब भी सतत प्रायिकता बंटन के लिए अस्तित्व में होते हैं, जब द्वितीय चरण की लागत का निरूपण समान संवृत रूप में किया जा सकता है।) उदाहरण के लिए, उपरोक्त स्टोकेस्टिक रैखिक प्रोग्राम के समतुल्य के निर्माण के लिए, हम प्रत्येक परिदृश्य <math>k=1,\dots,K</math> के लिए एक प्रायिकता <math>p_k</math> आवंटित करते हैं। | ||
फिर हम सभी परिदृश्यों से | फिर हम सभी परिदृश्यों से व्यवरोधों के अधीन उद्देश्य के प्रत्याशित मान को न्यूनतम कर सकते हैं: | ||
<math> | <math> | ||
Line 80: | Line 79: | ||
& x & , & y & , & z_1 & , & z_2 & , & \ldots & , & z_K & \geq & 0 \\ | & x & , & y & , & z_1 & , & z_2 & , & \ldots & , & z_K & \geq & 0 \\ | ||
\end{array} | \end{array} | ||
</math> | </math> | ||
हमारे पास | हमारे पास प्रत्येक परिदृश्य <math>k</math> के लिए, आनुक्रमिक अवधियों के चरों का एक अलग सदिश <math>z_k</math> है। प्रथम आवधिक चर <math>x</math> और <math>y</math> प्रत्येक परिदृश्य में समान होते हैं, हालाँकि, क्योंकि हमें यह जानने से पहले प्रथम अवधि के लिए निर्णय लेना चाहिए कि कौन सा परिदृश्य प्राप्त होगा। परिणामस्वरूप, केवल <math>x</math> और <math>y</math> को सम्मिलित करने वाले व्यवरोधों को केवल एक बार निर्दिष्ट करने की आवश्यकता होती है, जबकि शेष व्यवरोधों को प्रत्येक परिदृश्य के लिए एकल रूप से निर्दिष्ट किया जाना चाहिए। | ||
== परिदृश्य निर्माण == | == परिदृश्य निर्माण == | ||
व्यवहार में भविष्य पर विशेषज्ञों | व्यवहार में भविष्य पर विशेषज्ञों का मत जानकर परिदृश्यों का निर्माण करना संभव हो सकता है। निर्मित परिदृश्यों की संख्या अपेक्षाकृत साधारण होनी चाहिए जिससे प्राप्त निर्धारणात्मक समतुल्य को उचित संगणनीय प्रयास से हल किया जा सके। प्रायः यह दावा किया जाता है कि केवल कुछ परिदृश्यों का उपयोग करने वाला एक हल केवल एक परिदृश्य को मानने वाले हल की तुलना में अधिक अनुकूलनीय योजनाएँ प्रदान करता है। कुछ स्थितियों में ऐसे दावे को अनुकरण द्वारा सत्यापित किया जा सकता है। सिद्धांत रूप में आश्वासन के कुछ प्रमाप उपलब्ध हैं, जिससे एक प्राप्त हल मूल समस्या को उचित यथार्थता के साथ हल करता है। सामान्यतः अनुप्रयोगों में केवल ''प्रथम चरण'' इष्टतम हल <math>x^*</math> का एक व्यावहारिक मान है क्योंकि लगभग सदैव यादृच्छिक आँकड़ों का "सत्य" प्रतिफलन निर्मित (उत्पन्न) परिदृश्यों के समुच्चय से अलग होता है। | ||
माना <math>\xi</math> में <math>d</math> स्वतंत्र यादृच्छिक घटक सम्मिलित हैं, जिनमें से प्रत्येक में तीन संभावित प्रतिफल हैं (उदाहरण के लिए, प्रत्येक यादृच्छिक प्राचलों के भविष्य के प्रतिफलों को निम्न, मध्यम और उच्च के रूप में वर्गीकृत किया गया है), तो परिदृश्यों की कुल संख्या <math>K=3^d</math> है। परिदृश्यों की संख्या में इस प्रकार की ''घातीय वृद्धि'' उचित आकार <math>d</math> के लिए भी विशेषज्ञ के मत का उपयोग करके मॉडल के विकास को अत्यधिक जटिल बना देती है। यह स्थिति और भी खराब हो जाती है यदि <math>\xi</math> के कुछ यादृच्छिक घटकों में सतत बंटन हैं। | |||
=== मोंटे कार्लो | === मोंटे कार्लो प्रतिचयन और प्रतिदर्श औसत सन्निकटन (एसएए) विधि === | ||
एक प्रबंधनीय आकार के लिए निर्धारित परिदृश्य को कम करने के लिए एक सामान्य दृष्टिकोण | मोंटे कार्लो अनुकरण का उपयोग, एक प्रबंधनीय आकार के लिए निर्धारित परिदृश्य को कम करने के लिए एक सामान्य दृष्टिकोण है। माना परिदृश्यों की कुल संख्या अत्यधिक या अपरिमित है। आगे माना कि हम यादृच्छिक सदिश <math>\xi</math> की <math>N</math> प्रतिकृतियों का एक प्रतिदर्श <math>\xi^1,\xi^2,\dots,\xi^N</math> उत्पन्न कर सकते हैं। सामान्यतः प्रतिदर्श को [[स्वतंत्र और समान रूप से वितरित]] (आई.आई.डी प्रतिदर्श) माना जाता है। दिए गए एक प्रतिदर्श के लिए, प्रत्याशा फलन <math>q(x)=E[Q(x,\xi)]</math> को निम्न प्रतिदर्श औसत द्वारा सन्निकटित किया जाता है | ||
<math> | <math> | ||
\hat{q}_N(x) = \frac{1}{N} \sum_{j=1}^N Q(x,\xi^j) | \hat{q}_N(x) = \frac{1}{N} \sum_{j=1}^N Q(x,\xi^j) | ||
</math> | </math> | ||
और फलस्वरूप प्रथम चरण की समस्या द्वारा दी गई है | |||
और फलस्वरूप प्रथम चरण की समस्या निम्न द्वारा दी गई है | |||
<math> | <math> | ||
Line 106: | Line 105: | ||
\end{array} | \end{array} | ||
</math> | </math> | ||
इस सूत्रीकरण को | |||
इस सूत्रीकरण को ''प्रतिदर्श औसत सन्निकटन विधि'' के रूप में जाना जाता है। एसएए समस्या माने गए प्रतिदर्श का एक फलन है और इस अर्थ में यादृच्छिक है। दिए गए प्रतिदर्श <math>\xi^1,\xi^2,\dots,\xi^N</math> के लिए, एसएए समस्या परिदृश्यों <math>\xi^j</math>., <math>j=1,\dots,N</math> वाली द्वि-चरणीय स्टोकेस्टिक रैखिक प्रोग्रामन समस्या के समान रूप की है, जिनमें से प्रत्येक को समान प्रायिकता <math>p_j=\frac{1}{N}</math> के साथ लिया गया है। | |||
== सांख्यिकीय निष्कर्ष == | == सांख्यिकीय निष्कर्ष == | ||
निम्नलिखित | निम्नलिखित स्टोकेस्टिक प्रोग्रामन समस्या पर विचार करें | ||
<div वर्ग = केंद्र शैली = चौड़ाई: ऑटो; मार्जिन-लेफ्ट: ऑटो; मार्जिन-राइट: ऑटो; ><math> | <div वर्ग = केंद्र शैली = चौड़ाई: ऑटो; मार्जिन-लेफ्ट: ऑटो; मार्जिन-राइट: ऑटो; ><math> | ||
Line 116: | Line 116: | ||
</math></div> | </math></div> | ||
यहाँ <math>X</math> | यहाँ <math>X</math>, <math>\mathbb{R}^n</math> का एक अरिक्त संवृत उपसमुच्चय है, <math>\xi</math> एक यादृच्छिक सदिश है जिसका प्रायिकता बंटन <math>P</math> एक समुच्चय <math>\Xi \subset \mathbb{R}^d</math>, और <math>Q: X \times \Xi \rightarrow \mathbb{R}</math> पर समर्थित है। द्वि-चरणीय स्टोकेस्टिक प्रोग्रामन की संरचना में, <math>Q(x,\xi)</math> को संगत द्वितीय-चरणीय समस्या के इष्टतम मान द्वारा दिया गया है। | ||
माना <math>g(x)</math> सभी <math>x\in X</math> के लिए सुपरिभाषित और ''परिमित'' ''मान'' फलन है। इसका तात्पर्य है कि प्रत्येक <math>x\in X</math> के लिए मान <math>Q(x,\xi)</math> लगभग निश्चित है। | |||
माना हमारे पास यादृच्छिक सदिश <math>\xi</math> के <math>N</math> प्रतिफलनों का एक प्रतिदर्श <math>\xi^1,\dots,\xi^N</math> है। इस यादृच्छिक प्रतिदर्श को <math>\xi</math> के <math>N</math> प्रेक्षणों को ऐतिहासिक आँकड़े के रूप में देखा जा सकता है, या इसे मोंटे कार्लो प्रतिरूपण तकनीकों द्वारा उत्पन्न किया जा सकता है। तब हम एक संगत ''प्रतिदर्श औसत सन्निकटन'' सूत्रित कर सकते हैं | |||
<div वर्ग = केंद्र शैली = चौड़ाई: ऑटो; मार्जिन-लेफ्ट: ऑटो; मार्जिन-राइट: ऑटो; ><math> | <div वर्ग = केंद्र शैली = चौड़ाई: ऑटो; मार्जिन-लेफ्ट: ऑटो; मार्जिन-राइट: ऑटो; ><math> | ||
Line 126: | Line 126: | ||
</math></div> | </math></div> | ||
वृहत संख्या सिद्धांत के अनुसार हमें ज्ञात है कि, <math>\frac{1}{N} \sum_{j=1}^N Q(x,\xi^j)</math>, कुछ नियमितता शर्तों के तहत प्रायिकता 1 के साथ <math>E[Q(x,\xi)]</math> तक बिंदुवार अभिसरित होता है, क्योंकि <math>N \rightarrow \infty</math>।इसके अतिरिक्त, मंद अतिरिक्त परिस्थितियों में अभिसरण एक समान है। हमारे पास <math>E[\hat{g}_N(x)]=g(x)</math> भी है, अर्थात्, <math>\hat{g}_N(x)</math>, <math>g(x)</math> का एक ''अनभिनत'' आंकलक है। इसलिए, यह आशा करना स्वाभाविक है कि एसएए समस्या का इष्टतम मान और इष्टतम हल वास्तविक समस्या के अपने समतुल्यों के साथ अभिसरण करते हैं क्योंकि <math>N \rightarrow \infty</math>। | |||
=== एसएए | === एसएए आंकलकों की संगतता === | ||
माना एसएए समस्या का सुसंगत समुच्चय <math>X</math> नियत है, अर्थात् यह प्रतिदर्श से स्वतंत्र है। माना <math>\vartheta^*</math> और <math>S^*</math>, क्रमशः वास्तविक समस्या के इष्टतम मान और इष्टतम हलों का समुच्चय है और माना <math>\hat{\vartheta}_N</math> और <math>\hat{S}_N</math>, क्रमशः एसएए समस्या के इष्टतम मान और इष्टतम हलों का समुच्चय है। | |||
# | # माना <math>g: X \rightarrow \mathbb{R}</math> और <math>\hat{g}_N: X \rightarrow \mathbb{R}</math> (निर्धारणात्मक) वास्तविक मान फलनों का एक अनुक्रम है। निम्नलिखित दो गुण समतुल्य हैं: | ||
#* किसी | #* किसी <math>\overline{x}\in X</math> और <math>\overline{x}</math> में अभिसरित किसी अनुक्रम <math>\{x_N\}\subset X</math> के लिए, यह इस प्रकार है कि <math>\hat{g}_N(x_N)</math>, <math>g(\overline{x})</math> में अभिसरित होता है | ||
#* | #* फलन <math>g(\cdot)</math>, <math>X</math> पर सतत है और <math>\hat{g}_N(\cdot)</math>, <math>X</math> के किसी सघन उपसमुच्चय पर <math>g(\cdot)</math> पर समान रूप से अभिसरित होता है | ||
# यदि | # यदि एसएए समस्या का उद्देश्य <math>\hat{g}_N(x)</math>, सुसंगत समुच्चय <math>X</math> पर समान रूप से प्रायिकता 1 वाली वास्तविक समस्या के उद्देश्य <math>g(x)</math> में अभिसरित होता है, क्योंकि <math>N \rightarrow \infty</math>। तब <math>\hat{\vartheta}_N</math>, प्रायिकता 1 वाले <math>\vartheta^*</math> में अभिसरित होता है, क्योंकि <math>N \rightarrow \infty</math>। | ||
# | # माना एक ऐसे सघन समुच्चय <math>C \subset \mathbb{R}^n</math> का अस्तित्व है कि | ||
#* | #* वास्तविक समस्या के इष्टतम हलों का समुच्चय <math>S</math> अरिक्त है और <math>C</math> में निहित है | ||
#* | #* <math>g(x)</math> परिमित मान फलन है और <math>C</math> पर सतत है | ||
#* | #* फलनों का अनुक्रम <math>\hat{g}_N(x)</math>, <math>x\in C</math> में समान रूप से प्रायिकता 1 के साथ <math>g(x)</math> में अभिसरित होता है, क्योंकि <math>N \rightarrow \infty</math> | ||
#* | #* <math>N</math> के लिए काफी बड़ा समुच्चय <math>\hat{S}_N</math> अरिक्त है और प्रायिकता 1 के साथ <math>\hat{S}_N \subset C</math> | ||
:: तब <math>\hat{\vartheta}_N \rightarrow \vartheta^*</math> और <math>\mathbb{D}(S^*,\hat{S}_N)\rightarrow 0 </math> | :: तब प्रायिकता 1 के साथ <math>\hat{\vartheta}_N \rightarrow \vartheta^*</math> और <math>\mathbb{D}(S^*,\hat{S}_N)\rightarrow 0 </math> क्योंकि <math>N\rightarrow \infty </math>। ध्यान दें कि <math>\mathbb{D}(A,B) </math>, समुच्चय <math>A</math> के समुच्चय <math>B</math> से विचलन को दर्शाता है, जो इस प्रकार परिभाषित है | ||
::<math> | |||
\mathbb{D}(A,B) := \sup_{x\in A} \{ \inf_{x' \in B} \|x-x'\| \} | \mathbb{D}(A,B) := \sup_{x\in A} \{ \inf_{x' \in B} \|x-x'\| \} | ||
</math | </math> | ||
कुछ स्थितियों में | कुछ स्थितियों में एसएए समस्या के सुसंगत समुच्चय <math>X</math> का इष्टतमीकरण किया गया है, तो संगत एसएए समस्या निम्न रूप ग्रहण करती है | ||
<div वर्ग = केंद्र शैली = चौड़ाई: ऑटो; मार्जिन-लेफ्ट: ऑटो; मार्जिन-राइट: ऑटो; ><math> | <div वर्ग = केंद्र शैली = चौड़ाई: ऑटो; मार्जिन-लेफ्ट: ऑटो; मार्जिन-राइट: ऑटो; ><math> | ||
Line 153: | Line 152: | ||
</math></div> | </math></div> | ||
जहाँ <math>X_N</math>, प्रतिदर्श के आधार पर <math>\mathbb{R}^n</math> का उपसमुच्चय है और इसलिए यादृच्छिक है। फिर भी, एसएए आंकलकों के लिए निसंगतता परिणाम, अभी भी कुछ अतिरिक्त धारणाओं के तहत प्राप्त किए जा सकते हैं: | |||
# | # माना एक ऐसे सघन समुच्चय <math>C \subset \mathbb{R}^n</math> का अस्तित्व है कि | ||
#* | #* वास्तविक समस्या के इष्टतम हलों का समुच्चय <math>S</math> अरिक्त है और <math>C</math> में निहित है | ||
#* | #*<math>g(x)</math> परिमित मान फलन है और <math>C</math> पर सतत है | ||
#* | #* फलनों का अनुक्रम <math>\hat{g}_N(x)</math>, <math>x\in C</math> में समान रूप से प्रायिकता 1 के साथ <math>g(x)</math> में अभिसरित होता है, क्योंकि <math>N \rightarrow \infty</math> | ||
#* | #* <math>N</math> के लिए काफी बड़ा समुच्चय <math>\hat{S}_N</math> अरिक्त है और प्रायिकता 1 के साथ <math>\hat{S}_N \subset C</math> | ||
#* | #* यदि <math> x_N \in X_N</math> और <math> x_N </math> प्रायिकता 1 के साथ एक बिंदु <math> x</math> पर अभिसरित होता है, तब <math> x \in X</math> | ||
#* कुछ | #* कुछ बिंदुओं <math> x \in S^*</math> के लिए, एक ऐसे अनुक्रम <math> x_N \in X_N</math>का अस्तित्व है कि प्रायिकता 1 के साथ <math> x_N \rightarrow x</math>। | ||
:: तब <math>\hat{\vartheta}_N \rightarrow \vartheta^*</math> और <math>\mathbb{D}(S^*,\hat{S}_N)\rightarrow 0 </math> | :: तब प्रायिकता 1 के साथ <math>\hat{\vartheta}_N \rightarrow \vartheta^*</math> और <math>\mathbb{D}(S^*,\hat{S}_N)\rightarrow 0 </math>, क्योंकि <math>N\rightarrow \infty </math>। | ||
=== एसएए इष्टतम | === एसएए इष्टतम मान के उपगमन === | ||
माना प्रतिदर्श <math>\xi^1,\dots,\xi^N</math> आई.आई.डी. है और एक बिंदु <math>x \in X</math> को नियत करता है। फिर <math>g(x)</math> का प्रतिदर्श औसत आंकलक <math>\hat{g}_N(x)</math>, अनभिनत है और इसका विचरण <math>\frac{1}{N}\sigma^2(x)</math> है, जहाँ <math>\sigma^2(x):=Var[Q(x,\xi)]</math> परिमित माना जाता है। इसके अतिरिक्त, [[केंद्रीय सीमा प्रमेय]] द्वारा हमारे पास निम्न है | |||
<div वर्ग="केंद्र" शैली="चौड़ाई:" ऑटो; मार्जिन-लेफ्ट: मार्जिन-राइट:><math> | <div वर्ग="केंद्र" शैली="चौड़ाई:" ऑटो; मार्जिन-लेफ्ट: मार्जिन-राइट:><math> | ||
Line 170: | Line 169: | ||
</math></div> | </math></div> | ||
जहाँ <math>\xrightarrow{\mathcal{D}}</math> बंटन में अभिसरण को दर्शाता है और <math>Y_x</math> में माध्य <math>0</math> और विचरण <math>\sigma^2(x)</math> वाला एक अभिलम्ब बंटन है, जिसे <math>\mathcal{N}(0,\sigma^2(x))</math> के रूप में लिखा गया है। | |||
दूसरे शब्दों में, <math>\hat{g}_N(x)</math> | दूसरे शब्दों में, <math>\hat{g}_N(x)</math> ''उपगामी अभिलम्ब बंटन'' है, अर्थात्, बड़े <math>N</math> के लिए, <math>\hat{g}_N(x)</math> में माध्य <math>g(x)</math> और विचरण <math>\frac{1}{N}\sigma^2(x)</math> वाला लगभग अभिलम्ब बंटन है। यह <math>f(x)</math> के लिए निम्न (अनुमानित) <math>100(1-\alpha)</math> % विश्वास्यता अंतराल की ओर जाता है: | ||
<div वर्ग="केंद्र" शैली="चौड़ाई:" ऑटो; मार्जिन-लेफ्ट: मार्जिन-राइट:> <math> | <div वर्ग="केंद्र" शैली="चौड़ाई:" ऑटो; मार्जिन-लेफ्ट: मार्जिन-राइट:> <math> | ||
Line 178: | Line 177: | ||
</math></div> | </math></div> | ||
जहाँ <math>z_{\alpha/2}:=\Phi^{-1}(1-\alpha/2)</math> (यहाँ <math>\Phi(\cdot)</math> मानक अभिलम्ब वितरण के सीडीएफ को दर्शाता है) और | |||
<div वर्ग="केंद्र" शैली="चौड़ाई:" ऑटो; मार्जिन-लेफ्ट: मार्जिन-राइट:><math> | <div वर्ग="केंद्र" शैली="चौड़ाई:" ऑटो; मार्जिन-लेफ्ट: मार्जिन-राइट:><math> | ||
Line 184: | Line 183: | ||
</math></div> | </math></div> | ||
<math>\sigma^2(x)</math> का प्रतिदर्श प्रसरण आंकलन है। अर्थात् <math>g(x)</math> के आंकलन की त्रुटि (स्टोकेस्टिक रूप से) <math> O(\sqrt{N})</math> कोटि की है। | |||
== अनुप्रयोग और उदाहरण == | == अनुप्रयोग और उदाहरण == | ||
=== जैविक अनुप्रयोग === | === जैविक अनुप्रयोग === | ||
व्यावहारिक पारिस्थितिकी जैसे क्षेत्रों में | व्यावहारिक पारिस्थितिकी जैसे क्षेत्रों में पशुओं के व्यवहार को प्रतिरूपित करने के लिए प्रायः [[स्टोचैस्टिक गतिशील प्रोग्रामिंग|स्टोकेस्टिक गतिशील प्रोग्रामिंग]] का उपयोग किया जाता है।<ref>Mangel, M. & Clark, C. W. 1988. ''Dynamic modeling in behavioral ecology.'' Princeton University Press {{ISBN|0-691-08506-4}}</ref><ref>Houston, A. I & McNamara, J. M. 1999. ''Models of adaptive behaviour: an approach based on state''. Cambridge University Press {{ISBN|0-521-65539-0}}</ref> [[इष्टतम फोर्जिंग सिद्धांत|इष्टतम फोरेजिंग (चारे की तलाश)]], पक्षियों में [[कलियाना|उड़ने]] और [[परजीवी]] ततैयों में अंडे देने जैसे [[जैविक जीवन चक्र]] संक्रमणों के आनुभविक परीक्षण व्यवहारिक निर्णय लेने के विकास की व्याख्या करने में इस मॉडलिंग तकनीक के महत्व को दर्शाते हैं। ये मॉडल सामान्यतः दो चरणों के स्थान कई चरणों वाले होते हैं। | ||
=== आर्थिक अनुप्रयोग === | === आर्थिक अनुप्रयोग === | ||
अनिश्चितता के तहत निर्णय लेने | स्टोकेस्टिक गतिमान प्रोग्रामिंग, अनिश्चितता के तहत निर्णय लेने की समझ में एक उपयोगी उपकरण है। अनिश्चितता के तहत पूँजीगत भण्डार का संचय इसका एक उदाहरण है; इसका उपयोग प्रायः संसाधन अर्थशास्त्रियों द्वारा जैव आर्थिक समस्याओं का विश्लेषण करने के लिए किया जाता है<ref>Howitt, R., Msangi, S., Reynaud, A and K. Knapp. 2002. [http://www.agecon.ucdavis.edu/aredepart/facultydocs/Howitt/Polyapprox3a.pdf "Using Polynomial Approximations to Solve Stochastic Dynamic Programming Problems: or A "Betty Crocker " Approach to SDP."] University of California, Davis, Department of Agricultural and Resource Economics Working Paper.</ref> जहाँ मौसम आदि में अनिश्चितता प्रवेश करती है। | ||
=== उदाहरण: | === उदाहरण: बहुचरणीय पोर्टफोलियो अनुकूलन === | ||
{{Main|अंतर्कालिक पोर्टफोलियो चयन}} | {{Main|अंतर्कालिक पोर्टफोलियो चयन}} | ||
{{See also|मर्टन की पोर्टफोलियो समस्या}} | {{See also|मर्टन की पोर्टफोलियो समस्या}} | ||
निम्न उदाहरण बहु-चरणीय स्टोकेस्टिक प्रोग्रामिंग के वित्त से एक निम्न उदाहरण है। माना समय <math>t=0</math> पर, <math>n</math> संपत्तियों पर निवेश करने के लिए हमारे पास प्रारंभिक पूँजी <math>W_0</math> है। आगे माना कि हमें समय <math>t=1,\dots,T-1</math> पर अपने पोर्टफोलियो को अतिरिक्त नकदी डाले बिना पुनर्संतुलित करने की अनुमति है। प्रत्येक अवधि <math>t</math> में हम वर्तमान धन <math>W_t</math> के <math>n</math> संपत्तियों में पुनर्वितरण के बारे में निर्णय लेते हैं। माना <math>x_0=(x_{10},\dots,x_{n0})</math>, n संपत्तियों में निवेश की गई प्रारंभिक राशि है। हमें आवश्यकता है कि प्रत्येक <math>x_{i0}</math> गैर-ऋणात्मक हो और संतुलन समीकरण <math>\sum_{i=1}^{n}x_{i0}=W_0</math> सत्य होना चाहिए। | |||
प्रत्येक अवधि <math>t=1,\dots,T</math> के लिएक, ुल प्रतिफल <math>\xi_t=(\xi_{1t},\dots,\xi_{nt})</math> पर विचार करें। यह एक सदिश-मान यादृच्छिक प्रक्रिया <math>\xi_1,\dots,\xi_T</math> का निर्माण करता है। समयावधि <math>t=1</math> में, हम संगत संपत्तियों में निविष्ट राशियों <math>x_1=(x_{11},\dots,x_{n1})</math> को निर्दिष्ट करके पोर्टफोलियो को पुनर्संतुलित कर सकते हैं। उस समय पहली अवधि में प्रतिफल की प्राप्ति हो गयी है, इसलिए इस जानकारी का उपयोग पुनर्संतुलन निर्णय में करना उचित है। इस प्रकार, मय <math>t=1</math> पर द्वितीय चरण के निर्णय,वास्तव में यादृच्छिक सदिश <math>\xi_1</math> की प्राप्ति के फलन हैं, अर्थात्, <math>x_1=x_1(\xi_1)</math>। इसी प्रकार, समय <math>t</math> पर निर्णय <math>x_t=(x_{1t},\dots,x_{nt})</math>, <math>x_t=x_t(\xi_{[t]})</math>, समय <math>t</math> तक यादृच्छिक प्रक्रिया के इतिहास <math>\xi_{[t]}=(\xi_{1},\dots,\xi_{t})</math> द्वारा दी गयी उपलब्ध जानकारी का एक फलन है। फलनों <math>x_t=x_t(\xi_{[t]})</math>, <math>t=0,\dots,T-1</math> का एक अनुक्रम, जिसमें <math>x_0</math> स्थिर है, निर्णय प्रक्रिया की ''कार्यान्वयन योग्य नीति'' को परिभाषित करता है। ऐसा कहा जाता है कि ऐसी नीति ''सुसंगत'' होती है यदि यह प्रायिकता 1 वाले मॉडल के व्यवरोधों, अर्थात् गैर-ऋणात्मकता व्यवरोध <math>x_{it}(\xi_{[t]})\geq 0</math>, <math>i=1,\dots,n</math>, <math>t=0,\dots,T-1</math>, को संतुष्ट करती है, और धन व्यवरोधों का संतुलन निम्न है, | |||
:<math> | :<math> | ||
\sum_{i=1}^{n}x_{it}(\xi_{[t]}) = W_t, | \sum_{i=1}^{n}x_{it}(\xi_{[t]}) = W_t, | ||
</math> | </math> | ||
जहाँ अवधि <math>t=1,\dots,T</math> में धन <math>W_t</math> निम्न द्वारा दिया गया है | |||
:<math> | :<math> | ||
W_t = \sum_{i=1}^{n}\xi_{it} x_{i,t-1}(\xi_{[t-1]}), | W_t = \sum_{i=1}^{n}\xi_{it} x_{i,t-1}(\xi_{[t-1]}), | ||
</math> | </math> | ||
जो यादृच्छिक प्रक्रिया की प्राप्ति और समय | जो यादृच्छिक प्रक्रिया की प्राप्ति और समय <math>t</math> तक के निर्णयों पर निर्भर करता है। | ||
माना इसका उद्देश्य अंतिम अवधि में इस धन की प्रत्याशित उपयोगिता को अधिकतम करना है, अर्थात् निम्न समस्या पर विचार करने पर | |||
:<math> | :<math> | ||
\max E[U(W_T)]. | \max E[U(W_T)]. | ||
</math> | </math> | ||
यह एक | यह एक बहुचरणीय स्टोकेस्टिक प्रोग्रामिंग समस्या है, जहाँ चरणों को <math>t=0</math> से <math>t=T-1</math> तक क्रमांकित किया जाता है। अनुकूलन सभी कार्यान्वयन योग्य और सुसंगत नीतियों पर किया जाता है। समस्या के विवरण को पूरा करने के लिए यादृच्छिक प्रक्रिया के प्रायिकता बंटन <math>\xi_1,\dots,\xi_T</math> को परिभाषित करने की आवश्यकता होती है। यह विभिन्न विधियों से किया जा सकता है। उदाहरण के लिए, प्रक्रिया के समय के विकास को परिभाषित करने वाले एक विशेष परिदृश्य वृक्ष का निर्माण किया जा सकता है। यदि प्रत्येक स्तर पर प्रत्येक परिसंपत्ति के यादृच्छिक प्रतिफल को अन्य संपत्तियों से स्वतंत्र दो सततताओं की अनुमति दी जाती है, तो परिदृश्यों की कुल संख्या <math>2^{nT}.</math> होती है।} | ||
[[गतिशील प्रोग्रामिंग]] | [[गतिशील प्रोग्रामिंग]] समीकरणों को लिखने के लिए, उपरोक्त बहुचरणीय समस्या के पश्च समय पर विचार करें। अंतिम चरण <math>t=T-1</math> में, यादृच्छिक प्रक्रिया का एक प्रतिफल <math>\xi_{[T-1]}=(\xi_{1},\dots,\xi_{T-1})</math> ज्ञात है और <math>x_{T-2}</math> का चयन किया गया है। इसलिए, निम्नलिखित समस्या को हल करने की आवश्यकता होती है | ||
:<math> | :<math> | ||
Line 230: | Line 228: | ||
\end{array} | \end{array} | ||
</math> | </math> | ||
जहाँ <math>E[U(W_T)|\xi_{[T-1]}]</math> दिये गये <math>\xi_{[T-1]}</math> <math>U(W_T)</math> की सप्रतिबन्ध प्रत्याशा को दर्शाता है। उपरोक्त समस्या का इष्टतम मान <math>W_{T-1}</math> और <math>\xi_{[T-1]}</math> पर निर्भर करता है और <math>Q_{T-1}(W_{T-1},\xi_{[T-1]})</math> द्वारा निरूपित किया जाता है। | |||
इसी | इसी प्रकार, चरणों <math>t=T-2,\dots,1</math> में, निम्न समस्या को हल किया जाना चाहिए, | ||
:<math> | :<math> | ||
Line 242: | Line 240: | ||
\end{array} | \end{array} | ||
</math> | </math> | ||
जिसका इष्टतम | जिसका इष्टतम मान <math>Q_{t}(W_{t},\xi_{[t]})</math> द्वारा निरूपित किया जाता है। अंततः, चरण <math>t=0</math> पर, निम्न समस्या हल की जाती है | ||
:<math> | :<math> | ||
Line 255: | Line 253: | ||
==== चरणवार स्वतंत्र यादृच्छिक प्रक्रिया ==== | ==== चरणवार स्वतंत्र यादृच्छिक प्रक्रिया ==== | ||
प्रक्रिया | प्रक्रिया <math>\xi_t</math> के सामान्य बंटन के लिए, इन गतिशील प्रोग्रामिंग समीकरणों को हल करना जटिल हो सकता है। यह स्थिति प्रभावशाली रूप से सरल हो जाती है, यदि प्रक्रिया <math>\xi_t</math> चरणवार स्वतंत्र है, अर्थात्, <math>\xi_t</math>, <math>t=2,\dots,T</math> के लिए <math>\xi_1,\dots,\xi_{t-1}</math> से स्वतंत्र है। इस स्थिति में, संगत सप्रतिबन्ध प्रत्याशाएँ, अप्रतिबंध प्रत्याशाएँ बन जाती हैं, और फलन <math>Q_t(W_t)</math>, <math>t=1,\dots,T-1</math>, <math>\xi_{[t]}</math> पर निर्भर नहीं करता है। अर्थात्, <math>Q_{T-1}(W_{T-1})</math>, समस्या का इष्टतम मान है | ||
:<math> | :<math> | ||
Line 265: | Line 263: | ||
\end{array} | \end{array} | ||
</math> | </math> | ||
और <math>Q_t(W_t)</math> का इष्टतम | और <math>Q_t(W_t)</math>, <math>t=T-2,\dots,1</math> के लिए निम्न का इष्टतम मान है | ||
:<math> | :<math> | ||
Line 275: | Line 273: | ||
\end{array} | \end{array} | ||
</math> | </math> | ||
== सॉफ्टवेयर उपकरण == | == सॉफ्टवेयर उपकरण == | ||
===मॉडलिंग | ===मॉडलिंग भाषाएँ=== | ||
सभी असतत स्टोकेस्टिक प्रोग्रामिंग समस्याओं को किसी भी [[बीजगणितीय मॉडलिंग भाषा]] के साथ | सभी असतत स्टोकेस्टिक प्रोग्रामिंग समस्याओं को किसी भी [[बीजगणितीय मॉडलिंग भाषा]] के साथ हस्तचालित रूप से स्पष्ट या निहित गैर-प्रत्याशात्मकता को लागू करने के लिए प्रदर्शित किया जा सकता है जिससे यह सुनिश्चित किया जा सके कि परिणामी मॉडल प्रत्येक चरण में उपलब्ध कराई गई जानकारी की संरचना की उपेक्षा नहीं करता है। किसी सामान्य मॉडलिंग भाषा द्वारा उत्पन्न एसपी समस्या का एक उदाहरण काफी बड़ा (रैखिक रूप से परिदृश्यों की संख्या में) हो जाता है, और इसका आव्यूह उस संरचना को खो देता है जो समस्याओं के इस वर्ग के लिए मौलिक है, जिसका लाभ अन्यथा विशिष्ट अपघटन एल्गोरिदम द्वारा हल समय पर लिया जा सकता है। विशेष रूप से एसपी के लिए संरचित की गई मॉडलिंग भाषाओं के विस्तार दिखाई देने लगे हैं, देखें: | ||
*[[एआईएमएमएस]] - एसपी समस्याओं की परिभाषा का समर्थन | *[[एआईएमएमएस]] - एसपी समस्याओं की परिभाषा का समर्थन करती है | ||
*ईएमपी एसपी ( | *ईएमपी एसपी (स्टोकेस्टिक प्रोग्रामिंग के लिए विस्तारित गणितीय प्रोग्रामिंग) - स्टोकेस्टिक प्रोग्रामिंग को सुविधाजनक बनाने के लिए जीएएमएस का एक मॉड्यूल बनाया गया है (इसमें प्राचल बंटन के लिए संकेत शब्द, अवसर व्यवरोध और जोखिम पर मान एवं [[अपेक्षित कमी|प्रत्याशित कमी]] जैसी जोखिम की माप सम्मिलित हैं)। | ||
*[[एएमपीएल|एसएएमपीएल]] - एएमपीएल के | *[[एएमपीएल|एसएएमपीएल]] - एएमपीएल के विस्तार का एक समुच्चय विशेष रूप से स्टोकेस्टिक प्रोग्राम को व्यक्त करने के लिए संरचित किया गया है ( इसमें अवसर व्यवरोधों के लिए सिंटैक्स, एकीकृत अवसर व्यवरोध और [[मजबूत अनुकूलन|दृढ़ अनुकूलन]] समस्याएँ सम्मिलित हैं) | ||
ये दोनों एसएमपीएस उदाहरण तत्क्षण स्तर प्रारूप उत्पन्न कर सकते हैं, जो गैर-निरर्थक रूप में समस्या की संरचना को हलकर्ताओं तक पहुँचाता है। | |||
== यह भी देखें == | == यह भी देखें == | ||
* [[सहसंबंध अंतराल]] | * [[सहसंबंध अंतराल]] | ||
* | * स्टोकेस्टिक प्रोग्रामिंग के लिए विस्तारित गणितीय प्रोग्रामिंग (ईएमपी) | ||
* [[जोखिम में एंट्रोपिक मूल्य|जोखिम में एंट्रोपिक मान]] | * [[जोखिम में एंट्रोपिक मूल्य|जोखिम में एंट्रोपिक मान]] | ||
* [[ContSP|फोर्टएसपी]] | * [[ContSP|फोर्टएसपी]] | ||
* एसएएमपीएल बीजगणितीय मॉडलिंग भाषा | * एसएएमपीएल बीजगणितीय मॉडलिंग भाषा | ||
* [[परिदृश्य अनुकूलन]] | * [[परिदृश्य अनुकूलन]] | ||
* | * स्टोकेस्टिक अनुकूलन | ||
* [[मौका-विवश पोर्टफोलियो चयन|अवसर-व्यवरोधित पोर्टफोलियो चयन]] | * [[मौका-विवश पोर्टफोलियो चयन|अवसर-व्यवरोधित पोर्टफोलियो चयन]] | ||
Latest revision as of 12:26, 13 September 2023
गणितीय अनुकूलन के क्षेत्र में, स्टोकेस्टिक प्रोग्रामिंग या स्टोकेस्टिक प्रोग्रामिंग प्रतिरूपण अनुकूलन समस्याओं के लिए एक ऐसी संरचना है जिसमें अनिश्चितता सम्मिलित है। स्टोकेस्टिक प्रोग्राम एक ऐसी अनुकूलन समस्या है जिसमें कुछ या सभी समस्या प्राचल अनिश्चित हैं, लेकिन ज्ञात प्रायिकता वितरणों का अनुसरण करते हैं।[1][2] यह संरचना निर्धारणात्मक अनुकूलन के विपरीत है, जिसमें सभी समस्या प्राचलों को यथार्थ रूप से ज्ञात माना जाता है। स्टोकेस्टिक प्रोग्रामिंग का लक्ष्य एक ऐसा निर्णय प्राप्त करना है जो निर्णायक द्वारा चयनित कुछ प्राचलों का अनुकूलन करता है, और समस्या के प्राचलों की अनिश्चितता के लिए उचित रूप से ध्यान देने योग्य है। क्योंकि कई वास्तविक जगत के निर्णयों में अनिश्चितता सम्मिलित है, अतः स्टोकेस्टिक प्रोग्रामिंग का अनुप्रयोग वित्त से लेकर परिवहन तक ऊर्जा अनुकूलन के क्षेत्रों की एक विस्तृत श्रृंखला में देखा जाता है।[3][4]
द्वि-चरणीय समस्याएँ
द्वि-चरणीय स्टोकेस्टिक प्रोग्रामिंग का मूल विचार यह है कि (इष्टतम) निर्णय, निर्णय लिए जाने के समय उपलब्ध आंकड़ों पर आधारित होने चाहिए और ये निर्णय भविष्य के प्रेक्षणों पर निर्भर नहीं हो सकते हैं। स्टोकेस्टिक प्रोग्रामिंग में द्वि-चरणीय सूत्रीकरण का उपयोग व्यापक रूप से किया जाता है। द्वि-चरणीय स्टोकेस्टिक प्रोग्रामिंग समस्या का सामान्य सूत्रीकरण निम्न द्वारा दिया जाता है:
ऐसे सूत्रीकरण में, प्रथम-चरण निर्णय चर सदिश है, द्वितीय-चरण निर्णय चर सदिश है, और द्वितीय चरण की समस्या के आँकड़े को समाहित करता है। इस सूत्रीकरण में, प्रथम चरण में हमें अनिश्चित आँकड़े (इसे एक यादृच्छिक सदिश के रूप में देखा जाता है) की प्राप्ति से पहले "यहीं और अभी (तत्काल)" निर्णय लेना होता है। द्वितीय चरण में, की प्राप्ति के उपलब्ध होने के बाद, हम उपयुक्त अनुकूलन समस्या को हल करके अपने व्यवहार को अनुकूलित करते हैं।
प्रथम चरण में हम प्रथम चरण के निर्णय की लागत के साथ-साथ (इष्टतम) द्वितीय चरण के निर्णय की अपेक्षित लागत का अनुकूलन (उपर्युक्त सूत्रीकरण में न्यूनीकृत) करते हैं। हम द्वितीय चरण की समस्या को केवल एक ऐसी अनुकूलन समस्या के रूप में देख सकते हैं जो अनिश्चित आंकड़ों के प्रकट होने पर हमारे अनुमानित इष्टतम व्यवहार का वर्णन करती है, या हम इसके हल को एक ऐसी आश्रय क्रिया के रूप में मान सकते हैं जहाँ शब्द निकाय की संभावित असंगति की क्षतिपूर्ति करता है और इस आश्रय क्रिया की लागत है।
विचार की गयी द्वि-चरणीय समस्या रैखिक है क्योंकि उद्देश्य फलन और व्यवरोध रैखिक हैं। संकल्पनात्मक रूप से यह आवश्यक नहीं है और अधिक सामान्य द्वि-चरणीय स्टोकेस्टिक प्रोग्रामों पर विचार किया जा सकता है। उदाहरण के लिए, यदि प्रथम-चरण की समस्या पूर्णांक है, तो प्रथम-चरण की समस्या में समाकलनीय व्यवरोधों को इस प्रकार जोड़ा जा सकता है कि सुसंगत समुच्चय असतत हो जाये। आवश्यकतानुसार अरैखिक उद्देश्यों और व्यवरोधों को भी सम्मिलित किया जा सकता है।[5]
बंटनात्मक कल्पना
उपरोक्त द्वि-चरणीय समस्या का सूत्रीकरण यह मानता है कि द्वितीय-चरण के डेटा को ज्ञात प्रायिकता वितरण वाले एक यादृच्छिक सदिश के रूप में प्रतिरूपित किया गया है। यह कई स्थितियों में उचित होता है। उदाहरण के लिए, के बंटन को ऐतिहासिक आँकड़े से अनुमानित किया जा सकता है यदि मान जाता है कि वितरण किसी समयावधि में प्रभावशाली रूप से परिवर्तित नहीं होता है। इसके अतिरिक्त, प्रतिदर्श के प्रयोगसिद्ध बंटन का उपयोग के अग्रिम मानों के बंटन के सन्निकटन के रूप में किया जा सकता है। यदि का पूर्व मॉडल उपलब्ध है, तो बेज़ के अपडेट द्वारा पश्चवर्ती बंटन प्राप्त किया जा सकता है।
असततीकरण
द्वि-चरणीय की स्टोकेस्टिक समस्या को संख्यात्मक रूप से हल करने के लिए, प्रायः यह मानने की आवश्यकता होती है कि यादृच्छिक सदिश में परिदृश्य नामक संभावित प्राप्तियों की संख्या सीमित है, माना ये हैं, जिनके संगत प्रायिकता द्रव्यमान हैं। तब प्रथम चरण की समस्या के उद्देश्य फलन में प्रत्याशा को निम्न योग के रूप में लिखा जा सकता है:
जब में संभावित प्राप्तियों की संख्या अपरिमित (या बहुत बड़ी) है, तो इस बंटन का निरूपण परिदृश्यों द्वारा करने के लिए मानक दृष्टिकोण है। यह दृष्टिकोण तीन प्रश्न उठाता है, अर्थात्:
- परिदृश्यों का निर्माण कैसे करें, देखें § परिदृश्य निर्माण;
- निर्धारणात्मक समतुल्य को कैसे हल करें। सीपीएलईएक्स, और जीएनयू रैखिक प्रोग्रामिंग किट (जीएलपीके) जैसे अनुकूलक बड़ी रैखिक/अरैखिक समस्याओं को हल कर सकते हैं। विस्कॉन्सिन विश्वविद्यालय, मैडिसन में आयोजित एनईओएस सर्वर[6] कई आधुनिक हलकर्ताओं तक मुफ्त पहुँच की अनुमति प्रदान करता है। निर्धारणात्मक समतुल्य की संरचना बेंडर्स अपघटन या परिदृश्य अपघटन जैसी अपघटन विधियों को लागू करने के लिए विशेष रूप से उत्तरदायी है,[7]
- "सही" इष्टतम के सापेक्ष प्राप्त हल की गुणवत्ता को कैसे मापें।
ये प्रश्न स्वतंत्र नहीं हैं। उदाहरण के लिए, निर्मित परिदृश्यों की संख्या निर्धारणात्मक समतुल्य की वश्यता और प्राप्त हलों की गुणवत्ता दोनों को प्रभावित करती है।
स्टोकेस्टिक रैखिक प्रोग्राम
स्टोकेस्टिक रैखिक प्रोग्राम चिरसम्मत द्वि-चरणीय स्टोकेस्टिक प्रोग्राम का एक विशिष्ट उदाहरण है। एक स्टोकेस्टिक एलपी, बहु-आवधिक रैखिक प्रोग्रामों (एलपी) के संग्रह से बनाई गयी है, जिनमें से प्रत्येक की संरचना समान लेकिन आँकड़े कुछ अलग हैं। परिदृश्य को निरूपित करने वाली द्वि-आवधिक एलपी को निम्नलिखित रूप में माना जा सकता है:
सदिश और में प्रथम-आवधिक चर होते हैं, जिनके मानों का चयन तत्काल किया जाना चाहिए। सदिश अनुक्रमिक अवधियों के लिए सभी चरों को समाहित करता है। व्यवरोध केवल प्रथम-आवधिक चरों को सम्मिलित करता है और ये प्रत्येक परिदृश्य में समान होते हैं। अन्य व्यवरोधों में बाद की अवधियों के चर सम्मिलित हैं और अग्रिम अनिश्चितता को दर्शाते हुए परिदृश्य से परिदृश्य में कुछ स्थितियों में भिन्न हैं।
ध्यान दें कि द्वि-आवधिक एलपी को हल करना, बिना किसी अनिश्चितता के द्वितीय अवधि में परिदृश्य को मानने के बराबर है। द्वितीय चरण में अनिश्चितताओं को समाविष्ट करने के लिए, भिन्न परिदृश्यों के लिए प्रायिकताओं को आवंटित करना चाहिए और संगत निर्धारणात्मक समतुल्य को हल करना चाहिए।
स्टोकेस्टिक समस्या के निर्धारणात्मक समकक्ष
परिदृश्यों की परिमित संख्या के साथ, द्वि-चरणीय स्टोकेस्टिक रैखिक प्रोग्रामों को बड़ी रैखिक प्रोग्रामन समस्याओं के रूप में प्रतिरूपित किया जा सकता है। इस सूत्रीकरण को प्रायः निर्धारणात्मक समतुल्य रैखिक प्रोग्राम या संक्षिप्त रूप में निर्धारणात्मक समतुल्य कहा जाता है। (निष्पक्ष रूप से कहने पर, निर्धारणात्मक समतुल्य एक ऐसा गणितीय प्रोग्राम है जिसका उपयोग इष्टतम प्रथम-चरण के निर्णय की गणना करने के लिए किया जा सकता है, इसलिए ये तब भी सतत प्रायिकता बंटन के लिए अस्तित्व में होते हैं, जब द्वितीय चरण की लागत का निरूपण समान संवृत रूप में किया जा सकता है।) उदाहरण के लिए, उपरोक्त स्टोकेस्टिक रैखिक प्रोग्राम के समतुल्य के निर्माण के लिए, हम प्रत्येक परिदृश्य के लिए एक प्रायिकता आवंटित करते हैं।
फिर हम सभी परिदृश्यों से व्यवरोधों के अधीन उद्देश्य के प्रत्याशित मान को न्यूनतम कर सकते हैं:
हमारे पास प्रत्येक परिदृश्य के लिए, आनुक्रमिक अवधियों के चरों का एक अलग सदिश है। प्रथम आवधिक चर और प्रत्येक परिदृश्य में समान होते हैं, हालाँकि, क्योंकि हमें यह जानने से पहले प्रथम अवधि के लिए निर्णय लेना चाहिए कि कौन सा परिदृश्य प्राप्त होगा। परिणामस्वरूप, केवल और को सम्मिलित करने वाले व्यवरोधों को केवल एक बार निर्दिष्ट करने की आवश्यकता होती है, जबकि शेष व्यवरोधों को प्रत्येक परिदृश्य के लिए एकल रूप से निर्दिष्ट किया जाना चाहिए।
परिदृश्य निर्माण
व्यवहार में भविष्य पर विशेषज्ञों का मत जानकर परिदृश्यों का निर्माण करना संभव हो सकता है। निर्मित परिदृश्यों की संख्या अपेक्षाकृत साधारण होनी चाहिए जिससे प्राप्त निर्धारणात्मक समतुल्य को उचित संगणनीय प्रयास से हल किया जा सके। प्रायः यह दावा किया जाता है कि केवल कुछ परिदृश्यों का उपयोग करने वाला एक हल केवल एक परिदृश्य को मानने वाले हल की तुलना में अधिक अनुकूलनीय योजनाएँ प्रदान करता है। कुछ स्थितियों में ऐसे दावे को अनुकरण द्वारा सत्यापित किया जा सकता है। सिद्धांत रूप में आश्वासन के कुछ प्रमाप उपलब्ध हैं, जिससे एक प्राप्त हल मूल समस्या को उचित यथार्थता के साथ हल करता है। सामान्यतः अनुप्रयोगों में केवल प्रथम चरण इष्टतम हल का एक व्यावहारिक मान है क्योंकि लगभग सदैव यादृच्छिक आँकड़ों का "सत्य" प्रतिफलन निर्मित (उत्पन्न) परिदृश्यों के समुच्चय से अलग होता है।
माना में स्वतंत्र यादृच्छिक घटक सम्मिलित हैं, जिनमें से प्रत्येक में तीन संभावित प्रतिफल हैं (उदाहरण के लिए, प्रत्येक यादृच्छिक प्राचलों के भविष्य के प्रतिफलों को निम्न, मध्यम और उच्च के रूप में वर्गीकृत किया गया है), तो परिदृश्यों की कुल संख्या है। परिदृश्यों की संख्या में इस प्रकार की घातीय वृद्धि उचित आकार के लिए भी विशेषज्ञ के मत का उपयोग करके मॉडल के विकास को अत्यधिक जटिल बना देती है। यह स्थिति और भी खराब हो जाती है यदि के कुछ यादृच्छिक घटकों में सतत बंटन हैं।
मोंटे कार्लो प्रतिचयन और प्रतिदर्श औसत सन्निकटन (एसएए) विधि
मोंटे कार्लो अनुकरण का उपयोग, एक प्रबंधनीय आकार के लिए निर्धारित परिदृश्य को कम करने के लिए एक सामान्य दृष्टिकोण है। माना परिदृश्यों की कुल संख्या अत्यधिक या अपरिमित है। आगे माना कि हम यादृच्छिक सदिश की प्रतिकृतियों का एक प्रतिदर्श उत्पन्न कर सकते हैं। सामान्यतः प्रतिदर्श को स्वतंत्र और समान रूप से वितरित (आई.आई.डी प्रतिदर्श) माना जाता है। दिए गए एक प्रतिदर्श के लिए, प्रत्याशा फलन को निम्न प्रतिदर्श औसत द्वारा सन्निकटित किया जाता है
और फलस्वरूप प्रथम चरण की समस्या निम्न द्वारा दी गई है
इस सूत्रीकरण को प्रतिदर्श औसत सन्निकटन विधि के रूप में जाना जाता है। एसएए समस्या माने गए प्रतिदर्श का एक फलन है और इस अर्थ में यादृच्छिक है। दिए गए प्रतिदर्श के लिए, एसएए समस्या परिदृश्यों ., वाली द्वि-चरणीय स्टोकेस्टिक रैखिक प्रोग्रामन समस्या के समान रूप की है, जिनमें से प्रत्येक को समान प्रायिकता के साथ लिया गया है।
सांख्यिकीय निष्कर्ष
निम्नलिखित स्टोकेस्टिक प्रोग्रामन समस्या पर विचार करें
यहाँ , का एक अरिक्त संवृत उपसमुच्चय है, एक यादृच्छिक सदिश है जिसका प्रायिकता बंटन एक समुच्चय , और पर समर्थित है। द्वि-चरणीय स्टोकेस्टिक प्रोग्रामन की संरचना में, को संगत द्वितीय-चरणीय समस्या के इष्टतम मान द्वारा दिया गया है।
माना सभी के लिए सुपरिभाषित और परिमित मान फलन है। इसका तात्पर्य है कि प्रत्येक के लिए मान लगभग निश्चित है।
माना हमारे पास यादृच्छिक सदिश के प्रतिफलनों का एक प्रतिदर्श है। इस यादृच्छिक प्रतिदर्श को के प्रेक्षणों को ऐतिहासिक आँकड़े के रूप में देखा जा सकता है, या इसे मोंटे कार्लो प्रतिरूपण तकनीकों द्वारा उत्पन्न किया जा सकता है। तब हम एक संगत प्रतिदर्श औसत सन्निकटन सूत्रित कर सकते हैं
वृहत संख्या सिद्धांत के अनुसार हमें ज्ञात है कि, , कुछ नियमितता शर्तों के तहत प्रायिकता 1 के साथ तक बिंदुवार अभिसरित होता है, क्योंकि ।इसके अतिरिक्त, मंद अतिरिक्त परिस्थितियों में अभिसरण एक समान है। हमारे पास भी है, अर्थात्, , का एक अनभिनत आंकलक है। इसलिए, यह आशा करना स्वाभाविक है कि एसएए समस्या का इष्टतम मान और इष्टतम हल वास्तविक समस्या के अपने समतुल्यों के साथ अभिसरण करते हैं क्योंकि ।
एसएए आंकलकों की संगतता
माना एसएए समस्या का सुसंगत समुच्चय नियत है, अर्थात् यह प्रतिदर्श से स्वतंत्र है। माना और , क्रमशः वास्तविक समस्या के इष्टतम मान और इष्टतम हलों का समुच्चय है और माना और , क्रमशः एसएए समस्या के इष्टतम मान और इष्टतम हलों का समुच्चय है।
- माना और (निर्धारणात्मक) वास्तविक मान फलनों का एक अनुक्रम है। निम्नलिखित दो गुण समतुल्य हैं:
- किसी और में अभिसरित किसी अनुक्रम के लिए, यह इस प्रकार है कि , में अभिसरित होता है
- फलन , पर सतत है और , के किसी सघन उपसमुच्चय पर पर समान रूप से अभिसरित होता है
- यदि एसएए समस्या का उद्देश्य , सुसंगत समुच्चय पर समान रूप से प्रायिकता 1 वाली वास्तविक समस्या के उद्देश्य में अभिसरित होता है, क्योंकि । तब , प्रायिकता 1 वाले में अभिसरित होता है, क्योंकि ।
- माना एक ऐसे सघन समुच्चय का अस्तित्व है कि
- वास्तविक समस्या के इष्टतम हलों का समुच्चय अरिक्त है और में निहित है
- परिमित मान फलन है और पर सतत है
- फलनों का अनुक्रम , में समान रूप से प्रायिकता 1 के साथ में अभिसरित होता है, क्योंकि
- के लिए काफी बड़ा समुच्चय अरिक्त है और प्रायिकता 1 के साथ
- तब प्रायिकता 1 के साथ और क्योंकि । ध्यान दें कि , समुच्चय के समुच्चय से विचलन को दर्शाता है, जो इस प्रकार परिभाषित है
कुछ स्थितियों में एसएए समस्या के सुसंगत समुच्चय का इष्टतमीकरण किया गया है, तो संगत एसएए समस्या निम्न रूप ग्रहण करती है
जहाँ , प्रतिदर्श के आधार पर का उपसमुच्चय है और इसलिए यादृच्छिक है। फिर भी, एसएए आंकलकों के लिए निसंगतता परिणाम, अभी भी कुछ अतिरिक्त धारणाओं के तहत प्राप्त किए जा सकते हैं:
- माना एक ऐसे सघन समुच्चय का अस्तित्व है कि
- वास्तविक समस्या के इष्टतम हलों का समुच्चय अरिक्त है और में निहित है
- परिमित मान फलन है और पर सतत है
- फलनों का अनुक्रम , में समान रूप से प्रायिकता 1 के साथ में अभिसरित होता है, क्योंकि
- के लिए काफी बड़ा समुच्चय अरिक्त है और प्रायिकता 1 के साथ
- यदि और प्रायिकता 1 के साथ एक बिंदु पर अभिसरित होता है, तब
- कुछ बिंदुओं के लिए, एक ऐसे अनुक्रम का अस्तित्व है कि प्रायिकता 1 के साथ ।
- तब प्रायिकता 1 के साथ और , क्योंकि ।
एसएए इष्टतम मान के उपगमन
माना प्रतिदर्श आई.आई.डी. है और एक बिंदु को नियत करता है। फिर का प्रतिदर्श औसत आंकलक , अनभिनत है और इसका विचरण है, जहाँ परिमित माना जाता है। इसके अतिरिक्त, केंद्रीय सीमा प्रमेय द्वारा हमारे पास निम्न है
जहाँ बंटन में अभिसरण को दर्शाता है और में माध्य और विचरण वाला एक अभिलम्ब बंटन है, जिसे के रूप में लिखा गया है।
दूसरे शब्दों में, उपगामी अभिलम्ब बंटन है, अर्थात्, बड़े के लिए, में माध्य और विचरण वाला लगभग अभिलम्ब बंटन है। यह के लिए निम्न (अनुमानित) % विश्वास्यता अंतराल की ओर जाता है:
जहाँ (यहाँ मानक अभिलम्ब वितरण के सीडीएफ को दर्शाता है) और
का प्रतिदर्श प्रसरण आंकलन है। अर्थात् के आंकलन की त्रुटि (स्टोकेस्टिक रूप से) कोटि की है।
अनुप्रयोग और उदाहरण
जैविक अनुप्रयोग
व्यावहारिक पारिस्थितिकी जैसे क्षेत्रों में पशुओं के व्यवहार को प्रतिरूपित करने के लिए प्रायः स्टोकेस्टिक गतिशील प्रोग्रामिंग का उपयोग किया जाता है।[8][9] इष्टतम फोरेजिंग (चारे की तलाश), पक्षियों में उड़ने और परजीवी ततैयों में अंडे देने जैसे जैविक जीवन चक्र संक्रमणों के आनुभविक परीक्षण व्यवहारिक निर्णय लेने के विकास की व्याख्या करने में इस मॉडलिंग तकनीक के महत्व को दर्शाते हैं। ये मॉडल सामान्यतः दो चरणों के स्थान कई चरणों वाले होते हैं।
आर्थिक अनुप्रयोग
स्टोकेस्टिक गतिमान प्रोग्रामिंग, अनिश्चितता के तहत निर्णय लेने की समझ में एक उपयोगी उपकरण है। अनिश्चितता के तहत पूँजीगत भण्डार का संचय इसका एक उदाहरण है; इसका उपयोग प्रायः संसाधन अर्थशास्त्रियों द्वारा जैव आर्थिक समस्याओं का विश्लेषण करने के लिए किया जाता है[10] जहाँ मौसम आदि में अनिश्चितता प्रवेश करती है।
उदाहरण: बहुचरणीय पोर्टफोलियो अनुकूलन
निम्न उदाहरण बहु-चरणीय स्टोकेस्टिक प्रोग्रामिंग के वित्त से एक निम्न उदाहरण है। माना समय पर, संपत्तियों पर निवेश करने के लिए हमारे पास प्रारंभिक पूँजी है। आगे माना कि हमें समय पर अपने पोर्टफोलियो को अतिरिक्त नकदी डाले बिना पुनर्संतुलित करने की अनुमति है। प्रत्येक अवधि में हम वर्तमान धन के संपत्तियों में पुनर्वितरण के बारे में निर्णय लेते हैं। माना , n संपत्तियों में निवेश की गई प्रारंभिक राशि है। हमें आवश्यकता है कि प्रत्येक गैर-ऋणात्मक हो और संतुलन समीकरण सत्य होना चाहिए।
प्रत्येक अवधि के लिएक, ुल प्रतिफल पर विचार करें। यह एक सदिश-मान यादृच्छिक प्रक्रिया का निर्माण करता है। समयावधि में, हम संगत संपत्तियों में निविष्ट राशियों को निर्दिष्ट करके पोर्टफोलियो को पुनर्संतुलित कर सकते हैं। उस समय पहली अवधि में प्रतिफल की प्राप्ति हो गयी है, इसलिए इस जानकारी का उपयोग पुनर्संतुलन निर्णय में करना उचित है। इस प्रकार, मय पर द्वितीय चरण के निर्णय,वास्तव में यादृच्छिक सदिश की प्राप्ति के फलन हैं, अर्थात्, । इसी प्रकार, समय पर निर्णय , , समय तक यादृच्छिक प्रक्रिया के इतिहास द्वारा दी गयी उपलब्ध जानकारी का एक फलन है। फलनों , का एक अनुक्रम, जिसमें स्थिर है, निर्णय प्रक्रिया की कार्यान्वयन योग्य नीति को परिभाषित करता है। ऐसा कहा जाता है कि ऐसी नीति सुसंगत होती है यदि यह प्रायिकता 1 वाले मॉडल के व्यवरोधों, अर्थात् गैर-ऋणात्मकता व्यवरोध , , , को संतुष्ट करती है, और धन व्यवरोधों का संतुलन निम्न है,
जहाँ अवधि में धन निम्न द्वारा दिया गया है
जो यादृच्छिक प्रक्रिया की प्राप्ति और समय तक के निर्णयों पर निर्भर करता है।
माना इसका उद्देश्य अंतिम अवधि में इस धन की प्रत्याशित उपयोगिता को अधिकतम करना है, अर्थात् निम्न समस्या पर विचार करने पर
यह एक बहुचरणीय स्टोकेस्टिक प्रोग्रामिंग समस्या है, जहाँ चरणों को से तक क्रमांकित किया जाता है। अनुकूलन सभी कार्यान्वयन योग्य और सुसंगत नीतियों पर किया जाता है। समस्या के विवरण को पूरा करने के लिए यादृच्छिक प्रक्रिया के प्रायिकता बंटन को परिभाषित करने की आवश्यकता होती है। यह विभिन्न विधियों से किया जा सकता है। उदाहरण के लिए, प्रक्रिया के समय के विकास को परिभाषित करने वाले एक विशेष परिदृश्य वृक्ष का निर्माण किया जा सकता है। यदि प्रत्येक स्तर पर प्रत्येक परिसंपत्ति के यादृच्छिक प्रतिफल को अन्य संपत्तियों से स्वतंत्र दो सततताओं की अनुमति दी जाती है, तो परिदृश्यों की कुल संख्या होती है।}
गतिशील प्रोग्रामिंग समीकरणों को लिखने के लिए, उपरोक्त बहुचरणीय समस्या के पश्च समय पर विचार करें। अंतिम चरण में, यादृच्छिक प्रक्रिया का एक प्रतिफल ज्ञात है और का चयन किया गया है। इसलिए, निम्नलिखित समस्या को हल करने की आवश्यकता होती है
जहाँ दिये गये की सप्रतिबन्ध प्रत्याशा को दर्शाता है। उपरोक्त समस्या का इष्टतम मान और पर निर्भर करता है और द्वारा निरूपित किया जाता है।
इसी प्रकार, चरणों में, निम्न समस्या को हल किया जाना चाहिए,
जिसका इष्टतम मान द्वारा निरूपित किया जाता है। अंततः, चरण पर, निम्न समस्या हल की जाती है
चरणवार स्वतंत्र यादृच्छिक प्रक्रिया
प्रक्रिया के सामान्य बंटन के लिए, इन गतिशील प्रोग्रामिंग समीकरणों को हल करना जटिल हो सकता है। यह स्थिति प्रभावशाली रूप से सरल हो जाती है, यदि प्रक्रिया चरणवार स्वतंत्र है, अर्थात्, , के लिए से स्वतंत्र है। इस स्थिति में, संगत सप्रतिबन्ध प्रत्याशाएँ, अप्रतिबंध प्रत्याशाएँ बन जाती हैं, और फलन , , पर निर्भर नहीं करता है। अर्थात्, , समस्या का इष्टतम मान है
और , के लिए निम्न का इष्टतम मान है
सॉफ्टवेयर उपकरण
मॉडलिंग भाषाएँ
सभी असतत स्टोकेस्टिक प्रोग्रामिंग समस्याओं को किसी भी बीजगणितीय मॉडलिंग भाषा के साथ हस्तचालित रूप से स्पष्ट या निहित गैर-प्रत्याशात्मकता को लागू करने के लिए प्रदर्शित किया जा सकता है जिससे यह सुनिश्चित किया जा सके कि परिणामी मॉडल प्रत्येक चरण में उपलब्ध कराई गई जानकारी की संरचना की उपेक्षा नहीं करता है। किसी सामान्य मॉडलिंग भाषा द्वारा उत्पन्न एसपी समस्या का एक उदाहरण काफी बड़ा (रैखिक रूप से परिदृश्यों की संख्या में) हो जाता है, और इसका आव्यूह उस संरचना को खो देता है जो समस्याओं के इस वर्ग के लिए मौलिक है, जिसका लाभ अन्यथा विशिष्ट अपघटन एल्गोरिदम द्वारा हल समय पर लिया जा सकता है। विशेष रूप से एसपी के लिए संरचित की गई मॉडलिंग भाषाओं के विस्तार दिखाई देने लगे हैं, देखें:
- एआईएमएमएस - एसपी समस्याओं की परिभाषा का समर्थन करती है
- ईएमपी एसपी (स्टोकेस्टिक प्रोग्रामिंग के लिए विस्तारित गणितीय प्रोग्रामिंग) - स्टोकेस्टिक प्रोग्रामिंग को सुविधाजनक बनाने के लिए जीएएमएस का एक मॉड्यूल बनाया गया है (इसमें प्राचल बंटन के लिए संकेत शब्द, अवसर व्यवरोध और जोखिम पर मान एवं प्रत्याशित कमी जैसी जोखिम की माप सम्मिलित हैं)।
- एसएएमपीएल - एएमपीएल के विस्तार का एक समुच्चय विशेष रूप से स्टोकेस्टिक प्रोग्राम को व्यक्त करने के लिए संरचित किया गया है ( इसमें अवसर व्यवरोधों के लिए सिंटैक्स, एकीकृत अवसर व्यवरोध और दृढ़ अनुकूलन समस्याएँ सम्मिलित हैं)
ये दोनों एसएमपीएस उदाहरण तत्क्षण स्तर प्रारूप उत्पन्न कर सकते हैं, जो गैर-निरर्थक रूप में समस्या की संरचना को हलकर्ताओं तक पहुँचाता है।
यह भी देखें
- सहसंबंध अंतराल
- स्टोकेस्टिक प्रोग्रामिंग के लिए विस्तारित गणितीय प्रोग्रामिंग (ईएमपी)
- जोखिम में एंट्रोपिक मान
- फोर्टएसपी
- एसएएमपीएल बीजगणितीय मॉडलिंग भाषा
- परिदृश्य अनुकूलन
- स्टोकेस्टिक अनुकूलन
- अवसर-व्यवरोधित पोर्टफोलियो चयन
संदर्भ
- ↑ Shapiro, Alexander; Dentcheva, Darinka; Ruszczyński, Andrzej (2009). Lectures on stochastic programming: Modeling and theory (PDF). MPS/SIAM Series on Optimization. Vol. 9. Philadelphia, PA: Society for Industrial and Applied Mathematics (SIAM). Mathematical Programming Society (MPS). pp. xvi+436. ISBN 978-0-89871-687-0. MR 2562798.
- ↑ Birge, John R.; Louveaux, François (2011). Introduction to Stochastic Programming. Springer Series in Operations Research and Financial Engineering (in British English). doi:10.1007/978-1-4614-0237-4. ISBN 978-1-4614-0236-7. ISSN 1431-8598.
- ↑ Stein W. Wallace and William T. Ziemba (eds.). Applications of Stochastic Programming. MPS-SIAM Book Series on Optimization 5, 2005.
- ↑ Applications of stochastic programming are described at the following website, Stochastic Programming Community.
- ↑ Shapiro, Alexander; Philpott, Andy. A tutorial on Stochastic Programming (PDF).
- ↑ "NEOS Server for Optimization".
- ↑ Ruszczyński, Andrzej; Shapiro, Alexander (2003). Stochastic Programming. Handbooks in Operations Research and Management Science. Vol. 10. Philadelphia: Elsevier. p. 700. ISBN 978-0444508546.
- ↑ Mangel, M. & Clark, C. W. 1988. Dynamic modeling in behavioral ecology. Princeton University Press ISBN 0-691-08506-4
- ↑ Houston, A. I & McNamara, J. M. 1999. Models of adaptive behaviour: an approach based on state. Cambridge University Press ISBN 0-521-65539-0
- ↑ Howitt, R., Msangi, S., Reynaud, A and K. Knapp. 2002. "Using Polynomial Approximations to Solve Stochastic Dynamic Programming Problems: or A "Betty Crocker " Approach to SDP." University of California, Davis, Department of Agricultural and Resource Economics Working Paper.
अग्रिम पठन
- John R. Birge and François V. Louveaux. Introduction to Stochastic Programming. Springer Verlag, New York, 1997.
- Kall, Peter; Wallace, Stein W. (1994). Stochastic programming. Wiley-Interscience Series in Systems and Optimization. Chichester: John Wiley & Sons, Ltd. pp. xii+307. ISBN 0-471-95158-7. MR 1315300.
- G. Ch. Pflug: Optimization of Stochastic Models. The Interface between Simulation and Optimization. Kluwer, Dordrecht, 1996.
- András Prékopa. Stochastic Programming. Kluwer Academic Publishers, Dordrecht, 1995.
- Andrzej Ruszczynski and Alexander Shapiro (eds.) (2003) Stochastic Programming. Handbooks in Operations Research and Management Science, Vol. 10, Elsevier.
- Shapiro, Alexander; Dentcheva, Darinka; Ruszczyński, Andrzej (2009). Lectures on stochastic programming: Modeling and theory (PDF). MPS/SIAM Series on Optimization. Vol. 9. Philadelphia, PA: Society for Industrial and Applied Mathematics (SIAM). Mathematical Programming Society (MPS). pp. xvi+436. ISBN 978-0-89871-687-0. MR 2562798.
- Stein W. Wallace and William T. Ziemba (eds.) (2005) Applications of Stochastic Programming. MPS-SIAM Book Series on Optimization 5
- King, Alan J.; Wallace, Stein W. (2012). Modeling with Stochastic Programming. Springer Series in Operations Research and Financial Engineering. New York: Springer. ISBN 978-0-387-87816-4.