स्टोकेस्टिक प्रोग्रामिंग: Difference between revisions
No edit summary |
No edit summary |
||
Line 1: | Line 1: | ||
{{Short description|Framework for modeling optimization problems that involve uncertainty}} | {{Short description|Framework for modeling optimization problems that involve uncertainty}} | ||
{{For|नियंत्रण सिद्धांत का संदर्भ|प्रसंभाव्य नियंत्रण}} | {{For|नियंत्रण सिद्धांत का संदर्भ|प्रसंभाव्य नियंत्रण}} | ||
[[गणितीय अनुकूलन]] के क्षेत्र में, '''प्रसंभाव्य प्रोग्रामिंग''' या ''' | [[गणितीय अनुकूलन]] के क्षेत्र में, '''प्रसंभाव्य प्रोग्रामिंग''' या '''प्रसंभाव्य प्रोग्रामिंग''' प्रतिरूपण [[अनुकूलन (गणित)|अनुकूलन]] समस्याओं के लिए एक ऐसी संरचना है जिसमें [[अनिश्चितता]] सम्मिलित है। '''प्रसंभाव्य प्रोग्राम''' एक ऐसी अनुकूलन समस्या है जिसमें कुछ या सभी समस्या प्राचल अनिश्चित हैं, लेकिन ज्ञात प्रायिकता वितरणों का अनुसरण करते हैं।<ref>{{cite book|last1=Shapiro|first1=Alexander|url=http://www2.isye.gatech.edu/people/faculty/Alex_Shapiro/SPbook.pdf|title=Lectures on stochastic programming: Modeling and theory|last2=Dentcheva|first2=Darinka|last3=Ruszczyński|first3=Andrzej|publisher=Society for Industrial and Applied Mathematics (SIAM)|year=2009|isbn=978-0-89871-687-0|series=MPS/SIAM Series on Optimization|volume=9|location=Philadelphia, PA|pages=xvi+436|mr=2562798|author2-link=Darinka Dentcheva|author3-link=Andrzej Piotr Ruszczyński|agency=Mathematical Programming Society (MPS)}}</ref><ref>{{Cite book|last1=Birge|first1=John R.|last2=Louveaux|first2=François|date=2011|title=Introduction to Stochastic Programming|url=https://doi.org/10.1007/978-1-4614-0237-4|series=Springer Series in Operations Research and Financial Engineering|language=en-gb|doi=10.1007/978-1-4614-0237-4|isbn=978-1-4614-0236-7|issn=1431-8598}}</ref> यह संरचना नियतात्मक अनुकूलन के विपरीत है, जिसमें सभी समस्या प्राचलों को यथार्थ रूप से ज्ञात माना जाता है। प्रसंभाव्य प्रोग्रामिंग का लक्ष्य एक ऐसा निर्णय प्राप्त करना है जो निर्णायक द्वारा चयनित कुछ प्राचलों का अनुकूलन करता है, और समस्या के प्राचलों की अनिश्चितता के लिए उचित रूप से ध्यान देने योग्य है। क्योंकि कई वास्तविक जगत के निर्णयों में अनिश्चितता सम्मिलित है, अतः प्रसंभाव्य प्रोग्रामिंग का अनुप्रयोग [[वित्त]] से लेकर परिवहन तक ऊर्जा अनुकूलन के क्षेत्रों की एक विस्तृत श्रृंखला में देखा जाता है।<ref> | ||
Stein W. Wallace and William T. Ziemba (eds.). ''[https://books.google.com/books?id=KAI0jsuyDPsC&printsec=frontcover&dq=%22Applications+of+Stochastic+Programming%22&hl=en&sa=X&ved=0ahUKEwivt-nn2OfiAhURXa0KHYJMC9UQ6AEIKjAA#v=onepage&q=%22Applications%20of%20Stochastic%20Programming%22&f=false Applications of Stochastic Programming]''. MPS-SIAM Book Series on Optimization 5, 2005. | Stein W. Wallace and William T. Ziemba (eds.). ''[https://books.google.com/books?id=KAI0jsuyDPsC&printsec=frontcover&dq=%22Applications+of+Stochastic+Programming%22&hl=en&sa=X&ved=0ahUKEwivt-nn2OfiAhURXa0KHYJMC9UQ6AEIKjAA#v=onepage&q=%22Applications%20of%20Stochastic%20Programming%22&f=false Applications of Stochastic Programming]''. MPS-SIAM Book Series on Optimization 5, 2005. | ||
</ref><ref> | </ref><ref> | ||
Applications of stochastic programming are described at the following website, [http://stoprog.org Stochastic Programming Community]. | Applications of stochastic programming are described at the following website, [http://stoprog.org Stochastic Programming Community]. | ||
</ref> | </ref> | ||
== | == द्वि-चरणीय समस्याएँ == | ||
द्वि-चरणीय प्रसंभाव्य प्रोग्रामिंग का मूल विचार यह है कि (इष्टतम) निर्णय, निर्णय लिए जाने के समय उपलब्ध आंकड़ों पर आधारित होने चाहिए और ये निर्णय भविष्य के प्रेक्षणों पर निर्भर नहीं हो सकते हैं। प्रसंभाव्य प्रोग्रामिंग में द्वि-चरणीय सूत्रीकरण का उपयोग व्यापक रूप से किया जाता है। द्वि-चरणीय प्रसंभाव्य प्रोग्रामिंग समस्या का सामान्य सूत्रीकरण निम्न द्वारा दिया जाता है:<math display="block"> | |||
\min_{x\in X}\{ g(x)= f(x) + E_{\xi}[Q(x,\xi)]\} | \min_{x\in X}\{ g(x)= f(x) + E_{\xi}[Q(x,\xi)]\} | ||
</math> | </math>जहाँ <math>Q(x,\xi)</math> द्वितीय-चरण की समस्या का इष्टतम मान है<math display="block"> | ||
\min_{y}\{ q(y,\xi) \,|\,T(\xi)x+W(\xi) y = h(\xi)\}. | \min_{y}\{ q(y,\xi) \,|\,T(\xi)x+W(\xi) y = h(\xi)\}. | ||
</math> | </math>चिरसम्मत द्वि-चरणीय रैखिक प्रसंभाव्य प्रोग्रामिंग समस्याओं को निम्न रूप में सूत्रित किया जा सकता है<math display="block"> | ||
<math display="block"> | |||
\begin{array}{llr} | \begin{array}{llr} | ||
\min\limits_{x\in \mathbb{R}^n} &g(x)= c^T x + E_{\xi}[Q(x,\xi)] & \\ | \min\limits_{x\in \mathbb{R}^n} &g(x)= c^T x + E_{\xi}[Q(x,\xi)] & \\ | ||
Line 18: | Line 17: | ||
& x \geq 0 & | & x \geq 0 & | ||
\end{array} | \end{array} | ||
</math> | </math>जहाँ <math> Q(x,\xi)</math> द्वितीय-चरण की समस्या का इष्टतम मान है<math display="block"> | ||
<math display="block"> | |||
\begin{array}{llr} | \begin{array}{llr} | ||
\min\limits_{y\in \mathbb{R}^m} & q(\xi)^T y & \\ | \min\limits_{y\in \mathbb{R}^m} & q(\xi)^T y & \\ | ||
Line 27: | Line 24: | ||
\end{array} | \end{array} | ||
</math> | </math> | ||
ऐसे सूत्रीकरण में <math>x\in \mathbb{R}^n</math> प्रथम-चरण निर्णय चर | |||
ऐसे सूत्रीकरण में, <math>x\in \mathbb{R}^n</math> प्रथम-चरण निर्णय चर सदिश है, <math>y\in \mathbb{R}^m</math> द्वितीय-चरण निर्णय चर सदिश है, और <math>\xi(q,T,W,h)</math> द्वितीय चरण की समस्या के आँकड़े को समाहित करता है। इस सूत्रीकरण में, प्रथम चरण में हमें अनिश्चित आँकड़े <math>\xi</math> की प्राप्ति से पहले "यहीं और अभी (तत्काल)" निर्णय <math>x</math> लेना है, एक यादृच्छिक सदिश के रूप में देखा जाता है। दूसरे चरण में, की प्राप्ति के बाद <math>\xi</math> उपलब्ध हो जाता है, हम उपयुक्त अनुकूलन समस्या को हल करके अपने व्यवहार को अनुकूलित करते हैं। | |||
पहले चरण में हम लागत का अनुकूलन करते हैं (उपर्युक्त फॉर्मूलेशन में न्यूनतम)। <math>c^Tx</math> प्रथम चरण के निर्णय के साथ साथ (इष्टतम) दूसरे चरण के निर्णय की अपेक्षित लागत। हम दूसरे चरण की समस्या को केवल एक अनुकूलन समस्या के रूप में देख सकते हैं जो अनिश्चित डेटा के प्रकट होने पर हमारे अनुमानित इष्टतम व्यवहार का वर्णन करती है, या हम इसके समाधान को एक सहारा कार्रवाई के रूप में मान सकते हैं जहां शब्द <math>Wy</math> सिस्टम की संभावित असंगति के लिए क्षतिपूर्ति करता है <math>Tx\leq h</math> और <math>q^Ty</math> इस सहारा कार्रवाई की लागत है। | पहले चरण में हम लागत का अनुकूलन करते हैं (उपर्युक्त फॉर्मूलेशन में न्यूनतम)। <math>c^Tx</math> प्रथम चरण के निर्णय के साथ साथ (इष्टतम) दूसरे चरण के निर्णय की अपेक्षित लागत। हम दूसरे चरण की समस्या को केवल एक अनुकूलन समस्या के रूप में देख सकते हैं जो अनिश्चित डेटा के प्रकट होने पर हमारे अनुमानित इष्टतम व्यवहार का वर्णन करती है, या हम इसके समाधान को एक सहारा कार्रवाई के रूप में मान सकते हैं जहां शब्द <math>Wy</math> सिस्टम की संभावित असंगति के लिए क्षतिपूर्ति करता है <math>Tx\leq h</math> और <math>q^Ty</math> इस सहारा कार्रवाई की लागत है। | ||
माना जाने वाला द्वि-चरण समस्या रैखिक है क्योंकि उद्देश्य कार्य और बाधाएं रैखिक हैं। संकल्पनात्मक रूप से यह आवश्यक नहीं है और कोई अधिक सामान्य | माना जाने वाला द्वि-चरण समस्या रैखिक है क्योंकि उद्देश्य कार्य और बाधाएं रैखिक हैं। संकल्पनात्मक रूप से यह आवश्यक नहीं है और कोई अधिक सामान्य द्वि-चरणीय प्रसंभाव्य कार्यक्रमों पर विचार कर सकता है। उदाहरण के लिए, यदि प्रथम-चरण की समस्या पूर्णांक है, तो कोई प्रथम-चरण की समस्या में अभिन्नता की कमी को जोड़ सकता है ताकि व्यवहार्य सेट असतत हो। जरूरत पड़ने पर गैर-रैखिक उद्देश्यों और बाधाओं को भी शामिल किया जा सकता है।<ref>{{cite book| last1=Shapiro|first1=Alexander|last2=Philpott|first2=Andy|title=A tutorial on Stochastic Programming| url=http://www2.isye.gatech.edu/people/faculty/Alex_Shapiro/TutorialSP.pdf}}</ref> | ||
=== वितरण धारणा === | === वितरण धारणा === | ||
उपरोक्त | उपरोक्त द्वि-चरणीय की समस्या का सूत्रीकरण दूसरे चरण के डेटा को मानता है <math>\xi</math> एक 'ज्ञात' संभाव्यता वितरण के साथ एक यादृच्छिक सदिश के रूप में तैयार किया गया है। यह कई स्थितियों में उचित होगा। उदाहरण के लिए, का वितरण <math>\xi</math> ऐतिहासिक डेटा से अनुमान लगाया जा सकता है यदि कोई मानता है कि समय की अवधि में वितरण महत्वपूर्ण रूप से नहीं बदलता है। इसके अलावा, नमूने के अनुभवजन्य वितरण का उपयोग भविष्य के मानों के वितरण के अनुमान के रूप में किया जा सकता है <math>\xi</math>. यदि किसी के पास पूर्व मॉडल है <math>\xi</math>, कोई बायेसियन अपडेट द्वारा पोस्टरियरी वितरण प्राप्त कर सकता है। | ||
=== विवेक === | === विवेक === | ||
संख्यात्मक रूप से | संख्यात्मक रूप से द्वि-चरणीय की प्रसंभाव्य समस्या को हल करने के लिए, अक्सर यह मानने की आवश्यकता होती है कि यादृच्छिक सदिश <math>\xi</math> संभावित अहसासों की एक सीमित संख्या होती है, जिन्हें परिदृश्य कहा जाता है <math>\xi_1,\dots,\xi_K</math>, संबंधित संभाव्यता द्रव्यमान के साथ <math>p_1,\dots,p_K</math>. तब प्रथम चरण की समस्या के उद्देश्य समारोह में अपेक्षा को योग के रूप में लिखा जा सकता है:<math display="block"> | ||
E[Q(x,\xi)]=\sum\limits_{k=1}^{K} p_kQ(x,\xi_k) | E[Q(x,\xi)]=\sum\limits_{k=1}^{K} p_kQ(x,\xi_k) | ||
</math>और, इसके अलावा, | </math>और, इसके अलावा, द्वि-चरणीय की समस्या को एक बड़ी रैखिक प्रोग्रामिंग समस्या के रूप में तैयार किया जा सकता है (इसे मूल समस्या का नियतात्मक समतुल्य कहा जाता है, अनुभाग देखें {{Section link||§ यादृच्छिक समस्या का निर्धारक समतुल्य}})। | ||
Line 50: | Line 49: | ||
== प्रसंभाव्य रैखिक प्रोग्राम == | == प्रसंभाव्य रैखिक प्रोग्राम == | ||
एक प्रसंभाव्य [[रैखिक कार्यक्रम|रैखिक प्रोग्राम]] क्लासिकल टू-स्टेज | एक प्रसंभाव्य [[रैखिक कार्यक्रम|रैखिक प्रोग्राम]] क्लासिकल टू-स्टेज प्रसंभाव्य प्रोग्राम का एक विशिष्ट उदाहरण है। एक प्रसंभाव्य एलपी मल्टी-पीरियड लीनियर प्रोग्राम (एलपी) के संग्रह से बनाया गया है, जिनमें से प्रत्येक की संरचना समान है लेकिन कुछ अलग डेटा है। <math>k^{th}</math> एच> दो-अवधि एलपी, प्रतिनिधित्व करते हैं <math>k^{th}</math> परिदृश्य, निम्नलिखित रूप होने के रूप में माना जा सकता है: | ||
<math> | <math> | ||
Line 65: | Line 64: | ||
ध्यान दें कि हल करना <math>k^{th}</math> दो-अवधि एलपी मानने के बराबर है <math>k^{th}</math> बिना किसी अनिश्चितता के दूसरी अवधि में परिदृश्य। दूसरे चरण में अनिश्चितताओं को शामिल करने के लिए, किसी को अलग-अलग परिदृश्यों के लिए संभावनाओं को आवंटित करना चाहिए और संबंधित नियतात्मक समतुल्य को हल करना चाहिए। | ध्यान दें कि हल करना <math>k^{th}</math> दो-अवधि एलपी मानने के बराबर है <math>k^{th}</math> बिना किसी अनिश्चितता के दूसरी अवधि में परिदृश्य। दूसरे चरण में अनिश्चितताओं को शामिल करने के लिए, किसी को अलग-अलग परिदृश्यों के लिए संभावनाओं को आवंटित करना चाहिए और संबंधित नियतात्मक समतुल्य को हल करना चाहिए। | ||
=== एक | === एक प्रसंभाव्य समस्या के नियतात्मक समकक्ष === | ||
परिमित संख्या में परिदृश्यों के साथ, | परिमित संख्या में परिदृश्यों के साथ, द्वि-चरणीय प्रसंभाव्य रैखिक कार्यक्रमों को बड़ी रैखिक प्रोग्रामिंग समस्याओं के रूप में तैयार किया जा सकता है। इस सूत्रीकरण को अक्सर नियतात्मक समतुल्य रैखिक कार्यक्रम कहा जाता है, या नियतात्मक समतुल्य के लिए संक्षिप्त किया जाता है। (सख्ती से एक नियतात्मक समतुल्य बोलना कोई भी गणितीय कार्यक्रम है जिसका उपयोग इष्टतम प्रथम-चरण के निर्णय की गणना करने के लिए किया जा सकता है, इसलिए ये निरंतर संभाव्यता वितरण के लिए भी मौजूद रहेंगे, जब कोई किसी बंद रूप में दूसरे चरण की लागत का प्रतिनिधित्व कर सकता है।) के लिए उदाहरण के लिए, उपरोक्त प्रसंभाव्य रैखिक कार्यक्रम के समतुल्य समतुल्य बनाने के लिए, हम एक प्रायिकता प्रदान करते हैं <math>p_k</math> प्रत्येक परिदृश्य के लिए <math>k=1,\dots,K</math>। | ||
फिर हम सभी परिदृश्यों से बाधाओं के अधीन उद्देश्य के अपेक्षित | फिर हम सभी परिदृश्यों से बाधाओं के अधीन उद्देश्य के अपेक्षित मान को कम कर सकते हैं: | ||
<math> | <math> | ||
Line 81: | Line 80: | ||
\end{array} | \end{array} | ||
</math> | </math> | ||
हमारे पास एक अलग | हमारे पास एक अलग सदिश है <math>z_k</math> प्रत्येक परिदृश्य के लिए बाद की | ||
हमारे पास एक अलग | हमारे पास एक अलग सदिश है प्रत्येक परिदृश्य के लिए बाद की अवधि के चर <math>k</math>। पहली अवधि के चर <math>x</math> और <math>y</math> हालाँकि, हर परिदृश्य में y समान होते हैं, क्योंकि हमें यह जानने से पहले पहली अवधि के लिए निर्णय लेना चाहिए कि कौन सा परिदृश्य साकार होगा। नतीजतन, बाधाओं को शामिल करना <math>x</math> और <math>y</math> को केवल एक बार निर्दिष्ट करने की आवश्यकता है, जबकि शेष बाधाओं को प्रत्येक परिदृश्य के लिए अलग से दिया जाना चाहिए। | ||
== परिदृश्य निर्माण == | == परिदृश्य निर्माण == | ||
व्यवहार में भविष्य पर विशेषज्ञों की राय जानने के द्वारा परिदृश्यों का निर्माण करना संभव हो सकता है। निर्मित परिदृश्यों की संख्या अपेक्षाकृत मामूली होनी चाहिए ताकि प्राप्त नियतात्मक समतुल्य को उचित कम्प्यूटेशनल प्रयास से हल किया जा सके। अक्सर यह दावा किया जाता है कि केवल कुछ परिदृश्यों का उपयोग करने वाला एक समाधान केवल एक परिदृश्य को मानने वाले समाधान की तुलना में अधिक अनुकूलनीय योजनाएं प्रदान करता है। कुछ मामलों में ऐसे दावे को अनुकरण द्वारा सत्यापित किया जा सकता है। सिद्धांत रूप में गारंटी के कुछ उपाय कि एक प्राप्त समाधान मूल समस्या को उचित सटीकता के साथ हल करता है। आम तौर पर अनुप्रयोगों में केवल प्रथम चरण इष्टतम समाधान <math>x^*</math> का एक व्यावहारिक | व्यवहार में भविष्य पर विशेषज्ञों की राय जानने के द्वारा परिदृश्यों का निर्माण करना संभव हो सकता है। निर्मित परिदृश्यों की संख्या अपेक्षाकृत मामूली होनी चाहिए ताकि प्राप्त नियतात्मक समतुल्य को उचित कम्प्यूटेशनल प्रयास से हल किया जा सके। अक्सर यह दावा किया जाता है कि केवल कुछ परिदृश्यों का उपयोग करने वाला एक समाधान केवल एक परिदृश्य को मानने वाले समाधान की तुलना में अधिक अनुकूलनीय योजनाएं प्रदान करता है। कुछ मामलों में ऐसे दावे को अनुकरण द्वारा सत्यापित किया जा सकता है। सिद्धांत रूप में गारंटी के कुछ उपाय कि एक प्राप्त समाधान मूल समस्या को उचित सटीकता के साथ हल करता है। आम तौर पर अनुप्रयोगों में केवल प्रथम चरण इष्टतम समाधान <math>x^*</math> का एक व्यावहारिक मान है क्योंकि लगभग हमेशा यादृच्छिक डेटा का "सत्य" अहसास निर्मित (उत्पन्न) परिदृश्यों के सेट से अलग होगा। | ||
कल्पना करना <math>\xi</math> में शामिल है <math>d</math> स्वतंत्र यादृच्छिक घटक, जिनमें से प्रत्येक में तीन संभावित अहसास हैं (उदाहरण के लिए, प्रत्येक यादृच्छिक मापदंडों की भविष्य की प्राप्ति को निम्न, मध्यम और उच्च के रूप में वर्गीकृत किया गया है), तो परिदृश्यों की कुल संख्या है <math>K=3^d</math>। परिदृश्यों की संख्या में इस तरह की घातीय वृद्धि उचित आकार के लिए भी विशेषज्ञ की राय का उपयोग करके मॉडल विकास को बहुत कठिन बना देती है <math>d</math>। स्थिति और भी खराब हो जाती है अगर कुछ यादृच्छिक घटक <math>\xi</math> का निरंतर वितरण है। | कल्पना करना <math>\xi</math> में शामिल है <math>d</math> स्वतंत्र यादृच्छिक घटक, जिनमें से प्रत्येक में तीन संभावित अहसास हैं (उदाहरण के लिए, प्रत्येक यादृच्छिक मापदंडों की भविष्य की प्राप्ति को निम्न, मध्यम और उच्च के रूप में वर्गीकृत किया गया है), तो परिदृश्यों की कुल संख्या है <math>K=3^d</math>। परिदृश्यों की संख्या में इस तरह की घातीय वृद्धि उचित आकार के लिए भी विशेषज्ञ की राय का उपयोग करके मॉडल विकास को बहुत कठिन बना देती है <math>d</math>। स्थिति और भी खराब हो जाती है अगर कुछ यादृच्छिक घटक <math>\xi</math> का निरंतर वितरण है। | ||
Line 92: | Line 91: | ||
=== मोंटे कार्लो नमूनाकरण और नमूना औसत सन्निकटन (SAA) विधि === | === मोंटे कार्लो नमूनाकरण और नमूना औसत सन्निकटन (SAA) विधि === | ||
एक प्रबंधनीय आकार के लिए निर्धारित परिदृश्य को कम करने के लिए एक सामान्य दृष्टिकोण मोंटे कार्लो सिमुलेशन का उपयोग करना है। मान लीजिए परिदृश्यों की कुल संख्या बहुत बड़ी या अनंत है। आगे मान लीजिए कि हम एक नमूना उत्पन्न कर सकते हैं <math>\xi^1,\xi^2,\dots,\xi^N</math> का <math>N</math> यादृच्छिक | एक प्रबंधनीय आकार के लिए निर्धारित परिदृश्य को कम करने के लिए एक सामान्य दृष्टिकोण मोंटे कार्लो सिमुलेशन का उपयोग करना है। मान लीजिए परिदृश्यों की कुल संख्या बहुत बड़ी या अनंत है। आगे मान लीजिए कि हम एक नमूना उत्पन्न कर सकते हैं <math>\xi^1,\xi^2,\dots,\xi^N</math> का <math>N</math> यादृच्छिक सदिश की प्रतिकृति <math>\xi</math>. आमतौर पर नमूने को [[स्वतंत्र और समान रूप से वितरित]] (i.i.d नमूना) माना जाता है। एक नमूना दिया गया है, अपेक्षा फलन <math>q(x)=E[Q(x,\xi)]</math> नमूना औसत द्वारा अनुमानित है | ||
<math> | <math> | ||
Line 106: | Line 105: | ||
\end{array} | \end{array} | ||
</math> | </math> | ||
इस सूत्रीकरण को नमूना औसत सन्निकटन विधि के रूप में जाना जाता है। SAA समस्या माने गए नमूने का एक कार्य है और इस अर्थ में यादृच्छिक है। दिए गए नमूने के लिए <math>\xi^1,\xi^2,\dots,\xi^N</math> SAA समस्या परिदृश्यों के साथ | इस सूत्रीकरण को नमूना औसत सन्निकटन विधि के रूप में जाना जाता है। SAA समस्या माने गए नमूने का एक कार्य है और इस अर्थ में यादृच्छिक है। दिए गए नमूने के लिए <math>\xi^1,\xi^2,\dots,\xi^N</math> SAA समस्या परिदृश्यों के साथ द्वि-चरणीय प्रसंभाव्य रैखिक प्रोग्रामिंग समस्या के समान रूप की है <math>\xi^j</math>., <math>j=1,\dots,N</math>, प्रत्येक को समान संभावना के साथ लिया गया <math>p_j=\frac{1}{N}</math>. | ||
== सांख्यिकीय निष्कर्ष == | == सांख्यिकीय निष्कर्ष == | ||
Line 116: | Line 115: | ||
</math></div> | </math></div> | ||
यहाँ <math>X</math> का एक गैर-रिक्त बंद उपसमुच्चय है <math>\mathbb{R}^n</math>, <math>\xi</math> एक यादृच्छिक सदिश है जिसका संभाव्यता वितरण <math>P</math> एक सेट पर समर्थित है <math>\Xi \subset \mathbb{R}^d</math>, और <math>Q: X \times \Xi \rightarrow \mathbb{R}</math>. टू-स्टेज प्रसंभाव्य प्रोग्रामिंग के ढांचे में, <math>Q(x,\xi)</math> संबंधित दूसरे चरण की समस्या के इष्टतम | यहाँ <math>X</math> का एक गैर-रिक्त बंद उपसमुच्चय है <math>\mathbb{R}^n</math>, <math>\xi</math> एक यादृच्छिक सदिश है जिसका संभाव्यता वितरण <math>P</math> एक सेट पर समर्थित है <math>\Xi \subset \mathbb{R}^d</math>, और <math>Q: X \times \Xi \rightarrow \mathbb{R}</math>. टू-स्टेज प्रसंभाव्य प्रोग्रामिंग के ढांचे में, <math>Q(x,\xi)</math> संबंधित दूसरे चरण की समस्या के इष्टतम मान द्वारा दिया गया है। | ||
ये मान लीजिए <math>g(x)</math> सभी के लिए अच्छी तरह से परिभाषित और परिमित | ये मान लीजिए <math>g(x)</math> सभी के लिए अच्छी तरह से परिभाषित और परिमित मानवान है <math>x\in X</math>. इसका तात्पर्य है कि प्रत्येक के लिए <math>x\in X</math> मान <math>Q(x,\xi)</math> लगभग निश्चित है। | ||
मान लीजिए कि हमारे पास एक नमूना है <math>\xi^1,\dots,\xi^N</math> का <math>N</math>यादृच्छिक | मान लीजिए कि हमारे पास एक नमूना है <math>\xi^1,\dots,\xi^N</math> का <math>N</math>यादृच्छिक सदिश की प्राप्ति <math>\xi</math>. इस यादृच्छिक नमूने को ऐतिहासिक डेटा के रूप में देखा जा सकता है <math>N</math> के अवलोकन <math>\xi</math>, या इसे मोंटे कार्लो सैंपलिंग तकनीकों द्वारा उत्पन्न किया जा सकता है। तब हम एक संगत नमूना औसत सन्निकटन तैयार कर सकते हैं | ||
<div वर्ग = केंद्र शैली = चौड़ाई: ऑटो; मार्जिन-लेफ्ट: ऑटो; मार्जिन-राइट: ऑटो; ><math> | <div वर्ग = केंद्र शैली = चौड़ाई: ऑटो; मार्जिन-लेफ्ट: ऑटो; मार्जिन-राइट: ऑटो; ><math> | ||
Line 126: | Line 125: | ||
</math></div> | </math></div> | ||
बड़ी संख्या के कानून के अनुसार हमारे पास कुछ नियमितता शर्तों के तहत है <math>\frac{1}{N} \sum_{j=1}^N Q(x,\xi^j)</math> प्रायिकता 1 से बिंदुवार अभिसरित होता है <math>E[Q(x,\xi)]</math> जैसा <math>N \rightarrow \infty</math>. इसके अलावा, हल्के अतिरिक्त परिस्थितियों में अभिसरण एक समान है। हमारे पास भी है <math>E[\hat{g}_N(x)]=g(x)</math>, अर्थात।, <math>\hat{g}_N(x)</math> का निष्पक्ष आकलनकर्ता है <math>g(x)</math>. इसलिए, यह उम्मीद करना स्वाभाविक है कि SAA समस्या का इष्टतम | बड़ी संख्या के कानून के अनुसार हमारे पास कुछ नियमितता शर्तों के तहत है <math>\frac{1}{N} \sum_{j=1}^N Q(x,\xi^j)</math> प्रायिकता 1 से बिंदुवार अभिसरित होता है <math>E[Q(x,\xi)]</math> जैसा <math>N \rightarrow \infty</math>. इसके अलावा, हल्के अतिरिक्त परिस्थितियों में अभिसरण एक समान है। हमारे पास भी है <math>E[\hat{g}_N(x)]=g(x)</math>, अर्थात।, <math>\hat{g}_N(x)</math> का निष्पक्ष आकलनकर्ता है <math>g(x)</math>. इसलिए, यह उम्मीद करना स्वाभाविक है कि SAA समस्या का इष्टतम मान और इष्टतम समाधान वास्तविक समस्या के अपने समकक्षों के साथ अभिसरण करते हैं क्योंकि <math>N \rightarrow \infty</math>. | ||
=== एसएए अनुमानकों की संगति === | === एसएए अनुमानकों की संगति === | ||
संभव सेट मान लीजिए <math>X</math> SAA समस्या का समाधान निश्चित है, अर्थात यह नमूने से स्वतंत्र है। होने देना <math>\vartheta^*</math> और <math>S^*</math> वास्तविक समस्या का क्रमशः इष्टतम | संभव सेट मान लीजिए <math>X</math> SAA समस्या का समाधान निश्चित है, अर्थात यह नमूने से स्वतंत्र है। होने देना <math>\vartheta^*</math> और <math>S^*</math> वास्तविक समस्या का क्रमशः इष्टतम मान और इष्टतम समाधान का सेट हो और चलो <math>\hat{\vartheta}_N</math> और <math>\hat{S}_N</math> SAA समस्या का क्रमशः इष्टतम मान और इष्टतम समाधान का सेट हो। | ||
# होने देना <math>g: X \rightarrow \mathbb{R}</math> और <math>\hat{g}_N: X \rightarrow \mathbb{R}</math> (नियतात्मक) वास्तविक | # होने देना <math>g: X \rightarrow \mathbb{R}</math> और <math>\hat{g}_N: X \rightarrow \mathbb{R}</math> (नियतात्मक) वास्तविक मानवान कार्यों का एक क्रम हो। निम्नलिखित दो गुण समतुल्य हैं: | ||
#* किसी के लिए <math>\overline{x}\in X</math> और कोई अनुक्रम <math>\{x_N\}\subset X</math> में अभिसरण <math>\overline{x}</math> यह इस प्रकार है कि <math>\hat{g}_N(x_N)</math> में विलीन हो जाता है <math>g(\overline{x})</math> | #* किसी के लिए <math>\overline{x}\in X</math> और कोई अनुक्रम <math>\{x_N\}\subset X</math> में अभिसरण <math>\overline{x}</math> यह इस प्रकार है कि <math>\hat{g}_N(x_N)</math> में विलीन हो जाता है <math>g(\overline{x})</math> | ||
#* कार्यक्रम <math>g(\cdot)</math> निरंतर चालू है <math>X</math> और <math>\hat{g}_N(\cdot)</math> में विलीन हो जाता है <math>g(\cdot)</math> के किसी भी कॉम्पैक्ट सबसेट पर समान रूप से <math>X</math> | #* कार्यक्रम <math>g(\cdot)</math> निरंतर चालू है <math>X</math> और <math>\hat{g}_N(\cdot)</math> में विलीन हो जाता है <math>g(\cdot)</math> के किसी भी कॉम्पैक्ट सबसेट पर समान रूप से <math>X</math> | ||
Line 138: | Line 137: | ||
# मान लीजिए कि एक कॉम्पैक्ट सेट मौजूद है <math>C \subset \mathbb{R}^n</math> ऐसा है कि | # मान लीजिए कि एक कॉम्पैक्ट सेट मौजूद है <math>C \subset \mathbb{R}^n</math> ऐसा है कि | ||
#* सेट <math>S</math> वास्तविक समस्या का इष्टतम समाधान रिक्त नहीं है और इसमें निहित है <math>C</math> | #* सेट <math>S</math> वास्तविक समस्या का इष्टतम समाधान रिक्त नहीं है और इसमें निहित है <math>C</math> | ||
#* कार्यक्रम <math>g(x)</math> परिमित | #* कार्यक्रम <math>g(x)</math> परिमित मानवान और निरंतर है <math>C</math> | ||
#* कार्यों का क्रम <math>\hat{g}_N(x)</math> में विलीन हो जाता है <math>g(x)</math> संभाव्यता 1 के साथ, जैसा <math>N \rightarrow \infty</math>, समान रूप से <math>x\in C</math> | #* कार्यों का क्रम <math>\hat{g}_N(x)</math> में विलीन हो जाता है <math>g(x)</math> संभाव्यता 1 के साथ, जैसा <math>N \rightarrow \infty</math>, समान रूप से <math>x\in C</math> | ||
#* के लिए <math>N</math> काफी बड़ा सेट <math>\hat{S}_N</math> खाली नहीं है और <math>\hat{S}_N \subset C</math> संभाव्यता 1 के साथ | #* के लिए <math>N</math> काफी बड़ा सेट <math>\hat{S}_N</math> खाली नहीं है और <math>\hat{S}_N \subset C</math> संभाव्यता 1 के साथ | ||
Line 153: | Line 152: | ||
</math></div> | </math></div> | ||
जहाँ <math>X_N</math> का उपसमुच्चय है <math>\mathbb{R}^n</math> नमूने के आधार पर और इसलिए यादृच्छिक है। फिर भी, SAA आकलनकर्ताओं के लिए निरंतरता परिणाम अभी भी कुछ अतिरिक्त धारणाओं के तहत प्राप्त किए जा सकते हैं: | |||
# मान लीजिए कि एक कॉम्पैक्ट सेट मौजूद है <math>C \subset \mathbb{R}^n</math> ऐसा है कि | # मान लीजिए कि एक कॉम्पैक्ट सेट मौजूद है <math>C \subset \mathbb{R}^n</math> ऐसा है कि | ||
#* सेट <math>S</math> वास्तविक समस्या का इष्टतम समाधान रिक्त नहीं है और इसमें निहित है <math>C</math> | #* सेट <math>S</math> वास्तविक समस्या का इष्टतम समाधान रिक्त नहीं है और इसमें निहित है <math>C</math> | ||
#* कार्यक्रम <math>g(x)</math> परिमित | #* कार्यक्रम <math>g(x)</math> परिमित मानवान और निरंतर है <math>C</math> | ||
#* कार्यों का क्रम <math>\hat{g}_N(x)</math> में विलीन हो जाता है <math>g(x)</math> संभाव्यता 1 के साथ, जैसा <math>N \rightarrow \infty</math>, समान रूप से <math>x\in C</math> | #* कार्यों का क्रम <math>\hat{g}_N(x)</math> में विलीन हो जाता है <math>g(x)</math> संभाव्यता 1 के साथ, जैसा <math>N \rightarrow \infty</math>, समान रूप से <math>x\in C</math> | ||
#* के लिए <math>N</math> काफी बड़ा सेट <math>\hat{S}_N</math> खाली नहीं है और <math>\hat{S}_N \subset C</math> संभाव्यता 1 के साथ | #* के लिए <math>N</math> काफी बड़ा सेट <math>\hat{S}_N</math> खाली नहीं है और <math>\hat{S}_N \subset C</math> संभाव्यता 1 के साथ | ||
Line 163: | Line 162: | ||
:: तब <math>\hat{\vartheta}_N \rightarrow \vartheta^*</math> और <math>\mathbb{D}(S^*,\hat{S}_N)\rightarrow 0 </math> प्रायिकता 1 के रूप में <math>N\rightarrow \infty </math>. | :: तब <math>\hat{\vartheta}_N \rightarrow \vartheta^*</math> और <math>\mathbb{D}(S^*,\hat{S}_N)\rightarrow 0 </math> प्रायिकता 1 के रूप में <math>N\rightarrow \infty </math>. | ||
=== एसएए इष्टतम | === एसएए इष्टतम मान के स्पर्शोन्मुख === | ||
मान लीजिए नमूना <math>\xi^1,\dots,\xi^N</math> आई.आई.डी. और एक बिंदु तय करें <math>x \in X</math>. फिर नमूना औसत अनुमानक <math>\hat{g}_N(x)</math>, का <math>g(x)</math>, निष्पक्ष है और इसमें विचरण है <math>\frac{1}{N}\sigma^2(x)</math>, | मान लीजिए नमूना <math>\xi^1,\dots,\xi^N</math> आई.आई.डी. और एक बिंदु तय करें <math>x \in X</math>. फिर नमूना औसत अनुमानक <math>\hat{g}_N(x)</math>, का <math>g(x)</math>, निष्पक्ष है और इसमें विचरण है <math>\frac{1}{N}\sigma^2(x)</math>, जहाँ <math>\sigma^2(x):=Var[Q(x,\xi)]</math> परिमित माना जाता है। इसके अलावा, [[केंद्रीय सीमा प्रमेय]] द्वारा हमारे पास वह है | ||
<div वर्ग="केंद्र" शैली="चौड़ाई:" ऑटो; मार्जिन-लेफ्ट: मार्जिन-राइट:><math> | <div वर्ग="केंद्र" शैली="चौड़ाई:" ऑटो; मार्जिन-लेफ्ट: मार्जिन-राइट:><math> | ||
Line 170: | Line 169: | ||
</math></div> | </math></div> | ||
जहाँ <math>\xrightarrow{\mathcal{D}}</math> वितरण में अभिसरण को दर्शाता है और <math>Y_x</math> माध्य के साथ एक सामान्य वितरण है <math>0</math> और विचरण <math>\sigma^2(x)</math>, के रूप में लिखा गया है <math>\mathcal{N}(0,\sigma^2(x))</math>. | |||
दूसरे शब्दों में, <math>\hat{g}_N(x)</math> विषम रूप से सामान्य वितरण है, यानी, बड़े के लिए <math>N</math>, <math>\hat{g}_N(x)</math> माध्य के साथ लगभग सामान्य वितरण है <math>g(x)</math> और विचरण <math>\frac{1}{N}\sigma^2(x)</math>. यह निम्नलिखित (अनुमानित) की ओर जाता है <math>100(1-\alpha)</math>के लिए % विश्वास अंतराल <math>f(x)</math>: | दूसरे शब्दों में, <math>\hat{g}_N(x)</math> विषम रूप से सामान्य वितरण है, यानी, बड़े के लिए <math>N</math>, <math>\hat{g}_N(x)</math> माध्य के साथ लगभग सामान्य वितरण है <math>g(x)</math> और विचरण <math>\frac{1}{N}\sigma^2(x)</math>. यह निम्नलिखित (अनुमानित) की ओर जाता है <math>100(1-\alpha)</math>के लिए % विश्वास अंतराल <math>f(x)</math>: | ||
Line 178: | Line 177: | ||
</math></div> | </math></div> | ||
जहाँ <math>z_{\alpha/2}:=\Phi^{-1}(1-\alpha/2)</math> (यहाँ <math>\Phi(\cdot)</math> मानक सामान्य वितरण के सीडीएफ को दर्शाता है) और | |||
<div वर्ग="केंद्र" शैली="चौड़ाई:" ऑटो; मार्जिन-लेफ्ट: मार्जिन-राइट:><math> | <div वर्ग="केंद्र" शैली="चौड़ाई:" ऑटो; मार्जिन-लेफ्ट: मार्जिन-राइट:><math> | ||
Line 189: | Line 188: | ||
=== जैविक अनुप्रयोग === | === जैविक अनुप्रयोग === | ||
व्यावहारिक पारिस्थितिकी जैसे क्षेत्रों में जानवरों के व्यवहार को मॉडल करने के लिए अक्सर [[स्टोचैस्टिक गतिशील प्रोग्रामिंग]] का उपयोग किया जाता है।<ref>Mangel, M. & Clark, C. W. 1988. ''Dynamic modeling in behavioral ecology.'' Princeton University Press {{ISBN|0-691-08506-4}}</ref><ref>Houston, A. I & McNamara, J. M. 1999. ''Models of adaptive behaviour: an approach based on state''. Cambridge University Press {{ISBN|0-521-65539-0}}</ref> [[इष्टतम फोर्जिंग सिद्धांत|इष्टतम फोर्जिंग]] के मॉडल के अनुभवजन्य परीक्षण, [[जैविक जीवन चक्र]] संक्रमण जैसे कि पक्षियों में [[कलियाना|भागना]] और [[परजीवी]] ततैया में अंडे देना व्यवहारिक निर्णय लेने के विकास की व्याख्या करने में इस मॉडलिंग तकनीक के | व्यावहारिक पारिस्थितिकी जैसे क्षेत्रों में जानवरों के व्यवहार को मॉडल करने के लिए अक्सर [[स्टोचैस्टिक गतिशील प्रोग्रामिंग|प्रसंभाव्य गतिशील प्रोग्रामिंग]] का उपयोग किया जाता है।<ref>Mangel, M. & Clark, C. W. 1988. ''Dynamic modeling in behavioral ecology.'' Princeton University Press {{ISBN|0-691-08506-4}}</ref><ref>Houston, A. I & McNamara, J. M. 1999. ''Models of adaptive behaviour: an approach based on state''. Cambridge University Press {{ISBN|0-521-65539-0}}</ref> [[इष्टतम फोर्जिंग सिद्धांत|इष्टतम फोर्जिंग]] के मॉडल के अनुभवजन्य परीक्षण, [[जैविक जीवन चक्र]] संक्रमण जैसे कि पक्षियों में [[कलियाना|भागना]] और [[परजीवी]] ततैया में अंडे देना व्यवहारिक निर्णय लेने के विकास की व्याख्या करने में इस मॉडलिंग तकनीक के मान को दर्शाता है। ये मॉडल आम तौर पर दो चरणों के बजाय कई चरणों वाले होते हैं। | ||
=== आर्थिक अनुप्रयोग === | === आर्थिक अनुप्रयोग === | ||
अनिश्चितता के तहत निर्णय लेने को समझने में | अनिश्चितता के तहत निर्णय लेने को समझने में प्रसंभाव्य डायनेमिक प्रोग्रामिंग एक उपयोगी उपकरण है। अनिश्चितता के तहत पूंजीगत स्टॉक का संचय एक उदाहरण है; अक्सर इसका उपयोग संसाधन अर्थशास्त्रियों द्वारा जैव आर्थिक समस्याओं का विश्लेषण करने के लिए किया जाता है<ref>Howitt, R., Msangi, S., Reynaud, A and K. Knapp. 2002. [http://www.agecon.ucdavis.edu/aredepart/facultydocs/Howitt/Polyapprox3a.pdf "Using Polynomial Approximations to Solve Stochastic Dynamic Programming Problems: or A "Betty Crocker " Approach to SDP."] University of California, Davis, Department of Agricultural and Resource Economics Working Paper.</ref> जहां मौसम, आदि में अनिश्चितता प्रवेश करती है। | ||
=== उदाहरण: मल्टीस्टेज पोर्टफोलियो अनुकूलन === | === उदाहरण: मल्टीस्टेज पोर्टफोलियो अनुकूलन === | ||
Line 201: | Line 200: | ||
मान लीजिए कि समय पर <math>t=0</math> हमारे पास प्रारंभिक पूंजी है <math>W_0</math> में निवेश करना <math>n</math> संपत्तियां। आगे मान लीजिए कि हमें समय-समय पर अपने पोर्टफोलियो को पुनर्संतुलित करने की अनुमति है <math>t=1,\dots,T-1</math> लेकिन इसमें अतिरिक्त नकदी डाले बिना। प्रत्येक अवधि में <math>t</math> हम वर्तमान धन के पुनर्वितरण के बारे में निर्णय लेते हैं <math>W_t</math> बिच में <math>n</math> संपत्तियां। होने देना <math>x_0=(x_{10},\dots,x_{n0})</math> एन संपत्ति में निवेश की गई प्रारंभिक राशि हो। हम चाहते हैं कि प्रत्येक <math>x_{i0}</math> अऋणात्मक है और वह संतुलन समीकरण है <math>\sum_{i=1}^{n}x_{i0}=W_0</math> धारण करना चाहिए। | मान लीजिए कि समय पर <math>t=0</math> हमारे पास प्रारंभिक पूंजी है <math>W_0</math> में निवेश करना <math>n</math> संपत्तियां। आगे मान लीजिए कि हमें समय-समय पर अपने पोर्टफोलियो को पुनर्संतुलित करने की अनुमति है <math>t=1,\dots,T-1</math> लेकिन इसमें अतिरिक्त नकदी डाले बिना। प्रत्येक अवधि में <math>t</math> हम वर्तमान धन के पुनर्वितरण के बारे में निर्णय लेते हैं <math>W_t</math> बिच में <math>n</math> संपत्तियां। होने देना <math>x_0=(x_{10},\dots,x_{n0})</math> एन संपत्ति में निवेश की गई प्रारंभिक राशि हो। हम चाहते हैं कि प्रत्येक <math>x_{i0}</math> अऋणात्मक है और वह संतुलन समीकरण है <math>\sum_{i=1}^{n}x_{i0}=W_0</math> धारण करना चाहिए। | ||
कुल रिटर्न पर विचार करें <math>\xi_t=(\xi_{1t},\dots,\xi_{nt})</math> प्रत्येक अवधि के लिए <math>t=1,\dots,T</math>. यह एक | कुल रिटर्न पर विचार करें <math>\xi_t=(\xi_{1t},\dots,\xi_{nt})</math> प्रत्येक अवधि के लिए <math>t=1,\dots,T</math>. यह एक सदिश-मानवान यादृच्छिक प्रक्रिया बनाता है <math>\xi_1,\dots,\xi_T</math>. समय अवधि में <math>t=1</math>, हम राशियों को निर्दिष्ट करके पोर्टफोलियो को पुनर्संतुलित कर सकते हैं <math>x_1=(x_{11},\dots,x_{n1})</math> संबंधित संपत्तियों में निवेश किया। उस समय पहली अवधि में रिटर्न का एहसास हो गया है, इसलिए इस जानकारी का उपयोग पुनर्संतुलन निर्णय में करना उचित है। इस प्रकार, दूसरे चरण के फैसले, समय पर <math>t=1</math>, वास्तव में यादृच्छिक सदिश की प्राप्ति के कार्य हैं <math>\xi_1</math>, अर्थात।, <math>x_1=x_1(\xi_1)</math>. इसी तरह, समय पर <math>t</math> निर्णय <math>x_t=(x_{1t},\dots,x_{nt})</math> एक कार्य है <math>x_t=x_t(\xi_{[t]})</math> द्वारा उपलब्ध कराई गई जानकारी के अनुसार <math>\xi_{[t]}=(\xi_{1},\dots,\xi_{t})</math> समय-समय पर यादृच्छिक प्रक्रिया का इतिहास <math>t</math>. कार्यों का एक क्रम <math>x_t=x_t(\xi_{[t]})</math>, <math>t=0,\dots,T-1</math>, साथ <math>x_0</math> स्थिर होने के नाते, निर्णय प्रक्रिया की कार्यान्वयन योग्य नीति को परिभाषित करता है। ऐसा कहा जाता है कि ऐसी नीति संभव है यदि यह संभावना 1 के साथ मॉडल की कमी को पूरा करती है, यानी गैर-नकारात्मकता की कमी <math>x_{it}(\xi_{[t]})\geq 0</math>, <math>i=1,\dots,n</math>, <math>t=0,\dots,T-1</math>, और धन की कमी का संतुलन, | ||
:<math> | :<math> | ||
Line 218: | Line 217: | ||
\max E[U(W_T)]. | \max E[U(W_T)]. | ||
</math> | </math> | ||
यह एक मल्टीस्टेज | यह एक मल्टीस्टेज प्रसंभाव्य प्रोग्रामिंग समस्या है, जहाँ से चरणों को क्रमांकित किया जाता है <math>t=0</math> से <math>t=T-1</math>। अनुकूलन सभी कार्यान्वयन योग्य और व्यवहार्य नीतियों पर किया जाता है। समस्या के विवरण को पूरा करने के लिए किसी को भी यादृच्छिक प्रक्रिया के संभाव्यता वितरण को परिभाषित करने की आवश्यकता होती है <math>\xi_1,\dots,\xi_T</math>। यह विभिन्न तरीकों से किया जा सकता है। उदाहरण के लिए, प्रक्रिया के समय के विकास को परिभाषित करने वाला एक विशेष परिदृश्य वृक्ष का निर्माण कर सकता है। यदि प्रत्येक स्तर पर प्रत्येक परिसंपत्ति के यादृच्छिक रिटर्न को दो निरंतरताओं की अनुमति दी जाती है, अन्य संपत्तियों से स्वतंत्र, तो परिदृश्यों की कुल संख्या है <math>2^{nT}.</math>।} | ||
[[गतिशील प्रोग्रामिंग]] समीकरण लिखने के लिए, उपरोक्त मल्टीस्टेज समस्या को समय में पिछड़ने पर विचार करें। अंतिम चरण में <math>t=T-1</math>, एक अहसास <math>\xi_{[T-1]}=(\xi_{1},\dots,\xi_{T-1})</math> यादृच्छिक प्रक्रिया ज्ञात है और <math>x_{T-2}</math> चुना गया है। इसलिए, निम्नलिखित समस्या को हल करने की आवश्यकता है | [[गतिशील प्रोग्रामिंग]] समीकरण लिखने के लिए, उपरोक्त मल्टीस्टेज समस्या को समय में पिछड़ने पर विचार करें। अंतिम चरण में <math>t=T-1</math>, एक अहसास <math>\xi_{[T-1]}=(\xi_{1},\dots,\xi_{T-1})</math> यादृच्छिक प्रक्रिया ज्ञात है और <math>x_{T-2}</math> चुना गया है। इसलिए, निम्नलिखित समस्या को हल करने की आवश्यकता है | ||
Line 230: | Line 229: | ||
\end{array} | \end{array} | ||
</math> | </math> | ||
जहाँ <math>E[U(W_T)|\xi_{[T-1]}]</math> की सशर्त अपेक्षा को दर्शाता है <math>U(W_T)</math> दिया गया <math>\xi_{[T-1]}</math>. उपरोक्त समस्या का इष्टतम मान इस पर निर्भर करता है <math>W_{T-1}</math> और <math>\xi_{[T-1]}</math> और निरूपित किया जाता है <math>Q_{T-1}(W_{T-1},\xi_{[T-1]})</math>. | |||
इसी तरह, चरणों में <math>t=T-2,\dots,1</math>, समस्या का समाधान करना चाहिए | इसी तरह, चरणों में <math>t=T-2,\dots,1</math>, समस्या का समाधान करना चाहिए | ||
Line 242: | Line 241: | ||
\end{array} | \end{array} | ||
</math> | </math> | ||
जिसका इष्टतम | जिसका इष्टतम मान द्वारा निरूपित किया जाता है <math>Q_{t}(W_{t},\xi_{[t]})</math>. अंत में, मंच पर <math>t=0</math>, एक समस्या हल करता है | ||
:<math> | :<math> | ||
Line 255: | Line 254: | ||
==== चरणवार स्वतंत्र यादृच्छिक प्रक्रिया ==== | ==== चरणवार स्वतंत्र यादृच्छिक प्रक्रिया ==== | ||
प्रक्रिया के सामान्य वितरण के लिए <math>\xi_t</math>, इन गतिशील प्रोग्रामिंग समीकरणों को हल करना कठिन हो सकता है। यदि प्रक्रिया नाटकीय रूप से सरल हो जाती है <math>\xi_t</math> चरणवार स्वतंत्र है, अर्थात, <math>\xi_t</math> से स्वतंत्र है <math>\xi_1,\dots,\xi_{t-1}</math> के लिए <math>t=2,\dots,T</math>. इस मामले में, संबंधित सशर्त अपेक्षाएं बिना शर्त अपेक्षाएं और कार्य बन जाती हैं <math>Q_t(W_t)</math>, <math>t=1,\dots,T-1</math> पर निर्भर नहीं है <math>\xi_{[t]}</math>. वह है, <math>Q_{T-1}(W_{T-1})</math> समस्या का इष्टतम | प्रक्रिया के सामान्य वितरण के लिए <math>\xi_t</math>, इन गतिशील प्रोग्रामिंग समीकरणों को हल करना कठिन हो सकता है। यदि प्रक्रिया नाटकीय रूप से सरल हो जाती है <math>\xi_t</math> चरणवार स्वतंत्र है, अर्थात, <math>\xi_t</math> से स्वतंत्र है <math>\xi_1,\dots,\xi_{t-1}</math> के लिए <math>t=2,\dots,T</math>. इस मामले में, संबंधित सशर्त अपेक्षाएं बिना शर्त अपेक्षाएं और कार्य बन जाती हैं <math>Q_t(W_t)</math>, <math>t=1,\dots,T-1</math> पर निर्भर नहीं है <math>\xi_{[t]}</math>. वह है, <math>Q_{T-1}(W_{T-1})</math> समस्या का इष्टतम मान है | ||
:<math> | :<math> | ||
Line 265: | Line 264: | ||
\end{array} | \end{array} | ||
</math> | </math> | ||
और <math>Q_t(W_t)</math> का इष्टतम | और <math>Q_t(W_t)</math> का इष्टतम मान है | ||
:<math> | :<math> | ||
Line 280: | Line 279: | ||
===मॉडलिंग भाषाएं=== | ===मॉडलिंग भाषाएं=== | ||
सभी असतत | सभी असतत प्रसंभाव्य प्रोग्रामिंग समस्याओं को किसी भी [[बीजगणितीय मॉडलिंग भाषा]] के साथ प्रदर्शित किया जा सकता है, मैन्युअल रूप से स्पष्ट या निहित गैर-प्रत्याशाकता को लागू करने के लिए यह सुनिश्चित करने के लिए कि परिणामी मॉडल प्रत्येक चरण में उपलब्ध कराई गई जानकारी की संरचना का सम्मान करता है। एक सामान्य मॉडलिंग भाषा द्वारा उत्पन्न एक SP समस्या का एक उदाहरण काफी बड़ा हो जाता है (रैखिक रूप से परिदृश्यों की संख्या में), और इसका मैट्रिक्स उस संरचना को खो देता है जो समस्याओं के इस वर्ग के लिए आंतरिक है, जिसका समाधान समय पर अन्यथा शोषण किया जा सकता है विशिष्ट अपघटन एल्गोरिदम। विशेष रूप से SP के लिए डिज़ाइन की गई मॉडलिंग भाषाओं के एक्सटेंशन दिखाई देने लगे हैं, देखें: | ||
*[[एआईएमएमएस]] - एसपी समस्याओं की परिभाषा का समर्थन करता है | *[[एआईएमएमएस]] - एसपी समस्याओं की परिभाषा का समर्थन करता है | ||
*ईएमपी एसपी ( | *ईएमपी एसपी (प्रसंभाव्य प्रोग्रामिंग के लिए विस्तारित गणितीय प्रोग्रामिंग) - प्रसंभाव्य प्रोग्रामिंग को सुविधाजनक बनाने के लिए जीएएमएस का एक मॉड्यूल बनाया गया है (इसमें पैरामीट्रिक वितरण के लिए कीवर्ड, मौका की कमी और जोखिम के उपाय जैसे जोखिम पर मान और [[अपेक्षित कमी]] शामिल है)। | ||
*[[एएमपीएल|एसएएमपीएल]] - एएमपीएल के एक्सटेंशन का एक सेट विशेष रूप से | *[[एएमपीएल|एसएएमपीएल]] - एएमपीएल के एक्सटेंशन का एक सेट विशेष रूप से प्रसंभाव्य प्रोग्राम व्यक्त करने के लिए डिज़ाइन किया गया है (मौका बाधाओं के लिए सिंटैक्स शामिल है, एकीकृत मौके की कमी और [[मजबूत अनुकूलन]] समस्याएं) | ||
वे दोनों SMPS उदाहरण स्तर प्रारूप उत्पन्न कर सकते हैं, जो सॉल्वर को समस्या की संरचना को गैर-निरर्थक रूप में बताता है। | वे दोनों SMPS उदाहरण स्तर प्रारूप उत्पन्न कर सकते हैं, जो सॉल्वर को समस्या की संरचना को गैर-निरर्थक रूप में बताता है। | ||
Revision as of 13:36, 16 February 2023
गणितीय अनुकूलन के क्षेत्र में, प्रसंभाव्य प्रोग्रामिंग या प्रसंभाव्य प्रोग्रामिंग प्रतिरूपण अनुकूलन समस्याओं के लिए एक ऐसी संरचना है जिसमें अनिश्चितता सम्मिलित है। प्रसंभाव्य प्रोग्राम एक ऐसी अनुकूलन समस्या है जिसमें कुछ या सभी समस्या प्राचल अनिश्चित हैं, लेकिन ज्ञात प्रायिकता वितरणों का अनुसरण करते हैं।[1][2] यह संरचना नियतात्मक अनुकूलन के विपरीत है, जिसमें सभी समस्या प्राचलों को यथार्थ रूप से ज्ञात माना जाता है। प्रसंभाव्य प्रोग्रामिंग का लक्ष्य एक ऐसा निर्णय प्राप्त करना है जो निर्णायक द्वारा चयनित कुछ प्राचलों का अनुकूलन करता है, और समस्या के प्राचलों की अनिश्चितता के लिए उचित रूप से ध्यान देने योग्य है। क्योंकि कई वास्तविक जगत के निर्णयों में अनिश्चितता सम्मिलित है, अतः प्रसंभाव्य प्रोग्रामिंग का अनुप्रयोग वित्त से लेकर परिवहन तक ऊर्जा अनुकूलन के क्षेत्रों की एक विस्तृत श्रृंखला में देखा जाता है।[3][4]
द्वि-चरणीय समस्याएँ
द्वि-चरणीय प्रसंभाव्य प्रोग्रामिंग का मूल विचार यह है कि (इष्टतम) निर्णय, निर्णय लिए जाने के समय उपलब्ध आंकड़ों पर आधारित होने चाहिए और ये निर्णय भविष्य के प्रेक्षणों पर निर्भर नहीं हो सकते हैं। प्रसंभाव्य प्रोग्रामिंग में द्वि-चरणीय सूत्रीकरण का उपयोग व्यापक रूप से किया जाता है। द्वि-चरणीय प्रसंभाव्य प्रोग्रामिंग समस्या का सामान्य सूत्रीकरण निम्न द्वारा दिया जाता है:
ऐसे सूत्रीकरण में, प्रथम-चरण निर्णय चर सदिश है, द्वितीय-चरण निर्णय चर सदिश है, और द्वितीय चरण की समस्या के आँकड़े को समाहित करता है। इस सूत्रीकरण में, प्रथम चरण में हमें अनिश्चित आँकड़े की प्राप्ति से पहले "यहीं और अभी (तत्काल)" निर्णय लेना है, एक यादृच्छिक सदिश के रूप में देखा जाता है। दूसरे चरण में, की प्राप्ति के बाद उपलब्ध हो जाता है, हम उपयुक्त अनुकूलन समस्या को हल करके अपने व्यवहार को अनुकूलित करते हैं।
पहले चरण में हम लागत का अनुकूलन करते हैं (उपर्युक्त फॉर्मूलेशन में न्यूनतम)। प्रथम चरण के निर्णय के साथ साथ (इष्टतम) दूसरे चरण के निर्णय की अपेक्षित लागत। हम दूसरे चरण की समस्या को केवल एक अनुकूलन समस्या के रूप में देख सकते हैं जो अनिश्चित डेटा के प्रकट होने पर हमारे अनुमानित इष्टतम व्यवहार का वर्णन करती है, या हम इसके समाधान को एक सहारा कार्रवाई के रूप में मान सकते हैं जहां शब्द सिस्टम की संभावित असंगति के लिए क्षतिपूर्ति करता है और इस सहारा कार्रवाई की लागत है।
माना जाने वाला द्वि-चरण समस्या रैखिक है क्योंकि उद्देश्य कार्य और बाधाएं रैखिक हैं। संकल्पनात्मक रूप से यह आवश्यक नहीं है और कोई अधिक सामान्य द्वि-चरणीय प्रसंभाव्य कार्यक्रमों पर विचार कर सकता है। उदाहरण के लिए, यदि प्रथम-चरण की समस्या पूर्णांक है, तो कोई प्रथम-चरण की समस्या में अभिन्नता की कमी को जोड़ सकता है ताकि व्यवहार्य सेट असतत हो। जरूरत पड़ने पर गैर-रैखिक उद्देश्यों और बाधाओं को भी शामिल किया जा सकता है।[5]
वितरण धारणा
उपरोक्त द्वि-चरणीय की समस्या का सूत्रीकरण दूसरे चरण के डेटा को मानता है एक 'ज्ञात' संभाव्यता वितरण के साथ एक यादृच्छिक सदिश के रूप में तैयार किया गया है। यह कई स्थितियों में उचित होगा। उदाहरण के लिए, का वितरण ऐतिहासिक डेटा से अनुमान लगाया जा सकता है यदि कोई मानता है कि समय की अवधि में वितरण महत्वपूर्ण रूप से नहीं बदलता है। इसके अलावा, नमूने के अनुभवजन्य वितरण का उपयोग भविष्य के मानों के वितरण के अनुमान के रूप में किया जा सकता है . यदि किसी के पास पूर्व मॉडल है , कोई बायेसियन अपडेट द्वारा पोस्टरियरी वितरण प्राप्त कर सकता है।
विवेक
संख्यात्मक रूप से द्वि-चरणीय की प्रसंभाव्य समस्या को हल करने के लिए, अक्सर यह मानने की आवश्यकता होती है कि यादृच्छिक सदिश संभावित अहसासों की एक सीमित संख्या होती है, जिन्हें परिदृश्य कहा जाता है , संबंधित संभाव्यता द्रव्यमान के साथ . तब प्रथम चरण की समस्या के उद्देश्य समारोह में अपेक्षा को योग के रूप में लिखा जा सकता है:
कब संभावित प्राप्तियों की एक अनंत (या बहुत बड़ी) संख्या है, तो परिदृश्यों द्वारा इस वितरण का प्रतिनिधित्व करने के लिए मानक दृष्टिकोण है। यह दृष्टिकोण तीन प्रश्न उठाता है, अर्थात्:
- परिदृश्यों का निर्माण कैसे करें, देखें § Scenario construction;
- नियतात्मक समतुल्य को कैसे हल करें। सीपीएलईएक्स, और जीएनयू रैखिक प्रोग्रामिंग किट (जीएलपीके) जैसे अनुकूलक बड़ी रैखिक/अरैखिक समस्याओं को हल कर सकते हैं। एनईओएस सर्वर,[6] विस्कॉन्सिन विश्वविद्यालय, मैडिसन में होस्ट किया गया, कई आधुनिक सॉल्वरों तक मुफ्त पहुंच की अनुमति देता है। नियतात्मक समकक्ष की संरचना अपघटन विधियों को लागू करने के लिए विशेष रूप से उत्तरदायी है,[7] जैसे बेंडर्स अपघटन या परिदृश्य अपघटन;
- "सही" इष्टतम के संबंध में प्राप्त समाधान की गुणवत्ता को कैसे मापें।
ये प्रश्न स्वतंत्र नहीं हैं। उदाहरण के लिए, निर्मित परिदृश्यों की संख्या नियतात्मक समतुल्य की सुवाह्यता और प्राप्त समाधानों की गुणवत्ता दोनों को प्रभावित करेगी।
प्रसंभाव्य रैखिक प्रोग्राम
एक प्रसंभाव्य रैखिक प्रोग्राम क्लासिकल टू-स्टेज प्रसंभाव्य प्रोग्राम का एक विशिष्ट उदाहरण है। एक प्रसंभाव्य एलपी मल्टी-पीरियड लीनियर प्रोग्राम (एलपी) के संग्रह से बनाया गया है, जिनमें से प्रत्येक की संरचना समान है लेकिन कुछ अलग डेटा है। एच> दो-अवधि एलपी, प्रतिनिधित्व करते हैं परिदृश्य, निम्नलिखित रूप होने के रूप में माना जा सकता है:
वैक्टर और में प्रथम-अवधि चर होते हैं, जिनके मान तुरंत चुने जाने चाहिए। सदिश में बाद की अवधि के लिए सभी चर शामिल हैं। विवशताएँ में केवल प्रथम-अवधि चर शामिल होते हैं और प्रत्येक परिदृश्य में समान होते हैं। अन्य बाधाओं में बाद की अवधि के चर शामिल हैं और भविष्य के बारे में अनिश्चितता को दर्शाते हुए परिदृश्य से परिदृश्य में कुछ मामलों में भिन्न हैं।
ध्यान दें कि हल करना दो-अवधि एलपी मानने के बराबर है बिना किसी अनिश्चितता के दूसरी अवधि में परिदृश्य। दूसरे चरण में अनिश्चितताओं को शामिल करने के लिए, किसी को अलग-अलग परिदृश्यों के लिए संभावनाओं को आवंटित करना चाहिए और संबंधित नियतात्मक समतुल्य को हल करना चाहिए।
एक प्रसंभाव्य समस्या के नियतात्मक समकक्ष
परिमित संख्या में परिदृश्यों के साथ, द्वि-चरणीय प्रसंभाव्य रैखिक कार्यक्रमों को बड़ी रैखिक प्रोग्रामिंग समस्याओं के रूप में तैयार किया जा सकता है। इस सूत्रीकरण को अक्सर नियतात्मक समतुल्य रैखिक कार्यक्रम कहा जाता है, या नियतात्मक समतुल्य के लिए संक्षिप्त किया जाता है। (सख्ती से एक नियतात्मक समतुल्य बोलना कोई भी गणितीय कार्यक्रम है जिसका उपयोग इष्टतम प्रथम-चरण के निर्णय की गणना करने के लिए किया जा सकता है, इसलिए ये निरंतर संभाव्यता वितरण के लिए भी मौजूद रहेंगे, जब कोई किसी बंद रूप में दूसरे चरण की लागत का प्रतिनिधित्व कर सकता है।) के लिए उदाहरण के लिए, उपरोक्त प्रसंभाव्य रैखिक कार्यक्रम के समतुल्य समतुल्य बनाने के लिए, हम एक प्रायिकता प्रदान करते हैं प्रत्येक परिदृश्य के लिए ।
फिर हम सभी परिदृश्यों से बाधाओं के अधीन उद्देश्य के अपेक्षित मान को कम कर सकते हैं:
हमारे पास एक अलग सदिश है प्रत्येक परिदृश्य के लिए बाद की
हमारे पास एक अलग सदिश है प्रत्येक परिदृश्य के लिए बाद की अवधि के चर । पहली अवधि के चर और हालाँकि, हर परिदृश्य में y समान होते हैं, क्योंकि हमें यह जानने से पहले पहली अवधि के लिए निर्णय लेना चाहिए कि कौन सा परिदृश्य साकार होगा। नतीजतन, बाधाओं को शामिल करना और को केवल एक बार निर्दिष्ट करने की आवश्यकता है, जबकि शेष बाधाओं को प्रत्येक परिदृश्य के लिए अलग से दिया जाना चाहिए।
परिदृश्य निर्माण
व्यवहार में भविष्य पर विशेषज्ञों की राय जानने के द्वारा परिदृश्यों का निर्माण करना संभव हो सकता है। निर्मित परिदृश्यों की संख्या अपेक्षाकृत मामूली होनी चाहिए ताकि प्राप्त नियतात्मक समतुल्य को उचित कम्प्यूटेशनल प्रयास से हल किया जा सके। अक्सर यह दावा किया जाता है कि केवल कुछ परिदृश्यों का उपयोग करने वाला एक समाधान केवल एक परिदृश्य को मानने वाले समाधान की तुलना में अधिक अनुकूलनीय योजनाएं प्रदान करता है। कुछ मामलों में ऐसे दावे को अनुकरण द्वारा सत्यापित किया जा सकता है। सिद्धांत रूप में गारंटी के कुछ उपाय कि एक प्राप्त समाधान मूल समस्या को उचित सटीकता के साथ हल करता है। आम तौर पर अनुप्रयोगों में केवल प्रथम चरण इष्टतम समाधान का एक व्यावहारिक मान है क्योंकि लगभग हमेशा यादृच्छिक डेटा का "सत्य" अहसास निर्मित (उत्पन्न) परिदृश्यों के सेट से अलग होगा।
कल्पना करना में शामिल है स्वतंत्र यादृच्छिक घटक, जिनमें से प्रत्येक में तीन संभावित अहसास हैं (उदाहरण के लिए, प्रत्येक यादृच्छिक मापदंडों की भविष्य की प्राप्ति को निम्न, मध्यम और उच्च के रूप में वर्गीकृत किया गया है), तो परिदृश्यों की कुल संख्या है । परिदृश्यों की संख्या में इस तरह की घातीय वृद्धि उचित आकार के लिए भी विशेषज्ञ की राय का उपयोग करके मॉडल विकास को बहुत कठिन बना देती है । स्थिति और भी खराब हो जाती है अगर कुछ यादृच्छिक घटक का निरंतर वितरण है।
मोंटे कार्लो नमूनाकरण और नमूना औसत सन्निकटन (SAA) विधि
एक प्रबंधनीय आकार के लिए निर्धारित परिदृश्य को कम करने के लिए एक सामान्य दृष्टिकोण मोंटे कार्लो सिमुलेशन का उपयोग करना है। मान लीजिए परिदृश्यों की कुल संख्या बहुत बड़ी या अनंत है। आगे मान लीजिए कि हम एक नमूना उत्पन्न कर सकते हैं का यादृच्छिक सदिश की प्रतिकृति . आमतौर पर नमूने को स्वतंत्र और समान रूप से वितरित (i.i.d नमूना) माना जाता है। एक नमूना दिया गया है, अपेक्षा फलन नमूना औसत द्वारा अनुमानित है
और फलस्वरूप प्रथम चरण की समस्या द्वारा दी गई है
इस सूत्रीकरण को नमूना औसत सन्निकटन विधि के रूप में जाना जाता है। SAA समस्या माने गए नमूने का एक कार्य है और इस अर्थ में यादृच्छिक है। दिए गए नमूने के लिए SAA समस्या परिदृश्यों के साथ द्वि-चरणीय प्रसंभाव्य रैखिक प्रोग्रामिंग समस्या के समान रूप की है ., , प्रत्येक को समान संभावना के साथ लिया गया .
सांख्यिकीय निष्कर्ष
निम्नलिखित प्रसंभाव्य प्रोग्रामिंग समस्या पर विचार करें
यहाँ का एक गैर-रिक्त बंद उपसमुच्चय है , एक यादृच्छिक सदिश है जिसका संभाव्यता वितरण एक सेट पर समर्थित है , और . टू-स्टेज प्रसंभाव्य प्रोग्रामिंग के ढांचे में, संबंधित दूसरे चरण की समस्या के इष्टतम मान द्वारा दिया गया है।
ये मान लीजिए सभी के लिए अच्छी तरह से परिभाषित और परिमित मानवान है . इसका तात्पर्य है कि प्रत्येक के लिए मान लगभग निश्चित है।
मान लीजिए कि हमारे पास एक नमूना है का यादृच्छिक सदिश की प्राप्ति . इस यादृच्छिक नमूने को ऐतिहासिक डेटा के रूप में देखा जा सकता है के अवलोकन , या इसे मोंटे कार्लो सैंपलिंग तकनीकों द्वारा उत्पन्न किया जा सकता है। तब हम एक संगत नमूना औसत सन्निकटन तैयार कर सकते हैं
बड़ी संख्या के कानून के अनुसार हमारे पास कुछ नियमितता शर्तों के तहत है प्रायिकता 1 से बिंदुवार अभिसरित होता है जैसा . इसके अलावा, हल्के अतिरिक्त परिस्थितियों में अभिसरण एक समान है। हमारे पास भी है , अर्थात।, का निष्पक्ष आकलनकर्ता है . इसलिए, यह उम्मीद करना स्वाभाविक है कि SAA समस्या का इष्टतम मान और इष्टतम समाधान वास्तविक समस्या के अपने समकक्षों के साथ अभिसरण करते हैं क्योंकि .
एसएए अनुमानकों की संगति
संभव सेट मान लीजिए SAA समस्या का समाधान निश्चित है, अर्थात यह नमूने से स्वतंत्र है। होने देना और वास्तविक समस्या का क्रमशः इष्टतम मान और इष्टतम समाधान का सेट हो और चलो और SAA समस्या का क्रमशः इष्टतम मान और इष्टतम समाधान का सेट हो।
- होने देना और (नियतात्मक) वास्तविक मानवान कार्यों का एक क्रम हो। निम्नलिखित दो गुण समतुल्य हैं:
- किसी के लिए और कोई अनुक्रम में अभिसरण यह इस प्रकार है कि में विलीन हो जाता है
- कार्यक्रम निरंतर चालू है और में विलीन हो जाता है के किसी भी कॉम्पैक्ट सबसेट पर समान रूप से
- यदि SAA समस्या का उद्देश्य वास्तविक समस्या के उद्देश्य में परिवर्तित हो जाता है संभाव्यता 1 के साथ, जैसा , समान रूप से व्यवहार्य सेट पर . तब में विलीन हो जाता है प्रायिकता 1 के रूप में .
- मान लीजिए कि एक कॉम्पैक्ट सेट मौजूद है ऐसा है कि
- सेट वास्तविक समस्या का इष्टतम समाधान रिक्त नहीं है और इसमें निहित है
- कार्यक्रम परिमित मानवान और निरंतर है
- कार्यों का क्रम में विलीन हो जाता है संभाव्यता 1 के साथ, जैसा , समान रूप से
- के लिए काफी बड़ा सेट खाली नहीं है और संभाव्यता 1 के साथ
- तब और प्रायिकता 1 के रूप में . ध्यान दें कि सेट के विचलन को दर्शाता है सेट से , के रूप में परिभाषित
कुछ स्थितियों में व्यवहार्य सेट SAA समस्या का अनुमान लगाया जाता है, तो संबंधित SAA समस्या का रूप ले लेती है
जहाँ का उपसमुच्चय है नमूने के आधार पर और इसलिए यादृच्छिक है। फिर भी, SAA आकलनकर्ताओं के लिए निरंतरता परिणाम अभी भी कुछ अतिरिक्त धारणाओं के तहत प्राप्त किए जा सकते हैं:
- मान लीजिए कि एक कॉम्पैक्ट सेट मौजूद है ऐसा है कि
- सेट वास्तविक समस्या का इष्टतम समाधान रिक्त नहीं है और इसमें निहित है
- कार्यक्रम परिमित मानवान और निरंतर है
- कार्यों का क्रम में विलीन हो जाता है संभाव्यता 1 के साथ, जैसा , समान रूप से
- के लिए काफी बड़ा सेट खाली नहीं है और संभाव्यता 1 के साथ
- अगर और प्रायिकता 1 के साथ एक बिंदु पर अभिसरित होता है , तब
- कुछ बिंदु के लिए एक क्रम होता है ऐसा है कि संभाव्यता 1 के साथ।
- तब और प्रायिकता 1 के रूप में .
एसएए इष्टतम मान के स्पर्शोन्मुख
मान लीजिए नमूना आई.आई.डी. और एक बिंदु तय करें . फिर नमूना औसत अनुमानक , का , निष्पक्ष है और इसमें विचरण है , जहाँ परिमित माना जाता है। इसके अलावा, केंद्रीय सीमा प्रमेय द्वारा हमारे पास वह है
जहाँ वितरण में अभिसरण को दर्शाता है और माध्य के साथ एक सामान्य वितरण है और विचरण , के रूप में लिखा गया है .
दूसरे शब्दों में, विषम रूप से सामान्य वितरण है, यानी, बड़े के लिए , माध्य के साथ लगभग सामान्य वितरण है और विचरण . यह निम्नलिखित (अनुमानित) की ओर जाता है के लिए % विश्वास अंतराल :
जहाँ (यहाँ मानक सामान्य वितरण के सीडीएफ को दर्शाता है) और
का नमूना प्रसरण अनुमान है . यानी के आकलन में त्रुटि आदेश का (संकीर्ण रूप से) है .
अनुप्रयोग और उदाहरण
जैविक अनुप्रयोग
व्यावहारिक पारिस्थितिकी जैसे क्षेत्रों में जानवरों के व्यवहार को मॉडल करने के लिए अक्सर प्रसंभाव्य गतिशील प्रोग्रामिंग का उपयोग किया जाता है।[8][9] इष्टतम फोर्जिंग के मॉडल के अनुभवजन्य परीक्षण, जैविक जीवन चक्र संक्रमण जैसे कि पक्षियों में भागना और परजीवी ततैया में अंडे देना व्यवहारिक निर्णय लेने के विकास की व्याख्या करने में इस मॉडलिंग तकनीक के मान को दर्शाता है। ये मॉडल आम तौर पर दो चरणों के बजाय कई चरणों वाले होते हैं।
आर्थिक अनुप्रयोग
अनिश्चितता के तहत निर्णय लेने को समझने में प्रसंभाव्य डायनेमिक प्रोग्रामिंग एक उपयोगी उपकरण है। अनिश्चितता के तहत पूंजीगत स्टॉक का संचय एक उदाहरण है; अक्सर इसका उपयोग संसाधन अर्थशास्त्रियों द्वारा जैव आर्थिक समस्याओं का विश्लेषण करने के लिए किया जाता है[10] जहां मौसम, आदि में अनिश्चितता प्रवेश करती है।
उदाहरण: मल्टीस्टेज पोर्टफोलियो अनुकूलन
निम्नलिखित मल्टी-स्टेज प्रसंभाव्य प्रोग्रामिंग के वित्त से एक उदाहरण है। मान लीजिए कि समय पर हमारे पास प्रारंभिक पूंजी है में निवेश करना संपत्तियां। आगे मान लीजिए कि हमें समय-समय पर अपने पोर्टफोलियो को पुनर्संतुलित करने की अनुमति है लेकिन इसमें अतिरिक्त नकदी डाले बिना। प्रत्येक अवधि में हम वर्तमान धन के पुनर्वितरण के बारे में निर्णय लेते हैं बिच में संपत्तियां। होने देना एन संपत्ति में निवेश की गई प्रारंभिक राशि हो। हम चाहते हैं कि प्रत्येक अऋणात्मक है और वह संतुलन समीकरण है धारण करना चाहिए।
कुल रिटर्न पर विचार करें प्रत्येक अवधि के लिए . यह एक सदिश-मानवान यादृच्छिक प्रक्रिया बनाता है . समय अवधि में , हम राशियों को निर्दिष्ट करके पोर्टफोलियो को पुनर्संतुलित कर सकते हैं संबंधित संपत्तियों में निवेश किया। उस समय पहली अवधि में रिटर्न का एहसास हो गया है, इसलिए इस जानकारी का उपयोग पुनर्संतुलन निर्णय में करना उचित है। इस प्रकार, दूसरे चरण के फैसले, समय पर , वास्तव में यादृच्छिक सदिश की प्राप्ति के कार्य हैं , अर्थात।, . इसी तरह, समय पर निर्णय एक कार्य है द्वारा उपलब्ध कराई गई जानकारी के अनुसार समय-समय पर यादृच्छिक प्रक्रिया का इतिहास . कार्यों का एक क्रम , , साथ स्थिर होने के नाते, निर्णय प्रक्रिया की कार्यान्वयन योग्य नीति को परिभाषित करता है। ऐसा कहा जाता है कि ऐसी नीति संभव है यदि यह संभावना 1 के साथ मॉडल की कमी को पूरा करती है, यानी गैर-नकारात्मकता की कमी , , , और धन की कमी का संतुलन,
जहां अवधि में धन द्वारा दिया गया है
जो यादृच्छिक प्रक्रिया की प्राप्ति और समय तक के निर्णयों पर निर्भर करता है .
मान लीजिए कि उद्देश्य अंतिम अवधि में इस धन की अपेक्षित उपयोगिता को अधिकतम करना है, अर्थात समस्या पर विचार करना
यह एक मल्टीस्टेज प्रसंभाव्य प्रोग्रामिंग समस्या है, जहाँ से चरणों को क्रमांकित किया जाता है से । अनुकूलन सभी कार्यान्वयन योग्य और व्यवहार्य नीतियों पर किया जाता है। समस्या के विवरण को पूरा करने के लिए किसी को भी यादृच्छिक प्रक्रिया के संभाव्यता वितरण को परिभाषित करने की आवश्यकता होती है । यह विभिन्न तरीकों से किया जा सकता है। उदाहरण के लिए, प्रक्रिया के समय के विकास को परिभाषित करने वाला एक विशेष परिदृश्य वृक्ष का निर्माण कर सकता है। यदि प्रत्येक स्तर पर प्रत्येक परिसंपत्ति के यादृच्छिक रिटर्न को दो निरंतरताओं की अनुमति दी जाती है, अन्य संपत्तियों से स्वतंत्र, तो परिदृश्यों की कुल संख्या है ।}
गतिशील प्रोग्रामिंग समीकरण लिखने के लिए, उपरोक्त मल्टीस्टेज समस्या को समय में पिछड़ने पर विचार करें। अंतिम चरण में , एक अहसास यादृच्छिक प्रक्रिया ज्ञात है और चुना गया है। इसलिए, निम्नलिखित समस्या को हल करने की आवश्यकता है
जहाँ की सशर्त अपेक्षा को दर्शाता है दिया गया . उपरोक्त समस्या का इष्टतम मान इस पर निर्भर करता है और और निरूपित किया जाता है .
इसी तरह, चरणों में , समस्या का समाधान करना चाहिए
जिसका इष्टतम मान द्वारा निरूपित किया जाता है . अंत में, मंच पर , एक समस्या हल करता है
चरणवार स्वतंत्र यादृच्छिक प्रक्रिया
प्रक्रिया के सामान्य वितरण के लिए , इन गतिशील प्रोग्रामिंग समीकरणों को हल करना कठिन हो सकता है। यदि प्रक्रिया नाटकीय रूप से सरल हो जाती है चरणवार स्वतंत्र है, अर्थात, से स्वतंत्र है के लिए . इस मामले में, संबंधित सशर्त अपेक्षाएं बिना शर्त अपेक्षाएं और कार्य बन जाती हैं , पर निर्भर नहीं है . वह है, समस्या का इष्टतम मान है
और का इष्टतम मान है
के लिए .
सॉफ्टवेयर उपकरण
मॉडलिंग भाषाएं
सभी असतत प्रसंभाव्य प्रोग्रामिंग समस्याओं को किसी भी बीजगणितीय मॉडलिंग भाषा के साथ प्रदर्शित किया जा सकता है, मैन्युअल रूप से स्पष्ट या निहित गैर-प्रत्याशाकता को लागू करने के लिए यह सुनिश्चित करने के लिए कि परिणामी मॉडल प्रत्येक चरण में उपलब्ध कराई गई जानकारी की संरचना का सम्मान करता है। एक सामान्य मॉडलिंग भाषा द्वारा उत्पन्न एक SP समस्या का एक उदाहरण काफी बड़ा हो जाता है (रैखिक रूप से परिदृश्यों की संख्या में), और इसका मैट्रिक्स उस संरचना को खो देता है जो समस्याओं के इस वर्ग के लिए आंतरिक है, जिसका समाधान समय पर अन्यथा शोषण किया जा सकता है विशिष्ट अपघटन एल्गोरिदम। विशेष रूप से SP के लिए डिज़ाइन की गई मॉडलिंग भाषाओं के एक्सटेंशन दिखाई देने लगे हैं, देखें:
- एआईएमएमएस - एसपी समस्याओं की परिभाषा का समर्थन करता है
- ईएमपी एसपी (प्रसंभाव्य प्रोग्रामिंग के लिए विस्तारित गणितीय प्रोग्रामिंग) - प्रसंभाव्य प्रोग्रामिंग को सुविधाजनक बनाने के लिए जीएएमएस का एक मॉड्यूल बनाया गया है (इसमें पैरामीट्रिक वितरण के लिए कीवर्ड, मौका की कमी और जोखिम के उपाय जैसे जोखिम पर मान और अपेक्षित कमी शामिल है)।
- एसएएमपीएल - एएमपीएल के एक्सटेंशन का एक सेट विशेष रूप से प्रसंभाव्य प्रोग्राम व्यक्त करने के लिए डिज़ाइन किया गया है (मौका बाधाओं के लिए सिंटैक्स शामिल है, एकीकृत मौके की कमी और मजबूत अनुकूलन समस्याएं)
वे दोनों SMPS उदाहरण स्तर प्रारूप उत्पन्न कर सकते हैं, जो सॉल्वर को समस्या की संरचना को गैर-निरर्थक रूप में बताता है।
यह भी देखें
- सहसंबंध अंतराल
- प्रसंभाव्य प्रोग्रामिंग के लिए विस्तारित गणितीय प्रोग्रामिंग (ईएमपी)
- जोखिम में एंट्रोपिक मान
- फोर्टएसपी
- एसएएमपीएल बीजगणितीय मॉडलिंग भाषा
- परिदृश्य अनुकूलन
- प्रसंभाव्य अनुकूलन
- अवसर-व्यवरोधित पोर्टफोलियो चयन
संदर्भ
- ↑ Shapiro, Alexander; Dentcheva, Darinka; Ruszczyński, Andrzej (2009). Lectures on stochastic programming: Modeling and theory (PDF). MPS/SIAM Series on Optimization. Vol. 9. Philadelphia, PA: Society for Industrial and Applied Mathematics (SIAM). Mathematical Programming Society (MPS). pp. xvi+436. ISBN 978-0-89871-687-0. MR 2562798.
- ↑ Birge, John R.; Louveaux, François (2011). Introduction to Stochastic Programming. Springer Series in Operations Research and Financial Engineering (in British English). doi:10.1007/978-1-4614-0237-4. ISBN 978-1-4614-0236-7. ISSN 1431-8598.
- ↑ Stein W. Wallace and William T. Ziemba (eds.). Applications of Stochastic Programming. MPS-SIAM Book Series on Optimization 5, 2005.
- ↑ Applications of stochastic programming are described at the following website, Stochastic Programming Community.
- ↑ Shapiro, Alexander; Philpott, Andy. A tutorial on Stochastic Programming (PDF).
- ↑ "NEOS Server for Optimization".
- ↑ Ruszczyński, Andrzej; Shapiro, Alexander (2003). Stochastic Programming. Handbooks in Operations Research and Management Science. Vol. 10. Philadelphia: Elsevier. p. 700. ISBN 978-0444508546.
- ↑ Mangel, M. & Clark, C. W. 1988. Dynamic modeling in behavioral ecology. Princeton University Press ISBN 0-691-08506-4
- ↑ Houston, A. I & McNamara, J. M. 1999. Models of adaptive behaviour: an approach based on state. Cambridge University Press ISBN 0-521-65539-0
- ↑ Howitt, R., Msangi, S., Reynaud, A and K. Knapp. 2002. "Using Polynomial Approximations to Solve Stochastic Dynamic Programming Problems: or A "Betty Crocker " Approach to SDP." University of California, Davis, Department of Agricultural and Resource Economics Working Paper.
अग्रिम पठन
- John R. Birge and François V. Louveaux. Introduction to Stochastic Programming. Springer Verlag, New York, 1997.
- Kall, Peter; Wallace, Stein W. (1994). Stochastic programming. Wiley-Interscience Series in Systems and Optimization. Chichester: John Wiley & Sons, Ltd. pp. xii+307. ISBN 0-471-95158-7. MR 1315300.
- G. Ch. Pflug: Optimization of Stochastic Models. The Interface between Simulation and Optimization. Kluwer, Dordrecht, 1996.
- András Prékopa. Stochastic Programming. Kluwer Academic Publishers, Dordrecht, 1995.
- Andrzej Ruszczynski and Alexander Shapiro (eds.) (2003) Stochastic Programming. Handbooks in Operations Research and Management Science, Vol. 10, Elsevier.
- Shapiro, Alexander; Dentcheva, Darinka; Ruszczyński, Andrzej (2009). Lectures on stochastic programming: Modeling and theory (PDF). MPS/SIAM Series on Optimization. Vol. 9. Philadelphia, PA: Society for Industrial and Applied Mathematics (SIAM). Mathematical Programming Society (MPS). pp. xvi+436. ISBN 978-0-89871-687-0. MR 2562798.
- Stein W. Wallace and William T. Ziemba (eds.) (2005) Applications of Stochastic Programming. MPS-SIAM Book Series on Optimization 5
- King, Alan J.; Wallace, Stein W. (2012). Modeling with Stochastic Programming. Springer Series in Operations Research and Financial Engineering. New York: Springer. ISBN 978-0-387-87816-4.