स्टोकेस्टिक प्रोग्रामिंग: Difference between revisions

From Vigyanwiki
Line 188: Line 188:


=== जैविक अनुप्रयोग ===
=== जैविक अनुप्रयोग ===
व्यावहारिक पारिस्थितिकी जैसे क्षेत्रों में जानवरों के व्यवहार को मॉडल करने के लिए प्रायः [[स्टोचैस्टिक गतिशील प्रोग्रामिंग|प्रसंभाव्य गतिशील प्रोग्रामिंग]] का उपयोग किया जाता है।<ref>Mangel, M. & Clark, C. W. 1988. ''Dynamic modeling in behavioral ecology.'' Princeton University Press {{ISBN|0-691-08506-4}}</ref><ref>Houston, A. I & McNamara, J. M. 1999. ''Models of adaptive behaviour: an approach based on state''. Cambridge University Press {{ISBN|0-521-65539-0}}</ref> [[इष्टतम फोर्जिंग सिद्धांत|इष्टतम फोर्जिंग]] के मॉडल के अनुभवजन्य परीक्षण, [[जैविक जीवन चक्र]] संक्रमण जैसे कि पक्षियों में [[कलियाना|भागना]] और [[परजीवी]] ततैया में अंडे देना व्यवहारिक निर्णय लेने के विकास की व्याख्या करने में इस मॉडलिंग तकनीक के मान को दर्शाता है। ये मॉडल आम तौर पर दो चरणों के बजाय कई चरणों वाले होते हैं।
व्यावहारिक पारिस्थितिकी जैसे क्षेत्रों में पशुओं के व्यवहार को प्रतिरूपित करने के लिए प्रायः [[स्टोचैस्टिक गतिशील प्रोग्रामिंग|प्रसंभाव्य गतिशील प्रोग्रामिंग]] का उपयोग किया जाता है।<ref>Mangel, M. & Clark, C. W. 1988. ''Dynamic modeling in behavioral ecology.'' Princeton University Press {{ISBN|0-691-08506-4}}</ref><ref>Houston, A. I & McNamara, J. M. 1999. ''Models of adaptive behaviour: an approach based on state''. Cambridge University Press {{ISBN|0-521-65539-0}}</ref> [[इष्टतम फोर्जिंग सिद्धांत|इष्टतम फोरेजिंग (चारे की तलाश)]], पक्षियों में [[कलियाना|उड़ने]] और [[परजीवी]] ततैयों में अंडे देने जैसे [[जैविक जीवन चक्र]] संक्रमणों के आनुभविक परीक्षण व्यवहारिक निर्णय लेने के विकास की व्याख्या करने में इस मॉडलिंग तकनीक के महत्व को दर्शाते हैं। ये मॉडल सामान्यतः दो चरणों के स्थान कई चरणों वाले होते हैं।


=== आर्थिक अनुप्रयोग ===
=== आर्थिक अनुप्रयोग ===
अनिश्चितता के तहत निर्णय लेने को समझने में प्रसंभाव्य डायनेमिक प्रोग्रामिंग एक उपयोगी उपकरण है। अनिश्चितता के तहत पूंजीगत स्टॉक का संचय एक उदाहरण है; प्रायः इसका उपयोग संसाधन अर्थशास्त्रियों द्वारा जैव आर्थिक समस्याओं का विश्लेषण करने के लिए किया जाता है<ref>Howitt, R., Msangi, S., Reynaud, A and K. Knapp. 2002. [http://www.agecon.ucdavis.edu/aredepart/facultydocs/Howitt/Polyapprox3a.pdf "Using Polynomial Approximations to Solve Stochastic Dynamic Programming Problems: or A "Betty Crocker " Approach to SDP."]  University of California, Davis, Department of Agricultural and Resource Economics Working Paper.</ref> जहां मौसम, आदि में अनिश्चितता प्रवेश करती है।
प्रसंभाव्य गतिमान प्रोग्रामिंग, अनिश्चितता के तहत निर्णय लेने की समझ में एक उपयोगी उपकरण है। अनिश्चितता के तहत पूँजीगत भण्डार का संचय इसका एक उदाहरण है; इसका उपयोग प्रायः संसाधन अर्थशास्त्रियों द्वारा जैव आर्थिक समस्याओं का विश्लेषण करने के लिए किया जाता है<ref>Howitt, R., Msangi, S., Reynaud, A and K. Knapp. 2002. [http://www.agecon.ucdavis.edu/aredepart/facultydocs/Howitt/Polyapprox3a.pdf "Using Polynomial Approximations to Solve Stochastic Dynamic Programming Problems: or A "Betty Crocker " Approach to SDP."]  University of California, Davis, Department of Agricultural and Resource Economics Working Paper.</ref> जहाँ मौसम आदि में अनिश्चितता प्रवेश करती है।


=== उदाहरण: मल्टीस्टेज पोर्टफोलियो अनुकूलन ===
=== उदाहरण: बहुचरणीय पोर्टफोलियो अनुकूलन ===
{{Main|अंतर्कालिक पोर्टफोलियो चयन}}
{{Main|अंतर्कालिक पोर्टफोलियो चयन}}
{{See also|मर्टन की पोर्टफोलियो समस्या}}
{{See also|मर्टन की पोर्टफोलियो समस्या}}


निम्नलिखित मल्टी-स्टेज प्रसंभाव्य प्रोग्रामिंग के वित्त से एक उदाहरण है।
निम्न उदाहरण बहु-चरणीय प्रसंभाव्य प्रोग्रामिंग के वित्त से एक निम्न उदाहरण है। माना समय <math>t=0</math> पर, <math>n</math> संपत्तियों पर निवेश करने के लिए हमारे पास प्रारंभिक पूँजी <math>W_0</math> है। आगे माना कि हमें समय <math>t=1,\dots,T-1</math> पर अपने पोर्टफोलियो को अतिरिक्त नकदी डाले बिना पुनर्संतुलित करने की अनुमति है। प्रत्येक अवधि <math>t</math> में हम वर्तमान धन <math>W_t</math> के <math>n</math> संपत्तियों में पुनर्वितरण के बारे में निर्णय लेते हैं। माना <math>x_0=(x_{10},\dots,x_{n0})</math>, n संपत्तियों में निवेश की गई प्रारंभिक राशि है। हमें आवश्यकता है कि प्रत्येक <math>x_{i0}</math> गैर-ऋणात्मक हो और संतुलन समीकरण <math>\sum_{i=1}^{n}x_{i0}=W_0</math> सत्य होना चाहिए।
मान लीजिए कि समय पर <math>t=0</math> हमारे पास प्रारंभिक पूंजी है <math>W_0</math> में निवेश करना <math>n</math> संपत्तियां। आगे मान लीजिए कि हमें समय-समय पर अपने पोर्टफोलियो को पुनर्संतुलित करने की अनुमति है <math>t=1,\dots,T-1</math> लेकिन इसमें अतिरिक्त नकदी डाले बिना। प्रत्येक अवधि में <math>t</math> हम वर्तमान धन के पुनर्वितरण के बारे में निर्णय लेते हैं <math>W_t</math> बिच में <math>n</math> संपत्तियां। होने देना <math>x_0=(x_{10},\dots,x_{n0})</math> एन संपत्ति में निवेश की गई प्रारंभिक राशि हो। हम चाहते हैं कि प्रत्येक <math>x_{i0}</math> अऋणात्मक है और वह संतुलन समीकरण है <math>\sum_{i=1}^{n}x_{i0}=W_0</math> धारण करना चाहिए।


कुल रिटर्न पर विचार करें <math>\xi_t=(\xi_{1t},\dots,\xi_{nt})</math> प्रत्येक अवधि के लिए <math>t=1,\dots,T</math>. यह एक सदिश-मानवान यादृच्छिक प्रक्रिया बनाता है <math>\xi_1,\dots,\xi_T</math>. समय अवधि में <math>t=1</math>, हम राशियों को निर्दिष्ट करके पोर्टफोलियो को पुनर्संतुलित कर सकते हैं <math>x_1=(x_{11},\dots,x_{n1})</math> संबंधित संपत्तियों में निवेश किया। उस समय पहली अवधि में रिटर्न का एहसास हो गया है, इसलिए इस जानकारी का उपयोग पुनर्संतुलन निर्णय में करना उचित है। इस प्रकार, दूसरे चरण के फैसले, समय पर <math>t=1</math>, वास्तव में यादृच्छिक सदिश की प्राप्ति के कार्य हैं <math>\xi_1</math>, अर्थात।, <math>x_1=x_1(\xi_1)</math>. इसी तरह, समय पर <math>t</math> निर्णय <math>x_t=(x_{1t},\dots,x_{nt})</math> एक कार्य है <math>x_t=x_t(\xi_{[t]})</math> द्वारा उपलब्ध कराई गई जानकारी के अनुसार <math>\xi_{[t]}=(\xi_{1},\dots,\xi_{t})</math> समय-समय पर यादृच्छिक प्रक्रिया का इतिहास <math>t</math>. कार्यों का एक क्रम <math>x_t=x_t(\xi_{[t]})</math>, <math>t=0,\dots,T-1</math>, साथ <math>x_0</math> स्थिर होने के नाते, निर्णय प्रक्रिया की कार्यान्वयन योग्य नीति को परिभाषित करता है। ऐसा कहा जाता है कि ऐसी नीति संभव है यदि यह संभावना 1 के साथ मॉडल की कमी को पूरा करती है, यानी गैर-नकारात्मकता की कमी <math>x_{it}(\xi_{[t]})\geq 0</math>, <math>i=1,\dots,n</math>, <math>t=0,\dots,T-1</math>, और धन की कमी का संतुलन,
प्रत्येक अवधि <math>t=1,\dots,T</math> के लिएक, ुल प्रतिफल <math>\xi_t=(\xi_{1t},\dots,\xi_{nt})</math> पर विचार करें। यह एक सदिश-मान यादृच्छिक प्रक्रिया <math>\xi_1,\dots,\xi_T</math> का निर्माण करता है। समयावधि <math>t=1</math> में, हम संगत संपत्तियों में निविष्ट राशियों <math>x_1=(x_{11},\dots,x_{n1})</math> को निर्दिष्ट करके पोर्टफोलियो को पुनर्संतुलित कर सकते हैं। उस समय पहली अवधि में प्रतिफल की प्राप्ति हो गयी है, इसलिए इस जानकारी का उपयोग पुनर्संतुलन निर्णय में करना उचित है। इस प्रकार, मय <math>t=1</math> पर द्वितीय चरण के निर्णय,वास्तव में यादृच्छिक सदिश <math>\xi_1</math> की प्राप्ति के फलन हैं, अर्थात्, <math>x_1=x_1(\xi_1)</math>इसी प्रकार, समय <math>t</math> पर निर्णय <math>x_t=(x_{1t},\dots,x_{nt})</math>, <math>x_t=x_t(\xi_{[t]})</math>, समय <math>t</math> तक यादृच्छिक प्रक्रिया के इतिहास <math>\xi_{[t]}=(\xi_{1},\dots,\xi_{t})</math> द्वारा दी गयी उपलब्ध जानकारी का एक फलन है। फलनों <math>x_t=x_t(\xi_{[t]})</math>, <math>t=0,\dots,T-1</math> का एक अनुक्रम, जिसमें <math>x_0</math> स्थिर है, निर्णय प्रक्रिया की ''कार्यान्वयन योग्य नीति'' को परिभाषित करता है। ऐसा कहा जाता है कि ऐसी नीति ''सुसंगत'' होती है यदि यह प्रायिकता 1 वाले मॉडल के व्यवरोधों, अर्थात् गैर-ऋणात्मकता व्यवरोध <math>x_{it}(\xi_{[t]})\geq 0</math>, <math>i=1,\dots,n</math>, <math>t=0,\dots,T-1</math>, को संतुष्ट करती है, और धन व्यवरोधों का संतुलन निम्न है,


:<math>
:<math>
\sum_{i=1}^{n}x_{it}(\xi_{[t]}) = W_t,
\sum_{i=1}^{n}x_{it}(\xi_{[t]}) = W_t,
</math>
</math>
जहां अवधि में <math>t=1,\dots,T</math> धन <math>W_t</math> द्वारा दिया गया है
जहाँ अवधि <math>t=1,\dots,T</math> में धन <math>W_t</math> निम्न द्वारा दिया गया है


:<math>
:<math>
W_t = \sum_{i=1}^{n}\xi_{it} x_{i,t-1}(\xi_{[t-1]}),
W_t = \sum_{i=1}^{n}\xi_{it} x_{i,t-1}(\xi_{[t-1]}),
</math>
</math>
जो यादृच्छिक प्रक्रिया की प्राप्ति और समय तक के निर्णयों पर निर्भर करता है <math>t</math>.
जो यादृच्छिक प्रक्रिया की प्राप्ति और समय <math>t</math> तक के निर्णयों पर निर्भर करता है।


मान लीजिए कि उद्देश्य अंतिम अवधि में इस धन की अपेक्षित उपयोगिता को अधिकतम करना है, अर्थात समस्या पर विचार करना
माना इसका उद्देश्य अंतिम अवधि में इस धन की प्रत्याशित उपयोगिता को अधिकतम करना है, अर्थात् निम्न समस्या पर विचार करने पर


:<math>
:<math>
\max E[U(W_T)].
\max E[U(W_T)].
</math>
</math>
यह एक मल्टीस्टेज प्रसंभाव्य प्रोग्रामिंग समस्या है, जहाँ से चरणों को क्रमांकित किया जाता है <math>t=0</math> से <math>t=T-1</math>अनुकूलन सभी कार्यान्वयन योग्य और सुसंगत नीतियों पर किया जाता है। समस्या के विवरण को पूरा करने के लिए किसी को भी यादृच्छिक प्रक्रिया के प्रायिकता वितरण को परिभाषित करने की आवश्यकता होती है <math>\xi_1,\dots,\xi_T</math>यह विभिन्न तरीकों से किया जा सकता है। उदाहरण के लिए, प्रक्रिया के समय के विकास को परिभाषित करने वाला एक विशेष परिदृश्य वृक्ष का निर्माण कर सकता है। यदि प्रत्येक स्तर पर प्रत्येक परिसंपत्ति के यादृच्छिक रिटर्न को दो निरंतरताओं की अनुमति दी जाती है, अन्य संपत्तियों से स्वतंत्र, तो परिदृश्यों की कुल संख्या है <math>2^{nT}.</math>}  
यह एक बहुचरणीय प्रसंभाव्य प्रोग्रामिंग समस्या है, जहाँ चरणों को <math>t=0</math> से <math>t=T-1</math> तक क्रमांकित किया जाता है। अनुकूलन सभी कार्यान्वयन योग्य और सुसंगत नीतियों पर किया जाता है। समस्या के विवरण को पूरा करने के लिए यादृच्छिक प्रक्रिया के प्रायिकता बंटन <math>\xi_1,\dots,\xi_T</math> को परिभाषित करने की आवश्यकता होती है। यह विभिन्न विधियों से किया जा सकता है। उदाहरण के लिए, प्रक्रिया के समय के विकास को परिभाषित करने वाले एक विशेष परिदृश्य वृक्ष का निर्माण किया जा सकता है। यदि प्रत्येक स्तर पर प्रत्येक परिसंपत्ति के यादृच्छिक प्रतिफल को अन्य संपत्तियों से स्वतंत्र दो सततताओं की अनुमति दी जाती है, तो परिदृश्यों की कुल संख्या <math>2^{nT}.</math> होती है।}  


[[गतिशील प्रोग्रामिंग]] समीकरण लिखने के लिए, उपरोक्त मल्टीस्टेज समस्या को समय में पिछड़ने पर विचार करें। अंतिम चरण में <math>t=T-1</math>, एक अहसास <math>\xi_{[T-1]}=(\xi_{1},\dots,\xi_{T-1})</math> यादृच्छिक प्रक्रिया ज्ञात है और <math>x_{T-2}</math> चुना गया है। इसलिए, निम्नलिखित समस्या को हल करने की आवश्यकता है
[[गतिशील प्रोग्रामिंग]] समीकरणों को लिखने के लिए, उपरोक्त बहुचरणीय समस्या के पश्च समय पर विचार करें। अंतिम चरण <math>t=T-1</math> में, यादृच्छिक प्रक्रिया का एक प्रतिफल <math>\xi_{[T-1]}=(\xi_{1},\dots,\xi_{T-1})</math> ज्ञात है और <math>x_{T-2}</math> का चयन किया गया है। इसलिए, निम्नलिखित समस्या को हल करने की आवश्यकता होती है


:<math>
:<math>
Line 229: Line 228:
\end{array}
\end{array}
</math>
</math>
जहाँ <math>E[U(W_T)|\xi_{[T-1]}]</math> की सशर्त अपेक्षा को दर्शाता है <math>U(W_T)</math> दिया गया <math>\xi_{[T-1]}</math>. उपरोक्त समस्या का इष्टतम मान इस पर निर्भर करता है <math>W_{T-1}</math> और <math>\xi_{[T-1]}</math> और निरूपित किया जाता है <math>Q_{T-1}(W_{T-1},\xi_{[T-1]})</math>.
जहाँ <math>E[U(W_T)|\xi_{[T-1]}]</math> दिये गये <math>\xi_{[T-1]}</math> <math>U(W_T)</math> की सप्रतिबन्ध प्रत्याशा को दर्शाता है। उपरोक्त समस्या का इष्टतम मान <math>W_{T-1}</math> और <math>\xi_{[T-1]}</math> पर निर्भर करता है और <math>Q_{T-1}(W_{T-1},\xi_{[T-1]})</math> द्वारा निरूपित किया जाता है।


इसी तरह, चरणों में <math>t=T-2,\dots,1</math>, समस्या का समाधान करना चाहिए
इसी प्रकार, चरणों <math>t=T-2,\dots,1</math> में, निम्न समस्या को हल किया जाना चाहिए,


:<math>
:<math>
Line 241: Line 240:
\end{array}
\end{array}
</math>
</math>
जिसका इष्टतम मान द्वारा निरूपित किया जाता है <math>Q_{t}(W_{t},\xi_{[t]})</math>. अंत में, मंच पर <math>t=0</math>, एक समस्या हल करता है
जिसका इष्टतम मान <math>Q_{t}(W_{t},\xi_{[t]})</math> द्वारा निरूपित किया जाता है। अंततः, चरण <math>t=0</math> पर, निम्न समस्या हल की जाती है


:<math>
:<math>
Line 254: Line 253:
==== चरणवार स्वतंत्र यादृच्छिक प्रक्रिया ====
==== चरणवार स्वतंत्र यादृच्छिक प्रक्रिया ====


प्रक्रिया के सामान्य वितरण के लिए <math>\xi_t</math>, इन गतिशील प्रोग्रामिंग समीकरणों को हल करना कठिन हो सकता है। यदि प्रक्रिया नाटकीय रूप से सरल हो जाती है <math>\xi_t</math> चरणवार स्वतंत्र है, अर्थात, <math>\xi_t</math> से स्वतंत्र है <math>\xi_1,\dots,\xi_{t-1}</math> के लिए <math>t=2,\dots,T</math>. इस मामले में, संबंधित सशर्त अपेक्षाएं बिना शर्त अपेक्षाएं और कार्य बन जाती हैं <math>Q_t(W_t)</math>, <math>t=1,\dots,T-1</math> पर निर्भर नहीं है <math>\xi_{[t]}</math>. वह है, <math>Q_{T-1}(W_{T-1})</math> समस्या का इष्टतम मान है
प्रक्रिया <math>\xi_t</math> के सामान्य बंटन के लिए, इन गतिशील प्रोग्रामिंग समीकरणों को हल करना जटिल हो सकता है। यह स्थिति प्रभावशाली रूप से सरल हो जाती है, यदि प्रक्रिया <math>\xi_t</math> चरणवार स्वतंत्र है, अर्थात्, <math>\xi_t</math>, <math>t=2,\dots,T</math> के लिए <math>\xi_1,\dots,\xi_{t-1}</math> से स्वतंत्र है। इस स्थिति में, संगत सप्रतिबन्ध प्रत्याशाएँ, अप्रतिबंध प्रत्याशाएँ बन जाती हैं, और फलन <math>Q_t(W_t)</math>, <math>t=1,\dots,T-1</math>, <math>\xi_{[t]}</math> पर निर्भर नहीं करता है। अर्थात्, <math>Q_{T-1}(W_{T-1})</math>, समस्या का इष्टतम मान है


:<math>
:<math>
Line 264: Line 263:
\end{array}
\end{array}
</math>
</math>
और <math>Q_t(W_t)</math> का इष्टतम मान है
और <math>Q_t(W_t)</math>, <math>t=T-2,\dots,1</math> के लिए निम्न का इष्टतम मान है


:<math>
:<math>
Line 274: Line 273:
\end{array}
\end{array}
</math>
</math>
के लिए <math>t=T-2,\dots,1</math>.
== सॉफ्टवेयर उपकरण ==
== सॉफ्टवेयर उपकरण ==


===मॉडलिंग भाषाएं===
===मॉडलिंग भाषाएँ===
सभी असतत प्रसंभाव्य प्रोग्रामिंग समस्याओं को किसी भी [[बीजगणितीय मॉडलिंग भाषा]] के साथ प्रदर्शित किया जा सकता है, मैन्युअल रूप से स्पष्ट या निहित गैर-प्रत्याशाकता को लागू करने के लिए यह सुनिश्चित करने के लिए कि परिणामी मॉडल प्रत्येक चरण में उपलब्ध कराई गई जानकारी की संरचना का सम्मान करता है। एक सामान्य मॉडलिंग भाषा द्वारा उत्पन्न एक SP समस्या का एक उदाहरण काफी बड़ा हो जाता है (रैखिक रूप से परिदृश्यों की संख्या में), और इसका मैट्रिक्स उस संरचना को खो देता है जो समस्याओं के इस वर्ग के लिए आंतरिक है, जिसका समाधान समय पर अन्यथा शोषण किया जा सकता है विशिष्ट अपघटन एल्गोरिदम। विशेष रूप से SP के लिए डिज़ाइन की गई मॉडलिंग भाषाओं के एक्सटेंशन दिखाई देने लगे हैं, देखें:
सभी असतत प्रसंभाव्य प्रोग्रामिंग समस्याओं को किसी भी [[बीजगणितीय मॉडलिंग भाषा]] के साथ हस्तचालित रूप से स्पष्ट या निहित गैर-प्रत्याशात्मकता को लागू करने के लिए प्रदर्शित किया जा सकता है जिससे यह सुनिश्चित किया जा सके कि परिणामी मॉडल प्रत्येक चरण में उपलब्ध कराई गई जानकारी की संरचना की उपेक्षा नहीं करता है। किसी सामान्य मॉडलिंग भाषा द्वारा उत्पन्न एसपी समस्या का एक उदाहरण काफी बड़ा (रैखिक रूप से परिदृश्यों की संख्या में) हो जाता है, और इसका आव्यूह उस संरचना को खो देता है जो समस्याओं के इस वर्ग के लिए मौलिक है, जिसका लाभ अन्यथा विशिष्ट अपघटन एल्गोरिदम द्वारा हल समय पर लिया जा सकता है। विशेष रूप से एसपी के लिए संरचित की गई मॉडलिंग भाषाओं के विस्तार दिखाई देने लगे हैं, देखें:
*[[एआईएमएमएस]] - एसपी समस्याओं की परिभाषा का समर्थन करता है
*[[एआईएमएमएस]] - एसपी समस्याओं की परिभाषा का समर्थन करती है
*ईएमपी एसपी (प्रसंभाव्य प्रोग्रामिंग के लिए विस्तारित गणितीय प्रोग्रामिंग) - प्रसंभाव्य प्रोग्रामिंग को सुविधाजनक बनाने के लिए जीएएमएस का एक मॉड्यूल बनाया गया है (इसमें पैरामीट्रिक वितरण के लिए कीवर्ड, मौका की कमी और जोखिम के उपाय जैसे जोखिम पर मान और [[अपेक्षित कमी]] शामिल है)।
*ईएमपी एसपी (प्रसंभाव्य प्रोग्रामिंग के लिए विस्तारित गणितीय प्रोग्रामिंग) - प्रसंभाव्य प्रोग्रामिंग को सुविधाजनक बनाने के लिए जीएएमएस का एक मॉड्यूल बनाया गया है (इसमें प्राचल बंटन के लिए संकेत शब्द, अवसर व्यवरोध और जोखिम पर मान एवं [[अपेक्षित कमी|प्रत्याशित कमी]] जैसी जोखिम की माप सम्मिलित हैं)।
*[[एएमपीएल|एसएएमपीएल]] - एएमपीएल के एक्सटेंशन का एक समुच्चय विशेष रूप से प्रसंभाव्य प्रोग्राम व्यक्त करने के लिए डिज़ाइन किया गया है (मौका व्यवरोधों के लिए सिंटैक्स शामिल है, एकीकृत मौके की कमी और [[मजबूत अनुकूलन]] समस्याएं)
*[[एएमपीएल|एसएएमपीएल]] - एएमपीएल के विस्तार का एक समुच्चय विशेष रूप से प्रसंभाव्य प्रोग्राम को व्यक्त करने के लिए संरचित किया गया है ( इसमें अवसर व्यवरोधों के लिए सिंटैक्स, एकीकृत अवसर व्यवरोध और [[मजबूत अनुकूलन|दृढ़ अनुकूलन]] समस्याएँ सम्मिलित हैं)
वे दोनों SMPS उदाहरण स्तर प्रारूप उत्पन्न कर सकते हैं, जो सॉल्वर को समस्या की संरचना को गैर-निरर्थक रूप में बताता है।
ये दोनों एसएमपीएस उदाहरण तत्क्षण स्तर प्रारूप उत्पन्न कर सकते हैं, जो गैर-निरर्थक रूप में समस्या की संरचना को हलकर्ताओं तक पहुँचाता है।


== यह भी देखें ==
== यह भी देखें ==

Revision as of 16:36, 17 February 2023

गणितीय अनुकूलन के क्षेत्र में, प्रसंभाव्य प्रोग्रामिंग या प्रसंभाव्य प्रोग्रामिंग प्रतिरूपण अनुकूलन समस्याओं के लिए एक ऐसी संरचना है जिसमें अनिश्चितता सम्मिलित है। प्रसंभाव्य प्रोग्राम एक ऐसी अनुकूलन समस्या है जिसमें कुछ या सभी समस्या प्राचल अनिश्चित हैं, लेकिन ज्ञात प्रायिकता वितरणों का अनुसरण करते हैं।[1][2] यह संरचना निर्धारणात्मक अनुकूलन के विपरीत है, जिसमें सभी समस्या प्राचलों को यथार्थ रूप से ज्ञात माना जाता है। प्रसंभाव्य प्रोग्रामिंग का लक्ष्य एक ऐसा निर्णय प्राप्त करना है जो निर्णायक द्वारा चयनित कुछ प्राचलों का अनुकूलन करता है, और समस्या के प्राचलों की अनिश्चितता के लिए उचित रूप से ध्यान देने योग्य है। क्योंकि कई वास्तविक जगत के निर्णयों में अनिश्चितता सम्मिलित है, अतः प्रसंभाव्य प्रोग्रामिंग का अनुप्रयोग वित्त से लेकर परिवहन तक ऊर्जा अनुकूलन के क्षेत्रों की एक विस्तृत श्रृंखला में देखा जाता है।[3][4]

द्वि-चरणीय समस्याएँ

द्वि-चरणीय प्रसंभाव्य प्रोग्रामिंग का मूल विचार यह है कि (इष्टतम) निर्णय, निर्णय लिए जाने के समय उपलब्ध आंकड़ों पर आधारित होने चाहिए और ये निर्णय भविष्य के प्रेक्षणों पर निर्भर नहीं हो सकते हैं। प्रसंभाव्य प्रोग्रामिंग में द्वि-चरणीय सूत्रीकरण का उपयोग व्यापक रूप से किया जाता है। द्वि-चरणीय प्रसंभाव्य प्रोग्रामिंग समस्या का सामान्य सूत्रीकरण निम्न द्वारा दिया जाता है:

जहाँ द्वितीय-चरण की समस्या का इष्टतम मान है
चिरसम्मत द्वि-चरणीय रैखिक प्रसंभाव्य प्रोग्रामिंग समस्याओं को निम्न रूप में सूत्रित किया जा सकता है
जहाँ द्वितीय-चरण की समस्या का इष्टतम मान है


ऐसे सूत्रीकरण में, प्रथम-चरण निर्णय चर सदिश है, द्वितीय-चरण निर्णय चर सदिश है, और द्वितीय चरण की समस्या के आँकड़े को समाहित करता है। इस सूत्रीकरण में, प्रथम चरण में हमें अनिश्चित आँकड़े (इसे एक यादृच्छिक सदिश के रूप में देखा जाता है) की प्राप्ति से पहले "यहीं और अभी (तत्काल)" निर्णय लेना होता है। द्वितीय चरण में, की प्राप्ति के उपलब्ध होने के बाद, हम उपयुक्त अनुकूलन समस्या को हल करके अपने व्यवहार को अनुकूलित करते हैं।

प्रथम चरण में हम प्रथम चरण के निर्णय की लागत के साथ-साथ (इष्टतम) द्वितीय चरण के निर्णय की अपेक्षित लागत का अनुकूलन (उपर्युक्त सूत्रीकरण में न्यूनीकृत) करते हैं। हम द्वितीय चरण की समस्या को केवल एक ऐसी अनुकूलन समस्या के रूप में देख सकते हैं जो अनिश्चित आंकड़ों के प्रकट होने पर हमारे अनुमानित इष्टतम व्यवहार का वर्णन करती है, या हम इसके हल को एक ऐसी आश्रय क्रिया के रूप में मान सकते हैं जहाँ शब्द निकाय की संभावित असंगति की क्षतिपूर्ति करता है और इस आश्रय क्रिया की लागत है।

विचार की गयी द्वि-चरणीय समस्या रैखिक है क्योंकि उद्देश्य फलन और व्यवरोध रैखिक हैं। संकल्पनात्मक रूप से यह आवश्यक नहीं है और अधिक सामान्य द्वि-चरणीय प्रसंभाव्य प्रोग्रामों पर विचार किया जा सकता है। उदाहरण के लिए, यदि प्रथम-चरण की समस्या पूर्णांक है, तो प्रथम-चरण की समस्या में समाकलनीय व्यवरोधों को इस प्रकार जोड़ा जा सकता है कि सुसंगत समुच्चय असतत हो जाये। आवश्यकतानुसार अरैखिक उद्देश्यों और व्यवरोधों को भी सम्मिलित किया जा सकता है।[5]

बंटनात्मक कल्पना

उपरोक्त द्वि-चरणीय समस्या का सूत्रीकरण यह मानता है कि द्वितीय-चरण के डेटा को ज्ञात प्रायिकता वितरण वाले एक यादृच्छिक सदिश के रूप में प्रतिरूपित किया गया है। यह कई स्थितियों में उचित होता है। उदाहरण के लिए, के बंटन को ऐतिहासिक आँकड़े से अनुमानित किया जा सकता है यदि मान जाता है कि वितरण किसी समयावधि में प्रभावशाली रूप से परिवर्तित नहीं होता है। इसके अतिरिक्त, प्रतिदर्श के प्रयोगसिद्ध बंटन का उपयोग के अग्रिम मानों के बंटन के सन्निकटन के रूप में किया जा सकता है। यदि का पूर्व मॉडल उपलब्ध है, तो बेज़ के अपडेट द्वारा पश्चवर्ती बंटन प्राप्त किया जा सकता है।

असततीकरण

द्वि-चरणीय की प्रसंभाव्य समस्या को संख्यात्मक रूप से हल करने के लिए, प्रायः यह मानने की आवश्यकता होती है कि यादृच्छिक सदिश में परिदृश्य नामक संभावित प्राप्तियों की संख्या सीमित है, माना ये हैं, जिनके संगत प्रायिकता द्रव्यमान हैं। तब प्रथम चरण की समस्या के उद्देश्य फलन में प्रत्याशा को निम्न योग के रूप में लिखा जा सकता है:

और इसके अतिरिक्त, द्वि-चरणीय समस्या को एक बड़ी रैखिक प्रोग्रामन समस्या के रूप में सूत्रित किया जा सकता है (इसे मूल समस्या का निर्धारणात्मक समतुल्य कहा जाता है, § § यादृच्छिक समस्या का निर्धारक समतुल्य अनुभाग देखें)।

जब में संभावित प्राप्तियों की संख्या अपरिमित (या बहुत बड़ी) है, तो इस बंटन का निरूपण परिदृश्यों द्वारा करने के लिए मानक दृष्टिकोण है। यह दृष्टिकोण तीन प्रश्न उठाता है, अर्थात्:

  1. परिदृश्यों का निर्माण कैसे करें, देखें § परिदृश्य निर्माण;
  2. निर्धारणात्मक समतुल्य को कैसे हल करें। सीपीएलईएक्स, और जीएनयू रैखिक प्रोग्रामिंग किट (जीएलपीके) जैसे अनुकूलक बड़ी रैखिक/अरैखिक समस्याओं को हल कर सकते हैं। विस्कॉन्सिन विश्वविद्यालय, मैडिसन में आयोजित एनईओएस सर्वर[6] कई आधुनिक हलकर्ताओं तक मुफ्त पहुँच की अनुमति प्रदान करता है। निर्धारणात्मक समतुल्य की संरचना बेंडर्स अपघटन या परिदृश्य अपघटन जैसी अपघटन विधियों को लागू करने के लिए विशेष रूप से उत्तरदायी है,[7]
  3. "सही" इष्टतम के सापेक्ष प्राप्त हल की गुणवत्ता को कैसे मापें।

ये प्रश्न स्वतंत्र नहीं हैं। उदाहरण के लिए, निर्मित परिदृश्यों की संख्या निर्धारणात्मक समतुल्य की वश्यता और प्राप्त हलों की गुणवत्ता दोनों को प्रभावित करती है।

प्रसंभाव्य रैखिक प्रोग्राम

प्रसंभाव्य रैखिक प्रोग्राम चिरसम्मत द्वि-चरणीय प्रसंभाव्य प्रोग्राम का एक विशिष्ट उदाहरण है। एक प्रसंभाव्य एलपी, बहु-आवधिक रैखिक प्रोग्रामों (एलपी) के संग्रह से बनाई गयी है, जिनमें से प्रत्येक की संरचना समान लेकिन आँकड़े कुछ अलग हैं। परिदृश्य को निरूपित करने वाली द्वि-आवधिक एलपी को निम्नलिखित रूप में माना जा सकता है:

सदिश और में प्रथम-आवधिक चर होते हैं, जिनके मानों का चयन तत्काल किया जाना चाहिए। सदिश अनुक्रमिक अवधियों के लिए सभी चरों को समाहित करता है। व्यवरोध केवल प्रथम-आवधिक चरों को सम्मिलित करता है और ये प्रत्येक परिदृश्य में समान होते हैं। अन्य व्यवरोधों में बाद की अवधियों के चर सम्मिलित हैं और अग्रिम अनिश्चितता को दर्शाते हुए परिदृश्य से परिदृश्य में कुछ स्थितियों में भिन्न हैं।

ध्यान दें कि द्वि-आवधिक एलपी को हल करना, बिना किसी अनिश्चितता के द्वितीय अवधि में परिदृश्य को मानने के बराबर है। द्वितीय चरण में अनिश्चितताओं को समाविष्ट करने के लिए, भिन्न परिदृश्यों के लिए प्रायिकताओं को आवंटित करना चाहिए और संगत निर्धारणात्मक समतुल्य को हल करना चाहिए।

प्रसंभाव्य समस्या के निर्धारणात्मक समकक्ष

परिदृश्यों की परिमित संख्या के साथ, द्वि-चरणीय प्रसंभाव्य रैखिक प्रोग्रामों को बड़ी रैखिक प्रोग्रामन समस्याओं के रूप में प्रतिरूपित किया जा सकता है। इस सूत्रीकरण को प्रायः निर्धारणात्मक समतुल्य रैखिक प्रोग्राम या संक्षिप्त रूप में निर्धारणात्मक समतुल्य कहा जाता है। (निष्पक्ष रूप से कहने पर, निर्धारणात्मक समतुल्य एक ऐसा गणितीय प्रोग्राम है जिसका उपयोग इष्टतम प्रथम-चरण के निर्णय की गणना करने के लिए किया जा सकता है, इसलिए ये तब भी सतत प्रायिकता बंटन के लिए अस्तित्व में होते हैं, जब द्वितीय चरण की लागत का निरूपण समान संवृत रूप में किया जा सकता है।) उदाहरण के लिए, उपरोक्त प्रसंभाव्य रैखिक प्रोग्राम के समतुल्य के निर्माण के लिए, हम प्रत्येक परिदृश्य के लिए एक प्रायिकता आवंटित करते हैं।

फिर हम सभी परिदृश्यों से व्यवरोधों के अधीन उद्देश्य के प्रत्याशित मान को न्यूनतम कर सकते हैं:

हमारे पास प्रत्येक परिदृश्य के लिए, आनुक्रमिक अवधियों के चरों का एक अलग सदिश है। प्रथम आवधिक चर और प्रत्येक परिदृश्य में समान होते हैं, हालाँकि, क्योंकि हमें यह जानने से पहले प्रथम अवधि के लिए निर्णय लेना चाहिए कि कौन सा परिदृश्य प्राप्त होगा। परिणामस्वरूप, केवल और को सम्मिलित करने वाले व्यवरोधों को केवल एक बार निर्दिष्ट करने की आवश्यकता होती है, जबकि शेष व्यवरोधों को प्रत्येक परिदृश्य के लिए एकल रूप से निर्दिष्ट किया जाना चाहिए।

परिदृश्य निर्माण

व्यवहार में भविष्य पर विशेषज्ञों का मत जानकर परिदृश्यों का निर्माण करना संभव हो सकता है। निर्मित परिदृश्यों की संख्या अपेक्षाकृत साधारण होनी चाहिए जिससे प्राप्त निर्धारणात्मक समतुल्य को उचित संगणनीय प्रयास से हल किया जा सके। प्रायः यह दावा किया जाता है कि केवल कुछ परिदृश्यों का उपयोग करने वाला एक हल केवल एक परिदृश्य को मानने वाले हल की तुलना में अधिक अनुकूलनीय योजनाएँ प्रदान करता है। कुछ स्थितियों में ऐसे दावे को अनुकरण द्वारा सत्यापित किया जा सकता है। सिद्धांत रूप में आश्वासन के कुछ प्रमाप उपलब्ध हैं, जिससे एक प्राप्त हल मूल समस्या को उचित यथार्थता के साथ हल करता है। सामान्यतः अनुप्रयोगों में केवल प्रथम चरण इष्टतम हल का एक व्यावहारिक मान है क्योंकि लगभग सदैव यादृच्छिक आँकड़ों का "सत्य" प्रतिफलन निर्मित (उत्पन्न) परिदृश्यों के समुच्चय से अलग होता है।

माना में स्वतंत्र यादृच्छिक घटक सम्मिलित हैं, जिनमें से प्रत्येक में तीन संभावित प्रतिफल हैं (उदाहरण के लिए, प्रत्येक यादृच्छिक प्राचलों के भविष्य के प्रतिफलों को निम्न, मध्यम और उच्च के रूप में वर्गीकृत किया गया है), तो परिदृश्यों की कुल संख्या है। परिदृश्यों की संख्या में इस प्रकार की घातीय वृद्धि उचित आकार के लिए भी विशेषज्ञ के मत का उपयोग करके मॉडल के विकास को अत्यधिक जटिल बना देती है। यह स्थिति और भी खराब हो जाती है यदि के कुछ यादृच्छिक घटकों में सतत बंटन हैं।

मोंटे कार्लो प्रतिचयन और प्रतिदर्श औसत सन्निकटन (एसएए) विधि

मोंटे कार्लो अनुकरण का उपयोग, एक प्रबंधनीय आकार के लिए निर्धारित परिदृश्य को कम करने के लिए एक सामान्य दृष्टिकोण है। माना परिदृश्यों की कुल संख्या अत्यधिक या अपरिमित है। आगे माना कि हम यादृच्छिक सदिश की प्रतिकृतियों का एक प्रतिदर्श उत्पन्न कर सकते हैं। सामान्यतः प्रतिदर्श को स्वतंत्र और समान रूप से वितरित (आई.आई.डी प्रतिदर्श) माना जाता है। दिए गए एक प्रतिदर्श के लिए, प्रत्याशा फलन को निम्न प्रतिदर्श औसत द्वारा सन्निकटित किया जाता है

और फलस्वरूप प्रथम चरण की समस्या निम्न द्वारा दी गई है

इस सूत्रीकरण को प्रतिदर्श औसत सन्निकटन विधि के रूप में जाना जाता है। एसएए समस्या माने गए प्रतिदर्श का एक फलन है और इस अर्थ में यादृच्छिक है। दिए गए प्रतिदर्श के लिए, एसएए समस्या परिदृश्यों ., वाली द्वि-चरणीय प्रसंभाव्य रैखिक प्रोग्रामन समस्या के समान रूप की है, जिनमें से प्रत्येक को समान प्रायिकता के साथ लिया गया है।

सांख्यिकीय निष्कर्ष

निम्नलिखित प्रसंभाव्य प्रोग्रामन समस्या पर विचार करें

यहाँ , का एक अरिक्त संवृत उपसमुच्चय है, एक यादृच्छिक सदिश है जिसका प्रायिकता बंटन एक समुच्चय , और पर समर्थित है। द्वि-चरणीय प्रसंभाव्य प्रोग्रामन की संरचना में, को संगत द्वितीय-चरणीय समस्या के इष्टतम मान द्वारा दिया गया है।

माना सभी के लिए सुपरिभाषित और परिमित मान फलन है। इसका तात्पर्य है कि प्रत्येक के लिए मान लगभग निश्चित है।

माना हमारे पास यादृच्छिक सदिश के प्रतिफलनों का एक प्रतिदर्श है। इस यादृच्छिक प्रतिदर्श को के प्रेक्षणों को ऐतिहासिक आँकड़े के रूप में देखा जा सकता है, या इसे मोंटे कार्लो प्रतिरूपण तकनीकों द्वारा उत्पन्न किया जा सकता है। तब हम एक संगत प्रतिदर्श औसत सन्निकटन सूत्रित कर सकते हैं

वृहत संख्या सिद्धांत के अनुसार हमें ज्ञात है कि, , कुछ नियमितता शर्तों के तहत प्रायिकता 1 के साथ तक बिंदुवार अभिसरित होता है, क्योंकि ।इसके अतिरिक्त, मंद अतिरिक्त परिस्थितियों में अभिसरण एक समान है। हमारे पास भी है, अर्थात्, , का एक अनभिनत आंकलक है। इसलिए, यह आशा करना स्वाभाविक है कि एसएए समस्या का इष्टतम मान और इष्टतम हल वास्तविक समस्या के अपने समतुल्यों के साथ अभिसरण करते हैं क्योंकि

एसएए आंकलकों की संगतता

माना एसएए समस्या का सुसंगत समुच्चय नियत है, अर्थात् यह प्रतिदर्श से स्वतंत्र है। माना और , क्रमशः वास्तविक समस्या के इष्टतम मान और इष्टतम हलों का समुच्चय है और माना और , क्रमशः एसएए समस्या के इष्टतम मान और इष्टतम हलों का समुच्चय है।

  1. माना और (निर्धारणात्मक) वास्तविक मान फलनों का एक अनुक्रम है। निम्नलिखित दो गुण समतुल्य हैं:
    • किसी और में अभिसरित किसी अनुक्रम के लिए, यह इस प्रकार है कि , में अभिसरित होता है
    • फलन , पर सतत है और , के किसी सघन उपसमुच्चय पर पर समान रूप से अभिसरित होता है
  2. यदि एसएए समस्या का उद्देश्य , सुसंगत समुच्चय पर समान रूप से प्रायिकता 1 वाली वास्तविक समस्या के उद्देश्य में अभिसरित होता है, क्योंकि । तब , प्रायिकता 1 वाले में अभिसरित होता है, क्योंकि
  3. माना एक ऐसे सघन समुच्चय का अस्तित्व है कि
    • वास्तविक समस्या के इष्टतम हलों का समुच्चय अरिक्त है और में निहित है
    • परिमित मान फलन है और पर सतत है
    • फलनों का अनुक्रम , में समान रूप से प्रायिकता 1 के साथ में अभिसरित होता है, क्योंकि
    • के लिए काफी बड़ा समुच्चय अरिक्त है और प्रायिकता 1 के साथ
तब प्रायिकता 1 के साथ और क्योंकि । ध्यान दें कि , समुच्चय के समुच्चय से विचलन को दर्शाता है, जो इस प्रकार परिभाषित है

कुछ स्थितियों में एसएए समस्या के सुसंगत समुच्चय का इष्टतमीकरण किया गया है, तो संगत एसएए समस्या निम्न रूप ग्रहण करती है

जहाँ , प्रतिदर्श के आधार पर का उपसमुच्चय है और इसलिए यादृच्छिक है। फिर भी, एसएए आंकलकों के लिए निसंगतता परिणाम, अभी भी कुछ अतिरिक्त धारणाओं के तहत प्राप्त किए जा सकते हैं:

  1. माना एक ऐसे सघन समुच्चय का अस्तित्व है कि
    • वास्तविक समस्या के इष्टतम हलों का समुच्चय अरिक्त है और में निहित है
    • परिमित मान फलन है और पर सतत है
    • फलनों का अनुक्रम , में समान रूप से प्रायिकता 1 के साथ में अभिसरित होता है, क्योंकि
    • के लिए काफी बड़ा समुच्चय अरिक्त है और प्रायिकता 1 के साथ
    • यदि और प्रायिकता 1 के साथ एक बिंदु पर अभिसरित होता है, तब
    • कुछ बिंदुओं के लिए, एक ऐसे अनुक्रम का अस्तित्व है कि प्रायिकता 1 के साथ
तब प्रायिकता 1 के साथ और , क्योंकि

एसएए इष्टतम मान के उपगमन

माना प्रतिदर्श आई.आई.डी. है और एक बिंदु को नियत करता है। फिर का प्रतिदर्श औसत आंकलक , अनभिनत है और इसका विचरण है, जहाँ परिमित माना जाता है। इसके अतिरिक्त, केंद्रीय सीमा प्रमेय द्वारा हमारे पास निम्न है

जहाँ बंटन में अभिसरण को दर्शाता है और में माध्य और विचरण वाला एक अभिलम्ब बंटन है, जिसे के रूप में लिखा गया है।

दूसरे शब्दों में, उपगामी अभिलम्ब बंटन है, अर्थात्, बड़े के लिए, में माध्य और विचरण वाला लगभग अभिलम्ब बंटन है। यह के लिए निम्न (अनुमानित)  % विश्वास्यता अंतराल की ओर जाता है:

जहाँ (यहाँ मानक अभिलम्ब वितरण के सीडीएफ को दर्शाता है) और

का प्रतिदर्श प्रसरण आंकलन है। अर्थात् के आंकलन की त्रुटि (प्रसंभाव्य रूप से) कोटि की है।

अनुप्रयोग और उदाहरण

जैविक अनुप्रयोग

व्यावहारिक पारिस्थितिकी जैसे क्षेत्रों में पशुओं के व्यवहार को प्रतिरूपित करने के लिए प्रायः प्रसंभाव्य गतिशील प्रोग्रामिंग का उपयोग किया जाता है।[8][9] इष्टतम फोरेजिंग (चारे की तलाश), पक्षियों में उड़ने और परजीवी ततैयों में अंडे देने जैसे जैविक जीवन चक्र संक्रमणों के आनुभविक परीक्षण व्यवहारिक निर्णय लेने के विकास की व्याख्या करने में इस मॉडलिंग तकनीक के महत्व को दर्शाते हैं। ये मॉडल सामान्यतः दो चरणों के स्थान कई चरणों वाले होते हैं।

आर्थिक अनुप्रयोग

प्रसंभाव्य गतिमान प्रोग्रामिंग, अनिश्चितता के तहत निर्णय लेने की समझ में एक उपयोगी उपकरण है। अनिश्चितता के तहत पूँजीगत भण्डार का संचय इसका एक उदाहरण है; इसका उपयोग प्रायः संसाधन अर्थशास्त्रियों द्वारा जैव आर्थिक समस्याओं का विश्लेषण करने के लिए किया जाता है[10] जहाँ मौसम आदि में अनिश्चितता प्रवेश करती है।

उदाहरण: बहुचरणीय पोर्टफोलियो अनुकूलन

निम्न उदाहरण बहु-चरणीय प्रसंभाव्य प्रोग्रामिंग के वित्त से एक निम्न उदाहरण है। माना समय पर, संपत्तियों पर निवेश करने के लिए हमारे पास प्रारंभिक पूँजी है। आगे माना कि हमें समय पर अपने पोर्टफोलियो को अतिरिक्त नकदी डाले बिना पुनर्संतुलित करने की अनुमति है। प्रत्येक अवधि में हम वर्तमान धन के संपत्तियों में पुनर्वितरण के बारे में निर्णय लेते हैं। माना , n संपत्तियों में निवेश की गई प्रारंभिक राशि है। हमें आवश्यकता है कि प्रत्येक गैर-ऋणात्मक हो और संतुलन समीकरण सत्य होना चाहिए।

प्रत्येक अवधि के लिएक, ुल प्रतिफल पर विचार करें। यह एक सदिश-मान यादृच्छिक प्रक्रिया का निर्माण करता है। समयावधि में, हम संगत संपत्तियों में निविष्ट राशियों को निर्दिष्ट करके पोर्टफोलियो को पुनर्संतुलित कर सकते हैं। उस समय पहली अवधि में प्रतिफल की प्राप्ति हो गयी है, इसलिए इस जानकारी का उपयोग पुनर्संतुलन निर्णय में करना उचित है। इस प्रकार, मय पर द्वितीय चरण के निर्णय,वास्तव में यादृच्छिक सदिश की प्राप्ति के फलन हैं, अर्थात्, । इसी प्रकार, समय पर निर्णय , , समय तक यादृच्छिक प्रक्रिया के इतिहास द्वारा दी गयी उपलब्ध जानकारी का एक फलन है। फलनों , का एक अनुक्रम, जिसमें स्थिर है, निर्णय प्रक्रिया की कार्यान्वयन योग्य नीति को परिभाषित करता है। ऐसा कहा जाता है कि ऐसी नीति सुसंगत होती है यदि यह प्रायिकता 1 वाले मॉडल के व्यवरोधों, अर्थात् गैर-ऋणात्मकता व्यवरोध , , , को संतुष्ट करती है, और धन व्यवरोधों का संतुलन निम्न है,

जहाँ अवधि में धन निम्न द्वारा दिया गया है

जो यादृच्छिक प्रक्रिया की प्राप्ति और समय तक के निर्णयों पर निर्भर करता है।

माना इसका उद्देश्य अंतिम अवधि में इस धन की प्रत्याशित उपयोगिता को अधिकतम करना है, अर्थात् निम्न समस्या पर विचार करने पर

यह एक बहुचरणीय प्रसंभाव्य प्रोग्रामिंग समस्या है, जहाँ चरणों को से तक क्रमांकित किया जाता है। अनुकूलन सभी कार्यान्वयन योग्य और सुसंगत नीतियों पर किया जाता है। समस्या के विवरण को पूरा करने के लिए यादृच्छिक प्रक्रिया के प्रायिकता बंटन को परिभाषित करने की आवश्यकता होती है। यह विभिन्न विधियों से किया जा सकता है। उदाहरण के लिए, प्रक्रिया के समय के विकास को परिभाषित करने वाले एक विशेष परिदृश्य वृक्ष का निर्माण किया जा सकता है। यदि प्रत्येक स्तर पर प्रत्येक परिसंपत्ति के यादृच्छिक प्रतिफल को अन्य संपत्तियों से स्वतंत्र दो सततताओं की अनुमति दी जाती है, तो परिदृश्यों की कुल संख्या होती है।}

गतिशील प्रोग्रामिंग समीकरणों को लिखने के लिए, उपरोक्त बहुचरणीय समस्या के पश्च समय पर विचार करें। अंतिम चरण में, यादृच्छिक प्रक्रिया का एक प्रतिफल ज्ञात है और का चयन किया गया है। इसलिए, निम्नलिखित समस्या को हल करने की आवश्यकता होती है

जहाँ दिये गये की सप्रतिबन्ध प्रत्याशा को दर्शाता है। उपरोक्त समस्या का इष्टतम मान और पर निर्भर करता है और द्वारा निरूपित किया जाता है।

इसी प्रकार, चरणों में, निम्न समस्या को हल किया जाना चाहिए,

जिसका इष्टतम मान द्वारा निरूपित किया जाता है। अंततः, चरण पर, निम्न समस्या हल की जाती है

चरणवार स्वतंत्र यादृच्छिक प्रक्रिया

प्रक्रिया के सामान्य बंटन के लिए, इन गतिशील प्रोग्रामिंग समीकरणों को हल करना जटिल हो सकता है। यह स्थिति प्रभावशाली रूप से सरल हो जाती है, यदि प्रक्रिया चरणवार स्वतंत्र है, अर्थात्, , के लिए से स्वतंत्र है। इस स्थिति में, संगत सप्रतिबन्ध प्रत्याशाएँ, अप्रतिबंध प्रत्याशाएँ बन जाती हैं, और फलन , , पर निर्भर नहीं करता है। अर्थात्, , समस्या का इष्टतम मान है

और , के लिए निम्न का इष्टतम मान है

सॉफ्टवेयर उपकरण

मॉडलिंग भाषाएँ

सभी असतत प्रसंभाव्य प्रोग्रामिंग समस्याओं को किसी भी बीजगणितीय मॉडलिंग भाषा के साथ हस्तचालित रूप से स्पष्ट या निहित गैर-प्रत्याशात्मकता को लागू करने के लिए प्रदर्शित किया जा सकता है जिससे यह सुनिश्चित किया जा सके कि परिणामी मॉडल प्रत्येक चरण में उपलब्ध कराई गई जानकारी की संरचना की उपेक्षा नहीं करता है। किसी सामान्य मॉडलिंग भाषा द्वारा उत्पन्न एसपी समस्या का एक उदाहरण काफी बड़ा (रैखिक रूप से परिदृश्यों की संख्या में) हो जाता है, और इसका आव्यूह उस संरचना को खो देता है जो समस्याओं के इस वर्ग के लिए मौलिक है, जिसका लाभ अन्यथा विशिष्ट अपघटन एल्गोरिदम द्वारा हल समय पर लिया जा सकता है। विशेष रूप से एसपी के लिए संरचित की गई मॉडलिंग भाषाओं के विस्तार दिखाई देने लगे हैं, देखें:

  • एआईएमएमएस - एसपी समस्याओं की परिभाषा का समर्थन करती है
  • ईएमपी एसपी (प्रसंभाव्य प्रोग्रामिंग के लिए विस्तारित गणितीय प्रोग्रामिंग) - प्रसंभाव्य प्रोग्रामिंग को सुविधाजनक बनाने के लिए जीएएमएस का एक मॉड्यूल बनाया गया है (इसमें प्राचल बंटन के लिए संकेत शब्द, अवसर व्यवरोध और जोखिम पर मान एवं प्रत्याशित कमी जैसी जोखिम की माप सम्मिलित हैं)।
  • एसएएमपीएल - एएमपीएल के विस्तार का एक समुच्चय विशेष रूप से प्रसंभाव्य प्रोग्राम को व्यक्त करने के लिए संरचित किया गया है ( इसमें अवसर व्यवरोधों के लिए सिंटैक्स, एकीकृत अवसर व्यवरोध और दृढ़ अनुकूलन समस्याएँ सम्मिलित हैं)

ये दोनों एसएमपीएस उदाहरण तत्क्षण स्तर प्रारूप उत्पन्न कर सकते हैं, जो गैर-निरर्थक रूप में समस्या की संरचना को हलकर्ताओं तक पहुँचाता है।

यह भी देखें

संदर्भ

  1. Shapiro, Alexander; Dentcheva, Darinka; Ruszczyński, Andrzej (2009). Lectures on stochastic programming: Modeling and theory (PDF). MPS/SIAM Series on Optimization. Vol. 9. Philadelphia, PA: Society for Industrial and Applied Mathematics (SIAM). Mathematical Programming Society (MPS). pp. xvi+436. ISBN 978-0-89871-687-0. MR 2562798.
  2. Birge, John R.; Louveaux, François (2011). Introduction to Stochastic Programming. Springer Series in Operations Research and Financial Engineering (in British English). doi:10.1007/978-1-4614-0237-4. ISBN 978-1-4614-0236-7. ISSN 1431-8598.
  3. Stein W. Wallace and William T. Ziemba (eds.). Applications of Stochastic Programming. MPS-SIAM Book Series on Optimization 5, 2005.
  4. Applications of stochastic programming are described at the following website, Stochastic Programming Community.
  5. Shapiro, Alexander; Philpott, Andy. A tutorial on Stochastic Programming (PDF).
  6. "NEOS Server for Optimization".
  7. Ruszczyński, Andrzej; Shapiro, Alexander (2003). Stochastic Programming. Handbooks in Operations Research and Management Science. Vol. 10. Philadelphia: Elsevier. p. 700. ISBN 978-0444508546.
  8. Mangel, M. & Clark, C. W. 1988. Dynamic modeling in behavioral ecology. Princeton University Press ISBN 0-691-08506-4
  9. Houston, A. I & McNamara, J. M. 1999. Models of adaptive behaviour: an approach based on state. Cambridge University Press ISBN 0-521-65539-0
  10. Howitt, R., Msangi, S., Reynaud, A and K. Knapp. 2002. "Using Polynomial Approximations to Solve Stochastic Dynamic Programming Problems: or A "Betty Crocker " Approach to SDP." University of California, Davis, Department of Agricultural and Resource Economics Working Paper.

अग्रिम पठन


बाहरी संबंध