स्टोकेस्टिक प्रोग्रामिंग: Difference between revisions

From Vigyanwiki
(Created page with "{{Short description|Framework for modeling optimization problems that involve uncertainty}} {{For|the context of control theory|Stochastic control}} गणितीय अ...")
 
No edit summary
 
(8 intermediate revisions by 2 users not shown)
Line 1: Line 1:
{{Short description|Framework for modeling optimization problems that involve uncertainty}}
{{Short description|Framework for modeling optimization problems that involve uncertainty}}
{{For|the context of control theory|Stochastic control}}
{{For|नियंत्रण सिद्धांत का संदर्भ|प्रसंभाव्य नियंत्रण}}
[[गणितीय अनुकूलन]] के क्षेत्र में, स्टोकेस्टिक प्रोग्रामिंग गणितीय मॉडल [[अनुकूलन (गणित)]] समस्याओं के लिए एक ढांचा है जिसमें [[अनिश्चितता]] शामिल है। एक स्टोकेस्टिक प्रोग्राम एक अनुकूलन समस्या है जिसमें कुछ या सभी समस्या पैरामीटर अनिश्चित हैं, लेकिन ज्ञात संभाव्यता वितरण का पालन करते हैं।<ref>{{cite book|last1=Shapiro|first1=Alexander|url=http://www2.isye.gatech.edu/people/faculty/Alex_Shapiro/SPbook.pdf|title=Lectures on stochastic programming: Modeling and theory|last2=Dentcheva|first2=Darinka|last3=Ruszczyński|first3=Andrzej|publisher=Society for Industrial and Applied Mathematics (SIAM)|year=2009|isbn=978-0-89871-687-0|series=MPS/SIAM Series on Optimization|volume=9|location=Philadelphia, PA|pages=xvi+436|mr=2562798|author2-link=Darinka Dentcheva|author3-link=Andrzej Piotr Ruszczyński|agency=Mathematical Programming Society (MPS)}}</ref><ref>{{Cite book|last1=Birge|first1=John R.|last2=Louveaux|first2=François|date=2011|title=Introduction to Stochastic Programming|url=https://doi.org/10.1007/978-1-4614-0237-4|series=Springer Series in Operations Research and Financial Engineering|language=en-gb|doi=10.1007/978-1-4614-0237-4|isbn=978-1-4614-0236-7|issn=1431-8598}}</ref> यह ढांचा नियतात्मक अनुकूलन के विपरीत है, जिसमें सभी समस्या मापदंडों को सटीक रूप से ज्ञात माना जाता है। स्टोकेस्टिक प्रोग्रामिंग का लक्ष्य एक निर्णय खोजना है जो निर्णय निर्माता द्वारा चुने गए कुछ मानदंडों का अनुकूलन करता है, और समस्या के मापदंडों की अनिश्चितता के लिए उचित रूप से खाता है। क्योंकि कई वास्तविक दुनिया के फैसलों में अनिश्चितता शामिल है, स्टोकेस्टिक प्रोग्रामिंग ने [[वित्त]] से लेकर परिवहन से लेकर ऊर्जा अनुकूलन तक के व्यापक क्षेत्रों में आवेदन पाया है।<ref>
[[गणितीय अनुकूलन]] के क्षेत्र में, '''स्टोकेस्टिक प्रोग्रामिंग''' या '''स्टोकेस्टिक प्रोग्रामिंग''' प्रतिरूपण [[अनुकूलन (गणित)|अनुकूलन]] समस्याओं के लिए एक ऐसी संरचना है जिसमें [[अनिश्चितता]] सम्मिलित है। '''स्टोकेस्टिक प्रोग्राम''' एक ऐसी अनुकूलन समस्या है जिसमें कुछ या सभी समस्या प्राचल अनिश्चित हैं, लेकिन ज्ञात प्रायिकता वितरणों का अनुसरण करते हैं।<ref>{{cite book|last1=Shapiro|first1=Alexander|url=http://www2.isye.gatech.edu/people/faculty/Alex_Shapiro/SPbook.pdf|title=Lectures on stochastic programming: Modeling and theory|last2=Dentcheva|first2=Darinka|last3=Ruszczyński|first3=Andrzej|publisher=Society for Industrial and Applied Mathematics (SIAM)|year=2009|isbn=978-0-89871-687-0|series=MPS/SIAM Series on Optimization|volume=9|location=Philadelphia, PA|pages=xvi+436|mr=2562798|author2-link=Darinka Dentcheva|author3-link=Andrzej Piotr Ruszczyński|agency=Mathematical Programming Society (MPS)}}</ref><ref>{{Cite book|last1=Birge|first1=John R.|last2=Louveaux|first2=François|date=2011|title=Introduction to Stochastic Programming|url=https://doi.org/10.1007/978-1-4614-0237-4|series=Springer Series in Operations Research and Financial Engineering|language=en-gb|doi=10.1007/978-1-4614-0237-4|isbn=978-1-4614-0236-7|issn=1431-8598}}</ref> यह संरचना निर्धारणात्मक अनुकूलन के विपरीत है, जिसमें सभी समस्या प्राचलों को यथार्थ रूप से ज्ञात माना जाता है। स्टोकेस्टिक प्रोग्रामिंग का लक्ष्य एक ऐसा निर्णय प्राप्त करना है जो निर्णायक द्वारा चयनित कुछ प्राचलों का अनुकूलन करता है, और समस्या के प्राचलों की अनिश्चितता के लिए उचित रूप से ध्यान देने योग्य है। क्योंकि कई वास्तविक जगत के निर्णयों में अनिश्चितता सम्मिलित है, अतः स्टोकेस्टिक प्रोग्रामिंग का अनुप्रयोग [[वित्त]] से लेकर परिवहन तक ऊर्जा अनुकूलन के क्षेत्रों की एक विस्तृत श्रृंखला में देखा जाता है।<ref>
Stein W. Wallace and William T. Ziemba (eds.). ''[https://books.google.com/books?id=KAI0jsuyDPsC&printsec=frontcover&dq=%22Applications+of+Stochastic+Programming%22&hl=en&sa=X&ved=0ahUKEwivt-nn2OfiAhURXa0KHYJMC9UQ6AEIKjAA#v=onepage&q=%22Applications%20of%20Stochastic%20Programming%22&f=false Applications of Stochastic Programming]''. MPS-SIAM Book Series on Optimization 5, 2005.
Stein W. Wallace and William T. Ziemba (eds.). ''[https://books.google.com/books?id=KAI0jsuyDPsC&printsec=frontcover&dq=%22Applications+of+Stochastic+Programming%22&hl=en&sa=X&ved=0ahUKEwivt-nn2OfiAhURXa0KHYJMC9UQ6AEIKjAA#v=onepage&q=%22Applications%20of%20Stochastic%20Programming%22&f=false Applications of Stochastic Programming]''. MPS-SIAM Book Series on Optimization 5, 2005.
</ref><ref>
</ref><ref>
Applications of stochastic programming are described at the following website, [http://stoprog.org Stochastic Programming Community].
Applications of stochastic programming are described at the following website, [http://stoprog.org Stochastic Programming Community].
</ref>
</ref>
 
== द्वि-चरणीय समस्याएँ ==
 
द्वि-चरणीय स्टोकेस्टिक प्रोग्रामिंग का मूल विचार यह है कि (इष्टतम) निर्णय, निर्णय लिए जाने के समय उपलब्ध आंकड़ों पर आधारित होने चाहिए और ये निर्णय भविष्य के प्रेक्षणों पर निर्भर नहीं हो सकते हैं। स्टोकेस्टिक प्रोग्रामिंग में द्वि-चरणीय सूत्रीकरण का उपयोग व्यापक रूप से किया जाता है। द्वि-चरणीय स्टोकेस्टिक प्रोग्रामिंग समस्या का सामान्य सूत्रीकरण निम्न द्वारा दिया जाता है:<math display="block">
== दो चरण की समस्याएं ==
दो-चरण स्टोकेस्टिक प्रोग्रामिंग का मूल विचार यह है कि (इष्टतम) निर्णय निर्णय किए जाने के समय उपलब्ध आंकड़ों पर आधारित होने चाहिए और भविष्य की टिप्पणियों पर निर्भर नहीं हो सकते। स्टोचैस्टिक प्रोग्रामिंग में दो-चरण सूत्रीकरण का व्यापक रूप से उपयोग किया जाता है। दो-चरण स्टोकास्टिक प्रोग्रामिंग समस्या का सामान्य सूत्रीकरण निम्न द्वारा दिया गया है:
<math display="block">
\min_{x\in X}\{ g(x)= f(x) + E_{\xi}[Q(x,\xi)]\}
\min_{x\in X}\{ g(x)= f(x) + E_{\xi}[Q(x,\xi)]\}
</math>
</math>जहाँ <math>Q(x,\xi)</math> द्वितीय-चरण की समस्या का इष्टतम मान है<math display="block">
कहाँ <math>Q(x,\xi)</math> दूसरे चरण की समस्या का इष्टतम मूल्य है
<math display="block">
\min_{y}\{ q(y,\xi) \,|\,T(\xi)x+W(\xi) y = h(\xi)\}.
\min_{y}\{ q(y,\xi) \,|\,T(\xi)x+W(\xi) y = h(\xi)\}.
</math>
</math>चिरसम्मत द्वि-चरणीय रैखिक स्टोकेस्टिक प्रोग्रामिंग समस्याओं को निम्न रूप में सूत्रित किया जा सकता है<math display="block">
क्लासिकल टू-स्टेज लीनियर स्टोचैस्टिक प्रोग्रामिंग प्रॉब्लम्स को इस रूप में तैयार किया जा सकता है
<math display="block">
\begin{array}{llr}
\begin{array}{llr}
\min\limits_{x\in \mathbb{R}^n}  &g(x)= c^T x + E_{\xi}[Q(x,\xi)]    &  \\
\min\limits_{x\in \mathbb{R}^n}  &g(x)= c^T x + E_{\xi}[Q(x,\xi)]    &  \\
Line 24: Line 17:
    & x    \geq 0 &
    & x    \geq 0 &
\end{array}
\end{array}
</math>
</math>जहाँ <math> Q(x,\xi)</math> द्वितीय-चरण की समस्या का इष्टतम मान है<math display="block">
कहाँ <math> Q(x,\xi)</math> दूसरे चरण की समस्या का इष्टतम मूल्य है
<math display="block">
\begin{array}{llr}
\begin{array}{llr}
\min\limits_{y\in \mathbb{R}^m}  & q(\xi)^T y    &  \\
\min\limits_{y\in \mathbb{R}^m}  & q(\xi)^T y    &  \\
Line 33: Line 24:
\end{array}
\end{array}
</math>
</math>
ऐसे सूत्रीकरण में <math>x\in \mathbb{R}^n</math> प्रथम-चरण निर्णय चर वेक्टर है, <math>y\in \mathbb{R}^m</math> दूसरे चरण का निर्णय चर वेक्टर है, और <math>\xi(q,T,W,h)</math> दूसरे चरण की समस्या का डेटा शामिल है। इस सूत्रीकरण में, पहले चरण में हमें अभी और अभी निर्णय लेना है <math>x</math> अनिश्चित डेटा की प्राप्ति से पहले <math>\xi</math>, एक यादृच्छिक वेक्टर के रूप में देखा जाता है। दूसरे चरण में, की प्राप्ति के बाद <math>\xi</math> उपलब्ध हो जाता है, हम उपयुक्त अनुकूलन समस्या को हल करके अपने व्यवहार को अनुकूलित करते हैं।


पहले चरण में हम लागत का अनुकूलन करते हैं (उपर्युक्त फॉर्मूलेशन में न्यूनतम)। <math>c^Tx</math> प्रथम चरण के निर्णय के साथ साथ (इष्टतम) दूसरे चरण के निर्णय की अपेक्षित लागत। हम दूसरे चरण की समस्या को केवल एक अनुकूलन समस्या के रूप में देख सकते हैं जो अनिश्चित डेटा के प्रकट होने पर हमारे अनुमानित इष्टतम व्यवहार का वर्णन करती है, या हम इसके समाधान को एक सहारा कार्रवाई के रूप में मान सकते हैं जहां शब्द <math>Wy</math> सिस्टम की संभावित असंगति के लिए क्षतिपूर्ति करता है <math>Tx\leq h</math> और <math>q^Ty</math> इस सहारा कार्रवाई की लागत है।


माना जाने वाला द्वि-चरण समस्या रैखिक है क्योंकि उद्देश्य कार्य और बाधाएं रैखिक हैं। संकल्पनात्मक रूप से यह आवश्यक नहीं है और कोई अधिक सामान्य दो-चरण स्टोकेस्टिक कार्यक्रमों पर विचार कर सकता है। उदाहरण के लिए, यदि प्रथम-चरण की समस्या पूर्णांक है, तो कोई प्रथम-चरण की समस्या में अभिन्नता की कमी को जोड़ सकता है ताकि व्यवहार्य सेट असतत हो। जरूरत पड़ने पर गैर-रैखिक उद्देश्यों और बाधाओं को भी शामिल किया जा सकता है।<ref>{{cite book| last1=Shapiro|first1=Alexander|last2=Philpott|first2=Andy|title=A tutorial on Stochastic Programming| url=http://www2.isye.gatech.edu/people/faculty/Alex_Shapiro/TutorialSP.pdf}}</ref>


ऐसे सूत्रीकरण में, <math>x\in \mathbb{R}^n</math> प्रथम-चरण निर्णय चर सदिश है, <math>y\in \mathbb{R}^m</math> द्वितीय-चरण निर्णय चर सदिश है, और <math>\xi(q,T,W,h)</math> द्वितीय चरण की समस्या के आँकड़े को समाहित करता है। इस सूत्रीकरण में, प्रथम चरण में हमें अनिश्चित आँकड़े <math>\xi</math> (इसे एक यादृच्छिक सदिश के रूप में देखा जाता है) की प्राप्ति से पहले "यहीं और अभी (तत्काल)" निर्णय <math>x</math> लेना होता है। द्वितीय चरण में, <math>\xi</math> की प्राप्ति के उपलब्ध होने के बाद, हम उपयुक्त अनुकूलन समस्या को हल करके अपने व्यवहार को अनुकूलित करते हैं।


=== वितरण धारणा ===
प्रथम चरण में हम प्रथम चरण के निर्णय की लागत <math>c^Tx</math> के साथ-साथ (इष्टतम) द्वितीय चरण के निर्णय की अपेक्षित लागत का अनुकूलन (उपर्युक्त सूत्रीकरण में न्यूनीकृत) करते हैं। हम द्वितीय चरण की समस्या को केवल एक ऐसी अनुकूलन समस्या के रूप में देख सकते हैं जो अनिश्चित आंकड़ों के प्रकट होने पर हमारे अनुमानित इष्टतम व्यवहार का वर्णन करती है, या हम इसके हल को एक ऐसी आश्रय क्रिया के रूप में मान सकते हैं जहाँ शब्द <math>Wy</math> निकाय <math>Tx\leq h</math> की संभावित असंगति की क्षतिपूर्ति करता है और <math>q^Ty</math> इस आश्रय क्रिया की लागत है।
उपरोक्त दो-चरण की समस्या का सूत्रीकरण दूसरे चरण के डेटा को मानता है <math>\xi</math> एक 'ज्ञात' संभाव्यता वितरण के साथ एक यादृच्छिक वेक्टर के रूप में तैयार किया गया है। यह कई स्थितियों में उचित होगा। उदाहरण के लिए, का वितरण <math>\xi</math> ऐतिहासिक डेटा से अनुमान लगाया जा सकता है यदि कोई मानता है कि समय की अवधि में वितरण महत्वपूर्ण रूप से नहीं बदलता है। इसके अलावा, नमूने के अनुभवजन्य वितरण का उपयोग भविष्य के मूल्यों के वितरण के अनुमान के रूप में किया जा सकता है <math>\xi</math>. यदि किसी के पास पूर्व मॉडल है <math>\xi</math>, कोई बायेसियन अपडेट द्वारा पोस्टरियरी वितरण प्राप्त कर सकता है।


=== विवेक ===
विचार की गयी द्वि-चरणीय समस्या ''रैखिक'' है क्योंकि उद्देश्य फलन और व्यवरोध रैखिक हैं। संकल्पनात्मक रूप से यह आवश्यक नहीं है और अधिक सामान्य द्वि-चरणीय स्टोकेस्टिक प्रोग्रामों पर विचार किया जा सकता है। उदाहरण के लिए, यदि प्रथम-चरण की समस्या पूर्णांक है, तो प्रथम-चरण की समस्या में समाकलनीय व्यवरोधों को इस प्रकार जोड़ा जा सकता है कि सुसंगत समुच्चय असतत हो जाये। आवश्यकतानुसार अरैखिक उद्देश्यों और व्यवरोधों को भी सम्मिलित किया जा सकता है।<ref>{{cite book| last1=Shapiro|first1=Alexander|last2=Philpott|first2=Andy|title=A tutorial on Stochastic Programming| url=http://www2.isye.gatech.edu/people/faculty/Alex_Shapiro/TutorialSP.pdf}}</ref>
संख्यात्मक रूप से दो-चरण की स्टोकेस्टिक समस्या को हल करने के लिए, अक्सर यह मानने की आवश्यकता होती है कि यादृच्छिक वेक्टर <math>\xi</math> संभावित अहसासों की एक सीमित संख्या होती है, जिन्हें परिदृश्य कहा जाता है <math>\xi_1,\dots,\xi_K</math>, संबंधित संभाव्यता द्रव्यमान के साथ <math>p_1,\dots,p_K</math>. तब प्रथम चरण की समस्या के उद्देश्य समारोह में अपेक्षा को योग के रूप में लिखा जा सकता है:
=== बंटनात्मक कल्पना ===
<math display="block">
उपरोक्त द्वि-चरणीय समस्या का सूत्रीकरण यह मानता है कि द्वितीय-चरण के डेटा <math>\xi</math> को '''''ज्ञात''''' प्रायिकता वितरण वाले एक यादृच्छिक सदिश के रूप में प्रतिरूपित किया गया है। यह कई स्थितियों में उचित होता है। उदाहरण के लिए, <math>\xi</math> के बंटन को ऐतिहासिक आँकड़े से अनुमानित किया जा सकता है यदि मान जाता है कि वितरण किसी समयावधि में प्रभावशाली रूप से परिवर्तित नहीं होता है। इसके अतिरिक्त, प्रतिदर्श के प्रयोगसिद्ध बंटन का उपयोग <math>\xi</math> के अग्रिम मानों के बंटन के सन्निकटन के रूप में किया जा सकता है। यदि <math>\xi</math> का पूर्व मॉडल उपलब्ध है, तो बेज़ के अपडेट द्वारा पश्चवर्ती बंटन प्राप्त किया जा सकता है।
 
=== असततीकरण ===
द्वि-चरणीय की स्टोकेस्टिक समस्या को संख्यात्मक रूप से हल करने के लिए, प्रायः यह मानने की आवश्यकता होती है कि यादृच्छिक सदिश <math>\xi</math> में ''परिदृश्य'' नामक संभावित प्राप्तियों की संख्या सीमित है, माना ये <math>\xi_1,\dots,\xi_K</math> हैं, जिनके संगत प्रायिकता द्रव्यमान <math>p_1,\dots,p_K</math> हैं। तब प्रथम चरण की समस्या के उद्देश्य फलन में प्रत्याशा को निम्न योग के रूप में लिखा जा सकता है:<math display="block">
E[Q(x,\xi)]=\sum\limits_{k=1}^{K} p_kQ(x,\xi_k)
E[Q(x,\xi)]=\sum\limits_{k=1}^{K} p_kQ(x,\xi_k)
</math>
</math>और इसके अतिरिक्त, द्वि-चरणीय समस्या को एक बड़ी रैखिक प्रोग्रामन समस्या के रूप में सूत्रित किया जा सकता है (इसे मूल समस्या का निर्धारणात्मक समतुल्य कहा जाता है, {{Section link||§ यादृच्छिक समस्या का निर्धारक समतुल्य}} अनुभाग देखें)
और, इसके अलावा, दो-चरण की समस्या को एक बड़ी रैखिक प्रोग्रामिंग समस्या के रूप में तैयार किया जा सकता है (इसे मूल समस्या का नियतात्मक समतुल्य कहा जाता है, खंड देखें {{Section link||Deterministic equivalent of a stochastic problem}}).


कब <math>\xi</math> संभावित प्राप्तियों की एक अनंत (या बहुत बड़ी) संख्या है, तो परिदृश्यों द्वारा इस वितरण का प्रतिनिधित्व करने के लिए मानक दृष्टिकोण है। यह दृष्टिकोण तीन प्रश्न उठाता है, अर्थात्:
जब <math>\xi</math> में संभावित प्राप्तियों की संख्या अपरिमित (या बहुत बड़ी) है, तो इस बंटन का निरूपण परिदृश्यों द्वारा करने के लिए मानक दृष्टिकोण है। यह दृष्टिकोण तीन प्रश्न उठाता है, अर्थात्:


# परिदृश्यों का निर्माण कैसे करें, देखें {{Section link||Scenario construction}};
# परिदृश्यों का निर्माण कैसे करें, देखें {{Section link||परिदृश्य निर्माण}};
# नियतात्मक समतुल्य को कैसे हल करें। [[सीप्लेक्स]], और [[जीएनयू रैखिक प्रोग्रामिंग किट]] जैसे अनुकूलक बड़ी रैखिक/अरैखिक समस्याओं को हल कर सकते हैं। एनईओएस सर्वर,<ref name="neos">{{Cite web|url=http://www.neos-server.org/neos/|title = NEOS Server for Optimization}}</ref> विस्कॉन्सिन विश्वविद्यालय, मैडिसन में होस्ट किया गया, कई आधुनिक सॉल्वरों तक मुफ्त पहुंच की अनुमति देता है। अपघटन विधियों को लागू करने के लिए नियतात्मक समतुल्य की संरचना विशेष रूप से उत्तरदायी है,<ref>{{cite book|first2=Alexander|last2=Shapiro|last1=Ruszczyński|first1=Andrzej|title=Stochastic Programming|publisher=[[Elsevier]]|year=2003|isbn=978-0444508546|series=Handbooks in Operations Research and Management Science|volume=10|location=Philadelphia|pages=700|author1-link=Andrzej Piotr Ruszczyński}}</ref> जैसे बेंडर्स अपघटन या परिदृश्य अपघटन;
#निर्धारणात्मक समतुल्य को कैसे हल करें। [[सीप्लेक्स|सीपीएलईएक्स]], और [[जीएनयू रैखिक प्रोग्रामिंग किट|जीएनयू रैखिक प्रोग्रामिंग किट (जीएलपीके)]] जैसे अनुकूलक बड़ी रैखिक/अरैखिक समस्याओं को हल कर सकते हैं। विस्कॉन्सिन विश्वविद्यालय, मैडिसन में आयोजित एनईओएस सर्वर<ref name="neos">{{Cite web|url=http://www.neos-server.org/neos/|title = NEOS Server for Optimization}}</ref> कई आधुनिक हलकर्ताओं तक मुफ्त पहुँच की अनुमति प्रदान करता है। निर्धारणात्मक समतुल्य की संरचना बेंडर्स अपघटन या परिदृश्य अपघटन जैसी अपघटन विधियों को लागू करने के लिए विशेष रूप से उत्तरदायी है,<ref>{{cite book|first2=Alexander|last2=Shapiro|last1=Ruszczyński|first1=Andrzej|title=Stochastic Programming|publisher=[[Elsevier]]|year=2003|isbn=978-0444508546|series=Handbooks in Operations Research and Management Science|volume=10|location=Philadelphia|pages=700|author1-link=Andrzej Piotr Ruszczyński}}</ref>
# सही इष्टतम के संबंध में प्राप्त समाधान की गुणवत्ता को कैसे मापें।
#"सही" इष्टतम के सापेक्ष प्राप्त हल की गुणवत्ता को कैसे मापें।


ये प्रश्न स्वतंत्र नहीं हैं। उदाहरण के लिए, निर्मित परिदृश्यों की संख्या नियतात्मक समतुल्य की सुवाह्यता और प्राप्त समाधानों की गुणवत्ता दोनों को प्रभावित करेगी।
ये प्रश्न स्वतंत्र नहीं हैं। उदाहरण के लिए, निर्मित परिदृश्यों की संख्या निर्धारणात्मक समतुल्य की वश्यता और प्राप्त हलों की गुणवत्ता दोनों को प्रभावित करती है।


== स्टोकेस्टिक [[रैखिक कार्यक्रम]]िंग ==
== स्टोकेस्टिक रैखिक प्रोग्राम ==
एक स्टोचैस्टिक लीनियर प्रोग्राम क्लासिकल टू-स्टेज स्टोकेस्टिक प्रोग्राम का एक विशिष्ट उदाहरण है। एक स्टोकेस्टिक एलपी मल्टी-पीरियड लीनियर प्रोग्राम (एलपी) के संग्रह से बनाया गया है, जिनमें से प्रत्येक की संरचना समान है लेकिन कुछ अलग डेटा है। <math>k^{th}</math> एच> दो-अवधि एलपी, प्रतिनिधित्व करते हैं <math>k^{th}</math> परिदृश्य, निम्नलिखित रूप होने के रूप में माना जा सकता है:
स्टोकेस्टिक [[रैखिक कार्यक्रम|रैखिक प्रोग्राम]] चिरसम्मत द्वि-चरणीय स्टोकेस्टिक प्रोग्राम का एक विशिष्ट उदाहरण है। एक स्टोकेस्टिक एलपी, बहु-आवधिक रैखिक प्रोग्रामों (एलपी) के संग्रह से बनाई गयी है, जिनमें से प्रत्येक की संरचना समान लेकिन आँकड़े कुछ अलग हैं।  <math>k^{th}</math> परिदृश्य को निरूपित करने वाली <math>k^{th}</math> द्वि-आवधिक एलपी को निम्नलिखित रूप में माना जा सकता है:


<math>
<math>
Line 69: Line 59:
\end{array}
\end{array}
</math>
</math>
वैक्टर <math>x</math> और <math>y</math> प्रथम-अवधि के चर होते हैं, जिनके मान तुरंत चुने जाने चाहिए। सदिश <math>z_k</math> बाद की अवधि के लिए सभी चर शामिल हैं। विवशताएँ <math>Tx + Uy = r</math> केवल प्रथम-अवधि के चर शामिल होते हैं और प्रत्येक परिदृश्य में समान होते हैं। अन्य बाधाओं में बाद की अवधि के चर शामिल हैं और भविष्य के बारे में अनिश्चितता को दर्शाते हुए परिदृश्य से परिदृश्य में कुछ मामलों में भिन्न हैं।


ध्यान दें कि हल करना <math>k^{th}</math> दो-अवधि एलपी मानने के बराबर है <math>k^{th}</math> बिना किसी अनिश्चितता के दूसरी अवधि में परिदृश्य। दूसरे चरण में अनिश्चितताओं को शामिल करने के लिए, किसी को अलग-अलग परिदृश्यों के लिए संभावनाओं को आवंटित करना चाहिए और संबंधित नियतात्मक समतुल्य को हल करना चाहिए।
सदिश <math>x</math> और <math>y</math> में प्रथम-आवधिक चर होते हैं, जिनके मानों का चयन तत्काल किया जाना चाहिए। सदिश <math>z_k</math> अनुक्रमिक अवधियों के लिए सभी चरों को समाहित करता है। व्यवरोध <math>Tx + Uy = r</math> केवल प्रथम-आवधिक चरों को सम्मिलित करता है और ये प्रत्येक परिदृश्य में समान होते हैं। अन्य व्यवरोधों में बाद की अवधियों के चर सम्मिलित हैं और अग्रिम अनिश्चितता को दर्शाते हुए परिदृश्य से परिदृश्य में कुछ स्थितियों में भिन्न हैं।


=== एक स्टोकास्टिक समस्या के नियतात्मक समकक्ष ===
ध्यान दें कि <math>k^{th}</math> द्वि-आवधिक एलपी को हल करना, बिना किसी अनिश्चितता के द्वितीय अवधि में <math>k^{th}</math> परिदृश्य को मानने के बराबर है। द्वितीय चरण में अनिश्चितताओं को समाविष्ट करने के लिए,  भिन्न परिदृश्यों के लिए प्रायिकताओं को आवंटित करना चाहिए और संगत निर्धारणात्मक समतुल्य को हल करना चाहिए।
परिमित संख्या में परिदृश्यों के साथ, दो-चरण स्टोकेस्टिक रैखिक कार्यक्रमों को बड़ी रैखिक प्रोग्रामिंग समस्याओं के रूप में तैयार किया जा सकता है। इस सूत्रीकरण को अक्सर नियतात्मक समतुल्य रैखिक कार्यक्रम कहा जाता है, या नियतात्मक समतुल्य के लिए संक्षिप्त किया जाता है। (सख्ती से एक नियतात्मक समकक्ष बोलना कोई भी गणितीय कार्यक्रम है जिसका उपयोग इष्टतम प्रथम-चरण के निर्णय की गणना करने के लिए किया जा सकता है, इसलिए ये निरंतर संभाव्यता वितरण के लिए भी मौजूद रहेंगे, जब कोई किसी बंद रूप में दूसरे चरण की लागत का प्रतिनिधित्व कर सकता है।)
 
उदाहरण के लिए, उपरोक्त स्टोकेस्टिक रैखिक कार्यक्रम के समतुल्य नियतात्मक बनाने के लिए, हम एक प्रायिकता प्रदान करते हैं <math>p_k</math> प्रत्येक परिदृश्य के लिए <math>k=1,\dots,K</math>. फिर हम सभी परिदृश्यों से बाधाओं के अधीन उद्देश्य के अपेक्षित मूल्य को कम कर सकते हैं:
=== स्टोकेस्टिक समस्या के निर्धारणात्मक समकक्ष ===
परिदृश्यों की परिमित संख्या के साथ, द्वि-चरणीय स्टोकेस्टिक रैखिक प्रोग्रामों को बड़ी रैखिक प्रोग्रामन समस्याओं के रूप में प्रतिरूपित किया जा सकता है। इस सूत्रीकरण को प्रायः निर्धारणात्मक समतुल्य रैखिक प्रोग्राम या संक्षिप्त रूप में निर्धारणात्मक समतुल्य कहा जाता है। (निष्पक्ष रूप से कहने पर, निर्धारणात्मक समतुल्य एक ऐसा गणितीय प्रोग्राम है जिसका उपयोग इष्टतम प्रथम-चरण के निर्णय की गणना करने के लिए किया जा सकता है, इसलिए ये तब भी सतत प्रायिकता बंटन के लिए अस्तित्व में होते हैं, जब द्वितीय चरण की लागत का निरूपण समान संवृत रूप में  किया जा सकता है।) उदाहरण के लिए, उपरोक्त स्टोकेस्टिक रैखिक प्रोग्राम के समतुल्य के निर्माण के लिए, हम प्रत्येक परिदृश्य <math>k=1,\dots,K</math> के लिए एक प्रायिकता <math>p_k</math> आवंटित करते हैं।
 
फिर हम सभी परिदृश्यों से व्यवरोधों के अधीन उद्देश्य के प्रत्याशित मान को न्यूनतम कर सकते हैं:


<math>
<math>
Line 87: Line 79:
  & x & , & y & , & z_1 & , & z_2 & , & \ldots & , & z_K & \geq & 0 \\  
  & x & , & y & , & z_1 & , & z_2 & , & \ldots & , & z_K & \geq & 0 \\  
\end{array}
\end{array}
</math>
</math>  
हमारे पास एक अलग वेक्टर है <math>z_k</math> प्रत्येक परिदृश्य के लिए बाद की अवधि के चर <math>k</math>. पहली अवधि के चर <math>x</math> और <math>y</math> हालाँकि, हर परिदृश्य में समान हैं, क्योंकि हमें यह जानने से पहले पहली अवधि के लिए निर्णय लेना चाहिए कि कौन सा परिदृश्य साकार होगा। नतीजतन, बाधाओं को शामिल करना <math>x</math> और <math>y</math> आवश्यकता केवल एक बार निर्दिष्ट की जानी चाहिए, जबकि शेष बाधाओं को प्रत्येक परिदृश्य के लिए अलग से दिया जाना चाहिए।
 
हमारे पास प्रत्येक परिदृश्य <math>k</math> के लिए, आनुक्रमिक अवधियों के चरों का एक अलग सदिश <math>z_k</math> है। प्रथम आवधिक चर <math>x</math> और <math>y</math> प्रत्येक परिदृश्य में समान होते हैं, हालाँकि, क्योंकि हमें यह जानने से पहले प्रथम अवधि के लिए निर्णय लेना चाहिए कि कौन सा परिदृश्य प्राप्त होगा। परिणामस्वरूप, केवल <math>x</math> और <math>y</math> को सम्मिलित करने वाले व्यवरोधों को केवल एक बार निर्दिष्ट करने की आवश्यकता होती है, जबकि शेष व्यवरोधों को प्रत्येक परिदृश्य के लिए एकल रूप से निर्दिष्ट किया जाना चाहिए।  


== परिदृश्य निर्माण ==
== परिदृश्य निर्माण ==
व्यवहार में भविष्य पर विशेषज्ञों की राय जानने के द्वारा परिदृश्यों का निर्माण करना संभव हो सकता है। निर्मित परिदृश्यों की संख्या अपेक्षाकृत मामूली होनी चाहिए ताकि प्राप्त नियतात्मक समतुल्य को उचित कम्प्यूटेशनल प्रयास से हल किया जा सके। अक्सर यह दावा किया जाता है कि केवल कुछ परिदृश्यों का उपयोग करने वाला एक समाधान केवल एक परिदृश्य को मानने वाले समाधान की तुलना में अधिक अनुकूलनीय योजनाएं प्रदान करता है। कुछ मामलों में ऐसे दावे को अनुकरण द्वारा सत्यापित किया जा सकता है। सिद्धांत रूप में गारंटी के कुछ उपाय कि एक प्राप्त समाधान मूल समस्या को उचित सटीकता के साथ हल करता है। आम तौर पर अनुप्रयोगों में केवल प्रथम चरण इष्टतम समाधान <math>x^*</math> एक व्यावहारिक मूल्य है क्योंकि लगभग हमेशा यादृच्छिक डेटा का एक वास्तविक बोध निर्मित (उत्पन्न) परिदृश्यों के सेट से अलग होगा।
व्यवहार में भविष्य पर विशेषज्ञों का मत जानकर परिदृश्यों का निर्माण करना संभव हो सकता है। निर्मित परिदृश्यों की संख्या अपेक्षाकृत साधारण होनी चाहिए जिससे प्राप्त निर्धारणात्मक समतुल्य को उचित संगणनीय प्रयास से हल किया जा सके। प्रायः यह दावा किया जाता है कि केवल कुछ परिदृश्यों का उपयोग करने वाला एक हल केवल एक परिदृश्य को मानने वाले हल की तुलना में अधिक अनुकूलनीय योजनाएँ प्रदान करता है। कुछ स्थितियों में ऐसे दावे को अनुकरण द्वारा सत्यापित किया जा सकता है। सिद्धांत रूप में आश्वासन के कुछ प्रमाप उपलब्ध हैं, जिससे एक प्राप्त हल मूल समस्या को उचित यथार्थता के साथ हल करता है। सामान्यतः अनुप्रयोगों में केवल ''प्रथम चरण'' इष्टतम हल <math>x^*</math> का एक व्यावहारिक मान है क्योंकि लगभग सदैव यादृच्छिक आँकड़ों का "सत्य" प्रतिफलन निर्मित (उत्पन्न) परिदृश्यों के समुच्चय से अलग होता है।


कल्पना करना <math>\xi</math> रोकना <math>d</math> स्वतंत्र यादृच्छिक घटक, जिनमें से प्रत्येक में तीन संभावित अहसास हैं (उदाहरण के लिए, प्रत्येक यादृच्छिक पैरामीटर की भविष्य की प्राप्ति को निम्न, मध्यम और उच्च के रूप में वर्गीकृत किया गया है), तो परिदृश्यों की कुल संख्या है <math>K=3^d</math>. परिदृश्यों की संख्या में इस तरह की घातीय वृद्धि उचित आकार के लिए भी विशेषज्ञ की राय का उपयोग करके मॉडल विकास को बहुत कठिन बना देती है <math>d</math>. स्थिति और भी खराब हो जाती है अगर कुछ यादृच्छिक घटक <math>\xi</math> निरंतर वितरण है।
माना <math>\xi</math> में <math>d</math> स्वतंत्र यादृच्छिक घटक सम्मिलित हैं, जिनमें से प्रत्येक में तीन संभावित प्रतिफल हैं (उदाहरण के लिए, प्रत्येक यादृच्छिक प्राचलों के भविष्य के प्रतिफलों को निम्न, मध्यम और उच्च के रूप में वर्गीकृत किया गया है), तो परिदृश्यों की कुल संख्या <math>K=3^d</math> है। परिदृश्यों की संख्या में इस प्रकार की ''घातीय वृद्धि'' उचित आकार <math>d</math> के लिए भी विशेषज्ञ के मत का उपयोग करके मॉडल के विकास को अत्यधिक जटिल बना देती है। यह स्थिति और भी खराब हो जाती है यदि <math>\xi</math> के कुछ यादृच्छिक घटकों में सतत बंटन हैं।


=== मोंटे कार्लो नमूनाकरण और नमूना औसत सन्निकटन (SAA) विधि ===
=== मोंटे कार्लो प्रतिचयन और प्रतिदर्श औसत सन्निकटन (एसएए) विधि ===


एक प्रबंधनीय आकार के लिए निर्धारित परिदृश्य को कम करने के लिए एक सामान्य दृष्टिकोण मोंटे कार्लो सिमुलेशन का उपयोग करना है। मान लीजिए परिदृश्यों की कुल संख्या बहुत बड़ी या अनंत है। आगे मान लीजिए कि हम एक नमूना उत्पन्न कर सकते हैं <math>\xi^1,\xi^2,\dots,\xi^N</math> का <math>N</math> यादृच्छिक वेक्टर की प्रतिकृति <math>\xi</math>. आमतौर पर नमूने को [[स्वतंत्र और समान रूप से वितरित]] (i.i.d नमूना) माना जाता है। एक नमूना दिया गया है, अपेक्षा फलन <math>q(x)=E[Q(x,\xi)]</math> नमूना औसत द्वारा अनुमानित है
मोंटे कार्लो अनुकरण का उपयोग, एक प्रबंधनीय आकार के लिए निर्धारित परिदृश्य को कम करने के लिए एक सामान्य दृष्टिकोण है। माना परिदृश्यों की कुल संख्या अत्यधिक या अपरिमित है। आगे माना कि हम यादृच्छिक सदिश <math>\xi</math> की <math>N</math> प्रतिकृतियों का एक प्रतिदर्श <math>\xi^1,\xi^2,\dots,\xi^N</math> उत्पन्न कर सकते हैं। सामान्यतः प्रतिदर्श को [[स्वतंत्र और समान रूप से वितरित]] (आई.आई.डी प्रतिदर्श) माना जाता है। दिए गए एक प्रतिदर्श के लिए, प्रत्याशा फलन <math>q(x)=E[Q(x,\xi)]</math> को निम्न प्रतिदर्श औसत द्वारा सन्निकटित किया जाता है


<math>
<math>
\hat{q}_N(x) = \frac{1}{N} \sum_{j=1}^N Q(x,\xi^j)
\hat{q}_N(x) = \frac{1}{N} \sum_{j=1}^N Q(x,\xi^j)
</math>
</math>
और फलस्वरूप प्रथम चरण की समस्या द्वारा दी गई है
 
और फलस्वरूप प्रथम चरण की समस्या निम्न द्वारा दी गई है


<math>
<math>
Line 111: Line 105:
\end{array}
\end{array}
</math>
</math>
इस सूत्रीकरण को नमूना औसत सन्निकटन विधि के रूप में जाना जाता है। SAA समस्या माने गए नमूने का एक कार्य है और इस अर्थ में यादृच्छिक है। दिए गए नमूने के लिए <math>\xi^1,\xi^2,\dots,\xi^N</math> SAA समस्या परिदृश्यों के साथ दो-चरण स्टोकेस्टिक रैखिक प्रोग्रामिंग समस्या के समान रूप की है <math>\xi^j</math>., <math>j=1,\dots,N</math>, प्रत्येक को समान संभावना के साथ लिया गया <math>p_j=\frac{1}{N}</math>.
 
इस सूत्रीकरण को ''प्रतिदर्श औसत सन्निकटन विधि'' के रूप में जाना जाता है। एसएए समस्या माने गए प्रतिदर्श का एक फलन है और इस अर्थ में यादृच्छिक है। दिए गए प्रतिदर्श <math>\xi^1,\xi^2,\dots,\xi^N</math> के लिए, एसएए समस्या परिदृश्यों <math>\xi^j</math>., <math>j=1,\dots,N</math> वाली द्वि-चरणीय स्टोकेस्टिक रैखिक प्रोग्रामन समस्या के समान रूप की है, जिनमें से प्रत्येक को समान प्रायिकता <math>p_j=\frac{1}{N}</math> के साथ लिया गया है।


== सांख्यिकीय निष्कर्ष ==
== सांख्यिकीय निष्कर्ष ==


निम्नलिखित स्टोकेस्टिक प्रोग्रामिंग समस्या पर विचार करें
निम्नलिखित स्टोकेस्टिक प्रोग्रामन समस्या पर विचार करें


<div वर्ग = केंद्र शैली = चौड़ाई: ऑटो; मार्जिन-लेफ्ट: ऑटो; मार्जिन-राइट: ऑटो; ><math>
<div वर्ग = केंद्र शैली = चौड़ाई: ऑटो; मार्जिन-लेफ्ट: ऑटो; मार्जिन-राइट: ऑटो; ><math>
Line 121: Line 116:
</math></div>
</math></div>


यहाँ <math>X</math> का एक गैर-रिक्त बंद उपसमुच्चय है <math>\mathbb{R}^n</math>, <math>\xi</math> एक यादृच्छिक सदिश है जिसका संभाव्यता वितरण <math>P</math> एक सेट पर समर्थित है <math>\Xi \subset \mathbb{R}^d</math>, और <math>Q: X \times \Xi \rightarrow \mathbb{R}</math>. टू-स्टेज स्टोकेस्टिक प्रोग्रामिंग के ढांचे में, <math>Q(x,\xi)</math> संबंधित दूसरे चरण की समस्या के इष्टतम मूल्य द्वारा दिया गया है।
यहाँ <math>X</math>, <math>\mathbb{R}^n</math> का एक अरिक्त संवृत उपसमुच्चय है, <math>\xi</math> एक यादृच्छिक सदिश है जिसका प्रायिकता बंटन <math>P</math> एक समुच्चय <math>\Xi \subset \mathbb{R}^d</math>, और <math>Q: X \times \Xi \rightarrow \mathbb{R}</math> पर समर्थित है। द्वि-चरणीय स्टोकेस्टिक प्रोग्रामन की संरचना में, <math>Q(x,\xi)</math> को संगत द्वितीय-चरणीय समस्या के इष्टतम मान द्वारा दिया गया है।


ये मान लीजिए <math>g(x)</math> सभी के लिए अच्छी तरह से परिभाषित और परिमित मूल्यवान है <math>x\in X</math>. इसका तात्पर्य है कि प्रत्येक के लिए <math>x\in X</math> मूल्य <math>Q(x,\xi)</math> लगभग निश्चित है।
माना <math>g(x)</math> सभी <math>x\in X</math> के लिए सुपरिभाषित और ''परिमित'' ''मान'' फलन है। इसका तात्पर्य है कि प्रत्येक <math>x\in X</math> के लिए मान <math>Q(x,\xi)</math> लगभग निश्चित है।


मान लीजिए कि हमारे पास एक नमूना है <math>\xi^1,\dots,\xi^N</math> का <math>N</math>यादृच्छिक वेक्टर की प्राप्ति <math>\xi</math>. इस यादृच्छिक नमूने को ऐतिहासिक डेटा के रूप में देखा जा सकता है <math>N</math> के अवलोकन <math>\xi</math>, या इसे मोंटे कार्लो सैंपलिंग तकनीकों द्वारा उत्पन्न किया जा सकता है। तब हम एक संगत नमूना औसत सन्निकटन तैयार कर सकते हैं
माना हमारे पास यादृच्छिक सदिश <math>\xi</math> के <math>N</math> प्रतिफलनों का एक प्रतिदर्श <math>\xi^1,\dots,\xi^N</math> है। इस यादृच्छिक प्रतिदर्श को <math>\xi</math> के <math>N</math> प्रेक्षणों को ऐतिहासिक आँकड़े के रूप में देखा जा सकता है, या इसे मोंटे कार्लो प्रतिरूपण तकनीकों द्वारा उत्पन्न किया जा सकता है। तब हम एक संगत ''प्रतिदर्श औसत सन्निकटन'' सूत्रित कर सकते हैं


<div वर्ग = केंद्र शैली = चौड़ाई: ऑटो; मार्जिन-लेफ्ट: ऑटो; मार्जिन-राइट: ऑटो; ><math>
<div वर्ग = केंद्र शैली = चौड़ाई: ऑटो; मार्जिन-लेफ्ट: ऑटो; मार्जिन-राइट: ऑटो; ><math>
Line 131: Line 126:
</math></div>
</math></div>


बड़ी संख्या के कानून के अनुसार हमारे पास कुछ नियमितता शर्तों के तहत है <math>\frac{1}{N} \sum_{j=1}^N Q(x,\xi^j)</math> प्रायिकता 1 से बिंदुवार अभिसरित होता है <math>E[Q(x,\xi)]</math> जैसा <math>N \rightarrow \infty</math>. इसके अलावा, हल्के अतिरिक्त परिस्थितियों में अभिसरण एक समान है। हमारे पास भी है <math>E[\hat{g}_N(x)]=g(x)</math>, अर्थात।, <math>\hat{g}_N(x)</math> का निष्पक्ष आकलनकर्ता है <math>g(x)</math>. इसलिए, यह उम्मीद करना स्वाभाविक है कि SAA समस्या का इष्टतम मूल्य और इष्टतम समाधान वास्तविक समस्या के अपने समकक्षों के साथ अभिसरण करते हैं क्योंकि <math>N \rightarrow \infty</math>.
वृहत संख्या सिद्धांत के अनुसार हमें ज्ञात है कि, <math>\frac{1}{N} \sum_{j=1}^N Q(x,\xi^j)</math>, कुछ नियमितता शर्तों के तहत प्रायिकता 1 के साथ <math>E[Q(x,\xi)]</math> तक बिंदुवार अभिसरित होता है, क्योंकि <math>N \rightarrow \infty</math>।इसके अतिरिक्त, मंद अतिरिक्त परिस्थितियों में अभिसरण एक समान है। हमारे पास <math>E[\hat{g}_N(x)]=g(x)</math> भी है, अर्थात्, <math>\hat{g}_N(x)</math>, <math>g(x)</math> का एक ''अनभिनत'' आंकलक है। इसलिए, यह आशा करना स्वाभाविक है कि एसएए समस्या का इष्टतम मान और इष्टतम हल वास्तविक समस्या के अपने समतुल्यों के साथ अभिसरण करते हैं क्योंकि <math>N \rightarrow \infty</math>


=== एसएए अनुमानकों की संगति ===
=== एसएए आंकलकों की संगतता ===


संभव सेट मान लीजिए <math>X</math> SAA समस्या का समाधान निश्चित है, अर्थात यह नमूने से स्वतंत्र है। होने देना <math>\vartheta^*</math> और <math>S^*</math> वास्तविक समस्या का क्रमशः इष्टतम मूल्य और इष्टतम समाधान का सेट हो और चलो <math>\hat{\vartheta}_N</math> और <math>\hat{S}_N</math> SAA समस्या का क्रमशः इष्टतम मूल्य और इष्टतम समाधान का सेट हो।
माना एसएए समस्या का सुसंगत समुच्चय <math>X</math> नियत है, अर्थात् यह प्रतिदर्श से स्वतंत्र है। माना <math>\vartheta^*</math> और <math>S^*</math>, क्रमशः वास्तविक समस्या के इष्टतम मान और इष्टतम हलों का समुच्चय है और माना <math>\hat{\vartheta}_N</math> और <math>\hat{S}_N</math>, क्रमशः एसएए समस्या के इष्टतम मान और इष्टतम हलों का समुच्चय है।


# होने देना <math>g: X \rightarrow \mathbb{R}</math> और <math>\hat{g}_N: X \rightarrow \mathbb{R}</math> (नियतात्मक) वास्तविक मूल्यवान कार्यों का एक क्रम हो। निम्नलिखित दो गुण समतुल्य हैं:
# माना <math>g: X \rightarrow \mathbb{R}</math> और <math>\hat{g}_N: X \rightarrow \mathbb{R}</math> (निर्धारणात्मक) वास्तविक मान फलनों का एक अनुक्रम है। निम्नलिखित दो गुण समतुल्य हैं:
#* किसी के लिए <math>\overline{x}\in X</math> और कोई अनुक्रम <math>\{x_N\}\subset X</math> में अभिसरण <math>\overline{x}</math> यह इस प्रकार है कि <math>\hat{g}_N(x_N)</math> में विलीन हो जाता है <math>g(\overline{x})</math>
#* किसी <math>\overline{x}\in X</math> और <math>\overline{x}</math> में अभिसरित किसी अनुक्रम <math>\{x_N\}\subset X</math> के लिए, यह इस प्रकार है कि <math>\hat{g}_N(x_N)</math>, <math>g(\overline{x})</math> में अभिसरित होता है
#* कार्यक्रम <math>g(\cdot)</math> निरंतर चालू है <math>X</math> और <math>\hat{g}_N(\cdot)</math> में विलीन हो जाता है <math>g(\cdot)</math> के किसी भी कॉम्पैक्ट सबसेट पर समान रूप से <math>X</math>
#* फलन <math>g(\cdot)</math>, <math>X</math> पर सतत है और <math>\hat{g}_N(\cdot)</math>, <math>X</math> के किसी सघन उपसमुच्चय पर <math>g(\cdot)</math> पर समान रूप से अभिसरित होता है
# यदि SAA समस्या का उद्देश्य <math>\hat{g}_N(x)</math> वास्तविक समस्या के उद्देश्य में परिवर्तित हो जाता है <math>g(x)</math> संभाव्यता 1 के साथ, जैसा <math>N \rightarrow \infty</math>, समान रूप से व्यवहार्य सेट पर <math>X</math>. तब <math>\hat{\vartheta}_N</math> में विलीन हो जाता है <math>\vartheta^*</math> प्रायिकता 1 के रूप में <math>N \rightarrow \infty</math>.
# यदि एसएए समस्या का उद्देश्य <math>\hat{g}_N(x)</math>, सुसंगत समुच्चय <math>X</math> पर समान रूप से प्रायिकता 1 वाली वास्तविक समस्या के उद्देश्य <math>g(x)</math> में अभिसरित होता है, क्योंकि <math>N \rightarrow \infty</math>तब <math>\hat{\vartheta}_N</math>, प्रायिकता 1 वाले <math>\vartheta^*</math> में अभिसरित होता है, क्योंकि <math>N \rightarrow \infty</math>
# मान लीजिए कि एक कॉम्पैक्ट सेट मौजूद है <math>C \subset \mathbb{R}^n</math> ऐसा है कि
# माना एक ऐसे सघन समुच्चय <math>C \subset \mathbb{R}^n</math> का अस्तित्व है कि
#* सेट <math>S</math> वास्तविक समस्या का इष्टतम समाधान रिक्त नहीं है और इसमें निहित है <math>C</math>
#* वास्तविक समस्या के इष्टतम हलों का समुच्चय <math>S</math> अरिक्त है और <math>C</math> में निहित है
#* कार्यक्रम <math>g(x)</math> परिमित मूल्यवान और निरंतर है <math>C</math>
#* <math>g(x)</math> परिमित मान फलन है और <math>C</math> पर सतत है
#* कार्यों का क्रम <math>\hat{g}_N(x)</math> में विलीन हो जाता है <math>g(x)</math> संभाव्यता 1 के साथ, जैसा <math>N \rightarrow \infty</math>, समान रूप से <math>x\in C</math>
#* फलनों का अनुक्रम <math>\hat{g}_N(x)</math>, <math>x\in C</math> में समान रूप से प्रायिकता 1 के साथ <math>g(x)</math> में अभिसरित होता है, क्योंकि <math>N \rightarrow \infty</math>  
#* के लिए <math>N</math> काफी बड़ा सेट <math>\hat{S}_N</math> खाली नहीं है और <math>\hat{S}_N \subset C</math> संभाव्यता 1 के साथ
#* <math>N</math> के लिए काफी बड़ा समुच्चय <math>\hat{S}_N</math> अरिक्त है और प्रायिकता 1 के साथ <math>\hat{S}_N \subset C</math>
:: तब <math>\hat{\vartheta}_N \rightarrow \vartheta^*</math> और <math>\mathbb{D}(S^*,\hat{S}_N)\rightarrow 0 </math> प्रायिकता 1 के रूप में <math>N\rightarrow \infty </math>. ध्यान दें कि <math>\mathbb{D}(A,B) </math> सेट के विचलन को दर्शाता है <math>A</math> सेट से <math>B</math>, के रूप में परिभाषित
:: तब प्रायिकता 1 के साथ <math>\hat{\vartheta}_N \rightarrow \vartheta^*</math> और <math>\mathbb{D}(S^*,\hat{S}_N)\rightarrow 0 </math> क्योंकि <math>N\rightarrow \infty </math>ध्यान दें कि <math>\mathbb{D}(A,B) </math>, समुच्चय <math>A</math> के समुच्चय <math>B</math> से विचलन को दर्शाता है, जो इस प्रकार परिभाषित है
 
::<math>
<div वर्ग = केंद्र शैली = चौड़ाई: ऑटो; मार्जिन-लेफ्ट: ऑटो; मार्जिन-राइट: ऑटो; ><math>
\mathbb{D}(A,B) := \sup_{x\in A} \{ \inf_{x' \in B} \|x-x'\| \}
\mathbb{D}(A,B) := \sup_{x\in A} \{ \inf_{x' \in B} \|x-x'\| \}
</math></div>
</math>


कुछ स्थितियों में व्यवहार्य सेट <math>X</math> SAA समस्या का अनुमान लगाया जाता है, तो संबंधित SAA समस्या का रूप ले लेती है
कुछ स्थितियों में एसएए समस्या के सुसंगत समुच्चय <math>X</math> का इष्टतमीकरण किया गया है, तो संगत एसएए समस्या निम्न रूप ग्रहण करती है


<div वर्ग = केंद्र शैली = चौड़ाई: ऑटो; मार्जिन-लेफ्ट: ऑटो; मार्जिन-राइट: ऑटो; ><math>
<div वर्ग = केंद्र शैली = चौड़ाई: ऑटो; मार्जिन-लेफ्ट: ऑटो; मार्जिन-राइट: ऑटो; ><math>
Line 158: Line 152:
</math></div>
</math></div>


कहाँ <math>X_N</math> का उपसमुच्चय है <math>\mathbb{R}^n</math> नमूने के आधार पर और इसलिए यादृच्छिक है। फिर भी, SAA आकलनकर्ताओं के लिए निरंतरता परिणाम अभी भी कुछ अतिरिक्त धारणाओं के तहत प्राप्त किए जा सकते हैं:
जहाँ <math>X_N</math>, प्रतिदर्श के आधार पर <math>\mathbb{R}^n</math> का उपसमुच्चय है और इसलिए यादृच्छिक है। फिर भी, एसएए आंकलकों के लिए निसंगतता परिणाम, अभी भी कुछ अतिरिक्त धारणाओं के तहत प्राप्त किए जा सकते हैं:
# मान लीजिए कि एक कॉम्पैक्ट सेट मौजूद है <math>C \subset \mathbb{R}^n</math> ऐसा है कि
# माना एक ऐसे सघन समुच्चय <math>C \subset \mathbb{R}^n</math> का अस्तित्व है कि
#* सेट <math>S</math> वास्तविक समस्या का इष्टतम समाधान रिक्त नहीं है और इसमें निहित है <math>C</math>
#* वास्तविक समस्या के इष्टतम हलों का समुच्चय <math>S</math> अरिक्त है और <math>C</math> में निहित है
#* कार्यक्रम <math>g(x)</math> परिमित मूल्यवान और निरंतर है <math>C</math>
#*<math>g(x)</math> परिमित मान फलन है और <math>C</math> पर सतत है
#* कार्यों का क्रम <math>\hat{g}_N(x)</math> में विलीन हो जाता है <math>g(x)</math> संभाव्यता 1 के साथ, जैसा <math>N \rightarrow \infty</math>, समान रूप से <math>x\in C</math>
#* फलनों का अनुक्रम <math>\hat{g}_N(x)</math>, <math>x\in C</math> में समान रूप से प्रायिकता 1 के साथ <math>g(x)</math> में अभिसरित होता है, क्योंकि <math>N \rightarrow \infty</math>  
#* के लिए <math>N</math> काफी बड़ा सेट <math>\hat{S}_N</math> खाली नहीं है और <math>\hat{S}_N \subset C</math> संभाव्यता 1 के साथ
#* <math>N</math> के लिए काफी बड़ा समुच्चय <math>\hat{S}_N</math> अरिक्त है और प्रायिकता 1 के साथ <math>\hat{S}_N \subset C</math>
#* अगर <math> x_N \in X_N</math> और <math> x_N </math> प्रायिकता 1 के साथ एक बिंदु पर अभिसरित होता है <math> x</math>, तब <math> x \in X</math>
#* यदि <math> x_N \in X_N</math> और <math> x_N </math> प्रायिकता 1 के साथ एक बिंदु <math> x</math> पर अभिसरित होता है, तब <math> x \in X</math>
#* कुछ बिंदु के लिए <math> x \in S^*</math> एक क्रम होता है <math> x_N \in X_N</math> ऐसा है कि <math> x_N \rightarrow x</math> संभाव्यता 1 के साथ।
#* कुछ बिंदुओं <math> x \in S^*</math> के लिए, एक ऐसे अनुक्रम <math> x_N \in X_N</math>का अस्तित्व है कि प्रायिकता 1 के साथ <math> x_N \rightarrow x</math>
:: तब <math>\hat{\vartheta}_N \rightarrow \vartheta^*</math> और <math>\mathbb{D}(S^*,\hat{S}_N)\rightarrow 0 </math> प्रायिकता 1 के रूप में <math>N\rightarrow \infty </math>.
:: तब प्रायिकता 1 के साथ <math>\hat{\vartheta}_N \rightarrow \vartheta^*</math> और <math>\mathbb{D}(S^*,\hat{S}_N)\rightarrow 0 </math>, क्योंकि <math>N\rightarrow \infty </math>


=== एसएए इष्टतम मूल्य === के स्पर्शोन्मुख
=== एसएए इष्टतम मान के उपगमन ===
माना प्रतिदर्श <math>\xi^1,\dots,\xi^N</math> आई.आई.डी. है और एक बिंदु <math>x \in X</math> को नियत करता है। फिर <math>g(x)</math> का प्रतिदर्श औसत आंकलक <math>\hat{g}_N(x)</math>, अनभिनत है और इसका विचरण <math>\frac{1}{N}\sigma^2(x)</math> है, जहाँ <math>\sigma^2(x):=Var[Q(x,\xi)]</math> परिमित माना जाता है। इसके अतिरिक्त, [[केंद्रीय सीमा प्रमेय]] द्वारा हमारे पास निम्न है


मान लीजिए नमूना <math>\xi^1,\dots,\xi^N</math> आई.आई.डी. और एक बिंदु तय करें <math>x \in X</math>. फिर नमूना औसत अनुमानक <math>\hat{g}_N(x)</math>, का <math>g(x)</math>, निष्पक्ष है और इसमें विचरण है <math>\frac{1}{N}\sigma^2(x)</math>, कहाँ <math>\sigma^2(x):=Var[Q(x,\xi)]</math> परिमित माना जाता है। इसके अलावा, [[केंद्रीय सीमा प्रमेय]] द्वारा हमारे पास वह है
<div वर्ग="केंद्र" शैली="चौड़ाई:" ऑटो; मार्जिन-लेफ्ट: मार्जिन-राइट:><math>
 
<div वर्ग = केंद्र शैली = चौड़ाई: ऑटो; मार्जिन-लेफ्ट: ऑटो; मार्जिन-राइट: ऑटो; ><math>
\sqrt{N} [\hat{g}_N-  g(x)] \xrightarrow{\mathcal{D}} Y_x
\sqrt{N} [\hat{g}_N-  g(x)] \xrightarrow{\mathcal{D}} Y_x
</math></div>
</math></div>


कहाँ <math>\xrightarrow{\mathcal{D}}</math> वितरण में अभिसरण को दर्शाता है और <math>Y_x</math> माध्य के साथ एक सामान्य वितरण है <math>0</math> और विचरण <math>\sigma^2(x)</math>, के रूप में लिखा गया है <math>\mathcal{N}(0,\sigma^2(x))</math>.
जहाँ <math>\xrightarrow{\mathcal{D}}</math> बंटन में अभिसरण को दर्शाता है और <math>Y_x</math> में माध्य <math>0</math> और विचरण <math>\sigma^2(x)</math> वाला एक अभिलम्ब बंटन है, जिसे <math>\mathcal{N}(0,\sigma^2(x))</math> के रूप में लिखा गया है।


दूसरे शब्दों में, <math>\hat{g}_N(x)</math> विषम रूप से सामान्य वितरण है, यानी, बड़े के लिए <math>N</math>, <math>\hat{g}_N(x)</math> माध्य के साथ लगभग सामान्य वितरण है <math>g(x)</math> और विचरण <math>\frac{1}{N}\sigma^2(x)</math>. यह निम्नलिखित (अनुमानित) की ओर जाता है <math>100(1-\alpha)</math>के लिए % विश्वास अंतराल <math>f(x)</math>:
दूसरे शब्दों में, <math>\hat{g}_N(x)</math> ''उपगामी अभिलम्ब बंटन'' है, अर्थात्, बड़े <math>N</math> के लिए, <math>\hat{g}_N(x)</math> में माध्य <math>g(x)</math> और विचरण <math>\frac{1}{N}\sigma^2(x)</math> वाला लगभग अभिलम्ब बंटन है। यह <math>f(x)</math> के लिए निम्न (अनुमानित) <math>100(1-\alpha)</math> % विश्वास्यता अंतराल की ओर जाता है:


<div वर्ग = केंद्र शैली = चौड़ाई: ऑटो; मार्जिन-लेफ्ट: ऑटो; मार्जिन-राइट: ऑटो; > <math>
<div वर्ग="केंद्र" शैली="चौड़ाई:" ऑटो; मार्जिन-लेफ्ट: मार्जिन-राइट:> <math>
\left[ \hat{g}_N(x)-z_{\alpha/2} \frac{\hat{\sigma}(x)}{\sqrt{N}}, \hat{g}_N(x)+z_{\alpha/2} \frac{\hat{\sigma}(x)}{\sqrt{N}}\right]
\left[ \hat{g}_N(x)-z_{\alpha/2} \frac{\hat{\sigma}(x)}{\sqrt{N}}, \hat{g}_N(x)+z_{\alpha/2} \frac{\hat{\sigma}(x)}{\sqrt{N}}\right]
</math></div>
</math></div>


कहाँ <math>z_{\alpha/2}:=\Phi^{-1}(1-\alpha/2)</math> (यहाँ <math>\Phi(\cdot)</math> मानक सामान्य वितरण के सीडीएफ को दर्शाता है) और
जहाँ <math>z_{\alpha/2}:=\Phi^{-1}(1-\alpha/2)</math> (यहाँ <math>\Phi(\cdot)</math> मानक अभिलम्ब वितरण के सीडीएफ को दर्शाता है) और


<div वर्ग = केंद्र शैली = चौड़ाई: ऑटो; मार्जिन-लेफ्ट: ऑटो; मार्जिन-राइट: ऑटो; ><math>
<div वर्ग="केंद्र" शैली="चौड़ाई:" ऑटो; मार्जिन-लेफ्ट: मार्जिन-राइट:><math>
\hat{\sigma}^2(x) := \frac{1}{N-1}\sum_{j=1}^{N} \left[ Q(x,\xi^j)-\frac{1}{N} \sum_{j=1}^N Q(x,\xi^j) \right]^2
\hat{\sigma}^2(x) := \frac{1}{N-1}\sum_{j=1}^{N} \left[ Q(x,\xi^j)-\frac{1}{N} \sum_{j=1}^N Q(x,\xi^j) \right]^2
</math></div>
</math></div>


का नमूना प्रसरण अनुमान है <math>\sigma^2(x)</math>. यानी के आकलन में त्रुटि <math>g(x)</math> आदेश का (संकीर्ण रूप से) है <math> O(\sqrt{N})</math>.
<math>\sigma^2(x)</math> का प्रतिदर्श प्रसरण आंकलन है। अर्थात् <math>g(x)</math> के आंकलन की त्रुटि (स्टोकेस्टिक रूप से) <math> O(\sqrt{N})</math> कोटि की है।


== अनुप्रयोग और उदाहरण ==
== अनुप्रयोग और उदाहरण ==


=== जैविक अनुप्रयोग ===
=== जैविक अनुप्रयोग ===
[[स्टोचैस्टिक गतिशील प्रोग्रामिंग]] का उपयोग व्यवहारिक पारिस्थितिकी जैसे क्षेत्रों में नैतिकता को मॉडल करने के लिए अक्सर किया जाता है।<ref>Mangel, M. & Clark, C. W. 1988. ''Dynamic modeling in behavioral ecology.'' Princeton University Press {{ISBN|0-691-08506-4}}</ref><ref>Houston, A. I & McNamara, J. M. 1999. ''Models of adaptive behaviour: an approach based on state''. Cambridge University Press {{ISBN|0-521-65539-0}}</ref> [[इष्टतम फोर्जिंग सिद्धांत]] के मॉडल के अनुभवजन्य परीक्षण, [[जैविक जीवन चक्र]] | जीवन-इतिहास संक्रमण जैसे कि [[परजीवी]] ततैया में [[कलियाना]] और अंडे देना व्यवहारिक निर्णय लेने के विकास की व्याख्या करने में इस मॉडलिंग तकनीक के मूल्य को दर्शाता है। ये मॉडल आम तौर पर दो चरणों के बजाय कई चरणों वाले होते हैं।
व्यावहारिक पारिस्थितिकी जैसे क्षेत्रों में पशुओं के व्यवहार को प्रतिरूपित करने के लिए प्रायः [[स्टोचैस्टिक गतिशील प्रोग्रामिंग|स्टोकेस्टिक गतिशील प्रोग्रामिंग]] का उपयोग किया जाता है।<ref>Mangel, M. & Clark, C. W. 1988. ''Dynamic modeling in behavioral ecology.'' Princeton University Press {{ISBN|0-691-08506-4}}</ref><ref>Houston, A. I & McNamara, J. M. 1999. ''Models of adaptive behaviour: an approach based on state''. Cambridge University Press {{ISBN|0-521-65539-0}}</ref> [[इष्टतम फोर्जिंग सिद्धांत|इष्टतम फोरेजिंग (चारे की तलाश)]], पक्षियों में [[कलियाना|उड़ने]] और [[परजीवी]] ततैयों में अंडे देने जैसे [[जैविक जीवन चक्र]] संक्रमणों के आनुभविक परीक्षण व्यवहारिक निर्णय लेने के विकास की व्याख्या करने में इस मॉडलिंग तकनीक के महत्व को दर्शाते हैं। ये मॉडल सामान्यतः दो चरणों के स्थान कई चरणों वाले होते हैं।


=== आर्थिक अनुप्रयोग ===
=== आर्थिक अनुप्रयोग ===
अनिश्चितता के तहत निर्णय लेने को समझने में स्टोकेस्टिक डायनेमिक प्रोग्रामिंग एक उपयोगी उपकरण है। अनिश्चितता के तहत पूंजीगत स्टॉक का संचय एक उदाहरण है; अक्सर इसका उपयोग संसाधन अर्थशास्त्रियों द्वारा निकोलस जॉर्जस्कु-रोगेन#मैन27 के आर्थिक संघर्ष और मानव जाति के सामाजिक विकास का विश्लेषण करने के लिए किया जाता है।28जैव अर्थशास्त्र।29<ref>Howitt, R., Msangi, S., Reynaud, A and K. Knapp. 2002. [http://www.agecon.ucdavis.edu/aredepart/facultydocs/Howitt/Polyapprox3a.pdf "Using Polynomial Approximations to Solve Stochastic Dynamic Programming Problems: or A "Betty Crocker " Approach to SDP."]  University of California, Davis, Department of Agricultural and Resource Economics Working Paper.</ref> जहां अनिश्चितता प्रवेश करती है जैसे कि मौसम आदि।
स्टोकेस्टिक गतिमान प्रोग्रामिंग, अनिश्चितता के तहत निर्णय लेने की समझ में एक उपयोगी उपकरण है। अनिश्चितता के तहत पूँजीगत भण्डार का संचय इसका एक उदाहरण है; इसका उपयोग प्रायः संसाधन अर्थशास्त्रियों द्वारा जैव आर्थिक समस्याओं का विश्लेषण करने के लिए किया जाता है<ref>Howitt, R., Msangi, S., Reynaud, A and K. Knapp. 2002. [http://www.agecon.ucdavis.edu/aredepart/facultydocs/Howitt/Polyapprox3a.pdf "Using Polynomial Approximations to Solve Stochastic Dynamic Programming Problems: or A "Betty Crocker " Approach to SDP."]  University of California, Davis, Department of Agricultural and Resource Economics Working Paper.</ref> जहाँ मौसम आदि में अनिश्चितता प्रवेश करती है।


=== उदाहरण: मल्टीस्टेज पोर्टफोलियो अनुकूलन ===
=== उदाहरण: बहुचरणीय पोर्टफोलियो अनुकूलन ===
{{Main|Intertemporal portfolio choice}}
{{Main|अंतर्कालिक पोर्टफोलियो चयन}}
{{See also|Merton's portfolio problem}}
{{See also|मर्टन की पोर्टफोलियो समस्या}}
निम्नलिखित मल्टी-स्टेज स्टोकेस्टिक प्रोग्रामिंग के वित्त से एक उदाहरण है।
मान लीजिए कि समय पर <math>t=0</math> हमारे पास प्रारंभिक पूंजी है <math>W_0</math> में निवेश करना <math>n</math> संपत्तियां। आगे मान लीजिए कि हमें समय-समय पर अपने पोर्टफोलियो को पुनर्संतुलित करने की अनुमति है <math>t=1,\dots,T-1</math> लेकिन इसमें अतिरिक्त नकदी डाले बिना। प्रत्येक अवधि में <math>t</math> हम वर्तमान धन के पुनर्वितरण के बारे में निर्णय लेते हैं <math>W_t</math> बिच में <math>n</math> संपत्तियां। होने देना <math>x_0=(x_{10},\dots,x_{n0})</math> एन संपत्ति में निवेश की गई प्रारंभिक राशि हो। हम चाहते हैं कि प्रत्येक <math>x_{i0}</math> अऋणात्मक है और वह संतुलन समीकरण है <math>\sum_{i=1}^{n}x_{i0}=W_0</math> धारण करना चाहिए।


कुल रिटर्न पर विचार करें <math>\xi_t=(\xi_{1t},\dots,\xi_{nt})</math> प्रत्येक अवधि के लिए <math>t=1,\dots,T</math>. यह एक वेक्टर-मूल्यवान यादृच्छिक प्रक्रिया बनाता है <math>\xi_1,\dots,\xi_T</math>. समय अवधि में <math>t=1</math>, हम राशियों को निर्दिष्ट करके पोर्टफोलियो को पुनर्संतुलित कर सकते हैं <math>x_1=(x_{11},\dots,x_{n1})</math> संबंधित संपत्तियों में निवेश किया। उस समय पहली अवधि में रिटर्न का एहसास हो गया है, इसलिए इस जानकारी का उपयोग पुनर्संतुलन निर्णय में करना उचित है। इस प्रकार, दूसरे चरण के फैसले, समय पर <math>t=1</math>, वास्तव में यादृच्छिक वेक्टर की प्राप्ति के कार्य हैं <math>\xi_1</math>, अर्थात।, <math>x_1=x_1(\xi_1)</math>. इसी तरह, समय पर <math>t</math> निर्णय <math>x_t=(x_{1t},\dots,x_{nt})</math> एक कार्य है <math>x_t=x_t(\xi_{[t]})</math> द्वारा उपलब्ध कराई गई जानकारी के अनुसार <math>\xi_{[t]}=(\xi_{1},\dots,\xi_{t})</math> समय-समय पर यादृच्छिक प्रक्रिया का इतिहास <math>t</math>. कार्यों का एक क्रम <math>x_t=x_t(\xi_{[t]})</math>, <math>t=0,\dots,T-1</math>, साथ <math>x_0</math> स्थिर होने के नाते, निर्णय प्रक्रिया की कार्यान्वयन योग्य नीति को परिभाषित करता है। ऐसा कहा जाता है कि ऐसी नीति संभव है यदि यह संभावना 1 के साथ मॉडल की कमी को पूरा करती है, यानी गैर-नकारात्मकता की कमी <math>x_{it}(\xi_{[t]})\geq 0</math>, <math>i=1,\dots,n</math>, <math>t=0,\dots,T-1</math>, और धन की कमी का संतुलन,
निम्न उदाहरण बहु-चरणीय स्टोकेस्टिक प्रोग्रामिंग के वित्त से एक निम्न उदाहरण है। माना समय <math>t=0</math> पर, <math>n</math> संपत्तियों पर निवेश करने के लिए हमारे पास प्रारंभिक पूँजी <math>W_0</math> है। आगे माना कि हमें समय <math>t=1,\dots,T-1</math> पर अपने पोर्टफोलियो को अतिरिक्त नकदी डाले बिना पुनर्संतुलित करने की अनुमति है। प्रत्येक अवधि <math>t</math> में हम वर्तमान धन <math>W_t</math> के <math>n</math> संपत्तियों में पुनर्वितरण के बारे में निर्णय लेते हैं। माना <math>x_0=(x_{10},\dots,x_{n0})</math>, n संपत्तियों में निवेश की गई प्रारंभिक राशि है। हमें आवश्यकता है कि प्रत्येक <math>x_{i0}</math> गैर-ऋणात्मक हो और संतुलन समीकरण <math>\sum_{i=1}^{n}x_{i0}=W_0</math> सत्य होना चाहिए।
 
प्रत्येक अवधि <math>t=1,\dots,T</math> के लिएक, ुल प्रतिफल <math>\xi_t=(\xi_{1t},\dots,\xi_{nt})</math> पर विचार करें। यह एक सदिश-मान यादृच्छिक प्रक्रिया <math>\xi_1,\dots,\xi_T</math> का निर्माण करता है। समयावधि <math>t=1</math> में, हम संगत संपत्तियों में निविष्ट राशियों <math>x_1=(x_{11},\dots,x_{n1})</math> को निर्दिष्ट करके पोर्टफोलियो को पुनर्संतुलित कर सकते हैं। उस समय पहली अवधि में प्रतिफल की प्राप्ति हो गयी है, इसलिए इस जानकारी का उपयोग पुनर्संतुलन निर्णय में करना उचित है। इस प्रकार, मय <math>t=1</math> पर द्वितीय चरण के निर्णय,वास्तव में यादृच्छिक सदिश <math>\xi_1</math> की प्राप्ति के फलन हैं, अर्थात्, <math>x_1=x_1(\xi_1)</math>इसी प्रकार, समय <math>t</math> पर निर्णय <math>x_t=(x_{1t},\dots,x_{nt})</math>, <math>x_t=x_t(\xi_{[t]})</math>, समय <math>t</math> तक यादृच्छिक प्रक्रिया के इतिहास <math>\xi_{[t]}=(\xi_{1},\dots,\xi_{t})</math> द्वारा दी गयी उपलब्ध जानकारी का एक फलन है। फलनों <math>x_t=x_t(\xi_{[t]})</math>, <math>t=0,\dots,T-1</math> का एक अनुक्रम, जिसमें <math>x_0</math> स्थिर है, निर्णय प्रक्रिया की ''कार्यान्वयन योग्य नीति'' को परिभाषित करता है। ऐसा कहा जाता है कि ऐसी नीति ''सुसंगत'' होती है यदि यह प्रायिकता 1 वाले मॉडल के व्यवरोधों, अर्थात् गैर-ऋणात्मकता व्यवरोध <math>x_{it}(\xi_{[t]})\geq 0</math>, <math>i=1,\dots,n</math>, <math>t=0,\dots,T-1</math>, को संतुष्ट करती है, और धन व्यवरोधों का संतुलन निम्न है,


:<math>
:<math>
\sum_{i=1}^{n}x_{it}(\xi_{[t]}) = W_t,
\sum_{i=1}^{n}x_{it}(\xi_{[t]}) = W_t,
</math>
</math>
जहां अवधि में <math>t=1,\dots,T</math> धन <math>W_t</math> द्वारा दिया गया है
जहाँ अवधि <math>t=1,\dots,T</math> में धन <math>W_t</math> निम्न द्वारा दिया गया है


:<math>
:<math>
W_t = \sum_{i=1}^{n}\xi_{it} x_{i,t-1}(\xi_{[t-1]}),
W_t = \sum_{i=1}^{n}\xi_{it} x_{i,t-1}(\xi_{[t-1]}),
</math>
</math>
जो यादृच्छिक प्रक्रिया की प्राप्ति और समय तक के निर्णयों पर निर्भर करता है <math>t</math>.
जो यादृच्छिक प्रक्रिया की प्राप्ति और समय <math>t</math> तक के निर्णयों पर निर्भर करता है।


मान लीजिए कि उद्देश्य अंतिम अवधि में इस धन की अपेक्षित उपयोगिता को अधिकतम करना है, अर्थात समस्या पर विचार करना
माना इसका उद्देश्य अंतिम अवधि में इस धन की प्रत्याशित उपयोगिता को अधिकतम करना है, अर्थात् निम्न समस्या पर विचार करने पर


:<math>
:<math>
\max E[U(W_T)].
\max E[U(W_T)].
</math>
</math>
यह एक मल्टीस्टेज स्टोचैस्टिक प्रोग्रामिंग समस्या है, जहाँ से चरणों को क्रमांकित किया जाता है <math>t=0</math> को <math>t=T-1</math>. अनुकूलन सभी कार्यान्वयन योग्य और व्यवहार्य नीतियों पर किया जाता है। समस्या के विवरण को पूरा करने के लिए किसी को भी यादृच्छिक प्रक्रिया के संभाव्यता वितरण को परिभाषित करने की आवश्यकता होती है <math>\xi_1,\dots,\xi_T</math>. यह विभिन्न तरीकों से किया जा सकता है। उदाहरण के लिए, प्रक्रिया के समय के विकास को परिभाषित करने वाला एक विशेष परिदृश्य वृक्ष का निर्माण कर सकता है। यदि प्रत्येक स्तर पर प्रत्येक परिसंपत्ति के यादृच्छिक रिटर्न को दो निरंतरताओं की अनुमति दी जाती है, अन्य संपत्तियों से स्वतंत्र, तो परिदृश्यों की कुल संख्या है <math>2^{nT}.</math>
यह एक बहुचरणीय स्टोकेस्टिक प्रोग्रामिंग समस्या है, जहाँ चरणों को <math>t=0</math> से <math>t=T-1</math> तक क्रमांकित किया जाता है। अनुकूलन सभी कार्यान्वयन योग्य और सुसंगत नीतियों पर किया जाता है। समस्या के विवरण को पूरा करने के लिए यादृच्छिक प्रक्रिया के प्रायिकता बंटन <math>\xi_1,\dots,\xi_T</math> को परिभाषित करने की आवश्यकता होती है। यह विभिन्न विधियों से किया जा सकता है। उदाहरण के लिए, प्रक्रिया के समय के विकास को परिभाषित करने वाले एक विशेष परिदृश्य वृक्ष का निर्माण किया जा सकता है। यदि प्रत्येक स्तर पर प्रत्येक परिसंपत्ति के यादृच्छिक प्रतिफल को अन्य संपत्तियों से स्वतंत्र दो सततताओं की अनुमति दी जाती है, तो परिदृश्यों की कुल संख्या <math>2^{nT}.</math> होती है।}
[[गतिशील प्रोग्रामिंग]] समीकरण लिखने के लिए, उपरोक्त मल्टीस्टेज समस्या को समय में पिछड़ने पर विचार करें। अंतिम चरण में <math>t=T-1</math>, एक अहसास <math>\xi_{[T-1]}=(\xi_{1},\dots,\xi_{T-1})</math> यादृच्छिक प्रक्रिया ज्ञात है और <math>x_{T-2}</math> चुना गया है। इसलिए, निम्नलिखित समस्या को हल करने की आवश्यकता है
 
[[गतिशील प्रोग्रामिंग]] समीकरणों को लिखने के लिए, उपरोक्त बहुचरणीय समस्या के पश्च समय पर विचार करें। अंतिम चरण <math>t=T-1</math> में, यादृच्छिक प्रक्रिया का एक प्रतिफल <math>\xi_{[T-1]}=(\xi_{1},\dots,\xi_{T-1})</math> ज्ञात है और <math>x_{T-2}</math> का चयन किया गया है। इसलिए, निम्नलिखित समस्या को हल करने की आवश्यकता होती है


:<math>
:<math>
Line 234: Line 228:
\end{array}
\end{array}
</math>
</math>
कहाँ <math>E[U(W_T)|\xi_{[T-1]}]</math> की सशर्त अपेक्षा को दर्शाता है <math>U(W_T)</math> दिया गया <math>\xi_{[T-1]}</math>. उपरोक्त समस्या का इष्टतम मूल्य इस पर निर्भर करता है <math>W_{T-1}</math> और <math>\xi_{[T-1]}</math> और निरूपित किया जाता है <math>Q_{T-1}(W_{T-1},\xi_{[T-1]})</math>.
जहाँ <math>E[U(W_T)|\xi_{[T-1]}]</math> दिये गये <math>\xi_{[T-1]}</math> <math>U(W_T)</math> की सप्रतिबन्ध प्रत्याशा को दर्शाता है। उपरोक्त समस्या का इष्टतम मान <math>W_{T-1}</math> और <math>\xi_{[T-1]}</math> पर निर्भर करता है और <math>Q_{T-1}(W_{T-1},\xi_{[T-1]})</math> द्वारा निरूपित किया जाता है।


इसी तरह, चरणों में <math>t=T-2,\dots,1</math>, समस्या का समाधान करना चाहिए
इसी प्रकार, चरणों <math>t=T-2,\dots,1</math> में, निम्न समस्या को हल किया जाना चाहिए,


:<math>
:<math>
Line 246: Line 240:
\end{array}
\end{array}
</math>
</math>
जिसका इष्टतम मूल्य द्वारा निरूपित किया जाता है <math>Q_{t}(W_{t},\xi_{[t]})</math>. अंत में, मंच पर <math>t=0</math>, एक समस्या हल करता है
जिसका इष्टतम मान <math>Q_{t}(W_{t},\xi_{[t]})</math> द्वारा निरूपित किया जाता है। अंततः, चरण <math>t=0</math> पर, निम्न समस्या हल की जाती है


:<math>
:<math>
Line 256: Line 250:
\end{array}
\end{array}
</math>
</math>


==== चरणवार स्वतंत्र यादृच्छिक प्रक्रिया ====
==== चरणवार स्वतंत्र यादृच्छिक प्रक्रिया ====


प्रक्रिया के सामान्य वितरण के लिए <math>\xi_t</math>, इन गतिशील प्रोग्रामिंग समीकरणों को हल करना कठिन हो सकता है। यदि प्रक्रिया नाटकीय रूप से सरल हो जाती है <math>\xi_t</math> चरणवार स्वतंत्र है, अर्थात, <math>\xi_t</math> से स्वतंत्र है <math>\xi_1,\dots,\xi_{t-1}</math> के लिए <math>t=2,\dots,T</math>. इस मामले में, संबंधित सशर्त अपेक्षाएं बिना शर्त अपेक्षाएं और कार्य बन जाती हैं <math>Q_t(W_t)</math>, <math>t=1,\dots,T-1</math> पर निर्भर नहीं है <math>\xi_{[t]}</math>. वह है, <math>Q_{T-1}(W_{T-1})</math> समस्या का इष्टतम मूल्य है
प्रक्रिया <math>\xi_t</math> के सामान्य बंटन के लिए, इन गतिशील प्रोग्रामिंग समीकरणों को हल करना जटिल हो सकता है। यह स्थिति प्रभावशाली रूप से सरल हो जाती है, यदि प्रक्रिया <math>\xi_t</math> चरणवार स्वतंत्र है, अर्थात्, <math>\xi_t</math>, <math>t=2,\dots,T</math> के लिए <math>\xi_1,\dots,\xi_{t-1}</math> से स्वतंत्र है। इस स्थिति में, संगत सप्रतिबन्ध प्रत्याशाएँ, अप्रतिबंध प्रत्याशाएँ बन जाती हैं, और फलन <math>Q_t(W_t)</math>, <math>t=1,\dots,T-1</math>, <math>\xi_{[t]}</math> पर निर्भर नहीं करता है। अर्थात्, <math>Q_{T-1}(W_{T-1})</math>, समस्या का इष्टतम मान है


:<math>
:<math>
Line 270: Line 263:
\end{array}
\end{array}
</math>
</math>
और <math>Q_t(W_t)</math> का इष्टतम मूल्य है
और <math>Q_t(W_t)</math>, <math>t=T-2,\dots,1</math> के लिए निम्न का इष्टतम मान है


:<math>
:<math>
Line 280: Line 273:
\end{array}
\end{array}
</math>
</math>
के लिए <math>t=T-2,\dots,1</math>.
== सॉफ्टवेयर उपकरण ==
== सॉफ्टवेयर उपकरण ==


===मॉडलिंग भाषाएं===
===मॉडलिंग भाषाएँ===
सभी असतत स्टोकेस्टिक प्रोग्रामिंग समस्याओं को किसी भी [[बीजगणितीय मॉडलिंग भाषा]] के साथ प्रदर्शित किया जा सकता है, मैन्युअल रूप से स्पष्ट या निहित गैर-प्रत्याशाकता को लागू करने के लिए यह सुनिश्चित करने के लिए कि परिणामी मॉडल प्रत्येक चरण में उपलब्ध कराई गई जानकारी की संरचना का सम्मान करता है।
सभी असतत स्टोकेस्टिक प्रोग्रामिंग समस्याओं को किसी भी [[बीजगणितीय मॉडलिंग भाषा]] के साथ हस्तचालित रूप से स्पष्ट या निहित गैर-प्रत्याशात्मकता को लागू करने के लिए प्रदर्शित किया जा सकता है जिससे यह सुनिश्चित किया जा सके कि परिणामी मॉडल प्रत्येक चरण में उपलब्ध कराई गई जानकारी की संरचना की उपेक्षा नहीं करता है। किसी सामान्य मॉडलिंग भाषा द्वारा उत्पन्न एसपी समस्या का एक उदाहरण काफी बड़ा (रैखिक रूप से परिदृश्यों की संख्या में) हो जाता है, और इसका आव्यूह उस संरचना को खो देता है जो समस्याओं के इस वर्ग के लिए मौलिक है, जिसका लाभ अन्यथा विशिष्ट अपघटन एल्गोरिदम द्वारा हल समय पर लिया जा सकता है। विशेष रूप से एसपी के लिए संरचित की गई मॉडलिंग भाषाओं के विस्तार दिखाई देने लगे हैं, देखें:
एक सामान्य मॉडलिंग भाषा द्वारा उत्पन्न एक SP समस्या का एक उदाहरण काफी बड़ा हो जाता है (रैखिक रूप से परिदृश्यों की संख्या में), और इसका मैट्रिक्स उस संरचना को खो देता है जो समस्याओं के इस वर्ग के लिए आंतरिक है, जिसका समाधान समय पर अन्यथा शोषण किया जा सकता है विशिष्ट अपघटन एल्गोरिदम।
*[[एआईएमएमएस]] - एसपी समस्याओं की परिभाषा का समर्थन करती है
विशेष रूप से SP के लिए डिज़ाइन की गई मॉडलिंग भाषाओं के एक्सटेंशन दिखाई देने लगे हैं, देखें:
*ईएमपी एसपी (स्टोकेस्टिक प्रोग्रामिंग के लिए विस्तारित गणितीय प्रोग्रामिंग) - स्टोकेस्टिक प्रोग्रामिंग को सुविधाजनक बनाने के लिए जीएएमएस का एक मॉड्यूल बनाया गया है (इसमें प्राचल बंटन के लिए संकेत शब्द, अवसर व्यवरोध और जोखिम पर मान एवं [[अपेक्षित कमी|प्रत्याशित कमी]] जैसी जोखिम की माप सम्मिलित हैं)।
*[[एआईएमएमएस]] - एसपी समस्याओं की परिभाषा का समर्थन करता है
*[[एएमपीएल|एसएएमपीएल]] - एएमपीएल के विस्तार का एक समुच्चय विशेष रूप से स्टोकेस्टिक प्रोग्राम को व्यक्त करने के लिए संरचित किया गया है ( इसमें अवसर व्यवरोधों के लिए सिंटैक्स, एकीकृत अवसर व्यवरोध और [[मजबूत अनुकूलन|दृढ़ अनुकूलन]] समस्याएँ सम्मिलित हैं)
*विस्तारित गणितीय प्रोग्रामिंग (ईएमपी)#स्टोचैस्टिक प्रोग्रामिंग के लिए ईएमपी (स्टोचैस्टिक प्रोग्रामिंग के लिए विस्तारित गणितीय प्रोग्रामिंग) - सामान्य बीजगणितीय मॉडलिंग सिस्टम का एक मॉड्यूल जो स्टोचैस्टिक प्रोग्रामिंग की सुविधा के लिए बनाया गया है (इसमें पैरामीट्रिक वितरण के लिए कीवर्ड शामिल हैं, मौके की कमी और जोखिम के उपाय जैसे जोखिम पर मूल्य और [[अपेक्षित कमी]])।
ये दोनों एसएमपीएस उदाहरण तत्क्षण स्तर प्रारूप उत्पन्न कर सकते हैं, जो गैर-निरर्थक रूप में समस्या की संरचना को हलकर्ताओं तक पहुँचाता है।
*एस[[एएमपीएल]] - एएमपीएल के एक्सटेंशन का एक सेट विशेष रूप से स्टोकास्टिक प्रोग्राम व्यक्त करने के लिए डिज़ाइन किया गया है (मौका बाधाओं के लिए सिंटैक्स शामिल है, एकीकृत मौके की कमी और [[मजबूत अनुकूलन]] समस्याएं शामिल हैं)
वे दोनों SMPS उदाहरण स्तर प्रारूप उत्पन्न कर सकते हैं, जो सॉल्वर को समस्या की संरचना को गैर-निरर्थक रूप में बताता है।


== यह भी देखें ==
== यह भी देखें ==


* [[सहसंबंध अंतराल]]
* [[सहसंबंध अंतराल]]
* स्टोकेस्टिक प्रोग्रामिंग के लिए विस्तारित गणितीय प्रोग्रामिंग (ईएमपी)#ईएमपी
* स्टोकेस्टिक प्रोग्रामिंग के लिए विस्तारित गणितीय प्रोग्रामिंग (ईएमपी)
* [[जोखिम में एंट्रोपिक मूल्य]]
* [[जोखिम में एंट्रोपिक मूल्य|जोखिम में एंट्रोपिक मान]]
* [[ContSP]]
* [[ContSP|फोर्टएसपी]]
* एसएएमपीएल
* एसएएमपीएल बीजगणितीय मॉडलिंग भाषा
* [[परिदृश्य अनुकूलन]]
* [[परिदृश्य अनुकूलन]]
* स्टोकेस्टिक अनुकूलन
* स्टोकेस्टिक अनुकूलन
* [[मौका-विवश पोर्टफोलियो चयन]]
* [[मौका-विवश पोर्टफोलियो चयन|अवसर-व्यवरोधित पोर्टफोलियो चयन]]


==संदर्भ==
==संदर्भ==
{{Reflist|30em}}
{{Reflist|30em}}


==अग्रिम पठन==
==अग्रिम पठन==

Latest revision as of 12:26, 13 September 2023

गणितीय अनुकूलन के क्षेत्र में, स्टोकेस्टिक प्रोग्रामिंग या स्टोकेस्टिक प्रोग्रामिंग प्रतिरूपण अनुकूलन समस्याओं के लिए एक ऐसी संरचना है जिसमें अनिश्चितता सम्मिलित है। स्टोकेस्टिक प्रोग्राम एक ऐसी अनुकूलन समस्या है जिसमें कुछ या सभी समस्या प्राचल अनिश्चित हैं, लेकिन ज्ञात प्रायिकता वितरणों का अनुसरण करते हैं।[1][2] यह संरचना निर्धारणात्मक अनुकूलन के विपरीत है, जिसमें सभी समस्या प्राचलों को यथार्थ रूप से ज्ञात माना जाता है। स्टोकेस्टिक प्रोग्रामिंग का लक्ष्य एक ऐसा निर्णय प्राप्त करना है जो निर्णायक द्वारा चयनित कुछ प्राचलों का अनुकूलन करता है, और समस्या के प्राचलों की अनिश्चितता के लिए उचित रूप से ध्यान देने योग्य है। क्योंकि कई वास्तविक जगत के निर्णयों में अनिश्चितता सम्मिलित है, अतः स्टोकेस्टिक प्रोग्रामिंग का अनुप्रयोग वित्त से लेकर परिवहन तक ऊर्जा अनुकूलन के क्षेत्रों की एक विस्तृत श्रृंखला में देखा जाता है।[3][4]

द्वि-चरणीय समस्याएँ

द्वि-चरणीय स्टोकेस्टिक प्रोग्रामिंग का मूल विचार यह है कि (इष्टतम) निर्णय, निर्णय लिए जाने के समय उपलब्ध आंकड़ों पर आधारित होने चाहिए और ये निर्णय भविष्य के प्रेक्षणों पर निर्भर नहीं हो सकते हैं। स्टोकेस्टिक प्रोग्रामिंग में द्वि-चरणीय सूत्रीकरण का उपयोग व्यापक रूप से किया जाता है। द्वि-चरणीय स्टोकेस्टिक प्रोग्रामिंग समस्या का सामान्य सूत्रीकरण निम्न द्वारा दिया जाता है:

जहाँ द्वितीय-चरण की समस्या का इष्टतम मान है
चिरसम्मत द्वि-चरणीय रैखिक स्टोकेस्टिक प्रोग्रामिंग समस्याओं को निम्न रूप में सूत्रित किया जा सकता है
जहाँ द्वितीय-चरण की समस्या का इष्टतम मान है


ऐसे सूत्रीकरण में, प्रथम-चरण निर्णय चर सदिश है, द्वितीय-चरण निर्णय चर सदिश है, और द्वितीय चरण की समस्या के आँकड़े को समाहित करता है। इस सूत्रीकरण में, प्रथम चरण में हमें अनिश्चित आँकड़े (इसे एक यादृच्छिक सदिश के रूप में देखा जाता है) की प्राप्ति से पहले "यहीं और अभी (तत्काल)" निर्णय लेना होता है। द्वितीय चरण में, की प्राप्ति के उपलब्ध होने के बाद, हम उपयुक्त अनुकूलन समस्या को हल करके अपने व्यवहार को अनुकूलित करते हैं।

प्रथम चरण में हम प्रथम चरण के निर्णय की लागत के साथ-साथ (इष्टतम) द्वितीय चरण के निर्णय की अपेक्षित लागत का अनुकूलन (उपर्युक्त सूत्रीकरण में न्यूनीकृत) करते हैं। हम द्वितीय चरण की समस्या को केवल एक ऐसी अनुकूलन समस्या के रूप में देख सकते हैं जो अनिश्चित आंकड़ों के प्रकट होने पर हमारे अनुमानित इष्टतम व्यवहार का वर्णन करती है, या हम इसके हल को एक ऐसी आश्रय क्रिया के रूप में मान सकते हैं जहाँ शब्द निकाय की संभावित असंगति की क्षतिपूर्ति करता है और इस आश्रय क्रिया की लागत है।

विचार की गयी द्वि-चरणीय समस्या रैखिक है क्योंकि उद्देश्य फलन और व्यवरोध रैखिक हैं। संकल्पनात्मक रूप से यह आवश्यक नहीं है और अधिक सामान्य द्वि-चरणीय स्टोकेस्टिक प्रोग्रामों पर विचार किया जा सकता है। उदाहरण के लिए, यदि प्रथम-चरण की समस्या पूर्णांक है, तो प्रथम-चरण की समस्या में समाकलनीय व्यवरोधों को इस प्रकार जोड़ा जा सकता है कि सुसंगत समुच्चय असतत हो जाये। आवश्यकतानुसार अरैखिक उद्देश्यों और व्यवरोधों को भी सम्मिलित किया जा सकता है।[5]

बंटनात्मक कल्पना

उपरोक्त द्वि-चरणीय समस्या का सूत्रीकरण यह मानता है कि द्वितीय-चरण के डेटा को ज्ञात प्रायिकता वितरण वाले एक यादृच्छिक सदिश के रूप में प्रतिरूपित किया गया है। यह कई स्थितियों में उचित होता है। उदाहरण के लिए, के बंटन को ऐतिहासिक आँकड़े से अनुमानित किया जा सकता है यदि मान जाता है कि वितरण किसी समयावधि में प्रभावशाली रूप से परिवर्तित नहीं होता है। इसके अतिरिक्त, प्रतिदर्श के प्रयोगसिद्ध बंटन का उपयोग के अग्रिम मानों के बंटन के सन्निकटन के रूप में किया जा सकता है। यदि का पूर्व मॉडल उपलब्ध है, तो बेज़ के अपडेट द्वारा पश्चवर्ती बंटन प्राप्त किया जा सकता है।

असततीकरण

द्वि-चरणीय की स्टोकेस्टिक समस्या को संख्यात्मक रूप से हल करने के लिए, प्रायः यह मानने की आवश्यकता होती है कि यादृच्छिक सदिश में परिदृश्य नामक संभावित प्राप्तियों की संख्या सीमित है, माना ये हैं, जिनके संगत प्रायिकता द्रव्यमान हैं। तब प्रथम चरण की समस्या के उद्देश्य फलन में प्रत्याशा को निम्न योग के रूप में लिखा जा सकता है:

और इसके अतिरिक्त, द्वि-चरणीय समस्या को एक बड़ी रैखिक प्रोग्रामन समस्या के रूप में सूत्रित किया जा सकता है (इसे मूल समस्या का निर्धारणात्मक समतुल्य कहा जाता है, § § यादृच्छिक समस्या का निर्धारक समतुल्य अनुभाग देखें)।

जब में संभावित प्राप्तियों की संख्या अपरिमित (या बहुत बड़ी) है, तो इस बंटन का निरूपण परिदृश्यों द्वारा करने के लिए मानक दृष्टिकोण है। यह दृष्टिकोण तीन प्रश्न उठाता है, अर्थात्:

  1. परिदृश्यों का निर्माण कैसे करें, देखें § परिदृश्य निर्माण;
  2. निर्धारणात्मक समतुल्य को कैसे हल करें। सीपीएलईएक्स, और जीएनयू रैखिक प्रोग्रामिंग किट (जीएलपीके) जैसे अनुकूलक बड़ी रैखिक/अरैखिक समस्याओं को हल कर सकते हैं। विस्कॉन्सिन विश्वविद्यालय, मैडिसन में आयोजित एनईओएस सर्वर[6] कई आधुनिक हलकर्ताओं तक मुफ्त पहुँच की अनुमति प्रदान करता है। निर्धारणात्मक समतुल्य की संरचना बेंडर्स अपघटन या परिदृश्य अपघटन जैसी अपघटन विधियों को लागू करने के लिए विशेष रूप से उत्तरदायी है,[7]
  3. "सही" इष्टतम के सापेक्ष प्राप्त हल की गुणवत्ता को कैसे मापें।

ये प्रश्न स्वतंत्र नहीं हैं। उदाहरण के लिए, निर्मित परिदृश्यों की संख्या निर्धारणात्मक समतुल्य की वश्यता और प्राप्त हलों की गुणवत्ता दोनों को प्रभावित करती है।

स्टोकेस्टिक रैखिक प्रोग्राम

स्टोकेस्टिक रैखिक प्रोग्राम चिरसम्मत द्वि-चरणीय स्टोकेस्टिक प्रोग्राम का एक विशिष्ट उदाहरण है। एक स्टोकेस्टिक एलपी, बहु-आवधिक रैखिक प्रोग्रामों (एलपी) के संग्रह से बनाई गयी है, जिनमें से प्रत्येक की संरचना समान लेकिन आँकड़े कुछ अलग हैं। परिदृश्य को निरूपित करने वाली द्वि-आवधिक एलपी को निम्नलिखित रूप में माना जा सकता है:

सदिश और में प्रथम-आवधिक चर होते हैं, जिनके मानों का चयन तत्काल किया जाना चाहिए। सदिश अनुक्रमिक अवधियों के लिए सभी चरों को समाहित करता है। व्यवरोध केवल प्रथम-आवधिक चरों को सम्मिलित करता है और ये प्रत्येक परिदृश्य में समान होते हैं। अन्य व्यवरोधों में बाद की अवधियों के चर सम्मिलित हैं और अग्रिम अनिश्चितता को दर्शाते हुए परिदृश्य से परिदृश्य में कुछ स्थितियों में भिन्न हैं।

ध्यान दें कि द्वि-आवधिक एलपी को हल करना, बिना किसी अनिश्चितता के द्वितीय अवधि में परिदृश्य को मानने के बराबर है। द्वितीय चरण में अनिश्चितताओं को समाविष्ट करने के लिए, भिन्न परिदृश्यों के लिए प्रायिकताओं को आवंटित करना चाहिए और संगत निर्धारणात्मक समतुल्य को हल करना चाहिए।

स्टोकेस्टिक समस्या के निर्धारणात्मक समकक्ष

परिदृश्यों की परिमित संख्या के साथ, द्वि-चरणीय स्टोकेस्टिक रैखिक प्रोग्रामों को बड़ी रैखिक प्रोग्रामन समस्याओं के रूप में प्रतिरूपित किया जा सकता है। इस सूत्रीकरण को प्रायः निर्धारणात्मक समतुल्य रैखिक प्रोग्राम या संक्षिप्त रूप में निर्धारणात्मक समतुल्य कहा जाता है। (निष्पक्ष रूप से कहने पर, निर्धारणात्मक समतुल्य एक ऐसा गणितीय प्रोग्राम है जिसका उपयोग इष्टतम प्रथम-चरण के निर्णय की गणना करने के लिए किया जा सकता है, इसलिए ये तब भी सतत प्रायिकता बंटन के लिए अस्तित्व में होते हैं, जब द्वितीय चरण की लागत का निरूपण समान संवृत रूप में किया जा सकता है।) उदाहरण के लिए, उपरोक्त स्टोकेस्टिक रैखिक प्रोग्राम के समतुल्य के निर्माण के लिए, हम प्रत्येक परिदृश्य के लिए एक प्रायिकता आवंटित करते हैं।

फिर हम सभी परिदृश्यों से व्यवरोधों के अधीन उद्देश्य के प्रत्याशित मान को न्यूनतम कर सकते हैं:

हमारे पास प्रत्येक परिदृश्य के लिए, आनुक्रमिक अवधियों के चरों का एक अलग सदिश है। प्रथम आवधिक चर और प्रत्येक परिदृश्य में समान होते हैं, हालाँकि, क्योंकि हमें यह जानने से पहले प्रथम अवधि के लिए निर्णय लेना चाहिए कि कौन सा परिदृश्य प्राप्त होगा। परिणामस्वरूप, केवल और को सम्मिलित करने वाले व्यवरोधों को केवल एक बार निर्दिष्ट करने की आवश्यकता होती है, जबकि शेष व्यवरोधों को प्रत्येक परिदृश्य के लिए एकल रूप से निर्दिष्ट किया जाना चाहिए।

परिदृश्य निर्माण

व्यवहार में भविष्य पर विशेषज्ञों का मत जानकर परिदृश्यों का निर्माण करना संभव हो सकता है। निर्मित परिदृश्यों की संख्या अपेक्षाकृत साधारण होनी चाहिए जिससे प्राप्त निर्धारणात्मक समतुल्य को उचित संगणनीय प्रयास से हल किया जा सके। प्रायः यह दावा किया जाता है कि केवल कुछ परिदृश्यों का उपयोग करने वाला एक हल केवल एक परिदृश्य को मानने वाले हल की तुलना में अधिक अनुकूलनीय योजनाएँ प्रदान करता है। कुछ स्थितियों में ऐसे दावे को अनुकरण द्वारा सत्यापित किया जा सकता है। सिद्धांत रूप में आश्वासन के कुछ प्रमाप उपलब्ध हैं, जिससे एक प्राप्त हल मूल समस्या को उचित यथार्थता के साथ हल करता है। सामान्यतः अनुप्रयोगों में केवल प्रथम चरण इष्टतम हल का एक व्यावहारिक मान है क्योंकि लगभग सदैव यादृच्छिक आँकड़ों का "सत्य" प्रतिफलन निर्मित (उत्पन्न) परिदृश्यों के समुच्चय से अलग होता है।

माना में स्वतंत्र यादृच्छिक घटक सम्मिलित हैं, जिनमें से प्रत्येक में तीन संभावित प्रतिफल हैं (उदाहरण के लिए, प्रत्येक यादृच्छिक प्राचलों के भविष्य के प्रतिफलों को निम्न, मध्यम और उच्च के रूप में वर्गीकृत किया गया है), तो परिदृश्यों की कुल संख्या है। परिदृश्यों की संख्या में इस प्रकार की घातीय वृद्धि उचित आकार के लिए भी विशेषज्ञ के मत का उपयोग करके मॉडल के विकास को अत्यधिक जटिल बना देती है। यह स्थिति और भी खराब हो जाती है यदि के कुछ यादृच्छिक घटकों में सतत बंटन हैं।

मोंटे कार्लो प्रतिचयन और प्रतिदर्श औसत सन्निकटन (एसएए) विधि

मोंटे कार्लो अनुकरण का उपयोग, एक प्रबंधनीय आकार के लिए निर्धारित परिदृश्य को कम करने के लिए एक सामान्य दृष्टिकोण है। माना परिदृश्यों की कुल संख्या अत्यधिक या अपरिमित है। आगे माना कि हम यादृच्छिक सदिश की प्रतिकृतियों का एक प्रतिदर्श उत्पन्न कर सकते हैं। सामान्यतः प्रतिदर्श को स्वतंत्र और समान रूप से वितरित (आई.आई.डी प्रतिदर्श) माना जाता है। दिए गए एक प्रतिदर्श के लिए, प्रत्याशा फलन को निम्न प्रतिदर्श औसत द्वारा सन्निकटित किया जाता है

और फलस्वरूप प्रथम चरण की समस्या निम्न द्वारा दी गई है

इस सूत्रीकरण को प्रतिदर्श औसत सन्निकटन विधि के रूप में जाना जाता है। एसएए समस्या माने गए प्रतिदर्श का एक फलन है और इस अर्थ में यादृच्छिक है। दिए गए प्रतिदर्श के लिए, एसएए समस्या परिदृश्यों ., वाली द्वि-चरणीय स्टोकेस्टिक रैखिक प्रोग्रामन समस्या के समान रूप की है, जिनमें से प्रत्येक को समान प्रायिकता के साथ लिया गया है।

सांख्यिकीय निष्कर्ष

निम्नलिखित स्टोकेस्टिक प्रोग्रामन समस्या पर विचार करें

यहाँ , का एक अरिक्त संवृत उपसमुच्चय है, एक यादृच्छिक सदिश है जिसका प्रायिकता बंटन एक समुच्चय , और पर समर्थित है। द्वि-चरणीय स्टोकेस्टिक प्रोग्रामन की संरचना में, को संगत द्वितीय-चरणीय समस्या के इष्टतम मान द्वारा दिया गया है।

माना सभी के लिए सुपरिभाषित और परिमित मान फलन है। इसका तात्पर्य है कि प्रत्येक के लिए मान लगभग निश्चित है।

माना हमारे पास यादृच्छिक सदिश के प्रतिफलनों का एक प्रतिदर्श है। इस यादृच्छिक प्रतिदर्श को के प्रेक्षणों को ऐतिहासिक आँकड़े के रूप में देखा जा सकता है, या इसे मोंटे कार्लो प्रतिरूपण तकनीकों द्वारा उत्पन्न किया जा सकता है। तब हम एक संगत प्रतिदर्श औसत सन्निकटन सूत्रित कर सकते हैं

वृहत संख्या सिद्धांत के अनुसार हमें ज्ञात है कि, , कुछ नियमितता शर्तों के तहत प्रायिकता 1 के साथ तक बिंदुवार अभिसरित होता है, क्योंकि ।इसके अतिरिक्त, मंद अतिरिक्त परिस्थितियों में अभिसरण एक समान है। हमारे पास भी है, अर्थात्, , का एक अनभिनत आंकलक है। इसलिए, यह आशा करना स्वाभाविक है कि एसएए समस्या का इष्टतम मान और इष्टतम हल वास्तविक समस्या के अपने समतुल्यों के साथ अभिसरण करते हैं क्योंकि

एसएए आंकलकों की संगतता

माना एसएए समस्या का सुसंगत समुच्चय नियत है, अर्थात् यह प्रतिदर्श से स्वतंत्र है। माना और , क्रमशः वास्तविक समस्या के इष्टतम मान और इष्टतम हलों का समुच्चय है और माना और , क्रमशः एसएए समस्या के इष्टतम मान और इष्टतम हलों का समुच्चय है।

  1. माना और (निर्धारणात्मक) वास्तविक मान फलनों का एक अनुक्रम है। निम्नलिखित दो गुण समतुल्य हैं:
    • किसी और में अभिसरित किसी अनुक्रम के लिए, यह इस प्रकार है कि , में अभिसरित होता है
    • फलन , पर सतत है और , के किसी सघन उपसमुच्चय पर पर समान रूप से अभिसरित होता है
  2. यदि एसएए समस्या का उद्देश्य , सुसंगत समुच्चय पर समान रूप से प्रायिकता 1 वाली वास्तविक समस्या के उद्देश्य में अभिसरित होता है, क्योंकि । तब , प्रायिकता 1 वाले में अभिसरित होता है, क्योंकि
  3. माना एक ऐसे सघन समुच्चय का अस्तित्व है कि
    • वास्तविक समस्या के इष्टतम हलों का समुच्चय अरिक्त है और में निहित है
    • परिमित मान फलन है और पर सतत है
    • फलनों का अनुक्रम , में समान रूप से प्रायिकता 1 के साथ में अभिसरित होता है, क्योंकि
    • के लिए काफी बड़ा समुच्चय अरिक्त है और प्रायिकता 1 के साथ
तब प्रायिकता 1 के साथ और क्योंकि । ध्यान दें कि , समुच्चय के समुच्चय से विचलन को दर्शाता है, जो इस प्रकार परिभाषित है

कुछ स्थितियों में एसएए समस्या के सुसंगत समुच्चय का इष्टतमीकरण किया गया है, तो संगत एसएए समस्या निम्न रूप ग्रहण करती है

जहाँ , प्रतिदर्श के आधार पर का उपसमुच्चय है और इसलिए यादृच्छिक है। फिर भी, एसएए आंकलकों के लिए निसंगतता परिणाम, अभी भी कुछ अतिरिक्त धारणाओं के तहत प्राप्त किए जा सकते हैं:

  1. माना एक ऐसे सघन समुच्चय का अस्तित्व है कि
    • वास्तविक समस्या के इष्टतम हलों का समुच्चय अरिक्त है और में निहित है
    • परिमित मान फलन है और पर सतत है
    • फलनों का अनुक्रम , में समान रूप से प्रायिकता 1 के साथ में अभिसरित होता है, क्योंकि
    • के लिए काफी बड़ा समुच्चय अरिक्त है और प्रायिकता 1 के साथ
    • यदि और प्रायिकता 1 के साथ एक बिंदु पर अभिसरित होता है, तब
    • कुछ बिंदुओं के लिए, एक ऐसे अनुक्रम का अस्तित्व है कि प्रायिकता 1 के साथ
तब प्रायिकता 1 के साथ और , क्योंकि

एसएए इष्टतम मान के उपगमन

माना प्रतिदर्श आई.आई.डी. है और एक बिंदु को नियत करता है। फिर का प्रतिदर्श औसत आंकलक , अनभिनत है और इसका विचरण है, जहाँ परिमित माना जाता है। इसके अतिरिक्त, केंद्रीय सीमा प्रमेय द्वारा हमारे पास निम्न है

जहाँ बंटन में अभिसरण को दर्शाता है और में माध्य और विचरण वाला एक अभिलम्ब बंटन है, जिसे के रूप में लिखा गया है।

दूसरे शब्दों में, उपगामी अभिलम्ब बंटन है, अर्थात्, बड़े के लिए, में माध्य और विचरण वाला लगभग अभिलम्ब बंटन है। यह के लिए निम्न (अनुमानित)  % विश्वास्यता अंतराल की ओर जाता है:

जहाँ (यहाँ मानक अभिलम्ब वितरण के सीडीएफ को दर्शाता है) और

का प्रतिदर्श प्रसरण आंकलन है। अर्थात् के आंकलन की त्रुटि (स्टोकेस्टिक रूप से) कोटि की है।

अनुप्रयोग और उदाहरण

जैविक अनुप्रयोग

व्यावहारिक पारिस्थितिकी जैसे क्षेत्रों में पशुओं के व्यवहार को प्रतिरूपित करने के लिए प्रायः स्टोकेस्टिक गतिशील प्रोग्रामिंग का उपयोग किया जाता है।[8][9] इष्टतम फोरेजिंग (चारे की तलाश), पक्षियों में उड़ने और परजीवी ततैयों में अंडे देने जैसे जैविक जीवन चक्र संक्रमणों के आनुभविक परीक्षण व्यवहारिक निर्णय लेने के विकास की व्याख्या करने में इस मॉडलिंग तकनीक के महत्व को दर्शाते हैं। ये मॉडल सामान्यतः दो चरणों के स्थान कई चरणों वाले होते हैं।

आर्थिक अनुप्रयोग

स्टोकेस्टिक गतिमान प्रोग्रामिंग, अनिश्चितता के तहत निर्णय लेने की समझ में एक उपयोगी उपकरण है। अनिश्चितता के तहत पूँजीगत भण्डार का संचय इसका एक उदाहरण है; इसका उपयोग प्रायः संसाधन अर्थशास्त्रियों द्वारा जैव आर्थिक समस्याओं का विश्लेषण करने के लिए किया जाता है[10] जहाँ मौसम आदि में अनिश्चितता प्रवेश करती है।

उदाहरण: बहुचरणीय पोर्टफोलियो अनुकूलन

निम्न उदाहरण बहु-चरणीय स्टोकेस्टिक प्रोग्रामिंग के वित्त से एक निम्न उदाहरण है। माना समय पर, संपत्तियों पर निवेश करने के लिए हमारे पास प्रारंभिक पूँजी है। आगे माना कि हमें समय पर अपने पोर्टफोलियो को अतिरिक्त नकदी डाले बिना पुनर्संतुलित करने की अनुमति है। प्रत्येक अवधि में हम वर्तमान धन के संपत्तियों में पुनर्वितरण के बारे में निर्णय लेते हैं। माना , n संपत्तियों में निवेश की गई प्रारंभिक राशि है। हमें आवश्यकता है कि प्रत्येक गैर-ऋणात्मक हो और संतुलन समीकरण सत्य होना चाहिए।

प्रत्येक अवधि के लिएक, ुल प्रतिफल पर विचार करें। यह एक सदिश-मान यादृच्छिक प्रक्रिया का निर्माण करता है। समयावधि में, हम संगत संपत्तियों में निविष्ट राशियों को निर्दिष्ट करके पोर्टफोलियो को पुनर्संतुलित कर सकते हैं। उस समय पहली अवधि में प्रतिफल की प्राप्ति हो गयी है, इसलिए इस जानकारी का उपयोग पुनर्संतुलन निर्णय में करना उचित है। इस प्रकार, मय पर द्वितीय चरण के निर्णय,वास्तव में यादृच्छिक सदिश की प्राप्ति के फलन हैं, अर्थात्, । इसी प्रकार, समय पर निर्णय , , समय तक यादृच्छिक प्रक्रिया के इतिहास द्वारा दी गयी उपलब्ध जानकारी का एक फलन है। फलनों , का एक अनुक्रम, जिसमें स्थिर है, निर्णय प्रक्रिया की कार्यान्वयन योग्य नीति को परिभाषित करता है। ऐसा कहा जाता है कि ऐसी नीति सुसंगत होती है यदि यह प्रायिकता 1 वाले मॉडल के व्यवरोधों, अर्थात् गैर-ऋणात्मकता व्यवरोध , , , को संतुष्ट करती है, और धन व्यवरोधों का संतुलन निम्न है,

जहाँ अवधि में धन निम्न द्वारा दिया गया है

जो यादृच्छिक प्रक्रिया की प्राप्ति और समय तक के निर्णयों पर निर्भर करता है।

माना इसका उद्देश्य अंतिम अवधि में इस धन की प्रत्याशित उपयोगिता को अधिकतम करना है, अर्थात् निम्न समस्या पर विचार करने पर

यह एक बहुचरणीय स्टोकेस्टिक प्रोग्रामिंग समस्या है, जहाँ चरणों को से तक क्रमांकित किया जाता है। अनुकूलन सभी कार्यान्वयन योग्य और सुसंगत नीतियों पर किया जाता है। समस्या के विवरण को पूरा करने के लिए यादृच्छिक प्रक्रिया के प्रायिकता बंटन को परिभाषित करने की आवश्यकता होती है। यह विभिन्न विधियों से किया जा सकता है। उदाहरण के लिए, प्रक्रिया के समय के विकास को परिभाषित करने वाले एक विशेष परिदृश्य वृक्ष का निर्माण किया जा सकता है। यदि प्रत्येक स्तर पर प्रत्येक परिसंपत्ति के यादृच्छिक प्रतिफल को अन्य संपत्तियों से स्वतंत्र दो सततताओं की अनुमति दी जाती है, तो परिदृश्यों की कुल संख्या होती है।}

गतिशील प्रोग्रामिंग समीकरणों को लिखने के लिए, उपरोक्त बहुचरणीय समस्या के पश्च समय पर विचार करें। अंतिम चरण में, यादृच्छिक प्रक्रिया का एक प्रतिफल ज्ञात है और का चयन किया गया है। इसलिए, निम्नलिखित समस्या को हल करने की आवश्यकता होती है

जहाँ दिये गये की सप्रतिबन्ध प्रत्याशा को दर्शाता है। उपरोक्त समस्या का इष्टतम मान और पर निर्भर करता है और द्वारा निरूपित किया जाता है।

इसी प्रकार, चरणों में, निम्न समस्या को हल किया जाना चाहिए,

जिसका इष्टतम मान द्वारा निरूपित किया जाता है। अंततः, चरण पर, निम्न समस्या हल की जाती है

चरणवार स्वतंत्र यादृच्छिक प्रक्रिया

प्रक्रिया के सामान्य बंटन के लिए, इन गतिशील प्रोग्रामिंग समीकरणों को हल करना जटिल हो सकता है। यह स्थिति प्रभावशाली रूप से सरल हो जाती है, यदि प्रक्रिया चरणवार स्वतंत्र है, अर्थात्, , के लिए से स्वतंत्र है। इस स्थिति में, संगत सप्रतिबन्ध प्रत्याशाएँ, अप्रतिबंध प्रत्याशाएँ बन जाती हैं, और फलन , , पर निर्भर नहीं करता है। अर्थात्, , समस्या का इष्टतम मान है

और , के लिए निम्न का इष्टतम मान है

सॉफ्टवेयर उपकरण

मॉडलिंग भाषाएँ

सभी असतत स्टोकेस्टिक प्रोग्रामिंग समस्याओं को किसी भी बीजगणितीय मॉडलिंग भाषा के साथ हस्तचालित रूप से स्पष्ट या निहित गैर-प्रत्याशात्मकता को लागू करने के लिए प्रदर्शित किया जा सकता है जिससे यह सुनिश्चित किया जा सके कि परिणामी मॉडल प्रत्येक चरण में उपलब्ध कराई गई जानकारी की संरचना की उपेक्षा नहीं करता है। किसी सामान्य मॉडलिंग भाषा द्वारा उत्पन्न एसपी समस्या का एक उदाहरण काफी बड़ा (रैखिक रूप से परिदृश्यों की संख्या में) हो जाता है, और इसका आव्यूह उस संरचना को खो देता है जो समस्याओं के इस वर्ग के लिए मौलिक है, जिसका लाभ अन्यथा विशिष्ट अपघटन एल्गोरिदम द्वारा हल समय पर लिया जा सकता है। विशेष रूप से एसपी के लिए संरचित की गई मॉडलिंग भाषाओं के विस्तार दिखाई देने लगे हैं, देखें:

  • एआईएमएमएस - एसपी समस्याओं की परिभाषा का समर्थन करती है
  • ईएमपी एसपी (स्टोकेस्टिक प्रोग्रामिंग के लिए विस्तारित गणितीय प्रोग्रामिंग) - स्टोकेस्टिक प्रोग्रामिंग को सुविधाजनक बनाने के लिए जीएएमएस का एक मॉड्यूल बनाया गया है (इसमें प्राचल बंटन के लिए संकेत शब्द, अवसर व्यवरोध और जोखिम पर मान एवं प्रत्याशित कमी जैसी जोखिम की माप सम्मिलित हैं)।
  • एसएएमपीएल - एएमपीएल के विस्तार का एक समुच्चय विशेष रूप से स्टोकेस्टिक प्रोग्राम को व्यक्त करने के लिए संरचित किया गया है ( इसमें अवसर व्यवरोधों के लिए सिंटैक्स, एकीकृत अवसर व्यवरोध और दृढ़ अनुकूलन समस्याएँ सम्मिलित हैं)

ये दोनों एसएमपीएस उदाहरण तत्क्षण स्तर प्रारूप उत्पन्न कर सकते हैं, जो गैर-निरर्थक रूप में समस्या की संरचना को हलकर्ताओं तक पहुँचाता है।

यह भी देखें

संदर्भ

  1. Shapiro, Alexander; Dentcheva, Darinka; Ruszczyński, Andrzej (2009). Lectures on stochastic programming: Modeling and theory (PDF). MPS/SIAM Series on Optimization. Vol. 9. Philadelphia, PA: Society for Industrial and Applied Mathematics (SIAM). Mathematical Programming Society (MPS). pp. xvi+436. ISBN 978-0-89871-687-0. MR 2562798.
  2. Birge, John R.; Louveaux, François (2011). Introduction to Stochastic Programming. Springer Series in Operations Research and Financial Engineering (in British English). doi:10.1007/978-1-4614-0237-4. ISBN 978-1-4614-0236-7. ISSN 1431-8598.
  3. Stein W. Wallace and William T. Ziemba (eds.). Applications of Stochastic Programming. MPS-SIAM Book Series on Optimization 5, 2005.
  4. Applications of stochastic programming are described at the following website, Stochastic Programming Community.
  5. Shapiro, Alexander; Philpott, Andy. A tutorial on Stochastic Programming (PDF).
  6. "NEOS Server for Optimization".
  7. Ruszczyński, Andrzej; Shapiro, Alexander (2003). Stochastic Programming. Handbooks in Operations Research and Management Science. Vol. 10. Philadelphia: Elsevier. p. 700. ISBN 978-0444508546.
  8. Mangel, M. & Clark, C. W. 1988. Dynamic modeling in behavioral ecology. Princeton University Press ISBN 0-691-08506-4
  9. Houston, A. I & McNamara, J. M. 1999. Models of adaptive behaviour: an approach based on state. Cambridge University Press ISBN 0-521-65539-0
  10. Howitt, R., Msangi, S., Reynaud, A and K. Knapp. 2002. "Using Polynomial Approximations to Solve Stochastic Dynamic Programming Problems: or A "Betty Crocker " Approach to SDP." University of California, Davis, Department of Agricultural and Resource Economics Working Paper.

अग्रिम पठन


बाहरी संबंध