स्टोकेस्टिक प्रोग्रामिंग: Difference between revisions

From Vigyanwiki
(Created page with "{{Short description|Framework for modeling optimization problems that involve uncertainty}} {{For|the context of control theory|Stochastic control}} गणितीय अ...")
 
No edit summary
Line 1: Line 1:
{{Short description|Framework for modeling optimization problems that involve uncertainty}}
{{Short description|Framework for modeling optimization problems that involve uncertainty}}
{{For|the context of control theory|Stochastic control}}
{{For|नियंत्रण सिद्धांत का संदर्भ|प्रसंभाव्य नियंत्रण}}
[[गणितीय अनुकूलन]] के क्षेत्र में, स्टोकेस्टिक प्रोग्रामिंग गणितीय मॉडल [[अनुकूलन (गणित)]] समस्याओं के लिए एक ढांचा है जिसमें [[अनिश्चितता]] शामिल है। एक स्टोकेस्टिक प्रोग्राम एक अनुकूलन समस्या है जिसमें कुछ या सभी समस्या पैरामीटर अनिश्चित हैं, लेकिन ज्ञात संभाव्यता वितरण का पालन करते हैं।<ref>{{cite book|last1=Shapiro|first1=Alexander|url=http://www2.isye.gatech.edu/people/faculty/Alex_Shapiro/SPbook.pdf|title=Lectures on stochastic programming: Modeling and theory|last2=Dentcheva|first2=Darinka|last3=Ruszczyński|first3=Andrzej|publisher=Society for Industrial and Applied Mathematics (SIAM)|year=2009|isbn=978-0-89871-687-0|series=MPS/SIAM Series on Optimization|volume=9|location=Philadelphia, PA|pages=xvi+436|mr=2562798|author2-link=Darinka Dentcheva|author3-link=Andrzej Piotr Ruszczyński|agency=Mathematical Programming Society (MPS)}}</ref><ref>{{Cite book|last1=Birge|first1=John R.|last2=Louveaux|first2=François|date=2011|title=Introduction to Stochastic Programming|url=https://doi.org/10.1007/978-1-4614-0237-4|series=Springer Series in Operations Research and Financial Engineering|language=en-gb|doi=10.1007/978-1-4614-0237-4|isbn=978-1-4614-0236-7|issn=1431-8598}}</ref> यह ढांचा नियतात्मक अनुकूलन के विपरीत है, जिसमें सभी समस्या मापदंडों को सटीक रूप से ज्ञात माना जाता है। स्टोकेस्टिक प्रोग्रामिंग का लक्ष्य एक निर्णय खोजना है जो निर्णय निर्माता द्वारा चुने गए कुछ मानदंडों का अनुकूलन करता है, और समस्या के मापदंडों की अनिश्चितता के लिए उचित रूप से खाता है। क्योंकि कई वास्तविक दुनिया के फैसलों में अनिश्चितता शामिल है, स्टोकेस्टिक प्रोग्रामिंग ने [[वित्त]] से लेकर परिवहन से लेकर ऊर्जा अनुकूलन तक के व्यापक क्षेत्रों में आवेदन पाया है।<ref>
[[गणितीय अनुकूलन]] के क्षेत्र में, '''प्रसंभाव्य प्रोग्रामिंग''' या '''स्टोकेस्टिक प्रोग्रामिंग''' मॉडलिंग [[अनुकूलन (गणित)|अनुकूलन]] समस्याओं के लिए एक ढांचा है जिसमें [[अनिश्चितता]] शामिल है। एक स्टोचैस्टिक प्रोग्राम एक अनुकूलन समस्या है जिसमें कुछ या सभी समस्या पैरामीटर अनिश्चित हैं, लेकिन ज्ञात संभाव्यता वितरण का पालन करते हैं।<ref>{{cite book|last1=Shapiro|first1=Alexander|url=http://www2.isye.gatech.edu/people/faculty/Alex_Shapiro/SPbook.pdf|title=Lectures on stochastic programming: Modeling and theory|last2=Dentcheva|first2=Darinka|last3=Ruszczyński|first3=Andrzej|publisher=Society for Industrial and Applied Mathematics (SIAM)|year=2009|isbn=978-0-89871-687-0|series=MPS/SIAM Series on Optimization|volume=9|location=Philadelphia, PA|pages=xvi+436|mr=2562798|author2-link=Darinka Dentcheva|author3-link=Andrzej Piotr Ruszczyński|agency=Mathematical Programming Society (MPS)}}</ref><ref>{{Cite book|last1=Birge|first1=John R.|last2=Louveaux|first2=François|date=2011|title=Introduction to Stochastic Programming|url=https://doi.org/10.1007/978-1-4614-0237-4|series=Springer Series in Operations Research and Financial Engineering|language=en-gb|doi=10.1007/978-1-4614-0237-4|isbn=978-1-4614-0236-7|issn=1431-8598}}</ref> यह ढांचा नियतात्मक अनुकूलन के विपरीत है, जिसमें सभी समस्या मापदंडों को सटीक रूप से ज्ञात माना जाता है। प्रसंभाव्य प्रोग्रामिंग का लक्ष्य एक निर्णय खोजना है जो निर्णय निर्माता द्वारा चुने गए कुछ मानदंडों का अनुकूलन करता है, और समस्या के मापदंडों की अनिश्चितता के लिए उचित रूप से खाता है। क्योंकि कई वास्तविक दुनिया के निर्णयों में अनिश्चितता शामिल है, प्रसंभाव्य प्रोग्रामिंग ने [[वित्त]] से लेकर परिवहन से लेकर ऊर्जा अनुकूलन तक के क्षेत्रों की एक विस्तृत श्रृंखला में आवेदन पाया है।<ref>
Stein W. Wallace and William T. Ziemba (eds.). ''[https://books.google.com/books?id=KAI0jsuyDPsC&printsec=frontcover&dq=%22Applications+of+Stochastic+Programming%22&hl=en&sa=X&ved=0ahUKEwivt-nn2OfiAhURXa0KHYJMC9UQ6AEIKjAA#v=onepage&q=%22Applications%20of%20Stochastic%20Programming%22&f=false Applications of Stochastic Programming]''. MPS-SIAM Book Series on Optimization 5, 2005.
Stein W. Wallace and William T. Ziemba (eds.). ''[https://books.google.com/books?id=KAI0jsuyDPsC&printsec=frontcover&dq=%22Applications+of+Stochastic+Programming%22&hl=en&sa=X&ved=0ahUKEwivt-nn2OfiAhURXa0KHYJMC9UQ6AEIKjAA#v=onepage&q=%22Applications%20of%20Stochastic%20Programming%22&f=false Applications of Stochastic Programming]''. MPS-SIAM Book Series on Optimization 5, 2005.
</ref><ref>
</ref><ref>
Applications of stochastic programming are described at the following website, [http://stoprog.org Stochastic Programming Community].
Applications of stochastic programming are described at the following website, [http://stoprog.org Stochastic Programming Community].
</ref>
</ref>
 
== दो चरण की समस्याएँ ==
 
दो-चरण स्टोकेस्टिक प्रोग्रामिंग का मूल विचार यह है कि (इष्टतम) निर्णय निर्णय किए जाने के समय उपलब्ध आंकड़ों पर आधारित होने चाहिए और भविष्य की टिप्पणियों पर निर्भर नहीं हो सकते। स्टोचैस्टिक प्रोग्रामिंग में दो-चरण सूत्रीकरण का व्यापक रूप से उपयोग किया जाता है। दो-चरण स्टोकास्टिक प्रोग्रामिंग समस्या का सामान्य सूत्रीकरण निम्न द्वारा दिया गया है:<math display="block">
== दो चरण की समस्याएं ==
दो-चरण स्टोकेस्टिक प्रोग्रामिंग का मूल विचार यह है कि (इष्टतम) निर्णय निर्णय किए जाने के समय उपलब्ध आंकड़ों पर आधारित होने चाहिए और भविष्य की टिप्पणियों पर निर्भर नहीं हो सकते। स्टोचैस्टिक प्रोग्रामिंग में दो-चरण सूत्रीकरण का व्यापक रूप से उपयोग किया जाता है। दो-चरण स्टोकास्टिक प्रोग्रामिंग समस्या का सामान्य सूत्रीकरण निम्न द्वारा दिया गया है:
<math display="block">
\min_{x\in X}\{ g(x)= f(x) + E_{\xi}[Q(x,\xi)]\}
\min_{x\in X}\{ g(x)= f(x) + E_{\xi}[Q(x,\xi)]\}
</math>
</math>कहाँ <math>Q(x,\xi)</math> दूसरे चरण की समस्या का इष्टतम मूल्य है<math display="block">
कहाँ <math>Q(x,\xi)</math> दूसरे चरण की समस्या का इष्टतम मूल्य है
<math display="block">
\min_{y}\{ q(y,\xi) \,|\,T(\xi)x+W(\xi) y = h(\xi)\}.
\min_{y}\{ q(y,\xi) \,|\,T(\xi)x+W(\xi) y = h(\xi)\}.
</math>
</math>क्लासिकल टू-स्टेज लीनियर स्टोचैस्टिक प्रोग्रामिंग प्रॉब्लम्स को इस रूप में तैयार किया जा सकता है
क्लासिकल टू-स्टेज लीनियर स्टोचैस्टिक प्रोग्रामिंग प्रॉब्लम्स को इस रूप में तैयार किया जा सकता है
<math display="block">
<math display="block">
\begin{array}{llr}
\begin{array}{llr}
Line 38: Line 32:


माना जाने वाला द्वि-चरण समस्या रैखिक है क्योंकि उद्देश्य कार्य और बाधाएं रैखिक हैं। संकल्पनात्मक रूप से यह आवश्यक नहीं है और कोई अधिक सामान्य दो-चरण स्टोकेस्टिक कार्यक्रमों पर विचार कर सकता है। उदाहरण के लिए, यदि प्रथम-चरण की समस्या पूर्णांक है, तो कोई प्रथम-चरण की समस्या में अभिन्नता की कमी को जोड़ सकता है ताकि व्यवहार्य सेट असतत हो। जरूरत पड़ने पर गैर-रैखिक उद्देश्यों और बाधाओं को भी शामिल किया जा सकता है।<ref>{{cite book| last1=Shapiro|first1=Alexander|last2=Philpott|first2=Andy|title=A tutorial on Stochastic Programming| url=http://www2.isye.gatech.edu/people/faculty/Alex_Shapiro/TutorialSP.pdf}}</ref>
माना जाने वाला द्वि-चरण समस्या रैखिक है क्योंकि उद्देश्य कार्य और बाधाएं रैखिक हैं। संकल्पनात्मक रूप से यह आवश्यक नहीं है और कोई अधिक सामान्य दो-चरण स्टोकेस्टिक कार्यक्रमों पर विचार कर सकता है। उदाहरण के लिए, यदि प्रथम-चरण की समस्या पूर्णांक है, तो कोई प्रथम-चरण की समस्या में अभिन्नता की कमी को जोड़ सकता है ताकि व्यवहार्य सेट असतत हो। जरूरत पड़ने पर गैर-रैखिक उद्देश्यों और बाधाओं को भी शामिल किया जा सकता है।<ref>{{cite book| last1=Shapiro|first1=Alexander|last2=Philpott|first2=Andy|title=A tutorial on Stochastic Programming| url=http://www2.isye.gatech.edu/people/faculty/Alex_Shapiro/TutorialSP.pdf}}</ref>
=== वितरण धारणा ===
=== वितरण धारणा ===
उपरोक्त दो-चरण की समस्या का सूत्रीकरण दूसरे चरण के डेटा को मानता है <math>\xi</math> एक 'ज्ञात' संभाव्यता वितरण के साथ एक यादृच्छिक वेक्टर के रूप में तैयार किया गया है। यह कई स्थितियों में उचित होगा। उदाहरण के लिए, का वितरण <math>\xi</math> ऐतिहासिक डेटा से अनुमान लगाया जा सकता है यदि कोई मानता है कि समय की अवधि में वितरण महत्वपूर्ण रूप से नहीं बदलता है। इसके अलावा, नमूने के अनुभवजन्य वितरण का उपयोग भविष्य के मूल्यों के वितरण के अनुमान के रूप में किया जा सकता है <math>\xi</math>. यदि किसी के पास पूर्व मॉडल है <math>\xi</math>, कोई बायेसियन अपडेट द्वारा पोस्टरियरी वितरण प्राप्त कर सकता है।
उपरोक्त दो-चरण की समस्या का सूत्रीकरण दूसरे चरण के डेटा को मानता है <math>\xi</math> एक 'ज्ञात' संभाव्यता वितरण के साथ एक यादृच्छिक वेक्टर के रूप में तैयार किया गया है। यह कई स्थितियों में उचित होगा। उदाहरण के लिए, का वितरण <math>\xi</math> ऐतिहासिक डेटा से अनुमान लगाया जा सकता है यदि कोई मानता है कि समय की अवधि में वितरण महत्वपूर्ण रूप से नहीं बदलता है। इसके अलावा, नमूने के अनुभवजन्य वितरण का उपयोग भविष्य के मूल्यों के वितरण के अनुमान के रूप में किया जा सकता है <math>\xi</math>. यदि किसी के पास पूर्व मॉडल है <math>\xi</math>, कोई बायेसियन अपडेट द्वारा पोस्टरियरी वितरण प्राप्त कर सकता है।


=== विवेक ===
=== विवेक ===
संख्यात्मक रूप से दो-चरण की स्टोकेस्टिक समस्या को हल करने के लिए, अक्सर यह मानने की आवश्यकता होती है कि यादृच्छिक वेक्टर <math>\xi</math> संभावित अहसासों की एक सीमित संख्या होती है, जिन्हें परिदृश्य कहा जाता है <math>\xi_1,\dots,\xi_K</math>, संबंधित संभाव्यता द्रव्यमान के साथ <math>p_1,\dots,p_K</math>. तब प्रथम चरण की समस्या के उद्देश्य समारोह में अपेक्षा को योग के रूप में लिखा जा सकता है:
संख्यात्मक रूप से दो-चरण की प्रसंभाव्य समस्या को हल करने के लिए, अक्सर यह मानने की आवश्यकता होती है कि यादृच्छिक वेक्टर <math>\xi</math> संभावित अहसासों की एक सीमित संख्या होती है, जिन्हें परिदृश्य कहा जाता है <math>\xi_1,\dots,\xi_K</math>, संबंधित संभाव्यता द्रव्यमान के साथ <math>p_1,\dots,p_K</math>. तब प्रथम चरण की समस्या के उद्देश्य समारोह में अपेक्षा को योग के रूप में लिखा जा सकता है:<math display="block">
<math display="block">
E[Q(x,\xi)]=\sum\limits_{k=1}^{K} p_kQ(x,\xi_k)
E[Q(x,\xi)]=\sum\limits_{k=1}^{K} p_kQ(x,\xi_k)
</math>
</math>और, इसके अलावा, दो-चरण की समस्या को एक बड़ी रैखिक प्रोग्रामिंग समस्या के रूप में तैयार किया जा सकता है (इसे मूल समस्या का नियतात्मक समतुल्य कहा जाता है, अनुभाग देखें {{Section link||§ यादृच्छिक समस्या का निर्धारक समतुल्य}})
और, इसके अलावा, दो-चरण की समस्या को एक बड़ी रैखिक प्रोग्रामिंग समस्या के रूप में तैयार किया जा सकता है (इसे मूल समस्या का नियतात्मक समतुल्य कहा जाता है, खंड देखें {{Section link||Deterministic equivalent of a stochastic problem}}).
 


कब <math>\xi</math> संभावित प्राप्तियों की एक अनंत (या बहुत बड़ी) संख्या है, तो परिदृश्यों द्वारा इस वितरण का प्रतिनिधित्व करने के लिए मानक दृष्टिकोण है। यह दृष्टिकोण तीन प्रश्न उठाता है, अर्थात्:
कब <math>\xi</math> संभावित प्राप्तियों की एक अनंत (या बहुत बड़ी) संख्या है, तो परिदृश्यों द्वारा इस वितरण का प्रतिनिधित्व करने के लिए मानक दृष्टिकोण है। यह दृष्टिकोण तीन प्रश्न उठाता है, अर्थात्:


# परिदृश्यों का निर्माण कैसे करें, देखें {{Section link||Scenario construction}};
# परिदृश्यों का निर्माण कैसे करें, देखें {{Section link||Scenario construction}};
# नियतात्मक समतुल्य को कैसे हल करें। [[सीप्लेक्स]], और [[जीएनयू रैखिक प्रोग्रामिंग किट]] जैसे अनुकूलक बड़ी रैखिक/अरैखिक समस्याओं को हल कर सकते हैं। एनईओएस सर्वर,<ref name="neos">{{Cite web|url=http://www.neos-server.org/neos/|title = NEOS Server for Optimization}}</ref> विस्कॉन्सिन विश्वविद्यालय, मैडिसन में होस्ट किया गया, कई आधुनिक सॉल्वरों तक मुफ्त पहुंच की अनुमति देता है। अपघटन विधियों को लागू करने के लिए नियतात्मक समतुल्य की संरचना विशेष रूप से उत्तरदायी है,<ref>{{cite book|first2=Alexander|last2=Shapiro|last1=Ruszczyński|first1=Andrzej|title=Stochastic Programming|publisher=[[Elsevier]]|year=2003|isbn=978-0444508546|series=Handbooks in Operations Research and Management Science|volume=10|location=Philadelphia|pages=700|author1-link=Andrzej Piotr Ruszczyński}}</ref> जैसे बेंडर्स अपघटन या परिदृश्य अपघटन;
#नियतात्मक समतुल्य को कैसे हल करें। [[सीप्लेक्स|सीपीएलईएक्स]], और [[जीएनयू रैखिक प्रोग्रामिंग किट]] (जीएलपीके) जैसे अनुकूलक बड़ी रैखिक/अरैखिक समस्याओं को हल कर सकते हैं। एनईओएस सर्वर,<ref name="neos">{{Cite web|url=http://www.neos-server.org/neos/|title = NEOS Server for Optimization}}</ref> विस्कॉन्सिन विश्वविद्यालय, मैडिसन में होस्ट किया गया, कई आधुनिक सॉल्वरों तक मुफ्त पहुंच की अनुमति देता है। नियतात्मक समकक्ष की संरचना अपघटन विधियों को लागू करने के लिए विशेष रूप से उत्तरदायी है,<ref>{{cite book|first2=Alexander|last2=Shapiro|last1=Ruszczyński|first1=Andrzej|title=Stochastic Programming|publisher=[[Elsevier]]|year=2003|isbn=978-0444508546|series=Handbooks in Operations Research and Management Science|volume=10|location=Philadelphia|pages=700|author1-link=Andrzej Piotr Ruszczyński}}</ref> जैसे बेंडर्स अपघटन या परिदृश्य अपघटन;
# सही इष्टतम के संबंध में प्राप्त समाधान की गुणवत्ता को कैसे मापें।
#"सही" इष्टतम के संबंध में प्राप्त समाधान की गुणवत्ता को कैसे मापें।


ये प्रश्न स्वतंत्र नहीं हैं। उदाहरण के लिए, निर्मित परिदृश्यों की संख्या नियतात्मक समतुल्य की सुवाह्यता और प्राप्त समाधानों की गुणवत्ता दोनों को प्रभावित करेगी।
ये प्रश्न स्वतंत्र नहीं हैं। उदाहरण के लिए, निर्मित परिदृश्यों की संख्या नियतात्मक समतुल्य की सुवाह्यता और प्राप्त समाधानों की गुणवत्ता दोनों को प्रभावित करेगी।


== स्टोकेस्टिक [[रैखिक कार्यक्रम]]िंग ==
== प्रसंभाव्य रैखिक प्रोग्राम ==
एक स्टोचैस्टिक लीनियर प्रोग्राम क्लासिकल टू-स्टेज स्टोकेस्टिक प्रोग्राम का एक विशिष्ट उदाहरण है। एक स्टोकेस्टिक एलपी मल्टी-पीरियड लीनियर प्रोग्राम (एलपी) के संग्रह से बनाया गया है, जिनमें से प्रत्येक की संरचना समान है लेकिन कुछ अलग डेटा है। <math>k^{th}</math> एच> दो-अवधि एलपी, प्रतिनिधित्व करते हैं <math>k^{th}</math> परिदृश्य, निम्नलिखित रूप होने के रूप में माना जा सकता है:
एक प्रसंभाव्य [[रैखिक कार्यक्रम|रैखिक प्रोग्राम]] क्लासिकल टू-स्टेज स्टोकेस्टिक प्रोग्राम का एक विशिष्ट उदाहरण है। एक स्टोकेस्टिक एलपी मल्टी-पीरियड लीनियर प्रोग्राम (एलपी) के संग्रह से बनाया गया है, जिनमें से प्रत्येक की संरचना समान है लेकिन कुछ अलग डेटा है। <math>k^{th}</math> एच> दो-अवधि एलपी, प्रतिनिधित्व करते हैं <math>k^{th}</math> परिदृश्य, निम्नलिखित रूप होने के रूप में माना जा सकता है:


<math>
<math>
Line 69: Line 60:
\end{array}
\end{array}
</math>
</math>
वैक्टर <math>x</math> और <math>y</math> प्रथम-अवधि के चर होते हैं, जिनके मान तुरंत चुने जाने चाहिए। सदिश <math>z_k</math> बाद की अवधि के लिए सभी चर शामिल हैं। विवशताएँ <math>Tx + Uy = r</math> केवल प्रथम-अवधि के चर शामिल होते हैं और प्रत्येक परिदृश्य में समान होते हैं। अन्य बाधाओं में बाद की अवधि के चर शामिल हैं और भविष्य के बारे में अनिश्चितता को दर्शाते हुए परिदृश्य से परिदृश्य में कुछ मामलों में भिन्न हैं।
 
वैक्टर <math>x</math> और <math>y</math> में प्रथम-अवधि चर होते हैं, जिनके मान तुरंत चुने जाने चाहिए। सदिश <math>z_k</math> में बाद की अवधि के लिए सभी चर शामिल हैं। विवशताएँ <math>Tx + Uy = r</math> में केवल प्रथम-अवधि चर शामिल होते हैं और प्रत्येक परिदृश्य में समान होते हैं। अन्य बाधाओं में बाद की अवधि के चर शामिल हैं और भविष्य के बारे में अनिश्चितता को दर्शाते हुए परिदृश्य से परिदृश्य में कुछ मामलों में भिन्न हैं।


ध्यान दें कि हल करना <math>k^{th}</math> दो-अवधि एलपी मानने के बराबर है <math>k^{th}</math> बिना किसी अनिश्चितता के दूसरी अवधि में परिदृश्य। दूसरे चरण में अनिश्चितताओं को शामिल करने के लिए, किसी को अलग-अलग परिदृश्यों के लिए संभावनाओं को आवंटित करना चाहिए और संबंधित नियतात्मक समतुल्य को हल करना चाहिए।
ध्यान दें कि हल करना <math>k^{th}</math> दो-अवधि एलपी मानने के बराबर है <math>k^{th}</math> बिना किसी अनिश्चितता के दूसरी अवधि में परिदृश्य। दूसरे चरण में अनिश्चितताओं को शामिल करने के लिए, किसी को अलग-अलग परिदृश्यों के लिए संभावनाओं को आवंटित करना चाहिए और संबंधित नियतात्मक समतुल्य को हल करना चाहिए।


=== एक स्टोकास्टिक समस्या के नियतात्मक समकक्ष ===
=== एक स्टोकास्टिक समस्या के नियतात्मक समकक्ष ===
परिमित संख्या में परिदृश्यों के साथ, दो-चरण स्टोकेस्टिक रैखिक कार्यक्रमों को बड़ी रैखिक प्रोग्रामिंग समस्याओं के रूप में तैयार किया जा सकता है। इस सूत्रीकरण को अक्सर नियतात्मक समतुल्य रैखिक कार्यक्रम कहा जाता है, या नियतात्मक समतुल्य के लिए संक्षिप्त किया जाता है। (सख्ती से एक नियतात्मक समकक्ष बोलना कोई भी गणितीय कार्यक्रम है जिसका उपयोग इष्टतम प्रथम-चरण के निर्णय की गणना करने के लिए किया जा सकता है, इसलिए ये निरंतर संभाव्यता वितरण के लिए भी मौजूद रहेंगे, जब कोई किसी बंद रूप में दूसरे चरण की लागत का प्रतिनिधित्व कर सकता है।)
परिमित संख्या में परिदृश्यों के साथ, दो-चरण स्टोकेस्टिक रैखिक कार्यक्रमों को बड़ी रैखिक प्रोग्रामिंग समस्याओं के रूप में तैयार किया जा सकता है। इस सूत्रीकरण को अक्सर नियतात्मक समतुल्य रैखिक कार्यक्रम कहा जाता है, या नियतात्मक समतुल्य के लिए संक्षिप्त किया जाता है। (सख्ती से एक नियतात्मक समतुल्य बोलना कोई भी गणितीय कार्यक्रम है जिसका उपयोग इष्टतम प्रथम-चरण के निर्णय की गणना करने के लिए किया जा सकता है, इसलिए ये निरंतर संभाव्यता वितरण के लिए भी मौजूद रहेंगे, जब कोई किसी बंद रूप में दूसरे चरण की लागत का प्रतिनिधित्व कर सकता है।) के लिए उदाहरण के लिए, उपरोक्त स्टोकेस्टिक रैखिक कार्यक्रम के समतुल्य समतुल्य बनाने के लिए, हम एक प्रायिकता प्रदान करते हैं <math>p_k</math> प्रत्येक परिदृश्य के लिए <math>k=1,\dots,K</math>
उदाहरण के लिए, उपरोक्त स्टोकेस्टिक रैखिक कार्यक्रम के समतुल्य नियतात्मक बनाने के लिए, हम एक प्रायिकता प्रदान करते हैं <math>p_k</math> प्रत्येक परिदृश्य के लिए <math>k=1,\dots,K</math>. फिर हम सभी परिदृश्यों से बाधाओं के अधीन उद्देश्य के अपेक्षित मूल्य को कम कर सकते हैं:
 
फिर हम सभी परिदृश्यों से बाधाओं के अधीन उद्देश्य के अपेक्षित मूल्य को कम कर सकते हैं:


<math>
<math>
Line 88: Line 81:
\end{array}
\end{array}
</math>
</math>
हमारे पास एक अलग वेक्टर है <math>z_k</math> प्रत्येक परिदृश्य के लिए बाद की अवधि के चर <math>k</math>. पहली अवधि के चर <math>x</math> और <math>y</math> हालाँकि, हर परिदृश्य में समान हैं, क्योंकि हमें यह जानने से पहले पहली अवधि के लिए निर्णय लेना चाहिए कि कौन सा परिदृश्य साकार होगा। नतीजतन, बाधाओं को शामिल करना <math>x</math> और <math>y</math> आवश्यकता केवल एक बार निर्दिष्ट की जानी चाहिए, जबकि शेष बाधाओं को प्रत्येक परिदृश्य के लिए अलग से दिया जाना चाहिए।
हमारे पास एक अलग वेक्टर है <math>z_k</math> प्रत्येक परिदृश्य के लिए बाद की
 
हमारे पास एक अलग वेक्टर है  प्रत्येक परिदृश्य के लिए बाद की अवधि के चर <math>k</math>पहली अवधि के चर <math>x</math> और <math>y</math> हालाँकि, हर परिदृश्य में y समान होते हैं, क्योंकि हमें यह जानने से पहले पहली अवधि के लिए निर्णय लेना चाहिए कि कौन सा परिदृश्य साकार होगा। नतीजतन, बाधाओं को शामिल करना <math>x</math> और <math>y</math> को केवल एक बार निर्दिष्ट करने की आवश्यकता है, जबकि शेष बाधाओं को प्रत्येक परिदृश्य के लिए अलग से दिया जाना चाहिए।


== परिदृश्य निर्माण ==
== परिदृश्य निर्माण ==
व्यवहार में भविष्य पर विशेषज्ञों की राय जानने के द्वारा परिदृश्यों का निर्माण करना संभव हो सकता है। निर्मित परिदृश्यों की संख्या अपेक्षाकृत मामूली होनी चाहिए ताकि प्राप्त नियतात्मक समतुल्य को उचित कम्प्यूटेशनल प्रयास से हल किया जा सके। अक्सर यह दावा किया जाता है कि केवल कुछ परिदृश्यों का उपयोग करने वाला एक समाधान केवल एक परिदृश्य को मानने वाले समाधान की तुलना में अधिक अनुकूलनीय योजनाएं प्रदान करता है। कुछ मामलों में ऐसे दावे को अनुकरण द्वारा सत्यापित किया जा सकता है। सिद्धांत रूप में गारंटी के कुछ उपाय कि एक प्राप्त समाधान मूल समस्या को उचित सटीकता के साथ हल करता है। आम तौर पर अनुप्रयोगों में केवल प्रथम चरण इष्टतम समाधान <math>x^*</math> एक व्यावहारिक मूल्य है क्योंकि लगभग हमेशा यादृच्छिक डेटा का एक वास्तविक बोध निर्मित (उत्पन्न) परिदृश्यों के सेट से अलग होगा।
व्यवहार में भविष्य पर विशेषज्ञों की राय जानने के द्वारा परिदृश्यों का निर्माण करना संभव हो सकता है। निर्मित परिदृश्यों की संख्या अपेक्षाकृत मामूली होनी चाहिए ताकि प्राप्त नियतात्मक समतुल्य को उचित कम्प्यूटेशनल प्रयास से हल किया जा सके। अक्सर यह दावा किया जाता है कि केवल कुछ परिदृश्यों का उपयोग करने वाला एक समाधान केवल एक परिदृश्य को मानने वाले समाधान की तुलना में अधिक अनुकूलनीय योजनाएं प्रदान करता है। कुछ मामलों में ऐसे दावे को अनुकरण द्वारा सत्यापित किया जा सकता है। सिद्धांत रूप में गारंटी के कुछ उपाय कि एक प्राप्त समाधान मूल समस्या को उचित सटीकता के साथ हल करता है। आम तौर पर अनुप्रयोगों में केवल प्रथम चरण इष्टतम समाधान <math>x^*</math> का एक व्यावहारिक मूल्य है क्योंकि लगभग हमेशा यादृच्छिक डेटा का "सत्य" अहसास निर्मित (उत्पन्न) परिदृश्यों के सेट से अलग होगा।


कल्पना करना <math>\xi</math> रोकना <math>d</math> स्वतंत्र यादृच्छिक घटक, जिनमें से प्रत्येक में तीन संभावित अहसास हैं (उदाहरण के लिए, प्रत्येक यादृच्छिक पैरामीटर की भविष्य की प्राप्ति को निम्न, मध्यम और उच्च के रूप में वर्गीकृत किया गया है), तो परिदृश्यों की कुल संख्या है <math>K=3^d</math>. परिदृश्यों की संख्या में इस तरह की घातीय वृद्धि उचित आकार के लिए भी विशेषज्ञ की राय का उपयोग करके मॉडल विकास को बहुत कठिन बना देती है <math>d</math>. स्थिति और भी खराब हो जाती है अगर कुछ यादृच्छिक घटक <math>\xi</math> निरंतर वितरण है।
कल्पना करना <math>\xi</math> में शामिल है <math>d</math> स्वतंत्र यादृच्छिक घटक, जिनमें से प्रत्येक में तीन संभावित अहसास हैं (उदाहरण के लिए, प्रत्येक यादृच्छिक मापदंडों की भविष्य की प्राप्ति को निम्न, मध्यम और उच्च के रूप में वर्गीकृत किया गया है), तो परिदृश्यों की कुल संख्या है <math>K=3^d</math>परिदृश्यों की संख्या में इस तरह की घातीय वृद्धि उचित आकार के लिए भी विशेषज्ञ की राय का उपयोग करके मॉडल विकास को बहुत कठिन बना देती है <math>d</math>स्थिति और भी खराब हो जाती है अगर कुछ यादृच्छिक घटक <math>\xi</math> का निरंतर वितरण है।


=== मोंटे कार्लो नमूनाकरण और नमूना औसत सन्निकटन (SAA) विधि ===
=== मोंटे कार्लो नमूनाकरण और नमूना औसत सन्निकटन (SAA) विधि ===
Line 111: Line 106:
\end{array}
\end{array}
</math>
</math>
इस सूत्रीकरण को नमूना औसत सन्निकटन विधि के रूप में जाना जाता है। SAA समस्या माने गए नमूने का एक कार्य है और इस अर्थ में यादृच्छिक है। दिए गए नमूने के लिए <math>\xi^1,\xi^2,\dots,\xi^N</math> SAA समस्या परिदृश्यों के साथ दो-चरण स्टोकेस्टिक रैखिक प्रोग्रामिंग समस्या के समान रूप की है <math>\xi^j</math>., <math>j=1,\dots,N</math>, प्रत्येक को समान संभावना के साथ लिया गया <math>p_j=\frac{1}{N}</math>.
इस सूत्रीकरण को नमूना औसत सन्निकटन विधि के रूप में जाना जाता है। SAA समस्या माने गए नमूने का एक कार्य है और इस अर्थ में यादृच्छिक है। दिए गए नमूने के लिए <math>\xi^1,\xi^2,\dots,\xi^N</math> SAA समस्या परिदृश्यों के साथ दो-चरण प्रसंभाव्य रैखिक प्रोग्रामिंग समस्या के समान रूप की है <math>\xi^j</math>., <math>j=1,\dots,N</math>, प्रत्येक को समान संभावना के साथ लिया गया <math>p_j=\frac{1}{N}</math>.


== सांख्यिकीय निष्कर्ष ==
== सांख्यिकीय निष्कर्ष ==


निम्नलिखित स्टोकेस्टिक प्रोग्रामिंग समस्या पर विचार करें
निम्नलिखित प्रसंभाव्य प्रोग्रामिंग समस्या पर विचार करें


<div वर्ग = केंद्र शैली = चौड़ाई: ऑटो; मार्जिन-लेफ्ट: ऑटो; मार्जिन-राइट: ऑटो; ><math>
<div वर्ग = केंद्र शैली = चौड़ाई: ऑटो; मार्जिन-लेफ्ट: ऑटो; मार्जिन-राइट: ऑटो; ><math>
Line 121: Line 116:
</math></div>
</math></div>


यहाँ <math>X</math> का एक गैर-रिक्त बंद उपसमुच्चय है <math>\mathbb{R}^n</math>, <math>\xi</math> एक यादृच्छिक सदिश है जिसका संभाव्यता वितरण <math>P</math> एक सेट पर समर्थित है <math>\Xi \subset \mathbb{R}^d</math>, और <math>Q: X \times \Xi \rightarrow \mathbb{R}</math>. टू-स्टेज स्टोकेस्टिक प्रोग्रामिंग के ढांचे में, <math>Q(x,\xi)</math> संबंधित दूसरे चरण की समस्या के इष्टतम मूल्य द्वारा दिया गया है।
यहाँ <math>X</math> का एक गैर-रिक्त बंद उपसमुच्चय है <math>\mathbb{R}^n</math>, <math>\xi</math> एक यादृच्छिक सदिश है जिसका संभाव्यता वितरण <math>P</math> एक सेट पर समर्थित है <math>\Xi \subset \mathbb{R}^d</math>, और <math>Q: X \times \Xi \rightarrow \mathbb{R}</math>. टू-स्टेज प्रसंभाव्य प्रोग्रामिंग के ढांचे में, <math>Q(x,\xi)</math> संबंधित दूसरे चरण की समस्या के इष्टतम मूल्य द्वारा दिया गया है।


ये मान लीजिए <math>g(x)</math> सभी के लिए अच्छी तरह से परिभाषित और परिमित मूल्यवान है <math>x\in X</math>. इसका तात्पर्य है कि प्रत्येक के लिए <math>x\in X</math> मूल्य <math>Q(x,\xi)</math> लगभग निश्चित है।
ये मान लीजिए <math>g(x)</math> सभी के लिए अच्छी तरह से परिभाषित और परिमित मूल्यवान है <math>x\in X</math>. इसका तात्पर्य है कि प्रत्येक के लिए <math>x\in X</math> मूल्य <math>Q(x,\xi)</math> लगभग निश्चित है।
Line 168: Line 163:
:: तब <math>\hat{\vartheta}_N \rightarrow \vartheta^*</math> और <math>\mathbb{D}(S^*,\hat{S}_N)\rightarrow 0 </math> प्रायिकता 1 के रूप में <math>N\rightarrow \infty </math>.
:: तब <math>\hat{\vartheta}_N \rightarrow \vartheta^*</math> और <math>\mathbb{D}(S^*,\hat{S}_N)\rightarrow 0 </math> प्रायिकता 1 के रूप में <math>N\rightarrow \infty </math>.


=== एसएए इष्टतम मूल्य === के स्पर्शोन्मुख
=== एसएए इष्टतम मूल्य के स्पर्शोन्मुख ===
 
मान लीजिए नमूना <math>\xi^1,\dots,\xi^N</math> आई.आई.डी. और एक बिंदु तय करें <math>x \in X</math>. फिर नमूना औसत अनुमानक <math>\hat{g}_N(x)</math>, का <math>g(x)</math>, निष्पक्ष है और इसमें विचरण है <math>\frac{1}{N}\sigma^2(x)</math>, कहाँ <math>\sigma^2(x):=Var[Q(x,\xi)]</math> परिमित माना जाता है। इसके अलावा, [[केंद्रीय सीमा प्रमेय]] द्वारा हमारे पास वह है
मान लीजिए नमूना <math>\xi^1,\dots,\xi^N</math> आई.आई.डी. और एक बिंदु तय करें <math>x \in X</math>. फिर नमूना औसत अनुमानक <math>\hat{g}_N(x)</math>, का <math>g(x)</math>, निष्पक्ष है और इसमें विचरण है <math>\frac{1}{N}\sigma^2(x)</math>, कहाँ <math>\sigma^2(x):=Var[Q(x,\xi)]</math> परिमित माना जाता है। इसके अलावा, [[केंद्रीय सीमा प्रमेय]] द्वारा हमारे पास वह है


<div वर्ग = केंद्र शैली = चौड़ाई: ऑटो; मार्जिन-लेफ्ट: ऑटो; मार्जिन-राइट: ऑटो; ><math>
<div वर्ग="केंद्र" शैली="चौड़ाई:" ऑटो; मार्जिन-लेफ्ट: मार्जिन-राइट:><math>
\sqrt{N} [\hat{g}_N-  g(x)] \xrightarrow{\mathcal{D}} Y_x
\sqrt{N} [\hat{g}_N-  g(x)] \xrightarrow{\mathcal{D}} Y_x
</math></div>
</math></div>
Line 180: Line 174:
दूसरे शब्दों में, <math>\hat{g}_N(x)</math> विषम रूप से सामान्य वितरण है, यानी, बड़े के लिए <math>N</math>, <math>\hat{g}_N(x)</math> माध्य के साथ लगभग सामान्य वितरण है <math>g(x)</math> और विचरण <math>\frac{1}{N}\sigma^2(x)</math>. यह निम्नलिखित (अनुमानित) की ओर जाता है <math>100(1-\alpha)</math>के लिए % विश्वास अंतराल <math>f(x)</math>:
दूसरे शब्दों में, <math>\hat{g}_N(x)</math> विषम रूप से सामान्य वितरण है, यानी, बड़े के लिए <math>N</math>, <math>\hat{g}_N(x)</math> माध्य के साथ लगभग सामान्य वितरण है <math>g(x)</math> और विचरण <math>\frac{1}{N}\sigma^2(x)</math>. यह निम्नलिखित (अनुमानित) की ओर जाता है <math>100(1-\alpha)</math>के लिए % विश्वास अंतराल <math>f(x)</math>:


<div वर्ग = केंद्र शैली = चौड़ाई: ऑटो; मार्जिन-लेफ्ट: ऑटो; मार्जिन-राइट: ऑटो; > <math>
<div वर्ग="केंद्र" शैली="चौड़ाई:" ऑटो; मार्जिन-लेफ्ट: मार्जिन-राइट:> <math>
\left[ \hat{g}_N(x)-z_{\alpha/2} \frac{\hat{\sigma}(x)}{\sqrt{N}}, \hat{g}_N(x)+z_{\alpha/2} \frac{\hat{\sigma}(x)}{\sqrt{N}}\right]
\left[ \hat{g}_N(x)-z_{\alpha/2} \frac{\hat{\sigma}(x)}{\sqrt{N}}, \hat{g}_N(x)+z_{\alpha/2} \frac{\hat{\sigma}(x)}{\sqrt{N}}\right]
</math></div>
</math></div>
Line 186: Line 180:
कहाँ <math>z_{\alpha/2}:=\Phi^{-1}(1-\alpha/2)</math> (यहाँ <math>\Phi(\cdot)</math> मानक सामान्य वितरण के सीडीएफ को दर्शाता है) और
कहाँ <math>z_{\alpha/2}:=\Phi^{-1}(1-\alpha/2)</math> (यहाँ <math>\Phi(\cdot)</math> मानक सामान्य वितरण के सीडीएफ को दर्शाता है) और


<div वर्ग = केंद्र शैली = चौड़ाई: ऑटो; मार्जिन-लेफ्ट: ऑटो; मार्जिन-राइट: ऑटो; ><math>
<div वर्ग="केंद्र" शैली="चौड़ाई:" ऑटो; मार्जिन-लेफ्ट: मार्जिन-राइट:><math>
\hat{\sigma}^2(x) := \frac{1}{N-1}\sum_{j=1}^{N} \left[ Q(x,\xi^j)-\frac{1}{N} \sum_{j=1}^N Q(x,\xi^j) \right]^2
\hat{\sigma}^2(x) := \frac{1}{N-1}\sum_{j=1}^{N} \left[ Q(x,\xi^j)-\frac{1}{N} \sum_{j=1}^N Q(x,\xi^j) \right]^2
</math></div>
</math></div>
Line 195: Line 189:


=== जैविक अनुप्रयोग ===
=== जैविक अनुप्रयोग ===
[[स्टोचैस्टिक गतिशील प्रोग्रामिंग]] का उपयोग व्यवहारिक पारिस्थितिकी जैसे क्षेत्रों में नैतिकता को मॉडल करने के लिए अक्सर किया जाता है।<ref>Mangel, M. & Clark, C. W. 1988. ''Dynamic modeling in behavioral ecology.'' Princeton University Press {{ISBN|0-691-08506-4}}</ref><ref>Houston, A. I & McNamara, J. M. 1999. ''Models of adaptive behaviour: an approach based on state''. Cambridge University Press {{ISBN|0-521-65539-0}}</ref> [[इष्टतम फोर्जिंग सिद्धांत]] के मॉडल के अनुभवजन्य परीक्षण, [[जैविक जीवन चक्र]] | जीवन-इतिहास संक्रमण जैसे कि [[परजीवी]] ततैया में [[कलियाना]] और अंडे देना व्यवहारिक निर्णय लेने के विकास की व्याख्या करने में इस मॉडलिंग तकनीक के मूल्य को दर्शाता है। ये मॉडल आम तौर पर दो चरणों के बजाय कई चरणों वाले होते हैं।
व्यावहारिक पारिस्थितिकी जैसे क्षेत्रों में जानवरों के व्यवहार को मॉडल करने के लिए अक्सर [[स्टोचैस्टिक गतिशील प्रोग्रामिंग]] का उपयोग किया जाता है।<ref>Mangel, M. & Clark, C. W. 1988. ''Dynamic modeling in behavioral ecology.'' Princeton University Press {{ISBN|0-691-08506-4}}</ref><ref>Houston, A. I & McNamara, J. M. 1999. ''Models of adaptive behaviour: an approach based on state''. Cambridge University Press {{ISBN|0-521-65539-0}}</ref> [[इष्टतम फोर्जिंग सिद्धांत|इष्टतम फोर्जिंग]] के मॉडल के अनुभवजन्य परीक्षण, [[जैविक जीवन चक्र]] संक्रमण जैसे कि पक्षियों में [[कलियाना|भागना]] और [[परजीवी]] ततैया में अंडे देना व्यवहारिक निर्णय लेने के विकास की व्याख्या करने में इस मॉडलिंग तकनीक के मूल्य को दर्शाता है। ये मॉडल आम तौर पर दो चरणों के बजाय कई चरणों वाले होते हैं।


=== आर्थिक अनुप्रयोग ===
=== आर्थिक अनुप्रयोग ===
अनिश्चितता के तहत निर्णय लेने को समझने में स्टोकेस्टिक डायनेमिक प्रोग्रामिंग एक उपयोगी उपकरण है। अनिश्चितता के तहत पूंजीगत स्टॉक का संचय एक उदाहरण है; अक्सर इसका उपयोग संसाधन अर्थशास्त्रियों द्वारा निकोलस जॉर्जस्कु-रोगेन#मैन27 के आर्थिक संघर्ष और मानव जाति के सामाजिक विकास का विश्लेषण करने के लिए किया जाता है।28जैव अर्थशास्त्र।29<ref>Howitt, R., Msangi, S., Reynaud, A and K. Knapp. 2002. [http://www.agecon.ucdavis.edu/aredepart/facultydocs/Howitt/Polyapprox3a.pdf "Using Polynomial Approximations to Solve Stochastic Dynamic Programming Problems: or A "Betty Crocker " Approach to SDP."]  University of California, Davis, Department of Agricultural and Resource Economics Working Paper.</ref> जहां अनिश्चितता प्रवेश करती है जैसे कि मौसम आदि।
अनिश्चितता के तहत निर्णय लेने को समझने में स्टोकेस्टिक डायनेमिक प्रोग्रामिंग एक उपयोगी उपकरण है। अनिश्चितता के तहत पूंजीगत स्टॉक का संचय एक उदाहरण है; अक्सर इसका उपयोग संसाधन अर्थशास्त्रियों द्वारा जैव आर्थिक समस्याओं का विश्लेषण करने के लिए किया जाता है<ref>Howitt, R., Msangi, S., Reynaud, A and K. Knapp. 2002. [http://www.agecon.ucdavis.edu/aredepart/facultydocs/Howitt/Polyapprox3a.pdf "Using Polynomial Approximations to Solve Stochastic Dynamic Programming Problems: or A "Betty Crocker " Approach to SDP."]  University of California, Davis, Department of Agricultural and Resource Economics Working Paper.</ref> जहां मौसम, आदि में अनिश्चितता प्रवेश करती है।


=== उदाहरण: मल्टीस्टेज पोर्टफोलियो अनुकूलन ===
=== उदाहरण: मल्टीस्टेज पोर्टफोलियो अनुकूलन ===
{{Main|Intertemporal portfolio choice}}
{{Main|अंतर्कालिक पोर्टफोलियो चयन}}
{{See also|Merton's portfolio problem}}
{{See also|मर्टन की पोर्टफोलियो समस्या}}
निम्नलिखित मल्टी-स्टेज स्टोकेस्टिक प्रोग्रामिंग के वित्त से एक उदाहरण है।
 
निम्नलिखित मल्टी-स्टेज प्रसंभाव्य प्रोग्रामिंग के वित्त से एक उदाहरण है।
मान लीजिए कि समय पर <math>t=0</math> हमारे पास प्रारंभिक पूंजी है <math>W_0</math> में निवेश करना <math>n</math> संपत्तियां। आगे मान लीजिए कि हमें समय-समय पर अपने पोर्टफोलियो को पुनर्संतुलित करने की अनुमति है <math>t=1,\dots,T-1</math> लेकिन इसमें अतिरिक्त नकदी डाले बिना। प्रत्येक अवधि में <math>t</math> हम वर्तमान धन के पुनर्वितरण के बारे में निर्णय लेते हैं <math>W_t</math> बिच में <math>n</math> संपत्तियां। होने देना <math>x_0=(x_{10},\dots,x_{n0})</math> एन संपत्ति में निवेश की गई प्रारंभिक राशि हो। हम चाहते हैं कि प्रत्येक <math>x_{i0}</math> अऋणात्मक है और वह संतुलन समीकरण है <math>\sum_{i=1}^{n}x_{i0}=W_0</math> धारण करना चाहिए।
मान लीजिए कि समय पर <math>t=0</math> हमारे पास प्रारंभिक पूंजी है <math>W_0</math> में निवेश करना <math>n</math> संपत्तियां। आगे मान लीजिए कि हमें समय-समय पर अपने पोर्टफोलियो को पुनर्संतुलित करने की अनुमति है <math>t=1,\dots,T-1</math> लेकिन इसमें अतिरिक्त नकदी डाले बिना। प्रत्येक अवधि में <math>t</math> हम वर्तमान धन के पुनर्वितरण के बारे में निर्णय लेते हैं <math>W_t</math> बिच में <math>n</math> संपत्तियां। होने देना <math>x_0=(x_{10},\dots,x_{n0})</math> एन संपत्ति में निवेश की गई प्रारंभिक राशि हो। हम चाहते हैं कि प्रत्येक <math>x_{i0}</math> अऋणात्मक है और वह संतुलन समीकरण है <math>\sum_{i=1}^{n}x_{i0}=W_0</math> धारण करना चाहिए।


Line 223: Line 218:
\max E[U(W_T)].
\max E[U(W_T)].
</math>
</math>
यह एक मल्टीस्टेज स्टोचैस्टिक प्रोग्रामिंग समस्या है, जहाँ से चरणों को क्रमांकित किया जाता है <math>t=0</math> को <math>t=T-1</math>. अनुकूलन सभी कार्यान्वयन योग्य और व्यवहार्य नीतियों पर किया जाता है। समस्या के विवरण को पूरा करने के लिए किसी को भी यादृच्छिक प्रक्रिया के संभाव्यता वितरण को परिभाषित करने की आवश्यकता होती है <math>\xi_1,\dots,\xi_T</math>. यह विभिन्न तरीकों से किया जा सकता है। उदाहरण के लिए, प्रक्रिया के समय के विकास को परिभाषित करने वाला एक विशेष परिदृश्य वृक्ष का निर्माण कर सकता है। यदि प्रत्येक स्तर पर प्रत्येक परिसंपत्ति के यादृच्छिक रिटर्न को दो निरंतरताओं की अनुमति दी जाती है, अन्य संपत्तियों से स्वतंत्र, तो परिदृश्यों की कुल संख्या है <math>2^{nT}.</math>
यह एक मल्टीस्टेज स्टोचैस्टिक प्रोग्रामिंग समस्या है, जहाँ से चरणों को क्रमांकित किया जाता है <math>t=0</math> से <math>t=T-1</math>अनुकूलन सभी कार्यान्वयन योग्य और व्यवहार्य नीतियों पर किया जाता है। समस्या के विवरण को पूरा करने के लिए किसी को भी यादृच्छिक प्रक्रिया के संभाव्यता वितरण को परिभाषित करने की आवश्यकता होती है <math>\xi_1,\dots,\xi_T</math>यह विभिन्न तरीकों से किया जा सकता है। उदाहरण के लिए, प्रक्रिया के समय के विकास को परिभाषित करने वाला एक विशेष परिदृश्य वृक्ष का निर्माण कर सकता है। यदि प्रत्येक स्तर पर प्रत्येक परिसंपत्ति के यादृच्छिक रिटर्न को दो निरंतरताओं की अनुमति दी जाती है, अन्य संपत्तियों से स्वतंत्र, तो परिदृश्यों की कुल संख्या है <math>2^{nT}.</math>।}
 
[[गतिशील प्रोग्रामिंग]] समीकरण लिखने के लिए, उपरोक्त मल्टीस्टेज समस्या को समय में पिछड़ने पर विचार करें। अंतिम चरण में <math>t=T-1</math>, एक अहसास <math>\xi_{[T-1]}=(\xi_{1},\dots,\xi_{T-1})</math> यादृच्छिक प्रक्रिया ज्ञात है और <math>x_{T-2}</math> चुना गया है। इसलिए, निम्नलिखित समस्या को हल करने की आवश्यकता है
[[गतिशील प्रोग्रामिंग]] समीकरण लिखने के लिए, उपरोक्त मल्टीस्टेज समस्या को समय में पिछड़ने पर विचार करें। अंतिम चरण में <math>t=T-1</math>, एक अहसास <math>\xi_{[T-1]}=(\xi_{1},\dots,\xi_{T-1})</math> यादृच्छिक प्रक्रिया ज्ञात है और <math>x_{T-2}</math> चुना गया है। इसलिए, निम्नलिखित समस्या को हल करने की आवश्यकता है


Line 256: Line 252:
\end{array}
\end{array}
</math>
</math>


==== चरणवार स्वतंत्र यादृच्छिक प्रक्रिया ====
==== चरणवार स्वतंत्र यादृच्छिक प्रक्रिया ====
Line 285: Line 280:


===मॉडलिंग भाषाएं===
===मॉडलिंग भाषाएं===
सभी असतत स्टोकेस्टिक प्रोग्रामिंग समस्याओं को किसी भी [[बीजगणितीय मॉडलिंग भाषा]] के साथ प्रदर्शित किया जा सकता है, मैन्युअल रूप से स्पष्ट या निहित गैर-प्रत्याशाकता को लागू करने के लिए यह सुनिश्चित करने के लिए कि परिणामी मॉडल प्रत्येक चरण में उपलब्ध कराई गई जानकारी की संरचना का सम्मान करता है।
सभी असतत स्टोकेस्टिक प्रोग्रामिंग समस्याओं को किसी भी [[बीजगणितीय मॉडलिंग भाषा]] के साथ प्रदर्शित किया जा सकता है, मैन्युअल रूप से स्पष्ट या निहित गैर-प्रत्याशाकता को लागू करने के लिए यह सुनिश्चित करने के लिए कि परिणामी मॉडल प्रत्येक चरण में उपलब्ध कराई गई जानकारी की संरचना का सम्मान करता है। एक सामान्य मॉडलिंग भाषा द्वारा उत्पन्न एक SP समस्या का एक उदाहरण काफी बड़ा हो जाता है (रैखिक रूप से परिदृश्यों की संख्या में), और इसका मैट्रिक्स उस संरचना को खो देता है जो समस्याओं के इस वर्ग के लिए आंतरिक है, जिसका समाधान समय पर अन्यथा शोषण किया जा सकता है विशिष्ट अपघटन एल्गोरिदम। विशेष रूप से SP के लिए डिज़ाइन की गई मॉडलिंग भाषाओं के एक्सटेंशन दिखाई देने लगे हैं, देखें:
एक सामान्य मॉडलिंग भाषा द्वारा उत्पन्न एक SP समस्या का एक उदाहरण काफी बड़ा हो जाता है (रैखिक रूप से परिदृश्यों की संख्या में), और इसका मैट्रिक्स उस संरचना को खो देता है जो समस्याओं के इस वर्ग के लिए आंतरिक है, जिसका समाधान समय पर अन्यथा शोषण किया जा सकता है विशिष्ट अपघटन एल्गोरिदम।
विशेष रूप से SP के लिए डिज़ाइन की गई मॉडलिंग भाषाओं के एक्सटेंशन दिखाई देने लगे हैं, देखें:
*[[एआईएमएमएस]] - एसपी समस्याओं की परिभाषा का समर्थन करता है
*[[एआईएमएमएस]] - एसपी समस्याओं की परिभाषा का समर्थन करता है
*विस्तारित गणितीय प्रोग्रामिंग (ईएमपी)#स्टोचैस्टिक प्रोग्रामिंग के लिए ईएमपी (स्टोचैस्टिक प्रोग्रामिंग के लिए विस्तारित गणितीय प्रोग्रामिंग) - सामान्य बीजगणितीय मॉडलिंग सिस्टम का एक मॉड्यूल जो स्टोचैस्टिक प्रोग्रामिंग की सुविधा के लिए बनाया गया है (इसमें पैरामीट्रिक वितरण के लिए कीवर्ड शामिल हैं, मौके की कमी और जोखिम के उपाय जैसे जोखिम पर मूल्य और [[अपेक्षित कमी]])।
*ईएमपी एसपी (स्टोचैस्टिक प्रोग्रामिंग के लिए विस्तारित गणितीय प्रोग्रामिंग) - स्टोकेस्टिक प्रोग्रामिंग को सुविधाजनक बनाने के लिए जीएएमएस का एक मॉड्यूल बनाया गया है (इसमें पैरामीट्रिक वितरण के लिए कीवर्ड, मौका की कमी और जोखिम के उपाय जैसे जोखिम पर मूल्य और [[अपेक्षित कमी]] शामिल है)।
*एस[[एएमपीएल]] - एएमपीएल के एक्सटेंशन का एक सेट विशेष रूप से स्टोकास्टिक प्रोग्राम व्यक्त करने के लिए डिज़ाइन किया गया है (मौका बाधाओं के लिए सिंटैक्स शामिल है, एकीकृत मौके की कमी और [[मजबूत अनुकूलन]] समस्याएं शामिल हैं)
*[[एएमपीएल|एसएएमपीएल]] - एएमपीएल के एक्सटेंशन का एक सेट विशेष रूप से स्टोकास्टिक प्रोग्राम व्यक्त करने के लिए डिज़ाइन किया गया है (मौका बाधाओं के लिए सिंटैक्स शामिल है, एकीकृत मौके की कमी और [[मजबूत अनुकूलन]] समस्याएं)
वे दोनों SMPS उदाहरण स्तर प्रारूप उत्पन्न कर सकते हैं, जो सॉल्वर को समस्या की संरचना को गैर-निरर्थक रूप में बताता है।
वे दोनों SMPS उदाहरण स्तर प्रारूप उत्पन्न कर सकते हैं, जो सॉल्वर को समस्या की संरचना को गैर-निरर्थक रूप में बताता है।


Line 296: Line 289:


* [[सहसंबंध अंतराल]]
* [[सहसंबंध अंतराल]]
* स्टोकेस्टिक प्रोग्रामिंग के लिए विस्तारित गणितीय प्रोग्रामिंग (ईएमपी)#ईएमपी
* प्रसंभाव्य प्रोग्रामिंग के लिए विस्तारित गणितीय प्रोग्रामिंग (ईएमपी)
* [[जोखिम में एंट्रोपिक मूल्य]]
* [[जोखिम में एंट्रोपिक मूल्य|जोखिम में एंट्रोपिक मान]]
* [[ContSP]]
* [[ContSP|फोर्टएसपी]]
* एसएएमपीएल
* एसएएमपीएल बीजगणितीय मॉडलिंग भाषा
* [[परिदृश्य अनुकूलन]]
* [[परिदृश्य अनुकूलन]]
* स्टोकेस्टिक अनुकूलन
* प्रसंभाव्य अनुकूलन
* [[मौका-विवश पोर्टफोलियो चयन]]
* [[मौका-विवश पोर्टफोलियो चयन|अवसर-व्यवरोधित पोर्टफोलियो चयन]]


==संदर्भ==
==संदर्भ==
{{Reflist|30em}}
{{Reflist|30em}}


==अग्रिम पठन==
==अग्रिम पठन==

Revision as of 13:06, 16 February 2023

गणितीय अनुकूलन के क्षेत्र में, प्रसंभाव्य प्रोग्रामिंग या स्टोकेस्टिक प्रोग्रामिंग मॉडलिंग अनुकूलन समस्याओं के लिए एक ढांचा है जिसमें अनिश्चितता शामिल है। एक स्टोचैस्टिक प्रोग्राम एक अनुकूलन समस्या है जिसमें कुछ या सभी समस्या पैरामीटर अनिश्चित हैं, लेकिन ज्ञात संभाव्यता वितरण का पालन करते हैं।[1][2] यह ढांचा नियतात्मक अनुकूलन के विपरीत है, जिसमें सभी समस्या मापदंडों को सटीक रूप से ज्ञात माना जाता है। प्रसंभाव्य प्रोग्रामिंग का लक्ष्य एक निर्णय खोजना है जो निर्णय निर्माता द्वारा चुने गए कुछ मानदंडों का अनुकूलन करता है, और समस्या के मापदंडों की अनिश्चितता के लिए उचित रूप से खाता है। क्योंकि कई वास्तविक दुनिया के निर्णयों में अनिश्चितता शामिल है, प्रसंभाव्य प्रोग्रामिंग ने वित्त से लेकर परिवहन से लेकर ऊर्जा अनुकूलन तक के क्षेत्रों की एक विस्तृत श्रृंखला में आवेदन पाया है।[3][4]

दो चरण की समस्याएँ

दो-चरण स्टोकेस्टिक प्रोग्रामिंग का मूल विचार यह है कि (इष्टतम) निर्णय निर्णय किए जाने के समय उपलब्ध आंकड़ों पर आधारित होने चाहिए और भविष्य की टिप्पणियों पर निर्भर नहीं हो सकते। स्टोचैस्टिक प्रोग्रामिंग में दो-चरण सूत्रीकरण का व्यापक रूप से उपयोग किया जाता है। दो-चरण स्टोकास्टिक प्रोग्रामिंग समस्या का सामान्य सूत्रीकरण निम्न द्वारा दिया गया है:

कहाँ दूसरे चरण की समस्या का इष्टतम मूल्य है
क्लासिकल टू-स्टेज लीनियर स्टोचैस्टिक प्रोग्रामिंग प्रॉब्लम्स को इस रूप में तैयार किया जा सकता है
कहाँ दूसरे चरण की समस्या का इष्टतम मूल्य है
ऐसे सूत्रीकरण में प्रथम-चरण निर्णय चर वेक्टर है, दूसरे चरण का निर्णय चर वेक्टर है, और दूसरे चरण की समस्या का डेटा शामिल है। इस सूत्रीकरण में, पहले चरण में हमें अभी और अभी निर्णय लेना है अनिश्चित डेटा की प्राप्ति से पहले , एक यादृच्छिक वेक्टर के रूप में देखा जाता है। दूसरे चरण में, की प्राप्ति के बाद उपलब्ध हो जाता है, हम उपयुक्त अनुकूलन समस्या को हल करके अपने व्यवहार को अनुकूलित करते हैं।

पहले चरण में हम लागत का अनुकूलन करते हैं (उपर्युक्त फॉर्मूलेशन में न्यूनतम)। प्रथम चरण के निर्णय के साथ साथ (इष्टतम) दूसरे चरण के निर्णय की अपेक्षित लागत। हम दूसरे चरण की समस्या को केवल एक अनुकूलन समस्या के रूप में देख सकते हैं जो अनिश्चित डेटा के प्रकट होने पर हमारे अनुमानित इष्टतम व्यवहार का वर्णन करती है, या हम इसके समाधान को एक सहारा कार्रवाई के रूप में मान सकते हैं जहां शब्द सिस्टम की संभावित असंगति के लिए क्षतिपूर्ति करता है और इस सहारा कार्रवाई की लागत है।

माना जाने वाला द्वि-चरण समस्या रैखिक है क्योंकि उद्देश्य कार्य और बाधाएं रैखिक हैं। संकल्पनात्मक रूप से यह आवश्यक नहीं है और कोई अधिक सामान्य दो-चरण स्टोकेस्टिक कार्यक्रमों पर विचार कर सकता है। उदाहरण के लिए, यदि प्रथम-चरण की समस्या पूर्णांक है, तो कोई प्रथम-चरण की समस्या में अभिन्नता की कमी को जोड़ सकता है ताकि व्यवहार्य सेट असतत हो। जरूरत पड़ने पर गैर-रैखिक उद्देश्यों और बाधाओं को भी शामिल किया जा सकता है।[5]

वितरण धारणा

उपरोक्त दो-चरण की समस्या का सूत्रीकरण दूसरे चरण के डेटा को मानता है एक 'ज्ञात' संभाव्यता वितरण के साथ एक यादृच्छिक वेक्टर के रूप में तैयार किया गया है। यह कई स्थितियों में उचित होगा। उदाहरण के लिए, का वितरण ऐतिहासिक डेटा से अनुमान लगाया जा सकता है यदि कोई मानता है कि समय की अवधि में वितरण महत्वपूर्ण रूप से नहीं बदलता है। इसके अलावा, नमूने के अनुभवजन्य वितरण का उपयोग भविष्य के मूल्यों के वितरण के अनुमान के रूप में किया जा सकता है . यदि किसी के पास पूर्व मॉडल है , कोई बायेसियन अपडेट द्वारा पोस्टरियरी वितरण प्राप्त कर सकता है।

विवेक

संख्यात्मक रूप से दो-चरण की प्रसंभाव्य समस्या को हल करने के लिए, अक्सर यह मानने की आवश्यकता होती है कि यादृच्छिक वेक्टर संभावित अहसासों की एक सीमित संख्या होती है, जिन्हें परिदृश्य कहा जाता है , संबंधित संभाव्यता द्रव्यमान के साथ . तब प्रथम चरण की समस्या के उद्देश्य समारोह में अपेक्षा को योग के रूप में लिखा जा सकता है:

और, इसके अलावा, दो-चरण की समस्या को एक बड़ी रैखिक प्रोग्रामिंग समस्या के रूप में तैयार किया जा सकता है (इसे मूल समस्या का नियतात्मक समतुल्य कहा जाता है, अनुभाग देखें § § यादृच्छिक समस्या का निर्धारक समतुल्य)।


कब संभावित प्राप्तियों की एक अनंत (या बहुत बड़ी) संख्या है, तो परिदृश्यों द्वारा इस वितरण का प्रतिनिधित्व करने के लिए मानक दृष्टिकोण है। यह दृष्टिकोण तीन प्रश्न उठाता है, अर्थात्:

  1. परिदृश्यों का निर्माण कैसे करें, देखें § Scenario construction;
  2. नियतात्मक समतुल्य को कैसे हल करें। सीपीएलईएक्स, और जीएनयू रैखिक प्रोग्रामिंग किट (जीएलपीके) जैसे अनुकूलक बड़ी रैखिक/अरैखिक समस्याओं को हल कर सकते हैं। एनईओएस सर्वर,[6] विस्कॉन्सिन विश्वविद्यालय, मैडिसन में होस्ट किया गया, कई आधुनिक सॉल्वरों तक मुफ्त पहुंच की अनुमति देता है। नियतात्मक समकक्ष की संरचना अपघटन विधियों को लागू करने के लिए विशेष रूप से उत्तरदायी है,[7] जैसे बेंडर्स अपघटन या परिदृश्य अपघटन;
  3. "सही" इष्टतम के संबंध में प्राप्त समाधान की गुणवत्ता को कैसे मापें।

ये प्रश्न स्वतंत्र नहीं हैं। उदाहरण के लिए, निर्मित परिदृश्यों की संख्या नियतात्मक समतुल्य की सुवाह्यता और प्राप्त समाधानों की गुणवत्ता दोनों को प्रभावित करेगी।

प्रसंभाव्य रैखिक प्रोग्राम

एक प्रसंभाव्य रैखिक प्रोग्राम क्लासिकल टू-स्टेज स्टोकेस्टिक प्रोग्राम का एक विशिष्ट उदाहरण है। एक स्टोकेस्टिक एलपी मल्टी-पीरियड लीनियर प्रोग्राम (एलपी) के संग्रह से बनाया गया है, जिनमें से प्रत्येक की संरचना समान है लेकिन कुछ अलग डेटा है। एच> दो-अवधि एलपी, प्रतिनिधित्व करते हैं परिदृश्य, निम्नलिखित रूप होने के रूप में माना जा सकता है:

वैक्टर और में प्रथम-अवधि चर होते हैं, जिनके मान तुरंत चुने जाने चाहिए। सदिश में बाद की अवधि के लिए सभी चर शामिल हैं। विवशताएँ में केवल प्रथम-अवधि चर शामिल होते हैं और प्रत्येक परिदृश्य में समान होते हैं। अन्य बाधाओं में बाद की अवधि के चर शामिल हैं और भविष्य के बारे में अनिश्चितता को दर्शाते हुए परिदृश्य से परिदृश्य में कुछ मामलों में भिन्न हैं।

ध्यान दें कि हल करना दो-अवधि एलपी मानने के बराबर है बिना किसी अनिश्चितता के दूसरी अवधि में परिदृश्य। दूसरे चरण में अनिश्चितताओं को शामिल करने के लिए, किसी को अलग-अलग परिदृश्यों के लिए संभावनाओं को आवंटित करना चाहिए और संबंधित नियतात्मक समतुल्य को हल करना चाहिए।

एक स्टोकास्टिक समस्या के नियतात्मक समकक्ष

परिमित संख्या में परिदृश्यों के साथ, दो-चरण स्टोकेस्टिक रैखिक कार्यक्रमों को बड़ी रैखिक प्रोग्रामिंग समस्याओं के रूप में तैयार किया जा सकता है। इस सूत्रीकरण को अक्सर नियतात्मक समतुल्य रैखिक कार्यक्रम कहा जाता है, या नियतात्मक समतुल्य के लिए संक्षिप्त किया जाता है। (सख्ती से एक नियतात्मक समतुल्य बोलना कोई भी गणितीय कार्यक्रम है जिसका उपयोग इष्टतम प्रथम-चरण के निर्णय की गणना करने के लिए किया जा सकता है, इसलिए ये निरंतर संभाव्यता वितरण के लिए भी मौजूद रहेंगे, जब कोई किसी बंद रूप में दूसरे चरण की लागत का प्रतिनिधित्व कर सकता है।) के लिए उदाहरण के लिए, उपरोक्त स्टोकेस्टिक रैखिक कार्यक्रम के समतुल्य समतुल्य बनाने के लिए, हम एक प्रायिकता प्रदान करते हैं प्रत्येक परिदृश्य के लिए

फिर हम सभी परिदृश्यों से बाधाओं के अधीन उद्देश्य के अपेक्षित मूल्य को कम कर सकते हैं:

हमारे पास एक अलग वेक्टर है प्रत्येक परिदृश्य के लिए बाद की

हमारे पास एक अलग वेक्टर है प्रत्येक परिदृश्य के लिए बाद की अवधि के चर । पहली अवधि के चर और हालाँकि, हर परिदृश्य में y समान होते हैं, क्योंकि हमें यह जानने से पहले पहली अवधि के लिए निर्णय लेना चाहिए कि कौन सा परिदृश्य साकार होगा। नतीजतन, बाधाओं को शामिल करना और को केवल एक बार निर्दिष्ट करने की आवश्यकता है, जबकि शेष बाधाओं को प्रत्येक परिदृश्य के लिए अलग से दिया जाना चाहिए।

परिदृश्य निर्माण

व्यवहार में भविष्य पर विशेषज्ञों की राय जानने के द्वारा परिदृश्यों का निर्माण करना संभव हो सकता है। निर्मित परिदृश्यों की संख्या अपेक्षाकृत मामूली होनी चाहिए ताकि प्राप्त नियतात्मक समतुल्य को उचित कम्प्यूटेशनल प्रयास से हल किया जा सके। अक्सर यह दावा किया जाता है कि केवल कुछ परिदृश्यों का उपयोग करने वाला एक समाधान केवल एक परिदृश्य को मानने वाले समाधान की तुलना में अधिक अनुकूलनीय योजनाएं प्रदान करता है। कुछ मामलों में ऐसे दावे को अनुकरण द्वारा सत्यापित किया जा सकता है। सिद्धांत रूप में गारंटी के कुछ उपाय कि एक प्राप्त समाधान मूल समस्या को उचित सटीकता के साथ हल करता है। आम तौर पर अनुप्रयोगों में केवल प्रथम चरण इष्टतम समाधान का एक व्यावहारिक मूल्य है क्योंकि लगभग हमेशा यादृच्छिक डेटा का "सत्य" अहसास निर्मित (उत्पन्न) परिदृश्यों के सेट से अलग होगा।

कल्पना करना में शामिल है स्वतंत्र यादृच्छिक घटक, जिनमें से प्रत्येक में तीन संभावित अहसास हैं (उदाहरण के लिए, प्रत्येक यादृच्छिक मापदंडों की भविष्य की प्राप्ति को निम्न, मध्यम और उच्च के रूप में वर्गीकृत किया गया है), तो परिदृश्यों की कुल संख्या है । परिदृश्यों की संख्या में इस तरह की घातीय वृद्धि उचित आकार के लिए भी विशेषज्ञ की राय का उपयोग करके मॉडल विकास को बहुत कठिन बना देती है । स्थिति और भी खराब हो जाती है अगर कुछ यादृच्छिक घटक का निरंतर वितरण है।

मोंटे कार्लो नमूनाकरण और नमूना औसत सन्निकटन (SAA) विधि

एक प्रबंधनीय आकार के लिए निर्धारित परिदृश्य को कम करने के लिए एक सामान्य दृष्टिकोण मोंटे कार्लो सिमुलेशन का उपयोग करना है। मान लीजिए परिदृश्यों की कुल संख्या बहुत बड़ी या अनंत है। आगे मान लीजिए कि हम एक नमूना उत्पन्न कर सकते हैं का यादृच्छिक वेक्टर की प्रतिकृति . आमतौर पर नमूने को स्वतंत्र और समान रूप से वितरित (i.i.d नमूना) माना जाता है। एक नमूना दिया गया है, अपेक्षा फलन नमूना औसत द्वारा अनुमानित है

और फलस्वरूप प्रथम चरण की समस्या द्वारा दी गई है

इस सूत्रीकरण को नमूना औसत सन्निकटन विधि के रूप में जाना जाता है। SAA समस्या माने गए नमूने का एक कार्य है और इस अर्थ में यादृच्छिक है। दिए गए नमूने के लिए SAA समस्या परिदृश्यों के साथ दो-चरण प्रसंभाव्य रैखिक प्रोग्रामिंग समस्या के समान रूप की है ., , प्रत्येक को समान संभावना के साथ लिया गया .

सांख्यिकीय निष्कर्ष

निम्नलिखित प्रसंभाव्य प्रोग्रामिंग समस्या पर विचार करें

यहाँ का एक गैर-रिक्त बंद उपसमुच्चय है , एक यादृच्छिक सदिश है जिसका संभाव्यता वितरण एक सेट पर समर्थित है , और . टू-स्टेज प्रसंभाव्य प्रोग्रामिंग के ढांचे में, संबंधित दूसरे चरण की समस्या के इष्टतम मूल्य द्वारा दिया गया है।

ये मान लीजिए सभी के लिए अच्छी तरह से परिभाषित और परिमित मूल्यवान है . इसका तात्पर्य है कि प्रत्येक के लिए मूल्य लगभग निश्चित है।

मान लीजिए कि हमारे पास एक नमूना है का यादृच्छिक वेक्टर की प्राप्ति . इस यादृच्छिक नमूने को ऐतिहासिक डेटा के रूप में देखा जा सकता है के अवलोकन , या इसे मोंटे कार्लो सैंपलिंग तकनीकों द्वारा उत्पन्न किया जा सकता है। तब हम एक संगत नमूना औसत सन्निकटन तैयार कर सकते हैं

बड़ी संख्या के कानून के अनुसार हमारे पास कुछ नियमितता शर्तों के तहत है प्रायिकता 1 से बिंदुवार अभिसरित होता है जैसा . इसके अलावा, हल्के अतिरिक्त परिस्थितियों में अभिसरण एक समान है। हमारे पास भी है , अर्थात।, का निष्पक्ष आकलनकर्ता है . इसलिए, यह उम्मीद करना स्वाभाविक है कि SAA समस्या का इष्टतम मूल्य और इष्टतम समाधान वास्तविक समस्या के अपने समकक्षों के साथ अभिसरण करते हैं क्योंकि .

एसएए अनुमानकों की संगति

संभव सेट मान लीजिए SAA समस्या का समाधान निश्चित है, अर्थात यह नमूने से स्वतंत्र है। होने देना और वास्तविक समस्या का क्रमशः इष्टतम मूल्य और इष्टतम समाधान का सेट हो और चलो और SAA समस्या का क्रमशः इष्टतम मूल्य और इष्टतम समाधान का सेट हो।

  1. होने देना और (नियतात्मक) वास्तविक मूल्यवान कार्यों का एक क्रम हो। निम्नलिखित दो गुण समतुल्य हैं:
    • किसी के लिए और कोई अनुक्रम में अभिसरण यह इस प्रकार है कि में विलीन हो जाता है
    • कार्यक्रम निरंतर चालू है और में विलीन हो जाता है के किसी भी कॉम्पैक्ट सबसेट पर समान रूप से
  2. यदि SAA समस्या का उद्देश्य वास्तविक समस्या के उद्देश्य में परिवर्तित हो जाता है संभाव्यता 1 के साथ, जैसा , समान रूप से व्यवहार्य सेट पर . तब में विलीन हो जाता है प्रायिकता 1 के रूप में .
  3. मान लीजिए कि एक कॉम्पैक्ट सेट मौजूद है ऐसा है कि
    • सेट वास्तविक समस्या का इष्टतम समाधान रिक्त नहीं है और इसमें निहित है
    • कार्यक्रम परिमित मूल्यवान और निरंतर है
    • कार्यों का क्रम में विलीन हो जाता है संभाव्यता 1 के साथ, जैसा , समान रूप से
    • के लिए काफी बड़ा सेट खाली नहीं है और संभाव्यता 1 के साथ
तब और प्रायिकता 1 के रूप में . ध्यान दें कि सेट के विचलन को दर्शाता है सेट से , के रूप में परिभाषित

कुछ स्थितियों में व्यवहार्य सेट SAA समस्या का अनुमान लगाया जाता है, तो संबंधित SAA समस्या का रूप ले लेती है

कहाँ का उपसमुच्चय है नमूने के आधार पर और इसलिए यादृच्छिक है। फिर भी, SAA आकलनकर्ताओं के लिए निरंतरता परिणाम अभी भी कुछ अतिरिक्त धारणाओं के तहत प्राप्त किए जा सकते हैं:

  1. मान लीजिए कि एक कॉम्पैक्ट सेट मौजूद है ऐसा है कि
    • सेट वास्तविक समस्या का इष्टतम समाधान रिक्त नहीं है और इसमें निहित है
    • कार्यक्रम परिमित मूल्यवान और निरंतर है
    • कार्यों का क्रम में विलीन हो जाता है संभाव्यता 1 के साथ, जैसा , समान रूप से
    • के लिए काफी बड़ा सेट खाली नहीं है और संभाव्यता 1 के साथ
    • अगर और प्रायिकता 1 के साथ एक बिंदु पर अभिसरित होता है , तब
    • कुछ बिंदु के लिए एक क्रम होता है ऐसा है कि संभाव्यता 1 के साथ।
तब और प्रायिकता 1 के रूप में .

एसएए इष्टतम मूल्य के स्पर्शोन्मुख

मान लीजिए नमूना आई.आई.डी. और एक बिंदु तय करें . फिर नमूना औसत अनुमानक , का , निष्पक्ष है और इसमें विचरण है , कहाँ परिमित माना जाता है। इसके अलावा, केंद्रीय सीमा प्रमेय द्वारा हमारे पास वह है

कहाँ वितरण में अभिसरण को दर्शाता है और माध्य के साथ एक सामान्य वितरण है और विचरण , के रूप में लिखा गया है .

दूसरे शब्दों में, विषम रूप से सामान्य वितरण है, यानी, बड़े के लिए , माध्य के साथ लगभग सामान्य वितरण है और विचरण . यह निम्नलिखित (अनुमानित) की ओर जाता है के लिए % विश्वास अंतराल :

कहाँ (यहाँ मानक सामान्य वितरण के सीडीएफ को दर्शाता है) और

का नमूना प्रसरण अनुमान है . यानी के आकलन में त्रुटि आदेश का (संकीर्ण रूप से) है .

अनुप्रयोग और उदाहरण

जैविक अनुप्रयोग

व्यावहारिक पारिस्थितिकी जैसे क्षेत्रों में जानवरों के व्यवहार को मॉडल करने के लिए अक्सर स्टोचैस्टिक गतिशील प्रोग्रामिंग का उपयोग किया जाता है।[8][9] इष्टतम फोर्जिंग के मॉडल के अनुभवजन्य परीक्षण, जैविक जीवन चक्र संक्रमण जैसे कि पक्षियों में भागना और परजीवी ततैया में अंडे देना व्यवहारिक निर्णय लेने के विकास की व्याख्या करने में इस मॉडलिंग तकनीक के मूल्य को दर्शाता है। ये मॉडल आम तौर पर दो चरणों के बजाय कई चरणों वाले होते हैं।

आर्थिक अनुप्रयोग

अनिश्चितता के तहत निर्णय लेने को समझने में स्टोकेस्टिक डायनेमिक प्रोग्रामिंग एक उपयोगी उपकरण है। अनिश्चितता के तहत पूंजीगत स्टॉक का संचय एक उदाहरण है; अक्सर इसका उपयोग संसाधन अर्थशास्त्रियों द्वारा जैव आर्थिक समस्याओं का विश्लेषण करने के लिए किया जाता है[10] जहां मौसम, आदि में अनिश्चितता प्रवेश करती है।

उदाहरण: मल्टीस्टेज पोर्टफोलियो अनुकूलन

निम्नलिखित मल्टी-स्टेज प्रसंभाव्य प्रोग्रामिंग के वित्त से एक उदाहरण है। मान लीजिए कि समय पर हमारे पास प्रारंभिक पूंजी है में निवेश करना संपत्तियां। आगे मान लीजिए कि हमें समय-समय पर अपने पोर्टफोलियो को पुनर्संतुलित करने की अनुमति है लेकिन इसमें अतिरिक्त नकदी डाले बिना। प्रत्येक अवधि में हम वर्तमान धन के पुनर्वितरण के बारे में निर्णय लेते हैं बिच में संपत्तियां। होने देना एन संपत्ति में निवेश की गई प्रारंभिक राशि हो। हम चाहते हैं कि प्रत्येक अऋणात्मक है और वह संतुलन समीकरण है धारण करना चाहिए।

कुल रिटर्न पर विचार करें प्रत्येक अवधि के लिए . यह एक वेक्टर-मूल्यवान यादृच्छिक प्रक्रिया बनाता है . समय अवधि में , हम राशियों को निर्दिष्ट करके पोर्टफोलियो को पुनर्संतुलित कर सकते हैं संबंधित संपत्तियों में निवेश किया। उस समय पहली अवधि में रिटर्न का एहसास हो गया है, इसलिए इस जानकारी का उपयोग पुनर्संतुलन निर्णय में करना उचित है। इस प्रकार, दूसरे चरण के फैसले, समय पर , वास्तव में यादृच्छिक वेक्टर की प्राप्ति के कार्य हैं , अर्थात।, . इसी तरह, समय पर निर्णय एक कार्य है द्वारा उपलब्ध कराई गई जानकारी के अनुसार समय-समय पर यादृच्छिक प्रक्रिया का इतिहास . कार्यों का एक क्रम , , साथ स्थिर होने के नाते, निर्णय प्रक्रिया की कार्यान्वयन योग्य नीति को परिभाषित करता है। ऐसा कहा जाता है कि ऐसी नीति संभव है यदि यह संभावना 1 के साथ मॉडल की कमी को पूरा करती है, यानी गैर-नकारात्मकता की कमी , , , और धन की कमी का संतुलन,

जहां अवधि में धन द्वारा दिया गया है

जो यादृच्छिक प्रक्रिया की प्राप्ति और समय तक के निर्णयों पर निर्भर करता है .

मान लीजिए कि उद्देश्य अंतिम अवधि में इस धन की अपेक्षित उपयोगिता को अधिकतम करना है, अर्थात समस्या पर विचार करना

यह एक मल्टीस्टेज स्टोचैस्टिक प्रोग्रामिंग समस्या है, जहाँ से चरणों को क्रमांकित किया जाता है से । अनुकूलन सभी कार्यान्वयन योग्य और व्यवहार्य नीतियों पर किया जाता है। समस्या के विवरण को पूरा करने के लिए किसी को भी यादृच्छिक प्रक्रिया के संभाव्यता वितरण को परिभाषित करने की आवश्यकता होती है । यह विभिन्न तरीकों से किया जा सकता है। उदाहरण के लिए, प्रक्रिया के समय के विकास को परिभाषित करने वाला एक विशेष परिदृश्य वृक्ष का निर्माण कर सकता है। यदि प्रत्येक स्तर पर प्रत्येक परिसंपत्ति के यादृच्छिक रिटर्न को दो निरंतरताओं की अनुमति दी जाती है, अन्य संपत्तियों से स्वतंत्र, तो परिदृश्यों की कुल संख्या है ।}

गतिशील प्रोग्रामिंग समीकरण लिखने के लिए, उपरोक्त मल्टीस्टेज समस्या को समय में पिछड़ने पर विचार करें। अंतिम चरण में , एक अहसास यादृच्छिक प्रक्रिया ज्ञात है और चुना गया है। इसलिए, निम्नलिखित समस्या को हल करने की आवश्यकता है

कहाँ की सशर्त अपेक्षा को दर्शाता है दिया गया . उपरोक्त समस्या का इष्टतम मूल्य इस पर निर्भर करता है और और निरूपित किया जाता है .

इसी तरह, चरणों में , समस्या का समाधान करना चाहिए

जिसका इष्टतम मूल्य द्वारा निरूपित किया जाता है . अंत में, मंच पर , एक समस्या हल करता है

चरणवार स्वतंत्र यादृच्छिक प्रक्रिया

प्रक्रिया के सामान्य वितरण के लिए , इन गतिशील प्रोग्रामिंग समीकरणों को हल करना कठिन हो सकता है। यदि प्रक्रिया नाटकीय रूप से सरल हो जाती है चरणवार स्वतंत्र है, अर्थात, से स्वतंत्र है के लिए . इस मामले में, संबंधित सशर्त अपेक्षाएं बिना शर्त अपेक्षाएं और कार्य बन जाती हैं , पर निर्भर नहीं है . वह है, समस्या का इष्टतम मूल्य है

और का इष्टतम मूल्य है

के लिए .

सॉफ्टवेयर उपकरण

मॉडलिंग भाषाएं

सभी असतत स्टोकेस्टिक प्रोग्रामिंग समस्याओं को किसी भी बीजगणितीय मॉडलिंग भाषा के साथ प्रदर्शित किया जा सकता है, मैन्युअल रूप से स्पष्ट या निहित गैर-प्रत्याशाकता को लागू करने के लिए यह सुनिश्चित करने के लिए कि परिणामी मॉडल प्रत्येक चरण में उपलब्ध कराई गई जानकारी की संरचना का सम्मान करता है। एक सामान्य मॉडलिंग भाषा द्वारा उत्पन्न एक SP समस्या का एक उदाहरण काफी बड़ा हो जाता है (रैखिक रूप से परिदृश्यों की संख्या में), और इसका मैट्रिक्स उस संरचना को खो देता है जो समस्याओं के इस वर्ग के लिए आंतरिक है, जिसका समाधान समय पर अन्यथा शोषण किया जा सकता है विशिष्ट अपघटन एल्गोरिदम। विशेष रूप से SP के लिए डिज़ाइन की गई मॉडलिंग भाषाओं के एक्सटेंशन दिखाई देने लगे हैं, देखें:

  • एआईएमएमएस - एसपी समस्याओं की परिभाषा का समर्थन करता है
  • ईएमपी एसपी (स्टोचैस्टिक प्रोग्रामिंग के लिए विस्तारित गणितीय प्रोग्रामिंग) - स्टोकेस्टिक प्रोग्रामिंग को सुविधाजनक बनाने के लिए जीएएमएस का एक मॉड्यूल बनाया गया है (इसमें पैरामीट्रिक वितरण के लिए कीवर्ड, मौका की कमी और जोखिम के उपाय जैसे जोखिम पर मूल्य और अपेक्षित कमी शामिल है)।
  • एसएएमपीएल - एएमपीएल के एक्सटेंशन का एक सेट विशेष रूप से स्टोकास्टिक प्रोग्राम व्यक्त करने के लिए डिज़ाइन किया गया है (मौका बाधाओं के लिए सिंटैक्स शामिल है, एकीकृत मौके की कमी और मजबूत अनुकूलन समस्याएं)

वे दोनों SMPS उदाहरण स्तर प्रारूप उत्पन्न कर सकते हैं, जो सॉल्वर को समस्या की संरचना को गैर-निरर्थक रूप में बताता है।

यह भी देखें

संदर्भ

  1. Shapiro, Alexander; Dentcheva, Darinka; Ruszczyński, Andrzej (2009). Lectures on stochastic programming: Modeling and theory (PDF). MPS/SIAM Series on Optimization. Vol. 9. Philadelphia, PA: Society for Industrial and Applied Mathematics (SIAM). Mathematical Programming Society (MPS). pp. xvi+436. ISBN 978-0-89871-687-0. MR 2562798.
  2. Birge, John R.; Louveaux, François (2011). Introduction to Stochastic Programming. Springer Series in Operations Research and Financial Engineering (in British English). doi:10.1007/978-1-4614-0237-4. ISBN 978-1-4614-0236-7. ISSN 1431-8598.
  3. Stein W. Wallace and William T. Ziemba (eds.). Applications of Stochastic Programming. MPS-SIAM Book Series on Optimization 5, 2005.
  4. Applications of stochastic programming are described at the following website, Stochastic Programming Community.
  5. Shapiro, Alexander; Philpott, Andy. A tutorial on Stochastic Programming (PDF).
  6. "NEOS Server for Optimization".
  7. Ruszczyński, Andrzej; Shapiro, Alexander (2003). Stochastic Programming. Handbooks in Operations Research and Management Science. Vol. 10. Philadelphia: Elsevier. p. 700. ISBN 978-0444508546.
  8. Mangel, M. & Clark, C. W. 1988. Dynamic modeling in behavioral ecology. Princeton University Press ISBN 0-691-08506-4
  9. Houston, A. I & McNamara, J. M. 1999. Models of adaptive behaviour: an approach based on state. Cambridge University Press ISBN 0-521-65539-0
  10. Howitt, R., Msangi, S., Reynaud, A and K. Knapp. 2002. "Using Polynomial Approximations to Solve Stochastic Dynamic Programming Problems: or A "Betty Crocker " Approach to SDP." University of California, Davis, Department of Agricultural and Resource Economics Working Paper.

अग्रिम पठन


बाहरी संबंध