सिमुलेशन आधारित अनुकूलन: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
 
Line 1: Line 1:
{{short description|Form of optimization}}
{{short description|Form of optimization}}
सिमुलेशन-आधारित अनुकूलन (सिर्फ सिमुलेशन अनुकूलन के रूप में भी जाना जाता है) [[अनुकूलन (गणित)]] प्रौद्योगिकी को [[कंप्यूटर सिमुलेशन]] मॉडलिंग और विश्लेषण में एकीकृत करता है। अनुकरण की जटिलता के कारण, उद्देश्य फलन का मूल्यांकन करना कठिन और खर्चीला हो सकता है। सामान्यतः, अंतर्निहित सिमुलेशन मॉडल स्टोकेस्टिक होता है, जिससे सांख्यिकीय आकलन प्रौद्योगिकी (सिमुलेशन पद्धति में आउटपुट विश्लेषण कहा जाता है) का उपयोग करके उद्देश्य फ़ंक्शन का अनुमान लगाया जाना चाहिए।
'''सिमुलेशन-आधारित अनुकूलन''' (सिर्फ सिमुलेशन अनुकूलन के रूप में भी जाना जाता है) अनुकूलन (गणित) प्रौद्योगिकी को [[कंप्यूटर सिमुलेशन]] मॉडलिंग और विश्लेषण में एकीकृत करता है। अनुकरण की जटिलता के कारण, उद्देश्य फलन का मूल्यांकन करना कठिन और खर्चीला हो सकता है। सामान्यतः, अंतर्निहित सिमुलेशन मॉडल स्टोकेस्टिक होता है, जिससे सांख्यिकीय आकलन प्रौद्योगिकी (सिमुलेशन पद्धति में आउटपुट विश्लेषण कहा जाता है) का उपयोग करके उद्देश्य फ़ंक्शन का अनुमान लगाया जाना चाहिए।


एक बार एक प्रणाली को गणितीय रूप से प्रतिरूपित करने के बाद, कंप्यूटर-आधारित सिमुलेशन उसके व्यवहार के बारे में जानकारी प्रदान करते हैं। सिस्टम के प्रदर्शन को उत्तम बनाने के लिए पैरामीट्रिक सिमुलेशन विधियों का उपयोग किया जा सकता है। इस पद्धति में, प्रत्येक चर का इनपुट अन्य मापदंडों के स्थिर रहने के साथ भिन्न होता है और डिजाइन उद्देश्य पर प्रभाव देखा जाता है। यह एक समय लेने वाली विधि है और आंशिक रूप से प्रदर्शन में सुधार करती है। न्यूनतम संगणना और समय के साथ इष्टतम समाधान प्राप्त करने के लिए, समस्या को पुनरावृत्त रूप से हल किया जाता है जहां प्रत्येक पुनरावृत्ति में समाधान इष्टतम समाधान के निकट जाता है। ऐसे विधि को 'संख्यात्मक अनुकूलन' या 'सिमुलेशन-आधारित अनुकूलन' के रूप में जाना जाता है।<ref>Nguyen, Anh-Tuan, Sigrid Reiter, and Philippe Rigo. "[https://orbi.uliege.be/bitstream/2268/155988/1/Nguyen%20AT.pdf A review on simulation-based optimization methods applied to building performance analysis]."''Applied Energy'' 113 (2014): 1043–1058.</ref>
एक बार एक प्रणाली को गणितीय रूप से प्रतिरूपित करने के बाद, कंप्यूटर-आधारित सिमुलेशन उसके व्यवहार के बारे में जानकारी प्रदान करते हैं। सिस्टम के प्रदर्शन को उत्तम बनाने के लिए पैरामीट्रिक सिमुलेशन विधियों का उपयोग किया जा सकता है। इस पद्धति में, प्रत्येक चर का इनपुट अन्य मापदंडों के स्थिर रहने के साथ भिन्न होता है और डिजाइन उद्देश्य पर प्रभाव देखा जाता है। यह एक समय लेने वाली विधि है और आंशिक रूप से प्रदर्शन में सुधार करती है। न्यूनतम संगणना और समय के साथ इष्टतम समाधान प्राप्त करने के लिए, समस्या को पुनरावृत्त रूप से हल किया जाता है जहां प्रत्येक पुनरावृत्ति में समाधान इष्टतम समाधान के निकट जाता है। ऐसे विधि को 'संख्यात्मक अनुकूलन' या 'सिमुलेशन-आधारित अनुकूलन' के रूप में जाना जाता है।<ref>Nguyen, Anh-Tuan, Sigrid Reiter, and Philippe Rigo. "[https://orbi.uliege.be/bitstream/2268/155988/1/Nguyen%20AT.pdf A review on simulation-based optimization methods applied to building performance analysis]."''Applied Energy'' 113 (2014): 1043–1058.</ref>
Line 7: Line 7:


विशिष्ट सिमुलेशन-आधारित अनुकूलन विधियों को चित्र 1 के अनुसार निर्णय चर प्रकारों के आधार पर चुना जा सकता है।<ref>Jalali, Hamed, and Inneke Van Nieuwenhuyse. "[https://core.ac.uk/download/pdf/34623919.pdf Simulation optimization in inventory replenishment: a classification]." IIE Transactions 47.11 (2015): 1217-1235.</ref>
विशिष्ट सिमुलेशन-आधारित अनुकूलन विधियों को चित्र 1 के अनुसार निर्णय चर प्रकारों के आधार पर चुना जा सकता है।<ref>Jalali, Hamed, and Inneke Van Nieuwenhuyse. "[https://core.ac.uk/download/pdf/34623919.pdf Simulation optimization in inventory replenishment: a classification]." IIE Transactions 47.11 (2015): 1217-1235.</ref>
[[File:Slide1 1.jpg|thumb|Fig.1 चर प्रकार के अनुसार सिमुलेशन आधारित अनुकूलन का वर्गीकरण]][[अनुकूलन (कंप्यूटर विज्ञान)]] संचालन अनुसंधान की दो मुख्य शाखाओं में सम्मलित है:
[[File:Slide1 1.jpg|thumb|Fig.1 चर प्रकार के अनुसार सिमुलेशन आधारित अनुकूलन का वर्गीकरण]]अनुकूलन (कंप्यूटर विज्ञान) संचालन अनुसंधान की दो मुख्य शाखाओं में सम्मलित है:


अनुकूलन [[पैरामीट्रिक प्रोग्रामिंग]] (स्थैतिक) - इसका उद्देश्य पैरामीटर के मूल्यों को खोजना है, जो सभी राज्यों के लिए "स्थैतिक" हैं, एक समारोह को अधिकतम या कम करने के लक्ष्य के साथ। इस स्थितियोंमें, कोई [[गणितीय प्रोग्रामिंग]] का उपयोग कर सकता है, जैसे [[रैखिक प्रोग्रामिंग]]। इस परिदृश्य में, अनुकरण सहायता करता है जब पैरामीटर में शोर होता है या समस्या का मूल्यांकन इसकी जटिलता के कारण अत्यधिक कंप्यूटर समय की मांग करेगा।<ref name=":0" />
अनुकूलन पैरामीट्रिक प्रोग्रामिंग (स्थैतिक) - इसका उद्देश्य पैरामीटर के मूल्यों को खोजना है, जो सभी राज्यों के लिए "स्थैतिक" हैं, एक समारोह को अधिकतम या कम करने के लक्ष्य के साथ। इस स्थितियोंमें, कोई [[गणितीय प्रोग्रामिंग]] का उपयोग कर सकता है, जैसे [[रैखिक प्रोग्रामिंग]]। इस परिदृश्य में, अनुकरण सहायता करता है जब पैरामीटर में शोर होता है या समस्या का मूल्यांकन इसकी जटिलता के कारण अत्यधिक कंप्यूटर समय की मांग करेगा।<ref name=":0" />


अनुकूलन [[इष्टतम नियंत्रण]] (गतिशील) - इसका उपयोग बड़े पैमाने पर [[कंप्यूटर विज्ञान]] और [[विद्युत अभियन्त्रण]] में किया जाता है। इष्टतम नियंत्रण प्रति राज्य है और उनमें से प्रत्येक में परिणाम बदलते हैं। कोई गणितीय प्रोग्रामिंग, साथ ही गतिशील प्रोग्रामिंग का उपयोग कर सकता है। इस परिदृश्य में, अनुकरण यादृच्छिक नमूने उत्पन्न कर सकता है और जटिल और बड़े पैमाने की समस्याओं को हल कर सकता है।<ref name=":0">Abhijit Gosavi, [http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.462.5587&rep=rep1&type=pdf Simulation‐Based Optimization: Parametric Optimization Techniques and Reinforcement Learning], Springer, 2nd Edition (2015)</ref>
अनुकूलन [[इष्टतम नियंत्रण]] (गतिशील) - इसका उपयोग बड़े पैमाने पर [[कंप्यूटर विज्ञान]] और [[विद्युत अभियन्त्रण]] में किया जाता है। इष्टतम नियंत्रण प्रति राज्य है और उनमें से प्रत्येक में परिणाम बदलते हैं। कोई गणितीय प्रोग्रामिंग, साथ ही गतिशील प्रोग्रामिंग का उपयोग कर सकता है। इस परिदृश्य में, अनुकरण यादृच्छिक नमूने उत्पन्न कर सकता है और जटिल और बड़े पैमाने की समस्याओं को हल कर सकता है।<ref name=":0">Abhijit Gosavi, [http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.462.5587&rep=rep1&type=pdf Simulation‐Based Optimization: Parametric Optimization Techniques and Reinforcement Learning], Springer, 2nd Edition (2015)</ref>
Line 16: Line 16:
== सिमुलेशन-आधारित अनुकूलन विधियां ==
== सिमुलेशन-आधारित अनुकूलन विधियां ==


सिमुलेशन अनुकूलन में कुछ महत्वपूर्ण दृष्टिकोणों पर नीचे चर्चा की गई है।
सिमुलेशन अनुकूलन में कुछ महत्वपूर्ण दृष्टिकोणों पर नीचे चर्चा की गई है।<ref name="Fu">{{cite book|editor-last=Fu|editor-first=Michael|title=Handbook of Simulation Optimization|publisher=Springer|year=2015|url=https://www.springer.com/us/book/9781493913831}}</ref><ref>Spall, J.C. (2003). ''Introduction to Stochastic Search and Optimization: Estimation, Simulation, and Control''. Hoboken: Wiley.</ref>
<ref name=Fu>{{cite book|editor-last=Fu|editor-first=Michael|title=Handbook of Simulation Optimization|publisher=Springer|year=2015|url=https://www.springer.com/us/book/9781493913831}}</ref>
<ref>Spall, J.C. (2003). ''Introduction to Stochastic Search and Optimization: Estimation, Simulation, and Control''. Hoboken: Wiley.</ref>
 
 
=== सांख्यिकीय रैंकिंग और चयन के प्रणाली (आर / एस) ===
=== सांख्यिकीय रैंकिंग और चयन के प्रणाली (आर / एस) ===
रैंकिंग और चयन विधियों को उन समस्याओं के लिए डिज़ाइन किया गया है जहाँ विकल्प निश्चित और ज्ञात हैं, और सिस्टम प्रदर्शन का अनुमान लगाने के लिए सिमुलेशन का उपयोग किया जाता है।
रैंकिंग और चयन विधियों को उन समस्याओं के लिए डिज़ाइन किया गया है जहाँ विकल्प निश्चित और ज्ञात हैं, और सिस्टम प्रदर्शन का अनुमान लगाने के लिए सिमुलेशन का उपयोग किया जाता है।
Line 26: Line 22:
सिमुलेशन अनुकूलन सेटिंग में, लागू विधियों में उदासीनता क्षेत्र दृष्टिकोण, इष्टतम कंप्यूटिंग बजट आवंटन और ज्ञान ढाल एल्गोरिदम सम्मलित हैं।
सिमुलेशन अनुकूलन सेटिंग में, लागू विधियों में उदासीनता क्षेत्र दृष्टिकोण, इष्टतम कंप्यूटिंग बजट आवंटन और ज्ञान ढाल एल्गोरिदम सम्मलित हैं।


=== [[प्रतिक्रिया सतह कार्यप्रणाली]]<nowiki/>लॉजी (RSM)===
=== प्रतिक्रिया सतह कार्यप्रणालीलॉजी (RSM)===
प्रतिक्रिया सतह पद्धति में, उद्देश्य इनपुट चर और प्रतिक्रिया चर के बीच संबंध खोजना है। प्रक्रिया एक रेखीय प्रतिगमन मॉडल को फिट करने की प्रयास से प्रारंभ होती है। यदि पी-मान कम हो जाता है, तो एक उच्च डिग्री बहुपद प्रतिगमन  का उपयोग किया जाएगा, जो  सामान्यतः द्विघात होता है। प्रत्येक सिमुलेशन परीक्षण के लिए इनपुट और प्रतिक्रिया चर के बीच एक अच्छा संबंध खोजने की प्रक्रिया की जाएगी। सिमुलेशन अनुकूलन में, प्रतिक्रिया चर के स्थितियोंमें वांछित परिणाम उत्पन्न करने वाले सर्वोत्तम इनपुट चर खोजने के लिए प्रतिक्रिया सतह विधि का उपयोग किया जा सकता है।<ref>Rahimi Mazrae Shahi, M., Fallah Mehdipour, E. and Amiri, M. (2016), [https://onlinelibrary.wiley.com/doi/abs/10.1111/itor.12150 Optimization using simulation and response surface methodology with an application on subway train scheduling]. Intl. Trans. in Op. Res., 23: 797–811. {{doi|10.1111/itor.12150}}</ref>
प्रतिक्रिया सतह पद्धति में, उद्देश्य इनपुट चर और प्रतिक्रिया चर के बीच संबंध खोजना है। प्रक्रिया एक रेखीय प्रतिगमन मॉडल को फिट करने की प्रयास से प्रारंभ होती है। यदि पी-मान कम हो जाता है, तो एक उच्च डिग्री बहुपद प्रतिगमन  का उपयोग किया जाएगा, जो  सामान्यतः द्विघात होता है। प्रत्येक सिमुलेशन परीक्षण के लिए इनपुट और प्रतिक्रिया चर के बीच एक अच्छा संबंध खोजने की प्रक्रिया की जाएगी। सिमुलेशन अनुकूलन में, प्रतिक्रिया चर के स्थितियोंमें वांछित परिणाम उत्पन्न करने वाले सर्वोत्तम इनपुट चर खोजने के लिए प्रतिक्रिया सतह विधि का उपयोग किया जा सकता है।<ref>Rahimi Mazrae Shahi, M., Fallah Mehdipour, E. and Amiri, M. (2016), [https://onlinelibrary.wiley.com/doi/abs/10.1111/itor.12150 Optimization using simulation and response surface methodology with an application on subway train scheduling]. Intl. Trans. in Op. Res., 23: 797–811. {{doi|10.1111/itor.12150}}</ref>
=== अनुमानी प्रणाली ===
=== अनुमानी प्रणाली ===
ह्यूरिस्टिक (कंप्यूटर विज्ञान) गति से सटीकता को बदलता है। उनका लक्ष्य पारंपरिक विधि की तुलना में तेजी से एक अच्छा समाधान खोजना है, जब वे बहुत धीमे होते हैं या समस्या को हल करने में विफल होते हैं। सामान्यतः वे इष्टतम मूल्य के अतिरिक्त स्थानीय इष्टतम पाते हैं; चूंकि, मानों को अंतिम समाधान के अधिक  निकट माना जाता है। इस तरह के विधि के उदाहरणों में [[तब्बू खोज]] और [[आनुवंशिक एल्गोरिदम]] सम्मलित हैं।<ref name=":0" />
ह्यूरिस्टिक (कंप्यूटर विज्ञान) गति से सटीकता को बदलता है। उनका लक्ष्य पारंपरिक विधि की तुलना में तेजी से एक अच्छा समाधान खोजना है, जब वे बहुत धीमे होते हैं या समस्या को हल करने में विफल होते हैं। सामान्यतः वे इष्टतम मूल्य के अतिरिक्त स्थानीय इष्टतम पाते हैं; चूंकि, मानों को अंतिम समाधान के अधिक  निकट माना जाता है। इस तरह के विधि के उदाहरणों में [[तब्बू खोज]] और [[आनुवंशिक एल्गोरिदम]] सम्मलित हैं।<ref name=":0" />


मेटामॉडल्स शोधकर्ताओं को महंगे और समय लेने वाले कंप्यूटर सिमुलेशन के बिना विश्वसनीय अनुमानित मॉडल आउटपुट प्राप्त करने में सक्षम बनाते हैं। इसलिए, मॉडल अनुकूलन की प्रक्रिया कम संगणना समय और लागत ले सकती है।<ref>{{Cite journal|last=Yousefi|first=Milad|last2=Yousefi|first2=Moslem|last3=Ferreira|first3=Ricardo Poley Martins|last4=Kim|first4=Joong Hoon|last5=Fogliatto|first5=Flavio S.|title=Chaotic genetic algorithm and Adaboost ensemble metamodeling approach for optimum resource planning in emergency departments|journal=Artificial Intelligence in Medicine|volume=84|pages=23–33|doi=10.1016/j.artmed.2017.10.002|pmid=29054572|year=2018}}</ref>
मेटामॉडल्स शोधकर्ताओं को महंगे और समय लेने वाले कंप्यूटर सिमुलेशन के बिना विश्वसनीय अनुमानित मॉडल आउटपुट प्राप्त करने में सक्षम बनाते हैं। इसलिए, मॉडल अनुकूलन की प्रक्रिया कम संगणना समय और लागत ले सकती है।<ref>{{Cite journal|last=Yousefi|first=Milad|last2=Yousefi|first2=Moslem|last3=Ferreira|first3=Ricardo Poley Martins|last4=Kim|first4=Joong Hoon|last5=Fogliatto|first5=Flavio S.|title=Chaotic genetic algorithm and Adaboost ensemble metamodeling approach for optimum resource planning in emergency departments|journal=Artificial Intelligence in Medicine|volume=84|pages=23–33|doi=10.1016/j.artmed.2017.10.002|pmid=29054572|year=2018}}</ref>
 
=== स्टोकेस्टिक सन्निकटन ===
 
=== [[स्टोकेस्टिक सन्निकटन]] ===
स्टोचैस्टिक सन्निकटन का उपयोग तब किया जाता है जब फ़ंक्शन की सीधे गणना नहीं की जा सकती है, केवल शोर अवलोकनों के माध्यम से अनुमान लगाया जाता है। इन परिदृश्यों में, यह विधि (या विधियों का परिवार) इन कार्यों के एक्स्ट्रेमा की जाँच करती है। उद्देश्य समारोह होगा:<ref>Powell, W. (2011). ''Approximate Dynamic Programming Solving the Curses of Dimensionality'' (2nd ed., Wiley Series in Probability and Statistics). Hoboken: Wiley.</ref>
स्टोचैस्टिक सन्निकटन का उपयोग तब किया जाता है जब फ़ंक्शन की सीधे गणना नहीं की जा सकती है, केवल शोर अवलोकनों के माध्यम से अनुमान लगाया जाता है। इन परिदृश्यों में, यह विधि (या विधियों का परिवार) इन कार्यों के एक्स्ट्रेमा की जाँच करती है। उद्देश्य समारोह होगा:<ref>Powell, W. (2011). ''Approximate Dynamic Programming Solving the Curses of Dimensionality'' (2nd ed., Wiley Series in Probability and Statistics). Hoboken: Wiley.</ref>
:<math>\underset{\text{x}\in\theta}{\min}f\bigl(\text{x}\bigr) = \underset{\text{x}\in\theta}{\min}\Epsilon[F\bigl(\text{x,y})]</math>
:<math>\underset{\text{x}\in\theta}{\min}f\bigl(\text{x}\bigr) = \underset{\text{x}\in\theta}{\min}\Epsilon[F\bigl(\text{x,y})]</math>
Line 45: Line 37:
:<math>\theta</math> पैरामीटर का डोमेन है <math>x</math>.
:<math>\theta</math> पैरामीटर का डोमेन है <math>x</math>.


=== [[व्युत्पन्न मुक्त अनुकूलन]] प्रणाली ===
=== व्युत्पन्न मुक्त अनुकूलन प्रणाली ===
व्युत्पन्न-मुक्त अनुकूलन गणितीय अनुकूलन का विषय है। यह विधि एक निश्चित अनुकूलन समस्या पर लागू होती है जब इसके डेरिवेटिव अनुपलब्ध या अविश्वसनीय होते हैं। डेरिवेटिव-मुक्त विधियाँ प्रतिकृति फ़ंक्शन मानों के आधार पर एक मॉडल स्थापित करती हैं या विस्तृत मॉडल का दोहन किए बिना फ़ंक्शन मानों का एक प्रतिकृति सेट सीधे खींचती हैं। चूंकि इसे किसी डेरिवेटिव की आवश्यकता नहीं है, इसकी तुलना डेरिवेटिव-आधारित विधियों से नहीं की जा सकती है।<ref>Conn, A. R.; [[Katya Scheinberg|Scheinberg, K.]]; Vicente, L. N. (2009). [http://www.mat.uc.pt/~lnv/idfo/ ''Introduction to Derivative-Free Optimization'']. MPS-SIAM Book Series on Optimization. Philadelphia: SIAM. Retrieved 2014-01-18.</ref>
व्युत्पन्न-मुक्त अनुकूलन गणितीय अनुकूलन का विषय है। यह विधि एक निश्चित अनुकूलन समस्या पर लागू होती है जब इसके डेरिवेटिव अनुपलब्ध या अविश्वसनीय होते हैं। डेरिवेटिव-मुक्त विधियाँ प्रतिकृति फ़ंक्शन मानों के आधार पर एक मॉडल स्थापित करती हैं या विस्तृत मॉडल का दोहन किए बिना फ़ंक्शन मानों का एक प्रतिकृति सेट सीधे खींचती हैं। चूंकि इसे किसी डेरिवेटिव की आवश्यकता नहीं है, इसकी तुलना डेरिवेटिव-आधारित विधियों से नहीं की जा सकती है।<ref>Conn, A. R.; [[Katya Scheinberg|Scheinberg, K.]]; Vicente, L. N. (2009). [http://www.mat.uc.pt/~lnv/idfo/ ''Introduction to Derivative-Free Optimization'']. MPS-SIAM Book Series on Optimization. Philadelphia: SIAM. Retrieved 2014-01-18.</ref>


Line 61: Line 53:
=== गतिशील प्रोग्रामिंग और न्यूरो-गतिशील प्रोग्रामिंग ===
=== गतिशील प्रोग्रामिंग और न्यूरो-गतिशील प्रोग्रामिंग ===


==== [[गतिशील प्रोग्रामिंग]] ====
==== गतिशील प्रोग्रामिंग ====
डायनेमिक प्रोग्रामिंग उन स्थितियों से संबंधित है जहां चरणों में निर्णय लिए जाते हैं। इस तरह की समस्या की कुंजी वर्तमान और भविष्य की लागतों का व्यापार करना है।<ref>Cooper, Leon; Cooper, Mary W. Introduction to dynamic programming. New York: Pergamon Press, 1981</ref>
डायनेमिक प्रोग्रामिंग उन स्थितियों से संबंधित है जहां चरणों में निर्णय लिए जाते हैं। इस तरह की समस्या की कुंजी वर्तमान और भविष्य की लागतों का व्यापार करना है।<ref>Cooper, Leon; Cooper, Mary W. Introduction to dynamic programming. New York: Pergamon Press, 1981</ref>




Line 91: Line 84:


:<math>E\{g_N(X_N) + \sum_{k=0}^{N-1} g_k(x_k,u_k,W_k) \}</math>
:<math>E\{g_N(X_N) + \sum_{k=0}^{N-1} g_k(x_k,u_k,W_k) \}</math>
==== न्यूरो-डायनामिक प्रोग्रामिंग ====
==== न्यूरो-डायनामिक प्रोग्रामिंग ====
न्यूरो-डायनेमिक प्रोग्रामिंग डायनेमिक प्रोग्रामिंग के समान है सिवाय इसके कि पूर्व में सन्निकटन आर्किटेक्चर की अवधारणा है। यह [[कृत्रिम होशियारी]], सिमुलेशन-बेस एल्गोरिदम और कार्यात्मक दृष्टिकोण प्रौद्योगिकी को जोड़ती है। इस शब्द में "न्यूरो" कृत्रिम बुद्धि समुदाय से उत्पन्न हुआ है। इसका अर्थ यह सीखना है कि वर्तमान व्यवहार के आधार पर अंतर्निहित तंत्र के माध्यम से भविष्य के लिए अच्छा निर्णय कैसे लें। न्यूरो-डायनामिक प्रोग्रामिंग का सबसे महत्वपूर्ण भाग इष्टतम समस्या के लिए प्रशिक्षित न्यूरो नेटवर्क का निर्माण करना है।<ref>Van Roy, B., Bertsekas, D., Lee, Y., & [[John Tsitsiklis|Tsitsiklis, J.]] (1997). [https://web.stanford.edu/~bvr/pubs/retail.pdf Neuro-dynamic programming approach to retailer inventory management]. ''Proceedings of the IEEE Conference on Decision and Control,'' ''4'', 4052-4057.</ref>
न्यूरो-डायनेमिक प्रोग्रामिंग डायनेमिक प्रोग्रामिंग के समान है सिवाय इसके कि पूर्व में सन्निकटन आर्किटेक्चर की अवधारणा है। यह [[कृत्रिम होशियारी]], सिमुलेशन-बेस एल्गोरिदम और कार्यात्मक दृष्टिकोण प्रौद्योगिकी को जोड़ती है। इस शब्द में "न्यूरो" कृत्रिम बुद्धि समुदाय से उत्पन्न हुआ है। इसका अर्थ यह सीखना है कि वर्तमान व्यवहार के आधार पर अंतर्निहित तंत्र के माध्यम से भविष्य के लिए अच्छा निर्णय कैसे लें। न्यूरो-डायनामिक प्रोग्रामिंग का सबसे महत्वपूर्ण भाग इष्टतम समस्या के लिए प्रशिक्षित न्यूरो नेटवर्क का निर्माण करना है।<ref>Van Roy, B., Bertsekas, D., Lee, Y., & [[John Tsitsiklis|Tsitsiklis, J.]] (1997). [https://web.stanford.edu/~bvr/pubs/retail.pdf Neuro-dynamic programming approach to retailer inventory management]. ''Proceedings of the IEEE Conference on Decision and Control,'' ''4'', 4052-4057.</ref>
== सीमाएं ==
== सीमाएं ==
सिमुलेशन-आधारित अनुकूलन की कुछ सीमाएँ हैं, जैसे कि एक मॉडल बनाने में कठिनाई जो एक प्रणाली के गतिशील व्यवहार का इस तरह से अनुकरण करता है जो इसके प्रतिनिधित्व के लिए अधिक अच्छा माना जाता है। एक अन्य समस्या वास्तविक दुनिया प्रणाली और अनुकरण दोनों के अनियंत्रित मापदंडों को निर्धारित करने में जटिलता है। इसके अतिरिक्त, वास्तविक मूल्यों का केवल एक सांख्यिकीय अनुमान प्राप्त किया जा सकता है। उद्देश्य फलन को निर्धारित करना आसान नहीं है, क्योंकि यह मापन का परिणाम है, जो समाधानों के लिए हानिकारक हो सकता है।<ref>Prasetio, Y. (2005). ''[https://elibrary.ru/item.asp?id=9387151 Simulation-based optimization for complex stochastic systems]''. University of Washington.</ref><ref>Deng, G., & Ferris, Michael. (2007). ''Simulation-based Optimization,'' ProQuest Dissertations and Theses</ref>
सिमुलेशन-आधारित अनुकूलन की कुछ सीमाएँ हैं, जैसे कि एक मॉडल बनाने में कठिनाई जो एक प्रणाली के गतिशील व्यवहार का इस तरह से अनुकरण करता है जो इसके प्रतिनिधित्व के लिए अधिक अच्छा माना जाता है। एक अन्य समस्या वास्तविक दुनिया प्रणाली और अनुकरण दोनों के अनियंत्रित मापदंडों को निर्धारित करने में जटिलता है। इसके अतिरिक्त, वास्तविक मूल्यों का केवल एक सांख्यिकीय अनुमान प्राप्त किया जा सकता है। उद्देश्य फलन को निर्धारित करना आसान नहीं है, क्योंकि यह मापन का परिणाम है, जो समाधानों के लिए हानिकारक हो सकता है।<ref>Prasetio, Y. (2005). ''[https://elibrary.ru/item.asp?id=9387151 Simulation-based optimization for complex stochastic systems]''. University of Washington.</ref><ref>Deng, G., & Ferris, Michael. (2007). ''Simulation-based Optimization,'' ProQuest Dissertations and Theses</ref>

Latest revision as of 15:47, 20 October 2023

सिमुलेशन-आधारित अनुकूलन (सिर्फ सिमुलेशन अनुकूलन के रूप में भी जाना जाता है) अनुकूलन (गणित) प्रौद्योगिकी को कंप्यूटर सिमुलेशन मॉडलिंग और विश्लेषण में एकीकृत करता है। अनुकरण की जटिलता के कारण, उद्देश्य फलन का मूल्यांकन करना कठिन और खर्चीला हो सकता है। सामान्यतः, अंतर्निहित सिमुलेशन मॉडल स्टोकेस्टिक होता है, जिससे सांख्यिकीय आकलन प्रौद्योगिकी (सिमुलेशन पद्धति में आउटपुट विश्लेषण कहा जाता है) का उपयोग करके उद्देश्य फ़ंक्शन का अनुमान लगाया जाना चाहिए।

एक बार एक प्रणाली को गणितीय रूप से प्रतिरूपित करने के बाद, कंप्यूटर-आधारित सिमुलेशन उसके व्यवहार के बारे में जानकारी प्रदान करते हैं। सिस्टम के प्रदर्शन को उत्तम बनाने के लिए पैरामीट्रिक सिमुलेशन विधियों का उपयोग किया जा सकता है। इस पद्धति में, प्रत्येक चर का इनपुट अन्य मापदंडों के स्थिर रहने के साथ भिन्न होता है और डिजाइन उद्देश्य पर प्रभाव देखा जाता है। यह एक समय लेने वाली विधि है और आंशिक रूप से प्रदर्शन में सुधार करती है। न्यूनतम संगणना और समय के साथ इष्टतम समाधान प्राप्त करने के लिए, समस्या को पुनरावृत्त रूप से हल किया जाता है जहां प्रत्येक पुनरावृत्ति में समाधान इष्टतम समाधान के निकट जाता है। ऐसे विधि को 'संख्यात्मक अनुकूलन' या 'सिमुलेशन-आधारित अनुकूलन' के रूप में जाना जाता है।[1]

सिमुलेशन प्रयोग में, लक्ष्य एक सिस्टम पर इनपुट चर के विभिन्न मूल्यों के प्रभाव का मूल्यांकन करना है। चूंकि, ब्याज कभी-कभी सिस्टम परिणामों के संदर्भ में इनपुट चर के लिए इष्टतम मूल्य खोजने में होता है। एक प्रणाली यह हो सकता है कि सभी संभावित इनपुट वेरिएबल्स के लिए सिमुलेशन प्रयोग चलाए जाएं। चूंकि, कई संभावित स्थितियों के कारण यह दृष्टिकोण हमेशा व्यावहारिक नहीं होता है और यह प्रत्येक परिदृश्य के लिए प्रयोगों को चलाने के लिए बस इसे अट्रैक्टिव बना देता है। उदाहरण के लिए, इनपुट वेरिएबल्स के लिए बहुत अधिक संभावित मान हो सकते हैं, या सिमुलेशन मॉडल बहुत जटिल और उप-इष्टतम इनपुट वेरिएबल मानों के लिए चलाने के लिए महंगा हो सकता है। इन स्थितियों में, लक्ष्य सभी संभावित मूल्यों की प्रयास करने के अतिरिक्त इनपुट चर के लिए इष्टतम मान खोजना है। इस प्रक्रिया को सिमुलेशन ऑप्टिमाइज़ेशन कहा जाता है।[2]

विशिष्ट सिमुलेशन-आधारित अनुकूलन विधियों को चित्र 1 के अनुसार निर्णय चर प्रकारों के आधार पर चुना जा सकता है।[3]

Fig.1 चर प्रकार के अनुसार सिमुलेशन आधारित अनुकूलन का वर्गीकरण

अनुकूलन (कंप्यूटर विज्ञान) संचालन अनुसंधान की दो मुख्य शाखाओं में सम्मलित है:

अनुकूलन पैरामीट्रिक प्रोग्रामिंग (स्थैतिक) - इसका उद्देश्य पैरामीटर के मूल्यों को खोजना है, जो सभी राज्यों के लिए "स्थैतिक" हैं, एक समारोह को अधिकतम या कम करने के लक्ष्य के साथ। इस स्थितियोंमें, कोई गणितीय प्रोग्रामिंग का उपयोग कर सकता है, जैसे रैखिक प्रोग्रामिंग। इस परिदृश्य में, अनुकरण सहायता करता है जब पैरामीटर में शोर होता है या समस्या का मूल्यांकन इसकी जटिलता के कारण अत्यधिक कंप्यूटर समय की मांग करेगा।[4]

अनुकूलन इष्टतम नियंत्रण (गतिशील) - इसका उपयोग बड़े पैमाने पर कंप्यूटर विज्ञान और विद्युत अभियन्त्रण में किया जाता है। इष्टतम नियंत्रण प्रति राज्य है और उनमें से प्रत्येक में परिणाम बदलते हैं। कोई गणितीय प्रोग्रामिंग, साथ ही गतिशील प्रोग्रामिंग का उपयोग कर सकता है। इस परिदृश्य में, अनुकरण यादृच्छिक नमूने उत्पन्न कर सकता है और जटिल और बड़े पैमाने की समस्याओं को हल कर सकता है।[4]


सिमुलेशन-आधारित अनुकूलन विधियां

सिमुलेशन अनुकूलन में कुछ महत्वपूर्ण दृष्टिकोणों पर नीचे चर्चा की गई है।[5][6]

सांख्यिकीय रैंकिंग और चयन के प्रणाली (आर / एस)

रैंकिंग और चयन विधियों को उन समस्याओं के लिए डिज़ाइन किया गया है जहाँ विकल्प निश्चित और ज्ञात हैं, और सिस्टम प्रदर्शन का अनुमान लगाने के लिए सिमुलेशन का उपयोग किया जाता है।

सिमुलेशन अनुकूलन सेटिंग में, लागू विधियों में उदासीनता क्षेत्र दृष्टिकोण, इष्टतम कंप्यूटिंग बजट आवंटन और ज्ञान ढाल एल्गोरिदम सम्मलित हैं।

प्रतिक्रिया सतह कार्यप्रणालीलॉजी (RSM)

प्रतिक्रिया सतह पद्धति में, उद्देश्य इनपुट चर और प्रतिक्रिया चर के बीच संबंध खोजना है। प्रक्रिया एक रेखीय प्रतिगमन मॉडल को फिट करने की प्रयास से प्रारंभ होती है। यदि पी-मान कम हो जाता है, तो एक उच्च डिग्री बहुपद प्रतिगमन का उपयोग किया जाएगा, जो सामान्यतः द्विघात होता है। प्रत्येक सिमुलेशन परीक्षण के लिए इनपुट और प्रतिक्रिया चर के बीच एक अच्छा संबंध खोजने की प्रक्रिया की जाएगी। सिमुलेशन अनुकूलन में, प्रतिक्रिया चर के स्थितियोंमें वांछित परिणाम उत्पन्न करने वाले सर्वोत्तम इनपुट चर खोजने के लिए प्रतिक्रिया सतह विधि का उपयोग किया जा सकता है।[7]

अनुमानी प्रणाली

ह्यूरिस्टिक (कंप्यूटर विज्ञान) गति से सटीकता को बदलता है। उनका लक्ष्य पारंपरिक विधि की तुलना में तेजी से एक अच्छा समाधान खोजना है, जब वे बहुत धीमे होते हैं या समस्या को हल करने में विफल होते हैं। सामान्यतः वे इष्टतम मूल्य के अतिरिक्त स्थानीय इष्टतम पाते हैं; चूंकि, मानों को अंतिम समाधान के अधिक निकट माना जाता है। इस तरह के विधि के उदाहरणों में तब्बू खोज और आनुवंशिक एल्गोरिदम सम्मलित हैं।[4]

मेटामॉडल्स शोधकर्ताओं को महंगे और समय लेने वाले कंप्यूटर सिमुलेशन के बिना विश्वसनीय अनुमानित मॉडल आउटपुट प्राप्त करने में सक्षम बनाते हैं। इसलिए, मॉडल अनुकूलन की प्रक्रिया कम संगणना समय और लागत ले सकती है।[8]

स्टोकेस्टिक सन्निकटन

स्टोचैस्टिक सन्निकटन का उपयोग तब किया जाता है जब फ़ंक्शन की सीधे गणना नहीं की जा सकती है, केवल शोर अवलोकनों के माध्यम से अनुमान लगाया जाता है। इन परिदृश्यों में, यह विधि (या विधियों का परिवार) इन कार्यों के एक्स्ट्रेमा की जाँच करती है। उद्देश्य समारोह होगा:[9]

एक यादृच्छिक चर है जो शोर का प्रतिनिधित्व करता है।
वह पैरामीटर है जो कम करता है .
पैरामीटर का डोमेन है .

व्युत्पन्न मुक्त अनुकूलन प्रणाली

व्युत्पन्न-मुक्त अनुकूलन गणितीय अनुकूलन का विषय है। यह विधि एक निश्चित अनुकूलन समस्या पर लागू होती है जब इसके डेरिवेटिव अनुपलब्ध या अविश्वसनीय होते हैं। डेरिवेटिव-मुक्त विधियाँ प्रतिकृति फ़ंक्शन मानों के आधार पर एक मॉडल स्थापित करती हैं या विस्तृत मॉडल का दोहन किए बिना फ़ंक्शन मानों का एक प्रतिकृति सेट सीधे खींचती हैं। चूंकि इसे किसी डेरिवेटिव की आवश्यकता नहीं है, इसकी तुलना डेरिवेटिव-आधारित विधियों से नहीं की जा सकती है।[10]

अप्रतिबंधित अनुकूलन समस्याओं के लिए, इसका रूप है:

व्युत्पन्न-मुक्त अनुकूलन की सीमाएँ:

1. कुछ विधियाँ कुछ चरों से अधिक के साथ अनुकूलन समस्याओं को नहीं संभाल सकती हैं; परिणाम सामान्यतः इतने सटीक नहीं होते हैं। चूंकि, ऐसे कई व्यावहारिक स्थितियों हैं जहां व्युत्पन्न-मुक्त विधियां गैर-तुच्छ सिमुलेशन अनुकूलन समस्याओं में सफल रही हैं जिनमें उद्देश्य समारोह में शोर के रूप में प्रकट होने वाली यादृच्छिकता सम्मलित है। उदाहरण के लिए निम्नलिखित देखें[5].[11]

2. जब गैर-उत्तल कार्यों को कम करने का सामना करना पड़ता है, तो यह इसकी सीमा दिखाएगा।

3. डेरिवेटिव-फ्री ऑप्टिमाइज़ेशन मेथड्स अपेक्षाकृत सरल और आसान हैं, किन्तु, अधिकांश ऑप्टिमाइज़ेशन मेथड्स की तरह, व्यावहारिक कार्यान्वयन में कुछ देखभाल की आवश्यकता होती है (उदाहरण के लिए, एल्गोरिथम पैरामीटर चुनने में)।

गतिशील प्रोग्रामिंग और न्यूरो-गतिशील प्रोग्रामिंग

गतिशील प्रोग्रामिंग

डायनेमिक प्रोग्रामिंग उन स्थितियों से संबंधित है जहां चरणों में निर्णय लिए जाते हैं। इस तरह की समस्या की कुंजी वर्तमान और भविष्य की लागतों का व्यापार करना है।[12]


एक गतिशील बुनियादी मॉडल में दो विशेषताएं हैं:

1) इसमें असतत समय गतिशील प्रणाली है।

2) लागत फलन समय के साथ योगात्मक होता है।

असतत सुविधाओं के लिए, गतिशील प्रोग्रामिंग का रूप है:

असतत समय के सूचकांक का प्रतिनिधित्व करता है।
समय की स्थिति k है, इसमें पिछली जानकारी सम्मलित है और इसे भविष्य के अनुकूलन के लिए तैयार करती है।
नियंत्रण चर है।
यादृच्छिक पैरामीटर है।

लागत फ़ंक्शन के लिए, इसका रूप है:

प्रक्रिया के अंत में लागत है।

चूंकि लागत को सार्थक रूप से अनुकूलित नहीं किया जा सकता है, इसका उपयोग अपेक्षित मूल्य के रूप में किया जा सकता है:

न्यूरो-डायनामिक प्रोग्रामिंग

न्यूरो-डायनेमिक प्रोग्रामिंग डायनेमिक प्रोग्रामिंग के समान है सिवाय इसके कि पूर्व में सन्निकटन आर्किटेक्चर की अवधारणा है। यह कृत्रिम होशियारी, सिमुलेशन-बेस एल्गोरिदम और कार्यात्मक दृष्टिकोण प्रौद्योगिकी को जोड़ती है। इस शब्द में "न्यूरो" कृत्रिम बुद्धि समुदाय से उत्पन्न हुआ है। इसका अर्थ यह सीखना है कि वर्तमान व्यवहार के आधार पर अंतर्निहित तंत्र के माध्यम से भविष्य के लिए अच्छा निर्णय कैसे लें। न्यूरो-डायनामिक प्रोग्रामिंग का सबसे महत्वपूर्ण भाग इष्टतम समस्या के लिए प्रशिक्षित न्यूरो नेटवर्क का निर्माण करना है।[13]

सीमाएं

सिमुलेशन-आधारित अनुकूलन की कुछ सीमाएँ हैं, जैसे कि एक मॉडल बनाने में कठिनाई जो एक प्रणाली के गतिशील व्यवहार का इस तरह से अनुकरण करता है जो इसके प्रतिनिधित्व के लिए अधिक अच्छा माना जाता है। एक अन्य समस्या वास्तविक दुनिया प्रणाली और अनुकरण दोनों के अनियंत्रित मापदंडों को निर्धारित करने में जटिलता है। इसके अतिरिक्त, वास्तविक मूल्यों का केवल एक सांख्यिकीय अनुमान प्राप्त किया जा सकता है। उद्देश्य फलन को निर्धारित करना आसान नहीं है, क्योंकि यह मापन का परिणाम है, जो समाधानों के लिए हानिकारक हो सकता है।[14][15]


संदर्भ

  1. Nguyen, Anh-Tuan, Sigrid Reiter, and Philippe Rigo. "A review on simulation-based optimization methods applied to building performance analysis."Applied Energy 113 (2014): 1043–1058.
  2. Carson, Yolanda, and Anu Maria. "Simulation optimization: methods and applications." Proceedings of the 29th Winter Simulation Conference. IEEE Computer Society, 1997.
  3. Jalali, Hamed, and Inneke Van Nieuwenhuyse. "Simulation optimization in inventory replenishment: a classification." IIE Transactions 47.11 (2015): 1217-1235.
  4. 4.0 4.1 4.2 Abhijit Gosavi, Simulation‐Based Optimization: Parametric Optimization Techniques and Reinforcement Learning, Springer, 2nd Edition (2015)
  5. 5.0 5.1 Fu, Michael, ed. (2015). Handbook of Simulation Optimization. Springer.
  6. Spall, J.C. (2003). Introduction to Stochastic Search and Optimization: Estimation, Simulation, and Control. Hoboken: Wiley.
  7. Rahimi Mazrae Shahi, M., Fallah Mehdipour, E. and Amiri, M. (2016), Optimization using simulation and response surface methodology with an application on subway train scheduling. Intl. Trans. in Op. Res., 23: 797–811. doi:10.1111/itor.12150
  8. Yousefi, Milad; Yousefi, Moslem; Ferreira, Ricardo Poley Martins; Kim, Joong Hoon; Fogliatto, Flavio S. (2018). "Chaotic genetic algorithm and Adaboost ensemble metamodeling approach for optimum resource planning in emergency departments". Artificial Intelligence in Medicine. 84: 23–33. doi:10.1016/j.artmed.2017.10.002. PMID 29054572.
  9. Powell, W. (2011). Approximate Dynamic Programming Solving the Curses of Dimensionality (2nd ed., Wiley Series in Probability and Statistics). Hoboken: Wiley.
  10. Conn, A. R.; Scheinberg, K.; Vicente, L. N. (2009). Introduction to Derivative-Free Optimization. MPS-SIAM Book Series on Optimization. Philadelphia: SIAM. Retrieved 2014-01-18.
  11. Fu, M.C., Hill, S.D. Optimization of discrete event systems via simultaneous perturbation stochastic approximation. IIE Transactions 29, 233–243 (1997). https://doi.org/10.1023/A:1018523313043
  12. Cooper, Leon; Cooper, Mary W. Introduction to dynamic programming. New York: Pergamon Press, 1981
  13. Van Roy, B., Bertsekas, D., Lee, Y., & Tsitsiklis, J. (1997). Neuro-dynamic programming approach to retailer inventory management. Proceedings of the IEEE Conference on Decision and Control, 4, 4052-4057.
  14. Prasetio, Y. (2005). Simulation-based optimization for complex stochastic systems. University of Washington.
  15. Deng, G., & Ferris, Michael. (2007). Simulation-based Optimization, ProQuest Dissertations and Theses