सिमुलेशन आधारित अनुकूलन: Difference between revisions
No edit summary |
No edit summary |
||
Line 2: | Line 2: | ||
सिमुलेशन-आधारित अनुकूलन (सिर्फ सिमुलेशन अनुकूलन के रूप में भी जाना जाता है) [[अनुकूलन (गणित)]] तकनीकों को [[कंप्यूटर सिमुलेशन]] मॉडलिंग और विश्लेषण में एकीकृत करता है। अनुकरण की जटिलता के कारण, उद्देश्य फलन का मूल्यांकन करना कठिन और खर्चीला हो सकता है। सामान्यतः, अंतर्निहित सिमुलेशन मॉडल स्टोकेस्टिक होता है, ताकि सांख्यिकीय आकलन तकनीकों (सिमुलेशन पद्धति में आउटपुट विश्लेषण कहा जाता है) का उपयोग करके उद्देश्य फ़ंक्शन का अनुमान लगाया जाना चाहिए। | सिमुलेशन-आधारित अनुकूलन (सिर्फ सिमुलेशन अनुकूलन के रूप में भी जाना जाता है) [[अनुकूलन (गणित)]] तकनीकों को [[कंप्यूटर सिमुलेशन]] मॉडलिंग और विश्लेषण में एकीकृत करता है। अनुकरण की जटिलता के कारण, उद्देश्य फलन का मूल्यांकन करना कठिन और खर्चीला हो सकता है। सामान्यतः, अंतर्निहित सिमुलेशन मॉडल स्टोकेस्टिक होता है, ताकि सांख्यिकीय आकलन तकनीकों (सिमुलेशन पद्धति में आउटपुट विश्लेषण कहा जाता है) का उपयोग करके उद्देश्य फ़ंक्शन का अनुमान लगाया जाना चाहिए। | ||
एक बार एक प्रणाली को गणितीय रूप से प्रतिरूपित करने के बाद, कंप्यूटर-आधारित सिमुलेशन उसके व्यवहार के बारे में जानकारी प्रदान करते हैं। सिस्टम के प्रदर्शन को | एक बार एक प्रणाली को गणितीय रूप से प्रतिरूपित करने के बाद, कंप्यूटर-आधारित सिमुलेशन उसके व्यवहार के बारे में जानकारी प्रदान करते हैं। सिस्टम के प्रदर्शन को उत्तम बनाने के लिए पैरामीट्रिक सिमुलेशन विधियों का उपयोग किया जा सकता है। इस पद्धति में, प्रत्येक चर का इनपुट अन्य मापदंडों के स्थिर रहने के साथ भिन्न होता है और डिजाइन उद्देश्य पर प्रभाव देखा जाता है। यह एक समय लेने वाली विधि है और आंशिक रूप से प्रदर्शन में सुधार करती है। न्यूनतम संगणना और समय के साथ इष्टतम समाधान प्राप्त करने के लिए, समस्या को पुनरावृत्त रूप से हल किया जाता है जहां प्रत्येक पुनरावृत्ति में समाधान इष्टतम समाधान के निकट जाता है। ऐसे तरीकों को 'संख्यात्मक अनुकूलन' या 'सिमुलेशन-आधारित अनुकूलन' के रूप में जाना जाता है।<ref>Nguyen, Anh-Tuan, Sigrid Reiter, and Philippe Rigo. "[https://orbi.uliege.be/bitstream/2268/155988/1/Nguyen%20AT.pdf A review on simulation-based optimization methods applied to building performance analysis]."''Applied Energy'' 113 (2014): 1043–1058.</ref> | ||
सिमुलेशन प्रयोग में, लक्ष्य एक सिस्टम पर इनपुट चर के विभिन्न मूल्यों के प्रभाव का मूल्यांकन करना है। चूंकि, ब्याज कभी-कभी सिस्टम परिणामों के संदर्भ में इनपुट चर के लिए इष्टतम मूल्य खोजने में होता है। एक प्रणाली यह हो सकता है कि सभी संभावित इनपुट वेरिएबल्स के लिए सिमुलेशन प्रयोग चलाए जाएं। चूंकि, कई संभावित स्थितियों के कारण यह दृष्टिकोण हमेशा व्यावहारिक नहीं होता है और यह प्रत्येक परिदृश्य के लिए प्रयोगों को चलाने के लिए बस इसे अट्रैक्टिव बना देता है। उदाहरण के लिए, इनपुट वेरिएबल्स के लिए बहुत अधिक संभावित मान हो सकते हैं, या सिमुलेशन मॉडल बहुत जटिल और उप-इष्टतम इनपुट वेरिएबल मानों के लिए चलाने के लिए महंगा हो सकता है। इन स्थितियों में, लक्ष्य सभी संभावित मूल्यों की कोशिश करने के अतिरिक्त इनपुट चर के लिए इष्टतम मान खोजना है। इस प्रक्रिया को सिमुलेशन ऑप्टिमाइज़ेशन कहा जाता है।<ref>Carson, Yolanda, and Anu Maria. "[http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.24.9192&rep=rep1&type=pdf Simulation optimization: methods and applications]." ''Proceedings of the 29th Winter Simulation Conference''. IEEE Computer Society, 1997.</ref> | सिमुलेशन प्रयोग में, लक्ष्य एक सिस्टम पर इनपुट चर के विभिन्न मूल्यों के प्रभाव का मूल्यांकन करना है। चूंकि, ब्याज कभी-कभी सिस्टम परिणामों के संदर्भ में इनपुट चर के लिए इष्टतम मूल्य खोजने में होता है। एक प्रणाली यह हो सकता है कि सभी संभावित इनपुट वेरिएबल्स के लिए सिमुलेशन प्रयोग चलाए जाएं। चूंकि, कई संभावित स्थितियों के कारण यह दृष्टिकोण हमेशा व्यावहारिक नहीं होता है और यह प्रत्येक परिदृश्य के लिए प्रयोगों को चलाने के लिए बस इसे अट्रैक्टिव बना देता है। उदाहरण के लिए, इनपुट वेरिएबल्स के लिए बहुत अधिक संभावित मान हो सकते हैं, या सिमुलेशन मॉडल बहुत जटिल और उप-इष्टतम इनपुट वेरिएबल मानों के लिए चलाने के लिए महंगा हो सकता है। इन स्थितियों में, लक्ष्य सभी संभावित मूल्यों की कोशिश करने के अतिरिक्त इनपुट चर के लिए इष्टतम मान खोजना है। इस प्रक्रिया को सिमुलेशन ऑप्टिमाइज़ेशन कहा जाता है।<ref>Carson, Yolanda, and Anu Maria. "[http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.24.9192&rep=rep1&type=pdf Simulation optimization: methods and applications]." ''Proceedings of the 29th Winter Simulation Conference''. IEEE Computer Society, 1997.</ref> | ||
विशिष्ट सिमुलेशन-आधारित अनुकूलन विधियों को चित्र 1 के अनुसार निर्णय चर प्रकारों के आधार पर चुना जा सकता है।<ref>Jalali, Hamed, and Inneke Van Nieuwenhuyse. "[https://core.ac.uk/download/pdf/34623919.pdf Simulation optimization in inventory replenishment: a classification]." IIE Transactions 47.11 (2015): 1217-1235.</ref> | विशिष्ट सिमुलेशन-आधारित अनुकूलन विधियों को चित्र 1 के अनुसार निर्णय चर प्रकारों के आधार पर चुना जा सकता है।<ref>Jalali, Hamed, and Inneke Van Nieuwenhuyse. "[https://core.ac.uk/download/pdf/34623919.pdf Simulation optimization in inventory replenishment: a classification]." IIE Transactions 47.11 (2015): 1217-1235.</ref> | ||
Line 21: | Line 22: | ||
=== सांख्यिकीय रैंकिंग और चयन के तरीके (आर / एस) === | === सांख्यिकीय रैंकिंग और चयन के तरीके (आर / एस) === | ||
रैंकिंग और चयन विधियों को उन समस्याओं के लिए डिज़ाइन किया गया है जहाँ विकल्प निश्चित और ज्ञात हैं, और सिस्टम प्रदर्शन का अनुमान लगाने के लिए सिमुलेशन का उपयोग किया जाता है। | रैंकिंग और चयन विधियों को उन समस्याओं के लिए डिज़ाइन किया गया है जहाँ विकल्प निश्चित और ज्ञात हैं, और सिस्टम प्रदर्शन का अनुमान लगाने के लिए सिमुलेशन का उपयोग किया जाता है। | ||
सिमुलेशन अनुकूलन सेटिंग में, लागू विधियों में उदासीनता क्षेत्र दृष्टिकोण, इष्टतम कंप्यूटिंग बजट आवंटन और ज्ञान ढाल एल्गोरिदम सम्मलित हैं। | सिमुलेशन अनुकूलन सेटिंग में, लागू विधियों में उदासीनता क्षेत्र दृष्टिकोण, इष्टतम कंप्यूटिंग बजट आवंटन और ज्ञान ढाल एल्गोरिदम सम्मलित हैं। | ||
Line 44: | Line 46: | ||
=== [[व्युत्पन्न मुक्त अनुकूलन]] तरीके === | === [[व्युत्पन्न मुक्त अनुकूलन]] तरीके === | ||
व्युत्पन्न-मुक्त अनुकूलन गणितीय अनुकूलन का विषय है। यह विधि एक निश्चित अनुकूलन समस्या पर लागू होती है जब इसके डेरिवेटिव अनुपलब्ध या अविश्वसनीय होते हैं। डेरिवेटिव-मुक्त विधियाँ नमूना फ़ंक्शन मानों के आधार पर एक मॉडल स्थापित करती हैं या विस्तृत मॉडल का दोहन किए बिना फ़ंक्शन मानों का एक नमूना सेट सीधे खींचती हैं। चूंकि इसे किसी डेरिवेटिव की आवश्यकता नहीं है, इसकी तुलना डेरिवेटिव-आधारित विधियों से नहीं की जा सकती है।<ref>Conn, A. R.; [[Katya Scheinberg|Scheinberg, K.]]; Vicente, L. N. (2009). [http://www.mat.uc.pt/~lnv/idfo/ ''Introduction to Derivative-Free Optimization'']. MPS-SIAM Book Series on Optimization. Philadelphia: SIAM. Retrieved 2014-01-18.</ref> | व्युत्पन्न-मुक्त अनुकूलन गणितीय अनुकूलन का विषय है। यह विधि एक निश्चित अनुकूलन समस्या पर लागू होती है जब इसके डेरिवेटिव अनुपलब्ध या अविश्वसनीय होते हैं। डेरिवेटिव-मुक्त विधियाँ नमूना फ़ंक्शन मानों के आधार पर एक मॉडल स्थापित करती हैं या विस्तृत मॉडल का दोहन किए बिना फ़ंक्शन मानों का एक नमूना सेट सीधे खींचती हैं। चूंकि इसे किसी डेरिवेटिव की आवश्यकता नहीं है, इसकी तुलना डेरिवेटिव-आधारित विधियों से नहीं की जा सकती है।<ref>Conn, A. R.; [[Katya Scheinberg|Scheinberg, K.]]; Vicente, L. N. (2009). [http://www.mat.uc.pt/~lnv/idfo/ ''Introduction to Derivative-Free Optimization'']. MPS-SIAM Book Series on Optimization. Philadelphia: SIAM. Retrieved 2014-01-18.</ref> | ||
अप्रतिबंधित अनुकूलन समस्याओं के लिए, इसका रूप है: | अप्रतिबंधित अनुकूलन समस्याओं के लिए, इसका रूप है: | ||
Line 51: | Line 54: | ||
1. कुछ विधियाँ कुछ चरों से अधिक के साथ अनुकूलन समस्याओं को नहीं संभाल सकती हैं; परिणाम सामान्यतः इतने सटीक नहीं होते हैं। चूंकि, ऐसे कई व्यावहारिक मामले हैं जहां व्युत्पन्न-मुक्त विधियां गैर-तुच्छ सिमुलेशन अनुकूलन समस्याओं में सफल रही हैं जिनमें उद्देश्य समारोह में शोर के रूप में प्रकट होने वाली यादृच्छिकता सम्मलित है। उदाहरण के लिए निम्नलिखित देखें | 1. कुछ विधियाँ कुछ चरों से अधिक के साथ अनुकूलन समस्याओं को नहीं संभाल सकती हैं; परिणाम सामान्यतः इतने सटीक नहीं होते हैं। चूंकि, ऐसे कई व्यावहारिक मामले हैं जहां व्युत्पन्न-मुक्त विधियां गैर-तुच्छ सिमुलेशन अनुकूलन समस्याओं में सफल रही हैं जिनमें उद्देश्य समारोह में शोर के रूप में प्रकट होने वाली यादृच्छिकता सम्मलित है। उदाहरण के लिए निम्नलिखित देखें | ||
<ref name=Fu/>.<ref>Fu, M.C., Hill, S.D. Optimization of discrete event systems via simultaneous perturbation stochastic approximation. ''IIE Transactions'' 29, 233–243 (1997). https://doi.org/10.1023/A:1018523313043</ref> | <ref name=Fu/>.<ref>Fu, M.C., Hill, S.D. Optimization of discrete event systems via simultaneous perturbation stochastic approximation. ''IIE Transactions'' 29, 233–243 (1997). https://doi.org/10.1023/A:1018523313043</ref> | ||
2. जब गैर-उत्तल कार्यों को कम करने का सामना करना पड़ता है, तो यह इसकी सीमा दिखाएगा। | 2. जब गैर-उत्तल कार्यों को कम करने का सामना करना पड़ता है, तो यह इसकी सीमा दिखाएगा। | ||
Revision as of 00:11, 16 February 2023
सिमुलेशन-आधारित अनुकूलन (सिर्फ सिमुलेशन अनुकूलन के रूप में भी जाना जाता है) अनुकूलन (गणित) तकनीकों को कंप्यूटर सिमुलेशन मॉडलिंग और विश्लेषण में एकीकृत करता है। अनुकरण की जटिलता के कारण, उद्देश्य फलन का मूल्यांकन करना कठिन और खर्चीला हो सकता है। सामान्यतः, अंतर्निहित सिमुलेशन मॉडल स्टोकेस्टिक होता है, ताकि सांख्यिकीय आकलन तकनीकों (सिमुलेशन पद्धति में आउटपुट विश्लेषण कहा जाता है) का उपयोग करके उद्देश्य फ़ंक्शन का अनुमान लगाया जाना चाहिए।
एक बार एक प्रणाली को गणितीय रूप से प्रतिरूपित करने के बाद, कंप्यूटर-आधारित सिमुलेशन उसके व्यवहार के बारे में जानकारी प्रदान करते हैं। सिस्टम के प्रदर्शन को उत्तम बनाने के लिए पैरामीट्रिक सिमुलेशन विधियों का उपयोग किया जा सकता है। इस पद्धति में, प्रत्येक चर का इनपुट अन्य मापदंडों के स्थिर रहने के साथ भिन्न होता है और डिजाइन उद्देश्य पर प्रभाव देखा जाता है। यह एक समय लेने वाली विधि है और आंशिक रूप से प्रदर्शन में सुधार करती है। न्यूनतम संगणना और समय के साथ इष्टतम समाधान प्राप्त करने के लिए, समस्या को पुनरावृत्त रूप से हल किया जाता है जहां प्रत्येक पुनरावृत्ति में समाधान इष्टतम समाधान के निकट जाता है। ऐसे तरीकों को 'संख्यात्मक अनुकूलन' या 'सिमुलेशन-आधारित अनुकूलन' के रूप में जाना जाता है।[1]
सिमुलेशन प्रयोग में, लक्ष्य एक सिस्टम पर इनपुट चर के विभिन्न मूल्यों के प्रभाव का मूल्यांकन करना है। चूंकि, ब्याज कभी-कभी सिस्टम परिणामों के संदर्भ में इनपुट चर के लिए इष्टतम मूल्य खोजने में होता है। एक प्रणाली यह हो सकता है कि सभी संभावित इनपुट वेरिएबल्स के लिए सिमुलेशन प्रयोग चलाए जाएं। चूंकि, कई संभावित स्थितियों के कारण यह दृष्टिकोण हमेशा व्यावहारिक नहीं होता है और यह प्रत्येक परिदृश्य के लिए प्रयोगों को चलाने के लिए बस इसे अट्रैक्टिव बना देता है। उदाहरण के लिए, इनपुट वेरिएबल्स के लिए बहुत अधिक संभावित मान हो सकते हैं, या सिमुलेशन मॉडल बहुत जटिल और उप-इष्टतम इनपुट वेरिएबल मानों के लिए चलाने के लिए महंगा हो सकता है। इन स्थितियों में, लक्ष्य सभी संभावित मूल्यों की कोशिश करने के अतिरिक्त इनपुट चर के लिए इष्टतम मान खोजना है। इस प्रक्रिया को सिमुलेशन ऑप्टिमाइज़ेशन कहा जाता है।[2] विशिष्ट सिमुलेशन-आधारित अनुकूलन विधियों को चित्र 1 के अनुसार निर्णय चर प्रकारों के आधार पर चुना जा सकता है।[3]
अनुकूलन (कंप्यूटर विज्ञान) संचालन अनुसंधान की दो मुख्य शाखाओं में सम्मलित है:
अनुकूलन पैरामीट्रिक प्रोग्रामिंग (स्थैतिक) - इसका उद्देश्य पैरामीटर के मूल्यों को खोजना है, जो सभी राज्यों के लिए "स्थैतिक" हैं, एक समारोह को अधिकतम या कम करने के लक्ष्य के साथ। इस मामले में, कोई गणितीय प्रोग्रामिंग का उपयोग कर सकता है, जैसे रैखिक प्रोग्रामिंग। इस परिदृश्य में, अनुकरण सहायता करता है जब पैरामीटर में शोर होता है या समस्या का मूल्यांकन इसकी जटिलता के कारण अत्यधिक कंप्यूटर समय की मांग करेगा।[4]
अनुकूलन इष्टतम नियंत्रण (गतिशील) - इसका उपयोग बड़े पैमाने पर कंप्यूटर विज्ञान और विद्युत अभियन्त्रण में किया जाता है। इष्टतम नियंत्रण प्रति राज्य है और उनमें से प्रत्येक में परिणाम बदलते हैं। कोई गणितीय प्रोग्रामिंग, साथ ही गतिशील प्रोग्रामिंग का उपयोग कर सकता है। इस परिदृश्य में, अनुकरण यादृच्छिक नमूने उत्पन्न कर सकता है और जटिल और बड़े पैमाने की समस्याओं को हल कर सकता है।[4]
सिमुलेशन-आधारित अनुकूलन विधियां
सिमुलेशन अनुकूलन में कुछ महत्वपूर्ण दृष्टिकोणों पर नीचे चर्चा की गई है।
[5]
सांख्यिकीय रैंकिंग और चयन के तरीके (आर / एस)
रैंकिंग और चयन विधियों को उन समस्याओं के लिए डिज़ाइन किया गया है जहाँ विकल्प निश्चित और ज्ञात हैं, और सिस्टम प्रदर्शन का अनुमान लगाने के लिए सिमुलेशन का उपयोग किया जाता है।
सिमुलेशन अनुकूलन सेटिंग में, लागू विधियों में उदासीनता क्षेत्र दृष्टिकोण, इष्टतम कंप्यूटिंग बजट आवंटन और ज्ञान ढाल एल्गोरिदम सम्मलित हैं।
प्रतिक्रिया सतह कार्यप्रणालीलॉजी (RSM)
प्रतिक्रिया सतह पद्धति में, उद्देश्य इनपुट चर और प्रतिक्रिया चर के बीच संबंध खोजना है। प्रक्रिया एक रेखीय प्रतिगमन मॉडल को फिट करने की कोशिश से प्रारंभ होती है। यदि पी-मान कम हो जाता है, तो एक उच्च डिग्री बहुपद प्रतिगमन, जो सामान्यतः द्विघात होता है, लागू किया जाएगा। प्रत्येक सिमुलेशन परीक्षण के लिए इनपुट और प्रतिक्रिया चर के बीच एक अच्छा संबंध खोजने की प्रक्रिया की जाएगी। सिमुलेशन अनुकूलन में, प्रतिक्रिया चर के मामले में वांछित परिणाम उत्पन्न करने वाले सर्वोत्तम इनपुट चर खोजने के लिए प्रतिक्रिया सतह विधि का उपयोग किया जा सकता है।[7]
अनुमानी तरीके
ह्यूरिस्टिक (कंप्यूटर विज्ञान) गति से सटीकता को बदलता है। उनका लक्ष्य पारंपरिक तरीकों की तुलना में तेजी से एक अच्छा समाधान खोजना है, जब वे बहुत धीमे होते हैं या समस्या को हल करने में विफल होते हैं। सामान्यतः वे इष्टतम मूल्य के अतिरिक्त स्थानीय इष्टतम पाते हैं; चूंकि, मानों को अंतिम समाधान के अधिक निकट माना जाता है। इस तरह के तरीकों के उदाहरणों में तब्बू खोज और आनुवंशिक एल्गोरिदम सम्मलित हैं।[4]
मेटामॉडल्स शोधकर्ताओं को महंगे और समय लेने वाले कंप्यूटर सिमुलेशन के बिना विश्वसनीय अनुमानित मॉडल आउटपुट प्राप्त करने में सक्षम बनाते हैं। इसलिए, मॉडल अनुकूलन की प्रक्रिया कम संगणना समय और लागत ले सकती है।[8]
स्टोकेस्टिक सन्निकटन
स्टोचैस्टिक सन्निकटन का उपयोग तब किया जाता है जब फ़ंक्शन की सीधे गणना नहीं की जा सकती है, केवल शोर अवलोकनों के माध्यम से अनुमान लगाया जाता है। इन परिदृश्यों में, यह विधि (या विधियों का परिवार) इन कार्यों के एक्स्ट्रेमा की तलाश करती है। उद्देश्य समारोह होगा:[9]
- एक यादृच्छिक चर है जो शोर का प्रतिनिधित्व करता है।
- वह पैरामीटर है जो कम करता है .
- पैरामीटर का डोमेन है .
व्युत्पन्न मुक्त अनुकूलन तरीके
व्युत्पन्न-मुक्त अनुकूलन गणितीय अनुकूलन का विषय है। यह विधि एक निश्चित अनुकूलन समस्या पर लागू होती है जब इसके डेरिवेटिव अनुपलब्ध या अविश्वसनीय होते हैं। डेरिवेटिव-मुक्त विधियाँ नमूना फ़ंक्शन मानों के आधार पर एक मॉडल स्थापित करती हैं या विस्तृत मॉडल का दोहन किए बिना फ़ंक्शन मानों का एक नमूना सेट सीधे खींचती हैं। चूंकि इसे किसी डेरिवेटिव की आवश्यकता नहीं है, इसकी तुलना डेरिवेटिव-आधारित विधियों से नहीं की जा सकती है।[10]
अप्रतिबंधित अनुकूलन समस्याओं के लिए, इसका रूप है:
व्युत्पन्न-मुक्त अनुकूलन की सीमाएँ:
1. कुछ विधियाँ कुछ चरों से अधिक के साथ अनुकूलन समस्याओं को नहीं संभाल सकती हैं; परिणाम सामान्यतः इतने सटीक नहीं होते हैं। चूंकि, ऐसे कई व्यावहारिक मामले हैं जहां व्युत्पन्न-मुक्त विधियां गैर-तुच्छ सिमुलेशन अनुकूलन समस्याओं में सफल रही हैं जिनमें उद्देश्य समारोह में शोर के रूप में प्रकट होने वाली यादृच्छिकता सम्मलित है। उदाहरण के लिए निम्नलिखित देखें [5].[11]
2. जब गैर-उत्तल कार्यों को कम करने का सामना करना पड़ता है, तो यह इसकी सीमा दिखाएगा।
3. डेरिवेटिव-फ्री ऑप्टिमाइज़ेशन मेथड्स अपेक्षाकृत सरल और आसान हैं, किन्तु, अधिकांश ऑप्टिमाइज़ेशन मेथड्स की तरह, व्यावहारिक कार्यान्वयन में कुछ देखभाल की आवश्यकता होती है (उदाहरण के लिए, एल्गोरिथम पैरामीटर चुनने में)।
गतिशील प्रोग्रामिंग और न्यूरो-गतिशील प्रोग्रामिंग
गतिशील प्रोग्रामिंग
डायनेमिक प्रोग्रामिंग उन स्थितियों से संबंधित है जहां चरणों में निर्णय लिए जाते हैं। इस तरह की समस्या की कुंजी वर्तमान और भविष्य की लागतों का व्यापार करना है।[12] एक गतिशील बुनियादी मॉडल में दो विशेषताएं हैं:
1) इसमें असतत समय गतिशील प्रणाली है।
2) लागत फलन समय के साथ योगात्मक होता है।
असतत सुविधाओं के लिए, गतिशील प्रोग्रामिंग का रूप है:
- असतत समय के सूचकांक का प्रतिनिधित्व करता है।
- समय की स्थिति k है, इसमें पिछली जानकारी सम्मलित है और इसे भविष्य के अनुकूलन के लिए तैयार करती है।
- नियंत्रण चर है।
- यादृच्छिक पैरामीटर है।
लागत समारोह के लिए, इसका रूप है:
प्रक्रिया के अंत में लागत है।
चूंकि लागत को सार्थक रूप से अनुकूलित नहीं किया जा सकता है, इसका उपयोग अपेक्षित मूल्य के रूप में किया जा सकता है:
न्यूरो-डायनामिक प्रोग्रामिंग
न्यूरो-डायनेमिक प्रोग्रामिंग डायनेमिक प्रोग्रामिंग के समान है सिवाय इसके कि पूर्व में सन्निकटन आर्किटेक्चर की अवधारणा है। यह कृत्रिम होशियारी, सिमुलेशन-बेस एल्गोरिदम और कार्यात्मक दृष्टिकोण तकनीकों को जोड़ती है। इस शब्द में "न्यूरो" कृत्रिम बुद्धि समुदाय से उत्पन्न हुआ है। इसका अर्थ यह सीखना है कि वर्तमान व्यवहार के आधार पर अंतर्निहित तंत्र के माध्यम से भविष्य के लिए बेहतर निर्णय कैसे लें। न्यूरो-डायनामिक प्रोग्रामिंग का सबसे महत्वपूर्ण हिस्सा इष्टतम समस्या के लिए प्रशिक्षित न्यूरो नेटवर्क का निर्माण करना है।[13]
सीमाएं
सिमुलेशन-आधारित अनुकूलन की कुछ सीमाएँ हैं, जैसे कि एक मॉडल बनाने में कठिनाई जो एक प्रणाली के गतिशील व्यवहार का इस तरह से अनुकरण करता है जो इसके प्रतिनिधित्व के लिए अधिक अच्छा माना जाता है। एक अन्य समस्या वास्तविक दुनिया प्रणाली और अनुकरण दोनों के बेकाबू मापदंडों को निर्धारित करने में जटिलता है। इसके अतिरिक्त, वास्तविक मूल्यों का केवल एक सांख्यिकीय अनुमान प्राप्त किया जा सकता है। उद्देश्य फलन को निर्धारित करना आसान नहीं है, क्योंकि यह मापन का परिणाम है, जो समाधानों के लिए हानिकारक हो सकता है।[14][15]
संदर्भ
- ↑ Nguyen, Anh-Tuan, Sigrid Reiter, and Philippe Rigo. "A review on simulation-based optimization methods applied to building performance analysis."Applied Energy 113 (2014): 1043–1058.
- ↑ Carson, Yolanda, and Anu Maria. "Simulation optimization: methods and applications." Proceedings of the 29th Winter Simulation Conference. IEEE Computer Society, 1997.
- ↑ Jalali, Hamed, and Inneke Van Nieuwenhuyse. "Simulation optimization in inventory replenishment: a classification." IIE Transactions 47.11 (2015): 1217-1235.
- ↑ 4.0 4.1 4.2 Abhijit Gosavi, Simulation‐Based Optimization: Parametric Optimization Techniques and Reinforcement Learning, Springer, 2nd Edition (2015)
- ↑ 5.0 5.1 Fu, Michael, ed. (2015). Handbook of Simulation Optimization. Springer.
- ↑ Spall, J.C. (2003). Introduction to Stochastic Search and Optimization: Estimation, Simulation, and Control. Hoboken: Wiley.
- ↑ Rahimi Mazrae Shahi, M., Fallah Mehdipour, E. and Amiri, M. (2016), Optimization using simulation and response surface methodology with an application on subway train scheduling. Intl. Trans. in Op. Res., 23: 797–811. doi:10.1111/itor.12150
- ↑ Yousefi, Milad; Yousefi, Moslem; Ferreira, Ricardo Poley Martins; Kim, Joong Hoon; Fogliatto, Flavio S. (2018). "Chaotic genetic algorithm and Adaboost ensemble metamodeling approach for optimum resource planning in emergency departments". Artificial Intelligence in Medicine. 84: 23–33. doi:10.1016/j.artmed.2017.10.002. PMID 29054572.
- ↑ Powell, W. (2011). Approximate Dynamic Programming Solving the Curses of Dimensionality (2nd ed., Wiley Series in Probability and Statistics). Hoboken: Wiley.
- ↑ Conn, A. R.; Scheinberg, K.; Vicente, L. N. (2009). Introduction to Derivative-Free Optimization. MPS-SIAM Book Series on Optimization. Philadelphia: SIAM. Retrieved 2014-01-18.
- ↑ Fu, M.C., Hill, S.D. Optimization of discrete event systems via simultaneous perturbation stochastic approximation. IIE Transactions 29, 233–243 (1997). https://doi.org/10.1023/A:1018523313043
- ↑ Cooper, Leon; Cooper, Mary W. Introduction to dynamic programming. New York: Pergamon Press, 1981
- ↑ Van Roy, B., Bertsekas, D., Lee, Y., & Tsitsiklis, J. (1997). Neuro-dynamic programming approach to retailer inventory management. Proceedings of the IEEE Conference on Decision and Control, 4, 4052-4057.
- ↑ Prasetio, Y. (2005). Simulation-based optimization for complex stochastic systems. University of Washington.
- ↑ Deng, G., & Ferris, Michael. (2007). Simulation-based Optimization, ProQuest Dissertations and Theses