इष्टतम नियंत्रण: Difference between revisions

From Vigyanwiki
 
(5 intermediate revisions by 4 users not shown)
Line 41: Line 41:
अनंत क्षितिज समस्या ( अर्थात्, LQR) अत्यधिक प्रतिबंधात्मक और अनिवार्य रूप से व्यर्थ लग सकती है क्योंकि यह मानती है कि संचालक प्रणाली को शून्य-स्थिति में चला रहा है और इसलिए  प्रणाली के प्रक्षेपण को शून्य पर चला रहा है। यह वास्तव में  सही है। हालाँकि प्रक्षेपण को एक वांछित अशून्य स्तर पर ले जाने की समस्या को शून्य प्रक्षेपण एक के बाद हल किया जा सकता है। वस्तुत:, यह साबित किया जा सकता है कि इस द्वितीयक LQR समस्या को बहुत ही सरल तरीके से हल किया जा सकता है। शास्त्रीय इष्टतम नियंत्रण सिद्धांत में यह दिखाया गया है कि LQ (या LQR) इष्टतम नियंत्रण में प्रतिपुष्टि स्वरुप है।
अनंत क्षितिज समस्या ( अर्थात्, LQR) अत्यधिक प्रतिबंधात्मक और अनिवार्य रूप से व्यर्थ लग सकती है क्योंकि यह मानती है कि संचालक प्रणाली को शून्य-स्थिति में चला रहा है और इसलिए  प्रणाली के प्रक्षेपण को शून्य पर चला रहा है। यह वास्तव में  सही है। हालाँकि प्रक्षेपण को एक वांछित अशून्य स्तर पर ले जाने की समस्या को शून्य प्रक्षेपण एक के बाद हल किया जा सकता है। वस्तुत:, यह साबित किया जा सकता है कि इस द्वितीयक LQR समस्या को बहुत ही सरल तरीके से हल किया जा सकता है। शास्त्रीय इष्टतम नियंत्रण सिद्धांत में यह दिखाया गया है कि LQ (या LQR) इष्टतम नियंत्रण में प्रतिपुष्टि स्वरुप है।
<math display="block">\mathbf{u}(t) = -\mathbf{K}(t)\mathbf{x}(t)</math>
<math display="block">\mathbf{u}(t) = -\mathbf{K}(t)\mathbf{x}(t)</math>
कहाँ पे <math>\mathbf{K}(t)</math> एक उचित रूप से आयामित आव्यूह है, जैसा दिया गया है
जहाँ पे <math>\mathbf{K}(t)</math> एक उचित रूप से आयामित आव्यूह है, जैसा दिया गया है
<math display="block">\mathbf{K}(t) = \mathbf{R}^{-1}\mathbf{B}^{\mathsf{T}}\mathbf{S}(t),</math>
<math display="block">\mathbf{K}(t) = \mathbf{R}^{-1}\mathbf{B}^{\mathsf{T}}\mathbf{S}(t),</math>
तथा <math>\mathbf{S}(t)</math> अवकल [[रिकाटी समीकरण]] का हल है। अंतर रिकाटी समीकरण के रूप में दिया गया है
तथा <math>\mathbf{S}(t)</math> अवकल [[रिकाटी समीकरण]] का हल है। अंतर रिकाटी समीकरण के रूप में दिया गया है
Line 50: Line 50:
<math display="block">\mathbf{0} = -\mathbf{S}\mathbf{A}-\mathbf{A}^{\mathsf{T}}\mathbf{S}+\mathbf{S}\mathbf{B}\mathbf{R}^{-1}\mathbf{B}^{\mathsf{T}}\mathbf{S}-\mathbf{Q}</math>
<math display="block">\mathbf{0} = -\mathbf{S}\mathbf{A}-\mathbf{A}^{\mathsf{T}}\mathbf{S}+\mathbf{S}\mathbf{B}\mathbf{R}^{-1}\mathbf{B}^{\mathsf{T}}\mathbf{S}-\mathbf{Q}</math>
यह समझना कि ARE अनंत क्षितिज समस्या, मैट्रिसेस से उत्पन्न होता है <math>\mathbf{A}</math>, <math>\mathbf{B}</math>, <math>\mathbf{Q}</math>, तथा <math>\mathbf{R}</math> सभी स्थिर हैं। यह ध्यान दिया जाता है कि बीजगणितीय रिकाटी समीकरण के सामान्य रूप से कई समाधान हैं और सकारात्मक निश्चित (या सकारात्मक अर्ध-निश्चित) समाधान वह है जिसका उपयोग प्रतिक्रिया लाभ की गणना करने के लिए किया जाता है। LQ(LQR) समस्या को रूडोल्फ ई. काल्मन द्वारा सुरुचिपूर्ण ढंग से हल किया गया था।<ref>Kalman, Rudolf. ''A new approach to linear filtering and prediction problems''. Transactions of the ASME, Journal of Basic Engineering, 82:34–45, 1960</ref>
यह समझना कि ARE अनंत क्षितिज समस्या, मैट्रिसेस से उत्पन्न होता है <math>\mathbf{A}</math>, <math>\mathbf{B}</math>, <math>\mathbf{Q}</math>, तथा <math>\mathbf{R}</math> सभी स्थिर हैं। यह ध्यान दिया जाता है कि बीजगणितीय रिकाटी समीकरण के सामान्य रूप से कई समाधान हैं और सकारात्मक निश्चित (या सकारात्मक अर्ध-निश्चित) समाधान वह है जिसका उपयोग प्रतिक्रिया लाभ की गणना करने के लिए किया जाता है। LQ(LQR) समस्या को रूडोल्फ ई. काल्मन द्वारा सुरुचिपूर्ण ढंग से हल किया गया था।<ref>Kalman, Rudolf. ''A new approach to linear filtering and prediction problems''. Transactions of the ASME, Journal of Basic Engineering, 82:34–45, 1960</ref>


== इष्टतम नियंत्रण के लिए संख्यात्मक तरीके ==
== इष्टतम नियंत्रण के लिए संख्यात्मक तरीके ==
Line 155: Line 154:
* [[प्रक्षेपवक्र अनुकूलन]]
* [[प्रक्षेपवक्र अनुकूलन]]
{{colend}}
{{colend}}


==संदर्भ==
==संदर्भ==
{{Reflist|30em}}
{{Reflist|30em}}


==अग्रिम पठन==
==अग्रिम पठन==
Line 167: Line 164:
* {{cite book |first1=M. I. |last1=Kamien |author-link=Morton Kamien |first2=N. L. |last2=Schwartz |author-link2=Nancy Schwartz |title=Dynamic Optimization: The Calculus of Variations and Optimal Control in Economics and Management |location=New York |publisher=Elsevier |edition=Second |year=1991 |isbn=0-444-01609-0 |url=https://books.google.com/books?id=0IoGUn8wjDQC }}
* {{cite book |first1=M. I. |last1=Kamien |author-link=Morton Kamien |first2=N. L. |last2=Schwartz |author-link2=Nancy Schwartz |title=Dynamic Optimization: The Calculus of Variations and Optimal Control in Economics and Management |location=New York |publisher=Elsevier |edition=Second |year=1991 |isbn=0-444-01609-0 |url=https://books.google.com/books?id=0IoGUn8wjDQC }}
* {{cite book |last=Kirk |first=D. E. |author-link=Donald E. Kirk |year=1970 |title=Optimal Control Theory: An Introduction |location=Englewood Cliffs |publisher=Prentice-Hall |isbn=0-13-638098-0 |url=https://books.google.com/books?id=onuH0PnZwV4C }}
* {{cite book |last=Kirk |first=D. E. |author-link=Donald E. Kirk |year=1970 |title=Optimal Control Theory: An Introduction |location=Englewood Cliffs |publisher=Prentice-Hall |isbn=0-13-638098-0 |url=https://books.google.com/books?id=onuH0PnZwV4C }}
==इस पेज में लापता आंतरिक लिंक की सूची==
वस्तुनिष्ठ कार्य
चांद
विविधताओं की गणना
समारोह (गणित)
बाधा (गणित)
आरंभिक दशा
सीमारेखा की हालत
controllability
चटकाना
के रूप में
संगत अनुमान
डिजिटल डाटा
खास समय
*परछाई कीमत
==बाहरी संबंध==
==बाहरी संबंध==
*[https://nps.edu/documents/103424443/116151573/Ross.pdf/2c85d1a1-ff5b-4f60-9700-2ee5e1f3f65f?t=1580766209000 Computational Optimal Control]
*[https://nps.edu/documents/103424443/116151573/Ross.pdf/2c85d1a1-ff5b-4f60-9700-2ee5e1f3f65f?t=1580766209000 Computational Optimal Control]
Line 203: Line 170:
* [https://gekko.readthedocs.io/en/latest/ GEKKO - Python package for optimal control]  
* [https://gekko.readthedocs.io/en/latest/ GEKKO - Python package for optimal control]  
* [https://web.archive.org/web/20101031195713/http://www.astos.de/products/gesop GESOP – Graphical Environment for Simulation and OPtimization]
* [https://web.archive.org/web/20101031195713/http://www.astos.de/products/gesop GESOP – Graphical Environment for Simulation and OPtimization]
{{Use dmy dates|date=April 2020}}
 
* [http://gpops2.com/ GPOPS-II – General-Purpose MATLAB Optimal Control Software]
* [http://gpops2.com/ GPOPS-II – General-Purpose MATLAB Optimal Control Software]
* [https://web.casadi.org/ CasADi –  Free and open source symbolic framework for optimal control]
* [https://web.casadi.org/ CasADi –  Free and open source symbolic framework for optimal control]
Line 216: Line 183:
{{Authority control}}
{{Authority control}}


{{DEFAULTSORT:Optimal Control}}[[Category:इष्टतम नियंत्रण| ]]
{{DEFAULTSORT:Optimal Control}}
[[Category: गणितीय अनुकूलन]]
 


[[Category: Machine Translated Page]]
[[Category:AC with 0 elements|Optimal Control]]
[[Category:Created On 25/11/2022]]
[[Category:Articles with invalid date parameter in template|Optimal Control]]
[[Category:Articles with short description|Optimal Control]]
[[Category:CS1 English-language sources (en)]]
[[Category:Created On 25/11/2022|Optimal Control]]
[[Category:Lua-based templates|Optimal Control]]
[[Category:Machine Translated Page|Optimal Control]]
[[Category:Multi-column templates|Optimal Control]]
[[Category:Pages using div col with small parameter|Optimal Control]]
[[Category:Short description with empty Wikidata description|Optimal Control]]
[[Category:Templates that add a tracking category|Optimal Control]]
[[Category:Templates using TemplateData|Optimal Control]]
[[Category:Templates using under-protected Lua modules|Optimal Control]]
[[Category:Use dmy dates from April 2020|Optimal Control]]
[[Category:Webarchive template wayback links]]
[[Category:Wikipedia fully protected templates|Div col]]
[[Category:इष्टतम नियंत्रण| ]]
[[Category:गणितीय अनुकूलन|Optimal Control]]

Latest revision as of 11:36, 1 November 2023

इष्टतम नियंत्रण समस्या बेंचमार्क (लुस) एक अभिन्न उद्देश्य, असमानता और अंतर बाधा के साथ।

इष्टतम नियंत्रण सिद्धांत गणितीय अनुकूलन की एक शाखा है जो एक गतिशील प्रणाली के लिए समय की अवधि में एक नियंत्रण (इष्टतम नियंत्रण सिद्धांत) खोजने से संबंधित है, जैसे कि एक उद्देश्य प्रकार्य अनुकूलित किया गया है।[1] इसके विज्ञान, अभियांत्रिकी और संचालन अनुसंधान में कई अनुप्रयोग हैं। उदाहरण के लिए, गतिशील प्रणाली प्रक्षेपात्र प्रक्षेपक के अनुरूप नियंत्रण वाला एक अंतरिक्ष यान हो सकता है, और इसका उद्देश्य न्यूनतम ईंधन व्यय के साथ चंद्रमा तक पहुंचना हो सकता है।[2] या गतिशील प्रणाली बेरोजगारी को कम करने के उद्देश्य से एक राष्ट्र की अर्थव्यवस्था हो सकती है; इसप्रकर्ण में नियंत्रण राजकोषीय नीति और मौद्रिक नीति हो सकते हैं।[3] इष्टतम नियंत्रण सिद्धांत के ढांचे के भीतर संचालन अनुसंधान को लागू करने के लिए एक गतिशील प्रणाली भी शुरू की जा सकती है।[4][5]

इष्टतम नियंत्रण विविधताओं की कलन का एक विस्तार है, और नियंत्रण सिद्धांत प्राप्त करने के लिए एक गणितीय अनुकूलन विधि है।[6] 1950 के दशक में एडवर्ड जे. मैक्शेन द्वारा विविधताओं की कलन में योगदान के बाद, विधि काफी हद तक लेव पोंट्रीगिन और रिचर्ड बेलमैन के काम के कारण है।[7] इष्टतम नियंत्रण को नियंत्रण सिद्धांत में नियंत्रण रणनीति के रूप में देखा जा सकता है।[1]


सामान्य विधि

इष्टतम नियंत्रण किसी दी गई प्रणाली के लिए नियंत्रण कानून खोजने की समस्या से संबंधित है जैसे कि एक निश्चित इष्टतमता मानदंड प्राप्त किया जाता है। एक नियंत्रण समस्या में एक लागत कार्यात्मक सम्मिलित है जो राज्य और नियंत्रण चर का कार्य (गणित) है। एक इष्टतम नियंत्रण अंतर समीकरणों का एक समुच्चय है जो नियंत्रण चर के पथ का वर्णन करता है जो लागत प्रकार्य को कम करता है। पोन्ट्रियाजिन उच्चिष्ठ सिद्धांत (एक आवश्यक शर्त जिसे पोन्ट्रियाजिन न्यूनतम सिद्धांत या केवल पोंट्रीगिन के सिद्धांत के रूप में भी जाना जाता है) का उपयोग करके[8] या हैमिल्टन-जैकोबी-बेलमैन समीकरण (एक पर्याप्त स्थिति) को हल करके इष्टतम नियंत्रण प्राप्त किया जा सकता है।

हम एक साधारण उदाहरण से शुरू करते हैं। एक पहाड़ी सड़क पर एक सीधी रेखा में चलने वाली मोटर गाड़ी पर विचार करें। सवाल यह है कि कुल यात्रा समय को कम करने के लिए ड्राइवर को त्वरक पदिक कैसे दबाना चाहिए? इस उदाहरण में, शब्द नियंत्रण कानून विशेष रूप से उस तरीके को संदर्भित करता है जिसमें चालक त्वरक को दबाता है और यंत्रावली को बदलता है। प्रणाली में मोटर गाड़ी और सड़क दोनों अन्तर्वलित हैं, और इष्टतमता मानदंड कुल यात्रा समय का न्यूनतमकरण है। नियंत्रण समस्याओं में सामान्यतः सहायक प्रतिबंध (गणित) अन्तर्वलित होते हैं। उदाहरण के लिए, उपलब्ध ईंधन की मात्रा सीमित हो सकती है, त्वरक पेडल को कार के फर्श, गति सीमा आदि के माध्यम से नहीं धकेला जा सकता है।

एक उचित लागत प्रकार्य एक गणितीय अभिव्यक्ति होगी जो गति, ज्यामितीय विचारों और प्रणाली की प्रारंभिक स्थितियों के कार्य के रूप में यात्रा का समय देगी। बाधाएँ (गणित) प्राय: लागत फलन के साथ विनिमेय होती हैं।

एक और संबंधित इष्टतम नियंत्रण समस्या कार को चलाने का तरीका खोजने के लिए हो सकती है ताकि इसकी ईंधन खपत को कम किया जा सके, यह देखते हुए कि इसे एक निश्चित समय में पूरा करना होगा बिना कुछ राशि से अधिक बढाए। फिर भी एक और संबंधित नियंत्रण समस्या यात्रा को पूरा करने की कुल मौद्रिक लागत को कम करने के लिए हो सकती है, समय और ईंधन के लिए अनुमानित मौद्रिक कीमतों को देखते हुए।

एक अधिक सार रूपरेखा इस प्रकार है।[1] निरंतर-समय की लागत कार्यात्मक को कम करें

प्रथम-क्रम गतिशील बाधाओं (राज्य समीकरण) के अधीन
बीजगणितीय पथ बाधाएँ
और सीमा शर्तें
जहाँ पर अवस्था है, नियंत्रण है, स्वतंत्र चर है (सामान्यतः बोलना, समय), प्रारंभिक समय है, और टर्मिनल समय है। शर्तें तथा क्रमशः एंडपॉइंट कॉस्ट और रनिंग कॉस्ट कहलाते हैं। भिन्नों की गणना में, तथा क्रमशः मेयर शब्द और लैग्रेंज गुणक के रूप में जाना जाता है। इसके अतिरिक्त, यह नोट किया गया है कि पथ बाधाएँ सामान्य असमानता बाधाओं में हैं और इस प्रकार इष्टतम समाधान पर सक्रिय ( अर्थात् , शून्य के बराबर) नहीं हो सकती हैं। यह भी नोट किया गया है कि जैसा कि ऊपर कहा गया है, इष्टतम नियंत्रण समस्या के कई समाधान हो सकते हैं (अर्थात, समाधान अद्वितीय नहीं हो सकता है)। इस प्रकार, यह सबसे अधिक बार होता है कि कोई भी समाधान इष्टतम नियंत्रण समस्या स्थानीय रूप से कम हो रही है।

रैखिक द्विघात नियंत्रण

पिछले खंड में दी गई सामान्य गैर-रैखिक इष्टतम नियंत्रण समस्या का एक विशेष मामला रैखिक-द्विघात नियामक | रैखिक द्विघात (LQ) इष्टतम नियंत्रण समस्या है। LQ समस्या इस प्रकार बताई गई है। द्विघात निरंतर-समय लागत कार्यात्मक को कम करें

रैखिक प्रथम-क्रम गतिशील बाधाओं के अधीन
और प्रारंभिक स्थिति
कई नियंत्रण प्रणाली की समस्याओं में उत्पन्न होने वाली LQ समस्या का एक विशेष रूप रैखिक द्विघात नियामक (LQR) है, जहाँ सभी आव्यूह ( अर्थात् , , , , तथा ) स्थिर हैं, प्रारंभिक समय मनमाने ढंग से शून्य पर समुच्चय है, और अवसानक समय सीमा में लिया जाता है (यह अंतिम धारणा अनंत क्षितिज के रूप में जानी जाती है)। LQR समस्या इस प्रकार बताई गई है। अनंत क्षितिज द्विघात निरंतर-समय लागत कार्यात्मक को कम करें
रैखिक समय-अपरिवर्तनीय प्रथम-क्रम गतिशील बाधाओं के अधीन
और प्रारंभिक स्थिति
परिमित-क्षितिज प्रकर्ण में आव्यूह उसमें प्रतिबंधित हैं तथा क्रमशः सकारात्मक अर्ध-निश्चित और सकारात्मक निश्चित हैं। तथापि, अनंत-क्षितिज प्रकर्ण में, आव्यूह (गणित) तथा न केवल सकारात्मक-अर्द्ध-निश्चित और सकारात्मक-निश्चित हैं, वस्तुतः स्थिर भी हैं। इन अतिरिक्त प्रतिबंधों पर तथा अनंत-क्षितिजप्रकर्ण में यह सुनिश्चित करने के लिए लागू किया जाता है कि लागत कार्यात्मक सकारात्मक बनी रहे। इसके अतिरिक्त, यह सुनिश्चित करने के लिए कि लागत प्रकार्य सीमित है, जोड़ी पर अतिरिक्त प्रतिबंध लगाया जाता है जो कि नियंत्रणीय है। ध्यान दें कि LQ या LQR लागत कार्यात्मक को भौतिक रूप से नियंत्रण ऊर्जा को कम करने के प्रयास के रूप में सोचा जा सकता है (द्विघात रूप में मापा जाता है)।

अनंत क्षितिज समस्या ( अर्थात्, LQR) अत्यधिक प्रतिबंधात्मक और अनिवार्य रूप से व्यर्थ लग सकती है क्योंकि यह मानती है कि संचालक प्रणाली को शून्य-स्थिति में चला रहा है और इसलिए प्रणाली के प्रक्षेपण को शून्य पर चला रहा है। यह वास्तव में सही है। हालाँकि प्रक्षेपण को एक वांछित अशून्य स्तर पर ले जाने की समस्या को शून्य प्रक्षेपण एक के बाद हल किया जा सकता है। वस्तुत:, यह साबित किया जा सकता है कि इस द्वितीयक LQR समस्या को बहुत ही सरल तरीके से हल किया जा सकता है। शास्त्रीय इष्टतम नियंत्रण सिद्धांत में यह दिखाया गया है कि LQ (या LQR) इष्टतम नियंत्रण में प्रतिपुष्टि स्वरुप है।

जहाँ पे एक उचित रूप से आयामित आव्यूह है, जैसा दिया गया है
तथा अवकल रिकाटी समीकरण का हल है। अंतर रिकाटी समीकरण के रूप में दिया गया है
परिमित क्षितिज LQ समस्या के लिए, रिकाटी समीकरण को अंतस्थ सीमा की स्थिति का उपयोग करते हुए समय में पीछे की ओर एकीकृत किया जाता है
अनंत क्षितिज LQR समस्या के लिए, अंतर रिकाटी समीकरण को बीजगणितीय रिकाटी समीकरण (ARE) के साथ बदल दिया गया है
यह समझना कि ARE अनंत क्षितिज समस्या, मैट्रिसेस से उत्पन्न होता है , , , तथा सभी स्थिर हैं। यह ध्यान दिया जाता है कि बीजगणितीय रिकाटी समीकरण के सामान्य रूप से कई समाधान हैं और सकारात्मक निश्चित (या सकारात्मक अर्ध-निश्चित) समाधान वह है जिसका उपयोग प्रतिक्रिया लाभ की गणना करने के लिए किया जाता है। LQ(LQR) समस्या को रूडोल्फ ई. काल्मन द्वारा सुरुचिपूर्ण ढंग से हल किया गया था।[9]

इष्टतम नियंत्रण के लिए संख्यात्मक तरीके

इष्टतम नियंत्रण समस्याएं सामान्यतः अरैखिक होती हैं और इसलिए, सामान्यतः विश्लेषणात्मक समाधान नहीं होते हैं (उदाहरण के लिए, रैखिक-द्विघात इष्टतम नियंत्रण समस्या की तरह)। नतीजतन, इष्टतम नियंत्रण समस्याओं को हल करने के लिए संख्यात्मक तरीकों को नियोजित करना आवश्यक है। इष्टतम नियंत्रण के प्रारंभिक वर्षों में (c. 1950 से 1980 के दशक) इष्टतम नियंत्रण समस्याओं को हल करने के लिए इष्ट दृष्टिकोण अप्रत्यक्ष तरीकों का था। अप्रत्यक्ष विधि में, पहले क्रम की अनुकूलता की स्थिति प्राप्त करने के लिए विविधताओं की गणना को नियोजित किया जाता है। इन स्थितियों के परिणामस्वरूप दो-बिंदु (या, एक जटिल समस्या केप्रकर्ण में, एक बहु-बिंदु) सीमा-मान समस्या होती है। इस सीमा-मूल्य समस्या की वास्तव में एक विशेष संरचना है क्योंकि यह हैमिल्टनियन (नियंत्रण सिद्धांत) के व्युत्पन्न लेने से उत्पन्न होती है। इस प्रकार, परिणामी गतिकीय प्रणाली रूप की हैमिल्टनियन प्रणाली है[1]

जहाँ पर
संवर्धित हैमिल्टनियन है और अप्रत्यक्ष विधि में, सीमा-मूल्य समस्या हल हो जाती है (उपयुक्त सीमा या ट्रांसवर्सलिटी स्थितियों का उपयोग करके)। एक अप्रत्यक्ष विधि का उपयोग करने की सुंदरता यह है कि स्थिति और आसन्न (अर्थात् , ) के लिए हल किया जाता है और परिणामी समाधान एक चरम प्रक्षेपवक्र होने के लिए आसानी से सत्यापित होता है। अप्रत्यक्ष तरीकों का नुकसान यह है कि सीमा-मूल्य समस्या को हल करना प्राय: बेहद मुश्किल होता है (विशेष रूप से उन समस्याओं के लिए जो बड़े समय के अंतराल या आंतरिक बिंदु बाधाओं के साथ समस्याओं को फैलाते हैं)। एक प्रसिद्ध प्रक्रिया योजना जो अप्रत्यक्ष तरीकों को लागू करता है, वह है BNDSCO।[10]

1980 के दशक से जो दृष्टिकोण संख्यात्मक इष्टतम नियंत्रण में प्रमुखता से बढ़ा है, वह तथाकथित प्रत्यक्ष तरीकों का है। एक प्रत्यक्ष विधि में, स्थिति या नियंत्रण, या दोनों, एक उपयुक्त प्रकार्य सन्निकटन (जैसे, बहुपद सन्निकटन या टुकड़े-टुकड़े स्थिर मापदण्ड) का उपयोग करके अनुमानित किए जाते हैं। इसके साथ ही, लागत कार्यात्मक लागत प्रकार्य के रूप में अनुमानित है। फिर, प्रकार्य सन्निकटन के गुणांक को इष्टमीकरण चर के रूप में माना जाता है और समस्या को प्ररूप की एक गैर-रैखिक अनुकूलन समस्या में स्थानांतरित किया जाता है:


न्यूनतमीकरण

बीजगणितीय बाधाओं के अधीन
नियोजित प्रत्यक्ष विधि के प्रकार के आधार पर, गैर-रैखिक अनुकूलन समस्या का आकार काफी छोटा हो सकता है (उदाहरण के लिए, प्रत्यक्ष आखेट या क्वासिलिनेराइजेशन विधि में), औसत (उदाहरण के लिए स्यूडोस्पेक्ट्रल इष्टतम नियंत्रण)[11]) या काफी बड़ा हो सकता है (उदाहरण के लिए, एक प्रत्यक्ष सहस्थापन विधि[12]) बाद के प्रकर्ण में ( अर्थात् , एक सहस्थापन विधि), गैर-रैखिक अनुकूलन समस्या का शाब्दिक रूप से हजारों से दसियों हजारों चर और बाधाएं हो सकती हैं। प्रत्यक्ष विधि से उत्पन्न होने वाले कई NLP के आकार को देखते हुए, यह कुछ हद तक प्रति-सहज लग सकता है कि सीमा-मूल्य समस्या को हल करने की तुलना में गैर-रैखिक अनुकूलन समस्या को हल करना आसान है। हालांकि, यह तथ्य है कि सीमा-मूल्य समस्या की तुलना में NLP को हल करना आसान है। संगणना की सापेक्ष आसानी का कारण, विशेष रूप से प्रत्यक्ष सह-स्थापन विधि, यह है कि NLP विरल है और कई प्रसिद्ध प्रक्रिया सामग्री कार्यक्रम मौजूद हैं (उदाहरण के लिए, SNOPT[13]) बड़े विरल NLP को हल करने के लिए। नतीजतन, समस्याओं की सीमा जो प्रत्यक्ष विधियों के माध्यम से हल की जा सकती है (विशेष रूप से प्रत्यक्ष सहस्थापन विधियाँ जो इन दिनों बहुत लोकप्रिय हैं) उन समस्याओं की सीमा से काफी बड़ी हैं जिन्हें अप्रत्यक्ष तरीकों से हल किया जा सकता है। वास्तव में, प्रत्यक्ष विधियाँ इन दिनों इतनी लोकप्रिय हो गई हैं कि बहुत से लोगों ने विस्तृत प्रक्रिया सामग्री कार्यक्रम लिखे हैं जो इन विधियों को नियोजित करते हैं। विशेष रूप से ऐसे कई कार्यक्रमों में DIRCOL,[14] SOCS,[15] OTIS,[16] GESOP/ASTOS,[17] DITAN।[18] और PyGMO/PyKEP।[19] नवागत वर्षों में, MATLAB कार्यरचना भाषा के आगमन के कारण, MATLAB में इष्टतम नियंत्रण प्रक्रिया सामग्री अधिक सामान्य हो गया है। शैक्षिक रूप से विकसित MATLAB यंत्रेतर सामग्री साधन के उदाहरणों में प्रत्यक्ष तरीकों को लागू करने में अन्तर्वलित हैं, RIOTS,[20] DIDO,[21] DIRECT,[22] FALCON.m,[23] और GPOPS,[24] चूँकि एक उद्योग विकसित MATLAB उपकरण का एक उदाहरण PROPT है।[25] इन प्रक्रिया सामग्री कलपुर्जे ने शैक्षणिक अनुसंधान और औद्योगिक समस्याओं दोनों के लिए जटिल इष्टतम नियंत्रण समस्याओं का पता लगाने के लिए लोगों के अवसर में काफी वृद्धि की है।[26] अंत में, यह नोट किया गया है कि सामान्य-उद्देश्य MATLAB अनुकूलन वातावरण जैसे TOMLAB ने कूटलेखन जटिल इष्टतम नियंत्रण समस्याओं को C और FORTRAN जैसी भाषाओं में पहले की तुलना में काफी आसान बना दिया है।

असतत-समय इष्टतम नियंत्रण

इस प्रकार अब तक के उदाहरणों ने निरंतर समय प्रणाली और नियंत्रण समाधान दिखाए हैं। वस्तुत:, इष्टतम नियंत्रण समाधान के रूप में अब प्राय: डिजिटली लागू किया जाता है, समकालीन नियंत्रण सिद्धांत अब मुख्य रूप से पृथक समय प्रणालियों और समाधानों से संबंधित है। संगत सन्निकटन का सिद्धांत[27][28] ऐसी स्थितियाँ प्रदान करता है जिसके अंतर्गत तेजी से सटीक विखंडित इष्टतम नियंत्रण समस्या की एक श्रृंखला के समाधान मूल, निरंतर-समय की समस्या के समाधान में परिवर्तित हो जाते हैं। विवेकाधिकार के सभी तरीकों में स्पष्ट रूप से भी यह गुण नहीं होता है।[29] उदाहरण के लिए, समस्या के गतिशील समीकरणों को एकीकृत करने के लिए एक चर चरण-आकार की दिनचर्या का उपयोग करने से एक अनुप्रवण उत्पन्न हो सकता है जो समाधान के संपर्क में आने पर शून्य (या सही दिशा में इंगित) में परिवर्तित नहीं होता है। प्रत्यक्ष विधि RIOTS संगत सन्निकटन के सिद्धांत पर आधारित है।

उदाहरण

कई इष्टतम नियंत्रण समस्याओं में एक सामान्य समाधान रणनीति लागत के लिए हल करना है (कभी-कभी छाया मूल्य कहा जाता है)। पर्शुरेखित एक संख्या में स्तिथि चर के अगले मोड़ के विस्तार या अनुबंध के सीमांत मूल्य को संक्षेप में प्रस्तुत करता है। सीमांत मूल्य न केवल अगले मोड़ पर अर्जित लाभ है वस्तुतः कार्यक्रम की अवधि से जुड़ा है। यह अच्छा है जब विश्लेषणात्मक रूप से हल किया जा सकता है, लेकिन सामान्यतः, सबसे अधिक यह किया जा सकता है कि यह पर्याप्त रूप से अच्छी तरह से वर्णन करता है कि अंतर्ज्ञान समाधान के चरित्र को समझ सकता है और एक समीकरण समाधानकर्ता मूल्यों के लिए संख्यात्मक रूप से हल कर सकता है।

अभिप्राप्त , नियंत्रण के लिए पंक्ति-t इष्टतम मूल्य को सामान्यतः ज्ञान के आधार पर अंतर समीकरण के रूप में हल किया जा सकता है। फिर से यह विरल होता है, विशेष रूप से निरंतर-समय की समस्याओं में, यह नियंत्रण या राज्य के मूल्य को स्पष्ट रूप से प्राप्त करता है। सामान्यतः, रणनीति प्रभावसीमा और क्षेत्रों के लिए हल करना है जो इष्टतम नियंत्रण की विशेषता है और समय में वास्तविक पसंद मूल्यों को अलग करने के लिए एक संख्यात्मक समाधानकर्ता का उपयोग करते हैं।

परिमित समय

एक खदान मालिक की समस्या पर विचार करें, जिसे यह तय करना होगा कि उनकी खदान से किस दर पर अयस्क निकाला जाए। अयस्क पर उनका अधिकार तारीख से तक है. तिथि पर वहाँ जमीन में अयस्क है, और अयस्क की समय-निर्भर मात्रा खदान मालिक इसे निकालता है तो जमीन में छोड़े जाने की दर से गिरावट आती है। खदान मालिक लागत पर अयस्क निकालता है (निष्कर्षण की लागत वर्ग के साथ निष्कर्षण की गति और बचे हुए अयस्क की मात्रा के व्युत्क्रम के साथ बढ़ती है) और अयस्क को एक स्थिर मूल्य पर बेचता है . समय पर जमीन में छोड़ा गया कोई अयस्क बेचा नहीं जा सकता है और इसका कोई मूल्य नहीं है (कोई क्षेप्य मूल्य नहीं है)। मालिक स्वामित्व की अवधि में बिना किसी छूट के लाभ को अधिकतम करने के लिए समय के साथ अलग-अलग निकासी की दर चुनता है

  1. पृथक- समय वृतान्त

    प्रबंधक लाभ को अधिकतम करता है :

    दशा चर के लिए गति के कानून के अधीन

    हैमिल्टनियन का निर्माण करें और अंतर करें:

    चूंकि खदान मालिक समय पर बचे हुए अयस्क को महत्व नहीं देता है,

    उपरोक्त समीकरणों का उपयोग करके,इस शृंखला को हल करना आसान है और प्रारंभिक और टर्न-t स्थितियों का उपयोग करते हुए,

    श्रंखला को स्पष्ट रूप से दे कर हल किया जा सकता है
  2. निरंतर-समय संस्करण

    प्रबंधक लाभ को अधिकतम करता है :

    जहां राज्य चर निम्नानुसार विकसित होता है:
    हैमिल्टनियन का निर्माण करें और अंतर करें:
    चूंकि खदान मालिक समय पर बचे हुए अयस्क को महत्व नहीं देता है ,
    उपरोक्त समीकरणों का उपयोग करके, नियंत्रित करने वाले अंतर समीकरणों को हल करना आसान है तथा
    और प्रारंभिक और टर्न-टी शर्तों का उपयोग करके, कार्यों को उपज के लिए हल किया जा सकता है

यह भी देखें

संदर्भ

  1. 1.0 1.1 1.2 1.3 Ross, Isaac (2015). इष्टतम नियंत्रण में पोंट्रीगिन के सिद्धांत पर एक प्राइमर. San Francisco: Collegiate Publishers. ISBN 978-0-9843571-0-9. OCLC 625106088.
  2. Luenberger, David G. (1979). "Optimal Control". डायनेमिक सिस्टम का परिचय. New York: John Wiley & Sons. pp. 393–435. ISBN 0-471-02594-1.
  3. Kamien, Morton I. (2013). डायनेमिक ऑप्टिमाइजेशन: द कैलकुलस ऑफ वैरिएशन एंड ऑप्टिमल कंट्रोल इन इकोनॉमिक्स एंड मैनेजमेंट. Dover Publications. ISBN 978-1-306-39299-0. OCLC 869522905.
  4. Ross, I. M.; Proulx, R. J.; Karpenko, M. (2020-05-06). "ट्रैवलिंग सेल्समैन प्रॉब्लम और इसके प्रकारों के लिए एक इष्टतम नियंत्रण सिद्धांत". arXiv:2005.03186 [math.OC].
  5. Ross, Isaac M.; Karpenko, Mark; Proulx, Ronald J. (2016-01-01). "कुछ ग्राफ़-सैद्धांतिक नियंत्रण समस्याओं को हल करने के लिए एक गैर-चिकनी कलन ** यह शोध यू.एस. नौसेना द्वारा प्रायोजित किया गया था।". IFAC-PapersOnLine. 10th IFAC Symposium on Nonlinear Control Systems NOLCOS 2016 (in English). 49 (18): 462–467. doi:10.1016/j.ifacol.2016.10.208. ISSN 2405-8963.
  6. Sargent, R. W. H. (2000). "इष्टतम नियंत्रण". Journal of Computational and Applied Mathematics. 124 (1–2): 361–371. Bibcode:2000JCoAM.124..361S. doi:10.1016/S0377-0427(00)00418-0.
  7. Bryson, A. E. (1996). "इष्टतम नियंत्रण - 1950 से 1985". IEEE Control Systems Magazine. 16 (3): 26–33. doi:10.1109/37.506395.
  8. Ross, I. M. (2009). इष्टतम नियंत्रण में पोंट्रीगिन के सिद्धांत पर एक प्राइमर. Collegiate Publishers. ISBN 978-0-9843571-0-9.
  9. Kalman, Rudolf. A new approach to linear filtering and prediction problems. Transactions of the ASME, Journal of Basic Engineering, 82:34–45, 1960
  10. Oberle, H. J. and Grimm, W., "BNDSCO-A Program for the Numerical Solution of Optimal Control Problems," Institute for Flight Systems Dynamics, DLR, Oberpfaffenhofen, 1989
  11. Ross, I. M.; Karpenko, M. (2012). "स्यूडोस्पेक्ट्रल इष्टतम नियंत्रण की समीक्षा: सिद्धांत से उड़ान तक". Annual Reviews in Control. 36 (2): 182–197. doi:10.1016/j.arcontrol.2012.09.002.
  12. Betts, J. T. (2010). गैर-रैखिक प्रोग्रामिंग का उपयोग करके इष्टतम नियंत्रण के लिए व्यावहारिक तरीके (2nd ed.). Philadelphia, Pennsylvania: SIAM Press. ISBN 978-0-89871-688-7.
  13. Gill, P. E., Murray, W. M., and Saunders, M. A., User's Manual for SNOPT Version 7: Software for Large-Scale Nonlinear Programming, University of California, San Diego Report, 24 April 2007
  14. von Stryk, O., User's Guide for DIRCOL (version 2.1): A Direct Collocation Method for the Numerical Solution of Optimal Control Problems, Fachgebiet Simulation und Systemoptimierung (SIM), Technische Universität Darmstadt (2000, Version of November 1999).
  15. Betts, J.T. and Huffman, W. P., Sparse Optimal Control Software, SOCS, Boeing Information and Support Services, Seattle, Washington, July 1997
  16. Hargraves, C. R.; Paris, S. W. (1987). "नॉनलाइनियर प्रोग्रामिंग और कोलोकेशन का उपयोग करके डायरेक्ट ट्रैजेक्टरी ऑप्टिमाइजेशन". Journal of Guidance, Control, and Dynamics. 10 (4): 338–342. Bibcode:1987JGCD...10..338H. doi:10.2514/3.20223.
  17. Gath, P.F., Well, K.H., "Trajectory Optimization Using a Combination of Direct Multiple Shooting and Collocation", AIAA 2001–4047, AIAA Guidance, Navigation, and Control Conference, Montréal, Québec, Canada, 6–9 August 2001
  18. Vasile M., Bernelli-Zazzera F., Fornasari N., Masarati P., "Design of Interplanetary and Lunar Missions Combining Low-Thrust and Gravity Assists", Final Report of the ESA/ESOC Study Contract No. 14126/00/D/CS, September 2002
  19. Izzo, Dario. "PyGMO and PyKEP: open source tools for massively parallel optimization in astrodynamics (the case of interplanetary trajectory optimization)." Proceed. Fifth International Conf. Astrodynam. Tools and Techniques, ICATT. 2012.
  20. RIOTS Archived 16 July 2011 at the Wayback Machine, based on Schwartz, Adam (1996). Theory and Implementation of Methods based on Runge–Kutta Integration for Solving Optimal Control Problems (Ph.D.). University of California at Berkeley. OCLC 35140322.
  21. Ross, I. M., Enhancements to the DIDO Optimal Control Toolbox, arXiv 2020. https://arxiv.org/abs/2004.13112
  22. Williams, P., User's Guide to DIRECT, Version 2.00, Melbourne, Australia, 2008
  23. FALCON.m, described in Rieck, M., Bittner, M., Grüter, B., Diepolder, J., and Piprek, P., FALCON.m - User Guide, Institute of Flight System Dynamics, Technical University of Munich, October 2019
  24. GPOPS Archived 24 July 2011 at the Wayback Machine, described in Rao, A. V., Benson, D. A., Huntington, G. T., Francolin, C., Darby, C. L., and Patterson, M. A., User's Manual for GPOPS: A MATLAB Package for Dynamic Optimization Using the Gauss Pseudospectral Method, University of Florida Report, August 2008.
  25. Rutquist, P. and Edvall, M. M, PROPT – MATLAB Optimal Control Software," 1260 S.E. Bishop Blvd Ste E, Pullman, WA 99163, USA: Tomlab Optimization, Inc.
  26. I.M. Ross, Computational Optimal Control, 3rd Workshop in Computational Issues in Nonlinear Control, October 8th, 2019, Monterey, CA
  27. E. Polak, On the use of consistent approximations in the solution of semi-infinite optimization and optimal control problems Math. Prog. 62 pp. 385–415 (1993).
  28. Ross, I M. (2005-12-01). "इष्टतम नियंत्रण के लिए एक रोडमैप: यात्रा करने का सही तरीका". Annals of the New York Academy of Sciences. 1065 (1): 210–231. Bibcode:2005NYASA1065..210R. doi:10.1196/annals.1370.015. ISSN 0077-8923. PMID 16510411. S2CID 7625851.
  29. Fahroo, Fariba; Ross, I. Michael (September 2008). "कॉस्टेट्स के अभिसरण का मतलब नियंत्रण का अभिसरण नहीं है". Journal of Guidance, Control, and Dynamics. 31 (5): 1492–1497. Bibcode:2008JGCD...31.1492F. doi:10.2514/1.37331. ISSN 0731-5090. S2CID 756939.

अग्रिम पठन

बाहरी संबंध