इष्टतम नियंत्रण: Difference between revisions
(Created page with "{{Short description|Mathematical way of attaining a desired output from a dynamic system}} File:Optimal Control Luus.png|thumb|इष्टतम नियंत्रण...") |
|||
(12 intermediate revisions by 5 users not shown) | |||
Line 1: | Line 1: | ||
{{Short description|Mathematical way of attaining a desired output from a dynamic system}} | {{Short description|Mathematical way of attaining a desired output from a dynamic system}} | ||
[[File:Optimal Control Luus.png|thumb|इष्टतम नियंत्रण समस्या बेंचमार्क (लुस) एक अभिन्न उद्देश्य, असमानता और अंतर बाधा के साथ।]]इष्टतम नियंत्रण सिद्धांत [[गणितीय अनुकूलन]] की एक शाखा है जो एक [[गतिशील प्रणाली]] के लिए समय की अवधि में एक [[नियंत्रण (इष्टतम नियंत्रण सिद्धांत)]] खोजने से संबंधित है, जैसे कि एक उद्देश्य | [[File:Optimal Control Luus.png|thumb|इष्टतम नियंत्रण समस्या बेंचमार्क (लुस) एक अभिन्न उद्देश्य, असमानता और अंतर बाधा के साथ।]]'''इष्टतम नियंत्रण''' सिद्धांत [[गणितीय अनुकूलन]] की एक शाखा है जो एक [[गतिशील प्रणाली]] के लिए समय की अवधि में एक [[नियंत्रण (इष्टतम नियंत्रण सिद्धांत)]] खोजने से संबंधित है, जैसे कि एक उद्देश्य प्रकार्य अनुकूलित किया गया है।<ref name=":0">{{Cite book|last=Ross|first=Isaac |title=इष्टतम नियंत्रण में पोंट्रीगिन के सिद्धांत पर एक प्राइमर|publisher=Collegiate Publishers|year=2015|isbn=978-0-9843571-0-9|location=San Francisco|oclc=625106088}}</ref> इसके विज्ञान, अभियांत्रिकी और संचालन अनुसंधान में कई अनुप्रयोग हैं। उदाहरण के लिए, गतिशील प्रणाली प्रक्षेपात्र प्रक्षेपक के अनुरूप नियंत्रण वाला एक [[अंतरिक्ष यान]] हो सकता है, और इसका उद्देश्य न्यूनतम ईंधन व्यय के साथ चंद्रमा तक पहुंचना हो सकता है।<ref>{{cite book |first=David G. |last=Luenberger |author-link=David Luenberger |title=डायनेमिक सिस्टम का परिचय|url=https://archive.org/details/introductiontody00luen_582 |url-access=limited |location=New York |publisher=John Wiley & Sons |year=1979 |isbn=0-471-02594-1 |chapter=Optimal Control |pages=[https://archive.org/details/introductiontody00luen_582/page/n406 393]–435 }}</ref> या गतिशील प्रणाली [[बेरोजगारी]] को कम करने के उद्देश्य से एक राष्ट्र की [[अर्थव्यवस्था]] हो सकती है; इसप्रकर्ण में नियंत्रण [[राजकोषीय नीति]] और [[मौद्रिक नीति]] हो सकते हैं।<ref>{{Cite book|author=Kamien, Morton I.| url=http://worldcat.org/oclc/869522905 |title=डायनेमिक ऑप्टिमाइजेशन: द कैलकुलस ऑफ वैरिएशन एंड ऑप्टिमल कंट्रोल इन इकोनॉमिक्स एंड मैनेजमेंट|date=2013 |publisher=Dover Publications |isbn=978-1-306-39299-0|oclc=869522905}}</ref> इष्टतम नियंत्रण सिद्धांत के ढांचे के भीतर [[संचालन अनुसंधान]] को लागू करने के लिए एक गतिशील प्रणाली भी शुरू की जा सकती है।<ref>{{cite arXiv |last1=Ross|first1=I. M. |last2=Proulx|first2=R. J. |last3=Karpenko|first3=M. |date=2020-05-06 | title=ट्रैवलिंग सेल्समैन प्रॉब्लम और इसके प्रकारों के लिए एक इष्टतम नियंत्रण सिद्धांत|class=math.OC|eprint=2005.03186}}</ref><ref>{{Cite journal|last1=Ross|first1=Isaac M.|last2=Karpenko|first2=Mark|last3=Proulx|first3=Ronald J.|date=2016-01-01|title=कुछ ग्राफ़-सैद्धांतिक नियंत्रण समस्याओं को हल करने के लिए एक गैर-चिकनी कलन ** यह शोध यू.एस. नौसेना द्वारा प्रायोजित किया गया था।| journal=IFAC-PapersOnLine |series=10th IFAC Symposium on Nonlinear Control Systems NOLCOS 2016|language=en|volume=49| issue=18|pages=462–467| doi=10.1016/j.ifacol.2016.10.208| issn=2405-8963| doi-access=free}}</ref> | ||
इष्टतम नियंत्रण विविधताओं की कलन का एक विस्तार है, और [[नियंत्रण सिद्धांत]] प्राप्त करने के लिए एक गणितीय अनुकूलन विधि है।<ref>{{cite journal |first=R. W. H. |last=Sargent |author-link=Roger W. H. Sargent |title=इष्टतम नियंत्रण|journal=Journal of Computational and Applied Mathematics |volume=124 |issue=1–2 |year=2000 |pages=361–371 |doi=10.1016/S0377-0427(00)00418-0 |bibcode=2000JCoAM.124..361S |doi-access=free }}</ref> 1950 के दशक में एडवर्ड जे. मैक्शेन द्वारा विविधताओं की कलन में योगदान के बाद, विधि काफी हद तक [[लेव पोंट्रीगिन]] और [[रिचर्ड बेलमैन]] के काम के कारण है।<ref>{{cite journal |first=A. E. |last=Bryson |author-link=Arthur E. Bryson |year=1996 |title=इष्टतम नियंत्रण - 1950 से 1985|journal= IEEE Control Systems Magazine |volume=16 |issue=3 |pages=26–33 |doi=10.1109/37.506395 }}</ref> इष्टतम नियंत्रण को नियंत्रण सिद्धांत में [[नियंत्रण रणनीति]] के रूप में देखा जा सकता है।<ref name=":0" /> | इष्टतम नियंत्रण विविधताओं की कलन का एक विस्तार है, और [[नियंत्रण सिद्धांत]] प्राप्त करने के लिए एक गणितीय अनुकूलन विधि है।<ref>{{cite journal |first=R. W. H. |last=Sargent |author-link=Roger W. H. Sargent |title=इष्टतम नियंत्रण|journal=Journal of Computational and Applied Mathematics |volume=124 |issue=1–2 |year=2000 |pages=361–371 |doi=10.1016/S0377-0427(00)00418-0 |bibcode=2000JCoAM.124..361S |doi-access=free }}</ref> 1950 के दशक में एडवर्ड जे. मैक्शेन द्वारा विविधताओं की कलन में योगदान के बाद, विधि काफी हद तक [[लेव पोंट्रीगिन]] और [[रिचर्ड बेलमैन]] के काम के कारण है।<ref>{{cite journal |first=A. E. |last=Bryson |author-link=Arthur E. Bryson |year=1996 |title=इष्टतम नियंत्रण - 1950 से 1985|journal= IEEE Control Systems Magazine |volume=16 |issue=3 |pages=26–33 |doi=10.1109/37.506395 }}</ref> इष्टतम नियंत्रण को नियंत्रण सिद्धांत में [[नियंत्रण रणनीति]] के रूप में देखा जा सकता है।<ref name=":0" /> | ||
== सामान्य विधि == | == सामान्य विधि == | ||
इष्टतम नियंत्रण किसी | इष्टतम नियंत्रण किसी दी गई प्रणाली के लिए नियंत्रण कानून खोजने की समस्या से संबंधित है जैसे कि एक निश्चित [[इष्टतमता मानदंड]] प्राप्त किया जाता है। एक नियंत्रण समस्या में एक [[लागत कार्यात्मक]] सम्मिलित है जो राज्य और नियंत्रण चर का कार्य (गणित) है। एक इष्टतम नियंत्रण [[अंतर समीकरण|अंतर समीकरणों]] का एक समुच्चय है जो नियंत्रण चर के पथ का वर्णन करता है जो लागत प्रकार्य को कम करता है। पोन्ट्रियाजिन उच्चिष्ठ सिद्धांत (एक [[आवश्यक शर्त]] जिसे पोन्ट्रियाजिन न्यूनतम सिद्धांत या केवल पोंट्रीगिन के सिद्धांत के रूप में भी जाना जाता है) का उपयोग करके<ref>{{cite book |first=I. M. |last=Ross |author-link=I. Michael Ross |year=2009 |title=इष्टतम नियंत्रण में पोंट्रीगिन के सिद्धांत पर एक प्राइमर|publisher=Collegiate Publishers |isbn=978-0-9843571-0-9 }}</ref> या हैमिल्टन-जैकोबी-बेलमैन समीकरण (एक [[पर्याप्त स्थिति]]) को हल करके इष्टतम नियंत्रण प्राप्त किया जा सकता है। | ||
हम एक साधारण उदाहरण से शुरू करते हैं। एक पहाड़ी सड़क पर एक सीधी रेखा में चलने वाली | हम एक साधारण उदाहरण से शुरू करते हैं। एक पहाड़ी सड़क पर एक सीधी रेखा में चलने वाली मोटर गाड़ी पर विचार करें। सवाल यह है कि कुल यात्रा समय को कम करने के लिए ड्राइवर को त्वरक पदिक कैसे दबाना चाहिए? इस उदाहरण में, शब्द नियंत्रण कानून विशेष रूप से उस तरीके को संदर्भित करता है जिसमें चालक त्वरक को दबाता है और यंत्रावली को बदलता है। प्रणाली में मोटर गाड़ी और सड़क दोनों अन्तर्वलित हैं, और इष्टतमता मानदंड कुल यात्रा समय का न्यूनतमकरण है। नियंत्रण समस्याओं में सामान्यतः सहायक प्रतिबंध (गणित) अन्तर्वलित होते हैं। उदाहरण के लिए, उपलब्ध ईंधन की मात्रा सीमित हो सकती है, त्वरक पेडल को कार के फर्श, गति सीमा आदि के माध्यम से नहीं धकेला जा सकता है। | ||
एक उचित लागत | एक उचित लागत प्रकार्य एक गणितीय अभिव्यक्ति होगी जो गति, ज्यामितीय विचारों और प्रणाली की प्रारंभिक स्थितियों के कार्य के रूप में यात्रा का समय देगी। बाधाएँ (गणित) प्राय: लागत फलन के साथ विनिमेय होती हैं। | ||
एक और संबंधित इष्टतम नियंत्रण समस्या कार को चलाने का तरीका खोजने के लिए हो सकती है ताकि इसकी ईंधन खपत को कम किया जा सके, यह देखते हुए कि इसे एक निश्चित समय में पूरा करना होगा | एक और संबंधित इष्टतम नियंत्रण समस्या कार को चलाने का तरीका खोजने के लिए हो सकती है ताकि इसकी ईंधन खपत को कम किया जा सके, यह देखते हुए कि इसे एक निश्चित समय में पूरा करना होगा बिना कुछ राशि से अधिक बढाए। फिर भी एक और संबंधित नियंत्रण समस्या यात्रा को पूरा करने की कुल मौद्रिक लागत को कम करने के लिए हो सकती है, समय और ईंधन के लिए अनुमानित मौद्रिक कीमतों को देखते हुए। | ||
एक अधिक सार रूपरेखा इस प्रकार है।<ref name=":0" /> निरंतर-समय की लागत कार्यात्मक को कम करें | एक अधिक सार रूपरेखा इस प्रकार है।<ref name=":0" /> निरंतर-समय की लागत कार्यात्मक को कम करें | ||
Line 21: | Line 21: | ||
और सीमा शर्तें | और सीमा शर्तें | ||
<math display="block">\textbf{e}[\textbf{x}(t_0),t_0,\textbf{x}(t_f),t_f] = 0</math> | <math display="block">\textbf{e}[\textbf{x}(t_0),t_0,\textbf{x}(t_f),t_f] = 0</math> | ||
जहाँ पर <math>\textbf{x}(t)</math> अवस्था है, <math>\textbf{u}(t)</math> नियंत्रण है, <math>t</math> स्वतंत्र चर है (सामान्यतः बोलना, समय), <math>t_0</math> प्रारंभिक समय है, और <math>t_f</math> टर्मिनल समय है। शर्तें <math>E</math> तथा <math>F</math> क्रमशः एंडपॉइंट कॉस्ट और रनिंग कॉस्ट कहलाते हैं। भिन्नों की गणना में, <math>E</math> तथा <math>F</math> क्रमशः मेयर शब्द और [[लैग्रेंज गुणक]] के रूप में जाना जाता है। इसके अतिरिक्त, यह नोट किया गया है कि पथ बाधाएँ सामान्य असमानता बाधाओं में हैं और इस प्रकार इष्टतम समाधान पर सक्रिय ( अर्थात् , शून्य के बराबर) नहीं हो सकती हैं। यह भी नोट किया गया है कि जैसा कि ऊपर कहा गया है, इष्टतम नियंत्रण समस्या के कई समाधान हो सकते हैं (अर्थात, समाधान अद्वितीय नहीं हो सकता है)। इस प्रकार, यह सबसे अधिक बार होता है कि कोई भी समाधान <math>[\textbf{x}^*(t),\textbf{u}^*(t),t_0^*, t_f^*]</math> इष्टतम नियंत्रण समस्या स्थानीय रूप से कम हो रही है। | |||
== रैखिक द्विघात नियंत्रण == | == रैखिक द्विघात नियंत्रण == | ||
Line 30: | Line 30: | ||
और प्रारंभिक स्थिति | और प्रारंभिक स्थिति | ||
<math display="block"> \mathbf{x}(t_0) = \mathbf{x}_0</math> | <math display="block"> \mathbf{x}(t_0) = \mathbf{x}_0</math> | ||
कई नियंत्रण प्रणाली की समस्याओं में उत्पन्न होने वाली LQ समस्या का एक विशेष रूप रैखिक द्विघात नियामक (LQR) है, जहाँ सभी | कई नियंत्रण प्रणाली की समस्याओं में उत्पन्न होने वाली LQ समस्या का एक विशेष रूप रैखिक द्विघात नियामक (LQR) है, जहाँ सभी आव्यूह ( अर्थात् , <math>\mathbf{A}</math>, <math>\mathbf{B}</math>, <math>\mathbf{Q}</math>, तथा <math>\mathbf{R}</math>) स्थिर हैं, प्रारंभिक समय मनमाने ढंग से शून्य पर समुच्चय है, और अवसानक समय सीमा में लिया जाता है <math>t_f\rightarrow\infty</math> (यह अंतिम धारणा अनंत क्षितिज के रूप में जानी जाती है)। LQR समस्या इस प्रकार बताई गई है। अनंत क्षितिज द्विघात निरंतर-समय लागत कार्यात्मक को कम करें | ||
<math display="block">J= \tfrac{1}{2} \int_{0}^{\infty}[\mathbf{x}^{\mathsf{T}}(t)\mathbf{Q}\mathbf{x}(t) + \mathbf{u}^{\mathsf{T}}(t)\mathbf{R}\mathbf{u}(t)]\, \mathrm dt</math> | <math display="block">J= \tfrac{1}{2} \int_{0}^{\infty}[\mathbf{x}^{\mathsf{T}}(t)\mathbf{Q}\mathbf{x}(t) + \mathbf{u}^{\mathsf{T}}(t)\mathbf{R}\mathbf{u}(t)]\, \mathrm dt</math> | ||
रैखिक समय-अपरिवर्तनीय प्रथम-क्रम गतिशील बाधाओं के अधीन | रैखिक समय-अपरिवर्तनीय प्रथम-क्रम गतिशील बाधाओं के अधीन | ||
Line 36: | Line 36: | ||
और प्रारंभिक स्थिति | और प्रारंभिक स्थिति | ||
<math display="block"> \mathbf{x}(t_0) = \mathbf{x}_0</math> | <math display="block"> \mathbf{x}(t_0) = \mathbf{x}_0</math> | ||
परिमित-क्षितिज | परिमित-क्षितिज प्रकर्ण में आव्यूह उसमें प्रतिबंधित हैं <math>\mathbf{Q}</math> तथा <math>\mathbf{R}</math> क्रमशः सकारात्मक अर्ध-निश्चित और सकारात्मक निश्चित हैं। तथापि, अनंत-क्षितिज प्रकर्ण में, [[मैट्रिक्स (गणित)|आव्यूह (गणित)]] <math>\mathbf{Q}</math> तथा <math>\mathbf{R}</math> न केवल सकारात्मक-अर्द्ध-निश्चित और सकारात्मक-निश्चित हैं, वस्तुतः स्थिर भी हैं। इन अतिरिक्त प्रतिबंधों पर | ||
<math>\mathbf{Q}</math> तथा <math>\mathbf{R}</math> अनंत- | <math>\mathbf{Q}</math> तथा <math>\mathbf{R}</math> अनंत-क्षितिजप्रकर्ण में यह सुनिश्चित करने के लिए लागू किया जाता है कि लागत कार्यात्मक सकारात्मक बनी रहे। इसके अतिरिक्त, यह सुनिश्चित करने के लिए कि लागत प्रकार्य सीमित है, जोड़ी <math>(\mathbf{A},\mathbf{B})</math> पर अतिरिक्त प्रतिबंध लगाया जाता है जो कि नियंत्रणीय है। ध्यान दें कि LQ या LQR लागत कार्यात्मक को भौतिक रूप से नियंत्रण ऊर्जा को कम करने के प्रयास के रूप में सोचा जा सकता है (द्विघात रूप में मापा जाता है)। | ||
अनंत क्षितिज समस्या ( | अनंत क्षितिज समस्या ( अर्थात्, LQR) अत्यधिक प्रतिबंधात्मक और अनिवार्य रूप से व्यर्थ लग सकती है क्योंकि यह मानती है कि संचालक प्रणाली को शून्य-स्थिति में चला रहा है और इसलिए प्रणाली के प्रक्षेपण को शून्य पर चला रहा है। यह वास्तव में सही है। हालाँकि प्रक्षेपण को एक वांछित अशून्य स्तर पर ले जाने की समस्या को शून्य प्रक्षेपण एक के बाद हल किया जा सकता है। वस्तुत:, यह साबित किया जा सकता है कि इस द्वितीयक LQR समस्या को बहुत ही सरल तरीके से हल किया जा सकता है। शास्त्रीय इष्टतम नियंत्रण सिद्धांत में यह दिखाया गया है कि LQ (या LQR) इष्टतम नियंत्रण में प्रतिपुष्टि स्वरुप है। | ||
<math display="block">\mathbf{u}(t) = -\mathbf{K}(t)\mathbf{x}(t)</math> | <math display="block">\mathbf{u}(t) = -\mathbf{K}(t)\mathbf{x}(t)</math> | ||
जहाँ पे <math>\mathbf{K}(t)</math> एक उचित रूप से आयामित आव्यूह है, जैसा दिया गया है | |||
<math display="block">\mathbf{K}(t) = \mathbf{R}^{-1}\mathbf{B}^{\mathsf{T}}\mathbf{S}(t),</math> | <math display="block">\mathbf{K}(t) = \mathbf{R}^{-1}\mathbf{B}^{\mathsf{T}}\mathbf{S}(t),</math> | ||
तथा <math>\mathbf{S}(t)</math> अवकल [[रिकाटी समीकरण]] का हल है। अंतर रिकाटी समीकरण के रूप में दिया गया है | तथा <math>\mathbf{S}(t)</math> अवकल [[रिकाटी समीकरण]] का हल है। अंतर रिकाटी समीकरण के रूप में दिया गया है | ||
<math display="block">\dot{\mathbf{S}}(t) = -\mathbf{S}(t)\mathbf{A}-\mathbf{A}^{\mathsf{T}} \mathbf{S}(t) +\mathbf{S}(t)\mathbf{B}\mathbf{R}^{-1}\mathbf{B}^{\mathsf{T}}\mathbf{S}(t) - \mathbf{Q}</math> | <math display="block">\dot{\mathbf{S}}(t) = -\mathbf{S}(t)\mathbf{A}-\mathbf{A}^{\mathsf{T}} \mathbf{S}(t) +\mathbf{S}(t)\mathbf{B}\mathbf{R}^{-1}\mathbf{B}^{\mathsf{T}}\mathbf{S}(t) - \mathbf{Q}</math> | ||
परिमित क्षितिज | परिमित क्षितिज LQ समस्या के लिए, रिकाटी समीकरण को अंतस्थ सीमा की स्थिति का उपयोग करते हुए समय में पीछे की ओर एकीकृत किया जाता है | ||
<math display="block">\mathbf{S}(t_f) = \mathbf{S}_f</math> | <math display="block">\mathbf{S}(t_f) = \mathbf{S}_f</math> | ||
अनंत क्षितिज | अनंत क्षितिज LQR समस्या के लिए, अंतर रिकाटी समीकरण को बीजगणितीय रिकाटी समीकरण (ARE) के साथ बदल दिया गया है | ||
<math display="block">\mathbf{0} = -\mathbf{S}\mathbf{A}-\mathbf{A}^{\mathsf{T}}\mathbf{S}+\mathbf{S}\mathbf{B}\mathbf{R}^{-1}\mathbf{B}^{\mathsf{T}}\mathbf{S}-\mathbf{Q}</math> | <math display="block">\mathbf{0} = -\mathbf{S}\mathbf{A}-\mathbf{A}^{\mathsf{T}}\mathbf{S}+\mathbf{S}\mathbf{B}\mathbf{R}^{-1}\mathbf{B}^{\mathsf{T}}\mathbf{S}-\mathbf{Q}</math> | ||
यह समझना कि | यह समझना कि ARE अनंत क्षितिज समस्या, मैट्रिसेस से उत्पन्न होता है <math>\mathbf{A}</math>, <math>\mathbf{B}</math>, <math>\mathbf{Q}</math>, तथा <math>\mathbf{R}</math> सभी स्थिर हैं। यह ध्यान दिया जाता है कि बीजगणितीय रिकाटी समीकरण के सामान्य रूप से कई समाधान हैं और सकारात्मक निश्चित (या सकारात्मक अर्ध-निश्चित) समाधान वह है जिसका उपयोग प्रतिक्रिया लाभ की गणना करने के लिए किया जाता है। LQ(LQR) समस्या को रूडोल्फ ई. काल्मन द्वारा सुरुचिपूर्ण ढंग से हल किया गया था।<ref>Kalman, Rudolf. ''A new approach to linear filtering and prediction problems''. Transactions of the ASME, Journal of Basic Engineering, 82:34–45, 1960</ref> | ||
== इष्टतम नियंत्रण के लिए संख्यात्मक तरीके == | == इष्टतम नियंत्रण के लिए संख्यात्मक तरीके == | ||
इष्टतम नियंत्रण समस्याएं | इष्टतम नियंत्रण समस्याएं सामान्यतः अरैखिक होती हैं और इसलिए, सामान्यतः विश्लेषणात्मक समाधान नहीं होते हैं (उदाहरण के लिए, रैखिक-द्विघात इष्टतम नियंत्रण समस्या की तरह)। नतीजतन, इष्टतम नियंत्रण समस्याओं को हल करने के लिए संख्यात्मक तरीकों को नियोजित करना आवश्यक है। इष्टतम नियंत्रण के प्रारंभिक वर्षों में ({{abbr|c.|circa}} 1950 से 1980 के दशक) इष्टतम नियंत्रण समस्याओं को हल करने के लिए इष्ट दृष्टिकोण अप्रत्यक्ष तरीकों का था। अप्रत्यक्ष विधि में, पहले क्रम की अनुकूलता की स्थिति प्राप्त करने के लिए विविधताओं की गणना को नियोजित किया जाता है। इन स्थितियों के परिणामस्वरूप दो-बिंदु (या, एक जटिल समस्या केप्रकर्ण में, एक बहु-बिंदु) सीमा-मान समस्या होती है। इस [[सीमा-मूल्य समस्या]] की वास्तव में एक विशेष संरचना है क्योंकि यह [[हैमिल्टनियन (नियंत्रण सिद्धांत)]] के व्युत्पन्न लेने से उत्पन्न होती है। इस प्रकार, परिणामी गतिकीय प्रणाली रूप की [[हैमिल्टनियन प्रणाली]] है<ref name=":0" /> | ||
<math display="block">\begin{align} | <math display="block">\begin{align} | ||
\dot{\textbf{x}} & = \frac{\partial H}{\partial\boldsymbol{\lambda}} \\[1.2ex] | \dot{\textbf{x}} & = \frac{\partial H}{\partial\boldsymbol{\lambda}} \\[1.2ex] | ||
\dot{\boldsymbol{\lambda}} & = -\frac{\partial H}{\partial\textbf{x}} | \dot{\boldsymbol{\lambda}} & = -\frac{\partial H}{\partial\textbf{x}} | ||
\end{align}</math> | \end{align}</math> | ||
जहाँ पर | |||
<math display="block">H= F +\boldsymbol{\lambda}^{\mathsf{T}}\textbf{f}- \boldsymbol{\mu}^{\mathsf{T}}\textbf{h}</math> | <math display="block">H= F +\boldsymbol{\lambda}^{\mathsf{T}}\textbf{f}- \boldsymbol{\mu}^{\mathsf{T}}\textbf{h}</math> | ||
संवर्धित हैमिल्टनियन है और अप्रत्यक्ष विधि में, सीमा-मूल्य समस्या हल हो जाती है (उपयुक्त सीमा या ट्रांसवर्सलिटी स्थितियों का उपयोग करके)। एक अप्रत्यक्ष विधि का उपयोग करने की सुंदरता यह है कि स्थिति और आसन्न ( | संवर्धित हैमिल्टनियन है और अप्रत्यक्ष विधि में, सीमा-मूल्य समस्या हल हो जाती है (उपयुक्त सीमा या ट्रांसवर्सलिटी स्थितियों का उपयोग करके)। एक अप्रत्यक्ष विधि का उपयोग करने की सुंदरता यह है कि स्थिति और आसन्न (अर्थात् , <math>\boldsymbol{\lambda}</math>) के लिए हल किया जाता है और परिणामी समाधान एक चरम प्रक्षेपवक्र होने के लिए आसानी से सत्यापित होता है। अप्रत्यक्ष तरीकों का नुकसान यह है कि सीमा-मूल्य समस्या को हल करना प्राय: बेहद मुश्किल होता है (विशेष रूप से उन समस्याओं के लिए जो बड़े समय के अंतराल या आंतरिक बिंदु बाधाओं के साथ समस्याओं को फैलाते हैं)। एक प्रसिद्ध प्रक्रिया योजना जो अप्रत्यक्ष तरीकों को लागू करता है, वह है BNDSCO।<ref>Oberle, H. J. and Grimm, W., "BNDSCO-A Program for the Numerical Solution of Optimal Control Problems," Institute for Flight Systems Dynamics, DLR, Oberpfaffenhofen, 1989</ref> | ||
1980 के दशक से जो दृष्टिकोण संख्यात्मक इष्टतम नियंत्रण में प्रमुखता से बढ़ा है, वह तथाकथित प्रत्यक्ष तरीकों का है। एक प्रत्यक्ष विधि में, स्थिति या नियंत्रण, या दोनों, एक उपयुक्त | |||
1980 के दशक से जो दृष्टिकोण संख्यात्मक इष्टतम नियंत्रण में प्रमुखता से बढ़ा है, वह तथाकथित प्रत्यक्ष तरीकों का है। एक प्रत्यक्ष विधि में, स्थिति या नियंत्रण, या दोनों, एक उपयुक्त प्रकार्य सन्निकटन (जैसे, बहुपद सन्निकटन या टुकड़े-टुकड़े स्थिर मापदण्ड) का उपयोग करके अनुमानित किए जाते हैं। इसके साथ ही, लागत कार्यात्मक लागत प्रकार्य के रूप में अनुमानित है। फिर, प्रकार्य सन्निकटन के गुणांक को इष्टमीकरण चर के रूप में माना जाता है और समस्या को प्ररूप की एक गैर-रैखिक अनुकूलन समस्या में स्थानांतरित किया जाता है: | |||
न्यूनतमीकरण<math display="block"> F(\mathbf{z})</math> | |||
<math display="block"> F(\mathbf{z})</math> | |||
बीजगणितीय बाधाओं के अधीन | बीजगणितीय बाधाओं के अधीन | ||
<math display="block"> \begin{align} | <math display="block"> \begin{align} | ||
Line 70: | Line 70: | ||
\mathbf{h}(\mathbf{z}) & \leq \mathbf{0} | \mathbf{h}(\mathbf{z}) & \leq \mathbf{0} | ||
\end{align} </math> | \end{align} </math> | ||
नियोजित प्रत्यक्ष विधि के प्रकार के आधार पर, गैर-रैखिक अनुकूलन समस्या का आकार काफी छोटा हो सकता है (उदाहरण के लिए, प्रत्यक्ष | नियोजित प्रत्यक्ष विधि के प्रकार के आधार पर, गैर-रैखिक अनुकूलन समस्या का आकार काफी छोटा हो सकता है (उदाहरण के लिए, प्रत्यक्ष आखेट या क्वासिलिनेराइजेशन विधि में), औसत (उदाहरण के लिए [[स्यूडोस्पेक्ट्रल इष्टतम नियंत्रण]])<ref name="ReviewPOC">{{cite journal |author-link=I. Michael Ross |first1=I. M. |last1=Ross |first2=M. |last2=Karpenko |title=स्यूडोस्पेक्ट्रल इष्टतम नियंत्रण की समीक्षा: सिद्धांत से उड़ान तक|journal=Annual Reviews in Control |volume=36 |issue=2 |pages=182–197 |year=2012 |doi=10.1016/j.arcontrol.2012.09.002 |title-link=Pseudospectral optimal control }}</ref>) या काफी बड़ा हो सकता है (उदाहरण के लिए, एक प्रत्यक्ष [[सहस्थापन विधि]]<ref>{{cite book |last=Betts |first=J. T. |title=गैर-रैखिक प्रोग्रामिंग का उपयोग करके इष्टतम नियंत्रण के लिए व्यावहारिक तरीके|publisher=SIAM Press |location=Philadelphia, Pennsylvania |edition=2nd |year=2010 |isbn=978-0-89871-688-7 }}</ref>) बाद के प्रकर्ण में ( अर्थात् , एक सहस्थापन विधि), गैर-रैखिक अनुकूलन समस्या का शाब्दिक रूप से हजारों से दसियों हजारों चर और बाधाएं हो सकती हैं। प्रत्यक्ष विधि से उत्पन्न होने वाले कई NLP के आकार को देखते हुए, यह कुछ हद तक प्रति-सहज लग सकता है कि सीमा-मूल्य समस्या को हल करने की तुलना में गैर-रैखिक अनुकूलन समस्या को हल करना आसान है। हालांकि, यह तथ्य है कि सीमा-मूल्य समस्या की तुलना में NLP को हल करना आसान है। संगणना की सापेक्ष आसानी का कारण, विशेष रूप से प्रत्यक्ष सह-स्थापन विधि, यह है कि NLP विरल है और कई प्रसिद्ध प्रक्रिया सामग्री कार्यक्रम मौजूद हैं (उदाहरण के लिए, SNOPT<ref>Gill, P. E., Murray, W. M., and Saunders, M. A., ''User's Manual for SNOPT Version 7: Software for Large-Scale Nonlinear Programming'', University of California, San Diego Report, 24 April 2007</ref>) बड़े विरल NLP को हल करने के लिए। नतीजतन, समस्याओं की सीमा जो प्रत्यक्ष विधियों के माध्यम से हल की जा सकती है (विशेष रूप से प्रत्यक्ष सहस्थापन विधियाँ जो इन दिनों बहुत लोकप्रिय हैं) उन समस्याओं की सीमा से काफी बड़ी हैं जिन्हें अप्रत्यक्ष तरीकों से हल किया जा सकता है। वास्तव में, प्रत्यक्ष विधियाँ इन दिनों इतनी लोकप्रिय हो गई हैं कि बहुत से लोगों ने विस्तृत प्रक्रिया सामग्री कार्यक्रम लिखे हैं जो इन विधियों को नियोजित करते हैं। विशेष रूप से ऐसे कई कार्यक्रमों में DIRCOL,<ref>von Stryk, O., ''User's Guide for DIRCOL (version 2.1): A Direct Collocation Method for the Numerical Solution of Optimal Control Problems'', Fachgebiet Simulation und Systemoptimierung (SIM), Technische Universität Darmstadt (2000, Version of November 1999).</ref> SOCS,<ref>Betts, J.T. and Huffman, W. P., ''Sparse Optimal Control Software, SOCS'', Boeing Information and Support Services, Seattle, Washington, July 1997</ref> OTIS,<ref>{{cite journal |last1=Hargraves |first1=C. R. |last2=Paris |first2=S. W. |title=नॉनलाइनियर प्रोग्रामिंग और कोलोकेशन का उपयोग करके डायरेक्ट ट्रैजेक्टरी ऑप्टिमाइजेशन|journal=Journal of Guidance, Control, and Dynamics |volume=10 |issue=4 |year=1987 |pages=338–342 |doi=10.2514/3.20223 |bibcode=1987JGCD...10..338H }}</ref> GESOP/ASTOS,<ref>Gath, P.F., Well, K.H., "Trajectory Optimization Using a Combination of Direct Multiple Shooting and Collocation", AIAA 2001–4047, AIAA Guidance, Navigation, and Control Conference, Montréal, Québec, Canada, 6–9 August 2001</ref> DITAN।<ref>Vasile M., Bernelli-Zazzera F., Fornasari N., Masarati P., "Design of Interplanetary and Lunar Missions Combining Low-Thrust and Gravity Assists", Final Report of the ESA/ESOC Study Contract No. 14126/00/D/CS, September 2002</ref> और PyGMO/PyKEP।<ref>Izzo, Dario. "PyGMO and PyKEP: open source tools for massively parallel optimization in astrodynamics (the case of interplanetary trajectory optimization)." Proceed. Fifth International Conf. Astrodynam. Tools and Techniques, ICATT. 2012.</ref> नवागत वर्षों में, [[MATLAB]] कार्यरचना भाषा के आगमन के कारण, MATLAB में इष्टतम नियंत्रण प्रक्रिया सामग्री अधिक सामान्य हो गया है। शैक्षिक रूप से विकसित MATLAB यंत्रेतर सामग्री साधन के उदाहरणों में प्रत्यक्ष तरीकों को लागू करने में अन्तर्वलित हैं, ''RIOTS'',<ref>[http://www.schwartz-home.com/RIOTS/ RIOTS] {{Webarchive| url=https://web.archive.org/web/20110716014630/http://www.schwartz-home.com/RIOTS/ |date=16 July 2011 }}, based on {{cite thesis |type=Ph.D. |last=Schwartz |first=Adam |date=1996 |title=Theory and Implementation of Methods based on Runge–Kutta Integration for Solving Optimal Control Problems |publisher=University of California at Berkeley |oclc=35140322 }}</ref> [[DIDO (इष्टतम नियंत्रण)|DIDO]],<ref>Ross, I. M., ''Enhancements to the DIDO Optimal Control Toolbox, arXiv 2020.'' https://arxiv.org/abs/2004.13112</ref> ''DIRECT'',<ref>Williams, P., ''User's Guide to DIRECT, Version 2.00,'' Melbourne, Australia, 2008</ref> FALCON.m,<ref>[http://www.falcon-m.com/ FALCON.m], described in Rieck, M., Bittner, M., Grüter, B., Diepolder, J., and Piprek, P., ''FALCON.m - User Guide'', Institute of Flight System Dynamics, Technical University of Munich, October 2019</ref> और ''GPOPS'',<ref>[http://gpops.sourceforge.net GPOPS] {{Webarchive|url=https://web.archive.org/web/20110724074641/http://gpops.sourceforge.net/ |date=24 July 2011 }}, described in Rao, A. V., Benson, D. A., Huntington, G. T., Francolin, C., Darby, C. L., and Patterson, M. A., ''User's Manual for GPOPS: A MATLAB Package for Dynamic Optimization Using the [[Gauss pseudospectral method|Gauss Pseudospectral Method]]'', University of Florida Report, August 2008.</ref> चूँकि एक उद्योग विकसित MATLAB उपकरण का एक उदाहरण [[PROPT]] है।<ref>Rutquist, P. and Edvall, M. M, ''PROPT – MATLAB Optimal Control Software," 1260 S.E. Bishop Blvd Ste E, Pullman, WA 99163, USA: Tomlab Optimization, Inc.</ref> इन प्रक्रिया सामग्री कलपुर्जे ने शैक्षणिक अनुसंधान और औद्योगिक समस्याओं दोनों के लिए जटिल इष्टतम नियंत्रण समस्याओं का पता लगाने के लिए लोगों के अवसर में काफी वृद्धि की है।<ref>I.M. Ross, [https://nps.edu/documents/103424443/116151573/Ross.pdf/2c85d1a1-ff5b-4f60-9700-2ee5e1f3f65f?t=1580766209000 Computational Optimal Control], 3rd Workshop in Computational Issues in Nonlinear Control, October 8th, 2019, Monterey, CA</ref> अंत में, यह नोट किया गया है कि सामान्य-उद्देश्य MATLAB अनुकूलन वातावरण जैसे [[TOMLAB]] ने कूटलेखन जटिल इष्टतम नियंत्रण समस्याओं को C और FORTRAN जैसी भाषाओं में पहले की तुलना में काफी आसान बना दिया है। | ||
== असतत-समय इष्टतम नियंत्रण == | == असतत-समय इष्टतम नियंत्रण == | ||
इस प्रकार अब तक के उदाहरणों ने [[निरंतर समय]] प्रणाली और नियंत्रण समाधान दिखाए हैं। | इस प्रकार अब तक के उदाहरणों ने [[निरंतर समय]] प्रणाली और नियंत्रण समाधान दिखाए हैं। वस्तुत:, इष्टतम नियंत्रण समाधान के रूप में अब प्राय: डिजिटली लागू किया जाता है, समकालीन नियंत्रण सिद्धांत अब मुख्य रूप से पृथक समय प्रणालियों और समाधानों से संबंधित है। संगत सन्निकटन का सिद्धांत<ref>E. Polak, ''On the use of consistent approximations in the solution of semi-infinite optimization and optimal control problems'' Math. Prog. 62 pp. 385–415 (1993).</ref><ref>{{Cite journal|last=Ross|first=I M. |date=2005-12-01|title=इष्टतम नियंत्रण के लिए एक रोडमैप: यात्रा करने का सही तरीका|url=http://dx.doi.org/10.1196/annals.1370.015 |journal=Annals of the New York Academy of Sciences|volume=1065 |issue=1 |pages=210–231 |doi=10.1196/annals.1370.015 |pmid=16510411 |bibcode=2005NYASA1065..210R |s2cid=7625851 |issn=0077-8923}}</ref> ऐसी स्थितियाँ प्रदान करता है जिसके अंतर्गत तेजी से सटीक विखंडित इष्टतम नियंत्रण समस्या की एक श्रृंखला के समाधान मूल, निरंतर-समय की समस्या के समाधान में परिवर्तित हो जाते हैं। विवेकाधिकार के सभी तरीकों में स्पष्ट रूप से भी यह गुण नहीं होता है।<ref>{{Cite journal|last1=Fahroo|first1=Fariba |last2=Ross|first2=I. Michael |date=September 2008|title=कॉस्टेट्स के अभिसरण का मतलब नियंत्रण का अभिसरण नहीं है|url=http://dx.doi.org/10.2514/1.37331|journal=Journal of Guidance, Control, and Dynamics|volume=31|issue=5 |pages=1492–1497|doi=10.2514/1.37331 |bibcode=2008JGCD...31.1492F |s2cid=756939 |issn=0731-5090}}</ref> उदाहरण के लिए, समस्या के गतिशील समीकरणों को एकीकृत करने के लिए एक चर चरण-आकार की दिनचर्या का उपयोग करने से एक अनुप्रवण उत्पन्न हो सकता है जो समाधान के संपर्क में आने पर शून्य (या सही दिशा में इंगित) में परिवर्तित नहीं होता है। प्रत्यक्ष विधि [http://www.schwartz-home.com/RIOTS RIOTS] संगत सन्निकटन के सिद्धांत पर आधारित है। | ||
== उदाहरण == | == उदाहरण == | ||
कई इष्टतम नियंत्रण समस्याओं में एक सामान्य समाधान रणनीति लागत के लिए हल करना है (कभी-कभी छाया मूल्य कहा जाता है)। <math>\lambda(t)</math> पर्शुरेखित एक संख्या में स्तिथि चर के अगले मोड़ के विस्तार या अनुबंध के सीमांत मूल्य को संक्षेप में प्रस्तुत करता है। सीमांत मूल्य न केवल अगले मोड़ पर अर्जित लाभ है वस्तुतः कार्यक्रम की अवधि से जुड़ा है। यह अच्छा है जब <math>\lambda(t)</math> विश्लेषणात्मक रूप से हल किया जा सकता है, लेकिन सामान्यतः, सबसे अधिक यह किया जा सकता है कि यह पर्याप्त रूप से अच्छी तरह से वर्णन करता है कि अंतर्ज्ञान समाधान के चरित्र को समझ सकता है और एक समीकरण समाधानकर्ता मूल्यों के लिए संख्यात्मक रूप से हल कर सकता है। | |||
कई इष्टतम नियंत्रण समस्याओं में एक सामान्य समाधान रणनीति लागत के लिए हल करना है (कभी-कभी छाया मूल्य कहा जाता है) <math>\lambda(t)</math> | |||
अभिप्राप्त <math>\lambda(t)</math>, नियंत्रण के लिए पंक्ति-t इष्टतम मूल्य को सामान्यतः ज्ञान के आधार पर <math>\lambda(t)</math> अंतर समीकरण के रूप में हल किया जा सकता है। फिर से यह विरल होता है, विशेष रूप से निरंतर-समय की समस्याओं में, यह नियंत्रण या राज्य के मूल्य को स्पष्ट रूप से प्राप्त करता है। सामान्यतः, रणनीति प्रभावसीमा और क्षेत्रों के लिए हल करना है जो इष्टतम नियंत्रण की विशेषता है और समय में वास्तविक पसंद मूल्यों को अलग करने के लिए एक संख्यात्मक समाधानकर्ता का उपयोग करते हैं। | |||
=== परिमित समय === | === परिमित समय === | ||
एक खदान मालिक की समस्या पर विचार करें, जिसे यह तय करना होगा कि उनकी खदान से किस दर पर अयस्क निकाला जाए। अयस्क पर उनका अधिकार <math>0</math> तारीख से <math>T</math> तक है. <math>0</math> तिथि पर वहाँ जमीन में <math>x_0</math> अयस्क है, और अयस्क की समय-निर्भर मात्रा <math>x(t)</math> खदान मालिक इसे निकालता है तो जमीन में छोड़े जाने की दर <math>u(t)</math> से गिरावट आती है। खदान मालिक लागत पर अयस्क निकालता है <math>u(t)^2/x(t)</math> (निष्कर्षण की लागत वर्ग के साथ निष्कर्षण की गति और बचे हुए अयस्क की मात्रा के व्युत्क्रम के साथ बढ़ती है) और अयस्क को एक स्थिर मूल्य पर बेचता है <math>p</math>. समय पर जमीन में छोड़ा गया कोई अयस्क <math>T</math> बेचा नहीं जा सकता है और इसका कोई मूल्य नहीं है (कोई क्षेप्य मूल्य नहीं है)। मालिक स्वामित्व की अवधि में बिना किसी छूट के लाभ को अधिकतम करने के लिए समय के साथ अलग-अलग निकासी की दर चुनता है <math>u(t)</math>। | |||
एक खदान मालिक की समस्या पर विचार करें, जिसे यह तय करना होगा कि उनकी खदान से किस दर पर अयस्क निकाला जाए। | |||
{{ordered list | {{ordered list | ||
| 1 = | | 1 = पृथक- समय वृतान्त | ||
{{pb}} | {{pb}} | ||
प्रबंधक लाभ को अधिकतम करता है <math>\Pi</math>: | |||
<math display="block">\Pi = \sum_{t=0}^{T-1} \left[ pu_t - \frac{u_t^2}{x_t} \right] </math> | <math display="block">\Pi = \sum_{t=0}^{T-1} \left[ pu_t - \frac{u_t^2}{x_t} \right] </math> | ||
दशा चर के लिए गति के कानून के अधीन<math>x_t</math> | |||
<math display="block">x_{t+1} - x_t = - u_t</math> | <math display="block">x_{t+1} - x_t = - u_t</math> | ||
हैमिल्टनियन का निर्माण करें और अंतर करें: | |||
<math display="block">\begin{align} | <math display="block">\begin{align} | ||
H &= pu_t - \frac{u_t^2}{x_t} - \lambda_{t+1} u_t \\ | H &= pu_t - \frac{u_t^2}{x_t} - \lambda_{t+1} u_t \\ | ||
Line 100: | Line 98: | ||
\end{align}</math> | \end{align}</math> | ||
चूंकि खदान मालिक समय पर बचे हुए अयस्क को महत्व नहीं देता है, | |||
<math display="block">\lambda_T = 0</math> | <math display="block">\lambda_T = 0</math> | ||
उपरोक्त समीकरणों का उपयोग करके,इस शृंखला को हल करना आसान है और प्रारंभिक और टर्न-t स्थितियों का उपयोग करते हुए, | |||
श्रंखला को स्पष्ट रूप से दे कर हल किया जा सकता है | |||
और प्रारंभिक और टर्न- | |||
| 2 = निरंतर-समय संस्करण | | 2 = निरंतर-समय संस्करण | ||
Line 139: | Line 132: | ||
* [[बेलमैन समीकरण]] | * [[बेलमैन समीकरण]] | ||
* [[बेलमैन स्यूडोस्पेक्ट्रल विधि]] | * [[बेलमैन स्यूडोस्पेक्ट्रल विधि]] | ||
* [[ | * [[ क्षिप्रतम वक्र]] | ||
* DIDO (इष्टतम नियंत्रण) | * DIDO (इष्टतम नियंत्रण) | ||
* [[ | * [[DNSS बिंदु]] | ||
* [[गतिशील प्रोग्रामिंग]] | * [[गतिशील प्रोग्रामिंग]] | ||
* [[गॉस स्यूडोस्पेक्ट्रल विधि]] | * [[गॉस स्यूडोस्पेक्ट्रल विधि]] | ||
* [[सामान्यीकृत | * [[सामान्यीकृत निस्पंदन]] | ||
* [[ | * [[GPOPS-द्वितीय]] | ||
* [[ | * [[CasADi]] | ||
* JModelica.org (गतिशील अनुकूलन के लिए मॉडलिका-आधारित खुला स्रोत मंच) | * JModelica.org (गतिशील अनुकूलन के लिए मॉडलिका-आधारित खुला स्रोत मंच) | ||
* [[कलमन | * [[कलमन निस्यंदक]] | ||
* [[रैखिक-द्विघात नियामक]] | * [[रैखिक-द्विघात नियामक]] | ||
* [[ | * [[आदर्श भविष्यवाणी नियंत्रण]] | ||
* [[ | * [[अभिलंघन कसौटी]] | ||
* [[ | * [[PID नियंत्रक]] | ||
* | * PROPT (MATLAB के लिए इष्टतम नियंत्रण प्रक्रिया सामग्री) | ||
* स्यूडोस्पेक्ट्रल इष्टतम नियंत्रण | * स्यूडोस्पेक्ट्रल इष्टतम नियंत्रण | ||
* [[ | * [[ अनुधावन- भागना]] का खेल | ||
* [[ | * [[स्खलन प्रणाली नियंत्रण]] | ||
* | * SNOTP | ||
* [[ | * [[प्रसंभाव्य नियंत्रण]] | ||
* [[प्रक्षेपवक्र अनुकूलन]] | * [[प्रक्षेपवक्र अनुकूलन]] | ||
{{colend}} | {{colend}} | ||
==संदर्भ== | ==संदर्भ== | ||
{{Reflist|30em}} | {{Reflist|30em}} | ||
==अग्रिम पठन== | ==अग्रिम पठन== | ||
Line 173: | Line 164: | ||
* {{cite book |first1=M. I. |last1=Kamien |author-link=Morton Kamien |first2=N. L. |last2=Schwartz |author-link2=Nancy Schwartz |title=Dynamic Optimization: The Calculus of Variations and Optimal Control in Economics and Management |location=New York |publisher=Elsevier |edition=Second |year=1991 |isbn=0-444-01609-0 |url=https://books.google.com/books?id=0IoGUn8wjDQC }} | * {{cite book |first1=M. I. |last1=Kamien |author-link=Morton Kamien |first2=N. L. |last2=Schwartz |author-link2=Nancy Schwartz |title=Dynamic Optimization: The Calculus of Variations and Optimal Control in Economics and Management |location=New York |publisher=Elsevier |edition=Second |year=1991 |isbn=0-444-01609-0 |url=https://books.google.com/books?id=0IoGUn8wjDQC }} | ||
* {{cite book |last=Kirk |first=D. E. |author-link=Donald E. Kirk |year=1970 |title=Optimal Control Theory: An Introduction |location=Englewood Cliffs |publisher=Prentice-Hall |isbn=0-13-638098-0 |url=https://books.google.com/books?id=onuH0PnZwV4C }} | * {{cite book |last=Kirk |first=D. E. |author-link=Donald E. Kirk |year=1970 |title=Optimal Control Theory: An Introduction |location=Englewood Cliffs |publisher=Prentice-Hall |isbn=0-13-638098-0 |url=https://books.google.com/books?id=onuH0PnZwV4C }} | ||
==बाहरी संबंध== | ==बाहरी संबंध== | ||
*[https://nps.edu/documents/103424443/116151573/Ross.pdf/2c85d1a1-ff5b-4f60-9700-2ee5e1f3f65f?t=1580766209000 Computational Optimal Control] | *[https://nps.edu/documents/103424443/116151573/Ross.pdf/2c85d1a1-ff5b-4f60-9700-2ee5e1f3f65f?t=1580766209000 Computational Optimal Control] | ||
Line 198: | Line 170: | ||
* [https://gekko.readthedocs.io/en/latest/ GEKKO - Python package for optimal control] | * [https://gekko.readthedocs.io/en/latest/ GEKKO - Python package for optimal control] | ||
* [https://web.archive.org/web/20101031195713/http://www.astos.de/products/gesop GESOP – Graphical Environment for Simulation and OPtimization] | * [https://web.archive.org/web/20101031195713/http://www.astos.de/products/gesop GESOP – Graphical Environment for Simulation and OPtimization] | ||
* [http://gpops2.com/ GPOPS-II – General-Purpose MATLAB Optimal Control Software] | * [http://gpops2.com/ GPOPS-II – General-Purpose MATLAB Optimal Control Software] | ||
* [https://web.casadi.org/ CasADi – Free and open source symbolic framework for optimal control] | * [https://web.casadi.org/ CasADi – Free and open source symbolic framework for optimal control] | ||
Line 211: | Line 183: | ||
{{Authority control}} | {{Authority control}} | ||
{{DEFAULTSORT:Optimal Control}} | {{DEFAULTSORT:Optimal Control}} | ||
[[Category: | [[Category:AC with 0 elements|Optimal Control]] | ||
[[Category:Created On 25/11/2022]] | [[Category:Articles with invalid date parameter in template|Optimal Control]] | ||
[[Category:Articles with short description|Optimal Control]] | |||
[[Category:CS1 English-language sources (en)]] | |||
[[Category:Created On 25/11/2022|Optimal Control]] | |||
[[Category:Lua-based templates|Optimal Control]] | |||
[[Category:Machine Translated Page|Optimal Control]] | |||
[[Category:Multi-column templates|Optimal Control]] | |||
[[Category:Pages using div col with small parameter|Optimal Control]] | |||
[[Category:Short description with empty Wikidata description|Optimal Control]] | |||
[[Category:Templates that add a tracking category|Optimal Control]] | |||
[[Category:Templates using TemplateData|Optimal Control]] | |||
[[Category:Templates using under-protected Lua modules|Optimal Control]] | |||
[[Category:Use dmy dates from April 2020|Optimal Control]] | |||
[[Category:Webarchive template wayback links]] | |||
[[Category:Wikipedia fully protected templates|Div col]] | |||
[[Category:इष्टतम नियंत्रण| ]] | |||
[[Category:गणितीय अनुकूलन|Optimal Control]] |
Latest revision as of 11:36, 1 November 2023
इष्टतम नियंत्रण सिद्धांत गणितीय अनुकूलन की एक शाखा है जो एक गतिशील प्रणाली के लिए समय की अवधि में एक नियंत्रण (इष्टतम नियंत्रण सिद्धांत) खोजने से संबंधित है, जैसे कि एक उद्देश्य प्रकार्य अनुकूलित किया गया है।[1] इसके विज्ञान, अभियांत्रिकी और संचालन अनुसंधान में कई अनुप्रयोग हैं। उदाहरण के लिए, गतिशील प्रणाली प्रक्षेपात्र प्रक्षेपक के अनुरूप नियंत्रण वाला एक अंतरिक्ष यान हो सकता है, और इसका उद्देश्य न्यूनतम ईंधन व्यय के साथ चंद्रमा तक पहुंचना हो सकता है।[2] या गतिशील प्रणाली बेरोजगारी को कम करने के उद्देश्य से एक राष्ट्र की अर्थव्यवस्था हो सकती है; इसप्रकर्ण में नियंत्रण राजकोषीय नीति और मौद्रिक नीति हो सकते हैं।[3] इष्टतम नियंत्रण सिद्धांत के ढांचे के भीतर संचालन अनुसंधान को लागू करने के लिए एक गतिशील प्रणाली भी शुरू की जा सकती है।[4][5]
इष्टतम नियंत्रण विविधताओं की कलन का एक विस्तार है, और नियंत्रण सिद्धांत प्राप्त करने के लिए एक गणितीय अनुकूलन विधि है।[6] 1950 के दशक में एडवर्ड जे. मैक्शेन द्वारा विविधताओं की कलन में योगदान के बाद, विधि काफी हद तक लेव पोंट्रीगिन और रिचर्ड बेलमैन के काम के कारण है।[7] इष्टतम नियंत्रण को नियंत्रण सिद्धांत में नियंत्रण रणनीति के रूप में देखा जा सकता है।[1]
सामान्य विधि
इष्टतम नियंत्रण किसी दी गई प्रणाली के लिए नियंत्रण कानून खोजने की समस्या से संबंधित है जैसे कि एक निश्चित इष्टतमता मानदंड प्राप्त किया जाता है। एक नियंत्रण समस्या में एक लागत कार्यात्मक सम्मिलित है जो राज्य और नियंत्रण चर का कार्य (गणित) है। एक इष्टतम नियंत्रण अंतर समीकरणों का एक समुच्चय है जो नियंत्रण चर के पथ का वर्णन करता है जो लागत प्रकार्य को कम करता है। पोन्ट्रियाजिन उच्चिष्ठ सिद्धांत (एक आवश्यक शर्त जिसे पोन्ट्रियाजिन न्यूनतम सिद्धांत या केवल पोंट्रीगिन के सिद्धांत के रूप में भी जाना जाता है) का उपयोग करके[8] या हैमिल्टन-जैकोबी-बेलमैन समीकरण (एक पर्याप्त स्थिति) को हल करके इष्टतम नियंत्रण प्राप्त किया जा सकता है।
हम एक साधारण उदाहरण से शुरू करते हैं। एक पहाड़ी सड़क पर एक सीधी रेखा में चलने वाली मोटर गाड़ी पर विचार करें। सवाल यह है कि कुल यात्रा समय को कम करने के लिए ड्राइवर को त्वरक पदिक कैसे दबाना चाहिए? इस उदाहरण में, शब्द नियंत्रण कानून विशेष रूप से उस तरीके को संदर्भित करता है जिसमें चालक त्वरक को दबाता है और यंत्रावली को बदलता है। प्रणाली में मोटर गाड़ी और सड़क दोनों अन्तर्वलित हैं, और इष्टतमता मानदंड कुल यात्रा समय का न्यूनतमकरण है। नियंत्रण समस्याओं में सामान्यतः सहायक प्रतिबंध (गणित) अन्तर्वलित होते हैं। उदाहरण के लिए, उपलब्ध ईंधन की मात्रा सीमित हो सकती है, त्वरक पेडल को कार के फर्श, गति सीमा आदि के माध्यम से नहीं धकेला जा सकता है।
एक उचित लागत प्रकार्य एक गणितीय अभिव्यक्ति होगी जो गति, ज्यामितीय विचारों और प्रणाली की प्रारंभिक स्थितियों के कार्य के रूप में यात्रा का समय देगी। बाधाएँ (गणित) प्राय: लागत फलन के साथ विनिमेय होती हैं।
एक और संबंधित इष्टतम नियंत्रण समस्या कार को चलाने का तरीका खोजने के लिए हो सकती है ताकि इसकी ईंधन खपत को कम किया जा सके, यह देखते हुए कि इसे एक निश्चित समय में पूरा करना होगा बिना कुछ राशि से अधिक बढाए। फिर भी एक और संबंधित नियंत्रण समस्या यात्रा को पूरा करने की कुल मौद्रिक लागत को कम करने के लिए हो सकती है, समय और ईंधन के लिए अनुमानित मौद्रिक कीमतों को देखते हुए।
एक अधिक सार रूपरेखा इस प्रकार है।[1] निरंतर-समय की लागत कार्यात्मक को कम करें
रैखिक द्विघात नियंत्रण
पिछले खंड में दी गई सामान्य गैर-रैखिक इष्टतम नियंत्रण समस्या का एक विशेष मामला रैखिक-द्विघात नियामक | रैखिक द्विघात (LQ) इष्टतम नियंत्रण समस्या है। LQ समस्या इस प्रकार बताई गई है। द्विघात निरंतर-समय लागत कार्यात्मक को कम करें
अनंत क्षितिज समस्या ( अर्थात्, LQR) अत्यधिक प्रतिबंधात्मक और अनिवार्य रूप से व्यर्थ लग सकती है क्योंकि यह मानती है कि संचालक प्रणाली को शून्य-स्थिति में चला रहा है और इसलिए प्रणाली के प्रक्षेपण को शून्य पर चला रहा है। यह वास्तव में सही है। हालाँकि प्रक्षेपण को एक वांछित अशून्य स्तर पर ले जाने की समस्या को शून्य प्रक्षेपण एक के बाद हल किया जा सकता है। वस्तुत:, यह साबित किया जा सकता है कि इस द्वितीयक LQR समस्या को बहुत ही सरल तरीके से हल किया जा सकता है। शास्त्रीय इष्टतम नियंत्रण सिद्धांत में यह दिखाया गया है कि LQ (या LQR) इष्टतम नियंत्रण में प्रतिपुष्टि स्वरुप है।
इष्टतम नियंत्रण के लिए संख्यात्मक तरीके
इष्टतम नियंत्रण समस्याएं सामान्यतः अरैखिक होती हैं और इसलिए, सामान्यतः विश्लेषणात्मक समाधान नहीं होते हैं (उदाहरण के लिए, रैखिक-द्विघात इष्टतम नियंत्रण समस्या की तरह)। नतीजतन, इष्टतम नियंत्रण समस्याओं को हल करने के लिए संख्यात्मक तरीकों को नियोजित करना आवश्यक है। इष्टतम नियंत्रण के प्रारंभिक वर्षों में (c. 1950 से 1980 के दशक) इष्टतम नियंत्रण समस्याओं को हल करने के लिए इष्ट दृष्टिकोण अप्रत्यक्ष तरीकों का था। अप्रत्यक्ष विधि में, पहले क्रम की अनुकूलता की स्थिति प्राप्त करने के लिए विविधताओं की गणना को नियोजित किया जाता है। इन स्थितियों के परिणामस्वरूप दो-बिंदु (या, एक जटिल समस्या केप्रकर्ण में, एक बहु-बिंदु) सीमा-मान समस्या होती है। इस सीमा-मूल्य समस्या की वास्तव में एक विशेष संरचना है क्योंकि यह हैमिल्टनियन (नियंत्रण सिद्धांत) के व्युत्पन्न लेने से उत्पन्न होती है। इस प्रकार, परिणामी गतिकीय प्रणाली रूप की हैमिल्टनियन प्रणाली है[1]
1980 के दशक से जो दृष्टिकोण संख्यात्मक इष्टतम नियंत्रण में प्रमुखता से बढ़ा है, वह तथाकथित प्रत्यक्ष तरीकों का है। एक प्रत्यक्ष विधि में, स्थिति या नियंत्रण, या दोनों, एक उपयुक्त प्रकार्य सन्निकटन (जैसे, बहुपद सन्निकटन या टुकड़े-टुकड़े स्थिर मापदण्ड) का उपयोग करके अनुमानित किए जाते हैं। इसके साथ ही, लागत कार्यात्मक लागत प्रकार्य के रूप में अनुमानित है। फिर, प्रकार्य सन्निकटन के गुणांक को इष्टमीकरण चर के रूप में माना जाता है और समस्या को प्ररूप की एक गैर-रैखिक अनुकूलन समस्या में स्थानांतरित किया जाता है:
न्यूनतमीकरण
असतत-समय इष्टतम नियंत्रण
इस प्रकार अब तक के उदाहरणों ने निरंतर समय प्रणाली और नियंत्रण समाधान दिखाए हैं। वस्तुत:, इष्टतम नियंत्रण समाधान के रूप में अब प्राय: डिजिटली लागू किया जाता है, समकालीन नियंत्रण सिद्धांत अब मुख्य रूप से पृथक समय प्रणालियों और समाधानों से संबंधित है। संगत सन्निकटन का सिद्धांत[27][28] ऐसी स्थितियाँ प्रदान करता है जिसके अंतर्गत तेजी से सटीक विखंडित इष्टतम नियंत्रण समस्या की एक श्रृंखला के समाधान मूल, निरंतर-समय की समस्या के समाधान में परिवर्तित हो जाते हैं। विवेकाधिकार के सभी तरीकों में स्पष्ट रूप से भी यह गुण नहीं होता है।[29] उदाहरण के लिए, समस्या के गतिशील समीकरणों को एकीकृत करने के लिए एक चर चरण-आकार की दिनचर्या का उपयोग करने से एक अनुप्रवण उत्पन्न हो सकता है जो समाधान के संपर्क में आने पर शून्य (या सही दिशा में इंगित) में परिवर्तित नहीं होता है। प्रत्यक्ष विधि RIOTS संगत सन्निकटन के सिद्धांत पर आधारित है।
उदाहरण
कई इष्टतम नियंत्रण समस्याओं में एक सामान्य समाधान रणनीति लागत के लिए हल करना है (कभी-कभी छाया मूल्य कहा जाता है)। पर्शुरेखित एक संख्या में स्तिथि चर के अगले मोड़ के विस्तार या अनुबंध के सीमांत मूल्य को संक्षेप में प्रस्तुत करता है। सीमांत मूल्य न केवल अगले मोड़ पर अर्जित लाभ है वस्तुतः कार्यक्रम की अवधि से जुड़ा है। यह अच्छा है जब विश्लेषणात्मक रूप से हल किया जा सकता है, लेकिन सामान्यतः, सबसे अधिक यह किया जा सकता है कि यह पर्याप्त रूप से अच्छी तरह से वर्णन करता है कि अंतर्ज्ञान समाधान के चरित्र को समझ सकता है और एक समीकरण समाधानकर्ता मूल्यों के लिए संख्यात्मक रूप से हल कर सकता है।
अभिप्राप्त , नियंत्रण के लिए पंक्ति-t इष्टतम मूल्य को सामान्यतः ज्ञान के आधार पर अंतर समीकरण के रूप में हल किया जा सकता है। फिर से यह विरल होता है, विशेष रूप से निरंतर-समय की समस्याओं में, यह नियंत्रण या राज्य के मूल्य को स्पष्ट रूप से प्राप्त करता है। सामान्यतः, रणनीति प्रभावसीमा और क्षेत्रों के लिए हल करना है जो इष्टतम नियंत्रण की विशेषता है और समय में वास्तविक पसंद मूल्यों को अलग करने के लिए एक संख्यात्मक समाधानकर्ता का उपयोग करते हैं।
परिमित समय
एक खदान मालिक की समस्या पर विचार करें, जिसे यह तय करना होगा कि उनकी खदान से किस दर पर अयस्क निकाला जाए। अयस्क पर उनका अधिकार तारीख से तक है. तिथि पर वहाँ जमीन में अयस्क है, और अयस्क की समय-निर्भर मात्रा खदान मालिक इसे निकालता है तो जमीन में छोड़े जाने की दर से गिरावट आती है। खदान मालिक लागत पर अयस्क निकालता है (निष्कर्षण की लागत वर्ग के साथ निष्कर्षण की गति और बचे हुए अयस्क की मात्रा के व्युत्क्रम के साथ बढ़ती है) और अयस्क को एक स्थिर मूल्य पर बेचता है . समय पर जमीन में छोड़ा गया कोई अयस्क बेचा नहीं जा सकता है और इसका कोई मूल्य नहीं है (कोई क्षेप्य मूल्य नहीं है)। मालिक स्वामित्व की अवधि में बिना किसी छूट के लाभ को अधिकतम करने के लिए समय के साथ अलग-अलग निकासी की दर चुनता है ।
- पृथक- समय वृतान्त
प्रबंधक लाभ को अधिकतम करता है :
दशा चर के लिए गति के कानून के अधीनहैमिल्टनियन का निर्माण करें और अंतर करें:
चूंकि खदान मालिक समय पर बचे हुए अयस्क को महत्व नहीं देता है,
उपरोक्त समीकरणों का उपयोग करके,इस शृंखला को हल करना आसान है और प्रारंभिक और टर्न-t स्थितियों का उपयोग करते हुए,
श्रंखला को स्पष्ट रूप से दे कर हल किया जा सकता है - निरंतर-समय संस्करण
प्रबंधक लाभ को अधिकतम करता है :
जहां राज्य चर निम्नानुसार विकसित होता है:हैमिल्टनियन का निर्माण करें और अंतर करें:चूंकि खदान मालिक समय पर बचे हुए अयस्क को महत्व नहीं देता है ,उपरोक्त समीकरणों का उपयोग करके, नियंत्रित करने वाले अंतर समीकरणों को हल करना आसान है तथाऔर प्रारंभिक और टर्न-टी शर्तों का उपयोग करके, कार्यों को उपज के लिए हल किया जा सकता है
यह भी देखें
- सक्रिय निष्कर्ष
- बेलमैन समीकरण
- बेलमैन स्यूडोस्पेक्ट्रल विधि
- क्षिप्रतम वक्र
- DIDO (इष्टतम नियंत्रण)
- DNSS बिंदु
- गतिशील प्रोग्रामिंग
- गॉस स्यूडोस्पेक्ट्रल विधि
- सामान्यीकृत निस्पंदन
- GPOPS-द्वितीय
- CasADi
- JModelica.org (गतिशील अनुकूलन के लिए मॉडलिका-आधारित खुला स्रोत मंच)
- कलमन निस्यंदक
- रैखिक-द्विघात नियामक
- आदर्श भविष्यवाणी नियंत्रण
- अभिलंघन कसौटी
- PID नियंत्रक
- PROPT (MATLAB के लिए इष्टतम नियंत्रण प्रक्रिया सामग्री)
- स्यूडोस्पेक्ट्रल इष्टतम नियंत्रण
- अनुधावन- भागना का खेल
- स्खलन प्रणाली नियंत्रण
- SNOTP
- प्रसंभाव्य नियंत्रण
- प्रक्षेपवक्र अनुकूलन
संदर्भ
- ↑ 1.0 1.1 1.2 1.3 Ross, Isaac (2015). इष्टतम नियंत्रण में पोंट्रीगिन के सिद्धांत पर एक प्राइमर. San Francisco: Collegiate Publishers. ISBN 978-0-9843571-0-9. OCLC 625106088.
- ↑ Luenberger, David G. (1979). "Optimal Control". डायनेमिक सिस्टम का परिचय. New York: John Wiley & Sons. pp. 393–435. ISBN 0-471-02594-1.
- ↑ Kamien, Morton I. (2013). डायनेमिक ऑप्टिमाइजेशन: द कैलकुलस ऑफ वैरिएशन एंड ऑप्टिमल कंट्रोल इन इकोनॉमिक्स एंड मैनेजमेंट. Dover Publications. ISBN 978-1-306-39299-0. OCLC 869522905.
- ↑ Ross, I. M.; Proulx, R. J.; Karpenko, M. (2020-05-06). "ट्रैवलिंग सेल्समैन प्रॉब्लम और इसके प्रकारों के लिए एक इष्टतम नियंत्रण सिद्धांत". arXiv:2005.03186 [math.OC].
- ↑ Ross, Isaac M.; Karpenko, Mark; Proulx, Ronald J. (2016-01-01). "कुछ ग्राफ़-सैद्धांतिक नियंत्रण समस्याओं को हल करने के लिए एक गैर-चिकनी कलन ** यह शोध यू.एस. नौसेना द्वारा प्रायोजित किया गया था।". IFAC-PapersOnLine. 10th IFAC Symposium on Nonlinear Control Systems NOLCOS 2016 (in English). 49 (18): 462–467. doi:10.1016/j.ifacol.2016.10.208. ISSN 2405-8963.
- ↑ Sargent, R. W. H. (2000). "इष्टतम नियंत्रण". Journal of Computational and Applied Mathematics. 124 (1–2): 361–371. Bibcode:2000JCoAM.124..361S. doi:10.1016/S0377-0427(00)00418-0.
- ↑ Bryson, A. E. (1996). "इष्टतम नियंत्रण - 1950 से 1985". IEEE Control Systems Magazine. 16 (3): 26–33. doi:10.1109/37.506395.
- ↑ Ross, I. M. (2009). इष्टतम नियंत्रण में पोंट्रीगिन के सिद्धांत पर एक प्राइमर. Collegiate Publishers. ISBN 978-0-9843571-0-9.
- ↑ Kalman, Rudolf. A new approach to linear filtering and prediction problems. Transactions of the ASME, Journal of Basic Engineering, 82:34–45, 1960
- ↑ Oberle, H. J. and Grimm, W., "BNDSCO-A Program for the Numerical Solution of Optimal Control Problems," Institute for Flight Systems Dynamics, DLR, Oberpfaffenhofen, 1989
- ↑ Ross, I. M.; Karpenko, M. (2012). "स्यूडोस्पेक्ट्रल इष्टतम नियंत्रण की समीक्षा: सिद्धांत से उड़ान तक". Annual Reviews in Control. 36 (2): 182–197. doi:10.1016/j.arcontrol.2012.09.002.
- ↑ Betts, J. T. (2010). गैर-रैखिक प्रोग्रामिंग का उपयोग करके इष्टतम नियंत्रण के लिए व्यावहारिक तरीके (2nd ed.). Philadelphia, Pennsylvania: SIAM Press. ISBN 978-0-89871-688-7.
- ↑ Gill, P. E., Murray, W. M., and Saunders, M. A., User's Manual for SNOPT Version 7: Software for Large-Scale Nonlinear Programming, University of California, San Diego Report, 24 April 2007
- ↑ von Stryk, O., User's Guide for DIRCOL (version 2.1): A Direct Collocation Method for the Numerical Solution of Optimal Control Problems, Fachgebiet Simulation und Systemoptimierung (SIM), Technische Universität Darmstadt (2000, Version of November 1999).
- ↑ Betts, J.T. and Huffman, W. P., Sparse Optimal Control Software, SOCS, Boeing Information and Support Services, Seattle, Washington, July 1997
- ↑ Hargraves, C. R.; Paris, S. W. (1987). "नॉनलाइनियर प्रोग्रामिंग और कोलोकेशन का उपयोग करके डायरेक्ट ट्रैजेक्टरी ऑप्टिमाइजेशन". Journal of Guidance, Control, and Dynamics. 10 (4): 338–342. Bibcode:1987JGCD...10..338H. doi:10.2514/3.20223.
- ↑ Gath, P.F., Well, K.H., "Trajectory Optimization Using a Combination of Direct Multiple Shooting and Collocation", AIAA 2001–4047, AIAA Guidance, Navigation, and Control Conference, Montréal, Québec, Canada, 6–9 August 2001
- ↑ Vasile M., Bernelli-Zazzera F., Fornasari N., Masarati P., "Design of Interplanetary and Lunar Missions Combining Low-Thrust and Gravity Assists", Final Report of the ESA/ESOC Study Contract No. 14126/00/D/CS, September 2002
- ↑ Izzo, Dario. "PyGMO and PyKEP: open source tools for massively parallel optimization in astrodynamics (the case of interplanetary trajectory optimization)." Proceed. Fifth International Conf. Astrodynam. Tools and Techniques, ICATT. 2012.
- ↑ RIOTS Archived 16 July 2011 at the Wayback Machine, based on Schwartz, Adam (1996). Theory and Implementation of Methods based on Runge–Kutta Integration for Solving Optimal Control Problems (Ph.D.). University of California at Berkeley. OCLC 35140322.
- ↑ Ross, I. M., Enhancements to the DIDO Optimal Control Toolbox, arXiv 2020. https://arxiv.org/abs/2004.13112
- ↑ Williams, P., User's Guide to DIRECT, Version 2.00, Melbourne, Australia, 2008
- ↑ FALCON.m, described in Rieck, M., Bittner, M., Grüter, B., Diepolder, J., and Piprek, P., FALCON.m - User Guide, Institute of Flight System Dynamics, Technical University of Munich, October 2019
- ↑ GPOPS Archived 24 July 2011 at the Wayback Machine, described in Rao, A. V., Benson, D. A., Huntington, G. T., Francolin, C., Darby, C. L., and Patterson, M. A., User's Manual for GPOPS: A MATLAB Package for Dynamic Optimization Using the Gauss Pseudospectral Method, University of Florida Report, August 2008.
- ↑ Rutquist, P. and Edvall, M. M, PROPT – MATLAB Optimal Control Software," 1260 S.E. Bishop Blvd Ste E, Pullman, WA 99163, USA: Tomlab Optimization, Inc.
- ↑ I.M. Ross, Computational Optimal Control, 3rd Workshop in Computational Issues in Nonlinear Control, October 8th, 2019, Monterey, CA
- ↑ E. Polak, On the use of consistent approximations in the solution of semi-infinite optimization and optimal control problems Math. Prog. 62 pp. 385–415 (1993).
- ↑ Ross, I M. (2005-12-01). "इष्टतम नियंत्रण के लिए एक रोडमैप: यात्रा करने का सही तरीका". Annals of the New York Academy of Sciences. 1065 (1): 210–231. Bibcode:2005NYASA1065..210R. doi:10.1196/annals.1370.015. ISSN 0077-8923. PMID 16510411. S2CID 7625851.
- ↑ Fahroo, Fariba; Ross, I. Michael (September 2008). "कॉस्टेट्स के अभिसरण का मतलब नियंत्रण का अभिसरण नहीं है". Journal of Guidance, Control, and Dynamics. 31 (5): 1492–1497. Bibcode:2008JGCD...31.1492F. doi:10.2514/1.37331. ISSN 0731-5090. S2CID 756939.
अग्रिम पठन
- Bertsekas, D. P. (1995). Dynamic Programming and Optimal Control. Belmont: Athena. ISBN 1-886529-11-6.
- Bryson, A. E.; Ho, Y.-C. (1975). Applied Optimal Control: Optimization, Estimation and Control (Revised ed.). New York: John Wiley and Sons. ISBN 0-470-11481-9.
- Fleming, W. H.; Rishel, R. W. (1975). Deterministic and Stochastic Optimal Control. New York: Springer. ISBN 0-387-90155-8.
- Kamien, M. I.; Schwartz, N. L. (1991). Dynamic Optimization: The Calculus of Variations and Optimal Control in Economics and Management (Second ed.). New York: Elsevier. ISBN 0-444-01609-0.
- Kirk, D. E. (1970). Optimal Control Theory: An Introduction. Englewood Cliffs: Prentice-Hall. ISBN 0-13-638098-0.
बाहरी संबंध
- Computational Optimal Control
- Dr. Benoît CHACHUAT: Automatic Control Laboratory – Nonlinear Programming, Calculus of Variations and Optimal Control.
- DIDO - MATLAB tool for optimal control
- GEKKO - Python package for optimal control
- GESOP – Graphical Environment for Simulation and OPtimization
- GPOPS-II – General-Purpose MATLAB Optimal Control Software
- CasADi – Free and open source symbolic framework for optimal control
- PROPT – MATLAB Optimal Control Software
- OpenOCL – Open Optimal Control Library
- Elmer G. Wiens: Optimal Control – Applications of Optimal Control Theory Using the Pontryagin Maximum Principle with interactive models.
- Pontryagin's Principle Illustrated with Examples
- On Optimal Control by Yu-Chi Ho
- Pseudospectral optimal control: Part 1
- Pseudospectral optimal control: Part 2