इष्टतम नियंत्रण: Difference between revisions

From Vigyanwiki
(Created page with "{{Short description|Mathematical way of attaining a desired output from a dynamic system}} File:Optimal Control Luus.png|thumb|इष्टतम नियंत्रण...")
 
 
(12 intermediate revisions by 5 users not shown)
Line 1: Line 1:
{{Short description|Mathematical way of attaining a desired output from a dynamic system}}
{{Short description|Mathematical way of attaining a desired output from a dynamic system}}
[[File:Optimal Control Luus.png|thumb|इष्टतम नियंत्रण समस्या बेंचमार्क (लुस) एक अभिन्न उद्देश्य, असमानता और अंतर बाधा के साथ।]]इष्टतम नियंत्रण सिद्धांत [[गणितीय अनुकूलन]] की एक शाखा है जो एक [[गतिशील प्रणाली]] के लिए समय की अवधि में एक [[नियंत्रण (इष्टतम नियंत्रण सिद्धांत)]] खोजने से संबंधित है, जैसे कि एक उद्देश्य फ़ंक्शन अनुकूलित किया गया है।<ref name=":0">{{Cite book|last=Ross|first=Isaac |title=इष्टतम नियंत्रण में पोंट्रीगिन के सिद्धांत पर एक प्राइमर|publisher=Collegiate Publishers|year=2015|isbn=978-0-9843571-0-9|location=San Francisco|oclc=625106088}}</ref> इसके विज्ञान, इंजीनियरिंग और संचालन अनुसंधान में कई अनुप्रयोग हैं। उदाहरण के लिए, गतिशील प्रणाली रॉकेट थ्रस्टर्स के अनुरूप नियंत्रण वाला एक [[अंतरिक्ष यान]] हो सकता है, और इसका उद्देश्य न्यूनतम ईंधन व्यय के साथ चंद्रमा तक पहुंचना हो सकता है।<ref>{{cite book |first=David G. |last=Luenberger |author-link=David Luenberger |title=डायनेमिक सिस्टम का परिचय|url=https://archive.org/details/introductiontody00luen_582 |url-access=limited |location=New York |publisher=John Wiley & Sons |year=1979 |isbn=0-471-02594-1 |chapter=Optimal Control |pages=[https://archive.org/details/introductiontody00luen_582/page/n406 393]–435 }}</ref> या गतिशील प्रणाली [[बेरोजगारी]] को कम करने के उद्देश्य से एक राष्ट्र की [[अर्थव्यवस्था]] हो सकती है; इस मामले में नियंत्रण [[राजकोषीय नीति]] और [[मौद्रिक नीति]] हो सकते हैं।<ref>{{Cite book|author=Kamien, Morton I.| url=http://worldcat.org/oclc/869522905 |title=डायनेमिक ऑप्टिमाइजेशन: द कैलकुलस ऑफ वैरिएशन एंड ऑप्टिमल कंट्रोल इन इकोनॉमिक्स एंड मैनेजमेंट|date=2013 |publisher=Dover Publications |isbn=978-1-306-39299-0|oclc=869522905}}</ref> इष्टतम नियंत्रण सिद्धांत के ढांचे के भीतर [[संचालन अनुसंधान]] को एम्बेड करने के लिए एक गतिशील प्रणाली भी शुरू की जा सकती है।<ref>{{cite arXiv |last1=Ross|first1=I. M. |last2=Proulx|first2=R. J. |last3=Karpenko|first3=M. |date=2020-05-06 | title=ट्रैवलिंग सेल्समैन प्रॉब्लम और इसके प्रकारों के लिए एक इष्टतम नियंत्रण सिद्धांत|class=math.OC|eprint=2005.03186}}</ref><ref>{{Cite journal|last1=Ross|first1=Isaac M.|last2=Karpenko|first2=Mark|last3=Proulx|first3=Ronald J.|date=2016-01-01|title=कुछ ग्राफ़-सैद्धांतिक नियंत्रण समस्याओं को हल करने के लिए एक गैर-चिकनी कलन ** यह शोध यू.एस. नौसेना द्वारा प्रायोजित किया गया था।| journal=IFAC-PapersOnLine |series=10th IFAC Symposium on Nonlinear Control Systems NOLCOS 2016|language=en|volume=49| issue=18|pages=462–467| doi=10.1016/j.ifacol.2016.10.208| issn=2405-8963| doi-access=free}}</ref>
[[File:Optimal Control Luus.png|thumb|इष्टतम नियंत्रण समस्या बेंचमार्क (लुस) एक अभिन्न उद्देश्य, असमानता और अंतर बाधा के साथ।]]'''इष्टतम नियंत्रण''' सिद्धांत [[गणितीय अनुकूलन]] की एक शाखा है जो एक [[गतिशील प्रणाली]] के लिए समय की अवधि में एक [[नियंत्रण (इष्टतम नियंत्रण सिद्धांत)]] खोजने से संबंधित है, जैसे कि एक उद्देश्य प्रकार्य अनुकूलित किया गया है।<ref name=":0">{{Cite book|last=Ross|first=Isaac |title=इष्टतम नियंत्रण में पोंट्रीगिन के सिद्धांत पर एक प्राइमर|publisher=Collegiate Publishers|year=2015|isbn=978-0-9843571-0-9|location=San Francisco|oclc=625106088}}</ref> इसके विज्ञान, अभियांत्रिकी और संचालन अनुसंधान में कई अनुप्रयोग हैं। उदाहरण के लिए, गतिशील प्रणाली प्रक्षेपात्र प्रक्षेपक के अनुरूप नियंत्रण वाला एक [[अंतरिक्ष यान]] हो सकता है, और इसका उद्देश्य न्यूनतम ईंधन व्यय के साथ चंद्रमा तक पहुंचना हो सकता है।<ref>{{cite book |first=David G. |last=Luenberger |author-link=David Luenberger |title=डायनेमिक सिस्टम का परिचय|url=https://archive.org/details/introductiontody00luen_582 |url-access=limited |location=New York |publisher=John Wiley & Sons |year=1979 |isbn=0-471-02594-1 |chapter=Optimal Control |pages=[https://archive.org/details/introductiontody00luen_582/page/n406 393]–435 }}</ref> या गतिशील प्रणाली [[बेरोजगारी]] को कम करने के उद्देश्य से एक राष्ट्र की [[अर्थव्यवस्था]] हो सकती है; इसप्रकर्ण में नियंत्रण [[राजकोषीय नीति]] और [[मौद्रिक नीति]] हो सकते हैं।<ref>{{Cite book|author=Kamien, Morton I.| url=http://worldcat.org/oclc/869522905 |title=डायनेमिक ऑप्टिमाइजेशन: द कैलकुलस ऑफ वैरिएशन एंड ऑप्टिमल कंट्रोल इन इकोनॉमिक्स एंड मैनेजमेंट|date=2013 |publisher=Dover Publications |isbn=978-1-306-39299-0|oclc=869522905}}</ref> इष्टतम नियंत्रण सिद्धांत के ढांचे के भीतर [[संचालन अनुसंधान]] को लागू करने के लिए एक गतिशील प्रणाली भी शुरू की जा सकती है।<ref>{{cite arXiv |last1=Ross|first1=I. M. |last2=Proulx|first2=R. J. |last3=Karpenko|first3=M. |date=2020-05-06 | title=ट्रैवलिंग सेल्समैन प्रॉब्लम और इसके प्रकारों के लिए एक इष्टतम नियंत्रण सिद्धांत|class=math.OC|eprint=2005.03186}}</ref><ref>{{Cite journal|last1=Ross|first1=Isaac M.|last2=Karpenko|first2=Mark|last3=Proulx|first3=Ronald J.|date=2016-01-01|title=कुछ ग्राफ़-सैद्धांतिक नियंत्रण समस्याओं को हल करने के लिए एक गैर-चिकनी कलन ** यह शोध यू.एस. नौसेना द्वारा प्रायोजित किया गया था।| journal=IFAC-PapersOnLine |series=10th IFAC Symposium on Nonlinear Control Systems NOLCOS 2016|language=en|volume=49| issue=18|pages=462–467| doi=10.1016/j.ifacol.2016.10.208| issn=2405-8963| doi-access=free}}</ref>
इष्टतम नियंत्रण विविधताओं की कलन का एक विस्तार है, और [[नियंत्रण सिद्धांत]] प्राप्त करने के लिए एक गणितीय अनुकूलन विधि है।<ref>{{cite journal |first=R. W. H. |last=Sargent |author-link=Roger W. H. Sargent |title=इष्टतम नियंत्रण|journal=Journal of Computational and Applied Mathematics |volume=124 |issue=1–2 |year=2000 |pages=361–371 |doi=10.1016/S0377-0427(00)00418-0 |bibcode=2000JCoAM.124..361S |doi-access=free }}</ref> 1950 के दशक में एडवर्ड जे. मैक्शेन द्वारा विविधताओं की कलन में योगदान के बाद, विधि काफी हद तक [[लेव पोंट्रीगिन]] और [[रिचर्ड बेलमैन]] के काम के कारण है।<ref>{{cite journal |first=A. E. |last=Bryson |author-link=Arthur E. Bryson |year=1996 |title=इष्टतम नियंत्रण - 1950 से 1985|journal= IEEE Control Systems Magazine |volume=16 |issue=3 |pages=26–33 |doi=10.1109/37.506395 }}</ref> इष्टतम नियंत्रण को नियंत्रण सिद्धांत में [[नियंत्रण रणनीति]] के रूप में देखा जा सकता है।<ref name=":0" />
इष्टतम नियंत्रण विविधताओं की कलन का एक विस्तार है, और [[नियंत्रण सिद्धांत]] प्राप्त करने के लिए एक गणितीय अनुकूलन विधि है।<ref>{{cite journal |first=R. W. H. |last=Sargent |author-link=Roger W. H. Sargent |title=इष्टतम नियंत्रण|journal=Journal of Computational and Applied Mathematics |volume=124 |issue=1–2 |year=2000 |pages=361–371 |doi=10.1016/S0377-0427(00)00418-0 |bibcode=2000JCoAM.124..361S |doi-access=free }}</ref> 1950 के दशक में एडवर्ड जे. मैक्शेन द्वारा विविधताओं की कलन में योगदान के बाद, विधि काफी हद तक [[लेव पोंट्रीगिन]] और [[रिचर्ड बेलमैन]] के काम के कारण है।<ref>{{cite journal |first=A. E. |last=Bryson |author-link=Arthur E. Bryson |year=1996 |title=इष्टतम नियंत्रण - 1950 से 1985|journal= IEEE Control Systems Magazine |volume=16 |issue=3 |pages=26–33 |doi=10.1109/37.506395 }}</ref> इष्टतम नियंत्रण को नियंत्रण सिद्धांत में [[नियंत्रण रणनीति]] के रूप में देखा जा सकता है।<ref name=":0" />




== सामान्य विधि ==
== सामान्य विधि ==
इष्टतम नियंत्रण किसी दिए गए सिस्टम के लिए नियंत्रण कानून खोजने की समस्या से संबंधित है जैसे कि एक निश्चित [[इष्टतमता मानदंड]] प्राप्त किया जाता है। एक नियंत्रण समस्या में एक [[लागत कार्यात्मक]] शामिल है जो राज्य और नियंत्रण चर का एक कार्य (गणित) है। एक इष्टतम नियंत्रण [[अंतर समीकरण]]ों का एक सेट है जो नियंत्रण चर के पथ का वर्णन करता है जो लागत फ़ंक्शन को कम करता है। पोंट्रीगिन के अधिकतम सिद्धांत (एक [[आवश्यक शर्त]] जिसे पोंट्रीगिन के न्यूनतम सिद्धांत या केवल पोंट्रीगिन के सिद्धांत के रूप में भी जाना जाता है) का उपयोग करके इष्टतम नियंत्रण प्राप्त किया जा सकता है।<ref>{{cite book |first=I. M. |last=Ross |author-link=I. Michael Ross |year=2009 |title=इष्टतम नियंत्रण में पोंट्रीगिन के सिद्धांत पर एक प्राइमर|publisher=Collegiate Publishers |isbn=978-0-9843571-0-9 }}</ref> या हैमिल्टन-जैकोबी-बेलमैन समीकरण (एक [[पर्याप्त स्थिति]]) को हल करके।
इष्टतम नियंत्रण किसी दी गई प्रणाली के लिए नियंत्रण कानून खोजने की समस्या से संबंधित है जैसे कि एक निश्चित [[इष्टतमता मानदंड]] प्राप्त किया जाता है। एक नियंत्रण समस्या में एक [[लागत कार्यात्मक]] सम्मिलित है जो राज्य और नियंत्रण चर का कार्य (गणित) है। एक इष्टतम नियंत्रण [[अंतर समीकरण|अंतर समीकरणों]] का एक समुच्चय है जो नियंत्रण चर के पथ का वर्णन करता है जो लागत प्रकार्य को कम करता है। पोन्ट्रियाजिन उच्चिष्ठ सिद्धांत (एक [[आवश्यक शर्त]] जिसे पोन्ट्रियाजिन न्यूनतम सिद्धांत या केवल पोंट्रीगिन के सिद्धांत के रूप में भी जाना जाता है) का उपयोग करके<ref>{{cite book |first=I. M. |last=Ross |author-link=I. Michael Ross |year=2009 |title=इष्टतम नियंत्रण में पोंट्रीगिन के सिद्धांत पर एक प्राइमर|publisher=Collegiate Publishers |isbn=978-0-9843571-0-9 }}</ref> या हैमिल्टन-जैकोबी-बेलमैन समीकरण (एक [[पर्याप्त स्थिति]]) को हल करके इष्टतम नियंत्रण प्राप्त किया जा सकता है।


हम एक साधारण उदाहरण से शुरू करते हैं। एक पहाड़ी सड़क पर एक सीधी रेखा में चलने वाली कार पर विचार करें। सवाल यह है कि कुल यात्रा समय को कम करने के लिए ड्राइवर को एक्सीलरेटर पैडल कैसे दबाना चाहिए? इस उदाहरण में, शब्द नियंत्रण कानून विशेष रूप से उस तरीके को संदर्भित करता है जिसमें चालक त्वरक को दबाता है और गियर को बदलता है। प्रणाली में कार और सड़क दोनों शामिल हैं, और इष्टतमता मानदंड कुल यात्रा समय का न्यूनतमकरण है। नियंत्रण समस्याओं में आमतौर पर सहायक प्रतिबंध (गणित) शामिल होते हैं। उदाहरण के लिए, उपलब्ध ईंधन की मात्रा सीमित हो सकती है, त्वरक पेडल को कार के फर्श, गति सीमा आदि के माध्यम से नहीं धकेला जा सकता है।
हम एक साधारण उदाहरण से शुरू करते हैं। एक पहाड़ी सड़क पर एक सीधी रेखा में चलने वाली मोटर गाड़ी पर विचार करें। सवाल यह है कि कुल यात्रा समय को कम करने के लिए ड्राइवर को त्वरक पदिक कैसे दबाना चाहिए? इस उदाहरण में, शब्द नियंत्रण कानून विशेष रूप से उस तरीके को संदर्भित करता है जिसमें चालक त्वरक को दबाता है और यंत्रावली को बदलता है। प्रणाली में मोटर गाड़ी और सड़क दोनों अन्तर्वलित हैं, और इष्टतमता मानदंड कुल यात्रा समय का न्यूनतमकरण है। नियंत्रण समस्याओं में सामान्यतः सहायक प्रतिबंध (गणित) अन्तर्वलित होते हैं। उदाहरण के लिए, उपलब्ध ईंधन की मात्रा सीमित हो सकती है, त्वरक पेडल को कार के फर्श, गति सीमा आदि के माध्यम से नहीं धकेला जा सकता है।


एक उचित लागत फ़ंक्शन एक गणितीय अभिव्यक्ति होगी जो गति, ज्यामितीय विचारों और सिस्टम की प्रारंभिक स्थितियों के कार्य के रूप में यात्रा का समय देगी। बाधाएँ (गणित) अक्सर लागत फलन के साथ विनिमेय होती हैं।
एक उचित लागत प्रकार्य एक गणितीय अभिव्यक्ति होगी जो गति, ज्यामितीय विचारों और प्रणाली की प्रारंभिक स्थितियों के कार्य के रूप में यात्रा का समय देगी। बाधाएँ (गणित) प्राय: लागत फलन के साथ विनिमेय होती हैं।


एक और संबंधित इष्टतम नियंत्रण समस्या कार को चलाने का तरीका खोजने के लिए हो सकती है ताकि इसकी ईंधन खपत को कम किया जा सके, यह देखते हुए कि इसे एक निश्चित समय में पूरा करना होगा जो कुछ राशि से अधिक नहीं है। फिर भी एक और संबंधित नियंत्रण समस्या यात्रा को पूरा करने की कुल मौद्रिक लागत को कम करने के लिए हो सकती है, समय और ईंधन के लिए अनुमानित मौद्रिक कीमतों को देखते हुए।
एक और संबंधित इष्टतम नियंत्रण समस्या कार को चलाने का तरीका खोजने के लिए हो सकती है ताकि इसकी ईंधन खपत को कम किया जा सके, यह देखते हुए कि इसे एक निश्चित समय में पूरा करना होगा बिना कुछ राशि से अधिक बढाए। फिर भी एक और संबंधित नियंत्रण समस्या यात्रा को पूरा करने की कुल मौद्रिक लागत को कम करने के लिए हो सकती है, समय और ईंधन के लिए अनुमानित मौद्रिक कीमतों को देखते हुए।


एक अधिक सार रूपरेखा इस प्रकार है।<ref name=":0" />  निरंतर-समय की लागत कार्यात्मक को कम करें
एक अधिक सार रूपरेखा इस प्रकार है।<ref name=":0" />  निरंतर-समय की लागत कार्यात्मक को कम करें
Line 21: Line 21:
और सीमा शर्तें
और सीमा शर्तें
<math display="block">\textbf{e}[\textbf{x}(t_0),t_0,\textbf{x}(t_f),t_f] = 0</math>
<math display="block">\textbf{e}[\textbf{x}(t_0),t_0,\textbf{x}(t_f),t_f] = 0</math>
कहाँ पे <math>\textbf{x}(t)</math> राज्य है, <math>\textbf{u}(t)</math> नियंत्रण है, <math>t</math> स्वतंत्र चर है (आम तौर पर बोलना, समय), <math>t_0</math> प्रारंभिक समय है, और <math>t_f</math> टर्मिनल समय है। शर्तें <math>E</math> तथा <math>F</math> क्रमशः एंडपॉइंट कॉस्ट और रनिंग कॉस्ट कहलाते हैं। भिन्नों की गणना में, <math>E</math> तथा <math>F</math> क्रमशः मेयर शब्द और [[लैग्रेंज गुणक]] के रूप में जाना जाता है। इसके अलावा, यह नोट किया गया है कि पथ बाधाएँ सामान्य असमानता बाधाओं में हैं और इस प्रकार इष्टतम समाधान पर सक्रिय (यानी, शून्य के बराबर) नहीं हो सकती हैं। यह भी नोट किया गया है कि जैसा कि ऊपर कहा गया है, इष्टतम नियंत्रण समस्या के कई समाधान हो सकते हैं (अर्थात, समाधान अद्वितीय नहीं हो सकता है)। इस प्रकार, यह सबसे अधिक बार होता है कि कोई भी समाधान <math>[\textbf{x}^*(t),\textbf{u}^*(t),t_0^*, t_f^*]</math> इष्टतम नियंत्रण समस्या स्थानीय रूप से कम हो रही है।
जहाँ पर <math>\textbf{x}(t)</math> अवस्था है, <math>\textbf{u}(t)</math> नियंत्रण है, <math>t</math> स्वतंत्र चर है (सामान्यतः बोलना, समय), <math>t_0</math> प्रारंभिक समय है, और <math>t_f</math> टर्मिनल समय है। शर्तें <math>E</math> तथा <math>F</math> क्रमशः एंडपॉइंट कॉस्ट और रनिंग कॉस्ट कहलाते हैं। भिन्नों की गणना में, <math>E</math> तथा <math>F</math> क्रमशः मेयर शब्द और [[लैग्रेंज गुणक]] के रूप में जाना जाता है। इसके अतिरिक्त, यह नोट किया गया है कि पथ बाधाएँ सामान्य असमानता बाधाओं में हैं और इस प्रकार इष्टतम समाधान पर सक्रिय ( अर्थात् , शून्य के बराबर) नहीं हो सकती हैं। यह भी नोट किया गया है कि जैसा कि ऊपर कहा गया है, इष्टतम नियंत्रण समस्या के कई समाधान हो सकते हैं (अर्थात, समाधान अद्वितीय नहीं हो सकता है)। इस प्रकार, यह सबसे अधिक बार होता है कि कोई भी समाधान <math>[\textbf{x}^*(t),\textbf{u}^*(t),t_0^*, t_f^*]</math> इष्टतम नियंत्रण समस्या स्थानीय रूप से कम हो रही है।


== रैखिक द्विघात नियंत्रण ==
== रैखिक द्विघात नियंत्रण ==
Line 30: Line 30:
और प्रारंभिक स्थिति
और प्रारंभिक स्थिति
<math display="block"> \mathbf{x}(t_0) = \mathbf{x}_0</math>
<math display="block"> \mathbf{x}(t_0) = \mathbf{x}_0</math>
कई नियंत्रण प्रणाली की समस्याओं में उत्पन्न होने वाली LQ समस्या का एक विशेष रूप रैखिक द्विघात नियामक (LQR) है, जहाँ सभी मैट्रिक्स (यानी, <math>\mathbf{A}</math>, <math>\mathbf{B}</math>, <math>\mathbf{Q}</math>, तथा <math>\mathbf{R}</math>) स्थिर हैं, प्रारंभिक समय मनमाने ढंग से शून्य पर सेट है, और टर्मिनल समय सीमा में लिया जाता है <math>t_f\rightarrow\infty</math> (यह अंतिम धारणा अनंत क्षितिज के रूप में जानी जाती है)। LQR समस्या इस प्रकार बताई गई है। अनंत क्षितिज द्विघात निरंतर-समय लागत कार्यात्मक को कम करें
कई नियंत्रण प्रणाली की समस्याओं में उत्पन्न होने वाली LQ समस्या का एक विशेष रूप रैखिक द्विघात नियामक (LQR) है, जहाँ सभी आव्यूह ( अर्थात् , <math>\mathbf{A}</math>, <math>\mathbf{B}</math>, <math>\mathbf{Q}</math>, तथा <math>\mathbf{R}</math>) स्थिर हैं, प्रारंभिक समय मनमाने ढंग से शून्य पर समुच्चय है, और अवसानक समय सीमा में लिया जाता है <math>t_f\rightarrow\infty</math> (यह अंतिम धारणा अनंत क्षितिज के रूप में जानी जाती है)। LQR समस्या इस प्रकार बताई गई है। अनंत क्षितिज द्विघात निरंतर-समय लागत कार्यात्मक को कम करें
<math display="block">J= \tfrac{1}{2} \int_{0}^{\infty}[\mathbf{x}^{\mathsf{T}}(t)\mathbf{Q}\mathbf{x}(t) + \mathbf{u}^{\mathsf{T}}(t)\mathbf{R}\mathbf{u}(t)]\, \mathrm dt</math>
<math display="block">J= \tfrac{1}{2} \int_{0}^{\infty}[\mathbf{x}^{\mathsf{T}}(t)\mathbf{Q}\mathbf{x}(t) + \mathbf{u}^{\mathsf{T}}(t)\mathbf{R}\mathbf{u}(t)]\, \mathrm dt</math>
रैखिक समय-अपरिवर्तनीय प्रथम-क्रम गतिशील बाधाओं के अधीन
रैखिक समय-अपरिवर्तनीय प्रथम-क्रम गतिशील बाधाओं के अधीन
Line 36: Line 36:
और प्रारंभिक स्थिति
और प्रारंभिक स्थिति
<math display="block"> \mathbf{x}(t_0) = \mathbf{x}_0</math>
<math display="block"> \mathbf{x}(t_0) = \mathbf{x}_0</math>
परिमित-क्षितिज मामले में मेट्रिसेस उसमें प्रतिबंधित हैं <math>\mathbf{Q}</math> तथा <math>\mathbf{R}</math> क्रमशः सकारात्मक अर्ध-निश्चित और सकारात्मक निश्चित हैं। हालांकि, अनंत-क्षितिज मामले में, [[मैट्रिक्स (गणित)]] <math>\mathbf{Q}</math> तथा <math>\mathbf{R}</math> न केवल सकारात्मक-अर्द्ध-निश्चित और सकारात्मक-निश्चित हैं, बल्कि स्थिर भी हैं। इन अतिरिक्त प्रतिबंधों पर
परिमित-क्षितिज प्रकर्ण में आव्यूह उसमें प्रतिबंधित हैं <math>\mathbf{Q}</math> तथा <math>\mathbf{R}</math> क्रमशः सकारात्मक अर्ध-निश्चित और सकारात्मक निश्चित हैं। तथापि, अनंत-क्षितिज प्रकर्ण में, [[मैट्रिक्स (गणित)|आव्यूह (गणित)]] <math>\mathbf{Q}</math> तथा <math>\mathbf{R}</math> न केवल सकारात्मक-अर्द्ध-निश्चित और सकारात्मक-निश्चित हैं, वस्तुतः स्थिर भी हैं। इन अतिरिक्त प्रतिबंधों पर
<math>\mathbf{Q}</math> तथा <math>\mathbf{R}</math> अनंत-क्षितिज मामले में यह सुनिश्चित करने के लिए लागू किया जाता है कि लागत कार्यात्मक सकारात्मक बनी रहे। इसके अलावा, यह सुनिश्चित करने के लिए कि लागत फ़ंक्शन सीमित है, जोड़ी पर अतिरिक्त प्रतिबंध लगाया जाता है <math>(\mathbf{A},\mathbf{B})</math> नियंत्रणीयता है। ध्यान दें कि एलक्यू या एलक्यूआर लागत कार्यात्मक को भौतिक रूप से नियंत्रण ऊर्जा को कम करने के प्रयास के रूप में सोचा जा सकता है (द्विघात रूप में मापा जाता है)।
<math>\mathbf{Q}</math> तथा <math>\mathbf{R}</math> अनंत-क्षितिजप्रकर्ण में यह सुनिश्चित करने के लिए लागू किया जाता है कि लागत कार्यात्मक सकारात्मक बनी रहे। इसके अतिरिक्त, यह सुनिश्चित करने के लिए कि लागत प्रकार्य सीमित है, जोड़ी <math>(\mathbf{A},\mathbf{B})</math> पर अतिरिक्त प्रतिबंध लगाया जाता है जो कि नियंत्रणीय है। ध्यान दें कि LQ या LQR लागत कार्यात्मक को भौतिक रूप से नियंत्रण ऊर्जा को कम करने के प्रयास के रूप में सोचा जा सकता है (द्विघात रूप में मापा जाता है)।


अनंत क्षितिज समस्या (यानी, LQR) अत्यधिक प्रतिबंधात्मक और अनिवार्य रूप से बेकार लग सकती है क्योंकि यह मानती है कि ऑपरेटर सिस्टम को शून्य-स्थिति में चला रहा है और इसलिए सिस्टम के आउटपुट को शून्य पर चला रहा है। यह वाकई सही है। हालाँकि आउटपुट को एक वांछित नॉनज़रो स्तर पर ले जाने की समस्या को शून्य आउटपुट एक के बाद हल किया जा सकता है। वास्तव में, यह साबित किया जा सकता है कि इस द्वितीयक LQR समस्या को बहुत ही सरल तरीके से हल किया जा सकता है। शास्त्रीय इष्टतम नियंत्रण सिद्धांत में यह दिखाया गया है कि एलक्यू (या एलक्यूआर) इष्टतम नियंत्रण में फीडबैक फॉर्म है
अनंत क्षितिज समस्या ( अर्थात्, LQR) अत्यधिक प्रतिबंधात्मक और अनिवार्य रूप से व्यर्थ लग सकती है क्योंकि यह मानती है कि संचालक प्रणाली को शून्य-स्थिति में चला रहा है और इसलिए प्रणाली के प्रक्षेपण को शून्य पर चला रहा है। यह वास्तव में  सही है। हालाँकि प्रक्षेपण को एक वांछित अशून्य स्तर पर ले जाने की समस्या को शून्य प्रक्षेपण एक के बाद हल किया जा सकता है। वस्तुत:, यह साबित किया जा सकता है कि इस द्वितीयक LQR समस्या को बहुत ही सरल तरीके से हल किया जा सकता है। शास्त्रीय इष्टतम नियंत्रण सिद्धांत में यह दिखाया गया है कि LQ (या LQR) इष्टतम नियंत्रण में प्रतिपुष्टि स्वरुप है।
<math display="block">\mathbf{u}(t) = -\mathbf{K}(t)\mathbf{x}(t)</math>
<math display="block">\mathbf{u}(t) = -\mathbf{K}(t)\mathbf{x}(t)</math>
कहाँ पे <math>\mathbf{K}(t)</math> एक उचित रूप से आयामित मैट्रिक्स है, जैसा दिया गया है
जहाँ पे <math>\mathbf{K}(t)</math> एक उचित रूप से आयामित आव्यूह है, जैसा दिया गया है
<math display="block">\mathbf{K}(t) = \mathbf{R}^{-1}\mathbf{B}^{\mathsf{T}}\mathbf{S}(t),</math>
<math display="block">\mathbf{K}(t) = \mathbf{R}^{-1}\mathbf{B}^{\mathsf{T}}\mathbf{S}(t),</math>
तथा <math>\mathbf{S}(t)</math> अवकल [[रिकाटी समीकरण]] का हल है। अंतर रिकाटी समीकरण के रूप में दिया गया है
तथा <math>\mathbf{S}(t)</math> अवकल [[रिकाटी समीकरण]] का हल है। अंतर रिकाटी समीकरण के रूप में दिया गया है
<math display="block">\dot{\mathbf{S}}(t) = -\mathbf{S}(t)\mathbf{A}-\mathbf{A}^{\mathsf{T}} \mathbf{S}(t) +\mathbf{S}(t)\mathbf{B}\mathbf{R}^{-1}\mathbf{B}^{\mathsf{T}}\mathbf{S}(t) - \mathbf{Q}</math>
<math display="block">\dot{\mathbf{S}}(t) = -\mathbf{S}(t)\mathbf{A}-\mathbf{A}^{\mathsf{T}} \mathbf{S}(t) +\mathbf{S}(t)\mathbf{B}\mathbf{R}^{-1}\mathbf{B}^{\mathsf{T}}\mathbf{S}(t) - \mathbf{Q}</math>
परिमित क्षितिज एलक्यू समस्या के लिए, रिकाटी समीकरण को टर्मिनल सीमा की स्थिति का उपयोग करते हुए समय में पीछे की ओर एकीकृत किया जाता है
परिमित क्षितिज LQ समस्या के लिए, रिकाटी समीकरण को अंतस्थ सीमा की स्थिति का उपयोग करते हुए समय में पीछे की ओर एकीकृत किया जाता है
<math display="block">\mathbf{S}(t_f) = \mathbf{S}_f</math>
<math display="block">\mathbf{S}(t_f) = \mathbf{S}_f</math>
अनंत क्षितिज एलक्यूआर समस्या के लिए, अंतर रिकाटी समीकरण को बीजगणितीय रिकाटी समीकरण (एआरई) के साथ बदल दिया गया है
अनंत क्षितिज LQR समस्या के लिए, अंतर रिकाटी समीकरण को बीजगणितीय रिकाटी समीकरण (ARE) के साथ बदल दिया गया है
<math display="block">\mathbf{0} = -\mathbf{S}\mathbf{A}-\mathbf{A}^{\mathsf{T}}\mathbf{S}+\mathbf{S}\mathbf{B}\mathbf{R}^{-1}\mathbf{B}^{\mathsf{T}}\mathbf{S}-\mathbf{Q}</math>
<math display="block">\mathbf{0} = -\mathbf{S}\mathbf{A}-\mathbf{A}^{\mathsf{T}}\mathbf{S}+\mathbf{S}\mathbf{B}\mathbf{R}^{-1}\mathbf{B}^{\mathsf{T}}\mathbf{S}-\mathbf{Q}</math>
यह समझना कि एआरई अनंत क्षितिज समस्या, मैट्रिसेस से उत्पन्न होता है <math>\mathbf{A}</math>, <math>\mathbf{B}</math>, <math>\mathbf{Q}</math>, तथा <math>\mathbf{R}</math> सभी स्थिर हैं। यह ध्यान दिया जाता है कि बीजगणितीय रिकाटी समीकरण के सामान्य रूप से कई समाधान हैं और सकारात्मक निश्चित (या सकारात्मक अर्ध-निश्चित) समाधान वह है जिसका उपयोग प्रतिक्रिया लाभ की गणना करने के लिए किया जाता है। एलक्यू (एलक्यूआर) समस्या को रूडोल्फ ई. काल्मन द्वारा सुरुचिपूर्ण ढंग से हल किया गया था।<ref>Kalman, Rudolf. ''A new approach to linear filtering and prediction problems''. Transactions of the ASME, Journal of Basic Engineering, 82:34–45, 1960</ref>
यह समझना कि ARE अनंत क्षितिज समस्या, मैट्रिसेस से उत्पन्न होता है <math>\mathbf{A}</math>, <math>\mathbf{B}</math>, <math>\mathbf{Q}</math>, तथा <math>\mathbf{R}</math> सभी स्थिर हैं। यह ध्यान दिया जाता है कि बीजगणितीय रिकाटी समीकरण के सामान्य रूप से कई समाधान हैं और सकारात्मक निश्चित (या सकारात्मक अर्ध-निश्चित) समाधान वह है जिसका उपयोग प्रतिक्रिया लाभ की गणना करने के लिए किया जाता है। LQ(LQR) समस्या को रूडोल्फ ई. काल्मन द्वारा सुरुचिपूर्ण ढंग से हल किया गया था।<ref>Kalman, Rudolf. ''A new approach to linear filtering and prediction problems''. Transactions of the ASME, Journal of Basic Engineering, 82:34–45, 1960</ref>
 


== इष्टतम नियंत्रण के लिए संख्यात्मक तरीके ==
== इष्टतम नियंत्रण के लिए संख्यात्मक तरीके ==
इष्टतम नियंत्रण समस्याएं आम तौर पर अरैखिक होती हैं और इसलिए, आम तौर पर विश्लेषणात्मक समाधान नहीं होते हैं (उदाहरण के लिए, रैखिक-द्विघात इष्टतम नियंत्रण समस्या की तरह)। नतीजतन, इष्टतम नियंत्रण समस्याओं को हल करने के लिए संख्यात्मक तरीकों को नियोजित करना आवश्यक है। इष्टतम नियंत्रण के प्रारंभिक वर्षों में ({{abbr|c.|circa}} 1950 से 1980 के दशक) इष्टतम नियंत्रण समस्याओं को हल करने के लिए इष्ट दृष्टिकोण अप्रत्यक्ष तरीकों का था। एक अप्रत्यक्ष विधि में, पहले क्रम की अनुकूलता की स्थिति प्राप्त करने के लिए विविधताओं की गणना को नियोजित किया जाता है। इन स्थितियों के परिणामस्वरूप दो-बिंदु (या, एक जटिल समस्या के मामले में, एक बहु-बिंदु) सीमा-मान समस्या होती है। इस [[सीमा-मूल्य समस्या]] की वास्तव में एक विशेष संरचना है क्योंकि यह [[हैमिल्टनियन (नियंत्रण सिद्धांत)]] के व्युत्पन्न लेने से उत्पन्न होती है। इस प्रकार, परिणामी गतिकीय प्रणाली फॉर्म की [[हैमिल्टनियन प्रणाली]] है<ref name=":0" />
इष्टतम नियंत्रण समस्याएं सामान्यतः अरैखिक होती हैं और इसलिए, सामान्यतः विश्लेषणात्मक समाधान नहीं होते हैं (उदाहरण के लिए, रैखिक-द्विघात इष्टतम नियंत्रण समस्या की तरह)। नतीजतन, इष्टतम नियंत्रण समस्याओं को हल करने के लिए संख्यात्मक तरीकों को नियोजित करना आवश्यक है। इष्टतम नियंत्रण के प्रारंभिक वर्षों में ({{abbr|c.|circa}} 1950 से 1980 के दशक) इष्टतम नियंत्रण समस्याओं को हल करने के लिए इष्ट दृष्टिकोण अप्रत्यक्ष तरीकों का था। अप्रत्यक्ष विधि में, पहले क्रम की अनुकूलता की स्थिति प्राप्त करने के लिए विविधताओं की गणना को नियोजित किया जाता है। इन स्थितियों के परिणामस्वरूप दो-बिंदु (या, एक जटिल समस्या केप्रकर्ण में, एक बहु-बिंदु) सीमा-मान समस्या होती है। इस [[सीमा-मूल्य समस्या]] की वास्तव में एक विशेष संरचना है क्योंकि यह [[हैमिल्टनियन (नियंत्रण सिद्धांत)]] के व्युत्पन्न लेने से उत्पन्न होती है। इस प्रकार, परिणामी गतिकीय प्रणाली रूप की [[हैमिल्टनियन प्रणाली]] है<ref name=":0" />
<math display="block">\begin{align}
<math display="block">\begin{align}
\dot{\textbf{x}} & = \frac{\partial H}{\partial\boldsymbol{\lambda}} \\[1.2ex]
\dot{\textbf{x}} & = \frac{\partial H}{\partial\boldsymbol{\lambda}} \\[1.2ex]
\dot{\boldsymbol{\lambda}} & = -\frac{\partial H}{\partial\textbf{x}}
\dot{\boldsymbol{\lambda}} & = -\frac{\partial H}{\partial\textbf{x}}
\end{align}</math>
\end{align}</math>
कहाँ पे
जहाँ पर
<math display="block">H= F +\boldsymbol{\lambda}^{\mathsf{T}}\textbf{f}- \boldsymbol{\mu}^{\mathsf{T}}\textbf{h}</math>
<math display="block">H= F +\boldsymbol{\lambda}^{\mathsf{T}}\textbf{f}- \boldsymbol{\mu}^{\mathsf{T}}\textbf{h}</math>
संवर्धित हैमिल्टनियन है और अप्रत्यक्ष विधि में, सीमा-मूल्य समस्या हल हो जाती है (उपयुक्त सीमा या ट्रांसवर्सलिटी स्थितियों का उपयोग करके)। एक अप्रत्यक्ष विधि का उपयोग करने की सुंदरता यह है कि स्थिति और आसन्न (यानी, <math>\boldsymbol{\lambda}</math>) के लिए हल किया जाता है और परिणामी समाधान एक चरम प्रक्षेपवक्र होने के लिए आसानी से सत्यापित होता है। अप्रत्यक्ष तरीकों का नुकसान यह है कि सीमा-मूल्य समस्या को हल करना अक्सर बेहद मुश्किल होता है (विशेष रूप से उन समस्याओं के लिए जो बड़े समय के अंतराल या आंतरिक बिंदु बाधाओं के साथ समस्याओं को फैलाते हैं)। एक प्रसिद्ध सॉफ्टवेयर प्रोग्राम जो अप्रत्यक्ष तरीकों को लागू करता है, वह है BNDSCO।<ref>Oberle, H. J. and Grimm, W., "BNDSCO-A Program for the Numerical Solution of Optimal Control Problems," Institute for Flight Systems Dynamics, DLR, Oberpfaffenhofen, 1989</ref>
संवर्धित हैमिल्टनियन है और अप्रत्यक्ष विधि में, सीमा-मूल्य समस्या हल हो जाती है (उपयुक्त सीमा या ट्रांसवर्सलिटी स्थितियों का उपयोग करके)। एक अप्रत्यक्ष विधि का उपयोग करने की सुंदरता यह है कि स्थिति और आसन्न (अर्थात् , <math>\boldsymbol{\lambda}</math>) के लिए हल किया जाता है और परिणामी समाधान एक चरम प्रक्षेपवक्र होने के लिए आसानी से सत्यापित होता है। अप्रत्यक्ष तरीकों का नुकसान यह है कि सीमा-मूल्य समस्या को हल करना प्राय: बेहद मुश्किल होता है (विशेष रूप से उन समस्याओं के लिए जो बड़े समय के अंतराल या आंतरिक बिंदु बाधाओं के साथ समस्याओं को फैलाते हैं)। एक प्रसिद्ध प्रक्रिया योजना जो अप्रत्यक्ष तरीकों को लागू करता है, वह है BNDSCO।<ref>Oberle, H. J. and Grimm, W., "BNDSCO-A Program for the Numerical Solution of Optimal Control Problems," Institute for Flight Systems Dynamics, DLR, Oberpfaffenhofen, 1989</ref>
1980 के दशक से जो दृष्टिकोण संख्यात्मक इष्टतम नियंत्रण में प्रमुखता से बढ़ा है, वह तथाकथित प्रत्यक्ष तरीकों का है। एक प्रत्यक्ष विधि में, स्थिति या नियंत्रण, या दोनों, एक उपयुक्त फ़ंक्शन सन्निकटन (जैसे, बहुपद सन्निकटन या टुकड़े-टुकड़े स्थिर पैरामीटर) का उपयोग करके अनुमानित किए जाते हैं। इसके साथ ही, लागत कार्यात्मक लागत फ़ंक्शन के रूप में अनुमानित है। फिर, फ़ंक्शन सन्निकटन के गुणांक को ऑप्टिमाइज़ेशन चर के रूप में माना जाता है और समस्या को फॉर्म की एक गैर-रैखिक अनुकूलन समस्या में स्थानांतरित किया जाता है:
 
1980 के दशक से जो दृष्टिकोण संख्यात्मक इष्टतम नियंत्रण में प्रमुखता से बढ़ा है, वह तथाकथित प्रत्यक्ष तरीकों का है। एक प्रत्यक्ष विधि में, स्थिति या नियंत्रण, या दोनों, एक उपयुक्त प्रकार्य सन्निकटन (जैसे, बहुपद सन्निकटन या टुकड़े-टुकड़े स्थिर मापदण्ड) का उपयोग करके अनुमानित किए जाते हैं। इसके साथ ही, लागत कार्यात्मक लागत प्रकार्य के रूप में अनुमानित है। फिर, प्रकार्य सन्निकटन के गुणांक को इष्टमीकरण चर के रूप में माना जाता है और समस्या को प्ररूप की एक गैर-रैखिक अनुकूलन समस्या में स्थानांतरित किया जाता है:  
 


छोटा करना
न्यूनतमीकरण<math display="block"> F(\mathbf{z})</math>
<math display="block"> F(\mathbf{z})</math>
बीजगणितीय बाधाओं के अधीन
बीजगणितीय बाधाओं के अधीन
<math display="block"> \begin{align}
<math display="block"> \begin{align}
Line 70: Line 70:
\mathbf{h}(\mathbf{z}) & \leq \mathbf{0}
\mathbf{h}(\mathbf{z}) & \leq \mathbf{0}
\end{align} </math>
\end{align} </math>
नियोजित प्रत्यक्ष विधि के प्रकार के आधार पर, गैर-रैखिक अनुकूलन समस्या का आकार काफी छोटा हो सकता है (उदाहरण के लिए, प्रत्यक्ष शूटिंग या क्वासिलिनेराइजेशन विधि में), मध्यम (उदाहरण के लिए [[स्यूडोस्पेक्ट्रल इष्टतम नियंत्रण]])<ref name="ReviewPOC">{{cite journal |author-link=I. Michael Ross |first1=I. M. |last1=Ross |first2=M. |last2=Karpenko |title=स्यूडोस्पेक्ट्रल इष्टतम नियंत्रण की समीक्षा: सिद्धांत से उड़ान तक|journal=Annual Reviews in Control |volume=36 |issue=2 |pages=182–197 |year=2012 |doi=10.1016/j.arcontrol.2012.09.002 |title-link=Pseudospectral optimal control }}</ref>) या काफी बड़ा हो सकता है (उदाहरण के लिए, एक प्रत्यक्ष [[सहस्थापन विधि]]<ref>{{cite book |last=Betts |first=J. T. |title=गैर-रैखिक प्रोग्रामिंग का उपयोग करके इष्टतम नियंत्रण के लिए व्यावहारिक तरीके|publisher=SIAM Press |location=Philadelphia, Pennsylvania |edition=2nd |year=2010 |isbn=978-0-89871-688-7 }}</ref>). बाद के मामले में (यानी, एक कॉलोकेशन विधि), गैर-रैखिक अनुकूलन समस्या का शाब्दिक रूप से हजारों से दसियों हजारों चर और बाधाएं हो सकती हैं। प्रत्यक्ष विधि से उत्पन्न होने वाले कई एनएलपी के आकार को देखते हुए, यह कुछ हद तक प्रति-सहज लग सकता है कि सीमा-मूल्य समस्या को हल करने की तुलना में गैर-रैखिक अनुकूलन समस्या को हल करना आसान है। हालांकि, यह तथ्य है कि सीमा-मूल्य समस्या की तुलना में एनएलपी को हल करना आसान है। संगणना की सापेक्ष आसानी का कारण, विशेष रूप से प्रत्यक्ष सह-स्थापन विधि, यह है कि एनएलपी विरल है और कई प्रसिद्ध सॉफ्टवेयर प्रोग्राम मौजूद हैं (उदाहरण के लिए, एसएनओपीटी<ref>Gill, P. E., Murray, W. M., and Saunders, M. A., ''User's Manual for SNOPT Version 7: Software for Large-Scale Nonlinear Programming'', University of California, San Diego Report, 24 April 2007</ref>) बड़े विरल एनएलपी को हल करने के लिए। नतीजतन, समस्याओं की सीमा जो प्रत्यक्ष विधियों के माध्यम से हल की जा सकती है (विशेष रूप से प्रत्यक्ष सहस्थापन विधियाँ जो इन दिनों बहुत लोकप्रिय हैं) उन समस्याओं की सीमा से काफी बड़ी हैं जिन्हें अप्रत्यक्ष तरीकों से हल किया जा सकता है। वास्तव में, प्रत्यक्ष विधियाँ इन दिनों इतनी लोकप्रिय हो गई हैं कि बहुत से लोगों ने विस्तृत सॉफ्टवेयर प्रोग्राम लिखे हैं जो इन विधियों को नियोजित करते हैं। विशेष रूप से ऐसे कई कार्यक्रमों में डीआईआरसीओएल,<ref>von Stryk, O., ''User's Guide for DIRCOL (version 2.1): A Direct Collocation Method for the Numerical Solution of Optimal Control Problems'', Fachgebiet Simulation und Systemoptimierung (SIM), Technische Universität Darmstadt (2000, Version of November 1999).</ref> एसओसीएस,<ref>Betts, J.T. and Huffman, W. P., ''Sparse Optimal Control Software, SOCS'', Boeing Information and Support Services, Seattle, Washington, July 1997</ref> ओटिस,<ref>{{cite journal |last1=Hargraves |first1=C. R. |last2=Paris |first2=S. W. |title=नॉनलाइनियर प्रोग्रामिंग और कोलोकेशन का उपयोग करके डायरेक्ट ट्रैजेक्टरी ऑप्टिमाइजेशन|journal=Journal of Guidance, Control, and Dynamics |volume=10 |issue=4 |year=1987 |pages=338–342 |doi=10.2514/3.20223 |bibcode=1987JGCD...10..338H }}</ref> जीएसओपी/एएसटीओएस,<ref>Gath, P.F., Well, K.H., "Trajectory Optimization Using a Combination of Direct Multiple Shooting and Collocation", AIAA 2001–4047, AIAA Guidance, Navigation, and Control Conference, Montréal, Québec, Canada, 6–9 August 2001</ref> डाइटन।<ref>Vasile M., Bernelli-Zazzera F., Fornasari N., Masarati P., "Design of Interplanetary and Lunar Missions Combining Low-Thrust and Gravity Assists", Final Report of the ESA/ESOC Study Contract No. 14126/00/D/CS, September 2002</ref> और पायजीएमओ/पीईकेईपी।<ref>Izzo, Dario. "PyGMO and PyKEP: open source tools for massively parallel optimization in astrodynamics (the case of interplanetary trajectory optimization)." Proceed. Fifth International Conf. Astrodynam. Tools and Techniques, ICATT. 2012.</ref> हाल के वर्षों में, [[MATLAB]] प्रोग्रामिंग भाषा के आगमन के कारण, MATLAB में इष्टतम नियंत्रण सॉफ्टवेयर अधिक सामान्य हो गया है। शैक्षिक रूप से विकसित MATLAB सॉफ़्टवेयर टूल के उदाहरणों में प्रत्यक्ष तरीकों को लागू करने में शामिल हैं, दंगा,<ref>[http://www.schwartz-home.com/RIOTS/ RIOTS] {{Webarchive| url=https://web.archive.org/web/20110716014630/http://www.schwartz-home.com/RIOTS/ |date=16 July 2011 }}, based on {{cite thesis |type=Ph.D. |last=Schwartz |first=Adam |date=1996 |title=Theory and Implementation of Methods based on Runge–Kutta Integration for Solving Optimal Control Problems |publisher=University of California at Berkeley |oclc=35140322 }}</ref> [[DIDO (इष्टतम नियंत्रण)]],<ref>Ross, I. M., ''Enhancements to the DIDO Optimal Control Toolbox, arXiv 2020.'' https://arxiv.org/abs/2004.13112</ref> प्रत्यक्ष,<ref>Williams, P., ''User's Guide to DIRECT, Version 2.00,'' Melbourne, Australia, 2008</ref> फाल्कन.एम,<ref>[http://www.falcon-m.com/ FALCON.m], described in Rieck, M., Bittner, M., Grüter, B., Diepolder, J., and Piprek, P., ''FALCON.m - User Guide'', Institute of Flight System Dynamics, Technical University of Munich, October 2019</ref> और जीपीओपीएस,<ref>[http://gpops.sourceforge.net GPOPS] {{Webarchive|url=https://web.archive.org/web/20110724074641/http://gpops.sourceforge.net/ |date=24 July 2011 }}, described in Rao, A. V., Benson, D. A., Huntington, G. T., Francolin, C., Darby, C. L., and Patterson, M. A., ''User's Manual for GPOPS: A MATLAB Package for Dynamic Optimization Using the [[Gauss pseudospectral method|Gauss Pseudospectral Method]]'', University of Florida Report, August 2008.</ref> जबकि एक उद्योग विकसित MATLAB उपकरण का एक उदाहरण [[PROPT]] है।<ref>Rutquist, P. and Edvall, M. M, ''PROPT – MATLAB Optimal Control Software," 1260 S.E. Bishop Blvd Ste E, Pullman, WA 99163, USA: Tomlab Optimization, Inc.</ref> इन सॉफ्टवेयर टूल्स ने शैक्षणिक अनुसंधान और औद्योगिक समस्याओं दोनों के लिए जटिल इष्टतम नियंत्रण समस्याओं का पता लगाने के लिए लोगों के अवसर में काफी वृद्धि की है।<ref>I.M. Ross, [https://nps.edu/documents/103424443/116151573/Ross.pdf/2c85d1a1-ff5b-4f60-9700-2ee5e1f3f65f?t=1580766209000 Computational Optimal Control], 3rd Workshop in Computational Issues in Nonlinear Control, October 8th, 2019, Monterey, CA</ref> अंत में, यह नोट किया गया है कि सामान्य-उद्देश्य MATLAB अनुकूलन वातावरण जैसे [[TOMLAB]] ने कोडिंग जटिल इष्टतम नियंत्रण समस्याओं को सी और [[फोरट्रान]] जैसी भाषाओं में पहले की तुलना में काफी आसान बना दिया है।
नियोजित प्रत्यक्ष विधि के प्रकार के आधार पर, गैर-रैखिक अनुकूलन समस्या का आकार काफी छोटा हो सकता है (उदाहरण के लिए, प्रत्यक्ष आखेट या क्वासिलिनेराइजेशन विधि में), औसत (उदाहरण के लिए [[स्यूडोस्पेक्ट्रल इष्टतम नियंत्रण]])<ref name="ReviewPOC">{{cite journal |author-link=I. Michael Ross |first1=I. M. |last1=Ross |first2=M. |last2=Karpenko |title=स्यूडोस्पेक्ट्रल इष्टतम नियंत्रण की समीक्षा: सिद्धांत से उड़ान तक|journal=Annual Reviews in Control |volume=36 |issue=2 |pages=182–197 |year=2012 |doi=10.1016/j.arcontrol.2012.09.002 |title-link=Pseudospectral optimal control }}</ref>) या काफी बड़ा हो सकता है (उदाहरण के लिए, एक प्रत्यक्ष [[सहस्थापन विधि]]<ref>{{cite book |last=Betts |first=J. T. |title=गैर-रैखिक प्रोग्रामिंग का उपयोग करके इष्टतम नियंत्रण के लिए व्यावहारिक तरीके|publisher=SIAM Press |location=Philadelphia, Pennsylvania |edition=2nd |year=2010 |isbn=978-0-89871-688-7 }}</ref>) बाद के प्रकर्ण में ( अर्थात् , एक सहस्थापन विधि), गैर-रैखिक अनुकूलन समस्या का शाब्दिक रूप से हजारों से दसियों हजारों चर और बाधाएं हो सकती हैं। प्रत्यक्ष विधि से उत्पन्न होने वाले कई NLP के आकार को देखते हुए, यह कुछ हद तक प्रति-सहज लग सकता है कि सीमा-मूल्य समस्या को हल करने की तुलना में गैर-रैखिक अनुकूलन समस्या को हल करना आसान है। हालांकि, यह तथ्य है कि सीमा-मूल्य समस्या की तुलना में NLP को हल करना आसान है। संगणना की सापेक्ष आसानी का कारण, विशेष रूप से प्रत्यक्ष सह-स्थापन विधि, यह है कि NLP विरल है और कई प्रसिद्ध प्रक्रिया सामग्री कार्यक्रम मौजूद हैं (उदाहरण के लिए, SNOPT<ref>Gill, P. E., Murray, W. M., and Saunders, M. A., ''User's Manual for SNOPT Version 7: Software for Large-Scale Nonlinear Programming'', University of California, San Diego Report, 24 April 2007</ref>) बड़े विरल NLP को हल करने के लिए। नतीजतन, समस्याओं की सीमा जो प्रत्यक्ष विधियों के माध्यम से हल की जा सकती है (विशेष रूप से प्रत्यक्ष सहस्थापन विधियाँ जो इन दिनों बहुत लोकप्रिय हैं) उन समस्याओं की सीमा से काफी बड़ी हैं जिन्हें अप्रत्यक्ष तरीकों से हल किया जा सकता है। वास्तव में, प्रत्यक्ष विधियाँ इन दिनों इतनी लोकप्रिय हो गई हैं कि बहुत से लोगों ने विस्तृत प्रक्रिया सामग्री कार्यक्रम लिखे हैं जो इन विधियों को नियोजित करते हैं। विशेष रूप से ऐसे कई कार्यक्रमों में DIRCOL,<ref>von Stryk, O., ''User's Guide for DIRCOL (version 2.1): A Direct Collocation Method for the Numerical Solution of Optimal Control Problems'', Fachgebiet Simulation und Systemoptimierung (SIM), Technische Universität Darmstadt (2000, Version of November 1999).</ref> SOCS,<ref>Betts, J.T. and Huffman, W. P., ''Sparse Optimal Control Software, SOCS'', Boeing Information and Support Services, Seattle, Washington, July 1997</ref> OTIS,<ref>{{cite journal |last1=Hargraves |first1=C. R. |last2=Paris |first2=S. W. |title=नॉनलाइनियर प्रोग्रामिंग और कोलोकेशन का उपयोग करके डायरेक्ट ट्रैजेक्टरी ऑप्टिमाइजेशन|journal=Journal of Guidance, Control, and Dynamics |volume=10 |issue=4 |year=1987 |pages=338–342 |doi=10.2514/3.20223 |bibcode=1987JGCD...10..338H }}</ref> GESOP/ASTOS,<ref>Gath, P.F., Well, K.H., "Trajectory Optimization Using a Combination of Direct Multiple Shooting and Collocation", AIAA 2001–4047, AIAA Guidance, Navigation, and Control Conference, Montréal, Québec, Canada, 6–9 August 2001</ref> DITAN।<ref>Vasile M., Bernelli-Zazzera F., Fornasari N., Masarati P., "Design of Interplanetary and Lunar Missions Combining Low-Thrust and Gravity Assists", Final Report of the ESA/ESOC Study Contract No. 14126/00/D/CS, September 2002</ref> और PyGMO/PyKEP।<ref>Izzo, Dario. "PyGMO and PyKEP: open source tools for massively parallel optimization in astrodynamics (the case of interplanetary trajectory optimization)." Proceed. Fifth International Conf. Astrodynam. Tools and Techniques, ICATT. 2012.</ref> नवागत वर्षों में, [[MATLAB]] कार्यरचना भाषा के आगमन के कारण, MATLAB में इष्टतम नियंत्रण प्रक्रिया सामग्री अधिक सामान्य हो गया है। शैक्षिक रूप से विकसित MATLAB यंत्रेतर सामग्री साधन के उदाहरणों में प्रत्यक्ष तरीकों को लागू करने में अन्तर्वलित हैं, ''RIOTS'',<ref>[http://www.schwartz-home.com/RIOTS/ RIOTS] {{Webarchive| url=https://web.archive.org/web/20110716014630/http://www.schwartz-home.com/RIOTS/ |date=16 July 2011 }}, based on {{cite thesis |type=Ph.D. |last=Schwartz |first=Adam |date=1996 |title=Theory and Implementation of Methods based on Runge–Kutta Integration for Solving Optimal Control Problems |publisher=University of California at Berkeley |oclc=35140322 }}</ref> [[DIDO (इष्टतम नियंत्रण)|DIDO]],<ref>Ross, I. M., ''Enhancements to the DIDO Optimal Control Toolbox, arXiv 2020.'' https://arxiv.org/abs/2004.13112</ref> ''DIRECT'',<ref>Williams, P., ''User's Guide to DIRECT, Version 2.00,'' Melbourne, Australia, 2008</ref> FALCON.m,<ref>[http://www.falcon-m.com/ FALCON.m], described in Rieck, M., Bittner, M., Grüter, B., Diepolder, J., and Piprek, P., ''FALCON.m - User Guide'', Institute of Flight System Dynamics, Technical University of Munich, October 2019</ref> और ''GPOPS'',<ref>[http://gpops.sourceforge.net GPOPS] {{Webarchive|url=https://web.archive.org/web/20110724074641/http://gpops.sourceforge.net/ |date=24 July 2011 }}, described in Rao, A. V., Benson, D. A., Huntington, G. T., Francolin, C., Darby, C. L., and Patterson, M. A., ''User's Manual for GPOPS: A MATLAB Package for Dynamic Optimization Using the [[Gauss pseudospectral method|Gauss Pseudospectral Method]]'', University of Florida Report, August 2008.</ref> चूँकि एक उद्योग विकसित MATLAB उपकरण का एक उदाहरण [[PROPT]] है।<ref>Rutquist, P. and Edvall, M. M, ''PROPT – MATLAB Optimal Control Software," 1260 S.E. Bishop Blvd Ste E, Pullman, WA 99163, USA: Tomlab Optimization, Inc.</ref> इन प्रक्रिया सामग्री कलपुर्जे ने शैक्षणिक अनुसंधान और औद्योगिक समस्याओं दोनों के लिए जटिल इष्टतम नियंत्रण समस्याओं का पता लगाने के लिए लोगों के अवसर में काफी वृद्धि की है।<ref>I.M. Ross, [https://nps.edu/documents/103424443/116151573/Ross.pdf/2c85d1a1-ff5b-4f60-9700-2ee5e1f3f65f?t=1580766209000 Computational Optimal Control], 3rd Workshop in Computational Issues in Nonlinear Control, October 8th, 2019, Monterey, CA</ref> अंत में, यह नोट किया गया है कि सामान्य-उद्देश्य MATLAB अनुकूलन वातावरण जैसे [[TOMLAB]] ने कूटलेखन जटिल इष्टतम नियंत्रण समस्याओं को C और FORTRAN जैसी भाषाओं में पहले की तुलना में काफी आसान बना दिया है।


== असतत-समय इष्टतम नियंत्रण ==
== असतत-समय इष्टतम नियंत्रण ==
इस प्रकार अब तक के उदाहरणों ने [[निरंतर समय]] प्रणाली और नियंत्रण समाधान दिखाए हैं। वास्तव में, इष्टतम नियंत्रण समाधान के रूप में अब अक्सर डिजिटल डेटाली को लागू किया जाता है, समकालीन नियंत्रण सिद्धांत अब मुख्य रूप से असतत समय प्रणालियों और समाधानों से संबंधित है। संगत सन्निकटन का सिद्धांत<ref>E. Polak, ''On the use of consistent approximations in the solution of semi-infinite optimization and optimal control problems'' Math. Prog. 62 pp. 385–415 (1993).</ref><ref>{{Cite journal|last=Ross|first=I M. |date=2005-12-01|title=इष्टतम नियंत्रण के लिए एक रोडमैप: यात्रा करने का सही तरीका|url=http://dx.doi.org/10.1196/annals.1370.015 |journal=Annals of the New York Academy of Sciences|volume=1065 |issue=1 |pages=210–231 |doi=10.1196/annals.1370.015 |pmid=16510411 |bibcode=2005NYASA1065..210R |s2cid=7625851 |issn=0077-8923}}</ref> ऐसी स्थितियाँ प्रदान करता है जिसके तहत तेजी से सटीक विखंडित इष्टतम नियंत्रण समस्या की एक श्रृंखला के समाधान मूल, निरंतर-समय की समस्या के समाधान में परिवर्तित हो जाते हैं। विवेकाधिकार के सभी तरीकों में यह गुण नहीं होता है, यहाँ तक कि स्पष्ट रूप से भी।<ref>{{Cite journal|last1=Fahroo|first1=Fariba |last2=Ross|first2=I. Michael |date=September 2008|title=कॉस्टेट्स के अभिसरण का मतलब नियंत्रण का अभिसरण नहीं है|url=http://dx.doi.org/10.2514/1.37331|journal=Journal of Guidance, Control, and Dynamics|volume=31|issue=5 |pages=1492–1497|doi=10.2514/1.37331 |bibcode=2008JGCD...31.1492F |s2cid=756939 |issn=0731-5090}}</ref> उदाहरण के लिए, समस्या के गतिशील समीकरणों को एकीकृत करने के लिए एक चर चरण-आकार की दिनचर्या का उपयोग करने से एक ग्रेडिएंट उत्पन्न हो सकता है जो समाधान के संपर्क में आने पर शून्य (या सही दिशा में इंगित) में परिवर्तित नहीं होता है। प्रत्यक्ष विधि [http://www.schwartz-home.com/RIOTS RIOTS] संगत सन्निकटन के सिद्धांत पर आधारित है।
इस प्रकार अब तक के उदाहरणों ने [[निरंतर समय]] प्रणाली और नियंत्रण समाधान दिखाए हैं। वस्तुत:, इष्टतम नियंत्रण समाधान के रूप में अब प्राय: डिजिटली लागू किया जाता है, समकालीन नियंत्रण सिद्धांत अब मुख्य रूप से पृथक समय प्रणालियों और समाधानों से संबंधित है। संगत सन्निकटन का सिद्धांत<ref>E. Polak, ''On the use of consistent approximations in the solution of semi-infinite optimization and optimal control problems'' Math. Prog. 62 pp. 385–415 (1993).</ref><ref>{{Cite journal|last=Ross|first=I M. |date=2005-12-01|title=इष्टतम नियंत्रण के लिए एक रोडमैप: यात्रा करने का सही तरीका|url=http://dx.doi.org/10.1196/annals.1370.015 |journal=Annals of the New York Academy of Sciences|volume=1065 |issue=1 |pages=210–231 |doi=10.1196/annals.1370.015 |pmid=16510411 |bibcode=2005NYASA1065..210R |s2cid=7625851 |issn=0077-8923}}</ref> ऐसी स्थितियाँ प्रदान करता है जिसके अंतर्गत तेजी से सटीक विखंडित इष्टतम नियंत्रण समस्या की एक श्रृंखला के समाधान मूल, निरंतर-समय की समस्या के समाधान में परिवर्तित हो जाते हैं। विवेकाधिकार के सभी तरीकों में स्पष्ट रूप से भी यह गुण नहीं होता है।<ref>{{Cite journal|last1=Fahroo|first1=Fariba |last2=Ross|first2=I. Michael |date=September 2008|title=कॉस्टेट्स के अभिसरण का मतलब नियंत्रण का अभिसरण नहीं है|url=http://dx.doi.org/10.2514/1.37331|journal=Journal of Guidance, Control, and Dynamics|volume=31|issue=5 |pages=1492–1497|doi=10.2514/1.37331 |bibcode=2008JGCD...31.1492F |s2cid=756939 |issn=0731-5090}}</ref> उदाहरण के लिए, समस्या के गतिशील समीकरणों को एकीकृत करने के लिए एक चर चरण-आकार की दिनचर्या का उपयोग करने से एक अनुप्रवण उत्पन्न हो सकता है जो समाधान के संपर्क में आने पर शून्य (या सही दिशा में इंगित) में परिवर्तित नहीं होता है। प्रत्यक्ष विधि [http://www.schwartz-home.com/RIOTS RIOTS] संगत सन्निकटन के सिद्धांत पर आधारित है।


== उदाहरण ==
== उदाहरण ==
{{unreferenced section|date=April 2018}}
कई इष्टतम नियंत्रण समस्याओं में एक सामान्य समाधान रणनीति लागत के लिए हल करना है (कभी-कभी छाया मूल्य कहा जाता है)<math>\lambda(t)</math> पर्शुरेखित एक संख्या में स्तिथि चर के अगले मोड़ के विस्तार या अनुबंध के सीमांत मूल्य को संक्षेप में प्रस्तुत करता है। सीमांत मूल्य न केवल अगले मोड़ पर अर्जित लाभ है वस्तुतः कार्यक्रम की अवधि से जुड़ा है। यह अच्छा है जब <math>\lambda(t)</math> विश्लेषणात्मक रूप से हल किया जा सकता है, लेकिन सामान्यतः, सबसे अधिक यह किया जा सकता है कि यह पर्याप्त रूप से अच्छी तरह से वर्णन करता है कि अंतर्ज्ञान समाधान के चरित्र को समझ सकता है और एक समीकरण समाधानकर्ता मूल्यों के लिए संख्यात्मक रूप से हल कर सकता है।
कई इष्टतम नियंत्रण समस्याओं में एक सामान्य समाधान रणनीति लागत के लिए हल करना है (कभी-कभी छाया मूल्य कहा जाता है) <math>\lambda(t)</math>. कॉस्टेट एक संख्या में राज्य चर के अगले मोड़ के विस्तार या अनुबंध के सीमांत मूल्य को संक्षेप में प्रस्तुत करता है। सीमांत मूल्य न केवल अगले मोड़ पर अर्जित लाभ है बल्कि कार्यक्रम की अवधि से जुड़ा है। यह अच्छा है जब <math>\lambda(t)</math> विश्लेषणात्मक रूप से हल किया जा सकता है, लेकिन आमतौर पर, सबसे अधिक यह किया जा सकता है कि यह पर्याप्त रूप से अच्छी तरह से वर्णन करता है कि अंतर्ज्ञान समाधान के चरित्र को समझ सकता है और एक समीकरण सॉल्वर मूल्यों के लिए संख्यात्मक रूप से हल कर सकता है।


प्राप्त करके <math>\lambda(t)</math>, नियंत्रण के लिए टर्न-टी इष्टतम मूल्य को आमतौर पर ज्ञान के आधार पर अंतर समीकरण के रूप में हल किया जा सकता है <math>\lambda(t)</math>. फिर से यह बहुत कम होता है, विशेष रूप से निरंतर-समय की समस्याओं में, कि कोई नियंत्रण या राज्य के मूल्य को स्पष्ट रूप से प्राप्त करता है। आमतौर पर, रणनीति थ्रेसहोल्ड और क्षेत्रों के लिए हल करना है जो इष्टतम नियंत्रण की विशेषता है और समय में वास्तविक पसंद मूल्यों को अलग करने के लिए एक संख्यात्मक सॉल्वर का उपयोग करते हैं।
अभिप्राप्त <math>\lambda(t)</math>, नियंत्रण के लिए पंक्ति-t इष्टतम मूल्य को सामान्यतः  ज्ञान के आधार पर <math>\lambda(t)</math> अंतर समीकरण के रूप में हल किया जा सकता है। फिर से यह विरल होता है, विशेष रूप से निरंतर-समय की समस्याओं में, यह नियंत्रण या राज्य के मूल्य को स्पष्ट रूप से प्राप्त करता है। सामान्यतः, रणनीति प्रभावसीमा और क्षेत्रों के लिए हल करना है जो इष्टतम नियंत्रण की विशेषता है और समय में वास्तविक पसंद मूल्यों को अलग करने के लिए एक संख्यात्मक समाधानकर्ता का उपयोग करते हैं।


=== परिमित समय ===
=== परिमित समय ===
{{confusing|section|reason=the law of evolution mentioned in the example is not mentioned in the article and is probably not the same as [[evolution]]|date=October 2018}}
एक खदान मालिक की समस्या पर विचार करें, जिसे यह तय करना होगा कि उनकी खदान से किस दर पर अयस्क निकाला जाए। अयस्क पर उनका अधिकार <math>0</math> तारीख से  <math>T</math> तक है. <math>0</math> तिथि पर वहाँ जमीन में <math>x_0</math> अयस्क है, और अयस्क की समय-निर्भर मात्रा <math>x(t)</math> खदान मालिक इसे निकालता है तो जमीन में छोड़े जाने की दर <math>u(t)</math> से गिरावट आती है। खदान मालिक लागत पर अयस्क निकालता है <math>u(t)^2/x(t)</math> (निष्कर्षण की लागत वर्ग के साथ निष्कर्षण की गति और बचे हुए अयस्क की मात्रा के व्युत्क्रम के साथ बढ़ती है) और अयस्क को एक स्थिर मूल्य पर बेचता है <math>p</math>. समय पर जमीन में छोड़ा गया कोई अयस्क <math>T</math> बेचा नहीं जा सकता है और इसका कोई मूल्य नहीं है (कोई क्षेप्य मूल्य नहीं है)। मालिक स्वामित्व की अवधि में बिना किसी छूट के लाभ को अधिकतम करने के लिए समय के साथ अलग-अलग निकासी की दर चुनता है <math>u(t)</math>
एक खदान मालिक की समस्या पर विचार करें, जिसे यह तय करना होगा कि उनकी खदान से किस दर पर अयस्क निकाला जाए। तारीख से अयस्क पर उनका अधिकार है <math>0</math> तारीख तक <math>T</math>. तिथि पर <math>0</math> वहाँ है <math>x_0</math> जमीन में अयस्क, और अयस्क की समय-निर्भर मात्रा <math>x(t)</math> जमीन में छोड़े जाने की दर से गिरावट आती है <math>u(t)</math> कि खदान मालिक इसे निकालता है। खदान मालिक लागत पर अयस्क निकालता है <math>u(t)^2/x(t)</math> (निष्कर्षण की लागत वर्ग के साथ निष्कर्षण की गति और बचे हुए अयस्क की मात्रा के व्युत्क्रम के साथ बढ़ती है) और अयस्क को एक स्थिर मूल्य पर बेचता है <math>p</math>. समय पर जमीन में छोड़ा गया कोई अयस्क <math>T</math> बेचा नहीं जा सकता है और इसका कोई मूल्य नहीं है (कोई स्क्रैप मूल्य नहीं है)। मालिक समय के साथ अलग-अलग निकासी की दर चुनता है <math>u(t)</math> बिना किसी छूट के स्वामित्व की अवधि में लाभ को अधिकतम करने के लिए।


{{ordered list
{{ordered list
| 1 = Discrete-time version
| 1 = पृथक- समय  वृतान्त
{{pb}}
{{pb}}
The manager maximizes profit <math>\Pi</math>:
प्रबंधक लाभ को अधिकतम करता है <math>\Pi</math>:
<math display="block">\Pi = \sum_{t=0}^{T-1} \left[ pu_t - \frac{u_t^2}{x_t} \right] </math>
<math display="block">\Pi = \sum_{t=0}^{T-1} \left[ pu_t - \frac{u_t^2}{x_t} \right] </math>
subject to the law of motion for the state variable <math>x_t</math>
दशा चर के लिए गति के कानून के अधीन<math>x_t</math>
<math display="block">x_{t+1} - x_t = - u_t</math>
<math display="block">x_{t+1} - x_t = - u_t</math>


Form the Hamiltonian and differentiate:
हैमिल्टनियन का निर्माण करें और अंतर करें:
<math display="block">\begin{align}
<math display="block">\begin{align}
H &= pu_t - \frac{u_t^2}{x_t} - \lambda_{t+1} u_t \\
H &= pu_t - \frac{u_t^2}{x_t} - \lambda_{t+1} u_t \\
Line 100: Line 98:
\end{align}</math>
\end{align}</math>


As the mine owner does not value the ore remaining at time <math>T</math>,
चूंकि खदान मालिक समय पर बचे हुए अयस्क को महत्व नहीं देता है,
<math display="block">\lambda_T = 0</math>
<math display="block">\lambda_T = 0</math>


Using the above equations, it is easy to solve for the <math>x_t</math> and <math>\lambda_t</math> series
उपरोक्त समीकरणों का उपयोग करके,इस शृंखला को हल करना आसान है और प्रारंभिक और टर्न-t स्थितियों का उपयोग करते हुए,  
<math display="block">\begin{align}
श्रंखला को स्पष्ट रूप से दे कर हल किया जा सकता है
\lambda_t &= \lambda_{t+1} + \frac{\left(p-\lambda_{t+1}\right)^2}{4} \\
x_{t+1} &= x_t \frac{2 - p + \lambda_{t+1}}{2}
\end{संरेखित करें}</math>
और प्रारंभिक और टर्न-टी स्थितियों का उपयोग करते हुए,  
math>x_t</math> श्रंखला को स्पष्ट रूप से दे कर हल किया जा सकता है गणित>u_t</गणित>।


| 2 = निरंतर-समय संस्करण
| 2 = निरंतर-समय संस्करण
Line 139: Line 132:
* [[बेलमैन समीकरण]]
* [[बेलमैन समीकरण]]
* [[बेलमैन स्यूडोस्पेक्ट्रल विधि]]
* [[बेलमैन स्यूडोस्पेक्ट्रल विधि]]
* [[ब्राचिस्टोक्रोन]]
* [[ क्षिप्रतम वक्र]]
* DIDO (इष्टतम नियंत्रण)
* DIDO (इष्टतम नियंत्रण)
* [[डीएनएसएस बिंदु]]
* [[DNSS बिंदु]]
* [[गतिशील प्रोग्रामिंग]]
* [[गतिशील प्रोग्रामिंग]]
* [[गॉस स्यूडोस्पेक्ट्रल विधि]]
* [[गॉस स्यूडोस्पेक्ट्रल विधि]]
* [[सामान्यीकृत फ़िल्टरिंग]]
* [[सामान्यीकृत निस्पंदन]]
* [[जीपीओपीएस-द्वितीय]]
* [[GPOPS-द्वितीय]]
* [[का घर]]
* [[CasADi]]
* JModelica.org (गतिशील अनुकूलन के लिए मॉडलिका-आधारित खुला स्रोत मंच)
* JModelica.org (गतिशील अनुकूलन के लिए मॉडलिका-आधारित खुला स्रोत मंच)
* [[कलमन फिल्टर]]
* [[कलमन निस्यंदक]]
* [[रैखिक-द्विघात नियामक]]
* [[रैखिक-द्विघात नियामक]]
* [[मॉडल भविष्यवाणी नियंत्रण]]
* [[आदर्श भविष्यवाणी नियंत्रण]]
* [[ओवरटेकिंग कसौटी]]
* [[अभिलंघन कसौटी]]
* [[पीआईडी ​​​​नियंत्रक]]
* [[PID ​​​​नियंत्रक]]
* PROPT| PROPT (MATLAB के लिए इष्टतम नियंत्रण सॉफ्टवेयर)
* PROPT (MATLAB के लिए इष्टतम नियंत्रण प्रक्रिया सामग्री)
* स्यूडोस्पेक्ट्रल इष्टतम नियंत्रण
* स्यूडोस्पेक्ट्रल इष्टतम नियंत्रण
* [[पीछा-चोरी]] का खेल
* [[ अनुधावन- भागना]] का खेल
* [[स्लाइडिंग मोड नियंत्रण]]
* [[स्खलन प्रणाली नियंत्रण]]
* एसएनओपीटी
* SNOTP
* [[स्टोकेस्टिक नियंत्रण]]
* [[प्रसंभाव्य नियंत्रण]]
* [[प्रक्षेपवक्र अनुकूलन]]
* [[प्रक्षेपवक्र अनुकूलन]]
{{colend}}
{{colend}}


==संदर्भ==
==संदर्भ==
{{Reflist|30em}}
{{Reflist|30em}}


==अग्रिम पठन==
==अग्रिम पठन==
Line 173: Line 164:
* {{cite book |first1=M. I. |last1=Kamien |author-link=Morton Kamien |first2=N. L. |last2=Schwartz |author-link2=Nancy Schwartz |title=Dynamic Optimization: The Calculus of Variations and Optimal Control in Economics and Management |location=New York |publisher=Elsevier |edition=Second |year=1991 |isbn=0-444-01609-0 |url=https://books.google.com/books?id=0IoGUn8wjDQC }}
* {{cite book |first1=M. I. |last1=Kamien |author-link=Morton Kamien |first2=N. L. |last2=Schwartz |author-link2=Nancy Schwartz |title=Dynamic Optimization: The Calculus of Variations and Optimal Control in Economics and Management |location=New York |publisher=Elsevier |edition=Second |year=1991 |isbn=0-444-01609-0 |url=https://books.google.com/books?id=0IoGUn8wjDQC }}
* {{cite book |last=Kirk |first=D. E. |author-link=Donald E. Kirk |year=1970 |title=Optimal Control Theory: An Introduction |location=Englewood Cliffs |publisher=Prentice-Hall |isbn=0-13-638098-0 |url=https://books.google.com/books?id=onuH0PnZwV4C }}
* {{cite book |last=Kirk |first=D. E. |author-link=Donald E. Kirk |year=1970 |title=Optimal Control Theory: An Introduction |location=Englewood Cliffs |publisher=Prentice-Hall |isbn=0-13-638098-0 |url=https://books.google.com/books?id=onuH0PnZwV4C }}
==इस पेज में लापता आंतरिक लिंक की सूची==
*वस्तुनिष्ठ कार्य
*चांद
*विविधताओं की गणना
*समारोह (गणित)
*बाधा (गणित)
*आरंभिक दशा
*सीमारेखा की हालत
*controllability
*चटकाना
*के रूप में
*संगत अनुमान
*डिजिटल डाटा
*खास समय
*परछाई कीमत
==बाहरी संबंध==
==बाहरी संबंध==
*[https://nps.edu/documents/103424443/116151573/Ross.pdf/2c85d1a1-ff5b-4f60-9700-2ee5e1f3f65f?t=1580766209000 Computational Optimal Control]
*[https://nps.edu/documents/103424443/116151573/Ross.pdf/2c85d1a1-ff5b-4f60-9700-2ee5e1f3f65f?t=1580766209000 Computational Optimal Control]
Line 198: Line 170:
* [https://gekko.readthedocs.io/en/latest/ GEKKO - Python package for optimal control]  
* [https://gekko.readthedocs.io/en/latest/ GEKKO - Python package for optimal control]  
* [https://web.archive.org/web/20101031195713/http://www.astos.de/products/gesop GESOP – Graphical Environment for Simulation and OPtimization]
* [https://web.archive.org/web/20101031195713/http://www.astos.de/products/gesop GESOP – Graphical Environment for Simulation and OPtimization]
{{Use dmy dates|date=April 2020}}
 
* [http://gpops2.com/ GPOPS-II – General-Purpose MATLAB Optimal Control Software]
* [http://gpops2.com/ GPOPS-II – General-Purpose MATLAB Optimal Control Software]
* [https://web.casadi.org/ CasADi –  Free and open source symbolic framework for optimal control]
* [https://web.casadi.org/ CasADi –  Free and open source symbolic framework for optimal control]
Line 211: Line 183:
{{Authority control}}
{{Authority control}}


{{DEFAULTSORT:Optimal Control}}[[Category:इष्टतम नियंत्रण| ]]
{{DEFAULTSORT:Optimal Control}}
[[Category: गणितीय अनुकूलन]]
 


[[Category: Machine Translated Page]]
[[Category:AC with 0 elements|Optimal Control]]
[[Category:Created On 25/11/2022]]
[[Category:Articles with invalid date parameter in template|Optimal Control]]
[[Category:Articles with short description|Optimal Control]]
[[Category:CS1 English-language sources (en)]]
[[Category:Created On 25/11/2022|Optimal Control]]
[[Category:Lua-based templates|Optimal Control]]
[[Category:Machine Translated Page|Optimal Control]]
[[Category:Multi-column templates|Optimal Control]]
[[Category:Pages using div col with small parameter|Optimal Control]]
[[Category:Short description with empty Wikidata description|Optimal Control]]
[[Category:Templates that add a tracking category|Optimal Control]]
[[Category:Templates using TemplateData|Optimal Control]]
[[Category:Templates using under-protected Lua modules|Optimal Control]]
[[Category:Use dmy dates from April 2020|Optimal Control]]
[[Category:Webarchive template wayback links]]
[[Category:Wikipedia fully protected templates|Div col]]
[[Category:इष्टतम नियंत्रण| ]]
[[Category:गणितीय अनुकूलन|Optimal Control]]

Latest revision as of 11:36, 1 November 2023

इष्टतम नियंत्रण समस्या बेंचमार्क (लुस) एक अभिन्न उद्देश्य, असमानता और अंतर बाधा के साथ।

इष्टतम नियंत्रण सिद्धांत गणितीय अनुकूलन की एक शाखा है जो एक गतिशील प्रणाली के लिए समय की अवधि में एक नियंत्रण (इष्टतम नियंत्रण सिद्धांत) खोजने से संबंधित है, जैसे कि एक उद्देश्य प्रकार्य अनुकूलित किया गया है।[1] इसके विज्ञान, अभियांत्रिकी और संचालन अनुसंधान में कई अनुप्रयोग हैं। उदाहरण के लिए, गतिशील प्रणाली प्रक्षेपात्र प्रक्षेपक के अनुरूप नियंत्रण वाला एक अंतरिक्ष यान हो सकता है, और इसका उद्देश्य न्यूनतम ईंधन व्यय के साथ चंद्रमा तक पहुंचना हो सकता है।[2] या गतिशील प्रणाली बेरोजगारी को कम करने के उद्देश्य से एक राष्ट्र की अर्थव्यवस्था हो सकती है; इसप्रकर्ण में नियंत्रण राजकोषीय नीति और मौद्रिक नीति हो सकते हैं।[3] इष्टतम नियंत्रण सिद्धांत के ढांचे के भीतर संचालन अनुसंधान को लागू करने के लिए एक गतिशील प्रणाली भी शुरू की जा सकती है।[4][5]

इष्टतम नियंत्रण विविधताओं की कलन का एक विस्तार है, और नियंत्रण सिद्धांत प्राप्त करने के लिए एक गणितीय अनुकूलन विधि है।[6] 1950 के दशक में एडवर्ड जे. मैक्शेन द्वारा विविधताओं की कलन में योगदान के बाद, विधि काफी हद तक लेव पोंट्रीगिन और रिचर्ड बेलमैन के काम के कारण है।[7] इष्टतम नियंत्रण को नियंत्रण सिद्धांत में नियंत्रण रणनीति के रूप में देखा जा सकता है।[1]


सामान्य विधि

इष्टतम नियंत्रण किसी दी गई प्रणाली के लिए नियंत्रण कानून खोजने की समस्या से संबंधित है जैसे कि एक निश्चित इष्टतमता मानदंड प्राप्त किया जाता है। एक नियंत्रण समस्या में एक लागत कार्यात्मक सम्मिलित है जो राज्य और नियंत्रण चर का कार्य (गणित) है। एक इष्टतम नियंत्रण अंतर समीकरणों का एक समुच्चय है जो नियंत्रण चर के पथ का वर्णन करता है जो लागत प्रकार्य को कम करता है। पोन्ट्रियाजिन उच्चिष्ठ सिद्धांत (एक आवश्यक शर्त जिसे पोन्ट्रियाजिन न्यूनतम सिद्धांत या केवल पोंट्रीगिन के सिद्धांत के रूप में भी जाना जाता है) का उपयोग करके[8] या हैमिल्टन-जैकोबी-बेलमैन समीकरण (एक पर्याप्त स्थिति) को हल करके इष्टतम नियंत्रण प्राप्त किया जा सकता है।

हम एक साधारण उदाहरण से शुरू करते हैं। एक पहाड़ी सड़क पर एक सीधी रेखा में चलने वाली मोटर गाड़ी पर विचार करें। सवाल यह है कि कुल यात्रा समय को कम करने के लिए ड्राइवर को त्वरक पदिक कैसे दबाना चाहिए? इस उदाहरण में, शब्द नियंत्रण कानून विशेष रूप से उस तरीके को संदर्भित करता है जिसमें चालक त्वरक को दबाता है और यंत्रावली को बदलता है। प्रणाली में मोटर गाड़ी और सड़क दोनों अन्तर्वलित हैं, और इष्टतमता मानदंड कुल यात्रा समय का न्यूनतमकरण है। नियंत्रण समस्याओं में सामान्यतः सहायक प्रतिबंध (गणित) अन्तर्वलित होते हैं। उदाहरण के लिए, उपलब्ध ईंधन की मात्रा सीमित हो सकती है, त्वरक पेडल को कार के फर्श, गति सीमा आदि के माध्यम से नहीं धकेला जा सकता है।

एक उचित लागत प्रकार्य एक गणितीय अभिव्यक्ति होगी जो गति, ज्यामितीय विचारों और प्रणाली की प्रारंभिक स्थितियों के कार्य के रूप में यात्रा का समय देगी। बाधाएँ (गणित) प्राय: लागत फलन के साथ विनिमेय होती हैं।

एक और संबंधित इष्टतम नियंत्रण समस्या कार को चलाने का तरीका खोजने के लिए हो सकती है ताकि इसकी ईंधन खपत को कम किया जा सके, यह देखते हुए कि इसे एक निश्चित समय में पूरा करना होगा बिना कुछ राशि से अधिक बढाए। फिर भी एक और संबंधित नियंत्रण समस्या यात्रा को पूरा करने की कुल मौद्रिक लागत को कम करने के लिए हो सकती है, समय और ईंधन के लिए अनुमानित मौद्रिक कीमतों को देखते हुए।

एक अधिक सार रूपरेखा इस प्रकार है।[1] निरंतर-समय की लागत कार्यात्मक को कम करें

प्रथम-क्रम गतिशील बाधाओं (राज्य समीकरण) के अधीन
बीजगणितीय पथ बाधाएँ
और सीमा शर्तें
जहाँ पर अवस्था है, नियंत्रण है, स्वतंत्र चर है (सामान्यतः बोलना, समय), प्रारंभिक समय है, और टर्मिनल समय है। शर्तें तथा क्रमशः एंडपॉइंट कॉस्ट और रनिंग कॉस्ट कहलाते हैं। भिन्नों की गणना में, तथा क्रमशः मेयर शब्द और लैग्रेंज गुणक के रूप में जाना जाता है। इसके अतिरिक्त, यह नोट किया गया है कि पथ बाधाएँ सामान्य असमानता बाधाओं में हैं और इस प्रकार इष्टतम समाधान पर सक्रिय ( अर्थात् , शून्य के बराबर) नहीं हो सकती हैं। यह भी नोट किया गया है कि जैसा कि ऊपर कहा गया है, इष्टतम नियंत्रण समस्या के कई समाधान हो सकते हैं (अर्थात, समाधान अद्वितीय नहीं हो सकता है)। इस प्रकार, यह सबसे अधिक बार होता है कि कोई भी समाधान इष्टतम नियंत्रण समस्या स्थानीय रूप से कम हो रही है।

रैखिक द्विघात नियंत्रण

पिछले खंड में दी गई सामान्य गैर-रैखिक इष्टतम नियंत्रण समस्या का एक विशेष मामला रैखिक-द्विघात नियामक | रैखिक द्विघात (LQ) इष्टतम नियंत्रण समस्या है। LQ समस्या इस प्रकार बताई गई है। द्विघात निरंतर-समय लागत कार्यात्मक को कम करें

रैखिक प्रथम-क्रम गतिशील बाधाओं के अधीन
और प्रारंभिक स्थिति
कई नियंत्रण प्रणाली की समस्याओं में उत्पन्न होने वाली LQ समस्या का एक विशेष रूप रैखिक द्विघात नियामक (LQR) है, जहाँ सभी आव्यूह ( अर्थात् , , , , तथा ) स्थिर हैं, प्रारंभिक समय मनमाने ढंग से शून्य पर समुच्चय है, और अवसानक समय सीमा में लिया जाता है (यह अंतिम धारणा अनंत क्षितिज के रूप में जानी जाती है)। LQR समस्या इस प्रकार बताई गई है। अनंत क्षितिज द्विघात निरंतर-समय लागत कार्यात्मक को कम करें
रैखिक समय-अपरिवर्तनीय प्रथम-क्रम गतिशील बाधाओं के अधीन
और प्रारंभिक स्थिति
परिमित-क्षितिज प्रकर्ण में आव्यूह उसमें प्रतिबंधित हैं तथा क्रमशः सकारात्मक अर्ध-निश्चित और सकारात्मक निश्चित हैं। तथापि, अनंत-क्षितिज प्रकर्ण में, आव्यूह (गणित) तथा न केवल सकारात्मक-अर्द्ध-निश्चित और सकारात्मक-निश्चित हैं, वस्तुतः स्थिर भी हैं। इन अतिरिक्त प्रतिबंधों पर तथा अनंत-क्षितिजप्रकर्ण में यह सुनिश्चित करने के लिए लागू किया जाता है कि लागत कार्यात्मक सकारात्मक बनी रहे। इसके अतिरिक्त, यह सुनिश्चित करने के लिए कि लागत प्रकार्य सीमित है, जोड़ी पर अतिरिक्त प्रतिबंध लगाया जाता है जो कि नियंत्रणीय है। ध्यान दें कि LQ या LQR लागत कार्यात्मक को भौतिक रूप से नियंत्रण ऊर्जा को कम करने के प्रयास के रूप में सोचा जा सकता है (द्विघात रूप में मापा जाता है)।

अनंत क्षितिज समस्या ( अर्थात्, LQR) अत्यधिक प्रतिबंधात्मक और अनिवार्य रूप से व्यर्थ लग सकती है क्योंकि यह मानती है कि संचालक प्रणाली को शून्य-स्थिति में चला रहा है और इसलिए प्रणाली के प्रक्षेपण को शून्य पर चला रहा है। यह वास्तव में सही है। हालाँकि प्रक्षेपण को एक वांछित अशून्य स्तर पर ले जाने की समस्या को शून्य प्रक्षेपण एक के बाद हल किया जा सकता है। वस्तुत:, यह साबित किया जा सकता है कि इस द्वितीयक LQR समस्या को बहुत ही सरल तरीके से हल किया जा सकता है। शास्त्रीय इष्टतम नियंत्रण सिद्धांत में यह दिखाया गया है कि LQ (या LQR) इष्टतम नियंत्रण में प्रतिपुष्टि स्वरुप है।

जहाँ पे एक उचित रूप से आयामित आव्यूह है, जैसा दिया गया है
तथा अवकल रिकाटी समीकरण का हल है। अंतर रिकाटी समीकरण के रूप में दिया गया है
परिमित क्षितिज LQ समस्या के लिए, रिकाटी समीकरण को अंतस्थ सीमा की स्थिति का उपयोग करते हुए समय में पीछे की ओर एकीकृत किया जाता है
अनंत क्षितिज LQR समस्या के लिए, अंतर रिकाटी समीकरण को बीजगणितीय रिकाटी समीकरण (ARE) के साथ बदल दिया गया है
यह समझना कि ARE अनंत क्षितिज समस्या, मैट्रिसेस से उत्पन्न होता है , , , तथा सभी स्थिर हैं। यह ध्यान दिया जाता है कि बीजगणितीय रिकाटी समीकरण के सामान्य रूप से कई समाधान हैं और सकारात्मक निश्चित (या सकारात्मक अर्ध-निश्चित) समाधान वह है जिसका उपयोग प्रतिक्रिया लाभ की गणना करने के लिए किया जाता है। LQ(LQR) समस्या को रूडोल्फ ई. काल्मन द्वारा सुरुचिपूर्ण ढंग से हल किया गया था।[9]

इष्टतम नियंत्रण के लिए संख्यात्मक तरीके

इष्टतम नियंत्रण समस्याएं सामान्यतः अरैखिक होती हैं और इसलिए, सामान्यतः विश्लेषणात्मक समाधान नहीं होते हैं (उदाहरण के लिए, रैखिक-द्विघात इष्टतम नियंत्रण समस्या की तरह)। नतीजतन, इष्टतम नियंत्रण समस्याओं को हल करने के लिए संख्यात्मक तरीकों को नियोजित करना आवश्यक है। इष्टतम नियंत्रण के प्रारंभिक वर्षों में (c. 1950 से 1980 के दशक) इष्टतम नियंत्रण समस्याओं को हल करने के लिए इष्ट दृष्टिकोण अप्रत्यक्ष तरीकों का था। अप्रत्यक्ष विधि में, पहले क्रम की अनुकूलता की स्थिति प्राप्त करने के लिए विविधताओं की गणना को नियोजित किया जाता है। इन स्थितियों के परिणामस्वरूप दो-बिंदु (या, एक जटिल समस्या केप्रकर्ण में, एक बहु-बिंदु) सीमा-मान समस्या होती है। इस सीमा-मूल्य समस्या की वास्तव में एक विशेष संरचना है क्योंकि यह हैमिल्टनियन (नियंत्रण सिद्धांत) के व्युत्पन्न लेने से उत्पन्न होती है। इस प्रकार, परिणामी गतिकीय प्रणाली रूप की हैमिल्टनियन प्रणाली है[1]

जहाँ पर
संवर्धित हैमिल्टनियन है और अप्रत्यक्ष विधि में, सीमा-मूल्य समस्या हल हो जाती है (उपयुक्त सीमा या ट्रांसवर्सलिटी स्थितियों का उपयोग करके)। एक अप्रत्यक्ष विधि का उपयोग करने की सुंदरता यह है कि स्थिति और आसन्न (अर्थात् , ) के लिए हल किया जाता है और परिणामी समाधान एक चरम प्रक्षेपवक्र होने के लिए आसानी से सत्यापित होता है। अप्रत्यक्ष तरीकों का नुकसान यह है कि सीमा-मूल्य समस्या को हल करना प्राय: बेहद मुश्किल होता है (विशेष रूप से उन समस्याओं के लिए जो बड़े समय के अंतराल या आंतरिक बिंदु बाधाओं के साथ समस्याओं को फैलाते हैं)। एक प्रसिद्ध प्रक्रिया योजना जो अप्रत्यक्ष तरीकों को लागू करता है, वह है BNDSCO।[10]

1980 के दशक से जो दृष्टिकोण संख्यात्मक इष्टतम नियंत्रण में प्रमुखता से बढ़ा है, वह तथाकथित प्रत्यक्ष तरीकों का है। एक प्रत्यक्ष विधि में, स्थिति या नियंत्रण, या दोनों, एक उपयुक्त प्रकार्य सन्निकटन (जैसे, बहुपद सन्निकटन या टुकड़े-टुकड़े स्थिर मापदण्ड) का उपयोग करके अनुमानित किए जाते हैं। इसके साथ ही, लागत कार्यात्मक लागत प्रकार्य के रूप में अनुमानित है। फिर, प्रकार्य सन्निकटन के गुणांक को इष्टमीकरण चर के रूप में माना जाता है और समस्या को प्ररूप की एक गैर-रैखिक अनुकूलन समस्या में स्थानांतरित किया जाता है:


न्यूनतमीकरण

बीजगणितीय बाधाओं के अधीन
नियोजित प्रत्यक्ष विधि के प्रकार के आधार पर, गैर-रैखिक अनुकूलन समस्या का आकार काफी छोटा हो सकता है (उदाहरण के लिए, प्रत्यक्ष आखेट या क्वासिलिनेराइजेशन विधि में), औसत (उदाहरण के लिए स्यूडोस्पेक्ट्रल इष्टतम नियंत्रण)[11]) या काफी बड़ा हो सकता है (उदाहरण के लिए, एक प्रत्यक्ष सहस्थापन विधि[12]) बाद के प्रकर्ण में ( अर्थात् , एक सहस्थापन विधि), गैर-रैखिक अनुकूलन समस्या का शाब्दिक रूप से हजारों से दसियों हजारों चर और बाधाएं हो सकती हैं। प्रत्यक्ष विधि से उत्पन्न होने वाले कई NLP के आकार को देखते हुए, यह कुछ हद तक प्रति-सहज लग सकता है कि सीमा-मूल्य समस्या को हल करने की तुलना में गैर-रैखिक अनुकूलन समस्या को हल करना आसान है। हालांकि, यह तथ्य है कि सीमा-मूल्य समस्या की तुलना में NLP को हल करना आसान है। संगणना की सापेक्ष आसानी का कारण, विशेष रूप से प्रत्यक्ष सह-स्थापन विधि, यह है कि NLP विरल है और कई प्रसिद्ध प्रक्रिया सामग्री कार्यक्रम मौजूद हैं (उदाहरण के लिए, SNOPT[13]) बड़े विरल NLP को हल करने के लिए। नतीजतन, समस्याओं की सीमा जो प्रत्यक्ष विधियों के माध्यम से हल की जा सकती है (विशेष रूप से प्रत्यक्ष सहस्थापन विधियाँ जो इन दिनों बहुत लोकप्रिय हैं) उन समस्याओं की सीमा से काफी बड़ी हैं जिन्हें अप्रत्यक्ष तरीकों से हल किया जा सकता है। वास्तव में, प्रत्यक्ष विधियाँ इन दिनों इतनी लोकप्रिय हो गई हैं कि बहुत से लोगों ने विस्तृत प्रक्रिया सामग्री कार्यक्रम लिखे हैं जो इन विधियों को नियोजित करते हैं। विशेष रूप से ऐसे कई कार्यक्रमों में DIRCOL,[14] SOCS,[15] OTIS,[16] GESOP/ASTOS,[17] DITAN।[18] और PyGMO/PyKEP।[19] नवागत वर्षों में, MATLAB कार्यरचना भाषा के आगमन के कारण, MATLAB में इष्टतम नियंत्रण प्रक्रिया सामग्री अधिक सामान्य हो गया है। शैक्षिक रूप से विकसित MATLAB यंत्रेतर सामग्री साधन के उदाहरणों में प्रत्यक्ष तरीकों को लागू करने में अन्तर्वलित हैं, RIOTS,[20] DIDO,[21] DIRECT,[22] FALCON.m,[23] और GPOPS,[24] चूँकि एक उद्योग विकसित MATLAB उपकरण का एक उदाहरण PROPT है।[25] इन प्रक्रिया सामग्री कलपुर्जे ने शैक्षणिक अनुसंधान और औद्योगिक समस्याओं दोनों के लिए जटिल इष्टतम नियंत्रण समस्याओं का पता लगाने के लिए लोगों के अवसर में काफी वृद्धि की है।[26] अंत में, यह नोट किया गया है कि सामान्य-उद्देश्य MATLAB अनुकूलन वातावरण जैसे TOMLAB ने कूटलेखन जटिल इष्टतम नियंत्रण समस्याओं को C और FORTRAN जैसी भाषाओं में पहले की तुलना में काफी आसान बना दिया है।

असतत-समय इष्टतम नियंत्रण

इस प्रकार अब तक के उदाहरणों ने निरंतर समय प्रणाली और नियंत्रण समाधान दिखाए हैं। वस्तुत:, इष्टतम नियंत्रण समाधान के रूप में अब प्राय: डिजिटली लागू किया जाता है, समकालीन नियंत्रण सिद्धांत अब मुख्य रूप से पृथक समय प्रणालियों और समाधानों से संबंधित है। संगत सन्निकटन का सिद्धांत[27][28] ऐसी स्थितियाँ प्रदान करता है जिसके अंतर्गत तेजी से सटीक विखंडित इष्टतम नियंत्रण समस्या की एक श्रृंखला के समाधान मूल, निरंतर-समय की समस्या के समाधान में परिवर्तित हो जाते हैं। विवेकाधिकार के सभी तरीकों में स्पष्ट रूप से भी यह गुण नहीं होता है।[29] उदाहरण के लिए, समस्या के गतिशील समीकरणों को एकीकृत करने के लिए एक चर चरण-आकार की दिनचर्या का उपयोग करने से एक अनुप्रवण उत्पन्न हो सकता है जो समाधान के संपर्क में आने पर शून्य (या सही दिशा में इंगित) में परिवर्तित नहीं होता है। प्रत्यक्ष विधि RIOTS संगत सन्निकटन के सिद्धांत पर आधारित है।

उदाहरण

कई इष्टतम नियंत्रण समस्याओं में एक सामान्य समाधान रणनीति लागत के लिए हल करना है (कभी-कभी छाया मूल्य कहा जाता है)। पर्शुरेखित एक संख्या में स्तिथि चर के अगले मोड़ के विस्तार या अनुबंध के सीमांत मूल्य को संक्षेप में प्रस्तुत करता है। सीमांत मूल्य न केवल अगले मोड़ पर अर्जित लाभ है वस्तुतः कार्यक्रम की अवधि से जुड़ा है। यह अच्छा है जब विश्लेषणात्मक रूप से हल किया जा सकता है, लेकिन सामान्यतः, सबसे अधिक यह किया जा सकता है कि यह पर्याप्त रूप से अच्छी तरह से वर्णन करता है कि अंतर्ज्ञान समाधान के चरित्र को समझ सकता है और एक समीकरण समाधानकर्ता मूल्यों के लिए संख्यात्मक रूप से हल कर सकता है।

अभिप्राप्त , नियंत्रण के लिए पंक्ति-t इष्टतम मूल्य को सामान्यतः ज्ञान के आधार पर अंतर समीकरण के रूप में हल किया जा सकता है। फिर से यह विरल होता है, विशेष रूप से निरंतर-समय की समस्याओं में, यह नियंत्रण या राज्य के मूल्य को स्पष्ट रूप से प्राप्त करता है। सामान्यतः, रणनीति प्रभावसीमा और क्षेत्रों के लिए हल करना है जो इष्टतम नियंत्रण की विशेषता है और समय में वास्तविक पसंद मूल्यों को अलग करने के लिए एक संख्यात्मक समाधानकर्ता का उपयोग करते हैं।

परिमित समय

एक खदान मालिक की समस्या पर विचार करें, जिसे यह तय करना होगा कि उनकी खदान से किस दर पर अयस्क निकाला जाए। अयस्क पर उनका अधिकार तारीख से तक है. तिथि पर वहाँ जमीन में अयस्क है, और अयस्क की समय-निर्भर मात्रा खदान मालिक इसे निकालता है तो जमीन में छोड़े जाने की दर से गिरावट आती है। खदान मालिक लागत पर अयस्क निकालता है (निष्कर्षण की लागत वर्ग के साथ निष्कर्षण की गति और बचे हुए अयस्क की मात्रा के व्युत्क्रम के साथ बढ़ती है) और अयस्क को एक स्थिर मूल्य पर बेचता है . समय पर जमीन में छोड़ा गया कोई अयस्क बेचा नहीं जा सकता है और इसका कोई मूल्य नहीं है (कोई क्षेप्य मूल्य नहीं है)। मालिक स्वामित्व की अवधि में बिना किसी छूट के लाभ को अधिकतम करने के लिए समय के साथ अलग-अलग निकासी की दर चुनता है

  1. पृथक- समय वृतान्त

    प्रबंधक लाभ को अधिकतम करता है :

    दशा चर के लिए गति के कानून के अधीन

    हैमिल्टनियन का निर्माण करें और अंतर करें:

    चूंकि खदान मालिक समय पर बचे हुए अयस्क को महत्व नहीं देता है,

    उपरोक्त समीकरणों का उपयोग करके,इस शृंखला को हल करना आसान है और प्रारंभिक और टर्न-t स्थितियों का उपयोग करते हुए,

    श्रंखला को स्पष्ट रूप से दे कर हल किया जा सकता है
  2. निरंतर-समय संस्करण

    प्रबंधक लाभ को अधिकतम करता है :

    जहां राज्य चर निम्नानुसार विकसित होता है:
    हैमिल्टनियन का निर्माण करें और अंतर करें:
    चूंकि खदान मालिक समय पर बचे हुए अयस्क को महत्व नहीं देता है ,
    उपरोक्त समीकरणों का उपयोग करके, नियंत्रित करने वाले अंतर समीकरणों को हल करना आसान है तथा
    और प्रारंभिक और टर्न-टी शर्तों का उपयोग करके, कार्यों को उपज के लिए हल किया जा सकता है

यह भी देखें

संदर्भ

  1. 1.0 1.1 1.2 1.3 Ross, Isaac (2015). इष्टतम नियंत्रण में पोंट्रीगिन के सिद्धांत पर एक प्राइमर. San Francisco: Collegiate Publishers. ISBN 978-0-9843571-0-9. OCLC 625106088.
  2. Luenberger, David G. (1979). "Optimal Control". डायनेमिक सिस्टम का परिचय. New York: John Wiley & Sons. pp. 393–435. ISBN 0-471-02594-1.
  3. Kamien, Morton I. (2013). डायनेमिक ऑप्टिमाइजेशन: द कैलकुलस ऑफ वैरिएशन एंड ऑप्टिमल कंट्रोल इन इकोनॉमिक्स एंड मैनेजमेंट. Dover Publications. ISBN 978-1-306-39299-0. OCLC 869522905.
  4. Ross, I. M.; Proulx, R. J.; Karpenko, M. (2020-05-06). "ट्रैवलिंग सेल्समैन प्रॉब्लम और इसके प्रकारों के लिए एक इष्टतम नियंत्रण सिद्धांत". arXiv:2005.03186 [math.OC].
  5. Ross, Isaac M.; Karpenko, Mark; Proulx, Ronald J. (2016-01-01). "कुछ ग्राफ़-सैद्धांतिक नियंत्रण समस्याओं को हल करने के लिए एक गैर-चिकनी कलन ** यह शोध यू.एस. नौसेना द्वारा प्रायोजित किया गया था।". IFAC-PapersOnLine. 10th IFAC Symposium on Nonlinear Control Systems NOLCOS 2016 (in English). 49 (18): 462–467. doi:10.1016/j.ifacol.2016.10.208. ISSN 2405-8963.
  6. Sargent, R. W. H. (2000). "इष्टतम नियंत्रण". Journal of Computational and Applied Mathematics. 124 (1–2): 361–371. Bibcode:2000JCoAM.124..361S. doi:10.1016/S0377-0427(00)00418-0.
  7. Bryson, A. E. (1996). "इष्टतम नियंत्रण - 1950 से 1985". IEEE Control Systems Magazine. 16 (3): 26–33. doi:10.1109/37.506395.
  8. Ross, I. M. (2009). इष्टतम नियंत्रण में पोंट्रीगिन के सिद्धांत पर एक प्राइमर. Collegiate Publishers. ISBN 978-0-9843571-0-9.
  9. Kalman, Rudolf. A new approach to linear filtering and prediction problems. Transactions of the ASME, Journal of Basic Engineering, 82:34–45, 1960
  10. Oberle, H. J. and Grimm, W., "BNDSCO-A Program for the Numerical Solution of Optimal Control Problems," Institute for Flight Systems Dynamics, DLR, Oberpfaffenhofen, 1989
  11. Ross, I. M.; Karpenko, M. (2012). "स्यूडोस्पेक्ट्रल इष्टतम नियंत्रण की समीक्षा: सिद्धांत से उड़ान तक". Annual Reviews in Control. 36 (2): 182–197. doi:10.1016/j.arcontrol.2012.09.002.
  12. Betts, J. T. (2010). गैर-रैखिक प्रोग्रामिंग का उपयोग करके इष्टतम नियंत्रण के लिए व्यावहारिक तरीके (2nd ed.). Philadelphia, Pennsylvania: SIAM Press. ISBN 978-0-89871-688-7.
  13. Gill, P. E., Murray, W. M., and Saunders, M. A., User's Manual for SNOPT Version 7: Software for Large-Scale Nonlinear Programming, University of California, San Diego Report, 24 April 2007
  14. von Stryk, O., User's Guide for DIRCOL (version 2.1): A Direct Collocation Method for the Numerical Solution of Optimal Control Problems, Fachgebiet Simulation und Systemoptimierung (SIM), Technische Universität Darmstadt (2000, Version of November 1999).
  15. Betts, J.T. and Huffman, W. P., Sparse Optimal Control Software, SOCS, Boeing Information and Support Services, Seattle, Washington, July 1997
  16. Hargraves, C. R.; Paris, S. W. (1987). "नॉनलाइनियर प्रोग्रामिंग और कोलोकेशन का उपयोग करके डायरेक्ट ट्रैजेक्टरी ऑप्टिमाइजेशन". Journal of Guidance, Control, and Dynamics. 10 (4): 338–342. Bibcode:1987JGCD...10..338H. doi:10.2514/3.20223.
  17. Gath, P.F., Well, K.H., "Trajectory Optimization Using a Combination of Direct Multiple Shooting and Collocation", AIAA 2001–4047, AIAA Guidance, Navigation, and Control Conference, Montréal, Québec, Canada, 6–9 August 2001
  18. Vasile M., Bernelli-Zazzera F., Fornasari N., Masarati P., "Design of Interplanetary and Lunar Missions Combining Low-Thrust and Gravity Assists", Final Report of the ESA/ESOC Study Contract No. 14126/00/D/CS, September 2002
  19. Izzo, Dario. "PyGMO and PyKEP: open source tools for massively parallel optimization in astrodynamics (the case of interplanetary trajectory optimization)." Proceed. Fifth International Conf. Astrodynam. Tools and Techniques, ICATT. 2012.
  20. RIOTS Archived 16 July 2011 at the Wayback Machine, based on Schwartz, Adam (1996). Theory and Implementation of Methods based on Runge–Kutta Integration for Solving Optimal Control Problems (Ph.D.). University of California at Berkeley. OCLC 35140322.
  21. Ross, I. M., Enhancements to the DIDO Optimal Control Toolbox, arXiv 2020. https://arxiv.org/abs/2004.13112
  22. Williams, P., User's Guide to DIRECT, Version 2.00, Melbourne, Australia, 2008
  23. FALCON.m, described in Rieck, M., Bittner, M., Grüter, B., Diepolder, J., and Piprek, P., FALCON.m - User Guide, Institute of Flight System Dynamics, Technical University of Munich, October 2019
  24. GPOPS Archived 24 July 2011 at the Wayback Machine, described in Rao, A. V., Benson, D. A., Huntington, G. T., Francolin, C., Darby, C. L., and Patterson, M. A., User's Manual for GPOPS: A MATLAB Package for Dynamic Optimization Using the Gauss Pseudospectral Method, University of Florida Report, August 2008.
  25. Rutquist, P. and Edvall, M. M, PROPT – MATLAB Optimal Control Software," 1260 S.E. Bishop Blvd Ste E, Pullman, WA 99163, USA: Tomlab Optimization, Inc.
  26. I.M. Ross, Computational Optimal Control, 3rd Workshop in Computational Issues in Nonlinear Control, October 8th, 2019, Monterey, CA
  27. E. Polak, On the use of consistent approximations in the solution of semi-infinite optimization and optimal control problems Math. Prog. 62 pp. 385–415 (1993).
  28. Ross, I M. (2005-12-01). "इष्टतम नियंत्रण के लिए एक रोडमैप: यात्रा करने का सही तरीका". Annals of the New York Academy of Sciences. 1065 (1): 210–231. Bibcode:2005NYASA1065..210R. doi:10.1196/annals.1370.015. ISSN 0077-8923. PMID 16510411. S2CID 7625851.
  29. Fahroo, Fariba; Ross, I. Michael (September 2008). "कॉस्टेट्स के अभिसरण का मतलब नियंत्रण का अभिसरण नहीं है". Journal of Guidance, Control, and Dynamics. 31 (5): 1492–1497. Bibcode:2008JGCD...31.1492F. doi:10.2514/1.37331. ISSN 0731-5090. S2CID 756939.

अग्रिम पठन

बाहरी संबंध