रैखिक-द्विघात-गाऊसी नियंत्रण: Difference between revisions

From Vigyanwiki
(Created page with "{{Short description|Linear optimal control technique}} नियंत्रण सिद्धांत में, रैखिक-द्विघात-गाऊसी (...")
 
(TEXT)
Line 1: Line 1:
{{Short description|Linear optimal control technique}}
{{Short description|Linear optimal control technique}}
[[नियंत्रण सिद्धांत]] में, रैखिक-द्विघात-गाऊसी (LQG) नियंत्रण समस्या सबसे मौलिक [[इष्टतम नियंत्रण]] समस्याओं में से एक है, और इसे [[मॉडल पूर्वानुमान नियंत्रण]] के लिए बार-बार संचालित भी किया जा सकता है। यह योगात्मक सफेद गॉसियन शोर द्वारा संचालित रैखिक प्रणालियों से संबंधित है। समस्या एक आउटपुट फीडबैक कानून निर्धारित करना है जो द्विघात [[लागत कार्यात्मक]] मानदंड के अपेक्षित मूल्य को कम करने के अर्थ में इष्टतम है। आउटपुट माप को गॉसियन शोर से दूषित माना जाता है और प्रारंभिक स्थिति को भी गॉसियन यादृच्छिक वेक्टर माना जाता है।
[[नियंत्रण सिद्धांत]] में, '''रैखिक-द्विघात-गाऊसी (एलक्यूजी) नियंत्रण''' समस्या सबसे मौलिक [[इष्टतम नियंत्रण]] समस्याओं में से एक है, और इसे [[मॉडल पूर्वानुमान नियंत्रण|प्रतिरूप पूर्वानुमान नियंत्रण]] के लिए बार-बार संचालित भी किया जा सकता है। यह योगात्मक सफेद गॉसियन नॉइज़ द्वारा संचालित रैखिक प्रणालियों से संबंधित है। समस्या एक निष्पाद प्रतिपुष्टि कानून निर्धारित करना है जो द्विघात [[लागत कार्यात्मक]] मानदंड के अपेक्षित मूल्य को कम करने के अर्थ में इष्टतम है। निष्पाद माप को गॉसियन नॉइज़ से दूषित माना जाता है और प्रारंभिक स्थिति को भी गॉसियन यादृच्छिक सदिश माना जाता है।


इन मान्यताओं के तहत रैखिक नियंत्रण कानूनों के वर्ग के भीतर एक इष्टतम नियंत्रण योजना पूर्ण-वर्ग तर्क द्वारा प्राप्त की जा सकती है।<ref name="astrom">{{cite book |author=Karl Johan Astrom |title=स्टोकेस्टिक नियंत्रण के सिद्धांत का परिचय|publisher=Academic Press |volume=58 |year=1970 |isbn=0-486-44531-3}}</ref> यह नियंत्रण कानून जिसे एलक्यूजी नियंत्रक के रूप में जाना जाता है, अद्वितीय है और यह केवल एक [[कलमन फ़िल्टर]] (एक रैखिक-द्विघात राज्य अनुमानक (एलक्यूई)) के साथ एक रैखिक-द्विघात नियामक | रैखिक-द्विघात नियामक (एलक्यूआर) का एक संयोजन है। [[पृथक्करण सिद्धांत]] बताता है कि राज्य अनुमानक और राज्य फीडबैक को स्वतंत्र रूप से डिज़ाइन किया जा सकता है। एलक्यूजी नियंत्रण एलटीआई प्रणालियों | रैखिक समय-अपरिवर्तनीय प्रणालियों के साथ-साथ समय-संस्करण प्रणाली | रैखिक समय-परिवर्तनीय प्रणालियों दोनों पर लागू होता है, और एक रैखिक गतिशील प्रतिक्रिया नियंत्रण कानून का गठन करता है जिसे आसानी से गणना और कार्यान्वित किया जाता है: एलक्यूजी नियंत्रक स्वयं एक गतिशील प्रणाली है उस प्रणाली की तरह जिसे वह नियंत्रित करता है। दोनों प्रणालियों का राज्य आयाम समान है।
इन मान्यताओं के अंतर्गत रैखिक नियंत्रण कानूनों के वर्ग के भीतर एक इष्टतम नियंत्रण योजना पूर्ण-वर्ग तर्क द्वारा प्राप्त की जा सकती है। <ref name="astrom">{{cite book |author=Karl Johan Astrom |title=स्टोकेस्टिक नियंत्रण के सिद्धांत का परिचय|publisher=Academic Press |volume=58 |year=1970 |isbn=0-486-44531-3}}</ref> यह नियंत्रण कानून जिसे एलक्यूजी नियंत्रक के रूप में जाना जाता है, वह अद्वितीय है और यह केवल एक [[कलमन फ़िल्टर|कलमन निस्यंदक]] (एक रैखिक-द्विघात स्तिथि अनुमानक (एलक्यूई)) के साथ एक रैखिक-द्विघात नियामक (एलक्यूआर) का एक संयोजन है। [[पृथक्करण सिद्धांत]] बताता है कि स्तिथि अनुमानक और स्तिथि प्रतिपुष्टि को स्वतंत्र रूप से अभिकल्पित किया जा सकता है। एलक्यूजी रैखिक समय-अपरिवर्तनीय प्रणालियों के साथ-साथ समय-संस्करण प्रणाली दोनों पर लागू होता है, और एक रैखिक गतिशील प्रतिक्रिया नियंत्रण कानून का गठन करता है जिसे आसानी से गणना और कार्यान्वित किया जाता है: एलक्यूजी नियंत्रक स्वयं एक गतिशील प्रणाली है उस प्रणाली की तरह जिसे वह नियंत्रित करता है। दोनों प्रणालियों का स्तिथि आयाम समान है।


पृथक्करण सिद्धांत का एक गहरा कथन यह है कि एलक्यूजी नियंत्रक संभवतः गैर-रेखीय नियंत्रकों की एक विस्तृत श्रेणी में अभी भी इष्टतम है। अर्थात्, एक अरेखीय नियंत्रण योजना का उपयोग करने से लागत फ़ंक्शन के अपेक्षित मूल्य में सुधार नहीं होगा। पृथक्करण सिद्धांत का यह संस्करण [[स्टोकेस्टिक नियंत्रण में पृथक्करण सिद्धांत]] का एक विशेष मामला है जो बताता है कि भले ही प्रक्रिया और आउटपुट शोर स्रोत संभवतः गैर-गाऊसी [[मार्टिंगेल (संभावना सिद्धांत)]] हों, जब तक कि सिस्टम की गतिशीलता रैखिक होती है, इष्टतम नियंत्रण एक इष्टतम स्थिति अनुमानक (जो अब कलमैन फ़िल्टर नहीं हो सकता है) और एक एलक्यूआर नियामक में अलग हो जाता है।<ref name="lindquist">{{cite journal |author=Anders Lindquist|title=लीनियर स्टोकेस्टिक सिस्टम के फीडबैक नियंत्रण पर|journal=SIAM Journal on Control |volume=11  |issue=2 |pages=323–343 |year=1973|doi=10.1137/0311025 }}.</ref><ref name="GL2013">{{cite journal |author=Tryphon T. Georgiou and Anders Lindquist |title=स्टोकेस्टिक नियंत्रण में पृथक्करण सिद्धांत, रिडक्स|journal=IEEE Transactions on Automatic Control |volume=58 |issue=10 |pages=2481–2494 |year=2013 |doi=10.1109/TAC.2013.2259207|arxiv=1103.3005 |s2cid=12623187 }}</ref>
पृथक्करण सिद्धांत का एक गहरा कथन यह है कि एलक्यूजी नियंत्रक संभवतः गैर-रेखीय नियंत्रकों की एक विस्तृत श्रेणी में अभी भी इष्टतम है। अर्थात्, एक अरेखीय नियंत्रण योजना का उपयोग करने से लागत फलन के अपेक्षित मूल्य में सुधार नहीं होगा। पृथक्करण सिद्धांत का यह संस्करण [[स्टोकेस्टिक नियंत्रण में पृथक्करण सिद्धांत|प्रसंभाव्य नियंत्रण में पृथक्करण सिद्धांत]] की एक विशेष स्तिथि है जो बताता है कि भले ही प्रक्रिया और निष्पाद नॉइज़ स्रोत संभवतः गैर-गाऊसी [[मार्टिंगेल (संभावना सिद्धांत)]] हों, जब तक कि प्रणाली की गतिशीलता रैखिक होती है, इष्टतम नियंत्रण एक इष्टतम स्थिति अनुमानक (जो अब कलमैन निस्यंदक नहीं हो सकता है) और एक एलक्यूआर नियामक में अलग हो जाता है। <ref name="lindquist">{{cite journal |author=Anders Lindquist|title=लीनियर स्टोकेस्टिक सिस्टम के फीडबैक नियंत्रण पर|journal=SIAM Journal on Control |volume=11  |issue=2 |pages=323–343 |year=1973|doi=10.1137/0311025 }}.</ref><ref name="GL2013">{{cite journal |author=Tryphon T. Georgiou and Anders Lindquist |title=स्टोकेस्टिक नियंत्रण में पृथक्करण सिद्धांत, रिडक्स|journal=IEEE Transactions on Automatic Control |volume=58 |issue=10 |pages=2481–2494 |year=2013 |doi=10.1109/TAC.2013.2259207|arxiv=1103.3005 |s2cid=12623187 }}</ref>
शास्त्रीय एलक्यूजी सेटिंग में, सिस्टम स्थिति का आयाम बड़ा होने पर एलक्यूजी नियंत्रक का कार्यान्वयन समस्याग्रस्त हो सकता है। कम-क्रम वाली LQG समस्या (निश्चित-क्रम LQG समस्या) LQG नियंत्रक के राज्यों की संख्या ''प्राथमिकता'' को ठीक करके इस पर काबू पाती है। इस समस्या को हल करना अधिक कठिन है क्योंकि इसे अब अलग नहीं किया जा सकता है। साथ ही, समाधान अब अद्वितीय नहीं रहा. इन तथ्यों के बावजूद संख्यात्मक एल्गोरिदम उपलब्ध हैं<ref name="Wil1">{{cite journal |author1=Van Willigenburg L.G. |author2=De Koning W.L. |title=संख्यात्मक एल्गोरिदम और असतत-समय इष्टतम प्रक्षेपण समीकरणों से संबंधित मुद्दे|journal=European Journal of Control |volume=6 |issue=1 |pages=93–100 |year=2000 |doi=10.1016/s0947-3580(00)70917-4}} [http://www.mathworks.com/matlabcentral/fileexchange/loadFile.do?objectId=19948&objectType=file  Associated software download from Matlab Central].</ref><ref name="Wil2">{{cite journal |author1=Van Willigenburg L.G. |author2=De Koning W.L. |title=नियतात्मक और सफेद मापदंडों के साथ समय-अलग-अलग असतत-समय प्रणालियों के लिए इष्टतम कम-ऑर्डर कम्पेसाटर|journal=Automatica |volume=35 |pages=129–138 |year=1999 |doi=10.1016/S0005-1098(98)00138-1}} [http://www.mathworks.com/matlabcentral/fileexchange/loadFile.do?objectId=20014&objectType=FILE  Associated software download from Matlab Central].</ref><ref name="Bern3">{{cite journal |author1=Zigic D. |author2=Watson L.T. |author3=Collins E.G. |author4=Haddad W.M. |author5=Ying S. |title=Homotopy methods for solving the optimal projection equations for the H2 reduced order model problem |journal=International Journal of Control |volume=56 | issue=1 | pages=173–191 |year=1996 |doi=10.1080/00207179208934308}}</ref><ref name="Had1">{{cite journal |author1=Collins Jr. E.G |author2=Haddad W.M. |author3=Ying S. |title=हाइलैंड-बर्नस्टीन इष्टतम प्रक्षेपण समीकरणों का उपयोग करके कम-ऑर्डर गतिशील मुआवजे के लिए एक होमोटॉपी एल्गोरिदम|journal=Journal of Guidance, Control, and Dynamics |volume=19 |pages=407–417 |year=1996 |doi=10.2514/3.21633 |issue=2}}</ref> संबंधित [[इष्टतम प्रक्षेपण समीकरण]]ों को हल करने के लिए<ref name="Bern1">{{cite journal |author1=Hyland D.C |author2=Bernstein D.S. |title=निश्चित क्रम गतिशील मुआवजे के लिए इष्टतम प्रक्षेपण समीकरण|journal=IEEE Transactions on Automatic Control |volume=AC-29 | pages=1034–1037 |year=1984 |doi=10.1109/TAC.1984.1103418 |issue=11|url=https://deepblue.lib.umich.edu/bitstream/2027.42/57875/1/OptimalProjectionRedOrdDynCompTAC1984.pdf |hdl=2027.42/57875 |hdl-access=free }}</ref><ref name="Bern2">{{cite journal |author1=Bernstein D.S. |author2=Davis L.D. |author3=Hyland D.C. |title=कम-क्रम वाले असतत-समय मॉडलिंग अनुमान और नियंत्रण के लिए इष्टतम प्रक्षेपण समीकरण|journal=Journal of Guidance, Control, and Dynamics| volume=9 |issue=3 |pages=288–293 |year=1986 |doi=10.2514/3.20105|url=https://deepblue.lib.umich.edu/bitstream/2027.42/57880/1/DTReduced-OrderDiscrete-TimeModelingEstimationandControl.pdf |bibcode=1986JGCD....9..288B |hdl=2027.42/57880 |hdl-access=free }}</ref> जो स्थानीय रूप से इष्टतम कम-ऑर्डर LQG नियंत्रक के लिए आवश्यक और पर्याप्त शर्तों का गठन करता है।<ref name="Wil1"/>


एलक्यूजी इष्टतमता स्वचालित रूप से अच्छी मजबूती गुणों को सुनिश्चित नहीं करती है।<ref>{{cite book |first1=Michael |last1=Green |first2=David J. N. |last2=Limebeer |title=रैखिक मजबूत नियंत्रण|location=Englewood Cliffs |publisher=Prentice Hall |year=1995 |isbn=0-13-102278-4 |page=27 |url=https://books.google.com/books?id=8NdSAAAAMAAJ&pg=PA27 }}</ref> एलक्यूजी नियंत्रक के डिजाइन किए जाने के बाद बंद लूप सिस्टम की मजबूत स्थिरता की अलग से जांच की जानी चाहिए। मजबूती को बढ़ावा देने के लिए कुछ सिस्टम मापदंडों को नियतिवादी के बजाय स्टोकेस्टिक माना जा सकता है। संबंधित अधिक कठिन नियंत्रण समस्या एक समान इष्टतम नियंत्रक की ओर ले जाती है जिसके केवल नियंत्रक पैरामीटर भिन्न होते हैं।<ref name="Wil2"/>
पारम्परिक एलक्यूजी प्रणाली में, प्रणाली स्थिति का आयाम बड़ा होने पर एलक्यूजी नियंत्रक का कार्यान्वयन समस्याग्रस्त हो सकता है। कम-क्रम वाली एलक्यूजी समस्या (निश्चित-क्रम एलक्यूजी समस्या) एलक्यूजी नियंत्रक की स्तिथि की संख्या प्राथमिकता को ठीक करके इस पर नियंत्रण पाती है। इस समस्या को हल करना अधिक कठिन है क्योंकि इसे अब अलग नहीं किया जा सकता है। साथ ही, समाधान अब अद्वितीय नहीं रहा। इन तथ्यों के होने पर भी संबंधित [[इष्टतम प्रक्षेपण समीकरण]] को हल करने के लिए संख्यात्मक एल्गोरिदम उपलब्ध हैं <ref name="Bern1">{{cite journal |author1=Hyland D.C |author2=Bernstein D.S. |title=निश्चित क्रम गतिशील मुआवजे के लिए इष्टतम प्रक्षेपण समीकरण|journal=IEEE Transactions on Automatic Control |volume=AC-29 | pages=1034–1037 |year=1984 |doi=10.1109/TAC.1984.1103418 |issue=11|url=https://deepblue.lib.umich.edu/bitstream/2027.42/57875/1/OptimalProjectionRedOrdDynCompTAC1984.pdf |hdl=2027.42/57875 |hdl-access=free }}</ref><ref name="Bern2">{{cite journal |author1=Bernstein D.S. |author2=Davis L.D. |author3=Hyland D.C. |title=कम-क्रम वाले असतत-समय मॉडलिंग अनुमान और नियंत्रण के लिए इष्टतम प्रक्षेपण समीकरण|journal=Journal of Guidance, Control, and Dynamics| volume=9 |issue=3 |pages=288–293 |year=1986 |doi=10.2514/3.20105|url=https://deepblue.lib.umich.edu/bitstream/2027.42/57880/1/DTReduced-OrderDiscrete-TimeModelingEstimationandControl.pdf |bibcode=1986JGCD....9..288B |hdl=2027.42/57880 |hdl-access=free }}</ref><ref name="Wil1">{{cite journal |author1=Van Willigenburg L.G. |author2=De Koning W.L. |title=संख्यात्मक एल्गोरिदम और असतत-समय इष्टतम प्रक्षेपण समीकरणों से संबंधित मुद्दे|journal=European Journal of Control |volume=6 |issue=1 |pages=93–100 |year=2000 |doi=10.1016/s0947-3580(00)70917-4}} [http://www.mathworks.com/matlabcentral/fileexchange/loadFile.do?objectId=19948&objectType=file Associated software download from Matlab Central].</ref><ref name="Wil2">{{cite journal |author1=Van Willigenburg L.G. |author2=De Koning W.L. |title=नियतात्मक और सफेद मापदंडों के साथ समय-अलग-अलग असतत-समय प्रणालियों के लिए इष्टतम कम-ऑर्डर कम्पेसाटर|journal=Automatica |volume=35 |pages=129–138 |year=1999 |doi=10.1016/S0005-1098(98)00138-1}} [http://www.mathworks.com/matlabcentral/fileexchange/loadFile.do?objectId=20014&objectType=FILE Associated software download from Matlab Central].</ref><ref name="Bern3">{{cite journal |author1=Zigic D. |author2=Watson L.T. |author3=Collins E.G. |author4=Haddad W.M. |author5=Ying S. |title=Homotopy methods for solving the optimal projection equations for the H2 reduced order model problem |journal=International Journal of Control |volume=56 | issue=1 | pages=173–191 |year=1996 |doi=10.1080/00207179208934308}}</ref><ref name="Had1">{{cite journal |author1=Collins Jr. E.G |author2=Haddad W.M. |author3=Ying S. |title=हाइलैंड-बर्नस्टीन इष्टतम प्रक्षेपण समीकरणों का उपयोग करके कम-ऑर्डर गतिशील मुआवजे के लिए एक होमोटॉपी एल्गोरिदम|journal=Journal of Guidance, Control, and Dynamics |volume=19 |pages=407–417 |year=1996 |doi=10.2514/3.21633 |issue=2}}</ref> जो स्थानीय रूप से इष्टतम लघुकृत-क्रम एलक्यूजी नियंत्रक के लिए आवश्यक और पर्याप्त परिस्थितियों का गठन करता है। <ref name="Wil1" />
 
एलक्यूजी इष्टतमता स्वचालित रूप से अच्छी मजबूती गुणों को सुनिश्चित नहीं करती है। <ref>{{cite book |first1=Michael |last1=Green |first2=David J. N. |last2=Limebeer |title=रैखिक मजबूत नियंत्रण|location=Englewood Cliffs |publisher=Prentice Hall |year=1995 |isbn=0-13-102278-4 |page=27 |url=https://books.google.com/books?id=8NdSAAAAMAAJ&pg=PA27 }}</ref> एलक्यूजी नियंत्रक के अभिकल्पित किए जाने के बाद बंद पाश तंत्र की मजबूत स्थिरता की अलग से जांच की जानी चाहिए। मजबूती को बढ़ावा देने के लिए कुछ प्रणाली मापदंडों को नियतिवादी के स्थान पर प्रसंभाव्य माना जा सकता है। संबंधित अधिक कठिन नियंत्रण समस्या एक समान इष्टतम नियंत्रक की ओर ले जाती है जिसके केवल नियंत्रक मापदण्ड भिन्न होते हैं। <ref name="Wil2" />
 
इष्टतम लाभ के साथ-साथ स्थिर लाभ के किसी अन्य समुच्चय के लिए लागत फलन के अपेक्षित मूल्य की गणना करना संभव है। <ref>{{cite journal |last1=Matsakis |first1=Demetrios |title=नियंत्रित घड़ियों के व्यवहार पर आनुपातिक स्टीयरिंग रणनीतियों का प्रभाव|journal=Metrologia |date=March 8, 2019 |volume=56 |issue=2 |pages=025007 |doi=10.1088/1681-7575/ab0614 |bibcode=2019Metro..56b5007M |doi-access=free }}</ref>
 
एलक्यूजी नियंत्रक का उपयोग अशान्त गैर-रेखीय प्रणालियों को नियंत्रित करने के लिए भी किया जाता है। <ref name="Athans">{{cite journal |author=Athans M. |title=नियंत्रण प्रणाली डिज़ाइन में स्टोकेस्टिक लीनियर-क्वाड्रैटिक-गॉसियन समस्या की भूमिका और उपयोग|journal=IEEE Transactions on Automatic Control |volume=AC-16 |issue=6 |pages=529–552 |year=1971 |doi=10.1109/TAC.1971.1099818}}</ref>


इष्टतम लाभ के साथ-साथ स्थिर लाभ के किसी अन्य सेट के लिए लागत फ़ंक्शन के अपेक्षित मूल्य की गणना करना संभव है।<ref>{{cite journal |last1=Matsakis |first1=Demetrios |title=नियंत्रित घड़ियों के व्यवहार पर आनुपातिक स्टीयरिंग रणनीतियों का प्रभाव|journal=Metrologia |date=March 8, 2019 |volume=56 |issue=2 |pages=025007 |doi=10.1088/1681-7575/ab0614 |bibcode=2019Metro..56b5007M |doi-access=free }}</ref>
एलक्यूजी नियंत्रक का उपयोग परेशान गैर-रेखीय प्रणालियों को नियंत्रित करने के लिए भी किया जाता है।<ref name="Athans">{{cite journal |author=Athans M. |title=नियंत्रण प्रणाली डिज़ाइन में स्टोकेस्टिक लीनियर-क्वाड्रैटिक-गॉसियन समस्या की भूमिका और उपयोग|journal=IEEE Transactions on Automatic Control |volume=AC-16 |issue=6 |pages=529–552 |year=1971 |doi=10.1109/TAC.1971.1099818}}</ref>




Line 20: Line 23:
: <math>\dot{\mathbf{x}}(t) = A(t) \mathbf{x}(t) + B(t) \mathbf{u}(t) +  \mathbf{v}(t),</math>
: <math>\dot{\mathbf{x}}(t) = A(t) \mathbf{x}(t) + B(t) \mathbf{u}(t) +  \mathbf{v}(t),</math>
: <math>\mathbf{y}(t) = C(t) \mathbf{x}(t) + \mathbf{w}(t),</math>
: <math>\mathbf{y}(t) = C(t) \mathbf{x}(t) + \mathbf{w}(t),</math>
कहाँ <math>{\mathbf{x}}</math> सिस्टम के राज्य चर के वेक्टर का प्रतिनिधित्व करता है, <math>{\mathbf{u}}</math> नियंत्रण इनपुट का वेक्टर और <math>{\mathbf{y}}</math> फीडबैक के लिए उपलब्ध मापे गए आउटपुट का वेक्टर। दोनों additive सफेद गाऊसी प्रणाली शोर <math>\mathbf{v}(t)</math> और योगात्मक सफेद गाऊसी माप शोर <math>\mathbf{w}(t)</math> सिस्टम को प्रभावित करें. इस प्रणाली को देखते हुए उद्देश्य नियंत्रण इनपुट इतिहास का पता लगाना है <math>{\mathbf{u}}(t)</math> जो हर समय <math>{\mathbf{}}t</math> केवल पिछले मापों पर रैखिक रूप से निर्भर हो सकता है <math>{\mathbf{y}}(t'), 0 \leq t' < t</math> इस प्रकार कि निम्नलिखित लागत फलन न्यूनतम हो जाए:
जहाँ <math>{\mathbf{x}}</math> प्रणाली के स्तिथि चर के सदिश का प्रतिनिधित्व करता है, <math>{\mathbf{u}}</math> नियंत्रण निविष्ट का सदिश और <math>{\mathbf{y}}</math> प्रतिपुष्टि के लिए उपलब्ध मापे गए निष्पाद के सदिश का प्रतिनिधित्व करता है। दोनों योगात्मक सफेद गाऊसी प्रणाली नॉइज़ <math>\mathbf{v}(t)</math> और योगात्मक सफेद गाऊसी माप नॉइज़ <math>\mathbf{w}(t)</math> प्रणाली को प्रभावित करते हैं। इस प्रणाली को देखते हुए उद्देश्य नियंत्रण निविष्ट इतिहास <math>{\mathbf{u}}(t)</math> का पता लगाना है जो हर समय <math>{\mathbf{}}t</math> केवल पिछले माप <math>{\mathbf{y}}(t'), 0 \leq t' < t</math> पर रैखिक रूप से निर्भर हो सकता है। इस प्रकार कि निम्नलिखित लागत फलन न्यूनतम हो जाए:


: <math> J = \mathbb{E}\left[{\mathbf{x}^\mathrm T}(T)F{\mathbf{x}}(T)+ \int_{0}^{T} {\mathbf{x}^\mathrm T}(t)Q(t){\mathbf{x}}(t) + {\mathbf{u}^\mathrm T}(t)R(t){\mathbf{u}}(t)\,dt \right],</math>
: <math> J = \mathbb{E}\left[{\mathbf{x}^\mathrm T}(T)F{\mathbf{x}}(T)+ \int_{0}^{T} {\mathbf{x}^\mathrm T}(t)Q(t){\mathbf{x}}(t) + {\mathbf{u}^\mathrm T}(t)R(t){\mathbf{u}}(t)\,dt \right],</math>
: <math> F \ge 0,\quad Q(t) \ge 0,\quad R(t) > 0, </math>
: <math> F \ge 0,\quad Q(t) \ge 0,\quad R(t) > 0, </math>
कहाँ <math>\mathbb{E}</math> [[अपेक्षित मूल्य]] को दर्शाता है। अंतिम समय (क्षितिज) <math>{\mathbf{}}T</math> या तो सीमित या अनंत हो सकता है। यदि क्षितिज पहले पद की ओर अनंत की ओर प्रवृत्त होता है <math>{\mathbf{x}}^\mathrm T(T)F{\mathbf{x}}(T)</math> लागत फलन समस्या के लिए नगण्य और अप्रासंगिक हो जाता है। इसके अलावा लागत को सीमित रखने के लिए लागत फ़ंक्शन को अपनाना होगा <math>{\mathbf{}}J/T</math>.
जहाँ <math>\mathbb{E}</math> [[अपेक्षित मूल्य]] को दर्शाता है। अंतिम समय (क्षितिज) <math>{\mathbf{}}T</math> या तो सीमित या अनंत हो सकता है। यदि क्षितिज पहले पद <math>{\mathbf{x}}^\mathrm T(T)F{\mathbf{x}}(T)</math> की ओर अनंत की ओर प्रवृत्त होता है तो लागत फलन समस्या के लिए नगण्य और अप्रासंगिक हो जाता है। इसके अतिरिक्त लागत को सीमित रखने के लिए लागत फलन <math>{\mathbf{}}J/T</math> को अपनाना होगा।


LQG नियंत्रक जो LQG नियंत्रण समस्या को हल करता है, निम्नलिखित समीकरणों द्वारा निर्दिष्ट किया गया है:
एलक्यूजी नियंत्रक जो एलक्यूजी नियंत्रण समस्या को हल करता है, निम्नलिखित समीकरणों द्वारा निर्दिष्ट किया गया है:


: <math> \dot{\hat{\mathbf{x}}}(t) = A(t)\hat{\mathbf{x}}(t) + B(t){\mathbf{u}}(t)+L(t) \left( {\mathbf{y}}(t)-C(t)\hat{\mathbf{x}}(t) \right),  \quad \hat{\mathbf{x}}(0) = \mathbb{E} \left[ {\mathbf{x}}(0) \right], </math>
: <math> \dot{\hat{\mathbf{x}}}(t) = A(t)\hat{\mathbf{x}}(t) + B(t){\mathbf{u}}(t)+L(t) \left( {\mathbf{y}}(t)-C(t)\hat{\mathbf{x}}(t) \right),  \quad \hat{\mathbf{x}}(0) = \mathbb{E} \left[ {\mathbf{x}}(0) \right], </math>
: <math> {\mathbf{u}}(t)= -K(t) \hat{\mathbf{x}}(t).</math>
: <math> {\mathbf{u}}(t)= -K(t) \hat{\mathbf{x}}(t).</math>
गणित का सवाल <math>{\mathbf{}}L(t)</math> पहले समीकरण द्वारा दर्शाए गए संबंधित कलमैन फ़िल्टर का कलमैन लाभ कहा जाता है। हर समय <math>{\mathbf{}}t</math> यह फ़िल्टर अनुमान उत्पन्न करता है <math>\hat{\mathbf{x}}(t)</math> राज्य की <math>{\mathbf{x}}(t)</math> पिछले मापों और इनपुट का उपयोग करना। कलमन को लाभ <math>{\mathbf{}}L(t)</math> मैट्रिक्स से गणना की जाती है <math>{\mathbf{}}A(t), C(t)</math>, दो तीव्रता मैट्रिक्स <math>\mathbf{}V(t), W(t)</math> सफेद गॉसियन शोर से संबंधित <math>\mathbf{v}(t)</math> और <math>\mathbf{w}(t)</math> और अंत में <math>\mathbb{E}\left[{\mathbf{x}}(0){\mathbf{x}}^\mathrm T(0) \right]</math>. ये पांच मैट्रिक्स निम्नलिखित संबंधित मैट्रिक्स रिकाटी अंतर समीकरण के माध्यम से कलमन लाभ निर्धारित करते हैं:
आव्यूह <math>{\mathbf{}}L(t)</math> को पहले समीकरण द्वारा दर्शाए गए संबंधित कलमैन फ़िल्टर का कलमैन लाभ कहा जाता है। हर समय <math>{\mathbf{}}t</math> पर यह निस्यंदक पिछले मापों का उपयोग करके <math>{\mathbf{x}}(t)</math> स्तिथि का अनुमान <math>\hat{\mathbf{x}}(t)</math> उत्पन्न करता है। कलमन लाभ <math>{\mathbf{}}L(t)</math> आव्यूह <math>{\mathbf{}}A(t), C(t)</math> से गणना की जाती है, दो तीव्रता आव्यूह <math>\mathbf{}V(t), W(t)</math> सफेद गॉसियन नॉइज़ <math>\mathbf{v}(t)</math> और <math>\mathbf{w}(t)</math> और अंत में <math>\mathbb{E}\left[{\mathbf{x}}(0){\mathbf{x}}^\mathrm T(0) \right]</math> से संबंधित है। ये पांच आव्यूह निम्नलिखित संबंधित आव्यूह रिकाटी अंतर समीकरण के माध्यम से कलमन लाभ निर्धारित करते हैं:


: <math> \dot{P}(t) = A(t)P(t)+P(t)A^\mathrm T(t)-P(t)C^\mathrm T(t){\mathbf{}}W^{-1}(t)
: <math> \dot{P}(t) = A(t)P(t)+P(t)A^\mathrm T(t)-P(t)C^\mathrm T(t){\mathbf{}}W^{-1}(t)
C(t)P(t)+V(t),</math>
C(t)P(t)+V(t),</math>
: <math> P(0)= \mathbb{E} \left[{\mathbf{x}}(0){\mathbf{x}}^\mathrm T(0) \right].</math>
: <math> P(0)= \mathbb{E} \left[{\mathbf{x}}(0){\mathbf{x}}^\mathrm T(0) \right].</math>
समाधान दिया <math>P(t), 0 \leq t \leq T</math> कलमन का लाभ बराबर है
समाधान <math>P(t), 0 \leq t \leq T</math> को देखते हुए कलमन लाभ निम्नलिखित के बराबर है


: <math> {\mathbf{}}L(t) = P(t)C^\mathrm T(t)W^{-1}(t). </math>
: <math> {\mathbf{}}L(t) = P(t)C^\mathrm T(t)W^{-1}(t). </math>
गणित का सवाल <math>{\mathbf{}}K(t)</math> फीडबैक गेन मैट्रिक्स कहा जाता है। यह मैट्रिक्स मैट्रिक्स द्वारा निर्धारित होता है <math>{\mathbf{}}A(t), B(t), Q(t), R(t)</math> और <math>{\mathbf{}}F</math> निम्नलिखित संबद्ध मैट्रिक्स रिकाटी अंतर समीकरण के माध्यम से:
गणित का सवाल <math>{\mathbf{}}K(t)</math> प्रतिपुष्टि प्राप्ति आव्यूह कहा जाता है। यह आव्यूह <math>{\mathbf{}}A(t), B(t), Q(t), R(t)</math> और <math>{\mathbf{}}F</math> आव्यूह द्वारा निर्धारित होता है, निम्नलिखित संबद्ध आव्यूह रिकाटी अंतर के माध्यम से निर्धारित किया जाता है:


: <math> -\dot{S}(t) = A^\mathrm T(t)S(t)+S(t)A(t)-S(t)B(t)R^{-1}(t)B^\mathrm T(t)S(t)+Q(t),</math>
: <math> -\dot{S}(t) = A^\mathrm T(t)S(t)+S(t)A(t)-S(t)B(t)R^{-1}(t)B^\mathrm T(t)S(t)+Q(t),</math>
: <math>  {\mathbf{}}S(T) = F.</math>
: <math>  {\mathbf{}}S(T) = F.</math>
समाधान दिया <math>{\mathbf{}}S(t), 0 \leq t \leq T</math> फीडबैक लाभ बराबर है
समाधान <math>{\mathbf{}}S(t), 0 \leq t \leq T</math> को देखते हुए प्रतिपुष्टि लाभ निम्नलिखित के बराबर है


: <math> {\mathbf{}}K(t) = R^{-1}(t)B^\mathrm T(t)S(t).</math>
: <math> {\mathbf{}}K(t) = R^{-1}(t)B^\mathrm T(t)S(t).</math>
दो मैट्रिक्स रिकाटी अंतर समीकरणों की समानता का निरीक्षण करें, पहला समय में आगे चल रहा है, दूसरा समय में पीछे चल रहा है। इस समानता को द्वंद्व कहा जाता है। पहला मैट्रिक्स रिकाटी अंतर समीकरण रैखिक-द्विघात अनुमान समस्या (LQE) को हल करता है। दूसरा मैट्रिक्स रिकाटी अंतर समीकरण रैखिक-द्विघात नियामक | रैखिक-द्विघात नियामक समस्या (एलक्यूआर) को हल करता है। ये समस्याएँ दोहरी हैं और साथ में ये रैखिक-द्विघात-गाऊसी नियंत्रण समस्या (LQG) को हल करती हैं। तो LQG समस्या LQE और LQR समस्या में विभाजित हो जाती है जिसे स्वतंत्र रूप से हल किया जा सकता है। इसलिए, LQG समस्या को वियोज्य कहा जाता है।
दो आव्यूह रिकाटी अंतर समीकरणों की समानता का निरीक्षण करें, पहला समय में आगे चल रहा है, दूसरा समय में पीछे चल रहा है। इस समानता को द्वंद्व कहा जाता है। पहला आव्यूह रिकाटी अंतर समीकरण रैखिक-द्विघात अनुमान समस्या (एलक्यूई) को हल करता है। दूसरा आव्यूह रिकाटी अंतर समीकरण रैखिक-द्विघात नियामक समस्या (एलक्यूआर) को हल करता है। ये समस्याएँ दोहरी हैं और साथ में ये रैखिक-द्विघात-गाऊसी नियंत्रण समस्या (एलक्यूजी) को हल करती हैं। तो एलक्यूजी समस्या एलक्यूई और एलक्यूआर समस्या में विभाजित हो जाती है जिसे स्वतंत्र रूप से हल किया जा सकता है। इसलिए, एलक्यूजी समस्या को वियोज्य कहा जाता है।


कब <math>{\mathbf{}}A(t), B(t), C(t), Q(t), R(t)</math> और शोर तीव्रता मैट्रिक्स <math>\mathbf{}V(t)</math>, <math>\mathbf{}W(t)</math> पर निर्भर न रहें <math>{\mathbf{}}t</math> और जब <math>{\mathbf{}}T</math> अनंत तक जाने पर LQG नियंत्रक एक समय-अपरिवर्तनीय गतिशील प्रणाली बन जाता है। उस स्थिति में दूसरे मैट्रिक्स रिकाटी अंतर समीकरण को संबंधित बीजगणितीय रिकाटी समीकरण द्वारा प्रतिस्थापित किया जा सकता है।
जब <math>{\mathbf{}}A(t), B(t), C(t), Q(t), R(t)</math> और नॉइज़ तीव्रता आव्यूह <math>\mathbf{}V(t)</math>, <math>\mathbf{}W(t)</math> <math>{\mathbf{}}t</math> पर निर्भर न रहें और जब <math>{\mathbf{}}T</math> अनंत तक जाने पर एलक्यूजी नियंत्रक एक समय-अपरिवर्तनीय गतिशील प्रणाली बन जाता है। उस स्थिति में दूसरे आव्यूह रिकाटी अंतर समीकरण को संबंधित बीजगणितीय रिकाटी समीकरण द्वारा प्रतिस्थापित किया जा सकता है।


===अलग समय===
===असतत समय===
चूंकि असतत-समय एलक्यूजी नियंत्रण समस्या निरंतर-समय के समान है, इसलिए नीचे दिया गया विवरण गणितीय समीकरणों पर केंद्रित है।
चूंकि असतत-समय एलक्यूजी नियंत्रण समस्या निरंतर-समय के समान है, इसलिए नीचे दिया गया विवरण गणितीय समीकरणों पर केंद्रित है।


Line 56: Line 59:
: <math>{\mathbf{x}}_{i+1} = A_i\mathbf{x}_i + B_i \mathbf{u}_i +  \mathbf{v}_i,</math>
: <math>{\mathbf{x}}_{i+1} = A_i\mathbf{x}_i + B_i \mathbf{u}_i +  \mathbf{v}_i,</math>
: <math>\mathbf{y}_{i} = C_{i} \mathbf{x}_i + \mathbf{w}_i.</math>
: <math>\mathbf{y}_{i} = C_{i} \mathbf{x}_i + \mathbf{w}_i.</math>
यहाँ <math>\mathbf{}i</math> असतत समय सूचकांक का प्रतिनिधित्व करता है और <math>\mathbf{v}_{i}, \mathbf{w}_{i}</math> सहप्रसरण मैट्रिक्स के साथ असतत-समय गाऊसी सफेद शोर प्रक्रियाओं का प्रतिनिधित्व करते हैं <math>\mathbf{}V_{i}, W_{i}</math>, क्रमशः, और एक दूसरे से स्वतंत्र हैं।
यहाँ <math>\mathbf{}i</math> असतत समय सूचकांक का प्रतिनिधित्व करता है और <math>\mathbf{v}_{i}, \mathbf{w}_{i}</math> सहप्रसरण आव्यूह <math>\mathbf{}V_{i}, W_{i}</math> के साथ असतत-समय गाऊसी सफेद नॉइज़ प्रक्रियाओं का क्रमशः प्रतिनिधित्व करते हैं और एक दूसरे से स्वतंत्र हैं।


न्यूनतम किया जाने वाला द्विघात लागत फलन है
न्यूनतम किया जाने वाला द्विघात लागत फलन निम्न है


: <math> J = \mathbb{E}\left[{\mathbf{x}}^\mathrm T_{N}F{\mathbf{x}}_{N}+ \sum_{i=0}^{N-1}( \mathbf{x}_i^\mathrm T Q_i \mathbf{x}_i + \mathbf{u}_i^\mathrm T R_i \mathbf{u}_i )\right],</math>
: <math> J = \mathbb{E}\left[{\mathbf{x}}^\mathrm T_{N}F{\mathbf{x}}_{N}+ \sum_{i=0}^{N-1}( \mathbf{x}_i^\mathrm T Q_i \mathbf{x}_i + \mathbf{u}_i^\mathrm T R_i \mathbf{u}_i )\right],</math>
: <math> F \ge 0, Q_i \ge 0, R_i > 0. \,  </math>
: <math> F \ge 0, Q_i \ge 0, R_i > 0. \,  </math>
असतत-समय LQG नियंत्रक है
असतत-समय एलक्यूजी नियंत्रक है


:<math>\hat{\mathbf{x}}_{i+1}=A_i\hat{\mathbf{x}}_i+B_i{\mathbf{u}}_i+L_{i+1} \left({\mathbf{y}}_{i+1}-C_{i+1} \left\{ A_i \hat{\mathbf{x}}_i + B_i \mathbf{u}_i \right\} \right), \qquad \hat{\mathbf{x}}_0=\mathbb{E}[{\mathbf{x}}_0]</math>,
:<math>\hat{\mathbf{x}}_{i+1}=A_i\hat{\mathbf{x}}_i+B_i{\mathbf{u}}_i+L_{i+1} \left({\mathbf{y}}_{i+1}-C_{i+1} \left\{ A_i \hat{\mathbf{x}}_i + B_i \mathbf{u}_i \right\} \right), \qquad \hat{\mathbf{x}}_0=\mathbb{E}[{\mathbf{x}}_0]</math>,


:<math> \mathbf{u}_i=-K_i\hat{\mathbf{x}}_i. \, </math>
:<math> \mathbf{u}_i=-K_i\hat{\mathbf{x}}_i. \, </math>
और <math> \hat{\mathbf{x}}_i </math> पूर्वानुमानित अनुमान के अनुरूप है <math> \hat{\mathbf{x}}_i = \mathbb{E}[\mathbf{x}_i|\mathbf{y}^i, \mathbf{u}^{i-1}] </math>.
और <math> \hat{\mathbf{x}}_i </math> पूर्वानुमानित अनुमान <math> \hat{\mathbf{x}}_i = \mathbb{E}[\mathbf{x}_i|\mathbf{y}^i, \mathbf{u}^{i-1}] </math> के अनुरूप है।


कलमन का लाभ बराबर है
कलमन लाभ निम्न के बराबर है


: <math> {\mathbf{}}L_i = P_iC ^\mathrm T _i(C_iP_iC ^\mathrm T _i + W_i)^{-1}, </math>
: <math> {\mathbf{}}L_i = P_iC ^\mathrm T _i(C_iP_iC ^\mathrm T _i + W_i)^{-1}, </math>
कहाँ <math>{\mathbf{}}P_i</math> निम्नलिखित मैट्रिक्स रिकाटी अंतर समीकरण द्वारा निर्धारित किया जाता है जो समय में आगे बढ़ता है:
जहाँ <math>{\mathbf{}}P_i</math> निम्नलिखित आव्यूह रिकाटी अंतर समीकरण द्वारा निर्धारित किया जाता है जो समय में आगे बढ़ता है:


: <math> P_{i+1} = A_i \left( P_i - P_i C ^\mathrm T _i \left( C_i P_i C ^\mathrm T _i+W_i \right)^{-1} C_i P_i \right) A ^\mathrm T _i+V_i, \qquad P_0=\mathbb{E} [\left( {\mathbf{x}}_0 - \hat{\mathbf{x}}_0\right)\left({\mathbf{x}}_0- \hat{\mathbf{x}}_0\right)^\mathrm T]. </math>
: <math> P_{i+1} = A_i \left( P_i - P_i C ^\mathrm T _i \left( C_i P_i C ^\mathrm T _i+W_i \right)^{-1} C_i P_i \right) A ^\mathrm T _i+V_i, \qquad P_0=\mathbb{E} [\left( {\mathbf{x}}_0 - \hat{\mathbf{x}}_0\right)\left({\mathbf{x}}_0- \hat{\mathbf{x}}_0\right)^\mathrm T]. </math>
फीडबैक गेन मैट्रिक्स बराबर है
प्रतिपुष्टि वृद्धि आव्यूह निम्न के बराबर है


: <math> {\mathbf{}}K_i = (B^\mathrm T_iS_{i+1}B_i + R_i)^{-1}B^\mathrm T_iS_{i+1}A_i </math>
: <math> {\mathbf{}}K_i = (B^\mathrm T_iS_{i+1}B_i + R_i)^{-1}B^\mathrm T_iS_{i+1}A_i </math>
कहाँ <math>{\mathbf{}}S_i</math> निम्नलिखित मैट्रिक्स रिकाटी अंतर समीकरण द्वारा निर्धारित किया जाता है जो समय में पीछे चलता है:
जहाँ <math>{\mathbf{}}S_i</math> निम्नलिखित आव्यूह रिकाटी अंतर समीकरण द्वारा निर्धारित किया जाता है जो समय में पीछे चलता है:


: <math> S_i = A^\mathrm T_i \left( S_{i+1} - S_{i+1}B_i \left( B^\mathrm T_iS_{i+1}B_i+R_i \right)^{-1} B^\mathrm T_i S_{i+1} \right) A_i+Q_i, \quad S_N=F.</math>
: <math> S_i = A^\mathrm T_i \left( S_{i+1} - S_{i+1}B_i \left( B^\mathrm T_iS_{i+1}B_i+R_i \right)^{-1} B^\mathrm T_i S_{i+1} \right) A_i+Q_i, \quad S_N=F.</math>
यदि समस्या सूत्रीकरण में सभी आव्यूह समय-अपरिवर्तनीय हैं और यदि क्षितिज <math>{\mathbf{}}N</math> अनंत की ओर प्रवृत्त होने पर असतत-समय LQG नियंत्रक समय-अपरिवर्तनीय बन जाता है। उस स्थिति में मैट्रिक्स रिकाटी अंतर समीकरणों को उनके संबंधित असतत-समय बीजगणितीय रिकाटी समीकरणों द्वारा प्रतिस्थापित किया जा सकता है। ये अलग-अलग समय में समय-अपरिवर्तनीय रैखिक-द्विघात अनुमानक और समय-अपरिवर्तनीय रैखिक-द्विघात नियामक | रैखिक-द्विघात नियामक निर्धारित करते हैं। इसके बजाय लागतों को सीमित रखना <math>{\mathbf{}}J</math> विचार करना होगा <math>{\mathbf{}}J/N</math> इस मामले में।
यदि समस्या सूत्रीकरण में सभी आव्यूह समय-अपरिवर्तनीय हैं और यदि क्षितिज <math>{\mathbf{}}N</math> अनंत की ओर प्रवृत्त होने पर असतत-समय एलक्यूजी नियंत्रक समय-अपरिवर्तनीय बन जाता है। उस स्थिति में आव्यूह रिकाटी अंतर समीकरणों को उनके संबंधित असतत-समय बीजगणितीय रिकाटी समीकरणों द्वारा प्रतिस्थापित किया जा सकता है। ये अलग-अलग समय में समय-अपरिवर्तनीय रैखिक-द्विघात अनुमानक और समय-अपरिवर्तनीय रैखिक-द्विघात नियामक निर्धारित करते हैं। इस स्तिथि में लागत को <math>{\mathbf{}}J</math> के स्थान पर सीमित रखने के लिए <math>{\mathbf{}}J/N</math> पर विचार करना होगा।


==यह भी देखें==
==यह भी देखें==


*[[स्टोकेस्टिक नियंत्रण]]
*[[स्टोकेस्टिक नियंत्रण|प्रसंभाव्य नियंत्रण]]
*विट्सनहाउज़ेन का प्रतिउदाहरण
*विट्सनहाउज़ेन का प्रतिउदाहरण



Revision as of 03:28, 6 October 2023

नियंत्रण सिद्धांत में, रैखिक-द्विघात-गाऊसी (एलक्यूजी) नियंत्रण समस्या सबसे मौलिक इष्टतम नियंत्रण समस्याओं में से एक है, और इसे प्रतिरूप पूर्वानुमान नियंत्रण के लिए बार-बार संचालित भी किया जा सकता है। यह योगात्मक सफेद गॉसियन नॉइज़ द्वारा संचालित रैखिक प्रणालियों से संबंधित है। समस्या एक निष्पाद प्रतिपुष्टि कानून निर्धारित करना है जो द्विघात लागत कार्यात्मक मानदंड के अपेक्षित मूल्य को कम करने के अर्थ में इष्टतम है। निष्पाद माप को गॉसियन नॉइज़ से दूषित माना जाता है और प्रारंभिक स्थिति को भी गॉसियन यादृच्छिक सदिश माना जाता है।

इन मान्यताओं के अंतर्गत रैखिक नियंत्रण कानूनों के वर्ग के भीतर एक इष्टतम नियंत्रण योजना पूर्ण-वर्ग तर्क द्वारा प्राप्त की जा सकती है। [1] यह नियंत्रण कानून जिसे एलक्यूजी नियंत्रक के रूप में जाना जाता है, वह अद्वितीय है और यह केवल एक कलमन निस्यंदक (एक रैखिक-द्विघात स्तिथि अनुमानक (एलक्यूई)) के साथ एक रैखिक-द्विघात नियामक (एलक्यूआर) का एक संयोजन है। पृथक्करण सिद्धांत बताता है कि स्तिथि अनुमानक और स्तिथि प्रतिपुष्टि को स्वतंत्र रूप से अभिकल्पित किया जा सकता है। एलक्यूजी रैखिक समय-अपरिवर्तनीय प्रणालियों के साथ-साथ समय-संस्करण प्रणाली दोनों पर लागू होता है, और एक रैखिक गतिशील प्रतिक्रिया नियंत्रण कानून का गठन करता है जिसे आसानी से गणना और कार्यान्वित किया जाता है: एलक्यूजी नियंत्रक स्वयं एक गतिशील प्रणाली है उस प्रणाली की तरह जिसे वह नियंत्रित करता है। दोनों प्रणालियों का स्तिथि आयाम समान है।

पृथक्करण सिद्धांत का एक गहरा कथन यह है कि एलक्यूजी नियंत्रक संभवतः गैर-रेखीय नियंत्रकों की एक विस्तृत श्रेणी में अभी भी इष्टतम है। अर्थात्, एक अरेखीय नियंत्रण योजना का उपयोग करने से लागत फलन के अपेक्षित मूल्य में सुधार नहीं होगा। पृथक्करण सिद्धांत का यह संस्करण प्रसंभाव्य नियंत्रण में पृथक्करण सिद्धांत की एक विशेष स्तिथि है जो बताता है कि भले ही प्रक्रिया और निष्पाद नॉइज़ स्रोत संभवतः गैर-गाऊसी मार्टिंगेल (संभावना सिद्धांत) हों, जब तक कि प्रणाली की गतिशीलता रैखिक होती है, इष्टतम नियंत्रण एक इष्टतम स्थिति अनुमानक (जो अब कलमैन निस्यंदक नहीं हो सकता है) और एक एलक्यूआर नियामक में अलग हो जाता है। [2][3]

पारम्परिक एलक्यूजी प्रणाली में, प्रणाली स्थिति का आयाम बड़ा होने पर एलक्यूजी नियंत्रक का कार्यान्वयन समस्याग्रस्त हो सकता है। कम-क्रम वाली एलक्यूजी समस्या (निश्चित-क्रम एलक्यूजी समस्या) एलक्यूजी नियंत्रक की स्तिथि की संख्या प्राथमिकता को ठीक करके इस पर नियंत्रण पाती है। इस समस्या को हल करना अधिक कठिन है क्योंकि इसे अब अलग नहीं किया जा सकता है। साथ ही, समाधान अब अद्वितीय नहीं रहा। इन तथ्यों के होने पर भी संबंधित इष्टतम प्रक्षेपण समीकरण को हल करने के लिए संख्यात्मक एल्गोरिदम उपलब्ध हैं [4][5][6][7][8][9] जो स्थानीय रूप से इष्टतम लघुकृत-क्रम एलक्यूजी नियंत्रक के लिए आवश्यक और पर्याप्त परिस्थितियों का गठन करता है। [6]

एलक्यूजी इष्टतमता स्वचालित रूप से अच्छी मजबूती गुणों को सुनिश्चित नहीं करती है। [10] एलक्यूजी नियंत्रक के अभिकल्पित किए जाने के बाद बंद पाश तंत्र की मजबूत स्थिरता की अलग से जांच की जानी चाहिए। मजबूती को बढ़ावा देने के लिए कुछ प्रणाली मापदंडों को नियतिवादी के स्थान पर प्रसंभाव्य माना जा सकता है। संबंधित अधिक कठिन नियंत्रण समस्या एक समान इष्टतम नियंत्रक की ओर ले जाती है जिसके केवल नियंत्रक मापदण्ड भिन्न होते हैं। [7]

इष्टतम लाभ के साथ-साथ स्थिर लाभ के किसी अन्य समुच्चय के लिए लागत फलन के अपेक्षित मूल्य की गणना करना संभव है। [11]

एलक्यूजी नियंत्रक का उपयोग अशान्त गैर-रेखीय प्रणालियों को नियंत्रित करने के लिए भी किया जाता है। [12]


समस्या और समाधान का गणितीय विवरण

निरंतर समय

सतत-समय रैखिक गतिशील प्रणाली पर विचार करें

जहाँ प्रणाली के स्तिथि चर के सदिश का प्रतिनिधित्व करता है, नियंत्रण निविष्ट का सदिश और प्रतिपुष्टि के लिए उपलब्ध मापे गए निष्पाद के सदिश का प्रतिनिधित्व करता है। दोनों योगात्मक सफेद गाऊसी प्रणाली नॉइज़ और योगात्मक सफेद गाऊसी माप नॉइज़ प्रणाली को प्रभावित करते हैं। इस प्रणाली को देखते हुए उद्देश्य नियंत्रण निविष्ट इतिहास का पता लगाना है जो हर समय केवल पिछले माप पर रैखिक रूप से निर्भर हो सकता है। इस प्रकार कि निम्नलिखित लागत फलन न्यूनतम हो जाए:

जहाँ अपेक्षित मूल्य को दर्शाता है। अंतिम समय (क्षितिज) या तो सीमित या अनंत हो सकता है। यदि क्षितिज पहले पद की ओर अनंत की ओर प्रवृत्त होता है तो लागत फलन समस्या के लिए नगण्य और अप्रासंगिक हो जाता है। इसके अतिरिक्त लागत को सीमित रखने के लिए लागत फलन को अपनाना होगा।

एलक्यूजी नियंत्रक जो एलक्यूजी नियंत्रण समस्या को हल करता है, निम्नलिखित समीकरणों द्वारा निर्दिष्ट किया गया है:

आव्यूह को पहले समीकरण द्वारा दर्शाए गए संबंधित कलमैन फ़िल्टर का कलमैन लाभ कहा जाता है। हर समय पर यह निस्यंदक पिछले मापों का उपयोग करके स्तिथि का अनुमान उत्पन्न करता है। कलमन लाभ आव्यूह से गणना की जाती है, दो तीव्रता आव्यूह सफेद गॉसियन नॉइज़ और और अंत में से संबंधित है। ये पांच आव्यूह निम्नलिखित संबंधित आव्यूह रिकाटी अंतर समीकरण के माध्यम से कलमन लाभ निर्धारित करते हैं:

समाधान को देखते हुए कलमन लाभ निम्नलिखित के बराबर है

गणित का सवाल प्रतिपुष्टि प्राप्ति आव्यूह कहा जाता है। यह आव्यूह और आव्यूह द्वारा निर्धारित होता है, निम्नलिखित संबद्ध आव्यूह रिकाटी अंतर के माध्यम से निर्धारित किया जाता है:

समाधान को देखते हुए प्रतिपुष्टि लाभ निम्नलिखित के बराबर है

दो आव्यूह रिकाटी अंतर समीकरणों की समानता का निरीक्षण करें, पहला समय में आगे चल रहा है, दूसरा समय में पीछे चल रहा है। इस समानता को द्वंद्व कहा जाता है। पहला आव्यूह रिकाटी अंतर समीकरण रैखिक-द्विघात अनुमान समस्या (एलक्यूई) को हल करता है। दूसरा आव्यूह रिकाटी अंतर समीकरण रैखिक-द्विघात नियामक समस्या (एलक्यूआर) को हल करता है। ये समस्याएँ दोहरी हैं और साथ में ये रैखिक-द्विघात-गाऊसी नियंत्रण समस्या (एलक्यूजी) को हल करती हैं। तो एलक्यूजी समस्या एलक्यूई और एलक्यूआर समस्या में विभाजित हो जाती है जिसे स्वतंत्र रूप से हल किया जा सकता है। इसलिए, एलक्यूजी समस्या को वियोज्य कहा जाता है।

जब और नॉइज़ तीव्रता आव्यूह , पर निर्भर न रहें और जब अनंत तक जाने पर एलक्यूजी नियंत्रक एक समय-अपरिवर्तनीय गतिशील प्रणाली बन जाता है। उस स्थिति में दूसरे आव्यूह रिकाटी अंतर समीकरण को संबंधित बीजगणितीय रिकाटी समीकरण द्वारा प्रतिस्थापित किया जा सकता है।

असतत समय

चूंकि असतत-समय एलक्यूजी नियंत्रण समस्या निरंतर-समय के समान है, इसलिए नीचे दिया गया विवरण गणितीय समीकरणों पर केंद्रित है।

असतत-समय रैखिक प्रणाली समीकरण हैं

यहाँ असतत समय सूचकांक का प्रतिनिधित्व करता है और सहप्रसरण आव्यूह के साथ असतत-समय गाऊसी सफेद नॉइज़ प्रक्रियाओं का क्रमशः प्रतिनिधित्व करते हैं और एक दूसरे से स्वतंत्र हैं।

न्यूनतम किया जाने वाला द्विघात लागत फलन निम्न है

असतत-समय एलक्यूजी नियंत्रक है

,

और पूर्वानुमानित अनुमान के अनुरूप है।

कलमन लाभ निम्न के बराबर है

जहाँ निम्नलिखित आव्यूह रिकाटी अंतर समीकरण द्वारा निर्धारित किया जाता है जो समय में आगे बढ़ता है:

प्रतिपुष्टि वृद्धि आव्यूह निम्न के बराबर है

जहाँ निम्नलिखित आव्यूह रिकाटी अंतर समीकरण द्वारा निर्धारित किया जाता है जो समय में पीछे चलता है:

यदि समस्या सूत्रीकरण में सभी आव्यूह समय-अपरिवर्तनीय हैं और यदि क्षितिज अनंत की ओर प्रवृत्त होने पर असतत-समय एलक्यूजी नियंत्रक समय-अपरिवर्तनीय बन जाता है। उस स्थिति में आव्यूह रिकाटी अंतर समीकरणों को उनके संबंधित असतत-समय बीजगणितीय रिकाटी समीकरणों द्वारा प्रतिस्थापित किया जा सकता है। ये अलग-अलग समय में समय-अपरिवर्तनीय रैखिक-द्विघात अनुमानक और समय-अपरिवर्तनीय रैखिक-द्विघात नियामक निर्धारित करते हैं। इस स्तिथि में लागत को के स्थान पर सीमित रखने के लिए पर विचार करना होगा।

यह भी देखें

संदर्भ

  1. Karl Johan Astrom (1970). स्टोकेस्टिक नियंत्रण के सिद्धांत का परिचय. Vol. 58. Academic Press. ISBN 0-486-44531-3.
  2. Anders Lindquist (1973). "लीनियर स्टोकेस्टिक सिस्टम के फीडबैक नियंत्रण पर". SIAM Journal on Control. 11 (2): 323–343. doi:10.1137/0311025..
  3. Tryphon T. Georgiou and Anders Lindquist (2013). "स्टोकेस्टिक नियंत्रण में पृथक्करण सिद्धांत, रिडक्स". IEEE Transactions on Automatic Control. 58 (10): 2481–2494. arXiv:1103.3005. doi:10.1109/TAC.2013.2259207. S2CID 12623187.
  4. Hyland D.C; Bernstein D.S. (1984). "निश्चित क्रम गतिशील मुआवजे के लिए इष्टतम प्रक्षेपण समीकरण" (PDF). IEEE Transactions on Automatic Control. AC-29 (11): 1034–1037. doi:10.1109/TAC.1984.1103418. hdl:2027.42/57875.
  5. Bernstein D.S.; Davis L.D.; Hyland D.C. (1986). "कम-क्रम वाले असतत-समय मॉडलिंग अनुमान और नियंत्रण के लिए इष्टतम प्रक्षेपण समीकरण" (PDF). Journal of Guidance, Control, and Dynamics. 9 (3): 288–293. Bibcode:1986JGCD....9..288B. doi:10.2514/3.20105. hdl:2027.42/57880.
  6. 6.0 6.1 Van Willigenburg L.G.; De Koning W.L. (2000). "संख्यात्मक एल्गोरिदम और असतत-समय इष्टतम प्रक्षेपण समीकरणों से संबंधित मुद्दे". European Journal of Control. 6 (1): 93–100. doi:10.1016/s0947-3580(00)70917-4. Associated software download from Matlab Central.
  7. 7.0 7.1 Van Willigenburg L.G.; De Koning W.L. (1999). "नियतात्मक और सफेद मापदंडों के साथ समय-अलग-अलग असतत-समय प्रणालियों के लिए इष्टतम कम-ऑर्डर कम्पेसाटर". Automatica. 35: 129–138. doi:10.1016/S0005-1098(98)00138-1. Associated software download from Matlab Central.
  8. Zigic D.; Watson L.T.; Collins E.G.; Haddad W.M.; Ying S. (1996). "Homotopy methods for solving the optimal projection equations for the H2 reduced order model problem". International Journal of Control. 56 (1): 173–191. doi:10.1080/00207179208934308.
  9. Collins Jr. E.G; Haddad W.M.; Ying S. (1996). "हाइलैंड-बर्नस्टीन इष्टतम प्रक्षेपण समीकरणों का उपयोग करके कम-ऑर्डर गतिशील मुआवजे के लिए एक होमोटॉपी एल्गोरिदम". Journal of Guidance, Control, and Dynamics. 19 (2): 407–417. doi:10.2514/3.21633.
  10. Green, Michael; Limebeer, David J. N. (1995). रैखिक मजबूत नियंत्रण. Englewood Cliffs: Prentice Hall. p. 27. ISBN 0-13-102278-4.
  11. Matsakis, Demetrios (March 8, 2019). "नियंत्रित घड़ियों के व्यवहार पर आनुपातिक स्टीयरिंग रणनीतियों का प्रभाव". Metrologia. 56 (2): 025007. Bibcode:2019Metro..56b5007M. doi:10.1088/1681-7575/ab0614.
  12. Athans M. (1971). "नियंत्रण प्रणाली डिज़ाइन में स्टोकेस्टिक लीनियर-क्वाड्रैटिक-गॉसियन समस्या की भूमिका और उपयोग". IEEE Transactions on Automatic Control. AC-16 (6): 529–552. doi:10.1109/TAC.1971.1099818.


अग्रिम पठन