रैखिक-द्विघात-गाऊसी नियंत्रण: Difference between revisions
(Created page with "{{Short description|Linear optimal control technique}} नियंत्रण सिद्धांत में, रैखिक-द्विघात-गाऊसी (...") |
m (3 revisions imported from alpha:रैखिक-द्विघात-गाऊसी_नियंत्रण) |
||
(2 intermediate revisions by 2 users not shown) | |||
Line 1: | Line 1: | ||
{{Short description|Linear optimal control technique}} | {{Short description|Linear optimal control technique}} | ||
[[नियंत्रण सिद्धांत]] में, रैखिक-द्विघात-गाऊसी ( | [[नियंत्रण सिद्धांत]] में, '''रैखिक-द्विघात-गाऊसी (एलक्यूजी) नियंत्रण''' समस्या सबसे मौलिक [[इष्टतम नियंत्रण]] समस्याओं में से एक है, और इसे [[मॉडल पूर्वानुमान नियंत्रण|प्रतिरूप पूर्वानुमान नियंत्रण]] के लिए बार-बार संचालित भी किया जा सकता है। यह योगात्मक सफेद गॉसियन नॉइज़ द्वारा संचालित रैखिक प्रणालियों से संबंधित है। समस्या एक निष्पाद प्रतिपुष्टि कानून निर्धारित करना है जो द्विघात [[लागत कार्यात्मक]] मानदंड के अपेक्षित मूल्य को कम करने के अर्थ में इष्टतम है। निष्पाद माप को गॉसियन नॉइज़ से दूषित माना जाता है और प्रारंभिक स्थिति को भी गॉसियन यादृच्छिक सदिश माना जाता है। | ||
इन मान्यताओं के | इन मान्यताओं के अंतर्गत रैखिक नियंत्रण कानूनों के वर्ग के भीतर एक इष्टतम नियंत्रण योजना पूर्ण-वर्ग तर्क द्वारा प्राप्त की जा सकती है। <ref name="astrom">{{cite book |author=Karl Johan Astrom |title=स्टोकेस्टिक नियंत्रण के सिद्धांत का परिचय|publisher=Academic Press |volume=58 |year=1970 |isbn=0-486-44531-3}}</ref> यह नियंत्रण कानून जिसे एलक्यूजी नियंत्रक के रूप में जाना जाता है, वह अद्वितीय है और यह केवल एक [[कलमन फ़िल्टर|कलमन निस्यंदक]] (एक रैखिक-द्विघात स्तिथि अनुमानक (एलक्यूई)) के साथ एक रैखिक-द्विघात नियामक (एलक्यूआर) का एक संयोजन है। [[पृथक्करण सिद्धांत]] बताता है कि स्तिथि अनुमानक और स्तिथि प्रतिपुष्टि को स्वतंत्र रूप से अभिकल्पित किया जा सकता है। एलक्यूजी रैखिक समय-अपरिवर्तनीय प्रणालियों के साथ-साथ समय-संस्करण प्रणाली दोनों पर लागू होता है, और एक रैखिक गतिशील प्रतिक्रिया नियंत्रण कानून का गठन करता है जिसे आसानी से गणना और कार्यान्वित किया जाता है: एलक्यूजी नियंत्रक स्वयं एक गतिशील प्रणाली है उस प्रणाली की तरह जिसे वह नियंत्रित करता है। दोनों प्रणालियों का स्तिथि आयाम समान है। | ||
पृथक्करण सिद्धांत का एक गहरा कथन यह है कि एलक्यूजी नियंत्रक संभवतः गैर-रेखीय नियंत्रकों की एक विस्तृत श्रेणी में अभी भी इष्टतम है। अर्थात्, एक अरेखीय नियंत्रण योजना का उपयोग करने से लागत | पृथक्करण सिद्धांत का एक गहरा कथन यह है कि एलक्यूजी नियंत्रक संभवतः गैर-रेखीय नियंत्रकों की एक विस्तृत श्रेणी में अभी भी इष्टतम है। अर्थात्, एक अरेखीय नियंत्रण योजना का उपयोग करने से लागत फलन के अपेक्षित मूल्य में सुधार नहीं होगा। पृथक्करण सिद्धांत का यह संस्करण [[स्टोकेस्टिक नियंत्रण में पृथक्करण सिद्धांत|प्रसंभाव्य नियंत्रण में पृथक्करण सिद्धांत]] की एक विशेष स्तिथि है जो बताता है कि भले ही प्रक्रिया और निष्पाद नॉइज़ स्रोत संभवतः गैर-गाऊसी [[मार्टिंगेल (संभावना सिद्धांत)]] हों, जब तक कि प्रणाली की गतिशीलता रैखिक होती है, इष्टतम नियंत्रण एक इष्टतम स्थिति अनुमानक (जो अब कलमैन निस्यंदक नहीं हो सकता है) और एक एलक्यूआर नियामक में अलग हो जाता है। <ref name="lindquist">{{cite journal |author=Anders Lindquist|title=लीनियर स्टोकेस्टिक सिस्टम के फीडबैक नियंत्रण पर|journal=SIAM Journal on Control |volume=11 |issue=2 |pages=323–343 |year=1973|doi=10.1137/0311025 }}.</ref><ref name="GL2013">{{cite journal |author=Tryphon T. Georgiou and Anders Lindquist |title=स्टोकेस्टिक नियंत्रण में पृथक्करण सिद्धांत, रिडक्स|journal=IEEE Transactions on Automatic Control |volume=58 |issue=10 |pages=2481–2494 |year=2013 |doi=10.1109/TAC.2013.2259207|arxiv=1103.3005 |s2cid=12623187 }}</ref> | ||
एलक्यूजी इष्टतमता स्वचालित रूप से अच्छी मजबूती गुणों को सुनिश्चित नहीं करती है।<ref>{{cite book |first1=Michael |last1=Green |first2=David J. N. |last2=Limebeer |title=रैखिक मजबूत नियंत्रण|location=Englewood Cliffs |publisher=Prentice Hall |year=1995 |isbn=0-13-102278-4 |page=27 |url=https://books.google.com/books?id=8NdSAAAAMAAJ&pg=PA27 }}</ref> एलक्यूजी नियंत्रक के | पारम्परिक एलक्यूजी प्रणाली में, प्रणाली स्थिति का आयाम बड़ा होने पर एलक्यूजी नियंत्रक का कार्यान्वयन समस्याग्रस्त हो सकता है। कम-क्रम वाली एलक्यूजी समस्या (निश्चित-क्रम एलक्यूजी समस्या) एलक्यूजी नियंत्रक की स्तिथि की संख्या प्राथमिकता को ठीक करके इस पर नियंत्रण पाती है। इस समस्या को हल करना अधिक कठिन है क्योंकि इसे अब अलग नहीं किया जा सकता है। साथ ही, समाधान अब अद्वितीय नहीं रहा। इन तथ्यों के होने पर भी संबंधित [[इष्टतम प्रक्षेपण समीकरण]] को हल करने के लिए संख्यात्मक एल्गोरिदम उपलब्ध हैं <ref name="Bern1">{{cite journal |author1=Hyland D.C |author2=Bernstein D.S. |title=निश्चित क्रम गतिशील मुआवजे के लिए इष्टतम प्रक्षेपण समीकरण|journal=IEEE Transactions on Automatic Control |volume=AC-29 | pages=1034–1037 |year=1984 |doi=10.1109/TAC.1984.1103418 |issue=11|url=https://deepblue.lib.umich.edu/bitstream/2027.42/57875/1/OptimalProjectionRedOrdDynCompTAC1984.pdf |hdl=2027.42/57875 |hdl-access=free }}</ref><ref name="Bern2">{{cite journal |author1=Bernstein D.S. |author2=Davis L.D. |author3=Hyland D.C. |title=कम-क्रम वाले असतत-समय मॉडलिंग अनुमान और नियंत्रण के लिए इष्टतम प्रक्षेपण समीकरण|journal=Journal of Guidance, Control, and Dynamics| volume=9 |issue=3 |pages=288–293 |year=1986 |doi=10.2514/3.20105|url=https://deepblue.lib.umich.edu/bitstream/2027.42/57880/1/DTReduced-OrderDiscrete-TimeModelingEstimationandControl.pdf |bibcode=1986JGCD....9..288B |hdl=2027.42/57880 |hdl-access=free }}</ref><ref name="Wil1">{{cite journal |author1=Van Willigenburg L.G. |author2=De Koning W.L. |title=संख्यात्मक एल्गोरिदम और असतत-समय इष्टतम प्रक्षेपण समीकरणों से संबंधित मुद्दे|journal=European Journal of Control |volume=6 |issue=1 |pages=93–100 |year=2000 |doi=10.1016/s0947-3580(00)70917-4}} [http://www.mathworks.com/matlabcentral/fileexchange/loadFile.do?objectId=19948&objectType=file Associated software download from Matlab Central].</ref><ref name="Wil2">{{cite journal |author1=Van Willigenburg L.G. |author2=De Koning W.L. |title=नियतात्मक और सफेद मापदंडों के साथ समय-अलग-अलग असतत-समय प्रणालियों के लिए इष्टतम कम-ऑर्डर कम्पेसाटर|journal=Automatica |volume=35 |pages=129–138 |year=1999 |doi=10.1016/S0005-1098(98)00138-1}} [http://www.mathworks.com/matlabcentral/fileexchange/loadFile.do?objectId=20014&objectType=FILE Associated software download from Matlab Central].</ref><ref name="Bern3">{{cite journal |author1=Zigic D. |author2=Watson L.T. |author3=Collins E.G. |author4=Haddad W.M. |author5=Ying S. |title=Homotopy methods for solving the optimal projection equations for the H2 reduced order model problem |journal=International Journal of Control |volume=56 | issue=1 | pages=173–191 |year=1996 |doi=10.1080/00207179208934308}}</ref><ref name="Had1">{{cite journal |author1=Collins Jr. E.G |author2=Haddad W.M. |author3=Ying S. |title=हाइलैंड-बर्नस्टीन इष्टतम प्रक्षेपण समीकरणों का उपयोग करके कम-ऑर्डर गतिशील मुआवजे के लिए एक होमोटॉपी एल्गोरिदम|journal=Journal of Guidance, Control, and Dynamics |volume=19 |pages=407–417 |year=1996 |doi=10.2514/3.21633 |issue=2}}</ref> जो स्थानीय रूप से इष्टतम लघुकृत-क्रम एलक्यूजी नियंत्रक के लिए आवश्यक और पर्याप्त परिस्थितियों का गठन करता है। <ref name="Wil1" /> | ||
एलक्यूजी इष्टतमता स्वचालित रूप से अच्छी मजबूती गुणों को सुनिश्चित नहीं करती है। <ref>{{cite book |first1=Michael |last1=Green |first2=David J. N. |last2=Limebeer |title=रैखिक मजबूत नियंत्रण|location=Englewood Cliffs |publisher=Prentice Hall |year=1995 |isbn=0-13-102278-4 |page=27 |url=https://books.google.com/books?id=8NdSAAAAMAAJ&pg=PA27 }}</ref> एलक्यूजी नियंत्रक के अभिकल्पित किए जाने के बाद बंद पाश तंत्र की मजबूत स्थिरता की अलग से जांच की जानी चाहिए। मजबूती को बढ़ावा देने के लिए कुछ प्रणाली मापदंडों को नियतिवादी के स्थान पर प्रसंभाव्य माना जा सकता है। संबंधित अधिक कठिन नियंत्रण समस्या एक समान इष्टतम नियंत्रक की ओर ले जाती है जिसके केवल नियंत्रक मापदण्ड भिन्न होते हैं। <ref name="Wil2" /> | |||
इष्टतम लाभ के साथ-साथ स्थिर लाभ के किसी अन्य समुच्चय के लिए लागत फलन के अपेक्षित मूल्य की गणना करना संभव है। <ref>{{cite journal |last1=Matsakis |first1=Demetrios |title=नियंत्रित घड़ियों के व्यवहार पर आनुपातिक स्टीयरिंग रणनीतियों का प्रभाव|journal=Metrologia |date=March 8, 2019 |volume=56 |issue=2 |pages=025007 |doi=10.1088/1681-7575/ab0614 |bibcode=2019Metro..56b5007M |doi-access=free }}</ref> | |||
एलक्यूजी नियंत्रक का उपयोग अशान्त गैर-रेखीय प्रणालियों को नियंत्रित करने के लिए भी किया जाता है। <ref name="Athans">{{cite journal |author=Athans M. |title=नियंत्रण प्रणाली डिज़ाइन में स्टोकेस्टिक लीनियर-क्वाड्रैटिक-गॉसियन समस्या की भूमिका और उपयोग|journal=IEEE Transactions on Automatic Control |volume=AC-16 |issue=6 |pages=529–552 |year=1971 |doi=10.1109/TAC.1971.1099818}}</ref> | |||
Line 20: | Line 23: | ||
: <math>\dot{\mathbf{x}}(t) = A(t) \mathbf{x}(t) + B(t) \mathbf{u}(t) + \mathbf{v}(t),</math> | : <math>\dot{\mathbf{x}}(t) = A(t) \mathbf{x}(t) + B(t) \mathbf{u}(t) + \mathbf{v}(t),</math> | ||
: <math>\mathbf{y}(t) = C(t) \mathbf{x}(t) + \mathbf{w}(t),</math> | : <math>\mathbf{y}(t) = C(t) \mathbf{x}(t) + \mathbf{w}(t),</math> | ||
जहाँ <math>{\mathbf{x}}</math> प्रणाली के स्तिथि चर के सदिश का प्रतिनिधित्व करता है, <math>{\mathbf{u}}</math> नियंत्रण निविष्ट का सदिश और <math>{\mathbf{y}}</math> प्रतिपुष्टि के लिए उपलब्ध मापे गए निष्पाद के सदिश का प्रतिनिधित्व करता है। दोनों योगात्मक सफेद गाऊसी प्रणाली नॉइज़ <math>\mathbf{v}(t)</math> और योगात्मक सफेद गाऊसी माप नॉइज़ <math>\mathbf{w}(t)</math> प्रणाली को प्रभावित करते हैं। इस प्रणाली को देखते हुए उद्देश्य नियंत्रण निविष्ट इतिहास <math>{\mathbf{u}}(t)</math> का पता लगाना है जो हर समय <math>{\mathbf{}}t</math> केवल पिछले माप <math>{\mathbf{y}}(t'), 0 \leq t' < t</math> पर रैखिक रूप से निर्भर हो सकता है। इस प्रकार कि निम्नलिखित लागत फलन न्यूनतम हो जाए: | |||
: <math> J = \mathbb{E}\left[{\mathbf{x}^\mathrm T}(T)F{\mathbf{x}}(T)+ \int_{0}^{T} {\mathbf{x}^\mathrm T}(t)Q(t){\mathbf{x}}(t) + {\mathbf{u}^\mathrm T}(t)R(t){\mathbf{u}}(t)\,dt \right],</math> | : <math> J = \mathbb{E}\left[{\mathbf{x}^\mathrm T}(T)F{\mathbf{x}}(T)+ \int_{0}^{T} {\mathbf{x}^\mathrm T}(t)Q(t){\mathbf{x}}(t) + {\mathbf{u}^\mathrm T}(t)R(t){\mathbf{u}}(t)\,dt \right],</math> | ||
: <math> F \ge 0,\quad Q(t) \ge 0,\quad R(t) > 0, </math> | : <math> F \ge 0,\quad Q(t) \ge 0,\quad R(t) > 0, </math> | ||
जहाँ <math>\mathbb{E}</math> [[अपेक्षित मूल्य]] को दर्शाता है। अंतिम समय (क्षितिज) <math>{\mathbf{}}T</math> या तो सीमित या अनंत हो सकता है। यदि क्षितिज पहले पद <math>{\mathbf{x}}^\mathrm T(T)F{\mathbf{x}}(T)</math> की ओर अनंत की ओर प्रवृत्त होता है तो लागत फलन समस्या के लिए नगण्य और अप्रासंगिक हो जाता है। इसके अतिरिक्त लागत को सीमित रखने के लिए लागत फलन <math>{\mathbf{}}J/T</math> को अपनाना होगा। | |||
एलक्यूजी नियंत्रक जो एलक्यूजी नियंत्रण समस्या को हल करता है, निम्नलिखित समीकरणों द्वारा निर्दिष्ट किया गया है: | |||
: <math> \dot{\hat{\mathbf{x}}}(t) = A(t)\hat{\mathbf{x}}(t) + B(t){\mathbf{u}}(t)+L(t) \left( {\mathbf{y}}(t)-C(t)\hat{\mathbf{x}}(t) \right), \quad \hat{\mathbf{x}}(0) = \mathbb{E} \left[ {\mathbf{x}}(0) \right], </math> | : <math> \dot{\hat{\mathbf{x}}}(t) = A(t)\hat{\mathbf{x}}(t) + B(t){\mathbf{u}}(t)+L(t) \left( {\mathbf{y}}(t)-C(t)\hat{\mathbf{x}}(t) \right), \quad \hat{\mathbf{x}}(0) = \mathbb{E} \left[ {\mathbf{x}}(0) \right], </math> | ||
: <math> {\mathbf{u}}(t)= -K(t) \hat{\mathbf{x}}(t).</math> | : <math> {\mathbf{u}}(t)= -K(t) \hat{\mathbf{x}}(t).</math> | ||
आव्यूह <math>{\mathbf{}}L(t)</math> को पहले समीकरण द्वारा दर्शाए गए संबंधित कलमैन फ़िल्टर का कलमैन लाभ कहा जाता है। हर समय <math>{\mathbf{}}t</math> पर यह निस्यंदक पिछले मापों का उपयोग करके <math>{\mathbf{x}}(t)</math> स्तिथि का अनुमान <math>\hat{\mathbf{x}}(t)</math> उत्पन्न करता है। कलमन लाभ <math>{\mathbf{}}L(t)</math> आव्यूह <math>{\mathbf{}}A(t), C(t)</math> से गणना की जाती है, दो तीव्रता आव्यूह <math>\mathbf{}V(t), W(t)</math> सफेद गॉसियन नॉइज़ <math>\mathbf{v}(t)</math> और <math>\mathbf{w}(t)</math> और अंत में <math>\mathbb{E}\left[{\mathbf{x}}(0){\mathbf{x}}^\mathrm T(0) \right]</math> से संबंधित है। ये पांच आव्यूह निम्नलिखित संबंधित आव्यूह रिकाटी अंतर समीकरण के माध्यम से कलमन लाभ निर्धारित करते हैं: | |||
: <math> \dot{P}(t) = A(t)P(t)+P(t)A^\mathrm T(t)-P(t)C^\mathrm T(t){\mathbf{}}W^{-1}(t) | : <math> \dot{P}(t) = A(t)P(t)+P(t)A^\mathrm T(t)-P(t)C^\mathrm T(t){\mathbf{}}W^{-1}(t) | ||
C(t)P(t)+V(t),</math> | C(t)P(t)+V(t),</math> | ||
: <math> P(0)= \mathbb{E} \left[{\mathbf{x}}(0){\mathbf{x}}^\mathrm T(0) \right].</math> | : <math> P(0)= \mathbb{E} \left[{\mathbf{x}}(0){\mathbf{x}}^\mathrm T(0) \right].</math> | ||
समाधान | समाधान <math>P(t), 0 \leq t \leq T</math> को देखते हुए कलमन लाभ निम्नलिखित के बराबर है | ||
: <math> {\mathbf{}}L(t) = P(t)C^\mathrm T(t)W^{-1}(t). </math> | : <math> {\mathbf{}}L(t) = P(t)C^\mathrm T(t)W^{-1}(t). </math> | ||
गणित का सवाल <math>{\mathbf{}}K(t)</math> | गणित का सवाल <math>{\mathbf{}}K(t)</math> प्रतिपुष्टि प्राप्ति आव्यूह कहा जाता है। यह आव्यूह <math>{\mathbf{}}A(t), B(t), Q(t), R(t)</math> और <math>{\mathbf{}}F</math> आव्यूह द्वारा निर्धारित होता है, निम्नलिखित संबद्ध आव्यूह रिकाटी अंतर के माध्यम से निर्धारित किया जाता है: | ||
: <math> -\dot{S}(t) = A^\mathrm T(t)S(t)+S(t)A(t)-S(t)B(t)R^{-1}(t)B^\mathrm T(t)S(t)+Q(t),</math> | : <math> -\dot{S}(t) = A^\mathrm T(t)S(t)+S(t)A(t)-S(t)B(t)R^{-1}(t)B^\mathrm T(t)S(t)+Q(t),</math> | ||
: <math> {\mathbf{}}S(T) = F.</math> | : <math> {\mathbf{}}S(T) = F.</math> | ||
समाधान | समाधान <math>{\mathbf{}}S(t), 0 \leq t \leq T</math> को देखते हुए प्रतिपुष्टि लाभ निम्नलिखित के बराबर है | ||
: <math> {\mathbf{}}K(t) = R^{-1}(t)B^\mathrm T(t)S(t).</math> | : <math> {\mathbf{}}K(t) = R^{-1}(t)B^\mathrm T(t)S(t).</math> | ||
दो | दो आव्यूह रिकाटी अंतर समीकरणों की समानता का निरीक्षण करें, पहला समय में आगे चल रहा है, दूसरा समय में पीछे चल रहा है। इस समानता को द्वंद्व कहा जाता है। पहला आव्यूह रिकाटी अंतर समीकरण रैखिक-द्विघात अनुमान समस्या (एलक्यूई) को हल करता है। दूसरा आव्यूह रिकाटी अंतर समीकरण रैखिक-द्विघात नियामक समस्या (एलक्यूआर) को हल करता है। ये समस्याएँ दोहरी हैं और साथ में ये रैखिक-द्विघात-गाऊसी नियंत्रण समस्या (एलक्यूजी) को हल करती हैं। तो एलक्यूजी समस्या एलक्यूई और एलक्यूआर समस्या में विभाजित हो जाती है जिसे स्वतंत्र रूप से हल किया जा सकता है। इसलिए, एलक्यूजी समस्या को वियोज्य कहा जाता है। | ||
जब <math>{\mathbf{}}A(t), B(t), C(t), Q(t), R(t)</math> और नॉइज़ तीव्रता आव्यूह <math>\mathbf{}V(t)</math>, <math>\mathbf{}W(t)</math> <math>{\mathbf{}}t</math> पर निर्भर न रहें और जब <math>{\mathbf{}}T</math> अनंत तक जाने पर एलक्यूजी नियंत्रक एक समय-अपरिवर्तनीय गतिशील प्रणाली बन जाता है। उस स्थिति में दूसरे आव्यूह रिकाटी अंतर समीकरण को संबंधित बीजगणितीय रिकाटी समीकरण द्वारा प्रतिस्थापित किया जा सकता है। | |||
=== | ===असतत समय=== | ||
चूंकि असतत-समय एलक्यूजी नियंत्रण समस्या निरंतर-समय के समान है, इसलिए नीचे दिया गया विवरण गणितीय समीकरणों पर केंद्रित है। | चूंकि असतत-समय एलक्यूजी नियंत्रण समस्या निरंतर-समय के समान है, इसलिए नीचे दिया गया विवरण गणितीय समीकरणों पर केंद्रित है। | ||
Line 56: | Line 59: | ||
: <math>{\mathbf{x}}_{i+1} = A_i\mathbf{x}_i + B_i \mathbf{u}_i + \mathbf{v}_i,</math> | : <math>{\mathbf{x}}_{i+1} = A_i\mathbf{x}_i + B_i \mathbf{u}_i + \mathbf{v}_i,</math> | ||
: <math>\mathbf{y}_{i} = C_{i} \mathbf{x}_i + \mathbf{w}_i.</math> | : <math>\mathbf{y}_{i} = C_{i} \mathbf{x}_i + \mathbf{w}_i.</math> | ||
यहाँ <math>\mathbf{}i</math> असतत समय सूचकांक का प्रतिनिधित्व करता है और <math>\mathbf{v}_{i}, \mathbf{w}_{i}</math> सहप्रसरण | यहाँ <math>\mathbf{}i</math> असतत समय सूचकांक का प्रतिनिधित्व करता है और <math>\mathbf{v}_{i}, \mathbf{w}_{i}</math> सहप्रसरण आव्यूह <math>\mathbf{}V_{i}, W_{i}</math> के साथ असतत-समय गाऊसी सफेद नॉइज़ प्रक्रियाओं का क्रमशः प्रतिनिधित्व करते हैं और एक दूसरे से स्वतंत्र हैं। | ||
न्यूनतम किया जाने वाला द्विघात लागत फलन है | न्यूनतम किया जाने वाला द्विघात लागत फलन निम्न है | ||
: <math> J = \mathbb{E}\left[{\mathbf{x}}^\mathrm T_{N}F{\mathbf{x}}_{N}+ \sum_{i=0}^{N-1}( \mathbf{x}_i^\mathrm T Q_i \mathbf{x}_i + \mathbf{u}_i^\mathrm T R_i \mathbf{u}_i )\right],</math> | : <math> J = \mathbb{E}\left[{\mathbf{x}}^\mathrm T_{N}F{\mathbf{x}}_{N}+ \sum_{i=0}^{N-1}( \mathbf{x}_i^\mathrm T Q_i \mathbf{x}_i + \mathbf{u}_i^\mathrm T R_i \mathbf{u}_i )\right],</math> | ||
: <math> F \ge 0, Q_i \ge 0, R_i > 0. \, </math> | : <math> F \ge 0, Q_i \ge 0, R_i > 0. \, </math> | ||
असतत-समय | असतत-समय एलक्यूजी नियंत्रक है | ||
:<math>\hat{\mathbf{x}}_{i+1}=A_i\hat{\mathbf{x}}_i+B_i{\mathbf{u}}_i+L_{i+1} \left({\mathbf{y}}_{i+1}-C_{i+1} \left\{ A_i \hat{\mathbf{x}}_i + B_i \mathbf{u}_i \right\} \right), \qquad \hat{\mathbf{x}}_0=\mathbb{E}[{\mathbf{x}}_0]</math>, | :<math>\hat{\mathbf{x}}_{i+1}=A_i\hat{\mathbf{x}}_i+B_i{\mathbf{u}}_i+L_{i+1} \left({\mathbf{y}}_{i+1}-C_{i+1} \left\{ A_i \hat{\mathbf{x}}_i + B_i \mathbf{u}_i \right\} \right), \qquad \hat{\mathbf{x}}_0=\mathbb{E}[{\mathbf{x}}_0]</math>, | ||
:<math> \mathbf{u}_i=-K_i\hat{\mathbf{x}}_i. \, </math> | :<math> \mathbf{u}_i=-K_i\hat{\mathbf{x}}_i. \, </math> | ||
और <math> \hat{\mathbf{x}}_i </math> पूर्वानुमानित अनुमान | और <math> \hat{\mathbf{x}}_i </math> पूर्वानुमानित अनुमान <math> \hat{\mathbf{x}}_i = \mathbb{E}[\mathbf{x}_i|\mathbf{y}^i, \mathbf{u}^{i-1}] </math> के अनुरूप है। | ||
कलमन | कलमन लाभ निम्न के बराबर है | ||
: <math> {\mathbf{}}L_i = P_iC ^\mathrm T _i(C_iP_iC ^\mathrm T _i + W_i)^{-1}, </math> | : <math> {\mathbf{}}L_i = P_iC ^\mathrm T _i(C_iP_iC ^\mathrm T _i + W_i)^{-1}, </math> | ||
जहाँ <math>{\mathbf{}}P_i</math> निम्नलिखित आव्यूह रिकाटी अंतर समीकरण द्वारा निर्धारित किया जाता है जो समय में आगे बढ़ता है: | |||
: <math> P_{i+1} = A_i \left( P_i - P_i C ^\mathrm T _i \left( C_i P_i C ^\mathrm T _i+W_i \right)^{-1} C_i P_i \right) A ^\mathrm T _i+V_i, \qquad P_0=\mathbb{E} [\left( {\mathbf{x}}_0 - \hat{\mathbf{x}}_0\right)\left({\mathbf{x}}_0- \hat{\mathbf{x}}_0\right)^\mathrm T]. </math> | : <math> P_{i+1} = A_i \left( P_i - P_i C ^\mathrm T _i \left( C_i P_i C ^\mathrm T _i+W_i \right)^{-1} C_i P_i \right) A ^\mathrm T _i+V_i, \qquad P_0=\mathbb{E} [\left( {\mathbf{x}}_0 - \hat{\mathbf{x}}_0\right)\left({\mathbf{x}}_0- \hat{\mathbf{x}}_0\right)^\mathrm T]. </math> | ||
प्रतिपुष्टि वृद्धि आव्यूह निम्न के बराबर है | |||
: <math> {\mathbf{}}K_i = (B^\mathrm T_iS_{i+1}B_i + R_i)^{-1}B^\mathrm T_iS_{i+1}A_i </math> | : <math> {\mathbf{}}K_i = (B^\mathrm T_iS_{i+1}B_i + R_i)^{-1}B^\mathrm T_iS_{i+1}A_i </math> | ||
जहाँ <math>{\mathbf{}}S_i</math> निम्नलिखित आव्यूह रिकाटी अंतर समीकरण द्वारा निर्धारित किया जाता है जो समय में पीछे चलता है: | |||
: <math> S_i = A^\mathrm T_i \left( S_{i+1} - S_{i+1}B_i \left( B^\mathrm T_iS_{i+1}B_i+R_i \right)^{-1} B^\mathrm T_i S_{i+1} \right) A_i+Q_i, \quad S_N=F.</math> | : <math> S_i = A^\mathrm T_i \left( S_{i+1} - S_{i+1}B_i \left( B^\mathrm T_iS_{i+1}B_i+R_i \right)^{-1} B^\mathrm T_i S_{i+1} \right) A_i+Q_i, \quad S_N=F.</math> | ||
यदि समस्या सूत्रीकरण में सभी आव्यूह समय-अपरिवर्तनीय हैं और यदि क्षितिज <math>{\mathbf{}}N</math> अनंत की ओर प्रवृत्त होने पर असतत-समय | यदि समस्या सूत्रीकरण में सभी आव्यूह समय-अपरिवर्तनीय हैं और यदि क्षितिज <math>{\mathbf{}}N</math> अनंत की ओर प्रवृत्त होने पर असतत-समय एलक्यूजी नियंत्रक समय-अपरिवर्तनीय बन जाता है। उस स्थिति में आव्यूह रिकाटी अंतर समीकरणों को उनके संबंधित असतत-समय बीजगणितीय रिकाटी समीकरणों द्वारा प्रतिस्थापित किया जा सकता है। ये अलग-अलग समय में समय-अपरिवर्तनीय रैखिक-द्विघात अनुमानक और समय-अपरिवर्तनीय रैखिक-द्विघात नियामक निर्धारित करते हैं। इस स्तिथि में लागत को <math>{\mathbf{}}J</math> के स्थान पर सीमित रखने के लिए <math>{\mathbf{}}J/N</math> पर विचार करना होगा। | ||
==यह भी देखें== | ==यह भी देखें== | ||
*[[स्टोकेस्टिक नियंत्रण]] | *[[स्टोकेस्टिक नियंत्रण|प्रसंभाव्य नियंत्रण]] | ||
*विट्सनहाउज़ेन का प्रतिउदाहरण | *विट्सनहाउज़ेन का प्रतिउदाहरण | ||
Line 101: | Line 104: | ||
[[Category: Machine Translated Page]] | [[Category: Machine Translated Page]] | ||
[[Category:Created On 15/08/2023]] | [[Category:Created On 15/08/2023]] | ||
[[Category:Vigyan Ready]] |
Latest revision as of 07:02, 16 October 2023
नियंत्रण सिद्धांत में, रैखिक-द्विघात-गाऊसी (एलक्यूजी) नियंत्रण समस्या सबसे मौलिक इष्टतम नियंत्रण समस्याओं में से एक है, और इसे प्रतिरूप पूर्वानुमान नियंत्रण के लिए बार-बार संचालित भी किया जा सकता है। यह योगात्मक सफेद गॉसियन नॉइज़ द्वारा संचालित रैखिक प्रणालियों से संबंधित है। समस्या एक निष्पाद प्रतिपुष्टि कानून निर्धारित करना है जो द्विघात लागत कार्यात्मक मानदंड के अपेक्षित मूल्य को कम करने के अर्थ में इष्टतम है। निष्पाद माप को गॉसियन नॉइज़ से दूषित माना जाता है और प्रारंभिक स्थिति को भी गॉसियन यादृच्छिक सदिश माना जाता है।
इन मान्यताओं के अंतर्गत रैखिक नियंत्रण कानूनों के वर्ग के भीतर एक इष्टतम नियंत्रण योजना पूर्ण-वर्ग तर्क द्वारा प्राप्त की जा सकती है। [1] यह नियंत्रण कानून जिसे एलक्यूजी नियंत्रक के रूप में जाना जाता है, वह अद्वितीय है और यह केवल एक कलमन निस्यंदक (एक रैखिक-द्विघात स्तिथि अनुमानक (एलक्यूई)) के साथ एक रैखिक-द्विघात नियामक (एलक्यूआर) का एक संयोजन है। पृथक्करण सिद्धांत बताता है कि स्तिथि अनुमानक और स्तिथि प्रतिपुष्टि को स्वतंत्र रूप से अभिकल्पित किया जा सकता है। एलक्यूजी रैखिक समय-अपरिवर्तनीय प्रणालियों के साथ-साथ समय-संस्करण प्रणाली दोनों पर लागू होता है, और एक रैखिक गतिशील प्रतिक्रिया नियंत्रण कानून का गठन करता है जिसे आसानी से गणना और कार्यान्वित किया जाता है: एलक्यूजी नियंत्रक स्वयं एक गतिशील प्रणाली है उस प्रणाली की तरह जिसे वह नियंत्रित करता है। दोनों प्रणालियों का स्तिथि आयाम समान है।
पृथक्करण सिद्धांत का एक गहरा कथन यह है कि एलक्यूजी नियंत्रक संभवतः गैर-रेखीय नियंत्रकों की एक विस्तृत श्रेणी में अभी भी इष्टतम है। अर्थात्, एक अरेखीय नियंत्रण योजना का उपयोग करने से लागत फलन के अपेक्षित मूल्य में सुधार नहीं होगा। पृथक्करण सिद्धांत का यह संस्करण प्रसंभाव्य नियंत्रण में पृथक्करण सिद्धांत की एक विशेष स्तिथि है जो बताता है कि भले ही प्रक्रिया और निष्पाद नॉइज़ स्रोत संभवतः गैर-गाऊसी मार्टिंगेल (संभावना सिद्धांत) हों, जब तक कि प्रणाली की गतिशीलता रैखिक होती है, इष्टतम नियंत्रण एक इष्टतम स्थिति अनुमानक (जो अब कलमैन निस्यंदक नहीं हो सकता है) और एक एलक्यूआर नियामक में अलग हो जाता है। [2][3]
पारम्परिक एलक्यूजी प्रणाली में, प्रणाली स्थिति का आयाम बड़ा होने पर एलक्यूजी नियंत्रक का कार्यान्वयन समस्याग्रस्त हो सकता है। कम-क्रम वाली एलक्यूजी समस्या (निश्चित-क्रम एलक्यूजी समस्या) एलक्यूजी नियंत्रक की स्तिथि की संख्या प्राथमिकता को ठीक करके इस पर नियंत्रण पाती है। इस समस्या को हल करना अधिक कठिन है क्योंकि इसे अब अलग नहीं किया जा सकता है। साथ ही, समाधान अब अद्वितीय नहीं रहा। इन तथ्यों के होने पर भी संबंधित इष्टतम प्रक्षेपण समीकरण को हल करने के लिए संख्यात्मक एल्गोरिदम उपलब्ध हैं [4][5][6][7][8][9] जो स्थानीय रूप से इष्टतम लघुकृत-क्रम एलक्यूजी नियंत्रक के लिए आवश्यक और पर्याप्त परिस्थितियों का गठन करता है। [6]
एलक्यूजी इष्टतमता स्वचालित रूप से अच्छी मजबूती गुणों को सुनिश्चित नहीं करती है। [10] एलक्यूजी नियंत्रक के अभिकल्पित किए जाने के बाद बंद पाश तंत्र की मजबूत स्थिरता की अलग से जांच की जानी चाहिए। मजबूती को बढ़ावा देने के लिए कुछ प्रणाली मापदंडों को नियतिवादी के स्थान पर प्रसंभाव्य माना जा सकता है। संबंधित अधिक कठिन नियंत्रण समस्या एक समान इष्टतम नियंत्रक की ओर ले जाती है जिसके केवल नियंत्रक मापदण्ड भिन्न होते हैं। [7]
इष्टतम लाभ के साथ-साथ स्थिर लाभ के किसी अन्य समुच्चय के लिए लागत फलन के अपेक्षित मूल्य की गणना करना संभव है। [11]
एलक्यूजी नियंत्रक का उपयोग अशान्त गैर-रेखीय प्रणालियों को नियंत्रित करने के लिए भी किया जाता है। [12]
समस्या और समाधान का गणितीय विवरण
निरंतर समय
सतत-समय रैखिक गतिशील प्रणाली पर विचार करें
जहाँ प्रणाली के स्तिथि चर के सदिश का प्रतिनिधित्व करता है, नियंत्रण निविष्ट का सदिश और प्रतिपुष्टि के लिए उपलब्ध मापे गए निष्पाद के सदिश का प्रतिनिधित्व करता है। दोनों योगात्मक सफेद गाऊसी प्रणाली नॉइज़ और योगात्मक सफेद गाऊसी माप नॉइज़ प्रणाली को प्रभावित करते हैं। इस प्रणाली को देखते हुए उद्देश्य नियंत्रण निविष्ट इतिहास का पता लगाना है जो हर समय केवल पिछले माप पर रैखिक रूप से निर्भर हो सकता है। इस प्रकार कि निम्नलिखित लागत फलन न्यूनतम हो जाए:
जहाँ अपेक्षित मूल्य को दर्शाता है। अंतिम समय (क्षितिज) या तो सीमित या अनंत हो सकता है। यदि क्षितिज पहले पद की ओर अनंत की ओर प्रवृत्त होता है तो लागत फलन समस्या के लिए नगण्य और अप्रासंगिक हो जाता है। इसके अतिरिक्त लागत को सीमित रखने के लिए लागत फलन को अपनाना होगा।
एलक्यूजी नियंत्रक जो एलक्यूजी नियंत्रण समस्या को हल करता है, निम्नलिखित समीकरणों द्वारा निर्दिष्ट किया गया है:
आव्यूह को पहले समीकरण द्वारा दर्शाए गए संबंधित कलमैन फ़िल्टर का कलमैन लाभ कहा जाता है। हर समय पर यह निस्यंदक पिछले मापों का उपयोग करके स्तिथि का अनुमान उत्पन्न करता है। कलमन लाभ आव्यूह से गणना की जाती है, दो तीव्रता आव्यूह सफेद गॉसियन नॉइज़ और और अंत में से संबंधित है। ये पांच आव्यूह निम्नलिखित संबंधित आव्यूह रिकाटी अंतर समीकरण के माध्यम से कलमन लाभ निर्धारित करते हैं:
समाधान को देखते हुए कलमन लाभ निम्नलिखित के बराबर है
गणित का सवाल प्रतिपुष्टि प्राप्ति आव्यूह कहा जाता है। यह आव्यूह और आव्यूह द्वारा निर्धारित होता है, निम्नलिखित संबद्ध आव्यूह रिकाटी अंतर के माध्यम से निर्धारित किया जाता है:
समाधान को देखते हुए प्रतिपुष्टि लाभ निम्नलिखित के बराबर है
दो आव्यूह रिकाटी अंतर समीकरणों की समानता का निरीक्षण करें, पहला समय में आगे चल रहा है, दूसरा समय में पीछे चल रहा है। इस समानता को द्वंद्व कहा जाता है। पहला आव्यूह रिकाटी अंतर समीकरण रैखिक-द्विघात अनुमान समस्या (एलक्यूई) को हल करता है। दूसरा आव्यूह रिकाटी अंतर समीकरण रैखिक-द्विघात नियामक समस्या (एलक्यूआर) को हल करता है। ये समस्याएँ दोहरी हैं और साथ में ये रैखिक-द्विघात-गाऊसी नियंत्रण समस्या (एलक्यूजी) को हल करती हैं। तो एलक्यूजी समस्या एलक्यूई और एलक्यूआर समस्या में विभाजित हो जाती है जिसे स्वतंत्र रूप से हल किया जा सकता है। इसलिए, एलक्यूजी समस्या को वियोज्य कहा जाता है।
जब और नॉइज़ तीव्रता आव्यूह , पर निर्भर न रहें और जब अनंत तक जाने पर एलक्यूजी नियंत्रक एक समय-अपरिवर्तनीय गतिशील प्रणाली बन जाता है। उस स्थिति में दूसरे आव्यूह रिकाटी अंतर समीकरण को संबंधित बीजगणितीय रिकाटी समीकरण द्वारा प्रतिस्थापित किया जा सकता है।
असतत समय
चूंकि असतत-समय एलक्यूजी नियंत्रण समस्या निरंतर-समय के समान है, इसलिए नीचे दिया गया विवरण गणितीय समीकरणों पर केंद्रित है।
असतत-समय रैखिक प्रणाली समीकरण हैं
यहाँ असतत समय सूचकांक का प्रतिनिधित्व करता है और सहप्रसरण आव्यूह के साथ असतत-समय गाऊसी सफेद नॉइज़ प्रक्रियाओं का क्रमशः प्रतिनिधित्व करते हैं और एक दूसरे से स्वतंत्र हैं।
न्यूनतम किया जाने वाला द्विघात लागत फलन निम्न है
असतत-समय एलक्यूजी नियंत्रक है
- ,
और पूर्वानुमानित अनुमान के अनुरूप है।
कलमन लाभ निम्न के बराबर है
जहाँ निम्नलिखित आव्यूह रिकाटी अंतर समीकरण द्वारा निर्धारित किया जाता है जो समय में आगे बढ़ता है:
प्रतिपुष्टि वृद्धि आव्यूह निम्न के बराबर है
जहाँ निम्नलिखित आव्यूह रिकाटी अंतर समीकरण द्वारा निर्धारित किया जाता है जो समय में पीछे चलता है:
यदि समस्या सूत्रीकरण में सभी आव्यूह समय-अपरिवर्तनीय हैं और यदि क्षितिज अनंत की ओर प्रवृत्त होने पर असतत-समय एलक्यूजी नियंत्रक समय-अपरिवर्तनीय बन जाता है। उस स्थिति में आव्यूह रिकाटी अंतर समीकरणों को उनके संबंधित असतत-समय बीजगणितीय रिकाटी समीकरणों द्वारा प्रतिस्थापित किया जा सकता है। ये अलग-अलग समय में समय-अपरिवर्तनीय रैखिक-द्विघात अनुमानक और समय-अपरिवर्तनीय रैखिक-द्विघात नियामक निर्धारित करते हैं। इस स्तिथि में लागत को के स्थान पर सीमित रखने के लिए पर विचार करना होगा।
यह भी देखें
- प्रसंभाव्य नियंत्रण
- विट्सनहाउज़ेन का प्रतिउदाहरण
संदर्भ
- ↑ Karl Johan Astrom (1970). स्टोकेस्टिक नियंत्रण के सिद्धांत का परिचय. Vol. 58. Academic Press. ISBN 0-486-44531-3.
- ↑ Anders Lindquist (1973). "लीनियर स्टोकेस्टिक सिस्टम के फीडबैक नियंत्रण पर". SIAM Journal on Control. 11 (2): 323–343. doi:10.1137/0311025..
- ↑ Tryphon T. Georgiou and Anders Lindquist (2013). "स्टोकेस्टिक नियंत्रण में पृथक्करण सिद्धांत, रिडक्स". IEEE Transactions on Automatic Control. 58 (10): 2481–2494. arXiv:1103.3005. doi:10.1109/TAC.2013.2259207. S2CID 12623187.
- ↑ Hyland D.C; Bernstein D.S. (1984). "निश्चित क्रम गतिशील मुआवजे के लिए इष्टतम प्रक्षेपण समीकरण" (PDF). IEEE Transactions on Automatic Control. AC-29 (11): 1034–1037. doi:10.1109/TAC.1984.1103418. hdl:2027.42/57875.
- ↑ Bernstein D.S.; Davis L.D.; Hyland D.C. (1986). "कम-क्रम वाले असतत-समय मॉडलिंग अनुमान और नियंत्रण के लिए इष्टतम प्रक्षेपण समीकरण" (PDF). Journal of Guidance, Control, and Dynamics. 9 (3): 288–293. Bibcode:1986JGCD....9..288B. doi:10.2514/3.20105. hdl:2027.42/57880.
- ↑ 6.0 6.1 Van Willigenburg L.G.; De Koning W.L. (2000). "संख्यात्मक एल्गोरिदम और असतत-समय इष्टतम प्रक्षेपण समीकरणों से संबंधित मुद्दे". European Journal of Control. 6 (1): 93–100. doi:10.1016/s0947-3580(00)70917-4. Associated software download from Matlab Central.
- ↑ 7.0 7.1 Van Willigenburg L.G.; De Koning W.L. (1999). "नियतात्मक और सफेद मापदंडों के साथ समय-अलग-अलग असतत-समय प्रणालियों के लिए इष्टतम कम-ऑर्डर कम्पेसाटर". Automatica. 35: 129–138. doi:10.1016/S0005-1098(98)00138-1. Associated software download from Matlab Central.
- ↑ Zigic D.; Watson L.T.; Collins E.G.; Haddad W.M.; Ying S. (1996). "Homotopy methods for solving the optimal projection equations for the H2 reduced order model problem". International Journal of Control. 56 (1): 173–191. doi:10.1080/00207179208934308.
- ↑ Collins Jr. E.G; Haddad W.M.; Ying S. (1996). "हाइलैंड-बर्नस्टीन इष्टतम प्रक्षेपण समीकरणों का उपयोग करके कम-ऑर्डर गतिशील मुआवजे के लिए एक होमोटॉपी एल्गोरिदम". Journal of Guidance, Control, and Dynamics. 19 (2): 407–417. doi:10.2514/3.21633.
- ↑ Green, Michael; Limebeer, David J. N. (1995). रैखिक मजबूत नियंत्रण. Englewood Cliffs: Prentice Hall. p. 27. ISBN 0-13-102278-4.
- ↑ Matsakis, Demetrios (March 8, 2019). "नियंत्रित घड़ियों के व्यवहार पर आनुपातिक स्टीयरिंग रणनीतियों का प्रभाव". Metrologia. 56 (2): 025007. Bibcode:2019Metro..56b5007M. doi:10.1088/1681-7575/ab0614.
- ↑ Athans M. (1971). "नियंत्रण प्रणाली डिज़ाइन में स्टोकेस्टिक लीनियर-क्वाड्रैटिक-गॉसियन समस्या की भूमिका और उपयोग". IEEE Transactions on Automatic Control. AC-16 (6): 529–552. doi:10.1109/TAC.1971.1099818.
अग्रिम पठन
- Stengel, Robert F. (1994). Optimal Control and Estimation. New York: Dover. ISBN 0-486-68200-5.