रैखिक-द्विघात नियामक: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
 
(9 intermediate revisions by 3 users not shown)
Line 1: Line 1:
{{Short description|Linear optimal control technique}}[[इष्टतम नियंत्रण]] का सिद्धांत न्यूनतम लागत पर एक [[गतिशील प्रणाली|गतिक तंत्र]] के संचालन से संबंधित है। वह मामला जहां सिस्टम की गतिशीलता को [[रैखिक अंतर समीकरण]]ों के एक सेट द्वारा वर्णित किया जाता है और लागत को [[द्विघात बहुपद]] [[कार्यात्मक (गणित)]] द्वारा वर्णित किया जाता है, एलक्यू समस्या कहलाती है। सिद्धांत में मुख्य परिणामों में से एक यह है कि समाधान रैखिक-द्विघात नियामक (एलक्यूआर) द्वारा प्रदान किया जाता है, एक फीडबैक नियंत्रक जिसके समीकरण नीचे दिए गए हैं।
{{Short description|Linear optimal control technique}}[[इष्टतम नियंत्रण]] का सिद्धांत न्यूनतम लागत पर एक [[गतिशील प्रणाली|गतिक तंत्र]] के संचालन से संबंधित है। वह स्थिति जहां तंत्र गतिकी को [[रैखिक अंतर समीकरण|रैखिक अवकल समीकरणों]] के एक समुच्चय द्वारा वर्णित किया जाता है और लागत को एक [[द्विघात बहुपद|द्विघात फलन]] द्वारा वर्णित किया जाता है, उसे LQ समस्या कहा जाता है। सिद्धांत में मुख्य परिणामों में से एक यह है कि समाधान '''रैखिक-द्विघात नियामक''' ('''LQR''') द्वारा प्रदान किया जाता है, एक फीडबैक (पुनर्भरण) नियंत्रक जिसके समीकरण नीचे दिए गए हैं।


LQR नियंत्रकों में गारंटीकृत लाभ मार्जिन और [[चरण मार्जिन]] के साथ अंतर्निहित मजबूती होती है,<ref>{{Cite journal |last=Lehtomaki |first=N. |last2=Sandell |first2=N. |last3=Athans |first3=M. |date=1981 |title=मजबूती के परिणामस्वरूप रैखिक-द्विघात गॉसियन आधारित बहुपरिवर्तनीय नियंत्रण डिजाइन तैयार होते हैं|url=http://ieeexplore.ieee.org/document/1102565/ |journal=IEEE Transactions on Automatic Control |language=en |volume=26 |issue=1 |pages=75–93 |doi=10.1109/TAC.1981.1102565 |issn=0018-9286}}</ref> और वे रैखिक-द्विघात-गाऊसी नियंत्रण|एलक्यूजी (रैखिक-द्विघात-गाऊसी) समस्या के समाधान का भी हिस्सा हैं। एलक्यूआर समस्या की तरह ही, एलक्यूजी समस्या भी [[नियंत्रण सिद्धांत]] में सबसे बुनियादी समस्याओं में से एक है।
LQR नियंत्रकों में गारंटित [[लाभ]] और [[चरण मार्जिन|फेज मार्जिन]] के साथ अंतर्निहित मजबूती होती है,<ref>{{Cite journal |last=Lehtomaki |first=N. |last2=Sandell |first2=N. |last3=Athans |first3=M. |date=1981 |title=मजबूती के परिणामस्वरूप रैखिक-द्विघात गॉसियन आधारित बहुपरिवर्तनीय नियंत्रण डिजाइन तैयार होते हैं|url=http://ieeexplore.ieee.org/document/1102565/ |journal=IEEE Transactions on Automatic Control |language=en |volume=26 |issue=1 |pages=75–93 |doi=10.1109/TAC.1981.1102565 |issn=0018-9286}}</ref> और वे [[LQG (रैखिक-द्विघात-गाऊसी) समस्या]] के समाधान के भी भाग हैं। LQR समस्या की तरह, LQG समस्या भी [[नियंत्रण सिद्धांत]] में सबसे मौलिक समस्याओं में से एक है।


==सामान्य विवरण==
==सामान्य विवरण==
किसी मशीन या प्रक्रिया (जैसे हवाई जहाज या रासायनिक रिएक्टर) को नियंत्रित करने वाले (विनियमन करने वाले) नियंत्रक की सेटिंग्स एक गणितीय एल्गोरिदम का उपयोग करके पाई जाती हैं जो मानव (इंजीनियर) द्वारा आपूर्ति किए गए भार कारकों के साथ हानि फ़ंक्शन को कम करती है। लागत फ़ंक्शन को अक्सर उनके वांछित मूल्यों से ऊंचाई या प्रक्रिया तापमान जैसे प्रमुख मापों के विचलन के योग के रूप में परिभाषित किया जाता है। इस प्रकार एल्गोरिदम उन नियंत्रक सेटिंग्स को ढूंढता है जो अवांछित विचलन को कम करते हैं। नियंत्रण कार्रवाई का परिमाण भी लागत फ़ंक्शन में शामिल किया जा सकता है।
किसी मशीन या प्रक्रिया (जैसे हवाई जहाज या रासायनिक अभिक्रियक) को नियंत्रित करने वाले (विनियमन करने वाले) नियंत्रक की सेटिंग एक गणितीय कलन विधि का उपयोग करके पाई जाती है जो मानव (इंजीनियर) द्वारा आपूर्ति किए गए भारक गुणकों के साथ [[लागत फलन]] को कम करती है। लागत फलन को अधितर उनके अपेक्षित मानों से शीर्षलंब या प्रक्रम ताप जैसे प्रमुख मापों के विचलनों के योग के रूप में परिभाषित किया जाता है। इस प्रकार कलन विधि उन नियंत्रक सेटिंग्स को खोजती है जो अवांछित विचलनों को कम करते हैं। नियंत्रण क्रिया का परिमाण भी लागत फलन में सम्मिलित किया जा सकता है।
 
LQR एल्गोरिदम नियंत्रक को अनुकूलित करने के लिए नियंत्रण सिस्टम इंजीनियर द्वारा किए गए कार्य की मात्रा को कम कर देता है। हालाँकि, इंजीनियर को अभी भी लागत फ़ंक्शन पैरामीटर निर्दिष्ट करने और निर्दिष्ट डिज़ाइन लक्ष्यों के साथ परिणामों की तुलना करने की आवश्यकता है। अक्सर इसका मतलब यह होता है कि नियंत्रक निर्माण एक पुनरावृत्तीय प्रक्रिया होगी जिसमें इंजीनियर सिमुलेशन के माध्यम से उत्पादित इष्टतम नियंत्रकों का मूल्यांकन करता है और फिर डिजाइन लक्ष्यों के साथ अधिक सुसंगत नियंत्रक का उत्पादन करने के लिए मापदंडों को समायोजित करता है।
 
LQR एल्गोरिथ्म अनिवार्य रूप से एक उपयुक्त [[राज्य स्थान (नियंत्रण)]] | राज्य-प्रतिक्रिया नियंत्रक खोजने का एक स्वचालित तरीका है। इस प्रकार, नियंत्रण इंजीनियरों के लिए वैकल्पिक तरीकों को प्राथमिकता देना असामान्य नहीं है, जैसे पूर्ण राज्य फीडबैक, जिसे पोल प्लेसमेंट भी कहा जाता है, जिसमें नियंत्रक मापदंडों और नियंत्रक व्यवहार के बीच एक स्पष्ट संबंध होता है। सही भार कारकों को खोजने में कठिनाई एलक्यूआर आधारित नियंत्रक संश्लेषण के अनुप्रयोग को सीमित करती है।
<!-- The final paragraph of this article assumes that the final controlled signal is the most important result of control. This may seems like an obvious statement, but, there are examples where the cost of the control input is of similar magnitude to the cost of having the system deviate. In such applications it may be preferable to allow the system to deviate. An example that I am familiar with (although not the most intuitive example) is load control of airfoils. Near stall conditions sucking, blowing and periodic excitation are all methods of delaying stall. None of the above mentioned methods will control stall indefinitely. While all methods can require significant energy inputs that may exceed the capabilities of the power source. Given that none of these methods can always control the system, situations will arise where control is not possible. In this situation a state-feedback controller will try harder and harder to correct the system, possibly burning out the power source, or causing serious damage to other components. An example of irreversible damage is in Mig 21 fighter planes. They used the blowing of hot exhaust to control stall in tight turns, it was common that in dog fights the blowing mechanism would actually burn up the wings destroying the plane. with an LQR the controller would recognize that control is hopeless and allow the system to deviate. In the Mig 21 example the plane would simply not be able to turn as tight. This may be undesirable in a dog fight, but nor is burning up and falling from the sky. Now maybe I do not understand what a state-feedback controller is, but this is my impression of the last paragraph-->


LQR एल्गोरिदम नियंत्रक को इष्टतम करने के लिए नियंत्रण तंत्र इंजीनियर द्वारा किए गए कार्य की मात्रा को कम कर देता है। हालाँकि, इंजीनियर को अभी भी लागत फलन पैरामीटर निर्दिष्ट करने और निर्दिष्ट प्रारुप लक्ष्यों के साथ परिणामों की तुलना करने की आवश्यकता है। अधिकतर इसका अर्थ यह होता है कि नियंत्रक निर्माण एक पुनरावृत्‍तिमूलक क्रिया होगी जिसमें इंजीनियर सिमुलेशन (अनुकार) के माध्यम से उत्पादित "इष्टतम" नियंत्रकों का मूल्यांकन करता है और फिर प्रारुप लक्ष्यों के साथ अधिक सुसंगत नियंत्रक का उत्पादन करने के लिए मापदंडों को समायोजित करता है।


LQR एल्गोरिथ्म अनिवार्य रूप से एक उपयुक्त [[स्थिति फीडबैक (पुनर्भरण) नियंत्रक]] खोजने का एक स्वचालित तरीका है। इस प्रकार, नियंत्रण इंजीनियरों के लिए वैकल्पिक विधियों को प्राथमिकता देना असामान्य नहीं है, जैसे [[पूर्ण स्थिति फीडबैक]], जिसे पोल प्लेसमेंट भी कहा जाता है | सही भारक गुणकों को खोजने में कठिनाई LQR आधारित नियंत्रक संश्लेषण के अनुप्रयोग को सीमित करती है।
== संस्करण ==
== संस्करण ==


===परिमित-क्षितिज, निरंतर-समय===
===परिमित-क्षितिज, सतत समय===


एक सतत-समय रैखिक प्रणाली के लिए, पर परिभाषित <math>t\in[t_0,t_1]</math>, द्वारा वर्णित:
<math>t\in[t_0,t_1]</math> पर परिभाषित एक सतत-समय रेखीय तंत्र के लिए, इसका वर्णन इस प्रकार है:


:<math>\dot{x} = Ax + Bu</math>
:<math>\dot{x} = Ax + Bu</math>
कहाँ <math>x \in \mathbb{R}^{n}</math> (वह है, <math>x</math> एक <math>n</math>-आयामी वास्तविक-मूल्यवान वेक्टर) सिस्टम की स्थिति है और <math>u \in \mathbb{R}^{m}</math> नियंत्रण इनपुट है. सिस्टम के लिए एक द्विघात लागत फ़ंक्शन दिया गया है, जिसे इस प्रकार परिभाषित किया गया है:
जहां <math>x \in \mathbb{R}^{n}</math> (अर्थात्, <math>x</math> एक <math>n</math>-विमीय वास्तविक-मूल्यवान सदिश) पद्धति की स्थिति है और <math>u \in \mathbb{R}^{m}</math> नियंत्रण इनपुट है। पद्धति के लिए एक द्विघात लागत फलन दिया गया है, जिसे इस प्रकार परिभाषित किया गया है:


:<math>J =  x^T(t_1)F(t_1)x(t_1)  + \int\limits_{t_0}^{t_1} \left( x^T Q x + u^T R u + 2 x^T N u \right) dt</math><!-- Q,R,N and other variables are not defined, making the formula useless. -->
:<math>J =  x^T(t_1)F(t_1)x(t_1)  + \int\limits_{t_0}^{t_1} \left( x^T Q x + u^T R u + 2 x^T N u \right) dt</math>
फीडबैक नियंत्रण कानून जो लागत के मूल्य को न्यूनतम करता है वह है:
फीडबैक नियंत्रण नियम जो लागत के मूल्य को न्यूनतम करता है वह है:


:<math>u = -K x \,</math>
:<math>u = -K x \,</math>
कहाँ <math>K</math> द्वारा दिया गया है:
जहां <math>K</math> द्वारा दिया गया है:


:<math>K = R^{-1} (B^T P(t) + N^T) \,</math>
:<math>K = R^{-1} (B^T P(t) + N^T) \,</math>
और <math>P</math> निरंतर समय रिकाटी अंतर समीकरण को हल करके पाया जाता है:
और <math>P</math> सतत समय [[रिकाटी अवकल समीकरण]] को हल करके प्राप्त किया जाता है:


:<math>A^T P(t) + P(t) A - (P(t) B + N) R^{-1} (B^T P(t) + N^T) + Q = - \dot{P}(t) \,</math>
:<math>A^T P(t) + P(t) A - (P(t) B + N) R^{-1} (B^T P(t) + N^T) + Q = - \dot{P}(t) \,</math>
सीमा शर्त के साथ:
परिसीमा प्रतिबंध के साथ:


:<math>P(t_1) = F(t_1).</math>
:<math>P(t_1) = F(t_1).</math>
जे के लिए प्रथम आदेश की शर्तें<sub>min</sub> हैं:
J<sub>min</sub> के लिए प्रथम अनुक्रम की शर्तें हैं:


1) राज्य समीकरण
'''1) अवस्था समीकरण'''
:<math>\dot{x} = Ax + Bu</math>
:<math>\dot{x} = Ax + Bu</math>
2) [[कोस्टेट समीकरण]]|कोस्टेट समीकरण
'''2) [[सह-अवस्था समीकरण]]'''
:<math>-\dot{\lambda} = Qx + Nu + A^T \lambda </math>
:<math>-\dot{\lambda} = Qx + Nu + A^T \lambda </math>
3) स्थिर समीकरण
'''3) अप्रगामी समीकरण'''
:<math> 0 = Ru + N^Tx + B^T \lambda</math>
:<math> 0 = Ru + N^Tx + B^T \lambda</math>
4) सीमा की स्थितियाँ
'''4) परिसीमा शर्तें'''
:<math> x(t_0) = x_0</math>
:<math> x(t_0) = x_0</math>
और
और <math> \lambda(t_1) = F(t_1) x(t_1)</math>
<math> \lambda(t_1) = F(t_1) x(t_1)</math>
 
 
===अनंत-क्षितिज, सतत-समय ===
===अनंत-क्षितिज, सतत-समय ===


द्वारा वर्णित सतत-समय रैखिक प्रणाली के लिए:
द्वारा वर्णित सतत-समय रैखिक तंत्र के लिए:


:<math>\dot{x} = Ax + Bu</math>
:<math>\dot{x} = Ax + Bu</math>
एक लागत फ़ंक्शन के साथ जिसे इस प्रकार परिभाषित किया गया है:
एक लागत फलन के साथ जिसे इस प्रकार परिभाषित किया गया है:


:<math>J = \int_{0}^\infty \left( x^T Q x + u^T R u + 2 x^T N u \right) dt</math>
:<math>J = \int_{0}^\infty \left( x^T Q x + u^T R u + 2 x^T N u \right) dt</math>
फीडबैक नियंत्रण कानून जो लागत के मूल्य को न्यूनतम करता है वह है:
फीडबैक नियंत्रण नियम जो लागत के मूल्य को न्यूनतम करता है वह है:


:<math>u = -K x \,</math>
:<math>u = -K x \,</math>
कहाँ <math>K</math> द्वारा दिया गया है:
जहां <math>K</math> द्वारा दिया गया है:


:<math>K = R^{-1} (B^T P + N^T) \,</math>
:<math>K = R^{-1} (B^T P + N^T) \,</math>
और <math>P</math> निरंतर समय [[बीजगणितीय रिकाती समीकरण]] को हल करके पाया जाता है:
और <math>P</math> सतत समय [[बीजगणितीय रिकाती समीकरण]] को हल करके प्राप्त किया जाता है:


:<math>A^T P + P A - (P B + N) R^{-1} (B^T P + N^T) + Q = 0 \,</math>
:<math>A^T P + P A - (P B + N) R^{-1} (B^T P + N^T) + Q = 0 \,</math>
Line 68: Line 62:


:<math>\mathcal A^T P + P \mathcal A - P B R^{-1} B^T P + \mathcal Q = 0 \,</math>
:<math>\mathcal A^T P + P \mathcal A - P B R^{-1} B^T P + \mathcal Q = 0 \,</math>
साथ
के साथ


:<math>\mathcal A = A - B R^{-1} N^T \qquad  \mathcal Q = Q - N R^{-1} N^T \,</math>
:<math>\mathcal A = A - B R^{-1} N^T \qquad  \mathcal Q = Q - N R^{-1} N^T \,</math>
===परिमित-क्षितिज, असतत-समय===
===परिमित-क्षितिज, असतत-समय===


द्वारा वर्णित असतत-समय रैखिक प्रणाली के लिए:
द्वारा वर्णित असतत-समय रैखिक तंत्र के लिए:<ref>{{cite book |last= Chow |first= Gregory C. |title= गतिशील आर्थिक प्रणालियों का विश्लेषण और नियंत्रण|publisher= Krieger Publ. Co. |year= 1986  |isbn= 0-89874-969-7}}</ref>
<ref>{{cite book |last= Chow |first= Gregory C. |title= गतिशील आर्थिक प्रणालियों का विश्लेषण और नियंत्रण|publisher= Krieger Publ. Co. |year= 1986  |isbn= 0-89874-969-7}}</ref>
:<math>x_{k+1} = A x_k + B u_k \,</math>
:<math>x_{k+1} = A x_k + B u_k \,</math>
एक प्रदर्शन सूचकांक के साथ जिसे इस प्रकार परिभाषित किया गया है:
एक निष्पादन सूचकांक के साथ जिसे इस प्रकार परिभाषित किया गया है:


:<math>J = x_{H_p}^T Q_{H_p} x_{H_p} + \sum\limits_{k=0}^{H_p-1} \left( x_k^T Q x_k + u_k^T R u_k + 2 x_k^T N u_k \right)</math>, कहाँ <math> H_p </math> समय क्षितिज है
:<math>J = x_{H_p}^T Q_{H_p} x_{H_p} + \sum\limits_{k=0}^{H_p-1} \left( x_k^T Q x_k + u_k^T R u_k + 2 x_k^T N u_k \right)</math>, जहां <math> H_p </math> समय क्षितिज है


प्रदर्शन सूचकांक को न्यूनतम करने वाला इष्टतम नियंत्रण अनुक्रम इस प्रकार दिया गया है:
निष्पादन सूचकांक को न्यूनतम करने वाला इष्टतम नियंत्रण अनुक्रम इस प्रकार दिया गया है:


:<math>u_k = -F_k x_{k} \,</math>
:<math>u_k = -F_k x_{k} \,</math>
कहाँ:
जहां:


:<math>F_k = (R + B^T P_{k+1} B)^{-1} (B^T P_{k+1} A + N^T) \,</math>
:<math>F_k = (R + B^T P_{k+1} B)^{-1} (B^T P_{k+1} A + N^T) \,</math>
और <math>P_k</math> गतिशील रिकाटी समीकरण द्वारा समय में पुनरावर्ती रूप से पीछे की ओर पाया जाता है:
और <math>P_k</math> को गतिक रिकाटी समीकरण द्वारा समय में पीछे की ओर पुनरावृत्त रूप से प्राप्त किया जाता है:


:<math>P_{k-1} = A^T P_k A - (A^T P_k B + N) \left( R + B^T P_k B \right)^{-1} (B^T P_k A + N^T) + Q </math>
:<math>P_{k-1} = A^T P_k A - (A^T P_k B + N) \left( R + B^T P_k B \right)^{-1} (B^T P_k A + N^T) + Q </math>
टर्मिनल स्थिति से <math>P_{H_p} = Q_{H_p}</math>.<ref>{{cite journal |last= Shaiju, AJ | first=Petersen, Ian R. |title= असतत समय LQR, LQG, LEQG और मिनिमैक्स LQG इष्टतम नियंत्रण समस्याओं के लिए सूत्र|journal= IFAC Proceedings Volumes |year= 2008 | pages = 8773–8778 |publisher = Elsevier|volume = 41 | number = 2| doi=10.3182/20080706-5-KR-1001.01483 }}</ref> ध्यान दें कि <math>u_{H_p}</math> परिभाषित नहीं है, चूँकि <math>x</math> अपनी अंतिम अवस्था में चला जाता है <math>x_{H_p}</math> द्वारा <math>A x_{H_p-1} + B u_{H_p-1}</math>.
अंतक (टर्मिनल) शर्त <math>P_{H_p} = Q_{H_p}</math>से |<ref>{{cite journal |last= Shaiju, AJ | first=Petersen, Ian R. |title= असतत समय LQR, LQG, LEQG और मिनिमैक्स LQG इष्टतम नियंत्रण समस्याओं के लिए सूत्र|journal= IFAC Proceedings Volumes |year= 2008 | pages = 8773–8778 |publisher = Elsevier|volume = 41 | number = 2| doi=10.3182/20080706-5-KR-1001.01483 }}</ref> ध्यान दें कि <math>u_{H_p}</math> परिभाषित नहीं है, क्योंकि <math>x</math> अपनी अंतिम स्थिति <math>x_{H_p}</math> से  <math>A x_{H_p-1} + B u_{H_p-1}</math> तक संचालित होता है।


===अनंत-क्षितिज, असतत-समय===
===अनंत-क्षितिज, असतत-समय===


द्वारा वर्णित असतत-समय रैखिक प्रणाली के लिए:
द्वारा वर्णित असतत-समय रैखिक तंत्र के लिए:


:<math>x_{k+1} = A x_k + B u_k \,</math>
:<math>x_{k+1} = A x_k + B u_k \,</math>
एक प्रदर्शन सूचकांक के साथ जिसे इस प्रकार परिभाषित किया गया है:
एक निष्पादन सूचकांक के साथ जिसे इस प्रकार परिभाषित किया गया है:


:<math>J = \sum\limits_{k=0}^{\infty} \left( x_k^T Q x_k + u_k^T R u_k + 2 x_k^T N u_k \right)</math>
:<math>J = \sum\limits_{k=0}^{\infty} \left( x_k^T Q x_k + u_k^T R u_k + 2 x_k^T N u_k \right)</math>
प्रदर्शन सूचकांक को न्यूनतम करने वाला इष्टतम नियंत्रण अनुक्रम इस प्रकार दिया गया है:
निष्पादन सूचकांक को न्यूनतम करने वाला इष्टतम नियंत्रण अनुक्रम इस प्रकार दिया गया है:


:<math>u_k = -F x_k \,</math>
:<math>u_k = -F x_k \,</math>
कहाँ:
जहां:


:<math>F = (R + B^T P B)^{-1} (B^T P A + N^T) \,</math>
:<math>F = (R + B^T P B)^{-1} (B^T P A + N^T) \,</math>
Line 114: Line 105:


:<math>P = \mathcal A^T P \mathcal A - \mathcal A^T P B \left( R + B^T P B \right)^{-1} B^T P \mathcal A + \mathcal Q </math>
:<math>P = \mathcal A^T P \mathcal A - \mathcal A^T P B \left( R + B^T P B \right)^{-1} B^T P \mathcal A + \mathcal Q </math>
साथ:
के साथ:


:<math> \mathcal A = A - B R^{-1} N^T \qquad \mathcal Q = Q - N R^{-1} N^T </math>.
:<math> \mathcal A = A - B R^{-1} N^T \qquad \mathcal Q = Q - N R^{-1} N^T </math>.


ध्यान दें कि बीजगणितीय रिकाटी समीकरण को हल करने का एक तरीका परिमित-क्षितिज मामले के गतिशील रिकाटी समीकरण को तब तक दोहराना है जब तक कि यह अभिसरण न हो जाए।
ध्यान दें कि बीजगणितीय रिकाटी समीकरण को हल करने का एक तरीका परिमित-क्षितिज स्थिति के गतिक रिकाटी समीकरण को तब तक दोहराना है जब तक कि यह अभिसरण न हो जाए।


==बाधाएँ==
==व्यवरोध==
व्यवहार में, सभी मूल्य नहीं <math>x_k, u_k</math> अनुमति दी जा सकती है. एक सामान्य बाधा रैखिक है:
अभ्यास में, <math>x_k, u_k</math> के सभी मानों की अनुमति नहीं दी जा सकती है | एक सामान्य व्यवरोध रैखिक है:
:<math>C \mathbf{x} + D\mathbf{u}\leq \mathbf{e}.</math>
:<math>C \mathbf{x} + D\mathbf{u}\leq \mathbf{e}.</math>
इसका परिमित क्षितिज संस्करण एक [[उत्तल अनुकूलन]] समस्या है, और इसलिए समस्या को अक्सर घटते क्षितिज के साथ बार-बार हल किया जाता है। यह मॉडल पूर्वानुमानित नियंत्रण का एक रूप है।<ref name="underactuated-ch8">{{cite web |title=Ch. 8 - Linear Quadratic Regulators |url=http://underactuated.mit.edu/lqr.html |website=underactuated.mit.edu |access-date=20 August 2022}}</ref><ref>{{cite web |url=https://minds.wisconsin.edu/bitstream/handle/1793/10888/file_1.pdf;jsessionid=52A001EAADF4C22B901290B594BFDA8E?sequence=1 |access-date=20 August 2022}}</ref>
इसका परिमित क्षितिज संस्करण एक [[उत्तल अनुकूलन|उत्तल इष्टतमीकरण]] समस्या है, और इसलिए समस्या को अधिकतर पश्चगामी क्षितिज के साथ बार-बार हल किया जाता है। यह प्रारुप पूर्वानुमानित नियंत्रण का एक रूप है।<ref name="underactuated-ch8">{{cite web |title=Ch. 8 - Linear Quadratic Regulators |url=http://underactuated.mit.edu/lqr.html |website=underactuated.mit.edu |access-date=20 August 2022}}</ref><ref>{{cite web |url=https://minds.wisconsin.edu/bitstream/handle/1793/10888/file_1.pdf;jsessionid=52A001EAADF4C22B901290B594BFDA8E?sequence=1 |access-date=20 August 2022}}</ref>
 
 
==संबंधित नियंत्रक==
==संबंधित नियंत्रक==


===द्विघात-द्विघात नियामक===
===द्विघात-द्विघात नियामक===
यदि अवस्था समीकरण द्विघात है तो समस्या को द्विघात-द्विघात नियामक (QQR) के रूप में जाना जाता है। इस समस्या को कम करने के लिए अल'ब्रेक्ट एल्गोरिदम को लागू किया जा सकता है जिसे टेंसर आधारित रैखिक सॉल्वर का उपयोग करके कुशलतापूर्वक हल किया जा सकता है।<ref name="qqr">{{cite book |last1=Borggaard |first1=Jeff |last2=Zietsman |first2=Lizette |title=The Quadratic-Quadratic Regulator Problem: Approximating feedback controls for quadratic-in-state nonlinear systems |url=https://ieeexplore.ieee.org/document/9147286 |website=2020 American Control Conference (ACC) |access-date=20 August 2022 |pages=818–823 |doi=10.23919/ACC45564.2020.9147286 |date=July 2020|arxiv=1910.03396 |isbn=978-1-5386-8266-1 |s2cid=203904925 }}</ref>
यदि अवस्था समीकरण द्विघात है तो समस्या को द्विघात-द्विघात नियामक (QQR) के रूप में जाना जाता है। इस समस्या को कम करने के लिए [[अल'ब्रेक्ट एल्गोरिदम]] को लागू किया जा सकता है जिसे प्रदिश आधारित रैखिक सॉल्वर का उपयोग करके कुशलतापूर्वक हल किया जा सकता है।<ref name="qqr">{{cite book |last1=Borggaard |first1=Jeff |last2=Zietsman |first2=Lizette |title=The Quadratic-Quadratic Regulator Problem: Approximating feedback controls for quadratic-in-state nonlinear systems |url=https://ieeexplore.ieee.org/document/9147286 |website=2020 American Control Conference (ACC) |access-date=20 August 2022 |pages=818–823 |doi=10.23919/ACC45564.2020.9147286 |date=July 2020|arxiv=1910.03396 |isbn=978-1-5386-8266-1 |s2cid=203904925 }}</ref>
 
 
===[[बहुपद]]-द्विघात नियामक===
===[[बहुपद]]-द्विघात नियामक===
यदि अवस्था समीकरण बहुपद है तो समस्या को बहुपद-द्विघात नियामक (PQR) के रूप में जाना जाता है। फिर से, इस समस्या को एक बड़े रैखिक रूप में कम करने के लिए अल'ब्रेक्ट एल्गोरिदम को लागू किया जा सकता है जिसे [[बार्टेल्स-स्टीवर्ट एल्गोरिथम]] के सामान्यीकरण के साथ हल किया जा सकता है; यह संभव है बशर्ते कि बहुपद की डिग्री बहुत अधिक न हो।<ref name="pqr">{{cite journal |last1=Borggaard |first1=Jeff |last2=Zietsman |first2=Lizette |title=बहुपद-द्विघात नियामक समस्याओं का अनुमान लगाने पर|journal=IFAC-PapersOnLine |pages=329–334 |language=en |doi=10.1016/j.ifacol.2021.06.090 |date=1 January 2021|volume=54 |issue=9 |s2cid=221856517 |doi-access=free }}</ref>
यदि अवस्था समीकरण [[बहुपद]] है तो समस्या को बहुपद-द्विघात नियामक (PQR) के रूप में जाना जाता है। फिर से, इस समस्या को एक बड़े रैखिक रूप में कम करने के लिए अल'ब्रेक्ट एल्गोरिदम को लागू किया जा सकता है जिसे [[बार्टेल्स-स्टीवर्ट एल्गोरिथम]] के सामान्यीकरण के साथ हल किया जा सकता है; यह संभव है बशर्ते कि बहुपद की कोटि बहुत अधिक न हो।<ref name="pqr">{{cite journal |last1=Borggaard |first1=Jeff |last2=Zietsman |first2=Lizette |title=बहुपद-द्विघात नियामक समस्याओं का अनुमान लगाने पर|journal=IFAC-PapersOnLine |pages=329–334 |language=en |doi=10.1016/j.ifacol.2021.06.090 |date=1 January 2021|volume=54 |issue=9 |s2cid=221856517 |doi-access=free }}</ref>
 
=== प्रारुप-पूर्वानुमानित नियंत्रण ===
{{Main articles|प्रारुप पूर्वानुमानित नियंत्रण#एमपीसी vs.एलक्यूआर}}


=== मॉडल-भविष्य कहनेवाला नियंत्रण ===
प्रारुप पूर्वानुमानित नियंत्रण और रैखिक-द्विघात नियामक दो प्रकार की इष्टतम नियंत्रण विधियाँ हैं जिनमें इष्टमीकरण लागतों को निर्धारित करने के लिए अलग-अलग दृष्टिकोण हैं। विशेष रूप से, जब LQR को पश्चगामी क्षैतिज के साथ बार-बार चलाया जाता है, तो यह [[प्रारुप पूर्वानुमान नियंत्रण]] (एमपीसी) का एक रूप बन जाता है। हालाँकि, सामान्य तौर पर, एमपीसी तंत्र की रैखिकता के संबंध में किसी भी धारणा पर विश्वास नहीं करता है।
{{Main articles|Model predictive control#MPC vs.LQR}}
मॉडल पूर्वानुमानित नियंत्रण और रैखिक-द्विघात नियामक दो प्रकार की इष्टतम नियंत्रण विधियाँ हैं जिनमें अनुकूलन लागत निर्धारित करने के लिए अलग-अलग दृष्टिकोण हैं। विशेष रूप से, जब एलक्यूआर को घटते क्षितिज के साथ बार-बार चलाया जाता है, तो यह मॉडल पूर्वानुमान नियंत्रण (एमपीसी) का एक रूप बन जाता है। हालाँकि, सामान्य तौर पर, एमपीसी सिस्टम की रैखिकता के संबंध में किसी भी धारणा पर भरोसा नहीं करता है।


==संदर्भ==
==संदर्भ==
Line 165: Line 151:
* [http://reference.wolfram.com/mathematica/ref/LQRegulatorGains.html Mathematica function for Linear Quadratic Regulator design]
* [http://reference.wolfram.com/mathematica/ref/LQRegulatorGains.html Mathematica function for Linear Quadratic Regulator design]


{{DEFAULTSORT:Linear-quadratic regulator}}[[Category: इष्टतम नियंत्रण]]
{{DEFAULTSORT:Linear-quadratic regulator}}
 
 


[[Category: Machine Translated Page]]
[[Category:Articles with hatnote templates targeting a nonexistent page|Linear-quadratic regulator]]
[[Category:Created On 26/07/2023]]
[[Category:CS1 English-language sources (en)]]
[[Category:CS1 errors]]
[[Category:Created On 26/07/2023|Linear-quadratic regulator]]
[[Category:Lua-based templates|Linear-quadratic regulator]]
[[Category:Machine Translated Page|Linear-quadratic regulator]]
[[Category:Pages with script errors|Linear-quadratic regulator]]
[[Category:Short description with empty Wikidata description|Linear-quadratic regulator]]
[[Category:Templates Vigyan Ready|Linear-quadratic regulator]]
[[Category:Templates that add a tracking category|Linear-quadratic regulator]]
[[Category:Templates that generate short descriptions|Linear-quadratic regulator]]
[[Category:Templates using TemplateData|Linear-quadratic regulator]]
[[Category:इष्टतम नियंत्रण|Linear-quadratic regulator]]

Latest revision as of 17:49, 10 August 2023

इष्टतम नियंत्रण का सिद्धांत न्यूनतम लागत पर एक गतिक तंत्र के संचालन से संबंधित है। वह स्थिति जहां तंत्र गतिकी को रैखिक अवकल समीकरणों के एक समुच्चय द्वारा वर्णित किया जाता है और लागत को एक द्विघात फलन द्वारा वर्णित किया जाता है, उसे LQ समस्या कहा जाता है। सिद्धांत में मुख्य परिणामों में से एक यह है कि समाधान रैखिक-द्विघात नियामक (LQR) द्वारा प्रदान किया जाता है, एक फीडबैक (पुनर्भरण) नियंत्रक जिसके समीकरण नीचे दिए गए हैं।

LQR नियंत्रकों में गारंटित लाभ और फेज मार्जिन के साथ अंतर्निहित मजबूती होती है,[1] और वे LQG (रैखिक-द्विघात-गाऊसी) समस्या के समाधान के भी भाग हैं। LQR समस्या की तरह, LQG समस्या भी नियंत्रण सिद्धांत में सबसे मौलिक समस्याओं में से एक है।

सामान्य विवरण

किसी मशीन या प्रक्रिया (जैसे हवाई जहाज या रासायनिक अभिक्रियक) को नियंत्रित करने वाले (विनियमन करने वाले) नियंत्रक की सेटिंग एक गणितीय कलन विधि का उपयोग करके पाई जाती है जो मानव (इंजीनियर) द्वारा आपूर्ति किए गए भारक गुणकों के साथ लागत फलन को कम करती है। लागत फलन को अधितर उनके अपेक्षित मानों से शीर्षलंब या प्रक्रम ताप जैसे प्रमुख मापों के विचलनों के योग के रूप में परिभाषित किया जाता है। इस प्रकार कलन विधि उन नियंत्रक सेटिंग्स को खोजती है जो अवांछित विचलनों को कम करते हैं। नियंत्रण क्रिया का परिमाण भी लागत फलन में सम्मिलित किया जा सकता है।

LQR एल्गोरिदम नियंत्रक को इष्टतम करने के लिए नियंत्रण तंत्र इंजीनियर द्वारा किए गए कार्य की मात्रा को कम कर देता है। हालाँकि, इंजीनियर को अभी भी लागत फलन पैरामीटर निर्दिष्ट करने और निर्दिष्ट प्रारुप लक्ष्यों के साथ परिणामों की तुलना करने की आवश्यकता है। अधिकतर इसका अर्थ यह होता है कि नियंत्रक निर्माण एक पुनरावृत्‍तिमूलक क्रिया होगी जिसमें इंजीनियर सिमुलेशन (अनुकार) के माध्यम से उत्पादित "इष्टतम" नियंत्रकों का मूल्यांकन करता है और फिर प्रारुप लक्ष्यों के साथ अधिक सुसंगत नियंत्रक का उत्पादन करने के लिए मापदंडों को समायोजित करता है।

LQR एल्गोरिथ्म अनिवार्य रूप से एक उपयुक्त स्थिति फीडबैक (पुनर्भरण) नियंत्रक खोजने का एक स्वचालित तरीका है। इस प्रकार, नियंत्रण इंजीनियरों के लिए वैकल्पिक विधियों को प्राथमिकता देना असामान्य नहीं है, जैसे पूर्ण स्थिति फीडबैक, जिसे पोल प्लेसमेंट भी कहा जाता है | सही भारक गुणकों को खोजने में कठिनाई LQR आधारित नियंत्रक संश्लेषण के अनुप्रयोग को सीमित करती है।

संस्करण

परिमित-क्षितिज, सतत समय

पर परिभाषित एक सतत-समय रेखीय तंत्र के लिए, इसका वर्णन इस प्रकार है:

जहां (अर्थात्, एक -विमीय वास्तविक-मूल्यवान सदिश) पद्धति की स्थिति है और नियंत्रण इनपुट है। पद्धति के लिए एक द्विघात लागत फलन दिया गया है, जिसे इस प्रकार परिभाषित किया गया है:

फीडबैक नियंत्रण नियम जो लागत के मूल्य को न्यूनतम करता है वह है:

जहां द्वारा दिया गया है:

और सतत समय रिकाटी अवकल समीकरण को हल करके प्राप्त किया जाता है:

परिसीमा प्रतिबंध के साथ:

Jmin के लिए प्रथम अनुक्रम की शर्तें हैं:

1) अवस्था समीकरण

2) सह-अवस्था समीकरण

3) अप्रगामी समीकरण

4) परिसीमा शर्तें

और

अनंत-क्षितिज, सतत-समय

द्वारा वर्णित सतत-समय रैखिक तंत्र के लिए:

एक लागत फलन के साथ जिसे इस प्रकार परिभाषित किया गया है:

फीडबैक नियंत्रण नियम जो लागत के मूल्य को न्यूनतम करता है वह है:

जहां द्वारा दिया गया है:

और सतत समय बीजगणितीय रिकाती समीकरण को हल करके प्राप्त किया जाता है:

इसे इस प्रकार भी लिखा जा सकता है:

के साथ

परिमित-क्षितिज, असतत-समय

द्वारा वर्णित असतत-समय रैखिक तंत्र के लिए:[2]

एक निष्पादन सूचकांक के साथ जिसे इस प्रकार परिभाषित किया गया है:

, जहां समय क्षितिज है

निष्पादन सूचकांक को न्यूनतम करने वाला इष्टतम नियंत्रण अनुक्रम इस प्रकार दिया गया है:

जहां:

और को गतिक रिकाटी समीकरण द्वारा समय में पीछे की ओर पुनरावृत्त रूप से प्राप्त किया जाता है:

अंतक (टर्मिनल) शर्त से |[3] ध्यान दें कि परिभाषित नहीं है, क्योंकि अपनी अंतिम स्थिति से तक संचालित होता है।

अनंत-क्षितिज, असतत-समय

द्वारा वर्णित असतत-समय रैखिक तंत्र के लिए:

एक निष्पादन सूचकांक के साथ जिसे इस प्रकार परिभाषित किया गया है:

निष्पादन सूचकांक को न्यूनतम करने वाला इष्टतम नियंत्रण अनुक्रम इस प्रकार दिया गया है:

जहां:

और असतत समय बीजगणितीय रिकाटी समीकरण (डीएआरई) का अद्वितीय सकारात्मक निश्चित समाधान है:

.

इसे इस प्रकार भी लिखा जा सकता है:

के साथ:

.

ध्यान दें कि बीजगणितीय रिकाटी समीकरण को हल करने का एक तरीका परिमित-क्षितिज स्थिति के गतिक रिकाटी समीकरण को तब तक दोहराना है जब तक कि यह अभिसरण न हो जाए।

व्यवरोध

अभ्यास में, के सभी मानों की अनुमति नहीं दी जा सकती है | एक सामान्य व्यवरोध रैखिक है:

इसका परिमित क्षितिज संस्करण एक उत्तल इष्टतमीकरण समस्या है, और इसलिए समस्या को अधिकतर पश्चगामी क्षितिज के साथ बार-बार हल किया जाता है। यह प्रारुप पूर्वानुमानित नियंत्रण का एक रूप है।[4][5]

संबंधित नियंत्रक

द्विघात-द्विघात नियामक

यदि अवस्था समीकरण द्विघात है तो समस्या को द्विघात-द्विघात नियामक (QQR) के रूप में जाना जाता है। इस समस्या को कम करने के लिए अल'ब्रेक्ट एल्गोरिदम को लागू किया जा सकता है जिसे प्रदिश आधारित रैखिक सॉल्वर का उपयोग करके कुशलतापूर्वक हल किया जा सकता है।[6]

बहुपद-द्विघात नियामक

यदि अवस्था समीकरण बहुपद है तो समस्या को बहुपद-द्विघात नियामक (PQR) के रूप में जाना जाता है। फिर से, इस समस्या को एक बड़े रैखिक रूप में कम करने के लिए अल'ब्रेक्ट एल्गोरिदम को लागू किया जा सकता है जिसे बार्टेल्स-स्टीवर्ट एल्गोरिथम के सामान्यीकरण के साथ हल किया जा सकता है; यह संभव है बशर्ते कि बहुपद की कोटि बहुत अधिक न हो।[7]

प्रारुप-पूर्वानुमानित नियंत्रण

प्रारुप पूर्वानुमानित नियंत्रण और रैखिक-द्विघात नियामक दो प्रकार की इष्टतम नियंत्रण विधियाँ हैं जिनमें इष्टमीकरण लागतों को निर्धारित करने के लिए अलग-अलग दृष्टिकोण हैं। विशेष रूप से, जब LQR को पश्चगामी क्षैतिज के साथ बार-बार चलाया जाता है, तो यह प्रारुप पूर्वानुमान नियंत्रण (एमपीसी) का एक रूप बन जाता है। हालाँकि, सामान्य तौर पर, एमपीसी तंत्र की रैखिकता के संबंध में किसी भी धारणा पर विश्वास नहीं करता है।

संदर्भ

  1. Lehtomaki, N.; Sandell, N.; Athans, M. (1981). "मजबूती के परिणामस्वरूप रैखिक-द्विघात गॉसियन आधारित बहुपरिवर्तनीय नियंत्रण डिजाइन तैयार होते हैं". IEEE Transactions on Automatic Control (in English). 26 (1): 75–93. doi:10.1109/TAC.1981.1102565. ISSN 0018-9286.
  2. Chow, Gregory C. (1986). गतिशील आर्थिक प्रणालियों का विश्लेषण और नियंत्रण. Krieger Publ. Co. ISBN 0-89874-969-7.
  3. Shaiju, AJ, Petersen, Ian R. (2008). "असतत समय LQR, LQG, LEQG और मिनिमैक्स LQG इष्टतम नियंत्रण समस्याओं के लिए सूत्र". IFAC Proceedings Volumes. Elsevier. 41 (2): 8773–8778. doi:10.3182/20080706-5-KR-1001.01483.{{cite journal}}: CS1 maint: multiple names: authors list (link)
  4. "Ch. 8 - Linear Quadratic Regulators". underactuated.mit.edu. Retrieved 20 August 2022.
  5. https://minds.wisconsin.edu/bitstream/handle/1793/10888/file_1.pdf;jsessionid=52A001EAADF4C22B901290B594BFDA8E?sequence=1. Retrieved 20 August 2022. {{cite web}}: Missing or empty |title= (help)
  6. Borggaard, Jeff; Zietsman, Lizette (July 2020). The Quadratic-Quadratic Regulator Problem: Approximating feedback controls for quadratic-in-state nonlinear systems. pp. 818–823. arXiv:1910.03396. doi:10.23919/ACC45564.2020.9147286. ISBN 978-1-5386-8266-1. S2CID 203904925. Retrieved 20 August 2022. {{cite book}}: |website= ignored (help)
  7. Borggaard, Jeff; Zietsman, Lizette (1 January 2021). "बहुपद-द्विघात नियामक समस्याओं का अनुमान लगाने पर". IFAC-PapersOnLine (in English). 54 (9): 329–334. doi:10.1016/j.ifacol.2021.06.090. S2CID 221856517.
  • Kwakernaak, Huibert & Sivan, Raphael (1972). Linear Optimal Control Systems. First Edition. Wiley-Interscience. ISBN 0-471-51110-2.


बाहरी संबंध