रैखिक-द्विघात नियामक: Difference between revisions

From Vigyanwiki
No edit summary
Line 4: Line 4:


==सामान्य विवरण==
==सामान्य विवरण==
किसी मशीन या प्रक्रिया (जैसे हवाई जहाज या रासायनिक रिएक्टर) को नियंत्रित करने वाले (विनियमन करने वाले) नियंत्रक की समुच्चयिंग्स एक गणितीय एल्गोरिदम का उपयोग करके पाई जाती हैं जो मानव (इंजीनियर) द्वारा आपूर्ति किए गए भार कारकों के साथ हानि फ़ंक्शन को कम करती है। लागत फ़ंक्शन को अक्सर उनके वांछित मूल्यों से ऊंचाई या प्रक्रिया तापमान जैसे प्रमुख मापों के विचलन के योग के रूप में परिभाषित किया जाता है। इस प्रकार एल्गोरिदम उन नियंत्रक समुच्चयिंग्स को ढूंढता है जो अवांछित विचलन को कम करते हैं। नियंत्रण कार्रवाई का परिमाण भी लागत फ़ंक्शन में शामिल किया जा सकता है।
किसी मशीन या प्रक्रिया (जैसे हवाई जहाज या रासायनिक अभिक्रियक) को नियंत्रित करने वाले (विनियमन करने वाले) नियंत्रक की सेटिंग एक गणितीय कलन विधि का उपयोग करके पाई जाती है जो मानव (इंजीनियर) द्वारा आपूर्ति किए गए भारक गुणकों के साथ [[लागत फलन]] को कम करती है। लागत फलन को अधितर उनके अपेक्षित मानों से शीर्षलंब या प्रक्रम ताप जैसे प्रमुख मापों के विचलनों के योग के रूप में परिभाषित किया जाता है। इस प्रकार कलन विधि उन नियंत्रक सेटिंग्स को खोजती है जो अवांछित विचलनों को कम करते हैं। नियंत्रण क्रिया का परिमाण भी लागत फलन में सम्मिलित किया जा सकता है।
 
LQR एल्गोरिदम नियंत्रक को अनुकूलित करने के लिए नियंत्रण सिस्टम इंजीनियर द्वारा किए गए कार्य की मात्रा को कम कर देता है। हालाँकि, इंजीनियर को अभी भी लागत फ़ंक्शन पैरामीटर निर्दिष्ट करने और निर्दिष्ट डिज़ाइन लक्ष्यों के साथ परिणामों की तुलना करने की आवश्यकता है। अक्सर इसका मतलब यह होता है कि नियंत्रक निर्माण एक पुनरावृत्तीय प्रक्रिया होगी जिसमें इंजीनियर सिमुलेशन के माध्यम से उत्पादित इष्टतम नियंत्रकों का मूल्यांकन करता है और फिर डिजाइन लक्ष्यों के साथ अधिक सुसंगत नियंत्रक का उत्पादन करने के लिए मापदंडों को समायोजित करता है।
 
LQR एल्गोरिथ्म अनिवार्य रूप से एक उपयुक्त [[राज्य स्थान (नियंत्रण)]] | राज्य-प्रतिक्रिया नियंत्रक खोजने का एक स्वचालित तरीका है। इस प्रकार, नियंत्रण इंजीनियरों के लिए वैकल्पिक तरीकों को प्राथमिकता देना असामान्य नहीं है, जैसे पूर्ण राज्य फीडबैक, जिसे पोल प्लेसमेंट भी कहा जाता है, जिसमें नियंत्रक मापदंडों और नियंत्रक व्यवहार के बीच एक स्पष्ट संबंध होता है। सही भार कारकों को खोजने में कठिनाई एलक्यूआर आधारित नियंत्रक संश्लेषण के अनुप्रयोग को सीमित करती है।
<!-- The final paragraph of this article assumes that the final controlled signal is the most important result of control. This may seems like an obvious statement, but, there are examples where the cost of the control input is of similar magnitude to the cost of having the system deviate. In such applications it may be preferable to allow the system to deviate. An example that I am familiar with (although not the most intuitive example) is load control of airfoils. Near stall conditions sucking, blowing and periodic excitation are all methods of delaying stall. None of the above mentioned methods will control stall indefinitely. While all methods can require significant energy inputs that may exceed the capabilities of the power source. Given that none of these methods can always control the system, situations will arise where control is not possible. In this situation a state-feedback controller will try harder and harder to correct the system, possibly burning out the power source, or causing serious damage to other components. An example of irreversible damage is in Mig 21 fighter planes. They used the blowing of hot exhaust to control stall in tight turns, it was common that in dog fights the blowing mechanism would actually burn up the wings destroying the plane. with an LQR the controller would recognize that control is hopeless and allow the system to deviate. In the Mig 21 example the plane would simply not be able to turn as tight. This may be undesirable in a dog fight, but nor is burning up and falling from the sky. Now maybe I do not understand what a state-feedback controller is, but this is my impression of the last paragraph-->


LQR एल्गोरिदम नियंत्रक को अनुकूलित करने के लिए नियंत्रण तंत्र इंजीनियर द्वारा किए गए कार्य की मात्रा को कम कर देता है। हालाँकि, इंजीनियर को अभी भी लागत फलन पैरामीटर निर्दिष्ट करने और निर्दिष्ट प्रारुप लक्ष्यों के साथ परिणामों की तुलना करने की आवश्यकता है। अधिकतर इसका अर्थ यह होता है कि नियंत्रक निर्माण एक पुनरावृत्‍तिमूलक क्रिया होगी जिसमें इंजीनियर सिमुलेशन (अनुकार) के माध्यम से उत्पादित "इष्टतम" नियंत्रकों का मूल्यांकन करता है और फिर प्रारुप लक्ष्यों के साथ अधिक सुसंगत नियंत्रक का उत्पादन करने के लिए मापदंडों को समायोजित करता है।


LQR एल्गोरिथ्म अनिवार्य रूप से एक उपयुक्त [[स्थिति फीडबैक (पुनर्भरण) नियंत्रक]] खोजने का एक स्वचालित तरीका है। इस प्रकार, नियंत्रण इंजीनियरों के लिए वैकल्पिक विधियों को प्राथमिकता देना असामान्य नहीं है, जैसे [[पूर्ण स्थिति  फीडबैक]], जिसे पोल प्लेसमेंट भी कहा जाता है | सही भारक गुणकों को खोजने में कठिनाई LQR आधारित नियंत्रक संश्लेषण के अनुप्रयोग को सीमित करती है।
== संस्करण ==
== संस्करण ==


Line 19: Line 16:


:<math>\dot{x} = Ax + Bu</math>
:<math>\dot{x} = Ax + Bu</math>
कहाँ <math>x \in \mathbb{R}^{n}</math> (वह है, <math>x</math> एक <math>n</math>-आयामी वास्तविक-मूल्यवान वेक्टर) सिस्टम की स्थिति है और <math>u \in \mathbb{R}^{m}</math> नियंत्रण इनपुट है. सिस्टम के लिए एक द्विघात लागत फ़ंक्शन दिया गया है, जिसे इस प्रकार परिभाषित किया गया है:
कहाँ <math>x \in \mathbb{R}^{n}</math> (वह है, <math>x</math> एक <math>n</math>-आयामी वास्तविक-मूल्यवान वेक्टर) सिस्टम की स्थिति है और <math>u \in \mathbb{R}^{m}</math> नियंत्रण इनपुट है. सिस्टम के लिए एक द्विघात लागत फलन दिया गया है, जिसे इस प्रकार परिभाषित किया गया है:


:<math>J =  x^T(t_1)F(t_1)x(t_1)  + \int\limits_{t_0}^{t_1} \left( x^T Q x + u^T R u + 2 x^T N u \right) dt</math><!-- Q,R,N and other variables are not defined, making the formula useless. -->
:<math>J =  x^T(t_1)F(t_1)x(t_1)  + \int\limits_{t_0}^{t_1} \left( x^T Q x + u^T R u + 2 x^T N u \right) dt</math>
फीडबैक नियंत्रण कानून जो लागत के मूल्य को न्यूनतम करता है वह है:
फीडबैक नियंत्रण कानून जो लागत के मूल्य को न्यूनतम करता है वह है:


Line 53: Line 50:


:<math>\dot{x} = Ax + Bu</math>
:<math>\dot{x} = Ax + Bu</math>
एक लागत फ़ंक्शन के साथ जिसे इस प्रकार परिभाषित किया गया है:
एक लागत फलन के साथ जिसे इस प्रकार परिभाषित किया गया है:


:<math>J = \int_{0}^\infty \left( x^T Q x + u^T R u + 2 x^T N u \right) dt</math>
:<math>J = \int_{0}^\infty \left( x^T Q x + u^T R u + 2 x^T N u \right) dt</math>

Revision as of 07:29, 4 August 2023

इष्टतम नियंत्रण का सिद्धांत न्यूनतम लागत पर एक गतिक तंत्र के संचालन से संबंधित है। वह स्थिति जहां तंत्र गतिकी को रैखिक अवकल समीकरणों के एक समुच्चय द्वारा वर्णित किया जाता है और लागत को एक द्विघात फलन द्वारा वर्णित किया जाता है, उसे LQ समस्या कहलाती है। सिद्धांत में मुख्य परिणामों में से एक यह है कि समाधान रैखिक-द्विघात नियामक (LQR) द्वारा प्रदान किया जाता है, एक फीडबैक (पुनर्भरण) नियंत्रक जिसके समीकरण नीचे दिए गए हैं।

LQR नियंत्रकों में गारंटित लाभ और फेज मार्जिन के साथ अंतर्निहित मजबूती होती है,[1] और वे LQG (रैखिक-द्विघात-गाऊसी) समस्या के समाधान के भी भाग हैं। LQR समस्या की तरह, LQG समस्या भी नियंत्रण सिद्धांत में सबसे मौलिक समस्याओं में से एक है।

सामान्य विवरण

किसी मशीन या प्रक्रिया (जैसे हवाई जहाज या रासायनिक अभिक्रियक) को नियंत्रित करने वाले (विनियमन करने वाले) नियंत्रक की सेटिंग एक गणितीय कलन विधि का उपयोग करके पाई जाती है जो मानव (इंजीनियर) द्वारा आपूर्ति किए गए भारक गुणकों के साथ लागत फलन को कम करती है। लागत फलन को अधितर उनके अपेक्षित मानों से शीर्षलंब या प्रक्रम ताप जैसे प्रमुख मापों के विचलनों के योग के रूप में परिभाषित किया जाता है। इस प्रकार कलन विधि उन नियंत्रक सेटिंग्स को खोजती है जो अवांछित विचलनों को कम करते हैं। नियंत्रण क्रिया का परिमाण भी लागत फलन में सम्मिलित किया जा सकता है।

LQR एल्गोरिदम नियंत्रक को अनुकूलित करने के लिए नियंत्रण तंत्र इंजीनियर द्वारा किए गए कार्य की मात्रा को कम कर देता है। हालाँकि, इंजीनियर को अभी भी लागत फलन पैरामीटर निर्दिष्ट करने और निर्दिष्ट प्रारुप लक्ष्यों के साथ परिणामों की तुलना करने की आवश्यकता है। अधिकतर इसका अर्थ यह होता है कि नियंत्रक निर्माण एक पुनरावृत्‍तिमूलक क्रिया होगी जिसमें इंजीनियर सिमुलेशन (अनुकार) के माध्यम से उत्पादित "इष्टतम" नियंत्रकों का मूल्यांकन करता है और फिर प्रारुप लक्ष्यों के साथ अधिक सुसंगत नियंत्रक का उत्पादन करने के लिए मापदंडों को समायोजित करता है।

LQR एल्गोरिथ्म अनिवार्य रूप से एक उपयुक्त स्थिति फीडबैक (पुनर्भरण) नियंत्रक खोजने का एक स्वचालित तरीका है। इस प्रकार, नियंत्रण इंजीनियरों के लिए वैकल्पिक विधियों को प्राथमिकता देना असामान्य नहीं है, जैसे पूर्ण स्थिति फीडबैक, जिसे पोल प्लेसमेंट भी कहा जाता है | सही भारक गुणकों को खोजने में कठिनाई LQR आधारित नियंत्रक संश्लेषण के अनुप्रयोग को सीमित करती है।

संस्करण

परिमित-क्षितिज, निरंतर-समय

एक सतत-समय रैखिक प्रणाली के लिए, पर परिभाषित , द्वारा वर्णित:

कहाँ (वह है, एक -आयामी वास्तविक-मूल्यवान वेक्टर) सिस्टम की स्थिति है और नियंत्रण इनपुट है. सिस्टम के लिए एक द्विघात लागत फलन दिया गया है, जिसे इस प्रकार परिभाषित किया गया है:

फीडबैक नियंत्रण कानून जो लागत के मूल्य को न्यूनतम करता है वह है:

कहाँ द्वारा दिया गया है:

और निरंतर समय रिकाटी अंतर समीकरण को हल करके पाया जाता है:

सीमा शर्त के साथ:

जे के लिए प्रथम आदेश की शर्तेंmin हैं:

1) राज्य समीकरण

2) कोस्टेट समीकरण|कोस्टेट समीकरण

3) स्थिर समीकरण

4) सीमा की स्थितियाँ

और


अनंत-क्षितिज, सतत-समय

द्वारा वर्णित सतत-समय रैखिक प्रणाली के लिए:

एक लागत फलन के साथ जिसे इस प्रकार परिभाषित किया गया है:

फीडबैक नियंत्रण कानून जो लागत के मूल्य को न्यूनतम करता है वह है:

कहाँ द्वारा दिया गया है:

और निरंतर समय बीजगणितीय रिकाती समीकरण को हल करके पाया जाता है:

इसे इस प्रकार भी लिखा जा सकता है:

साथ


परिमित-क्षितिज, असतत-समय

द्वारा वर्णित असतत-समय रैखिक प्रणाली के लिए: [2]

एक प्रदर्शन सूचकांक के साथ जिसे इस प्रकार परिभाषित किया गया है:

, कहाँ समय क्षितिज है

प्रदर्शन सूचकांक को न्यूनतम करने वाला इष्टतम नियंत्रण अनुक्रम इस प्रकार दिया गया है:

कहाँ:

और गतिशील रिकाटी समीकरण द्वारा समय में पुनरावर्ती रूप से पीछे की ओर पाया जाता है:

टर्मिनल स्थिति से .[3] ध्यान दें कि परिभाषित नहीं है, चूँकि अपनी अंतिम अवस्था में चला जाता है द्वारा .

अनंत-क्षितिज, असतत-समय

द्वारा वर्णित असतत-समय रैखिक प्रणाली के लिए:

एक प्रदर्शन सूचकांक के साथ जिसे इस प्रकार परिभाषित किया गया है:

प्रदर्शन सूचकांक को न्यूनतम करने वाला इष्टतम नियंत्रण अनुक्रम इस प्रकार दिया गया है:

कहाँ:

और असतत समय बीजगणितीय रिकाटी समीकरण (डीएआरई) का अद्वितीय सकारात्मक निश्चित समाधान है:

.

इसे इस प्रकार भी लिखा जा सकता है:

साथ:

.

ध्यान दें कि बीजगणितीय रिकाटी समीकरण को हल करने का एक तरीका परिमित-क्षितिज मामले के गतिशील रिकाटी समीकरण को तब तक दोहराना है जब तक कि यह अभिसरण न हो जाए।

बाधाएँ

व्यवहार में, सभी मूल्य नहीं अनुमति दी जा सकती है. एक सामान्य बाधा रैखिक है:

इसका परिमित क्षितिज संस्करण एक उत्तल अनुकूलन समस्या है, और इसलिए समस्या को अक्सर घटते क्षितिज के साथ बार-बार हल किया जाता है। यह मॉडल पूर्वानुमानित नियंत्रण का एक रूप है।[4][5]


संबंधित नियंत्रक

द्विघात-द्विघात नियामक

यदि अवस्था समीकरण द्विघात है तो समस्या को द्विघात-द्विघात नियामक (QQR) के रूप में जाना जाता है। इस समस्या को कम करने के लिए अल'ब्रेक्ट एल्गोरिदम को लागू किया जा सकता है जिसे टेंसर आधारित रैखिक सॉल्वर का उपयोग करके कुशलतापूर्वक हल किया जा सकता है।[6]


बहुपद-द्विघात नियामक

यदि अवस्था समीकरण बहुपद है तो समस्या को बहुपद-द्विघात नियामक (PQR) के रूप में जाना जाता है। फिर से, इस समस्या को एक बड़े रैखिक रूप में कम करने के लिए अल'ब्रेक्ट एल्गोरिदम को लागू किया जा सकता है जिसे बार्टेल्स-स्टीवर्ट एल्गोरिथम के सामान्यीकरण के साथ हल किया जा सकता है; यह संभव है बशर्ते कि बहुपद की डिग्री बहुत अधिक न हो।[7]


मॉडल-भविष्य कहनेवाला नियंत्रण

मॉडल पूर्वानुमानित नियंत्रण और रैखिक-द्विघात नियामक दो प्रकार की इष्टतम नियंत्रण विधियाँ हैं जिनमें अनुकूलन लागत निर्धारित करने के लिए अलग-अलग दृष्टिकोण हैं। विशेष रूप से, जब एलक्यूआर को घटते क्षितिज के साथ बार-बार चलाया जाता है, तो यह मॉडल पूर्वानुमान नियंत्रण (एमपीसी) का एक रूप बन जाता है। हालाँकि, सामान्य तौर पर, एमपीसी सिस्टम की रैखिकता के संबंध में किसी भी धारणा पर भरोसा नहीं करता है।

संदर्भ

  1. Lehtomaki, N.; Sandell, N.; Athans, M. (1981). "मजबूती के परिणामस्वरूप रैखिक-द्विघात गॉसियन आधारित बहुपरिवर्तनीय नियंत्रण डिजाइन तैयार होते हैं". IEEE Transactions on Automatic Control (in English). 26 (1): 75–93. doi:10.1109/TAC.1981.1102565. ISSN 0018-9286.
  2. Chow, Gregory C. (1986). गतिशील आर्थिक प्रणालियों का विश्लेषण और नियंत्रण. Krieger Publ. Co. ISBN 0-89874-969-7.
  3. Shaiju, AJ, Petersen, Ian R. (2008). "असतत समय LQR, LQG, LEQG और मिनिमैक्स LQG इष्टतम नियंत्रण समस्याओं के लिए सूत्र". IFAC Proceedings Volumes. Elsevier. 41 (2): 8773–8778. doi:10.3182/20080706-5-KR-1001.01483.{{cite journal}}: CS1 maint: multiple names: authors list (link)
  4. "Ch. 8 - Linear Quadratic Regulators". underactuated.mit.edu. Retrieved 20 August 2022.
  5. https://minds.wisconsin.edu/bitstream/handle/1793/10888/file_1.pdf;jsessionid=52A001EAADF4C22B901290B594BFDA8E?sequence=1. Retrieved 20 August 2022. {{cite web}}: Missing or empty |title= (help)
  6. Borggaard, Jeff; Zietsman, Lizette (July 2020). The Quadratic-Quadratic Regulator Problem: Approximating feedback controls for quadratic-in-state nonlinear systems. pp. 818–823. arXiv:1910.03396. doi:10.23919/ACC45564.2020.9147286. ISBN 978-1-5386-8266-1. S2CID 203904925. Retrieved 20 August 2022. {{cite book}}: |website= ignored (help)
  7. Borggaard, Jeff; Zietsman, Lizette (1 January 2021). "बहुपद-द्विघात नियामक समस्याओं का अनुमान लगाने पर". IFAC-PapersOnLine (in English). 54 (9): 329–334. doi:10.1016/j.ifacol.2021.06.090. S2CID 221856517.
  • Kwakernaak, Huibert & Sivan, Raphael (1972). Linear Optimal Control Systems. First Edition. Wiley-Interscience. ISBN 0-471-51110-2.


बाहरी संबंध