रैखिक-द्विघात नियामक: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 1: Line 1:
{{Short description|Linear optimal control technique}}[[इष्टतम नियंत्रण]] का सिद्धांत न्यूनतम लागत पर एक [[गतिशील प्रणाली|गतिक तंत्र]] के संचालन से संबंधित है। वह मामला जहां सिस्टम की गतिशीलता को [[रैखिक अंतर समीकरण]]ों के एक सेट द्वारा वर्णित किया जाता है और लागत को [[द्विघात बहुपद]] [[कार्यात्मक (गणित)]] द्वारा वर्णित किया जाता है, एलक्यू समस्या कहलाती है। सिद्धांत में मुख्य परिणामों में से एक यह है कि समाधान रैखिक-द्विघात नियामक (एलक्यूआर) द्वारा प्रदान किया जाता है, एक फीडबैक नियंत्रक जिसके समीकरण नीचे दिए गए हैं।
{{Short description|Linear optimal control technique}}[[इष्टतम नियंत्रण]] का सिद्धांत न्यूनतम लागत पर एक [[गतिशील प्रणाली|गतिक तंत्र]] के संचालन से संबंधित है। वह स्थिति जहां तंत्र गतिकी को [[रैखिक अंतर समीकरण|रैखिक अवकल समीकरणों]] के एक समुच्चय द्वारा वर्णित किया जाता है और लागत को एक [[द्विघात बहुपद|द्विघात फलन]] द्वारा वर्णित किया जाता है, उसे LQ समस्या कहलाती है। सिद्धांत में मुख्य परिणामों में से एक यह है कि समाधान '''रैखिक-द्विघात नियामक''' ('''LQR''') द्वारा प्रदान किया जाता है, एक फीडबैक (पुनर्भरण) नियंत्रक जिसके समीकरण नीचे दिए गए हैं।


LQR नियंत्रकों में गारंटीकृत लाभ मार्जिन और [[चरण मार्जिन]] के साथ अंतर्निहित मजबूती होती है,<ref>{{Cite journal |last=Lehtomaki |first=N. |last2=Sandell |first2=N. |last3=Athans |first3=M. |date=1981 |title=मजबूती के परिणामस्वरूप रैखिक-द्विघात गॉसियन आधारित बहुपरिवर्तनीय नियंत्रण डिजाइन तैयार होते हैं|url=http://ieeexplore.ieee.org/document/1102565/ |journal=IEEE Transactions on Automatic Control |language=en |volume=26 |issue=1 |pages=75–93 |doi=10.1109/TAC.1981.1102565 |issn=0018-9286}}</ref> और वे रैखिक-द्विघात-गाऊसी नियंत्रण|एलक्यूजी (रैखिक-द्विघात-गाऊसी) समस्या के समाधान का भी हिस्सा हैं। एलक्यूआर समस्या की तरह ही, एलक्यूजी समस्या भी [[नियंत्रण सिद्धांत]] में सबसे बुनियादी समस्याओं में से एक है।
LQR नियंत्रकों में गारंटित [[लाभ]] और [[चरण मार्जिन|फेज मार्जिन]] के साथ अंतर्निहित मजबूती होती है,<ref>{{Cite journal |last=Lehtomaki |first=N. |last2=Sandell |first2=N. |last3=Athans |first3=M. |date=1981 |title=मजबूती के परिणामस्वरूप रैखिक-द्विघात गॉसियन आधारित बहुपरिवर्तनीय नियंत्रण डिजाइन तैयार होते हैं|url=http://ieeexplore.ieee.org/document/1102565/ |journal=IEEE Transactions on Automatic Control |language=en |volume=26 |issue=1 |pages=75–93 |doi=10.1109/TAC.1981.1102565 |issn=0018-9286}}</ref> और वे [[LQG (रैखिक-द्विघात-गाऊसी) समस्या]] के समाधान के भी भाग हैं। LQR समस्या की तरह, LQG समस्या भी [[नियंत्रण सिद्धांत]] में सबसे मौलिक समस्याओं में से एक है।


==सामान्य विवरण==
==सामान्य विवरण==
किसी मशीन या प्रक्रिया (जैसे हवाई जहाज या रासायनिक रिएक्टर) को नियंत्रित करने वाले (विनियमन करने वाले) नियंत्रक की सेटिंग्स एक गणितीय एल्गोरिदम का उपयोग करके पाई जाती हैं जो मानव (इंजीनियर) द्वारा आपूर्ति किए गए भार कारकों के साथ हानि फ़ंक्शन को कम करती है। लागत फ़ंक्शन को अक्सर उनके वांछित मूल्यों से ऊंचाई या प्रक्रिया तापमान जैसे प्रमुख मापों के विचलन के योग के रूप में परिभाषित किया जाता है। इस प्रकार एल्गोरिदम उन नियंत्रक सेटिंग्स को ढूंढता है जो अवांछित विचलन को कम करते हैं। नियंत्रण कार्रवाई का परिमाण भी लागत फ़ंक्शन में शामिल किया जा सकता है।
किसी मशीन या प्रक्रिया (जैसे हवाई जहाज या रासायनिक रिएक्टर) को नियंत्रित करने वाले (विनियमन करने वाले) नियंत्रक की समुच्चयिंग्स एक गणितीय एल्गोरिदम का उपयोग करके पाई जाती हैं जो मानव (इंजीनियर) द्वारा आपूर्ति किए गए भार कारकों के साथ हानि फ़ंक्शन को कम करती है। लागत फ़ंक्शन को अक्सर उनके वांछित मूल्यों से ऊंचाई या प्रक्रिया तापमान जैसे प्रमुख मापों के विचलन के योग के रूप में परिभाषित किया जाता है। इस प्रकार एल्गोरिदम उन नियंत्रक समुच्चयिंग्स को ढूंढता है जो अवांछित विचलन को कम करते हैं। नियंत्रण कार्रवाई का परिमाण भी लागत फ़ंक्शन में शामिल किया जा सकता है।


LQR एल्गोरिदम नियंत्रक को अनुकूलित करने के लिए नियंत्रण सिस्टम इंजीनियर द्वारा किए गए कार्य की मात्रा को कम कर देता है। हालाँकि, इंजीनियर को अभी भी लागत फ़ंक्शन पैरामीटर निर्दिष्ट करने और निर्दिष्ट डिज़ाइन लक्ष्यों के साथ परिणामों की तुलना करने की आवश्यकता है। अक्सर इसका मतलब यह होता है कि नियंत्रक निर्माण एक पुनरावृत्तीय प्रक्रिया होगी जिसमें इंजीनियर सिमुलेशन के माध्यम से उत्पादित इष्टतम नियंत्रकों का मूल्यांकन करता है और फिर डिजाइन लक्ष्यों के साथ अधिक सुसंगत नियंत्रक का उत्पादन करने के लिए मापदंडों को समायोजित करता है।
LQR एल्गोरिदम नियंत्रक को अनुकूलित करने के लिए नियंत्रण सिस्टम इंजीनियर द्वारा किए गए कार्य की मात्रा को कम कर देता है। हालाँकि, इंजीनियर को अभी भी लागत फ़ंक्शन पैरामीटर निर्दिष्ट करने और निर्दिष्ट डिज़ाइन लक्ष्यों के साथ परिणामों की तुलना करने की आवश्यकता है। अक्सर इसका मतलब यह होता है कि नियंत्रक निर्माण एक पुनरावृत्तीय प्रक्रिया होगी जिसमें इंजीनियर सिमुलेशन के माध्यम से उत्पादित इष्टतम नियंत्रकों का मूल्यांकन करता है और फिर डिजाइन लक्ष्यों के साथ अधिक सुसंगत नियंत्रक का उत्पादन करने के लिए मापदंडों को समायोजित करता है।

Revision as of 06:31, 4 August 2023

इष्टतम नियंत्रण का सिद्धांत न्यूनतम लागत पर एक गतिक तंत्र के संचालन से संबंधित है। वह स्थिति जहां तंत्र गतिकी को रैखिक अवकल समीकरणों के एक समुच्चय द्वारा वर्णित किया जाता है और लागत को एक द्विघात फलन द्वारा वर्णित किया जाता है, उसे LQ समस्या कहलाती है। सिद्धांत में मुख्य परिणामों में से एक यह है कि समाधान रैखिक-द्विघात नियामक (LQR) द्वारा प्रदान किया जाता है, एक फीडबैक (पुनर्भरण) नियंत्रक जिसके समीकरण नीचे दिए गए हैं।

LQR नियंत्रकों में गारंटित लाभ और फेज मार्जिन के साथ अंतर्निहित मजबूती होती है,[1] और वे LQG (रैखिक-द्विघात-गाऊसी) समस्या के समाधान के भी भाग हैं। LQR समस्या की तरह, LQG समस्या भी नियंत्रण सिद्धांत में सबसे मौलिक समस्याओं में से एक है।

सामान्य विवरण

किसी मशीन या प्रक्रिया (जैसे हवाई जहाज या रासायनिक रिएक्टर) को नियंत्रित करने वाले (विनियमन करने वाले) नियंत्रक की समुच्चयिंग्स एक गणितीय एल्गोरिदम का उपयोग करके पाई जाती हैं जो मानव (इंजीनियर) द्वारा आपूर्ति किए गए भार कारकों के साथ हानि फ़ंक्शन को कम करती है। लागत फ़ंक्शन को अक्सर उनके वांछित मूल्यों से ऊंचाई या प्रक्रिया तापमान जैसे प्रमुख मापों के विचलन के योग के रूप में परिभाषित किया जाता है। इस प्रकार एल्गोरिदम उन नियंत्रक समुच्चयिंग्स को ढूंढता है जो अवांछित विचलन को कम करते हैं। नियंत्रण कार्रवाई का परिमाण भी लागत फ़ंक्शन में शामिल किया जा सकता है।

LQR एल्गोरिदम नियंत्रक को अनुकूलित करने के लिए नियंत्रण सिस्टम इंजीनियर द्वारा किए गए कार्य की मात्रा को कम कर देता है। हालाँकि, इंजीनियर को अभी भी लागत फ़ंक्शन पैरामीटर निर्दिष्ट करने और निर्दिष्ट डिज़ाइन लक्ष्यों के साथ परिणामों की तुलना करने की आवश्यकता है। अक्सर इसका मतलब यह होता है कि नियंत्रक निर्माण एक पुनरावृत्तीय प्रक्रिया होगी जिसमें इंजीनियर सिमुलेशन के माध्यम से उत्पादित इष्टतम नियंत्रकों का मूल्यांकन करता है और फिर डिजाइन लक्ष्यों के साथ अधिक सुसंगत नियंत्रक का उत्पादन करने के लिए मापदंडों को समायोजित करता है।

LQR एल्गोरिथ्म अनिवार्य रूप से एक उपयुक्त राज्य स्थान (नियंत्रण) | राज्य-प्रतिक्रिया नियंत्रक खोजने का एक स्वचालित तरीका है। इस प्रकार, नियंत्रण इंजीनियरों के लिए वैकल्पिक तरीकों को प्राथमिकता देना असामान्य नहीं है, जैसे पूर्ण राज्य फीडबैक, जिसे पोल प्लेसमेंट भी कहा जाता है, जिसमें नियंत्रक मापदंडों और नियंत्रक व्यवहार के बीच एक स्पष्ट संबंध होता है। सही भार कारकों को खोजने में कठिनाई एलक्यूआर आधारित नियंत्रक संश्लेषण के अनुप्रयोग को सीमित करती है।


संस्करण

परिमित-क्षितिज, निरंतर-समय

एक सतत-समय रैखिक प्रणाली के लिए, पर परिभाषित , द्वारा वर्णित:

कहाँ (वह है, एक -आयामी वास्तविक-मूल्यवान वेक्टर) सिस्टम की स्थिति है और नियंत्रण इनपुट है. सिस्टम के लिए एक द्विघात लागत फ़ंक्शन दिया गया है, जिसे इस प्रकार परिभाषित किया गया है:

फीडबैक नियंत्रण कानून जो लागत के मूल्य को न्यूनतम करता है वह है:

कहाँ द्वारा दिया गया है:

और निरंतर समय रिकाटी अंतर समीकरण को हल करके पाया जाता है:

सीमा शर्त के साथ:

जे के लिए प्रथम आदेश की शर्तेंmin हैं:

1) राज्य समीकरण

2) कोस्टेट समीकरण|कोस्टेट समीकरण

3) स्थिर समीकरण

4) सीमा की स्थितियाँ

और


अनंत-क्षितिज, सतत-समय

द्वारा वर्णित सतत-समय रैखिक प्रणाली के लिए:

एक लागत फ़ंक्शन के साथ जिसे इस प्रकार परिभाषित किया गया है:

फीडबैक नियंत्रण कानून जो लागत के मूल्य को न्यूनतम करता है वह है:

कहाँ द्वारा दिया गया है:

और निरंतर समय बीजगणितीय रिकाती समीकरण को हल करके पाया जाता है:

इसे इस प्रकार भी लिखा जा सकता है:

साथ


परिमित-क्षितिज, असतत-समय

द्वारा वर्णित असतत-समय रैखिक प्रणाली के लिए: [2]

एक प्रदर्शन सूचकांक के साथ जिसे इस प्रकार परिभाषित किया गया है:

, कहाँ समय क्षितिज है

प्रदर्शन सूचकांक को न्यूनतम करने वाला इष्टतम नियंत्रण अनुक्रम इस प्रकार दिया गया है:

कहाँ:

और गतिशील रिकाटी समीकरण द्वारा समय में पुनरावर्ती रूप से पीछे की ओर पाया जाता है:

टर्मिनल स्थिति से .[3] ध्यान दें कि परिभाषित नहीं है, चूँकि अपनी अंतिम अवस्था में चला जाता है द्वारा .

अनंत-क्षितिज, असतत-समय

द्वारा वर्णित असतत-समय रैखिक प्रणाली के लिए:

एक प्रदर्शन सूचकांक के साथ जिसे इस प्रकार परिभाषित किया गया है:

प्रदर्शन सूचकांक को न्यूनतम करने वाला इष्टतम नियंत्रण अनुक्रम इस प्रकार दिया गया है:

कहाँ:

और असतत समय बीजगणितीय रिकाटी समीकरण (डीएआरई) का अद्वितीय सकारात्मक निश्चित समाधान है:

.

इसे इस प्रकार भी लिखा जा सकता है:

साथ:

.

ध्यान दें कि बीजगणितीय रिकाटी समीकरण को हल करने का एक तरीका परिमित-क्षितिज मामले के गतिशील रिकाटी समीकरण को तब तक दोहराना है जब तक कि यह अभिसरण न हो जाए।

बाधाएँ

व्यवहार में, सभी मूल्य नहीं अनुमति दी जा सकती है. एक सामान्य बाधा रैखिक है:

इसका परिमित क्षितिज संस्करण एक उत्तल अनुकूलन समस्या है, और इसलिए समस्या को अक्सर घटते क्षितिज के साथ बार-बार हल किया जाता है। यह मॉडल पूर्वानुमानित नियंत्रण का एक रूप है।[4][5]


संबंधित नियंत्रक

द्विघात-द्विघात नियामक

यदि अवस्था समीकरण द्विघात है तो समस्या को द्विघात-द्विघात नियामक (QQR) के रूप में जाना जाता है। इस समस्या को कम करने के लिए अल'ब्रेक्ट एल्गोरिदम को लागू किया जा सकता है जिसे टेंसर आधारित रैखिक सॉल्वर का उपयोग करके कुशलतापूर्वक हल किया जा सकता है।[6]


बहुपद-द्विघात नियामक

यदि अवस्था समीकरण बहुपद है तो समस्या को बहुपद-द्विघात नियामक (PQR) के रूप में जाना जाता है। फिर से, इस समस्या को एक बड़े रैखिक रूप में कम करने के लिए अल'ब्रेक्ट एल्गोरिदम को लागू किया जा सकता है जिसे बार्टेल्स-स्टीवर्ट एल्गोरिथम के सामान्यीकरण के साथ हल किया जा सकता है; यह संभव है बशर्ते कि बहुपद की डिग्री बहुत अधिक न हो।[7]


मॉडल-भविष्य कहनेवाला नियंत्रण

मॉडल पूर्वानुमानित नियंत्रण और रैखिक-द्विघात नियामक दो प्रकार की इष्टतम नियंत्रण विधियाँ हैं जिनमें अनुकूलन लागत निर्धारित करने के लिए अलग-अलग दृष्टिकोण हैं। विशेष रूप से, जब एलक्यूआर को घटते क्षितिज के साथ बार-बार चलाया जाता है, तो यह मॉडल पूर्वानुमान नियंत्रण (एमपीसी) का एक रूप बन जाता है। हालाँकि, सामान्य तौर पर, एमपीसी सिस्टम की रैखिकता के संबंध में किसी भी धारणा पर भरोसा नहीं करता है।

संदर्भ

  1. Lehtomaki, N.; Sandell, N.; Athans, M. (1981). "मजबूती के परिणामस्वरूप रैखिक-द्विघात गॉसियन आधारित बहुपरिवर्तनीय नियंत्रण डिजाइन तैयार होते हैं". IEEE Transactions on Automatic Control (in English). 26 (1): 75–93. doi:10.1109/TAC.1981.1102565. ISSN 0018-9286.
  2. Chow, Gregory C. (1986). गतिशील आर्थिक प्रणालियों का विश्लेषण और नियंत्रण. Krieger Publ. Co. ISBN 0-89874-969-7.
  3. Shaiju, AJ, Petersen, Ian R. (2008). "असतत समय LQR, LQG, LEQG और मिनिमैक्स LQG इष्टतम नियंत्रण समस्याओं के लिए सूत्र". IFAC Proceedings Volumes. Elsevier. 41 (2): 8773–8778. doi:10.3182/20080706-5-KR-1001.01483.{{cite journal}}: CS1 maint: multiple names: authors list (link)
  4. "Ch. 8 - Linear Quadratic Regulators". underactuated.mit.edu. Retrieved 20 August 2022.
  5. https://minds.wisconsin.edu/bitstream/handle/1793/10888/file_1.pdf;jsessionid=52A001EAADF4C22B901290B594BFDA8E?sequence=1. Retrieved 20 August 2022. {{cite web}}: Missing or empty |title= (help)
  6. Borggaard, Jeff; Zietsman, Lizette (July 2020). The Quadratic-Quadratic Regulator Problem: Approximating feedback controls for quadratic-in-state nonlinear systems. pp. 818–823. arXiv:1910.03396. doi:10.23919/ACC45564.2020.9147286. ISBN 978-1-5386-8266-1. S2CID 203904925. Retrieved 20 August 2022. {{cite book}}: |website= ignored (help)
  7. Borggaard, Jeff; Zietsman, Lizette (1 January 2021). "बहुपद-द्विघात नियामक समस्याओं का अनुमान लगाने पर". IFAC-PapersOnLine (in English). 54 (9): 329–334. doi:10.1016/j.ifacol.2021.06.090. S2CID 221856517.
  • Kwakernaak, Huibert & Sivan, Raphael (1972). Linear Optimal Control Systems. First Edition. Wiley-Interscience. ISBN 0-471-51110-2.


बाहरी संबंध