रैखिक-द्विघात नियामक: Difference between revisions
No edit summary |
|||
Line 4: | Line 4: | ||
==सामान्य विवरण== | ==सामान्य विवरण== | ||
किसी मशीन या प्रक्रिया (जैसे हवाई जहाज या रासायनिक | किसी मशीन या प्रक्रिया (जैसे हवाई जहाज या रासायनिक अभिक्रियक) को नियंत्रित करने वाले (विनियमन करने वाले) नियंत्रक की सेटिंग एक गणितीय कलन विधि का उपयोग करके पाई जाती है जो मानव (इंजीनियर) द्वारा आपूर्ति किए गए भारक गुणकों के साथ [[लागत फलन]] को कम करती है। लागत फलन को अधितर उनके अपेक्षित मानों से शीर्षलंब या प्रक्रम ताप जैसे प्रमुख मापों के विचलनों के योग के रूप में परिभाषित किया जाता है। इस प्रकार कलन विधि उन नियंत्रक सेटिंग्स को खोजती है जो अवांछित विचलनों को कम करते हैं। नियंत्रण क्रिया का परिमाण भी लागत फलन में सम्मिलित किया जा सकता है। | ||
LQR एल्गोरिदम नियंत्रक को अनुकूलित करने के लिए नियंत्रण तंत्र इंजीनियर द्वारा किए गए कार्य की मात्रा को कम कर देता है। हालाँकि, इंजीनियर को अभी भी लागत फलन पैरामीटर निर्दिष्ट करने और निर्दिष्ट प्रारुप लक्ष्यों के साथ परिणामों की तुलना करने की आवश्यकता है। अधिकतर इसका अर्थ यह होता है कि नियंत्रक निर्माण एक पुनरावृत्तिमूलक क्रिया होगी जिसमें इंजीनियर सिमुलेशन (अनुकार) के माध्यम से उत्पादित "इष्टतम" नियंत्रकों का मूल्यांकन करता है और फिर प्रारुप लक्ष्यों के साथ अधिक सुसंगत नियंत्रक का उत्पादन करने के लिए मापदंडों को समायोजित करता है। | |||
LQR एल्गोरिथ्म अनिवार्य रूप से एक उपयुक्त [[स्थिति फीडबैक (पुनर्भरण) नियंत्रक]] खोजने का एक स्वचालित तरीका है। इस प्रकार, नियंत्रण इंजीनियरों के लिए वैकल्पिक विधियों को प्राथमिकता देना असामान्य नहीं है, जैसे [[पूर्ण स्थिति फीडबैक]], जिसे पोल प्लेसमेंट भी कहा जाता है | सही भारक गुणकों को खोजने में कठिनाई LQR आधारित नियंत्रक संश्लेषण के अनुप्रयोग को सीमित करती है। | |||
== संस्करण == | == संस्करण == | ||
Line 19: | Line 16: | ||
:<math>\dot{x} = Ax + Bu</math> | :<math>\dot{x} = Ax + Bu</math> | ||
कहाँ <math>x \in \mathbb{R}^{n}</math> (वह है, <math>x</math> एक <math>n</math>-आयामी वास्तविक-मूल्यवान वेक्टर) सिस्टम की स्थिति है और <math>u \in \mathbb{R}^{m}</math> नियंत्रण इनपुट है. सिस्टम के लिए एक द्विघात लागत | कहाँ <math>x \in \mathbb{R}^{n}</math> (वह है, <math>x</math> एक <math>n</math>-आयामी वास्तविक-मूल्यवान वेक्टर) सिस्टम की स्थिति है और <math>u \in \mathbb{R}^{m}</math> नियंत्रण इनपुट है. सिस्टम के लिए एक द्विघात लागत फलन दिया गया है, जिसे इस प्रकार परिभाषित किया गया है: | ||
:<math>J = x^T(t_1)F(t_1)x(t_1) + \int\limits_{t_0}^{t_1} \left( x^T Q x + u^T R u + 2 x^T N u \right) dt</math | :<math>J = x^T(t_1)F(t_1)x(t_1) + \int\limits_{t_0}^{t_1} \left( x^T Q x + u^T R u + 2 x^T N u \right) dt</math> | ||
फीडबैक नियंत्रण कानून जो लागत के मूल्य को न्यूनतम करता है वह है: | फीडबैक नियंत्रण कानून जो लागत के मूल्य को न्यूनतम करता है वह है: | ||
Line 53: | Line 50: | ||
:<math>\dot{x} = Ax + Bu</math> | :<math>\dot{x} = Ax + Bu</math> | ||
एक लागत | एक लागत फलन के साथ जिसे इस प्रकार परिभाषित किया गया है: | ||
:<math>J = \int_{0}^\infty \left( x^T Q x + u^T R u + 2 x^T N u \right) dt</math> | :<math>J = \int_{0}^\infty \left( x^T Q x + u^T R u + 2 x^T N u \right) dt</math> |
Revision as of 07:29, 4 August 2023
इष्टतम नियंत्रण का सिद्धांत न्यूनतम लागत पर एक गतिक तंत्र के संचालन से संबंधित है। वह स्थिति जहां तंत्र गतिकी को रैखिक अवकल समीकरणों के एक समुच्चय द्वारा वर्णित किया जाता है और लागत को एक द्विघात फलन द्वारा वर्णित किया जाता है, उसे LQ समस्या कहलाती है। सिद्धांत में मुख्य परिणामों में से एक यह है कि समाधान रैखिक-द्विघात नियामक (LQR) द्वारा प्रदान किया जाता है, एक फीडबैक (पुनर्भरण) नियंत्रक जिसके समीकरण नीचे दिए गए हैं।
LQR नियंत्रकों में गारंटित लाभ और फेज मार्जिन के साथ अंतर्निहित मजबूती होती है,[1] और वे LQG (रैखिक-द्विघात-गाऊसी) समस्या के समाधान के भी भाग हैं। LQR समस्या की तरह, LQG समस्या भी नियंत्रण सिद्धांत में सबसे मौलिक समस्याओं में से एक है।
सामान्य विवरण
किसी मशीन या प्रक्रिया (जैसे हवाई जहाज या रासायनिक अभिक्रियक) को नियंत्रित करने वाले (विनियमन करने वाले) नियंत्रक की सेटिंग एक गणितीय कलन विधि का उपयोग करके पाई जाती है जो मानव (इंजीनियर) द्वारा आपूर्ति किए गए भारक गुणकों के साथ लागत फलन को कम करती है। लागत फलन को अधितर उनके अपेक्षित मानों से शीर्षलंब या प्रक्रम ताप जैसे प्रमुख मापों के विचलनों के योग के रूप में परिभाषित किया जाता है। इस प्रकार कलन विधि उन नियंत्रक सेटिंग्स को खोजती है जो अवांछित विचलनों को कम करते हैं। नियंत्रण क्रिया का परिमाण भी लागत फलन में सम्मिलित किया जा सकता है।
LQR एल्गोरिदम नियंत्रक को अनुकूलित करने के लिए नियंत्रण तंत्र इंजीनियर द्वारा किए गए कार्य की मात्रा को कम कर देता है। हालाँकि, इंजीनियर को अभी भी लागत फलन पैरामीटर निर्दिष्ट करने और निर्दिष्ट प्रारुप लक्ष्यों के साथ परिणामों की तुलना करने की आवश्यकता है। अधिकतर इसका अर्थ यह होता है कि नियंत्रक निर्माण एक पुनरावृत्तिमूलक क्रिया होगी जिसमें इंजीनियर सिमुलेशन (अनुकार) के माध्यम से उत्पादित "इष्टतम" नियंत्रकों का मूल्यांकन करता है और फिर प्रारुप लक्ष्यों के साथ अधिक सुसंगत नियंत्रक का उत्पादन करने के लिए मापदंडों को समायोजित करता है।
LQR एल्गोरिथ्म अनिवार्य रूप से एक उपयुक्त स्थिति फीडबैक (पुनर्भरण) नियंत्रक खोजने का एक स्वचालित तरीका है। इस प्रकार, नियंत्रण इंजीनियरों के लिए वैकल्पिक विधियों को प्राथमिकता देना असामान्य नहीं है, जैसे पूर्ण स्थिति फीडबैक, जिसे पोल प्लेसमेंट भी कहा जाता है | सही भारक गुणकों को खोजने में कठिनाई LQR आधारित नियंत्रक संश्लेषण के अनुप्रयोग को सीमित करती है।
संस्करण
परिमित-क्षितिज, निरंतर-समय
एक सतत-समय रैखिक प्रणाली के लिए, पर परिभाषित , द्वारा वर्णित:
कहाँ (वह है, एक -आयामी वास्तविक-मूल्यवान वेक्टर) सिस्टम की स्थिति है और नियंत्रण इनपुट है. सिस्टम के लिए एक द्विघात लागत फलन दिया गया है, जिसे इस प्रकार परिभाषित किया गया है:
फीडबैक नियंत्रण कानून जो लागत के मूल्य को न्यूनतम करता है वह है:
कहाँ द्वारा दिया गया है:
और निरंतर समय रिकाटी अंतर समीकरण को हल करके पाया जाता है:
सीमा शर्त के साथ:
जे के लिए प्रथम आदेश की शर्तेंmin हैं:
1) राज्य समीकरण
2) कोस्टेट समीकरण|कोस्टेट समीकरण
3) स्थिर समीकरण
4) सीमा की स्थितियाँ
और
अनंत-क्षितिज, सतत-समय
द्वारा वर्णित सतत-समय रैखिक प्रणाली के लिए:
एक लागत फलन के साथ जिसे इस प्रकार परिभाषित किया गया है:
फीडबैक नियंत्रण कानून जो लागत के मूल्य को न्यूनतम करता है वह है:
कहाँ द्वारा दिया गया है:
और निरंतर समय बीजगणितीय रिकाती समीकरण को हल करके पाया जाता है:
इसे इस प्रकार भी लिखा जा सकता है:
साथ
परिमित-क्षितिज, असतत-समय
द्वारा वर्णित असतत-समय रैखिक प्रणाली के लिए: [2]
एक प्रदर्शन सूचकांक के साथ जिसे इस प्रकार परिभाषित किया गया है:
- , कहाँ समय क्षितिज है
प्रदर्शन सूचकांक को न्यूनतम करने वाला इष्टतम नियंत्रण अनुक्रम इस प्रकार दिया गया है:
कहाँ:
और गतिशील रिकाटी समीकरण द्वारा समय में पुनरावर्ती रूप से पीछे की ओर पाया जाता है:
टर्मिनल स्थिति से .[3] ध्यान दें कि परिभाषित नहीं है, चूँकि अपनी अंतिम अवस्था में चला जाता है द्वारा .
अनंत-क्षितिज, असतत-समय
द्वारा वर्णित असतत-समय रैखिक प्रणाली के लिए:
एक प्रदर्शन सूचकांक के साथ जिसे इस प्रकार परिभाषित किया गया है:
प्रदर्शन सूचकांक को न्यूनतम करने वाला इष्टतम नियंत्रण अनुक्रम इस प्रकार दिया गया है:
कहाँ:
और असतत समय बीजगणितीय रिकाटी समीकरण (डीएआरई) का अद्वितीय सकारात्मक निश्चित समाधान है:
- .
इसे इस प्रकार भी लिखा जा सकता है:
साथ:
- .
ध्यान दें कि बीजगणितीय रिकाटी समीकरण को हल करने का एक तरीका परिमित-क्षितिज मामले के गतिशील रिकाटी समीकरण को तब तक दोहराना है जब तक कि यह अभिसरण न हो जाए।
बाधाएँ
व्यवहार में, सभी मूल्य नहीं अनुमति दी जा सकती है. एक सामान्य बाधा रैखिक है:
इसका परिमित क्षितिज संस्करण एक उत्तल अनुकूलन समस्या है, और इसलिए समस्या को अक्सर घटते क्षितिज के साथ बार-बार हल किया जाता है। यह मॉडल पूर्वानुमानित नियंत्रण का एक रूप है।[4][5]
संबंधित नियंत्रक
द्विघात-द्विघात नियामक
यदि अवस्था समीकरण द्विघात है तो समस्या को द्विघात-द्विघात नियामक (QQR) के रूप में जाना जाता है। इस समस्या को कम करने के लिए अल'ब्रेक्ट एल्गोरिदम को लागू किया जा सकता है जिसे टेंसर आधारित रैखिक सॉल्वर का उपयोग करके कुशलतापूर्वक हल किया जा सकता है।[6]
बहुपद-द्विघात नियामक
यदि अवस्था समीकरण बहुपद है तो समस्या को बहुपद-द्विघात नियामक (PQR) के रूप में जाना जाता है। फिर से, इस समस्या को एक बड़े रैखिक रूप में कम करने के लिए अल'ब्रेक्ट एल्गोरिदम को लागू किया जा सकता है जिसे बार्टेल्स-स्टीवर्ट एल्गोरिथम के सामान्यीकरण के साथ हल किया जा सकता है; यह संभव है बशर्ते कि बहुपद की डिग्री बहुत अधिक न हो।[7]
मॉडल-भविष्य कहनेवाला नियंत्रण
मॉडल पूर्वानुमानित नियंत्रण और रैखिक-द्विघात नियामक दो प्रकार की इष्टतम नियंत्रण विधियाँ हैं जिनमें अनुकूलन लागत निर्धारित करने के लिए अलग-अलग दृष्टिकोण हैं। विशेष रूप से, जब एलक्यूआर को घटते क्षितिज के साथ बार-बार चलाया जाता है, तो यह मॉडल पूर्वानुमान नियंत्रण (एमपीसी) का एक रूप बन जाता है। हालाँकि, सामान्य तौर पर, एमपीसी सिस्टम की रैखिकता के संबंध में किसी भी धारणा पर भरोसा नहीं करता है।
संदर्भ
- ↑ Lehtomaki, N.; Sandell, N.; Athans, M. (1981). "मजबूती के परिणामस्वरूप रैखिक-द्विघात गॉसियन आधारित बहुपरिवर्तनीय नियंत्रण डिजाइन तैयार होते हैं". IEEE Transactions on Automatic Control (in English). 26 (1): 75–93. doi:10.1109/TAC.1981.1102565. ISSN 0018-9286.
- ↑ Chow, Gregory C. (1986). गतिशील आर्थिक प्रणालियों का विश्लेषण और नियंत्रण. Krieger Publ. Co. ISBN 0-89874-969-7.
- ↑ Shaiju, AJ, Petersen, Ian R. (2008). "असतत समय LQR, LQG, LEQG और मिनिमैक्स LQG इष्टतम नियंत्रण समस्याओं के लिए सूत्र". IFAC Proceedings Volumes. Elsevier. 41 (2): 8773–8778. doi:10.3182/20080706-5-KR-1001.01483.
{{cite journal}}
: CS1 maint: multiple names: authors list (link) - ↑ "Ch. 8 - Linear Quadratic Regulators". underactuated.mit.edu. Retrieved 20 August 2022.
- ↑ https://minds.wisconsin.edu/bitstream/handle/1793/10888/file_1.pdf;jsessionid=52A001EAADF4C22B901290B594BFDA8E?sequence=1. Retrieved 20 August 2022.
{{cite web}}
: Missing or empty|title=
(help) - ↑ Borggaard, Jeff; Zietsman, Lizette (July 2020). The Quadratic-Quadratic Regulator Problem: Approximating feedback controls for quadratic-in-state nonlinear systems. pp. 818–823. arXiv:1910.03396. doi:10.23919/ACC45564.2020.9147286. ISBN 978-1-5386-8266-1. S2CID 203904925. Retrieved 20 August 2022.
{{cite book}}
:|website=
ignored (help) - ↑ Borggaard, Jeff; Zietsman, Lizette (1 January 2021). "बहुपद-द्विघात नियामक समस्याओं का अनुमान लगाने पर". IFAC-PapersOnLine (in English). 54 (9): 329–334. doi:10.1016/j.ifacol.2021.06.090. S2CID 221856517.
- Kwakernaak, Huibert & Sivan, Raphael (1972). Linear Optimal Control Systems. First Edition. Wiley-Interscience. ISBN 0-471-51110-2.
- Sontag, Eduardo (1998). Mathematical Control Theory: Deterministic Finite Dimensional Systems. Second Edition. Springer. ISBN 0-387-98489-5.