रैखिक-द्विघात नियामक: Difference between revisions

From Vigyanwiki
No edit summary
 
(6 intermediate revisions by 3 users not shown)
Line 1: Line 1:
{{Short description|Linear optimal control technique}}[[इष्टतम नियंत्रण]] का सिद्धांत न्यूनतम लागत पर एक [[गतिशील प्रणाली|गतिक तंत्र]] के संचालन से संबंधित है। वह स्थिति जहां तंत्र गतिकी को [[रैखिक अंतर समीकरण|रैखिक अवकल समीकरणों]] के एक समुच्चय द्वारा वर्णित किया जाता है और लागत को एक [[द्विघात बहुपद|द्विघात फलन]] द्वारा वर्णित किया जाता है, उसे LQ समस्या कहलाती है। सिद्धांत में मुख्य परिणामों में से एक यह है कि समाधान '''रैखिक-द्विघात नियामक''' ('''LQR''') द्वारा प्रदान किया जाता है, एक फीडबैक (पुनर्भरण) नियंत्रक जिसके समीकरण नीचे दिए गए हैं।
{{Short description|Linear optimal control technique}}[[इष्टतम नियंत्रण]] का सिद्धांत न्यूनतम लागत पर एक [[गतिशील प्रणाली|गतिक तंत्र]] के संचालन से संबंधित है। वह स्थिति जहां तंत्र गतिकी को [[रैखिक अंतर समीकरण|रैखिक अवकल समीकरणों]] के एक समुच्चय द्वारा वर्णित किया जाता है और लागत को एक [[द्विघात बहुपद|द्विघात फलन]] द्वारा वर्णित किया जाता है, उसे LQ समस्या कहा जाता है। सिद्धांत में मुख्य परिणामों में से एक यह है कि समाधान '''रैखिक-द्विघात नियामक''' ('''LQR''') द्वारा प्रदान किया जाता है, एक फीडबैक (पुनर्भरण) नियंत्रक जिसके समीकरण नीचे दिए गए हैं।


LQR नियंत्रकों में गारंटित [[लाभ]] और [[चरण मार्जिन|फेज मार्जिन]] के साथ अंतर्निहित मजबूती होती है,<ref>{{Cite journal |last=Lehtomaki |first=N. |last2=Sandell |first2=N. |last3=Athans |first3=M. |date=1981 |title=मजबूती के परिणामस्वरूप रैखिक-द्विघात गॉसियन आधारित बहुपरिवर्तनीय नियंत्रण डिजाइन तैयार होते हैं|url=http://ieeexplore.ieee.org/document/1102565/ |journal=IEEE Transactions on Automatic Control |language=en |volume=26 |issue=1 |pages=75–93 |doi=10.1109/TAC.1981.1102565 |issn=0018-9286}}</ref> और वे [[LQG (रैखिक-द्विघात-गाऊसी) समस्या]] के समाधान के भी भाग हैं। LQR समस्या की तरह, LQG समस्या भी [[नियंत्रण सिद्धांत]] में सबसे मौलिक समस्याओं में से एक है।
LQR नियंत्रकों में गारंटित [[लाभ]] और [[चरण मार्जिन|फेज मार्जिन]] के साथ अंतर्निहित मजबूती होती है,<ref>{{Cite journal |last=Lehtomaki |first=N. |last2=Sandell |first2=N. |last3=Athans |first3=M. |date=1981 |title=मजबूती के परिणामस्वरूप रैखिक-द्विघात गॉसियन आधारित बहुपरिवर्तनीय नियंत्रण डिजाइन तैयार होते हैं|url=http://ieeexplore.ieee.org/document/1102565/ |journal=IEEE Transactions on Automatic Control |language=en |volume=26 |issue=1 |pages=75–93 |doi=10.1109/TAC.1981.1102565 |issn=0018-9286}}</ref> और वे [[LQG (रैखिक-द्विघात-गाऊसी) समस्या]] के समाधान के भी भाग हैं। LQR समस्या की तरह, LQG समस्या भी [[नियंत्रण सिद्धांत]] में सबसे मौलिक समस्याओं में से एक है।
Line 6: Line 6:
किसी मशीन या प्रक्रिया (जैसे हवाई जहाज या रासायनिक अभिक्रियक) को नियंत्रित करने वाले (विनियमन करने वाले) नियंत्रक की सेटिंग एक गणितीय कलन विधि का उपयोग करके पाई जाती है जो मानव (इंजीनियर) द्वारा आपूर्ति किए गए भारक गुणकों के साथ [[लागत फलन]] को कम करती है। लागत फलन को अधितर उनके अपेक्षित मानों से शीर्षलंब या प्रक्रम ताप जैसे प्रमुख मापों के विचलनों के योग के रूप में परिभाषित किया जाता है। इस प्रकार कलन विधि उन नियंत्रक सेटिंग्स को खोजती है जो अवांछित विचलनों को कम करते हैं। नियंत्रण क्रिया का परिमाण भी लागत फलन में सम्मिलित किया जा सकता है।
किसी मशीन या प्रक्रिया (जैसे हवाई जहाज या रासायनिक अभिक्रियक) को नियंत्रित करने वाले (विनियमन करने वाले) नियंत्रक की सेटिंग एक गणितीय कलन विधि का उपयोग करके पाई जाती है जो मानव (इंजीनियर) द्वारा आपूर्ति किए गए भारक गुणकों के साथ [[लागत फलन]] को कम करती है। लागत फलन को अधितर उनके अपेक्षित मानों से शीर्षलंब या प्रक्रम ताप जैसे प्रमुख मापों के विचलनों के योग के रूप में परिभाषित किया जाता है। इस प्रकार कलन विधि उन नियंत्रक सेटिंग्स को खोजती है जो अवांछित विचलनों को कम करते हैं। नियंत्रण क्रिया का परिमाण भी लागत फलन में सम्मिलित किया जा सकता है।


LQR एल्गोरिदम नियंत्रक को अनुकूलित करने के लिए नियंत्रण तंत्र इंजीनियर द्वारा किए गए कार्य की मात्रा को कम कर देता है। हालाँकि, इंजीनियर को अभी भी लागत फलन पैरामीटर निर्दिष्ट करने और निर्दिष्ट प्रारुप लक्ष्यों के साथ परिणामों की तुलना करने की आवश्यकता है। अधिकतर इसका अर्थ यह होता है कि नियंत्रक निर्माण एक पुनरावृत्‍तिमूलक क्रिया होगी जिसमें इंजीनियर सिमुलेशन (अनुकार) के माध्यम से उत्पादित "इष्टतम" नियंत्रकों का मूल्यांकन करता है और फिर प्रारुप लक्ष्यों के साथ अधिक सुसंगत नियंत्रक का उत्पादन करने के लिए मापदंडों को समायोजित करता है।
LQR एल्गोरिदम नियंत्रक को इष्टतम करने के लिए नियंत्रण तंत्र इंजीनियर द्वारा किए गए कार्य की मात्रा को कम कर देता है। हालाँकि, इंजीनियर को अभी भी लागत फलन पैरामीटर निर्दिष्ट करने और निर्दिष्ट प्रारुप लक्ष्यों के साथ परिणामों की तुलना करने की आवश्यकता है। अधिकतर इसका अर्थ यह होता है कि नियंत्रक निर्माण एक पुनरावृत्‍तिमूलक क्रिया होगी जिसमें इंजीनियर सिमुलेशन (अनुकार) के माध्यम से उत्पादित "इष्टतम" नियंत्रकों का मूल्यांकन करता है और फिर प्रारुप लक्ष्यों के साथ अधिक सुसंगत नियंत्रक का उत्पादन करने के लिए मापदंडों को समायोजित करता है।


LQR एल्गोरिथ्म अनिवार्य रूप से एक उपयुक्त [[स्थिति फीडबैक (पुनर्भरण) नियंत्रक]] खोजने का एक स्वचालित तरीका है। इस प्रकार, नियंत्रण इंजीनियरों के लिए वैकल्पिक विधियों को प्राथमिकता देना असामान्य नहीं है, जैसे [[पूर्ण स्थिति फीडबैक]], जिसे पोल प्लेसमेंट भी कहा जाता है | सही भारक गुणकों को खोजने में कठिनाई LQR आधारित नियंत्रक संश्लेषण के अनुप्रयोग को सीमित करती है।
LQR एल्गोरिथ्म अनिवार्य रूप से एक उपयुक्त [[स्थिति फीडबैक (पुनर्भरण) नियंत्रक]] खोजने का एक स्वचालित तरीका है। इस प्रकार, नियंत्रण इंजीनियरों के लिए वैकल्पिक विधियों को प्राथमिकता देना असामान्य नहीं है, जैसे [[पूर्ण स्थिति फीडबैक]], जिसे पोल प्लेसमेंट भी कहा जाता है | सही भारक गुणकों को खोजने में कठिनाई LQR आधारित नियंत्रक संश्लेषण के अनुप्रयोग को सीमित करती है।
== संस्करण ==
== संस्करण ==


===परिमित-क्षितिज, निरंतर-समय===
===परिमित-क्षितिज, सतत समय===


एक सतत-समय रैखिक प्रणाली के लिए, पर परिभाषित <math>t\in[t_0,t_1]</math>, द्वारा वर्णित:
<math>t\in[t_0,t_1]</math> पर परिभाषित एक सतत-समय रेखीय तंत्र के लिए, इसका वर्णन इस प्रकार है:


:<math>\dot{x} = Ax + Bu</math>
:<math>\dot{x} = Ax + Bu</math>
कहाँ <math>x \in \mathbb{R}^{n}</math> (वह है, <math>x</math> एक <math>n</math>-आयामी वास्तविक-मूल्यवान वेक्टर) सिस्टम की स्थिति है और <math>u \in \mathbb{R}^{m}</math> नियंत्रण इनपुट है. सिस्टम के लिए एक द्विघात लागत फलन दिया गया है, जिसे इस प्रकार परिभाषित किया गया है:
जहां <math>x \in \mathbb{R}^{n}</math> (अर्थात्, <math>x</math> एक <math>n</math>-विमीय वास्तविक-मूल्यवान सदिश) पद्धति की स्थिति है और <math>u \in \mathbb{R}^{m}</math> नियंत्रण इनपुट है। पद्धति के लिए एक द्विघात लागत फलन दिया गया है, जिसे इस प्रकार परिभाषित किया गया है:


:<math>J =  x^T(t_1)F(t_1)x(t_1)  + \int\limits_{t_0}^{t_1} \left( x^T Q x + u^T R u + 2 x^T N u \right) dt</math>
:<math>J =  x^T(t_1)F(t_1)x(t_1)  + \int\limits_{t_0}^{t_1} \left( x^T Q x + u^T R u + 2 x^T N u \right) dt</math>
फीडबैक नियंत्रण कानून जो लागत के मूल्य को न्यूनतम करता है वह है:
फीडबैक नियंत्रण नियम जो लागत के मूल्य को न्यूनतम करता है वह है:


:<math>u = -K x \,</math>
:<math>u = -K x \,</math>
कहाँ <math>K</math> द्वारा दिया गया है:
जहां <math>K</math> द्वारा दिया गया है:


:<math>K = R^{-1} (B^T P(t) + N^T) \,</math>
:<math>K = R^{-1} (B^T P(t) + N^T) \,</math>
और <math>P</math> निरंतर समय रिकाटी अंतर समीकरण को हल करके पाया जाता है:
और <math>P</math> सतत समय [[रिकाटी अवकल समीकरण]] को हल करके प्राप्त किया जाता है:


:<math>A^T P(t) + P(t) A - (P(t) B + N) R^{-1} (B^T P(t) + N^T) + Q = - \dot{P}(t) \,</math>
:<math>A^T P(t) + P(t) A - (P(t) B + N) R^{-1} (B^T P(t) + N^T) + Q = - \dot{P}(t) \,</math>
सीमा शर्त के साथ:
परिसीमा प्रतिबंध के साथ:


:<math>P(t_1) = F(t_1).</math>
:<math>P(t_1) = F(t_1).</math>
जे के लिए प्रथम आदेश की शर्तें<sub>min</sub> हैं:
J<sub>min</sub> के लिए प्रथम अनुक्रम की शर्तें हैं:


1) राज्य समीकरण
'''1) अवस्था समीकरण'''
:<math>\dot{x} = Ax + Bu</math>
:<math>\dot{x} = Ax + Bu</math>
2) [[कोस्टेट समीकरण]]|कोस्टेट समीकरण
'''2) [[सह-अवस्था समीकरण]]'''
:<math>-\dot{\lambda} = Qx + Nu + A^T \lambda </math>
:<math>-\dot{\lambda} = Qx + Nu + A^T \lambda </math>
3) स्थिर समीकरण
'''3) अप्रगामी समीकरण'''
:<math> 0 = Ru + N^Tx + B^T \lambda</math>
:<math> 0 = Ru + N^Tx + B^T \lambda</math>
4) सीमा की स्थितियाँ
'''4) परिसीमा शर्तें'''
:<math> x(t_0) = x_0</math>
:<math> x(t_0) = x_0</math>
और
और <math> \lambda(t_1) = F(t_1) x(t_1)</math>
<math> \lambda(t_1) = F(t_1) x(t_1)</math>
 
 
===अनंत-क्षितिज, सतत-समय ===
===अनंत-क्षितिज, सतत-समय ===


द्वारा वर्णित सतत-समय रैखिक प्रणाली के लिए:
द्वारा वर्णित सतत-समय रैखिक तंत्र के लिए:


:<math>\dot{x} = Ax + Bu</math>
:<math>\dot{x} = Ax + Bu</math>
Line 53: Line 50:


:<math>J = \int_{0}^\infty \left( x^T Q x + u^T R u + 2 x^T N u \right) dt</math>
:<math>J = \int_{0}^\infty \left( x^T Q x + u^T R u + 2 x^T N u \right) dt</math>
फीडबैक नियंत्रण कानून जो लागत के मूल्य को न्यूनतम करता है वह है:
फीडबैक नियंत्रण नियम जो लागत के मूल्य को न्यूनतम करता है वह है:


:<math>u = -K x \,</math>
:<math>u = -K x \,</math>
कहाँ <math>K</math> द्वारा दिया गया है:
जहां <math>K</math> द्वारा दिया गया है:


:<math>K = R^{-1} (B^T P + N^T) \,</math>
:<math>K = R^{-1} (B^T P + N^T) \,</math>
और <math>P</math> निरंतर समय [[बीजगणितीय रिकाती समीकरण]] को हल करके पाया जाता है:
और <math>P</math> सतत समय [[बीजगणितीय रिकाती समीकरण]] को हल करके प्राप्त किया जाता है:


:<math>A^T P + P A - (P B + N) R^{-1} (B^T P + N^T) + Q = 0 \,</math>
:<math>A^T P + P A - (P B + N) R^{-1} (B^T P + N^T) + Q = 0 \,</math>
Line 65: Line 62:


:<math>\mathcal A^T P + P \mathcal A - P B R^{-1} B^T P + \mathcal Q = 0 \,</math>
:<math>\mathcal A^T P + P \mathcal A - P B R^{-1} B^T P + \mathcal Q = 0 \,</math>
साथ
के साथ


:<math>\mathcal A = A - B R^{-1} N^T \qquad  \mathcal Q = Q - N R^{-1} N^T \,</math>
:<math>\mathcal A = A - B R^{-1} N^T \qquad  \mathcal Q = Q - N R^{-1} N^T \,</math>
===परिमित-क्षितिज, असतत-समय===
===परिमित-क्षितिज, असतत-समय===


द्वारा वर्णित असतत-समय रैखिक प्रणाली के लिए:
द्वारा वर्णित असतत-समय रैखिक तंत्र के लिए:<ref>{{cite book |last= Chow |first= Gregory C. |title= गतिशील आर्थिक प्रणालियों का विश्लेषण और नियंत्रण|publisher= Krieger Publ. Co. |year= 1986  |isbn= 0-89874-969-7}}</ref>
<ref>{{cite book |last= Chow |first= Gregory C. |title= गतिशील आर्थिक प्रणालियों का विश्लेषण और नियंत्रण|publisher= Krieger Publ. Co. |year= 1986  |isbn= 0-89874-969-7}}</ref>
:<math>x_{k+1} = A x_k + B u_k \,</math>
:<math>x_{k+1} = A x_k + B u_k \,</math>
एक प्रदर्शन सूचकांक के साथ जिसे इस प्रकार परिभाषित किया गया है:
एक निष्पादन सूचकांक के साथ जिसे इस प्रकार परिभाषित किया गया है:


:<math>J = x_{H_p}^T Q_{H_p} x_{H_p} + \sum\limits_{k=0}^{H_p-1} \left( x_k^T Q x_k + u_k^T R u_k + 2 x_k^T N u_k \right)</math>, कहाँ <math> H_p </math> समय क्षितिज है
:<math>J = x_{H_p}^T Q_{H_p} x_{H_p} + \sum\limits_{k=0}^{H_p-1} \left( x_k^T Q x_k + u_k^T R u_k + 2 x_k^T N u_k \right)</math>, जहां <math> H_p </math> समय क्षितिज है


प्रदर्शन सूचकांक को न्यूनतम करने वाला इष्टतम नियंत्रण अनुक्रम इस प्रकार दिया गया है:
निष्पादन सूचकांक को न्यूनतम करने वाला इष्टतम नियंत्रण अनुक्रम इस प्रकार दिया गया है:


:<math>u_k = -F_k x_{k} \,</math>
:<math>u_k = -F_k x_{k} \,</math>
कहाँ:
जहां:


:<math>F_k = (R + B^T P_{k+1} B)^{-1} (B^T P_{k+1} A + N^T) \,</math>
:<math>F_k = (R + B^T P_{k+1} B)^{-1} (B^T P_{k+1} A + N^T) \,</math>
और <math>P_k</math> गतिशील रिकाटी समीकरण द्वारा समय में पुनरावर्ती रूप से पीछे की ओर पाया जाता है:
और <math>P_k</math> को गतिक रिकाटी समीकरण द्वारा समय में पीछे की ओर पुनरावृत्त रूप से प्राप्त किया जाता है:


:<math>P_{k-1} = A^T P_k A - (A^T P_k B + N) \left( R + B^T P_k B \right)^{-1} (B^T P_k A + N^T) + Q </math>
:<math>P_{k-1} = A^T P_k A - (A^T P_k B + N) \left( R + B^T P_k B \right)^{-1} (B^T P_k A + N^T) + Q </math>
टर्मिनल स्थिति से <math>P_{H_p} = Q_{H_p}</math>.<ref>{{cite journal |last= Shaiju, AJ | first=Petersen, Ian R. |title= असतत समय LQR, LQG, LEQG और मिनिमैक्स LQG इष्टतम नियंत्रण समस्याओं के लिए सूत्र|journal= IFAC Proceedings Volumes |year= 2008 | pages = 8773–8778 |publisher = Elsevier|volume = 41 | number = 2| doi=10.3182/20080706-5-KR-1001.01483 }}</ref> ध्यान दें कि <math>u_{H_p}</math> परिभाषित नहीं है, चूँकि <math>x</math> अपनी अंतिम अवस्था में चला जाता है <math>x_{H_p}</math> द्वारा <math>A x_{H_p-1} + B u_{H_p-1}</math>.
अंतक (टर्मिनल) शर्त <math>P_{H_p} = Q_{H_p}</math>से |<ref>{{cite journal |last= Shaiju, AJ | first=Petersen, Ian R. |title= असतत समय LQR, LQG, LEQG और मिनिमैक्स LQG इष्टतम नियंत्रण समस्याओं के लिए सूत्र|journal= IFAC Proceedings Volumes |year= 2008 | pages = 8773–8778 |publisher = Elsevier|volume = 41 | number = 2| doi=10.3182/20080706-5-KR-1001.01483 }}</ref> ध्यान दें कि <math>u_{H_p}</math> परिभाषित नहीं है, क्योंकि <math>x</math> अपनी अंतिम स्थिति <math>x_{H_p}</math> से  <math>A x_{H_p-1} + B u_{H_p-1}</math> तक संचालित होता है।


===अनंत-क्षितिज, असतत-समय===
===अनंत-क्षितिज, असतत-समय===


द्वारा वर्णित असतत-समय रैखिक प्रणाली के लिए:
द्वारा वर्णित असतत-समय रैखिक तंत्र के लिए:


:<math>x_{k+1} = A x_k + B u_k \,</math>
:<math>x_{k+1} = A x_k + B u_k \,</math>
एक प्रदर्शन सूचकांक के साथ जिसे इस प्रकार परिभाषित किया गया है:
एक निष्पादन सूचकांक के साथ जिसे इस प्रकार परिभाषित किया गया है:


:<math>J = \sum\limits_{k=0}^{\infty} \left( x_k^T Q x_k + u_k^T R u_k + 2 x_k^T N u_k \right)</math>
:<math>J = \sum\limits_{k=0}^{\infty} \left( x_k^T Q x_k + u_k^T R u_k + 2 x_k^T N u_k \right)</math>
प्रदर्शन सूचकांक को न्यूनतम करने वाला इष्टतम नियंत्रण अनुक्रम इस प्रकार दिया गया है:
निष्पादन सूचकांक को न्यूनतम करने वाला इष्टतम नियंत्रण अनुक्रम इस प्रकार दिया गया है:


:<math>u_k = -F x_k \,</math>
:<math>u_k = -F x_k \,</math>
कहाँ:
जहां:


:<math>F = (R + B^T P B)^{-1} (B^T P A + N^T) \,</math>
:<math>F = (R + B^T P B)^{-1} (B^T P A + N^T) \,</math>
Line 111: Line 105:


:<math>P = \mathcal A^T P \mathcal A - \mathcal A^T P B \left( R + B^T P B \right)^{-1} B^T P \mathcal A + \mathcal Q </math>
:<math>P = \mathcal A^T P \mathcal A - \mathcal A^T P B \left( R + B^T P B \right)^{-1} B^T P \mathcal A + \mathcal Q </math>
साथ:
के साथ:


:<math> \mathcal A = A - B R^{-1} N^T \qquad \mathcal Q = Q - N R^{-1} N^T </math>.
:<math> \mathcal A = A - B R^{-1} N^T \qquad \mathcal Q = Q - N R^{-1} N^T </math>.


ध्यान दें कि बीजगणितीय रिकाटी समीकरण को हल करने का एक तरीका परिमित-क्षितिज मामले के गतिशील रिकाटी समीकरण को तब तक दोहराना है जब तक कि यह अभिसरण न हो जाए।
ध्यान दें कि बीजगणितीय रिकाटी समीकरण को हल करने का एक तरीका परिमित-क्षितिज स्थिति के गतिक रिकाटी समीकरण को तब तक दोहराना है जब तक कि यह अभिसरण न हो जाए।


==व्यवरोध==
==व्यवरोध==
Line 128: Line 122:
यदि अवस्था समीकरण [[बहुपद]] है तो समस्या को बहुपद-द्विघात नियामक (PQR) के रूप में जाना जाता है। फिर से, इस समस्या को एक बड़े रैखिक रूप में कम करने के लिए अल'ब्रेक्ट एल्गोरिदम को लागू किया जा सकता है जिसे [[बार्टेल्स-स्टीवर्ट एल्गोरिथम]] के सामान्यीकरण के साथ हल किया जा सकता है; यह संभव है बशर्ते कि बहुपद की कोटि बहुत अधिक न हो।<ref name="pqr">{{cite journal |last1=Borggaard |first1=Jeff |last2=Zietsman |first2=Lizette |title=बहुपद-द्विघात नियामक समस्याओं का अनुमान लगाने पर|journal=IFAC-PapersOnLine |pages=329–334 |language=en |doi=10.1016/j.ifacol.2021.06.090 |date=1 January 2021|volume=54 |issue=9 |s2cid=221856517 |doi-access=free }}</ref>
यदि अवस्था समीकरण [[बहुपद]] है तो समस्या को बहुपद-द्विघात नियामक (PQR) के रूप में जाना जाता है। फिर से, इस समस्या को एक बड़े रैखिक रूप में कम करने के लिए अल'ब्रेक्ट एल्गोरिदम को लागू किया जा सकता है जिसे [[बार्टेल्स-स्टीवर्ट एल्गोरिथम]] के सामान्यीकरण के साथ हल किया जा सकता है; यह संभव है बशर्ते कि बहुपद की कोटि बहुत अधिक न हो।<ref name="pqr">{{cite journal |last1=Borggaard |first1=Jeff |last2=Zietsman |first2=Lizette |title=बहुपद-द्विघात नियामक समस्याओं का अनुमान लगाने पर|journal=IFAC-PapersOnLine |pages=329–334 |language=en |doi=10.1016/j.ifacol.2021.06.090 |date=1 January 2021|volume=54 |issue=9 |s2cid=221856517 |doi-access=free }}</ref>
=== प्रारुप-पूर्वानुमानित नियंत्रण ===
=== प्रारुप-पूर्वानुमानित नियंत्रण ===
{{Main articles|प्रारुप पूर्वानुमानित नियंत्रण#MPC vs.LQR}}
{{Main articles|प्रारुप पूर्वानुमानित नियंत्रण#एमपीसी vs.एलक्यूआर}}


प्रारुप पूर्वानुमानित नियंत्रण और रैखिक-द्विघात नियामक दो प्रकार की इष्टतम नियंत्रण विधियाँ हैं जिनमें इष्टमीकरण लागतों को निर्धारित करने के लिए अलग-अलग दृष्टिकोण हैं। विशेष रूप से, जब LQR को पश्चगामी क्षैतिज के साथ बार-बार चलाया जाता है, तो यह [[प्रारुप पूर्वानुमान नियंत्रण]] (एमपीसी) का एक रूप बन जाता है। हालाँकि, सामान्य तौर पर, एमपीसी तंत्र की रैखिकता के संबंध में किसी भी धारणा पर विश्वास नहीं करता है।
प्रारुप पूर्वानुमानित नियंत्रण और रैखिक-द्विघात नियामक दो प्रकार की इष्टतम नियंत्रण विधियाँ हैं जिनमें इष्टमीकरण लागतों को निर्धारित करने के लिए अलग-अलग दृष्टिकोण हैं। विशेष रूप से, जब LQR को पश्चगामी क्षैतिज के साथ बार-बार चलाया जाता है, तो यह [[प्रारुप पूर्वानुमान नियंत्रण]] (एमपीसी) का एक रूप बन जाता है। हालाँकि, सामान्य तौर पर, एमपीसी तंत्र की रैखिकता के संबंध में किसी भी धारणा पर विश्वास नहीं करता है।
Line 157: Line 151:
* [http://reference.wolfram.com/mathematica/ref/LQRegulatorGains.html Mathematica function for Linear Quadratic Regulator design]
* [http://reference.wolfram.com/mathematica/ref/LQRegulatorGains.html Mathematica function for Linear Quadratic Regulator design]


{{DEFAULTSORT:Linear-quadratic regulator}}[[Category: इष्टतम नियंत्रण]]
{{DEFAULTSORT:Linear-quadratic regulator}}
 
 


[[Category: Machine Translated Page]]
[[Category:Articles with hatnote templates targeting a nonexistent page|Linear-quadratic regulator]]
[[Category:Created On 26/07/2023]]
[[Category:CS1 English-language sources (en)]]
[[Category:CS1 errors]]
[[Category:Created On 26/07/2023|Linear-quadratic regulator]]
[[Category:Lua-based templates|Linear-quadratic regulator]]
[[Category:Machine Translated Page|Linear-quadratic regulator]]
[[Category:Pages with script errors|Linear-quadratic regulator]]
[[Category:Short description with empty Wikidata description|Linear-quadratic regulator]]
[[Category:Templates Vigyan Ready|Linear-quadratic regulator]]
[[Category:Templates that add a tracking category|Linear-quadratic regulator]]
[[Category:Templates that generate short descriptions|Linear-quadratic regulator]]
[[Category:Templates using TemplateData|Linear-quadratic regulator]]
[[Category:इष्टतम नियंत्रण|Linear-quadratic regulator]]

Latest revision as of 17:49, 10 August 2023

इष्टतम नियंत्रण का सिद्धांत न्यूनतम लागत पर एक गतिक तंत्र के संचालन से संबंधित है। वह स्थिति जहां तंत्र गतिकी को रैखिक अवकल समीकरणों के एक समुच्चय द्वारा वर्णित किया जाता है और लागत को एक द्विघात फलन द्वारा वर्णित किया जाता है, उसे LQ समस्या कहा जाता है। सिद्धांत में मुख्य परिणामों में से एक यह है कि समाधान रैखिक-द्विघात नियामक (LQR) द्वारा प्रदान किया जाता है, एक फीडबैक (पुनर्भरण) नियंत्रक जिसके समीकरण नीचे दिए गए हैं।

LQR नियंत्रकों में गारंटित लाभ और फेज मार्जिन के साथ अंतर्निहित मजबूती होती है,[1] और वे LQG (रैखिक-द्विघात-गाऊसी) समस्या के समाधान के भी भाग हैं। LQR समस्या की तरह, LQG समस्या भी नियंत्रण सिद्धांत में सबसे मौलिक समस्याओं में से एक है।

सामान्य विवरण

किसी मशीन या प्रक्रिया (जैसे हवाई जहाज या रासायनिक अभिक्रियक) को नियंत्रित करने वाले (विनियमन करने वाले) नियंत्रक की सेटिंग एक गणितीय कलन विधि का उपयोग करके पाई जाती है जो मानव (इंजीनियर) द्वारा आपूर्ति किए गए भारक गुणकों के साथ लागत फलन को कम करती है। लागत फलन को अधितर उनके अपेक्षित मानों से शीर्षलंब या प्रक्रम ताप जैसे प्रमुख मापों के विचलनों के योग के रूप में परिभाषित किया जाता है। इस प्रकार कलन विधि उन नियंत्रक सेटिंग्स को खोजती है जो अवांछित विचलनों को कम करते हैं। नियंत्रण क्रिया का परिमाण भी लागत फलन में सम्मिलित किया जा सकता है।

LQR एल्गोरिदम नियंत्रक को इष्टतम करने के लिए नियंत्रण तंत्र इंजीनियर द्वारा किए गए कार्य की मात्रा को कम कर देता है। हालाँकि, इंजीनियर को अभी भी लागत फलन पैरामीटर निर्दिष्ट करने और निर्दिष्ट प्रारुप लक्ष्यों के साथ परिणामों की तुलना करने की आवश्यकता है। अधिकतर इसका अर्थ यह होता है कि नियंत्रक निर्माण एक पुनरावृत्‍तिमूलक क्रिया होगी जिसमें इंजीनियर सिमुलेशन (अनुकार) के माध्यम से उत्पादित "इष्टतम" नियंत्रकों का मूल्यांकन करता है और फिर प्रारुप लक्ष्यों के साथ अधिक सुसंगत नियंत्रक का उत्पादन करने के लिए मापदंडों को समायोजित करता है।

LQR एल्गोरिथ्म अनिवार्य रूप से एक उपयुक्त स्थिति फीडबैक (पुनर्भरण) नियंत्रक खोजने का एक स्वचालित तरीका है। इस प्रकार, नियंत्रण इंजीनियरों के लिए वैकल्पिक विधियों को प्राथमिकता देना असामान्य नहीं है, जैसे पूर्ण स्थिति फीडबैक, जिसे पोल प्लेसमेंट भी कहा जाता है | सही भारक गुणकों को खोजने में कठिनाई LQR आधारित नियंत्रक संश्लेषण के अनुप्रयोग को सीमित करती है।

संस्करण

परिमित-क्षितिज, सतत समय

पर परिभाषित एक सतत-समय रेखीय तंत्र के लिए, इसका वर्णन इस प्रकार है:

जहां (अर्थात्, एक -विमीय वास्तविक-मूल्यवान सदिश) पद्धति की स्थिति है और नियंत्रण इनपुट है। पद्धति के लिए एक द्विघात लागत फलन दिया गया है, जिसे इस प्रकार परिभाषित किया गया है:

फीडबैक नियंत्रण नियम जो लागत के मूल्य को न्यूनतम करता है वह है:

जहां द्वारा दिया गया है:

और सतत समय रिकाटी अवकल समीकरण को हल करके प्राप्त किया जाता है:

परिसीमा प्रतिबंध के साथ:

Jmin के लिए प्रथम अनुक्रम की शर्तें हैं:

1) अवस्था समीकरण

2) सह-अवस्था समीकरण

3) अप्रगामी समीकरण

4) परिसीमा शर्तें

और

अनंत-क्षितिज, सतत-समय

द्वारा वर्णित सतत-समय रैखिक तंत्र के लिए:

एक लागत फलन के साथ जिसे इस प्रकार परिभाषित किया गया है:

फीडबैक नियंत्रण नियम जो लागत के मूल्य को न्यूनतम करता है वह है:

जहां द्वारा दिया गया है:

और सतत समय बीजगणितीय रिकाती समीकरण को हल करके प्राप्त किया जाता है:

इसे इस प्रकार भी लिखा जा सकता है:

के साथ

परिमित-क्षितिज, असतत-समय

द्वारा वर्णित असतत-समय रैखिक तंत्र के लिए:[2]

एक निष्पादन सूचकांक के साथ जिसे इस प्रकार परिभाषित किया गया है:

, जहां समय क्षितिज है

निष्पादन सूचकांक को न्यूनतम करने वाला इष्टतम नियंत्रण अनुक्रम इस प्रकार दिया गया है:

जहां:

और को गतिक रिकाटी समीकरण द्वारा समय में पीछे की ओर पुनरावृत्त रूप से प्राप्त किया जाता है:

अंतक (टर्मिनल) शर्त से |[3] ध्यान दें कि परिभाषित नहीं है, क्योंकि अपनी अंतिम स्थिति से तक संचालित होता है।

अनंत-क्षितिज, असतत-समय

द्वारा वर्णित असतत-समय रैखिक तंत्र के लिए:

एक निष्पादन सूचकांक के साथ जिसे इस प्रकार परिभाषित किया गया है:

निष्पादन सूचकांक को न्यूनतम करने वाला इष्टतम नियंत्रण अनुक्रम इस प्रकार दिया गया है:

जहां:

और असतत समय बीजगणितीय रिकाटी समीकरण (डीएआरई) का अद्वितीय सकारात्मक निश्चित समाधान है:

.

इसे इस प्रकार भी लिखा जा सकता है:

के साथ:

.

ध्यान दें कि बीजगणितीय रिकाटी समीकरण को हल करने का एक तरीका परिमित-क्षितिज स्थिति के गतिक रिकाटी समीकरण को तब तक दोहराना है जब तक कि यह अभिसरण न हो जाए।

व्यवरोध

अभ्यास में, के सभी मानों की अनुमति नहीं दी जा सकती है | एक सामान्य व्यवरोध रैखिक है:

इसका परिमित क्षितिज संस्करण एक उत्तल इष्टतमीकरण समस्या है, और इसलिए समस्या को अधिकतर पश्चगामी क्षितिज के साथ बार-बार हल किया जाता है। यह प्रारुप पूर्वानुमानित नियंत्रण का एक रूप है।[4][5]

संबंधित नियंत्रक

द्विघात-द्विघात नियामक

यदि अवस्था समीकरण द्विघात है तो समस्या को द्विघात-द्विघात नियामक (QQR) के रूप में जाना जाता है। इस समस्या को कम करने के लिए अल'ब्रेक्ट एल्गोरिदम को लागू किया जा सकता है जिसे प्रदिश आधारित रैखिक सॉल्वर का उपयोग करके कुशलतापूर्वक हल किया जा सकता है।[6]

बहुपद-द्विघात नियामक

यदि अवस्था समीकरण बहुपद है तो समस्या को बहुपद-द्विघात नियामक (PQR) के रूप में जाना जाता है। फिर से, इस समस्या को एक बड़े रैखिक रूप में कम करने के लिए अल'ब्रेक्ट एल्गोरिदम को लागू किया जा सकता है जिसे बार्टेल्स-स्टीवर्ट एल्गोरिथम के सामान्यीकरण के साथ हल किया जा सकता है; यह संभव है बशर्ते कि बहुपद की कोटि बहुत अधिक न हो।[7]

प्रारुप-पूर्वानुमानित नियंत्रण

प्रारुप पूर्वानुमानित नियंत्रण और रैखिक-द्विघात नियामक दो प्रकार की इष्टतम नियंत्रण विधियाँ हैं जिनमें इष्टमीकरण लागतों को निर्धारित करने के लिए अलग-अलग दृष्टिकोण हैं। विशेष रूप से, जब LQR को पश्चगामी क्षैतिज के साथ बार-बार चलाया जाता है, तो यह प्रारुप पूर्वानुमान नियंत्रण (एमपीसी) का एक रूप बन जाता है। हालाँकि, सामान्य तौर पर, एमपीसी तंत्र की रैखिकता के संबंध में किसी भी धारणा पर विश्वास नहीं करता है।

संदर्भ

  1. Lehtomaki, N.; Sandell, N.; Athans, M. (1981). "मजबूती के परिणामस्वरूप रैखिक-द्विघात गॉसियन आधारित बहुपरिवर्तनीय नियंत्रण डिजाइन तैयार होते हैं". IEEE Transactions on Automatic Control (in English). 26 (1): 75–93. doi:10.1109/TAC.1981.1102565. ISSN 0018-9286.
  2. Chow, Gregory C. (1986). गतिशील आर्थिक प्रणालियों का विश्लेषण और नियंत्रण. Krieger Publ. Co. ISBN 0-89874-969-7.
  3. Shaiju, AJ, Petersen, Ian R. (2008). "असतत समय LQR, LQG, LEQG और मिनिमैक्स LQG इष्टतम नियंत्रण समस्याओं के लिए सूत्र". IFAC Proceedings Volumes. Elsevier. 41 (2): 8773–8778. doi:10.3182/20080706-5-KR-1001.01483.{{cite journal}}: CS1 maint: multiple names: authors list (link)
  4. "Ch. 8 - Linear Quadratic Regulators". underactuated.mit.edu. Retrieved 20 August 2022.
  5. https://minds.wisconsin.edu/bitstream/handle/1793/10888/file_1.pdf;jsessionid=52A001EAADF4C22B901290B594BFDA8E?sequence=1. Retrieved 20 August 2022. {{cite web}}: Missing or empty |title= (help)
  6. Borggaard, Jeff; Zietsman, Lizette (July 2020). The Quadratic-Quadratic Regulator Problem: Approximating feedback controls for quadratic-in-state nonlinear systems. pp. 818–823. arXiv:1910.03396. doi:10.23919/ACC45564.2020.9147286. ISBN 978-1-5386-8266-1. S2CID 203904925. Retrieved 20 August 2022. {{cite book}}: |website= ignored (help)
  7. Borggaard, Jeff; Zietsman, Lizette (1 January 2021). "बहुपद-द्विघात नियामक समस्याओं का अनुमान लगाने पर". IFAC-PapersOnLine (in English). 54 (9): 329–334. doi:10.1016/j.ifacol.2021.06.090. S2CID 221856517.
  • Kwakernaak, Huibert & Sivan, Raphael (1972). Linear Optimal Control Systems. First Edition. Wiley-Interscience. ISBN 0-471-51110-2.


बाहरी संबंध