डेटा-संचालित नियंत्रण प्रणाली: Difference between revisions
No edit summary |
m (5 revisions imported from alpha:डेटा-संचालित_नियंत्रण_प्रणाली) |
||
(3 intermediate revisions by 3 users not shown) | |||
Line 1: | Line 1: | ||
{{Short description|Family of control systems}} | {{Short description|Family of control systems}} | ||
डेटा-संचालित नियंत्रण प्रणालियाँ [[नियंत्रण सिद्धांत]] का एक | '''डेटा-संचालित नियंत्रण प्रणालियाँ''' [[नियंत्रण सिद्धांत]] का एक विस्तृत परिवार होता है, जिसमें प्रक्रिया प्रतिरूप की [[सिस्टम पहचान|पहचान]] और/या नियंत्रक की रूप-रेखा पूरी तरह से संयंत्र से एकत्र किए गए प्रायोगिक डेटा पर आधारित होती है।<ref>Bazanella, A.S., Campestrini, L., Eckhard, D. (2012). Data-driven controller design: the <math>H_2</math> approach. Springer, {{ISBN|978-94-007-2300-9}}, 208 pages.</ref> | ||
कई नियंत्रण अनुप्रयोगों में, संयंत्र का गणितीय | |||
कई नियंत्रण अनुप्रयोगों में, संयंत्र का गणितीय प्रतिरूप लिखने का प्रयास करना एक कठिन कार्य माना जाता है, जिसके लिए प्रक्रिया और नियंत्रण इंजीनियरों को प्रयास करनेऔर समय की आवश्यकता होती है। इस समस्या को डेटा-संचालित विधियों से दूर किया जाता है, जो एक प्रणाली प्रतिरूप को एकत्र किए गए प्रयोगात्मक डेटा में स्टथापित करते हैं, इसे एक विशिष्ट प्रतिरूप वर्ग में चयन किया जाता हैं। नियंत्रण इंजीनियर प्रणाली के लिए एक उचित नियंत्रक रूप-रेखा का निर्माण करने के लिए इस प्रतिरूप का उपयोग कर सकता है। यद्यपि, किसी भौतिक प्रणाली के लिए एक सरल परन्तु विश्वसनीय प्रतिरूप ढूंढना अभी भी कठिन कार्य है, जिसमें प्रणाली की मात्र वे गतिशीलताएँ सम्मिलित हों जो नियंत्रण विशिष्टताओं के लिए रुचिकर हों। प्रत्यक्ष डेटा-संचालित विधियाँ प्रणाली के किसी पहचाने गए प्रतिरूप की आवश्यकता के अतिरिक्त, किसी दिए गए वर्ग से संबंधित नियंत्रक को ट्यून करने की अनुमति देती हैं। इस तरह, कोई भी नियंत्रण लागत फलन के अंदर रुचि की प्रक्रिया गतिशीलता को सरलता से महत्व दे सकता है, और उन गतिशीलता को बाहर कर सकता है जो रुचि से बाहर हैं। | |||
== सिंहावलोकन == | == सिंहावलोकन == | ||
प्रणाली प्रतिरूप को नियंत्रित करने का मानक दृष्टिकोण दो चरणों में व्यवस्थित किया गया है: | |||
# | # प्रतिरूप पहचान का उद्देश्य प्रणाली <math>\widehat{G} = G\left(q; \widehat{\theta}_N\right)</math> के नाममात्र प्रतिरूप का प्राक्कलन लगाना है, जहाँ <math>q</math> इकाई-विलंब प्रचालक होता है (असतत-समय स्थानांतरण कार्यों के प्रतिनिधित्व के लिए) और <math>\widehat{\theta}_N</math> <math>N</math> डेटा के एक समुच्चय पर पहचाना गया <math>G</math> मापदंडों का सदिश होता है। फिर, सत्यापन में अनिश्चितता समुच्चय <math>\Gamma</math> का निर्माण सम्मिलित है जिसमें एक निश्चित संभाव्यता स्तर पर सत्य व्यवस्था <math>G_0</math> समाहित होती है। | ||
# नियंत्रक | # नियंत्रक प्रतिरूप का लक्ष्य एक नियंत्रक <math>C</math> को संवृत-लूप स्थिरता प्राप्त करना और <math>\widehat{G}</math> के साथ आवश्यक प्रदर्शन को पूरा करना होता है। | ||
[[सिस्टम पहचान]] के विशिष्ट उद्देश्य | [[सिस्टम पहचान|प्रणाली पहचान]] के विशिष्ट उद्देश्य <math>\widehat{G}</math> को यथासंभव <math>G_0</math> के समीप स्थित करना होता है, और <math>\Gamma</math> को यथासंभव छोटा करना होता है। यद्यपि, नियंत्रण परिप्रेक्ष्य के लिए प्रणाली की पहचान से, जो वास्तव में महत्वपूर्ण होता है वह नियंत्रक द्वारा प्राप्त प्रदर्शन होता है, न कि प्रतिरूप की आंतरिक गुणवत्ता द्वारा होता है। | ||
अनिश्चितता से निपटने | अनिश्चितता से निपटने की एक विधि एक ऐसे नियंत्रक को प्रतिरूप करना है जिसका <math>G_0</math> सहित <math>\Gamma</math> के सभी प्रतिरूपों साथ स्वीकार्य प्रदर्शन होता है। [[मजबूत नियंत्रण|सशक्त नियंत्रण]] प्रतिरूप प्रक्रिया के पीछे यह मुख्य विचार है, जिसका उद्देश्य प्रक्रिया की आवृत्ति कार्यक्षेत्र में अनिश्चितता विवरण का निर्माण करना होता है। यद्यपि, ध्वनि को औसत करने के विचार के अतिरिक्त सबसे अनुपयुक्त स्थिति की धारणाओं पर आधारित होने के कारण, यह दृष्टिकोण सामान्यतः पर रूढ़िवादी अनिश्चितता समुच्चय की ओर ले जाता है। जबकि, डेटा-संचालित तकनीकें प्रायोगिक डेटा पर काम करके और अत्यधिक रूढ़िवादिता से बचकर अनिश्चितता से निपटती हैं। | ||
निम्नलिखित में, डेटा-संचालित नियंत्रण प्रणालियों का मुख्य वर्गीकरण प्रस्तुत किया गया है। | निम्नलिखित में, डेटा-संचालित नियंत्रण प्रणालियों का मुख्य वर्गीकरण प्रस्तुत किया गया है। | ||
=== अप्रत्यक्ष और प्रत्यक्ष विधियाँ === | === अप्रत्यक्ष और प्रत्यक्ष विधियाँ === | ||
प्रणाली को नियंत्रित करने के लिए कई विधियाँ उपलब्ध हैं। मौलिक अंतर '''अप्रत्यक्ष और प्रत्यक्ष''' नियंत्रक प्रतिरूप विधियों के मध्य होता है। तकनीकों का पूर्व समूह अभी भी मानक दो-चरणीय दृष्टिकोण को निरंतर रख रहा है, अर्थात् पहले एक प्रतिरूप की पहचान की जाती है, फिर ऐसे प्रतिरूप के आधार पर एक नियंत्रक को ट्यून किया जाता है। ऐसा करने में मुख्य उद्देश्य यह है कि नियंत्रक की गणना प्राक्कलनित प्रतिरूप <math>\widehat{G}</math> से की जाती है (निश्चितता तुल्यता सिद्धांत के अनुसार), परन्तु व्यवहार में <math>\widehat{G} \neq G_0</math>होता है। इस समस्या को दूर करने के लिए, तकनीकों के बाद वाले समूह के पीछे का विचार प्रयोगात्मक डेटा को मध्य में किसी भी प्रतिरूप की पहचान किए बिना सीधे नियंत्रक पर मानचित्र करना होता है। | |||
मौलिक अंतर अप्रत्यक्ष और प्रत्यक्ष नियंत्रक | |||
=== पुनरावृत्तीय और गैर-पुनरावृत्तीय विधियाँ === | === पुनरावृत्तीय और गैर-पुनरावृत्तीय विधियाँ === | ||
एक अन्य महत्वपूर्ण अंतर पुनरावृत्तीय और गैर-पुनरावृत्तीय (या एक-शॉट) | एक अन्य महत्वपूर्ण अंतर '''पुनरावृत्तीय''' और '''गैर-पुनरावृत्तीय''' (या '''एक-शॉट''') विधियों के मध्य है। पहले समूह में, नियंत्रक मापदंडों का प्राक्कलन लगाने के लिए बार-बार पुनरावृत्ति की आवश्यकता होती है, जिसके पर्यन्त पिछले पुनरावृत्ति के परिणामों के आधार पर [[अनुकूलन समस्या]] का प्रदर्शन किया जाता है, और प्रत्येक पुनरावृत्ति पर प्राक्कलन अधिक से अधिक त्रुटिहीन होने की आशा की जाती है। यह दृष्टिकोण ऑनलाइन कार्यान्वयन के लिए भी प्रवण होता है (नीचे देखें)। पश्चात् वाले समूह में, (इष्टतम) नियंत्रक पैरामीट्रिज़ेशन को एकल अनुकूलन समस्या के साथ प्रदान किया जाता है। यह उन प्रणालियों के लिए विशेष रूप से महत्वपूर्ण है जिनमें डेटा संग्रह प्रयोगों की पुनरावृत्ति या पुनरावृत्ति सीमित है या यहां तक कि अनुमति नहीं है (उदाहरण के लिए, आर्थिक पहलुओं के कारण)। ऐसी स्थितियों में, किसी को एक प्रतिरूप तकनीक का चयन करना चाहिए जो एकल डेटा समुच्चय पर नियंत्रक वितरित करने में सक्षम हो। यह दृष्टिकोण अधिकांशतः ऑफ़लाइन प्रयुक्त किया जाता है (नीचे देखें)। | ||
=== ऑन-लाइन और ऑफ-लाइन | === ऑन-लाइन और ऑफ-लाइन विधियाँ === | ||
चूंकि, व्यावहारिक औद्योगिक अनुप्रयोगों पर, | चूंकि, व्यावहारिक औद्योगिक अनुप्रयोगों पर, विवृत-लूप या संवृत-लूप डेटा अधिकांशतः निरंतर उपलब्ध होते हैं, '''ऑन-लाइन''' डेटा-संचालित तकनीकें उन डेटा का उपयोग पहचाने गए प्रतिरूप की गुणवत्ता और/या नियंत्रक के प्रदर्शन में सुधार करने के लिए करती हैं, हर बार नई सूचना पौधे पर एकत्र किया जाता है। इसके अतरिक्त, '''ऑफ़लाइन''' दृष्टिकोण डेटा के समूह पर काम करते हैं, जिन्हें नियमित (जबकि लंबे) समय अंतराल पर मात्र एक बार या कई बार एकत्र किया जा सकता है। | ||
== पुनरावृत्तीय | == पुनरावृत्तीय प्रतिपुष्टि ट्यूनिंग == | ||
पुनरावृत्त | पुनरावृत्त प्रतिपुष्टि ट्यूनिंग (आईएफटी) पद्धति 1994 में प्रारंभ की गई थी,<ref>[[Håkan Hjalmarsson|Hjalmarsson, H.]], Gevers, M., Gunnarsson, S., & Lequin, O. (1998). Iterative feedback tuning: theory and applications. IEEE control systems, 18(4), 26–41.</ref> इस अवलोकन से प्रारंभ करते हुए कि, नियंत्रण के लिए पहचान में, प्रत्येक पुनरावृत्ति (असत्य) निश्चितता तुल्यता सिद्धांत पर आधारित है। | ||
आईएफटी एक निश्चित-ऑर्डर नियंत्रक के मापदंडों के प्रत्यक्ष पुनरावृत्त अनुकूलन के लिए एक प्रतिरूप-मुक्त तकनीक होती है; ऐसे मापदंडों को मानक (संवृत-लूप) प्रणाली संचालन से आने वाली सूचना का उपयोग करके क्रमिक रूप से अद्यतन किया जा सकता है। | |||
मान लीजिए <math>y^d</math> संदर्भ संकेत <math>r</math> के लिए वांछित आउटपुट है; प्राप्त और वांछित प्रतिक्रिया के मध्य त्रुटि <math>\tilde{y}(\rho)=y(\rho)-y^d</math> है। नियंत्रण प्रतिरूप उद्देश्य को उद्देश्य फलन के न्यूनतमकरण के रूप में तैयार किया जा सकता है: | |||
:<math> J(\rho) = \frac{1}{2N}\sum_{t=1}^N E\left[\tilde{y}(t,\rho)^2\right].</math> | :<math> J(\rho) = \frac{1}{2N}\sum_{t=1}^N E\left[\tilde{y}(t,\rho)^2\right].</math> | ||
न्यूनतम करने के उद्देश्य | न्यूनतम करने के उद्देश्य फलन को देखते हुए, अर्ध-न्यूटन विधि प्रयुक्त की जा सकती है, अर्थात् ग्रेडिएंट-आधारित न्यूनतमकरण प्रकार की ग्रेडिएंट अन्वेषण का उपयोग करता है: | ||
:<math> \rho_{i+1} = \rho_i - \gamma_i R_i^{-1} \frac{d\widehat{J}}{d\rho}(\rho_i). </math> | :<math> \rho_{i+1} = \rho_i - \gamma_i R_i^{-1} \frac{d\widehat{J}}{d\rho}(\rho_i). </math> | ||
मूल्य <math>\gamma_i</math> चरण का आकार है, <math>R_i</math> एक उपयुक्त सकारात्मक निश्चित | मूल्य <math>\gamma_i</math> चरण का आकार होता है, <math>R_i</math> एक उपयुक्त सकारात्मक निश्चित आव्युह होता है और <math>\frac{d\widehat{J}}{d\rho}</math> ढाल का एक प्राक्कलन होता है; ग्रेडिएंट का सही मान निम्नलिखित द्वारा दिया जाता है: | ||
: <math> \frac{dJ}{d\rho} (\rho) = \frac{1}{N} \sum_{t=1}^N \left[\tilde{y}(t,\rho)\frac{\delta y}{\delta \rho}(t,\rho)\right]. </math> | : <math> \frac{dJ}{d\rho} (\rho) = \frac{1}{N} \sum_{t=1}^N \left[\tilde{y}(t,\rho)\frac{\delta y}{\delta \rho}(t,\rho)\right]. </math> | ||
<math>\frac{\delta y}{\delta \rho}(t,\rho)</math> का मान निम्नलिखित तीन-चरणीय पद्धति के माध्यम से प्राप्त किया जाता है: | |||
# सामान्य प्रयोग: | # सामान्य प्रयोग: नियंत्रक के रूप में <math>C(\rho)</math> और संदर्भ के रूप में <math>r</math> के साथ संवृत लूप प्रणाली पर एक प्रयोग करें; आउटपुट <math>y(\rho)</math> का N माप एकत्र करें , जिसे <math>y^{(1)} (\rho) </math> के रूप में प्रदर्शित किया गया है। | ||
# ग्रेडिएंट प्रयोग: | # ग्रेडिएंट प्रयोग: नियंत्रक के रूप में <math>C(\rho)</math> और संदर्भ <math>r</math> के रूप में 0 के साथ संवृत लूप प्रणाली पर एक प्रयोग करें; संकेत <math>r-y^{(1)} (\rho)</math> को इस तरह इंजेक्ट करें कि इसे प्रकार इसे <math>C(\rho)</math> द्वारा नियंत्रण चर आउटपुट में संक्षेपित किया जा सके, जो संयंत्र में इनपुट के रूप में जा रहा है। आउटपुट एकत्रित करें, जिसे <math>y^{(2)} (\rho) </math> रूप में प्रदर्शित गया है। | ||
# निम्नलिखित को ग्रेडिएंट सन्निकटन के रूप में लें: <math> \frac{\delta \widehat{y}}{\delta \rho} (\rho) = \frac{\delta C}{\delta \rho} (\rho) y^{(2)} (\rho)</math>. | # निम्नलिखित को ग्रेडिएंट सन्निकटन के रूप में लें: <math> \frac{\delta \widehat{y}}{\delta \rho} (\rho) = \frac{\delta C}{\delta \rho} (\rho) y^{(2)} (\rho)</math>. | ||
एल्गोरिथ्म की अभिसरण गति के लिए एक महत्वपूर्ण कारक | एल्गोरिथ्म की अभिसरण गति के लिए एक महत्वपूर्ण कारक <math>R_i</math> का विकल्प है; जब <math>\tilde{y}</math> छोटा होता है, गॉस-न्यूटन दिशा द्वारा दिया गया सन्निकटन एक अच्छा विकल्प होता है: | ||
: <math> R_i = \frac 1 N \sum_{t=1}^N \frac{\delta \widehat{y}}{\delta \rho} (\rho_i) \frac{\delta \widehat{y}^T}{\delta \rho} (\rho_i).</math> | : <math> R_i = \frac 1 N \sum_{t=1}^N \frac{\delta \widehat{y}}{\delta \rho} (\rho_i) \frac{\delta \widehat{y}^T}{\delta \rho} (\rho_i).</math> | ||
== गैर-अनिवार्य सहसंबंध-आधारित ट्यूनिंग == | == गैर-अनिवार्य सहसंबंध-आधारित ट्यूनिंग == | ||
निरर्थक सहसंबंध-आधारित ट्यूनिंग (एनसीबीटी) एक निश्चित-संरचना नियंत्रक के डेटा-संचालित ट्यूनिंग के लिए एक निरर्थक विधि होती है।<ref>van Heusden, K., Karimi, A. and Bonvin, D. (2011), Data-driven model reference control with asymptotically guaranteed stability. Int. J. Adapt. Control Signal Process., 25: 331–351. {{doi|10.1002/acs.1212}}</ref> यह एकल डेटासमुच्चय के आधार पर नियंत्रक को सीधे संश्लेषित करने के लिए एक-शॉट विधि प्रदान करता है। | |||
मान लीजिए कि <math>G</math> एक अज्ञात एलटीआई स्थिर एसआईएसओ संयंत्र को प्रदर्शित करता है, <math>M</math> एक उपयोगकर्ता-परिभाषित संदर्भ प्रतिरूप और <math>F</math> एक उपयोगकर्ता-परिभाषित वेटिंग फलन को प्रदर्शित करता है। एक एलटीआई निश्चित-आदेश नियंत्रक को <math>K(\rho)=\beta^T \rho</math> इस रूप में प्रदर्शित गया है, जहाँ <math> \rho \in \mathbb R ^n</math>, और <math>\beta</math> एलटीआई आधारित कार्यों का एक सदिश होता है। अंत में, <math>K^*</math> किसी भी संरचना का एक आदर्श एलटीआई नियंत्रक होता है, जो <math>G</math> पर प्रयुक्त होने पर एक संवृत-लूप फलन <math>M</math> की उत्तरदायित्व लेता है। | |||
लक्ष्य निम्नलिखित उद्देश्य | लक्ष्य निम्नलिखित उद्देश्य फलन को कम करना है: | ||
: <math>J(\rho)=\left\| F \bigg( \frac{ K^* G-K(\rho)G }{ (1+K^* G)^2 } \bigg) \right\|_2^2. </math> | : <math>J(\rho)=\left\| F \bigg( \frac{ K^* G-K(\rho)G }{ (1+K^* G)^2 } \bigg) \right\|_2^2. </math> | ||
ऐसा मानते हुए, एक प्रतिरूप संदर्भ समस्या से प्राप्त उद्देश्य फलन का उत्तल सन्निकटन <math>J(\rho)</math> है, यह मानते हुए कि | |||
<math>\frac{1}{ (1+K(\rho)G) } \approx \frac{1}{ (1+K^*G) }</math>. | |||
जब <math>G</math> स्थिर और न्यूनतम-चरण है, प्राक्कलनित प्रतिरूप संदर्भ समस्या चित्र में योजना में <math>\varepsilon(t)</math> के मानक के न्यूनतमकरण के समान होती है। | |||
[[File:Noniterative Correlation-based Tuning Scheme.svg|thumb|483x180px|विचार यह है कि,जब G स्थिर और न्यूनतम चरण होता है, तो प्राक्कलनित प्रतिरूप संदर्भ समस्या मानक के न्यूनतमकरण <math>\varepsilon</math> के समान होती है। ]]इनपुट संकेत <math>r(t)</math> इसे निरंतर रोमांचक इनपुट संकेत माना जाता है और <math>v(t)</math> एक स्थिर डेटा-जनरेशन तंत्र द्वारा उत्पन्न किया जाता है। इस प्रकार एक विवृत-लूप प्रयोग में दो संकेत असंबद्ध हैं; इसलिए, आदर्श त्रुटि <math>\varepsilon(t,\rho^* )</math> <math>r(t)</math> से असंबंधित है। इस प्रकार नियंत्रण उद्देश्य <math>\rho</math> को इस प्रकार अन्वेषण करना है कि <math>r(t)</math> और <math>\varepsilon(t,\rho^* )</math> असंबंधित हो। | |||
: <math> \zeta(t)=[r_W (t+\ell_1 ),r_W (t+\ell_1-1),\ldots,r_W (t),\ldots,r_W (t-\ell_1) ]^T </math> | वाद्य चर का सदिश <math>\zeta(t)</math> इस प्रकार परिभाषित किया जाता है:<math> \zeta(t)=[r_W (t+\ell_1 ),r_W (t+\ell_1-1),\ldots,r_W (t),\ldots,r_W (t-\ell_1) ]^T </math> | ||
सहसंबंध | जहाँ <math>\ell_1</math> अत्यधिक बड़ा है और <math>r_W (t)=Wr(t)</math> होता है, जहाँ <math>W</math> एक उपयुक्त निस्पंदन है। | ||
सहसंबंध फलन इस प्रकार है: | |||
: <math>f_{N,\ell_1} (\rho) = \frac{1}{N} \sum_{t=1}^N \zeta(t) \varepsilon(t,\rho)</math> | : <math>f_{N,\ell_1} (\rho) = \frac{1}{N} \sum_{t=1}^N \zeta(t) \varepsilon(t,\rho)</math> | ||
और अनुकूलन समस्या बन जाती है: | और अनुकूलन समस्या इस प्रकार बन जाती है: | ||
:<math>\widehat{\rho} = \underset{\rho \in D_k}{\operatorname{arg\,min}} J_{N,\ell_1}(\rho) = \underset{\rho \in D_k}{\operatorname{arg\,min}} f_{N,\ell_1}^T f_{N,\ell_1}. | :<math>\widehat{\rho} = \underset{\rho \in D_k}{\operatorname{arg\,min}} J_{N,\ell_1}(\rho) = \underset{\rho \in D_k}{\operatorname{arg\,min}} f_{N,\ell_1}^T f_{N,\ell_1}. | ||
</math> | </math> | ||
से निरूपित करना <math>\phi_r (\omega)</math> | से निरूपित करना <math>\phi_r (\omega)</math> के स्पेक्ट्रम को <math>r(t)</math>के साथ निरूपित करते हुए, यह प्रदर्शित किया जा सकता है कि, कुछ धारणाओं के तहत, यदि <math>W</math> इस प्रकार चयन किया जा सकता है: | ||
:<math>W(e^{-j\omega}) = \frac{F(e^{-j\omega})(1-M(e^{-j\omega}))}{\phi_r (\omega)}</math> | :<math>W(e^{-j\omega}) = \frac{F(e^{-j\omega})(1-M(e^{-j\omega}))}{\phi_r (\omega)}</math> | ||
Line 86: | Line 87: | ||
=== स्थिरता बाधा === | === स्थिरता बाधा === | ||
इसकी कोई | इसकी बात का कोई आश्वासन नहीं देता है कि नियंत्रक <math>K</math> जो न्यूनतम करता है वह <math>J_{N,\ell_1}</math> स्थिर होता है। निम्नलिखित स्थितियों में अस्थिरता हो सकती है: | ||
* अगर <math>G</math> गैर-न्यूनतम चरण <math>K^*</math> दाएँ-आधे | * अगर <math>G</math> गैर-न्यूनतम चरण <math>K^*</math> दाएँ-आधे सम्मिश्र समष्टि में रद्दीकरण हो सकता है। | ||
* अगर <math>K^*</math> (स्थिर होने पर भी) साध्य नहीं है, <math>K(\rho)</math> स्थिर नहीं हो | * अगर <math>K^*</math> (स्थिर होने पर भी) साध्य नहीं है, <math>K(\rho)</math> स्थिर नहीं हो सकता। | ||
* माप के | * माप के ध्वनि के कारण, तथापि <math>K^*=K(\rho)</math> स्थिर कर रहा है, डेटा-प्राक्कलनित <math>\widehat{K}(\rho)</math> ऐसा नहीं हो सकता है। | ||
एक स्थिरीकरण नियंत्रक | एक स्थिरीकरण नियंत्रक <math>K_s</math> पर विचार करें और संवृत लूप ट्रांसफर फलन <math>M_s=\frac{K_s G}{1+K_s G}</math> परिभाषित करना: | ||
परिभाषित करना: | |||
:<math> \Delta(\rho) := M_s - K(\rho) G (1-M_s) </math> | :<math> \Delta(\rho) := M_s - K(\rho) G (1-M_s) </math> | ||
:<math> \delta(\rho) := \left\| \Delta(\rho) \right\|_\infty. </math> | :<math> \delta(\rho) := \left\| \Delta(\rho) \right\|_\infty. </math> | ||
:प्रमेय | :'''प्रमेय''' | ||
:''नियंत्रक <math>K(\rho)</math> पौधे | :''नियंत्रक <math>K(\rho)</math> पौधे <math>G</math> को स्थिर करता है यदि'' | ||
* <math>K(\rho)</math> स्थिर है | #<math> \Delta(\rho) </math> स्थिर होता है | ||
* <math>K(\rho)</math> इसमें एक इंटीग्रेटर | #<math>\exist \delta_N \in (0,1) </math> S.T. <math> \delta (\rho) \leq \delta_N. </math> | ||
स्थिति 1. तब प्रयुक्त होती है जब: | |||
* <math>K(\rho)</math> स्थिर होता है | |||
* <math>K(\rho)</math> इसमें एक इंटीग्रेटर सम्मिलित होता है (इसे रद्द कर दिया गया है)। | |||
स्थिरता बाधा के साथ | स्थिरता बाधा के साथ प्रतिरूप संदर्भ प्रतिरूप बन जाता है: | ||
:<math> \rho_s = \underset{\rho \in D_k}{\operatorname{arg\,min}} J(\rho) </math> | :<math> \rho_s = \underset{\rho \in D_k}{\operatorname{arg\,min}} J(\rho) </math> | ||
:<math> \text{s.t. } \delta(\rho) \leq \delta_N. </math> | :<math> \text{s.t. } \delta(\rho) \leq \delta_N. </math> | ||
<math>\delta(\rho)</math> का '''उत्तल डेटा-संचालित प्राक्कलन''' [[असतत फूरियर रूपांतरण]] के माध्यम से प्राप्त किया जा सकता है। | |||
निम्नलिखित को परिभाषित कीजिये: | |||
: <math> | : <math> | ||
Line 120: | Line 120: | ||
\end{align} | \end{align} | ||
</math> | </math> | ||
स्थिर न्यूनतम चरण संयंत्रों के लिए, निम्नलिखित उत्तल डेटा-संचालित अनुकूलन समस्या दी गई है: | '''स्थिर न्यूनतम चरण''' संयंत्रों के लिए, निम्नलिखित '''उत्तल डेटा-संचालित अनुकूलन समस्या''' दी गई है: | ||
:<math> | :<math> | ||
Line 131: | Line 131: | ||
</math> | </math> | ||
== | == आभासी संदर्भ प्रतिपुष्टि ट्यूनिंग == | ||
आभासी संदर्भ प्रतिपुष्टि ट्यूनिंग (वीआरएफटी) एक निश्चित-संरचना नियंत्रक की डेटा-संचालित ट्यूनिंग के लिए एक गैर-पुनरावृत्तीय विधि है। यह एकल डेटासमुच्चय के आधार पर नियंत्रक को सीधे संश्लेषित करने के लिए एक-शॉट विधि प्रदान करता है। | |||
वीआरएफटी पहली बार प्रस्तावित किया गया था <ref>Campi, Marco C., Andrea Lecchini, and Sergio M. Savaresi. "Virtual reference feedback tuning: a direct method for the design of feedback controllers." Automatica 38.8 (2002): 1337–1346.</ref> और फिर एलपीवी | वीआरएफटी पहली बार प्रस्तावित किया गया था <ref>Campi, Marco C., Andrea Lecchini, and Sergio M. Savaresi. "Virtual reference feedback tuning: a direct method for the design of feedback controllers." Automatica 38.8 (2002): 1337–1346.</ref> और फिर एलपीवी प्रणाली तक विस्तारित किया गया था।<ref>Formentin, S., Piga, D., Tóth, R., & Savaresi, S. M. (2016). Direct learning of LPV controllers from data. Automatica, 65, 98–110.</ref> वीआरएफटी भी इसमें दिए गए विचारों पर आधारित है <ref>Guardabassi, Guido O., and Sergio M. Savaresi. "Approximate feedback linearization of discrete-time non-linear systems using virtual input direct design." Systems & Control Letters 32.2 (1997): 63–74.</ref> जैसा <math>VRD^2</math>। | ||
मुख्य विचार वांछित | मुख्य विचार वांछित संवृत लूप प्रतिरूप <math>M</math> को परिभाषित करना है और आभासी संदर्भ <math>r_v (t)</math> प्राप्त करने के लिए इसकी व्युत्क्रम गतिशीलता का उपयोग, मापे गये आउटपुट संकेत <math>y(t)</math> से करें। | ||
[[File:Virtual Reference Feedback Tuning Scheme.svg|thumb|483x180px|मुख्य विचार वांछित | [[File:Virtual Reference Feedback Tuning Scheme.svg|thumb|483x180px|मुख्य विचार वांछित संवृत लूप प्रतिरूप एम को परिभाषित करना और मापा आउटपुट संकेत वाई से आभासी संदर्भ प्राप्त करने के लिए इसकी व्युत्क्रम गतिशीलता का उपयोग करना है।]]आभासी संकेत <math>r_v (t)=M^{-1} y(t)</math> और <math> e_v (t)=r_v (t) - y(t) </math>है। | ||
निम्नलिखित अनुकूलन समस्या को हल करके | निम्नलिखित अनुकूलन समस्या को हल करके ध्वनि रहित डेटा से इष्टतम नियंत्रक प्राप्त किया जाता है: | ||
: <math>\widehat{\rho}_\infty = \underset{\rho}{\operatorname{arg\,min}} \lim_{N \to \infty} J_{vr} (\rho)</math> | : <math>\widehat{\rho}_\infty = \underset{\rho}{\operatorname{arg\,min}} \lim_{N \to \infty} J_{vr} (\rho)</math> | ||
जहाँ अनुकूलन फलन इस प्रकार दिया गया है: | |||
:<math> J_{vr}^N (\rho) = \frac{1}{N} \sum_{t=1}^N \left(u(t)-K(\rho) e_v(t) \right)^2. </math> | :<math> J_{vr}^N (\rho) = \frac{1}{N} \sum_{t=1}^N \left(u(t)-K(\rho) e_v(t) \right)^2. </math> | ||
Line 157: | Line 157: | ||
[[Category: Machine Translated Page]] | [[Category: Machine Translated Page]] | ||
[[Category:Created On 11/08/2023]] | [[Category:Created On 11/08/2023]] | ||
[[Category:Vigyan Ready]] |
Latest revision as of 07:12, 23 September 2023
डेटा-संचालित नियंत्रण प्रणालियाँ नियंत्रण सिद्धांत का एक विस्तृत परिवार होता है, जिसमें प्रक्रिया प्रतिरूप की पहचान और/या नियंत्रक की रूप-रेखा पूरी तरह से संयंत्र से एकत्र किए गए प्रायोगिक डेटा पर आधारित होती है।[1]
कई नियंत्रण अनुप्रयोगों में, संयंत्र का गणितीय प्रतिरूप लिखने का प्रयास करना एक कठिन कार्य माना जाता है, जिसके लिए प्रक्रिया और नियंत्रण इंजीनियरों को प्रयास करनेऔर समय की आवश्यकता होती है। इस समस्या को डेटा-संचालित विधियों से दूर किया जाता है, जो एक प्रणाली प्रतिरूप को एकत्र किए गए प्रयोगात्मक डेटा में स्टथापित करते हैं, इसे एक विशिष्ट प्रतिरूप वर्ग में चयन किया जाता हैं। नियंत्रण इंजीनियर प्रणाली के लिए एक उचित नियंत्रक रूप-रेखा का निर्माण करने के लिए इस प्रतिरूप का उपयोग कर सकता है। यद्यपि, किसी भौतिक प्रणाली के लिए एक सरल परन्तु विश्वसनीय प्रतिरूप ढूंढना अभी भी कठिन कार्य है, जिसमें प्रणाली की मात्र वे गतिशीलताएँ सम्मिलित हों जो नियंत्रण विशिष्टताओं के लिए रुचिकर हों। प्रत्यक्ष डेटा-संचालित विधियाँ प्रणाली के किसी पहचाने गए प्रतिरूप की आवश्यकता के अतिरिक्त, किसी दिए गए वर्ग से संबंधित नियंत्रक को ट्यून करने की अनुमति देती हैं। इस तरह, कोई भी नियंत्रण लागत फलन के अंदर रुचि की प्रक्रिया गतिशीलता को सरलता से महत्व दे सकता है, और उन गतिशीलता को बाहर कर सकता है जो रुचि से बाहर हैं।
सिंहावलोकन
प्रणाली प्रतिरूप को नियंत्रित करने का मानक दृष्टिकोण दो चरणों में व्यवस्थित किया गया है:
- प्रतिरूप पहचान का उद्देश्य प्रणाली के नाममात्र प्रतिरूप का प्राक्कलन लगाना है, जहाँ इकाई-विलंब प्रचालक होता है (असतत-समय स्थानांतरण कार्यों के प्रतिनिधित्व के लिए) और डेटा के एक समुच्चय पर पहचाना गया मापदंडों का सदिश होता है। फिर, सत्यापन में अनिश्चितता समुच्चय का निर्माण सम्मिलित है जिसमें एक निश्चित संभाव्यता स्तर पर सत्य व्यवस्था समाहित होती है।
- नियंत्रक प्रतिरूप का लक्ष्य एक नियंत्रक को संवृत-लूप स्थिरता प्राप्त करना और के साथ आवश्यक प्रदर्शन को पूरा करना होता है।
प्रणाली पहचान के विशिष्ट उद्देश्य को यथासंभव के समीप स्थित करना होता है, और को यथासंभव छोटा करना होता है। यद्यपि, नियंत्रण परिप्रेक्ष्य के लिए प्रणाली की पहचान से, जो वास्तव में महत्वपूर्ण होता है वह नियंत्रक द्वारा प्राप्त प्रदर्शन होता है, न कि प्रतिरूप की आंतरिक गुणवत्ता द्वारा होता है।
अनिश्चितता से निपटने की एक विधि एक ऐसे नियंत्रक को प्रतिरूप करना है जिसका सहित के सभी प्रतिरूपों साथ स्वीकार्य प्रदर्शन होता है। सशक्त नियंत्रण प्रतिरूप प्रक्रिया के पीछे यह मुख्य विचार है, जिसका उद्देश्य प्रक्रिया की आवृत्ति कार्यक्षेत्र में अनिश्चितता विवरण का निर्माण करना होता है। यद्यपि, ध्वनि को औसत करने के विचार के अतिरिक्त सबसे अनुपयुक्त स्थिति की धारणाओं पर आधारित होने के कारण, यह दृष्टिकोण सामान्यतः पर रूढ़िवादी अनिश्चितता समुच्चय की ओर ले जाता है। जबकि, डेटा-संचालित तकनीकें प्रायोगिक डेटा पर काम करके और अत्यधिक रूढ़िवादिता से बचकर अनिश्चितता से निपटती हैं।
निम्नलिखित में, डेटा-संचालित नियंत्रण प्रणालियों का मुख्य वर्गीकरण प्रस्तुत किया गया है।
अप्रत्यक्ष और प्रत्यक्ष विधियाँ
प्रणाली को नियंत्रित करने के लिए कई विधियाँ उपलब्ध हैं। मौलिक अंतर अप्रत्यक्ष और प्रत्यक्ष नियंत्रक प्रतिरूप विधियों के मध्य होता है। तकनीकों का पूर्व समूह अभी भी मानक दो-चरणीय दृष्टिकोण को निरंतर रख रहा है, अर्थात् पहले एक प्रतिरूप की पहचान की जाती है, फिर ऐसे प्रतिरूप के आधार पर एक नियंत्रक को ट्यून किया जाता है। ऐसा करने में मुख्य उद्देश्य यह है कि नियंत्रक की गणना प्राक्कलनित प्रतिरूप से की जाती है (निश्चितता तुल्यता सिद्धांत के अनुसार), परन्तु व्यवहार में होता है। इस समस्या को दूर करने के लिए, तकनीकों के बाद वाले समूह के पीछे का विचार प्रयोगात्मक डेटा को मध्य में किसी भी प्रतिरूप की पहचान किए बिना सीधे नियंत्रक पर मानचित्र करना होता है।
पुनरावृत्तीय और गैर-पुनरावृत्तीय विधियाँ
एक अन्य महत्वपूर्ण अंतर पुनरावृत्तीय और गैर-पुनरावृत्तीय (या एक-शॉट) विधियों के मध्य है। पहले समूह में, नियंत्रक मापदंडों का प्राक्कलन लगाने के लिए बार-बार पुनरावृत्ति की आवश्यकता होती है, जिसके पर्यन्त पिछले पुनरावृत्ति के परिणामों के आधार पर अनुकूलन समस्या का प्रदर्शन किया जाता है, और प्रत्येक पुनरावृत्ति पर प्राक्कलन अधिक से अधिक त्रुटिहीन होने की आशा की जाती है। यह दृष्टिकोण ऑनलाइन कार्यान्वयन के लिए भी प्रवण होता है (नीचे देखें)। पश्चात् वाले समूह में, (इष्टतम) नियंत्रक पैरामीट्रिज़ेशन को एकल अनुकूलन समस्या के साथ प्रदान किया जाता है। यह उन प्रणालियों के लिए विशेष रूप से महत्वपूर्ण है जिनमें डेटा संग्रह प्रयोगों की पुनरावृत्ति या पुनरावृत्ति सीमित है या यहां तक कि अनुमति नहीं है (उदाहरण के लिए, आर्थिक पहलुओं के कारण)। ऐसी स्थितियों में, किसी को एक प्रतिरूप तकनीक का चयन करना चाहिए जो एकल डेटा समुच्चय पर नियंत्रक वितरित करने में सक्षम हो। यह दृष्टिकोण अधिकांशतः ऑफ़लाइन प्रयुक्त किया जाता है (नीचे देखें)।
ऑन-लाइन और ऑफ-लाइन विधियाँ
चूंकि, व्यावहारिक औद्योगिक अनुप्रयोगों पर, विवृत-लूप या संवृत-लूप डेटा अधिकांशतः निरंतर उपलब्ध होते हैं, ऑन-लाइन डेटा-संचालित तकनीकें उन डेटा का उपयोग पहचाने गए प्रतिरूप की गुणवत्ता और/या नियंत्रक के प्रदर्शन में सुधार करने के लिए करती हैं, हर बार नई सूचना पौधे पर एकत्र किया जाता है। इसके अतरिक्त, ऑफ़लाइन दृष्टिकोण डेटा के समूह पर काम करते हैं, जिन्हें नियमित (जबकि लंबे) समय अंतराल पर मात्र एक बार या कई बार एकत्र किया जा सकता है।
पुनरावृत्तीय प्रतिपुष्टि ट्यूनिंग
पुनरावृत्त प्रतिपुष्टि ट्यूनिंग (आईएफटी) पद्धति 1994 में प्रारंभ की गई थी,[2] इस अवलोकन से प्रारंभ करते हुए कि, नियंत्रण के लिए पहचान में, प्रत्येक पुनरावृत्ति (असत्य) निश्चितता तुल्यता सिद्धांत पर आधारित है।
आईएफटी एक निश्चित-ऑर्डर नियंत्रक के मापदंडों के प्रत्यक्ष पुनरावृत्त अनुकूलन के लिए एक प्रतिरूप-मुक्त तकनीक होती है; ऐसे मापदंडों को मानक (संवृत-लूप) प्रणाली संचालन से आने वाली सूचना का उपयोग करके क्रमिक रूप से अद्यतन किया जा सकता है।
मान लीजिए संदर्भ संकेत के लिए वांछित आउटपुट है; प्राप्त और वांछित प्रतिक्रिया के मध्य त्रुटि है। नियंत्रण प्रतिरूप उद्देश्य को उद्देश्य फलन के न्यूनतमकरण के रूप में तैयार किया जा सकता है:
न्यूनतम करने के उद्देश्य फलन को देखते हुए, अर्ध-न्यूटन विधि प्रयुक्त की जा सकती है, अर्थात् ग्रेडिएंट-आधारित न्यूनतमकरण प्रकार की ग्रेडिएंट अन्वेषण का उपयोग करता है:
मूल्य चरण का आकार होता है, एक उपयुक्त सकारात्मक निश्चित आव्युह होता है और ढाल का एक प्राक्कलन होता है; ग्रेडिएंट का सही मान निम्नलिखित द्वारा दिया जाता है:
का मान निम्नलिखित तीन-चरणीय पद्धति के माध्यम से प्राप्त किया जाता है:
- सामान्य प्रयोग: नियंत्रक के रूप में और संदर्भ के रूप में के साथ संवृत लूप प्रणाली पर एक प्रयोग करें; आउटपुट का N माप एकत्र करें , जिसे के रूप में प्रदर्शित किया गया है।
- ग्रेडिएंट प्रयोग: नियंत्रक के रूप में और संदर्भ के रूप में 0 के साथ संवृत लूप प्रणाली पर एक प्रयोग करें; संकेत को इस तरह इंजेक्ट करें कि इसे प्रकार इसे द्वारा नियंत्रण चर आउटपुट में संक्षेपित किया जा सके, जो संयंत्र में इनपुट के रूप में जा रहा है। आउटपुट एकत्रित करें, जिसे रूप में प्रदर्शित गया है।
- निम्नलिखित को ग्रेडिएंट सन्निकटन के रूप में लें: .
एल्गोरिथ्म की अभिसरण गति के लिए एक महत्वपूर्ण कारक का विकल्प है; जब छोटा होता है, गॉस-न्यूटन दिशा द्वारा दिया गया सन्निकटन एक अच्छा विकल्प होता है:
गैर-अनिवार्य सहसंबंध-आधारित ट्यूनिंग
निरर्थक सहसंबंध-आधारित ट्यूनिंग (एनसीबीटी) एक निश्चित-संरचना नियंत्रक के डेटा-संचालित ट्यूनिंग के लिए एक निरर्थक विधि होती है।[3] यह एकल डेटासमुच्चय के आधार पर नियंत्रक को सीधे संश्लेषित करने के लिए एक-शॉट विधि प्रदान करता है।
मान लीजिए कि एक अज्ञात एलटीआई स्थिर एसआईएसओ संयंत्र को प्रदर्शित करता है, एक उपयोगकर्ता-परिभाषित संदर्भ प्रतिरूप और एक उपयोगकर्ता-परिभाषित वेटिंग फलन को प्रदर्शित करता है। एक एलटीआई निश्चित-आदेश नियंत्रक को इस रूप में प्रदर्शित गया है, जहाँ , और एलटीआई आधारित कार्यों का एक सदिश होता है। अंत में, किसी भी संरचना का एक आदर्श एलटीआई नियंत्रक होता है, जो पर प्रयुक्त होने पर एक संवृत-लूप फलन की उत्तरदायित्व लेता है।
लक्ष्य निम्नलिखित उद्देश्य फलन को कम करना है:
ऐसा मानते हुए, एक प्रतिरूप संदर्भ समस्या से प्राप्त उद्देश्य फलन का उत्तल सन्निकटन है, यह मानते हुए कि
.
जब स्थिर और न्यूनतम-चरण है, प्राक्कलनित प्रतिरूप संदर्भ समस्या चित्र में योजना में के मानक के न्यूनतमकरण के समान होती है।
इनपुट संकेत इसे निरंतर रोमांचक इनपुट संकेत माना जाता है और एक स्थिर डेटा-जनरेशन तंत्र द्वारा उत्पन्न किया जाता है। इस प्रकार एक विवृत-लूप प्रयोग में दो संकेत असंबद्ध हैं; इसलिए, आदर्श त्रुटि से असंबंधित है। इस प्रकार नियंत्रण उद्देश्य को इस प्रकार अन्वेषण करना है कि और असंबंधित हो।
वाद्य चर का सदिश इस प्रकार परिभाषित किया जाता है:
जहाँ अत्यधिक बड़ा है और होता है, जहाँ एक उपयुक्त निस्पंदन है।
सहसंबंध फलन इस प्रकार है:
और अनुकूलन समस्या इस प्रकार बन जाती है:
से निरूपित करना के स्पेक्ट्रम को के साथ निरूपित करते हुए, यह प्रदर्शित किया जा सकता है कि, कुछ धारणाओं के तहत, यदि इस प्रकार चयन किया जा सकता है:
फिर, निम्नलिखित धारण करता है:
स्थिरता बाधा
इसकी बात का कोई आश्वासन नहीं देता है कि नियंत्रक जो न्यूनतम करता है वह स्थिर होता है। निम्नलिखित स्थितियों में अस्थिरता हो सकती है:
- अगर गैर-न्यूनतम चरण दाएँ-आधे सम्मिश्र समष्टि में रद्दीकरण हो सकता है।
- अगर (स्थिर होने पर भी) साध्य नहीं है, स्थिर नहीं हो सकता।
- माप के ध्वनि के कारण, तथापि स्थिर कर रहा है, डेटा-प्राक्कलनित ऐसा नहीं हो सकता है।
एक स्थिरीकरण नियंत्रक पर विचार करें और संवृत लूप ट्रांसफर फलन परिभाषित करना:
- प्रमेय
- नियंत्रक पौधे को स्थिर करता है यदि
- स्थिर होता है
- S.T.
स्थिति 1. तब प्रयुक्त होती है जब:
- स्थिर होता है
- इसमें एक इंटीग्रेटर सम्मिलित होता है (इसे रद्द कर दिया गया है)।
स्थिरता बाधा के साथ प्रतिरूप संदर्भ प्रतिरूप बन जाता है:
का उत्तल डेटा-संचालित प्राक्कलन असतत फूरियर रूपांतरण के माध्यम से प्राप्त किया जा सकता है।
निम्नलिखित को परिभाषित कीजिये:
स्थिर न्यूनतम चरण संयंत्रों के लिए, निम्नलिखित उत्तल डेटा-संचालित अनुकूलन समस्या दी गई है:
आभासी संदर्भ प्रतिपुष्टि ट्यूनिंग
आभासी संदर्भ प्रतिपुष्टि ट्यूनिंग (वीआरएफटी) एक निश्चित-संरचना नियंत्रक की डेटा-संचालित ट्यूनिंग के लिए एक गैर-पुनरावृत्तीय विधि है। यह एकल डेटासमुच्चय के आधार पर नियंत्रक को सीधे संश्लेषित करने के लिए एक-शॉट विधि प्रदान करता है।
वीआरएफटी पहली बार प्रस्तावित किया गया था [4] और फिर एलपीवी प्रणाली तक विस्तारित किया गया था।[5] वीआरएफटी भी इसमें दिए गए विचारों पर आधारित है [6] जैसा ।
मुख्य विचार वांछित संवृत लूप प्रतिरूप को परिभाषित करना है और आभासी संदर्भ प्राप्त करने के लिए इसकी व्युत्क्रम गतिशीलता का उपयोग, मापे गये आउटपुट संकेत से करें।
आभासी संकेत और है।
निम्नलिखित अनुकूलन समस्या को हल करके ध्वनि रहित डेटा से इष्टतम नियंत्रक प्राप्त किया जाता है:
जहाँ अनुकूलन फलन इस प्रकार दिया गया है:
संदर्भ
- ↑ Bazanella, A.S., Campestrini, L., Eckhard, D. (2012). Data-driven controller design: the approach. Springer, ISBN 978-94-007-2300-9, 208 pages.
- ↑ Hjalmarsson, H., Gevers, M., Gunnarsson, S., & Lequin, O. (1998). Iterative feedback tuning: theory and applications. IEEE control systems, 18(4), 26–41.
- ↑ van Heusden, K., Karimi, A. and Bonvin, D. (2011), Data-driven model reference control with asymptotically guaranteed stability. Int. J. Adapt. Control Signal Process., 25: 331–351. doi:10.1002/acs.1212
- ↑ Campi, Marco C., Andrea Lecchini, and Sergio M. Savaresi. "Virtual reference feedback tuning: a direct method for the design of feedback controllers." Automatica 38.8 (2002): 1337–1346.
- ↑ Formentin, S., Piga, D., Tóth, R., & Savaresi, S. M. (2016). Direct learning of LPV controllers from data. Automatica, 65, 98–110.
- ↑ Guardabassi, Guido O., and Sergio M. Savaresi. "Approximate feedback linearization of discrete-time non-linear systems using virtual input direct design." Systems & Control Letters 32.2 (1997): 63–74.