डेटा-संचालित नियंत्रण प्रणाली: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 1: Line 1:
{{Short description|Family of control systems}}
{{Short description|Family of control systems}}
डेटा-संचालित नियंत्रण प्रणालियाँ [[नियंत्रण सिद्धांत]] का एक व्यापक परिवार है, जिसमें प्रक्रिया मॉडल की [[सिस्टम पहचान]] और/या नियंत्रक का डिज़ाइन पूरी तरह से संयंत्र से एकत्र किए गए ''प्रायोगिक डेटा'' पर आधारित होता है।<ref>Bazanella, A.S., Campestrini, L., Eckhard, D. (2012). Data-driven controller design: the <math>H_2</math> approach. Springer, {{ISBN|978-94-007-2300-9}}, 208 pages.</ref>
'''डेटा-संचालित नियंत्रण प्रणालियाँ''' [[नियंत्रण सिद्धांत]] का एक व्यापक परिवार होता है, जिसमें प्रक्रिया प्रतिरूप की [[सिस्टम पहचान|पहचान]] और/या नियंत्रक की रूप-रेखा पूरी तरह से संयंत्र से एकत्र किए गए प्रायोगिक डेटा पर आधारित होती है।<ref>Bazanella, A.S., Campestrini, L., Eckhard, D. (2012). Data-driven controller design: the <math>H_2</math> approach. Springer, {{ISBN|978-94-007-2300-9}}, 208 pages.</ref>
कई नियंत्रण अनुप्रयोगों में, संयंत्र का गणितीय मॉडल लिखने का प्रयास करना एक कठिन कार्य माना जाता है, जिसके लिए प्रक्रिया और नियंत्रण इंजीनियरों को प्रयास और समय की आवश्यकता होती है। इस समस्या को डेटा-संचालित तरीकों से दूर किया जाता है, जो एक सिस्टम मॉडल को एकत्र किए गए प्रयोगात्मक डेटा में फिट करते हैं, इसे एक विशिष्ट मॉडल वर्ग में चुनते हैं। नियंत्रण इंजीनियर सिस्टम के लिए एक उचित नियंत्रक डिजाइन करने के लिए इस मॉडल का उपयोग कर सकता है। हालाँकि, किसी भौतिक प्रणाली के लिए एक सरल लेकिन विश्वसनीय मॉडल ढूंढना अभी भी मुश्किल है, जिसमें सिस्टम की केवल वे गतिशीलताएँ शामिल हों जो नियंत्रण विशिष्टताओं के लिए रुचिकर हों। प्रत्यक्ष डेटा-संचालित विधियाँ सिस्टम के किसी पहचाने गए मॉडल की आवश्यकता के बिना, किसी दिए गए वर्ग से संबंधित नियंत्रक को ट्यून करने की अनुमति देती हैं। इस तरह, कोई भी नियंत्रण लागत फ़ंक्शन के अंदर रुचि की प्रक्रिया गतिशीलता को आसानी से महत्व दे सकता है, और उन गतिशीलता को बाहर कर सकता है जो रुचि से बाहर हैं।
 
कई नियंत्रण अनुप्रयोगों में, संयंत्र का गणितीय प्रतिरूप लिखने का प्रयास करना एक कठिन कार्य माना जाता है, जिसके लिए प्रक्रिया और नियंत्रण इंजीनियरों को प्रयास करनेऔर समय की आवश्यकता होती है। इस समस्या को डेटा-संचालित विधियों से दूर किया जाता है, जो एक प्रणाली प्रतिरूप को एकत्र किए गए प्रयोगात्मक डेटा में स्टथापित करते हैं, इसे एक विशिष्ट प्रतिरूप वर्ग में चयन किया जाता हैं। नियंत्रण इंजीनियर प्रणाली के लिए एक उचित नियंत्रक रूप-रेखा का निर्माण करने के लिए इस प्रतिरूप का उपयोग कर सकता है। यद्यपि, किसी भौतिक प्रणाली के लिए एक सरल परन्तु विश्वसनीय प्रतिरूप ढूंढना अभी भी कठिन कार्य है, जिसमें प्रणाली की मात्र वे गतिशीलताएँ सम्मिलित हों जो नियंत्रण विशिष्टताओं के लिए रुचिकर हों। प्रत्यक्ष डेटा-संचालित विधियाँ प्रणाली के किसी पहचाने गए प्रतिरूप की आवश्यकता के अतिरिक्त, किसी दिए गए वर्ग से संबंधित नियंत्रक को ट्यून करने की अनुमति देती हैं। इस तरह, कोई भी नियंत्रण लागत फलन के अंदर रुचि की प्रक्रिया गतिशीलता को सरलता से महत्व दे सकता है, और उन गतिशीलता को बाहर कर सकता है जो रुचि से बाहर हैं।


== सिंहावलोकन ==
== सिंहावलोकन ==


सिस्टम डिज़ाइन को नियंत्रित करने का मानक दृष्टिकोण दो चरणों में व्यवस्थित किया गया है:
प्रणाली प्रतिरूप को नियंत्रित करने का मानक दृष्टिकोण दो चरणों में व्यवस्थित किया गया है:
# मॉडल पहचान का उद्देश्य सिस्टम के नाममात्र मॉडल का अनुमान लगाना है <math>\widehat{G} = G\left(q; \widehat{\theta}_N\right)</math>, कहाँ <math>q</math> इकाई-विलंब ऑपरेटर है (असतत-समय स्थानांतरण कार्यों के प्रतिनिधित्व के लिए) और <math>\widehat{\theta}_N</math> के मापदंडों का सदिश है <math>G</math> के एक सेट पर पहचाना गया <math>N</math> डेटा। फिर, सत्यापन में अनिश्चितता सेट का निर्माण शामिल है <math>\Gamma</math> जिसमें सच्ची व्यवस्था समाहित है <math>G_0</math> एक निश्चित संभाव्यता स्तर पर.
# प्रतिरूप पहचान का उद्देश्य प्रणाली <math>\widehat{G} = G\left(q; \widehat{\theta}_N\right)</math> के नाममात्र प्रतिरूप का प्राक्कलन लगाना है, जहाँ <math>q</math> इकाई-विलंब प्रचालक होता है (असतत-समय स्थानांतरण कार्यों के प्रतिनिधित्व के लिए) और <math>\widehat{\theta}_N</math> <math>N</math> डेटा के एक समुच्चय पर पहचाना गया <math>G</math> मापदंडों का सदिश होता है। फिर, सत्यापन में अनिश्चितता समुच्चय <math>\Gamma</math> का निर्माण सम्मिलित है जिसमें एक निश्चित संभाव्यता स्तर पर सत्य व्यवस्था <math>G_0</math> समाहित होती है।
# नियंत्रक डिज़ाइन का लक्ष्य एक नियंत्रक ढूंढना है <math>C</math> बंद-लूप स्थिरता प्राप्त करना और आवश्यक प्रदर्शन को पूरा करना <math>\widehat{G}</math>.
# नियंत्रक प्रतिरूप का लक्ष्य एक नियंत्रक <math>C</math> को संवृत-लूप स्थिरता प्राप्त करना और <math>\widehat{G}</math> के साथ आवश्यक प्रदर्शन को पूरा करना होता है।
[[सिस्टम पहचान]] के विशिष्ट उद्देश्य हैं <math>\widehat{G}</math> जितना संभव हो उतना करीब <math>G_0</math>, और होना <math>\Gamma</math> जितना संभव हो उतना छोटा. हालाँकि, नियंत्रण परिप्रेक्ष्य के लिए सिस्टम पहचान#पहचान से, जो वास्तव में मायने रखता है वह नियंत्रक द्वारा प्राप्त प्रदर्शन है, न कि मॉडल की आंतरिक गुणवत्ता।
[[सिस्टम पहचान|प्रणाली पहचान]] के विशिष्ट उद्देश्य <math>\widehat{G}</math> को यथासंभव <math>G_0</math> के समीप स्थित करना होता है, और <math>\Gamma</math> को यथासंभव छोटा करना होता है। यद्यपि, नियंत्रण परिप्रेक्ष्य के लिए प्रणाली की पहचान से, जो वास्तव में महत्वपूर्ण होता है वह नियंत्रक द्वारा प्राप्त प्रदर्शन होता है, न कि प्रतिरूप की आंतरिक गुणवत्ता द्वारा होता है।


अनिश्चितता से निपटने का एक तरीका एक ऐसे नियंत्रक को डिज़ाइन करना है जिसका प्रदर्शन सभी मॉडलों के साथ स्वीकार्य हो <math>\Gamma</math>, शामिल <math>G_0</math>. [[मजबूत नियंत्रण]] डिज़ाइन प्रक्रिया के पीछे यह मुख्य विचार है, जिसका उद्देश्य प्रक्रिया की आवृत्ति डोमेन अनिश्चितता विवरण तैयार करना है। हालाँकि, शोर को औसत करने के विचार के बजाय सबसे खराब स्थिति की धारणाओं पर आधारित होने के कारण, यह दृष्टिकोण आमतौर पर रूढ़िवादी अनिश्चितता सेट की ओर ले जाता है। बल्कि, डेटा-संचालित तकनीकें प्रायोगिक डेटा पर काम करके और अत्यधिक रूढ़िवादिता से बचकर अनिश्चितता से निपटती हैं।
अनिश्चितता से निपटने की एक विधि एक ऐसे नियंत्रक को प्रतिरूप करना है जिसका <math>G_0</math> सहित <math>\Gamma</math> के सभी प्रतिरूपों साथ स्वीकार्य प्रदर्शन होता है। [[मजबूत नियंत्रण|सशक्त नियंत्रण]] प्रतिरूप प्रक्रिया के पीछे यह मुख्य विचार है, जिसका उद्देश्य प्रक्रिया की आवृत्ति कार्यक्षेत्र में अनिश्चितता विवरण का निर्माण करना होता है। यद्यपि, ध्वनि को औसत करने के विचार के अतिरिक्त सबसे अनुपयुक्त स्थिति की धारणाओं पर आधारित होने के कारण, यह दृष्टिकोण सामान्यतः पर रूढ़िवादी अनिश्चितता समुच्चय की ओर ले जाता है। जबकि, डेटा-संचालित तकनीकें प्रायोगिक डेटा पर काम करके और अत्यधिक रूढ़िवादिता से बचकर अनिश्चितता से निपटती हैं।


निम्नलिखित में, डेटा-संचालित नियंत्रण प्रणालियों का मुख्य वर्गीकरण प्रस्तुत किया गया है।
निम्नलिखित में, डेटा-संचालित नियंत्रण प्रणालियों का मुख्य वर्गीकरण प्रस्तुत किया गया है।


=== अप्रत्यक्ष और प्रत्यक्ष विधियाँ ===
=== अप्रत्यक्ष और प्रत्यक्ष विधियाँ ===
सिस्टम को नियंत्रित करने के लिए कई विधियाँ उपलब्ध हैं।
प्रणाली को नियंत्रित करने के लिए कई विधियाँ उपलब्ध हैं। मौलिक अंतर '''अप्रत्यक्ष और प्रत्यक्ष''' नियंत्रक प्रतिरूप विधियों के मध्य होता है। तकनीकों का पूर्व समूह अभी भी मानक दो-चरणीय दृष्टिकोण को निरंतर रख रहा है, अर्थात् पहले एक प्रतिरूप की पहचान की जाती है, फिर ऐसे प्रतिरूप के आधार पर एक नियंत्रक को ट्यून किया जाता है। ऐसा करने में मुख्य उद्देश्य यह है कि नियंत्रक की गणना प्राक्कलनित प्रतिरूप <math>\widehat{G}</math> से की जाती है (निश्चितता तुल्यता सिद्धांत के अनुसार), परन्तु व्यवहार में <math>\widehat{G} \neq G_0</math>होता है। इस समस्या को दूर करने के लिए, तकनीकों के बाद वाले समूह के पीछे का विचार प्रयोगात्मक डेटा को मध्य में किसी भी प्रतिरूप की पहचान किए बिना सीधे नियंत्रक पर मानचित्र करना होता है।
मौलिक अंतर अप्रत्यक्ष और प्रत्यक्ष नियंत्रक डिज़ाइन विधियों के बीच है। तकनीकों का पूर्व समूह अभी भी मानक दो-चरणीय दृष्टिकोण को बरकरार रख रहा है, ''यानी'' पहले एक मॉडल की पहचान की जाती है, फिर ऐसे मॉडल के आधार पर एक नियंत्रक को ट्यून किया जाता है। ऐसा करने में मुख्य मुद्दा यह है कि नियंत्रक की गणना अनुमानित मॉडल से की जाती है <math>\widehat{G}</math> (स्टोकेस्टिक नियंत्रण#निश्चितता तुल्यता सिद्धांत के अनुसार), लेकिन व्यवहार में <math>\widehat{G} \neq G_0</math>. इस समस्या को दूर करने के लिए, तकनीकों के बाद वाले समूह के पीछे का विचार प्रयोगात्मक डेटा को सीधे नियंत्रक पर मैप करना है, बीच में किसी भी मॉडल की पहचान किए बिना।


=== पुनरावृत्तीय और गैर-पुनरावृत्तीय विधियाँ ===
=== पुनरावृत्तीय और गैर-पुनरावृत्तीय विधियाँ ===


एक अन्य महत्वपूर्ण अंतर पुनरावृत्तीय और गैर-पुनरावृत्तीय (या एक-शॉट) तरीकों के बीच है। पहले समूह में, नियंत्रक मापदंडों का अनुमान लगाने के लिए बार-बार पुनरावृत्ति की आवश्यकता होती है, जिसके दौरान पिछले पुनरावृत्ति के परिणामों के आधार पर [[अनुकूलन समस्या]] का प्रदर्शन किया जाता है, और प्रत्येक पुनरावृत्ति पर अनुमान अधिक से अधिक सटीक होने की उम्मीद की जाती है। यह दृष्टिकोण ऑनलाइन कार्यान्वयन के लिए भी प्रवण है (नीचे देखें)। बाद वाले समूह में, (इष्टतम) नियंत्रक पैरामीट्रिज़ेशन को एकल अनुकूलन समस्या के साथ प्रदान किया जाता है। यह उन प्रणालियों के लिए विशेष रूप से महत्वपूर्ण है जिनमें डेटा संग्रह प्रयोगों की पुनरावृत्ति या पुनरावृत्ति सीमित है या यहां तक ​​कि अनुमति नहीं है (उदाहरण के लिए, आर्थिक पहलुओं के कारण)। ऐसे मामलों में, किसी को एक डिज़ाइन तकनीक का चयन करना चाहिए जो एकल डेटा सेट पर नियंत्रक वितरित करने में सक्षम हो। यह दृष्टिकोण अक्सर ऑफ़लाइन लागू किया जाता है (नीचे देखें)।
एक अन्य महत्वपूर्ण अंतर '''पुनरावृत्तीय''' और '''गैर-पुनरावृत्तीय''' (या '''एक-शॉट''') विधियों के मध्य है। पहले समूह में, नियंत्रक मापदंडों का प्राक्कलन लगाने के लिए बार-बार पुनरावृत्ति की आवश्यकता होती है, जिसके पर्यन्त पिछले पुनरावृत्ति के परिणामों के आधार पर [[अनुकूलन समस्या]] का प्रदर्शन किया जाता है, और प्रत्येक पुनरावृत्ति पर प्राक्कलन अधिक से अधिक त्रुटिहीन होने की आशा की जाती है। यह दृष्टिकोण ऑनलाइन कार्यान्वयन के लिए भी प्रवण होता है (नीचे देखें)। पश्चात् वाले समूह में, (इष्टतम) नियंत्रक पैरामीट्रिज़ेशन को एकल अनुकूलन समस्या के साथ प्रदान किया जाता है। यह उन प्रणालियों के लिए विशेष रूप से महत्वपूर्ण है जिनमें डेटा संग्रह प्रयोगों की पुनरावृत्ति या पुनरावृत्ति सीमित है या यहां तक ​​कि अनुमति नहीं है (उदाहरण के लिए, आर्थिक पहलुओं के कारण)। ऐसी स्थितियों में, किसी को एक प्रतिरूप तकनीक का चयन करना चाहिए जो एकल डेटा समुच्चय पर नियंत्रक वितरित करने में सक्षम हो। यह दृष्टिकोण अधिकांशतः ऑफ़लाइन प्रयुक्त किया जाता है (नीचे देखें)।


=== ऑन-लाइन और ऑफ-लाइन तरीके ===
=== ऑन-लाइन और ऑफ-लाइन विधियाँ ===


चूंकि, व्यावहारिक औद्योगिक अनुप्रयोगों पर, ओपन-लूप या बंद-लूप डेटा अक्सर लगातार उपलब्ध होते हैं, ऑन-लाइन डेटा-संचालित तकनीकें उन डेटा का उपयोग पहचाने गए मॉडल की गुणवत्ता और/या नियंत्रक के प्रदर्शन में सुधार करने के लिए करती हैं, हर बार नई जानकारी पौधे पर एकत्र किया जाता है। इसके बजाय, ऑफ़लाइन दृष्टिकोण डेटा के बैच पर काम करते हैं, जिन्हें नियमित (बल्कि लंबे) समय अंतराल पर केवल एक बार या कई बार एकत्र किया जा सकता है।
चूंकि, व्यावहारिक औद्योगिक अनुप्रयोगों पर, विवृत-लूप या संवृत-लूप डेटा अधिकांशतः निरंतर उपलब्ध होते हैं, '''ऑन-लाइन''' डेटा-संचालित तकनीकें उन डेटा का उपयोग पहचाने गए प्रतिरूप की गुणवत्ता और/या नियंत्रक के प्रदर्शन में सुधार करने के लिए करती हैं, हर बार नई सूचना पौधे पर एकत्र किया जाता है। इसके अतरिक्त, '''ऑफ़लाइन''' दृष्टिकोण डेटा के समूह पर काम करते हैं, जिन्हें नियमित (जबकि लंबे) समय अंतराल पर मात्र एक बार या कई बार एकत्र किया जा सकता है।


== पुनरावृत्तीय फीडबैक ट्यूनिंग ==
== पुनरावृत्तीय प्रतिपुष्टि ट्यूनिंग ==


पुनरावृत्त फीडबैक ट्यूनिंग (आईएफटी) पद्धति 1994 में शुरू की गई थी,<ref>[[Håkan Hjalmarsson|Hjalmarsson, H.]], Gevers, M., Gunnarsson, S., & Lequin, O. (1998). Iterative feedback tuning: theory and applications. IEEE control systems, 18(4), 26–41.</ref> इस अवलोकन से शुरू करते हुए कि, नियंत्रण के लिए पहचान में, प्रत्येक पुनरावृत्ति (गलत) निश्चितता तुल्यता सिद्धांत पर आधारित है।
पुनरावृत्त प्रतिपुष्टि ट्यूनिंग (आईएफटी) पद्धति 1994 में प्रारंभ की गई थी,<ref>[[Håkan Hjalmarsson|Hjalmarsson, H.]], Gevers, M., Gunnarsson, S., & Lequin, O. (1998). Iterative feedback tuning: theory and applications. IEEE control systems, 18(4), 26–41.</ref> इस अवलोकन से प्रारंभ करते हुए कि, नियंत्रण के लिए पहचान में, प्रत्येक पुनरावृत्ति (असत्य) निश्चितता तुल्यता सिद्धांत पर आधारित है।


IFT एक निश्चित-ऑर्डर नियंत्रक के मापदंडों के प्रत्यक्ष पुनरावृत्त अनुकूलन के लिए एक मॉडल-मुक्त तकनीक है; ऐसे मापदंडों को मानक (बंद-लूप) सिस्टम ऑपरेशन से आने वाली जानकारी का उपयोग करके क्रमिक रूप से अद्यतन किया जा सकता है।
आईएफटी एक निश्चित-ऑर्डर नियंत्रक के मापदंडों के प्रत्यक्ष पुनरावृत्त अनुकूलन के लिए एक प्रतिरूप-मुक्त तकनीक होती है; ऐसे मापदंडों को मानक (संवृत-लूप) प्रणाली संचालन से आने वाली सूचना का उपयोग करके क्रमिक रूप से अद्यतन किया जा सकता है।


होने देना <math>y^d</math> संदर्भ सिग्नल के लिए वांछित आउटपुट बनें <math>r</math>; प्राप्त और वांछित प्रतिक्रिया के बीच त्रुटि है <math>\tilde{y}(\rho)=y(\rho)-y^d</math>. नियंत्रण डिज़ाइन उद्देश्य को उद्देश्य फ़ंक्शन के न्यूनतमकरण के रूप में तैयार किया जा सकता है:
मान लीजिए <math>y^d</math> संदर्भ संकेत <math>r</math> के लिए वांछित आउटपुट है; प्राप्त और वांछित प्रतिक्रिया के मध्य त्रुटि <math>\tilde{y}(\rho)=y(\rho)-y^d</math> है। नियंत्रण प्रतिरूप उद्देश्य को उद्देश्य फलन के न्यूनतमकरण के रूप में तैयार किया जा सकता है:


:<math> J(\rho) = \frac{1}{2N}\sum_{t=1}^N E\left[\tilde{y}(t,\rho)^2\right].</math>
:<math> J(\rho) = \frac{1}{2N}\sum_{t=1}^N E\left[\tilde{y}(t,\rho)^2\right].</math>
न्यूनतम करने के उद्देश्य फ़ंक्शन को देखते हुए, अर्ध-न्यूटन विधि लागू की जा सकती है, यानी प्रकार की ग्रेडिएंट खोज का उपयोग करके ग्रेडिएंट-आधारित न्यूनतमकरण:
न्यूनतम करने के उद्देश्य फलन को देखते हुए, अर्ध-न्यूटन विधि प्रयुक्त की जा सकती है, अर्थात् ग्रेडिएंट-आधारित न्यूनतमकरण प्रकार की ग्रेडिएंट अन्वेषण का उपयोग करता है:


:<math> \rho_{i+1} = \rho_i - \gamma_i R_i^{-1}  \frac{d\widehat{J}}{d\rho}(\rho_i). </math>
:<math> \rho_{i+1} = \rho_i - \gamma_i R_i^{-1}  \frac{d\widehat{J}}{d\rho}(\rho_i). </math>
मूल्य <math>\gamma_i</math> चरण का आकार है, <math>R_i</math> एक उपयुक्त सकारात्मक निश्चित मैट्रिक्स है और <math>\frac{d\widehat{J}}{d\rho}</math> ढाल का एक अनुमान है; ग्रेडिएंट का सही मान निम्नलिखित द्वारा दिया गया है:
मूल्य <math>\gamma_i</math> चरण का आकार होता है, <math>R_i</math> एक उपयुक्त सकारात्मक निश्चित आव्युह होता है और <math>\frac{d\widehat{J}}{d\rho}</math> ढाल का एक प्राक्कलन होता है; ग्रेडिएंट का सही मान निम्नलिखित द्वारा दिया जाता है:


: <math> \frac{dJ}{d\rho} (\rho) = \frac{1}{N} \sum_{t=1}^N \left[\tilde{y}(t,\rho)\frac{\delta y}{\delta \rho}(t,\rho)\right]. </math>
: <math> \frac{dJ}{d\rho} (\rho) = \frac{1}{N} \sum_{t=1}^N \left[\tilde{y}(t,\rho)\frac{\delta y}{\delta \rho}(t,\rho)\right]. </math>
का मान है <math>\frac{\delta y}{\delta \rho}(t,\rho)</math> निम्नलिखित तीन-चरणीय पद्धति के माध्यम से प्राप्त किया जाता है:
<math>\frac{\delta y}{\delta \rho}(t,\rho)</math> का मान निम्नलिखित तीन-चरणीय पद्धति के माध्यम से प्राप्त किया जाता है:


# सामान्य प्रयोग: बंद लूप सिस्टम पर एक प्रयोग करें <math>C(\rho)</math> नियंत्रक के रूप में और <math>r</math> संदर्भ के रूप में; आउटपुट का एन माप एकत्र करें <math>y(\rho)</math>, इस रूप में घोषित किया गया <math>y^{(1)} (\rho) </math>.
# सामान्य प्रयोग: नियंत्रक के रूप में <math>C(\rho)</math> और संदर्भ के रूप में <math>r</math> के साथ संवृत लूप प्रणाली पर एक प्रयोग करें; आउटपुट <math>y(\rho)</math> का N माप एकत्र करें , जिसे <math>y^{(1)} (\rho) </math> के रूप में प्रदर्शित किया गया है।
# ग्रेडिएंट प्रयोग: बंद लूप सिस्टम पर एक प्रयोग करें <math>C(\rho)</math> नियंत्रक के रूप में और 0 संदर्भ के रूप में <math>r</math>; सिग्नल इंजेक्ट करें <math>r-y^{(1)} (\rho)</math> इस प्रकार इसे नियंत्रण चर आउटपुट में संक्षेपित किया जाता है <math>C(\rho)</math>, संयंत्र में इनपुट के रूप में जा रहा है। आउटपुट एकत्रित करें, जिसे इस रूप में दर्शाया गया है <math>y^{(2)} (\rho) </math>.
# ग्रेडिएंट प्रयोग: नियंत्रक के रूप में <math>C(\rho)</math> और संदर्भ <math>r</math> के रूप में 0 के साथ संवृत लूप प्रणाली पर एक प्रयोग करें; संकेत <math>r-y^{(1)} (\rho)</math> को इस तरह इंजेक्ट करें कि इसे प्रकार इसे <math>C(\rho)</math> द्वारा नियंत्रण चर आउटपुट में संक्षेपित किया जा सके, जो संयंत्र में इनपुट के रूप में जा रहा है। आउटपुट एकत्रित करें, जिसे <math>y^{(2)} (\rho) </math> रूप में प्रदर्शित गया है।
# निम्नलिखित को ग्रेडिएंट सन्निकटन के रूप में लें: <math> \frac{\delta \widehat{y}}{\delta \rho} (\rho) = \frac{\delta C}{\delta \rho} (\rho) y^{(2)} (\rho)</math>.
# निम्नलिखित को ग्रेडिएंट सन्निकटन के रूप में लें: <math> \frac{\delta \widehat{y}}{\delta \rho} (\rho) = \frac{\delta C}{\delta \rho} (\rho) y^{(2)} (\rho)</math>.


एल्गोरिथ्म की अभिसरण गति के लिए एक महत्वपूर्ण कारक का चुनाव है <math>R_i</math>; कब <math>\tilde{y}</math> छोटा है, गॉस-न्यूटन दिशा द्वारा दिया गया सन्निकटन एक अच्छा विकल्प है:
एल्गोरिथ्म की अभिसरण गति के लिए एक महत्वपूर्ण कारक <math>R_i</math> का विकल्प है; जब <math>\tilde{y}</math> छोटा होता है, गॉस-न्यूटन दिशा द्वारा दिया गया सन्निकटन एक अच्छा विकल्प होता है:


: <math> R_i = \frac 1 N \sum_{t=1}^N \frac{\delta \widehat{y}}{\delta \rho} (\rho_i) \frac{\delta \widehat{y}^T}{\delta \rho} (\rho_i).</math>
: <math> R_i = \frac 1 N \sum_{t=1}^N \frac{\delta \widehat{y}}{\delta \rho} (\rho_i) \frac{\delta \widehat{y}^T}{\delta \rho} (\rho_i).</math>


== गैर-अनिवार्य सहसंबंध-आधारित ट्यूनिंग ==
== गैर-अनिवार्य सहसंबंध-आधारित ट्यूनिंग ==
नॉनटेरेटिव सहसंबंध-आधारित ट्यूनिंग (एनसीबीटी) एक निश्चित-संरचना नियंत्रक के डेटा-संचालित ट्यूनिंग के लिए एक नॉनटेरेटिव विधि है।<ref>van Heusden, K., Karimi, A. and Bonvin, D. (2011), Data-driven model reference control with asymptotically guaranteed stability. Int. J. Adapt. Control Signal Process., 25: 331–351. {{doi|10.1002/acs.1212}}</ref> यह एकल डेटासेट के आधार पर नियंत्रक को सीधे संश्लेषित करने के लिए एक-शॉट विधि प्रदान करता है।
निरर्थक सहसंबंध-आधारित ट्यूनिंग (एनसीबीटी) एक निश्चित-संरचना नियंत्रक के डेटा-संचालित ट्यूनिंग के लिए एक निरर्थक विधि होती है।<ref>van Heusden, K., Karimi, A. and Bonvin, D. (2011), Data-driven model reference control with asymptotically guaranteed stability. Int. J. Adapt. Control Signal Process., 25: 331–351. {{doi|10.1002/acs.1212}}</ref> यह एकल डेटासमुच्चय के आधार पर नियंत्रक को सीधे संश्लेषित करने के लिए एक-शॉट विधि प्रदान करता है।


लगता है कि <math>G</math> एक अज्ञात LTI स्थिर SISO संयंत्र को दर्शाता है, <math>M</math> एक उपयोगकर्ता-परिभाषित संदर्भ मॉडल और <math>F</math> एक उपयोगकर्ता-परिभाषित वेटिंग फ़ंक्शन। एक एलटीआई निश्चित-आदेश नियंत्रक को इस रूप में दर्शाया गया है <math>K(\rho)=\beta^T \rho</math>, कहाँ <math> \rho \in \mathbb R ^n</math>, और <math>\beta</math> एलटीआई आधारित कार्यों का एक वेक्टर है। अंत में, <math>K^*</math> किसी भी संरचना का एक आदर्श एलटीआई नियंत्रक है, जो बंद-लूप फ़ंक्शन की गारंटी देता है <math>M</math> जब लागू किया गया <math>G</math>.
मान लीजिए कि <math>G</math> एक अज्ञात एलटीआई स्थिर एसआईएसओ संयंत्र को प्रदर्शित करता है, <math>M</math> एक उपयोगकर्ता-परिभाषित संदर्भ प्रतिरूप और <math>F</math> एक उपयोगकर्ता-परिभाषित वेटिंग फलन को प्रदर्शित करता है। एक एलटीआई निश्चित-आदेश नियंत्रक को <math>K(\rho)=\beta^T \rho</math> इस रूप में प्रदर्शित गया है, जहाँ <math> \rho \in \mathbb R ^n</math>, और <math>\beta</math> एलटीआई आधारित कार्यों का एक सदिश होता है। अंत में, <math>K^*</math> किसी भी संरचना का एक आदर्श एलटीआई नियंत्रक होता है, जो <math>G</math> पर प्रयुक्त होने पर एक संवृत-लूप फलन <math>M</math> की उत्तरदायित्व लेता है।


लक्ष्य निम्नलिखित उद्देश्य फ़ंक्शन को कम करना है:
लक्ष्य निम्नलिखित उद्देश्य फलन को कम करना है:


: <math>J(\rho)=\left\| F \bigg( \frac{ K^* G-K(\rho)G }{ (1+K^* G)^2 } \bigg) \right\|_2^2. </math>
: <math>J(\rho)=\left\| F \bigg( \frac{ K^* G-K(\rho)G }{ (1+K^* G)^2 } \bigg) \right\|_2^2. </math>


<math>J(\rho)</math> ऐसा मानते हुए, एक मॉडल संदर्भ समस्या से प्राप्त उद्देश्य फ़ंक्शन का उत्तल सन्निकटन है <math>\frac{1}{ (1+K(\rho)G) } \approx \frac{1}{ (1+K^*G) }</math>.
ऐसा मानते हुए, एक प्रतिरूप संदर्भ समस्या से प्राप्त उद्देश्य फलन का उत्तल सन्निकटन <math>J(\rho)</math> है, यह मानते हुए कि


कब <math>G</math> स्थिर और न्यूनतम-चरण है, अनुमानित मॉडल संदर्भ समस्या मानक के न्यूनतमकरण के बराबर है <math>\varepsilon(t)</math> चित्र में योजना में।
<math>\frac{1}{ (1+K(\rho)G) } \approx \frac{1}{ (1+K^*G) }</math>.


[[File:Noniterative Correlation-based Tuning Scheme.svg|thumb|483x180px|विचार यह है कि, जब G स्थिर और न्यूनतम चरण होता है, तो अनुमानित मॉडल संदर्भ समस्या मानक के न्यूनतमकरण के बराबर होती है <math>\varepsilon</math>.]]इनपुट सिग्नल <math>r(t)</math> इसे लगातार रोमांचक इनपुट सिग्नल माना जाता है और <math>v(t)</math> एक स्थिर डेटा-जनरेशन तंत्र द्वारा उत्पन्न किया जाना है। इस प्रकार एक ओपन-लूप प्रयोग में दो सिग्नल असंबद्ध हैं; इसलिए, आदर्श त्रुटि <math>\varepsilon(t,\rho^* )</math> से असंबंधित है <math>r(t)</math>. इस प्रकार नियंत्रण उद्देश्य खोजना शामिल है <math>\rho</math> ऐसा है कि <math>r(t)</math> और <math>\varepsilon(t,\rho^* )</math> असंबंधित हैं.
जब <math>G</math> स्थिर और न्यूनतम-चरण है, प्राक्कलनित प्रतिरूप संदर्भ समस्या चित्र में योजना में <math>\varepsilon(t)</math> के मानक के न्यूनतमकरण के समान होती है।


वाद्य चर का वेक्टर <math>\zeta(t)</math> परिभाषित किया जाता है:
[[File:Noniterative Correlation-based Tuning Scheme.svg|thumb|483x180px|विचार यह है कि,जब G स्थिर और न्यूनतम चरण होता है, तो प्राक्कलनित प्रतिरूप संदर्भ समस्या मानक के न्यूनतमकरण <math>\varepsilon</math> के समान होती है। ]]इनपुट संकेत <math>r(t)</math> इसे निरंतर रोमांचक इनपुट संकेत माना जाता है और <math>v(t)</math> एक स्थिर डेटा-जनरेशन तंत्र द्वारा उत्पन्न किया जाता है। इस प्रकार एक विवृत-लूप प्रयोग में दो संकेत असंबद्ध हैं; इसलिए, आदर्श त्रुटि <math>\varepsilon(t,\rho^* )</math> <math>r(t)</math> से असंबंधित है। इस प्रकार नियंत्रण उद्देश्य <math>\rho</math> को इस प्रकार अन्वेषण करना है कि <math>r(t)</math> और <math>\varepsilon(t,\rho^* )</math> असंबंधित हो।


: <math> \zeta(t)=[r_W (t+\ell_1 ),r_W (t+\ell_1-1),\ldots,r_W (t),\ldots,r_W (t-\ell_1) ]^T </math>
वाद्य चर का सदिश <math>\zeta(t)</math> इस प्रकार परिभाषित किया जाता है:<math> \zeta(t)=[r_W (t+\ell_1 ),r_W (t+\ell_1-1),\ldots,r_W (t),\ldots,r_W (t-\ell_1) ]^T </math>
कहाँ <math>\ell_1</math> काफी बड़ा है और <math>r_W (t)=Wr(t)</math>, कहाँ <math>W</math> एक उपयुक्त फ़िल्टर है.


सहसंबंध कार्य है:
जहाँ <math>\ell_1</math> अत्यधिक बड़ा है और <math>r_W (t)=Wr(t)</math> होता है, जहाँ <math>W</math> एक उपयुक्त निस्पंदन है।
 
सहसंबंध फलन इस प्रकार है:


: <math>f_{N,\ell_1} (\rho) = \frac{1}{N} \sum_{t=1}^N \zeta(t) \varepsilon(t,\rho)</math>
: <math>f_{N,\ell_1} (\rho) = \frac{1}{N} \sum_{t=1}^N \zeta(t) \varepsilon(t,\rho)</math>
और अनुकूलन समस्या बन जाती है:
और अनुकूलन समस्या इस प्रकार बन जाती है:


:<math>\widehat{\rho} = \underset{\rho \in D_k}{\operatorname{arg\,min}} J_{N,\ell_1}(\rho) = \underset{\rho \in D_k}{\operatorname{arg\,min}} f_{N,\ell_1}^T f_{N,\ell_1}.
:<math>\widehat{\rho} = \underset{\rho \in D_k}{\operatorname{arg\,min}} J_{N,\ell_1}(\rho) = \underset{\rho \in D_k}{\operatorname{arg\,min}} f_{N,\ell_1}^T f_{N,\ell_1}.
</math>
</math>
से निरूपित करना <math>\phi_r (\omega)</math> का स्पेक्ट्रम <math>r(t)</math>, यह प्रदर्शित किया जा सकता है कि, कुछ धारणाओं के तहत, यदि <math>W</math> इस प्रकार चुना गया है:
से निरूपित करना <math>\phi_r (\omega)</math> के स्पेक्ट्रम को <math>r(t)</math>के साथ निरूपित करते हुए, यह प्रदर्शित किया जा सकता है कि, कुछ धारणाओं के तहत, यदि <math>W</math> इस प्रकार चयन किया जा सकता है:


:<math>W(e^{-j\omega}) = \frac{F(e^{-j\omega})(1-M(e^{-j\omega}))}{\phi_r (\omega)}</math>
:<math>W(e^{-j\omega}) = \frac{F(e^{-j\omega})(1-M(e^{-j\omega}))}{\phi_r (\omega)}</math>
Line 86: Line 87:


=== स्थिरता बाधा ===
=== स्थिरता बाधा ===
इसकी कोई गारंटी नहीं है कि नियंत्रक <math>K</math> वह न्यूनतम करता है <math>J_{N,\ell_1}</math> स्थिर है. निम्नलिखित मामलों में अस्थिरता हो सकती है:
इसकी बात का कोईआश्वासन नहीं देता है कि नियंत्रक <math>K</math> जो न्यूनतम करता है वह <math>J_{N,\ell_1}</math> स्थिर होता है। निम्नलिखित स्थितियों में अस्थिरता हो सकती है:


* अगर <math>G</math> गैर-न्यूनतम चरण <math>K^*</math> दाएँ-आधे जटिल विमान में रद्दीकरण हो सकता है।
* अगर <math>G</math> गैर-न्यूनतम चरण <math>K^*</math> दाएँ-आधे जटिल विमान में रद्दीकरण हो सकता है।
* अगर <math>K^*</math> (स्थिर होने पर भी) साध्य नहीं है, <math>K(\rho)</math> स्थिर नहीं हो सकता.
* अगर <math>K^*</math> (स्थिर होने पर भी) साध्य नहीं है, <math>K(\rho)</math> स्थिर नहीं हो सकता।
* माप के शोर के कारण, भले ही <math>K^*=K(\rho)</math> स्थिर कर रहा है, डेटा-अनुमानित <math>\widehat{K}(\rho)</math> ऐसा नहीं हो सकता.
* माप के ध्वनि के कारण, तथापि <math>K^*=K(\rho)</math> स्थिर कर रहा है, डेटा-प्राक्कलनित <math>\widehat{K}(\rho)</math> ऐसा नहीं हो सकता है।


एक स्थिरीकरण नियंत्रक पर विचार करें <math>K_s</math> और बंद लूप ट्रांसफर फ़ंक्शन <math>M_s=\frac{K_s G}{1+K_s G}</math>.
एक स्थिरीकरण नियंत्रक <math>K_s</math> पर विचार करें और संवृत लूप ट्रांसफर फलन <math>M_s=\frac{K_s G}{1+K_s G}</math> परिभाषित करना:
परिभाषित करना:


:<math> \Delta(\rho) := M_s - K(\rho) G (1-M_s) </math>
:<math> \Delta(\rho) := M_s - K(\rho) G (1-M_s) </math>
:<math> \delta(\rho) := \left\| \Delta(\rho) \right\|_\infty. </math>
:<math> \delta(\rho) := \left\| \Delta(\rho) \right\|_\infty. </math>
:प्रमेय
:'''प्रमेय'''
:''नियंत्रक <math>K(\rho)</math> पौधे को स्थिर करता है <math>G</math> अगर
:''नियंत्रक <math>K(\rho)</math> पौधे <math>G</math> को स्थिर करता है यदि''
 
#<math> \Delta(\rho) </math> स्थिर है
#<math>\exist \delta_N \in (0,1) </math> अनुसूचित जनजाति। <math> \delta (\rho) \leq \delta_N. </math>शर्त 1. तब लागू होती है जब:


* <math>K(\rho)</math> स्थिर है
#<math> \Delta(\rho) </math> स्थिर होता है
* <math>K(\rho)</math> इसमें एक इंटीग्रेटर शामिल है (इसे रद्द कर दिया गया है)।
#<math>\exist \delta_N \in (0,1) </math> एस.टी. <math> \delta (\rho) \leq \delta_N. </math>
स्थिति 1. तब प्रयुक्त होती है जब:
* <math>K(\rho)</math> स्थिर होता है
* <math>K(\rho)</math> इसमें एक इंटीग्रेटर सम्मिलित होता है (इसे रद्द कर दिया गया है)।  


स्थिरता बाधा के साथ मॉडल संदर्भ डिज़ाइन बन जाता है:
स्थिरता बाधा के साथ प्रतिरूप संदर्भ प्रतिरूप बन जाता है:


:<math> \rho_s = \underset{\rho \in D_k}{\operatorname{arg\,min}} J(\rho) </math>
:<math> \rho_s = \underset{\rho \in D_k}{\operatorname{arg\,min}} J(\rho) </math>
:<math> \text{s.t. } \delta(\rho) \leq \delta_N. </math>
:<math> \text{s.t. } \delta(\rho) \leq \delta_N. </math>
का उत्तल डेटा-संचालित अनुमान <math>\delta(\rho)</math> [[असतत फूरियर रूपांतरण]] के माध्यम से प्राप्त किया जा सकता है।
<math>\delta(\rho)</math> का '''उत्तल डेटा-संचालित प्राक्कलन''' [[असतत फूरियर रूपांतरण]] के माध्यम से प्राप्त किया जा सकता है।


नीचे उल्लेख किए गए परिभाषित करो:
निम्नलिखित को परिभाषित कीजिये:


: <math>
: <math>
Line 120: Line 120:
\end{align}
\end{align}
</math>
</math>
स्थिर न्यूनतम चरण संयंत्रों के लिए, निम्नलिखित उत्तल डेटा-संचालित अनुकूलन समस्या दी गई है:
'''स्थिर न्यूनतम चरण''' संयंत्रों के लिए, निम्नलिखित '''उत्तल डेटा-संचालित अनुकूलन समस्या''' दी गई है:


:<math>
:<math>
Line 131: Line 131:
</math>
</math>


== वर्चुअल संदर्भ फीडबैक ट्यूनिंग ==
== आभासी संदर्भ प्रतिपुष्टि ट्यूनिंग ==
वर्चुअल रेफरेंस फीडबैक ट्यूनिंग (वीआरएफटी) एक निश्चित-संरचना नियंत्रक की डेटा-संचालित ट्यूनिंग के लिए एक गैर-पुनरावृत्तीय विधि है। यह एकल डेटासेट के आधार पर नियंत्रक को सीधे संश्लेषित करने के लिए एक-शॉट विधि प्रदान करता है।
आभासी संदर्भ प्रतिपुष्टि ट्यूनिंग (वीआरएफटी) एक निश्चित-संरचना नियंत्रक की डेटा-संचालित ट्यूनिंग के लिए एक गैर-पुनरावृत्तीय विधि है। यह एकल डेटासमुच्चय के आधार पर नियंत्रक को सीधे संश्लेषित करने के लिए एक-शॉट विधि प्रदान करता है।


वीआरएफटी पहली बार प्रस्तावित किया गया था <ref>Campi, Marco C., Andrea Lecchini, and Sergio M. Savaresi. "Virtual reference feedback tuning: a direct method for the design of feedback controllers." Automatica 38.8 (2002): 1337–1346.</ref> और फिर एलपीवी सिस्टम तक विस्तारित किया गया।<ref>Formentin, S., Piga, D., Tóth, R., & Savaresi, S. M. (2016). Direct learning of LPV controllers from data. Automatica, 65, 98–110.</ref> वीआरएफटी भी इसमें दिए गए विचारों पर आधारित है <ref>Guardabassi, Guido O., and Sergio M. Savaresi. "Approximate feedback linearization of discrete-time non-linear systems using virtual input direct design." Systems & Control Letters 32.2 (1997): 63–74.</ref> जैसा <math>VRD^2</math>.
वीआरएफटी पहली बार प्रस्तावित किया गया था <ref>Campi, Marco C., Andrea Lecchini, and Sergio M. Savaresi. "Virtual reference feedback tuning: a direct method for the design of feedback controllers." Automatica 38.8 (2002): 1337–1346.</ref> और फिर एलपीवी प्रणाली तक विस्तारित किया गया था।<ref>Formentin, S., Piga, D., Tóth, R., & Savaresi, S. M. (2016). Direct learning of LPV controllers from data. Automatica, 65, 98–110.</ref> वीआरएफटी भी इसमें दिए गए विचारों पर आधारित है <ref>Guardabassi, Guido O., and Sergio M. Savaresi. "Approximate feedback linearization of discrete-time non-linear systems using virtual input direct design." Systems & Control Letters 32.2 (1997): 63–74.</ref> जैसा <math>VRD^2</math>


मुख्य विचार वांछित बंद लूप मॉडल को परिभाषित करना है <math>M</math> और आभासी संदर्भ प्राप्त करने के लिए इसकी व्युत्क्रम गतिशीलता का उपयोग करना <math>r_v (t)</math> मापा आउटपुट सिग्नल से <math>y(t)</math>.
मुख्य विचार वांछित संवृत लूप प्रतिरूप <math>M</math> को परिभाषित करना है और आभासी संदर्भ <math>r_v (t)</math> प्राप्त करने के लिए इसकी व्युत्क्रम गतिशीलता का उपयोग, मापे गये आउटपुट संकेत <math>y(t)</math> से करें।


[[File:Virtual Reference Feedback Tuning Scheme.svg|thumb|483x180px|मुख्य विचार वांछित बंद लूप मॉडल एम को परिभाषित करना और मापा आउटपुट सिग्नल वाई से वर्चुअल संदर्भ प्राप्त करने के लिए इसकी व्युत्क्रम गतिशीलता का उपयोग करना है।]]आभासी संकेत हैं <math>r_v (t)=M^{-1} y(t)</math> और <math> e_v (t)=r_v (t) - y(t). </math>
[[File:Virtual Reference Feedback Tuning Scheme.svg|thumb|483x180px|मुख्य विचार वांछित संवृत लूप प्रतिरूप एम को परिभाषित करना और मापा आउटपुट संकेत वाई से आभासी संदर्भ प्राप्त करने के लिए इसकी व्युत्क्रम गतिशीलता का उपयोग करना है।]]आभासी संकेत <math>r_v (t)=M^{-1} y(t)</math> और <math> e_v (t)=r_v (t) - y(t) </math>है।
निम्नलिखित अनुकूलन समस्या को हल करके शोर रहित डेटा से इष्टतम नियंत्रक प्राप्त किया जाता है:
निम्नलिखित अनुकूलन समस्या को हल करके ध्वनि रहित डेटा से इष्टतम नियंत्रक प्राप्त किया जाता है:


: <math>\widehat{\rho}_\infty = \underset{\rho}{\operatorname{arg\,min}} \lim_{N \to \infty} J_{vr} (\rho)</math>
: <math>\widehat{\rho}_\infty = \underset{\rho}{\operatorname{arg\,min}} \lim_{N \to \infty} J_{vr} (\rho)</math>
जहां अनुकूलन फ़ंक्शन इस प्रकार दिया गया है:
जहाँ अनुकूलन फलन इस प्रकार दिया गया है:


:<math> J_{vr}^N (\rho) = \frac{1}{N} \sum_{t=1}^N \left(u(t)-K(\rho) e_v(t) \right)^2. </math>
:<math> J_{vr}^N (\rho) = \frac{1}{N} \sum_{t=1}^N \left(u(t)-K(\rho) e_v(t) \right)^2. </math>

Revision as of 11:09, 20 September 2023

डेटा-संचालित नियंत्रण प्रणालियाँ नियंत्रण सिद्धांत का एक व्यापक परिवार होता है, जिसमें प्रक्रिया प्रतिरूप की पहचान और/या नियंत्रक की रूप-रेखा पूरी तरह से संयंत्र से एकत्र किए गए प्रायोगिक डेटा पर आधारित होती है।[1]

कई नियंत्रण अनुप्रयोगों में, संयंत्र का गणितीय प्रतिरूप लिखने का प्रयास करना एक कठिन कार्य माना जाता है, जिसके लिए प्रक्रिया और नियंत्रण इंजीनियरों को प्रयास करनेऔर समय की आवश्यकता होती है। इस समस्या को डेटा-संचालित विधियों से दूर किया जाता है, जो एक प्रणाली प्रतिरूप को एकत्र किए गए प्रयोगात्मक डेटा में स्टथापित करते हैं, इसे एक विशिष्ट प्रतिरूप वर्ग में चयन किया जाता हैं। नियंत्रण इंजीनियर प्रणाली के लिए एक उचित नियंत्रक रूप-रेखा का निर्माण करने के लिए इस प्रतिरूप का उपयोग कर सकता है। यद्यपि, किसी भौतिक प्रणाली के लिए एक सरल परन्तु विश्वसनीय प्रतिरूप ढूंढना अभी भी कठिन कार्य है, जिसमें प्रणाली की मात्र वे गतिशीलताएँ सम्मिलित हों जो नियंत्रण विशिष्टताओं के लिए रुचिकर हों। प्रत्यक्ष डेटा-संचालित विधियाँ प्रणाली के किसी पहचाने गए प्रतिरूप की आवश्यकता के अतिरिक्त, किसी दिए गए वर्ग से संबंधित नियंत्रक को ट्यून करने की अनुमति देती हैं। इस तरह, कोई भी नियंत्रण लागत फलन के अंदर रुचि की प्रक्रिया गतिशीलता को सरलता से महत्व दे सकता है, और उन गतिशीलता को बाहर कर सकता है जो रुचि से बाहर हैं।

सिंहावलोकन

प्रणाली प्रतिरूप को नियंत्रित करने का मानक दृष्टिकोण दो चरणों में व्यवस्थित किया गया है:

  1. प्रतिरूप पहचान का उद्देश्य प्रणाली के नाममात्र प्रतिरूप का प्राक्कलन लगाना है, जहाँ इकाई-विलंब प्रचालक होता है (असतत-समय स्थानांतरण कार्यों के प्रतिनिधित्व के लिए) और डेटा के एक समुच्चय पर पहचाना गया मापदंडों का सदिश होता है। फिर, सत्यापन में अनिश्चितता समुच्चय का निर्माण सम्मिलित है जिसमें एक निश्चित संभाव्यता स्तर पर सत्य व्यवस्था समाहित होती है।
  2. नियंत्रक प्रतिरूप का लक्ष्य एक नियंत्रक को संवृत-लूप स्थिरता प्राप्त करना और के साथ आवश्यक प्रदर्शन को पूरा करना होता है।

प्रणाली पहचान के विशिष्ट उद्देश्य को यथासंभव के समीप स्थित करना होता है, और को यथासंभव छोटा करना होता है। यद्यपि, नियंत्रण परिप्रेक्ष्य के लिए प्रणाली की पहचान से, जो वास्तव में महत्वपूर्ण होता है वह नियंत्रक द्वारा प्राप्त प्रदर्शन होता है, न कि प्रतिरूप की आंतरिक गुणवत्ता द्वारा होता है।

अनिश्चितता से निपटने की एक विधि एक ऐसे नियंत्रक को प्रतिरूप करना है जिसका सहित के सभी प्रतिरूपों साथ स्वीकार्य प्रदर्शन होता है। सशक्त नियंत्रण प्रतिरूप प्रक्रिया के पीछे यह मुख्य विचार है, जिसका उद्देश्य प्रक्रिया की आवृत्ति कार्यक्षेत्र में अनिश्चितता विवरण का निर्माण करना होता है। यद्यपि, ध्वनि को औसत करने के विचार के अतिरिक्त सबसे अनुपयुक्त स्थिति की धारणाओं पर आधारित होने के कारण, यह दृष्टिकोण सामान्यतः पर रूढ़िवादी अनिश्चितता समुच्चय की ओर ले जाता है। जबकि, डेटा-संचालित तकनीकें प्रायोगिक डेटा पर काम करके और अत्यधिक रूढ़िवादिता से बचकर अनिश्चितता से निपटती हैं।

निम्नलिखित में, डेटा-संचालित नियंत्रण प्रणालियों का मुख्य वर्गीकरण प्रस्तुत किया गया है।

अप्रत्यक्ष और प्रत्यक्ष विधियाँ

प्रणाली को नियंत्रित करने के लिए कई विधियाँ उपलब्ध हैं। मौलिक अंतर अप्रत्यक्ष और प्रत्यक्ष नियंत्रक प्रतिरूप विधियों के मध्य होता है। तकनीकों का पूर्व समूह अभी भी मानक दो-चरणीय दृष्टिकोण को निरंतर रख रहा है, अर्थात् पहले एक प्रतिरूप की पहचान की जाती है, फिर ऐसे प्रतिरूप के आधार पर एक नियंत्रक को ट्यून किया जाता है। ऐसा करने में मुख्य उद्देश्य यह है कि नियंत्रक की गणना प्राक्कलनित प्रतिरूप से की जाती है (निश्चितता तुल्यता सिद्धांत के अनुसार), परन्तु व्यवहार में होता है। इस समस्या को दूर करने के लिए, तकनीकों के बाद वाले समूह के पीछे का विचार प्रयोगात्मक डेटा को मध्य में किसी भी प्रतिरूप की पहचान किए बिना सीधे नियंत्रक पर मानचित्र करना होता है।

पुनरावृत्तीय और गैर-पुनरावृत्तीय विधियाँ

एक अन्य महत्वपूर्ण अंतर पुनरावृत्तीय और गैर-पुनरावृत्तीय (या एक-शॉट) विधियों के मध्य है। पहले समूह में, नियंत्रक मापदंडों का प्राक्कलन लगाने के लिए बार-बार पुनरावृत्ति की आवश्यकता होती है, जिसके पर्यन्त पिछले पुनरावृत्ति के परिणामों के आधार पर अनुकूलन समस्या का प्रदर्शन किया जाता है, और प्रत्येक पुनरावृत्ति पर प्राक्कलन अधिक से अधिक त्रुटिहीन होने की आशा की जाती है। यह दृष्टिकोण ऑनलाइन कार्यान्वयन के लिए भी प्रवण होता है (नीचे देखें)। पश्चात् वाले समूह में, (इष्टतम) नियंत्रक पैरामीट्रिज़ेशन को एकल अनुकूलन समस्या के साथ प्रदान किया जाता है। यह उन प्रणालियों के लिए विशेष रूप से महत्वपूर्ण है जिनमें डेटा संग्रह प्रयोगों की पुनरावृत्ति या पुनरावृत्ति सीमित है या यहां तक ​​कि अनुमति नहीं है (उदाहरण के लिए, आर्थिक पहलुओं के कारण)। ऐसी स्थितियों में, किसी को एक प्रतिरूप तकनीक का चयन करना चाहिए जो एकल डेटा समुच्चय पर नियंत्रक वितरित करने में सक्षम हो। यह दृष्टिकोण अधिकांशतः ऑफ़लाइन प्रयुक्त किया जाता है (नीचे देखें)।

ऑन-लाइन और ऑफ-लाइन विधियाँ

चूंकि, व्यावहारिक औद्योगिक अनुप्रयोगों पर, विवृत-लूप या संवृत-लूप डेटा अधिकांशतः निरंतर उपलब्ध होते हैं, ऑन-लाइन डेटा-संचालित तकनीकें उन डेटा का उपयोग पहचाने गए प्रतिरूप की गुणवत्ता और/या नियंत्रक के प्रदर्शन में सुधार करने के लिए करती हैं, हर बार नई सूचना पौधे पर एकत्र किया जाता है। इसके अतरिक्त, ऑफ़लाइन दृष्टिकोण डेटा के समूह पर काम करते हैं, जिन्हें नियमित (जबकि लंबे) समय अंतराल पर मात्र एक बार या कई बार एकत्र किया जा सकता है।

पुनरावृत्तीय प्रतिपुष्टि ट्यूनिंग

पुनरावृत्त प्रतिपुष्टि ट्यूनिंग (आईएफटी) पद्धति 1994 में प्रारंभ की गई थी,[2] इस अवलोकन से प्रारंभ करते हुए कि, नियंत्रण के लिए पहचान में, प्रत्येक पुनरावृत्ति (असत्य) निश्चितता तुल्यता सिद्धांत पर आधारित है।

आईएफटी एक निश्चित-ऑर्डर नियंत्रक के मापदंडों के प्रत्यक्ष पुनरावृत्त अनुकूलन के लिए एक प्रतिरूप-मुक्त तकनीक होती है; ऐसे मापदंडों को मानक (संवृत-लूप) प्रणाली संचालन से आने वाली सूचना का उपयोग करके क्रमिक रूप से अद्यतन किया जा सकता है।

मान लीजिए संदर्भ संकेत के लिए वांछित आउटपुट है; प्राप्त और वांछित प्रतिक्रिया के मध्य त्रुटि है। नियंत्रण प्रतिरूप उद्देश्य को उद्देश्य फलन के न्यूनतमकरण के रूप में तैयार किया जा सकता है:

न्यूनतम करने के उद्देश्य फलन को देखते हुए, अर्ध-न्यूटन विधि प्रयुक्त की जा सकती है, अर्थात् ग्रेडिएंट-आधारित न्यूनतमकरण प्रकार की ग्रेडिएंट अन्वेषण का उपयोग करता है:

मूल्य चरण का आकार होता है, एक उपयुक्त सकारात्मक निश्चित आव्युह होता है और ढाल का एक प्राक्कलन होता है; ग्रेडिएंट का सही मान निम्नलिखित द्वारा दिया जाता है:

का मान निम्नलिखित तीन-चरणीय पद्धति के माध्यम से प्राप्त किया जाता है:

  1. सामान्य प्रयोग: नियंत्रक के रूप में और संदर्भ के रूप में के साथ संवृत लूप प्रणाली पर एक प्रयोग करें; आउटपुट का N माप एकत्र करें , जिसे के रूप में प्रदर्शित किया गया है।
  2. ग्रेडिएंट प्रयोग: नियंत्रक के रूप में और संदर्भ के रूप में 0 के साथ संवृत लूप प्रणाली पर एक प्रयोग करें; संकेत को इस तरह इंजेक्ट करें कि इसे प्रकार इसे द्वारा नियंत्रण चर आउटपुट में संक्षेपित किया जा सके, जो संयंत्र में इनपुट के रूप में जा रहा है। आउटपुट एकत्रित करें, जिसे रूप में प्रदर्शित गया है।
  3. निम्नलिखित को ग्रेडिएंट सन्निकटन के रूप में लें: .

एल्गोरिथ्म की अभिसरण गति के लिए एक महत्वपूर्ण कारक का विकल्प है; जब छोटा होता है, गॉस-न्यूटन दिशा द्वारा दिया गया सन्निकटन एक अच्छा विकल्प होता है:

गैर-अनिवार्य सहसंबंध-आधारित ट्यूनिंग

निरर्थक सहसंबंध-आधारित ट्यूनिंग (एनसीबीटी) एक निश्चित-संरचना नियंत्रक के डेटा-संचालित ट्यूनिंग के लिए एक निरर्थक विधि होती है।[3] यह एकल डेटासमुच्चय के आधार पर नियंत्रक को सीधे संश्लेषित करने के लिए एक-शॉट विधि प्रदान करता है।

मान लीजिए कि एक अज्ञात एलटीआई स्थिर एसआईएसओ संयंत्र को प्रदर्शित करता है, एक उपयोगकर्ता-परिभाषित संदर्भ प्रतिरूप और एक उपयोगकर्ता-परिभाषित वेटिंग फलन को प्रदर्शित करता है। एक एलटीआई निश्चित-आदेश नियंत्रक को इस रूप में प्रदर्शित गया है, जहाँ , और एलटीआई आधारित कार्यों का एक सदिश होता है। अंत में, किसी भी संरचना का एक आदर्श एलटीआई नियंत्रक होता है, जो पर प्रयुक्त होने पर एक संवृत-लूप फलन की उत्तरदायित्व लेता है।

लक्ष्य निम्नलिखित उद्देश्य फलन को कम करना है:

ऐसा मानते हुए, एक प्रतिरूप संदर्भ समस्या से प्राप्त उद्देश्य फलन का उत्तल सन्निकटन है, यह मानते हुए कि

.

जब स्थिर और न्यूनतम-चरण है, प्राक्कलनित प्रतिरूप संदर्भ समस्या चित्र में योजना में के मानक के न्यूनतमकरण के समान होती है।

विचार यह है कि,जब G स्थिर और न्यूनतम चरण होता है, तो प्राक्कलनित प्रतिरूप संदर्भ समस्या मानक के न्यूनतमकरण के समान होती है।

इनपुट संकेत इसे निरंतर रोमांचक इनपुट संकेत माना जाता है और एक स्थिर डेटा-जनरेशन तंत्र द्वारा उत्पन्न किया जाता है। इस प्रकार एक विवृत-लूप प्रयोग में दो संकेत असंबद्ध हैं; इसलिए, आदर्श त्रुटि से असंबंधित है। इस प्रकार नियंत्रण उद्देश्य को इस प्रकार अन्वेषण करना है कि और असंबंधित हो।

वाद्य चर का सदिश इस प्रकार परिभाषित किया जाता है:

जहाँ अत्यधिक बड़ा है और होता है, जहाँ एक उपयुक्त निस्पंदन है।

सहसंबंध फलन इस प्रकार है:

और अनुकूलन समस्या इस प्रकार बन जाती है:

से निरूपित करना के स्पेक्ट्रम को के साथ निरूपित करते हुए, यह प्रदर्शित किया जा सकता है कि, कुछ धारणाओं के तहत, यदि इस प्रकार चयन किया जा सकता है:

फिर, निम्नलिखित धारण करता है:

स्थिरता बाधा

इसकी बात का कोईआश्वासन नहीं देता है कि नियंत्रक जो न्यूनतम करता है वह स्थिर होता है। निम्नलिखित स्थितियों में अस्थिरता हो सकती है:

  • अगर गैर-न्यूनतम चरण दाएँ-आधे जटिल विमान में रद्दीकरण हो सकता है।
  • अगर (स्थिर होने पर भी) साध्य नहीं है, स्थिर नहीं हो सकता।
  • माप के ध्वनि के कारण, तथापि स्थिर कर रहा है, डेटा-प्राक्कलनित ऐसा नहीं हो सकता है।

एक स्थिरीकरण नियंत्रक पर विचार करें और संवृत लूप ट्रांसफर फलन परिभाषित करना:

प्रमेय
नियंत्रक पौधे को स्थिर करता है यदि
  1. स्थिर होता है
  2. एस.टी.

स्थिति 1. तब प्रयुक्त होती है जब:

  • स्थिर होता है
  • इसमें एक इंटीग्रेटर सम्मिलित होता है (इसे रद्द कर दिया गया है)।

स्थिरता बाधा के साथ प्रतिरूप संदर्भ प्रतिरूप बन जाता है:

का उत्तल डेटा-संचालित प्राक्कलन असतत फूरियर रूपांतरण के माध्यम से प्राप्त किया जा सकता है।

निम्नलिखित को परिभाषित कीजिये:

स्थिर न्यूनतम चरण संयंत्रों के लिए, निम्नलिखित उत्तल डेटा-संचालित अनुकूलन समस्या दी गई है:

आभासी संदर्भ प्रतिपुष्टि ट्यूनिंग

आभासी संदर्भ प्रतिपुष्टि ट्यूनिंग (वीआरएफटी) एक निश्चित-संरचना नियंत्रक की डेटा-संचालित ट्यूनिंग के लिए एक गैर-पुनरावृत्तीय विधि है। यह एकल डेटासमुच्चय के आधार पर नियंत्रक को सीधे संश्लेषित करने के लिए एक-शॉट विधि प्रदान करता है।

वीआरएफटी पहली बार प्रस्तावित किया गया था [4] और फिर एलपीवी प्रणाली तक विस्तारित किया गया था।[5] वीआरएफटी भी इसमें दिए गए विचारों पर आधारित है [6] जैसा

मुख्य विचार वांछित संवृत लूप प्रतिरूप को परिभाषित करना है और आभासी संदर्भ प्राप्त करने के लिए इसकी व्युत्क्रम गतिशीलता का उपयोग, मापे गये आउटपुट संकेत से करें।

मुख्य विचार वांछित संवृत लूप प्रतिरूप एम को परिभाषित करना और मापा आउटपुट संकेत वाई से आभासी संदर्भ प्राप्त करने के लिए इसकी व्युत्क्रम गतिशीलता का उपयोग करना है।

आभासी संकेत और है।

निम्नलिखित अनुकूलन समस्या को हल करके ध्वनि रहित डेटा से इष्टतम नियंत्रक प्राप्त किया जाता है:

जहाँ अनुकूलन फलन इस प्रकार दिया गया है:

संदर्भ

  1. Bazanella, A.S., Campestrini, L., Eckhard, D. (2012). Data-driven controller design: the approach. Springer, ISBN 978-94-007-2300-9, 208 pages.
  2. Hjalmarsson, H., Gevers, M., Gunnarsson, S., & Lequin, O. (1998). Iterative feedback tuning: theory and applications. IEEE control systems, 18(4), 26–41.
  3. van Heusden, K., Karimi, A. and Bonvin, D. (2011), Data-driven model reference control with asymptotically guaranteed stability. Int. J. Adapt. Control Signal Process., 25: 331–351. doi:10.1002/acs.1212
  4. Campi, Marco C., Andrea Lecchini, and Sergio M. Savaresi. "Virtual reference feedback tuning: a direct method for the design of feedback controllers." Automatica 38.8 (2002): 1337–1346.
  5. Formentin, S., Piga, D., Tóth, R., & Savaresi, S. M. (2016). Direct learning of LPV controllers from data. Automatica, 65, 98–110.
  6. Guardabassi, Guido O., and Sergio M. Savaresi. "Approximate feedback linearization of discrete-time non-linear systems using virtual input direct design." Systems & Control Letters 32.2 (1997): 63–74.

बाहरी संबंध