डेटा-संचालित नियंत्रण प्रणाली
डेटा-संचालित नियंत्रण प्रणालियाँ नियंत्रण सिद्धांत का एक व्यापक परिवार है, जिसमें प्रक्रिया मॉडल की सिस्टम पहचान और/या नियंत्रक का डिज़ाइन पूरी तरह से संयंत्र से एकत्र किए गए प्रायोगिक डेटा पर आधारित होता है।[1] कई नियंत्रण अनुप्रयोगों में, संयंत्र का गणितीय मॉडल लिखने का प्रयास करना एक कठिन कार्य माना जाता है, जिसके लिए प्रक्रिया और नियंत्रण इंजीनियरों को प्रयास और समय की आवश्यकता होती है। इस समस्या को डेटा-संचालित तरीकों से दूर किया जाता है, जो एक सिस्टम मॉडल को एकत्र किए गए प्रयोगात्मक डेटा में फिट करते हैं, इसे एक विशिष्ट मॉडल वर्ग में चुनते हैं। नियंत्रण इंजीनियर सिस्टम के लिए एक उचित नियंत्रक डिजाइन करने के लिए इस मॉडल का उपयोग कर सकता है। हालाँकि, किसी भौतिक प्रणाली के लिए एक सरल लेकिन विश्वसनीय मॉडल ढूंढना अभी भी मुश्किल है, जिसमें सिस्टम की केवल वे गतिशीलताएँ शामिल हों जो नियंत्रण विशिष्टताओं के लिए रुचिकर हों। प्रत्यक्ष डेटा-संचालित विधियाँ सिस्टम के किसी पहचाने गए मॉडल की आवश्यकता के बिना, किसी दिए गए वर्ग से संबंधित नियंत्रक को ट्यून करने की अनुमति देती हैं। इस तरह, कोई भी नियंत्रण लागत फ़ंक्शन के अंदर रुचि की प्रक्रिया गतिशीलता को आसानी से महत्व दे सकता है, और उन गतिशीलता को बाहर कर सकता है जो रुचि से बाहर हैं।
सिंहावलोकन
सिस्टम डिज़ाइन को नियंत्रित करने का मानक दृष्टिकोण दो चरणों में व्यवस्थित किया गया है:
- मॉडल पहचान का उद्देश्य सिस्टम के नाममात्र मॉडल का अनुमान लगाना है , कहाँ इकाई-विलंब ऑपरेटर है (असतत-समय स्थानांतरण कार्यों के प्रतिनिधित्व के लिए) और के मापदंडों का सदिश है के एक सेट पर पहचाना गया डेटा। फिर, सत्यापन में अनिश्चितता सेट का निर्माण शामिल है जिसमें सच्ची व्यवस्था समाहित है एक निश्चित संभाव्यता स्तर पर.
- नियंत्रक डिज़ाइन का लक्ष्य एक नियंत्रक ढूंढना है बंद-लूप स्थिरता प्राप्त करना और आवश्यक प्रदर्शन को पूरा करना .
सिस्टम पहचान के विशिष्ट उद्देश्य हैं जितना संभव हो उतना करीब , और होना जितना संभव हो उतना छोटा. हालाँकि, नियंत्रण परिप्रेक्ष्य के लिए सिस्टम पहचान#पहचान से, जो वास्तव में मायने रखता है वह नियंत्रक द्वारा प्राप्त प्रदर्शन है, न कि मॉडल की आंतरिक गुणवत्ता।
अनिश्चितता से निपटने का एक तरीका एक ऐसे नियंत्रक को डिज़ाइन करना है जिसका प्रदर्शन सभी मॉडलों के साथ स्वीकार्य हो , शामिल . मजबूत नियंत्रण डिज़ाइन प्रक्रिया के पीछे यह मुख्य विचार है, जिसका उद्देश्य प्रक्रिया की आवृत्ति डोमेन अनिश्चितता विवरण तैयार करना है। हालाँकि, शोर को औसत करने के विचार के बजाय सबसे खराब स्थिति की धारणाओं पर आधारित होने के कारण, यह दृष्टिकोण आमतौर पर रूढ़िवादी अनिश्चितता सेट की ओर ले जाता है। बल्कि, डेटा-संचालित तकनीकें प्रायोगिक डेटा पर काम करके और अत्यधिक रूढ़िवादिता से बचकर अनिश्चितता से निपटती हैं।
निम्नलिखित में, डेटा-संचालित नियंत्रण प्रणालियों का मुख्य वर्गीकरण प्रस्तुत किया गया है।
अप्रत्यक्ष और प्रत्यक्ष विधियाँ
सिस्टम को नियंत्रित करने के लिए कई विधियाँ उपलब्ध हैं। मौलिक अंतर अप्रत्यक्ष और प्रत्यक्ष नियंत्रक डिज़ाइन विधियों के बीच है। तकनीकों का पूर्व समूह अभी भी मानक दो-चरणीय दृष्टिकोण को बरकरार रख रहा है, यानी पहले एक मॉडल की पहचान की जाती है, फिर ऐसे मॉडल के आधार पर एक नियंत्रक को ट्यून किया जाता है। ऐसा करने में मुख्य मुद्दा यह है कि नियंत्रक की गणना अनुमानित मॉडल से की जाती है (स्टोकेस्टिक नियंत्रण#निश्चितता तुल्यता सिद्धांत के अनुसार), लेकिन व्यवहार में . इस समस्या को दूर करने के लिए, तकनीकों के बाद वाले समूह के पीछे का विचार प्रयोगात्मक डेटा को सीधे नियंत्रक पर मैप करना है, बीच में किसी भी मॉडल की पहचान किए बिना।
पुनरावृत्तीय और गैर-पुनरावृत्तीय विधियाँ
एक अन्य महत्वपूर्ण अंतर पुनरावृत्तीय और गैर-पुनरावृत्तीय (या एक-शॉट) तरीकों के बीच है। पहले समूह में, नियंत्रक मापदंडों का अनुमान लगाने के लिए बार-बार पुनरावृत्ति की आवश्यकता होती है, जिसके दौरान पिछले पुनरावृत्ति के परिणामों के आधार पर अनुकूलन समस्या का प्रदर्शन किया जाता है, और प्रत्येक पुनरावृत्ति पर अनुमान अधिक से अधिक सटीक होने की उम्मीद की जाती है। यह दृष्टिकोण ऑनलाइन कार्यान्वयन के लिए भी प्रवण है (नीचे देखें)। बाद वाले समूह में, (इष्टतम) नियंत्रक पैरामीट्रिज़ेशन को एकल अनुकूलन समस्या के साथ प्रदान किया जाता है। यह उन प्रणालियों के लिए विशेष रूप से महत्वपूर्ण है जिनमें डेटा संग्रह प्रयोगों की पुनरावृत्ति या पुनरावृत्ति सीमित है या यहां तक कि अनुमति नहीं है (उदाहरण के लिए, आर्थिक पहलुओं के कारण)। ऐसे मामलों में, किसी को एक डिज़ाइन तकनीक का चयन करना चाहिए जो एकल डेटा सेट पर नियंत्रक वितरित करने में सक्षम हो। यह दृष्टिकोण अक्सर ऑफ़लाइन लागू किया जाता है (नीचे देखें)।
ऑन-लाइन और ऑफ-लाइन तरीके
चूंकि, व्यावहारिक औद्योगिक अनुप्रयोगों पर, ओपन-लूप या बंद-लूप डेटा अक्सर लगातार उपलब्ध होते हैं, ऑन-लाइन डेटा-संचालित तकनीकें उन डेटा का उपयोग पहचाने गए मॉडल की गुणवत्ता और/या नियंत्रक के प्रदर्शन में सुधार करने के लिए करती हैं, हर बार नई जानकारी पौधे पर एकत्र किया जाता है। इसके बजाय, ऑफ़लाइन दृष्टिकोण डेटा के बैच पर काम करते हैं, जिन्हें नियमित (बल्कि लंबे) समय अंतराल पर केवल एक बार या कई बार एकत्र किया जा सकता है।
पुनरावृत्तीय फीडबैक ट्यूनिंग
पुनरावृत्त फीडबैक ट्यूनिंग (आईएफटी) पद्धति 1994 में शुरू की गई थी,[2] इस अवलोकन से शुरू करते हुए कि, नियंत्रण के लिए पहचान में, प्रत्येक पुनरावृत्ति (गलत) निश्चितता तुल्यता सिद्धांत पर आधारित है।
IFT एक निश्चित-ऑर्डर नियंत्रक के मापदंडों के प्रत्यक्ष पुनरावृत्त अनुकूलन के लिए एक मॉडल-मुक्त तकनीक है; ऐसे मापदंडों को मानक (बंद-लूप) सिस्टम ऑपरेशन से आने वाली जानकारी का उपयोग करके क्रमिक रूप से अद्यतन किया जा सकता है।
होने देना संदर्भ सिग्नल के लिए वांछित आउटपुट बनें ; प्राप्त और वांछित प्रतिक्रिया के बीच त्रुटि है . नियंत्रण डिज़ाइन उद्देश्य को उद्देश्य फ़ंक्शन के न्यूनतमकरण के रूप में तैयार किया जा सकता है:
न्यूनतम करने के उद्देश्य फ़ंक्शन को देखते हुए, अर्ध-न्यूटन विधि लागू की जा सकती है, यानी प्रकार की ग्रेडिएंट खोज का उपयोग करके ग्रेडिएंट-आधारित न्यूनतमकरण:
मूल्य चरण का आकार है, एक उपयुक्त सकारात्मक निश्चित मैट्रिक्स है और ढाल का एक अनुमान है; ग्रेडिएंट का सही मान निम्नलिखित द्वारा दिया गया है:
का मान है निम्नलिखित तीन-चरणीय पद्धति के माध्यम से प्राप्त किया जाता है:
- सामान्य प्रयोग: बंद लूप सिस्टम पर एक प्रयोग करें नियंत्रक के रूप में और संदर्भ के रूप में; आउटपुट का एन माप एकत्र करें , इस रूप में घोषित किया गया .
- ग्रेडिएंट प्रयोग: बंद लूप सिस्टम पर एक प्रयोग करें नियंत्रक के रूप में और 0 संदर्भ के रूप में ; सिग्नल इंजेक्ट करें इस प्रकार इसे नियंत्रण चर आउटपुट में संक्षेपित किया जाता है , संयंत्र में इनपुट के रूप में जा रहा है। आउटपुट एकत्रित करें, जिसे इस रूप में दर्शाया गया है .
- निम्नलिखित को ग्रेडिएंट सन्निकटन के रूप में लें: .
एल्गोरिथ्म की अभिसरण गति के लिए एक महत्वपूर्ण कारक का चुनाव है ; कब छोटा है, गॉस-न्यूटन दिशा द्वारा दिया गया सन्निकटन एक अच्छा विकल्प है:
गैर-अनिवार्य सहसंबंध-आधारित ट्यूनिंग
नॉनटेरेटिव सहसंबंध-आधारित ट्यूनिंग (एनसीबीटी) एक निश्चित-संरचना नियंत्रक के डेटा-संचालित ट्यूनिंग के लिए एक नॉनटेरेटिव विधि है।[3] यह एकल डेटासेट के आधार पर नियंत्रक को सीधे संश्लेषित करने के लिए एक-शॉट विधि प्रदान करता है।
लगता है कि एक अज्ञात LTI स्थिर SISO संयंत्र को दर्शाता है, एक उपयोगकर्ता-परिभाषित संदर्भ मॉडल और एक उपयोगकर्ता-परिभाषित वेटिंग फ़ंक्शन। एक एलटीआई निश्चित-आदेश नियंत्रक को इस रूप में दर्शाया गया है , कहाँ , और एलटीआई आधारित कार्यों का एक वेक्टर है। अंत में, किसी भी संरचना का एक आदर्श एलटीआई नियंत्रक है, जो बंद-लूप फ़ंक्शन की गारंटी देता है जब लागू किया गया .
लक्ष्य निम्नलिखित उद्देश्य फ़ंक्शन को कम करना है:
ऐसा मानते हुए, एक मॉडल संदर्भ समस्या से प्राप्त उद्देश्य फ़ंक्शन का उत्तल सन्निकटन है .
कब स्थिर और न्यूनतम-चरण है, अनुमानित मॉडल संदर्भ समस्या मानक के न्यूनतमकरण के बराबर है चित्र में योजना में।
इनपुट सिग्नल इसे लगातार रोमांचक इनपुट सिग्नल माना जाता है और एक स्थिर डेटा-जनरेशन तंत्र द्वारा उत्पन्न किया जाना है। इस प्रकार एक ओपन-लूप प्रयोग में दो सिग्नल असंबद्ध हैं; इसलिए, आदर्श त्रुटि से असंबंधित है . इस प्रकार नियंत्रण उद्देश्य खोजना शामिल है ऐसा है कि और असंबंधित हैं.
वाद्य चर का वेक्टर परिभाषित किया जाता है:
कहाँ काफी बड़ा है और , कहाँ एक उपयुक्त फ़िल्टर है.
सहसंबंध कार्य है:
और अनुकूलन समस्या बन जाती है:
से निरूपित करना का स्पेक्ट्रम , यह प्रदर्शित किया जा सकता है कि, कुछ धारणाओं के तहत, यदि इस प्रकार चुना गया है:
फिर, निम्नलिखित धारण करता है:
स्थिरता बाधा
इसकी कोई गारंटी नहीं है कि नियंत्रक वह न्यूनतम करता है स्थिर है. निम्नलिखित मामलों में अस्थिरता हो सकती है:
- अगर गैर-न्यूनतम चरण दाएँ-आधे जटिल विमान में रद्दीकरण हो सकता है।
- अगर (स्थिर होने पर भी) साध्य नहीं है, स्थिर नहीं हो सकता.
- माप के शोर के कारण, भले ही स्थिर कर रहा है, डेटा-अनुमानित ऐसा नहीं हो सकता.
एक स्थिरीकरण नियंत्रक पर विचार करें और बंद लूप ट्रांसफर फ़ंक्शन . परिभाषित करना:
- प्रमेय
- नियंत्रक पौधे को स्थिर करता है अगर
- स्थिर है
- अनुसूचित जनजाति। शर्त 1. तब लागू होती है जब:
- स्थिर है
- इसमें एक इंटीग्रेटर शामिल है (इसे रद्द कर दिया गया है)।
स्थिरता बाधा के साथ मॉडल संदर्भ डिज़ाइन बन जाता है:
का उत्तल डेटा-संचालित अनुमान असतत फूरियर रूपांतरण के माध्यम से प्राप्त किया जा सकता है।
नीचे उल्लेख किए गए परिभाषित करो:
स्थिर न्यूनतम चरण संयंत्रों के लिए, निम्नलिखित उत्तल डेटा-संचालित अनुकूलन समस्या दी गई है:
वर्चुअल संदर्भ फीडबैक ट्यूनिंग
वर्चुअल रेफरेंस फीडबैक ट्यूनिंग (वीआरएफटी) एक निश्चित-संरचना नियंत्रक की डेटा-संचालित ट्यूनिंग के लिए एक गैर-पुनरावृत्तीय विधि है। यह एकल डेटासेट के आधार पर नियंत्रक को सीधे संश्लेषित करने के लिए एक-शॉट विधि प्रदान करता है।
वीआरएफटी पहली बार प्रस्तावित किया गया था [4] और फिर एलपीवी सिस्टम तक विस्तारित किया गया।[5] वीआरएफटी भी इसमें दिए गए विचारों पर आधारित है [6] जैसा .
मुख्य विचार वांछित बंद लूप मॉडल को परिभाषित करना है और आभासी संदर्भ प्राप्त करने के लिए इसकी व्युत्क्रम गतिशीलता का उपयोग करना मापा आउटपुट सिग्नल से .
आभासी संकेत हैं और
निम्नलिखित अनुकूलन समस्या को हल करके शोर रहित डेटा से इष्टतम नियंत्रक प्राप्त किया जाता है:
जहां अनुकूलन फ़ंक्शन इस प्रकार दिया गया है:
संदर्भ
- ↑ Bazanella, A.S., Campestrini, L., Eckhard, D. (2012). Data-driven controller design: the approach. Springer, ISBN 978-94-007-2300-9, 208 pages.
- ↑ Hjalmarsson, H., Gevers, M., Gunnarsson, S., & Lequin, O. (1998). Iterative feedback tuning: theory and applications. IEEE control systems, 18(4), 26–41.
- ↑ van Heusden, K., Karimi, A. and Bonvin, D. (2011), Data-driven model reference control with asymptotically guaranteed stability. Int. J. Adapt. Control Signal Process., 25: 331–351. doi:10.1002/acs.1212
- ↑ Campi, Marco C., Andrea Lecchini, and Sergio M. Savaresi. "Virtual reference feedback tuning: a direct method for the design of feedback controllers." Automatica 38.8 (2002): 1337–1346.
- ↑ Formentin, S., Piga, D., Tóth, R., & Savaresi, S. M. (2016). Direct learning of LPV controllers from data. Automatica, 65, 98–110.
- ↑ Guardabassi, Guido O., and Sergio M. Savaresi. "Approximate feedback linearization of discrete-time non-linear systems using virtual input direct design." Systems & Control Letters 32.2 (1997): 63–74.