अवस्था प्रेक्षक

From Vigyanwiki

नियंत्रण सिद्धांत में, एक राज्य पर्यवेक्षक या राज्य अनुमानक एक ऐसी प्रणाली है जो वास्तविक प्रणाली के इनपुट/आउटपुट और आउटपुट के माप से किसी दिए गए वास्तविक प्रणाली के राज्य स्थान (नियंत्रण) का अनुमान प्रदान करती है। यह आमतौर पर कंप्यूटर द्वारा क्रियान्वित किया जाता है, और कई व्यावहारिक अनुप्रयोगों का आधार प्रदान करता है।

कई नियंत्रण सिद्धांत समस्याओं को हल करने के लिए सिस्टम स्थिति को जानना आवश्यक है; उदाहरण के लिए, पूर्ण राज्य फीडबैक का उपयोग करके किसी सिस्टम को स्थिर करना। अधिकांश व्यावहारिक मामलों में, सिस्टम की भौतिक स्थिति को प्रत्यक्ष अवलोकन द्वारा निर्धारित नहीं किया जा सकता है। इसके बजाय, सिस्टम आउटपुट के माध्यम से आंतरिक स्थिति के अप्रत्यक्ष प्रभाव देखे जाते हैं। एक सरल उदाहरण एक सुरंग में वाहनों का है: जिस दर और वेग से वाहन सुरंग में प्रवेश करते हैं और निकलते हैं उसे सीधे देखा जा सकता है, लेकिन सुरंग के अंदर की सटीक स्थिति का केवल अनुमान लगाया जा सकता है। यदि कोई सिस्टम observability है, तो राज्य पर्यवेक्षक का उपयोग करके उसके आउटपुट माप से सिस्टम स्थिति को पूरी तरह से पुनर्निर्माण करना संभव है।

विशिष्ट पर्यवेक्षक मॉडल

लुएनबर्गर ऑब्जर्वर का ब्लॉक आरेख। प्रेक्षक लाभ का इनपुट एल है .

रैखिक, विलंबित, स्लाइडिंग मोड, उच्च लाभ, ताऊ, समरूपता-आधारित, विस्तारित और घन पर्यवेक्षक रैखिक और गैर-रेखीय प्रणालियों के राज्य आकलन के लिए उपयोग की जाने वाली कई पर्यवेक्षक संरचनाओं में से हैं। एक रैखिक पर्यवेक्षक संरचना का वर्णन निम्नलिखित अनुभागों में किया गया है।

असतत-समय का मामला

एक रैखिक, समय-अपरिवर्तनीय असतत-समय प्रणाली की स्थिति को संतुष्ट माना जाता है

कहाँ, समय पर , पौधे की अवस्था है; क्या इसका इनपुट है; और इसका आउटपुट है. ये समीकरण सीधे तौर पर कहते हैं कि संयंत्र के वर्तमान आउटपुट और इसकी भविष्य की स्थिति दोनों पूरी तरह से इसकी वर्तमान स्थिति और वर्तमान इनपुट द्वारा निर्धारित होते हैं। (यद्यपि ये समीकरण अलग-अलग गणित समय चरणों के संदर्भ में व्यक्त किए जाते हैं, निरंतर कार्य प्रणालियों के लिए बहुत समान समीकरण लागू होते हैं)। यदि यह प्रणाली अवलोकनीयता है तो संयंत्र का उत्पादन, , का उपयोग राज्य पर्यवेक्षक की स्थिति को नियंत्रित करने के लिए किया जा सकता है।

भौतिक प्रणाली का पर्यवेक्षक मॉडल आमतौर पर उपरोक्त समीकरणों से प्राप्त होता है। यह सुनिश्चित करने के लिए अतिरिक्त शर्तें शामिल की जा सकती हैं कि, संयंत्र के इनपुट और आउटपुट के क्रमिक मापा मूल्य प्राप्त करने पर, मॉडल की स्थिति संयंत्र की स्थिति में परिवर्तित हो जाती है। विशेष रूप से, पर्यवेक्षक के आउटपुट को संयंत्र के आउटपुट से घटाया जा सकता है और फिर मैट्रिक्स द्वारा गुणा किया जा सकता है ; फिर इसे नीचे दिए गए समीकरणों द्वारा परिभाषित एक तथाकथित डेविड लुएनबर्गर पर्यवेक्षक बनाने के लिए पर्यवेक्षक की स्थिति के समीकरणों में जोड़ा जाता है। ध्यान दें कि राज्य पर्यवेक्षक के चर आमतौर पर एक टोपी द्वारा दर्शाए जाते हैं: और उन्हें भौतिक प्रणाली द्वारा संतुष्ट समीकरणों के चरों से अलग करना।

यदि प्रेक्षक त्रुटि करता है तो प्रेक्षक को स्पर्शोन्मुख रूप से स्थिर कहा जाता है जब शून्य में परिवर्तित हो जाता है . लुएनबर्गर पर्यवेक्षक के लिए, पर्यवेक्षक की त्रुटि संतुष्ट करती है . इस असतत-समय प्रणाली के लिए लुएनबर्गर पर्यवेक्षक इसलिए मैट्रिक्स के दौरान स्पर्शोन्मुख रूप से स्थिर होता है यूनिट सर्कल के अंदर सभी eigenvalues ​​​​हैं।

नियंत्रण उद्देश्यों के लिए पर्यवेक्षक प्रणाली का आउटपुट लाभ मैट्रिक्स के माध्यम से पर्यवेक्षक और संयंत्र दोनों के इनपुट में वापस फीड किया जाता है .

पर्यवेक्षक समीकरण तब बन जाते हैं:

या, अधिक सरलता से,

पृथक्करण सिद्धांत के कारण हम जानते हैं कि हम चुन सकते हैं और सिस्टम की समग्र स्थिरता को नुकसान पहुंचाए बिना स्वतंत्र रूप से। एक सामान्य नियम के रूप में, पर्यवेक्षक के ध्रुव आमतौर पर सिस्टम के ध्रुवों की तुलना में 10 गुना तेजी से अभिसरण करने के लिए चुना जाता है .

सतत-समय मामला

पिछला उदाहरण एक अलग-समय एलटीआई प्रणाली में कार्यान्वित पर्यवेक्षक के लिए था। हालाँकि, निरंतर-समय के मामले के लिए प्रक्रिया समान है; प्रेक्षक को लाभ होता है निरंतर-समय त्रुटि गतिशीलता को स्पर्शोन्मुख रूप से शून्य में परिवर्तित करने के लिए चुना जाता है (यानी, जब एक हर्विट्ज़ मैट्रिक्स है)।

एक सतत-समय रैखिक प्रणाली के लिए

कहाँ , पर्यवेक्षक ऊपर वर्णित असतत-समय के मामले के समान दिखता है:

.

पर्यवेक्षक त्रुटि समीकरण को संतुष्ट करता है

.

मैट्रिक्स के eigenvalues पर्यवेक्षक लाभ के उचित विकल्प द्वारा मनमाने ढंग से चुना जा सकता है जब जोड़ी अवलोकनीय है, अर्थात अवलोकनीय स्थिति कायम है। विशेष रूप से, इसे हर्विट्ज़ बनाया जा सकता है, इसलिए पर्यवेक्षक त्रुटि कब .

पीकिंग और अन्य पर्यवेक्षक विधियां

जब प्रेक्षक को लाभ होता है उच्च है, रैखिक लुएनबर्गर पर्यवेक्षक सिस्टम स्थितियों में बहुत तेज़ी से परिवर्तित होता है। हालाँकि, उच्च पर्यवेक्षक लाभ एक चरम घटना की ओर ले जाता है जिसमें प्रारंभिक अनुमानक त्रुटि निषेधात्मक रूप से बड़ी हो सकती है (यानी, अव्यावहारिक या उपयोग करने के लिए असुरक्षित)।[1] परिणामस्वरूप, गैर-रैखिक उच्च-लाभ पर्यवेक्षक विधियां उपलब्ध हैं जो चरम घटना के बिना जल्दी से अभिसरण करती हैं। उदाहरण के लिए, स्लाइडिंग मोड नियंत्रण का उपयोग एक पर्यवेक्षक को डिजाइन करने के लिए किया जा सकता है जो माप त्रुटि की उपस्थिति में भी सीमित समय में एक अनुमानित राज्य की त्रुटि को शून्य पर लाता है; अन्य राज्यों में त्रुटि है जो शिखर के कम होने के बाद लुएनबर्गर पर्यवेक्षक में त्रुटि के समान व्यवहार करती है। स्लाइडिंग मोड पर्यवेक्षकों में आकर्षक शोर लचीलापन गुण भी होते हैं जो कलमन फ़िल्टर के समान होते हैं।[2][3] एक अन्य दृष्टिकोण मल्टी ऑब्जर्वर को लागू करना है, जो ट्रांजिएंट्स में काफी सुधार करता है और ऑब्जर्वर ओवरशूट को कम करता है। मल्टी-ऑब्जर्वर को हर उस प्रणाली के लिए अनुकूलित किया जा सकता है जहां उच्च-लाभ पर्यवेक्षक लागू होता है।[4]


अरेखीय प्रणालियों के लिए राज्य पर्यवेक्षक

उच्च लाभ, स्लाइडिंग मोड और विस्तारित पर्यवेक्षक नॉनलाइनियर सिस्टम के लिए सबसे आम पर्यवेक्षक हैं। नॉनलीनियर सिस्टम के लिए स्लाइडिंग मोड पर्यवेक्षकों के अनुप्रयोग को स्पष्ट करने के लिए, पहले नो-इनपुट नॉन-लीनियर सिस्टम पर विचार करें:

कहाँ . यह भी मान लें कि एक मापने योग्य आउटपुट है द्वारा दिए गए

किसी पर्यवेक्षक को डिज़ाइन करने के लिए कई गैर-अनुमानित दृष्टिकोण हैं। नीचे दिए गए दो पर्यवेक्षक उस स्थिति पर भी लागू होते हैं जब सिस्टम में कोई इनपुट होता है। वह है,


रेखीय त्रुटि गतिशीलता

क्रेनर और इसिडोरी का एक सुझाव[5] और क्रेनर और रिस्पोंडेक[6] ऐसी स्थिति में लागू किया जा सकता है जब एक रैखिक परिवर्तन मौजूद होता है (यानी, एक भिन्नता, जैसा कि फीडबैक रैखिककरण में उपयोग किया जाता है) जैसे कि नए वेरिएबल्स में सिस्टम समीकरण पढ़े जाते हैं

लुएनबर्गर पर्यवेक्षक को तब डिज़ाइन किया गया है

.

रूपांतरित चर के लिए पर्यवेक्षक त्रुटि शास्त्रीय रैखिक मामले के समान समीकरण को संतुष्ट करता है।

.

जैसा कि गौथियर, हैमौरी और ओथमैन द्वारा दिखाया गया है[7] और हम्मौरी और किन्नार्ट,[8] यदि परिवर्तन मौजूद है जिससे व्यवस्था को स्वरूप में बदला जा सके

तब पर्यवेक्षक को इस प्रकार डिज़ाइन किया गया है

,

कहाँ एक समय-परिवर्तनशील पर्यवेक्षक लाभ है।

सिस्कारेला, दल्ला मोरा, और जर्मनी[9] अधिक उन्नत और सामान्य परिणाम प्राप्त किए, एक गैर-रेखीय परिवर्तन की आवश्यकता को हटा दिया और नियमितता पर केवल सरल मान्यताओं का उपयोग करके अनुमानित स्थिति के वैश्विक स्पर्शोन्मुख अभिसरण को वास्तविक स्थिति में साबित किया।

परिवर्तित पर्यवेक्षक

जैसा कि ऊपर रैखिक मामले के लिए चर्चा की गई है, लुएनबर्गर पर्यवेक्षकों में मौजूद चरम घटना स्विच किए गए पर्यवेक्षकों के उपयोग को उचित ठहराती है। एक स्विच्ड ऑब्जर्वर में एक रिले या बाइनरी स्विच शामिल होता है जो मापा आउटपुट में मिनट परिवर्तन का पता लगाने पर कार्य करता है। कुछ सामान्य प्रकार के स्विच्ड पर्यवेक्षकों में स्लाइडिंग मोड पर्यवेक्षक, नॉनलाइनियर विस्तारित राज्य पर्यवेक्षक शामिल हैं।[10] निश्चित समय पर्यवेक्षक,[11] उच्च लाभ पर्यवेक्षक को स्विच किया गया[12] और पर्यवेक्षक को एकजुट करना।[13] स्लाइडिंग मोड नियंत्रण#स्लाइडिंग मोड ऑब्जर्वर अनुमानित स्थितियों को ऊनविम पृष्ठ पर ले जाने के लिए गैर-रेखीय उच्च-लाभ फीडबैक का उपयोग करता है जहां अनुमानित आउटपुट और मापा आउटपुट के बीच कोई अंतर नहीं होता है। पर्यवेक्षक में उपयोग किए जाने वाले गैर-रैखिक लाभ को आम तौर पर अनुमानित - मापा आउटपुट त्रुटि के साइन फ़ंक्शन (यानी, एसजीएन) जैसे स्केल किए गए स्विचिंग फ़ंक्शन के साथ कार्यान्वित किया जाता है। इसलिए, इस उच्च-लाभ प्रतिक्रिया के कारण, पर्यवेक्षक के वेक्टर क्षेत्र में एक क्रीज होती है ताकि पर्यवेक्षक प्रक्षेपवक्र एक वक्र के साथ स्लाइड करें जहां अनुमानित आउटपुट मापा आउटपुट से बिल्कुल मेल खाता है। इसलिए, यदि सिस्टम अपने आउटपुट से अवलोकन योग्य है, तो पर्यवेक्षक राज्यों को वास्तविक सिस्टम राज्यों में ले जाया जाएगा। इसके अतिरिक्त, स्लाइडिंग मोड ऑब्जर्वर को चलाने के लिए त्रुटि के संकेत का उपयोग करने से, ऑब्जर्वर प्रक्षेप पथ कई प्रकार के शोर के प्रति असंवेदनशील हो जाते हैं। इसलिए, कुछ स्लाइडिंग मोड पर्यवेक्षकों में कलमन फ़िल्टर के समान आकर्षक गुण होते हैं लेकिन सरल कार्यान्वयन के साथ।[2][3]

जैसा कि ड्रैकुनोव ने सुझाव दिया था,[14] एक स्लाइडिंग मोड नियंत्रण#स्लाइडिंग मोड ऑब्जर्वर को गैर-रेखीय प्रणालियों के एक वर्ग के लिए भी डिज़ाइन किया जा सकता है। ऐसे पर्यवेक्षक को मूल चर अनुमान के संदर्भ में लिखा जा सकता है और रूप है

कहाँ:

  • h> वेक्टर अदिश चिह्न फ़ंक्शन का विस्तार करता है आयाम. वह है,
    वेक्टर के लिए .
  • वेक्टर इसमें ऐसे घटक हैं जो आउटपुट फ़ंक्शन हैं और इसके दोहराए गए लाई डेरिवेटिव। विशेष रूप से,
    कहाँ मैं हैवेंआउटपुट फ़ंक्शन का व्युत्पन्न झूठ वेक्टर फ़ील्ड के साथ (अर्थात्, साथ में गैर-रेखीय प्रणाली के प्रक्षेप पथ)। विशेष मामले में जहां सिस्टम में कोई इनपुट नहीं है या n का फीडबैक रैखिककरण है, आउटपुट का एक संग्रह है और इसके व्युत्पन्न। क्योंकि के रैखिककरण का उलटा इस पर्यवेक्षक को अच्छी तरह से परिभाषित करने के लिए, परिवर्तन का अस्तित्व होना चाहिए स्थानीय भिन्नता होने की गारंटी है।
  • विकर्ण मैट्रिक्स लाभ का इतना है कि
    कहाँ, प्रत्येक के लिए , तत्व और स्लाइडिंग मोड की पहुंच सुनिश्चित करने के लिए उपयुक्त रूप से बड़ा।
  • प्रेक्षक वेक्टर इस प्रकार कि
    कहाँ यहां स्केलर के लिए परिभाषित सामान्य साइन फ़ंक्शन है, और स्लाइडिंग मोड में एक असंतत फ़ंक्शन के समतुल्य मान ऑपरेटर को दर्शाता है।

इस विचार को संक्षेप में इस प्रकार समझाया जा सकता है। स्लाइडिंग मोड के सिद्धांत के अनुसार, सिस्टम व्यवहार का वर्णन करने के लिए, एक बार स्लाइडिंग मोड शुरू होने पर, फ़ंक्शन समकक्ष मानों द्वारा प्रतिस्थापित किया जाना चाहिए (स्लाइडिंग मोड नियंत्रण के सिद्धांत में समकक्ष नियंत्रण देखें)। व्यवहार में, यह उच्च आवृत्ति के साथ स्विच (चैटर) करता है और धीमा घटक समतुल्य मूल्य के बराबर होता है। उच्च आवृत्ति घटक से छुटकारा पाने के लिए उपयुक्त लोपास फ़िल्टर लागू करने से समतुल्य नियंत्रण का मूल्य प्राप्त किया जा सकता है, जिसमें अनुमानित प्रणाली की स्थिति के बारे में अधिक जानकारी होती है। ऊपर वर्णित पर्यवेक्षक आदर्श रूप से सीमित समय में गैर-रेखीय प्रणाली की स्थिति प्राप्त करने के लिए इस विधि का कई बार उपयोग करता है।

संशोधित अवलोकन त्रुटि को रूपांतरित अवस्थाओं में लिखा जा सकता है . विशेष रूप से,

इसलिए