ग्रे बॉक्स मॉडल: Difference between revisions
No edit summary |
No edit summary |
||
Line 1: | Line 1: | ||
{{short description|Mathematical data production model with limited structure}} | {{short description|Mathematical data production model with limited structure}} | ||
गणित, सांख्यिकी और [[कम्प्यूटेशनल मॉडलिंग]] में, एक ग्रे बॉक्स मॉडल<ref name="Bohlin06">{{cite book|first=Torsten P. |last=Bohlin|title=Practical Grey-box Process Identification: Theory and Applications|url={{google books |plainurl=y |id=SZtEAAAAQBAJ}}|date=7 September 2006|publisher=Springer Science & Business Media|isbn=978-1-84628-403-8}}</ref><ref name="Mathworks12">{{cite web |publisher=Mathworks 2|year=2012 |title=ग्रे-बॉक्स मॉडल अनुमान|url=http://www.mathworks.com.au/help/ident/grey-box-model-estimation.html}}</ref><ref>Kroll, Andreas (2000). Grey-box models: Concepts and application. In: New Frontiers in Computational Intelligence and its Applications, vol.57 of Frontiers in artificial intelligence and applications, pp. 42-51. IOS Press, Amsterdam.</ref><ref name="Sohlberg08">Sohlberg, B., and Jacobsen, E.W., 2008. [https://www.sciencedirect.com/science/article/pii/S1474667016408025 Grey box modelling - branches and experiences], Proc. 17th World Congress, Int. Federation of Automatic Control, Seoul. pp 11415-11420 </ref> मॉडल को पूरा करने के लिए डेटा के साथ आंशिक सैद्धांतिक संरचना को जोड़ता है। सैद्धांतिक संरचना परिणामों की सहजता पर जानकारी से लेकर उन मॉडलों तक भिन्न हो सकती है जिन्हें डेटा या वर्तमान साहित्य से केवल पैरामीटर मानों की आवश्यकता होती है।<ref name="Whiten13" >Whiten, B., 2013. [http://journal.austms.org.au/ojs/index.php/ANZIAMJ/article/view/6125/1682 Model completion and validation using inversion of grey box models], ANZIAM J.,54 (CTAC 2012) pp C187–C199. </ref> इस प्रकार, लगभग सभी मॉडल [[ब्लैक बॉक्स]] के विपरीत ग्रे बॉक्स मॉडल हैं जहां कोई मॉडल फॉर्म नहीं माना जाता है या [[व्हाइट बॉक्स (सॉफ्टवेयर इंजीनियरिंग)]] मॉडल जो पूरी तरह से सैद्धांतिक हैं। कुछ मॉडल एक विशेष रूप धारण करते हैं जैसे कि रैखिक प्रतिगमन<ref name="Draper98">{{cite book|first1=Norman R. |last1=Draper|first2=Harry |last2=Smith|title=अनुप्रयुक्त प्रतिगमन विश्लेषण|url={{google books |plainurl=y |id=uSReBAAAQBAJ}}|date=25 August 2014|publisher=John Wiley & Sons|isbn=978-1-118-62568-2|pages=657–}}</ref><ref name="Weisburg05">{{cite book|first=Sanford |last=Weisberg|title=एप्लाइड रैखिक प्रतिगमन|url={{google books |plainurl=y |id=7pg3AgAAQBAJ}}|date=25 November 2013|publisher=Wiley|isbn=978-1-118-59485-8}}</ref> या [[तंत्रिका नेटवर्क]]।<ref name="Heaton12">Heaton, J., 2012. Introduction to the math of neural networks, Heaton Research Inc. (Chesterfield, MO), {{isbn|978-1475190878}}</ref><ref name="Stergiou13">{{cite web |last1=Stergiou |first1=C. |last2=Siganos |first2=D. |year=2013 |title=तंत्रिका - तंत्र|url=http://www.doc.ic.ac.uk/~nd/surprise_96/journal/vol4/cs11/report.html |access-date=2013-07-03 |archive-url=https://web.archive.org/web/20091216110504/http://www.doc.ic.ac.uk/~nd/surprise_96/journal/vol4/cs11/report.html |archive-date=2009-12-16 |url-status=dead }}</ref> इनमें विशेष विश्लेषण विधियाँ हैं। विशेष रूप से रैखिक प्रतिगमन तकनीकों में<ref name="Lawson96">{{cite book|first1=Charles L. |last1=Lawson|first2=Richard |last2=J. Hanson|title=न्यूनतम वर्ग समस्याओं का समाधान|url={{google books |plainurl=y |id=AEwDbHp50FgC}}|date=1 December 1995|publisher=SIAM|isbn=978-0-89871-356-5}}</ref> अधिकांश गैर-रेखीय तकनीकों की तुलना में बहुत अधिक कुशल हैं।<ref name="Press07" >{{cite book | last1= Press| first1= W.H. |last2=Teukolsky |first2=S.A. |last3=Vetterling |first3=W.T. |last4=Flannery |first4=B.P.|title=[[Numerical Recipes]] | edition= 3rd |date= 2007|publisher=Cambridge University Press|isbn=978-0-521-88068-8}}</ref><ref name="Gelman03">{{cite book|first1=Andrew |last1=Gelman|first2=John B. |last2=Carlin|first3=Hal S. |last3=Stern|first4=David B. |last4=Dunson |first5=Aki |last5=Vehtari |first6=Donald B. |last6=Rubin|title=बायेसियन डेटा विश्लेषण, तीसरा संस्करण|url={{google books |plainurl=y |id=ZXL6AQAAQBAJ}}|date=1 November 2013|publisher=CRC Press|isbn=978-1-4398-4095-5}}</ref> मॉडल अपने नियोजित उपयोग के आधार पर नियतात्मक या [[स्टोकेस्टिक]] (अर्थात् यादृच्छिक घटकों से युक्त) हो सकता है। | गणित, सांख्यिकी और [[कम्प्यूटेशनल मॉडलिंग]] में, एक '''ग्रे बॉक्स मॉडल'''<ref name="Bohlin06">{{cite book|first=Torsten P. |last=Bohlin|title=Practical Grey-box Process Identification: Theory and Applications|url={{google books |plainurl=y |id=SZtEAAAAQBAJ}}|date=7 September 2006|publisher=Springer Science & Business Media|isbn=978-1-84628-403-8}}</ref><ref name="Mathworks12">{{cite web |publisher=Mathworks 2|year=2012 |title=ग्रे-बॉक्स मॉडल अनुमान|url=http://www.mathworks.com.au/help/ident/grey-box-model-estimation.html}}</ref><ref>Kroll, Andreas (2000). Grey-box models: Concepts and application. In: New Frontiers in Computational Intelligence and its Applications, vol.57 of Frontiers in artificial intelligence and applications, pp. 42-51. IOS Press, Amsterdam.</ref><ref name="Sohlberg08">Sohlberg, B., and Jacobsen, E.W., 2008. [https://www.sciencedirect.com/science/article/pii/S1474667016408025 Grey box modelling - branches and experiences], Proc. 17th World Congress, Int. Federation of Automatic Control, Seoul. pp 11415-11420 </ref> मॉडल को पूरा करने के लिए डेटा के साथ आंशिक सैद्धांतिक संरचना को जोड़ता है। सैद्धांतिक संरचना परिणामों की सहजता पर जानकारी से लेकर उन मॉडलों तक भिन्न हो सकती है जिन्हें डेटा या वर्तमान साहित्य से केवल पैरामीटर मानों की आवश्यकता होती है।<ref name="Whiten13" >Whiten, B., 2013. [http://journal.austms.org.au/ojs/index.php/ANZIAMJ/article/view/6125/1682 Model completion and validation using inversion of grey box models], ANZIAM J.,54 (CTAC 2012) pp C187–C199. </ref> इस प्रकार, लगभग सभी मॉडल [[ब्लैक बॉक्स]] के विपरीत ग्रे बॉक्स मॉडल हैं जहां कोई मॉडल फॉर्म नहीं माना जाता है या [[व्हाइट बॉक्स (सॉफ्टवेयर इंजीनियरिंग)]] मॉडल जो पूरी तरह से सैद्धांतिक हैं। कुछ मॉडल एक विशेष रूप धारण करते हैं जैसे कि रैखिक प्रतिगमन<ref name="Draper98">{{cite book|first1=Norman R. |last1=Draper|first2=Harry |last2=Smith|title=अनुप्रयुक्त प्रतिगमन विश्लेषण|url={{google books |plainurl=y |id=uSReBAAAQBAJ}}|date=25 August 2014|publisher=John Wiley & Sons|isbn=978-1-118-62568-2|pages=657–}}</ref><ref name="Weisburg05">{{cite book|first=Sanford |last=Weisberg|title=एप्लाइड रैखिक प्रतिगमन|url={{google books |plainurl=y |id=7pg3AgAAQBAJ}}|date=25 November 2013|publisher=Wiley|isbn=978-1-118-59485-8}}</ref> या [[तंत्रिका नेटवर्क]]।<ref name="Heaton12">Heaton, J., 2012. Introduction to the math of neural networks, Heaton Research Inc. (Chesterfield, MO), {{isbn|978-1475190878}}</ref><ref name="Stergiou13">{{cite web |last1=Stergiou |first1=C. |last2=Siganos |first2=D. |year=2013 |title=तंत्रिका - तंत्र|url=http://www.doc.ic.ac.uk/~nd/surprise_96/journal/vol4/cs11/report.html |access-date=2013-07-03 |archive-url=https://web.archive.org/web/20091216110504/http://www.doc.ic.ac.uk/~nd/surprise_96/journal/vol4/cs11/report.html |archive-date=2009-12-16 |url-status=dead }}</ref> इनमें विशेष विश्लेषण विधियाँ हैं। विशेष रूप से रैखिक प्रतिगमन तकनीकों में<ref name="Lawson96">{{cite book|first1=Charles L. |last1=Lawson|first2=Richard |last2=J. Hanson|title=न्यूनतम वर्ग समस्याओं का समाधान|url={{google books |plainurl=y |id=AEwDbHp50FgC}}|date=1 December 1995|publisher=SIAM|isbn=978-0-89871-356-5}}</ref> अधिकांश गैर-रेखीय तकनीकों की तुलना में बहुत अधिक कुशल हैं।<ref name="Press07" >{{cite book | last1= Press| first1= W.H. |last2=Teukolsky |first2=S.A. |last3=Vetterling |first3=W.T. |last4=Flannery |first4=B.P.|title=[[Numerical Recipes]] | edition= 3rd |date= 2007|publisher=Cambridge University Press|isbn=978-0-521-88068-8}}</ref><ref name="Gelman03">{{cite book|first1=Andrew |last1=Gelman|first2=John B. |last2=Carlin|first3=Hal S. |last3=Stern|first4=David B. |last4=Dunson |first5=Aki |last5=Vehtari |first6=Donald B. |last6=Rubin|title=बायेसियन डेटा विश्लेषण, तीसरा संस्करण|url={{google books |plainurl=y |id=ZXL6AQAAQBAJ}}|date=1 November 2013|publisher=CRC Press|isbn=978-1-4398-4095-5}}</ref> मॉडल अपने नियोजित उपयोग के आधार पर नियतात्मक या [[स्टोकेस्टिक]] (अर्थात् यादृच्छिक घटकों से युक्त) हो सकता है। | ||
== मॉडल फॉर्म == | == मॉडल फॉर्म == | ||
सामान्य | सामान्य स्थिति एक गैर-रैखिक मॉडल है जिसमें आंशिक सैद्धांतिक संरचना और डेटा से प्राप्त कुछ अज्ञात भाग होते हैं। विपरीत सैद्धांतिक संरचनाओं वाले मॉडलों का संभवतः [[ तैयार किए हुयी धातु पे पानी चढाने की कला |सिम्युलेटेड एनीलिंग]] या [[आनुवंशिक एल्गोरिदम|जेनेटिक एल्गोरिदम]] का उपयोग करके व्यक्तिगत रूप से मूल्यांकन करने की आवश्यकता है।<ref name="Bohlin06"/><ref name="Mathworks13">Mathworks, 2013. [http://www.mathworks.com.au/help/ident/ug/supported-grey-box-models.html Supported grey box models ]</ref><ref name="Hauth08">{{Citation |last=Hauth |first=J. |year=2008|title=Grey Box Modelling for Nonlinear Systems| url=https://kluedo.ub.uni-kl.de/files/2045/diss.pdf | type= dissertation, [[Kaiserslautern University of Technology]]}}.</ref> | ||
विशेष मॉडल संरचना के | विशेष मॉडल संरचना के अन्दर, [[सिस्टम पहचान]]<ref name="Hauth08"/><ref name="Nash87" >Nash, J.C. and Walker-Smith, M. 1987. Nonlinear parameter estimation, Marcel Dekker, Inc. (New York).</ref> या परिवर्तनीय पैरामीटर संबंधों<ref name="Whiten13" /><ref name="Whiten71">Whiten, W.J., 1971. Model building techniques applied to mineral treatment processes, Symp. on Automatic Control Systems in Mineral Processing Plants, (Australas. Inst. Min. Metall., S. Queensland Branch, Brisbane), 129-148.</ref> को खोजने की आवश्यकता हो सकती है। किसी विशेष संरचना के लिए यह स्वैच्छिक रूप से माना जाता है कि डेटा में फ़ीड वैक्टर '''f''', उत्पाद वैक्टर '''p''', और ऑपरेटिंग स्थिति वैक्टर '''c''' के सेट सम्मिलित हैं।<ref name="Whiten13" /> सामान्यतः '''c''' में '''f''' से निकाले गए मानों के साथ-साथ अन्य मान भी सम्मिलित होंगे। कई स्थितियों में मॉडल को फॉर्म के फ़ंक्शन में परिवर्तित किया जा सकता है:<ref name="Whiten13" /><ref name="Whiten94">Whiten, W.J., 1994. Determination of parameter relations within non-linear models, SIGNUM Newsletter, 29(3–4,) 2–5. 10.1145/192527.192535.</ref><ref name="Whiten14">Whiten, B., 2014. [http://journal.austms.org.au/ojs/index.php/ANZIAMJ/article/view/7767 Determining the form of ordinary differential equations using model inversion], ANZIAM J. 55 (EMAC2013) pp.C329–C347. </ref> | ||
: | : '''m(f,p,q)''' | ||
जहां वेक्टर फ़ंक्शन m डेटा p और मॉडल भविष्यवाणियों के बीच त्रुटियां देता है। वेक्टर q कुछ परिवर्तनीय पैरामीटर देता है जो मॉडल के अज्ञात भाग हैं। | जहां वेक्टर फ़ंक्शन '''m''' डेटा '''p''' और मॉडल भविष्यवाणियों के बीच त्रुटियां देता है। वेक्टर '''q''' कुछ परिवर्तनीय पैरामीटर देता है जो मॉडल के अज्ञात भाग हैं। | ||
पैरामीटर q परिचालन स्थितियों के अनुसार निर्धारित | पैरामीटर '''q''' परिचालन स्थितियों के अनुसार निर्धारित विधि से भिन्न होते हैं।<ref name="Whiten13"/><ref name="Whiten94"/> इस संबंध को '''q = Ac''' के रूप में निर्दिष्ट किया जा सकता है जहां '''A''' अज्ञात गुणांकों का एक मैट्रिक्स है, और रैखिक प्रतिगमन में '''c''' में मूल परिचालन स्थितियों और '''q''' के बीच गैर-रैखिक संबंध<ref name="Draper98"/><ref name="Weisburg05"/> प्राप्त करने के लिए मूल परिचालन स्थितियों के एक स्थिर शब्द और संभवतः रूपांतरित मान सम्मिलित हैं।<ref name="Wikipolynomial">[[Polynomial]]</ref><ref name="Wikispline">[[Spline (mathematics)]]</ref> फिर यह चुनने की स्थिति है कि '''A''' में कौन से पद गैर-शून्य हैं और उनके मान निर्दिष्ट करें। '''A''' में गैर-शून्य मान निर्धारित करने के लिए मॉडल पूर्णता [[गणितीय अनुकूलन]] समस्या बन जाती है जो डेटा पर त्रुटि शर्तों '''m(f,p,Ac)''' को कम करती है।<ref name="Bohlin06"/><ref name="Whiten71"/><ref name="Kojovic94" >Kojovic, T., and Whiten W. J., 1994. Evaluation of the quality of simulation models, Innovations in mineral processing, (Lauretian University, Sudbury) pp 437–446. {{isbn|088667025X}}</ref><ref name="Kojovic89">Kojovic, T., 1989. The development and application of Model - an automated model builder for mineral processing, PhD thesis, The University of Queensland.</ref><ref name="Xiao98">Xiao, J., 1998. Extensions of model building techniques and their applications in mineral processing, PhD thesis, The University of Queensland.</ref> | ||
== मॉडल पूर्णता == | == मॉडल पूर्णता == | ||
बार गैर-शून्य मानों का चयन हो जाने के बाद, ए में शेष गुणांक को डेटा के संबंध में ''m''(''f'',''p'',''Ac'') को कम करके निर्धारित किया जा सकता है। ए में गैर-शून्य मानों के लिए, | बार गैर-शून्य मानों का चयन हो जाने के बाद, ए में शेष गुणांक को डेटा के संबंध में ''m''(''f'',''p'',''Ac'') को कम करके निर्धारित किया जा सकता है। ए में गैर-शून्य मानों के लिए, सामान्यतः [[गैर-रैखिक न्यूनतम वर्ग]]ों द्वारा। गैर-शून्य शब्दों का चयन अनुकूलन विधियों जैसे सिम्युलेटेड एनीलिंग और [[विकासवादी एल्गोरिदम]] द्वारा किया जा सकता है। इसके अलावा गैर-रैखिक न्यूनतम वर्ग सटीकता अनुमान प्रदान कर सकते हैं<ref name="Press07" /><ref name="Nash87" />ए के तत्वों के लिए जिसका उपयोग यह निर्धारित करने के लिए किया जा सकता है कि क्या वे शून्य से काफी भिन्न हैं, इस प्रकार [[मॉडल चयन]] की विधि प्रदान की जाती है।<ref name="Linhart86">{{cite book|first1=H. |last1=Linhart|first2=W. |last2=Zucchini|title=मॉडल चयन|url={{google books |plainurl=y |id=fzDm34Z8ctUC}}|year=1986|publisher=Wiley|isbn=978-0-471-83722-0}}</ref><ref name="Miller02">{{cite book|first=Alan |last=Miller|title=प्रतिगमन में सबसेट चयन|url={{google books |plainurl=y |id=V-vLBQAAQBAJ}}|date=15 April 2002|publisher=CRC Press|isbn=978-1-4200-3593-3}}</ref> | ||
कभी-कभी प्रत्येक डेटा सेट के लिए सीधे या गैर-रेखीय न्यूनतम वर्गों द्वारा q के मानों की गणना करना संभव होता है। फिर अधिक कुशल रैखिक प्रतिगमन का उपयोग सी का उपयोग करके क्यू की भविष्यवाणी करने के लिए किया जा सकता है, इस प्रकार ए में गैर-शून्य मानों का चयन किया जा सकता है और उनके मूल्यों का अनुमान लगाया जा सकता है। बार जब गैर-शून्य मान स्थित हो जाते हैं तो इन मानों को परिष्कृत करने के लिए मूल मॉडल m(f,p,Ac) पर गैर-रेखीय न्यूनतम वर्गों का उपयोग किया जा सकता है।<ref name="Whiten71"/><ref name="Kojovic94"/><ref name="Kojovic89"/> | कभी-कभी प्रत्येक डेटा सेट के लिए सीधे या गैर-रेखीय न्यूनतम वर्गों द्वारा q के मानों की गणना करना संभव होता है। फिर अधिक कुशल रैखिक प्रतिगमन का उपयोग सी का उपयोग करके क्यू की भविष्यवाणी करने के लिए किया जा सकता है, इस प्रकार ए में गैर-शून्य मानों का चयन किया जा सकता है और उनके मूल्यों का अनुमान लगाया जा सकता है। बार जब गैर-शून्य मान स्थित हो जाते हैं तो इन मानों को परिष्कृत करने के लिए मूल मॉडल m(f,p,Ac) पर गैर-रेखीय न्यूनतम वर्गों का उपयोग किया जा सकता है।<ref name="Whiten71"/><ref name="Kojovic94"/><ref name="Kojovic89"/> | ||
Line 29: | Line 29: | ||
जहां पर्याप्त डेटा उपलब्ध है, डेटा को अलग मॉडल निर्माण सेट में विभाजित करने और या दो [[क्रॉस-सत्यापन (सांख्यिकी)]] की सिफारिश की जाती है। इसे निर्माण सेट और [[बूटस्ट्रैप एकत्रीकरण]] के कई चयनों का उपयोग करके दोहराया जा सकता है या भविष्यवाणी अंतर का मूल्यांकन करने के लिए उपयोग किया जा सकता है। | जहां पर्याप्त डेटा उपलब्ध है, डेटा को अलग मॉडल निर्माण सेट में विभाजित करने और या दो [[क्रॉस-सत्यापन (सांख्यिकी)]] की सिफारिश की जाती है। इसे निर्माण सेट और [[बूटस्ट्रैप एकत्रीकरण]] के कई चयनों का उपयोग करके दोहराया जा सकता है या भविष्यवाणी अंतर का मूल्यांकन करने के लिए उपयोग किया जा सकता है। | ||
अवशेषों पर ची-स्क्वायर वितरण|ची-स्क्वायर जैसा सांख्यिकीय परीक्षण विशेष रूप से उपयोगी नहीं है।<ref name="Deming2000">{{cite book|first=William Edwards | last = Deming|title=Out of the Crisis p272|url={{google books |plainurl=y |id=LA15eDlOPgoC |page=272}}|year=2000|publisher=MIT Press|isbn=978-0-262-54115-2}}</ref> ची स्क्वॉयर परीक्षण के लिए ज्ञात मानक विचलन की आवश्यकता होती है जो शायद ही कभी उपलब्ध होते हैं, और असफल परीक्षण इस बात का कोई संकेत नहीं देते हैं कि मॉडल को कैसे सुधारा जाए।<ref name="Press07" /> नेस्टेड और नॉन नेस्टेड दोनों मॉडलों की तुलना करने के लिए कई तरीके हैं। इनमें दोहराए गए डेटा के साथ मॉडल भविष्यवाणियों की तुलना | अवशेषों पर ची-स्क्वायर वितरण|ची-स्क्वायर जैसा सांख्यिकीय परीक्षण विशेष रूप से उपयोगी नहीं है।<ref name="Deming2000">{{cite book|first=William Edwards | last = Deming|title=Out of the Crisis p272|url={{google books |plainurl=y |id=LA15eDlOPgoC |page=272}}|year=2000|publisher=MIT Press|isbn=978-0-262-54115-2}}</ref> ची स्क्वॉयर परीक्षण के लिए ज्ञात मानक विचलन की आवश्यकता होती है जो शायद ही कभी उपलब्ध होते हैं, और असफल परीक्षण इस बात का कोई संकेत नहीं देते हैं कि मॉडल को कैसे सुधारा जाए।<ref name="Press07" /> नेस्टेड और नॉन नेस्टेड दोनों मॉडलों की तुलना करने के लिए कई तरीके हैं। इनमें दोहराए गए डेटा के साथ मॉडल भविष्यवाणियों की तुलना सम्मिलित है। | ||
रैखिक प्रतिगमन का उपयोग करके परिचालन स्थितियों सी के साथ अवशिष्ट एम (,) की भविष्यवाणी करने का प्रयास दिखाएगा कि क्या अवशिष्ट की भविष्यवाणी की जा सकती है।<ref name="Kojovic94" /><ref name="Kojovic89"/>जिन अवशेषों की भविष्यवाणी नहीं की जा सकती, वे वर्तमान परिचालन स्थितियों का उपयोग करके मॉडल में सुधार की बहुत कम संभावना पेश करते हैं।<ref name="Whiten13" />वे शर्तें जो अवशिष्टों की भविष्यवाणी करती हैं, मॉडल के प्रदर्शन को बेहतर बनाने के लिए उसे इसमें | रैखिक प्रतिगमन का उपयोग करके परिचालन स्थितियों सी के साथ अवशिष्ट एम (,) की भविष्यवाणी करने का प्रयास दिखाएगा कि क्या अवशिष्ट की भविष्यवाणी की जा सकती है।<ref name="Kojovic94" /><ref name="Kojovic89"/>जिन अवशेषों की भविष्यवाणी नहीं की जा सकती, वे वर्तमान परिचालन स्थितियों का उपयोग करके मॉडल में सुधार की बहुत कम संभावना पेश करते हैं।<ref name="Whiten13" />वे शर्तें जो अवशिष्टों की भविष्यवाणी करती हैं, मॉडल के प्रदर्शन को बेहतर बनाने के लिए उसे इसमें सम्मिलित करने के लिए संभावित शर्तें हैं।<ref name="Kojovic94" /> | ||
उपरोक्त मॉडल व्युत्क्रम तकनीक का उपयोग यह निर्धारित करने की विधि के रूप में किया जा सकता है कि किसी मॉडल में सुधार किया जा सकता है या नहीं। इस मामले में गैर-शून्य शब्दों का चयन इतना महत्वपूर्ण नहीं है और [[डिज़ाइन मैट्रिक्स]] के महत्वपूर्ण [[eigenvectors]] का उपयोग करके रैखिक भविष्यवाणी की जा सकती है। मॉडल त्रुटियों में सुधार का आकलन करने के लिए इस तरीके से निर्धारित ए में मूल्यों को नॉनलाइनियर मॉडल में प्रतिस्थापित करने की आवश्यकता है। महत्वपूर्ण सुधार की अनुपस्थिति इंगित करती है कि उपलब्ध डेटा परिभाषित मापदंडों का उपयोग करके वर्तमान मॉडल फॉर्म में सुधार करने में सक्षम नहीं है।<ref name="Whiten13" />इस परीक्षण को अधिक व्यापक बनाने के लिए मॉडल में अतिरिक्त पैरामीटर डाले जा सकते हैं। | उपरोक्त मॉडल व्युत्क्रम तकनीक का उपयोग यह निर्धारित करने की विधि के रूप में किया जा सकता है कि किसी मॉडल में सुधार किया जा सकता है या नहीं। इस मामले में गैर-शून्य शब्दों का चयन इतना महत्वपूर्ण नहीं है और [[डिज़ाइन मैट्रिक्स]] के महत्वपूर्ण [[eigenvectors]] का उपयोग करके रैखिक भविष्यवाणी की जा सकती है। मॉडल त्रुटियों में सुधार का आकलन करने के लिए इस तरीके से निर्धारित ए में मूल्यों को नॉनलाइनियर मॉडल में प्रतिस्थापित करने की आवश्यकता है। महत्वपूर्ण सुधार की अनुपस्थिति इंगित करती है कि उपलब्ध डेटा परिभाषित मापदंडों का उपयोग करके वर्तमान मॉडल फॉर्म में सुधार करने में सक्षम नहीं है।<ref name="Whiten13" />इस परीक्षण को अधिक व्यापक बनाने के लिए मॉडल में अतिरिक्त पैरामीटर डाले जा सकते हैं। |
Revision as of 19:46, 10 July 2023
गणित, सांख्यिकी और कम्प्यूटेशनल मॉडलिंग में, एक ग्रे बॉक्स मॉडल[1][2][3][4] मॉडल को पूरा करने के लिए डेटा के साथ आंशिक सैद्धांतिक संरचना को जोड़ता है। सैद्धांतिक संरचना परिणामों की सहजता पर जानकारी से लेकर उन मॉडलों तक भिन्न हो सकती है जिन्हें डेटा या वर्तमान साहित्य से केवल पैरामीटर मानों की आवश्यकता होती है।[5] इस प्रकार, लगभग सभी मॉडल ब्लैक बॉक्स के विपरीत ग्रे बॉक्स मॉडल हैं जहां कोई मॉडल फॉर्म नहीं माना जाता है या व्हाइट बॉक्स (सॉफ्टवेयर इंजीनियरिंग) मॉडल जो पूरी तरह से सैद्धांतिक हैं। कुछ मॉडल एक विशेष रूप धारण करते हैं जैसे कि रैखिक प्रतिगमन[6][7] या तंत्रिका नेटवर्क।[8][9] इनमें विशेष विश्लेषण विधियाँ हैं। विशेष रूप से रैखिक प्रतिगमन तकनीकों में[10] अधिकांश गैर-रेखीय तकनीकों की तुलना में बहुत अधिक कुशल हैं।[11][12] मॉडल अपने नियोजित उपयोग के आधार पर नियतात्मक या स्टोकेस्टिक (अर्थात् यादृच्छिक घटकों से युक्त) हो सकता है।
मॉडल फॉर्म
सामान्य स्थिति एक गैर-रैखिक मॉडल है जिसमें आंशिक सैद्धांतिक संरचना और डेटा से प्राप्त कुछ अज्ञात भाग होते हैं। विपरीत सैद्धांतिक संरचनाओं वाले मॉडलों का संभवतः सिम्युलेटेड एनीलिंग या जेनेटिक एल्गोरिदम का उपयोग करके व्यक्तिगत रूप से मूल्यांकन करने की आवश्यकता है।[1][13][14]
विशेष मॉडल संरचना के अन्दर, सिस्टम पहचान[14][15] या परिवर्तनीय पैरामीटर संबंधों[5][16] को खोजने की आवश्यकता हो सकती है। किसी विशेष संरचना के लिए यह स्वैच्छिक रूप से माना जाता है कि डेटा में फ़ीड वैक्टर f, उत्पाद वैक्टर p, और ऑपरेटिंग स्थिति वैक्टर c के सेट सम्मिलित हैं।[5] सामान्यतः c में f से निकाले गए मानों के साथ-साथ अन्य मान भी सम्मिलित होंगे। कई स्थितियों में मॉडल को फॉर्म के फ़ंक्शन में परिवर्तित किया जा सकता है:[5][17][18]
- m(f,p,q)
जहां वेक्टर फ़ंक्शन m डेटा p और मॉडल भविष्यवाणियों के बीच त्रुटियां देता है। वेक्टर q कुछ परिवर्तनीय पैरामीटर देता है जो मॉडल के अज्ञात भाग हैं।
पैरामीटर q परिचालन स्थितियों के अनुसार निर्धारित विधि से भिन्न होते हैं।[5][17] इस संबंध को q = Ac के रूप में निर्दिष्ट किया जा सकता है जहां A अज्ञात गुणांकों का एक मैट्रिक्स है, और रैखिक प्रतिगमन में c में मूल परिचालन स्थितियों और q के बीच गैर-रैखिक संबंध[6][7] प्राप्त करने के लिए मूल परिचालन स्थितियों के एक स्थिर शब्द और संभवतः रूपांतरित मान सम्मिलित हैं।[19][20] फिर यह चुनने की स्थिति है कि A में कौन से पद गैर-शून्य हैं और उनके मान निर्दिष्ट करें। A में गैर-शून्य मान निर्धारित करने के लिए मॉडल पूर्णता गणितीय अनुकूलन समस्या बन जाती है जो डेटा पर त्रुटि शर्तों m(f,p,Ac) को कम करती है।[1][16][21][22][23]
मॉडल पूर्णता
बार गैर-शून्य मानों का चयन हो जाने के बाद, ए में शेष गुणांक को डेटा के संबंध में m(f,p,Ac) को कम करके निर्धारित किया जा सकता है। ए में गैर-शून्य मानों के लिए, सामान्यतः गैर-रैखिक न्यूनतम वर्गों द्वारा। गैर-शून्य शब्दों का चयन अनुकूलन विधियों जैसे सिम्युलेटेड एनीलिंग और विकासवादी एल्गोरिदम द्वारा किया जा सकता है। इसके अलावा गैर-रैखिक न्यूनतम वर्ग सटीकता अनुमान प्रदान कर सकते हैं[11][15]ए के तत्वों के लिए जिसका उपयोग यह निर्धारित करने के लिए किया जा सकता है कि क्या वे शून्य से काफी भिन्न हैं, इस प्रकार मॉडल चयन की विधि प्रदान की जाती है।[24][25] कभी-कभी प्रत्येक डेटा सेट के लिए सीधे या गैर-रेखीय न्यूनतम वर्गों द्वारा q के मानों की गणना करना संभव होता है। फिर अधिक कुशल रैखिक प्रतिगमन का उपयोग सी का उपयोग करके क्यू की भविष्यवाणी करने के लिए किया जा सकता है, इस प्रकार ए में गैर-शून्य मानों का चयन किया जा सकता है और उनके मूल्यों का अनुमान लगाया जा सकता है। बार जब गैर-शून्य मान स्थित हो जाते हैं तो इन मानों को परिष्कृत करने के लिए मूल मॉडल m(f,p,Ac) पर गैर-रेखीय न्यूनतम वर्गों का उपयोग किया जा सकता है।[16][21][22]
तीसरी विधि मॉडल व्युत्क्रम है,[5][17][18]जो ए के तत्वों में गैर-रैखिक एम (एफ, पी, एसी) को अनुमानित रैखिक रूप में परिवर्तित करता है, जिसे कुशल शब्द चयन का उपयोग करके जांच की जा सकती है[24][25]और रैखिक प्रतिगमन का मूल्यांकन।[10] एकल q मान (q = a) के सरल मामले के लिएTc) और q का अनुमान q*। dq=a लगानाTc − q* देता है
- एम(एफ,पी,एटीसी) = एम(एफ,पी,क्यू* + डीक्यू) ≈ एम(एफ,पी.क्यू*) + डीक्यू एम'(एफ,पी,क्यू*) = एम(एफ,पी.क्यू*) + (एटीc − q*) m'(f,p,q*)
ताकि एटीअब अन्य सभी ज्ञात शब्दों के साथ रैखिक स्थिति में है, और इस प्रकार रैखिक प्रतिगमन तकनीकों द्वारा इसका विश्लेषण किया जा सकता है। से अधिक पैरामीटर के लिए विधि प्रत्यक्ष तरीके से विस्तारित होती है।[5][18][17]यह जांचने के बाद कि मॉडल में सुधार हुआ है, इस प्रक्रिया को अभिसरण तक दोहराया जा सकता है। इस दृष्टिकोण के फायदे यह हैं कि इसे व्यक्तिगत डेटा सेट से निर्धारित करने में सक्षम होने के लिए पैरामीटर q की आवश्यकता नहीं होती है और रैखिक प्रतिगमन मूल त्रुटि शर्तों पर होता है[5]
मॉडल सत्यापन
जहां पर्याप्त डेटा उपलब्ध है, डेटा को अलग मॉडल निर्माण सेट में विभाजित करने और या दो क्रॉस-सत्यापन (सांख्यिकी) की सिफारिश की जाती है। इसे निर्माण सेट और बूटस्ट्रैप एकत्रीकरण के कई चयनों का उपयोग करके दोहराया जा सकता है या भविष्यवाणी अंतर का मूल्यांकन करने के लिए उपयोग किया जा सकता है।
अवशेषों पर ची-स्क्वायर वितरण|ची-स्क्वायर जैसा सांख्यिकीय परीक्षण विशेष रूप से उपयोगी नहीं है।[26] ची स्क्वॉयर परीक्षण के लिए ज्ञात मानक विचलन की आवश्यकता होती है जो शायद ही कभी उपलब्ध होते हैं, और असफल परीक्षण इस बात का कोई संकेत नहीं देते हैं कि मॉडल को कैसे सुधारा जाए।[11] नेस्टेड और नॉन नेस्टेड दोनों मॉडलों की तुलना करने के लिए कई तरीके हैं। इनमें दोहराए गए डेटा के साथ मॉडल भविष्यवाणियों की तुलना सम्मिलित है।
रैखिक प्रतिगमन का उपयोग करके परिचालन स्थितियों सी के साथ अवशिष्ट एम (,) की भविष्यवाणी करने का प्रयास दिखाएगा कि क्या अवशिष्ट की भविष्यवाणी की जा सकती है।[21][22]जिन अवशेषों की भविष्यवाणी नहीं की जा सकती, वे वर्तमान परिचालन स्थितियों का उपयोग करके मॉडल में सुधार की बहुत कम संभावना पेश करते हैं।[5]वे शर्तें जो अवशिष्टों की भविष्यवाणी करती हैं, मॉडल के प्रदर्शन को बेहतर बनाने के लिए उसे इसमें सम्मिलित करने के लिए संभावित शर्तें हैं।[21]
उपरोक्त मॉडल व्युत्क्रम तकनीक का उपयोग यह निर्धारित करने की विधि के रूप में किया जा सकता है कि किसी मॉडल में सुधार किया जा सकता है या नहीं। इस मामले में गैर-शून्य शब्दों का चयन इतना महत्वपूर्ण नहीं है और डिज़ाइन मैट्रिक्स के महत्वपूर्ण eigenvectors का उपयोग करके रैखिक भविष्यवाणी की जा सकती है। मॉडल त्रुटियों में सुधार का आकलन करने के लिए इस तरीके से निर्धारित ए में मूल्यों को नॉनलाइनियर मॉडल में प्रतिस्थापित करने की आवश्यकता है। महत्वपूर्ण सुधार की अनुपस्थिति इंगित करती है कि उपलब्ध डेटा परिभाषित मापदंडों का उपयोग करके वर्तमान मॉडल फॉर्म में सुधार करने में सक्षम नहीं है।[5]इस परीक्षण को अधिक व्यापक बनाने के लिए मॉडल में अतिरिक्त पैरामीटर डाले जा सकते हैं।
यह भी देखें
संदर्भ
- ↑ 1.0 1.1 1.2 Bohlin, Torsten P. (7 September 2006). Practical Grey-box Process Identification: Theory and Applications. Springer Science & Business Media. ISBN 978-1-84628-403-8.
- ↑ "ग्रे-बॉक्स मॉडल अनुमान". Mathworks 2. 2012.
- ↑ Kroll, Andreas (2000). Grey-box models: Concepts and application. In: New Frontiers in Computational Intelligence and its Applications, vol.57 of Frontiers in artificial intelligence and applications, pp. 42-51. IOS Press, Amsterdam.
- ↑ Sohlberg, B., and Jacobsen, E.W., 2008. Grey box modelling - branches and experiences, Proc. 17th World Congress, Int. Federation of Automatic Control, Seoul. pp 11415-11420
- ↑ 5.0 5.1 5.2 5.3 5.4 5.5 5.6 5.7 5.8 5.9 Whiten, B., 2013. Model completion and validation using inversion of grey box models, ANZIAM J.,54 (CTAC 2012) pp C187–C199.
- ↑ 6.0 6.1 Draper, Norman R.; Smith, Harry (25 August 2014). अनुप्रयुक्त प्रतिगमन विश्लेषण. John Wiley & Sons. pp. 657–. ISBN 978-1-118-62568-2.
- ↑ 7.0 7.1 Weisberg, Sanford (25 November 2013). एप्लाइड रैखिक प्रतिगमन. Wiley. ISBN 978-1-118-59485-8.
- ↑ Heaton, J., 2012. Introduction to the math of neural networks, Heaton Research Inc. (Chesterfield, MO), ISBN 978-1475190878
- ↑ Stergiou, C.; Siganos, D. (2013). "तंत्रिका - तंत्र". Archived from the original on 2009-12-16. Retrieved 2013-07-03.
- ↑ 10.0 10.1 Lawson, Charles L.; J. Hanson, Richard (1 December 1995). न्यूनतम वर्ग समस्याओं का समाधान. SIAM. ISBN 978-0-89871-356-5.
- ↑ 11.0 11.1 11.2 Press, W.H.; Teukolsky, S.A.; Vetterling, W.T.; Flannery, B.P. (2007). Numerical Recipes (3rd ed.). Cambridge University Press. ISBN 978-0-521-88068-8.
- ↑ Gelman, Andrew; Carlin, John B.; Stern, Hal S.; Dunson, David B.; Vehtari, Aki; Rubin, Donald B. (1 November 2013). बायेसियन डेटा विश्लेषण, तीसरा संस्करण. CRC Press. ISBN 978-1-4398-4095-5.
- ↑ Mathworks, 2013. Supported grey box models
- ↑ 14.0 14.1 Hauth, J. (2008), Grey Box Modelling for Nonlinear Systems (PDF) (dissertation, Kaiserslautern University of Technology).
- ↑ 15.0 15.1 Nash, J.C. and Walker-Smith, M. 1987. Nonlinear parameter estimation, Marcel Dekker, Inc. (New York).
- ↑ 16.0 16.1 16.2 Whiten, W.J., 1971. Model building techniques applied to mineral treatment processes, Symp. on Automatic Control Systems in Mineral Processing Plants, (Australas. Inst. Min. Metall., S. Queensland Branch, Brisbane), 129-148.
- ↑ 17.0 17.1 17.2 17.3 Whiten, W.J., 1994. Determination of parameter relations within non-linear models, SIGNUM Newsletter, 29(3–4,) 2–5. 10.1145/192527.192535.
- ↑ 18.0 18.1 18.2 Whiten, B., 2014. Determining the form of ordinary differential equations using model inversion, ANZIAM J. 55 (EMAC2013) pp.C329–C347.
- ↑ Polynomial
- ↑ Spline (mathematics)
- ↑ 21.0 21.1 21.2 21.3 Kojovic, T., and Whiten W. J., 1994. Evaluation of the quality of simulation models, Innovations in mineral processing, (Lauretian University, Sudbury) pp 437–446. ISBN 088667025X
- ↑ 22.0 22.1 22.2 Kojovic, T., 1989. The development and application of Model - an automated model builder for mineral processing, PhD thesis, The University of Queensland.
- ↑ Xiao, J., 1998. Extensions of model building techniques and their applications in mineral processing, PhD thesis, The University of Queensland.
- ↑ 24.0 24.1 Linhart, H.; Zucchini, W. (1986). मॉडल चयन. Wiley. ISBN 978-0-471-83722-0.
- ↑ 25.0 25.1 Miller, Alan (15 April 2002). प्रतिगमन में सबसेट चयन. CRC Press. ISBN 978-1-4200-3593-3.
- ↑ Deming, William Edwards (2000). Out of the Crisis p272. MIT Press. ISBN 978-0-262-54115-2.