ग्रे बॉक्स मॉडल

From Vigyanwiki

गणित, सांख्यिकी और कम्प्यूटेशनल मॉडलिंग में, एक ग्रे बॉक्स मॉडल[1][2][3][4] मॉडल को पूरा करने के लिए डेटा के साथ आंशिक सैद्धांतिक संरचना को जोड़ता है। सैद्धांतिक संरचना परिणामों की सहजता पर जानकारी से लेकर उन मॉडलों तक भिन्न हो सकती है जिन्हें डेटा या वर्तमान साहित्य से केवल पैरामीटर मानों की आवश्यकता होती है।[5] इस प्रकार, लगभग सभी मॉडल ब्लैक बॉक्स के विपरीत ग्रे बॉक्स मॉडल हैं जहां कोई मॉडल फॉर्म नहीं माना जाता है या व्हाइट बॉक्स (सॉफ्टवेयर इंजीनियरिंग) मॉडल जो पूरी तरह से सैद्धांतिक हैं। कुछ मॉडल एक विशेष रूप धारण करते हैं जैसे कि रैखिक प्रतिगमन[6][7] या तंत्रिका नेटवर्क[8][9] इनमें विशेष विश्लेषण विधियाँ हैं। विशेष रूप से रैखिक प्रतिगमन तकनीकों में[10] अधिकांश गैर-रेखीय तकनीकों की तुलना में बहुत अधिक कुशल हैं।[11][12] मॉडल अपने नियोजित उपयोग के आधार पर नियतात्मक या स्टोकेस्टिक (अर्थात् यादृच्छिक घटकों से युक्त) हो सकता है।

मॉडल फॉर्म

सामान्य स्थिति एक गैर-रैखिक मॉडल है जिसमें आंशिक सैद्धांतिक संरचना और डेटा से प्राप्त कुछ अज्ञात भाग होते हैं। विपरीत सैद्धांतिक संरचनाओं वाले मॉडलों का संभवतः सिम्युलेटेड एनीलिंग या जेनेटिक एल्गोरिदम का उपयोग करके व्यक्तिगत रूप से मूल्यांकन करने की आवश्यकता है।[1][13][14]

विशेष मॉडल संरचना के अन्दर, सिस्टम पहचान[14][15] या परिवर्तनीय पैरामीटर संबंधों[5][16] को खोजने की आवश्यकता हो सकती है। किसी विशेष संरचना के लिए यह स्वैच्छिक रूप से माना जाता है कि डेटा में फ़ीड वैक्टर f, उत्पाद वैक्टर p, और ऑपरेटिंग स्थिति वैक्टर c के सेट सम्मिलित हैं।[5] सामान्यतः c में f से निकाले गए मानों के साथ-साथ अन्य मान भी सम्मिलित होंगे। कई स्थितियों में मॉडल को फॉर्म के फ़ंक्शन में परिवर्तित किया जा सकता है:[5][17][18]

m(f,p,q)

जहां वेक्टर फ़ंक्शन m डेटा p और मॉडल भविष्यवाणियों के बीच त्रुटियां देता है। वेक्टर q कुछ परिवर्तनीय पैरामीटर देता है जो मॉडल के अज्ञात भाग हैं।

पैरामीटर q परिचालन स्थितियों के अनुसार निर्धारित विधि से भिन्न होते हैं।[5][17] इस संबंध को q = Ac के रूप में निर्दिष्ट किया जा सकता है जहां A अज्ञात गुणांकों का एक मैट्रिक्स है, और रैखिक प्रतिगमन में c में मूल परिचालन स्थितियों और q के बीच गैर-रैखिक संबंध[6][7] प्राप्त करने के लिए मूल परिचालन स्थितियों के एक स्थिर शब्द और संभवतः रूपांतरित मान सम्मिलित हैं।[19][20] फिर यह चुनने की स्थिति है कि A में कौन से पद गैर-शून्य हैं और उनके मान निर्दिष्ट करें। A में गैर-शून्य मान निर्धारित करने के लिए मॉडल पूर्णता गणितीय अनुकूलन समस्या बन जाती है जो डेटा पर त्रुटि शर्तों m(f,p,Ac) को कम करती है।[1][16][21][22][23]


मॉडल पूर्णता

बार गैर-शून्य मानों का चयन हो जाने के बाद, ए में शेष गुणांक को डेटा के संबंध में m(f,p,Ac) को कम करके निर्धारित किया जा सकता है। ए में गैर-शून्य मानों के लिए, सामान्यतः गैर-रैखिक न्यूनतम वर्गों द्वारा। गैर-शून्य शब्दों का चयन अनुकूलन विधियों जैसे सिम्युलेटेड एनीलिंग और विकासवादी एल्गोरिदम द्वारा किया जा सकता है। इसके अलावा गैर-रैखिक न्यूनतम वर्ग सटीकता अनुमान प्रदान कर सकते हैं[11][15]ए के तत्वों के लिए जिसका उपयोग यह निर्धारित करने के लिए किया जा सकता है कि क्या वे शून्य से काफी भिन्न हैं, इस प्रकार मॉडल चयन की विधि प्रदान की जाती है।[24][25] कभी-कभी प्रत्येक डेटा सेट के लिए सीधे या गैर-रेखीय न्यूनतम वर्गों द्वारा q के मानों की गणना करना संभव होता है। फिर अधिक कुशल रैखिक प्रतिगमन का उपयोग सी का उपयोग करके क्यू की भविष्यवाणी करने के लिए किया जा सकता है, इस प्रकार ए में गैर-शून्य मानों का चयन किया जा सकता है और उनके मूल्यों का अनुमान लगाया जा सकता है। बार जब गैर-शून्य मान स्थित हो जाते हैं तो इन मानों को परिष्कृत करने के लिए मूल मॉडल m(f,p,Ac) पर गैर-रेखीय न्यूनतम वर्गों का उपयोग किया जा सकता है।[16][21][22]

तीसरी विधि मॉडल व्युत्क्रम है,[5][17][18]जो ए के तत्वों में गैर-रैखिक एम (एफ, पी, एसी) को अनुमानित रैखिक रूप में परिवर्तित करता है, जिसे कुशल शब्द चयन का उपयोग करके जांच की जा सकती है[24][25]और रैखिक प्रतिगमन का मूल्यांकन।[10] एकल q मान (q = a) के सरल मामले के लिएTc) और q का अनुमान q*। dq=a लगानाTc − q* देता है

एम(एफ,पी,एटीसी) = एम(एफ,पी,क्यू* + डीक्यू) ≈ एम(एफ,पी.क्यू*) + डीक्यू एम'(एफ,पी,क्यू*) = एम(एफ,पी.क्यू*) + (एटीc − q*) m'(f,p,q*)

ताकि एटीअब अन्य सभी ज्ञात शब्दों के साथ रैखिक स्थिति में है, और इस प्रकार रैखिक प्रतिगमन तकनीकों द्वारा इसका विश्लेषण किया जा सकता है। से अधिक पैरामीटर के लिए विधि प्रत्यक्ष तरीके से विस्तारित होती है।[5][18][17]यह जांचने के बाद कि मॉडल में सुधार हुआ है, इस प्रक्रिया को अभिसरण तक दोहराया जा सकता है। इस दृष्टिकोण के फायदे यह हैं कि इसे व्यक्तिगत डेटा सेट से निर्धारित करने में सक्षम होने के लिए पैरामीटर q की आवश्यकता नहीं होती है और रैखिक प्रतिगमन मूल त्रुटि शर्तों पर होता है[5]


मॉडल सत्यापन

जहां पर्याप्त डेटा उपलब्ध है, डेटा को अलग मॉडल निर्माण सेट में विभाजित करने और या दो क्रॉस-सत्यापन (सांख्यिकी) की सिफारिश की जाती है। इसे निर्माण सेट और बूटस्ट्रैप एकत्रीकरण के कई चयनों का उपयोग करके दोहराया जा सकता है या भविष्यवाणी अंतर का मूल्यांकन करने के लिए उपयोग किया जा सकता है।

अवशेषों पर ची-स्क्वायर वितरण|ची-स्क्वायर जैसा सांख्यिकीय परीक्षण विशेष रूप से उपयोगी नहीं है।[26] ची स्क्वॉयर परीक्षण के लिए ज्ञात मानक विचलन की आवश्यकता होती है जो शायद ही कभी उपलब्ध होते हैं, और असफल परीक्षण इस बात का कोई संकेत नहीं देते हैं कि मॉडल को कैसे सुधारा जाए।[11] नेस्टेड और नॉन नेस्टेड दोनों मॉडलों की तुलना करने के लिए कई तरीके हैं। इनमें दोहराए गए डेटा के साथ मॉडल भविष्यवाणियों की तुलना सम्मिलित है।

रैखिक प्रतिगमन का उपयोग करके परिचालन स्थितियों सी के साथ अवशिष्ट एम (,) की भविष्यवाणी करने का प्रयास दिखाएगा कि क्या अवशिष्ट की भविष्यवाणी की जा सकती है।[21][22]जिन अवशेषों की भविष्यवाणी नहीं की जा सकती, वे वर्तमान परिचालन स्थितियों का उपयोग करके मॉडल में सुधार की बहुत कम संभावना पेश करते हैं।[5]वे शर्तें जो अवशिष्टों की भविष्यवाणी करती हैं, मॉडल के प्रदर्शन को बेहतर बनाने के लिए उसे इसमें सम्मिलित करने के लिए संभावित शर्तें हैं।[21]

उपरोक्त मॉडल व्युत्क्रम तकनीक का उपयोग यह निर्धारित करने की विधि के रूप में किया जा सकता है कि किसी मॉडल में सुधार किया जा सकता है या नहीं। इस मामले में गैर-शून्य शब्दों का चयन इतना महत्वपूर्ण नहीं है और डिज़ाइन मैट्रिक्स के महत्वपूर्ण eigenvectors का उपयोग करके रैखिक भविष्यवाणी की जा सकती है। मॉडल त्रुटियों में सुधार का आकलन करने के लिए इस तरीके से निर्धारित ए में मूल्यों को नॉनलाइनियर मॉडल में प्रतिस्थापित करने की आवश्यकता है। महत्वपूर्ण सुधार की अनुपस्थिति इंगित करती है कि उपलब्ध डेटा परिभाषित मापदंडों का उपयोग करके वर्तमान मॉडल फॉर्म में सुधार करने में सक्षम नहीं है।[5]इस परीक्षण को अधिक व्यापक बनाने के लिए मॉडल में अतिरिक्त पैरामीटर डाले जा सकते हैं।

यह भी देखें

संदर्भ

  1. 1.0 1.1 1.2 Bohlin, Torsten P. (7 September 2006). Practical Grey-box Process Identification: Theory and Applications. Springer Science & Business Media. ISBN 978-1-84628-403-8.
  2. "ग्रे-बॉक्स मॉडल अनुमान". Mathworks 2. 2012.
  3. Kroll, Andreas (2000). Grey-box models: Concepts and application. In: New Frontiers in Computational Intelligence and its Applications, vol.57 of Frontiers in artificial intelligence and applications, pp. 42-51. IOS Press, Amsterdam.
  4. Sohlberg, B., and Jacobsen, E.W., 2008. Grey box modelling - branches and experiences, Proc. 17th World Congress, Int. Federation of Automatic Control, Seoul. pp 11415-11420
  5. 5.0 5.1 5.2 5.3 5.4 5.5 5.6 5.7 5.8 5.9 Whiten, B., 2013. Model completion and validation using inversion of grey box models, ANZIAM J.,54 (CTAC 2012) pp C187–C199.
  6. 6.0 6.1 Draper, Norman R.; Smith, Harry (25 August 2014). अनुप्रयुक्त प्रतिगमन विश्लेषण. John Wiley & Sons. pp. 657–. ISBN 978-1-118-62568-2.
  7. 7.0 7.1 Weisberg, Sanford (25 November 2013). एप्लाइड रैखिक प्रतिगमन. Wiley. ISBN 978-1-118-59485-8.
  8. Heaton, J., 2012. Introduction to the math of neural networks, Heaton Research Inc. (Chesterfield, MO), ISBN 978-1475190878
  9. Stergiou, C.; Siganos, D. (2013). "तंत्रिका - तंत्र". Archived from the original on 2009-12-16. Retrieved 2013-07-03.
  10. 10.0 10.1 Lawson, Charles L.; J. Hanson, Richard (1 December 1995). न्यूनतम वर्ग समस्याओं का समाधान. SIAM. ISBN 978-0-89871-356-5.
  11. 11.0 11.1 11.2 Press, W.H.; Teukolsky, S.A.; Vetterling, W.T.; Flannery, B.P. (2007). Numerical Recipes (3rd ed.). Cambridge University Press. ISBN 978-0-521-88068-8.
  12. Gelman, Andrew; Carlin, John B.; Stern, Hal S.; Dunson, David B.; Vehtari, Aki; Rubin, Donald B. (1 November 2013). बायेसियन डेटा विश्लेषण, तीसरा संस्करण. CRC Press. ISBN 978-1-4398-4095-5.
  13. Mathworks, 2013. Supported grey box models
  14. 14.0 14.1 Hauth, J. (2008), Grey Box Modelling for Nonlinear Systems (PDF) (dissertation, Kaiserslautern University of Technology).
  15. 15.0 15.1 Nash, J.C. and Walker-Smith, M. 1987. Nonlinear parameter estimation, Marcel Dekker, Inc. (New York).
  16. 16.0 16.1 16.2 Whiten, W.J., 1971. Model building techniques applied to mineral treatment processes, Symp. on Automatic Control Systems in Mineral Processing Plants, (Australas. Inst. Min. Metall., S. Queensland Branch, Brisbane), 129-148.
  17. 17.0 17.1 17.2 17.3 Whiten, W.J., 1994. Determination of parameter relations within non-linear models, SIGNUM Newsletter, 29(3–4,) 2–5. 10.1145/192527.192535.
  18. 18.0 18.1 18.2 Whiten, B., 2014. Determining the form of ordinary differential equations using model inversion, ANZIAM J. 55 (EMAC2013) pp.C329–C347.
  19. Polynomial
  20. Spline (mathematics)
  21. 21.0 21.1 21.2 21.3 Kojovic, T., and Whiten W. J., 1994. Evaluation of the quality of simulation models, Innovations in mineral processing, (Lauretian University, Sudbury) pp 437–446. ISBN 088667025X
  22. 22.0 22.1 22.2 Kojovic, T., 1989. The development and application of Model - an automated model builder for mineral processing, PhD thesis, The University of Queensland.
  23. Xiao, J., 1998. Extensions of model building techniques and their applications in mineral processing, PhD thesis, The University of Queensland.
  24. 24.0 24.1 Linhart, H.; Zucchini, W. (1986). मॉडल चयन. Wiley. ISBN 978-0-471-83722-0.
  25. 25.0 25.1 Miller, Alan (15 April 2002). प्रतिगमन में सबसेट चयन. CRC Press. ISBN 978-1-4200-3593-3.
  26. Deming, William Edwards (2000). Out of the Crisis p272. MIT Press. ISBN 978-0-262-54115-2.