मूल-माध्य-वर्ग विचलन

From Vigyanwiki
Revision as of 19:56, 6 August 2023 by alpha>AmitKumar

मूल-माध्य-वर्ग विचलन (आरएमएसडी) या मूल-माध्य-वर्ग त्रुटि (आरएमएसई) मॉडल या अनुमानक द्वारा अनुमानित मूल्यों (नमूना या जनसंख्या मूल्यों) और देखे गए मूल्यों के बीच अंतर का अक्सर उपयोग किया जाने वाला माप है। आरएमएसडी अनुमानित मूल्यों और देखे गए मूल्यों या इन अंतरों के द्विघात माध्य के बीच अंतर के दूसरे नमूना क्षण के वर्गमूल का प्रतिनिधित्व करता है। इन सांख्यिकीय विचलन को आंकड़ों में त्रुटियां और अवशेष कहा जाता है, जब गणना डेटा नमूने पर की जाती है जिसका उपयोग अनुमान के लिए किया गया था और जब नमूने से बाहर गणना की जाती है तो इन्हें त्रुटियां (या भविष्यवाणी त्रुटियां) कहा जाता है। आरएमएसडी विभिन्न डेटा बिंदुओं के लिए भविष्यवाणियों में त्रुटियों के परिमाण को पूर्वानुमानित शक्ति के ही माप में एकत्रित करने का कार्य करता है। आरएमएसडी किसी विशेष डेटासेट के लिए विभिन्न मॉडलों की पूर्वानुमान त्रुटियों की तुलना करने के लिए सटीकता और परिशुद्धता का माप है, न कि डेटासेट के बीच, क्योंकि यह स्केल-निर्भर है।[1] आरएमएसडी हमेशा गैर-नकारात्मक होता है, और 0 का मान (व्यवहार में लगभग कभी हासिल नहीं किया गया) डेटा के लिए एकदम फिट होने का संकेत देगा। सामान्य तौर पर, कम आरएमएसडी उच्चतर से बेहतर होता है। हालाँकि, विभिन्न प्रकार के डेटा की तुलना अमान्य होगी क्योंकि माप उपयोग की गई संख्याओं के पैमाने पर निर्भर है।

आरएमएसडी वर्ग त्रुटियों के औसत का वर्गमूल है। आरएमएसडी पर प्रत्येक त्रुटि का प्रभाव वर्ग त्रुटि के आकार के समानुपाती होता है; इस प्रकार बड़ी त्रुटियों का आरएमएसडी पर असंगत रूप से बड़ा प्रभाव पड़ता है। नतीजतन, आरएमएसडी आउटलेर्स के प्रति संवेदनशील है।[2][3]


सूत्र

एक अनुमानक का आरएमएसडी अनुमानित पैरामीटर के संबंध में माध्य वर्ग त्रुटि के वर्गमूल के रूप में परिभाषित किया गया है:

एक निष्पक्ष अनुमानक के लिए, आरएमएसडी विचरण का वर्गमूल है, जिसे मानक विचलन के रूप में जाना जाता है।

अनुमानित मूल्यों का आरएमएसडी प्रतिगमन विश्लेषण के समय टी के लिए|प्रतिगमन के आश्रित चर टी समय पर देखे गए चर के साथ, टी अलग-अलग भविष्यवाणियों के लिए विचलन के वर्गों के माध्य के वर्गमूल के रूप में गणना की जाती है:

(क्रास सेक्शनल डाटा पर प्रतिगमन के लिए, सबस्क्रिप्ट t को i द्वारा प्रतिस्थापित किया जाता है और T को n द्वारा प्रतिस्थापित किया जाता है।)

कुछ विषयों में, आरएमएसडी का उपयोग दो चीजों के बीच अंतर की तुलना करने के लिए किया जाता है जो भिन्न हो सकते हैं, जिनमें से किसी को भी मानक के रूप में स्वीकार नहीं किया जाता है। उदाहरण के लिए, दो समय श्रृंखलाओं के बीच औसत अंतर को मापते समय और , सूत्र बन जाता है


सामान्यीकरण

आरएमएसडी को सामान्य करने से विभिन्न पैमानों वाले डेटासेट या मॉडल के बीच तुलना की सुविधा मिलती है। यद्यपि साहित्य में सामान्यीकरण का कोई सुसंगत साधन नहीं है, सामान्य विकल्प मापे गए डेटा का माध्य या सीमा (अधिकतम मान शून्य से न्यूनतम मान के रूप में परिभाषित) हैं:[4]

या .

इस मान को आमतौर पर सामान्यीकृत मूल-माध्य-वर्ग विचलन या त्रुटि (एनआरएमएसडी या एनआरएमएसई) के रूप में जाना जाता है, और अक्सर इसे प्रतिशत के रूप में व्यक्त किया जाता है, जहां कम मान कम अवशिष्ट विचरण का संकेत देते हैं। इसे भिन्नता गुणांक या 'प्रतिशत आरएमएस' भी कहा जाता है। कई मामलों में, विशेष रूप से छोटे नमूनों के लिए, नमूना सीमा नमूने के आकार से प्रभावित होने की संभावना है जो तुलना में बाधा उत्पन्न करेगी।

आरएमएसडी को अधिक उपयोगी तुलना उपाय बनाने की अन्य संभावित विधि आरएमएसडी को अन्तःचतुर्थक श्रेणी द्वारा विभाजित करना है। आरएमएसडी को आईक्यूआर के साथ विभाजित करते समय सामान्यीकृत मूल्य लक्ष्य चर में चरम मूल्यों के लिए कम संवेदनशील हो जाता है।

कहाँ

साथ और जहां सी.डी.एफ−1मात्रात्मक फलन है।

माप के औसत मूल्य द्वारा सामान्यीकरण करते समय, अस्पष्टता से बचने के लिए आरएमएसडी, सीवी (आरएमएसडी) की भिन्नता के गुणांक शब्द का उपयोग किया जा सकता है।[5] यह मानक विचलन की जगह लेने वाले आरएमएसडी के साथ भिन्नता के गुणांक के अनुरूप है।


माध्य पूर्ण त्रुटि

कुछ शोधकर्ताओं ने मूल माध्य वर्ग विचलन के बजाय माध्य निरपेक्ष त्रुटि (एमएई) के उपयोग की सिफारिश की है। आरएमएसडी की तुलना में व्याख्यात्मकता में एमएई को लाभ है। एमएई त्रुटियों के निरपेक्ष मूल्यों का औसत है। वर्ग त्रुटियों के औसत के वर्गमूल की तुलना में एमएई को समझना मौलिक रूप से आसान है। इसके अलावा, प्रत्येक त्रुटि त्रुटि के पूर्ण मूल्य के सीधे अनुपात में एमएई को प्रभावित करती है, जो आरएमएसडी के मामले में नहीं है।[2]


अनुप्रयोग

  • मौसम विज्ञान में, यह देखना कि गणित का मॉडल वायुमंडल के व्यवहार की कितनी प्रभावी भविष्यवाणी करता है।
  • जैव सूचना विज्ञान में, परमाणु स्थितियों का मूल-माध्य-वर्ग विचलन प्रोटीन संरचनात्मक संरेखण प्रोटीन के परमाणुओं के बीच औसत दूरी का माप है।
  • ड्रग डिजाइन#संरचना-आधारित में, आरएमएसडी लिगैंड गठनात्मक समावयवता के क्रिस्टल संरचना और डॉकिंग (आण्विक) भविष्यवाणी के बीच अंतर का माप है।
  • अर्थशास्त्र में, आरएमएसडी का उपयोग यह निर्धारित करने के लिए किया जाता है कि कोई आर्थिक मॉडल आर्थिक संकेतकों पर फिट बैठता है या नहीं। कुछ विशेषज्ञों ने तर्क दिया है कि आरएमएसडी रिलेटिव एब्सोल्यूट एरर की तुलना में कम विश्वसनीय है।[6]
  • प्रायोगिक मनोविज्ञान में, आरएमएसडी का उपयोग यह आकलन करने के लिए किया जाता है कि व्यवहार के गणितीय या कम्प्यूटेशनल मॉडल अनुभवजन्य रूप से देखे गए व्यवहार को कितनी अच्छी तरह समझाते हैं।
  • गिस में, आरएमएसडी उपाय है जिसका उपयोग स्थानिक विश्लेषण और रिमोट सेंसिंग की सटीकता का आकलन करने के लिए किया जाता है।
  • हाइड्रोज्योलोजी में, आरएमएसडी और एनआरएमएसडी का उपयोग भूजल मॉडल के अंशांकन का मूल्यांकन करने के लिए किया जाता है।[7]
  • इमेजिंग विज्ञान में, आरएमएसडी चरम सिग्नल-टू-शोर अनुपात का हिस्सा है, उपाय जिसका उपयोग यह आकलन करने के लिए किया जाता है कि किसी छवि को फिर से बनाने की विधि मूल छवि के सापेक्ष कितना अच्छा प्रदर्शन करती है।
  • कम्प्यूटेशनल तंत्रिका विज्ञान में, आरएमएसडी का उपयोग यह आकलन करने के लिए किया जाता है कि कोई सिस्टम किसी दिए गए मॉडल को कितनी अच्छी तरह सीखता है।[8]
  • प्रोटीन परमाणु चुंबकीय अनुनाद स्पेक्ट्रोस्कोपी में, आरएमएसडी का उपयोग संरचनाओं के प्राप्त बंडल की गुणवत्ता का अनुमान लगाने के लिए उपाय के रूप में किया जाता है।
  • नेटफ्लिक्स पुरस्कार के लिए प्रस्तुतियों का मूल्यांकन परीक्षण डेटासेट के अज्ञात वास्तविक मूल्यों से आरएमएसडी का उपयोग करके किया गया था।
  • इमारतों की ऊर्जा खपत के अनुकरण में, आरएमएसई और सीवी (आरएमएसई) का उपयोग भवन के प्रदर्शन को मापने के लिए मॉडल को कैलिब्रेट करने के लिए किया जाता है।[9]
  • एक्स - रे क्रिस्टलोग्राफी में, आरएमएसडी (और आरएमएसजेड) का उपयोग आणविक आंतरिक निर्देशांक के विचलन को मापने के लिए किया जाता है जो कि पुस्तकालय मूल्यों से विचलित होता है।
  • नियंत्रण सिद्धांत में, आरएमएसई का उपयोग राज्य पर्यवेक्षक के प्रदर्शन का मूल्यांकन करने के लिए गुणवत्ता उपाय के रूप में किया जाता है।[10]
  • द्रव गतिशीलता में, सामान्यीकृत मूल-माध्य-वर्ग विचलन (एनआरएमएसडी), भिन्नता का गुणांक (सीवी), और प्रतिशत आरएमएस का उपयोग प्रवाह व्यवहार की एकरूपता जैसे वेग प्रोफ़ाइल, तापमान वितरण, या गैस प्रजाति एकाग्रता को मापने के लिए किया जाता है। प्रवाह और थर्मल उपकरण और प्रक्रियाओं के डिजाइन को अनुकूलित करने के लिए मूल्य की तुलना उद्योग मानकों से की जाती है।

यह भी देखें

संदर्भ

  1. Hyndman, Rob J.; Koehler, Anne B. (2006). "पूर्वानुमान सटीकता के उपायों पर एक और नज़र". International Journal of Forecasting. 22 (4): 679–688. CiteSeerX 10.1.1.154.9771. doi:10.1016/j.ijforecast.2006.03.001.
  2. 2.0 2.1 Pontius, Robert; Thontteh, Olufunmilayo; Chen, Hao (2008). "वास्तविक चर साझा करने वाले मानचित्रों के बीच एकाधिक रिज़ॉल्यूशन तुलना के लिए जानकारी के घटक". Environmental Ecological Statistics. 15 (2): 111–142. doi:10.1007/s10651-007-0043-y.
  3. Willmott, Cort; Matsuura, Kenji (2006). "स्थानिक प्रक्षेपकों के प्रदर्शन का मूल्यांकन करने के लिए त्रुटि के आयामी मापों के उपयोग पर". International Journal of Geographical Information Science. 20: 89–102. doi:10.1080/13658810500286976.
  4. "तटीय इनलेट्स अनुसंधान कार्यक्रम (सीआईआरपी) विकी - सांख्यिकी". Retrieved 4 February 2015.
  5. "FAQ: What is the coefficient of variation?". Retrieved 19 February 2019.
  6. Armstrong, J. Scott; Collopy, Fred (1992). "Error Measures For Generalizing About Forecasting Methods: Empirical Comparisons" (PDF). International Journal of Forecasting. 8 (1): 69–80. CiteSeerX 10.1.1.423.508. doi:10.1016/0169-2070(92)90008-w.
  7. Anderson, M.P.; Woessner, W.W. (1992). Applied Groundwater Modeling: Simulation of Flow and Advective Transport (2nd ed.). Academic Press.
  8. Ensemble Neural Network Model
  9. ANSI/BPI-2400-S-2012: Standard Practice for Standardized Qualification of Whole-House Energy Savings Predictions by Calibration to Energy Use History
  10. https://kalman-filter.com/root-mean-square-error