मूल-माध्य-वर्ग विचलन: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 1: Line 1:
{{Short description|Statistical measure}}
{{Short description|Statistical measure}}
{{for|the bioinformatics concept|Root-mean-square deviation of atomic positions}}
{{for|जैव सूचना विज्ञान अवधारणा|परमाणु स्थितियों का मूल-माध्य-वर्ग विचलन}}
{{StatsTopicTOC}}
{{StatsTopicTOC}}
मूल-माध्य-वर्ग विचलन (आरएमएसडी) या मूल-माध्य-वर्ग त्रुटि (आरएमएसई) मॉडल या अनुमानक द्वारा अनुमानित मूल्यों (नमूना या जनसंख्या मूल्यों) और देखे गए मूल्यों के बीच अंतर का अक्सर उपयोग किया जाने वाला माप है। आरएमएसडी अनुमानित मूल्यों और देखे गए मूल्यों या इन अंतरों के [[द्विघात माध्य]] के बीच अंतर के दूसरे [[नमूना क्षण]] के वर्गमूल का प्रतिनिधित्व करता है। इन [[सांख्यिकीय विचलन]] को ''आंकड़ों में त्रुटियां और अवशेष'' कहा जाता है, जब गणना डेटा नमूने पर की जाती है जिसका उपयोग अनुमान के लिए किया गया था और जब नमूने से बाहर गणना की जाती है तो इन्हें ''त्रुटियां'' (या भविष्यवाणी त्रुटियां) कहा जाता है। आरएमएसडी विभिन्न डेटा बिंदुओं के लिए भविष्यवाणियों में त्रुटियों के परिमाण को पूर्वानुमानित शक्ति के ही माप में एकत्रित करने का कार्य करता है। आरएमएसडी किसी विशेष डेटासेट के लिए विभिन्न मॉडलों की पूर्वानुमान त्रुटियों की तुलना करने के लिए सटीकता और परिशुद्धता का माप है, न कि डेटासेट के बीच, क्योंकि यह स्केल-निर्भर है।<ref>{{cite journal|last=Hyndman|first=Rob J.|last2=Koehler|first2=Anne B.|title=पूर्वानुमान सटीकता के उपायों पर एक और नज़र|journal=International Journal of Forecasting|year=2006|pages=679–688|doi=10.1016/j.ijforecast.2006.03.001|volume=22|issue=4|citeseerx=10.1.1.154.9771}}</ref>
'''मूल-माध्य-वर्ग विचलन''' (आरएमएसडी) या मूल-माध्य-वर्ग त्रुटि (आरएमएसई) मॉडल या अनुमानक द्वारा अनुमानित मूल्यों (प्रतिरूप या जनसंख्या मूल्यों) और देखे गए मूल्यों के मध्य अंतर का अधिकांशतः उपयोग किया जाने वाला माप है। आरएमएसडी अनुमानित मूल्यों और देखे गए मूल्यों या इन अंतरों के [[द्विघात माध्य]] के मध्य अंतर के दूसरे [[नमूना क्षण|सैंपल मोवमेंट]] के वर्गमूल का प्रतिनिधित्व करता है। इन [[सांख्यिकीय विचलन]] को आंकड़ों में त्रुटियां और अवशेष कहा जाता है, जब गणना डेटा प्रतिरूप पर की जाती है जिसका उपयोग अनुमान के लिए किया गया था और जब प्रतिरूप से बाहर गणना की जाती है तो इन्हें त्रुटियां (या पूर्वानुमान त्रुटियां) कहा जाता है। आरएमएसडी विभिन्न डेटा बिंदुओं के लिए पूर्वानुमानों में त्रुटियों के परिमाण को पूर्वानुमानित शक्ति के ही माप में एकत्रित करने का कार्य करता है। आरएमएसडी किसी विशेष डेटासमुच्चय के लिए विभिन्न मॉडलों की पूर्वानुमान त्रुटियों की तुलना करने के लिए स्पष्टता और परिशुद्धता का माप है, न कि डेटासमुच्चय के मध्य, क्योंकि यह स्केल-निर्भर रहता है। <ref>{{cite journal|last=Hyndman|first=Rob J.|last2=Koehler|first2=Anne B.|title=पूर्वानुमान सटीकता के उपायों पर एक और नज़र|journal=International Journal of Forecasting|year=2006|pages=679–688|doi=10.1016/j.ijforecast.2006.03.001|volume=22|issue=4|citeseerx=10.1.1.154.9771}}</ref>
आरएमएसडी हमेशा गैर-नकारात्मक होता है, और 0 का मान (व्यवहार में लगभग कभी हासिल नहीं किया गया) डेटा के लिए एकदम फिट होने का संकेत देगा। सामान्य तौर पर, कम आरएमएसडी उच्चतर से बेहतर होता है। हालाँकि, विभिन्न प्रकार के डेटा की तुलना अमान्य होगी क्योंकि माप उपयोग की गई संख्याओं के पैमाने पर निर्भर है।
 
आरएमएसडी सदैव गैर-ऋणात्मक होता है, और 0 का मान (व्यवहार में लगभग कभी प्राप्त नहीं किया गया) हैं यह डेटा के लिए एकदम फिट होने का संकेत देता हैं। सामान्यतः, कम आरएमएसडी उच्चतर से उत्तम होता है। चूँकि, विभिन्न प्रकार के डेटा की तुलना अमान्य होगी क्योंकि माप उपयोग की गई संख्याओं के मापदंड पर निर्भर होता है।                                                                                                                                                                                 
 
आरएमएसडी वर्ग त्रुटियों के औसत का वर्गमूल है। आरएमएसडी पर प्रत्येक त्रुटि का प्रभाव वर्ग त्रुटि के आकार के समानुपाती होता है | इस प्रकार बड़ी त्रुटियों का आरएमएसडी पर असंगत रूप से बड़ा प्रभाव पड़ता है। ऐसे परिणाम के रूप में, आरएमएसडी आउटलेर्स के प्रति संवेदनशील होता है। <ref name=":0">{{Cite journal|last=Pontius|first=Robert|last2=Thontteh|first2=Olufunmilayo|last3=Chen|first3=Hao|date=2008|title=वास्तविक चर साझा करने वाले मानचित्रों के बीच एकाधिक रिज़ॉल्यूशन तुलना के लिए जानकारी के घटक|journal=Environmental Ecological Statistics|volume=15|issue=2|pages=111–142|doi=10.1007/s10651-007-0043-y}}</ref><ref>{{Cite journal|last=Willmott|first=Cort|last2=Matsuura|first2=Kenji|date=2006|title=स्थानिक प्रक्षेपकों के प्रदर्शन का मूल्यांकन करने के लिए त्रुटि के आयामी मापों के उपयोग पर|journal=International Journal of Geographical Information Science|volume=20|pages=89–102|doi=10.1080/13658810500286976}}</ref>


आरएमएसडी वर्ग त्रुटियों के औसत का वर्गमूल है। आरएमएसडी पर प्रत्येक त्रुटि का प्रभाव वर्ग त्रुटि के आकार के समानुपाती होता है; इस प्रकार बड़ी त्रुटियों का आरएमएसडी पर असंगत रूप से बड़ा प्रभाव पड़ता है। नतीजतन, आरएमएसडी आउटलेर्स के प्रति संवेदनशील है।<ref name=":0">{{Cite journal|last=Pontius|first=Robert|last2=Thontteh|first2=Olufunmilayo|last3=Chen|first3=Hao|date=2008|title=वास्तविक चर साझा करने वाले मानचित्रों के बीच एकाधिक रिज़ॉल्यूशन तुलना के लिए जानकारी के घटक|journal=Environmental Ecological Statistics|volume=15|issue=2|pages=111–142|doi=10.1007/s10651-007-0043-y}}</ref><ref>{{Cite journal|last=Willmott|first=Cort|last2=Matsuura|first2=Kenji|date=2006|title=स्थानिक प्रक्षेपकों के प्रदर्शन का मूल्यांकन करने के लिए त्रुटि के आयामी मापों के उपयोग पर|journal=International Journal of Geographical Information Science|volume=20|pages=89–102|doi=10.1080/13658810500286976}}</ref>




== सूत्र ==
== सूत्र ==


एक अनुमानक का आरएमएसडी <math>\hat{\theta}</math> अनुमानित पैरामीटर के संबंध में <math>\theta</math> माध्य वर्ग त्रुटि के वर्गमूल के रूप में परिभाषित किया गया है:
अनुमानित पैरामीटर <math>\theta</math> के संबंध में अनुमानक <math>\hat{\theta}</math> के आरएमएसडी को माध्य वर्ग त्रुटि के वर्गमूल के रूप में परिभाषित किया गया है                                          


:<math>\operatorname{RMSD}(\hat{\theta}) = \sqrt{\operatorname{MSE}(\hat{\theta})} = \sqrt{\operatorname{E}((\hat{\theta}-\theta)^2)}.</math>
:<math>\operatorname{RMSD}(\hat{\theta}) = \sqrt{\operatorname{MSE}(\hat{\theta})} = \sqrt{\operatorname{E}((\hat{\theta}-\theta)^2)}.</math>
एक निष्पक्ष अनुमानक के लिए, आरएमएसडी विचरण का वर्गमूल है, जिसे [[मानक विचलन]] के रूप में जाना जाता है।
निष्पक्ष अनुमानक के लिए, आरएमएसडी विचरण का वर्गमूल है, जिसे [[मानक विचलन]] के रूप में जाना जाता है।


अनुमानित मूल्यों का आरएमएसडी <math>\hat y_t</math> प्रतिगमन विश्लेषण के समय टी के लिए|प्रतिगमन के आश्रित चर <math>y_t,</math> टी समय पर देखे गए चर के साथ, टी अलग-अलग भविष्यवाणियों के लिए विचलन के वर्गों के माध्य के वर्गमूल के रूप में गणना की जाती है:
प्रतिगमन के आश्रित वेरिएबल <math>y_t,</math> के समय ''t'' के लिए अनुमानित मूल्यों <math>\hat y_t</math> का आरएमएसडी, ''T'' समय पर देखे गए वेरिएबल के साथ, ''T'' के विभिन्न पूर्वानुमानों के लिए विचलन के वर्गों के माध्य के वर्गमूल के रूप में गणना की जाती है                                                                                                              


:<math>\operatorname{RMSD}=\sqrt{\frac{\sum_{t=1}^T (\hat y_t - y_t)^2}{T}}.</math>
:<math>\operatorname{RMSD}=\sqrt{\frac{\sum_{t=1}^T (\hat y_t - y_t)^2}{T}}.</math>
([[क्रास सेक्शनल डाटा]] पर प्रतिगमन के लिए, सबस्क्रिप्ट t को i द्वारा प्रतिस्थापित किया जाता है और T को n द्वारा प्रतिस्थापित किया जाता है।)
([[क्रास सेक्शनल डाटा]] पर प्रतिगमन के लिए, सबस्क्रिप्ट ''t'' को ''i'' द्वारा प्रतिस्थापित किया जाता है और ''T'' को ''n'' द्वारा प्रतिस्थापित किया जाता है।)


कुछ विषयों में, आरएमएसडी का उपयोग दो चीजों के बीच अंतर की तुलना करने के लिए किया जाता है जो भिन्न हो सकते हैं, जिनमें से किसी को भी मानक के रूप में स्वीकार नहीं किया जाता है। उदाहरण के लिए, दो समय श्रृंखलाओं के बीच औसत अंतर को मापते समय <math>x_{1,t}</math> और <math>x_{2,t}</math>,
कुछ विषयों में, आरएमएसडी का उपयोग दो वस्तुओं के मध्य अंतर की तुलना करने के लिए किया जाता है जो भिन्न हो सकते हैं, जिनमें से किसी को भी मानक के रूप में स्वीकार नहीं किया जाता है। उदाहरण के लिए, दो समय श्रृंखलाओं के मध्य औसत अंतर को मापते समय <math>x_{1,t}</math> और <math>x_{2,t}</math>,सूत्र बन जाता है
सूत्र बन जाता है
:<math>\operatorname{RMSD}= \sqrt{\frac{\sum_{t=1}^T (x_{1,t} - x_{2,t})^2}{T}}.</math>
:<math>\operatorname{RMSD}= \sqrt{\frac{\sum_{t=1}^T (x_{1,t} - x_{2,t})^2}{T}}.</math>




==सामान्यीकरण==
==सामान्यीकरण==
आरएमएसडी को सामान्य करने से विभिन्न पैमानों वाले डेटासेट या मॉडल के बीच तुलना की सुविधा मिलती है। यद्यपि साहित्य में सामान्यीकरण का कोई सुसंगत साधन नहीं है, सामान्य विकल्प मापे गए डेटा का माध्य या सीमा (अधिकतम मान शून्य से न्यूनतम मान के रूप में परिभाषित) हैं:<ref>{{cite web|title=तटीय इनलेट्स अनुसंधान कार्यक्रम (सीआईआरपी) विकी - सांख्यिकी|url=http://cirpwiki.info/wiki/Statistics#Normalization|access-date=4 February 2015}}</ref>
आरएमएसडी को सामान्य करने से विभिन्न मापदंडों वाले डेटासमुच्चय या मॉडल के मध्य तुलना की सुविधा मिलती है। यद्यपि साहित्य में सामान्यीकरण का कोई सुसंगत साधन नहीं है, सामान्य विकल्प मापे गए डेटा के माध्य या सीमा (अधिकतम मान शून्य से न्यूनतम मान के रूप में परिभाषित) होती हैं |<ref>{{cite web|title=तटीय इनलेट्स अनुसंधान कार्यक्रम (सीआईआरपी) विकी - सांख्यिकी|url=http://cirpwiki.info/wiki/Statistics#Normalization|access-date=4 February 2015}}</ref>
:<math>\mathrm{NRMSD} = \frac{\mathrm{RMSD}}{y_\max -y_\min}</math> या <math> \mathrm{NRMSD} = \frac {\mathrm{RMSD}}{\bar y}  </math>.
:<math>\mathrm{NRMSD} = \frac{\mathrm{RMSD}}{y_\max -y_\min}</math> या <math> \mathrm{NRMSD} = \frac {\mathrm{RMSD}}{\bar y}  </math>.


इस मान को आमतौर पर सामान्यीकृत मूल-माध्य-वर्ग विचलन या त्रुटि (एनआरएमएसडी या एनआरएमएसई) के रूप में जाना जाता है, और अक्सर इसे प्रतिशत के रूप में व्यक्त किया जाता है, जहां कम मान कम अवशिष्ट विचरण का संकेत देते हैं। इसे भिन्नता गुणांक या 'प्रतिशत आरएमएस' भी कहा जाता है। कई मामलों में, विशेष रूप से छोटे नमूनों के लिए, नमूना सीमा नमूने के आकार से प्रभावित होने की संभावना है जो तुलना में बाधा उत्पन्न करेगी।
इस मान को सामान्यतः सामान्यीकृत मूल-माध्य-वर्ग विचलन या त्रुटि (एनआरएमएसडी या एनआरएमएसई) के रूप में जाना जाता है, और अधिकांशतः इसे प्रतिशत के रूप में व्यक्त किया जाता है, जहां यह कम मान कम अवशिष्ट विचरण का संकेत देते हैं। इसे भिन्नता गुणांक या 'प्रतिशत आरएमएस' भी कहा जाता है। यह अनेक स्तिथियों में, विशेष रूप से लघु प्रतिरूपों के लिए हैं, प्रतिरूप सीमा का प्रतिरूप के आकार से प्रभावित होने की संभावना होती है जो तुलना में बाधा उत्पन्न करती हैं।


आरएमएसडी को अधिक उपयोगी तुलना उपाय बनाने की अन्य संभावित विधि आरएमएसडी को [[अन्तःचतुर्थक श्रेणी]] द्वारा विभाजित करना है। आरएमएसडी को आईक्यूआर के साथ विभाजित करते समय सामान्यीकृत मूल्य लक्ष्य चर में चरम मूल्यों के लिए कम संवेदनशील हो जाता है।
आरएमएसडी को अधिक उपयोगी तुलना उपाय बनाने की अन्य संभावित विधि आरएमएसडी को [[अन्तःचतुर्थक श्रेणी]] द्वारा विभाजित करना है। आरएमएसडी को आईक्यूआर के साथ विभाजित करते समय सामान्यीकृत मूल्य लक्ष्य वेरिएबल में चरम मूल्यों के लिए कम संवेदनशील हो जाता है।


:<math>\mathrm{RMSDIQR} = \frac{\mathrm{RMSD}}{IQR}</math> कहाँ <math>IQR = Q_3 - Q_1</math>
:<math>\mathrm{RMSDIQR} = \frac{\mathrm{RMSD}}{IQR}</math> कहाँ <math>IQR = Q_3 - Q_1</math>
साथ <math>Q_1 = \text{CDF}^{-1}(0.25)</math> और <math>Q_3 = \text{CDF}^{-1}(0.75) ,</math> जहां सी.डी.एफ<sup>−1</sup>मात्रात्मक फलन है।
<math>Q_1 = \text{CDF}^{-1}(0.25)</math> और <math>Q_3 = \text{CDF}^{-1}(0.75) ,</math>के साथ जहां सी.डी.एफ<sup>−1</sup>क्वांटाइल फलन है।


माप के औसत मूल्य द्वारा सामान्यीकरण करते समय, अस्पष्टता से बचने के लिए आरएमएसडी, सीवी (आरएमएसडी) की भिन्नता के गुणांक शब्द का उपयोग किया जा सकता है।<ref>{{cite web|title=FAQ: What is the coefficient of variation?|url=https://stats.idre.ucla.edu/other/mult-pkg/faq/general/faq-what-is-the-coefficient-of-variation/|access-date=19 February 2019}}</ref> यह मानक विचलन की जगह लेने वाले आरएमएसडी के साथ भिन्नता के गुणांक के अनुरूप है।
माप के औसत मूल्य द्वारा सामान्यीकरण करते समय, अस्पष्टता से बचने के लिए आरएमएसडी, सीवी (आरएमएसडी) की भिन्नता के गुणांक शब्द का उपयोग किया जा सकता है।<ref>{{cite web|title=FAQ: What is the coefficient of variation?|url=https://stats.idre.ucla.edu/other/mult-pkg/faq/general/faq-what-is-the-coefficient-of-variation/|access-date=19 February 2019}}</ref> यह मानक विचलन की जगह लेने वाले आरएमएसडी के साथ भिन्नता के गुणांक के अनुरूप होता है।


:<math> \mathrm{CV(RMSD)} = \frac {\mathrm{RMSD}}{\bar y} .</math>
:<math> \mathrm{CV(RMSD)} = \frac {\mathrm{RMSD}}{\bar y} .</math>
Line 42: Line 43:


== माध्य पूर्ण त्रुटि ==
== माध्य पूर्ण त्रुटि ==
कुछ शोधकर्ताओं ने मूल माध्य वर्ग विचलन के बजाय माध्य निरपेक्ष त्रुटि (एमएई) के उपयोग की सिफारिश की है। आरएमएसडी की तुलना में व्याख्यात्मकता में एमएई को लाभ है। एमएई त्रुटियों के निरपेक्ष मूल्यों का औसत है। वर्ग त्रुटियों के औसत के वर्गमूल की तुलना में एमएई को समझना मौलिक रूप से आसान है। इसके अलावा, प्रत्येक त्रुटि त्रुटि के पूर्ण मूल्य के सीधे अनुपात में एमएई को प्रभावित करती है, जो आरएमएसडी के मामले में नहीं है।<ref name=":0" />
कुछ शोधकर्ताओं ने मूल माध्य वर्ग विचलन के अतिरिक्त माध्य निरपेक्ष त्रुटि (एमएई) के उपयोग का पक्षसमर्थन करता है। आरएमएसडी की तुलना में व्याख्यात्मकता में एमएई को लाभ होता है। एमएई त्रुटियों के निरपेक्ष मूल्यों का औसत है। वर्ग त्रुटियों के औसत के वर्गमूल की तुलना में एमएई को समझना मौलिक रूप से सरल है। इसके अतिरिक्त, प्रत्येक त्रुटि के पूर्ण मूल्य के सीधे अनुपात में एमएई को प्रभावित करती है, जो आरएमएसडी के स्तिथियां में नहीं है।<ref name=":0" />




==अनुप्रयोग==
==अनुप्रयोग==
*मौसम विज्ञान में, यह देखना कि गणित का मॉडल [[वायुमंडल]] के व्यवहार की कितनी प्रभावी भविष्यवाणी करता है।
*मौसम विज्ञान में, यह देखना कि गणित का मॉडल [[वायुमंडल]] के व्यवहार की कितनी प्रभावी पूर्वानुमान करता है।
*जैव सूचना विज्ञान में, [[परमाणु स्थितियों का मूल-माध्य-वर्ग विचलन]] [[प्रोटीन]] संरचनात्मक संरेखण प्रोटीन के परमाणुओं के बीच औसत दूरी का माप है।
*जैव सूचना विज्ञान में, [[परमाणु स्थितियों का मूल-माध्य-वर्ग विचलन]] [[प्रोटीन]] संरचनात्मक संरेखण प्रोटीन के परमाणुओं के मध्य औसत दूरी का माप है।
*ड्रग डिजाइन#संरचना-आधारित में, आरएमएसडी लिगैंड [[गठनात्मक समावयवता]] के क्रिस्टल संरचना और डॉकिंग (आण्विक) भविष्यवाणी के बीच अंतर का माप है।
*ड्रग डिजाइन#संरचना-आधारित में, आरएमएसडी लिगैंड [[गठनात्मक समावयवता]] के क्रिस्टल संरचना और डॉकिंग (आण्विक) पूर्वानुमान के मध्य अंतर का माप है।
*[[अर्थशास्त्र]] में, आरएमएसडी का उपयोग यह निर्धारित करने के लिए किया जाता है कि कोई आर्थिक मॉडल आर्थिक संकेतकों पर फिट बैठता है या नहीं। कुछ विशेषज्ञों ने तर्क दिया है कि आरएमएसडी रिलेटिव एब्सोल्यूट एरर की तुलना में कम विश्वसनीय है।<ref>{{cite journal|url= http://faculty.weatherhead.case.edu/Fred-Collopy/researchArticles/ErrorMeasures.pdf | title = Error Measures For Generalizing About Forecasting Methods: Empirical Comparisons |last=Armstrong |first=J. Scott |last2=Collopy |first2=Fred |journal = International Journal of Forecasting | volume = 8 | pages = 69–80 | year = 1992 | doi=10.1016/0169-2070(92)90008-w | issue=1| citeseerx = 10.1.1.423.508 }}</ref>
*[[अर्थशास्त्र]] में, आरएमएसडी का उपयोग यह निर्धारित करने के लिए किया जाता है कि कोई आर्थिक मॉडल आर्थिक संकेतकों पर फिट बैठता है या नहीं। कुछ विशेषज्ञों ने तर्क दिया है कि आरएमएसडी रिलेटिव एब्सोल्यूट एरर की तुलना में कम विश्वसनीय है।<ref>{{cite journal|url= http://faculty.weatherhead.case.edu/Fred-Collopy/researchArticles/ErrorMeasures.pdf | title = Error Measures For Generalizing About Forecasting Methods: Empirical Comparisons |last=Armstrong |first=J. Scott |last2=Collopy |first2=Fred |journal = International Journal of Forecasting | volume = 8 | pages = 69–80 | year = 1992 | doi=10.1016/0169-2070(92)90008-w | issue=1| citeseerx = 10.1.1.423.508 }}</ref>
*प्रायोगिक मनोविज्ञान में, आरएमएसडी का उपयोग यह आकलन करने के लिए किया जाता है कि व्यवहार के गणितीय या कम्प्यूटेशनल मॉडल अनुभवजन्य रूप से देखे गए व्यवहार को कितनी अच्छी तरह समझाते हैं।
*प्रायोगिक मनोविज्ञान में, आरएमएसडी का उपयोग यह आकलन करने के लिए किया जाता है कि व्यवहार के गणितीय या कम्प्यूटेशनल मॉडल अनुभवजन्य रूप से देखे गए व्यवहार को कितनी अच्छी तरह समझाते हैं।
*[[ गिस | गिस]] में, आरएमएसडी उपाय है जिसका उपयोग स्थानिक विश्लेषण और रिमोट सेंसिंग की सटीकता का आकलन करने के लिए किया जाता है।
*[[ गिस | गिस]] में, आरएमएसडी उपाय है जिसका उपयोग स्थानिक विश्लेषण और रिमोट सेंसिंग की स्पष्टता का आकलन करने के लिए किया जाता है।
*[[ हाइड्रोज्योलोजी | हाइड्रोज्योलोजी]] में, आरएमएसडी और एनआरएमएसडी का उपयोग भूजल मॉडल के अंशांकन का मूल्यांकन करने के लिए किया जाता है।<ref>{{cite book |title=Applied Groundwater Modeling: Simulation of Flow and Advective Transport |publisher=Academic Press |year=1992 |last=Anderson |first=M.P. |author2=Woessner, W.W.  |edition=2nd}}</ref>
*[[ हाइड्रोज्योलोजी | हाइड्रोज्योलोजी]] में, आरएमएसडी और एनआरएमएसडी का उपयोग भूजल मॉडल के अंशांकन का मूल्यांकन करने के लिए किया जाता है।<ref>{{cite book |title=Applied Groundwater Modeling: Simulation of Flow and Advective Transport |publisher=Academic Press |year=1992 |last=Anderson |first=M.P. |author2=Woessner, W.W.  |edition=2nd}}</ref>
*[[इमेजिंग विज्ञान]] में, आरएमएसडी [[चरम सिग्नल-टू-शोर अनुपात]] का हिस्सा है, उपाय जिसका उपयोग यह आकलन करने के लिए किया जाता है कि किसी छवि को फिर से बनाने की विधि मूल छवि के सापेक्ष कितना अच्छा प्रदर्शन करती है।
*[[इमेजिंग विज्ञान]] में, आरएमएसडी [[चरम सिग्नल-टू-शोर अनुपात]] का हिस्सा है, उपाय जिसका उपयोग यह आकलन करने के लिए किया जाता है कि किसी छवि को फिर से बनाने की विधि मूल छवि के सापेक्ष कितना अच्छा प्रदर्शन करती है।
*[[ कम्प्यूटेशनल तंत्रिका विज्ञान | कम्प्यूटेशनल तंत्रिका विज्ञान]] में, आरएमएसडी का उपयोग यह आकलन करने के लिए किया जाता है कि कोई सिस्टम किसी दिए गए मॉडल को कितनी अच्छी तरह सीखता है।<ref>[http://www.ocgy.ubc.ca/projects/clim.pred/NN/3.1/model.html Ensemble Neural Network Model<!-- Bot generated title -->]</ref>
*[[ कम्प्यूटेशनल तंत्रिका विज्ञान | कम्प्यूटेशनल तंत्रिका विज्ञान]] में, आरएमएसडी का उपयोग यह आकलन करने के लिए किया जाता है कि कोई सिस्टम किसी दिए गए मॉडल को कितनी अच्छी तरह सीखता है।<ref>[http://www.ocgy.ubc.ca/projects/clim.pred/NN/3.1/model.html Ensemble Neural Network Model<!-- Bot generated title -->]</ref>
*[[प्रोटीन परमाणु चुंबकीय अनुनाद स्पेक्ट्रोस्कोपी]] में, आरएमएसडी का उपयोग संरचनाओं के प्राप्त बंडल की गुणवत्ता का अनुमान लगाने के लिए उपाय के रूप में किया जाता है।
*[[प्रोटीन परमाणु चुंबकीय अनुनाद स्पेक्ट्रोस्कोपी]] में, आरएमएसडी का उपयोग संरचनाओं के प्राप्त बंडल की गुणवत्ता का अनुमान लगाने के लिए उपाय के रूप में किया जाता है।
*[[नेटफ्लिक्स पुरस्कार]] के लिए प्रस्तुतियों का मूल्यांकन परीक्षण डेटासेट के अज्ञात वास्तविक मूल्यों से आरएमएसडी का उपयोग करके किया गया था।
*[[नेटफ्लिक्स पुरस्कार]] के लिए प्रस्तुतियों का मूल्यांकन परीक्षण डेटासमुच्चय के अज्ञात वास्तविक मूल्यों से आरएमएसडी का उपयोग करके किया गया था।
*इमारतों की ऊर्जा खपत के अनुकरण में, आरएमएसई और सीवी (आरएमएसई) का उपयोग भवन के प्रदर्शन को मापने के लिए मॉडल को कैलिब्रेट करने के लिए किया जाता है।<ref>[http://www.bpi.org/Web%20Download/BPI%20Standards/BPI-2400-S-2012_Standard_Practice_for_Standardized_Qualification_of_Whole-House%20Energy%20Savings_9-28-12_sg.pdf ANSI/BPI-2400-S-2012: Standard Practice for Standardized Qualification of Whole-House Energy Savings Predictions by Calibration to Energy Use History]</ref>
*इमारतों की ऊर्जा खपत के अनुकरण में, आरएमएसई और सीवी (आरएमएसई) का उपयोग भवन के प्रदर्शन को मापने के लिए मॉडल को कैलिब्रेट करने के लिए किया जाता है।<ref>[http://www.bpi.org/Web%20Download/BPI%20Standards/BPI-2400-S-2012_Standard_Practice_for_Standardized_Qualification_of_Whole-House%20Energy%20Savings_9-28-12_sg.pdf ANSI/BPI-2400-S-2012: Standard Practice for Standardized Qualification of Whole-House Energy Savings Predictions by Calibration to Energy Use History]</ref>
*[[एक्स - रे क्रिस्टलोग्राफी]] में, आरएमएसडी (और आरएमएसजेड) का उपयोग आणविक आंतरिक निर्देशांक के विचलन को मापने के लिए किया जाता है जो कि पुस्तकालय मूल्यों से विचलित होता है।
*[[एक्स - रे क्रिस्टलोग्राफी]] में, आरएमएसडी (और आरएमएसजेड) का उपयोग आणविक आंतरिक निर्देशांक के विचलन को मापने के लिए किया जाता है जो कि पुस्तकालय मूल्यों से विचलित होता है।

Revision as of 20:43, 6 August 2023

मूल-माध्य-वर्ग विचलन (आरएमएसडी) या मूल-माध्य-वर्ग त्रुटि (आरएमएसई) मॉडल या अनुमानक द्वारा अनुमानित मूल्यों (प्रतिरूप या जनसंख्या मूल्यों) और देखे गए मूल्यों के मध्य अंतर का अधिकांशतः उपयोग किया जाने वाला माप है। आरएमएसडी अनुमानित मूल्यों और देखे गए मूल्यों या इन अंतरों के द्विघात माध्य के मध्य अंतर के दूसरे सैंपल मोवमेंट के वर्गमूल का प्रतिनिधित्व करता है। इन सांख्यिकीय विचलन को आंकड़ों में त्रुटियां और अवशेष कहा जाता है, जब गणना डेटा प्रतिरूप पर की जाती है जिसका उपयोग अनुमान के लिए किया गया था और जब प्रतिरूप से बाहर गणना की जाती है तो इन्हें त्रुटियां (या पूर्वानुमान त्रुटियां) कहा जाता है। आरएमएसडी विभिन्न डेटा बिंदुओं के लिए पूर्वानुमानों में त्रुटियों के परिमाण को पूर्वानुमानित शक्ति के ही माप में एकत्रित करने का कार्य करता है। आरएमएसडी किसी विशेष डेटासमुच्चय के लिए विभिन्न मॉडलों की पूर्वानुमान त्रुटियों की तुलना करने के लिए स्पष्टता और परिशुद्धता का माप है, न कि डेटासमुच्चय के मध्य, क्योंकि यह स्केल-निर्भर रहता है। [1]

आरएमएसडी सदैव गैर-ऋणात्मक होता है, और 0 का मान (व्यवहार में लगभग कभी प्राप्त नहीं किया गया) हैं यह डेटा के लिए एकदम फिट होने का संकेत देता हैं। सामान्यतः, कम आरएमएसडी उच्चतर से उत्तम होता है। चूँकि, विभिन्न प्रकार के डेटा की तुलना अमान्य होगी क्योंकि माप उपयोग की गई संख्याओं के मापदंड पर निर्भर होता है।

आरएमएसडी वर्ग त्रुटियों के औसत का वर्गमूल है। आरएमएसडी पर प्रत्येक त्रुटि का प्रभाव वर्ग त्रुटि के आकार के समानुपाती होता है | इस प्रकार बड़ी त्रुटियों का आरएमएसडी पर असंगत रूप से बड़ा प्रभाव पड़ता है। ऐसे परिणाम के रूप में, आरएमएसडी आउटलेर्स के प्रति संवेदनशील होता है। [2][3]


सूत्र

अनुमानित पैरामीटर के संबंध में अनुमानक के आरएमएसडी को माध्य वर्ग त्रुटि के वर्गमूल के रूप में परिभाषित किया गया है

निष्पक्ष अनुमानक के लिए, आरएमएसडी विचरण का वर्गमूल है, जिसे मानक विचलन के रूप में जाना जाता है।

प्रतिगमन के आश्रित वेरिएबल के समय t के लिए अनुमानित मूल्यों का आरएमएसडी, T समय पर देखे गए वेरिएबल के साथ, T के विभिन्न पूर्वानुमानों के लिए विचलन के वर्गों के माध्य के वर्गमूल के रूप में गणना की जाती है

(क्रास सेक्शनल डाटा पर प्रतिगमन के लिए, सबस्क्रिप्ट t को i द्वारा प्रतिस्थापित किया जाता है और T को n द्वारा प्रतिस्थापित किया जाता है।)

कुछ विषयों में, आरएमएसडी का उपयोग दो वस्तुओं के मध्य अंतर की तुलना करने के लिए किया जाता है जो भिन्न हो सकते हैं, जिनमें से किसी को भी मानक के रूप में स्वीकार नहीं किया जाता है। उदाहरण के लिए, दो समय श्रृंखलाओं के मध्य औसत अंतर को मापते समय और ,सूत्र बन जाता है


सामान्यीकरण

आरएमएसडी को सामान्य करने से विभिन्न मापदंडों वाले डेटासमुच्चय या मॉडल के मध्य तुलना की सुविधा मिलती है। यद्यपि साहित्य में सामान्यीकरण का कोई सुसंगत साधन नहीं है, सामान्य विकल्प मापे गए डेटा के माध्य या सीमा (अधिकतम मान शून्य से न्यूनतम मान के रूप में परिभाषित) होती हैं |[4]

या .

इस मान को सामान्यतः सामान्यीकृत मूल-माध्य-वर्ग विचलन या त्रुटि (एनआरएमएसडी या एनआरएमएसई) के रूप में जाना जाता है, और अधिकांशतः इसे प्रतिशत के रूप में व्यक्त किया जाता है, जहां यह कम मान कम अवशिष्ट विचरण का संकेत देते हैं। इसे भिन्नता गुणांक या 'प्रतिशत आरएमएस' भी कहा जाता है। यह अनेक स्तिथियों में, विशेष रूप से लघु प्रतिरूपों के लिए हैं, प्रतिरूप सीमा का प्रतिरूप के आकार से प्रभावित होने की संभावना होती है जो तुलना में बाधा उत्पन्न करती हैं।

आरएमएसडी को अधिक उपयोगी तुलना उपाय बनाने की अन्य संभावित विधि आरएमएसडी को अन्तःचतुर्थक श्रेणी द्वारा विभाजित करना है। आरएमएसडी को आईक्यूआर के साथ विभाजित करते समय सामान्यीकृत मूल्य लक्ष्य वेरिएबल में चरम मूल्यों के लिए कम संवेदनशील हो जाता है।

कहाँ

और के साथ जहां सी.डी.एफ−1क्वांटाइल फलन है।

माप के औसत मूल्य द्वारा सामान्यीकरण करते समय, अस्पष्टता से बचने के लिए आरएमएसडी, सीवी (आरएमएसडी) की भिन्नता के गुणांक शब्द का उपयोग किया जा सकता है।[5] यह मानक विचलन की जगह लेने वाले आरएमएसडी के साथ भिन्नता के गुणांक के अनुरूप होता है।


माध्य पूर्ण त्रुटि

कुछ शोधकर्ताओं ने मूल माध्य वर्ग विचलन के अतिरिक्त माध्य निरपेक्ष त्रुटि (एमएई) के उपयोग का पक्षसमर्थन करता है। आरएमएसडी की तुलना में व्याख्यात्मकता में एमएई को लाभ होता है। एमएई त्रुटियों के निरपेक्ष मूल्यों का औसत है। वर्ग त्रुटियों के औसत के वर्गमूल की तुलना में एमएई को समझना मौलिक रूप से सरल है। इसके अतिरिक्त, प्रत्येक त्रुटि के पूर्ण मूल्य के सीधे अनुपात में एमएई को प्रभावित करती है, जो आरएमएसडी के स्तिथियां में नहीं है।[2]


अनुप्रयोग

  • मौसम विज्ञान में, यह देखना कि गणित का मॉडल वायुमंडल के व्यवहार की कितनी प्रभावी पूर्वानुमान करता है।
  • जैव सूचना विज्ञान में, परमाणु स्थितियों का मूल-माध्य-वर्ग विचलन प्रोटीन संरचनात्मक संरेखण प्रोटीन के परमाणुओं के मध्य औसत दूरी का माप है।
  • ड्रग डिजाइन#संरचना-आधारित में, आरएमएसडी लिगैंड गठनात्मक समावयवता के क्रिस्टल संरचना और डॉकिंग (आण्विक) पूर्वानुमान के मध्य अंतर का माप है।
  • अर्थशास्त्र में, आरएमएसडी का उपयोग यह निर्धारित करने के लिए किया जाता है कि कोई आर्थिक मॉडल आर्थिक संकेतकों पर फिट बैठता है या नहीं। कुछ विशेषज्ञों ने तर्क दिया है कि आरएमएसडी रिलेटिव एब्सोल्यूट एरर की तुलना में कम विश्वसनीय है।[6]
  • प्रायोगिक मनोविज्ञान में, आरएमएसडी का उपयोग यह आकलन करने के लिए किया जाता है कि व्यवहार के गणितीय या कम्प्यूटेशनल मॉडल अनुभवजन्य रूप से देखे गए व्यवहार को कितनी अच्छी तरह समझाते हैं।
  • गिस में, आरएमएसडी उपाय है जिसका उपयोग स्थानिक विश्लेषण और रिमोट सेंसिंग की स्पष्टता का आकलन करने के लिए किया जाता है।
  • हाइड्रोज्योलोजी में, आरएमएसडी और एनआरएमएसडी का उपयोग भूजल मॉडल के अंशांकन का मूल्यांकन करने के लिए किया जाता है।[7]
  • इमेजिंग विज्ञान में, आरएमएसडी चरम सिग्नल-टू-शोर अनुपात का हिस्सा है, उपाय जिसका उपयोग यह आकलन करने के लिए किया जाता है कि किसी छवि को फिर से बनाने की विधि मूल छवि के सापेक्ष कितना अच्छा प्रदर्शन करती है।
  • कम्प्यूटेशनल तंत्रिका विज्ञान में, आरएमएसडी का उपयोग यह आकलन करने के लिए किया जाता है कि कोई सिस्टम किसी दिए गए मॉडल को कितनी अच्छी तरह सीखता है।[8]
  • प्रोटीन परमाणु चुंबकीय अनुनाद स्पेक्ट्रोस्कोपी में, आरएमएसडी का उपयोग संरचनाओं के प्राप्त बंडल की गुणवत्ता का अनुमान लगाने के लिए उपाय के रूप में किया जाता है।
  • नेटफ्लिक्स पुरस्कार के लिए प्रस्तुतियों का मूल्यांकन परीक्षण डेटासमुच्चय के अज्ञात वास्तविक मूल्यों से आरएमएसडी का उपयोग करके किया गया था।
  • इमारतों की ऊर्जा खपत के अनुकरण में, आरएमएसई और सीवी (आरएमएसई) का उपयोग भवन के प्रदर्शन को मापने के लिए मॉडल को कैलिब्रेट करने के लिए किया जाता है।[9]
  • एक्स - रे क्रिस्टलोग्राफी में, आरएमएसडी (और आरएमएसजेड) का उपयोग आणविक आंतरिक निर्देशांक के विचलन को मापने के लिए किया जाता है जो कि पुस्तकालय मूल्यों से विचलित होता है।
  • नियंत्रण सिद्धांत में, आरएमएसई का उपयोग राज्य पर्यवेक्षक के प्रदर्शन का मूल्यांकन करने के लिए गुणवत्ता उपाय के रूप में किया जाता है।[10]
  • द्रव गतिशीलता में, सामान्यीकृत मूल-माध्य-वर्ग विचलन (एनआरएमएसडी), भिन्नता का गुणांक (सीवी), और प्रतिशत आरएमएस का उपयोग प्रवाह व्यवहार की एकरूपता जैसे वेग प्रोफ़ाइल, तापमान वितरण, या गैस प्रजाति एकाग्रता को मापने के लिए किया जाता है। प्रवाह और थर्मल उपकरण और प्रक्रियाओं के डिजाइन को अनुकूलित करने के लिए मूल्य की तुलना उद्योग मानकों से की जाती है।

यह भी देखें

संदर्भ

  1. Hyndman, Rob J.; Koehler, Anne B. (2006). "पूर्वानुमान सटीकता के उपायों पर एक और नज़र". International Journal of Forecasting. 22 (4): 679–688. CiteSeerX 10.1.1.154.9771. doi:10.1016/j.ijforecast.2006.03.001.
  2. 2.0 2.1 Pontius, Robert; Thontteh, Olufunmilayo; Chen, Hao (2008). "वास्तविक चर साझा करने वाले मानचित्रों के बीच एकाधिक रिज़ॉल्यूशन तुलना के लिए जानकारी के घटक". Environmental Ecological Statistics. 15 (2): 111–142. doi:10.1007/s10651-007-0043-y.
  3. Willmott, Cort; Matsuura, Kenji (2006). "स्थानिक प्रक्षेपकों के प्रदर्शन का मूल्यांकन करने के लिए त्रुटि के आयामी मापों के उपयोग पर". International Journal of Geographical Information Science. 20: 89–102. doi:10.1080/13658810500286976.
  4. "तटीय इनलेट्स अनुसंधान कार्यक्रम (सीआईआरपी) विकी - सांख्यिकी". Retrieved 4 February 2015.
  5. "FAQ: What is the coefficient of variation?". Retrieved 19 February 2019.
  6. Armstrong, J. Scott; Collopy, Fred (1992). "Error Measures For Generalizing About Forecasting Methods: Empirical Comparisons" (PDF). International Journal of Forecasting. 8 (1): 69–80. CiteSeerX 10.1.1.423.508. doi:10.1016/0169-2070(92)90008-w.
  7. Anderson, M.P.; Woessner, W.W. (1992). Applied Groundwater Modeling: Simulation of Flow and Advective Transport (2nd ed.). Academic Press.
  8. Ensemble Neural Network Model
  9. ANSI/BPI-2400-S-2012: Standard Practice for Standardized Qualification of Whole-House Energy Savings Predictions by Calibration to Energy Use History
  10. https://kalman-filter.com/root-mean-square-error