परिशुद्धता और यथार्थता: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 1: Line 1:
{{Short description|Characterization of measurement error}}
{{Short description|Characterization of measurement error}}
'''परिशुद्धता और यथार्थता''' ''[[अवलोकन]]'' संबंधी त्रुटि के दो उपाय है। सटीकता यह है कि माप (अवलोकन या रीडिंग) के दिए गए सेट उनके वास्तविक मूल्य के कितने करीब होते है, जबकि ''परिशुद्धता'' [[मापन]] एक दूसरे के कितने करीब होते है।
'''परिशुद्धता और यथार्थता''' ''[[अवलोकन]]'' संबंधी त्रुटि के दो उपाय है। सटीकता यह है कि माप (अवलोकन या रीडिंग) के दिए गए सेट उनके वास्तविक मूल्य के कितने निकट होते है, जबकि ''परिशुद्धता'' [[मापन]] एक दूसरे के कितने निकट होते है।


दूसरे शब्दों में, सटीकता यादृच्छिक त्रुटियों का विवरण है, सांख्यिकीय परिवर्तनशीलता का एक उपाय होता है। सटीकता की दो परिभाषाएँ है:
दूसरे शब्दों में, सटीकता यादृच्छिक त्रुटियों का विवरण है, सांख्यिकीय परिवर्तनशीलता का एक उपाय होता है। सटीकता की दो परिभाषाएँ है:
Line 7: Line 7:
उपरोक्त "सटीकता" की पहली, अधिक सामान्य परिभाषा में, अवधारणा "परिशुद्धता" से स्वतंत्र है, इसलिए डेटा के एक विशेष सेट को सटीक नहीं कहा जा सकता है।
उपरोक्त "सटीकता" की पहली, अधिक सामान्य परिभाषा में, अवधारणा "परिशुद्धता" से स्वतंत्र है, इसलिए डेटा के एक विशेष सेट को सटीक नहीं कहा जा सकता है।


सरल शब्दों में, एक ही मात्रा के बार-बार माप से एक सांख्यिकीय नमूना या डेटा बिंदुओं का सेट दिया जाता है, नमूना या सेट को सटीक कहा जा सकता है यदि उनका औसत मापी जाने वाली मात्रा के सही मूल्य के करीब होता है, जबकि सटीक सेट कर सकते है कहा जा सकता है यदि उनका मानक विचलन अपेक्षाकृत छोटा होता है।
सरल शब्दों में, एक ही मात्रा के बार-बार माप से एक सांख्यिकीय नमूना या डेटा बिंदुओं का सेट दिया जाता है, नमूना या सेट को सटीक कहा जा सकता है यदि उनका औसत मापी जाने वाली मात्रा के सही मूल्य के निकट होता है, जबकि सटीक सेट कर सकते है कहा जा सकता है यदि उनका मानक विचलन अपेक्षाकृत छोटा होता है।


== सामान्य तकनीकी परिभाषा ==
== सामान्य तकनीकी परिभाषा ==
[[File:Accuracy and precision.svg|thumb|300px|सटीकता माप परिणामों की स्वीकृत मूल्य की निकटता है; परिशुद्धता वह डिग्री है जिस पर अपरिवर्तित स्थितियों के अनुसार दोहराने योग्यता (या पुनरुत्पादन) माप समान परिणाम दिखाते है।]][[विज्ञान]] और [[अभियांत्रिकी]] के क्षेत्र में, [[माप]] प्रणाली की सटीकता किसी [[मात्रा]] के माप की उस मात्रा के वास्तविक मान के निकटता की डिग्री होती है।<ref name=metrology_terms>[http://www.bipm.org/utils/common/documents/jcgm/JCGM_200_2008.pdf JCGM 200:2008 मैट्रोलोजी की अंतर्राष्ट्रीय शब्दावली] — बुनियादी और सामान्य अवधारणाएं और संबद्ध शर्तें (VIM)</ref> पुनरुत्पादनीयता और पुनरावर्तनीयता से संबंधित एक माप प्रणाली की सटीकता, वह डिग्री है जिस पर अपरिवर्तित स्थितियों के अनुसार दोहराए गए माप समान [[परिणाम]] दिखाते है।<ref name=metrology_terms /><ref name=Taylor>{{cite book  |title=An Introduction to Error Analysis: The Study of Uncertainties in Physical Measurements |first= John Robert |last= Taylor |url=https://books.google.com/books?id=giFQcZub80oC&pg=PA128 |pages=128–129 |isbn=0-935702-75-X |year=1999 |publisher=University Science Books}}</ref> यद्यपि बोलचाल के उपयोग में सटीकता के दो शब्द समानार्थक हो सकते है, लेकिन वैज्ञानिक पद्धति के संदर्भ में जानबूझकर इसको विपरीत किया जाता है।
[[File:Accuracy and precision.svg|thumb|300px|सटीकता माप परिणामों की स्वीकृत मूल्य की निकटता है; परिशुद्धता वह डिग्री है जिस पर अपरिवर्तित स्थितियों के अनुसार दोहराने योग्यता (या पुनरुत्पादन) माप समान परिणाम दिखाते है।]][[विज्ञान]] और [[अभियांत्रिकी]] के क्षेत्र में, [[माप]] प्रणाली की सटीकता किसी [[मात्रा]] के माप की उस मात्रा के वास्तविक मान के निकटता की डिग्री होती है।<ref name=metrology_terms>[http://www.bipm.org/utils/common/documents/jcgm/JCGM_200_2008.pdf JCGM 200:2008 मैट्रोलोजी की अंतर्राष्ट्रीय शब्दावली] — बुनियादी और सामान्य अवधारणाएं और संबद्ध शर्तें (VIM)</ref> पुनरुत्पादनीयता और पुनरावर्तनीयता से संबंधित एक माप प्रणाली की सटीकता, वह डिग्री है जिस पर अपरिवर्तित स्थितियों के अनुसार दोहराए गए माप समान [[परिणाम]] दिखाते है।<ref name=metrology_terms /><ref name=Taylor>{{cite book  |title=An Introduction to Error Analysis: The Study of Uncertainties in Physical Measurements |first= John Robert |last= Taylor |url=https://books.google.com/books?id=giFQcZub80oC&pg=PA128 |pages=128–129 |isbn=0-935702-75-X |year=1999 |publisher=University Science Books}}</ref> यद्यपि बोलचाल के उपयोग में सटीकता के दो शब्द समानार्थक हो सकते है, लेकिन वैज्ञानिक पद्धति के संदर्भ में अभिप्रायपूर्वक इसको विपरीत किया जाता है।


आँकड़ों का क्षेत्र, जहाँ माप की व्याख्या एक केंद्रीय भूमिका निभाती है, सटीकता के अतिरिक्त पूर्वाग्रह और परिवर्तनशीलता का उपयोग करना पसंद करती है: पूर्वाग्रह अशुद्धि की मात्रा होती है और परिवर्तनशीलता भी अशुद्धि की मात्रा होती है।
आँकड़ों का क्षेत्र, जहाँ माप की व्याख्या एक केंद्रीय भूमिका निभाती है, सटीकता के अतिरिक्त पूर्वाग्रह और परिवर्तनशीलता का उपयोग करना पसंद करती है: पूर्वाग्रह अशुद्धि की मात्रा होती है और परिवर्तनशीलता भी अशुद्धि की मात्रा होती है।
Line 29: Line 29:
औद्योगिक उपकरण में, सटीकता माप की सहनशीलता, या उपकरण का संचरण होता है और जब उपकरण सामान्य परिचालन स्थितियों में उपयोग किया जाता है तो त्रुटियों की सीमा को परिभाषित करता है।<ref>Creus, Antonio. ''Instrumentación Industrial''{{citation needed|date=February 2015}}</ref>
औद्योगिक उपकरण में, सटीकता माप की सहनशीलता, या उपकरण का संचरण होता है और जब उपकरण सामान्य परिचालन स्थितियों में उपयोग किया जाता है तो त्रुटियों की सीमा को परिभाषित करता है।<ref>Creus, Antonio. ''Instrumentación Industrial''{{citation needed|date=February 2015}}</ref>


आदर्श रूप से एक माप उपकरण सटीक है, माप के साथ सभी वास्तविक मूल्य के करीब और कसकर क्लस्टर किए गए है। माप प्रक्रिया की सटीकता सामान्यतः कुछ ट्रेस करने योग्य संदर्भ मानक को बार-बार मापने के द्वारा स्थापित की जाती है। इस तरह के मानकों को इंटरनेशनल सिस्टम ऑफ यूनिट्स (फ्रेंच से संक्षिप्त एसआई: सिस्टेम इंटरनेशनल डी'यूनिट्स) में परिभाषित किया गया था और संयुक्त राज्य अमेरिका में नेशनल इंस्टीट्यूट ऑफ स्टैंडर्ड्स एंड टेक्नोलॉजी जैसे राष्ट्रीय मानक संगठनों द्वारा बनाए रखा गया था।
आदर्श रूप से एक माप उपकरण सटीक है, माप के साथ सभी वास्तविक मूल्य के निकट और सन्निकट समूह किए गए है। माप प्रक्रिया की सटीकता सामान्यतः कुछ ट्रेस करने योग्य संदर्भ मानक को बार-बार मापने के द्वारा स्थापित की जाती है। इस तरह के मानकों को इंटरनेशनल सिस्टम ऑफ यूनिट्स (फ्रेंच से संक्षिप्त एसआई: सिस्टेम इंटरनेशनल डी'यूनिट्स) में परिभाषित किया गया था और संयुक्त राज्य अमेरिका में नेशनल इंस्टीट्यूट ऑफ स्टैंडर्ड्स एंड टेक्नोलॉजी जैसे राष्ट्रीय मानक संगठनों द्वारा बनाए रखा गया था।


यह तब भी लागू होता है जब माप दोहराए जाते है और औसत होते है। उस स्थिति में, शब्द मानक त्रुटि ठीक से लागू होती है: औसत की शुद्धता औसत माप की संख्या के वर्गमूल से विभाजित प्रक्रिया के ज्ञात मानक विचलन के बराबर होती है। इसके अतिरिक्त, [[केंद्रीय सीमा प्रमेय]] से पता चलता है कि औसत मापों की संभाव्यता वितरण व्यक्तिगत मापों की तुलना में सामान्य वितरण के करीब होता है।
यह तब भी लागू होता है जब माप दोहराए जाते है और औसत होते है। उस स्थिति में, शब्द मानक त्रुटि ठीक से लागू होती है: औसत की शुद्धता औसत माप की संख्या के वर्गमूल से विभाजित प्रक्रिया के ज्ञात मानक विचलन के बराबर होती है। इसके अतिरिक्त, [[केंद्रीय सीमा प्रमेय]] से पता चलता है कि औसत मापों की संभाव्यता वितरण व्यक्तिगत मापों की तुलना में सामान्य वितरण के निकट होता है।


सटीकता के संबंध में हम भेद कर सकते है:
सटीकता के संबंध में हम भेद कर सकते है:
* माप के माध्य और संदर्भ मान के बीच का अंतर, अनुमानक का पूर्वाग्रह। [[अंशांकन]] के लिए पूर्वाग्रह की स्थापना और सुधार आवश्यक है।
* माप के माध्य और संदर्भ मान के बीच का अंतर, अनुमानक का पूर्वाग्रह है। [[अंशांकन]] के लिए पूर्वाग्रह की स्थापना और सुधार आवश्यक है।
* उस और परिशुद्धता का संयुक्त प्रभाव।
* उस और परिशुद्धता का संयुक्त प्रभाव है।


विज्ञान और अभियांत्रिकी में एक सामान्य परिपाटी महत्वपूर्ण अंकों के माध्यम से सटीक रूप से व्यक्त करता है। जहां स्पष्ट रूप से नहीं कहा गया है, त्रुटि का मार्जिन अंतिम महत्वपूर्ण स्थान के मूल्य का आधा समझा जाता है। उदाहरण के लिए, 843.6 मीटर, या 843.0 मीटर, या 800.0 मीटर की रिकॉर्डिंग में 0.05 मीटर का मार्जिन होता है (अंतिम महत्वपूर्ण स्थान दसवां स्थान है), जबकि 843 मीटर की रिकॉर्डिंग में 0.5 मीटर की त्रुटि का मार्जिन होता है।
विज्ञान और अभियांत्रिकी में एक सामान्य परिपाटी महत्वपूर्ण अंकों के माध्यम से सटीक रूप से व्यक्त करता है। जहां स्पष्ट रूप से नहीं कहा गया है, त्रुटि का मार्जिन अंतिम महत्वपूर्ण स्थान के मूल्य का आधा समझा जाता है। उदाहरण के लिए, 843.6 मीटर, या 843.0 मीटर, या 800.0 मीटर की रिकॉर्डिंग में 0.05 मीटर का मार्जिन होता है (अंतिम महत्वपूर्ण स्थान दसवां स्थान है), जबकि 843 मीटर की रिकॉर्डिंग में 0.5 मीटर की त्रुटि का मार्जिन होता है।
Line 69: Line 69:




जहां टीपी = सही सकारात्मक; एफपी = झूठी सकारात्मक; टीएन = सही नकारात्मक; एफएन = मिथ्या नकारात्मक
जहां TP = True positive; FP = False positive; TN = True negative; FN = False negative


ध्यान दें कि, इस संदर्भ में, ISO 5725-1 द्वारा परिभाषित सत्यता और परिशुद्धता की अवधारणाएं लागू नहीं होती है। एक कारण यह है कि मात्रा का एक "सही मूल्य" नहीं है, जबकि हर स्थिति के लिए दो संभावित वास्तविक मूल्य होते है, जबकि सटीकता सभी स्थितियों में औसत होती है और इसलिए दोनों मूल्यों को ध्यान में रखा जाता है। चूँकि, इस संदर्भ में [[सटीक और याद]] शब्द का उपयोग सूचना पुनर्प्राप्ति के क्षेत्र से उत्पन्न एक अलग मीट्रिक के अर्थ के लिए किया जाता है।
ध्यान दें कि, इस संदर्भ में, ISO 5725-1 द्वारा परिभाषित सत्यता और परिशुद्धता की अवधारणाएं लागू नहीं होती है। एक कारण यह है कि मात्रा का एक "सही मूल्य" नहीं है, जबकि हर स्थिति के लिए दो संभावित वास्तविक मूल्य होते है, जबकि सटीकता सभी स्थितियों में औसत होती है और इसलिए दोनों मूल्यों को ध्यान में रखा जाता है। चूँकि, इस संदर्भ में [[सटीक और याद]] शब्द का उपयोग सूचना पुनर्प्राप्ति के क्षेत्र से उत्पन्न एक अलग मीट्रिक के अर्थ के लिए किया जाता है।
Line 85: Line 85:
== सूचना प्रणाली में ==
== सूचना प्रणाली में ==


सूचना पुनर्प्राप्ति प्रणाली, जैसे कि [[डेटाबेस]] और वेब सर्च इंजन, का मूल्यांकन कई अलग-अलग मेट्रिक्स द्वारा किया जाता है, जिनमें से कुछ भ्रम मैट्रिक्स से प्राप्त होते है, जो परिणामों को सही सकारात्मक (दस्तावेज़ों को सही ढंग से पुनर्प्राप्त), सच्चे नकारात्मक (दस्तावेज़ों को सही ढंग से पुनर्प्राप्त नहीं किया गया) में विभाजित करते है। झूठे सकारात्मक (दस्तावेज़ गलत तरीके से पुनर्प्राप्त), और झूठे नकारात्मक (दस्तावेज़ गलत तरीके से पुनर्प्राप्त नहीं किए गए)। सामान्यतः उपयोग किए जाने वाले मेट्रिक्स में सटीकता और रिकॉल की धारणाएं सम्मलित होती है। इस संदर्भ में, सटीकता को पुनः प्राप्त दस्तावेजों के अंश के रूप में परिभाषित किया गया है जो मानव द्वारा चुने गए जमीनी [[सच्चाई]] प्रासंगिक परिणामों के एक सेट का उपयोग करके क्वेरी के लिए प्रासंगिक होते है (सच्चे सकारात्मक को सही + गलत सकारात्मक से विभाजित किया गया है)। रिकॉल को प्रासंगिक दस्तावेजों की कुल संख्या की तुलना में पुनर्प्राप्त किए गए प्रासंगिक दस्तावेजों के अंश के रूप में परिभाषित किया गया है (वास्तविक सकारात्मक सकारात्मक सकारात्मक + गलत नकारात्मक द्वारा विभाजित)। सामान्यतः, सटीकता की मीट्रिक का उपयोग किया जाता है, इसे दस्तावेजों की कुल संख्या से विभाजित सही वर्गीकरणों (वास्तविक सकारात्मक और वास्तविक नकारात्मक) की कुल संख्या के रूप में परिभाषित किया जाता है।
सूचना पुनर्प्राप्ति प्रणाली, जैसे कि [[डेटाबेस]] और वेब सर्च इंजन, का मूल्यांकन कई अलग-अलग मेट्रिक्स द्वारा किया जाता है, जिनमें से कुछ भ्रम मैट्रिक्स से प्राप्त होते है, जो परिणामों को ट्रू पॉजिटिव (आलेखों को सही ढंग से पुनर्प्राप्त), ट्रू निगेटिव (आलेखों को सही ढंग से पुनर्प्राप्त नहीं किया गया) में विभाजित करते है। फॉल्स पॉजिटिव (आलेख गलत तरीके से पुनर्प्राप्त), और फॉल्स नेगेटिव (आलेख गलत तरीके से पुनर्प्राप्त नहीं किए गए)। सामान्यतः उपयोग किए जाने वाले मेट्रिक्स में सटीकता और रिकॉल की धारणाएं सम्मलित होती है। इस संदर्भ में, सटीकता को पुनः प्राप्त दस्तावेजों के अंश के रूप में परिभाषित किया गया है जो मानव द्वारा चुने गए जमीनी [[सच्चाई]] प्रासंगिक परिणामों के एक सेट का उपयोग करके क्वेरी के लिए प्रासंगिक होते है (सच्चे सकारात्मक को सही + गलत सकारात्मक से विभाजित किया गया है)। रिकॉल को प्रासंगिक दस्तावेजों की कुल संख्या की तुलना में पुनर्प्राप्त किए गए प्रासंगिक दस्तावेजों के अंश के रूप में परिभाषित किया गया है (वास्तविक सकारात्मक सकारात्मक सकारात्मक + गलत नकारात्मक द्वारा विभाजित)। सामान्यतः, सटीकता की मीट्रिक का उपयोग किया जाता है, इसे दस्तावेजों की कुल संख्या से विभाजित सही वर्गीकरणों (वास्तविक सकारात्मक और वास्तविक नकारात्मक) की कुल संख्या के रूप में परिभाषित किया जाता है।


इनमें से कोई भी मेट्रिक्स परिणामों की रैंकिंग को ध्यान में नहीं रखता है। वेब खोज इंजनों के लिए रैंकिंग बहुत महत्वपूर्ण होती है क्योंकि पाठक संभवतः ही कभी परिणामों के पहले पृष्ठ से आगे जाते है, और वेब पर बहुत सारे दस्तावेज़ मैन्युअल रूप से उन सभी को वर्गीकृत करने के लिए है कि क्या उन्हें किसी खोज से सम्मलित किया जाना चाहिए या बाहर रखा जाना चाहिए। परिणामों की एक विशेष संख्या में कटऑफ जोड़ने से रैंकिंग को कुछ हद तक ध्यान में रखा जाता है। उदाहरण के लिए, k पर माप सटीकता, केवल शीर्ष दस (k=10) खोज परिणामों को देखते हुए परिशुद्धता का माप होता है। अधिक परिष्कृत मेट्रिक्स, जैसे कि [[रियायती संचयी लाभ]], प्रत्येक व्यक्तिगत रैंकिंग को ध्यान में रखते है, और सामान्यतः इसका उपयोग तब किया जाता है जब यह महत्वपूर्ण होता है।
इनमें से कोई भी मेट्रिक्स परिणामों की रैंकिंग को ध्यान में नहीं रखता है। वेब खोज इंजनों के लिए रैंकिंग बहुत महत्वपूर्ण होती है क्योंकि पाठक संभवतः ही कभी परिणामों के पहले पृष्ठ से आगे जाते है, और वेब पर बहुत सारे आलेख मैन्युअल रूप से उन सभी को वर्गीकृत करने के लिए है कि क्या उन्हें किसी खोज से सम्मलित किया जाना चाहिए या बाहर रखा जाना चाहिए। परिणामों की एक विशेष संख्या में कटऑफ जोड़ने से रैंकिंग को कुछ हद तक ध्यान में रखा जाता है। उदाहरण के लिए, k पर माप सटीकता, केवल शीर्ष दस (k=10) खोज परिणामों को देखते हुए परिशुद्धता का माप होता है। अधिक परिष्कृत मेट्रिक्स, जैसे कि [[रियायती संचयी लाभ]], प्रत्येक व्यक्तिगत रैंकिंग को ध्यान में रखते है, और सामान्यतः इसका उपयोग तब किया जाता है जब यह महत्वपूर्ण होता है।


== संज्ञानात्मक प्रणालियों में ==
== संज्ञानात्मक प्रणालियों में ==
Line 111: Line 111:
* आंकड़ों की महत्ता
* आंकड़ों की महत्ता
{{div col end}}
{{div col end}}
{{Machine learning evaluation metrics}}


==संदर्भ==
==संदर्भ==

Revision as of 11:23, 9 February 2023

परिशुद्धता और यथार्थता अवलोकन संबंधी त्रुटि के दो उपाय है। सटीकता यह है कि माप (अवलोकन या रीडिंग) के दिए गए सेट उनके वास्तविक मूल्य के कितने निकट होते है, जबकि परिशुद्धता मापन एक दूसरे के कितने निकट होते है।

दूसरे शब्दों में, सटीकता यादृच्छिक त्रुटियों का विवरण है, सांख्यिकीय परिवर्तनशीलता का एक उपाय होता है। सटीकता की दो परिभाषाएँ है:

  1. अधिक सामान्यतः, यह केवल व्यवस्थित त्रुटियों का विवरण है, केंद्रीय प्रवृत्ति के दिए गए माप के सांख्यिकीय पूर्वाग्रह का एक उपाय होता है कम सटीकता परिणाम और वास्तविक मान के बीच के अंतर का कारण बनती है, आईएसओ इसे 'सत्यता' कहता है।
  2. वैकल्पिक रूप से, आईएसओ दोनों प्रकार की अवलोकन संबंधी त्रुटि (यादृच्छिक और व्यवस्थित) के संयोजन का वर्णन करने के रूप में सटीकता को परिभाषित करता है[1] इसलिए उच्च सटीकता और उच्च सत्यता दोनों की आवश्यकता होती है।

उपरोक्त "सटीकता" की पहली, अधिक सामान्य परिभाषा में, अवधारणा "परिशुद्धता" से स्वतंत्र है, इसलिए डेटा के एक विशेष सेट को सटीक नहीं कहा जा सकता है।

सरल शब्दों में, एक ही मात्रा के बार-बार माप से एक सांख्यिकीय नमूना या डेटा बिंदुओं का सेट दिया जाता है, नमूना या सेट को सटीक कहा जा सकता है यदि उनका औसत मापी जाने वाली मात्रा के सही मूल्य के निकट होता है, जबकि सटीक सेट कर सकते है कहा जा सकता है यदि उनका मानक विचलन अपेक्षाकृत छोटा होता है।

सामान्य तकनीकी परिभाषा

सटीकता माप परिणामों की स्वीकृत मूल्य की निकटता है; परिशुद्धता वह डिग्री है जिस पर अपरिवर्तित स्थितियों के अनुसार दोहराने योग्यता (या पुनरुत्पादन) माप समान परिणाम दिखाते है।

विज्ञान और अभियांत्रिकी के क्षेत्र में, माप प्रणाली की सटीकता किसी मात्रा के माप की उस मात्रा के वास्तविक मान के निकटता की डिग्री होती है।[2] पुनरुत्पादनीयता और पुनरावर्तनीयता से संबंधित एक माप प्रणाली की सटीकता, वह डिग्री है जिस पर अपरिवर्तित स्थितियों के अनुसार दोहराए गए माप समान परिणाम दिखाते है।[2][3] यद्यपि बोलचाल के उपयोग में सटीकता के दो शब्द समानार्थक हो सकते है, लेकिन वैज्ञानिक पद्धति के संदर्भ में अभिप्रायपूर्वक इसको विपरीत किया जाता है।

आँकड़ों का क्षेत्र, जहाँ माप की व्याख्या एक केंद्रीय भूमिका निभाती है, सटीकता के अतिरिक्त पूर्वाग्रह और परिवर्तनशीलता का उपयोग करना पसंद करती है: पूर्वाग्रह अशुद्धि की मात्रा होती है और परिवर्तनशीलता भी अशुद्धि की मात्रा होती है।

एक माप प्रणाली सटीक हो सकती है या सटीक नहीं भी हो सकती है, या दोनों हो सकते है। उदाहरण के लिए, यदि किसी प्रयोग में एक व्यवस्थित त्रुटि होती है, तो नमूना आकार बढ़ाने से सामान्यतः सटीकता बढ़ जाती है लेकिन सटीकता में सुधार नहीं होता है। परिणाम त्रुटिपूर्ण प्रयोग से परिणामों की एक सुसंगत लेकिन गलत स्ट्रिंग होती है। व्यवस्थित त्रुटि को खत्म करने से सटीकता में सुधार होता है लेकिन सटीकता में बदलाव नहीं होता है।

एक माप प्रणाली को वैध माना जाता है यह सटीक हो सकते है या सटीक नहीं भी हो सकते है। संबंधित शब्दों में पूर्वाग्रह (गैर-यादृच्छिक या निर्देशित प्रभाव एक कारक या स्वतंत्र चर से असंबंधित कारकों के कारण) और त्रुटि (यादृच्छिक परिवर्तनशीलता) सम्मलित होते है।

शब्दावली को अप्रत्यक्ष मापों पर भी लागू किया जाता है - अर्थात, देखे गए डेटा से कम्प्यूटेशनल प्रक्रिया द्वारा प्राप्त मान होता है।

सटीकता के अतिरिक्त, मापन में माप संकल्प भी हो सकता है, जो अंतर्निहित भौतिक मात्रा में सबसे छोटा परिवर्तन होता है जो माप में प्रतिक्रिया उत्पन्न करता है।

संख्यात्मक विश्लेषण में, सटीकता भी सही मूल्य की गणना की मंहगाई है, जबकि परिशुद्धता प्रतिनिधित्व का संकल्प है, सामान्यतः दशमलव या बाइनरी अंकों की संख्या द्वारा परिभाषित किया जाता है।

न्य दृष्टि से, सटीकता मुख्य रूप से आग की सटीकता (जस्टसी डी टीआईआर) को संदर्भित करती है, लक्ष्य के केंद्र में और उसके आसपास शॉट्स के समूह की निकटता द्वारा व्यक्त की गई आग की सटीकता है।[4]

परिमाणीकरण

औद्योगिक उपकरण में, सटीकता माप की सहनशीलता, या उपकरण का संचरण होता है और जब उपकरण सामान्य परिचालन स्थितियों में उपयोग किया जाता है तो त्रुटियों की सीमा को परिभाषित करता है।[5]

आदर्श रूप से एक माप उपकरण सटीक है, माप के साथ सभी वास्तविक मूल्य के निकट और सन्निकट समूह किए गए है। माप प्रक्रिया की सटीकता सामान्यतः कुछ ट्रेस करने योग्य संदर्भ मानक को बार-बार मापने के द्वारा स्थापित की जाती है। इस तरह के मानकों को इंटरनेशनल सिस्टम ऑफ यूनिट्स (फ्रेंच से संक्षिप्त एसआई: सिस्टेम इंटरनेशनल डी'यूनिट्स) में परिभाषित किया गया था और संयुक्त राज्य अमेरिका में नेशनल इंस्टीट्यूट ऑफ स्टैंडर्ड्स एंड टेक्नोलॉजी जैसे राष्ट्रीय मानक संगठनों द्वारा बनाए रखा गया था।

यह तब भी लागू होता है जब माप दोहराए जाते है और औसत होते है। उस स्थिति में, शब्द मानक त्रुटि ठीक से लागू होती है: औसत की शुद्धता औसत माप की संख्या के वर्गमूल से विभाजित प्रक्रिया के ज्ञात मानक विचलन के बराबर होती है। इसके अतिरिक्त, केंद्रीय सीमा प्रमेय से पता चलता है कि औसत मापों की संभाव्यता वितरण व्यक्तिगत मापों की तुलना में सामान्य वितरण के निकट होता है।

सटीकता के संबंध में हम भेद कर सकते है:

  • माप के माध्य और संदर्भ मान के बीच का अंतर, अनुमानक का पूर्वाग्रह है। अंशांकन के लिए पूर्वाग्रह की स्थापना और सुधार आवश्यक है।
  • उस और परिशुद्धता का संयुक्त प्रभाव है।

विज्ञान और अभियांत्रिकी में एक सामान्य परिपाटी महत्वपूर्ण अंकों के माध्यम से सटीक रूप से व्यक्त करता है। जहां स्पष्ट रूप से नहीं कहा गया है, त्रुटि का मार्जिन अंतिम महत्वपूर्ण स्थान के मूल्य का आधा समझा जाता है। उदाहरण के लिए, 843.6 मीटर, या 843.0 मीटर, या 800.0 मीटर की रिकॉर्डिंग में 0.05 मीटर का मार्जिन होता है (अंतिम महत्वपूर्ण स्थान दसवां स्थान है), जबकि 843 मीटर की रिकॉर्डिंग में 0.5 मीटर की त्रुटि का मार्जिन होता है।

अनुगामी शून्य और कोई दशमलव बिंदु के साथ 8,000 मीटर की रीडिंग अस्पष्ट है, अनुगामी शून्य महत्वपूर्ण आंकड़े के रूप में आशयित हो भी सकते है और नहीं भी हो सकते है। इस अस्पष्टता से बचने के लिए, संख्या को वैज्ञानिक संकेतन में प्रदर्शित किया जा सकता है: 8.0 × 103 m इंगित करता है कि पहला शून्य महत्वपूर्ण है (इसलिए 50 मीटर का मार्जिन) जबकि 8.000 × 103 m इंगित करता है कि सभी तीन शून्य महत्वपूर्ण है, जो 0.5 मी मार्जिन देते है। इसी तरह, कोई बुनियादी माप इकाई के गुणकों का उपयोग कर सकता है: 8.0 किमी 8.0 × 103 m के बराबर होता है। यह 0.05 किमी (50 मीटर) के मार्जिन को इंगित करता है। चूंकि, इस सम्मेलन पर निर्भरता से उन स्रोतों से डेटा स्वीकार करते समय गलत सटीक त्रुटियां हो सकती है जो इसका पालन नहीं करते है। उदाहरण के लिए, 153,753 जैसी संख्या की रिपोर्ट करने वाला स्रोत सटीकता +/- 5,000 के साथ ऐसा लगता है कि इसमें सटीकता +/- 0.5 है। अधिवेशन के अनुसार इसे 154,000 तक गोल किया गया है।

वैकल्पिक रूप से, एक वैज्ञानिक संदर्भ में, यदि त्रुटि के मार्जिन को अधिक सटीकता के साथ इंगित करना वांछित है, तो एक संकेतन का उपयोग किया जा सकता है जैसे 7.54398(23) × 10−10 m का उपयोग किया जा सकता है, मतलब बीच की एक सीमा 7.54375 और 7.54421 × 10−10 m.

परिशुद्धता में सम्मलित है:

  • पुनरावृत्ति - एक ही उपकरण और ऑपरेटर का उपयोग करके स्थितियों को स्थिर रखने के लिए सभी प्रयास किए जाने और कम समय अवधि के दौरान दोहराए जाने पर होने वाली भिन्नता, और
  • पुनरुत्पादन - विभिन्न उपकरणों और ऑपरेटरों के बीच एक ही माप प्रक्रिया का उपयोग करके उत्पन्न होने वाली भिन्नता, और लंबी अवधि होना है।

अभियांत्रिकी में, सटीकता को अधिकांशतः लिए गए मापों के तीन गुना मानक विचलन के रूप में लिया जाता है, जो उस सीमा का प्रतिनिधित्व करता है जिसमें 99.73% माप हो सकते है।[6] उदाहरण के लिए, मानव शरीर को मापने वाला एक एर्गोनोमिस्ट आश्वस्त हो सकता है कि उनके निकाले गए माप का 99.73% ± 0.7 सेमी के भीतर आता है - यदि GRYPHON प्रसंस्करण प्रणाली का उपयोग कर रहा है - या ± 13 सेमी - यदि असंसाधित डेटा का उपयोग कर रहा है।[7]

आईएसओ परिभाषा (आईएसओ 5725)

आईएसओ 5725-1 के अनुसार, सटीकता में सत्यता (माप परिणामों की वास्तविक मूल्य से निकटता) और सटीकता (माप की पुनरावर्तनीयता या पुनरुत्पादन) सम्मलित है।

1994 में आईएसओ 5725 श्रृंखला के मानकों के प्रकाशन के साथ इन शब्दों के अर्थ में एक बदलाव दिखाई दिया था, जो 2008 के "बीआईपीएम इंटरनेशनल वोकैबुलरी ऑफ मेट्रोलॉजी" (वीआईएम), आइटम 2.13 और 2.14 के अंक में भी परिलक्षित हुआ था।[2]

आईएसओ 5725-1 के अनुसार,[1] सामान्य शब्द "सटीकता" का उपयोग वास्तविक मूल्य के माप की निकटता का वर्णन करने के लिए किया जाता है। जब शब्द समान माप के माप के सेट पर लागू होता है, तो उसमें यादृच्छिक त्रुटि का एक घटक और व्यवस्थित त्रुटि का एक घटक सम्मलित होता है। इस स्थिति में ट्रूनेस माप परिणामों के एक सेट के वास्तविक (ट्रू) मान के माध्य की निकटता होती है और सटीकता परिणामों के एक सेट के बीच समझौते की निकटता होती है।

आईएसओ 5725-1 और वीआईएम भी "पूर्वाग्रह" शब्द के प्रयोग से बचते है, जिसे पहले बीएस 5497-1 में निर्दिष्ट किया गया था,[8] क्योंकि चिकित्सा और कानून के रूप में विज्ञान और अभियांत्रिकी के क्षेत्र के बाहर इसके अलग-अलग अर्थ है।

वर्गीकरण में

बाइनरी वर्गीकरण में

सटीकता का उपयोग एक सांख्यिकीय माप के रूप में भी किया जाता है कि बाइनरी वर्गीकरण परीक्षण कितनी अच्छी तरह से किसी स्थिति को सही ढंग से पहचानता है या बाहर करता है। अर्थात, जांच किए गए स्थितियों की कुल संख्या के बीच सटीक भविष्यवाणियों (वास्तविक सकारात्मक और वास्तविक नकारात्मक दोनों) का अनुपात सटीकता होता है। जैसे, यह पूर्व और परीक्षण के बाद की संभाव्यता के अनुमानों की तुलना करता है। शब्दार्थ द्वारा संदर्भ को स्पष्ट करने के लिए, इसे अधिकांशतः "रैंड सटीकता" या "रैंड इंडेक्स" के रूप में संदर्भित किया जाता है।[9][10][11] यह परीक्षण का एक पैरामीटर होता है। बाइनरी सटीकता को मापने का सूत्र है:


जहां TP = True positive; FP = False positive; TN = True negative; FN = False negative

ध्यान दें कि, इस संदर्भ में, ISO 5725-1 द्वारा परिभाषित सत्यता और परिशुद्धता की अवधारणाएं लागू नहीं होती है। एक कारण यह है कि मात्रा का एक "सही मूल्य" नहीं है, जबकि हर स्थिति के लिए दो संभावित वास्तविक मूल्य होते है, जबकि सटीकता सभी स्थितियों में औसत होती है और इसलिए दोनों मूल्यों को ध्यान में रखा जाता है। चूँकि, इस संदर्भ में सटीक और याद शब्द का उपयोग सूचना पुनर्प्राप्ति के क्षेत्र से उत्पन्न एक अलग मीट्रिक के अर्थ के लिए किया जाता है।

मल्टीक्लास वर्गीकरण में

मल्टीक्लास वर्गीकरण में सटीकता की गणना करते समय, सटीकता केवल सही वर्गीकरण का अंश होता है:[12]

यह सामान्यतः प्रतिशत के रूप में व्यक्त किया जाता है। उदाहरण के लिए, यदि कोई क्लासिफायर दस भविष्यवाणियां करता है और उनमें से नौ सही है, तो सटीकता 90% होती है।

सटीकता को शीर्ष-5 सटीकता से अलग करने के लिए शीर्ष-1 सटीकता भी कहा जाता है, जो दृढ़ तंत्रिका नेटवर्क मूल्यांकन में सामान्य होता है। शीर्ष -5 सटीकता का मूल्यांकन करने के लिए, क्लासिफायर को प्रत्येक वर्ग के लिए सापेक्ष संभावनाएँ प्रदान करनी चाहिए। जब इन्हें क्रमबद्ध किया जाता है, तो एक वर्गीकरण को सही माना जाता है यदि सही वर्गीकरण नेटवर्क द्वारा की गई शीर्ष 5 भविष्यवाणियों में कहीं भी आ जाता है। इमेजनेट चुनौती द्वारा शीर्ष-5 सटीकता को लोकप्रिय बनाया गया था। यह सामान्यतः शीर्ष -1 सटीकता से अधिक होती है, क्योंकि दूसरे से पांचवें स्थान तक कोई भी सही भविष्यवाणी शीर्ष -1 स्कोर में सुधार नहीं करती है, लेकिन शीर्ष -5 स्कोर में सुधार करती है।

साइकोमेट्रिक्स और साइकोफिज़िक्स में

साइकोमेट्रिक्स और साइकोफिज़िक्स में, सटीकता शब्द का प्रयोग वैधता और निरंतर त्रुटि के साथ किया जाता है। परिशुद्धता विश्वसनीयता और परिवर्तनशील त्रुटि का पर्याय होता है। माप उपकरण या मनोवैज्ञानिक परीक्षण की वैधता प्रयोग या व्यवहार के साथ सहसंबंध के माध्यम से स्थापित की जाती है। विभिन्न प्रकार की सांख्यिकीय तकनीकों के साथ विश्वसनीयता स्थापित की जाती है, मौलिक रूप से क्रोनबैक के अल्फा जैसे आंतरिक स्थिरता परीक्षण के माध्यम से यह सुनिश्चित करने के लिए कि संबंधित प्रश्नों के सेट से संबंधित प्रतिक्रियाएं होती है, और फिर संदर्भ और लक्षित आबादी के बीच उन संबंधित प्रश्नों की तुलना करती है।

तर्क अनुकरण में

तर्क अनुकरण में, सटीक मॉडल के मूल्यांकन में एक सामान्य गलती एक इलेक्ट्रॉनिक सर्किट सिमुलेशन मॉडल की तुलना ट्रांजिस्टर सर्किट सिमुलेशन मॉडल से करता है। यह सटीकता में अंतर की तुलना होती है। सटीकता को विस्तार के संबंध में मापा जाता है और वास्तविकता के संबंध में भी मापा जाता है।[13][14]

सूचना प्रणाली में

सूचना पुनर्प्राप्ति प्रणाली, जैसे कि डेटाबेस और वेब सर्च इंजन, का मूल्यांकन कई अलग-अलग मेट्रिक्स द्वारा किया जाता है, जिनमें से कुछ भ्रम मैट्रिक्स से प्राप्त होते है, जो परिणामों को ट्रू पॉजिटिव (आलेखों को सही ढंग से पुनर्प्राप्त), ट्रू निगेटिव (आलेखों को सही ढंग से पुनर्प्राप्त नहीं किया गया) में विभाजित करते है। फॉल्स पॉजिटिव (आलेख गलत तरीके से पुनर्प्राप्त), और फॉल्स नेगेटिव (आलेख गलत तरीके से पुनर्प्राप्त नहीं किए गए)। सामान्यतः उपयोग किए जाने वाले मेट्रिक्स में सटीकता और रिकॉल की धारणाएं सम्मलित होती है। इस संदर्भ में, सटीकता को पुनः प्राप्त दस्तावेजों के अंश के रूप में परिभाषित किया गया है जो मानव द्वारा चुने गए जमीनी सच्चाई प्रासंगिक परिणामों के एक सेट का उपयोग करके क्वेरी के लिए प्रासंगिक होते है (सच्चे सकारात्मक को सही + गलत सकारात्मक से विभाजित किया गया है)। रिकॉल को प्रासंगिक दस्तावेजों की कुल संख्या की तुलना में पुनर्प्राप्त किए गए प्रासंगिक दस्तावेजों के अंश के रूप में परिभाषित किया गया है (वास्तविक सकारात्मक सकारात्मक सकारात्मक + गलत नकारात्मक द्वारा विभाजित)। सामान्यतः, सटीकता की मीट्रिक का उपयोग किया जाता है, इसे दस्तावेजों की कुल संख्या से विभाजित सही वर्गीकरणों (वास्तविक सकारात्मक और वास्तविक नकारात्मक) की कुल संख्या के रूप में परिभाषित किया जाता है।

इनमें से कोई भी मेट्रिक्स परिणामों की रैंकिंग को ध्यान में नहीं रखता है। वेब खोज इंजनों के लिए रैंकिंग बहुत महत्वपूर्ण होती है क्योंकि पाठक संभवतः ही कभी परिणामों के पहले पृष्ठ से आगे जाते है, और वेब पर बहुत सारे आलेख मैन्युअल रूप से उन सभी को वर्गीकृत करने के लिए है कि क्या उन्हें किसी खोज से सम्मलित किया जाना चाहिए या बाहर रखा जाना चाहिए। परिणामों की एक विशेष संख्या में कटऑफ जोड़ने से रैंकिंग को कुछ हद तक ध्यान में रखा जाता है। उदाहरण के लिए, k पर माप सटीकता, केवल शीर्ष दस (k=10) खोज परिणामों को देखते हुए परिशुद्धता का माप होता है। अधिक परिष्कृत मेट्रिक्स, जैसे कि रियायती संचयी लाभ, प्रत्येक व्यक्तिगत रैंकिंग को ध्यान में रखते है, और सामान्यतः इसका उपयोग तब किया जाता है जब यह महत्वपूर्ण होता है।

संज्ञानात्मक प्रणालियों में

संज्ञानात्मक प्रणालियों में, जैविक या कृत्रिम संस्थाओं द्वारा निष्पादित एक संज्ञानात्मक प्रक्रिया के परिणामों को चिह्नित करने और मापने के लिए सटीकता का उपयोग किया जाता है जहां एक संज्ञानात्मक प्रक्रिया डेटा, सूचना, ज्ञान या ज्ञान का एक उच्च-मूल्यवान रूप में परिवर्तन करती है। (DIKW पिरामिड) कभी-कभी, एक संज्ञानात्मक प्रक्रिया सटीक रूप से इच्छित या वांछित आउटपुट उत्पन्न करती है लेकिन कभी-कभी इच्छित या वांछित से बहुत दूर आउटपुट उत्पन्न करती है। इसके अतिरिक्त, एक संज्ञानात्मक प्रक्रिया की पुनरावृत्ति हमेशा एक ही परिणाम नहीं देती है। संज्ञानात्मक सटीकता (सीA) इच्छित या वांछित आउटपुट का उत्पादन करने के लिए एक संज्ञानात्मक प्रक्रिया की प्रवृत्ति होती है। संज्ञानात्मक परिशुद्धता (सीP) केवल अभीष्ट या वांछित परिणाम उत्पन्न करने के लिए एक संज्ञानात्मक प्रक्रिया की प्रवृत्ति होती है।[15][16][17] मानव/कोग पहनावा में संवर्धित अनुभूति को मापने के लिए, जहां एक या अधिक मनुष्य एक या एक से अधिक संज्ञानात्मक प्रणालियों (कोग) के साथ मिलकर काम करते है, संज्ञानात्मक सटीकता में वृद्धि होती है और संज्ञानात्मक वृद्धि की डिग्री को मापने में संज्ञानात्मक सटीकता सहायता करती है।

यह भी देखें

संदर्भ

  1. 1.0 1.1 BS ISO 5725-1: "Accuracy (trueness and precision) of measurement methods and results - Part 1: General principles and definitions.", p.1 (1994)
  2. 2.0 2.1 2.2 JCGM 200:2008 मैट्रोलोजी की अंतर्राष्ट्रीय शब्दावली — बुनियादी और सामान्य अवधारणाएं और संबद्ध शर्तें (VIM)
  3. Taylor, John Robert (1999). An Introduction to Error Analysis: The Study of Uncertainties in Physical Measurements. University Science Books. pp. 128–129. ISBN 0-935702-75-X.
  4. North Atlantic Treaty Organization, NATO Standardization Agency AAP-6 – Glossary of terms and definitions, p 43.
  5. Creus, Antonio. Instrumentación Industrial[citation needed]
  6. Black, J. Temple (21 July 2020). DeGarmo's materials and processes in manufacturing. ISBN 978-1-119-72329-5. OCLC 1246529321.
  7. Parker, Christopher J.; Gill, Simeon; Harwood, Adrian; Hayes, Steven G.; Ahmed, Maryam (2021-05-19). "A Method for Increasing 3D Body Scanning's Precision: Gryphon and Consecutive Scanning". Ergonomics (in English). 65 (1): 39–59. doi:10.1080/00140139.2021.1931473. ISSN 0014-0139. PMID 34006206.
  8. BS 5497-1: "Precision of test methods. Guide for the determination of repeatability and reproducibility for a standard test method." (1979)
  9. "Archived copy" (PDF). Archived from the original (PDF) on 2015-03-11. Retrieved 2015-08-09.{{cite web}}: CS1 maint: archived copy as title (link)
  10. Powers, David M. W. (2015). "What the F-measure doesn't measure". arXiv:1503.06410 [cs.IR].
  11. David M W Powers. "The Problem with Kappa" (PDF). Anthology.aclweb.org. Archived (PDF) from the original on 2022-10-09. Retrieved 11 December 2017.
  12. "3.3. Metrics and scoring: quantifying the quality of predictions". scikit-learn (in English). Retrieved 17 May 2022.
  13. Acken, John M. (1997). "कोई भी नहीं". Encyclopedia of Computer Science and Technology. 36: 281–306.
  14. Glasser, Mark; Mathews, Rob; Acken, John M. (June 1990). "1990 Workshop on Logic-Level Modelling for ASICS". SIGDA Newsletter. 20 (1).
  15. Fulbright, Ron (2020). Democratization of Expertise: How Cognitive Systems Will Revolutionize Your Life (1st ed.). Boca Raton, FL: CRC Press. ISBN 978-0367859459.
  16. Fulbright, Ron (2019). "Calculating Cognitive Augmentation – A Case Study". Augmented Cognition. Lecture Notes in Computer Science. Lecture Notes in Computer Science. Springer Cham. 11580: 533–545. arXiv:2211.06479. doi:10.1007/978-3-030-22419-6_38. ISBN 978-3-030-22418-9. S2CID 195891648.
  17. Fulbright, Ron (2018). "On Measuring Cognition and Cognitive Augmentation". Human Interface and the Management of Information. Information in Applications and Services. Lecture Notes in Computer Science. Lecture Notes in Computer Science. Springer Cham. 10905: 494–507. arXiv:2211.06477. doi:10.1007/978-3-319-92046-7_41. ISBN 978-3-319-92045-0. S2CID 51603737.


बाहरी संबंध