धनात्मक और ऋणत्मक पूर्वानुमानित मान
धनात्मक और ऋणात्मक पूर्वानुमानित मान (क्रमशः पीपीवी और एनपीवी) परीक्षणों और नैदानिक परीक्षणों के पूर्वानुमानित मान में धनात्मक और ऋणात्मक परिणामों के अनुपात होते हैं जो क्रमशः सत्य धनात्मक और सत्य ऋणात्मक परिणाम हैं।[1] पीपीवी और एनपीवी नैदानिक परीक्षण या अन्य सांख्यिकीय माप के प्रदर्शन का वर्णन करते हैं। इसमें उच्च परिणाम की व्याख्या ऐसे आँकड़ों की स्पष्टता को निरुपित करने के रूप में की जा सकती है। यह पीपीवी और एनपीवी परीक्षण के लिए आंतरिक नहीं होते हैं (जैसा कि वास्तविक धनात्मक दर और वास्तविक ऋणात्मक दर होते हैं) | वह व्यापकता पर भी निर्भर करते हैं। [2] पीपीवी और एनपीवी दोनों को बेयस प्रमेय का उपयोग करके प्राप्त किया जा सकता है।
यद्यपि कभी-कभी समानार्थक रूप से इनका उपयोग किया जाता है, धनात्मक भविष्य कहने वाला मान सामान्यतः नियंत्रण समूहों द्वारा स्थापित की गई चीज़ों को संदर्भित करता है, जबकि यह पूर्व और परीक्षण के पश्चात् की संभावना होती हैं | इसमें परीक्षण के पश्चात् की संभावना व्यक्ति के लिए संभावना को संदर्भित करती है। फिर भी, यदि व्यक्ति की लक्ष्य स्थिति की पूर्व-परीक्षण संभावना धनात्मक पूर्वानुमानित मान स्थापित करने के लिए उपयोग किए जाने वाले नियंत्रण समूह में व्यापकता के समान है, तब दोनों संख्यात्मक रूप से सामान्य होते हैं।
सूचना पुनर्प्राप्ति में, पीपीवी सांख्यिकी को अधिकांशतः परिशुद्धता और स्मरण कहा जाता है।
परिभाषा
धनात्मक पूर्वानुमानित मान (पीपीवी)
धनात्मक पूर्वानुमानित मान (पीपीवी), या परिशुद्धता, को इस प्रकार परिभाषित किया गया है
जहां वास्तविक धनात्मक वह घटना है कि परीक्षण धनात्मक पूर्वानुमान करता है, और विषय का गोल्ड स्टैण्डर्ड (रिजल्ट) के अनुसार धनात्मक परिणाम होता है, और त्रुटि धनात्मक वह घटना है कि परीक्षण धनात्मक पूर्वानुमान करता है, और विषय का गोल्ड स्टैण्डर्ड के अनुसार ऋणात्मक परिणाम होता है। पूर्ण परीक्षण के साथ पीपीवी का आदर्श मान 1 (100%) है, और इसमें सबसे व्यर्थ संभावित मान शून्य होता हैं।
पीपीवी की गणना संवेदनशीलता और विशिष्टता, और स्थिति की व्यापकता से भी की जा सकती है
- सी एफ बेयस प्रमेय
पीपीवी का पूरक फाल्स डिसकवर रेट (एफडीआर) है
ऋणात्मक पूर्वानुमानित मान (एनपीवी)
ऋणात्मक पूर्वानुमानित मान को इस प्रकार परिभाषित किया गया है
जहां वास्तविक ऋणात्मक वह घटना है कि परीक्षण ऋणात्मक पूर्वानुमान करता है, और विषय का गोल्ड स्टैण्डर्ड के अनुसार ऋणात्मक परिणाम होता है, और त्रुटि ऋणात्मक वह घटना है कि परीक्षण ऋणात्मक पूर्वानुमान करता है, और विषय का गोल्ड स्टैण्डर्ड के अनुसार धनात्मक परिणाम होता है। इसमें आदर्श परीक्षण के साथ, जो कोई त्रुटि ऋणात्मक परिणाम नहीं देता है, उसमे एनपीवी का मान 1 (100%) है, और परीक्षण के साथ जो कोई वास्तविक ऋणात्मक परिणाम नहीं देता है, उसमे एनपीवी मान शून्य होता है।
एनपीवी की गणना संवेदनशीलता और विशिष्टता, और व्यापकता से भी की जा सकती है
एनपीवी का पूरक हैफाल्स ओमिशन रेट (एफओआर) है
यद्यपि यह कभी-कभी पर्यायवाची रूप से उपयोग किया जाता है, ऋणात्मक पूर्वानुमानित मान सामान्यतः नियंत्रण समूहों द्वारा स्थापित की गई चीज़ों को संदर्भित करता है, जबकि ऋणात्मक पोस्ट-टेस्ट संभावना किसी व्यक्ति के लिए संभावना को संदर्भित करती है। फिर भी, यदि किसी व्यक्ति की लक्ष्य स्थिति की पूर्व-परीक्षण संभावना ऋणात्मक पूर्वानुमानित मान स्थापित करने के लिए उपयोग किए जाने वाले नियंत्रण समूह में व्यापकता के समान है, तब दोनों संख्यात्मक रूप से सामान्य होती हैं।
सम्बन्ध
निम्नलिखित आरेख दर्शाता है कि धनात्मक पूर्वानुमानित मान, और ऋणात्मक पूर्वानुमानित मान, संवेदनशीलता और विशिष्टता कैसे संबंधित हैं।
Predicted condition | Sources: [3][4][5][6][7][8][9][10][11] | ||||
Total population = P + N |
Positive (PP) | Negative (PN) | Informedness, bookmaker informedness (BM) = TPR + TNR − 1 |
Prevalence threshold (PT) = | |
Positive (P) | True positive (TP), hit |
False negative (FN), type II error, miss, underestimation |
True positive rate (TPR), recall, sensitivity (SEN), probability of detection, hit rate, power = TP/P = 1 − FNR |
False negative rate (FNR), miss rate = FN/P = 1 − TPR | |
Negative (N) | False positive (FP), type I error, false alarm, overestimation |
True negative (TN), correct rejection |
False positive rate (FPR), probability of false alarm, [[evaluation measures (information retrieval)#Fall-out|fall-out]] = FP/N = 1 − TNR |
True negative rate (TNR), specificity (SPC), selectivity = TN/N = 1 − FPR | |
Prevalence = P/P + N |
Positive predictive value (PPV), precision = TP/PP = 1 − FDR |
False omission rate (FOR) = FN/PN = 1 − NPV |
Positive likelihood ratio (LR+) = TPR/FPR |
Negative likelihood ratio (LR−) = FNR/TNR | |
Accuracy (ACC) = TP + TN/P + N | False discovery rate (FDR) = FP/PP = 1 − PPV |
Negative predictive value (NPV) = TN/PN = 1 − FOR | Markedness (MK), deltaP (Δp) = PPV + NPV − 1 |
[[Diagnostic odds ratio|Diagnostic odds ratio]] (DOR) = LR+/LR− | |
Balanced accuracy (BA) = TPR + TNR/2 | F1 score = 2 PPV × TPR/PPV + TPR = 2 TP/2 TP + FP + FN |
Fowlkes–Mallows index (FM) = | Matthews correlation coefficient (MCC) = |
Threat score (TS), critical success index (CSI), Jaccard index = TP/TP + FN + FP |
ध्यान दें कि धनात्मक और ऋणात्मक पूर्वानुमानित मानों का अनुमान केवल क्रॉस-अनुभागीय अध्ययन या अन्य जनसंख्या-आधारित अध्ययन से डेटा का उपयोग करके लगाया जा सकता है जिसमें वैध प्रसार अनुमान प्राप्त किया जा सकता है। इसके विपरीत, स्तिथियाँ नियंत्रण अध्ययनों से संवेदनशीलता और विशिष्टता का अनुमान लगाया जा सकता है।
कार्य उदाहरण
मान लीजिए कि आंत्र कैंसर का पता लगाने के लिए 2030 व्यक्तियों में फेकल ऑकल्ट ब्लड (एफओबी) स्क्रीन परीक्षण का उपयोग किया जाता है
Fecal occult blood screen test outcome | |||||
Total population (pop.) = 2030 |
Test outcome positive | Test outcome negative | Accuracy (ACC) = (TP + TN) / pop.
= (20 + 1820) / 2030 ≈ 90.64% |
F1 score = 2 × precision × recall/precision + recall
≈ 0.174 | |
Patients with bowel cancer (as confirmed on endoscopy) |
Actual condition positive |
True positive (TP) = 20 (2030 × 1.48% × 67%) |
False negative (FN) = 10 (2030 × 1.48% × (100% − 67%)) |
True positive rate (TPR), recall, sensitivity = TP / (TP + FN)
= 20 / (20 + 10) ≈ 66.7% |
False negative rate (FNR), miss rate = FN / (TP + FN)
= 10 / (20 + 10) ≈ 33.3% |
Actual condition negative |
False positive (FP) = 180 (2030 × (100% − 1.48%) × (100% − 91%)) |
True negative (TN) = 1820 (2030 × (100% − 1.48%) × 91%) |
False positive rate (FPR), [[information retrieval|fall-out]], probability of false alarm = FP / (FP + TN)
= 180 / (180 + 1820) = 9.0% |
Specificity, selectivity, true negative rate (TNR) = TN / (FP + TN)
= 1820 / (180 + 1820) = 91% | |
Prevalence = (TP + FN) / pop.
= (20 + 10) / 2030 ≈ 1.48% |
Positive predictive value (PPV), precision = TP / (TP + FP)
= 20 / (20 + 180) = 10% |
False omission rate (FOR) = FN / (FN + TN)
= 10 / (10 + 1820) ≈ 0.55% |
Positive likelihood ratio (LR+) = TPR/FPR
= (20 / 30) / (180 / 2000) ≈ 7.41 |
Negative likelihood ratio (LR−) = FNR/TNR
= (10 / 30) / (1820 / 2000) ≈ 0.366 | |
False discovery rate (FDR) = FP / (TP + FP)
= 180 / (20 + 180) = 90.0% |
Negative predictive value (NPV) = TN / (FN + TN)
= 1820 / (10 + 1820) ≈ 99.45% |
Diagnostic odds ratio (DOR) = LR+/LR−
≈ 20.2 |
लघु धनात्मक पूर्वानुमानित मान (पीपीवी = 10%) निरुपित करता है कि इस परीक्षण प्रक्रिया से अनेक धनात्मक परिणाम त्रुटि धनात्मक होते हैं। इस प्रकार कैंसर उपस्तिथ है या नहीं, इसका अधिक स्पष्ट आकलन प्राप्त करने के लिए अधिक विश्वसनीय परीक्षण के साथ किसी भी धनात्मक परिणाम का पालन करना आवश्यक होता हैं। फिर भी, ऐसा परीक्षण उपयोगी हो सकता है यदि यह सस्ता और सुविधाजनक हो। एफओबी स्क्रीन परीक्षण की शक्ति इसके ऋणात्मक पूर्वानुमानित मान में होती है | जो, यदि किसी व्यक्ति के लिए ऋणात्मक है, तब यह हमें उच्च विश्वास देता है कि इसका ऋणात्मक परिणाम सत्य होता है।
समस्याएँ
अन्य व्यक्तिगत कारक
ध्यान दें कि यह पीपीवी परीक्षण में अंतर्निहित नहीं होता है यह व्यापकता पर भी निर्भर करता है।[2] इसमें पूर्वानुमानित मानों पर व्यापकता के बड़े प्रभाव के कारण, मानकीकृत दृष्टिकोण प्रस्तावित किया गया है, जहां पीपीवी को 50% की व्यापकता तक सामान्यीकृत किया जाता है।[12] पीपीवी रोग या स्थिति की व्यापकता के लिए प्रत्यक्ष रूप से आनुपातिक होता है । उपरोक्त उदाहरण में, यदि परीक्षण किए गए व्यक्तियों के समूह में आंत्र कैंसर वाले व्यक्तियों का अनुपात अधिक होता हैं, तब पीपीवी संभवतः अधिक और एनपीवी कम होता हैं। यदि समूह में सभी को आंत्र कैंसर है, तब पीपीवी 100% और एनपीवी 0% होता हैं।
इस समस्या को दूर करने के लिए, एनपीवी और पीपीवी का उपयोग केवल तभी किया जाना चाहिए जब एनपीवी और पीपीवी को स्थापित करने के लिए रोग समूह में रोगियों की संख्या और स्वस्थ नियंत्रण समूह में रोगियों की संख्या का अनुपात रोगों की व्यापकता के सामान्य होता हैं। अध्ययन की गई जनसंख्या, या, यदि दो रोग समूहों की तुलना की जाती है, यदि रोग समूह 1 में रोगियों की संख्या और रोग समूह 2 में रोगियों की संख्या का अनुपात अध्ययन किए गए दो रोगों के प्रसार के अनुपात के सामान्य है। अन्यथा, धनात्मक और ऋणात्मक संभावना अनुपात एनपीवी और पीपीवी की तुलना में अधिक स्पष्ट होते हैं, क्योंकि संभावना अनुपात व्यापकता पर निर्भर नहीं होते हैं।
जब परीक्षण किए जा रहे किसी व्यक्ति में पीपीवी और एनपीवी को स्थापित करने के लिए उपयोग किए जाने वाले नियंत्रण समूहों की तुलना में भिन्न पूर्व-परीक्षण संभावना होती है, तब पीपीवी और एनपीवी को सामान्यतः धनात्मक और ऋणात्मक परीक्षण के पश्चात् उसकी संभावनाओं से भिन्न किया जाता है, पीपीवी और एनपीवी नियंत्रण समूहों द्वारा स्थापित व्यक्तियों को संदर्भित करते हैं, और परीक्षण के पश्चात् की संभावनाओं को परीक्षण किए गए व्यक्ति के लिए संदर्भित करते हैं (जैसा कि अनुमान लगाया गया है, उदाहरण के लिए, नैदानिक परीक्षण में संभावना अनुपात द्वारा) होती हैं। अधिमानतः, ऐसी स्थितियों में, ऐसे व्यक्तियों में परीक्षण में उपयोग के लिए भिन्न-भिन्न धनात्मक और ऋणात्मक पूर्वानुमानित मान स्थापित करने के लिए, समकक्ष व्यक्तियों के बड़े समूह का अध्ययन किया जाना चाहिए।
बेयसियन अपडेट
बेयस प्रमेय रोग की व्यापकता या पूर्व-परीक्षण संभाव्यता के कार्य के रूप में स्क्रीनिंग परीक्षणों की स्पष्टता पर अंतर्निहित सीमाएं प्रदान करता है। यह दिखाया गया है कि परीक्षण प्रणाली व्यापकता में महत्वपूर्ण गिरावट को सहन कर सकती है, निश्चित परिभाषित बिंदु तक जिसे व्यापकता सीमा के रूप में जाना जाता है, जिसके नीचे धनात्मक स्क्रीनिंग परीक्षण की विश्वसनीयता शीघ्रता से गिर जाती है। ऐसा कहा गया, बलायला एट अल में [13] दिखाया गया कि अनुक्रमिक परीक्षण उपरोक्त बायेसियन सीमाओं को पार कर जाता है और इस प्रकार स्क्रीनिंग परीक्षणों की विश्वसनीयता में सुधार होता है। वांछित धनात्मक पूर्वानुमानित मान के लिए जो कुछ स्थिरांक के समीप पहुंचता है, उसमे धनात्मक परीक्षण पुनरावृत्तियों की संख्या की आवश्यकता होती है
जहाँ
- वांछित पीपीवी है
- प्राप्त करने के लिए आवश्यक परीक्षण पुनरावृत्तियों की संख्या है
- संवेदनशीलता है
- विशिष्टता होता है
- रोग की व्यापकता होती है, और
- स्थिरांक है
ध्यान दें, उपरोक्त समीकरण का प्रत्येक नैदानिक परीक्षण (एलआर+) में धनात्मक संभावना अनुपात का प्राकृतिक लघुगणक होता है।
विभिन्न लक्ष्य स्थितियाँ
पीपीवी का उपयोग इस संभावना को निरुपित करने के लिए किया जाता है कि धनात्मक परीक्षण की स्थितियों में, किसी रोगी को वास्तव में निर्दिष्ट रोग होता है। चूँकि, किसी रोग के अनेक कारण हो सकते हैं और किसी संभावित कारण के परिणामस्वरूप सदैव रोगी में प्रकट रोग नहीं देखा जा सकता है। इसमें पीपीवी और एनपीवी की संबंधित लक्ष्य स्थितियों को मिश्रित करने की संभावना होती है, जैसे किसी परीक्षण के पीपीवी या एनपीवी का रोग होने के रूप में व्याख्या करना, जब वह पीपीवी या एनपीवी मान वास्तव में केवल उस रोग के होने की पूर्वसूचना को संदर्भित करता है।
इसका उदाहरण गले में खराश के रोगियों में उपयोग किया जाने वाला माइक्रोबायोलॉजिकल थ्रोट स्वैब है। सामान्यतः गले के स्वैब के पीपीवी को बताने वाले प्रकाशन इस संभावना पर रिपोर्ट कर रहे हैं कि यह जीवाणु गले में उपस्तिथ है, इसके अतिरिक्त कि रोगी पाए गए बैक्टीरिया से बीमार है। यदि इस जीवाणु की उपस्थिति के कारण सदैव गले में खराश रहती है, तब पीपीवी बहुत उपयोगी होता हैं। चूँकि बैक्टीरिया हानिरहित विधियों से व्यक्तियों में प्रवेश कर सकते हैं और इसके परिणामस्वरूप इसमें कभी भी संक्रमण या रोग नहीं होता है। इन व्यक्तियों में होने वाली गले की खराश वायरस जैसे अन्य एजेंटों के कारण होती है। इस स्थिति में मूल्यांकन अध्ययन में उपयोग किया जाने वाला गोल्ड स्टैण्डर्ड केवल बैक्टीरिया की उपस्थिति का प्रतिनिधित्व करता है (जो हानिरहित हो सकता है) किन्तु गले में होने वाली बैक्टीरिया संबंधी गले की रोग का नहीं होता हैं। यह सिद्ध किया जा सकता है कि यह समस्या ऋणात्मक पूर्वानुमानित मान की तुलना में धनात्मक पूर्वानुमानित मान को कहीं अधिक प्रभावित करती हैं। [14] नैदानिक परीक्षणों का मूल्यांकन करने के लिए जहां गोल्ड स्टैण्डर्ड केवल रोग के संभावित कारणों को देखता है, और अन्य इसमें पूर्वानुमानित मान के विस्तार का उपयोग कर सकते है जिसे एटियोलॉजिकल प्रेडिक्टिव वैल्यू कहा जाता है। [15][16]
यह भी देखें
- बाइनरी क्लासिफिकेशन
- सेंस्टिविट और स्पेसिफिसिटी
- फाल्स डिसकवरी रेट
- रेलेवेंस (इन्फॉर्मेशन रिट्रीवल)
- रिसीवर-ऑपरेटर कैरेक्टरिस्टिक
- डायग्नोस्टिक ऑड्स रेटियों
- सेंस्टिविटी इंडेक्स
संदर्भ
- ↑ Fletcher, Robert H. Fletcher ; Suzanne W. (2005). Clinical epidemiology : the essentials (4th ed.). Baltimore, Md.: Lippincott Williams & Wilkins. pp. 45. ISBN 0-7817-5215-9.
{{cite book}}
: CS1 maint: multiple names: authors list (link) - ↑ 2.0 2.1 Altman, DG; Bland, JM (1994). "Diagnostic tests 2: Predictive values". BMJ. 309 (6947): 102. doi:10.1136/bmj.309.6947.102. PMC 2540558. PMID 8038641.
- ↑ Balayla, Jacques (2020). "Prevalence threshold (ϕe) and the geometry of screening curves". PLoS One. 15 (10). doi:10.1371/journal.pone.0240215.
- ↑ Fawcett, Tom (2006). "An Introduction to ROC Analysis" (PDF). Pattern Recognition Letters. 27 (8): 861–874. doi:10.1016/j.patrec.2005.10.010.
- ↑ Piryonesi S. Madeh; El-Diraby Tamer E. (2020-03-01). "Data Analytics in Asset Management: Cost-Effective Prediction of the Pavement Condition Index". Journal of Infrastructure Systems. 26 (1): 04019036. doi:10.1061/(ASCE)IS.1943-555X.0000512.
- ↑ Powers, David M. W. (2011). "Evaluation: From Precision, Recall and F-Measure to ROC, Informedness, Markedness & Correlation". Journal of Machine Learning Technologies. 2 (1): 37–63.
- ↑ Ting, Kai Ming (2011). Sammut, Claude; Webb, Geoffrey I. (eds.). Encyclopedia of machine learning. Springer. doi:10.1007/978-0-387-30164-8. ISBN 978-0-387-30164-8.
- ↑ Brooks, Harold; Brown, Barb; Ebert, Beth; Ferro, Chris; Jolliffe, Ian; Koh, Tieh-Yong; Roebber, Paul; Stephenson, David (2015-01-26). "WWRP/WGNE Joint Working Group on Forecast Verification Research". Collaboration for Australian Weather and Climate Research. World Meteorological Organisation. Retrieved 2019-07-17.
- ↑ Chicco D, Jurman G (January 2020). "The advantages of the Matthews correlation coefficient (MCC) over F1 score and accuracy in binary classification evaluation". BMC Genomics. 21 (1): 6-1–6-13. doi:10.1186/s12864-019-6413-7. PMC 6941312. PMID 31898477.
- ↑ Chicco D, Toetsch N, Jurman G (February 2021). "The Matthews correlation coefficient (MCC) is more reliable than balanced accuracy, bookmaker informedness, and markedness in two-class confusion matrix evaluation". BioData Mining. 14 (13): 1-22. doi:10.1186/s13040-021-00244-z. PMC 7863449. PMID 33541410.
- ↑ Tharwat A. (August 2018). "Classification assessment methods". Applied Computing and Informatics. doi:10.1016/j.aci.2018.08.003.
- ↑ Heston, Thomas F. (2011). "डायग्नोस्टिक इमेजिंग अनुसंधान में पूर्वानुमानित मूल्यों का मानकीकरण". Journal of Magnetic Resonance Imaging. 33 (2): 505, author reply 506–7. doi:10.1002/jmri.22466. PMID 21274995.
- ↑ Jacques Balayla. Bayesian Updating and Sequential Testing: Overcoming Inferential Limitations of Screening Tests. ArXiv 2020. https://arxiv.org/abs/2006.11641.
- ↑ Orda, Ulrich; Gunnarsson, Ronny K; Orda, Sabine; Fitzgerald, Mark; Rofe, Geoffry; Dargan, Anna (2016). "गले में खराश वाले रोगियों में गले के स्वाब से समूह ए स्ट्रेप्टोकोकस एंटीजन का पता लगाने के लिए तेजी से इम्यूनोपरख का एटियोलॉजिकल पूर्वानुमानित मूल्य" (PDF). International Journal of Infectious Diseases. 45 (April): 32–5. doi:10.1016/j.ijid.2016.02.002. PMID 26873279.
- ↑ Gunnarsson, Ronny K.; Lanke, Jan (2002). "यदि स्पर्शोन्मुख वाहक मौजूद हैं तो माइक्रोबायोलॉजिकल डायग्नोस्टिक परीक्षणों का पूर्वानुमानित मूल्य". Statistics in Medicine. 21 (12): 1773–85. doi:10.1002/sim.1119. PMID 12111911. S2CID 26163122.
- ↑ Gunnarsson, Ronny K. "ईपीवी कैलकुलेटर". Science Network TV.