रैंड इंडेक्स: Difference between revisions
No edit summary |
m (added Category:Vigyan Ready using HotCat) |
||
Line 147: | Line 147: | ||
[[Category: Machine Translated Page]] | [[Category: Machine Translated Page]] | ||
[[Category:Created On 21/03/2023]] | [[Category:Created On 21/03/2023]] | ||
[[Category:Vigyan Ready]] |
Revision as of 15:34, 5 April 2023
रैंड इंडेक्स[1] या स्थैतिकी में रैंड माप (विलियम एम. रैंड के नाम पर), और विशेष रूप से आँकड़े गुच्छन में, दो आँकड़े गुच्छन के बीच समानता का एक उपाय है। रैंड इंडेक्स का एक रूप परिभाषित किया जा सकता है जो तत्वों का संयोग समूहन के लिए समायोजित किया जाता है, यह समायोजित रैंड इंडेक्स है। गणितीय दृष्टिकोण से, रैंड इंडेक्स सटीकता से संबंधित है, लेकिन तब भी लागू होता है जब श्रेणी वर्गीकरण का उपयोग नहीं किया जाता है।
रैंड इंडेक्स
परिभाषा
तत्वों के एक सम्मुच्चय को देखते हुए और तुलना करने के लिए के दो विभाजन, उपसम्मुच्चय में S का एक विभाजन, और Y = \, s उपसमुच्चयों में S का विभाजन, निम्नलिखित को परिभाषित करें:
- , में तत्वों के जोड़े की संख्या जो में एक ही उपसमुच्चय में और में एक ही उपसमुच्चय में हैं
- , में तत्वों के जोड़े की संख्या जो में अलग-अलग उपसमुच्चय में और में अलग-अलग उपसमुच्चय में हैं
- , में तत्वों के जोड़े की संख्या जो में एक ही उपसमुच्चय में और में विभिन्न उपसमुच्चय में हैं
- , में तत्वों के जोड़े की संख्या जो में विभिन्न उपसमुच्चय में हैं और में एक ही उपसमुच्चय में हैं
सहज रूप से, के बीच समझौतों की संख्या और के रूप में माना जा सकता है और के बीच असहमति की संख्या के रूप में और है
चूंकि भाजक जोड़े की कुल संख्या है, रैंड इंडेक्स कुल जोड़े पर समझौतों की घटना की आवृत्ति का प्रतिनिधित्व करता है, या संभावना है कि और यादृच्छिक रूप से चुने गए जोड़े पर सहमत होंगे .
की गणना के रूप में की जाती है।
इसी तरह, रैंड इंडेक्स को कलन विधि द्वारा किए गए सही निर्णयों के प्रतिशत के माप के रूप में भी देखा जा सकता है। इसकी गणना निम्न सूत्र का उपयोग करके की जा सकती है:
- जहाँ वास्तविक सकारात्मक की संख्या है, वास्तविक नकारात्मक की संख्या है, मिथ्या नकारात्मक की संख्या है, और मिथ्या नकारात्मक की संख्या है।
गुण
रैंड इंडेक्स में 0 और 1 के बीच का मान होता है, जिसमें 0 यह दर्शाता है कि दो आँकड़े गुच्छन किसी भी जोड़ी के बिंदुओं पर सहमत नहीं हैं और 1 यह दर्शाता है कि आँकड़े गुच्छन बिल्कुल समान हैं।
गणितीय शब्दों में, a, b, c, d को निम्नानुसार परिभाषित किया गया है:
- , जहाँ
- , जहाँ
- , जहाँ
- , जहाँ
कुछ के लिए है।
वर्गीकरण सटीकता के साथ संबंध
रैंड इंडेक्स को तत्वों के जोड़े पर युग्मक वर्गीकरण सटीकता के वर्णक्रम के माध्यम से भी देखा जा सकता है। और दो वर्ग वर्गीकृत हैं और और में एक ही उपसमुच्चय में हैं और और और में विभिन्न उपसमुच्चयों में हैं।
उस समायोजन में, एक ही उपसमुच्चय (वास्तविक सकारात्मक) से संबंधित सही ढंग से वर्गीकृत किए गए जोड़े की संख्या है, और अलग-अलग उपसमुच्चय (वास्तविक नकारात्मक) से संबंधित सही ढंग से वर्गीकृत किए गए जोड़े की संख्या है।
समायोजित रैंड इंडेक्स
समायोजित रैंड इंडेक्स रैंड इंडेक्स का संयोग-संशोधित संस्करण है।[1][2][3] मौके के लिए इस तरह का सुधार यादृच्छिक प्रतिरूप द्वारा निर्दिष्ट गुच्छन के बीच सभी जोड़ी-वार तुलनाओं की अपेक्षित समानता का उपयोग करके आधार रेखा स्थापित करता है। परंपरागत रूप से, रैंड इंडेक्स को गुच्छन के लिए क्रमचय प्रतिरूप का उपयोग करके ठीक किया गया था (गुच्छन के भीतर गुच्छन की संख्या और आकार निश्चित हैं, और सभी यादृच्छिक गुच्छन निश्चित समूहों के बीच तत्वों को समवकुलन करके उत्पन्न होते हैं)। हालाँकि, क्रमचय प्रतिरूप के परिसर का प्रायः उल्लंघन किया जाता है; कई गुच्छन परिदृश्यों में, या तो गुच्छन की संख्या या उन गुच्छन के आकार वितरण में भारी अंतर होता है। उदाहरण के लिए, विचार करें कि K- साधन व्यवसायी द्वारा समूहों की संख्या तय की जाती है, लेकिन उन समूहों के आकार आंकड़ों से अनुमानित होते हैं। यादृच्छिक गुच्छन के विभिन्न प्रतिरूपों के लिए समायोजित रैंड इंडेक्स खाते की विविधताएं।[4]
हालांकि रैंड इंडेक्स केवल 0 और +1 के बीच एक मान उत्पन्न कर सकता है, यदि इंडेक्स अपेक्षित इंडेक्स से कम है तो समायोजित रैंड इंडेक्स नकारात्मक मान प्राप्त कर सकता है।[5]
आकस्मिक इंडेक्स
n तत्वों का एक समुच्चय S दिया है, और इन तत्वों के दो समूह या विभाजन (जैसे गुच्छन), अर्थात् और , के बीच अतिछादित X और Y आकस्मिक इंडेक्स में सारांशित किया जा सकता है जहां प्रत्येक प्रविष्टि और के बीच सामान्य वस्तुओं की संख्या को दर्शाती है:
परिभाषा
क्रमपरिवर्तन प्रतिरूप का उपयोग कर मूल समायोजित रैंड इंडेक्स है
जहाँ आकस्मिक इंडेक्स से मान हैं।
यह भी देखें
संदर्भ
- ↑ 1.0 1.1 1.2 W. M. Rand (1971). "Objective criteria for the evaluation of clustering methods". Journal of the American Statistical Association. American Statistical Association. 66 (336): 846–850. doi:10.2307/2284239. JSTOR 2284239.
- ↑ 2.0 2.1 Lawrence Hubert and Phipps Arabie (1985). "Comparing partitions". Journal of Classification. 2 (1): 193–218. doi:10.1007/BF01908075.
- ↑ Nguyen Xuan Vinh, Julien Epps and James Bailey (2009). "Information Theoretic Measures for Clustering Comparison: Is a Correction for Chance Necessary?" (PDF). ICML '09: Proceedings of the 26th Annual International Conference on Machine Learning. ACM. pp. 1073–1080.PDF.
- ↑ Alexander J Gates and Yong-Yeol Ahn (2017). "क्लस्टरिंग समानता पर रैंडम मॉडल का प्रभाव" (PDF). Journal of Machine Learning Research. 18: 1–28.
- ↑ "क्लस्टरिंग की तुलना - एक सिंहावलोकन" (PDF).