रैंड इंडेक्स: Difference between revisions

From Vigyanwiki
(TEXT)
No edit summary
 
(5 intermediate revisions by 5 users not shown)
Line 1: Line 1:
{{Short description|Measure of similarity between two data clusterings}}
[[File: Example for Adjusted Rand index.svg|thumb|K- साधन गुच्छन (बाएं) और [[ मतलब पारी |अवकृष्ट स्थानान्तरण]] (दाएं) कलन विधि वाले आँकड़ेसम्मुच्चय के लिए उदाहरण गुच्छन। इन दो गुच्छन के लिए परिकलित समायोजित रैंड इंडेक्स है <math>ARI \approx 0.94</math>]]'''रैंड इंडेक्स'''<ref name=rand71>{{Cite journal
[[File: Example for Adjusted Rand index.svg|thumb|K- साधन गुच्छन (बाएं) और [[ मतलब पारी |अवकृष्ट स्थानान्तरण]] (दाएं) कलन विधि वाले आँकड़ेसम्मुच्चय के लिए उदाहरण गुच्छन। इन दो गुच्छन के लिए परिकलित समायोजित रैंड घातांक है <math>ARI \approx 0.94</math>]]रैंड घातांक<ref name=rand71>{{Cite journal
  | author = W. M. Rand
  | author = W. M. Rand
  | title = Objective criteria for the evaluation of clustering methods
  | title = Objective criteria for the evaluation of clustering methods
Line 11: Line 10:
  | publisher = American Statistical Association
  | publisher = American Statistical Association
  | jstor = 2284239
  | jstor = 2284239
  }}</ref> या स्थैतिकी में रैंड माप (विलियम एम. रैंड के नाम पर), और विशेष रूप से [[डेटा क्लस्टरिंग|आँकड़े गुच्छन]] में, दो आँकड़े गुच्छन के बीच समानता का एक उपाय है। रैंड घातांक का एक रूप परिभाषित किया जा सकता है जो तत्वों का संयोग समूहन के लिए समायोजित किया जाता है, यह समायोजित रैंड घातांक है। गणितीय दृष्टिकोण से, रैंड घातांक सटीकता से संबंधित है, लेकिन तब भी लागू होता है जब श्रेणी वर्गीकरण का उपयोग नहीं किया जाता है।
  }}</ref> या स्थैतिकी में '''रैंड माप''' (विलियम एम. रैंड के नाम पर), और विशेष रूप से [[डेटा क्लस्टरिंग|आँकड़े गुच्छन]] में, दो आँकड़े गुच्छन के बीच समानता का एक उपाय है। रैंड इंडेक्स का एक रूप परिभाषित किया जा सकता है जो तत्वों का संयोग समूहन के लिए समायोजित किया जाता है, यह समायोजित रैंड इंडेक्स है। गणितीय दृष्टिकोण से, रैंड इंडेक्स सटीकता से संबंधित है, लेकिन तब भी लागू होता है जब श्रेणी वर्गीकरण का उपयोग नहीं किया जाता है।  


== रैंड घातांक ==
== रैंड इंडेक्स ==


=== परिभाषा ===
=== परिभाषा ===
Line 34: Line 33:
सहज रूप से,  <math>a + b</math> के बीच समझौतों की संख्या <math>X</math> और <math>Y</math> के रूप में माना जा सकता है और <math>c + d</math> के बीच असहमति की संख्या के रूप में <math>X</math> और <math>Y</math> है
सहज रूप से,  <math>a + b</math> के बीच समझौतों की संख्या <math>X</math> और <math>Y</math> के रूप में माना जा सकता है और <math>c + d</math> के बीच असहमति की संख्या के रूप में <math>X</math> और <math>Y</math> है


चूंकि भाजक जोड़े की कुल संख्या है, रैंड घातांक कुल जोड़े पर समझौतों की घटना की आवृत्ति का प्रतिनिधित्व करता है, या संभावना है कि <math>X</math> और <math>Y</math> यादृच्छिक रूप से चुने गए जोड़े पर सहमत होंगे .
चूंकि भाजक जोड़े की कुल संख्या है, रैंड इंडेक्स कुल जोड़े पर समझौतों की घटना की आवृत्ति का प्रतिनिधित्व करता है, या संभावना है कि <math>X</math> और <math>Y</math> यादृच्छिक रूप से चुने गए जोड़े पर सहमत होंगे .


<math> {n \choose 2 }</math> की गणना <math> n(n-1)/2</math> के रूप में की जाती है।
<math> {n \choose 2 }</math> की गणना <math> n(n-1)/2</math> के रूप में की जाती है।


इसी तरह, रैंड घातांक को कलन विधि द्वारा किए गए सही निर्णयों के प्रतिशत के माप के रूप में भी देखा जा सकता है। इसकी गणना निम्न सूत्र का उपयोग करके की जा सकती है:
इसी तरह, रैंड इंडेक्स को कलन विधि द्वारा किए गए सही निर्णयों के प्रतिशत के माप के रूप में भी देखा जा सकता है। इसकी गणना निम्न सूत्र का उपयोग करके की जा सकती है:
::<math>
::<math>
RI = \frac {TP + TN} {TP + FP + FN + TN}
RI = \frac {TP + TN} {TP + FP + FN + TN}
Line 45: Line 44:


=== गुण ===
=== गुण ===
रैंड घातांक में 0 और 1 के बीच का मान होता है, जिसमें 0 यह दर्शाता है कि दो आँकड़े गुच्छन किसी भी जोड़ी के बिंदुओं पर सहमत नहीं हैं और 1 यह दर्शाता है कि आँकड़े गुच्छन बिल्कुल समान हैं।
रैंड इंडेक्स में 0 और 1 के बीच का मान होता है, जिसमें 0 यह दर्शाता है कि दो आँकड़े गुच्छन किसी भी जोड़ी के बिंदुओं पर सहमत नहीं हैं और 1 यह दर्शाता है कि आँकड़े गुच्छन बिल्कुल समान हैं।


गणितीय शब्दों में, a, b, c, d को निम्नानुसार परिभाषित किया गया है:
गणितीय शब्दों में, a, b, c, d को निम्नानुसार परिभाषित किया गया है:
Line 58: Line 57:
=== वर्गीकरण सटीकता के साथ संबंध ===
=== वर्गीकरण सटीकता के साथ संबंध ===


रैंड घातांक को तत्वों के जोड़े पर युग्मक वर्गीकरण सटीकता के वर्णक्रम <math>S</math> के माध्यम से भी देखा जा सकता है। <math>o_{i}</math> और <math>o_{j}</math> दो वर्ग वर्गीकृत हैं और <math>X</math> और <math>Y</math> में एक ही उपसमुच्चय में हैं और <math>o_{i}</math> और <math>o_{j}</math> <math>X</math> और <math>Y</math> में विभिन्न उपसमुच्चयों में हैं।
रैंड इंडेक्स को तत्वों के जोड़े पर युग्मक वर्गीकरण सटीकता के वर्णक्रम <math>S</math> के माध्यम से भी देखा जा सकता है। <math>o_{i}</math> और <math>o_{j}</math> दो वर्ग वर्गीकृत हैं और <math>X</math> और <math>Y</math> में एक ही उपसमुच्चय में हैं और <math>o_{i}</math> और <math>o_{j}</math> <math>X</math> और <math>Y</math> में विभिन्न उपसमुच्चयों में हैं।


उस समायोजन में, <math>a</math> एक ही उपसमुच्चय (वास्तविक सकारात्मक) से संबंधित सही ढंग से वर्गीकृत किए गए जोड़े की संख्या है, और <math>b</math> अलग-अलग उपसमुच्चय (वास्तविक नकारात्मक) से संबंधित सही ढंग से वर्गीकृत किए गए जोड़े की संख्या है।
उस समायोजन में, <math>a</math> एक ही उपसमुच्चय (वास्तविक सकारात्मक) से संबंधित सही ढंग से वर्गीकृत किए गए जोड़े की संख्या है, और <math>b</math> अलग-अलग उपसमुच्चय (वास्तविक नकारात्मक) से संबंधित सही ढंग से वर्गीकृत किए गए जोड़े की संख्या है।


== समायोजित रैंड घातांक ==
== समायोजित रैंड इंडेक्स ==
समायोजित रैंड घातांक रैंड घातांक का संयोग-संशोधित संस्करण है।<ref name=rand71/><ref name=hb85/><ref>{{Cite conference
समायोजित रैंड इंडेक्स रैंड इंडेक्स का संयोग-संशोधित संस्करण है।<ref name=rand71/><ref name=hb85/><ref>{{Cite conference
  | author = Nguyen Xuan Vinh, Julien Epps and James Bailey
  | author = Nguyen Xuan Vinh, Julien Epps and James Bailey
  | title = Information Theoretic Measures for Clustering Comparison: Is a Correction for Chance Necessary?
  | title = Information Theoretic Measures for Clustering Comparison: Is a Correction for Chance Necessary?
Line 72: Line 71:
  | publisher = ACM
  | publisher = ACM
}}[http://www.ima.umn.edu/~iwen/REU/10.pdf PDF].
}}[http://www.ima.umn.edu/~iwen/REU/10.pdf PDF].
</ref> मौके के लिए इस तरह का सुधार यादृच्छिक प्रतिरूप द्वारा निर्दिष्ट गुच्छन के बीच सभी जोड़ी-वार तुलनाओं की अपेक्षित समानता का उपयोग करके आधार रेखा स्थापित करता है। परंपरागत रूप से, रैंड घातांक को गुच्छन के लिए क्रमचय प्रतिरूप का उपयोग करके ठीक किया गया था (गुच्छन के भीतर गुच्छन की संख्या और आकार निश्चित हैं, और सभी यादृच्छिक गुच्छन निश्चित समूहों के बीच तत्वों को समवकुलन करके उत्पन्न होते हैं)। हालाँकि, क्रमचय प्रतिरूप के परिसर का प्रायः उल्लंघन किया जाता है; कई गुच्छन परिदृश्यों में, या तो गुच्छन की संख्या या उन गुच्छन के आकार वितरण में भारी अंतर होता है। उदाहरण के लिए, विचार करें कि K- साधन व्यवसायी द्वारा समूहों की संख्या तय की जाती है, लेकिन उन समूहों के आकार आंकड़ों से अनुमानित होते हैं। यादृच्छिक गुच्छन के विभिन्न प्रतिरूपों के लिए समायोजित रैंड घातांक खाते की विविधताएं।<ref name="ga17">{{Cite journal |author=Alexander J Gates and Yong-Yeol Ahn |year=2017 |title=क्लस्टरिंग समानता पर रैंडम मॉडल का प्रभाव|URL=http://www.jmlr.org/papers/volume18/17-039/17-039.pdf |journal=Journal of Machine Learning Research |volume=18 |pages=1–28}}
</ref> मौके के लिए इस तरह का सुधार यादृच्छिक प्रतिरूप द्वारा निर्दिष्ट गुच्छन के बीच सभी जोड़ी-वार तुलनाओं की अपेक्षित समानता का उपयोग करके आधार रेखा स्थापित करता है। परंपरागत रूप से, रैंड इंडेक्स को गुच्छन के लिए क्रमचय प्रतिरूप का उपयोग करके ठीक किया गया था (गुच्छन के भीतर गुच्छन की संख्या और आकार निश्चित हैं, और सभी यादृच्छिक गुच्छन निश्चित समूहों के बीच तत्वों को समवकुलन करके उत्पन्न होते हैं)। हालाँकि, क्रमचय प्रतिरूप के परिसर का प्रायः उल्लंघन किया जाता है; कई गुच्छन परिदृश्यों में, या तो गुच्छन की संख्या या उन गुच्छन के आकार वितरण में भारी अंतर होता है। उदाहरण के लिए, विचार करें कि K- साधन व्यवसायी द्वारा समूहों की संख्या तय की जाती है, लेकिन उन समूहों के आकार आंकड़ों से अनुमानित होते हैं। यादृच्छिक गुच्छन के विभिन्न प्रतिरूपों के लिए समायोजित रैंड इंडेक्स खाते की विविधताएं।<ref name="ga17">{{Cite journal |author=Alexander J Gates and Yong-Yeol Ahn |year=2017 |title=क्लस्टरिंग समानता पर रैंडम मॉडल का प्रभाव|URL=http://www.jmlr.org/papers/volume18/17-039/17-039.pdf |journal=Journal of Machine Learning Research |volume=18 |pages=1–28}}
</ref>
</ref>


हालांकि रैंड घातांक केवल 0 और +1 के बीच एक मान उत्पन्न कर सकता है, यदि घातांक अपेक्षित घातांक से कम है तो समायोजित रैंड घातांक नकारात्मक मान प्राप्त कर सकता है।<ref>{{Cite web |title=क्लस्टरिंग की तुलना - एक सिंहावलोकन|url=https://i11www.iti.kit.edu/extra/publications/ww-cco-06.pdf}}</ref>
हालांकि रैंड इंडेक्स केवल 0 और +1 के बीच एक मान उत्पन्न कर सकता है, यदि इंडेक्स अपेक्षित इंडेक्स से कम है तो समायोजित रैंड इंडेक्स नकारात्मक मान प्राप्त कर सकता है।<ref>{{Cite web |title=क्लस्टरिंग की तुलना - एक सिंहावलोकन|url=https://i11www.iti.kit.edu/extra/publications/ww-cco-06.pdf}}</ref>






=== आकस्मिक घातांक ===
=== आकस्मिक इंडेक्स ===
n तत्वों का एक समुच्चय S दिया है, और इन तत्वों के दो समूह या विभाजन (जैसे गुच्छन), अर्थात् <math>X = \{ X_1, X_2, \ldots , X_r \}</math> और <math>Y = \{ Y_1, Y_2, \ldots , Y_s \}</math>, के बीच अतिछादित {{mvar|X}} और {{mvar|Y}} आकस्मिक घातांक <math>\left[n_{ij}\right]</math> में सारांशित किया जा सकता है जहां प्रत्येक प्रविष्टि <math>n_{ij}</math>  <math>X_i</math>और <math>Y_j</math> के बीच सामान्य वस्तुओं की संख्या को दर्शाती है: <math>n_{ij}=|X_i \cap Y_j|</math>
n तत्वों का एक समुच्चय S दिया है, और इन तत्वों के दो समूह या विभाजन (जैसे गुच्छन), अर्थात् <math>X = \{ X_1, X_2, \ldots , X_r \}</math> और <math>Y = \{ Y_1, Y_2, \ldots , Y_s \}</math>, के बीच अतिछादित {{mvar|X}} और {{mvar|Y}} आकस्मिक इंडेक्स <math>\left[n_{ij}\right]</math> में सारांशित किया जा सकता है जहां प्रत्येक प्रविष्टि <math>n_{ij}</math>  <math>X_i</math>और <math>Y_j</math> के बीच सामान्य वस्तुओं की संख्या को दर्शाती है: <math>n_{ij}=|X_i \cap Y_j|</math>
: <math>\begin{array}{c|cccc|c}
: <math>\begin{array}{c|cccc|c}
{{} \atop X}\!\diagdown\!^Y &
{{} \atop X}\!\diagdown\!^Y &
Line 128: Line 127:


=== परिभाषा ===
=== परिभाषा ===
क्रमपरिवर्तन प्रतिरूप का उपयोग कर मूल समायोजित रैंड घातांक है
क्रमपरिवर्तन प्रतिरूप का उपयोग कर मूल समायोजित रैंड इंडेक्स है
:<math>ARI = \frac{ \left. \sum_{ij} \binom{n_{ij}}{2} - \left[\sum_i \binom{a_i}{2} \sum_j \binom{b_j}{2}\right] \right/ \binom{n}{2} }{ \left. \frac{1}{2} \left[\sum_i \binom{a_i}{2} + \sum_j \binom{b_j}{2}\right] - \left[\sum_i \binom{a_i}{2} \sum_j \binom{b_j}{2}\right] \right/ \binom{n}{2} }</math>
:<math>ARI = \frac{ \left. \sum_{ij} \binom{n_{ij}}{2} - \left[\sum_i \binom{a_i}{2} \sum_j \binom{b_j}{2}\right] \right/ \binom{n}{2} }{ \left. \frac{1}{2} \left[\sum_i \binom{a_i}{2} + \sum_j \binom{b_j}{2}\right] - \left[\sum_i \binom{a_i}{2} \sum_j \binom{b_j}{2}\right] \right/ \binom{n}{2} }</math>
जहाँ <math>n_{ij}, a_i, b_j</math> आकस्मिक घातांक से मान हैं।
जहाँ <math>n_{ij}, a_i, b_j</math> आकस्मिक इंडेक्स से मान हैं।


== यह भी देखें ==
== यह भी देखें ==
Line 142: Line 141:
* [https://github.com/bjoern-andres/partition-comparison C++ implementation with MATLAB mex files]
* [https://github.com/bjoern-andres/partition-comparison C++ implementation with MATLAB mex files]


{{Machine learning evaluation metrics}}
[[Category: आकस्मिक तालिकाओं के लिए सारांश आँकड़े]] [[Category: क्लस्टरिंग मानदंड]]
[[Category: Machine Translated Page]]
[[Category:Created On 21/03/2023]]
[[Category:Created On 21/03/2023]]
[[Category:Lua-based templates]]
[[Category:Machine Translated Page]]
[[Category:Pages with script errors]]
[[Category:Short description with empty Wikidata description]]
[[Category:Templates Vigyan Ready]]
[[Category:Templates that add a tracking category]]
[[Category:Templates that generate short descriptions]]
[[Category:Templates using TemplateData]]
[[Category:आकस्मिक तालिकाओं के लिए सारांश आँकड़े]]
[[Category:क्लस्टरिंग मानदंड]]

Latest revision as of 15:36, 6 November 2023

K- साधन गुच्छन (बाएं) और अवकृष्ट स्थानान्तरण (दाएं) कलन विधि वाले आँकड़ेसम्मुच्चय के लिए उदाहरण गुच्छन। इन दो गुच्छन के लिए परिकलित समायोजित रैंड इंडेक्स है

रैंड इंडेक्स[1] या स्थैतिकी में रैंड माप (विलियम एम. रैंड के नाम पर), और विशेष रूप से आँकड़े गुच्छन में, दो आँकड़े गुच्छन के बीच समानता का एक उपाय है। रैंड इंडेक्स का एक रूप परिभाषित किया जा सकता है जो तत्वों का संयोग समूहन के लिए समायोजित किया जाता है, यह समायोजित रैंड इंडेक्स है। गणितीय दृष्टिकोण से, रैंड इंडेक्स सटीकता से संबंधित है, लेकिन तब भी लागू होता है जब श्रेणी वर्गीकरण का उपयोग नहीं किया जाता है।

रैंड इंडेक्स

परिभाषा

तत्वों के एक सम्मुच्चय को देखते हुए और तुलना करने के लिए के दो विभाजन, उपसम्मुच्चय में S का एक विभाजन, और Y = \, s उपसमुच्चयों में S का विभाजन, निम्नलिखित को परिभाषित करें:

  • , में तत्वों के जोड़े की संख्या जो में एक ही उपसमुच्चय में और में एक ही उपसमुच्चय में हैं
  • , में तत्वों के जोड़े की संख्या जो में अलग-अलग उपसमुच्चय में और में अलग-अलग उपसमुच्चय में हैं
  • , में तत्वों के जोड़े की संख्या जो में एक ही उपसमुच्चय में और में विभिन्न उपसमुच्चय में हैं
  • , में तत्वों के जोड़े की संख्या जो में विभिन्न उपसमुच्चय में हैं और में एक ही उपसमुच्चय में हैं

रैंड सूचकांक, , है:[1][2]

सहज रूप से, के बीच समझौतों की संख्या और के रूप में माना जा सकता है और के बीच असहमति की संख्या के रूप में और है

चूंकि भाजक जोड़े की कुल संख्या है, रैंड इंडेक्स कुल जोड़े पर समझौतों की घटना की आवृत्ति का प्रतिनिधित्व करता है, या संभावना है कि और यादृच्छिक रूप से चुने गए जोड़े पर सहमत होंगे .

की गणना के रूप में की जाती है।

इसी तरह, रैंड इंडेक्स को कलन विधि द्वारा किए गए सही निर्णयों के प्रतिशत के माप के रूप में भी देखा जा सकता है। इसकी गणना निम्न सूत्र का उपयोग करके की जा सकती है:

जहाँ वास्तविक सकारात्मक की संख्या है, वास्तविक नकारात्मक की संख्या है, मिथ्या नकारात्मक की संख्या है, और मिथ्या नकारात्मक की संख्या है।

गुण

रैंड इंडेक्स में 0 और 1 के बीच का मान होता है, जिसमें 0 यह दर्शाता है कि दो आँकड़े गुच्छन किसी भी जोड़ी के बिंदुओं पर सहमत नहीं हैं और 1 यह दर्शाता है कि आँकड़े गुच्छन बिल्कुल समान हैं।

गणितीय शब्दों में, a, b, c, d को निम्नानुसार परिभाषित किया गया है:

  • , जहाँ
  • , जहाँ
  • , जहाँ
  • , जहाँ

कुछ के लिए है।


वर्गीकरण सटीकता के साथ संबंध

रैंड इंडेक्स को तत्वों के जोड़े पर युग्मक वर्गीकरण सटीकता के वर्णक्रम के माध्यम से भी देखा जा सकता है। और दो वर्ग वर्गीकृत हैं और और में एक ही उपसमुच्चय में हैं और और और में विभिन्न उपसमुच्चयों में हैं।

उस समायोजन में, एक ही उपसमुच्चय (वास्तविक सकारात्मक) से संबंधित सही ढंग से वर्गीकृत किए गए जोड़े की संख्या है, और अलग-अलग उपसमुच्चय (वास्तविक नकारात्मक) से संबंधित सही ढंग से वर्गीकृत किए गए जोड़े की संख्या है।

समायोजित रैंड इंडेक्स

समायोजित रैंड इंडेक्स रैंड इंडेक्स का संयोग-संशोधित संस्करण है।[1][2][3] मौके के लिए इस तरह का सुधार यादृच्छिक प्रतिरूप द्वारा निर्दिष्ट गुच्छन के बीच सभी जोड़ी-वार तुलनाओं की अपेक्षित समानता का उपयोग करके आधार रेखा स्थापित करता है। परंपरागत रूप से, रैंड इंडेक्स को गुच्छन के लिए क्रमचय प्रतिरूप का उपयोग करके ठीक किया गया था (गुच्छन के भीतर गुच्छन की संख्या और आकार निश्चित हैं, और सभी यादृच्छिक गुच्छन निश्चित समूहों के बीच तत्वों को समवकुलन करके उत्पन्न होते हैं)। हालाँकि, क्रमचय प्रतिरूप के परिसर का प्रायः उल्लंघन किया जाता है; कई गुच्छन परिदृश्यों में, या तो गुच्छन की संख्या या उन गुच्छन के आकार वितरण में भारी अंतर होता है। उदाहरण के लिए, विचार करें कि K- साधन व्यवसायी द्वारा समूहों की संख्या तय की जाती है, लेकिन उन समूहों के आकार आंकड़ों से अनुमानित होते हैं। यादृच्छिक गुच्छन के विभिन्न प्रतिरूपों के लिए समायोजित रैंड इंडेक्स खाते की विविधताएं।[4]

हालांकि रैंड इंडेक्स केवल 0 और +1 के बीच एक मान उत्पन्न कर सकता है, यदि इंडेक्स अपेक्षित इंडेक्स से कम है तो समायोजित रैंड इंडेक्स नकारात्मक मान प्राप्त कर सकता है।[5]


आकस्मिक इंडेक्स

n तत्वों का एक समुच्चय S दिया है, और इन तत्वों के दो समूह या विभाजन (जैसे गुच्छन), अर्थात् और , के बीच अतिछादित X और Y आकस्मिक इंडेक्स में सारांशित किया जा सकता है जहां प्रत्येक प्रविष्टि और के बीच सामान्य वस्तुओं की संख्या को दर्शाती है:


परिभाषा

क्रमपरिवर्तन प्रतिरूप का उपयोग कर मूल समायोजित रैंड इंडेक्स है

जहाँ आकस्मिक इंडेक्स से मान हैं।

यह भी देखें

संदर्भ

  1. 1.0 1.1 1.2 W. M. Rand (1971). "Objective criteria for the evaluation of clustering methods". Journal of the American Statistical Association. American Statistical Association. 66 (336): 846–850. doi:10.2307/2284239. JSTOR 2284239.
  2. 2.0 2.1 Lawrence Hubert and Phipps Arabie (1985). "Comparing partitions". Journal of Classification. 2 (1): 193–218. doi:10.1007/BF01908075.
  3. Nguyen Xuan Vinh, Julien Epps and James Bailey (2009). "Information Theoretic Measures for Clustering Comparison: Is a Correction for Chance Necessary?" (PDF). ICML '09: Proceedings of the 26th Annual International Conference on Machine Learning. ACM. pp. 1073–1080.PDF.
  4. Alexander J Gates and Yong-Yeol Ahn (2017). "क्लस्टरिंग समानता पर रैंडम मॉडल का प्रभाव" (PDF). Journal of Machine Learning Research. 18: 1–28.
  5. "क्लस्टरिंग की तुलना - एक सिंहावलोकन" (PDF).


बाहरी संबंध