कोसाइन समानता: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 54: Line 54:


=== ओत्सुका-ओचियाई गुणांक ===
=== ओत्सुका-ओचियाई गुणांक ===
जीव विज्ञान में, एक ऐसी ही अवधारणा है जिसे ओत्सुका-ओचियाई गुणांक के रूप में जाना जाता है।<ref name="Omori">{{cite journal
जीव विज्ञान में, एक ऐसी ही अवधारणा है जिसे ओत्सुका ओचियाई गुणांक के रूप में जाना जाता है।<ref name="Omori">{{cite journal
  | author = Omori, Masae
  | author = Omori, Masae
  | title = Geological idea of Yanosuke Otuka, who built the foundation of neotectonics (geoscientist)
  | title = Geological idea of Yanosuke Otuka, who built the foundation of neotectonics (geoscientist)
Line 64: Line 64:
  | doi = 10.15080/agcjchikyukagaku.58.4_256
  | doi = 10.15080/agcjchikyukagaku.58.4_256
  | url = https://www.jstage.jst.go.jp/article/agcjchikyukagaku/58/4/58_KJ00004410060/_pdf/-char/en
  | url = https://www.jstage.jst.go.jp/article/agcjchikyukagaku/58/4/58_KJ00004410060/_pdf/-char/en
}}</ref> {{lang-ja|大塚 弥之助}})<ref name="Otsuka1936">{{cite journal
}}</ref> जिसका नाम यानोसुके ओत्सुका के नाम पर रखा गया है, जिसे ओत्सुका, ऊत्सुका या ओटुका जापानी और अकीरा ओचियाई जापानी: 落合 明 भी कहा जाता है,<ref name="Ochiai1957">{{cite journal
| author = Otsuka, Yanosuke
| title = The faunal character of the Japanese Pleistocene marine Mollusca, as evidence of the climate having become colder during the Pleistocene in Japan
| journal = Bulletin of the Biogeographical Society of Japan
| year = 1936
| volume = 6
| issue = 16
| pages = 165–170
}}</ref> और अकीरा ओचियाई ({{lang-ja|落合 明}}),<ref name="Ochiai1957">{{cite journal
  | author = Ochiai, Akira
  | author = Ochiai, Akira
  | title = Zoogeographical studies on the soleoid fishes found in Japan and its neighhouring regions-II
  | title = Zoogeographical studies on the soleoid fishes found in Japan and its neighhouring regions-II
Line 83: Line 75:
  | url = https://www.jstage.jst.go.jp/article/suisan1932/22/9/22_9_526/_pdf/-char/en
  | url = https://www.jstage.jst.go.jp/article/suisan1932/22/9/22_9_526/_pdf/-char/en
| doi-access = free
| doi-access = free
  }}</ref> ओचियाई-बार्कमैन के रूप में भी जाना जाता है<ref name="Barkman1958">{{cite book
  }}</ref> ओचियाई-बार्कमैन या ओचियाई गुणांक के रूप में जाना जाता है<ref name="Barkman1958">{{cite book
  | author = Barkman, Jan J.
  | author = Barkman, Jan J.
  | title = Phytosociology and Ecology of Cryptogamic Epiphytes: Including a Taxonomic Survey and Description of Their Vegetation Units in Europe
  | title = Phytosociology and Ecology of Cryptogamic Epiphytes: Including a Taxonomic Survey and Description of Their Vegetation Units in Europe
Line 89: Line 81:
  | year = 1958
  | year = 1958
  | location = Assen
  | location = Assen
}}</ref> या ओचियाई गुणांक,<ref name="Romesburg1984">{{cite book
}}</ref> जिसे इस प्रकार दर्शाया जा सकता है,<ref name="Romesburg1984">{{cite book
  | author = H. Charles Romesburg
  | author = H. Charles Romesburg
  | title = Cluster Analysis for Researchers
  | title = Cluster Analysis for Researchers
Line 97: Line 89:
  | page = 149
  | page = 149
  | url = {{Google books|ZuIPv7OKm10C|page=149|plainurl=yes}}
  | url = {{Google books|ZuIPv7OKm10C|page=149|plainurl=yes}}
}}</ref> जिसे इस प्रकार दर्शाया जा सकता है:
}}</ref>  
:<math>K =\frac{|A \cap B|}{\sqrt{|A| \times |B|}}</math>
:<math>K =\frac{|A \cap B|}{\sqrt{|A| \times |B|}}</math>
यहाँ, <math>A</math> और <math>B</math> [[सेट (गणित)]] हैं, और <math>|A|</math> में तत्वों की संख्या है <math>A</math>. यदि सेट को बिट सदिश  के रूप में दर्शाया जाता है, तो ओत्सुका-ओचियाई गुणांक कोसाइन समानता के समान देखा जा सकता है।
यहाँ, <math>A</math> और <math>B</math> [[सेट (गणित)]] हैं, और <math>|A|</math> में तत्वों की संख्या है <math>A</math>. यदि सेट को बिट सदिश  के रूप में दर्शाया जाता है, तो ओत्सुका-ओचियाई गुणांक कोसाइन समानता के समान देखा जा सकता है।
Line 122: Line 114:
  | doi = 10.18960/seitai.5.1_41
  | doi = 10.18960/seitai.5.1_41
  | url = https://www.jstage.jst.go.jp/article/seitai/5/1/5_KJ00002869450/_pdf/-char/en
  | url = https://www.jstage.jst.go.jp/article/seitai/5/1/5_KJ00002869450/_pdf/-char/en
}}</ref> जो बदले में यानोसुके ओत्सुका के मूल 1936 के लेख का हवाला देते हैं।<ref name="Otsuka1936"/>
}}</ref> जो बदले में यानोसुके ओत्सुका के मूल 1936 के लेख का हवाला देते हैं।<ref name="Otsuka1936">{{cite journal
| author = Otsuka, Yanosuke
| title = The faunal character of the Japanese Pleistocene marine Mollusca, as evidence of the climate having become colder during the Pleistocene in Japan
| journal = Bulletin of the Biogeographical Society of Japan
| year = 1936
| volume = 6
| issue = 16
| pages = 165–170
}}</ref>





Revision as of 13:11, 14 May 2023

डेटा विश्लेषण में, कोसाइन समानता आंतरिक गुणन क्षेत्र में परिभाषित दो गैर-शून्य सदिश के बीच समानता का का माप होता है। कोसाइन समानता सदिशों के बीच के कोण की कोज्या होती है; अर्थात्, यह उनकी लंबाई के गुणनफल से विभाजित सदिशों के डॉट का गुणनफल होता है। इससे यह पता चलता है कि कोज्या समानता सदिशों के परिमाण पर निर्भर नहीं करती है, लेकिन केवल उनके कोण पर निर्भर करती है। कोसाइन समानता अधिकांशतः अंतराल से संबंधित होती है। उदाहरण के लिए दो समानुपाती सदिशों में 1 की कोज्या समानता होती है और इस प्रकार दो लंबकोणीय सदिशों की कोसाइन समानता 0 होती है और दो विपरीत सदिश में -1 की समानता होती है। कुछ संदर्भों में, सदिशों के घटक मान ऋणात्मक नहीं हो सकते है और जिस स्थिति में कोसाइन समानता .के रूप में सीमित होती है

उदाहरण के लिए, सूचना पुनर्प्राप्ति और पाठ माइनिंग में, प्रत्येक शब्द को एक भिन्न निर्देशांक दिया जाता है और दस्तावेज़ में प्रत्येक शब्द की घटनाओं की संख्या के सदिश द्वारा दस्तावेज़ का प्रतिनिधित्व किया जाता है। कोसाइन समानता तब इस बात का एक उपयोगी माप देता है कि उनकी विषय वस्तु के संदर्भ में और दस्तावेज़ों की लंबाई के अनुसार स्वतंत्र रूप से दो दस्तावेज़ों के समान होने की कितनी संभावना होती है।[1]

डेटा माइनिंग के क्षेत्र में क्लस्टर के भीतर सामंजस्य को मापने के लिए प्रोद्योगिकीय का उपयोग किया जाता है।[2]

कोसाइन समानता का एक लाभ यह है कि इसकी संगणनात्मक जटिलता जो विशेष रूप से असामान्य आव्यूह के रूप में होती है और इस प्रकार केवल गैर-शून्य निर्देशांक पर विचार करने की आवश्यकता है।

कोसाइन समानता के लिए अन्य नामों में ओतसुका ओरचिनी समानता के समरूपी कोसाइन गुणांक के रूप में सम्मलित होते है। कोसाइन समरूपी बाइनरी आंकड़ों पर लागू किया गया है जिसे नीचे दिखाया गया है

परिभाषा

दो गैर शून्य सदिश की कोसाइन यूक्लिडियन डॉट गुणन फॉर्मूला का उपयोग करके प्राप्त किया जा सकता है।

दो n आयामी सदिश (ज्यामितीय) के गुण को देखते हुए A और B कोसाइन समानता cos(θ), एक सदिश गुणन और परिमाण (गणित) का उपयोग करके दर्शाया जाता है।

जहाँ और क्रमशः यूक्लिडियन सदिशों और के वें घटकों के रूप में होते है।

परिणामी समानता -1 से लेकर होती है जिसका अर्थ बिल्कुल विपरीत होता है और 1 का अर्थ बिल्कुल समान होता है और इस प्रकार 0 के साथ लंबकोणीयता या सहसंबंध का संकेत मिलता है, जबकि बीच के मान मध्यवर्ती समानता या असमानता का संकेत देते हैं।

पाठ मिलान के लिए, सामान्यतया विशेषता सदिश A और B दस्तावेजों के आवृत्ति सदिश शब्द के रूप में होते हैं। कोसाइन समानता को तुलना के समय सामान्यीकरण (सांख्यिकी) दस्तावेज़ लंबाई की एक विधि के रूप में देखा जा सकता है। सूचना पुनर्प्राप्ति के स्थितियों में दो दस्तावेज़ों की कोसाइन समानता की सीमा के रूप में होती है, क्योंकि शब्द आवृत्ति ऋणात्मक नहीं हो सकती। यह टीएफ-आईडीएफ (शब्द आवृत्ति व्युत्क्रम दस्तावेज़ आवृत्ति) भार का उपयोग करते समय सही साबित होता है। दो शब्द आवृत्ति वैक्टर के बीच का कोण 90 डिग्री से अधिक नहीं हो सकता

यदि सदिश के घटाव द्वारा गुणनफल सदिश को सामान्यीकृत किया जाता है, अर्थात ), तो माप को केंद्रित कोसाइन समानता कहा जाता है और पियर्सन सहसंबंध गुणांक के बराबर होता है। केंद्रीकरण के उदाहरण के लिए इस रूप में होते है,

कोसाइन दूरी

शब्द कोसाइन दूरी[3] सामान्यतः सकारात्मक क्षेत्र में कोसाइन समानता के पूरक के लिए उपयोग किया जाता है।

यह ध्यान रखना महत्वपूर्ण है कि कोसाइन दूरी वास्तविक क्षेत्र मीट्रिक नहीं होता है, क्योंकि इसमें त्रिकोण असमानता गुण को प्रदर्शित नहीं नहीं करती है या फिर औपचारिक रूप से श्वार्ज़ असमानता तथा यह संयोग एक्सिओम का उल्लंघन करती है। यह देखने की एक विधि है कि कोसाइन दूरी सदिश के सामान्यीकरण की यूक्लिडियन दूरी का आधा होता है और और यूक्लिडियन दूरी का वर्ग त्रिभुज असमानता को भी संतुष्ट नहीं करता है और इस प्रकार समान क्रम को बनाए रखते हुए त्रिभुज असमानता गुण की पूर्वावस्था के लिए कोणीय दूरी या यूक्लिडियन दूरी में परिवर्तित कर दिया जाता है और इस प्रकार वैकल्पिक रूप से कोसाइन के संदर्भ में त्रिकोणीय असमानता जो कोणीय दूरियां बनाने के लिए काम करती है वे सीधे कोसाइन के संदर्भ में व्यक्त की जा सकती है। जिसे नीचे दिखाया गया है।

कोणीय दूरी और समानता

किसी भी दो वैक्टर और के बीच में सामान्य कोण को कोणीय दूरी कहा जाता है और यह औपचारिक दूरी मीट्रिक होता है इसकी गणना कोसाइन समानता से की जा सकती है।[4] तब कोणीय दूरी मीट्रिक का पूरक का प्रयोग कोणीय समानता फलन को 0 और 1 के बीच परिबद्ध करने के लिए किया जा सकता है।

जब सदिश तत्व धनात्मक या ऋणात्मक हो सकते हैं,

यदि सदिश तत्व अधिकांशतः सकारात्मक रूप में होते हैं

दुर्भाग्यवश, व्युत्क्रम कोसाइन (अरक्कोस) फलन की गणना धीमी गति से की जाती है, जिससे अधिक सामान्य मीट्रिक कोसाइन दूरी का उपयोग करने की तुलना में कोणीय दूरी का उपयोग अधिक संगणनात्मक रूप से महंगा हो जाता है।

L2सामान्यीकृत यूक्लिडियन दूरी

कोसाइन दूरी के लिए एक और प्रभावी प्रतिनिधि यूक्लिडियन सदिश के सामान्यीकरण द्वारा प्राप्त किया जा सकता है और उसके बाद सामान्य यूक्लिडियन दूरी के अनुप्रयोग के बाद इस प्रोद्योगिकीय का उपयोग करते है और इस प्रकार प्रत्येक सदिश में प्रत्येक पद को पहले सदिश के परिमाण से विभाजित किया जाता है, जिससे इकाई लंबाई का सदिश प्राप्त होता है। फिर किन्हीं दो सदिशों के अंत-बिंदुओं पर यूक्लिडियन दूरी यथार्थ मीट्रिक के रूप में होता है, जो सदिशों की किसी भी तुलना के लिए कोसाइन दूरी के समान क्रम के रूप में देता है और इस प्रकार यूक्लिडियन दूरी का एकदिष्ट परिवर्तन को इस प्रकार दिखाया जाता है और इसके अतिरिक्त यह सदिशों की तुलना से बचता है और उचित मीट्रिक प्राप्त करने के लिए संभावित रूप से बहुमूल्य त्रिकोणमितीय संचालन की आवश्यकता होती है। एक बार सामान्यीकरण हो जाने के बाद सदिश क्षेत्र का उपयोग किसी भी यूक्लिडियन क्षेत्र के लिए उपलब्ध प्रोद्योगिकीय की पूरी श्रृंखला के साथ किया जाता है और विशेष रूप से मानक विमीयता में कमी प्रोद्योगिकीय के रूप में होती है। यह सामान्यीकृत फॉर्म दूरी अधिकांशतः कई गहन शिक्षण कलन विधि में उपयोग की जाती है।

ओत्सुका-ओचियाई गुणांक

जीव विज्ञान में, एक ऐसी ही अवधारणा है जिसे ओत्सुका ओचियाई गुणांक के रूप में जाना जाता है।[5] जिसका नाम यानोसुके ओत्सुका के नाम पर रखा गया है, जिसे ओत्सुका, ऊत्सुका या ओटुका जापानी और अकीरा ओचियाई जापानी: 落合 明 भी कहा जाता है,[6] ओचियाई-बार्कमैन या ओचियाई गुणांक के रूप में जाना जाता है[7] जिसे इस प्रकार दर्शाया जा सकता है,[8]

यहाँ, और सेट (गणित) हैं, और में तत्वों की संख्या है . यदि सेट को बिट सदिश के रूप में दर्शाया जाता है, तो ओत्सुका-ओचियाई गुणांक कोसाइन समानता के समान देखा जा सकता है।

हाल की एक किताब में,[9] गुणांक को ओत्सुका परिवार के नाम वाले एक अन्य जापानी शोधकर्ता को गलत विधि े से आरोपित किया गया है। भ्रम उत्पन्न होता है क्योंकि 1957 में अकीरा ओचियाई गुणांक को केवल ओत्सुका (पहले नाम का उल्लेख नहीं) के लिए जिम्मेदार ठहराते हैं।[6]इकुसो हमाई के एक लेख का हवाला देते हुए (Japanese: 浜井 生三),[10] जो बदले में यानोसुके ओत्सुका के मूल 1936 के लेख का हवाला देते हैं।[11]


गुण

कोसाइन समानता की सबसे उल्लेखनीय गुण यह है कि यह अलग-भिन्न सदिश आयामों की तुलना में निरपेक्ष के अतिरिक्त एक रिश्तेदार को दर्शाती है। किसी भी स्थिरांक के लिए और सदिश , सदिश और अधिकतम समान हैं। माप इस प्रकार डेटा के लिए सबसे उपयुक्त है जहां आवृत्ति निरपेक्ष मूल्यों की तुलना में अधिक महत्वपूर्ण है; विशेष रूप से, दस्तावेजों में शब्द आवृत्ति। चूंकि सूचना सिद्धांत में ग्राउंडिंग के साथ हाल ही के मेट्रिक्स, जैसे जेन्सेन-शैनन विचलन | जेन्सेन-शैनन, एसईडी, और त्रिकोणीय विचलन को कम से कम कुछ संदर्भों में बेहतर शब्दार्थ दिखाया गया है। [12] कोसाइन समानता यूक्लिडियन दूरी से निम्नानुसार संबंधित है। यूक्लिडियन दूरी को सामान्य रूप से निरूपित करें , और उसका निरीक्षण करें

(ध्रुवीकरण पहचान#Relation_to_the_law_of_cosines)

बहुपद विस्तार द्वारा। कब A और B इकाई लंबाई के लिए सामान्यीकृत हैं, तो यह अभिव्यक्ति के बराबर है

संक्षेप में, कोसाइन दूरी को यूक्लिडियन दूरी के रूप में व्यक्त किया जा सकता है

.

यूक्लिडियन दूरी को जीवा दूरी कहा जाता है (क्योंकि यह यूनिट सर्कल पर जीवा की लंबाई है) और यह सदिशों के बीच यूक्लिडियन दूरी है जो उनके भीतर वर्ग मानों के इकाई योग के लिए सामान्यीकृत थे।

'अशक्त वितरण:' डेटा के लिए जो नकारात्मक और साथ ही सकारात्मक हो सकता है, कोसाइन समानता के लिए अशक्त वितरण दो स्वतंत्र यादृच्छिक इकाई सदिश के डॉट गुणन का वितरण है। इस बंटन का माध्य शून्य और विचरण है (जहाँ आयामों की संख्या है), और यद्यपि वितरण -1 और +1 के बीच सीमित है, जैसे बड़ा होता है वितरण सामान्य वितरण द्वारा तेजी से अच्छी तरह से अनुमानित है।[13][14] अन्य प्रकार के डेटा जैसे bitstream , जो केवल मान 0 या 1 लेते हैं, अशक्त वितरण एक भिन्न रूप लेता है और इसका एक गैर-शून्य माध्य हो सकता है।[15]


कोज्या समानता के लिए त्रिभुज असमानता

कोणों के लिए साधारण त्रिभुज असमानता (अर्थात , एक इकाई हाइपरस्फीयर पर चाप की लंबाई) हमें वह देती है

क्योंकि कोज्या फलन एक कोण के रूप में घटता है [0, π] रेडियन बढ़ता है, तो इन असमानताओं की भावना उलट जाती है जब हम प्रत्येक मूल्य का कोसाइन लेते हैं:

कोसाइन जोड़ और घटाव सूत्रों का उपयोग करके, इन दो असमानताओं को मूल कोसाइन के रूप में लिखा जा सकता है,

त्रिभुज असमानता के इस रूप का उपयोग दो वस्तुओं ए और बी की न्यूनतम और अधिकतम समानता को सीमित करने के लिए किया जा सकता है यदि किसी संदर्भ वस्तु सी की समानता पहले से ही ज्ञात हो। इसका उपयोग उदाहरण के लिए मीट्रिक डेटा इंडेक्सिंग में किया जाता है, लेकिन इसका उपयोग गोलाकार k-मतलब क्लस्टरिंग में तेजी लाने के लिए भी किया जाता है[16] उसी तरह यूक्लिडियन त्रिकोण असमानता का उपयोग नियमित के-साधनों को तेज करने के लिए किया गया है।

शीतल कोसाइन उपाय

दो सदिशों के बीच एक नरम कोसाइन या (नरम समानता) सुविधाओं के जोड़े के बीच समानता पर विचार करता है।[17] पारंपरिक कोसाइन समानता सदिश अंतरिक्ष मॉडल (वीएसएम) सुविधाओं को स्वतंत्र या पूरी तरह से भिन्न मानती है, जबकि सॉफ्ट कोसाइन उपाय वीएसएम में सुविधाओं की समानता पर विचार करने का प्रस्ताव करता है, जो कोसाइन (और सॉफ्ट कोसाइन) की अवधारणा के साथ-साथ विचार को सामान्य बनाने में मदद करता है। (मुलायम) समानता।

उदाहरण के लिए, प्राकृतिक भाषा प्रसंस्करण (एनएलपी) के क्षेत्र में सुविधाओं के बीच समानता बहुत सहज है। शब्द, एन-ग्राम|एन-ग्राम, या वाक्यात्मक एन-ग्राम जैसी विशेषताएं[18] बहुत सीमा तक समान हो सकते हैं, चूंकि औपचारिक रूप से उन्हें वीएसएम में विभिन्न विशेषताओं के रूप में माना जाता है। उदाहरण के लिए, शब्द "प्ले" और "गेम" अलग-भिन्न शब्द हैं और इस प्रकार वीएसएम में विभिन्न बिंदुओं पर मैप किए गए; फिर भी वे शब्दार्थ से संबंधित हैं। एन-ग्राम या सिंटैक्टिक एन-ग्राम के स्थितियों में, लेवेनशेटिन दूरी को लागू किया जा सकता है (वास्तव में, लेवेनशेटिन दूरी को शब्दों पर भी लागू किया जा सकता है)।

सॉफ्ट कोसाइन की गणना के लिए, आव्यूह s का उपयोग सुविधाओं के बीच समानता को इंगित करने के लिए किया जाता है। इसकी गणना लेवेनशेटिन दूरी, शब्दतंत्र समानता, या अन्य समानता उपायों के माध्यम से की जा सकती है। फिर हम इस आव्यूह से गुणा करते हैं।

दो दिया N-आयाम सदिश और , सॉफ्ट कोसाइन समानता की गणना निम्नानुसार की जाती है:

जहाँ sij = similarity(featurei, featurej).

यदि सुविधाओं के बीच कोई समानता नहीं है (sii = 1, sij = 0 के लिए ij), दिया गया समीकरण पारंपरिक कोसाइन समानता सूत्र के बराबर है।

इस उपाय की समय जटिलता द्विघात है, जो इसे वास्तविक दुनिया के कार्यों पर लागू करती है। ध्यान दें कि जटिलता को सबक्वाड्रैटिक में कम किया जा सकता है।[19] ऐसी सॉफ्ट कोसाइन समानता का एक कुशल कार्यान्वयन Gensim ओपन सोर्स लाइब्रेरी में सम्मलित है।

यह भी देखें

संदर्भ

  1. Singhal, Amit (2001). "Modern Information Retrieval: A Brief Overview". Bulletin of the IEEE Computer Society Technical Committee on Data Engineering 24 (4): 35–43.
  2. P.-N. Tan, M. Steinbach & V. Kumar, Introduction to Data Mining, Addison-Wesley (2005), ISBN 0-321-32136-7, chapter 8; page 500.
  3. Wolfram Research (2007). "कोसाइनडिस्टैंक - वोल्फ्राम लैंग्वेज डॉक्यूमेंटेशन". wolfram.com.
  4. "कोसाइन दूरी, कोसाइन समानता, कोणीय कोसाइन दूरी, कोणीय कोसाइन समानता". www.itl.nist.gov. Retrieved 2020-07-11.
  5. Omori, Masae (2004). "Geological idea of Yanosuke Otuka, who built the foundation of neotectonics (geoscientist)". Earth Science. 58 (4): 256–259. doi:10.15080/agcjchikyukagaku.58.4_256.
  6. 6.0 6.1 Ochiai, Akira (1957). "Zoogeographical studies on the soleoid fishes found in Japan and its neighhouring regions-II". Bulletin of the Japanese Society of Scientific Fisheries. 22 (9): 526–530. doi:10.2331/suisan.22.526.
  7. Barkman, Jan J. (1958). Phytosociology and Ecology of Cryptogamic Epiphytes: Including a Taxonomic Survey and Description of Their Vegetation Units in Europe. Assen: Van Gorcum.
  8. H. Charles Romesburg (1984). Cluster Analysis for Researchers. Belmont, California: Lifetime Learning Publications. p. 149.
  9. Howarth, Richard J. (2017). Dictionary of Mathematical Geosciences: With Historical Notes. Cham: Springer. p. 421. doi:10.1007/978-3-319-57315-1. ISBN 978-3-319-57314-4. S2CID 67081034.
  10. Hamai, Ikuso (1955). "Stratification of community by means of "community coefficient" (continued)". Japanese Journal of Ecology. 5 (1): 41–45. doi:10.18960/seitai.5.1_41.
  11. Otsuka, Yanosuke (1936). "The faunal character of the Japanese Pleistocene marine Mollusca, as evidence of the climate having become colder during the Pleistocene in Japan". Bulletin of the Biogeographical Society of Japan. 6 (16): 165–170.
  12. Connor, Richard (2016). A Tale of Four Metrics. Similarity Search and Applications. Tokyo: Springer. doi:10.1007/978-3-319-46759-7_16.
  13. Spruill, Marcus C. (2007). "Asymptotic distribution of coordinates on high dimensional spheres". Electronic Communications in Probability. 12: 234–247. doi:10.1214/ECP.v12-1294.
  14. "Distribution of dot products between two random unit vectors in RD". CrossValidated.
  15. Graham L. Giller (2012). "रैंडम बिटस्ट्रीम के सांख्यिकीय गुण और कोसाइन समानता का नमूना वितरण". Giller Investments Research Notes (20121024/1). doi:10.2139/ssrn.2167044. S2CID 123332455.
  16. Schubert, Erich; Lang, Andreas; Feher, Gloria (2021). Reyes, Nora; Connor, Richard; Kriege, Nils; Kazempour, Daniyal; Bartolini, Ilaria; Schubert, Erich; Chen, Jian-Jia (eds.). "गोलाकार के-मीन्स को तेज करना". Similarity Search and Applications. Lecture Notes in Computer Science (in English). Cham: Springer International Publishing. 13058: 217–231. arXiv:2107.04074. doi:10.1007/978-3-030-89657-7_17. ISBN 978-3-030-89657-7. S2CID 235790358.
  17. Sidorov, Grigori; Gelbukh, Alexander; Gómez-Adorno, Helena; Pinto, David (29 September 2014). "Soft Similarity and Soft Cosine Measure: Similarity of Features in Vector Space Model". Computación y Sistemas. 18 (3): 491–504. doi:10.13053/CyS-18-3-2043. Retrieved 7 October 2014.
  18. Sidorov, Grigori; Velasquez, Francisco; Stamatatos, Efstathios; Gelbukh, Alexander; Chanona-Hernández, Liliana (2013). कम्प्यूटेशनल इंटेलिजेंस में अग्रिम. Lecture Notes in Computer Science. Vol. 7630. LNAI 7630. pp. 1–11. doi:10.1007/978-3-642-37798-3_1. ISBN 978-3-642-37798-3.
  19. Novotný, Vít (2018). सॉफ्ट कोसाइन उपाय के लिए कार्यान्वयन नोट्स. The 27th ACM International Conference on Information and Knowledge Management. Torun, Italy: Association for Computing Machinery. pp. 1639–1642. arXiv:1808.09407. doi:10.1145/3269206.3269317. ISBN 978-1-4503-6014-2.


बाहरी संबंध