एफिनिटी प्रोपेगेशन: Difference between revisions

From Vigyanwiki
(Created page with "सांख्यिकी और डेटा खनन में, एफ़िनिटी प्रोपेगेशन (एपी) डेटा बिंदुओं...")
 
No edit summary
 
(10 intermediate revisions by 4 users not shown)
Line 1: Line 1:
सांख्यिकी और [[डेटा खनन]] में, एफ़िनिटी प्रोपेगेशन (एपी) डेटा बिंदुओं के बीच संदेश भेजने की अवधारणा पर आधारित एक [[क्लस्टर विश्लेषण]] है।<ref name="science">{{cite journal |author1=Brendan J. Frey |author2=Delbert Dueck |title=डेटा बिंदुओं के बीच संदेश भेजकर क्लस्टरिंग|journal=[[Science (journal)|Science]] |volume=315 |year=2007 |pages=972–976 |doi=10.1126/science.1136800 |pmid=17218491 |issue=5814|citeseerx=10.1.1.121.3145 |s2cid=6502291 }}</ref>
सांख्यिकी और [[डेटा खनन|डेटा माइनिंग]] में, '''एफिनिटी प्रोपेगेशन''' (AP) डेटा बिंदुओं के मध्य "संदेश पासिंग" की अवधारणा पर आधारित [[क्लस्टर विश्लेषण]] होता है। <ref name="science">{{cite journal |author1=Brendan J. Frey |author2=Delbert Dueck |title=डेटा बिंदुओं के बीच संदेश भेजकर क्लस्टरिंग|journal=[[Science (journal)|Science]] |volume=315 |year=2007 |pages=972–976 |doi=10.1126/science.1136800 |pmid=17218491 |issue=5814|citeseerx=10.1.1.121.3145 |s2cid=6502291 }}</ref> यह इस प्रकार {{mvar|k                                                                                                 }} -मीन्स या {{mvar|k                                                                                                         }}-मेडोइड्स जैसे समूहन एल्गोरिदम के विपरीत, एफ़िनिटी प्रसार के लिए एल्गोरिदम चलाने से पहले क्लस्टर की संख्या निर्धारित करने में या इसका अनुमान लगाने की आवश्यकता नहीं होती है। और {{mvar|k                                                                                                       }}-मेडोइड्स के समान, एफिनिटी प्रोपेगेशन इनपुट समुच्चय {{mvar|k                                                                                                                                                                                                                  }} "उदाहरण" सदस्यों को खोजता रहता है जो क्लस्टर के प्रतिनिधि होते हैं।<ref name="science"/>
K-मीन्स क्लस्टरिंग| जैसे क्लस्टरिंग एल्गोरिदम के विपरीत{{mvar|k}}-मीन्स या के-मेडोइड्स|{{mvar|k}}-मेडोइड्स, आत्मीयता प्रसार के लिए एल्गोरिदम चलाने से पहले समूहों की संख्या निर्धारित या अनुमान लगाने की आवश्यकता नहीं होती है। के समान {{mvar|k}}-मेडोइड्स, आत्मीयता प्रसार उदाहरणों को खोजता है, इनपुट सेट के सदस्य जो क्लस्टर के प्रतिनिधि हैं।<ref name="science"/>
==एल्गोरिदम                                                                                                                                          ==
मान लीजिए कि {{math|''x''<sub>1</sub>                                                                                  }} से {{mvar|x<sub>n</sub>                                                                                    }} तक डेटा बिंदुओं का समुच्चय होता है | और उनकी आंतरिक संरचना के बारे में कोई धारणा नहीं बनाई गई है और {{mvar|s                                                                                                            }} इसका फलन होता है | जो किन्हीं दो बिंदुओं के मध्य समानता की मात्रा को निर्धारित करता है, जैसे कि {{math|''s''(''i'', ''j'') > ''s''(''i'', ''k'')}} हैं यदि [[अगर और केवल अगर|आई एफ एफ]] {{mvar|x<sub>i</sub>                                                                                    }}, {{mvar|x<sub>k</sub>                                                                                    }} की तुलना में {{mvar|x<sub>j</sub>                                                                                              }} के अधिक समान है। तब इसके उदाहरण के लिए, दो डेटा बिंदुओं की ऋणात्मक वर्ग दूरी का उपयोग किया गया था | अर्थात बिंदुओं {{mvar|x<sub>i</sub>                                                                                        }} और {{mvar|x<sub>k</sub>                                                                                    }} के लिए, <math>s(i,k) = - \left\| x_i - x_k \right\|^2 </math> होता हैं | <ref name="science"/>


{{mvar|s                                                                                                          }} का विकर्ण (अर्थात <math>s(i,i)</math> विशेष रूप से महत्वपूर्ण होता है | इस प्रकार यह उदाहरण वरीयता का प्रतिनिधित्व करता है, जिसका अर्थ है कि किसी विशेष उदाहरण के अनुकरणीय बनने की कितनी संभावना होती है। और इस प्रकार जब इसके सभी इनपुट के लिए समान मान पर सेट किया जाता है, तब यह नियंत्रित करता है कि कितने वर्ग होते हैं | और इसके साथ यह एल्गोरिथ्म भी उत्पन्न करता है। इस प्रकार न्यूनतम संभव समानता के समीप का मान अल्पकालीन कक्षाएं उत्पन्न करता है, और जबकि अधिकतम संभव समानता के करीब या उससे बड़ा मान अनेक कक्षाएं उत्पन्न करता है। इसे सामान्यतः इनपुट के सभी युग्मों की औसत समानता के लिए आरंभ किया जाता है।


==एल्गोरिदम==
एल्गोरिथ्म दो संदेश-पासिंग चरणों के मध्य बारी-बारी से आगे बढ़ता रहता है, इस प्रकार वह दो आव्युह को अपडेट करता है |<ref name="science"/>
होने देना {{math|''x''<sub>1</sub>}} द्वारा {{mvar|x<sub>n</sub>}} डेटा बिंदुओं का एक सेट हो, उनकी आंतरिक संरचना के बारे में कोई धारणा न बनाई जाए, और चलो {{mvar|s}} एक फ़ंक्शन बनें जो किन्हीं दो बिंदुओं के बीच समानता को मापता है, जैसे कि {{math|''s''(''i'', ''j'') > ''s''(''i'', ''k'')}} [[अगर और केवल अगर]] {{mvar|x<sub>i</sub>}} अधिक समान है {{mvar|x<sub>j</sub>}} की तुलना में {{mvar|x<sub>k</sub>}}. इस उदाहरण के लिए, दो डेटा बिंदुओं की नकारात्मक वर्ग दूरी का उपयोग किया गया था यानी बिंदुओं के लिए {{mvar|x<sub>i</sub>}} और {{mvar|x<sub>k</sub>}}, <math>s(i,k) = - \left\| x_i - x_k \right\|^2 </math><ref name="science"/>


का विकर्ण {{mvar|s}} (अर्थात <math>s(i,i)</math>) विशेष रूप से महत्वपूर्ण है, क्योंकि यह उदाहरण वरीयता का प्रतिनिधित्व करता है, जिसका अर्थ है कि किसी विशेष उदाहरण के एक उदाहरण बनने की कितनी संभावना है। जब इसे सभी इनपुट के लिए समान मान पर सेट किया जाता है, तो यह नियंत्रित करता है कि एल्गोरिदम कितने वर्ग उत्पन्न करता है। न्यूनतम संभव समानता के निकट का मान कम वर्ग उत्पन्न करता है, जबकि अधिकतम संभव समानता के निकट या उससे बड़ा मान कई वर्ग उत्पन्न करता है। इसे आम तौर पर इनपुट के सभी जोड़े की औसत समानता के लिए प्रारंभ किया जाता है।
*"उत्तरदायित्व" आव्युह {{math|'''R'''                                                                                                                                                                                              }} में मान {{math|''r''(''i'', ''k'')}} होता हैं जो यह निर्धारित करते हैं कि {{mvar|x<sub>k</sub>                                                                             }}, {{mvar|x<sub>i</sub>                                                                            }} के लिए अन्य प्रतिद्वंद्वी उदाहरणों के सापेक्ष, {{mvar|x<sub>i</sub>                                                                                }} के लिए उदाहरण के रूप में कार्य करने के लिए कितना उपयुक्त होता है।
*"उपलब्धता" आव्युह {{math|'''A'''                                                                                                  }} में जितने मान {{math|''a''(''i'', ''k'')}} सम्मिलित होते हैं वह दर्शाते हैं कि {{mvar|x<sub>i</sub>}} के लिए {{mvar|x<sub>k</sub>                                                                              }} को अपने उदाहरण के रूप में उसका निर्वाचन कितना "उचित" होता हैं, यह उदाहरण के रूप में {{mvar|x<sub>k</sub>                                                                                    }} के लिए अन्य बिंदुओं की प्राथमिकता को ध्यान में रखते हुए उपयुक्त होता हैं।


एल्गोरिथ्म दो संदेश-पासिंग चरणों के बीच बारी-बारी से आगे बढ़ता है, जो दो मैट्रिक्स को अपडेट करता है:<ref name="science"/>
इस प्रकार दोनों आव्युह को सभी शून्यों से प्रारंभ किया गया है, और इन्हें [[लॉग-संभावना]] तालिकाओं के रूप में देखा जा सकता है। इसके पश्चात् एल्गोरिदम निम्नलिखित अद्यतनों को पुनरावर्ती रूप से निष्पादित करता है |


* जिम्मेदारी मैट्रिक्स {{math|'''R'''}} के मान हैं {{math|''r''(''i'', ''k'')}} जो यह बताता है कि कितना उपयुक्त है {{mvar|x<sub>k</sub>}} के लिए उदाहरण के रूप में कार्य करना है {{mvar|x<sub>i</sub>}}, अन्य उम्मीदवार उदाहरणों के सापेक्ष {{mvar|x<sub>i</sub>}}.
*सबसे पहले, जिम्मेदारी अद्यतन चारों ओर भेजे जाते हैं| और <math>r(i,k) \leftarrow s(i,k) - \max_{k' \neq k} \left\{ a(i,k') + s(i,k') \right\}</math>
* उपलब्धता मैट्रिक्स {{math|'''A'''}} में मान शामिल हैं {{math|''a''(''i'', ''k'')}} जो दर्शाता है कि यह कितना उपयुक्त होगा {{mvar|x<sub>i</sub>}} लेना {{mvar|x<sub>k</sub>}} इसके उदाहरण के रूप में, अन्य बिंदुओं की प्राथमिकता को ध्यान में रखते हुए {{mvar|x<sub>k</sub>}} एक उदाहरण के रूप में।
* फिर, इनकी उपलब्धता प्रति अद्यतन के द्वारा की जाती है |
::<math>a(i,k) \leftarrow \min \left( 0, r(k,k) + \sum_{i' \not\in \{i,k\}} \max(0, r(i',k)) \right)</math> के लिए <math>i \neq k</math> और                                                             
::<math>a(k,k) \leftarrow \sum_{i' \neq k} \max(0, r(i',k))</math>.                                                                                                                               


दोनों मैट्रिक्स को सभी शून्यों से प्रारंभ किया गया है, और इन्हें [[लॉग-संभावना]] तालिकाओं के रूप में देखा जा सकता है। इसके बाद एल्गोरिदम निम्नलिखित अद्यतनों को पुनरावर्ती रूप से निष्पादित करता है:
किसी भी प्रकार की पुनरावृत्तियाँ तब तक की जाती हैं जब तक कि इसकी क्लस्टर सीमाएँ अनेक पुनरावृत्तियों में अपरिवर्तित रहती हैं, या कुछ पूर्व निर्धारित संख्या (पुनरावृत्तियों की) तक नहीं पहुँच जाती हैं। और अंतिम आव्युह से उदाहरण उन लोगों के रूप में निकाले जाते हैं जिनकी स्वयं के लिए उनका 'उत्तरदायित्व + उपलब्धता' धनात्मक होती है (अर्थात यह <math>(r(i,i) + a(i,i)) > 0                                                                                                                                                                                                          </math>) होते हैं।


* सबसे पहले, जिम्मेदारी संबंधी अपडेट इधर-उधर भेजे जाते हैं: <math>r(i,k) \leftarrow s(i,k) - \max_{k' \neq k} \left\{ a(i,k') + s(i,k') \right\}</math>
==अनुप्रयोग                                                                                                                                        ==
* फिर, उपलब्धता प्रति अद्यतन की जाती है
एफ़िनिटी प्रसार के अन्वेषकों ने दिखाया कि यह कुछ कंप्यूटर विज़न और [[कम्प्यूटेशनल बायोलॉजी]] विज्ञान कार्यों के लिए उत्तम होते है | जिस प्रकार उदाहरण के लिए {{mvar|k                                                                                                      }} -मीन्स की तुलना में मानव चेहरों की छवियों का समूह बनाना और विनियमित प्रतिलेखों की पहचान करना होता था | <ref name="science"/> तब भी जब [[आर (प्रोग्रामिंग भाषा)]] {{mvar|k                                                                                                     }}-मीन्स को अनेक यादृच्छिक पुन प्रारंभ की अनुमति दी गई थी और इसको पीसीए का उपयोग करके आरंभ किया गया था।<ref>{{cite conference |author1=Delbert Dueck |author2=Brendan J. Frey |title=बिना पर्यवेक्षित छवि वर्गीकरण के लिए गैर-मीट्रिक आत्मीयता प्रसार|conference=Int'l Conf. on Computer Vision |year=2007|doi=10.1109/ICCV.2007.4408853}}</ref> इस प्रकार [[प्रोटीन इंटरेक्शन ग्राफ]] विभाजन पर एफिनिटी प्रोपेगेशन और [[मार्कोव क्लस्टरिंग|मार्कोव समूहन]] की तुलना करने वाले अध्ययन में पाया गया कि मार्कोव समूहन उस समस्या के लिए उत्तम काम करती है | <ref>{{cite journal |author1=James Vlasblom |author2=Shoshana Wodak |title=प्रोटीन इंटरेक्शन ग्राफ़ के विभाजन के लिए मार्कोव क्लस्टरिंग बनाम आत्मीयता प्रसार|journal=BMC Bioinformatics |volume=10 |number=1 |year=2009 |pages=99 |doi=10.1186/1471-2105-10-99 |pmid=19331680 |pmc=2682798}}</ref> इस प्रकार इसको [[ टेक्स्ट खनन |टेक्स्ट माइनिंग]] अनुप्रयोगों के लिए अर्ध-पर्यवेक्षित संस्करण प्रस्तावित किया गया है।<ref>{{cite journal |author1=Renchu Guan |author2=Xiaohu Shi |author3=Maurizio Marchese |author4=Chen Yang |author5=Yanchun Liang |title=बीज एफ़िनिटी प्रसार के साथ टेक्स्ट क्लस्टरिंग|journal=IEEE Transactions on Knowledge & Data Engineering |volume=23 |number=4 |year=2011 |pages=627–637 |doi=10.1109/tkde.2010.144|hdl=11572/89884 |s2cid=14053903 |hdl-access=free }}</ref> और यह आधुनिक अनुप्रयोग अर्थशास्त्र में तब हुआ था, जब 1997 और 2017 के मध्य अमेरिकी अर्थव्यवस्था के आउटपुट मल्टीप्लायरों में कुछ अस्थायी पैटर्न खोजने के लिए एफिनिटी प्रोपेगेशन का उपयोग किया गया था।<ref>{{Cite journal|last1=Almeida|first1=Lucas Milanez de Lima|last2=Balanco|first2=Paulo Antonio de Freitas|date=2020-06-01|title=Application of multivariate analysis as complementary instrument in studies about structural changes: An example of the multipliers in the US economy|url=http://www.sciencedirect.com/science/article/pii/S0954349X17301406|journal=Structural Change and Economic Dynamics|language=en|volume=53|pages=189–207|doi=10.1016/j.strueco.2020.02.006|s2cid=216406772 |issn=0954-349X}}</ref>
::<math>a(i,k) \leftarrow \min \left( 0, r(k,k) + \sum_{i' \not\in \{i,k\}} \max(0, r(i',k)) \right)</math> के लिए <math>i \neq k</math> और
::<math>a(k,k) \leftarrow \sum_{i' \neq k} \max(0, r(i',k))</math>.


पुनरावृत्तियाँ तब तक की जाती हैं जब तक कि या तो क्लस्टर सीमाएँ कई पुनरावृत्तियों में अपरिवर्तित रहती हैं, या कुछ पूर्व निर्धारित संख्या (पुनरावृत्तियों की) तक नहीं पहुँच जाती हैं। अंतिम मैट्रिक्स से उदाहरण उन लोगों के रूप में निकाले जाते हैं जिनकी स्वयं के लिए 'जिम्मेदारी + उपलब्धता' सकारात्मक है (अर्थात <math>(r(i,i) + a(i,i)) > 0</math>).


==अनुप्रयोग==
एफ़िनिटी प्रसार के अन्वेषकों ने दिखाया कि यह कुछ कंप्यूटर विज़न और [[कम्प्यूटेशनल बायोलॉजी]] विज्ञान कार्यों के लिए बेहतर है, उदाहरण के लिए मानवीय चेहरों की तस्वीरों का समूह बनाना और विनियमित प्रतिलेखों की पहचान करना {{mvar|k}}-साधन,<ref name="science"/>यहां तक ​​कि जब {{mvar|k}}-मीन्स को कई यादृच्छिक पुनरारंभ की अनुमति दी गई और प्रिंसिपल घटक विश्लेषण का उपयोग करके आरंभ किया गया।<ref>{{cite conference |author1=Delbert Dueck |author2=Brendan J. Frey |title=बिना पर्यवेक्षित छवि वर्गीकरण के लिए गैर-मीट्रिक आत्मीयता प्रसार|conference=Int'l Conf. on Computer Vision |year=2007|doi=10.1109/ICCV.2007.4408853}}</ref>
[[प्रोटीन इंटरेक्शन ग्राफ]] विभाजन पर आत्मीयता प्रसार और [[मार्कोव क्लस्टरिंग]] की तुलना करने वाले एक अध्ययन में पाया गया कि मार्कोव क्लस्टरिंग उस समस्या के लिए बेहतर काम करती है।<ref>{{cite journal |author1=James Vlasblom |author2=Shoshana Wodak |title=प्रोटीन इंटरेक्शन ग्राफ़ के विभाजन के लिए मार्कोव क्लस्टरिंग बनाम आत्मीयता प्रसार|journal=BMC Bioinformatics |volume=10 |number=1 |year=2009 |pages=99 |doi=10.1186/1471-2105-10-99 |pmid=19331680 |pmc=2682798}}</ref> [[ टेक्स्ट खनन ]] अनुप्रयोगों के लिए एक अर्ध-पर्यवेक्षित संस्करण प्रस्तावित किया गया है।<ref>{{cite journal |author1=Renchu Guan |author2=Xiaohu Shi |author3=Maurizio Marchese |author4=Chen Yang |author5=Yanchun Liang |title=बीज एफ़िनिटी प्रसार के साथ टेक्स्ट क्लस्टरिंग|journal=IEEE Transactions on Knowledge & Data Engineering |volume=23 |number=4 |year=2011 |pages=627–637 |doi=10.1109/tkde.2010.144|hdl=11572/89884 |s2cid=14053903 |hdl-access=free }}</ref> एक और हालिया अनुप्रयोग अर्थशास्त्र में था, जब 1997 और 2017 के बीच अमेरिकी अर्थव्यवस्था के आउटपुट मल्टीप्लायरों में कुछ अस्थायी पैटर्न खोजने के लिए आत्मीयता प्रसार का उपयोग किया गया था।<ref>{{Cite journal|last1=Almeida|first1=Lucas Milanez de Lima|last2=Balanco|first2=Paulo Antonio de Freitas|date=2020-06-01|title=Application of multivariate analysis as complementary instrument in studies about structural changes: An example of the multipliers in the US economy|url=http://www.sciencedirect.com/science/article/pii/S0954349X17301406|journal=Structural Change and Economic Dynamics|language=en|volume=53|pages=189–207|doi=10.1016/j.strueco.2020.02.006|s2cid=216406772 |issn=0954-349X}}</ref>


 
==सॉफ़्टवेयर                                                                                                                                     ==
==सॉफ़्टवेयर==
* [[ELKI|ईएलकेआई]] डेटा माइनिंग फ्रेमवर्क में [[जावा (प्रोग्रामिंग भाषा)]] कार्यान्वयन सम्मिलित होती है।
* [[ELKI]] डेटा माइनिंग फ्रेमवर्क में एक [[जावा (प्रोग्रामिंग भाषा)]] कार्यान्वयन शामिल है।
*एफ़िनिटी प्रसार का [[जूलिया (प्रोग्रामिंग भाषा)]] कार्यान्वयन जूलिया सांख्यिकी विज्ञान के समूहन के जेएल पैकेज में निहित होता है।
* एफ़िनिटी प्रसार का एक [[जूलिया (प्रोग्रामिंग भाषा)]] कार्यान्वयन जूलिया स्टैटिस्टिक्स के क्लस्टरिंग.जेएल पैकेज में निहित है।
* [[पायथन (प्रोग्रामिंग भाषा)]] संस्करण [[स्किकिट-लर्न]] लाइब्रेरी का भाग होता है।
* [[पायथन (प्रोग्रामिंग भाषा)]] संस्करण [[स्किकिट-लर्न]] लाइब्रेरी का हिस्सा है।
*[[आर (प्रोग्रामिंग भाषा)]] कार्यान्वयन "एपीक्लस्टर" पैकेज में उपलब्ध होता है।
* एपीक्लस्टर पैकेज में एक [[आर (प्रोग्रामिंग भाषा)]] कार्यान्वयन उपलब्ध है।


==संदर्भ==
==संदर्भ==
{{reflist}}
{{reflist}}
[[Category: क्लस्टर विश्लेषण एल्गोरिदम]]


[[Category: Machine Translated Page]]
[[Category:CS1 English-language sources (en)]]
[[Category:Created On 10/07/2023]]
[[Category:Created On 10/07/2023]]
[[Category:Machine Translated Page]]
[[Category:Pages with script errors]]
[[Category:Templates Vigyan Ready]]
[[Category:क्लस्टर विश्लेषण एल्गोरिदम]]

Latest revision as of 10:36, 27 July 2023

सांख्यिकी और डेटा माइनिंग में, एफिनिटी प्रोपेगेशन (AP) डेटा बिंदुओं के मध्य "संदेश पासिंग" की अवधारणा पर आधारित क्लस्टर विश्लेषण होता है। [1] यह इस प्रकार k -मीन्स या k -मेडोइड्स जैसे समूहन एल्गोरिदम के विपरीत, एफ़िनिटी प्रसार के लिए एल्गोरिदम चलाने से पहले क्लस्टर की संख्या निर्धारित करने में या इसका अनुमान लगाने की आवश्यकता नहीं होती है। और k -मेडोइड्स के समान, एफिनिटी प्रोपेगेशन इनपुट समुच्चय k "उदाहरण" सदस्यों को खोजता रहता है जो क्लस्टर के प्रतिनिधि होते हैं।[1]

एल्गोरिदम

मान लीजिए कि x1 से xn तक डेटा बिंदुओं का समुच्चय होता है | और उनकी आंतरिक संरचना के बारे में कोई धारणा नहीं बनाई गई है और s इसका फलन होता है | जो किन्हीं दो बिंदुओं के मध्य समानता की मात्रा को निर्धारित करता है, जैसे कि s(i, j) > s(i, k) हैं यदि आई एफ एफ xi , xk की तुलना में xj के अधिक समान है। तब इसके उदाहरण के लिए, दो डेटा बिंदुओं की ऋणात्मक वर्ग दूरी का उपयोग किया गया था | अर्थात बिंदुओं xi और xk के लिए, होता हैं | [1]

s का विकर्ण (अर्थात विशेष रूप से महत्वपूर्ण होता है | इस प्रकार यह उदाहरण वरीयता का प्रतिनिधित्व करता है, जिसका अर्थ है कि किसी विशेष उदाहरण के अनुकरणीय बनने की कितनी संभावना होती है। और इस प्रकार जब इसके सभी इनपुट के लिए समान मान पर सेट किया जाता है, तब यह नियंत्रित करता है कि कितने वर्ग होते हैं | और इसके साथ यह एल्गोरिथ्म भी उत्पन्न करता है। इस प्रकार न्यूनतम संभव समानता के समीप का मान अल्पकालीन कक्षाएं उत्पन्न करता है, और जबकि अधिकतम संभव समानता के करीब या उससे बड़ा मान अनेक कक्षाएं उत्पन्न करता है। इसे सामान्यतः इनपुट के सभी युग्मों की औसत समानता के लिए आरंभ किया जाता है।

एल्गोरिथ्म दो संदेश-पासिंग चरणों के मध्य बारी-बारी से आगे बढ़ता रहता है, इस प्रकार वह दो आव्युह को अपडेट करता है |[1]

  • "उत्तरदायित्व" आव्युह R में मान r(i, k) होता हैं जो यह निर्धारित करते हैं कि xk , xi के लिए अन्य प्रतिद्वंद्वी उदाहरणों के सापेक्ष, xi के लिए उदाहरण के रूप में कार्य करने के लिए कितना उपयुक्त होता है।
  • "उपलब्धता" आव्युह A में जितने मान a(i, k) सम्मिलित होते हैं वह दर्शाते हैं कि xi के लिए xk को अपने उदाहरण के रूप में उसका निर्वाचन कितना "उचित" होता हैं, यह उदाहरण के रूप में xk के लिए अन्य बिंदुओं की प्राथमिकता को ध्यान में रखते हुए उपयुक्त होता हैं।

इस प्रकार दोनों आव्युह को सभी शून्यों से प्रारंभ किया गया है, और इन्हें लॉग-संभावना तालिकाओं के रूप में देखा जा सकता है। इसके पश्चात् एल्गोरिदम निम्नलिखित अद्यतनों को पुनरावर्ती रूप से निष्पादित करता है |

  • सबसे पहले, जिम्मेदारी अद्यतन चारों ओर भेजे जाते हैं| और
  • फिर, इनकी उपलब्धता प्रति अद्यतन के द्वारा की जाती है |
के लिए और
.

किसी भी प्रकार की पुनरावृत्तियाँ तब तक की जाती हैं जब तक कि इसकी क्लस्टर सीमाएँ अनेक पुनरावृत्तियों में अपरिवर्तित रहती हैं, या कुछ पूर्व निर्धारित संख्या (पुनरावृत्तियों की) तक नहीं पहुँच जाती हैं। और अंतिम आव्युह से उदाहरण उन लोगों के रूप में निकाले जाते हैं जिनकी स्वयं के लिए उनका 'उत्तरदायित्व + उपलब्धता' धनात्मक होती है (अर्थात यह ) होते हैं।

अनुप्रयोग

एफ़िनिटी प्रसार के अन्वेषकों ने दिखाया कि यह कुछ कंप्यूटर विज़न और कम्प्यूटेशनल बायोलॉजी विज्ञान कार्यों के लिए उत्तम होते है | जिस प्रकार उदाहरण के लिए k -मीन्स की तुलना में मानव चेहरों की छवियों का समूह बनाना और विनियमित प्रतिलेखों की पहचान करना होता था | [1] तब भी जब आर (प्रोग्रामिंग भाषा) k -मीन्स को अनेक यादृच्छिक पुन प्रारंभ की अनुमति दी गई थी और इसको पीसीए का उपयोग करके आरंभ किया गया था।[2] इस प्रकार प्रोटीन इंटरेक्शन ग्राफ विभाजन पर एफिनिटी प्रोपेगेशन और मार्कोव समूहन की तुलना करने वाले अध्ययन में पाया गया कि मार्कोव समूहन उस समस्या के लिए उत्तम काम करती है | [3] इस प्रकार इसको टेक्स्ट माइनिंग अनुप्रयोगों के लिए अर्ध-पर्यवेक्षित संस्करण प्रस्तावित किया गया है।[4] और यह आधुनिक अनुप्रयोग अर्थशास्त्र में तब हुआ था, जब 1997 और 2017 के मध्य अमेरिकी अर्थव्यवस्था के आउटपुट मल्टीप्लायरों में कुछ अस्थायी पैटर्न खोजने के लिए एफिनिटी प्रोपेगेशन का उपयोग किया गया था।[5]


सॉफ़्टवेयर

संदर्भ

  1. 1.0 1.1 1.2 1.3 1.4 Brendan J. Frey; Delbert Dueck (2007). "डेटा बिंदुओं के बीच संदेश भेजकर क्लस्टरिंग". Science. 315 (5814): 972–976. CiteSeerX 10.1.1.121.3145. doi:10.1126/science.1136800. PMID 17218491. S2CID 6502291.
  2. Delbert Dueck; Brendan J. Frey (2007). बिना पर्यवेक्षित छवि वर्गीकरण के लिए गैर-मीट्रिक आत्मीयता प्रसार. Int'l Conf. on Computer Vision. doi:10.1109/ICCV.2007.4408853.
  3. James Vlasblom; Shoshana Wodak (2009). "प्रोटीन इंटरेक्शन ग्राफ़ के विभाजन के लिए मार्कोव क्लस्टरिंग बनाम आत्मीयता प्रसार". BMC Bioinformatics. 10 (1): 99. doi:10.1186/1471-2105-10-99. PMC 2682798. PMID 19331680.
  4. Renchu Guan; Xiaohu Shi; Maurizio Marchese; Chen Yang; Yanchun Liang (2011). "बीज एफ़िनिटी प्रसार के साथ टेक्स्ट क्लस्टरिंग". IEEE Transactions on Knowledge & Data Engineering. 23 (4): 627–637. doi:10.1109/tkde.2010.144. hdl:11572/89884. S2CID 14053903.
  5. Almeida, Lucas Milanez de Lima; Balanco, Paulo Antonio de Freitas (2020-06-01). "Application of multivariate analysis as complementary instrument in studies about structural changes: An example of the multipliers in the US economy". Structural Change and Economic Dynamics (in English). 53: 189–207. doi:10.1016/j.strueco.2020.02.006. ISSN 0954-349X. S2CID 216406772.