एफिनिटी प्रोपेगेशन: Difference between revisions

Revision as of 17:00, 18 July 2023

सांख्यिकी और डेटा खनन में,आत्मीयता प्रसार (AP) डेटा बिंदुओं के मध्य "संदेश पासिंग" की अवधारणा पर आधारित क्लस्टर विश्लेषण होता है। ^[1] यह इस प्रकार $k$ -मीन्स या $k$ -मेडोइड्स जैसे समूहन एल्गोरिदम के विपरीत, एफ़िनिटी प्रसार के लिए एल्गोरिदम चलाने से पहले क्लस्टर की संख्या निर्धारित करने में या इसका अनुमान लगाने की आवश्यकता नहीं होती है। और $k$ -मेडोइड्स के समान, आत्मीयता प्रसार इनपुट समुच्चय $k$ "उदाहरण" सदस्यों को ढूंढता रहता है जो क्लस्टर के प्रतिनिधि होते हैं।^[1]

एल्गोरिदम

मान लीजिए कि $x 1$ से $x n$ तक डेटा बिंदुओं का समुच्चय होता है | और उनकी आंतरिक संरचना के बारे में कोई धारणा नहीं बनाई गई है और $s$ इसका फलन होता है | जो किन्हीं दो बिंदुओं के मध्य समानता की मात्रा को निर्धारित करता है, जैसे कि $s (i, j) > s (i, k)$ हैं यदि आई एफ एफ $x i$ , $x k$ की तुलना में $x j$ के अधिक समान है। तब इसके उदाहरण के लिए, दो डेटा बिंदुओं की ऋणात्मक वर्ग दूरी का उपयोग किया गया था | अर्थात बिंदुओं $x i$ और $x k$ के लिए, $s(i,k)=-\left\|x_{i}-x_{k}\right\|^{2}$ होता हैं | ^[1]

$s$ का विकर्ण (अर्थात $s(i,i)$ विशेष रूप से महत्वपूर्ण होता है | इस प्रकार यह उदाहरण वरीयता का प्रतिनिधित्व करता है, जिसका अर्थ है कि किसी विशेष उदाहरण के अनुकरणीय बनने की कितनी संभावना होती है। और इस प्रकार जब इसके सभी इनपुट के लिए समान मान पर समुच्चय किया जाता है, तब यह नियंत्रित करता है कि कितने वर्ग होते हैं | और इसके साथ यह एल्गोरिथ्म भी उत्पन्न करता है। इस प्रकार न्यूनतम संभव समानता के करीब का मान अल्पकालीन कक्षाएं उत्पन्न करता है, और जबकि अधिकतम संभव समानता के करीब या उससे बड़ा मान अनेक कक्षाएं उत्पन्न करता है। इसे सामान्यतः इनपुट के सभी जोड़े की औसत समानता के लिए आरंभ किया जाता है।

एल्गोरिथ्म दो संदेश-पासिंग चरणों के मध्य बारी-बारी से आगे बढ़ता रहता है, इस प्रकार वह दो आव्युह को अपडेट करता है |^[1]

"जिम्मेदारी" आव्युह $R$ में मान $r (i, k)$ होता हैं जो यह निर्धारित करते हैं कि $x k$ , $x i$ के लिए अन्य प्रतिद्वंद्वी उदाहरणों के सापेक्ष, $x i$ के लिए उदाहरण के रूप में कार्य करने के लिए कितना उपयुक्त होता है।
"उपलब्धता" आव्युह $A$ में जितने मान $a (i, k)$ सम्मिलित होते हैं वह दर्शाते हैं कि $x i$ के लिए $x k$ को अपने उदाहरण के रूप में उसका निर्वाचन कितना "उचित" होता हैं, यह उदाहरण के रूप में $x k$ के लिए अन्य बिंदुओं की प्राथमिकता को ध्यान में रखते हुए उपयुक्त होता हैं।

इस प्रकार दोनों आव्युह को सभी शून्यों से प्रारंभ किया गया है, और इन्हें लॉग-संभावना तालिकाओं के रूप में देखा जा सकता है। इसके पश्चात् एल्गोरिदम निम्नलिखित अद्यतनों को पुनरावर्ती रूप से निष्पादित करता है |

सबसे पहले, जिम्मेदारी अद्यतन चारों ओर भेजे जाते हैं| और $r(i,k)\leftarrow s(i,k)-\max _{k'\neq k}\left\{a(i,k')+s(i,k')\right\}$
फिर, इनकी उपलब्धता प्रति अद्यतन के द्वारा की जाती है |

a(i,k)\leftarrow \min \left(0,r(k,k)+\sum _{i'\not \in \{i,k\}}\max(0,r(i',k))\right)

के लिए

i\neq k

और

a(k,k)\leftarrow \sum _{i'\neq k}\max(0,r(i',k))

.

किसी भी प्रकार की पुनरावृत्तियाँ तब तक की जाती हैं जब तक कि इसकी क्लस्टर सीमाएँ अनेक पुनरावृत्तियों में अपरिवर्तित रहती हैं, या कुछ पूर्व निर्धारित संख्या (पुनरावृत्तियों की) तक नहीं पहुँच जाती हैं। और अंतिम आव्युह से उदाहरण उन लोगों के रूप में निकाले जाते हैं जिनकी स्वयं के लिए उनका 'उत्तरदायित्व + उपलब्धता' धनात्मक होती है (अर्थात यह $(r(i,i)+a(i,i))>0$ ) होते हैं।

अनुप्रयोग

एफ़िनिटी प्रसार के अन्वेषकों ने दिखाया कि यह कुछ कंप्यूटर विज़न और कम्प्यूटेशनल बायोलॉजी विज्ञान कार्यों के लिए उत्तम होते है | जिस प्रकार उदाहरण के लिए $k$ -मीन्स की तुलना में मानव चेहरों की तस्वीरों का समूह बनाना और विनियमित प्रतिलेखों की पहचान करना होता था | ^[1] तब भी जब आर (प्रोग्रामिंग भाषा) $k$ -मीन्स को अनेक यादृच्छिक पुन प्रारंभ की अनुमति दी गई थी और इसको पीसीए का उपयोग करके आरंभ किया गया था।^[2] इस प्रकार प्रोटीन इंटरेक्शन ग्राफ विभाजन पर आत्मीयता प्रसार और मार्कोव समूहन की तुलना करने वाले अध्ययन में पाया गया कि मार्कोव समूहन उस समस्या के लिए उत्तम काम करती है | ^[3] इस प्रकार इसको टेक्स्ट खनन अनुप्रयोगों के लिए अर्ध-पर्यवेक्षित संस्करण प्रस्तावित किया गया है।^[4] और यह आधुनिक अनुप्रयोग अर्थशास्त्र में तब हुआ था, जब 1997 और 2017 के मध्य अमेरिकी अर्थव्यवस्था के आउटपुट मल्टीप्लायरों में कुछ अस्थायी पैटर्न खोजने के लिए आत्मीयता प्रसार का उपयोग किया गया था।^[5]

सॉफ़्टवेयर

ईएलकेआई डेटा माइनिंग फ्रेमवर्क में जावा (प्रोग्रामिंग भाषा) कार्यान्वयन सम्मिलित होती है।
एफ़िनिटी प्रसार का जूलिया (प्रोग्रामिंग भाषा) कार्यान्वयन जूलिया सांख्यिकी विज्ञान के समूहन के जेएल पैकेज में निहित होता है।
पायथन (प्रोग्रामिंग भाषा) संस्करण स्किकिट-लर्न लाइब्रेरी का भाग होता है।
आर (प्रोग्रामिंग भाषा) कार्यान्वयन "एपीक्लस्टर" पैकेज में उपलब्ध होता है।

संदर्भ

↑ ^1.0 ^1.1 ^1.2 ^1.3 ^1.4 Brendan J. Frey; Delbert Dueck (2007). "डेटा बिंदुओं के बीच संदेश भेजकर क्लस्टरिंग". Science. 315 (5814): 972–976. CiteSeerX 10.1.1.121.3145. doi:10.1126/science.1136800. PMID 17218491. S2CID 6502291.
↑ Delbert Dueck; Brendan J. Frey (2007). बिना पर्यवेक्षित छवि वर्गीकरण के लिए गैर-मीट्रिक आत्मीयता प्रसार. Int'l Conf. on Computer Vision. doi:10.1109/ICCV.2007.4408853.
↑ James Vlasblom; Shoshana Wodak (2009). "प्रोटीन इंटरेक्शन ग्राफ़ के विभाजन के लिए मार्कोव क्लस्टरिंग बनाम आत्मीयता प्रसार". BMC Bioinformatics. 10 (1): 99. doi:10.1186/1471-2105-10-99. PMC 2682798. PMID 19331680.
↑ Renchu Guan; Xiaohu Shi; Maurizio Marchese; Chen Yang; Yanchun Liang (2011). "बीज एफ़िनिटी प्रसार के साथ टेक्स्ट क्लस्टरिंग". IEEE Transactions on Knowledge & Data Engineering. 23 (4): 627–637. doi:10.1109/tkde.2010.144. hdl:11572/89884. S2CID 14053903.
↑ Almeida, Lucas Milanez de Lima; Balanco, Paulo Antonio de Freitas (2020-06-01). "Application of multivariate analysis as complementary instrument in studies about structural changes: An example of the multipliers in the US economy". Structural Change and Economic Dynamics (in English). 53: 189–207. doi:10.1016/j.strueco.2020.02.006. ISSN 0954-349X. S2CID 216406772.

[science-1] 1.0 ^1.1 ^1.2 ^1.3 ^1.4 Brendan J. Frey; Delbert Dueck (2007). "डेटा बिंदुओं के बीच संदेश भेजकर क्लस्टरिंग". Science. 315 (5814): 972–976. CiteSeerX 10.1.1.121.3145. doi:10.1126/science.1136800. PMID 17218491. S2CID 6502291.

[2] Delbert Dueck; Brendan J. Frey (2007). बिना पर्यवेक्षित छवि वर्गीकरण के लिए गैर-मीट्रिक आत्मीयता प्रसार. Int'l Conf. on Computer Vision. doi:10.1109/ICCV.2007.4408853.

[3] James Vlasblom; Shoshana Wodak (2009). "प्रोटीन इंटरेक्शन ग्राफ़ के विभाजन के लिए मार्कोव क्लस्टरिंग बनाम आत्मीयता प्रसार". BMC Bioinformatics. 10 (1): 99. doi:10.1186/1471-2105-10-99. PMC 2682798. PMID 19331680.

[4] Renchu Guan; Xiaohu Shi; Maurizio Marchese; Chen Yang; Yanchun Liang (2011). "बीज एफ़िनिटी प्रसार के साथ टेक्स्ट क्लस्टरिंग". IEEE Transactions on Knowledge & Data Engineering. 23 (4): 627–637. doi:10.1109/tkde.2010.144. hdl:11572/89884. S2CID 14053903.

[5] Almeida, Lucas Milanez de Lima; Balanco, Paulo Antonio de Freitas (2020-06-01). "Application of multivariate analysis as complementary instrument in studies about structural changes: An example of the multipliers in the US economy". Structural Change and Economic Dynamics (in English). 53: 189–207. doi:10.1016/j.strueco.2020.02.006. ISSN 0954-349X. S2CID 216406772.

[1]

[2]

[3]

[4]

[5]

Anonymous

Search

एफिनिटी प्रोपेगेशन: Difference between revisions

Namespaces

More

Page actions

Revision as of 17:00, 18 July 2023

Contents

एल्गोरिदम

अनुप्रयोग

सॉफ़्टवेयर

संदर्भ

Navigation

Navigation

Wiki tools

Wiki tools

Revision as of 00:48, 18 July 2023 (view source) alpha>AshishG No edit summary ← Older edit	Revision as of 17:00, 18 July 2023 (view source) alpha>Abhishek m (Abhishek moved page आत्मीयता का प्रसार to एफिनिटी प्रोपेगेशन without leaving a redirect) Newer edit →
(No difference)

Anonymous

Search

एफिनिटी प्रोपेगेशन: Difference between revisions

Revision as of 17:00, 18 July 2023

एल्गोरिदम

अनुप्रयोग

सॉफ़्टवेयर

संदर्भ

Navigation

Wiki tools

Page tools

Other projects

Categories