ज्यामितीय माध्यिका: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 2: Line 2:
{{distinguish|माध्यिका (ज्यामिति)|ज्यामितीय माध्य}}
{{distinguish|माध्यिका (ज्यामिति)|ज्यामितीय माध्य}}


[[File:Geometric median example.svg|thumb|right|320px|अंकों की एक श्रृंखला के ज्यामितीय माध्यिका (पीले रंग में) का उदाहरण। द्रव्यमान का केंद्र नीले रंग में।]][[ज्यामिति]] में, [[यूक्लिडियन अंतरिक्ष|यूक्लिडियन]] में नमूना बिंदुओं के असतत सेट का '''ज्यामितीय माध्यिका''' वह बिंदु है जो नमूना बिंदुओं की दूरी को कम करता है। यह माध्यिका का सामान्यीकरण करता है, जिसमें एक-आयामी डेटा के लिए दूरियों के योग को कम करने का गुण होता है, और उच्च आयामों में एक [[केंद्रीय प्रवृत्ति]] प्रदान करता है। इसे 1-माध्यिका,<ref>The more general [[k-median problem|''k''-median problem]] asks for the location of ''k'' cluster centers minimizing the sum of distances from each sample point to its nearest center.</ref> स्थानिक माध्यिका,<ref name="dksw">{{harvtxt|Drezner|Klamroth|Schöbel|Wesolowsky|2002}}</ref> यूक्लिडियन मिनिसम बिंदु,<ref name="dksw" /> या टोरिकेली बिंदु{{sfnp|Cieslik|2006}} के रूप में भी जाना जाता है।
[[File:Geometric median example.svg|thumb|right|320px|अंकों की एक श्रृंखला के ज्यामितीय माध्यिका (पीले रंग में) का उदाहरण। द्रव्यमान का केंद्र नीले रंग में।]][[ज्यामिति]] में, [[यूक्लिडियन अंतरिक्ष|यूक्लिडियन]] में नमूना बिंदुओं के असतत सेट का '''ज्यामितीय माध्यिका''' वह बिंदु है जो नमूना बिंदुओं की दूरी को कम करता है। यह माध्यिका का सामान्यीकरण करता है, जिसमें एक-आयामी डेटा के लिए दूरियों के योग को कम करने का गुण होता है, और उच्च आयामों में एक [[केंद्रीय प्रवृत्ति]] प्रदान करता है। इसे 1-माध्यिका,<ref>The more general [[k-median problem|''k''-median problem]] asks for the location of ''k'' cluster centers minimizing the sum of distances from each sample point to its nearest center.</ref> स्थानिक माध्यिका,<ref name="dksw">{{harvtxt|Drezner|Klamroth|Schöbel|Wesolowsky|2002}}</ref> यूक्लिडियन मिनिसम बिंदु,<ref name="dksw" /> या टोरिकेली बिंदु{{sfnp|Cieslik|2006}} के रूप में भी जाना जाता है।ka


ज्यामितीय माध्यिका आंकड़ों में [[स्थान पैरामीटर]] का एक महत्वपूर्ण अनुमानक है,{{sfnp|Lawera|Thompson|1993}} जहां इसे L<sub>1</sub> अनुमानक के रूप में भी जाना जाता है।<ref name="lr"/> यह सुविधा स्थान में एक मानक समस्या भी है, जहाँ यह परिवहन की लागत को कम करने के लिए एक सुविधा का पता लगाने की समस्या का मॉडल बनाती है।{{sfnp|Eiselt|Marianov|2011}}
ज्यामितीय माध्यिका आंकड़ों में [[स्थान पैरामीटर]] का एक महत्वपूर्ण अनुमानक है,{{sfnp|Lawera|Thompson|1993}} जहां इसे L<sub>1</sub> अनुमानक के रूप में भी जाना जाता है।<ref name="lr"/> यह सुविधा स्थान में एक मानक समस्या भी है, जहाँ यह परिवहन की लागत को कम करने के लिए एक सुविधा का पता लगाने की समस्या का मॉडल बनाती है।{{sfnp|Eiselt|Marianov|2011}}
Line 18: Line 18:


== गुण ==
== गुण ==
* 1-आयामी स्थिति के लिए, ज्यामितीय माध्य माध्यिका के साथ मेल खाता है। ऐसा इसलिए है क्योंकि अविभाजित माध्यिका भी बिंदुओं से दूरियों के योग को कम करती है। (अधिक सटीक रूप से, यदि अंक पी<sub>1</sub> हैं, …, पी<sub>n</sub> हैं, उस क्रम में, ज्यामितीय माध्यिका मध्य बिंदु है <math>p_{(n+1)/2}</math> यदि n विषम है, लेकिन विशिष्ट रूप से निर्धारित नहीं है यदि n सम है, जब यह दो मध्य बिंदुओं के बीच रेखा खंड में कोई बिंदु हो सकता है <math>p_{n/2}</math> और <math>p_{(n/2)+1}</math>.) <ref name="haldane"/><ref>Claim 18.10, ''Geometric Methods and Optimization Problems'', V. Boltyanski, H. Martini, V. Soltan, Springer, 1999.</ref>
* 1-आयामी स्थिति के लिए, ज्यामितीय माध्य माध्यिका के साथ मेल खाता है। ऐसा इसलिए है क्योंकि अविभाजित माध्यिका भी बिंदुओं से दूरियों के योग को कम करती है। (अधिक त्रुटिहीन रूप से, यदि अंक पी<sub>1</sub> हैं, …, पी<sub>n</sub> हैं, उस क्रम में, ज्यामितीय माध्यिका मध्य बिंदु है <math>p_{(n+1)/2}</math> यदि n विषम है, लेकिन विशिष्ट रूप से निर्धारित नहीं है यदि n सम है, जब यह दो मध्य बिंदुओं के बीच रेखा खंड में कोई बिंदु हो सकता है <math>p_{n/2}</math> और <math>p_{(n/2)+1}</math>.) <ref name="haldane"/><ref>Claim 18.10, ''Geometric Methods and Optimization Problems'', V. Boltyanski, H. Martini, V. Soltan, Springer, 1999.</ref>
*ज्यामितीय माध्य अद्वितीय होता है जब भी बिंदु संरेख नहीं होते हैं।<ref name="vz">{{harvtxt|Vardi|Zhang|2000}}</ref>
*ज्यामितीय माध्य अद्वितीय होता है जब भी बिंदु संरेख नहीं होते हैं।<ref name="vz">{{harvtxt|Vardi|Zhang|2000}}</ref>
* ज्यामितीय मध्य यूक्लिडियन [[समानता (ज्यामिति)]] के लिए [[समतुल्य]] होता है, जिसमें [[अनुवाद (ज्यामिति)]] और [[रोटेशन (गणित)]] सम्मलित होता है।<ref name="lr"/><ref name="haldane">{{harvtxt|Haldane|1948}}</ref> इसका मतलब यह है कि एक ही परिणाम या तो ज्यामितीय माध्यिका को बदलकर, या समान परिवर्तन को नमूना डेटा में लागू करके और रूपांतरित डेटा के ज्यामितीय माध्य को खोजने से प्राप्त होता है। यह संपत्ति इस तथ्य से अनुसरण करती है कि ज्यामितीय मध्यिका केवल जोड़ीदार दूरी से परिभाषित होती है, और यह ऑर्थोगोनल कार्टेशियन निर्देशांक की प्रणाली पर निर्भर नहीं करती है जिसके द्वारा नमूना डेटा का प्रतिनिधित्व किया जाता है। इसके विपरीत, एक बहुभिन्नरूपी डेटा सेट के लिए घटक-वार माध्य सामान्य रोटेशन अपरिवर्तनीय नहीं होता है, न ही यह निर्देशांक की पसंद से स्वतंत्र होता है।<ref name="lr"/>
* ज्यामितीय मध्य यूक्लिडियन [[समानता (ज्यामिति)]] के लिए [[समतुल्य]] होता है, जिसमें [[अनुवाद (ज्यामिति)]] और [[रोटेशन (गणित)]] सम्मलित होता है।<ref name="lr"/><ref name="haldane">{{harvtxt|Haldane|1948}}</ref> इसका मतलब यह है कि एक ही परिणाम या तो ज्यामितीय माध्यिका को बदलकर, या समान परिवर्तन को नमूना डेटा में लागू करके और रूपांतरित डेटा के ज्यामितीय माध्य को खोजने से प्राप्त होता है। यह संपत्ति इस तथ्य से अनुसरण करती है कि ज्यामितीय मध्यिका केवल जोड़ीदार दूरी से परिभाषित होती है, और यह ऑर्थोगोनल कार्टेशियन निर्देशांक की प्रणाली पर निर्भर नहीं करती है जिसके द्वारा नमूना डेटा का प्रतिनिधित्व किया जाता है। इसके विपरीत, एक बहुभिन्नरूपी डेटा सेट के लिए घटक-वार माध्य सामान्य रोटेशन अपरिवर्तनीय नहीं होता है, न ही यह निर्देशांक की पसंद से स्वतंत्र होता है।<ref name="lr"/>
Line 27: Line 27:
*4 [[समतलीय]] बिंदुओं के लिए, यदि चार बिंदुओं में से एक बिंदु अन्य तीन बिंदुओं से बने त्रिभुज के अंदर है, तो ज्यामितीय माध्यिका वह बिंदु होती है। अन्यथा, चार बिंदु उत्तल चतुर्भुज बनाते हैं और ज्यामितीय माध्य चतुर्भुज के विकर्णों का क्रॉसिंग बिंदु होता है। चार समतलीय बिंदुओं का ज्यामितीय माध्य चार बिंदुओं के अद्वितीय [[रेडॉन बिंदु]] के समान होता है।<ref>{{harvtxt|Cieslik|2006}}, p.&nbsp;6; {{harvtxt|Plastria|2006}}. The convex case was originally proven by [[Giovanni Fagnano]].</ref>
*4 [[समतलीय]] बिंदुओं के लिए, यदि चार बिंदुओं में से एक बिंदु अन्य तीन बिंदुओं से बने त्रिभुज के अंदर है, तो ज्यामितीय माध्यिका वह बिंदु होती है। अन्यथा, चार बिंदु उत्तल चतुर्भुज बनाते हैं और ज्यामितीय माध्य चतुर्भुज के विकर्णों का क्रॉसिंग बिंदु होता है। चार समतलीय बिंदुओं का ज्यामितीय माध्य चार बिंदुओं के अद्वितीय [[रेडॉन बिंदु]] के समान होता है।<ref>{{harvtxt|Cieslik|2006}}, p.&nbsp;6; {{harvtxt|Plastria|2006}}. The convex case was originally proven by [[Giovanni Fagnano]].</ref>
== गणना ==
== गणना ==
ज्यामितीय माध्यिका की आसानी से समझ में आने वाली अवधारणा होने के अतिरिक्त, इसकी गणना करना एक चुनौती है। केंद्रक या द्रव्यमान का केंद्र, जिसे ज्यामितीय माध्यिका के समान परिभाषित किया गया है, प्रत्येक बिंदु के लिए दूरी के वर्गों के योग को कम करने के रूप में, एक सरल सूत्र द्वारा पाया जा सकता है - इसके निर्देशांक बिंदुओं के निर्देशांक के औसत हैं - लेकिन इसमें है दिखाया गया है कि कोई स्पष्ट सूत्र, न ही एक सटीक एल्गोरिदम जिसमें केवल अंकगणितीय संचालन और kth मूल सम्मलित हैं, सामान्य रूप से ज्यामितीय माध्यिका के लिए उपस्तिथ हो सकते हैं। इसलिए, गणना के इस मॉडल के तहत इस समस्या के समाधान के लिए केवल संख्यात्मक या प्रतीकात्मक सन्निकटन संभव हैं।<ref>{{harvtxt|Bajaj|1986}}; {{harvtxt|Bajaj|1988}}. Earlier, {{harvtxt|Cockayne|Melzak|1969}} proved that the Steiner point for 5 points in the plane cannot be constructed with [[ruler and compass]]</ref>
ज्यामितीय माध्यिका की आसानी से समझ में आने वाली अवधारणा होने के अतिरिक्त, इसकी गणना करना एक चुनौती है। केंद्रक या द्रव्यमान का केंद्र, जिसे ज्यामितीय माध्यिका के समान परिभाषित किया गया है, प्रत्येक बिंदु के लिए दूरी के वर्गों के योग को कम करने के रूप में, एक सरल सूत्र द्वारा पाया जा सकता है - इसके निर्देशांक बिंदुओं के निर्देशांक के औसत हैं - लेकिन इसमें है दिखाया गया है कि कोई स्पष्ट सूत्र, न ही एक त्रुटिहीन एल्गोरिदम जिसमें केवल अंकगणितीय संचालन और kth मूल सम्मलित हैं, सामान्य रूप से ज्यामितीय माध्यिका के लिए उपस्तिथ हो सकते हैं। इसलिए, गणना के इस मॉडल के तहत इस समस्या के समाधान के लिए केवल संख्यात्मक या प्रतीकात्मक सन्निकटन संभव हैं।<ref>{{harvtxt|Bajaj|1986}}; {{harvtxt|Bajaj|1988}}. Earlier, {{harvtxt|Cockayne|Melzak|1969}} proved that the Steiner point for 5 points in the plane cannot be constructed with [[ruler and compass]]</ref>


हालांकि, पुनरावृत्त प्रक्रिया का उपयोग करके ज्यामितीय माध्यिका के सन्निकटन की गणना करना सीधा है जिसमें प्रत्येक चरण अधिक सटीक सन्निकटन उत्पन्न करता है। इस प्रकार की प्रक्रियाएं इस तथ्य से प्राप्त की जा सकती हैं कि नमूना बिंदुओं की दूरी का योग एक उत्तल कार्य है, क्योंकि प्रत्येक नमूना बिंदु की दूरी उत्तल है और उत्तल कार्यों का योग उत्तल रहता है। इसलिए, प्रत्येक चरण पर दूरियों के योग को कम करने वाली प्रक्रियाएं [[स्थानीय इष्टतम]] में फंस नहीं सकतीं।
चूंकि, पुनरावृत्त प्रक्रिया का उपयोग करके ज्यामितीय माध्यिका के सन्निकटन की गणना करना सीधा है जिसमें प्रत्येक चरण अधिक त्रुटिहीन सन्निकटन उत्पन्न करता है। इस प्रकार की प्रक्रियाएं इस तथ्य से प्राप्त की जा सकती हैं कि नमूना बिंदुओं की दूरी का योग एक उत्तल कार्य है, क्योंकि प्रत्येक नमूना बिंदु की दूरी उत्तल है और उत्तल कार्यों का योग उत्तल रहता है। इसलिए, प्रत्येक चरण पर दूरियों के योग को कम करने वाली प्रक्रियाएं [[स्थानीय इष्टतम]] में फंस नहीं सकती है।


इस प्रकार का एक सामान्य दृष्टिकोण, [[एंड्रे वीज़फेल्ड]] के काम के बाद वीज़फेल्ड का एल्गोरिथ्म कहलाता है,<ref>{{harvtxt|Weiszfeld|1937}}; {{harvtxt|Kuhn|1973}}; {{harvtxt|Chandrasekaran|Tamir|1989}}.</ref> पुनरावृत्ति पुन: भारित कम से कम वर्गों का एक रूप है। यह एल्गोरिथ्म वजन के एक सेट को परिभाषित करता है जो वर्तमान अनुमान से नमूना बिंदुओं तक की दूरी के व्युत्क्रमानुपाती होता है, और एक नया अनुमान बनाता है जो इन भारों के अनुसार नमूने का भारित औसत होता है। वह है,
इस प्रकार का एक सामान्य दृष्टिकोण, [[एंड्रे वीज़फेल्ड]] के काम के बाद वीज़फेल्ड का एल्गोरिथ्म कहलाता है,<ref>{{harvtxt|Weiszfeld|1937}}; {{harvtxt|Kuhn|1973}}; {{harvtxt|Chandrasekaran|Tamir|1989}}.</ref> पुनरावृत्ति पुन: भारित कम से कम वर्गों का एक रूप होता है। यह एल्गोरिथ्म वजन के एक सेट को परिभाषित करता है जो वर्तमान अनुमान से नमूना बिंदुओं तक की दूरी के व्युत्क्रमानुपाती होता है, और एक नया अनुमान बनाता है जो इन भारों के अनुसार नमूने का भारित औसत होता है। वह है,
:<math>\left. y_{k+1}=\left( \sum_{i=1}^m \frac{x_i}{\| x_i - y_k \|} \right) \right/ \left( \sum_{i=1}^m \frac{1}{\| x_i - y_k \|} \right).</math>
:<math>\left. y_{k+1}=\left( \sum_{i=1}^m \frac{x_i}{\| x_i - y_k \|} \right) \right/ \left( \sum_{i=1}^m \frac{1}{\| x_i - y_k \|} \right).</math>
यह विधि लगभग सभी प्रारंभिक स्थितियों के लिए अभिसरण करती है, लेकिन जब इसका कोई अनुमान दिए गए बिंदुओं में से किसी एक पर पड़ता है तो यह अभिसरण करने में विफल हो सकता है। इन मामलों को संभालने के लिए इसे संशोधित किया जा सकता है ताकि यह सभी प्रारंभिक बिंदुओं के लिए अभिसरण कर सके।<ref name="vz"/>
यह विधि लगभग सभी प्रारंभिक स्थितियों के लिए अभिसरण करती है, लेकिन जब इसका कोई अनुमान दिए गए बिंदुओं में से किसी एक पर पड़ता है तो यह अभिसरण करने में विफल हो सकता है। इन स्थितियों को संभालने के लिए इसे संशोधित किया जा सकता है जिससे कि यह सभी प्रारंभिक बिंदुओं के लिए अभिसरण कर सकता है।<ref name="vz"/>


{{harvtxt|Bose|Maheshwari|Morin|2003}} इस समस्या का लगभग इष्टतम समाधान खोजने के लिए अधिक परिष्कृत ज्यामितीय अनुकूलन प्रक्रियाओं का वर्णन करें।
{{harvtxt|बोस|माहेश्वरी|मोरिन|2003}} इस समस्या का लगभग इष्टतम समाधान खोजने के लिए अधिक परिष्कृत ज्यामितीय अनुकूलन प्रक्रियाओं का वर्णन करते हैं। {{harvtxt|कोहेन|एट|अल|Pachocki|2016}} दिखाते हैं कि ज्यामितीय माध्यिका की गणना लगभग रैखिक समय में मनमाने ढंग से कैसे की जाती है। यह भी ध्यान दें कि समस्या को दूसरे क्रम के शंकु रूप के रूप में तैयार किया जा सकता है
{{harvtxt|Cohen|Lee|Miller|Pachocki|2016}} दिखाएँ कि लगभग रेखीय समय में मनमाने ढंग से सटीकता के लिए ज्यामितीय माध्यिका की गणना कैसे करें।
यह भी ध्यान दें कि समस्या को दूसरे क्रम के शंकु प्रोग्रामिंग | दूसरे क्रम के शंकु कार्यक्रम के रूप में तैयार किया जा सकता है
 
{{harvtxt|बोस|माहेश्वरी|मोरिन|2003}} इस समस्या का लगभग इष्टतम समाधान खोजने के लिए अधिक परिष्कृत ज्यामितीय अनुकूलन प्रक्रियाओं का वर्णन करते हैं। {{harvtxt|कोहेन|एट|अल|Pachocki|2016}} दिखाते हैं कि ज्यामितीय माध्यिका की गणना लगभग रैखिक समय में मनमाने ढंग से कैसे की जाती है। यह भी ध्यान दें कि समस्या को दूसरे क्रम के शंकु कार्यक्रम के रूप में तैयार किया जा सकता है
:<math> \underset{y \in \mathbb{R}^n, \ s \in \mathbb{R}^m}{\min} \ \sum_{i=1}^m s_i \text{ subject to } s_i \geq \left \| x_i-y \right \|_2 \text{ for } i=1, \ldots, m,</math>
:<math> \underset{y \in \mathbb{R}^n, \ s \in \mathbb{R}^m}{\min} \ \sum_{i=1}^m s_i \text{ subject to } s_i \geq \left \| x_i-y \right \|_2 \text{ for } i=1, \ldots, m,</math>
जिसे सामान्य अनुकूलन सॉल्वरों का उपयोग करके बहुपद समय में हल किया जा सकता है।
जिसे सामान्य अनुकूलन सॉल्वरों का उपयोग करके बहुपद समय में हल किया जा सकता है।
Line 63: Line 59:


== सामान्यीकरण ==
== सामान्यीकरण ==
ज्यामितीय माध्यिका को यूक्लिडियन रिक्त स्थान से सामान्य [[रीमैनियन कई गुना]] (और यहां तक ​​कि मीट्रिक रिक्त स्थान) तक उसी विचार का उपयोग करके सामान्यीकृत किया जा सकता है जिसका उपयोग रीमैनियन मैनिफोल्ड पर फ्रेचेट माध्य को परिभाषित करने के लिए किया जाता है।<ref>{{cite conference |url=https://ieeexplore.ieee.org/document/4587747 |title=ज्यामितीय माध्यिका के माध्यम से रीमैनियन मैनिफोल्ड्स पर मजबूत आंकड़े|last1=Fletcher |first1=P. Thomas |last2=Venkatasubramanian |first2=Suresh |last3=Joshi |first3=Sarang |date=23 June 2008 |publisher=IEEE |book-title=2008 IEEE Conference on Computer Vision and Pattern Recognition |location=Anchorage, AK, USA |conference=IEEE Conference on Computer Vision and Pattern Recognition}}</ref>{{sfnp|Fletcher|Venkatasubramanian|Joshi|2009}} होने देना <math>M</math> संबंधित दूरी समारोह के साथ एक रिमेंनियन मैनिफोल्ड बनें <math>d(\cdot, \cdot)</math>, होने देना <math>w_1, \ldots, w_n</math> होना <math>n</math> वज़न का योग 1, और चलो <math>x_1, \ldots, x_n</math>
ज्यामितीय माध्यिका को यूक्लिडियन रिक्त स्थान से सामान्य [[रीमैनियन कई गुना]] (और यहां तक ​​कि मीट्रिक रिक्त स्थान) तक उसी विचार का उपयोग करके सामान्यीकृत किया जा सकता है जिसका उपयोग रीमैनियन मैनिफोल्ड पर फ्रेचेट माध्य को परिभाषित करने के लिए किया जाता है।<ref>{{cite conference |url=https://ieeexplore.ieee.org/document/4587747 |title=ज्यामितीय माध्यिका के माध्यम से रीमैनियन मैनिफोल्ड्स पर मजबूत आंकड़े|last1=Fletcher |first1=P. Thomas |last2=Venkatasubramanian |first2=Suresh |last3=Joshi |first3=Sarang |date=23 June 2008 |publisher=IEEE |book-title=2008 IEEE Conference on Computer Vision and Pattern Recognition |location=Anchorage, AK, USA |conference=IEEE Conference on Computer Vision and Pattern Recognition}}</ref>{{sfnp|Fletcher|Venkatasubramanian|Joshi|2009}} <math>M</math> संबंधित दूरी के साथ एक रिमेंनियन मैनिफोल्ड है <math>d(\cdot, \cdot)</math>, <math>w_1, \ldots, w_n</math> है <math>n</math> वज़न का योग 1 है, और <math>x_1, \ldots, x_n</math> है <math>n</math> से अवलोकन <math>M</math>. फिर हम भारित ज्यामितीय माध्यिका को परिभाषित करते हैं <math>m</math> (या भारित फ़्रेचेट माध्यिका) डेटा बिंदुओं के रूप में
होना <math>n</math> से अवलोकन <math>M</math>. फिर हम भारित ज्यामितीय माध्यिका को परिभाषित करते हैं <math>m</math> (या भारित फ़्रेचेट माध्यिका) डेटा बिंदुओं के रूप में
: <math> m = \underset{x \in M}{\operatorname{arg\,min}} \sum_{i=1}^n w_i d(x,x_i) </math>.
: <math> m = \underset{x \in M}{\operatorname{arg\,min}} \sum_{i=1}^n w_i d(x,x_i) </math>.
यदि सभी वजन बराबर हैं, तो हम बस यही कहते हैं <math>m</math> ज्यामितीय माध्यिका है।
यदि सभी वजन बराबर हैं, तो हम बस यही कहते हैं <math>m</math> ज्यामितीय माध्यिका है।

Revision as of 02:47, 3 April 2023

अंकों की एक श्रृंखला के ज्यामितीय माध्यिका (पीले रंग में) का उदाहरण। द्रव्यमान का केंद्र नीले रंग में।

ज्यामिति में, यूक्लिडियन में नमूना बिंदुओं के असतत सेट का ज्यामितीय माध्यिका वह बिंदु है जो नमूना बिंदुओं की दूरी को कम करता है। यह माध्यिका का सामान्यीकरण करता है, जिसमें एक-आयामी डेटा के लिए दूरियों के योग को कम करने का गुण होता है, और उच्च आयामों में एक केंद्रीय प्रवृत्ति प्रदान करता है। इसे 1-माध्यिका,[1] स्थानिक माध्यिका,[2] यूक्लिडियन मिनिसम बिंदु,[2] या टोरिकेली बिंदु[3] के रूप में भी जाना जाता है।ka

ज्यामितीय माध्यिका आंकड़ों में स्थान पैरामीटर का एक महत्वपूर्ण अनुमानक है,[4] जहां इसे L1 अनुमानक के रूप में भी जाना जाता है।[5] यह सुविधा स्थान में एक मानक समस्या भी है, जहाँ यह परिवहन की लागत को कम करने के लिए एक सुविधा का पता लगाने की समस्या का मॉडल बनाती है।[6]

समतल में तीन बिंदुओं के लिए समस्या की विशेष स्थिति (अर्थात्, नीचे दी गई परिभाषा में m = 3 और n = 2) को कभी-कभी फ़र्मेट की समस्या के रूप में भी जाना जाता है, यह न्यूनतम स्टाइनर पेड़ों के निर्माण में उत्पन्न होता है, और मूल रूप से पियरे डी फर्मेट द्वारा एक समस्या के रूप में प्रस्तुत किया गया था और इवेंजलिस्ता टोरिकेली द्वारा हल किया गया था।[7] इसके समाधान को अब तीन नमूना बिंदुओं द्वारा गठित त्रिभुज के फर्मेट बिंदु के रूप में जाना जाता है।[8] बदले में ज्यामितीय माध्यिका को भारित दूरियों के योग को कम करने की समस्या के लिए सामान्यीकृत किया जा सकता है, जिसे अल्फ्रेड वेबर की 1909 की सुविधा स्थान पर पुस्तक में समस्या की चर्चा के बाद वेबर समस्या के रूप में जाना जाता है।[2] इसके अतिरिक्त कुछ स्रोत वेबर की समस्या को फ़र्मेट-वेबर समस्या कहते हैं,[9] लेकिन अन्य इस नाम का उपयोग भारित ज्यामितीय माध्यिका समस्या के लिए करते हैं।[10]

वेसोलोव्स्की (1993) ज्यामितीय माध्य समस्या का एक सर्वेक्षण प्रदान करता है। गैर-असतत बिंदु सेटों के लिए समस्या के सामान्यीकरण के लिए फेकेट, मिशेल & बेउरर (2005) देखें।

परिभाषा

औपचारिक रूप से, m बिंदुओं के दिए गए सेट के लिए प्रत्येक के साथ , ज्यामितीय माध्यिका के रूप में परिभाषित किया गया है

यहाँ, arg min का अर्थ है तर्क का मान जो राशि को कम करता है। इस स्थिति में, यह बात है जहाँ से सभी यूक्लिडियन दूरियों का योग न्यूनतम है।

गुण

  • 1-आयामी स्थिति के लिए, ज्यामितीय माध्य माध्यिका के साथ मेल खाता है। ऐसा इसलिए है क्योंकि अविभाजित माध्यिका भी बिंदुओं से दूरियों के योग को कम करती है। (अधिक त्रुटिहीन रूप से, यदि अंक पी1 हैं, …, पीn हैं, उस क्रम में, ज्यामितीय माध्यिका मध्य बिंदु है यदि n विषम है, लेकिन विशिष्ट रूप से निर्धारित नहीं है यदि n सम है, जब यह दो मध्य बिंदुओं के बीच रेखा खंड में कोई बिंदु हो सकता है और .) [11][12]
  • ज्यामितीय माध्य अद्वितीय होता है जब भी बिंदु संरेख नहीं होते हैं।[13]
  • ज्यामितीय मध्य यूक्लिडियन समानता (ज्यामिति) के लिए समतुल्य होता है, जिसमें अनुवाद (ज्यामिति) और रोटेशन (गणित) सम्मलित होता है।[5][11] इसका मतलब यह है कि एक ही परिणाम या तो ज्यामितीय माध्यिका को बदलकर, या समान परिवर्तन को नमूना डेटा में लागू करके और रूपांतरित डेटा के ज्यामितीय माध्य को खोजने से प्राप्त होता है। यह संपत्ति इस तथ्य से अनुसरण करती है कि ज्यामितीय मध्यिका केवल जोड़ीदार दूरी से परिभाषित होती है, और यह ऑर्थोगोनल कार्टेशियन निर्देशांक की प्रणाली पर निर्भर नहीं करती है जिसके द्वारा नमूना डेटा का प्रतिनिधित्व किया जाता है। इसके विपरीत, एक बहुभिन्नरूपी डेटा सेट के लिए घटक-वार माध्य सामान्य रोटेशन अपरिवर्तनीय नहीं होता है, न ही यह निर्देशांक की पसंद से स्वतंत्र होता है।[5]
  • ज्यामितीय माध्यिका का ब्रेकडाउन बिंदु 0.5 है।[5] अर्थात्, नमूना डेटा का आधा हिस्सा मनमाने ढंग से दूषित होता है, और नमूनों का माध्य अभी भी अदूषित डेटा के स्थान के लिए एक मजबूत अनुमानक प्रदान करता है।

विशेष स्थितियां

  • 3 (गैर संरेख) बिंदुओं के लिए, यदि उन बिंदुओं से बने त्रिभुज का कोई कोण 120° या अधिक होता है, तो ज्यामितीय माध्यिका उस कोण के शीर्ष पर स्थित बिंदु होती है। यदि सभी कोण 120° से कम हैं, तो ज्यामितीय माध्य त्रिभुज के भीतर का वह बिंदु है जो त्रिभुज के शीर्षों के प्रत्येक तीन युग्मों में 120° का कोण अंतरित करता है।[11] इसे तीन शीर्षों से बने त्रिभुज के फर्मेट बिंदु के रूप में भी जाना जाता है। (यदि तीन बिंदु संरेख हैं तो ज्यामितीय माध्य दो अन्य बिंदुओं के बीच का बिंदु है, जैसा कि एक आयामी माध्यिका के स्थितियों में होता है।)
  • 4 समतलीय बिंदुओं के लिए, यदि चार बिंदुओं में से एक बिंदु अन्य तीन बिंदुओं से बने त्रिभुज के अंदर है, तो ज्यामितीय माध्यिका वह बिंदु होती है। अन्यथा, चार बिंदु उत्तल चतुर्भुज बनाते हैं और ज्यामितीय माध्य चतुर्भुज के विकर्णों का क्रॉसिंग बिंदु होता है। चार समतलीय बिंदुओं का ज्यामितीय माध्य चार बिंदुओं के अद्वितीय रेडॉन बिंदु के समान होता है।[14]

गणना

ज्यामितीय माध्यिका की आसानी से समझ में आने वाली अवधारणा होने के अतिरिक्त, इसकी गणना करना एक चुनौती है। केंद्रक या द्रव्यमान का केंद्र, जिसे ज्यामितीय माध्यिका के समान परिभाषित किया गया है, प्रत्येक बिंदु के लिए दूरी के वर्गों के योग को कम करने के रूप में, एक सरल सूत्र द्वारा पाया जा सकता है - इसके निर्देशांक बिंदुओं के निर्देशांक के औसत हैं - लेकिन इसमें है दिखाया गया है कि कोई स्पष्ट सूत्र, न ही एक त्रुटिहीन एल्गोरिदम जिसमें केवल अंकगणितीय संचालन और kth मूल सम्मलित हैं, सामान्य रूप से ज्यामितीय माध्यिका के लिए उपस्तिथ हो सकते हैं। इसलिए, गणना के इस मॉडल के तहत इस समस्या के समाधान के लिए केवल संख्यात्मक या प्रतीकात्मक सन्निकटन संभव हैं।[15]

चूंकि, पुनरावृत्त प्रक्रिया का उपयोग करके ज्यामितीय माध्यिका के सन्निकटन की गणना करना सीधा है जिसमें प्रत्येक चरण अधिक त्रुटिहीन सन्निकटन उत्पन्न करता है। इस प्रकार की प्रक्रियाएं इस तथ्य से प्राप्त की जा सकती हैं कि नमूना बिंदुओं की दूरी का योग एक उत्तल कार्य है, क्योंकि प्रत्येक नमूना बिंदु की दूरी उत्तल है और उत्तल कार्यों का योग उत्तल रहता है। इसलिए, प्रत्येक चरण पर दूरियों के योग को कम करने वाली प्रक्रियाएं स्थानीय इष्टतम में फंस नहीं सकती है।

इस प्रकार का एक सामान्य दृष्टिकोण, एंड्रे वीज़फेल्ड के काम के बाद वीज़फेल्ड का एल्गोरिथ्म कहलाता है,[16] पुनरावृत्ति पुन: भारित कम से कम वर्गों का एक रूप होता है। यह एल्गोरिथ्म वजन के एक सेट को परिभाषित करता है जो वर्तमान अनुमान से नमूना बिंदुओं तक की दूरी के व्युत्क्रमानुपाती होता है, और एक नया अनुमान बनाता है जो इन भारों के अनुसार नमूने का भारित औसत होता है। वह है,

यह विधि लगभग सभी प्रारंभिक स्थितियों के लिए अभिसरण करती है, लेकिन जब इसका कोई अनुमान दिए गए बिंदुओं में से किसी एक पर पड़ता है तो यह अभिसरण करने में विफल हो सकता है। इन स्थितियों को संभालने के लिए इसे संशोधित किया जा सकता है जिससे कि यह सभी प्रारंभिक बिंदुओं के लिए अभिसरण कर सकता है।[13]

बोस, माहेश्वरी & मोरिन (2003) इस समस्या का लगभग इष्टतम समाधान खोजने के लिए अधिक परिष्कृत ज्यामितीय अनुकूलन प्रक्रियाओं का वर्णन करते हैं। कोहेन et al. (2016) दिखाते हैं कि ज्यामितीय माध्यिका की गणना लगभग रैखिक समय में मनमाने ढंग से कैसे की जाती है। यह भी ध्यान दें कि समस्या को दूसरे क्रम के शंकु रूप के रूप में तैयार किया जा सकता है

जिसे सामान्य अनुकूलन सॉल्वरों का उपयोग करके बहुपद समय में हल किया जा सकता है।

ज्यामितीय माध्यिका की विशेषता

यदि y दिए गए सभी बिंदुओं से भिन्न है, तो xi, तब y ज्यामितीय माध्यिका है यदि और केवल यदि यह संतुष्ट करती है:

यह इसके बराबर है:

जो वीज़फेल्ड के एल्गोरिथम से निकटता से संबंधित है।

सामान्यतः, y ज्यामितीय माध्यिका है यदि और केवल यदि सदिश u हैंi चूंकि:

जहां xi ≠ y है और,

और xi = y है और,

इस स्थिति का एक समकक्ष सूत्रीकरण है

इसे मध्य संपत्ति के सामान्यीकरण के रूप में देखा जा सकता है, इस अर्थ में कि बिंदुओं के किसी भी विभाजन, विशेष रूप से y के माध्यम से किसी भी हाइपरप्लेन द्वारा प्रेरित के रूप में, प्रत्येक तरफ y से सकारात्मक दिशाओं का समान और विपरीत योग होता है। एक आयामी स्थिति में, हाइपरप्लेन बिंदु y ही है, और दिशाओं का योग (निर्देशित) गिनती माप को सरल करता है।

सामान्यीकरण

ज्यामितीय माध्यिका को यूक्लिडियन रिक्त स्थान से सामान्य रीमैनियन कई गुना (और यहां तक ​​कि मीट्रिक रिक्त स्थान) तक उसी विचार का उपयोग करके सामान्यीकृत किया जा सकता है जिसका उपयोग रीमैनियन मैनिफोल्ड पर फ्रेचेट माध्य को परिभाषित करने के लिए किया जाता है।[17][18] संबंधित दूरी के साथ एक रिमेंनियन मैनिफोल्ड है , है वज़न का योग 1 है, और है से अवलोकन . फिर हम भारित ज्यामितीय माध्यिका को परिभाषित करते हैं (या भारित फ़्रेचेट माध्यिका) डेटा बिंदुओं के रूप में

.

यदि सभी वजन बराबर हैं, तो हम बस यही कहते हैं ज्यामितीय माध्यिका है।

यह भी देखें

  • मेडॉयड
  • मध्य_पूर्ण_विचलन#ज्यामितीय_मध्य_पूर्ण_विचलन

टिप्पणियाँ

  1. The more general k-median problem asks for the location of k cluster centers minimizing the sum of distances from each sample point to its nearest center.
  2. 2.0 2.1 2.2 Drezner et al. (2002)
  3. Cieslik (2006).
  4. Lawera & Thompson (1993).
  5. 5.0 5.1 5.2 5.3 Lopuhaä & Rousseeuw (1991)
  6. Eiselt & Marianov (2011).
  7. Krarup & Vajda (1997).
  8. Spain (1996).
  9. Brimberg (1995).
  10. Bose, Maheshwari & Morin (2003).
  11. 11.0 11.1 11.2 Haldane (1948)
  12. Claim 18.10, Geometric Methods and Optimization Problems, V. Boltyanski, H. Martini, V. Soltan, Springer, 1999.
  13. 13.0 13.1 Vardi & Zhang (2000)
  14. Cieslik (2006), p. 6; Plastria (2006). The convex case was originally proven by Giovanni Fagnano.
  15. Bajaj (1986); Bajaj (1988). Earlier, Cockayne & Melzak (1969) proved that the Steiner point for 5 points in the plane cannot be constructed with ruler and compass
  16. Weiszfeld (1937); Kuhn (1973); Chandrasekaran & Tamir (1989).
  17. Fletcher, P. Thomas; Venkatasubramanian, Suresh; Joshi, Sarang (23 June 2008). "ज्यामितीय माध्यिका के माध्यम से रीमैनियन मैनिफोल्ड्स पर मजबूत आंकड़े". 2008 IEEE Conference on Computer Vision and Pattern Recognition. IEEE Conference on Computer Vision and Pattern Recognition. Anchorage, AK, USA: IEEE.
  18. Fletcher, Venkatasubramanian & Joshi (2009).


संदर्भ