मीन शिफ्ट: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 2: Line 2:
{{Machine learning|Clustering}}
{{Machine learning|Clustering}}


 
मीन शिफ्ट एक  [[गैर पैरामीट्रिक]] [[सुविधा स्थान]] गणितीय विश्लेषण तकनीक है जो एक घनत्व फलन के मैक्सिमा का पता लगाने के लिए एक आधारशील एल्गोरिदम है, जिसे [[मोड (सांख्यिकी)|मोड]]  संवेदना खोजी एल्गोरिदम कहा जाता है।<ref name="PAMI95">{{cite journal
मीन शिफ्ट एक  [[गैर पैरामीट्रिक]] [[सुविधा स्थान]] गणितीय विश्लेषण तकनीक है जो एक घनत्व फ़ंक्शन के मैक्सिमा का पता लगाने के लिए एक आधारशील एल्गोरिदम है, जिसे [[मोड (सांख्यिकी)|मोड]]  संवेदना खोजी एल्गोरिदम कहा जाता है।<ref name="PAMI95">{{cite journal
   | last = Cheng
   | last = Cheng
   | first = Yizong
   | first = Yizong
Line 41: Line 40:
   }}</ref> यद्यपि, यह 1964 में श्नेल द्वारा किए गए पहले कार्य को याद दिलाता है।<ref>{{Cite journal|last=Schnell|first=P.|date=1964|title=समूहों को खोजने की एक विधि|url=https://onlinelibrary.wiley.com/doi/10.1002/bimj.19640060105|journal=Biometrische Zeitschrift|language=de|volume=6|issue=1|pages=47-48|doi=10.1002/bimj.19640060105}}</ref>
   }}</ref> यद्यपि, यह 1964 में श्नेल द्वारा किए गए पहले कार्य को याद दिलाता है।<ref>{{Cite journal|last=Schnell|first=P.|date=1964|title=समूहों को खोजने की एक विधि|url=https://onlinelibrary.wiley.com/doi/10.1002/bimj.19640060105|journal=Biometrische Zeitschrift|language=de|volume=6|issue=1|pages=47-48|doi=10.1002/bimj.19640060105}}</ref>
== सिंहावलोकन ==
== सिंहावलोकन ==
मीन शिफ्ट उस फ़ंक्शन से नमूना किए गए असतत डेटा को देखते हुए एक घनत्व फ़ंक्शन के मैक्सिमा - मोड (सांख्यिकी) - का पता लगाने की एक प्रक्रिया है।<ref name="PAMI95" />यह एक पुनरावृत्तीय विधि है, और हम प्रारंभिक अनुमान से प्रारंभ करते हैं <math> x </math>. आइए एक [[कर्नेल (सांख्यिकी)]] <math> K(x_i - x) </math> दिया जा। यह फ़ंक्शन माध्य के पुनः आकलन के लिए निकटवर्ती बिंदुओं का भार निर्धारित करता है। यद्यपि वर्तमान अनुमान की दूरी पर एक [[रेडियल आधार फ़ंक्शन कर्नेल]] का उपयोग किया जाता है, <math> K(x_i - x) = e^{-c||x_i - x||^2} </math>. विंडो में घनत्व का भारित माध्य किसके द्वारा निर्धारित किया जाता है? <math> K </math> है
 
 
मीन शिफ्ट एक प्रक्रिया है जिसका उपयोग एक गुणवत्ता फलन के मूल्यकों के मॉड्स की खोज के लिए किया जाता है, जो उस फलन से प्रारूप डेटा के आधार पर लिया गया होता है।<ref name="PAMI95" />यह एक पुनरावृत्तिक विधि है, और हम एक प्रारंभिक अनुमान <math> x </math> के साथ प्रारंभ करते हैं। एक [[कर्नेल (सांख्यिकी)|कर्नल फ़ंक्शन]] <math> K(x_i - x) </math> दिया गया हो। सामान्यतः, उपस्थित अनुमान तक दूरी पर [[रेडियल आधार फ़ंक्शन कर्नेल|गॉसियन कर्नल]] का प्रयोग किया जाता है,
 
<math> K(x_i - x) = e^{-c||x_i - x||^2} </math>. <math> K </math> द्वारा निर्धारित खिड़की में घनत्व का भारी औसत होता है। यह फलन अर्थात' की समीपी बिंदुओं के लिए वजन तय करता है, अर्थात के नए अनुमान के लिए पुनर्मूल्यांकन के लिए प्रयोग किए जाते हैं।


:<math> m(x) = \frac{ \sum_{x_i \in N(x)} K(x_i - x) x_i } {\sum_{x_i \in N(x)} K(x_i - x)} </math>
:<math> m(x) = \frac{ \sum_{x_i \in N(x)} K(x_i - x) x_i } {\sum_{x_i \in N(x)} K(x_i - x)} </math>
कहाँ <math> N(x) </math> का पड़ोस है <math> x </math>, जिसके लिए अंकों का एक सेट <math> K(x_i - x) \neq 0 </math>.
.


के अंतर <math>m(x) - x</math> फुकुनागा और होस्टेटलर में माध्य बदलाव कहा जाता है।<ref name="Fukunaga" />
यहां, <math> N(x) </math> के पड़ोसी <math> x </math> है, जो कुछ बिंदुओं का सेट होता है जिनके लिए <math> K(x_i - x) \neq 0 </math> होता है।
माध्य-शिफ्ट एल्गोरिथ्म अब सेट हो गया है <math> x \leftarrow m(x) </math>, और अनुमान को तब तक दोहराता है <math> m(x) </math> जुटता है.


यद्यपि माध्य शिफ्ट एल्गोरिदम का व्यापक रूप से कई अनुप्रयोगों में उपयोग किया गया है, उच्च आयामी स्थान में सामान्य कर्नेल का उपयोग करके एल्गोरिदम के अभिसरण के लिए एक कठोर प्रमाण अभी भी ज्ञात नहीं है।<ref name=":0">{{Cite journal|title = गॉसियन कर्नेल के साथ माध्य शिफ्ट एल्गोरिदम के अभिसरण के लिए एक पर्याप्त शर्त|journal = Journal of Multivariate Analysis|date = 2015-03-01|pages = 1–10|volume = 135|doi = 10.1016/j.jmva.2014.11.009|first = Youness|last = Aliyari Ghassabeh|doi-access = free}}</ref> अलियारी घासाबेह ने एक विभेदक, उत्तल और कड़ाई से घटते प्रोफ़ाइल फ़ंक्शन के साथ एक आयाम में माध्य शिफ्ट एल्गोरिदम के अभिसरण को दिखाया।<ref>{{Cite journal|title = एक-आयामी अंतरिक्ष में माध्य बदलाव एल्गोरिथ्म के अभिसरण पर|journal = Pattern Recognition Letters|date = 2013-09-01|pages = 1423–1427|volume = 34|issue = 12|doi = 10.1016/j.patrec.2013.05.004|first = Youness|last = Aliyari Ghassabeh|arxiv = 1407.2961|s2cid = 10233475}}</ref> यद्यपि, एक-आयामी मामले में वास्तविक दुनिया के अनुप्रयोग सीमित हैं। साथ ही, स्थिर (या पृथक) बिंदुओं की एक सीमित संख्या के साथ उच्च आयामों में एल्गोरिदम का अभिसरण साबित हुआ है।<ref name=":0" /><ref>{{Cite journal|title = माध्य बदलाव के अभिसरण पर एक नोट|journal = Pattern Recognition|date = 2007-06-01|pages = 1756–1762|volume = 40|issue = 6|doi = 10.1016/j.patcog.2006.10.016|first1 = Xiangru|last1 = Li|first2 = Zhanyi|last2 = Hu|first3 = Fuchao|last3 = Wu}}</ref> यद्यपि, सामान्य कर्नेल फ़ंक्शन के लिए परिमित स्थिर (या पृथक) बिंदु रखने के लिए पर्याप्त स्थितियाँ प्रदान नहीं की गई हैं।
फुकुनागा और होस्टेट्लर में, अंतर <math>m(x) - x</math> को मीन शिफ्ट कहा जाता है।<ref name="Fukunaga" /> अब मीन-शिफ्ट एल्गोरिदम <math> x </math> को <math> x \leftarrow m(x) </math> से सेट करता है और अनुमानन को<math> m(x) </math>का संघटन होने तक दोहराता है।


गॉसियन मीन-शिफ्ट एक उम्मीद-अधिकतमकरण एल्गोरिथ्म है।<ref>{{Cite journal|last=Carreira-Perpinan|first=Miguel A.|date=May 2007|title=गॉसियन मीन-शिफ्ट एक ईएम एल्गोरिथम है|journal=IEEE Transactions on Pattern Analysis and Machine Intelligence|volume=29|issue=5|pages=767–776|doi=10.1109/tpami.2007.1057|pmid=17356198|s2cid=6694308|issn=0162-8828}}</ref>
यद्यपि मीन शिफ्ट एल्गोरिदम का विस्तृत उपयोग कई एप्लिकेशनों में किया जा चुका है, परंतु एक उच्च आयामी अंतरिक्ष में एक सामान्य कर्नल का उपयोग करके एल्गोरिदम के संघटन के लिए एक कठिनता-मुक्त प्रमाण  अभी तक नहीं प्रस्तुत किया गया है।<ref name=":0">{{Cite journal|title = गॉसियन कर्नेल के साथ माध्य शिफ्ट एल्गोरिदम के अभिसरण के लिए एक पर्याप्त शर्त|journal = Journal of Multivariate Analysis|date = 2015-03-01|pages = 1–10|volume = 135|doi = 10.1016/j.jmva.2014.11.009|first = Youness|last = Aliyari Ghassabeh|doi-access = free}}</ref>अलियारी घसाबेह ने दिखाया कि एक आयाम में मीन शिफ्ट एल्गोरिदम का संघटन प्रमाणित किया जा सकता है जब उसमें एक अलगावशेषी, घुमावशील और सख्त रूप से घटनेवाली प्रोफ़ाइल फ़ंक्शन हो।<ref>{{Cite journal|title = एक-आयामी अंतरिक्ष में माध्य बदलाव एल्गोरिथ्म के अभिसरण पर|journal = Pattern Recognition Letters|date = 2013-09-01|pages = 1423–1427|volume = 34|issue = 12|doi = 10.1016/j.patrec.2013.05.004|first = Youness|last = Aliyari Ghassabeh|arxiv = 1407.2961|s2cid = 10233475}}</ref> यद्यपि, एक-आयामी परिस्थिति में सीमित वास्तविक विश्व अनुप्रयोग होते हैं। इसके अलावा, एक निर्देशांक (या अलग) बिंदुओं की एक सीमित संख्या के साथ उच्च आयामों में एल्गोरिदम के संघटन को प्रमाणित किया गया है।<ref name=":0" /><ref>{{Cite journal|title = माध्य बदलाव के अभिसरण पर एक नोट|journal = Pattern Recognition|date = 2007-06-01|pages = 1756–1762|volume = 40|issue = 6|doi = 10.1016/j.patcog.2006.10.016|first1 = Xiangru|last1 = Li|first2 = Zhanyi|last2 = Hu|first3 = Fuchao|last3 = Wu}}</ref> यद्यपि, किसी भी सामान्य कर्नल फ़ंक्शन के लिए सीमित निर्देशांक बिंदुओं के लिए पर्याप्त स्थितियाँ प्रदान नहीं की गई हैं।
 
गॉसियन मीन-शिफ्ट एक अपेक्षासंग्रह एवं अधिकतमीकरण एल्गोरिदम है।<ref>{{Cite journal|last=Carreira-Perpinan|first=Miguel A.|date=May 2007|title=गॉसियन मीन-शिफ्ट एक ईएम एल्गोरिथम है|journal=IEEE Transactions on Pattern Analysis and Machine Intelligence|volume=29|issue=5|pages=767–776|doi=10.1109/tpami.2007.1057|pmid=17356198|s2cid=6694308|issn=0162-8828}}</ref>




==विवरण==
==विवरण==


मान लीजिए कि डेटा एक सीमित सेट है <math>S</math> में सन्निहित है <math>n</math>-आयामी यूक्लिडियन अंतरिक्ष, <math>X</math>. होने देना <math>K</math> एक सपाट कर्नेल हो जो कि का विशिष्ट कार्य है <math>\lambda</math>-बॉल इन <math>X</math>,
डेटा एक समाप्त सेट <math>S</math> है जो <math>n</math>-आयामी यूक्लिडियन स्पेस <math>X</math> में एम्बेड है।<math>K</math> एक फ्लैट कर्नल है जो <math>X</math> में <math>\lambda</math>-बॉल  के विशेषता फ़ंक्शन है।
<div शैली= टेक्स्ट-संरेखण: केंद्र; >
<div शैली= टेक्स्ट-संरेखण: केंद्र; >
<math>  
<math>  
Line 66: Line 70:
</math> </div>
</math> </div>


एल्गोरिथ्म के प्रत्येक पुनरावृत्ति में, <math>s \leftarrow m(s)</math> सभी के लिए किया जाता है <math>s \in S</math> इसके साथ ही। तो, पहला सवाल यह है कि नमूनों के विरल सेट को देखते हुए घनत्व फ़ंक्शन का अनुमान कैसे लगाया जाए। सबसे सरल तरीकों में से एक है डेटा को सुचारू बनाना, उदाहरण के लिए, इसे चौड़ाई के एक निश्चित कर्नेल के साथ जोड़कर <math>h</math>,
एल्गोरिथ्म के प्रत्येक पुनरावृत्ति में, <math>s \leftarrow m(s)</math> सभी के लिए किया जाता है <math>s \in S</math> इसके साथ ही।


<div शैली= टेक्स्ट-संरेखण: केंद्र; >
प्रत्येक एल्गोरिदम के प्रत्यावर्तन में, सभी S के प्रत्येक p के लिए m(s) समवर्ती रूप से किया जाता है।
 
पहला प्रश्न है, तो विकिरणीय सेट के दिए गए नमूनों के आधार पर घनत्व फ़ंक्शन का आकलन कैसे करें। सबसे सरल दृष्टिकोन है डेटा को स्मूथ करना, उदाहरण के लिए, एक निश्चित चौड़ाई <math>h</math> के निश्चित कर्नल के साथ उसे गहन करने से हैं।
 
<div शैली="टेक्स्ट-संरेखण:" केंद्र;>
<math>  
<math>  
f(x) = \sum_{i}K(x - x_i) = \sum_{i}k \left(\frac{\|x - x_i\|^2}{h^2}\right)
f(x) = \sum_{i}K(x - x_i) = \sum_{i}k \left(\frac{\|x - x_i\|^2}{h^2}\right)
</math>
</math>
</div>
</div>
कहाँ <math>x_i</math> इनपुट नमूने हैं और <math>k(r)</math> कर्नेल फ़ंक्शन (या पार्ज़ेन विंडो) है। <math>h</math> एल्गोरिथम में एकमात्र पैरामीटर है और इसे बैंडविड्थ कहा जाता है। इस दृष्टिकोण को कर्नेल घनत्व अनुमान या पार्ज़ेन विंडो तकनीक के रूप में जाना जाता है। एक बार हमने गणना कर ली <math>f(x)</math> उपरोक्त समीकरण से, हम ग्रेडिएंट एसेंट या किसी अन्य अनुकूलन तकनीक का उपयोग करके इसकी स्थानीय मैक्सिमा पा सकते हैं। इस क्रूर बल दृष्टिकोण के साथ समस्या यह है कि, उच्च आयामों के लिए, इसका मूल्यांकन करना कम्प्यूटेशनल रूप से निषेधात्मक हो जाता है <math>f(x)</math> संपूर्ण खोज स्थान पर. इसके बजाय, मीन शिफ्ट एक प्रकार का उपयोग करता है जिसे अनुकूलन साहित्य में मल्टीपल रीस्टार्ट ग्रेडिएंट डिसेंट के रूप में जाना जाता है। स्थानीय अधिकतम के लिए कुछ अनुमान से प्रारंभ करते हुए, <math>y_k</math>, जो एक यादृच्छिक इनपुट डेटा बिंदु हो सकता है <math>x_1</math>, माध्य शिफ्ट घनत्व अनुमान के ग्रेडिएंट की गणना करता है <math>f(x)</math> पर <math>y_k</math> और उस दिशा में एक कठिन कदम उठाता है।<ref>Richard Szeliski, Computer Vision, Algorithms and Applications, Springer, 2011</ref>
'''जहाँ <math>x_i</math> इनपुट प्रारूप हैं और <math>k(r)</math> कर्नेल फलन (या पार्ज़ेन विंडो) है। <math>h</math> एल्गोरिथम में एकमात्र पैरामीटर है और इसे बैंडविड्थ कहा जाता है। इस दृष्टिकोण को कर्नेल घनत्व अनुमान या पार्ज़ेन विंडो तकनीक के रूप में जाना जाता है। एक बार हमने गणना कर ली <math>f(x)</math> उपरोक्त समीकरण से, हम ग्रेडिएंट एसेंट या किसी अन्य अनुकूलन तकनीक का उपयोग करके इसकी स्थानीय मैक्सिमा पा सकते हैं। इस क्रूर बल दृष्टिकोण के साथ समस्या यह है कि, उच्च आयामों के लिए, इसका मूल्यांकन करना कम्प्यूटेशनल रूप से निषेधात्मक हो जाता है <math>f(x)</math> संपूर्ण खोज स्थान पर. इसके बजाय, मीन शिफ्ट एक प्रकार का उपयोग करता है जिसे अनुकूलन साहित्य में मल्टीपल रीस्टार्ट ग्रेडिएंट डिसेंट के रूप में जाना जाता है। स्थानीय अधिकतम के लिए कुछ अनुमान से प्रारंभ करते हुए, <math>y_k</math>, जो एक यादृच्छिक इनपुट डेटा बिंदु हो सकता है <math>x_1</math>, माध्य शिफ्ट घनत्व अनुमान के ग्रेडिएंट की गणना करता है <math>f(x)</math> पर <math>y_k</math> और उस दिशा में एक कठिन कदम उठाता है।<ref>Richard Szeliski, Computer Vision, Algorithms and Applications, Springer, 2011</ref>'''
 




Line 112: Line 121:


=== क्लस्टरिंग ===
=== क्लस्टरिंग ===
द्वि-आयामी अंतरिक्ष में बिंदुओं के एक सेट पर विचार करें। मान लीजिए कि एक गोलाकार खिड़की केन्द्रित है <math>C</math> और त्रिज्या वाला <math>r</math> कर्नेल के रूप में. मीन-शिफ्ट एक पहाड़ी चढ़ाई एल्गोरिथ्म है जिसमें अभिसरण तक इस कर्नेल को उच्च घनत्व वाले क्षेत्र में पुनरावृत्त रूप से स्थानांतरित करना सम्मिलित है। प्रत्येक शिफ्ट को माध्य शिफ्ट वेक्टर द्वारा परिभाषित किया जाता है। माध्य शिफ्ट वेक्टर हमेशा घनत्व में अधिकतम वृद्धि की दिशा की ओर इशारा करता है। प्रत्येक पुनरावृत्ति पर कर्नेल को केन्द्रक या उसके भीतर के बिंदुओं के माध्य में स्थानांतरित कर दिया जाता है। इस माध्य की गणना करने की विधि कर्नेल की पसंद पर निर्भर करती है। इस मामले में यदि फ्लैट कर्नेल के बजाय गॉसियन कर्नेल को चुना जाता है, तो प्रत्येक बिंदु को पहले एक भार सौंपा जाएगा जो कि कर्नेल के केंद्र से दूरी बढ़ने पर तेजी से घट जाएगा। अभिसरण पर, ऐसी कोई दिशा नहीं होगी जिस पर एक बदलाव कर्नेल के अंदर अधिक बिंदुओं को समायोजित कर सके।
द्वि-आयामी अंतरिक्ष में बिंदुओं के एक सेट पर विचार करें। मान लीजिए कि एक गोलाकार खिड़की केन्द्रित है <math>C</math> और त्रिज्या वाला <math>r</math> कर्नेल के रूप में. मीन-शिफ्ट एक पहाड़ी चढ़ाई एल्गोरिथ्म है जिसमें अभिसरण तक इस कर्नेल को उच्च घनत्व वाले क्षेत्र में पुनरावृत्त रूप से स्थानांतरित करना सम्मिलित है। प्रत्येक शिफ्ट को माध्य शिफ्ट वेक्टर द्वारा परिभाषित किया जाता है। माध्य शिफ्ट वेक्टर हमेशा घनत्व में अधिकतम वृद्धि की दिशा की ओर इशारा करता है। प्रत्येक पुनरावृत्ति पर कर्नेल को केन्द्रक या उसके भीतर के बिंदुओं के माध्य में स्थानांतरित कर दिया जाता है। इस माध्य की गणना करने की विधि कर्नेल की पसंद पर निर्भर करती है। इस परिस्थिति में यदि फ्लैट कर्नेल के बजाय गॉसियन कर्नेल को चुना जाता है, तो प्रत्येक बिंदु को पहले एक भार सौंपा जाएगा जो कि कर्नेल के केंद्र से दूरी बढ़ने पर तेजी से घट जाएगा। अभिसरण पर, ऐसी कोई दिशा नहीं होगी जिस पर एक बदलाव कर्नेल के अंदर अधिक बिंदुओं को समायोजित कर सके।


=== ट्रैकिंग ===
=== ट्रैकिंग ===
दृश्य ट्रैकिंग के लिए माध्य शिफ्ट एल्गोरिदम का उपयोग किया जा सकता है। इस तरह का सबसे सरल एल्गोरिदम पिछली छवि में ऑब्जेक्ट के रंग हिस्टोग्राम के आधार पर नई छवि में एक आत्मविश्वास मानचित्र तैयार करेगा, और ऑब्जेक्ट की पुरानी स्थिति के पास आत्मविश्वास मानचित्र के शिखर को खोजने के लिए माध्य बदलाव का उपयोग करेगा। कॉन्फिडेंस मैप नई छवि पर एक संभाव्यता घनत्व फ़ंक्शन है, जो नई छवि के प्रत्येक पिक्सेल को एक संभावना निर्दिष्ट करता है, जो पिछली छवि में ऑब्जेक्ट में होने वाले पिक्सेल रंग की संभावना है। कुछ एल्गोरिदम, जैसे कर्नेल-आधारित ऑब्जेक्ट ट्रैकिंग,<ref name="PAMI03">{{cite journal
दृश्य ट्रैकिंग के लिए माध्य शिफ्ट एल्गोरिदम का उपयोग किया जा सकता है। इस तरह का सबसे सरल एल्गोरिदम पिछली छवि में ऑब्जेक्ट के रंग हिस्टोग्राम के आधार पर नई छवि में एक आत्मविश्वास मानचित्र तैयार करेगा, और ऑब्जेक्ट की पुरानी स्थिति के पास आत्मविश्वास मानचित्र के शिखर को खोजने के लिए माध्य बदलाव का उपयोग करेगा। कॉन्फिडेंस मैप नई छवि पर एक संभाव्यता घनत्व फलन है, जो नई छवि के प्रत्येक पिक्सेल को एक संभावना निर्दिष्ट करता है, जो पिछली छवि में ऑब्जेक्ट में होने वाले पिक्सेल रंग की संभावना है। कुछ एल्गोरिदम, जैसे कर्नेल-आधारित ऑब्जेक्ट ट्रैकिंग,<ref name="PAMI03">{{cite journal
   | last = Comaniciu
   | last = Comaniciu
   | first = Dorin
   | first = Dorin

Revision as of 22:04, 27 July 2023

मीन शिफ्ट एक गैर पैरामीट्रिक सुविधा स्थान गणितीय विश्लेषण तकनीक है जो एक घनत्व फलन के मैक्सिमा का पता लगाने के लिए एक आधारशील एल्गोरिदम है, जिसे मोड संवेदना खोजी एल्गोरिदम कहा जाता है।[1] इसके अनुप्रयोग डिजिटल दृष्टि में क्लस्टर विश्लेषण और छवि प्रसंस्करण में किया जाता है।[2]

इतिहास

मीन शिफ्ट प्रक्रिया को सामान्यतः 1975 में फुकुनागा और होस्टेटलर के कार्य का श्रेय दिया जाता है।[3] यद्यपि, यह 1964 में श्नेल द्वारा किए गए पहले कार्य को याद दिलाता है।[4]

सिंहावलोकन

मीन शिफ्ट एक प्रक्रिया है जिसका उपयोग एक गुणवत्ता फलन के मूल्यकों के मॉड्स की खोज के लिए किया जाता है, जो उस फलन से प्रारूप डेटा के आधार पर लिया गया होता है।[1]यह एक पुनरावृत्तिक विधि है, और हम एक प्रारंभिक अनुमान के साथ प्रारंभ करते हैं। एक कर्नल फ़ंक्शन दिया गया हो। सामान्यतः, उपस्थित अनुमान तक दूरी पर गॉसियन कर्नल का प्रयोग किया जाता है,

. द्वारा निर्धारित खिड़की में घनत्व का भारी औसत होता है। यह फलन अर्थात' की समीपी बिंदुओं के लिए वजन तय करता है, अर्थात के नए अनुमान के लिए पुनर्मूल्यांकन के लिए प्रयोग किए जाते हैं।

.

यहां, के पड़ोसी है, जो कुछ बिंदुओं का सेट होता है जिनके लिए होता है।

फुकुनागा और होस्टेट्लर में, अंतर को मीन शिफ्ट कहा जाता है।[3] अब मीन-शिफ्ट एल्गोरिदम को से सेट करता है और अनुमानन कोका संघटन होने तक दोहराता है।

यद्यपि मीन शिफ्ट एल्गोरिदम का विस्तृत उपयोग कई एप्लिकेशनों में किया जा चुका है, परंतु एक उच्च आयामी अंतरिक्ष में एक सामान्य कर्नल का उपयोग करके एल्गोरिदम के संघटन के लिए एक कठिनता-मुक्त प्रमाण अभी तक नहीं प्रस्तुत किया गया है।[5]अलियारी घसाबेह ने दिखाया कि एक आयाम में मीन शिफ्ट एल्गोरिदम का संघटन प्रमाणित किया जा सकता है जब उसमें एक अलगावशेषी, घुमावशील और सख्त रूप से घटनेवाली प्रोफ़ाइल फ़ंक्शन हो।[6] यद्यपि, एक-आयामी परिस्थिति में सीमित वास्तविक विश्व अनुप्रयोग होते हैं। इसके अलावा, एक निर्देशांक (या अलग) बिंदुओं की एक सीमित संख्या के साथ उच्च आयामों में एल्गोरिदम के संघटन को प्रमाणित किया गया है।[5][7] यद्यपि, किसी भी सामान्य कर्नल फ़ंक्शन के लिए सीमित निर्देशांक बिंदुओं के लिए पर्याप्त स्थितियाँ प्रदान नहीं की गई हैं।

गॉसियन मीन-शिफ्ट एक अपेक्षासंग्रह एवं अधिकतमीकरण एल्गोरिदम है।[8]


विवरण

डेटा एक समाप्त सेट है जो -आयामी यूक्लिडियन स्पेस में एम्बेड है। एक फ्लैट कर्नल है जो में -बॉल के विशेषता फ़ंक्शन है।

एल्गोरिथ्म के प्रत्येक पुनरावृत्ति में, सभी के लिए किया जाता है इसके साथ ही।

प्रत्येक एल्गोरिदम के प्रत्यावर्तन में, सभी S के प्रत्येक p के लिए m(s) समवर्ती रूप से किया जाता है।

पहला प्रश्न है, तो विकिरणीय सेट के दिए गए नमूनों के आधार पर घनत्व फ़ंक्शन का आकलन कैसे करें। सबसे सरल दृष्टिकोन है डेटा को स्मूथ करना, उदाहरण के लिए, एक निश्चित चौड़ाई के निश्चित कर्नल के साथ उसे गहन करने से हैं।

जहाँ इनपुट प्रारूप हैं और कर्नेल फलन (या पार्ज़ेन विंडो) है। एल्गोरिथम में एकमात्र पैरामीटर है और इसे बैंडविड्थ कहा जाता है। इस दृष्टिकोण को कर्नेल घनत्व अनुमान या पार्ज़ेन विंडो तकनीक के रूप में जाना जाता है। एक बार हमने गणना कर ली उपरोक्त समीकरण से, हम ग्रेडिएंट एसेंट या किसी अन्य अनुकूलन तकनीक का उपयोग करके इसकी स्थानीय मैक्सिमा पा सकते हैं। इस क्रूर बल दृष्टिकोण के साथ समस्या यह है कि, उच्च आयामों के लिए, इसका मूल्यांकन करना कम्प्यूटेशनल रूप से निषेधात्मक हो जाता है संपूर्ण खोज स्थान पर. इसके बजाय, मीन शिफ्ट एक प्रकार का उपयोग करता है जिसे अनुकूलन साहित्य में मल्टीपल रीस्टार्ट ग्रेडिएंट डिसेंट के रूप में जाना जाता है। स्थानीय अधिकतम के लिए कुछ अनुमान से प्रारंभ करते हुए, , जो एक यादृच्छिक इनपुट डेटा बिंदु हो सकता है , माध्य शिफ्ट घनत्व अनुमान के ग्रेडिएंट की गणना करता है पर और उस दिशा में एक कठिन कदम उठाता है।[9]


गुठली के प्रकार

कर्नेल परिभाषा: चलो हो -आयामी यूक्लिडियन अंतरिक्ष, . का आदर्श एक गैर-ऋणात्मक संख्या है, . एक समारोह यदि कोई प्रोफ़ाइल मौजूद है तो उसे कर्नेल कहा जाता है, , ऐसा है कि

और

  • k गैर-नकारात्मक है।
  • k गैर-बढ़ती है: अगर .
  • k टुकड़े-टुकड़े निरंतर है और

माध्य बदलाव के लिए दो सबसे अधिक उपयोग की जाने वाली कर्नेल प्रोफ़ाइल हैं:

फ्लैट कर्नेल

गाऊसी कर्नेल

जहां मानक विचलन पैरामीटर बैंडविड्थ पैरामीटर के रूप में कार्य करता है, .

अनुप्रयोग

क्लस्टरिंग

द्वि-आयामी अंतरिक्ष में बिंदुओं के एक सेट पर विचार करें। मान लीजिए कि एक गोलाकार खिड़की केन्द्रित है और त्रिज्या वाला कर्नेल के रूप में. मीन-शिफ्ट एक पहाड़ी चढ़ाई एल्गोरिथ्म है जिसमें अभिसरण तक इस कर्नेल को उच्च घनत्व वाले क्षेत्र में पुनरावृत्त रूप से स्थानांतरित करना सम्मिलित है। प्रत्येक शिफ्ट को माध्य शिफ्ट वेक्टर द्वारा परिभाषित किया जाता है। माध्य शिफ्ट वेक्टर हमेशा घनत्व में अधिकतम वृद्धि की दिशा की ओर इशारा करता है। प्रत्येक पुनरावृत्ति पर कर्नेल को केन्द्रक या उसके भीतर के बिंदुओं के माध्य में स्थानांतरित कर दिया जाता है। इस माध्य की गणना करने की विधि कर्नेल की पसंद पर निर्भर करती है। इस परिस्थिति में यदि फ्लैट कर्नेल के बजाय गॉसियन कर्नेल को चुना जाता है, तो प्रत्येक बिंदु को पहले एक भार सौंपा जाएगा जो कि कर्नेल के केंद्र से दूरी बढ़ने पर तेजी से घट जाएगा। अभिसरण पर, ऐसी कोई दिशा नहीं होगी जिस पर एक बदलाव कर्नेल के अंदर अधिक बिंदुओं को समायोजित कर सके।

ट्रैकिंग

दृश्य ट्रैकिंग के लिए माध्य शिफ्ट एल्गोरिदम का उपयोग किया जा सकता है। इस तरह का सबसे सरल एल्गोरिदम पिछली छवि में ऑब्जेक्ट के रंग हिस्टोग्राम के आधार पर नई छवि में एक आत्मविश्वास मानचित्र तैयार करेगा, और ऑब्जेक्ट की पुरानी स्थिति के पास आत्मविश्वास मानचित्र के शिखर को खोजने के लिए माध्य बदलाव का उपयोग करेगा। कॉन्फिडेंस मैप नई छवि पर एक संभाव्यता घनत्व फलन है, जो नई छवि के प्रत्येक पिक्सेल को एक संभावना निर्दिष्ट करता है, जो पिछली छवि में ऑब्जेक्ट में होने वाले पिक्सेल रंग की संभावना है। कुछ एल्गोरिदम, जैसे कर्नेल-आधारित ऑब्जेक्ट ट्रैकिंग,[10] समूह ट्रैकिंग,[11] कैमशिफ्ट [12][13] इस विचार का विस्तार करें.

चौरसाई

होने देना और हो -संयुक्त स्थानिक-श्रेणी डोमेन में आयामी इनपुट और फ़िल्टर किए गए छवि पिक्सेल। प्रत्येक पिक्सेल के लिए,

  • आरंभ करें और
  • गणना करें के अनुसार अभिसरण तक, .
  • सौंपना . सुपरस्क्रिप्ट s और r क्रमशः एक वेक्टर के स्थानिक और श्रेणी घटकों को दर्शाते हैं। असाइनमेंट निर्दिष्ट करता है कि स्थानिक स्थान अक्ष पर फ़िल्टर किए गए डेटा में अभिसरण बिंदु का रेंज घटक होगा .

ताकतें

  1. मीन शिफ्ट वास्तविक डेटा विश्लेषण के लिए उपयुक्त एक एप्लिकेशन-स्वतंत्र उपकरण है।
  2. डेटा क्लस्टर पर कोई पूर्वनिर्धारित आकार नहीं लेता है।
  3. यह मनमाने फीचर स्पेस को संभालने में सक्षम है।
  4. प्रक्रिया एकल पैरामीटर की पसंद पर निर्भर करती है: बैंडविड्थ।
  5. बैंडविड्थ/विंडो आकार 'एच' का एक भौतिक अर्थ है, के-मीन्स|के-मीन्स के विपरीत।

कमजोरियाँ

  1. विंडो आकार का चयन कोई मामूली बात नहीं है.
  2. अनुपयुक्त विंडो आकार के कारण मोड मर्ज हो सकते हैं, या अतिरिक्त "उथले" मोड उत्पन्न हो सकते हैं।
  3. अक्सर अनुकूली विंडो आकार का उपयोग करने की आवश्यकता होती है।

उपलब्धता

एल्गोरिदम के वेरिएंट मशीन लर्निंग और इमेजेज प्रोसेसिंग पैकेज में पाए जा सकते हैं:

  • मूर्तियों । कई क्लस्टरिंग एल्गोरिदम के साथ जावा डेटा माइनिंग टूल।
  • छवि जे. माध्य शिफ्ट फ़िल्टर का उपयोग करके छवि फ़िल्टरिंग।
  • mlpack . कुशल दोहरे वृक्ष एल्गोरिदम-आधारित कार्यान्वयन।
  • OpenCV में cvMeanShift विधि के माध्यम से माध्य-शिफ्ट कार्यान्वयन सम्मिलित है
  • ऑर्फियो टूलबॉक्स। एक C++ कार्यान्वयन.
  • स्किकिट-लर्न नम्पी/पायथन कार्यान्वयन कुशल पड़ोसी बिंदुओं के लुकअप के लिए बॉल ट्री का उपयोग करता है

यह भी देखें

संदर्भ

  1. 1.0 1.1 Cheng, Yizong (August 1995). "Mean Shift, Mode Seeking, and Clustering". IEEE Transactions on Pattern Analysis and Machine Intelligence. 17 (8): 790–799. CiteSeerX 10.1.1.510.1222. doi:10.1109/34.400568.
  2. Comaniciu, Dorin; Peter Meer (May 2002). "Mean Shift: A Robust Approach Toward Feature Space Analysis". IEEE Transactions on Pattern Analysis and Machine Intelligence. 24 (5): 603–619. CiteSeerX 10.1.1.160.3832. doi:10.1109/34.1000236.
  3. 3.0 3.1 Fukunaga, Keinosuke; Larry D. Hostetler (January 1975). "The Estimation of the Gradient of a Density Function, with Applications in Pattern Recognition". IEEE Transactions on Information Theory. 21 (1): 32–40. doi:10.1109/TIT.1975.1055330.
  4. Schnell, P. (1964). "समूहों को खोजने की एक विधि". Biometrische Zeitschrift (in Deutsch). 6 (1): 47–48. doi:10.1002/bimj.19640060105.
  5. 5.0 5.1 Aliyari Ghassabeh, Youness (2015-03-01). "गॉसियन कर्नेल के साथ माध्य शिफ्ट एल्गोरिदम के अभिसरण के लिए एक पर्याप्त शर्त". Journal of Multivariate Analysis. 135: 1–10. doi:10.1016/j.jmva.2014.11.009.
  6. Aliyari Ghassabeh, Youness (2013-09-01). "एक-आयामी अंतरिक्ष में माध्य बदलाव एल्गोरिथ्म के अभिसरण पर". Pattern Recognition Letters. 34 (12): 1423–1427. arXiv:1407.2961. doi:10.1016/j.patrec.2013.05.004. S2CID 10233475.
  7. Li, Xiangru; Hu, Zhanyi; Wu, Fuchao (2007-06-01). "माध्य बदलाव के अभिसरण पर एक नोट". Pattern Recognition. 40 (6): 1756–1762. doi:10.1016/j.patcog.2006.10.016.
  8. Carreira-Perpinan, Miguel A. (May 2007). "गॉसियन मीन-शिफ्ट एक ईएम एल्गोरिथम है". IEEE Transactions on Pattern Analysis and Machine Intelligence. 29 (5): 767–776. doi:10.1109/tpami.2007.1057. ISSN 0162-8828. PMID 17356198. S2CID 6694308.
  9. Richard Szeliski, Computer Vision, Algorithms and Applications, Springer, 2011
  10. Comaniciu, Dorin; Visvanathan Ramesh; Peter Meer (May 2003). "Kernel-based Object Tracking". IEEE Transactions on Pattern Analysis and Machine Intelligence. 25 (5): 564–575. CiteSeerX 10.1.1.8.7474. doi:10.1109/tpami.2003.1195991.
  11. Avidan, Shai (2005). Ensemble tracking. pp. 494–501. doi:10.1109/CVPR.2005.144. ISBN 978-0-7695-2372-9. PMID 17170479. S2CID 1638397. {{cite book}}: |journal= ignored (help)
  12. Gary Bradski (1998) Computer Vision Face Tracking For Use in a Perceptual User Interface Archived 2012-04-17 at the Wayback Machine, Intel Technology Journal, No. Q2.
  13. Emami, Ebrahim (2013). "Online failure detection and correction for CAMShift tracking algorithm". 2013 8th Iranian Conference on Machine Vision and Image Processing (MVIP). pp. 180–183. doi:10.1109/IranianMVIP.2013.6779974. ISBN 978-1-4673-6184-2. S2CID 15864761. {{cite book}}: |journal= ignored (help)