मीन शिफ्ट

From Vigyanwiki

मीन शिफ्ट एक गैर पैरामीट्रिक सुविधा स्थान गणितीय विश्लेषण तकनीक है जो एक घनत्व फलन के मैक्सिमा का पता लगाने के लिए एक आधारशील एल्गोरिदम है, जिसे मोड संवेदना खोजी एल्गोरिदम कहा जाता है।[1] इसके अनुप्रयोग डिजिटल दृष्टि में क्लस्टर विश्लेषण और छवि प्रसंस्करण में किया जाता है।[2]

इतिहास

मीन शिफ्ट प्रक्रिया को सामान्यतः 1975 में फुकुनागा और होस्टेटलर के कार्य का श्रेय दिया जाता है।[3] यद्यपि, यह 1964 में श्नेल द्वारा किए गए पहले कार्य को याद दिलाता है।[4]

सिंहावलोकन

मीन शिफ्ट एक प्रक्रिया है जिसका उपयोग एक गुणवत्ता फलन के मूल्यकों के मॉड्स की खोज के लिए किया जाता है, जो उस फलन से प्रारूप डेटा के आधार पर लिया गया होता है।[1]यह एक पुनरावृत्तिक विधि है, और हम एक प्रारंभिक अनुमान के साथ प्रारंभ करते हैं। एक कर्नल फ़ंक्शन दिया गया हो। सामान्यतः, उपस्थित अनुमान तक दूरी पर गॉसियन कर्नल का प्रयोग किया जाता है,

. द्वारा निर्धारित खिड़की में घनत्व का भारी औसत होता है। यह फलन अर्थात' की समीपी बिंदुओं के लिए वजन तय करता है, अर्थात के नए अनुमान के लिए पुनर्मूल्यांकन के लिए प्रयोग किए जाते हैं।

.

यहां, के पड़ोसी है, जो कुछ बिंदुओं का सेट होता है जिनके लिए होता है।

फुकुनागा और होस्टेट्लर में, अंतर को मीन शिफ्ट कहा जाता है।[3] अब मीन-शिफ्ट एल्गोरिदम को से सेट करता है और अनुमानन कोका संघटन होने तक दोहराता है।

यद्यपि मीन शिफ्ट एल्गोरिदम का विस्तृत उपयोग कई एप्लिकेशनों में किया जा चुका है, परंतु एक उच्च आयामी अंतरिक्ष में एक सामान्य कर्नल का उपयोग करके एल्गोरिदम के संघटन के लिए एक कठिनता-मुक्त प्रमाण अभी तक नहीं प्रस्तुत किया गया है।[5]अलियारी घसाबेह ने दिखाया कि एक आयाम में मीन शिफ्ट एल्गोरिदम का संघटन प्रमाणित किया जा सकता है जब उसमें एक अलगावशेषी, घुमावशील और सख्त रूप से घटनेवाली प्रोफ़ाइल फ़ंक्शन हो।[6] यद्यपि, एक-आयामी परिस्थिति में सीमित वास्तविक विश्व अनुप्रयोग होते हैं। इसके अलावा, एक निर्देशांक (या अलग) बिंदुओं की एक सीमित संख्या के साथ उच्च आयामों में एल्गोरिदम के संघटन को प्रमाणित किया गया है।[5][7] यद्यपि, किसी भी सामान्य कर्नल फ़ंक्शन के लिए सीमित निर्देशांक बिंदुओं के लिए पर्याप्त स्थितियाँ प्रदान नहीं की गई हैं।

गॉसियन मीन-शिफ्ट एक अपेक्षासंग्रह एवं अधिकतमीकरण एल्गोरिदम है।[8]


विवरण

डेटा एक समाप्त सेट है जो -आयामी यूक्लिडियन स्पेस में एम्बेड है। एक फ्लैट कर्नल है जो में -बॉल के विशेषता फ़ंक्शन है।

एल्गोरिथ्म के प्रत्येक पुनरावृत्ति में, सभी के लिए किया जाता है इसके साथ ही।

प्रत्येक एल्गोरिदम के प्रत्यावर्तन में, सभी S के प्रत्येक p के लिए m(s) समवर्ती रूप से किया जाता है।

पहला प्रश्न है, तो विकिरणीय सेट के दिए गए नमूनों के आधार पर घनत्व फ़ंक्शन का आकलन कैसे करें। सबसे सरल दृष्टिकोन है डेटा को स्मूथ करना, उदाहरण के लिए, एक निश्चित चौड़ाई के निश्चित कर्नल के साथ उसे गहन करने से हैं।

जहाँ इनपुट प्रारूप हैं और कर्नेल फलन (या पार्ज़ेन विंडो) है। एल्गोरिथम में एकमात्र पैरामीटर है और इसे बैंडविड्थ कहा जाता है। इस दृष्टिकोण को कर्नेल घनत्व अनुमान या पार्ज़ेन विंडो तकनीक के रूप में जाना जाता है। एक बार हमने गणना कर ली उपरोक्त समीकरण से, हम ग्रेडिएंट एसेंट या किसी अन्य अनुकूलन तकनीक का उपयोग करके इसकी स्थानीय मैक्सिमा पा सकते हैं। इस क्रूर बल दृष्टिकोण के साथ समस्या यह है कि, उच्च आयामों के लिए, इसका मूल्यांकन करना कम्प्यूटेशनल रूप से निषेधात्मक हो जाता है संपूर्ण खोज स्थान पर. इसके बजाय, मीन शिफ्ट एक प्रकार का उपयोग करता है जिसे अनुकूलन साहित्य में मल्टीपल रीस्टार्ट ग्रेडिएंट डिसेंट के रूप में जाना जाता है। स्थानीय अधिकतम के लिए कुछ अनुमान से प्रारंभ करते हुए, , जो एक यादृच्छिक इनपुट डेटा बिंदु हो सकता है , माध्य शिफ्ट घनत्व अनुमान के ग्रेडिएंट की गणना करता है पर और उस दिशा में एक कठिन कदम उठाता है।[9]


गुठली के प्रकार

कर्नेल परिभाषा: चलो हो -आयामी यूक्लिडियन अंतरिक्ष, . का आदर्श एक गैर-ऋणात्मक संख्या है, . एक समारोह यदि कोई प्रोफ़ाइल मौजूद है तो उसे कर्नेल कहा जाता है, , ऐसा है कि

और

  • k गैर-नकारात्मक है।
  • k गैर-बढ़ती है: अगर .
  • k टुकड़े-टुकड़े निरंतर है और

माध्य बदलाव के लिए दो सबसे अधिक उपयोग की जाने वाली कर्नेल प्रोफ़ाइल हैं:

फ्लैट कर्नेल

गाऊसी कर्नेल

जहां मानक विचलन पैरामीटर बैंडविड्थ पैरामीटर के रूप में कार्य करता है, .

अनुप्रयोग

क्लस्टरिंग

दो-आयामी अंतरिक्ष में कुछ बिंदुओं का एक सेट पर विचार करें। एक वृत्ताकार खिड़की को कर्नल के रूप में समझें, जो बिंदु पर केंद्रित है और रेडियस रखता है। मीन-शिफ्ट एक हिल क्लाइमिंग एल्गोरिदम है जिसमें यह कर्नल घनत्व के उच्चतर क्षेत्र की ओर पुनर्स्थान संघटन तक किया जाता है।प्रत्येक शिफ्ट को माध्य शिफ्ट वेक्टर द्वारा परिभाषित किया जाता है। मीन शिफ्ट वेक्टर हमेशा घनत्व में अधिकतम वृद्धि के दिशा की ओर संकेत करता है। प्रत्येक प्रतियांत्रण में, कर्नल को उसके अंदर बिंदुओं की औसत या मीन के लिए परिस्थान किया जाता है। इस मीन की गणना का विधि कर्नल के चयन पर निर्भर करता है। इस परीस्थिति में, यदि एक फ्लैट कर्नल के अतिरिक्त एक गॉसियन कर्नल का चयन किया जाता है, तो हर बिंदु को पहले एक भार आवंटित किया जाएगा जो कर्नल के केंद्र से दूरी के साथ घटता है। संघटन पर, एक ऐसी दिशा नहीं होगी जिसमें एक शिफ्ट में अधिक से अधिक बिंदु एक कर्नल के अंदर समायोजित कर सके।

ट्रैकिंग

दृश्य ट्रैकिंग के लिए माध्य शिफ्ट एल्गोरिदम का उपयोग किया जा सकता है। इस तरह का सबसे सरल एल्गोरिदम पिछली छवि में ऑब्जेक्ट के रंग हिस्टोग्राम के आधार पर नई छवि में एक आत्मविश्वास मानचित्र तैयार करेगा, और ऑब्जेक्ट की पुरानी स्थिति के पास आत्मविश्वास मानचित्र के शिखर को खोजने के लिए माध्य बदलाव का उपयोग करेगा। कॉन्फिडेंस मैप नई छवि पर एक संभाव्यता घनत्व फलन है, जो नई छवि के प्रत्येक पिक्सेल को एक संभावना निर्दिष्ट करता है, जो पिछली छवि में ऑब्जेक्ट में होने वाले पिक्सेल रंग की संभावना है। कुछ एल्गोरिदम, जैसे कर्नेल-आधारित ऑब्जेक्ट ट्रैकिंग,[10] समूह ट्रैकिंग,[11] कैमशिफ्ट [12][13] इस विचार का विस्तार करें.

चौरसाई

होने देना और हो -संयुक्त स्थानिक-श्रेणी डोमेन में आयामी इनपुट और फ़िल्टर किए गए छवि पिक्सेल। प्रत्येक पिक्सेल के लिए,

  • आरंभ करें और
  • गणना करें के अनुसार अभिसरण तक, .
  • सौंपना . सुपरस्क्रिप्ट s और r क्रमशः एक वेक्टर के स्थानिक और श्रेणी घटकों को दर्शाते हैं। असाइनमेंट निर्दिष्ट करता है कि स्थानिक स्थान अक्ष पर फ़िल्टर किए गए डेटा में अभिसरण बिंदु का रेंज घटक होगा .

ताकतें

  1. मीन शिफ्ट वास्तविक डेटा विश्लेषण के लिए उपयुक्त एक एप्लिकेशन-स्वतंत्र उपकरण है।
  2. डेटा क्लस्टर पर कोई पूर्वनिर्धारित आकार नहीं लेता है।
  3. यह मनमाने फीचर स्पेस को संभालने में सक्षम है।
  4. प्रक्रिया एकल पैरामीटर की पसंद पर निर्भर करती है: बैंडविड्थ।
  5. बैंडविड्थ/विंडो आकार 'एच' का एक भौतिक अर्थ है, के-मीन्स|के-मीन्स के विपरीत।

कमजोरियाँ

  1. विंडो आकार का चयन कोई मामूली बात नहीं है.
  2. अनुपयुक्त विंडो आकार के कारण मोड मर्ज हो सकते हैं, या अतिरिक्त "उथले" मोड उत्पन्न हो सकते हैं।
  3. अक्सर अनुकूली विंडो आकार का उपयोग करने की आवश्यकता होती है।

उपलब्धता

एल्गोरिदम के वेरिएंट मशीन लर्निंग और इमेजेज प्रोसेसिंग पैकेज में पाए जा सकते हैं:

  • मूर्तियों । कई क्लस्टरिंग एल्गोरिदम के साथ जावा डेटा माइनिंग टूल।
  • छवि जे. माध्य शिफ्ट फ़िल्टर का उपयोग करके छवि फ़िल्टरिंग।
  • mlpack . कुशल दोहरे वृक्ष एल्गोरिदम-आधारित कार्यान्वयन।
  • OpenCV में cvMeanShift विधि के माध्यम से माध्य-शिफ्ट कार्यान्वयन सम्मिलित है
  • ऑर्फियो टूलबॉक्स। एक C++ कार्यान्वयन.
  • स्किकिट-लर्न नम्पी/पायथन कार्यान्वयन कुशल पड़ोसी बिंदुओं के लुकअप के लिए बॉल ट्री का उपयोग करता है

यह भी देखें

संदर्भ

  1. 1.0 1.1 Cheng, Yizong (August 1995). "Mean Shift, Mode Seeking, and Clustering". IEEE Transactions on Pattern Analysis and Machine Intelligence. 17 (8): 790–799. CiteSeerX 10.1.1.510.1222. doi:10.1109/34.400568.
  2. Comaniciu, Dorin; Peter Meer (May 2002). "Mean Shift: A Robust Approach Toward Feature Space Analysis". IEEE Transactions on Pattern Analysis and Machine Intelligence. 24 (5): 603–619. CiteSeerX 10.1.1.160.3832. doi:10.1109/34.1000236.
  3. 3.0 3.1 Fukunaga, Keinosuke; Larry D. Hostetler (January 1975). "The Estimation of the Gradient of a Density Function, with Applications in Pattern Recognition". IEEE Transactions on Information Theory. 21 (1): 32–40. doi:10.1109/TIT.1975.1055330.
  4. Schnell, P. (1964). "समूहों को खोजने की एक विधि". Biometrische Zeitschrift (in Deutsch). 6 (1): 47–48. doi:10.1002/bimj.19640060105.
  5. 5.0 5.1 Aliyari Ghassabeh, Youness (2015-03-01). "गॉसियन कर्नेल के साथ माध्य शिफ्ट एल्गोरिदम के अभिसरण के लिए एक पर्याप्त शर्त". Journal of Multivariate Analysis. 135: 1–10. doi:10.1016/j.jmva.2014.11.009.
  6. Aliyari Ghassabeh, Youness (2013-09-01). "एक-आयामी अंतरिक्ष में माध्य बदलाव एल्गोरिथ्म के अभिसरण पर". Pattern Recognition Letters. 34 (12): 1423–1427. arXiv:1407.2961. doi:10.1016/j.patrec.2013.05.004. S2CID 10233475.
  7. Li, Xiangru; Hu, Zhanyi; Wu, Fuchao (2007-06-01). "माध्य बदलाव के अभिसरण पर एक नोट". Pattern Recognition. 40 (6): 1756–1762. doi:10.1016/j.patcog.2006.10.016.
  8. Carreira-Perpinan, Miguel A. (May 2007). "गॉसियन मीन-शिफ्ट एक ईएम एल्गोरिथम है". IEEE Transactions on Pattern Analysis and Machine Intelligence. 29 (5): 767–776. doi:10.1109/tpami.2007.1057. ISSN 0162-8828. PMID 17356198. S2CID 6694308.
  9. Richard Szeliski, Computer Vision, Algorithms and Applications, Springer, 2011
  10. Comaniciu, Dorin; Visvanathan Ramesh; Peter Meer (May 2003). "Kernel-based Object Tracking". IEEE Transactions on Pattern Analysis and Machine Intelligence. 25 (5): 564–575. CiteSeerX 10.1.1.8.7474. doi:10.1109/tpami.2003.1195991.
  11. Avidan, Shai (2005). Ensemble tracking. pp. 494–501. doi:10.1109/CVPR.2005.144. ISBN 978-0-7695-2372-9. PMID 17170479. S2CID 1638397. {{cite book}}: |journal= ignored (help)
  12. Gary Bradski (1998) Computer Vision Face Tracking For Use in a Perceptual User Interface Archived 2012-04-17 at the Wayback Machine, Intel Technology Journal, No. Q2.
  13. Emami, Ebrahim (2013). "Online failure detection and correction for CAMShift tracking algorithm". 2013 8th Iranian Conference on Machine Vision and Image Processing (MVIP). pp. 180–183. doi:10.1109/IranianMVIP.2013.6779974. ISBN 978-1-4673-6184-2. S2CID 15864761. {{cite book}}: |journal= ignored (help)