कॉर्नर डिटेक्शन: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
 
(8 intermediate revisions by 4 users not shown)
Line 1: Line 1:
[[File:corner.png|thumb|right|300px|विशिष्ट कोने का पता लगाने वाले एल्गोरिदम का आउटपुट]]
[[File:corner.png|thumb|right|300px|विशिष्ट कोने का पता लगाने वाले एल्गोरिदम का आउटपुट ऐसा होता है। ]]
{{FeatureDetectionCompVisNavbox}}
{{FeatureDetectionCompVisNavbox}}


कॉर्नर डिटेक्शन दृष्टिकोण है जिसका उपयोग [[कंप्यूटर दृष्टि]] सिस्टम के भीतर कुछ प्रकार के [[फ़ीचर डिटेक्शन (कंप्यूटर विज़न)]] को निकालने और छवि की सामग्री का अनुमान लगाने के लिए किया जाता है। कॉर्नर डिटेक्शन का उपयोग अक्सर गति पहचान, [[छवि पंजीकरण]], [[वीडियो ट्रैकिंग]], [[फोटोग्राफिक मोज़ेक]], [[पैनोरमा सिलाई]], 3 डी पुनर्निर्माण और ऑब्जेक्ट पहचान में किया जाता है। कॉर्नर डिटेक्शन रुचि बिंदु डिटेक्शन के विषय के साथ ओवरलैप होता है।
'''कॉर्नर डिटेक्शन''' दृष्टिकोण है जिसका उपयोग [[कंप्यूटर दृष्टि]] प्रणाली के भीतर कुछ प्रकार के [[फ़ीचर डिटेक्शन (कंप्यूटर विज़न)]] को निकालने और छवि की सामग्री का अनुमान लगाने के लिए किया जाता है। कॉर्नर डिटेक्शन का उपयोग अधिकांशतः गति पहचान, [[छवि पंजीकरण]], [[वीडियो ट्रैकिंग]], [[फोटोग्राफिक मोज़ेक]], [[पैनोरमा सिलाई]], 3 डी पुनर्निर्माण और ऑब्जेक्ट पहचान में अधिकांशतः किया जाता है। कॉर्नर डिटेक्शन अंतर्गत आपूर्ति बिंदु डिटेक्शन के विषय के साथ संघुषित होता है।


== औपचारिकीकरण ==
== औपचारिकीकरण ==
कोने को दो किनारों के प्रतिच्छेदन के रूप में परिभाषित किया जा सकता है। कोने को बिंदु के रूप में भी परिभाषित किया जा सकता है जिसके लिए बिंदु के स्थानीय पड़ोस में दो प्रमुख और अलग-अलग किनारे की दिशाएं हैं।
इस प्रकार कोने को दो किनारों के प्रतिच्छेदन के रूप में परिभाषित किया जा सकता है। कोने को बिंदु के रूप में भी परिभाषित किया जा सकता है जिसके लिए स्थानीय पड़ोस में दो प्रमुख और भिन्न धारा दिशाएं होती हैं।


रुचि बिंदु छवि में बिंदु है जिसकी अच्छी तरह से परिभाषित स्थिति होती है और इसे मजबूती से पहचाना जा सकता है। इसका मतलब यह है कि रुचि का बिंदु कोना हो सकता है, लेकिन यह उदाहरण के लिए, स्थानीय तीव्रता का अलग बिंदु अधिकतम या न्यूनतम, रेखा का अंत या वक्र पर बिंदु भी हो सकता है जहां वक्रता स्थानीय रूप से अधिकतम होती है।
रुचि बिंदु छवि में बिंदु है जिसकी छवि में अच्छी प्रकार से परिभाषित स्थान होता है और इसे मजबूती से पहचाना जा सकता है। इसका अर्थ यह है कि इंटरेस्ट पॉइंट कोना हो सकता है,किन्तु इसके अतिरिक्त यह मात्र कोना नहीं हो सकता है, उदाहरण के लिए, स्थानीय तीव्रता के अधिकतम या न्यूनतम स्थानीय बहुत्तर, रेखा के अंत, या कर्व पर बिंदु जहां की कर्वता स्थानीय अधिकतम होती हैं।


व्यवहार में, अधिकांश तथाकथित कोने का पता लगाने के तरीके सामान्य रूप से रुचि बिंदुओं का पता लगाते हैं, और वास्तव में, कोने और रुचि बिंदु शब्द का उपयोग साहित्य के माध्यम से कमोबेश दूसरे के स्थान पर किया जाता है।<ref name="willis"/>परिणामस्वरूप, यदि केवल कोनों का पता लगाना है तो यह निर्धारित करने के लिए पता लगाए गए रुचि बिंदुओं का स्थानीय विश्लेषण करना आवश्यक है कि इनमें से कौन सा वास्तविक कोने हैं। किनारों का पता लगाने के उदाहरण जिनका उपयोग पोस्ट-प्रोसेसिंग के साथ कोनों का पता लगाने के लिए किया जा सकता है, [[किर्श संचालक]] और फ़्री-चेन मास्किंग सेट हैं।<ref>[[Linda Shapiro|Shapiro, Linda]] and George C. Stockman (2001). ''Computer Vision'', p. 257. Prentice Books, Upper Saddle River. {{ISBN|0-13-030796-3}}.</ref>
व्यावहारिक रूप में, अधिकांश तथाकथित कोने का पता लगाने के तरीके सामान्य रूप से रुचि बिंदुओं का पता लगाते हैं, और वास्तव में, कोने और रुचि और बिंदु शब्द का उपयोग प्रायः साहित्य के माध्यम से कमोबेश दूसरे के स्थान पर किया जाता है।<ref name="willis"/>परिणामस्वरूप, यदि केवल कोनों का पता लगाने में किया जाता है तो यह निर्धारित करने के लिए पता लगाए गए रुचि बिंदुओं का स्थानीय विश्लेषण करना आवश्यक है कि इनमें से कौन सा वास्तविक कोने हैं। किनारों का पता लगाने के उदाहरण जिनका उपयोग पोस्ट-प्रोसेसिंग के साथ कोनों का पता लगाने के लिए किया जा सकता है, [[किर्श संचालक]] और फ़्री-चेन मास्किंग सेट हैं।<ref>[[Linda Shapiro|Shapiro, Linda]] and George C. Stockman (2001). ''Computer Vision'', p. 257. Prentice Books, Upper Saddle River. {{ISBN|0-13-030796-3}}.</ref>
कोने, रुचि बिंदु और फीचर का साहित्य में परस्पर उपयोग किया जाता है, जिससे समस्या भ्रमित हो जाती है। विशेष रूप से, ऐसे कई [[ बूँद का पता लगाना |बूँद का पता लगाना]] हैं जिन्हें रुचि बिंदु ऑपरेटर के रूप में संदर्भित किया जा सकता है, लेकिन जिन्हें कभी-कभी गलती से कॉर्नर डिटेक्टर के रूप में संदर्भित किया जाता है। इसके अलावा, लम्बी वस्तुओं की उपस्थिति को पकड़ने के लिए रिज का पता लगाने की धारणा मौजूद है।


कॉर्नर डिटेक्टर आमतौर पर बहुत मजबूत नहीं होते हैं और पहचान कार्य पर व्यक्तिगत त्रुटियों के प्रभाव को हावी होने से रोकने के लिए अक्सर बड़े अतिरेक की आवश्यकता होती है।
कोने, रुचि बिंदु और फीचर का साहित्य में परस्पर उपयोग किया जाता है, जिससे समस्या भ्रमित हो जाती है। विशेष रूप से, ऐसे कई [[ बूँद का पता लगाना |बूँद का पता लगाना]] हैं जिन्हें रुचि बिंदु ऑपरेटर के रूप में संदर्भित किया जा सकता है, किन्तु जिन्हें कभी-कभी गलती से कॉर्नर डिटेक्टर के रूप में संदर्भित किया जाता है। इसके अतिरिक्त , लम्बी वस्तुओं की उपस्थिति को पकड़ने के लिए रिज का पता लगाने की धारणा उपस्थित है।


कोने डिटेक्टर की गुणवत्ता का निर्धारण विभिन्न प्रकाश व्यवस्था, अनुवाद, रोटेशन और अन्य परिवर्तनों की स्थितियों के तहत कई समान छवियों में ही कोने का पता लगाने की क्षमता है।
कॉर्नर डिटेक्टर सामान्यतः बहुत मजबूत नहीं होते हैं और पहचान कार्य पर व्यक्तिगत त्रुटियों के प्रभाव को हावी होने से रोकने के लिए अधिकांशतः बड़े अतिरेक की आवश्यकता होती है।


छवियों में कोने का पता लगाने का सरल तरीका सहसंबंध का उपयोग करना है, लेकिन यह कम्प्यूटेशनल रूप से बहुत महंगा और उप-इष्टतम हो जाता है। अक्सर उपयोग किया जाने वाला वैकल्पिक दृष्टिकोण हैरिस और स्टीफंस (नीचे) द्वारा प्रस्तावित विधि पर आधारित है, जो बदले में मोरावेक द्वारा विधि का सुधार है।
कोने डिटेक्टर की गुणवत्ता का निर्धारण विभिन्न प्रकाश व्यवस्था, अनुवाद, रोटेशन और अन्य परिवर्तनों की स्थितियों के अनुसार कई समान छवियों में ही कोने का पता लगाने की क्षमता है।
 
छवियों में कोने का पता लगाने का सरल विधि सहसंबंध का उपयोग करना है, किन्तु यह कम्प्यूटेशनल रूप से बहुत महंगा और उप-इष्टतम हो जाता है। अधिकांशतः उपयोग किया जाने वाला वैकल्पिक दृष्टिकोण हैरिस और स्टीफंस (नीचे) द्वारा प्रस्तावित विधि पर आधारित है, जो बदले में मोरावेक द्वारा विधि का सुधार है।


== मोरवेक कॉर्नर डिटेक्शन एल्गोरिदम ==
== मोरवेक कॉर्नर डिटेक्शन एल्गोरिदम ==
यह सबसे शुरुआती कोने का पता लगाने वाले एल्गोरिदम में से है और कोने को कम आत्म-समानता वाले बिंदु के रूप में परिभाषित करता है।<ref name="moravec"/>एल्गोरिदम यह देखने के लिए छवि में प्रत्येक पिक्सेल का परीक्षण करता है कि कोई कोना मौजूद है या नहीं, यह विचार करके कि पिक्सेल पर केंद्रित पैच पास के, बड़े पैमाने पर ओवरलैपिंग पैच के समान है। समानता को दो पैच के संबंधित पिक्सेल के बीच वर्ग अंतर (एसएसडी) का योग लेकर मापा जाता है। कम संख्या अधिक समानता दर्शाती है.
यह सबसे शुरुआती कोने का पता लगाने वाले एल्गोरिदम में से है और कोने को कम आत्म-समानता वाले बिंदु के रूप में परिभाषित करता है।<ref name="moravec"/>एल्गोरिदम यह देखने के लिए छवि में प्रत्येक पिक्सेल का परीक्षण करता है कि कोई कोना उपस्थित है या नहीं, यह विचार करके कि पिक्सेल पर केंद्रित पैच पास के, बड़े पैमाने पर ओवरलैपिंग पैच के समान है। समानता को दो पैच के संबंधित पिक्सेल के बीच वर्ग अंतर (एसएसडी) का योग लेकर मापा जाता है। कम संख्या अधिक समानता दर्शाती है.


यदि पिक्सेल एकसमान तीव्रता के क्षेत्र में है, तो आस-पास के पैच समान दिखेंगे। यदि पिक्सेल किनारे पर है, तो किनारे के लंबवत दिशा में पास के पैच काफी अलग दिखेंगे, लेकिन किनारे के समानांतर दिशा में पास के पैच के परिणामस्वरूप केवल छोटा सा बदलाव होगा। यदि पिक्सेल सभी दिशाओं में भिन्नता वाले फीचर पर है, तो आस-पास का कोई भी पैच समान नहीं दिखेगा।
यदि पिक्सेल एकसमान तीव्रता के क्षेत्र में है, तो आस-पास के पैच समान दिखेंगे। यदि पिक्सेल किनारे पर है, तो किनारे के लंबवत दिशा में पास के पैच अत्यधिक अलग दिखेंगे, किन्तु किनारे के समानांतर दिशा में पास के पैच के परिणामस्वरूप केवल छोटा सा बदलाव होगा। यदि पिक्सेल सभी दिशाओं में भिन्नता वाले फीचर पर है, तो आस-पास का कोई भी पैच समान नहीं दिखेगा।


कोने की ताकत को पैच और उसके पड़ोसियों (क्षैतिज, ऊर्ध्वाधर और दो विकर्णों पर) के बीच सबसे छोटे एसएसडी के रूप में परिभाषित किया गया है। कारण यह है कि यदि यह संख्या अधिक है, तो सभी बदलावों में भिन्नता या तो इसके बराबर होती है या इससे बड़ी होती है, इसलिए कैप्चरिंग से आस-पास के सभी पैच अलग दिखते हैं।
कोने की ताकत को पैच और उसके पड़ोसियों (क्षैतिज, ऊर्ध्वाधर और दो विकर्णों पर) के बीच सबसे छोटे एसएसडी के रूप में परिभाषित किया गया है। कारण यह है कि यदि यह संख्या अधिक है, तो सभी बदलावों में भिन्नता या तो इसके बराबर होती है या इससे बड़ी होती है, इसलिए कैप्चरिंग से आस-पास के सभी पैच अलग दिखते हैं।


यदि सभी स्थानों के लिए कोने की ताकत संख्या की गणना की जाती है, तो यह स्थान के लिए स्थानीय रूप से अधिकतम है, यह दर्शाता है कि इसमें रुचि की विशेषता मौजूद है।
यदि सभी स्थानों के लिए कोने की ताकत संख्या की गणना की जाती है, तो यह स्थान के लिए स्थानीय रूप से अधिकतम है, यह दर्शाता है कि इसमें रुचि की विशेषता उपस्थित है।


जैसा कि मोरावेक ने बताया है, इस ऑपरेटर के साथ मुख्य समस्याओं में से यह है कि यह [[ समदैशिक |समदैशिक]] नहीं है: यदि कोई किनारा मौजूद है जो पड़ोसियों (क्षैतिज, ऊर्ध्वाधर या विकर्ण) की दिशा में नहीं है, तो सबसे छोटा एसएसडी होगा बड़ा और किनारे को गलत तरीके से रुचि बिंदु के रूप में चुना जाएगा।<ref>Obstacle Avoidance and Navigation in the Real World by a Seeing Robot Rover, Hans Moravec, March 1980, Computer Science Department, Stanford University (Ph.D. thesis)</ref>
जैसा कि मोरावेक ने बताया है, इस ऑपरेटर के साथ मुख्य समस्याओं में से यह है कि यह [[ समदैशिक |समदैशिक]] नहीं है: यदि कोई किनारा उपस्थित है जो पड़ोसियों (क्षैतिज, ऊर्ध्वाधर या विकर्ण) की दिशा में नहीं है, तो सबसे छोटा एसएसडी होगा बड़ा और किनारे को गलत तरीके से रुचि बिंदु के रूप में चुना जाएगा।<ref>Obstacle Avoidance and Navigation in the Real World by a Seeing Robot Rover, Hans Moravec, March 1980, Computer Science Department, Stanford University (Ph.D. thesis)</ref>
== हैरिस और स्टीफेंस / शि-तोमासी कोने का पता लगाने वाले एल्गोरिदम ==
== हैरिस और स्टीफेंस / शि-तोमासी कोने का पता लगाने वाले एल्गोरिदम ==
{{see|Harris Corner Detector}}
{{see|हैरिस कॉर्नर डिटेक्टर}}


हैरिस और स्टीफंस<ref name="harris"/>स्थानांतरित पैच का उपयोग करने के बजाय, सीधे दिशा के संबंध में कोने के स्कोर के अंतर पर विचार करके मोरावेक के कोने डिटेक्टर में सुधार किया गया। (इस कोने के स्कोर को अक्सर ऑटोसहसंबंध के रूप में जाना जाता है, क्योंकि इस शब्द का उपयोग उस पेपर में किया जाता है जिसमें इस डिटेक्टर का वर्णन किया गया है। हालांकि, पेपर में गणित स्पष्ट रूप से इंगित करता है कि वर्ग अंतर के योग का उपयोग किया जाता है।)
हैरिस और स्टीफंस<ref name="harris"/>स्थानांतरित पैच का उपयोग करने के अतिरिक्त , सीधे दिशा के संबंध में कोने के स्कोर के अंतर पर विचार करके मोरावेक के कोने डिटेक्टर में सुधार किया गया। (इस कोने के स्कोर को अधिकांशतः ऑटोसहसंबंध के रूप में जाना जाता है, क्योंकि इस शब्द का उपयोग उस पेपर में किया जाता है जिसमें इस डिटेक्टर का वर्णन किया गया है। हालांकि, पेपर में गणित स्पष्ट रूप से इंगित करता है कि वर्ग अंतर के योग का उपयोग किया जाता है।)


व्यापकता की हानि के बिना, हम मान लेंगे कि ग्रेस्केल 2-आयामी छवि का उपयोग किया जाता है। बता दें कि यह छवि दी गई है <math>I</math>. क्षेत्र पर छवि पैच लेने पर विचार करें <math>(u, v)</math> और इसे स्थानांतरित करना <math>(x, y)</math>. इन दो पैच के बीच वर्ग अंतर (एसएसडी) का भारित योग दर्शाया गया है <math>S</math>, द्वारा दिया गया है:
व्यापकता की हानि के बिना, हम मान लेंगे कि ग्रेस्केल 2-आयामी छवि का उपयोग किया जाता है। बता दें कि यह छवि दी गई है <math>I</math>. क्षेत्र पर छवि पैच लेने पर विचार करें <math>(u, v)</math> और इसे स्थानांतरित करना <math>(x, y)</math>. इन दो पैच के बीच वर्ग अंतर (एसएसडी) का भारित योग दर्शाया गया है <math>S</math>, द्वारा दिया गया है:
Line 41: Line 42:
इससे सन्निकटन उत्पन्न होता है
इससे सन्निकटन उत्पन्न होता है
:<math> S(x,y) \approx \sum_u \sum_v w(u,v) \, \left( I_x(u,v)x + I_y(u,v)y \right)^2, </math>
:<math> S(x,y) \approx \sum_u \sum_v w(u,v) \, \left( I_x(u,v)x + I_y(u,v)y \right)^2, </math>
जिसे मैट्रिक्स रूप में लिखा जा सकता है:
जिसे आव्यूह रूप में लिखा जा सकता है:
:<math> S(x,y) \approx \begin{bmatrix} x & y \end{bmatrix} A \begin{bmatrix} x \\ y \end{bmatrix}, </math>
:<math> S(x,y) \approx \begin{bmatrix} x & y \end{bmatrix} A \begin{bmatrix} x \\ y \end{bmatrix}, </math>
जहां ए [[संरचना टेंसर]] है,
जहां ए [[संरचना टेंसर]] है,
Line 59: Line 60:
शब्दों में, हम छवि तीव्रता के आंशिक व्युत्पन्न का [[सहप्रसरण]] पाते हैं <math>I</math> के प्रति सम्मान के साथ <math>x</math> और <math>y</math> कुल्हाड़ियाँ
शब्दों में, हम छवि तीव्रता के आंशिक व्युत्पन्न का [[सहप्रसरण]] पाते हैं <math>I</math> के प्रति सम्मान के साथ <math>x</math> और <math>y</math> कुल्हाड़ियाँ


कोण कोष्ठक औसत को दर्शाते हैं (अर्थात् संक्षेपण)। <math>(u,v)</math>). <math> w(u,v)</math> छवि पर स्लाइड करने वाली विंडो के प्रकार को दर्शाता है। यदि [[बॉक्स ब्लर]] का उपयोग किया जाता है तो प्रतिक्रिया [[एनिसोट्रॉपिक]] होगी, लेकिन यदि [[गॉसियन फ़ंक्शन]] का उपयोग किया जाता है, तो प्रतिक्रिया आइसोट्रोपिक होगी।
कोण कोष्ठक औसत को दर्शाते हैं (अर्थात् संक्षेपण)। <math>(u,v)</math>). <math> w(u,v)</math> छवि पर स्लाइड करने वाली विंडो के प्रकार को दर्शाता है। यदि [[बॉक्स ब्लर]] का उपयोग किया जाता है तो प्रतिक्रिया [[एनिसोट्रॉपिक]] होगी, किन्तु यदि [[गॉसियन फ़ंक्शन]] का उपयोग किया जाता है, तो प्रतिक्रिया आइसोट्रोपिक होगी।


कोने (या सामान्य तौर पर रुचि बिंदु) की विशेषता बड़ी विविधता है <math> S </math> वेक्टर की सभी दिशाओं में <math> \begin{bmatrix} x & y \end{bmatrix} </math>. के eigenvalues ​​का विश्लेषण करके <math> A </math>, इस लक्षण वर्णन को निम्नलिखित तरीके से व्यक्त किया जा सकता है: <math> A </math> रुचि बिंदु के लिए दो बड़े eigenvalues ​​​​होने चाहिए।
कोने (या सामान्य तौर पर रुचि बिंदु) की विशेषता बड़ी विविधता है <math> S </math> वेक्टर की सभी दिशाओं में <math> \begin{bmatrix} x & y \end{bmatrix} </math>. के आइगेनमूल्य ​​का विश्लेषण करके <math> A </math>, इस लक्षण वर्णन को निम्नलिखित तरीके से व्यक्त किया जा सकता है: <math> A </math> रुचि बिंदु के लिए दो बड़े आइगेनमूल्य ​​​​होने चाहिए।
स्वदेशी मूल्यों के परिमाण के आधार पर, इस तर्क के आधार पर निम्नलिखित अनुमान लगाए जा सकते हैं:
स्वदेशी मूल्यों के परिमाण के आधार पर, इस तर्क के आधार पर निम्नलिखित अनुमान लगाए जा सकते हैं:
#अगर <math>\lambda_1 \approx 0</math> और <math>\lambda_2 \approx 0</math> फिर यह पिक्सेल <math>(x,y)</math> रुचि की कोई विशेषता नहीं है.
#यदि <math>\lambda_1 \approx 0</math> और <math>\lambda_2 \approx 0</math> फिर यह पिक्सेल <math>(x,y)</math> रुचि की कोई विशेषता नहीं है.
#अगर <math>\lambda_1 \approx 0</math> और <math>\lambda_2</math> कुछ बड़ा सकारात्मक मूल्य है, तो बढ़त पाई जाती है।
#यदि <math>\lambda_1 \approx 0</math> और <math>\lambda_2</math> कुछ बड़ा धनात्मक मूल्य है, तो बढ़त पाई जाती है।
#अगर <math> \lambda_1</math> और <math> \lambda_2</math> बड़े सकारात्मक मान हैं, तो कोना मिल जाता है।
#यदि <math> \lambda_1</math> और <math> \lambda_2</math> बड़े धनात्मक मान हैं, तो कोना मिल जाता है।


हैरिस और स्टीफंस ने ध्यान दिया कि आइगेनवैल्यू की सटीक गणना कम्प्यूटेशनल रूप से महंगी है, क्योंकि इसके लिए [[वर्गमूल]] की गणना की आवश्यकता होती है, और इसके बजाय सुझाव देते हैं
हैरिस और स्टीफंस ने ध्यान दिया कि आइगेनवैल्यू की सटीक गणना कम्प्यूटेशनल रूप से महंगी है, क्योंकि इसके लिए [[वर्गमूल]] की गणना की आवश्यकता होती है, और इसके अतिरिक्त सुझाव देते हैं
निम्नलिखित फ़ंक्शन <math>M_c</math>, कहाँ <math>\kappa</math> ट्यून करने योग्य संवेदनशीलता पैरामीटर है:
निम्नलिखित फ़ंक्शन <math>M_c</math>, यहाँ <math>\kappa</math> ट्यून करने योग्य संवेदनशीलता पैरामीटर है:


:<math> M_c = \lambda_1 \lambda_2 - \kappa \left(\lambda_1 + \lambda_2\right)^2
:<math> M_c = \lambda_1 \lambda_2 - \kappa \left(\lambda_1 + \lambda_2\right)^2
= \det(A) - \kappa \operatorname{trace}^2(A) </math>
= \det(A) - \kappa \operatorname{trace}^2(A) </math>
इसलिए, एल्गोरिथ्म<ref name="sanchez"/>वास्तव में मैट्रिक्स के [[eigenvalue अपघटन]] की गणना करने की आवश्यकता नहीं है <math>A</math> और
इसलिए, एल्गोरिथ्म<ref name="sanchez"/>वास्तव में आव्यूह के [[eigenvalue अपघटन]] की गणना करने की आवश्यकता नहीं है <math>A</math> और
इसके बजाय यह निर्धारक और [[ट्रेस (रैखिक बीजगणित)]] का मूल्यांकन करने के लिए पर्याप्त है <math>A</math> ढूँढ़ने के लिए
इसके अतिरिक्त यह निर्धारक और [[ट्रेस (रैखिक बीजगणित)]] का मूल्यांकन करने के लिए पर्याप्त है <math>A</math> ढूँढ़ने के लिए
कोने, या सामान्यतः रुचि बिंदु।
कोने, या सामान्यतः रुचि बिंदु।


Line 80: Line 81:
का मान है <math>\kappa</math> अनुभवजन्य रूप से निर्धारित किया जाना है, और साहित्य में 0.04-0.15 की सीमा में मूल्यों को व्यवहार्य बताया गया है।
का मान है <math>\kappa</math> अनुभवजन्य रूप से निर्धारित किया जाना है, और साहित्य में 0.04-0.15 की सीमा में मूल्यों को व्यवहार्य बताया गया है।


कोई भी पैरामीटर सेट करने से बच सकता है <math>\kappa</math> नोबल का उपयोग करके<ref name="noble"/>कोने का माप <math>M_c'</math> जो eigenvalues ​​​​के [[अनुकूल माध्य]] के बराबर है:
कोई भी पैरामीटर सेट करने से बच सकता है <math>\kappa</math> नोबल का उपयोग करके<ref name="noble"/>कोने का माप <math>M_c'</math> जो आइगेनमूल्य ​​​​के [[अनुकूल माध्य]] के बराबर है:
:<math> M_c' = 2 \frac{\det(A)}{\operatorname{trace}(A) + \epsilon}, </math>
:<math> M_c' = 2 \frac{\det(A)}{\operatorname{trace}(A) + \epsilon}, </math>
<math>\epsilon</math> छोटा सा सकारात्मक स्थिरांक होना।
<math>\epsilon</math> छोटा सा धनात्मक स्थिरांक होना।


अगर <math>A</math> कोने की स्थिति के लिए सटीक मैट्रिक्स के रूप में व्याख्या की जा सकती है, कोने की स्थिति के लिए [[परिशुद्धता मैट्रिक्स]] है <math> A^{-1}</math>, अर्थात।
यदि <math>A</math> कोने की स्थिति के लिए सटीक आव्यूह के रूप में व्याख्या की जा सकती है, कोने की स्थिति के लिए [[परिशुद्धता मैट्रिक्स|परिशुद्धता]] आव्यूह है <math> A^{-1}</math>, अर्थात।


:<math>
:<math>
Line 93: Line 94:
\end{bmatrix}.
\end{bmatrix}.
</math>
</math>
के eigenvalues ​​का योग <math> A^{-1}</math>, जिसे उस मामले में कोने की स्थिति के [[सामान्यीकृत विचरण]] (या कुल अनिश्चितता) के रूप में व्याख्या किया जा सकता है, नोबल के कोने के माप से संबंधित है <math>M_c'</math> निम्नलिखित समीकरण द्वारा:
के आइगेनमूल्य ​​का योग <math> A^{-1}</math>, जिसे उस मामले में कोने की स्थिति के [[सामान्यीकृत विचरण]] (या कुल अनिश्चितता) के रूप में व्याख्या किया जा सकता है, नोबल के कोने के माप से संबंधित है <math>M_c'</math> निम्नलिखित समीकरण द्वारा:


:<math>\lambda_1(A^{-1}) + \lambda_2(A^{-1}) = \frac{\operatorname{trace}(A)}{\det(A)} \approx \frac{2}{M_c'}.</math>
:<math>\lambda_1(A^{-1}) + \lambda_2(A^{-1}) = \frac{\operatorname{trace}(A)}{\det(A)} \approx \frac{2}{M_c'}.</math>


== फोरस्टनर कॉर्नर डिटेक्टर ==
== फोरस्टनर कॉर्नर डिटेक्टर ==
[[File:Corner detection using Foerstner Algorithm.png|thumb|फ़ॉर्स्टनर एल्गोरिथम का उपयोग करके कोने का पता लगाना]]कुछ मामलों में, कोई उपपिक्सेल सटीकता के साथ कोने के स्थान की गणना करना चाह सकता है। अनुमानित समाधान प्राप्त करने के लिए, फ़ोरस्टनर<ref>{{cite journal |last=Förstner |first=W |author2=Gülch |title=विशिष्ट बिंदुओं, कोनों और गोलाकार विशेषताओं के केंद्रों का पता लगाने और सटीक स्थान के लिए एक तेज़ ऑपरेटर|journal=ISPRS |year=1987 |url=https://cseweb.ucsd.edu//classes/sp02/cse252/foerstner/foerstner.pdf }}</ref> एल्गोरिदम किसी दिए गए विंडो में कोने की सभी स्पर्शरेखा रेखाओं के निकटतम बिंदु को हल करता है और यह न्यूनतम-वर्ग समाधान है। एल्गोरिदम इस तथ्य पर निर्भर करता है कि आदर्श कोने के लिए, स्पर्शरेखा रेखाएं ही बिंदु पर प्रतिच्छेद करती हैं।
[[File:Corner detection using Foerstner Algorithm.png|thumb|फ़ॉर्स्टनर एल्गोरिथम का उपयोग करके कोने का पता लगाना]]कुछ स्थितियों में, कोई उपपिक्सेल सटीकता के साथ कोने के स्थान की गणना करना चाह सकता है। अनुमानित समाधान प्राप्त करने के लिए, फ़ोरस्टनर<ref>{{cite journal |last=Förstner |first=W |author2=Gülch |title=विशिष्ट बिंदुओं, कोनों और गोलाकार विशेषताओं के केंद्रों का पता लगाने और सटीक स्थान के लिए एक तेज़ ऑपरेटर|journal=ISPRS |year=1987 |url=https://cseweb.ucsd.edu//classes/sp02/cse252/foerstner/foerstner.pdf }}</ref> एल्गोरिदम किसी दिए गए विंडो में कोने की सभी स्पर्शरेखा रेखाओं के निकटतम बिंदु को हल करता है और यह न्यूनतम-वर्ग समाधान है। एल्गोरिदम इस तथ्य पर निर्भर करता है कि आदर्श कोने के लिए, स्पर्शरेखा रेखाएं ही बिंदु पर प्रतिच्छेद करती हैं।


स्पर्श रेखा का समीकरण <math>T_{\mathbf{x}'}(\mathbf{x})</math> पिक्सेल पर <math>\mathbf{x}'</math> द्वारा दिया गया है:
स्पर्श रेखा का समीकरण <math>T_{\mathbf{x}'}(\mathbf{x})</math> पिक्सेल पर <math>\mathbf{x}'</math> द्वारा दिया गया है:


:<math>T_\mathbf{x'}(\mathbf x) = \nabla I(\mathbf{x'})^{\top}(\mathbf{x}-\mathbf{x'}) = 0</math>
:<math>T_\mathbf{x'}(\mathbf x) = \nabla I(\mathbf{x'})^{\top}(\mathbf{x}-\mathbf{x'}) = 0</math>
कहाँ <math>\nabla I(\mathbf{x'}) = \begin{bmatrix} I_{\mathbf{x}} & I_{\mathbf{y}} \end{bmatrix}^{\top}</math> छवि का ग्रेडिएंट वेक्टर है <math>I</math> पर <math>\mathbf{x'}</math>.
यहाँ <math>\nabla I(\mathbf{x'}) = \begin{bmatrix} I_{\mathbf{x}} & I_{\mathbf{y}} \end{bmatrix}^{\top}</math> छवि का ग्रेडिएंट वेक्टर है <math>I</math> पर <math>\mathbf{x'}</math>.


बिंदु <math>\mathbf{x}_{0}</math> विंडो में सभी स्पर्शरेखा रेखाओं के सबसे निकट <math>N</math> है:
बिंदु <math>\mathbf{x}_{0}</math> विंडो में सभी स्पर्शरेखा रेखाओं के सबसे निकट <math>N</math> है:
Line 135: Line 136:


:<math>x_{0}=A^{-1}\mathbf{b}</math>
:<math>x_{0}=A^{-1}\mathbf{b}</math>
केवल वहीं मौजूद है जहां विंडो में वास्तविक कोना मौजूद है <math>N</math>.
केवल वहीं उपस्थित है जहां विंडो में वास्तविक कोना उपस्थित है <math>N</math>.


इस कोने के स्थानीयकरण विधि के लिए स्वचालित पैमाने का चयन करने की पद्धति लिंडेबर्ग द्वारा प्रस्तुत की गई है<ref name="lindeberg94icip"/><ref name="lindeberg98"/>सामान्यीकृत अवशिष्ट को कम करके
इस कोने के स्थानीयकरण विधि के लिए स्वचालित पैमाने का चयन करने की पद्धति लिंडेबर्ग द्वारा प्रस्तुत की गई है<ref name="lindeberg94icip"/><ref name="lindeberg98"/>सामान्यीकृत अवशिष्ट को कम करके


:<math>\tilde{d}_{\min} = \frac{c - b^T A^{-1} b}{\operatorname{trace} A}</math>
:<math>\tilde{d}_{\min} = \frac{c - b^T A^{-1} b}{\operatorname{trace} A}</math>
तराजू के ऊपर. इस प्रकार, विधि में शोर छवि डेटा के लिए मोटे पैमाने के स्तर और आदर्श कोने जैसी संरचनाओं के लिए बेहतर पैमाने के स्तर का चयन करके, छवि डेटा में शोर स्तर के लिए छवि ग्रेडिएंट्स की गणना के लिए स्केल स्तरों को स्वचालित रूप से अनुकूलित करने की क्षमता होती है।
तराजू के ऊपर. इस प्रकार, विधि में शोर छवि डेटा के लिए मोटे पैमाने के स्तर और आदर्श कोने जैसी संरचनाओं के लिए उत्तम पैमाने के स्तर का चयन करके, छवि डेटा में शोर स्तर के लिए छवि ग्रेडिएंट्स की गणना के लिए स्केल स्तरों को स्वचालित रूप से अनुकूलित करने की क्षमता होती है।


टिप्पणियाँ:
टिप्पणियाँ:
Line 149: Line 150:
== मल्टी-स्केल हैरिस ऑपरेटर ==
== मल्टी-स्केल हैरिस ऑपरेटर ==


दूसरे क्षण मैट्रिक्स की गणना (कभी-कभी इसे संरचना टेंसर भी कहा जाता है) <math>A</math> हैरिस ऑपरेटर में, छवि डेरिवेटिव की गणना की आवश्यकता होती है <math>I_x, I_y</math> छवि डोमेन के साथ-साथ स्थानीय पड़ोस पर इन डेरिवेटिव के गैर-रेखीय संयोजनों का योग। चूंकि डेरिवेटिव की गणना में आमतौर पर स्केल-स्पेस स्मूथिंग का चरण शामिल होता है, हैरिस ऑपरेटर की परिचालन परिभाषा के लिए दो स्केल पैरामीटर की आवश्यकता होती है: (i) इमेज डेरिवेटिव की गणना से पहले स्मूथिंग के लिए स्थानीय स्केल, और (ii) एकीकरण स्केल एकीकृत छवि डिस्क्रिप्टर में व्युत्पन्न ऑपरेटरों पर गैर-रेखीय संचालन को संचित करने के लिए।
दूसरे क्षण आव्यूह की गणना (कभी-कभी इसे संरचना टेंसर भी कहा जाता है) <math>A</math> हैरिस ऑपरेटर में, छवि डेरिवेटिव की गणना की आवश्यकता होती है <math>I_x, I_y</math> छवि डोमेन के साथ-साथ स्थानीय पड़ोस पर इन डेरिवेटिव के गैर-रेखीय संयोजनों का योग। चूंकि डेरिवेटिव की गणना में सामान्यतः स्केल-स्पेस स्मूथिंग का चरण सम्मलित होता है, हैरिस ऑपरेटर की परिचालन परिभाषा के लिए दो स्केल पैरामीटर की आवश्यकता होती है: (i) इमेज डेरिवेटिव की गणना से पहले स्मूथिंग के लिए स्थानीय स्केल, और (ii) एकीकरण स्केल एकीकृत छवि डिस्क्रिप्टर में व्युत्पन्न ऑपरेटरों पर गैर-रेखीय संचालन को संचित करने के लिए।


साथ <math>I</math> मूल छवि तीव्रता को दर्शाते हुए, आइए <math>L</math> के [[स्केल स्पेस प्रतिनिधित्व]] को निरूपित करें <math>I</math> गॉसियन कर्नेल के साथ कनवल्शन द्वारा प्राप्त किया गया
साथ <math>I</math> मूल छवि तीव्रता को दर्शाते हुए, आइए <math>L</math> के [[स्केल स्पेस प्रतिनिधित्व]] को निरूपित करें <math>I</math> गॉसियन कर्नेल के साथ कनवल्शन द्वारा प्राप्त किया गया
Line 156: Line 157:
:<math>L(x, y, t)\ = g(x, y, t) * I(x, y)</math>
:<math>L(x, y, t)\ = g(x, y, t) * I(x, y)</math>
और जाने <math>L_x = \partial_x L</math> और <math>L_y = \partial_y L</math> के आंशिक व्युत्पन्न को निरूपित करें <math>L</math>.
और जाने <math>L_x = \partial_x L</math> और <math>L_y = \partial_y L</math> के आंशिक व्युत्पन्न को निरूपित करें <math>L</math>.
इसके अलावा, गाऊसी विंडो फ़ंक्शन का परिचय दें <math>g(x, y, s)</math> एकीकरण स्केल पैरामीटर के साथ <math>s</math>. फिर, स्ट्रक्चर टेंसर#मल्टी-स्केल स्ट्रक्चर टेंसर|मल्टी-स्केल सेकेंड-मोमेंट मैट्रिक्स<ref name="lindeberg94book"/><ref name=LinGar97-IVC/><ref name="lindeberg08enc"/>के रूप में परिभाषित किया जा सकता है
इसके अतिरिक्त , गाऊसी विंडो फ़ंक्शन का परिचय दें <math>g(x, y, s)</math> एकीकरण स्केल पैरामीटर के साथ <math>s</math>. फिर, स्ट्रक्चर टेंसर मल्टी-स्केल स्ट्रक्चर टेंसर|मल्टी-स्केल सेकेंड-मोमेंट मैट्रिक्स<ref name="lindeberg94book"/><ref name=LinGar97-IVC/><ref name="lindeberg08enc"/>के रूप में परिभाषित किया जा सकता है
:<math>
:<math>
\mu(x, y; t, s) =
\mu(x, y; t, s) =
Line 166: Line 167:
g(\xi, \eta; s) \, d\xi \, d\eta.
g(\xi, \eta; s) \, d\xi \, d\eta.
</math>
</math>
फिर, हम eigenvalues ​​​​की गणना कर सकते हैं <math>\mu</math> के eigenvalues ​​​​के समान तरीके से <math>A</math> और मल्टी-स्केल हैरिस कॉर्नर माप को इस प्रकार परिभाषित करें
फिर, हम आइगेनमूल्य ​​​​की गणना कर सकते हैं <math>\mu</math> के आइगेनमूल्य ​​​​के समान तरीके से <math>A</math> और मल्टी-स्केल हैरिस कॉर्नर माप को इस प्रकार परिभाषित करें
:<math>M_c(x, y; t, s) = \det (\mu(x, y; t, s)) - \kappa \, \operatorname{trace}^2(\mu(x, y; t, s)) .</math>
:<math>M_c(x, y; t, s) = \det (\mu(x, y; t, s)) - \kappa \, \operatorname{trace}^2(\mu(x, y; t, s)) .</math>
स्थानीय पैमाने के पैरामीटर के चयन के संबंध में <math>t</math> और एकीकरण स्केल पैरामीटर <math>s</math>, ये स्केल पैरामीटर आमतौर पर सापेक्ष एकीकरण स्केल पैरामीटर द्वारा युग्मित होते हैं <math>\gamma</math> ऐसा है कि <math>s = \gamma^2 t</math>, कहाँ <math>\gamma</math> आमतौर पर अंतराल में चुना जाता है <math>[1, 2]</math>.<ref name="lindeberg94book"/><ref name=LinGar97-IVC/>इस प्रकार, हम बहु-स्तरीय हैरिस कॉर्नर माप की गणना कर सकते हैं <math>M_c(x, y; t, \gamma^2 t)</math> किसी भी पैमाने पर <math>t</math> मल्टी-स्केल कॉर्नर डिटेक्टर प्राप्त करने के लिए स्केल-स्पेस में, जो इमेज डोमेन में विभिन्न आकारों की कॉर्नर संरचनाओं पर प्रतिक्रिया करता है।
स्थानीय पैमाने के पैरामीटर के चयन के संबंध में <math>t</math> और एकीकरण स्केल पैरामीटर <math>s</math>, ये स्केल पैरामीटर सामान्यतः सापेक्ष एकीकरण स्केल पैरामीटर द्वारा युग्मित होते हैं <math>\gamma</math> ऐसा है कि <math>s = \gamma^2 t</math>, यहाँ <math>\gamma</math> सामान्यतः अंतराल में चुना जाता है <math>[1, 2]</math>.<ref name="lindeberg94book"/><ref name=LinGar97-IVC/>इस प्रकार, हम बहु-स्तरीय हैरिस कॉर्नर माप की गणना कर सकते हैं <math>M_c(x, y; t, \gamma^2 t)</math> किसी भी पैमाने पर <math>t</math> मल्टी-स्केल कॉर्नर डिटेक्टर प्राप्त करने के लिए स्केल-स्पेस में, जो इमेज डोमेन में विभिन्न आकारों की कॉर्नर संरचनाओं पर प्रतिक्रिया करता है।


व्यवहार में, इस मल्टी-स्केल कॉर्नर डिटेक्टर को अक्सर स्केल चयन चरण द्वारा पूरक किया जाता है, जहां स्केल-सामान्यीकृत लाप्लासियन ऑपरेटर<ref name="lindeberg98"/><ref name="lindeberg94book"/>:<math>\nabla^2_\mathrm{norm} L(x, y; t)\ = t \nabla^2 L(x, y, t) = t (L_{xx}(x, y, t) + L_{yy}(x, y, t))</math>
व्यवहार में, इस मल्टी-स्केल कॉर्नर डिटेक्टर को अधिकांशतः स्केल चयन चरण द्वारा पूरक किया जाता है, जहां स्केल-सामान्यीकृत लाप्लासियन ऑपरेटर<ref name="lindeberg98"/><ref name="lindeberg94book"/>:<math>\nabla^2_\mathrm{norm} L(x, y; t)\ = t \nabla^2 L(x, y, t) = t (L_{xx}(x, y, t) + L_{yy}(x, y, t))</math>
स्केल-स्पेस में हर पैमाने पर गणना की जाती है और स्वचालित स्केल चयन (हैरिस-लाप्लास ऑपरेटर) के साथ स्केल अनुकूलित कोने बिंदुओं की गणना उन बिंदुओं से की जाती है जो साथ हैं:<ref name="schmid"/>
स्केल-स्पेस में हर पैमाने पर गणना की जाती है और स्वचालित स्केल चयन (हैरिस-लाप्लास ऑपरेटर) के साथ स्केल अनुकूलित कोने बिंदुओं की गणना उन बिंदुओं से की जाती है जो साथ हैं:<ref name="schmid"/>


Line 179: Line 180:
== स्तर वक्र [[वक्रता]] दृष्टिकोण ==
== स्तर वक्र [[वक्रता]] दृष्टिकोण ==


कोने का पता लगाने का पुराना तरीका उन बिंदुओं का पता लगाना है जहां [[आइसोलिन्स]] की वक्रता और ढाल परिमाण साथ उच्च हैं।<ref name="kitchen82"/><ref name="richards88"/>  
कोने का पता लगाने का पुराना विधि उन बिंदुओं का पता लगाना है जहां [[आइसोलिन्स]] की वक्रता और ढाल परिमाण साथ उच्च हैं।<ref name="kitchen82"/><ref name="richards88"/>  
ऐसे बिंदुओं का पता लगाने का अलग तरीका पुनर्स्केल स्तर वक्र वक्रता (स्तर वक्र वक्रता का उत्पाद और तीन की शक्ति तक बढ़ाए गए ढाल परिमाण) की गणना करना है।
ऐसे बिंदुओं का पता लगाने का अलग विधि पुनर्स्केल स्तर वक्र वक्रता (स्तर वक्र वक्रता का उत्पाद और तीन की शक्ति तक बढ़ाए गए ढाल परिमाण) की गणना करना है।
:<math>\tilde{\kappa}(x, y;t) = L_x^2 L_{yy} + L_y^2 L_{xx} - 2 L_x L_y L_{xy}</math>
:<math>\tilde{\kappa}(x, y;t) = L_x^2 L_{yy} + L_y^2 L_{xx} - 2 L_x L_y L_{xy}</math>
और कुछ पैमाने पर इस अंतर अभिव्यक्ति के सकारात्मक मैक्सिमा और नकारात्मक मिनिमा का पता लगाने के लिए <math>t</math> स्केल स्पेस प्रतिनिधित्व में <math>L</math> मूल छवि का.<ref name="lindeberg94icip"/><ref name="lindeberg98"/>  
और कुछ पैमाने पर इस अंतर अभिव्यक्ति के धनात्मक मैक्सिमा और नकारात्मक मिनिमा का पता लगाने के लिए <math>t</math> स्केल स्पेस प्रतिनिधित्व में <math>L</math> मूल छवि का.<ref name="lindeberg94icip"/><ref name="lindeberg98"/>  
हालाँकि, एकल पैमाने पर पुनर्स्केल स्तर वक्र वक्रता इकाई की गणना करते समय मुख्य समस्या यह है कि यह शोर और स्केल स्तर की पसंद के प्रति संवेदनशील हो सकता है। की गणना करना बेहतर तरीका है<math>\gamma</math>-सामान्यीकृत पुनर्स्केल्ड स्तर वक्र वक्रता
 
चूँकि , एकल पैमाने पर पुनर्स्केल स्तर वक्र वक्रता इकाई की गणना करते समय मुख्य समस्या यह है कि यह शोर और स्केल स्तर की पसंद के प्रति संवेदनशील हो सकता है। की गणना करना उत्तम विधि है<math>\gamma</math>-सामान्यीकृत पुनर्स्केल्ड स्तर वक्र वक्रता
:<math>\tilde{\kappa}_\mathrm{norm}(x, y;t) = t^{2 \gamma} (L_x^2 L_{yy} + L_y^2 L_{xx} - 2 L_x L_y L_{xy})</math>
:<math>\tilde{\kappa}_\mathrm{norm}(x, y;t) = t^{2 \gamma} (L_x^2 L_{yy} + L_y^2 L_{xx} - 2 L_x L_y L_{xy})</math>
साथ <math>\gamma = 7/8</math> और इस अभिव्यक्ति के हस्ताक्षरित स्केल-स्पेस एक्स्ट्रेमा का पता लगाने के लिए, ये ऐसे बिंदु और स्केल हैं जो स्पेस और स्केल दोनों के संबंध में सकारात्मक मैक्सिमा और नकारात्मक मिनिमा हैं।
साथ <math>\gamma = 7/8</math> और इस अभिव्यक्ति के हस्ताक्षरित स्केल-स्पेस एक्स्ट्रेमा का पता लगाने के लिए, ये ऐसे बिंदु और स्केल हैं जो स्पेस और स्केल दोनों के संबंध में धनात्मक मैक्सिमा और नकारात्मक मिनिमा हैं।
:<math>(\hat{x}, \hat{y}; \hat{t}) = \operatorname{argminmaxlocal}_{(x, y; t)} \tilde{\kappa}_\mathrm{norm}(x, y; t)</math>
:<math>(\hat{x}, \hat{y}; \hat{t}) = \operatorname{argminmaxlocal}_{(x, y; t)} \tilde{\kappa}_\mathrm{norm}(x, y; t)</math>
मोटे पैमाने पर स्थानीयकरण त्रुटि में वृद्धि को संभालने के लिए पूरक स्थानीयकरण कदम के साथ संयोजन में।<ref name="lindeberg94icip"/><ref name="lindeberg98"/><ref name="lindeberg94book"/>इस तरह, बड़े पैमाने के मूल्य बड़े स्थानिक विस्तार वाले गोल कोनों से जुड़े होंगे जबकि छोटे पैमाने के मूल्य छोटे स्थानिक विस्तार वाले तेज कोनों से जुड़े होंगे। यह दृष्टिकोण स्वचालित स्केल चयन वाला पहला कॉर्नर डिटेक्टर है (ऊपर हैरिस-लाप्लास ऑपरेटर से पहले) और इसका उपयोग छवि डोमेन में बड़े पैमाने पर बदलाव के तहत कोनों को ट्रैक करने के लिए किया गया है।<ref name="brelin98feattrack"/>और [[जियोन (मनोविज्ञान)]]-आधारित वस्तु पहचान के लिए संरचनात्मक छवि सुविधाओं की गणना करने के लिए किनारों से कोने की प्रतिक्रियाओं का मिलान करने के लिए।<ref name="lindebergli97"/>
मोटे पैमाने पर स्थानीयकरण त्रुटि में वृद्धि को संभालने के लिए पूरक स्थानीयकरण कदम के साथ संयोजन में।<ref name="lindeberg94icip" /><ref name="lindeberg98" /><ref name="lindeberg94book" />इस प्रकार , बड़े पैमाने के मूल्य बड़े स्थानिक विस्तार वाले गोल कोनों से जुड़े होंगे जबकि छोटे पैमाने के मूल्य छोटे स्थानिक विस्तार वाले तेज कोनों से जुड़े होंगे। यह दृष्टिकोण स्वचालित स्केल चयन वाला पहला कॉर्नर डिटेक्टर है (ऊपर हैरिस-लाप्लास ऑपरेटर से पहले) और इसका उपयोग छवि डोमेन में बड़े पैमाने पर बदलाव के अनुसार कोनों को ट्रैक करने के लिए किया गया है।<ref name="brelin98feattrack" />और [[जियोन (मनोविज्ञान)]]-आधारित वस्तु पहचान के लिए संरचनात्मक छवि सुविधाओं की गणना करने के लिए किनारों से कोने की प्रतिक्रियाओं का मिलान करने के लिए।<ref name="lindebergli97" />


== गॉसियन का लाप्लासियन, गॉसियन के अंतर और हेसियन स्केल-स्पेस ब्याज बिंदुओं के निर्धारक ==
== गॉसियन का लाप्लासियन, गॉसियन के अंतर और हेसियन स्केल-स्पेस ब्याज बिंदुओं के निर्धारक ==


लकड़ी का लट्ठा<ref name="lindeberg98"/><ref name="lindeberg94book"/><ref name="schmid"/>गॉसियन, DoG के लाप्लासियन का संक्षिप्त रूप है<ref name="sift"/>गॉसियन के अंतर के लिए संक्षिप्त शब्द है (DoG LoG का अनुमान है), और DoH हेसियन के निर्धारक के लिए संक्षिप्त शब्द है।<ref name="lindeberg98"/>ये सभी स्केल-अपरिवर्तनीय ब्याज बिंदु स्केल-सामान्यीकृत अंतर अभिव्यक्तियों के स्केल-स्पेस एक्स्ट्रेमा का पता लगाकर निकाले जाते हैं, यानी, स्केल-स्पेस में बिंदु जहां संबंधित स्केल-सामान्यीकृत अंतर अभिव्यक्तियां अंतरिक्ष और स्केल दोनों के संबंध में स्थानीय एक्स्स्ट्रेमा मानती हैं।<ref name="lindeberg98"/>:<math>(\hat{x}, \hat{y}; \hat{t}) = \operatorname{argminmaxlocal}_{(x, y; t)} (D_\mathrm{norm} L)(x, y; t)</math>
लकड़ी का लट्ठा<ref name="lindeberg98"/><ref name="lindeberg94book"/><ref name="schmid"/>गॉसियन, DoG के लाप्लासियन का संक्षिप्त रूप है<ref name="sift"/>गॉसियन के अंतर के लिए संक्षिप्त शब्द है (DoG LoG का अनुमान है), और DoH हेसियन के निर्धारक के लिए संक्षिप्त शब्द है।<ref name="lindeberg98"/>ये सभी स्केल-अपरिवर्तनीय ब्याज बिंदु स्केल-सामान्यीकृत अंतर अभिव्यक्तियों के स्केल-स्पेस एक्स्ट्रेमा का पता लगाकर निकाले जाते हैं, यानी, स्केल-स्पेस में बिंदु जहां संबंधित स्केल-सामान्यीकृत अंतर अभिव्यक्तियां अंतरिक्ष और स्केल दोनों के संबंध में स्थानीय एक्स्स्ट्रेमा मानती हैं।<ref name="lindeberg98"/>:
कहाँ <math>D_{norm} L</math> उपयुक्त पैमाने-सामान्यीकृत अंतर इकाई को दर्शाता है (नीचे परिभाषित)।


इन डिटेक्टरों को ब्लॉब डिटेक्शन में अधिक पूरी तरह से वर्णित किया गया है। गॉसियन का स्केल-सामान्यीकृत लाप्लासियन और गॉसियन विशेषताओं का अंतर (लिंडेबर्ग 1994, 1998; लोव 2004)<ref name="lindeberg98"/><ref name="lindeberg94book"/><ref name="sift"/>  
<math>(\hat{x}, \hat{y}; \hat{t}) = \operatorname{argminmaxlocal}_{(x, y; t)} (D_\mathrm{norm} L)(x, y; t)</math>
 
यहाँ <math>D_{norm} L</math> उपयुक्त पैमाने-सामान्यीकृत अंतर इकाई को दर्शाता है (नीचे परिभाषित)।
 
इन डिटेक्टरों को ब्लॉब डिटेक्शन में अधिक पूरी प्रकार से वर्णित किया गया है। गॉसियन का स्केल-सामान्यीकृत लाप्लासियन और गॉसियन विशेषताओं का अंतर (लिंडेबर्ग 1994, 1998; लोव 2004)<ref name="lindeberg98"/><ref name="lindeberg94book"/><ref name="sift"/>  
:<math>\begin{align}
:<math>\begin{align}
\nabla^2_\mathrm{norm} L(x, y; t)
\nabla^2_\mathrm{norm} L(x, y; t)
Line 200: Line 205:
&\approx \frac{t \left( L(x, y; t+\Delta t) - L(x, y; t) \right)}{\Delta t}   
&\approx \frac{t \left( L(x, y; t+\Delta t) - L(x, y; t) \right)}{\Delta t}   
\end{align}</math>
\end{align}</math>
जरूरी नहीं कि अत्यधिक चयनात्मक विशेषताएं बनाएं, क्योंकि ये ऑपरेटर किनारों के पास भी प्रतिक्रियाएं दे सकते हैं। गॉसियन डिटेक्टर के अंतर की कोने का पता लगाने की क्षमता में सुधार करने के लिए, [[स्केल-अपरिवर्तनीय सुविधा परिवर्तन]] में उपयोग किए जाने वाले फ़ीचर डिटेक्टर<ref name="sift"/>इसलिए सिस्टम अतिरिक्त पोस्ट-प्रोसेसिंग चरण का उपयोग करता है, जहां डिटेक्शन स्केल पर छवि के [[ हेस्सियन मैट्रिक्स |हेस्सियन मैट्रिक्स]] के आइगेनवैल्यू की जांच हैरिस ऑपरेटर की तरह ही की जाती है। यदि [[eigenvalue]]s ​​​​का अनुपात बहुत अधिक है, तो स्थानीय छवि को बहुत किनारे जैसा माना जाता है, इसलिए सुविधा को अस्वीकार कर दिया जाता है। इसके अलावा गॉसियन फ़ीचर डिटेक्टर के लिंडेबर्ग के लाप्लासियन को किनारों के पास प्रतिक्रियाओं को दबाने के लिए पूरक अंतर अपरिवर्तनीय पर पूरक थ्रेशोल्डिंग शामिल करने के लिए परिभाषित किया जा सकता है।<ref name=Lin15JMIV>[https://doi.org/10.1007/s10851-014-0541-0 T. Lindeberg ``Image matching using generalized scale-space interest points", Journal of Mathematical Imaging and Vision, volume 52, number 1, pages 3-36, 2015.]</ref>
जरूरी नहीं कि अत्यधिक चयनात्मक विशेषताएं बनाएं, क्योंकि ये ऑपरेटर किनारों के पास भी प्रतिक्रियाएं दे सकते हैं। गॉसियन डिटेक्टर के अंतर की कोने का पता लगाने की क्षमता में सुधार करने के लिए, [[स्केल-अपरिवर्तनीय सुविधा परिवर्तन]] में उपयोग किए जाने वाले फ़ीचर डिटेक्टर<ref name="sift"/>इसलिए प्रणाली अतिरिक्त पोस्ट-प्रोसेसिंग चरण का उपयोग करता है, जहां डिटेक्शन स्केल पर छवि के [[ हेस्सियन मैट्रिक्स |हेस्सियन]] आव्यूह के आइगेनवैल्यू की जांच हैरिस ऑपरेटर की प्रकार ही की जाती है। यदि आइगेनमूल्य ​​​​का अनुपात बहुत अधिक है, तो स्थानीय छवि को बहुत किनारे जैसा माना जाता है, इसलिए सुविधा को अस्वीकार कर दिया जाता है। इसके अतिरिक्त गॉसियन फ़ीचर डिटेक्टर के लिंडेबर्ग के लाप्लासियन को किनारों के पास प्रतिक्रियाओं को दबाने के लिए पूरक अंतर अपरिवर्तनीय पर पूरक थ्रेशोल्डिंग सम्मलित करने के लिए परिभाषित किया जा सकता है।<ref name=Lin15JMIV>[https://doi.org/10.1007/s10851-014-0541-0 T. Lindeberg ``Image matching using generalized scale-space interest points", Journal of Mathematical Imaging and Vision, volume 52, number 1, pages 3-36, 2015.]</ref>
हेसियन ऑपरेटर का स्केल-सामान्यीकृत निर्धारक (लिंडेबर्ग 1994, 1998)<ref name="lindeberg98"/><ref name="lindeberg94book"/>:<math>\det H_\mathrm{norm} L = t^2 (L_{xx} L_{yy} - L_{xy}^2)</math>
 
दूसरी ओर, अच्छी तरह से स्थानीयकृत छवि सुविधाओं के लिए अत्यधिक चयनात्मक है और केवल तभी प्रतिक्रिया करता है जब दो छवि दिशाओं में महत्वपूर्ण ग्रे-स्तर भिन्नताएं होती हैं<ref name="lindeberg98"/><ref name="lindeberg08enc"/>और इस और अन्य मामलों में गॉसियन के लाप्लासियन की तुलना में बेहतर रुचि बिंदु डिटेक्टर है। हेसियन का निर्धारक एफ़िन सहसंयोजक विभेदक अभिव्यक्ति है और इसमें लाप्लासियन ऑपरेटर की तुलना में एफ़िन छवि परिवर्तनों के तहत बेहतर पैमाने पर चयन गुण हैं।
हेसियन ऑपरेटर का स्केल-सामान्यीकृत निर्धारक (लिंडेबर्ग 1994, 1998)<ref name="lindeberg98" /><ref name="lindeberg94book" />:<math>\det H_\mathrm{norm} L = t^2 (L_{xx} L_{yy} - L_{xy}^2)</math>
(लिंडेबर्ग 2013, 2015)।<ref name=Lin15JMIV/><ref name=Lin13JMIV>[https://doi.org/10.1007/s10851-012-0378-3 T. Lindeberg "Scale selection properties of generalized scale-space interest point detectors", Journal of Mathematical Imaging and Vision, Volume 46, Issue 2, pages 177-210, 2013.]</ref> प्रयोगात्मक रूप से इसका तात्पर्य यह है कि हेसियन रुचि बिंदुओं के निर्धारक में लाप्लासियन रुचि बिंदुओं की तुलना में स्थानीय छवि विरूपण के तहत बेहतर दोहराव गुण होते हैं, जिसके परिणामस्वरूप उच्च दक्षता स्कोर और कम 1-[[परिशुद्धता (सूचना पुनर्प्राप्ति)]] स्कोर के संदर्भ में छवि-आधारित मिलान का बेहतर प्रदर्शन होता है। .<ref name=Lin15JMIV/>
दूसरी ओर, अच्छी प्रकार से स्थानीयकृत छवि सुविधाओं के लिए अत्यधिक चयनात्मक है और केवल तभी प्रतिक्रिया करता है जब दो छवि दिशाओं में महत्वपूर्ण ग्रे-स्तर भिन्नताएं होती हैं<ref name="lindeberg98" /><ref name="lindeberg08enc" />और इस और अन्य स्थितियों में गॉसियन के लाप्लासियन की समानता में उत्तम रुचि बिंदु डिटेक्टर है। हेसियन का निर्धारक एफ़िन सहसंयोजक विभेदक अभिव्यक्ति है और इसमें लाप्लासियन ऑपरेटर की समानता में एफ़िन छवि परिवर्तनों के अनुसार उत्तम पैमाने पर चयन गुण हैं।
 
(लिंडेबर्ग 2013, 2015)।<ref name="Lin15JMIV" /><ref name="Lin13JMIV">[https://doi.org/10.1007/s10851-012-0378-3 T. Lindeberg "Scale selection properties of generalized scale-space interest point detectors", Journal of Mathematical Imaging and Vision, Volume 46, Issue 2, pages 177-210, 2013.]</ref> प्रयोगात्मक रूप से इसका तात्पर्य यह है कि हेसियन रुचि बिंदुओं के निर्धारक में लाप्लासियन रुचि बिंदुओं की समानता में स्थानीय छवि विरूपण के अनुसार उत्तम दोहराव गुण होते हैं, जिसके परिणामस्वरूप उच्च दक्षता स्कोर और कम 1-[[परिशुद्धता (सूचना पुनर्प्राप्ति)]] स्कोर के संदर्भ में छवि-आधारित मिलान का उत्तम प्रदर्शन होता है। .<ref name="Lin15JMIV" />


इन और अन्य स्केल-स्पेस इंटरेस्ट पॉइंट डिटेक्टरों के स्केल चयन गुणों, एफ़िन ट्रांसफ़ॉर्मेशन गुणों और प्रयोगात्मक गुणों का विस्तार से विश्लेषण किया गया है (लिंडेबर्ग 2013, 2015)।<ref name=Lin15JMIV/><ref name=Lin13JMIV/>
इन और अन्य स्केल-स्पेस इंटरेस्ट पॉइंट डिटेक्टरों के स्केल चयन गुणों, एफ़िन ट्रांसफ़ॉर्मेशन गुणों और प्रयोगात्मक गुणों का विस्तार से विश्लेषण किया गया है (लिंडेबर्ग 2013, 2015)।<ref name=Lin15JMIV/><ref name=Lin13JMIV/>
== लिंडेबर्ग हेसियन फीचर ताकत उपायों के आधार पर स्केल-स्पेस रुचि बिंदु ==
== लिंडेबर्ग हेसियन फीचर ताकत उपायों के आधार पर स्केल-स्पेस रुचि बिंदु ==


हेसियन मैट्रिक्स के संरचनात्मक रूप से समान गुणों से प्रेरित <math>H f</math> समारोह का <math>f</math> और दूसरे क्षण का मैट्रिक्स (संरचना टेंसर) <math>\mu</math>, जैसे कि कर सकते हैं एफ़िन छवि विकृतियों के तहत उनके समान परिवर्तन गुणों के संदर्भ में प्रकट होना<ref name=LinGar97-IVC/><ref name=Lin15JMIV/>:<math>(H f') = A^{-T} \, (H f) \, A^{-1}</math>,
हेसियन आव्यूह के संरचनात्मक रूप से समान गुणों से प्रेरित <math>H f</math> समारोह का <math>f</math> और दूसरे क्षण का आव्यूह (संरचना टेंसर) <math>\mu</math>, जैसे कि कर सकते हैं एफ़िन छवि विकृतियों के अनुसार उनके समान परिवर्तन गुणों के संदर्भ में प्रकट होना<ref name=LinGar97-IVC/><ref name=Lin15JMIV/>:<math>(H f') = A^{-T} \, (H f) \, A^{-1}</math>,
:<math>\mu' = A^{-T} \, \mu \, A^{-1}</math>,
:<math>\mu' = A^{-T} \, \mu \, A^{-1}</math>,
लिंडेबर्ग (2013, 2015)<ref name=Lin15JMIV/><ref name=Lin13JMIV/>हेस्सियन मैट्रिक्स से संबंधित तरीकों से चार फीचर ताकत उपायों को परिभाषित करने का प्रस्ताव किया गया है क्योंकि हैरिस और शि-एंड-टोमासी ऑपरेटरों को संरचना टेंसर (दूसरे-पल मैट्रिक्स) से परिभाषित किया गया है।
लिंडेबर्ग (2013, 2015)<ref name=Lin15JMIV/><ref name=Lin13JMIV/>हेस्सियन आव्यूह से संबंधित तरीकों से चार फीचर ताकत उपायों को परिभाषित करने का प्रस्ताव किया गया है क्योंकि हैरिस और शि-एंड-टोमासी ऑपरेटरों को संरचना टेंसर (दूसरे-पल मैट्रिक्स) से परिभाषित किया गया है।
विशेष रूप से, उन्होंने निम्नलिखित अहस्ताक्षरित और हस्ताक्षरित हेस्सियन सुविधा शक्ति उपायों को परिभाषित किया:
विशेष रूप से, उन्होंने निम्नलिखित अहस्ताक्षरित और हस्ताक्षरित हेस्सियन सुविधा शक्ति उपायों को परिभाषित किया:
* अहस्ताक्षरित हेसियन सुविधा शक्ति माप I:
* अहस्ताक्षरित हेसियन सुविधा शक्ति माप I:
Line 242: Line 249:
     \end{cases}
     \end{cases}
</math>
</math>
कहाँ <math>\operatorname{trace} H L = L_{xx} + L_{yy}</math> और <math>\det H L = L_{xx} L_{yy} - L_{xy}^2</math> हेसियन मैट्रिक्स के ट्रेस और निर्धारक को निरूपित करें <math>H L</math> स्केल-स्पेस प्रतिनिधित्व का <math>L</math> किसी भी पैमाने पर <math>t</math>,
यहाँ <math>\operatorname{trace} H L = L_{xx} + L_{yy}</math> और <math>\det H L = L_{xx} L_{yy} - L_{xy}^2</math> हेसियन आव्यूह के ट्रेस और निर्धारक को निरूपित करें <math>H L</math> स्केल-स्पेस प्रतिनिधित्व का <math>L</math> किसी भी पैमाने पर <math>t</math>,
 
जबकि
जबकि
:<math>\lambda_1(H L) = L_{pp} = \frac{1}{2} \left( L_{xx}+L_{yy} - \sqrt{(L_{xx}-L_{yy})^2 + 4 L_{xy}^2} \right)</math>
:<math>\lambda_1(H L) = L_{pp} = \frac{1}{2} \left( L_{xx}+L_{yy} - \sqrt{(L_{xx}-L_{yy})^2 + 4 L_{xy}^2} \right)</math>
:<math>\lambda_2(H L) = L_{qq} = \frac{1}{2} \left( L_{xx}+L_{yy} + \sqrt{(L_{xx}-L_{yy})^2 + 4 L_{xy}^2} \right)</math> हेसियन मैट्रिक्स के eigenvalues ​​​​को निरूपित करें।<ref>{{cite journal |doi=10.1023/A:1008097225773 |author=Lindeberg, T. |title=स्वचालित स्केल चयन के साथ किनारे का पता लगाना और रिज का पता लगाना|journal=International Journal of Computer Vision |volume=30 |issue=2 |pages=117–154 |year=1998 |s2cid=35328443 |url=http://kth.diva-portal.org/smash/record.jsf?pid=diva2%3A452310&dswid=-7063}}</ref>
:<math>\lambda_2(H L) = L_{qq} = \frac{1}{2} \left( L_{xx}+L_{yy} + \sqrt{(L_{xx}-L_{yy})^2 + 4 L_{xy}^2} \right)</math> हेसियन आव्यूह के आइगेनमूल्य ​​​​को निरूपित करें।<ref>{{cite journal |doi=10.1023/A:1008097225773 |author=Lindeberg, T. |title=स्वचालित स्केल चयन के साथ किनारे का पता लगाना और रिज का पता लगाना|journal=International Journal of Computer Vision |volume=30 |issue=2 |pages=117–154 |year=1998 |s2cid=35328443 |url=http://kth.diva-portal.org/smash/record.jsf?pid=diva2%3A452310&dswid=-7063}}</ref>
अहस्ताक्षरित हेसियन सुविधा शक्ति माप <math>D_{1,\mathrm{norm}} L</math> सकारात्मक मूल्यों द्वारा स्थानीय चरम सीमा पर प्रतिक्रिया करता है और काठी बिंदुओं के प्रति संवेदनशील नहीं है, जबकि हस्ताक्षरित हेसियन सुविधा शक्ति मापती है <math>\tilde{D}_{1,\mathrm{norm}} L</math> नकारात्मक मूल्यों द्वारा सैडल बिंदुओं पर अतिरिक्त प्रतिक्रिया करता है। अहस्ताक्षरित हेसियन सुविधा शक्ति माप <math>D_{2,\mathrm{norm}} L</math> सिग्नल की स्थानीय ध्रुवीयता के प्रति असंवेदनशील है, जबकि हस्ताक्षरित हेसियन सुविधा शक्ति मापती है <math>\tilde{D}_{2,\mathrm{norm}} L</math> सिग्नल की स्थानीय ध्रुवता पर उसके आउटपुट के संकेत द्वारा प्रतिक्रिया करता है।
अहस्ताक्षरित हेसियन सुविधा शक्ति माप <math>D_{1,\mathrm{norm}} L</math> धनात्मक मूल्यों द्वारा स्थानीय चरम सीमा पर प्रतिक्रिया करता है और काठी बिंदुओं के प्रति संवेदनशील नहीं है, जबकि हस्ताक्षरित हेसियन सुविधा शक्ति मापती है <math>\tilde{D}_{1,\mathrm{norm}} L</math> नकारात्मक मूल्यों द्वारा सैडल बिंदुओं पर अतिरिक्त प्रतिक्रिया करता है। अहस्ताक्षरित हेसियन सुविधा शक्ति माप <math>D_{2,\mathrm{norm}} L</math> सिग्नल की स्थानीय ध्रुवीयता के प्रति असंवेदनशील है, जबकि हस्ताक्षरित हेसियन सुविधा शक्ति मापती है <math>\tilde{D}_{2,\mathrm{norm}} L</math> सिग्नल की स्थानीय ध्रुवता पर उसके आउटपुट के संकेत द्वारा प्रतिक्रिया करता है।


लिंडेबर्ग में (2015)<ref name=Lin15JMIV/>इन चार विभेदक संस्थाओं को स्केल-स्पेस एक्स्ट्रेमा डिटेक्शन के आधार पर स्थानीय पैमाने के चयन के साथ जोड़ा गया था
लिंडेबर्ग में (2015)<ref name=Lin15JMIV/>इन चार विभेदक संस्थाओं को स्केल-स्पेस एक्स्ट्रेमा डिटेक्शन के आधार पर स्थानीय पैमाने के चयन के साथ जोड़ा गया था
:<math>(\hat{x}, \hat{y}; \hat{t}) = \operatorname{argminmaxlocal}_{(x, y; t)} (D_\mathrm{norm} L)(x, y; t)</math>
:<math>(\hat{x}, \hat{y}; \hat{t}) = \operatorname{argminmaxlocal}_{(x, y; t)} (D_\mathrm{norm} L)(x, y; t)</math>
या स्केल लिंकिंग। इसके अलावा, हस्ताक्षरित और अहस्ताक्षरित हेसियन में ताकत के उपाय हैं <math>D_{2,\mathrm{norm}} L</math> और <math>\tilde{D}_{2,\mathrm{norm}} L</math> पूरक थ्रेशोल्डिंग के साथ जोड़ा गया था <math>D_{1,\mathrm{norm}} L > 0</math>.
या स्केल लिंकिंग। इसके अतिरिक्त , हस्ताक्षरित और अहस्ताक्षरित हेसियन में ताकत के उपाय हैं <math>D_{2,\mathrm{norm}} L</math> और <math>\tilde{D}_{2,\mathrm{norm}} L</math> पूरक थ्रेशोल्डिंग के साथ जोड़ा गया था <math>D_{1,\mathrm{norm}} L > 0</math>.


12 पोस्टर वाले पोस्टर डेटासेट पर स्केलिंग ट्रांसफॉर्मेशन के तहत छवि मिलान पर प्रयोगों द्वारा, 6 के स्केलिंग कारक तक स्केलिंग ट्रांसफॉर्मेशन पर मल्टी-व्यू मिलान और स्थानीय छवि डिस्क्रिप्टर के साथ 45 डिग्री के तिरछे कोण तक दिशा भिन्नता को देखने के लिए। स्केल-इनवेरिएंट फीचर में शुद्ध छवि डिस्क्रिप्टर छवि पिरामिड या मूल एसयूआरएफ से परिभाषित मूल एसआईएफटी के बजाय गाऊसी व्युत्पन्न ऑपरेटरों (गॉस-एसआईएफटी और गॉस-एसयूआरएफ) के संदर्भ में छवि माप के लिए मजबूत फीचर ऑपरेटरों को बदलते हैं और तेज करते हैं। हार वेवलेट्स से, यह दिखाया गया कि अहस्ताक्षरित हेसियन सुविधा शक्ति माप के आधार पर स्केल-स्पेस ब्याज बिंदु का पता लगाना <math>D_{1,\mathrm{norm}} L</math> हेसियन के निर्धारक से प्राप्त स्केल-स्पेस ब्याज बिंदुओं की तुलना में सर्वोत्तम प्रदर्शन और बेहतर प्रदर्शन की अनुमति दी गई <math>\det H_\mathrm{norm} L = t^2 \left(L_{xx} L_{yy} - L_{xy}^2\right)</math>. दोनों अहस्ताक्षरित हेस्सियन सुविधा शक्ति माप <math>D_{1,\mathrm{norm}} L</math>, हस्ताक्षरित हेसियन सुविधा शक्ति माप <math>\tilde{D}_{1,norm} L</math> और हेस्सियन का निर्धारक <math>\det H_{norm} L</math> गॉसियन के लाप्लासियन की तुलना में बेहतर प्रदर्शन की अनुमति दी गई <math>\nabla_\mathrm{norm}^2 L = t \, (L_{xx} + L_{yy})</math>. जब स्केल लिंकिंग और पूरक थ्रेशोल्डिंग के साथ जोड़ा जाता है <math>D_{1,\mathrm{norm}} L > 0</math>, हस्ताक्षरित हेसियन सुविधा शक्ति माप <math>\tilde{D}_{2,\mathrm{norm}} L</math> इसके अतिरिक्त गॉसियन के लाप्लासियन की तुलना में बेहतर प्रदर्शन की अनुमति दी गई <math>\nabla_{\mathrm{norm}}^2 L</math>.
12 पोस्टर वाले पोस्टर डेटासेट पर स्केलिंग ट्रांसफॉर्मेशन के अनुसार छवि मिलान पर प्रयोगों द्वारा, 6 के स्केलिंग कारक तक स्केलिंग ट्रांसफॉर्मेशन पर मल्टी-व्यू मिलान और स्थानीय छवि डिस्क्रिप्टर के साथ 45 डिग्री के तिरछे कोण तक दिशा भिन्नता को देखने के लिए। स्केल-इनवेरिएंट फीचर में शुद्ध छवि डिस्क्रिप्टर छवि पिरामिड या मूल एसयूआरएफ से परिभाषित मूल एसआईएफटी के अतिरिक्त गाऊसी व्युत्पन्न ऑपरेटरों (गॉस-एसआईएफटी और गॉस-एसयूआरएफ) के संदर्भ में छवि माप के लिए मजबूत फीचर ऑपरेटरों को बदलते हैं और तेज करते हैं। हार वेवलेट्स से, यह दिखाया गया कि अहस्ताक्षरित हेसियन सुविधा शक्ति माप के आधार पर स्केल-स्पेस ब्याज बिंदु का पता लगाना <math>D_{1,\mathrm{norm}} L</math> हेसियन के निर्धारक से प्राप्त स्केल-स्पेस ब्याज बिंदुओं की समानता में सर्वोत्तम प्रदर्शन और उत्तम प्रदर्शन की अनुमति दी गई <math>\det H_\mathrm{norm} L = t^2 \left(L_{xx} L_{yy} - L_{xy}^2\right)</math>. दोनों अहस्ताक्षरित हेस्सियन सुविधा शक्ति माप <math>D_{1,\mathrm{norm}} L</math>, हस्ताक्षरित हेसियन सुविधा शक्ति माप <math>\tilde{D}_{1,norm} L</math> और हेस्सियन का निर्धारक <math>\det H_{norm} L</math> गॉसियन के लाप्लासियन की समानता में उत्तम प्रदर्शन की अनुमति दी गई <math>\nabla_\mathrm{norm}^2 L = t \, (L_{xx} + L_{yy})</math>. जब स्केल लिंकिंग और पूरक थ्रेशोल्डिंग के साथ जोड़ा जाता है <math>D_{1,\mathrm{norm}} L > 0</math>, हस्ताक्षरित हेसियन सुविधा शक्ति माप <math>\tilde{D}_{2,\mathrm{norm}} L</math> इसके अतिरिक्त गॉसियन के लाप्लासियन की समानता में उत्तम प्रदर्शन की अनुमति दी गई <math>\nabla_{\mathrm{norm}}^2 L</math>.


इसके अलावा, यह दिखाया गया कि हेसियन मैट्रिक्स से परिभाषित ये सभी विभेदक स्केल-स्पेस ब्याज बिंदु डिटेक्टर संरचना से परिभाषित हैरिस और शि-एंड-टोमासी ऑपरेटरों की तुलना में बड़ी संख्या में ब्याज बिंदुओं का पता लगाने और बेहतर मिलान प्रदर्शन की अनुमति देते हैं। टेंसर (दूसरे क्षण का मैट्रिक्स)।
इसके अतिरिक्त , यह दिखाया गया कि हेसियन आव्यूह से परिभाषित ये सभी विभेदक स्केल-स्पेस ब्याज बिंदु डिटेक्टर संरचना से परिभाषित हैरिस और शि-एंड-टोमासी ऑपरेटरों की समानता में बड़ी संख्या में ब्याज बिंदुओं का पता लगाने और उत्तम मिलान प्रदर्शन की अनुमति देते हैं। टेंसर (दूसरे क्षण का मैट्रिक्स)।


इन चार हेसियन फीचर शक्ति उपायों और स्केल-स्पेस ब्याज बिंदुओं का पता लगाने के लिए अन्य अंतर इकाइयों के स्केल चयन गुणों का सैद्धांतिक विश्लेषण, जिसमें गॉसियन के लाप्लासियन और हेसियन के निर्धारक शामिल हैं, लिंडेबर्ग (2013) में दिया गया है।<ref name=Lin13JMIV/>और लिंडेबर्ग (2015) में उनके एफ़िन परिवर्तन गुणों के साथ-साथ प्रयोगात्मक गुणों का विश्लेषण।<ref name=Lin15JMIV/>
इन चार हेसियन फीचर शक्ति उपायों और स्केल-स्पेस ब्याज बिंदुओं का पता लगाने के लिए अन्य अंतर इकाइयों के स्केल चयन गुणों का सैद्धांतिक विश्लेषण, जिसमें गॉसियन के लाप्लासियन और हेसियन के निर्धारक सम्मलित हैं, लिंडेबर्ग (2013) में दिया गया है।<ref name=Lin13JMIV/>और लिंडेबर्ग (2015) में उनके एफ़िन परिवर्तन गुणों के साथ-साथ प्रयोगात्मक गुणों का विश्लेषण होता है।<ref name=Lin15JMIV/>
== एफ़िन-अनुकूलित ब्याज बिंदु ऑपरेटर ==
== एफ़िन-अनुकूलित ब्याज बिंदु ऑपरेटर ==


स्वचालित स्केल चयन के साथ मल्टी-स्केल हैरिस ऑपरेटर से प्राप्त ब्याज बिंदु स्थानिक डोमेन में अनुवाद, रोटेशन और समान पुनर्स्केलिंग के लिए अपरिवर्तनीय हैं। हालाँकि, जो छवियाँ कंप्यूटर विज़न सिस्टम के लिए इनपुट का निर्माण करती हैं, वे भी परिप्रेक्ष्य विकृतियों के अधीन हैं। रुचि बिंदु ऑपरेटर प्राप्त करने के लिए जो परिप्रेक्ष्य परिवर्तनों के लिए अधिक मजबूत है, प्राकृतिक दृष्टिकोण फीचर डिटेक्टर तैयार करना है जो कि परिवर्तनों को प्रभावित करने के लिए अपरिवर्तनीय है। व्यवहार में, एफ़िन अपरिवर्तनीय रुचि बिंदुओं को [[एफ़िन आकार अनुकूलन]] लागू करके प्राप्त किया जा सकता है जहां स्मूथिंग कर्नेल का आकार रुचि बिंदु के आसपास स्थानीय छवि संरचना से मेल खाने के लिए पुनरावृत्त रूप से विकृत होता है या समकक्ष रूप से स्थानीय छवि पैच पुनरावृत्त रूप से विकृत होता है जबकि स्मूथिंग का आकार होता है कर्नेल घूर्णी रूप से सममित रहता है (लिंडेबर्ग 1993, 2008; लिंडेबर्ग और गार्डिंग 1997; मिकोलाजस्क और श्मिट 2004)।<ref name="lindeberg94book"/><ref name=LinGar97-IVC>[http://kth.diva-portal.org/smash/record.jsf?pid=diva2%3A472972&dswid=4333 T. Lindeberg and J. Garding "Shape-adapted smoothing in estimation of 3-D depth cues from affine distortions of local 2-D structure". Image and Vision Computing 15 (6): pp 415–434, 1997.]</ref><ref name="lindeberg08enc"/><ref name="schmid"/>इसलिए, आमतौर पर उपयोग किए जाने वाले मल्टी-स्केल हैरिस ऑपरेटर के अलावा, इस आलेख में सूचीबद्ध अन्य कोने डिटेक्टरों के साथ-साथ ब्लॉब डिटेक्शन जैसे गॉसियन ऑपरेटर के लाप्लासियन/अंतर, हेसियन के निर्धारक, पर एफ़िन आकार अनुकूलन लागू किया जा सकता है।<ref name="lindeberg08enc"/>और हेस्सियन-लाप्लास ऑपरेटर।
स्वचालित स्केल चयन के साथ मल्टी-स्केल हैरिस ऑपरेटर से प्राप्त ब्याज बिंदु स्थानिक डोमेन में अनुवाद, रोटेशन और समान पुनर्स्केलिंग के लिए अपरिवर्तनीय हैं। चूँकि , जो छवियाँ कंप्यूटर विज़न प्रणाली के लिए इनपुट का निर्माण करती हैं, वे भी परिप्रेक्ष्य विकृतियों के अधीन हैं। रुचि बिंदु ऑपरेटर प्राप्त करने के लिए जो परिप्रेक्ष्य परिवर्तनों के लिए अधिक मजबूत है, प्राकृतिक दृष्टिकोण फीचर डिटेक्टर तैयार करना है जो कि परिवर्तनों को प्रभावित करने के लिए अपरिवर्तनीय है। व्यवहार में, एफ़िन अपरिवर्तनीय रुचि बिंदुओं को [[एफ़िन आकार अनुकूलन]] लागू करके प्राप्त किया जा सकता है जहां स्मूथिंग कर्नेल का आकार रुचि बिंदु के आसपास स्थानीय छवि संरचना से मेल खाने के लिए पुनरावृत्त रूप से विकृत होता है या समकक्ष रूप से स्थानीय छवि पैच पुनरावृत्त रूप से विकृत होता है जबकि स्मूथिंग का आकार होता है कर्नेल घूर्णी रूप से सममित रहता है (लिंडेबर्ग 1993, 2008; लिंडेबर्ग और गार्डिंग 1997; मिकोलाजस्क और श्मिट 2004)।<ref name="lindeberg94book"/><ref name=LinGar97-IVC>[http://kth.diva-portal.org/smash/record.jsf?pid=diva2%3A472972&dswid=4333 T. Lindeberg and J. Garding "Shape-adapted smoothing in estimation of 3-D depth cues from affine distortions of local 2-D structure". Image and Vision Computing 15 (6): pp 415–434, 1997.]</ref><ref name="lindeberg08enc"/><ref name="schmid"/>इसलिए, सामान्यतः उपयोग किए जाने वाले मल्टी-स्केल हैरिस ऑपरेटर के अतिरिक्त , इस आलेख में सूचीबद्ध अन्य कोने डिटेक्टरों के साथ-साथ ब्लॉब डिटेक्शन जैसे गॉसियन ऑपरेटर के लाप्लासियन/अंतर, हेसियन के निर्धारक, पर एफ़िन आकार अनुकूलन लागू किया जा सकता है।<ref name="lindeberg08enc"/>और हेस्सियन-लाप्लास ऑपरेटर होता है।


== वैंग और ब्रैडी कॉर्नर डिटेक्शन एल्गोरिदम ==
== वैंग और ब्रैडी कॉर्नर डिटेक्शन एल्गोरिदम ==


वैंग और ब्रैडी<ref name="wangbrady"/>डिटेक्टर छवि को सतह मानता है, और उन स्थानों की तलाश करता है जहां छवि किनारे पर बड़ी वक्रता होती है। दूसरे शब्दों में, एल्गोरिदम उन स्थानों की तलाश करता है जहां किनारा तेजी से दिशा बदलता है। कोने का स्कोर, <math>C</math>, द्वारा दिया गया है:
वैंग और ब्रैडी<ref name="wangbrady"/>डिटेक्टर छवि को सतह मानता है, और उन स्थानों की अविष्कार करता है जहां छवि किनारे पर बड़ी वक्रता होती है। दूसरे शब्दों में, एल्गोरिदम उन स्थानों की अविष्कार करता है जहां किनारा तेजी से दिशा बदलता है। कोने का स्कोर, <math>C</math>, द्वारा दिया गया है:


:<math>
:<math>
C = \left(\frac{\delta^2 I}{\delta \mathbf{t}^2}\right)^2 - c|\nabla I|^2,
C = \left(\frac{\delta^2 I}{\delta \mathbf{t}^2}\right)^2 - c|\nabla I|^2,
</math>
</math>
कहाँ <math>\bf{t}</math> ग्रेडिएंट के लंबवत इकाई वेक्टर है, और <math>c</math> यह निर्धारित करता है कि डिटेक्टर कितना एज-फ़ोबिक है। लेखक यह भी ध्यान देते हैं कि शोर को कम करने के लिए स्मूथिंग (गॉसियन का सुझाव दिया गया है) की आवश्यकता है।
यहाँ <math>\bf{t}</math> ग्रेडिएंट के लंबवत इकाई वेक्टर है, और <math>c</math> यह निर्धारित करता है कि डिटेक्टर कितना एज-फ़ोबिक है। लेखक यह भी ध्यान देते हैं कि शोर को कम करने के लिए स्मूथिंग (गॉसियन का सुझाव दिया गया है) की आवश्यकता है।


स्मूथिंग भी कोनों के विस्थापन का कारण बनती है, इसलिए लेखक 90 डिग्री के कोने के विस्थापन के लिए अभिव्यक्ति प्राप्त करते हैं, और इसे पहचाने गए कोनों पर सुधार कारक के रूप में लागू करते हैं।
स्मूथिंग भी कोनों के विस्थापन का कारण बनती है, इसलिए लेखक 90 डिग्री के कोने के विस्थापन के लिए अभिव्यक्ति प्राप्त करते हैं, और इसे पहचाने गए कोनों पर सुधार कारक के रूप में लागू करते हैं।
Line 286: Line 294:
  | assign1 = Secr Defence
  | assign1 = Secr Defence
}}</ref>
}}</ref>
सुविधा का पता लगाने के लिए, सुसान परीक्षण किए जाने वाले पिक्सेल (नाभिक) के ऊपर गोलाकार मास्क लगाता है। मुखौटे का क्षेत्र है <math>M</math>, और इस मास्क में पिक्सेल का प्रतिनिधित्व किया जाता है <math>\vec{m} \in M</math>. केन्द्रक पर है <math>\vec{m}_0</math>. तुलना फ़ंक्शन का उपयोग करके प्रत्येक पिक्सेल की तुलना नाभिक से की जाती है:
 
सुविधा का पता लगाने के लिए, सुसान परीक्षण किए जाने वाले पिक्सेल (नाभिक) के ऊपर गोलाकार मास्क लगाता है। मुखौटे का क्षेत्र है <math>M</math>, और इस मास्क में पिक्सेल का प्रतिनिधित्व किया जाता है <math>\vec{m} \in M</math>. केन्द्रक पर है <math>\vec{m}_0</math>. समानता फ़ंक्शन का उपयोग करके प्रत्येक पिक्सेल की समानता नाभिक से की जाती है:


:<math>
:<math>
c(\vec{m}) = e^{-\left(\frac{I(\vec{m}) - I(\vec{m}_0)}{t}\right)^6}
c(\vec{m}) = e^{-\left(\frac{I(\vec{m}) - I(\vec{m}_0)}{t}\right)^6}
</math>
</math>
कहाँ <math>t</math> चमक अंतर सीमा है,<ref>{{Cite web | url=https://users.fmrib.ox.ac.uk/~steve/susan/susan/node6.html#c_equation | title=The SUSAN Edge Detector in Detail}}</ref> <math>I</math> पिक्सेल की चमक है और घातांक की शक्ति अनुभवजन्य रूप से निर्धारित की गई है। इस फ़ंक्शन में चिकने आयताकार फ़ंक्शन | टॉप-हैट या आयताकार फ़ंक्शन की उपस्थिति होती है। सुसान का क्षेत्रफल इस प्रकार दिया गया है:
यहाँ <math>t</math> चमक अंतर सीमा है,<ref>{{Cite web | url=https://users.fmrib.ox.ac.uk/~steve/susan/susan/node6.html#c_equation | title=The SUSAN Edge Detector in Detail}}</ref> <math>I</math> पिक्सेल की चमक है और घातांक की शक्ति अनुभवजन्य रूप से निर्धारित की गई है। इस फ़ंक्शन में चिकने आयताकार फ़ंक्शन | टॉप-हैट या आयताकार फ़ंक्शन की उपस्थिति होती है। सुसान का क्षेत्रफल इस प्रकार दिया गया है:


:<math>
:<math>
n(M) = \sum_{\vec{m}\in M} c(\vec{m})
n(M) = \sum_{\vec{m}\in M} c(\vec{m})
</math>
</math>
अगर <math>c</math> तो, आयताकार फलन है <math>n</math> मास्क में पिक्सेल की संख्या है जो अंदर हैं <math>t</math> नाभिक का. सुसान ऑपरेटर की प्रतिक्रिया इस प्रकार दी गई है:
यदि <math>c</math> तो, आयताकार फलन है <math>n</math> मास्क में पिक्सेल की संख्या है जो अंदर हैं <math>t</math> नाभिक का. सुसान ऑपरेटर की प्रतिक्रिया इस प्रकार दी गई है:


:<math>
:<math>
Line 304: Line 313:
           \end{cases}
           \end{cases}
</math>
</math>
कहाँ <math>g</math> को 'ज्यामितीय सीमा' नाम दिया गया है। दूसरे शब्दों में, SUSAN ऑपरेटर का स्कोर केवल तभी सकारात्मक होता है जब क्षेत्र काफी छोटा हो। स्थानीय स्तर पर सबसे छोटा SUSAN गैर-अधिकतम दमन का उपयोग करके पाया जा सकता है, और यह संपूर्ण SUSAN ऑपरेटर है।
यहाँ <math>g</math> को 'ज्यामितीय सीमा' नाम दिया गया है। दूसरे शब्दों में, सुसान ऑपरेटर का स्कोर केवल तभी धनात्मक होता है जब क्षेत्र अत्यधिक छोटा हो। स्थानीय स्तर पर सबसे छोटा सुसान गैर-अधिकतम दमन का उपयोग करके पाया जा सकता है, और यह संपूर्ण सुसान ऑपरेटर है।


मूल्य <math>t</math> यह निर्धारित करता है कि यूनीवैल्यू सेगमेंट का हिस्सा माने जाने से पहले नाभिक के समान बिंदु कितने समान होने चाहिए। का मान है <math>g</math> यूनीवैल्यू सेगमेंट का न्यूनतम आकार निर्धारित करता है। अगर <math>g</math> काफी बड़ा है, तो यह [[ किनारे का पता लगाना |किनारे का पता लगाना]] बन जाता है।
मूल्य <math>t</math> यह निर्धारित करता है कि यूनीवैल्यू सेगमेंट का भाग माने जाने से पहले नाभिक के समान बिंदु कितने समान होने चाहिए। का मान है <math>g</math> यूनीवैल्यू सेगमेंट का न्यूनतम आकार निर्धारित करता है। यदि <math>g</math> अत्यधिक बड़ा है, तो यह [[ किनारे का पता लगाना |किनारे का पता लगाना]] बन जाता है।


कोने का पता लगाने के लिए, दो और चरणों का उपयोग किया जाता है। सबसे पहले सुसान का [[केन्द्रक]] पाया जाता है। उचित कोने में केन्द्रक नाभिक से दूर होगा। दूसरा चरण इस बात पर जोर देता है कि नाभिक से केन्द्रक के माध्यम से मास्क के किनारे तक की रेखा पर सभी बिंदु सुसान में हैं।
कोने का पता लगाने के लिए, दो और चरणों का उपयोग किया जाता है। सबसे पहले सुसान का [[केन्द्रक]] पाया जाता है। उचित कोने में केन्द्रक नाभिक से दूर होगा। दूसरा चरण इस बात पर जोर देता है कि नाभिक से केन्द्रक के माध्यम से मास्क के किनारे तक की रेखा पर सभी बिंदु सुसान में हैं।
Line 312: Line 321:
==ट्रैजकोविक और हेडली कॉर्नर डिटेक्टर==
==ट्रैजकोविक और हेडली कॉर्नर डिटेक्टर==


सुसान के समान ही यह डिटेक्टर<ref name="hedley"/>आस-पास के पिक्सेल की जांच करके सीधे परीक्षण करता है कि पिक्सेल के नीचे का पैच स्व-समान है या नहीं। <math>\vec{c}</math> विचार किया जाने वाला पिक्सेल है, और <math>\vec{p} \in P</math> वृत्त पर बिंदु है <math>P</math> आसपास केंद्रित <math>\vec{c}</math>. बिंदु <math>\vec{p}'</math> के विपरीत बिंदु है <math>\vec{p}</math> व्यास के साथ.
सुसान के प्रकार की विधि , यह डिटेक्टर<ref name="hedley"/>सीधे यह जांचता है कि क्या पिक्सेल के नीचे पैच स्व-समान है, निकटतम पिक्सेलों की जांच करके। <math>\vec{c}</math> विचार किए जाने वाला पिक्सेल है, और <math>\vec{p} \in P</math> पृष्ठ पर बिंदु है जो बिंदु <math>\vec{c}</math> के चारों ओर केंद्रित वृत्त <math>P</math>. के चारों ओर रहता है। बिंदु <math>\vec{p}'</math> विषमता वाले सिरे के लिए <math>\vec{p}</math> के विपरीत बिंदु है।


प्रतिक्रिया फ़ंक्शन को इस प्रकार परिभाषित किया गया है:
प्रतिक्रिया फ़ंक्शन को इस प्रकार परिभाषित किया गया है:
Line 319: Line 328:
  r(\vec{c}) = \min_{\vec{p} \in P} \left(\left(I(\vec{p}) - I(\vec{c})\right)^2 + \left(I(\vec{p}') - I(\vec{c})\right) ^2\right)
  r(\vec{c}) = \min_{\vec{p} \in P} \left(\left(I(\vec{p}) - I(\vec{c})\right)^2 + \left(I(\vec{p}') - I(\vec{c})\right) ^2\right)
</math>
</math>
यह तब बड़ा होगा जब ऐसी कोई दिशा नहीं होगी जिसमें केंद्र पिक्सेल व्यास के साथ दो निकटवर्ती पिक्सेल के समान हो। <math>P</math> पृथक वृत्त ( [[मध्यबिंदु वृत्त एल्गोरिथ्म]]) है, इसलिए अधिक आइसोट्रोपिक प्रतिक्रिया देने के लिए मध्यवर्ती व्यास के लिए [[प्रक्षेप]] का उपयोग किया जाता है। चूँकि कोई भी गणना ऊपरी सीमा देती है <math>\min</math>, क्षैतिज और ऊर्ध्वाधर दिशाओं को पहले यह देखने के लिए जांचा जाता है कि क्या यह पूरी गणना के साथ आगे बढ़ने लायक है <math>c</math>.
यह तब बड़ा होगा जब ऐसी कोई दिशा नहीं होगी जिसमें केंद्र पिक्सेल व्यास के साथ दो निकटवर्ती पिक्सेल के समान हो। <math>P</math> पृथक वृत्त ( [[मध्यबिंदु वृत्त एल्गोरिथ्म]]) है, इसलिए अधिक आइसोट्रोपिक प्रतिक्रिया देने के लिए मध्यवर्ती व्यास के लिए [[प्रक्षेप]] का उपयोग किया जाता है। चूँकि कोई भी गणना <math>\min</math> के ऊपरी सीमा दी जाती है, इसलिए पहले यह देखा जाता है कि क्या सम्पूर्ण <math>c</math> की गणना पूरी करने में लायक है, इसके लिए संयोजनात्मक और लंबवत दिशाओं की जांच की जाती है।


== एएसटी-आधारित फीचर डिटेक्टर ==
== एएसटी-आधारित फीचर डिटेक्टर ==


एएसटी त्वरित खंड परीक्षण का संक्षिप्त रूप है। यह परीक्षण सुसान कॉर्नर मानदंड का आरामदायक संस्करण है। वृत्ताकार डिस्क का मूल्यांकन करने के बजाय, त्रिज्या के मध्यबिंदु वृत्त एल्गोरिथ्म में केवल पिक्सेल <math>r</math> उम्मीदवार के चारों ओर बिंदु पर विचार किया जाता है। अगर <math>n</math> सभी सन्निहित पिक्सेल कम से कम नाभिक से अधिक चमकीले होते हैं <math>t</math> अथवा सभी नाभिक से अधिक गहरे <math>t</math>, तो नाभिक के नीचे के पिक्सेल को विशेषता माना जाता है। बताया गया है कि यह परीक्षण बहुत स्थिर सुविधाएँ उत्पन्न करता है।<ref name="fast"/>जिस क्रम में पिक्सेल का परीक्षण किया जाता है उसका चुनाव तथाकथित [[बीस प्रश्न]] है। इस समस्या के लिए लघु निर्णय वृक्षों के निर्माण से सबसे अधिक कम्प्यूटेशनल रूप से कुशल फीचर डिटेक्टर उपलब्ध होते हैं।
इस प्रकार एएसटी त्वरित खंड परीक्षण का संक्षिप्त रूप है। यह परीक्षण सुसान कॉर्नर मानदंड का संविहित संस्करण है। परीक्षण में, गोलाकार वट की जगह, केवल उम्मीदवार बिंदु के चारों ओर <math>r</math> के ब्रेजेनहम वृत्त में पिक्सेल को मान्यता दी जाती है। यदि <math>n</math> संचित पिक्सेल सभी न्यूक्लियस से कम से कम <math>t</math> या सभी न्यूक्लियस से अधिक के रूप में धुंधले हों, तो न्यूक्लियस के नीचे पिक्सेल को विशेषता माना जाता है। इस परीक्षण की सुचारू रूप से स्थिर विशेषताएं उत्पन्न की जाती हैं।<ref name="fast"/>जिस क्रम में पिक्सेल का परीक्षण किया जाता है उसका चुनाव तथाकथित [[बीस प्रश्न]] है। इस समस्या के लिए छोटे निर्णय पेड़ बनाने से सबसे अधिक गणनात्मक रूप से दक्ष विशेषता डिटेक्टर प्राप्त होते हैं।


एएसटी पर आधारित पहला कॉर्नर डिटेक्शन एल्गोरिदम फास्ट (त्वरित खंड परीक्षण की विशेषताएं) है।<ref name="fast"/>यद्यपि <math>r</math> सैद्धांतिक रूप से कोई भी मूल्य ले सकता है, FAST केवल 3 के मान का उपयोग करता है (16 पिक्सेल परिधि के वृत्त के अनुरूप), और परीक्षण दिखाते हैं कि सबसे अच्छे परिणाम प्राप्त होते हैं <math>n</math> 9 होना। का यह मान <math>n</math> सबसे निचला है जिस पर किनारों का पता नहीं चलता है। जिस क्रम में पिक्सेल का परीक्षण किया जाता है वह छवियों के प्रशिक्षण सेट से ID3 एल्गोरिदम द्वारा निर्धारित किया जाता है। भ्रामक रूप से, डिटेक्टर का नाम कुछ हद तक ट्रैजकोविक और हेडली के डिटेक्टर का वर्णन करने वाले पेपर के नाम के समान है।
इस प्रकार एएसटी पर आधारित पहला कॉर्नर डिटेक्शन एल्गोरिदम फास्ट (एकीकृत सेगमेंट परीक्षण से विशेषताएं) है।<ref name="fast"/>यद्यपि, सिद्धांत में <math>r</math> किसी भी मान को ले सकता है, FAST केवल 3 का मान (16 पिक्सेल परिधि का वृत्त के समान) का उपयोग करता है, और परीक्षण से पता चलता है कि सबसे अच्छा परिणाम <math>n</math> के साथ प्राप्त किया जाता है। यह मान <math>n</math> वह सबसे निम्न मान है जिस पर किनारों का पता नहीं चलता है। पिक्सेलों की परीक्षा की क्रमबद्धता प्रशिक्षण सेट से ID3 एल्गोरिदम द्वारा निर्धारित की जाती है। संदिग्धतापूर्ण रूप से, इस डिटेक्टर का नाम प्रकाशित करने वाले पेपर के नाम से कुछ समान होता है जो तराजकोविक और हेडली के डिटेक्टर का वर्णन करता है।


== डिटेक्टरों का स्वचालित संश्लेषण ==
== डिटेक्टरों का स्वचालित संश्लेषण ==


ट्रुजिलो और ओलाग्यू<ref name="geneticprogramming"/> ऐसी विधि पेश की गई जिसके द्वारा [[आनुवंशिक प्रोग्रामिंग]] का उपयोग स्वचालित रूप से छवि ऑपरेटरों को संश्लेषित करने के लिए किया जाता है जो रुचि बिंदुओं का पता लगा सकते हैं। टर्मिनल और फ़ंक्शन सेट में आदिम संचालन होते हैं जो पहले से प्रस्तावित कई मानव निर्मित डिज़ाइनों में आम हैं। [[फिटनेस कार्य]] दोहराव दर के माध्यम से प्रत्येक ऑपरेटर की स्थिरता को मापता है, और छवि तल पर ज्ञात बिंदुओं के समान फैलाव को बढ़ावा देता है। उत्तरोत्तर परिवर्तित छवियों के प्रशिक्षण और परीक्षण अनुक्रमों का उपयोग करके विकसित ऑपरेटरों के प्रदर्शन की प्रयोगात्मक रूप से पुष्टि की गई है। इसलिए, प्रस्तावित जीपी एल्गोरिदम को रुचि बिंदु पहचान की समस्या के लिए मानव-प्रतिस्पर्धी माना जाता है।
त्रुहिलो और ओलाग्यू<ref name="geneticprogramming"/> ने विधि प्रस्तुत की है जिसमें [[आनुवंशिक प्रोग्रामिंग]] का उपयोग करके स्वचालित रूप से छवि ऑपरेटर संश्लेषण किया जाता है जो रुचि बिंदुओं को पता लगा सकते हैं। टर्मिनल और फंक्शन सेट में प्राथमिक आपरेशन सम्मलित हैं जो पहले से प्रस्तावित मन-निर्मित डिज़ाइन में सामान्य रूप से पाए जाते हैं। [[फिटनेस कार्य|फिटनेस मापक]] प्रत्येक ऑपरेटर की स्थिरता को अवरुद्धता दरदी माध्यम से मापता है, और छवि तस्वीर प्लेन में पाये गए बिंदुओं के विन्यास में समान वितरण को बढ़ावा देता है। विकसित ऑपरेटर्स के प्रदर्शन को प्रयोगात्मक रूप से प्रमाणित किया गया है जब आदेशित और परीक्षण श्रृंखलाओं का उपयोग करके प्रगतिशील रूप से परिवर्तित छवियों के लिए किया गया है। इसलिए, प्रस्तावित जीपी एल्गोरिदम को रुचि बिंदु डिटेक्शन की समस्या के लिए मानव-प्रतियोगी माना जाता है।


== स्थानिक-अस्थायी रुचि बिंदु डिटेक्टर ==
== स्थानिक-अस्थायी रुचि बिंदु डिटेक्टर ==


लैपटेव और लिंडेबर्ग द्वारा हैरिस ऑपरेटर को अंतरिक्ष-समय तक विस्तारित किया गया है।<ref name="laplin03"/>होने देना <math>\mu</math> द्वारा परिभाषित अनुपात-अस्थायी दूसरे-पल मैट्रिक्स को निरूपित करें
इस प्रकार स्थान-समय में हैरिस ऑपरेटर को लपटेव और लिन्डबर्ग द्वारा स्थान-समय तक विस्तारित किया गया है।<ref name="laplin03"/>होने देना <math>\mu</math> स्थान-समय द्वितीय-मोमेंट आव्यूह को प्रतिनिधित्व करने वाला समकालिक संबंधी आव्यूह के द्वारा चित्रित करें


:<math>
:<math>
Line 349: Line 358:
\end{bmatrix}
\end{bmatrix}
</math>
</math>
फिर, उपयुक्त विकल्प के लिए <math>k < 1/27</math>,
फिर, <math>k < 1/27</math> उचित चयन के लिए है। स्थान-समय रुचि बिंदुओं की खोज निम्नलिखित स्थान-समय हैरिस माप के स्थान-समय अधिकतमों से होती है:
निम्नलिखित स्थानिक-अस्थायी हैरिस माप के स्थानिक-अस्थायी चरम सीमा से स्थानिक-अस्थायी रुचि बिंदुओं का पता लगाया जाता है:


:<math>
:<math>
H = \det(\mu) - \kappa \, \operatorname{trace}^2(\mu).
H = \det(\mu) - \kappa \, \operatorname{trace}^2(\mu).
</math>
</math>
हेसियन ऑपरेटर के निर्धारक को विलेम्स एट अल द्वारा संयुक्त अंतरिक्ष-समय तक बढ़ा दिया गया है <ref name="willems08"/>और लिंडेबर्ग,<ref name="lindeberg18"/>निम्नलिखित पैमाने-सामान्यीकृत विभेदक अभिव्यक्ति की ओर अग्रसर:
हेसियन ऑपरेटर का निर्णय संयोजन अंतर्दृष्टि जगत के विलेम्स एट अल <ref name="willems08"/>और लिंडेबर्ग,<ref name="lindeberg18"/> द्वारा स्थान-समय में किया गया है, जिससे निम्नलिखित स्केल-मानकीकरण विभेदक अभिव्यक्ति में प्रवेश हुआ है:


:<math>
:<math>
Line 363: Line 371:
       - L_{xx} L_{yt}^2 - L_{yy} L_{xt}^2 - L_{tt} L_{xy}^2 \right).
       - L_{xx} L_{yt}^2 - L_{yy} L_{xt}^2 - L_{tt} L_{xy}^2 \right).
</math>
</math>
विलेम्स एट अल के काम में,<ref name="willems08"/>के अनुरूप सरल अभिव्यक्ति <math>\gamma_s = 1</math> और <math>\gamma_{\tau} = 1</math> प्रयोग किया गया। लिंडेबर्ग में,<ref name="lindeberg18"/>ऐसा दिखाया गया <math>\gamma_s = 5/4</math> और <math>\gamma_{\tau} = 5/4</math> बेहतर पैमाने के चयन गुणों का तात्पर्य इस अर्थ में है कि चयनित पैमाने के स्तर स्थानिक सीमा के साथ स्थानिक-अस्थायी गाऊसी बूँद से प्राप्त होते हैं <math>s = s_0</math> और अस्थायी सीमा <math>\tau = \tau_0</math> अंतर अभिव्यक्ति के स्थानिक-अस्थायी स्केल-स्पेस एक्स्ट्रेमा का पता लगाकर किए गए स्केल चयन के साथ, ब्लॉब की स्थानिक सीमा और अस्थायी अवधि से पूरी तरह मेल खाएगा।
विलेम्स एट अल के काम में,<ref name="willems08"/> <math>\gamma_s = 1</math> और <math>\gamma_{\tau} = 1</math> के लिए सरल अभिव्यक्ति का प्रयोग किया गया था। लिंडेबर्ग में,<ref name="lindeberg18"/> दिखाया कि <math>\gamma_s = 5/4</math> और <math>\gamma_{\tau} = 5/4</math> स्थान-समय माप परम्पराओं के चयन के गुणवत्ता में उत्तम परिणाम देता है, जिसका अर्थ है कि स्थान-समय गौसियन ब्लॉब के साथ स्थानिक परिस्थिति <math>s = s_0</math> और कालिक परिस्थिति <math>\tau = \tau_0</math> के सही मेल करेंगे, जहां स्थानिक चयन स्थान-समय तकनीकी अधिकताओं को पकड़कर किया जाता है।


लाप्लासियन ऑपरेटर को लिंडेबर्ग द्वारा स्थानिक-अस्थायी वीडियो डेटा तक विस्तारित किया गया है,<ref name="lindeberg18"/>निम्नलिखित दो स्पैटियो-टेम्पोरल ऑपरेटरों के लिए अग्रणी, जो [[पार्श्व जीनिकुलेट नाभिक]] में नॉन-लैग्ड बनाम लैग्ड न्यूरॉन्स के ग्रहणशील क्षेत्रों के मॉडल का भी गठन करते हैं:
लाप्लासियन ऑपरेटर को लिंडेबर्ग द्वारा स्थान-समय वीडियो डेटा तक विस्तारित किया गया है, जिससे निम्नलिखित दो स्थान-समय ऑपरेटर भी उत्पन्न हुए हैं,<ref name="lindeberg18"/> जो [[पार्श्व जीनिकुलेट नाभिक]] में पिछले न्यूरॉन के बिना और लैग्ड न्यूरॉन के ग्रहक के मॉडल भी हैं:


:<math>
:<math>
Line 373: Line 381:
\partial_{tt,\mathrm{norm}} (\nabla_{(x,y),\mathrm{norm}}^2 L) = s^{\gamma_s} \tau^{\gamma_{\tau}} (L_{xxtt} + L_{yytt}).
\partial_{tt,\mathrm{norm}} (\nabla_{(x,y),\mathrm{norm}}^2 L) = s^{\gamma_s} \tau^{\gamma_{\tau}} (L_{xxtt} + L_{yytt}).
</math>
</math>
पहले ऑपरेटर के लिए, स्केल चयन गुणों का उपयोग करना आवश्यक है <math>\gamma_s = 1</math> और <math>\gamma_{\tau} = 1/2</math>, यदि हम चाहते हैं कि यह ऑपरेटर स्थानिक-अस्थायी पैमाने के स्तर पर स्थानिक-अस्थायी पैमाने पर अपना अधिकतम मूल्य मान ले, जो शुरुआत गाऊसी ब्लॉब की स्थानिक सीमा और अस्थायी अवधि को दर्शाता है। दूसरे ऑपरेटर के लिए, स्केल चयन गुणों का उपयोग करने की आवश्यकता है <math>\gamma_s = 1</math> और <math>\gamma_{\tau} = 3/4</math>, यदि हम चाहते हैं कि यह ऑपरेटर स्थानिक-अस्थायी पैमाने के स्तर पर स्थानिक सीमा और पलक झपकते गॉसियन ब्लॉब की लौकिक अवधि को दर्शाते हुए अपने अधिकतम मूल्य को मान ले।
पहले ऑपरेटर के लिए, स्केल चयन गुणों के लिए, <math>\gamma_s = 1</math> और <math>\gamma_{\tau} = 1/2</math>, का प्रयोग करना चाहिए, यदि हम चाहते हैं कि इस ऑपरेटर को अपनी अधिकतम मानकीकरण स्थान-समय पर स्थान-समय स्तरों पर उचित चयन करें, जो प्रारंभिक गॉसियन ब्लॉब की स्थानिक विस्तार और कालिक अवधि को अभिव्यक्त करते हैं। दूसरे ऑपरेटर के लिए, स्केल चयन गुणों के लिए, <math>\gamma_s = 1</math> और <math>\gamma_{\tau} = 3/4</math>, का प्रयोग करना चाहिए, यदि हम चाहते हैं कि इस ऑपरेटर को अपनी अधिकतम मानकीकरण स्थान-समय पर स्थान-समय स्तरों पर उचित चयन करें, जो झपकते हुए गॉसियन ब्लॉब की स्थानिक विस्तार और कालिक अवधि को अभिव्यक्त करते हैं।


स्थानिक-अस्थायी रुचि बिंदु डिटेक्टरों के रंग विस्तार की जांच एवर्ट्स एट अल द्वारा की गई है।<ref name="everts14"/>
स्थान-समय रुचि बिंदु डिटेक्टरों के रंगीन विस्तार का अध्ययन एवर्ट्स एट अल द्वारा की गई है।<ref name="everts14"/>
== ग्रन्थसूची ==
== ग्रन्थसूची ==


Line 685: Line 693:
== संदर्भ कार्यान्वयन ==
== संदर्भ कार्यान्वयन ==


यह अनुभाग ऊपर वर्णित कुछ डिटेक्टरों के संदर्भ कार्यान्वयन के लिए बाहरी लिंक प्रदान करता है। ये संदर्भ कार्यान्वयन उस पेपर के लेखकों द्वारा प्रदान किए गए हैं जिसमें डिटेक्टर का पहली बार वर्णन किया गया है। इनमें ऐसे विवरण शामिल हो सकते हैं जो विशेषताओं का वर्णन करने वाले कागजात में मौजूद या स्पष्ट नहीं हैं।
यह अनुभाग ऊपर वर्णित कुछ डिटेक्टरों के संदर्भ कार्यान्वयन के लिए बाहरी लिंक प्रदान करता है। ये संदर्भ कार्यान्वयन उस पेपर के लेखकों द्वारा प्रदान किए गए हैं जिसमें डिटेक्टर का पहली बार वर्णन किया गया है। इनमें ऐसे विवरण सम्मलित हो सकते हैं जो विशेषताओं का वर्णन करने वाले कागजात में उपस्थित या स्पष्ट नहीं हैं।
*[http://www.cs.ubc.ca/spider/lowe/keypoints/siftDemoV4.zip DoG डिटेक्शन] (स्केल-इनवेरिएंट फ़ीचर ट्रांसफ़ॉर्म सिस्टम के भाग के रूप में), [[Microsoft Windows]] और x[[86]] Linux निष्पादनयोग्य
*[http://www.cs.ubc.ca/spider/lowe/keypoints/siftDemoV4.zip DoG डिटेक्शन] (स्केल-इनवेरिएंट फ़ीचर ट्रांसफ़ॉर्म प्रणाली के भाग के रूप में), [[Microsoft Windows]] और x[[86]] Linux निष्पादनयोग्य
*[http://lear.inrialpes.fr/people/dorko/ipld/ipld_static.tgz हैरिस-लाप्लेस], स्थिर [[लिनक्स]] निष्पादन योग्य। इसमें DoG और LoG डिटेक्टर और सभी डिटेक्टरों के लिए एफ़िन अनुकूलन भी शामिल है।
*[http://lear.inrialpes.fr/people/dorko/ipld/ipld_static.tgz हैरिस-लाप्लेस], स्थिर [[लिनक्स]] निष्पादन योग्य। इसमें DoG और LoG डिटेक्टर और सभी डिटेक्टरों के लिए एफ़िन अनुकूलन भी सम्मलित है।
*[http://edwardrosten.com/work/fast.html फास्ट डिटेक्टर], C, C++, MATLAB स्रोत कोड और विभिन्न ऑपरेटिंग सिस्टम और आर्किटेक्चर के लिए निष्पादन योग्य।
*[http://edwardrosten.com/work/fast.html फास्ट डिटेक्टर], C, C++, MATLAB स्रोत कोड और विभिन्न ऑपरेटिंग प्रणाली और आर्किटेक्चर के लिए निष्पादन योग्य।
*[http://pami.xmu.edu.cn/~wlzhao/lip-vireo.htm लिप-विरियो], [LoG, DoG, हैरिस-लाप्लासियन, हेसियन और हेसियन-लाप्लासियन], [SIFT, फ्लिप इनवेरिएंट SIFT, पीसीए-एसआईएफटी, पीएसआईएफटी, स्टीयरेबल फिल्टर, स्पिन] [लिनक्स, विंडोज और सनओएस] निष्पादन योग्य।
*[http://pami.xmu.edu.cn/~wlzhao/lip-vireo.htm लिप-विरियो], [LoG, DoG, हैरिस-लाप्लासियन, हेसियन और हेसियन-लाप्लासियन], [SIFT, फ्लिप इनवेरिएंट SIFT, पीसीए-एसआईएफटी, पीएसआईएफटी, स्टीयरेबल फिल्टर, स्पिन] [लिनक्स, विंडोज और सनओएस] निष्पादन योग्य।
*[http://users.fmrib.ox.ac.uk/~steve/susan/ SUSAN लो लेवल इमेज प्रोसेसिंग], सी सोर्स कोड।
*[http://users.fmrib.ox.ac.uk/~steve/susan/ सुसान लो लेवल इमेज प्रोसेसिंग], सी सोर्स कोड।
*[https://ipolcore.ipol.im/demo/clientApp/demo.html?id=229 हैरिस कॉर्नर डिटेक्टर का ऑनलाइन कार्यान्वयन - IPOL]
*[https://ipolcore.ipol.im/demo/clientApp/demo.html?id=229 हैरिस कॉर्नर डिटेक्टर का ऑनलाइन कार्यान्वयन - IPOL]


Line 707: Line 715:
* Brostow, [http://www0.cs.ucl.ac.uk/staff/G.Brostow/classes/IP2008/L7_CornerDetection.pdf "Corner Detection -- UCL Computer Science"]
* Brostow, [http://www0.cs.ucl.ac.uk/staff/G.Brostow/classes/IP2008/L7_CornerDetection.pdf "Corner Detection -- UCL Computer Science"]


{{DEFAULTSORT:Corner Detection}}[[Category: फ़ीचर डिटेक्शन (कंप्यूटर विज़न)]]
{{DEFAULTSORT:Corner Detection}}
 
 


[[Category: Machine Translated Page]]
[[Category:Articles with hatnote templates targeting a nonexistent page|Corner Detection]]
[[Category:Created On 07/07/2023]]
[[Category:Created On 07/07/2023|Corner Detection]]
[[Category:Machine Translated Page|Corner Detection]]
[[Category:Pages with maths render errors|Corner Detection]]
[[Category:Pages with script errors|Corner Detection]]
[[Category:Templates Vigyan Ready|Corner Detection]]
[[Category:फ़ीचर डिटेक्शन (कंप्यूटर विज़न)|Corner Detection]]

Latest revision as of 13:21, 26 July 2023

विशिष्ट कोने का पता लगाने वाले एल्गोरिदम का आउटपुट ऐसा होता है।

कॉर्नर डिटेक्शन दृष्टिकोण है जिसका उपयोग कंप्यूटर दृष्टि प्रणाली के भीतर कुछ प्रकार के फ़ीचर डिटेक्शन (कंप्यूटर विज़न) को निकालने और छवि की सामग्री का अनुमान लगाने के लिए किया जाता है। कॉर्नर डिटेक्शन का उपयोग अधिकांशतः गति पहचान, छवि पंजीकरण, वीडियो ट्रैकिंग, फोटोग्राफिक मोज़ेक, पैनोरमा सिलाई, 3 डी पुनर्निर्माण और ऑब्जेक्ट पहचान में अधिकांशतः किया जाता है। कॉर्नर डिटेक्शन अंतर्गत आपूर्ति बिंदु डिटेक्शन के विषय के साथ संघुषित होता है।

औपचारिकीकरण

इस प्रकार कोने को दो किनारों के प्रतिच्छेदन के रूप में परिभाषित किया जा सकता है। कोने को बिंदु के रूप में भी परिभाषित किया जा सकता है जिसके लिए स्थानीय पड़ोस में दो प्रमुख और भिन्न धारा दिशाएं होती हैं।

रुचि बिंदु छवि में बिंदु है जिसकी छवि में अच्छी प्रकार से परिभाषित स्थान होता है और इसे मजबूती से पहचाना जा सकता है। इसका अर्थ यह है कि इंटरेस्ट पॉइंट कोना हो सकता है,किन्तु इसके अतिरिक्त यह मात्र कोना नहीं हो सकता है, उदाहरण के लिए, स्थानीय तीव्रता के अधिकतम या न्यूनतम स्थानीय बहुत्तर, रेखा के अंत, या कर्व पर बिंदु जहां की कर्वता स्थानीय अधिकतम होती हैं।

व्यावहारिक रूप में, अधिकांश तथाकथित कोने का पता लगाने के तरीके सामान्य रूप से रुचि बिंदुओं का पता लगाते हैं, और वास्तव में, कोने और रुचि और बिंदु शब्द का उपयोग प्रायः साहित्य के माध्यम से कमोबेश दूसरे के स्थान पर किया जाता है।[1]परिणामस्वरूप, यदि केवल कोनों का पता लगाने में किया जाता है तो यह निर्धारित करने के लिए पता लगाए गए रुचि बिंदुओं का स्थानीय विश्लेषण करना आवश्यक है कि इनमें से कौन सा वास्तविक कोने हैं। किनारों का पता लगाने के उदाहरण जिनका उपयोग पोस्ट-प्रोसेसिंग के साथ कोनों का पता लगाने के लिए किया जा सकता है, किर्श संचालक और फ़्री-चेन मास्किंग सेट हैं।[2]

कोने, रुचि बिंदु और फीचर का साहित्य में परस्पर उपयोग किया जाता है, जिससे समस्या भ्रमित हो जाती है। विशेष रूप से, ऐसे कई बूँद का पता लगाना हैं जिन्हें रुचि बिंदु ऑपरेटर के रूप में संदर्भित किया जा सकता है, किन्तु जिन्हें कभी-कभी गलती से कॉर्नर डिटेक्टर के रूप में संदर्भित किया जाता है। इसके अतिरिक्त , लम्बी वस्तुओं की उपस्थिति को पकड़ने के लिए रिज का पता लगाने की धारणा उपस्थित है।

कॉर्नर डिटेक्टर सामान्यतः बहुत मजबूत नहीं होते हैं और पहचान कार्य पर व्यक्तिगत त्रुटियों के प्रभाव को हावी होने से रोकने के लिए अधिकांशतः बड़े अतिरेक की आवश्यकता होती है।

कोने डिटेक्टर की गुणवत्ता का निर्धारण विभिन्न प्रकाश व्यवस्था, अनुवाद, रोटेशन और अन्य परिवर्तनों की स्थितियों के अनुसार कई समान छवियों में ही कोने का पता लगाने की क्षमता है।

छवियों में कोने का पता लगाने का सरल विधि सहसंबंध का उपयोग करना है, किन्तु यह कम्प्यूटेशनल रूप से बहुत महंगा और उप-इष्टतम हो जाता है। अधिकांशतः उपयोग किया जाने वाला वैकल्पिक दृष्टिकोण हैरिस और स्टीफंस (नीचे) द्वारा प्रस्तावित विधि पर आधारित है, जो बदले में मोरावेक द्वारा विधि का सुधार है।

मोरवेक कॉर्नर डिटेक्शन एल्गोरिदम

यह सबसे शुरुआती कोने का पता लगाने वाले एल्गोरिदम में से है और कोने को कम आत्म-समानता वाले बिंदु के रूप में परिभाषित करता है।[3]एल्गोरिदम यह देखने के लिए छवि में प्रत्येक पिक्सेल का परीक्षण करता है कि कोई कोना उपस्थित है या नहीं, यह विचार करके कि पिक्सेल पर केंद्रित पैच पास के, बड़े पैमाने पर ओवरलैपिंग पैच के समान है। समानता को दो पैच के संबंधित पिक्सेल के बीच वर्ग अंतर (एसएसडी) का योग लेकर मापा जाता है। कम संख्या अधिक समानता दर्शाती है.

यदि पिक्सेल एकसमान तीव्रता के क्षेत्र में है, तो आस-पास के पैच समान दिखेंगे। यदि पिक्सेल किनारे पर है, तो किनारे के लंबवत दिशा में पास के पैच अत्यधिक अलग दिखेंगे, किन्तु किनारे के समानांतर दिशा में पास के पैच के परिणामस्वरूप केवल छोटा सा बदलाव होगा। यदि पिक्सेल सभी दिशाओं में भिन्नता वाले फीचर पर है, तो आस-पास का कोई भी पैच समान नहीं दिखेगा।

कोने की ताकत को पैच और उसके पड़ोसियों (क्षैतिज, ऊर्ध्वाधर और दो विकर्णों पर) के बीच सबसे छोटे एसएसडी के रूप में परिभाषित किया गया है। कारण यह है कि यदि यह संख्या अधिक है, तो सभी बदलावों में भिन्नता या तो इसके बराबर होती है या इससे बड़ी होती है, इसलिए कैप्चरिंग से आस-पास के सभी पैच अलग दिखते हैं।

यदि सभी स्थानों के लिए कोने की ताकत संख्या की गणना की जाती है, तो यह स्थान के लिए स्थानीय रूप से अधिकतम है, यह दर्शाता है कि इसमें रुचि की विशेषता उपस्थित है।

जैसा कि मोरावेक ने बताया है, इस ऑपरेटर के साथ मुख्य समस्याओं में से यह है कि यह समदैशिक नहीं है: यदि कोई किनारा उपस्थित है जो पड़ोसियों (क्षैतिज, ऊर्ध्वाधर या विकर्ण) की दिशा में नहीं है, तो सबसे छोटा एसएसडी होगा बड़ा और किनारे को गलत तरीके से रुचि बिंदु के रूप में चुना जाएगा।[4]

हैरिस और स्टीफेंस / शि-तोमासी कोने का पता लगाने वाले एल्गोरिदम

हैरिस और स्टीफंस[5]स्थानांतरित पैच का उपयोग करने के अतिरिक्त , सीधे दिशा के संबंध में कोने के स्कोर के अंतर पर विचार करके मोरावेक के कोने डिटेक्टर में सुधार किया गया। (इस कोने के स्कोर को अधिकांशतः ऑटोसहसंबंध के रूप में जाना जाता है, क्योंकि इस शब्द का उपयोग उस पेपर में किया जाता है जिसमें इस डिटेक्टर का वर्णन किया गया है। हालांकि, पेपर में गणित स्पष्ट रूप से इंगित करता है कि वर्ग अंतर के योग का उपयोग किया जाता है।)

व्यापकता की हानि के बिना, हम मान लेंगे कि ग्रेस्केल 2-आयामी छवि का उपयोग किया जाता है। बता दें कि यह छवि दी गई है . क्षेत्र पर छवि पैच लेने पर विचार करें और इसे स्थानांतरित करना . इन दो पैच के बीच वर्ग अंतर (एसएसडी) का भारित योग दर्शाया गया है , द्वारा दिया गया है:

टेलर श्रृंखला द्वारा अनुमान लगाया जा सकता है। होने देना और की आंशिक छवि व्युत्पन्न हो , ऐसा है कि

इससे सन्निकटन उत्पन्न होता है

जिसे आव्यूह रूप में लिखा जा सकता है:

जहां ए संरचना टेंसर है,

शब्दों में, हम छवि तीव्रता के आंशिक व्युत्पन्न का सहप्रसरण पाते हैं के प्रति सम्मान के साथ और कुल्हाड़ियाँ

कोण कोष्ठक औसत को दर्शाते हैं (अर्थात् संक्षेपण)। ). छवि पर स्लाइड करने वाली विंडो के प्रकार को दर्शाता है। यदि बॉक्स ब्लर का उपयोग किया जाता है तो प्रतिक्रिया एनिसोट्रॉपिक होगी, किन्तु यदि गॉसियन फ़ंक्शन का उपयोग किया जाता है, तो प्रतिक्रिया आइसोट्रोपिक होगी।

कोने (या सामान्य तौर पर रुचि बिंदु) की विशेषता बड़ी विविधता है वेक्टर की सभी दिशाओं में . के आइगेनमूल्य ​​का विश्लेषण करके , इस लक्षण वर्णन को निम्नलिखित तरीके से व्यक्त किया जा सकता है: रुचि बिंदु के लिए दो बड़े आइगेनमूल्य ​​​​होने चाहिए। स्वदेशी मूल्यों के परिमाण के आधार पर, इस तर्क के आधार पर निम्नलिखित अनुमान लगाए जा सकते हैं:

  1. यदि और फिर यह पिक्सेल रुचि की कोई विशेषता नहीं है.
  2. यदि और कुछ बड़ा धनात्मक मूल्य है, तो बढ़त पाई जाती है।
  3. यदि और बड़े धनात्मक मान हैं, तो कोना मिल जाता है।

हैरिस और स्टीफंस ने ध्यान दिया कि आइगेनवैल्यू की सटीक गणना कम्प्यूटेशनल रूप से महंगी है, क्योंकि इसके लिए वर्गमूल की गणना की आवश्यकता होती है, और इसके अतिरिक्त सुझाव देते हैं निम्नलिखित फ़ंक्शन , यहाँ ट्यून करने योग्य संवेदनशीलता पैरामीटर है:

इसलिए, एल्गोरिथ्म[6]वास्तव में आव्यूह के eigenvalue अपघटन की गणना करने की आवश्यकता नहीं है और इसके अतिरिक्त यह निर्धारक और ट्रेस (रैखिक बीजगणित) का मूल्यांकन करने के लिए पर्याप्त है ढूँढ़ने के लिए कोने, या सामान्यतः रुचि बिंदु।

शि-तोमासी[7]कॉर्नर डिटेक्टर सीधे गणना करता है क्योंकि कुछ मान्यताओं के तहत, ट्रैकिंग के लिए कोने अधिक स्थिर होते हैं। ध्यान दें कि इस विधि को कभी-कभी कनाडे-टोमासी कॉर्नर डिटेक्टर के रूप में भी जाना जाता है।

का मान है अनुभवजन्य रूप से निर्धारित किया जाना है, और साहित्य में 0.04-0.15 की सीमा में मूल्यों को व्यवहार्य बताया गया है।

कोई भी पैरामीटर सेट करने से बच सकता है नोबल का उपयोग करके[8]कोने का माप जो आइगेनमूल्य ​​​​के अनुकूल माध्य के बराबर है:

छोटा सा धनात्मक स्थिरांक होना।

यदि कोने की स्थिति के लिए सटीक आव्यूह के रूप में व्याख्या की जा सकती है, कोने की स्थिति के लिए परिशुद्धता आव्यूह है , अर्थात।

के आइगेनमूल्य ​​का योग , जिसे उस मामले में कोने की स्थिति के सामान्यीकृत विचरण (या कुल अनिश्चितता) के रूप में व्याख्या किया जा सकता है, नोबल के कोने के माप से संबंधित है निम्नलिखित समीकरण द्वारा:

फोरस्टनर कॉर्नर डिटेक्टर

फ़ॉर्स्टनर एल्गोरिथम का उपयोग करके कोने का पता लगाना

कुछ स्थितियों में, कोई उपपिक्सेल सटीकता के साथ कोने के स्थान की गणना करना चाह सकता है। अनुमानित समाधान प्राप्त करने के लिए, फ़ोरस्टनर[9] एल्गोरिदम किसी दिए गए विंडो में कोने की सभी स्पर्शरेखा रेखाओं के निकटतम बिंदु को हल करता है और यह न्यूनतम-वर्ग समाधान है। एल्गोरिदम इस तथ्य पर निर्भर करता है कि आदर्श कोने के लिए, स्पर्शरेखा रेखाएं ही बिंदु पर प्रतिच्छेद करती हैं।

स्पर्श रेखा का समीकरण पिक्सेल पर द्वारा दिया गया है:

यहाँ छवि का ग्रेडिएंट वेक्टर है पर .

बिंदु विंडो में सभी स्पर्शरेखा रेखाओं के सबसे निकट है:

से दूरी स्पर्शरेखा रेखाओं के लिए ग्रेडिएंट परिमाण द्वारा भारित किया जाता है, इस प्रकार मजबूत ग्रेडिएंट वाले पिक्सेल से गुजरने वाली स्पर्शरेखाओं को अधिक महत्व दिया जाता है।

के लिए समाधान :

के रूप में परिभाषित किया गया है:

के संबंध में विभेदन करके इस समीकरण को न्यूनतम किया जा सकता है और इसे 0 के बराबर सेट करना:

ध्यान दें कि संरचना टेंसर है. समीकरण का हल पाने के लिए, उलटा होना चाहिए, जिसका तात्पर्य यह है पूर्ण रैंक (रैंक 2) होना चाहिए। इस प्रकार, समाधान

केवल वहीं उपस्थित है जहां विंडो में वास्तविक कोना उपस्थित है .

इस कोने के स्थानीयकरण विधि के लिए स्वचालित पैमाने का चयन करने की पद्धति लिंडेबर्ग द्वारा प्रस्तुत की गई है[10][11]सामान्यीकृत अवशिष्ट को कम करके

तराजू के ऊपर. इस प्रकार, विधि में शोर छवि डेटा के लिए मोटे पैमाने के स्तर और आदर्श कोने जैसी संरचनाओं के लिए उत्तम पैमाने के स्तर का चयन करके, छवि डेटा में शोर स्तर के लिए छवि ग्रेडिएंट्स की गणना के लिए स्केल स्तरों को स्वचालित रूप से अनुकूलित करने की क्षमता होती है।

टिप्पणियाँ:

  • न्यूनतम-वर्ग समाधान गणना में अवशिष्ट के रूप में देखा जा सकता है: यदि , तो कोई त्रुटि नहीं थी.
  • इस एल्गोरिदम को स्पर्शरेखा रेखाओं को सामान्य रेखाओं में बदलकर वृत्ताकार विशेषताओं के केंद्रों की गणना करने के लिए संशोधित किया जा सकता है।

मल्टी-स्केल हैरिस ऑपरेटर

दूसरे क्षण आव्यूह की गणना (कभी-कभी इसे संरचना टेंसर भी कहा जाता है) हैरिस ऑपरेटर में, छवि डेरिवेटिव की गणना की आवश्यकता होती है छवि डोमेन के साथ-साथ स्थानीय पड़ोस पर इन डेरिवेटिव के गैर-रेखीय संयोजनों का योग। चूंकि डेरिवेटिव की गणना में सामान्यतः स्केल-स्पेस स्मूथिंग का चरण सम्मलित होता है, हैरिस ऑपरेटर की परिचालन परिभाषा के लिए दो स्केल पैरामीटर की आवश्यकता होती है: (i) इमेज डेरिवेटिव की गणना से पहले स्मूथिंग के लिए स्थानीय स्केल, और (ii) एकीकरण स्केल एकीकृत छवि डिस्क्रिप्टर में व्युत्पन्न ऑपरेटरों पर गैर-रेखीय संचालन को संचित करने के लिए।

साथ मूल छवि तीव्रता को दर्शाते हुए, आइए के स्केल स्पेस प्रतिनिधित्व को निरूपित करें गॉसियन कर्नेल के साथ कनवल्शन द्वारा प्राप्त किया गया

स्थानीय पैमाने के पैरामीटर के साथ :

और जाने और के आंशिक व्युत्पन्न को निरूपित करें . इसके अतिरिक्त , गाऊसी विंडो फ़ंक्शन का परिचय दें एकीकरण स्केल पैरामीटर के साथ . फिर, स्ट्रक्चर टेंसर मल्टी-स्केल स्ट्रक्चर टेंसर|मल्टी-स्केल सेकेंड-मोमेंट मैट्रिक्स[12][13][14]के रूप में परिभाषित किया जा सकता है

फिर, हम आइगेनमूल्य ​​​​की गणना कर सकते हैं के आइगेनमूल्य ​​​​के समान तरीके से और मल्टी-स्केल हैरिस कॉर्नर माप को इस प्रकार परिभाषित करें

स्थानीय पैमाने के पैरामीटर के चयन के संबंध में और एकीकरण स्केल पैरामीटर , ये स्केल पैरामीटर सामान्यतः सापेक्ष एकीकरण स्केल पैरामीटर द्वारा युग्मित होते हैं ऐसा है कि , यहाँ सामान्यतः अंतराल में चुना जाता है .[12][13]इस प्रकार, हम बहु-स्तरीय हैरिस कॉर्नर माप की गणना कर सकते हैं किसी भी पैमाने पर मल्टी-स्केल कॉर्नर डिटेक्टर प्राप्त करने के लिए स्केल-स्पेस में, जो इमेज डोमेन में विभिन्न आकारों की कॉर्नर संरचनाओं पर प्रतिक्रिया करता है।

व्यवहार में, इस मल्टी-स्केल कॉर्नर डिटेक्टर को अधिकांशतः स्केल चयन चरण द्वारा पूरक किया जाता है, जहां स्केल-सामान्यीकृत लाप्लासियन ऑपरेटर[11][12]: स्केल-स्पेस में हर पैमाने पर गणना की जाती है और स्वचालित स्केल चयन (हैरिस-लाप्लास ऑपरेटर) के साथ स्केल अनुकूलित कोने बिंदुओं की गणना उन बिंदुओं से की जाती है जो साथ हैं:[15]

  • मल्टी-स्केल कोने माप की स्थानिक मैक्सिमा
  • स्केल-सामान्यीकृत लाप्लासियन ऑपरेटर के पैमाने पर स्थानीय मैक्सिमा या मिनिमा[11] :

स्तर वक्र वक्रता दृष्टिकोण

कोने का पता लगाने का पुराना विधि उन बिंदुओं का पता लगाना है जहां आइसोलिन्स की वक्रता और ढाल परिमाण साथ उच्च हैं।[16][17] ऐसे बिंदुओं का पता लगाने का अलग विधि पुनर्स्केल स्तर वक्र वक्रता (स्तर वक्र वक्रता का उत्पाद और तीन की शक्ति तक बढ़ाए गए ढाल परिमाण) की गणना करना है।

और कुछ पैमाने पर इस अंतर अभिव्यक्ति के धनात्मक मैक्सिमा और नकारात्मक मिनिमा का पता लगाने के लिए स्केल स्पेस प्रतिनिधित्व में मूल छवि का.[10][11]

चूँकि , एकल पैमाने पर पुनर्स्केल स्तर वक्र वक्रता इकाई की गणना करते समय मुख्य समस्या यह है कि यह शोर और स्केल स्तर की पसंद के प्रति संवेदनशील हो सकता है। की गणना करना उत्तम विधि है-सामान्यीकृत पुनर्स्केल्ड स्तर वक्र वक्रता

साथ और इस अभिव्यक्ति के हस्ताक्षरित स्केल-स्पेस एक्स्ट्रेमा का पता लगाने के लिए, ये ऐसे बिंदु और स्केल हैं जो स्पेस और स्केल दोनों के संबंध में धनात्मक मैक्सिमा और नकारात्मक मिनिमा हैं।

मोटे पैमाने पर स्थानीयकरण त्रुटि में वृद्धि को संभालने के लिए पूरक स्थानीयकरण कदम के साथ संयोजन में।[10][11][12]इस प्रकार , बड़े पैमाने के मूल्य बड़े स्थानिक विस्तार वाले गोल कोनों से जुड़े होंगे जबकि छोटे पैमाने के मूल्य छोटे स्थानिक विस्तार वाले तेज कोनों से जुड़े होंगे। यह दृष्टिकोण स्वचालित स्केल चयन वाला पहला कॉर्नर डिटेक्टर है (ऊपर हैरिस-लाप्लास ऑपरेटर से पहले) और इसका उपयोग छवि डोमेन में बड़े पैमाने पर बदलाव के अनुसार कोनों को ट्रैक करने के लिए किया गया है।[18]और जियोन (मनोविज्ञान)-आधारित वस्तु पहचान के लिए संरचनात्मक छवि सुविधाओं की गणना करने के लिए किनारों से कोने की प्रतिक्रियाओं का मिलान करने के लिए।[19]

गॉसियन का लाप्लासियन, गॉसियन के अंतर और हेसियन स्केल-स्पेस ब्याज बिंदुओं के निर्धारक

लकड़ी का लट्ठा[11][12][15]गॉसियन, DoG के लाप्लासियन का संक्षिप्त रूप है[20]गॉसियन के अंतर के लिए संक्षिप्त शब्द है (DoG LoG का अनुमान है), और DoH हेसियन के निर्धारक के लिए संक्षिप्त शब्द है।[11]ये सभी स्केल-अपरिवर्तनीय ब्याज बिंदु स्केल-सामान्यीकृत अंतर अभिव्यक्तियों के स्केल-स्पेस एक्स्ट्रेमा का पता लगाकर निकाले जाते हैं, यानी, स्केल-स्पेस में बिंदु जहां संबंधित स्केल-सामान्यीकृत अंतर अभिव्यक्तियां अंतरिक्ष और स्केल दोनों के संबंध में स्थानीय एक्स्स्ट्रेमा मानती हैं।[11]:

यहाँ उपयुक्त पैमाने-सामान्यीकृत अंतर इकाई को दर्शाता है (नीचे परिभाषित)।

इन डिटेक्टरों को ब्लॉब डिटेक्शन में अधिक पूरी प्रकार से वर्णित किया गया है। गॉसियन का स्केल-सामान्यीकृत लाप्लासियन और गॉसियन विशेषताओं का अंतर (लिंडेबर्ग 1994, 1998; लोव 2004)[11][12][20]

जरूरी नहीं कि अत्यधिक चयनात्मक विशेषताएं बनाएं, क्योंकि ये ऑपरेटर किनारों के पास भी प्रतिक्रियाएं दे सकते हैं। गॉसियन डिटेक्टर के अंतर की कोने का पता लगाने की क्षमता में सुधार करने के लिए, स्केल-अपरिवर्तनीय सुविधा परिवर्तन में उपयोग किए जाने वाले फ़ीचर डिटेक्टर[20]इसलिए प्रणाली अतिरिक्त पोस्ट-प्रोसेसिंग चरण का उपयोग करता है, जहां डिटेक्शन स्केल पर छवि के हेस्सियन आव्यूह के आइगेनवैल्यू की जांच हैरिस ऑपरेटर की प्रकार ही की जाती है। यदि आइगेनमूल्य ​​​​का अनुपात बहुत अधिक है, तो स्थानीय छवि को बहुत किनारे जैसा माना जाता है, इसलिए सुविधा को अस्वीकार कर दिया जाता है। इसके अतिरिक्त गॉसियन फ़ीचर डिटेक्टर के लिंडेबर्ग के लाप्लासियन को किनारों के पास प्रतिक्रियाओं को दबाने के लिए पूरक अंतर अपरिवर्तनीय पर पूरक थ्रेशोल्डिंग सम्मलित करने के लिए परिभाषित किया जा सकता है।[21]

हेसियन ऑपरेटर का स्केल-सामान्यीकृत निर्धारक (लिंडेबर्ग 1994, 1998)[11][12]: दूसरी ओर, अच्छी प्रकार से स्थानीयकृत छवि सुविधाओं के लिए अत्यधिक चयनात्मक है और केवल तभी प्रतिक्रिया करता है जब दो छवि दिशाओं में महत्वपूर्ण ग्रे-स्तर भिन्नताएं होती हैं[11][14]और इस और अन्य स्थितियों में गॉसियन के लाप्लासियन की समानता में उत्तम रुचि बिंदु डिटेक्टर है। हेसियन का निर्धारक एफ़िन सहसंयोजक विभेदक अभिव्यक्ति है और इसमें लाप्लासियन ऑपरेटर की समानता में एफ़िन छवि परिवर्तनों के अनुसार उत्तम पैमाने पर चयन गुण हैं।

(लिंडेबर्ग 2013, 2015)।[21][22] प्रयोगात्मक रूप से इसका तात्पर्य यह है कि हेसियन रुचि बिंदुओं के निर्धारक में लाप्लासियन रुचि बिंदुओं की समानता में स्थानीय छवि विरूपण के अनुसार उत्तम दोहराव गुण होते हैं, जिसके परिणामस्वरूप उच्च दक्षता स्कोर और कम 1-परिशुद्धता (सूचना पुनर्प्राप्ति) स्कोर के संदर्भ में छवि-आधारित मिलान का उत्तम प्रदर्शन होता है। .[21]

इन और अन्य स्केल-स्पेस इंटरेस्ट पॉइंट डिटेक्टरों के स्केल चयन गुणों, एफ़िन ट्रांसफ़ॉर्मेशन गुणों और प्रयोगात्मक गुणों का विस्तार से विश्लेषण किया गया है (लिंडेबर्ग 2013, 2015)।[21][22]

लिंडेबर्ग हेसियन फीचर ताकत उपायों के आधार पर स्केल-स्पेस रुचि बिंदु

हेसियन आव्यूह के संरचनात्मक रूप से समान गुणों से प्रेरित समारोह का और दूसरे क्षण का आव्यूह (संरचना टेंसर) , जैसे कि कर सकते हैं एफ़िन छवि विकृतियों के अनुसार उनके समान परिवर्तन गुणों के संदर्भ में प्रकट होना[13][21]:,

,

लिंडेबर्ग (2013, 2015)[21][22]हेस्सियन आव्यूह से संबंधित तरीकों से चार फीचर ताकत उपायों को परिभाषित करने का प्रस्ताव किया गया है क्योंकि हैरिस और शि-एंड-टोमासी ऑपरेटरों को संरचना टेंसर (दूसरे-पल मैट्रिक्स) से परिभाषित किया गया है। विशेष रूप से, उन्होंने निम्नलिखित अहस्ताक्षरित और हस्ताक्षरित हेस्सियन सुविधा शक्ति उपायों को परिभाषित किया:

  • अहस्ताक्षरित हेसियन सुविधा शक्ति माप I:
  • हस्ताक्षरित हेस्सियन सुविधा शक्ति माप I:
  • अहस्ताक्षरित हेसियन सुविधा शक्ति माप II:
  • हस्ताक्षरित हेस्सियन सुविधा शक्ति माप II:

यहाँ और हेसियन आव्यूह के ट्रेस और निर्धारक को निरूपित करें स्केल-स्पेस प्रतिनिधित्व का किसी भी पैमाने पर ,

जबकि

हेसियन आव्यूह के आइगेनमूल्य ​​​​को निरूपित करें।[23]

अहस्ताक्षरित हेसियन सुविधा शक्ति माप धनात्मक मूल्यों द्वारा स्थानीय चरम सीमा पर प्रतिक्रिया करता है और काठी बिंदुओं के प्रति संवेदनशील नहीं है, जबकि हस्ताक्षरित हेसियन सुविधा शक्ति मापती है नकारात्मक मूल्यों द्वारा सैडल बिंदुओं पर अतिरिक्त प्रतिक्रिया करता है। अहस्ताक्षरित हेसियन सुविधा शक्ति माप सिग्नल की स्थानीय ध्रुवीयता के प्रति असंवेदनशील है, जबकि हस्ताक्षरित हेसियन सुविधा शक्ति मापती है सिग्नल की स्थानीय ध्रुवता पर उसके आउटपुट के संकेत द्वारा प्रतिक्रिया करता है।

लिंडेबर्ग में (2015)[21]इन चार विभेदक संस्थाओं को स्केल-स्पेस एक्स्ट्रेमा डिटेक्शन के आधार पर स्थानीय पैमाने के चयन के साथ जोड़ा गया था

या स्केल लिंकिंग। इसके अतिरिक्त , हस्ताक्षरित और अहस्ताक्षरित हेसियन में ताकत के उपाय हैं और पूरक थ्रेशोल्डिंग के साथ जोड़ा गया था .

12 पोस्टर वाले पोस्टर डेटासेट पर स्केलिंग ट्रांसफॉर्मेशन के अनुसार छवि मिलान पर प्रयोगों द्वारा, 6 के स्केलिंग कारक तक स्केलिंग ट्रांसफॉर्मेशन पर मल्टी-व्यू मिलान और स्थानीय छवि डिस्क्रिप्टर के साथ 45 डिग्री के तिरछे कोण तक दिशा भिन्नता को देखने के लिए। स्केल-इनवेरिएंट फीचर में शुद्ध छवि डिस्क्रिप्टर छवि पिरामिड या मूल एसयूआरएफ से परिभाषित मूल एसआईएफटी के अतिरिक्त गाऊसी व्युत्पन्न ऑपरेटरों (गॉस-एसआईएफटी और गॉस-एसयूआरएफ) के संदर्भ में छवि माप के लिए मजबूत फीचर ऑपरेटरों को बदलते हैं और तेज करते हैं। हार वेवलेट्स से, यह दिखाया गया कि अहस्ताक्षरित हेसियन सुविधा शक्ति माप के आधार पर स्केल-स्पेस ब्याज बिंदु का पता लगाना हेसियन के निर्धारक से प्राप्त स्केल-स्पेस ब्याज बिंदुओं की समानता में सर्वोत्तम प्रदर्शन और उत्तम प्रदर्शन की अनुमति दी गई . दोनों अहस्ताक्षरित हेस्सियन सुविधा शक्ति माप , हस्ताक्षरित हेसियन सुविधा शक्ति माप और हेस्सियन का निर्धारक गॉसियन के लाप्लासियन की समानता में उत्तम प्रदर्शन की अनुमति दी गई . जब स्केल लिंकिंग और पूरक थ्रेशोल्डिंग के साथ जोड़ा जाता है , हस्ताक्षरित हेसियन सुविधा शक्ति माप इसके अतिरिक्त गॉसियन के लाप्लासियन की समानता में उत्तम प्रदर्शन की अनुमति दी गई .

इसके अतिरिक्त , यह दिखाया गया कि हेसियन आव्यूह से परिभाषित ये सभी विभेदक स्केल-स्पेस ब्याज बिंदु डिटेक्टर संरचना से परिभाषित हैरिस और शि-एंड-टोमासी ऑपरेटरों की समानता में बड़ी संख्या में ब्याज बिंदुओं का पता लगाने और उत्तम मिलान प्रदर्शन की अनुमति देते हैं। टेंसर (दूसरे क्षण का मैट्रिक्स)।

इन चार हेसियन फीचर शक्ति उपायों और स्केल-स्पेस ब्याज बिंदुओं का पता लगाने के लिए अन्य अंतर इकाइयों के स्केल चयन गुणों का सैद्धांतिक विश्लेषण, जिसमें गॉसियन के लाप्लासियन और हेसियन के निर्धारक सम्मलित हैं, लिंडेबर्ग (2013) में दिया गया है।[22]और लिंडेबर्ग (2015) में उनके एफ़िन परिवर्तन गुणों के साथ-साथ प्रयोगात्मक गुणों का विश्लेषण होता है।[21]

एफ़िन-अनुकूलित ब्याज बिंदु ऑपरेटर

स्वचालित स्केल चयन के साथ मल्टी-स्केल हैरिस ऑपरेटर से प्राप्त ब्याज बिंदु स्थानिक डोमेन में अनुवाद, रोटेशन और समान पुनर्स्केलिंग के लिए अपरिवर्तनीय हैं। चूँकि , जो छवियाँ कंप्यूटर विज़न प्रणाली के लिए इनपुट का निर्माण करती हैं, वे भी परिप्रेक्ष्य विकृतियों के अधीन हैं। रुचि बिंदु ऑपरेटर प्राप्त करने के लिए जो परिप्रेक्ष्य परिवर्तनों के लिए अधिक मजबूत है, प्राकृतिक दृष्टिकोण फीचर डिटेक्टर तैयार करना है जो कि परिवर्तनों को प्रभावित करने के लिए अपरिवर्तनीय है। व्यवहार में, एफ़िन अपरिवर्तनीय रुचि बिंदुओं को एफ़िन आकार अनुकूलन लागू करके प्राप्त किया जा सकता है जहां स्मूथिंग कर्नेल का आकार रुचि बिंदु के आसपास स्थानीय छवि संरचना से मेल खाने के लिए पुनरावृत्त रूप से विकृत होता है या समकक्ष रूप से स्थानीय छवि पैच पुनरावृत्त रूप से विकृत होता है जबकि स्मूथिंग का आकार होता है कर्नेल घूर्णी रूप से सममित रहता है (लिंडेबर्ग 1993, 2008; लिंडेबर्ग और गार्डिंग 1997; मिकोलाजस्क और श्मिट 2004)।[12][13][14][15]इसलिए, सामान्यतः उपयोग किए जाने वाले मल्टी-स्केल हैरिस ऑपरेटर के अतिरिक्त , इस आलेख में सूचीबद्ध अन्य कोने डिटेक्टरों के साथ-साथ ब्लॉब डिटेक्शन जैसे गॉसियन ऑपरेटर के लाप्लासियन/अंतर, हेसियन के निर्धारक, पर एफ़िन आकार अनुकूलन लागू किया जा सकता है।[14]और हेस्सियन-लाप्लास ऑपरेटर होता है।

वैंग और ब्रैडी कॉर्नर डिटेक्शन एल्गोरिदम

वैंग और ब्रैडी[24]डिटेक्टर छवि को सतह मानता है, और उन स्थानों की अविष्कार करता है जहां छवि किनारे पर बड़ी वक्रता होती है। दूसरे शब्दों में, एल्गोरिदम उन स्थानों की अविष्कार करता है जहां किनारा तेजी से दिशा बदलता है। कोने का स्कोर, , द्वारा दिया गया है:

यहाँ ग्रेडिएंट के लंबवत इकाई वेक्टर है, और यह निर्धारित करता है कि डिटेक्टर कितना एज-फ़ोबिक है। लेखक यह भी ध्यान देते हैं कि शोर को कम करने के लिए स्मूथिंग (गॉसियन का सुझाव दिया गया है) की आवश्यकता है।

स्मूथिंग भी कोनों के विस्थापन का कारण बनती है, इसलिए लेखक 90 डिग्री के कोने के विस्थापन के लिए अभिव्यक्ति प्राप्त करते हैं, और इसे पहचाने गए कोनों पर सुधार कारक के रूप में लागू करते हैं।

सुसान कॉर्नर डिटेक्टर

सुसान[25]यह संक्षिप्त शब्द है जो नाभिक को आत्मसात करने वाले सबसे छोटे एकमूल्य खंड के लिए खड़ा है। यह विधि 1994 के यूके पेटेंट का विषय है जो अब लागू नहीं है।[26]

सुविधा का पता लगाने के लिए, सुसान परीक्षण किए जाने वाले पिक्सेल (नाभिक) के ऊपर गोलाकार मास्क लगाता है। मुखौटे का क्षेत्र है , और इस मास्क में पिक्सेल का प्रतिनिधित्व किया जाता है . केन्द्रक पर है . समानता फ़ंक्शन का उपयोग करके प्रत्येक पिक्सेल की समानता नाभिक से की जाती है:

यहाँ चमक अंतर सीमा है,[27] पिक्सेल की चमक है और घातांक की शक्ति अनुभवजन्य रूप से निर्धारित की गई है। इस फ़ंक्शन में चिकने आयताकार फ़ंक्शन | टॉप-हैट या आयताकार फ़ंक्शन की उपस्थिति होती है। सुसान का क्षेत्रफल इस प्रकार दिया गया है:

यदि तो, आयताकार फलन है मास्क में पिक्सेल की संख्या है जो अंदर हैं नाभिक का. सुसान ऑपरेटर की प्रतिक्रिया इस प्रकार दी गई है:

यहाँ को 'ज्यामितीय सीमा' नाम दिया गया है। दूसरे शब्दों में, सुसान ऑपरेटर का स्कोर केवल तभी धनात्मक होता है जब क्षेत्र अत्यधिक छोटा हो। स्थानीय स्तर पर सबसे छोटा सुसान गैर-अधिकतम दमन का उपयोग करके पाया जा सकता है, और यह संपूर्ण सुसान ऑपरेटर है।

मूल्य यह निर्धारित करता है कि यूनीवैल्यू सेगमेंट का भाग माने जाने से पहले नाभिक के समान बिंदु कितने समान होने चाहिए। का मान है यूनीवैल्यू सेगमेंट का न्यूनतम आकार निर्धारित करता है। यदि अत्यधिक बड़ा है, तो यह किनारे का पता लगाना बन जाता है।

कोने का पता लगाने के लिए, दो और चरणों का उपयोग किया जाता है। सबसे पहले सुसान का केन्द्रक पाया जाता है। उचित कोने में केन्द्रक नाभिक से दूर होगा। दूसरा चरण इस बात पर जोर देता है कि नाभिक से केन्द्रक के माध्यम से मास्क के किनारे तक की रेखा पर सभी बिंदु सुसान में हैं।

ट्रैजकोविक और हेडली कॉर्नर डिटेक्टर

सुसान के प्रकार की विधि , यह डिटेक्टर[28]सीधे यह जांचता है कि क्या पिक्सेल के नीचे पैच स्व-समान है, निकटतम पिक्सेलों की जांच करके। विचार किए जाने वाला पिक्सेल है, और पृष्ठ पर बिंदु है जो बिंदु के चारों ओर केंद्रित वृत्त . के चारों ओर रहता है। बिंदु विषमता वाले सिरे के लिए के विपरीत बिंदु है।

प्रतिक्रिया फ़ंक्शन को इस प्रकार परिभाषित किया गया है:

यह तब बड़ा होगा जब ऐसी कोई दिशा नहीं होगी जिसमें केंद्र पिक्सेल व्यास के साथ दो निकटवर्ती पिक्सेल के समान हो। पृथक वृत्त ( मध्यबिंदु वृत्त एल्गोरिथ्म) है, इसलिए अधिक आइसोट्रोपिक प्रतिक्रिया देने के लिए मध्यवर्ती व्यास के लिए प्रक्षेप का उपयोग किया जाता है। चूँकि कोई भी गणना के ऊपरी सीमा दी जाती है, इसलिए पहले यह देखा जाता है कि क्या सम्पूर्ण की गणना पूरी करने में लायक है, इसके लिए संयोजनात्मक और लंबवत दिशाओं की जांच की जाती है।

एएसटी-आधारित फीचर डिटेक्टर

इस प्रकार एएसटी त्वरित खंड परीक्षण का संक्षिप्त रूप है। यह परीक्षण सुसान कॉर्नर मानदंड का संविहित संस्करण है। परीक्षण में, गोलाकार वट की जगह, केवल उम्मीदवार बिंदु के चारों ओर के ब्रेजेनहम वृत्त में पिक्सेल को मान्यता दी जाती है। यदि संचित पिक्सेल सभी न्यूक्लियस से कम से कम या सभी न्यूक्लियस से अधिक के रूप में धुंधले हों, तो न्यूक्लियस के नीचे पिक्सेल को विशेषता माना जाता है। इस परीक्षण की सुचारू रूप से स्थिर विशेषताएं उत्पन्न की जाती हैं।[29]जिस क्रम में पिक्सेल का परीक्षण किया जाता है उसका चुनाव तथाकथित बीस प्रश्न है। इस समस्या के लिए छोटे निर्णय पेड़ बनाने से सबसे अधिक गणनात्मक रूप से दक्ष विशेषता डिटेक्टर प्राप्त होते हैं।

इस प्रकार एएसटी पर आधारित पहला कॉर्नर डिटेक्शन एल्गोरिदम फास्ट (एकीकृत सेगमेंट परीक्षण से विशेषताएं) है।[29]यद्यपि, सिद्धांत में किसी भी मान को ले सकता है, FAST केवल 3 का मान (16 पिक्सेल परिधि का वृत्त के समान) का उपयोग करता है, और परीक्षण से पता चलता है कि सबसे अच्छा परिणाम के साथ प्राप्त किया जाता है। यह मान वह सबसे निम्न मान है जिस पर किनारों का पता नहीं चलता है। पिक्सेलों की परीक्षा की क्रमबद्धता प्रशिक्षण सेट से ID3 एल्गोरिदम द्वारा निर्धारित की जाती है। संदिग्धतापूर्ण रूप से, इस डिटेक्टर का नाम प्रकाशित करने वाले पेपर के नाम से कुछ समान होता है जो तराजकोविक और हेडली के डिटेक्टर का वर्णन करता है।

डिटेक्टरों का स्वचालित संश्लेषण

त्रुहिलो और ओलाग्यू[30] ने विधि प्रस्तुत की है जिसमें आनुवंशिक प्रोग्रामिंग का उपयोग करके स्वचालित रूप से छवि ऑपरेटर संश्लेषण किया जाता है जो रुचि बिंदुओं को पता लगा सकते हैं। टर्मिनल और फंक्शन सेट में प्राथमिक आपरेशन सम्मलित हैं जो पहले से प्रस्तावित मन-निर्मित डिज़ाइन में सामान्य रूप से पाए जाते हैं। फिटनेस मापक प्रत्येक ऑपरेटर की स्थिरता को अवरुद्धता दरदी माध्यम से मापता है, और छवि तस्वीर प्लेन में पाये गए बिंदुओं के विन्यास में समान वितरण को बढ़ावा देता है। विकसित ऑपरेटर्स के प्रदर्शन को प्रयोगात्मक रूप से प्रमाणित किया गया है जब आदेशित और परीक्षण श्रृंखलाओं का उपयोग करके प्रगतिशील रूप से परिवर्तित छवियों के लिए किया गया है। इसलिए, प्रस्तावित जीपी एल्गोरिदम को रुचि बिंदु डिटेक्शन की समस्या के लिए मानव-प्रतियोगी माना जाता है।

स्थानिक-अस्थायी रुचि बिंदु डिटेक्टर

इस प्रकार स्थान-समय में हैरिस ऑपरेटर को लपटेव और लिन्डबर्ग द्वारा स्थान-समय तक विस्तारित किया गया है।[31]होने देना स्थान-समय द्वितीय-मोमेंट आव्यूह को प्रतिनिधित्व करने वाला समकालिक संबंधी आव्यूह के द्वारा चित्रित करें