गैबोर फिल्टर: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 1: Line 1:
{{Short description|Linear filter used for texture analysis}}
{{Short description|Linear filter used for texture analysis}}
{{Technical|date=February 2017}}
[[File:Gabor filter function.png|thumb|right|द्वि-आयामी गैबोर फ़िल्टर का उदाहरण]]छवि प्रसंस्करण में, गैबोर फ़िल्टर, जिसका नाम [[डेनिस गैबोर]] के नाम पर रखा गया, जिन्होंने सबसे पहले इसे 1D फ़िल्टर के रूप में प्रस्तावित किया था।<ref>
[[File:Gabor filter function.png|thumb|right|द्वि-आयामी गैबोर फ़िल्टर का उदाहरण]]छवि प्रसंस्करण में, एक गैबोर फ़िल्टर, जिसका नाम [[डेनिस गैबोर]] के नाम पर रखा गया, जिन्होंने सबसे पहले इसे 1D फ़िल्टर के रूप में प्रस्तावित किया था।<ref>
{{cite journal | last1 = Gabor, D. | title = Theory of communication. | journal = J. Inst. Electr. Eng. |volume=93 |year = 1946}}</ref> गैबोर फ़िल्टर को सबसे पहले गोस्टा ग्रैनलुंड द्वारा 2D में सामान्यीकृत किया गया था,<ref>
{{cite journal | last1 = Gabor, D. | title = Theory of communication. | journal = J. Inst. Electr. Eng. |volume=93 |year = 1946}}</ref> गैबोर फ़िल्टर को सबसे पहले गोस्टा ग्रैनलुंड द्वारा 2D में सामान्यीकृत किया गया था,<ref>
{{cite journal | last1 = Granlund G. H. | title = In Search of a General Picture Processing Operator. | journal = Computer Graphics and Image Processing |volume=8 |issue=2 |pages=155–173 |issn=0146-664X| doi=10.1016/0146-664X(78)90047-3 | year = 1978}}</ref> एक संदर्भ दिशा जोड़कर.
{{cite journal | last1 = Granlund G. H. | title = In Search of a General Picture Processing Operator. | journal = Computer Graphics and Image Processing |volume=8 |issue=2 |pages=155–173 |issn=0146-664X| doi=10.1016/0146-664X(78)90047-3 | year = 1978}}</ref> एक संदर्भ दिशा जोड़कर.
गैबोर फ़िल्टर एक [[रैखिक फ़िल्टर]] है जिसका उपयोग बनावट मानचित्रण विश्लेषण के लिए किया जाता है, जिसका अनिवार्य रूप से अर्थ है कि यह विश्लेषण करता है कि विश्लेषण के बिंदु या क्षेत्र के आसपास स्थानीयकृत क्षेत्र में विशिष्ट दिशाओं में छवि में कोई विशिष्ट आवृत्ति सामग्री है या नहीं। कई समकालीन दृष्टि वैज्ञानिकों द्वारा गैबोर फिल्टर की आवृत्ति और अभिविन्यास प्रतिनिधित्व को [[मानव दृश्य प्रणाली]] के समान होने का माँग किया गया है।<ref>{{cite journal | last1 = Olshausen, B. A. & Field, D. J. | title = प्राकृतिक छवियों के लिए विरल कोड सीखकर सरल-कोशिका ग्रहणशील-क्षेत्र गुणों का उद्भव।| journal = Nature |volume=381 |pages=607–609 | year = 1996| issue = 6583 | doi = 10.1038/381607a0 | pmid = 8637596 | bibcode = 1996Natur.381..607O | s2cid = 4358477 }}</ref> उन्हें बनावट प्रतिनिधित्व और भेदभाव के लिए विशेष रूप से उपयुक्त पाया गया है। स्थानिक डोमेन में, 2D गैबोर फ़िल्टर एक [[ गाऊसी ]] [[कर्नेल फ़ंक्शन|कर्नेल फलन]] है जो [[sinusoidal|साइनसॉइडल]] [[ समतल लहर | समतल वेव]] द्वारा संशोधित होता है ([[गैबोर परिवर्तन]] देखें)।
गैबोर फ़िल्टर [[रैखिक फ़िल्टर]] है जिसका उपयोग बनावट मानचित्रण विश्लेषण के लिए किया जाता है, जिसका अनिवार्य रूप से अर्थ है कि यह विश्लेषण करता है कि विश्लेषण के बिंदु या क्षेत्र के आसपास स्थानीयकृत क्षेत्र में विशिष्ट दिशाओं में छवि में कोई विशिष्ट आवृत्ति सामग्री है या नहीं। कई समकालीन दृष्टि वैज्ञानिकों द्वारा गैबोर फिल्टर की आवृत्ति और अभिविन्यास प्रतिनिधित्व को [[मानव दृश्य प्रणाली]] के समान होने का माँग किया गया है।<ref>{{cite journal | last1 = Olshausen, B. A. & Field, D. J. | title = प्राकृतिक छवियों के लिए विरल कोड सीखकर सरल-कोशिका ग्रहणशील-क्षेत्र गुणों का उद्भव।| journal = Nature |volume=381 |pages=607–609 | year = 1996| issue = 6583 | doi = 10.1038/381607a0 | pmid = 8637596 | bibcode = 1996Natur.381..607O | s2cid = 4358477 }}</ref> उन्हें बनावट प्रतिनिधित्व और भेदभाव के लिए विशेष रूप से उपयुक्त पाया गया है। स्थानिक डोमेन में, 2D गैबोर फ़िल्टर एक [[ गाऊसी ]] [[कर्नेल फ़ंक्शन|कर्नेल फलन]] है जो [[sinusoidal|साइनसॉइडल]] [[ समतल लहर | समतल वेव]] द्वारा संशोधित होता है ([[गैबोर परिवर्तन]] देखें)।


कुछ लेखकों का मानना है कि [[स्तनधारी मस्तिष्क]] के दृश्य प्रांतस्था में सरल कोशिकाओं को गैबोर फलन द्वारा मॉडल किया जा सकता है।<ref>{{cite journal | last1 = Marčelja | first1 = S. | year = 1980 | title = सरल कॉर्टिकल कोशिकाओं की प्रतिक्रियाओं का गणितीय विवरण| journal = Journal of the Optical Society of America | volume = 70 | issue = 11| pages = 1297–1300 | doi = 10.1364/JOSA.70.001297 | pmid = 7463179 | bibcode = 1980JOSA...70.1297M }}</ref><ref>{{Cite journal|last=Daugman|first=John G.|date=1985-07-01|title=अंतरिक्ष में रिज़ॉल्यूशन, स्थानिक आवृत्ति और दो-आयामी दृश्य कॉर्टिकल फ़िल्टर द्वारा अनुकूलित अभिविन्यास के लिए अनिश्चितता संबंध|journal=Journal of the Optical Society of America A|language=en|volume=2|issue=7|pages=1160–9|bibcode=1985JOSAA...2.1160D|citeseerx=10.1.1.465.8506|doi=10.1364/JOSAA.2.001160|issn=1084-7529|pmid=4020513|s2cid=9271650 }}</ref> इस प्रकार, गैबोर फिल्टर के साथ [[छवि विश्लेषण]] को कुछ लोगों द्वारा मानव दृश्य प्रणाली में धारणा के समान माना जाता है।
कुछ लेखकों का मानना है कि [[स्तनधारी मस्तिष्क]] के दृश्य प्रांतस्था में सरल कोशिकाओं को गैबोर फलन द्वारा मॉडल किया जा सकता है।<ref>{{cite journal | last1 = Marčelja | first1 = S. | year = 1980 | title = सरल कॉर्टिकल कोशिकाओं की प्रतिक्रियाओं का गणितीय विवरण| journal = Journal of the Optical Society of America | volume = 70 | issue = 11| pages = 1297–1300 | doi = 10.1364/JOSA.70.001297 | pmid = 7463179 | bibcode = 1980JOSA...70.1297M }}</ref><ref>{{Cite journal|last=Daugman|first=John G.|date=1985-07-01|title=अंतरिक्ष में रिज़ॉल्यूशन, स्थानिक आवृत्ति और दो-आयामी दृश्य कॉर्टिकल फ़िल्टर द्वारा अनुकूलित अभिविन्यास के लिए अनिश्चितता संबंध|journal=Journal of the Optical Society of America A|language=en|volume=2|issue=7|pages=1160–9|bibcode=1985JOSAA...2.1160D|citeseerx=10.1.1.465.8506|doi=10.1364/JOSAA.2.001160|issn=1084-7529|pmid=4020513|s2cid=9271650 }}</ref> इस प्रकार, गैबोर फिल्टर के साथ [[छवि विश्लेषण]] को कुछ लोगों द्वारा मानव दृश्य प्रणाली में धारणा के समान माना जाता है।


== परिभाषा ==
== परिभाषा ==
{{Disputed section|date=February 2013}}
इसकी [[आवेग प्रतिक्रिया]] को [[गॉसियन फ़ंक्शन|गॉसियन फलन]] द्वारा गुणा की गई [[ साइन लहर ]] वेव (2D गैबोर फिल्टर के लिए प्लेन वेव) द्वारा परिभाषित किया गया है।<ref name="FogelSagi1989">{{Cite journal|last1=Fogel|first1=I.|last2=Sagi|first2=D.|date=June 1989|title=गैबोर बनावट विभेदक के रूप में फ़िल्टर करता है|journal=Biological Cybernetics|language=en|volume=61|issue=2|pages=103–113 |citeseerx=10.1.1.367.2700|doi=10.1007/BF00204594|s2cid=14952808|issn=0340-1200|oclc=895625214}}</ref>
इसकी [[आवेग प्रतिक्रिया]] को [[गॉसियन फ़ंक्शन|गॉसियन फलन]] द्वारा गुणा की गई [[ साइन लहर ]] वेव (2D गैबोर फिल्टर के लिए एक प्लेन वेव) द्वारा परिभाषित किया गया है।<ref name="FogelSagi1989">{{Cite journal|last1=Fogel|first1=I.|last2=Sagi|first2=D.|date=June 1989|title=गैबोर बनावट विभेदक के रूप में फ़िल्टर करता है|journal=Biological Cybernetics|language=en|volume=61|issue=2|pages=103–113 |citeseerx=10.1.1.367.2700|doi=10.1007/BF00204594|s2cid=14952808|issn=0340-1200|oclc=895625214}}</ref>


गुणन-कन्वोल्यूशन प्रॉपर्टी (कन्वोल्यूशन प्रमेय) के कारण, गैबोर फिल्टर की आवेग प्रतिक्रिया का [[फूरियर रूपांतरण]] हार्मोनिक फलन (साइनसॉइडल फलन) के फूरियर ट्रांसफॉर्म और गॉसियन फलन के फूरियर ट्रांसफॉर्म का [[कनवल्शन]] है। फ़िल्टर में एक [[वास्तविक संख्या]] और एक [[काल्पनिक संख्या]] घटक होता है जो [[ ओर्थोगोनल | ओर्थोगोनल]] दिशाओं का प्रतिनिधित्व करता है।<ref>3D surface tracking and approximation using
गुणन-कन्वोल्यूशन प्रॉपर्टी (कन्वोल्यूशन प्रमेय) के कारण, गैबोर फिल्टर की आवेग प्रतिक्रिया का [[फूरियर रूपांतरण]] हार्मोनिक फलन (साइनसॉइडल फलन) के फूरियर ट्रांसफॉर्म और गॉसियन फलन के फूरियर ट्रांसफॉर्म का [[कनवल्शन]] है। फ़िल्टर में [[वास्तविक संख्या]] और [[काल्पनिक संख्या]] घटक होता है जो [[ ओर्थोगोनल | ओर्थोगोनल]] दिशाओं का प्रतिनिधित्व करता है।<ref>3D surface tracking and approximation using
Gabor filters, Jesper Juul Henriksen, South Denmark University, March 28, 2007</ref> दोनों घटकों को एक [[जटिल संख्या]] में बनाया जा सकता है या व्यक्तिगत रूप से उपयोग किया जा सकता है।
Gabor filters, Jesper Juul Henriksen, South Denmark University, March 28, 2007</ref> दोनों घटकों को [[जटिल संख्या]] में बनाया जा सकता है या व्यक्तिगत रूप से उपयोग किया जा सकता है।


जटिल
जटिल
Line 28: Line 26:
इस समीकरण में, <math>\lambda</math> साइनसॉइडल कारक की तरंग दैर्ध्य का प्रतिनिधित्व करता है, <math>\theta</math> [[गैबोर फ़ंक्शन|गैबोर फलन]] की समानांतर धारियों के लिए सामान्य के उन्मुखीकरण का प्रतिनिधित्व करता है, <math>\psi</math> चरण ऑफसेट है, <math>\sigma</math> गॉसियन लिफाफे का सिग्मा/मानक विचलन है और <math>\gamma</math> स्थानिक पहलू अनुपात है, और गैबोर फलन के समर्थन की अण्डाकारता निर्दिष्ट करता है।
इस समीकरण में, <math>\lambda</math> साइनसॉइडल कारक की तरंग दैर्ध्य का प्रतिनिधित्व करता है, <math>\theta</math> [[गैबोर फ़ंक्शन|गैबोर फलन]] की समानांतर धारियों के लिए सामान्य के उन्मुखीकरण का प्रतिनिधित्व करता है, <math>\psi</math> चरण ऑफसेट है, <math>\sigma</math> गॉसियन लिफाफे का सिग्मा/मानक विचलन है और <math>\gamma</math> स्थानिक पहलू अनुपात है, और गैबोर फलन के समर्थन की अण्डाकारता निर्दिष्ट करता है।


== वेवलेट स्पेस == <!-- This section is linked from redirect "[[Gabor Wavelet]]" -->
== वेवलेट स्पेस ==  
[[File:Gabor-ocr.png|thumb|चीनी ओसीआर पर लागू गैबोर फ़िल्टर का प्रदर्शन। दाईं ओर चार अभिविन्यास 0°, 45°, 90° और 135° दिखाए गए हैं। मूल चरित्र चित्र और सभी चार अभिविन्यासों का सुपरपोज़िशन बाईं ओर दिखाया गया है।]]गैबोर फ़िल्टर सीधे [[गैबोर वेवलेट]]्स से संबंधित हैं, क्योंकि उन्हें कई फैलाव और घुमावों के लिए डिज़ाइन किया जा सकता है। चूंकि, सामान्यतः, गैबोर तरंगिकाओं के लिए विस्तार प्रयुक्त नहीं किया जाता है, क्योंकि इसके लिए द्वि-ऑर्थोगोनल तरंगिकाओं की गणना की आवश्यकता होती है, जो बहुत समय लेने वाली हो सकती है। इसलिए, सामान्यतः, विभिन्न पैमानों और घुमावों वाले गैबोर फिल्टर से युक्त एक फिल्टर बैंक बनाया जाता है। फ़िल्टर सिग्नल के साथ जुड़ जाते हैं, जिसके परिणामस्वरूप तथाकथित गैबर स्पेस बनता है। यह प्रक्रिया प्राथमिक दृश्य प्रांतस्था में प्रक्रियाओं से निकटता से संबंधित है।<ref>{{citation |last=Daugman |first=J.G. |author-link=John Daugman |title=Two-dimensional spectral analysis of cortical receptive field profiles |year=1980 |journal=Vision Res. |volume=20 |issue=10 |pages=847–56 |pmid=7467139 |doi=10.1016/0042-6989(80)90065-6|s2cid=40518532 }}</ref>
[[File:Gabor-ocr.png|thumb|चीनी ओसीआर पर लागू गैबोर फ़िल्टर का प्रदर्शन। दाईं ओर चार अभिविन्यास 0°, 45°, 90° और 135° दिखाए गए हैं। मूल चरित्र चित्र और सभी चार अभिविन्यासों का सुपरपोज़िशन बाईं ओर दिखाया गया है।]]गैबोर फ़िल्टर सीधे [[गैबोर वेवलेट]]्स से संबंधित हैं, क्योंकि उन्हें कई फैलाव और घुमावों के लिए डिज़ाइन किया जा सकता है। चूंकि, सामान्यतः, गैबोर तरंगिकाओं के लिए विस्तार प्रयुक्त नहीं किया जाता है, क्योंकि इसके लिए द्वि-ऑर्थोगोनल तरंगिकाओं की गणना की आवश्यकता होती है, जो बहुत समय लेने वाली हो सकती है। इसलिए, सामान्यतः, विभिन्न पैमानों और घुमावों वाले गैबोर फिल्टर से युक्त फिल्टर बैंक बनाया जाता है। फ़िल्टर सिग्नल के साथ जुड़ जाते हैं, जिसके परिणामस्वरूप तथाकथित गैबर स्पेस बनता है। यह प्रक्रिया प्राथमिक दृश्य प्रांतस्था में प्रक्रियाओं से निकटता से संबंधित है।<ref>{{citation |last=Daugman |first=J.G. |author-link=John Daugman |title=Two-dimensional spectral analysis of cortical receptive field profiles |year=1980 |journal=Vision Res. |volume=20 |issue=10 |pages=847–56 |pmid=7467139 |doi=10.1016/0042-6989(80)90065-6|s2cid=40518532 }}</ref>
जोन्स और पामर ने दिखाया कि जटिल गैबोर फलन का वास्तविक भाग बिल्ली के स्ट्रिएट कॉर्टेक्स में सरल कोशिकाओं में पाए जाने वाले ग्रहणशील क्षेत्र वजन कार्यों के लिए उपयुक्त है।<ref>{{cite journal | last1 = Jones | first1 = J.P. | last2 = Palmer | first2 = L.A. | year = 1987 | title = कैट स्ट्रिएट कॉर्टेक्स में सरल ग्रहणशील क्षेत्रों के द्वि-आयामी गैबोर फ़िल्टर मॉडल का मूल्यांकन| url = http://pdfs.semanticscholar.org/0dbf/797d5b34f40d16eeadfa7a5b4543c2af2c11.pdf | archive-url = https://web.archive.org/web/20200228110529/http://pdfs.semanticscholar.org/0dbf/797d5b34f40d16eeadfa7a5b4543c2af2c11.pdf | url-status = dead | archive-date = 2020-02-28 | journal = J. Neurophysiol. | volume = 58 | issue = 6| pages = 1233–1258 | doi = 10.1152/jn.1987.58.6.1233 | pmid = 3437332 | s2cid = 16809045 }}</ref>
जोन्स और पामर ने दिखाया कि जटिल गैबोर फलन का वास्तविक भाग बिल्ली के स्ट्रिएट कॉर्टेक्स में सरल कोशिकाओं में पाए जाने वाले ग्रहणशील क्षेत्र वजन कार्यों के लिए उपयुक्त है।<ref>{{cite journal | last1 = Jones | first1 = J.P. | last2 = Palmer | first2 = L.A. | year = 1987 | title = कैट स्ट्रिएट कॉर्टेक्स में सरल ग्रहणशील क्षेत्रों के द्वि-आयामी गैबोर फ़िल्टर मॉडल का मूल्यांकन| url = http://pdfs.semanticscholar.org/0dbf/797d5b34f40d16eeadfa7a5b4543c2af2c11.pdf | archive-url = https://web.archive.org/web/20200228110529/http://pdfs.semanticscholar.org/0dbf/797d5b34f40d16eeadfa7a5b4543c2af2c11.pdf | url-status = dead | archive-date = 2020-02-28 | journal = J. Neurophysiol. | volume = 58 | issue = 6| pages = 1233–1258 | doi = 10.1152/jn.1987.58.6.1233 | pmid = 3437332 | s2cid = 16809045 }}</ref>


Line 35: Line 33:
== गैबोर फिल्टर का समय-कारण एनालॉग ==
== गैबोर फिल्टर का समय-कारण एनालॉग ==


अस्थायी संकेतों को संसाधित करते समय, भविष्य के डेटा तक नहीं पहुंचा जा सकता है, जिससे अस्थायी आयाम पर निर्भर वास्तविक समय संकेतों को संसाधित करने के लिए गैबोर फलन का उपयोग करने का प्रयास करने पर समस्याएं उत्पन होती हैं। गैबोर फ़िल्टर का एक समय-कारण एनालॉग विकसित किया गया है <ref name=Lin23> {{cite journal |last1=Lindeberg |first1=T. |title=A time-causal and time-recursive scale-covariant scale-space representation of temporal signals and past time |journal=Biological Cybernetics |date=23 January 2023 |volume=117 |issue=1–2 |pages=21–59 |doi=10.1007/s00422-022-00953-6|pmid=36689001 |pmc=10160219 |doi-access=free }}</ref> गैबोर फलन में गॉसियन कर्नेल को समय-कारण और समय-पुनरावर्ती कर्नेल के साथ बदलने पर आधारित, जिसे समय-कारण सीमा कर्नेल कहा जाता है। इस तरह, समय-कारण सीमा कर्नेल के परिणामी जटिल-मूल्य विस्तार के आधार पर समय-आवृत्ति विश्लेषण गैबोर फ़िल्टर के रूप में अस्थायी संकेत के अनिवार्य रूप से समान परिवर्तनों को पकड़ना संभव बनाता है, और जैसा कि हाइजेनबर्ग समूह द्वारा वर्णित किया जा सकता है, देखें <ref name=Lin23/>अधिक जानकारी के लिए।
अस्थायी संकेतों को संसाधित करते समय, भविष्य के डेटा तक नहीं पहुंचा जा सकता है, जिससे अस्थायी आयाम पर निर्भर वास्तविक समय संकेतों को संसाधित करने के लिए गैबोर फलन का उपयोग करने का प्रयास करने पर समस्याएं उत्पन होती हैं। गैबोर फ़िल्टर का समय-कारण एनालॉग विकसित किया गया है <ref name=Lin23> {{cite journal |last1=Lindeberg |first1=T. |title=A time-causal and time-recursive scale-covariant scale-space representation of temporal signals and past time |journal=Biological Cybernetics |date=23 January 2023 |volume=117 |issue=1–2 |pages=21–59 |doi=10.1007/s00422-022-00953-6|pmid=36689001 |pmc=10160219 |doi-access=free }}</ref> गैबोर फलन में गॉसियन कर्नेल को समय-कारण और समय-पुनरावर्ती कर्नेल के साथ बदलने पर आधारित, जिसे समय-कारण सीमा कर्नेल कहा जाता है। इस तरह, समय-कारण सीमा कर्नेल के परिणामी जटिल-मूल्य विस्तार के आधार पर समय-आवृत्ति विश्लेषण गैबोर फ़िल्टर के रूप में अस्थायी संकेत के अनिवार्य रूप से समान परिवर्तनों को पकड़ना संभव बनाता है, और जैसा कि हाइजेनबर्ग समूह द्वारा वर्णित किया जा सकता है, देखें <ref name=Lin23/>अधिक जानकारी के लिए।


== छवियों से सुविधाओं का निष्कर्षण ==
== छवियों से सुविधाओं का निष्कर्षण ==


विभिन्न आवृत्तियों और अभिविन्यासों के साथ गैबोर फ़िल्टर का एक सेट किसी छवि से उपयोगी सुविधाएँ निकालने में सहायक हो सकता है।<ref>{{Cite book | doi = 10.1007/978-3-642-40246-3_55| chapter = Identification Using Encrypted Biometrics| title = छवियों और पैटर्न का कंप्यूटर विश्लेषण| volume = 8048| pages = 440| series = Lecture Notes in Computer Science| year = 2013| last1 = Haghighat | first1 = M. | last2 = Zonouz | first2 = S. | last3 = Abdel-Mottaleb | first3 = M. | isbn = 978-3-642-40245-6}}</ref> असतत डोमेन में, द्वि-आयामी गैबर फ़िल्टर दिए गए हैं,
विभिन्न आवृत्तियों और अभिविन्यासों के साथ गैबोर फ़िल्टर का सेट किसी छवि से उपयोगी सुविधाएँ निकालने में सहायक हो सकता है।<ref>{{Cite book | doi = 10.1007/978-3-642-40246-3_55| chapter = Identification Using Encrypted Biometrics| title = छवियों और पैटर्न का कंप्यूटर विश्लेषण| volume = 8048| pages = 440| series = Lecture Notes in Computer Science| year = 2013| last1 = Haghighat | first1 = M. | last2 = Zonouz | first2 = S. | last3 = Abdel-Mottaleb | first3 = M. | isbn = 978-3-642-40245-6}}</ref> असतत डोमेन में, द्वि-आयामी गैबर फ़िल्टर दिए गए हैं,
:<math>G_c[i,j] = B e^{-\frac{(i^2+j^2)}{2\sigma^2}} \cos(2\pi f(i\cos\theta+j\sin\theta))</math>
:<math>G_c[i,j] = B e^{-\frac{(i^2+j^2)}{2\sigma^2}} \cos(2\pi f(i\cos\theta+j\sin\theta))</math>
:<math>G_s[i,j] = C e^{-\frac{(i^2+j^2)}{2\sigma^2}} \sin(2\pi f(i\cos\theta+j\sin\theta))</math>
:<math>G_s[i,j] = C e^{-\frac{(i^2+j^2)}{2\sigma^2}} \sin(2\pi f(i\cos\theta+j\sin\theta))</math>
Line 55: Line 53:
== उदाहरण कार्यान्वयन ==
== उदाहरण कार्यान्वयन ==


यह [[पायथन (प्रोग्रामिंग भाषा)]] में एक उदाहरण कार्यान्वयन है:
यह [[पायथन (प्रोग्रामिंग भाषा)]] में उदाहरण कार्यान्वयन है:


<syntaxhighlight lang="numpy">
<syntaxhighlight lang="numpy">
Line 91: Line 89:
छवियों पर कार्यान्वयन के लिए, [https://pythonhosted.org/LogGabor/] देखें।
छवियों पर कार्यान्वयन के लिए, [https://pythonhosted.org/LogGabor/] देखें।


यह [[MATLAB]]/GNU ऑक्टेव में एक उदाहरण कार्यान्वयन है:
यह [[MATLAB]]/GNU ऑक्टेव में उदाहरण कार्यान्वयन है:


<syntaxhighlight lang="matlab">
<syntaxhighlight lang="matlab">

Revision as of 22:46, 1 August 2023

द्वि-आयामी गैबोर फ़िल्टर का उदाहरण

छवि प्रसंस्करण में, गैबोर फ़िल्टर, जिसका नाम डेनिस गैबोर के नाम पर रखा गया, जिन्होंने सबसे पहले इसे 1D फ़िल्टर के रूप में प्रस्तावित किया था।[1] गैबोर फ़िल्टर को सबसे पहले गोस्टा ग्रैनलुंड द्वारा 2D में सामान्यीकृत किया गया था,[2] एक संदर्भ दिशा जोड़कर.

गैबोर फ़िल्टर रैखिक फ़िल्टर है जिसका उपयोग बनावट मानचित्रण विश्लेषण के लिए किया जाता है, जिसका अनिवार्य रूप से अर्थ है कि यह विश्लेषण करता है कि विश्लेषण के बिंदु या क्षेत्र के आसपास स्थानीयकृत क्षेत्र में विशिष्ट दिशाओं में छवि में कोई विशिष्ट आवृत्ति सामग्री है या नहीं। कई समकालीन दृष्टि वैज्ञानिकों द्वारा गैबोर फिल्टर की आवृत्ति और अभिविन्यास प्रतिनिधित्व को मानव दृश्य प्रणाली के समान होने का माँग किया गया है।[3] उन्हें बनावट प्रतिनिधित्व और भेदभाव के लिए विशेष रूप से उपयुक्त पाया गया है। स्थानिक डोमेन में, 2D गैबोर फ़िल्टर एक गाऊसी कर्नेल फलन है जो साइनसॉइडल समतल वेव द्वारा संशोधित होता है (गैबोर परिवर्तन देखें)।

कुछ लेखकों का मानना है कि स्तनधारी मस्तिष्क के दृश्य प्रांतस्था में सरल कोशिकाओं को गैबोर फलन द्वारा मॉडल किया जा सकता है।[4][5] इस प्रकार, गैबोर फिल्टर के साथ छवि विश्लेषण को कुछ लोगों द्वारा मानव दृश्य प्रणाली में धारणा के समान माना जाता है।

परिभाषा

इसकी आवेग प्रतिक्रिया को गॉसियन फलन द्वारा गुणा की गई साइन लहर वेव (2D गैबोर फिल्टर के लिए प्लेन वेव) द्वारा परिभाषित किया गया है।[6]

गुणन-कन्वोल्यूशन प्रॉपर्टी (कन्वोल्यूशन प्रमेय) के कारण, गैबोर फिल्टर की आवेग प्रतिक्रिया का फूरियर रूपांतरण हार्मोनिक फलन (साइनसॉइडल फलन) के फूरियर ट्रांसफॉर्म और गॉसियन फलन के फूरियर ट्रांसफॉर्म का कनवल्शन है। फ़िल्टर में वास्तविक संख्या और काल्पनिक संख्या घटक होता है जो ओर्थोगोनल दिशाओं का प्रतिनिधित्व करता है।[7] दोनों घटकों को जटिल संख्या में बनाया जा सकता है या व्यक्तिगत रूप से उपयोग किया जा सकता है।

जटिल

वास्तविक

काल्पनिक

जहाँ और .

इस समीकरण में, साइनसॉइडल कारक की तरंग दैर्ध्य का प्रतिनिधित्व करता है, गैबोर फलन की समानांतर धारियों के लिए सामान्य के उन्मुखीकरण का प्रतिनिधित्व करता है, चरण ऑफसेट है, गॉसियन लिफाफे का सिग्मा/मानक विचलन है और स्थानिक पहलू अनुपात है, और गैबोर फलन के समर्थन की अण्डाकारता निर्दिष्ट करता है।

वेवलेट स्पेस

चीनी ओसीआर पर लागू गैबोर फ़िल्टर का प्रदर्शन। दाईं ओर चार अभिविन्यास 0°, 45°, 90° और 135° दिखाए गए हैं। मूल चरित्र चित्र और सभी चार अभिविन्यासों का सुपरपोज़िशन बाईं ओर दिखाया गया है।

गैबोर फ़िल्टर सीधे गैबोर वेवलेट्स से संबंधित हैं, क्योंकि उन्हें कई फैलाव और घुमावों के लिए डिज़ाइन किया जा सकता है। चूंकि, सामान्यतः, गैबोर तरंगिकाओं के लिए विस्तार प्रयुक्त नहीं किया जाता है, क्योंकि इसके लिए द्वि-ऑर्थोगोनल तरंगिकाओं की गणना की आवश्यकता होती है, जो बहुत समय लेने वाली हो सकती है। इसलिए, सामान्यतः, विभिन्न पैमानों और घुमावों वाले गैबोर फिल्टर से युक्त फिल्टर बैंक बनाया जाता है। फ़िल्टर सिग्नल के साथ जुड़ जाते हैं, जिसके परिणामस्वरूप तथाकथित गैबर स्पेस बनता है। यह प्रक्रिया प्राथमिक दृश्य प्रांतस्था में प्रक्रियाओं से निकटता से संबंधित है।[8]

जोन्स और पामर ने दिखाया कि जटिल गैबोर फलन का वास्तविक भाग बिल्ली के स्ट्रिएट कॉर्टेक्स में सरल कोशिकाओं में पाए जाने वाले ग्रहणशील क्षेत्र वजन कार्यों के लिए उपयुक्त है।[9]


गैबोर फिल्टर का समय-कारण एनालॉग

अस्थायी संकेतों को संसाधित करते समय, भविष्य के डेटा तक नहीं पहुंचा जा सकता है, जिससे अस्थायी आयाम पर निर्भर वास्तविक समय संकेतों को संसाधित करने के लिए गैबोर फलन का उपयोग करने का प्रयास करने पर समस्याएं उत्पन होती हैं। गैबोर फ़िल्टर का समय-कारण एनालॉग विकसित किया गया है [10] गैबोर फलन में गॉसियन कर्नेल को समय-कारण और समय-पुनरावर्ती कर्नेल के साथ बदलने पर आधारित, जिसे समय-कारण सीमा कर्नेल कहा जाता है। इस तरह, समय-कारण सीमा कर्नेल के परिणामी जटिल-मूल्य विस्तार के आधार पर समय-आवृत्ति विश्लेषण गैबोर फ़िल्टर के रूप में अस्थायी संकेत के अनिवार्य रूप से समान परिवर्तनों को पकड़ना संभव बनाता है, और जैसा कि हाइजेनबर्ग समूह द्वारा वर्णित किया जा सकता है, देखें [10]अधिक जानकारी के लिए।

छवियों से सुविधाओं का निष्कर्षण

विभिन्न आवृत्तियों और अभिविन्यासों के साथ गैबोर फ़िल्टर का सेट किसी छवि से उपयोगी सुविधाएँ निकालने में सहायक हो सकता है।[11] असतत डोमेन में, द्वि-आयामी गैबर फ़िल्टर दिए गए हैं,

जहां B और C निर्धारित किए जाने वाले सामान्यीकरण कारक हैं।

2D गैबर फिल्टर का छवि प्रसंस्करण में समृद्ध अनुप्रयोग है, विशेष रूप से बनावट विश्लेषण और विभाजन के लिए फीचर निष्कर्षण में।[12] बनावट में खोजी जा रही आवृत्ति को परिभाषित करता है। भिन्न-भिन्न करके , हम किसी विशेष दिशा में उन्मुख बनावट की तलाश कर सकते हैं। भिन्न-भिन्न करके , हम विश्लेषण किए जा रहे छवि क्षेत्र के आधार या आकार का समर्थन बदलते हैं।

छवि प्रसंस्करण में 2D गैबोर फिल्टर का अनुप्रयोग

डाक्यूमेंटेशन छवि प्रसंस्करण में, गैबोर सुविधाएँ बहुभाषी डाक्यूमेंटेशन में किसी शब्द की लिपि की पहचान करने के लिए आदर्श हैं।[13] विभिन्न आवृत्तियों और विभिन्न दिशाओं में अभिविन्यास वाले गैबर फ़िल्टर का उपयोग जटिल डाक्यूमेंटेशन छवियों (ग्रे और रंग दोनों) से केवल-पाठ क्षेत्रों को स्थानीयकृत करने और निकालने के लिए किया गया है, क्योंकि पाठ उच्च आवृत्ति घटकों में समृद्ध है, जबकि चित्र प्रकृति में अपेक्षाकृत चिकनी हैं।[14][15][16] इसे चेहरे की अभिव्यक्ति पहचानने के लिए भी लागू किया गया है [17]

पैटर्न विश्लेषण अनुप्रयोगों में गैबोर फिल्टर का भी व्यापक रूप से उपयोग किया गया है। उदाहरण के लिए, इसका उपयोग कशेरुक स्तंभ में छिद्रपूर्ण स्पंजी ट्रैब्युलर हड्डी के अंदर दिशात्मक वितरण का अध्ययन करने के लिए किया गया है।[18] गैबोर स्पेस ऑप्टिकल कैरेक्टर मान्यता, आईरिस पहचान और फिंगरप्रिंट पहचान जैसे इमेज प्रोसेसिंग अनुप्रयोगों में बहुत उपयोगी है। किसी छवि में वस्तुओं के बीच किसी विशिष्ट स्थानिक स्थान के लिए सक्रियता के बीच संबंध बहुत विशिष्ट होते हैं। इसके अतिरिक्त, विरल वस्तु प्रतिनिधित्व बनाने के लिए गैबोर स्पेस से महत्वपूर्ण सक्रियण निकाले जा सकते हैं।

उदाहरण कार्यान्वयन

यह पायथन (प्रोग्रामिंग भाषा) में उदाहरण कार्यान्वयन है:

import numpy as np


def gabor(sigma, theta, Lambda, psi, gamma):
    """Gabor feature extraction."""
    sigma_x = sigma
    sigma_y = float(sigma) / gamma

    # Bounding box
    nstds = 3  # Number of standard deviation sigma
    xmax = max(
        abs(nstds * sigma_x * np.cos(theta)), abs(nstds * sigma_y * np.sin(theta))
    )
    xmax = np.ceil(max(1, xmax))
    ymax = max(
        abs(nstds * sigma_x * np.sin(theta)), abs(nstds * sigma_y * np.cos(theta))
    )
    ymax = np.ceil(max(1, ymax))
    xmin = -xmax
    ymin = -ymax
    (y, x) = np.meshgrid(np.arange(ymin, ymax + 1), np.arange(xmin, xmax + 1))

    # Rotation
    x_theta = x * np.cos(theta) + y * np.sin(theta)
    y_theta = -x * np.sin(theta) + y * np.cos(theta)

    gb = np.exp(
        -0.5 * (x_theta**2 / sigma_x**2 + y_theta**2 / sigma_y**2)
    ) * np.cos(2 * np.pi / Lambda * x_theta + psi)
    return gb

छवियों पर कार्यान्वयन के लिए, [1] देखें।

यह MATLAB/GNU ऑक्टेव में उदाहरण कार्यान्वयन है:

function gb=gabor_fn(sigma, theta, lambda, psi, gamma)

sigma_x = sigma;
sigma_y = sigma / gamma;

% Bounding box
nstds = 3;
xmax = max(abs(nstds * sigma_x * cos(theta)), abs(nstds * sigma_y * sin(theta)));
xmax = ceil(max(1, xmax));
ymax = max(abs(nstds * sigma_x * sin(theta)), abs(nstds * sigma_y * cos(theta)));
ymax = ceil(max(1, ymax));
xmin = -xmax; ymin = -ymax;
[x,y] = meshgrid(xmin:xmax, ymin:ymax);

% Rotation 
x_theta = x * cos(theta) + y * sin(theta);
y_theta = -x * sin(theta) + y * cos(theta);

gb = exp(-.5*(x_theta.^2/sigma_x^2+y_theta.^2/sigma_y^2)).*cos(2*pi/lambda*x_theta+psi);

MATLAB में छवियों से गैबोर सुविधा निष्कर्षण के लिए कोड http://www.mathworks.com/matlabcentral/fileexchange/44630 पर पाया जा सकता है।

यह हास्केल (प्रोग्रामिंग भाषा) में कार्यान्वयन का एक और उदाहरण है:

import Data.Complex
gabor λ θ ψ σ γ x y = exp(-(x'^2 + γ^2 * y'^2) / (2*σ^2)) * exp(i * (2*pi*x'/λ + ψ))
    where x' =  x * cos θ + y * sin θ
          y' = -x * sin θ + y * cos θ
          i  = 0 :+ 1


यह भी देखें

संदर्भ

  1. Gabor, D. (1946). "Theory of communication". J. Inst. Electr. Eng. 93.
  2. Granlund G. H. (1978). "In Search of a General Picture Processing Operator". Computer Graphics and Image Processing. 8 (2): 155–173. doi:10.1016/0146-664X(78)90047-3. ISSN 0146-664X.
  3. Olshausen, B. A. & Field, D. J. (1996). "प्राकृतिक छवियों के लिए विरल कोड सीखकर सरल-कोशिका ग्रहणशील-क्षेत्र गुणों का उद्भव।". Nature. 381 (6583): 607–609. Bibcode:1996Natur.381..607O. doi:10.1038/381607a0. PMID 8637596. S2CID 4358477.{{cite journal}}: CS1 maint: multiple names: authors list (link)
  4. Marčelja, S. (1980). "सरल कॉर्टिकल कोशिकाओं की प्रतिक्रियाओं का गणितीय विवरण". Journal of the Optical Society of America. 70 (11): 1297–1300. Bibcode:1980JOSA...70.1297M. doi:10.1364/JOSA.70.001297. PMID 7463179.
  5. Daugman, John G. (1985-07-01). "अंतरिक्ष में रिज़ॉल्यूशन, स्थानिक आवृत्ति और दो-आयामी दृश्य कॉर्टिकल फ़िल्टर द्वारा अनुकूलित अभिविन्यास के लिए अनिश्चितता संबंध". Journal of the Optical Society of America A (in English). 2 (7): 1160–9. Bibcode:1985JOSAA...2.1160D. CiteSeerX 10.1.1.465.8506. doi:10.1364/JOSAA.2.001160. ISSN 1084-7529. PMID 4020513. S2CID 9271650.
  6. Fogel, I.; Sagi, D. (June 1989). "गैबोर बनावट विभेदक के रूप में फ़िल्टर करता है". Biological Cybernetics (in English). 61 (2): 103–113. CiteSeerX 10.1.1.367.2700. doi:10.1007/BF00204594. ISSN 0340-1200. OCLC 895625214. S2CID 14952808.
  7. 3D surface tracking and approximation using Gabor filters, Jesper Juul Henriksen, South Denmark University, March 28, 2007
  8. Daugman, J.G. (1980), "Two-dimensional spectral analysis of cortical receptive field profiles", Vision Res., 20 (10): 847–56, doi:10.1016/0042-6989(80)90065-6, PMID 7467139, S2CID 40518532
  9. Jones, J.P.; Palmer, L.A. (1987). "कैट स्ट्रिएट कॉर्टेक्स में सरल ग्रहणशील क्षेत्रों के द्वि-आयामी गैबोर फ़िल्टर मॉडल का मूल्यांकन" (PDF). J. Neurophysiol. 58 (6): 1233–1258. doi:10.1152/jn.1987.58.6.1233. PMID 3437332. S2CID 16809045. Archived from the original (PDF) on 2020-02-28.
  10. 10.0 10.1 Lindeberg, T. (23 January 2023). "A time-causal and time-recursive scale-covariant scale-space representation of temporal signals and past time". Biological Cybernetics. 117 (1–2): 21–59. doi:10.1007/s00422-022-00953-6. PMC 10160219. PMID 36689001.
  11. Haghighat, M.; Zonouz, S.; Abdel-Mottaleb, M. (2013). "Identification Using Encrypted Biometrics". छवियों और पैटर्न का कंप्यूटर विश्लेषण. Lecture Notes in Computer Science. Vol. 8048. p. 440. doi:10.1007/978-3-642-40246-3_55. ISBN 978-3-642-40245-6.
  12. Ramakrishnan, A.G.; Kumar Raja, S.; Raghu Ram, H.V. (2002). "Neural network-based segmentation of textures using Gabor features" (PDF). Proceedings of the 12th IEEE Workshop on Neural Networks for Signal Processing. Martigny, Switzerland: IEEE. pp. 365–374. doi:10.1109/NNSP.2002.1030048. ISBN 978-0-7803-7616-8. OCLC 812617471. S2CID 10994982.
  13. Pati, Peeta Basa; Ramakrishnan, A.G. (July 2008). "शब्द स्तरीय बहु-स्क्रिप्ट पहचान". Pattern Recognition Letters (in English). 29 (9): 1218–1229. Bibcode:2008PaReL..29.1218P. doi:10.1016/j.patrec.2008.01.027. ISSN 0167-8655.
  14. Raju S, S.; Pati, P.B.; Ramakrishnan, A.G. (2004). "Gabor filter based block energy analysis for text extraction from digital document images" (PDF). First International Workshop on Document Image Analysis for Libraries, 2004. Proceedings. Palo Alto, CA, USA: IEEE. pp. 233–243. doi:10.1109/DIAL.2004.1263252. ISBN 978-0-7695-2088-9. LCCN 2003116308. OL 8067708M. S2CID 21856192.
  15. Raju, S. Sabari; Pati, P. B.; Ramakrishnan, A. G. (2005). "जटिल रंग छवियों से पाठ स्थानीयकरण और निष्कर्षण". Lecture Notes in Computer Science. 3804: 486–493. doi:10.1007/11595755_59. ISBN 978-3-540-30750-1. ISSN 0302-9743. LCCN 2005936803. OL 9056158M.
  16. S Sabari Raju, P B Pati and A G Ramakrishnan, “Text Localization and Extraction from Complex Color Images,” Proc. First International Conference on Advances in Visual Computing (ISVC05), Nevada, USA, LNCS 3804, Springer Verlag, Dec. 5-7, 2005, pp. 486-493.
  17. Lyons, M.; Akamatsu, S.; Kamachi, M.; Gyoba, J. (1998). "Coding facial expressions with Gabor wavelets". स्वचालित चेहरे और हावभाव पहचान पर तीसरे आईईईई अंतर्राष्ट्रीय सम्मेलन की कार्यवाही. pp. 200–205. doi:10.1109/AFGR.1998.670949. ISBN 0-8186-8344-9. OL 11390549M. S2CID 1586662.
  18. Gdyczynski, C.M.; Manbachi, A.; et al. (2014). "माइक्रो-सीटी छवियों से पेडिकल ट्रैब्युलर हड्डी में दिशात्मक वितरण का अनुमान लगाने पर". Physiological Measurement. 35 (12): 2415–2428. Bibcode:2014PhyM...35.2415G. doi:10.1088/0967-3334/35/12/2415. PMID 25391037. S2CID 206078730.


बाहरी संबंध


अग्रिम पठन