गैबोर फिल्टर
छवि प्रसंस्करण में, गैबोर फ़िल्टर, जिसका नाम डेनिस गैबोर के नाम पर रखा गया, जिन्होंने सबसे पहले इसे 1D फ़िल्टर के रूप में प्रस्तावित किया था।[1] गैबोर फ़िल्टर को सबसे पहले गोस्टा ग्रैनलुंड द्वारा 2D में सामान्यीकृत किया गया था,[2] एक संदर्भ दिशा जोड़कर
गैबोर फ़िल्टर रैखिक फ़िल्टर है जिसका उपयोग बनावट मानचित्रण विश्लेषण के लिए किया जाता है, जिसका अनिवार्य रूप से अर्थ है कि यह विश्लेषण करता है कि विश्लेषण के बिंदु या क्षेत्र के आसपास स्थानीयकृत क्षेत्र में विशिष्ट दिशाओं में छवि में कोई विशिष्ट आवृत्ति सामग्री है या नहीं। कई समकालीन दृष्टि वैज्ञानिकों द्वारा गैबोर फिल्टर की आवृत्ति और अभिविन्यास प्रतिनिधित्व को मानव दृश्य प्रणाली के समान होने का माँग किया गया है।[3] उन्हें बनावट प्रतिनिधित्व और भेदभाव के लिए विशेष रूप से उपयुक्त पाया गया है। स्थानिक डोमेन में, 2D गैबोर फ़िल्टर एक गाऊसी कर्नेल फलन है। जो साइनसॉइडल समतल वेव द्वारा संशोधित होता है। (गैबोर परिवर्तन देखें)
कुछ लेखकों का मानना है कि स्तनधारी मस्तिष्क के दृश्य प्रांतस्था में सरल कोशिकाओं को गैबोर फलन द्वारा मॉडल किया जा सकता है।[4][5] इस प्रकार, गैबोर फिल्टर के साथ छवि विश्लेषण को कुछ लोगों द्वारा मानव दृश्य प्रणाली में धारणा के समान माना जाता है।
परिभाषा
इसकी आवेग प्रतिक्रिया को गॉसियन फलन द्वारा गुणा की गई साइन वेव (2D गैबोर फिल्टर के लिए प्लेन वेव) द्वारा परिभाषित किया गया है।[6]
गुणन-कन्वोल्यूशन प्रॉपर्टी (कन्वोल्यूशन प्रमेय) के कारण, गैबोर फिल्टर की आवेग प्रतिक्रिया का फूरियर रूपांतरण हार्मोनिक फलन (साइनसॉइडल फलन) के फूरियर ट्रांसफॉर्म और गॉसियन फलन के फूरियर ट्रांसफॉर्म का कनवल्शन है। फ़िल्टर में वास्तविक संख्या और काल्पनिक संख्या घटक होता है। जो ओर्थोगोनल दिशाओं का प्रतिनिधित्व करता है।[7] दोनों घटकों को जटिल संख्या में बनाया जा सकता है या व्यक्तिगत रूप से उपयोग किया जा सकता है।
सरल
वास्तविक
काल्पनिक
जहाँ और .
इस समीकरण में, साइनसॉइडल कारक की तरंग दैर्ध्य का प्रतिनिधित्व करता है, गैबोर फलन की समानांतर धारियों के लिए सामान्य के उन्मुखीकरण का प्रतिनिधित्व करता है, चरण ऑफसेट है, गॉसियन लिफाफे का सिग्मा/मानक विचलन है और स्थानिक पहलू अनुपात है, और गैबोर फलन के समर्थन की अण्डाकारता निर्दिष्ट करता है।
वेवलेट स्पेस
गैबोर फ़िल्टर सीधे गैबोर वेवलेट्स से संबंधित हैं, क्योंकि उन्हें कई फैलाव और घुमावों के लिए डिज़ाइन किया जा सकता है। चूंकि, सामान्यतः, गैबोर तरंगिकाओं के लिए विस्तार प्रयुक्त नहीं किया जाता है, क्योंकि इसके लिए द्वि-ऑर्थोगोनल तरंगिकाओं की गणना की आवश्यकता होती है, जो बहुत समय लेने वाली हो सकती है। इसलिए, सामान्यतः, विभिन्न पैमानों और घुमावों वाले गैबोर फिल्टर से युक्त फिल्टर बैंक बनाया जाता है। फ़िल्टर सिग्नल के साथ जुड़ जाते हैं, जिसके परिणामस्वरूप तथाकथित गैबर स्पेस बनता है। यह प्रक्रिया प्राथमिक दृश्य प्रांतस्था में प्रक्रियाओं से निकटता से संबंधित है।[8]
जोन्स और पामर ने दिखाया कि जटिल गैबोर फलन का वास्तविक भाग बिल्ली के स्ट्रिएट कॉर्टेक्स में सरल कोशिकाओं में पाए जाने वाले ग्रहणशील क्षेत्र वजन कार्यों के लिए उपयुक्त है।[9]
गैबोर फिल्टर का समय-कारण एनालॉग
अस्थायी संकेतों को संसाधित करते समय, भविष्य के डेटा तक नहीं पहुंचा जा सकता है, जिससे अस्थायी आयाम पर निर्भर वास्तविक समय संकेतों को संसाधित करने के लिए गैबोर फलन का उपयोग करने का प्रयास करने पर समस्याएं उत्पन होती हैं। गैबोर फ़िल्टर का समय-कारण एनालॉग विकसित किया गया है।[10] गैबोर फलन में गॉसियन कर्नेल को समय-कारण और समय-पुनरावर्ती कर्नेल के साथ बदलने पर आधारित, जिसे समय-कारण सीमा कर्नेल कहा जाता है। इस तरह, समय-कारण सीमा कर्नेल के परिणामी जटिल-मूल्य विस्तार के आधार पर समय-आवृत्ति विश्लेषण गैबोर फ़िल्टर के रूप में अस्थायी संकेत के अनिवार्य रूप से समान परिवर्तनों को पकड़ना संभव बनाता है, और जैसा कि हाइजेनबर्ग समूह द्वारा वर्णित किया जा सकता है।[10]अधिक जानकारी के लिए देखें।
छवियों से सुविधाओं का निष्कर्षण
विभिन्न आवृत्तियों और अभिविन्यासों के साथ गैबोर फ़िल्टर का सेट किसी छवि से उपयोगी सुविधाएँ निकालने में सहायक हो सकता है।[11] असतत डोमेन में, द्वि-आयामी गैबर फ़िल्टर दिए गए हैं,
जहां B और C निर्धारित किए जाने वाले सामान्यीकरण कारक हैं।
2D गैबर फिल्टर का छवि प्रसंस्करण में समृद्ध अनुप्रयोग है, विशेष रूप से बनावट विश्लेषण और विभाजन के लिए फीचर निष्कर्षण में।[12] बनावट में खोजी जा रही आवृत्ति को परिभाषित करता है। भिन्न-भिन्न करके , हम किसी विशेष दिशा में उन्मुख बनावट की तलाश कर सकते हैं। भिन्न-भिन्न करके , हम विश्लेषण किए जा रहे छवि क्षेत्र के आधार या आकार का समर्थन बदलते हैं।
छवि प्रसंस्करण में 2D गैबोर फिल्टर का अनुप्रयोग
डाक्यूमेंटेशन छवि प्रसंस्करण में, गैबोर सुविधाएँ बहुभाषी डाक्यूमेंटेशन में किसी शब्द की लिपि की पहचान करने के लिए आदर्श हैं।[13] विभिन्न आवृत्तियों और विभिन्न दिशाओं में अभिविन्यास वाले गैबर फ़िल्टर का उपयोग जटिल डाक्यूमेंटेशन छवियों (ग्रे और रंग दोनों) से केवल-पाठ क्षेत्रों को स्थानीयकृत करने और निकालने के लिए किया गया है, क्योंकि पाठ उच्च आवृत्ति घटकों में समृद्ध है, जबकि चित्र प्रकृति में अपेक्षाकृत चिकनी हैं।[14][15][16] इसे चेहरे की अभिव्यक्ति पहचानने के लिए भी लागू किया गया है।[17]
पैटर्न विश्लेषण अनुप्रयोगों में गैबोर फिल्टर का भी व्यापक रूप से उपयोग किया गया है। उदाहरण के लिए, इसका उपयोग कशेरुक स्तंभ में छिद्रपूर्ण स्पंजी ट्रैब्युलर हड्डी के अंदर दिशात्मक वितरण का अध्ययन करने के लिए किया गया है।[18] गैबोर स्पेस ऑप्टिकल कैरेक्टर मान्यता, आईरिस पहचान और फिंगरप्रिंट पहचान जैसे इमेज प्रोसेसिंग अनुप्रयोगों में बहुत उपयोगी है। किसी छवि में वस्तुओं के बीच किसी विशिष्ट स्थानिक स्थान के लिए सक्रियता के बीच संबंध बहुत विशिष्ट होते हैं। इसके अतिरिक्त, विरल वस्तु प्रतिनिधित्व बनाने के लिए गैबोर स्पेस से महत्वपूर्ण सक्रियण निकाले जा सकते हैं।
उदाहरण कार्यान्वयन
यह पायथन (प्रोग्रामिंग भाषा) में उदाहरण कार्यान्वयन है:
import numpy as np
def gabor(sigma, theta, Lambda, psi, gamma):
"""Gabor feature extraction."""
sigma_x = sigma
sigma_y = float(sigma) / gamma
# Bounding box
nstds = 3 # Number of standard deviation sigma
xmax = max(
abs(nstds * sigma_x * np.cos(theta)), abs(nstds * sigma_y * np.sin(theta))
)
xmax = np.ceil(max(1, xmax))
ymax = max(
abs(nstds * sigma_x * np.sin(theta)), abs(nstds * sigma_y * np.cos(theta))
)
ymax = np.ceil(max(1, ymax))
xmin = -xmax
ymin = -ymax
(y, x) = np.meshgrid(np.arange(ymin, ymax + 1), np.arange(xmin, xmax + 1))
# Rotation
x_theta = x * np.cos(theta) + y * np.sin(theta)
y_theta = -x * np.sin(theta) + y * np.cos(theta)
gb = np.exp(
-0.5 * (x_theta**2 / sigma_x**2 + y_theta**2 / sigma_y**2)
) * np.cos(2 * np.pi / Lambda * x_theta + psi)
return gb
छवियों पर कार्यान्वयन के लिए, [1] देखें।
यह MATLAB/GNU ऑक्टेव में उदाहरण कार्यान्वयन है:
function gb=gabor_fn(sigma, theta, lambda, psi, gamma)
sigma_x = sigma;
sigma_y = sigma / gamma;
% Bounding box
nstds = 3;
xmax = max(abs(nstds * sigma_x * cos(theta)), abs(nstds * sigma_y * sin(theta)));
xmax = ceil(max(1, xmax));
ymax = max(abs(nstds * sigma_x * sin(theta)), abs(nstds * sigma_y * cos(theta)));
ymax = ceil(max(1, ymax));
xmin = -xmax; ymin = -ymax;
[x,y] = meshgrid(xmin:xmax, ymin:ymax);
% Rotation
x_theta = x * cos(theta) + y * sin(theta);
y_theta = -x * sin(theta) + y * cos(theta);
gb = exp(-.5*(x_theta.^2/sigma_x^2+y_theta.^2/sigma_y^2)).*cos(2*pi/lambda*x_theta+psi);
MATLAB में छवियों से गैबोर सुविधा निष्कर्षण के लिए कोड http://www.mathworks.com/matlabcentral/fileexchange/44630 पर पाया जा सकता है।
यह हास्केल (प्रोग्रामिंग भाषा) में कार्यान्वयन का एक और उदाहरण है:
import Data.Complex
gabor λ θ ψ σ γ x y = exp(-(x'^2 + γ^2 * y'^2) / (2*σ^2)) * exp(i * (2*pi*x'/λ + ψ))
where x' = x * cos θ + y * sin θ
y' = -x * sin θ + y * cos θ
i = 0 :+ 1
यह भी देखें
- गैबोर परिवर्तन
- गैबोर वेवलेट
- गैबर परमाणु
- गैबोर फ़िल्टर लॉग करें
संदर्भ
- ↑ Gabor, D. (1946). "Theory of communication". J. Inst. Electr. Eng. 93.
- ↑ Granlund G. H. (1978). "In Search of a General Picture Processing Operator". Computer Graphics and Image Processing. 8 (2): 155–173. doi:10.1016/0146-664X(78)90047-3. ISSN 0146-664X.
- ↑ Olshausen, B. A. & Field, D. J. (1996). "प्राकृतिक छवियों के लिए विरल कोड सीखकर सरल-कोशिका ग्रहणशील-क्षेत्र गुणों का उद्भव।". Nature. 381 (6583): 607–609. Bibcode:1996Natur.381..607O. doi:10.1038/381607a0. PMID 8637596. S2CID 4358477.
{{cite journal}}
: CS1 maint: multiple names: authors list (link) - ↑ Marčelja, S. (1980). "सरल कॉर्टिकल कोशिकाओं की प्रतिक्रियाओं का गणितीय विवरण". Journal of the Optical Society of America. 70 (11): 1297–1300. Bibcode:1980JOSA...70.1297M. doi:10.1364/JOSA.70.001297. PMID 7463179.
- ↑ Daugman, John G. (1985-07-01). "अंतरिक्ष में रिज़ॉल्यूशन, स्थानिक आवृत्ति और दो-आयामी दृश्य कॉर्टिकल फ़िल्टर द्वारा अनुकूलित अभिविन्यास के लिए अनिश्चितता संबंध". Journal of the Optical Society of America A (in English). 2 (7): 1160–9. Bibcode:1985JOSAA...2.1160D. CiteSeerX 10.1.1.465.8506. doi:10.1364/JOSAA.2.001160. ISSN 1084-7529. PMID 4020513. S2CID 9271650.
- ↑ Fogel, I.; Sagi, D. (June 1989). "गैबोर बनावट विभेदक के रूप में फ़िल्टर करता है". Biological Cybernetics (in English). 61 (2): 103–113. CiteSeerX 10.1.1.367.2700. doi:10.1007/BF00204594. ISSN 0340-1200. OCLC 895625214. S2CID 14952808.
- ↑ 3D surface tracking and approximation using Gabor filters, Jesper Juul Henriksen, South Denmark University, March 28, 2007
- ↑ Daugman, J.G. (1980), "Two-dimensional spectral analysis of cortical receptive field profiles", Vision Res., 20 (10): 847–56, doi:10.1016/0042-6989(80)90065-6, PMID 7467139, S2CID 40518532
- ↑ Jones, J.P.; Palmer, L.A. (1987). "कैट स्ट्रिएट कॉर्टेक्स में सरल ग्रहणशील क्षेत्रों के द्वि-आयामी गैबोर फ़िल्टर मॉडल का मूल्यांकन" (PDF). J. Neurophysiol. 58 (6): 1233–1258. doi:10.1152/jn.1987.58.6.1233. PMID 3437332. S2CID 16809045. Archived from the original (PDF) on 2020-02-28.
- ↑ 10.0 10.1 Lindeberg, T. (23 January 2023). "A time-causal and time-recursive scale-covariant scale-space representation of temporal signals and past time". Biological Cybernetics. 117 (1–2): 21–59. doi:10.1007/s00422-022-00953-6. PMC 10160219. PMID 36689001.
- ↑ Haghighat, M.; Zonouz, S.; Abdel-Mottaleb, M. (2013). "Identification Using Encrypted Biometrics". छवियों और पैटर्न का कंप्यूटर विश्लेषण. Lecture Notes in Computer Science. Vol. 8048. p. 440. doi:10.1007/978-3-642-40246-3_55. ISBN 978-3-642-40245-6.
- ↑ Ramakrishnan, A.G.; Kumar Raja, S.; Raghu Ram, H.V. (2002). "Neural network-based segmentation of textures using Gabor features" (PDF). Proceedings of the 12th IEEE Workshop on Neural Networks for Signal Processing. Martigny, Switzerland: IEEE. pp. 365–374. doi:10.1109/NNSP.2002.1030048. ISBN 978-0-7803-7616-8. OCLC 812617471. S2CID 10994982.
- ↑ Pati, Peeta Basa; Ramakrishnan, A.G. (July 2008). "शब्द स्तरीय बहु-स्क्रिप्ट पहचान". Pattern Recognition Letters (in English). 29 (9): 1218–1229. Bibcode:2008PaReL..29.1218P. doi:10.1016/j.patrec.2008.01.027. ISSN 0167-8655.
- ↑ Raju S, S.; Pati, P.B.; Ramakrishnan, A.G. (2004). "Gabor filter based block energy analysis for text extraction from digital document images" (PDF). First International Workshop on Document Image Analysis for Libraries, 2004. Proceedings. Palo Alto, CA, USA: IEEE. pp. 233–243. doi:10.1109/DIAL.2004.1263252. ISBN 978-0-7695-2088-9. LCCN 2003116308. OL 8067708M. S2CID 21856192.
- ↑ Raju, S. Sabari; Pati, P. B.; Ramakrishnan, A. G. (2005). "जटिल रंग छवियों से पाठ स्थानीयकरण और निष्कर्षण". Lecture Notes in Computer Science. 3804: 486–493. doi:10.1007/11595755_59. ISBN 978-3-540-30750-1. ISSN 0302-9743. LCCN 2005936803. OL 9056158M.
- ↑ S Sabari Raju, P B Pati and A G Ramakrishnan, “Text Localization and Extraction from Complex Color Images,” Proc. First International Conference on Advances in Visual Computing (ISVC05), Nevada, USA, LNCS 3804, Springer Verlag, Dec. 5-7, 2005, pp. 486-493.
- ↑ Lyons, M.; Akamatsu, S.; Kamachi, M.; Gyoba, J. (1998). "Coding facial expressions with Gabor wavelets". स्वचालित चेहरे और हावभाव पहचान पर तीसरे आईईईई अंतर्राष्ट्रीय सम्मेलन की कार्यवाही. pp. 200–205. doi:10.1109/AFGR.1998.670949. ISBN 0-8186-8344-9. OL 11390549M. S2CID 1586662.
- ↑ Gdyczynski, C.M.; Manbachi, A.; et al. (2014). "माइक्रो-सीटी छवियों से पेडिकल ट्रैब्युलर हड्डी में दिशात्मक वितरण का अनुमान लगाने पर". Physiological Measurement. 35 (12): 2415–2428. Bibcode:2014PhyM...35.2415G. doi:10.1088/0967-3334/35/12/2415. PMID 25391037. S2CID 206078730.
बाहरी संबंध
- MATLAB code for Gabor filters and Gabor feature extraction
- 3D Gabor demonstrated with Mathematica
- python implementation of log-Gabors for still images
- Gabor filter for image processing and computer vision (demonstration)
अग्रिम पठन
- Feichtinger, Hans G.; Strohmer, Thomas, eds. (1998). Gabor analysis and algorithms : theory and applications. Boston: Birkhäuser. ISBN 0-8176-3959-4. LCCN 97032252. OCLC 37761814. OL 685385M.
- Gröchenig, Karlheinz (2001). Foundations of time-frequency analysis : with 15 figures. Applied and Numerical Harmonic Analysis. Boston: Birkhäuser. doi:10.1007/978-1-4612-0003-1. ISBN 0-8176-4022-3. LCCN 00044508. OCLC 44420790. OL 8074618M.
- Daugman, J.G. (1988). "Complete discrete 2-D Gabor transforms by neural networks for image analysis and compression" (PDF). IEEE Transactions on Acoustics, Speech, and Signal Processing. 36 (7): 1169–1179. CiteSeerX 10.1.1.371.5847. doi:10.1109/29.1644. ISSN 0096-3518.
- "Online Gabor filter demo". Archived from the original on 2009-06-15. Retrieved 2009-05-25.
- Movellan, Javier R. "Tutorial on Gabor Filters" (PDF). Archived from the original (PDF) on 2009-04-19. Retrieved 2008-05-14.
- Lagae, Ares; Lefebvre, Sylvain; Drettakis, George; Dutré, Philip (2009). "Procedural Noise using Sparse Gabor Convolution". ACM Transactions on Graphics. 28 (3): 1. CiteSeerX 10.1.1.232.5566. doi:10.1145/1531326.1531360. Retrieved 2009-09-12.
- Steerable Pyramids:
- Eero Simoncelli's page on Steerable Pyramids
- Manduchi, R.; Perona, P.; Shy, D. (April 1998). "Efficient deformable filter banks" (PDF). IEEE Transactions on Signal Processing. 46 (4): 1168–1173. Bibcode:1998ITSP...46.1168M. doi:10.1109/78.668570. ISSN 1053-587X. OCLC 926890247. (PDF Archived 2021-11-12 at the Wayback Machine) (Code)
- Fischer, Sylvain; Šroubek, Filip; Perrinet, Laurent; Redondo, Rafael; Cristóbal, Gabriel (2007). "Self-Invertible 2D Log-Gabor Wavelets" (PDF). International Journal of Computer Vision. 75 (2): 231–246. CiteSeerX 10.1.1.329.6283. doi:10.1007/s11263-006-0026-8. ISSN 0920-5691. S2CID 1452724.