गैबोर फिल्टर

From Vigyanwiki
Revision as of 13:20, 10 August 2023 by alpha>Neeraja (added Category:Vigyan Ready using HotCat)
द्वि-आयामी गैबोर फ़िल्टर का उदाहरण

छवि प्रसंस्करण में, गैबोर फ़िल्टर, जिसका नाम डेनिस गैबोर के नाम पर रखा गया था, जिन्होंने सबसे पहले इसे 1D फ़िल्टर के रूप में प्रस्तावित किया था।[1] गैबोर फ़िल्टर को सबसे पहले गोस्टा ग्रैनलुंड द्वारा एक संदर्भ दिशा जोड़कर, 2D में सामान्यीकृत किया गया था।[2]

गैबोर फ़िल्टर रैखिक फ़िल्टर है, जिसका उपयोग बनावट मानचित्रण विश्लेषण के लिए किया जाता है, जिसका अनिवार्य रूप से अर्थ है कि यह विश्लेषण करता है कि विश्लेषण के बिंदु या क्षेत्र के आसपास स्थानीयकृत क्षेत्र में विशिष्ट दिशाओं में छवि में कोई विशिष्ट आवृत्ति सामग्री है या नहीं है। कई समकालीन दृष्टि वैज्ञानिकों द्वारा गैबोर फिल्टर की आवृत्ति और अभिविन्यास प्रतिनिधित्व को मानव दृश्य प्रणाली के समान होने का माँग किया गया है।[3] उन्हें बनावट प्रतिनिधित्व और भेदभाव के लिए विशेष रूप से उपयुक्त पाया गया है। स्थानिक डोमेन में, 2D गैबोर फ़िल्टर एक गाऊसी कर्नेल फलन है। जो साइनसॉइडल समतल वेव द्वारा संशोधित होता है। (गैबोर परिवर्तन देखें)

कुछ लेखकों का मानना है कि स्तनधारी मस्तिष्क के दृश्य प्रांतस्था में सरल कोशिकाओं को गैबोर फलन द्वारा मॉडल किया जा सकता है।[4][5] इस प्रकार, गैबोर फिल्टर के साथ छवि विश्लेषण को कुछ लोगों द्वारा मानव दृश्य प्रणाली में धारणा के समान माना जाता है।

परिभाषा

इसकी आवेग प्रतिक्रिया को गॉसियन फलन द्वारा गुणा की गई साइन वेव (2D गैबोर फिल्टर के लिए प्लेन वेव) द्वारा परिभाषित किया गया है।[6]

गुणन-कन्वोल्यूशन प्रॉपर्टी (कन्वोल्यूशन प्रमेय) के कारण, गैबोर फिल्टर की आवेग प्रतिक्रिया का फूरियर रूपांतरण हार्मोनिक फलन (साइनसॉइडल फलन) के फूरियर ट्रांसफॉर्म और गॉसियन फलन के फूरियर ट्रांसफॉर्म का कनवल्शन है। फ़िल्टर में वास्तविक संख्या और काल्पनिक संख्या घटक होता है। जो ओर्थोगोनल दिशाओं का प्रतिनिधित्व करता है।[7] दोनों घटकों को जटिल संख्या में बनाया जा सकता है या व्यक्तिगत रूप से उपयोग किया जा सकता है।

सरल

वास्तविक

काल्पनिक

जहाँ और है।

इस समीकरण में, साइनसॉइडल कारक की तरंग दैर्ध्य का प्रतिनिधित्व करता है, गैबोर फलन की समानांतर धारियों के लिए सामान्य के उन्मुखीकरण का प्रतिनिधित्व करता है, चरण ऑफसेट है, गॉसियन लिफाफे का सिग्मा/मानक विचलन है और स्थानिक आस्पेक्ट अनुपात है, और गैबोर फलन के समर्थन की अण्डाकारता निर्दिष्ट करता है।

वेवलेट स्पेस

चीनी ओसीआर पर प्रयुक्त गैबोर फ़िल्टर का प्रदर्शन दाईं ओर चार अभिविन्यास 0°, 45°, 90° और 135° दिखाए गए हैं। मूल चरित्र चित्र और सभी चार अभिविन्यासों का सुपरपोज़िशन बाईं ओर दिखाया गया है।

गैबोर फ़िल्टर सीधे गैबोर वेवलेट से संबंधित हैं, क्योंकि उन्हें कई फैलाव और घुमावों के लिए डिज़ाइन किया जा सकता है। चूंकि, सामान्यतः, गैबोर तरंगिकाओं के लिए विस्तार प्रयुक्त नहीं किया जाता है, क्योंकि इसके लिए द्वि-ऑर्थोगोनल तरंगिकाओं की गणना की आवश्यकता होती है, जो बहुत समय लेने वाली हो सकती है। इसलिए, सामान्यतः, विभिन्न पैमानों और घुमावों वाले गैबोर फिल्टर से युक्त फिल्टर बैंक बनाया जाता है। फ़िल्टर संकेत के साथ जुड़ जाते हैं, जिसके परिणामस्वरूप तथाकथित गैबर स्पेस बनता है। यह प्रक्रिया प्राथमिक दृश्य प्रांतस्था में प्रक्रियाओं से निकटता से संबंधित है।[8]

जोन्स और पामर ने दिखाया कि जटिल गैबोर फलन का वास्तविक भाग बिल्ली के स्ट्रिएट कॉर्टेक्स में सरल कोशिकाओं में पाए जाने वाले ग्रहणशील क्षेत्र वजन कार्यों के लिए उपयुक्त है।[9]


गैबोर फिल्टर का समय-कारण एनालॉग

अस्थायी संकेतों को संसाधित करते समय, भविष्य के डेटा तक नहीं पहुंचा जा सकता है, जिससे अस्थायी आयाम पर निर्भर वास्तविक समय संकेतों को संसाधित करने के लिए गैबोर फलन का उपयोग करने का प्रयास करने पर समस्याएं उत्पन होती हैं। गैबोर फ़िल्टर का समय-कारण एनालॉग विकसित किया गया है।[10] गैबोर फलन में गॉसियन कर्नेल को समय-कारण और समय-पुनरावर्ती कर्नेल के साथ बदलने पर आधारित, जिसे समय-कारण सीमा कर्नेल कहा जाता है। इस तरह, समय-कारण सीमा कर्नेल के परिणामी जटिल-मूल्य विस्तार के आधार पर समय-आवृत्ति विश्लेषण गैबोर फ़िल्टर के रूप में अस्थायी संकेत के अनिवार्य रूप से समान परिवर्तनों को पकड़ना संभव बनाता है, और जैसा कि हाइजेनबर्ग समूह द्वारा वर्णित किया जा सकता है (अधिक जानकारी के लिए देखें।)।[10]

छवियों से सुविधाओं का निष्कर्षण

विभिन्न आवृत्तियों और अभिविन्यासों के साथ गैबोर फ़िल्टर का सेट किसी छवि से उपयोगी सुविधाएँ निकालने में सहायक हो सकता है।[11] असतत डोमेन में, द्वि-आयामी गैबर फ़िल्टर दिए गए हैं,

जहां B और C निर्धारित किए जाने वाले सामान्यीकरण कारक हैं।

2D गैबर फिल्टर का छवि प्रसंस्करण में समृद्ध अनुप्रयोग है, विशेष रूप से बनावट विश्लेषण और विभाजन के लिए फीचर निष्कर्षण में समृद्ध अनुप्रयोग है।[12] बनावट में खोजी जा रही आवृत्ति को परिभाषित करता है। को भिन्न-भिन्न करके, हम किसी विशेष दिशा में उन्मुख बनावट की तलाश कर सकते हैं। को भिन्न-भिन्न करके, हम विश्लेषण किए जा रहे छवि क्षेत्र के आधार या आकार का समर्थन बदलते हैं।

छवि प्रसंस्करण में 2D गैबोर फिल्टर का अनुप्रयोग

डाक्यूमेंटेशन छवि प्रसंस्करण में, गैबोर सुविधाएँ बहुभाषी डाक्यूमेंटेशन में किसी शब्द की लिपि की पहचान करने के लिए आदर्श हैं।[13] विभिन्न आवृत्तियों और विभिन्न दिशाओं में अभिविन्यास वाले गैबर फ़िल्टर का उपयोग जटिल डाक्यूमेंटेशन छवियों (ग्रे और रंग दोनों) से केवल-पाठ क्षेत्रों को स्थानीयकृत करने और निकालने के लिए किया गया है, क्योंकि पाठ उच्च आवृत्ति घटकों में समृद्ध है, जबकि चित्र प्रकृति में अपेक्षाकृत चिकनी हैं।[14][15][16] इसे चेहरे की अभिव्यक्ति पहचानने के लिए भी प्रयुक्त किया गया है।[17]

पैटर्न विश्लेषण अनुप्रयोगों में गैबोर फिल्टर का भी व्यापक रूप से उपयोग किया गया है। उदाहरण के लिए, इसका उपयोग कशेरुक स्तंभ में छिद्रपूर्ण स्पंजी ट्रैब्युलर हड्डी के अंदर दिशात्मक वितरण का अध्ययन करने के लिए किया गया है।[18] गैबोर स्पेस ऑप्टिकल कैरेक्टर मान्यता, आईरिस पहचान और फिंगरप्रिंट पहचान जैसे इमेज प्रोसेसिंग अनुप्रयोगों में बहुत उपयोगी है। किसी छवि में वस्तुओं के बीच किसी विशिष्ट स्थानिक स्थान के लिए सक्रियता के बीच संबंध बहुत विशिष्ट होते हैं। इसके अतिरिक्त, विरल वस्तु प्रतिनिधित्व बनाने के लिए गैबोर स्पेस से महत्वपूर्ण सक्रियण निकाले जा सकते हैं।

उदाहरण कार्यान्वयन

यह पायथन (प्रोग्रामिंग लैंग्वेज) में उदाहरण कार्यान्वयन है:

import numpy as np


def gabor(sigma, theta, Lambda, psi, gamma):
    """Gabor feature extraction."""
    sigma_x = sigma
    sigma_y = float(sigma) / gamma

    # Bounding box
    nstds = 3  # Number of standard deviation sigma
    xmax = max(
        abs(nstds * sigma_x * np.cos(theta)), abs(nstds * sigma_y * np.sin(theta))
    )
    xmax = np.ceil(max(1, xmax))
    ymax = max(
        abs(nstds * sigma_x * np.sin(theta)), abs(nstds * sigma_y * np.cos(theta))
    )
    ymax = np.ceil(max(1, ymax))
    xmin = -xmax
    ymin = -ymax
    (y, x) = np.meshgrid(np.arange(ymin, ymax + 1), np.arange(xmin, xmax + 1))

    # Rotation
    x_theta = x * np.cos(theta) + y * np.sin(theta)
    y_theta = -x * np.sin(theta) + y * np.cos(theta)

    gb = np.exp(
        -0.5 * (x_theta**2 / sigma_x**2 + y_theta**2 / sigma_y**2)
    ) * np.cos(2 * np.pi / Lambda * x_theta + psi)
    return gb

छवियों पर कार्यान्वयन के लिए, [1] देखें।

यह एमएटीएलएबी/जीएनयू ऑक्टेव में उदाहरण कार्यान्वयन है:

function gb=gabor_fn(sigma, theta, lambda, psi, gamma)

sigma_x = sigma;
sigma_y = sigma / gamma;

% Bounding box
nstds = 3;
xmax = max(abs(nstds * sigma_x * cos(theta)), abs(nstds * sigma_y * sin(theta)));
xmax = ceil(max(1, xmax));
ymax = max(abs(nstds * sigma_x * sin(theta)), abs(nstds * sigma_y * cos(theta)));
ymax = ceil(max(1, ymax));
xmin = -xmax; ymin = -ymax;
[x,y] = meshgrid(xmin:xmax, ymin:ymax);

% Rotation 
x_theta = x * cos(theta) + y * sin(theta);
y_theta = -x * sin(theta) + y * cos(theta);

gb = exp(-.5*(x_theta.^2/sigma_x^2+y_theta.^2/sigma_y^2)).*cos(2*pi/lambda*x_theta+psi);

एमएटीएलएबी में छवियों से गैबोर सुविधा निष्कर्षण के लिए कोड http://www.mathworks.com/matlabcentral/fileexchange/44630 पर पाया जा सकता है।

यह हास्केल (प्रोग्रामिंग लैंग्वेज) में कार्यान्वयन का एक और उदाहरण है:

import Data.Complex
gabor λ θ ψ σ γ x y = exp(-(x'^2 + γ^2 * y'^2) / (2*σ^2)) * exp(i * (2*pi*x'/λ + ψ))
    where x' =  x * cos θ + y * sin θ
          y' = -x * sin θ + y * cos θ
          i  = 0 :+ 1


यह भी देखें

संदर्भ

  1. Gabor, D. (1946). "Theory of communication". J. Inst. Electr. Eng. 93.
  2. Granlund G. H. (1978). "In Search of a General Picture Processing Operator". Computer Graphics and Image Processing. 8 (2): 155–173. doi:10.1016/0146-664X(78)90047-3. ISSN 0146-664X.
  3. Olshausen, B. A. & Field, D. J. (1996). "प्राकृतिक छवियों के लिए विरल कोड सीखकर सरल-कोशिका ग्रहणशील-क्षेत्र गुणों का उद्भव।". Nature. 381 (6583): 607–609. Bibcode:1996Natur.381..607O. doi:10.1038/381607a0. PMID 8637596. S2CID 4358477.{{cite journal}}: CS1 maint: multiple names: authors list (link)
  4. Marčelja, S. (1980). "सरल कॉर्टिकल कोशिकाओं की प्रतिक्रियाओं का गणितीय विवरण". Journal of the Optical Society of America. 70 (11): 1297–1300. Bibcode:1980JOSA...70.1297M. doi:10.1364/JOSA.70.001297. PMID 7463179.
  5. Daugman, John G. (1985-07-01). "अंतरिक्ष में रिज़ॉल्यूशन, स्थानिक आवृत्ति और दो-आयामी दृश्य कॉर्टिकल फ़िल्टर द्वारा अनुकूलित अभिविन्यास के लिए अनिश्चितता संबंध". Journal of the Optical Society of America A (in English). 2 (7): 1160–9. Bibcode:1985JOSAA...2.1160D. CiteSeerX 10.1.1.465.8506. doi:10.1364/JOSAA.2.001160. ISSN 1084-7529. PMID 4020513. S2CID 9271650.
  6. Fogel, I.; Sagi, D. (June 1989). "गैबोर बनावट विभेदक के रूप में फ़िल्टर करता है". Biological Cybernetics (in English). 61 (2): 103–113. CiteSeerX 10.1.1.367.2700. doi:10.1007/BF00204594. ISSN 0340-1200. OCLC 895625214. S2CID 14952808.
  7. 3D surface tracking and approximation using Gabor filters, Jesper Juul Henriksen, South Denmark University, March 28, 2007
  8. Daugman, J.G. (1980), "Two-dimensional spectral analysis of cortical receptive field profiles", Vision Res., 20 (10): 847–56, doi:10.1016/0042-6989(80)90065-6, PMID 7467139, S2CID 40518532
  9. Jones, J.P.; Palmer, L.A. (1987). "कैट स्ट्रिएट कॉर्टेक्स में सरल ग्रहणशील क्षेत्रों के द्वि-आयामी गैबोर फ़िल्टर मॉडल का मूल्यांकन" (PDF). J. Neurophysiol. 58 (6): 1233–1258. doi:10.1152/jn.1987.58.6.1233. PMID 3437332. S2CID 16809045. Archived from the original (PDF) on 2020-02-28.
  10. 10.0 10.1 Lindeberg, T. (23 January 2023). "A time-causal and time-recursive scale-covariant scale-space representation of temporal signals and past time". Biological Cybernetics. 117 (1–2): 21–59. doi:10.1007/s00422-022-00953-6. PMC 10160219. PMID 36689001.
  11. Haghighat, M.; Zonouz, S.; Abdel-Mottaleb, M. (2013). "Identification Using Encrypted Biometrics". छवियों और पैटर्न का कंप्यूटर विश्लेषण. Lecture Notes in Computer Science. Vol. 8048. p. 440. doi:10.1007/978-3-642-40246-3_55. ISBN 978-3-642-40245-6.
  12. Ramakrishnan, A.G.; Kumar Raja, S.; Raghu Ram, H.V. (2002). "Neural network-based segmentation of textures using Gabor features" (PDF). Proceedings of the 12th IEEE Workshop on Neural Networks for Signal Processing. Martigny, Switzerland: IEEE. pp. 365–374. doi:10.1109/NNSP.2002.1030048. ISBN 978-0-7803-7616-8. OCLC 812617471. S2CID 10994982.
  13. Pati, Peeta Basa; Ramakrishnan, A.G. (July 2008). "शब्द स्तरीय बहु-स्क्रिप्ट पहचान". Pattern Recognition Letters (in English). 29 (9): 1218–1229. Bibcode:2008PaReL..29.1218P. doi:10.1016/j.patrec.2008.01.027. ISSN 0167-8655.
  14. Raju S, S.; Pati, P.B.; Ramakrishnan, A.G. (2004). "Gabor filter based block energy analysis for text extraction from digital document images" (PDF). First International Workshop on Document Image Analysis for Libraries, 2004. Proceedings. Palo Alto, CA, USA: IEEE. pp. 233–243. doi:10.1109/DIAL.2004.1263252. ISBN 978-0-7695-2088-9. LCCN 2003116308. OL 8067708M. S2CID 21856192.
  15. Raju, S. Sabari; Pati, P. B.; Ramakrishnan, A. G. (2005). "जटिल रंग छवियों से पाठ स्थानीयकरण और निष्कर्षण". Lecture Notes in Computer Science. 3804: 486–493. doi:10.1007/11595755_59. ISBN 978-3-540-30750-1. ISSN 0302-9743. LCCN 2005936803. OL 9056158M.
  16. S Sabari Raju, P B Pati and A G Ramakrishnan, “Text Localization and Extraction from Complex Color Images,” Proc. First International Conference on Advances in Visual Computing (ISVC05), Nevada, USA, LNCS 3804, Springer Verlag, Dec. 5-7, 2005, pp. 486-493.
  17. Lyons, M.; Akamatsu, S.; Kamachi, M.; Gyoba, J. (1998). "Coding facial expressions with Gabor wavelets". स्वचालित चेहरे और हावभाव पहचान पर तीसरे आईईईई अंतर्राष्ट्रीय सम्मेलन की कार्यवाही. pp. 200–205. doi:10.1109/AFGR.1998.670949. ISBN 0-8186-8344-9. OL 11390549M. S2CID 1586662.
  18. Gdyczynski, C.M.; Manbachi, A.; et al. (2014). "माइक्रो-सीटी छवियों से पेडिकल ट्रैब्युलर हड्डी में दिशात्मक वितरण का अनुमान लगाने पर". Physiological Measurement. 35 (12): 2415–2428. Bibcode:2014PhyM...35.2415G. doi:10.1088/0967-3334/35/12/2415. PMID 25391037. S2CID 206078730.


बाहरी संबंध


अग्रिम पठन