वीनर डिकोनवोल्यूशन: Difference between revisions

From Vigyanwiki
No edit summary
(text)
Line 1: Line 1:
[[File:Image restoration (motion blur, Wiener filtering).png|thumb|350px|बाएं से: मूल छवि, धुंधली छवि, वीनर विसंवलन का उपयोग करके छवि को [[धुंधला करना]]।]]गणित में, '''वीनर [[विखंडन|विसंवलन]]''', विसंवलन में निहित [[शोर]] समस्याओं के लिए[[ विनीज़ फ़िल्टर | विनीज़ निस्यन्दक]] का एक अनुप्रयोग है। यह [[आवृत्ति डोमेन|आवृत्ति कार्यक्षेत्र]] में काम करता है, उन आवृति पर डिकंवॉल्व्ड शोर के प्रभाव को कम करने का प्रयास करता है जिनमें संकेत-से-शोर अनुपात खराब होता है।
[[File:Image restoration (motion blur, Wiener filtering).png|thumb|350px|बाएं से: मूल छवि, धुंधली छवि, वीनर विसंवलन का उपयोग करके छवि को [[धुंधला करना]]।]]गणित में, '''वीनर [[विखंडन|विसंवलन]]''', विसंवलन में निहित [[शोर|नॉइज़]] समस्याओं के लिए[[ विनीज़ फ़िल्टर | विनीज़ निस्यन्दक]] का एक अनुप्रयोग है। यह [[आवृत्ति डोमेन|आवृत्ति कार्यक्षेत्र]] में काम करता है, उन आवृति पर डिकंवॉल्व्ड नॉइज़ के प्रभाव को कम करने का प्रयास करता है जिनमें सिग्नल-से-नॉइज़ अनुपात खराब होता है।


वीनर विसंवलन विधि का [[छवि]] विसंवलन अनुप्रयोगों में व्यापक उपयोग होता है, क्योंकि अधिकांश दृश्य छवियों का आवृत्ति वर्णक्रम काफी अच्छी तरह से व्यवहार किया जाता है और आसानी से अनुमान लगाया जा सकता है।
वीनर विसंवलन विधि का [[छवि]] विसंवलन अनुप्रयोगों में व्यापक उपयोग होता है, क्योंकि अधिकांश दृश्य छवियों का आवृत्ति वर्णक्रम काफी अच्छी तरह से व्यवहार किया जाता है और आसानी से अनुमान लगाया जा सकता है।
Line 7: Line 7:
== परिभाषा ==
== परिभाषा ==


एक प्रणाली दी गई:
एक प्रणाली दी गई है:


:<math>\ y(t) = (h*x)(t) + n(t)</math>
:<math>\ y(t) = (h*x)(t) + n(t)</math>
जहाँ <math>*</math> [[कनवल्शन|संवलन]] को दर्शाता है और:
जहाँ <math>*</math> [[कनवल्शन|संवलन]] को दर्शाता है और:


*<math>\ x(t)</math> समय<math>\ t </math> पर कुछ मूल संकेत (अज्ञात) है।
*<math>\ x(t)</math> समय<math>\ t </math> पर कुछ मूल सिग्नल (अज्ञात) है।
*<math>\ h(t)</math> रैखिक समय-अपरिवर्तनीय प्रणाली की ज्ञात [[आवेग प्रतिक्रिया]] है।
*<math>\ h(t)</math> रैखिक समय-अपरिवर्तनीय प्रणाली की ज्ञात [[आवेग प्रतिक्रिया]] है।
*<math>\ n(t)</math> कुछ अज्ञात योगात्मक शोर है, जो<math>\ x(t)</math> से स्वतंत्र है।
*<math>\ n(t)</math> कुछ अज्ञात योगात्मक नॉइज़ है, जो<math>\ x(t)</math> से स्वतंत्र है।
*<math>\ y(t)</math> हमारा देखा हुआ संकेत है।
*<math>\ y(t)</math> हमारा देखा हुआ सिग्नल है।


हमारा लक्ष्य कुछ <math>\ g(t)</math> खोजना है ताकि हम निम्नलिखित नुसार <math>\ x(t)</math> का अनुमान लगा सकें:
हमारा लक्ष्य कुछ <math>\ g(t)</math> खोजना है ताकि हम निम्नलिखित नुसार <math>\ x(t)</math> का अनुमान लगा सकें:
Line 30: Line 30:


* <math>\ G(f)</math> और <math>\ H(f)</math> के [[फूरियर रूपांतरण]]<math>\ g(t)</math> और<math>\ h(t)</math> हैं,
* <math>\ G(f)</math> और <math>\ H(f)</math> के [[फूरियर रूपांतरण]]<math>\ g(t)</math> और<math>\ h(t)</math> हैं,
* <math>\ S(f) = \mathbb{E}|X(f)|^2 </math> मूल संकेत का औसत पावर वर्णक्रमीय घनत्व <math>\ x(t)</math> है,
* <math>\ S(f) = \mathbb{E}|X(f)|^2 </math> मूल सिग्नल का औसत शक्ति स्पेक्ट्रमी घनत्व <math>\ x(t)</math> है,
* <math>\ N(f) = \mathbb{E}|V(f)|^2 </math> शोर का औसत शक्ति वर्णक्रमीय घनत्व <math>\ n(t)</math> है,
* <math>\ N(f) = \mathbb{E}|V(f)|^2 </math> नॉइज़ का औसत शक्ति स्पेक्ट्रमी घनत्व<math>\ n(t)</math> है,
* <math>X(f)</math>, <math>Y(f)</math>, और <math>V(f)</math> के फूरियर रूपांतरण <math>x(t)</math>, और <math>y(t)</math>हैं, क्रमश,
* <math>X(f)</math>, <math>Y(f)</math>, और <math>V(f)</math> के फूरियर रूपांतरण <math>x(t)</math>, और <math>y(t)</math>हैं, क्रमश,
* अधिलेख <math>{}^*</math> जटिल संयुग्म को दर्शाता है।
* अधिलेख <math>{}^*</math> जटिल संयुग्म को दर्शाता है।
Line 38: Line 38:


:<math>\ \hat{X}(f) = G(f)Y(f)</math>
:<math>\ \hat{X}(f) = G(f)Y(f)</math>
और फिर [[उलटा फूरियर रूपांतरण]] <math>\ \hat{X}(f)</math> प्राप्त करने के लिए <math>\ \hat{x}(t)</math> निष्पादित करना
और फिर [[उलटा फूरियर रूपांतरण|प्रतिलोम फूरिये रूपांतर]]<math>\ \hat{X}(f)</math> प्राप्त करने के लिए <math>\ \hat{x}(t)</math> निष्पादित करना


ध्यान दें कि छवियों की स्तिथि में, तर्क <math>\ t </math> और <math>\ f </math> द्वि-आयामी हो जाते हैं; हालाँकि परिणाम वही है।
ध्यान दें कि छवियों की स्तिथि में, तर्क <math>\ t </math> और <math>\ f </math> द्वि-आयामी हो जाते हैं; हालाँकि परिणाम वही है।
Line 51: Line 51:
\end{align}
\end{align}
</math>
</math>
यहाँ, <math>\ 1/H(f)</math> मूल प्रणाली का उलटा है, <math>\ \mathrm{SNR}(f) = S(f)/N(f)</math> संकेत-से-शोर अनुपात है, और <math>\ |H(f)|^2 \mathrm{SNR}(f)</math> शोर वर्णक्रमीय घनत्व के लिए शुद्ध निस्यन्दक किए गए संकेत का अनुपात है। जब शून्य शोर (यानी अनंत संकेत-से-शोर) होता है, तो वर्गाकार कोष्ठक के अंदर का शब्द 1 के बराबर होता है, जिसका अर्थ है कि वीनर निस्यन्दक प्रणाली का उलटा है, जैसा कि हम उम्मीद कर सकते हैं। हालाँकि, जैसे-जैसे कुछ आवृत्तियों पर शोर बढ़ता है, संकेत-से-शोर अनुपात कम हो जाता है, इसलिए वर्ग कोष्ठक के अंदर का शब्द भी कम हो जाता है। इसका मतलब यह है कि वीनर निस्यन्दक उनके निस्यन्दक किए गए संकेत-से-शोर अनुपात के अनुसार आवृत्तियों को क्षीण करता है।
यहाँ, <math>\ 1/H(f)</math> मूल प्रणाली का प्रतिलोम है, <math>\ \mathrm{SNR}(f) = S(f)/N(f)</math> सिग्नल-से-नॉइज़ अनुपात है, और <math>\ |H(f)|^2 \mathrm{SNR}(f)</math> नॉइज़ वर्णक्रमीय घनत्व के लिए शुद्ध निस्यन्दक किए गए सिग्नल का अनुपात है। जब शून्य नॉइज़ (यानी अनंत सिग्नल-से-नॉइज़) होता है, तो वर्गाकार कोष्ठक के अंदर का शब्द 1 के बराबर होता है, जिसका अर्थ है कि वीनर निस्यन्दक प्रणाली का प्रतिलोम है, जैसा कि हम आशा कर सकते हैं। हालाँकि, जैसे-जैसे कुछ आवृत्तियों पर नॉइज़ बढ़ता है, सिग्नल-से-नॉइज़ अनुपात कम हो जाता है, इसलिए वर्ग कोष्ठक के अंदर का शब्द भी कम हो जाता है। इसका अर्थ यह है कि वीनर निस्यन्दक उनके निस्यन्दक किए गए सिग्नल-से-नॉइज़ अनुपात के अनुसार आवृत्तियों को क्षीण करता है।


उपरोक्त वीनर निस्यन्दक समीकरण के लिए हमें एक विशिष्ट छवि की वर्णक्रमीय सामग्री और शोर की भी जानकारी होनी आवश्यक है। प्रायः, हमें इन सटीक मात्राओं तक पहुंच नहीं होती है, लेकिन हम ऐसी स्थिति में हो सकते हैं जहां अच्छे अनुमान लगाए जा सकते हैं। उदाहरण के लिए, छायाचित्रित छवियों की स्तिथि में, संकेत (मूल छवि) में सामान्यतः शक्तिशाली कम आवृत्तियों और शक्तिविहीन उच्च आवृत्तियों होती हैं, जबकि कई स्तिथियों में शोर सामग्री आवृत्ति के साथ अपेक्षाकृत सपाट होगी।
उपरोक्त वीनर निस्यन्दक समीकरण के लिए हमें एक विशिष्ट छवि की वर्णक्रमीय सामग्री और नॉइज़ की भी जानकारी होनी आवश्यक है। प्रायः, हमें इन सटीक मात्राओं तक पहुंच नहीं होती है, लेकिन हम ऐसी स्थिति में हो सकते हैं जहां अच्छे अनुमान लगाए जा सकते हैं। उदाहरण के लिए, छायाचित्रित छवियों की स्तिथि में, सिग्नल (मूल छवि) में सामान्यतः शक्तिशाली कम आवृत्तियों और शक्तिविहीन उच्च आवृत्तियों होती हैं, जबकि कई स्तिथियों में नॉइज़ सामग्री आवृत्ति के साथ अपेक्षाकृत सपाट होगी।


== व्युत्पत्ति ==
== व्युत्पत्ति ==


जैसा कि ऊपर उल्लेख किया गया है, हम मूल संकेत का एक अनुमान तैयार करना चाहते हैं जो माध्य वर्ग त्रुटि को कम करता है, जिसे निम्नलिखित रूप से व्यक्त किया जा सकता है:
जैसा कि ऊपर उल्लेख किया गया है, हम मूल सिग्नल का एक अनुमान तैयार करना चाहते हैं जो माध्य वर्ग त्रुटि को कम करता है, जिसे निम्नलिखित रूप से व्यक्त किया जा सकता है:


:<math>\ \epsilon(f) = \mathbb{E} \left| X(f) - \hat{X}(f) \right|^2</math>  
:<math>\ \epsilon(f) = \mathbb{E} \left| X(f) - \hat{X}(f) \right|^2</math>  
Line 82: Line 82:
\end{align}
\end{align}
</math>
</math>
हालाँकि, हम यह मान रहे हैं कि शोर संकेत से स्वतंत्र है, इसलिए:
हालाँकि, हम यह मान रहे हैं कि नॉइज़ सिग्नल से स्वतंत्र है, इसलिए:


:<math>\ \mathbb{E}\Big\{X(f)V^*(f)\Big\} =  \mathbb{E}\Big\{V(f)X^*(f)\Big\} = 0</math>
:<math>\ \mathbb{E}\Big\{X(f)V^*(f)\Big\} =  \mathbb{E}\Big\{V(f)X^*(f)\Big\} = 0</math>

Revision as of 10:44, 22 September 2023

बाएं से: मूल छवि, धुंधली छवि, वीनर विसंवलन का उपयोग करके छवि को धुंधला करना

गणित में, वीनर विसंवलन, विसंवलन में निहित नॉइज़ समस्याओं के लिए विनीज़ निस्यन्दक का एक अनुप्रयोग है। यह आवृत्ति कार्यक्षेत्र में काम करता है, उन आवृति पर डिकंवॉल्व्ड नॉइज़ के प्रभाव को कम करने का प्रयास करता है जिनमें सिग्नल-से-नॉइज़ अनुपात खराब होता है।

वीनर विसंवलन विधि का छवि विसंवलन अनुप्रयोगों में व्यापक उपयोग होता है, क्योंकि अधिकांश दृश्य छवियों का आवृत्ति वर्णक्रम काफी अच्छी तरह से व्यवहार किया जाता है और आसानी से अनुमान लगाया जा सकता है।

वीनर विसंवलन का नाम नॉर्बर्ट वीनर के नाम पर रखा गया है।

परिभाषा

एक प्रणाली दी गई है:

जहाँ संवलन को दर्शाता है और:

  • समय पर कुछ मूल सिग्नल (अज्ञात) है।
  • रैखिक समय-अपरिवर्तनीय प्रणाली की ज्ञात आवेग प्रतिक्रिया है।
  • कुछ अज्ञात योगात्मक नॉइज़ है, जो से स्वतंत्र है।
  • हमारा देखा हुआ सिग्नल है।

हमारा लक्ष्य कुछ खोजना है ताकि हम निम्नलिखित नुसार का अनुमान लगा सकें:

जहाँ का एक अनुमान है जो माध्य वर्ग त्रुटि को न्यूनतम करता है

,

साथ ही अपेक्षित मूल्य को दर्शाता है। वीनर विसंवलन निस्यन्दक प्रदान करता है। निस्यन्दक को आवृति कार्यक्षेत्र में सबसे आसानी से वर्णित किया गया है:

जहाँ:

  • और के फूरियर रूपांतरण और हैं,
  • मूल सिग्नल का औसत शक्ति स्पेक्ट्रमी घनत्व है,
  • नॉइज़ का औसत शक्ति स्पेक्ट्रमी घनत्व है,
  • , , और के फूरियर रूपांतरण , और हैं, क्रमश,
  • अधिलेख जटिल संयुग्म को दर्शाता है।

निस्यंदन संचालन या तो समय-कार्यक्षेत्र में, जैसा कि ऊपर किया गया है, या आवृति कार्यक्षेत्र में किया जा सकता है:

और फिर प्रतिलोम फूरिये रूपांतर प्राप्त करने के लिए निष्पादित करना

ध्यान दें कि छवियों की स्तिथि में, तर्क और द्वि-आयामी हो जाते हैं; हालाँकि परिणाम वही है।

व्याख्या

वीनर निस्यन्दक का संचालन तब स्पष्ट हो जाता है जब उपरोक्त निस्यन्दक समीकरण को फिर से लिखा जाता है:

यहाँ, मूल प्रणाली का प्रतिलोम है, सिग्नल-से-नॉइज़ अनुपात है, और नॉइज़ वर्णक्रमीय घनत्व के लिए शुद्ध निस्यन्दक किए गए सिग्नल का अनुपात है। जब शून्य नॉइज़ (यानी अनंत सिग्नल-से-नॉइज़) होता है, तो वर्गाकार कोष्ठक के अंदर का शब्द 1 के बराबर होता है, जिसका अर्थ है कि वीनर निस्यन्दक प्रणाली का प्रतिलोम है, जैसा कि हम आशा कर सकते हैं। हालाँकि, जैसे-जैसे कुछ आवृत्तियों पर नॉइज़ बढ़ता है, सिग्नल-से-नॉइज़ अनुपात कम हो जाता है, इसलिए वर्ग कोष्ठक के अंदर का शब्द भी कम हो जाता है। इसका अर्थ यह है कि वीनर निस्यन्दक उनके निस्यन्दक किए गए सिग्नल-से-नॉइज़ अनुपात के अनुसार आवृत्तियों को क्षीण करता है।

उपरोक्त वीनर निस्यन्दक समीकरण के लिए हमें एक विशिष्ट छवि की वर्णक्रमीय सामग्री और नॉइज़ की भी जानकारी होनी आवश्यक है। प्रायः, हमें इन सटीक मात्राओं तक पहुंच नहीं होती है, लेकिन हम ऐसी स्थिति में हो सकते हैं जहां अच्छे अनुमान लगाए जा सकते हैं। उदाहरण के लिए, छायाचित्रित छवियों की स्तिथि में, सिग्नल (मूल छवि) में सामान्यतः शक्तिशाली कम आवृत्तियों और शक्तिविहीन उच्च आवृत्तियों होती हैं, जबकि कई स्तिथियों में नॉइज़ सामग्री आवृत्ति के साथ अपेक्षाकृत सपाट होगी।

व्युत्पत्ति

जैसा कि ऊपर उल्लेख किया गया है, हम मूल सिग्नल का एक अनुमान तैयार करना चाहते हैं जो माध्य वर्ग त्रुटि को कम करता है, जिसे निम्नलिखित रूप से व्यक्त किया जा सकता है:

की पिछली परिभाषा के समतुल्य, फूरियर रूपांतरण के लिए प्लांचरेल प्रमेय या पार्सेवल के प्रमेय का उपयोग करके प्राप्त किया जा सकता है।

यदि हम अभिव्यक्ति में इसके लिए स्थानापन्न करते हैं, उपरोक्त को पुनर्व्यवस्थित किया जा सकता है

यदि हम द्विघात का विस्तार करें, तो हमें निम्नलिखित मिलता है:

हालाँकि, हम यह मान रहे हैं कि नॉइज़ सिग्नल से स्वतंत्र है, इसलिए:

शक्ति वर्णक्रमीय घनत्व और को प्रतिस्थापित करने पर, हमारे पास निम्न है:

न्यूनतम त्रुटि मान ज्ञात करने के लिए, हम इसके संबंध में विर्टिंगर व्युत्पन्न की गणना करते हैं और इसे शून्य के बराबर निर्धारित करें।

इस अंतिम समानता को वीनर निस्यन्दक देने के लिए पुन: व्यवस्थित किया जा सकता है।

यह भी देखें

संदर्भ

  • Rafael Gonzalez, Richard Woods, and Steven Eddins. Digital Image Processing Using Matlab. Prentice Hall, 2003.


बाहरी संबंध