वीनर डिकोनवोल्यूशन: Difference between revisions
m (Deepak moved page वीनर डेकोंवोलुशन to वीनर डिकोनवोल्यूशन without leaving a redirect) |
No edit summary |
||
Line 1: | Line 1: | ||
[[File:Image restoration (motion blur, Wiener filtering).png|thumb|350px|बाएं से: मूल छवि, धुंधली छवि, वीनर | [[File:Image restoration (motion blur, Wiener filtering).png|thumb|350px|बाएं से: मूल छवि, धुंधली छवि, वीनर विसंवलन का उपयोग करके छवि को [[धुंधला करना]]।]]गणित में, '''वीनर [[विखंडन|विसंवलन]]''', विसंवलन में निहित [[शोर]] समस्याओं के लिए[[ विनीज़ फ़िल्टर | विनीज़ निस्यन्दक]] का एक अनुप्रयोग है। यह [[आवृत्ति डोमेन|आवृत्ति कार्यक्षेत्र]] में काम करता है, उन आवृति पर डिकंवॉल्व्ड शोर के प्रभाव को कम करने का प्रयास करता है जिनमें संकेत-से-शोर अनुपात खराब होता है। | ||
वीनर | वीनर विसंवलन विधि का [[छवि]] विसंवलन अनुप्रयोगों में व्यापक उपयोग होता है, क्योंकि अधिकांश दृश्य छवियों का आवृत्ति वर्णक्रम काफी अच्छी तरह से व्यवहार किया जाता है और आसानी से अनुमान लगाया जा सकता है। | ||
वीनर | वीनर विसंवलन का नाम [[नॉर्बर्ट वीनर]] के नाम पर रखा गया है। | ||
== परिभाषा == | == परिभाषा == | ||
Line 10: | Line 10: | ||
:<math>\ y(t) = (h*x)(t) + n(t)</math> | :<math>\ y(t) = (h*x)(t) + n(t)</math> | ||
जहाँ <math>*</math> [[कनवल्शन|संवलन]] को दर्शाता है और: | |||
*<math>\ x(t)</math> समय | *<math>\ x(t)</math> समय<math>\ t </math> पर कुछ मूल संकेत (अज्ञात) है। | ||
*<math>\ h(t)</math> | *<math>\ h(t)</math> रैखिक समय-अपरिवर्तनीय प्रणाली की ज्ञात [[आवेग प्रतिक्रिया]] है। | ||
*<math>\ n(t)</math> कुछ अज्ञात योगात्मक शोर है, | *<math>\ n(t)</math> कुछ अज्ञात योगात्मक शोर है, जो<math>\ x(t)</math> से स्वतंत्र है। | ||
*<math>\ y(t)</math> हमारा देखा हुआ संकेत | *<math>\ y(t)</math> हमारा देखा हुआ संकेत है। | ||
हमारा लक्ष्य कुछ | हमारा लक्ष्य कुछ <math>\ g(t)</math> खोजना है ताकि हम निम्नलिखित नुसार <math>\ x(t)</math> का अनुमान लगा सकें: | ||
:<math>\ \hat{x}(t) = (g*y)(t)</math> | :<math>\ \hat{x}(t) = (g*y)(t)</math> | ||
जहाँ <math>\ \hat{x}(t)</math> का एक अनुमान <math>\ x(t)</math> है जो माध्य वर्ग त्रुटि को न्यूनतम करता है | |||
: <math>\ \epsilon(t) = \mathbb{E} \left| x(t) - \hat{x}(t) \right|^2</math>, | : <math>\ \epsilon(t) = \mathbb{E} \left| x(t) - \hat{x}(t) \right|^2</math>, | ||
साथ <math>\ \mathbb{E}</math> [[अपेक्षित मूल्य]] को | साथ ही<math>\ \mathbb{E}</math> [[अपेक्षित मूल्य]] को दर्शाता है। वीनर विसंवलन निस्यन्दक <math>\ g(t)</math> प्रदान करता है। निस्यन्दक को आवृति कार्यक्षेत्र में सबसे आसानी से वर्णित किया गया है: | ||
वीनर | |||
:<math>\ G(f) = \frac{H^*(f)S(f)}{ |H(f)|^2 S(f) + N(f) }</math> | :<math>\ G(f) = \frac{H^*(f)S(f)}{ |H(f)|^2 S(f) + N(f) }</math> | ||
जहाँ: | |||
* <math>\ G(f)</math> और <math>\ H(f)</math> के [[फूरियर रूपांतरण]] | * <math>\ G(f)</math> और <math>\ H(f)</math> के [[फूरियर रूपांतरण]]<math>\ g(t)</math> और<math>\ h(t)</math> हैं, | ||
* <math>\ S(f) = \mathbb{E}|X(f)|^2 </math> मूल | * <math>\ S(f) = \mathbb{E}|X(f)|^2 </math> मूल संकेत का औसत पावर वर्णक्रमीय घनत्व <math>\ x(t)</math> है, | ||
* <math>\ N(f) = \mathbb{E}|V(f)|^2 </math> शोर का औसत शक्ति वर्णक्रमीय घनत्व | * <math>\ N(f) = \mathbb{E}|V(f)|^2 </math> शोर का औसत शक्ति वर्णक्रमीय घनत्व <math>\ n(t)</math> है, | ||
* <math>X(f)</math>, <math>Y(f)</math>, और <math>V(f)</math> के फूरियर रूपांतरण | * <math>X(f)</math>, <math>Y(f)</math>, और <math>V(f)</math> के फूरियर रूपांतरण <math>x(t)</math>, और <math>y(t)</math>हैं, क्रमश, | ||
* | * अधिलेख <math>{}^*</math> जटिल संयुग्म को दर्शाता है। | ||
निस्यंदन संचालन या तो समय-कार्यक्षेत्र में, जैसा कि ऊपर किया गया है, या आवृति कार्यक्षेत्र में किया जा सकता है: | |||
:<math>\ \hat{X}(f) = G(f)Y(f)</math> | :<math>\ \hat{X}(f) = G(f)Y(f)</math> | ||
और फिर [[उलटा फूरियर रूपांतरण]] | और फिर [[उलटा फूरियर रूपांतरण]] <math>\ \hat{X}(f)</math> प्राप्त करने के लिए <math>\ \hat{x}(t)</math> निष्पादित करना | ||
ध्यान दें कि छवियों | ध्यान दें कि छवियों की स्तिथि में, तर्क <math>\ t </math> और <math>\ f </math> द्वि-आयामी हो जाते हैं; हालाँकि परिणाम वही है। | ||
== व्याख्या == | == व्याख्या == | ||
वीनर | वीनर निस्यन्दक का संचालन तब स्पष्ट हो जाता है जब उपरोक्त निस्यन्दक समीकरण को फिर से लिखा जाता है: | ||
:<math> | :<math> | ||
Line 52: | Line 51: | ||
\end{align} | \end{align} | ||
</math> | </math> | ||
यहाँ, <math>\ 1/H(f)</math> मूल प्रणाली का उलटा है, <math>\ \mathrm{SNR}(f) = S(f)/N(f)</math> | यहाँ, <math>\ 1/H(f)</math> मूल प्रणाली का उलटा है, <math>\ \mathrm{SNR}(f) = S(f)/N(f)</math> संकेत-से-शोर अनुपात है, और <math>\ |H(f)|^2 \mathrm{SNR}(f)</math> शोर वर्णक्रमीय घनत्व के लिए शुद्ध निस्यन्दक किए गए संकेत का अनुपात है। जब शून्य शोर (यानी अनंत संकेत-से-शोर) होता है, तो वर्गाकार कोष्ठक के अंदर का शब्द 1 के बराबर होता है, जिसका अर्थ है कि वीनर निस्यन्दक प्रणाली का उलटा है, जैसा कि हम उम्मीद कर सकते हैं। हालाँकि, जैसे-जैसे कुछ आवृत्तियों पर शोर बढ़ता है, संकेत-से-शोर अनुपात कम हो जाता है, इसलिए वर्ग कोष्ठक के अंदर का शब्द भी कम हो जाता है। इसका मतलब यह है कि वीनर निस्यन्दक उनके निस्यन्दक किए गए संकेत-से-शोर अनुपात के अनुसार आवृत्तियों को क्षीण करता है। | ||
उपरोक्त वीनर | उपरोक्त वीनर निस्यन्दक समीकरण के लिए हमें एक विशिष्ट छवि की वर्णक्रमीय सामग्री और शोर की भी जानकारी होनी आवश्यक है। प्रायः, हमें इन सटीक मात्राओं तक पहुंच नहीं होती है, लेकिन हम ऐसी स्थिति में हो सकते हैं जहां अच्छे अनुमान लगाए जा सकते हैं। उदाहरण के लिए, छायाचित्रित छवियों की स्तिथि में, संकेत (मूल छवि) में सामान्यतः शक्तिशाली कम आवृत्तियों और शक्तिविहीन उच्च आवृत्तियों होती हैं, जबकि कई स्तिथियों में शोर सामग्री आवृत्ति के साथ अपेक्षाकृत सपाट होगी। | ||
== व्युत्पत्ति == | == व्युत्पत्ति == | ||
जैसा कि ऊपर उल्लेख किया गया है, हम मूल | जैसा कि ऊपर उल्लेख किया गया है, हम मूल संकेत का एक अनुमान तैयार करना चाहते हैं जो माध्य वर्ग त्रुटि को कम करता है, जिसे निम्नलिखित रूप से व्यक्त किया जा सकता है: | ||
:<math>\ \epsilon(f) = \mathbb{E} \left| X(f) - \hat{X}(f) \right|^2</math> | :<math>\ \epsilon(f) = \mathbb{E} \left| X(f) - \hat{X}(f) \right|^2</math> | ||
<math>\epsilon</math> की पिछली परिभाषा के समतुल्य, फूरियर रूपांतरण के लिए [[प्लांचरेल प्रमेय]] या पार्सेवल के प्रमेय का उपयोग करके प्राप्त किया जा सकता है। | |||
यदि हम अभिव्यक्ति में इसके लिए | यदि हम अभिव्यक्ति में इसके लिए <math>\ \hat{X}(f)</math> स्थानापन्न करते हैं, उपरोक्त को पुनर्व्यवस्थित किया जा सकता है | ||
:<math> | :<math> | ||
Line 83: | Line 82: | ||
\end{align} | \end{align} | ||
</math> | </math> | ||
हालाँकि, हम यह मान रहे हैं कि शोर | हालाँकि, हम यह मान रहे हैं कि शोर संकेत से स्वतंत्र है, इसलिए: | ||
:<math>\ \mathbb{E}\Big\{X(f)V^*(f)\Big\} = \mathbb{E}\Big\{V(f)X^*(f)\Big\} = 0</math> | :<math>\ \mathbb{E}\Big\{X(f)V^*(f)\Big\} = \mathbb{E}\Big\{V(f)X^*(f)\Big\} = 0</math> | ||
शक्ति वर्णक्रमीय | शक्ति वर्णक्रमीय घनत्व<math>\ S(f) </math> और <math>\ N(f) </math> को प्रतिस्थापित करने पर, हमारे पास निम्न है: | ||
:<math> | :<math> | ||
\epsilon(f) = \Big[ 1-G(f)H(f) \Big]\Big[ 1-G(f)H(f) \Big]^ * S(f) + G(f)G^*(f)N(f) | \epsilon(f) = \Big[ 1-G(f)H(f) \Big]\Big[ 1-G(f)H(f) \Big]^ * S(f) + G(f)G^*(f)N(f) | ||
</math> | </math> | ||
न्यूनतम त्रुटि मान ज्ञात करने के लिए, हम इसके संबंध में [[विर्टिंगर डेरिवेटिव]] | न्यूनतम त्रुटि मान ज्ञात करने के लिए, हम इसके संबंध में [[विर्टिंगर डेरिवेटिव|विर्टिंगर व्युत्पन्न]] <math>\ G(f)</math> की गणना करते हैं और इसे शून्य के बराबर निर्धारित करें। | ||
:<math>\ | :<math>\ | ||
\frac{d\epsilon(f)}{dG(f)} = 0 \Rightarrow G^*(f)N(f) - H(f)\Big[1 - G(f)H(f)\Big]^* S(f) = 0 | \frac{d\epsilon(f)}{dG(f)} = 0 \Rightarrow G^*(f)N(f) - H(f)\Big[1 - G(f)H(f)\Big]^* S(f) = 0 | ||
</math> | </math> | ||
इस अंतिम समानता को वीनर | इस अंतिम समानता को वीनर निस्यन्दक देने के लिए पुन: व्यवस्थित किया जा सकता है। | ||
== यह भी देखें == | == यह भी देखें == |
Revision as of 01:39, 21 September 2023
गणित में, वीनर विसंवलन, विसंवलन में निहित शोर समस्याओं के लिए विनीज़ निस्यन्दक का एक अनुप्रयोग है। यह आवृत्ति कार्यक्षेत्र में काम करता है, उन आवृति पर डिकंवॉल्व्ड शोर के प्रभाव को कम करने का प्रयास करता है जिनमें संकेत-से-शोर अनुपात खराब होता है।
वीनर विसंवलन विधि का छवि विसंवलन अनुप्रयोगों में व्यापक उपयोग होता है, क्योंकि अधिकांश दृश्य छवियों का आवृत्ति वर्णक्रम काफी अच्छी तरह से व्यवहार किया जाता है और आसानी से अनुमान लगाया जा सकता है।
वीनर विसंवलन का नाम नॉर्बर्ट वीनर के नाम पर रखा गया है।
परिभाषा
एक प्रणाली दी गई:
जहाँ संवलन को दर्शाता है और:
- समय पर कुछ मूल संकेत (अज्ञात) है।
- रैखिक समय-अपरिवर्तनीय प्रणाली की ज्ञात आवेग प्रतिक्रिया है।
- कुछ अज्ञात योगात्मक शोर है, जो से स्वतंत्र है।
- हमारा देखा हुआ संकेत है।
हमारा लक्ष्य कुछ खोजना है ताकि हम निम्नलिखित नुसार का अनुमान लगा सकें:
जहाँ का एक अनुमान है जो माध्य वर्ग त्रुटि को न्यूनतम करता है
- ,
साथ ही अपेक्षित मूल्य को दर्शाता है। वीनर विसंवलन निस्यन्दक प्रदान करता है। निस्यन्दक को आवृति कार्यक्षेत्र में सबसे आसानी से वर्णित किया गया है:
जहाँ:
- और के फूरियर रूपांतरण और हैं,
- मूल संकेत का औसत पावर वर्णक्रमीय घनत्व है,
- शोर का औसत शक्ति वर्णक्रमीय घनत्व है,
- , , और के फूरियर रूपांतरण , और हैं, क्रमश,
- अधिलेख जटिल संयुग्म को दर्शाता है।
निस्यंदन संचालन या तो समय-कार्यक्षेत्र में, जैसा कि ऊपर किया गया है, या आवृति कार्यक्षेत्र में किया जा सकता है:
और फिर उलटा फूरियर रूपांतरण प्राप्त करने के लिए निष्पादित करना
ध्यान दें कि छवियों की स्तिथि में, तर्क और द्वि-आयामी हो जाते हैं; हालाँकि परिणाम वही है।
व्याख्या
वीनर निस्यन्दक का संचालन तब स्पष्ट हो जाता है जब उपरोक्त निस्यन्दक समीकरण को फिर से लिखा जाता है:
यहाँ, मूल प्रणाली का उलटा है, संकेत-से-शोर अनुपात है, और शोर वर्णक्रमीय घनत्व के लिए शुद्ध निस्यन्दक किए गए संकेत का अनुपात है। जब शून्य शोर (यानी अनंत संकेत-से-शोर) होता है, तो वर्गाकार कोष्ठक के अंदर का शब्द 1 के बराबर होता है, जिसका अर्थ है कि वीनर निस्यन्दक प्रणाली का उलटा है, जैसा कि हम उम्मीद कर सकते हैं। हालाँकि, जैसे-जैसे कुछ आवृत्तियों पर शोर बढ़ता है, संकेत-से-शोर अनुपात कम हो जाता है, इसलिए वर्ग कोष्ठक के अंदर का शब्द भी कम हो जाता है। इसका मतलब यह है कि वीनर निस्यन्दक उनके निस्यन्दक किए गए संकेत-से-शोर अनुपात के अनुसार आवृत्तियों को क्षीण करता है।
उपरोक्त वीनर निस्यन्दक समीकरण के लिए हमें एक विशिष्ट छवि की वर्णक्रमीय सामग्री और शोर की भी जानकारी होनी आवश्यक है। प्रायः, हमें इन सटीक मात्राओं तक पहुंच नहीं होती है, लेकिन हम ऐसी स्थिति में हो सकते हैं जहां अच्छे अनुमान लगाए जा सकते हैं। उदाहरण के लिए, छायाचित्रित छवियों की स्तिथि में, संकेत (मूल छवि) में सामान्यतः शक्तिशाली कम आवृत्तियों और शक्तिविहीन उच्च आवृत्तियों होती हैं, जबकि कई स्तिथियों में शोर सामग्री आवृत्ति के साथ अपेक्षाकृत सपाट होगी।
व्युत्पत्ति
जैसा कि ऊपर उल्लेख किया गया है, हम मूल संकेत का एक अनुमान तैयार करना चाहते हैं जो माध्य वर्ग त्रुटि को कम करता है, जिसे निम्नलिखित रूप से व्यक्त किया जा सकता है:
की पिछली परिभाषा के समतुल्य, फूरियर रूपांतरण के लिए प्लांचरेल प्रमेय या पार्सेवल के प्रमेय का उपयोग करके प्राप्त किया जा सकता है।
यदि हम अभिव्यक्ति में इसके लिए स्थानापन्न करते हैं, उपरोक्त को पुनर्व्यवस्थित किया जा सकता है
यदि हम द्विघात का विस्तार करें, तो हमें निम्नलिखित मिलता है:
हालाँकि, हम यह मान रहे हैं कि शोर संकेत से स्वतंत्र है, इसलिए:
शक्ति वर्णक्रमीय घनत्व और को प्रतिस्थापित करने पर, हमारे पास निम्न है:
न्यूनतम त्रुटि मान ज्ञात करने के लिए, हम इसके संबंध में विर्टिंगर व्युत्पन्न की गणना करते हैं और इसे शून्य के बराबर निर्धारित करें।
इस अंतिम समानता को वीनर निस्यन्दक देने के लिए पुन: व्यवस्थित किया जा सकता है।
यह भी देखें
- सूचना क्षेत्र सिद्धांत
- विखंडन
- वीनर फिल्टर
- प्वाइंट स्प्रेड फ़ंक्शन
- अंधा विखंडन
- फूरियर रूपांतरण
संदर्भ
- Rafael Gonzalez, Richard Woods, and Steven Eddins. Digital Image Processing Using Matlab. Prentice Hall, 2003.