संकुचन क्षेत्र (छवि पुनर्स्थापना): Difference between revisions

From Vigyanwiki
No edit summary
Line 9: Line 9:




<math>{\hat{x}}_{t}</math> के रूप में सीखा जाता है <math>{\hat{x}}_{t}={g}_{{\mathrm{\Theta }}_{t}}\left({\hat{x}}_{t-1}\right)</math> प्रत्येक पुनरावृत्ति के लिए <math>t</math> प्रारंभिक मामले के साथ <math>{\hat{x}}_{0}=y</math>, यह गाऊसी [[सशर्त यादृच्छिक क्षेत्र]]ों (या संकुचन क्षेत्रों (सीएसएफ) का झरना) का एक झरना बनाता है। हानि-न्यूनीकरण का उपयोग मॉडल मापदंडों को सीखने के लिए किया जाता है <math>{\mathrm{\Theta }}_{t}={\left\lbrace {\lambda }_{t},{\pi }_{\mathit{ti}},{f}_{\mathit{ti}}\right\rbrace }_{i=1}^{N}</math>.


सीखने के उद्देश्य फ़ंक्शन को इस प्रकार परिभाषित किया गया है <math>J\left({\mathrm{\Theta }}_{t}\right)={\sum }_{s=1}^{S}l\left({\hat{x}}_{t}^{\left(s\right)};{x}_{gt}^{\left(s\right)}\right)</math>, कहाँ <math>l</math> वर्गीकरण के लिए एक भिन्न फ़ंक्शन हानि फ़ंक्शन है जिसे प्रशिक्षण डेटा का उपयोग करके लालच से कम किया जाता है <math>{\left\lbrace {x}_{gt}^{\left(s\right)},{y}^{\left(s\right)},{k}^{\left(s\right)}\right\rbrace }_{s=1}^{S}</math> और <math>{\hat{x}}_{t}^{\left(s\right)}</math>.
<math>{\hat{x}}_{t}</math> को प्रारंभिक केस <math>{\hat{x}}_{0}=y</math> वॉटरफॉल के साथ प्रत्येक पुनरावृत्ति <math>t</math> के लिए <math>{\hat{x}}_{t}={g}_{{\mathrm{\Theta }}_{t}}\left({\hat{x}}_{t-1}\right)</math> के रूप में सीखा जाता है)। हानि-न्यूनीकरण का उपयोग मॉडल पैरामीटर <math>{\mathrm{\Theta }}_{t}={\left\lbrace {\lambda }_{t},{\pi }_{\mathit{ti}},{f}_{\mathit{ti}}\right\rbrace }_{i=1}^{N}</math>सीखने के लिए किया जाता है।
 
सीखने के उद्देश्य फ़ंक्शन को <math>J\left({\mathrm{\Theta }}_{t}\right)={\sum }_{s=1}^{S}l\left({\hat{x}}_{t}^{\left(s\right)};{x}_{gt}^{\left(s\right)}\right)</math>के रूप में परिभाषित किया गया है। जहां <math>l</math> एक अलग-अलग हानि फ़ंक्शन है जिसे प्रशिक्षण डेटा <math>{\left\lbrace {x}_{gt}^{\left(s\right)},{y}^{\left(s\right)},{k}^{\left(s\right)}\right\rbrace }_{s=1}^{S}</math> <math>{\hat{x}}_{t}^{\left(s\right)}</math> का उपयोग करके अति लोभ से से कम किया जाता है।


== प्रदर्शन ==
== प्रदर्शन ==

Revision as of 10:13, 14 December 2023

संकुचन क्षेत्र एक यादृच्छिक क्षेत्र-आधारित मशीन लर्निंग तकनीक है जिसका उद्देश्य कम कम्प्यूटेशनल ओवरहेड का उपयोग करके उच्च गुणवत्ता वाली छवि पुनर्स्थापना (डीनोइजिंग और डीब्लरिंग) करना है।

विधि

पुनर्स्थापित छवि का अनुमान नमूना छवियों के एक सेट पर प्रशिक्षण के बाद एक दूषित अवलोकन से लगाया गया है।

एक संकुचन (मैपिंग) फ़ंक्शन को सीधे रेडियल आधार फ़ंक्शन कर्नेल के रैखिक संयोजन के रूप में तैयार किया गया है, जहां साझा सटीक पैरामीटर है, (समदूरस्थ) कर्नेल स्थिति को दर्शाता है, और M गाऊसी कर्नेल की संख्या है।

क्योंकि संकुचन फ़ंक्शन को सीधे मॉडल किया गया है, अनुकूलन प्रक्रिया प्रति पुनरावृत्ति एकल द्विघात न्यूनतमकरण तक कम हो जाती है, जिसे सिकुड़न क्षेत्र की भविष्यवाणी के रूप में दर्शाया जाता है जहां असतत फूरियर रूपांतरण को दर्शाता है और 2D है बिंदु प्रसार फ़ंक्शन फ़िल्टर के साथ कनवल्शन एक ऑप्टिकल ट्रांसफर फ़ंक्शन है जिसे के असतत फूरियर रूपांतरण के रूप में परिभाषित किया गया है, और का जटिल संयुग्म है।


को प्रारंभिक केस वॉटरफॉल के साथ प्रत्येक पुनरावृत्ति के लिए के रूप में सीखा जाता है)। हानि-न्यूनीकरण का उपयोग मॉडल पैरामीटर सीखने के लिए किया जाता है।

सीखने के उद्देश्य फ़ंक्शन को के रूप में परिभाषित किया गया है। जहां एक अलग-अलग हानि फ़ंक्शन है जिसे प्रशिक्षण डेटा का उपयोग करके अति लोभ से से कम किया जाता है।

प्रदर्शन

लेखक द्वारा प्रारंभिक परीक्षणों से पता चलता है कि आर.टी.एफ5[1] की तुलना में थोड़ा बेहतर प्रदर्शन प्रदर्शन प्राप्त करता है , के बाद , , , और ब्लॉक-मिलान और 3डी फ़िल्टरिंग

ब्लॉक-मैचिंग और 3डी फ़िल्टरिंग डीनोइज़िंग गति के बीच में आती है और , आरटीएफ परिमाण का क्रम धीमा है।

लाभ

  • परिणाम ब्लॉक-मैचिंग और 3डी फ़िल्टरिंग द्वारा प्राप्त परिणामों से तुलनीय हैं (2007 में इसकी स्थापना के बाद से अत्याधुनिक डीनोइज़िंग में संदर्भ)
  • अन्य उच्च-प्रदर्शन विधियों की तुलना में न्यूनतम रनटाइम (संभवतः एम्बेडेड उपकरणों के भीतर लागू)
  • समानांतरीकरण योग्य (जैसे: संभावित जीपीयू कार्यान्वयन)
  • पूर्वानुमेयता: रनटाइम कहां पिक्सेल की संख्या है
  • सीपीयू के साथ भी तेज प्रशिक्षण

कार्यान्वयन

  • एक संदर्भ कार्यान्वयन MATLAB में लिखा गया है और BSD 2-क्लॉज लाइसेंस के तहत जारी किया गया है: संकुचन-फील्ड्स

यह भी देखें

संदर्भ

  1. Jancsary, Jeremy; Nowozin, Sebastian; Sharp, Toby; Rother, Carsten (10 April 2012). Regression Tree Fields – An Efficient, Non-parametric Approach to Image Labeling Problems. IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR). Providence, RI, USA: IEEE Computer Society. doi:10.1109/CVPR.2012.6247950.