सारांशित क्षेत्र तालिका: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
 
(5 intermediate revisions by 3 users not shown)
Line 1: Line 1:
[[File:integral_image_application_example.svg|thumb|upright|ऑर्डर -6 [[जादू वर्ग]] (1.) के योग-क्षेत्र तालिका (2.) का उपयोग करके इसके मानों के एक उप-आयत का योग करना; प्रत्येक रंगीन स्थान उस रंग के आयत के अंदर योग को हाइलाइट करता है।]]एक योग-क्षेत्र तालिका एक ग्रिड के एक आयताकार उपसमुच्चय में मूल्यों के योग को जल्दी और कुशलता से उत्पन्न करने के लिए एक [[डेटा संरचना]] और [[कलन विधि]] है। [[ मूर्ति प्रोद्योगिकी |मूर्ति प्रोद्योगिकी]] डोमेन में, इसे इंटीग्रल इमेज के रूप में भी जाना जाता है। यह 1984 में फ्रैंकलिन सी. क्रो द्वारा [[मिपमैप|मिपमैप्स]] के साथ उपयोग के लिए [[ कंप्यूटर चित्रलेख |कंप्यूटर चित्रलेख]] के लिए प्रस्तुत किया गया था। [[कंप्यूटर दृष्टि]] में इसे लुईस द्वारा लोकप्रिय बनाया गया था<ref>{{cite conference|last1=Lewis|first1=J.P.|title=तेज़ टेम्पलेट मिलान| journal=Proc. Vision Interface|date=1995|pages=120–123}}</ref> और उसके बाद अभिन्न छवि नाम दिया गया और 2001 में वियोला-जोन्स ऑब्जेक्ट डिटेक्शन फ्रेमवर्क के अंदर प्रमुखता से उपयोग किया गया। ऐतिहासिक रूप से, यह सिद्धांत बहु-आयामी संभाव्यता वितरण कार्यों के अध्ययन में बहुत अच्छी तरह से जाना जाता है, अर्थात् 2D (या ND) संभावनाओं की गणना में ( संभाव्यता वितरण के अनुसार क्षेत्र) संबंधित [[संचयी वितरण कार्य|संचयी वितरण कार्यों]] से।<ref name="Finkelstein2010">{{cite conference
[[File:integral_image_application_example.svg|thumb|upright|ऑर्डर -6 [[जादू वर्ग]] (1.) के सारांशित क्षेत्र तालिका (2.) का उपयोग करके इसके मानों के एक उप-आयत का योग करना; प्रत्येक रंगीन स्थान उस रंग के आयत के अंदर योग को हाइलाइट करता है।]]एक सारांशित क्षेत्र तालिका एक ग्रिड के एक आयताकार उपसमुच्चय में मूल्यों के योग को जल्दी और कुशलता से उत्पन्न करने के लिए एक [[डेटा संरचना]] और [[कलन विधि]] है। [[ मूर्ति प्रोद्योगिकी |छवि प्रोद्योगिकी]] डोमेन में, इसे अभिन्न छवि के रूप में भी जाना जाता है। यह 1984 में फ्रैंकलिन सी. क्रो द्वारा [[मिपमैप|मिपमैप्स]] के साथ उपयोग के लिए [[ कंप्यूटर चित्रलेख |कंप्यूटर चित्रलेख]] के लिए प्रस्तुत किया गया था। [[कंप्यूटर दृष्टि|कंप्यूटर विजन]] में इसे लुईस द्वारा लोकप्रिय बनाया गया था<ref>{{cite conference|last1=Lewis|first1=J.P.|title=तेज़ टेम्पलेट मिलान| journal=Proc. Vision Interface|date=1995|pages=120–123}}</ref> और उसके बाद "अभिन्न छवि" नाम दिया गया और 2001 में वियोला-जोन्स वस्तु पहचान रूपरेखा के अंदर प्रमुखता से उपयोग किया गया। ऐतिहासिक रूप से, यह सिद्धांत बहु-आयामी संभाव्यता वितरण कार्यों के अध्ययन में बहुत अच्छी तरह से जाना जाता है, अर्थात् 2D (या ND) संभावनाओं की गणना में ( संभाव्यता वितरण के अनुसार क्षेत्र) संबंधित [[संचयी वितरण कार्य|संचयी वितरण कार्यों]] से उपयोगी है ।<ref name="Finkelstein2010">{{cite conference
   | first = Amir
   | first = Amir
   | last = Finkelstein
   | last = Finkelstein
Line 10: Line 10:
== एल्गोरिथम ==
== एल्गोरिथम ==


जैसा कि नाम से पता चलता है, सारांशित क्षेत्र तालिका में किसी भी बिंदु (x, y) पर मान ऊपर और (x, y) के बाईं ओर के सभी पिक्सेल का योग होता है, जिसमें सम्मिलित हैं:<ref>{{cite conference
जैसा कि नाम से पता चलता है, सारांशित क्षेत्र तालिका में किसी भी बिंदु (x, y) पर मान उपरोक्त सभी पिक्सेल का योग है और (x, y) के बाईं ओर है:<ref>{{cite conference
   | first = Franklin
   | first = Franklin
   | last = Crow
   | last = Crow
Line 26: Line 26:
   | year = 2002  
   | year = 2002  
   | url = http://www.hpl.hp.com/techreports/Compaq-DEC/CRL-2001-1.pdf }}
   | url = http://www.hpl.hp.com/techreports/Compaq-DEC/CRL-2001-1.pdf }}
</ref><math display="block"> I(x,y) = \sum_{\begin{smallmatrix} x' \le x \\ y' \le y\end{smallmatrix}} i(x',y')</math>कहाँ <math>i(x,y)</math> (x, y) पर पिक्सेल का मान है।
</ref><math display="block"> I(x,y) = \sum_{\begin{smallmatrix} x' \le x \\ y' \le y\end{smallmatrix}} i(x',y')</math>जहाँ (x, y) पर पिक्सेल का मान <math>i(x,y)</math> है।


सारांशित क्षेत्र तालिका को छवि पर एकल पास में कुशलता से गणना की जा सकती है, क्योंकि सारांशित क्षेत्र तालिका में मान (x, y) बस है:<ref>{{cite web | last1=BADGERATI | title=Computer Vision – The Integral Image | url=https://computersciencesource.wordpress.com/2010/09/03/computer-vision-the-integral-image/ | website=computersciencesource.wordpress.com | access-date=2017-02-13|date=2010-09-03}}</ref><math display="block"> I(x,y) = i(x,y) + I(x,y-1) + I(x-1,y) - I(x-1,y-1)</math>(ध्यान दिया गया है कि सम्‍मिलित आव्युह की गणना ऊपरी बाएँ कोने से की जाती है)
सारांशित क्षेत्र तालिका में मान (x, y) पर होने के कारण सारांशित क्षेत्र तालिका को छवि पर एकल पास में कुशलता से गणना की जा सकती है:<ref>{{cite web | last1=BADGERATI | title=Computer Vision – The Integral Image | url=https://computersciencesource.wordpress.com/2010/09/03/computer-vision-the-integral-image/ | website=computersciencesource.wordpress.com | access-date=2017-02-13|date=2010-09-03}}</ref><math display="block"> I(x,y) = i(x,y) + I(x,y-1) + I(x-1,y) - I(x-1,y-1)</math>(ध्यान दिया गया है कि सम्‍मिलित आव्युह की गणना ऊपरी बाएँ कोने से की जाती है)
[[File:Summed area table.png|thumb|सारांशित क्षेत्र तालिका डेटा संरचना/एल्गोरिदम में योग की गणना करने का विवरण]]एक बार सारांशित क्षेत्र तालिका की गणना हो जाने के बाद, किसी भी आयताकार क्षेत्र पर तीव्रता के योग का मूल्यांकन करने के लिए क्षेत्र के आकार की परवाह किए बिना ठीक चार सरणी संदर्भों की आवश्यकता होती है। यही है, दाईं ओर की आकृति में अंकन, होना {{math|1=''A'' = (''x''<sub>0</sub>, ''y''<sub>0</sub>)}}, {{math|1=''B'' = (''x''<sub>1</sub>, ''y''<sub>0</sub>)}}, {{math|1=''C'' = (''x''<sub>0</sub>, ''y''<sub>1</sub>)}} और {{math|1=''D'' = (''x''<sub>1</sub>, ''y''<sub>1</sub>)}}, कुल मिलाकर {{math|''i''(''x'',''y'')}} A, B, C, और D द्वारा फैलाए गए आयत के ऊपर है:<math display="block">\sum_{\begin{smallmatrix} x_0 < x \le x_1 \\ y_0 < y \le y_1 \end{smallmatrix}} i(x,y) = I(D) + I(A) - I(B) - I(C)</math>
[[File:Summed area table.png|thumb|सारांशित क्षेत्र तालिका डेटा संरचना/एल्गोरिदम में योग की गणना करने का विवरण]]एक बार सारांशित क्षेत्र तालिका की गणना हो जाने के बाद, किसी भी आयताकार क्षेत्र पर तीव्रता के योग का मूल्यांकन करने के लिए क्षेत्र के आकार की सावधानी रखे बिना ठीक चार सरणी संदर्भों की आवश्यकता होती है। अर्थात, दाईं ओर की आकृति में अंकन, जिसमें {{math|1=''A'' = (''x''<sub>0</sub>, ''y''<sub>0</sub>)}}, {{math|1=''B'' = (''x''<sub>1</sub>, ''y''<sub>0</sub>)}}, {{math|1=''C'' = (''x''<sub>0</sub>, ''y''<sub>1</sub>)}} और {{math|1=''D'' = (''x''<sub>1</sub>, ''y''<sub>1</sub>)}} है, कुल मिलाकर A, B, C, और D द्वारा फैले आयत पर {{math|''i''(''x'',''y'')}} का योग है:<math display="block">\sum_{\begin{smallmatrix} x_0 < x \le x_1 \\ y_0 < y \le y_1 \end{smallmatrix}} i(x,y) = I(D) + I(A) - I(B) - I(C)</math>


== एक्सटेंशन ==
== विस्तार ==
यह विधि स्वाभाविक रूप से निरंतर डोमेन तक विस्तारित है।<ref name="Finkelstein2010" />
यह विधि स्वाभाविक रूप से निरंतर डोमेन तक विस्तारित है।<ref name="Finkelstein2010" />


विधि को उच्च-आयामी छवियों तक भी बढ़ाया जा सकता है।<ref>{{cite journal | last=Tapia|first=Ernesto | title=उच्च-आयामी अभिन्न छवियों की गणना पर एक नोट| journal=Pattern Recognition Letters | date=January 2011 | volume=32 | issue=2 | pages=197–201 | doi=10.1016/j.patrec.2010.10.007}}</ref> यदि आयत के कोने हैं <math>x^p</math> साथ <math>p</math> में <math>\{0,1\}^d</math>, फिर आयत में समाहित छवि मानों के योग की गणना सूत्र के साथ की जाती है<math display="block"> \sum_{p\in\{0,1\}^d }(-1)^{d-\|p\|_1} I(x^p)</math>कहाँ <math>I(x)</math> पर अभिन्न छवि है <math>x</math> और <math>d</math> छवि आयाम। अंकन <math>x^p</math> के उदाहरण से मेल खाता है <math>d=2</math>, <math>A=x^{(0,0)}</math>, <math>B=x^{(1,0)}</math>, <math>C=x^{(1,1)}</math> और <math>D=x^{(0,1)}</math>. [[न्यूरोइमेजिंग]] में, उदाहरण के लिए, छवियों का आयाम होता है <math>d=3</math> या <math>d=4</math>, टाइम-स्टैम्प के साथ [[वॉक्सेल]] या वोक्सल्स का उपयोग करते समय।
विधि को उच्च-आयामी छवियों तक भी बढ़ाया जा सकता है।<ref>{{cite journal | last=Tapia|first=Ernesto | title=उच्च-आयामी अभिन्न छवियों की गणना पर एक नोट| journal=Pattern Recognition Letters | date=January 2011 | volume=32 | issue=2 | pages=197–201 | doi=10.1016/j.patrec.2010.10.007}}</ref> यदि आयत के कोने हैं <math>x^p</math> है और <math>\{0,1\}^d</math> में <math>p</math> है , तो आयत में निहित छवि मानों के योग की गणना सूत्र के साथ की जाती है:<math display="block"> \sum_{p\in\{0,1\}^d }(-1)^{d-\|p\|_1} I(x^p)</math>जहाँ <math>I(x)</math> छवि आयाम <math>x</math> और <math>d</math> पर अभिन्न छवि है। अंकन <math>x^p</math> के उदाहरण <math>d=2</math>, <math>A=x^{(0,0)}</math>, <math>B=x^{(1,0)}</math>, <math>C=x^{(1,1)}</math> और <math>D=x^{(0,1)}</math> से मेल खाता है। [[न्यूरोइमेजिंग]] में, उदाहरण के लिए, टाइम-स्टैम्प के साथ [[वॉक्सेल|वोक्सल्स]] या वोक्सल्स का उपयोग करते समय छवियों का आयाम <math>d=3</math> या <math>d=4</math> होता है।


फान एट अल के काम के रूप में इस पद्धति को उच्च-क्रम की अभिन्न छवि तक बढ़ा दिया गया है।<ref name="Phan-April2012">{{cite book| last1=Phan|first1=Thien| last2=Sohoni|first2=Sohum| last3=Larson|first3=Eric C.| last4=Chandler|first4=Damon M.| title=छवि गुणवत्ता मूल्यांकन का प्रदर्शन-विश्लेषण-आधारित त्वरण| journal=2012 IEEE Southwest Symposium on Image Analysis and Interpretation| date=22 April 2012| pages=81–84| doi=10.1109/SSIAI.2012.6202458| url=http://vision.okstate.edu/pubs/ssiai_tp_1.pdf| isbn=978-1-4673-1830-3| citeseerx=10.1.1.666.4791}}</ref> जिन्होंने छवि में स्थानीय ब्लॉक के [[मानक विचलन]] (विचरण), तिरछापन और कर्टोसिस की त्वरित और कुशलता से गणना करने के लिए दो, तीन, या चार अभिन्न छवियां प्रदान कीं। यह नीचे विस्तृत है:
फान एट अल के कार्य के रूप में इस पद्धति को उच्च-क्रम की अभिन्न छवि तक बढ़ा दिया गया है।<ref name="Phan-April2012">{{cite book| last1=Phan|first1=Thien| last2=Sohoni|first2=Sohum| last3=Larson|first3=Eric C.| last4=Chandler|first4=Damon M.| title=छवि गुणवत्ता मूल्यांकन का प्रदर्शन-विश्लेषण-आधारित त्वरण| journal=2012 IEEE Southwest Symposium on Image Analysis and Interpretation| date=22 April 2012| pages=81–84| doi=10.1109/SSIAI.2012.6202458| url=http://vision.okstate.edu/pubs/ssiai_tp_1.pdf| isbn=978-1-4673-1830-3| citeseerx=10.1.1.666.4791}}</ref> जिन्होंने छवि में स्थानीय ब्लॉक के [[मानक विचलन]] (विचरण), विषमता और कर्टोसिस की त्वरित और कुशलता से गणना करने के लिए दो, तीन, या चार अभिन्न छवियां प्रदान कीं। यह निम्नवत विस्तृत है:


किसी ब्लॉक के प्रसरण या मानक विचलन की गणना करने के लिए, हमें दो अभिन्न छवियों की आवश्यकता होती है:<math display="block"> I(x,y) = \sum_{\begin{smallmatrix} x' \le x \\ y' \le y\end{smallmatrix}} i(x',y')</math><math display="block"> I^2(x,y) = \sum_{\begin{smallmatrix} x' \le x \\ y' \le y\end{smallmatrix}} i^2(x',y')</math>भिन्नता इसके द्वारा दी गई है:<math display="block"> \operatorname{Var}(X) = \frac{1}{n} \sum_{i=1}^n (x_i - \mu)^2. </math>होने देना <math>S_1</math> और <math>S_2</math> ब्लॉक के योग को निरूपित करें <math>ABCD</math> का <math>I</math> और <math>I^2</math>, क्रमश। <math>S_1</math> और <math>S_2</math> अभिन्न छवि द्वारा जल्दी से गणना की जाती है। अब, हम विचरण समीकरण में हेरफेर करते हैं:<math display="block"> \begin{align}
किसी ब्लॉक के प्रसरण या मानक विचलन की गणना करने के लिए, हमें दो अभिन्न छवियों की आवश्यकता होती है:<math display="block"> I(x,y) = \sum_{\begin{smallmatrix} x' \le x \\ y' \le y\end{smallmatrix}} i(x',y')</math><math display="block"> I^2(x,y) = \sum_{\begin{smallmatrix} x' \le x \\ y' \le y\end{smallmatrix}} i^2(x',y')</math>भिन्नता इसके द्वारा दी गई है:<math display="block"> \operatorname{Var}(X) = \frac{1}{n} \sum_{i=1}^n (x_i - \mu)^2. </math>माना <math>S_1</math> और <math>S_2</math> ब्लॉक <math>ABCD</math> के क्रमश <math>I</math> और <math>I^2</math> के योग को निरूपित करते है। <math>S_1</math> और <math>S_2</math> अभिन्न छवि द्वारा जल्दी से गणना की जाती है। अब, हम विचरण समीकरण में परिवर्तन निम्न प्रकार से करते हैं:<math display="block"> \begin{align}
\operatorname{Var}(X)
\operatorname{Var}(X)
&= \frac{1}{n} \sum_{i=1}^n \left(x_i^2 - 2 \mu x_i + \mu^2\right) \\[1ex]
&= \frac{1}{n} \sum_{i=1}^n \left(x_i^2 - 2 \mu x_i + \mu^2\right) \\[1ex]
Line 47: Line 47:
&= \frac{1}{n} \left[S_2 - \frac{S_1^2}{n}\right]
&= \frac{1}{n} \left[S_2 - \frac{S_1^2}{n}\right]
\end{align}
\end{align}
</math>
</math>जहाँ <math>\mu=S_1/n</math> और <math display="inline">S_2 = \sum_{i=1}^n x_i^2</math> है।


 
माध्य (<math>\mu</math>) और विचरण (<math>\operatorname{Var}</math>) के अनुमान के समान , जिसके लिए क्रमशः छवि की पहली और दूसरी शक्ति की अभिन्न छवियों की आवश्यकता होती है (अर्थात <math>I, I^2</math>); विषमता और कर्टोसिस प्राप्त करने के लिए ऊपर उल्लिखित के समान परिवर्तन छवियों की तीसरी और चौथी शक्तियों (अर्थात ,<math>I^3(x,y), I^4(x,y)</math>) के लिए किया जा सकता है।<ref name="Phan-April2012" /> किन्तु एक महत्वपूर्ण कार्यान्वयन विवरण जिसे उपरोक्त विधियों के लिए ध्यान में रखा जाना चाहिए, जैसा कि एफ शाफेट एट अल द्वारा उल्लेख किया गया है।<ref>{{cite journal| last1=Shafait|first1=Faisal| last2=Keysers|first2=Daniel| last3=M. Breuel|first3=Thomas| title=अभिन्न छवियों का उपयोग करके स्थानीय अनुकूली थ्रेशोल्डिंग तकनीकों का कुशल कार्यान्वयन| journal=Electronic Imaging| volume=6815| pages=681510–681510–6| date=January 2008| doi=10.1117/12.767755| url=http://www.csse.uwa.edu.au/~shafait/papers/Shafait-efficient-binarization-SPIE08.pdf| series=Document Recognition and Retrieval XV | citeseerx=10.1.1.109.2748}}</ref> 32-बिट पूर्णांकों का उपयोग किए जाने की स्थिति में उच्च क्रम की अभिन्न छवियों के लिए पूर्णांक अतिप्रवाह होता है।
कहाँ <math>\mu=S_1/n</math> और <math display="inline">S_2 = \sum_{i=1}^n x_i^2</math>
 
माध्य के अनुमान के समान (<math>\mu</math>) और विचरण (<math>\operatorname{Var}</math>), जिसके लिए क्रमशः छवि की पहली और दूसरी शक्ति की अभिन्न छवियों की आवश्यकता होती है (अर्थात <math>I, I^2</math>); ऊपर उल्लिखित के समान हेरफेर छवियों की तीसरी और चौथी शक्तियों के लिए किया जा सकता है (अर्थात। <math>I^3(x,y), I^4(x,y)</math> तिरछापन और कर्टोसिस प्राप्त करने के लिए।<ref name="Phan-April2012" /> किन्तु एक महत्वपूर्ण कार्यान्वयन विवरण जिसे उपरोक्त विधियों के लिए ध्यान में रखा जाना चाहिए, जैसा कि एफ शाफेट एट अल द्वारा उल्लेख किया गया है।<ref>{{cite journal| last1=Shafait|first1=Faisal| last2=Keysers|first2=Daniel| last3=M. Breuel|first3=Thomas| title=अभिन्न छवियों का उपयोग करके स्थानीय अनुकूली थ्रेशोल्डिंग तकनीकों का कुशल कार्यान्वयन| journal=Electronic Imaging| volume=6815| pages=681510–681510–6| date=January 2008| doi=10.1117/12.767755| url=http://www.csse.uwa.edu.au/~shafait/papers/Shafait-efficient-binarization-SPIE08.pdf| series=Document Recognition and Retrieval XV | citeseerx=10.1.1.109.2748}}</ref> 32-बिट पूर्णांकों का उपयोग किए जाने की स्थिति में उच्च क्रम की अभिन्न छवियों के लिए पूर्णांक अतिप्रवाह होता है।


== यह भी देखें ==
== यह भी देखें ==
Line 62: Line 59:
* [http://www.codeproject.com/Articles/441226/Haar-feature-Object-Detection-in-Csharp Summed table implementation in object detection]
* [http://www.codeproject.com/Articles/441226/Haar-feature-Object-Detection-in-Csharp Summed table implementation in object detection]
=== व्याख्यान वीडियो ===
=== व्याख्यान वीडियो ===
* [https://www.youtube.com/watch?v=mM5JY-Q6hiM इंटीग्रल इमेज एल्गोरिदम के पीछे के सिद्धांत का परिचय]
* [https://www.youtube.com/watch?v=mM5JY-Q6hiM अभिन्न छवि एल्गोरिदम के पीछे के सिद्धांत का परिचय]
* [https://www.youtube.com/watch?v=-SI117NdjJ8 वोल्फ्राम डिमॉन्स्ट्रेशन प्रोजेक्ट से इंटीग्रल इमेज एल्गोरिद्म के निरंतर संस्करण का एक प्रदर्शन]
* [https://www.youtube.com/watch?v=-SI117NdjJ8 वोल्फ्राम डिमॉन्स्ट्रेशन प्रोजेक्ट से अभिन्न छवि एल्गोरिद्म के निरंतर संस्करण का एक प्रदर्शन]


श्रेणी:डिजिटल ज्यामिति
श्रेणी:डिजिटल ज्यामिति
Line 69: Line 66:
श्रेणी:कंप्यूटर ग्राफ़िक्स डेटा संरचनाएँ
श्रेणी:कंप्यूटर ग्राफ़िक्स डेटा संरचनाएँ


[[Category: Machine Translated Page]]
[[Category:Created On 28/02/2023]]
[[Category:Created On 28/02/2023]]
[[Category:Machine Translated Page]]
[[Category:Templates Vigyan Ready]]

Latest revision as of 10:32, 21 March 2023

ऑर्डर -6 जादू वर्ग (1.) के सारांशित क्षेत्र तालिका (2.) का उपयोग करके इसके मानों के एक उप-आयत का योग करना; प्रत्येक रंगीन स्थान उस रंग के आयत के अंदर योग को हाइलाइट करता है।

एक सारांशित क्षेत्र तालिका एक ग्रिड के एक आयताकार उपसमुच्चय में मूल्यों के योग को जल्दी और कुशलता से उत्पन्न करने के लिए एक डेटा संरचना और कलन विधि है। छवि प्रोद्योगिकी डोमेन में, इसे अभिन्न छवि के रूप में भी जाना जाता है। यह 1984 में फ्रैंकलिन सी. क्रो द्वारा मिपमैप्स के साथ उपयोग के लिए कंप्यूटर चित्रलेख के लिए प्रस्तुत किया गया था। कंप्यूटर विजन में इसे लुईस द्वारा लोकप्रिय बनाया गया था[1] और उसके बाद "अभिन्न छवि" नाम दिया गया और 2001 में वियोला-जोन्स वस्तु पहचान रूपरेखा के अंदर प्रमुखता से उपयोग किया गया। ऐतिहासिक रूप से, यह सिद्धांत बहु-आयामी संभाव्यता वितरण कार्यों के अध्ययन में बहुत अच्छी तरह से जाना जाता है, अर्थात् 2D (या ND) संभावनाओं की गणना में ( संभाव्यता वितरण के अनुसार क्षेत्र) संबंधित संचयी वितरण कार्यों से उपयोगी है ।[2]

एल्गोरिथम

जैसा कि नाम से पता चलता है, सारांशित क्षेत्र तालिका में किसी भी बिंदु (x, y) पर मान उपरोक्त सभी पिक्सेल का योग है और (x, y) के बाईं ओर है:[3][4]

जहाँ (x, y) पर पिक्सेल का मान है।

सारांशित क्षेत्र तालिका में मान (x, y) पर होने के कारण सारांशित क्षेत्र तालिका को छवि पर एकल पास में कुशलता से गणना की जा सकती है:[5]

(ध्यान दिया गया है कि सम्‍मिलित आव्युह की गणना ऊपरी बाएँ कोने से की जाती है)

सारांशित क्षेत्र तालिका डेटा संरचना/एल्गोरिदम में योग की गणना करने का विवरण

एक बार सारांशित क्षेत्र तालिका की गणना हो जाने के बाद, किसी भी आयताकार क्षेत्र पर तीव्रता के योग का मूल्यांकन करने के लिए क्षेत्र के आकार की सावधानी रखे बिना ठीक चार सरणी संदर्भों की आवश्यकता होती है। अर्थात, दाईं ओर की आकृति में अंकन, जिसमें A = (x0, y0), B = (x1, y0), C = (x0, y1) और D = (x1, y1) है, कुल मिलाकर A, B, C, और D द्वारा फैले आयत पर i(x,y) का योग है:

विस्तार

यह विधि स्वाभाविक रूप से निरंतर डोमेन तक विस्तारित है।[2]

विधि को उच्च-आयामी छवियों तक भी बढ़ाया जा सकता है।[6] यदि आयत के कोने हैं है और में है , तो आयत में निहित छवि मानों के योग की गणना सूत्र के साथ की जाती है:

जहाँ छवि आयाम और पर अभिन्न छवि है। अंकन के उदाहरण , , , और से मेल खाता है। न्यूरोइमेजिंग में, उदाहरण के लिए, टाइम-स्टैम्प के साथ वोक्सल्स या वोक्सल्स का उपयोग करते समय छवियों का आयाम या होता है।

फान एट अल के कार्य के रूप में इस पद्धति को उच्च-क्रम की अभिन्न छवि तक बढ़ा दिया गया है।[7] जिन्होंने छवि में स्थानीय ब्लॉक के मानक विचलन (विचरण), विषमता और कर्टोसिस की त्वरित और कुशलता से गणना करने के लिए दो, तीन, या चार अभिन्न छवियां प्रदान कीं। यह निम्नवत विस्तृत है:

किसी ब्लॉक के प्रसरण या मानक विचलन की गणना करने के लिए, हमें दो अभिन्न छवियों की आवश्यकता होती है:

भिन्नता इसके द्वारा दी गई है:
माना और ब्लॉक के क्रमश और के योग को निरूपित करते है। और अभिन्न छवि द्वारा जल्दी से गणना की जाती है। अब, हम विचरण समीकरण में परिवर्तन निम्न प्रकार से करते हैं:
जहाँ और है।

माध्य () और विचरण () के अनुमान के समान , जिसके लिए क्रमशः छवि की पहली और दूसरी शक्ति की अभिन्न छवियों की आवश्यकता होती है (अर्थात ); विषमता और कर्टोसिस प्राप्त करने के लिए ऊपर उल्लिखित के समान परिवर्तन छवियों की तीसरी और चौथी शक्तियों (अर्थात ,) के लिए किया जा सकता है।[7] किन्तु एक महत्वपूर्ण कार्यान्वयन विवरण जिसे उपरोक्त विधियों के लिए ध्यान में रखा जाना चाहिए, जैसा कि एफ शाफेट एट अल द्वारा उल्लेख किया गया है।[8] 32-बिट पूर्णांकों का उपयोग किए जाने की स्थिति में उच्च क्रम की अभिन्न छवियों के लिए पूर्णांक अतिप्रवाह होता है।

यह भी देखें

  • उपसर्ग राशि

संदर्भ

  1. Lewis, J.P. (1995). तेज़ टेम्पलेट मिलान. Proc. Vision Interface. pp. 120–123.
  2. 2.0 2.1 Finkelstein, Amir; neeratsharma (2010). "Double Integrals By Summing Values Of Cumulative Distribution Function". Wolfram Demonstration Project.
  3. Crow, Franklin (1984). "Summed-area tables for texture mapping". SIGGRAPH '84: Proceedings of the 11th annual conference on Computer graphics and interactive techniques. pp. 207–212.
  4. Viola, Paul; Jones, Michael (2002). "Robust Real-time Object Detection" (PDF). International Journal of Computer Vision.
  5. BADGERATI (2010-09-03). "Computer Vision – The Integral Image". computersciencesource.wordpress.com. Retrieved 2017-02-13.
  6. Tapia, Ernesto (January 2011). "उच्च-आयामी अभिन्न छवियों की गणना पर एक नोट". Pattern Recognition Letters. 32 (2): 197–201. doi:10.1016/j.patrec.2010.10.007.
  7. 7.0 7.1 Phan, Thien; Sohoni, Sohum; Larson, Eric C.; Chandler, Damon M. (22 April 2012). छवि गुणवत्ता मूल्यांकन का प्रदर्शन-विश्लेषण-आधारित त्वरण (PDF). pp. 81–84. CiteSeerX 10.1.1.666.4791. doi:10.1109/SSIAI.2012.6202458. ISBN 978-1-4673-1830-3. {{cite book}}: |journal= ignored (help)
  8. Shafait, Faisal; Keysers, Daniel; M. Breuel, Thomas (January 2008). "अभिन्न छवियों का उपयोग करके स्थानीय अनुकूली थ्रेशोल्डिंग तकनीकों का कुशल कार्यान्वयन" (PDF). Electronic Imaging. Document Recognition and Retrieval XV. 6815: 681510–681510–6. CiteSeerX 10.1.1.109.2748. doi:10.1117/12.767755.

बाहरी संबंध

व्याख्यान वीडियो

श्रेणी:डिजिटल ज्यामिति

श्रेणी:कंप्यूटर ग्राफ़िक्स डेटा संरचनाएँ