सारांशित क्षेत्र तालिका: Difference between revisions

Revision as of 08:08, 18 March 2023

ऑर्डर -6 जादू वर्ग (1.) के योग-क्षेत्र तालिका (2.) का उपयोग करके इसके मानों के एक उप-आयत का योग करना; प्रत्येक रंगीन स्थान उस रंग के आयत के अंदर योग को हाइलाइट करता है।

एक योग-क्षेत्र तालिका एक ग्रिड के एक आयताकार उपसमुच्चय में मूल्यों के योग को जल्दी और कुशलता से उत्पन्न करने के लिए एक डेटा संरचना और कलन विधि है। मूर्ति प्रोद्योगिकी डोमेन में, इसे इंटीग्रल इमेज के रूप में भी जाना जाता है। यह 1984 में फ्रैंकलिन सी. क्रो द्वारा मिपमैप्स्स के साथ उपयोग के लिए कंप्यूटर चित्रलेख के लिए प्रस्तुत किया गया था। कंप्यूटर दृष्टि में इसे लुईस द्वारा लोकप्रिय बनाया गया था^[1] और उसके बाद अभिन्न छवि नाम दिया गया और 2001 में वियोला-जोन्स ऑब्जेक्ट डिटेक्शन फ्रेमवर्क के अंदर प्रमुखता से उपयोग किया गया। ऐतिहासिक रूप से, यह सिद्धांत बहु-आयामी संभाव्यता वितरण कार्यों के अध्ययन में बहुत अच्छी तरह से जाना जाता है, अर्थात् 2D (या ND) संभावनाओं की गणना में ( संभाव्यता वितरण के अनुसार क्षेत्र) संबंधित संचयी वितरण कार्यों से।^[2]

एल्गोरिथम

जैसा कि नाम से पता चलता है, सारांशित क्षेत्र तालिका में किसी भी बिंदु (x, y) पर मान ऊपर और (x, y) के बाईं ओर के सभी पिक्सेल का योग होता है, जिसमें सम्मिलित हैं:^[3]^[4]

I(x,y)=\sum _{\begin{smallmatrix}x'\leq x\\y'\leq y\end{smallmatrix}}i(x',y')

कहाँ

i(x,y)

(x, y) पर पिक्सेल का मान है।

सारांशित क्षेत्र तालिका को छवि पर एकल पास में कुशलता से गणना की जा सकती है, क्योंकि सारांशित क्षेत्र तालिका में मान (x, y) बस है:^[5]

I(x,y)=i(x,y)+I(x,y-1)+I(x-1,y)-I(x-1,y-1)

(ध्यान दिया गया है कि सम्‍मिलित आव्युह की गणना ऊपरी बाएँ कोने से की जाती है)

सारांशित क्षेत्र तालिका डेटा संरचना/एल्गोरिदम में योग की गणना करने का विवरण

एक बार सारांशित क्षेत्र तालिका की गणना हो जाने के बाद, किसी भी आयताकार क्षेत्र पर तीव्रता के योग का मूल्यांकन करने के लिए क्षेत्र के आकार की परवाह किए बिना ठीक चार सरणी संदर्भों की आवश्यकता होती है। यही है, दाईं ओर की आकृति में अंकन, होना $A = (x 0, y 0)$ , $B = (x 1, y 0)$ , $C = (x 0, y 1)$ और $D = (x 1, y 1)$ , कुल मिलाकर $i (x, y)$ A, B, C, और D द्वारा फैलाए गए आयत के ऊपर है:

\sum _{\begin{smallmatrix}x_{0}<x\leq x_{1}\\y_{0}<y\leq y_{1}\end{smallmatrix}}i(x,y)=I(D)+I(A)-I(B)-I(C)

एक्सटेंशन

यह विधि स्वाभाविक रूप से निरंतर डोमेन तक विस्तारित है।^[2]

विधि को उच्च-आयामी छवियों तक भी बढ़ाया जा सकता है।^[6] यदि आयत के कोने हैं $x^{p}$ साथ $p$ में $\{0,1\}^{d}$ , फिर आयत में समाहित छवि मानों के योग की गणना सूत्र के साथ की जाती है

\sum _{p\in \{0,1\}^{d}}(-1)^{d-\|p\|_{1}}I(x^{p})

कहाँ

I(x)

पर अभिन्न छवि है

x

और

d

छवि आयाम। अंकन

x^{p}

के उदाहरण से मेल खाता है

d=2

,

A=x^{(0,0)}

,

B=x^{(1,0)}

,

C=x^{(1,1)}

और

D=x^{(0,1)}

. न्यूरोइमेजिंग में, उदाहरण के लिए, छवियों का आयाम होता है

d=3

या

d=4

, टाइम-स्टैम्प के साथ वॉक्सेल या वोक्सल्स का उपयोग करते समय।

फान एट अल के काम के रूप में इस पद्धति को उच्च-क्रम की अभिन्न छवि तक बढ़ा दिया गया है।^[7] जिन्होंने छवि में स्थानीय ब्लॉक के मानक विचलन (विचरण), तिरछापन और कर्टोसिस की त्वरित और कुशलता से गणना करने के लिए दो, तीन, या चार अभिन्न छवियां प्रदान कीं। यह नीचे विस्तृत है:

किसी ब्लॉक के प्रसरण या मानक विचलन की गणना करने के लिए, हमें दो अभिन्न छवियों की आवश्यकता होती है:

I(x,y)=\sum _{\begin{smallmatrix}x'\leq x\\y'\leq y\end{smallmatrix}}i(x',y')

I^{2}(x,y)=\sum _{\begin{smallmatrix}x'\leq x\\y'\leq y\end{smallmatrix}}i^{2}(x',y')

भिन्नता इसके द्वारा दी गई है:

\operatorname {Var} (X)={\frac {1}{n}}\sum _{i=1}^{n}(x_{i}-\mu )^{2}.

होने देना

S_{1}

और

S_{2}

ब्लॉक के योग को निरूपित करें

ABCD

का

I

और

I^{2}

, क्रमश।

S_{1}

और

S_{2}

अभिन्न छवि द्वारा जल्दी से गणना की जाती है। अब, हम विचरण समीकरण में हेरफेर करते हैं:

{\begin{aligned}\operatorname {Var} (X)&={\frac {1}{n}}\sum _{i=1}^{n}\left(x_{i}^{2}-2\mu x_{i}+\mu ^{2}\right)\\[1ex]&={\frac {1}{n}}\left[\sum _{i=1}^{n}x_{i}^{2}-2\sum _{i=1}^{n}\mu x_{i}+\sum _{i=1}^{n}\mu ^{2}\right]\\[1ex]&={\frac {1}{n}}\left[\sum _{i=1}^{n}x_{i}^{2}-2\sum _{i=1}^{n}\mu x_{i}+n\mu ^{2}\right]\\[1ex]&={\frac {1}{n}}\left[\sum _{i=1}^{n}x_{i}^{2}-2\mu \sum _{i=1}^{n}x_{i}+n\mu ^{2}\right]\\[1ex]&={\frac {1}{n}}\left[S_{2}-2{\frac {S_{1}}{n}}S_{1}+n\left({\frac {S_{1}}{n}}\right)^{2}\right]\\[1ex]&={\frac {1}{n}}\left[S_{2}-{\frac {S_{1}^{2}}{n}}\right]\end{aligned}}

कहाँ

\mu =S_{1}/n

और

{\textstyle S_{2}=\sum _{i=1}^{n}x_{i}^{2}}

.

माध्य के अनुमान के समान ( $\mu$ ) और विचरण ( $\operatorname {Var}$ ), जिसके लिए क्रमशः छवि की पहली और दूसरी शक्ति की अभिन्न छवियों की आवश्यकता होती है (अर्थात $I,I^{2}$ ); ऊपर उल्लिखित के समान हेरफेर छवियों की तीसरी और चौथी शक्तियों के लिए किया जा सकता है (अर्थात। $I^{3}(x,y),I^{4}(x,y)$ .) तिरछापन और कर्टोसिस प्राप्त करने के लिए।^[7] किन्तु एक महत्वपूर्ण कार्यान्वयन विवरण जिसे उपरोक्त विधियों के लिए ध्यान में रखा जाना चाहिए, जैसा कि एफ शाफेट एट अल द्वारा उल्लेख किया गया है।^[8] 32-बिट पूर्णांकों का उपयोग किए जाने की स्थिति में उच्च क्रम की अभिन्न छवियों के लिए पूर्णांक अतिप्रवाह होता है।

यह भी देखें

उपसर्ग राशि

संदर्भ

↑ Lewis, J.P. (1995). तेज़ टेम्पलेट मिलान. Proc. Vision Interface. pp. 120–123.
↑ ^2.0 ^2.1 Finkelstein, Amir; neeratsharma (2010). "Double Integrals By Summing Values Of Cumulative Distribution Function". Wolfram Demonstration Project.
↑ Crow, Franklin (1984). "Summed-area tables for texture mapping". SIGGRAPH '84: Proceedings of the 11th annual conference on Computer graphics and interactive techniques. pp. 207–212.
↑ Viola, Paul; Jones, Michael (2002). "Robust Real-time Object Detection" (PDF). International Journal of Computer Vision.
↑ BADGERATI (2010-09-03). "Computer Vision – The Integral Image". computersciencesource.wordpress.com. Retrieved 2017-02-13.
↑ Tapia, Ernesto (January 2011). "उच्च-आयामी अभिन्न छवियों की गणना पर एक नोट". Pattern Recognition Letters. 32 (2): 197–201. doi:10.1016/j.patrec.2010.10.007.
↑ ^7.0 ^7.1 Phan, Thien; Sohoni, Sohum; Larson, Eric C.; Chandler, Damon M. (22 April 2012). छवि गुणवत्ता मूल्यांकन का प्रदर्शन-विश्लेषण-आधारित त्वरण (PDF). pp. 81–84. CiteSeerX 10.1.1.666.4791. doi:10.1109/SSIAI.2012.6202458. ISBN 978-1-4673-1830-3. {{cite book}}: |journal= ignored (help)
↑ Shafait, Faisal; Keysers, Daniel; M. Breuel, Thomas (January 2008). "अभिन्न छवियों का उपयोग करके स्थानीय अनुकूली थ्रेशोल्डिंग तकनीकों का कुशल कार्यान्वयन" (PDF). Electronic Imaging. Document Recognition and Retrieval XV. 6815: 681510–681510–6. CiteSeerX 10.1.1.109.2748. doi:10.1117/12.767755.

बाहरी संबंध

Summed table implementation in object detection

व्याख्यान वीडियो

श्रेणी:डिजिटल ज्यामिति श्रेणी:कंप्यूटर ग्राफ़िक्स डेटा संरचनाएँ

[1] Lewis, J.P. (1995). तेज़ टेम्पलेट मिलान. Proc. Vision Interface. pp. 120–123.

[Finkelstein2010-2] 2.0 ^2.1 Finkelstein, Amir; neeratsharma (2010). "Double Integrals By Summing Values Of Cumulative Distribution Function". Wolfram Demonstration Project.

[3] Crow, Franklin (1984). "Summed-area tables for texture mapping". SIGGRAPH '84: Proceedings of the 11th annual conference on Computer graphics and interactive techniques. pp. 207–212.

[4] Viola, Paul; Jones, Michael (2002). "Robust Real-time Object Detection" (PDF). International Journal of Computer Vision.

[5] BADGERATI (2010-09-03). "Computer Vision – The Integral Image". computersciencesource.wordpress.com. Retrieved 2017-02-13.

[6] Tapia, Ernesto (January 2011). "उच्च-आयामी अभिन्न छवियों की गणना पर एक नोट". Pattern Recognition Letters. 32 (2): 197–201. doi:10.1016/j.patrec.2010.10.007.

[Phan-April2012-7] 7.0 ^7.1 Phan, Thien; Sohoni, Sohum; Larson, Eric C.; Chandler, Damon M. (22 April 2012). छवि गुणवत्ता मूल्यांकन का प्रदर्शन-विश्लेषण-आधारित त्वरण (PDF). pp. 81–84. CiteSeerX 10.1.1.666.4791. doi:10.1109/SSIAI.2012.6202458. ISBN 978-1-4673-1830-3. {{cite book}}: |journal= ignored (help)

[8] Shafait, Faisal; Keysers, Daniel; M. Breuel, Thomas (January 2008). "अभिन्न छवियों का उपयोग करके स्थानीय अनुकूली थ्रेशोल्डिंग तकनीकों का कुशल कार्यान्वयन" (PDF). Electronic Imaging. Document Recognition and Retrieval XV. 6815: 681510–681510–6. CiteSeerX 10.1.1.109.2748. doi:10.1117/12.767755.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

@@ Line 1: / Line 1: @@
-[[File:integral_image_application_example.svg|thumb|upright|ऑर्डर -6 [[जादू वर्ग]] (1.) के योग-क्षेत्र तालिका (2.) का उपयोग करके इसके मानों के एक उप-आयत का योग करना; प्रत्येक रंगीन स्थान उस रंग के आयत के भीतर योग को हाइलाइट करता है।]]एक योग-क्षेत्र तालिका एक ग्रिड के एक आयताकार उपसमुच्चय में मूल्यों के योग को जल्दी और कुशलता से उत्पन्न करने के लिए एक [[डेटा संरचना]] और [[कलन विधि]] है। [[ मूर्ति प्रोद्योगिकी ]] डोमेन में, इसे इंटीग्रल इमेज के रूप में भी जाना जाता है। यह 1984 में फ्रैंकलिन सी. क्रो द्वारा [[मिपमैप]]्स के साथ उपयोग के लिए [[ कंप्यूटर चित्रलेख ]] के लिए पेश किया गया था। [[कंप्यूटर दृष्टि]] में इसे लुईस द्वारा लोकप्रिय बनाया गया था<ref>{{cite conference|last1=Lewis|first1=J.P.|title=तेज़ टेम्पलेट मिलान| journal=Proc. Vision Interface|date=1995|pages=120–123}}</ref> और उसके बाद अभिन्न छवि नाम दिया गया और 2001 में वियोला-जोन्स ऑब्जेक्ट डिटेक्शन फ्रेमवर्क के भीतर प्रमुखता से उपयोग किया गया। ऐतिहासिक रूप से, यह सिद्धांत बहु-आयामी संभाव्यता वितरण कार्यों के अध्ययन में बहुत अच्छी तरह से जाना जाता है, अर्थात् 2D (या ND) संभावनाओं की गणना में ( संभाव्यता वितरण के तहत क्षेत्र) संबंधित [[संचयी वितरण कार्य]]ों से।<ref name="Finkelstein2010">{{cite conference
+[[File:integral_image_application_example.svg|thumb|upright|ऑर्डर -6 [[जादू वर्ग]] (1.) के योग-क्षेत्र तालिका (2.) का उपयोग करके इसके मानों के एक उप-आयत का योग करना; प्रत्येक रंगीन स्थान उस रंग के आयत के अंदर योग को हाइलाइट करता है।]]एक योग-क्षेत्र तालिका एक ग्रिड के एक आयताकार उपसमुच्चय में मूल्यों के योग को जल्दी और कुशलता से उत्पन्न करने के लिए एक [[डेटा संरचना]] और [[कलन विधि]] है। [[ मूर्ति प्रोद्योगिकी ]] डोमेन में, इसे इंटीग्रल इमेज के रूप में भी जाना जाता है। यह 1984 में फ्रैंकलिन सी. क्रो द्वारा [[मिपमैप|मिपमैप्स]]्स के साथ उपयोग के लिए [[ कंप्यूटर चित्रलेख ]] के लिए प्रस्तुत किया गया था। [[कंप्यूटर दृष्टि]] में इसे लुईस द्वारा लोकप्रिय बनाया गया था<ref>{{cite conference|last1=Lewis|first1=J.P.|title=तेज़ टेम्पलेट मिलान| journal=Proc. Vision Interface|date=1995|pages=120–123}}</ref> और उसके बाद अभिन्न छवि नाम दिया गया और 2001 में वियोला-जोन्स ऑब्जेक्ट डिटेक्शन फ्रेमवर्क के अंदर प्रमुखता से उपयोग किया गया। ऐतिहासिक रूप से, यह सिद्धांत बहु-आयामी संभाव्यता वितरण कार्यों के अध्ययन में बहुत अच्छी तरह से जाना जाता है, अर्थात् 2D (या ND) संभावनाओं की गणना में ( संभाव्यता वितरण के अनुसार  क्षेत्र) संबंधित [[संचयी वितरण कार्य]]ों से।<ref name="Finkelstein2010">{{cite conference
    | first = Amir
    | last = Finkelstein
@@ Line 12: / Line 12: @@
 == एल्गोरिथम ==
-जैसा कि नाम से पता चलता है, सारांशित क्षेत्र तालिका में किसी भी बिंदु (x, y) पर मान ऊपर और (x, y) के बाईं ओर के सभी पिक्सेल का योग होता है, जिसमें शामिल हैं:<ref>{{cite conference
+जैसा कि नाम से पता चलता है, सारांशित क्षेत्र तालिका में किसी भी बिंदु (x, y) पर मान ऊपर और (x, y) के बाईं ओर के सभी पिक्सेल का योग होता है, जिसमें सम्मिलित  हैं:<ref>{{cite conference
    | first = Franklin
    | last = Crow
@@ Line 33: / Line 33: @@
 सारांशित क्षेत्र तालिका को छवि पर एकल पास में कुशलता से गणना की जा सकती है, क्योंकि सारांशित क्षेत्र तालिका में मान (x, y) बस है:<ref>{{cite web | last1=BADGERATI | title=Computer Vision – The Integral Image | url=https://computersciencesource.wordpress.com/2010/09/03/computer-vision-the-integral-image/ | website=computersciencesource.wordpress.com | access-date=2017-02-13|date=2010-09-03}}</ref>
-<math display="block"> I(x,y) = i(x,y) + I(x,y-1) + I(x-1,y) - I(x-1,y-1)</math> (ध्यान दिया गया है कि सम्‍मिलित मैट्रिक्स की गणना ऊपरी बाएँ कोने से की जाती है)
+<math display="block"> I(x,y) = i(x,y) + I(x,y-1) + I(x-1,y) - I(x-1,y-1)</math> (ध्यान दिया गया है कि सम्‍मिलित आव्युह की गणना ऊपरी बाएँ कोने से की जाती है)
 [[File:Summed area table.png|thumb|सारांशित क्षेत्र तालिका डेटा संरचना/एल्गोरिदम में योग की गणना करने का विवरण]]एक बार सारांशित क्षेत्र तालिका की गणना हो जाने के बाद, किसी भी आयताकार क्षेत्र पर तीव्रता के योग का मूल्यांकन करने के लिए क्षेत्र के आकार की परवाह किए बिना ठीक चार सरणी संदर्भों की आवश्यकता होती है। यही है, दाईं ओर की आकृति में अंकन, होना {{math|1=''A'' = (''x''<sub>0</sub>, ''y''<sub>0</sub>)}}, {{math|1=''B'' = (''x''<sub>1</sub>, ''y''<sub>0</sub>)}}, {{math|1=''C'' = (''x''<sub>0</sub>, ''y''<sub>1</sub>)}} और {{math|1=''D'' = (''x''<sub>1</sub>, ''y''<sub>1</sub>)}}, कुल मिलाकर {{math|''i''(''x'',''y'')}} A, B, C, और D द्वारा फैलाए गए आयत के ऊपर है:
 <math display="block">\sum_{\begin{smallmatrix} x_0 < x \le x_1 \\ y_0 < y \le y_1 \end{smallmatrix}} i(x,y) = I(D) + I(A) - I(B) - I(C)</math>
@@ Line 65: / Line 65: @@
 कहाँ <math>\mu=S_1/n</math> और <math display="inline">S_2 = \sum_{i=1}^n x_i^2</math>.
-माध्य के अनुमान के समान (<math>\mu</math>) और विचरण (<math>\operatorname{Var}</math>), जिसके लिए क्रमशः छवि की पहली और दूसरी शक्ति की अभिन्न छवियों की आवश्यकता होती है (अर्थात <math>I, I^2</math>); ऊपर उल्लिखित के समान हेरफेर छवियों की तीसरी और चौथी शक्तियों के लिए किया जा सकता है (अर्थात। <math>I^3(x,y), I^4(x,y)</math>.) तिरछापन और कर्टोसिस प्राप्त करने के लिए।<ref name="Phan-April2012" />लेकिन एक महत्वपूर्ण कार्यान्वयन विवरण जिसे उपरोक्त विधियों के लिए ध्यान में रखा जाना चाहिए, जैसा कि एफ शाफेट एट अल द्वारा उल्लेख किया गया है।<ref>{{cite journal| last1=Shafait|first1=Faisal| last2=Keysers|first2=Daniel| last3=M. Breuel|first3=Thomas| title=अभिन्न छवियों का उपयोग करके स्थानीय अनुकूली थ्रेशोल्डिंग तकनीकों का कुशल कार्यान्वयन| journal=Electronic Imaging| volume=6815| pages=681510–681510–6| date=January 2008| doi=10.1117/12.767755| url=http://www.csse.uwa.edu.au/~shafait/papers/Shafait-efficient-binarization-SPIE08.pdf| series=Document Recognition and Retrieval XV | citeseerx=10.1.1.109.2748}}</ref> 32-बिट पूर्णांकों का उपयोग किए जाने की स्थिति में उच्च क्रम की अभिन्न छवियों के लिए पूर्णांक अतिप्रवाह होता है।
+माध्य के अनुमान के समान (<math>\mu</math>) और विचरण (<math>\operatorname{Var}</math>), जिसके लिए क्रमशः छवि की पहली और दूसरी शक्ति की अभिन्न छवियों की आवश्यकता होती है (अर्थात <math>I, I^2</math>); ऊपर उल्लिखित के समान हेरफेर छवियों की तीसरी और चौथी शक्तियों के लिए किया जा सकता है (अर्थात। <math>I^3(x,y), I^4(x,y)</math>.) तिरछापन और कर्टोसिस प्राप्त करने के लिए।<ref name="Phan-April2012" /> किन्तु एक महत्वपूर्ण कार्यान्वयन विवरण जिसे उपरोक्त विधियों के लिए ध्यान में रखा जाना चाहिए, जैसा कि एफ शाफेट एट अल द्वारा उल्लेख किया गया है।<ref>{{cite journal| last1=Shafait|first1=Faisal| last2=Keysers|first2=Daniel| last3=M. Breuel|first3=Thomas| title=अभिन्न छवियों का उपयोग करके स्थानीय अनुकूली थ्रेशोल्डिंग तकनीकों का कुशल कार्यान्वयन| journal=Electronic Imaging| volume=6815| pages=681510–681510–6| date=January 2008| doi=10.1117/12.767755| url=http://www.csse.uwa.edu.au/~shafait/papers/Shafait-efficient-binarization-SPIE08.pdf| series=Document Recognition and Retrieval XV | citeseerx=10.1.1.109.2748}}</ref> 32-बिट पूर्णांकों का उपयोग किए जाने की स्थिति में उच्च क्रम की अभिन्न छवियों के लिए पूर्णांक अतिप्रवाह होता है।
 == यह भी देखें ==

Anonymous

Search

सारांशित क्षेत्र तालिका: Difference between revisions

Namespaces

More

Page actions

Revision as of 08:08, 18 March 2023

Contents

एल्गोरिथम

एक्सटेंशन

यह भी देखें

संदर्भ

बाहरी संबंध

व्याख्यान वीडियो

Navigation

Navigation

Wiki tools

Wiki tools

Anonymous

Search

सारांशित क्षेत्र तालिका: Difference between revisions

Revision as of 08:08, 18 March 2023

एल्गोरिथम

एक्सटेंशन

यह भी देखें

संदर्भ

बाहरी संबंध

व्याख्यान वीडियो

Navigation

Wiki tools

Page tools

Other projects

Hidden categories