पिनहोल कैमरा मॉडल: Difference between revisions

From Vigyanwiki
(Created page with "{{broader|Epipolar geometry}} {{More footnotes|date=February 2008}} thumb|एक [[पिनहोल कैमरा का आरेख।]]प...")
 
No edit summary
 
(6 intermediate revisions by 3 users not shown)
Line 1: Line 1:
{{broader|Epipolar geometry}}
{{broader|एपिपोलर ज्यामिति}}
{{More footnotes|date=February 2008}}
[[Image:Pinhole-camera.svg|thumb|[[पिनहोल कैमरा]] का आरेख।]]पिनहोल कैमरा मॉडल त्रि-आयामी अंतरिक्ष में एक बिंदु के निर्देशांक और आदर्श पिनहोल कैमरा के छवि तल पर इसके [[3 डी प्रोजेक्शन]] के बीच गणितीय संबंध का वर्णन करता है, जहां कैमरा एपर्चर को बिंदु के रूप में वर्णित किया गया है और प्रकाश को फोकस करने के लिए किसी लेंस का उपयोग नहीं किया जाता है। मॉडल में सम्मिलित नहीं है, उदाहरण के लिए, विरूपण (ऑप्टिक्स) या लेंस और परिमित आकार के एपर्चर के कारण अनफोकस्ड ऑब्जेक्ट्स का धुंधलापन। यह इस बात पर भी ध्यान नहीं देता है कि अधिकांश व्यावहारिक कैमरों में केवल असतत [[छवि]] निर्देशांक होते हैं। इसका अर्थ यह है कि पिनहोल कैमरा मॉडल का उपयोग केवल [[3डी दृश्य]] से 2डी अंतरिक्ष छवि तक मैपिंग के प्रथम क्रम सन्निकटन के रूप में किया जा सकता है। इसकी वैधता कैमरे की गुणवत्ता पर निर्भर करती है और सामान्य तौर पर, लेंस विरूपण प्रभाव बढ़ने पर छवि के केंद्र से किनारों तक घट जाती है।
[[Image:Pinhole-camera.svg|thumb|एक [[पिनहोल कैमरा]] का आरेख।]]पिनहोल कैमरा मॉडल त्रि-आयामी अंतरिक्ष में एक बिंदु के निर्देशांक और एक ''आदर्श'' पिनहोल कैमरा के इमेज प्लेन पर इसके [[3 डी प्रोजेक्शन]] के बीच गणितीय संबंध का वर्णन करता है, जहां कैमरा एपर्चर को एक बिंदु के रूप में वर्णित किया गया है और कोई लेंस नहीं है। प्रकाश को केंद्रित करने के लिए उपयोग किया जाता है। मॉडल में शामिल नहीं है, उदाहरण के लिए, विरूपण (ऑप्टिक्स) या लेंस और परिमित आकार के एपर्चर के कारण अनफोकस्ड ऑब्जेक्ट्स का धुंधलापन। यह इस बात पर भी ध्यान नहीं देता है कि अधिकांश व्यावहारिक कैमरों में केवल असतत [[छवि]] निर्देशांक होते हैं। इसका मतलब यह है कि पिनहोल कैमरा मॉडल का उपयोग केवल [[3डी दृश्य]] से द्वि-आयामी_अंतरिक्ष छवि के मानचित्रण के पहले क्रम सन्निकटन के रूप में किया जा सकता है। इसकी वैधता कैमरे की गुणवत्ता पर निर्भर करती है और सामान्य तौर पर, लेंस विरूपण प्रभाव बढ़ने पर छवि के केंद्र से किनारों तक घट जाती है।


पिनहोल कैमरा मॉडल जिन प्रभावों को ध्यान में नहीं रखता है उनमें से कुछ प्रभावों की भरपाई की जा सकती है, उदाहरण के लिए छवि निर्देशांक पर उपयुक्त समन्वय परिवर्तन लागू करके; यदि उच्च गुणवत्ता वाले कैमरे का उपयोग किया जाता है तो अन्य प्रभावों की उपेक्षा की जा सकती है। इसका मतलब यह है कि पिनहोल कैमरा मॉडल को अक्सर एक उचित विवरण के रूप में इस्तेमाल किया जा सकता है कि कैसे एक कैमरा एक 3डी दृश्य को दर्शाता है, उदाहरण के लिए [[कंप्यूटर दृष्टि]] और [[ कंप्यूटर चित्रलेख ]] में।
पिनहोल कैमरा मॉडल जिन प्रभावों को ध्यान में नहीं रखता है, उनमें से कुछ प्रभावों की भरपाई की जा सकती है, उदाहरण के लिए छवि निर्देशांक पर उपयुक्त समन्वय परिवर्तन प्रयुक्त करके; यदि उच्च गुणवत्ता वाले कैमरे का उपयोग किया जाता है, तो अन्य प्रभावों की उपेक्षा की जा सकती है। इसका अर्थ यह है कि पिनहोल कैमरा मॉडल को अधिकांशतः उचित विवरण के रूप में उपयोग किया जा सकता है कि कैसे कैमरा 3डी दृश्य को दर्शाता है, उदाहरण के लिए [[कंप्यूटर दृष्टि]] और [[ कंप्यूटर चित्रलेख |कंप्यूटर ग्राफिक्स]] में।


== ज्यामिति ==
== ज्यामिति ==
[[Image:Pinhole.svg|thumb|400px|right|एक पिनहोल कैमरे की ज्यामिति। नोट: एक्स<sub>1</sub>x<sub>2</sub>x<sub>3</sub> आकृति में समन्वय प्रणाली बाएं हाथ की है, यानी OZ अक्ष की दिशा उस प्रणाली के विपरीत है जिसका पाठक उपयोग कर सकता है।]]एक पिनहोल कैमरे की मैपिंग से संबंधित [[ज्यामिति]] को चित्र में दिखाया गया है। आकृति में निम्नलिखित मूल वस्तुएँ हैं:
[[Image:Pinhole.svg|thumb|400px|right|पिनहोल कैमरे की ज्यामिति। नोट: x<sub>1</sub>x<sub>2</sub>x<sub>3</sub> आकृति में समन्वय प्रणाली बाएं हाथ की है, अर्थात् OZ अक्ष की दिशा उस प्रणाली के विपरीत है, जिसका पाठक उपयोग कर सकता है।]]पिनहोल कैमरे की मैपिंग से संबंधित [[ज्यामिति]] को चित्र में दिखाया गया है। आकृति में निम्नलिखित मूल वस्तुएँ हैं:


* एक 3डी ऑर्थोगोनल कोऑर्डिनेट सिस्टम जिसका मूल O पर है। यहीं पर अपर्चर|''कैमरा अपर्चर'' स्थित है। समन्वय प्रणाली के तीन अक्षों को X1, X2, X3 कहा जाता है। एक्सिस एक्स3 कैमरे की देखने की दिशा में इशारा कर रहा है और इसे ''[[ ऑप्टिकल अक्ष ]]'', ''प्रिंसिपल एक्सिस'', या ''प्रिंसिपल रे'' कहा जाता है। अक्ष X1 और X2 द्वारा फैला हुआ विमान कैमरे के सामने की ओर है, या 'प्रिंसिपल प्लेन' है।
* 3डी ऑर्थोगोनल कोऑर्डिनेट प्रणाली जिसका मूल O पर है। यह वह जगह भी है जहाँ कैमरा एपर्चर स्थित है। समन्वय प्रणाली के तीन अक्षों को X1, X2, X3 कहा जाता है। अक्ष X3 कैमरे की देखने की दिशा में संकेत कर रहा है और इसे [[ ऑप्टिकल अक्ष |ऑप्टिकल अक्ष]], प्रिंसिपल अक्ष, या प्रिंसिपल रे कहा जाता है। अक्ष X1 और X2 द्वारा फैला हुआ तल कैमरे के सामने की ओर है, या 'प्रिंसिपल तल' है।
* एक इमेज प्लेन, जहां कैमरे के एपर्चर के माध्यम से 3डी दुनिया को प्रक्षेपित किया जाता है। छवि तल X1 और X2 अक्षों के समानांतर है और दूरी पर स्थित है <math>f</math> मूल O से X3 अक्ष की ऋणात्मक दिशा में, जहाँ ''f'' पिनहोल कैमरा की फ़ोकल लंबाई है। एक पिनहोल कैमरे के व्यावहारिक कार्यान्वयन का तात्पर्य है कि छवि तल इस तरह स्थित है कि यह X3 अक्ष को निर्देशांक ''-f'' जहां ''f > 0'' पर काटता है।
* छवि तल, जहां कैमरे के एपर्चर के माध्यम से 3डी विश्व को प्रक्षेपित किया जाता है। छवि तल X1 और X2 अक्षों के समानांतर है और X3 अक्ष की नकारात्मक दिशा में उत्पत्ति O से दूरी <math>f</math> पर स्थित है, जहां ''f'' पिनहोल कैमरे की फोकल लंबाई है। पिनहोल कैमरे के व्यावहारिक कार्यान्वयन का अर्थ है कि छवि तल इस तरह स्थित है कि यह X3 अक्ष को निर्देशांक -f पर प्रतिच्छेद करता है, जहां f> 0 है।
* ऑप्टिकल अक्ष और छवि तल के चौराहे पर एक बिंदु R। इस बिंदु को 'प्रमुख बिंदु' कहा जाता है <ref>{{cite web|author=Carlo Tomasi |url=https://www2.cs.duke.edu/courses/fall16/compsci527/notes/camera-model.pdf |title=एक साधारण कैमरा मॉडल|publisher=cs.duke.edu |date=2016-08-09 |accessdate=2021-02-18}}</ref> या छवि केंद्र।
* ऑप्टिकल अक्ष और छवि तल के प्रतिच्छेदन पर एक बिंदु R है। इस बिंदु को 'प्रमुख बिंदु' कहा जाता है<ref>{{cite web|author=Carlo Tomasi |url=https://www2.cs.duke.edu/courses/fall16/compsci527/notes/camera-model.pdf |title=एक साधारण कैमरा मॉडल|publisher=cs.duke.edu |date=2016-08-09 |accessdate=2021-02-18}}</ref> या छवि केंद्र कहा जाता है।
* विश्व में कहीं एक बिंदु 'P' निर्देशांक पर है <math> (x_1, x_2, x_3) </math> अक्ष X1, X2 और X3 के सापेक्ष।
* अक्ष X1, X2 और X3 के सापेक्ष समन्वय <math> (x_1, x_2, x_3) </math> पर विश्व में कहीं बिंदु 'P' है।
* कैमरे में बिंदु 'P' की प्रोजेक्शन लाइन। यह हरी रेखा है जो बिंदु 'P' और बिंदु 'O' से होकर गुजरती है।
* कैमरे में बिंदु 'P' की प्रोजेक्शन लाइन। यह हरी रेखा है, जो बिंदु 'P' और बिंदु 'O' से होकर निकलती है।
* छवि तल पर बिंदु 'P' का प्रक्षेपण, 'Q' को निरूपित करता है। यह बिंदु प्रक्षेपण रेखा (हरा) और छवि तल के प्रतिच्छेदन द्वारा दिया गया है। किसी भी व्यावहारिक स्थिति में हम यह मान सकते हैं <math>x_3</math> > 0 जिसका अर्थ है कि प्रतिच्छेदन बिंदु अच्छी तरह से परिभाषित है।
* छवि तल पर बिंदु 'P' का प्रक्षेपण, 'Q' को निरूपित करता है। यह बिंदु प्रक्षेपण रेखा (हरा) और छवि तल के प्रतिच्छेदन द्वारा दिया गया है। किसी भी व्यावहारिक स्थिति में हम यह मान सकते हैं कि <math>x_3</math> > 0 जिसका अर्थ है कि प्रतिच्छेदन बिंदु अच्छी तरह से परिभाषित है।
* इमेज प्लेन में एक 2D कोऑर्डिनेट सिस्टम भी है, जिसका मूल R पर है और एक्सिस Y1 और Y2 के साथ जो क्रमशः X1 और X2 के समानांतर हैं। इस निर्देशांक प्रणाली के सापेक्ष बिंदु Q का निर्देशांक है <math> (y_1, y_2) </math>.
* छवि तल में 2डी कोऑर्डिनेट प्रणाली भी है, जिसका मूल R पर है और अक्ष Y1 और Y2 के साथ जो क्रमशः X1 और X2 के समानांतर हैं। इस निर्देशांक प्रणाली के सापेक्ष बिंदु Q के निर्देशांक <math> (y_1, y_2) </math> हैं।


कैमरे का पिनहोल एपर्चर, जिसके माध्यम से सभी प्रोजेक्शन लाइनों को गुजरना चाहिए, को असीम रूप से छोटा, एक बिंदु माना जाता है। साहित्य में 3डी अंतरिक्ष में इस बिंदु को ऑप्टिकल (या लेंस या कैमरा) केंद्र के रूप में जाना जाता है।<ref>{{cite web|author=Andrea Fusiello |url=http://homepages.inf.ed.ac.uk/rbf/CVonline/LOCAL_COPIES/FUSIELLO4/tutorial.html#x1-30003 |title=ज्यामितीय कंप्यूटर विजन के तत्व|publisher=Homepages.inf.ed.ac.uk |date=2005-12-27 |accessdate=2013-12-18}}</ref>
कैमरे का पिनहोल एपर्चर, जिसके माध्यम से सभी प्रोजेक्शन लाइनों को निकलना चाहिए, उनको मूल रूप से छोटा, बिंदु माना जाता है। साहित्य में 3डी अंतरिक्ष में इस बिंदु को ऑप्टिकल (या लेंस या कैमरा) केंद्र के रूप में जाना जाता है।<ref>{{cite web|author=Andrea Fusiello |url=http://homepages.inf.ed.ac.uk/rbf/CVonline/LOCAL_COPIES/FUSIELLO4/tutorial.html#x1-30003 |title=ज्यामितीय कंप्यूटर विजन के तत्व|publisher=Homepages.inf.ed.ac.uk |date=2005-12-27 |accessdate=2013-12-18}}</ref>




== सूत्रीकरण ==
== सूत्रीकरण ==


आगे हम यह समझना चाहते हैं कि निर्देशांक कैसे होते हैं <math> (y_1, y_2) </math> बिंदु Q निर्देशांक पर निर्भर करता है <math> (x_1, x_2, x_3) </math> यह निम्न चित्र की सहायता से किया जा सकता है जो पिछली आकृति के समान दृश्य दिखाता है लेकिन अब ऊपर से, X2 अक्ष की नकारात्मक दिशा में नीचे देख रहा है।
इसके बाद हम यह समझना चाहते हैं कि बिंदु Q के निर्देशांक <math> (y_1, y_2) </math> बिंदु P के निर्देशांक <math> (x_1, x_2, x_3) </math> पर कैसे निर्भर करते हैं। यह निम्नलिखित चित्र की सहायता से किया जा सकता है, जो पिछले दृश्य के समान ही दिखाता है आंकड़ा लेकिन अब ऊपर से, X2 अक्ष की नकारात्मक दिशा में नीचे देख रहे हैं।


[[Image:Pinhole2.svg|thumb|400px|right|X2 अक्ष से देखे गए पिनहोल कैमरे की ज्यामिति]]इस चित्र में हम दो समान त्रिभुज देखते हैं, दोनों में उनके [[कर्ण]] के रूप में प्रक्षेपण रेखा (हरा) के हिस्से हैं। बाएं त्रिकोण के [[कैथेटस]] हैं <math> -y_1 </math> और f और समकोण त्रिभुज के कैथेटी हैं <math> x_1 </math> और <math> x_3 </math>. चूंकि दो त्रिकोण समान हैं, इसलिए यह इस प्रकार है
[[Image:Pinhole2.svg|thumb|400px|right|X2 अक्ष से देखे गए पिनहोल कैमरे की ज्यामिति]]इस चित्र में हम दो समान त्रिभुज देखते हैं, दोनों में उनके [[कर्ण]] के रूप में प्रक्षेपण रेखा (हरा) के हिस्से हैं। बाएं त्रिकोण के [[कैथेटस|कैथेटी]] <math> -y_1 </math> और f हैं और समकोण दाएं त्रिकोण के कैथेटी <math> x_1 </math> और <math> x_3 </math> हैं। चूंकि दो त्रिकोण समान हैं, इसलिए यह इस प्रकार है:


: <math> \frac{-y_1}{f} = \frac{x_1}{x_3} </math> या <math> y_1 = -\frac{f \, x_1}{x_3} </math>
: <math> \frac{-y_1}{f} = \frac{x_1}{x_3} </math> या <math> y_1 = -\frac{f \, x_1}{x_3} </math>
एक समान जाँच, X1 अक्ष की ऋणात्मक दिशा में देखने से मिलती है
एक समान जाँच, X1 अक्ष की ऋणात्मक दिशा में देखने से मिलती है:


: <math> \frac{-y_2}{f} = \frac{x_2}{x_3} </math> या <math> y_2 = -\frac{f \, x_2}{x_3} </math>
: <math> \frac{-y_2}{f} = \frac{x_2}{x_3} </math> या <math> y_2 = -\frac{f \, x_2}{x_3} </math>
इसे इस रूप में संक्षेपित किया जा सकता है
इसे इस रूप में संक्षेपित किया जा सकता है:


: <math> \begin{pmatrix} y_1 \\ y_2 \end{pmatrix} = -\frac{f}{x_3} \begin{pmatrix} x_1 \\ x_2 \end{pmatrix} </math>
: <math> \begin{pmatrix} y_1 \\ y_2 \end{pmatrix} = -\frac{f}{x_3} \begin{pmatrix} x_1 \\ x_2 \end{pmatrix} </math>
जो एक व्यंजक है जो 3D निर्देशांकों के बीच संबंध का वर्णन करता है <math> (x_1,x_2,x_3) </math> बिंदु P और इसकी छवि निर्देशांक <math> (y_1,y_2) </math> छवि तल में बिंदु Q द्वारा दिया गया।
जो व्यंजक है, जो 3डी निर्देशांकों <math> (x_1,x_2,x_3) </math> के बीच संबंध का वर्णन करता है, बिंदु P और इसकी छवि निर्देशांक <math> (y_1,y_2) </math> छवि तल में बिंदु Q द्वारा दिया गया।


=== घुमाई गई छवि और आभासी छवि का तल ===
=== घुमाई गई छवि और आभासी छवि का तल ===


एक पिनहोल कैमरा द्वारा वर्णित 3डी से 2डी निर्देशांकों की मैपिंग एक [[परिप्रेक्ष्य प्रक्षेपण]] है जिसके बाद इमेज प्लेन में 180° घुमाव होता है। यह इस बात से मेल खाता है कि एक वास्तविक पिनहोल कैमरा कैसे काम करता है; परिणामी छवि को 180° घुमाया जाता है और प्रक्षेपित वस्तुओं का सापेक्ष आकार फोकल बिंदु से उनकी दूरी पर निर्भर करता है और छवि का समग्र आकार छवि तल और फोकल बिंदु के बीच की दूरी f पर निर्भर करता है। एक बिना घुमाई गई छवि बनाने के लिए, जिसकी हम कैमरे से अपेक्षा करते हैं, दो संभावनाएँ हैं:
पिनहोल कैमरा द्वारा वर्णित 3डी से 2डी निर्देशांकों की मैपिंग [[परिप्रेक्ष्य प्रक्षेपण]] है, जिसके बाद छवि तल में 180° घुमाव होता है। यह इस बात से मेल खाता है, कि वास्तविक पिनहोल कैमरा कैसे काम करता है; परिणामी छवि को 180° घुमाया जाता है और प्रक्षेपित वस्तुओं का सापेक्ष आकार फोकल बिंदु से उनकी दूरी पर निर्भर करता है और छवि का समग्र आकार छवि तल और फोकल बिंदु के बीच की दूरी f पर निर्भर करता है। बिना घुमाई गई छवि बनाने के लिए, जिसकी हम कैमरे से अपेक्षा करते हैं, उसकी दो संभावनाएँ हैं:


* छवि तल में समन्वय प्रणाली को 180° (किसी भी दिशा में) घुमाएँ। इस तरह एक पिनहोल कैमरे के किसी भी व्यावहारिक कार्यान्वयन से समस्या का समाधान हो जाएगा; एक फोटोग्राफिक कैमरे के लिए हम छवि को देखने से पहले घुमाते हैं, और एक डिजिटल कैमरे के लिए हम पिक्सल को इस क्रम में पढ़ते हैं कि यह घूमता है।
* छवि तल में समन्वय प्रणाली को 180° (किसी भी दिशा में) घुमाएँ। इस तरह पिनहोल कैमरे के किसी भी व्यावहारिक कार्यान्वयन से समस्या का समाधान हो जाएगा; फोटोग्राफिक कैमरे के लिए हम छवि को देखने से पहले घुमाते हैं, और डिजिटल कैमरे के लिए हम पिक्सल को इस क्रम में पढ़ते हैं कि यह घूमता है।
* छवि तल को रखें ताकि यह -f के बजाय X3 अक्ष को f पर प्रतिच्छेद करे और पिछली गणनाओं को फिर से करें। यह एक आभासी (या सामने) छवि विमान उत्पन्न करेगा जिसे व्यवहार में लागू नहीं किया जा सकता है, लेकिन एक सैद्धांतिक कैमरा प्रदान करता है जो वास्तविक की तुलना में विश्लेषण करना आसान हो सकता है।
* छवि तल को रखें जिससे यह -f के अतिरिक्त X3 अक्ष को f पर प्रतिच्छेद करे और पिछली गणनाओं को पुनः करें। यह आभासी (या सामने) छवि विमान उत्पन्न करेगा, जिसे व्यवहार में प्रयुक्त नहीं किया जा सकता है, लेकिन सैद्धांतिक कैमरा प्रदान करता है ,जो वास्तविक की तुलना में विश्लेषण करना सरल हो सकता है।


दोनों ही मामलों में, 3D निर्देशांक से 2D छवि निर्देशांक तक परिणामी मानचित्रण उपरोक्त अभिव्यक्ति द्वारा दिया गया है, लेकिन बिना निषेध के, इस प्रकार
दोनों ही स्थितियों में, 3डी निर्देशांक से 2डी छवि निर्देशांक तक परिणामी मानचित्रण उपरोक्त अभिव्यक्ति द्वारा दिया गया है, लेकिन बिना निषेध के, इस प्रकार


: <math> \begin{pmatrix} y_1 \\ y_2 \end{pmatrix} = \frac{f}{x_3} \begin{pmatrix} x_1 \\ x_2 \end{pmatrix} </math>
: <math> \begin{pmatrix} y_1 \\ y_2 \end{pmatrix} = \frac{f}{x_3} \begin{pmatrix} x_1 \\ x_2 \end{pmatrix} </math>
Line 48: Line 47:
== सजातीय निर्देशांक में ==
== सजातीय निर्देशांक में ==


{{main|Camera matrix}}
{{main|कैमरा आव्यूह}}


अंतरिक्ष में बिंदुओं के 3डी निर्देशांक से लेकर 2डी छवि निर्देशांक तक की मैपिंग को [[सजातीय निर्देशांक]] में भी प्रदर्शित किया जा सकता है। होने देना <math> \mathbf{x} </math> सजातीय निर्देशांक (एक 4-आयामी वेक्टर) में एक 3डी बिंदु का प्रतिनिधित्व हो, और चलो <math> \mathbf{y} </math> पिनहोल कैमरा (एक 3-आयामी वेक्टर) में इस बिंदु की छवि का प्रतिनिधित्व करें। तब निम्नलिखित संबंध धारण करता है
अंतरिक्ष में बिंदुओं के 3डी निर्देशांक से लेकर 2डी छवि निर्देशांक तक की मैपिंग को [[सजातीय निर्देशांक]] में भी प्रदर्शित किया जा सकता है। माना <math> \mathbf{x} </math> सजातीय निर्देशांक (4-आयामी सदिश) में 3डी बिंदु का प्रतिनिधित्व है, और <math> \mathbf{y} </math> को पिनहोल कैमरा (3-आयामी सदिश) में इस बिंदु की छवि का प्रतिनिधित्व करते हैं। तब निम्नलिखित संबंध धारण करता है;


: <math> \mathbf{y} \sim \mathbf{C} \, \mathbf{x} </math>
: <math> \mathbf{y} \sim \mathbf{C} \, \mathbf{x} </math>
कहाँ <math> \mathbf{C} </math> है <math> 3 \times 4 </math> [[कैमरा मैट्रिक्स]] और <math>\, \sim </math> प्रक्षेप्य रिक्त स्थान के तत्वों के बीच समानता का मतलब है। इसका तात्पर्य यह है कि बाएँ और दाएँ हाथ की भुजाएँ एक गैर-शून्य अदिश गुणन के बराबर हैं। इस संबंध का एक परिणाम यह भी है <math> \mathbf{C} </math> प्रोजेक्टिव स्पेस के तत्व के रूप में देखा जा सकता है; दो कैमरा मैट्रिसेस समतुल्य हैं यदि वे एक स्केलर गुणन के बराबर हैं। एक रेखीय परिवर्तन के रूप में, पिनहोल कैमरा मैपिंग का यह विवरण <math> \mathbf{C} </math> दो रैखिक व्यंजकों के अंश के बजाय, 3D और 2D निर्देशांकों के बीच संबंधों की कई व्युत्पत्तियों को सरल बनाना संभव बनाता है।{{Citation needed|date=September 2007}}
जहाँ <math> \mathbf{C} </math>, <math> 3 \times 4 </math> [[कैमरा मैट्रिक्स|कैमरा आव्यूह]] है और <math>\, \sim </math> प्रक्षेप्य रिक्त स्थान के तत्वों के बीच समानता का अर्थ है। इसका तात्पर्य यह है कि बाएँ और दाएँ हाथ की भुजाएँ गैर-शून्य अदिश गुणन के बराबर हैं। इस संबंध का परिणाम यह भी है कि <math> \mathbf{C} </math> को प्रोजेक्टिव स्पेस के तत्व के रूप में भी देखा जा सकता है; दो कैमरा आव्यूह समतुल्य हैं, यदि वे स्केलर गुणन के बराबर हैं। पिनहोल कैमरा मैपिंग का यह विवरण, दो रैखिक अभिव्यक्तियों के अंश के अतिरिक्त रैखिक परिवर्तन <math> \mathbf{C} </math> के रूप में, 3डी और 2डी निर्देशांकों के बीच संबंधों के कई व्युत्पत्तियों को सरल बनाना संभव बनाता है।


== यह भी देखें ==
== यह भी देखें ==
* [[कैमरा शोधन]]
* [[कैमरा शोधन]]
* [[संपार्श्विक समीकरण]]
* [[संपार्श्विक समीकरण]]
* प्रवेश पुतली, एक वास्तविक कैमरे में वस्तु स्थान के संबंध में पिनहोल का समतुल्य स्थान।
* प्रवेश पुतली, वास्तविक कैमरे में वस्तु स्थान के संबंध में पिनहोल का समतुल्य स्थान।
* [[छात्र बाहर निकलें]], वास्तविक कैमरे में इमेज प्लेन के संबंध में पिनहोल का समतुल्य स्थान।
* [[छात्र बाहर निकलें|पुतली से बाहर निकलें,]] वास्तविक कैमरे में छवि तल के संबंध में पिनहोल का समतुल्य स्थान।
* [[इब्न अल-हेथम]]
* [[इब्न अल-हेथम]]
* पिनहोल कैमरा, इस आलेख में वर्णित गणितीय मॉडल का व्यावहारिक कार्यान्वयन।
* पिनहोल कैमरा, इस आलेख में वर्णित गणितीय मॉडल का व्यावहारिक कार्यान्वयन।
Line 65: Line 64:


== संदर्भ ==
== संदर्भ ==
{{Refimprove|date=January 2008}}
{{reflist}}
{{reflist}}


Line 75: Line 73:
*{{cite book| author=[[Linda Shapiro|Linda G. Shapiro]] and George C. Stockman| title=Computer Vision| publisher=Prentice Hall| year=2001| isbn=0-13-030796-3}}
*{{cite book| author=[[Linda Shapiro|Linda G. Shapiro]] and George C. Stockman| title=Computer Vision| publisher=Prentice Hall| year=2001| isbn=0-13-030796-3}}
*{{cite book| author=Gang Xu and Zhengyou Zhang| title=Epipolar geometry in Stereo, Motion and Object Recognition| publisher=Kluwer Academic Publishers| year=1996| isbn=0-7923-4199-6| url = https://books.google.com/books?id=DnFaUidM-B0C&pg=PA7&dq=pinhole+intitle:%22Epipolar+geometry%22}}
*{{cite book| author=Gang Xu and Zhengyou Zhang| title=Epipolar geometry in Stereo, Motion and Object Recognition| publisher=Kluwer Academic Publishers| year=1996| isbn=0-7923-4199-6| url = https://books.google.com/books?id=DnFaUidM-B0C&pg=PA7&dq=pinhole+intitle:%22Epipolar+geometry%22}}
[[Category: कंप्यूटर दृष्टि में ज्यामिति]] [[Category: कैमरा]]


 
[[Category:Articles with hatnote templates targeting a nonexistent page]]
 
[[Category: Machine Translated Page]]
[[Category:Created On 08/06/2023]]
[[Category:Created On 08/06/2023]]
[[Category:Machine Translated Page]]
[[Category:Pages with script errors]]
[[Category:Templates Vigyan Ready]]
[[Category:कंप्यूटर दृष्टि में ज्यामिति]]
[[Category:कैमरा]]

Latest revision as of 09:54, 21 June 2023

पिनहोल कैमरा का आरेख।

पिनहोल कैमरा मॉडल त्रि-आयामी अंतरिक्ष में एक बिंदु के निर्देशांक और आदर्श पिनहोल कैमरा के छवि तल पर इसके 3 डी प्रोजेक्शन के बीच गणितीय संबंध का वर्णन करता है, जहां कैमरा एपर्चर को बिंदु के रूप में वर्णित किया गया है और प्रकाश को फोकस करने के लिए किसी लेंस का उपयोग नहीं किया जाता है। मॉडल में सम्मिलित नहीं है, उदाहरण के लिए, विरूपण (ऑप्टिक्स) या लेंस और परिमित आकार के एपर्चर के कारण अनफोकस्ड ऑब्जेक्ट्स का धुंधलापन। यह इस बात पर भी ध्यान नहीं देता है कि अधिकांश व्यावहारिक कैमरों में केवल असतत छवि निर्देशांक होते हैं। इसका अर्थ यह है कि पिनहोल कैमरा मॉडल का उपयोग केवल 3डी दृश्य से 2डी अंतरिक्ष छवि तक मैपिंग के प्रथम क्रम सन्निकटन के रूप में किया जा सकता है। इसकी वैधता कैमरे की गुणवत्ता पर निर्भर करती है और सामान्य तौर पर, लेंस विरूपण प्रभाव बढ़ने पर छवि के केंद्र से किनारों तक घट जाती है।

पिनहोल कैमरा मॉडल जिन प्रभावों को ध्यान में नहीं रखता है, उनमें से कुछ प्रभावों की भरपाई की जा सकती है, उदाहरण के लिए छवि निर्देशांक पर उपयुक्त समन्वय परिवर्तन प्रयुक्त करके; यदि उच्च गुणवत्ता वाले कैमरे का उपयोग किया जाता है, तो अन्य प्रभावों की उपेक्षा की जा सकती है। इसका अर्थ यह है कि पिनहोल कैमरा मॉडल को अधिकांशतः उचित विवरण के रूप में उपयोग किया जा सकता है कि कैसे कैमरा 3डी दृश्य को दर्शाता है, उदाहरण के लिए कंप्यूटर दृष्टि और कंप्यूटर ग्राफिक्स में।

ज्यामिति

पिनहोल कैमरे की ज्यामिति। नोट: x1x2x3 आकृति में समन्वय प्रणाली बाएं हाथ की है, अर्थात् OZ अक्ष की दिशा उस प्रणाली के विपरीत है, जिसका पाठक उपयोग कर सकता है।

पिनहोल कैमरे की मैपिंग से संबंधित ज्यामिति को चित्र में दिखाया गया है। आकृति में निम्नलिखित मूल वस्तुएँ हैं:

  • 3डी ऑर्थोगोनल कोऑर्डिनेट प्रणाली जिसका मूल O पर है। यह वह जगह भी है जहाँ कैमरा एपर्चर स्थित है। समन्वय प्रणाली के तीन अक्षों को X1, X2, X3 कहा जाता है। अक्ष X3 कैमरे की देखने की दिशा में संकेत कर रहा है और इसे ऑप्टिकल अक्ष, प्रिंसिपल अक्ष, या प्रिंसिपल रे कहा जाता है। अक्ष X1 और X2 द्वारा फैला हुआ तल कैमरे के सामने की ओर है, या 'प्रिंसिपल तल' है।
  • छवि तल, जहां कैमरे के एपर्चर के माध्यम से 3डी विश्व को प्रक्षेपित किया जाता है। छवि तल X1 और X2 अक्षों के समानांतर है और X3 अक्ष की नकारात्मक दिशा में उत्पत्ति O से दूरी पर स्थित है, जहां f पिनहोल कैमरे की फोकल लंबाई है। पिनहोल कैमरे के व्यावहारिक कार्यान्वयन का अर्थ है कि छवि तल इस तरह स्थित है कि यह X3 अक्ष को निर्देशांक -f पर प्रतिच्छेद करता है, जहां f> 0 है।
  • ऑप्टिकल अक्ष और छवि तल के प्रतिच्छेदन पर एक बिंदु R है। इस बिंदु को 'प्रमुख बिंदु' कहा जाता है[1] या छवि केंद्र कहा जाता है।
  • अक्ष X1, X2 और X3 के सापेक्ष समन्वय पर विश्व में कहीं बिंदु 'P' है।
  • कैमरे में बिंदु 'P' की प्रोजेक्शन लाइन। यह हरी रेखा है, जो बिंदु 'P' और बिंदु 'O' से होकर निकलती है।
  • छवि तल पर बिंदु 'P' का प्रक्षेपण, 'Q' को निरूपित करता है। यह बिंदु प्रक्षेपण रेखा (हरा) और छवि तल के प्रतिच्छेदन द्वारा दिया गया है। किसी भी व्यावहारिक स्थिति में हम यह मान सकते हैं कि > 0 जिसका अर्थ है कि प्रतिच्छेदन बिंदु अच्छी तरह से परिभाषित है।
  • छवि तल में 2डी कोऑर्डिनेट प्रणाली भी है, जिसका मूल R पर है और अक्ष Y1 और Y2 के साथ जो क्रमशः X1 और X2 के समानांतर हैं। इस निर्देशांक प्रणाली के सापेक्ष बिंदु Q के निर्देशांक हैं।

कैमरे का पिनहोल एपर्चर, जिसके माध्यम से सभी प्रोजेक्शन लाइनों को निकलना चाहिए, उनको मूल रूप से छोटा, बिंदु माना जाता है। साहित्य में 3डी अंतरिक्ष में इस बिंदु को ऑप्टिकल (या लेंस या कैमरा) केंद्र के रूप में जाना जाता है।[2]


सूत्रीकरण

इसके बाद हम यह समझना चाहते हैं कि बिंदु Q के निर्देशांक बिंदु P के निर्देशांक पर कैसे निर्भर करते हैं। यह निम्नलिखित चित्र की सहायता से किया जा सकता है, जो पिछले दृश्य के समान ही दिखाता है आंकड़ा लेकिन अब ऊपर से, X2 अक्ष की नकारात्मक दिशा में नीचे देख रहे हैं।

X2 अक्ष से देखे गए पिनहोल कैमरे की ज्यामिति

इस चित्र में हम दो समान त्रिभुज देखते हैं, दोनों में उनके कर्ण के रूप में प्रक्षेपण रेखा (हरा) के हिस्से हैं। बाएं त्रिकोण के कैथेटी और f हैं और समकोण दाएं त्रिकोण के कैथेटी और हैं। चूंकि दो त्रिकोण समान हैं, इसलिए यह इस प्रकार है:

या

एक समान जाँच, X1 अक्ष की ऋणात्मक दिशा में देखने से मिलती है:

या

इसे इस रूप में संक्षेपित किया जा सकता है:

जो व्यंजक है, जो 3डी निर्देशांकों के बीच संबंध का वर्णन करता है, बिंदु P और इसकी छवि निर्देशांक छवि तल में बिंदु Q द्वारा दिया गया।

घुमाई गई छवि और आभासी छवि का तल

पिनहोल कैमरा द्वारा वर्णित 3डी से 2डी निर्देशांकों की मैपिंग परिप्रेक्ष्य प्रक्षेपण है, जिसके बाद छवि तल में 180° घुमाव होता है। यह इस बात से मेल खाता है, कि वास्तविक पिनहोल कैमरा कैसे काम करता है; परिणामी छवि को 180° घुमाया जाता है और प्रक्षेपित वस्तुओं का सापेक्ष आकार फोकल बिंदु से उनकी दूरी पर निर्भर करता है और छवि का समग्र आकार छवि तल और फोकल बिंदु के बीच की दूरी f पर निर्भर करता है। बिना घुमाई गई छवि बनाने के लिए, जिसकी हम कैमरे से अपेक्षा करते हैं, उसकी दो संभावनाएँ हैं:

  • छवि तल में समन्वय प्रणाली को 180° (किसी भी दिशा में) घुमाएँ। इस तरह पिनहोल कैमरे के किसी भी व्यावहारिक कार्यान्वयन से समस्या का समाधान हो जाएगा; फोटोग्राफिक कैमरे के लिए हम छवि को देखने से पहले घुमाते हैं, और डिजिटल कैमरे के लिए हम पिक्सल को इस क्रम में पढ़ते हैं कि यह घूमता है।
  • छवि तल को रखें जिससे यह -f के अतिरिक्त X3 अक्ष को f पर प्रतिच्छेद करे और पिछली गणनाओं को पुनः करें। यह आभासी (या सामने) छवि विमान उत्पन्न करेगा, जिसे व्यवहार में प्रयुक्त नहीं किया जा सकता है, लेकिन सैद्धांतिक कैमरा प्रदान करता है ,जो वास्तविक की तुलना में विश्लेषण करना सरल हो सकता है।

दोनों ही स्थितियों में, 3डी निर्देशांक से 2डी छवि निर्देशांक तक परिणामी मानचित्रण उपरोक्त अभिव्यक्ति द्वारा दिया गया है, लेकिन बिना निषेध के, इस प्रकार


सजातीय निर्देशांक में

अंतरिक्ष में बिंदुओं के 3डी निर्देशांक से लेकर 2डी छवि निर्देशांक तक की मैपिंग को सजातीय निर्देशांक में भी प्रदर्शित किया जा सकता है। माना सजातीय निर्देशांक (4-आयामी सदिश) में 3डी बिंदु का प्रतिनिधित्व है, और को पिनहोल कैमरा (3-आयामी सदिश) में इस बिंदु की छवि का प्रतिनिधित्व करते हैं। तब निम्नलिखित संबंध धारण करता है;

जहाँ , कैमरा आव्यूह है और प्रक्षेप्य रिक्त स्थान के तत्वों के बीच समानता का अर्थ है। इसका तात्पर्य यह है कि बाएँ और दाएँ हाथ की भुजाएँ गैर-शून्य अदिश गुणन के बराबर हैं। इस संबंध का परिणाम यह भी है कि को प्रोजेक्टिव स्पेस के तत्व के रूप में भी देखा जा सकता है; दो कैमरा आव्यूह समतुल्य हैं, यदि वे स्केलर गुणन के बराबर हैं। पिनहोल कैमरा मैपिंग का यह विवरण, दो रैखिक अभिव्यक्तियों के अंश के अतिरिक्त रैखिक परिवर्तन के रूप में, 3डी और 2डी निर्देशांकों के बीच संबंधों के कई व्युत्पत्तियों को सरल बनाना संभव बनाता है।

यह भी देखें

संदर्भ

  1. Carlo Tomasi (2016-08-09). "एक साधारण कैमरा मॉडल" (PDF). cs.duke.edu. Retrieved 2021-02-18.
  2. Andrea Fusiello (2005-12-27). "ज्यामितीय कंप्यूटर विजन के तत्व". Homepages.inf.ed.ac.uk. Retrieved 2013-12-18.


ग्रन्थसूची