पिनहोल कैमरा मॉडल: Difference between revisions
No edit summary |
No edit summary |
||
(5 intermediate revisions by 3 users not shown) | |||
Line 1: | Line 1: | ||
{{broader| | {{broader|एपिपोलर ज्यामिति}} | ||
[[Image:Pinhole-camera.svg|thumb|[[पिनहोल कैमरा]] का आरेख।]]पिनहोल कैमरा मॉडल त्रि-आयामी अंतरिक्ष में एक बिंदु के निर्देशांक और | [[Image:Pinhole-camera.svg|thumb|[[पिनहोल कैमरा]] का आरेख।]]पिनहोल कैमरा मॉडल त्रि-आयामी अंतरिक्ष में एक बिंदु के निर्देशांक और आदर्श पिनहोल कैमरा के छवि तल पर इसके [[3 डी प्रोजेक्शन]] के बीच गणितीय संबंध का वर्णन करता है, जहां कैमरा एपर्चर को बिंदु के रूप में वर्णित किया गया है और प्रकाश को फोकस करने के लिए किसी लेंस का उपयोग नहीं किया जाता है। मॉडल में सम्मिलित नहीं है, उदाहरण के लिए, विरूपण (ऑप्टिक्स) या लेंस और परिमित आकार के एपर्चर के कारण अनफोकस्ड ऑब्जेक्ट्स का धुंधलापन। यह इस बात पर भी ध्यान नहीं देता है कि अधिकांश व्यावहारिक कैमरों में केवल असतत [[छवि]] निर्देशांक होते हैं। इसका अर्थ यह है कि पिनहोल कैमरा मॉडल का उपयोग केवल [[3डी दृश्य]] से 2डी अंतरिक्ष छवि तक मैपिंग के प्रथम क्रम सन्निकटन के रूप में किया जा सकता है। इसकी वैधता कैमरे की गुणवत्ता पर निर्भर करती है और सामान्य तौर पर, लेंस विरूपण प्रभाव बढ़ने पर छवि के केंद्र से किनारों तक घट जाती है। | ||
पिनहोल कैमरा मॉडल जिन प्रभावों को ध्यान में नहीं रखता है उनमें से कुछ प्रभावों की भरपाई की जा सकती है, उदाहरण के लिए छवि निर्देशांक पर उपयुक्त समन्वय परिवर्तन | पिनहोल कैमरा मॉडल जिन प्रभावों को ध्यान में नहीं रखता है, उनमें से कुछ प्रभावों की भरपाई की जा सकती है, उदाहरण के लिए छवि निर्देशांक पर उपयुक्त समन्वय परिवर्तन प्रयुक्त करके; यदि उच्च गुणवत्ता वाले कैमरे का उपयोग किया जाता है, तो अन्य प्रभावों की उपेक्षा की जा सकती है। इसका अर्थ यह है कि पिनहोल कैमरा मॉडल को अधिकांशतः उचित विवरण के रूप में उपयोग किया जा सकता है कि कैसे कैमरा 3डी दृश्य को दर्शाता है, उदाहरण के लिए [[कंप्यूटर दृष्टि]] और [[ कंप्यूटर चित्रलेख |कंप्यूटर ग्राफिक्स]] में। | ||
== ज्यामिति == | == ज्यामिति == | ||
[[Image:Pinhole.svg|thumb|400px|right|पिनहोल कैमरे की ज्यामिति। नोट: | [[Image:Pinhole.svg|thumb|400px|right|पिनहोल कैमरे की ज्यामिति। नोट: x<sub>1</sub>x<sub>2</sub>x<sub>3</sub> आकृति में समन्वय प्रणाली बाएं हाथ की है, अर्थात् OZ अक्ष की दिशा उस प्रणाली के विपरीत है, जिसका पाठक उपयोग कर सकता है।]]पिनहोल कैमरे की मैपिंग से संबंधित [[ज्यामिति]] को चित्र में दिखाया गया है। आकृति में निम्नलिखित मूल वस्तुएँ हैं: | ||
* 3डी ऑर्थोगोनल कोऑर्डिनेट | * 3डी ऑर्थोगोनल कोऑर्डिनेट प्रणाली जिसका मूल O पर है। यह वह जगह भी है जहाँ कैमरा एपर्चर स्थित है। समन्वय प्रणाली के तीन अक्षों को X1, X2, X3 कहा जाता है। अक्ष X3 कैमरे की देखने की दिशा में संकेत कर रहा है और इसे [[ ऑप्टिकल अक्ष |ऑप्टिकल अक्ष]], प्रिंसिपल अक्ष, या प्रिंसिपल रे कहा जाता है। अक्ष X1 और X2 द्वारा फैला हुआ तल कैमरे के सामने की ओर है, या 'प्रिंसिपल तल' है। | ||
* | * छवि तल, जहां कैमरे के एपर्चर के माध्यम से 3डी विश्व को प्रक्षेपित किया जाता है। छवि तल X1 और X2 अक्षों के समानांतर है और X3 अक्ष की नकारात्मक दिशा में उत्पत्ति O से दूरी <math>f</math> पर स्थित है, जहां ''f'' पिनहोल कैमरे की फोकल लंबाई है। पिनहोल कैमरे के व्यावहारिक कार्यान्वयन का अर्थ है कि छवि तल इस तरह स्थित है कि यह X3 अक्ष को निर्देशांक -f पर प्रतिच्छेद करता है, जहां f> 0 है। | ||
* ऑप्टिकल अक्ष और छवि तल के | * ऑप्टिकल अक्ष और छवि तल के प्रतिच्छेदन पर एक बिंदु R है। इस बिंदु को 'प्रमुख बिंदु' कहा जाता है<ref>{{cite web|author=Carlo Tomasi |url=https://www2.cs.duke.edu/courses/fall16/compsci527/notes/camera-model.pdf |title=एक साधारण कैमरा मॉडल|publisher=cs.duke.edu |date=2016-08-09 |accessdate=2021-02-18}}</ref> या छवि केंद्र कहा जाता है। | ||
* | * अक्ष X1, X2 और X3 के सापेक्ष समन्वय <math> (x_1, x_2, x_3) </math> पर विश्व में कहीं बिंदु 'P' है। | ||
* कैमरे में बिंदु 'P' की प्रोजेक्शन लाइन। यह हरी रेखा है जो बिंदु 'P' और बिंदु 'O' से होकर | * कैमरे में बिंदु 'P' की प्रोजेक्शन लाइन। यह हरी रेखा है, जो बिंदु 'P' और बिंदु 'O' से होकर निकलती है। | ||
* छवि तल पर बिंदु 'P' का प्रक्षेपण, 'Q' को निरूपित करता है। यह बिंदु प्रक्षेपण रेखा (हरा) और छवि तल के प्रतिच्छेदन द्वारा दिया गया है। किसी भी व्यावहारिक स्थिति में हम यह मान सकते हैं <math>x_3</math> > 0 जिसका अर्थ है कि प्रतिच्छेदन बिंदु अच्छी तरह से परिभाषित है। | * छवि तल पर बिंदु 'P' का प्रक्षेपण, 'Q' को निरूपित करता है। यह बिंदु प्रक्षेपण रेखा (हरा) और छवि तल के प्रतिच्छेदन द्वारा दिया गया है। किसी भी व्यावहारिक स्थिति में हम यह मान सकते हैं कि <math>x_3</math> > 0 जिसका अर्थ है कि प्रतिच्छेदन बिंदु अच्छी तरह से परिभाषित है। | ||
* | * छवि तल में 2डी कोऑर्डिनेट प्रणाली भी है, जिसका मूल R पर है और अक्ष Y1 और Y2 के साथ जो क्रमशः X1 और X2 के समानांतर हैं। इस निर्देशांक प्रणाली के सापेक्ष बिंदु Q के निर्देशांक <math> (y_1, y_2) </math> हैं। | ||
कैमरे का पिनहोल एपर्चर, जिसके माध्यम से सभी प्रोजेक्शन लाइनों को | कैमरे का पिनहोल एपर्चर, जिसके माध्यम से सभी प्रोजेक्शन लाइनों को निकलना चाहिए, उनको मूल रूप से छोटा, बिंदु माना जाता है। साहित्य में 3डी अंतरिक्ष में इस बिंदु को ऑप्टिकल (या लेंस या कैमरा) केंद्र के रूप में जाना जाता है।<ref>{{cite web|author=Andrea Fusiello |url=http://homepages.inf.ed.ac.uk/rbf/CVonline/LOCAL_COPIES/FUSIELLO4/tutorial.html#x1-30003 |title=ज्यामितीय कंप्यूटर विजन के तत्व|publisher=Homepages.inf.ed.ac.uk |date=2005-12-27 |accessdate=2013-12-18}}</ref> | ||
== सूत्रीकरण == | == सूत्रीकरण == | ||
इसके बाद हम यह समझना चाहते हैं कि बिंदु Q के निर्देशांक <math> (y_1, y_2) </math> बिंदु P के निर्देशांक <math> (x_1, x_2, x_3) </math> पर कैसे निर्भर करते हैं। यह निम्नलिखित चित्र की सहायता से किया जा सकता है, जो पिछले दृश्य के समान ही दिखाता है आंकड़ा लेकिन अब ऊपर से, X2 अक्ष की नकारात्मक दिशा में नीचे देख रहे हैं। | |||
[[Image:Pinhole2.svg|thumb|400px|right|X2 अक्ष से देखे गए पिनहोल कैमरे की ज्यामिति]]इस चित्र में हम दो समान त्रिभुज देखते हैं, दोनों में उनके [[कर्ण]] के रूप में प्रक्षेपण रेखा (हरा) के हिस्से हैं। बाएं त्रिकोण के [[कैथेटस]] | [[Image:Pinhole2.svg|thumb|400px|right|X2 अक्ष से देखे गए पिनहोल कैमरे की ज्यामिति]]इस चित्र में हम दो समान त्रिभुज देखते हैं, दोनों में उनके [[कर्ण]] के रूप में प्रक्षेपण रेखा (हरा) के हिस्से हैं। बाएं त्रिकोण के [[कैथेटस|कैथेटी]] <math> -y_1 </math> और f हैं और समकोण दाएं त्रिकोण के कैथेटी <math> x_1 </math> और <math> x_3 </math> हैं। चूंकि दो त्रिकोण समान हैं, इसलिए यह इस प्रकार है: | ||
: <math> \frac{-y_1}{f} = \frac{x_1}{x_3} </math> या <math> y_1 = -\frac{f \, x_1}{x_3} </math> | : <math> \frac{-y_1}{f} = \frac{x_1}{x_3} </math> या <math> y_1 = -\frac{f \, x_1}{x_3} </math> | ||
समान जाँच, X1 अक्ष की ऋणात्मक दिशा में देखने से मिलती है | एक समान जाँच, X1 अक्ष की ऋणात्मक दिशा में देखने से मिलती है: | ||
: <math> \frac{-y_2}{f} = \frac{x_2}{x_3} </math> या <math> y_2 = -\frac{f \, x_2}{x_3} </math> | : <math> \frac{-y_2}{f} = \frac{x_2}{x_3} </math> या <math> y_2 = -\frac{f \, x_2}{x_3} </math> | ||
इसे इस रूप में संक्षेपित किया जा सकता है | इसे इस रूप में संक्षेपित किया जा सकता है: | ||
: <math> \begin{pmatrix} y_1 \\ y_2 \end{pmatrix} = -\frac{f}{x_3} \begin{pmatrix} x_1 \\ x_2 \end{pmatrix} </math> | : <math> \begin{pmatrix} y_1 \\ y_2 \end{pmatrix} = -\frac{f}{x_3} \begin{pmatrix} x_1 \\ x_2 \end{pmatrix} </math> | ||
जो व्यंजक है जो | जो व्यंजक है, जो 3डी निर्देशांकों <math> (x_1,x_2,x_3) </math> के बीच संबंध का वर्णन करता है, बिंदु P और इसकी छवि निर्देशांक <math> (y_1,y_2) </math> छवि तल में बिंदु Q द्वारा दिया गया। | ||
=== घुमाई गई छवि और आभासी छवि का तल === | === घुमाई गई छवि और आभासी छवि का तल === | ||
पिनहोल कैमरा द्वारा वर्णित 3डी से 2डी निर्देशांकों की मैपिंग [[परिप्रेक्ष्य प्रक्षेपण]] है जिसके बाद | पिनहोल कैमरा द्वारा वर्णित 3डी से 2डी निर्देशांकों की मैपिंग [[परिप्रेक्ष्य प्रक्षेपण]] है, जिसके बाद छवि तल में 180° घुमाव होता है। यह इस बात से मेल खाता है, कि वास्तविक पिनहोल कैमरा कैसे काम करता है; परिणामी छवि को 180° घुमाया जाता है और प्रक्षेपित वस्तुओं का सापेक्ष आकार फोकल बिंदु से उनकी दूरी पर निर्भर करता है और छवि का समग्र आकार छवि तल और फोकल बिंदु के बीच की दूरी f पर निर्भर करता है। बिना घुमाई गई छवि बनाने के लिए, जिसकी हम कैमरे से अपेक्षा करते हैं, उसकी दो संभावनाएँ हैं: | ||
* छवि तल में समन्वय प्रणाली को 180° (किसी भी दिशा में) घुमाएँ। इस तरह पिनहोल कैमरे के किसी भी व्यावहारिक कार्यान्वयन से समस्या का समाधान हो जाएगा; फोटोग्राफिक कैमरे के लिए हम छवि को देखने से पहले घुमाते हैं, और डिजिटल कैमरे के लिए हम पिक्सल को इस क्रम में पढ़ते हैं कि यह घूमता है। | * छवि तल में समन्वय प्रणाली को 180° (किसी भी दिशा में) घुमाएँ। इस तरह पिनहोल कैमरे के किसी भी व्यावहारिक कार्यान्वयन से समस्या का समाधान हो जाएगा; फोटोग्राफिक कैमरे के लिए हम छवि को देखने से पहले घुमाते हैं, और डिजिटल कैमरे के लिए हम पिक्सल को इस क्रम में पढ़ते हैं कि यह घूमता है। | ||
* छवि तल को रखें | * छवि तल को रखें जिससे यह -f के अतिरिक्त X3 अक्ष को f पर प्रतिच्छेद करे और पिछली गणनाओं को पुनः करें। यह आभासी (या सामने) छवि विमान उत्पन्न करेगा, जिसे व्यवहार में प्रयुक्त नहीं किया जा सकता है, लेकिन सैद्धांतिक कैमरा प्रदान करता है ,जो वास्तविक की तुलना में विश्लेषण करना सरल हो सकता है। | ||
दोनों ही | दोनों ही स्थितियों में, 3डी निर्देशांक से 2डी छवि निर्देशांक तक परिणामी मानचित्रण उपरोक्त अभिव्यक्ति द्वारा दिया गया है, लेकिन बिना निषेध के, इस प्रकार | ||
: <math> \begin{pmatrix} y_1 \\ y_2 \end{pmatrix} = \frac{f}{x_3} \begin{pmatrix} x_1 \\ x_2 \end{pmatrix} </math> | : <math> \begin{pmatrix} y_1 \\ y_2 \end{pmatrix} = \frac{f}{x_3} \begin{pmatrix} x_1 \\ x_2 \end{pmatrix} </math> | ||
Line 47: | Line 47: | ||
== सजातीय निर्देशांक में == | == सजातीय निर्देशांक में == | ||
{{main| | {{main|कैमरा आव्यूह}} | ||
अंतरिक्ष में बिंदुओं के 3डी निर्देशांक से लेकर 2डी छवि निर्देशांक तक की मैपिंग को [[सजातीय निर्देशांक]] में भी प्रदर्शित किया जा सकता है। | अंतरिक्ष में बिंदुओं के 3डी निर्देशांक से लेकर 2डी छवि निर्देशांक तक की मैपिंग को [[सजातीय निर्देशांक]] में भी प्रदर्शित किया जा सकता है। माना <math> \mathbf{x} </math> सजातीय निर्देशांक (4-आयामी सदिश) में 3डी बिंदु का प्रतिनिधित्व है, और <math> \mathbf{y} </math> को पिनहोल कैमरा (3-आयामी सदिश) में इस बिंदु की छवि का प्रतिनिधित्व करते हैं। तब निम्नलिखित संबंध धारण करता है; | ||
: <math> \mathbf{y} \sim \mathbf{C} \, \mathbf{x} </math> | : <math> \mathbf{y} \sim \mathbf{C} \, \mathbf{x} </math> | ||
जहाँ <math> \mathbf{C} </math>, <math> 3 \times 4 </math> [[कैमरा मैट्रिक्स|कैमरा आव्यूह]] है और <math>\, \sim </math> प्रक्षेप्य रिक्त स्थान के तत्वों के बीच समानता का अर्थ है। इसका तात्पर्य यह है कि बाएँ और दाएँ हाथ की भुजाएँ गैर-शून्य अदिश गुणन के बराबर हैं। इस संबंध का परिणाम यह भी है कि <math> \mathbf{C} </math> को प्रोजेक्टिव स्पेस के तत्व के रूप में भी देखा जा सकता है; दो कैमरा आव्यूह समतुल्य हैं, यदि वे स्केलर गुणन के बराबर हैं। पिनहोल कैमरा मैपिंग का यह विवरण, दो रैखिक अभिव्यक्तियों के अंश के अतिरिक्त रैखिक परिवर्तन <math> \mathbf{C} </math> के रूप में, 3डी और 2डी निर्देशांकों के बीच संबंधों के कई व्युत्पत्तियों को सरल बनाना संभव बनाता है। | |||
== यह भी देखें == | == यह भी देखें == | ||
Line 58: | Line 58: | ||
* [[संपार्श्विक समीकरण]] | * [[संपार्श्विक समीकरण]] | ||
* प्रवेश पुतली, वास्तविक कैमरे में वस्तु स्थान के संबंध में पिनहोल का समतुल्य स्थान। | * प्रवेश पुतली, वास्तविक कैमरे में वस्तु स्थान के संबंध में पिनहोल का समतुल्य स्थान। | ||
* [[छात्र बाहर निकलें]] | * [[छात्र बाहर निकलें|पुतली से बाहर निकलें,]] वास्तविक कैमरे में छवि तल के संबंध में पिनहोल का समतुल्य स्थान। | ||
* [[इब्न अल-हेथम]] | * [[इब्न अल-हेथम]] | ||
* पिनहोल कैमरा, इस आलेख में वर्णित गणितीय मॉडल का व्यावहारिक कार्यान्वयन। | * पिनहोल कैमरा, इस आलेख में वर्णित गणितीय मॉडल का व्यावहारिक कार्यान्वयन। | ||
Line 73: | Line 73: | ||
*{{cite book| author=[[Linda Shapiro|Linda G. Shapiro]] and George C. Stockman| title=Computer Vision| publisher=Prentice Hall| year=2001| isbn=0-13-030796-3}} | *{{cite book| author=[[Linda Shapiro|Linda G. Shapiro]] and George C. Stockman| title=Computer Vision| publisher=Prentice Hall| year=2001| isbn=0-13-030796-3}} | ||
*{{cite book| author=Gang Xu and Zhengyou Zhang| title=Epipolar geometry in Stereo, Motion and Object Recognition| publisher=Kluwer Academic Publishers| year=1996| isbn=0-7923-4199-6| url = https://books.google.com/books?id=DnFaUidM-B0C&pg=PA7&dq=pinhole+intitle:%22Epipolar+geometry%22}} | *{{cite book| author=Gang Xu and Zhengyou Zhang| title=Epipolar geometry in Stereo, Motion and Object Recognition| publisher=Kluwer Academic Publishers| year=1996| isbn=0-7923-4199-6| url = https://books.google.com/books?id=DnFaUidM-B0C&pg=PA7&dq=pinhole+intitle:%22Epipolar+geometry%22}} | ||
[[Category:Articles with hatnote templates targeting a nonexistent page]] | |||
[[Category: | |||
[[Category:Created On 08/06/2023]] | [[Category:Created On 08/06/2023]] | ||
[[Category:Machine Translated Page]] | |||
[[Category:Pages with script errors]] | |||
[[Category:Templates Vigyan Ready]] | |||
[[Category:कंप्यूटर दृष्टि में ज्यामिति]] | |||
[[Category:कैमरा]] |
Latest revision as of 09:54, 21 June 2023
पिनहोल कैमरा मॉडल त्रि-आयामी अंतरिक्ष में एक बिंदु के निर्देशांक और आदर्श पिनहोल कैमरा के छवि तल पर इसके 3 डी प्रोजेक्शन के बीच गणितीय संबंध का वर्णन करता है, जहां कैमरा एपर्चर को बिंदु के रूप में वर्णित किया गया है और प्रकाश को फोकस करने के लिए किसी लेंस का उपयोग नहीं किया जाता है। मॉडल में सम्मिलित नहीं है, उदाहरण के लिए, विरूपण (ऑप्टिक्स) या लेंस और परिमित आकार के एपर्चर के कारण अनफोकस्ड ऑब्जेक्ट्स का धुंधलापन। यह इस बात पर भी ध्यान नहीं देता है कि अधिकांश व्यावहारिक कैमरों में केवल असतत छवि निर्देशांक होते हैं। इसका अर्थ यह है कि पिनहोल कैमरा मॉडल का उपयोग केवल 3डी दृश्य से 2डी अंतरिक्ष छवि तक मैपिंग के प्रथम क्रम सन्निकटन के रूप में किया जा सकता है। इसकी वैधता कैमरे की गुणवत्ता पर निर्भर करती है और सामान्य तौर पर, लेंस विरूपण प्रभाव बढ़ने पर छवि के केंद्र से किनारों तक घट जाती है।
पिनहोल कैमरा मॉडल जिन प्रभावों को ध्यान में नहीं रखता है, उनमें से कुछ प्रभावों की भरपाई की जा सकती है, उदाहरण के लिए छवि निर्देशांक पर उपयुक्त समन्वय परिवर्तन प्रयुक्त करके; यदि उच्च गुणवत्ता वाले कैमरे का उपयोग किया जाता है, तो अन्य प्रभावों की उपेक्षा की जा सकती है। इसका अर्थ यह है कि पिनहोल कैमरा मॉडल को अधिकांशतः उचित विवरण के रूप में उपयोग किया जा सकता है कि कैसे कैमरा 3डी दृश्य को दर्शाता है, उदाहरण के लिए कंप्यूटर दृष्टि और कंप्यूटर ग्राफिक्स में।
ज्यामिति
पिनहोल कैमरे की मैपिंग से संबंधित ज्यामिति को चित्र में दिखाया गया है। आकृति में निम्नलिखित मूल वस्तुएँ हैं:
- 3डी ऑर्थोगोनल कोऑर्डिनेट प्रणाली जिसका मूल O पर है। यह वह जगह भी है जहाँ कैमरा एपर्चर स्थित है। समन्वय प्रणाली के तीन अक्षों को X1, X2, X3 कहा जाता है। अक्ष X3 कैमरे की देखने की दिशा में संकेत कर रहा है और इसे ऑप्टिकल अक्ष, प्रिंसिपल अक्ष, या प्रिंसिपल रे कहा जाता है। अक्ष X1 और X2 द्वारा फैला हुआ तल कैमरे के सामने की ओर है, या 'प्रिंसिपल तल' है।
- छवि तल, जहां कैमरे के एपर्चर के माध्यम से 3डी विश्व को प्रक्षेपित किया जाता है। छवि तल X1 और X2 अक्षों के समानांतर है और X3 अक्ष की नकारात्मक दिशा में उत्पत्ति O से दूरी पर स्थित है, जहां f पिनहोल कैमरे की फोकल लंबाई है। पिनहोल कैमरे के व्यावहारिक कार्यान्वयन का अर्थ है कि छवि तल इस तरह स्थित है कि यह X3 अक्ष को निर्देशांक -f पर प्रतिच्छेद करता है, जहां f> 0 है।
- ऑप्टिकल अक्ष और छवि तल के प्रतिच्छेदन पर एक बिंदु R है। इस बिंदु को 'प्रमुख बिंदु' कहा जाता है[1] या छवि केंद्र कहा जाता है।
- अक्ष X1, X2 और X3 के सापेक्ष समन्वय पर विश्व में कहीं बिंदु 'P' है।
- कैमरे में बिंदु 'P' की प्रोजेक्शन लाइन। यह हरी रेखा है, जो बिंदु 'P' और बिंदु 'O' से होकर निकलती है।
- छवि तल पर बिंदु 'P' का प्रक्षेपण, 'Q' को निरूपित करता है। यह बिंदु प्रक्षेपण रेखा (हरा) और छवि तल के प्रतिच्छेदन द्वारा दिया गया है। किसी भी व्यावहारिक स्थिति में हम यह मान सकते हैं कि > 0 जिसका अर्थ है कि प्रतिच्छेदन बिंदु अच्छी तरह से परिभाषित है।
- छवि तल में 2डी कोऑर्डिनेट प्रणाली भी है, जिसका मूल R पर है और अक्ष Y1 और Y2 के साथ जो क्रमशः X1 और X2 के समानांतर हैं। इस निर्देशांक प्रणाली के सापेक्ष बिंदु Q के निर्देशांक हैं।
कैमरे का पिनहोल एपर्चर, जिसके माध्यम से सभी प्रोजेक्शन लाइनों को निकलना चाहिए, उनको मूल रूप से छोटा, बिंदु माना जाता है। साहित्य में 3डी अंतरिक्ष में इस बिंदु को ऑप्टिकल (या लेंस या कैमरा) केंद्र के रूप में जाना जाता है।[2]
सूत्रीकरण
इसके बाद हम यह समझना चाहते हैं कि बिंदु Q के निर्देशांक बिंदु P के निर्देशांक पर कैसे निर्भर करते हैं। यह निम्नलिखित चित्र की सहायता से किया जा सकता है, जो पिछले दृश्य के समान ही दिखाता है आंकड़ा लेकिन अब ऊपर से, X2 अक्ष की नकारात्मक दिशा में नीचे देख रहे हैं।
इस चित्र में हम दो समान त्रिभुज देखते हैं, दोनों में उनके कर्ण के रूप में प्रक्षेपण रेखा (हरा) के हिस्से हैं। बाएं त्रिकोण के कैथेटी और f हैं और समकोण दाएं त्रिकोण के कैथेटी और हैं। चूंकि दो त्रिकोण समान हैं, इसलिए यह इस प्रकार है:
- या
एक समान जाँच, X1 अक्ष की ऋणात्मक दिशा में देखने से मिलती है:
- या
इसे इस रूप में संक्षेपित किया जा सकता है:
जो व्यंजक है, जो 3डी निर्देशांकों के बीच संबंध का वर्णन करता है, बिंदु P और इसकी छवि निर्देशांक छवि तल में बिंदु Q द्वारा दिया गया।
घुमाई गई छवि और आभासी छवि का तल
पिनहोल कैमरा द्वारा वर्णित 3डी से 2डी निर्देशांकों की मैपिंग परिप्रेक्ष्य प्रक्षेपण है, जिसके बाद छवि तल में 180° घुमाव होता है। यह इस बात से मेल खाता है, कि वास्तविक पिनहोल कैमरा कैसे काम करता है; परिणामी छवि को 180° घुमाया जाता है और प्रक्षेपित वस्तुओं का सापेक्ष आकार फोकल बिंदु से उनकी दूरी पर निर्भर करता है और छवि का समग्र आकार छवि तल और फोकल बिंदु के बीच की दूरी f पर निर्भर करता है। बिना घुमाई गई छवि बनाने के लिए, जिसकी हम कैमरे से अपेक्षा करते हैं, उसकी दो संभावनाएँ हैं:
- छवि तल में समन्वय प्रणाली को 180° (किसी भी दिशा में) घुमाएँ। इस तरह पिनहोल कैमरे के किसी भी व्यावहारिक कार्यान्वयन से समस्या का समाधान हो जाएगा; फोटोग्राफिक कैमरे के लिए हम छवि को देखने से पहले घुमाते हैं, और डिजिटल कैमरे के लिए हम पिक्सल को इस क्रम में पढ़ते हैं कि यह घूमता है।
- छवि तल को रखें जिससे यह -f के अतिरिक्त X3 अक्ष को f पर प्रतिच्छेद करे और पिछली गणनाओं को पुनः करें। यह आभासी (या सामने) छवि विमान उत्पन्न करेगा, जिसे व्यवहार में प्रयुक्त नहीं किया जा सकता है, लेकिन सैद्धांतिक कैमरा प्रदान करता है ,जो वास्तविक की तुलना में विश्लेषण करना सरल हो सकता है।
दोनों ही स्थितियों में, 3डी निर्देशांक से 2डी छवि निर्देशांक तक परिणामी मानचित्रण उपरोक्त अभिव्यक्ति द्वारा दिया गया है, लेकिन बिना निषेध के, इस प्रकार
सजातीय निर्देशांक में
अंतरिक्ष में बिंदुओं के 3डी निर्देशांक से लेकर 2डी छवि निर्देशांक तक की मैपिंग को सजातीय निर्देशांक में भी प्रदर्शित किया जा सकता है। माना सजातीय निर्देशांक (4-आयामी सदिश) में 3डी बिंदु का प्रतिनिधित्व है, और को पिनहोल कैमरा (3-आयामी सदिश) में इस बिंदु की छवि का प्रतिनिधित्व करते हैं। तब निम्नलिखित संबंध धारण करता है;
जहाँ , कैमरा आव्यूह है और प्रक्षेप्य रिक्त स्थान के तत्वों के बीच समानता का अर्थ है। इसका तात्पर्य यह है कि बाएँ और दाएँ हाथ की भुजाएँ गैर-शून्य अदिश गुणन के बराबर हैं। इस संबंध का परिणाम यह भी है कि को प्रोजेक्टिव स्पेस के तत्व के रूप में भी देखा जा सकता है; दो कैमरा आव्यूह समतुल्य हैं, यदि वे स्केलर गुणन के बराबर हैं। पिनहोल कैमरा मैपिंग का यह विवरण, दो रैखिक अभिव्यक्तियों के अंश के अतिरिक्त रैखिक परिवर्तन के रूप में, 3डी और 2डी निर्देशांकों के बीच संबंधों के कई व्युत्पत्तियों को सरल बनाना संभव बनाता है।
यह भी देखें
- कैमरा शोधन
- संपार्श्विक समीकरण
- प्रवेश पुतली, वास्तविक कैमरे में वस्तु स्थान के संबंध में पिनहोल का समतुल्य स्थान।
- पुतली से बाहर निकलें, वास्तविक कैमरे में छवि तल के संबंध में पिनहोल का समतुल्य स्थान।
- इब्न अल-हेथम
- पिनहोल कैमरा, इस आलेख में वर्णित गणितीय मॉडल का व्यावहारिक कार्यान्वयन।
- रेक्टिलाइनियर लेंस
संदर्भ
- ↑ Carlo Tomasi (2016-08-09). "एक साधारण कैमरा मॉडल" (PDF). cs.duke.edu. Retrieved 2021-02-18.
- ↑ Andrea Fusiello (2005-12-27). "ज्यामितीय कंप्यूटर विजन के तत्व". Homepages.inf.ed.ac.uk. Retrieved 2013-12-18.
ग्रन्थसूची
- David A. Forsyth and Jean Ponce (2003). Computer Vision, A Modern Approach. Prentice Hall. ISBN 0-12-379777-2.
- Richard Hartley and Andrew Zisserman (2003). Multiple View Geometry in computer vision. Cambridge University Press. ISBN 0-521-54051-8.
- Bernd Jähne (1997). Practical Handbook on Image Processing for Scientific Applications. CRC Press. ISBN 0-8493-8906-2.
- Linda G. Shapiro and George C. Stockman (2001). Computer Vision. Prentice Hall. ISBN 0-13-030796-3.
- Gang Xu and Zhengyou Zhang (1996). Epipolar geometry in Stereo, Motion and Object Recognition. Kluwer Academic Publishers. ISBN 0-7923-4199-6.