पिनहोल कैमरा मॉडल
पिनहोल कैमरा मॉडल त्रि-आयामी अंतरिक्ष में एक बिंदु के निर्देशांक और आदर्श पिनहोल कैमरा के इमेज प्लेन पर इसके 3 डी प्रोजेक्शन के बीच गणितीय संबंध का वर्णन करता है, जहां कैमरा एपर्चर को बिंदु के रूप में वर्णित किया गया है और कोई लेंस नहीं है। प्रकाश को केंद्रित करने के लिए उपयोग किया जाता है। मॉडल में शामिल नहीं है, उदाहरण के लिए, विरूपण (ऑप्टिक्स) या लेंस और परिमित आकार के एपर्चर के कारण अनफोकस्ड ऑब्जेक्ट्स का धुंधलापन। यह इस बात पर भी ध्यान नहीं देता है कि अधिकांश व्यावहारिक कैमरों में केवल असतत छवि निर्देशांक होते हैं। इसका मतलब यह है कि पिनहोल कैमरा मॉडल का उपयोग केवल 3डी दृश्य से द्वि-आयामी_अंतरिक्ष छवि के मानचित्रण के पहले क्रम सन्निकटन के रूप में किया जा सकता है। इसकी वैधता कैमरे की गुणवत्ता पर निर्भर करती है और सामान्य तौर पर, लेंस विरूपण प्रभाव बढ़ने पर छवि के केंद्र से किनारों तक घट जाती है।
पिनहोल कैमरा मॉडल जिन प्रभावों को ध्यान में नहीं रखता है उनमें से कुछ प्रभावों की भरपाई की जा सकती है, उदाहरण के लिए छवि निर्देशांक पर उपयुक्त समन्वय परिवर्तन लागू करके; यदि उच्च गुणवत्ता वाले कैमरे का उपयोग किया जाता है तो अन्य प्रभावों की उपेक्षा की जा सकती है। इसका मतलब यह है कि पिनहोल कैमरा मॉडल को अक्सर उचित विवरण के रूप में इस्तेमाल किया जा सकता है कि कैसे कैमरा 3डी दृश्य को दर्शाता है, उदाहरण के लिए कंप्यूटर दृष्टि और कंप्यूटर चित्रलेख में।
ज्यामिति
पिनहोल कैमरे की मैपिंग से संबंधित ज्यामिति को चित्र में दिखाया गया है। आकृति में निम्नलिखित मूल वस्तुएँ हैं:
- 3डी ऑर्थोगोनल कोऑर्डिनेट सिस्टम जिसका मूल O पर है। यहीं पर अपर्चर|कैमरा अपर्चर स्थित है। समन्वय प्रणाली के तीन अक्षों को X1, X2, X3 कहा जाता है। एक्सिस एक्स3 कैमरे की देखने की दिशा में इशारा कर रहा है और इसे ऑप्टिकल अक्ष, प्रिंसिपल एक्सिस, या प्रिंसिपल रे कहा जाता है। अक्ष X1 और X2 द्वारा फैला हुआ विमान कैमरे के सामने की ओर है, या 'प्रिंसिपल प्लेन' है।
- इमेज प्लेन, जहां कैमरे के एपर्चर के माध्यम से 3डी दुनिया को प्रक्षेपित किया जाता है। छवि तल X1 और X2 अक्षों के समानांतर है और दूरी पर स्थित है मूल O से X3 अक्ष की ऋणात्मक दिशा में, जहाँ f पिनहोल कैमरा की फ़ोकल लंबाई है। पिनहोल कैमरे के व्यावहारिक कार्यान्वयन का तात्पर्य है कि छवि तल इस तरह स्थित है कि यह X3 अक्ष को निर्देशांक -f जहां f > 0 पर काटता है।
- ऑप्टिकल अक्ष और छवि तल के चौराहे पर एक बिंदु R है। इस बिंदु को 'प्रमुख बिंदु' कहा जाता है [1] या छवि केंद्र।
- विश्व में कहीं बिंदु 'P' निर्देशांक पर है अक्ष X1, X2 और X3 के सापेक्ष।
- कैमरे में बिंदु 'P' की प्रोजेक्शन लाइन। यह हरी रेखा है जो बिंदु 'P' और बिंदु 'O' से होकर गुजरती है।
- छवि तल पर बिंदु 'P' का प्रक्षेपण, 'Q' को निरूपित करता है। यह बिंदु प्रक्षेपण रेखा (हरा) और छवि तल के प्रतिच्छेदन द्वारा दिया गया है। किसी भी व्यावहारिक स्थिति में हम यह मान सकते हैं > 0 जिसका अर्थ है कि प्रतिच्छेदन बिंदु अच्छी तरह से परिभाषित है।
- इमेज प्लेन में 2D कोऑर्डिनेट सिस्टम भी है, जिसका मूल R पर है और एक्सिस Y1 और Y2 के साथ जो क्रमशः X1 और X2 के समानांतर हैं। इस निर्देशांक प्रणाली के सापेक्ष बिंदु Q का निर्देशांक है .
कैमरे का पिनहोल एपर्चर, जिसके माध्यम से सभी प्रोजेक्शन लाइनों को गुजरना चाहिए, को असीम रूप से छोटा, बिंदु माना जाता है। साहित्य में 3डी अंतरिक्ष में इस बिंदु को ऑप्टिकल (या लेंस या कैमरा) केंद्र के रूप में जाना जाता है।[2]
सूत्रीकरण
आगे हम यह समझना चाहते हैं कि निर्देशांक कैसे होते हैं बिंदु Q निर्देशांक पर निर्भर करता है यह निम्न चित्र की सहायता से किया जा सकता है जो पिछली आकृति के समान दृश्य दिखाता है लेकिन अब ऊपर से, X2 अक्ष की नकारात्मक दिशा में नीचे देख रहा है।
इस चित्र में हम दो समान त्रिभुज देखते हैं, दोनों में उनके कर्ण के रूप में प्रक्षेपण रेखा (हरा) के हिस्से हैं। बाएं त्रिकोण के कैथेटस हैं और f और समकोण त्रिभुज के कैथेटी हैं और . चूंकि दो त्रिकोण समान हैं, इसलिए यह इस प्रकार है
- या
समान जाँच, X1 अक्ष की ऋणात्मक दिशा में देखने से मिलती है
- या
इसे इस रूप में संक्षेपित किया जा सकता है
जो व्यंजक है जो 3D निर्देशांकों के बीच संबंध का वर्णन करता है बिंदु P और इसकी छवि निर्देशांक छवि तल में बिंदु Q द्वारा दिया गया।
घुमाई गई छवि और आभासी छवि का तल
पिनहोल कैमरा द्वारा वर्णित 3डी से 2डी निर्देशांकों की मैपिंग परिप्रेक्ष्य प्रक्षेपण है जिसके बाद इमेज प्लेन में 180° घुमाव होता है। यह इस बात से मेल खाता है कि वास्तविक पिनहोल कैमरा कैसे काम करता है; परिणामी छवि को 180° घुमाया जाता है और प्रक्षेपित वस्तुओं का सापेक्ष आकार फोकल बिंदु से उनकी दूरी पर निर्भर करता है और छवि का समग्र आकार छवि तल और फोकल बिंदु के बीच की दूरी f पर निर्भर करता है। बिना घुमाई गई छवि बनाने के लिए, जिसकी हम कैमरे से अपेक्षा करते हैं, दो संभावनाएँ हैं:
- छवि तल में समन्वय प्रणाली को 180° (किसी भी दिशा में) घुमाएँ। इस तरह पिनहोल कैमरे के किसी भी व्यावहारिक कार्यान्वयन से समस्या का समाधान हो जाएगा; फोटोग्राफिक कैमरे के लिए हम छवि को देखने से पहले घुमाते हैं, और डिजिटल कैमरे के लिए हम पिक्सल को इस क्रम में पढ़ते हैं कि यह घूमता है।
- छवि तल को रखें ताकि यह -f के बजाय X3 अक्ष को f पर प्रतिच्छेद करे और पिछली गणनाओं को फिर से करें। यह आभासी (या सामने) छवि विमान उत्पन्न करेगा जिसे व्यवहार में लागू नहीं किया जा सकता है, लेकिन सैद्धांतिक कैमरा प्रदान करता है जो वास्तविक की तुलना में विश्लेषण करना आसान हो सकता है।
दोनों ही मामलों में, 3D निर्देशांक से 2D छवि निर्देशांक तक परिणामी मानचित्रण उपरोक्त अभिव्यक्ति द्वारा दिया गया है, लेकिन बिना निषेध के, इस प्रकार
सजातीय निर्देशांक में
अंतरिक्ष में बिंदुओं के 3डी निर्देशांक से लेकर 2डी छवि निर्देशांक तक की मैपिंग को सजातीय निर्देशांक में भी प्रदर्शित किया जा सकता है। होने देना सजातीय निर्देशांक (4-आयामी वेक्टर) में 3डी बिंदु का प्रतिनिधित्व हो, और चलो पिनहोल कैमरा (3-आयामी वेक्टर) में इस बिंदु की छवि का प्रतिनिधित्व करें। तब निम्नलिखित संबंध धारण करता है
कहाँ है कैमरा मैट्रिक्स और प्रक्षेप्य रिक्त स्थान के तत्वों के बीच समानता का मतलब है। इसका तात्पर्य यह है कि बाएँ और दाएँ हाथ की भुजाएँ गैर-शून्य अदिश गुणन के बराबर हैं। इस संबंध का परिणाम यह भी है प्रोजेक्टिव स्पेस के तत्व के रूप में देखा जा सकता है; दो कैमरा मैट्रिसेस समतुल्य हैं यदि वे स्केलर गुणन के बराबर हैं। रेखीय परिवर्तन के रूप में, पिनहोल कैमरा मैपिंग का यह विवरण दो रैखिक व्यंजकों के अंश के बजाय, 3D और 2D निर्देशांकों के बीच संबंधों की कई व्युत्पत्तियों को सरल बनाना संभव बनाता है।
यह भी देखें
- कैमरा शोधन
- संपार्श्विक समीकरण
- प्रवेश पुतली, वास्तविक कैमरे में वस्तु स्थान के संबंध में पिनहोल का समतुल्य स्थान।
- छात्र बाहर निकलें, वास्तविक कैमरे में इमेज प्लेन के संबंध में पिनहोल का समतुल्य स्थान।
- इब्न अल-हेथम
- पिनहोल कैमरा, इस आलेख में वर्णित गणितीय मॉडल का व्यावहारिक कार्यान्वयन।
- रेक्टिलाइनियर लेंस
संदर्भ
- ↑ Carlo Tomasi (2016-08-09). "एक साधारण कैमरा मॉडल" (PDF). cs.duke.edu. Retrieved 2021-02-18.
- ↑ Andrea Fusiello (2005-12-27). "ज्यामितीय कंप्यूटर विजन के तत्व". Homepages.inf.ed.ac.uk. Retrieved 2013-12-18.
ग्रन्थसूची
- David A. Forsyth and Jean Ponce (2003). Computer Vision, A Modern Approach. Prentice Hall. ISBN 0-12-379777-2.
- Richard Hartley and Andrew Zisserman (2003). Multiple View Geometry in computer vision. Cambridge University Press. ISBN 0-521-54051-8.
- Bernd Jähne (1997). Practical Handbook on Image Processing for Scientific Applications. CRC Press. ISBN 0-8493-8906-2.
- Linda G. Shapiro and George C. Stockman (2001). Computer Vision. Prentice Hall. ISBN 0-13-030796-3.
- Gang Xu and Zhengyou Zhang (1996). Epipolar geometry in Stereo, Motion and Object Recognition. Kluwer Academic Publishers. ISBN 0-7923-4199-6.