पिनहोल कैमरा मॉडल

From Vigyanwiki
पिनहोल कैमरा का आरेख।

पिनहोल कैमरा मॉडल त्रि-आयामी अंतरिक्ष में एक बिंदु के निर्देशांक और आदर्श पिनहोल कैमरा के छवि तल पर इसके 3 डी प्रोजेक्शन के बीच गणितीय संबंध का वर्णन करता है, जहां कैमरा एपर्चर को बिंदु के रूप में वर्णित किया गया है और प्रकाश को फोकस करने के लिए किसी लेंस का उपयोग नहीं किया जाता है। मॉडल में सम्मिलित नहीं है, उदाहरण के लिए, विरूपण (ऑप्टिक्स) या लेंस और परिमित आकार के एपर्चर के कारण अनफोकस्ड ऑब्जेक्ट्स का धुंधलापन। यह इस बात पर भी ध्यान नहीं देता है कि अधिकांश व्यावहारिक कैमरों में केवल असतत छवि निर्देशांक होते हैं। इसका अर्थ यह है कि पिनहोल कैमरा मॉडल का उपयोग केवल 3डी दृश्य से 2डी अंतरिक्ष छवि तक मैपिंग के प्रथम क्रम सन्निकटन के रूप में किया जा सकता है। इसकी वैधता कैमरे की गुणवत्ता पर निर्भर करती है और सामान्य तौर पर, लेंस विरूपण प्रभाव बढ़ने पर छवि के केंद्र से किनारों तक घट जाती है।

पिनहोल कैमरा मॉडल जिन प्रभावों को ध्यान में नहीं रखता है, उनमें से कुछ प्रभावों की भरपाई की जा सकती है, उदाहरण के लिए छवि निर्देशांक पर उपयुक्त समन्वय परिवर्तन प्रयुक्त करके; यदि उच्च गुणवत्ता वाले कैमरे का उपयोग किया जाता है, तो अन्य प्रभावों की उपेक्षा की जा सकती है। इसका अर्थ यह है कि पिनहोल कैमरा मॉडल को अधिकांशतः उचित विवरण के रूप में उपयोग किया जा सकता है कि कैसे कैमरा 3डी दृश्य को दर्शाता है, उदाहरण के लिए कंप्यूटर दृष्टि और कंप्यूटर ग्राफिक्स में।

ज्यामिति

पिनहोल कैमरे की ज्यामिति। नोट: x1x2x3 आकृति में समन्वय प्रणाली बाएं हाथ की है, अर्थात् OZ अक्ष की दिशा उस प्रणाली के विपरीत है, जिसका पाठक उपयोग कर सकता है।

पिनहोल कैमरे की मैपिंग से संबंधित ज्यामिति को चित्र में दिखाया गया है। आकृति में निम्नलिखित मूल वस्तुएँ हैं:

  • 3डी ऑर्थोगोनल कोऑर्डिनेट प्रणाली जिसका मूल O पर है। यह वह जगह भी है जहाँ कैमरा एपर्चर स्थित है। समन्वय प्रणाली के तीन अक्षों को X1, X2, X3 कहा जाता है। अक्ष X3 कैमरे की देखने की दिशा में संकेत कर रहा है और इसे ऑप्टिकल अक्ष, प्रिंसिपल अक्ष, या प्रिंसिपल रे कहा जाता है। अक्ष X1 और X2 द्वारा फैला हुआ तल कैमरे के सामने की ओर है, या 'प्रिंसिपल तल' है।
  • छवि तल, जहां कैमरे के एपर्चर के माध्यम से 3डी विश्व को प्रक्षेपित किया जाता है। छवि तल X1 और X2 अक्षों के समानांतर है और X3 अक्ष की नकारात्मक दिशा में उत्पत्ति O से दूरी पर स्थित है, जहां f पिनहोल कैमरे की फोकल लंबाई है। पिनहोल कैमरे के व्यावहारिक कार्यान्वयन का अर्थ है कि छवि तल इस तरह स्थित है कि यह X3 अक्ष को निर्देशांक -f पर प्रतिच्छेद करता है, जहां f> 0 है।
  • ऑप्टिकल अक्ष और छवि तल के प्रतिच्छेदन पर एक बिंदु R है। इस बिंदु को 'प्रमुख बिंदु' कहा जाता है[1] या छवि केंद्र कहा जाता है।
  • अक्ष X1, X2 और X3 के सापेक्ष समन्वय पर विश्व में कहीं बिंदु 'P' है।
  • कैमरे में बिंदु 'P' की प्रोजेक्शन लाइन। यह हरी रेखा है, जो बिंदु 'P' और बिंदु 'O' से होकर निकलती है।
  • छवि तल पर बिंदु 'P' का प्रक्षेपण, 'Q' को निरूपित करता है। यह बिंदु प्रक्षेपण रेखा (हरा) और छवि तल के प्रतिच्छेदन द्वारा दिया गया है। किसी भी व्यावहारिक स्थिति में हम यह मान सकते हैं कि > 0 जिसका अर्थ है कि प्रतिच्छेदन बिंदु अच्छी तरह से परिभाषित है।
  • छवि तल में 2डी कोऑर्डिनेट प्रणाली भी है, जिसका मूल R पर है और अक्ष Y1 और Y2 के साथ जो क्रमशः X1 और X2 के समानांतर हैं। इस निर्देशांक प्रणाली के सापेक्ष बिंदु Q के निर्देशांक हैं।

कैमरे का पिनहोल एपर्चर, जिसके माध्यम से सभी प्रोजेक्शन लाइनों को निकलना चाहिए, उनको मूल रूप से छोटा, बिंदु माना जाता है। साहित्य में 3डी अंतरिक्ष में इस बिंदु को ऑप्टिकल (या लेंस या कैमरा) केंद्र के रूप में जाना जाता है।[2]


सूत्रीकरण

इसके बाद हम यह समझना चाहते हैं कि बिंदु Q के निर्देशांक बिंदु P के निर्देशांक पर कैसे निर्भर करते हैं। यह निम्नलिखित चित्र की सहायता से किया जा सकता है, जो पिछले दृश्य के समान ही दिखाता है आंकड़ा लेकिन अब ऊपर से, X2 अक्ष की नकारात्मक दिशा में नीचे देख रहे हैं।

X2 अक्ष से देखे गए पिनहोल कैमरे की ज्यामिति

इस चित्र में हम दो समान त्रिभुज देखते हैं, दोनों में उनके कर्ण के रूप में प्रक्षेपण रेखा (हरा) के हिस्से हैं। बाएं त्रिकोण के कैथेटी और f हैं और समकोण दाएं त्रिकोण के कैथेटी और हैं। चूंकि दो त्रिकोण समान हैं, इसलिए यह इस प्रकार है:

या

एक समान जाँच, X1 अक्ष की ऋणात्मक दिशा में देखने से मिलती है:

या

इसे इस रूप में संक्षेपित किया जा सकता है:

जो व्यंजक है, जो 3डी निर्देशांकों के बीच संबंध का वर्णन करता है, बिंदु P और इसकी छवि निर्देशांक छवि तल में बिंदु Q द्वारा दिया गया।

घुमाई गई छवि और आभासी छवि का तल

पिनहोल कैमरा द्वारा वर्णित 3डी से 2डी निर्देशांकों की मैपिंग परिप्रेक्ष्य प्रक्षेपण है, जिसके बाद छवि तल में 180° घुमाव होता है। यह इस बात से मेल खाता है, कि वास्तविक पिनहोल कैमरा कैसे काम करता है; परिणामी छवि को 180° घुमाया जाता है और प्रक्षेपित वस्तुओं का सापेक्ष आकार फोकल बिंदु से उनकी दूरी पर निर्भर करता है और छवि का समग्र आकार छवि तल और फोकल बिंदु के बीच की दूरी f पर निर्भर करता है। बिना घुमाई गई छवि बनाने के लिए, जिसकी हम कैमरे से अपेक्षा करते हैं, उसकी दो संभावनाएँ हैं:

  • छवि तल में समन्वय प्रणाली को 180° (किसी भी दिशा में) घुमाएँ। इस तरह पिनहोल कैमरे के किसी भी व्यावहारिक कार्यान्वयन से समस्या का समाधान हो जाएगा; फोटोग्राफिक कैमरे के लिए हम छवि को देखने से पहले घुमाते हैं, और डिजिटल कैमरे के लिए हम पिक्सल को इस क्रम में पढ़ते हैं कि यह घूमता है।
  • छवि तल को रखें जिससे यह -f के अतिरिक्त X3 अक्ष को f पर प्रतिच्छेद करे और पिछली गणनाओं को पुनः करें। यह आभासी (या सामने) छवि विमान उत्पन्न करेगा, जिसे व्यवहार में प्रयुक्त नहीं किया जा सकता है, लेकिन सैद्धांतिक कैमरा प्रदान करता है ,जो वास्तविक की तुलना में विश्लेषण करना सरल हो सकता है।

दोनों ही स्थितियों में, 3डी निर्देशांक से 2डी छवि निर्देशांक तक परिणामी मानचित्रण उपरोक्त अभिव्यक्ति द्वारा दिया गया है, लेकिन बिना निषेध के, इस प्रकार


सजातीय निर्देशांक में

अंतरिक्ष में बिंदुओं के 3डी निर्देशांक से लेकर 2डी छवि निर्देशांक तक की मैपिंग को सजातीय निर्देशांक में भी प्रदर्शित किया जा सकता है। माना सजातीय निर्देशांक (4-आयामी सदिश) में 3डी बिंदु का प्रतिनिधित्व है, और को पिनहोल कैमरा (3-आयामी सदिश) में इस बिंदु की छवि का प्रतिनिधित्व करते हैं। तब निम्नलिखित संबंध धारण करता है;

जहाँ , कैमरा आव्यूह है और प्रक्षेप्य रिक्त स्थान के तत्वों के बीच समानता का अर्थ है। इसका तात्पर्य यह है कि बाएँ और दाएँ हाथ की भुजाएँ गैर-शून्य अदिश गुणन के बराबर हैं। इस संबंध का परिणाम यह भी है कि को प्रोजेक्टिव स्पेस के तत्व के रूप में भी देखा जा सकता है; दो कैमरा आव्यूह समतुल्य हैं, यदि वे स्केलर गुणन के बराबर हैं। पिनहोल कैमरा मैपिंग का यह विवरण, दो रैखिक अभिव्यक्तियों के अंश के अतिरिक्त रैखिक परिवर्तन के रूप में, 3डी और 2डी निर्देशांकों के बीच संबंधों के कई व्युत्पत्तियों को सरल बनाना संभव बनाता है।

यह भी देखें

संदर्भ

  1. Carlo Tomasi (2016-08-09). "एक साधारण कैमरा मॉडल" (PDF). cs.duke.edu. Retrieved 2021-02-18.
  2. Andrea Fusiello (2005-12-27). "ज्यामितीय कंप्यूटर विजन के तत्व". Homepages.inf.ed.ac.uk. Retrieved 2013-12-18.


ग्रन्थसूची