पिनहोल कैमरा मॉडल: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
 
(3 intermediate revisions by 3 users not shown)
Line 5: Line 5:


== ज्यामिति ==
== ज्यामिति ==
[[Image:Pinhole.svg|thumb|400px|right|पिनहोल कैमरे की ज्यामिति। नोट: एक्स<sub>1</sub>x<sub>2</sub>x<sub>3</sub> आकृति में समन्वय प्रणाली बाएं हाथ की है, यानी OZ अक्ष की दिशा उस प्रणाली के विपरीत है जिसका पाठक उपयोग कर सकता है।]]पिनहोल कैमरे की मैपिंग से संबंधित [[ज्यामिति]] को चित्र में दिखाया गया है। आकृति में निम्नलिखित मूल वस्तुएँ हैं:
[[Image:Pinhole.svg|thumb|400px|right|पिनहोल कैमरे की ज्यामिति। नोट: x<sub>1</sub>x<sub>2</sub>x<sub>3</sub> आकृति में समन्वय प्रणाली बाएं हाथ की है, अर्थात् OZ अक्ष की दिशा उस प्रणाली के विपरीत है, जिसका पाठक उपयोग कर सकता है।]]पिनहोल कैमरे की मैपिंग से संबंधित [[ज्यामिति]] को चित्र में दिखाया गया है। आकृति में निम्नलिखित मूल वस्तुएँ हैं:


* 3डी ऑर्थोगोनल कोऑर्डिनेट प्रणाली जिसका मूल O पर है। यह वह जगह भी है जहाँ कैमरा एपर्चर स्थित है। समन्वय प्रणाली के तीन अक्षों को X1, X2, X3 कहा जाता है। अक्ष X3 कैमरे की देखने की दिशा में संकेत कर रहा है और इसे [[ ऑप्टिकल अक्ष |ऑप्टिकल अक्ष]], प्रिंसिपल अक्ष, या प्रिंसिपल रे कहा जाता है। अक्ष X1 और X2 द्वारा फैला हुआ तल कैमरे के सामने की ओर है, या 'प्रिंसिपल तल' है।
* 3डी ऑर्थोगोनल कोऑर्डिनेट प्रणाली जिसका मूल O पर है। यह वह जगह भी है जहाँ कैमरा एपर्चर स्थित है। समन्वय प्रणाली के तीन अक्षों को X1, X2, X3 कहा जाता है। अक्ष X3 कैमरे की देखने की दिशा में संकेत कर रहा है और इसे [[ ऑप्टिकल अक्ष |ऑप्टिकल अक्ष]], प्रिंसिपल अक्ष, या प्रिंसिपल रे कहा जाता है। अक्ष X1 और X2 द्वारा फैला हुआ तल कैमरे के सामने की ओर है, या 'प्रिंसिपल तल' है।
Line 73: Line 73:
*{{cite book| author=[[Linda Shapiro|Linda G. Shapiro]] and George C. Stockman| title=Computer Vision| publisher=Prentice Hall| year=2001| isbn=0-13-030796-3}}
*{{cite book| author=[[Linda Shapiro|Linda G. Shapiro]] and George C. Stockman| title=Computer Vision| publisher=Prentice Hall| year=2001| isbn=0-13-030796-3}}
*{{cite book| author=Gang Xu and Zhengyou Zhang| title=Epipolar geometry in Stereo, Motion and Object Recognition| publisher=Kluwer Academic Publishers| year=1996| isbn=0-7923-4199-6| url = https://books.google.com/books?id=DnFaUidM-B0C&pg=PA7&dq=pinhole+intitle:%22Epipolar+geometry%22}}
*{{cite book| author=Gang Xu and Zhengyou Zhang| title=Epipolar geometry in Stereo, Motion and Object Recognition| publisher=Kluwer Academic Publishers| year=1996| isbn=0-7923-4199-6| url = https://books.google.com/books?id=DnFaUidM-B0C&pg=PA7&dq=pinhole+intitle:%22Epipolar+geometry%22}}
[[Category: कंप्यूटर दृष्टि में ज्यामिति]] [[Category: कैमरा]]


 
[[Category:Articles with hatnote templates targeting a nonexistent page]]
 
[[Category: Machine Translated Page]]
[[Category:Created On 08/06/2023]]
[[Category:Created On 08/06/2023]]
[[Category:Machine Translated Page]]
[[Category:Pages with script errors]]
[[Category:Templates Vigyan Ready]]
[[Category:कंप्यूटर दृष्टि में ज्यामिति]]
[[Category:कैमरा]]

Latest revision as of 09:54, 21 June 2023

पिनहोल कैमरा का आरेख।

पिनहोल कैमरा मॉडल त्रि-आयामी अंतरिक्ष में एक बिंदु के निर्देशांक और आदर्श पिनहोल कैमरा के छवि तल पर इसके 3 डी प्रोजेक्शन के बीच गणितीय संबंध का वर्णन करता है, जहां कैमरा एपर्चर को बिंदु के रूप में वर्णित किया गया है और प्रकाश को फोकस करने के लिए किसी लेंस का उपयोग नहीं किया जाता है। मॉडल में सम्मिलित नहीं है, उदाहरण के लिए, विरूपण (ऑप्टिक्स) या लेंस और परिमित आकार के एपर्चर के कारण अनफोकस्ड ऑब्जेक्ट्स का धुंधलापन। यह इस बात पर भी ध्यान नहीं देता है कि अधिकांश व्यावहारिक कैमरों में केवल असतत छवि निर्देशांक होते हैं। इसका अर्थ यह है कि पिनहोल कैमरा मॉडल का उपयोग केवल 3डी दृश्य से 2डी अंतरिक्ष छवि तक मैपिंग के प्रथम क्रम सन्निकटन के रूप में किया जा सकता है। इसकी वैधता कैमरे की गुणवत्ता पर निर्भर करती है और सामान्य तौर पर, लेंस विरूपण प्रभाव बढ़ने पर छवि के केंद्र से किनारों तक घट जाती है।

पिनहोल कैमरा मॉडल जिन प्रभावों को ध्यान में नहीं रखता है, उनमें से कुछ प्रभावों की भरपाई की जा सकती है, उदाहरण के लिए छवि निर्देशांक पर उपयुक्त समन्वय परिवर्तन प्रयुक्त करके; यदि उच्च गुणवत्ता वाले कैमरे का उपयोग किया जाता है, तो अन्य प्रभावों की उपेक्षा की जा सकती है। इसका अर्थ यह है कि पिनहोल कैमरा मॉडल को अधिकांशतः उचित विवरण के रूप में उपयोग किया जा सकता है कि कैसे कैमरा 3डी दृश्य को दर्शाता है, उदाहरण के लिए कंप्यूटर दृष्टि और कंप्यूटर ग्राफिक्स में।

ज्यामिति

पिनहोल कैमरे की ज्यामिति। नोट: x1x2x3 आकृति में समन्वय प्रणाली बाएं हाथ की है, अर्थात् OZ अक्ष की दिशा उस प्रणाली के विपरीत है, जिसका पाठक उपयोग कर सकता है।

पिनहोल कैमरे की मैपिंग से संबंधित ज्यामिति को चित्र में दिखाया गया है। आकृति में निम्नलिखित मूल वस्तुएँ हैं:

  • 3डी ऑर्थोगोनल कोऑर्डिनेट प्रणाली जिसका मूल O पर है। यह वह जगह भी है जहाँ कैमरा एपर्चर स्थित है। समन्वय प्रणाली के तीन अक्षों को X1, X2, X3 कहा जाता है। अक्ष X3 कैमरे की देखने की दिशा में संकेत कर रहा है और इसे ऑप्टिकल अक्ष, प्रिंसिपल अक्ष, या प्रिंसिपल रे कहा जाता है। अक्ष X1 और X2 द्वारा फैला हुआ तल कैमरे के सामने की ओर है, या 'प्रिंसिपल तल' है।
  • छवि तल, जहां कैमरे के एपर्चर के माध्यम से 3डी विश्व को प्रक्षेपित किया जाता है। छवि तल X1 और X2 अक्षों के समानांतर है और X3 अक्ष की नकारात्मक दिशा में उत्पत्ति O से दूरी पर स्थित है, जहां f पिनहोल कैमरे की फोकल लंबाई है। पिनहोल कैमरे के व्यावहारिक कार्यान्वयन का अर्थ है कि छवि तल इस तरह स्थित है कि यह X3 अक्ष को निर्देशांक -f पर प्रतिच्छेद करता है, जहां f> 0 है।
  • ऑप्टिकल अक्ष और छवि तल के प्रतिच्छेदन पर एक बिंदु R है। इस बिंदु को 'प्रमुख बिंदु' कहा जाता है[1] या छवि केंद्र कहा जाता है।
  • अक्ष X1, X2 और X3 के सापेक्ष समन्वय पर विश्व में कहीं बिंदु 'P' है।
  • कैमरे में बिंदु 'P' की प्रोजेक्शन लाइन। यह हरी रेखा है, जो बिंदु 'P' और बिंदु 'O' से होकर निकलती है।
  • छवि तल पर बिंदु 'P' का प्रक्षेपण, 'Q' को निरूपित करता है। यह बिंदु प्रक्षेपण रेखा (हरा) और छवि तल के प्रतिच्छेदन द्वारा दिया गया है। किसी भी व्यावहारिक स्थिति में हम यह मान सकते हैं कि > 0 जिसका अर्थ है कि प्रतिच्छेदन बिंदु अच्छी तरह से परिभाषित है।
  • छवि तल में 2डी कोऑर्डिनेट प्रणाली भी है, जिसका मूल R पर है और अक्ष Y1 और Y2 के साथ जो क्रमशः X1 और X2 के समानांतर हैं। इस निर्देशांक प्रणाली के सापेक्ष बिंदु Q के निर्देशांक हैं।

कैमरे का पिनहोल एपर्चर, जिसके माध्यम से सभी प्रोजेक्शन लाइनों को निकलना चाहिए, उनको मूल रूप से छोटा, बिंदु माना जाता है। साहित्य में 3डी अंतरिक्ष में इस बिंदु को ऑप्टिकल (या लेंस या कैमरा) केंद्र के रूप में जाना जाता है।[2]


सूत्रीकरण

इसके बाद हम यह समझना चाहते हैं कि बिंदु Q के निर्देशांक बिंदु P के निर्देशांक पर कैसे निर्भर करते हैं। यह निम्नलिखित चित्र की सहायता से किया जा सकता है, जो पिछले दृश्य के समान ही दिखाता है आंकड़ा लेकिन अब ऊपर से, X2 अक्ष की नकारात्मक दिशा में नीचे देख रहे हैं।

X2 अक्ष से देखे गए पिनहोल कैमरे की ज्यामिति

इस चित्र में हम दो समान त्रिभुज देखते हैं, दोनों में उनके कर्ण के रूप में प्रक्षेपण रेखा (हरा) के हिस्से हैं। बाएं त्रिकोण के कैथेटी और f हैं और समकोण दाएं त्रिकोण के कैथेटी और हैं। चूंकि दो त्रिकोण समान हैं, इसलिए यह इस प्रकार है:

या

एक समान जाँच, X1 अक्ष की ऋणात्मक दिशा में देखने से मिलती है:

या

इसे इस रूप में संक्षेपित किया जा सकता है:

जो व्यंजक है, जो 3डी निर्देशांकों के बीच संबंध का वर्णन करता है, बिंदु P और इसकी छवि निर्देशांक छवि तल में बिंदु Q द्वारा दिया गया।

घुमाई गई छवि और आभासी छवि का तल

पिनहोल कैमरा द्वारा वर्णित 3डी से 2डी निर्देशांकों की मैपिंग परिप्रेक्ष्य प्रक्षेपण है, जिसके बाद छवि तल में 180° घुमाव होता है। यह इस बात से मेल खाता है, कि वास्तविक पिनहोल कैमरा कैसे काम करता है; परिणामी छवि को 180° घुमाया जाता है और प्रक्षेपित वस्तुओं का सापेक्ष आकार फोकल बिंदु से उनकी दूरी पर निर्भर करता है और छवि का समग्र आकार छवि तल और फोकल बिंदु के बीच की दूरी f पर निर्भर करता है। बिना घुमाई गई छवि बनाने के लिए, जिसकी हम कैमरे से अपेक्षा करते हैं, उसकी दो संभावनाएँ हैं:

  • छवि तल में समन्वय प्रणाली को 180° (किसी भी दिशा में) घुमाएँ। इस तरह पिनहोल कैमरे के किसी भी व्यावहारिक कार्यान्वयन से समस्या का समाधान हो जाएगा; फोटोग्राफिक कैमरे के लिए हम छवि को देखने से पहले घुमाते हैं, और डिजिटल कैमरे के लिए हम पिक्सल को इस क्रम में पढ़ते हैं कि यह घूमता है।
  • छवि तल को रखें जिससे यह -f के अतिरिक्त X3 अक्ष को f पर प्रतिच्छेद करे और पिछली गणनाओं को पुनः करें। यह आभासी (या सामने) छवि विमान उत्पन्न करेगा, जिसे व्यवहार में प्रयुक्त नहीं किया जा सकता है, लेकिन सैद्धांतिक कैमरा प्रदान करता है ,जो वास्तविक की तुलना में विश्लेषण करना सरल हो सकता है।

दोनों ही स्थितियों में, 3डी निर्देशांक से 2डी छवि निर्देशांक तक परिणामी मानचित्रण उपरोक्त अभिव्यक्ति द्वारा दिया गया है, लेकिन बिना निषेध के, इस प्रकार


सजातीय निर्देशांक में

अंतरिक्ष में बिंदुओं के 3डी निर्देशांक से लेकर 2डी छवि निर्देशांक तक की मैपिंग को सजातीय निर्देशांक में भी प्रदर्शित किया जा सकता है। माना सजातीय निर्देशांक (4-आयामी सदिश) में 3डी बिंदु का प्रतिनिधित्व है, और को पिनहोल कैमरा (3-आयामी सदिश) में इस बिंदु की छवि का प्रतिनिधित्व करते हैं। तब निम्नलिखित संबंध धारण करता है;

जहाँ , कैमरा आव्यूह है और प्रक्षेप्य रिक्त स्थान के तत्वों के बीच समानता का अर्थ है। इसका तात्पर्य यह है कि बाएँ और दाएँ हाथ की भुजाएँ गैर-शून्य अदिश गुणन के बराबर हैं। इस संबंध का परिणाम यह भी है कि को प्रोजेक्टिव स्पेस के तत्व के रूप में भी देखा जा सकता है; दो कैमरा आव्यूह समतुल्य हैं, यदि वे स्केलर गुणन के बराबर हैं। पिनहोल कैमरा मैपिंग का यह विवरण, दो रैखिक अभिव्यक्तियों के अंश के अतिरिक्त रैखिक परिवर्तन के रूप में, 3डी और 2डी निर्देशांकों के बीच संबंधों के कई व्युत्पत्तियों को सरल बनाना संभव बनाता है।

यह भी देखें

संदर्भ

  1. Carlo Tomasi (2016-08-09). "एक साधारण कैमरा मॉडल" (PDF). cs.duke.edu. Retrieved 2021-02-18.
  2. Andrea Fusiello (2005-12-27). "ज्यामितीय कंप्यूटर विजन के तत्व". Homepages.inf.ed.ac.uk. Retrieved 2013-12-18.


ग्रन्थसूची