एपिपोलर ज्यामिति: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 1: Line 1:
{{short description|Geometry of stereo vision}}
{{short description|Geometry of stereo vision}}
{{broader|Computer stereo vision}}
{{broader|कंप्यूटर स्टीरियो विजन}}
[[File:Aufnahme mit zwei Kameras.svg|thumb |right|250px|एपिपोलर ज्योमेट्री के लिए विशिष्ट उपयोग मामला<br /><small>Two cameras take a picture of the same scene from different points of view. The epipolar geometry then describes the relation between the two resulting views.</small>]]एपिपोलर ज्योमेट्री स्टीरियो विजन # कंप्यूटर स्टीरियो विजन की ज्योमेट्री है। जब दो कैमरे दो अलग-अलग स्थितियों से एक 3डी दृश्य देखते हैं, तो 3डी बिंदुओं और 2डी छवियों पर उनके अनुमानों के बीच कई ज्यामितीय संबंध होते हैं जो छवि बिंदुओं के बीच बाधाओं का कारण बनते हैं। ये संबंध इस धारणा के आधार पर निकाले गए हैं कि कैमरों को [[पिनहोल कैमरा मॉडल]] द्वारा अनुमानित किया जा सकता है।
[[File:Aufnahme mit zwei Kameras.svg|thumb |right|250px|एपिपोलर ज्यामिती के लिए विशिष्ट उपयोग मामला<br /><small>Two cameras take a picture of the same scene from different points of view. The एपिपोलर geometry then describes the relation between the two resulting views.</small>]]'''एपिपोलर ज्यामिती स्टीरियो विजन''' कंप्यूटर स्टीरियो विजन की ज्यामिती है। जब दो कैमरे दो अलग-अलग स्थितियों से 3डी दृश्य को देखते हैं, तो 3डी बिंदुओं और 2डी प्रतिबिम्बों पर उनके अनुमानों के बीच कई ज्यामितीय संबंध होते हैं जो प्रतिबिंब बिंदुओं के बीच बाधाओं का कारण बनते हैं। ये संबंध इस धारणा के आधार पर निकाले गए हैं कि कैमरों को [[पिनहोल कैमरा मॉडल|पिनहोल कैमरा प्रारूप]] द्वारा अनुमानित किया जा सकता है।


== परिभाषाएँ ==
== परिभाषाएँ ==
#Epipolar बाधा और त्रिकोणासन दो पिनहोल कैमरों को बिंदु X पर देखते हुए दर्शाता है। वास्तविक कैमरों में, छवि तल वास्तव में फोकल केंद्र के पीछे होता है, और एक ऐसी छवि बनाता है जो लेंस के फोकल केंद्र के बारे में सममित होती है। यहाँ, हालाँकि, समरूपता द्वारा परिवर्तित नहीं की गई छवि का निर्माण करने के लिए फोकल सेंटर यानी प्रत्येक कैमरा लेंस के [[ऑप्टिकल केंद्र]] के सामने एक 'वर्चुअल इमेज प्लेन' रखकर समस्या को सरल बनाया गया है। हे<sub>L</sub> और <sub>R</sub> दो कैमरों के लेंसों के समरूपता के केंद्रों का प्रतिनिधित्व करते हैं। X दोनों कैमरों में रुचि के बिंदु का प्रतिनिधित्व करता है। अंक एक्स<sub>L</sub> और एक्स<sub>R</sub> छवि विमानों पर बिंदु X के अनुमान हैं।
#एपिपोलर बाधा और त्रिकोणासन दो पिनहोल कैमरों को बिंदु X पर देखते हुए दर्शाया जाता है। वास्तविक कैमरों में, प्रतिबिंब तल वास्तव में फोकल केंद्र के पीछे होता है, और इसी प्रकार प्रतिबिंब बनाता है जो लेंस के फोकल केंद्र के बारे में सममित होती है। चूंकि यहाँ पर समरूपता द्वारा परिवर्तित नहीं किए गए प्रतिबिंब का निर्माण करने के लिए फोकल सेंटर अर्ताथ प्रत्येक कैमरा लेंस के [[ऑप्टिकल केंद्र]] के सामने 'वर्चुअल इमेज प्लेन' रखकर समस्या को सरल बनाया गया है। H<sub>L</sub> और O<sub>R</sub> दो कैमरों के लेंसों के समरूपता के केंद्रों का प्रतिनिधित्व करते हैं। X दोनों कैमरों में रुचि के बिंदु का प्रतिनिधित्व करता है। अंक X<sub>L</sub> और X<sub>R</sub> प्रतिबिंब तलों पर बिंदु X का अनुमान हैं।


[[File:Epipolar geometry.svg|thumb|right|372x372px|एपिपोलर ज्यामिति]]प्रत्येक कैमरा 3D दुनिया की 2D छवि कैप्चर करता है। 3डी से 2डी में इस रूपांतरण को [[परिप्रेक्ष्य प्रक्षेपण]] के रूप में संदर्भित किया जाता है और इसे पिनहोल कैमरा मॉडल द्वारा वर्णित किया जाता है। इस प्रोजेक्शन ऑपरेशन को कैमरे से निकलने वाली किरणों द्वारा, इसके फोकल सेंटर से गुजरते हुए मॉडल करना आम है। प्रत्येक निकलने वाली किरण छवि में एक बिंदु से मेल खाती है।
[[File:Epipolar geometry.svg|thumb|right|372x372px|एपिपोलर ज्यामिति]]प्रत्येक कैमरा 3D दुनिया की 2D प्रतिबिंब कैप्चर करता है। 3डी से 2डी में इस रूपांतरण को [[परिप्रेक्ष्य प्रक्षेपण]] के रूप में संदर्भित किया जाता है और इसे पिनहोल कैमरे के प्रारूप द्वारा वर्णित किया जाता है। इस प्रोजेक्शन ऑपरेशन को कैमरे से निकलने वाली किरणों द्वारा, इसके फोकल सेंटर से गुजरते हुए प्रारूप करना सरल होता हैं। प्रत्येक निकलने वाली किरण प्रतिबिंब में एक बिंदु से मेल खाती है।


=== एपिपोल या एपिपोलर पॉइंट ===
=== एपिपोल या एपिपोलर पॉइंट ===
चूंकि कैमरों के लेंस के ऑप्टिकल केंद्र अलग-अलग होते हैं, इसलिए प्रत्येक केंद्र दूसरे कैमरे के छवि तल में एक अलग बिंदु पर प्रोजेक्ट करता है। इन दो छवि बिंदुओं को ई द्वारा दर्शाया गया है<sub>L</sub> और <sub>R</sub>, एरी कॉलिट एपिपोलरिस या एपिपोलर पॉइंट। सतही वासना 'एन'<sub>L</sub> और <sub>R</sub> उनके संबंधित छवियों के विमानों और दोनों ऑप्टिकल केंद्र ओ में<sub>L</sub> और <sub>R</sub> एक 3डी लाइन पर लेट जाएं।
चूंकि कैमरों के लेंस के ऑप्टिकल केंद्र अलग-अलग होते हैं, इसलिए प्रत्येक केंद्र दूसरे कैमरे के प्रतिबिंब तल में अलग बिंदु पर प्रोजेक्ट करता है। इन दो प्रतिबिंब बिंदुओं को E<sub>L</sub> और E<sub>R</sub> एरी कॉलिट एपिपोलरिस या एपिपोलर पॉइंट द्वारा दर्शाया गया है। सतही मान के लिए 'N'<sub>L</sub> और E<sub>R</sub> उनके संबंधित प्रतिबिम्बों के विमानों और दोनों ऑप्टिकल केंद्र O I<sub>L</sub> और O<sub>R</sub> 3डी लाइन पर व्याप्त हो जाते हैं।


=== बिट ध्रुवीय ===
=== बिट ध्रुवीय ===
ओह लिटिल ओ<sub>L</sub>–X को बाएं कैमरे द्वारा एक बिंदु के रूप में देखा जाता है क्योंकि यह सीधे उस कैमरे के लेंस ऑप्टिकल केंद्र के अनुरूप होता है। हालाँकि, दायाँ कैमरा इस रेखा को अपने छवि तल में एक रेखा के रूप में देखता है। वह रेखा (<sub>R</sub>-एक्स<sub>R</sub>) दाहिने कैमरे में एक एपिपोलर लाइन कहा जाता है। सममित रूप से, रेखा ''<sub>R</sub>–X को दाहिने कैमरे द्वारा एक बिंदु के रूप में देखा जाता है और इसे एपिपोलर लाइन e के रूप में देखा जाता है<sub>L</sub>-एक्स<sub>L</sub>बाएं कैमरे द्वारा।
O<sub>L</sub>–X को बाएं कैमरे द्वारा एक बिंदु के रूप में देखा जाता है क्योंकि यह सीधे उस कैमरे के लेंस ऑप्टिकल केंद्र के अनुरूप होता है। चूंकि, दायाँ कैमरा इस रेखा को अपने प्रतिबिंब तल में रेखा के रूप में देखता है। वह रेखा (E<sub>R</sub>-X<sub>R</sub>) दाहिने कैमरे में एपिपोलर लाइन कहा जाता है। सममित रूप से, रेखा 'O'<sub>R</sub>–X को दाहिने कैमरे द्वारा बिंदु के रूप में देखा जाता है और इसे एपिपोलर लाइन e<sub>L</sub>-X<sub>L</sub>बाएं कैमरे द्वारा के रूप में देखा जाता है।


एक एपिपोलर लाइन 3डी स्पेस में बिंदु एक्स की स्थिति का एक कार्य है, यानी जैसे एक्स बदलता है, दोनों छवियों में एपिपोलर लाइनों का एक सेट उत्पन्न होता है। 3डी लाइन के बाद से
एपिपोलर लाइन 3डी स्पेस में बिंदु X की स्थिति का कार्य करती है, अर्ताथ जैसे X परिवर्तित होता हैं, दोनों प्रतिबिम्बों में एपिपोलर लाइनों का सेट उत्पन्न होता है। 3डी लाइन के बाद से H<sub>L</sub>-X लेंस O<sub>L</sub> के ऑप्टिकल केंद्र से होकर गुजरता है, इस प्रकार सही प्रतिबिंब में संबंधित एपिपोलर लाइन एपिपोल E<sub>R</sub> से होकर गुजरनी चाहिए (और तदनुसार बाईं प्रतिबिंब में एपिपोलर लाइनों के लिए किया जाता हैं)। किसी प्रतिबिंब में सभी एपिपोलर लाइन्स में उस इमेज का एपिपोलर पॉइंट होता है। वास्तव में कोई भी रेखा जिसमें अधिध्रुवीय बिंदु होता है, जिस पर अधिध्रुवीय रेखा होती है क्योंकि इसे किसी 3D बिंदु X से प्राप्त किया जा सकता है।
हे<sub>L</sub>-X लेंस O के ऑप्टिकल केंद्र से होकर गुजरता है<sub>L</sub>, सही छवि में संबंधित एपिपोलर लाइन एपिपोल ई से होकर गुजरनी चाहिए<sub>R</sub> (और तदनुसार बाईं छवि में एपिपोलर लाइनों के लिए)। एक छवि में सभी एपिपोलर लाइन्स में उस इमेज का एपिपोलर पॉइंट होता है। वास्तव में, कोई भी रेखा जिसमें अधिध्रुवीय बिंदु होता है, एक अधिध्रुवीय रेखा होती है क्योंकि इसे किसी 3D बिंदु X से प्राप्त किया जा सकता है।


=== एपिपोलर प्लेन ===
=== एपिपोलर प्लेन ===
एक वैकल्पिक विज़ुअलाइज़ेशन के रूप में, बिंदुओं X, O पर विचार करें<sub>L</sub> और <sub>R</sub> जो एक तल बनाती है जिसे अधिध्रुवीय तल कहते हैं। एपिपोलर प्लेन प्रत्येक कैमरे के इमेज प्लेन को काटता है जहाँ यह रेखाएँ बनाता है - एपिपोलर लाइन्स। सभी एपिपोलर प्लेन और एपिपोलर लाइनें एपिपोल को काटती हैं, भले ही 'X' स्थित हो।
एक वैकल्पिक विज़ुअलाइज़ेशन के रूप में बिंदुओं X, O<sub>L</sub> और O<sub>R</sub> पर विचार करें जो एक तल बनाती है जिसे अधिध्रुवीय तल कहते हैं। एपिपोलर प्लेन प्रत्येक कैमरे के इमेज प्लेन को काटता है जहाँ यह रेखाएँ बनाता है जिसे एपिपोलर लाइन्स के द्वारा व्यक्त करते हैं। सभी एपिपोलर प्लेन और एपिपोलर लाइनें एपिपोल को काटती हैं, भले ही 'X' पूर्ण रूप से संलग्न हों।


== एपिपोलर बाधा और त्रिभुज ==
== एपिपोलर बाधा और त्रिभुज ==
यदि दो कैमरों की सापेक्ष स्थिति ज्ञात है, तो इससे दो महत्वपूर्ण प्रेक्षण प्राप्त होते हैं:
यदि दो कैमरों की सापेक्ष स्थिति ज्ञात है, तो इससे दो महत्वपूर्ण प्रेक्षण प्राप्त होते हैं:


* प्रक्षेपण बिंदु x मान लें<sub>L</sub> जाना जाता है, और एपिपोलर लाइन <sub>R</sub>-एक्स<sub>R</sub> ज्ञात है और बिंदु X सही छवि में, बिंदु x पर प्रोजेक्ट करता है<sub>R</sub> जो इस विशेष एपिपोलर लाइन पर होना चाहिए। इसका मतलब यह है कि एक छवि में देखे गए प्रत्येक बिंदु के लिए एक ही बिंदु को दूसरी छवि में एक ज्ञात एपिपोलर लाइन पर देखा जाना चाहिए। यह एक एपिपोलर बाधा प्रदान करता है: दाएं कैमरे के विमान 'एक्स' पर एक्स का प्रक्षेपण<sub>R</sub> ई में निहित होना चाहिए<sub>R</sub>-एक्स<sub>R</sub> एपिपोलर लाइन। सभी बिंदु एक्स उदा। एक्स<sub>1</sub>, एक्स<sub>2</sub>, एक्स<sub>3</sub> ओ पर<sub>L</sub>-एक्स<sub>L</sub> लाइन उस बाधा को सत्यापित करेगी। इसका मतलब है कि यह परीक्षण करना संभव है कि क्या दो बिंदु एक ही 3D बिंदु पर पत्राचार समस्या है। दो कैमरों के बीच [[आवश्यक मैट्रिक्स]] या [[मौलिक मैट्रिक्स (कंप्यूटर दृष्टि)]] द्वारा एपिपोलर बाधाओं का भी वर्णन किया जा सकता है।
* प्रक्षेपण बिंदु x<sub>L</sub> मान लें जाना जाता है, और एपिपोलर लाइन E<sub>R</sub>-X<sub>R</sub> ज्ञात है और बिंदु X सही प्रतिबिंब में, बिंदु x<sub>R</sub> पर प्रोजेक्ट करता है जो इस विशेष एपिपोलर लाइन पर होना चाहिए। इसका तात्पर्य यह है कि प्रतिबिंब में देखे गए प्रत्येक बिंदु के लिए किसी बिंदु को दूसरी प्रतिबिंब में ज्ञात एपिपोलर लाइन पर देखा जाना चाहिए। यह एपिपोलर बाधा प्रदान करता है: दाएं कैमरे के विमान X' पर X<sub>R</sub> का प्रक्षेपण E<sub>R</sub>-X<sub>R</sub> एपिपोलर लाइन में निहित होना आवश्यक होता हैं। सभी बिंदु के लिए X, X<sub>1</sub>, X<sub>2</sub>, X<sub>3</sub> O<sub>L</sub>-X<sub>L</sub> पर लाइन उस बाधा को सत्यापित करती हैं। इसका तात्पर्य है कि यह परीक्षण करना संभव है कि क्या दो बिंदु एक ही 3D बिंदु पर पत्राचार की समस्या के कारण होता हैं। दो कैमरों के बीच [[आवश्यक मैट्रिक्स|आवश्यक आव्यूह]] या [[मौलिक मैट्रिक्स (कंप्यूटर दृष्टि)|मौलिक आव्यूह (कंप्यूटर दृष्टि)]] द्वारा एपिपोलर बाधाओं का भी वर्णन किया जा सकता है।
* यदि अंक x<sub>L</sub> और एक्स<sub>R</sub> ज्ञात हैं, उनकी प्रक्षेपण रेखाएँ भी ज्ञात हैं। यदि दो छवि बिंदु एक ही 3D बिंदु X के अनुरूप हैं, तो प्रक्षेपण रेखाओं को X पर सटीक रूप से प्रतिच्छेद करना चाहिए। इसका मतलब है कि X की गणना दो छवि बिंदुओं के निर्देशांक से की जा सकती है, एक प्रक्रिया जिसे ''त्रिकोण (कंप्यूटर दृष्टि)'' कहा जाता है।
* यदि अंक x<sub>L</sub> और X<sub>R</sub> ज्ञात हैं, उनकी प्रक्षेपण रेखाएँ भी ज्ञात रहती हैं। यदि दो प्रतिबिंब बिंदु एक ही 3D बिंदु X के अनुरूप होते हैं, तो प्रक्षेपण रेखाओं को X पर मुख्य रूप से प्रतिच्छेद करना आवश्यक होता हैं। इसका तात्पर्य है कि X की गणना दो प्रतिबिंब बिंदुओं के निर्देशांक से की जा सकती है, इस प्रक्रिया को ''त्रिकोण (कंप्यूटर दृष्टि)'' कहा जाता है।


== सरलीकृत मामले ==
== सरलीकृत स्थिति ==
यदि दो कैमरा इमेज प्लेन मेल खाते हैं तो एपिपोलर ज्योमेट्री सरल हो जाती है। इस मामले में, एपिपोलर लाइनें भी मेल खाती हैं (<sub>L</sub>-एक्स<sub>L</sub> = और<sub>R</sub>-एक्स<sub>R</sub>). इसके अलावा, एपिपोलर लाइनें ओ लाइन के समानांतर हैं<sub>L</sub>-<sub>R</sub> प्रक्षेपण के केंद्रों के बीच, और व्यवहार में दो छवियों के क्षैतिज अक्षों के साथ संरेखित किया जा सकता है। इसका मतलब यह है कि एक छवि में प्रत्येक बिंदु के लिए, दूसरी छवि में इसके संबंधित बिंदु को केवल एक क्षैतिज रेखा के साथ देखकर पाया जा सकता है। अगर कैमरों को इस तरह से नहीं रखा जा सकता है, तो कैमरों से छवि निर्देशांक को एक सामान्य छवि विमान के अनुकरण के लिए रूपांतरित किया जा सकता है। इस प्रक्रिया को [[छवि सुधार]] कहा जाता है।
यदि दो कैमरा इमेज प्लेन मेल खाते हैं तो एपिपोलर ज्यामिती सरल हो जाती है। इस स्थिति में, एपिपोलर लाइनें (E<sub>L</sub>-X<sub>L</sub> = O<sub>R</sub>-X<sub>R</sub>) भी मेल खाती हैं। इसके अतिरिक्त, एपिपोलर लाइनें O<sub>L</sub>-O<sub>R</sub> लाइन के समानांतर हैं, इसे प्रक्षेपण के केंद्रों के बीच और व्यवहारिक रूप से दो प्रतिबिम्बों के क्षैतिज अक्षों के साथ संरेखित किया जाता है। इसका तात्पर्य यह है कि किसी प्रतिबिंब में प्रत्येक बिंदु के लिए, दूसरी प्रतिबिंब में इसके संबंधित बिंदु को केवल क्षैतिज रेखाओं के साथ पाया जाता हैं। यदि कैमरों को इस प्रकार से नहीं रखा जाता है, तो कैमरों से प्रतिबिंब निर्देशांक को सामान्य प्रतिबिंब तल के अनुकरण के लिए रूपांतरित किया जा सकता है। इस प्रक्रिया को [[छवि सुधार|प्रतिबिंब सुधार]] कहा जाता है।


== पुशब्रूम सेंसर की एपिपोलर ज्योमेट्री ==
== पुशब्रूम सेंसर की एपिपोलर ज्यामिती ==
पारंपरिक फ्रेम कैमरे के विपरीत, जो एक द्वि-आयामी सीसीडी का उपयोग करता है, [[ पुश झाड़ू स्कैनर ]] लंबी निरंतर छवि पट्टी बनाने के लिए एक-आयामी सीसीडी की एक सरणी को अपनाता है जिसे छवि कालीन कहा जाता है। इस सेंसर की एपिपोलर ज्योमेट्री पिनहोल प्रोजेक्शन कैमरों से काफी अलग है। सबसे पहले, पुशब्रूम सेंसर की एपिपोलर लाइन सीधी नहीं है, लेकिन हाइपरबोला जैसी वक्र है। दूसरा, एपिपोलर 'वक्र' जोड़ी मौजूद नहीं है।<ref>Jaehong Oh. [http://etd.ohiolink.edu/view.cgi?acc_num=osu1306250594 "Novel Approach to Epipolar Resampling of HRSI and Satellite Stereo Imagery-based Georeferencing of Aerial Images"] {{Webarchive|url=https://web.archive.org/web/20120331123047/http://etd.ohiolink.edu/view.cgi?acc_num=osu1306250594 |date=2012-03-31 }}, 2011, accessed 2011-08-05.</ref> हालाँकि, कुछ विशेष परिस्थितियों में, उपग्रह चित्रों की एपिपोलर ज्यामिति को एक रेखीय मॉडल के रूप में माना जा सकता है।<ref> Nurollah Tatar and Hossein Arefi. [https://doi.org/10.1080/01431161.2019.1624862 "Stereo rectification of pushbroom satellite images by robustly estimating the fundamental matrix"], 2019, pp. 1–19 accessed 2019-06-03.</ref>
पारंपरिक फ्रेम कैमरे के विपरीत, द्वि-आयामी सीसीडी का उपयोग करता है, जिसे [[ पुश झाड़ू स्कैनर |पुश स्कैनर]] लंबी निरंतर प्रतिबिंब पट्टी बनाने के लिए एक-आयामी सीसीडी की सारणी को अपनाता है जिसे प्रतिबिंब काल कहा जाता है। इस सेंसर की एपिपोलर ज्यामिती पिनहोल प्रोजेक्शन कैमरों से अधिक अलग होते हैं। सबसे पहले पुशब्रूम सेंसर की एपिपोलर लाइन सीधी नहीं होती हैं, लेकिन हाइपरबोला जैसी वक्र सम्मिलित होते हैं। इसके लिए दूसरा, एपिपोलर 'वक्र' जोड़ी सम्मिलित नहीं होता हैं।<ref>Jaehong Oh. [http://etd.ohiolink.edu/view.cgi?acc_num=osu1306250594 "Novel Approach to Epipolar Resampling of HRSI and Satellite Stereo Imagery-based Georeferencing of Aerial Images"] {{Webarchive|url=https://web.archive.org/web/20120331123047/http://etd.ohiolink.edu/view.cgi?acc_num=osu1306250594 |date=2012-03-31 }}, 2011, accessed 2011-08-05.</ref> चूंकि, कुछ विशेष परिस्थितियों में, उपग्रह चित्रों की एपिपोलर ज्यामिति को रेखीय प्रारूप के रूप में माना जा सकता है।<ref> Nurollah Tatar and Hossein Arefi. [https://doi.org/10.1080/01431161.2019.1624862 "Stereo rectification of pushbroom satellite images by robustly estimating the fundamental matrix"], 2019, pp. 1–19 accessed 2019-06-03.</ref>
== यह भी देखें ==
== यह भी देखें ==
* [[3 डी पुनर्निर्माण]]
* [[3 डी पुनर्निर्माण]]
* [[कई छवियों से 3डी पुनर्निर्माण]]
* [[कई छवियों से 3डी पुनर्निर्माण|कई प्रतिबिम्बों से 3डी पुनर्निर्माण]]
* [[3डी स्कैनर]]
* [[3डी स्कैनर]]
* [[दूरबीन असमानता]]
* [[दूरबीन असमानता]]
* [[संपार्श्विक समीकरण]]
* [[संपार्श्विक समीकरण]]
* [[फोटोग्रामेट्री]]
* [[फोटोग्रामेट्री]]
* आवश्यक मैट्रिक्स, Fundamental_matrix_(कंप्यूटर_विजन)
* आवश्यक आव्यूह, प्राथमिक आव्यूह
* [[ट्राइफोकल टेंसर]]
* [[ट्राइफोकल टेंसर]]



Revision as of 22:15, 23 March 2023

एपिपोलर ज्यामिती के लिए विशिष्ट उपयोग मामला
Two cameras take a picture of the same scene from different points of view. The एपिपोलर geometry then describes the relation between the two resulting views.

एपिपोलर ज्यामिती स्टीरियो विजन कंप्यूटर स्टीरियो विजन की ज्यामिती है। जब दो कैमरे दो अलग-अलग स्थितियों से 3डी दृश्य को देखते हैं, तो 3डी बिंदुओं और 2डी प्रतिबिम्बों पर उनके अनुमानों के बीच कई ज्यामितीय संबंध होते हैं जो प्रतिबिंब बिंदुओं के बीच बाधाओं का कारण बनते हैं। ये संबंध इस धारणा के आधार पर निकाले गए हैं कि कैमरों को पिनहोल कैमरा प्रारूप द्वारा अनुमानित किया जा सकता है।

परिभाषाएँ

  1. एपिपोलर बाधा और त्रिकोणासन दो पिनहोल कैमरों को बिंदु X पर देखते हुए दर्शाया जाता है। वास्तविक कैमरों में, प्रतिबिंब तल वास्तव में फोकल केंद्र के पीछे होता है, और इसी प्रकार प्रतिबिंब बनाता है जो लेंस के फोकल केंद्र के बारे में सममित होती है। चूंकि यहाँ पर समरूपता द्वारा परिवर्तित नहीं किए गए प्रतिबिंब का निर्माण करने के लिए फोकल सेंटर अर्ताथ प्रत्येक कैमरा लेंस के ऑप्टिकल केंद्र के सामने 'वर्चुअल इमेज प्लेन' रखकर समस्या को सरल बनाया गया है। HL और OR दो कैमरों के लेंसों के समरूपता के केंद्रों का प्रतिनिधित्व करते हैं। X दोनों कैमरों में रुचि के बिंदु का प्रतिनिधित्व करता है। अंक XL और XR प्रतिबिंब तलों पर बिंदु X का अनुमान हैं।
एपिपोलर ज्यामिति

प्रत्येक कैमरा 3D दुनिया की 2D प्रतिबिंब कैप्चर करता है। 3डी से 2डी में इस रूपांतरण को परिप्रेक्ष्य प्रक्षेपण के रूप में संदर्भित किया जाता है और इसे पिनहोल कैमरे के प्रारूप द्वारा वर्णित किया जाता है। इस प्रोजेक्शन ऑपरेशन को कैमरे से निकलने वाली किरणों द्वारा, इसके फोकल सेंटर से गुजरते हुए प्रारूप करना सरल होता हैं। प्रत्येक निकलने वाली किरण प्रतिबिंब में एक बिंदु से मेल खाती है।

एपिपोल या एपिपोलर पॉइंट

चूंकि कैमरों के लेंस के ऑप्टिकल केंद्र अलग-अलग होते हैं, इसलिए प्रत्येक केंद्र दूसरे कैमरे के प्रतिबिंब तल में अलग बिंदु पर प्रोजेक्ट करता है। इन दो प्रतिबिंब बिंदुओं को EL और ER एरी कॉलिट एपिपोलरिस या एपिपोलर पॉइंट द्वारा दर्शाया गया है। सतही मान के लिए 'N'L और ER उनके संबंधित प्रतिबिम्बों के विमानों और दोनों ऑप्टिकल केंद्र O IL और OR 3डी लाइन पर व्याप्त हो जाते हैं।

बिट ध्रुवीय

OL–X को बाएं कैमरे द्वारा एक बिंदु के रूप में देखा जाता है क्योंकि यह सीधे उस कैमरे के लेंस ऑप्टिकल केंद्र के अनुरूप होता है। चूंकि, दायाँ कैमरा इस रेखा को अपने प्रतिबिंब तल में रेखा के रूप में देखता है। वह रेखा (ER-XR) दाहिने कैमरे में एपिपोलर लाइन कहा जाता है। सममित रूप से, रेखा 'O'R–X को दाहिने कैमरे द्वारा बिंदु के रूप में देखा जाता है और इसे एपिपोलर लाइन eL-XLबाएं कैमरे द्वारा के रूप में देखा जाता है।

एपिपोलर लाइन 3डी स्पेस में बिंदु X की स्थिति का कार्य करती है, अर्ताथ जैसे X परिवर्तित होता हैं, दोनों प्रतिबिम्बों में एपिपोलर लाइनों का सेट उत्पन्न होता है। 3डी लाइन के बाद से HL-X लेंस OL के ऑप्टिकल केंद्र से होकर गुजरता है, इस प्रकार सही प्रतिबिंब में संबंधित एपिपोलर लाइन एपिपोल ER से होकर गुजरनी चाहिए (और तदनुसार बाईं प्रतिबिंब में एपिपोलर लाइनों के लिए किया जाता हैं)। किसी प्रतिबिंब में सभी एपिपोलर लाइन्स में उस इमेज का एपिपोलर पॉइंट होता है। वास्तव में कोई भी रेखा जिसमें अधिध्रुवीय बिंदु होता है, जिस पर अधिध्रुवीय रेखा होती है क्योंकि इसे किसी 3D बिंदु X से प्राप्त किया जा सकता है।

एपिपोलर प्लेन

एक वैकल्पिक विज़ुअलाइज़ेशन के रूप में बिंदुओं X, OL और OR पर विचार करें जो एक तल बनाती है जिसे अधिध्रुवीय तल कहते हैं। एपिपोलर प्लेन प्रत्येक कैमरे के इमेज प्लेन को काटता है जहाँ यह रेखाएँ बनाता है जिसे एपिपोलर लाइन्स के द्वारा व्यक्त करते हैं। सभी एपिपोलर प्लेन और एपिपोलर लाइनें एपिपोल को काटती हैं, भले ही 'X' पूर्ण रूप से संलग्न हों।

एपिपोलर बाधा और त्रिभुज

यदि दो कैमरों की सापेक्ष स्थिति ज्ञात है, तो इससे दो महत्वपूर्ण प्रेक्षण प्राप्त होते हैं:

  • प्रक्षेपण बिंदु xL मान लें जाना जाता है, और एपिपोलर लाइन ER-XR ज्ञात है और बिंदु X सही प्रतिबिंब में, बिंदु xR पर प्रोजेक्ट करता है जो इस विशेष एपिपोलर लाइन पर होना चाहिए। इसका तात्पर्य यह है कि प्रतिबिंब में देखे गए प्रत्येक बिंदु के लिए किसी बिंदु को दूसरी प्रतिबिंब में ज्ञात एपिपोलर लाइन पर देखा जाना चाहिए। यह एपिपोलर बाधा प्रदान करता है: दाएं कैमरे के विमान X' पर XR का प्रक्षेपण ER-XR एपिपोलर लाइन में निहित होना आवश्यक होता हैं। सभी बिंदु के लिए X, X1, X2, X3 OL-XL पर लाइन उस बाधा को सत्यापित करती हैं। इसका तात्पर्य है कि यह परीक्षण करना संभव है कि क्या दो बिंदु एक ही 3D बिंदु पर पत्राचार की समस्या के कारण होता हैं। दो कैमरों के बीच आवश्यक आव्यूह या मौलिक आव्यूह (कंप्यूटर दृष्टि) द्वारा एपिपोलर बाधाओं का भी वर्णन किया जा सकता है।
  • यदि अंक xL और XR ज्ञात हैं, उनकी प्रक्षेपण रेखाएँ भी ज्ञात रहती हैं। यदि दो प्रतिबिंब बिंदु एक ही 3D बिंदु X के अनुरूप होते हैं, तो प्रक्षेपण रेखाओं को X पर मुख्य रूप से प्रतिच्छेद करना आवश्यक होता हैं। इसका तात्पर्य है कि X की गणना दो प्रतिबिंब बिंदुओं के निर्देशांक से की जा सकती है, इस प्रक्रिया को त्रिकोण (कंप्यूटर दृष्टि) कहा जाता है।

सरलीकृत स्थिति

यदि दो कैमरा इमेज प्लेन मेल खाते हैं तो एपिपोलर ज्यामिती सरल हो जाती है। इस स्थिति में, एपिपोलर लाइनें (EL-XL = OR-XR) भी मेल खाती हैं। इसके अतिरिक्त, एपिपोलर लाइनें OL-OR लाइन के समानांतर हैं, इसे प्रक्षेपण के केंद्रों के बीच और व्यवहारिक रूप से दो प्रतिबिम्बों के क्षैतिज अक्षों के साथ संरेखित किया जाता है। इसका तात्पर्य यह है कि किसी प्रतिबिंब में प्रत्येक बिंदु के लिए, दूसरी प्रतिबिंब में इसके संबंधित बिंदु को केवल क्षैतिज रेखाओं के साथ पाया जाता हैं। यदि कैमरों को इस प्रकार से नहीं रखा जाता है, तो कैमरों से प्रतिबिंब निर्देशांक को सामान्य प्रतिबिंब तल के अनुकरण के लिए रूपांतरित किया जा सकता है। इस प्रक्रिया को प्रतिबिंब सुधार कहा जाता है।

पुशब्रूम सेंसर की एपिपोलर ज्यामिती

पारंपरिक फ्रेम कैमरे के विपरीत, द्वि-आयामी सीसीडी का उपयोग करता है, जिसे पुश स्कैनर लंबी निरंतर प्रतिबिंब पट्टी बनाने के लिए एक-आयामी सीसीडी की सारणी को अपनाता है जिसे प्रतिबिंब काल कहा जाता है। इस सेंसर की एपिपोलर ज्यामिती पिनहोल प्रोजेक्शन कैमरों से अधिक अलग होते हैं। सबसे पहले पुशब्रूम सेंसर की एपिपोलर लाइन सीधी नहीं होती हैं, लेकिन हाइपरबोला जैसी वक्र सम्मिलित होते हैं। इसके लिए दूसरा, एपिपोलर 'वक्र' जोड़ी सम्मिलित नहीं होता हैं।[1] चूंकि, कुछ विशेष परिस्थितियों में, उपग्रह चित्रों की एपिपोलर ज्यामिति को रेखीय प्रारूप के रूप में माना जा सकता है।[2]

यह भी देखें

संदर्भ

अग्रिम पठन

  • Richard Hartley and Andrew Zisserman (2003). Multiple View Geometry in computer vision. Cambridge University Press. ISBN 0-521-54051-8.
  • Vishvjit S. Nalwa (1993). A Guided Tour of Computer Vision. Addison Wesley. pp. 216–240. ISBN 0-201-54853-4.