द्विनेत्री असमानता: Difference between revisions
(text) |
No edit summary |
||
(2 intermediate revisions by 2 users not shown) | |||
Line 49: | Line 49: | ||
<references /> | <references /> | ||
{{DEFAULTSORT:Binocular Disparity}} | {{DEFAULTSORT:Binocular Disparity}} | ||
[[lb:Parallax]] | [[lb:Parallax]] | ||
[[ja:両眼視差]] | [[ja:両眼視差]] | ||
[[Category:Created On 02/06/2023|Binocular Disparity]] | |||
[[Category:Machine Translated Page|Binocular Disparity]] | |||
[[Category: Machine Translated Page]] | [[Category:Templates Vigyan Ready]] | ||
[[Category: | [[Category:कंप्यूटर दृष्टि|Binocular Disparity]] | ||
[[Category:दृष्टि|Binocular Disparity]] | |||
[[Category:लंबन|Binocular Disparity]] |
Latest revision as of 13:11, 22 June 2023
द्विनेत्री विषमता, बाईं और दाईं मानव नेत्र द्वारा देखी गई वस्तु की छवि स्थान में अंतर को संदर्भित करती है, जिसके परिणामस्वरूप आँखें क्षैतिज पृथक्करण (लंबन) होती हैं। मस्तिष्क त्रिविमदृष्टिता में द्वि-आयामी दृष्टिपटलीय प्रतिमा से गहनता से जानकारी निकालने के लिए दूरबीन विषमता का उपयोग करता है। कंप्यूटर दृष्टि में, द्विनेत्री विषमता दो त्रिविम ध्वनिक छवियों के भीतर समान सुविधाओं के निर्देशांक में अंतर को संदर्भित करती है।
एक लक्ष्य के लिए दूरी और/या ऊंचाई निर्धारित करने के लिए संयोग परासमापी द्वारा रेंजफाइंडिंग में एक समान विषमता का उपयोग किया जा सकता है। खगोल विज्ञान में, पृथ्वी पर विभिन्न स्थानों के बीच विषमता का उपयोग विभिन्न आकाशीय लंबन को निर्धारित करने के लिए किया जा सकता है, और तारकीय लंबन के लिए पृथ्वी की कक्षा का उपयोग किया जा सकता है।
परिभाषा
प्रत्येक व्यक्ति के आधार पर मानव आंखें क्षैतिज रूप से लगभग 50–75 मिमी (अंतरप्यूपिलरी दूरी) से अलग होती हैं। इस प्रकार, प्रत्येक आंख का दुनिया भर में थोड़ा अलग दृष्टिकोण होता है। ऊर्ध्वाधर किनारे को देखते हुए वैकल्पिक रूप से एक आंख को बंद करने पर इसे आसानी से देखा जा सकता है। द्विनेत्री विषमता दोनों विचारों के बीच ऊर्ध्वाधर किनारे के स्पष्ट क्षैतिज बदलाव से देखी जा सकती है।
किसी भी समय, दोनों नेत्र की दृष्टि रेखा अंतरिक्ष में एक बिंदु पर मिलती है। अंतरिक्ष में यह बिंदु दोनों नेत्र के दृष्टिपटल पर एक ही स्थान (अर्थात केंद्र) पर प्रक्षेपण करता है। बाएँ और दाएँ आँख द्वारा देखे गए अलग-अलग दृष्टिकोणों के कारण, अंतरिक्ष में कई अन्य बिंदु संबंधित दृष्टिपटलीय स्थानों पर नहीं पड़ते हैं। दृश्य द्विनेत्री विषमता को दो नेत्र में प्रक्षेपण के बिंदु के बीच के अंतर के रूप में परिभाषित किया गया है और सामान्यतः दृश्य कोण के रूप में घात में व्यक्त किया जाता है। [1]
द्विनेत्री विषमता शब्द आंख के बाहर किए गए ज्यामितीय मापों को संदर्भित करता है। वास्तविक दृष्टिपटल पर छवियों की विषमता आंख के आंतरिक कारकों पर निर्भर करती है, विशेष रूप से पातिक बिंदुओं का स्थान, भले ही दृष्टिपटल का अनुप्रस्थ काट एक पूर्ण चक्र हो। घात के रूप में मापे जाने पर दृष्टिपटल पर विषमता द्विनेत्री विषमता के अनुरूप होती है, जबकि आंख के अंदर जटिल संरचना के कारण दूरी के रूप में मापी जाने पर बहुत भिन्न होती है।
चित्र 1: पूर्ण काला घेरा निर्धारण का बिंदु है। नीली वस्तु प्रेक्षक के निकट होती है। इसलिए, इसमें दृष्टिपटल लगभग विषमता है '। अधिक दूर (हरा) पड़ी वस्तुओं में संगत रूप से दूर विषमता होती हैf. द्विनेत्री विषमता प्रक्षेपण की दो रेखाओं के बीच का कोण है। जिनमें से एक वस्तु से प्रक्षेपण के वास्तविक बिंदु तक वास्तविक प्रक्षेपण है। अन्य एक निर्धारण बिंदु के पातिक बिंदु के माध्यम से चलने वाला काल्पनिक प्रक्षेपण है।
कंप्यूटर दृष्टि में, द्विनेत्री विषमता की गणना त्रिविम ध्वनिक कैमरों के एक सम्मुच्चय से ली गई त्रिविम ध्वनिक छवियों से की जाती है। इन कैमरों के बीच परिवर्तनशील दूरी, जिसे आधार रेखा कहा जाता है, उनके संबंधित छवि तल पर एक विशिष्ट बिंदु की विषमता को प्रभावित कर सकती है। जैसे-जैसे आधार रेखा बढ़ती है, बिंदु पर दृष्टि को संरेखित करने के लिए आवश्यक अधिक कोण के कारण विषमता बढ़ती है। हालांकि, कंप्यूटर दृष्टि में, द्विनेत्री विषमता को दृश्य कोण के बजाय दाएं और बाएं छवियों के बीच बिंदु के समन्वय अंतर के रूप में संदर्भित किया जाता है। इकाइयों को सामान्यतः पिक्सेल में मापा जाता है।
2 D छवियों के साथ स्नायु को चकमा देना
दृष्टिपटल (प्राथमिक दृश्य प्रांतस्था) से आने वाली दृश्य जानकारी को संसाधित करने के लिए जिम्मेदार मस्तिष्क के एक हिस्से में मस्तिष्क कोशिकाएं (न्यूरॉन्स) आंखों से उनके निविष्ट में विषमता के अस्तित्व का पता लगा सकती हैं। विशेष रूप से, ये न्यूरॉन्स सक्रिय होंगे, यदि उनकी विशेष विषमता वाली वस्तु दृश्य क्षेत्र के उस हिस्से के भीतर होती है, जिस तक उनकी पहुंच (ग्रहणशील क्षेत्र) है। [2]
विषमता के संबंध में इन न्यूरॉन्स के सटीक गुणों की जांच करने वाले शोधकर्ता कोशिकाओं को विभिन्न विषमताओं के साथ दृश्य उत्तेजना (शरीरवृत्तिक) प्रस्तुत करते हैं और देखते हैं कि वे सक्रिय हैं या नहीं। अलग-अलग विषमताओं के साथ उत्तेजनाओं को प्रस्तुत करने की एक संभावना वस्तुओं को आंखों के सामने अलग-अलग गहराई में रखना है। हालाँकि, इस पद्धति की खामी दूर रखी गई वस्तुओं के लिए पर्याप्त सटीक नहीं हो सकती है क्योंकि उनमें छोटी विषमताएँ होती हैं जबकि निकट की वस्तुओं में अधिक विषमताएँ होंगी। इसके स्थान पर, न्यूरोसाइंटिस्ट एक वैकल्पिक विधि का उपयोग करते हैं जैसा कि चित्र 2 में दिखाया गया है।
चित्रा 2: निर्धारण बिंदु की तुलना में अलग-अलग गहराई वाली वस्तु की विषमता वैकल्पिक रूप से वस्तु की एक छवि को एक आंख और उसी छवि के पार्श्व रूप से स्थानांतरित संस्करण को दूसरी आंख में प्रस्तुत करके उत्पादित की जा सकती है। यह पूर्ण काला घेरा निर्धारण का बिंदु है। अलग-अलग गहराई की वस्तुओं को बायीं आंख की यह लाइन के साथ रखा जाता है। किसी वस्तु की गहराई में बदलाव (भरे रंग के घेरे) से उत्पन्न समान विषमता को बाद में वस्तु को लगातार गहराई में उस तस्वीर में स्थानांतरित करके भी उत्पन्न किया जा सकता है जिसे एक आँख देखती है (रंगीन मार्जिन के साथ काले घेरे)। ध्यान दें कि निकट विषमताओं के लिए पार्श्व बदलाव दूर विषमताओं की तुलना में समान गहराई के अनुरूप बड़ा होना चाहिए। यह न्यूरोसाइंटिस्ट सामान्यतः न्यूरॉन्स की विषमता चयनात्मकता का अध्ययन करने के लिए यादृच्छिक बिंदु उत्तेजनाओं के साथ करते हैं क्योंकि विषमताओं का परीक्षण करने के लिए आवश्यक पार्श्व दूरी गहराई परीक्षणों का उपयोग करके आवश्यक दूरी से कम है। यह सिद्धांत ऑटोस्टेरोग्राम भ्रम में भी लागू किया गया है।
अंकीय त्रिविम ध्वनिक छवियों का उपयोग करके कंप्यूटिंग विषमता
दो त्रिविम ध्वनिक छवियों के बीच सुविधाओं की विषमता की गणना सामान्यतः एक छवि सुविधा के बाईं ओर बदलाव के रूप में की जाती है, जब उसे सही छवि में देखा जाता है। [3] उदाहरण के लिए, बाईं छवि में x निर्देशांक t (पिक्सेल में मापा गया) पर दिखाई देने वाला एक बिंदु दाईं छवि में x निर्देशांक t − 3 पर उपस्थित हो सकता है। इस स्थिति में, सही छवि में उस स्थान पर विषमता 3 पिक्सेल होगी।
त्वरित विषमता गणना की अनुमति देने के लिए त्रिविम ध्वनिक छवियों को हमेशा सही ढंग से संरेखित नहीं किया जा सकता है। उदाहरण के लिए, कैमरों के सम्मुच्चय को स्तर से थोड़ा घुमाया जा सकता है। छवि सुधार के रूप में जानी जाने वाली प्रक्रिया के माध्यम से, दोनों छवियों को केवल क्षैतिज दिशा में विषमताओं की अनुमति देने के लिए घुमाया जाता है (अर्थात y छवि निर्देशांक में कोई विषमता नहीं है)।[3] यह एक ऐसी संपत्ति है जिसे प्रतिबिंब प्रग्रहण करने से पहले त्रिविम ध्वनिक कैमरों के यथार्थ संरेखण द्वारा भी प्राप्त किया जा सकता है।
कंप्यूटर कलन विधि
सुधार के बाद, एक कलन विधि का उपयोग करके पत्राचार समस्या को हल किया जा सकता है जो छवि सुविधाओं से मेल खाने के लिए बाएं और दाएं दोनों छवियों को क्रमवीक्षण करता है। इस समस्या का एक सामान्य तरीका बाईं छवि में प्रत्येक पिक्सेल के चारों ओर एक छोटा छवि योजक बनाना है। इन छवि योजक की तुलना उनके संबंधित छवि योजक की तुलना करके सही छवि में सभी संभावित विषमताओं से की जाती है। उदाहरण के लिए, 1 की विषमता के लिए, बाईं छवि में योजक की तुलना दाईं ओर समान आकार के योजक से की जाएगी, जिसे एक पिक्सेल द्वारा बाईं ओर स्थानांतरित कर दिया जाएगा। इन दो योजक के बीच तुलना निम्नलिखित समीकरणों में से एक से कम्प्यूटेशनल उपाय प्राप्त करके की जा सकती है जो योजक में प्रत्येक पिक्सेल की तुलना करता है। निम्नलिखित सभी समीकरणों के लिए, L और R बाएँ और दाएँ स्तंभों को संदर्भित करते हैं जबकि r और c वर्तमान पंक्ति और उन छवियों के स्तंभ को संदर्भित करते हैं जिनकी जांच की जा रही है। d सही छवि की विषमता को संदर्भित करता है।
- सामान्यीकृत सहसंबंध:
- चुकता अंतरों का योग:
- पूर्ण अंतर का योग:
उपरोक्त विधियों में से किसी एक का उपयोग करके सबसे कम संगणित मान के साथ विषमता को छवि विशेषता के लिए विषमता माना जाता है। यह न्यूनतम प्राप्तांक इंगित करता है कि कलन विधि ने दोनों छवियों में संबंधित सुविधाओं का सबसे अच्छा मिलान पाया है।
ऊपर वर्णित विधि एक क्रूर-बल खोज कलन विधि है। बड़े योजक और/या छवि आकार के साथ, यह तकनीक बहुत समय लेने वाली हो सकती है क्योंकि सबसे कम सहसंबंध प्राप्तांक खोजने के लिए पिक्सेल की लगातार जांच की जा रही है। हालाँकि, इस तकनीक में अनावश्यक दोहराव भी सम्मिलित है क्योंकि कई पिक्सेल अंशछादन होते हैं। एक अधिक कुशल कलन विधि में पिछले पिक्सेल से सभी मानों को याद रखना सम्मिलित है। एक और भी अधिक कुशल कलन विधि में पिछली पंक्ति से पंक्त् योग को याद रखना सम्मिलित है (पिछले पिक्सेल से सभी मानों को याद रखने के अतिरिक्त)। तकनीकें जो पिछली जानकारी को सहेजती हैं, इस छवि विश्लेषण प्रक्रिया की कलन विधि दक्षता को बहुत बढ़ा सकती हैं।
छवियों से विषमता का उपयोग
विषमता के ज्ञान का उपयोग त्रिविम ध्वनिक छवि से जानकारी निकालने के लिए किया जा सकता है। एक स्तिथि है कि विषमता सबसे उपयोगी है गहराई/दूरी गणना के लिए कैमरों से विषमता और दूरी विपरीत रूप से संबंधित हैं। जैसे-जैसे कैमरों से दूरी बढ़ती है, विषमता कम होती जाती है। यह त्रिविम ध्वनिक छवियों में गहराई की धारणा के लिए अनुमति देता है। ज्यामिति और बीजगणित का उपयोग करके, 2D त्रिविम ध्वनिक छवियों में दिखाई देने वाले बिंदुओं को 3D स्थल में निर्देशांक के रूप में मानचित्र किया जा सकता है।
यह अवधारणा मार्गनिर्देशन के लिए विशेष रूप से उपयोगी है। उदाहरण के लिए, मंगल अन्वेषण रोवर बाधाओं के लिए इलाके को क्रमवीक्षण करने के लिए इसी तरह की विधि का उपयोग करता है। [4] रोवर अपने त्रिविम मार्गनिर्देशन कैमरों के साथ छवियों की एक जोड़ी को अधिकृत करता है और ऊंचा वस्तुओं (जैसे बोल्डर) का पता लगाने के लिए विषमता की गणना की जाती है। [5] इसके अतिरिक्त, रोवर के सापेक्ष वस्तुओं के विस्थापन को मापकर बाद की त्रिविम ध्वनिक छवियों से स्थान और गति डेटा निकाला जा सकता है। कुछ स्तिथियों में, यह इस प्रकार की जानकारी का सबसे अच्छा स्रोत है क्योंकि टायर फिसलने के कारण पहियों में संकेतक संवेदक गलत हो सकते हैं।
यह भी देखें
संदर्भ
- ↑ Qian, N., Binocular Disparity and the Perception of Depth, Neuron, 18, 359–368, 1997.
- ↑ Gonzalez, F. and Perez, R., Neural mechanisms underlying stereoscopic vision, Prog Neurobiol, 55(3), 191–224, 1998.
- ↑ 3.0 3.1 लिंडा शापिरो|लिंडा जी. शापिरो और जॉर्ज सी. स्टॉकमैन (2001)। कंप्यूटर दृष्टि। प्रेंटिस हॉल, 371–409। ISBN 0-13-030796-3.
- ↑ "The Computer Vision Laboratory ." JPL.NASA.GOV. JPL/NASA, n.d. Web. 5 Jun 2011. <[1]>.
- ↑ "Spacecraft: Surface Operations: Rover ." JPL.NASA.GOV. JPL/NASA, n.d. Web. 5 Jun 2011. http://marsrovers.jpl.nasa.gov/mission/spacecraft_rover_eyes.html.