द्विनेत्री असमानता
द्विनेत्री असमानता, बाईं और दाईं मानवीय आँखों द्वारा देखी गई वस्तु की छवि स्थान में अंतर को संदर्भित करती है, जिसके परिणामस्वरूप आँखें क्षैतिज पृथक्करण (लंबन) होती हैं। मस्तिष्क त्रिविमदृष्टिता में द्वि-आयामी दृष्टिपटलीय प्रतिमा से गहनता से जानकारी निकालने के लिए दूरबीन असमानता का उपयोग करता है। कंप्यूटर दृष्टि में, द्विनेत्री असमानता दो त्रिविम ध्वनिक छवियों के भीतर समान सुविधाओं के निर्देशांक में अंतर को संदर्भित करती है।
एक लक्ष्य के लिए दूरी और/या ऊंचाई निर्धारित करने के लिए संयोग परासमापी द्वारा परासमापन में
एक समान असमानता का उपयोग किया जा सकता है। खगोल विज्ञान में, पृथ्वी पर विभिन्न स्थानों के बीच असमानता का उपयोग विभिन्न आकाशीय लंबन को निर्धारित करने के लिए किया जा सकता है, और तारकीय लंबन के लिए पृथ्वी की कक्षा का उपयोग किया जा सकता है।
परिभाषा
प्रत्येक व्यक्ति के आधार पर मानव आंखें क्षैतिज रूप से लगभग 50–75 मिमी (अंतरप्यूपिलरी दूरी) से अलग होती हैं। इस प्रकार, प्रत्येक आंख का दुनिया भर में थोड़ा अलग दृष्टिकोण होता है। ऊर्ध्वाधर किनारे को देखते हुए वैकल्पिक रूप से एक आंख को बंद करने पर इसे आसानी से देखा जा सकता है। द्विनेत्री असमानता दोनों विचारों के बीच ऊर्ध्वाधर किनारे के स्पष्ट क्षैतिज बदलाव से देखी जा सकती है।
किसी भी समय, दोनों आँखों की दृष्टि रेखा अंतरिक्ष में एक बिंदु पर मिलती है। अंतरिक्ष में यह बिंदु दोनों आँखों के रेटिना पर एक ही स्थान (अर्थात केंद्र) पर प्रोजेक्ट करता है। बाएँ और दाएँ आँख द्वारा देखे गए अलग-अलग दृष्टिकोणों के कारण, अंतरिक्ष में कई अन्य बिंदु संबंधित दृष्टिपटलीय स्थानों पर नहीं पड़ते हैं। दृश्य द्विनेत्री असमानता को दो आँखों में प्रक्षेपण के बिंदु के बीच के अंतर के रूप में परिभाषित किया गया है और सामान्यतः दृश्य कोण के रूप में डिग्री में व्यक्त किया जाता है। [1]
द्विनेत्री असमानता शब्द आंख के बाहर किए गए ज्यामितीय मापों को संदर्भित करता है। वास्तविक रेटिना पर छवियों की असमानता आंख के आंतरिक कारकों पर निर्भर करती है, विशेष रूप से पातिक बिंदुओं का स्थान, भले ही रेटिना का अनुप्रस्थ काट एक पूर्ण चक्र हो। डिग्री के रूप में मापे जाने पर रेटिना पर असमानता द्विनेत्री असमानता के अनुरूप होती है, जबकि आंख के अंदर जटिल संरचना के कारण दूरी के रूप में मापी जाने पर बहुत भिन्न होती है।
चित्र 1: पूर्ण काला घेरा निर्धारण का बिंदु है। नीली वस्तु प्रेक्षक के निकट होती है। इसलिए, इसमें दृष्टिपटल लगभग असमानता है '. अधिक दूर (हरा) पड़ी वस्तुओं में संगत रूप से दूर असमानता होती हैf. द्विनेत्री असमानता प्रक्षेपण की दो रेखाओं के बीच का कोण है। जिनमें से एक वस्तु से प्रक्षेपण के वास्तविक बिंदु तक वास्तविक प्रक्षेपण है। अन्य एक निर्धारण बिंदु के पातिक बिंदु के माध्यम से चलने वाला काल्पनिक प्रक्षेपण है।
कंप्यूटर दृष्टि में, द्विनेत्री असमानता की गणना त्रिविम ध्वनिक कैमरों के एक सम्मुच्चय से ली गई त्रिविम ध्वनिक छवियों से की जाती है। इन कैमरों के बीच परिवर्तनशील दूरी, जिसे आधार रेखा कहा जाता है, उनके संबंधित छवि तल पर एक विशिष्ट बिंदु की असमानता को प्रभावित कर सकती है। जैसे-जैसे आधार रेखा बढ़ती है, बिंदु पर दृष्टि को संरेखित करने के लिए आवश्यक अधिक कोण के कारण असमानता बढ़ती है। हालांकि, कंप्यूटर दृष्टि में, द्विनेत्री असमानता को दृश्य कोण के बजाय दाएं और बाएं छवियों के बीच बिंदु के समन्वय अंतर के रूप में संदर्भित किया जाता है। इकाइयों को सामान्यतः पिक्सेल में मापा जाता है।
2 D छवियों के साथ न्यूरॉन्स को धोखा देना
रेटिना (प्राथमिक दृश्य प्रांतस्था) से आने वाली दृश्य जानकारी को संसाधित करने के लिए जिम्मेदार मस्तिष्क के एक हिस्से में मस्तिष्क कोशिकाएं (न्यूरॉन्स) आंखों से उनके निविष्ट में असमानता के अस्तित्व का पता लगा सकती हैं। विशेष रूप से, ये न्यूरॉन्स सक्रिय होंगे, यदि उनकी विशेष असमानता वाली वस्तु दृश्य क्षेत्र के उस हिस्से के भीतर होती है, जिस तक उनकी पहुंच (ग्रहणशील क्षेत्र) है। [2]
असमानता के संबंध में इन न्यूरॉन्स के सटीक गुणों की जांच करने वाले शोधकर्ता कोशिकाओं को विभिन्न असमानताओं के साथ दृश्य उत्तेजना (फिजियोलॉजी) प्रस्तुत करते हैं और देखते हैं कि वे सक्रिय हैं या नहीं। अलग-अलग असमानताओं के साथ उत्तेजनाओं को प्रस्तुत करने की एक संभावना वस्तुओं को आंखों के सामने अलग-अलग गहराई में रखना है। हालाँकि, इस पद्धति की खामी दूर रखी गई वस्तुओं के लिए पर्याप्त सटीक नहीं हो सकती है क्योंकि उनमें छोटी असमानताएँ होती हैं जबकि निकट की वस्तुओं में अधिक असमानताएँ होंगी। इसके बजाय, न्यूरोसाइंटिस्ट एक वैकल्पिक विधि का उपयोग करते हैं जैसा कि चित्र 2 में दिखाया गया है।
चित्रा 2: निर्धारण बिंदु की तुलना में अलग-अलग गहराई वाली वस्तु की असमानता वैकल्पिक रूप से वस्तु की एक छवि को एक आंख और उसी छवि के पार्श्व रूप से स्थानांतरित संस्करण को दूसरी आंख में प्रस्तुत करके उत्पादित की जा सकती है। यह पूर्ण काला घेरा निर्धारण का बिंदु है। अलग-अलग गहराई की वस्तुओं को बायीं आंख की यह लाइन के साथ रखा जाता है। किसी वस्तु की गहराई में बदलाव (भरे रंग के घेरे) से उत्पन्न समान असमानता को बाद में वस्तु को लगातार गहराई में उस तस्वीर में स्थानांतरित करके भी उत्पन्न किया जा सकता है जिसे एक आँख देखती है (रंगीन मार्जिन के साथ काले घेरे)। ध्यान दें कि निकट असमानताओं के लिए पार्श्व बदलाव दूर असमानताओं की तुलना में समान गहराई के अनुरूप बड़ा होना चाहिए। यह न्यूरोसाइंटिस्ट सामान्यतः न्यूरॉन्स की विषमता चयनात्मकता का अध्ययन करने के लिए यादृच्छिक डॉट उत्तेजनाओं के साथ करते हैं क्योंकि असमानताओं का परीक्षण करने के लिए आवश्यक पार्श्व दूरी गहराई परीक्षणों का उपयोग करके आवश्यक दूरी से कम है। यह सिद्धांत ऑटोस्टेरोग्राम भ्रम में भी लागू किया गया है।
डिजिटल त्रिविम ध्वनिक छवियों का उपयोग करके कंप्यूटिंग असमानता
दो त्रिविम ध्वनिक छवियों के बीच सुविधाओं की असमानता की गणना सामान्यतः एक छवि सुविधा के बाईं ओर बदलाव के रूप में की जाती है, जब उसे सही छवि में देखा जाता है। [3] उदाहरण के लिए, बाईं छवि में x निर्देशांक t (पिक्सेल में मापा गया) पर दिखाई देने वाला एक बिंदु दाईं छवि में x निर्देशांक t − 3 पर उपस्थित हो सकता है। इस स्थिति में, सही छवि में उस स्थान पर असमानता 3 पिक्सेल होगी।
त्वरित असमानता गणना की अनुमति देने के लिए त्रिविम ध्वनिक छवियों को हमेशा सही ढंग से संरेखित नहीं किया जा सकता है। उदाहरण के लिए, कैमरों के सम्मुच्चय को स्तर से थोड़ा घुमाया जा सकता है। छवि सुधार के रूप में जानी जाने वाली प्रक्रिया के माध्यम से, दोनों छवियों को केवल क्षैतिज दिशा में असमानताओं की अनुमति देने के लिए घुमाया जाता है (अर्थात y छवि निर्देशांक में कोई असमानता नहीं है)।[3] यह एक ऐसी संपत्ति है जिसे प्रतिबिंब प्रग्रहण करने से पहले त्रिविम ध्वनिक कैमरों के सटीक संरेखण द्वारा भी प्राप्त किया जा सकता है।
कंप्यूटर कलन विधि
सुधार के बाद, एक कलन विधि का उपयोग करके पत्राचार समस्या को हल किया जा सकता है जो छवि सुविधाओं से मेल खाने के लिए बाएं और दाएं दोनों छवियों को स्कैन करता है। इस समस्या का एक सामान्य तरीका बाईं छवि में प्रत्येक पिक्सेल के चारों ओर एक छोटा छवि योजक बनाना है। इन छवि योजक की तुलना उनके संबंधित छवि योजक की तुलना करके सही छवि में सभी संभावित विषमताओं से की जाती है। उदाहरण के लिए, 1 की असमानता के लिए, बाईं छवि में योजक की तुलना दाईं ओर समान आकार के योजक से की जाएगी, जिसे एक पिक्सेल द्वारा बाईं ओर स्थानांतरित कर दिया जाएगा। इन दो योजक के बीच तुलना निम्नलिखित समीकरणों में से एक से कम्प्यूटेशनल उपाय प्राप्त करके की जा सकती है जो योजक में प्रत्येक पिक्सेल की तुलना करता है। निम्नलिखित सभी समीकरणों के लिए, L और R बाएँ और दाएँ स्तंभों को संदर्भित करते हैं जबकि r और c वर्तमान पंक्ति और उन छवियों के स्तंभ को संदर्भित करते हैं जिनकी जांच की जा रही है। d सही छवि की असमानता को संदर्भित करता है।
- सामान्यीकृत सहसंबंध:
- चुकता अंतरों का योग:
- पूर्ण अंतर का योग:
उपरोक्त विधियों में से किसी एक का उपयोग करके सबसे कम संगणित मान के साथ असमानता को छवि विशेषता के लिए असमानता माना जाता है। यह न्यूनतम प्राप्तांक इंगित करता है कि कलन विधि ने दोनों छवियों में संबंधित सुविधाओं का सबसे अच्छा मिलान पाया है।
ऊपर वर्णित विधि एक क्रूर-बल खोज कलन विधि है। बड़े योजक और/या छवि आकार के साथ, यह तकनीक बहुत समय लेने वाली हो सकती है क्योंकि सबसे कम सहसंबंध प्राप्तांक खोजने के लिए पिक्सेल की लगातार जांच की जा रही है। हालाँकि, इस तकनीक में अनावश्यक दोहराव भी सम्मिलित है क्योंकि कई पिक्सेल अंशछादन होते हैं। एक अधिक कुशल कलन विधि में पिछले पिक्सेल से सभी मानों को याद रखना सम्मिलित है। एक और भी अधिक कुशल कलन विधि में पिछली पंक्ति से पंक्त् योग को याद रखना सम्मिलित है (पिछले पिक्सेल से सभी मानों को याद रखने के अतिरिक्त)। तकनीकें जो पिछली जानकारी को सहेजती हैं, इस छवि विश्लेषण प्रक्रिया की कलन विधि दक्षता को बहुत बढ़ा सकती हैं।
छवियों से असमानता का उपयोग
असमानता के ज्ञान का उपयोग त्रिविम ध्वनिक छवि से जानकारी निकालने के लिए किया जा सकता है। एक स्तिथि है कि असमानता सबसे उपयोगी है गहराई/दूरी गणना के लिए कैमरों से असमानता और दूरी विपरीत रूप से संबंधित हैं। जैसे-जैसे कैमरों से दूरी बढ़ती है, असमानता कम होती जाती है। यह त्रिविम ध्वनिक छवियों में गहराई की धारणा के लिए अनुमति देता है। ज्यामिति और बीजगणित का उपयोग करके, 2D त्रिविम ध्वनिक छवियों में दिखाई देने वाले बिंदुओं को 3D स्थल में निर्देशांक के रूप में मानचित्र किया जा सकता है।
यह अवधारणा मार्गनिर्देशन के लिए विशेष रूप से उपयोगी है। उदाहरण के लिए, मंगल अन्वेषण रोवर बाधाओं के लिए इलाके को क्रमवीक्षण करने के लिए इसी तरह की विधि का उपयोग करता है। [4] रोवर अपने त्रिविम मार्गनिर्देशन कैमरों के साथ छवियों की एक जोड़ी को अधिकृत करता है और ऊंचा वस्तुओं (जैसे बोल्डर) का पता लगाने के लिए असमानता की गणना की जाती है। [5] इसके अतिरिक्त, रोवर के सापेक्ष वस्तुओं के विस्थापन को मापकर बाद की त्रिविम ध्वनिक छवियों से स्थान और गति डेटा निकाला जा सकता है। कुछ स्तिथियों में, यह इस प्रकार की जानकारी का सबसे अच्छा स्रोत है क्योंकि टायर फिसलने के कारण पहियों में संकेतक संवेदक गलत हो सकते हैं।
यह भी देखें
संदर्भ
- ↑ Qian, N., Binocular Disparity and the Perception of Depth, Neuron, 18, 359–368, 1997.
- ↑ Gonzalez, F. and Perez, R., Neural mechanisms underlying stereoscopic vision, Prog Neurobiol, 55(3), 191–224, 1998.
- ↑ 3.0 3.1 लिंडा शापिरो|लिंडा जी. शापिरो और जॉर्ज सी. स्टॉकमैन (2001)। कंप्यूटर दृष्टि। प्रेंटिस हॉल, 371–409। ISBN 0-13-030796-3.
- ↑ "The Computer Vision Laboratory ." JPL.NASA.GOV. JPL/NASA, n.d. Web. 5 Jun 2011. <[1]>.
- ↑ "Spacecraft: Surface Operations: Rover ." JPL.NASA.GOV. JPL/NASA, n.d. Web. 5 Jun 2011. http://marsrovers.jpl.nasa.gov/mission/spacecraft_rover_eyes.html.