द्विनेत्री असमानता
द्विनेत्री असमानता, बाईं और दाईं मानवीय आँखों द्वारा देखी गई वस्तु की छवि स्थान में अंतर को संदर्भित करती है, जिसके परिणामस्वरूप आँखें क्षैतिज पृथक्करण (लंबन) होती हैं। मस्तिष्क स्टीरियोप्सिस में द्वि-आयामी रेटिना छवियों से गहराई से जानकारी निकालने के लिए दूरबीन असमानता का उपयोग करता है। कंप्यूटर दृष्टि में, द्विनेत्री असमानता दो स्टीरियो छवियों के भीतर समान सुविधाओं के निर्देशांक में अंतर को संदर्भित करती है।
एक लक्ष्य के लिए दूरी और/या ऊंचाई निर्धारित करने के लिए संयोग रेंजफाइंडर द्वारा रेंजफाइंडिंग में एक समान असमानता का उपयोग किया जा सकता है। खगोल विज्ञान में, पृथ्वी पर विभिन्न स्थानों के बीच असमानता का उपयोग विभिन्न आकाशीय लंबन को निर्धारित करने के लिए किया जा सकता है, और तारकीय लंबन के लिए पृथ्वी की कक्षा का उपयोग किया जा सकता है।
परिभाषा
प्रत्येक व्यक्ति के आधार पर मानव आंखें क्षैतिज रूप से लगभग 50–75 मिमी (अंतरप्यूपिलरी दूरी) से अलग होती हैं। इस प्रकार, प्रत्येक आंख का दुनिया भर में थोड़ा अलग दृष्टिकोण होता है। ऊर्ध्वाधर किनारे को देखते हुए वैकल्पिक रूप से एक आंख को बंद करने पर इसे आसानी से देखा जा सकता है। द्विनेत्री असमानता दोनों विचारों के बीच ऊर्ध्वाधर किनारे के स्पष्ट क्षैतिज बदलाव से देखी जा सकती है।
किसी भी समय, दोनों आँखों की दृष्टि रेखा अंतरिक्ष में एक बिंदु पर मिलती है। अंतरिक्ष में यह बिंदु दोनों आँखों के रेटिना पर एक ही स्थान (अर्थात केंद्र) पर प्रोजेक्ट करता है। बाएँ और दाएँ आँख द्वारा देखे गए अलग-अलग दृष्टिकोणों के कारण, अंतरिक्ष में कई अन्य बिंदु संबंधित रेटिनल स्थानों पर नहीं पड़ते हैं। दृश्य द्विनेत्री असमानता को दो आँखों में प्रक्षेपण के बिंदु के बीच के अंतर के रूप में परिभाषित किया गया है और आमतौर पर दृश्य कोण के रूप में डिग्री में व्यक्त किया जाता है।[1] द्विनेत्री असमानता शब्द आंख के बाहर किए गए ज्यामितीय मापों को संदर्भित करता है। वास्तविक रेटिना पर छवियों की असमानता आंख के आंतरिक कारकों पर निर्भर करती है, विशेष रूप से नोडल बिंदुओं का स्थान, भले ही रेटिना का क्रॉस सेक्शन एक पूर्ण चक्र हो। डिग्री के रूप में मापे जाने पर रेटिना पर असमानता द्विनेत्री असमानता के अनुरूप होती है, जबकि आंख के अंदर जटिल संरचना के कारण दूरी के रूप में मापी जाने पर बहुत भिन्न होती है।
चित्र 1: पूर्ण काला घेरा निर्धारण का बिंदु है। नीली वस्तु प्रेक्षक के निकट होती है। इसलिए, इसमें लगभग असमानता है 'डीn. अधिक दूर (हरा) पड़ी वस्तुओं में संगत रूप से दूर असमानता होती हैf. द्विनेत्री असमानता प्रक्षेपण की दो रेखाओं के बीच का कोण है। जिनमें से एक वस्तु से प्रक्षेपण के वास्तविक बिंदु तक वास्तविक प्रक्षेपण है। अन्य एक निर्धारण बिंदु के नोडल बिंदु के माध्यम से चलने वाला काल्पनिक प्रक्षेपण है।
कंप्यूटर दृष्टि में, द्विनेत्री असमानता की गणना स्टीरियो कैमरों के एक सेट से ली गई स्टीरियो छवियों से की जाती है। इन कैमरों के बीच परिवर्तनशील दूरी, जिसे आधार रेखा कहा जाता है, उनके संबंधित छवि तल पर एक विशिष्ट बिंदु की असमानता को प्रभावित कर सकती है। जैसे-जैसे आधार रेखा बढ़ती है, बिंदु पर दृष्टि को संरेखित करने के लिए आवश्यक अधिक कोण के कारण असमानता बढ़ती है। हालांकि, कंप्यूटर दृष्टि में, द्विनेत्री असमानता को दृश्य कोण के बजाय दाएं और बाएं छवियों के बीच बिंदु के समन्वय अंतर के रूप में संदर्भित किया जाता है। इकाइयों को आमतौर पर पिक्सेल में मापा जाता है।
2 डी छवियों के साथ न्यूरॉन्स को धोखा देना
रेटिना (प्राथमिक दृश्य प्रांतस्था) से आने वाली दृश्य जानकारी को संसाधित करने के लिए जिम्मेदार मस्तिष्क के एक हिस्से में मस्तिष्क कोशिकाएं (न्यूरॉन्स) आंखों से उनके इनपुट में असमानता के अस्तित्व का पता लगा सकती हैं। विशेष रूप से, ये न्यूरॉन्स सक्रिय होंगे, यदि उनकी विशेष असमानता वाली वस्तु दृश्य क्षेत्र के उस हिस्से के भीतर होती है, जिस तक उनकी पहुंच (ग्रहणशील क्षेत्र) है।[2]
असमानता के संबंध में इन न्यूरॉन्स के सटीक गुणों की जांच करने वाले शोधकर्ता कोशिकाओं को विभिन्न असमानताओं के साथ दृश्य उत्तेजना (फिजियोलॉजी) पेश करते हैं और देखते हैं कि वे सक्रिय हैं या नहीं। अलग-अलग असमानताओं के साथ उत्तेजनाओं को प्रस्तुत करने की एक संभावना वस्तुओं को आंखों के सामने अलग-अलग गहराई में रखना है। हालाँकि, इस पद्धति की खामी दूर रखी गई वस्तुओं के लिए पर्याप्त सटीक नहीं हो सकती है क्योंकि उनमें छोटी असमानताएँ होती हैं जबकि निकट की वस्तुओं में अधिक असमानताएँ होंगी। इसके बजाय, न्यूरोसाइंटिस्ट एक वैकल्पिक विधि का उपयोग करते हैं जैसा कि चित्र 2 में दिखाया गया है।
चित्रा 2: निर्धारण बिंदु की तुलना में अलग-अलग गहराई वाली वस्तु की असमानता वैकल्पिक रूप से वस्तु की एक छवि को एक आंख और उसी छवि के पार्श्व रूप से स्थानांतरित संस्करण को दूसरी आंख में पेश करके उत्पादित की जा सकती है। पूर्ण काला घेरा निर्धारण का बिंदु है। अलग-अलग गहराई की वस्तुओं को बायीं आंख की फिक्सिंग लाइन के साथ रखा जाता है। किसी वस्तु की गहराई में बदलाव (भरे रंग के घेरे) से उत्पन्न समान असमानता को बाद में वस्तु को लगातार गहराई में उस तस्वीर में स्थानांतरित करके भी उत्पन्न किया जा सकता है जिसे एक आँख देखती है (रंगीन मार्जिन के साथ काले घेरे)। ध्यान दें कि निकट असमानताओं के लिए पार्श्व बदलाव दूर असमानताओं की तुलना में समान गहराई के अनुरूप बड़ा होना चाहिए। यह न्यूरोसाइंटिस्ट आमतौर पर न्यूरॉन्स की विषमता चयनात्मकता का अध्ययन करने के लिए यादृच्छिक डॉट उत्तेजनाओं के साथ करते हैं क्योंकि असमानताओं का परीक्षण करने के लिए आवश्यक पार्श्व दूरी गहराई परीक्षणों का उपयोग करके आवश्यक दूरी से कम है। यह सिद्धांत autostereogram भ्रम में भी लागू किया गया है।
डिजिटल स्टीरियो छवियों का उपयोग करके कंप्यूटिंग असमानता
दो स्टीरियो छवियों के बीच सुविधाओं की असमानता की गणना आमतौर पर एक छवि सुविधा के बाईं ओर बदलाव के रूप में की जाती है, जब उसे सही छवि में देखा जाता है।[3] उदाहरण के लिए, बाईं छवि में x निर्देशांक t (पिक्सेल में मापा गया) पर दिखाई देने वाला एक बिंदु दाईं छवि में x निर्देशांक t − 3 पर मौजूद हो सकता है। इस स्थिति में, सही छवि में उस स्थान पर असमानता 3 पिक्सेल होगी।
त्वरित असमानता गणना की अनुमति देने के लिए स्टीरियो छवियों को हमेशा सही ढंग से संरेखित नहीं किया जा सकता है। उदाहरण के लिए, कैमरों के सेट को स्तर से थोड़ा घुमाया जा सकता है। छवि सुधार के रूप में जानी जाने वाली प्रक्रिया के माध्यम से, दोनों छवियों को केवल क्षैतिज दिशा में असमानताओं की अनुमति देने के लिए घुमाया जाता है (अर्थात y छवि निर्देशांक में कोई असमानता नहीं है)।[3]यह एक ऐसी संपत्ति है जिसे इमेज कैप्चर करने से पहले स्टीरियो कैमरों के सटीक संरेखण द्वारा भी प्राप्त किया जा सकता है।
कंप्यूटर एल्गोरिथ्म
सुधार के बाद, एक एल्गोरिदम का उपयोग करके पत्राचार समस्या को हल किया जा सकता है जो छवि सुविधाओं से मेल खाने के लिए बाएं और दाएं दोनों छवियों को स्कैन करता है। इस समस्या का एक सामान्य तरीका बाईं छवि में प्रत्येक पिक्सेल के चारों ओर एक छोटा छवि पैच बनाना है। इन छवि पैच की तुलना उनके संबंधित छवि पैच की तुलना करके सही छवि में सभी संभावित विषमताओं से की जाती है। उदाहरण के लिए, 1 की असमानता के लिए, बाईं छवि में पैच की तुलना दाईं ओर समान आकार के पैच से की जाएगी, जिसे एक पिक्सेल द्वारा बाईं ओर स्थानांतरित कर दिया जाएगा। इन दो पैच के बीच तुलना निम्नलिखित समीकरणों में से एक से कम्प्यूटेशनल उपाय प्राप्त करके की जा सकती है जो पैच में प्रत्येक पिक्सेल की तुलना करता है। निम्नलिखित सभी समीकरणों के लिए, L और R बाएँ और दाएँ स्तंभों को संदर्भित करते हैं जबकि r और c वर्तमान पंक्ति और उन छवियों के स्तंभ को संदर्भित करते हैं जिनकी जांच की जा रही है। d सही छवि की असमानता को संदर्भित करता है।
- सामान्यीकृत सहसंबंध:
- चुकता अंतरों का योग:
- पूर्ण अंतर का योग:
उपरोक्त विधियों में से किसी एक का उपयोग करके सबसे कम संगणित मान के साथ असमानता को छवि विशेषता के लिए असमानता माना जाता है। यह न्यूनतम स्कोर इंगित करता है कि एल्गोरिदम ने दोनों छवियों में संबंधित सुविधाओं का सबसे अच्छा मिलान पाया है।
ऊपर वर्णित विधि एक क्रूर-बल खोज एल्गोरिथम है। बड़े पैच और/या छवि आकार के साथ, यह तकनीक बहुत समय लेने वाली हो सकती है क्योंकि सबसे कम सहसंबंध स्कोर खोजने के लिए पिक्सेल की लगातार जांच की जा रही है। हालाँकि, इस तकनीक में अनावश्यक दोहराव भी शामिल है क्योंकि कई पिक्सेल ओवरलैप होते हैं। एक अधिक कुशल एल्गोरिथ्म में पिछले पिक्सेल से सभी मानों को याद रखना शामिल है। एक और भी अधिक कुशल एल्गोरिदम में पिछली पंक्ति से कॉलम रकम को याद रखना शामिल है (पिछले पिक्सेल से सभी मानों को याद रखने के अलावा)। तकनीकें जो पिछली जानकारी को सहेजती हैं, इस छवि विश्लेषण प्रक्रिया की एल्गोरिथम दक्षता को बहुत बढ़ा सकती हैं।
छवियों से असमानता का उपयोग
असमानता के ज्ञान का उपयोग स्टीरियो इमेज से जानकारी निकालने के लिए किया जा सकता है। एक मामला है कि असमानता सबसे उपयोगी है गहराई/दूरी गणना के लिए। कैमरों से असमानता और दूरी विपरीत रूप से संबंधित हैं। जैसे-जैसे कैमरों से दूरी बढ़ती है, असमानता कम होती जाती है। यह स्टीरियो छवियों में गहराई की धारणा के लिए अनुमति देता है। ज्यामिति और बीजगणित का उपयोग करके, 2D स्टीरियो छवियों में दिखाई देने वाले बिंदुओं को 3D अंतरिक्ष में निर्देशांक के रूप में मैप किया जा सकता है।
यह अवधारणा नेविगेशन के लिए विशेष रूप से उपयोगी है। उदाहरण के लिए, मार्स एक्सप्लोरेशन रोवर बाधाओं के लिए इलाके को स्कैन करने के लिए इसी तरह की विधि का उपयोग करता है।[4] रोवर अपने त्रिविम नेविगेशन कैमरों के साथ छवियों की एक जोड़ी को कैप्चर करता है और ऊंचा वस्तुओं (जैसे बोल्डर) का पता लगाने के लिए असमानता की गणना की जाती है।[5] इसके अतिरिक्त, रोवर के सापेक्ष वस्तुओं के विस्थापन को मापकर बाद की स्टीरियो छवियों से स्थान और गति डेटा निकाला जा सकता है। कुछ मामलों में, यह इस प्रकार की जानकारी का सबसे अच्छा स्रोत है क्योंकि टायर फिसलने के कारण पहियों में एनकोडर सेंसर गलत हो सकते हैं।
यह भी देखें
संदर्भ
- ↑ Qian, N., Binocular Disparity and the Perception of Depth, Neuron, 18, 359–368, 1997.
- ↑ Gonzalez, F. and Perez, R., Neural mechanisms underlying stereoscopic vision, Prog Neurobiol, 55(3), 191–224, 1998.
- ↑ 3.0 3.1 लिंडा शापिरो|लिंडा जी. शापिरो और जॉर्ज सी. स्टॉकमैन (2001)। कंप्यूटर दृष्टि। प्रेंटिस हॉल, 371–409। ISBN 0-13-030796-3.
- ↑ "The Computer Vision Laboratory ." JPL.NASA.GOV. JPL/NASA, n.d. Web. 5 Jun 2011. <[1]>.
- ↑ "Spacecraft: Surface Operations: Rover ." JPL.NASA.GOV. JPL/NASA, n.d. Web. 5 Jun 2011. http://marsrovers.jpl.nasa.gov/mission/spacecraft_rover_eyes.html.