द्विनेत्री असमानता: Difference between revisions
(Created page with "द्विनेत्री असमानता, बाईं और दाईं मानवीय आँखों द्वारा देखी गई वस्त...") |
(text) |
||
Line 1: | Line 1: | ||
द्विनेत्री असमानता, बाईं और दाईं मानवीय आँखों द्वारा देखी गई वस्तु की छवि स्थान में अंतर को संदर्भित करती है, जिसके परिणामस्वरूप आँखें क्षैतिज पृथक्करण ([[लंबन]]) होती हैं। मस्तिष्क [[स्टीरियोप्सिस]] में द्वि-आयामी | द्विनेत्री असमानता, बाईं और दाईं मानवीय आँखों द्वारा देखी गई वस्तु की छवि स्थान में अंतर को संदर्भित करती है, जिसके परिणामस्वरूप आँखें क्षैतिज पृथक्करण ([[लंबन]]) होती हैं। मस्तिष्क [[स्टीरियोप्सिस|त्रिविमदृष्टिता]] में द्वि-आयामी दृष्टिपटलीय प्रतिमा से गहनता से जानकारी निकालने के लिए दूरबीन असमानता का उपयोग करता है। [[कंप्यूटर दृष्टि]] में, द्विनेत्री असमानता दो त्रिविम ध्वनिक छवियों के भीतर समान सुविधाओं के निर्देशांक में अंतर को संदर्भित करती है। | ||
एक लक्ष्य के लिए दूरी और/या ऊंचाई निर्धारित करने के लिए [[संयोग रेंजफाइंडर]] द्वारा | एक लक्ष्य के लिए दूरी और/या ऊंचाई निर्धारित करने के लिए [[संयोग रेंजफाइंडर|संयोग परासमापी]] द्वारा परासमापन में | ||
एक समान असमानता का उपयोग किया जा सकता है। खगोल विज्ञान में, पृथ्वी पर विभिन्न स्थानों के बीच असमानता का उपयोग विभिन्न आकाशीय लंबन को निर्धारित करने के लिए किया जा सकता है, और [[तारकीय लंबन]] के लिए पृथ्वी की कक्षा का उपयोग किया जा सकता है। | |||
== परिभाषा == | == परिभाषा == | ||
[[Image:Binocular disparity.png|thumb|right|चित्रा 1. दूरबीन असमानता की परिभाषा (दूर और निकट)।]]प्रत्येक व्यक्ति के आधार पर मानव आंखें क्षैतिज रूप से लगभग 50–75 मिमी (अंतरप्यूपिलरी दूरी) से अलग होती हैं। इस प्रकार, प्रत्येक आंख का दुनिया भर में थोड़ा अलग दृष्टिकोण होता है। ऊर्ध्वाधर किनारे को देखते हुए वैकल्पिक रूप से एक आंख को बंद करने पर इसे आसानी से देखा जा सकता है। द्विनेत्री असमानता दोनों विचारों के बीच ऊर्ध्वाधर किनारे के स्पष्ट क्षैतिज बदलाव से देखी जा सकती है। | [[Image:Binocular disparity.png|thumb|right|चित्रा 1. दूरबीन असमानता की परिभाषा (दूर और निकट)।]]प्रत्येक व्यक्ति के आधार पर मानव आंखें क्षैतिज रूप से लगभग 50–75 मिमी (अंतरप्यूपिलरी दूरी) से अलग होती हैं। इस प्रकार, प्रत्येक आंख का दुनिया भर में थोड़ा अलग दृष्टिकोण होता है। ऊर्ध्वाधर किनारे को देखते हुए वैकल्पिक रूप से एक आंख को बंद करने पर इसे आसानी से देखा जा सकता है। द्विनेत्री असमानता दोनों विचारों के बीच ऊर्ध्वाधर किनारे के स्पष्ट क्षैतिज बदलाव से देखी जा सकती है। | ||
किसी भी समय, दोनों आँखों की दृष्टि रेखा अंतरिक्ष में एक बिंदु पर मिलती है। अंतरिक्ष में यह बिंदु दोनों आँखों के रेटिना पर एक ही स्थान (अर्थात केंद्र) पर प्रोजेक्ट करता है। बाएँ और दाएँ आँख द्वारा देखे गए अलग-अलग दृष्टिकोणों के कारण, अंतरिक्ष में कई अन्य बिंदु संबंधित | किसी भी समय, दोनों आँखों की दृष्टि रेखा अंतरिक्ष में एक बिंदु पर मिलती है। अंतरिक्ष में यह बिंदु दोनों आँखों के रेटिना पर एक ही स्थान (अर्थात केंद्र) पर प्रोजेक्ट करता है। बाएँ और दाएँ आँख द्वारा देखे गए अलग-अलग दृष्टिकोणों के कारण, अंतरिक्ष में कई अन्य बिंदु संबंधित दृष्टिपटलीय स्थानों पर नहीं पड़ते हैं। दृश्य द्विनेत्री असमानता को दो आँखों में प्रक्षेपण के बिंदु के बीच के अंतर के रूप में परिभाषित किया गया है और सामान्यतः [[दृश्य कोण]] के रूप में डिग्री में व्यक्त किया जाता है। <ref name="binocular">Qian, N., [https://www.cell.com/neuron/pdf/S0896-6273(00)81238-6.pdf Binocular Disparity and the Perception of Depth], Neuron, 18, 359–368, 1997.</ref> | ||
द्विनेत्री असमानता शब्द आंख के बाहर किए गए ज्यामितीय मापों को संदर्भित करता है। वास्तविक रेटिना पर छवियों की असमानता आंख के आंतरिक कारकों पर निर्भर करती है, विशेष रूप से | |||
द्विनेत्री असमानता शब्द आंख के बाहर किए गए ज्यामितीय मापों को संदर्भित करता है। वास्तविक रेटिना पर छवियों की असमानता आंख के आंतरिक कारकों पर निर्भर करती है, विशेष रूप से पातिक बिंदुओं का स्थान, भले ही रेटिना का अनुप्रस्थ काट एक पूर्ण चक्र हो। डिग्री के रूप में मापे जाने पर रेटिना पर असमानता द्विनेत्री असमानता के अनुरूप होती है, जबकि आंख के अंदर जटिल संरचना के कारण दूरी के रूप में मापी जाने पर बहुत भिन्न होती है। | |||
चित्र 1: पूर्ण काला घेरा निर्धारण का बिंदु है। नीली वस्तु प्रेक्षक के निकट होती है। इसलिए, इसमें लगभग असमानता है ' | चित्र 1: पूर्ण काला घेरा निर्धारण का बिंदु है। नीली वस्तु प्रेक्षक के निकट होती है। इसलिए, इसमें दृष्टिपटल लगभग असमानता है '. अधिक दूर (हरा) पड़ी वस्तुओं में संगत रूप से दूर असमानता होती है<sub>f</sub>. द्विनेत्री असमानता प्रक्षेपण की दो रेखाओं के बीच का कोण है। जिनमें से एक वस्तु से प्रक्षेपण के वास्तविक बिंदु तक वास्तविक प्रक्षेपण है। अन्य एक निर्धारण बिंदु के पातिक बिंदु के माध्यम से चलने वाला काल्पनिक प्रक्षेपण है। | ||
कंप्यूटर दृष्टि में, द्विनेत्री असमानता की गणना | कंप्यूटर दृष्टि में, द्विनेत्री असमानता की गणना त्रिविम ध्वनिक कैमरों के एक सम्मुच्चय से ली गई त्रिविम ध्वनिक छवियों से की जाती है। इन कैमरों के बीच परिवर्तनशील दूरी, जिसे आधार रेखा कहा जाता है, उनके संबंधित छवि तल पर एक विशिष्ट बिंदु की असमानता को प्रभावित कर सकती है। जैसे-जैसे आधार रेखा बढ़ती है, बिंदु पर दृष्टि को संरेखित करने के लिए आवश्यक अधिक कोण के कारण असमानता बढ़ती है। हालांकि, कंप्यूटर दृष्टि में, द्विनेत्री असमानता को दृश्य कोण के बजाय दाएं और बाएं छवियों के बीच बिंदु के समन्वय अंतर के रूप में संदर्भित किया जाता है। इकाइयों को सामान्यतः पिक्सेल में मापा जाता है। | ||
== 2 | == 2 D छवियों के साथ न्यूरॉन्स को धोखा देना == | ||
[[Image:Binocular disparity 2D.png|thumb|right|चित्रा 2. विमान में गहराई से असमानता का अनुकरण। (चित्र 1 से संबंधित)]]रेटिना ([[प्राथमिक दृश्य प्रांतस्था]]) से आने वाली दृश्य जानकारी को संसाधित करने के लिए जिम्मेदार मस्तिष्क के एक हिस्से में मस्तिष्क कोशिकाएं ([[न्यूरॉन]]्स) आंखों से उनके | [[Image:Binocular disparity 2D.png|thumb|right|चित्रा 2. विमान में गहराई से असमानता का अनुकरण। (चित्र 1 से संबंधित)]]रेटिना ([[प्राथमिक दृश्य प्रांतस्था]]) से आने वाली दृश्य जानकारी को संसाधित करने के लिए जिम्मेदार मस्तिष्क के एक हिस्से में मस्तिष्क कोशिकाएं ([[न्यूरॉन]]्स) आंखों से उनके निविष्ट में असमानता के अस्तित्व का पता लगा सकती हैं। विशेष रूप से, ये न्यूरॉन्स सक्रिय होंगे, यदि उनकी विशेष असमानता वाली वस्तु दृश्य क्षेत्र के उस हिस्से के भीतर होती है, जिस तक उनकी पहुंच ([[ग्रहणशील क्षेत्र]]) है। <ref name="neural">Gonzalez, F. and Perez, R., [https://www.sciencedirect.com/science/article/pii/S0301008298000124 Neural mechanisms underlying stereoscopic vision], Prog Neurobiol, 55(3), 191–224, 1998.</ref> | ||
असमानता के संबंध में इन न्यूरॉन्स के सटीक गुणों की जांच करने वाले शोधकर्ता कोशिकाओं को विभिन्न असमानताओं के साथ दृश्य [[उत्तेजना (फिजियोलॉजी)]] | असमानता के संबंध में इन न्यूरॉन्स के सटीक गुणों की जांच करने वाले शोधकर्ता कोशिकाओं को विभिन्न असमानताओं के साथ दृश्य [[उत्तेजना (फिजियोलॉजी)]] प्रस्तुत करते हैं और देखते हैं कि वे सक्रिय हैं या नहीं। अलग-अलग असमानताओं के साथ उत्तेजनाओं को प्रस्तुत करने की एक संभावना वस्तुओं को आंखों के सामने अलग-अलग गहराई में रखना है। हालाँकि, इस पद्धति की खामी दूर रखी गई वस्तुओं के लिए पर्याप्त सटीक नहीं हो सकती है क्योंकि उनमें छोटी असमानताएँ होती हैं जबकि निकट की वस्तुओं में अधिक असमानताएँ होंगी। इसके बजाय, न्यूरोसाइंटिस्ट एक वैकल्पिक विधि का उपयोग करते हैं जैसा कि चित्र 2 में दिखाया गया है। | ||
चित्रा 2: निर्धारण बिंदु की तुलना में अलग-अलग गहराई वाली वस्तु की असमानता वैकल्पिक रूप से वस्तु की एक छवि को एक आंख और उसी छवि के पार्श्व रूप से स्थानांतरित संस्करण को दूसरी आंख में | चित्रा 2: निर्धारण बिंदु की तुलना में अलग-अलग गहराई वाली वस्तु की असमानता वैकल्पिक रूप से वस्तु की एक छवि को एक आंख और उसी छवि के पार्श्व रूप से स्थानांतरित संस्करण को दूसरी आंख में प्रस्तुत करके उत्पादित की जा सकती है। यह पूर्ण काला घेरा निर्धारण का बिंदु है। अलग-अलग गहराई की वस्तुओं को बायीं आंख की यह लाइन के साथ रखा जाता है। किसी वस्तु की गहराई में बदलाव (भरे रंग के घेरे) से उत्पन्न समान असमानता को बाद में वस्तु को लगातार गहराई में उस तस्वीर में स्थानांतरित करके भी उत्पन्न किया जा सकता है जिसे एक आँख देखती है (रंगीन मार्जिन के साथ काले घेरे)। ध्यान दें कि निकट असमानताओं के लिए पार्श्व बदलाव दूर असमानताओं की तुलना में समान गहराई के अनुरूप बड़ा होना चाहिए। यह न्यूरोसाइंटिस्ट सामान्यतः न्यूरॉन्स की विषमता चयनात्मकता का अध्ययन करने के लिए [[यादृच्छिक डॉट उत्तेजना]]ओं के साथ करते हैं क्योंकि असमानताओं का परीक्षण करने के लिए आवश्यक पार्श्व दूरी गहराई परीक्षणों का उपयोग करके आवश्यक दूरी से कम है। यह सिद्धांत [[autostereogram|ऑटोस्टेरोग्राम]] भ्रम में भी लागू किया गया है। | ||
== डिजिटल | == डिजिटल त्रिविम ध्वनिक छवियों का उपयोग करके कंप्यूटिंग असमानता == | ||
दो | दो त्रिविम ध्वनिक छवियों के बीच सुविधाओं की असमानता की गणना सामान्यतः एक छवि सुविधा के बाईं ओर बदलाव के रूप में की जाती है, जब उसे सही छवि में देखा जाता है। <ref name="comp_vision">लिंडा शापिरो|लिंडा जी. शापिरो और जॉर्ज सी. स्टॉकमैन (2001)। कंप्यूटर दृष्टि। प्रेंटिस हॉल, 371–409। {{ISBN|0-13-030796-3}}.</ref> उदाहरण के लिए, बाईं छवि में x निर्देशांक t ([[पिक्सेल]] में मापा गया) पर दिखाई देने वाला एक बिंदु दाईं छवि में x निर्देशांक t − 3 पर उपस्थित हो सकता है। इस स्थिति में, सही छवि में उस स्थान पर असमानता 3 पिक्सेल होगी। | ||
त्वरित असमानता गणना की अनुमति देने के लिए | त्वरित असमानता गणना की अनुमति देने के लिए त्रिविम ध्वनिक छवियों को हमेशा सही ढंग से संरेखित नहीं किया जा सकता है। उदाहरण के लिए, कैमरों के सम्मुच्चय को स्तर से थोड़ा घुमाया जा सकता है। [[छवि सुधार]] के रूप में जानी जाने वाली प्रक्रिया के माध्यम से, दोनों छवियों को केवल क्षैतिज दिशा में असमानताओं की अनुमति देने के लिए घुमाया जाता है (अर्थात y छवि निर्देशांक में कोई असमानता नहीं है)।<ref name="comp_vision" /> यह एक ऐसी संपत्ति है जिसे प्रतिबिंब प्रग्रहण करने से पहले त्रिविम ध्वनिक कैमरों के सटीक संरेखण द्वारा भी प्राप्त किया जा सकता है। | ||
=== कंप्यूटर | === कंप्यूटर कलन विधि === | ||
सुधार के बाद, एक | सुधार के बाद, एक कलन विधि का उपयोग करके पत्राचार समस्या को हल किया जा सकता है जो छवि सुविधाओं से मेल खाने के लिए बाएं और दाएं दोनों छवियों को स्कैन करता है। इस समस्या का एक सामान्य तरीका बाईं छवि में प्रत्येक पिक्सेल के चारों ओर एक छोटा छवि योजक बनाना है। इन छवि योजक की तुलना उनके संबंधित छवि योजक की तुलना करके सही छवि में सभी संभावित विषमताओं से की जाती है। उदाहरण के लिए, 1 की असमानता के लिए, बाईं छवि में योजक की तुलना दाईं ओर समान आकार के योजक से की जाएगी, जिसे एक पिक्सेल द्वारा बाईं ओर स्थानांतरित कर दिया जाएगा। इन दो योजक के बीच तुलना निम्नलिखित समीकरणों में से एक से कम्प्यूटेशनल उपाय प्राप्त करके की जा सकती है जो योजक में प्रत्येक पिक्सेल की तुलना करता है। निम्नलिखित सभी समीकरणों के लिए, L और R बाएँ और दाएँ स्तंभों को संदर्भित करते हैं जबकि r और c वर्तमान पंक्ति और उन छवियों के स्तंभ को संदर्भित करते हैं जिनकी जांच की जा रही है। d सही छवि की असमानता को संदर्भित करता है। | ||
* सामान्यीकृत सहसंबंध: <math display="block">\frac{\sum{\sum{ L(r,c) \cdot R(r,c-d) }}}{\sqrt{(\sum{\sum{ L(r,c)^2 }}) \cdot (\sum{\sum{ R(r,c-d)^2 }})}}</math> | * सामान्यीकृत सहसंबंध: <math display="block">\frac{\sum{\sum{ L(r,c) \cdot R(r,c-d) }}}{\sqrt{(\sum{\sum{ L(r,c)^2 }}) \cdot (\sum{\sum{ R(r,c-d)^2 }})}}</math> | ||
* चुकता अंतरों का योग: <math display="block">\sum{\sum{ (L(r,c) - R(r,c-d))^2 }}</math> | * चुकता अंतरों का योग: <math display="block">\sum{\sum{ (L(r,c) - R(r,c-d))^2 }}</math> | ||
* पूर्ण अंतर का योग: <math display="block">\sum{\sum{ \left | L(r,c) - R(r,c-d) \right \vert }}</math> | * पूर्ण अंतर का योग: <math display="block">\sum{\sum{ \left | L(r,c) - R(r,c-d) \right \vert }}</math> | ||
उपरोक्त विधियों में से किसी एक का उपयोग करके सबसे कम संगणित मान के साथ असमानता को छवि विशेषता के लिए असमानता माना जाता है। यह न्यूनतम | उपरोक्त विधियों में से किसी एक का उपयोग करके सबसे कम संगणित मान के साथ असमानता को छवि विशेषता के लिए असमानता माना जाता है। यह न्यूनतम प्राप्तांक इंगित करता है कि कलन विधि ने दोनों छवियों में संबंधित सुविधाओं का सबसे अच्छा मिलान पाया है। | ||
ऊपर वर्णित विधि एक [[क्रूर-बल खोज]] | ऊपर वर्णित विधि एक [[क्रूर-बल खोज]] कलन विधि है। बड़े योजक और/या छवि आकार के साथ, यह तकनीक बहुत समय लेने वाली हो सकती है क्योंकि सबसे कम सहसंबंध प्राप्तांक खोजने के लिए पिक्सेल की लगातार जांच की जा रही है। हालाँकि, इस तकनीक में अनावश्यक दोहराव भी सम्मिलित है क्योंकि कई पिक्सेल अंशछादन होते हैं। एक अधिक कुशल कलन विधि में पिछले पिक्सेल से सभी मानों को याद रखना सम्मिलित है। एक और भी अधिक कुशल कलन विधि में पिछली पंक्ति से पंक्त् योग को याद रखना सम्मिलित है (पिछले पिक्सेल से सभी मानों को याद रखने के अतिरिक्त)। तकनीकें जो पिछली जानकारी को सहेजती हैं, इस छवि विश्लेषण प्रक्रिया की [[एल्गोरिथम दक्षता|कलन विधि दक्षता]] को बहुत बढ़ा सकती हैं। | ||
== छवियों से असमानता का उपयोग == | == छवियों से असमानता का उपयोग == | ||
असमानता के ज्ञान का उपयोग | असमानता के ज्ञान का उपयोग त्रिविम ध्वनिक छवि से जानकारी निकालने के लिए किया जा सकता है। एक स्तिथि है कि असमानता सबसे उपयोगी है गहराई/दूरी गणना के लिए कैमरों से असमानता और दूरी विपरीत रूप से संबंधित हैं। जैसे-जैसे कैमरों से दूरी बढ़ती है, असमानता कम होती जाती है। यह त्रिविम ध्वनिक छवियों में गहराई की धारणा के लिए अनुमति देता है। ज्यामिति और बीजगणित का उपयोग करके, 2D त्रिविम ध्वनिक छवियों में दिखाई देने वाले बिंदुओं को 3D स्थल में निर्देशांक के रूप में मानचित्र किया जा सकता है। | ||
यह अवधारणा | यह अवधारणा मार्गनिर्देशन के लिए विशेष रूप से उपयोगी है। उदाहरण के लिए, [[मार्स एक्सप्लोरेशन रोवर|मंगल अन्वेषण रोवर]] बाधाओं के लिए इलाके को क्रमवीक्षण करने के लिए इसी तरह की विधि का उपयोग करता है। <ref>"The Computer Vision Laboratory ." JPL.NASA.GOV. JPL/NASA, n.d. Web. 5 Jun 2011. <[https://web.archive.org/web/20080531113553/http://www-robotics.jpl.nasa.gov/facilities/facilityImage.cfm?Facility=13&Image=335]>.</ref> रोवर अपने त्रिविम मार्गनिर्देशन कैमरों के साथ छवियों की एक जोड़ी को अधिकृत करता है और ऊंचा वस्तुओं (जैसे बोल्डर) का पता लगाने के लिए असमानता की गणना की जाती है। <ref>"Spacecraft: Surface Operations: Rover ." JPL.NASA.GOV. JPL/NASA, n.d. Web. 5 Jun 2011. http://marsrovers.jpl.nasa.gov/mission/spacecraft_rover_eyes.html.</ref> इसके अतिरिक्त, रोवर के सापेक्ष वस्तुओं के विस्थापन को मापकर बाद की त्रिविम ध्वनिक छवियों से स्थान और गति डेटा निकाला जा सकता है। कुछ स्तिथियों में, यह इस प्रकार की जानकारी का सबसे अच्छा स्रोत है क्योंकि टायर फिसलने के कारण पहियों में संकेतक संवेदक गलत हो सकते हैं। | ||
== यह भी देखें == | == यह भी देखें == |
Revision as of 01:17, 12 June 2023
द्विनेत्री असमानता, बाईं और दाईं मानवीय आँखों द्वारा देखी गई वस्तु की छवि स्थान में अंतर को संदर्भित करती है, जिसके परिणामस्वरूप आँखें क्षैतिज पृथक्करण (लंबन) होती हैं। मस्तिष्क त्रिविमदृष्टिता में द्वि-आयामी दृष्टिपटलीय प्रतिमा से गहनता से जानकारी निकालने के लिए दूरबीन असमानता का उपयोग करता है। कंप्यूटर दृष्टि में, द्विनेत्री असमानता दो त्रिविम ध्वनिक छवियों के भीतर समान सुविधाओं के निर्देशांक में अंतर को संदर्भित करती है।
एक लक्ष्य के लिए दूरी और/या ऊंचाई निर्धारित करने के लिए संयोग परासमापी द्वारा परासमापन में
एक समान असमानता का उपयोग किया जा सकता है। खगोल विज्ञान में, पृथ्वी पर विभिन्न स्थानों के बीच असमानता का उपयोग विभिन्न आकाशीय लंबन को निर्धारित करने के लिए किया जा सकता है, और तारकीय लंबन के लिए पृथ्वी की कक्षा का उपयोग किया जा सकता है।
परिभाषा
प्रत्येक व्यक्ति के आधार पर मानव आंखें क्षैतिज रूप से लगभग 50–75 मिमी (अंतरप्यूपिलरी दूरी) से अलग होती हैं। इस प्रकार, प्रत्येक आंख का दुनिया भर में थोड़ा अलग दृष्टिकोण होता है। ऊर्ध्वाधर किनारे को देखते हुए वैकल्पिक रूप से एक आंख को बंद करने पर इसे आसानी से देखा जा सकता है। द्विनेत्री असमानता दोनों विचारों के बीच ऊर्ध्वाधर किनारे के स्पष्ट क्षैतिज बदलाव से देखी जा सकती है।
किसी भी समय, दोनों आँखों की दृष्टि रेखा अंतरिक्ष में एक बिंदु पर मिलती है। अंतरिक्ष में यह बिंदु दोनों आँखों के रेटिना पर एक ही स्थान (अर्थात केंद्र) पर प्रोजेक्ट करता है। बाएँ और दाएँ आँख द्वारा देखे गए अलग-अलग दृष्टिकोणों के कारण, अंतरिक्ष में कई अन्य बिंदु संबंधित दृष्टिपटलीय स्थानों पर नहीं पड़ते हैं। दृश्य द्विनेत्री असमानता को दो आँखों में प्रक्षेपण के बिंदु के बीच के अंतर के रूप में परिभाषित किया गया है और सामान्यतः दृश्य कोण के रूप में डिग्री में व्यक्त किया जाता है। [1]
द्विनेत्री असमानता शब्द आंख के बाहर किए गए ज्यामितीय मापों को संदर्भित करता है। वास्तविक रेटिना पर छवियों की असमानता आंख के आंतरिक कारकों पर निर्भर करती है, विशेष रूप से पातिक बिंदुओं का स्थान, भले ही रेटिना का अनुप्रस्थ काट एक पूर्ण चक्र हो। डिग्री के रूप में मापे जाने पर रेटिना पर असमानता द्विनेत्री असमानता के अनुरूप होती है, जबकि आंख के अंदर जटिल संरचना के कारण दूरी के रूप में मापी जाने पर बहुत भिन्न होती है।
चित्र 1: पूर्ण काला घेरा निर्धारण का बिंदु है। नीली वस्तु प्रेक्षक के निकट होती है। इसलिए, इसमें दृष्टिपटल लगभग असमानता है '. अधिक दूर (हरा) पड़ी वस्तुओं में संगत रूप से दूर असमानता होती हैf. द्विनेत्री असमानता प्रक्षेपण की दो रेखाओं के बीच का कोण है। जिनमें से एक वस्तु से प्रक्षेपण के वास्तविक बिंदु तक वास्तविक प्रक्षेपण है। अन्य एक निर्धारण बिंदु के पातिक बिंदु के माध्यम से चलने वाला काल्पनिक प्रक्षेपण है।
कंप्यूटर दृष्टि में, द्विनेत्री असमानता की गणना त्रिविम ध्वनिक कैमरों के एक सम्मुच्चय से ली गई त्रिविम ध्वनिक छवियों से की जाती है। इन कैमरों के बीच परिवर्तनशील दूरी, जिसे आधार रेखा कहा जाता है, उनके संबंधित छवि तल पर एक विशिष्ट बिंदु की असमानता को प्रभावित कर सकती है। जैसे-जैसे आधार रेखा बढ़ती है, बिंदु पर दृष्टि को संरेखित करने के लिए आवश्यक अधिक कोण के कारण असमानता बढ़ती है। हालांकि, कंप्यूटर दृष्टि में, द्विनेत्री असमानता को दृश्य कोण के बजाय दाएं और बाएं छवियों के बीच बिंदु के समन्वय अंतर के रूप में संदर्भित किया जाता है। इकाइयों को सामान्यतः पिक्सेल में मापा जाता है।
2 D छवियों के साथ न्यूरॉन्स को धोखा देना
रेटिना (प्राथमिक दृश्य प्रांतस्था) से आने वाली दृश्य जानकारी को संसाधित करने के लिए जिम्मेदार मस्तिष्क के एक हिस्से में मस्तिष्क कोशिकाएं (न्यूरॉन्स) आंखों से उनके निविष्ट में असमानता के अस्तित्व का पता लगा सकती हैं। विशेष रूप से, ये न्यूरॉन्स सक्रिय होंगे, यदि उनकी विशेष असमानता वाली वस्तु दृश्य क्षेत्र के उस हिस्से के भीतर होती है, जिस तक उनकी पहुंच (ग्रहणशील क्षेत्र) है। [2]
असमानता के संबंध में इन न्यूरॉन्स के सटीक गुणों की जांच करने वाले शोधकर्ता कोशिकाओं को विभिन्न असमानताओं के साथ दृश्य उत्तेजना (फिजियोलॉजी) प्रस्तुत करते हैं और देखते हैं कि वे सक्रिय हैं या नहीं। अलग-अलग असमानताओं के साथ उत्तेजनाओं को प्रस्तुत करने की एक संभावना वस्तुओं को आंखों के सामने अलग-अलग गहराई में रखना है। हालाँकि, इस पद्धति की खामी दूर रखी गई वस्तुओं के लिए पर्याप्त सटीक नहीं हो सकती है क्योंकि उनमें छोटी असमानताएँ होती हैं जबकि निकट की वस्तुओं में अधिक असमानताएँ होंगी। इसके बजाय, न्यूरोसाइंटिस्ट एक वैकल्पिक विधि का उपयोग करते हैं जैसा कि चित्र 2 में दिखाया गया है।
चित्रा 2: निर्धारण बिंदु की तुलना में अलग-अलग गहराई वाली वस्तु की असमानता वैकल्पिक रूप से वस्तु की एक छवि को एक आंख और उसी छवि के पार्श्व रूप से स्थानांतरित संस्करण को दूसरी आंख में प्रस्तुत करके उत्पादित की जा सकती है। यह पूर्ण काला घेरा निर्धारण का बिंदु है। अलग-अलग गहराई की वस्तुओं को बायीं आंख की यह लाइन के साथ रखा जाता है। किसी वस्तु की गहराई में बदलाव (भरे रंग के घेरे) से उत्पन्न समान असमानता को बाद में वस्तु को लगातार गहराई में उस तस्वीर में स्थानांतरित करके भी उत्पन्न किया जा सकता है जिसे एक आँख देखती है (रंगीन मार्जिन के साथ काले घेरे)। ध्यान दें कि निकट असमानताओं के लिए पार्श्व बदलाव दूर असमानताओं की तुलना में समान गहराई के अनुरूप बड़ा होना चाहिए। यह न्यूरोसाइंटिस्ट सामान्यतः न्यूरॉन्स की विषमता चयनात्मकता का अध्ययन करने के लिए यादृच्छिक डॉट उत्तेजनाओं के साथ करते हैं क्योंकि असमानताओं का परीक्षण करने के लिए आवश्यक पार्श्व दूरी गहराई परीक्षणों का उपयोग करके आवश्यक दूरी से कम है। यह सिद्धांत ऑटोस्टेरोग्राम भ्रम में भी लागू किया गया है।
डिजिटल त्रिविम ध्वनिक छवियों का उपयोग करके कंप्यूटिंग असमानता
दो त्रिविम ध्वनिक छवियों के बीच सुविधाओं की असमानता की गणना सामान्यतः एक छवि सुविधा के बाईं ओर बदलाव के रूप में की जाती है, जब उसे सही छवि में देखा जाता है। [3] उदाहरण के लिए, बाईं छवि में x निर्देशांक t (पिक्सेल में मापा गया) पर दिखाई देने वाला एक बिंदु दाईं छवि में x निर्देशांक t − 3 पर उपस्थित हो सकता है। इस स्थिति में, सही छवि में उस स्थान पर असमानता 3 पिक्सेल होगी।
त्वरित असमानता गणना की अनुमति देने के लिए त्रिविम ध्वनिक छवियों को हमेशा सही ढंग से संरेखित नहीं किया जा सकता है। उदाहरण के लिए, कैमरों के सम्मुच्चय को स्तर से थोड़ा घुमाया जा सकता है। छवि सुधार के रूप में जानी जाने वाली प्रक्रिया के माध्यम से, दोनों छवियों को केवल क्षैतिज दिशा में असमानताओं की अनुमति देने के लिए घुमाया जाता है (अर्थात y छवि निर्देशांक में कोई असमानता नहीं है)।[3] यह एक ऐसी संपत्ति है जिसे प्रतिबिंब प्रग्रहण करने से पहले त्रिविम ध्वनिक कैमरों के सटीक संरेखण द्वारा भी प्राप्त किया जा सकता है।
कंप्यूटर कलन विधि
सुधार के बाद, एक कलन विधि का उपयोग करके पत्राचार समस्या को हल किया जा सकता है जो छवि सुविधाओं से मेल खाने के लिए बाएं और दाएं दोनों छवियों को स्कैन करता है। इस समस्या का एक सामान्य तरीका बाईं छवि में प्रत्येक पिक्सेल के चारों ओर एक छोटा छवि योजक बनाना है। इन छवि योजक की तुलना उनके संबंधित छवि योजक की तुलना करके सही छवि में सभी संभावित विषमताओं से की जाती है। उदाहरण के लिए, 1 की असमानता के लिए, बाईं छवि में योजक की तुलना दाईं ओर समान आकार के योजक से की जाएगी, जिसे एक पिक्सेल द्वारा बाईं ओर स्थानांतरित कर दिया जाएगा। इन दो योजक के बीच तुलना निम्नलिखित समीकरणों में से एक से कम्प्यूटेशनल उपाय प्राप्त करके की जा सकती है जो योजक में प्रत्येक पिक्सेल की तुलना करता है। निम्नलिखित सभी समीकरणों के लिए, L और R बाएँ और दाएँ स्तंभों को संदर्भित करते हैं जबकि r और c वर्तमान पंक्ति और उन छवियों के स्तंभ को संदर्भित करते हैं जिनकी जांच की जा रही है। d सही छवि की असमानता को संदर्भित करता है।
- सामान्यीकृत सहसंबंध:
- चुकता अंतरों का योग:
- पूर्ण अंतर का योग:
उपरोक्त विधियों में से किसी एक का उपयोग करके सबसे कम संगणित मान के साथ असमानता को छवि विशेषता के लिए असमानता माना जाता है। यह न्यूनतम प्राप्तांक इंगित करता है कि कलन विधि ने दोनों छवियों में संबंधित सुविधाओं का सबसे अच्छा मिलान पाया है।
ऊपर वर्णित विधि एक क्रूर-बल खोज कलन विधि है। बड़े योजक और/या छवि आकार के साथ, यह तकनीक बहुत समय लेने वाली हो सकती है क्योंकि सबसे कम सहसंबंध प्राप्तांक खोजने के लिए पिक्सेल की लगातार जांच की जा रही है। हालाँकि, इस तकनीक में अनावश्यक दोहराव भी सम्मिलित है क्योंकि कई पिक्सेल अंशछादन होते हैं। एक अधिक कुशल कलन विधि में पिछले पिक्सेल से सभी मानों को याद रखना सम्मिलित है। एक और भी अधिक कुशल कलन विधि में पिछली पंक्ति से पंक्त् योग को याद रखना सम्मिलित है (पिछले पिक्सेल से सभी मानों को याद रखने के अतिरिक्त)। तकनीकें जो पिछली जानकारी को सहेजती हैं, इस छवि विश्लेषण प्रक्रिया की कलन विधि दक्षता को बहुत बढ़ा सकती हैं।
छवियों से असमानता का उपयोग
असमानता के ज्ञान का उपयोग त्रिविम ध्वनिक छवि से जानकारी निकालने के लिए किया जा सकता है। एक स्तिथि है कि असमानता सबसे उपयोगी है गहराई/दूरी गणना के लिए कैमरों से असमानता और दूरी विपरीत रूप से संबंधित हैं। जैसे-जैसे कैमरों से दूरी बढ़ती है, असमानता कम होती जाती है। यह त्रिविम ध्वनिक छवियों में गहराई की धारणा के लिए अनुमति देता है। ज्यामिति और बीजगणित का उपयोग करके, 2D त्रिविम ध्वनिक छवियों में दिखाई देने वाले बिंदुओं को 3D स्थल में निर्देशांक के रूप में मानचित्र किया जा सकता है।
यह अवधारणा मार्गनिर्देशन के लिए विशेष रूप से उपयोगी है। उदाहरण के लिए, मंगल अन्वेषण रोवर बाधाओं के लिए इलाके को क्रमवीक्षण करने के लिए इसी तरह की विधि का उपयोग करता है। [4] रोवर अपने त्रिविम मार्गनिर्देशन कैमरों के साथ छवियों की एक जोड़ी को अधिकृत करता है और ऊंचा वस्तुओं (जैसे बोल्डर) का पता लगाने के लिए असमानता की गणना की जाती है। [5] इसके अतिरिक्त, रोवर के सापेक्ष वस्तुओं के विस्थापन को मापकर बाद की त्रिविम ध्वनिक छवियों से स्थान और गति डेटा निकाला जा सकता है। कुछ स्तिथियों में, यह इस प्रकार की जानकारी का सबसे अच्छा स्रोत है क्योंकि टायर फिसलने के कारण पहियों में संकेतक संवेदक गलत हो सकते हैं।
यह भी देखें
संदर्भ
- ↑ Qian, N., Binocular Disparity and the Perception of Depth, Neuron, 18, 359–368, 1997.
- ↑ Gonzalez, F. and Perez, R., Neural mechanisms underlying stereoscopic vision, Prog Neurobiol, 55(3), 191–224, 1998.
- ↑ 3.0 3.1 लिंडा शापिरो|लिंडा जी. शापिरो और जॉर्ज सी. स्टॉकमैन (2001)। कंप्यूटर दृष्टि। प्रेंटिस हॉल, 371–409। ISBN 0-13-030796-3.
- ↑ "The Computer Vision Laboratory ." JPL.NASA.GOV. JPL/NASA, n.d. Web. 5 Jun 2011. <[1]>.
- ↑ "Spacecraft: Surface Operations: Rover ." JPL.NASA.GOV. JPL/NASA, n.d. Web. 5 Jun 2011. http://marsrovers.jpl.nasa.gov/mission/spacecraft_rover_eyes.html.