द्विनेत्री असमानता: Difference between revisions

From Vigyanwiki
(Created page with "द्विनेत्री असमानता, बाईं और दाईं मानवीय आँखों द्वारा देखी गई वस्त...")
 
(text)
Line 1: Line 1:
द्विनेत्री असमानता, बाईं और दाईं मानवीय आँखों द्वारा देखी गई वस्तु की छवि स्थान में अंतर को संदर्भित करती है, जिसके परिणामस्वरूप आँखें क्षैतिज पृथक्करण ([[लंबन]]) होती हैं। मस्तिष्क [[स्टीरियोप्सिस]] में द्वि-आयामी [[रेटिना छवि]]यों से गहराई से जानकारी निकालने के लिए दूरबीन असमानता का उपयोग करता है। [[कंप्यूटर दृष्टि]] में, द्विनेत्री असमानता दो स्टीरियो छवियों के भीतर समान सुविधाओं के निर्देशांक में अंतर को संदर्भित करती है।
द्विनेत्री असमानता, बाईं और दाईं मानवीय आँखों द्वारा देखी गई वस्तु की छवि स्थान में अंतर को संदर्भित करती है, जिसके परिणामस्वरूप आँखें क्षैतिज पृथक्करण ([[लंबन]]) होती हैं। मस्तिष्क [[स्टीरियोप्सिस|त्रिविमदृष्‍टिता]] में द्वि-आयामी दृष्‍टिपटलीय प्रतिमा से गहनता से जानकारी निकालने के लिए दूरबीन असमानता का उपयोग करता है। [[कंप्यूटर दृष्टि]] में, द्विनेत्री असमानता दो त्रिविम ध्वनिक छवियों के भीतर समान सुविधाओं के निर्देशांक में अंतर को संदर्भित करती है।


एक लक्ष्य के लिए दूरी और/या ऊंचाई निर्धारित करने के लिए [[संयोग रेंजफाइंडर]] द्वारा रेंजफाइंडिंग में एक समान असमानता का उपयोग किया जा सकता है। खगोल विज्ञान में, पृथ्वी पर विभिन्न स्थानों के बीच असमानता का उपयोग विभिन्न आकाशीय लंबन को निर्धारित करने के लिए किया जा सकता है, और [[तारकीय लंबन]] के लिए पृथ्वी की कक्षा का उपयोग किया जा सकता है।
एक लक्ष्य के लिए दूरी और/या ऊंचाई निर्धारित करने के लिए [[संयोग रेंजफाइंडर|संयोग परासमापी]] द्वारा परासमापन में  
 
एक समान असमानता का उपयोग किया जा सकता है। खगोल विज्ञान में, पृथ्वी पर विभिन्न स्थानों के बीच असमानता का उपयोग विभिन्न आकाशीय लंबन को निर्धारित करने के लिए किया जा सकता है, और [[तारकीय लंबन]] के लिए पृथ्वी की कक्षा का उपयोग किया जा सकता है।


== परिभाषा ==
== परिभाषा ==
[[Image:Binocular disparity.png|thumb|right|चित्रा 1. दूरबीन असमानता की परिभाषा (दूर और निकट)।]]प्रत्येक व्यक्ति के आधार पर मानव आंखें क्षैतिज रूप से लगभग 50–75 मिमी (अंतरप्यूपिलरी दूरी) से अलग होती हैं। इस प्रकार, प्रत्येक आंख का दुनिया भर में थोड़ा अलग दृष्टिकोण होता है। ऊर्ध्वाधर किनारे को देखते हुए वैकल्पिक रूप से एक आंख को बंद करने पर इसे आसानी से देखा जा सकता है। द्विनेत्री असमानता दोनों विचारों के बीच ऊर्ध्वाधर किनारे के स्पष्ट क्षैतिज बदलाव से देखी जा सकती है।
[[Image:Binocular disparity.png|thumb|right|चित्रा 1. दूरबीन असमानता की परिभाषा (दूर और निकट)।]]प्रत्येक व्यक्ति के आधार पर मानव आंखें क्षैतिज रूप से लगभग 50–75 मिमी (अंतरप्यूपिलरी दूरी) से अलग होती हैं। इस प्रकार, प्रत्येक आंख का दुनिया भर में थोड़ा अलग दृष्टिकोण होता है। ऊर्ध्वाधर किनारे को देखते हुए वैकल्पिक रूप से एक आंख को बंद करने पर इसे आसानी से देखा जा सकता है। द्विनेत्री असमानता दोनों विचारों के बीच ऊर्ध्वाधर किनारे के स्पष्ट क्षैतिज बदलाव से देखी जा सकती है।


किसी भी समय, दोनों आँखों की दृष्टि रेखा अंतरिक्ष में एक बिंदु पर मिलती है। अंतरिक्ष में यह बिंदु दोनों आँखों के रेटिना पर एक ही स्थान (अर्थात केंद्र) पर प्रोजेक्ट करता है। बाएँ और दाएँ आँख द्वारा देखे गए अलग-अलग दृष्टिकोणों के कारण, अंतरिक्ष में कई अन्य बिंदु संबंधित रेटिनल स्थानों पर नहीं पड़ते हैं। दृश्य द्विनेत्री असमानता को दो आँखों में प्रक्षेपण के बिंदु के बीच के अंतर के रूप में परिभाषित किया गया है और आमतौर पर [[दृश्य कोण]] के रूप में डिग्री में व्यक्त किया जाता है।<ref name="binocular">Qian, N., [https://www.cell.com/neuron/pdf/S0896-6273(00)81238-6.pdf Binocular Disparity and the Perception of Depth], Neuron, 18, 359–368, 1997.</ref>
किसी भी समय, दोनों आँखों की दृष्टि रेखा अंतरिक्ष में एक बिंदु पर मिलती है। अंतरिक्ष में यह बिंदु दोनों आँखों के रेटिना पर एक ही स्थान (अर्थात केंद्र) पर प्रोजेक्ट करता है। बाएँ और दाएँ आँख द्वारा देखे गए अलग-अलग दृष्टिकोणों के कारण, अंतरिक्ष में कई अन्य बिंदु संबंधित दृष्टिपटलीय स्थानों पर नहीं पड़ते हैं। दृश्य द्विनेत्री असमानता को दो आँखों में प्रक्षेपण के बिंदु के बीच के अंतर के रूप में परिभाषित किया गया है और सामान्यतः [[दृश्य कोण]] के रूप में डिग्री में व्यक्त किया जाता है। <ref name="binocular">Qian, N., [https://www.cell.com/neuron/pdf/S0896-6273(00)81238-6.pdf Binocular Disparity and the Perception of Depth], Neuron, 18, 359–368, 1997.</ref>
द्विनेत्री असमानता शब्द आंख के बाहर किए गए ज्यामितीय मापों को संदर्भित करता है। वास्तविक रेटिना पर छवियों की असमानता आंख के आंतरिक कारकों पर निर्भर करती है, विशेष रूप से नोडल बिंदुओं का स्थान, भले ही रेटिना का क्रॉस सेक्शन एक पूर्ण चक्र हो। डिग्री के रूप में मापे जाने पर रेटिना पर असमानता द्विनेत्री असमानता के अनुरूप होती है, जबकि आंख के अंदर जटिल संरचना के कारण दूरी के रूप में मापी जाने पर बहुत भिन्न होती है।
 
द्विनेत्री असमानता शब्द आंख के बाहर किए गए ज्यामितीय मापों को संदर्भित करता है। वास्तविक रेटिना पर छवियों की असमानता आंख के आंतरिक कारकों पर निर्भर करती है, विशेष रूप से पातिक बिंदुओं का स्थान, भले ही रेटिना का अनुप्रस्थ काट एक पूर्ण चक्र हो। डिग्री के रूप में मापे जाने पर रेटिना पर असमानता द्विनेत्री असमानता के अनुरूप होती है, जबकि आंख के अंदर जटिल संरचना के कारण दूरी के रूप में मापी जाने पर बहुत भिन्न होती है।


चित्र 1: पूर्ण काला घेरा निर्धारण का बिंदु है। नीली वस्तु प्रेक्षक के निकट होती है। इसलिए, इसमें लगभग असमानता है 'डी<sub>n</sub>. अधिक दूर (हरा) पड़ी वस्तुओं में संगत रूप से दूर असमानता होती है<sub>f</sub>. द्विनेत्री असमानता प्रक्षेपण की दो रेखाओं के बीच का कोण है। जिनमें से एक वस्तु से प्रक्षेपण के वास्तविक बिंदु तक वास्तविक प्रक्षेपण है। अन्य एक निर्धारण बिंदु के नोडल बिंदु के माध्यम से चलने वाला काल्पनिक प्रक्षेपण है।
चित्र 1: पूर्ण काला घेरा निर्धारण का बिंदु है। नीली वस्तु प्रेक्षक के निकट होती है। इसलिए, इसमें दृष्टिपटल लगभग असमानता है '. अधिक दूर (हरा) पड़ी वस्तुओं में संगत रूप से दूर असमानता होती है<sub>f</sub>. द्विनेत्री असमानता प्रक्षेपण की दो रेखाओं के बीच का कोण है। जिनमें से एक वस्तु से प्रक्षेपण के वास्तविक बिंदु तक वास्तविक प्रक्षेपण है। अन्य एक निर्धारण बिंदु के पातिक बिंदु के माध्यम से चलने वाला काल्पनिक प्रक्षेपण है।


कंप्यूटर दृष्टि में, द्विनेत्री असमानता की गणना स्टीरियो कैमरों के एक सेट से ली गई स्टीरियो छवियों से की जाती है। इन कैमरों के बीच परिवर्तनशील दूरी, जिसे आधार रेखा कहा जाता है, उनके संबंधित छवि तल पर एक विशिष्ट बिंदु की असमानता को प्रभावित कर सकती है। जैसे-जैसे आधार रेखा बढ़ती है, बिंदु पर दृष्टि को संरेखित करने के लिए आवश्यक अधिक कोण के कारण असमानता बढ़ती है। हालांकि, कंप्यूटर दृष्टि में, द्विनेत्री असमानता को दृश्य कोण के बजाय दाएं और बाएं छवियों के बीच बिंदु के समन्वय अंतर के रूप में संदर्भित किया जाता है। इकाइयों को आमतौर पर पिक्सेल में मापा जाता है।
कंप्यूटर दृष्टि में, द्विनेत्री असमानता की गणना त्रिविम ध्वनिक कैमरों के एक सम्मुच्चय से ली गई त्रिविम ध्वनिक छवियों से की जाती है। इन कैमरों के बीच परिवर्तनशील दूरी, जिसे आधार रेखा कहा जाता है, उनके संबंधित छवि तल पर एक विशिष्ट बिंदु की असमानता को प्रभावित कर सकती है। जैसे-जैसे आधार रेखा बढ़ती है, बिंदु पर दृष्टि को संरेखित करने के लिए आवश्यक अधिक कोण के कारण असमानता बढ़ती है। हालांकि, कंप्यूटर दृष्टि में, द्विनेत्री असमानता को दृश्य कोण के बजाय दाएं और बाएं छवियों के बीच बिंदु के समन्वय अंतर के रूप में संदर्भित किया जाता है। इकाइयों को सामान्यतः पिक्सेल में मापा जाता है।


== 2 डी छवियों के साथ न्यूरॉन्स को धोखा देना ==
== 2 D छवियों के साथ न्यूरॉन्स को धोखा देना ==
[[Image:Binocular disparity 2D.png|thumb|right|चित्रा 2. विमान में गहराई से असमानता का अनुकरण। (चित्र 1 से संबंधित)]]रेटिना ([[प्राथमिक दृश्य प्रांतस्था]]) से आने वाली दृश्य जानकारी को संसाधित करने के लिए जिम्मेदार मस्तिष्क के एक हिस्से में मस्तिष्क कोशिकाएं ([[न्यूरॉन]]्स) आंखों से उनके इनपुट में असमानता के अस्तित्व का पता लगा सकती हैं। विशेष रूप से, ये न्यूरॉन्स सक्रिय होंगे, यदि उनकी विशेष असमानता वाली वस्तु दृश्य क्षेत्र के उस हिस्से के भीतर होती है, जिस तक उनकी पहुंच ([[ग्रहणशील क्षेत्र]]) है।<ref name="neural">Gonzalez, F. and Perez, R., [https://www.sciencedirect.com/science/article/pii/S0301008298000124 Neural mechanisms underlying stereoscopic vision], Prog Neurobiol, 55(3), 191–224, 1998.</ref>
[[Image:Binocular disparity 2D.png|thumb|right|चित्रा 2. विमान में गहराई से असमानता का अनुकरण। (चित्र 1 से संबंधित)]]रेटिना ([[प्राथमिक दृश्य प्रांतस्था]]) से आने वाली दृश्य जानकारी को संसाधित करने के लिए जिम्मेदार मस्तिष्क के एक हिस्से में मस्तिष्क कोशिकाएं ([[न्यूरॉन]]्स) आंखों से उनके निविष्ट में असमानता के अस्तित्व का पता लगा सकती हैं। विशेष रूप से, ये न्यूरॉन्स सक्रिय होंगे, यदि उनकी विशेष असमानता वाली वस्तु दृश्य क्षेत्र के उस हिस्से के भीतर होती है, जिस तक उनकी पहुंच ([[ग्रहणशील क्षेत्र]]) है। <ref name="neural">Gonzalez, F. and Perez, R., [https://www.sciencedirect.com/science/article/pii/S0301008298000124 Neural mechanisms underlying stereoscopic vision], Prog Neurobiol, 55(3), 191–224, 1998.</ref>
असमानता के संबंध में इन न्यूरॉन्स के सटीक गुणों की जांच करने वाले शोधकर्ता कोशिकाओं को विभिन्न असमानताओं के साथ दृश्य [[उत्तेजना (फिजियोलॉजी)]] पेश करते हैं और देखते हैं कि वे सक्रिय हैं या नहीं। अलग-अलग असमानताओं के साथ उत्तेजनाओं को प्रस्तुत करने की एक संभावना वस्तुओं को आंखों के सामने अलग-अलग गहराई में रखना है। हालाँकि, इस पद्धति की खामी दूर रखी गई वस्तुओं के लिए पर्याप्त सटीक नहीं हो सकती है क्योंकि उनमें छोटी असमानताएँ होती हैं जबकि निकट की वस्तुओं में अधिक असमानताएँ होंगी। इसके बजाय, न्यूरोसाइंटिस्ट एक वैकल्पिक विधि का उपयोग करते हैं जैसा कि चित्र 2 में दिखाया गया है।
असमानता के संबंध में इन न्यूरॉन्स के सटीक गुणों की जांच करने वाले शोधकर्ता कोशिकाओं को विभिन्न असमानताओं के साथ दृश्य [[उत्तेजना (फिजियोलॉजी)]] प्रस्तुत करते हैं और देखते हैं कि वे सक्रिय हैं या नहीं। अलग-अलग असमानताओं के साथ उत्तेजनाओं को प्रस्तुत करने की एक संभावना वस्तुओं को आंखों के सामने अलग-अलग गहराई में रखना है। हालाँकि, इस पद्धति की खामी दूर रखी गई वस्तुओं के लिए पर्याप्त सटीक नहीं हो सकती है क्योंकि उनमें छोटी असमानताएँ होती हैं जबकि निकट की वस्तुओं में अधिक असमानताएँ होंगी। इसके बजाय, न्यूरोसाइंटिस्ट एक वैकल्पिक विधि का उपयोग करते हैं जैसा कि चित्र 2 में दिखाया गया है।


चित्रा 2: निर्धारण बिंदु की तुलना में अलग-अलग गहराई वाली वस्तु की असमानता वैकल्पिक रूप से वस्तु की एक छवि को एक आंख और उसी छवि के पार्श्व रूप से स्थानांतरित संस्करण को दूसरी आंख में पेश करके उत्पादित की जा सकती है। पूर्ण काला घेरा निर्धारण का बिंदु है। अलग-अलग गहराई की वस्तुओं को बायीं आंख की फिक्सिंग लाइन के साथ रखा जाता है। किसी वस्तु की गहराई में बदलाव (भरे रंग के घेरे) से उत्पन्न समान असमानता को बाद में वस्तु को लगातार गहराई में उस तस्वीर में स्थानांतरित करके भी उत्पन्न किया जा सकता है जिसे एक आँख देखती है (रंगीन मार्जिन के साथ काले घेरे)। ध्यान दें कि निकट असमानताओं के लिए पार्श्व बदलाव दूर असमानताओं की तुलना में समान गहराई के अनुरूप बड़ा होना चाहिए। यह न्यूरोसाइंटिस्ट आमतौर पर न्यूरॉन्स की विषमता चयनात्मकता का अध्ययन करने के लिए [[यादृच्छिक डॉट उत्तेजना]]ओं के साथ करते हैं क्योंकि असमानताओं का परीक्षण करने के लिए आवश्यक पार्श्व दूरी गहराई परीक्षणों का उपयोग करके आवश्यक दूरी से कम है। यह सिद्धांत [[autostereogram]] भ्रम में भी लागू किया गया है।
चित्रा 2: निर्धारण बिंदु की तुलना में अलग-अलग गहराई वाली वस्तु की असमानता वैकल्पिक रूप से वस्तु की एक छवि को एक आंख और उसी छवि के पार्श्व रूप से स्थानांतरित संस्करण को दूसरी आंख में प्रस्तुत करके उत्पादित की जा सकती है। यह पूर्ण काला घेरा निर्धारण का बिंदु है। अलग-अलग गहराई की वस्तुओं को बायीं आंख की यह लाइन के साथ रखा जाता है। किसी वस्तु की गहराई में बदलाव (भरे रंग के घेरे) से उत्पन्न समान असमानता को बाद में वस्तु को लगातार गहराई में उस तस्वीर में स्थानांतरित करके भी उत्पन्न किया जा सकता है जिसे एक आँख देखती है (रंगीन मार्जिन के साथ काले घेरे)। ध्यान दें कि निकट असमानताओं के लिए पार्श्व बदलाव दूर असमानताओं की तुलना में समान गहराई के अनुरूप बड़ा होना चाहिए। यह न्यूरोसाइंटिस्ट सामान्यतः न्यूरॉन्स की विषमता चयनात्मकता का अध्ययन करने के लिए [[यादृच्छिक डॉट उत्तेजना]]ओं के साथ करते हैं क्योंकि असमानताओं का परीक्षण करने के लिए आवश्यक पार्श्व दूरी गहराई परीक्षणों का उपयोग करके आवश्यक दूरी से कम है। यह सिद्धांत [[autostereogram|ऑटोस्टेरोग्राम]] भ्रम में भी लागू किया गया है।


== डिजिटल स्टीरियो छवियों का उपयोग करके कंप्यूटिंग असमानता ==
== डिजिटल त्रिविम ध्वनिक छवियों का उपयोग करके कंप्यूटिंग असमानता ==
दो स्टीरियो छवियों के बीच सुविधाओं की असमानता की गणना आमतौर पर एक छवि सुविधा के बाईं ओर बदलाव के रूप में की जाती है, जब उसे सही छवि में देखा जाता है।<ref name="comp_vision">लिंडा शापिरो|लिंडा जी. शापिरो और जॉर्ज सी. स्टॉकमैन (2001)। कंप्यूटर दृष्टि। प्रेंटिस हॉल, 371–409। {{ISBN|0-13-030796-3}}.</ref> उदाहरण के लिए, बाईं छवि में x निर्देशांक t ([[पिक्सेल]] में मापा गया) पर दिखाई देने वाला एक बिंदु दाईं छवि में x निर्देशांक t − 3 पर मौजूद हो सकता है। इस स्थिति में, सही छवि में उस स्थान पर असमानता 3 पिक्सेल होगी।
दो त्रिविम ध्वनिक छवियों के बीच सुविधाओं की असमानता की गणना सामान्यतः एक छवि सुविधा के बाईं ओर बदलाव के रूप में की जाती है, जब उसे सही छवि में देखा जाता है। <ref name="comp_vision">लिंडा शापिरो|लिंडा जी. शापिरो और जॉर्ज सी. स्टॉकमैन (2001)। कंप्यूटर दृष्टि। प्रेंटिस हॉल, 371–409। {{ISBN|0-13-030796-3}}.</ref> उदाहरण के लिए, बाईं छवि में x निर्देशांक t ([[पिक्सेल]] में मापा गया) पर दिखाई देने वाला एक बिंदु दाईं छवि में x निर्देशांक t − 3 पर उपस्थित हो सकता है। इस स्थिति में, सही छवि में उस स्थान पर असमानता 3 पिक्सेल होगी।


त्वरित असमानता गणना की अनुमति देने के लिए स्टीरियो छवियों को हमेशा सही ढंग से संरेखित नहीं किया जा सकता है। उदाहरण के लिए, कैमरों के सेट को स्तर से थोड़ा घुमाया जा सकता है। [[छवि सुधार]] के रूप में जानी जाने वाली प्रक्रिया के माध्यम से, दोनों छवियों को केवल क्षैतिज दिशा में असमानताओं की अनुमति देने के लिए घुमाया जाता है (अर्थात y छवि निर्देशांक में कोई असमानता नहीं है)।<ref name="comp_vision" />यह एक ऐसी संपत्ति है जिसे इमेज कैप्चर करने से पहले स्टीरियो कैमरों के सटीक संरेखण द्वारा भी प्राप्त किया जा सकता है।
त्वरित असमानता गणना की अनुमति देने के लिए त्रिविम ध्वनिक छवियों को हमेशा सही ढंग से संरेखित नहीं किया जा सकता है। उदाहरण के लिए, कैमरों के सम्मुच्चय को स्तर से थोड़ा घुमाया जा सकता है। [[छवि सुधार]] के रूप में जानी जाने वाली प्रक्रिया के माध्यम से, दोनों छवियों को केवल क्षैतिज दिशा में असमानताओं की अनुमति देने के लिए घुमाया जाता है (अर्थात y छवि निर्देशांक में कोई असमानता नहीं है)।<ref name="comp_vision" /> यह एक ऐसी संपत्ति है जिसे प्रतिबिंब प्रग्रहण करने से पहले त्रिविम ध्वनिक कैमरों के सटीक संरेखण द्वारा भी प्राप्त किया जा सकता है।


=== कंप्यूटर एल्गोरिथ्म ===
=== कंप्यूटर कलन विधि ===
सुधार के बाद, एक एल्गोरिदम का उपयोग करके पत्राचार समस्या को हल किया जा सकता है जो छवि सुविधाओं से मेल खाने के लिए बाएं और दाएं दोनों छवियों को स्कैन करता है। इस समस्या का एक सामान्य तरीका बाईं छवि में प्रत्येक पिक्सेल के चारों ओर एक छोटा छवि पैच बनाना है। इन छवि पैच की तुलना उनके संबंधित छवि पैच की तुलना करके सही छवि में सभी संभावित विषमताओं से की जाती है। उदाहरण के लिए, 1 की असमानता के लिए, बाईं छवि में पैच की तुलना दाईं ओर समान आकार के पैच से की जाएगी, जिसे एक पिक्सेल द्वारा बाईं ओर स्थानांतरित कर दिया जाएगा। इन दो पैच के बीच तुलना निम्नलिखित समीकरणों में से एक से कम्प्यूटेशनल उपाय प्राप्त करके की जा सकती है जो पैच में प्रत्येक पिक्सेल की तुलना करता है। निम्नलिखित सभी समीकरणों के लिए, L और R बाएँ और दाएँ स्तंभों को संदर्भित करते हैं जबकि r और c वर्तमान पंक्ति और उन छवियों के स्तंभ को संदर्भित करते हैं जिनकी जांच की जा रही है। d सही छवि की असमानता को संदर्भित करता है।
सुधार के बाद, एक कलन विधि का उपयोग करके पत्राचार समस्या को हल किया जा सकता है जो छवि सुविधाओं से मेल खाने के लिए बाएं और दाएं दोनों छवियों को स्कैन करता है। इस समस्या का एक सामान्य तरीका बाईं छवि में प्रत्येक पिक्सेल के चारों ओर एक छोटा छवि योजक बनाना है। इन छवि योजक की तुलना उनके संबंधित छवि योजक की तुलना करके सही छवि में सभी संभावित विषमताओं से की जाती है। उदाहरण के लिए, 1 की असमानता के लिए, बाईं छवि में योजक की तुलना दाईं ओर समान आकार के योजक से की जाएगी, जिसे एक पिक्सेल द्वारा बाईं ओर स्थानांतरित कर दिया जाएगा। इन दो योजक के बीच तुलना निम्नलिखित समीकरणों में से एक से कम्प्यूटेशनल उपाय प्राप्त करके की जा सकती है जो योजक में प्रत्येक पिक्सेल की तुलना करता है। निम्नलिखित सभी समीकरणों के लिए, L और R बाएँ और दाएँ स्तंभों को संदर्भित करते हैं जबकि r और c वर्तमान पंक्ति और उन छवियों के स्तंभ को संदर्भित करते हैं जिनकी जांच की जा रही है। d सही छवि की असमानता को संदर्भित करता है।


* सामान्यीकृत सहसंबंध: <math display="block">\frac{\sum{\sum{ L(r,c) \cdot R(r,c-d) }}}{\sqrt{(\sum{\sum{ L(r,c)^2 }}) \cdot (\sum{\sum{ R(r,c-d)^2 }})}}</math>
* सामान्यीकृत सहसंबंध: <math display="block">\frac{\sum{\sum{ L(r,c) \cdot R(r,c-d) }}}{\sqrt{(\sum{\sum{ L(r,c)^2 }}) \cdot (\sum{\sum{ R(r,c-d)^2 }})}}</math>
* चुकता अंतरों का योग: <math display="block">\sum{\sum{ (L(r,c) - R(r,c-d))^2 }}</math>
* चुकता अंतरों का योग: <math display="block">\sum{\sum{ (L(r,c) - R(r,c-d))^2 }}</math>
* पूर्ण अंतर का योग: <math display="block">\sum{\sum{ \left | L(r,c) - R(r,c-d) \right \vert }}</math>
* पूर्ण अंतर का योग: <math display="block">\sum{\sum{ \left | L(r,c) - R(r,c-d) \right \vert }}</math>
उपरोक्त विधियों में से किसी एक का उपयोग करके सबसे कम संगणित मान के साथ असमानता को छवि विशेषता के लिए असमानता माना जाता है। यह न्यूनतम स्कोर इंगित करता है कि एल्गोरिदम ने दोनों छवियों में संबंधित सुविधाओं का सबसे अच्छा मिलान पाया है।
उपरोक्त विधियों में से किसी एक का उपयोग करके सबसे कम संगणित मान के साथ असमानता को छवि विशेषता के लिए असमानता माना जाता है। यह न्यूनतम प्राप्तांक इंगित करता है कि कलन विधि ने दोनों छवियों में संबंधित सुविधाओं का सबसे अच्छा मिलान पाया है।


ऊपर वर्णित विधि एक [[क्रूर-बल खोज]] एल्गोरिथम है। बड़े पैच और/या छवि आकार के साथ, यह तकनीक बहुत समय लेने वाली हो सकती है क्योंकि सबसे कम सहसंबंध स्कोर खोजने के लिए पिक्सेल की लगातार जांच की जा रही है। हालाँकि, इस तकनीक में अनावश्यक दोहराव भी शामिल है क्योंकि कई पिक्सेल ओवरलैप होते हैं। एक अधिक कुशल एल्गोरिथ्म में पिछले पिक्सेल से सभी मानों को याद रखना शामिल है। एक और भी अधिक कुशल एल्गोरिदम में पिछली पंक्ति से कॉलम रकम को याद रखना शामिल है (पिछले पिक्सेल से सभी मानों को याद रखने के अलावा)। तकनीकें जो पिछली जानकारी को सहेजती हैं, इस छवि विश्लेषण प्रक्रिया की [[एल्गोरिथम दक्षता]] को बहुत बढ़ा सकती हैं।
ऊपर वर्णित विधि एक [[क्रूर-बल खोज]] कलन विधि है। बड़े योजक और/या छवि आकार के साथ, यह तकनीक बहुत समय लेने वाली हो सकती है क्योंकि सबसे कम सहसंबंध प्राप्तांक खोजने के लिए पिक्सेल की लगातार जांच की जा रही है। हालाँकि, इस तकनीक में अनावश्यक दोहराव भी सम्मिलित है क्योंकि कई पिक्सेल अंशछादन होते हैं। एक अधिक कुशल कलन विधि में पिछले पिक्सेल से सभी मानों को याद रखना सम्मिलित है। एक और भी अधिक कुशल कलन विधि में पिछली पंक्ति से पंक्त् योग को याद रखना सम्मिलित है (पिछले पिक्सेल से सभी मानों को याद रखने के अतिरिक्त)। तकनीकें जो पिछली जानकारी को सहेजती हैं, इस छवि विश्लेषण प्रक्रिया की [[एल्गोरिथम दक्षता|कलन विधि दक्षता]] को बहुत बढ़ा सकती हैं।


== छवियों से असमानता का उपयोग ==
== छवियों से असमानता का उपयोग ==
असमानता के ज्ञान का उपयोग स्टीरियो इमेज से जानकारी निकालने के लिए किया जा सकता है। एक मामला है कि असमानता सबसे उपयोगी है गहराई/दूरी गणना के लिए। कैमरों से असमानता और दूरी विपरीत रूप से संबंधित हैं। जैसे-जैसे कैमरों से दूरी बढ़ती है, असमानता कम होती जाती है। यह स्टीरियो छवियों में गहराई की धारणा के लिए अनुमति देता है। ज्यामिति और बीजगणित का उपयोग करके, 2D स्टीरियो छवियों में दिखाई देने वाले बिंदुओं को 3D अंतरिक्ष में निर्देशांक के रूप में मैप किया जा सकता है।
असमानता के ज्ञान का उपयोग त्रिविम ध्वनिक छवि से जानकारी निकालने के लिए किया जा सकता है। एक स्तिथि है कि असमानता सबसे उपयोगी है गहराई/दूरी गणना के लिए कैमरों से असमानता और दूरी विपरीत रूप से संबंधित हैं। जैसे-जैसे कैमरों से दूरी बढ़ती है, असमानता कम होती जाती है। यह त्रिविम ध्वनिक छवियों में गहराई की धारणा के लिए अनुमति देता है। ज्यामिति और बीजगणित का उपयोग करके, 2D त्रिविम ध्वनिक छवियों में दिखाई देने वाले बिंदुओं को 3D स्थल में निर्देशांक के रूप में मानचित्र किया जा सकता है।


यह अवधारणा नेविगेशन के लिए विशेष रूप से उपयोगी है। उदाहरण के लिए, [[मार्स एक्सप्लोरेशन रोवर]] बाधाओं के लिए इलाके को स्कैन करने के लिए इसी तरह की विधि का उपयोग करता है।<ref>"The Computer Vision Laboratory ." JPL.NASA.GOV. JPL/NASA, n.d. Web. 5 Jun 2011. <[https://web.archive.org/web/20080531113553/http://www-robotics.jpl.nasa.gov/facilities/facilityImage.cfm?Facility=13&Image=335]>.</ref> रोवर अपने त्रिविम नेविगेशन कैमरों के साथ छवियों की एक जोड़ी को कैप्चर करता है और ऊंचा वस्तुओं (जैसे बोल्डर) का पता लगाने के लिए असमानता की गणना की जाती है।<ref>"Spacecraft: Surface Operations: Rover ." JPL.NASA.GOV. JPL/NASA, n.d. Web. 5 Jun 2011. http://marsrovers.jpl.nasa.gov/mission/spacecraft_rover_eyes.html.</ref> इसके अतिरिक्त, रोवर के सापेक्ष वस्तुओं के विस्थापन को मापकर बाद की स्टीरियो छवियों से स्थान और गति डेटा निकाला जा सकता है। कुछ मामलों में, यह इस प्रकार की जानकारी का सबसे अच्छा स्रोत है क्योंकि टायर फिसलने के कारण पहियों में एनकोडर सेंसर गलत हो सकते हैं।
यह अवधारणा मार्गनिर्देशन के लिए विशेष रूप से उपयोगी है। उदाहरण के लिए, [[मार्स एक्सप्लोरेशन रोवर|मंगल अन्वेषण रोवर]] बाधाओं के लिए इलाके को क्रमवीक्षण करने के लिए इसी तरह की विधि का उपयोग करता है। <ref>"The Computer Vision Laboratory ." JPL.NASA.GOV. JPL/NASA, n.d. Web. 5 Jun 2011. <[https://web.archive.org/web/20080531113553/http://www-robotics.jpl.nasa.gov/facilities/facilityImage.cfm?Facility=13&Image=335]>.</ref> रोवर अपने त्रिविम मार्गनिर्देशन कैमरों के साथ छवियों की एक जोड़ी को अधिकृत करता है और ऊंचा वस्तुओं (जैसे बोल्डर) का पता लगाने के लिए असमानता की गणना की जाती है। <ref>"Spacecraft: Surface Operations: Rover ." JPL.NASA.GOV. JPL/NASA, n.d. Web. 5 Jun 2011. http://marsrovers.jpl.nasa.gov/mission/spacecraft_rover_eyes.html.</ref> इसके अतिरिक्त, रोवर के सापेक्ष वस्तुओं के विस्थापन को मापकर बाद की त्रिविम ध्वनिक छवियों से स्थान और गति डेटा निकाला जा सकता है। कुछ स्तिथियों में, यह इस प्रकार की जानकारी का सबसे अच्छा स्रोत है क्योंकि टायर फिसलने के कारण पहियों में संकेतक संवेदक गलत हो सकते हैं।


== यह भी देखें ==
== यह भी देखें ==

Revision as of 01:17, 12 June 2023

द्विनेत्री असमानता, बाईं और दाईं मानवीय आँखों द्वारा देखी गई वस्तु की छवि स्थान में अंतर को संदर्भित करती है, जिसके परिणामस्वरूप आँखें क्षैतिज पृथक्करण (लंबन) होती हैं। मस्तिष्क त्रिविमदृष्‍टिता में द्वि-आयामी दृष्‍टिपटलीय प्रतिमा से गहनता से जानकारी निकालने के लिए दूरबीन असमानता का उपयोग करता है। कंप्यूटर दृष्टि में, द्विनेत्री असमानता दो त्रिविम ध्वनिक छवियों के भीतर समान सुविधाओं के निर्देशांक में अंतर को संदर्भित करती है।

एक लक्ष्य के लिए दूरी और/या ऊंचाई निर्धारित करने के लिए संयोग परासमापी द्वारा परासमापन में

एक समान असमानता का उपयोग किया जा सकता है। खगोल विज्ञान में, पृथ्वी पर विभिन्न स्थानों के बीच असमानता का उपयोग विभिन्न आकाशीय लंबन को निर्धारित करने के लिए किया जा सकता है, और तारकीय लंबन के लिए पृथ्वी की कक्षा का उपयोग किया जा सकता है।

परिभाषा

चित्रा 1. दूरबीन असमानता की परिभाषा (दूर और निकट)।

प्रत्येक व्यक्ति के आधार पर मानव आंखें क्षैतिज रूप से लगभग 50–75 मिमी (अंतरप्यूपिलरी दूरी) से अलग होती हैं। इस प्रकार, प्रत्येक आंख का दुनिया भर में थोड़ा अलग दृष्टिकोण होता है। ऊर्ध्वाधर किनारे को देखते हुए वैकल्पिक रूप से एक आंख को बंद करने पर इसे आसानी से देखा जा सकता है। द्विनेत्री असमानता दोनों विचारों के बीच ऊर्ध्वाधर किनारे के स्पष्ट क्षैतिज बदलाव से देखी जा सकती है।

किसी भी समय, दोनों आँखों की दृष्टि रेखा अंतरिक्ष में एक बिंदु पर मिलती है। अंतरिक्ष में यह बिंदु दोनों आँखों के रेटिना पर एक ही स्थान (अर्थात केंद्र) पर प्रोजेक्ट करता है। बाएँ और दाएँ आँख द्वारा देखे गए अलग-अलग दृष्टिकोणों के कारण, अंतरिक्ष में कई अन्य बिंदु संबंधित दृष्टिपटलीय स्थानों पर नहीं पड़ते हैं। दृश्य द्विनेत्री असमानता को दो आँखों में प्रक्षेपण के बिंदु के बीच के अंतर के रूप में परिभाषित किया गया है और सामान्यतः दृश्य कोण के रूप में डिग्री में व्यक्त किया जाता है। [1]

द्विनेत्री असमानता शब्द आंख के बाहर किए गए ज्यामितीय मापों को संदर्भित करता है। वास्तविक रेटिना पर छवियों की असमानता आंख के आंतरिक कारकों पर निर्भर करती है, विशेष रूप से पातिक बिंदुओं का स्थान, भले ही रेटिना का अनुप्रस्थ काट एक पूर्ण चक्र हो। डिग्री के रूप में मापे जाने पर रेटिना पर असमानता द्विनेत्री असमानता के अनुरूप होती है, जबकि आंख के अंदर जटिल संरचना के कारण दूरी के रूप में मापी जाने पर बहुत भिन्न होती है।

चित्र 1: पूर्ण काला घेरा निर्धारण का बिंदु है। नीली वस्तु प्रेक्षक के निकट होती है। इसलिए, इसमें दृष्टिपटल लगभग असमानता है '. अधिक दूर (हरा) पड़ी वस्तुओं में संगत रूप से दूर असमानता होती हैf. द्विनेत्री असमानता प्रक्षेपण की दो रेखाओं के बीच का कोण है। जिनमें से एक वस्तु से प्रक्षेपण के वास्तविक बिंदु तक वास्तविक प्रक्षेपण है। अन्य एक निर्धारण बिंदु के पातिक बिंदु के माध्यम से चलने वाला काल्पनिक प्रक्षेपण है।

कंप्यूटर दृष्टि में, द्विनेत्री असमानता की गणना त्रिविम ध्वनिक कैमरों के एक सम्मुच्चय से ली गई त्रिविम ध्वनिक छवियों से की जाती है। इन कैमरों के बीच परिवर्तनशील दूरी, जिसे आधार रेखा कहा जाता है, उनके संबंधित छवि तल पर एक विशिष्ट बिंदु की असमानता को प्रभावित कर सकती है। जैसे-जैसे आधार रेखा बढ़ती है, बिंदु पर दृष्टि को संरेखित करने के लिए आवश्यक अधिक कोण के कारण असमानता बढ़ती है। हालांकि, कंप्यूटर दृष्टि में, द्विनेत्री असमानता को दृश्य कोण के बजाय दाएं और बाएं छवियों के बीच बिंदु के समन्वय अंतर के रूप में संदर्भित किया जाता है। इकाइयों को सामान्यतः पिक्सेल में मापा जाता है।

2 D छवियों के साथ न्यूरॉन्स को धोखा देना

चित्रा 2. विमान में गहराई से असमानता का अनुकरण। (चित्र 1 से संबंधित)

रेटिना (प्राथमिक दृश्य प्रांतस्था) से आने वाली दृश्य जानकारी को संसाधित करने के लिए जिम्मेदार मस्तिष्क के एक हिस्से में मस्तिष्क कोशिकाएं (न्यूरॉन्स) आंखों से उनके निविष्ट में असमानता के अस्तित्व का पता लगा सकती हैं। विशेष रूप से, ये न्यूरॉन्स सक्रिय होंगे, यदि उनकी विशेष असमानता वाली वस्तु दृश्य क्षेत्र के उस हिस्से के भीतर होती है, जिस तक उनकी पहुंच (ग्रहणशील क्षेत्र) है। [2]

असमानता के संबंध में इन न्यूरॉन्स के सटीक गुणों की जांच करने वाले शोधकर्ता कोशिकाओं को विभिन्न असमानताओं के साथ दृश्य उत्तेजना (फिजियोलॉजी) प्रस्तुत करते हैं और देखते हैं कि वे सक्रिय हैं या नहीं। अलग-अलग असमानताओं के साथ उत्तेजनाओं को प्रस्तुत करने की एक संभावना वस्तुओं को आंखों के सामने अलग-अलग गहराई में रखना है। हालाँकि, इस पद्धति की खामी दूर रखी गई वस्तुओं के लिए पर्याप्त सटीक नहीं हो सकती है क्योंकि उनमें छोटी असमानताएँ होती हैं जबकि निकट की वस्तुओं में अधिक असमानताएँ होंगी। इसके बजाय, न्यूरोसाइंटिस्ट एक वैकल्पिक विधि का उपयोग करते हैं जैसा कि चित्र 2 में दिखाया गया है।

चित्रा 2: निर्धारण बिंदु की तुलना में अलग-अलग गहराई वाली वस्तु की असमानता वैकल्पिक रूप से वस्तु की एक छवि को एक आंख और उसी छवि के पार्श्व रूप से स्थानांतरित संस्करण को दूसरी आंख में प्रस्तुत करके उत्पादित की जा सकती है। यह पूर्ण काला घेरा निर्धारण का बिंदु है। अलग-अलग गहराई की वस्तुओं को बायीं आंख की यह लाइन के साथ रखा जाता है। किसी वस्तु की गहराई में बदलाव (भरे रंग के घेरे) से उत्पन्न समान असमानता को बाद में वस्तु को लगातार गहराई में उस तस्वीर में स्थानांतरित करके भी उत्पन्न किया जा सकता है जिसे एक आँख देखती है (रंगीन मार्जिन के साथ काले घेरे)। ध्यान दें कि निकट असमानताओं के लिए पार्श्व बदलाव दूर असमानताओं की तुलना में समान गहराई के अनुरूप बड़ा होना चाहिए। यह न्यूरोसाइंटिस्ट सामान्यतः न्यूरॉन्स की विषमता चयनात्मकता का अध्ययन करने के लिए यादृच्छिक डॉट उत्तेजनाओं के साथ करते हैं क्योंकि असमानताओं का परीक्षण करने के लिए आवश्यक पार्श्व दूरी गहराई परीक्षणों का उपयोग करके आवश्यक दूरी से कम है। यह सिद्धांत ऑटोस्टेरोग्राम भ्रम में भी लागू किया गया है।

डिजिटल त्रिविम ध्वनिक छवियों का उपयोग करके कंप्यूटिंग असमानता

दो त्रिविम ध्वनिक छवियों के बीच सुविधाओं की असमानता की गणना सामान्यतः एक छवि सुविधा के बाईं ओर बदलाव के रूप में की जाती है, जब उसे सही छवि में देखा जाता है। [3] उदाहरण के लिए, बाईं छवि में x निर्देशांक t (पिक्सेल में मापा गया) पर दिखाई देने वाला एक बिंदु दाईं छवि में x निर्देशांक t − 3 पर उपस्थित हो सकता है। इस स्थिति में, सही छवि में उस स्थान पर असमानता 3 पिक्सेल होगी।

त्वरित असमानता गणना की अनुमति देने के लिए त्रिविम ध्वनिक छवियों को हमेशा सही ढंग से संरेखित नहीं किया जा सकता है। उदाहरण के लिए, कैमरों के सम्मुच्चय को स्तर से थोड़ा घुमाया जा सकता है। छवि सुधार के रूप में जानी जाने वाली प्रक्रिया के माध्यम से, दोनों छवियों को केवल क्षैतिज दिशा में असमानताओं की अनुमति देने के लिए घुमाया जाता है (अर्थात y छवि निर्देशांक में कोई असमानता नहीं है)।[3] यह एक ऐसी संपत्ति है जिसे प्रतिबिंब प्रग्रहण करने से पहले त्रिविम ध्वनिक कैमरों के सटीक संरेखण द्वारा भी प्राप्त किया जा सकता है।

कंप्यूटर कलन विधि

सुधार के बाद, एक कलन विधि का उपयोग करके पत्राचार समस्या को हल किया जा सकता है जो छवि सुविधाओं से मेल खाने के लिए बाएं और दाएं दोनों छवियों को स्कैन करता है। इस समस्या का एक सामान्य तरीका बाईं छवि में प्रत्येक पिक्सेल के चारों ओर एक छोटा छवि योजक बनाना है। इन छवि योजक की तुलना उनके संबंधित छवि योजक की तुलना करके सही छवि में सभी संभावित विषमताओं से की जाती है। उदाहरण के लिए, 1 की असमानता के लिए, बाईं छवि में योजक की तुलना दाईं ओर समान आकार के योजक से की जाएगी, जिसे एक पिक्सेल द्वारा बाईं ओर स्थानांतरित कर दिया जाएगा। इन दो योजक के बीच तुलना निम्नलिखित समीकरणों में से एक से कम्प्यूटेशनल उपाय प्राप्त करके की जा सकती है जो योजक में प्रत्येक पिक्सेल की तुलना करता है। निम्नलिखित सभी समीकरणों के लिए, L और R बाएँ और दाएँ स्तंभों को संदर्भित करते हैं जबकि r और c वर्तमान पंक्ति और उन छवियों के स्तंभ को संदर्भित करते हैं जिनकी जांच की जा रही है। d सही छवि की असमानता को संदर्भित करता है।

  • सामान्यीकृत सहसंबंध:
  • चुकता अंतरों का योग:
  • पूर्ण अंतर का योग:

उपरोक्त विधियों में से किसी एक का उपयोग करके सबसे कम संगणित मान के साथ असमानता को छवि विशेषता के लिए असमानता माना जाता है। यह न्यूनतम प्राप्तांक इंगित करता है कि कलन विधि ने दोनों छवियों में संबंधित सुविधाओं का सबसे अच्छा मिलान पाया है।

ऊपर वर्णित विधि एक क्रूर-बल खोज कलन विधि है। बड़े योजक और/या छवि आकार के साथ, यह तकनीक बहुत समय लेने वाली हो सकती है क्योंकि सबसे कम सहसंबंध प्राप्तांक खोजने के लिए पिक्सेल की लगातार जांच की जा रही है। हालाँकि, इस तकनीक में अनावश्यक दोहराव भी सम्मिलित है क्योंकि कई पिक्सेल अंशछादन होते हैं। एक अधिक कुशल कलन विधि में पिछले पिक्सेल से सभी मानों को याद रखना सम्मिलित है। एक और भी अधिक कुशल कलन विधि में पिछली पंक्ति से पंक्त् योग को याद रखना सम्मिलित है (पिछले पिक्सेल से सभी मानों को याद रखने के अतिरिक्त)। तकनीकें जो पिछली जानकारी को सहेजती हैं, इस छवि विश्लेषण प्रक्रिया की कलन विधि दक्षता को बहुत बढ़ा सकती हैं।

छवियों से असमानता का उपयोग

असमानता के ज्ञान का उपयोग त्रिविम ध्वनिक छवि से जानकारी निकालने के लिए किया जा सकता है। एक स्तिथि है कि असमानता सबसे उपयोगी है गहराई/दूरी गणना के लिए कैमरों से असमानता और दूरी विपरीत रूप से संबंधित हैं। जैसे-जैसे कैमरों से दूरी बढ़ती है, असमानता कम होती जाती है। यह त्रिविम ध्वनिक छवियों में गहराई की धारणा के लिए अनुमति देता है। ज्यामिति और बीजगणित का उपयोग करके, 2D त्रिविम ध्वनिक छवियों में दिखाई देने वाले बिंदुओं को 3D स्थल में निर्देशांक के रूप में मानचित्र किया जा सकता है।

यह अवधारणा मार्गनिर्देशन के लिए विशेष रूप से उपयोगी है। उदाहरण के लिए, मंगल अन्वेषण रोवर बाधाओं के लिए इलाके को क्रमवीक्षण करने के लिए इसी तरह की विधि का उपयोग करता है। [4] रोवर अपने त्रिविम मार्गनिर्देशन कैमरों के साथ छवियों की एक जोड़ी को अधिकृत करता है और ऊंचा वस्तुओं (जैसे बोल्डर) का पता लगाने के लिए असमानता की गणना की जाती है। [5] इसके अतिरिक्त, रोवर के सापेक्ष वस्तुओं के विस्थापन को मापकर बाद की त्रिविम ध्वनिक छवियों से स्थान और गति डेटा निकाला जा सकता है। कुछ स्तिथियों में, यह इस प्रकार की जानकारी का सबसे अच्छा स्रोत है क्योंकि टायर फिसलने के कारण पहियों में संकेतक संवेदक गलत हो सकते हैं।

यह भी देखें

संदर्भ

  1. Qian, N., Binocular Disparity and the Perception of Depth, Neuron, 18, 359–368, 1997.
  2. Gonzalez, F. and Perez, R., Neural mechanisms underlying stereoscopic vision, Prog Neurobiol, 55(3), 191–224, 1998.
  3. 3.0 3.1 लिंडा शापिरो|लिंडा जी. शापिरो और जॉर्ज सी. स्टॉकमैन (2001)। कंप्यूटर दृष्टि। प्रेंटिस हॉल, 371–409। ISBN 0-13-030796-3.
  4. "The Computer Vision Laboratory ." JPL.NASA.GOV. JPL/NASA, n.d. Web. 5 Jun 2011. <[1]>.
  5. "Spacecraft: Surface Operations: Rover ." JPL.NASA.GOV. JPL/NASA, n.d. Web. 5 Jun 2011. http://marsrovers.jpl.nasa.gov/mission/spacecraft_rover_eyes.html.