पत्राचार समस्या: Difference between revisions
No edit summary |
No edit summary |
||
Line 1: | Line 1: | ||
{{Short description|Computer vision problem}} | {{Short description|Computer vision problem}} | ||
'''पत्राचार समस्या''' '''(कॉरेस्पोंडेंस प्रॉब्लम)''' यह सुनिश्चित करने की समस्या को संदर्भित करती है कि एक छवि के कौन से हिस्से दूसरी छवि के किन हिस्सों से मेल खाते हैं,<ref name="BachAggarwal1988">{{cite book|author1=W. Bach|author2=J.K. Aggarwal|title=Motion Understanding: Robot and Human Vision|url=https://books.google.com/books?id=9luuxWMbHCMC&q=%22correspondence+problem%22|date=29 February 1988|publisher=Springer Science & Business Media|isbn=978-0-89838-258-7}}</ref> जहां अंतर कैमरे की गति, समय बीतने और/या तस्वीरों में वस्तुओं की गति के कारण होता है। | '''पत्राचार समस्या''' '''(कॉरेस्पोंडेंस प्रॉब्लम)''' यह सुनिश्चित करने की समस्या को संदर्भित करती है कि एक छवि के कौन से हिस्से दूसरी छवि के किन हिस्सों से मेल खाते हैं,<ref name="BachAggarwal1988">{{cite book|author1=W. Bach|author2=J.K. Aggarwal|title=Motion Understanding: Robot and Human Vision|url=https://books.google.com/books?id=9luuxWMbHCMC&q=%22correspondence+problem%22|date=29 February 1988|publisher=Springer Science & Business Media|isbn=978-0-89838-258-7}}</ref> जहां अंतर कैमरे की गति, समय बीतने और/या तस्वीरों में वस्तुओं की गति के कारण होता है। | ||
[[कंप्यूटर दृष्टि]] में पत्राचार एक मूलभूत समस्या है - प्रभावशाली कंप्यूटर विज़न शोधकर्ता [[ताकेओ कनाडे]] ने एक बार प्रसिद्ध रूप से कहा था कि कंप्यूटर विज़न की तीन मूलभूत समस्याएं हैं: "पत्राचार, पत्राचार और पत्राचार!" <ref name="Wang2019">{{cite book|author1=X. Wang|title=समय में दृश्य पत्राचार के साथ सीखना और तर्क करना|url=https://www.ri.cmu.edu/publications/learning-and-reasoning-with-visual-correspondence-in-time/|date=September 2019}}</ref> वास्तव में, कई संबंधित अनुप्रयोगों में पत्राचार निश्चित रूप से महत्वपूर्ण निर्माण खंड है: [[ऑप्टिकल प्रवाह]] (जिसमें दो छवियां समय में बाद की होती हैं), सघन [[कंप्यूटर स्टीरियो विज़न]] (जिसमें दो छवियां एक स्टीरियो कैमरा जोड़ी से होती हैं), गति से संरचना (एसएफएम) और दृश्य एक साथ स्थानीयकरण और मैपिंग (जिसमें छवियां एक दृश्य के अलग-अलग लेकिन आंशिक रूप से ओवरलैपिंग दृश्यों से होती हैं), और क्रॉस-सीन पत्राचार (जिसमें छवियां पूरी तरह से अलग-अलग दृश्यों से होती हैं)। | [[कंप्यूटर दृष्टि]] में पत्राचार एक मूलभूत समस्या है - प्रभावशाली कंप्यूटर विज़न शोधकर्ता [[ताकेओ कनाडे]] ने एक बार प्रसिद्ध रूप से कहा था कि कंप्यूटर विज़न की तीन मूलभूत समस्याएं हैं: "पत्राचार, पत्राचार और पत्राचार!" <ref name="Wang2019">{{cite book|author1=X. Wang|title=समय में दृश्य पत्राचार के साथ सीखना और तर्क करना|url=https://www.ri.cmu.edu/publications/learning-and-reasoning-with-visual-correspondence-in-time/|date=September 2019}}</ref> वास्तव में, कई संबंधित अनुप्रयोगों में पत्राचार निश्चित रूप से महत्वपूर्ण निर्माण खंड है: [[ऑप्टिकल प्रवाह]] (जिसमें दो छवियां समय में बाद की होती हैं), सघन [[कंप्यूटर स्टीरियो विज़न]] (जिसमें दो छवियां एक स्टीरियो कैमरा जोड़ी से होती हैं), गति से संरचना (एसएफएम) और दृश्य एक साथ स्थानीयकरण और मैपिंग (जिसमें छवियां एक दृश्य के अलग-अलग लेकिन आंशिक रूप से ओवरलैपिंग दृश्यों से होती हैं), और क्रॉस-सीन पत्राचार (जिसमें छवियां पूरी तरह से अलग-अलग दृश्यों से होती हैं)। | ||
==अवलोकन== | ==अवलोकन== | ||
अलग-अलग दृष्टिकोण से ली गई एक ही 3डी दृश्य की दो या दो से अधिक छवियों को देखते हुए, पत्राचार समस्या एक छवि में बिंदुओं के एक सेट को खोजने के कार्य को संदर्भित करती है, जिसे दूसरी छवि में समान बिंदुओं के रूप में पहचाना जा सकता है। ऐसा करने के लिए, एक छवि के बिंदुओं या विशेषताओं का दूसरी छवि के बिंदुओं या विशेषताओं के साथ मिलान किया जाता है, इस प्रकार संबंधित बिंदुओं या संबंधित विशेषताओं की स्थापना की जाती है, जिन्हें समजात बिंदु या समजात विशेषताएं भी कहा जाता है। छवियों को अलग-अलग दृष्टिकोण से, अलग-अलग समय पर, या कैमरे के सापेक्ष सामान्य गति में दृश्य में वस्तुओं के साथ लिया जा सकता है। | अलग-अलग दृष्टिकोण से ली गई एक ही 3डी दृश्य की दो या दो से अधिक छवियों को देखते हुए, पत्राचार समस्या एक छवि में बिंदुओं के एक सेट को खोजने के कार्य को संदर्भित करती है, जिसे दूसरी छवि में समान बिंदुओं के रूप में पहचाना जा सकता है। ऐसा करने के लिए, एक छवि के बिंदुओं या विशेषताओं का दूसरी छवि के ''बिंदुओं या विशेषताओं'' के साथ मिलान किया जाता है, इस प्रकार '''संबंधित बिंदुओं''' या '''संबंधित विशेषताओं''' की स्थापना की जाती है, जिन्हें '''समजात बिंदु''' या '''समजात विशेषताएं''' भी कहा जाता है। छवियों को अलग-अलग दृष्टिकोण से, अलग-अलग समय पर, या कैमरे के सापेक्ष सामान्य गति में दृश्य में वस्तुओं के साथ लिया जा सकता है। | ||
पत्राचार समस्या एक स्टीरियो स्थिति में हो सकती है जब एक ही दृश्य की दो छवियों का उपयोग किया जाता है या इसे एन-व्यू पत्राचार समस्या के लिए सामान्यीकृत किया जा सकता है। बाद के मामले में, छवियां या तो एक ही समय में फोटो खींच रहे अलग-अलग कैमरों से आ सकती हैं या एक कैमरे से आ सकती हैं जो दृश्य के सापेक्ष घूम रहा है। समस्या तब और अधिक कठिन हो जाती है जब दृश्य में वस्तुएँ कैमरे के सापेक्ष गति में हों। | पत्राचार समस्या एक स्टीरियो स्थिति में हो सकती है जब एक ही दृश्य की दो छवियों का उपयोग किया जाता है या इसे एन-व्यू पत्राचार समस्या के लिए सामान्यीकृत किया जा सकता है। बाद के मामले में, छवियां या तो एक ही समय में फोटो खींच रहे अलग-अलग कैमरों से आ सकती हैं या एक कैमरे से आ सकती हैं जो दृश्य के सापेक्ष घूम रहा है। समस्या तब और अधिक कठिन हो जाती है जब दृश्य में वस्तुएँ कैमरे के सापेक्ष गति में हों। | ||
Line 27: | Line 24: | ||
==सरल उदाहरण== | ==सरल उदाहरण== | ||
सेट A [1,2,3,4,5] और सेट B [3,4,5,6,7] के बीच पत्राचार का पता लगाने के लिए पता लगाएं कि वे कहां ओवरलैप होते हैं और एक सेट दूसरे से कितनी दूर है। यहां हम देखते हैं कि सेट | सेट A [1,2,3,4,5] और सेट B [3,4,5,6,7] के बीच पत्राचार का पता लगाने के लिए पता लगाएं कि वे कहां ओवरलैप होते हैं और एक सेट दूसरे से कितनी दूर है। यहां हम देखते हैं कि सेट A में अंतिम तीन संख्याएं सेट B में पहले तीन संख्याओं के अनुरूप हैं। इससे पता चलता है कि B बाईं ओर ऑफसेट 2 है। | ||
==सरल सहसंबंध-आधारित उदाहरण== | ==सरल सहसंबंध-आधारित उदाहरण== | ||
एक सरल विधि संशोधित छवियों के बीच छोटे पैच की तुलना करना है। यह लगभग एक ही दृष्टिकोण से और एक ही समय में ली गई छवियों के साथ सबसे अच्छा काम करता है या छवि कैप्चर के बीच दृश्य में बहुत कम या कोई हलचल नहीं होती है, जैसे कि स्टीरियो छवियां। | एक सरल विधि संशोधित छवियों के बीच छोटे पैच की तुलना करना है। यह लगभग एक ही दृष्टिकोण से और एक ही समय में ली गई छवियों के साथ सबसे अच्छा काम करता है या छवि कैप्चर के बीच दृश्य में बहुत कम या कोई हलचल नहीं होती है, जैसे कि स्टीरियो छवियां। | ||
एक छोटी सी विंडो को एक छवि में कई स्थानों से गुजारा जाता है। प्रत्येक स्थिति की जाँच यह देखने के लिए की जाती है कि वह दूसरी छवि में उसी स्थान से कितनी अच्छी तरह तुलना करती है। एक छवि में वस्तुओं के लिए आस-पास के कई स्थानों की तुलना की जाती है जो दूसरी छवि में बिल्कुल उसी छवि स्थान पर नहीं हो सकते हैं। यह संभव है कि कोई फिट पर्याप्त रूप से अच्छा न हो। इसका | एक छोटी सी विंडो को एक छवि में कई स्थानों से गुजारा जाता है। प्रत्येक स्थिति की जाँच यह देखने के लिए की जाती है कि वह दूसरी छवि में उसी स्थान से कितनी अच्छी तरह तुलना करती है। एक छवि में वस्तुओं के लिए आस-पास के कई स्थानों की तुलना की जाती है जो दूसरी छवि में बिल्कुल उसी छवि स्थान पर नहीं हो सकते हैं। यह संभव है कि कोई फिट पर्याप्त रूप से अच्छा न हो। इसका तात्पर्य यह हो सकता है कि यह सुविधा दोनों छवियों में मौजूद नहीं है, यह आपकी खोज से कहीं अधिक आगे बढ़ गई है, यह बहुत अधिक बदल गई है या छवि के अन्य हिस्सों द्वारा छिपाई जा रही है। | ||
==यह भी देखें== | ==यह भी देखें== | ||
Line 51: | Line 48: | ||
*[http://vision.middlebury.edu/stereo/taxonomy-IJCV.pdf D. Scharstein and R. Szeliski. A Taxonomy and Evaluation of Dense Two-Frame Stereo Correspondence Algorithms.] (PDF) | *[http://vision.middlebury.edu/stereo/taxonomy-IJCV.pdf D. Scharstein and R. Szeliski. A Taxonomy and Evaluation of Dense Two-Frame Stereo Correspondence Algorithms.] (PDF) | ||
{{reflist}} | {{reflist}} | ||
==बाहरी संबंध== | ==बाहरी संबंध== | ||
*[https://web.archive.org/web/20120423180315/http://vision.middlebury.edu/stereo/ Middlebury Stereo Vision page] | *[https://web.archive.org/web/20120423180315/http://vision.middlebury.edu/stereo/ Middlebury Stereo Vision page] |
Revision as of 11:41, 9 August 2023
पत्राचार समस्या (कॉरेस्पोंडेंस प्रॉब्लम) यह सुनिश्चित करने की समस्या को संदर्भित करती है कि एक छवि के कौन से हिस्से दूसरी छवि के किन हिस्सों से मेल खाते हैं,[1] जहां अंतर कैमरे की गति, समय बीतने और/या तस्वीरों में वस्तुओं की गति के कारण होता है।
कंप्यूटर दृष्टि में पत्राचार एक मूलभूत समस्या है - प्रभावशाली कंप्यूटर विज़न शोधकर्ता ताकेओ कनाडे ने एक बार प्रसिद्ध रूप से कहा था कि कंप्यूटर विज़न की तीन मूलभूत समस्याएं हैं: "पत्राचार, पत्राचार और पत्राचार!" [2] वास्तव में, कई संबंधित अनुप्रयोगों में पत्राचार निश्चित रूप से महत्वपूर्ण निर्माण खंड है: ऑप्टिकल प्रवाह (जिसमें दो छवियां समय में बाद की होती हैं), सघन कंप्यूटर स्टीरियो विज़न (जिसमें दो छवियां एक स्टीरियो कैमरा जोड़ी से होती हैं), गति से संरचना (एसएफएम) और दृश्य एक साथ स्थानीयकरण और मैपिंग (जिसमें छवियां एक दृश्य के अलग-अलग लेकिन आंशिक रूप से ओवरलैपिंग दृश्यों से होती हैं), और क्रॉस-सीन पत्राचार (जिसमें छवियां पूरी तरह से अलग-अलग दृश्यों से होती हैं)।
अवलोकन
अलग-अलग दृष्टिकोण से ली गई एक ही 3डी दृश्य की दो या दो से अधिक छवियों को देखते हुए, पत्राचार समस्या एक छवि में बिंदुओं के एक सेट को खोजने के कार्य को संदर्भित करती है, जिसे दूसरी छवि में समान बिंदुओं के रूप में पहचाना जा सकता है। ऐसा करने के लिए, एक छवि के बिंदुओं या विशेषताओं का दूसरी छवि के बिंदुओं या विशेषताओं के साथ मिलान किया जाता है, इस प्रकार संबंधित बिंदुओं या संबंधित विशेषताओं की स्थापना की जाती है, जिन्हें समजात बिंदु या समजात विशेषताएं भी कहा जाता है। छवियों को अलग-अलग दृष्टिकोण से, अलग-अलग समय पर, या कैमरे के सापेक्ष सामान्य गति में दृश्य में वस्तुओं के साथ लिया जा सकता है।
पत्राचार समस्या एक स्टीरियो स्थिति में हो सकती है जब एक ही दृश्य की दो छवियों का उपयोग किया जाता है या इसे एन-व्यू पत्राचार समस्या के लिए सामान्यीकृत किया जा सकता है। बाद के मामले में, छवियां या तो एक ही समय में फोटो खींच रहे अलग-अलग कैमरों से आ सकती हैं या एक कैमरे से आ सकती हैं जो दृश्य के सापेक्ष घूम रहा है। समस्या तब और अधिक कठिन हो जाती है जब दृश्य में वस्तुएँ कैमरे के सापेक्ष गति में हों।
पत्राचार समस्या का एक विशिष्ट अनुप्रयोग पैनोरमा निर्माण या छवि सिलाई में होता है - जब दो या दो से अधिक छवियां जिनमें केवल एक छोटा सा ओवरलैप होता है, उन्हें एक बड़ी समग्र छवि में सिला जाना होता है। इस मामले में, एक छवि के परिवर्तन की गणना करके इसे दूसरी छवि पर जोड़ने के लिए छवियों की एक जोड़ी में संबंधित बिंदुओं के एक सेट की पहचान करने में सक्षम होना आवश्यक है।
बुनियादी तरीके
दो छवियों के बीच पत्राचार खोजने के दो बुनियादी तरीके हैं।
सहसंबंध-आधारित - यह जांचना कि क्या एक छवि में एक स्थान दूसरी छवि में दूसरे जैसा दिखता/लगता है।
फ़ीचर-आधारित - छवि में फ़ीचर ढूँढना और देखना कि क्या फ़ीचर के सबसेट का लेआउट दो छवियों में समान है। एपर्चर समस्या से बचने के लिए एक अच्छे फीचर में दो दिशाओं में स्थानीय भिन्नता होनी चाहिए।
उपयोग
कंप्यूटर विज़न में पत्राचार समस्या का अध्ययन उस स्थिति के लिए किया जाता है जब कंप्यूटर को इनपुट के रूप में केवल छवियों के साथ इसे स्वचालित रूप से हल करना चाहिए। एक बार पत्राचार समस्या हल हो जाने के बाद, छवि बिंदुओं का एक सेट तैयार हो जाता है जो पत्राचार में हैं, दृश्य में संबंधित 3डी बिंदुओं की स्थिति, गति और/या रोटेशन को 3डी पुनर्निर्माण के लिए इस सेट पर अन्य तरीकों को लागू किया जा सकता है।
पत्राचार समस्या कण छवि वेलोसिमेट्री माप तकनीक का भी आधार है, जिसका आजकल द्रव गति को मात्रात्मक रूप से मापने के लिए द्रव यांत्रिकी क्षेत्र में व्यापक रूप से उपयोग किया जाता है।
सरल उदाहरण
सेट A [1,2,3,4,5] और सेट B [3,4,5,6,7] के बीच पत्राचार का पता लगाने के लिए पता लगाएं कि वे कहां ओवरलैप होते हैं और एक सेट दूसरे से कितनी दूर है। यहां हम देखते हैं कि सेट A में अंतिम तीन संख्याएं सेट B में पहले तीन संख्याओं के अनुरूप हैं। इससे पता चलता है कि B बाईं ओर ऑफसेट 2 है।
सरल सहसंबंध-आधारित उदाहरण
एक सरल विधि संशोधित छवियों के बीच छोटे पैच की तुलना करना है। यह लगभग एक ही दृष्टिकोण से और एक ही समय में ली गई छवियों के साथ सबसे अच्छा काम करता है या छवि कैप्चर के बीच दृश्य में बहुत कम या कोई हलचल नहीं होती है, जैसे कि स्टीरियो छवियां।
एक छोटी सी विंडो को एक छवि में कई स्थानों से गुजारा जाता है। प्रत्येक स्थिति की जाँच यह देखने के लिए की जाती है कि वह दूसरी छवि में उसी स्थान से कितनी अच्छी तरह तुलना करती है। एक छवि में वस्तुओं के लिए आस-पास के कई स्थानों की तुलना की जाती है जो दूसरी छवि में बिल्कुल उसी छवि स्थान पर नहीं हो सकते हैं। यह संभव है कि कोई फिट पर्याप्त रूप से अच्छा न हो। इसका तात्पर्य यह हो सकता है कि यह सुविधा दोनों छवियों में मौजूद नहीं है, यह आपकी खोज से कहीं अधिक आगे बढ़ गई है, यह बहुत अधिक बदल गई है या छवि के अन्य हिस्सों द्वारा छिपाई जा रही है।
यह भी देखें
- स्टीरियोस्कोपी
- लंबन
- फोटोग्रामेट्री
- गहराई की समझ
- स्टीरियोप्सिस
- कंप्यूटर दृष्टि
- मौलिक मैट्रिक्स (कंप्यूटर विज़न)
- जेसीबीबी
- एपिपोलर ज्यामिति
- छवि पंजीकरण
- बिर्चफील्ड-टोमासी असमानता
- स्केल-अपरिवर्तनीय सुविधा परिवर्तन (SIFT)
संदर्भ
- ↑ W. Bach; J.K. Aggarwal (29 February 1988). Motion Understanding: Robot and Human Vision. Springer Science & Business Media. ISBN 978-0-89838-258-7.
- ↑ X. Wang (September 2019). समय में दृश्य पत्राचार के साथ सीखना और तर्क करना.
- ↑ John X. Liu (2006). कंप्यूटर विज़न और रोबोटिक्स. Nova Publishers. ISBN 978-1-59454-357-9.