पत्राचार समस्या: Difference between revisions

From Vigyanwiki
(Created page with "{{Short description|Computer vision problem}} {{refimprove|date=May 2015}} {{for|the problem in theory of computation|Post correspondence problem}} पत्राचार...")
 
No edit summary
Line 2: Line 2:
{{refimprove|date=May 2015}}
{{refimprove|date=May 2015}}
{{for|the problem in theory of computation|Post correspondence problem}}
{{for|the problem in theory of computation|Post correspondence problem}}
पत्राचार समस्या यह सुनिश्चित करने की समस्या को संदर्भित करती है कि एक छवि के कौन से हिस्से दूसरी छवि के किन हिस्सों से मेल खाते हैं,<ref name="BachAggarwal1988">{{cite book|author1=W. Bach|author2=J.K. Aggarwal|title=Motion Understanding: Robot and Human Vision|url=https://books.google.com/books?id=9luuxWMbHCMC&q=%22correspondence+problem%22|date=29 February 1988|publisher=Springer Science & Business Media|isbn=978-0-89838-258-7}}</ref> जहां अंतर कैमरे की गति, समय बीतने और/या तस्वीरों में वस्तुओं की गति के कारण होता है।
'''पत्राचार समस्या''' '''(कॉरेस्पोंडेंस प्रॉब्लम)''' यह सुनिश्चित करने की समस्या को संदर्भित करती है कि एक छवि के कौन से हिस्से दूसरी छवि के किन हिस्सों से मेल खाते हैं,<ref name="BachAggarwal1988">{{cite book|author1=W. Bach|author2=J.K. Aggarwal|title=Motion Understanding: Robot and Human Vision|url=https://books.google.com/books?id=9luuxWMbHCMC&q=%22correspondence+problem%22|date=29 February 1988|publisher=Springer Science & Business Media|isbn=978-0-89838-258-7}}</ref> जहां अंतर कैमरे की गति, समय बीतने और/या तस्वीरों में वस्तुओं की गति के कारण होता है।


[[कंप्यूटर दृष्टि]] में पत्राचार एक मूलभूत समस्या है - प्रभावशाली कंप्यूटर विज़न शोधकर्ता [[ताकेओ कनाडे]] ने एक बार प्रसिद्ध रूप से कहा था कि कंप्यूटर विज़न की तीन मूलभूत समस्याएं हैं: "पत्राचार, पत्राचार और पत्राचार!" <ref name="Wang2019">{{cite book|author1=X. Wang|title=समय में दृश्य पत्राचार के साथ सीखना और तर्क करना|url=https://www.ri.cmu.edu/publications/learning-and-reasoning-with-visual-correspondence-in-time/|date=September 2019}}</ref> दरअसल, कई संबंधित अनुप्रयोगों में पत्राचार निश्चित रूप से महत्वपूर्ण निर्माण खंड है: [[ऑप्टिकल प्रवाह]] (जिसमें दो छवियां समय में बाद की होती हैं), सघन [[कंप्यूटर स्टीरियो विज़न]] (जिसमें दो छवियां एक स्टीरियो कैमरा जोड़ी से होती हैं), [[गति से संरचना]] (एसएफएम) और दृश्य एक साथ स्थानीयकरण और मैपिंग (जिसमें छवियां एक दृश्य के अलग-अलग लेकिन आंशिक रूप से ओवरलैपिंग दृश्यों से होती हैं), और क्रॉस-सीन पत्राचार (जिसमें छवियां पूरी तरह से अलग-अलग दृश्यों से होती हैं)।
 
[[कंप्यूटर दृष्टि]] में पत्राचार एक मूलभूत समस्या है - प्रभावशाली कंप्यूटर विज़न शोधकर्ता [[ताकेओ कनाडे]] ने एक बार प्रसिद्ध रूप से कहा था कि कंप्यूटर विज़न की तीन मूलभूत समस्याएं हैं: "पत्राचार, पत्राचार और पत्राचार!" <ref name="Wang2019">{{cite book|author1=X. Wang|title=समय में दृश्य पत्राचार के साथ सीखना और तर्क करना|url=https://www.ri.cmu.edu/publications/learning-and-reasoning-with-visual-correspondence-in-time/|date=September 2019}}</ref> वास्तव में, कई संबंधित अनुप्रयोगों में पत्राचार निश्चित रूप से महत्वपूर्ण निर्माण खंड है: [[ऑप्टिकल प्रवाह]] (जिसमें दो छवियां समय में बाद की होती हैं), सघन [[कंप्यूटर स्टीरियो विज़न]] (जिसमें दो छवियां एक स्टीरियो कैमरा जोड़ी से होती हैं), गति से संरचना (एसएफएम) और दृश्य एक साथ स्थानीयकरण और मैपिंग (जिसमें छवियां एक दृश्य के अलग-अलग लेकिन आंशिक रूप से ओवरलैपिंग दृश्यों से होती हैं), और क्रॉस-सीन पत्राचार (जिसमें छवियां पूरी तरह से अलग-अलग दृश्यों से होती हैं)।


==अवलोकन==
==अवलोकन==
विभिन्न दृष्टिकोणों से ली गई एक ही 3डी दृश्य की दो या दो से अधिक छवियों को देखते हुए, पत्राचार समस्या एक छवि में बिंदुओं के एक सेट को खोजने के कार्य को संदर्भित करती है जिसे किसी अन्य छवि में समान बिंदुओं के रूप में पहचाना जा सकता है। ऐसा करने के लिए, एक छवि में [[बिंदु (ज्यामिति)]] या सुविधा (कंप्यूटर दृष्टि) को दूसरी छवि में बिंदुओं या विशेषताओं के साथ मिलान किया जाता है, इस प्रकार 'संबंधित बिंदु' या 'संबंधित विशेषताएं' स्थापित की जाती हैं, जिन्हें 'समरूप बिंदु' या 'समरूप विशेषताएं' भी कहा जाता है। छवियों को अलग-अलग दृष्टिकोण से, अलग-अलग समय पर, या कैमरे के सापेक्ष सामान्य गति में दृश्य में वस्तुओं के साथ लिया जा सकता है।
अलग-अलग दृष्टिकोण से ली गई एक ही 3डी दृश्य की दो या दो से अधिक छवियों को देखते हुए, पत्राचार समस्या एक छवि में बिंदुओं के एक सेट को खोजने के कार्य को संदर्भित करती है, जिसे दूसरी छवि में समान बिंदुओं के रूप में पहचाना जा सकता है। ऐसा करने के लिए, एक छवि के बिंदुओं या विशेषताओं का दूसरी छवि के बिंदुओं या विशेषताओं के साथ मिलान किया जाता है, इस प्रकार संबंधित बिंदुओं या संबंधित विशेषताओं की स्थापना की जाती है, जिन्हें समजात बिंदु या समजात विशेषताएं भी कहा जाता है। छवियों को अलग-अलग दृष्टिकोण से, अलग-अलग समय पर, या कैमरे के सापेक्ष सामान्य गति में दृश्य में वस्तुओं के साथ लिया जा सकता है।


पत्राचार समस्या एक स्टीरियो स्थिति में हो सकती है जब एक ही दृश्य की दो छवियों का उपयोग किया जाता है, या एन-व्यू पत्राचार समस्या के लिए सामान्यीकृत किया जा सकता है। बाद वाले मामले में, छवियां या तो एक ही समय में फोटो खींच रहे अलग-अलग कैमरों से आ सकती हैं या एक कैमरे से आ सकती हैं जो दृश्य के सापेक्ष घूम रहा है। समस्या तब और अधिक कठिन हो जाती है जब दृश्य में वस्तुएँ कैमरे के सापेक्ष गति में हों।
पत्राचार समस्या एक स्टीरियो स्थिति में हो सकती है जब एक ही दृश्य की दो छवियों का उपयोग किया जाता है या इसे एन-व्यू पत्राचार समस्या के लिए सामान्यीकृत किया जा सकता है। बाद के मामले में, छवियां या तो एक ही समय में फोटो खींच रहे अलग-अलग कैमरों से आ सकती हैं या एक कैमरे से आ सकती हैं जो दृश्य के सापेक्ष घूम रहा है। समस्या तब और अधिक कठिन हो जाती है जब दृश्य में वस्तुएँ कैमरे के सापेक्ष गति में हों।


पत्राचार समस्या का एक विशिष्ट अनुप्रयोग [[चित्रमाला]] निर्माण या [[छवि सिलाई]] में होता है - जब दो या दो से अधिक छवियों, जिनमें केवल एक छोटा सा ओवरलैप होता है, को एक बड़ी समग्र छवि में सिला जाना होता है। इस मामले में छवियों की एक जोड़ी में संबंधित बिंदुओं के एक सेट की पहचान करने में सक्षम होना आवश्यक है ताकि एक छवि के परिवर्तन की गणना दूसरी छवि पर सिलाई करने के लिए की जा सके।
पत्राचार समस्या का एक विशिष्ट अनुप्रयोग पैनोरमा निर्माण या छवि सिलाई में होता है - जब दो या दो से अधिक छवियां जिनमें केवल एक छोटा सा ओवरलैप होता है, उन्हें एक बड़ी समग्र छवि में सिला जाना होता है। इस मामले में, एक छवि के परिवर्तन की गणना करके इसे दूसरी छवि पर जोड़ने के लिए छवियों की एक जोड़ी में संबंधित बिंदुओं के एक सेट की पहचान करने में सक्षम होना आवश्यक है।


==बुनियादी तरीके==
==बुनियादी तरीके==
Line 18: Line 19:
सहसंबंध-आधारित - यह जांचना कि क्या एक छवि में एक स्थान दूसरी छवि में दूसरे जैसा दिखता/लगता है।
सहसंबंध-आधारित - यह जांचना कि क्या एक छवि में एक स्थान दूसरी छवि में दूसरे जैसा दिखता/लगता है।


फ़ीचर-आधारित - छवि में फ़ीचर ढूँढना और देखना कि क्या फ़ीचर के सबसेट का लेआउट दो छवियों में समान है। [[एपर्चर समस्या]] से बचने के लिए एक अच्छे फीचर में दो दिशाओं में स्थानीय भिन्नता होनी चाहिए।
फ़ीचर-आधारित - छवि में फ़ीचर ढूँढना और देखना कि क्या फ़ीचर के सबसेट का लेआउट दो छवियों में समान है। एपर्चर समस्या से बचने के लिए एक अच्छे फीचर में दो दिशाओं में स्थानीय भिन्नता होनी चाहिए।


==उपयोग==
==उपयोग==
Line 26: Line 27:


==सरल उदाहरण==
==सरल उदाहरण==
सेट [1,2,3,4,5] और सेट बी [3,4,5,6,7] के बीच पत्राचार खोजने के लिए पता लगाएं कि वे कहां ओवरलैप होते हैं और एक सेट दूसरे से कितनी दूर है। यहां हम देखते हैं कि सेट ए में अंतिम तीन संख्याएं सेट बी में पहले तीन संख्याओं के अनुरूप हैं। इससे पता चलता है कि बी, ए के बाईं ओर 2 ऑफसेट है।
सेट A [1,2,3,4,5] और सेट B [3,4,5,6,7] के बीच पत्राचार का पता लगाने के लिए पता लगाएं कि वे कहां ओवरलैप होते हैं और एक सेट दूसरे से कितनी दूर है। यहां हम देखते हैं कि सेट ए में अंतिम तीन संख्याएं सेट बी में पहले तीन संख्याओं के अनुरूप हैं। इससे पता चलता है कि B बाईं ओर ऑफसेट 2 है।


==सरल सहसंबंध-आधारित उदाहरण==
==सरल सहसंबंध-आधारित उदाहरण==
[[छवि सुधार]] छवियों के बीच छोटे पैच की तुलना करना एक सरल तरीका है। यह लगभग एक ही दृष्टिकोण से और एक ही समय में ली गई छवियों के साथ सबसे अच्छा काम करता है या छवि कैप्चर के बीच दृश्य में बहुत कम या कोई हलचल नहीं होती है, जैसे कि स्टीरियो छवियां।
एक सरल विधि संशोधित छवियों के बीच छोटे पैच की तुलना करना है। यह लगभग एक ही दृष्टिकोण से और एक ही समय में ली गई छवियों के साथ सबसे अच्छा काम करता है या छवि कैप्चर के बीच दृश्य में बहुत कम या कोई हलचल नहीं होती है, जैसे कि स्टीरियो छवियां।


एक छोटी सी विंडो को एक छवि में कई स्थानों से गुजारा जाता है। प्रत्येक स्थिति की जाँच यह देखने के लिए की जाती है कि वह दूसरी छवि में उसी स्थान से कितनी अच्छी तरह तुलना करती है। एक छवि में वस्तुओं के लिए आस-पास के कई स्थानों की तुलना की जाती है जो दूसरी छवि में बिल्कुल उसी छवि-स्थान पर नहीं हो सकते हैं। यह संभव है कि कोई फिट पर्याप्त रूप से अच्छा न हो। इसका मतलब यह हो सकता है कि यह सुविधा दोनों छवियों में मौजूद नहीं है, यह आपकी खोज से कहीं अधिक आगे बढ़ गई है, यह बहुत अधिक बदल गई है, या छवि के अन्य हिस्सों द्वारा छिपाई जा रही है।
एक छोटी सी विंडो को एक छवि में कई स्थानों से गुजारा जाता है। प्रत्येक स्थिति की जाँच यह देखने के लिए की जाती है कि वह दूसरी छवि में उसी स्थान से कितनी अच्छी तरह तुलना करती है। एक छवि में वस्तुओं के लिए आस-पास के कई स्थानों की तुलना की जाती है जो दूसरी छवि में बिल्कुल उसी छवि स्थान पर नहीं हो सकते हैं। यह संभव है कि कोई फिट पर्याप्त रूप से अच्छा न हो। इसका मतलब यह हो सकता है कि यह सुविधा दोनों छवियों में मौजूद नहीं है, यह आपकी खोज से कहीं अधिक आगे बढ़ गई है, यह बहुत अधिक बदल गई है या छवि के अन्य हिस्सों द्वारा छिपाई जा रही है।


==यह भी देखें==
==यह भी देखें==

Revision as of 23:27, 7 August 2023

पत्राचार समस्या (कॉरेस्पोंडेंस प्रॉब्लम) यह सुनिश्चित करने की समस्या को संदर्भित करती है कि एक छवि के कौन से हिस्से दूसरी छवि के किन हिस्सों से मेल खाते हैं,[1] जहां अंतर कैमरे की गति, समय बीतने और/या तस्वीरों में वस्तुओं की गति के कारण होता है।


कंप्यूटर दृष्टि में पत्राचार एक मूलभूत समस्या है - प्रभावशाली कंप्यूटर विज़न शोधकर्ता ताकेओ कनाडे ने एक बार प्रसिद्ध रूप से कहा था कि कंप्यूटर विज़न की तीन मूलभूत समस्याएं हैं: "पत्राचार, पत्राचार और पत्राचार!" [2] वास्तव में, कई संबंधित अनुप्रयोगों में पत्राचार निश्चित रूप से महत्वपूर्ण निर्माण खंड है: ऑप्टिकल प्रवाह (जिसमें दो छवियां समय में बाद की होती हैं), सघन कंप्यूटर स्टीरियो विज़न (जिसमें दो छवियां एक स्टीरियो कैमरा जोड़ी से होती हैं), गति से संरचना (एसएफएम) और दृश्य एक साथ स्थानीयकरण और मैपिंग (जिसमें छवियां एक दृश्य के अलग-अलग लेकिन आंशिक रूप से ओवरलैपिंग दृश्यों से होती हैं), और क्रॉस-सीन पत्राचार (जिसमें छवियां पूरी तरह से अलग-अलग दृश्यों से होती हैं)।

अवलोकन

अलग-अलग दृष्टिकोण से ली गई एक ही 3डी दृश्य की दो या दो से अधिक छवियों को देखते हुए, पत्राचार समस्या एक छवि में बिंदुओं के एक सेट को खोजने के कार्य को संदर्भित करती है, जिसे दूसरी छवि में समान बिंदुओं के रूप में पहचाना जा सकता है। ऐसा करने के लिए, एक छवि के बिंदुओं या विशेषताओं का दूसरी छवि के बिंदुओं या विशेषताओं के साथ मिलान किया जाता है, इस प्रकार संबंधित बिंदुओं या संबंधित विशेषताओं की स्थापना की जाती है, जिन्हें समजात बिंदु या समजात विशेषताएं भी कहा जाता है। छवियों को अलग-अलग दृष्टिकोण से, अलग-अलग समय पर, या कैमरे के सापेक्ष सामान्य गति में दृश्य में वस्तुओं के साथ लिया जा सकता है।

पत्राचार समस्या एक स्टीरियो स्थिति में हो सकती है जब एक ही दृश्य की दो छवियों का उपयोग किया जाता है या इसे एन-व्यू पत्राचार समस्या के लिए सामान्यीकृत किया जा सकता है। बाद के मामले में, छवियां या तो एक ही समय में फोटो खींच रहे अलग-अलग कैमरों से आ सकती हैं या एक कैमरे से आ सकती हैं जो दृश्य के सापेक्ष घूम रहा है। समस्या तब और अधिक कठिन हो जाती है जब दृश्य में वस्तुएँ कैमरे के सापेक्ष गति में हों।

पत्राचार समस्या का एक विशिष्ट अनुप्रयोग पैनोरमा निर्माण या छवि सिलाई में होता है - जब दो या दो से अधिक छवियां जिनमें केवल एक छोटा सा ओवरलैप होता है, उन्हें एक बड़ी समग्र छवि में सिला जाना होता है। इस मामले में, एक छवि के परिवर्तन की गणना करके इसे दूसरी छवि पर जोड़ने के लिए छवियों की एक जोड़ी में संबंधित बिंदुओं के एक सेट की पहचान करने में सक्षम होना आवश्यक है।

बुनियादी तरीके

वीडियो फ़्रेमों के बीच पत्राचार दिखाने वाला मोशन अनुमान[3]

दो छवियों के बीच पत्राचार खोजने के दो बुनियादी तरीके हैं।

सहसंबंध-आधारित - यह जांचना कि क्या एक छवि में एक स्थान दूसरी छवि में दूसरे जैसा दिखता/लगता है।

फ़ीचर-आधारित - छवि में फ़ीचर ढूँढना और देखना कि क्या फ़ीचर के सबसेट का लेआउट दो छवियों में समान है। एपर्चर समस्या से बचने के लिए एक अच्छे फीचर में दो दिशाओं में स्थानीय भिन्नता होनी चाहिए।

उपयोग

कंप्यूटर विज़न में पत्राचार समस्या का अध्ययन उस स्थिति के लिए किया जाता है जब कंप्यूटर को इनपुट के रूप में केवल छवियों के साथ इसे स्वचालित रूप से हल करना चाहिए। एक बार पत्राचार समस्या हल हो जाने के बाद, छवि बिंदुओं का एक सेट तैयार हो जाता है जो पत्राचार में हैं, दृश्य में संबंधित 3डी बिंदुओं की स्थिति, गति और/या रोटेशन को 3डी पुनर्निर्माण के लिए इस सेट पर अन्य तरीकों को लागू किया जा सकता है।

पत्राचार समस्या कण छवि वेलोसिमेट्री माप तकनीक का भी आधार है, जिसका आजकल द्रव गति को मात्रात्मक रूप से मापने के लिए द्रव यांत्रिकी क्षेत्र में व्यापक रूप से उपयोग किया जाता है।

सरल उदाहरण

सेट A [1,2,3,4,5] और सेट B [3,4,5,6,7] के बीच पत्राचार का पता लगाने के लिए पता लगाएं कि वे कहां ओवरलैप होते हैं और एक सेट दूसरे से कितनी दूर है। यहां हम देखते हैं कि सेट ए में अंतिम तीन संख्याएं सेट बी में पहले तीन संख्याओं के अनुरूप हैं। इससे पता चलता है कि B बाईं ओर ऑफसेट 2 है।

सरल सहसंबंध-आधारित उदाहरण

एक सरल विधि संशोधित छवियों के बीच छोटे पैच की तुलना करना है। यह लगभग एक ही दृष्टिकोण से और एक ही समय में ली गई छवियों के साथ सबसे अच्छा काम करता है या छवि कैप्चर के बीच दृश्य में बहुत कम या कोई हलचल नहीं होती है, जैसे कि स्टीरियो छवियां।

एक छोटी सी विंडो को एक छवि में कई स्थानों से गुजारा जाता है। प्रत्येक स्थिति की जाँच यह देखने के लिए की जाती है कि वह दूसरी छवि में उसी स्थान से कितनी अच्छी तरह तुलना करती है। एक छवि में वस्तुओं के लिए आस-पास के कई स्थानों की तुलना की जाती है जो दूसरी छवि में बिल्कुल उसी छवि स्थान पर नहीं हो सकते हैं। यह संभव है कि कोई फिट पर्याप्त रूप से अच्छा न हो। इसका मतलब यह हो सकता है कि यह सुविधा दोनों छवियों में मौजूद नहीं है, यह आपकी खोज से कहीं अधिक आगे बढ़ गई है, यह बहुत अधिक बदल गई है या छवि के अन्य हिस्सों द्वारा छिपाई जा रही है।

यह भी देखें

संदर्भ

  1. W. Bach; J.K. Aggarwal (29 February 1988). Motion Understanding: Robot and Human Vision. Springer Science & Business Media. ISBN 978-0-89838-258-7.
  2. X. Wang (September 2019). समय में दृश्य पत्राचार के साथ सीखना और तर्क करना.
  3. John X. Liu (2006). कंप्यूटर विज़न और रोबोटिक्स. Nova Publishers. ISBN 978-1-59454-357-9.


बाहरी संबंध