प्रकाशीय प्रवाह: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 11: Line 11:
ऑप्टिकल प्रवाह विधियाँ दो छवि फ़्रेमों के मध्य गति की गणना करने का प्रयास करती हैं जो प्रत्येक स्वर स्थिति में समय <math>t</math> और <math>t+\Delta t</math> पर ली जाती हैं। इन विधियों को विभेदक कहा जाता है क्योंकि वे छवि संकेत के स्थानीय [[टेलर श्रृंखला]] सन्निकटन पर आधारित हैं; अर्थात्, वे स्थानिक और लौकिक निर्देशांक के संबंध में आंशिक व्युत्पन्न का उपयोग करते हैं।
ऑप्टिकल प्रवाह विधियाँ दो छवि फ़्रेमों के मध्य गति की गणना करने का प्रयास करती हैं जो प्रत्येक स्वर स्थिति में समय <math>t</math> और <math>t+\Delta t</math> पर ली जाती हैं। इन विधियों को विभेदक कहा जाता है क्योंकि वे छवि संकेत के स्थानीय [[टेलर श्रृंखला]] सन्निकटन पर आधारित हैं; अर्थात्, वे स्थानिक और लौकिक निर्देशांक के संबंध में आंशिक व्युत्पन्न का उपयोग करते हैं।


(2D + ''t'')-आयामी स्तिथियों के लिए (3डी या एन-डी स्तिथियों के समान होता हैं) | इस प्रकार तीव्रता <math>I(x,y,t)</math> के साथ स्थान <math>(x,y,t)</math> पर स्वर <math>\Delta x</math>, <math>\Delta y</math> द्वारा स्थानांतरित हो जाएगा और <math>\Delta t</math> दो छवि फ़्रेमों के बीच, और निम्नलिखित साइन स्थिरता प्रतिरोध दिया जा सकता है |
(2D + ''t'')-आयामी स्तिथियों के लिए (3डी या एन-डी स्तिथियों के समान होता हैं) | इस प्रकार तीव्रता <math>I(x,y,t)</math> के साथ स्थान <math>(x,y,t)</math> पर स्वर <math>\Delta x</math>, <math>\Delta y</math> द्वारा स्थानांतरित हो जाएगा और <math>\Delta t</math> दो छवि फ़्रेमों के मध्य, और निम्नलिखित साइन स्थिरता प्रतिरोध दिया जा सकता है |
:<math>I(x,y,t) = I(x+\Delta x, y + \Delta y, t + \Delta t)</math>
:<math>I(x,y,t) = I(x+\Delta x, y + \Delta y, t + \Delta t)</math>
गति को सूक्ष्म मानते हुए, टेलर श्रृंखला के साथ <math>I(x,y,t)</math>) पर छवि प्रतिरोध को प्राप्त करने के लिए विकसित किया जा सकता है |
गति को सूक्ष्म मानते हुए, टेलर श्रृंखला के साथ <math>I(x,y,t)</math>) पर छवि प्रतिरोध को प्राप्त करने के लिए विकसित किया जा सकता है |

Revision as of 12:21, 19 July 2023

घूमने वाले पर्यवेक्षक (इस स्तिथियों में मक्खी) द्वारा अनुभव किया गया ऑप्टिक प्रवाह होता हैं। जिसमे प्रत्येक स्थान पर ऑप्टिक प्रवाह की दिशा और परिमाण को प्रत्येक तीर की दिशा और लंबाई द्वारा दर्शाया जाता है।

ऑप्टिकल प्रवाह या ऑप्टिक प्रवाह दृश्य में वस्तुओं, सतहों और किनारों की स्पष्ट गति (भौतिकी) का प्रतिरूप है जो पर्यवेक्षक और दृश्य के मध्य सापेक्ष गति के कारण होता है।[1][2] ऑप्टिकल प्रवाह को छवि में साइन प्रतिरूप की गति के स्पष्ट वेग के वितरण के रूप में भी परिभाषित किया जा सकता है।[3]

ऑप्टिकल प्रवाह की अवधारणा 1940 के दशक में अमेरिकी मनोवैज्ञानिक जेम्स जे. गिब्सन द्वारा संसार भर में घूमने वाले जानवरों को प्रदान की जाने वाली दृश्य उत्तेजना का वर्णन करने के लिए प्रस्तुत की गई थी। [4] गिब्सन ने पर्यावरण के अंदर कार्रवाई के लिए संभावनाओं को समझने की क्षमता, सामर्थ्य धारणा के लिए ऑप्टिक प्रवाह के महत्व पर जोर दिया। गिब्सन के अनुयायियों और मनोविज्ञान के प्रति उनके पारिस्थितिक मनोविज्ञान दृष्टिकोण ने संसार में पर्यवेक्षक द्वारा आंदोलन की धारणा के लिए ऑप्टिकल प्रवाह उत्तेजना की भूमिका का प्रदर्शन किया है; संसार में वस्तुओं के आकार, दूरी और गति की धारणा; और जानवरों की गति पर नियंत्रण किया हैं | [5] ऑप्टिकल फ्लो शब्द का उपयोग रोबोटिस्टों द्वारा भी किया जाता है, जिसमें छवि प्रसंस्करण और नेविगेशन के नियंत्रण से संबंधित तकनीकों को सम्मिलित किया जाता है, जिसमें गति का पता लगाना, छवि विभाजन, समय-से-संपर्क जानकारी, विस्तार गणना का फोकस, साइन, गति प्रतिपूर्ति एन्कोडिंग और स्टीरियो असमानता माप भी सम्मिलित होती हैं।[6][7]


अनुमान

आदेशित छवियों के अनुक्रम तात्कालिक छवि वेग या असतत छवि विस्थापन के रूप में गति का अनुमान लगाने की अनुमति देते हैं।[7] फ्लीट और वीस ग्रेडिएंट आधारित ऑप्टिकल प्रवाह के लिए शैक्षणिक परिचय प्रदान करते हैं।[8] जॉन एल. बैरोन, डेविड जे. फ्लीट, और स्टीवन ब्यूकेमिन कई ऑप्टिकल प्रवाह तकनीकों का प्रदर्शन विश्लेषण प्रदान करते हैं। यह माप की सटीकता और घनत्व पर जोर देता है।[9]

ऑप्टिकल प्रवाह विधियाँ दो छवि फ़्रेमों के मध्य गति की गणना करने का प्रयास करती हैं जो प्रत्येक स्वर स्थिति में समय और पर ली जाती हैं। इन विधियों को विभेदक कहा जाता है क्योंकि वे छवि संकेत के स्थानीय टेलर श्रृंखला सन्निकटन पर आधारित हैं; अर्थात्, वे स्थानिक और लौकिक निर्देशांक के संबंध में आंशिक व्युत्पन्न का उपयोग करते हैं।

(2D + t)-आयामी स्तिथियों के लिए (3डी या एन-डी स्तिथियों के समान होता हैं) | इस प्रकार तीव्रता के साथ स्थान पर स्वर , द्वारा स्थानांतरित हो जाएगा और दो छवि फ़्रेमों के मध्य, और निम्नलिखित साइन स्थिरता प्रतिरोध दिया जा सकता है |

गति को सूक्ष्म मानते हुए, टेलर श्रृंखला के साथ ) पर छवि प्रतिरोध को प्राप्त करने के लिए विकसित किया जा सकता है |

उच्च-क्रम की नियम

उच्च क्रम के शब्दों को सूक्ष्म करके (जो रैखिककरण करता है) यह इस प्रकार है:

या, इससे विभाजित करना ,

जिसके परिणामस्वरूप


जहां , के वेग या ऑप्टिकल प्रवाह के और घटक हैं और, और पर आकृति के व्युत्पन्न में होता हैं ।) और संगत दिशाओं में , और को निम्नलिखित में व्युत्पन्न के लिए लिखा जा सकता है।

इस प्रकार:

या

यह दो अज्ञातों में समीकरण है और इसे इस प्रकार समाधान नहीं किया जा सकता है। इसे ऑप्टिकल फ्लो एल्गोरिदम की एपर्चर समस्या के रूप में जाना जाता है। ऑप्टिकल प्रवाह को खोजने के लिए कुछ अतिरिक्त बाधाओं द्वारा दिए गए समीकरणों के समुच्चय की आवश्यकता होती है। इसमें सभी ऑप्टिकल प्रवाह विधियां वास्तविक प्रवाह का अनुमान लगाने के लिए अतिरिक्त नियम प्रस्तुत करती हैं।

निर्धारण की विधियाँ

  • चरण सहसंबंध - सामान्यीकृत क्रॉस-पावर स्पेक्ट्रम का व्युत्क्रम होता हैं |
  • ब्लॉक-आधारित विधियाँ - वर्ग अंतरों का योग या पूर्ण अंतरों का योग न्यूनतम करना, या सामान्यीकृत क्रॉस-सहसंबंध को अधिकतम करना आवश्यक होता हैं |
  • छवि सिग्नल के आंशिक व्युत्पन्न और अपनाए गए प्रवाह क्षेत्र और उच्च-क्रम आंशिक व्युत्पन्न के आधार पर ऑप्टिकल प्रवाह का अनुमान लगाने की विभेदक विधियाँ होती हैं |
    • लुकास-कनाडे विधि - छवि पैच और प्रवाह क्षेत्र के लिए एफ़िन मॉडल के संबंध में आवश्यक हैं | [10]
    • हॉर्न-शुंक विधि - साइन स्थिरता प्रतिरोध से अवशेषों के आधार पर कार्यात्मक अनुकूलन, और प्रवाह क्षेत्र की अपेक्षित स्मूथनिंग को व्यक्त करने वाला विशेष नियमितीकरण शब्द हैं |[10]
    • बक्सटन-बक्सटन विधि - छवि अनुक्रमों में किनारों की गति के मॉडल पर आधारित होती हैं | [11]
    • ब्लैक-जेपसन विधि - सहसंबंध के माध्यम से मोटे ऑप्टिकल प्रवाह [7]
    • सामान्य परिवर्तनशील विधियाँ - अन्य डेटा नियमों और अन्य सहजता नियमों का उपयोग करते हुए हॉर्न-शुंक के संशोधनों/विस्तारों की श्रृंखला हैं।
  • अलग-अलग अनुकूलन विधियाँ - खोज स्थान को परिमाणित किया जाता है, और फिर प्रत्येक पिक्सेल पर लेबल कार्य के माध्यम से छवि मिलान को संबोधित किया जाता है, ताकि संबंधित विरूपण स्रोत और लक्ष्य छवि के मध्य की दूरी को कम कर दे। [12] इष्टतम समाधान अक्सर अधिकतम-प्रवाह न्यूनतम-कट प्रमेय एल्गोरिदम, रैखिक प्रोग्रामिंग या विश्वास प्रसार विधियों के माध्यम से पुनर्प्राप्त किया जाता है।

इनमें से कई, वर्तमान अत्याधुनिक एल्गोरिदम के अलावा, मिडिलबरी बेंचमार्क डेटासमुच्चय पर मूल्यांकन किए जाते हैं।[13][14] अन्य लोकप्रिय बेंचमार्क डेटासमुच्चय केआईटीटीआई और सिंटेल हैं।

उपयोग

मोशन अनुमान और वीडियो संपीड़न ऑप्टिकल प्रवाह अनुसंधान के प्रमुख पहलू के रूप में विकसित हुए हैं। जबकि ऑप्टिकल प्रवाह क्षेत्र सतही तौर पर गति अनुमान की तकनीकों से प्राप्त घने गति क्षेत्र के समान है, ऑप्टिकल प्रवाह न सिर्फ ऑप्टिकल प्रवाह क्षेत्र के निर्धारण का अध्ययन है, किंतु त्रि-आयामी प्रकृति का आकलन करने में इसके उपयोग का भी अध्ययन है। और दृश्य की संरचना, साथ ही वस्तुओं की 3डी गति और दृश्य के सापेक्ष पर्यवेक्षक, उनमें से अधिकांश जैकोबियन छवि का उपयोग करते हैं।[15]

रोबोटिक्स्स शोधकर्ताओं द्वारा ऑप्टिकल प्रवाह का उपयोग कई क्षेत्रों में किया गया था जैसे: वस्तु का पता लगाना और ट्रैकिंग, छवि डोमिनेंट प्लेन निष्कर्षण, मूवमेंट का पता लगाना, रोबोट नेविगेशन और दृश्य ओडोमेट्र [6] सूक्ष्म वायु वाहनों को नियंत्रित करने के लिए ऑप्टिकल प्रवाह जानकारी को उपयोगी माना गया है।[16]

ऑप्टिकल प्रवाह के अनुप्रयोग में न सिर्फ पर्यवेक्षक और दृश्य में वस्तुओं की गति, किंतु वस्तुओं और पर्यावरण की संरचना का भी अनुमान लगाने की समस्या सम्मिलित है। चूँकि गति के बारे में जागरूकता और हमारे पर्यावरण की संरचना के मानसिक मानचित्रों का निर्माण पशु (और मानव) दृश्य धारणा के महत्वपूर्ण घटक हैं, इस जन्मजात क्षमता का कंप्यूटर क्षमता में रूपांतरण मशीन दृष्टि के क्षेत्र में भी उतना ही महत्वपूर्ण है।[17]

वीडियो अनुक्रम में किसी गतिशील वस्तु का ऑप्टिकल प्रवाह सदिश होता हैं।

दृष्टि क्षेत्र के नीचे बाईं ओर से ऊपर दाईं ओर घूमती हुई गेंद की पांच-फ़्रेम क्लिप पर विचार करें। गति अनुमान तकनीक यह निर्धारित कर सकती है कि दो आयामी विमान पर गेंद ऊपर और दाईं ओर जा रही है और इस गति का वर्णन करने वाले वैक्टर को फ्रेम के अनुक्रम से निकाला जा सकता है। वीडियो संपीड़न (उदाहरण के लिए, एमपीईजी) के प्रयोजनों के लिए, अनुक्रम का अब उतना ही वर्णन किया गया है जितना कि इसकी आवश्यकता है। चूँकि, मशीन दृष्टि के क्षेत्र में, यह प्रश्न कि क्या गेंद दाईं ओर जा रही है या पर्यवेक्षक बाईं ओर जा रहा है, अज्ञात लेकिन महत्वपूर्ण जानकारी है। उपयुक्त पांच फ़्रेमों में स्थिर, प्रतिरूप वाली पृष्ठभूमि उपस्थित हो, क्या हम आत्मविश्वास से कह सकते हैं कि गेंद दाईं ओर जा रही थी, क्योंकि प्रतिरूप में पर्यवेक्षक के लिए अनंत दूरी हो सकती है।

ऑप्टिकल फ्लो सेंसर

ऑप्टिकल फ्लो सेंसर के विभिन्न विन्यास उपस्थित हैं। कॉन्फ़िगरेशन छवि संवेदक चिप है जो ऑप्टिकल फ्लो एल्गोरिदम को चलाने के लिए प्रोग्राम किए गए प्रोसेसर से जुड़ा होता है। अन्य कॉन्फ़िगरेशन विज़न चिप का उपयोग करता है, जो एकीकृत सर्किट है जिसमें छवि सेंसर और प्रोसेसर दोनों ही डाई पर होते हैं, जो कॉम्पैक्ट कार्यान्वयन की अनुमति देता है।[18][19] इसका उदाहरण ऑप्टिकल माउस में उपयोग किया जाने वाला सामान्य ऑप्टिकल माउस सेंसर है। कुछ स्तिथियोंं में प्रोसेसिंग सर्किटरी को न्यूनतम वर्तमान उपभोग का उपयोग करके तीव्र ऑप्टिकल प्रवाह गणना को सक्षम करने के लिए एनालॉग या मिश्रित-सिग्नल सर्किट का उपयोग करके कार्यान्वित किया जा सकता है।

समकालीन अनुसंधान का क्षेत्र ऑप्टिकल प्रवाह पर प्रतिक्रिया करने वाले सर्किट को प्रयुक्त करने के लिए न्यूरोमोर्फिक इंजीनियरिंग तकनीकों का उपयोग है, और इस प्रकार ऑप्टिकल प्रवाह सेंसर में उपयोग के लिए उपयुक्त हो सकता है।[20] ऐसे सर्किट जैविक तंत्रिका सर्किटरी से प्रेरणा ले सकते हैं जो ऑप्टिकल प्रवाह पर समान रूप से प्रतिक्रिया करता है।

किसी सतह पर माउस की गति को मापने के लिए मुख्य सेंसिंग घटक के रूप में, कंप्यूटर ऑप्टिकल माउस में ऑप्टिकल फ्लो सेंसर का बड़े पैमाने पर उपयोग किया जाता है।

ऑप्टिकल फ्लो सेंसर का उपयोग रोबोटिक्स अनुप्रयोगों में भी किया जा रहा है, मुख्य रूप से जहां रोबोट और रोबोट के आसपास की अन्य वस्तुओं के मध्य दृश्य गति या सापेक्ष गति को मापने की आवश्यकता होती है। स्थिरता और प्रतिरोध से बचाव के लिए मानव रहित हवाई वाहन (UAVs), में ऑप्टिकल फ्लो सेंसर का उपयोग भी वर्तमान में अनुसंधान का क्षेत्र है।[21]

यह भी देखें

संदर्भ

  1. Burton, Andrew; Radford, John (1978). Thinking in Perspective: Critical Essays in the Study of Thought Processes. Routledge. ISBN 978-0-416-85840-2.
  2. Warren, David H.; Strelow, Edward R. (1985). Electronic Spatial Sensing for the Blind: Contributions from Perception. Springer. ISBN 978-90-247-2689-9.
  3. Horn, Berthold K.P.; Schunck, Brian G. (August 1981). "ऑप्टिकल प्रवाह का निर्धारण" (PDF). Artificial Intelligence (in English). 17 (1–3): 185–203. doi:10.1016/0004-3702(81)90024-2. hdl:1721.1/6337.
  4. Gibson, J.J. (1950). दृश्य जगत की धारणा. Houghton Mifflin.
  5. Royden, C. S.; Moore, K. D. (2012). "गतिमान पर्यवेक्षकों द्वारा गतिमान वस्तुओं का पता लगाने में गति संकेतों का उपयोग". Vision Research. 59: 17–24. doi:10.1016/j.visres.2012.02.006. PMID 22406544. S2CID 52847487.
  6. 6.0 6.1 Aires, Kelson R. T.; Santana, Andre M.; Medeiros, Adelardo A. D. (2008). रंग सूचना का उपयोग कर ऑप्टिकल प्रवाह (PDF). ACM New York, NY, USA. ISBN 978-1-59593-753-7.
  7. 7.0 7.1 7.2 Beauchemin, S. S.; Barron, J. L. (1995). "ऑप्टिकल प्रवाह की गणना". ACM Computing Surveys. ACM New York, USA. 27 (3): 433–466. doi:10.1145/212094.212141. S2CID 1334552.
  8. Fleet, David J.; Weiss, Yair (2006). "Optical Flow Estimation" (PDF). In Paragios, Nikos; Chen, Yunmei; Faugeras, Olivier D. (eds.). कंप्यूटर विज़न में गणितीय मॉडल की पुस्तिका. Springer. pp. 237–257. ISBN 978-0-387-26371-7.
  9. Barron, John L.; Fleet, David J. & Beauchemin, Steven (1994). "ऑप्टिकल प्रवाह तकनीकों का प्रदर्शन" (PDF). International Journal of Computer Vision. 12: 43–77. CiteSeerX 10.1.1.173.481. doi:10.1007/bf01420984. S2CID 1290100.
  10. 10.0 10.1 Zhang, G.; Chanson, H. (2018). "Application of Local Optical Flow Methods to High-Velocity Free-surface Flows: Validation and Application to Stepped Chutes" (PDF). Experimental Thermal and Fluid Science. 90: 186–199. doi:10.1016/j.expthermflusci.2017.09.010.
  11. Glyn W. Humphreys and Vicki Bruce (1989). दृश्य अनुभूति. Psychology Press. ISBN 978-0-86377-124-8.
  12. B. Glocker; N. Komodakis; G. Tziritas; N. Navab; N. Paragios (2008). एमआरएफ और कुशल रैखिक प्रोग्रामिंग के माध्यम से सघन छवि पंजीकरण (PDF). Medical Image Analysis Journal.
  13. Baker, Simon; Scharstein, Daniel; Lewis, J. P.; Roth, Stefan; Black, Michael J.; Szeliski, Richard (March 2011). "ऑप्टिकल फ्लो के लिए एक डेटाबेस और मूल्यांकन पद्धति". International Journal of Computer Vision (in English). 92 (1): 1–31. doi:10.1007/s11263-010-0390-2. ISSN 0920-5691. S2CID 316800.
  14. Baker, Simon; Scharstein, Daniel; Lewis, J. P.; Roth, Stefan; Black, Michael J.; Szeliski, Richard. "ऑप्टिकल प्रवाह". vision.middlebury.edu. Retrieved 2019-10-18.
  15. Corke, Peter (8 May 2017). "छवि जैकोबियन". QUT Robot Academy.
  16. Barrows, G. L.; Chahl, J. S.; Srinivasan, M. V. (2003). "जैविक रूप से प्रेरित दृश्य संवेदन और उड़ान नियंत्रण". Aeronautical Journal. 107 (1069): 159–268. doi:10.1017/S0001924000011891. S2CID 108782688 – via Cambridge University Press.
  17. Brown, Christopher M. (1987). कंप्यूटर विजन में प्रगति. Lawrence Erlbaum Associates. ISBN 978-0-89859-648-9.
  18. Moini, Alireza (2000). विज़न चिप्स. Boston, MA: Springer US. ISBN 9781461552673. OCLC 851803922.
  19. Mead, Carver (1989). एनालॉग वीएलएसआई और तंत्रिका तंत्र. Reading, Mass.: Addison-Wesley. ISBN 0201059924. OCLC 17954003.
  20. Stocker, Alan A. (2006). दृश्य गति की धारणा के लिए एनालॉग वीएलएसआई सर्किट. Chichester, England: John Wiley & Sons. ISBN 0470034882. OCLC 71521689.
  21. Floreano, Dario; Zufferey, Jean-Christophe; Srinivasan, Mandyam V.; Ellington, Charlie, eds. (2009). उड़ने वाले कीड़े और रोबोट. Heidelberg: Springer. ISBN 9783540893936. OCLC 495477442.


बाहरी संबंध