प्रकाशीय प्रवाह
प्रकाशीय प्रवाह या ऑप्टिक प्रवाह दृश्य में वस्तुओं, सतहों और किनारों की स्पष्ट गति (भौतिकी) का प्रतिरूप होता है | जो पर्यवेक्षक और दृश्य के मध्य सापेक्ष गति के कारण होता है।[1][2] इसको प्रकाशीय प्रवाह की छवि में साइन प्रतिरूप में गति के स्पष्ट वेग के वितरण के रूप में भी परिभाषित किया जा सकता है।[3]
प्रकाशीय प्रवाह की अवधारणा 1940 के दशक में अमेरिकी मनोवैज्ञानिक जेम्स जे. गिब्सन द्वारा संसार में घूमने वाले जानवरों को प्रदान की जाने वाली दृश्य उत्तेजना का वर्णन करने के लिए प्रस्तुत की गई थी। [4] गिब्सन ने पर्यावरण के अंदर कार्रवाई के लिए संभावनाओं को समझने की क्षमता, सामर्थ्य धारणा के लिए ऑप्टिक प्रवाह के महत्व पर बल दिया हैं। इसमें गिब्सन के अनुयायियों और मनोविज्ञान के प्रति उनके पारिस्थितिक मनोविज्ञान दृष्टिकोण ने संसार में पर्यवेक्षक द्वारा गतिविधि की धारणा के लिए प्रकाशीय प्रवाह उत्तेजना की भूमिका का प्रदर्शन करता है | और संसार में वस्तुओं के आकार, दूरी और गति की धारणा, और गति का नियंत्रण किया हैं | [5] इसमें प्रकाशीय फ्लो शब्द का उपयोग रोबोट विज्ञानी, द्वारा भी किया जाता है | जिसमें छवि प्रसंस्करण और मार्गदर्शन के नियंत्रण से संबंधित विधि को सम्मिलित किया जाता है | और जिसमें गति का पता लगाना, छवि विभाजन, समय-से-संपर्क जानकारी, विस्तार गणना का फोकस, साइन, गति प्रतिपूर्ति संकेतीकरण और स्टीरियो असमानता माप भी सम्मिलित होती हैं।[6][7]
अनुमान
आदेशित छवियों के अनुक्रम तात्कालिक छवि वेग या असतत छवि विस्थापन के रूप में गति का अनुमान लगाने की अनुमति देते हैं।[7] फ्लीट और वीस ग्रेडिएंट आधारित प्रकाशीय प्रवाह के लिए यह शैक्षणिक परिचय प्रदान करते हैं।[8] जॉन एल. बैरोन, डेविड जे. फ्लीट, और स्टीवन ब्यूकेमिन अनेक प्रकाशीय प्रवाह विधि के प्रदर्शन विश्लेषण प्रदान करते हैं। यह माप की स्पष्टता और घनत्व पर बल देता है।[9]
प्रकाशीय प्रवाह विधियाँ दो छवि फ़्रेमों के मध्य गति की गणना करने का प्रयास करती हैं जो प्रत्येक स्वर स्थिति में समय और पर ली जाती हैं। इन विधियों को विभेदक कहा जाता है क्योंकि वे छवि संकेत के स्थानीय टेलर श्रृंखला सन्निकटन पर आधारित हैं; अर्थात्, वे स्थानिक और लौकिक निर्देशांक के संबंध में आंशिक व्युत्पन्न का उपयोग करते हैं।
(2D + t)-आयामी स्तिथियों के लिए (3डी या एन-डी स्तिथियों के समान होता हैं) | इस प्रकार तीव्रता के साथ स्थान पर स्वर , द्वारा स्थानांतरित हो जाएगा और दो छवि फ़्रेमों के मध्य, और निम्नलिखित साइन स्थिरता प्रतिरोध दिया जा सकता है |
गति को सूक्ष्म मानते हुए, टेलर श्रृंखला के साथ ) पर छवि प्रतिरोध को प्राप्त करने के लिए विकसित किया जा सकता है |
उच्च क्रम के शब्दों को सूक्ष्म करके (जो रैखिककरण करता है) यह इस प्रकार है:
या, इससे विभाजित करना ,
जिसके परिणामस्वरूप
जहां , के वेग या प्रकाशीय प्रवाह के और घटक हैं और, और पर आकृति के व्युत्पन्न में होता हैं ।) और संगत दिशाओं में , और को निम्नलिखित में व्युत्पन्न के लिए लिखा जा सकता है।
इस प्रकार:
या
यह दो अज्ञातों में समीकरण है और इसे इस प्रकार समाधान नहीं किया जा सकता है। इसे प्रकाशीय फ्लो एल्गोरिदम की एपर्चर समस्या के रूप में जाना जाता है। प्रकाशीय प्रवाह को खोजने के लिए कुछ अतिरिक्त बाधाओं द्वारा दिए गए समीकरणों के समुच्चय की आवश्यकता होती है। इसमें सभी प्रकाशीय प्रवाह विधियां वास्तविक प्रवाह का अनुमान लगाने के लिए अतिरिक्त नियम प्रस्तुत करती हैं।
निर्धारण की विधियाँ
- चरण सहसंबंध - सामान्यीकृत क्रॉस-पावर स्पेक्ट्रम का व्युत्क्रम होता हैं |
- ब्लॉक-आधारित विधियाँ - वर्ग अंतरों का योग या पूर्ण अंतरों का योग न्यूनतम करना, या सामान्यीकृत क्रॉस-सहसंबंध को अधिकतम करना आवश्यक होता हैं |
- छवि सिग्नल के आंशिक व्युत्पन्न और अपनाए गए प्रवाह क्षेत्र और उच्च-क्रम आंशिक व्युत्पन्न के आधार पर प्रकाशीय प्रवाह का अनुमान लगाने की विभेदक विधियाँ होती हैं |
- लुकास-कनाडे विधि - छवि पैच और प्रवाह क्षेत्र के लिए एफ़िन मॉडल के संबंध में आवश्यक हैं | [10]
- हॉर्न-शुंक विधि - साइन स्थिरता प्रतिरोध से अवशेषों के आधार पर कार्यात्मक अनुकूलन, और प्रवाह क्षेत्र की अपेक्षित स्मूथनिंग को व्यक्त करने वाला विशेष नियमितीकरण शब्द हैं |[10]
- बक्सटन-बक्सटन विधि - छवि अनुक्रमों में किनारों की गति के मॉडल पर आधारित होती हैं | [11]
- ब्लैक-जेपसन विधि - सहसंबंध के माध्यम से मोटे प्रकाशीय प्रवाह [7]
- सामान्य परिवर्तनशील विधियाँ - अन्य डेटा नियमों और अन्य सहजता नियमों का उपयोग करते हुए हॉर्न-शुंक के संशोधनों/विस्तारों की श्रृंखला हैं।
- अलग-अलग अनुकूलन विधियाँ - खोज स्थान को परिमाणित किया जाता है, और फिर प्रत्येक पिक्सेल पर लेबल कार्य के माध्यम से छवि मिलान को संबोधित किया जाता है, जिससे संबंधित विरूपण स्रोत और लक्ष्य छवि के मध्य की दूरी को कम कर दे। [12] इष्टतम समाधान अधिकांशतः अधिकतम-प्रवाह न्यूनतम-कट प्रमेय एल्गोरिदम, रैखिक प्रोग्रामिंग या विश्वास प्रसार विधियों के माध्यम से पुनर्प्राप्त किया जाता है।
इनमें से कई, वर्तमान अत्याधुनिक एल्गोरिदम के अतिरिक्त, मिडिलबरी बेंचमार्क डेटासमुच्चय पर मूल्यांकन किए जाते हैं।[13][14] अन्य लोकप्रिय बेंचमार्क डेटासमुच्चय केआईटीटीआई और सिंटेल हैं।
उपयोग
मोशन अनुमान और वीडियो संपीड़न प्रकाशीय प्रवाह अनुसंधान के प्रमुख दृष्टिकोण के रूप में विकसित हुए हैं। चूँकि प्रकाशीय प्रवाह क्षेत्र सतही रूप से गति अनुमान की विधि से प्राप्त घने गति क्षेत्र के समान है, प्रकाशीय प्रवाह न केवल प्रकाशीय प्रवाह क्षेत्र के निर्धारण का अध्ययन है, किंतु त्रि-आयामी प्रकृति का आकलन करने में भी इसके उपयोग का अध्ययन होता है। और दृश्य की संरचना, साथ ही वस्तुओं की 3डी गति और दृश्य के सापेक्ष पर्यवेक्षक, उनमें से अधिकांश जैकोबियन छवि का उपयोग करते हैं।[15]
रोबोटिक्स्स शोधकर्ताओं द्वारा प्रकाशीय प्रवाह का उपयोग अनेकक्षेत्रों में किया गया था जैसे: वस्तु का पता लगाना और ट्रैकिंग, छवि डोमिनेंट प्लेन निष्कर्षण, मूवमेंट का पता लगाना, रोबोट मार्गदर्शन और दृश्य ओडोमेट्र [6] सूक्ष्म वायु वाहनों को नियंत्रित करने के लिए प्रकाशीय प्रवाह जानकारी को उपयोगी माना गया है।[16]
प्रकाशीय प्रवाह के अनुप्रयोग में न केवल पर्यवेक्षक और दृश्य में वस्तुओं की गति, किंतु वस्तुओं और पर्यावरण की संरचना का भी अनुमान लगाने की समस्या सम्मिलित है। चूँकि गति के बारे में जागरूकता और हमारे पर्यावरण की संरचना के मानसिक मानचित्रों का निर्माण पशु (और मानव) दृश्य धारणा के महत्वपूर्ण घटक हैं, इस जन्मजात क्षमता का कंप्यूटर क्षमता में रूपांतरण मशीन दृष्टि के क्षेत्र में भी उतना ही महत्वपूर्ण है।[17]
दृष्टि क्षेत्र के नीचे बाईं ओर से ऊपर दाईं ओर घूमती हुई गेंद की पांच-फ़्रेम क्लिप पर विचार करें। गति अनुमान विधि यह निर्धारित कर सकती है कि दो आयामी विमान पर गेंद ऊपर और दाईं ओर जा रही है और इस गति का वर्णन करने वाले सदिश को फ्रेम के अनुक्रम से निकाला जा सकता है। वीडियो संपीड़न (उदाहरण के लिए, एमपीईजी) के प्रयोजनों के लिए, अनुक्रम का अब उतना ही वर्णन किया गया है जितना कि इसकी आवश्यकता है। चूँकि मशीन दृष्टि के क्षेत्र में, यह प्रश्न कि क्या गेंद दाईं ओर जा रही है या पर्यवेक्षक बाईं ओर जा रहा है, अज्ञात किन्तु महत्वपूर्ण जानकारी है। उपयुक्त पांच फ़्रेमों में स्थिर, प्रतिरूप वाली पृष्ठभूमि उपस्थित हो, क्या हम आत्मविश्वास से कह सकते हैं कि गेंद दाईं ओर जा रही थी, क्योंकि प्रतिरूप में पर्यवेक्षक के लिए अनंत दूरी हो सकती है।
प्रकाशीय फ्लो सेंसर
प्रकाशीय फ्लो सेंसर के विभिन्न विन्यास उपस्थित हैं। कॉन्फ़िगरेशन छवि संवेदक चिप है जो प्रकाशीय फ्लो एल्गोरिदम को चलाने के लिए प्रोग्राम किए गए प्रोसेसर से जुड़ा होता है। अन्य कॉन्फ़िगरेशन विज़न चिप का उपयोग करता है, जो एकीकृत परिपथ है जिसमें छवि सेंसर और प्रोसेसर दोनों ही डाई पर होते हैं, जो कॉम्पैक्ट कार्यान्वयन की अनुमति देता है।[18][19] इसका उदाहरण प्रकाशीय माउस में उपयोग किया जाने वाला सामान्य प्रकाशीय माउस सेंसर है। कुछ स्तिथियोंं में प्रोसेसिंग परिप को न्यूनतम वर्तमान उपभोग का उपयोग करके तीव्र प्रकाशीय प्रवाह गणना को सक्षम करने के लिए एनालॉग या मिश्रित-सिग्नल परिपथ का उपयोग करके कार्यान्वित किया जा सकता है।
समकालीन अनुसंधान का क्षेत्र प्रकाशीय प्रवाह पर प्रतिक्रिया करने वाले परिपथ को प्रयुक्त करने के लिए न्यूरोमोर्फिक इंजीनियरिंग विधि का उपयोग है, और इस प्रकार प्रकाशीय प्रवाह सेंसर में उपयोग के लिए उपयुक्त हो सकता है।[20] ऐसे परिपथ जैविक तंत्रिका परिपथरी से प्रेरणा ले सकते हैं जो प्रकाशीय प्रवाह पर समान रूप से प्रतिक्रिया करता है।
किसी सतह पर माउस की गति को मापने के लिए विशेष सेंसिंग घटक के रूप में, कंप्यूटर प्रकाशीय माउस में प्रकाशीय फ्लो सेंसर का बड़े मापदंड पर उपयोग किया जाता है।
प्रकाशीय फ्लो सेंसर का उपयोग रोबोटिक्स अनुप्रयोगों में भी किया जा रहा है, विशेष रूप से जहां रोबोट और रोबोट के आसपास की अन्य वस्तुओं के मध्य दृश्य गति या सापेक्ष गति को मापने की आवश्यकता होती है। इसमें स्थिरता और प्रतिरोध से रक्षा के लिए मानव रहित हवाई वाहन (यूएवी), में प्रकाशीय फ्लो सेंसर का उपयोग भी वर्तमान में अनुसंधान का क्षेत्र होता है।[21]
यह भी देखें
- पारिस्थितिक संगठन
- प्रकाशीय माउस
- सीमा इमेजिंग
- दृष्टि प्रसंस्करण इकाई
- सातत्य समीकरण
संदर्भ
- ↑ Burton, Andrew; Radford, John (1978). Thinking in Perspective: Critical Essays in the Study of Thought Processes. Routledge. ISBN 978-0-416-85840-2.
- ↑ Warren, David H.; Strelow, Edward R. (1985). Electronic Spatial Sensing for the Blind: Contributions from Perception. Springer. ISBN 978-90-247-2689-9.
- ↑ Horn, Berthold K.P.; Schunck, Brian G. (August 1981). "ऑप्टिकल प्रवाह का निर्धारण" (PDF). Artificial Intelligence (in English). 17 (1–3): 185–203. doi:10.1016/0004-3702(81)90024-2. hdl:1721.1/6337.
- ↑ Gibson, J.J. (1950). दृश्य जगत की धारणा. Houghton Mifflin.
- ↑ Royden, C. S.; Moore, K. D. (2012). "गतिमान पर्यवेक्षकों द्वारा गतिमान वस्तुओं का पता लगाने में गति संकेतों का उपयोग". Vision Research. 59: 17–24. doi:10.1016/j.visres.2012.02.006. PMID 22406544. S2CID 52847487.
- ↑ 6.0 6.1 Aires, Kelson R. T.; Santana, Andre M.; Medeiros, Adelardo A. D. (2008). रंग सूचना का उपयोग कर ऑप्टिकल प्रवाह (PDF). ACM New York, NY, USA. ISBN 978-1-59593-753-7.
- ↑ 7.0 7.1 7.2 Beauchemin, S. S.; Barron, J. L. (1995). "ऑप्टिकल प्रवाह की गणना". ACM Computing Surveys. ACM New York, USA. 27 (3): 433–466. doi:10.1145/212094.212141. S2CID 1334552.
- ↑ Fleet, David J.; Weiss, Yair (2006). "Optical Flow Estimation" (PDF). In Paragios, Nikos; Chen, Yunmei; Faugeras, Olivier D. (eds.). कंप्यूटर विज़न में गणितीय मॉडल की पुस्तिका. Springer. pp. 237–257. ISBN 978-0-387-26371-7.
- ↑ Barron, John L.; Fleet, David J. & Beauchemin, Steven (1994). "ऑप्टिकल प्रवाह तकनीकों का प्रदर्शन" (PDF). International Journal of Computer Vision. 12: 43–77. CiteSeerX 10.1.1.173.481. doi:10.1007/bf01420984. S2CID 1290100.
- ↑ 10.0 10.1 Zhang, G.; Chanson, H. (2018). "Application of Local Optical Flow Methods to High-Velocity Free-surface Flows: Validation and Application to Stepped Chutes" (PDF). Experimental Thermal and Fluid Science. 90: 186–199. doi:10.1016/j.expthermflusci.2017.09.010.
- ↑ Glyn W. Humphreys and Vicki Bruce (1989). दृश्य अनुभूति. Psychology Press. ISBN 978-0-86377-124-8.
- ↑ B. Glocker; N. Komodakis; G. Tziritas; N. Navab; N. Paragios (2008). एमआरएफ और कुशल रैखिक प्रोग्रामिंग के माध्यम से सघन छवि पंजीकरण (PDF). Medical Image Analysis Journal.
- ↑ Baker, Simon; Scharstein, Daniel; Lewis, J. P.; Roth, Stefan; Black, Michael J.; Szeliski, Richard (March 2011). "ऑप्टिकल फ्लो के लिए एक डेटाबेस और मूल्यांकन पद्धति". International Journal of Computer Vision (in English). 92 (1): 1–31. doi:10.1007/s11263-010-0390-2. ISSN 0920-5691. S2CID 316800.
- ↑ Baker, Simon; Scharstein, Daniel; Lewis, J. P.; Roth, Stefan; Black, Michael J.; Szeliski, Richard. "ऑप्टिकल प्रवाह". vision.middlebury.edu. Retrieved 2019-10-18.
- ↑ Corke, Peter (8 May 2017). "छवि जैकोबियन". QUT Robot Academy.
- ↑ Barrows, G. L.; Chahl, J. S.; Srinivasan, M. V. (2003). "जैविक रूप से प्रेरित दृश्य संवेदन और उड़ान नियंत्रण". Aeronautical Journal. 107 (1069): 159–268. doi:10.1017/S0001924000011891. S2CID 108782688 – via Cambridge University Press.
- ↑ Brown, Christopher M. (1987). कंप्यूटर विजन में प्रगति. Lawrence Erlbaum Associates. ISBN 978-0-89859-648-9.
- ↑ Moini, Alireza (2000). विज़न चिप्स. Boston, MA: Springer US. ISBN 9781461552673. OCLC 851803922.
- ↑ Mead, Carver (1989). एनालॉग वीएलएसआई और तंत्रिका तंत्र. Reading, Mass.: Addison-Wesley. ISBN 0201059924. OCLC 17954003.
- ↑ Stocker, Alan A. (2006). दृश्य गति की धारणा के लिए एनालॉग वीएलएसआई सर्किट. Chichester, England: John Wiley & Sons. ISBN 0470034882. OCLC 71521689.
- ↑ Floreano, Dario; Zufferey, Jean-Christophe; Srinivasan, Mandyam V.; Ellington, Charlie, eds. (2009). उड़ने वाले कीड़े और रोबोट. Heidelberg: Springer. ISBN 9783540893936. OCLC 495477442.
बाहरी संबंध
- Finding Optic Flow
- Art of Optical Flow article on fxguide.com (using optical flow in visual effects)
- Optical flow evaluation and ground truth sequences.
- Middlebury Optical flow evaluation and ground truth sequences.
- mrf-registration.net - Optical flow estimation through MRF
- The French Aerospace Lab: GPU implementation of a Lucas-Kanade based optical flow
- CUDA Implementation by CUVI (CUDA Vision & Imaging Library)
- Horn and Schunck Optical Flow: Online demo and source code of the Horn and Schunck method
- TV-L1 Optical Flow: Online demo and source code of the Zach et al. method
- Robust Optical Flow: Online demo and source code of the Brox et al. method