वीडियो ट्रैकिंग: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 1: Line 1:
{{distinguish|कैमरा ट्रैकिंग}}
{{distinguish|कैमरा ट्रैकिंग}}


वीडियो ट्रैकिंग कैमरे का उपयोग करके समय के साथ मोशन (भौतिकी) ऑब्जेक्ट (या ाधिक ऑब्जेक्ट) का पता लगाने की प्रक्रिया है। इसके विभिन्न प्रकार के उपयोग हैं, जिनमें से कुछ हैं: मानव-कंप्यूटर संपर्क, सुरक्षा और निगरानी, ​​वीडियो संचार और [[वीडियो संपीड़न]], [[संवर्धित वास्तविकता]], यातायात नियंत्रण, चिकित्सा इमेजिंग<ref>{{cite journal|author1=Peter Mountney, Danail Stoyanov |author2=Guang-Zhong Yang |name-list-style=amp |title=Three-Dimensional Tissue Deformation Recovery and Tracking: Introducing techniques based on laparoscopic or endoscopic images." IEEE Signal Processing Magazine. 2010 July. Volume: 27|issue= 4|pages=14–24|doi=10.1109/MSP.2010.936728|year=2010|journal=IEEE Signal Processing Magazine|volume=27 |hdl=10044/1/53740 |s2cid=14009451 |url=http://spiral.imperial.ac.uk/bitstream/10044/1/53740/2/Three-Dimensional%20Tissue%20Deformation%20Recovery%20and%20Tracking_AuthorsVersion.pdf|hdl-access=free}}</ref> और [[वीडियो संपादन]].<ref>{{cite book |author=Lyudmila Mihaylova, Paul Brasnett, Nishan Canagarajan and David Bull |title=Object Tracking by Particle Filtering Techniques in Video Sequences; In: Advances and Challenges in Multisensor Data and Information |citeseerx=10.1.1.60.8510 |year=2007 |series=NATO Security Through Science Series, 8 |publisher=IOS Press |place= Netherlands |pages=260–268 |isbn= 978-1-58603-727-7 |url=http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.60.8510&rep=rep1&type=pdf}}</ref><ref>{{cite book |chapter-url=http://www.hitl.washington.edu/research/artoolkit/Papers/IWAR99.kato.pdf |doi=10.1109/IWAR.1999.803809 |isbn=0-7695-0359-4 |chapter=Marker tracking and HMD calibration for a video-based augmented reality conferencing system |title=Proceedings 2nd IEEE and ACM International Workshop on Augmented Reality (IWAR'99) |pages=85–94 |year=1999 |last1=Kato |first1=H. |last2=Billinghurst |first2=M. |s2cid=8192877 }}</ref> वीडियो में मौजूद डेटा की मात्रा के कारण वीडियो ट्रैकिंग समय लेने वाली प्रक्रिया हो सकती है। ट्रैकिंग के लिए ऑब्जेक्ट पहचान तकनीकों का उपयोग करने की संभावित आवश्यकता जटिलता को और बढ़ा रही है, जो अपने आप में चुनौतीपूर्ण समस्या है।
'''वीडियो ट्रैकिंग''' कैमरे का उपयोग करके समय के साथ चलती हुई वस्तु (या कई वस्तुओं) को ज्ञात करने की प्रक्रिया है। इसके विभिन्न प्रकार के उपयोग हैं, जिनमें से कुछ हैं: मानव-कंप्यूटर संपर्क, सुरक्षा और निरीक्षण, ​​वीडियो संचार और [[वीडियो संपीड़न|संपीड़न]], [[संवर्धित वास्तविकता]], यातायात नियंत्रण, चिकित्सा इमेजिंग<ref>{{cite journal|author1=Peter Mountney, Danail Stoyanov |author2=Guang-Zhong Yang |name-list-style=amp |title=Three-Dimensional Tissue Deformation Recovery and Tracking: Introducing techniques based on laparoscopic or endoscopic images." IEEE Signal Processing Magazine. 2010 July. Volume: 27|issue= 4|pages=14–24|doi=10.1109/MSP.2010.936728|year=2010|journal=IEEE Signal Processing Magazine|volume=27 |hdl=10044/1/53740 |s2cid=14009451 |url=http://spiral.imperial.ac.uk/bitstream/10044/1/53740/2/Three-Dimensional%20Tissue%20Deformation%20Recovery%20and%20Tracking_AuthorsVersion.pdf|hdl-access=free}}</ref> और [[वीडियो संपादन]] है। <ref>{{cite book |author=Lyudmila Mihaylova, Paul Brasnett, Nishan Canagarajan and David Bull |title=Object Tracking by Particle Filtering Techniques in Video Sequences; In: Advances and Challenges in Multisensor Data and Information |citeseerx=10.1.1.60.8510 |year=2007 |series=NATO Security Through Science Series, 8 |publisher=IOS Press |place= Netherlands |pages=260–268 |isbn= 978-1-58603-727-7 |url=http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.60.8510&rep=rep1&type=pdf}}</ref><ref>{{cite book |chapter-url=http://www.hitl.washington.edu/research/artoolkit/Papers/IWAR99.kato.pdf |doi=10.1109/IWAR.1999.803809 |isbn=0-7695-0359-4 |chapter=Marker tracking and HMD calibration for a video-based augmented reality conferencing system |title=Proceedings 2nd IEEE and ACM International Workshop on Augmented Reality (IWAR'99) |pages=85–94 |year=1999 |last1=Kato |first1=H. |last2=Billinghurst |first2=M. |s2cid=8192877 }}</ref> वीडियो में उपस्तिथ डेटा की मात्रा के कारण वीडियो ट्रैकिंग समय लेने वाली प्रक्रिया हो सकती है। ट्रैकिंग के लिए ऑब्जेक्ट पहचान तकनीकों का उपयोग करने की संभावित आवश्यकता समिष्ट को और बढ़ा रही है, जो स्वयं में उद्देशपूर्ण समस्या है।


==उद्देश्य==
==उद्देश्य==
[[File:High-speed catching system.webm|thumb|दृश्य प्रतिक्रिया के साथ ऑब्जेक्ट ट्रैकिंग द्वारा गेंद को पकड़ने के लिए रोबोट के हाथ के लिए दृश्य सर्वोइंग का  उदाहरण जिसे उच्च गति छवि प्रसंस्करण प्रणाली द्वारा संसाधित किया जाता है।<ref>{{cite web|title=High-speed Catching System (exhibited in National Museum of Emerging Science and Innovation since 2005)|url=http://www.k2.t.u-tokyo.ac.jp/fusion/MiraikanCatching/index-e.html|website=Ishikawa Watanabe Laboratory, University of Tokyo|access-date=12 February 2015}}</ref><ref>{{cite web|title=बुनियादी अवधारणा और तकनीकी शर्तें|url=http://www.k2.t.u-tokyo.ac.jp/tech_terms/index-e.html#VisualFeedback|website=Ishikawa Watanabe Laboratory, University of Tokyo|access-date=12 February 2015}}</ref>]]वीडियो ट्रैकिंग का उद्देश्य लक्ष्य वस्तुओं को लगातार वीडियो फ्रेम में जोड़ना है। एसोसिएशन विशेष रूप से कठिन हो सकता है जब ऑब्जेक्ट [[फ्रेम रेट]] के सापेक्ष तेजी से आगे बढ़ रहे हों। और स्थिति जो समस्या की जटिलता को बढ़ाती है वह है जब ट्रैक की गई वस्तु समय के साथ अभिविन्यास बदलती है। इन स्थितियों के लिए वीडियो ट्रैकिंग सिस्टम आमतौर पर  गति मॉडल का उपयोग करते हैं जो बताता है कि वस्तु की विभिन्न संभावित गतियों के लिए लक्ष्य की छवि कैसे बदल सकती है।
[[File:High-speed catching system.webm|thumb|दृश्य प्रतिक्रिया के साथ ऑब्जेक्ट ट्रैकिंग द्वारा गेंद को पकड़ने के लिए रोबोट के हाथ के लिए दृश्य सर्वोइंग का  उदाहरण जिसे उच्च गति छवि प्रसंस्करण प्रणाली द्वारा संसाधित किया जाता है।<ref>{{cite web|title=High-speed Catching System (exhibited in National Museum of Emerging Science and Innovation since 2005)|url=http://www.k2.t.u-tokyo.ac.jp/fusion/MiraikanCatching/index-e.html|website=Ishikawa Watanabe Laboratory, University of Tokyo|access-date=12 February 2015}}</ref><ref>{{cite web|title=बुनियादी अवधारणा और तकनीकी शर्तें|url=http://www.k2.t.u-tokyo.ac.jp/tech_terms/index-e.html#VisualFeedback|website=Ishikawa Watanabe Laboratory, University of Tokyo|access-date=12 February 2015}}</ref>]]वीडियो ट्रैकिंग का उद्देश्य लक्ष्य वस्तुओं को निरंतर वीडियो फ्रेम में जोड़ना है। एसोसिएशन विशेष रूप से कठिन हो सकता है जब ऑब्जेक्ट [[फ्रेम रेट]] के सापेक्ष तीव्रता से आगे बढ़ रहे हों। और स्थिति जो समस्या की समिष्टता को बढ़ाती है वह है जब ट्रैक की गई वस्तु समय के साथ अभिविन्यास परिवर्तित होती है। इन स्थितियों के लिए वीडियो ट्रैकिंग प्रणाली सामान्यतः गति मॉडल का उपयोग करते हैं जो बताता है कि वस्तु की विभिन्न संभावित गतियों के लिए लक्ष्य की छवि कैसे परिवर्तित कर सकती है।


सरल गति मॉडल के उदाहरण हैं:
सरल गति मॉडल के उदाहरण हैं:
* तलीय वस्तुओं को ट्रैक करते समय, गति मॉडल वस्तु की छवि (उदाहरण के लिए प्रारंभिक फ्रेम) का 2डी परिवर्तन ([[एफ़िन परिवर्तन]] या [[होमोग्राफी (कंप्यूटर विज़न)]]) होता है।
* समतल वस्तुओं को ट्रैक करते समय, गति मॉडल वस्तु की छवि (उदाहरण के लिए प्रारंभिक फ्रेम) का 2डी परिवर्तन ([[एफ़िन परिवर्तन]] या [[होमोग्राफी (कंप्यूटर विज़न)]]) होता है।
* जब लक्ष्य कठोर 3डी वस्तु है, तो गति मॉडल उसकी 3डी स्थिति और अभिविन्यास के आधार पर उसके पहलू को परिभाषित करता है।
* जब लक्ष्य कठोर 3डी वस्तु है, तो गति मॉडल उसकी 3डी स्थिति और अभिविन्यास के आधार पर उसके विषय को परिभाषित करता है।
* वीडियो संपीड़न के लिए, मुख्य फ़्रेम को [[ मेक्रोब्लॉक ]] में विभाजित किया गया है। मोशन मॉडल मुख्य फ्रेम का विघटन है, जहां प्रत्येक मैक्रोब्लॉक को गति मापदंडों द्वारा दिए गए मोशन वेक्टर द्वारा अनुवादित किया जाता है।
* वीडियो संपीड़न के लिए, मुख्य फ़्रेम को [[ मेक्रोब्लॉक |मेक्रोब्लॉक]] में विभाजित किया गया है। गति मॉडल मुख्य फ्रेम का विघटन है, जहां प्रत्येक मैक्रोब्लॉक को गति पैरामीटर द्वारा दिए गए गति वेक्टर द्वारा अनुवादित किया जाता है।
* विकृत वस्तुओं की छवि को जाल से ढका जा सकता है, वस्तु की गति जाल के नोड्स की स्थिति से परिभाषित होती है।
* विकृत वस्तुओं की छवि को लैटिस से कवर किया जा सकता है, वस्तु की गति लैटिस के नोड्स की स्थिति से परिभाषित होती है।


==एल्गोरिदम==
==एल्गोरिदम==
[[File:Samples_of_object_co-segmentation.jpg|thumb|[[वस्तु सह-विभाजन]]|वीडियो फ्रेम में वस्तुओं का सह-विभाजन]]वीडियो ट्रैकिंग करने के लिए एल्गोरिदम अनुक्रमिक [[वीडियो फ्रेम]] का विश्लेषण करता है और फ़्रेम के बीच लक्ष्य की गति को आउटपुट करता है। विभिन्न प्रकार के एल्गोरिदम हैं, जिनमें से प्रत्येक में ताकत और कमजोरियां हैं। किस एल्गोरिदम का उपयोग करना है यह चुनते समय इच्छित उपयोग पर विचार करना महत्वपूर्ण है। विज़ुअल ट्रैकिंग सिस्टम के दो प्रमुख घटक हैं: लक्ष्य प्रतिनिधित्व और स्थानीयकरण, साथ ही फ़िल्टरिंग और डेटा एसोसिएशन।
[[File:Samples_of_object_co-segmentation.jpg|thumb|[[वस्तु सह-विभाजन]]|वीडियो फ्रेम में वस्तुओं का सह-विभाजन]]वीडियो ट्रैकिंग करने के लिए एल्गोरिदम अनुक्रमिक [[वीडियो फ्रेम]] का विश्लेषण करता है और फ़्रेम के मध्य लक्ष्य की गति को आउटपुट करता है। विभिन्न प्रकार के एल्गोरिदम हैं, जिनमें से प्रत्येक में बल और निर्बलता हैं। किस एल्गोरिदम का उपयोग करना है यह चयन करते समय इच्छित उपयोग पर विचार करना महत्वपूर्ण है। विज़ुअल ट्रैकिंग प्रणाली के दो प्रमुख घटक हैं: लक्ष्य प्रतिनिधित्व और स्थानीयकरण, साथ ही फ़िल्टरिंग और डेटा एसोसिएशन है।


लक्ष्य प्रतिनिधित्व और स्थानीयकरण अधिकतर नीचे से ऊपर की प्रक्रिया है। ये विधियाँ चलती हुई वस्तु की पहचान करने के लिए विभिन्न प्रकार के उपकरण देती हैं। लक्ष्य वस्तु का सफलतापूर्वक पता लगाना और उसे ट्रैक करना एल्गोरिथम पर निर्भर है। उदाहरण के लिए, ब्लॉब ट्रैकिंग का उपयोग मानव गतिविधि की पहचान करने के लिए उपयोगी है क्योंकि किसी व्यक्ति की प्रोफ़ाइल गतिशील रूप से बदलती रहती है।<ref>{{cite journal |author1=S. Kang |author2=J. Paik |author3=A. Koschan |author4=B. Abidi |author5=M. A. Abidi |editor-first1=Kenneth W |editor-first2=Fabrice |editor-last1=Tobin, Jr |editor-last2=Meriaudeau |name-list-style=amp |title=पीटीजेड कैमरों का उपयोग करके वास्तविक समय की वीडियो ट्रैकिंग|journal=Proc. SPIE |volume= 5132 |pages=103–111 |year=2003 |citeseerx=10.1.1.101.4242 |doi=10.1117/12.514945 |series=Sixth International Conference on Quality Control by Artificial Vision |bibcode=2003SPIE.5132..103K |s2cid=12298526 }}</ref> आमतौर पर इन एल्गोरिदम के लिए कम्प्यूटेशनल जटिलता कम है। निम्नलिखित कुछ सामान्य लक्ष्य प्रतिनिधित्व और स्थानीयकरण एल्गोरिदम हैं:
लक्ष्य प्रतिनिधित्व और स्थानीयकरण प्रायः नीचे से ऊपर की प्रक्रिया है। ये विधियाँ चलती हुई वस्तु की पहचान करने के लिए विभिन्न प्रकार के उपकरण प्रदान करती हैं। लक्ष्य वस्तु का सफलतापूर्वक ज्ञात करना और उसे ट्रैक करना एल्गोरिथम पर निर्भर है। उदाहरण के लिए, ब्लॉब ट्रैकिंग का उपयोग मानव गतिविधि की पहचान करने के लिए उपयोगी है क्योंकि किसी व्यक्ति की प्रोफ़ाइल गतिशील रूप से परिवर्तित होती रहती है।<ref>{{cite journal |author1=S. Kang |author2=J. Paik |author3=A. Koschan |author4=B. Abidi |author5=M. A. Abidi |editor-first1=Kenneth W |editor-first2=Fabrice |editor-last1=Tobin, Jr |editor-last2=Meriaudeau |name-list-style=amp |title=पीटीजेड कैमरों का उपयोग करके वास्तविक समय की वीडियो ट्रैकिंग|journal=Proc. SPIE |volume= 5132 |pages=103–111 |year=2003 |citeseerx=10.1.1.101.4242 |doi=10.1117/12.514945 |series=Sixth International Conference on Quality Control by Artificial Vision |bibcode=2003SPIE.5132..103K |s2cid=12298526 }}</ref> सामान्यतः इन एल्गोरिदम के लिए कम्प्यूटेशनल समिष्टता कम है। निम्नलिखित कुछ सामान्य लक्ष्य प्रतिनिधित्व और स्थानीयकरण एल्गोरिदम हैं:


* 'कर्नेल-आधारित ट्रैकिंग' ([[ माध्य-परिवर्तन ]] ट्रैकिंग<ref>Comaniciu, D.; Ramesh, V.; Meer, P., "[http://imagine.enpc.fr/~de-la-gm/cours/UPEM/projects/Real-Time%20Tracking%20of%20Non-Rigid%20Objects%20using%20Mean%20Shift.pdf Real-time tracking of non-rigid objects using mean shift]," Computer Vision and Pattern Recognition, 2000. Proceedings. IEEE Conference on, vol.2, no., pp. 142, 149 vol.2, 2000</ref>): [[समानता माप]] ([[भट्टाचार्य गुणांक]]) के अधिकतमकरण पर आधारित  पुनरावृत्तीय स्थानीयकरण प्रक्रिया।
* '''<nowiki/>'कर्नेल-आधारित ट्रैकिंग'''' '''([[ माध्य-परिवर्तन |माध्य-परिवर्तन]] ट्रैकिंग<ref>Comaniciu, D.; Ramesh, V.; Meer, P., "[http://imagine.enpc.fr/~de-la-gm/cours/UPEM/projects/Real-Time%20Tracking%20of%20Non-Rigid%20Objects%20using%20Mean%20Shift.pdf Real-time tracking of non-rigid objects using mean shift]," Computer Vision and Pattern Recognition, 2000. Proceedings. IEEE Conference on, vol.2, no., pp. 142, 149 vol.2, 2000</ref>):''' [[समानता माप]] ([[भट्टाचार्य गुणांक]]) के अधिकतमकरण पर आधारित  पुनरावृत्तीय स्थानीयकरण प्रक्रिया है।
* कंटूर ट्रैकिंग: ऑब्जेक्ट सीमा का पता लगाना (उदाहरण के लिए सक्रिय कंटूर या [[संक्षेपण एल्गोरिथ्म]])। कंटूर ट्रैकिंग विधियां पिछले फ्रेम से शुरू की गई प्रारंभिक रूपरेखा को वर्तमान फ्रेम में उसकी नई स्थिति में पुनरावृत्त रूप से विकसित करती हैं। समोच्च ट्रैकिंग का यह दृष्टिकोण ग्रेडिएंट डिसेंट का उपयोग करके समोच्च ऊर्जा को कम करके सीधे समोच्च विकसित करता है।
* '''कंटूर ट्रैकिंग:''' ऑब्जेक्ट सीमा को ज्ञात करना (उदाहरण के लिए सक्रिय कंटूर या [[संक्षेपण एल्गोरिथ्म]])। कंटूर ट्रैकिंग विधियां पूर्व फ्रेम से प्रारंभ की गई प्रारंभिक रूपरेखा को वर्तमान फ्रेम में उसकी नई स्थिति में पुनरावृत्त रूप से विकसित करती हैं। समोच्च ट्रैकिंग का यह दृष्टिकोण ग्रेडिएंट डिसेंट का उपयोग करके समोच्च ऊर्जा को कम करके सीधे समोच्च विकसित करता है।


''फ़िल्टरिंग और डेटा एसोसिएशन'' ज्यादातर ऊपर से नीचे की प्रक्रिया है, जिसमें दृश्य या वस्तु के बारे में पूर्व जानकारी शामिल करना, वस्तु की गतिशीलता से निपटना और विभिन्न परिकल्पनाओं का मूल्यांकन करना शामिल है। ये विधियाँ जटिल वस्तुओं को ट्रैक करने के साथ-साथ अधिक जटिल ऑब्जेक्ट इंटरैक्शन की अनुमति देती हैं जैसे बाधाओं के पीछे चलती वस्तुओं को ट्रैक करना।<ref>{{cite journal |author=Black, James, Tim Ellis, and Paul Rosin |title=वीडियो ट्रैकिंग प्रदर्शन मूल्यांकन के लिए एक नवीन विधि|citeseerx=10.1.1.10.3365|journal=Joint IEEE Int. Workshop on Visual Surveillance and Performance Evaluation of Tracking and Surveillance |year=2003 |pages= 125–132}}</ref> इसके अतिरिक्त जटिलता तब बढ़ जाती है जब वीडियो ट्रैकर (जिसे टीवी ट्रैकर या टारगेट ट्रैकर भी कहा जाता है) को कठोर नींव (तट पर) पर नहीं बल्कि  चलते जहाज (ऑफ-किनारे) पर लगाया जाता है, जहां आमतौर पर जड़त्वीय माप प्रणाली का उपयोग किया जाता है। -कैमरा सिस्टम की आवश्यक गतिशीलता और बैंडविड्थ को कम करने के लिए वीडियो ट्रैकर को स्थिर करें।<ref>[https://www.imar-navigation.de/de/produkte-uebersicht/product-overview-by-product/item/iipsc-tr-target-tracker-range-control Gyro Stabilized Target Tracker for Off-shore Installation]</ref>
फ़िल्टरिंग और डेटा एसोसिएशन अत्यन्त ऊपर से नीचे की प्रक्रिया है, जिसमें दृश्य या वस्तु के बारे में पूर्व जानकारी सम्मिलित करना, वस्तु की गतिशीलता से निवारण करना और विभिन्न परिकल्पनाओं का मूल्यांकन करना सम्मिलित है। ये विधियाँ समिष्ट वस्तुओं को ट्रैक करने के साथ-साथ अधिक समिष्ट ऑब्जेक्ट इंटरैक्शन की अनुमति देती हैं जैसे बाधाओं के पीछे चलती वस्तुओं को ट्रैक करना।<ref>{{cite journal |author=Black, James, Tim Ellis, and Paul Rosin |title=वीडियो ट्रैकिंग प्रदर्शन मूल्यांकन के लिए एक नवीन विधि|citeseerx=10.1.1.10.3365|journal=Joint IEEE Int. Workshop on Visual Surveillance and Performance Evaluation of Tracking and Surveillance |year=2003 |pages= 125–132}}</ref> इसके अतिरिक्त समिष्टता तब बढ़ जाती है जब वीडियो ट्रैकर (जिसे टीवी ट्रैकर या टारगेट ट्रैकर भी कहा जाता है) को कठोर आधार (तट पर) पर नहीं अन्यथा चलते जहाज (ऑफ-किनारे) पर लगाया जाता है, जहां सामान्यतः जड़त्वीय माप प्रणाली का उपयोग किया जाता है। कैमरा प्रणाली की आवश्यक गतिशीलता और बैंड की चौड़ाई को कम करने के लिए वीडियो ट्रैकर को स्थिर करते है।<ref>[https://www.imar-navigation.de/de/produkte-uebersicht/product-overview-by-product/item/iipsc-tr-target-tracker-range-control Gyro Stabilized Target Tracker for Off-shore Installation]</ref>इन एल्गोरिदम के लिए कम्प्यूटेशनल समिष्टता सामान्यतः  अधिक होती है। निम्नलिखित कुछ सामान्य फ़िल्टरिंग एल्गोरिदम हैं:
इन एल्गोरिदम के लिए कम्प्यूटेशनल जटिलता आमतौर पर बहुत अधिक होती है। निम्नलिखित कुछ सामान्य फ़िल्टरिंग एल्गोरिदम हैं:
* '''[[कलमन फ़िल्टर]]:''' गॉसियन शोर के अधीन रैखिक कार्यों के लिए इष्टतम पुनरावर्ती बायेसियन फ़िल्टर है। यह एल्गोरिदम है जो समय के साथ देखे गए मापों की श्रृंखला का उपयोग करता है, जिसमें शोर (यादृच्छिक भिन्नताएं) और अन्य अशुद्धियां होती हैं, और अज्ञात चर के अनुमान उत्पन्न करता है जो एकमात्र माप के आधार पर अधिक त्रुटिहीन होते हैं।<ref>{{cite journal |author1=M. Arulampalam |author2=S. Maskell |author3=N. Gordon |author4=T. Clapp |name-list-style=amp |title=A Tutorial on Particle Filters for Online Nonlinear/Non-Gaussian Bayesian Tracking |journal=IEEE Transactions on Signal Processing |volume= 50 |issue= 2 |year=2002 |doi=10.1109/78.978374 | citeseerx=10.1.1.117.1144 |pages=174 |bibcode=2002ITSP...50..174A |s2cid=55577025 }}</ref>
* [[कलमन फ़िल्टर]]: गॉसियन शोर के अधीन रैखिक कार्यों के लिए इष्टतम पुनरावर्ती बायेसियन फ़िल्टर। यह एल्गोरिदम है जो समय के साथ देखे गए मापों की श्रृंखला का उपयोग करता है, जिसमें शोर (यादृच्छिक भिन्नताएं) और अन्य अशुद्धियां होती हैं, और अज्ञात चर के अनुमान उत्पन्न करता है जो अकेले ल माप के आधार पर अधिक सटीक होते हैं।<ref>{{cite journal |author1=M. Arulampalam |author2=S. Maskell |author3=N. Gordon |author4=T. Clapp |name-list-style=amp |title=A Tutorial on Particle Filters for Online Nonlinear/Non-Gaussian Bayesian Tracking |journal=IEEE Transactions on Signal Processing |volume= 50 |issue= 2 |year=2002 |doi=10.1109/78.978374 | citeseerx=10.1.1.117.1144 |pages=174 |bibcode=2002ITSP...50..174A |s2cid=55577025 }}</ref>
* '''कण फ़िल्टर:''' गैर-रेखीय और गैर-गॉसियन प्रक्रियाओं के अंतर्निहित स्थान वितरण का प्रारूप लेने के लिए उपयोगी है।<ref name="Video Tracking">
* कण फ़िल्टर: गैर-रेखीय और गैर-गॉसियन प्रक्रियाओं के अंतर्निहित राज्य-स्थान वितरण का नमूना लेने के लिए उपयोगी।<ref name="Video Tracking">
{{cite book
{{cite book
|author1=Emilio Maggio |author2=Andrea Cavallaro | title = Video Tracking: Theory and Practice
|author1=Emilio Maggio |author2=Andrea Cavallaro | title = Video Tracking: Theory and Practice
Line 44: Line 43:


== यह भी देखें ==
== यह भी देखें ==
*[[मैच चल रहा है]]
*[[मैच चल रहा है|मैच मूविंग]]
*[[गति चित्रांकन]]
*[[गति चित्रांकन]]
*[[गति अनुमान]]
*[[गति अनुमान]]
*[[ऑप्टिकल प्रवाह]]
*[[ऑप्टिकल प्रवाह]]
*[[स्विस्ट्रैक]]
*[[स्विस्ट्रैक]]
*[[एकल कण ट्रैकिंग|ल कण ट्रैकिंग]]
*[[एकल कण ट्रैकिंग]]
*टेक्नोमो-फर्नांडीज एल्गोरिथम
*टेक्नोमो-फर्नांडीज एल्गोरिथम



Revision as of 20:40, 18 July 2023

वीडियो ट्रैकिंग कैमरे का उपयोग करके समय के साथ चलती हुई वस्तु (या कई वस्तुओं) को ज्ञात करने की प्रक्रिया है। इसके विभिन्न प्रकार के उपयोग हैं, जिनमें से कुछ हैं: मानव-कंप्यूटर संपर्क, सुरक्षा और निरीक्षण, ​​वीडियो संचार और संपीड़न, संवर्धित वास्तविकता, यातायात नियंत्रण, चिकित्सा इमेजिंग[1] और वीडियो संपादन है। [2][3] वीडियो में उपस्तिथ डेटा की मात्रा के कारण वीडियो ट्रैकिंग समय लेने वाली प्रक्रिया हो सकती है। ट्रैकिंग के लिए ऑब्जेक्ट पहचान तकनीकों का उपयोग करने की संभावित आवश्यकता समिष्ट को और बढ़ा रही है, जो स्वयं में उद्देशपूर्ण समस्या है।

उद्देश्य

दृश्य प्रतिक्रिया के साथ ऑब्जेक्ट ट्रैकिंग द्वारा गेंद को पकड़ने के लिए रोबोट के हाथ के लिए दृश्य सर्वोइंग का उदाहरण जिसे उच्च गति छवि प्रसंस्करण प्रणाली द्वारा संसाधित किया जाता है।[4][5]

वीडियो ट्रैकिंग का उद्देश्य लक्ष्य वस्तुओं को निरंतर वीडियो फ्रेम में जोड़ना है। एसोसिएशन विशेष रूप से कठिन हो सकता है जब ऑब्जेक्ट फ्रेम रेट के सापेक्ष तीव्रता से आगे बढ़ रहे हों। और स्थिति जो समस्या की समिष्टता को बढ़ाती है वह है जब ट्रैक की गई वस्तु समय के साथ अभिविन्यास परिवर्तित होती है। इन स्थितियों के लिए वीडियो ट्रैकिंग प्रणाली सामान्यतः गति मॉडल का उपयोग करते हैं जो बताता है कि वस्तु की विभिन्न संभावित गतियों के लिए लक्ष्य की छवि कैसे परिवर्तित कर सकती है।

सरल गति मॉडल के उदाहरण हैं:

  • समतल वस्तुओं को ट्रैक करते समय, गति मॉडल वस्तु की छवि (उदाहरण के लिए प्रारंभिक फ्रेम) का 2डी परिवर्तन (एफ़िन परिवर्तन या होमोग्राफी (कंप्यूटर विज़न)) होता है।
  • जब लक्ष्य कठोर 3डी वस्तु है, तो गति मॉडल उसकी 3डी स्थिति और अभिविन्यास के आधार पर उसके विषय को परिभाषित करता है।
  • वीडियो संपीड़न के लिए, मुख्य फ़्रेम को मेक्रोब्लॉक में विभाजित किया गया है। गति मॉडल मुख्य फ्रेम का विघटन है, जहां प्रत्येक मैक्रोब्लॉक को गति पैरामीटर द्वारा दिए गए गति वेक्टर द्वारा अनुवादित किया जाता है।
  • विकृत वस्तुओं की छवि को लैटिस से कवर किया जा सकता है, वस्तु की गति लैटिस के नोड्स की स्थिति से परिभाषित होती है।

एल्गोरिदम

वीडियो फ्रेम में वस्तुओं का सह-विभाजन

वीडियो ट्रैकिंग करने के लिए एल्गोरिदम अनुक्रमिक वीडियो फ्रेम का विश्लेषण करता है और फ़्रेम के मध्य लक्ष्य की गति को आउटपुट करता है। विभिन्न प्रकार के एल्गोरिदम हैं, जिनमें से प्रत्येक में बल और निर्बलता हैं। किस एल्गोरिदम का उपयोग करना है यह चयन करते समय इच्छित उपयोग पर विचार करना महत्वपूर्ण है। विज़ुअल ट्रैकिंग प्रणाली के दो प्रमुख घटक हैं: लक्ष्य प्रतिनिधित्व और स्थानीयकरण, साथ ही फ़िल्टरिंग और डेटा एसोसिएशन है।

लक्ष्य प्रतिनिधित्व और स्थानीयकरण प्रायः नीचे से ऊपर की प्रक्रिया है। ये विधियाँ चलती हुई वस्तु की पहचान करने के लिए विभिन्न प्रकार के उपकरण प्रदान करती हैं। लक्ष्य वस्तु का सफलतापूर्वक ज्ञात करना और उसे ट्रैक करना एल्गोरिथम पर निर्भर है। उदाहरण के लिए, ब्लॉब ट्रैकिंग का उपयोग मानव गतिविधि की पहचान करने के लिए उपयोगी है क्योंकि किसी व्यक्ति की प्रोफ़ाइल गतिशील रूप से परिवर्तित होती रहती है।[6] सामान्यतः इन एल्गोरिदम के लिए कम्प्यूटेशनल समिष्टता कम है। निम्नलिखित कुछ सामान्य लक्ष्य प्रतिनिधित्व और स्थानीयकरण एल्गोरिदम हैं:

  • 'कर्नेल-आधारित ट्रैकिंग' (माध्य-परिवर्तन ट्रैकिंग[7]): समानता माप (भट्टाचार्य गुणांक) के अधिकतमकरण पर आधारित पुनरावृत्तीय स्थानीयकरण प्रक्रिया है।
  • कंटूर ट्रैकिंग: ऑब्जेक्ट सीमा को ज्ञात करना (उदाहरण के लिए सक्रिय कंटूर या संक्षेपण एल्गोरिथ्म)। कंटूर ट्रैकिंग विधियां पूर्व फ्रेम से प्रारंभ की गई प्रारंभिक रूपरेखा को वर्तमान फ्रेम में उसकी नई स्थिति में पुनरावृत्त रूप से विकसित करती हैं। समोच्च ट्रैकिंग का यह दृष्टिकोण ग्रेडिएंट डिसेंट का उपयोग करके समोच्च ऊर्जा को कम करके सीधे समोच्च विकसित करता है।

फ़िल्टरिंग और डेटा एसोसिएशन अत्यन्त ऊपर से नीचे की प्रक्रिया है, जिसमें दृश्य या वस्तु के बारे में पूर्व जानकारी सम्मिलित करना, वस्तु की गतिशीलता से निवारण करना और विभिन्न परिकल्पनाओं का मूल्यांकन करना सम्मिलित है। ये विधियाँ समिष्ट वस्तुओं को ट्रैक करने के साथ-साथ अधिक समिष्ट ऑब्जेक्ट इंटरैक्शन की अनुमति देती हैं जैसे बाधाओं के पीछे चलती वस्तुओं को ट्रैक करना।[8] इसके अतिरिक्त समिष्टता तब बढ़ जाती है जब वीडियो ट्रैकर (जिसे टीवी ट्रैकर या टारगेट ट्रैकर भी कहा जाता है) को कठोर आधार (तट पर) पर नहीं अन्यथा चलते जहाज (ऑफ-किनारे) पर लगाया जाता है, जहां सामान्यतः जड़त्वीय माप प्रणाली का उपयोग किया जाता है। कैमरा प्रणाली की आवश्यक गतिशीलता और बैंड की चौड़ाई को कम करने के लिए वीडियो ट्रैकर को स्थिर करते है।[9]इन एल्गोरिदम के लिए कम्प्यूटेशनल समिष्टता सामान्यतः अधिक होती है। निम्नलिखित कुछ सामान्य फ़िल्टरिंग एल्गोरिदम हैं:

  • कलमन फ़िल्टर: गॉसियन शोर के अधीन रैखिक कार्यों के लिए इष्टतम पुनरावर्ती बायेसियन फ़िल्टर है। यह एल्गोरिदम है जो समय के साथ देखे गए मापों की श्रृंखला का उपयोग करता है, जिसमें शोर (यादृच्छिक भिन्नताएं) और अन्य अशुद्धियां होती हैं, और अज्ञात चर के अनुमान उत्पन्न करता है जो एकमात्र माप के आधार पर अधिक त्रुटिहीन होते हैं।[10]
  • कण फ़िल्टर: गैर-रेखीय और गैर-गॉसियन प्रक्रियाओं के अंतर्निहित स्थान वितरण का प्रारूप लेने के लिए उपयोगी है।[11][12][13]

यह भी देखें

संदर्भ

  1. Peter Mountney, Danail Stoyanov & Guang-Zhong Yang (2010). "Three-Dimensional Tissue Deformation Recovery and Tracking: Introducing techniques based on laparoscopic or endoscopic images." IEEE Signal Processing Magazine. 2010 July. Volume: 27" (PDF). IEEE Signal Processing Magazine. 27 (4): 14–24. doi:10.1109/MSP.2010.936728. hdl:10044/1/53740. S2CID 14009451.
  2. Lyudmila Mihaylova, Paul Brasnett, Nishan Canagarajan and David Bull (2007). Object Tracking by Particle Filtering Techniques in Video Sequences; In: Advances and Challenges in Multisensor Data and Information. NATO Security Through Science Series, 8. Netherlands: IOS Press. pp. 260–268. CiteSeerX 10.1.1.60.8510. ISBN 978-1-58603-727-7.{{cite book}}: CS1 maint: multiple names: authors list (link)
  3. Kato, H.; Billinghurst, M. (1999). "Marker tracking and HMD calibration for a video-based augmented reality conferencing system" (PDF). Proceedings 2nd IEEE and ACM International Workshop on Augmented Reality (IWAR'99). pp. 85–94. doi:10.1109/IWAR.1999.803809. ISBN 0-7695-0359-4. S2CID 8192877.
  4. "High-speed Catching System (exhibited in National Museum of Emerging Science and Innovation since 2005)". Ishikawa Watanabe Laboratory, University of Tokyo. Retrieved 12 February 2015.
  5. "बुनियादी अवधारणा और तकनीकी शर्तें". Ishikawa Watanabe Laboratory, University of Tokyo. Retrieved 12 February 2015.
  6. S. Kang; J. Paik; A. Koschan; B. Abidi & M. A. Abidi (2003). Tobin, Jr, Kenneth W & Meriaudeau, Fabrice (eds.). "पीटीजेड कैमरों का उपयोग करके वास्तविक समय की वीडियो ट्रैकिंग". Proc. SPIE. Sixth International Conference on Quality Control by Artificial Vision. 5132: 103–111. Bibcode:2003SPIE.5132..103K. CiteSeerX 10.1.1.101.4242. doi:10.1117/12.514945. S2CID 12298526.
  7. Comaniciu, D.; Ramesh, V.; Meer, P., "Real-time tracking of non-rigid objects using mean shift," Computer Vision and Pattern Recognition, 2000. Proceedings. IEEE Conference on, vol.2, no., pp. 142, 149 vol.2, 2000
  8. Black, James, Tim Ellis, and Paul Rosin (2003). "वीडियो ट्रैकिंग प्रदर्शन मूल्यांकन के लिए एक नवीन विधि". Joint IEEE Int. Workshop on Visual Surveillance and Performance Evaluation of Tracking and Surveillance: 125–132. CiteSeerX 10.1.1.10.3365.{{cite journal}}: CS1 maint: multiple names: authors list (link)
  9. Gyro Stabilized Target Tracker for Off-shore Installation
  10. M. Arulampalam; S. Maskell; N. Gordon & T. Clapp (2002). "A Tutorial on Particle Filters for Online Nonlinear/Non-Gaussian Bayesian Tracking". IEEE Transactions on Signal Processing. 50 (2): 174. Bibcode:2002ITSP...50..174A. CiteSeerX 10.1.1.117.1144. doi:10.1109/78.978374. S2CID 55577025.
  11. Emilio Maggio; Andrea Cavallaro (2010). Video Tracking: Theory and Practice. Vol. 1. ISBN 9780132702348. Video Tracking provides a comprehensive treatment of the fundamental aspects of algorithm and application development for the task of estimating, over time.
  12. Karthik Chandrasekaran (2010). Parametric & Non-parametric Background Subtraction Model with Object Tracking for VENUS. Vol. 1. ISBN 9780549524892. Background subtraction is the process by which we segment moving regions in image sequences.
  13. J. Martinez-del-Rincon, D. Makris, C. Orrite-Urunuela and J.-C. Nebel (2010). "Tracking Human Position and Lower Body Parts Using Kalman and Particle Filters Constrained by Human Biomechanics". IEEE Transactions on Systems Man and Cybernetics – Part B', 40(4).


बाहरी संबंध