डाटा संलयन

From Vigyanwiki
दो स्रोतों (आयाम #1 और #2) से डेटा का संलयन अकेले आयाम #1 या आयाम #2 के आधार पर किसी भी क्लासिफायर से बेहतर बाइनरी वर्गीकरण प्राप्त कर सकता है।

डेटा फ़्यूज़न (डाटा संलयन) किसी भी व्यक्तिगत डेटा स्रोत द्वारा प्रदान की गई जानकारी की तुलना में अधिक सुसंगत, सटीक और उपयोगी जानकारी उत्पन्न करने के लिए कई डेटा स्रोतों को एकीकृत करने की प्रक्रिया है।

डेटा फ़्यूज़न प्रक्रियाओं को प्रायः निम्न, मध्यवर्ती या उच्च के रूप में वर्गीकृत किया जाता है, यह उस प्रसंस्करण चरण पर निर्भर करता है जिस पर फ़्यूज़न होता है।[1] निम्न-स्तरीय डेटा फ़्यूज़न नए रॉ डेटा (असंसाधित्र आँकड़ा) का उत्पादन करने के लिए रॉ डेटा के कई स्रोतों को जोड़ता है। उम्मीद यह है कि फ़्यूज्ड डेटा मूल इनपुट की तुलना में अधिक एन्ट्रॉपी (सूचना सिद्धांत) और सिंथेटिक डेटा है।

उदाहरण के लिए, सेंसर फ़्यूज़न (संवेदक संलयन) को (मल्टी-सेंसर) डेटा फ़्यूज़न के रूप में भी जाना जाता है और यह सूचना फ़्यूज़न का एक उपवर्ग है।

डेटा फ़्यूज़न की अवधारणा मनुष्यों और जानवरों की जीवित रहने की क्षमता में सुधार करने के लिए कई इंद्रियों से जानकारी को सम्मिलित करने की विकसित क्षमता में उत्पन्न हुई है। उदाहरण के लिए, दृष्टि, स्पर्श, गंध और स्वाद का संयोजन यह संकेत दे सकता है कि कोई पदार्थ खाने योग्य है या नहीं है।[2]

जेडीएल/डीएफआईजी मॉडल

लैब्स (जेडीएल)/डेटा फ्यूजन इंफॉर्मेशन ग्रुप (डीएफआईजी) मॉडल के संयुक्त निदेशक

1980 के दशक के मध्य में, प्रयोगशालाओं के संयुक्त निदेशकों ने डेटा फ़्यूज़न सबपैनल का गठन किया हुआ था (जिसे बाद में डेटा फ़्यूज़न समूह के रूप में जाना जाने लगा)। वर्ल्ड वाइड वेब के आगमन के साथ, डेटा फ़्यूज़न में डेटा, सेंसर और सूचना फ़्यूज़न सम्मिलित हो गए थे। जेडीएल/डीएफआईजी ने डेटा फ़्यूज़न का एक मॉडल पेश किया जिसने विभिन्न प्रक्रियाओं को विभाजित किया था। वर्तमान में, डेटा फ़्यूज़न सूचना समूह (डीएफआईजी) मॉडल के छह स्तर हैं:

  • स्तर 0: स्रोत प्रीप्रोसेसिंग (या डेटा मूल्यांकन)
  • स्तर 1: वस्तु मूल्यांकन
  • स्तर 2: स्थिति का आकलन
  • स्तर 3: प्रभाव आकलन (या खतरा शोधन)
  • स्तर 4: प्रक्रिया परिशोधन (या संसाधन प्रबंधन)
  • स्तर 5: उपयोगकर्ता परिशोधन (या संज्ञानात्मक शोधन)
  • स्तर 6: मिशन शोधन (या मिशन प्रबंधन)

यद्यपि जेडीएल मॉडल (स्तर 1-4) आज भी उपयोग में है, लेकिन इसके निहितार्थ के लिए प्रायः इसकी आलोचना की जाती है कि स्तर आवश्यक रूप से क्रम में होते हैं और ह्यूमन-इन-द-लूप की क्षमता के पर्याप्त प्रतिनिधित्व की कमी के लिए भी। . डीएफआईजी मॉडल (स्तर 0-5) ने स्थिति जागरूकता, उपयोगकर्ता परिशोधन और मिशन प्रबंधन के निहितार्थों का पता लगाया।[3] इन कमियों के अतिरिक्त, जेडीएल/डीएफआईजी मॉडल डेटा फ़्यूज़न प्रक्रिया को देखने, चर्चा और सामान्य समझ को सुविधाजनक बनाने के लिए उपयोगी हैं।[4] और सिस्टम-स्तरीय सूचना संलयन डिज़ाइन के लिए महत्वपूर्ण है।[3] [5]

भू-स्थानिक अनुप्रयोग

भू-स्थानिक (जीआईएस) डोमेन में, डेटा फ़्यूज़न प्रायः डेटा एकीकरण का पर्याय बन जाता है। इन अनुप्रयोगों में, प्रायः विविध डेटा सेटों को एक एकीकृत (फ्यूज्ड) डेटा सेट में संयोजित करने की आवश्यकता होती है जिसमें इनपुट डेटा सेट से सभी डेटा बिंदु और समय चरण सम्मिलित होते हैं। फ़्यूज़्ड डेटा सेट एक साधारण संयुक्त सुपरसेट से भिन्न होता है जिसमें फ़्यूज़्ड डेटा सेट के बिंदुओं में विशेषताएँ और मेटाडेटा होते हैं जो मूल डेटा सेट में इन बिंदुओं के लिए सम्मिलित नहीं किए गए होंगे।

इस प्रक्रिया का एक सरलीकृत उदाहरण नीचे दिखाया गया है जहां डेटा सेट α को डेटा सेट β के साथ जोड़कर फ़्यूज्ड डेटा सेट δ बनाया जाता है। सेट α में डेटा बिंदुओं में स्थानिक निर्देशांक X और Y और विशेषताएँ A1 और A2 हैं। सेट β में डेटा बिंदुओं में स्थानिक निर्देशांक X और Y और विशेषताएँ B1 और B2 हैं। फ़्यूज़्ड डेटा सेट में सभी बिंदु और विशेषताएँ सम्मिलित हैं।

इनपुट डेटा सेट α आउटपुट डेटा सेट β फ्यूज्ड डेटा सेट δ
पॉइंट X Y A1 A2
α1 10 10 M N
α2 10 30 M N
α3 30 10 M N
α4 30 30 M N
पॉइंट X Y B1 B2
β1 20 20 Q R
β2 20 40 Q R
β3 40 20 Q R
β4 40 40 Q R
पॉइंट X Y A1 A2 B1 B2
δ1 10 10 M N Q? R?
δ2 10 30 M N Q? R?
δ3 30 10 M N Q? R?
δ4 30 30 M N Q? R?
δ5 20 20 M? N? Q R
δ6 20 40 M? N? Q R
δ7 40 20 M? N? Q R
δ8 40 40 M? N? Q R

एक साधारण परिस्थिति में जहां सभी विशेषताएँ संपूर्ण विश्लेषण डोमेन में एक समान हैं, विशेषताओं को आसानी से निर्दिष्ट किया जा सकता है: एम?, एन?, क्यू?, आर? एम, एन, क्यू, आर के लिए। एक वास्तविक एप्लिकेशन में, विशेषताएँ एक समान नहीं होती हैं और फ़्यूज्ड सेट में डेटा बिंदुओं पर विशेषताओं को ठीक से निर्दिष्ट करने के लिए सामान्यतः कुछ प्रकार के प्रक्षेप की आवश्यकता होती है।

तस्मान सागर में रॉक लॉबस्टर ट्रैक के लिए फ़्यूज्ड डेटा सेट का विज़ुअलाइज़ेशन। Myriax Pty. Ltd द्वारा इओन्फ्यूजन सॉफ़्टवेयर का उपयोग करके बनाई गई छवि।

एक अधिक जटिल अनुप्रयोग में, समुद्री पशु शोधकर्ता पशु ट्रैकिंग डेटा को बैथिमीट्रिक, मौसम विज्ञान, समुद्री सतह तापमान (एसएसटी) और पशु आवास डेटा के साथ संयोजित करने के लिए डेटा फ़्यूज़न का उपयोग करते हैं ताकि मौसम जैसी बाहरी ताकतों की प्रतिक्रिया में निवास स्थान के उपयोग और पशु व्यवहार या पानी का तापमान की जांच और समझ की जा सके, इनमें से प्रत्येक डेटा सेट एक अलग स्थानिक ग्रिड और नमूना दर प्रदर्शित करता है, इसलिए एक साधारण संयोजन संभवतः गलत धारणाएं उत्पन्न करेगा और विश्लेषण के परिणामों को खराब कर देगा। लेकिन डेटा फ़्यूज़न के उपयोग के माध्यम से, सभी डेटा और विशेषताओं को एक ही दृश्य में एक साथ लाया जाता है जिसमें पर्यावरण की अधिक संपूर्ण तस्वीर बनाई जाती है। यह वैज्ञानिकों को प्रमुख स्थानों और समय की पहचान करने और पर्यावरण और जानवरों के व्यवहार के बीच बातचीत में नई अंतर्दृष्टि बनाने में सक्षम बनाता है।

दाईं ओर के चित्र में, तस्मानिया के तट पर रॉक लॉबस्टर का अध्ययन किया गया है। तस्मानिया विश्वविद्यालय के ह्यू पेडर्सन ने दक्षिणी रॉक लॉबस्टर ट्रैकिंग डेटा (दिन और रात के लिए क्रमशः पीले और काले रंग में कोडित) को बाथमीट्री और निवास स्थान डेटा के साथ फ्यूज करने के लिए डेटा फ़्यूज़न सॉफ़्टवेयर का उपयोग किया ताकि रॉक लॉबस्टर व्यवहार की एक अनूठी 4D तस्वीर बनाई जा सके।

डेटा एकीकरण

भू-स्थानिक डोमेन के बाहर के अनुप्रयोगों में, डेटा एकीकरण और डेटा फ़्यूज़न शब्दों के उपयोग में अंतर लागू होता है। उदाहरण के लिए, बिजनेस इंटेलिजेंस जैसे क्षेत्रों में, डेटा एकीकरण का उपयोग डेटा के संयोजन का वर्णन करने के लिए किया जाता है, जबकि डेटा फ़्यूज़न एकीकरण है जिसके बाद कमी या प्रतिस्थापन होता है। डेटा एकीकरण को सेट संयोजन के रूप में देखा जा सकता है जिसमें बड़े सेट को बरकरार रखा जाता है, जबकि फ़्यूज़न बेहतर आत्मविश्वास के साथ सेट न्यूनीकरण तकनीक है।

आवेदन क्षेत्र

विभिन्न ट्रैफ़िक सेंसिंग तौर-तरीकों से

ट्रैफ़िक स्थिति को सटीक रूप से निर्धारित करने के लिए विभिन्न सेंसिंग तकनीकों के डेटा को बुद्धिमान तरीकों से जोड़ा जा सकता है। एक डेटा फ़्यूज़न आधारित दृष्टिकोण जो सड़क किनारे एकत्रित ध्वनिक, छवि और सेंसर डेटा का उपयोग करता है, विभिन्न व्यक्तिगत तरीकों के लाभों को संयोजित करने के लिए दिखाया गया है।[6]


निर्णय संलयन

कई परिस्थितियों में, भौगोलिक रूप से फैले हुए सेंसर गंभीर रूप से ऊर्जा- और बैंडविड्थ-सीमित होते हैं। इसलिए, एक निश्चित घटना से संबंधित रॉ डेटा को प्रायः प्रत्येक सेंसर से कुछ बिट्स में संक्षेपित किया जाता है। किसी द्विआधारी घटना का अनुमान लगाते समय (अर्थात्, या ), चरम परिस्थिति में केवल बाइनरी निर्णय सेंसर से निर्णय फ़्यूज़न सेंटर (डीएफसी) में भेजे जाते हैं और बेहतर वर्गीकरण प्रदर्शन प्राप्त करने के लिए संयुक्त होते हैं।[7][8][9]


संवर्धित प्रासंगिक जागरूकता के लिए

मोशन सेंसर, पर्यावरण सेंसर, पोजिशन सेंसर सहित कई अंतर्निहित सेंसर के साथ, एक आधुनिक मोबाइल डिवाइस सामान्यतः मोबाइल एप्लिकेशन को कई संवेदी डेटा तक पहुंच प्रदान करता है जिसका लाभ प्रासंगिक जागरूकता को बढ़ाने के लिए किया जा सकता है। सिग्नल प्रोसेसिंग और डेटा फ़्यूज़न तकनीकों जैसे फ़ीचर जेनरेशन, व्यवहार्यता अध्ययन और प्रमुख घटक विश्लेषण (पीसीए) का उपयोग करने से ऐसे संवेदी डेटा से डिवाइस की गति और प्रासंगिक प्रासंगिक स्थिति को वर्गीकृत करने की घनात्मक दर में काफी सुधार होगा।[10] कई संदर्भ-संवर्धित सूचना तकनीकें स्निडारो, एट अल द्वारा प्रदान की जाती हैं।[11][12]


बायेसियन ऑटो-प्रतिगामी गाऊसी प्रक्रियाएं

गॉसियन प्रक्रियाएँ एक लोकप्रिय मशीन लर्निंग मॉडल हैं। यदि एक ऑटोरेग्रेसिव मॉडल डेटा के बीच ऑटो-रिग्रेसिव संबंध माना जाता है, और प्रत्येक डेटा स्रोत को गॉसियन प्रक्रिया माना जाता है, तो यह एक गैर-रेखीय बायेसियन प्रतिगमन समस्या का गठन करता है।[13]

मल्टीफिडेलिटी सिमुलेशन बायेसियन ऑटो-रिग्रेसिव गॉसियन प्रक्रियाएं भी देखेंl

यह भी देखें

संदर्भ

  1. Klein, Lawrence A. (2004). Sensor and data fusion: A tool for information assessment and decision making. SPIE Press. p. 51. ISBN 978-0-8194-5435-5.
  2. Hall, David L.; Llinas, James (1997). "मल्टीसेंसर डेटा फ़्यूज़न का परिचय". Proceedings of the IEEE. 85 (1): 6–23. doi:10.1109/5.554205. ISSN 0018-9219.
  3. 3.0 3.1 Blasch, Erik P.; Bossé, Éloi; Lambert, Dale A. (2012). उच्च स्तरीय सूचना संलयन प्रबंधन और सिस्टम डिज़ाइन. Norwood, MA: Artech House Publishers. ISBN 978-1-6080-7151-7.
  4. Liggins, Martin E.; Hall, David L.; Llinas, James (2008). Multisensor Data Fusion, Second Edition: Theory and Practice (Multisensor Data Fusion). CRC. ISBN 978-1-4200-5308-1.
  5. Blasch, E., Steinberg, A., Das, S., Llinas, J., Chong, C.-Y., Kessler, O., Waltz, E., White, F." (2013). सूचना दोहन के लिए जेडीएल मॉडल पर दोबारा गौर करना. International Conference on Information Fusion.{{cite conference}}: CS1 maint: multiple names: authors list (link)
  6. Joshi, V., Rajamani, N., Takayuki, K., Prathapaneni, Subramaniam, L. V. (2013). मितव्ययी यातायात स्थिति संवेदन के लिए सूचना संलयन आधारित शिक्षण. Proceedings of the Twenty-Third International Joint Conference on Artificial Intelligence.{{cite conference}}: CS1 maint: multiple names: authors list (link)
  7. Ciuonzo, D.; Papa, G.; Romano, G.; Salvo Rossi, P.; Willett, P. (2013-09-01). "मल्टीसेंसर फ़्यूज़न के लिए राव टेस्ट के साथ वन-बिट विकेंद्रीकृत जांच". IEEE Signal Processing Letters. 20 (9): 861–864. arXiv:1306.6141. Bibcode:2013ISPL...20..861C. doi:10.1109/LSP.2013.2271847. ISSN 1070-9908. S2CID 6315906.
  8. Ciuonzo, D.; Salvo Rossi, P. (2014-02-01). "अज्ञात सेंसर डिटेक्शन संभावना के साथ निर्णय संलयन". IEEE Signal Processing Letters. 21 (2): 208–212. arXiv:1312.2227. Bibcode:2014ISPL...21..208C. doi:10.1109/LSP.2013.2295054. ISSN 1070-9908. S2CID 8761982.
  9. Ciuonzo, D.; De Maio, A.; Salvo Rossi, P. (2015-09-01). "स्वतंत्र बर्नौली परीक्षणों की समग्र परिकल्पना परीक्षण के लिए एक व्यवस्थित रूपरेखा". IEEE Signal Processing Letters. 22 (9): 1249–1253. Bibcode:2015ISPL...22.1249C. doi:10.1109/LSP.2015.2395811. ISSN 1070-9908. S2CID 15503268.
  10. Guiry, John J.; van de Ven, Pepijn; Nelson, John (2014-03-21). "सर्वव्यापी उपकरणों के साथ रोजमर्रा की गतिविधियों की उन्नत प्रासंगिक जागरूकता के लिए मल्टी-सेंसर फ्यूजन". Sensors (in English). 14 (3): 5687–5701. Bibcode:2014Senso..14.5687G. doi:10.3390/s140305687. PMC 4004015. PMID 24662406.
  11. Snidaro, Laurao; et, al. (2016). Context-Enhanced Information Fusion:Boosting Real-World Performance with Domain Knowledge. Switzerland, AG: Springer. ISBN 978-3-319-28971-7.
  12. Haghighat, Mohammad; Abdel-Mottaleb, Mohamed; Alhalabi, Wadee (2016). "Discriminant Correlation Analysis: Real-Time Feature Level Fusion for Multimodal Biometric Recognition". IEEE Transactions on Information Forensics and Security. 11 (9): 1984–1996. doi:10.1109/TIFS.2016.2569061. S2CID 15624506.
  13. Ranftl, Sascha; Melito, Gian Marco; Badeli, Vahid; Reinbacher-Köstinger, Alice; Ellermann, Katrin; von der Linden, Wolfgang (2019-12-31). "महाधमनी विच्छेदन की प्रतिबाधा कार्डियोग्राफी के लिए बहु-निष्ठा डेटा और गाऊसी प्रक्रियाओं के साथ बायेसियन अनिश्चितता मात्रा का ठहराव". Entropy. 22 (1): 58. Bibcode:2019Entrp..22...58R. doi:10.3390/e22010058. ISSN 1099-4300. PMC 7516489. PMID 33285833.

स्रोत

सामान्य सन्दर्भ

ग्रन्थसूची

  • Hall, David L.; McMullen, Sonya A. H. (2004). Mathematical Techniques in Multisensor Data Fusion, Second Edition. Norwood, MA: Artech House, Inc. ISBN 978-1-5805-3335-5.
  • Mitchell, H. B. (2007). Multi-sensor Data Fusion – An Introduction. Berlin: Springer-Verlag. ISBN 978-3-540-71463-7.
  • Das, S. (2008). High-Level Data Fusion. Norwood, MA: Artech House Publishers. ISBN 978-1-59693-281-4.


बाहरी संबंध