मल्टीवे डेटा विश्लेषण: Difference between revisions
No edit summary |
No edit summary |
||
Line 3: | Line 3: | ||
मल्टीवे डेटा विश्लेषण | '''मल्टीवे डेटा विश्लेषण''' मल्टीवे सरणी <math> {\mathcal A}\in{\mathbb C}^{I_0\times I_1\times \dots I_c\times \dots I_C} | ||
</math> के रूप में अवलोकनों के संग्रह का प्रतिनिधित्व करके बड़े डेटा सेट का विश्लेषण करने की एक विधि है। (''C+1'')-वे सरणी में डेटा संगठन का उचित विकल्प, और विश्लेषण तकनीकें अन्य विधियों से न पहचाने गए अंतर्निहित डेटा में पैटर्न प्रकट कर सकती हैं।<ref name="Coppi1989"> | |||
{{cite book | {{cite book | ||
|editor1-last=Coppi|editor1-first=R. | |editor1-last=Coppi|editor1-first=R. | ||
Line 14: | Line 15: | ||
}}</ref> | }}</ref> | ||
==इतिहास== | ==इतिहास== | ||
मल्टीवे डेटा विश्लेषण के अध्ययन को पहली बार 1988 में आयोजित एक सम्मेलन के परिणाम के रूप में औपचारिक रूप दिया गया था। इस सम्मेलन का परिणाम विशेष रूप से इस क्षेत्र को संबोधित पहला पाठ था कोप्पी और बोलास्को का मल्टीवे डेटा | मल्टीवे डेटा विश्लेषण के अध्ययन को पहली बार 1988 में आयोजित एक सम्मेलन के परिणाम के रूप में औपचारिक रूप दिया गया था। इस सम्मेलन का परिणाम विशेष रूप से इस क्षेत्र को संबोधित पहला पाठ था कोप्पी और बोलास्को का मल्टीवे डेटा विश्लेषण था।<ref name=Kroonenberg2008> | ||
{{cite book | {{cite book | ||
|page=xv | |page=xv | ||
Line 24: | Line 25: | ||
|year=2008 | |year=2008 | ||
|isbn=9780470237991 | |isbn=9780470237991 | ||
}}</ref> उस समय मल्टीवे विश्लेषण के अनुप्रयोग क्षेत्रों में सांख्यिकी [[अर्थमिति]] और [[साइकोमेट्रिक्स]] सम्मिलित थे। | }}</ref> उस समय मल्टीवे विश्लेषण के अनुप्रयोग क्षेत्रों में सांख्यिकी [[अर्थमिति]] और [[साइकोमेट्रिक्स]] सम्मिलित थे। वर्तमान के वर्षों में [[ रसायन विज्ञान |रसायन विज्ञान]] , [[कृषि]], [[सामाजिक नेटवर्क विश्लेषण]] और [[खाद्य उद्योग]] को सम्मिलित करने के लिए अनुप्रयोगों का विस्तार हुआ है।<ref name=Bro1998> | ||
{{cite thesis | {{cite thesis | ||
|url=http://curis.ku.dk/ws/files/13035961/rasmus_bro.pdf | |url=http://curis.ku.dk/ws/files/13035961/rasmus_bro.pdf | ||
Line 40: | Line 41: | ||
इस अर्थ में हम विश्लेषण करने के लिए डेटा के विभिन्न विधियो को परिभाषित कर सकते हैं: | इस अर्थ में हम विश्लेषण करने के लिए डेटा के विभिन्न विधियो को परिभाषित कर सकते हैं: | ||
* एक तरफ़ा डेटा: एक डेटा बिंदु <math>I_0</math>-आयाम, <math>{\bf a}\in {\mathbb C}^{I_0}</math> एक [[वेक्टर (गणित और भौतिकी)]] या डेटा बिंदु है जो एक-तरफ़ा सरणी डेटा संरचना में संग्रहीत होता है। | * एक तरफ़ा डेटा: एक डेटा बिंदु <math>I_0</math>-आयाम, <math>{\bf a}\in {\mathbb C}^{I_0}</math> एक [[वेक्टर (गणित और भौतिकी)]] या डेटा बिंदु है जो एक-तरफ़ा सरणी डेटा संरचना में संग्रहीत होता है। | ||
* दो- | *दो-तरफ़ा डेटा: <math>I_1</math> डेटा बिंदुओं <math>{\bf a}\in {\mathbb C}^{I_0}</math> का एक संग्रह दो-तरफ़ा सरणी, <math>{\bf A}\in {\mathbb C}^{I_0\times I_1}</math> में संग्रहीत किया जाता है। अलग-अलग आयामों के स्थितियों में ऐसे डेटा की कल्पना करने के लिए एक स्प्रेडशीट का उपयोग किया जा सकता है। | ||
* तीन-तरफा डेटा: डेटा का संग्रह <math>{\bf a}\in {\mathbb C}^{I_0}</math> जिसमें भिन्नता के दो विधि हैं, उसे तीन-तरफ़ा सरणी में संग्रहीत किया जाता है, <math>{\bf A}\in {\mathbb C}^{I_0\times I_1\times I_2}</math>. ऐसा डेटा अलग-अलग स्थानों पर तापमान का प्रतिनिधित्व कर सकता है (दो-तरफा डेटा) अलग-अलग समय पर नमूना लिया गया (तीन-तरफ़ा डेटा के लिए अग्रणी) | * तीन-तरफा डेटा: डेटा का संग्रह <math>{\bf a}\in {\mathbb C}^{I_0}</math> जिसमें भिन्नता के दो विधि हैं, उसे तीन-तरफ़ा सरणी में संग्रहीत किया जाता है, <math>{\bf A}\in {\mathbb C}^{I_0\times I_1\times I_2}</math>. ऐसा डेटा अलग-अलग स्थानों पर तापमान का प्रतिनिधित्व कर सकता है (दो-तरफा डेटा) अलग-अलग समय पर नमूना लिया गया (तीन-तरफ़ा डेटा के लिए अग्रणी) | ||
* समान स्प्रेडशीट सादृश्य का उपयोग करके चार-तरफा डेटा को अलग-अलग कार्यपुस्तिकाओं से भरे फ़ाइल फ़ोल्डर के रूप में दर्शाया जा सकता है। | * समान स्प्रेडशीट सादृश्य का उपयोग करके चार-तरफा डेटा को अलग-अलग कार्यपुस्तिकाओं से भरे फ़ाइल फ़ोल्डर के रूप में दर्शाया जा सकता है। | ||
* पांच-तरफ़ा डेटा और छह-तरफ़ा डेटा को डेटा एकत्रीकरण के समान उच्च स्तर द्वारा दर्शाया जा सकता है। | * पांच-तरफ़ा डेटा और छह-तरफ़ा डेटा को डेटा एकत्रीकरण के समान उच्च स्तर द्वारा दर्शाया जा सकता है। | ||
सामान्यतः | सामान्यतः मल्टीवे डेटा को मल्टीवे ऐरे में संग्रहित किया जाता है और इसे अलग-अलग समय पर या अलग-अलग स्थानों पर अलग-अलग पद्धतियों का उपयोग करके मापा जा सकता है और इसमें विसंगतियां हो सकती हैं जैसे कि लापता डेटा या डेटा प्रतिनिधित्व में विसंगतियां है। | ||
===मल्टीवे मॉडल=== | ===मल्टीवे मॉडल=== | ||
===मल्टीवे एप्लिकेशन=== | ===मल्टीवे एप्लिकेशन=== | ||
मल्टीवे डेटा विश्लेषण को विभिन्न मल्टीवे अनुप्रयोगों में नियोजित किया जा सकता है जिससे मल्टीवे डेटासेट में छिपी मल्टीलाइनर संरचना को खोजने की समस्या का समाधान किया जा सकता | मल्टीवे डेटा विश्लेषण को विभिन्न मल्टीवे अनुप्रयोगों में नियोजित किया जा सकता है जिससे मल्टीवे डेटासेट में छिपी मल्टीलाइनर संरचना को खोजने की समस्या का समाधान किया जा सकता है। विभिन्न क्षेत्रों में अनुप्रयोगों के उदाहरण निम्नलिखित हैं:<ref> | ||
{{cite thesis | {{cite thesis | ||
|url=http://www.cs.rpi.edu/research/pdf/07-06.pdf | |url=http://www.cs.rpi.edu/research/pdf/07-06.pdf | ||
Line 79: | Line 80: | ||
|year=2021 | |year=2021 | ||
}}</ref> | }}</ref> | ||
*[[कंप्यूटर दृष्टि]] - टेन्सरफेसेस<ref name="Vasilescu2002Tensorfaces" /><ref name="MPCA-MICA2005" /> और मानव गति हस्ताक्षर<ref name="Vasilescu2002b" /> चेहरे की छवियों का विश्लेषण करता है और मानव संयुक्त कोण डेटा को मल्टीवे सरणी में व्यवस्थित करता है। मल्टीवे डेटा विश्लेषण का उपयोग कारण कारक अभ्यावेदन के एक सेट की गणना करने के लिए किया जाता है। | |||
* [[इलेक्ट्रोएनालिटिकल रसायन शास्त्र]] विज्ञान | * [[इलेक्ट्रोएनालिटिकल रसायन शास्त्र]] विज्ञान | ||
* [[तंत्रिका विज्ञान]] | * [[तंत्रिका विज्ञान|तंत्रिकाविज्ञान]] | ||
* [[प्रक्रिया विश्लेषण]] | * [[प्रक्रिया विश्लेषण]] | ||
* सोशल नेटवर्क विश्लेषण/वेब-माइनिंग | * सोशल नेटवर्क विश्लेषण/वेब-माइनिंग | ||
Line 99: | Line 101: | ||
|doi=10.1002/elan.201000642 | |doi=10.1002/elan.201000642 | ||
}}</ref> | }}</ref> | ||
== यह भी देखें == | == यह भी देखें == | ||
*[[मल्टीलिनियर सबस्पेस लर्निंग]] | *[[मल्टीलिनियर सबस्पेस लर्निंग]] |
Revision as of 20:50, 12 July 2023
मल्टीवे डेटा विश्लेषण मल्टीवे सरणी के रूप में अवलोकनों के संग्रह का प्रतिनिधित्व करके बड़े डेटा सेट का विश्लेषण करने की एक विधि है। (C+1)-वे सरणी में डेटा संगठन का उचित विकल्प, और विश्लेषण तकनीकें अन्य विधियों से न पहचाने गए अंतर्निहित डेटा में पैटर्न प्रकट कर सकती हैं।[1]
इतिहास
मल्टीवे डेटा विश्लेषण के अध्ययन को पहली बार 1988 में आयोजित एक सम्मेलन के परिणाम के रूप में औपचारिक रूप दिया गया था। इस सम्मेलन का परिणाम विशेष रूप से इस क्षेत्र को संबोधित पहला पाठ था कोप्पी और बोलास्को का मल्टीवे डेटा विश्लेषण था।[2] उस समय मल्टीवे विश्लेषण के अनुप्रयोग क्षेत्रों में सांख्यिकी अर्थमिति और साइकोमेट्रिक्स सम्मिलित थे। वर्तमान के वर्षों में रसायन विज्ञान , कृषि, सामाजिक नेटवर्क विश्लेषण और खाद्य उद्योग को सम्मिलित करने के लिए अनुप्रयोगों का विस्तार हुआ है।[3]
मल्टीवे डेटा विश्लेषण की संरचना
मल्टीवे डेटा
मल्टीवे डेटा विश्लेषक डेटा का विश्लेषण करने के लिए उपयोग की जाने वाली विधियों या मॉडलों के लिए मोड शब्द को आरक्षित करते समय डेटा भिन्नता के संख्या स्रोतों को संदर्भित करने के लिए वे शब्द का उपयोग करते हैं।[2]: xviii
इस अर्थ में हम विश्लेषण करने के लिए डेटा के विभिन्न विधियो को परिभाषित कर सकते हैं:
- एक तरफ़ा डेटा: एक डेटा बिंदु -आयाम, एक वेक्टर (गणित और भौतिकी) या डेटा बिंदु है जो एक-तरफ़ा सरणी डेटा संरचना में संग्रहीत होता है।
- दो-तरफ़ा डेटा: डेटा बिंदुओं का एक संग्रह दो-तरफ़ा सरणी, में संग्रहीत किया जाता है। अलग-अलग आयामों के स्थितियों में ऐसे डेटा की कल्पना करने के लिए एक स्प्रेडशीट का उपयोग किया जा सकता है।
- तीन-तरफा डेटा: डेटा का संग्रह जिसमें भिन्नता के दो विधि हैं, उसे तीन-तरफ़ा सरणी में संग्रहीत किया जाता है, . ऐसा डेटा अलग-अलग स्थानों पर तापमान का प्रतिनिधित्व कर सकता है (दो-तरफा डेटा) अलग-अलग समय पर नमूना लिया गया (तीन-तरफ़ा डेटा के लिए अग्रणी)
- समान स्प्रेडशीट सादृश्य का उपयोग करके चार-तरफा डेटा को अलग-अलग कार्यपुस्तिकाओं से भरे फ़ाइल फ़ोल्डर के रूप में दर्शाया जा सकता है।
- पांच-तरफ़ा डेटा और छह-तरफ़ा डेटा को डेटा एकत्रीकरण के समान उच्च स्तर द्वारा दर्शाया जा सकता है।
सामान्यतः मल्टीवे डेटा को मल्टीवे ऐरे में संग्रहित किया जाता है और इसे अलग-अलग समय पर या अलग-अलग स्थानों पर अलग-अलग पद्धतियों का उपयोग करके मापा जा सकता है और इसमें विसंगतियां हो सकती हैं जैसे कि लापता डेटा या डेटा प्रतिनिधित्व में विसंगतियां है।
मल्टीवे मॉडल
मल्टीवे एप्लिकेशन
मल्टीवे डेटा विश्लेषण को विभिन्न मल्टीवे अनुप्रयोगों में नियोजित किया जा सकता है जिससे मल्टीवे डेटासेट में छिपी मल्टीलाइनर संरचना को खोजने की समस्या का समाधान किया जा सकता है। विभिन्न क्षेत्रों में अनुप्रयोगों के उदाहरण निम्नलिखित हैं:[4]
- कंप्यूटर दृष्टि - टेन्सरफ़ेस[5][6] और मानव गति हस्ताक्षर[7] चेहरे की छवियों का विश्लेषण करता है और मानव संयुक्त कोण डेटा को मल्टीवे सरणी में व्यवस्थित करता है। मल्टीवे डेटा विश्लेषण का उपयोग कारण कारक अभ्यावेदन के एक सेट की गणना करने के लिए किया जाता है।[8]
- कंप्यूटर दृष्टि - टेन्सरफेसेस[5][6] और मानव गति हस्ताक्षर[7] चेहरे की छवियों का विश्लेषण करता है और मानव संयुक्त कोण डेटा को मल्टीवे सरणी में व्यवस्थित करता है। मल्टीवे डेटा विश्लेषण का उपयोग कारण कारक अभ्यावेदन के एक सेट की गणना करने के लिए किया जाता है।
- इलेक्ट्रोएनालिटिकल रसायन शास्त्र विज्ञान
- तंत्रिकाविज्ञान
- प्रक्रिया विश्लेषण
- सोशल नेटवर्क विश्लेषण/वेब-माइनिंग
मल्टीवे प्रोसेसिंग
मल्टीवे प्रोसेसिंग विशेष मल्टीवे एप्लिकेशन की विशिष्ट आवश्यकता को संबोधित करके मल्टीवे डेटा को वांछनीय स्तर पर परिवर्तित करने के लिए डिज़ाइन और निर्धारित मल्टीवे मॉडल का निष्पादन है। पोटेंशियोमेट्रिक इलेक्ट्रॉनिक जीभ से उत्पन्न डेटा का एक विशिष्ट उदाहरण प्रासंगिक मल्टीवे प्रोसेसिंग को दर्शाता है।[9]
यह भी देखें
संदर्भ
- ↑ Coppi, R.; Bolasco, S., eds. (1989). Multiway Data Analysis. Amsterdam: North-Holland. ISBN 9780444874108.
- ↑ 2.0 2.1 Kroonenberg, Pieter M. (2008). Applied Multiway Data Analysis. Wiley Series in Probability and Statistics. Vol. 702. John Wiley & Sons. p. xv. ISBN 9780470237991.
- ↑ Bro, Rasmus (20 November 1998). Multi-way Analysis in the Food Industry: Models, Algorithms, and Applications (PDF) (Ph.D. thesis). University of Amsterdam.
- ↑ Acar, Evrim; Yener, Bulent. Unsupervised Multiway Data Analysis: A Literature Survey (PDF) (Thesis). Rensselaer Polytechnic Institute.
- ↑ 5.0 5.1 Vasilescu, M.A.O.; Terzopoulos, D. (2002). "Multilinear Analysis of Image Ensembles: TensorFaces" (PDF). Lecture Notes in Computer Science 2350; (Presented at Proc. 7th European Conference on Computer Vision (ECCV'02), Copenhagen, Denmark). Springer, Berlin, Heidelberg. doi:10.1007/3-540-47969-4_30. ISBN 978-3-540-43745-1.
{{cite journal}}
: Cite journal requires|journal=
(help) - ↑ 6.0 6.1 M.A.O. Vasilescu, D. Terzopoulos (2005) "Multilinear Independent Component Analysis", "Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR’05), San Diego, CA, June 2005, vol.1, 547–553."
- ↑ 7.0 7.1 M.A.O. Vasilescu (2002) "Human Motion Signatures: Analysis, Synthesis, Recognition," Proceedings of International Conference on Pattern Recognition (ICPR 2002), Vol. 3, Quebec City, Canada, Aug, 2002, 456–460.
- ↑ Vasilescu, M.A.O.; Kim, Eric; Zeng, Xiao (2021). "CausalX: Causal eXplanations and Block Multilinear Factor Analysis", (PDF). In the Proceedings of the 2020 25th International Conference on Pattern Recognition (ICPR 2020). Milan, Italy. pp. 10736–10743.
- ↑ Cartas, Raul; Mimendia, Aitor; Legin, Andrey; del Valle, Manel (2011). "Multiway Processing of Data Generated with a Potentiometric Electronic Tongue in a SIA System". Electroanalysis. 23 (4): 953–961. doi:10.1002/elan.201000642.