मल्टीवे डेटा विश्लेषण: Difference between revisions
(Created page with "{{short description|Method of analyzing large data sets}} मल्टीवे डेटा विश्लेषण मल्टीवे सरणी के रूप...") |
No edit summary |
||
Line 1: | Line 1: | ||
{{short description|Method of analyzing large data sets}} | {{short description|Method of analyzing large data sets}} | ||
मल्टीवे डेटा विश्लेषण [[मल्टीवे सरणी]] के रूप में अवलोकनों के संग्रह का प्रतिनिधित्व करके बड़े डेटा सेट का विश्लेषण करने की एक विधि है, <math> {\mathcal A}\in{\mathbb C}^{I_0\times I_1\times \dots I_c\times \dots I_C}</math>. (सी+1)-वे सरणी में डेटा संगठन का उचित विकल्प | मल्टीवे डेटा विश्लेषण [[मल्टीवे सरणी]] के रूप में अवलोकनों के संग्रह का प्रतिनिधित्व करके बड़े डेटा सेट का विश्लेषण करने की एक विधि है, <math> {\mathcal A}\in{\mathbb C}^{I_0\times I_1\times \dots I_c\times \dots I_C}</math>. (सी+1)-वे सरणी में डेटा संगठन का उचित विकल्प और विश्लेषण तकनीकें अन्य विधियो से न पहचाने गए अंतर्निहित डेटा में पैटर्न प्रकट कर सकती हैं।<ref name=Coppi1989> | ||
{{cite book | {{cite book | ||
|editor1-last=Coppi|editor1-first=R. | |editor1-last=Coppi|editor1-first=R. | ||
Line 10: | Line 10: | ||
|isbn=9780444874108 | |isbn=9780444874108 | ||
}}</ref> | }}</ref> | ||
==इतिहास== | ==इतिहास== | ||
मल्टीवे डेटा विश्लेषण के अध्ययन को पहली बार 1988 में आयोजित एक सम्मेलन के परिणाम के रूप में औपचारिक रूप दिया गया था। इस सम्मेलन का परिणाम विशेष रूप से इस क्षेत्र को संबोधित पहला पाठ था | मल्टीवे डेटा विश्लेषण के अध्ययन को पहली बार 1988 में आयोजित एक सम्मेलन के परिणाम के रूप में औपचारिक रूप दिया गया था। इस सम्मेलन का परिणाम विशेष रूप से इस क्षेत्र को संबोधित पहला पाठ था कोप्पी और बोलास्को का मल्टीवे डेटा विश्लेषण।<ref name=Kroonenberg2008> | ||
{{cite book | {{cite book | ||
|page=xv | |page=xv | ||
Line 23: | Line 21: | ||
|year=2008 | |year=2008 | ||
|isbn=9780470237991 | |isbn=9780470237991 | ||
}}</ref> उस समय | }}</ref> उस समय मल्टीवे विश्लेषण के अनुप्रयोग क्षेत्रों में सांख्यिकी [[अर्थमिति]] और [[साइकोमेट्रिक्स]] सम्मिलित थे। हाल के वर्षों में [[ रसायन विज्ञान ]], [[कृषि]], [[सामाजिक नेटवर्क विश्लेषण]] और [[खाद्य उद्योग]] को सम्मिलित करने के लिए अनुप्रयोगों का विस्तार हुआ है।<ref name=Bro1998> | ||
{{cite thesis | {{cite thesis | ||
|url=http://curis.ku.dk/ws/files/13035961/rasmus_bro.pdf | |url=http://curis.ku.dk/ws/files/13035961/rasmus_bro.pdf | ||
Line 39: | Line 37: | ||
मल्टीवे डेटा विश्लेषक डेटा का विश्लेषण करने के लिए उपयोग की जाने वाली विधियों या मॉडलों के लिए मोड शब्द को आरक्षित करते समय डेटा भिन्नता के संख्या स्रोतों को संदर्भित करने के लिए वे शब्द का उपयोग करते हैं।<ref name=Kroonenberg2008/>{{rp|xviii}} | मल्टीवे डेटा विश्लेषक डेटा का विश्लेषण करने के लिए उपयोग की जाने वाली विधियों या मॉडलों के लिए मोड शब्द को आरक्षित करते समय डेटा भिन्नता के संख्या स्रोतों को संदर्भित करने के लिए वे शब्द का उपयोग करते हैं।<ref name=Kroonenberg2008/>{{rp|xviii}} | ||
इस अर्थ में | इस अर्थ में हम विश्लेषण करने के लिए डेटा के विभिन्न विधियो को परिभाषित कर सकते हैं: | ||
* एक तरफ़ा डेटा: एक डेटा बिंदु <math>I_0</math>-आयाम, <math>{\bf a}\in {\mathbb C}^{I_0}</math> एक [[वेक्टर (गणित और भौतिकी)]] या डेटा बिंदु है जो एक-तरफ़ा सरणी डेटा संरचना में संग्रहीत होता है। | * एक तरफ़ा डेटा: एक डेटा बिंदु <math>I_0</math>-आयाम, <math>{\bf a}\in {\mathbb C}^{I_0}</math> एक [[वेक्टर (गणित और भौतिकी)]] या डेटा बिंदु है जो एक-तरफ़ा सरणी डेटा संरचना में संग्रहीत होता है। | ||
* दो-तरफा डेटा: का एक संग्रह <math>I_1</math> डेटा अंक <math>{\bf a}\in {\mathbb C}^{I_0}</math> दो-तरफा सरणी में संग्रहीत है, <math>{\bf A}\in {\mathbb C}^{I_0\times I_1}</math>. अलग-अलग आयामों के | * दो-तरफा डेटा: का एक संग्रह <math>I_1</math> डेटा अंक <math>{\bf a}\in {\mathbb C}^{I_0}</math> दो-तरफा सरणी में संग्रहीत है, <math>{\bf A}\in {\mathbb C}^{I_0\times I_1}</math>. अलग-अलग आयामों के स्थितियों में ऐसे डेटा की कल्पना करने के लिए एक [[स्प्रेडशीट]] का उपयोग किया जा सकता है। | ||
* तीन-तरफा डेटा: डेटा का संग्रह <math>{\bf a}\in {\mathbb C}^{I_0}</math> जिसमें भिन्नता के दो | * तीन-तरफा डेटा: डेटा का संग्रह <math>{\bf a}\in {\mathbb C}^{I_0}</math> जिसमें भिन्नता के दो विधि हैं, उसे तीन-तरफ़ा सरणी में संग्रहीत किया जाता है, <math>{\bf A}\in {\mathbb C}^{I_0\times I_1\times I_2}</math>. ऐसा डेटा अलग-अलग स्थानों पर तापमान का प्रतिनिधित्व कर सकता है (दो-तरफा डेटा) अलग-अलग समय पर नमूना लिया गया (तीन-तरफ़ा डेटा के लिए अग्रणी) | ||
* समान स्प्रेडशीट सादृश्य का उपयोग करके चार-तरफा डेटा को अलग-अलग कार्यपुस्तिकाओं से भरे फ़ाइल फ़ोल्डर के रूप में दर्शाया जा सकता है। | * समान स्प्रेडशीट सादृश्य का उपयोग करके चार-तरफा डेटा को अलग-अलग कार्यपुस्तिकाओं से भरे फ़ाइल फ़ोल्डर के रूप में दर्शाया जा सकता है। | ||
* पांच-तरफ़ा डेटा और छह-तरफ़ा डेटा को डेटा एकत्रीकरण के समान उच्च स्तर द्वारा दर्शाया जा सकता है। | * पांच-तरफ़ा डेटा और छह-तरफ़ा डेटा को डेटा एकत्रीकरण के समान उच्च स्तर द्वारा दर्शाया जा सकता है। | ||
सामान्यतः एक मल्टीवे डेटा को एक मल्टीवे ऐरे में संग्रहीत किया जाता है और इसे अलग-अलग समय पर ,या अलग-अलग स्थानों पर, अलग-अलग विधियो का उपयोग करके मापा जा सकता है, और इसमें विसंगतियां हो सकती हैं जैसे कि लापता डेटा या डेटा प्रतिनिधित्व में विसंगतियां। | |||
===मल्टीवे मॉडल=== | ===मल्टीवे मॉडल=== | ||
===मल्टीवे एप्लिकेशन=== | ===मल्टीवे एप्लिकेशन=== | ||
मल्टीवे डेटा विश्लेषण को विभिन्न मल्टीवे अनुप्रयोगों में नियोजित किया जा सकता है | मल्टीवे डेटा विश्लेषण को विभिन्न मल्टीवे अनुप्रयोगों में नियोजित किया जा सकता है जिससे मल्टीवे डेटासेट में छिपी मल्टीलाइनर संरचना को खोजने की समस्या का समाधान किया जा सके। विभिन्न क्षेत्रों में अनुप्रयोगों के उदाहरण निम्नलिखित हैं:<ref> | ||
{{cite thesis | {{cite thesis | ||
|url=http://www.cs.rpi.edu/research/pdf/07-06.pdf | |url=http://www.cs.rpi.edu/research/pdf/07-06.pdf |
Revision as of 17:36, 12 July 2023
मल्टीवे डेटा विश्लेषण मल्टीवे सरणी के रूप में अवलोकनों के संग्रह का प्रतिनिधित्व करके बड़े डेटा सेट का विश्लेषण करने की एक विधि है, . (सी+1)-वे सरणी में डेटा संगठन का उचित विकल्प और विश्लेषण तकनीकें अन्य विधियो से न पहचाने गए अंतर्निहित डेटा में पैटर्न प्रकट कर सकती हैं।[1]
इतिहास
मल्टीवे डेटा विश्लेषण के अध्ययन को पहली बार 1988 में आयोजित एक सम्मेलन के परिणाम के रूप में औपचारिक रूप दिया गया था। इस सम्मेलन का परिणाम विशेष रूप से इस क्षेत्र को संबोधित पहला पाठ था कोप्पी और बोलास्को का मल्टीवे डेटा विश्लेषण।[2] उस समय मल्टीवे विश्लेषण के अनुप्रयोग क्षेत्रों में सांख्यिकी अर्थमिति और साइकोमेट्रिक्स सम्मिलित थे। हाल के वर्षों में रसायन विज्ञान , कृषि, सामाजिक नेटवर्क विश्लेषण और खाद्य उद्योग को सम्मिलित करने के लिए अनुप्रयोगों का विस्तार हुआ है।[3]
मल्टीवे डेटा विश्लेषण की संरचना
मल्टीवे डेटा
मल्टीवे डेटा विश्लेषक डेटा का विश्लेषण करने के लिए उपयोग की जाने वाली विधियों या मॉडलों के लिए मोड शब्द को आरक्षित करते समय डेटा भिन्नता के संख्या स्रोतों को संदर्भित करने के लिए वे शब्द का उपयोग करते हैं।[2]: xviii
इस अर्थ में हम विश्लेषण करने के लिए डेटा के विभिन्न विधियो को परिभाषित कर सकते हैं:
- एक तरफ़ा डेटा: एक डेटा बिंदु -आयाम, एक वेक्टर (गणित और भौतिकी) या डेटा बिंदु है जो एक-तरफ़ा सरणी डेटा संरचना में संग्रहीत होता है।
- दो-तरफा डेटा: का एक संग्रह डेटा अंक दो-तरफा सरणी में संग्रहीत है, . अलग-अलग आयामों के स्थितियों में ऐसे डेटा की कल्पना करने के लिए एक स्प्रेडशीट का उपयोग किया जा सकता है।
- तीन-तरफा डेटा: डेटा का संग्रह जिसमें भिन्नता के दो विधि हैं, उसे तीन-तरफ़ा सरणी में संग्रहीत किया जाता है, . ऐसा डेटा अलग-अलग स्थानों पर तापमान का प्रतिनिधित्व कर सकता है (दो-तरफा डेटा) अलग-अलग समय पर नमूना लिया गया (तीन-तरफ़ा डेटा के लिए अग्रणी)
- समान स्प्रेडशीट सादृश्य का उपयोग करके चार-तरफा डेटा को अलग-अलग कार्यपुस्तिकाओं से भरे फ़ाइल फ़ोल्डर के रूप में दर्शाया जा सकता है।
- पांच-तरफ़ा डेटा और छह-तरफ़ा डेटा को डेटा एकत्रीकरण के समान उच्च स्तर द्वारा दर्शाया जा सकता है।
सामान्यतः एक मल्टीवे डेटा को एक मल्टीवे ऐरे में संग्रहीत किया जाता है और इसे अलग-अलग समय पर ,या अलग-अलग स्थानों पर, अलग-अलग विधियो का उपयोग करके मापा जा सकता है, और इसमें विसंगतियां हो सकती हैं जैसे कि लापता डेटा या डेटा प्रतिनिधित्व में विसंगतियां।
मल्टीवे मॉडल
मल्टीवे एप्लिकेशन
मल्टीवे डेटा विश्लेषण को विभिन्न मल्टीवे अनुप्रयोगों में नियोजित किया जा सकता है जिससे मल्टीवे डेटासेट में छिपी मल्टीलाइनर संरचना को खोजने की समस्या का समाधान किया जा सके। विभिन्न क्षेत्रों में अनुप्रयोगों के उदाहरण निम्नलिखित हैं:[4]
- कंप्यूटर दृष्टि - टेन्सरफ़ेस[5][6] और मानव गति हस्ताक्षर[7] चेहरे की छवियों का विश्लेषण करता है और मानव संयुक्त कोण डेटा को मल्टीवे सरणी में व्यवस्थित करता है। मल्टीवे डेटा विश्लेषण का उपयोग कारण कारक अभ्यावेदन के एक सेट की गणना करने के लिए किया जाता है।[8]
- इलेक्ट्रोएनालिटिकल रसायन शास्त्र विज्ञान
- तंत्रिका विज्ञान
- प्रक्रिया विश्लेषण
- सोशल नेटवर्क विश्लेषण/वेब-माइनिंग
मल्टीवे प्रोसेसिंग
मल्टीवे प्रोसेसिंग विशेष मल्टीवे एप्लिकेशन की विशिष्ट आवश्यकता को संबोधित करके मल्टीवे डेटा को वांछनीय स्तर पर परिवर्तित करने के लिए डिज़ाइन और निर्धारित मल्टीवे मॉडल का निष्पादन है। पोटेंशियोमेट्रिक इलेक्ट्रॉनिक जीभ से उत्पन्न डेटा का एक विशिष्ट उदाहरण प्रासंगिक मल्टीवे प्रोसेसिंग को दर्शाता है।[9]
यह भी देखें
संदर्भ
- ↑ Coppi, R.; Bolasco, S., eds. (1989). Multiway Data Analysis. Amsterdam: North-Holland. ISBN 9780444874108.
- ↑ 2.0 2.1 Kroonenberg, Pieter M. (2008). Applied Multiway Data Analysis. Wiley Series in Probability and Statistics. Vol. 702. John Wiley & Sons. p. xv. ISBN 9780470237991.
- ↑ Bro, Rasmus (20 November 1998). Multi-way Analysis in the Food Industry: Models, Algorithms, and Applications (PDF) (Ph.D. thesis). University of Amsterdam.
- ↑ Acar, Evrim; Yener, Bulent. Unsupervised Multiway Data Analysis: A Literature Survey (PDF) (Thesis). Rensselaer Polytechnic Institute.
- ↑ Vasilescu, M.A.O.; Terzopoulos, D. (2002). "Multilinear Analysis of Image Ensembles: TensorFaces" (PDF). Lecture Notes in Computer Science 2350; (Presented at Proc. 7th European Conference on Computer Vision (ECCV'02), Copenhagen, Denmark). Springer, Berlin, Heidelberg. doi:10.1007/3-540-47969-4_30. ISBN 978-3-540-43745-1.
{{cite journal}}
: Cite journal requires|journal=
(help) - ↑ M.A.O. Vasilescu, D. Terzopoulos (2005) "Multilinear Independent Component Analysis", "Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR’05), San Diego, CA, June 2005, vol.1, 547–553."
- ↑ M.A.O. Vasilescu (2002) "Human Motion Signatures: Analysis, Synthesis, Recognition," Proceedings of International Conference on Pattern Recognition (ICPR 2002), Vol. 3, Quebec City, Canada, Aug, 2002, 456–460.
- ↑ Vasilescu, M.A.O.; Kim, Eric; Zeng, Xiao (2021). "CausalX: Causal eXplanations and Block Multilinear Factor Analysis", (PDF). In the Proceedings of the 2020 25th International Conference on Pattern Recognition (ICPR 2020). Milan, Italy. pp. 10736–10743.
- ↑ Cartas, Raul; Mimendia, Aitor; Legin, Andrey; del Valle, Manel (2011). "Multiway Processing of Data Generated with a Potentiometric Electronic Tongue in a SIA System". Electroanalysis. 23 (4): 953–961. doi:10.1002/elan.201000642.