बहुभिन्नरूपी आँकड़े

From Vigyanwiki

बहुभिन्नरूपी आँकड़े आँकड़ों का एक उपखंड है जिसमें एक से अधिक परिणाम वेरिएट के एक साथ अवलोकन और विश्लेषण सम्मिलितहैं।

बहुभिन्नरूपी आँकड़े बहुभिन्नरूपी विश्लेषण के विभिन्न रूपों में से प्रत्येक के विभिन्न उद्देश्यों और पृष्ठभूमि को समझने से संबंधित हैं, और वे एक दूसरे से कैसे संबंधित हैं। किसी विशेष समस्या के लिए बहुभिन्नरूपी आँकड़ों के व्यावहारिक अनुप्रयोग में वेरिएट के बीच संबंधों और अध्ययन की जा रही समस्या के लिए उनकी संबद्ध को समझने के लिए कई प्रकार के अविभाज्य और बहुभिन्नरूपी विश्लेषण सम्मिलितहो सकते हैं।

इसके अतिरिक्त, बहुभिन्नरूपी आँकड़े दोनों के संदर्भ में बहुभिन्नरूपी प्रायिकता वितरण से संबंधित हैं

  • देखे गए डेटा के वितरण का प्रतिनिधित्व करने के लिए इनका उपयोग कैसे किया जा सकता है;
  • सांख्यिकीय अनुमान के हिस्से के रूप में उनका उपयोग कैसे किया जा सकता है, विशेष रूप से जहां एक ही विश्लेषण के लिए कई अलग-अलग मात्राएं रुचिकर हों।।

बहुभिन्नरूपी डेटा से जुड़ी कुछ प्रकार की समस्याएं, उदाहरण के लिए सरल रेखीय प्रतिगमन और एकाधिक प्रतिगमन, सामान्यतः बहुभिन्नरूपी आँकड़ों के विशेष स्थिति नहीं माने जाती हैं क्योंकि विश्लेषण अन्य वेरिएटों को दिए गए एकल परिणाम वेरिएट के (अविभाजित) सशर्त वितरण पर विचार करके किया जाता है।

बहुभिन्नरूपी विश्लेषण

बहुभिन्नरूपी विश्लेषण (एमवीए) बहुभिन्नरूपी सांख्यिकी के सिद्धांतों पर आधारित है। सामान्यतः, एमवीए का उपयोग उन स्थितियों को संबोधित करने के लिए किया जाता है जहां प्रत्येक प्रायोगिक इकाई पर कई माप किए जाते हैं और इन मापों और उनकी संरचनाओं के बीच महत्वपूर्ण संबंध होते हैं।[1] एमवीए के एक आधुनिक, अतिव्यापी वर्गीकरण में सम्मिलित हैं:[1]

  • सामान्य और सामान्य बहुभिन्नरूपी मॉडल और वितरण सिद्धांत
  • संबंधों का अध्ययन और माप
  • बहुआयामी क्षेत्रों की संभाव्यता संगणना
  • डेटा संरचनाओं और पैटर्न की खोज

एक पदानुक्रमित पद्धति-का-पद्धति के लिए वेरिएट के प्रभावों की गणना करने के लिए भौतिकी-आधारित विश्लेषण को सम्मिलित करने की इच्छा से बहुभिन्नरूपी विश्लेषण जटिल हो सकता है। बहुभिन्नरूपी विश्लेषण का उपयोग करने की इच्छा रखने वाले अध्ययन अधिकांश समस्या की विमा के कारण रुक जाते हैं। सरोगेट मॉडल, भौतिकी-आधारित कोड के अत्यधिक यथार्थ अनुमानों के उपयोग के माध्यम से इन चिंताओं को अधिकांश कम किया जाता है। चूंकि सरोगेट मॉडल एक समीकरण का रूप लेते हैं, इसलिए उनका मूल्यांकन बहुत जल्दी किया जा सकता है। यह बड़े पैमाने पर एमवीए अध्ययनों के लिए एक संबल बन जाता है: जबकि डिज़ाइन स्पेस में एक मोंटे कार्लो सिमुलेशन भौतिकी-आधारित कोड के साथ जटिल है, सरोगेट मॉडल का मूल्यांकन करते समय यह तुच्छ हो जाता है, जो अधिकांश प्रतिक्रिया-सतह समीकरणों का रूप ले लेता है।

विश्लेषण के प्रकार

कई अलग-अलग मॉडल हैं, जिनमें से प्रत्येक का अपना विश्लेषण प्रकार है:

  1. विवेरिएटण का बहुभिन्नरूपी विश्लेषण (मनोवा) उन स्थितियों को आच्छादन करने के लिए विवेरिएटण के विश्लेषण का विस्तार करता है जहां एक से अधिक आश्रित वेरिएट एक साथ विश्लेषण किए जाते हैं; सहप्रसरण (मैनकोवा) का बहुभिन्नरूपी विश्लेषण भी देखें।
  2. बहुभिन्नरूपी प्रतिगमन एक सूत्र को निर्धारित करने का प्रयास करता है जो वर्णन कर सकता है कि कैसे वेरिएट के सदिश में तत्व दूसरों में परिवर्तनों के साथ-साथ प्रतिक्रिया करते हैं। रैखिक संबंधों के लिए, यहाँ प्रतिगमन विश्लेषण सामान्य रैखिक मॉडल के रूपों पर आधारित हैं। कुछ प्रस्ताव देते हैं कि बहुभिन्नरूपी प्रतिगमन बहुभिन्नरूपी प्रतिगमन से अलग है, चूंकि, यह वाद विवाद का विषय है और वैज्ञानिक क्षेत्रों में लगातार सत्य नहीं है।[2]
  3. प्रधान घटक विश्लेषण (पीसीए) लांबिक विश्लेषण वेरिएट का एक नया समुच्चय बनाता है जिसमें मूल समुच्चय के समान जानकारी होती है। यह लांबिक विश्लेषण अक्षों का एक नया समुच्चय देने के लिए भिन्नता के अक्षों को घूर्णन कराता है, ताकि वे भिन्नता के घटते अनुपात को संक्षेप में प्रस्तुत कर सके।
  4. कारक विश्लेषण पीसीए के समान है, लेकिन उपयोगकर्ता को मूल समुच्चय से कम संख्या में अवास्तविक वेरिएट निकालने की अनुमति देता है, शेष अस्पष्टीकृत भिन्नता को त्रुटि के रूप में छोड़ देता है। निकाले गए वेरिएट अव्यक्त वेरिएट या कारकों के रूप में जाने जाते हैं; देखे गए वेरिएटों के समूह में प्रत्येक को सहसंयोजन के लिए जिम्मेदार माना जा सकता है।
  5. कैनोनिकल सहसंबंध विश्लेषण वेरिएट के दो सेटों के बीच रैखिक संबंध पाता है; यह द्विभाजित सहसंबंध का सामान्यीकृत (अर्थात् कैनोनिकल) संस्करण है।[3]
  6. अतिरेक विश्लेषण (आरडीए) कैनोनिकल सहसंबंध विश्लेषण के समान है, लेकिन उपयोगकर्ता को (स्वतंत्र) वेरिएट के एक समुच्चय से निर्दिष्ट संख्या में अवास्तविक वेरिएट प्राप्त करने की अनुमति देता है जो दूसरे (स्वतंत्र) समुच्चय में जितना संभव हो उतना विवेरिएटण की व्याख्या करता है। यह प्रतिगमन विश्लेषण का एक बहुभिन्नरूपी अनुरूप है।
  7. पत्राचार विश्लेषण (सीए), या पारस्परिक औसत, मूल समुच्चय को संक्षिप्त करने वाले अवास्तविक वेरिएट का एक समुच्चय (पीसीए की तरह) पाता है। अंतर्निहित मॉडल रिकॉर्ड (स्थितियों) के बीच सीएचआई-वर्ग असमानताओं को दर्शाता है।
  8. वेरिएट के दो सेटों (जैसे अतिरेक विश्लेषण) में संयुक्त भिन्नता को संक्षिप्त करने के लिए कैननिकल (या "विवश") पत्राचार विश्लेषण (सीसीए); पत्राचार विश्लेषण और बहुभिन्नरूपी प्रतिगमन विश्लेषण का संयोजन। अंतर्निहित मॉडल रिकॉर्ड (स्थितियों) के बीच सीएचआई-वर्ग असमानताओं को मानता है।
  9. बहुआयामी स्केलिंग में अवास्तविक वेरिएट का एक समुच्चय निर्धारित करने के लिए विभिन्न कलन विधि सम्मिलित हैं जो रिकॉर्ड के बीच जोड़ीदार दूरी का सबसे अच्छा प्रतिनिधित्व करते हैं। मूल विधि प्रधान निर्देशांक विश्लेषण (PCoA; PCA पर आधारित) है।
  10. विभेदक विश्लेषण, या कैनोनिकल वेरिएट एनालिसिस, यह स्थापित करने का प्रयास करता है कि क्या वेरिएट के एक समुच्चय का उपयोग स्थितियों के दो या अधिक समूहों के बीच अंतर करने के लिए किया जा सकता है।
  11. रेखीय विभेदक विश्लेषण (LDA) नई टिप्पणियों के वर्गीकरण की अनुमति देने के लिए सामान्य रूप से वितरित डेटा के दो समुच्चयों से एक रेखीय भविष्यवक्ता की गणना करता है।
  12. क्लस्टर विश्लेषण वस्तुओं को समूहों (क्लस्टर कहा जाता है) में निर्धारित करता है ताकि एक ही क्लस्टर से वस्तु (स्थितियों) अलग-अलग क्लस्टर की वस्तुओं की तुलना में एक दूसरे के समान हों।
  13. पुनरावर्ती विभाजन एक निर्णय रेखा चित्र बनाता है जो एक द्विबीजपत्री आश्रित वेरिएट के आधार पर जनसंख्या के सदस्यों को सही संरचना से वर्गीकृत करने का प्रयास करता है।
  14. कृत्रिम तंत्रिका नेटवर्क गैर-रैखिक बहुभिन्नरूपी मॉडल के प्रतिगमन और क्लस्टरिंग विधियों का विस्तार करते हैं।
  15. बहुभिन्नरूपी डेटा का पता लगाने के लिए सांख्यिकीय ग्राफिक्स जैसे पर्यटन, समानांतर निर्देशांक, स्कैटरप्लॉट मैट्रिसेस का उपयोग किया जा सकता है।
  16. एक साथ अनुमानित विभिन्न निर्भर चर के साथ समीकरण मॉडल एक से अधिक प्रतिगमन समीकरण सम्मिलित हैं।।
  17. वेक्टर ऑटोरिग्रेशन में विभिन्न समय श्रृंखला वेरिएट के एक साथ प्रतिगमन और एक दूसरे के पिछड़े मानों पर एक साथ प्रतिगमन सम्मिलित है।
  18. प्रधान प्रतिक्रिया वक्रो विश्लेषण (पीआरसी) आरडीए पर आधारित एक विधि है जो उपयोगकर्ता को समय के साथ नियंत्रण अनुकूलन में बदलाव के लिए सुधार करके समय के साथ उपचार के प्रभावों पर ध्यान केंद्रित करने की अनुमति देता है।[4]
  19. सहसंबंधों की प्रतीकात्मकता में सहसंबंध मैट्रिक्स को एक आरेख द्वारा प्रतिस्थापित करना सम्मिलित है जहां "उल्लेखनीय" सहसंबंधों को एक ठोस रेखा (सकारात्मक सहसंबंध), या एक बिंदीदार रेखा (नकारात्मक सहसंबंध) द्वारा दर्शाया जाता है।

महत्वपूर्ण प्रायिकता वितरण

बहुभिन्नरूपी विश्लेषणों में उपयोग किए जाने वाले प्रायिकता वितरणों का एक समुच्चय होता है जो वितरणों के संगत समुच्चय के समान भूमिका निभाते हैं जो सामान्य वितरण डेटासमुच्चय के लिए उपयुक्त होने पर अविभाज्य विश्लेषण में उपयोग किए जाते हैं। ये बहुभिन्नरूपी वितरण हैं:

* बहुभिन्नरूपी सामान्य वितरण
* विशार्ट वितरण

बायेसियन अनुमान में व्युत्क्रम-विशार्ट वितरण महत्वपूर्ण है, उदाहरण के लिए बायेसियन बहुभिन्नरूपी रैखिक प्रतिगमन में महत्वपूर्ण है। इसके अतिरिक्त, हॉटेलिंग का टी-वर्ग वितरण एक बहुभिन्नरूपी वितरण है, जो स्टूडेंट के टी-वितरण का सामान्यीकरण करता है, जिसका उपयोग बहुभिन्नरूपी सांख्यिकीय परिकल्पना परीक्षण में किया जाता है।

इतिहास

एंडरसन की 1958 की पाठ्यपुस्तक, बहुभिन्नरूपी सांख्यिकीय विश्लेषण का एक परिचय,[5] ने सिद्धांतकारों और अनुप्रयुक्त सांख्यिकीविदों की एक पीढ़ी को शिक्षित किया; एंडरसन की पुस्तक संभावना अनुपात परीक्षण और सांख्यिकीय शक्ति कार्यों के गुणों के माध्यम से परिकल्पना परीक्षण, स्वीकार्यता, निष्पक्षता और एकरसता का पूर्वाग्रह पर जोर देती है।[6][7]

एमवीए एक बार केवल आकार, अंतर्निहित डेटा समुच्चय की जटिलता और उच्च संगणनात्मक उपभोग के कारण सांख्यिकीय सिद्धांत क्षेत्र में खड़ा था। संगणनात्मक शक्ति के नाटकीय विकास के साथ, एमवीए अब डेटा विश्लेषण में तेजी से महत्वपूर्ण भूमिका निभाता है और ओमिक्स क्षेत्रों में इसका व्यापक अनुप्रयोग है।

अनुप्रयोग

सॉफ्टवेयर और उपकरण

बहुभिन्नरूपी विश्लेषण के लिए बड़ी संख्या में सॉफ्टवेयर पैकेज और अन्य उपकरण हैं, जिनमें सम्मिलित हैं:

यह भी देखें

संदर्भ

  1. 1.0 1.1 Olkin, I.; Sampson, A. R. (2001-01-01), "Multivariate Analysis: Overview", in Smelser, Neil J.; Baltes, Paul B. (eds.), International Encyclopedia of the Social & Behavioral Sciences, Pergamon, pp. 10240–10247, ISBN 9780080430768, retrieved 2019-09-02
  2. Hidalgo, B; Goodman, M (2013). "बहुभिन्नरूपी या बहुभिन्नरूपी प्रतिगमन?". Am J Public Health. 103: 39–40. doi:10.2105/AJPH.2012.300897. PMC 3518362. PMID 23153131.
  3. Unsophisticated analysts of bivariate Gaussian problems may find useful a crude but accurate method of accurately gauging probability by simply taking the sum S of the N residuals' squares, subtracting the sum Sm at minimum, dividing this difference by Sm, multiplying the result by (N - 2) and taking the inverse anti-ln of half that product.
  4. ter Braak, Cajo J.F. & Šmilauer, Petr (2012). Canoco reference manual and user's guide: software for ordination (version 5.0), p292. Microcomputer Power, Ithaca, NY.
  5. T.W. Anderson (1958) An Introduction to Multivariate Analysis, New York: Wiley ISBN 0471026409; 2e (1984) ISBN 0471889873; 3e (2003) ISBN 0471360910
  6. Sen, Pranab Kumar; Anderson, T. W.; Arnold, S. F.; Eaton, M. L.; Giri, N. C.; Gnanadesikan, R.; Kendall, M. G.; Kshirsagar, A. M.; et al. (June 1986). "समीक्षा: बहुभिन्नरूपी सांख्यिकीय विश्लेषण पर समकालीन पाठ्यपुस्तकें: एक मनोरम मूल्यांकन और समालोचना". Journal of the American Statistical Association. 81 (394): 560–564. doi:10.2307/2289251. ISSN 0162-1459. JSTOR 2289251.(Pages 560–561)
  7. Schervish, Mark J. (November 1987). "बहुभिन्नरूपी विश्लेषण की समीक्षा". Statistical Science. 2 (4): 396–413. doi:10.1214/ss/1177013111. ISSN 0883-4237. JSTOR 2245530.
  8. CRAN has details on the packages available for multivariate data analysis


अग्रिम पठन

  • Johnson, Richard A.; Wichern, Dean W. (2007). Applied Multivariate Statistical Analysis (Sixth ed.). Prentice Hall. ISBN 978-0-13-187715-3.
  • KV Mardia; JT Kent; JM Bibby (1979). Multivariate Analysis. Academic Press. ISBN 0-12-471252-5.
  • A. Sen, M. Srivastava, Regression Analysis — Theory, Methods, and Applications, Springer-Verlag, Berlin, 2011 (4th printing).
  • Cook, Swayne (2007). Interactive Graphics for Data Analysis.
  • Malakooti, B. (2013). Operations and Production Systems with Multiple Objectives. John Wiley & Sons.
  • T. W. Anderson, An Introduction to Multivariate Statistical Analysis, Wiley, New York, 1958.
  • KV Mardia; JT Kent & JM Bibby (1979). Multivariate Analysis. Academic Press. ISBN 978-0124712522. (M.A. level "likelihood" approach)
  • Feinstein, A. R. (1996) Multivariable Analysis. New Haven, CT: Yale University Press.
  • Hair, J. F. Jr. (1995) Multivariate Data Analysis with Readings, 4th ed. Prentice-Hall.
  • Johnson, Richard A.; Wichern, Dean W. (2007). Applied Multivariate Statistical Analysis (Sixth ed.). Prentice Hall. ISBN 978-0-13-187715-3.
  • Schafer, J. L. (1997) Analysis of Incomplete Multivariate Data. CRC Press. (Advanced)
  • Sharma, S. (1996) Applied Multivariate Techniques. Wiley. (Informal, applied)
  • Izenman, Alan J. (2008). Modern Multivariate Statistical Techniques: Regression, Classification, and Manifold Learning. Springer Texts in Statistics. New York: Springer-Verlag. ISBN 9780387781884.
  • "Handbook of Applied Multivariate Statistics and Mathematical Modeling | ScienceDirect". Retrieved 2019-09-03.









बाहरी संबंध