बहुभिन्नरूपी आँकड़े: Difference between revisions
(Created page with "{{Short description|Simultaneous observation and analysis of more than one outcome variable}} {{redirect|Multivariate analysis|the usage in mathematics|Multivariable calculus}...") |
No edit summary |
||
(11 intermediate revisions by 4 users not shown) | |||
Line 1: | Line 1: | ||
{{Short description|Simultaneous observation and analysis of more than one outcome variable}} | {{Short description|Simultaneous observation and analysis of more than one outcome variable}} | ||
{{redirect| | {{redirect|बहुभिन्नरूपी कलन|गणित में उपयोग|बहुभिन्नरूपी गणना }} | ||
बहुभिन्नरूपी आँकड़े आँकड़ों का एक उपखंड है जिसमें एक से अधिक परिणाम | बहुभिन्नरूपी आँकड़े आँकड़ों का एक उपखंड है जिसमें एक से अधिक परिणाम वेरिएट के एक साथ अवलोकन और विश्लेषण सम्मिलितहैं। | ||
इसके | बहुभिन्नरूपी आँकड़े बहुभिन्नरूपी विश्लेषण के विभिन्न रूपों में से प्रत्येक के विभिन्न उद्देश्यों और पृष्ठभूमि को समझने से संबंधित हैं, और वे एक दूसरे से कैसे संबंधित हैं। किसी विशेष समस्या के लिए बहुभिन्नरूपी आँकड़ों के व्यावहारिक अनुप्रयोग में वेरिएट के बीच संबंधों और अध्ययन की जा रही समस्या के लिए उनकी संबद्ध को समझने के लिए कई प्रकार के अविभाज्य और बहुभिन्नरूपी विश्लेषण सम्मिलितहो सकते हैं। | ||
इसके अतिरिक्त, बहुभिन्नरूपी आँकड़े दोनों के संदर्भ में बहुभिन्नरूपी प्रायिकता वितरण से संबंधित हैं | |||
:*देखे गए डेटा के वितरण का प्रतिनिधित्व करने के लिए इनका उपयोग कैसे किया जा सकता है; | :*देखे गए डेटा के वितरण का प्रतिनिधित्व करने के लिए इनका उपयोग कैसे किया जा सकता है; | ||
: * | :*सांख्यिकीय अनुमान के हिस्से के रूप में उनका उपयोग कैसे किया जा सकता है, विशेष रूप से जहां एक ही विश्लेषण के लिए कई अलग-अलग मात्राएं रुचिकर हों।। | ||
बहुभिन्नरूपी डेटा से जुड़ी कुछ प्रकार की समस्याएं, उदाहरण के लिए [[सरल रेखीय प्रतिगमन]] और [[एकाधिक प्रतिगमन]], | बहुभिन्नरूपी डेटा से जुड़ी कुछ प्रकार की समस्याएं, उदाहरण के लिए [[सरल रेखीय प्रतिगमन]] और [[एकाधिक प्रतिगमन]], सामान्यतः बहुभिन्नरूपी आँकड़ों के विशेष स्थिति नहीं माने जाती हैं क्योंकि विश्लेषण अन्य वेरिएटों को दिए गए एकल परिणाम वेरिएट के (अविभाजित) सशर्त वितरण पर विचार करके किया जाता है। | ||
== बहुभिन्नरूपी विश्लेषण == | == बहुभिन्नरूपी विश्लेषण == | ||
बहुभिन्नरूपी विश्लेषण (एमवीए) बहुभिन्नरूपी सांख्यिकी के सिद्धांतों पर आधारित है। | बहुभिन्नरूपी विश्लेषण (एमवीए) बहुभिन्नरूपी सांख्यिकी के सिद्धांतों पर आधारित है। सामान्यतः, एमवीए का उपयोग उन स्थितियों को संबोधित करने के लिए किया जाता है जहां प्रत्येक प्रायोगिक इकाई पर कई माप किए जाते हैं और इन मापों और उनकी संरचनाओं के बीच महत्वपूर्ण संबंध होते हैं।<ref name=":0">{{Citation|last1=Olkin|first1=I.|title=Multivariate Analysis: Overview|date=2001-01-01|url=http://www.sciencedirect.com/science/article/pii/B0080430767004721|encyclopedia=International Encyclopedia of the Social & Behavioral Sciences|pages=10240–10247|editor-last=Smelser|editor-first=Neil J.|publisher=Pergamon|isbn=9780080430768|access-date=2019-09-02|last2=Sampson|first2=A. R.|editor2-last=Baltes|editor2-first=Paul B.}}</ref> एमवीए के एक आधुनिक, अतिव्यापी वर्गीकरण में सम्मिलित हैं:<ref name=":0" /> | ||
* सामान्य और सामान्य बहुभिन्नरूपी मॉडल और वितरण सिद्धांत | * सामान्य और सामान्य बहुभिन्नरूपी मॉडल और वितरण सिद्धांत | ||
* संबंधों का अध्ययन और माप | * संबंधों का अध्ययन और माप | ||
Line 17: | Line 18: | ||
* डेटा संरचनाओं और पैटर्न की खोज | * डेटा संरचनाओं और पैटर्न की खोज | ||
एक पदानुक्रमित | एक पदानुक्रमित पद्धति-का-पद्धति के लिए वेरिएट के प्रभावों की गणना करने के लिए भौतिकी-आधारित विश्लेषण को सम्मिलित करने की इच्छा से बहुभिन्नरूपी विश्लेषण जटिल हो सकता है। बहुभिन्नरूपी विश्लेषण का उपयोग करने की इच्छा रखने वाले अध्ययन अधिकांश समस्या की विमा के कारण रुक जाते हैं। [[सरोगेट मॉडल]], भौतिकी-आधारित कोड के अत्यधिक यथार्थ अनुमानों के उपयोग के माध्यम से इन चिंताओं को अधिकांश कम किया जाता है। चूंकि सरोगेट मॉडल एक समीकरण का रूप लेते हैं, इसलिए उनका मूल्यांकन बहुत जल्दी किया जा सकता है। यह बड़े पैमाने पर एमवीए अध्ययनों के लिए एक संबल बन जाता है: जबकि डिज़ाइन स्पेस में एक [[मोंटे कार्लो सिमुलेशन]] भौतिकी-आधारित कोड के साथ जटिल है, सरोगेट मॉडल का मूल्यांकन करते समय यह तुच्छ हो जाता है, जो अधिकांश प्रतिक्रिया-सतह समीकरणों का रूप ले लेता है। | ||
=== विश्लेषण के प्रकार === | === विश्लेषण के प्रकार === | ||
कई अलग-अलग मॉडल हैं, जिनमें से प्रत्येक का अपना विश्लेषण प्रकार है: | कई अलग-अलग मॉडल हैं, जिनमें से प्रत्येक का अपना विश्लेषण प्रकार है: | ||
# [[विचरण का बहुभिन्नरूपी विश्लेषण]] ( | # [[विचरण का बहुभिन्नरूपी विश्लेषण|विवेरिएटण का बहुभिन्नरूपी विश्लेषण]] (मनोवा) उन स्थितियों को आच्छादन करने के लिए विवेरिएटण के विश्लेषण का विस्तार करता है जहां एक से अधिक आश्रित वेरिएट एक साथ विश्लेषण किए जाते हैं; सहप्रसरण (मैनकोवा) का बहुभिन्नरूपी विश्लेषण भी देखें। | ||
# | #बहुभिन्नरूपी प्रतिगमन एक सूत्र को निर्धारित करने का प्रयास करता है जो वर्णन कर सकता है कि कैसे वेरिएट के सदिश में तत्व दूसरों में परिवर्तनों के साथ-साथ प्रतिक्रिया करते हैं। रैखिक संबंधों के लिए, यहाँ प्रतिगमन विश्लेषण [[सामान्य रैखिक मॉडल]] के रूपों पर आधारित हैं। कुछ प्रस्ताव देते हैं कि बहुभिन्नरूपी प्रतिगमन बहुभिन्नरूपी प्रतिगमन से अलग है, चूंकि, यह वाद विवाद का विषय है और वैज्ञानिक क्षेत्रों में लगातार सत्य नहीं है।<ref>{{cite journal | pmc = 3518362 | pmid=23153131 | doi=10.2105/AJPH.2012.300897 | volume=103 | title=बहुभिन्नरूपी या बहुभिन्नरूपी प्रतिगमन?| year=2013 | journal=Am J Public Health | pages=39–40 | last1 = Hidalgo | first1 = B | last2 = Goodman | first2 = M}}</ref> | ||
# प्रधान घटक विश्लेषण (पीसीए) | # प्रधान घटक विश्लेषण (पीसीए) लांबिक विश्लेषण वेरिएट का एक नया समुच्चय बनाता है जिसमें मूल समुच्चय के समान जानकारी होती है। यह लांबिक विश्लेषण अक्षों का एक नया समुच्चय देने के लिए भिन्नता के अक्षों को घूर्णन कराता है, ताकि वे भिन्नता के घटते अनुपात को संक्षेप में प्रस्तुत कर सके। | ||
# [[कारक विश्लेषण]] पीसीए के समान है, लेकिन उपयोगकर्ता को मूल | # [[कारक विश्लेषण]] पीसीए के समान है, लेकिन उपयोगकर्ता को मूल समुच्चय से कम संख्या में अवास्तविक वेरिएट निकालने की अनुमति देता है, शेष अस्पष्टीकृत भिन्नता को त्रुटि के रूप में छोड़ देता है। निकाले गए वेरिएट अव्यक्त वेरिएट या कारकों के रूप में जाने जाते हैं; देखे गए वेरिएटों के समूह में प्रत्येक को सहसंयोजन के लिए जिम्मेदार माना जा सकता है। | ||
# कैनोनिकल सहसंबंध विश्लेषण | # कैनोनिकल सहसंबंध विश्लेषण वेरिएट के दो सेटों के बीच रैखिक संबंध पाता है; यह द्विभाजित सहसंबंध का सामान्यीकृत (अर्थात् कैनोनिकल) संस्करण है।<ref>Unsophisticated analysts of bivariate Gaussian problems may find useful a crude but accurate [http://www.dioi.org/sta.htm#sdsx method] of accurately gauging probability by simply taking the sum ''S'' of the ''N'' residuals' squares, subtracting the sum ''Sm'' at minimum, dividing this difference by ''Sm'', multiplying the result by (''N'' - 2) and taking the inverse anti-ln of half that product.</ref> | ||
# [[अतिरेक विश्लेषण]] (आरडीए) कैनोनिकल सहसंबंध विश्लेषण के समान है, लेकिन उपयोगकर्ता को (स्वतंत्र) | # [[अतिरेक विश्लेषण]] (आरडीए) कैनोनिकल सहसंबंध विश्लेषण के समान है, लेकिन उपयोगकर्ता को (स्वतंत्र) वेरिएट के एक समुच्चय से निर्दिष्ट संख्या में अवास्तविक वेरिएट प्राप्त करने की अनुमति देता है जो दूसरे (स्वतंत्र) समुच्चय में जितना संभव हो उतना विवेरिएटण की व्याख्या करता है। यह [[प्रतिगमन विश्लेषण]] का एक बहुभिन्नरूपी अनुरूप है। | ||
# [[पत्राचार विश्लेषण]] (सीए), या पारस्परिक औसत, मूल | # [[पत्राचार विश्लेषण]] (सीए), या पारस्परिक औसत, मूल समुच्चय को संक्षिप्त करने वाले अवास्तविक वेरिएट का एक समुच्चय (पीसीए की तरह) पाता है। अंतर्निहित मॉडल रिकॉर्ड (स्थितियों) के बीच सीएचआई-वर्ग असमानताओं को दर्शाता है। | ||
# | # वेरिएट के दो सेटों (जैसे अतिरेक विश्लेषण) में संयुक्त भिन्नता को संक्षिप्त करने के लिए कैननिकल (या "विवश") पत्राचार विश्लेषण (सीसीए); पत्राचार विश्लेषण और बहुभिन्नरूपी प्रतिगमन विश्लेषण का संयोजन। अंतर्निहित मॉडल रिकॉर्ड (स्थितियों) के बीच सीएचआई-वर्ग असमानताओं को मानता है। | ||
# [[बहुआयामी स्केलिंग]] में | # [[बहुआयामी स्केलिंग]] में अवास्तविक वेरिएट का एक समुच्चय निर्धारित करने के लिए विभिन्न कलन विधि सम्मिलित हैं जो रिकॉर्ड के बीच जोड़ीदार दूरी का सबसे अच्छा प्रतिनिधित्व करते हैं। मूल विधि प्रधान निर्देशांक विश्लेषण (PCoA; PCA पर आधारित) है। | ||
# [[विभेदक कार्य]], या कैनोनिकल वेरिएट एनालिसिस, यह स्थापित करने का प्रयास करता है कि क्या | # [[विभेदक कार्य|विभेदक विश्लेषण]], या कैनोनिकल वेरिएट एनालिसिस, यह स्थापित करने का प्रयास करता है कि क्या वेरिएट के एक समुच्चय का उपयोग स्थितियों के दो या अधिक समूहों के बीच अंतर करने के लिए किया जा सकता है। | ||
# रेखीय विभेदक विश्लेषण (LDA) नई टिप्पणियों के वर्गीकरण की अनुमति देने के लिए सामान्य रूप से वितरित डेटा के दो | # रेखीय विभेदक विश्लेषण (LDA) नई टिप्पणियों के वर्गीकरण की अनुमति देने के लिए सामान्य रूप से वितरित डेटा के दो समुच्चयों से एक रेखीय भविष्यवक्ता की गणना करता है। | ||
# [[क्लस्टर विश्लेषण]] वस्तुओं को समूहों (क्लस्टर कहा जाता है) में | # [[क्लस्टर विश्लेषण]] वस्तुओं को समूहों (क्लस्टर कहा जाता है) में निर्धारित करता है ताकि एक ही क्लस्टर से वस्तु (स्थितियों) अलग-अलग क्लस्टर की वस्तुओं की तुलना में एक दूसरे के समान हों। | ||
# [[पुनरावर्ती विभाजन]] एक निर्णय | # [[पुनरावर्ती विभाजन]] एक निर्णय रेखा चित्र बनाता है जो एक द्विबीजपत्री आश्रित वेरिएट के आधार पर जनसंख्या के सदस्यों को सही संरचना से वर्गीकृत करने का प्रयास करता है। | ||
# कृत्रिम तंत्रिका नेटवर्क गैर-रैखिक बहुभिन्नरूपी मॉडल के प्रतिगमन और क्लस्टरिंग विधियों का विस्तार करते हैं। | # कृत्रिम तंत्रिका नेटवर्क गैर-रैखिक बहुभिन्नरूपी मॉडल के प्रतिगमन और क्लस्टरिंग विधियों का विस्तार करते हैं। | ||
# बहुभिन्नरूपी डेटा का पता लगाने के लिए पर्यटन, [[समानांतर निर्देशांक]], स्कैटरप्लॉट मैट्रिसेस | # बहुभिन्नरूपी डेटा का पता लगाने के लिए [[सांख्यिकीय ग्राफिक्स]] जैसे पर्यटन, [[समानांतर निर्देशांक]], स्कैटरप्लॉट मैट्रिसेस का उपयोग किया जा सकता है। | ||
# एक साथ समीकरण मॉडल | # एक साथ अनुमानित विभिन्न निर्भर चर के साथ समीकरण मॉडल एक से अधिक प्रतिगमन समीकरण सम्मिलित हैं।। | ||
# [[वेक्टर ऑटोरिग्रेशन]] में विभिन्न [[समय श्रृंखला]] | # [[वेक्टर ऑटोरिग्रेशन]] में विभिन्न [[समय श्रृंखला]] वेरिएट के एक साथ प्रतिगमन और एक दूसरे के पिछड़े मानों पर एक साथ प्रतिगमन सम्मिलित है। | ||
# [[प्रधान प्रतिक्रिया वक्र]] | # [[प्रधान प्रतिक्रिया वक्र|प्रधान प्रतिक्रिया वक्रो]] विश्लेषण (पीआरसी) आरडीए पर आधारित एक विधि है जो उपयोगकर्ता को समय के साथ नियंत्रण अनुकूलन में बदलाव के लिए सुधार करके समय के साथ उपचार के प्रभावों पर ध्यान केंद्रित करने की अनुमति देता है।<ref>ter Braak, Cajo J.F. & Šmilauer, Petr (2012). ''Canoco reference manual and user's guide: software for ordination (version 5.0)'', p292. Microcomputer Power, Ithaca, NY.</ref> | ||
# सहसंबंधों की प्रतीकात्मकता में सहसंबंध मैट्रिक्स को एक आरेख द्वारा प्रतिस्थापित करना | # सहसंबंधों की प्रतीकात्मकता में सहसंबंध मैट्रिक्स को एक आरेख द्वारा प्रतिस्थापित करना सम्मिलित है जहां "उल्लेखनीय" सहसंबंधों को एक ठोस रेखा (सकारात्मक सहसंबंध), या एक बिंदीदार रेखा (नकारात्मक सहसंबंध) द्वारा दर्शाया जाता है। | ||
== महत्वपूर्ण | == महत्वपूर्ण प्रायिकता वितरण == | ||
बहुभिन्नरूपी विश्लेषणों में उपयोग किए जाने वाले प्रायिकता वितरणों का एक | बहुभिन्नरूपी विश्लेषणों में उपयोग किए जाने वाले प्रायिकता वितरणों का एक समुच्चय होता है जो वितरणों के संगत समुच्चय के समान भूमिका निभाते हैं जो [[सामान्य वितरण]] डेटासमुच्चय के लिए उपयुक्त होने पर अविभाज्य विश्लेषण में उपयोग किए जाते हैं। ये बहुभिन्नरूपी वितरण हैं: | ||
: * [[बहुभिन्नरूपी सामान्य वितरण]] | : * [[बहुभिन्नरूपी सामान्य वितरण]] | ||
: * [[विशार्ट वितरण]] | : * [[विशार्ट वितरण]] | ||
:*[[बहुभिन्नरूपी छात्र वितरण | :*[[बहुभिन्नरूपी छात्र वितरण|बहुभिन्नरूपी स्टूडेंट-टी वितरण]] | ||
बायेसियन अनुमान में व्युत्क्रम-विशार्ट वितरण महत्वपूर्ण है, उदाहरण के लिए [[बायेसियन बहुभिन्नरूपी रैखिक प्रतिगमन]] | बायेसियन अनुमान में व्युत्क्रम-विशार्ट वितरण महत्वपूर्ण है, उदाहरण के लिए [[बायेसियन बहुभिन्नरूपी रैखिक प्रतिगमन]] में महत्वपूर्ण है। इसके अतिरिक्त, हॉटेलिंग का टी-वर्ग वितरण एक बहुभिन्नरूपी वितरण है, जो स्टूडेंट के टी-वितरण का सामान्यीकरण करता है, जिसका उपयोग बहुभिन्नरूपी [[सांख्यिकीय परिकल्पना परीक्षण]] में किया जाता है। | ||
== इतिहास == | == इतिहास == | ||
एंडरसन की 1958 की पाठ्यपुस्तक, बहुभिन्नरूपी सांख्यिकीय विश्लेषण का एक परिचय,<ref>[[Theodore Wilbur Anderson|T.W. Anderson]] (1958) '' An Introduction to Multivariate Analysis'', New York: Wiley {{ISBN|0471026409}}; 2e (1984) {{ISBN|0471889873}}; 3e (2003) {{ISBN|0471360910}}</ref> सिद्धांतकारों और अनुप्रयुक्त सांख्यिकीविदों की एक पीढ़ी को शिक्षित किया; एंडरसन की पुस्तक [[संभावना अनुपात परीक्षण]] और [[सांख्यिकीय शक्ति]] | एंडरसन की 1958 की पाठ्यपुस्तक, बहुभिन्नरूपी सांख्यिकीय विश्लेषण का एक परिचय,<ref>[[Theodore Wilbur Anderson|T.W. Anderson]] (1958) '' An Introduction to Multivariate Analysis'', New York: Wiley {{ISBN|0471026409}}; 2e (1984) {{ISBN|0471889873}}; 3e (2003) {{ISBN|0471360910}}</ref> ने सिद्धांतकारों और अनुप्रयुक्त सांख्यिकीविदों की एक पीढ़ी को शिक्षित किया; एंडरसन की पुस्तक [[संभावना अनुपात परीक्षण]] और [[सांख्यिकीय शक्ति]] कार्यों के गुणों के माध्यम से [[परिकल्पना परीक्षण]], [[स्वीकार्य निर्णय नियम|स्वीकार्यता]], निष्पक्षता और एकरसता का पूर्वाग्रह पर जोर देती है।<ref>{{cite journal|doi =10.2307/2289251|title =समीक्षा: बहुभिन्नरूपी सांख्यिकीय विश्लेषण पर समकालीन पाठ्यपुस्तकें: एक मनोरम मूल्यांकन और समालोचना|first9 =K. V.|last10 =Kent|first10 =J. T.|last11 =Bibby|first11 =J. M.|last12 =Morrison|first12 =D. F.|last13 =Muirhead|first13 =R. J.|last14 =Press|first14 =S. J.|last15 =Rao|first15 =C. R.|last16 =Roy|first16 =S. N.|last17 =Gnanadesikan|first17 =R.|last18 =Srivastava|first18 =J. N.|last19 =Seber|first19 =G. A. F.|last20 =Srivastava|first20 =M. S.|last21 =Khatri|first21 =C. G.|last22 =Takeuchi|first22 =K.|last23 =Yanai|first23 =H.|last24 =Mukherjee|first24 =B. N.|last9 =Mardia|first8 =A. M.|last8 =Kshirsagar|first7 =M. G.|last7 =Kendall|first6 =R.|last6 =Gnanadesikan|first5 =N. C.|last5 =Giri|first4 =M. L.|last4 =Eaton|first3 =S. F.|last3 =Arnold|first2 =T. W.|last2 =Anderson|last1=Sen|first1=Pranab Kumar|author1-link=Pranab K. Sen|journal=[[Journal of the American Statistical Association]]| volume=81 | issue=394 |date=June 1986|pages=560–564| jstor=2289251 | issn=0162-1459 |display-authors =8}}(Pages 560–561)</ref><ref>{{cite journal|doi =10.1214/ss/1177013111|title =बहुभिन्नरूपी विश्लेषण की समीक्षा|last=Schervish|first=Mark J.| journal=Statistical Science| volume=2|issue=4|date=November 1987|pages=396–413|jstor=2245530|issn =0883-4237|doi-access=free}} | ||
</ref> | </ref> | ||
एमवीए एक बार केवल आकार, अंतर्निहित डेटा | |||
एमवीए एक बार केवल आकार, अंतर्निहित डेटा समुच्चय की जटिलता और उच्च संगणनात्मक उपभोग के कारण सांख्यिकीय सिद्धांत क्षेत्र में खड़ा था। संगणनात्मक शक्ति के नाटकीय विकास के साथ, एमवीए अब डेटा विश्लेषण में तेजी से महत्वपूर्ण भूमिका निभाता है और [[ओमिक्स]] क्षेत्रों में इसका व्यापक अनुप्रयोग है। | |||
== अनुप्रयोग == | == अनुप्रयोग == | ||
Line 61: | Line 63: | ||
* बहुभिन्नरूपी प्रतिगमन विश्लेषण | * बहुभिन्नरूपी प्रतिगमन विश्लेषण | ||
*[[सांख्यिकीय वर्गीकरण]] | *[[सांख्यिकीय वर्गीकरण]] | ||
*[[फीचर चयन]] | *[[फीचर चयन|फीवेरिएट चयन]] | ||
* [[बहुआयामी विश्लेषण]] | * [[बहुआयामी विश्लेषण]] | ||
* बहुआयामी स्केलिंग | * बहुआयामी स्केलिंग | ||
Line 67: | Line 69: | ||
== सॉफ्टवेयर और उपकरण == | == सॉफ्टवेयर और उपकरण == | ||
बहुभिन्नरूपी विश्लेषण के लिए बड़ी संख्या में सॉफ्टवेयर पैकेज और अन्य उपकरण हैं, जिनमें | बहुभिन्नरूपी विश्लेषण के लिए बड़ी संख्या में सॉफ्टवेयर पैकेज और अन्य उपकरण हैं, जिनमें सम्मिलित हैं: | ||
* [[जेएमपी (सांख्यिकीय सॉफ्टवेयर)]] | * [[जेएमपी (सांख्यिकीय सॉफ्टवेयर)]] | ||
* [[मिनीटैब]] | * [[मिनीटैब]] | ||
* | * ओपनऑफिस.ओआरजी कैल्क | ||
* [[पीएसपीपी]] | * [[पीएसपीपी]] | ||
* [[आर (प्रोग्रामिंग भाषा)]]<ref>[https://cran.r-project.org/web/views/Multivariate.html CRAN] has details on the packages available for multivariate data analysis</ref> | * [[आर (प्रोग्रामिंग भाषा)]]<ref>[https://cran.r-project.org/web/views/Multivariate.html CRAN] has details on the packages available for multivariate data analysis</ref> | ||
Line 76: | Line 78: | ||
* पायथन के लिए [[SciPy]] (प्रोग्रामिंग भाषा) | * पायथन के लिए [[SciPy]] (प्रोग्रामिंग भाषा) | ||
* [[एसपीएसएस]] | * [[एसपीएसएस]] | ||
* [[था]] | * [[था|स्टाटा]] | ||
* सांख्यिकी | * सांख्यिकी | ||
[[द अनस्क्रैम्बलर]] | *[[द अनस्क्रैम्बलर]] | ||
* वारपीएलएस | * वारपीएलएस | ||
* [[स्मार्टपीएलएस]] | * [[स्मार्टपीएलएस]] | ||
* [[मतलब]] | * [[मतलब]] | ||
* [[समीक्षा]] | * [[समीक्षा]] | ||
*[[एनसीएसएस (सांख्यिकीय सॉफ्टवेयर)]] में बहुभिन्नरूपी विश्लेषण | *[[एनसीएसएस (सांख्यिकीय सॉफ्टवेयर)]] में बहुभिन्नरूपी विश्लेषण सम्मिलित है। | ||
*[http://www.camo.com/rt/Products/Unscrambler/unscrambler.html | *[http://www.camo.com/rt/Products/Unscrambler/unscrambler.html अनस्क्रैम्बलर® X] एक बहुभिन्नरूपी विश्लेषण उपकरण है। | ||
*[https://umetrics.com/products/simca | *[https://umetrics.com/products/simca सिम्का] | ||
*डेटापंडित ([http://letsexcel.in लेट्स एक्सेल एनालिटिक्स सॉल्यूशंस] द्वारा मुफ्त SaaS एप्लिकेशन) | *डेटापंडित ([http://letsexcel.in लेट्स एक्सेल एनालिटिक्स सॉल्यूशंस] द्वारा मुफ्त SaaS एप्लिकेशन) | ||
Line 131: | Line 134: | ||
==बाहरी संबंध== | ==बाहरी संबंध== | ||
{{Commons category}} | {{Commons category}} | ||
Line 168: | Line 157: | ||
{{Authority control}} | {{Authority control}} | ||
[[Category: | [[Category:Articles with hatnote templates targeting a nonexistent page]] | ||
[[Category:Articles with short description]] | |||
[[Category:Collapse templates]] | |||
[[Category:Commons category link is the pagename]] | |||
[[Category:Created On 05/12/2022]] | [[Category:Created On 05/12/2022]] | ||
[[Category:Exclude in print]] | |||
[[Category:Interwiki category linking templates]] | |||
[[Category:Interwiki link templates]] | |||
[[Category:Machine Translated Page]] | |||
[[Category:Missing redirects]] | |||
[[Category:Navigational boxes| ]] | |||
[[Category:Navigational boxes without horizontal lists]] | |||
[[Category:Pages with empty portal template]] | |||
[[Category:Pages with script errors]] | |||
[[Category:Portal-inline template with redlinked portals]] | |||
[[Category:Portal templates with redlinked portals]] | |||
[[Category:Short description with empty Wikidata description]] | |||
[[Category:Sidebars with styles needing conversion]] | |||
[[Category:Template documentation pages|Documentation/doc]] | |||
[[Category:Templates Vigyan Ready]] | |||
[[Category:Templates generating microformats]] | |||
[[Category:Templates that add a tracking category]] | |||
[[Category:Templates that are not mobile friendly]] | |||
[[Category:Templates using TemplateData]] | |||
[[Category:Wikimedia Commons templates]] | |||
[[Category:Wikipedia metatemplates]] | |||
[[Category:बहुभिन्नरूपी आंकड़े| ]] |
Latest revision as of 18:06, 3 January 2023
बहुभिन्नरूपी आँकड़े आँकड़ों का एक उपखंड है जिसमें एक से अधिक परिणाम वेरिएट के एक साथ अवलोकन और विश्लेषण सम्मिलितहैं।
बहुभिन्नरूपी आँकड़े बहुभिन्नरूपी विश्लेषण के विभिन्न रूपों में से प्रत्येक के विभिन्न उद्देश्यों और पृष्ठभूमि को समझने से संबंधित हैं, और वे एक दूसरे से कैसे संबंधित हैं। किसी विशेष समस्या के लिए बहुभिन्नरूपी आँकड़ों के व्यावहारिक अनुप्रयोग में वेरिएट के बीच संबंधों और अध्ययन की जा रही समस्या के लिए उनकी संबद्ध को समझने के लिए कई प्रकार के अविभाज्य और बहुभिन्नरूपी विश्लेषण सम्मिलितहो सकते हैं।
इसके अतिरिक्त, बहुभिन्नरूपी आँकड़े दोनों के संदर्भ में बहुभिन्नरूपी प्रायिकता वितरण से संबंधित हैं
- देखे गए डेटा के वितरण का प्रतिनिधित्व करने के लिए इनका उपयोग कैसे किया जा सकता है;
- सांख्यिकीय अनुमान के हिस्से के रूप में उनका उपयोग कैसे किया जा सकता है, विशेष रूप से जहां एक ही विश्लेषण के लिए कई अलग-अलग मात्राएं रुचिकर हों।।
बहुभिन्नरूपी डेटा से जुड़ी कुछ प्रकार की समस्याएं, उदाहरण के लिए सरल रेखीय प्रतिगमन और एकाधिक प्रतिगमन, सामान्यतः बहुभिन्नरूपी आँकड़ों के विशेष स्थिति नहीं माने जाती हैं क्योंकि विश्लेषण अन्य वेरिएटों को दिए गए एकल परिणाम वेरिएट के (अविभाजित) सशर्त वितरण पर विचार करके किया जाता है।
बहुभिन्नरूपी विश्लेषण
बहुभिन्नरूपी विश्लेषण (एमवीए) बहुभिन्नरूपी सांख्यिकी के सिद्धांतों पर आधारित है। सामान्यतः, एमवीए का उपयोग उन स्थितियों को संबोधित करने के लिए किया जाता है जहां प्रत्येक प्रायोगिक इकाई पर कई माप किए जाते हैं और इन मापों और उनकी संरचनाओं के बीच महत्वपूर्ण संबंध होते हैं।[1] एमवीए के एक आधुनिक, अतिव्यापी वर्गीकरण में सम्मिलित हैं:[1]
- सामान्य और सामान्य बहुभिन्नरूपी मॉडल और वितरण सिद्धांत
- संबंधों का अध्ययन और माप
- बहुआयामी क्षेत्रों की संभाव्यता संगणना
- डेटा संरचनाओं और पैटर्न की खोज
एक पदानुक्रमित पद्धति-का-पद्धति के लिए वेरिएट के प्रभावों की गणना करने के लिए भौतिकी-आधारित विश्लेषण को सम्मिलित करने की इच्छा से बहुभिन्नरूपी विश्लेषण जटिल हो सकता है। बहुभिन्नरूपी विश्लेषण का उपयोग करने की इच्छा रखने वाले अध्ययन अधिकांश समस्या की विमा के कारण रुक जाते हैं। सरोगेट मॉडल, भौतिकी-आधारित कोड के अत्यधिक यथार्थ अनुमानों के उपयोग के माध्यम से इन चिंताओं को अधिकांश कम किया जाता है। चूंकि सरोगेट मॉडल एक समीकरण का रूप लेते हैं, इसलिए उनका मूल्यांकन बहुत जल्दी किया जा सकता है। यह बड़े पैमाने पर एमवीए अध्ययनों के लिए एक संबल बन जाता है: जबकि डिज़ाइन स्पेस में एक मोंटे कार्लो सिमुलेशन भौतिकी-आधारित कोड के साथ जटिल है, सरोगेट मॉडल का मूल्यांकन करते समय यह तुच्छ हो जाता है, जो अधिकांश प्रतिक्रिया-सतह समीकरणों का रूप ले लेता है।
विश्लेषण के प्रकार
कई अलग-अलग मॉडल हैं, जिनमें से प्रत्येक का अपना विश्लेषण प्रकार है:
- विवेरिएटण का बहुभिन्नरूपी विश्लेषण (मनोवा) उन स्थितियों को आच्छादन करने के लिए विवेरिएटण के विश्लेषण का विस्तार करता है जहां एक से अधिक आश्रित वेरिएट एक साथ विश्लेषण किए जाते हैं; सहप्रसरण (मैनकोवा) का बहुभिन्नरूपी विश्लेषण भी देखें।
- बहुभिन्नरूपी प्रतिगमन एक सूत्र को निर्धारित करने का प्रयास करता है जो वर्णन कर सकता है कि कैसे वेरिएट के सदिश में तत्व दूसरों में परिवर्तनों के साथ-साथ प्रतिक्रिया करते हैं। रैखिक संबंधों के लिए, यहाँ प्रतिगमन विश्लेषण सामान्य रैखिक मॉडल के रूपों पर आधारित हैं। कुछ प्रस्ताव देते हैं कि बहुभिन्नरूपी प्रतिगमन बहुभिन्नरूपी प्रतिगमन से अलग है, चूंकि, यह वाद विवाद का विषय है और वैज्ञानिक क्षेत्रों में लगातार सत्य नहीं है।[2]
- प्रधान घटक विश्लेषण (पीसीए) लांबिक विश्लेषण वेरिएट का एक नया समुच्चय बनाता है जिसमें मूल समुच्चय के समान जानकारी होती है। यह लांबिक विश्लेषण अक्षों का एक नया समुच्चय देने के लिए भिन्नता के अक्षों को घूर्णन कराता है, ताकि वे भिन्नता के घटते अनुपात को संक्षेप में प्रस्तुत कर सके।
- कारक विश्लेषण पीसीए के समान है, लेकिन उपयोगकर्ता को मूल समुच्चय से कम संख्या में अवास्तविक वेरिएट निकालने की अनुमति देता है, शेष अस्पष्टीकृत भिन्नता को त्रुटि के रूप में छोड़ देता है। निकाले गए वेरिएट अव्यक्त वेरिएट या कारकों के रूप में जाने जाते हैं; देखे गए वेरिएटों के समूह में प्रत्येक को सहसंयोजन के लिए जिम्मेदार माना जा सकता है।
- कैनोनिकल सहसंबंध विश्लेषण वेरिएट के दो सेटों के बीच रैखिक संबंध पाता है; यह द्विभाजित सहसंबंध का सामान्यीकृत (अर्थात् कैनोनिकल) संस्करण है।[3]
- अतिरेक विश्लेषण (आरडीए) कैनोनिकल सहसंबंध विश्लेषण के समान है, लेकिन उपयोगकर्ता को (स्वतंत्र) वेरिएट के एक समुच्चय से निर्दिष्ट संख्या में अवास्तविक वेरिएट प्राप्त करने की अनुमति देता है जो दूसरे (स्वतंत्र) समुच्चय में जितना संभव हो उतना विवेरिएटण की व्याख्या करता है। यह प्रतिगमन विश्लेषण का एक बहुभिन्नरूपी अनुरूप है।
- पत्राचार विश्लेषण (सीए), या पारस्परिक औसत, मूल समुच्चय को संक्षिप्त करने वाले अवास्तविक वेरिएट का एक समुच्चय (पीसीए की तरह) पाता है। अंतर्निहित मॉडल रिकॉर्ड (स्थितियों) के बीच सीएचआई-वर्ग असमानताओं को दर्शाता है।
- वेरिएट के दो सेटों (जैसे अतिरेक विश्लेषण) में संयुक्त भिन्नता को संक्षिप्त करने के लिए कैननिकल (या "विवश") पत्राचार विश्लेषण (सीसीए); पत्राचार विश्लेषण और बहुभिन्नरूपी प्रतिगमन विश्लेषण का संयोजन। अंतर्निहित मॉडल रिकॉर्ड (स्थितियों) के बीच सीएचआई-वर्ग असमानताओं को मानता है।
- बहुआयामी स्केलिंग में अवास्तविक वेरिएट का एक समुच्चय निर्धारित करने के लिए विभिन्न कलन विधि सम्मिलित हैं जो रिकॉर्ड के बीच जोड़ीदार दूरी का सबसे अच्छा प्रतिनिधित्व करते हैं। मूल विधि प्रधान निर्देशांक विश्लेषण (PCoA; PCA पर आधारित) है।
- विभेदक विश्लेषण, या कैनोनिकल वेरिएट एनालिसिस, यह स्थापित करने का प्रयास करता है कि क्या वेरिएट के एक समुच्चय का उपयोग स्थितियों के दो या अधिक समूहों के बीच अंतर करने के लिए किया जा सकता है।
- रेखीय विभेदक विश्लेषण (LDA) नई टिप्पणियों के वर्गीकरण की अनुमति देने के लिए सामान्य रूप से वितरित डेटा के दो समुच्चयों से एक रेखीय भविष्यवक्ता की गणना करता है।
- क्लस्टर विश्लेषण वस्तुओं को समूहों (क्लस्टर कहा जाता है) में निर्धारित करता है ताकि एक ही क्लस्टर से वस्तु (स्थितियों) अलग-अलग क्लस्टर की वस्तुओं की तुलना में एक दूसरे के समान हों।
- पुनरावर्ती विभाजन एक निर्णय रेखा चित्र बनाता है जो एक द्विबीजपत्री आश्रित वेरिएट के आधार पर जनसंख्या के सदस्यों को सही संरचना से वर्गीकृत करने का प्रयास करता है।
- कृत्रिम तंत्रिका नेटवर्क गैर-रैखिक बहुभिन्नरूपी मॉडल के प्रतिगमन और क्लस्टरिंग विधियों का विस्तार करते हैं।
- बहुभिन्नरूपी डेटा का पता लगाने के लिए सांख्यिकीय ग्राफिक्स जैसे पर्यटन, समानांतर निर्देशांक, स्कैटरप्लॉट मैट्रिसेस का उपयोग किया जा सकता है।
- एक साथ अनुमानित विभिन्न निर्भर चर के साथ समीकरण मॉडल एक से अधिक प्रतिगमन समीकरण सम्मिलित हैं।।
- वेक्टर ऑटोरिग्रेशन में विभिन्न समय श्रृंखला वेरिएट के एक साथ प्रतिगमन और एक दूसरे के पिछड़े मानों पर एक साथ प्रतिगमन सम्मिलित है।
- प्रधान प्रतिक्रिया वक्रो विश्लेषण (पीआरसी) आरडीए पर आधारित एक विधि है जो उपयोगकर्ता को समय के साथ नियंत्रण अनुकूलन में बदलाव के लिए सुधार करके समय के साथ उपचार के प्रभावों पर ध्यान केंद्रित करने की अनुमति देता है।[4]
- सहसंबंधों की प्रतीकात्मकता में सहसंबंध मैट्रिक्स को एक आरेख द्वारा प्रतिस्थापित करना सम्मिलित है जहां "उल्लेखनीय" सहसंबंधों को एक ठोस रेखा (सकारात्मक सहसंबंध), या एक बिंदीदार रेखा (नकारात्मक सहसंबंध) द्वारा दर्शाया जाता है।
महत्वपूर्ण प्रायिकता वितरण
बहुभिन्नरूपी विश्लेषणों में उपयोग किए जाने वाले प्रायिकता वितरणों का एक समुच्चय होता है जो वितरणों के संगत समुच्चय के समान भूमिका निभाते हैं जो सामान्य वितरण डेटासमुच्चय के लिए उपयुक्त होने पर अविभाज्य विश्लेषण में उपयोग किए जाते हैं। ये बहुभिन्नरूपी वितरण हैं:
बायेसियन अनुमान में व्युत्क्रम-विशार्ट वितरण महत्वपूर्ण है, उदाहरण के लिए बायेसियन बहुभिन्नरूपी रैखिक प्रतिगमन में महत्वपूर्ण है। इसके अतिरिक्त, हॉटेलिंग का टी-वर्ग वितरण एक बहुभिन्नरूपी वितरण है, जो स्टूडेंट के टी-वितरण का सामान्यीकरण करता है, जिसका उपयोग बहुभिन्नरूपी सांख्यिकीय परिकल्पना परीक्षण में किया जाता है।
इतिहास
एंडरसन की 1958 की पाठ्यपुस्तक, बहुभिन्नरूपी सांख्यिकीय विश्लेषण का एक परिचय,[5] ने सिद्धांतकारों और अनुप्रयुक्त सांख्यिकीविदों की एक पीढ़ी को शिक्षित किया; एंडरसन की पुस्तक संभावना अनुपात परीक्षण और सांख्यिकीय शक्ति कार्यों के गुणों के माध्यम से परिकल्पना परीक्षण, स्वीकार्यता, निष्पक्षता और एकरसता का पूर्वाग्रह पर जोर देती है।[6][7]
एमवीए एक बार केवल आकार, अंतर्निहित डेटा समुच्चय की जटिलता और उच्च संगणनात्मक उपभोग के कारण सांख्यिकीय सिद्धांत क्षेत्र में खड़ा था। संगणनात्मक शक्ति के नाटकीय विकास के साथ, एमवीए अब डेटा विश्लेषण में तेजी से महत्वपूर्ण भूमिका निभाता है और ओमिक्स क्षेत्रों में इसका व्यापक अनुप्रयोग है।
अनुप्रयोग
- बहुभिन्नरूपी परिकल्पना परीक्षण
- आयामीता में कमी
- अव्यक्त संरचना की खोज
- क्लस्टर विश्लेषण
- बहुभिन्नरूपी प्रतिगमन विश्लेषण
- सांख्यिकीय वर्गीकरण
- फीवेरिएट चयन
- बहुआयामी विश्लेषण
- बहुआयामी स्केलिंग
- डेटा माइनिंग
सॉफ्टवेयर और उपकरण
बहुभिन्नरूपी विश्लेषण के लिए बड़ी संख्या में सॉफ्टवेयर पैकेज और अन्य उपकरण हैं, जिनमें सम्मिलित हैं:
- जेएमपी (सांख्यिकीय सॉफ्टवेयर)
- मिनीटैब
- ओपनऑफिस.ओआरजी कैल्क
- पीएसपीपी
- आर (प्रोग्रामिंग भाषा)[8]
- एसएएस (सॉफ्टवेयर)
- पायथन के लिए SciPy (प्रोग्रामिंग भाषा)
- एसपीएसएस
- स्टाटा
- सांख्यिकी
- द अनस्क्रैम्बलर
- वारपीएलएस
- स्मार्टपीएलएस
- मतलब
- समीक्षा
- एनसीएसएस (सांख्यिकीय सॉफ्टवेयर) में बहुभिन्नरूपी विश्लेषण सम्मिलित है।
- अनस्क्रैम्बलर® X एक बहुभिन्नरूपी विश्लेषण उपकरण है।
- सिम्का
- डेटापंडित (लेट्स एक्सेल एनालिटिक्स सॉल्यूशंस द्वारा मुफ्त SaaS एप्लिकेशन)
यह भी देखें
- सहप्रसरण मैट्रिक्स का अनुमान
- सांख्यिकी में महत्वपूर्ण प्रकाशनों की सूची#बहुभिन्नरूपी विश्लेषण
- विपणन में बहुभिन्नरूपी परीक्षण
- संरचित डेटा विश्लेषण (सांख्यिकी)
- संरचनात्मक समीकरण मॉडलिंग
- आरवी गुणांक
- द्विभाजित विश्लेषण
- प्रयोगों का डिज़ाइन (DoE)
- आयामी विश्लेषण
- अन्वेषणात्मक डेटा विश्लेषण
- सामान्य कम चौकोर
- आंशिक न्यूनतम वर्ग प्रतिगमन
- पैटर्न मान्यता
- प्रधान घटक विश्लेषण (पीसीए)
- प्रतिगमन विश्लेषण
- वर्ग उपमाओं का नरम स्वतंत्र मॉडलिंग (SIMCA)
- सांख्यिकीय हस्तक्षेप
- वस्तु के एक प्रकार विश्लेषण
संदर्भ
- ↑ 1.0 1.1 Olkin, I.; Sampson, A. R. (2001-01-01), "Multivariate Analysis: Overview", in Smelser, Neil J.; Baltes, Paul B. (eds.), International Encyclopedia of the Social & Behavioral Sciences, Pergamon, pp. 10240–10247, ISBN 9780080430768, retrieved 2019-09-02
- ↑ Hidalgo, B; Goodman, M (2013). "बहुभिन्नरूपी या बहुभिन्नरूपी प्रतिगमन?". Am J Public Health. 103: 39–40. doi:10.2105/AJPH.2012.300897. PMC 3518362. PMID 23153131.
- ↑ Unsophisticated analysts of bivariate Gaussian problems may find useful a crude but accurate method of accurately gauging probability by simply taking the sum S of the N residuals' squares, subtracting the sum Sm at minimum, dividing this difference by Sm, multiplying the result by (N - 2) and taking the inverse anti-ln of half that product.
- ↑ ter Braak, Cajo J.F. & Šmilauer, Petr (2012). Canoco reference manual and user's guide: software for ordination (version 5.0), p292. Microcomputer Power, Ithaca, NY.
- ↑ T.W. Anderson (1958) An Introduction to Multivariate Analysis, New York: Wiley ISBN 0471026409; 2e (1984) ISBN 0471889873; 3e (2003) ISBN 0471360910
- ↑ Sen, Pranab Kumar; Anderson, T. W.; Arnold, S. F.; Eaton, M. L.; Giri, N. C.; Gnanadesikan, R.; Kendall, M. G.; Kshirsagar, A. M.; et al. (June 1986). "समीक्षा: बहुभिन्नरूपी सांख्यिकीय विश्लेषण पर समकालीन पाठ्यपुस्तकें: एक मनोरम मूल्यांकन और समालोचना". Journal of the American Statistical Association. 81 (394): 560–564. doi:10.2307/2289251. ISSN 0162-1459. JSTOR 2289251.(Pages 560–561)
- ↑ Schervish, Mark J. (November 1987). "बहुभिन्नरूपी विश्लेषण की समीक्षा". Statistical Science. 2 (4): 396–413. doi:10.1214/ss/1177013111. ISSN 0883-4237. JSTOR 2245530.
- ↑ CRAN has details on the packages available for multivariate data analysis
अग्रिम पठन
- Johnson, Richard A.; Wichern, Dean W. (2007). Applied Multivariate Statistical Analysis (Sixth ed.). Prentice Hall. ISBN 978-0-13-187715-3.
- KV Mardia; JT Kent; JM Bibby (1979). Multivariate Analysis. Academic Press. ISBN 0-12-471252-5.
- A. Sen, M. Srivastava, Regression Analysis — Theory, Methods, and Applications, Springer-Verlag, Berlin, 2011 (4th printing).
- Cook, Swayne (2007). Interactive Graphics for Data Analysis.
- Malakooti, B. (2013). Operations and Production Systems with Multiple Objectives. John Wiley & Sons.
- T. W. Anderson, An Introduction to Multivariate Statistical Analysis, Wiley, New York, 1958.
- KV Mardia; JT Kent & JM Bibby (1979). Multivariate Analysis. Academic Press. ISBN 978-0124712522. (M.A. level "likelihood" approach)
- Feinstein, A. R. (1996) Multivariable Analysis. New Haven, CT: Yale University Press.
- Hair, J. F. Jr. (1995) Multivariate Data Analysis with Readings, 4th ed. Prentice-Hall.
- Johnson, Richard A.; Wichern, Dean W. (2007). Applied Multivariate Statistical Analysis (Sixth ed.). Prentice Hall. ISBN 978-0-13-187715-3.
- Schafer, J. L. (1997) Analysis of Incomplete Multivariate Data. CRC Press. (Advanced)
- Sharma, S. (1996) Applied Multivariate Techniques. Wiley. (Informal, applied)
- Izenman, Alan J. (2008). Modern Multivariate Statistical Techniques: Regression, Classification, and Manifold Learning. Springer Texts in Statistics. New York: Springer-Verlag. ISBN 9780387781884.
- "Handbook of Applied Multivariate Statistics and Mathematical Modeling | ScienceDirect". Retrieved 2019-09-03.