सामान्य रैखिक मॉडल
एक श्रृंखला का हिस्सा |
प्रतिगमन विश्लेषण |
---|
मॉडल |
अनुमान |
पार्श्वभूमि |
|
सामान्य रैखिक मॉडल या सामान्य बहुभिन्नरूपी प्रतिगमन मॉडल एक साथ कई एकाधिक रैखिक प्रतिगमन मॉडल लिखने का सघन (कॉम्पैक्ट) तरीका है। इस अर्थ में यह एक अलग सांख्यिकीय रैखिक मॉडल नहीं है। विभिन्न एकाधिक रैखिक प्रतिगमन मॉडल को सघन रूप से इस प्रकार लिखा जा सकता है[1]
जहां Y बहुभिन्नरूपी मापों की श्रृंखला के साथ एक आव्यूह (आव्यूह) (गणित) है (प्रत्येक कॉलम आश्रित चर में से एक पर माप का एक सेट है), X स्वतंत्र चर पर टिप्पणियों का आव्यूह है जो एक डिज़ाइन आव्यूह हो सकता है (प्रत्येक कॉलम एक सेट है) स्वतंत्र चरों में से एक पर अवलोकनों का), B एक आव्यूह है जिसमें पैरामीटर होते हैं जिनका सामान्यतः अनुमान लगाया जाता है और U एक आव्यूह है जिसमें आंकड़ों (रव) में त्रुटियां और अवशेष होते हैं। त्रुटियों को सामान्यतः मापों में असंबद्ध माना जाता है, और एक बहुभिन्नरूपी सामान्य वितरण का पालन करते हैं। यदि त्रुटियाँ बहुभिन्नरूपी सामान्य वितरण का पालन नहीं करती हैं, तो Y और U के बारे में धारणाओं को शिथिल करने के लिए सामान्यीकृत रैखिक मॉडल का उपयोग किया जा सकता है।
सामान्य रैखिक मॉडल में कई अलग-अलग सांख्यिकीय मॉडल: ANOVA, ANCOVA, MANOVA, MANCOVA, साधारण रैखिक प्रतिगमन, टी-टेस्ट और एफ-टेस्ट सम्मिलित होते हैं। सामान्य रैखिक मॉडल एक से अधिक आश्रित चर की स्थितियो में एकाधिक रैखिक प्रतिगमन का सामान्यीकरण है। यदि Y, B, और U स्तंभ सदिश थे, तो उपरोक्त आव्यूह समीकरण एकाधिक रैखिक प्रतिगमन का प्रतिनिधित्व करेगा।
सामान्य रैखिक मॉडल के साथ परिकल्पना परीक्षण दो तरीकों: बहुभिन्नरूपी आँकड़े या कई स्वतंत्र अविभाज्य परीक्षण से किए जा सकते हैं। बहुभिन्नरूपी परीक्षणों में Y के स्तंभों का एक साथ परीक्षण किया जाता है, जबकि एकविभिन्न परीक्षणों में Y के स्तंभों का स्वतंत्र रूप से परीक्षण किया जाता है अर्थात, एक ही डिज़ाइन आव्यूह के साथ कई अविभाज्य परीक्षणों के रूप में हैं।
एकाधिक रैखिक प्रतिगमन की तुलना
एकाधिक रैखिक प्रतिगमन एक से अधिक स्वतंत्र चर के स्थितियो में सरल रैखिक प्रतिगमन का एक सामान्यीकरण है, और सामान्य रैखिक मॉडल की एक विशेष स्थिति है, जो एक आश्रित चर तक सीमित है। एकाधिक रैखिक प्रतिगमन के लिए मूल मॉडल है
- या अधिक सघन रूप से
प्रत्येक अवलोकन के लिए i = 1, ... , n.
उपरोक्त सूत्र में हम एक आश्रित चर और p स्वतंत्र चर के n अवलोकनों पर विचार करते हैं। इस प्रकार, Yi आश्रित चर का अवलोकन है, Xij यह ith स्वतंत्र चर का अवलोकन है, j = 1, 2, ..., p मान βj अनुमानित किए जाने वाले पैरामीटर का प्रतिनिधित्व करें, εi और ith स्वतंत्र समान रूप से वितरित सामान्य त्रुटि है।
अधिक सामान्य बहुभिन्नरूपी रैखिक प्रतिगमन में, प्रत्येक m > 1 आश्रित चर के लिए उपरोक्त रूप का एक समीकरण होता है जो व्याख्यात्मक चर के समान सेट को साझा करता है और इसलिए एक दूसरे के साथ एक साथ अनुमान लगाया जाता है:
- या अधिक सघन रूप से
सभी अवलोकनों को i = 1, ... , n के रूप में अनुक्रमित किया गया है और सभी आश्रित चर को j = 1, ... , m के रूप में अनुक्रमित किया गया है।
ध्यान दें, चूंकि प्रत्येक आश्रित चर के पास प्रतिगमन मापदंडों का अपना एक सेट है, एक कम्प्यूटेशनल दृष्टिकोण से सामान्य बहुवाद प्रतिगमन केवल एक ही व्याख्यात्मक चर का उपयोग करके मानक बहु रैखिक प्रतिगमन का एक अनुक्रम है।
सामान्यीकृत रैखिक मॉडल की तुलना
सामान्य रैखिक मॉडल और सामान्यीकृत रैखिक मॉडल (GLM)[2][3] सांख्यिकी के दो सामान्य रूप से उपयोग किए जाने वाले परिवार हैं जो कुछ संख्या में निरंतर और/या श्रेणीबद्ध आश्रित और स्वतंत्र चर को आश्रित और स्वतंत्र चर से जोड़ते हैं।
दोनों दृष्टिकोणों के बीच मुख्य अंतर यह है कि सामान्य रैखिक मॉडल दृढता से मानता है कि त्रुटियां और अवशेष सशर्त संभाव्यता वितरण सामान्य वितरण का पालन करेंगे,[4] जबकि GLM इस धारणा को शिथिल कर देता है और अवशिष्ट के लिए घातीय परिवार से कई अन्य वितरण (गणित) की अनुमति देता है।[2] ध्यान दें, सामान्य रैखिक मॉडल GLM की एक विशेष स्थिति है जिसमें अवशिष्ट का वितरण सशर्त रूप से सामान्य वितरण का पालन करता है।
अवशिष्ट का वितरण काफी हद तक परिणाम चर के प्रकार और वितरण पर निर्भर करता है; विभिन्न प्रकार के परिणाम चर GLM परिवार के भीतर मॉडलों की विविधता को जन्म देते हैं। GLM परिवार में सामान्यतः उपयोग किए जाने वाले मॉडल मेंसंभार तन्त्र परावर्तन [5] द्विआधारी या द्विभाजित परिणामों के लिए, पॉइसन प्रतिगमन[6] गणना परिणामों के लिए, और निरंतर, सामान्य रूप से वितरित परिणामों के लिए रैखिक प्रतिगमन सम्मिलित है। इसका अर्थ यह है कि GLM को सांख्यिकीय मॉडल के एक सामान्य परिवार के रूप में या विशिष्ट परिणाम प्रकारों के लिए विशिष्ट मॉडल के रूप में कहा जा सकता है।
सामान्य रैखिक मॉडल | सामान्यीकृत रैखिक मॉडल | |
---|---|---|
विशिष्ट अनुमान विधि | न्यूनतम वर्ग, उत्कृष्ट रैखिक अनभिनत पूर्वानुमान | अधिकतम संभावना या बायेसियन |
उदाहरण | ANOVA, ANCOVA, रैखिक प्रतिगमन | रैखिक प्रतिगमन, लॉजिस्टिक प्रतिगमन, पॉइसन प्रतिगमन, गामा प्रतिगमन,[7] सामान्य रैखिक मॉडल |
विस्तारण और संबंधित विधियाँ | MANOVA, MANCOVA, रैखिक मिश्रित मॉडल | सामान्यीकृत रैखिक मिश्रित मॉडल (GLMM), सामान्यीकृत आकलन समीकरण (GEE) |
R संपुष्टि और फलन | lm() आँकड़े संपुष्टि में (आधार R) | glm() आँकड़े संपुष्टि में (आधार R) |
मैटलैब फलन | mvregress() | glmfit() |
SAS प्रक्रियाऐ | PROC GLM, PROC REG | PROC GENMOD, PROC LOGISTIC (बाइनरी और क्रमबद्ध या अव्यवस्थित श्रेणीबद्ध परिणामों के लिए) |
Stata समादेश | regress | glm |
SPSS समादेश | regression, glm | genlin, logistic |
वोल्फ्राम लैंगग्विज & मेथेमेटिका फलन | रैखिक मॉडलफिट[][8] | सामान्यीकृत रैखिक मॉडल फिट[][9] |
EViews समादेश | ls[10] | glm[11] |
आँकड़ेमॉडल पायथन संपुष्टि | regression-and-linear-models | GLM |
अनुप्रयोग
सामान्य रैखिक मॉडल का एक अनुप्रयोग वैज्ञानिक प्रयोगों में कई ब्रेन स्कैन के विश्लेषण में दिखाई देता है जहां Y ब्रेन स्कैनर से आँकड़े सम्मिलित है, X में प्रयोगात्मक डिज़ाइन चर और कन्फाउन्ड सम्मिलित हैं। इसका परीक्षण सामान्यतः एकचर विधि से किया जाता है (सामान्यतः इस सेटिंग में इसे द्रव्यमान-एकचर कहा जाता है) और इसे प्राय: सांख्यिकीय पैरामीट्रिक मानचित्रण के रूप में जाना जाता है।[12]
यह भी देखें
टिप्पणियाँ
- ↑ K. V. Mardia, J. T. Kent and J. M. Bibby (1979). बहुभिन्नरूपी विश्लेषण. Academic Press. ISBN 0-12-471252-5.
- ↑ 2.0 2.1 McCullagh, P.; Nelder, J. A. (1989), "An outline of generalized linear models", Generalized Linear Models, Springer US, pp. 21–47, doi:10.1007/978-1-4899-3242-6_2, ISBN 9780412317606
- ↑ Fox, J. (2015). Applied regression analysis and generalized linear models. Sage Publications.
- ↑ Cohen, J., Cohen, P., West, S. G., & Aiken, L. S. (2003). Applied multiple regression/correlation analysis for the behavioral sciences.
- ↑ Hosmer Jr, D. W., Lemeshow, S., & Sturdivant, R. X. (2013). Applied logistic regression (Vol. 398). John Wiley & Sons.
- ↑ Gardner, W.; Mulvey, E. P.; Shaw, E. C. (1995). "Regression analyses of counts and rates: Poisson, overdispersed Poisson, and negative binomial models". Psychological Bulletin. 118 (3): 392–404. doi:10.1037/0033-2909.118.3.392. PMID 7501743.
- ↑ McCullagh, Peter; Nelder, John (1989). Generalized Linear Models, Second Edition. Boca Raton: Chapman and Hall/CRC. ISBN 978-0-412-31760-6.
- ↑ LinearModelFit, Wolfram Language Documentation Center.
- ↑ GeneralizedLinearModelFit, Wolfram Language Documentation Center.
- ↑ ls, EViews Help.
- ↑ glm, EViews Help.
- ↑ K.J. Friston; A.P. Holmes; K.J. Worsley; J.-B. Poline; C.D. Frith; R.S.J. Frackowiak (1995). "Statistical Parametric Maps in functional imaging: A general linear approach". Human Brain Mapping. 2 (4): 189–210. doi:10.1002/hbm.460020402. S2CID 9898609.
संदर्भ
- Christensen, Ronald (2020). Plane Answers to Complex Questions: The Theory of Linear Models (Fifth ed.). New York: Springer. ISBN 978-3-030-32096-6.
- Wichura, Michael J. (2006). The coordinate-free approach to linear models. Cambridge Series in Statistical and Probabilistic Mathematics. Cambridge: Cambridge University Press. pp. xiv+199. ISBN 978-0-521-86842-6. MR 2283455.
- Rawlings, John O.; Pantula, Sastry G.; Dickey, David A., eds. (1998). Applied Regression Analysis. Springer Texts in Statistics. doi:10.1007/b98890. ISBN 0-387-98454-2.