सामान्य रैखिक मॉडल: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 4: Line 4:
'''सामान्य [[रैखिक मॉडल]]''' या सामान्य बहुभिन्नरूपी प्रतिगमन मॉडल एक साथ कई एकाधिक रैखिक प्रतिगमन मॉडल लिखने का सघन (कॉम्पैक्ट) तरीका है। इस अर्थ में यह एक अलग सांख्यिकीय रैखिक मॉडल नहीं है। विभिन्न एकाधिक रैखिक प्रतिगमन मॉडल को सघन रूप से इस प्रकार लिखा जा सकता है<ref name="MardiaK1979Multivariate">{{Cite book | author = [[K. V. Mardia]], J. T. Kent and J. M. Bibby | title = बहुभिन्नरूपी विश्लेषण| publisher = [[Academic Press]] | year = 1979 | isbn = 0-12-471252-5}}</ref>
'''सामान्य [[रैखिक मॉडल]]''' या सामान्य बहुभिन्नरूपी प्रतिगमन मॉडल एक साथ कई एकाधिक रैखिक प्रतिगमन मॉडल लिखने का सघन (कॉम्पैक्ट) तरीका है। इस अर्थ में यह एक अलग सांख्यिकीय रैखिक मॉडल नहीं है। विभिन्न एकाधिक रैखिक प्रतिगमन मॉडल को सघन रूप से इस प्रकार लिखा जा सकता है<ref name="MardiaK1979Multivariate">{{Cite book | author = [[K. V. Mardia]], J. T. Kent and J. M. Bibby | title = बहुभिन्नरूपी विश्लेषण| publisher = [[Academic Press]] | year = 1979 | isbn = 0-12-471252-5}}</ref>
: <math>\mathbf{Y} = \mathbf{X}\mathbf{B} + \mathbf{U},</math>
: <math>\mathbf{Y} = \mathbf{X}\mathbf{B} + \mathbf{U},</math>
जहां Y बहुभिन्नरूपी मापों की श्रृंखला के साथ एक [[मैट्रिक्स (गणित)]] है (प्रत्येक कॉलम आश्रित चर में से एक पर माप का एक सेट है), एक्स [[स्वतंत्र चर]] पर टिप्पणियों का एक मैट्रिक्स है जो एक [[डिज़ाइन मैट्रिक्स]] हो सकता है (प्रत्येक कॉलम एक सेट है) स्वतंत्र चरों में से एक पर अवलोकनों का), बी एक मैट्रिक्स है जिसमें पैरामीटर होते हैं जिनका सामान्यतः अनुमान लगाया जाता है और यू एक मैट्रिक्स है जिसमें आंकड़ों (शोर) में त्रुटियां और अवशेष होते हैं।
जहां '''Y''' बहुभिन्नरूपी मापों की श्रृंखला के साथ एक [[मैट्रिक्स (गणित)|आव्यूह (]][[डिज़ाइन मैट्रिक्स|आव्यूह]]) (गणित) है (प्रत्येक कॉलम आश्रित चर में से एक पर माप का एक सेट है), '''X''' [[स्वतंत्र चर]] पर टिप्पणियों का आव्यूह है जो एक [[डिज़ाइन मैट्रिक्स|डिज़ाइन आव्यूह]] हो सकता है (प्रत्येक कॉलम एक सेट है) स्वतंत्र चरों में से एक पर अवलोकनों का), '''B''' एक आव्यूह है जिसमें पैरामीटर होते हैं जिनका सामान्यतः अनुमान लगाया जाता है और '''U''' एक आव्यूह है जिसमें आंकड़ों (रव) में त्रुटियां और अवशेष होते हैं। त्रुटियों को सामान्यतः मापों में असंबद्ध माना जाता है, और एक [[बहुभिन्नरूपी सामान्य वितरण]] का पालन करते हैं। यदि त्रुटियाँ बहुभिन्नरूपी सामान्य वितरण का पालन नहीं करती हैं, तो '''Y''' और '''U''' के बारे में धारणाओं को शिथिल करने के लिए [[सामान्यीकृत रैखिक मॉडल]] का उपयोग किया जा सकता है।
त्रुटियों को सामान्यतः मापों में असंबद्ध माना जाता है, और एक [[बहुभिन्नरूपी सामान्य वितरण]] का पालन करते हैं। यदि त्रुटियाँ बहुभिन्नरूपी सामान्य वितरण का पालन नहीं करती हैं, तो Y और U के बारे में धारणाओं को शिथिल करने के लिए [[सामान्यीकृत रैखिक मॉडल]] का उपयोग किया जा सकता है।


सामान्य रैखिक मॉडल में कई अलग-अलग सांख्यिकीय मॉडल सम्मिलित होते हैं: [[एनोवा]], एएनसीओवीए, [[परिवर्तन]], [[ मनकोवा ]], साधारण रैखिक प्रतिगमन, टी-टेस्ट|''टी''-टेस्ट और एफ-टेस्ट|''एफ''-टेस्ट। सामान्य रैखिक मॉडल एक से अधिक आश्रित चर के मामले में एकाधिक रैखिक प्रतिगमन का सामान्यीकरण है। यदि Y, B, और U [[स्तंभ सदिश]] थे, तो उपरोक्त मैट्रिक्स समीकरण एकाधिक रैखिक प्रतिगमन का प्रतिनिधित्व करेगा।
सामान्य रैखिक मॉडल में कई अलग-अलग सांख्यिकीय मॉडल: [[एनोवा|ANOVA]], ANCOVA, [[ मनकोवा |MANOVA, MANCOVA]], साधारण रैखिक प्रतिगमन, ''टी''-टेस्ट और ''एफ''-टेस्ट सम्मिलित होते हैं। सामान्य रैखिक मॉडल एक से अधिक आश्रित चर की स्थितियो में एकाधिक रैखिक प्रतिगमन का सामान्यीकरण है। यदि '''Y''', '''B''', और '''U''' [[स्तंभ सदिश]] थे, तो उपरोक्त आव्यूह समीकरण एकाधिक रैखिक प्रतिगमन का प्रतिनिधित्व करेगा।


सामान्य रैखिक मॉडल के साथ परिकल्पना परीक्षण दो तरीकों से किए जा सकते हैं: [[बहुभिन्नरूपी आँकड़े]] या कई स्वतंत्र [[अविभाज्य]] परीक्षण। बहुभिन्नरूपी परीक्षणों में Y के स्तंभों का एक साथ परीक्षण किया जाता है, जबकि एकविभिन्न परीक्षणों में Y के स्तंभों का स्वतंत्र रूप से परीक्षण किया जाता है, अर्थात, एक ही डिज़ाइन मैट्रिक्स के साथ कई अविभाज्य परीक्षणों के रूप में।
सामान्य रैखिक मॉडल के साथ परिकल्पना परीक्षण दो तरीकों: [[बहुभिन्नरूपी आँकड़े]] या कई स्वतंत्र [[अविभाज्य]] परीक्षण से किए जा सकते हैं। बहुभिन्नरूपी परीक्षणों में '''Y''' के स्तंभों का एक साथ परीक्षण किया जाता है, जबकि एकविभिन्न परीक्षणों में '''Y''' के स्तंभों का स्वतंत्र रूप से परीक्षण किया जाता है अर्थात, एक ही डिज़ाइन आव्यूह के साथ कई अविभाज्य परीक्षणों के रूप में हैं।


== एकाधिक रैखिक प्रतिगमन की तुलना ==
== एकाधिक रैखिक प्रतिगमन की तुलना ==
{{further|Multiple linear regression}}
{{further|एकाधिक रेखीय प्रतिगमन}}
एकाधिक रैखिक प्रतिगमन एक से अधिक स्वतंत्र चर के मामले में सरल रैखिक प्रतिगमन का एक सामान्यीकरण है, और सामान्य रैखिक मॉडल का एक [[विशेष मामला]] है, जो एक आश्रित चर तक सीमित है। एकाधिक रैखिक प्रतिगमन के लिए मूल मॉडल है
 
एकाधिक रैखिक प्रतिगमन एक से अधिक स्वतंत्र चर के स्थितियो में सरल रैखिक प्रतिगमन का एक सामान्यीकरण है, और सामान्य रैखिक मॉडल की एक [[विशेष मामला|विशेष स्थिति]] है, जो एक आश्रित चर तक सीमित है। एकाधिक रैखिक प्रतिगमन के लिए मूल मॉडल है


:<math> Y_i = \beta_0 + \beta_1 X_{i1} + \beta_2 X_{i2} + \ldots + \beta_p X_{ip} + \epsilon_i</math> या अधिक सघन रूप से <math>Y_i = \beta_0 + \sum \limits_{k=1}^{p} {\beta_k X_{ik}} + \epsilon_i</math>
:<math> Y_i = \beta_0 + \beta_1 X_{i1} + \beta_2 X_{i2} + \ldots + \beta_p X_{ip} + \epsilon_i</math> या अधिक सघन रूप से <math>Y_i = \beta_0 + \sum \limits_{k=1}^{p} {\beta_k X_{ik}} + \epsilon_i</math>
प्रत्येक अवलोकन के लिए i = 1, ... , n.
प्रत्येक अवलोकन के लिए ''i'' = 1, ... , ''n''.


उपरोक्त सूत्र में हम एक आश्रित चर और p स्वतंत्र चर के n अवलोकनों पर विचार करते हैं। इस प्रकार, वाई<sub>''i''</sub> मैं है<sup>वें</sup>निर्भर चर का अवलोकन, एक्स<sub>''ij''</sub> क्या मैं<sup>वें</sup>जे का अवलोकन<sup>वें</sup>स्वतंत्र चर, जे = 1, 2, ..., पी। मान β<sub>''j''</sub> अनुमानित किए जाने वाले मापदंडों का प्रतिनिधित्व करें, और ε<sub>''i''</sub> मैं है<sup>वें</sup> स्वतंत्र समान रूप से वितरित सामान्य त्रुटि।
उपरोक्त सूत्र में हम एक आश्रित चर और ''p'' स्वतंत्र चर के ''n'' अवलोकनों पर विचार करते हैं। इस प्रकार, ''Y<sub>i</sub>''  आश्रित चर का अवलोकन है, ''X<sub>ij</sub>'' यह ''i''<sup>th</sup> स्वतंत्र चर का अवलोकन है, ''j'' = 1, 2, ..., ''p'' मान β<sub>''j''</sub> अनुमानित किए जाने वाले पैरामीटर का प्रतिनिधित्व करें, ''ε<sub>i</sub>'' और ''i''<sup>th</sup> स्वतंत्र समान रूप से वितरित सामान्य त्रुटि है।


अधिक सामान्य बहुभिन्नरूपी रैखिक प्रतिगमन में, प्रत्येक m > 1 आश्रित चर के लिए उपरोक्त रूप का एक समीकरण होता है जो व्याख्यात्मक चर के समान सेट को साझा करता है और इसलिए एक दूसरे के साथ एक साथ अनुमान लगाया जाता है:
अधिक सामान्य बहुभिन्नरूपी रैखिक प्रतिगमन में, प्रत्येक ''m'' > 1 आश्रित चर के लिए उपरोक्त रूप का एक समीकरण होता है जो व्याख्यात्मक चर के समान सेट को साझा करता है और इसलिए एक दूसरे के साथ एक साथ अनुमान लगाया जाता है:


:<math> Y_{ij} = \beta_{0j} + \beta_{1j} X_{i1} + \beta_{2j}X_{i2} + \ldots + \beta_{pj} X_{ip} + \epsilon_{ij}</math> या अधिक सघन रूप से <math>Y_{ij} = \beta_{0j} + \sum \limits_{k=1}^{p} { \beta_{kj} X_{ik}} + \epsilon_{ij}</math>
:<math> Y_{ij} = \beta_{0j} + \beta_{1j} X_{i1} + \beta_{2j}X_{i2} + \ldots + \beta_{pj} X_{ip} + \epsilon_{ij}</math> या अधिक सघन रूप से <math>Y_{ij} = \beta_{0j} + \sum \limits_{k=1}^{p} { \beta_{kj} X_{ik}} + \epsilon_{ij}</math>
सभी अवलोकनों को i = 1, ..., n के रूप में अनुक्रमित किया गया है और सभी आश्रित चर को j = 1, ..., m के रूप में अनुक्रमित किया गया है।
सभी अवलोकनों को ''i'' = 1, ... , ''n'' के रूप में अनुक्रमित किया गया है और सभी आश्रित चर को ''j = 1, ... ,'' m के रूप में अनुक्रमित किया गया है।


ध्यान दें, चूंकि प्रत्येक आश्रित चर में फिट किए जाने वाले प्रतिगमन मापदंडों का अपना सेट होता है, इसलिए कम्प्यूटेशनल दृष्टिकोण से सामान्य बहुभिन्नरूपी प्रतिगमन समान व्याख्यात्मक चर का उपयोग करके मानक एकाधिक रैखिक प्रतिगमन का एक अनुक्रम है।
ध्यान दें, चूंकि प्रत्येक आश्रित चर के पास प्रतिगमन मापदंडों का अपना एक सेट है, एक कम्प्यूटेशनल दृष्टिकोण से सामान्य बहुवाद प्रतिगमन केवल एक ही व्याख्यात्मक चर का उपयोग करके मानक बहु रैखिक प्रतिगमन का एक अनुक्रम है।


== सामान्यीकृत रैखिक मॉडल की तुलना ==
== सामान्यीकृत रैखिक मॉडल की तुलना ==


सामान्य रैखिक मॉडल और सामान्यीकृत रैखिक मॉडल|सामान्यीकृत रैखिक मॉडल (जीएलएम)<ref name=":0">{{Citation|last1=McCullagh|first1=P.|title=An outline of generalized linear models|date=1989|work=Generalized Linear Models|pages=21–47|publisher=Springer US|isbn=9780412317606|last2=Nelder|first2=J. A.|doi=10.1007/978-1-4899-3242-6_2}}</ref><ref>Fox, J. (2015). ''Applied regression analysis and generalized linear models''. Sage Publications.</ref> सांख्यिकी के दो सामान्य रूप से उपयोग किए जाने वाले परिवार हैं जो कुछ संख्या में निरंतर और/या श्रेणीबद्ध [[आश्रित और स्वतंत्र चर]] को एक आश्रित और स्वतंत्र चर से जोड़ते हैं।
सामान्य रैखिक मॉडल और सामान्यीकृत रैखिक मॉडल (GLM)<ref name=":0">{{Citation|last1=McCullagh|first1=P.|title=An outline of generalized linear models|date=1989|work=Generalized Linear Models|pages=21–47|publisher=Springer US|isbn=9780412317606|last2=Nelder|first2=J. A.|doi=10.1007/978-1-4899-3242-6_2}}</ref><ref>Fox, J. (2015). ''Applied regression analysis and generalized linear models''. Sage Publications.</ref> सांख्यिकी के दो सामान्य रूप से उपयोग किए जाने वाले परिवार हैं जो कुछ संख्या में निरंतर और/या श्रेणीबद्ध [[आश्रित और स्वतंत्र चर]] को आश्रित और स्वतंत्र चर से जोड़ते हैं।


दोनों दृष्टिकोणों के बीच मुख्य अंतर यह है कि सामान्य रैखिक मॉडल सख्ती से मानता है कि त्रुटियां और अवशेष [[सशर्त संभाव्यता वितरण]] [[सामान्य वितरण]] का पालन करेंगे,<ref name=":1">Cohen, J., Cohen, P., West, S. G., & [[Leona S. Aiken|Aiken, L. S.]] (2003). Applied multiple regression/correlation analysis for the behavioral sciences.</ref> जबकि जीएलएम इस धारणा को ढीला कर देता है और अवशेषों के लिए [[घातीय परिवार]] से कई अन्य [[वितरण (गणित)]] की अनुमति देता है।<ref name=":0" />ध्यान दें, सामान्य रैखिक मॉडल जीएलएम का एक विशेष मामला है जिसमें अवशेषों का वितरण सशर्त रूप से सामान्य वितरण का पालन करता है।
दोनों दृष्टिकोणों के बीच मुख्य अंतर यह है कि सामान्य रैखिक मॉडल दृढता से मानता है कि त्रुटियां और अवशेष [[सशर्त संभाव्यता वितरण]] [[सामान्य वितरण]] का पालन करेंगे,<ref name=":1">Cohen, J., Cohen, P., West, S. G., & [[Leona S. Aiken|Aiken, L. S.]] (2003). Applied multiple regression/correlation analysis for the behavioral sciences.</ref> जबकि GLM इस धारणा को शिथिल कर देता है और अवशिष्ट के लिए [[घातीय परिवार]] से कई अन्य [[वितरण (गणित)]] की अनुमति देता है।<ref name=":0" /> ध्यान दें, सामान्य रैखिक मॉडल GLM की एक विशेष स्थिति है जिसमें अवशिष्ट का वितरण सशर्त रूप से सामान्य वितरण का पालन करता है।


अवशेषों का वितरण काफी हद तक परिणाम चर के प्रकार और वितरण पर निर्भर करता है; विभिन्न प्रकार के परिणाम चर जीएलएम परिवार के भीतर मॉडलों की विविधता को जन्म देते हैं। जीएलएम परिवार में सामान्यतः इस्तेमाल किए जाने वाले मॉडल में [[ संभार तन्त्र परावर्तन ]] सम्मिलित है<ref>Hosmer Jr, D. W., Lemeshow, S., & Sturdivant, R. X. (2013). ''Applied logistic regression'' (Vol. 398). John Wiley & Sons.</ref> द्विआधारी या द्विभाजित परिणामों के लिए, [[पॉइसन प्रतिगमन]]<ref>{{cite journal |last1=Gardner |first1=W. |last2=Mulvey |first2=E. P. |last3=Shaw |first3=E. C. |title=Regression analyses of counts and rates: Poisson, overdispersed Poisson, and negative binomial models. |journal=Psychological Bulletin |date=1995 |volume=118 |issue=3 |pages=392–404 |doi=10.1037/0033-2909.118.3.392|pmid=7501743 }}</ref> गणना परिणामों के लिए, और निरंतर, सामान्य रूप से वितरित परिणामों के लिए रैखिक प्रतिगमन। इसका मतलब यह है कि जीएलएम को सांख्यिकीय मॉडल के एक सामान्य परिवार के रूप में या विशिष्ट परिणाम प्रकारों के लिए विशिष्ट मॉडल के रूप में कहा जा सकता है।
अवशिष्ट का वितरण काफी हद तक परिणाम चर के प्रकार और वितरण पर निर्भर करता है; विभिन्न प्रकार के परिणाम चर GLM परिवार के भीतर मॉडलों की विविधता को जन्म देते हैं। GLM परिवार में सामान्यतः उपयोग किए जाने वाले मॉडल में[[ संभार तन्त्र परावर्तन ]]<ref>Hosmer Jr, D. W., Lemeshow, S., & Sturdivant, R. X. (2013). ''Applied logistic regression'' (Vol. 398). John Wiley & Sons.</ref> द्विआधारी या द्विभाजित परिणामों के लिए, [[पॉइसन प्रतिगमन]]<ref>{{cite journal |last1=Gardner |first1=W. |last2=Mulvey |first2=E. P. |last3=Shaw |first3=E. C. |title=Regression analyses of counts and rates: Poisson, overdispersed Poisson, and negative binomial models. |journal=Psychological Bulletin |date=1995 |volume=118 |issue=3 |pages=392–404 |doi=10.1037/0033-2909.118.3.392|pmid=7501743 }}</ref> गणना परिणामों के लिए, और निरंतर, सामान्य रूप से वितरित परिणामों के लिए रैखिक प्रतिगमन सम्मिलित है। इसका अर्थ यह है कि GLM को सांख्यिकीय मॉडल के एक सामान्य परिवार के रूप में या विशिष्ट परिणाम प्रकारों के लिए विशिष्ट मॉडल के रूप में कहा जा सकता है।
{| class="wikitable"
{| class="wikitable"
!
!

Revision as of 13:07, 20 July 2023

सामान्य रैखिक मॉडल या सामान्य बहुभिन्नरूपी प्रतिगमन मॉडल एक साथ कई एकाधिक रैखिक प्रतिगमन मॉडल लिखने का सघन (कॉम्पैक्ट) तरीका है। इस अर्थ में यह एक अलग सांख्यिकीय रैखिक मॉडल नहीं है। विभिन्न एकाधिक रैखिक प्रतिगमन मॉडल को सघन रूप से इस प्रकार लिखा जा सकता है[1]

जहां Y बहुभिन्नरूपी मापों की श्रृंखला के साथ एक आव्यूह (आव्यूह) (गणित) है (प्रत्येक कॉलम आश्रित चर में से एक पर माप का एक सेट है), X स्वतंत्र चर पर टिप्पणियों का आव्यूह है जो एक डिज़ाइन आव्यूह हो सकता है (प्रत्येक कॉलम एक सेट है) स्वतंत्र चरों में से एक पर अवलोकनों का), B एक आव्यूह है जिसमें पैरामीटर होते हैं जिनका सामान्यतः अनुमान लगाया जाता है और U एक आव्यूह है जिसमें आंकड़ों (रव) में त्रुटियां और अवशेष होते हैं। त्रुटियों को सामान्यतः मापों में असंबद्ध माना जाता है, और एक बहुभिन्नरूपी सामान्य वितरण का पालन करते हैं। यदि त्रुटियाँ बहुभिन्नरूपी सामान्य वितरण का पालन नहीं करती हैं, तो Y और U के बारे में धारणाओं को शिथिल करने के लिए सामान्यीकृत रैखिक मॉडल का उपयोग किया जा सकता है।

सामान्य रैखिक मॉडल में कई अलग-अलग सांख्यिकीय मॉडल: ANOVA, ANCOVA, MANOVA, MANCOVA, साधारण रैखिक प्रतिगमन, टी-टेस्ट और एफ-टेस्ट सम्मिलित होते हैं। सामान्य रैखिक मॉडल एक से अधिक आश्रित चर की स्थितियो में एकाधिक रैखिक प्रतिगमन का सामान्यीकरण है। यदि Y, B, और U स्तंभ सदिश थे, तो उपरोक्त आव्यूह समीकरण एकाधिक रैखिक प्रतिगमन का प्रतिनिधित्व करेगा।

सामान्य रैखिक मॉडल के साथ परिकल्पना परीक्षण दो तरीकों: बहुभिन्नरूपी आँकड़े या कई स्वतंत्र अविभाज्य परीक्षण से किए जा सकते हैं। बहुभिन्नरूपी परीक्षणों में Y के स्तंभों का एक साथ परीक्षण किया जाता है, जबकि एकविभिन्न परीक्षणों में Y के स्तंभों का स्वतंत्र रूप से परीक्षण किया जाता है अर्थात, एक ही डिज़ाइन आव्यूह के साथ कई अविभाज्य परीक्षणों के रूप में हैं।

एकाधिक रैखिक प्रतिगमन की तुलना

एकाधिक रैखिक प्रतिगमन एक से अधिक स्वतंत्र चर के स्थितियो में सरल रैखिक प्रतिगमन का एक सामान्यीकरण है, और सामान्य रैखिक मॉडल की एक विशेष स्थिति है, जो एक आश्रित चर तक सीमित है। एकाधिक रैखिक प्रतिगमन के लिए मूल मॉडल है

या अधिक सघन रूप से

प्रत्येक अवलोकन के लिए i = 1, ... , n.

उपरोक्त सूत्र में हम एक आश्रित चर और p स्वतंत्र चर के n अवलोकनों पर विचार करते हैं। इस प्रकार, Yi आश्रित चर का अवलोकन है, Xij यह ith स्वतंत्र चर का अवलोकन है, j = 1, 2, ..., p मान βj अनुमानित किए जाने वाले पैरामीटर का प्रतिनिधित्व करें, εi और ith स्वतंत्र समान रूप से वितरित सामान्य त्रुटि है।

अधिक सामान्य बहुभिन्नरूपी रैखिक प्रतिगमन में, प्रत्येक m > 1 आश्रित चर के लिए उपरोक्त रूप का एक समीकरण होता है जो व्याख्यात्मक चर के समान सेट को साझा करता है और इसलिए एक दूसरे के साथ एक साथ अनुमान लगाया जाता है:

या अधिक सघन रूप से

सभी अवलोकनों को i = 1, ... , n के रूप में अनुक्रमित किया गया है और सभी आश्रित चर को j = 1, ... , m के रूप में अनुक्रमित किया गया है।

ध्यान दें, चूंकि प्रत्येक आश्रित चर के पास प्रतिगमन मापदंडों का अपना एक सेट है, एक कम्प्यूटेशनल दृष्टिकोण से सामान्य बहुवाद प्रतिगमन केवल एक ही व्याख्यात्मक चर का उपयोग करके मानक बहु रैखिक प्रतिगमन का एक अनुक्रम है।

सामान्यीकृत रैखिक मॉडल की तुलना

सामान्य रैखिक मॉडल और सामान्यीकृत रैखिक मॉडल (GLM)[2][3] सांख्यिकी के दो सामान्य रूप से उपयोग किए जाने वाले परिवार हैं जो कुछ संख्या में निरंतर और/या श्रेणीबद्ध आश्रित और स्वतंत्र चर को आश्रित और स्वतंत्र चर से जोड़ते हैं।

दोनों दृष्टिकोणों के बीच मुख्य अंतर यह है कि सामान्य रैखिक मॉडल दृढता से मानता है कि त्रुटियां और अवशेष सशर्त संभाव्यता वितरण सामान्य वितरण का पालन करेंगे,[4] जबकि GLM इस धारणा को शिथिल कर देता है और अवशिष्ट के लिए घातीय परिवार से कई अन्य वितरण (गणित) की अनुमति देता है।[2] ध्यान दें, सामान्य रैखिक मॉडल GLM की एक विशेष स्थिति है जिसमें अवशिष्ट का वितरण सशर्त रूप से सामान्य वितरण का पालन करता है।

अवशिष्ट का वितरण काफी हद तक परिणाम चर के प्रकार और वितरण पर निर्भर करता है; विभिन्न प्रकार के परिणाम चर GLM परिवार के भीतर मॉडलों की विविधता को जन्म देते हैं। GLM परिवार में सामान्यतः उपयोग किए जाने वाले मॉडल मेंसंभार तन्त्र परावर्तन [5] द्विआधारी या द्विभाजित परिणामों के लिए, पॉइसन प्रतिगमन[6] गणना परिणामों के लिए, और निरंतर, सामान्य रूप से वितरित परिणामों के लिए रैखिक प्रतिगमन सम्मिलित है। इसका अर्थ यह है कि GLM को सांख्यिकीय मॉडल के एक सामान्य परिवार के रूप में या विशिष्ट परिणाम प्रकारों के लिए विशिष्ट मॉडल के रूप में कहा जा सकता है।

सामान्य रैखिक मॉडल सामान्यीकृत रैखिक मॉडल
विशिष्ट अनुमान विधि न्यूनतम वर्ग, उत्कृष्ट रैखिक अनभिनत पूर्वानुमान अधिकतम संभावना या बायेसियन
उदाहरण ANOVA, ANCOVA, रैखिक प्रतिगमन रैखिक प्रतिगमन, लॉजिस्टिक प्रतिगमन, पॉइसन प्रतिगमन, गामा प्रतिगमन,[7] सामान्य रैखिक मॉडल
विस्तारण और संबंधित विधियाँ MANOVA, MANCOVA, रैखिक मिश्रित मॉडल सामान्यीकृत रैखिक मिश्रित मॉडल (GLMM), सामान्यीकृत आकलन समीकरण (GEE)
R संपुष्टि और फलन lm() आँकड़े संपुष्टि में (आधार R) glm() आँकड़े संपुष्टि में (आधार R)
मैटलैब फलन mvregress() glmfit()
SAS प्रक्रियाऐ PROC GLM, PROC REG PROC GENMOD, PROC LOGISTIC (बाइनरी और क्रमबद्ध या अव्यवस्थित श्रेणीबद्ध परिणामों के लिए)
Stata समादेश regress glm
SPSS समादेश regression, glm genlin, logistic
वोल्फ्राम लैंगग्विज & मेथेमेटिका फलन रैखिक मॉडलफिट[][8] सामान्यीकृत रैखिक मॉडल फिट[][9]
EViews समादेश ls[10] glm[11]
आँकड़ेमॉडल पायथन संपुष्टि regression-and-linear-models GLM


अनुप्रयोग

सामान्य रैखिक मॉडल का एक अनुप्रयोग वैज्ञानिक प्रयोगों में कई ब्रेन स्कैन के विश्लेषण में दिखाई देता है जहां Y ब्रेन स्कैनर से आँकड़े सम्मिलित है, X में प्रयोगात्मक डिज़ाइन चर और कन्फाउन्ड सम्मिलित हैं। इसका परीक्षण सामान्यतः एकचर विधि से किया जाता है (सामान्यतः इस सेटिंग में इसे द्रव्यमान-एकचर कहा जाता है) और इसे प्राय: सांख्यिकीय पैरामीट्रिक मानचित्रण के रूप में जाना जाता है।[12]


यह भी देखें

t- परीक्षण

टिप्पणियाँ

  1. K. V. Mardia, J. T. Kent and J. M. Bibby (1979). बहुभिन्नरूपी विश्लेषण. Academic Press. ISBN 0-12-471252-5.
  2. 2.0 2.1 McCullagh, P.; Nelder, J. A. (1989), "An outline of generalized linear models", Generalized Linear Models, Springer US, pp. 21–47, doi:10.1007/978-1-4899-3242-6_2, ISBN 9780412317606
  3. Fox, J. (2015). Applied regression analysis and generalized linear models. Sage Publications.
  4. Cohen, J., Cohen, P., West, S. G., & Aiken, L. S. (2003). Applied multiple regression/correlation analysis for the behavioral sciences.
  5. Hosmer Jr, D. W., Lemeshow, S., & Sturdivant, R. X. (2013). Applied logistic regression (Vol. 398). John Wiley & Sons.
  6. Gardner, W.; Mulvey, E. P.; Shaw, E. C. (1995). "Regression analyses of counts and rates: Poisson, overdispersed Poisson, and negative binomial models". Psychological Bulletin. 118 (3): 392–404. doi:10.1037/0033-2909.118.3.392. PMID 7501743.
  7. McCullagh, Peter; Nelder, John (1989). Generalized Linear Models, Second Edition. Boca Raton: Chapman and Hall/CRC. ISBN 978-0-412-31760-6.
  8. LinearModelFit, Wolfram Language Documentation Center.
  9. GeneralizedLinearModelFit, Wolfram Language Documentation Center.
  10. ls, EViews Help.
  11. glm, EViews Help.
  12. K.J. Friston; A.P. Holmes; K.J. Worsley; J.-B. Poline; C.D. Frith; R.S.J. Frackowiak (1995). "Statistical Parametric Maps in functional imaging: A general linear approach". Human Brain Mapping. 2 (4): 189–210. doi:10.1002/hbm.460020402. S2CID 9898609.


संदर्भ

  • Christensen, Ronald (2020). Plane Answers to Complex Questions: The Theory of Linear Models (Fifth ed.). New York: Springer. ISBN 978-3-030-32096-6.
  • Wichura, Michael J. (2006). The coordinate-free approach to linear models. Cambridge Series in Statistical and Probabilistic Mathematics. Cambridge: Cambridge University Press. pp. xiv+199. ISBN 978-0-521-86842-6. MR 2283455.
  • Rawlings, John O.; Pantula, Sastry G.; Dickey, David A., eds. (1998). Applied Regression Analysis. Springer Texts in Statistics. doi:10.1007/b98890. ISBN 0-387-98454-2.