मिश्रित मॉडल

From Vigyanwiki
Revision as of 10:49, 7 July 2023 by alpha>Indicwiki (Created page with "{{Short description|Statistical model containing both fixed effects and random effects}} {{distinguish|mixture model}} {{Regression bar}} एक मिश्रित मॉ...")
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

एक मिश्रित मॉडल, मिश्रित-प्रभाव मॉडल या मिश्रित त्रुटि-घटक मॉडल एक सांख्यिकीय मॉडल है जिसमें निश्चित प्रभाव और यादृच्छिक प्रभाव दोनों होते हैं।[1][2] ये मॉडल भौतिक, जैविक और सामाजिक विज्ञान के विविध विषयों में उपयोगी हैं। वे उन सेटिंग्स में विशेष रूप से उपयोगी होते हैं जहां बार-बार माप डिजाइन एक ही सांख्यिकीय इकाइयों (अनुदैर्ध्य अध्ययन) पर किए जाते हैं, या जहां माप संबंधित सांख्यिकीय इकाइयों के समूहों पर किए जाते हैं।[2]लापता मूल्यों से निपटने में उनके लाभ के कारण, मिश्रित प्रभाव मॉडल को अक्सर अधिक पारंपरिक दृष्टिकोण जैसे कि विचरण के बार-बार माप विश्लेषण पर प्राथमिकता दी जाती है।

यह पृष्ठ सामान्यीकृत रैखिक मिश्रित मॉडल या गैर-रेखीय मिश्रित-प्रभाव मॉडल | गैर-रेखीय मिश्रित-प्रभाव मॉडल के बजाय मुख्य रूप से रैखिक मिश्रित-प्रभाव मॉडल (एलएमईएम) पर चर्चा करेगा।

इतिहास और वर्तमान स्थिति

रोनाल्ड फिशर ने रिश्तेदारों के बीच गुण मूल्यों के सहसंबंधों का अध्ययन करने के लिए यादृच्छिक प्रभाव मॉडल पेश किए।[3] 1950 के दशक में, चार्ल्स रॉय हेंडरसन निश्चित प्रभाव अनुमानक का गॉस-मार्कोव प्रमेय और यादृच्छिक प्रभावों की सर्वोत्तम रैखिक निष्पक्ष भविष्यवाणियाँ प्रदान की गईं।[4][5][6][7] इसके बाद, मिश्रित मॉडलिंग सांख्यिकीय अनुसंधान का एक प्रमुख क्षेत्र बन गया है, जिसमें अधिकतम संभावना अनुमान, गैर-रेखीय मिश्रित प्रभाव मॉडल, मिश्रित प्रभाव मॉडल में लापता डेटा और मिश्रित प्रभाव मॉडल के बायेसियन सांख्यिकी अनुमान की गणना पर काम शामिल है। मिश्रित मॉडल कई विषयों में लागू किए जाते हैं जहां रुचि की प्रत्येक इकाई पर कई सहसंबद्ध माप किए जाते हैं। आनुवंशिकी से लेकर विपणन तक के क्षेत्रों में मानव और पशु विषयों से जुड़े अनुसंधान में इनका प्रमुखता से उपयोग किया जाता है, और बेसबॉल में भी इसका उपयोग किया गया है[8] और औद्योगिक आँकड़े।[9]


परिभाषा

मैट्रिक्स नोटेशन#नोटेशन में एक रैखिक मिश्रित मॉडल को इस प्रकार दर्शाया जा सकता है

कहाँ

  • माध्य के साथ प्रेक्षणों का एक ज्ञात वेक्टर है ;
  • निश्चित प्रभावों का एक अज्ञात वेक्टर है;
  • माध्य के साथ यादृच्छिक प्रभावों का एक अज्ञात वेक्टर है और सहप्रसरण मैट्रिक्स|विचरण-सहप्रसरण मैट्रिक्स ;
  • माध्य के साथ यादृच्छिक त्रुटियों का एक अज्ञात वेक्टर है और विचरण ;
  • और अवलोकनों से संबंधित डिज़ाइन मैट्रिक्स ज्ञात हैं को और , क्रमश।

अनुमान

का संयुक्त घनत्व और इस प्रकार लिखा जा सकता है: . सामान्यता मानते हुए, , और , और संयुक्त घनत्व को अधिकतम करना और , रैखिक मिश्रित मॉडल के लिए हेंडरसन के मिश्रित मॉडल समीकरण (एमएमई) देता है:[4][6][10]

एमएमई के समाधान, और के लिए सर्वोत्तम रैखिक निष्पक्ष अनुमान और भविष्यवक्ता हैं और , क्रमश। यह गॉस-मार्कोव प्रमेय का परिणाम है जब परिणाम का सशर्त भिन्नता पहचान मैट्रिक्स के लिए स्केलेबल नहीं है। जब सशर्त विचरण ज्ञात होता है, तो व्युत्क्रम विचरण भारित न्यूनतम वर्ग अनुमान सबसे अच्छा रैखिक निष्पक्ष अनुमान होता है। हालाँकि, सशर्त भिन्नता शायद ही कभी ज्ञात होती है। इसलिए एमएमई को हल करते समय विचरण और भारित पैरामीटर अनुमानों का संयुक्त रूप से अनुमान लगाना वांछनीय है।

ऐसे मिश्रित मॉडलों को फिट करने के लिए उपयोग की जाने वाली एक विधि अपेक्षा-अधिकतमकरण एल्गोरिदम (ईएम) है जहां विचरण घटकों को संयुक्त संभावना में न देखे गए उपद्रव पैरामीटर के रूप में माना जाता है।[11] वर्तमान में, यह विधि सांख्यिकीय सॉफ़्टवेयर जैसे कि पायथन (प्रोग्रामिंग भाषा) (राज्य मॉडल पैकेज) और एसएएस (सॉफ़्टवेयर) (प्रो मिश्रित) में लागू की गई है, और केवल आर (प्रोग्रामिंग भाषा) के एनएलएमई पैकेज एलएमई () में प्रारंभिक चरण के रूप में लागू की गई है। जब त्रुटियों का वितरण सामान्य होता है तो मिश्रित मॉडल समीकरणों का समाधान अधिकतम संभावना अनुमान होता है।[12][13] मिश्रित मॉडलों को फिट करने के लिए कई अन्य तरीके हैं, जिनमें शुरुआत में एमईएम का उपयोग करना और फिर न्यूटन-रेफसन (आर (प्रोग्रामिंग भाषा) पैकेज nlme द्वारा प्रयुक्त) शामिल है।[14] के lme()), केवल (निम्न-आयामी) विचरण-सहसंयोजक मापदंडों के आधार पर एक प्रोफाइल लॉग संभावना प्राप्त करने के लिए न्यूनतम वर्गों को दंडित किया गया , यानी, इसका मैट्रिक्स , और फिर उस कम उद्देश्य फ़ंक्शन के लिए आधुनिक प्रत्यक्ष अनुकूलन (आर (प्रोग्रामिंग भाषा) के एलएमई4 द्वारा प्रयुक्त)[15] पैकेज lmer() और जूलिया (प्रोग्रामिंग भाषा) पैकेज MixedModels.jl) और संभावना का प्रत्यक्ष अनुकूलन (उदाहरण के लिए R (प्रोग्रामिंग भाषा) के glmmTMB द्वारा उपयोग किया जाता है)। विशेष रूप से, जबकि हेंडरसन द्वारा प्रस्तावित विहित रूप सिद्धांत के लिए उपयोगी है, कई लोकप्रिय सॉफ़्टवेयर पैकेज विरल मैट्रिक्स विधियों (जैसे lme4 और MixedModels.jl) का लाभ उठाने के लिए संख्यात्मक गणना के लिए एक अलग फॉर्मूलेशन का उपयोग करते हैं।

यह भी देखें

संदर्भ

  1. Baltagi, Badi H. (2008). पैनल डेटा का अर्थमितीय विश्लेषण (Fourth ed.). New York: Wiley. pp. 54–55. ISBN 978-0-470-51886-1.
  2. 2.0 2.1 Gomes, Dylan G.E. (20 January 2022). "Should I use fixed effects or random effects when I have fewer than five levels of a grouping factor in a mixed-effects model?". PeerJ. 10: e12794. doi:10.7717/peerj.12794.
  3. Fisher, RA (1918). "मेंडेलियन विरासत की धारणा पर रिश्तेदारों के बीच सहसंबंध". Transactions of the Royal Society of Edinburgh. 52 (2): 399–433. doi:10.1017/S0080456800012163.
  4. 4.0 4.1 Robinson, G.K. (1991). "That BLUP is a Good Thing: The Estimation of Random Effects". Statistical Science. 6 (1): 15–32. doi:10.1214/ss/1177011926. JSTOR 2245695.
  5. C. R. Henderson; Oscar Kempthorne; S. R. Searle; C. M. von Krosigk (1959). "कटाई के अधीन अभिलेखों से पर्यावरण और आनुवंशिक प्रवृत्तियों का अनुमान". Biometrics. International Biometric Society. 15 (2): 192–218. doi:10.2307/2527669. JSTOR 2527669.
  6. 6.0 6.1 L. Dale Van Vleck. "Charles Roy Henderson, April 1, 1911 – March 14, 1989" (PDF). United States National Academy of Sciences.
  7. McLean, Robert A.; Sanders, William L.; Stroup, Walter W. (1991). "मिश्रित रैखिक मॉडल के लिए एक एकीकृत दृष्टिकोण". The American Statistician. American Statistical Association. 45 (1): 54–64. doi:10.2307/2685241. JSTOR 2685241.
  8. analytics guru and mixed model
  9. Mixed models in industry
  10. Henderson, C R (1973). "सर मूल्यांकन और आनुवंशिक रुझान" (PDF). Journal of Animal Science. American Society of Animal Science. 1973: 10–41. doi:10.1093/ansci/1973.Symposium.10. Retrieved 17 August 2014.
  11. Lindstrom, ML; Bates, DM (1988). "Newton–Raphson and EM algorithms for linear mixed-effects models for repeated-measures data". JASA. 83 (404): 1014–1021. doi:10.1080/01621459.1988.10478693.
  12. Laird, Nan M.; Ware, James H. (1982). "अनुदैर्ध्य डेटा के लिए यादृच्छिक-प्रभाव मॉडल". Biometrics. International Biometric Society. 38 (4): 963–974. doi:10.2307/2529876. JSTOR 2529876. PMID 7168798.
  13. Fitzmaurice, Garrett M.; Laird, Nan M.; Ware, James H. (2004). अनुप्रयुक्त अनुदैर्ध्य विश्लेषण. John Wiley & Sons. pp. 326–328.
  14. Pinheiro, J; Bates, DM (2006). एस और एस-प्लस में मिश्रित-प्रभाव वाले मॉडल. Statistics and Computing. New York: Springer Science & Business Media. doi:10.1007/b98882. ISBN 0-387-98957-9.
  15. Bates, D.; Maechler, M.; Bolker, B.; Walker, S. (2015). "Fitting Linear Mixed-Effects Models Using lme4". Journal of Statistical Software. 67 (1). doi:10.18637/jss.v067.i01.


अग्रिम पठन

  • Gałecki, Andrzej; Burzykowski, Tomasz (2013). Linear Mixed-Effects Models Using R: A Step-by-Step Approach. New York: Springer. ISBN 978-1-4614-3900-4.
  • Milliken, G. A.; Johnson, D. E. (1992). Analysis of Messy Data: Vol. I. Designed Experiments. New York: Chapman & Hall.
  • West, B. T.; Welch, K. B.; Galecki, A. T. (2007). Linear Mixed Models: A Practical Guide Using Statistical Software. New York: Chapman & Hall/CRC.