मिश्रित मॉडल: Difference between revisions

From Vigyanwiki
(Created page with "{{Short description|Statistical model containing both fixed effects and random effects}} {{distinguish|mixture model}} {{Regression bar}} एक मिश्रित मॉ...")
 
No edit summary
 
(10 intermediate revisions by 3 users not shown)
Line 1: Line 1:
{{Short description|Statistical model containing both fixed effects and random effects}}
{{Short description|Statistical model containing both fixed effects and random effects}}
{{distinguish|mixture model}}
{{distinguish|मिश्रित नमूना}}
{{Regression bar}}
{{Regression bar}}
एक मिश्रित मॉडल, मिश्रित-प्रभाव मॉडल या मिश्रित त्रुटि-घटक मॉडल एक [[सांख्यिकीय मॉडल]] है जिसमें [[निश्चित प्रभाव]] और [[यादृच्छिक प्रभाव]] दोनों होते हैं।<ref>{{cite book |first=Badi H. |last=Baltagi |title=पैनल डेटा का अर्थमितीय विश्लेषण|location=New York |publisher=Wiley |edition=Fourth |year=2008 |isbn=978-0-470-51886-1 |pages=54–55 }}</ref><ref name="Gomes2022">{{cite journal |last1=Gomes |first1=Dylan G.E. |title=Should I use fixed effects or random effects when I have fewer than five levels of a grouping factor in a mixed-effects model? |journal=PeerJ |date=20 January 2022 |volume=10 |pages=e12794 |doi=10.7717/peerj.12794|doi-access=free }}</ref> ये मॉडल भौतिक, जैविक और सामाजिक विज्ञान के विविध विषयों में उपयोगी हैं।
'''मिश्रित मॉडल''' या मिश्रित त्रुटि-घटक मॉडल एक [[सांख्यिकीय मॉडल]] होता है जिसमें [[निश्चित प्रभाव]] और [[यादृच्छिक प्रभाव]] दोनों होते है।<ref>{{cite book |first=Badi H. |last=Baltagi |title=पैनल डेटा का अर्थमितीय विश्लेषण|location=New York |publisher=Wiley |edition=Fourth |year=2008 |isbn=978-0-470-51886-1 |pages=54–55 }}</ref><ref name="Gomes2022">{{cite journal |last1=Gomes |first1=Dylan G.E. |title=Should I use fixed effects or random effects when I have fewer than five levels of a grouping factor in a mixed-effects model? |journal=PeerJ |date=20 January 2022 |volume=10 |pages=e12794 |doi=10.7717/peerj.12794|doi-access=free }}</ref> यह मॉडल भौतिक, जैविक और सामाजिक विज्ञान के विविध विषयों में उपयोगी होता है। वह उन सेटिंग्स में विशेष रूप से उपयोगी होते है जहां बार-बार माप डिजाइन एक ही सांख्यिकीय इकाइयों (अनुदैर्ध्य अध्ययन) पर किए जाते है, या जहां माप संबंधित सांख्यिकीय इकाइयों के समूहों पर किए जाते है।<ref name="Gomes2022" /> अनुपस्थित मूल्यों को मिश्रित प्रभाव मॉडल अधिकांशतः अधिक पारंपरिक दृष्टिकोण विश्लेषण पर प्राथमिकता दी जाती है।  
वे उन सेटिंग्स में विशेष रूप से उपयोगी होते हैं जहां बार-बार माप डिजाइन एक ही सांख्यिकीय इकाइयों (अनुदैर्ध्य अध्ययन) पर किए जाते हैं, या जहां माप संबंधित सांख्यिकीय इकाइयों के समूहों पर किए जाते हैं।<ref name="Gomes2022" />लापता मूल्यों से निपटने में उनके लाभ के कारण, मिश्रित प्रभाव मॉडल को अक्सर अधिक पारंपरिक दृष्टिकोण जैसे कि विचरण के बार-बार माप विश्लेषण पर प्राथमिकता दी जाती है।


यह पृष्ठ [[सामान्यीकृत रैखिक मिश्रित मॉडल]] या गैर-रेखीय मिश्रित-प्रभाव मॉडल | गैर-रेखीय मिश्रित-प्रभाव मॉडल के बजाय मुख्य रूप से रैखिक मिश्रित-प्रभाव मॉडल (एलएमईएम) पर चर्चा करेगा।
यह पृष्ठ [[सामान्यीकृत रैखिक मिश्रित मॉडल]] या गैर-रेखीय मिश्रित-प्रभाव मॉडल के अतिरिक्त मुख्य रूप से रैखिक मिश्रित-प्रभाव मॉडल (एलएमईएम) पर तर्क करता है।


==इतिहास और वर्तमान स्थिति==
==इतिहास और वर्तमान स्थिति==


[[रोनाल्ड फिशर]] ने रिश्तेदारों के बीच गुण मूल्यों के सहसंबंधों का अध्ययन करने के लिए [[यादृच्छिक प्रभाव मॉडल]] पेश किए।<ref>{{cite journal | last=Fisher | first=RA | title=मेंडेलियन विरासत की धारणा पर रिश्तेदारों के बीच सहसंबंध| journal=Transactions of the Royal Society of Edinburgh | year=1918 | volume=52 | pages=399–433 | doi=10.1017/S0080456800012163 | issue=2| url=https://zenodo.org/record/1428666 }}</ref> 1950 के दशक में, [[चार्ल्स रॉय हेंडरसन]]
[[रोनाल्ड फिशर]] ने गुण मूल्यों के सहसंबंधों का अध्ययन करने के लिए [[यादृच्छिक प्रभाव मॉडल]] प्रस्तुत किया था।<ref>{{cite journal | last=Fisher | first=RA | title=मेंडेलियन विरासत की धारणा पर रिश्तेदारों के बीच सहसंबंध| journal=Transactions of the Royal Society of Edinburgh | year=1918 | volume=52 | pages=399–433 | doi=10.1017/S0080456800012163 | issue=2| url=https://zenodo.org/record/1428666 }}</ref> 1950 के दशक में, [[चार्ल्स रॉय हेंडरसन]] [[निश्चित प्रभाव अनुमानक]] का गॉस-मार्कोव प्रमेय और यादृच्छिक प्रभावों की सर्वोत्तम रैखिक निष्पक्ष भविष्यवाणियाँ प्रदान की गईं थी।<ref name=GKR1991>{{cite journal | last=Robinson | first=G.K. | title=That BLUP is a Good Thing: The Estimation of Random Effects | journal=Statistical Science | volume=6 | issue=1 | year=1991 | pages=15–32 | jstor=2245695 | doi=10.1214/ss/1177011926| doi-access=free }}</ref><ref>{{cite journal | title = कटाई के अधीन अभिलेखों से पर्यावरण और आनुवंशिक प्रवृत्तियों का अनुमान| journal = Biometrics | volume = 15 | year = 1959 |pages = 192–218 | jstor=2527669 |author1=C. R. Henderson |author2=Oscar Kempthorne |author3=S. R. Searle |author4=C. M. von Krosigk | doi = 10.2307/2527669 | issue = 2 | publisher = International Biometric Society}}</ref><ref name=LDVV1989>{{cite web | url = http://books.nap.edu/html/biomems/chenderson.pdf | title = Charles Roy Henderson, April 1, 1911 – March 14, 1989 | author = L. Dale Van Vleck | publisher = [[United States National Academy of Sciences]]}}</ref><ref>{{cite journal | last=McLean | first=Robert A. |author2=Sanders, William L. |author3=Stroup, Walter W.  | title= मिश्रित रैखिक मॉडल के लिए एक एकीकृत दृष्टिकोण| journal=The American Statistician | year=1991 | volume=45 | pages=54–64 | jstor=2685241 | doi=10.2307/2685241 | issue=1 | publisher=American Statistical Association}}</ref> इसके बाद, मिश्रित मॉडल सांख्यिकीय अनुसंधान का एक प्रमुख क्षेत्र बन गया था, जिसमें अधिकतम संभावना अनुमान, गैर-रेखीय मिश्रित प्रभाव मॉडल के बायेसियन सांख्यिकी अनुमान की गणना करना सम्मलित होता है। मिश्रित मॉडल कई विषयों में उपयुक्त किए जाते है जहां रुचि की प्रत्येक इकाई पर कई सहसंबद्ध माप किए जाते है। आनुवंशिकी से लेकर विपणन तक के क्षेत्रों में मानव और पशु विषयों से जुड़े अनुसंधान में इनका प्रमुखता से उपयोग किया जाता है।<ref>[http://www.cbssports.com/mlb/news/mlb-analytics-guru-who-could-be-the-next-nate-silver-has-a-revolutionary-new-stat/ analytics guru and mixed model]</ref><ref>[http://www.lexjansen.com/mwsug/1993/MWSUG93035.pdf Mixed models in industry]</ref>
[[निश्चित प्रभाव अनुमानक]] का गॉस-मार्कोव प्रमेय और यादृच्छिक प्रभावों की सर्वोत्तम रैखिक निष्पक्ष भविष्यवाणियाँ प्रदान की गईं।<ref name=GKR1991>{{cite journal | last=Robinson | first=G.K. | title=That BLUP is a Good Thing: The Estimation of Random Effects | journal=Statistical Science | volume=6 | issue=1 | year=1991 | pages=15–32 | jstor=2245695 | doi=10.1214/ss/1177011926| doi-access=free }}</ref><ref>{{cite journal | title = कटाई के अधीन अभिलेखों से पर्यावरण और आनुवंशिक प्रवृत्तियों का अनुमान| journal = Biometrics | volume = 15 | year = 1959 |pages = 192–218 | jstor=2527669 |author1=C. R. Henderson |author2=Oscar Kempthorne |author3=S. R. Searle |author4=C. M. von Krosigk | doi = 10.2307/2527669 | issue = 2 | publisher = International Biometric Society}}</ref><ref name=LDVV1989>{{cite web | url = http://books.nap.edu/html/biomems/chenderson.pdf | title = Charles Roy Henderson, April 1, 1911 – March 14, 1989 | author = L. Dale Van Vleck | publisher = [[United States National Academy of Sciences]]}}</ref><ref>{{cite journal | last=McLean | first=Robert A. |author2=Sanders, William L. |author3=Stroup, Walter W.  | title= मिश्रित रैखिक मॉडल के लिए एक एकीकृत दृष्टिकोण| journal=The American Statistician | year=1991 | volume=45 | pages=54–64 | jstor=2685241 | doi=10.2307/2685241 | issue=1 | publisher=American Statistical Association}}</ref> इसके बाद, मिश्रित मॉडलिंग सांख्यिकीय अनुसंधान का एक प्रमुख क्षेत्र बन गया है, जिसमें अधिकतम संभावना अनुमान, गैर-रेखीय मिश्रित प्रभाव मॉडल, मिश्रित प्रभाव मॉडल में लापता डेटा और मिश्रित प्रभाव मॉडल के बायेसियन सांख्यिकी अनुमान की गणना पर काम शामिल है। मिश्रित मॉडल कई विषयों में लागू किए जाते हैं जहां रुचि की प्रत्येक इकाई पर कई सहसंबद्ध माप किए जाते हैं। आनुवंशिकी से लेकर विपणन तक के क्षेत्रों में मानव और पशु विषयों से जुड़े अनुसंधान में इनका प्रमुखता से उपयोग किया जाता है, और बेसबॉल में भी इसका उपयोग किया गया है<ref>[http://www.cbssports.com/mlb/news/mlb-analytics-guru-who-could-be-the-next-nate-silver-has-a-revolutionary-new-stat/ analytics guru and mixed model]</ref> और औद्योगिक आँकड़े।<ref>[http://www.lexjansen.com/mwsug/1993/MWSUG93035.pdf Mixed models in industry]</ref>
 
 
==परिभाषा==
==परिभाषा==


मैट्रिक्स नोटेशन#नोटेशन में एक रैखिक मिश्रित मॉडल को इस प्रकार दर्शाया जा सकता है
आव्यूह संकेतन में एक रैखिक मिश्रित मॉडल को इस प्रकार दर्शाया जा सकता है


:<math>\boldsymbol{y} = X \boldsymbol{\beta} + Z \boldsymbol{u} + \boldsymbol{\epsilon}</math>
:<math>\boldsymbol{y} = X \boldsymbol{\beta} + Z \boldsymbol{u} + \boldsymbol{\epsilon}</math>
कहाँ
जहाँ


*<math>\boldsymbol{y}</math> माध्य के साथ प्रेक्षणों का एक ज्ञात वेक्टर है <math>E(\boldsymbol{y}) = X \boldsymbol{\beta}</math>;
*<math>\boldsymbol{y}</math> माध्य के साथ प्रेक्षणों का एक ज्ञात वेक्टर है <math>E(\boldsymbol{y}) = X \boldsymbol{\beta}</math>;
*<math>\boldsymbol{\beta}</math> निश्चित प्रभावों का एक अज्ञात वेक्टर है;
*<math>\boldsymbol{\beta}</math> निश्चित प्रभावों का एक अज्ञात वेक्टर है;
*<math>\boldsymbol{u}</math> माध्य के साथ यादृच्छिक प्रभावों का एक अज्ञात वेक्टर है <math>E(\boldsymbol{u})=\boldsymbol{0}</math> और सहप्रसरण मैट्रिक्स|विचरण-सहप्रसरण मैट्रिक्स <math>\operatorname{var}(\boldsymbol{u})=G</math>;
*<math>\boldsymbol{u}</math> माध्य के साथ यादृच्छिक प्रभावों का एक अज्ञात वेक्टर है <math>E(\boldsymbol{u})=\boldsymbol{0}</math> और विचरण-सहप्रसरण आव्यूह है <math>\operatorname{var}(\boldsymbol{u})=G</math>;
*<math>\boldsymbol{\epsilon}</math> माध्य के साथ यादृच्छिक त्रुटियों का एक अज्ञात वेक्टर है <math>E(\boldsymbol{\epsilon})=\boldsymbol{0}</math> और विचरण <math>\operatorname{var}(\boldsymbol{\epsilon})=R</math>;
*<math>\boldsymbol{\epsilon}</math> माध्य के साथ यादृच्छिक त्रुटियों का एक अज्ञात वेक्टर है <math>E(\boldsymbol{\epsilon})=\boldsymbol{0}</math> और विचरण है <math>\operatorname{var}(\boldsymbol{\epsilon})=R</math>;
*<math>X</math> और <math>Z</math> अवलोकनों से संबंधित [[डिज़ाइन मैट्रिक्स]] ज्ञात हैं <math>\boldsymbol{y}</math> को <math>\boldsymbol{\beta}</math> और <math>\boldsymbol{u}</math>, क्रमश।
*<math>X</math> और <math>Z</math> अवलोकनों से संबंधित [[डिज़ाइन मैट्रिक्स|डिज़ाइन आव्यूह]] <math>\boldsymbol{y}</math> को <math>\boldsymbol{\beta}</math> और <math>\boldsymbol{u}</math>, है।


==अनुमान==
==अनुमान==


का संयुक्त घनत्व <math>\boldsymbol{y}</math> और <math>\boldsymbol{u}</math> इस प्रकार लिखा जा सकता है: <math>f(\boldsymbol{y},\boldsymbol{u}) = f(\boldsymbol{y} | \boldsymbol{u}) \, f(\boldsymbol{u})</math>.
संयुक्त घनत्व <math>\boldsymbol{y}</math> और <math>\boldsymbol{u}</math> इस प्रकार लिखा जा सकता है: <math>f(\boldsymbol{y},\boldsymbol{u}) = f(\boldsymbol{y} | \boldsymbol{u}) \, f(\boldsymbol{u})</math>. सामान्यता, <math>\boldsymbol{u} \sim \mathcal{N}(\boldsymbol{0},G)</math>, <math>\boldsymbol{\epsilon} \sim \mathcal{N}(\boldsymbol{0},R)</math> और <math>\mathrm{Cov}(\boldsymbol{u},\boldsymbol{\epsilon})=\boldsymbol{0}</math>, और संयुक्त घनत्व को अधिकतम करते है <math>\boldsymbol{\beta}</math> और <math>\boldsymbol{u}</math>, रैखिक मिश्रित मॉडल के लिए हेंडरसन के मिश्रित मॉडल समीकरण (एमएमई) से हमे प्राप्त होता है:<ref name=GKR1991/><ref name=LDVV1989/><ref>{{cite journal |last=Henderson |first=C R |date=1973 |title=सर मूल्यांकन और आनुवंशिक रुझान|url=http://www.journalofanimalscience.org/content/1973/Symposium/10.full.pdf |journal=Journal of Animal Science |publisher=American Society of Animal Science |volume=1973 |pages=10–41 |access-date=17 August 2014|doi=10.1093/ansci/1973.Symposium.10 }}</ref>
सामान्यता मानते हुए, <math>\boldsymbol{u} \sim \mathcal{N}(\boldsymbol{0},G)</math>, <math>\boldsymbol{\epsilon} \sim \mathcal{N}(\boldsymbol{0},R)</math> और <math>\mathrm{Cov}(\boldsymbol{u},\boldsymbol{\epsilon})=\boldsymbol{0}</math>, और संयुक्त घनत्व को अधिकतम करना <math>\boldsymbol{\beta}</math> और <math>\boldsymbol{u}</math>, रैखिक मिश्रित मॉडल के लिए हेंडरसन के मिश्रित मॉडल समीकरण (एमएमई) देता है:<ref name=GKR1991/><ref name=LDVV1989/><ref>{{cite journal |last=Henderson |first=C R |date=1973 |title=सर मूल्यांकन और आनुवंशिक रुझान|url=http://www.journalofanimalscience.org/content/1973/Symposium/10.full.pdf |journal=Journal of Animal Science |publisher=American Society of Animal Science |volume=1973 |pages=10–41 |access-date=17 August 2014|doi=10.1093/ansci/1973.Symposium.10 }}</ref>
:<math>
:<math>
\begin{pmatrix}
\begin{pmatrix}
Line 44: Line 39:
\end{pmatrix}
\end{pmatrix}
</math>
</math>
एमएमई के समाधान, <math>\textstyle\hat{\boldsymbol{\beta}}</math> और <math>\textstyle\hat{\boldsymbol{u}}</math> के लिए सर्वोत्तम रैखिक निष्पक्ष अनुमान और भविष्यवक्ता हैं <math>\boldsymbol{\beta}</math> और <math>\boldsymbol{u}</math>, क्रमश। यह गॉस-मार्कोव प्रमेय का परिणाम है जब परिणाम का सशर्त भिन्नता पहचान मैट्रिक्स के लिए स्केलेबल नहीं है। जब [[सशर्त विचरण]] ज्ञात होता है, तो व्युत्क्रम विचरण भारित न्यूनतम वर्ग अनुमान सबसे अच्छा रैखिक निष्पक्ष अनुमान होता है। हालाँकि, सशर्त भिन्नता शायद ही कभी ज्ञात होती है। इसलिए एमएमई को हल करते समय विचरण और भारित पैरामीटर अनुमानों का संयुक्त रूप से अनुमान लगाना वांछनीय है।
एमएमई के समाधान, <math>\textstyle\hat{\boldsymbol{\beta}}</math> और <math>\textstyle\hat{\boldsymbol{u}}</math> के लिए सर्वोत्तम रैखिक निष्पक्ष अनुमान और भविष्यवक्ता है <math>\boldsymbol{\beta}</math> और <math>\boldsymbol{u}</math>,यह गॉस-मार्कोव प्रमेय का परिणाम होता है जब परिणाम का सशर्त भिन्नता पहचान आव्यूह के लिए स्केलेबल नहीं होता है। जब [[सशर्त विचरण]] ज्ञात होता है, तो व्युत्क्रम विचरण भारित न्यूनतम वर्ग अनुमान सबसे अच्छा रैखिक निष्पक्ष अनुमान होता है। चूँकि, सशर्त भिन्नता संभवतः ही कभी ज्ञात होती है। इसलिए एमएमई को हल करते समय विचरण और भारित पैरामीटर अनुमानों का संयुक्त रूप से अनुमान लगाना वांछनीय होता है।


ऐसे मिश्रित मॉडलों को फिट करने के लिए उपयोग की जाने वाली एक विधि अपेक्षा-अधिकतमकरण एल्गोरिदम (ईएम) है जहां विचरण घटकों को संयुक्त संभावना में न देखे गए [[उपद्रव पैरामीटर]] के रूप में माना जाता है।<ref>{{cite journal | title=Newton–Raphson and EM algorithms for linear mixed-effects models for repeated-measures data | last=Lindstrom | first=ML |author2=Bates, DM | journal=JASA | volume=83 | year=1988 | pages=1014–1021 | issue=404 | doi=10.1080/01621459.1988.10478693}}</ref> वर्तमान में, यह विधि सांख्यिकीय सॉफ़्टवेयर जैसे कि [[पायथन (प्रोग्रामिंग भाषा)]] ([[राज्य मॉडल]] पैकेज) और एसएएस (सॉफ़्टवेयर) (प्रो मिश्रित) में लागू की गई है, और केवल [[आर (प्रोग्रामिंग भाषा)]] के एनएलएमई पैकेज एलएमई () में प्रारंभिक चरण के रूप में लागू की गई है। जब त्रुटियों का वितरण सामान्य होता है तो मिश्रित मॉडल समीकरणों का समाधान [[अधिकतम संभावना अनुमान]] होता है।<ref>{{cite journal | title=अनुदैर्ध्य डेटा के लिए यादृच्छिक-प्रभाव मॉडल| last=Laird | first=Nan M. |author2=Ware, James H. | journal=Biometrics | volume=38 | year=1982 | pages=963–974 | jstor=2529876 | doi=10.2307/2529876 | issue=4 | publisher=International Biometric Society | pmid=7168798}}</ref><ref>{{cite book |first1=Garrett M. |last1=Fitzmaurice |first2=Nan M. |last2=Laird |first3=James H. |last3=Ware |year=2004 |title=अनुप्रयुक्त अनुदैर्ध्य विश्लेषण|publisher=John Wiley & Sons |pages=326–328 }}</ref>
ऐसे मिश्रित मॉडल का उपयोग एक विधि अपेक्षा-अधिकतमकरण कलन विधि (ईएम) में किया जाता है जहां विचरण घटकों को [[उपद्रव पैरामीटर]] के रूप में माना जाता है।<ref>{{cite journal | title=Newton–Raphson and EM algorithms for linear mixed-effects models for repeated-measures data | last=Lindstrom | first=ML |author2=Bates, DM | journal=JASA | volume=83 | year=1988 | pages=1014–1021 | issue=404 | doi=10.1080/01621459.1988.10478693}}</ref> वर्तमान में, यह विधि सांख्यिकीय सॉफ्टवेयर जैसे कि [[पायथन (प्रोग्रामिंग भाषा)]] और एसएएस (सॉफ्टवेयर) (प्रो मिश्रित) में उपयुक्त की गई है, और केवल [[आर (प्रोग्रामिंग भाषा)]] के एनएलएमई पैकेज एलएमई () में प्रारंभिक चरण के रूप में उपयुक्त की गई है। जब त्रुटियों का वितरण सामान्य होता है तो मिश्रित मॉडल समीकरणों का समाधान [[अधिकतम संभावना अनुमान|अधिकतम अनुमानित]] होता है।<ref>{{cite journal | title=अनुदैर्ध्य डेटा के लिए यादृच्छिक-प्रभाव मॉडल| last=Laird | first=Nan M. |author2=Ware, James H. | journal=Biometrics | volume=38 | year=1982 | pages=963–974 | jstor=2529876 | doi=10.2307/2529876 | issue=4 | publisher=International Biometric Society | pmid=7168798}}</ref><ref>{{cite book |first1=Garrett M. |last1=Fitzmaurice |first2=Nan M. |last2=Laird |first3=James H. |last3=Ware |year=2004 |title=अनुप्रयुक्त अनुदैर्ध्य विश्लेषण|publisher=John Wiley & Sons |pages=326–328 }}</ref>
मिश्रित मॉडलों को फिट करने के लिए कई अन्य तरीके हैं, जिनमें शुरुआत में एमईएम का उपयोग करना और फिर न्यूटन-रेफसन (आर (प्रोग्रामिंग भाषा) पैकेज nlme द्वारा प्रयुक्त) शामिल है।<ref name="pinheiro_bates2006">{{cite book |last1=Pinheiro|first1=J |last2=Bates |first2=DM |year=2006 |title=एस और एस-प्लस में मिश्रित-प्रभाव वाले मॉडल|series=Statistics and Computing |location=New York |publisher=Springer Science & Business Media |doi=10.1007/b98882 |isbn=0-387-98957-9 }}</ref> के lme()), केवल (निम्न-आयामी) विचरण-सहसंयोजक मापदंडों के आधार पर एक प्रोफाइल लॉग संभावना प्राप्त करने के लिए न्यूनतम वर्गों को दंडित किया गया <math>\boldsymbol{u}</math>, यानी, इसका मैट्रिक्स <math>\boldsymbol{G}</math>, और फिर उस कम उद्देश्य फ़ंक्शन के लिए आधुनिक प्रत्यक्ष अनुकूलन (आर (प्रोग्रामिंग भाषा) के एलएमई4 द्वारा प्रयुक्त)<ref>{{cite journal | title=Fitting Linear Mixed-Effects Models Using lme4 | last=Bates | first=D. | author2=Maechler, M. | author3=Bolker, B. | author4=Walker, S. | journal=Journal of Statistical Software | volume=67 | year=2015 | issue=1 | doi=10.18637/jss.v067.i01 | doi-access=free }}</ref> पैकेज lmer() और [[जूलिया (प्रोग्रामिंग भाषा)]] पैकेज MixedModels.jl) और संभावना का प्रत्यक्ष अनुकूलन (उदाहरण के लिए R (प्रोग्रामिंग भाषा) के glmmTMB द्वारा उपयोग किया जाता है)। विशेष रूप से, जबकि हेंडरसन द्वारा प्रस्तावित विहित रूप सिद्धांत के लिए उपयोगी है, कई लोकप्रिय सॉफ़्टवेयर पैकेज विरल मैट्रिक्स विधियों (जैसे lme4 और MixedModels.jl) का लाभ उठाने के लिए संख्यात्मक गणना के लिए एक अलग फॉर्मूलेशन का उपयोग करते हैं।
 
मिश्रित मॉडल को उपयुक्त करने के लिए कई अन्य विधियां होती है, जिनमें प्रारंभ में एमईएम का उपयोग करना और फिर न्यूटन-रेफसन (आर (प्रोग्रामिंग भाषा) पैकेज नाइम द्वारा प्रयुक्त) सम्मलित होते है।<ref name="pinheiro_bates2006">{{cite book |last1=Pinheiro|first1=J |last2=Bates |first2=DM |year=2006 |title=एस और एस-प्लस में मिश्रित-प्रभाव वाले मॉडल|series=Statistics and Computing |location=New York |publisher=Springer Science & Business Media |doi=10.1007/b98882 |isbn=0-387-98957-9 }}</ref> lme()), केवल (निम्न-आयामी) विचरण-सहसंयोजक मापदंडों के आधार पर एक रूपरेखा लॉग संभावना प्राप्त करने के लिए न्यूनतम वर्गों को उपयुक्त किया जाता है <math>\boldsymbol{u}</math>, अर्थात, इसका आव्यूह है <math>\boldsymbol{G}</math>, और फिर उस कम उद्देश्य फ़ंक्शन के लिए आधुनिक प्रत्यक्ष अनुकूलन R (प्रोग्रामिंग भाषा) के LME4 द्वारा प्रयुक्त) पैकेज lmer() और [[जूलिया (प्रोग्रामिंग भाषा)]] पैकेज मिश्रित मॉडल) और संभावना का प्रत्यक्ष अनुकूलन (उदाहरण के लिए R (प्रोग्रामिंग भाषा) के glmmTMB द्वारा उपयोग किया जाता है। विशेष रूप से, हेंडरसन द्वारा प्रस्तावित विहित रूप सिद्धांत मिश्रित मॉडल के लिए उपयोगी होता है, कई लोकप्रिय सॉफ्टवेयर पैकेज विरल आव्यूह विधियों (जैसे lme4 और मिश्रित मॉडल.jl) का लाभ उठाने के लिए संख्यात्मक गणना के लिए एक अलग सूत्रीकरण का उपयोग करते है।


==यह भी देखें==
==यह भी देखें==
Line 69: Line 65:
*{{cite book |last1=West |first1=B. T. |last2=Welch |first2=K. B. |last3=Galecki |first3=A. T. |year=2007 |title=Linear Mixed Models: A Practical Guide Using Statistical Software |location=New York |publisher=Chapman & Hall/CRC }}
*{{cite book |last1=West |first1=B. T. |last2=Welch |first2=K. B. |last3=Galecki |first3=A. T. |year=2007 |title=Linear Mixed Models: A Practical Guide Using Statistical Software |location=New York |publisher=Chapman & Hall/CRC }}


{{DEFAULTSORT:Mixed Model}}[[Category: प्रतिगमन मॉडल]] [[Category: भिन्नता का विश्लेषण]]
{{DEFAULTSORT:Mixed Model}}
 
 


[[Category: Machine Translated Page]]
[[Category:Articles with hatnote templates targeting a nonexistent page|Mixed Model]]
[[Category:Created On 07/07/2023]]
[[Category:Created On 07/07/2023|Mixed Model]]
[[Category:Lua-based templates|Mixed Model]]
[[Category:Machine Translated Page|Mixed Model]]
[[Category:Pages with empty portal template|Mixed Model]]
[[Category:Pages with script errors|Mixed Model]]
[[Category:Portal-inline template with redlinked portals|Mixed Model]]
[[Category:Short description with empty Wikidata description|Mixed Model]]
[[Category:Templates Vigyan Ready|Mixed Model]]
[[Category:Templates that add a tracking category|Mixed Model]]
[[Category:Templates that generate short descriptions|Mixed Model]]
[[Category:Templates using TemplateData|Mixed Model]]
[[Category:प्रतिगमन मॉडल|Mixed Model]]
[[Category:भिन्नता का विश्लेषण|Mixed Model]]

Latest revision as of 17:57, 10 August 2023

मिश्रित मॉडल या मिश्रित त्रुटि-घटक मॉडल एक सांख्यिकीय मॉडल होता है जिसमें निश्चित प्रभाव और यादृच्छिक प्रभाव दोनों होते है।[1][2] यह मॉडल भौतिक, जैविक और सामाजिक विज्ञान के विविध विषयों में उपयोगी होता है। वह उन सेटिंग्स में विशेष रूप से उपयोगी होते है जहां बार-बार माप डिजाइन एक ही सांख्यिकीय इकाइयों (अनुदैर्ध्य अध्ययन) पर किए जाते है, या जहां माप संबंधित सांख्यिकीय इकाइयों के समूहों पर किए जाते है।[2] अनुपस्थित मूल्यों को मिश्रित प्रभाव मॉडल अधिकांशतः अधिक पारंपरिक दृष्टिकोण विश्लेषण पर प्राथमिकता दी जाती है।

यह पृष्ठ सामान्यीकृत रैखिक मिश्रित मॉडल या गैर-रेखीय मिश्रित-प्रभाव मॉडल के अतिरिक्त मुख्य रूप से रैखिक मिश्रित-प्रभाव मॉडल (एलएमईएम) पर तर्क करता है।

इतिहास और वर्तमान स्थिति

रोनाल्ड फिशर ने गुण मूल्यों के सहसंबंधों का अध्ययन करने के लिए यादृच्छिक प्रभाव मॉडल प्रस्तुत किया था।[3] 1950 के दशक में, चार्ल्स रॉय हेंडरसन निश्चित प्रभाव अनुमानक का गॉस-मार्कोव प्रमेय और यादृच्छिक प्रभावों की सर्वोत्तम रैखिक निष्पक्ष भविष्यवाणियाँ प्रदान की गईं थी।[4][5][6][7] इसके बाद, मिश्रित मॉडल सांख्यिकीय अनुसंधान का एक प्रमुख क्षेत्र बन गया था, जिसमें अधिकतम संभावना अनुमान, गैर-रेखीय मिश्रित प्रभाव मॉडल के बायेसियन सांख्यिकी अनुमान की गणना करना सम्मलित होता है। मिश्रित मॉडल कई विषयों में उपयुक्त किए जाते है जहां रुचि की प्रत्येक इकाई पर कई सहसंबद्ध माप किए जाते है। आनुवंशिकी से लेकर विपणन तक के क्षेत्रों में मानव और पशु विषयों से जुड़े अनुसंधान में इनका प्रमुखता से उपयोग किया जाता है।[8][9]

परिभाषा

आव्यूह संकेतन में एक रैखिक मिश्रित मॉडल को इस प्रकार दर्शाया जा सकता है

जहाँ

  • माध्य के साथ प्रेक्षणों का एक ज्ञात वेक्टर है ;
  • निश्चित प्रभावों का एक अज्ञात वेक्टर है;
  • माध्य के साथ यादृच्छिक प्रभावों का एक अज्ञात वेक्टर है और विचरण-सहप्रसरण आव्यूह है ;
  • माध्य के साथ यादृच्छिक त्रुटियों का एक अज्ञात वेक्टर है और विचरण है ;
  • और अवलोकनों से संबंधित डिज़ाइन आव्यूह को और , है।

अनुमान

संयुक्त घनत्व और इस प्रकार लिखा जा सकता है: . सामान्यता, , और , और संयुक्त घनत्व को अधिकतम करते है और , रैखिक मिश्रित मॉडल के लिए हेंडरसन के मिश्रित मॉडल समीकरण (एमएमई) से हमे प्राप्त होता है:[4][6][10]

एमएमई के समाधान, और के लिए सर्वोत्तम रैखिक निष्पक्ष अनुमान और भविष्यवक्ता है और ,। यह गॉस-मार्कोव प्रमेय का परिणाम होता है जब परिणाम का सशर्त भिन्नता पहचान आव्यूह के लिए स्केलेबल नहीं होता है। जब सशर्त विचरण ज्ञात होता है, तो व्युत्क्रम विचरण भारित न्यूनतम वर्ग अनुमान सबसे अच्छा रैखिक निष्पक्ष अनुमान होता है। चूँकि, सशर्त भिन्नता संभवतः ही कभी ज्ञात होती है। इसलिए एमएमई को हल करते समय विचरण और भारित पैरामीटर अनुमानों का संयुक्त रूप से अनुमान लगाना वांछनीय होता है।

ऐसे मिश्रित मॉडल का उपयोग एक विधि अपेक्षा-अधिकतमकरण कलन विधि (ईएम) में किया जाता है जहां विचरण घटकों को उपद्रव पैरामीटर के रूप में माना जाता है।[11] वर्तमान में, यह विधि सांख्यिकीय सॉफ्टवेयर जैसे कि पायथन (प्रोग्रामिंग भाषा) और एसएएस (सॉफ्टवेयर) (प्रो मिश्रित) में उपयुक्त की गई है, और केवल आर (प्रोग्रामिंग भाषा) के एनएलएमई पैकेज एलएमई () में प्रारंभिक चरण के रूप में उपयुक्त की गई है। जब त्रुटियों का वितरण सामान्य होता है तो मिश्रित मॉडल समीकरणों का समाधान अधिकतम अनुमानित होता है।[12][13]

मिश्रित मॉडल को उपयुक्त करने के लिए कई अन्य विधियां होती है, जिनमें प्रारंभ में एमईएम का उपयोग करना और फिर न्यूटन-रेफसन (आर (प्रोग्रामिंग भाषा) पैकेज नाइम द्वारा प्रयुक्त) सम्मलित होते है।[14] lme()), केवल (निम्न-आयामी) विचरण-सहसंयोजक मापदंडों के आधार पर एक रूपरेखा लॉग संभावना प्राप्त करने के लिए न्यूनतम वर्गों को उपयुक्त किया जाता है , अर्थात, इसका आव्यूह है , और फिर उस कम उद्देश्य फ़ंक्शन के लिए आधुनिक प्रत्यक्ष अनुकूलन R (प्रोग्रामिंग भाषा) के LME4 द्वारा प्रयुक्त) पैकेज lmer() और जूलिया (प्रोग्रामिंग भाषा) पैकेज मिश्रित मॉडल) और संभावना का प्रत्यक्ष अनुकूलन (उदाहरण के लिए R (प्रोग्रामिंग भाषा) के glmmTMB द्वारा उपयोग किया जाता है। विशेष रूप से, हेंडरसन द्वारा प्रस्तावित विहित रूप सिद्धांत मिश्रित मॉडल के लिए उपयोगी होता है, कई लोकप्रिय सॉफ्टवेयर पैकेज विरल आव्यूह विधियों (जैसे lme4 और मिश्रित मॉडल.jl) का लाभ उठाने के लिए संख्यात्मक गणना के लिए एक अलग सूत्रीकरण का उपयोग करते है।

यह भी देखें

संदर्भ

  1. Baltagi, Badi H. (2008). पैनल डेटा का अर्थमितीय विश्लेषण (Fourth ed.). New York: Wiley. pp. 54–55. ISBN 978-0-470-51886-1.
  2. 2.0 2.1 Gomes, Dylan G.E. (20 January 2022). "Should I use fixed effects or random effects when I have fewer than five levels of a grouping factor in a mixed-effects model?". PeerJ. 10: e12794. doi:10.7717/peerj.12794.
  3. Fisher, RA (1918). "मेंडेलियन विरासत की धारणा पर रिश्तेदारों के बीच सहसंबंध". Transactions of the Royal Society of Edinburgh. 52 (2): 399–433. doi:10.1017/S0080456800012163.
  4. 4.0 4.1 Robinson, G.K. (1991). "That BLUP is a Good Thing: The Estimation of Random Effects". Statistical Science. 6 (1): 15–32. doi:10.1214/ss/1177011926. JSTOR 2245695.
  5. C. R. Henderson; Oscar Kempthorne; S. R. Searle; C. M. von Krosigk (1959). "कटाई के अधीन अभिलेखों से पर्यावरण और आनुवंशिक प्रवृत्तियों का अनुमान". Biometrics. International Biometric Society. 15 (2): 192–218. doi:10.2307/2527669. JSTOR 2527669.
  6. 6.0 6.1 L. Dale Van Vleck. "Charles Roy Henderson, April 1, 1911 – March 14, 1989" (PDF). United States National Academy of Sciences.
  7. McLean, Robert A.; Sanders, William L.; Stroup, Walter W. (1991). "मिश्रित रैखिक मॉडल के लिए एक एकीकृत दृष्टिकोण". The American Statistician. American Statistical Association. 45 (1): 54–64. doi:10.2307/2685241. JSTOR 2685241.
  8. analytics guru and mixed model
  9. Mixed models in industry
  10. Henderson, C R (1973). "सर मूल्यांकन और आनुवंशिक रुझान" (PDF). Journal of Animal Science. American Society of Animal Science. 1973: 10–41. doi:10.1093/ansci/1973.Symposium.10. Retrieved 17 August 2014.
  11. Lindstrom, ML; Bates, DM (1988). "Newton–Raphson and EM algorithms for linear mixed-effects models for repeated-measures data". JASA. 83 (404): 1014–1021. doi:10.1080/01621459.1988.10478693.
  12. Laird, Nan M.; Ware, James H. (1982). "अनुदैर्ध्य डेटा के लिए यादृच्छिक-प्रभाव मॉडल". Biometrics. International Biometric Society. 38 (4): 963–974. doi:10.2307/2529876. JSTOR 2529876. PMID 7168798.
  13. Fitzmaurice, Garrett M.; Laird, Nan M.; Ware, James H. (2004). अनुप्रयुक्त अनुदैर्ध्य विश्लेषण. John Wiley & Sons. pp. 326–328.
  14. Pinheiro, J; Bates, DM (2006). एस और एस-प्लस में मिश्रित-प्रभाव वाले मॉडल. Statistics and Computing. New York: Springer Science & Business Media. doi:10.1007/b98882. ISBN 0-387-98957-9.


अग्रिम पठन

  • Gałecki, Andrzej; Burzykowski, Tomasz (2013). Linear Mixed-Effects Models Using R: A Step-by-Step Approach. New York: Springer. ISBN 978-1-4614-3900-4.
  • Milliken, G. A.; Johnson, D. E. (1992). Analysis of Messy Data: Vol. I. Designed Experiments. New York: Chapman & Hall.
  • West, B. T.; Welch, K. B.; Galecki, A. T. (2007). Linear Mixed Models: A Practical Guide Using Statistical Software. New York: Chapman & Hall/CRC.