सर्वोत्तम रैखिक निष्पक्ष प्रागुक्ति: Difference between revisions
(text) |
(text) |
||
Line 1: | Line 1: | ||
आंकड़ों में, [[यादृच्छिक प्रभाव मॉडल|यादृच्छिक प्रभावों]] के आकलन के लिए रैखिक [[मिश्रित मॉडल]] में '''सर्वोत्तम रैखिक निष्पक्ष प्रागुक्ति''' (बीएलयूपी) का उपयोग किया जाता है। बीएलयूपी की उत्पत्ति 1950 में [[चार्ल्स रॉय हेंडरसन]] द्वारा की गई थी, लेकिन "सर्वोत्तम रैखिक निष्पक्ष प्राग्वक्ता" (या प्रागुक्ति) शब्द का उपयोग 1962 तक नहीं किया गया था।<ref name=Robinson>{{cite journal |last=Robinson |first=G.K. |year=1991 |title=That BLUP is a Good Thing: The Estimation of Random Effects |journal=[[Statistical Science]] |volume=6 |issue=1 |pages=15–32 |doi=10.1214/ss/1177011926 |mr=1108815 |zbl=0955.62500 |jstor=2245695|doi-access=free }}</ref> यादृच्छिक प्रभावों की "सर्वोत्तम रैखिक निष्पक्ष प्रागुक्तियाँ" (बीएलयूपी) निश्चित प्रभावों के सर्वोत्तम रैखिक निष्पक्ष अनुमानों (बीएलयूई) (गॉस-मार्कोव प्रमेय देखें) के समान हैं। अंतर इसलिए उत्पन्न होता है क्योंकि निश्चित प्रभावों का अनुमान लगाने के बारे में नहीं बल्कि यादृच्छिक प्रभावों की प्रागुक्ति करने के बारे में बात करना पारंपरिक है, लेकिन दोनों शब्द अन्यथा समकक्ष हैं। (यह थोड़ा अजीब है क्योंकि यादृच्छिक प्रभावों को पहले ही "एहसास" हो चुका है; वे पहले से ही | आंकड़ों में, [[यादृच्छिक प्रभाव मॉडल|यादृच्छिक प्रभावों]] के आकलन के लिए रैखिक [[मिश्रित मॉडल]] में '''सर्वोत्तम रैखिक निष्पक्ष प्रागुक्ति''' (बीएलयूपी) का उपयोग किया जाता है। बीएलयूपी की उत्पत्ति 1950 में [[चार्ल्स रॉय हेंडरसन]] द्वारा की गई थी, लेकिन "सर्वोत्तम रैखिक निष्पक्ष प्राग्वक्ता" (या प्रागुक्ति) शब्द का उपयोग 1962 तक नहीं किया गया था।<ref name=Robinson>{{cite journal |last=Robinson |first=G.K. |year=1991 |title=That BLUP is a Good Thing: The Estimation of Random Effects |journal=[[Statistical Science]] |volume=6 |issue=1 |pages=15–32 |doi=10.1214/ss/1177011926 |mr=1108815 |zbl=0955.62500 |jstor=2245695|doi-access=free }}</ref> यादृच्छिक प्रभावों की "सर्वोत्तम रैखिक निष्पक्ष प्रागुक्तियाँ" (बीएलयूपी) निश्चित प्रभावों के सर्वोत्तम रैखिक निष्पक्ष अनुमानों (बीएलयूई) (गॉस-मार्कोव प्रमेय देखें) के समान हैं। अंतर इसलिए उत्पन्न होता है क्योंकि निश्चित प्रभावों का अनुमान लगाने के बारे में नहीं बल्कि यादृच्छिक प्रभावों की प्रागुक्ति करने के बारे में बात करना पारंपरिक है, लेकिन दोनों शब्द अन्यथा समकक्ष हैं। (यह थोड़ा अजीब है क्योंकि यादृच्छिक प्रभावों को पहले ही "एहसास" हो चुका है; वे पहले से ही सम्मिलित हैं। "प्रागुक्ति" शब्द का उपयोग इसलिए हो सकता है क्योंकि पशु प्रजनन के क्षेत्र में जिसमें हेंडरसन ने काम किया था, यादृच्छिक प्रभाव सामान्यतः आनुवंशिक योग्यता थे, जिसका उपयोग संतानों की गुणवत्ता की प्रागुक्ति करने के लिए उपयोग किया जाता है (रॉबिन्सन)।<ref name=Robinson/>पृष्ठ 28))। चूंकि, "निश्चित" प्रभावों और यादृच्छिक प्रभावों के समीकरण भिन्न हैं। | ||
व्यवहार में, | व्यवहार में, अधिकांशतः ऐसा होता है कि यादृच्छिक प्रभाव (शब्दों) से जुड़े मापदंड अज्ञात होते हैं; ये मापदंड यादृच्छिक प्रभावों और अवशेषों के भिन्नताएं हैं। सामान्यतः मापदंडों का अनुमान लगाया जाता है और प्राग्वक्ता में बंद किया जाता है, जिससे अनुभवजन्य सर्वोत्तम रैखिक निष्पक्ष प्राग्वक्ता (ईबीएलयूपी) प्राप्त होता है। ध्यान दें कि केवल अनुमानित मापदंड को प्राग्वक्ता में बंद करने से, अतिरिक्त परिवर्तनशीलता का पता नहीं चलता है, जिससे ईबीएलयूपी के लिए अत्यधिक आशावादी प्रागुक्ति भिन्नताएं उत्पन्न होती हैं। | ||
सर्वोत्तम रैखिक निष्पक्ष प्रागुक्तियाँ रैखिक मिश्रित मॉडल में यादृच्छिक प्रभावों के [[अनुभवजन्य बेयस]] अनुमानों के समान हैं, सिवाय इसके कि बाद के | सर्वोत्तम रैखिक निष्पक्ष प्रागुक्तियाँ रैखिक मिश्रित मॉडल में यादृच्छिक प्रभावों के [[अनुभवजन्य बेयस]] अनुमानों के समान हैं, सिवाय इसके कि बाद के स्थिति में, जहां वजन भिन्नता के घटकों के अज्ञात मानो पर निर्भर करते हैं, इन अज्ञात भिन्नताओं को नमूना-आधारित अनुमानों द्वारा प्रतिस्थापित किया जाता है। | ||
==उदाहरण== | ==उदाहरण== | ||
Line 9: | Line 9: | ||
:<math>Y_j= \mu + x_j^T\beta +\xi_j + \varepsilon_j, \, </math> के रूप में लिखा जाता है | :<math>Y_j= \mu + x_j^T\beta +\xi_j + \varepsilon_j, \, </math> के रूप में लिखा जाता है | ||
जहां <math>\mu</math> सभी अवलोकनों <math>Y</math> का माध्य है, और ξ<sub>j</sub>और ''ε<sub>j</sub>''<sub>j</sub>अवलोकन j के लिए यादृच्छिक प्रभाव और अवलोकन त्रुटि का प्रतिनिधित्व करते हैं, और मान लेते हैं कि वे असंबंधित हैं और क्रमशः ज्ञात भिन्नताएं σ<sub>ξ</sub><sup>2 और ''σ<sub>ε</sub>''<sup>2</sup>, हैं। इसके | जहां <math>\mu</math> सभी अवलोकनों <math>Y</math> का माध्य है, और ξ<sub>j</sub>और ''ε<sub>j</sub>''<sub>j</sub>अवलोकन j के लिए यादृच्छिक प्रभाव और अवलोकन त्रुटि का प्रतिनिधित्व करते हैं, और मान लेते हैं कि वे असंबंधित हैं और क्रमशः ज्ञात भिन्नताएं σ<sub>ξ</sub><sup>2 और ''σ<sub>ε</sub>''<sup>2</sup>, हैं। इसके अतिरिक्त, x<sub>j,</sub> ''j''वें अवलोकन के लिए [[आश्रित और स्वतंत्र चर]] का एक सदिश है <math>\beta</math> प्रतिगमन मापदंडों का एक सदिश है। | ||
''k''वें अवलोकन के लिए अवलोकन-त्रुटि-मुक्त मान का अनुमान प्रदान करने की बीएलयूपी समस्या, | ''k''वें अवलोकन के लिए अवलोकन-त्रुटि-मुक्त मान का अनुमान प्रदान करने की बीएलयूपी समस्या, | ||
Line 24: | Line 24: | ||
:<math>\operatorname{E}(\widetilde{Y}_k- \widehat{Y}_k)=0 . </math> | :<math>\operatorname{E}(\widetilde{Y}_k- \widehat{Y}_k)=0 . </math> | ||
==बीएलयूपी बनाम बीएलयूई== | ==बीएलयूपी बनाम बीएलयूई== | ||
सर्वोत्तम रैखिक निष्पक्ष अनुमानक के | सर्वोत्तम रैखिक निष्पक्ष अनुमानक के स्थिति के विपरीत, "अनुमानित की जाने वाली मात्रा", <math>\widetilde{Y}_k</math> में न केवल यादृच्छिक तत्व का योगदान है बल्कि देखी गई मात्राओं में से एक, विशेष रूप से <math>Y_k</math> का भी योगदान होता है। जो <math>\widehat{Y}_k</math> में योगदान देता है, उसी यादृच्छिक तत्व का भी योगदान है। | ||
बीएलयूई के विपरीत, बीएलयूपी ज्ञात या अनुमानित भिन्नताओं को ध्यान में रखता है।<ref>{{cite journal|last1=Stanek|first1=Edward J. III|last2=Well|first2=Arnold|last3=Ockene|first3=Ira|title=Why not routinely use best linear unbiased predictors (BLUPs) as estimates of cholesterol, per cent fat from kcal and physical activity?|journal=Statistics in Medicine|date=1999|volume=18|issue=21|pages=2943–2959|doi=10.1002/(sici)1097-0258(19991115)18:21<2943::aid-sim241>3.0.co;2-0|pmid=10523752}}</ref> | बीएलयूई के विपरीत, बीएलयूपी ज्ञात या अनुमानित भिन्नताओं को ध्यान में रखता है।<ref>{{cite journal|last1=Stanek|first1=Edward J. III|last2=Well|first2=Arnold|last3=Ockene|first3=Ira|title=Why not routinely use best linear unbiased predictors (BLUPs) as estimates of cholesterol, per cent fat from kcal and physical activity?|journal=Statistics in Medicine|date=1999|volume=18|issue=21|pages=2943–2959|doi=10.1002/(sici)1097-0258(19991115)18:21<2943::aid-sim241>3.0.co;2-0|pmid=10523752}}</ref> | ||
==प्रजनन में बीएलयूपी का इतिहास== | ==प्रजनन में बीएलयूपी का इतिहास== | ||
हेंडरसन ने सांख्यिकीय दृष्टिकोण से प्रजनन की खोज की थी। उनके काम ने [[सूचकांक चयन|सूचकांक]] (एसआई) और [[अनुमानित प्रजनन मूल्य|अनुमानित प्रजनन मान]] (ईबीवी) के विकास में सहायता की थी। इन सांख्यिकीय तरीकों ने संयुक्त राज्य अमेरिका में उपयोग की जाने वाली कृत्रिम गर्भाधान स्टड रैंकिंग को प्रभावित किया। ये प्रारंभिक सांख्यिकीय विधियां अब पशुधन प्रजनन में | हेंडरसन ने सांख्यिकीय दृष्टिकोण से प्रजनन की खोज की थी। उनके काम ने [[सूचकांक चयन|सूचकांक]] (एसआई) और [[अनुमानित प्रजनन मूल्य|अनुमानित प्रजनन मान]] (ईबीवी) के विकास में सहायता की थी। इन सांख्यिकीय तरीकों ने संयुक्त राज्य अमेरिका में उपयोग की जाने वाली कृत्रिम गर्भाधान स्टड रैंकिंग को प्रभावित किया। ये प्रारंभिक सांख्यिकीय विधियां अब पशुधन प्रजनन में सामान्यतः प्रचलित बीएलयूपी के साथ भ्रमित हैं। | ||
वास्तविक शब्द बीएलयूपी की उत्पत्ति कनाडा में गुएलफ विश्वविद्यालय में डैनियल सोरेंसन और ब्रायन कैनेडी के काम से हुई, जिसमें उन्होंने हेंडरसन के परिणामों को एक मॉडल तक बढ़ाया जिसमें चयन के कई चक्र | वास्तविक शब्द बीएलयूपी की उत्पत्ति कनाडा में गुएलफ विश्वविद्यालय में डैनियल सोरेंसन और ब्रायन कैनेडी के काम से हुई, जिसमें उन्होंने हेंडरसन के परिणामों को एक मॉडल तक बढ़ाया जिसमें चयन के कई चक्र सम्मिलित हैं।<ref>{{cite journal |last1=Sorensen |first1=D. A. |last2=Kennedy |first2=B. W. |title=न्यूनतम-वर्ग और मिश्रित मॉडल पद्धति का उपयोग करके चयन की प्रतिक्रिया का अनुमान|journal=Journal of Animal Science |date=1 May 1984 |volume=58 |issue=5 |pages=1097–1106 |doi=10.2527/jas1984.5851097x |url=https://academic.oup.com/jas/article-abstract/58/5/1097/4658306}}</ref> इस मॉडल को गुएल्फ़ विश्वविद्यालय द्वारा डेयरी उद्योग में बीएलयूपी नाम से लोकप्रिय बनाया गया था। विश्वविद्यालय द्वारा आगे के काम से पता चला कि ईबीवी और एसआई पर बीएलयूपी की श्रेष्ठता है जिसके कारण यह प्राथमिक आनुवंशिक प्राग्वक्ता बन गया है। | ||
इस प्रकार ऊपर लोकप्रिय बीएलयूपी मॉडल और सर्वोत्तम रैखिक निष्पक्ष प्रागुक्ति सांख्यिकीय पद्धति के बीच भ्रम है जो सामान्य उपयोग के लिए बहुत सैद्धांतिक था। यह मॉडल किसानों को कंप्यूटर पर उपयोग के लिए आपूर्ति किया गया था। | इस प्रकार ऊपर लोकप्रिय बीएलयूपी मॉडल और सर्वोत्तम रैखिक निष्पक्ष प्रागुक्ति सांख्यिकीय पद्धति के बीच भ्रम है जो सामान्य उपयोग के लिए बहुत सैद्धांतिक था। यह मॉडल किसानों को कंप्यूटर पर उपयोग के लिए आपूर्ति किया गया था। |
Revision as of 10:59, 17 December 2023
आंकड़ों में, यादृच्छिक प्रभावों के आकलन के लिए रैखिक मिश्रित मॉडल में सर्वोत्तम रैखिक निष्पक्ष प्रागुक्ति (बीएलयूपी) का उपयोग किया जाता है। बीएलयूपी की उत्पत्ति 1950 में चार्ल्स रॉय हेंडरसन द्वारा की गई थी, लेकिन "सर्वोत्तम रैखिक निष्पक्ष प्राग्वक्ता" (या प्रागुक्ति) शब्द का उपयोग 1962 तक नहीं किया गया था।[1] यादृच्छिक प्रभावों की "सर्वोत्तम रैखिक निष्पक्ष प्रागुक्तियाँ" (बीएलयूपी) निश्चित प्रभावों के सर्वोत्तम रैखिक निष्पक्ष अनुमानों (बीएलयूई) (गॉस-मार्कोव प्रमेय देखें) के समान हैं। अंतर इसलिए उत्पन्न होता है क्योंकि निश्चित प्रभावों का अनुमान लगाने के बारे में नहीं बल्कि यादृच्छिक प्रभावों की प्रागुक्ति करने के बारे में बात करना पारंपरिक है, लेकिन दोनों शब्द अन्यथा समकक्ष हैं। (यह थोड़ा अजीब है क्योंकि यादृच्छिक प्रभावों को पहले ही "एहसास" हो चुका है; वे पहले से ही सम्मिलित हैं। "प्रागुक्ति" शब्द का उपयोग इसलिए हो सकता है क्योंकि पशु प्रजनन के क्षेत्र में जिसमें हेंडरसन ने काम किया था, यादृच्छिक प्रभाव सामान्यतः आनुवंशिक योग्यता थे, जिसका उपयोग संतानों की गुणवत्ता की प्रागुक्ति करने के लिए उपयोग किया जाता है (रॉबिन्सन)।[1]पृष्ठ 28))। चूंकि, "निश्चित" प्रभावों और यादृच्छिक प्रभावों के समीकरण भिन्न हैं।
व्यवहार में, अधिकांशतः ऐसा होता है कि यादृच्छिक प्रभाव (शब्दों) से जुड़े मापदंड अज्ञात होते हैं; ये मापदंड यादृच्छिक प्रभावों और अवशेषों के भिन्नताएं हैं। सामान्यतः मापदंडों का अनुमान लगाया जाता है और प्राग्वक्ता में बंद किया जाता है, जिससे अनुभवजन्य सर्वोत्तम रैखिक निष्पक्ष प्राग्वक्ता (ईबीएलयूपी) प्राप्त होता है। ध्यान दें कि केवल अनुमानित मापदंड को प्राग्वक्ता में बंद करने से, अतिरिक्त परिवर्तनशीलता का पता नहीं चलता है, जिससे ईबीएलयूपी के लिए अत्यधिक आशावादी प्रागुक्ति भिन्नताएं उत्पन्न होती हैं।
सर्वोत्तम रैखिक निष्पक्ष प्रागुक्तियाँ रैखिक मिश्रित मॉडल में यादृच्छिक प्रभावों के अनुभवजन्य बेयस अनुमानों के समान हैं, सिवाय इसके कि बाद के स्थिति में, जहां वजन भिन्नता के घटकों के अज्ञात मानो पर निर्भर करते हैं, इन अज्ञात भिन्नताओं को नमूना-आधारित अनुमानों द्वारा प्रतिस्थापित किया जाता है।
उदाहरण
मान लीजिए कि प्रेक्षणों के लिए मॉडल {Yj ; j = 1, ..., n} को
- के रूप में लिखा जाता है
जहां सभी अवलोकनों का माध्य है, और ξjऔर εjjअवलोकन j के लिए यादृच्छिक प्रभाव और अवलोकन त्रुटि का प्रतिनिधित्व करते हैं, और मान लेते हैं कि वे असंबंधित हैं और क्रमशः ज्ञात भिन्नताएं σξ2 और σε2, हैं। इसके अतिरिक्त, xj, jवें अवलोकन के लिए आश्रित और स्वतंत्र चर का एक सदिश है प्रतिगमन मापदंडों का एक सदिश है।
kवें अवलोकन के लिए अवलोकन-त्रुटि-मुक्त मान का अनुमान प्रदान करने की बीएलयूपी समस्या,
आवश्यकता के अनुसार तैयार किया जा सकता है कि रैखिक प्राग्वक्ता के गुणांक को इस प्रकार परिभाषित किया गया है
प्रागुक्ति त्रुटि के विचरण को कम करने के लिए चुना जाना चाहिए,
इस स्थिति के अधीन कि प्राग्वक्ता निष्पक्ष है,
बीएलयूपी बनाम बीएलयूई
सर्वोत्तम रैखिक निष्पक्ष अनुमानक के स्थिति के विपरीत, "अनुमानित की जाने वाली मात्रा", में न केवल यादृच्छिक तत्व का योगदान है बल्कि देखी गई मात्राओं में से एक, विशेष रूप से का भी योगदान होता है। जो में योगदान देता है, उसी यादृच्छिक तत्व का भी योगदान है।
बीएलयूई के विपरीत, बीएलयूपी ज्ञात या अनुमानित भिन्नताओं को ध्यान में रखता है।[2]
प्रजनन में बीएलयूपी का इतिहास
हेंडरसन ने सांख्यिकीय दृष्टिकोण से प्रजनन की खोज की थी। उनके काम ने सूचकांक (एसआई) और अनुमानित प्रजनन मान (ईबीवी) के विकास में सहायता की थी। इन सांख्यिकीय तरीकों ने संयुक्त राज्य अमेरिका में उपयोग की जाने वाली कृत्रिम गर्भाधान स्टड रैंकिंग को प्रभावित किया। ये प्रारंभिक सांख्यिकीय विधियां अब पशुधन प्रजनन में सामान्यतः प्रचलित बीएलयूपी के साथ भ्रमित हैं।
वास्तविक शब्द बीएलयूपी की उत्पत्ति कनाडा में गुएलफ विश्वविद्यालय में डैनियल सोरेंसन और ब्रायन कैनेडी के काम से हुई, जिसमें उन्होंने हेंडरसन के परिणामों को एक मॉडल तक बढ़ाया जिसमें चयन के कई चक्र सम्मिलित हैं।[3] इस मॉडल को गुएल्फ़ विश्वविद्यालय द्वारा डेयरी उद्योग में बीएलयूपी नाम से लोकप्रिय बनाया गया था। विश्वविद्यालय द्वारा आगे के काम से पता चला कि ईबीवी और एसआई पर बीएलयूपी की श्रेष्ठता है जिसके कारण यह प्राथमिक आनुवंशिक प्राग्वक्ता बन गया है।
इस प्रकार ऊपर लोकप्रिय बीएलयूपी मॉडल और सर्वोत्तम रैखिक निष्पक्ष प्रागुक्ति सांख्यिकीय पद्धति के बीच भ्रम है जो सामान्य उपयोग के लिए बहुत सैद्धांतिक था। यह मॉडल किसानों को कंप्यूटर पर उपयोग के लिए आपूर्ति किया गया था।
कनाडा में, सभी डेयरियाँ राष्ट्रीय स्तर पर रिपोर्ट करती हैं। कनाडा में आनुवंशिकी को साझा किया गया जिससे यह सबसे बड़ा आनुवंशिक पूल बन गया और इस प्रकार सुधार का स्रोत बन गया था। इसने और बीएलयूपी होल्स्टीन फ़्रीज़ियन मवेशियों की गुणवत्ता में तेजी से वृद्धि किया था।
यह भी देखें
टिप्पणियाँ
- ↑ 1.0 1.1 Robinson, G.K. (1991). "That BLUP is a Good Thing: The Estimation of Random Effects". Statistical Science. 6 (1): 15–32. doi:10.1214/ss/1177011926. JSTOR 2245695. MR 1108815. Zbl 0955.62500.
- ↑ Stanek, Edward J. III; Well, Arnold; Ockene, Ira (1999). "Why not routinely use best linear unbiased predictors (BLUPs) as estimates of cholesterol, per cent fat from kcal and physical activity?". Statistics in Medicine. 18 (21): 2943–2959. doi:10.1002/(sici)1097-0258(19991115)18:21<2943::aid-sim241>3.0.co;2-0. PMID 10523752.
- ↑ Sorensen, D. A.; Kennedy, B. W. (1 May 1984). "न्यूनतम-वर्ग और मिश्रित मॉडल पद्धति का उपयोग करके चयन की प्रतिक्रिया का अनुमान". Journal of Animal Science. 58 (5): 1097–1106. doi:10.2527/jas1984.5851097x.
संदर्भ
- Henderson, C.R. (1975). "Best linear unbiased estimation and prediction under a selection model". Biometrics. 31 (2): 423–447. doi:10.2307/2529430. JSTOR 2529430. PMID 1174616.
- Liu, Xu-Qing; Rong, Jian-Ying; Liu, Xiu-Ying (2008). "Best linear unbiased prediction for linear combinations in general mixed linear models". Journal of Multivariate Analysis. 99 (8): 1503–1517. doi:10.1016/j.jmva.2008.01.004.