बायेसियन रैखिक प्रतिगमन: Difference between revisions

From Vigyanwiki
(text)
Line 4: Line 4:
{{Distinguish|बेयस रैखिक सांख्यिकी}}
{{Distinguish|बेयस रैखिक सांख्यिकी}}


'''बायेसियन रैखिक प्रतिगमन''' एक प्रकार का [[सशर्त मॉडल|विभेदक मॉडल]] है जिसमें चर का माध्य अन्य चर के रैखिक फलन द्वारा वर्णित किया जाता है, जिसका लक्ष्य प्रतिगमन गुणांक (साथ ही प्रतिगमन के वितरण का वर्णन करने वाले अन्य मापदण्ड) की पश्‍चीय संभाव्यता प्राप्त करना है।) और अंततः रिग्रेसैंड (अधिकांशतः <math>y</math> लेबल किया गया) की [[नमूना से बाहर|आउट-ऑफ़-सैंपल]] पूर्वानुमान की अनुमति देता है। प्रतिगामी मान का अवलोकन करती है (सामान्यतः<math>X</math>)। इस मॉडल का सबसे सरल और सबसे व्यापक रूप से उपयोग किया जाने वाला संस्करण ''सामान्य रैखिक मॉडल'' है, जिसमें <math>y</math> दिया गया <math>X</math> [[सामान्य वितरण|गाऊसी वितरित]] किया जाता है। इस मॉडल में, और मापदंडों के लिए पूर्ववर्ती संभाव्यता की विशेष पसंद के अनुसार - तथाकथित संयुग्मित पूर्ववर्ती - पश्च भाग को विश्लेषणात्मक रूप से पाया जा सकता है। अधिक अक्रमतः चुने गए पूर्ववर्तियों के साथ, सामान्यतः पीछे वाले का अनुमान लगाना पड़ता है।
'''बायेसियन रैखिक प्रतिगमन''' एक प्रकार का [[सशर्त मॉडल|विभेदक मॉडल]] है जिसमें चर का माध्य अन्य चर के रैखिक फलन द्वारा वर्णित किया जाता है, जिसका लक्ष्य प्रतिगमन गुणांक (साथ ही प्रतिगमन के वितरण का वर्णन करने वाले अन्य मापदण्ड) की पश्‍चीय संभाव्यता प्राप्त करना है।) और अंततः रिग्रेसैंड (अधिकांशतः <math>y</math> लेबल किया गया) की [[नमूना से बाहर|आउट-ऑफ़-सैंपल]] पूर्वानुमान की अनुमति देता है। प्रतिगामी मान का अवलोकन करती है (सामान्यतः<math>X</math>)। इस मॉडल का सबसे सरल और सबसे व्यापक रूप से उपयोग किया जाने वाला संस्करण ''सामान्य रैखिक मॉडल'' है, जिसमें <math>y</math> दिया गया <math>X</math> [[सामान्य वितरण|गाऊसी वितरित]] किया जाता है। इस मॉडल में, और मापदंडों के लिए पूर्ववर्ती संभाव्यता की विशेष पसंद के अनुसार - तथाकथित संयुग्मित पूर्ववर्ती - पश्च भाग को विश्लेषणात्मक रूप से पाया जा सकता है। अधिक अक्रमतः चुने गए पूर्ववर्तियों के साथ, सामान्यतः पश्च भाग का अनुमान लगाना पड़ता है।


==मॉडल सेटअप==
==मॉडल सेटअप==
Line 99: Line 99:
* [[स्पाइक और स्लैब चर चयन]]
* [[स्पाइक और स्लैब चर चयन]]
* [[कर्नेल नियमितीकरण की बायेसियन व्याख्या]]
* [[कर्नेल नियमितीकरण की बायेसियन व्याख्या]]
{{More footnotes|date=August 2011}}


==टिप्पणियाँ==
==टिप्पणियाँ==
{{Reflist}}
{{Reflist}}
==संदर्भ==
==संदर्भ==
* {{cite book |author-link=George E. P. Box |last=Box |first=G. E. P. |author2-link=George Tiao|last2=Tiao |first2=G. C. |year=1973 |title=Bayesian Inference in Statistical Analysis |publisher=Wiley |isbn=0-471-57428-7 }}
* {{cite book |author-link=George E. P. Box |last=Box |first=G. E. P. |author2-link=George Tiao|last2=Tiao |first2=G. C. |year=1973 |title=Bayesian Inference in Statistical Analysis |publisher=Wiley |isbn=0-471-57428-7 }}
Line 114: Line 110:
* {{cite book |first=Peter E. |last=Rossi |first2=Greg M. |last2=Allenby |first3=Robert |last3=McCulloch |title=Bayesian Statistics and Marketing |publisher=John Wiley & Sons |year=2006 |isbn=0470863676 }}
* {{cite book |first=Peter E. |last=Rossi |first2=Greg M. |last2=Allenby |first3=Robert |last3=McCulloch |title=Bayesian Statistics and Marketing |publisher=John Wiley & Sons |year=2006 |isbn=0470863676 }}
* {{cite book|author=O'Hagan, Anthony| title = Bayesian Inference| volume= 2B |series = Kendall's Advanced Theory of Statistics| year = 1994 | edition= First | isbn = 0-340-52922-9| publisher = Halsted}}
* {{cite book|author=O'Hagan, Anthony| title = Bayesian Inference| volume= 2B |series = Kendall's Advanced Theory of Statistics| year = 1994 | edition= First | isbn = 0-340-52922-9| publisher = Halsted}}
==बाहरी संबंध==
==बाहरी संबंध==
* [[b:en:R Programming/Linear Models#Bayesian estimation|Bayesian estimation of linear models (R programming wikibook)]]. Bayesian linear regression as implemented in [[R (programming language)|R]].
* [[b:en:R Programming/Linear Models#Bayesian estimation|Bayesian estimation of linear models (R programming wikibook)]]. Bayesian linear regression as implemented in [[R (programming language)|R]].
{{Least Squares and Regression Analysis}}
{{Statistics|correlation}}
[[Category: बायेसियन अनुमान|रैखिक प्रतिगमन]] [[Category: एकल-समीकरण विधियाँ (अर्थमिति)]]  
[[Category: बायेसियन अनुमान|रैखिक प्रतिगमन]] [[Category: एकल-समीकरण विधियाँ (अर्थमिति)]]  



Revision as of 13:13, 17 July 2023

बायेसियन रैखिक प्रतिगमन एक प्रकार का विभेदक मॉडल है जिसमें चर का माध्य अन्य चर के रैखिक फलन द्वारा वर्णित किया जाता है, जिसका लक्ष्य प्रतिगमन गुणांक (साथ ही प्रतिगमन के वितरण का वर्णन करने वाले अन्य मापदण्ड) की पश्‍चीय संभाव्यता प्राप्त करना है।) और अंततः रिग्रेसैंड (अधिकांशतः लेबल किया गया) की आउट-ऑफ़-सैंपल पूर्वानुमान की अनुमति देता है। प्रतिगामी मान का अवलोकन करती है (सामान्यतः)। इस मॉडल का सबसे सरल और सबसे व्यापक रूप से उपयोग किया जाने वाला संस्करण सामान्य रैखिक मॉडल है, जिसमें दिया गया गाऊसी वितरित किया जाता है। इस मॉडल में, और मापदंडों के लिए पूर्ववर्ती संभाव्यता की विशेष पसंद के अनुसार - तथाकथित संयुग्मित पूर्ववर्ती - पश्च भाग को विश्लेषणात्मक रूप से पाया जा सकता है। अधिक अक्रमतः चुने गए पूर्ववर्तियों के साथ, सामान्यतः पश्च भाग का अनुमान लगाना पड़ता है।

मॉडल सेटअप

मानक रैखिक प्रतिगमन समस्या पर विचार करें, जिसमें के लिए हम सशर्त संभाव्यता वितरण का माध्य निर्दिष्ट करते हैं दिया गया पूर्वानुमान सदिश :

जहाँ एक सदिश है, और स्वतंत्र और समान रूप से सामान्य वितरित यादृच्छिक चर:
यह निम्नलिखित संभाव्यता फलन से मेल खाता है:

सामान्य न्यूनतम वर्ग समाधान का उपयोग मूर-पेनरोज़ छद्म व्युत्क्रम का उपयोग करके गुणांक सदिश का अनुमान लगाने के लिए किया जाता है:
जहाँ , अभिकल्प आव्यूह है, जिसकी प्रत्येक पंक्ति पूर्वानुमान सदिश है; और -सदिश स्तंभ है,

यह बारंबारवादी दृष्टिकोण है, और यह मानता है कि कुछ सार्थक कहने के लिए पर्याप्त माप हैं, बायेसियन अनुमान दृष्टिकोण में, आँकड़े को पूर्ववर्ती संभाव्यता वितरण के रूप में अतिरिक्त जानकारी के साथ पूरक किया जाता है। मापदंडों के बारे में पश्‍चीय संभाव्यता प्राप्त करने के लिए बेयस प्रमेय के अनुसार मापदंडों और के बारे में पूर्ववर्ती धारणा को आँकड़े की संभाव्यता फलन के साथ जोड़ा जाता है। प्रांत और प्राथमिकता के आधार पर उपलब्ध जानकारी के आधार पर पूर्ववर्ती अलग-अलग कार्यात्मक रूप ले सकता है।

चूंकि आँकड़े में और दोनों सम्मिलित हैं केवल पर सशर्त के वितरण पर ध्यान केंद्रित करने के लिए औचित्य की आवश्यकता है। वास्तव में, "पूर्ण" बायेसियन विश्लेषण के लिए संयुक्त संभाव्यता पूर्ववर्ती के साथ की आवश्यकता होगी, जहाँ के वितरण के मापदंडों का प्रतीक है, केवल (अदृढ़) बहिर्जातता की धारणा के अनुसार ही संयुक्त संभाव्यता को में सम्मिलित किया जा सकता है।[1] बाद वाले हिस्से को सामान्यतः असंयुक्त मापदण्ड उत्पन्न की धारणा के अनुसार नजरअंदाज कर दिया जाता है। इससे भी अधिक, उत्कृष्ट धारणाओं के अनुसार चुने हुए माने जाते हैं (उदाहरण के लिए, डिज़ाइन किए गए प्रयोग में) और इसलिए मापदंडों के बिना ज्ञात संभाव्यता होती है।[2]

संयुग्मित पूर्ववर्ती के साथ

संयुग्मित पूर्ववर्ती वितरण

यादृच्छिक पूर्ववर्ती वितरण के लिए, पश्च वितरण के लिए कोई विश्लेषणात्मक समाधान नहीं हो सकता है। इस खंड में, हम तथाकथित संयुग्म पूर्ववर्ती पर विचार करेंगे जिसके लिए पश्च वितरण विश्लेषणात्मक रूप से प्राप्त किया जा सकता है।

पहले से इस संभाव्यता फलन से पहले संयुग्मित है यदि इसके संबंध में और समान कार्यात्मक रूप है, चूँकि लॉग-संभाव्यता द्विघात है , लॉग-संभाव्यता को फिर से लिखा जाता है जिससे कि संभाव्यता सामान्य हो जाए,

संभाव्यता को अब इस रूप में पुनः लिखा गया है
जहाँ
जहाँ प्रतिगमन गुणांकों की संख्या है.

यह पूर्ववर्ती के लिए विधि सुझाता है:

जहाँ व्युत्क्रम-गामा वितरण है
व्युत्क्रम-गामा वितरण लेख में प्रस्तुत संकेतन में, यह का घनत्व है और के साथ वितरण और के साथ पूर्ववर्ती मान के रूप में और , क्रमश समान रूप से, इसे स्केल्ड व्युत्क्रम ची-वर्ग वितरण के रूप में भी वर्णित किया जा सकता है,

आगे सशर्त पूर्ववर्ती घनत्व सामान्य वितरण है,

सामान्य वितरण के अंकन में, सशर्त पूर्ववर्ती वितरण है।

पश्च वितरण

पूर्ववर्ती अब निर्दिष्ट के साथ, पश्च वितरण को इस प्रकार व्यक्त किया जा सकता है

कुछ पुनर्व्यवस्था के साथ,[3] पश्च को फिर से लिखा जा सकता है जिससे कि पश्च माध्य मापदण्ड सदिश का न्यूनतम वर्ग अनुमानक और पूर्ववर्ती माध्य के रूप में व्यक्त किया जा सकता है, पूर्ववर्ती परिशुद्धता आव्यूह द्वारा इंगित पूर्ववर्ती की ताकत के साथ

उसे उचित ठहराने के लिए वास्तव में पश्च माध्य है, घातांक में द्विघात शब्दों को द्विघात रूप (सांख्यिकी) के रूप में फिर से व्यवस्थित किया जा सकता है .[4]

अब पश्च भाग को व्युत्क्रम-गामा वितरण के समय सामान्य वितरण के रूप में व्यक्त किया जा सकता है:

इसलिए, पश्च वितरण को निम्नानुसार प्राचलीकरण किया जा सकता है।
जहां दो कारक के घनत्व और वितरण के अनुरूप हैं, इनके द्वारा दिए गए मापदंडों के साथ

जो बायेसियन अनुमान को पूर्ववर्ती में निहित जानकारी और नमूने में निहित जानकारी के बीच समझौता दर्शाता है।

मॉडल साक्ष्य

मॉडल साक्ष्य मॉडल दिए गए आँकड़े की संभाव्यता है, इसे सीमांत संभाव्यता और पूर्ववर्ती पूर्वानुमानित घनत्व के रूप में भी जाना जाता है। यहां, मॉडल को संभाव्यता फलन द्वारा परिभाषित किया गया है और मापदंडों पर पूर्ववर्ती वितरण, अर्थात है। मॉडल साक्ष्य एक ही संख्या में अधिकृत करता है कि ऐसा मॉडल टिप्पणियों को कितनी अच्छी तरह समझाता है। इस खंड में प्रस्तुत बायेसियन रैखिक प्रतिगमन मॉडल के मॉडल साक्ष्य का उपयोग बायेसियन मॉडल तुलना द्वारा प्रतिस्पर्धी रैखिक मॉडल की तुलना करने के लिए किया जा सकता है। ये मॉडल पूर्वानुमान चर की संख्या और मान के साथ-साथ मॉडल मापदंडों पर उनके पूर्ववर्तियों में भिन्न हो सकते हैं। मॉडल साक्ष्य द्वारा मॉडल सम्मिश्रता को पहले से ही ध्यान में रखा गया है, क्योंकि यह और के सभी संभावित मान पर को एकीकृत करके मापदंडों को उपांतित पर रख देता है।

इस अभिन्न की गणना विश्लेषणात्मक रूप से की जा सकती है और समाधान निम्नलिखित समीकरण में दिया गया है।[5]
यहाँ गामा फलन को दर्शाता है। क्योंकि हमने पहले संयुग्म चुना है, सीमांत संभाव्यता की गणना यादृच्छिक मान और के लिए निम्नलिखित समानता का मूल्यांकन करके आसानी से की जा सकती है,
ध्यान दें कि यह समीकरण बेयस प्रमेय की पुनर्व्यवस्था के अलावा और कुछ नहीं है। पूर्ववर्ती, संभाव्यता और पश्च के लिए सूत्र सम्मिलित करने और परिणामी अभिव्यक्ति को सरल बनाने से ऊपर दी गई विश्लेषणात्मक अभिव्यक्ति प्राप्त होती है।

अन्य मामले

सामान्य तौर पर, विश्लेषणात्मक रूप से पश्च वितरण प्राप्त करना असंभव या अव्यावहारिक हो सकता है। हालाँकि, मोंटे कार्लो नमूनाकरण या वैरिएबल बेयस जैसी अनुमानित बायेसियन गणना विधि द्वारा पश्च भाग का अनुमान लगाना संभव है।[6]

विशेष मामला रिज प्रतिगमन कहा जाता है।

एक समान विश्लेषण बहुभिन्नरूपी प्रतिगमन के सामान्य मामले के लिए किया जा सकता है और इसका एक हिस्सा सहप्रसरण आव्यूह के बायेसियन अनुमान के लिए प्रदान करता है: बायेसियन बहुभिन्नरूपी रैखिक प्रतिगमन देखें।

यह भी देखें

टिप्पणियाँ

  1. See Jackman (2009), p. 101.
  2. See Gelman et al. (2013), p. 354.
  3. The intermediate steps of this computation can be found in O'Hagan (1994) at the beginning of the chapter on Linear models.
  4. The intermediate steps are in Fahrmeir et al. (2009) on page 188.
  5. The intermediate steps of this computation can be found in O'Hagan (1994) on page 257.
  6. Carlin and Louis(2008) and Gelman, et al. (2003) explain how to use sampling methods for Bayesian linear regression.

संदर्भ

  • Box, G. E. P.; Tiao, G. C. (1973). Bayesian Inference in Statistical Analysis. Wiley. ISBN 0-471-57428-7.
  • Carlin, Bradley P.; Louis, Thomas A. (2008). Bayesian Methods for Data Analysis (Third ed.). Boca Raton, FL: Chapman and Hall/CRC. ISBN 1-58488-697-8.
  • Fahrmeir, L.; Kneib, T.; Lang, S. (2009). Regression. Modelle, Methoden und Anwendungen (Second ed.). Heidelberg: Springer. doi:10.1007/978-3-642-01837-4. ISBN 978-3-642-01836-7.
  • Gelman, Andrew; et al. (2013). "Introduction to regression models". Bayesian Data Analysis (Third ed.). Boca Raton, FL: Chapman and Hall/CRC. pp. 353–380. ISBN 978-1-4398-4095-5.
  • Jackman, Simon (2009). "Regression models". Bayesian Analysis for the Social Sciences. Wiley. pp. 99–124. ISBN 978-0-470-01154-6.
  • Rossi, Peter E.; Allenby, Greg M.; McCulloch, Robert (2006). Bayesian Statistics and Marketing. John Wiley & Sons. ISBN 0470863676.
  • O'Hagan, Anthony (1994). Bayesian Inference. Kendall's Advanced Theory of Statistics. Vol. 2B (First ed.). Halsted. ISBN 0-340-52922-9.

बाहरी संबंध