बायेसियन रैखिक प्रतिगमन: Difference between revisions
(text) |
|||
Line 4: | Line 4: | ||
{{Distinguish|बेयस रैखिक सांख्यिकी}} | {{Distinguish|बेयस रैखिक सांख्यिकी}} | ||
'''बायेसियन रैखिक प्रतिगमन''' एक प्रकार का [[सशर्त मॉडल|विभेदक मॉडल]] है जिसमें चर का माध्य अन्य चर के रैखिक फलन द्वारा वर्णित किया जाता है, जिसका लक्ष्य प्रतिगमन गुणांक (साथ ही प्रतिगमन के वितरण का वर्णन करने वाले अन्य मापदण्ड) की पश्चीय संभाव्यता प्राप्त करना है।) और अंततः रिग्रेसैंड( | '''बायेसियन रैखिक प्रतिगमन''' एक प्रकार का [[सशर्त मॉडल|विभेदक मॉडल]] है जिसमें चर का माध्य अन्य चर के रैखिक फलन द्वारा वर्णित किया जाता है, जिसका लक्ष्य प्रतिगमन गुणांक (साथ ही प्रतिगमन के वितरण का वर्णन करने वाले अन्य मापदण्ड) की पश्चीय संभाव्यता प्राप्त करना है।) और अंततः रिग्रेसैंड(अधिकांशतः<math>y</math> लेबल किया गया) की [[नमूना से बाहर|आउट-ऑफ़-सैंपल]] पूर्वानुमान की अनुमति देता है। प्रतिगामी मान का अवलोकन करती है (सामान्यतः<math>X</math>)। इस मॉडल का सबसे सरल और सबसे व्यापक रूप से उपयोग किया जाने वाला संस्करण ''सामान्य रैखिक मॉडल'' है, जिसमें <math>y</math> दिया गया <math>X</math> [[सामान्य वितरण|गाऊसी वितरित]] किया जाता है। इस मॉडल में, और मापदंडों के लिए पूर्ववर्ती संभाव्यता की विशेष पसंद के अनुसार - तथाकथित संयुग्मित पूर्ववर्ती - पश्च भाग को विश्लेषणात्मक रूप से पाया जा सकता है। अधिक अक्रमतः चुने गए पूर्ववर्तियों के साथ, सामान्यतः पीछे वाले का अनुमान लगाना पड़ता है। | ||
==मॉडल सेटअप== | ==मॉडल सेटअप== | ||
Line 20: | Line 20: | ||
यह बारंबारवादी दृष्टिकोण है, और यह मानता है कि कुछ सार्थक कहने के लिए <math>\boldsymbol\beta</math> पर्याप्त माप हैं, [[बायेसियन अनुमान]] दृष्टिकोण में, आँकड़े को [[पूर्व संभाव्यता वितरण|पूर्ववर्ती संभाव्यता वितरण]] के रूप में अतिरिक्त जानकारी के साथ पूरक किया जाता है। मापदंडों के बारे में पश्चीय संभाव्यता प्राप्त करने के लिए [[बेयस प्रमेय]] के अनुसार मापदंडों <math>\boldsymbol\beta</math> और <math>\sigma</math> के बारे में पूर्ववर्ती धारणा को आँकड़े की संभाव्यता फलन के साथ जोड़ा जाता है। प्रांत और प्राथमिकता के आधार पर उपलब्ध जानकारी के आधार पर पूर्ववर्ती अलग-अलग कार्यात्मक रूप ले सकता है। | यह बारंबारवादी दृष्टिकोण है, और यह मानता है कि कुछ सार्थक कहने के लिए <math>\boldsymbol\beta</math> पर्याप्त माप हैं, [[बायेसियन अनुमान]] दृष्टिकोण में, आँकड़े को [[पूर्व संभाव्यता वितरण|पूर्ववर्ती संभाव्यता वितरण]] के रूप में अतिरिक्त जानकारी के साथ पूरक किया जाता है। मापदंडों के बारे में पश्चीय संभाव्यता प्राप्त करने के लिए [[बेयस प्रमेय]] के अनुसार मापदंडों <math>\boldsymbol\beta</math> और <math>\sigma</math> के बारे में पूर्ववर्ती धारणा को आँकड़े की संभाव्यता फलन के साथ जोड़ा जाता है। प्रांत और प्राथमिकता के आधार पर उपलब्ध जानकारी के आधार पर पूर्ववर्ती अलग-अलग कार्यात्मक रूप ले सकता है। | ||
चूंकि आँकड़े में <math>\mathbf{y}</math> और <math>\mathbf{X}</math> दोनों | चूंकि आँकड़े में <math>\mathbf{y}</math> और <math>\mathbf{X}</math> दोनों सम्मिलित हैं केवल <math>\mathbf{X}</math> पर सशर्त <math>\mathbf{y}</math> के वितरण पर ध्यान केंद्रित करने के लिए औचित्य की आवश्यकता है। वास्तव में, "पूर्ण" बायेसियन विश्लेषण के लिए संयुक्त संभाव्यता <math>\rho(\mathbf{y},\mathbf{X}\mid\boldsymbol\beta,\sigma^{2},\gamma)</math> पूर्ववर्ती के साथ <math>\rho(\beta,\sigma^{2},\gamma)</math> की आवश्यकता होगी, जहाँ <math>\gamma</math> के वितरण के मापदंडों <math>\mathbf{X}</math> का प्रतीक है, केवल (अदृढ़) बहिर्जातता की धारणा के अनुसार ही संयुक्त संभाव्यता को <math>\rho(\mathbf{y}\mid\boldsymbol\mathbf{X},\beta,\sigma^{2})\rho(\mathbf{X}\mid\gamma)</math> में सम्मिलित किया जा सकता है।<ref>See Jackman (2009), p. 101.</ref> बाद वाले हिस्से को सामान्यतः असंयुक्त मापदण्ड उत्पन्न की धारणा के अनुसार नजरअंदाज कर दिया जाता है। इससे भी अधिक, क्लासिक धारणाओं के अनुसार <math>\mathbf{X}</math> चुने हुए माने जाते हैं (उदाहरण के लिए, डिज़ाइन किए गए प्रयोग में) और इसलिए मापदंडों के बिना ज्ञात संभाव्यता होती है।<ref>See Gelman et al. (2013), p. 354.</ref> | ||
==संयुग्मित पूर्ववर्ती के साथ== | ==संयुग्मित पूर्ववर्ती के साथ== | ||
Line 26: | Line 26: | ||
यादृच्छिक पूर्ववर्ती वितरण के लिए, [[पश्च वितरण]] के लिए कोई विश्लेषणात्मक समाधान नहीं हो सकता है। इस खंड में, हम तथाकथित संयुग्म पूर्ववर्ती पर विचार करेंगे जिसके लिए पश्च वितरण विश्लेषणात्मक रूप से प्राप्त किया जा सकता है। | यादृच्छिक पूर्ववर्ती वितरण के लिए, [[पश्च वितरण]] के लिए कोई विश्लेषणात्मक समाधान नहीं हो सकता है। इस खंड में, हम तथाकथित संयुग्म पूर्ववर्ती पर विचार करेंगे जिसके लिए पश्च वितरण विश्लेषणात्मक रूप से प्राप्त किया जा सकता है। | ||
पहले से <math>\rho(\boldsymbol\beta,\sigma^{2})</math> इस संभाव्यता फलन से पहले संयुग्मित है यदि इसके संबंध में <math>\boldsymbol\beta</math> और <math>\sigma</math>समान कार्यात्मक रूप है, चूँकि लॉग-संभाव्यता द्विघात है <math>\boldsymbol\beta</math>, लॉग-संभाव्यता को फिर से लिखा जाता है | पहले से <math>\rho(\boldsymbol\beta,\sigma^{2})</math> इस संभाव्यता फलन से पहले संयुग्मित है यदि इसके संबंध में <math>\boldsymbol\beta</math> और <math>\sigma</math>समान कार्यात्मक रूप है, चूँकि लॉग-संभाव्यता द्विघात है <math>\boldsymbol\beta</math>, लॉग-संभाव्यता को फिर से लिखा जाता है जिससे कि संभाव्यता <math>(\boldsymbol\beta-\hat{\boldsymbol\beta})</math> सामान्य हो जाए, | ||
<math display="block">\begin{align} | <math display="block">\begin{align} | ||
Line 59: | Line 59: | ||
& \propto (\sigma^2)^{-n/2} \exp\left(-\frac{1}{2{\sigma}^2}(\mathbf{y}- \mathbf{X} \boldsymbol\beta)^\mathsf{T}(\mathbf{y}- \mathbf{X} \boldsymbol\beta)\right) (\sigma^2)^{-k/2} \exp\left(-\frac{1}{2\sigma^2}(\boldsymbol\beta -\boldsymbol\mu_0)^\mathsf{T} \boldsymbol\Lambda_0 (\boldsymbol\beta - \boldsymbol\mu_0)\right) (\sigma^2)^{-(a_0+1)} \exp\left(-\frac{b_0}{\sigma^2}\right) | & \propto (\sigma^2)^{-n/2} \exp\left(-\frac{1}{2{\sigma}^2}(\mathbf{y}- \mathbf{X} \boldsymbol\beta)^\mathsf{T}(\mathbf{y}- \mathbf{X} \boldsymbol\beta)\right) (\sigma^2)^{-k/2} \exp\left(-\frac{1}{2\sigma^2}(\boldsymbol\beta -\boldsymbol\mu_0)^\mathsf{T} \boldsymbol\Lambda_0 (\boldsymbol\beta - \boldsymbol\mu_0)\right) (\sigma^2)^{-(a_0+1)} \exp\left(-\frac{b_0}{\sigma^2}\right) | ||
\end{align}</math> | \end{align}</math> | ||
कुछ पुनर्व्यवस्था के साथ,<ref>The intermediate steps of this computation can be found in O'Hagan (1994) at the beginning of the chapter on Linear models.</ref> पश्च को फिर से लिखा जा सकता है | कुछ पुनर्व्यवस्था के साथ,<ref>The intermediate steps of this computation can be found in O'Hagan (1994) at the beginning of the chapter on Linear models.</ref> पश्च को फिर से लिखा जा सकता है जिससे कि पश्च माध्य <math>\boldsymbol\mu_n</math> मापदण्ड सदिश का <math>\boldsymbol\beta</math> न्यूनतम वर्ग अनुमानक <math>\hat{\boldsymbol\beta}</math> और पूर्ववर्ती माध्य <math>\boldsymbol\mu_0</math> के रूप में व्यक्त किया जा सकता है, पूर्ववर्ती परिशुद्धता आव्यूह <math>\boldsymbol\Lambda_0</math> द्वारा इंगित पूर्ववर्ती की ताकत के साथ | ||
<math display="block">\boldsymbol\mu_n = (\mathbf{X}^\mathsf{T}\mathbf{X}+\boldsymbol\Lambda_0)^{-1}(\mathbf{X}^\mathsf{T} \mathbf{X}\hat{\boldsymbol\beta}+\boldsymbol\Lambda_0\boldsymbol\mu_0) .</math> | <math display="block">\boldsymbol\mu_n = (\mathbf{X}^\mathsf{T}\mathbf{X}+\boldsymbol\Lambda_0)^{-1}(\mathbf{X}^\mathsf{T} \mathbf{X}\hat{\boldsymbol\beta}+\boldsymbol\Lambda_0\boldsymbol\mu_0) .</math> | ||
Line 77: | Line 77: | ||
===[[मॉडल साक्ष्य]]=== | ===[[मॉडल साक्ष्य]]=== | ||
मॉडल साक्ष्य <math>p(\mathbf{y}\mid m)</math> मॉडल <math>m</math> दिए गए आँकड़े की संभाव्यता है, इसे [[सीमांत संभावना|सीमांत संभाव्यता]] और ''पूर्ववर्ती पूर्वानुमानित घनत्व'' के रूप में भी जाना जाता है। यहां, मॉडल को संभाव्यता फलन <math>p(\mathbf{y}\mid\mathbf{X},\boldsymbol\beta,\sigma)</math> द्वारा परिभाषित किया गया है और मापदंडों पर पूर्ववर्ती वितरण, | मॉडल साक्ष्य <math>p(\mathbf{y}\mid m)</math> मॉडल <math>m</math> दिए गए आँकड़े की संभाव्यता है, इसे [[सीमांत संभावना|सीमांत संभाव्यता]] और ''पूर्ववर्ती पूर्वानुमानित घनत्व'' के रूप में भी जाना जाता है। यहां, मॉडल को संभाव्यता फलन <math>p(\mathbf{y}\mid\mathbf{X},\boldsymbol\beta,\sigma)</math> द्वारा परिभाषित किया गया है और मापदंडों पर पूर्ववर्ती वितरण, अर्थात <math>p(\boldsymbol\beta,\sigma)</math>है। मॉडल साक्ष्य एक ही संख्या में अधिकृत करता है कि ऐसा मॉडल टिप्पणियों को कितनी अच्छी तरह समझाता है। इस खंड में प्रस्तुत बायेसियन रैखिक प्रतिगमन मॉडल के मॉडल साक्ष्य का उपयोग [[बायेसियन मॉडल तुलना]] द्वारा प्रतिस्पर्धी रैखिक मॉडल की तुलना करने के लिए किया जा सकता है। ये मॉडल पूर्वानुमान चर की संख्या और मान के साथ-साथ मॉडल मापदंडों पर उनके पूर्ववर्तियों में भिन्न हो सकते हैं। मॉडल साक्ष्य द्वारा मॉडल सम्मिश्रता को पहले से ही ध्यान में रखा गया है, क्योंकि यह <math>\boldsymbol\beta</math> और <math>\sigma</math> के सभी संभावित मान पर<math>p(\mathbf{y},\boldsymbol\beta,\sigma\mid\mathbf{X})</math> को एकीकृत करके मापदंडों को उपांतित पर रख देता है। | ||
<math display="block">p(\mathbf{y}|m)=\int p(\mathbf{y}\mid\mathbf{X},\boldsymbol\beta,\sigma)\, p(\boldsymbol\beta,\sigma)\, d\boldsymbol\beta\, d\sigma</math> | <math display="block">p(\mathbf{y}|m)=\int p(\mathbf{y}\mid\mathbf{X},\boldsymbol\beta,\sigma)\, p(\boldsymbol\beta,\sigma)\, d\boldsymbol\beta\, d\sigma</math> | ||
इस अभिन्न की गणना विश्लेषणात्मक रूप से की जा सकती है और समाधान निम्नलिखित समीकरण में दिया गया है।<ref>The intermediate steps of this computation can be found in O'Hagan (1994) on page 257.</ref> | इस अभिन्न की गणना विश्लेषणात्मक रूप से की जा सकती है और समाधान निम्नलिखित समीकरण में दिया गया है।<ref>The intermediate steps of this computation can be found in O'Hagan (1994) on page 257.</ref> |
Revision as of 13:50, 16 July 2023
Part of a series on |
Bayesian statistics |
---|
Posterior = Likelihood × Prior ÷ Evidence |
Background |
Model building |
Posterior approximation |
Estimators |
Evidence approximation |
Model evaluation |
|
एक श्रृंखला का हिस्सा |
प्रतिगमन विश्लेषण |
---|
मॉडल |
अनुमान |
पार्श्वभूमि |
|
बायेसियन रैखिक प्रतिगमन एक प्रकार का विभेदक मॉडल है जिसमें चर का माध्य अन्य चर के रैखिक फलन द्वारा वर्णित किया जाता है, जिसका लक्ष्य प्रतिगमन गुणांक (साथ ही प्रतिगमन के वितरण का वर्णन करने वाले अन्य मापदण्ड) की पश्चीय संभाव्यता प्राप्त करना है।) और अंततः रिग्रेसैंड(अधिकांशतः लेबल किया गया) की आउट-ऑफ़-सैंपल पूर्वानुमान की अनुमति देता है। प्रतिगामी मान का अवलोकन करती है (सामान्यतः)। इस मॉडल का सबसे सरल और सबसे व्यापक रूप से उपयोग किया जाने वाला संस्करण सामान्य रैखिक मॉडल है, जिसमें दिया गया गाऊसी वितरित किया जाता है। इस मॉडल में, और मापदंडों के लिए पूर्ववर्ती संभाव्यता की विशेष पसंद के अनुसार - तथाकथित संयुग्मित पूर्ववर्ती - पश्च भाग को विश्लेषणात्मक रूप से पाया जा सकता है। अधिक अक्रमतः चुने गए पूर्ववर्तियों के साथ, सामान्यतः पीछे वाले का अनुमान लगाना पड़ता है।
मॉडल सेटअप
मानक रैखिक प्रतिगमन समस्या पर विचार करें, जिसमें के लिए हम सशर्त संभाव्यता वितरण का माध्य निर्दिष्ट करते हैं दिया गया पूर्वानुमान सदिश :
यह बारंबारवादी दृष्टिकोण है, और यह मानता है कि कुछ सार्थक कहने के लिए पर्याप्त माप हैं, बायेसियन अनुमान दृष्टिकोण में, आँकड़े को पूर्ववर्ती संभाव्यता वितरण के रूप में अतिरिक्त जानकारी के साथ पूरक किया जाता है। मापदंडों के बारे में पश्चीय संभाव्यता प्राप्त करने के लिए बेयस प्रमेय के अनुसार मापदंडों और के बारे में पूर्ववर्ती धारणा को आँकड़े की संभाव्यता फलन के साथ जोड़ा जाता है। प्रांत और प्राथमिकता के आधार पर उपलब्ध जानकारी के आधार पर पूर्ववर्ती अलग-अलग कार्यात्मक रूप ले सकता है।
चूंकि आँकड़े में और दोनों सम्मिलित हैं केवल पर सशर्त के वितरण पर ध्यान केंद्रित करने के लिए औचित्य की आवश्यकता है। वास्तव में, "पूर्ण" बायेसियन विश्लेषण के लिए संयुक्त संभाव्यता पूर्ववर्ती के साथ की आवश्यकता होगी, जहाँ के वितरण के मापदंडों का प्रतीक है, केवल (अदृढ़) बहिर्जातता की धारणा के अनुसार ही संयुक्त संभाव्यता को में सम्मिलित किया जा सकता है।[1] बाद वाले हिस्से को सामान्यतः असंयुक्त मापदण्ड उत्पन्न की धारणा के अनुसार नजरअंदाज कर दिया जाता है। इससे भी अधिक, क्लासिक धारणाओं के अनुसार चुने हुए माने जाते हैं (उदाहरण के लिए, डिज़ाइन किए गए प्रयोग में) और इसलिए मापदंडों के बिना ज्ञात संभाव्यता होती है।[2]
संयुग्मित पूर्ववर्ती के साथ
संयुग्मित पूर्ववर्ती वितरण
यादृच्छिक पूर्ववर्ती वितरण के लिए, पश्च वितरण के लिए कोई विश्लेषणात्मक समाधान नहीं हो सकता है। इस खंड में, हम तथाकथित संयुग्म पूर्ववर्ती पर विचार करेंगे जिसके लिए पश्च वितरण विश्लेषणात्मक रूप से प्राप्त किया जा सकता है।
पहले से इस संभाव्यता फलन से पहले संयुग्मित है यदि इसके संबंध में और समान कार्यात्मक रूप है, चूँकि लॉग-संभाव्यता द्विघात है , लॉग-संभाव्यता को फिर से लिखा जाता है जिससे कि संभाव्यता सामान्य हो जाए,
यह पूर्ववर्ती के लिए विधि सुझाता है:
आगे सशर्त पूर्ववर्ती घनत्व सामान्य वितरण है,
पश्च वितरण
पूर्ववर्ती अब निर्दिष्ट के साथ, पश्च वितरण को इस प्रकार व्यक्त किया जा सकता है
मॉडल साक्ष्य
मॉडल साक्ष्य मॉडल दिए गए आँकड़े की संभाव्यता है, इसे सीमांत संभाव्यता और पूर्ववर्ती पूर्वानुमानित घनत्व के रूप में भी जाना जाता है। यहां, मॉडल को संभाव्यता फलन द्वारा परिभाषित किया गया है और मापदंडों पर पूर्ववर्ती वितरण, अर्थात है। मॉडल साक्ष्य एक ही संख्या में अधिकृत करता है कि ऐसा मॉडल टिप्पणियों को कितनी अच्छी तरह समझाता है। इस खंड में प्रस्तुत बायेसियन रैखिक प्रतिगमन मॉडल के मॉडल साक्ष्य का उपयोग बायेसियन मॉडल तुलना द्वारा प्रतिस्पर्धी रैखिक मॉडल की तुलना करने के लिए किया जा सकता है। ये मॉडल पूर्वानुमान चर की संख्या और मान के साथ-साथ मॉडल मापदंडों पर उनके पूर्ववर्तियों में भिन्न हो सकते हैं। मॉडल साक्ष्य द्वारा मॉडल सम्मिश्रता को पहले से ही ध्यान में रखा गया है, क्योंकि यह और के सभी संभावित मान पर को एकीकृत करके मापदंडों को उपांतित पर रख देता है।
अन्य मामले
सामान्य तौर पर, विश्लेषणात्मक रूप से पश्च वितरण प्राप्त करना असंभव या अव्यावहारिक हो सकता है। हालाँकि, मोंटे कार्लो नमूनाकरण या वैरिएबल बेयस जैसी अनुमानित बायेसियन गणना विधि द्वारा पश्च भाग का अनुमान लगाना संभव है।[6]
विशेष मामला रिज प्रतिगमन कहा जाता है।
एक समान विश्लेषण बहुभिन्नरूपी प्रतिगमन के सामान्य मामले के लिए किया जा सकता है और इसका एक हिस्सा सहप्रसरण आव्यूह के बायेसियन अनुमान के लिए प्रदान करता है: बायेसियन बहुभिन्नरूपी रैखिक प्रतिगमन देखें।
यह भी देखें
- बेयस रैखिक आँकड़े
- सीमित न्यूनतम वर्ग
- न्यूनतम वर्गों को नियमित किया गया
- तिखोनोव नियमितीकरण
- स्पाइक और स्लैब चर चयन
- कर्नेल नियमितीकरण की बायेसियन व्याख्या
This article includes a list of general references, but it lacks sufficient corresponding inline citations. (August 2011) (Learn how and when to remove this template message) |
टिप्पणियाँ
- ↑ See Jackman (2009), p. 101.
- ↑ See Gelman et al. (2013), p. 354.
- ↑ The intermediate steps of this computation can be found in O'Hagan (1994) at the beginning of the chapter on Linear models.
- ↑ The intermediate steps are in Fahrmeir et al. (2009) on page 188.
- ↑ The intermediate steps of this computation can be found in O'Hagan (1994) on page 257.
- ↑ Carlin and Louis(2008) and Gelman, et al. (2003) explain how to use sampling methods for Bayesian linear regression.
संदर्भ
- Box, G. E. P.; Tiao, G. C. (1973). Bayesian Inference in Statistical Analysis. Wiley. ISBN 0-471-57428-7.
- Carlin, Bradley P.; Louis, Thomas A. (2008). Bayesian Methods for Data Analysis (Third ed.). Boca Raton, FL: Chapman and Hall/CRC. ISBN 1-58488-697-8.
- Fahrmeir, L.; Kneib, T.; Lang, S. (2009). Regression. Modelle, Methoden und Anwendungen (Second ed.). Heidelberg: Springer. doi:10.1007/978-3-642-01837-4. ISBN 978-3-642-01836-7.
- Gelman, Andrew; et al. (2013). "Introduction to regression models". Bayesian Data Analysis (Third ed.). Boca Raton, FL: Chapman and Hall/CRC. pp. 353–380. ISBN 978-1-4398-4095-5.
- Jackman, Simon (2009). "Regression models". Bayesian Analysis for the Social Sciences. Wiley. pp. 99–124. ISBN 978-0-470-01154-6.
- Rossi, Peter E.; Allenby, Greg M.; McCulloch, Robert (2006). Bayesian Statistics and Marketing. John Wiley & Sons. ISBN 0470863676.
- O'Hagan, Anthony (1994). Bayesian Inference. Kendall's Advanced Theory of Statistics. Vol. 2B (First ed.). Halsted. ISBN 0-340-52922-9.
बाहरी संबंध
- Bayesian estimation of linear models (R programming wikibook). Bayesian linear regression as implemented in R.