पॉइसन प्रतिगमन: Difference between revisions

Revision as of 09:01, 12 July 2023

आंकड़ों में पॉइसन प्रतिगमन प्रतिगमन विश्लेषण का एक सामान्यीकृत रैखिक मॉडल रूप है जिसका उपयोग गणना डेटा और आकस्मिक तालिकाओं को मॉडल करने के लिए किया जाता है। पॉइसन प्रतिगमन मानता है कि प्रतिक्रिया चर Y में पॉइसन वितरण है, और मानता है कि इसके अपेक्षित मूल्य के लघुगणक को अज्ञात मापदंडों के रैखिक संयोजन द्वारा मॉडल किया जा सकता है। एक पॉइसन प्रतिगमन मॉडल को कभी-कभी लॉग-रैखिक मॉडल के रूप में जाना जाता है, विशेष रूप से जब आकस्मिक तालिकाओं को मॉडल करने के लिए उपयोग किया जाता है।

नकारात्मक द्विपद प्रतिगमन पॉइसन प्रतिगमन का एक लोकप्रिय सामान्यीकरण है क्योंकि यह अत्यधिक प्रतिबंधात्मक धारणा को शिथिल करता है कि विचरण पॉइसन मॉडल द्वारा बनाए गए माध्य के समान है। पारंपरिक नकारात्मक द्विपद प्रतिगमन मॉडल पॉइसन-गामा मिश्रण वितरण पर आधारित है। यह मॉडल लोकप्रिय है क्योंकि यह गामा वितरण के साथ पॉइसन विषमता का मॉडल तैयार करता है।

पॉइसन प्रतिगमन मॉडल (कैनोनिकल) लिंक फलन के रूप में लघुगणक के साथ सामान्यीकृत रैखिक मॉडल हैं, और प्रतिक्रिया की अनुमानित संभाव्यता वितरण के रूप में पॉइसन वितरण फलन है।

प्रतिगमन मॉडल

यदि $\mathbf {x} \in \mathbb {R} ^{n}$ स्वतंत्र चरों का एक सदिश है, तो मॉडल रूप लेता है

\log(\operatorname {E} (Y\mid \mathbf {x} ))=\alpha +\mathbf {\beta } '\mathbf {x} ,

जहाँ $\alpha \in \mathbb {R}$ और $\mathbf {\beta } \in \mathbb {R} ^{n}$ . कभी-कभी इसे अधिक संक्षिप्त रूप में लिखा जाता है

\log(\operatorname {E} (Y\mid \mathbf {x} ))={\boldsymbol {\theta }}'\mathbf {x} ,\,

जहाँ $\mathbf {x}$ अब एक (n+1)-आयामी सदिश है जिसमें नंबर एक से जुड़े n स्वतंत्र चर सम्मिलित हैं। यहाँ $\theta$ सादा है $\alpha$ से संबद्ध $\beta$ .

इस प्रकार, जब एक पॉइसन प्रतिगमन मॉडल $\theta$ और एक इनपुट सदिश $\mathbf {x}$ दिया जाता है, तो संबंधित पॉइसन वितरण का अनुमानित माध्य इस प्रकार दिया जाता है

\operatorname {E} (Y\mid \mathbf {x} )=e^{{\boldsymbol {\theta }}'\mathbf {x} }.\,

यदि $Y_{i}$ भविष्यवक्ता चर के संगत मान $\mathbf {x} _{i}$ के साथ स्वतंत्र अवलोकन हैं, तो $\theta$ का अनुमान अधिकतम संभावना से लगाया जा सकता है। अधिकतम-संभावना अनुमानों में बंद-रूप अभिव्यक्ति का अभाव है और इसे संख्यात्मक विधि से पाया जाना चाहिए। अधिकतम-संभावना पॉइसन प्रतिगमन के लिए संभाव्यता सतह सदैव अवतल होती है, जिससे न्यूटन-रेफसन या अन्य ग्रेडिएंट-आधारित विधियाँ उपयुक्त अनुमान तकनीक बन जाती हैं।

अधिकतम संभावना-आधारित पैरामीटर अनुमान

मापदंडों के एक सेट और एक इनपुट सदिश x को देखते हुए, जैसा कि ऊपर बताया गया है, अनुमानित पॉइसन वितरण का माध्य इस प्रकार दिया गया है

\lambda :=\operatorname {E} (Y\mid x)=e^{\theta 'x},\,

और इस प्रकार, पॉइसन वितरण की संभाव्यता द्रव्यमान फलन द्वारा दी गई है

p(y\mid x;\theta )={\frac {\lambda ^{y}}{y!}}e^{-\lambda }={\frac {e^{y\theta 'x}e^{-e^{\theta 'x}}}{y!}}

अब मान लीजिए कि हमें एक डेटा सेट दिया गया है जिसमें m सदिश $x_{i}\in \mathbb {R} ^{n+1},\,i=1,\ldots ,m$ के साथ-साथ m मान $y_{1},\ldots ,y_{m}\in \mathbb {N}$ का एक सेट भी सम्मिलित है। फिर, मापदंडों के दिए गए सेट के लिए θ, डेटा के इस विशेष सेट को प्राप्त करने की संभावना इस प्रकार दी गई है

p(y_{1},\ldots ,y_{m}\mid x_{1},\ldots ,x_{m};\theta )=\prod _{i=1}^{m}{\frac {e^{y_{i}\theta 'x_{i}}e^{-e^{\theta 'x_{i}}}}{y_{i}!}}.

अधिकतम संभावना की विधि से, हम पैरामीटर θ का सेट खोजना चाहते हैं जो इस संभावना को यथासंभव बड़ा बनाता है। ऐसा करने के लिए, समीकरण को पहले θ के संदर्भ में एक संभावना फलन के रूप में फिर से लिखा जाता है:

L(\theta \mid X,Y)=\prod _{i=1}^{m}{\frac {e^{y_{i}\theta 'x_{i}}e^{-e^{\theta 'x_{i}}}}{y_{i}!}}.

ध्यान दें कि समीकरण की भुजाओं का व्यंजक वास्तव में नहीं बदला है। इस रूप में किसी सूत्र के साथ काम करना सामान्यतः कठिन होता है; इसके अतिरिक्त कोई लॉग-संभावना का उपयोग करता है:

\ell (\theta \mid X,Y)=\log L(\theta \mid X,Y)=\sum _{i=1}^{m}\left(y_{i}\theta 'x_{i}-e^{\theta 'x_{i}}-\log(y_{i}!)\right).

ध्यान दें कि पैरामीटर θ केवल योग में प्रत्येक पद के पहले दो पदों में दिखाई देते हैं। इसलिए, यह देखते हुए कि हम केवल θ के लिए सर्वोत्तम मूल्य खोजने में रुचि रखते हैं, हम y_i! को छोड़ सकते हैं! और बस लिखो

\ell (\theta \mid X,Y)=\sum _{i=1}^{m}\left(y_{i}\theta 'x_{i}-e^{\theta 'x_{i}}\right).

अधिकतम ज्ञात करने के लिए, हमें एक समीकरण ${\frac {\partial \ell (\theta \mid X,Y)}{\partial \theta }}=0$ को हल करना होगा जिसका कोई बंद-रूप समाधान नहीं है। चूँकि नकारात्मक लॉग-संभावना, $-\ell (\theta \mid X,Y)$ , एक उत्तल फलन है, और इसलिए ग्रेडिएंट डिसेंट जैसी मानक उत्तल अनुकूलन तकनीकों को θ का इष्टतम मान खोजने के लिए प्रयुक्त किया जा सकता है।

व्यवहार में पॉइसन प्रतिगमन

पॉइसन प्रतिगमन उपयुक्त हो सकता है जब आश्रित चर एक गिनती है, उदाहरण के लिए पॉइसन वितरण#घटना जैसे कॉल सेंटर पर टेलीफोन कॉल का आगमन।^[1] घटनाएँ इस अर्थ में स्वतंत्र होनी चाहिए कि एक कॉल के आने से दूसरी कॉल की संभावना कम या ज्यादा नहीं होगी, किंतु घटनाओं की प्रति इकाई समय की संभावना को दिन के समय जैसे सहसंयोजकों से संबंधित माना जाता है।

एक्सपोज़र और ऑफसेट

पॉइसन प्रतिगमन दर डेटा के लिए भी उपयुक्त हो सकता है, जहां दर उस इकाई के एक्सपोज़र (अवलोकन की एक विशेष इकाई) के कुछ माप से विभाजित घटनाओं की गिनती है। उदाहरण के लिए, जीवविज्ञानी किसी जंगल में वृक्ष प्रजातियों की संख्या की गणना कर सकते हैं: घटनाएँ वृक्ष अवलोकन होंगी, एक्सपोज़र इकाई क्षेत्र होगा, और दर प्रति इकाई क्षेत्र में प्रजातियों की संख्या होगी। जनसांख्यिकी विशेषज्ञ भौगोलिक क्षेत्रों में मृत्यु दर को व्यक्ति-वर्ष से विभाजित मौतों की संख्या के रूप में मॉडल कर सकते हैं। अधिक सामान्यतः, घटना दरों की गणना प्रति इकाई समय की घटनाओं के रूप में की जा सकती है, जो प्रत्येक इकाई के लिए अवलोकन विंडो को अलग-अलग करने की अनुमति देती है। इन उदाहरणों में, एक्सपोज़र क्रमशः इकाई क्षेत्र, व्यक्ति-वर्ष और इकाई समय है। पॉइसन प्रतिगमन में इसे 'ऑफ़सेट' के रूप में संभाला जाता है। यदि दर गणना/एक्सपोज़र है, तो समीकरण के दोनों पक्षों को एक्सपोज़र से गुणा करने पर यह समीकरण के दाईं ओर चला जाता है। जब समीकरण के दोनों पक्षों को लॉग किया जाता है, तो अंतिम मॉडल में एक शब्द के रूप में लॉग (एक्सपोज़र) होता है जो प्रतिगमन गुणांक में जोड़ा जाता है। इस लॉग वेरिएबल, लॉग (एक्सपोज़र) को ऑफसेट वेरिएबल कहा जाता है और समीकरण के दाईं ओर एक पैरामीटर अनुमान (लॉग (एक्सपोज़र) के लिए) 1 तक सीमित होता है।

\log(\operatorname {E} (Y\mid x))=\theta 'x

जो ये दर्शाता हे

\log \left({\frac {\operatorname {E} (Y\mid x)}{\text{exposure}}}\right)=\log(\operatorname {E} (Y\mid x))-\log({\text{exposure}})=\theta 'x-\log({\text{exposure}})

आर में जीएलएम के स्थिति में ऑफसेट को offset() फलन का उपयोग करके प्राप्त किया जा सकता है:

glm(y ~ offset(log(exposure)) + x, family=poisson(link=log) )

अति फैलाव और शून्य मुद्रास्फीति

पॉइसन वितरण की एक विशेषता यह है कि इसका माध्य इसके विचरण के समान है। कुछ परिस्थितियों में, यह पाया जाएगा कि देखा गया विचरण माध्य से अधिक है; इसे अति फैलाव के रूप में जाना जाता है और यह इंगित करता है कि मॉडल उपयुक्त नहीं है। एक सामान्य कारण प्रासंगिक व्याख्यात्मक चर, या आश्रित टिप्पणियों का चूक है। कुछ परिस्थितियों में, अति-विक्षेपण की समस्या को अर्ध-संभावना अनुमान या इसके अतिरिक्त नकारात्मक द्विपद वितरण का उपयोग करके हल किया जा सकता है।^[2]^[3]

वेर होफ और बोवेंग ने अर्ध-पॉइसन (जिसे अर्ध-संभावना के साथ अति-फैलाव भी कहा जाता है) और नकारात्मक द्विपद (गामा-पॉइसन के समान) के बीच अंतर का वर्णन इस प्रकार किया: यदि E(Y) = μ, अर्ध-पॉइसन मॉडल varr(Y) = θμ मानता है जबकि गामा-पॉइसन var(Y) = μ(1+ κμ) मानता है, जहां θ अर्ध-पॉइसन अतिफैलाव पैरामीटर है, और κ नकारात्मक द्विपद वितरण का आकार पैरामीटर है। दोनों मॉडलों के लिए, मापदंडों का अनुमान पुनरावृत्तीय रूप से पुनः भारित न्यूनतम वर्गों का उपयोग करके लगाया जाता है। अर्ध-पॉइसन के लिए, भार μ/θ हैं। ऋणात्मक द्विपद के लिए, भार μ/(1 + κμ) हैं। बड़े μ और पर्याप्त अतिरिक्त-पॉइसन भिन्नता के साथ, नकारात्मक द्विपद भार 1/κ पर सीमित हैं। वेर होफ और बोवेंग ने एक उदाहरण पर चर्चा की जहां उन्होंने माध्य बनाम माध्य वर्ग अवशिष्टों को आलेखित करके दोनों के बीच चयन किया था।^[4]

पॉइसन प्रतिगमन के साथ एक और समान्य समस्या अतिरिक्त शून्य है: यदि काम पर दो प्रक्रियाएं हैं, एक यह निर्धारित करती है कि शून्य घटनाएं हैं या कोई घटना है और एक पॉइसन प्रक्रिया यह निर्धारित करती है कि कितनी घटनाएं हैं, तो पॉइसन प्रतिगमन की तुलना में अधिक शून्य होंगे पूर्वानुमान करना है। एक उदाहरण उस समूह के सदस्यों द्वारा एक घंटे में पी गई सिगरेट का वितरण होगा जहां कुछ व्यक्ति धूम्रपान नहीं करते हैं।

अन्य सामान्यीकृत रैखिक मॉडल जैसे नकारात्मक द्विपद वितरण मॉडल या शून्य-फुलाया मॉडल इन स्थितियों में उत्तम कार्य कर सकते हैं।

इसके विपरीत, कम फैलाव पैरामीटर अनुमान के लिए एक समस्या उत्पन्न कर सकता है।^[5]

उत्तरजीविता विश्लेषण में उपयोग

पॉइसन प्रतिगमन आनुपातिक खतरों के मॉडल बनाता है,अस्तित्व विश्लेषण का एक वर्ग: कॉक्स मॉडल के विवरण के लिए आनुपातिक खतरों के मॉडल देखें।

एक्सटेंशन

नियमित पॉइसन प्रतिगमन

पॉइसन प्रतिगमन के लिए मापदंडों का अनुमान लगाते समय कोई सामान्यतः θ के लिए मान खोजने का प्रयास करता है जो फॉर्म की अभिव्यक्ति की संभावना को अधिकतम करता है

\sum _{i=1}^{m}\log(p(y_{i};e^{\theta 'x_{i}})),

जहां m डेटा सेट में उदाहरणों की संख्या है, और $p(y_{i};e^{\theta 'x_{i}})$ पॉइसन वितरण का संभाव्यता द्रव्यमान फलन है जिसका माध्य $e^{\theta 'x_{i}}$ पर सेट है। इस अनुकूलन समस्या में अधिकतमीकरण के अतिरिक्त नियमितीकरण को जोड़ा जा सकता है^[6]

\sum _{i=1}^{m}\log(p(y_{i};e^{\theta 'x_{i}}))-\lambda \left\|\theta \right\|_{2}^{2},

कुछ सकारात्मक स्थिरांक के लिए $\lambda$ . रिज प्रतिगमन के समान यह तकनीक, ओवरफिटिंग को कम कर सकती है।

मॉडल बनाता है,अस्तित्व विश्लेषण का एक वर्ग: कॉक्स मॉडल के विवरण के लिए आनुपातिक खतरों के मॉडल देखें

यह भी देखें

शून्य-फुलाया हुआ मॉडल
पॉसों वितरण
निश्चित-प्रभाव पॉइसन मॉडल
पैनल डेटा के लिए आंशिक संभावना विधियां या पॉइसन मॉडल के लिए पूलित क्यूएमएलई § Notes
नियंत्रण फ़ंक्शन (अर्थमिति) या पॉइसन प्रतिगमन में एंडोजेनिटी § Notes

संदर्भ

↑ Greene, William H. (2003). अर्थमितीय विश्लेषण (Fifth ed.). Prentice-Hall. pp. 740–752. ISBN 978-0130661890.
↑ Paternoster R, Brame R (1997). "Multiple routes to delinquency? A test of developmental and general theories of crime". Criminology. 35: 45–84. doi:10.1111/j.1745-9125.1997.tb00870.x.
↑ Berk R, MacDonald J (2008). "अति फैलाव और पॉइसन प्रतिगमन". Journal of Quantitative Criminology. 24 (3): 269–284. doi:10.1007/s10940-008-9048-4. S2CID 121273486.
↑ Ver Hoef, JAY M.; Boveng, Peter L. (2007-01-01). "Quasi-Poisson vs. Negative Binomial Regression: How should we model overdispersed count data?". Ecology. 88 (11): 2766–2772. doi:10.1890/07-0043.1. PMID 18051645. Retrieved 2016-09-01.
↑ Schwarzenegger, Rafael; Quigley, John; Walls, Lesley (23 November 2021). "Is eliciting dependency worth the effort? A study for the multivariate Poisson-Gamma probability model". Proceedings of the Institution of Mechanical Engineers, Part O: Journal of Risk and Reliability: 5. doi:10.1177/1748006X211059417.
↑ Perperoglou, Aris (2011-09-08). "दंडित पॉइसन प्रतिगमन के साथ उत्तरजीविता डेटा फ़िट करना". Statistical Methods & Applications. Springer Nature. 20 (4): 451–462. doi:10.1007/s10260-011-0172-1. ISSN 1618-2510. S2CID 10883925.

अग्रिम पठन

Cameron, A. C.; Trivedi, P. K. (1998). Regression analysis of count data. Cambridge University Press. ISBN 978-0-521-63201-0.
Christensen, Ronald (1997). Log-linear models and logistic regression. Springer Texts in Statistics (Second ed.). New York: Springer-Verlag. ISBN 978-0-387-98247-2. MR 1633357.
Gouriéroux, Christian (2000). "The Econometrics of Discrete Positive Variables: the Poisson Model". Econometrics of Qualitative Dependent Variables. New York: Cambridge University Press. pp. 270–83. ISBN 978-0-521-58985-7.
Greene, William H. (2008). "Models for Event Counts and Duration". Econometric Analysis (8th ed.). Upper Saddle River: Prentice Hall. pp. 906–944. ISBN 978-0-13-600383-0.
Hilbe, J. M. (2007). Negative Binomial Regression. Cambridge University Press. ISBN 978-0-521-85772-7.
Jones, Andrew M.; et al. (2013). "Models for count data". Applied Health Economics. London: Routledge. pp. 295–341. ISBN 978-0-415-67682-3.
Myers, Raymond H.; et al. (2010). "Logistic and Poisson Regression Models". Generalized Linear Models With Applications in Engineering and the Sciences (Second ed.). New Jersey: Wiley. pp. 176–183. ISBN 978-0-470-45463-3.

[1] Greene, William H. (2003). अर्थमितीय विश्लेषण (Fifth ed.). Prentice-Hall. pp. 740–752. ISBN 978-0130661890.

[2] Paternoster R, Brame R (1997). "Multiple routes to delinquency? A test of developmental and general theories of crime". Criminology. 35: 45–84. doi:10.1111/j.1745-9125.1997.tb00870.x.

[3] Berk R, MacDonald J (2008). "अति फैलाव और पॉइसन प्रतिगमन". Journal of Quantitative Criminology. 24 (3): 269–284. doi:10.1007/s10940-008-9048-4. S2CID 121273486.

[4] Ver Hoef, JAY M.; Boveng, Peter L. (2007-01-01). "Quasi-Poisson vs. Negative Binomial Regression: How should we model overdispersed count data?". Ecology. 88 (11): 2766–2772. doi:10.1890/07-0043.1. PMID 18051645. Retrieved 2016-09-01.

[5] Schwarzenegger, Rafael; Quigley, John; Walls, Lesley (23 November 2021). "Is eliciting dependency worth the effort? A study for the multivariate Poisson-Gamma probability model". Proceedings of the Institution of Mechanical Engineers, Part O: Journal of Risk and Reliability: 5. doi:10.1177/1748006X211059417.

[Perperoglou-6] Perperoglou, Aris (2011-09-08). "दंडित पॉइसन प्रतिगमन के साथ उत्तरजीविता डेटा फ़िट करना". Statistical Methods & Applications. Springer Nature. 20 (4): 451–462. doi:10.1007/s10260-011-0172-1. ISSN 1618-2510. S2CID 10883925.

[1]

[2]

[3]

[4]

[5]

[6]

@@ Line 1: / Line 1: @@
 {{Short description|Statistical model for count data}}
 {{Regression bar}}
-आंकड़ों में, पॉइसन प्रतिगमन [[प्रतिगमन विश्लेषण]] का एक [[सामान्यीकृत रैखिक मॉडल]] रूप है जिसका उपयोग गणना डेटा और [[आकस्मिक तालिका]]ओं को मॉडल करने के लिए किया जाता है। पॉइसन प्रतिगमन मानता है कि प्रतिक्रिया चर ''Y'' में पॉइसन वितरण है, और मानता है कि इसके [[अपेक्षित मूल्य]] के लघुगणक को अज्ञात मापदंडों के रैखिक संयोजन द्वारा मॉडल किया जा सकता है। एक पॉइसन प्रतिगमन मॉडल को कभी-कभी [[लॉग-रैखिक मॉडल]] के रूप में जाना जाता है, खासकर जब आकस्मिक तालिकाओं को मॉडल करने के लिए उपयोग किया जाता है।
+आंकड़ों में पॉइसन प्रतिगमन [[प्रतिगमन विश्लेषण]] का एक [[सामान्यीकृत रैखिक मॉडल]] रूप है जिसका उपयोग गणना डेटा और [[आकस्मिक तालिका]]ओं को मॉडल करने के लिए किया जाता है। पॉइसन प्रतिगमन मानता है कि प्रतिक्रिया चर ''Y'' में पॉइसन वितरण है, और मानता है कि इसके [[अपेक्षित मूल्य]] के लघुगणक को अज्ञात मापदंडों के रैखिक संयोजन द्वारा मॉडल किया जा सकता है। एक पॉइसन प्रतिगमन मॉडल को कभी-कभी [[लॉग-रैखिक मॉडल]] के रूप में जाना जाता है, विशेष रूप से जब आकस्मिक तालिकाओं को मॉडल करने के लिए उपयोग किया जाता है।
-नकारात्मक द्विपद प्रतिगमन पॉइसन प्रतिगमन का एक लोकप्रिय सामान्यीकरण है क्योंकि यह अत्यधिक प्रतिबंधात्मक धारणा को ढीला करता है कि विचरण पॉइसन मॉडल द्वारा बनाए गए माध्य के बराबर है। पारंपरिक नकारात्मक द्विपद प्रतिगमन मॉडल पॉइसन-गामा मिश्रण वितरण पर आधारित है। यह मॉडल लोकप्रिय है क्योंकि यह गामा वितरण के साथ पॉइसन विषमता का मॉडल तैयार करता है।
+नकारात्मक द्विपद प्रतिगमन पॉइसन प्रतिगमन का एक लोकप्रिय सामान्यीकरण है क्योंकि यह अत्यधिक प्रतिबंधात्मक धारणा को शिथिल करता है कि विचरण पॉइसन मॉडल द्वारा बनाए गए माध्य के समान है। पारंपरिक नकारात्मक द्विपद प्रतिगमन मॉडल पॉइसन-गामा मिश्रण वितरण पर आधारित है। यह मॉडल लोकप्रिय है क्योंकि यह गामा वितरण के साथ पॉइसन विषमता का मॉडल तैयार करता है।
-पॉइसन प्रतिगमन मॉडल (कैनोनिकल) [[लिंक फ़ंक्शन]] के रूप में लघुगणक के साथ सामान्यीकृत रैखिक मॉडल हैं, और प्रतिक्रिया की अनुमानित संभाव्यता वितरण के रूप में पॉइसन वितरण फ़ंक्शन है।
+पॉइसन प्रतिगमन मॉडल (कैनोनिकल) [[लिंक फ़ंक्शन|लिंक]] फलन के रूप में लघुगणक के साथ सामान्यीकृत रैखिक मॉडल हैं, और प्रतिक्रिया की अनुमानित संभाव्यता वितरण के रूप में पॉइसन वितरण फलन है।
 ==प्रतिगमन मॉडल==
-अगर <math>\mathbf{x} \in \mathbb{R}^n</math> स्वतंत्र चरों का एक वेक्टर है, तो मॉडल रूप लेता है
+यदि <math>\mathbf{x} \in \mathbb{R}^n</math> स्वतंत्र चरों का एक सदिश है, तो मॉडल रूप लेता है
 : <math>\log (\operatorname{E}(Y\mid\mathbf{x}))=\alpha + \mathbf{\beta}' \mathbf{x},</math>
-कहाँ <math>\alpha \in \mathbb{R}</math> और <math>\mathbf{\beta} \in \mathbb{R}^n</math>. कभी-कभी इसे अधिक संक्षिप्त रूप में लिखा जाता है
+जहाँ <math>\alpha \in \mathbb{R}</math> और <math>\mathbf{\beta} \in \mathbb{R}^n</math>. कभी-कभी इसे अधिक संक्षिप्त रूप में लिखा जाता है
 :<math>\log (\operatorname{E}(Y\mid\mathbf{x}))=\boldsymbol{\theta}' \mathbf{x},\,</math>
-कहाँ <math>\mathbf{x}</math> अब एक (n+1)-आयामी वेक्टर है जिसमें नंबर एक से जुड़े n स्वतंत्र चर शामिल हैं। यहाँ <math>\theta</math> सादा है <math>\alpha</math> से संबद्ध <math>\beta</math>.
+जहाँ <math>\mathbf{x}</math> अब एक (n+1)-आयामी सदिश है जिसमें नंबर एक से जुड़े n स्वतंत्र चर सम्मिलित हैं। यहाँ <math>\theta</math> सादा है <math>\alpha</math> से संबद्ध <math>\beta</math>.
-इस प्रकार, जब एक पॉइसन प्रतिगमन मॉडल दिया जाता है <math>\theta</math> और एक इनपुट वेक्टर <math>\mathbf{x}</math>, संबद्ध पॉइसन वितरण का अनुमानित माध्य किसके द्वारा दिया गया है
+इस प्रकार, जब एक पॉइसन प्रतिगमन मॉडल <math>\theta</math> और एक इनपुट सदिश <math>\mathbf{x}</math> दिया जाता है, तो संबंधित पॉइसन वितरण का अनुमानित माध्य इस प्रकार दिया जाता है
 :<math>\operatorname{E}(Y\mid\mathbf{x})=e^{\boldsymbol{\theta}' \mathbf{x}}.\,</math>
-अगर <math>Y_i</math> संगत मूल्यों के साथ [[सांख्यिकीय स्वतंत्रता]] अवलोकन हैं <math>\mathbf{x}_i</math> फिर, भविष्यवक्ता चर का <math>\theta</math> अधिकतम संभावना से अनुमान लगाया जा सकता है। अधिकतम-संभावना अनुमानों में [[बंद-रूप अभिव्यक्ति]] का अभाव है और इसे संख्यात्मक तरीकों से पाया जाना चाहिए। अधिकतम-संभावना पॉइसन प्रतिगमन के लिए संभाव्यता सतह हमेशा अवतल होती है, जिससे न्यूटन-रेफसन या अन्य ग्रेडिएंट-आधारित विधियाँ उपयुक्त अनुमान तकनीक बन जाती हैं।
+यदि <math>Y_i</math> भविष्यवक्ता चर के संगत मान <math>\mathbf{x}_i</math> के साथ स्वतंत्र अवलोकन हैं, तो <math>\theta</math> का अनुमान अधिकतम संभावना से लगाया जा सकता है। अधिकतम-संभावना अनुमानों में बंद-रूप अभिव्यक्ति का अभाव है और इसे संख्यात्मक विधि से पाया जाना चाहिए। अधिकतम-संभावना पॉइसन प्रतिगमन के लिए संभाव्यता सतह सदैव अवतल होती है, जिससे न्यूटन-रेफसन या अन्य ग्रेडिएंट-आधारित विधियाँ उपयुक्त अनुमान तकनीक बन जाती हैं।
 ==अधिकतम संभावना-आधारित पैरामीटर अनुमान==
-मापदंडों के एक सेट और एक इनपुट वेक्टर x को देखते हुए, जैसा कि ऊपर बताया गया है, अनुमानित पॉइसन वितरण का माध्य इस प्रकार दिया गया है
+मापदंडों के एक सेट और एक इनपुट सदिश x को देखते हुए, जैसा कि ऊपर बताया गया है, अनुमानित पॉइसन वितरण का माध्य इस प्रकार दिया गया है
 :<math>\lambda := \operatorname{E}(Y\mid x)=e^{\theta'x},\,</math>
-और इस प्रकार, पॉइसन वितरण की संभाव्यता द्रव्यमान फ़ंक्शन द्वारा दी गई है
+और इस प्रकार, पॉइसन वितरण की संभाव्यता द्रव्यमान फलन द्वारा दी गई है
 :<math>p(y\mid x;\theta) = \frac{\lambda^y}{y!} e^{-\lambda} = \frac{e^{y  \theta' x} e^{-e^{\theta' x}}}{y!}</math>
-अब मान लीजिए कि हमें m वैक्टर वाला एक डेटा सेट दिया गया है <math>x_i \in \mathbb{R}^{n+1}, \, i = 1,\ldots,m</math>, एम मानों के एक सेट के साथ <math>y_1,\ldots,y_m \in \mathbb{N}</math>. फिर, मापदंडों के दिए गए सेट के लिए θ, डेटा के इस विशेष सेट को प्राप्त करने की संभावना इस प्रकार दी गई है
+अब मान लीजिए कि हमें एक डेटा सेट दिया गया है जिसमें m सदिश <math>x_i \in \mathbb{R}^{n+1}, \, i = 1,\ldots,m</math> के साथ-साथ m मान '''<math>y_1,\ldots,y_m \in \mathbb{N}</math>''' का एक सेट भी सम्मिलित है। फिर, मापदंडों के दिए गए सेट के लिए θ, डेटा के इस विशेष सेट को प्राप्त करने की संभावना इस प्रकार दी गई है
 :<math>p(y_1,\ldots,y_m\mid x_1,\ldots,x_m;\theta) = \prod_{i=1}^m \frac{e^{y_i  \theta' x_i} e^{-e^{\theta' x_i}}}{y_i!}.</math>
-अधिकतम संभावना की विधि से, हम पैरामीटर θ का सेट ढूंढना चाहते हैं जो इस संभावना को यथासंभव बड़ा बनाता है। ऐसा करने के लिए, समीकरण को पहले θ के संदर्भ में एक संभावना फ़ंक्शन के रूप में फिर से लिखा जाता है:
+अधिकतम संभावना की विधि से, हम पैरामीटर θ का सेट खोजना चाहते हैं जो इस संभावना को यथासंभव बड़ा बनाता है। ऐसा करने के लिए, समीकरण को पहले θ के संदर्भ में एक संभावना फलन के रूप में फिर से लिखा जाता है:
 :<math>L(\theta\mid X,Y) = \prod_{i=1}^m \frac{e^{y_i \theta' x_i} e^{-e^{\theta' x_i}}}{y_i!}.</math>
-ध्यान दें कि समीकरण की भुजाओं का व्यंजक वास्तव में नहीं बदला है। इस रूप में किसी सूत्र के साथ काम करना आम तौर पर कठिन होता है; इसके बजाय, कोई लॉग-संभावना का उपयोग करता है:
+ध्यान दें कि समीकरण की भुजाओं का व्यंजक वास्तव में नहीं बदला है। इस रूप में किसी सूत्र के साथ काम करना सामान्यतः कठिन होता है; इसके अतिरिक्त  कोई लॉग-संभावना का उपयोग करता है:
 :<math>\ell(\theta\mid X,Y) = \log L(\theta\mid X,Y) = \sum_{i=1}^m \left( y_i \theta' x_i - e^{\theta' x_i} - \log(y_i!)\right). </math>
-ध्यान दें कि पैरामीटर θ केवल योग में प्रत्येक पद के पहले दो पदों में दिखाई देते हैं। इसलिए, यह देखते हुए कि हम केवल θ के लिए सर्वोत्तम मान खोजने में रुचि रखते हैं, हम y को छोड़ सकते हैं<sub>''i''</sub><nowiki>!</nowiki> और बस लिखें
+ध्यान दें कि पैरामीटर θ केवल योग में प्रत्येक पद के पहले दो पदों में दिखाई देते हैं। इसलिए, यह देखते हुए कि हम केवल θ के लिए सर्वोत्तम मूल्य खोजने में रुचि रखते हैं, हम ''y<sub>i</sub>''! को छोड़ सकते हैं! और बस लिखो
 :<math>\ell(\theta\mid X,Y) = \sum_{i=1}^m \left( y_i \theta' x_i - e^{\theta' x_i} \right). </math>
-अधिकतम ज्ञात करने के लिए, हमें एक समीकरण को हल करना होगा <math>\frac{\partial \ell(\theta\mid X,Y)}{\partial \theta} = 0 </math> जिसका कोई बंद-रूप समाधान नहीं है। हालाँकि, नकारात्मक लॉग-संभावना, <math>-\ell(\theta\mid X,Y)</math>, एक उत्तल फ़ंक्शन है, और इसलिए [[ ढतला हुआ वंश ]] जैसी मानक [[उत्तल अनुकूलन]] तकनीकों को θ का इष्टतम मान खोजने के लिए लागू किया जा सकता है।
+अधिकतम ज्ञात करने के लिए, हमें एक समीकरण <math>\frac{\partial \ell(\theta\mid X,Y)}{\partial \theta} = 0 </math> को हल करना होगा जिसका कोई बंद-रूप समाधान नहीं है। चूँकि नकारात्मक लॉग-संभावना, <math>-\ell(\theta\mid X,Y)</math>, एक उत्तल फलन है, और इसलिए ग्रेडिएंट डिसेंट जैसी मानक उत्तल अनुकूलन तकनीकों को θ का इष्टतम मान खोजने के लिए प्रयुक्त किया जा सकता है।
 ==व्यवहार में पॉइसन प्रतिगमन==
-पॉइसन प्रतिगमन उपयुक्त हो सकता है जब आश्रित चर एक गिनती है, उदाहरण के लिए पॉइसन वितरण#घटना जैसे कॉल सेंटर पर टेलीफोन कॉल का आगमन।<ref>{{cite book |last=Greene |first=William H. |title=अर्थमितीय विश्लेषण|url=https://archive.org/details/econometricanaly00gree_283 |url-access=registration |edition=Fifth |publisher=Prentice-Hall |year=2003 |pages=[https://archive.org/details/econometricanaly00gree_283/page/n767 740]–752 |isbn=978-0130661890 }}</ref> घटनाएँ इस अर्थ में स्वतंत्र होनी चाहिए कि एक कॉल के आने से दूसरी कॉल की संभावना कम या ज्यादा नहीं होगी, लेकिन घटनाओं की प्रति इकाई समय की संभावना को दिन के समय जैसे सहसंयोजकों से संबंधित माना जाता है।
+पॉइसन प्रतिगमन उपयुक्त हो सकता है जब आश्रित चर एक गिनती है, उदाहरण के लिए पॉइसन वितरण#घटना जैसे कॉल सेंटर पर टेलीफोन कॉल का आगमन।<ref>{{cite book |last=Greene |first=William H. |title=अर्थमितीय विश्लेषण|url=https://archive.org/details/econometricanaly00gree_283 |url-access=registration |edition=Fifth |publisher=Prentice-Hall |year=2003 |pages=[https://archive.org/details/econometricanaly00gree_283/page/n767 740]–752 |isbn=978-0130661890 }}</ref> घटनाएँ इस अर्थ में स्वतंत्र होनी चाहिए कि एक कॉल के आने से दूसरी कॉल की संभावना कम या ज्यादा नहीं होगी, किंतु घटनाओं की प्रति इकाई समय की संभावना को दिन के समय जैसे सहसंयोजकों से संबंधित माना जाता है।
 === एक्सपोज़र और ऑफसेट===
-पॉइसन प्रतिगमन दर डेटा के लिए भी उपयुक्त हो सकता है, जहां दर उस इकाई के एक्सपोज़र (अवलोकन की एक विशेष इकाई) के कुछ माप से विभाजित घटनाओं की गिनती है। उदाहरण के लिए, जीवविज्ञानी किसी जंगल में वृक्ष प्रजातियों की संख्या की गणना कर सकते हैं: घटनाएँ वृक्ष अवलोकन होंगी, एक्सपोज़र इकाई क्षेत्र होगा, और दर प्रति इकाई क्षेत्र में प्रजातियों की संख्या होगी। जनसांख्यिकी विशेषज्ञ भौगोलिक क्षेत्रों में मृत्यु दर को व्यक्ति-वर्ष से विभाजित मौतों की संख्या के रूप में मॉडल कर सकते हैं। अधिक आम तौर पर, घटना दरों की गणना प्रति इकाई समय की घटनाओं के रूप में की जा सकती है, जो प्रत्येक इकाई के लिए अवलोकन विंडो को अलग-अलग करने की अनुमति देती है। इन उदाहरणों में, एक्सपोज़र क्रमशः इकाई क्षेत्र, व्यक्ति-वर्ष और इकाई समय है। पॉइसन प्रतिगमन में इसे 'ऑफ़सेट' के रूप में संभाला जाता है। यदि दर गणना/एक्सपोज़र है, तो समीकरण के दोनों पक्षों को एक्सपोज़र से गुणा करने पर यह समीकरण के दाईं ओर चला जाता है। जब समीकरण के दोनों पक्षों को लॉग किया जाता है, तो अंतिम मॉडल में एक शब्द के रूप में लॉग (एक्सपोज़र) होता है जो प्रतिगमन गुणांक में जोड़ा जाता है। इस लॉग वेरिएबल, लॉग (एक्सपोज़र) को ऑफसेट वेरिएबल कहा जाता है और समीकरण के दाईं ओर एक पैरामीटर अनुमान (लॉग (एक्सपोज़र) के लिए) 1 तक सीमित होता है।
+पॉइसन प्रतिगमन दर डेटा के लिए भी उपयुक्त हो सकता है, जहां दर उस इकाई के एक्सपोज़र (अवलोकन की एक विशेष इकाई) के कुछ माप से विभाजित घटनाओं की गिनती है। उदाहरण के लिए, जीवविज्ञानी किसी जंगल में वृक्ष प्रजातियों की संख्या की गणना कर सकते हैं: घटनाएँ वृक्ष अवलोकन होंगी, एक्सपोज़र इकाई क्षेत्र होगा, और दर प्रति इकाई क्षेत्र में प्रजातियों की संख्या होगी। जनसांख्यिकी विशेषज्ञ भौगोलिक क्षेत्रों में मृत्यु दर को व्यक्ति-वर्ष से विभाजित मौतों की संख्या के रूप में मॉडल कर सकते हैं। अधिक सामान्यतः, घटना दरों की गणना प्रति इकाई समय की घटनाओं के रूप में की जा सकती है, जो प्रत्येक इकाई के लिए अवलोकन विंडो को अलग-अलग करने की अनुमति देती है। इन उदाहरणों में, एक्सपोज़र क्रमशः इकाई क्षेत्र, व्यक्ति-वर्ष और इकाई समय है। पॉइसन प्रतिगमन में इसे 'ऑफ़सेट' के रूप में संभाला जाता है। यदि दर गणना/एक्सपोज़र है, तो समीकरण के दोनों पक्षों को एक्सपोज़र से गुणा करने पर यह समीकरण के दाईं ओर चला जाता है। जब समीकरण के दोनों पक्षों को लॉग किया जाता है, तो अंतिम मॉडल में एक शब्द के रूप में लॉग (एक्सपोज़र) होता है जो प्रतिगमन गुणांक में जोड़ा जाता है। इस लॉग वेरिएबल, लॉग (एक्सपोज़र) को ऑफसेट वेरिएबल कहा जाता है और समीकरण के दाईं ओर एक पैरामीटर अनुमान (लॉग (एक्सपोज़र) के लिए) 1 तक सीमित होता है।
 :<math>\log(\operatorname{E}(Y\mid x)) = \theta' x</math>
 जो ये दर्शाता हे
 :<math>\log\left(\frac{\operatorname{E}(Y\mid x)}{\text{exposure}}\right) = \log(\operatorname{E}(Y\mid x)) - \log(\text{exposure}) =
          \theta' x  - \log(\text{exposure}) </math>
-[[आर (प्रोग्रामिंग भाषा)]] में एक सामान्यीकृत रैखिक मॉडल के मामले में ऑफसेट का उपयोग करके प्राप्त किया जा सकता है <code>offset()</code> समारोह:
+आर में जीएलएम के स्थिति में ऑफसेट को <code>offset()</code> फलन का उपयोग करके प्राप्त किया जा सकता है:
 <syntaxhighlight lang="r">
@@ Line 61: / Line 62: @@
 ===[[अति फैलाव]] और शून्य मुद्रास्फीति===
-पॉइसन वितरण की एक विशेषता यह है कि इसका माध्य इसके विचरण के बराबर है। कुछ परिस्थितियों में, यह पाया जाएगा कि देखा गया विचरण माध्य से अधिक है; इसे अति फैलाव के रूप में जाना जाता है और यह इंगित करता है कि मॉडल उपयुक्त नहीं है। एक सामान्य कारण प्रासंगिक व्याख्यात्मक चर, या आश्रित टिप्पणियों का चूक है। कुछ परिस्थितियों में, अति-विक्षेपण की समस्या को [[अर्ध-संभावना]] अनुमान या इसके बजाय [[नकारात्मक द्विपद वितरण]] का उपयोग करके हल किया जा सकता है।<ref>{{cite journal|author=Paternoster R, Brame R|year=1997|title=Multiple routes to delinquency? A test of developmental and general theories of crime|journal=Criminology|volume=35|pages=45–84|doi=10.1111/j.1745-9125.1997.tb00870.x}}</ref><ref>{{cite journal|author=Berk R, MacDonald J|title=अति फैलाव और पॉइसन प्रतिगमन|journal=Journal of Quantitative Criminology|volume=24|pages=269–284|year=2008|doi=10.1007/s10940-008-9048-4|issue=3|s2cid=121273486 }}</ref> वेर होफ और बोवेंग ने अर्ध-पॉइसन (जिसे अर्ध-संभावना के साथ अति-फैलाव भी कहा जाता है) और नकारात्मक द्विपद (गामा-पॉइसन के बराबर) के बीच अंतर का वर्णन इस प्रकार किया: यदि ई (वाई) = μ, अर्ध-पॉइसन मॉडल var (Y) मानता है ) = θμ जबकि गामा-पॉइसन var(Y) = μ(1+ κμ) मानता है, जहां θ अर्ध-पॉइसन अतिफैलाव पैरामीटर है, और κ नकारात्मक द्विपद वितरण का आकार पैरामीटर है। दोनों मॉडलों के लिए, मापदंडों का अनुमान पुनरावृत्तीय रूप से पुनः भारित न्यूनतम वर्गों का उपयोग करके लगाया जाता है। अर्ध-पॉइसन के लिए, भार μ/θ हैं। ऋणात्मक द्विपद के लिए, भार μ/(1 + κμ) हैं। बड़े μ और पर्याप्त अतिरिक्त-पॉइसन भिन्नता के साथ, नकारात्मक द्विपद भार 1/κ पर सीमित हैं। वेर होफ और बोवेंग ने एक उदाहरण पर चर्चा की जहां उन्होंने माध्य बनाम माध्य वर्ग अवशिष्टों को आलेखित करके दोनों के बीच चयन किया।<ref>{{cite journal|last1=Ver Hoef |first1=JAY M.
+पॉइसन वितरण की एक विशेषता यह है कि इसका माध्य इसके विचरण के समान है। कुछ परिस्थितियों में, यह पाया जाएगा कि देखा गया विचरण माध्य से अधिक है; इसे अति फैलाव के रूप में जाना जाता है और यह इंगित करता है कि मॉडल उपयुक्त नहीं है। एक सामान्य कारण प्रासंगिक व्याख्यात्मक चर, या आश्रित टिप्पणियों का चूक है। कुछ परिस्थितियों में, अति-विक्षेपण की समस्या को [[अर्ध-संभावना]] अनुमान या इसके अतिरिक्त  [[नकारात्मक द्विपद वितरण]] का उपयोग करके हल किया जा सकता है।<ref>{{cite journal|author=Paternoster R, Brame R|year=1997|title=Multiple routes to delinquency? A test of developmental and general theories of crime|journal=Criminology|volume=35|pages=45–84|doi=10.1111/j.1745-9125.1997.tb00870.x}}</ref><ref>{{cite journal|author=Berk R, MacDonald J|title=अति फैलाव और पॉइसन प्रतिगमन|journal=Journal of Quantitative Criminology|volume=24|pages=269–284|year=2008|doi=10.1007/s10940-008-9048-4|issue=3|s2cid=121273486 }}</ref>
+वेर होफ और बोवेंग ने अर्ध-पॉइसन (जिसे अर्ध-संभावना के साथ अति-फैलाव भी कहा जाता है) और नकारात्मक द्विपद (गामा-पॉइसन के समान) के बीच अंतर का वर्णन इस प्रकार किया: यदि ''E''(''Y'') = ''μ'', अर्ध-पॉइसन मॉडल varr(''Y'') = ''θμ'' मानता है जबकि गामा-पॉइसन var(Y) = μ(1+ κμ) मानता है, जहां θ अर्ध-पॉइसन अतिफैलाव पैरामीटर है, और κ नकारात्मक द्विपद वितरण का आकार पैरामीटर है। दोनों मॉडलों के लिए, मापदंडों का अनुमान पुनरावृत्तीय रूप से पुनः भारित न्यूनतम वर्गों का उपयोग करके लगाया जाता है। अर्ध-पॉइसन के लिए, भार μ/θ हैं। ऋणात्मक द्विपद के लिए, भार μ/(1 + κμ) हैं। बड़े μ और पर्याप्त अतिरिक्त-पॉइसन भिन्नता के साथ, नकारात्मक द्विपद भार 1/κ पर सीमित हैं। वेर होफ और बोवेंग ने एक उदाहरण पर चर्चा की जहां उन्होंने माध्य बनाम माध्य वर्ग अवशिष्टों को आलेखित करके दोनों के बीच चयन किया था।<ref>{{cite journal|last1=Ver Hoef |first1=JAY M.
 |last2=Boveng |first2 = Peter L.
 |title=Quasi-Poisson vs. Negative Binomial Regression: How should we model overdispersed count data?|journal=Ecology|date=2007-01-01|volume=88|issue=11|pages=2766–2772|url=http://digitalcommons.unl.edu/cgi/viewcontent.cgi?article=1141&context=usdeptcommercepub|access-date=2016-09-01|doi=10.1890/07-0043.1|pmid=18051645
 }}</ref>
-पॉइसन प्रतिगमन के साथ एक और आम समस्या अतिरिक्त शून्य है: यदि काम पर दो प्रक्रियाएं हैं, एक यह निर्धारित करती है कि शून्य घटनाएं हैं या कोई घटना है, और एक पॉइसन प्रक्रिया यह निर्धारित करती है कि कितनी घटनाएं हैं, तो पॉइसन प्रतिगमन की तुलना में अधिक शून्य होंगे भविष्यवाणी करना। एक उदाहरण उस समूह के सदस्यों द्वारा एक घंटे में पी गई सिगरेट का वितरण होगा जहां कुछ व्यक्ति धूम्रपान नहीं करते हैं।
-अन्य सामान्यीकृत रैखिक मॉडल जैसे नकारात्मक द्विपद वितरण मॉडल या शून्य-फुलाया मॉडल इन मामलों में बेहतर कार्य कर सकते हैं।
+पॉइसन प्रतिगमन के साथ एक और समान्य समस्या अतिरिक्त शून्य है: यदि काम पर दो प्रक्रियाएं हैं, एक यह निर्धारित करती है कि शून्य घटनाएं हैं या कोई घटना है और एक पॉइसन प्रक्रिया यह निर्धारित करती है कि कितनी घटनाएं हैं, तो पॉइसन प्रतिगमन की तुलना में अधिक शून्य होंगे पूर्वानुमान करना है। एक उदाहरण उस समूह के सदस्यों द्वारा एक घंटे में पी गई सिगरेट का वितरण होगा जहां कुछ व्यक्ति धूम्रपान नहीं करते हैं।
+अन्य सामान्यीकृत रैखिक मॉडल जैसे नकारात्मक द्विपद वितरण मॉडल या शून्य-फुलाया मॉडल इन स्थितियों  में उत्तम कार्य कर सकते हैं।
+इसके विपरीत, कम फैलाव पैरामीटर अनुमान के लिए एक समस्या उत्पन्न कर सकता है।<ref>{{cite journal |last1=Schwarzenegger |first1=Rafael |last2=Quigley |first2=John |last3=Walls |first3=Lesley |title=Is eliciting dependency worth the effort? A study for the multivariate Poisson-Gamma probability model |journal=Proceedings of the Institution of Mechanical Engineers, Part O: Journal of Risk and Reliability |date=23 November 2021 |page=5 |doi=10.1177/1748006X211059417 |doi-access=free }}</ref>
-इसके विपरीत, कम फैलाव पैरामीटर अनुमान के लिए एक समस्या पैदा कर सकता है।<ref>{{cite journal |last1=Schwarzenegger |first1=Rafael |last2=Quigley |first2=John |last3=Walls |first3=Lesley |title=Is eliciting dependency worth the effort? A study for the multivariate Poisson-Gamma probability model |journal=Proceedings of the Institution of Mechanical Engineers, Part O: Journal of Risk and Reliability |date=23 November 2021 |page=5 |doi=10.1177/1748006X211059417 |doi-access=free }}</ref>
 ===[[उत्तरजीविता विश्लेषण]] में उपयोग===
-पॉइसन प्रतिगमन आनुपातिक खतरों के मॉडल बनाता है, अस्तित्व विश्लेषण का एक वर्ग: कॉक्स मॉडल के विवरण के लिए आनुपातिक खतरों के मॉडल देखें।
+पॉइसन प्रतिगमन आनुपातिक खतरों के मॉडल बनाता है,अस्तित्व विश्लेषण का एक वर्ग: कॉक्स मॉडल के विवरण के लिए आनुपातिक खतरों के मॉडल देखें।
 ==एक्सटेंशन==
@@ Line 80: / Line 85: @@
 ===नियमित पॉइसन प्रतिगमन===
-पॉइसन प्रतिगमन के लिए मापदंडों का अनुमान लगाते समय, कोई आम तौर पर θ के लिए मान ढूंढने का प्रयास करता है जो फॉर्म की अभिव्यक्ति की संभावना को अधिकतम करता है
+पॉइसन प्रतिगमन के लिए मापदंडों का अनुमान लगाते समय कोई सामान्यतः θ के लिए मान खोजने का प्रयास करता है जो फॉर्म की अभिव्यक्ति की संभावना को अधिकतम करता है
 :<math>\sum_{i=1}^m \log(p(y_i;e^{\theta' x_i})),</math>
-जहां m डेटा सेट में उदाहरणों की संख्या है, और <math>p(y_i;e^{\theta' x_i})</math> माध्य सेट के साथ पॉइसन वितरण की संभाव्यता द्रव्यमान फ़ंक्शन है <math>e^{\theta' x_i}</math>. अधिकतमीकरण के बजाय इस अनुकूलन समस्या में नियमितीकरण जोड़ा जा सकता है <ref name= Perperoglou pp. 451-462 >{{cite journal | last=Perperoglou | first=Aris | title=दंडित पॉइसन प्रतिगमन के साथ उत्तरजीविता डेटा फ़िट करना| journal=Statistical Methods & Applications | publisher=Springer Nature | volume=20 | issue=4 | date=2011-09-08 | issn=1618-2510 | doi=10.1007/s10260-011-0172-1 | pages=451–462| s2cid=10883925 }}</ref>
+जहां m डेटा सेट में उदाहरणों की संख्या है, और <math>p(y_i;e^{\theta' x_i})</math> पॉइसन वितरण का संभाव्यता द्रव्यमान फलन है जिसका माध्य <math>e^{\theta' x_i}</math> पर सेट है। इस अनुकूलन समस्या में अधिकतमीकरण के अतिरिक्त नियमितीकरण को जोड़ा जा सकता है<ref name="Perperoglou">{{cite journal | last=Perperoglou | first=Aris | title=दंडित पॉइसन प्रतिगमन के साथ उत्तरजीविता डेटा फ़िट करना| journal=Statistical Methods & Applications | publisher=Springer Nature | volume=20 | issue=4 | date=2011-09-08 | issn=1618-2510 | doi=10.1007/s10260-011-0172-1 | pages=451–462| s2cid=10883925 }}</ref>
 :<math>\sum_{i=1}^m \log(p(y_i;e^{\theta' x_i})) - \lambda \left\|\theta\right\|_2^2,</math>
 कुछ सकारात्मक स्थिरांक के लिए <math>\lambda</math>. [[ रिज प्रतिगमन ]] के समान यह तकनीक, [[ओवरफिटिंग]] को कम कर सकती है।
+'''मॉडल बनाता है,अस्तित्व विश्लेषण का एक वर्ग: कॉक्स मॉडल के विवरण के लिए आनुपातिक खतरों के मॉडल देखें'''
 ==यह भी देखें==
@@ Line 92: / Line 100: @@
 * पॉसों वितरण
 * [[निश्चित-प्रभाव पॉइसन मॉडल]]
-* {{section link|Partial likelihood methods for panel data#Pooled QMLE for Poisson models}}
+* {{section link|पैनल डेटा के लिए आंशिक संभावना विधियां या पॉइसन मॉडल के लिए पूलित क्यूएमएलई}}
-* {{section link|Control function (econometrics)#Endogeneity in Poisson regression}}
+* {{section link|नियंत्रण फ़ंक्शन (अर्थमिति) या पॉइसन प्रतिगमन में एंडोजेनिटी}}
 ==संदर्भ==

Anonymous

Search

पॉइसन प्रतिगमन: Difference between revisions

Namespaces

More

Page actions

Revision as of 09:01, 12 July 2023

Contents

प्रतिगमन मॉडल

अधिकतम संभावना-आधारित पैरामीटर अनुमान