बीटा-द्विपद वितरण: Difference between revisions

From Vigyanwiki
(Created page with "{{Short description|Discrete probability distribution}} {{Probability distribution | pdf_image =Image:Beta-binomial distribution pmf.png|325px|Probability mass function f...")
 
No edit summary
Line 24: Line 24:
   }}
   }}


संभाव्यता सिद्धांत और आंकड़ों में, बीटा-[[द्विपद वितरण]] गैर-नकारात्मक पूर्णांकों के परिमित [[समर्थन (गणित)]] पर असतत संभाव्यता वितरण का एक परिवार है, जब बर्नौली परीक्षणों की निश्चित या ज्ञात संख्या में से प्रत्येक में सफलता की संभावना या तो अज्ञात होती है। या यादृच्छिक। बीटा-द्विपद वितरण द्विपद वितरण है जिसमें प्रत्येक 'एन'' परीक्षण में सफलता की संभावना तय नहीं है लेकिन [[बीटा वितरण]] से यादृच्छिक रूप से तैयार की जाती है। द्विपद प्रकार वितरित डेटा में [[अतिफैलाव]] को पकड़ने के लिए [[बायेसियन सांख्यिकी]], अनुभवजन्य बेयस विधियों और शास्त्रीय आंकड़ों में इसका उपयोग अक्सर किया जाता है।
संभाव्यता सिद्धांत और आंकड़ों में, बीटा-[[द्विपद वितरण]] गैर-नकारात्मक पूर्णांकों के परिमित [[समर्थन (गणित)]] पर असतत संभाव्यता वितरण का एक परिवार है, जब बर्नौली परीक्षणों की निश्चित या ज्ञात संख्या में से प्रत्येक में सफलता की संभावना या तो अज्ञात होती है। या यादृच्छिक। बीटा-द्विपद वितरण द्विपद वितरण है जिसमें प्रत्येक 'एन'' परीक्षण में सफलता की संभावना तय नहीं है लेकिन [[बीटा वितरण]] से यादृच्छिक रूप से तैयार की जाती है। द्विपद प्रकार वितरित आंकड़े में [[अतिफैलाव]] को पकड़ने के लिए [[बायेसियन सांख्यिकी]], अनुभवजन्य बेयस विधियों और शास्त्रीय आंकड़ों में इसका उपयोग प्रायः किया जाता है।''


बीटा-द्विपद डिरिचलेट-[[बहुपद वितरण]] का एक-आयामी संस्करण है क्योंकि द्विपद और बीटा वितरण क्रमशः बहुराष्ट्रीय वितरण और [[डिरिचलेट वितरण]] के एकतरफा संस्करण हैं। विशेष मामला जहां ''α'' और ''β'' पूर्णांक हैं, उन्हें [[नकारात्मक हाइपरज्यामितीय वितरण]] के रूप में भी जाना जाता है।
बीटा-द्विपद डिरिचलेट-[[बहुपद वितरण]] का एक-आयामी संस्करण है क्योंकि द्विपद और बीटा वितरण क्रमशः बहुराष्ट्रीय वितरण और [[डिरिचलेट वितरण]] के एकतरफा संस्करण हैं। विशेष घटना  जहां ''α'' और ''β'' पूर्णांक हैं, उन्हें [[नकारात्मक हाइपरज्यामितीय वितरण]] के रूप में भी जाना जाता है।


== प्रेरणा और व्युत्पत्ति ==
== प्रेरणा और व्युत्पत्ति ==
Line 32: Line 32:
=== [[यौगिक वितरण]] के रूप में ===
=== [[यौगिक वितरण]] के रूप में ===
द्विपद वितरण से पहले बीटा वितरण एक संयुग्म है। यह तथ्य एक विश्लेषणात्मक रूप से ट्रैक्टेबल कंपाउंड डिस्ट्रीब्यूशन की ओर जाता है जहां कोई सोच सकता है <math> p </math> बीटा वितरण से यादृच्छिक रूप से निकाले जाने के रूप में द्विपद वितरण में पैरामीटर।
द्विपद वितरण से पहले बीटा वितरण एक संयुग्म है। यह तथ्य एक विश्लेषणात्मक रूप से ट्रैक्टेबल कंपाउंड डिस्ट्रीब्यूशन की ओर जाता है जहां कोई सोच सकता है <math> p </math> बीटा वितरण से यादृच्छिक रूप से निकाले जाने के रूप में द्विपद वितरण में पैरामीटर।
मान लीजिए कि हमें हेड्स की संख्या का अनुमान लगाने में दिलचस्पी है, <math>x</math> में <math>n</math> भविष्य के परीक्षण। यह द्वारा दिया गया है
 
मान लीजिए कि हमें हेड्स की संख्या का अनुमान लगाने में दिलचस्पी है, <math>x</math> में <math>n</math> भविष्य के परीक्षण। इसके द्वारा दिया गया है  


:<math>
:<math>
Line 62: Line 63:
  \end{align}
  \end{align}
</math>
</math>
और [[कुकुदता]] है
और [[कुकुदता|कर्टोसिस]] है
::<math>  
::<math>  
   \beta_2 = \frac{(\alpha + \beta)^2 (1+\alpha+\beta)}{n \alpha \beta( \alpha + \beta + 2)(\alpha + \beta + 3)(\alpha + \beta + n) } \left[ (\alpha + \beta)(\alpha + \beta - 1 + 6n) + 3 \alpha\beta(n - 2) + 6n^2 -\frac{3\alpha\beta n(6-n)}{\alpha + \beta} - \frac{18\alpha\beta n^{2}}{(\alpha+\beta)^2} \right].
   \beta_2 = \frac{(\alpha + \beta)^2 (1+\alpha+\beta)}{n \alpha \beta( \alpha + \beta + 2)(\alpha + \beta + 3)(\alpha + \beta + n) } \left[ (\alpha + \beta)(\alpha + \beta - 1 + 6n) + 3 \alpha\beta(n - 2) + 6n^2 -\frac{3\alpha\beta n(6-n)}{\alpha + \beta} - \frac{18\alpha\beta n^{2}}{(\alpha+\beta)^2} \right].
Line 76: Line 77:
  = np(1-p) \frac{\alpha + \beta + n}{\alpha + \beta + 1} = np(1-p)[1+(n-1)\rho]
  = np(1-p) \frac{\alpha + \beta + n}{\alpha + \beta + 1} = np(1-p)[1+(n-1)\rho]
\!</math>
\!</math>
कहाँ <math>\rho= \tfrac{1}{\alpha+\beta+1}\!</math>. पैरामीटर <math>\rho \; \!</math> इंट्रा क्लास या इंट्रा क्लस्टर सहसंबंध के रूप में जाना जाता है। यह सकारात्मक सहसंबंध है जो अति फैलाव को जन्म देता है। ध्यान दें कि कब <math>n=1</math>, बीटा और द्विपद भिन्नता के बीच अंतर करने के लिए कोई जानकारी उपलब्ध नहीं है, और दो मॉडलों में समान भिन्नताएं हैं।
जहाँ  <math>\rho= \tfrac{1}{\alpha+\beta+1}\!</math>. पैरामीटर <math>\rho \; \!</math> इंट्रा क्लास या इंट्रा क्लस्टर सहसंबंध के रूप में जाना जाता है। यह सकारात्मक सहसंबंध है जो अति फैलाव को जन्म देता है। ध्यान दें कि कब <math>n=1</math>, बीटा और द्विपद भिन्नता के बीच अंतर करने के लिए कोई जानकारी उपलब्ध नहीं है, और दो मॉडलों में समान भिन्नताएं हैं।


=== फैक्टोरियल मोमेंट्स === {{math|''r''}}}-बीटा-द्विपद यादृच्छिक चर का वाँ [[तथ्यात्मक क्षण]] {{math|''X''}} है
=== फैक्टोरियल मोमेंट्स === {{math|''r''}}}-बीटा-द्विपद यादृच्छिक चर का वाँ [[तथ्यात्मक क्षण]] {{math|''X''}} है
Line 94: Line 95:
  \end{align}
  \end{align}
</math>
</math>
ये अनुमान गैर-संवेदनात्मक रूप से नकारात्मक हो सकते हैं जो इस बात का प्रमाण है कि द्विपद वितरण के सापेक्ष डेटा या तो अविच्छिन्न या अल्पप्रकीर्णित है। इस मामले में, द्विपद वितरण और अतिज्यामितीय वितरण क्रमशः वैकल्पिक उम्मीदवार हैं।
ये अनुमान गैर-संवेदनात्मक रूप से नकारात्मक हो सकते हैं जो इस बात का प्रमाण है कि द्विपद वितरण के सापेक्ष आंकड़े या तो अविच्छिन्न या अल्पप्रकीर्णित है। इस मामले में, द्विपद वितरण और अतिज्यामितीय वितरण क्रमशः वैकल्पिक उम्मीदवार हैं।


=== अधिकतम संभावना अनुमान ===
=== अधिकतम संभावना अनुमान ===


जबकि क्लोज-फॉर्म अधिकतम संभावना अव्यावहारिक है, यह देखते हुए कि पीडीएफ में सामान्य कार्य (गामा फ़ंक्शन और/या बीटा फ़ंक्शन) होते हैं, उन्हें प्रत्यक्ष संख्यात्मक अनुकूलन के माध्यम से आसानी से पाया जा सकता है। अनुभवजन्य डेटा से अधिकतम संभावना अनुमान बहुराष्ट्रीय पोल्या वितरण को फिट करने के लिए सामान्य तरीकों का उपयोग करके गणना की जा सकती है, जिसके लिए विधियाँ #Minka2003|(Minka 2003) में वर्णित हैं।
जबकि क्लोज-फॉर्म अधिकतम संभावना अव्यावहारिक है, यह देखते हुए कि पीडीएफ में सामान्य कार्य (गामा फ़ंक्शन और/या बीटा फ़ंक्शन) होते हैं, उन्हें प्रत्यक्ष संख्यात्मक अनुकूलन के माध्यम से आसानी से पाया जा सकता है। अनुभवजन्य आंकड़े से अधिकतम संभावना अनुमान बहुराष्ट्रीय पोल्या वितरण को फिट करने के लिए सामान्य तरीकों का उपयोग करके गणना की जा सकती है, जिसके लिए विधियाँ (मिन्का 2003) में वर्णित हैं।
R (प्रोग्रामिंग लैंग्वेज) पैकेज VGAM फ़ंक्शन vglm के माध्यम से, अधिकतम संभावना के माध्यम से, बीटा-द्विपद वितरण के अनुसार वितरित प्रतिक्रियाओं के साथ [[सामान्यीकृत रैखिक मॉडल]] प्रकार के मॉडल की फिटिंग की सुविधा प्रदान करता है। इस बात की कोई आवश्यकता नहीं है कि संपूर्ण प्रेक्षणों के दौरान n स्थिर रहता है।
 
आर (प्रोग्रामिंग लैंग्वेज) पैकेज वीजीएएम फ़ंक्शन वीजीएलएम के माध्यम से, अधिकतम संभावना के माध्यम से, बीटा-द्विपद वितरण के अनुसार वितरित प्रतिक्रियाओं के साथ [[सामान्यीकृत रैखिक मॉडल]] प्रकार के मॉडल की फिटिंग की सुविधा प्रदान करता है। इस बात की कोई आवश्यकता नहीं है कि संपूर्ण प्रेक्षणों के दौरान n स्थिर रहता है।


=== उदाहरण ===
=== उदाहरण ===


निम्नलिखित डेटा 19वीं सदी के [[सैक्सोनी]] में अस्पताल के रिकॉर्ड से लिए गए 6115 परिवारों में परिवार के आकार 13 के पहले 12 बच्चों में पुरुष बच्चों की संख्या देता है (लिंडसे से सोकल और रोल्फ़, पृ. 59)। 13वें बच्चे को अनदेखा किया जाता है ताकि वांछित लिंग प्राप्त होने पर परिवारों के गैर-यादृच्छिक रूप से रुकने के प्रभाव को कम किया जा सके।
निम्नलिखित आंकड़े 19वीं सदी के [[सैक्सोनी]] में अस्पताल के रिकॉर्ड से लिए गए 6115 परिवारों में परिवार के आकार 13 के पहले 12 बच्चों में पुरुष बच्चों की संख्या देता है (लिंडसे से सोकल और रोल्फ़, पृ. 59)। 13वें बच्चे को अनदेखा किया जाता है ताकि वांछित लिंग प्राप्त होने पर परिवारों के गैर-यादृच्छिक रूप से रुकने के प्रभाव को कम किया जा सके।
{| class="wikitable"
{| class="wikitable"
|-
|-
Line 138: Line 140:
   \log \mathcal{L} = -12492.9
   \log \mathcal{L} = -12492.9
</math>
</math>
जिससे हम एकैके सूचना कसौटी पाते हैं
जिससे हम एआईसी सूचना कसौटी पाते हैं


::<math>
::<math>
   \mathit{AIC}=24989.74.
   \mathit{AIC}=24989.74.
</math>
</math>
प्रतिस्पर्धी द्विपद मॉडल के लिए एआईसी एआईसी = 25070.34 है और इस प्रकार हम देखते हैं कि बीटा-द्विपद मॉडल डेटा के लिए बेहतर फिट प्रदान करता है यानी अति फैलाव के लिए सबूत है। ट्राइवर्स-विलार्ड परिकल्पना स्तनपायी संतानों के बीच लिंग-प्रवणता में विविधता के लिए एक सैद्धांतिक औचित्य को दर्शाती है।
प्रतिस्पर्धी द्विपद मॉडल के लिए एआईसी = 25070.34 है और इस प्रकार हम देखते हैं कि बीटा-द्विपद मॉडल आंकड़े के लिए बेहतर फिट प्रदान करता है यानी अति फैलाव के लिए सबूत है। ट्राइवर्स-विलार्ड परिकल्पना स्तनपायी संतानों के बीच लिंग-प्रवणता में विविधता के लिए एक सैद्धांतिक औचित्य को दर्शाती है।


बेहतर फिट विशेष रूप से पूंछों के बीच स्पष्ट है
बेहतर फिट विशेष रूप से पूंछों के बीच स्पष्ट है
Line 149: Line 151:
{| class="wikitable"
{| class="wikitable"
|-
|-
| '''Males'''|| 0|| 1|| 2|| 3|| 4|| 5|| 6|| 7|| 8|| 9|| 10|| 11|| 12
|पुरुषों
| 0|| 1|| 2|| 3|| 4|| 5|| 6|| 7|| 8|| 9|| 10|| 11|| 12
|-
|-
| '''Observed Families'''|| 3|| 24|| 104|| 286|| 670|| 1033|| 1343|| 1112|| 829|| 478|| 181|| 45|| 7
|परिवारों का अवलोकन किया
| 3|| 24|| 104|| 286|| 670|| 1033|| 1343|| 1112|| 829|| 478|| 181|| 45|| 7
|-
|-
| '''Fitted Expected (Beta-Binomial)'''|| 2.3|| 22.6|| 104.8|| 310.9|| 655.7|| 1036.2|| 1257.9|| 1182.1|| 853.6|| 461.9|| 177.9|| 43.8|| 5.2
|सज्जित अपेक्षित (बीटा-द्विपद)
| 2.3|| 22.6|| 104.8|| 310.9|| 655.7|| 1036.2|| 1257.9|| 1182.1|| 853.6|| 461.9|| 177.9|| 43.8|| 5.2
|-
|-
| '''Fitted Expected (Binomial ''p'' = 0.519215)'''|| 0.9|| 12.1|| 71.8|| 258.5|| 628.1|| 1085.2|| 1367.3|| 1265.6|| 854.2|| 410.0|| 132.8|| 26.1|| 2.3
|सज्जित अपेक्षित (द्विपद p = 0.519215)
| 0.9|| 12.1|| 71.8|| 258.5|| 628.1|| 1085.2|| 1367.3|| 1265.6|| 854.2|| 410.0|| 132.8|| 26.1|| 2.3
|}
|}
== बायेसियन सांख्यिकी में बीटा-द्विपद ==
== बायेसियन सांख्यिकी में बीटा-द्विपद ==


Line 174: Line 178:
\end{align}
\end{align}
</math>
</math>
कहाँ <math>C</math> एक सामान्यीकरण स्थिरांक है। हम पश्च वितरण को एक के रूप में पहचानते हैं <math>\mathrm{Beta}(y_1+\alpha,n_1-y_1+\beta)</math>.
जहाँ  <math>C</math> एक सामान्यीकरण स्थिरांक है। हम पश्च वितरण को एक के रूप में पहचानते हैं <math>\mathrm{Beta}(y_1+\alpha,n_1-y_1+\beta)</math>.


इस प्रकार, फिर से कंपाउंडिंग के माध्यम से, हम पाते हैं कि आकार के भविष्य के नमूने के योग का पश्चगामी वितरण <math>n_2</math> का <math>\mathrm{Bernoulli}(p)</math> यादृच्छिक चर है
इस प्रकार, फिर से कंपाउंडिंग के माध्यम से, हम पाते हैं कि आकार के भविष्य के नमूने के योग का पश्चगामी वितरण <math>n_2</math> का <math>\mathrm{Bernoulli}(p)</math> यादृच्छिक चर है
Line 187: Line 191:


== संबंधित वितरण ==
== संबंधित वितरण ==
* <math>\mathrm{BetaBin}(1, \alpha, \beta) \sim \mathrm{Bernoulli}(p)\,</math> कहाँ <math>p=\frac{\alpha}{\alpha+\beta}\,</math>.
* <math>\mathrm{BetaBin}(1, \alpha, \beta) \sim \mathrm{Bernoulli}(p)\,</math> जहाँ  <math>p=\frac{\alpha}{\alpha+\beta}\,</math>.
* <math>\mathrm{BetaBin}(n, 1, 1) \sim U(0,n)\,</math> कहाँ <math>U(a,b)\,</math> [[समान वितरण (असतत)]] है।
* <math>\mathrm{BetaBin}(n, 1, 1) \sim U(0,n)\,</math> जहाँ  <math>U(a,b)\,</math> [[समान वितरण (असतत)]] है।
* <math> \lim_{s \rightarrow \infty} \mathrm{BetaBin}(n, ps, (1-p)s) \sim \mathrm{B}(n,p)\,</math> कहाँ <math>p=\frac{\alpha}{\alpha+\beta}\,</math> और <math>s=\alpha+\beta\,</math> और <math>\mathrm{B}(n,p)\,</math> द्विपद वितरण है।
* <math> \lim_{s \rightarrow \infty} \mathrm{BetaBin}(n, ps, (1-p)s) \sim \mathrm{B}(n,p)\,</math> जहाँ  <math>p=\frac{\alpha}{\alpha+\beta}\,</math> और <math>s=\alpha+\beta\,</math> और <math>\mathrm{B}(n,p)\,</math> द्विपद वितरण है।
* <math>\lim_{n \rightarrow \infty} \mathrm{BetaBin}(n, \alpha, n\frac{(1-p)}{p}) \sim \mathrm{NB}(\alpha,p)\,</math> कहाँ <math>\mathrm{NB}(\alpha,p)\,</math> [[नकारात्मक द्विपद वितरण]] है।
* <math>\lim_{n \rightarrow \infty} \mathrm{BetaBin}(n, \alpha, n\frac{(1-p)}{p}) \sim \mathrm{NB}(\alpha,p)\,</math> जहाँ  <math>\mathrm{NB}(\alpha,p)\,</math> [[नकारात्मक द्विपद वितरण]] है।


== यह भी देखें ==
== यह भी देखें ==
Line 196: Line 200:


== संदर्भ ==
== संदर्भ ==
* {{anchor|Minka2003}}Minka, Thomas P. (2003). [http://research.microsoft.com/~minka/papers/dirichlet/ Estimating a Dirichlet distribution]. Microsoft Technical Report.
* {{anchor|Minka2003}}मिंका, थॉमस पी. (2003). डिरिचलेट वितरण का अनुमान लगाना। माइक्रोसॉफ्ट तकनीकी रिपोर्ट।




==बाहरी संबंध==
बाहरी संबंध
* [http://it.stlawu.edu/~msch/biometrics/papers.htm Using the Beta-binomial distribution to assess performance of a biometric identification device]
* [http://it.stlawu.edu/~msch/biometrics/papers.htm बायोमेट्रिक पहचान उपकरण के प्रदर्शन का आकलन करने के लिए बीटा-द्विपद वितरण का उपयोग करना]
* [http://research.microsoft.com/~minka/software/fastfit/ Fastfit] contains Matlab code for fitting Beta-Binomial distributions (in the form of two-dimensional Pólya distributions) to data.
* [http://research.microsoft.com/~minka/software/fastfit/ फास्टफिट] में डेटा के लिए बीटा-द्विपद वितरण (द्वि-आयामी पोल्या वितरण के रूप में) को फ़िट करने के लिए मैटलैब कोड होता है।.
* Interactive graphic: [http://www.math.wm.edu/~leemis/chart/UDR/UDR.html Univariate Distribution Relationships]
* इंटरएक्टिव ग्राफिक: [http://www.math.wm.edu/~leemis/chart/UDR/UDR.html यूनीवेरिएट डिस्ट्रीब्यूशन रिलेशनशिप]
* [https://cran.r-project.org/web/packages/VGAM/index.html Beta-binomial functions in VGAM R package]
* [https://cran.r-project.org/web/packages/VGAM/index.html वीजीएएम आर पैकेज में बीटा-द्विपद कार्य]
* [http://foundry.sandia.gov/releases/latest/javadoc-api/gov/sandia/cognition/statistics/distribution/BetaBinomialDistribution.html Beta-binomial distribution in Sandia National Labs Cognitive Foundry Java library]
* [http://foundry.sandia.gov/releases/latest/javadoc-api/gov/sandia/cognition/statistics/distribution/BetaBinomialDistribution.html सांडिया नेशनल लैब्स कॉग्निटिव फाउंड्री जावा लाइब्रेरी में बीटा-द्विपद वितरण]


{{Probability distributions}}
{{Probability distributions}}

Revision as of 16:55, 24 March 2023

Probability mass function
Probability mass function for the beta-binomial distribution
Cumulative distribution function
Cumulative probability distribution function for the beta-binomial distribution
Notation
Parameters nN0 — number of trials
(real)
(real)
Support x ∈ { 0, …, n }
PMF

where is the beta function
CDF

where 3F2(a;b;x) is the generalized hypergeometric function
Mean
Variance
Skewness
Ex. kurtosis See text
MGF where is the hypergeometric function
CF
PGF

संभाव्यता सिद्धांत और आंकड़ों में, बीटा-द्विपद वितरण गैर-नकारात्मक पूर्णांकों के परिमित समर्थन (गणित) पर असतत संभाव्यता वितरण का एक परिवार है, जब बर्नौली परीक्षणों की निश्चित या ज्ञात संख्या में से प्रत्येक में सफलता की संभावना या तो अज्ञात होती है। या यादृच्छिक। बीटा-द्विपद वितरण द्विपद वितरण है जिसमें प्रत्येक 'एन परीक्षण में सफलता की संभावना तय नहीं है लेकिन बीटा वितरण से यादृच्छिक रूप से तैयार की जाती है। द्विपद प्रकार वितरित आंकड़े में अतिफैलाव को पकड़ने के लिए बायेसियन सांख्यिकी, अनुभवजन्य बेयस विधियों और शास्त्रीय आंकड़ों में इसका उपयोग प्रायः किया जाता है।

बीटा-द्विपद डिरिचलेट-बहुपद वितरण का एक-आयामी संस्करण है क्योंकि द्विपद और बीटा वितरण क्रमशः बहुराष्ट्रीय वितरण और डिरिचलेट वितरण के एकतरफा संस्करण हैं। विशेष घटना जहां α और β पूर्णांक हैं, उन्हें नकारात्मक हाइपरज्यामितीय वितरण के रूप में भी जाना जाता है।

प्रेरणा और व्युत्पत्ति

यौगिक वितरण के रूप में

द्विपद वितरण से पहले बीटा वितरण एक संयुग्म है। यह तथ्य एक विश्लेषणात्मक रूप से ट्रैक्टेबल कंपाउंड डिस्ट्रीब्यूशन की ओर जाता है जहां कोई सोच सकता है बीटा वितरण से यादृच्छिक रूप से निकाले जाने के रूप में द्विपद वितरण में पैरामीटर।

मान लीजिए कि हमें हेड्स की संख्या का अनुमान लगाने में दिलचस्पी है, में भविष्य के परीक्षण। इसके द्वारा दिया गया है

बीटा समारोह के गुणों का उपयोग करके इसे वैकल्पिक रूप से लिखा जा सकता है


कलश मॉडल के रूप में बीटा-द्विपद

बीटा-द्विपद वितरण को α और β के सकारात्मक पूर्णांक मानों के लिए कलश मॉडल के माध्यम से भी प्रेरित किया जा सकता है, जिसे पोल्या कलश मॉडल के रूप में जाना जाता है। विशेष रूप से, α लाल गेंदों और β काली गेंदों वाले कलश की कल्पना करें, जहां यादृच्छिक ड्रॉ बनाए जाते हैं। यदि एक लाल गेंद देखी जाती है, तो दो लाल गेंदों को कलश में वापस कर दिया जाता है। इसी तरह, यदि एक काली गेंद निकाली जाती है, तो दो काली गेंदें कलश में वापस आ जाती हैं। यदि इसे n बार दोहराया जाता है, तो x लाल गेंदों को देखने की संभावना पैरामीटर n, α और β के साथ बीटा-द्विपद वितरण का अनुसरण करती है।

यदि यादृच्छिक ड्रॉ सरल प्रतिस्थापन के साथ होते हैं (प्रेक्षित गेंद के ऊपर और ऊपर कोई गेंद कलश में नहीं जोड़ी जाती है), तो वितरण एक द्विपद वितरण का अनुसरण करता है और यदि यादृच्छिक ड्रॉ प्रतिस्थापन के बिना किए जाते हैं, तो वितरण एक हाइपरज्यामितीय वितरण का अनुसरण करता है।

क्षण और गुण

पहले तीन कच्चे क्षण (गणित) हैं

और कर्टोसिस है

दे हम सुझाव देते हैं कि माध्य को इस प्रकार लिखा जा सकता है

और भिन्नता के रूप में

जहाँ . पैरामीटर इंट्रा क्लास या इंट्रा क्लस्टर सहसंबंध के रूप में जाना जाता है। यह सकारात्मक सहसंबंध है जो अति फैलाव को जन्म देता है। ध्यान दें कि कब , बीटा और द्विपद भिन्नता के बीच अंतर करने के लिए कोई जानकारी उपलब्ध नहीं है, और दो मॉडलों में समान भिन्नताएं हैं।

=== फैक्टोरियल मोमेंट्स === r}-बीटा-द्विपद यादृच्छिक चर का वाँ तथ्यात्मक क्षण X है

.

बिंदु अनुमान

आघूर्ण की विधि

क्षणों की विधि (सांख्यिकी) अनुमान बीटा-द्विपद के पहले और दूसरे क्षणों को ध्यान में रखते हुए और उन्हें नमूना क्षणों के बराबर सेट करके प्राप्त किया जा सकता है और . हम देखतें है

ये अनुमान गैर-संवेदनात्मक रूप से नकारात्मक हो सकते हैं जो इस बात का प्रमाण है कि द्विपद वितरण के सापेक्ष आंकड़े या तो अविच्छिन्न या अल्पप्रकीर्णित है। इस मामले में, द्विपद वितरण और अतिज्यामितीय वितरण क्रमशः वैकल्पिक उम्मीदवार हैं।

अधिकतम संभावना अनुमान

जबकि क्लोज-फॉर्म अधिकतम संभावना अव्यावहारिक है, यह देखते हुए कि पीडीएफ में सामान्य कार्य (गामा फ़ंक्शन और/या बीटा फ़ंक्शन) होते हैं, उन्हें प्रत्यक्ष संख्यात्मक अनुकूलन के माध्यम से आसानी से पाया जा सकता है। अनुभवजन्य आंकड़े से अधिकतम संभावना अनुमान बहुराष्ट्रीय पोल्या वितरण को फिट करने के लिए सामान्य तरीकों का उपयोग करके गणना की जा सकती है, जिसके लिए विधियाँ (मिन्का 2003) में वर्णित हैं।

आर (प्रोग्रामिंग लैंग्वेज) पैकेज वीजीएएम फ़ंक्शन वीजीएलएम के माध्यम से, अधिकतम संभावना के माध्यम से, बीटा-द्विपद वितरण के अनुसार वितरित प्रतिक्रियाओं के साथ सामान्यीकृत रैखिक मॉडल प्रकार के मॉडल की फिटिंग की सुविधा प्रदान करता है। इस बात की कोई आवश्यकता नहीं है कि संपूर्ण प्रेक्षणों के दौरान n स्थिर रहता है।

उदाहरण

निम्नलिखित आंकड़े 19वीं सदी के सैक्सोनी में अस्पताल के रिकॉर्ड से लिए गए 6115 परिवारों में परिवार के आकार 13 के पहले 12 बच्चों में पुरुष बच्चों की संख्या देता है (लिंडसे से सोकल और रोल्फ़, पृ. 59)। 13वें बच्चे को अनदेखा किया जाता है ताकि वांछित लिंग प्राप्त होने पर परिवारों के गैर-यादृच्छिक रूप से रुकने के प्रभाव को कम किया जा सके।

Males 0 1 2 3 4 5 6 7 8 9 10 11 12
Families 3 24 104 286 670 1033 1343 1112 829 478 181 45 7

पहले दो नमूना क्षण हैं

और इसलिए क्षणों का अनुमान लगाने की विधि है

अधिकतम संभावना अनुमान संख्यात्मक रूप से पाया जा सकता है

और अधिकतम लॉग संभावना है

जिससे हम एआईसी सूचना कसौटी पाते हैं

प्रतिस्पर्धी द्विपद मॉडल के लिए एआईसी = 25070.34 है और इस प्रकार हम देखते हैं कि बीटा-द्विपद मॉडल आंकड़े के लिए बेहतर फिट प्रदान करता है यानी अति फैलाव के लिए सबूत है। ट्राइवर्स-विलार्ड परिकल्पना स्तनपायी संतानों के बीच लिंग-प्रवणता में विविधता के लिए एक सैद्धांतिक औचित्य को दर्शाती है।

बेहतर फिट विशेष रूप से पूंछों के बीच स्पष्ट है

पुरुषों 0 1 2 3 4 5 6 7 8 9 10 11 12
परिवारों का अवलोकन किया 3 24 104 286 670 1033 1343 1112 829 478 181 45 7
सज्जित अपेक्षित (बीटा-द्विपद) 2.3 22.6 104.8 310.9 655.7 1036.2 1257.9 1182.1 853.6 461.9 177.9 43.8 5.2
सज्जित अपेक्षित (द्विपद p = 0.519215) 0.9 12.1 71.8 258.5 628.1 1085.2 1367.3 1265.6 854.2 410.0 132.8 26.1 2.3

बायेसियन सांख्यिकी में बीटा-द्विपद

बर्नौली सफलता की संभावना के बायेसियन अनुमान में बीटा-द्विपद वितरण एक प्रमुख भूमिका निभाता है जिसका अनुमान हम आंकड़ों के आधार पर लगाना चाहते हैं। होने देना स्वतंत्र और समान रूप से वितरित बर्नौली यादृच्छिक चर का एक नमूना (आँकड़े) बनें . मान लीजिए, हमारा ज्ञान - बायेसियन फैशन में - अनिश्चित है और पूर्व वितरण द्वारा तैयार किया गया है . अगर फिर संयुक्त वितरण के माध्यम से

.

अवलोकन करने के बाद हम ध्यान दें कि के लिए पश्च वितरण

जहाँ एक सामान्यीकरण स्थिरांक है। हम पश्च वितरण को एक के रूप में पहचानते हैं .

इस प्रकार, फिर से कंपाउंडिंग के माध्यम से, हम पाते हैं कि आकार के भविष्य के नमूने के योग का पश्चगामी वितरण का यादृच्छिक चर है

.

बीटा द्विपद-वितरित यादृच्छिक चर उत्पन्न करना

एक बीटा-द्विपद यादृच्छिक चर बनाने के लिए बस एक ड्रा करें और फिर ड्रा करें .

संबंधित वितरण

  • जहाँ .
  • जहाँ समान वितरण (असतत) है।
  • जहाँ और और द्विपद वितरण है।
  • जहाँ नकारात्मक द्विपद वितरण है।

यह भी देखें

  • डिरिचलेट-बहुराष्ट्रीय वितरण

संदर्भ

  • मिंका, थॉमस पी. (2003). डिरिचलेट वितरण का अनुमान लगाना। माइक्रोसॉफ्ट तकनीकी रिपोर्ट।


बाहरी संबंध