बीटा-द्विपद वितरण: Difference between revisions

From Vigyanwiki
(Created page with "{{Short description|Discrete probability distribution}} {{Probability distribution | pdf_image =Image:Beta-binomial distribution pmf.png|325px|Probability mass function f...")
 
No edit summary
 
(5 intermediate revisions by 4 users not shown)
Line 1: Line 1:
{{Short description|Discrete probability distribution}}
{{Short description|Discrete probability distribution}}
{{Probability distribution
{{Probability distribution
   | pdf_image  =[[Image:Beta-binomial distribution pmf.png|325px|Probability mass function for the beta-binomial distribution]]|
   | pdf_image  =[[Image:Beta-binomial distribution pmf.png|325px|Probability mass function for the beta-binomial distribution]]|| cdf_image  =[[Image:Beta-binomial cdf.png|325px|बीटा-द्विपद बंटन के लिए संचयी प्रायिकता बंटन फलन]]|| type      = mass
 
| cdf_image  =[[Image:Beta-binomial cdf.png|325px|Cumulative probability distribution function for the beta-binomial distribution]]|
 
  | type      = mass
   | notation  = <math>\mathrm{BetaBin}(n,\alpha,\beta)</math>
   | notation  = <math>\mathrm{BetaBin}(n,\alpha,\beta)</math>
   | parameters = ''n'' ∈ [[Natural numbers|'''N'''<sub>0</sub>]] — number of trials<br /><math>\alpha > 0</math> ([[real number|real]]) <br /><math>\beta > 0</math> ([[real number|real]])
   | parameters = ''n'' ∈ [[Natural numbers|'''N'''<sub>0</sub>]] — number of trials<br /><math>\alpha > 0</math> ([[real number|real]]) <br /><math>\beta > 0</math> ([[real number|real]])
   | support    = ''x'' ∈ {&thinsp;0, …, ''n''&thinsp;}
   | support    = ''x'' ∈ {&thinsp;0, …, ''n''&thinsp;}
   | pdf        =<math>\binom{n}{x} \frac{\mathrm{B}(x+\alpha,n-x+\beta)} {\mathrm{B}(\alpha,\beta)}\!</math> <br/><br/> where <math> \Beta(x,y)=\frac{\Gamma(x)\,\Gamma(y)}{\Gamma(x+y)}</math> is the [[beta function]]|
   | pdf        =<math>\binom{n}{x} \frac{\mathrm{B}(x+\alpha,n-x+\beta)} {\mathrm{B}(\alpha,\beta)}\!</math> <br/><br/> where <math> \Beta(x,y)=\frac{\Gamma(x)\,\Gamma(y)}{\Gamma(x+y)}</math> is the [[beta function]]|| cdf        =<math>\begin{cases} 0,& x < 0 \\ \binom{n}{x} \tfrac{\mathrm{B}(x+\alpha,n-x+\beta)} {\mathrm{B}(\alpha,\beta)} {}_3\!F_2(\boldsymbol{a};\boldsymbol{b};x), & 0 \le x < n \\ 1,& x \geq n \end{cases}</math> <br/><br/>where <big> <sub>3</sub>''F''<sub>2</sub>('''a''';'''b''';x)</big> is the [[Generalized hypergeometric series|generalized hypergeometric function]]<br/> <small><math>{}_3\!F_2(1, -x, n\! -\! x\! +\! \beta; n\! -\! x\! +\! 1, 1\! -\! x\! -\! \alpha; 1)\!</math></small>|| mean      =<math>\frac{n\alpha}{\alpha+\beta}\!</math>|| median    =|| mode      = || variance  =<math>\frac{n\alpha\beta(\alpha+\beta+n)}{(\alpha+\beta)^2(\alpha+\beta+1)}\!</math>|
  | cdf        =<math>\begin{cases} 0,& x < 0 \\ \binom{n}{x} \tfrac{\mathrm{B}(x+\alpha,n-x+\beta)} {\mathrm{B}(\alpha,\beta)} {}_3\!F_2(\boldsymbol{a};\boldsymbol{b};x), & 0 \le x < n \\ 1,& x \geq n \end{cases}</math> <br/><br/>where <big> <sub>3</sub>''F''<sub>2</sub>('''a''';'''b''';x)</big> is the [[Generalized hypergeometric series|generalized hypergeometric function]]<br/> <small><math>{}_3\!F_2(1, -x, n\! -\! x\! +\! \beta; n\! -\! x\! +\! 1, 1\! -\! x\! -\! \alpha; 1)\!</math></small>|
  | mean      =<math>\frac{n\alpha}{\alpha+\beta}\!</math>|
  | median    =|
  | mode      = |
  | variance  =<math>\frac{n\alpha\beta(\alpha+\beta+n)}{(\alpha+\beta)^2(\alpha+\beta+1)}\!</math>|
   | skewness  =<math>\tfrac{(\alpha+\beta+2n)(\beta-\alpha)}{(\alpha+\beta+2)}\sqrt{\tfrac{1+\alpha+\beta}{n\alpha\beta(n+\alpha+\beta)}}\!</math>|
   | skewness  =<math>\tfrac{(\alpha+\beta+2n)(\beta-\alpha)}{(\alpha+\beta+2)}\sqrt{\tfrac{1+\alpha+\beta}{n\alpha\beta(n+\alpha+\beta)}}\!</math>|
   | kurtosis  = See text|
   | kurtosis  = See text|
Line 24: Line 15:
   }}
   }}


संभाव्यता सिद्धांत और आंकड़ों में, बीटा-[[द्विपद वितरण]] गैर-नकारात्मक पूर्णांकों के परिमित [[समर्थन (गणित)]] पर असतत संभाव्यता वितरण का एक परिवार है, जब बर्नौली परीक्षणों की निश्चित या ज्ञात संख्या में से प्रत्येक में सफलता की संभावना या तो अज्ञात होती है। या यादृच्छिक। बीटा-द्विपद वितरण द्विपद वितरण है जिसमें प्रत्येक 'एन'' परीक्षण में सफलता की संभावना तय नहीं है लेकिन [[बीटा वितरण]] से यादृच्छिक रूप से तैयार की जाती है। द्विपद प्रकार वितरित डेटा में [[अतिफैलाव]] को पकड़ने के लिए [[बायेसियन सांख्यिकी]], अनुभवजन्य बेयस विधियों और शास्त्रीय आंकड़ों में इसका उपयोग अक्सर किया जाता है।
संभाव्यता सिद्धांत और आंकड़ों में, बीटा-[[द्विपद वितरण]] गैर-नकारात्मक पूर्णांकों के परिमित [[समर्थन (गणित)]] पर असतत संभाव्यता वितरण का एक परिवार है, जब बर्नौली परीक्षणों की निश्चित या ज्ञात संख्या में से प्रत्येक में सफलता की संभावना या तो अज्ञात होती है। या यादृच्छिक। बीटा-द्विपद वितरण द्विपद वितरण है जिसमें प्रत्येक 'एन'' परीक्षण में सफलता की संभावना तय नहीं है लेकिन [[बीटा वितरण]] से यादृच्छिक रूप से तैयार की जाती है। द्विपद प्रकार वितरित आंकड़े में [[अतिफैलाव]] को पकड़ने के लिए [[बायेसियन सांख्यिकी]], अनुभवजन्य बेयस विधियों और चिरसम्मत आंकड़ों में इसका उपयोग प्रायः किया जाता है।''


बीटा-द्विपद डिरिचलेट-[[बहुपद वितरण]] का एक-आयामी संस्करण है क्योंकि द्विपद और बीटा वितरण क्रमशः बहुराष्ट्रीय वितरण और [[डिरिचलेट वितरण]] के एकतरफा संस्करण हैं। विशेष मामला जहां ''α'' और ''β'' पूर्णांक हैं, उन्हें [[नकारात्मक हाइपरज्यामितीय वितरण]] के रूप में भी जाना जाता है।
बीटा-द्विपद डिरिचलेट-[[बहुपद वितरण]] का एक-आयामी संस्करण है क्योंकि द्विपद और बीटा वितरण क्रमशः बहुराष्ट्रीय वितरण और [[डिरिचलेट वितरण]] के एकतरफा संस्करण हैं। विशेष घटना  जहां ''α'' और ''β'' पूर्णांक हैं, उन्हें [[नकारात्मक हाइपरज्यामितीय वितरण]] के रूप में भी जाना जाता है।


== प्रेरणा और व्युत्पत्ति ==
== प्रेरणा और व्युत्पत्ति ==
Line 32: Line 23:
=== [[यौगिक वितरण]] के रूप में ===
=== [[यौगिक वितरण]] के रूप में ===
द्विपद वितरण से पहले बीटा वितरण एक संयुग्म है। यह तथ्य एक विश्लेषणात्मक रूप से ट्रैक्टेबल कंपाउंड डिस्ट्रीब्यूशन की ओर जाता है जहां कोई सोच सकता है <math> p </math> बीटा वितरण से यादृच्छिक रूप से निकाले जाने के रूप में द्विपद वितरण में पैरामीटर।
द्विपद वितरण से पहले बीटा वितरण एक संयुग्म है। यह तथ्य एक विश्लेषणात्मक रूप से ट्रैक्टेबल कंपाउंड डिस्ट्रीब्यूशन की ओर जाता है जहां कोई सोच सकता है <math> p </math> बीटा वितरण से यादृच्छिक रूप से निकाले जाने के रूप में द्विपद वितरण में पैरामीटर।
मान लीजिए कि हमें हेड्स की संख्या का अनुमान लगाने में दिलचस्पी है, <math>x</math> में <math>n</math> भविष्य के परीक्षण। यह द्वारा दिया गया है
 
मान लीजिए कि हमें हेड्स की संख्या का अनुमान लगाने में दिलचस्पी है, <math>x</math> में <math>n</math> भविष्य के परीक्षण। इसके द्वारा दिया गया है  


:<math>
:<math>
Line 41: Line 33:
  \end{align}
  \end{align}
</math>
</math>
[[बीटा समारोह]] के गुणों का उपयोग करके इसे वैकल्पिक रूप से लिखा जा सकता है
[[बीटा समारोह|बीटा फलन]] के गुणों का उपयोग करके इसे वैकल्पिक रूप से लिखा जा सकता है
:<math>
:<math>
   f(x\mid n,\alpha,\beta) = \frac{\Gamma(n+1)}{\Gamma(x+1)\Gamma(n-x+1)} \frac{\Gamma(x+\alpha)\Gamma(n-x+\beta)}{\Gamma(n+\alpha+\beta)} \frac{\Gamma(\alpha+\beta)}{\Gamma(\alpha)\Gamma(\beta)}.
   f(x\mid n,\alpha,\beta) = \frac{\Gamma(n+1)}{\Gamma(x+1)\Gamma(n-x+1)} \frac{\Gamma(x+\alpha)\Gamma(n-x+\beta)}{\Gamma(n+\alpha+\beta)} \frac{\Gamma(\alpha+\beta)}{\Gamma(\alpha)\Gamma(\beta)}.
Line 62: Line 54:
  \end{align}
  \end{align}
</math>
</math>
और [[कुकुदता]] है
और [[कुकुदता|कर्टोसिस]] है
::<math>  
::<math>  
   \beta_2 = \frac{(\alpha + \beta)^2 (1+\alpha+\beta)}{n \alpha \beta( \alpha + \beta + 2)(\alpha + \beta + 3)(\alpha + \beta + n) } \left[ (\alpha + \beta)(\alpha + \beta - 1 + 6n) + 3 \alpha\beta(n - 2) + 6n^2 -\frac{3\alpha\beta n(6-n)}{\alpha + \beta} - \frac{18\alpha\beta n^{2}}{(\alpha+\beta)^2} \right].
   \beta_2 = \frac{(\alpha + \beta)^2 (1+\alpha+\beta)}{n \alpha \beta( \alpha + \beta + 2)(\alpha + \beta + 3)(\alpha + \beta + n) } \left[ (\alpha + \beta)(\alpha + \beta - 1 + 6n) + 3 \alpha\beta(n - 2) + 6n^2 -\frac{3\alpha\beta n(6-n)}{\alpha + \beta} - \frac{18\alpha\beta n^{2}}{(\alpha+\beta)^2} \right].
Line 76: Line 68:
  = np(1-p) \frac{\alpha + \beta + n}{\alpha + \beta + 1} = np(1-p)[1+(n-1)\rho]
  = np(1-p) \frac{\alpha + \beta + n}{\alpha + \beta + 1} = np(1-p)[1+(n-1)\rho]
\!</math>
\!</math>
कहाँ <math>\rho= \tfrac{1}{\alpha+\beta+1}\!</math>. पैरामीटर <math>\rho \; \!</math> इंट्रा क्लास या इंट्रा क्लस्टर सहसंबंध के रूप में जाना जाता है। यह सकारात्मक सहसंबंध है जो अति फैलाव को जन्म देता है। ध्यान दें कि कब <math>n=1</math>, बीटा और द्विपद भिन्नता के बीच अंतर करने के लिए कोई जानकारी उपलब्ध नहीं है, और दो मॉडलों में समान भिन्नताएं हैं।
जहाँ  <math>\rho= \tfrac{1}{\alpha+\beta+1}\!</math>. पैरामीटर <math>\rho \; \!</math> इंट्रा क्लास या इंट्रा क्लस्टर सहसंबंध के रूप में जाना जाता है। यह सकारात्मक सहसंबंध है जो अति फैलाव को जन्म देता है। ध्यान दें कि कब <math>n=1</math>, बीटा और द्विपद भिन्नता के बीच अंतर करने के लिए कोई जानकारी उपलब्ध नहीं है, और दो मॉडलों में समान भिन्नताएं हैं।


=== फैक्टोरियल मोमेंट्स === {{math|''r''}}}-बीटा-द्विपद यादृच्छिक चर का वाँ [[तथ्यात्मक क्षण]] {{math|''X''}} है
== फैक्टोरियल मोमेंट्स ==
{{math|''r''}}-बीटा-द्विपद यादृच्छिक चर का वाँ [[तथ्यात्मक क्षण]] {{math|''X''}} है


:<math>\operatorname{E}\bigl[(X)_r\bigr] = \frac{n!}{(n-r)!}\frac{B(\alpha+r,\beta)}{B(\alpha,\beta)} =
:<math>\operatorname{E}\bigl[(X)_r\bigr] = \frac{n!}{(n-r)!}\frac{B(\alpha+r,\beta)}{B(\alpha,\beta)} =
Line 94: Line 87:
  \end{align}
  \end{align}
</math>
</math>
ये अनुमान गैर-संवेदनात्मक रूप से नकारात्मक हो सकते हैं जो इस बात का प्रमाण है कि द्विपद वितरण के सापेक्ष डेटा या तो अविच्छिन्न या अल्पप्रकीर्णित है। इस मामले में, द्विपद वितरण और अतिज्यामितीय वितरण क्रमशः वैकल्पिक उम्मीदवार हैं।
ये अनुमान गैर-संवेदनात्मक रूप से नकारात्मक हो सकते हैं जो इस बात का प्रमाण है कि द्विपद वितरण के सापेक्ष आंकड़े या तो अविच्छिन्न या अल्पप्रकीर्णित है। इस मामले में, द्विपद वितरण और अतिज्यामितीय वितरण क्रमशः वैकल्पिक उम्मीदवार हैं।


=== अधिकतम संभावना अनुमान ===
=== अधिकतम संभावना अनुमान ===


जबकि क्लोज-फॉर्म अधिकतम संभावना अव्यावहारिक है, यह देखते हुए कि पीडीएफ में सामान्य कार्य (गामा फ़ंक्शन और/या बीटा फ़ंक्शन) होते हैं, उन्हें प्रत्यक्ष संख्यात्मक अनुकूलन के माध्यम से आसानी से पाया जा सकता है। अनुभवजन्य डेटा से अधिकतम संभावना अनुमान बहुराष्ट्रीय पोल्या वितरण को फिट करने के लिए सामान्य तरीकों का उपयोग करके गणना की जा सकती है, जिसके लिए विधियाँ #Minka2003|(Minka 2003) में वर्णित हैं।
जबकि क्लोज-फॉर्म अधिकतम संभावना अव्यावहारिक है, यह देखते हुए कि पीडीएफ में सामान्य कार्य (गामा फ़ंक्शन और/या बीटा फ़ंक्शन) होते हैं, उन्हें प्रत्यक्ष संख्यात्मक अनुकूलन के माध्यम से आसानी से पाया जा सकता है। अनुभवजन्य आंकड़े से अधिकतम संभावना अनुमान बहुराष्ट्रीय पोल्या वितरण को फिट करने के लिए सामान्य तरीकों का उपयोग करके गणना की जा सकती है, जिसके लिए विधियाँ (मिन्का 2003) में वर्णित हैं।
R (प्रोग्रामिंग लैंग्वेज) पैकेज VGAM फ़ंक्शन vglm के माध्यम से, अधिकतम संभावना के माध्यम से, बीटा-द्विपद वितरण के अनुसार वितरित प्रतिक्रियाओं के साथ [[सामान्यीकृत रैखिक मॉडल]] प्रकार के मॉडल की फिटिंग की सुविधा प्रदान करता है। इस बात की कोई आवश्यकता नहीं है कि संपूर्ण प्रेक्षणों के दौरान n स्थिर रहता है।
 
आर (प्रोग्रामिंग लैंग्वेज) पैकेज वीजीएएम फ़ंक्शन वीजीएलएम के माध्यम से, अधिकतम संभावना के माध्यम से, बीटा-द्विपद वितरण के अनुसार वितरित प्रतिक्रियाओं के साथ [[सामान्यीकृत रैखिक मॉडल]] प्रकार के मॉडल की फिटिंग की सुविधा प्रदान करता है। इस बात की कोई आवश्यकता नहीं है कि संपूर्ण प्रेक्षणों के दौरान n स्थिर रहता है।


=== उदाहरण ===
=== उदाहरण ===


निम्नलिखित डेटा 19वीं सदी के [[सैक्सोनी]] में अस्पताल के रिकॉर्ड से लिए गए 6115 परिवारों में परिवार के आकार 13 के पहले 12 बच्चों में पुरुष बच्चों की संख्या देता है (लिंडसे से सोकल और रोल्फ़, पृ. 59)। 13वें बच्चे को अनदेखा किया जाता है ताकि वांछित लिंग प्राप्त होने पर परिवारों के गैर-यादृच्छिक रूप से रुकने के प्रभाव को कम किया जा सके।
निम्नलिखित आंकड़े 19वीं सदी के [[सैक्सोनी]] में अस्पताल के रिकॉर्ड से लिए गए 6115 परिवारों में परिवार के आकार 13 के पहले 12 बच्चों में पुरुष बच्चों की संख्या देता है (लिंडसे से सोकल और रोल्फ़, पृ. 59)। 13वें बच्चे को अनदेखा किया जाता है ताकि वांछित लिंग प्राप्त होने पर परिवारों के गैर-यादृच्छिक रूप से रुकने के प्रभाव को कम किया जा सके।
{| class="wikitable"
{| class="wikitable"
|-
|-
| '''Males'''|| 0|| 1|| 2|| 3|| 4|| 5|| 6|| 7|| 8|| 9|| 10|| 11|| 12
|पुरुषों
| 0|| 1|| 2|| 3|| 4|| 5|| 6|| 7|| 8|| 9|| 10|| 11|| 12
|-
|-
| '''Families'''|| 3|| 24|| 104|| 286|| 670|| 1033|| 1343|| 1112|| 829|| 478|| 181|| 45|| 7
|परिवार
| 3|| 24|| 104|| 286|| 670|| 1033|| 1343|| 1112|| 829|| 478|| 181|| 45|| 7
|}
|}
पहले दो नमूना क्षण हैं
पहले दो नमूना क्षण हैं
Line 138: Line 134:
   \log \mathcal{L} = -12492.9
   \log \mathcal{L} = -12492.9
</math>
</math>
जिससे हम एकैके सूचना कसौटी पाते हैं
जिससे हम एआईसी सूचना कसौटी पाते हैं


::<math>
::<math>
   \mathit{AIC}=24989.74.
   \mathit{AIC}=24989.74.
</math>
</math>
प्रतिस्पर्धी द्विपद मॉडल के लिए एआईसी एआईसी = 25070.34 है और इस प्रकार हम देखते हैं कि बीटा-द्विपद मॉडल डेटा के लिए बेहतर फिट प्रदान करता है यानी अति फैलाव के लिए सबूत है। ट्राइवर्स-विलार्ड परिकल्पना स्तनपायी संतानों के बीच लिंग-प्रवणता में विविधता के लिए एक सैद्धांतिक औचित्य को दर्शाती है।
प्रतिस्पर्धी द्विपद मॉडल के लिए एआईसी = 25070.34 है और इस प्रकार हम देखते हैं कि बीटा-द्विपद मॉडल आंकड़े के लिए बेहतर फिट प्रदान करता है यानी अति फैलाव के लिए सबूत है। ट्राइवर्स-विलार्ड परिकल्पना स्तनपायी संतानों के बीच लिंग-प्रवणता में विविधता के लिए एक सैद्धांतिक औचित्य को दर्शाती है।


बेहतर फिट विशेष रूप से पूंछों के बीच स्पष्ट है
बेहतर फिट विशेष रूप से पूंछों के बीच स्पष्ट है
Line 149: Line 145:
{| class="wikitable"
{| class="wikitable"
|-
|-
| '''Males'''|| 0|| 1|| 2|| 3|| 4|| 5|| 6|| 7|| 8|| 9|| 10|| 11|| 12
|पुरुषों
| 0|| 1|| 2|| 3|| 4|| 5|| 6|| 7|| 8|| 9|| 10|| 11|| 12
|-
|-
| '''Observed Families'''|| 3|| 24|| 104|| 286|| 670|| 1033|| 1343|| 1112|| 829|| 478|| 181|| 45|| 7
|परिवारों का अवलोकन किया
| 3|| 24|| 104|| 286|| 670|| 1033|| 1343|| 1112|| 829|| 478|| 181|| 45|| 7
|-
|-
| '''Fitted Expected (Beta-Binomial)'''|| 2.3|| 22.6|| 104.8|| 310.9|| 655.7|| 1036.2|| 1257.9|| 1182.1|| 853.6|| 461.9|| 177.9|| 43.8|| 5.2
|सज्जित अपेक्षित (बीटा-द्विपद)
| 2.3|| 22.6|| 104.8|| 310.9|| 655.7|| 1036.2|| 1257.9|| 1182.1|| 853.6|| 461.9|| 177.9|| 43.8|| 5.2
|-
|-
| '''Fitted Expected (Binomial ''p'' = 0.519215)'''|| 0.9|| 12.1|| 71.8|| 258.5|| 628.1|| 1085.2|| 1367.3|| 1265.6|| 854.2|| 410.0|| 132.8|| 26.1|| 2.3
|सज्जित अपेक्षित (द्विपद p = 0.519215)
| 0.9|| 12.1|| 71.8|| 258.5|| 628.1|| 1085.2|| 1367.3|| 1265.6|| 854.2|| 410.0|| 132.8|| 26.1|| 2.3
|}
|}
== बायेसियन सांख्यिकी में बीटा-द्विपद ==
== बायेसियन सांख्यिकी में बीटा-द्विपद ==


Line 174: Line 172:
\end{align}
\end{align}
</math>
</math>
कहाँ <math>C</math> एक सामान्यीकरण स्थिरांक है। हम पश्च वितरण को एक के रूप में पहचानते हैं <math>\mathrm{Beta}(y_1+\alpha,n_1-y_1+\beta)</math>.
जहाँ  <math>C</math> एक सामान्यीकरण स्थिरांक है। हम पश्च वितरण को एक के रूप में पहचानते हैं <math>\mathrm{Beta}(y_1+\alpha,n_1-y_1+\beta)</math>.


इस प्रकार, फिर से कंपाउंडिंग के माध्यम से, हम पाते हैं कि आकार के भविष्य के नमूने के योग का पश्चगामी वितरण <math>n_2</math> का <math>\mathrm{Bernoulli}(p)</math> यादृच्छिक चर है
इस प्रकार, फिर से कंपाउंडिंग के माध्यम से, हम पाते हैं कि आकार के भविष्य के नमूने के योग का पश्चगामी वितरण <math>n_2</math> का <math>\mathrm{Bernoulli}(p)</math> यादृच्छिक चर है
Line 187: Line 185:


== संबंधित वितरण ==
== संबंधित वितरण ==
* <math>\mathrm{BetaBin}(1, \alpha, \beta) \sim \mathrm{Bernoulli}(p)\,</math> कहाँ <math>p=\frac{\alpha}{\alpha+\beta}\,</math>.
* <math>\mathrm{BetaBin}(1, \alpha, \beta) \sim \mathrm{Bernoulli}(p)\,</math> जहाँ  <math>p=\frac{\alpha}{\alpha+\beta}\,</math>.
* <math>\mathrm{BetaBin}(n, 1, 1) \sim U(0,n)\,</math> कहाँ <math>U(a,b)\,</math> [[समान वितरण (असतत)]] है।
* <math>\mathrm{BetaBin}(n, 1, 1) \sim U(0,n)\,</math> जहाँ  <math>U(a,b)\,</math> [[समान वितरण (असतत)]] है।
* <math> \lim_{s \rightarrow \infty} \mathrm{BetaBin}(n, ps, (1-p)s) \sim \mathrm{B}(n,p)\,</math> कहाँ <math>p=\frac{\alpha}{\alpha+\beta}\,</math> और <math>s=\alpha+\beta\,</math> और <math>\mathrm{B}(n,p)\,</math> द्विपद वितरण है।
* <math> \lim_{s \rightarrow \infty} \mathrm{BetaBin}(n, ps, (1-p)s) \sim \mathrm{B}(n,p)\,</math> जहाँ  <math>p=\frac{\alpha}{\alpha+\beta}\,</math> और <math>s=\alpha+\beta\,</math> और <math>\mathrm{B}(n,p)\,</math> द्विपद वितरण है।
* <math>\lim_{n \rightarrow \infty} \mathrm{BetaBin}(n, \alpha, n\frac{(1-p)}{p}) \sim \mathrm{NB}(\alpha,p)\,</math> कहाँ <math>\mathrm{NB}(\alpha,p)\,</math> [[नकारात्मक द्विपद वितरण]] है।
* <math>\lim_{n \rightarrow \infty} \mathrm{BetaBin}(n, \alpha, n\frac{(1-p)}{p}) \sim \mathrm{NB}(\alpha,p)\,</math> जहाँ  <math>\mathrm{NB}(\alpha,p)\,</math> [[नकारात्मक द्विपद वितरण]] है।


== यह भी देखें ==
== यह भी देखें ==
Line 196: Line 194:


== संदर्भ ==
== संदर्भ ==
* {{anchor|Minka2003}}Minka, Thomas P. (2003). [http://research.microsoft.com/~minka/papers/dirichlet/ Estimating a Dirichlet distribution]. Microsoft Technical Report.
* {{anchor|Minka2003}}मिंका, थॉमस पी. (2003). डिरिचलेट वितरण का अनुमान लगाना। माइक्रोसॉफ्ट तकनीकी रिपोर्ट।
 
 
==बाहरी संबंध==
* [http://it.stlawu.edu/~msch/biometrics/papers.htm Using the Beta-binomial distribution to assess performance of a biometric identification device]
* [http://research.microsoft.com/~minka/software/fastfit/ Fastfit] contains Matlab code for fitting Beta-Binomial distributions (in the form of two-dimensional Pólya distributions) to data.
* Interactive graphic: [http://www.math.wm.edu/~leemis/chart/UDR/UDR.html Univariate Distribution Relationships]
* [https://cran.r-project.org/web/packages/VGAM/index.html Beta-binomial functions in VGAM R package]
* [http://foundry.sandia.gov/releases/latest/javadoc-api/gov/sandia/cognition/statistics/distribution/BetaBinomialDistribution.html Beta-binomial distribution in Sandia National Labs Cognitive Foundry Java library]
 
{{Probability distributions}}


{{DEFAULTSORT:Beta-Binomial Distribution}}[[Category: असतत वितरण]] [[Category: यौगिक संभाव्यता वितरण]] [[Category: पूर्व वितरण संयुग्मित करें]]


बाहरी संबंध
* [http://it.stlawu.edu/~msch/biometrics/papers.htm बायोमेट्रिक पहचान उपकरण के प्रदर्शन का आकलन करने के लिए बीटा-द्विपद वितरण का उपयोग करना]
* [http://research.microsoft.com/~minka/software/fastfit/ फास्टफिट]  में डेटा के लिए बीटा-द्विपद वितरण (द्वि-आयामी पोल्या वितरण के रूप में) को फ़िट करने के लिए मैटलैब कोड होता है।.
* इंटरएक्टिव ग्राफिक: [http://www.math.wm.edu/~leemis/chart/UDR/UDR.html यूनीवेरिएट डिस्ट्रीब्यूशन रिलेशनशिप]
* [https://cran.r-project.org/web/packages/VGAM/index.html वीजीएएम आर पैकेज में बीटा-द्विपद कार्य]
* [http://foundry.sandia.gov/releases/latest/javadoc-api/gov/sandia/cognition/statistics/distribution/BetaBinomialDistribution.html सांडिया नेशनल लैब्स कॉग्निटिव फाउंड्री जावा लाइब्रेरी में बीटा-द्विपद वितरण]


{{DEFAULTSORT:Beta-Binomial Distribution}}


[[Category: Machine Translated Page]]
[[Category:Created On 21/03/2023|Beta-Binomial Distribution]]
[[Category:Created On 21/03/2023]]
[[Category:Lua-based templates|Beta-Binomial Distribution]]
[[Category:Machine Translated Page|Beta-Binomial Distribution]]
[[Category:Pages with script errors|Beta-Binomial Distribution]]
[[Category:Short description with empty Wikidata description|Beta-Binomial Distribution]]
[[Category:Templates Vigyan Ready|Beta-Binomial Distribution]]
[[Category:Templates that add a tracking category|Beta-Binomial Distribution]]
[[Category:Templates that generate short descriptions|Beta-Binomial Distribution]]
[[Category:Templates using TemplateData|Beta-Binomial Distribution]]
[[Category:असतत वितरण|Beta-Binomial Distribution]]
[[Category:पूर्व वितरण संयुग्मित करें|Beta-Binomial Distribution]]
[[Category:यौगिक संभाव्यता वितरण|Beta-Binomial Distribution]]

Latest revision as of 13:10, 7 April 2023

Probability mass function
Probability mass function for the beta-binomial distribution
Cumulative distribution function
बीटा-द्विपद बंटन के लिए संचयी प्रायिकता बंटन फलन
Notation
Parameters nN0 — number of trials
(real)
(real)
Support x ∈ { 0, …, n }
PMF

where is the beta function
CDF

where 3F2(a;b;x) is the generalized hypergeometric function
Mean
Variance
Skewness
Ex. kurtosis See text
MGF where is the hypergeometric function
CF
PGF

संभाव्यता सिद्धांत और आंकड़ों में, बीटा-द्विपद वितरण गैर-नकारात्मक पूर्णांकों के परिमित समर्थन (गणित) पर असतत संभाव्यता वितरण का एक परिवार है, जब बर्नौली परीक्षणों की निश्चित या ज्ञात संख्या में से प्रत्येक में सफलता की संभावना या तो अज्ञात होती है। या यादृच्छिक। बीटा-द्विपद वितरण द्विपद वितरण है जिसमें प्रत्येक 'एन परीक्षण में सफलता की संभावना तय नहीं है लेकिन बीटा वितरण से यादृच्छिक रूप से तैयार की जाती है। द्विपद प्रकार वितरित आंकड़े में अतिफैलाव को पकड़ने के लिए बायेसियन सांख्यिकी, अनुभवजन्य बेयस विधियों और चिरसम्मत आंकड़ों में इसका उपयोग प्रायः किया जाता है।

बीटा-द्विपद डिरिचलेट-बहुपद वितरण का एक-आयामी संस्करण है क्योंकि द्विपद और बीटा वितरण क्रमशः बहुराष्ट्रीय वितरण और डिरिचलेट वितरण के एकतरफा संस्करण हैं। विशेष घटना जहां α और β पूर्णांक हैं, उन्हें नकारात्मक हाइपरज्यामितीय वितरण के रूप में भी जाना जाता है।

प्रेरणा और व्युत्पत्ति

यौगिक वितरण के रूप में

द्विपद वितरण से पहले बीटा वितरण एक संयुग्म है। यह तथ्य एक विश्लेषणात्मक रूप से ट्रैक्टेबल कंपाउंड डिस्ट्रीब्यूशन की ओर जाता है जहां कोई सोच सकता है बीटा वितरण से यादृच्छिक रूप से निकाले जाने के रूप में द्विपद वितरण में पैरामीटर।

मान लीजिए कि हमें हेड्स की संख्या का अनुमान लगाने में दिलचस्पी है, में भविष्य के परीक्षण। इसके द्वारा दिया गया है

बीटा फलन के गुणों का उपयोग करके इसे वैकल्पिक रूप से लिखा जा सकता है


कलश मॉडल के रूप में बीटा-द्विपद

बीटा-द्विपद वितरण को α और β के सकारात्मक पूर्णांक मानों के लिए कलश मॉडल के माध्यम से भी प्रेरित किया जा सकता है, जिसे पोल्या कलश मॉडल के रूप में जाना जाता है। विशेष रूप से, α लाल गेंदों और β काली गेंदों वाले कलश की कल्पना करें, जहां यादृच्छिक ड्रॉ बनाए जाते हैं। यदि एक लाल गेंद देखी जाती है, तो दो लाल गेंदों को कलश में वापस कर दिया जाता है। इसी तरह, यदि एक काली गेंद निकाली जाती है, तो दो काली गेंदें कलश में वापस आ जाती हैं। यदि इसे n बार दोहराया जाता है, तो x लाल गेंदों को देखने की संभावना पैरामीटर n, α और β के साथ बीटा-द्विपद वितरण का अनुसरण करती है।

यदि यादृच्छिक ड्रॉ सरल प्रतिस्थापन के साथ होते हैं (प्रेक्षित गेंद के ऊपर और ऊपर कोई गेंद कलश में नहीं जोड़ी जाती है), तो वितरण एक द्विपद वितरण का अनुसरण करता है और यदि यादृच्छिक ड्रॉ प्रतिस्थापन के बिना किए जाते हैं, तो वितरण एक हाइपरज्यामितीय वितरण का अनुसरण करता है।

क्षण और गुण

पहले तीन कच्चे क्षण (गणित) हैं

और कर्टोसिस है

दे हम सुझाव देते हैं कि माध्य को इस प्रकार लिखा जा सकता है

और भिन्नता के रूप में

जहाँ . पैरामीटर इंट्रा क्लास या इंट्रा क्लस्टर सहसंबंध के रूप में जाना जाता है। यह सकारात्मक सहसंबंध है जो अति फैलाव को जन्म देता है। ध्यान दें कि कब , बीटा और द्विपद भिन्नता के बीच अंतर करने के लिए कोई जानकारी उपलब्ध नहीं है, और दो मॉडलों में समान भिन्नताएं हैं।

फैक्टोरियल मोमेंट्स

r-बीटा-द्विपद यादृच्छिक चर का वाँ तथ्यात्मक क्षण X है

.

बिंदु अनुमान

आघूर्ण की विधि

क्षणों की विधि (सांख्यिकी) अनुमान बीटा-द्विपद के पहले और दूसरे क्षणों को ध्यान में रखते हुए और उन्हें नमूना क्षणों के बराबर सेट करके प्राप्त किया जा सकता है और . हम देखतें है

ये अनुमान गैर-संवेदनात्मक रूप से नकारात्मक हो सकते हैं जो इस बात का प्रमाण है कि द्विपद वितरण के सापेक्ष आंकड़े या तो अविच्छिन्न या अल्पप्रकीर्णित है। इस मामले में, द्विपद वितरण और अतिज्यामितीय वितरण क्रमशः वैकल्पिक उम्मीदवार हैं।

अधिकतम संभावना अनुमान

जबकि क्लोज-फॉर्म अधिकतम संभावना अव्यावहारिक है, यह देखते हुए कि पीडीएफ में सामान्य कार्य (गामा फ़ंक्शन और/या बीटा फ़ंक्शन) होते हैं, उन्हें प्रत्यक्ष संख्यात्मक अनुकूलन के माध्यम से आसानी से पाया जा सकता है। अनुभवजन्य आंकड़े से अधिकतम संभावना अनुमान बहुराष्ट्रीय पोल्या वितरण को फिट करने के लिए सामान्य तरीकों का उपयोग करके गणना की जा सकती है, जिसके लिए विधियाँ (मिन्का 2003) में वर्णित हैं।

आर (प्रोग्रामिंग लैंग्वेज) पैकेज वीजीएएम फ़ंक्शन वीजीएलएम के माध्यम से, अधिकतम संभावना के माध्यम से, बीटा-द्विपद वितरण के अनुसार वितरित प्रतिक्रियाओं के साथ सामान्यीकृत रैखिक मॉडल प्रकार के मॉडल की फिटिंग की सुविधा प्रदान करता है। इस बात की कोई आवश्यकता नहीं है कि संपूर्ण प्रेक्षणों के दौरान n स्थिर रहता है।

उदाहरण

निम्नलिखित आंकड़े 19वीं सदी के सैक्सोनी में अस्पताल के रिकॉर्ड से लिए गए 6115 परिवारों में परिवार के आकार 13 के पहले 12 बच्चों में पुरुष बच्चों की संख्या देता है (लिंडसे से सोकल और रोल्फ़, पृ. 59)। 13वें बच्चे को अनदेखा किया जाता है ताकि वांछित लिंग प्राप्त होने पर परिवारों के गैर-यादृच्छिक रूप से रुकने के प्रभाव को कम किया जा सके।

पुरुषों 0 1 2 3 4 5 6 7 8 9 10 11 12
परिवार 3 24 104 286 670 1033 1343 1112 829 478 181 45 7

पहले दो नमूना क्षण हैं

और इसलिए क्षणों का अनुमान लगाने की विधि है

अधिकतम संभावना अनुमान संख्यात्मक रूप से पाया जा सकता है

और अधिकतम लॉग संभावना है

जिससे हम एआईसी सूचना कसौटी पाते हैं

प्रतिस्पर्धी द्विपद मॉडल के लिए एआईसी = 25070.34 है और इस प्रकार हम देखते हैं कि बीटा-द्विपद मॉडल आंकड़े के लिए बेहतर फिट प्रदान करता है यानी अति फैलाव के लिए सबूत है। ट्राइवर्स-विलार्ड परिकल्पना स्तनपायी संतानों के बीच लिंग-प्रवणता में विविधता के लिए एक सैद्धांतिक औचित्य को दर्शाती है।

बेहतर फिट विशेष रूप से पूंछों के बीच स्पष्ट है

पुरुषों 0 1 2 3 4 5 6 7 8 9 10 11 12
परिवारों का अवलोकन किया 3 24 104 286 670 1033 1343 1112 829 478 181 45 7
सज्जित अपेक्षित (बीटा-द्विपद) 2.3 22.6 104.8 310.9 655.7 1036.2 1257.9 1182.1 853.6 461.9 177.9 43.8 5.2
सज्जित अपेक्षित (द्विपद p = 0.519215) 0.9 12.1 71.8 258.5 628.1 1085.2 1367.3 1265.6 854.2 410.0 132.8 26.1 2.3

बायेसियन सांख्यिकी में बीटा-द्विपद

बर्नौली सफलता की संभावना के बायेसियन अनुमान में बीटा-द्विपद वितरण एक प्रमुख भूमिका निभाता है जिसका अनुमान हम आंकड़ों के आधार पर लगाना चाहते हैं। होने देना स्वतंत्र और समान रूप से वितरित बर्नौली यादृच्छिक चर का एक नमूना (आँकड़े) बनें . मान लीजिए, हमारा ज्ञान - बायेसियन फैशन में - अनिश्चित है और पूर्व वितरण द्वारा तैयार किया गया है . अगर फिर संयुक्त वितरण के माध्यम से

.

अवलोकन करने के बाद हम ध्यान दें कि के लिए पश्च वितरण

जहाँ एक सामान्यीकरण स्थिरांक है। हम पश्च वितरण को एक के रूप में पहचानते हैं .

इस प्रकार, फिर से कंपाउंडिंग के माध्यम से, हम पाते हैं कि आकार के भविष्य के नमूने के योग का पश्चगामी वितरण का यादृच्छिक चर है

.

बीटा द्विपद-वितरित यादृच्छिक चर उत्पन्न करना

एक बीटा-द्विपद यादृच्छिक चर बनाने के लिए बस एक ड्रा करें और फिर ड्रा करें .

संबंधित वितरण

  • जहाँ .
  • जहाँ समान वितरण (असतत) है।
  • जहाँ और और द्विपद वितरण है।
  • जहाँ नकारात्मक द्विपद वितरण है।

यह भी देखें

  • डिरिचलेट-बहुराष्ट्रीय वितरण

संदर्भ

  • मिंका, थॉमस पी. (2003). डिरिचलेट वितरण का अनुमान लगाना। माइक्रोसॉफ्ट तकनीकी रिपोर्ट।


बाहरी संबंध