बीटा-द्विपद वितरण: Difference between revisions
(Created page with "{{Short description|Discrete probability distribution}} {{Probability distribution | pdf_image =Image:Beta-binomial distribution pmf.png|325px|Probability mass function f...") |
No edit summary |
||
(5 intermediate revisions by 4 users not shown) | |||
Line 1: | Line 1: | ||
{{Short description|Discrete probability distribution}} | {{Short description|Discrete probability distribution}} | ||
{{Probability distribution | {{Probability distribution | ||
| pdf_image =[[Image:Beta-binomial distribution pmf.png|325px|Probability mass function for the beta-binomial distribution]]| | | pdf_image =[[Image:Beta-binomial distribution pmf.png|325px|Probability mass function for the beta-binomial distribution]]|| cdf_image =[[Image:Beta-binomial cdf.png|325px|बीटा-द्विपद बंटन के लिए संचयी प्रायिकता बंटन फलन]]|| type = mass | ||
| notation = <math>\mathrm{BetaBin}(n,\alpha,\beta)</math> | | notation = <math>\mathrm{BetaBin}(n,\alpha,\beta)</math> | ||
| parameters = ''n'' ∈ [[Natural numbers|'''N'''<sub>0</sub>]] — number of trials<br /><math>\alpha > 0</math> ([[real number|real]]) <br /><math>\beta > 0</math> ([[real number|real]]) | | parameters = ''n'' ∈ [[Natural numbers|'''N'''<sub>0</sub>]] — number of trials<br /><math>\alpha > 0</math> ([[real number|real]]) <br /><math>\beta > 0</math> ([[real number|real]]) | ||
| support = ''x'' ∈ { 0, …, ''n'' } | | support = ''x'' ∈ { 0, …, ''n'' } | ||
| pdf =<math>\binom{n}{x} \frac{\mathrm{B}(x+\alpha,n-x+\beta)} {\mathrm{B}(\alpha,\beta)}\!</math> <br/><br/> where <math> \Beta(x,y)=\frac{\Gamma(x)\,\Gamma(y)}{\Gamma(x+y)}</math> is the [[beta function]]| | | pdf =<math>\binom{n}{x} \frac{\mathrm{B}(x+\alpha,n-x+\beta)} {\mathrm{B}(\alpha,\beta)}\!</math> <br/><br/> where <math> \Beta(x,y)=\frac{\Gamma(x)\,\Gamma(y)}{\Gamma(x+y)}</math> is the [[beta function]]|| cdf =<math>\begin{cases} 0,& x < 0 \\ \binom{n}{x} \tfrac{\mathrm{B}(x+\alpha,n-x+\beta)} {\mathrm{B}(\alpha,\beta)} {}_3\!F_2(\boldsymbol{a};\boldsymbol{b};x), & 0 \le x < n \\ 1,& x \geq n \end{cases}</math> <br/><br/>where <big> <sub>3</sub>''F''<sub>2</sub>('''a''';'''b''';x)</big> is the [[Generalized hypergeometric series|generalized hypergeometric function]]<br/> <small><math>{}_3\!F_2(1, -x, n\! -\! x\! +\! \beta; n\! -\! x\! +\! 1, 1\! -\! x\! -\! \alpha; 1)\!</math></small>|| mean =<math>\frac{n\alpha}{\alpha+\beta}\!</math>|| median =|| mode = || variance =<math>\frac{n\alpha\beta(\alpha+\beta+n)}{(\alpha+\beta)^2(\alpha+\beta+1)}\!</math>| | ||
| skewness =<math>\tfrac{(\alpha+\beta+2n)(\beta-\alpha)}{(\alpha+\beta+2)}\sqrt{\tfrac{1+\alpha+\beta}{n\alpha\beta(n+\alpha+\beta)}}\!</math>| | | skewness =<math>\tfrac{(\alpha+\beta+2n)(\beta-\alpha)}{(\alpha+\beta+2)}\sqrt{\tfrac{1+\alpha+\beta}{n\alpha\beta(n+\alpha+\beta)}}\!</math>| | ||
| kurtosis = See text| | | kurtosis = See text| | ||
Line 24: | Line 15: | ||
}} | }} | ||
संभाव्यता सिद्धांत और आंकड़ों में, बीटा-[[द्विपद वितरण]] गैर-नकारात्मक पूर्णांकों के परिमित [[समर्थन (गणित)]] पर असतत संभाव्यता वितरण का एक परिवार है, जब बर्नौली परीक्षणों की निश्चित या ज्ञात संख्या में से प्रत्येक में सफलता की संभावना या तो अज्ञात होती है। या यादृच्छिक। बीटा-द्विपद वितरण द्विपद वितरण है जिसमें प्रत्येक 'एन'' परीक्षण में सफलता की संभावना तय नहीं है लेकिन [[बीटा वितरण]] से यादृच्छिक रूप से तैयार की जाती है। द्विपद प्रकार वितरित | संभाव्यता सिद्धांत और आंकड़ों में, बीटा-[[द्विपद वितरण]] गैर-नकारात्मक पूर्णांकों के परिमित [[समर्थन (गणित)]] पर असतत संभाव्यता वितरण का एक परिवार है, जब बर्नौली परीक्षणों की निश्चित या ज्ञात संख्या में से प्रत्येक में सफलता की संभावना या तो अज्ञात होती है। या यादृच्छिक। बीटा-द्विपद वितरण द्विपद वितरण है जिसमें प्रत्येक 'एन'' परीक्षण में सफलता की संभावना तय नहीं है लेकिन [[बीटा वितरण]] से यादृच्छिक रूप से तैयार की जाती है। द्विपद प्रकार वितरित आंकड़े में [[अतिफैलाव]] को पकड़ने के लिए [[बायेसियन सांख्यिकी]], अनुभवजन्य बेयस विधियों और चिरसम्मत आंकड़ों में इसका उपयोग प्रायः किया जाता है।'' | ||
बीटा-द्विपद डिरिचलेट-[[बहुपद वितरण]] का एक-आयामी संस्करण है क्योंकि द्विपद और बीटा वितरण क्रमशः बहुराष्ट्रीय वितरण और [[डिरिचलेट वितरण]] के एकतरफा संस्करण हैं। विशेष | बीटा-द्विपद डिरिचलेट-[[बहुपद वितरण]] का एक-आयामी संस्करण है क्योंकि द्विपद और बीटा वितरण क्रमशः बहुराष्ट्रीय वितरण और [[डिरिचलेट वितरण]] के एकतरफा संस्करण हैं। विशेष घटना जहां ''α'' और ''β'' पूर्णांक हैं, उन्हें [[नकारात्मक हाइपरज्यामितीय वितरण]] के रूप में भी जाना जाता है। | ||
== प्रेरणा और व्युत्पत्ति == | == प्रेरणा और व्युत्पत्ति == | ||
Line 32: | Line 23: | ||
=== [[यौगिक वितरण]] के रूप में === | === [[यौगिक वितरण]] के रूप में === | ||
द्विपद वितरण से पहले बीटा वितरण एक संयुग्म है। यह तथ्य एक विश्लेषणात्मक रूप से ट्रैक्टेबल कंपाउंड डिस्ट्रीब्यूशन की ओर जाता है जहां कोई सोच सकता है <math> p </math> बीटा वितरण से यादृच्छिक रूप से निकाले जाने के रूप में द्विपद वितरण में पैरामीटर। | द्विपद वितरण से पहले बीटा वितरण एक संयुग्म है। यह तथ्य एक विश्लेषणात्मक रूप से ट्रैक्टेबल कंपाउंड डिस्ट्रीब्यूशन की ओर जाता है जहां कोई सोच सकता है <math> p </math> बीटा वितरण से यादृच्छिक रूप से निकाले जाने के रूप में द्विपद वितरण में पैरामीटर। | ||
मान लीजिए कि हमें हेड्स की संख्या का अनुमान लगाने में दिलचस्पी है, <math>x</math> में <math>n</math> भविष्य के परीक्षण। | |||
मान लीजिए कि हमें हेड्स की संख्या का अनुमान लगाने में दिलचस्पी है, <math>x</math> में <math>n</math> भविष्य के परीक्षण। इसके द्वारा दिया गया है | |||
:<math> | :<math> | ||
Line 41: | Line 33: | ||
\end{align} | \end{align} | ||
</math> | </math> | ||
[[बीटा समारोह]] के गुणों का उपयोग करके इसे वैकल्पिक रूप से लिखा जा सकता है | [[बीटा समारोह|बीटा फलन]] के गुणों का उपयोग करके इसे वैकल्पिक रूप से लिखा जा सकता है | ||
:<math> | :<math> | ||
f(x\mid n,\alpha,\beta) = \frac{\Gamma(n+1)}{\Gamma(x+1)\Gamma(n-x+1)} \frac{\Gamma(x+\alpha)\Gamma(n-x+\beta)}{\Gamma(n+\alpha+\beta)} \frac{\Gamma(\alpha+\beta)}{\Gamma(\alpha)\Gamma(\beta)}. | f(x\mid n,\alpha,\beta) = \frac{\Gamma(n+1)}{\Gamma(x+1)\Gamma(n-x+1)} \frac{\Gamma(x+\alpha)\Gamma(n-x+\beta)}{\Gamma(n+\alpha+\beta)} \frac{\Gamma(\alpha+\beta)}{\Gamma(\alpha)\Gamma(\beta)}. | ||
Line 62: | Line 54: | ||
\end{align} | \end{align} | ||
</math> | </math> | ||
और [[कुकुदता]] है | और [[कुकुदता|कर्टोसिस]] है | ||
::<math> | ::<math> | ||
\beta_2 = \frac{(\alpha + \beta)^2 (1+\alpha+\beta)}{n \alpha \beta( \alpha + \beta + 2)(\alpha + \beta + 3)(\alpha + \beta + n) } \left[ (\alpha + \beta)(\alpha + \beta - 1 + 6n) + 3 \alpha\beta(n - 2) + 6n^2 -\frac{3\alpha\beta n(6-n)}{\alpha + \beta} - \frac{18\alpha\beta n^{2}}{(\alpha+\beta)^2} \right]. | \beta_2 = \frac{(\alpha + \beta)^2 (1+\alpha+\beta)}{n \alpha \beta( \alpha + \beta + 2)(\alpha + \beta + 3)(\alpha + \beta + n) } \left[ (\alpha + \beta)(\alpha + \beta - 1 + 6n) + 3 \alpha\beta(n - 2) + 6n^2 -\frac{3\alpha\beta n(6-n)}{\alpha + \beta} - \frac{18\alpha\beta n^{2}}{(\alpha+\beta)^2} \right]. | ||
Line 76: | Line 68: | ||
= np(1-p) \frac{\alpha + \beta + n}{\alpha + \beta + 1} = np(1-p)[1+(n-1)\rho] | = np(1-p) \frac{\alpha + \beta + n}{\alpha + \beta + 1} = np(1-p)[1+(n-1)\rho] | ||
\!</math> | \!</math> | ||
जहाँ <math>\rho= \tfrac{1}{\alpha+\beta+1}\!</math>. पैरामीटर <math>\rho \; \!</math> इंट्रा क्लास या इंट्रा क्लस्टर सहसंबंध के रूप में जाना जाता है। यह सकारात्मक सहसंबंध है जो अति फैलाव को जन्म देता है। ध्यान दें कि कब <math>n=1</math>, बीटा और द्विपद भिन्नता के बीच अंतर करने के लिए कोई जानकारी उपलब्ध नहीं है, और दो मॉडलों में समान भिन्नताएं हैं। | |||
== फैक्टोरियल मोमेंट्स == | |||
{{math|''r''}}-बीटा-द्विपद यादृच्छिक चर का वाँ [[तथ्यात्मक क्षण]] {{math|''X''}} है | |||
:<math>\operatorname{E}\bigl[(X)_r\bigr] = \frac{n!}{(n-r)!}\frac{B(\alpha+r,\beta)}{B(\alpha,\beta)} = | :<math>\operatorname{E}\bigl[(X)_r\bigr] = \frac{n!}{(n-r)!}\frac{B(\alpha+r,\beta)}{B(\alpha,\beta)} = | ||
Line 94: | Line 87: | ||
\end{align} | \end{align} | ||
</math> | </math> | ||
ये अनुमान गैर-संवेदनात्मक रूप से नकारात्मक हो सकते हैं जो इस बात का प्रमाण है कि द्विपद वितरण के सापेक्ष | ये अनुमान गैर-संवेदनात्मक रूप से नकारात्मक हो सकते हैं जो इस बात का प्रमाण है कि द्विपद वितरण के सापेक्ष आंकड़े या तो अविच्छिन्न या अल्पप्रकीर्णित है। इस मामले में, द्विपद वितरण और अतिज्यामितीय वितरण क्रमशः वैकल्पिक उम्मीदवार हैं। | ||
=== अधिकतम संभावना अनुमान === | === अधिकतम संभावना अनुमान === | ||
जबकि क्लोज-फॉर्म अधिकतम संभावना अव्यावहारिक है, यह देखते हुए कि पीडीएफ में सामान्य कार्य (गामा फ़ंक्शन और/या बीटा फ़ंक्शन) होते हैं, उन्हें प्रत्यक्ष संख्यात्मक अनुकूलन के माध्यम से आसानी से पाया जा सकता है। अनुभवजन्य | जबकि क्लोज-फॉर्म अधिकतम संभावना अव्यावहारिक है, यह देखते हुए कि पीडीएफ में सामान्य कार्य (गामा फ़ंक्शन और/या बीटा फ़ंक्शन) होते हैं, उन्हें प्रत्यक्ष संख्यात्मक अनुकूलन के माध्यम से आसानी से पाया जा सकता है। अनुभवजन्य आंकड़े से अधिकतम संभावना अनुमान बहुराष्ट्रीय पोल्या वितरण को फिट करने के लिए सामान्य तरीकों का उपयोग करके गणना की जा सकती है, जिसके लिए विधियाँ (मिन्का 2003) में वर्णित हैं। | ||
आर (प्रोग्रामिंग लैंग्वेज) पैकेज वीजीएएम फ़ंक्शन वीजीएलएम के माध्यम से, अधिकतम संभावना के माध्यम से, बीटा-द्विपद वितरण के अनुसार वितरित प्रतिक्रियाओं के साथ [[सामान्यीकृत रैखिक मॉडल]] प्रकार के मॉडल की फिटिंग की सुविधा प्रदान करता है। इस बात की कोई आवश्यकता नहीं है कि संपूर्ण प्रेक्षणों के दौरान n स्थिर रहता है। | |||
=== उदाहरण === | === उदाहरण === | ||
निम्नलिखित | निम्नलिखित आंकड़े 19वीं सदी के [[सैक्सोनी]] में अस्पताल के रिकॉर्ड से लिए गए 6115 परिवारों में परिवार के आकार 13 के पहले 12 बच्चों में पुरुष बच्चों की संख्या देता है (लिंडसे से सोकल और रोल्फ़, पृ. 59)। 13वें बच्चे को अनदेखा किया जाता है ताकि वांछित लिंग प्राप्त होने पर परिवारों के गैर-यादृच्छिक रूप से रुकने के प्रभाव को कम किया जा सके। | ||
{| class="wikitable" | {| class="wikitable" | ||
|- | |- | ||
| | |पुरुषों | ||
| 0|| 1|| 2|| 3|| 4|| 5|| 6|| 7|| 8|| 9|| 10|| 11|| 12 | |||
|- | |- | ||
| | |परिवार | ||
| 3|| 24|| 104|| 286|| 670|| 1033|| 1343|| 1112|| 829|| 478|| 181|| 45|| 7 | |||
|} | |} | ||
पहले दो नमूना क्षण हैं | पहले दो नमूना क्षण हैं | ||
Line 138: | Line 134: | ||
\log \mathcal{L} = -12492.9 | \log \mathcal{L} = -12492.9 | ||
</math> | </math> | ||
जिससे हम | जिससे हम एआईसी सूचना कसौटी पाते हैं | ||
::<math> | ::<math> | ||
\mathit{AIC}=24989.74. | \mathit{AIC}=24989.74. | ||
</math> | </math> | ||
प्रतिस्पर्धी द्विपद मॉडल के लिए | प्रतिस्पर्धी द्विपद मॉडल के लिए एआईसी = 25070.34 है और इस प्रकार हम देखते हैं कि बीटा-द्विपद मॉडल आंकड़े के लिए बेहतर फिट प्रदान करता है यानी अति फैलाव के लिए सबूत है। ट्राइवर्स-विलार्ड परिकल्पना स्तनपायी संतानों के बीच लिंग-प्रवणता में विविधता के लिए एक सैद्धांतिक औचित्य को दर्शाती है। | ||
बेहतर फिट विशेष रूप से पूंछों के बीच स्पष्ट है | बेहतर फिट विशेष रूप से पूंछों के बीच स्पष्ट है | ||
Line 149: | Line 145: | ||
{| class="wikitable" | {| class="wikitable" | ||
|- | |- | ||
| | |पुरुषों | ||
| 0|| 1|| 2|| 3|| 4|| 5|| 6|| 7|| 8|| 9|| 10|| 11|| 12 | |||
|- | |- | ||
| | |परिवारों का अवलोकन किया | ||
| 3|| 24|| 104|| 286|| 670|| 1033|| 1343|| 1112|| 829|| 478|| 181|| 45|| 7 | |||
|- | |- | ||
| | |सज्जित अपेक्षित (बीटा-द्विपद) | ||
| 2.3|| 22.6|| 104.8|| 310.9|| 655.7|| 1036.2|| 1257.9|| 1182.1|| 853.6|| 461.9|| 177.9|| 43.8|| 5.2 | |||
|- | |- | ||
| | |सज्जित अपेक्षित (द्विपद p = 0.519215) | ||
| 0.9|| 12.1|| 71.8|| 258.5|| 628.1|| 1085.2|| 1367.3|| 1265.6|| 854.2|| 410.0|| 132.8|| 26.1|| 2.3 | |||
|} | |} | ||
== बायेसियन सांख्यिकी में बीटा-द्विपद == | == बायेसियन सांख्यिकी में बीटा-द्विपद == | ||
Line 174: | Line 172: | ||
\end{align} | \end{align} | ||
</math> | </math> | ||
जहाँ <math>C</math> एक सामान्यीकरण स्थिरांक है। हम पश्च वितरण को एक के रूप में पहचानते हैं <math>\mathrm{Beta}(y_1+\alpha,n_1-y_1+\beta)</math>. | |||
इस प्रकार, फिर से कंपाउंडिंग के माध्यम से, हम पाते हैं कि आकार के भविष्य के नमूने के योग का पश्चगामी वितरण <math>n_2</math> का <math>\mathrm{Bernoulli}(p)</math> यादृच्छिक चर है | इस प्रकार, फिर से कंपाउंडिंग के माध्यम से, हम पाते हैं कि आकार के भविष्य के नमूने के योग का पश्चगामी वितरण <math>n_2</math> का <math>\mathrm{Bernoulli}(p)</math> यादृच्छिक चर है | ||
Line 187: | Line 185: | ||
== संबंधित वितरण == | == संबंधित वितरण == | ||
* <math>\mathrm{BetaBin}(1, \alpha, \beta) \sim \mathrm{Bernoulli}(p)\,</math> | * <math>\mathrm{BetaBin}(1, \alpha, \beta) \sim \mathrm{Bernoulli}(p)\,</math> जहाँ <math>p=\frac{\alpha}{\alpha+\beta}\,</math>. | ||
* <math>\mathrm{BetaBin}(n, 1, 1) \sim U(0,n)\,</math> | * <math>\mathrm{BetaBin}(n, 1, 1) \sim U(0,n)\,</math> जहाँ <math>U(a,b)\,</math> [[समान वितरण (असतत)]] है। | ||
* <math> \lim_{s \rightarrow \infty} \mathrm{BetaBin}(n, ps, (1-p)s) \sim \mathrm{B}(n,p)\,</math> | * <math> \lim_{s \rightarrow \infty} \mathrm{BetaBin}(n, ps, (1-p)s) \sim \mathrm{B}(n,p)\,</math> जहाँ <math>p=\frac{\alpha}{\alpha+\beta}\,</math> और <math>s=\alpha+\beta\,</math> और <math>\mathrm{B}(n,p)\,</math> द्विपद वितरण है। | ||
* <math>\lim_{n \rightarrow \infty} \mathrm{BetaBin}(n, \alpha, n\frac{(1-p)}{p}) \sim \mathrm{NB}(\alpha,p)\,</math> | * <math>\lim_{n \rightarrow \infty} \mathrm{BetaBin}(n, \alpha, n\frac{(1-p)}{p}) \sim \mathrm{NB}(\alpha,p)\,</math> जहाँ <math>\mathrm{NB}(\alpha,p)\,</math> [[नकारात्मक द्विपद वितरण]] है। | ||
== यह भी देखें == | == यह भी देखें == | ||
Line 196: | Line 194: | ||
== संदर्भ == | == संदर्भ == | ||
* {{anchor|Minka2003}} | * {{anchor|Minka2003}}मिंका, थॉमस पी. (2003). डिरिचलेट वितरण का अनुमान लगाना। माइक्रोसॉफ्ट तकनीकी रिपोर्ट। | ||
बाहरी संबंध | |||
* [http://it.stlawu.edu/~msch/biometrics/papers.htm बायोमेट्रिक पहचान उपकरण के प्रदर्शन का आकलन करने के लिए बीटा-द्विपद वितरण का उपयोग करना] | |||
* [http://research.microsoft.com/~minka/software/fastfit/ फास्टफिट] में डेटा के लिए बीटा-द्विपद वितरण (द्वि-आयामी पोल्या वितरण के रूप में) को फ़िट करने के लिए मैटलैब कोड होता है।. | |||
* इंटरएक्टिव ग्राफिक: [http://www.math.wm.edu/~leemis/chart/UDR/UDR.html यूनीवेरिएट डिस्ट्रीब्यूशन रिलेशनशिप] | |||
* [https://cran.r-project.org/web/packages/VGAM/index.html वीजीएएम आर पैकेज में बीटा-द्विपद कार्य] | |||
* [http://foundry.sandia.gov/releases/latest/javadoc-api/gov/sandia/cognition/statistics/distribution/BetaBinomialDistribution.html सांडिया नेशनल लैब्स कॉग्निटिव फाउंड्री जावा लाइब्रेरी में बीटा-द्विपद वितरण] | |||
{{DEFAULTSORT:Beta-Binomial Distribution}} | |||
[[Category: Machine Translated Page]] | [[Category:Created On 21/03/2023|Beta-Binomial Distribution]] | ||
[[Category: | [[Category:Lua-based templates|Beta-Binomial Distribution]] | ||
[[Category:Machine Translated Page|Beta-Binomial Distribution]] | |||
[[Category:Pages with script errors|Beta-Binomial Distribution]] | |||
[[Category:Short description with empty Wikidata description|Beta-Binomial Distribution]] | |||
[[Category:Templates Vigyan Ready|Beta-Binomial Distribution]] | |||
[[Category:Templates that add a tracking category|Beta-Binomial Distribution]] | |||
[[Category:Templates that generate short descriptions|Beta-Binomial Distribution]] | |||
[[Category:Templates using TemplateData|Beta-Binomial Distribution]] | |||
[[Category:असतत वितरण|Beta-Binomial Distribution]] | |||
[[Category:पूर्व वितरण संयुग्मित करें|Beta-Binomial Distribution]] | |||
[[Category:यौगिक संभाव्यता वितरण|Beta-Binomial Distribution]] |
Latest revision as of 13:10, 7 April 2023
Probability mass function ![]() | |||
Cumulative distribution function ![]() | |||
Notation | |||
---|---|---|---|
Parameters |
n ∈ N0 — number of trials (real) (real) | ||
Support | x ∈ { 0, …, n } | ||
PMF |
where is the beta function | ||
CDF |
where 3F2(a;b;x) is the generalized hypergeometric function | ||
Mean | |||
Variance | |||
Skewness | |||
Ex. kurtosis | See text | ||
MGF | where is the hypergeometric function | ||
CF | |||
PGF |
संभाव्यता सिद्धांत और आंकड़ों में, बीटा-द्विपद वितरण गैर-नकारात्मक पूर्णांकों के परिमित समर्थन (गणित) पर असतत संभाव्यता वितरण का एक परिवार है, जब बर्नौली परीक्षणों की निश्चित या ज्ञात संख्या में से प्रत्येक में सफलता की संभावना या तो अज्ञात होती है। या यादृच्छिक। बीटा-द्विपद वितरण द्विपद वितरण है जिसमें प्रत्येक 'एन परीक्षण में सफलता की संभावना तय नहीं है लेकिन बीटा वितरण से यादृच्छिक रूप से तैयार की जाती है। द्विपद प्रकार वितरित आंकड़े में अतिफैलाव को पकड़ने के लिए बायेसियन सांख्यिकी, अनुभवजन्य बेयस विधियों और चिरसम्मत आंकड़ों में इसका उपयोग प्रायः किया जाता है।
बीटा-द्विपद डिरिचलेट-बहुपद वितरण का एक-आयामी संस्करण है क्योंकि द्विपद और बीटा वितरण क्रमशः बहुराष्ट्रीय वितरण और डिरिचलेट वितरण के एकतरफा संस्करण हैं। विशेष घटना जहां α और β पूर्णांक हैं, उन्हें नकारात्मक हाइपरज्यामितीय वितरण के रूप में भी जाना जाता है।
प्रेरणा और व्युत्पत्ति
यौगिक वितरण के रूप में
द्विपद वितरण से पहले बीटा वितरण एक संयुग्म है। यह तथ्य एक विश्लेषणात्मक रूप से ट्रैक्टेबल कंपाउंड डिस्ट्रीब्यूशन की ओर जाता है जहां कोई सोच सकता है बीटा वितरण से यादृच्छिक रूप से निकाले जाने के रूप में द्विपद वितरण में पैरामीटर।
मान लीजिए कि हमें हेड्स की संख्या का अनुमान लगाने में दिलचस्पी है, में भविष्य के परीक्षण। इसके द्वारा दिया गया है
बीटा फलन के गुणों का उपयोग करके इसे वैकल्पिक रूप से लिखा जा सकता है
कलश मॉडल के रूप में बीटा-द्विपद
बीटा-द्विपद वितरण को α और β के सकारात्मक पूर्णांक मानों के लिए कलश मॉडल के माध्यम से भी प्रेरित किया जा सकता है, जिसे पोल्या कलश मॉडल के रूप में जाना जाता है। विशेष रूप से, α लाल गेंदों और β काली गेंदों वाले कलश की कल्पना करें, जहां यादृच्छिक ड्रॉ बनाए जाते हैं। यदि एक लाल गेंद देखी जाती है, तो दो लाल गेंदों को कलश में वापस कर दिया जाता है। इसी तरह, यदि एक काली गेंद निकाली जाती है, तो दो काली गेंदें कलश में वापस आ जाती हैं। यदि इसे n बार दोहराया जाता है, तो x लाल गेंदों को देखने की संभावना पैरामीटर n, α और β के साथ बीटा-द्विपद वितरण का अनुसरण करती है।
यदि यादृच्छिक ड्रॉ सरल प्रतिस्थापन के साथ होते हैं (प्रेक्षित गेंद के ऊपर और ऊपर कोई गेंद कलश में नहीं जोड़ी जाती है), तो वितरण एक द्विपद वितरण का अनुसरण करता है और यदि यादृच्छिक ड्रॉ प्रतिस्थापन के बिना किए जाते हैं, तो वितरण एक हाइपरज्यामितीय वितरण का अनुसरण करता है।
क्षण और गुण
पहले तीन कच्चे क्षण (गणित) हैं
और कर्टोसिस है
दे हम सुझाव देते हैं कि माध्य को इस प्रकार लिखा जा सकता है
और भिन्नता के रूप में
जहाँ . पैरामीटर इंट्रा क्लास या इंट्रा क्लस्टर सहसंबंध के रूप में जाना जाता है। यह सकारात्मक सहसंबंध है जो अति फैलाव को जन्म देता है। ध्यान दें कि कब , बीटा और द्विपद भिन्नता के बीच अंतर करने के लिए कोई जानकारी उपलब्ध नहीं है, और दो मॉडलों में समान भिन्नताएं हैं।
फैक्टोरियल मोमेंट्स
r-बीटा-द्विपद यादृच्छिक चर का वाँ तथ्यात्मक क्षण X है
- .
बिंदु अनुमान
आघूर्ण की विधि
क्षणों की विधि (सांख्यिकी) अनुमान बीटा-द्विपद के पहले और दूसरे क्षणों को ध्यान में रखते हुए और उन्हें नमूना क्षणों के बराबर सेट करके प्राप्त किया जा सकता है और . हम देखतें है
ये अनुमान गैर-संवेदनात्मक रूप से नकारात्मक हो सकते हैं जो इस बात का प्रमाण है कि द्विपद वितरण के सापेक्ष आंकड़े या तो अविच्छिन्न या अल्पप्रकीर्णित है। इस मामले में, द्विपद वितरण और अतिज्यामितीय वितरण क्रमशः वैकल्पिक उम्मीदवार हैं।
अधिकतम संभावना अनुमान
जबकि क्लोज-फॉर्म अधिकतम संभावना अव्यावहारिक है, यह देखते हुए कि पीडीएफ में सामान्य कार्य (गामा फ़ंक्शन और/या बीटा फ़ंक्शन) होते हैं, उन्हें प्रत्यक्ष संख्यात्मक अनुकूलन के माध्यम से आसानी से पाया जा सकता है। अनुभवजन्य आंकड़े से अधिकतम संभावना अनुमान बहुराष्ट्रीय पोल्या वितरण को फिट करने के लिए सामान्य तरीकों का उपयोग करके गणना की जा सकती है, जिसके लिए विधियाँ (मिन्का 2003) में वर्णित हैं।
आर (प्रोग्रामिंग लैंग्वेज) पैकेज वीजीएएम फ़ंक्शन वीजीएलएम के माध्यम से, अधिकतम संभावना के माध्यम से, बीटा-द्विपद वितरण के अनुसार वितरित प्रतिक्रियाओं के साथ सामान्यीकृत रैखिक मॉडल प्रकार के मॉडल की फिटिंग की सुविधा प्रदान करता है। इस बात की कोई आवश्यकता नहीं है कि संपूर्ण प्रेक्षणों के दौरान n स्थिर रहता है।
उदाहरण
निम्नलिखित आंकड़े 19वीं सदी के सैक्सोनी में अस्पताल के रिकॉर्ड से लिए गए 6115 परिवारों में परिवार के आकार 13 के पहले 12 बच्चों में पुरुष बच्चों की संख्या देता है (लिंडसे से सोकल और रोल्फ़, पृ. 59)। 13वें बच्चे को अनदेखा किया जाता है ताकि वांछित लिंग प्राप्त होने पर परिवारों के गैर-यादृच्छिक रूप से रुकने के प्रभाव को कम किया जा सके।
पुरुषों | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 |
परिवार | 3 | 24 | 104 | 286 | 670 | 1033 | 1343 | 1112 | 829 | 478 | 181 | 45 | 7 |
पहले दो नमूना क्षण हैं
और इसलिए क्षणों का अनुमान लगाने की विधि है
अधिकतम संभावना अनुमान संख्यात्मक रूप से पाया जा सकता है
और अधिकतम लॉग संभावना है
जिससे हम एआईसी सूचना कसौटी पाते हैं
प्रतिस्पर्धी द्विपद मॉडल के लिए एआईसी = 25070.34 है और इस प्रकार हम देखते हैं कि बीटा-द्विपद मॉडल आंकड़े के लिए बेहतर फिट प्रदान करता है यानी अति फैलाव के लिए सबूत है। ट्राइवर्स-विलार्ड परिकल्पना स्तनपायी संतानों के बीच लिंग-प्रवणता में विविधता के लिए एक सैद्धांतिक औचित्य को दर्शाती है।
बेहतर फिट विशेष रूप से पूंछों के बीच स्पष्ट है
पुरुषों | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 |
परिवारों का अवलोकन किया | 3 | 24 | 104 | 286 | 670 | 1033 | 1343 | 1112 | 829 | 478 | 181 | 45 | 7 |
सज्जित अपेक्षित (बीटा-द्विपद) | 2.3 | 22.6 | 104.8 | 310.9 | 655.7 | 1036.2 | 1257.9 | 1182.1 | 853.6 | 461.9 | 177.9 | 43.8 | 5.2 |
सज्जित अपेक्षित (द्विपद p = 0.519215) | 0.9 | 12.1 | 71.8 | 258.5 | 628.1 | 1085.2 | 1367.3 | 1265.6 | 854.2 | 410.0 | 132.8 | 26.1 | 2.3 |
बायेसियन सांख्यिकी में बीटा-द्विपद
बर्नौली सफलता की संभावना के बायेसियन अनुमान में बीटा-द्विपद वितरण एक प्रमुख भूमिका निभाता है जिसका अनुमान हम आंकड़ों के आधार पर लगाना चाहते हैं। होने देना स्वतंत्र और समान रूप से वितरित बर्नौली यादृच्छिक चर का एक नमूना (आँकड़े) बनें . मान लीजिए, हमारा ज्ञान - बायेसियन फैशन में - अनिश्चित है और पूर्व वितरण द्वारा तैयार किया गया है . अगर फिर संयुक्त वितरण के माध्यम से
- .
अवलोकन करने के बाद हम ध्यान दें कि के लिए पश्च वितरण
जहाँ एक सामान्यीकरण स्थिरांक है। हम पश्च वितरण को एक के रूप में पहचानते हैं .
इस प्रकार, फिर से कंपाउंडिंग के माध्यम से, हम पाते हैं कि आकार के भविष्य के नमूने के योग का पश्चगामी वितरण का यादृच्छिक चर है
- .
बीटा द्विपद-वितरित यादृच्छिक चर उत्पन्न करना
एक बीटा-द्विपद यादृच्छिक चर बनाने के लिए बस एक ड्रा करें और फिर ड्रा करें .
संबंधित वितरण
- जहाँ .
- जहाँ समान वितरण (असतत) है।
- जहाँ और और द्विपद वितरण है।
- जहाँ नकारात्मक द्विपद वितरण है।
यह भी देखें
- डिरिचलेट-बहुराष्ट्रीय वितरण
संदर्भ
- मिंका, थॉमस पी. (2003). डिरिचलेट वितरण का अनुमान लगाना। माइक्रोसॉफ्ट तकनीकी रिपोर्ट।
बाहरी संबंध
- बायोमेट्रिक पहचान उपकरण के प्रदर्शन का आकलन करने के लिए बीटा-द्विपद वितरण का उपयोग करना
- फास्टफिट में डेटा के लिए बीटा-द्विपद वितरण (द्वि-आयामी पोल्या वितरण के रूप में) को फ़िट करने के लिए मैटलैब कोड होता है।.
- इंटरएक्टिव ग्राफिक: यूनीवेरिएट डिस्ट्रीब्यूशन रिलेशनशिप
- वीजीएएम आर पैकेज में बीटा-द्विपद कार्य
- सांडिया नेशनल लैब्स कॉग्निटिव फाउंड्री जावा लाइब्रेरी में बीटा-द्विपद वितरण