द्विपद वितरण: Difference between revisions
No edit summary |
|||
(8 intermediate revisions by 5 users not shown) | |||
Line 1: | Line 1: | ||
संभाव्यता सिद्धांत और सांख्यिकी में, ''n'' और ''p'' मापदंडों के साथ '''द्विपद वितरण''' ''n'' [[सांख्यिकीय स्वतंत्रता]] के रूप में प्रयोग किया जाता है तथा (प्रायिकता सिद्धांत) के क्रम में सफलताओं की संख्या का [[असतत संभाव्यता वितरण]] है, प्रत्येक हां-नहीं प्रश्न पूछ रहा है, और प्रत्येक अपने स्वयं के बूलियन-मूल्यवान फलन-मूल्यवान [[परिणाम (संभावना)]] के साथ: सफलता (संभावना के साथ ''p'') या विफलता (संभाव्यता के साथ) (<math>q=1-p</math>). एकल सफलता/विफलता प्रयोग को बर्नौली परीक्षण या बर्नौली प्रयोग भी कहा जाता है, और परिणामों के अनुक्रम को बर्नौली प्रक्रिया कहा जाता है; एकल परीक्षण के लिए, अर्थात, n = 1, द्विपद वितरण बर्नौली वितरण है। तथा द्विपद वितरण सांख्यिकीय महत्व के लोकप्रिय [[द्विपद परीक्षण]] का आधार है।<ref>{{Cite book|last=Westland|first=J. Christopher|title=Audit Analytics: Data Science for the Accounting Profession|publisher=Springer|year=2020|isbn=978-3-030-49091-1|location=Chicago, IL, USA|pages=53}}</ref> | |||
द्विपद वितरण का उपयोग अधिकांशतः आकार ''n'' की जनसंख्या से प्रतिस्थापन के साथ खींचे गए आकार ''n'' के नमूने में सफलताओं की संख्या को मॉडल करने के लिए किया जाता है। यदि नमूना प्रतिस्थापन के बिना किया जाता है, तब ड्रॉ स्वतंत्र नहीं होते हैं और इसलिए परिणामी वितरण एक हाइपरज्यामितीय होता है वितरण, द्विपद वितरण नहीं है। चूँकि, ''n'' से बहुत बड़े N के लिए, द्विपद वितरण एक अच्छा सन्निकटन बना हुआ है, और व्यापक रूप से उपयोग किया जाता है। | |||
द्विपद वितरण का उपयोग अधिकांशतः | |||
== परिभाषाएँ == | == परिभाषाएँ == | ||
=== संभाव्यता द्रव्यमान | === संभाव्यता द्रव्यमान फलन === | ||
सामान्यतः, यदि यादृच्छिक चर X पैरामीटर n ∈ <math>\mathbb{N}</math> प्राकृतिक संख्या के साथ द्विपद वितरण का अनुसरण करता है और p ∈ [0,1], हम X ~ B(n, p) लिखते हैं। n स्वतंत्र बर्नौली परीक्षणों में बिल्कुल k सफलताएँ प्राप्त करने की प्रायिकता संभाव्यता द्रव्यमान फलन द्वारा दी गई है: | सामान्यतः, यदि यादृच्छिक चर X पैरामीटर n ∈ <math>\mathbb{N}</math> प्राकृतिक संख्या के साथ द्विपद वितरण का अनुसरण करता है और ''p ∈ [0,1],'' हम ''X ~ B(n, p)'' लिखते हैं। n स्वतंत्र बर्नौली परीक्षणों में बिल्कुल k सफलताएँ प्राप्त करने की प्रायिकता संभाव्यता द्रव्यमान फलन द्वारा दी गई है: | ||
:<math>f(k,n,p) = \Pr(k;n,p) = \Pr(X = k) = \binom{n}{k}p^k(1-p)^{n-k}</math> | :<math>f(k,n,p) = \Pr(k;n,p) = \Pr(X = k) = \binom{n}{k}p^k(1-p)^{n-k}</math> | ||
Line 39: | Line 12: | ||
:<math>\binom{n}{k} =\frac{n!}{k!(n-k)!}</math> | :<math>\binom{n}{k} =\frac{n!}{k!(n-k)!}</math> | ||
[[द्विपद गुणांक]] है, इसलिए इसका नाम द्विपद वितरण है। सूत्र को इस प्रकार समझा जा सकता है: k सफलताएँ प्रायिकता p<sup>k</sup> के साथ होती हैं और n−k विफलताएँ संभाव्यता के साथ होती हैं <math>(1-p)^{n-k}</math>. चूँकि, k सफलताएँ n परीक्षणों के मध्य कहीं भी हो सकती हैं, और वहाँ हैं | [[द्विपद गुणांक]] है, इसलिए इसका नाम द्विपद वितरण है। सूत्र को इस प्रकार समझा जा सकता है: k सफलताएँ प्रायिकता ''p<sup>k</sup>'' के साथ होती हैं और ''n−k'' विफलताएँ संभाव्यता के साथ होती हैं <math>(1-p)^{n-k}</math>. चूँकि, k सफलताएँ n परीक्षणों के मध्य कहीं भी हो सकती हैं, और वहाँ हैं <math>\tbinom{n}{k}</math> n परीक्षणों के क्रम में k सफलताओं को वितरित करने के विभिन्न विधियों । | ||
द्विपद वितरण संभाव्यता के लिए संदर्भ सारणी बनाने में, सामान्यतः तालिका को n/2 मानों तक भर दिया जाता है। ऐसा इसलिए है क्योंकि k > n/2 के लिए, प्रायिकता की गणना इसके पूरक के रूप में की जा सकती है | द्विपद वितरण संभाव्यता के लिए संदर्भ सारणी बनाने में, सामान्यतः तालिका को ''n/2'' मानों तक भर दिया जाता है। ऐसा इसलिए है क्योंकि ''k > n/2'' के लिए, प्रायिकता की गणना इसके पूरक के रूप में की जा सकती है | ||
:<math>f(k,n,p)=f(n-k,n,1-p). </math> | :<math>f(k,n,p)=f(n-k,n,1-p). </math> | ||
अभिव्यक्ति f(k, n, p) को k के | अभिव्यक्ति f(k, n, p) को k के फलन के रूप में देखते हुए, k मान है जो इसे अधिकतम करता है। यह k मान गणना करके पाया जा सकता है | ||
:<math> \frac{f(k+1,n,p)}{f(k,n,p)}=\frac{(n-k)p}{(k+1)(1-p)} </math> | :<math> \frac{f(k+1,n,p)}{f(k,n,p)}=\frac{(n-k)p}{(k+1)(1-p)} </math> | ||
और इसकी तुलना 1 से करें। सदैव पूर्णांक M होता है जो संतुष्ट करता है<ref>{{cite book |last=Feller |first=W. |title=An Introduction to Probability Theory and Its Applications |url=https://archive.org/details/introductiontopr01wfel |url-access=limited |year=1968 |publisher=Wiley |location=New York |edition=Third |page=[https://archive.org/details/introductiontopr01wfel/page/n167 151] (theorem in section VI.3) }}</ref> | और इसकी तुलना 1 से करें। सदैव पूर्णांक M होता है जो संतुष्ट करता है<ref>{{cite book |last=Feller |first=W. |title=An Introduction to Probability Theory and Its Applications |url=https://archive.org/details/introductiontopr01wfel |url-access=limited |year=1968 |publisher=Wiley |location=New York |edition=Third |page=[https://archive.org/details/introductiontopr01wfel/page/n167 151] (theorem in section VI.3) }}</ref> | ||
:<math>(n+1)p-1 \leq M < (n+1)p.</math> | :<math>(n+1)p-1 \leq M < (n+1)p.</math> | ||
f(k, n, p) k < M के लिए मोनोटोन बढ़ रहा है और k > M के लिए मोनोटोन घट रहा है, उस स्थितियोंको छोड़कर जहां (n + 1)p पूर्णांक है। इस स्थितियों में, ऐसे दो मान हैं जिनके लिए f अधिकतम है: (n + 1)p और (n + 1) | ''f(k, n, p) k < M'' के लिए मोनोटोन बढ़ रहा है और ''k > M'' के लिए मोनोटोन घट रहा है, उस स्थितियोंको छोड़कर जहां ''(n + 1)p'' पूर्णांक है। इस स्थितियों में, ऐसे दो मान हैं जिनके लिए f अधिकतम है: ''(n + 1)p'' और ''(n + 1)p − 1''। है तथा ''M'' सबसे संभावित परिणाम है (अर्थात, सबसे अधिक संभावना है, चूंकि यह अभी भी असंभव हो सकता है कुल मिलाकर) बरनौली परीक्षण और इसे [[मोड (सांख्यिकी)]] भी कहा जाता है। | ||
=== उदाहरण === | === उदाहरण === | ||
Line 56: | Line 29: | ||
:<math>f(4,6,0.3) = \binom{6}{4}0.3^4 (1-0.3)^{6-4}= 0.059535.</math> | :<math>f(4,6,0.3) = \binom{6}{4}0.3^4 (1-0.3)^{6-4}= 0.059535.</math> | ||
=== संचयी वितरण | === संचयी वितरण फलन === | ||
संचयी वितरण | संचयी वितरण फलन के रूप में व्यक्त किया जा सकता है: | ||
:<math>F(k;n,p) = \Pr(X \le k) = \sum_{i=0}^{\lfloor k \rfloor} {n\choose i}p^i(1-p)^{n-i},</math> | :<math>F(k;n,p) = \Pr(X \le k) = \sum_{i=0}^{\lfloor k \rfloor} {n\choose i}p^i(1-p)^{n-i},</math> | ||
जहाँ <math>\lfloor k\rfloor</math> k के नीचे का तल है, अर्थात फर्श और छत k से कम या उसके सामान्तर | जहाँ <math>\lfloor k\rfloor</math> k के नीचे का तल है, अर्थात फर्श और छत k से कम या उसके सामान्तर फलन करता है। | ||
इसे नियमित रूप से अपूर्ण बीटा फलन के संदर्भ में निम्नानुसार भी प्रदर्शित किया जा सकता है:<ref>{{cite book |last=Wadsworth |first=G. P. |title=Introduction to Probability and Random Variables |year=1960 |publisher=McGraw-Hill |location=New York |page=[https://archive.org/details/introductiontopr0000wads/page/52 52] |url=https://archive.org/details/introductiontopr0000wads |url-access=registration }}</ref> | इसे नियमित रूप से अपूर्ण बीटा फलन के संदर्भ में निम्नानुसार भी प्रदर्शित किया जा सकता है:<ref>{{cite book |last=Wadsworth |first=G. P. |title=Introduction to Probability and Random Variables |year=1960 |publisher=McGraw-Hill |location=New York |page=[https://archive.org/details/introductiontopr0000wads/page/52 52] |url=https://archive.org/details/introductiontopr0000wads |url-access=registration }}</ref> | ||
Line 69: | Line 42: | ||
& = (n-k) {n \choose k} \int_0^{1-p} t^{n-k-1} (1-t)^k \, dt. | & = (n-k) {n \choose k} \int_0^{1-p} t^{n-k-1} (1-t)^k \, dt. | ||
\end{align}</math> | \end{align}</math> | ||
जो कि F-वितरण | जो कि F-वितरण | के संचयी वितरण फलन के समतुल्य है'''{{mvar|F}}-वितरण''':<ref>{{cite journal |last=Jowett |first=G. H. |year=1963 |title=The Relationship Between the Binomial and F Distributions |journal=Journal of the Royal Statistical Society, Series D |volume=13 |issue=1 |pages=55–57 |doi=10.2307/2986663 |jstor=2986663 }}</ref> | ||
:<math>F(k;n,p) = F_{F\text{-distribution}}\left(x=\frac{1-p}{p}\frac{k+1}{n-k};d_1=2(n-k),d_2=2(k+1)\right).</math> | :<math>F(k;n,p) = F_{F\text{-distribution}}\left(x=\frac{1-p}{p}\frac{k+1}{n-k};d_1=2(n-k),d_2=2(k+1)\right).</math> | ||
संचयी वितरण | संचयी वितरण फलन के लिए कुछ सवृत-फ़ॉर्म बाउंड या टेल बाउंड दिए गए हैं. | ||
== गुण == | == गुण == | ||
Line 77: | Line 50: | ||
=== [[अपेक्षित मूल्य]] और विचरण === | === [[अपेक्षित मूल्य]] और विचरण === | ||
यदि X ~ B(n, p), अर्थात, X द्विपद रूप से वितरित यादृच्छिक चर है, n प्रयोगों की कुल संख्या है और p प्रत्येक प्रयोग के सफल परिणाम देने की संभावना है, तब X का अपेक्षित मान है:<ref>See [https://proofwiki.org/wiki/Expectation_of_Binomial_Distribution Proof Wiki]</ref> | यदि ''X ~ B(n, p),'' अर्थात, X द्विपद रूप से वितरित यादृच्छिक चर है, n प्रयोगों की कुल संख्या है और p प्रत्येक प्रयोग के सफल परिणाम देने की संभावना है, तब X का अपेक्षित मान है:<ref>See [https://proofwiki.org/wiki/Expectation_of_Binomial_Distribution Proof Wiki]</ref> | ||
:<math> \operatorname{E}[X] = np.</math> | :<math> \operatorname{E}[X] = np.</math> | ||
यह इस तथ्य के साथ-साथ अपेक्षित मूल्य की रैखिकता का अनुसरण करता है कि {{mvar|X}} | यह इस तथ्य के साथ-साथ अपेक्षित मूल्य की रैखिकता का अनुसरण करता है कि {{mvar|X}} {{mvar|n}} का योग है तथा समान बर्नौली यादृच्छिक चर, प्रत्येक अपेक्षित मूल्य {{mvar|p}} के साथ है| दूसरे शब्दों में, यदि <math>X_1, \ldots, X_n</math> पैरामीटर के {{mvar|p}} साथ समान (और स्वतंत्र) बर्नौली यादृच्छिक चर हैं , तब <math>X = X_1 + \cdots + X_n</math> और | ||
<math>\operatorname{E}[X] = \operatorname{E}[X_1 + \cdots + X_n] = \operatorname{E}[X_1] + \cdots + \operatorname{E}[X_n] = p + \cdots + p = np.</math> | <math>\operatorname{E}[X] = \operatorname{E}[X_1 + \cdots + X_n] = \operatorname{E}[X_1] + \cdots + \operatorname{E}[X_n] = p + \cdots + p = np.</math> | ||
Line 131: | Line 104: | ||
\operatorname {E}[X^c] = \sum_{k=0}^c \left\{ {c \atop k} \right\} n^{\underline{k}} p^k, | \operatorname {E}[X^c] = \sum_{k=0}^c \left\{ {c \atop k} \right\} n^{\underline{k}} p^k, | ||
</math> | </math> | ||
कहाँ <math>\textstyle \left\{{c\atop k}\right\}</math> [[दूसरी तरह की स्टर्लिंग संख्या]]एँ हैं, और <math>n^{\underline{k}} = n(n-1)\cdots(n-k+1)</math> है <math>k</math> वें [[ | कहाँ <math>\textstyle \left\{{c\atop k}\right\}</math> [[दूसरी तरह की स्टर्लिंग संख्या]]एँ हैं, और <math>n^{\underline{k}} = n(n-1)\cdots(n-k+1)</math> है <math>k</math> वें [[अवरोही और आरोही क्रम गुणित]] <math>n</math>.एक साधारण बंधन <ref>{{Citation |last1=D. Ahle |first1=Thomas |title=Sharp and Simple Bounds for the raw Moments of the Binomial and Poisson Distributions | ||
|year=2022 | |year=2022 | ||
|volume=182 | |volume=182 | ||
|doi=10.1016/j.spl.2021.109306 | |doi=10.1016/j.spl.2021.109306 | ||
|journal=Statistics & Probability Letters | |journal=Statistics & Probability Letters | ||
|page=109306 |arxiv=2103.17027 }}</ref> प्वासों वितरण | |page=109306 |arxiv=2103.17027 }}</ref> प्वासों वितरण या उच्चतर क्षणों के माध्यम से द्विपद आघूर्णों को बाउंड करके अनुसरण करता है: | ||
::<math> | ::<math> | ||
\operatorname {E}[X^c] \le | \operatorname {E}[X^c] \le | ||
Line 142: | Line 115: | ||
</math> | </math> | ||
इससे पता चलता है कि यदि <math>c=O(\sqrt{np})</math>, तब <math>\operatorname {E}[X^c]</math> से अधिक से अधिक स्थिर कारक दूर है <math>\operatorname {E}[X]^c</math> | इससे पता चलता है कि यदि <math>c=O(\sqrt{np})</math>, तब <math>\operatorname {E}[X^c]</math> से अधिक से अधिक स्थिर कारक दूर है <math>\operatorname {E}[X]^c</math> | ||
[[Category:Articles with hatnote templates targeting a nonexistent page|Binomial Distribution]] | |||
[[Category:CS1 Deutsch-language sources (de)|Binomial Distribution]] | |||
[[Category:Collapse templates|Binomial Distribution]] | |||
[[Category:Commons category link is locally defined|Binomial Distribution]] | |||
[[Category:Created On 07/02/2023|Binomial Distribution]] | |||
[[Category:Lua-based templates|Binomial Distribution]] | |||
[[Category:Machine Translated Page|Binomial Distribution]] | |||
[[Category:Navigational boxes| ]] | |||
[[Category:Navigational boxes without horizontal lists|Binomial Distribution]] | |||
[[Category:Pages using infobox probability distribution with unknown parameters|मछुआराद्विपद वितरण]] | |||
[[Category:Pages with empty portal template|Binomial Distribution]] | |||
[[Category:Pages with maths render errors|Binomial Distribution]] | |||
[[Category:Pages with script errors|Binomial Distribution]] | |||
[[Category:Portal templates with redlinked portals|Binomial Distribution]] | |||
[[Category:Short description with empty Wikidata description|Binomial Distribution]] | |||
[[Category:Sidebars with styles needing conversion|Binomial Distribution]] | |||
[[Category:Template documentation pages|Documentation/doc]] | |||
[[Category:Templates Vigyan Ready|Binomial Distribution]] | |||
[[Category:Templates generating microformats|Binomial Distribution]] | |||
[[Category:Templates that add a tracking category|Binomial Distribution]] | |||
[[Category:Templates that are not mobile friendly|Binomial Distribution]] | |||
[[Category:Templates that generate short descriptions|Binomial Distribution]] | |||
[[Category:Templates using TemplateData|Binomial Distribution]] | |||
[[Category:Wikipedia metatemplates|Binomial Distribution]] | |||
[[Category:असतत वितरण|Binomial Distribution]] | |||
[[Category:क्रमगुणित और द्विपद विषय|Binomial Distribution]] | |||
[[Category:घातीय परिवार वितरण|Binomial Distribution]] | |||
[[Category:पूर्व वितरण संयुग्मित करें|Binomial Distribution]] | |||
=== मोड === | === मोड === | ||
सामान्यतः द्विपद B(n,-p) वितरण | सामान्यतः द्विपद ''B(n,-p)'' वितरण का बहुलक <math>\lfloor (n+1)p\rfloor</math> (सांख्यिकी) सामान्तर होता है , जहाँ <math>\lfloor\cdot\rfloor</math> [[फर्श फलन]] है। चूँकि, जब ''(n + 1)p'' पूर्णांक होता है और ''p'' न तो ''0'' होता है और न ही ''1'', तो वितरण के दो विधियों होते हैं: ''(n + 1)p'' और ''(n + 1)p − 1''। जब ''p 0'' के सामान्तर होता है या ''1'' होता है , तो मोड क्रमशः ''0'' और ''n'' होगा। इन स्थितियों को संक्षेप में निम्नानुसार किया जा सकता है: | ||
: <math>\text{mode} = | : <math>\text{mode} = | ||
\begin{cases} | \begin{cases} | ||
Line 154: | Line 157: | ||
:<math>f(k)=\binom nk p^k q^{n-k}.</math> | :<math>f(k)=\binom nk p^k q^{n-k}.</math> | ||
<math>p=0</math> के लिए | <math>p=0</math> के लिए केवल <math>f(0)</math> के साथ शून्येतर मान है <math>f(0)=1</math>. के लिए <math>p=1</math> हम देखतें है <math>f(n)=1</math> और <math>f(k)=0</math> के लिए <math>k\neq n</math>. इससे सिद्ध होता है कि बहुलक 0 है <math>p=0</math> और <math>n</math> के लिए <math>p=1</math>. | ||
होने देना <math>0 < p < 1</math>. हम देखतें है | होने देना <math>0 < p < 1</math>. हम देखतें है | ||
Line 167: | Line 170: | ||
k < (n+1)p-1 \Rightarrow f(k+1) > f(k) | k < (n+1)p-1 \Rightarrow f(k+1) > f(k) | ||
\end{align}</math> | \end{align}</math> | ||
तब '''कब''' जब | तब '''कब''' जब <math>(n+1)p-1</math> पूर्णांक है, तब <math>(n+1)p-1</math> और <math>(n+1)p</math> विधा है। उस स्थितियों में <math>(n+1)p-1\notin \Z</math>, सिर्फ तभी <math>\lfloor (n+1)p-1\rfloor+1=\lfloor (n+1)p\rfloor</math> विधा है।<ref>See also {{cite web |first=André |last=Nicolas |title=Finding mode in Binomial distribution |work=[[Stack Exchange]] |date=January 7, 2019 |url=https://math.stackexchange.com/q/117940 }}</ref> | ||
=== मध्य === | === मध्य === | ||
सामान्यतः, द्विपद वितरण | सामान्यतः, द्विपद वितरण के लिए माध्यिका ज्ञात करने के लिए कोई एकल सूत्र नहीं होता है, और यह गैर-अद्वितीय भी हो सकता है। चूँकि, अनेक विशेष परिणाम स्थापित किए गए हैं: | ||
* यदि np पूर्णांक है, तब माध्य, माध्यिका और बहुलक संपाती हैं और np के सामान्तर हैं।<ref>{{cite journal|last=Neumann|first=P.|year=1966|title=Über den Median der Binomial- and Poissonverteilung|journal=Wissenschaftliche Zeitschrift der Technischen Universität Dresden|volume=19|pages=29–33|language=de}}</ref><ref>Lord, Nick. (July 2010). "Binomial averages when the mean is an integer", [[The Mathematical Gazette]] 94, 331-332.</ref> | * यदि ''np'' पूर्णांक है, तब माध्य, माध्यिका और बहुलक संपाती हैं और ''np'' के सामान्तर हैं।<ref>{{cite journal|last=Neumann|first=P.|year=1966|title=Über den Median der Binomial- and Poissonverteilung|journal=Wissenschaftliche Zeitschrift der Technischen Universität Dresden|volume=19|pages=29–33|language=de}}</ref><ref>Lord, Nick. (July 2010). "Binomial averages when the mean is an integer", [[The Mathematical Gazette]] 94, 331-332.</ref> | ||
* किसी भी माध्यिका m को अंतराल ⌊np⌋ ≤ m ≤ ⌈np⌉ के अंदर होना चाहिए।<ref name="KaasBuhrman">{{cite journal|first1=R.|last1=Kaas|first2=J.M.|last2=Buhrman|title=Mean, Median and Mode in Binomial Distributions|journal=Statistica Neerlandica|year=1980|volume=34|issue=1|pages=13–18|doi=10.1111/j.1467-9574.1980.tb00681.x}}</ref> | * किसी भी माध्यिका ''m'' को अंतराल ''⌊np⌋ ≤ m ≤ ⌈np⌉'' के अंदर होना चाहिए।<ref name="KaasBuhrman">{{cite journal|first1=R.|last1=Kaas|first2=J.M.|last2=Buhrman|title=Mean, Median and Mode in Binomial Distributions|journal=Statistica Neerlandica|year=1980|volume=34|issue=1|pages=13–18|doi=10.1111/j.1467-9574.1980.tb00681.x}}</ref> | ||
* माध्यिका m माध्य से बहुत दूर नहीं हो सकता: {{nowrap|{{pipe}}''m'' − ''np''{{pipe}} ≤ min{ ln 2, max{''p'', 1 − ''p''} }}}.<ref name="Hamza">{{Cite journal | * माध्यिका m माध्य से बहुत दूर नहीं हो सकता: {{nowrap|{{pipe}}''m'' − ''np''{{pipe}} ≤ min{ ln 2, max{''p'', 1 − ''p''} }}}.<ref name="Hamza">{{Cite journal | ||
| last1 = Hamza | first1 = K. | | last1 = Hamza | first1 = K. | ||
Line 183: | Line 186: | ||
| year = 1995 | | year = 1995 | ||
}}</ref> | }}</ref> | ||
* माध्य अद्वितीय है और | * माध्य अद्वितीय है और ''m'' = [[Rounding|राउंडिंग]] (''np)'' के सामान्तर है जब ''|m − np|'' ≤ मिनट ''{p, 1 − p}'' (स्थितियोंको छोड़कर जब ''p ={{sfrac|1|2}}'' और ''n'' विषम है)।<ref name="KaasBuhrman"/> | ||
*जब p परिमेय संख्या है (p = 1/2 और n विषम को छोड़कर) तब माध्य अद्वितीय होता है।<ref name="Nowakowski">{{Cite journal | *जब ''p'' परिमेय संख्या है ''(p = 1/2'' और ''n'' विषम को छोड़कर) तब माध्य अद्वितीय होता है।<ref name="Nowakowski">{{Cite journal | ||
| last1 = Nowakowski | first1 = Sz. | | last1 = Nowakowski | first1 = Sz. | ||
| doi = 10.37418/amsj.10.4.9 | | doi = 10.37418/amsj.10.4.9 | ||
Line 197: | Line 200: | ||
| s2cid = 215238991 | | s2cid = 215238991 | ||
}}</ref> | }}</ref> | ||
* जब p = 1/2 और n विषम हो, तब अंतराल में कोई भी संख्या m {{sfrac|1|2}}(n − 1) ≤ m ≤{{sfrac|1|2}}(n + 1) द्विपद वितरण | * जब ''p = 1/2'' और ''n'' विषम हो, तब अंतराल में कोई भी संख्या ''m {{sfrac|1|2}}(n − 1) ≤ m ≤{{sfrac|1|2}}(n + 1)'' द्विपद वितरण की माध्यिका है। यदि ''p = 1/2'' और ''n'' सम है, तब ''m = n/2'' अद्वितीय माध्यिका है। | ||
=== ल बाउंड्स === | === ल बाउंड्स === | ||
''k'' ≤ ''np'' | ''k'' ≤ ''np'' के लिए, संचयी वितरण फलन <math>F(k;n,p) = \Pr(X \le k)</math> की निचली पूंछ के लिए होता है जिससे ऊपरी सीमाएं प्राप्त की जा सकती हैं , संभावना है कि अधिक से अधिक k सफलताएँ हैं। चूँकि <math>\Pr(X \ge k) = F(n-k;n,1-p) </math>, इन सीमाओं को ''k ≥ np'' के संचयी वितरण फलन की ऊपरी पूंछ के लिए सीमाओं के रूप में भी देखा जा सकता है। | ||
हॉफडिंग की असमानता से सरल सीमा प्राप्त होती है | हॉफडिंग की असमानता से सरल सीमा प्राप्त होती है | ||
:<math> F(k;n,p) \leq \exp\left(-2 n\left(p-\frac{k}{n}\right)^2\right), \!</math> | :<math> F(k;n,p) \leq \exp\left(-2 n\left(p-\frac{k}{n}\right)^2\right), \!</math> | ||
जो चूंकि ज्यादा टाइट नहीं है। विशेष रूप से, p = 1 के लिए, हमारे पास वह F(k;n,p) = 0 (स्थिर k के लिए, n के साथ k < n) है, किन्तु होफ़डिंग की सीमा | जो चूंकि ज्यादा टाइट नहीं है। विशेष रूप से, ''p = 1'' के लिए, हमारे पास वह ''F(k;n,p) = 0'' (स्थिर ''k'' के लिए, ''n'' के साथ ''k < n'') है, किन्तु होफ़डिंग की सीमा धनात्मक स्थिरांक का मूल्यांकन करती है। | ||
[[Chernoff बाध्य|चेर्नॉफ़ बाउंड]] से शार्प बाउंड प्राप्त किया जा सकता है:<ref name="ag">{{cite journal |first1=R. |last1=Arratia |first2=L. |last2=Gordon |title=Tutorial on large deviations for the binomial distribution |journal=Bulletin of Mathematical Biology |volume=51 |issue=1 |year=1989 |pages=125–131 |doi=10.1007/BF02458840 |pmid=2706397 |s2cid=189884382 }}</ref> | [[Chernoff बाध्य|चेर्नॉफ़ बाउंड]] से शार्प बाउंड प्राप्त किया जा सकता है:<ref name="ag">{{cite journal |first1=R. |last1=Arratia |first2=L. |last2=Gordon |title=Tutorial on large deviations for the binomial distribution |journal=Bulletin of Mathematical Biology |volume=51 |issue=1 |year=1989 |pages=125–131 |doi=10.1007/BF02458840 |pmid=2706397 |s2cid=189884382 }}</ref> | ||
:<math> F(k;n,p) \leq \exp\left(-nD\left(\frac{k}{n}\parallel p\right)\right) </math> | :<math> F(k;n,p) \leq \exp\left(-nD\left(\frac{k}{n}\parallel p\right)\right) </math> | ||
जहां D (''<u>a</u>''|| ''p'') कुल्बैक-लीब्लर डाइवर्जेंस है। ''a'' -सिक्का | जहां D (''<u>a</u>''|| ''p'') कुल्बैक-लीब्लर डाइवर्जेंस है। ''a'' -सिक्का और ''p''-सिक्का (अर्थात बर्नौली (a) और बर्नौली (p) वितरण के मध्य) के मध्य सापेक्ष एन्ट्रॉपी (या कुल्बैक-लीब्लर डाइवर्जेंस) है: | ||
:<math> D(a\parallel p)=(a)\log\frac{a}{p}+(1-a)\log\frac{1-a}{1-p}. \!</math> | :<math> D(a\parallel p)=(a)\log\frac{a}{p}+(1-a)\log\frac{1-a}{1-p}. \!</math> | ||
असम्बद्ध रूप से, यह सीमा यथोचित तंग है; देखना <ref name="ag"/>जानकारी के लिए। | असम्बद्ध रूप से, यह सीमा यथोचित तंग है; देखना <ref name="ag"/>जानकारी के लिए। | ||
कोई | कोई निचली सीमा भी प्राप्त कर सकता है <math>F(k;n,p) </math>, विरोधी एकाग्रता सीमा के रूप में जाना जाता है। स्टर्लिंग के सूत्र के साथ द्विपद गुणांक का अनुमान लगाकर यह दिखाया जा सकता है<ref>{{cite book |author1=Robert B. Ash |title=Information Theory |url=https://archive.org/details/informationtheor00ashr |url-access=limited |date=1990 |publisher=Dover Publications |page=[https://archive.org/details/informationtheor00ashr/page/n81 115]|isbn=9780486665214 }}</ref> | ||
:<math> F(k;n,p) \geq \frac{1}{\sqrt{8n\tfrac{k}{n}(1-\tfrac{k}{n})}} \exp\left(-nD\left(\frac{k}{n}\parallel p\right)\right),</math> | :<math> F(k;n,p) \geq \frac{1}{\sqrt{8n\tfrac{k}{n}(1-\tfrac{k}{n})}} \exp\left(-nD\left(\frac{k}{n}\parallel p\right)\right),</math> | ||
जिसका तात्पर्य सरल किन्तुशिथिल बाध्यता से है | जिसका तात्पर्य सरल किन्तुशिथिल बाध्यता से है | ||
Line 230: | Line 233: | ||
यह अनुमानक [[अधिकतम संभावना अनुमानक]] और [[क्षणों की विधि (सांख्यिकी)]] का उपयोग करके पाया जाता है। यह अनुमानक [[एक अनुमानक का पूर्वाग्रह|अनुमानक का पूर्वाग्रह]] है और समान रूप से [[न्यूनतम-विचरण निष्पक्ष अनुमानक]] के साथ, लेहमैन-शेफ़े प्रमेय का उपयोग करके सिद्ध किया गया है, क्योंकि यह [[न्यूनतम पर्याप्त]] और [[पूर्णता (सांख्यिकी)]] आँकड़ा (अर्थात: x) पर आधारित है। यह संभाव्यता और माध्य चुकता त्रुटि दोनों में संगत अनुमानक भी है। | यह अनुमानक [[अधिकतम संभावना अनुमानक]] और [[क्षणों की विधि (सांख्यिकी)]] का उपयोग करके पाया जाता है। यह अनुमानक [[एक अनुमानक का पूर्वाग्रह|अनुमानक का पूर्वाग्रह]] है और समान रूप से [[न्यूनतम-विचरण निष्पक्ष अनुमानक]] के साथ, लेहमैन-शेफ़े प्रमेय का उपयोग करके सिद्ध किया गया है, क्योंकि यह [[न्यूनतम पर्याप्त]] और [[पूर्णता (सांख्यिकी)]] आँकड़ा (अर्थात: x) पर आधारित है। यह संभाव्यता और माध्य चुकता त्रुटि दोनों में संगत अनुमानक भी है। | ||
p के लिए | p के लिए सवृत रूप [[बेयस अनुमानक]] भी उपस्थित है जब [[बीटा वितरण]] को संयुग्मित पूर्व [[पूर्व वितरण]] के रूप में उपयोग किया जाता है। सामान्य का उपयोग करते समय <math>\operatorname{Beta}(\alpha, \beta)</math> पूर्व के रूप में, बेयस अनुमानक या पोस्टीरियर माध्य अनुमानक है: | ||
:<math> \widehat{p}_b = \frac{x+\alpha}{n+\alpha+\beta}.</math> | :<math> \widehat{p}_b = \frac{x+\alpha}{n+\alpha+\beta}.</math> | ||
बायस आकलनकर्ता स्पर्शोन्मुख दक्षता (बायस) है और जैसे ही नमूना आकार अनंत (n → ∞) तक पहुंचता है, यह [[अधिकतम संभावना अनुमान]] समाधान तक पहुंचता है। बेयस अनुमानक अनुमानक का पूर्वाग्रह है (कितना पूर्ववर्तियों पर निर्भर करता है), बेयस अनुमानक या स्वीफलनता और संभाव्यता में लगातार अनुमानक। | |||
[[गैर-सूचनात्मक पूर्व]] के रूप में [[मानक वर्दी वितरण]] का उपयोग करने के विशेष | [[गैर-सूचनात्मक पूर्व]] के रूप में [[मानक वर्दी वितरण]] का उपयोग करने के विशेष स्थितियों के लिए, <math>\operatorname{Beta}(\alpha=1, \beta=1) = U(0,1)</math>, पश्च माध्य अनुमानक बन जाता है: | ||
:<math> \widehat{p}_b = \frac{x+1}{n+2}.</math> | :<math> \widehat{p}_b = \frac{x+1}{n+2}.</math> | ||
(एक बेयस अनुमानक या पश्च मोड को केवल मानक अनुमानक तक ले जाना चाहिए।) इस पद्धति को [[उत्तराधिकार का नियम]] कहा जाता है, जिसे 18 वीं शताब्दी में [[पियरे-साइमन लाप्लास]] द्वारा प्रस्तुत किया गया था। | (एक बेयस अनुमानक या पश्च मोड को केवल मानक अनुमानक तक ले जाना चाहिए।) इस पद्धति को [[उत्तराधिकार का नियम]] कहा जाता है, जिसे 18 वीं शताब्दी में [[पियरे-साइमन लाप्लास]] द्वारा प्रस्तुत किया गया था। | ||
Line 247: | Line 250: | ||
{{Main|द्विपद अनुपात विश्वास अंतराल}} | {{Main|द्विपद अनुपात विश्वास अंतराल}} | ||
यहां तक कि n | यहां तक कि n के अधिक बड़े मूल्यों के लिए, माध्य का वास्तविक वितरण महत्वपूर्ण रूप से असामान्य है।<ref name=Brown2001>{{Citation |first1=Lawrence D. |last1=Brown |first2=T. Tony |last2=Cai |first3=Anirban |last3=DasGupta |year=2001 |title = Interval Estimation for a Binomial Proportion |url=http://www-stat.wharton.upenn.edu/~tcai/paper/html/Binomial-StatSci.html |journal=Statistical Science |volume=16 |issue=2 |pages=101–133 |access-date = 2015-01-05 |doi=10.1214/ss/1009213286|citeseerx=10.1.1.323.7752 }}</ref> इस समस्या के कारण कॉन्फिडेंस इंटरवल का अनुमान लगाने के लिए अनेक विधियों प्रस्तावित किए गए हैं। | ||
नीचे दिए गए कॉन्फ़िडेंस इंटरवल के समीकरणों में, वेरिएबल्स के निम्नलिखित अर्थ हैं: | नीचे दिए गए कॉन्फ़िडेंस इंटरवल के समीकरणों में, वेरिएबल्स के निम्नलिखित अर्थ हैं: | ||
* n<sub>1,</sub> n में से सफलताओं की संख्या है, परीक्षणों की कुल संख्या | * ''n<sub>1,</sub> n'' में से सफलताओं की संख्या है, परीक्षणों की कुल संख्या | ||
* <math> \widehat{p\,} = \frac{n_1}{n}</math> सफलताओं का अनुपात है | * <math> \widehat{p\,} = \frac{n_1}{n}</math> सफलताओं का अनुपात है | ||
* <math>z=1 - \tfrac{1}{2}\alpha</math> लक्ष्य त्रुटि दर के अनुरूप [[मानक सामान्य वितरण]] (अर्थात, [[प्रोबिट]]) का परिमाण है <math>\alpha</math>. उदाहरण के लिए, 95% विश्वास स्तर के लिए त्रुटि <math>\alpha</math>= 0.05, इसलिए <math>1 - \tfrac{1}{2}\alpha</math>= 0.975 और <math>z</math> = 1.96. | * <math>z=1 - \tfrac{1}{2}\alpha</math> लक्ष्य त्रुटि दर के अनुरूप [[मानक सामान्य वितरण]] (अर्थात, [[प्रोबिट]]) का परिमाण है <math>\alpha</math>. उदाहरण के लिए, 95% विश्वास स्तर के लिए त्रुटि <math>\alpha</math>= 0.05, इसलिए <math>1 - \tfrac{1}{2}\alpha</math>= 0.975 और <math>z</math> = 1.96. | ||
Line 268: | Line 271: | ||
: <math> \tilde{p}= \frac{ n_1 + \frac{1}{2} z^2}{ n + z^2 } </math> | : <math> \tilde{p}= \frac{ n_1 + \frac{1}{2} z^2}{ n + z^2 } </math> | ||
यह विधि <math>n>10</math> और <math>n_1\neq 0,n</math> के लिए यह विधि अच्छा काम करता है. <ref>{{cite web|last1=Gulotta|first1=Joseph|title=Agresti-Coull Interval Method|url=https://pellucid.atlassian.net/wiki/spaces/PEL/pages/25722894/Agresti-Coull+Interval+Method#:~:text=The%20Agresti%2DCoull%20Interval%20Method,%2C%20or%20per%20100%2C000%2C%20etc|website=pellucid.atlassian.net|access-date=18 May 2021}}</ref> | यह विधि <math>n>10</math> और <math>n_1\neq 0,n</math> के लिए यह विधि अच्छा काम करता है. <ref>{{cite web|last1=Gulotta|first1=Joseph|title=Agresti-Coull Interval Method|url=https://pellucid.atlassian.net/wiki/spaces/PEL/pages/25722894/Agresti-Coull+Interval+Method#:~:text=The%20Agresti%2DCoull%20Interval%20Method,%2C%20or%20per%20100%2C000%2C%20etc|website=pellucid.atlassian.net|access-date=18 May 2021}}</ref> <math>n\leq 10</math> के लिए यहां देखें .<ref>{{cite web|title=Confidence intervals|url=https://www.itl.nist.gov/div898/handbook/prc/section2/prc241.htm|website=itl.nist.gov|access-date=18 May 2021}}</ref> <math>n_1 = 0,n</math> के लिए नीचे दी गई विल्सन (स्कोर) विधि का उपयोग करें। | ||
==== आर्कसीन विधि ==== | ==== आर्कसीन विधि ==== | ||
Line 279: | Line 282: | ||
{{Main|द्विपद अनुपात आत्मविश्वास अंतराल#विल्सन स्कोर अंतराल}} | {{Main|द्विपद अनुपात आत्मविश्वास अंतराल#विल्सन स्कोर अंतराल}} | ||
नीचे दिए गए सूत्र में अंकन पिछले सूत्रों से दो तरह से भिन्न है:<ref name="Wilson1927">{{Citation |last = Wilson |first=Edwin B. |date = June 1927 |title = Probable inference, the law of succession, and statistical inference |url = http://psych.stanford.edu/~jlm/pdfs/Wison27SingleProportion.pdf |journal = Journal of the American Statistical Association |volume=22 |issue=158 |pages=209–212 |access-date= 2015-01-05 |doi = 10.2307/2276774 |url-status=dead |archive-url = https://web.archive.org/web/20150113082307/http://psych.stanford.edu/~jlm/pdfs/Wison27SingleProportion.pdf |archive-date = 2015-01-13 |jstor = 2276774 }}</ref> | नीचे दिए गए सूत्र में अंकन पिछले सूत्रों से दो तरह से भिन्न है:<ref name="Wilson1927">{{Citation |last = Wilson |first=Edwin B. |date = June 1927 |title = Probable inference, the law of succession, and statistical inference |url = http://psych.stanford.edu/~jlm/pdfs/Wison27SingleProportion.pdf |journal = Journal of the American Statistical Association |volume=22 |issue=158 |pages=209–212 |access-date= 2015-01-05 |doi = 10.2307/2276774 |url-status=dead |archive-url = https://web.archive.org/web/20150113082307/http://psych.stanford.edu/~jlm/pdfs/Wison27SingleProportion.pdf |archive-date = 2015-01-13 |jstor = 2276774 }}</ref> | ||
* सबसे पहले, z<sub> | * सबसे पहले, ''z<sub>x</sub>'' नीचे दिए गए सूत्र में इसकी थोड़ी अलग व्याख्या है: इसका सामान्य अर्थ '''(1 − x)-th'' क्वांटाइल' के लिए शॉर्टहैंड होने के अतिरिक्त 'मानक सामान्य वितरण का ''x''वां क्वांटाइल' है। | ||
*दूसरे, यह सूत्र दो सीमाओं को परिभाषित करने के लिए प्लस-माइनस का उपयोग नहीं करता है। इसके बजाय, कोई निचली सीमा पाने के लिए | *दूसरे, यह सूत्र दो सीमाओं को परिभाषित करने के लिए प्लस-माइनस का उपयोग नहीं करता है। इसके बजाय, कोई निचली सीमा पाने के लिए <math>z = z_{\alpha / 2}</math> उपयोग कर सकता है या ऊपरी सीमा पाने के लिए। उपयोग करें <math>z = z_{1 - \alpha/2}</math> उदाहरण के लिए: 95% कॉन्फिडेंस लेवल के लिए एरर <math>\alpha</math>= 0.05, इसलिए <math>z = z_{\alpha/2} = z_{0.025} = - 1.96</math> उपयोग करने पर व्यक्ति को निचली सीमा मिलती है, और का <math>z = z_{1 - \alpha/2} = z_{0.975} = 1.96</math> उपयोग करके ऊपरी सीमा प्राप्त होती है . | ||
:: <math>\frac{ | :: <math>\frac{ | ||
Line 301: | Line 304: | ||
==== तुलना ==== | ==== तुलना ==== | ||
तथाकथित स्पष्ट (द्विपद अनुपात विश्वास अंतराल या क्लॉपर-पियर्सन अंतराल | क्लॉपर-पियर्सन) विधि सबसे रूढ़िवादी है।<ref name="Brown2001" /> | तथाकथित स्पष्ट (द्विपद अनुपात विश्वास अंतराल या क्लॉपर-पियर्सन अंतराल | क्लॉपर-पियर्सन) विधि सबसे रूढ़िवादी है।<ref name="Brown2001" /> (स्पष्ट का मतलब पूरी तरह से स्पष्ट नहीं है; किंतु, यह इंगित करता है कि अनुमान सही मूल्य से कम रूढ़िवादी नहीं होंगे।) | ||
वाल्ड विधि, चूंकि सामान्यतः पाठ्यपुस्तकों में अनुशंसित है, सबसे पक्षपाती है। | वाल्ड विधि, चूंकि सामान्यतः पाठ्यपुस्तकों में अनुशंसित है, सबसे पक्षपाती है। | ||
Line 308: | Line 311: | ||
=== द्विपदों का योग === | === द्विपदों का योग === | ||
यदि X ~ B(n, p) और Y ~ B(m, p) समान प्रायिकता p वाले स्वतंत्र द्विपद चर हैं, तब X + Y फिर से द्विपद चर है; इसका वितरण Z=X+Y ~ B(n+m, p) है:<ref>{{cite book |last1=Dekking |first1=F.M. |last2=Kraaikamp |first2=C. |last3=Lopohaa |first3=H.P. |last4=Meester |first4=L.E. |title=A Modern Introduction of Probability and Statistics |date=2005 |publisher=Springer-Verlag London |isbn=978-1-84628-168-6 |edition=1 |url=https://www.springer.com/gp/book/9781852338961}}</ref> | यदि ''X ~ B(n, p)'' और ''Y ~ B(m, p)'' समान प्रायिकता p वाले स्वतंत्र द्विपद चर हैं, तब ''X + Y'' फिर से द्विपद चर है; इसका वितरण ''Z=X+Y ~ B(n+m, p)'' है:<ref>{{cite book |last1=Dekking |first1=F.M. |last2=Kraaikamp |first2=C. |last3=Lopohaa |first3=H.P. |last4=Meester |first4=L.E. |title=A Modern Introduction of Probability and Statistics |date=2005 |publisher=Springer-Verlag London |isbn=978-1-84628-168-6 |edition=1 |url=https://www.springer.com/gp/book/9781852338961}}</ref> | ||
:<math>\begin{align} | :<math>\begin{align} | ||
\operatorname P(Z=k) &= \sum_{i=0}^k\left[\binom{n}i p^i (1-p)^{n-i}\right]\left[\binom{m}{k-i} p^{k-i} (1-p)^{m-k+i}\right]\\ | \operatorname P(Z=k) &= \sum_{i=0}^k\left[\binom{n}i p^i (1-p)^{n-i}\right]\left[\binom{m}{k-i} p^{k-i} (1-p)^{m-k+i}\right]\\ | ||
&= \binom{n+m}k p^k (1-p)^{n+m-k} | &= \binom{n+m}k p^k (1-p)^{n+m-k} | ||
\end{align}</math> | \end{align}</math> | ||
एक द्विपद वितरित यादृच्छिक चर X ~ B(n, p) को n बर्नौली वितरित यादृच्छिक चर के योग के रूप में माना जा सकता है। तब दो द्विपद वितरित यादृच्छिक चर X ~ B(n, p) और Y ~ B(m, p) का योग n + m बर्नौली वितरित यादृच्छिक चर के योग के सामान्तर है, जिसका अर्थ है Z=X+Y ~ B( n + m, p)। यह अतिरिक्त नियम का उपयोग करके भी सीधे सिद्ध किया जा सकता है। | एक द्विपद वितरित यादृच्छिक चर ''X ~ B(n, p)'' को ''n'' बर्नौली वितरित यादृच्छिक चर के योग के रूप में माना जा सकता है। तब दो द्विपद वितरित यादृच्छिक चर ''X ~ B(n, p)'' और ''Y ~ B(m, p)'' का योग ''n + m'' बर्नौली वितरित यादृच्छिक चर के योग के सामान्तर है, जिसका अर्थ है ''Z=X+Y ~ B( n + m, p)।'' यह अतिरिक्त नियम का उपयोग करके भी सीधे सिद्ध किया जा सकता है। | ||
चूँकि, यदि X और Y में समान प्रायिकता p नहीं है, तब योग का विचरण <math>B(n+m, \bar{p}).\,</math> [[द्विपद योग विचरण असमानता]] के रूप में वितरित किया जाएगा | चूँकि, यदि X और Y में समान प्रायिकता p नहीं है, तब योग का विचरण <math>B(n+m, \bar{p}).\,</math> [[द्विपद योग विचरण असमानता]] के रूप में वितरित किया जाएगा | ||
=== पोइसन द्विपद वितरण === | === पोइसन द्विपद वितरण === | ||
द्विपद वितरण | द्विपद वितरण प्वासों द्विपद वितरण का विशेष स्तिथियाँ है, जो ''n'' स्वतंत्र गैर-समरूप बर्नौली परीक्षणों के योग ''B(p<sub>i</sub>)'''.''''' का वितरण है '''<ref> | ||
{{Cite journal | {{Cite journal | ||
| volume = 3 | | volume = 3 | ||
Line 338: | Line 341: | ||
यह परिणाम पहली बार 1978 में काट्ज़ और सह-लेखकों द्वारा प्राप्त किया गया था।<ref name=Katz1978>{{cite journal |last1=Katz |first1=D. |display-authors=1 |first2=J. |last2=Baptista |first3=S. P. |last3=Azen |first4=M. C. |last4=Pike |year=1978 |title=Obtaining confidence intervals for the risk ratio in cohort studies |journal=Biometrics |volume=34 |issue=3 |pages=469–474 |doi=10.2307/2530610 |jstor=2530610 }}</ref> | यह परिणाम पहली बार 1978 में काट्ज़ और सह-लेखकों द्वारा प्राप्त किया गया था।<ref name=Katz1978>{{cite journal |last1=Katz |first1=D. |display-authors=1 |first2=J. |last2=Baptista |first3=S. P. |last3=Azen |first4=M. C. |last4=Pike |year=1978 |title=Obtaining confidence intervals for the risk ratio in cohort studies |journal=Biometrics |volume=34 |issue=3 |pages=469–474 |doi=10.2307/2530610 |jstor=2530610 }}</ref> | ||
चलो x~ ~ b(n, p<sub>1</sub>) और y~ b(m,p<sub>2</sub>) स्वतंत्र रहें। चलो टी = (x/n)/(y/m)। | चलो ''x~ ~ b(n, p<sub>1</sub>)'' और ''y~ b(m,p<sub>2</sub>)'' स्वतंत्र रहें। चलो टी = ''(x/n)/(y/m)।'' | ||
फिर लॉग (T) लगभग सामान्य रूप से औसत लॉग (p<sub>1</sub>/p<sub>2</sub>) | फिर लॉग (T) लगभग सामान्य रूप से औसत लॉग ''(p<sub>1</sub>/p<sub>2</sub>)'' और विचरण ''((1/p<sub>1</sub>) − 1)/n + ((1/p<sub>2</sub>) − 1)/मी''. के साथ वितरित किया जाता है | ||
=== सशर्त द्विपद === | === सशर्त द्विपद === | ||
यदि X ~ B(n, p) और Y | X ~ B(X, q) (Y का सशर्त वितरण, दिया | यदि ''X ~ B(n, p)'' और ''Y | X ~ B(X, q)'' (''Y'' का सशर्त वितरण, दिया गया ''X''), तब ''Y'' वितरण ''Y ~ B(n, pq)'' के साथ सरल द्विपद यादृच्छिक चर है। | ||
उदाहरण के लिए, n गेंदों को एक टोकरी U<sub>X</sub> में फेंकने और उन गेंदों को लेने की कल्पना करें जो हिट होती हैं और उन्हें दूसरी टोकरी U<sub>Y</sub> | उदाहरण के लिए, n गेंदों को एक टोकरी U<sub>X</sub> में फेंकने और उन गेंदों को लेने की कल्पना करें जो हिट होती हैं और उन्हें दूसरी टोकरी ''U<sub>Y</sub>'' में फेंक देती हैं। यदि ''p'', ''U<sub>X</sub>'' से टकराने की संभावना है तब ''X ~ B(n, p) U<sub>X</sub>'' से टकराने वाली गेंदों की संख्या है। यदि ''q, U<sub>Y</sub>'' से टकराने की संभावना है तो ''U<sub>Y</sub>'' से टकराने वाली गेंदों की संख्या ''Y ~ B(X, q)'' है और इसलिए ''Y ~ B(n, pq)'' है। | ||
{{hidden begin|style=width:60%|ta1=center|border=1px #aaa solid|title=[Proof]}} | {{hidden begin|style=width:60%|ta1=center|border=1px #aaa solid|title=[Proof]}} | ||
Line 372: | Line 375: | ||
=== बरनौली वितरण === | === बरनौली वितरण === | ||
बर्नौली वितरण द्विपद वितरण का विशेष स्तिथियाँ | बर्नौली वितरण द्विपद वितरण का विशेष स्तिथियाँ है, जहां ''n = 1''. सांकेतिक रूप से, ''X ~ B(1, p)'' का वही अर्थ है जो ''X ~ बरनौली(p)'' का है। इसके विपरीत, कोई भी द्विपद वितरण , ''B(n, p), n'' स्वतंत्र बर्नौली परीक्षणों के योग का वितरण है, बरनौली(''p''), प्रत्येक की समान प्रायिकता ''p'' है।<ref>{{cite web|last1=Taboga|first1=Marco|title=Lectures on Probability Theory and Mathematical Statistics|url=https://www.statlect.com/probability-distributions/binomial-distribution#hid3|website=statlect.com|access-date=18 December 2017}}</ref> | ||
Line 378: | Line 381: | ||
{{see also|द्विपद अनुपात विश्वास अंतराल#सामान्य सन्निकटन अंतराल}} | {{see also|द्विपद अनुपात विश्वास अंतराल#सामान्य सन्निकटन अंतराल}} | ||
[[File:Binomial Distribution.svg|right|250px|thumb|n = 6 और p = 0.5 के लिए द्विपद संभाव्यता द्रव्यमान | [[File:Binomial Distribution.svg|right|250px|thumb|n = 6 और p = 0.5 के लिए द्विपद संभाव्यता द्रव्यमान फलन और सामान्य संभावना घनत्व फलन सन्निकटन]]यदि ''n'' अधिक बड़ा है, तब वितरण का तिरछा बहुत बड़ा नहीं है। इस स्थितियों में [[सामान्य वितरण]] द्वारा ''B(n, p)'' के लिए उचित सन्निकटन दिया जाता है | ||
:<math> \mathcal{N}(np,\,np(1-p)),</math> | :<math> \mathcal{N}(np,\,np(1-p)),</math> | ||
और उपयुक्त निरंतरता सुधार का उपयोग करके इस मूलभूत | और उपयुक्त निरंतरता सुधार का उपयोग करके इस मूलभूत सन्निकटन को सरल विधियों के द्वारा से सुधारा जा सकता है। मूलभूत सन्निकटन सामान्यतः ''n'' बढ़ने (कम से कम 20) के रूप में उत्तम होता है और उत्तम होता है जब ''p 0'' या ''1'' के करीब नहीं होता है। अंगूठे के विभिन्न नियमों का उपयोग यह तय करने के लिए किया जा सकता है कि ''n'' अधिक बड़ा है, और ''p 0'' या ''k'' चरम से अधिक दूर है: | ||
*एक नियम<ref name="bhh">{{cite book|title=Statistics for experimenters|url=https://archive.org/details/statisticsforexp00geor|url-access=registration|author=Box, Hunter and Hunter|publisher=Wiley|year=1978|page=[https://archive.org/details/statisticsforexp00geor/page/130 130]|isbn=9780471093152}}</ref> यह है कि n > 5 के लिए सामान्य सन्निकटन पर्याप्त है यदि तिरछापन का पूर्ण मान सख्ती से 0.3 से कम है; वह है, यदि | *एक नियम<ref name="bhh">{{cite book|title=Statistics for experimenters|url=https://archive.org/details/statisticsforexp00geor|url-access=registration|author=Box, Hunter and Hunter|publisher=Wiley|year=1978|page=[https://archive.org/details/statisticsforexp00geor/page/130 130]|isbn=9780471093152}}</ref> यह है कि n > 5 के लिए सामान्य सन्निकटन पर्याप्त है यदि तिरछापन का पूर्ण मान सख्ती से 0.3 से कम है; वह है, यदि | ||
Line 387: | Line 390: | ||
इसे बेरी-एस्सेन प्रमेय का उपयोग करके स्पष्ट बनाया जा सकता है। | इसे बेरी-एस्सेन प्रमेय का उपयोग करके स्पष्ट बनाया जा सकता है। | ||
*एक शक्तिशाली | *एक शक्तिशाली नियम बताता है कि सामान्य सन्निकटन तभी उचित है जब इसके माध्य के 3 मानक विचलन के अंदर सब कुछ संभावित मूल्यों की सीमा के अंदर हो; वह है, केवल यदि | ||
::<math>\mu\pm3\sigma=np\pm3\sqrt{np(1-p)}\in(0,n).</math> | ::<math>\mu\pm3\sigma=np\pm3\sqrt{np(1-p)}\in(0,n).</math> | ||
: यह 3-मानक-विचलन नियम निम्नलिखित शर्तों के समतुल्य है, जो उपरोक्त पहले नियम को भी प्रयुक्त करता है। | : यह 3-मानक-विचलन नियम निम्नलिखित शर्तों के समतुल्य है, जो उपरोक्त पहले नियम को भी प्रयुक्त करता है। | ||
Line 405: | Line 408: | ||
:<math>\left|\sqrt{\frac{1-p}p}-\sqrt{\frac{p}{1-p}}\,\right|<\frac{\sqrt{n}}3.</math> | :<math>\left|\sqrt{\frac{1-p}p}-\sqrt{\frac{p}{1-p}}\,\right|<\frac{\sqrt{n}}3.</math> | ||
{{hidden end}} | {{hidden end}} | ||
* एक और सामान्यतः उपयोग किया जाने वाला नियम यह है कि दोनों मान <math>np</math> और <math>n(1-p)</math> 5 से अधिक या उसके सामान्तर होना चाहिए। चूँकि, विशिष्ट संख्या स्रोत से स्रोत में भिन्न होती है, और यह इस बात पर निर्भर करता है कि कोई सन्निकटन कितना अच्छा चाहता है। विशेष रूप से, यदि कोई 5 के अतिरिक्त 9 का उपयोग करता है, | * एक और सामान्यतः उपयोग किया जाने वाला नियम यह है कि दोनों मान <math>np</math> और <math>n(1-p)</math> 5 से अधिक या उसके सामान्तर होना चाहिए। चूँकि, विशिष्ट संख्या स्रोत से स्रोत में भिन्न होती है, और यह इस बात पर निर्भर करता है कि कोई सन्निकटन कितना अच्छा चाहता है। विशेष रूप से, यदि कोई 5 के अतिरिक्त 9 का उपयोग करता है, तो नियम का तात्पर्य पिछले पैराग्राफ में बताए गए परिणामों से है। | ||
{{hidden begin|style=width:66%|ta1=center|border=1px #aaa solid|title=[Proof]}} | {{hidden begin|style=width:66%|ta1=center|border=1px #aaa solid|title=[Proof]}} | ||
मान लें कि दोनों मान <math>np</math> और <math>n(1-p)</math> 9 से अधिक हैं। चूंकि <math>0< p<1</math>, हमारे पास वह आसानी से है | मान लें कि दोनों मान <math>np</math> और <math>n(1-p)</math> 9 से अधिक हैं। चूंकि <math>0< p<1</math>, हमारे पास वह आसानी से है | ||
Line 412: | Line 415: | ||
:<math>n>9 \left(\frac{1-p}p\right) \quad\text{and}\quad n>9 \left(\frac{p}{1-p}\right).</math> | :<math>n>9 \left(\frac{1-p}p\right) \quad\text{and}\quad n>9 \left(\frac{p}{1-p}\right).</math> | ||
{{hidden end}} | {{hidden end}} | ||
निरंतरता सुधार प्रयुक्त करने का उदाहरण निम्नलिखित है। मान लीजिए कि द्विपद यादृच्छिक चर X के लिए Pr(X ≤ 8) की गणना करना चाहता है। यदि Y का वितरण सामान्य सन्निकटन द्वारा दिया गया है, तब Pr(X ≤ 8) Pr(Y ≤ 8.5) द्वारा अनुमानित है। 0.5 का जोड़ निरंतरता सुधार है; असंशोधित सामान्य सन्निकटन अधिक | निरंतरता सुधार प्रयुक्त करने का उदाहरण निम्नलिखित है। मान लीजिए कि द्विपद यादृच्छिक चर X के लिए ''Pr(X ≤ 8)'' की गणना करना चाहता है। यदि ''Y'' का वितरण सामान्य सन्निकटन द्वारा दिया गया है, तब ''Pr(X ≤ 8) Pr(Y ≤ 8.5)'' द्वारा अनुमानित है। 0.5 का जोड़ निरंतरता सुधार है; असंशोधित सामान्य सन्निकटन अधिक स्पष्ट परिणाम देता है। | ||
यह सन्निकटन, डी मोइवर-लाप्लास प्रमेय के रूप में जाना जाता है, हाथ से गणना करते समय विशाल समय बचाने वाला होता है (बड़े n के साथ स्पष्ट गणना बहुत कठिन होती है); ऐतिहासिक रूप से, यह सामान्य वितरण का पहला प्रयोग था, जिसे 1738 में [[अब्राहम डी मोइवरे]] की पुस्तक [[संभावना का सिद्धांत]] में प्रस्तुत किया गया था। आजकल, इसे [[केंद्रीय सीमा प्रमेय]] के परिणाम के रूप में देखा जा सकता है क्योंकि B(n, p) का योग है n स्वतंत्र, समान रूप से वितरित | यह सन्निकटन, डी मोइवर-लाप्लास प्रमेय के रूप में जाना जाता है, हाथ से गणना करते समय विशाल समय बचाने वाला होता है (बड़े ''n'' के साथ स्पष्ट गणना बहुत कठिन होती है); ऐतिहासिक रूप से, यह सामान्य वितरण का पहला प्रयोग था, जिसे 1738 में [[अब्राहम डी मोइवरे]] की पुस्तक [[संभावना का सिद्धांत]] में प्रस्तुत किया गया था। आजकल, इसे [[केंद्रीय सीमा प्रमेय]] के परिणाम के रूप में देखा जा सकता है क्योंकि ''B(n, p)'' का योग है n स्वतंत्र, समान रूप से वितरित बरनौली वितरण पैरामीटर ''p'' के साथ है । यह तथ्य सामान्य परीक्षण आंकड़ों में ''x/n'', नमूना अनुपात और ''p'' के अनुमानक का उपयोग करके ''p'' के मूल्य के लिए [[परिकल्पना परीक्षण]], अनुपात ''z''-परीक्षण का आधार है।<ref>[[NIST]]/[[SEMATECH]], [http://www.itl.nist.gov/div898/handbook/prc/section2/prc24.htm "7.2.4. Does the proportion of defectives meet requirements?"] ''e-Handbook of Statistical Methods.''</ref> | ||
उदाहरण के लिए, मान लीजिए कि बड़ी जनसंख्या से बेतरतीब ढंग से n लोगों का नमूना लेता है और उनसे पूछता है कि क्या वे निश्चित कथन से सहमत हैं। सहमत होने वाले लोगों का अनुपात निश्चित रूप से नमूने पर निर्भर करेगा। यदि n लोगों के समूहों को बार-बार और सही मायने में बेतरतीब ढंग से नमूना लिया गया था, तब अनुपात जनसंख्या में समझौते के वास्तविक अनुपात p के | उदाहरण के लिए, मान लीजिए कि बड़ी जनसंख्या से बेतरतीब ढंग से ''n'' लोगों का नमूना लेता है और उनसे पूछता है कि क्या वे निश्चित कथन से सहमत हैं। सहमत होने वाले लोगों का अनुपात निश्चित रूप से नमूने पर निर्भर करेगा। यदि ''n'' लोगों के समूहों को बार-बार और सही मायने में बेतरतीब ढंग से नमूना लिया गया था, तब अनुपात जनसंख्या में समझौते के वास्तविक अनुपात ''p'' के सामान्तर और मानक विचलन के साथ लगभग सामान्य वितरण का पालन करेगा। | ||
:<math>\sigma = \sqrt{\frac{p(1-p)}{n}}</math> | :<math>\sigma = \sqrt{\frac{p(1-p)}{n}}</math> | ||
Line 422: | Line 425: | ||
=== पोइसन सन्निकटन === | === पोइसन सन्निकटन === | ||
द्विपद वितरण प्वासों वितरण की ओर अभिसरण करता है क्योंकि परीक्षणों की संख्या अनंत तक जाती है जबकि उत्पाद np सीमित सीमा तक अभिसरण करता है। इसलिए, पैरामीटर λ = np के साथ प्वासों वितरण को द्विपद वितरण के सन्निकटन के रूप में उपयोग किया जा सकता है यदि n पर्याप्त रूप से बड़ा है और p पर्याप्त रूप से छोटा है। अंगूठे के दो नियमों के अनुसार, यह सन्निकटन अच्छा है यदि n ≥ 20 और p ≤ 0.05, या यदि n ≥ 100 और | द्विपद वितरण प्वासों वितरण की ओर अभिसरण करता है क्योंकि परीक्षणों की संख्या अनंत तक जाती है जबकि उत्पाद ''np'' सीमित सीमा तक अभिसरण करता है। इसलिए, पैरामीटर ''λ = np'' के साथ प्वासों वितरण को द्विपद वितरण के सन्निकटन के रूप में उपयोग किया जा सकता है यदि ''n'' पर्याप्त रूप से बड़ा है और ''p'' पर्याप्त रूप से छोटा है। अंगूठे के दो नियमों के अनुसार, यह सन्निकटन अच्छा है यदि ''n ≥ 20'' और ''p ≤ 0.05,'' या यदि ''n ≥ 100'' और ''np ≤ 10''।<ref name="nist">[[NIST]]/[[SEMATECH]], [http://www.itl.nist.gov/div898/handbook/pmc/section3/pmc331.htm "6.3.3.1. Counts Control Charts"], ''e-Handbook of Statistical Methods.''</ref> | ||
पॉइसन सन्निकटन की सटीकता के संबंध में, नोवाक, <ref>Novak S.Y. (2011) Extreme value methods with applications to finance. London: CRC/ Chapman & Hall/Taylor & Francis. {{ISBN|9781-43983-5746}}.</ref>अध्याय देखें। 4, और उसमें संदर्भ। | पॉइसन सन्निकटन की सटीकता के संबंध में, नोवाक, <ref>Novak S.Y. (2011) Extreme value methods with applications to finance. London: CRC/ Chapman & Hall/Taylor & Francis. {{ISBN|9781-43983-5746}}.</ref>अध्याय देखें। ''4'', और उसमें संदर्भ। | ||
=== वितरण सीमित करना === | === वितरण सीमित करना === | ||
* पोइसन सीमा प्रमेय: चूंकि n ∞ तक पहुंचता है , उत्पाद np को स्थिर रखा जाता है और p 0 तक पहुंचता है,, द्विपद (n, p) वितरण अपेक्षित मान λ = np के साथ पॉइसन वितरण तक पहुंचता है।<ref name="nist"/> | * पोइसन सीमा प्रमेय: चूंकि ''n'' ∞ तक पहुंचता है , उत्पाद ''np'' को स्थिर रखा जाता है और ''p'' ''0'' तक पहुंचता है,, द्विपद ''(n, p)'' वितरण अपेक्षित मान ''λ = np'' के साथ पॉइसन वितरण तक पहुंचता है।<ref name="nist"/> | ||
*डी मोइवर-लाप्लास प्रमेय: जैसा कि n ∞ तक पहुंचता है जबकि p स्थिर रहता है, इसका वितरण | *डी मोइवर-लाप्लास प्रमेय: जैसा कि n ∞ तक पहुंचता है जबकि p स्थिर रहता है, इसका वितरण | ||
::<math>\frac{X-np}{\sqrt{np(1-p)}}</math> | ::<math>\frac{X-np}{\sqrt{np(1-p)}}</math> | ||
: अपेक्षित मान 0 और विचरण 1 के साथ सामान्य वितरण तक पहुंचता है। इस परिणाम को कभी-कभी यह कहते हुए शिथिल रूप से कहा जाता है कि X का वितरण अपेक्षित मान 0 और विचरण 1 के साथ [[स्पर्शोन्मुख सामान्यता]] है। यह परिणाम केंद्रीय सीमा प्रमेय का विशिष्ट स्तिथियाँ | : अपेक्षित मान ''0'' और विचरण ''1'' के साथ सामान्य वितरण तक पहुंचता है। इस परिणाम को कभी-कभी यह कहते हुए शिथिल रूप से कहा जाता है कि ''X'' का वितरण अपेक्षित मान ''0'' और विचरण ''1'' के साथ [[स्पर्शोन्मुख सामान्यता]] है। यह परिणाम केंद्रीय सीमा प्रमेय का विशिष्ट स्तिथियाँ है। | ||
===बीटा वितरण=== | ===बीटा वितरण=== | ||
द्विपद वितरण और बीटा वितरण दोहराए गए बर्नौली परीक्षणों के | द्विपद वितरण और बीटा वितरण दोहराए गए बर्नौली परीक्षणों के मॉडल के अलग-अलग विचार हैं। द्विपद वितरण का संभाव्यता द्रव्यमान फलन है द्विपद वितरण ''n'' स्वतंत्र घटनाओं को देखते हुए सफलताओं का ''PMF'' है, जिनमें से प्रत्येक में सफलता की संभावना ''p'' है। गणितीय रूप से, कब {{math|1=''α'' = ''k'' + 1}} और {{math|1=''β'' = ''n'' − ''k'' + 1}}, बीटा वितरण और द्विपद वितरण {{math|''n'' + 1}} के कारक से संबंधित हैं| | ||
:<math>\operatorname{Beta}(p;\alpha;\beta) = (n+1)B(k;n;p)</math> | :<math>\operatorname{Beta}(p;\alpha;\beta) = (n+1)B(k;n;p)</math> | ||
बीटा वितरण भी बायेसियन अनुमान में द्विपद वितरण के लिए पूर्व वितरण का परिवार प्रदान करते हैं:<ref name=MacKay>{{cite book| last=MacKay| first=David| title = Information Theory, Inference and Learning Algorithms|year=2003| publisher=Cambridge University Press; First Edition |isbn=978-0521642989}}</ref> : | बीटा वितरण भी बायेसियन अनुमान में द्विपद वितरण के लिए पूर्व वितरण का परिवार प्रदान करते हैं:<ref name=MacKay>{{cite book| last=MacKay| first=David| title = Information Theory, Inference and Learning Algorithms|year=2003| publisher=Cambridge University Press; First Edition |isbn=978-0521642989}}</ref> : | ||
Line 442: | Line 445: | ||
<math>P(p;\alpha,\beta) = \frac{p^{\alpha-1}(1-p)^{\beta-1}}{\operatorname{Beta}(\alpha,\beta)}.</math> | <math>P(p;\alpha,\beta) = \frac{p^{\alpha-1}(1-p)^{\beta-1}}{\operatorname{Beta}(\alpha,\beta)}.</math> | ||
एक समान पूर्व को देखते हुए, k देखी गई सफलताओं के साथ n स्वतंत्र घटनाओं को देखते हुए सफलता की संभावना p के लिए पश्च वितरण एक बीटा वितरण है।<ref>{{Cite web|url=https://www.statlect.com/probability-distributions/beta-distribution|title = Beta distribution}}</ref> | एक समान पूर्व को देखते हुए, ''k'' देखी गई सफलताओं के साथ ''n'' स्वतंत्र घटनाओं को देखते हुए सफलता की संभावना ''p'' के लिए पश्च वितरण एक बीटा वितरण है।<ref>{{Cite web|url=https://www.statlect.com/probability-distributions/beta-distribution|title = Beta distribution}}</ref> | ||
== यादृच्छिक संख्या पीढ़ी == | == यादृच्छिक संख्या पीढ़ी == | ||
{{further|छद्म-यादृच्छिक संख्या नमूनाकरण}} | {{further|छद्म-यादृच्छिक संख्या नमूनाकरण}} | ||
[[यादृच्छिक संख्या पीढ़ी]] के विधियों | [[यादृच्छिक संख्या पीढ़ी]] के विधियों जहां [[सीमांत वितरण]] द्विपद वितरण है, अच्छी तरह से स्थापित हैं।<ref>Devroye, Luc (1986) ''Non-Uniform Random Variate Generation'', New York: Springer-Verlag. (See especially [http://luc.devroye.org/chapter_ten.pdf Chapter X, Discrete Univariate Distributions])</ref><ref>{{Cite journal | ||
| pages = 216–222 | | pages = 216–222 | ||
| year = 1988 | | year = 1988 | ||
Line 455: | Line 458: | ||
| last1 = Kachitvichyanukul| issue = 2 | | last1 = Kachitvichyanukul| issue = 2 | ||
| s2cid = 18698828 | | s2cid = 18698828 | ||
}}</ref> एक द्विपद वितरण से यादृच्छिक भिन्न नमूने उत्पन्न करने का विधि व्युत्क्रम एल्गोरिथम का उपयोग करना है। ऐसा करने के लिए, किसी को संभावना की गणना करनी चाहिए कि 0 से n तक सभी मान k के लिए Pr(X = k) है।(इन संभावनाओं को पूरे नमूना स्थान को सम्मिलित | }}</ref> एक द्विपद वितरण से यादृच्छिक भिन्न नमूने उत्पन्न करने का विधि व्युत्क्रम एल्गोरिथम का उपयोग करना है। ऐसा करने के लिए, किसी को संभावना की गणना करनी चाहिए कि ''0'' से ''n'' तक सभी मान ''k'' के लिए ''Pr(X = k)'' है।(इन संभावनाओं को पूरे नमूना स्थान को सम्मिलित करने के लिए मूल्य के करीब होना चाहिए।) फिर ''0'' और ''1'' के मध्य समान रूप से नमूने उत्पन्न करने के लिए [[छद्म यादृच्छिक संख्या जनरेटर]] का उपयोग करके, परिकलित नमूनों को असतत संख्याओं में परिवर्तित कर सकते हैं। संभावनाओं की गणना पहले चरण में की जाती है। | ||
== इतिहास == | == इतिहास == | ||
यह वितरण जैकब बर्नौली द्वारा प्राप्त किया गया था। उन्होंने उस स्थितियोंपर विचार किया जहां p = r/(r + s) जहां p सफलता की संभावना है तथा r और s | यह वितरण जैकब बर्नौली द्वारा प्राप्त किया गया था। उन्होंने उस स्थितियोंपर विचार किया जहां ''p = r/(r + s)'' जहां ''p'' सफलता की संभावना है तथा ''r'' और ''s'' धनात्मक पूर्णांक हैं। ब्लेज़ पास्कल ने पहले उस स्थितियोंपर विचार किया था जहां ''p = 1/2'' होता है | | ||
== यह भी देखें == | == यह भी देखें == | ||
Line 465: | Line 468: | ||
*[[संभार तन्त्र परावर्तन]] | *[[संभार तन्त्र परावर्तन]] | ||
* [[बहुपद वितरण]] | * [[बहुपद वितरण]] | ||
*[[ | *[[ऋणात्मक द्विपद वितरण]] | ||
*[[बीटा-द्विपद वितरण]] | *[[बीटा-द्विपद वितरण]] | ||
*द्विपद माप, [[मल्टीफ्रैक्टल सिस्टम|मल्टीफ्रैक्टल]] प्रणाली माप (गणित) का उदाहरण।<ref>Mandelbrot, B. B., Fisher, A. J., & Calvet, L. E. (1997). A multifractal model of asset returns. ''3.2 The Binomial Measure is the Simplest Example of a Multifractal''</ref> | *द्विपद माप, [[मल्टीफ्रैक्टल सिस्टम|मल्टीफ्रैक्टल]] प्रणाली माप (गणित) का उदाहरण।<ref>Mandelbrot, B. B., Fisher, A. J., & Calvet, L. E. (1997). A multifractal model of asset returns. ''3.2 The Binomial Measure is the Simplest Example of a Multifractal''</ref> | ||
Line 488: | Line 491: | ||
{{ProbDistributions|discrete-finite}} | {{ProbDistributions|discrete-finite}} | ||
{{DEFAULTSORT:Binomial Distribution}} | {{DEFAULTSORT:Binomial Distribution}} | ||
[[Category: | [[Category:Articles with hatnote templates targeting a nonexistent page|Binomial Distribution]] | ||
[[Category:Created On 07/02/2023]] | [[Category:CS1 Deutsch-language sources (de)|Binomial Distribution]] | ||
[[Category:Collapse templates|Binomial Distribution]] | |||
[[Category:Commons category link is locally defined|Binomial Distribution]] | |||
[[Category:Created On 07/02/2023|Binomial Distribution]] | |||
[[Category:Lua-based templates|Binomial Distribution]] | |||
[[Category:Machine Translated Page|Binomial Distribution]] | |||
[[Category:Navigational boxes| ]] | |||
[[Category:Navigational boxes without horizontal lists|Binomial Distribution]] | |||
[[Category:Pages using infobox probability distribution with unknown parameters|मछुआराद्विपद वितरण]] | |||
[[Category:Pages with empty portal template|Binomial Distribution]] | |||
[[Category:Pages with maths render errors|Binomial Distribution]] | |||
[[Category:Pages with script errors|Binomial Distribution]] | |||
[[Category:Portal templates with redlinked portals|Binomial Distribution]] | |||
[[Category:Short description with empty Wikidata description|Binomial Distribution]] | |||
[[Category:Sidebars with styles needing conversion|Binomial Distribution]] | |||
[[Category:Template documentation pages|Documentation/doc]] | |||
[[Category:Templates Vigyan Ready|Binomial Distribution]] | |||
[[Category:Templates generating microformats|Binomial Distribution]] | |||
[[Category:Templates that add a tracking category|Binomial Distribution]] | |||
[[Category:Templates that are not mobile friendly|Binomial Distribution]] | |||
[[Category:Templates that generate short descriptions|Binomial Distribution]] | |||
[[Category:Templates using TemplateData|Binomial Distribution]] | |||
[[Category:Wikipedia metatemplates|Binomial Distribution]] | |||
[[Category:असतत वितरण|Binomial Distribution]] | |||
[[Category:क्रमगुणित और द्विपद विषय|Binomial Distribution]] | |||
[[Category:घातीय परिवार वितरण|Binomial Distribution]] | |||
[[Category:पूर्व वितरण संयुग्मित करें|Binomial Distribution]] |
Latest revision as of 15:37, 30 August 2023
संभाव्यता सिद्धांत और सांख्यिकी में, n और p मापदंडों के साथ द्विपद वितरण n सांख्यिकीय स्वतंत्रता के रूप में प्रयोग किया जाता है तथा (प्रायिकता सिद्धांत) के क्रम में सफलताओं की संख्या का असतत संभाव्यता वितरण है, प्रत्येक हां-नहीं प्रश्न पूछ रहा है, और प्रत्येक अपने स्वयं के बूलियन-मूल्यवान फलन-मूल्यवान परिणाम (संभावना) के साथ: सफलता (संभावना के साथ p) या विफलता (संभाव्यता के साथ) (). एकल सफलता/विफलता प्रयोग को बर्नौली परीक्षण या बर्नौली प्रयोग भी कहा जाता है, और परिणामों के अनुक्रम को बर्नौली प्रक्रिया कहा जाता है; एकल परीक्षण के लिए, अर्थात, n = 1, द्विपद वितरण बर्नौली वितरण है। तथा द्विपद वितरण सांख्यिकीय महत्व के लोकप्रिय द्विपद परीक्षण का आधार है।[1] द्विपद वितरण का उपयोग अधिकांशतः आकार n की जनसंख्या से प्रतिस्थापन के साथ खींचे गए आकार n के नमूने में सफलताओं की संख्या को मॉडल करने के लिए किया जाता है। यदि नमूना प्रतिस्थापन के बिना किया जाता है, तब ड्रॉ स्वतंत्र नहीं होते हैं और इसलिए परिणामी वितरण एक हाइपरज्यामितीय होता है वितरण, द्विपद वितरण नहीं है। चूँकि, n से बहुत बड़े N के लिए, द्विपद वितरण एक अच्छा सन्निकटन बना हुआ है, और व्यापक रूप से उपयोग किया जाता है।
परिभाषाएँ
संभाव्यता द्रव्यमान फलन
सामान्यतः, यदि यादृच्छिक चर X पैरामीटर n ∈ प्राकृतिक संख्या के साथ द्विपद वितरण का अनुसरण करता है और p ∈ [0,1], हम X ~ B(n, p) लिखते हैं। n स्वतंत्र बर्नौली परीक्षणों में बिल्कुल k सफलताएँ प्राप्त करने की प्रायिकता संभाव्यता द्रव्यमान फलन द्वारा दी गई है:
k = 0, 1, 2, ..., n , जहां के लिए
द्विपद गुणांक है, इसलिए इसका नाम द्विपद वितरण है। सूत्र को इस प्रकार समझा जा सकता है: k सफलताएँ प्रायिकता pk के साथ होती हैं और n−k विफलताएँ संभाव्यता के साथ होती हैं . चूँकि, k सफलताएँ n परीक्षणों के मध्य कहीं भी हो सकती हैं, और वहाँ हैं n परीक्षणों के क्रम में k सफलताओं को वितरित करने के विभिन्न विधियों ।
द्विपद वितरण संभाव्यता के लिए संदर्भ सारणी बनाने में, सामान्यतः तालिका को n/2 मानों तक भर दिया जाता है। ऐसा इसलिए है क्योंकि k > n/2 के लिए, प्रायिकता की गणना इसके पूरक के रूप में की जा सकती है
अभिव्यक्ति f(k, n, p) को k के फलन के रूप में देखते हुए, k मान है जो इसे अधिकतम करता है। यह k मान गणना करके पाया जा सकता है
और इसकी तुलना 1 से करें। सदैव पूर्णांक M होता है जो संतुष्ट करता है[2]
f(k, n, p) k < M के लिए मोनोटोन बढ़ रहा है और k > M के लिए मोनोटोन घट रहा है, उस स्थितियोंको छोड़कर जहां (n + 1)p पूर्णांक है। इस स्थितियों में, ऐसे दो मान हैं जिनके लिए f अधिकतम है: (n + 1)p और (n + 1)p − 1। है तथा M सबसे संभावित परिणाम है (अर्थात, सबसे अधिक संभावना है, चूंकि यह अभी भी असंभव हो सकता है कुल मिलाकर) बरनौली परीक्षण और इसे मोड (सांख्यिकी) भी कहा जाता है।
उदाहरण
मान लीजिए कि एक पक्षपाती सिक्का उछालने पर प्रायिकता 0.3 के साथ शीर्ष पर आता है। और 6 बार उछालने पर ठीक 4 सिर देखने की प्रायिकता है
संचयी वितरण फलन
संचयी वितरण फलन के रूप में व्यक्त किया जा सकता है:
जहाँ k के नीचे का तल है, अर्थात फर्श और छत k से कम या उसके सामान्तर फलन करता है।
इसे नियमित रूप से अपूर्ण बीटा फलन के संदर्भ में निम्नानुसार भी प्रदर्शित किया जा सकता है:[3]
जो कि F-वितरण | के संचयी वितरण फलन के समतुल्य हैF-वितरण:[4]
संचयी वितरण फलन के लिए कुछ सवृत-फ़ॉर्म बाउंड या टेल बाउंड दिए गए हैं.
गुण
अपेक्षित मूल्य और विचरण
यदि X ~ B(n, p), अर्थात, X द्विपद रूप से वितरित यादृच्छिक चर है, n प्रयोगों की कुल संख्या है और p प्रत्येक प्रयोग के सफल परिणाम देने की संभावना है, तब X का अपेक्षित मान है:[5]
यह इस तथ्य के साथ-साथ अपेक्षित मूल्य की रैखिकता का अनुसरण करता है कि X n का योग है तथा समान बर्नौली यादृच्छिक चर, प्रत्येक अपेक्षित मूल्य p के साथ है| दूसरे शब्दों में, यदि पैरामीटर के p साथ समान (और स्वतंत्र) बर्नौली यादृच्छिक चर हैं , तब और
भिन्नता है:
यह इसी तरह इस तथ्य से अनुसरण करता है कि स्वतंत्र यादृच्छिक चर के योग का विचरण भिन्नताओं का योग है।
उच्च क्षण
पहले 6 केंद्रीय क्षण, के रूप में परिभाषित , द्वारा दिया गया है
गैर-केंद्रीय क्षण संतुष्ट करते हैं
कहाँ दूसरी तरह की स्टर्लिंग संख्याएँ हैं, और है वें अवरोही और आरोही क्रम गुणित .एक साधारण बंधन [8] प्वासों वितरण या उच्चतर क्षणों के माध्यम से द्विपद आघूर्णों को बाउंड करके अनुसरण करता है:
इससे पता चलता है कि यदि , तब से अधिक से अधिक स्थिर कारक दूर है
मोड
सामान्यतः द्विपद B(n,-p) वितरण का बहुलक (सांख्यिकी) सामान्तर होता है , जहाँ फर्श फलन है। चूँकि, जब (n + 1)p पूर्णांक होता है और p न तो 0 होता है और न ही 1, तो वितरण के दो विधियों होते हैं: (n + 1)p और (n + 1)p − 1। जब p 0 के सामान्तर होता है या 1 होता है , तो मोड क्रमशः 0 और n होगा। इन स्थितियों को संक्षेप में निम्नानुसार किया जा सकता है:
प्रमाण: चलो
के लिए केवल के साथ शून्येतर मान है . के लिए हम देखतें है और के लिए . इससे सिद्ध होता है कि बहुलक 0 है और के लिए .
होने देना . हम देखतें है
- .
इससे इस प्रकार है
तब कब जब पूर्णांक है, तब और विधा है। उस स्थितियों में , सिर्फ तभी विधा है।[9]
मध्य
सामान्यतः, द्विपद वितरण के लिए माध्यिका ज्ञात करने के लिए कोई एकल सूत्र नहीं होता है, और यह गैर-अद्वितीय भी हो सकता है। चूँकि, अनेक विशेष परिणाम स्थापित किए गए हैं:
- यदि np पूर्णांक है, तब माध्य, माध्यिका और बहुलक संपाती हैं और np के सामान्तर हैं।[10][11]
- किसी भी माध्यिका m को अंतराल ⌊np⌋ ≤ m ≤ ⌈np⌉ के अंदर होना चाहिए।[12]
- माध्यिका m माध्य से बहुत दूर नहीं हो सकता: |m − np| ≤ min{ ln 2, max{p, 1 − p} }.[13]
- माध्य अद्वितीय है और m = राउंडिंग (np) के सामान्तर है जब |m − np| ≤ मिनट {p, 1 − p} (स्थितियोंको छोड़कर जब p =1/2 और n विषम है)।[12]
- जब p परिमेय संख्या है (p = 1/2 और n विषम को छोड़कर) तब माध्य अद्वितीय होता है।[14]
- जब p = 1/2 और n विषम हो, तब अंतराल में कोई भी संख्या m 1/2(n − 1) ≤ m ≤1/2(n + 1) द्विपद वितरण की माध्यिका है। यदि p = 1/2 और n सम है, तब m = n/2 अद्वितीय माध्यिका है।
ल बाउंड्स
k ≤ np के लिए, संचयी वितरण फलन की निचली पूंछ के लिए होता है जिससे ऊपरी सीमाएं प्राप्त की जा सकती हैं , संभावना है कि अधिक से अधिक k सफलताएँ हैं। चूँकि , इन सीमाओं को k ≥ np के संचयी वितरण फलन की ऊपरी पूंछ के लिए सीमाओं के रूप में भी देखा जा सकता है।
हॉफडिंग की असमानता से सरल सीमा प्राप्त होती है
जो चूंकि ज्यादा टाइट नहीं है। विशेष रूप से, p = 1 के लिए, हमारे पास वह F(k;n,p) = 0 (स्थिर k के लिए, n के साथ k < n) है, किन्तु होफ़डिंग की सीमा धनात्मक स्थिरांक का मूल्यांकन करती है।
चेर्नॉफ़ बाउंड से शार्प बाउंड प्राप्त किया जा सकता है:[15]
जहां D (a|| p) कुल्बैक-लीब्लर डाइवर्जेंस है। a -सिक्का और p-सिक्का (अर्थात बर्नौली (a) और बर्नौली (p) वितरण के मध्य) के मध्य सापेक्ष एन्ट्रॉपी (या कुल्बैक-लीब्लर डाइवर्जेंस) है:
असम्बद्ध रूप से, यह सीमा यथोचित तंग है; देखना [15]जानकारी के लिए।
कोई निचली सीमा भी प्राप्त कर सकता है , विरोधी एकाग्रता सीमा के रूप में जाना जाता है। स्टर्लिंग के सूत्र के साथ द्विपद गुणांक का अनुमान लगाकर यह दिखाया जा सकता है[16]
जिसका तात्पर्य सरल किन्तुशिथिल बाध्यता से है
p = 1/2 और k ≥ 3n/8 के लिए भी n के लिए, भाजक को स्थिर बनाना संभव है:[17]
सांख्यिकीय निष्कर्ष
मापदंडों का अनुमान
जब n ज्ञात हो, तब सफलताओं के अनुपात का उपयोग करके पैरामीटर p का अनुमान लगाया जा सकता है:
यह अनुमानक अधिकतम संभावना अनुमानक और क्षणों की विधि (सांख्यिकी) का उपयोग करके पाया जाता है। यह अनुमानक अनुमानक का पूर्वाग्रह है और समान रूप से न्यूनतम-विचरण निष्पक्ष अनुमानक के साथ, लेहमैन-शेफ़े प्रमेय का उपयोग करके सिद्ध किया गया है, क्योंकि यह न्यूनतम पर्याप्त और पूर्णता (सांख्यिकी) आँकड़ा (अर्थात: x) पर आधारित है। यह संभाव्यता और माध्य चुकता त्रुटि दोनों में संगत अनुमानक भी है।
p के लिए सवृत रूप बेयस अनुमानक भी उपस्थित है जब बीटा वितरण को संयुग्मित पूर्व पूर्व वितरण के रूप में उपयोग किया जाता है। सामान्य का उपयोग करते समय पूर्व के रूप में, बेयस अनुमानक या पोस्टीरियर माध्य अनुमानक है:
बायस आकलनकर्ता स्पर्शोन्मुख दक्षता (बायस) है और जैसे ही नमूना आकार अनंत (n → ∞) तक पहुंचता है, यह अधिकतम संभावना अनुमान समाधान तक पहुंचता है। बेयस अनुमानक अनुमानक का पूर्वाग्रह है (कितना पूर्ववर्तियों पर निर्भर करता है), बेयस अनुमानक या स्वीफलनता और संभाव्यता में लगातार अनुमानक।
गैर-सूचनात्मक पूर्व के रूप में मानक वर्दी वितरण का उपयोग करने के विशेष स्थितियों के लिए, , पश्च माध्य अनुमानक बन जाता है:
(एक बेयस अनुमानक या पश्च मोड को केवल मानक अनुमानक तक ले जाना चाहिए।) इस पद्धति को उत्तराधिकार का नियम कहा जाता है, जिसे 18 वीं शताब्दी में पियरे-साइमन लाप्लास द्वारा प्रस्तुत किया गया था।
बहुत दुर्लभ घटनाओं और छोटे n के साथ p का आकलन करते समय (उदाहरण के लिए: यदि x = 0), तब मानक अनुमानक का उपयोग करने की ओर जाता है जो कभी-कभी अवास्तविक और अवांछनीय होता है। ऐसे स्थितियों में विभिन्न वैकल्पिक आकलनकर्ता हैं।[18] बेयस अनुमानक का उपयोग करने का विधि है, जिससे:
एक अन्य विधि तीन के नियम (सांख्यिकी) का उपयोग करके प्राप्त विश्वास अंतराल की ऊपरी सीमा का उपयोग करना है:
विश्वास अंतराल
यहां तक कि n के अधिक बड़े मूल्यों के लिए, माध्य का वास्तविक वितरण महत्वपूर्ण रूप से असामान्य है।[19] इस समस्या के कारण कॉन्फिडेंस इंटरवल का अनुमान लगाने के लिए अनेक विधियों प्रस्तावित किए गए हैं।
नीचे दिए गए कॉन्फ़िडेंस इंटरवल के समीकरणों में, वेरिएबल्स के निम्नलिखित अर्थ हैं:
- n1, n में से सफलताओं की संख्या है, परीक्षणों की कुल संख्या
- सफलताओं का अनुपात है
- लक्ष्य त्रुटि दर के अनुरूप मानक सामान्य वितरण (अर्थात, प्रोबिट) का परिमाण है . उदाहरण के लिए, 95% विश्वास स्तर के लिए त्रुटि = 0.05, इसलिए = 0.975 और = 1.96.
वाल्ड विधि
0.5/n का निरंतरता सुधार जोड़ा जा सकता है।
अग्रेस्ती-कूल विधि
यहाँ p का अनुमान संशोधित किया गया है
यह विधि और के लिए यह विधि अच्छा काम करता है. [21] के लिए यहां देखें .[22] के लिए नीचे दी गई विल्सन (स्कोर) विधि का उपयोग करें।
आर्कसीन विधि
विल्सन (स्कोर) विधि
नीचे दिए गए सूत्र में अंकन पिछले सूत्रों से दो तरह से भिन्न है:[24]
- सबसे पहले, zx नीचे दिए गए सूत्र में इसकी थोड़ी अलग व्याख्या है: इसका सामान्य अर्थ '(1 − x)-th क्वांटाइल' के लिए शॉर्टहैंड होने के अतिरिक्त 'मानक सामान्य वितरण का xवां क्वांटाइल' है।
- दूसरे, यह सूत्र दो सीमाओं को परिभाषित करने के लिए प्लस-माइनस का उपयोग नहीं करता है। इसके बजाय, कोई निचली सीमा पाने के लिए उपयोग कर सकता है या ऊपरी सीमा पाने के लिए। उपयोग करें उदाहरण के लिए: 95% कॉन्फिडेंस लेवल के लिए एरर = 0.05, इसलिए उपयोग करने पर व्यक्ति को निचली सीमा मिलती है, और का उपयोग करके ऊपरी सीमा प्राप्त होती है .
तुलना
तथाकथित स्पष्ट (द्विपद अनुपात विश्वास अंतराल या क्लॉपर-पियर्सन अंतराल | क्लॉपर-पियर्सन) विधि सबसे रूढ़िवादी है।[19] (स्पष्ट का मतलब पूरी तरह से स्पष्ट नहीं है; किंतु, यह इंगित करता है कि अनुमान सही मूल्य से कम रूढ़िवादी नहीं होंगे।)
वाल्ड विधि, चूंकि सामान्यतः पाठ्यपुस्तकों में अनुशंसित है, सबसे पक्षपाती है।
संबंधित वितरण
द्विपदों का योग
यदि X ~ B(n, p) और Y ~ B(m, p) समान प्रायिकता p वाले स्वतंत्र द्विपद चर हैं, तब X + Y फिर से द्विपद चर है; इसका वितरण Z=X+Y ~ B(n+m, p) है:[26]
एक द्विपद वितरित यादृच्छिक चर X ~ B(n, p) को n बर्नौली वितरित यादृच्छिक चर के योग के रूप में माना जा सकता है। तब दो द्विपद वितरित यादृच्छिक चर X ~ B(n, p) और Y ~ B(m, p) का योग n + m बर्नौली वितरित यादृच्छिक चर के योग के सामान्तर है, जिसका अर्थ है Z=X+Y ~ B( n + m, p)। यह अतिरिक्त नियम का उपयोग करके भी सीधे सिद्ध किया जा सकता है।
चूँकि, यदि X और Y में समान प्रायिकता p नहीं है, तब योग का विचरण द्विपद योग विचरण असमानता के रूप में वितरित किया जाएगा
पोइसन द्विपद वितरण
द्विपद वितरण प्वासों द्विपद वितरण का विशेष स्तिथियाँ है, जो n स्वतंत्र गैर-समरूप बर्नौली परीक्षणों के योग B(pi). का वितरण है [27]
दो द्विपद बंटनों का अनुपात
यह परिणाम पहली बार 1978 में काट्ज़ और सह-लेखकों द्वारा प्राप्त किया गया था।[28]
चलो x~ ~ b(n, p1) और y~ b(m,p2) स्वतंत्र रहें। चलो टी = (x/n)/(y/m)।
फिर लॉग (T) लगभग सामान्य रूप से औसत लॉग (p1/p2) और विचरण ((1/p1) − 1)/n + ((1/p2) − 1)/मी. के साथ वितरित किया जाता है
सशर्त द्विपद
यदि X ~ B(n, p) और Y | X ~ B(X, q) (Y का सशर्त वितरण, दिया गया X), तब Y वितरण Y ~ B(n, pq) के साथ सरल द्विपद यादृच्छिक चर है।
उदाहरण के लिए, n गेंदों को एक टोकरी UX में फेंकने और उन गेंदों को लेने की कल्पना करें जो हिट होती हैं और उन्हें दूसरी टोकरी UY में फेंक देती हैं। यदि p, UX से टकराने की संभावना है तब X ~ B(n, p) UX से टकराने वाली गेंदों की संख्या है। यदि q, UY से टकराने की संभावना है तो UY से टकराने वाली गेंदों की संख्या Y ~ B(X, q) है और इसलिए Y ~ B(n, pq) है।
तब से और , कुल संभाव्यता के कानून द्वारा,
तब से उपरोक्त समीकरण के रूप में व्यक्त किया जा सकता है
फैक्टरिंग और उन सभी शर्तों को खींच रहा है जिन पर निर्भर नहीं है योग से बाहर अब पैदावार
प्रतिस्थापित करने के बाद उपरोक्त अभिव्यक्ति में, हम प्राप्त करते हैं
ध्यान दें कि योग (कोष्ठक में) ऊपर के बराबर है द्विपद प्रमेय द्वारा। अंत में उपज में इसे प्रतिस्थापित करना
और इस तरह जैसी इच्छा थी।
बरनौली वितरण
बर्नौली वितरण द्विपद वितरण का विशेष स्तिथियाँ है, जहां n = 1. सांकेतिक रूप से, X ~ B(1, p) का वही अर्थ है जो X ~ बरनौली(p) का है। इसके विपरीत, कोई भी द्विपद वितरण , B(n, p), n स्वतंत्र बर्नौली परीक्षणों के योग का वितरण है, बरनौली(p), प्रत्येक की समान प्रायिकता p है।[29]
सामान्य सन्निकटन
यदि n अधिक बड़ा है, तब वितरण का तिरछा बहुत बड़ा नहीं है। इस स्थितियों में सामान्य वितरण द्वारा B(n, p) के लिए उचित सन्निकटन दिया जाता है
और उपयुक्त निरंतरता सुधार का उपयोग करके इस मूलभूत सन्निकटन को सरल विधियों के द्वारा से सुधारा जा सकता है। मूलभूत सन्निकटन सामान्यतः n बढ़ने (कम से कम 20) के रूप में उत्तम होता है और उत्तम होता है जब p 0 या 1 के करीब नहीं होता है। अंगूठे के विभिन्न नियमों का उपयोग यह तय करने के लिए किया जा सकता है कि n अधिक बड़ा है, और p 0 या k चरम से अधिक दूर है:
- एक नियम[30] यह है कि n > 5 के लिए सामान्य सन्निकटन पर्याप्त है यदि तिरछापन का पूर्ण मान सख्ती से 0.3 से कम है; वह है, यदि
इसे बेरी-एस्सेन प्रमेय का उपयोग करके स्पष्ट बनाया जा सकता है।
- एक शक्तिशाली नियम बताता है कि सामान्य सन्निकटन तभी उचित है जब इसके माध्य के 3 मानक विचलन के अंदर सब कुछ संभावित मूल्यों की सीमा के अंदर हो; वह है, केवल यदि
- यह 3-मानक-विचलन नियम निम्नलिखित शर्तों के समतुल्य है, जो उपरोक्त पहले नियम को भी प्रयुक्त करता है।
नियम अनुरोध करने के लिए पूरी तरह से समकक्ष है
पैदावार के आसपास चलती शर्तें:
तब से , हम वर्ग शक्ति लागू कर सकते हैं और संबंधित कारकों से विभाजित कर सकते हैं और , वांछित शर्तें प्राप्त करने के लिए:
ध्यान दें कि ये शर्तें स्वचालित रूप से इसका अर्थ लगाती हैं . दूसरी ओर, वर्गमूल को फिर से लागू करें और 3 से विभाजित करें,
पहले वाले से असमानताओं के दूसरे सेट को घटाना:
और इसलिए, वांछित पहला नियम संतुष्ट है,
- एक और सामान्यतः उपयोग किया जाने वाला नियम यह है कि दोनों मान और 5 से अधिक या उसके सामान्तर होना चाहिए। चूँकि, विशिष्ट संख्या स्रोत से स्रोत में भिन्न होती है, और यह इस बात पर निर्भर करता है कि कोई सन्निकटन कितना अच्छा चाहता है। विशेष रूप से, यदि कोई 5 के अतिरिक्त 9 का उपयोग करता है, तो नियम का तात्पर्य पिछले पैराग्राफ में बताए गए परिणामों से है।
मान लें कि दोनों मान और 9 से अधिक हैं। चूंकि , हमारे पास वह आसानी से है
अब हमें केवल संबंधित कारकों द्वारा विभाजित करना है और , 3-मानक-विचलन नियम के वैकल्पिक रूप को निकालने के लिए:
निरंतरता सुधार प्रयुक्त करने का उदाहरण निम्नलिखित है। मान लीजिए कि द्विपद यादृच्छिक चर X के लिए Pr(X ≤ 8) की गणना करना चाहता है। यदि Y का वितरण सामान्य सन्निकटन द्वारा दिया गया है, तब Pr(X ≤ 8) Pr(Y ≤ 8.5) द्वारा अनुमानित है। 0.5 का जोड़ निरंतरता सुधार है; असंशोधित सामान्य सन्निकटन अधिक स्पष्ट परिणाम देता है।
यह सन्निकटन, डी मोइवर-लाप्लास प्रमेय के रूप में जाना जाता है, हाथ से गणना करते समय विशाल समय बचाने वाला होता है (बड़े n के साथ स्पष्ट गणना बहुत कठिन होती है); ऐतिहासिक रूप से, यह सामान्य वितरण का पहला प्रयोग था, जिसे 1738 में अब्राहम डी मोइवरे की पुस्तक संभावना का सिद्धांत में प्रस्तुत किया गया था। आजकल, इसे केंद्रीय सीमा प्रमेय के परिणाम के रूप में देखा जा सकता है क्योंकि B(n, p) का योग है n स्वतंत्र, समान रूप से वितरित बरनौली वितरण पैरामीटर p के साथ है । यह तथ्य सामान्य परीक्षण आंकड़ों में x/n, नमूना अनुपात और p के अनुमानक का उपयोग करके p के मूल्य के लिए परिकल्पना परीक्षण, अनुपात z-परीक्षण का आधार है।[31]
उदाहरण के लिए, मान लीजिए कि बड़ी जनसंख्या से बेतरतीब ढंग से n लोगों का नमूना लेता है और उनसे पूछता है कि क्या वे निश्चित कथन से सहमत हैं। सहमत होने वाले लोगों का अनुपात निश्चित रूप से नमूने पर निर्भर करेगा। यदि n लोगों के समूहों को बार-बार और सही मायने में बेतरतीब ढंग से नमूना लिया गया था, तब अनुपात जनसंख्या में समझौते के वास्तविक अनुपात p के सामान्तर और मानक विचलन के साथ लगभग सामान्य वितरण का पालन करेगा।
पोइसन सन्निकटन
द्विपद वितरण प्वासों वितरण की ओर अभिसरण करता है क्योंकि परीक्षणों की संख्या अनंत तक जाती है जबकि उत्पाद np सीमित सीमा तक अभिसरण करता है। इसलिए, पैरामीटर λ = np के साथ प्वासों वितरण को द्विपद वितरण के सन्निकटन के रूप में उपयोग किया जा सकता है यदि n पर्याप्त रूप से बड़ा है और p पर्याप्त रूप से छोटा है। अंगूठे के दो नियमों के अनुसार, यह सन्निकटन अच्छा है यदि n ≥ 20 और p ≤ 0.05, या यदि n ≥ 100 और np ≤ 10।[32]
पॉइसन सन्निकटन की सटीकता के संबंध में, नोवाक, [33]अध्याय देखें। 4, और उसमें संदर्भ।
वितरण सीमित करना
- पोइसन सीमा प्रमेय: चूंकि n ∞ तक पहुंचता है , उत्पाद np को स्थिर रखा जाता है और p 0 तक पहुंचता है,, द्विपद (n, p) वितरण अपेक्षित मान λ = np के साथ पॉइसन वितरण तक पहुंचता है।[32]
- डी मोइवर-लाप्लास प्रमेय: जैसा कि n ∞ तक पहुंचता है जबकि p स्थिर रहता है, इसका वितरण
- अपेक्षित मान 0 और विचरण 1 के साथ सामान्य वितरण तक पहुंचता है। इस परिणाम को कभी-कभी यह कहते हुए शिथिल रूप से कहा जाता है कि X का वितरण अपेक्षित मान 0 और विचरण 1 के साथ स्पर्शोन्मुख सामान्यता है। यह परिणाम केंद्रीय सीमा प्रमेय का विशिष्ट स्तिथियाँ है।
बीटा वितरण
द्विपद वितरण और बीटा वितरण दोहराए गए बर्नौली परीक्षणों के मॉडल के अलग-अलग विचार हैं। द्विपद वितरण का संभाव्यता द्रव्यमान फलन है द्विपद वितरण n स्वतंत्र घटनाओं को देखते हुए सफलताओं का PMF है, जिनमें से प्रत्येक में सफलता की संभावना p है। गणितीय रूप से, कब α = k + 1 और β = n − k + 1, बीटा वितरण और द्विपद वितरण n + 1 के कारक से संबंधित हैं|
बीटा वितरण भी बायेसियन अनुमान में द्विपद वितरण के लिए पूर्व वितरण का परिवार प्रदान करते हैं:[34] :
एक समान पूर्व को देखते हुए, k देखी गई सफलताओं के साथ n स्वतंत्र घटनाओं को देखते हुए सफलता की संभावना p के लिए पश्च वितरण एक बीटा वितरण है।[35]
यादृच्छिक संख्या पीढ़ी
यादृच्छिक संख्या पीढ़ी के विधियों जहां सीमांत वितरण द्विपद वितरण है, अच्छी तरह से स्थापित हैं।[36][37] एक द्विपद वितरण से यादृच्छिक भिन्न नमूने उत्पन्न करने का विधि व्युत्क्रम एल्गोरिथम का उपयोग करना है। ऐसा करने के लिए, किसी को संभावना की गणना करनी चाहिए कि 0 से n तक सभी मान k के लिए Pr(X = k) है।(इन संभावनाओं को पूरे नमूना स्थान को सम्मिलित करने के लिए मूल्य के करीब होना चाहिए।) फिर 0 और 1 के मध्य समान रूप से नमूने उत्पन्न करने के लिए छद्म यादृच्छिक संख्या जनरेटर का उपयोग करके, परिकलित नमूनों को असतत संख्याओं में परिवर्तित कर सकते हैं। संभावनाओं की गणना पहले चरण में की जाती है।
इतिहास
यह वितरण जैकब बर्नौली द्वारा प्राप्त किया गया था। उन्होंने उस स्थितियोंपर विचार किया जहां p = r/(r + s) जहां p सफलता की संभावना है तथा r और s धनात्मक पूर्णांक हैं। ब्लेज़ पास्कल ने पहले उस स्थितियोंपर विचार किया था जहां p = 1/2 होता है |
यह भी देखें
- संभार तन्त्र परावर्तन
- बहुपद वितरण
- ऋणात्मक द्विपद वितरण
- बीटा-द्विपद वितरण
- द्विपद माप, मल्टीफ्रैक्टल प्रणाली माप (गणित) का उदाहरण।[38]
- सांख्यिकीय यांत्रिकी
- पाइलिंग-अप लेम्मा, परिणामी प्रायिकता जब एक्सओआर-आईएनजी स्वतंत्र बूलियन चर
संदर्भ
- ↑ Westland, J. Christopher (2020). Audit Analytics: Data Science for the Accounting Profession. Chicago, IL, USA: Springer. p. 53. ISBN 978-3-030-49091-1.
- ↑ Feller, W. (1968). An Introduction to Probability Theory and Its Applications (Third ed.). New York: Wiley. p. 151 (theorem in section VI.3).
- ↑ Wadsworth, G. P. (1960). Introduction to Probability and Random Variables. New York: McGraw-Hill. p. 52.
- ↑ Jowett, G. H. (1963). "The Relationship Between the Binomial and F Distributions". Journal of the Royal Statistical Society, Series D. 13 (1): 55–57. doi:10.2307/2986663. JSTOR 2986663.
- ↑ See Proof Wiki
- ↑ Knoblauch, Andreas (2008), "Closed-Form Expressions for the Moments of the Binomial Probability Distribution", SIAM Journal on Applied Mathematics, 69 (1): 197–204, doi:10.1137/070700024, JSTOR 40233780
- ↑ Nguyen, Duy (2021), "A probabilistic approach to the moments of binomial random variables and application", The American Statistician, 75 (1): 101–103, doi:10.1080/00031305.2019.1679257, S2CID 209923008
- ↑ D. Ahle, Thomas (2022), "Sharp and Simple Bounds for the raw Moments of the Binomial and Poisson Distributions", Statistics & Probability Letters, 182: 109306, arXiv:2103.17027, doi:10.1016/j.spl.2021.109306
- ↑ See also Nicolas, André (January 7, 2019). "Finding mode in Binomial distribution". Stack Exchange.
- ↑ Neumann, P. (1966). "Über den Median der Binomial- and Poissonverteilung". Wissenschaftliche Zeitschrift der Technischen Universität Dresden (in Deutsch). 19: 29–33.
- ↑ Lord, Nick. (July 2010). "Binomial averages when the mean is an integer", The Mathematical Gazette 94, 331-332.
- ↑ 12.0 12.1 Kaas, R.; Buhrman, J.M. (1980). "Mean, Median and Mode in Binomial Distributions". Statistica Neerlandica. 34 (1): 13–18. doi:10.1111/j.1467-9574.1980.tb00681.x.
- ↑ Hamza, K. (1995). "The smallest uniform upper bound on the distance between the mean and the median of the binomial and Poisson distributions". Statistics & Probability Letters. 23: 21–25. doi:10.1016/0167-7152(94)00090-U.
- ↑ Nowakowski, Sz. (2021). "Uniqueness of a Median of a Binomial Distribution with Rational Probability". Advances in Mathematics: Scientific Journal. 10 (4): 1951–1958. arXiv:2004.03280. doi:10.37418/amsj.10.4.9. ISSN 1857-8365. S2CID 215238991.
- ↑ 15.0 15.1 Arratia, R.; Gordon, L. (1989). "Tutorial on large deviations for the binomial distribution". Bulletin of Mathematical Biology. 51 (1): 125–131. doi:10.1007/BF02458840. PMID 2706397. S2CID 189884382.
- ↑ Robert B. Ash (1990). Information Theory. Dover Publications. p. 115. ISBN 9780486665214.
- ↑ Matoušek, J.; Vondrak, J. "The Probabilistic Method" (PDF). lecture notes. Archived (PDF) from the original on 2022-10-09.
- ↑ Razzaghi, Mehdi (2002). "On the estimation of binomial success probability with zero occurrence in sample". Journal of Modern Applied Statistical Methods. 1 (2): 326–332. doi:10.22237/jmasm/1036110000.
- ↑ 19.0 19.1 Brown, Lawrence D.; Cai, T. Tony; DasGupta, Anirban (2001), "Interval Estimation for a Binomial Proportion", Statistical Science, 16 (2): 101–133, CiteSeerX 10.1.1.323.7752, doi:10.1214/ss/1009213286, retrieved 2015-01-05
- ↑ Agresti, Alan; Coull, Brent A. (May 1998), "Approximate is better than 'exact' for interval estimation of binomial proportions" (PDF), The American Statistician, 52 (2): 119–126, doi:10.2307/2685469, JSTOR 2685469, retrieved 2015-01-05
- ↑ Gulotta, Joseph. "Agresti-Coull Interval Method". pellucid.atlassian.net. Retrieved 18 May 2021.
- ↑ "Confidence intervals". itl.nist.gov. Retrieved 18 May 2021.
- ↑ Pires, M. A. (2002). "Confidence intervals for a binomial proportion: comparison of methods and software evaluation" (PDF). In Klinke, S.; Ahrend, P.; Richter, L. (eds.). Proceedings of the Conference CompStat 2002. Short Communications and Posters. Archived (PDF) from the original on 2022-10-09.
- ↑ Wilson, Edwin B. (June 1927), "Probable inference, the law of succession, and statistical inference" (PDF), Journal of the American Statistical Association, 22 (158): 209–212, doi:10.2307/2276774, JSTOR 2276774, archived from the original (PDF) on 2015-01-13, retrieved 2015-01-05
- ↑ "Confidence intervals". Engineering Statistics Handbook. NIST/Sematech. 2012. Retrieved 2017-07-23.
- ↑ Dekking, F.M.; Kraaikamp, C.; Lopohaa, H.P.; Meester, L.E. (2005). A Modern Introduction of Probability and Statistics (1 ed.). Springer-Verlag London. ISBN 978-1-84628-168-6.
- ↑ Wang, Y. H. (1993). "On the number of successes in independent trials" (PDF). Statistica Sinica. 3 (2): 295–312. Archived from the original (PDF) on 2016-03-03.
- ↑ Katz, D.; et al. (1978). "Obtaining confidence intervals for the risk ratio in cohort studies". Biometrics. 34 (3): 469–474. doi:10.2307/2530610. JSTOR 2530610.
- ↑ Taboga, Marco. "Lectures on Probability Theory and Mathematical Statistics". statlect.com. Retrieved 18 December 2017.
- ↑ Box, Hunter and Hunter (1978). Statistics for experimenters. Wiley. p. 130. ISBN 9780471093152.
- ↑ NIST/SEMATECH, "7.2.4. Does the proportion of defectives meet requirements?" e-Handbook of Statistical Methods.
- ↑ 32.0 32.1 NIST/SEMATECH, "6.3.3.1. Counts Control Charts", e-Handbook of Statistical Methods.
- ↑ Novak S.Y. (2011) Extreme value methods with applications to finance. London: CRC/ Chapman & Hall/Taylor & Francis. ISBN 9781-43983-5746.
- ↑ MacKay, David (2003). Information Theory, Inference and Learning Algorithms. Cambridge University Press; First Edition. ISBN 978-0521642989.
- ↑ "Beta distribution".
- ↑ Devroye, Luc (1986) Non-Uniform Random Variate Generation, New York: Springer-Verlag. (See especially Chapter X, Discrete Univariate Distributions)
- ↑ Kachitvichyanukul, V.; Schmeiser, B. W. (1988). "Binomial random variate generation". Communications of the ACM. 31 (2): 216–222. doi:10.1145/42372.42381. S2CID 18698828.
- ↑ Mandelbrot, B. B., Fisher, A. J., & Calvet, L. E. (1997). A multifractal model of asset returns. 3.2 The Binomial Measure is the Simplest Example of a Multifractal
अग्रिम पठन
- Hirsch, Werner Z. (1957). "Binomial Distribution—Success or Failure, How Likely Are They?". Introduction to Modern Statistics. New York: MacMillan. pp. 140–153.
- Neter, John; Wasserman, William; Whitmore, G. A. (1988). Applied Statistics (Third ed.). Boston: Allyn & Bacon. pp. 185–192. ISBN 0-205-10328-6.
बाहरी संबंध
- Interactive graphic: Univariate Distribution Relationships
- Binomial distribution formula calculator
- Difference of two binomial variables: X-Y or |X-Y|
- Querying the binomial probability distribution in WolframAlpha