बीटा-द्विपद वितरण

From Vigyanwiki
Probability mass function
Probability mass function for the beta-binomial distribution
Cumulative distribution function
बीटा-द्विपद बंटन के लिए संचयी प्रायिकता बंटन फलन
Notation
Parameters nN0 — number of trials
(real)
(real)
Support x ∈ { 0, …, n }
PMF

where is the beta function
CDF

where 3F2(a;b;x) is the generalized hypergeometric function
Mean
Variance
Skewness
Ex. kurtosis See text
MGF where is the hypergeometric function
CF
PGF

संभाव्यता सिद्धांत और आंकड़ों में, बीटा-द्विपद वितरण गैर-नकारात्मक पूर्णांकों के परिमित समर्थन (गणित) पर असतत संभाव्यता वितरण का एक परिवार है, जब बर्नौली परीक्षणों की निश्चित या ज्ञात संख्या में से प्रत्येक में सफलता की संभावना या तो अज्ञात होती है। या यादृच्छिक। बीटा-द्विपद वितरण द्विपद वितरण है जिसमें प्रत्येक 'एन परीक्षण में सफलता की संभावना तय नहीं है लेकिन बीटा वितरण से यादृच्छिक रूप से तैयार की जाती है। द्विपद प्रकार वितरित आंकड़े में अतिफैलाव को पकड़ने के लिए बायेसियन सांख्यिकी, अनुभवजन्य बेयस विधियों और चिरसम्मत आंकड़ों में इसका उपयोग प्रायः किया जाता है।

बीटा-द्विपद डिरिचलेट-बहुपद वितरण का एक-आयामी संस्करण है क्योंकि द्विपद और बीटा वितरण क्रमशः बहुराष्ट्रीय वितरण और डिरिचलेट वितरण के एकतरफा संस्करण हैं। विशेष घटना जहां α और β पूर्णांक हैं, उन्हें नकारात्मक हाइपरज्यामितीय वितरण के रूप में भी जाना जाता है।

प्रेरणा और व्युत्पत्ति

यौगिक वितरण के रूप में

द्विपद वितरण से पहले बीटा वितरण एक संयुग्म है। यह तथ्य एक विश्लेषणात्मक रूप से ट्रैक्टेबल कंपाउंड डिस्ट्रीब्यूशन की ओर जाता है जहां कोई सोच सकता है बीटा वितरण से यादृच्छिक रूप से निकाले जाने के रूप में द्विपद वितरण में पैरामीटर।

मान लीजिए कि हमें हेड्स की संख्या का अनुमान लगाने में दिलचस्पी है, में भविष्य के परीक्षण। इसके द्वारा दिया गया है

बीटा फलन के गुणों का उपयोग करके इसे वैकल्पिक रूप से लिखा जा सकता है


कलश मॉडल के रूप में बीटा-द्विपद

बीटा-द्विपद वितरण को α और β के सकारात्मक पूर्णांक मानों के लिए कलश मॉडल के माध्यम से भी प्रेरित किया जा सकता है, जिसे पोल्या कलश मॉडल के रूप में जाना जाता है। विशेष रूप से, α लाल गेंदों और β काली गेंदों वाले कलश की कल्पना करें, जहां यादृच्छिक ड्रॉ बनाए जाते हैं। यदि एक लाल गेंद देखी जाती है, तो दो लाल गेंदों को कलश में वापस कर दिया जाता है। इसी तरह, यदि एक काली गेंद निकाली जाती है, तो दो काली गेंदें कलश में वापस आ जाती हैं। यदि इसे n बार दोहराया जाता है, तो x लाल गेंदों को देखने की संभावना पैरामीटर n, α और β के साथ बीटा-द्विपद वितरण का अनुसरण करती है।

यदि यादृच्छिक ड्रॉ सरल प्रतिस्थापन के साथ होते हैं (प्रेक्षित गेंद के ऊपर और ऊपर कोई गेंद कलश में नहीं जोड़ी जाती है), तो वितरण एक द्विपद वितरण का अनुसरण करता है और यदि यादृच्छिक ड्रॉ प्रतिस्थापन के बिना किए जाते हैं, तो वितरण एक हाइपरज्यामितीय वितरण का अनुसरण करता है।

क्षण और गुण

पहले तीन कच्चे क्षण (गणित) हैं

और कर्टोसिस है

दे हम सुझाव देते हैं कि माध्य को इस प्रकार लिखा जा सकता है

और भिन्नता के रूप में

जहाँ . पैरामीटर इंट्रा क्लास या इंट्रा क्लस्टर सहसंबंध के रूप में जाना जाता है। यह सकारात्मक सहसंबंध है जो अति फैलाव को जन्म देता है। ध्यान दें कि कब , बीटा और द्विपद भिन्नता के बीच अंतर करने के लिए कोई जानकारी उपलब्ध नहीं है, और दो मॉडलों में समान भिन्नताएं हैं।

फैक्टोरियल मोमेंट्स

r-बीटा-द्विपद यादृच्छिक चर का वाँ तथ्यात्मक क्षण X है

.

बिंदु अनुमान

आघूर्ण की विधि

क्षणों की विधि (सांख्यिकी) अनुमान बीटा-द्विपद के पहले और दूसरे क्षणों को ध्यान में रखते हुए और उन्हें नमूना क्षणों के बराबर सेट करके प्राप्त किया जा सकता है और . हम देखतें है

ये अनुमान गैर-संवेदनात्मक रूप से नकारात्मक हो सकते हैं जो इस बात का प्रमाण है कि द्विपद वितरण के सापेक्ष आंकड़े या तो अविच्छिन्न या अल्पप्रकीर्णित है। इस मामले में, द्विपद वितरण और अतिज्यामितीय वितरण क्रमशः वैकल्पिक उम्मीदवार हैं।

अधिकतम संभावना अनुमान

जबकि क्लोज-फॉर्म अधिकतम संभावना अव्यावहारिक है, यह देखते हुए कि पीडीएफ में सामान्य कार्य (गामा फ़ंक्शन और/या बीटा फ़ंक्शन) होते हैं, उन्हें प्रत्यक्ष संख्यात्मक अनुकूलन के माध्यम से आसानी से पाया जा सकता है। अनुभवजन्य आंकड़े से अधिकतम संभावना अनुमान बहुराष्ट्रीय पोल्या वितरण को फिट करने के लिए सामान्य तरीकों का उपयोग करके गणना की जा सकती है, जिसके लिए विधियाँ (मिन्का 2003) में वर्णित हैं।

आर (प्रोग्रामिंग लैंग्वेज) पैकेज वीजीएएम फ़ंक्शन वीजीएलएम के माध्यम से, अधिकतम संभावना के माध्यम से, बीटा-द्विपद वितरण के अनुसार वितरित प्रतिक्रियाओं के साथ सामान्यीकृत रैखिक मॉडल प्रकार के मॉडल की फिटिंग की सुविधा प्रदान करता है। इस बात की कोई आवश्यकता नहीं है कि संपूर्ण प्रेक्षणों के दौरान n स्थिर रहता है।

उदाहरण

निम्नलिखित आंकड़े 19वीं सदी के सैक्सोनी में अस्पताल के रिकॉर्ड से लिए गए 6115 परिवारों में परिवार के आकार 13 के पहले 12 बच्चों में पुरुष बच्चों की संख्या देता है (लिंडसे से सोकल और रोल्फ़, पृ. 59)। 13वें बच्चे को अनदेखा किया जाता है ताकि वांछित लिंग प्राप्त होने पर परिवारों के गैर-यादृच्छिक रूप से रुकने के प्रभाव को कम किया जा सके।

पुरुषों 0 1 2 3 4 5 6 7 8 9 10 11 12
परिवार 3 24 104 286 670 1033 1343 1112 829 478 181 45 7

पहले दो नमूना क्षण हैं

और इसलिए क्षणों का अनुमान लगाने की विधि है

अधिकतम संभावना अनुमान संख्यात्मक रूप से पाया जा सकता है

और अधिकतम लॉग संभावना है

जिससे हम एआईसी सूचना कसौटी पाते हैं

प्रतिस्पर्धी द्विपद मॉडल के लिए एआईसी = 25070.34 है और इस प्रकार हम देखते हैं कि बीटा-द्विपद मॉडल आंकड़े के लिए बेहतर फिट प्रदान करता है यानी अति फैलाव के लिए सबूत है। ट्राइवर्स-विलार्ड परिकल्पना स्तनपायी संतानों के बीच लिंग-प्रवणता में विविधता के लिए एक सैद्धांतिक औचित्य को दर्शाती है।

बेहतर फिट विशेष रूप से पूंछों के बीच स्पष्ट है

पुरुषों 0 1 2 3 4 5 6 7 8 9 10 11 12
परिवारों का अवलोकन किया 3 24 104 286 670 1033 1343 1112 829 478 181 45 7
सज्जित अपेक्षित (बीटा-द्विपद) 2.3 22.6 104.8 310.9 655.7 1036.2 1257.9 1182.1 853.6 461.9 177.9 43.8 5.2
सज्जित अपेक्षित (द्विपद p = 0.519215) 0.9 12.1 71.8 258.5 628.1 1085.2 1367.3 1265.6 854.2 410.0 132.8 26.1 2.3

बायेसियन सांख्यिकी में बीटा-द्विपद

बर्नौली सफलता की संभावना के बायेसियन अनुमान में बीटा-द्विपद वितरण एक प्रमुख भूमिका निभाता है जिसका अनुमान हम आंकड़ों के आधार पर लगाना चाहते हैं। होने देना स्वतंत्र और समान रूप से वितरित बर्नौली यादृच्छिक चर का एक नमूना (आँकड़े) बनें . मान लीजिए, हमारा ज्ञान - बायेसियन फैशन में - अनिश्चित है और पूर्व वितरण द्वारा तैयार किया गया है . अगर फिर संयुक्त वितरण के माध्यम से

.

अवलोकन करने के बाद हम ध्यान दें कि के लिए पश्च वितरण

जहाँ एक सामान्यीकरण स्थिरांक है। हम पश्च वितरण को एक के रूप में पहचानते हैं .

इस प्रकार, फिर से कंपाउंडिंग के माध्यम से, हम पाते हैं कि आकार के भविष्य के नमूने के योग का पश्चगामी वितरण का यादृच्छिक चर है

.

बीटा द्विपद-वितरित यादृच्छिक चर उत्पन्न करना

एक बीटा-द्विपद यादृच्छिक चर बनाने के लिए बस एक ड्रा करें और फिर ड्रा करें .

संबंधित वितरण

  • जहाँ .
  • जहाँ समान वितरण (असतत) है।
  • जहाँ और और द्विपद वितरण है।
  • जहाँ नकारात्मक द्विपद वितरण है।

यह भी देखें

  • डिरिचलेट-बहुराष्ट्रीय वितरण

संदर्भ

  • मिंका, थॉमस पी. (2003). डिरिचलेट वितरण का अनुमान लगाना। माइक्रोसॉफ्ट तकनीकी रिपोर्ट।


बाहरी संबंध