बहुपद वितरण: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 53: Line 53:
=== उदाहरण ===
=== उदाहरण ===


मान लीजिए कि बड़े देश के लिए तीन-तरफ़ा चुनाव में, उम्मीदवार A को 20% वोट मिले, उम्मीदवार B को 30% वोट मिले, एवं उम्मीदवार C को 50% वोट मिले। यदि छह मतदाताओं को यादृच्छिक रूप से चुना जाता है, तो इसकी क्या संभावना है कि नमूने में उम्मीदवार A के लिए बिल्कुल एक समर्थक, उम्मीदवार B के लिए दो समर्थक एवं उम्मीदवार C के लिए तीन समर्थक होंगे?
मान लीजिए कि बड़े देश के लिए तीन-तरफ़ा चुनाव में, उम्मीदवार A को 20% वोट मिले, उम्मीदवार B को 30% वोट मिले, एवं उम्मीदवार C को 50% वोट मिले। यदि छह मतदाताओं का यादृच्छिक रूप से चयन होता है, तो इसकी क्या संभावना है कि प्रतिरूप में उम्मीदवार A के लिए बिल्कुल एक समर्थक, उम्मीदवार B के लिए दो समर्थक एवं उम्मीदवार C के लिए तीन समर्थक होंगे?


ध्यान दें: चूंकि हम यह मान रहे हैं कि मतदान करने वाली आपश्चाती बड़ी है, इसलिए नमूने के लिए मतदाता का चयन होने के पश्चात संभावनाओं को अपरिवर्तित मानना ​​उचित एवं स्वीकार्य है। तकनीकी रूप से कहें तो यह प्रतिस्थापन के बिना प्रतिरूपकरण है, इसलिए सही वितरण हाइपरज्यामितीय वितरण#मल्टीवेरिएट हाइपरज्यामितीय वितरण है, लेकिन एक निश्चित प्रतिरूप आकार की तुलना में जनसंख्या बड़ी होने पर वितरण परिवर्तित हो जाते हैं<ref>{{Cite web |title=संभाव्यता - बहुपद वितरण नमूनाकरण|url=https://stats.stackexchange.com/a/335239/307588 |access-date=2022-07-28 |website=Cross Validated |language=en}}</ref>.
ध्यान दें: चूंकि हम यह मान रहे हैं कि मतदान करने वाली जनसँख्या बड़ी है, इसलिए प्रतिरूप के लिए मतदाता का चयन होने के पश्चात संभावनाओं को अपरिवर्तित मानना ​​उचित एवं स्वीकार्य है। प्रौद्योगिकी रूप से कहें तो यह प्रतिस्थापन के बिना प्रतिरूपकरण है, इसलिए उचित वितरण बहुभिन्नरूपी  हाइपरज्यामितीय वितरण है, परन्तु निश्चित प्रतिरूप आकार की अपेक्षा में जनसंख्या बड़ी होने पर वितरण परिवर्तित हो जाते हैं<ref>{{Cite web |title=संभाव्यता - बहुपद वितरण नमूनाकरण|url=https://stats.stackexchange.com/a/335239/307588 |access-date=2022-07-28 |website=Cross Validated |language=en}}</ref>तो


: <math> \Pr(A=1,B=2,C=3) = \frac{6!}{1! 2! 3!}(0.2^1) (0.3^2) (0.5^3) = 0.135 </math>
: <math> \Pr(A=1,B=2,C=3) = \frac{6!}{1! 2! 3!}(0.2^1) (0.3^2) (0.5^3) = 0.135 </math> होता है।




Line 63: Line 63:


=== [[अपेक्षित मूल्य]] एवं विचरण ===
=== [[अपेक्षित मूल्य]] एवं विचरण ===
n परीक्षणों में जो परिणाम i देखा गया उसकी अपेक्षित मान संख्या है
n परीक्षणों में जो परिणाम i देखा गया उसकी अपेक्षित मान संख्या  


:<math>\operatorname{E}(X_i) = n p_i.\,</math>
:<math>\operatorname{E}(X_i) = n p_i\,</math>  
सहप्रसरण मैट्रिक्स इस प्रकार है। प्रत्येक विकर्ण प्रविष्टि एक द्विपद रूप से वितरित यादृच्छिक चर का विचरण है, एवं इसलिए है
सहप्रसरण मैट्रिक्स इस प्रकार है। प्रत्येक विकर्ण प्रविष्टि द्विपद रूप से वितरित यादृच्छिक चर का विचरण है, एवं इसलिए है


:<math>\operatorname{Var}(X_i)=np_i(1-p_i).\,</math>
:<math>\operatorname{Var}(X_i)=np_i(1-p_i)\,</math>होता है।
ऑफ-विकर्ण प्रविष्टियाँ [[सहप्रसरण]] हैं:
ऑफ-विकर्ण प्रविष्टियाँ [[सहप्रसरण]] हैं:


:<math>\operatorname{Cov}(X_i,X_j)=-np_i p_j\,</math>
:<math>\operatorname{Cov}(X_i,X_j)=-np_i p_j\,</math>
i, j के लिए अलग।
i, j के लिए भिन्न है।


सभी सहप्रसरण नकारात्मक हैं क्योंकि निश्चित n के लिए, बहुपद वेक्टर के एक घटक में वृद्धि के लिए दूसरे घटक में कमी की आवश्यकता होती है।
सभी सहप्रसरण नकारात्मक हैं क्योंकि निश्चित n के लिए, बहुपद वेक्टर के घटक में वृद्धि के लिए दूसरे घटक में कमी की आवश्यकता होती है।


जब इन अभिव्यक्तियों को i, j तत्व के साथ एक मैट्रिक्स में संयोजित किया जाता है <math>\operatorname{cov} (X_i,X_j),</math> परिणाम ak × k है सकारात्मक-निश्चित मैट्रिक्स#नकारात्मक-निश्चित, अर्धनिश्चित एवं अनिश्चित आव्यूह|रैंक k का सकारात्मक-अर्धनिश्चित सहप्रसरण मैट्रिक्स - 1. विशेष विषय में जहां k = n एवं जहां p<sub>''i''</sub> सभी समान हैं, सहप्रसरण मैट्रिक्स [[केन्द्रित मैट्रिक्स]] है।
जब इन अभिव्यक्तियों को i, j तत्व के साथ मैट्रिक्स में संयोजित किया जाता है, <math>\operatorname{cov} (X_i,X_j),</math> परिणाम ak × k रैंक k-1 का सकारात्मक-अर्धनिश्चित सहप्रसरण मैट्रिक्स है। विशेष विषय में जहां k = n एवं जहां p<sub>''i''</sub> सभी समान हैं, सहप्रसरण मैट्रिक्स [[केन्द्रित मैट्रिक्स]] है।


संगत सहसंबंध मैट्रिक्स#सहसंबंध मैट्रिक्स की प्रविष्टियाँ हैं
संगत सहसंबंध मैट्रिक्स की प्रविष्टियाँ  


:<math>\rho(X_i,X_i) = 1.</math>
:<math>\rho(X_i,X_i) = 1,</math>
:<math>\rho(X_i,X_j) = \frac{\operatorname{Cov}(X_i,X_j)}{\sqrt{\operatorname{Var}(X_i)\operatorname{Var}(X_j)}} = \frac{-p_i  p_j}{\sqrt{p_i(1-p_i) p_j(1-p_j)}} = -\sqrt{\frac{p_i  p_j}{(1-p_i)(1-p_j)}}.</math>
:<math>\rho(X_i,X_j) = \frac{\operatorname{Cov}(X_i,X_j)}{\sqrt{\operatorname{Var}(X_i)\operatorname{Var}(X_j)}} = \frac{-p_i  p_j}{\sqrt{p_i(1-p_i) p_j(1-p_j)}} = -\sqrt{\frac{p_i  p_j}{(1-p_i)(1-p_j)}}</math> हैं।
ध्यान दें कि प्रतिरूप आकार इस अभिव्यक्ति से बाहर हो जाता है।
ध्यान दें कि प्रतिरूप आकार इस अभिव्यक्ति से बाहर हो जाता है।


प्रत्येक k घटक में पैरामीटर n एवं p के साथ अलग से एक द्विपद वितरण होता है<sub>''i''</sub>, सबस्क्रिप्ट के उचित मान के लिए i.
सबस्क्रिप्ट के उचित i मान के लिए, प्रत्येक k घटक में पैरामीटर n एवं p<sub>''i''</sub> के साथ भिन्न से द्विपद वितरण होता है।


बहुपद वितरण का [[समर्थन (गणित)]] समुच्चय है
बहुपद वितरण का [[समर्थन (गणित)]] समुच्चय  


: <math>\{(n_1,\dots,n_k)\in \mathbb{N}^k \mid  n_1+\cdots+n_k=n\}.\,</math>
: <math>\{(n_1,\dots,n_k)\in \mathbb{N}^k \mid  n_1+\cdots+n_k=n\}\,</math> है।
इसके तत्वों की संख्या है
इसके तत्वों की संख्या  


: <math>{n+k-1 \choose k-1}.</math>
: <math>{n+k-1 \choose k-1}</math> है।





Revision as of 17:42, 11 July 2023

Multinomial
Parameters

number of trials (integer)
number of mutually exclusive events (integer)

event probabilities, where
Support
PMF
Mean
Variance
Entropy
MGF
CF where
PGF

संभाव्यता सिद्धांत में, बहुपद वितरण द्विपद वितरण का सामान्यीकरण है। उदाहरण के लिए, यह k-पक्षीय पासे को n बार घुमाने पर प्रत्येक पक्ष की गिनती की संभावना को मॉडल करता है। n सांख्यिकीय स्वतंत्रता परीक्षणों के लिए, जिनमें से प्रत्येक k श्रेणियों में से किसी एक के लिए सफलता की ओर ले जाता है, प्रत्येक श्रेणी में निश्चित सफलता की संभावना होती है, बहुपद वितरण विभिन्न श्रेणियों के लिए सफलताओं की संख्या के किसी विशेष संयोजन की संभावना देता है।।

जब k 2 है एवं n 1 है, तो बहुपद वितरण बर्नौली वितरण है। जब k 2 है एवं n 1 से बड़ा है, तो यह द्विपद वितरण है। जब k 2 से बड़ा है एवं n 1 है, तो यह श्रेणीबद्ध वितरण है। "मल्टीनौली" शब्द का उपयोग कभी-कभी इस चार-तरफा रिश्ते पर जोर देने के लिए श्रेणीबद्ध वितरण के लिए किया जाता है (इसलिए n उपसर्ग निर्धारित करता है, एवं k प्रत्यय निर्धारित करता है)।

बर्नौली वितरण एकल बर्नौली परीक्षण के परिणाम को मॉडल करता है। दूसरे शब्दों में, यह मॉडल करता है कि क्या (संभवतः उचित सिक्का) सिक्के को उछालने पर या तो सफलता मिलेगी (चित प्राप्त करना) या असफलता (पूंछ प्राप्त करना) मिलेगी। द्विपद वितरण इसे एक ही सिक्के के n स्वतंत्र फ्लिप (बर्नौली परीक्षण) करने से प्राप्त अंकों की संख्या के आधार पर सामान्यीकृत करता है। बहुपद वितरण n प्रयोगों के परिणाम को मॉडल करता है, जहां प्रत्येक परीक्षण के परिणाम में श्रेणीबद्ध वितरण होता है, जैसे कि k-पक्षीय पासे को n बार रोल करना होता है।

मान लीजिए k निश्चित परिमित संख्या है। गणितीय रूप से, हमारे पास k संभावित परस्पर अनन्य परिणाम हैं, संबंधित संभावनाओं p के p1, ..., pk, एवं n स्वतंत्र परीक्षण हैं। चूँकि k परिणाम परस्पर अनन्य हैं एवं अवश्य घटित होता है, इसलिए हमारे पास pi ≥ 0 के लिए i = 1,...,k एवं होता है। फिर यदि यादृच्छिक चर Xi इंगित करें कि n परीक्षणों में परिणाम संख्या i कितनी बार देखी गई है, वेक्टर X = (X1, ..., Xk) पैरामीटर n एवं 'p' के साथ बहुपद वितरण का अनुसरण करता है, जहां 'p' = (p1, ..., pk) होता है जबकि परीक्षण स्वतंत्र हैं, उनके परिणाम Xi पर निर्भर हैं, क्योंकि उन्हें n में जोड़ा जाना चाहिए।

परिभाषा

प्रायिकता द्रव्यमान फलन

मान लीजिए कि कोई बैग से k भिन्न-भिन्न रंगों की n गेंदें निकालने का प्रयोग करता है, एवं प्रत्येक ड्रॉ के पश्चात निकाली गई गेंदों को परिवर्तित कर देता है। समान रंग की गेंदें समतुल्य हैं। उस चर को X के रूप में निरूपित करें जो रंग i (i = 1, ..., k) की निकाली गई गेंदों की संख्या Xi है, एवं pi के रूप में निरूपित करें, संभावना है कि दिया गया निष्कर्षण रंग i में होगा। इस बहुपद वितरण का संभाव्यता द्रव्यमान फलन है:

अन्य-ऋणात्मक पूर्णांक x1 के लिए ...xk

संभाव्यता द्रव्यमान फ़ंक्शन को गामा फ़ंक्शन का उपयोग करके इस प्रकार व्यक्त किया जा सकता है:

यह रूप डिरिचलेट वितरण से इसकी समानता दर्शाता है, जो इसका संयुग्म पूर्व है।

उदाहरण

मान लीजिए कि बड़े देश के लिए तीन-तरफ़ा चुनाव में, उम्मीदवार A को 20% वोट मिले, उम्मीदवार B को 30% वोट मिले, एवं उम्मीदवार C को 50% वोट मिले। यदि छह मतदाताओं का यादृच्छिक रूप से चयन होता है, तो इसकी क्या संभावना है कि प्रतिरूप में उम्मीदवार A के लिए बिल्कुल एक समर्थक, उम्मीदवार B के लिए दो समर्थक एवं उम्मीदवार C के लिए तीन समर्थक होंगे?

ध्यान दें: चूंकि हम यह मान रहे हैं कि मतदान करने वाली जनसँख्या बड़ी है, इसलिए प्रतिरूप के लिए मतदाता का चयन होने के पश्चात संभावनाओं को अपरिवर्तित मानना ​​उचित एवं स्वीकार्य है। प्रौद्योगिकी रूप से कहें तो यह प्रतिस्थापन के बिना प्रतिरूपकरण है, इसलिए उचित वितरण बहुभिन्नरूपी हाइपरज्यामितीय वितरण है, परन्तु निश्चित प्रतिरूप आकार की अपेक्षा में जनसंख्या बड़ी होने पर वितरण परिवर्तित हो जाते हैं[1]तो

होता है।


गुण

अपेक्षित मूल्य एवं विचरण

n परीक्षणों में जो परिणाम i देखा गया उसकी अपेक्षित मान संख्या

सहप्रसरण मैट्रिक्स इस प्रकार है। प्रत्येक विकर्ण प्रविष्टि द्विपद रूप से वितरित यादृच्छिक चर का विचरण है, एवं इसलिए है

होता है।

ऑफ-विकर्ण प्रविष्टियाँ सहप्रसरण हैं:

i, j के लिए भिन्न है।

सभी सहप्रसरण नकारात्मक हैं क्योंकि निश्चित n के लिए, बहुपद वेक्टर के घटक में वृद्धि के लिए दूसरे घटक में कमी की आवश्यकता होती है।

जब इन अभिव्यक्तियों को i, j तत्व के साथ मैट्रिक्स में संयोजित किया जाता है, परिणाम ak × k रैंक k-1 का सकारात्मक-अर्धनिश्चित सहप्रसरण मैट्रिक्स है। विशेष विषय में जहां k = n एवं जहां pi सभी समान हैं, सहप्रसरण मैट्रिक्स केन्द्रित मैट्रिक्स है।

संगत सहसंबंध मैट्रिक्स की प्रविष्टियाँ

हैं।

ध्यान दें कि प्रतिरूप आकार इस अभिव्यक्ति से बाहर हो जाता है।

सबस्क्रिप्ट के उचित i मान के लिए, प्रत्येक k घटक में पैरामीटर n एवं pi के साथ भिन्न से द्विपद वितरण होता है।

बहुपद वितरण का समर्थन (गणित) समुच्चय

है।

इसके तत्वों की संख्या

है।


मैट्रिक्स संकेतन

मैट्रिक्स संकेतन में,

एवं

साथ pT = स्तंभ वेक्टर का पंक्ति वेक्टर स्थानान्तरण p.

विज़ुअलाइज़ेशन

सामान्यीकृत पास्कल त्रिकोण के स्लाइस के रूप में

जैसे कोई द्विपद वितरण की व्याख्या पास्कल के त्रिकोण के (सामान्यीकृत) एक-आयामी (1D) स्लाइस के रूप में कर सकता है, वैसे ही कोई बहुपद वितरण की व्याख्या पास्कल के पिरामिड के 2D (त्रिकोणीय) स्लाइस, या 3D/4D/+ (पिरामिड-) के रूप में कर सकता है। पास्कल के त्रिकोण के उच्च-आयामी एनालॉग्स के आकार के) टुकड़े। इससे वितरण की सीमा (सांख्यिकी) की व्याख्या का पता चलता है, मनमाने आयाम में विच्छेदित समबाहु पिरामिड - यानी। ग्रिड के साथ संकेतन

बहुपद गुणांक के रूप में

इसी प्रकार, जैसे कोई द्विपद वितरण की व्याख्या बहुपद गुणांक के रूप में कर सकता है जब विस्तारित किया जाता है, तो कोई बहुपद वितरण की व्याख्या गुणांक के रूप में कर सकता है जब विस्तारित किया जाता है, तो यह ध्यान में रखते हुए कि केवल गुणांकों का योग 1 होना चाहिए।

संबंधित वितरण

प्राकृतिक भाषा प्रसंस्करण जैसे कुछ क्षेत्रों में, श्रेणीबद्ध एवं बहुपद वितरण पर्यायवाची हैं एवं जब श्रेणीबद्ध वितरण वास्तव में होता है तो बहुपद वितरण की बात करना आम बात है। यह इस तथ्य से उपजा है कि किसी श्रेणीबद्ध वितरण के परिणाम को एक पूर्णांक के अतिरिक्त 1-के-के वेक्टर (वेक्टर जिसमें तत्व 1 एवं अन्य सभी तत्वों में 0 होता है) के रूप में व्यक्त करना सुविधाजनक होता है। श्रेणी ; इस रूप में, एक श्रेणीबद्ध वितरण एकल परीक्षण पर बहुपद वितरण के बराबर है।

  • जब k = 2, बहुपद वितरण द्विपद वितरण होता है।
  • श्रेणीबद्ध वितरण, प्रत्येक परीक्षण का वितरण; k = 2 के लिए, यह बर्नौली वितरण है।
  • डिरिचलेट वितरण बायेसियन सांख्यिकी में बहुपद से पूर्व का संयुग्म है।
  • डिरिचलेट-बहुपद वितरण
  • बीटा-द्विपद वितरण
  • नकारात्मक बहुपद वितरण
  • हार्डी-वेनबर्ग सिद्धांत (यह संभावनाओं के साथ त्रिपद वितरण है ) है।

सांख्यिकीय अनुमान

बहुपद वितरण के लिए समतुल्यता परीक्षण

तुल्यता परीक्षण का लक्ष्य सैद्धांतिक बहुपद वितरण एवं प्रेक्षित गणना आवृत्तियों के मध्य समझौता स्थापित करना है। सैद्धांतिक वितरण पूर्ण प्रकार से निर्दिष्ट बहुपद वितरण या बहुपद वितरण का पैरामीट्रिक परिवार हो सकता है।

होने देना सैद्धांतिक बहुपद वितरण को निरूपित करें एवं जाने दें सच्चा अंतर्निहित वितरण बनें। वितरण एवं यदि समतुल्य माना जाता है दूरी के लिए एवं सहिष्णुता पैरामीटर है। तुल्यता परीक्षण समस्या है बनाम है, वास्तविक अंतर्निहित वितरण अज्ञात है। इसके अतिरिक्त, गिनती की आवृत्तियाँ मनाया जाता है, जहां प्रतिरूप आकार है, तुल्यता परीक्षण का उपयोग करता है अस्वीकार करना . यदि तब मध्य की समानता को अस्वीकार किया जा सकता है, एवं किसी दिए गए महत्व स्तर पर दिखाया गया है। यूक्लिडियन दूरी के लिए समतुल्यता परीक्षण वेलेक (2010) की पाठ्य पुस्तक में पाया जा सकता है।[2] कुल भिन्नता दूरी के लिए तुल्यता परीक्षण ओस्ट्रोव्स्की (2017) में विकसित किया गया है।[3] विशिष्ट संचयी दूरी के लिए सटीक तुल्यता परीक्षण फ्रे (2009) में प्रस्तावित है।[4]वास्तविक अंतर्निहित वितरण के मध्य की दूरी एवं बहुपद वितरण का परिवार द्वारा परिभाषित किया गया है फिर तुल्यता परीक्षण एवं समस्या दी गई है। दूरी सामान्यतः संख्यात्मक अनुकूलन का उपयोग करके गणना की जाती है। इस विषय के परीक्षण वर्तमान में ओस्ट्रोव्स्की (2018) में विकसित किए गए हैं।[5]


यादृच्छिक भिन्न पीढ़ी

सबसे पूर्व, मापदंडों को पुन: व्यवस्थित करें, इस प्रकार कि उन्हें अवरोही क्रम में क्रमबद्ध किया जाता है (यह केवल गणना में तीव्रता लाने के लिए है एवं सख्ती से आवश्यक नहीं है)। अब, प्रत्येक परीक्षण के लिए, समान (0, 1) वितरण से सहायक चर X बनाएं। परिणामी परिणाम घटक है

है,

{xj = 1, xk = 0 k ≠ j } के लिए बहुपद वितरण से अवलोकन , एवं n = 1 है। इस प्रयोग के स्वतंत्र दोहराव का योग बहुपद वितरण से अवलोकन है जिसमें n ऐसे दोहराव की संख्या के समान है।

संदर्भ

उद्धरण

  1. "संभाव्यता - बहुपद वितरण नमूनाकरण". Cross Validated (in English). Retrieved 2022-07-28.
  2. Wellek, Stefan (2010). समतुल्यता और गैर-हीनता की सांख्यिकीय परिकल्पनाओं का परीक्षण करना. Chapman and Hall/CRC. ISBN 978-1439808184.
  3. Ostrovski, Vladimir (May 2017). "बहुपद वितरणों की तुल्यता का परीक्षण". Statistics & Probability Letters. 124: 77–82. doi:10.1016/j.spl.2017.01.004. S2CID 126293429.Official web link (subscription required). Alternate, free web link.
  4. Frey, Jesse (March 2009). "समतुल्यता के लिए एक सटीक बहुपद परीक्षण". The Canadian Journal of Statistics. 37: 47–59. doi:10.1002/cjs.10000. S2CID 122486567.Official web link (subscription required).
  5. Ostrovski, Vladimir (March 2018). "स्वतंत्रता मॉडल के अनुप्रयोग के साथ बहुराष्ट्रीय वितरण के परिवारों के लिए तुल्यता का परीक्षण". Statistics & Probability Letters. 139: 61–66. doi:10.1016/j.spl.2018.03.014. S2CID 126261081.Official web link (subscription required). Alternate, free web link.


स्रोत


श्रेणी:भिन्न-भिन्न वितरण श्रेणी:बहुभिन्नरूपी असतत वितरण श्रेणी:कारकीय एवं द्विपद विषय श्रेणी:घातांकीय पारिवारिक वितरण