बहुपद वितरण: Difference between revisions
(Created page with "{{short description|Generalization of the binomial distribution}} {{Probability distribution |pdf_image = |cdf_image = |name = Multinomial |type = mass |paramete...") |
No edit summary |
||
Line 24: | Line 24: | ||
}} | }} | ||
संभाव्यता सिद्धांत में, बहुपद वितरण [[द्विपद वितरण]] का | संभाव्यता सिद्धांत में, '''बहुपद वितरण''' [[द्विपद वितरण]] का सामान्यीकरण है। उदाहरण के लिए, यह ''k''-पक्षीय पासे को ''n'' बार घुमाने पर प्रत्येक पक्ष की गिनती की संभावना को मॉडल करता है। n [[सांख्यिकीय स्वतंत्रता]] परीक्षणों के लिए, जिनमें से प्रत्येक ''के'' श्रेणियों में से किसी एक के लिए सफलता की ओर ले जाता है, प्रत्येक श्रेणी में निश्चित सफलता की संभावना होती है, बहुपद वितरण संख्याओं के किसी विशेष संयोजन की संभावना देता है विभिन्न श्रेणियों के लिए सफलताएँ। | ||
जब ''k'' 2 है | जब ''k'' 2 है एवं ''n'' 1 है, तो बहुपद वितरण [[बर्नौली वितरण]] है। जब ''k'' 2 है एवं ''n'' 1 से बड़ा है, तो यह द्विपद वितरण है। जब ''k'' 2 से बड़ा है एवं ''n'' 1 है, तो यह [[श्रेणीबद्ध वितरण]] है। बहु-नौली शब्द का उपयोग कभी-कभी इस चार-तरफा रिश्ते पर जोर देने के लिए श्रेणीबद्ध वितरण के लिए किया जाता है (इसलिए ''n'' उपसर्ग निर्धारित करता है, एवं ''के'' प्रत्यय निर्धारित करता है)। | ||
बर्नौली वितरण एकल [[बर्नौली परीक्षण]] के परिणाम को मॉडल करता है। दूसरे शब्दों में, यह मॉडल करता है कि क्या एक (संभवतः उचित सिक्का) सिक्के को | बर्नौली वितरण एकल [[बर्नौली परीक्षण]] के परिणाम को मॉडल करता है। दूसरे शब्दों में, यह मॉडल करता है कि क्या एक (संभवतः उचित सिक्का) सिक्के को उछालने पर या तो सफलता मिलेगी (चित प्राप्त करना) या असफलता (पूंछ प्राप्त करना)। द्विपद वितरण इसे एक ही सिक्के के ''n'' स्वतंत्र फ्लिप (बर्नौली परीक्षण) करने से प्राप्त अंकों की संख्या के आधार पर सामान्यीकृत करता है। बहुपद वितरण ''n'' प्रयोगों के परिणाम को मॉडल करता है, जहां प्रत्येक परीक्षण के नतीजे में श्रेणीबद्ध वितरण होता है, जैसे कि ''k''-पक्षीय पासे को ''n'' बार रोल करना। | ||
मान लीजिए ''k'' एक निश्चित परिमित संख्या है। गणितीय रूप से, हमारे पास ''k'' संभावित परस्पर अनन्य परिणाम हैं, संबंधित संभावनाओं ''p'' के साथ<sub>1</sub>, ..., पी<sub>''k''</sub>, | मान लीजिए ''k'' एक निश्चित परिमित संख्या है। गणितीय रूप से, हमारे पास ''k'' संभावित परस्पर अनन्य परिणाम हैं, संबंधित संभावनाओं ''p'' के साथ<sub>1</sub>, ..., पी<sub>''k''</sub>, एवं n स्वतंत्र परीक्षण। चूँकि k परिणाम परस्पर अनन्य हैं एवं अवश्य घटित होता है, इसलिए हमारे पास p है<sub>''i''</sub>≥ 0 के लिए i = 1,...,k एवं <math>\sum_{i=1}^k p_i = 1</math>. फिर यदि यादृच्छिक चर X<sub>''i''</sub> इंगित करें कि n परीक्षणों में परिणाम संख्या i कितनी बार देखी गई है, वेक्टर X = (X<sub>1</sub>, ..., एक्स<sub>''k''</sub>) पैरामीटर n एवं 'p' के साथ एक बहुपद वितरण का अनुसरण करता है, जहां 'p' = (p<sub>1</sub>, ..., पी<sub>''k''</sub>). जबकि परीक्षण स्वतंत्र हैं, उनके परिणाम X हैं<sub>''i''</sub> निर्भर हैं क्योंकि उन्हें n में जोड़ा जाना चाहिए। | ||
== परिभाषाएँ == | == परिभाषाएँ == | ||
===प्रायिकता द्रव्यमान फलन=== | ===प्रायिकता द्रव्यमान फलन=== | ||
मान लीजिए कि कोई एक बैग से k अलग-अलग रंगों की n गेंदें निकालने का प्रयोग करता है, | मान लीजिए कि कोई एक बैग से k अलग-अलग रंगों की n गेंदें निकालने का प्रयोग करता है, एवं प्रत्येक ड्रॉ के बाद निकाली गई गेंदों को बदल देता है। एक ही रंग की गेंदें समतुल्य हैं। उस चर को X के रूप में निरूपित करें जो रंग i (i = 1, ..., k) की निकाली गई गेंदों की संख्या है<sub>''i''</sub>, एवं पी के रूप में निरूपित करें<sub>''i''</sub> संभावना है कि दिया गया निष्कर्षण i रंग में होगा। इस बहुपद वितरण का संभाव्यता द्रव्यमान फलन है: | ||
: <math> \begin{align} | : <math> \begin{align} | ||
Line 44: | Line 44: | ||
\end{align} | \end{align} | ||
</math> | </math> | ||
गैर-ऋणात्मक पूर्णांक x | गैर-ऋणात्मक पूर्णांक x<sub>1</sub> के लिए ...x<sub>''k''</sub> | ||
संभाव्यता द्रव्यमान फ़ंक्शन को [[गामा फ़ंक्शन]] का उपयोग करके इस प्रकार व्यक्त किया जा सकता है: | संभाव्यता द्रव्यमान फ़ंक्शन को [[गामा फ़ंक्शन]] का उपयोग करके इस प्रकार व्यक्त किया जा सकता है: | ||
:<math>f(x_1,\dots, x_{k}; p_1,\ldots, p_k) = \frac{\Gamma(\sum_i x_i + 1)}{\prod_i \Gamma(x_i+1)} \prod_{i=1}^k p_i^{x_i} | :<math>f(x_1,\dots, x_{k}; p_1,\ldots, p_k) = \frac{\Gamma(\sum_i x_i + 1)}{\prod_i \Gamma(x_i+1)} \prod_{i=1}^k p_i^{x_i}</math> | ||
यह रूप [[डिरिचलेट वितरण]] से इसकी समानता दर्शाता है, जो इसका संयुग्म पूर्व है। | यह रूप [[डिरिचलेट वितरण]] से इसकी समानता दर्शाता है, जो इसका संयुग्म पूर्व है। | ||
=== उदाहरण === | === उदाहरण === | ||
मान लीजिए कि एक बड़े देश के लिए तीन-तरफ़ा चुनाव में, उम्मीदवार A को 20% वोट मिले, उम्मीदवार B को 30% वोट मिले, | मान लीजिए कि एक बड़े देश के लिए तीन-तरफ़ा चुनाव में, उम्मीदवार A को 20% वोट मिले, उम्मीदवार B को 30% वोट मिले, एवं उम्मीदवार C को 50% वोट मिले। यदि छह मतदाताओं को यादृच्छिक रूप से चुना जाता है, तो इसकी क्या संभावना है कि नमूने में उम्मीदवार A के लिए बिल्कुल एक समर्थक, उम्मीदवार B के लिए दो समर्थक एवं उम्मीदवार C के लिए तीन समर्थक होंगे? | ||
ध्यान दें: चूंकि हम यह मान रहे हैं कि मतदान करने वाली आबादी बड़ी है, इसलिए नमूने के लिए मतदाता का चयन होने के बाद संभावनाओं को अपरिवर्तित मानना उचित | ध्यान दें: चूंकि हम यह मान रहे हैं कि मतदान करने वाली आबादी बड़ी है, इसलिए नमूने के लिए मतदाता का चयन होने के बाद संभावनाओं को अपरिवर्तित मानना उचित एवं स्वीकार्य है। तकनीकी रूप से कहें तो यह प्रतिस्थापन के बिना प्रतिरूपकरण है, इसलिए सही वितरण हाइपरज्यामितीय वितरण#मल्टीवेरिएट हाइपरज्यामितीय वितरण है, लेकिन एक निश्चित प्रतिरूप आकार की तुलना में जनसंख्या बड़ी होने पर वितरण परिवर्तित हो जाते हैं<ref>{{Cite web |title=संभाव्यता - बहुपद वितरण नमूनाकरण|url=https://stats.stackexchange.com/a/335239/307588 |access-date=2022-07-28 |website=Cross Validated |language=en}}</ref>. | ||
: <math> \Pr(A=1,B=2,C=3) = \frac{6!}{1! 2! 3!}(0.2^1) (0.3^2) (0.5^3) = 0.135 </math> | : <math> \Pr(A=1,B=2,C=3) = \frac{6!}{1! 2! 3!}(0.2^1) (0.3^2) (0.5^3) = 0.135 </math> | ||
Line 62: | Line 62: | ||
== गुण == | == गुण == | ||
=== [[अपेक्षित मूल्य]] | === [[अपेक्षित मूल्य]] एवं विचरण === | ||
n परीक्षणों में जो परिणाम i देखा गया उसकी अपेक्षित मान संख्या है | n परीक्षणों में जो परिणाम i देखा गया उसकी अपेक्षित मान संख्या है | ||
:<math>\operatorname{E}(X_i) = n p_i.\,</math> | :<math>\operatorname{E}(X_i) = n p_i.\,</math> | ||
सहप्रसरण मैट्रिक्स इस प्रकार है। प्रत्येक विकर्ण प्रविष्टि एक द्विपद रूप से वितरित यादृच्छिक चर का विचरण है, | सहप्रसरण मैट्रिक्स इस प्रकार है। प्रत्येक विकर्ण प्रविष्टि एक द्विपद रूप से वितरित यादृच्छिक चर का विचरण है, एवं इसलिए है | ||
:<math>\operatorname{Var}(X_i)=np_i(1-p_i).\,</math> | :<math>\operatorname{Var}(X_i)=np_i(1-p_i).\,</math> | ||
Line 76: | Line 76: | ||
सभी सहप्रसरण नकारात्मक हैं क्योंकि निश्चित n के लिए, बहुपद वेक्टर के एक घटक में वृद्धि के लिए दूसरे घटक में कमी की आवश्यकता होती है। | सभी सहप्रसरण नकारात्मक हैं क्योंकि निश्चित n के लिए, बहुपद वेक्टर के एक घटक में वृद्धि के लिए दूसरे घटक में कमी की आवश्यकता होती है। | ||
जब इन अभिव्यक्तियों को i, j तत्व के साथ एक मैट्रिक्स में संयोजित किया जाता है <math>\operatorname{cov} (X_i,X_j),</math> परिणाम ak × k है सकारात्मक-निश्चित मैट्रिक्स#नकारात्मक-निश्चित, अर्धनिश्चित | जब इन अभिव्यक्तियों को i, j तत्व के साथ एक मैट्रिक्स में संयोजित किया जाता है <math>\operatorname{cov} (X_i,X_j),</math> परिणाम ak × k है सकारात्मक-निश्चित मैट्रिक्स#नकारात्मक-निश्चित, अर्धनिश्चित एवं अनिश्चित आव्यूह|रैंक k का सकारात्मक-अर्धनिश्चित सहप्रसरण मैट्रिक्स - 1. विशेष विषय में जहां k = n एवं जहां p<sub>''i''</sub> सभी समान हैं, सहप्रसरण मैट्रिक्स [[केन्द्रित मैट्रिक्स]] है। | ||
संगत सहसंबंध मैट्रिक्स#सहसंबंध मैट्रिक्स की प्रविष्टियाँ हैं | संगत सहसंबंध मैट्रिक्स#सहसंबंध मैट्रिक्स की प्रविष्टियाँ हैं | ||
Line 82: | Line 82: | ||
:<math>\rho(X_i,X_i) = 1.</math> | :<math>\rho(X_i,X_i) = 1.</math> | ||
:<math>\rho(X_i,X_j) = \frac{\operatorname{Cov}(X_i,X_j)}{\sqrt{\operatorname{Var}(X_i)\operatorname{Var}(X_j)}} = \frac{-p_i p_j}{\sqrt{p_i(1-p_i) p_j(1-p_j)}} = -\sqrt{\frac{p_i p_j}{(1-p_i)(1-p_j)}}.</math> | :<math>\rho(X_i,X_j) = \frac{\operatorname{Cov}(X_i,X_j)}{\sqrt{\operatorname{Var}(X_i)\operatorname{Var}(X_j)}} = \frac{-p_i p_j}{\sqrt{p_i(1-p_i) p_j(1-p_j)}} = -\sqrt{\frac{p_i p_j}{(1-p_i)(1-p_j)}}.</math> | ||
ध्यान दें कि | ध्यान दें कि प्रतिरूप आकार इस अभिव्यक्ति से बाहर हो जाता है। | ||
प्रत्येक k घटक में पैरामीटर n | प्रत्येक k घटक में पैरामीटर n एवं p के साथ अलग से एक द्विपद वितरण होता है<sub>''i''</sub>, सबस्क्रिप्ट के उचित मान के लिए i. | ||
बहुपद वितरण का [[समर्थन (गणित)]] समुच्चय है | बहुपद वितरण का [[समर्थन (गणित)]] समुच्चय है | ||
Line 97: | Line 97: | ||
मैट्रिक्स संकेतन में, | मैट्रिक्स संकेतन में, | ||
:<math>\operatorname{E}(\mathbf{X}) = n \mathbf{p},\,</math> | :<math>\operatorname{E}(\mathbf{X}) = n \mathbf{p},\,</math> | ||
एवं | |||
:<math>\operatorname{Var}(\mathbf{X}) = n \lbrace \operatorname{diag}(\mathbf{p}) - \mathbf{p} \mathbf{p}^{\rm T} \rbrace ,\,</math> | :<math>\operatorname{Var}(\mathbf{X}) = n \lbrace \operatorname{diag}(\mathbf{p}) - \mathbf{p} \mathbf{p}^{\rm T} \rbrace ,\,</math> | ||
साथ {{math|'''p'''<sup>T</sup>}} = स्तंभ वेक्टर का पंक्ति वेक्टर स्थानान्तरण {{math|'''p'''}}. | साथ {{math|'''p'''<sup>T</sup>}} = स्तंभ वेक्टर का पंक्ति वेक्टर स्थानान्तरण {{math|'''p'''}}. | ||
Line 104: | Line 104: | ||
==== सामान्यीकृत पास्कल त्रिकोण के स्लाइस के रूप में ==== | ==== सामान्यीकृत पास्कल त्रिकोण के स्लाइस के रूप में ==== | ||
जैसे कोई द्विपद वितरण की व्याख्या पास्कल के त्रिकोण के (सामान्यीकृत) एक-आयामी (1D) स्लाइस के रूप में कर सकता है, वैसे ही कोई बहुपद वितरण की व्याख्या पास्कल के पिरामिड के 2D (त्रिकोणीय) स्लाइस, या 3D/4D/+ (पिरामिड-) के रूप में कर सकता है। पास्कल के त्रिकोण के उच्च-आयामी एनालॉग्स के आकार के) टुकड़े। इससे वितरण की सीमा (सांख्यिकी) की व्याख्या का पता चलता है | जैसे कोई द्विपद वितरण की व्याख्या पास्कल के त्रिकोण के (सामान्यीकृत) एक-आयामी (1D) स्लाइस के रूप में कर सकता है, वैसे ही कोई बहुपद वितरण की व्याख्या पास्कल के पिरामिड के 2D (त्रिकोणीय) स्लाइस, या 3D/4D/+ (पिरामिड-) के रूप में कर सकता है। पास्कल के त्रिकोण के उच्च-आयामी एनालॉग्स के आकार के) टुकड़े। इससे वितरण की सीमा (सांख्यिकी) की व्याख्या का पता चलता है, मनमाने आयाम में विच्छेदित समबाहु पिरामिड - यानी। ग्रिड के साथ [[संकेतन]] | ||
==== बहुपद गुणांक के रूप में ==== | ==== बहुपद गुणांक के रूप में ==== | ||
Line 110: | Line 110: | ||
==संबंधित वितरण== | ==संबंधित वितरण== | ||
[[प्राकृतिक भाषा प्रसंस्करण]] जैसे कुछ क्षेत्रों में, श्रेणीबद्ध | [[प्राकृतिक भाषा प्रसंस्करण]] जैसे कुछ क्षेत्रों में, श्रेणीबद्ध एवं बहुपद वितरण पर्यायवाची हैं एवं जब श्रेणीबद्ध वितरण वास्तव में होता है तो बहुपद वितरण की बात करना आम बात है। यह इस तथ्य से उपजा है कि किसी श्रेणीबद्ध वितरण के परिणाम को एक पूर्णांक के अतिरिक्त 1-के-के वेक्टर (वेक्टर जिसमें तत्व 1 एवं अन्य सभी तत्वों में 0 होता है) के रूप में व्यक्त करना सुविधाजनक होता है। श्रेणी <math>1 \dots K</math>; इस रूप में, एक श्रेणीबद्ध वितरण एक एकल परीक्षण पर बहुपद वितरण के बराबर है। | ||
* जब k = 2, बहुपद वितरण द्विपद वितरण होता है। | * जब k = 2, बहुपद वितरण द्विपद वितरण होता है। | ||
* श्रेणीबद्ध वितरण, प्रत्येक परीक्षण का वितरण; k = 2 के लिए, यह बर्नौली वितरण है। | * श्रेणीबद्ध वितरण, प्रत्येक परीक्षण का वितरण; k = 2 के लिए, यह बर्नौली वितरण है। | ||
* डिरिचलेट वितरण बायेसियन सांख्यिकी में बहुपद से | * डिरिचलेट वितरण बायेसियन सांख्यिकी में बहुपद से पूर्व का संयुग्म है। | ||
* [[डिरिचलेट-बहुपद वितरण]]। | * [[डिरिचलेट-बहुपद वितरण]]। | ||
* [[बीटा-द्विपद वितरण]]। | * [[बीटा-द्विपद वितरण]]। | ||
* [[नकारात्मक बहुपद वितरण]] | * [[नकारात्मक बहुपद वितरण]] | ||
* हार्डी-वेनबर्ग सिद्धांत (यह संभावनाओं के साथ | * हार्डी-वेनबर्ग सिद्धांत (यह संभावनाओं के साथ त्रिपद वितरण है <math>(\theta^2, 2 \theta (1-\theta), (1-\theta)^2) </math>) है। | ||
==सांख्यिकीय अनुमान == | ==सांख्यिकीय अनुमान == | ||
===बहुपद वितरण के लिए समतुल्यता परीक्षण=== | ===बहुपद वितरण के लिए समतुल्यता परीक्षण=== | ||
तुल्यता परीक्षण का लक्ष्य सैद्धांतिक बहुपद वितरण | तुल्यता परीक्षण का लक्ष्य सैद्धांतिक बहुपद वितरण एवं प्रेक्षित गणना आवृत्तियों के मध्य समझौता स्थापित करना है। सैद्धांतिक वितरण पूर्ण प्रकार से निर्दिष्ट बहुपद वितरण या बहुपद वितरण का पैरामीट्रिक परिवार हो सकता है। | ||
होने देना <math>q</math> | होने देना <math>q</math> सैद्धांतिक बहुपद वितरण को निरूपित करें एवं जाने दें <math>p</math> सच्चा अंतर्निहित वितरण बनें। वितरण <math>p</math> एवं <math>q</math> यदि समतुल्य माना जाता है <math>d(p,q)<\varepsilon</math> दूरी के लिए <math>d</math> एवं सहिष्णुता पैरामीटर <math>\varepsilon>0</math> है। तुल्यता परीक्षण समस्या है <math>H_0=\{d(p,q)\geq\varepsilon\}</math> बनाम <math>H_1=\{d(p,q)<\varepsilon\}</math>है, वास्तविक अंतर्निहित वितरण <math>p</math> अज्ञात है। इसके अतिरिक्त, गिनती की आवृत्तियाँ <math>p_n</math>मनाया जाता है, जहां <math>n</math> प्रतिरूप आकार है, तुल्यता परीक्षण <math>p_n</math>का उपयोग करता है अस्वीकार करना <math>H_0</math>. यदि <math>H_0</math> तब मध्य की समानता को अस्वीकार किया जा सकता है, <math>p</math> एवं <math>q</math> किसी दिए गए महत्व स्तर पर दिखाया गया है। यूक्लिडियन दूरी के लिए समतुल्यता परीक्षण वेलेक (2010) की पाठ्य पुस्तक में पाया जा सकता है।<ref>{{Cite book|title=समतुल्यता और गैर-हीनता की सांख्यिकीय परिकल्पनाओं का परीक्षण करना|last=Wellek|first=Stefan|publisher=Chapman and Hall/CRC|year=2010|isbn=978-1439808184}}</ref> कुल भिन्नता दूरी के लिए तुल्यता परीक्षण ओस्ट्रोव्स्की (2017) में विकसित किया गया है।<ref>{{cite journal|last1=Ostrovski|first1=Vladimir|date=May 2017|title=बहुपद वितरणों की तुल्यता का परीक्षण|journal=Statistics & Probability Letters|volume=124|pages=77–82|doi=10.1016/j.spl.2017.01.004|s2cid=126293429}}[http://dx.doi.org/10.1016/j.spl.2017.01.004 Official web link (subscription required)]. [https://www.researchgate.net/publication/312481284_Testing_equivalence_of_multinomial_distributions Alternate, free web link].</ref> विशिष्ट संचयी दूरी के लिए सटीक तुल्यता परीक्षण फ्रे (2009) में प्रस्तावित है।<ref>{{cite journal|last1=Frey|first1=Jesse|date=March 2009|title=समतुल्यता के लिए एक सटीक बहुपद परीक्षण|journal=The Canadian Journal of Statistics|volume=37|pages=47–59|doi=10.1002/cjs.10000|s2cid=122486567 }}[http://www.jstor.org/stable/25653460 Official web link (subscription required)].</ref>वास्तविक अंतर्निहित वितरण के मध्य की दूरी <math>p</math> एवं बहुपद वितरण का परिवार <math>\mathcal{M}</math> द्वारा <math>d(p, \mathcal{M})=\min_{h\in\mathcal{M}}d(p,h) </math>परिभाषित किया गया है फिर तुल्यता परीक्षण <math>H_0=\{d(p,\mathcal{M})\geq \varepsilon\}</math> एवं <math>H_1=\{d(p,\mathcal{M})< \varepsilon\}</math> समस्या दी गई है। दूरी <math>d(p,\mathcal{M})</math> सामान्यतः संख्यात्मक अनुकूलन का उपयोग करके गणना की जाती है। इस विषय के परीक्षण वर्तमान में ओस्ट्रोव्स्की (2018) में विकसित किए गए हैं।<ref>{{cite journal|last1=Ostrovski|first1=Vladimir|date=March 2018|title=स्वतंत्रता मॉडल के अनुप्रयोग के साथ बहुराष्ट्रीय वितरण के परिवारों के लिए तुल्यता का परीक्षण|journal=Statistics & Probability Letters|volume=139|pages=61–66|doi=10.1016/j.spl.2018.03.014|s2cid=126261081}}[https://doi.org/10.1016/j.spl.2018.03.014 Official web link (subscription required)]. [https://www.researchgate.net/publication/324124605_Testing_equivalence_to_families_of_multinomial_distributions_with_application_to_the_independence_model Alternate, free web link].</ref> | ||
वास्तविक अंतर्निहित वितरण के | |||
Line 132: | Line 131: | ||
{{further|Non-uniform random variate generation}} | {{further|Non-uniform random variate generation}} | ||
सबसे | सबसे पूर्व, मापदंडों को पुन: व्यवस्थित <math>p_1, \ldots, p_k</math>करें, इस प्रकार कि उन्हें अवरोही क्रम में क्रमबद्ध किया जाता है (यह केवल गणना में तीव्रता लाने के लिए है एवं सख्ती से आवश्यक नहीं है)। अब, प्रत्येक परीक्षण के लिए, समान (0, 1) वितरण से सहायक चर X बनाएं। परिणामी परिणाम घटक है | ||
: <math>j = \min \left\{ j' \in \{1,\dots,k\} : \left(\sum_{i=1}^{j'} p_i\right) - X \geq 0 \right\} | : <math>j = \min \left\{ j' \in \{1,\dots,k\} : \left(\sum_{i=1}^{j'} p_i\right) - X \geq 0 \right\}</math> है, | ||
{ | {x<sub>''j''</sub> = 1, x<sub>''k''</sub> = 0 k ≠ j } के लिए बहुपद वितरण से अवलोकन <math>p_1, \ldots, p_k</math>, एवं n = 1 है। इस प्रयोग के स्वतंत्र दोहराव का योग बहुपद वितरण से अवलोकन है जिसमें n ऐसे दोहराव की संख्या के समान है। | ||
== संदर्भ == | == संदर्भ == | ||
Line 171: | Line 170: | ||
{{DEFAULTSORT:Multinomial Distribution}} | {{DEFAULTSORT:Multinomial Distribution}} | ||
श्रेणी:अलग-अलग वितरण | श्रेणी:अलग-अलग वितरण | ||
श्रेणी:बहुभिन्नरूपी असतत वितरण | श्रेणी:बहुभिन्नरूपी असतत वितरण | ||
श्रेणी:कारकीय | श्रेणी:कारकीय एवं द्विपद विषय | ||
श्रेणी:घातांकीय पारिवारिक वितरण | श्रेणी:घातांकीय पारिवारिक वितरण | ||
Revision as of 16:46, 11 July 2023
Parameters |
number of trials (integer) | ||
---|---|---|---|
Support | |||
PMF | |||
Mean | |||
Variance |
| ||
Entropy | |||
MGF | |||
CF | where | ||
PGF |
संभाव्यता सिद्धांत में, बहुपद वितरण द्विपद वितरण का सामान्यीकरण है। उदाहरण के लिए, यह k-पक्षीय पासे को n बार घुमाने पर प्रत्येक पक्ष की गिनती की संभावना को मॉडल करता है। n सांख्यिकीय स्वतंत्रता परीक्षणों के लिए, जिनमें से प्रत्येक के श्रेणियों में से किसी एक के लिए सफलता की ओर ले जाता है, प्रत्येक श्रेणी में निश्चित सफलता की संभावना होती है, बहुपद वितरण संख्याओं के किसी विशेष संयोजन की संभावना देता है विभिन्न श्रेणियों के लिए सफलताएँ।
जब k 2 है एवं n 1 है, तो बहुपद वितरण बर्नौली वितरण है। जब k 2 है एवं n 1 से बड़ा है, तो यह द्विपद वितरण है। जब k 2 से बड़ा है एवं n 1 है, तो यह श्रेणीबद्ध वितरण है। बहु-नौली शब्द का उपयोग कभी-कभी इस चार-तरफा रिश्ते पर जोर देने के लिए श्रेणीबद्ध वितरण के लिए किया जाता है (इसलिए n उपसर्ग निर्धारित करता है, एवं के प्रत्यय निर्धारित करता है)।
बर्नौली वितरण एकल बर्नौली परीक्षण के परिणाम को मॉडल करता है। दूसरे शब्दों में, यह मॉडल करता है कि क्या एक (संभवतः उचित सिक्का) सिक्के को उछालने पर या तो सफलता मिलेगी (चित प्राप्त करना) या असफलता (पूंछ प्राप्त करना)। द्विपद वितरण इसे एक ही सिक्के के n स्वतंत्र फ्लिप (बर्नौली परीक्षण) करने से प्राप्त अंकों की संख्या के आधार पर सामान्यीकृत करता है। बहुपद वितरण n प्रयोगों के परिणाम को मॉडल करता है, जहां प्रत्येक परीक्षण के नतीजे में श्रेणीबद्ध वितरण होता है, जैसे कि k-पक्षीय पासे को n बार रोल करना।
मान लीजिए k एक निश्चित परिमित संख्या है। गणितीय रूप से, हमारे पास k संभावित परस्पर अनन्य परिणाम हैं, संबंधित संभावनाओं p के साथ1, ..., पीk, एवं n स्वतंत्र परीक्षण। चूँकि k परिणाम परस्पर अनन्य हैं एवं अवश्य घटित होता है, इसलिए हमारे पास p हैi≥ 0 के लिए i = 1,...,k एवं . फिर यदि यादृच्छिक चर Xi इंगित करें कि n परीक्षणों में परिणाम संख्या i कितनी बार देखी गई है, वेक्टर X = (X1, ..., एक्सk) पैरामीटर n एवं 'p' के साथ एक बहुपद वितरण का अनुसरण करता है, जहां 'p' = (p1, ..., पीk). जबकि परीक्षण स्वतंत्र हैं, उनके परिणाम X हैंi निर्भर हैं क्योंकि उन्हें n में जोड़ा जाना चाहिए।
परिभाषाएँ
प्रायिकता द्रव्यमान फलन
मान लीजिए कि कोई एक बैग से k अलग-अलग रंगों की n गेंदें निकालने का प्रयोग करता है, एवं प्रत्येक ड्रॉ के बाद निकाली गई गेंदों को बदल देता है। एक ही रंग की गेंदें समतुल्य हैं। उस चर को X के रूप में निरूपित करें जो रंग i (i = 1, ..., k) की निकाली गई गेंदों की संख्या हैi, एवं पी के रूप में निरूपित करेंi संभावना है कि दिया गया निष्कर्षण i रंग में होगा। इस बहुपद वितरण का संभाव्यता द्रव्यमान फलन है:
गैर-ऋणात्मक पूर्णांक x1 के लिए ...xk
संभाव्यता द्रव्यमान फ़ंक्शन को गामा फ़ंक्शन का उपयोग करके इस प्रकार व्यक्त किया जा सकता है:
यह रूप डिरिचलेट वितरण से इसकी समानता दर्शाता है, जो इसका संयुग्म पूर्व है।
उदाहरण
मान लीजिए कि एक बड़े देश के लिए तीन-तरफ़ा चुनाव में, उम्मीदवार A को 20% वोट मिले, उम्मीदवार B को 30% वोट मिले, एवं उम्मीदवार C को 50% वोट मिले। यदि छह मतदाताओं को यादृच्छिक रूप से चुना जाता है, तो इसकी क्या संभावना है कि नमूने में उम्मीदवार A के लिए बिल्कुल एक समर्थक, उम्मीदवार B के लिए दो समर्थक एवं उम्मीदवार C के लिए तीन समर्थक होंगे?
ध्यान दें: चूंकि हम यह मान रहे हैं कि मतदान करने वाली आबादी बड़ी है, इसलिए नमूने के लिए मतदाता का चयन होने के बाद संभावनाओं को अपरिवर्तित मानना उचित एवं स्वीकार्य है। तकनीकी रूप से कहें तो यह प्रतिस्थापन के बिना प्रतिरूपकरण है, इसलिए सही वितरण हाइपरज्यामितीय वितरण#मल्टीवेरिएट हाइपरज्यामितीय वितरण है, लेकिन एक निश्चित प्रतिरूप आकार की तुलना में जनसंख्या बड़ी होने पर वितरण परिवर्तित हो जाते हैं[1].
गुण
अपेक्षित मूल्य एवं विचरण
n परीक्षणों में जो परिणाम i देखा गया उसकी अपेक्षित मान संख्या है
सहप्रसरण मैट्रिक्स इस प्रकार है। प्रत्येक विकर्ण प्रविष्टि एक द्विपद रूप से वितरित यादृच्छिक चर का विचरण है, एवं इसलिए है
ऑफ-विकर्ण प्रविष्टियाँ सहप्रसरण हैं:
i, j के लिए अलग।
सभी सहप्रसरण नकारात्मक हैं क्योंकि निश्चित n के लिए, बहुपद वेक्टर के एक घटक में वृद्धि के लिए दूसरे घटक में कमी की आवश्यकता होती है।
जब इन अभिव्यक्तियों को i, j तत्व के साथ एक मैट्रिक्स में संयोजित किया जाता है परिणाम ak × k है सकारात्मक-निश्चित मैट्रिक्स#नकारात्मक-निश्चित, अर्धनिश्चित एवं अनिश्चित आव्यूह|रैंक k का सकारात्मक-अर्धनिश्चित सहप्रसरण मैट्रिक्स - 1. विशेष विषय में जहां k = n एवं जहां pi सभी समान हैं, सहप्रसरण मैट्रिक्स केन्द्रित मैट्रिक्स है।
संगत सहसंबंध मैट्रिक्स#सहसंबंध मैट्रिक्स की प्रविष्टियाँ हैं
ध्यान दें कि प्रतिरूप आकार इस अभिव्यक्ति से बाहर हो जाता है।
प्रत्येक k घटक में पैरामीटर n एवं p के साथ अलग से एक द्विपद वितरण होता हैi, सबस्क्रिप्ट के उचित मान के लिए i.
बहुपद वितरण का समर्थन (गणित) समुच्चय है
इसके तत्वों की संख्या है
मैट्रिक्स संकेतन
मैट्रिक्स संकेतन में,
एवं
साथ pT = स्तंभ वेक्टर का पंक्ति वेक्टर स्थानान्तरण p.
विज़ुअलाइज़ेशन
सामान्यीकृत पास्कल त्रिकोण के स्लाइस के रूप में
जैसे कोई द्विपद वितरण की व्याख्या पास्कल के त्रिकोण के (सामान्यीकृत) एक-आयामी (1D) स्लाइस के रूप में कर सकता है, वैसे ही कोई बहुपद वितरण की व्याख्या पास्कल के पिरामिड के 2D (त्रिकोणीय) स्लाइस, या 3D/4D/+ (पिरामिड-) के रूप में कर सकता है। पास्कल के त्रिकोण के उच्च-आयामी एनालॉग्स के आकार के) टुकड़े। इससे वितरण की सीमा (सांख्यिकी) की व्याख्या का पता चलता है, मनमाने आयाम में विच्छेदित समबाहु पिरामिड - यानी। ग्रिड के साथ संकेतन
बहुपद गुणांक के रूप में
इसी प्रकार, जैसे कोई द्विपद वितरण की व्याख्या बहुपद गुणांक के रूप में कर सकता है जब विस्तारित किया जाता है, तो कोई बहुपद वितरण की व्याख्या गुणांक के रूप में कर सकता है जब विस्तारित किया जाता है, तो यह ध्यान में रखते हुए कि केवल गुणांकों का योग 1 होना चाहिए।
संबंधित वितरण
प्राकृतिक भाषा प्रसंस्करण जैसे कुछ क्षेत्रों में, श्रेणीबद्ध एवं बहुपद वितरण पर्यायवाची हैं एवं जब श्रेणीबद्ध वितरण वास्तव में होता है तो बहुपद वितरण की बात करना आम बात है। यह इस तथ्य से उपजा है कि किसी श्रेणीबद्ध वितरण के परिणाम को एक पूर्णांक के अतिरिक्त 1-के-के वेक्टर (वेक्टर जिसमें तत्व 1 एवं अन्य सभी तत्वों में 0 होता है) के रूप में व्यक्त करना सुविधाजनक होता है। श्रेणी ; इस रूप में, एक श्रेणीबद्ध वितरण एक एकल परीक्षण पर बहुपद वितरण के बराबर है।
- जब k = 2, बहुपद वितरण द्विपद वितरण होता है।
- श्रेणीबद्ध वितरण, प्रत्येक परीक्षण का वितरण; k = 2 के लिए, यह बर्नौली वितरण है।
- डिरिचलेट वितरण बायेसियन सांख्यिकी में बहुपद से पूर्व का संयुग्म है।
- डिरिचलेट-बहुपद वितरण।
- बीटा-द्विपद वितरण।
- नकारात्मक बहुपद वितरण
- हार्डी-वेनबर्ग सिद्धांत (यह संभावनाओं के साथ त्रिपद वितरण है ) है।
सांख्यिकीय अनुमान
बहुपद वितरण के लिए समतुल्यता परीक्षण
तुल्यता परीक्षण का लक्ष्य सैद्धांतिक बहुपद वितरण एवं प्रेक्षित गणना आवृत्तियों के मध्य समझौता स्थापित करना है। सैद्धांतिक वितरण पूर्ण प्रकार से निर्दिष्ट बहुपद वितरण या बहुपद वितरण का पैरामीट्रिक परिवार हो सकता है।
होने देना सैद्धांतिक बहुपद वितरण को निरूपित करें एवं जाने दें सच्चा अंतर्निहित वितरण बनें। वितरण एवं यदि समतुल्य माना जाता है दूरी के लिए एवं सहिष्णुता पैरामीटर है। तुल्यता परीक्षण समस्या है बनाम है, वास्तविक अंतर्निहित वितरण अज्ञात है। इसके अतिरिक्त, गिनती की आवृत्तियाँ मनाया जाता है, जहां प्रतिरूप आकार है, तुल्यता परीक्षण का उपयोग करता है अस्वीकार करना . यदि तब मध्य की समानता को अस्वीकार किया जा सकता है, एवं किसी दिए गए महत्व स्तर पर दिखाया गया है। यूक्लिडियन दूरी के लिए समतुल्यता परीक्षण वेलेक (2010) की पाठ्य पुस्तक में पाया जा सकता है।[2] कुल भिन्नता दूरी के लिए तुल्यता परीक्षण ओस्ट्रोव्स्की (2017) में विकसित किया गया है।[3] विशिष्ट संचयी दूरी के लिए सटीक तुल्यता परीक्षण फ्रे (2009) में प्रस्तावित है।[4]वास्तविक अंतर्निहित वितरण के मध्य की दूरी एवं बहुपद वितरण का परिवार द्वारा परिभाषित किया गया है फिर तुल्यता परीक्षण एवं समस्या दी गई है। दूरी सामान्यतः संख्यात्मक अनुकूलन का उपयोग करके गणना की जाती है। इस विषय के परीक्षण वर्तमान में ओस्ट्रोव्स्की (2018) में विकसित किए गए हैं।[5]
यादृच्छिक भिन्न पीढ़ी
सबसे पूर्व, मापदंडों को पुन: व्यवस्थित करें, इस प्रकार कि उन्हें अवरोही क्रम में क्रमबद्ध किया जाता है (यह केवल गणना में तीव्रता लाने के लिए है एवं सख्ती से आवश्यक नहीं है)। अब, प्रत्येक परीक्षण के लिए, समान (0, 1) वितरण से सहायक चर X बनाएं। परिणामी परिणाम घटक है
- है,
{xj = 1, xk = 0 k ≠ j } के लिए बहुपद वितरण से अवलोकन , एवं n = 1 है। इस प्रयोग के स्वतंत्र दोहराव का योग बहुपद वितरण से अवलोकन है जिसमें n ऐसे दोहराव की संख्या के समान है।
संदर्भ
उद्धरण
- ↑ "संभाव्यता - बहुपद वितरण नमूनाकरण". Cross Validated (in English). Retrieved 2022-07-28.
- ↑ Wellek, Stefan (2010). समतुल्यता और गैर-हीनता की सांख्यिकीय परिकल्पनाओं का परीक्षण करना. Chapman and Hall/CRC. ISBN 978-1439808184.
- ↑ Ostrovski, Vladimir (May 2017). "बहुपद वितरणों की तुल्यता का परीक्षण". Statistics & Probability Letters. 124: 77–82. doi:10.1016/j.spl.2017.01.004. S2CID 126293429.Official web link (subscription required). Alternate, free web link.
- ↑ Frey, Jesse (March 2009). "समतुल्यता के लिए एक सटीक बहुपद परीक्षण". The Canadian Journal of Statistics. 37: 47–59. doi:10.1002/cjs.10000. S2CID 122486567.Official web link (subscription required).
- ↑ Ostrovski, Vladimir (March 2018). "स्वतंत्रता मॉडल के अनुप्रयोग के साथ बहुराष्ट्रीय वितरण के परिवारों के लिए तुल्यता का परीक्षण". Statistics & Probability Letters. 139: 61–66. doi:10.1016/j.spl.2018.03.014. S2CID 126261081.Official web link (subscription required). Alternate, free web link.
स्रोत
- Evans, Morton; Hastings, Nicholas; Peacock, Brian (2000). सांख्यिकीय वितरण (3rd ed.). New York: Wiley. pp. 134–136. ISBN 0-471-37124-6.
- Weisstein, Eric W. "बहुपद वितरण". MathWorld. Wolfram Research.
श्रेणी:अलग-अलग वितरण श्रेणी:बहुभिन्नरूपी असतत वितरण श्रेणी:कारकीय एवं द्विपद विषय श्रेणी:घातांकीय पारिवारिक वितरण