ज्यामितीय वितरण
Probability mass function | |||
Cumulative distribution function | |||
Parameters | success probability (real) | success probability (real) | |
---|---|---|---|
Support | k trials where | k failures where | |
PMF | |||
CDF |
for , for |
for , for | |
Mean | |||
Median |
|
| |
Mode | |||
Variance | |||
Skewness | |||
Ex. kurtosis | |||
Entropy | |||
MGF |
for |
for | |
CF |
संभाव्यता सिद्धांत और सांख्यिकी में, ज्यामितीय वितरण दो असतत संभाव्यता वितरणो में से एक है:
- बर्नूली परीक्षण की सफलता प्राप्त करने के लिए आवश्यक बर्नूली परीक्षणों की संख्या X का प्रायिक प्रायिकता वितरण, समुच्चय पर समर्थित है।
- प्रथम सफलता से पहले विफलताओं की संख्या Y = X - 1 का प्रायिक प्रायिकता वितरण, समुच्चय पर समर्थित है।
इनमें से किसे ज्यामितीय वितरण कहा जाता है, यह परंपरा और सुविधा का विषय है।
ये दो अलग-अलग ज्यामितीय वितरणों को एक दूसरे से गलती से नहीं मिलाना चाहिए। प्रायः पहले संख्या X के वितरण के लिए ज्यामितीय वितरणो को "शिफ्टेड ज्यामितीय वितरण" के नाम से अपनाया जाता है; यद्यपि, अस्पष्टता से बचने के लिए, जो वितरण उद्देश्यित है उसे स्पष्ट रूप से उल्लेखित करना समझदारी माना जाता है, उदाहरण के लिए समुच्चय के समर्थन का उल्लेख स्पष्ट रूप से होना चाहिए।
ज्यामितीय वितरण प्रदान करता है जो सफलता की पहली घटना के लिए आवश्यक k स्वतंत्र परीक्षणों की प्रायिकता को वर्णित करता है, प्रत्येक परीक्षण में सफलता की प्रायिकता p होती है। यदि प्रत्येक परीक्षण में सफलता की प्रायिकता p हो, तो kवें परीक्षण की पहली सफलता होने की प्रायिकता अत्यधिक होती है
k = 1, 2, 3, 4, .... के लिए
ज्यामितीय वितरण के उपरोक्त रूप का उपयोग पहली सफलता सहित और परीक्षणों की संख्या के प्रारूपण के लिए किया जाता है। इसके विपरीत, ज्यामितीय वितरण के निम्नलिखित रूप का उपयोग पहली सफलता तक विफलताओं की संख्या के प्रारूपण के लिए किया जाता है:
k = 0, 1, 2, 3, .... के लिए
किसी भी स्थिति में, प्रायिकताओ का क्रम एक ज्यामितीय अनुक्रम है।
उदाहरण के लिए, एक साधारण पासा मान लीजिए पहली बार 1 प्रकट होने तक बार-बार फेंका जाता है। इसे कितनी बार फेंका गया है इसकी प्रायिकता वितरण अनंत समुच्चय { 1, 2, 3, ...} पर समर्थित है तथा p = 1/6 के साथ एक ज्यामितीय वितरण है।
ज्यामितीय वितरण को जियो (पी) द्वारा निरूपित किया जाता है जहां 0 <पी ≤ 1 होता है। [1]
परिभाषाएँ
परीक्षणों के एक क्रम पर विचार करें, जहां प्रत्येक परीक्षण के केवल दो संभावित परिणाम होते हैंː विफलता तथा सफलता। प्रत्येक परीक्षण के लिए सफलता की प्रायिकता समान मानी जाती है। परीक्षणों के ऐसे क्रम में, ज्यामितीय वितरण पहली सफलता से पूर्व विफलताओं की संख्या को प्ररूपित करने के लिए उपयोगी होता है क्योंकि प्रयोग में सफलता तक परीक्षणों की अनिश्चित संख्या हो सकती है, द्विपद वितरण के विपरीत जिसमें परीक्षणों की एक निर्धारित संख्या होती है। वितरण यह प्रायिकता देता है कि पहली सफलता से पहले शून्य विफलताएँ हैं, पहली सफलता से पहले एक विफलता, पहली सफलता से पहले दो विफलताएँ, और इसी तरह अन्य क्रम भी घटित होते है।
अनुमान: ज्यामितीय वितरण कब एक उपयुक्त मॉडल है?
ज्यामितीय वितरण एक उपयुक्त मॉडल है यदि निम्नलिखित धारणाएँ सत्य हैं।
- प्रतिरूपित की जा रही घटना स्वतंत्र परीक्षणों का एक क्रम है।
- प्रत्येक परीक्षण के लिए केवल दो संभावित परिणाम होते हैं, प्रायः निर्दिष्ट सफलता या विफलता।
- सफलता की प्रायिकता, p, प्रत्येक परीक्षण के लिए समान होती है।
यदि ये स्थितियाँ सत्य हैं, तो ज्यामितीय यादृच्छिक चर Y पहली सफलता से पहले विफलताओं की संख्या की गणना है। पहली सफलता से पहले विफलताओं की संभावित संख्या 0, 1, 2, 3 और इसी तरह है। उपरोक्त आलेखों में, यह सूत्रीकरण दाईं ओर दिखाया गया है।
एक वैकल्पिक सूत्रीकरण यह है कि ज्यामितीय यादृच्छिक चर X पहली सफलता तक और इसमें शामिल परीक्षणों की कुल संख्या है, और विफलताओं की संख्या X − 1 है। ऊपर दिए गए ग्राफ़ में, यह सूत्रीकरण बाईं ओर दिखाया गया है।
संभाव्यता परिणाम उदाहरण
पहली सफलता से पहले k विफलताओं की प्रायिकता की गणना करने के लिए सामान्य सूत्र, जहां सफलता की प्रायिकता p है और विफलता की प्रायिकता q=1−p है, है
के लिए = 0, 1, 2, 3, ...
E1) एक डॉक्टर नए निदान किए गए रोगी के लिए एंटीडिप्रेसेंट की मांग कर रहा है। मान लीजिए कि, उपलब्ध अवसाद-रोधी दवाओं में, प्रायिकता है कि कोई विशेष दवा किसी विशेष रोगी के लिए प्रभावी होगी, p=0.6 है। इसकी क्या प्रायिकता है कि इस रोगी के लिए पहली दवा प्रभावी पाई गई है, पहली दवा आजमाई गई है, दूसरी दवा आजमाई गई है, और इसी तरह आगे भी? उन दवाओं की अपेक्षित संख्या क्या है जिन्हें प्रभावी खोजने की कोशिश की जाएगी?
प्रायिकता है कि पहली दवा काम करती है। पहली सफलता से पहले शून्य असफलता होती है। Y = 0 विफल। प्रायिकता पीआर (पहली सफलता से पहले शून्य विफलता) बस प्रायिकता है कि पहली दवा काम करती है।
प्रायिकता है कि पहली दवा विफल हो जाती है, लेकिन दूसरी दवा काम करती है। पहली सफलता से पहले एक असफलता होती है। वाई = 1 विफलता। घटनाओं के इस क्रम की प्रायिकता Pr(पहली दवा विफल) है पी (दूसरी दवा सफल होती है), जो इसके द्वारा दी जाती है
प्रायिकता है कि पहली दवा विफल हो जाती है, दूसरी दवा विफल हो जाती है, लेकिन तीसरी दवा काम करती है। पहली सफलता से पहले दो असफलताएं होती हैं। Y= 2 विफलताएं। घटनाओं के इस क्रम की प्रायिकता Pr(पहली दवा विफल) है पी (दूसरी दवा विफल) पीआर (तीसरी दवा सफलता है)
E2) एक नवविवाहित जोड़ा बच्चे पैदा करने की योजना बनाता है और पहली लड़की होने तक जारी रहेगा। इसकी क्या प्रायिकता है कि पहली लड़की से पहले शून्य लड़के हैं, पहली लड़की से पहले एक लड़का है, पहली लड़की से पहले दो लड़के हैं, इत्यादि?
लड़की होने की प्रायिकता (सफलता) p= 0.5 है और लड़का होने की प्रायिकता (असफलता) q=1 − p =0.5 है।
पहली लड़की से पहले कोई लड़का नहीं होने की प्रायिकता है
पहली लड़की से पहले एक लड़के की प्रायिकता है
पहली लड़की से पहले दो लड़कों के होने की प्रायिकता है
और इसी तरह।
गुण
क्षण और संचयी
पहली सफलता प्राप्त करने के लिए स्वतंत्र परीक्षणों की संख्या के लिए अपेक्षित मूल्य, और ज्यामितीय रूप से वितरित यादृच्छिक चर X का प्रसरण है:
इसी प्रकार, ज्यामितीय रूप से वितरित यादृच्छिक चर Y = X - 1 का अपेक्षित मान और प्रसरण (वितरण की परिभाषा देखें ) है:
प्रमाण
अपेक्षित मान (1 − p)/p है जिसे निम्न तरीके से दिखाया जा सकता है। माना Y ऊपर जैसा है। तब
योग और विभेदन का आदान-प्रदान इस तथ्य से उचित है कि अभिसारी शक्ति श्रृंखला उन बिंदुओं के समुच्चय के कॉम्पैक्ट जगह सबसमुच्चय पर समान रूप से अभिसरण करती है जहाँ वे अभिसरण करते हैं।
मान लीजिए μ = (1 − p)/p Y का अपेक्षित मान है। फिर संचयी Y के संभाव्यता बंटन का पुनरावर्तन को संतुष्ट करता है
अपेक्षित मूल्य उदाहरण
E3) एक मरीज एक प्रत्यारोपण के लिए एक उपयुक्त किडनी डोनर की प्रतीक्षा कर रहा है। यदि यादृच्छिक रूप से चुने गए दाता के उपयुक्त मिलान होने की प्रायिकता p = 0.1 है, तो मेल खाने वाले दाता मिलने से पहले उन दानदाताओं की अपेक्षित संख्या क्या होगी जिनका परीक्षण किया जाएगा?
पी = 0.1 के साथ, पहली सफलता से पहले विफलताओं की औसत संख्या ई (वाई) = (1 - पी) / पी = (1 - 0.1) / 0.1 = 9 है।
वैकल्पिक सूत्रीकरण के लिए, जहां X पहली सफलता तक और इसमें शामिल परीक्षणों की संख्या है, अपेक्षित मान E(X) = 1/p = 1/0.1 = 10 है।
ऊपर उदाहरण 1 के लिए, p = 0.6 के साथ, पहली सफलता से पहले विफलताओं की औसत संख्या E(Y) = (1 - p)/p = (1 - 0.6)/0.6 = 0.67 है।
उच्च क्रम के क्षण
पहली सफलता से पहले विफलताओं की संख्या के लिए क्षण किसके द्वारा दिए गए हैं
कहाँ बहुलघुगणक है।
सामान्य गुण
- एक्स और वाई के प्रायिकता पैदा करने वाले कार्य क्रमशः हैं,
- इसके निरंतर अनुरूप (घातीय वितरण) की तरह, ज्यामितीय वितरण स्मृतिहीनता है। अर्थात्, निम्नलिखित प्रत्येक m और n के लिए लागू होता है।
- : {1, 2, 3, ...} पर समर्थित ज्यामितीय वितरण एकमात्र स्मृतिहीन असतत वितरण है। ध्यान दें कि {0, 1, 2, ...} पर समर्थित ज्यामितीय वितरण स्मृतिहीन नहीं है।
- {1, 2, 3, ... } पर समर्थित सभी असतत संभाव्यता वितरणों में दिए गए अपेक्षित मान μ के साथ, पैरामीटर p = 1/μ वाला ज्यामितीय वितरण X वह है जिसमें अधिकतम एंट्रॉपी प्रायिकता वितरण है।[2]
- पहली सफलता से पहले विफलताओं की संख्या Y का ज्यामितीय वितरण अनंत विभाज्यता (संभाव्यता) है, अर्थात, किसी भी सकारात्मक पूर्णांक n के लिए, स्वतंत्र रूप से वितरित यादृच्छिक चर Y मौजूद हैं1, ..., औरn जिसका योग वही वितरण है जो Y का है। इन्हें ज्यामितीय रूप से वितरित नहीं किया जाएगा जब तक कि n = 1; वे एक नकारात्मक द्विपद वितरण का पालन करते हैं।
- ज्यामितीय रूप से वितरित रैंडम वेरिएबल वाई के दशमलव अंक सांख्यिकीय स्वतंत्रता (और समान रूप से वितरित नहीं) रैंडम वैरिएबल का अनुक्रम हैं।[citation needed] उदाहरण के लिए, सैकड़ों अंक डी में यह संभाव्यता वितरण है:
- जहां q = 1 − p, और इसी तरह अन्य अंकों के लिए, और, अधिक सामान्यतः, इसी तरह 10 के अलावा अन्य आधारों वाले अंक प्रणालियों के लिए। जब आधार 2 होता है, तो यह दर्शाता है कि एक ज्यामितीय रूप से वितरित यादृच्छिक चर को योग के रूप में लिखा जा सकता है स्वतंत्र यादृच्छिक चरों का, जिनके प्रायिकता बंटन अविघटनीय बंटन हैं।
- गोलोम्ब कोडिंग इष्टतम उपसर्ग कोड है ज्यामितीय असतत वितरण के लिए।[3]
- दो स्वतंत्र भू(पी) वितरित यादृच्छिक चर का योग ज्यामितीय वितरण नहीं है। [1]
संबंधित वितरण
- ज्यामितीय बंटन Y ऋणात्मक द्विपद बंटन का एक विशेष मामला है, r = 1 के साथ। अधिक आम तौर पर, यदि Y1, ..., औरr पैरामीटर पी के साथ सांख्यिकीय स्वतंत्रता ज्यामितीय रूप से वितरित चर हैं, फिर योग
- पैरामीटर r और p के साथ एक नकारात्मक द्विपद बंटन का अनुसरण करता है।[4]
- ज्यामितीय वितरण असतत यौगिक प्वासों वितरण का एक विशेष मामला है।
- यदि वाई1, ..., औरr स्वतंत्र ज्यामितीय रूप से वितरित चर हैं (संभवतः विभिन्न सफलता मापदंडों के साथ pm), फिर उनका न्यूनतम
- पैरामीटर के साथ ज्यामितीय रूप से वितरित भी है [5]
- मान लीजिए 0 < r < 1, और k = 1, 2, 3, ... के लिए यादृच्छिक चर Xk अपेक्षित मूल्य आर के साथ पॉसॉन वितरण हैक</सुप>/क. तब
- अपेक्षित मान r/(1 − r) के साथ समुच्चय {0, 1, 2, ...} में मान लेने वाला ज्यामितीय वितरण है।[citation needed]
- चरघातांकी बंटन ज्यामितीय बंटन का सतत अनुरूप है। यदि X पैरामीटर λ वाला चरघातांकी रूप से वितरित यादृच्छिक चर है, तो
- कहाँ फर्श और छत के कार्य (या सबसे बड़ा पूर्णांक) फ़ंक्शन है, पैरामीटर p=1 − e के साथ ज्यामितीय रूप से वितरित यादृच्छिक चर है−λ (इस प्रकार λ = −ln(1 − p)[6]) और समुच्चय {0, 1, 2, ...} में मान लेना। इसका उपयोग पहले घातीय वितरण द्वारा ज्यामितीय रूप से वितरित छद्म यादृच्छिक संख्या उत्पन्न करने के लिए किया जा सकता है # एक समान छद्म यादृच्छिक संख्या जनरेटर से घातीय चर छद्म यादृच्छिक संख्या उत्पन्न करना: फिर ज्यामितीय रूप से पैरामीटर के साथ वितरित किया जाता है , अगर [0,1] में समान रूप से वितरित किया जाता है।
- यदि p = 1/n और X को ज्यामितीय रूप से पैरामीटर p के साथ वितरित किया जाता है, तो X/n का वितरण अपेक्षित मान 1 के साथ एक घातीय वितरण तक पहुँचता है जैसे कि n→ ∞, क्योंकि
अधिक आम तौर पर, यदि p = λ/n, जहां λ एक पैरामीटर है, तो n→ ∞ के रूप में X/n का वितरण दर λ के साथ एक घातीय वितरण तक पहुंचता है:
- इसलिए X/n का वितरण फलन अभिसरण करता है , जो एक घातीय यादृच्छिक चर का है।
सांख्यिकीय अनुमान
पैरामीटर अनुमान
ज्यामितीय वितरण के दोनों प्रकारों के लिए, नमूना माध्य के साथ अपेक्षित मान को समान करके पैरामीटर p का अनुमान लगाया जा सकता है। यह क्षणों (सांख्यिकी) की विधि है, जो इस मामले में पी के अधिकतम प्रायिकता अनुमान प्राप्त करने के लिए होता है।[7][8] विशेष रूप से, पहले प्रकार के लिए k = k दें1, ..., कn एक नमूना (सांख्यिकी) हो जहाँ ki≥ 1 फॉर आई = 1, ..., एन। तब p का अनुमान लगाया जा सकता है
बेयसियन अनुमान में, बीटा वितरण पैरामीटर पी के लिए संयुग्मित पूर्व वितरण है। यदि इस पैरामीटर को बीटा (α, β) पूर्व वितरण दिया जाता है, तो पश्च वितरण है
पश्च माध्य E [p] अधिकतम प्रायिकता अनुमान तक पहुंचता है जैसे-जैसे α और β शून्य की ओर बढ़ते हैं।
वैकल्पिक स्थिति में, मान लीजिए k1, ..., कn एक नमूना बनें जहां ki≥ 0 i के लिए = 1, ..., n। तब p का अनुमान लगाया जा सकता है
p का पिछला वितरण दिया गया एक बीटा(α, β) पूर्व है[9]
फिर से पश्च माध्य E[p] अधिकतम प्रायिकता अनुमान तक पहुंचता है जैसे-जैसे α और β शून्य की ओर बढ़ते हैं।
किसी भी अनुमान के लिए अधिकतम प्रायिकता का उपयोग करते हुए, पूर्वाग्रह के बराबर है
जो अधिकतम प्रायिकता अनुमान देता है#उच्च-क्रम गुण|पूर्वाग्रह-सही अधिकतम प्रायिकता अनुमानक
कम्प्यूटेशनल तरीके
=== आर === का उपयोग कर ज्यामितीय वितरण
आर (प्रोग्रामिंग भाषा) समारोह dgeom(k, prob)
इस प्रायिकता की गणना करता है कि पहली सफलता से पहले k विफलताएँ हैं, जहाँ तर्क prob प्रत्येक परीक्षण पर सफलता की प्रायिकता है।
उदाहरण के लिए,
dgeom(0,0.6) = 0.6
dgeom(1,0.6) = 0.24
आर सम्मेलन का उपयोग करता है कि के विफलताओं की संख्या है, ताकि पहली सफलता तक और परीक्षणों की संख्या के + 1 हो।
निम्नलिखित आर कोड पी = 0.6 के साथ वाई = 0 से 10 तक ज्यामितीय वितरण का ग्राफ बनाता है।
Y=0:10
plot(Y, dgeom(Y,0.6), type="h", ylim=c(0,1), main="Geometric distribution for p=0.6", ylab="Pr(Y=Y)", xlab="Y=Number of failures before first success")
एक्सेल का उपयोग करके ज्यामितीय वितरण
ज्यामितीय वितरण, पहली सफलता से पहले विफलताओं की संख्या के लिए, नकारात्मक द्विपद वितरण का एक विशेष मामला है, सफलताओं से पहले विफलताओं की संख्या के लिए।
एक्सेल समारोह NEGBINOMDIST(number_f, number_s, probability_s)
s = number_s सफलताओं से पहले k = number_f विफलताओं की प्रायिकता की गणना करता है जहाँ p = प्रायिकता_s प्रत्येक परीक्षण पर सफलता की प्रायिकता है। ज्यामितीय वितरण के लिए, number_s = 1 सफलता दें।
उदाहरण के लिए,
=NEGBINOMDIST(0, 1, 0.6)
= 0.6
=NEGBINOMDIST(1, 1, 0.6)
= 0.24
आर की तरह, एक्सेल सम्मेलन का उपयोग करता है कि के विफलताओं की संख्या है, ताकि पहली सफलता तक और परीक्षणों की संख्या के + 1 हो।
यह भी देखें
- हाइपरज्यामितीय वितरण
- कूपन संग्राहक की समस्या
- यौगिक पॉसों वितरण
- नकारात्मक द्विपद वितरण
संदर्भ
- ↑ 1.0 1.1 A modern introduction to probability and statistics : understanding why and how. Dekking, Michel, 1946-. London: Springer. 2005. pp. 48–50, 61–62, 152. ISBN 9781852338961. OCLC 262680588.
{{cite book}}
: CS1 maint: others (link) - ↑ Park, Sung Y.; Bera, Anil K. (June 2009). "अधिकतम एन्ट्रॉपी ऑटोरेग्रेसिव कंडीशनल हेटेरोस्केडैस्टिकिटी मॉडल". Journal of Econometrics. 150 (2): 219–230. doi:10.1016/j.jeconom.2008.12.014.
- ↑ Gallager, R.; van Voorhis, D. (March 1975). "ज्यामितीय रूप से वितरित पूर्णांक अक्षरों के लिए इष्टतम स्रोत कोड (संशोधित।)". IEEE Transactions on Information Theory. 21 (2): 228–230. doi:10.1109/TIT.1975.1055357. ISSN 0018-9448.
- ↑ Pitman, Jim. Probability (1993 edition). Springer Publishers. pp 372.
- ↑ Ciardo, Gianfranco; Leemis, Lawrence M.; Nicol, David (1 June 1995). "कम से कम स्वतंत्र ज्यामितीय रूप से वितरित यादृच्छिक चर". Statistics & Probability Letters (in English). 23 (4): 313–326. doi:10.1016/0167-7152(94)00130-Z. S2CID 1505801.
- ↑ "Wolfram-Alpha: Computational Knowledge Engine". www.wolframalpha.com.
- ↑ casella, george; berger, roger l (2002). सांख्यिकीय निष्कर्ष (2nd ed.). pp. 312–315. ISBN 0-534-24312-6.
- ↑ "MLE Examples: Exponential and Geometric Distributions Old Kiwi - Rhea". www.projectrhea.org. Retrieved 2019-11-17.
- ↑ "3. Conjugate families of distributions" (PDF). Archived (PDF) from the original on 2010-04-08.