सामान्य वितरण: Difference between revisions
No edit summary |
m (52 revisions imported from alpha:सामान्य_वितरण) |
||
(37 intermediate revisions by 2 users not shown) | |||
Line 1: | Line 1: | ||
{{Short description|Probability distribution}} | {{Short description|Probability distribution}} | ||
{{Redirect| | {{Redirect|बेल्ल वक्र}} | ||
{{Infobox probability distribution | {{Infobox probability distribution | ||
Line 16: | Line 16: | ||
गणित>\frac{1}{2}\बाएं[1 + \ऑपरेटरनाम{erf}\बाएं( \frac{x-\mu}{\sigma\sqrt{2}} | गणित>\frac{1}{2}\बाएं[1 + \ऑपरेटरनाम{erf}\बाएं( \frac{x-\mu}{\sigma\sqrt{2}} | ||
{{Probability fundamentals}} | {{Probability fundamentals}} | ||
सांख्यिकी में, एक '''सामान्य''' '''वितरण''' या गॉसियन वितरण वास्तविक मान यादृच्छिक चर के लिए [[निरंतर संभाव्यता वितरण|निरंतर प्रायिकता]] वितरण का एक प्रकार है और जबकि इसकी चर की प्रायिकता घनत्व फलन का सामान्य प्रकार है | |||
:<math> | :<math> | ||
f(x) = \frac{1}{\sigma \sqrt{2\pi} } e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2} | f(x) = \frac{1}{\sigma \sqrt{2\pi} } e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2} | ||
</math> | </math> | ||
पैरामीटर <math>\mu</math> वितरण का औसत माध्य [[अपेक्षित मूल्य|अपेक्षित मान]] | पैरामीटर <math>\mu</math> वितरण का औसत माध्य [[अपेक्षित मूल्य|अपेक्षित मान]] है और इसकी माध्यिका और मोड [[सांख्यिकी]] पद्धति है, जबकि पैरामीटर <math>\sigma</math> इसका [[मानक विचलन]] है और इस प्रकार वितरण का वेरिएंस <math>\sigma^2</math> के रूप में है, गाऊसी वितरण के साथ एक यादृच्छिक चर को सामान्य वितरण कहा जाता है और इसे सामान्य विचलन भी कहा जाता है। | ||
सामान्य वितरण आंकड़ों में महत्वपूर्ण होते हैं और अधिकांशतः [[प्राकृतिक विज्ञान]] और [[सामाजिक विज्ञान]] में वास्तविक-मान | सामान्य वितरण आंकड़ों में महत्वपूर्ण होते हैं और अधिकांशतः [[प्राकृतिक विज्ञान]] और [[सामाजिक विज्ञान]] में वास्तविक-मान वाले यादृच्छिक चर का प्रतिनिधित्व करने के लिए उपयोग किए जाते हैं जिनके वितरण ज्ञात नहीं होते हैं।<ref>[http://www.encyclopedia.com/topic/Normal_Distribution.aspx#3 ''Normal Distribution''], Gale Encyclopedia of Psychology</ref><ref>{{harvtxt |Casella |Berger |2001 |p=102 }}</ref> और इस प्रकार उनका महत्व आंशिक रूप से [[केंद्रीय सीमा प्रमेय]] के कारण होता है। इसमें कहा गया है कि, कुछ शर्तों के अनुसार परिमित माध्य और वेरिएंस के साथ एक यादृच्छिक चर के कई नमूनों टिप्पणियों का औसत स्वयं एक यादृच्छिक चर है, जिसका वितरण अभिसरण नमूने की संख्या बढ़ने पर सामान्य वितरण में होता है। इसलिए, भौतिक मात्राएँ जो कई स्वतंत्र प्रक्रियाओं का योग होने की आशंका की जाती हैं, जैसे [[माप त्रुटि]]यां, अधिकांशतः ऐसे वितरण होते हैं जो लगभग सामान्य रूप में होते है।<ref>Lyon, A. (2014). [https://aidanlyon.com/normal_distributions.pdf Why are Normal Distributions Normal?], The British Journal for the Philosophy of Science.</ref> | ||
इसके अतिरिक्त, गॉसियन वितरण में कुछ अद्वितीय गुण हैं जो विश्लेषणात्मक अध्ययनों के रूप में | इसके अतिरिक्त, गॉसियन वितरण में कुछ अद्वितीय गुण हैं जो विश्लेषणात्मक अध्ययनों के रूप में मान हैं। उदाहरण के लिए, सामान्य विचलन के निश्चित संग्रह का कोई भी रैखिक संयोजन एक सामान्य विचलन है। इस प्रकार कई परिणाम और विधियाँ, जैसे कि [[अनिश्चितता का प्रसार]] और कम से कम वर्ग पैरामीटर फिटिंग विश्लेषणात्मक रूप से स्पष्ट रूप से प्राप्त की जा सकती हैं जब प्रासंगिक चर सामान्य रूप से वितरित किए जाते हैं। | ||
एक सामान्य वितरण को कभी-कभी अनौपचारिक रूप से बेल कर्व कहा जाता है।<ref name=":1">{{Cite web|title=Normal Distribution|url=https://www.mathsisfun.com/data/standard-normal-distribution.html|access-date=2020-08-15|website=www.mathsisfun.com}}</ref> चूंकि, कई अन्य | एक सामान्य वितरण को कभी-कभी अनौपचारिक रूप से बेल कर्व कहा जाता है।<ref name=":1">{{Cite web|title=Normal Distribution|url=https://www.mathsisfun.com/data/standard-normal-distribution.html|access-date=2020-08-15|website=www.mathsisfun.com}}</ref> चूंकि, कई अन्य वितरण बेल के आकार के होते हैं, जैसे [[कॉची वितरण|कॉची]] छात्र का t-वितरण और [[रसद वितरण|लॉजिस्टिक]] वितरण इत्यादि के रूप में होते है। अन्य नामों के लिए नेमिंग देखते हैं। | ||
[[बहुभिन्नरूपी सामान्य वितरण| | [[बहुभिन्नरूपी सामान्य वितरण|बहुभिन्नरूपी सामान्य]] वितरण में सदिश के लिए और [[मैट्रिक्स सामान्य वितरण|आव्यूह सामान्य]] वितरण में मेट्रिसेस के लिए यूनीवेरिएट प्रायिकता वितरण सामान्यीकृत किया जाता है। | ||
== परिभाषाएँ == | == परिभाषाएँ == | ||
=== मानक सामान्य | === मानक सामान्य वितरण === | ||
सामान्य वितरण का सबसे सरल | सामान्य वितरण का सबसे सरल स्थिति मानक सामान्य वितरण या इकाई सामान्य वितरण के रूप में जाना जाता है। यह एक विशेष स्थिति है जब u = 0 और <math>\sigma=1</math> और इसे इस प्रायिकता घनत्व फलन (या घनत्व) द्वारा वर्णित किया गया है | ||
:<math>\varphi(z) = \frac{e^{-z^2/2}}{\sqrt{2\pi}}</math> | :<math>\varphi(z) = \frac{e^{-z^2/2}}{\sqrt{2\pi}}</math> | ||
चर z का माध्य 0 है और | चर z का माध्य 0 है और वेरिएंस और मानक विचलन घनत्व 1 है <math>\varphi(z)</math> इसका शीर्ष <math>1/\sqrt{2\pi}</math> पर <math>z=0</math> है और मोड़ बिंदु <math>z=+1</math> और <math>z=-1</math>.के रूप में है | ||
यद्यपि उपरोक्त घनत्व को सामान्यतः | यद्यपि उपरोक्त घनत्व को सामान्यतः सामान्य मानक के रूप में जाना जाता है, कुछ लेखकों ने उस शब्द का उपयोग सामान्य वितरण के अन्य संस्करणों का वर्णन करने के लिए किया है। उदाहरण के लिए, [[कार्ल फ्रेडरिक गॉस]] ने एक बार मानक को सामान्य के रूप में परिभाषित किया था | ||
:<math>\varphi(z) = \frac{e^{-z^2}}{\sqrt\pi}</math> | :<math>\varphi(z) = \frac{e^{-z^2}}{\sqrt\pi}</math> | ||
जिसमें 1/2 का | जिसमें 1/2 का वेरिएंस होता है और स्टीफन स्टिगलर<ref>{{harvtxt |Stigler |1982 }}</ref> एक बार मानक सामान्य के रूप में परिभाषित किया गया है | ||
:<math> \varphi(z) = e^{-\pi z^2}</math> | :<math> \varphi(z) = e^{-\pi z^2}</math> | ||
जिसका एक सरल फलन ात्मक रूप और | जिसका एक सरल फलन ात्मक रूप और <math>\sigma^2 = 1/(2\pi)</math> एक वेरिएंस है | ||
=== सामान्य | === सामान्य वितरण === | ||
प्रत्येक सामान्य वितरण मानक सामान्य वितरण का एक संस्करण है, जिसका डोमेन एक कारक | प्रत्येक सामान्य वितरण मानक सामान्य वितरण का एक संस्करण है, जिसका डोमेन एक कारक <math>\sigma</math> मानक विचलन द्वारा बढ़ाया गया है और फिर <math>\mu</math> द्वारा औसत मान का अनुवाद किया गया है: | ||
:<math> | :<math> | ||
f(x \mid \mu, \sigma^2) =\frac 1 \sigma \varphi\left(\frac{x-\mu} \sigma \right) | f(x \mid \mu, \sigma^2) =\frac 1 \sigma \varphi\left(\frac{x-\mu} \sigma \right) | ||
</math> | </math> | ||
प्रायिकता | प्रायिकता घनत्व <math>1/\sigma</math> द्वारा स्केल किया जाना चाहिए जिससे की समाकलन 1 के रूप में होता है। | ||
यदि <math>Z</math> एक [[मानक सामान्य विचलन]] के रूप में है, तो <math>X=\sigma Z + \mu</math> अपेक्षित मान | यदि <math>Z</math> एक [[मानक सामान्य विचलन]] के रूप में है, तो <math>X=\sigma Z + \mu</math> अपेक्षित मान के साथ एक सामान्य वितरण होता है <math>\mu</math> और मानक विचलन <math>\sigma</math>. के बराबर है और मानक सामान्य वितरण <math>Z</math> के एक कारक द्वारा विस्तारित किया जा सकता है और इस प्रकार <math>\sigma</math> द्वारा स्थानांतरित किया जाता है, एक भिन्न सामान्य वितरण प्राप्त करने के लिए <math>\mu</math> द्वारा स्थानांतरित किया जा सकता है, जिसे <math>X</math> कहा जाता है. इसके विपरीत यदि <math>X</math> पैरामीटर के साथ एक सामान्य विचलन <math>\mu</math> और <math>\sigma^2</math> के रूप में है फिर यह <math>X</math> वितरण को फिर से बढ़ाया जा सकता है और सूत्र के माध्यम से स्थानांतरित किया जा सकता है <math>Z=(X-\mu)/\sigma</math> इसे मानक सामान्य वितरण में बदलने के लिए इस चर को <math>X</math> का मानकीकृत रूप भी कहा जाता है. | ||
=== अंकन === | === अंकन === | ||
मानक गाऊसी वितरण की प्रायिकता घनत्व को अधिकांशतः ग्रीक अक्षर | मानक गाऊसी वितरण की प्रायिकता घनत्व को अधिकांशतः ग्रीक अक्षर <math>\phi</math> से निरूपित किया जाता है, इस प्रकार मानक सामान्य वितरण शून्य माध्य और इकाई प्रसरण के साथकिया जा सकता है।<ref>{{harvtxt |Halperin |Hartley |Hoel |1965 |loc=item 7 }}</ref> ग्रीक अक्षर फी का वैकल्पिक रूप, <math>\varphi</math>, भी अधिकांशतः प्रयोग किया जाता है। | ||
सामान्य वितरण को अधिकांशतः | सामान्य वितरण को अधिकांशतः <math>N(\mu,\sigma^2)</math> या <math>\mathcal{N}(\mu,\sigma^2)</math> कहा जाता है.<ref>{{harvtxt |McPherson |1990 |p=110 }}</ref> इस प्रकार जब एक यादृच्छिक चर <math>X</math> सामान्य रूप से माध्य <math>\mu</math> और मानक विचलन <math>\sigma</math>, के साथ वितरित किया जाता है, तो कोई | ||
:<math>X \sim \mathcal{N}(\mu,\sigma^2).</math> लिख सकता है | :<math>X \sim \mathcal{N}(\mu,\sigma^2).</math> लिख सकता है | ||
=== वैकल्पिक मानकीकरण === | === वैकल्पिक मानकीकरण === | ||
कुछ लेखक विचलन | कुछ लेखक विचलन <math>\sigma</math> या वेरिएंस <math>\sigma^2</math> के अतिरिक्त वितरण की चौड़ाई को परिभाषित करने वाले पैरामीटर के रूप में अच्छे <math>\tau</math> का उपयोग करने की वकालत करते हैं और इस प्रकार परिशुद्धता को सामान्यतः वेरिएंस <math>1/\sigma^2</math> के व्युत्क्रम के रूप में परिभाषित किया जाता है,<ref>{{harvtxt |Bernardo |Smith |2000 |page=121 }}</ref> तब इस प्रकार वितरण का सूत्र बन जाता है, | ||
:<math>f(x) = \sqrt{\frac\tau{2\pi}} e^{-\tau(x-\mu)^2/2}.</math> | :<math>f(x) = \sqrt{\frac\tau{2\pi}} e^{-\tau(x-\mu)^2/2}.</math> | ||
इस विकल्प का संख्यात्मक संगणना में लाभ होने का दावा किया जाता है <math>\sigma</math> शून्य के बहुत निकटतम होता है और कुछ संदर्भों में सूत्रों को सरल करता है, जैसे | इस विकल्प का संख्यात्मक संगणना में लाभ होने का दावा किया जाता है <math>\sigma</math> शून्य के बहुत निकटतम होता है और कुछ संदर्भों में सूत्रों को सरल करता है, जैसे बहुभिन्नरूपी सामान्य वितरण वाले चर के बायेसियन आंकड़ों में करते हैं। | ||
वैकल्पिक रूप से, मानक विचलन का व्युत्क्रम <math>\tau^\prime=1/\sigma</math> परिशुद्धता के रूप में परिभाषित किया जा सकता है, जिस स्थिति में सामान्य वितरण की अभिव्यक्ति बन जाती है | वैकल्पिक रूप से, मानक विचलन का व्युत्क्रम <math>\tau^\prime=1/\sigma</math> परिशुद्धता के रूप में परिभाषित किया जा सकता है, जिस स्थिति में सामान्य वितरण की अभिव्यक्ति बन जाती है | ||
Line 71: | Line 71: | ||
स्टिगलर के अनुसार, यह सूत्रीकरण बहुत सरल और याद रखने में आसान सूत्र और वितरण की [[मात्राओं]] के लिए सरल अनुमानित सूत्रों के कारण लाभप्रद है। | स्टिगलर के अनुसार, यह सूत्रीकरण बहुत सरल और याद रखने में आसान सूत्र और वितरण की [[मात्राओं]] के लिए सरल अनुमानित सूत्रों के कारण लाभप्रद है। | ||
सामान्य वितरण प्राकृतिक | सामान्य वितरण प्राकृतिक <math> \textstyle\theta_1=\frac{\mu}{\sigma^2}</math> और <math>\textstyle\theta_2=\frac{-1}{2\sigma^2}</math>, पैरामीटर और प्राकृतिक सांख्यिकी x और x<sup>2 के साथ एक चरघातांकी फॅमिली बनाते हैं। सामान्य वितरण के लिए दोहरी अपेक्षा पैरामीटर {{nowrap|1=''η''<sub>1</sub> = ''μ''}} और {{nowrap|1=''η''<sub>2</sub> = ''μ''<sup>2</sup> + ''σ''<sup>2</sup>}}.के रूप में होते है, | ||
=== [[संचयी वितरण कार्य|संचयी वितरण फलन]] === | === [[संचयी वितरण कार्य|संचयी वितरण फलन]] === | ||
मानक सामान्य वितरण का संचयी वितरण फलन (सीडीएफ), सामान्यतः | मानक सामान्य वितरण का संचयी वितरण फलन (सीडीएफ), सामान्यतः बड़े ग्रीक अक्षर <math>\Phi</math> फाई से दर्शाया जाता है, जो अभिन्न रूप में है | ||
:<math>\Phi(x) = \frac 1 {\sqrt{2\pi}} \int_{-\infty}^x e^{-t^2/2} \, dt</math> | :<math>\Phi(x) = \frac 1 {\sqrt{2\pi}} \int_{-\infty}^x e^{-t^2/2} \, dt</math> | ||
संबंधित [[त्रुटि समारोह|त्रुटि फलन]] | संबंधित [[त्रुटि समारोह|त्रुटि फलन]] <math>\operatorname{erf}(x)</math> एक यादृच्छिक चर की प्रायिकता देता है, इस प्रकार माध्य 0 के सामान्य वितरण के साथ और भिन्नता 1/2 सीमा में गिरती है <math>[-x, x]</math>. इस प्रकार है: | ||
:<math>\operatorname{erf}(x) = \frac 2 {\sqrt\pi} \int_0^x e^{-t^2} \, dt</math> | :<math>\operatorname{erf}(x) = \frac 2 {\sqrt\pi} \int_0^x e^{-t^2} \, dt</math> | ||
इन समाकलन को प्रारंभिक फलन | इन समाकलन को प्रारंभिक फलन के संदर्भ में व्यक्त नहीं किया जा सकता है और अधिकांशतः इन्हें विशेष फलन कहा जाता है। चूंकि, कई संख्यात्मक सन्निकटन ज्ञात हैं और इस प्रकार अधिक के लिए सामान्य सीडीएफ और सामान्य क्वांटाइल फलन के लिए संख्यात्मक सन्निकटन देखें। | ||
दो फलन निकट सेसंबंधित हैं, अर्थात् | दो फलन निकट सेसंबंधित हैं, अर्थात् | ||
Line 89: | Line 89: | ||
F(x) = \Phi\left(\frac{x-\mu} \sigma \right) = \frac{1}{2} \left[1 + \operatorname{erf}\left(\frac{x-\mu}{\sigma \sqrt 2 }\right)\right] | F(x) = \Phi\left(\frac{x-\mu} \sigma \right) = \frac{1}{2} \left[1 + \operatorname{erf}\left(\frac{x-\mu}{\sigma \sqrt 2 }\right)\right] | ||
</math> | </math> | ||
मानक सामान्य सीडीएफ का पूरक, <math>Q(x) = 1 - \Phi(x)</math>, अधिकांशतः [[Q]] [[क्यू समारोह|फलन]] | मानक सामान्य सीडीएफ का पूरक, <math>Q(x) = 1 - \Phi(x)</math>, अधिकांशतः [[Q]] [[क्यू समारोह|फलन]] कहा जाता है, विशेष रूप से इंजीनियरिंग टेक्स्ट में,<ref>{{cite web|url=http://cnx.org/content/m11537/1.2/|last1=Scott|first1=Clayton|first2=Robert|last2=Nowak|title=The Q-function|work=Connexions|date=August 7, 2003}}</ref><ref>{{cite web|url=http://www.eng.tau.ac.il/~jo/academic/Q.pdf|last=Barak|first=Ohad|title=Q Function and Error Function|publisher=Tel Aviv University|date=April 6, 2006|url-status=dead|archive-url=https://web.archive.org/web/20090325160012/http://www.eng.tau.ac.il/~jo/academic/Q.pdf|archive-date=March 25, 2009|df=mdy-all}}</ref> यह प्रायिकता देता है कि एक मानक सामान्य यादृच्छिक चर का मान <math>X</math> के रूप में अधिक हो जाता है <math>x</math>: <math>P(X>x)</math>. की अन्य परिभाषाएँ <math>Q</math>-फलन जिनमें से सभी सरल रूपांतरण हैं <math>\Phi</math>, का भी कभी-कभी उपयोग किया जाता है।<ref>{{MathWorld |urlname=NormalDistributionFunction |title=Normal Distribution Function }}</ref> | ||
मानक सामान्य सीडीएफ के [[एक समारोह का ग्राफ|एक फलन | मानक सामान्य सीडीएफ के [[एक समारोह का ग्राफ|एक फलन का ग्राफ]] <math>\Phi</math> बिंदु (0,1/2) के चारों ओर 2 गुना [[घूर्णी समरूपता]] है; वह है, <math>\Phi(-x) = 1 - \Phi(x)</math>. इसका प्रतिपक्षी (अनिश्चितकालीन अभिन्न) निम्नानुसार व्यक्त किया जा सकता है, | ||
:<math>\int \Phi(x)\, dx = x\Phi(x) + \varphi(x) + C.</math> | :<math>\int \Phi(x)\, dx = x\Phi(x) + \varphi(x) + C.</math> | ||
मानक सामान्य वितरण के सीडीएफ को एक श्रृंखला में [[भागों द्वारा एकीकरण]] द्वारा विस्तारित किया जा सकता है, | मानक सामान्य वितरण के सीडीएफ को एक श्रृंखला में [[भागों द्वारा एकीकरण]] द्वारा विस्तारित किया जा सकता है, | ||
:<math>\Phi(x)=\frac{1}{2} + \frac{1}{\sqrt{2\pi}}\cdot e^{-x^2/2} \left[x + \frac{x^3}{3} + \frac{x^5}{3\cdot 5} + \cdots + \frac{x^{2n+1}}{(2n+1)!!} + \cdots\right]</math> | :<math>\Phi(x)=\frac{1}{2} + \frac{1}{\sqrt{2\pi}}\cdot e^{-x^2/2} \left[x + \frac{x^3}{3} + \frac{x^5}{3\cdot 5} + \cdots + \frac{x^{2n+1}}{(2n+1)!!} + \cdots\right]</math> | ||
जहाँ | जहाँ <math>!!</math> [[डबल फैक्टोरियल|डबल क्रमगुणित]] को दर्शाता है। | ||
बड़े x के लिए सीडीएफ का एक [[स्पर्शोन्मुख विस्तार|ऐसिम्टाटिक विस्तार]] द्वारा एकीकरण का उपयोग करके प्राप्त किया जा सकता है और इस प्रकार अधिक जानकारी के लिए, | बड़े x के लिए सीडीएफ का एक [[स्पर्शोन्मुख विस्तार|ऐसिम्टाटिक विस्तार]] द्वारा एकीकरण का उपयोग करके प्राप्त किया जा सकता है और इस प्रकार अधिक जानकारी के लिए, त्रुष्टि फलन #एसिम्प्टोटिक विस्तार देखते है।<ref>{{AS ref|26, eqn 26.2.12|932}}</ref> | ||
टेलर श्रृंखला सन्निकटन का उपयोग करके मानक सामान्य वितरण सीडीएफ के लिए एक त्वरित सन्निकटनके रूप में पाये जाते है, | टेलर श्रृंखला सन्निकटन का उपयोग करके मानक सामान्य वितरण सीडीएफ के लिए एक त्वरित सन्निकटनके रूप में पाये जाते है, | ||
Line 108: | Line 108: | ||
==== मानक विचलन और कवरेज ==== | ==== मानक विचलन और कवरेज ==== | ||
{{Further|अंतराल अनुमान|कवरेज प्रायिकता}} | {{Further|अंतराल अनुमान|कवरेज प्रायिकता}} | ||
[[File:Standard deviation diagram.svg|thumb|350px|सामान्य वितरण के लिए, | [[File:Standard deviation diagram.svg|thumb|350px|सामान्य वितरण के लिए, माध्य से एक मानक विचलन से कम दूरी का मान सेट का 68.27% होता है जबकि माध्य से दो मानक विचलन 95.45% और तीन मानक विचलन 99.73% होता है।]]एक सामान्य वितरण से निकाले गए लगभग 68% मान एक मानक विचलन σ माध्य से दूर होते हैं और इस प्रकार लगभग 95% मान दो मानक विचलन के भीतर होते हैं और लगभग 99.7% तीन मानक विचलन के भीतर होते हैं।<ref name=":1" /> इस तथ्य को 68–95–99.7 एम्पिरिकल नियम या 3-सिग्मा नियम के रूप में जाना जाता है। | ||
अधिक अच्छे रूप से, एक सामान्य विचलन के बीच की सीमा में होने की | अधिक अच्छे रूप से, एक सामान्य विचलन के बीच की सीमा में होने की प्रायिकता <math>\mu-n\sigma</math> और <math>\mu+n\sigma</math> द्वारा दिया गया है | ||
:<math> | :<math> | ||
F(\mu+n\sigma) - F(\mu-n\sigma) = \Phi(n)-\Phi(-n) = \operatorname{erf} \left(\frac{n}{\sqrt{2}}\right). | F(\mu+n\sigma) - F(\mu-n\sigma) = \Phi(n)-\Phi(-n) = \operatorname{erf} \left(\frac{n}{\sqrt{2}}\right). | ||
Line 159: | Line 159: | ||
{{Further|क्वांटाइल फ़ंक्शन # सामान्य वितरण}} | {{Further|क्वांटाइल फ़ंक्शन # सामान्य वितरण}} | ||
किसी वितरण का क्वांटाइल | किसी वितरण का क्वांटाइल फलन संचयी वितरण फलन का व्युत्क्रम होता है। मानक सामान्य वितरण के [[मात्रात्मक समारोह|क्वांटाइल फलन]] को [[प्रोबिट फ़ंक्शन|प्रोबिट फलन]] कहा जाता है और इसे व्युत्क्रम त्रुटि फलन के रूप में संदर्भ में व्यक्त किया जा सकता है, | ||
:<math> | :<math> | ||
\Phi^{-1}(p) = \sqrt2\operatorname{erf}^{-1}(2p - 1), \quad p\in(0,1). | \Phi^{-1}(p) = \sqrt2\operatorname{erf}^{-1}(2p - 1), \quad p\in(0,1). | ||
</math> | </math> | ||
औसत के साथ एक सामान्य यादृच्छिक चर के लिए <math>\mu</math> और | औसत के साथ एक सामान्य यादृच्छिक चर के लिए <math>\mu</math> और वेरिएंस <math>\sigma^2</math>क्वांटाइल फलन के रूप में है | ||
:<math> | :<math> | ||
F^{-1}(p) = \mu + \sigma\Phi^{-1}(p) | F^{-1}(p) = \mu + \sigma\Phi^{-1}(p) | ||
= \mu + \sigma\sqrt 2 \operatorname{erf}^{-1}(2p - 1), \quad p\in(0,1). | = \mu + \sigma\sqrt 2 \operatorname{erf}^{-1}(2p - 1), \quad p\in(0,1). | ||
</math> | </math> | ||
क्वांटाइल <math>\Phi^{-1}(p)</math> मानक सामान्य वितरण का सामान्य रूप से निरूपित किया जाता है <math>z_p</math>. इन मानों | क्वांटाइल <math>\Phi^{-1}(p)</math> मानक सामान्य वितरण का सामान्य रूप से निरूपित किया जाता है <math>z_p</math>. इन मानों का उपयोग [[परिकल्पना परीक्षण|परिकल्पना]] टेस्ट्स , [[विश्वास अंतराल|कॉन्फिडेंस अंतराल]] के निर्माण और Q-Q प्लॉट में किया जाता है। एक सामान्य यादृच्छिक चर <math>X</math> अधिक हो जाता है, इस प्रकार <math>\mu + z_p\sigma</math> प्रायिकता के साथ <math>1-p</math> अंतराल के बाहर होता है <math>\mu \pm z_p\sigma</math> प्रायिकता के साथ <math>2(1-p)</math>. विशेष रूप से, क्वांटाइल <math>z_{0.975}</math> 1.96 है; इसलिए केवल 5% स्थितियो में एक सामान्य यादृच्छिक चर अंतराल <math>\mu \pm 1.96\sigma</math> के बाहर होता है। | ||
निम्न तालिका क्वांटाइल <math>z_p</math> इस प्रकार देती है कि <math>X</math>एक निर्दिष्ट प्रायिकता | निम्न तालिका क्वांटाइल <math>z_p</math> इस प्रकार देती है कि <math>X</math>एक निर्दिष्ट प्रायिकता <math>p</math>. के साथ श्रेणी <math>\mu \pm z_p\sigma</math> के रूप में निर्दिष्ट होता है, ये मान नमूना औसत और ऐसिम्टाटिक रूप से सामान्य वितरण वाले अन्य सांख्यिकीय अनुमानकों के लिए टॉलरेंस अंतराल निर्धारित करने के लिए उपयोगी होते है। ध्यान दें कि निम्न तालिका दिखाती है <math>\sqrt 2 \operatorname{erf}^{-1}(p)=\Phi^{-1}\left(\frac{p+1}{2}\right)</math>, नहीं <math>\Phi^{-1}(p)</math> जैसा कि ऊपर परिभाषित किया गया है। | ||
{| class="wikitable" style="text-align:left;margin-left:24pt;border:none;background:none;" | {| class="wikitable" style="text-align:left;margin-left:24pt;border:none;background:none;" | ||
Line 191: | Line 191: | ||
| 0.998 || {{val|3.090232306168}} || 0.999999999 || {{val|6.109410204869}} | | 0.998 || {{val|3.090232306168}} || 0.999999999 || {{val|6.109410204869}} | ||
|} | |} | ||
छोटे के लिए <math>p</math>, क्वांटाइल फलन | छोटे के लिए <math>p</math>, क्वांटाइल फलन में उपयोगी ऐसिम्टाटिक विस्तार के रूप में होते है | ||
<math>\Phi^{-1}(p)=-\sqrt{\ln\frac{1}{p^2}-\ln\ln\frac{1}{p^2}-\ln(2\pi)}+\mathcal{o}(1).</math><ref>Reference needed</ref> | <math>\Phi^{-1}(p)=-\sqrt{\ln\frac{1}{p^2}-\ln\ln\frac{1}{p^2}-\ln(2\pi)}+\mathcal{o}(1).</math><ref>Reference needed</ref> | ||
== गुण == | == गुण == | ||
सामान्य वितरण ही एकमात्र ऐसा वितरण है जिसके पहले दो से परे [[संचयी]] शून्य होते हैं। अर्थात् माध्य और प्रसरण के अतिरिक्त यह निर्दिष्ट माध्य और | सामान्य वितरण ही एकमात्र ऐसा वितरण है जिसके पहले दो से परे [[संचयी]] शून्य होते हैं। अर्थात् माध्य और प्रसरण के अतिरिक्त यह निर्दिष्ट माध्य और वेरिएंस के लिए [[अधिकतम एन्ट्रापी संभाव्यता वितरण|अधिकतम एन्ट्रापी प्रायिकता]] वितरण के साथ निरंतर वितरण है।<ref>{{cite book|last=Cover|first=Thomas M.|author2=Thomas, Joy A.|year=2006|title=Elements of Information Theory|url=https://archive.org/details/elementsinformat00cove|url-access=limited|publisher=John Wiley and Sons|page=[https://archive.org/details/elementsinformat00cove/page/n279 254]|isbn=9780471748816}}</ref><ref>{{cite journal|last1=Park|first1=Sung Y.|last2=Bera|first2=Anil K.|year=2009|title=Maximum Entropy Autoregressive Conditional Heteroskedasticity Model|journal=Journal of Econometrics|pages=219–230|url=http://www.wise.xmu.edu.cn/Master/Download/..%5C..%5CUploadFiles%5Cpaper-masterdownload%5C2009519932327055475115776.pdf|access-date=2011-06-02|doi=10.1016/j.jeconom.2008.12.014|volume=150|issue=2|citeseerx=10.1.1.511.9750|archive-date=March 7, 2016|archive-url=https://web.archive.org/web/20160307144515/http://wise.xmu.edu.cn/uploadfiles/paper-masterdownload/2009519932327055475115776.pdf|url-status=dead}}</ref> गीरी ने मानते हुए यह दिखाया है कि माध्य और वेरिएंस परिमित रूप में होते है और सामान्य वितरण ही एकमात्र वितरण है जहां स्वतंत्र ड्रा के समुच्चय से गणना की गई माध्य और वेरिएंस एक दूसरे से स्वतंत्र हैं।<ref name=Geary1936>Geary RC(1936) The distribution of the "Student's" ratio for the non-normal samples". Supplement to the Journal of the Royal Statistical Society 3 (2): 178–184</ref><ref>{{Cite Q|Q55897617|author1=Lukacs, Eugene|author-link1=Eugene Lukacs}}</ref> | ||
सामान्य वितरण | सामान्य वितरण [[अण्डाकार वितरण|दीर्घवृत्ताकार]] वितरण का एक उपवर्ग है। सामान्य वितरण अपने माध्य के बारे में सममित वितरण है और संपूर्ण वास्तविक रेखा पर गैर-शून्य है। जैसे कि यह उन चरों के लिए उपयुक्त मॉडल नहीं हो सकता है जो स्वाभाविक रूप से धनात्मक या दृढ़ता से विषम हैं, जैसे किसी व्यक्ति का वजन या [[शेयर (वित्त)]] की कीमत इत्यादि। ऐसे चरों को अन्य वितरण द्वारा अच्छे से वर्णित किया जा सकता है, जैसे [[लॉग-सामान्य वितरण|लॉग-सामान्य]] वितरण या पारेटो वितरण इत्यादि। | ||
सामान्य वितरण का मान व्यावहारिक रूप से शून्य होता है जब मान <math>x</math> माध्य से कुछ मानक विचलनों से अधिक दूर स्थित होता है, उदाहरण के लिए, तीन मानक विचलनों का प्रसार कुल वितरण के 0.27% को छोड़कर सभी को कवर करता है। इसलिए, यह एक उपयुक्त मॉडल नहीं हो सकता है जब कोई [[आउटलेर्स]] मानों के एक महत्वपूर्ण | सामान्य वितरण का मान व्यावहारिक रूप से शून्य होता है जब मान <math>x</math> माध्य से कुछ मानक विचलनों से अधिक दूर स्थित होता है, उदाहरण के लिए, तीन मानक विचलनों का प्रसार कुल वितरण के 0.27% को छोड़कर सभी को कवर करता है। इसलिए, यह एक उपयुक्त मॉडल नहीं हो सकता है जब कोई [[आउटलेर्स]] मानों के एक महत्वपूर्ण भिन्न की अपेक्षा करता है जो कई मानक विचलन को माध्य से दूर करते हैं और कम से कम वर्ग और अन्य सांख्यिकीय अनुमान विधियां जो सामान्य रूप से वितरित चर के लिए इष्टतम हैं, ऐसे डेटा के लिए अधिकांशतः इस प्रकार प्रयुक्त होने पर अत्यधिक अविश्वसनीय हो जाती हैं। उन स्थितियो में, अधिक भारी टेल्ड वाले वितरण की कल्पना की जानी चाहिए और उचित मजबूत सांख्यिकीय अनुमान विधियों को प्रयुक्त किया जाना चाहिए। | ||
गॉसियन वितरण [[स्थिर वितरण|स्टेबल]] वितरण के फॅमिली से संबंधित है, जो स्वतंत्र और समान रूप से वितरित यादृच्छिक चर के योगों के आकर्षण हैं | इस प्रकार स्वतंत्र, समान रूप से वितरित वितरण माध्य या | गॉसियन वितरण [[स्थिर वितरण|स्टेबल]] वितरण के फॅमिली से संबंधित है, जो स्वतंत्र और समान रूप से वितरित यादृच्छिक चर के योगों के आकर्षण हैं | इस प्रकार स्वतंत्र, समान रूप से वितरित वितरण माध्य या वेरिएंस परिमित होते है या नहीं। गॉसियन को छोड़कर जो एक सीमित स्थिति में सभी स्टेबल वितरण में [[भारी पूंछ|भारी टेल्ड]] और अनंत वेरिएंस होता है। यह उन कुछ वितरण में से एक है जो स्टेबल हैं और जिनमें प्रायिकता घनत्व फलन के रूप में हैं, जिन्हें विश्लेषणात्मक रूप से व्यक्त किया जा सकता है, अन्य कॉची वितरण और लेवी वितरण हैं। | ||
=== समरूपता और डेरिवेटिव === | === समरूपता और डेरिवेटिव === | ||
घनत्व के साथ सामान्य वितरण <math>f(x)</math> (अर्थ <math>\mu</math> और मानक विचलन <math>\sigma > 0</math>) के निम्नलिखित गुण हैं | घनत्व के साथ सामान्य वितरण <math>f(x)</math> (अर्थ <math>\mu</math> और मानक विचलन <math>\sigma > 0</math>) के निम्नलिखित गुण हैं | ||
* यह बिंदु <math>x=\mu,</math> के चारों ओर सममित है, जो एक ही समय में बहुलक सांख्यिकी, माध्यिका और वितरण का माध्य है।<ref name="PR2.1.4">{{harvtxt |Patel |Read |1996 |loc=[2.1.4] }}</ref> | * यह बिंदु <math>x=\mu,</math> के चारों ओर सममित है, जो एक ही समय में बहुलक सांख्यिकी, माध्यिका और वितरण का माध्य है।<ref name="PR2.1.4">{{harvtxt |Patel |Read |1996 |loc=[2.1.4] }}</ref> | ||
* यह अनिमॉडल है इसका पहला [[यौगिक]] | * यह अनिमॉडल है इसका पहला [[यौगिक]] <math>x<\mu,</math> के लिए धनात्मक है और <math>x>\mu,</math> के लिए ऋणात्मक और <math>x=\mu.</math>पर केवल शून्य के रूप में है | ||
* वक्र और x-अक्ष से घिरा क्षेत्र इकाई है अर्थात एक के बराबर है। | * वक्र और x-अक्ष से घिरा क्षेत्र इकाई है अर्थात एक के बराबर है। | ||
* इसकी पहली अवकलज | * इसकी पहली अवकलज <math>f^\prime(x)=-\frac{x-\mu}{\sigma^2} f(x).</math>के रूप में है | ||
* इसके घनत्व में दो विभक्ति बिंदु होते हैं जहाँ दूसरा अवकलज होता है <math>f</math> शून्य है और चिह्न बदलता है, इसका अर्थ | * इसके घनत्व में दो विभक्ति बिंदु होते हैं जहाँ दूसरा अवकलज होता है <math>f</math> शून्य है और चिह्न बदलता है, इसका अर्थ एक मानक विचलन दूर स्थित है, अर्थात् <math>x=\mu-\sigma</math> और <math>x=\mu+\sigma.</math><ref name="PR2.1.4" /> | ||
*इसका घनत्व [[लघुगणकीय रूप से अवतल कार्य|लघुगणकीय रूप से अवतल फलन]] | *इसका घनत्व [[लघुगणकीय रूप से अवतल कार्य|लघुगणकीय रूप से अवतल फलन]] है।<ref name="PR2.1.4" /> | ||
**इसका घनत्व असीम रूप से भिन्न फलन | **इसका घनत्व असीम रूप से भिन्न फलन है, वास्तव में ऑर्डर 2 का सुपरस्मूथ है।<ref>{{harvtxt |Fan |1991 |p=1258 }}</ref> | ||
इसके अतिरिक्त | इसके अतिरिक्त घनत्व <math>\varphi</math> मानक सामान्य वितरण में निम्नलिखित गुण भी हैं, अर्थात <math>\mu=0</math> और <math>\sigma=1</math>) | ||
* इसकी पहली अवकलज | * इसकी पहली अवकलज है <math>\varphi^\prime(x)=-x\varphi(x).</math> | ||
* इसका दूसरा अवकलज है <math>\varphi^{\prime\prime}(x)=(x^2-1)\varphi(x)</math> | * इसका दूसरा अवकलज है <math>\varphi^{\prime\prime}(x)=(x^2-1)\varphi(x)</math> | ||
* अधिक सामान्यतः, इसकी {{mvar|n}}वें अवकलज है <math>\varphi^{(n)}(x) = (-1)^n\operatorname{He}_n(x)\varphi(x),</math> जहाँ | * अधिक सामान्यतः, इसकी {{mvar|n}}वें अवकलज है <math>\varphi^{(n)}(x) = (-1)^n\operatorname{He}_n(x)\varphi(x),</math> जहाँ <math>\operatorname{He}_n(x)</math>{{mvar|n}}(प्रायिकतात्मक ) हर्मिट बहुपद है।<ref>{{harvtxt |Patel |Read |1996 |loc=[2.1.8] }}</ref> | ||
* प्रायिकता है कि एक सामान्य रूप से वितरित चर <math>X</math> ज्ञात के साथ <math>\mu</math> और <math>\sigma</math> एक विशेष | * प्रायिकता है कि एक सामान्य रूप से वितरित चर <math>X</math> ज्ञात के साथ <math>\mu</math> और <math>\sigma</math> एक विशेष समुच्चय में है, इस तथ्य का उपयोग करके गणना की जा सकती है कि भिन्न <math>Z = (X-\mu)/\sigma</math> एक मानक सामान्य वितरण है। | ||
=== मोमेंट === | === मोमेंट === | ||
{{See also|गाऊसी फलन के समाकलन की सूची}} | {{See also|गाऊसी फलन के समाकलन की सूची}} | ||
चर | चर <math>X</math> के अपेक्षित मान का प्लैन और निरपेक्ष मोमेंट <math>X^p</math> और <math>|X|^p</math> गणित के रूप में होते है। यदि अपेक्षित मान <math>\mu</math> का <math>X</math> शून्य है, इन पैरामीटर को केंद्रीय मोमेंट कहा जाता है; अन्यथा इन पैरामीटर को गैर-केंद्रीय मोमेंट कहा जाता है। सामान्यतः हम केवल पूर्णांक क्रम वाले मोमेंट <math>\ p</math>.में रुचि रखते हैं | ||
यदि <math>X</math> एक सामान्य वितरण है, गैर-केंद्रीय मोमेंट के रूप में उपस्थित हैं और किसी | यदि <math>X</math> एक सामान्य वितरण है, गैर-केंद्रीय मोमेंट के रूप में उपस्थित हैं और किसी <math>p</math> के लिए परिमित हैं जिसका वास्तविक भाग −1 से बड़ा है। किसी भी गैर-ऋणात्मक पूर्णांक <math>p</math> के लिए प्लैन केंद्रीय मोमेंट इस प्रकार हैं<ref>{{cite book|last1=Papoulis|first1=Athanasios|title=Probability, Random Variables and Stochastic Processes|page=148|edition=4th}}</ref> | ||
:<math> | :<math> | ||
\operatorname{E}\left[(X-\mu)^p\right] = | \operatorname{E}\left[(X-\mu)^p\right] = | ||
Line 234: | Line 234: | ||
यहाँ <math>n!!</math> दोहरे क्रमगुणन को दर्शाता है, अर्थात सभी संख्याओं का गुणनफल <math>n</math> से 1 तक जिसमें <math>n.</math> समान समानता है | यहाँ <math>n!!</math> दोहरे क्रमगुणन को दर्शाता है, अर्थात सभी संख्याओं का गुणनफल <math>n</math> से 1 तक जिसमें <math>n.</math> समान समानता है | ||
केंद्रीय निरपेक्ष मोमेंट | केंद्रीय निरपेक्ष मोमेंट सभी समान क्रम के लिए प्लैन मोमेंट के साथ मेल खाते हैं, लेकिन विषम क्रमागत के लिए अशून्य हैं। किसी भी गैर-ऋणात्मक पूर्णांक <math>p,</math>के लिए इस रूप में होते है | ||
:<math>\begin{align} | :<math>\begin{align} | ||
\operatorname{E}\left[|X - \mu|^p\right] &= \sigma^p (p-1)!! \cdot \begin{cases} | \operatorname{E}\left[|X - \mu|^p\right] &= \sigma^p (p-1)!! \cdot \begin{cases} | ||
Line 242: | Line 242: | ||
&= \sigma^p \cdot \frac{2^{p/2}\Gamma\left(\frac{p+1} 2 \right)}{\sqrt\pi}. | &= \sigma^p \cdot \frac{2^{p/2}\Gamma\left(\frac{p+1} 2 \right)}{\sqrt\pi}. | ||
\end{align}</math> | \end{align}</math> | ||
अंतिम सूत्र किसी भी गैर-पूर्णांक <math>p>-1.</math> के लिए मान्य होते है, अर्थात जब <math>\mu \ne 0,</math> | अंतिम सूत्र किसी भी गैर-पूर्णांक <math>p>-1.</math> के लिए मान्य होते है, अर्थात जब <math>\mu \ne 0,</math> प्लैन और निरपेक्ष मोमेंट को कॉन्फ़्लूएंट हाइपरज्यामितीय फलन <math>{}_1F_1</math> और <math>U.</math> के संदर्भ में व्यक्त किया जा सकता है | ||
:<math>\begin{align} | :<math>\begin{align} | ||
\operatorname{E}\left[X^p\right] &= \sigma^p\cdot (-i\sqrt 2)^p U\left(-\frac{p}{2}, \frac{1}{2}, -\frac{1}{2} \left( \frac \mu \sigma \right)^2 \right), \\ | \operatorname{E}\left[X^p\right] &= \sigma^p\cdot (-i\sqrt 2)^p U\left(-\frac{p}{2}, \frac{1}{2}, -\frac{1}{2} \left( \frac \mu \sigma \right)^2 \right), \\ | ||
\operatorname{E}\left[|X|^p \right] &= \sigma^p \cdot 2^{p/2} \frac {\Gamma\left(\frac{1+p} 2\right)}{\sqrt\pi} {}_1F_1\left( -\frac{p}{2}, \frac{1}{2}, -\frac{1}{2} \left( \frac \mu \sigma \right)^2 \right). | \operatorname{E}\left[|X|^p \right] &= \sigma^p \cdot 2^{p/2} \frac {\Gamma\left(\frac{1+p} 2\right)}{\sqrt\pi} {}_1F_1\left( -\frac{p}{2}, \frac{1}{2}, -\frac{1}{2} \left( \frac \mu \sigma \right)^2 \right). | ||
\end{align}</math> | \end{align}</math> | ||
ये अभिव्यक्ति मान्य रहते हैं यदि | ये अभिव्यक्ति मान्य रहते हैं यदि <math>p</math> पूर्णांक नहीं है। सामान्यीकृत हर्माइट बहुपद भी देखें। | ||
{| class="wikitable" style="background:#fff; margin: auto;" | {| class="wikitable" style="background:#fff; margin: auto;" | ||
|- | |- | ||
! | ! क्रम !! अकेंद्रीय मोमेंट !! केंद्रीय मोमेंट | ||
|- | |- | ||
| 1 | | 1 | ||
Line 287: | Line 287: | ||
गणितीय <math>X</math> की अपेक्षा उस घटना पर आधारित थी सशर्त <math>X</math> अन्तराल में <math>[a,b]</math> द्वारा दिया गया है | गणितीय <math>X</math> की अपेक्षा उस घटना पर आधारित थी सशर्त <math>X</math> अन्तराल में <math>[a,b]</math> द्वारा दिया गया है | ||
:<math>\operatorname{E}\left[X \mid a<X<b \right] = \mu - \sigma^2\frac{f(b)-f(a)}{F(b)-F(a)} </math> | :<math>\operatorname{E}\left[X \mid a<X<b \right] = \mu - \sigma^2\frac{f(b)-f(a)}{F(b)-F(a)} </math> | ||
जहाँ | जहाँ <math>f</math> और <math>F</math> क्रमशः घनत्व और संचयी वितरण फलन <math>X</math>. के लिए <math>b=\infty</math> के रूप में होता है, इसे व्युत्क्रम मिल्स अनुपात के रूप में जाना जाता है। ध्यान दें कि ऊपर, घनत्व <math>f</math> का <math>X</math> व्युत्क्रम मिल्स अनुपात में मानक सामान्य घनत्व के अतिरिक्त प्रयोग किया जाता है, इसलिए यहां हमारे पास <math>\sigma^2</math> के अतिरिक्त <math>\sigma</math>. हैं। | ||
=== [[फूरियर रूपांतरण]] और विशिष्ट फलन === | === [[फूरियर रूपांतरण]] और विशिष्ट फलन === | ||
Line 294: | Line 294: | ||
\hat f(t) = \int_{-\infty}^\infty f(x)e^{-itx} \, dx = e^{-i\mu t} e^{- \frac12 (\sigma t)^2} | \hat f(t) = \int_{-\infty}^\infty f(x)e^{-itx} \, dx = e^{-i\mu t} e^{- \frac12 (\sigma t)^2} | ||
</math> | </math> | ||
जहाँ | जहाँ <math>i</math> [[काल्पनिक इकाई]] है। यदि माध्य <math>\mu=0</math>, पहला कारक 1 है और फूरियर ट्रांसफॉर्म एक स्टेबल कारक के अतिरिक्त [[आवृत्ति डोमेन]] पर एक सामान्य घनत्व है, इस प्रकार 0 और मानक विचलन के साथ <math>1/\sigma</math>. विशेष रूप से, मानक सामान्य वितरण <math>\varphi</math> एक फूरियर रूपांतरण का एक अभिलक्षणिक फलन है। | ||
प्रायिकता | प्रायिकता सिद्धांत में, एक वास्तविक-मान यादृच्छिक चर के प्रायिकता वितरण का फूरियर रूपांतरण <math>X</math> विशेष फलन प्रायिकता सिद्धांत से निकटता से जुड़ा हुआ है <math>\varphi_X(t)</math> उस चर के रूप में होते है, जिसके अपेक्षित मान <math>e^{itX}</math>के रूप में परिभाषित किया गया है वास्तविक चर के एक फलन के रूप में <math>t</math> फूरियर रूपांतरण की [[आवृत्ति]] पैरामीटर के रूप में होते है। इस परिभाषा को विश्लेषणात्मक रूप से एक सम्मिश्र -मान <math>t</math> चर तक बढ़ाया जा सकता है<ref>{{harvtxt |Bryc |1995 |p=24 }}</ref> दोनों के बीच संबंध इस प्रकार है, | ||
:<math>\varphi_X(t) = \hat f(-t)</math> | :<math>\varphi_X(t) = \hat f(-t)</math> | ||
=== मोमेंट | === मोमेंट और संचयी जनरेटिंग फलन === | ||
एक वास्तविक यादृच्छिक चर का [[क्षण उत्पन्न करने वाला कार्य|मोमेंट जनरेटिंग | एक वास्तविक यादृच्छिक चर का [[क्षण उत्पन्न करने वाला कार्य|मोमेंट जनरेटिंग फलन]] <math>X</math> का अपेक्षित मान <math>e^{tX}</math> है और इस प्रकार वास्तविक पैरामीटर के एक फलन के रूप में <math>t</math>. घनत्व के साथ सामान्य वितरण के लिए <math>f</math>, अर्थ <math>\mu</math> और विचलन <math>\sigma</math>, मोमेंट जनरेटिंग फलन के रूप में उपस्थित है और इसके बराबर है | ||
:<math>M(t) = \operatorname{E}[e^{tX}] = \hat f(it) = e^{\mu t} e^{\tfrac12 \sigma^2 t^2}</math> | :<math>M(t) = \operatorname{E}[e^{tX}] = \hat f(it) = e^{\mu t} e^{\tfrac12 \sigma^2 t^2}</math> | ||
[[संचयी उत्पादन समारोह|संचयी जनरेटिंग फलन]] | [[संचयी उत्पादन समारोह|संचयी जनरेटिंग फलन]] मोमेंट जनरेटिंग फलन का लघुगणक है, अर्थात् | ||
:<math>g(t) = \ln M(t) = \mu t + \tfrac 12 \sigma^2 t^2</math> | :<math>g(t) = \ln M(t) = \mu t + \tfrac 12 \sigma^2 t^2</math> | ||
Line 310: | Line 310: | ||
=== स्टीन ऑपरेटर और वर्ग === | === स्टीन ऑपरेटर और वर्ग === | ||
स्टीन की विधि के भीतर स्टीन ऑपरेटर और एक यादृच्छिक चर का वर्ग | स्टीन की विधि के भीतर स्टीन ऑपरेटर और एक यादृच्छिक चर का वर्ग <math>X \sim \mathcal{N}(\mu, \sigma^2)</math> हैं <math>\mathcal{A}f(x) = \sigma^2 f'(x) - (x-\mu)f(x)</math> और <math>\mathcal{F}</math> सभी बिल्कुल निरंतर फलन का वर्ग <math>f : \R \to \R \mbox{ such that }\mathbb{E}[|f'(X)|]< \infty</math>.के रूप में होता है | ||
=== शून्य | === शून्य वेरिएंस सीमा === | ||
सीमा में (गणित) जब <math>\sigma</math> शून्य हो जाता है, प्रायिकता घनत्व <math>f(x)</math> अंततः शून्य हो जाता है <math>x\ne \mu</math>, लेकिन यदि | सीमा में (गणित) जब <math>\sigma</math> शून्य हो जाता है, प्रायिकता घनत्व <math>f(x)</math> अंततः शून्य हो जाता है <math>x\ne \mu</math>, लेकिन यदि <math>x = \mu</math>,बिना सीमा के बढ़ता है जबकि इसका समाकल 1 के बराबर रहता है। इसलिए, सामान्य वितरण को साधारण फलन (गणित) के रूप में परिभाषित नहीं किया जा सकता जब <math>\sigma = 0</math> होता है | ||
चूंकि, सामान्य वितरण को एक सामान्यीकृत फलन | चूंकि, सामान्य वितरण को एक सामान्यीकृत फलन के रूप में शून्य वेरिएंस के साथ परिभाषित किया जा सकता है; विशेष रूप से, डिराक का डेल्टा फलन के रूप में <math>\delta</math> माध्यम से अनुवादित <math>\mu</math> है, <math>f(x)=\delta(x-\mu).</math> इसका सीडीएफ तब माध्य <math>\mu</math>,द्वारा अनुवादित [[हैवीसाइड स्टेप फंक्शन|हैवीसाइड स्टेप फलन]] है, | ||
:<math>F(x) = | :<math>F(x) = | ||
\begin{cases} | \begin{cases} | ||
Line 325: | Line 325: | ||
=== अधिकतम एन्ट्रापी === | === अधिकतम एन्ट्रापी === | ||
एक निर्दिष्ट माध्य के साथ वास्तविक पर सभी | एक निर्दिष्ट माध्य के साथ वास्तविक पर सभी प्रायिकता वितरण में से <math>\mu</math> और वेरिएंस <math>\sigma^2</math>, सामान्य वितरण <math>N(\mu,\sigma^2)</math> अधिकतम एंट्रॉp प्रायिकता वितरण वाला एक है।<ref>{{harvtxt |Cover |Thomas |2006 |p=254 }}</ref> यदि <math>X</math> प्रायिकता घनत्व फलन के साथ एक [[सतत यादृच्छिक चर]] <math>f(x)</math> है और इस प्रकार फिर <math>X</math> एन्ट्रापी को परिभाषित किया जाता है<ref>{{cite book|last1=Williams|first1=David|title=Weighing the odds : a course in probability and statistics|url=https://archive.org/details/weighingoddscour00will|url-access=limited|date=2001|publisher=Cambridge Univ. Press|location=Cambridge [u.a.]|isbn=978-0-521-00618-7|pages=[https://archive.org/details/weighingoddscour00will/page/n219 197]–199|edition=Reprinted.}}</ref><ref>{{cite book|last1=Smith|first1=José M. Bernardo; Adrian F. M.|title=Bayesian theory|url=https://archive.org/details/bayesiantheory00bern_963|url-access=limited|date=2000|publisher=Wiley|location=Chichester [u.a.]|isbn=978-0-471-49464-5|pages=[https://archive.org/details/bayesiantheory00bern_963/page/n224 209], 366|edition=Reprint}}</ref><ref>O'Hagan, A. (1994) ''Kendall's Advanced Theory of statistics, Vol 2B, Bayesian Inference'', Edward Arnold. {{isbn|0-340-52922-9}} (Section 5.40)</ref> | ||
:<math> | :<math> | ||
H(X) = - \int_{-\infty}^\infty f(x)\log f(x)\, dx | H(X) = - \int_{-\infty}^\infty f(x)\log f(x)\, dx | ||
</math> | </math> | ||
जहाँ | जहाँ <math>f(x)\log f(x)</math> कभी भी शून्य समझा जाता है <math>f(x)=0</math>. इस फलन कार्यात्मकता को अधिकतम किया जा सकता है, इस शर्त के अधीन कि वितरण उचित रूप से सामान्यीकृत है और इसमें वैरिएबल कैलकुलस का उपयोग करके एक निर्दिष्ट भिन्नता है। दो लैग्रेंज गुणक वाले एक फलन को परिभाषित किया गया है | ||
:<math> | :<math> | ||
L=\int_{-\infty}^\infty f(x)\ln(f(x))\,dx-\lambda_0\left(1-\int_{-\infty}^\infty f(x)\,dx\right)-\lambda\left(\sigma^2-\int_{-\infty}^\infty f(x)(x-\mu)^2\,dx\right) | L=\int_{-\infty}^\infty f(x)\ln(f(x))\,dx-\lambda_0\left(1-\int_{-\infty}^\infty f(x)\,dx\right)-\lambda\left(\sigma^2-\int_{-\infty}^\infty f(x)(x-\mu)^2\,dx\right) | ||
</math> | </math> | ||
जहाँ | जहाँ <math>f(x)</math> अभी के लिए, माध्य के साथ कुछ घनत्व फलन के रूप में माना जाता है <math>\mu</math> और मानक विचलन <math>\sigma</math>.के रूप में होता है | ||
अधिकतम एन्ट्रापी पर, एक छोटा बदलाव <math>\delta f(x)</math> के बारे में <math>f(x)</math> भिन्नता उत्पन्न करता है, <math>\delta L</math> के बारे में <math>L</math> जो 0 के बराबर होता है | अधिकतम एन्ट्रापी पर, एक छोटा बदलाव <math>\delta f(x)</math> के बारे में <math>f(x)</math> भिन्नता उत्पन्न करता है, <math>\delta L</math> के बारे में <math>L</math> जो 0 के बराबर होता है | ||
Line 344: | Line 344: | ||
:<math>f(x)=e^{-\lambda_0-1-\lambda(x-\mu)^2}</math> | :<math>f(x)=e^{-\lambda_0-1-\lambda(x-\mu)^2}</math> | ||
<math>\lambda_0</math> और <math>\lambda</math> को हल करने के लिए कॉन्सट्रेंट | <math>\lambda_0</math> और <math>\lambda</math> को हल करने के लिए कॉन्सट्रेंट समीकरणों का उपयोग करने से सामान्य वितरण का घनत्व प्राप्त होता है: | ||
:<math> | :<math> | ||
f(x, \mu, \sigma)=\frac{1}{\sqrt{2\pi\sigma^2}}e^{-\frac{(x-\mu)^2}{2\sigma^2}} | f(x, \mu, \sigma)=\frac{1}{\sqrt{2\pi\sigma^2}}e^{-\frac{(x-\mu)^2}{2\sigma^2}} | ||
</math> | </math> | ||
एक सामान्य वितरण की | एक सामान्य वितरण की एन्ट्रॉp बराबर होती है | ||
:<math> | :<math> | ||
H(X)=\tfrac{1}{2}(1+\log(2\sigma^2\pi)) | H(X)=\tfrac{1}{2}(1+\log(2\sigma^2\pi)) | ||
Line 377: | Line 377: | ||
}} | }} | ||
== संबंधित | == संबंधित वितरण == | ||
=== केंद्रीय सीमा प्रमेय === | === केंद्रीय सीमा प्रमेय === | ||
[[File:De moivre-laplace.gif|right|thumb|250px|जैसे-जैसे असतत घटनाओं की संख्या बढ़ती है, फलन | [[File:De moivre-laplace.gif|right|thumb|250px|जैसे-जैसे असतत घटनाओं की संख्या बढ़ती है, फलन एक सामान्य वितरण जैसा दिखने लगता है]] | ||
[[File:Dice sum central limit theorem.svg|thumb|250px|प्रायिकता | [[File:Dice sum central limit theorem.svg|thumb|250px|प्रायिकता घनत्व फलन की तुलना, <math>p(k)</math> के योग के लिए <math>n</math> वृद्धि के साथ एक सामान्य वितरण के लिए उनके अभिसरण को दिखाने के लिए निष्पक्ष 6-पक्षीय डाइस <math>na</math>, केंद्रीय सीमा प्रमेय के अनुसार नीचे-दाएं ग्राफ़ में, पिछले ग्राफ़ के स्मूथ प्रोफाइल को सामान्य वितरण (ब्लैक कर्व) के साथ पुन: व्यवस्थित प्रभारित रूप में तुलना की जाती है।]] | ||
{{Main|केंद्रीय सीमा प्रमेय}} | {{Main|केंद्रीय सीमा प्रमेय}} | ||
केंद्रीय सीमा प्रमेय कहता है कि कुछ बहुत | केंद्रीय सीमा प्रमेय कहता है कि कुछ बहुत सामान्य स्थितियों के अनुसार कई यादृच्छिक चरों के योग का लगभग सामान्य वितरण होता है। इस प्रकार विशेष रूप से, जहाँ <math>X_1,\ldots ,X_n</math> स्वतंत्र और समान रूप से समान वितरण के रूप में होता है और शून्य माध्य और वेरिएंस के साथ समान रूप से वितरित यादृच्छिक चर <math>\sigma^2</math> और <math>Z</math> उनका माध्य <math>\sqrt{n}</math> द्वारा मापा जाता है | ||
:<math> Z = \sqrt{n}\left(\frac{1}{n}\sum_{i=1}^n X_i\right) </math> | :<math> Z = \sqrt{n}\left(\frac{1}{n}\sum_{i=1}^n X_i\right) </math> | ||
फिर, जैसे-जैसे <math>n</math> बढ़ता है, <math>Z</math> की | फिर, जैसे-जैसे <math>n</math> बढ़ता है, <math>Z</math> की प्रायिकता वितरण शून्य माध्य और वेरिएंस <math>\sigma^2</math>.के साथ सामान्य वितरण की ओर प्रवृत्त होता है | ||
प्रमेय को | प्रमेय को <math>(X_i)</math>चरों तक बढ़ाया जाता है, जो स्वतंत्र रूप में नहीं हैं या समान रूप से वितरित नहीं हैं यदि कुछ कॉन्सट्रेंट को निर्भरता की डिग्री और वितरण के मोमेंट पर रखा जाता है। | ||
व्यवहार में आने वाले अनेक परीक्षण सांख्यिकी, [[अंक]] [[स्कोर (सांख्यिकी)|(सांख्यिकी)]] और | व्यवहार में आने वाले अनेक परीक्षण सांख्यिकी, [[अंक]] [[स्कोर (सांख्यिकी)|(सांख्यिकी)]] और एस्टीमेटर अभ्यास में सामना करते हैं, उनमें कुछ यादृच्छिक चर के योग होते हैं और इससे भी अधिक अनुमानकों को [[प्रभाव समारोह (सांख्यिकी)|अभिव्यक्ति फलन (सांख्यिकी)]] के उपयोग के माध्यम से यादृच्छिक चर के योग के रूप में दर्शाया जा सकता है। केंद्रीय सीमा प्रमेय का अर्थ है कि उन सांख्यिकीय पैरामीटर में असमान रूप से सामान्य वितरण होता है। | ||
केंद्रीय सीमा प्रमेय का अर्थ यह भी है कि कुछ | केंद्रीय सीमा प्रमेय का अर्थ यह भी है कि कुछ वितरण को सामान्य वितरण द्वारा अनुमानित किया जा सकता है, उदाहरण के लिए: | ||
* [[द्विपद वितरण|द्विपद]] वितरण <math>B(n,p)</math> माध्य के साथ डी मोइवर-लाप्लास प्रमेय है <math>np</math> और | * [[द्विपद वितरण|द्विपद]] वितरण <math>B(n,p)</math> माध्य के साथ डी मोइवर-लाप्लास प्रमेय है <math>np</math> और वेरिएंस <math>np(1-p)</math> बड़े के लिए <math>n</math> और के लिए <math>p</math> 0 या 1 के बहुत निकटतम रूप में नहीं होते है। | ||
* पैरामीटर के साथ पॉइसन वितरण <math>\lambda</math> औसत के साथ लगभग सामान्य रूप में होते है <math>\lambda</math> और | * पैरामीटर के साथ पॉइसन वितरण <math>\lambda</math> औसत के साथ लगभग सामान्य रूप में होते है <math>\lambda</math> और वेरिएंस <math>\lambda</math>, के बड़े मानों के लिए <math>\lambda</math>.के रूप में होते है<ref>{{cite web|url=http://www.stat.ucla.edu/~dinov/courses_students.dir/Applets.dir/NormalApprox2PoissonApplet.html|title=Normal Approximation to Poisson Distribution|website=Stat.ucla.edu|access-date=2017-03-03}}</ref> | ||
* [[ची-वर्ग वितरण|ची-वर्ग]] वितरण <math>\chi^2(k)</math> औसत के साथ लगभग सामान्य है <math>k</math> और | * [[ची-वर्ग वितरण|ची-वर्ग]] वितरण <math>\chi^2(k)</math> औसत के साथ लगभग सामान्य है <math>k</math> और वेरिएंस <math>2k</math>, बड़े के लिए <math>k</math>. रूप में होते है | ||
* छात्र का टी-वितरण <math>t(\nu)</math> माध्य 0 और प्रसरण 1 के साथ लगभग सामान्य है जब <math>\nu</math> बड़ी है। | * छात्र का टी-वितरण <math>t(\nu)</math> माध्य 0 और प्रसरण 1 के साथ लगभग सामान्य है जब <math>\nu</math> बड़ी है। | ||
Line 406: | Line 406: | ||
=== सामान्य चर के संचालन और फलन === | === सामान्य चर के संचालन और फलन === | ||
[[File:Probabilities of functions of normal vectors.png|thumb|right|a: किसी फलन | [[File:Probabilities of functions of normal vectors.png|thumb|right|a: किसी फलन का प्रायिकता घनत्व <math>\cos x^2</math> एक सामान्य चर का <math>x</math> साथ <math>\mu=-2</math> और <math>\sigma=3</math>. b: एक फलन की प्रायिकता घनत्व <math>x^y</math> दो सामान्य चर के <math>x</math> और <math>y</math>, जहाँ <math>\mu_x=1</math>, <math>\mu_y=2</math>, <math>\sigma_x = 0.1</math>, <math>\sigma_y = 0.2</math>, और <math>\rho_{xy} = 0.8</math>. c: दो सहसंबद्ध सामान्य चर के दो फलन की संयुक्त प्रायिकता घनत्व का हीट मैप <math>x</math> और <math>y</math>, जहाँ <math>\mu_x = -2</math>, <math>\mu_y=5</math>, <math>\sigma_x^2 = 10</math>, <math>\sigma_y^2 = 20</math>, और <math>\rho_{xy} = 0.495</math>. d: एक फलन की प्रायिकता घनत्व <math display="inline">\sum_{i=1}^4 \vert x_i \vert</math> 4 iid मानक सामान्य चर के रूप में होती है। इनकी गणना रे-ट्रेसिंग की संख्यात्मक विधि द्वारा की जाती है।<ref name="Das" />]]प्रायिकता घनत्व फलन संचयी वितरण फलन और एक या एक से अधिक स्वतंत्र या सहसंबद्ध सामान्य चर के किसी भी फलन के व्युत्क्रम संचयी वितरण फलन की गणना रे-ट्रेसिंग की संख्यात्मक विधि से की जा सकती है।<ref name="Das">{{cite arXiv | last=Das|first=Abhranil| eprint=2012.14331| title=A method to integrate and classify normal distributions|date=2020| class=stat.ML}}</ref> ([https://www.mathworks.com/matlabcentral/fileexchange/84973-integrate-and-classify-normal-distributions मैटलैब कोड]) और इस प्रकार निम्नलिखित अनुभागों में हम कुछ विशेष स्थितियो को देख सकते है। | ||
==== एकल सामान्य चर पर संचालन ==== | ==== एकल सामान्य चर पर संचालन ==== | ||
यदि <math>X</math> माध्य के साथ सामान्य रूप से वितरित किया जाता है <math>\mu</math> और | यदि <math>X</math> माध्य के साथ सामान्य रूप से वितरित किया जाता है <math>\mu</math> और वेरिएंस <math>\sigma^2</math>, तब | ||
* <math>aX+b</math>, किसी भी वास्तविक संख्या के लिए <math>a</math> और <math>b</math>, भी सामान्य रूप से माध्य के साथ वितरित किया जाता है <math>a\mu+b</math> और मानक विचलन <math>|a|\sigma</math>. अर्थात्, रैखिक परिवर्तनों के अनुसार | * <math>aX+b</math>, किसी भी वास्तविक संख्या के लिए <math>a</math> और <math>b</math>, भी सामान्य रूप से माध्य के साथ वितरित किया जाता है <math>a\mu+b</math> और मानक विचलन <math>|a|\sigma</math>. अर्थात्, रैखिक परिवर्तनों के अनुसार सामान्य वितरण का फॅमिली संवृत रूप में होते है। | ||
* <math>X</math> का घातांक लॉग-सामान्य रूप से: {{math|''e<sup>X</sup>'' ~ ln(''N'' (''μ'', ''σ''<sup>2</sup>))}}. वितरित किया जाता है | * <math>X</math> का घातांक लॉग-सामान्य रूप से: {{math|''e<sup>X</sup>'' ~ ln(''N'' (''μ'', ''σ''<sup>2</sup>))}}. वितरित किया जाता है | ||
* <math>X</math> का पूर्ण मान सामान्य वितरण {{math|{{pipe}}''X''{{pipe}} ~ ''N<sub>f</sub>'' (''μ'', ''σ''<sup>2</sup>)}}.को फोल्ड कर देता है, यदि <math>\mu = 0</math> इसे अर्ध-सामान्य वितरण के रूप में जाना जाता है। | * <math>X</math> का पूर्ण मान सामान्य वितरण {{math|{{pipe}}''X''{{pipe}} ~ ''N<sub>f</sub>'' (''μ'', ''σ''<sup>2</sup>)}}.को फोल्ड कर देता है, यदि <math>\mu = 0</math> इसे अर्ध-सामान्य वितरण के रूप में जाना जाता है। | ||
* सामान्यीकृत अवशिष्टों का निरपेक्ष मान, |X - μ|/σ, में स्वतंत्र की एक डिग्री के साथ [[ची वितरण|ची]] वितरण | * सामान्यीकृत अवशिष्टों का निरपेक्ष मान, |X - μ|/σ, में स्वतंत्र की एक डिग्री के साथ [[ची वितरण|ची]] वितरण होते है। <math>|X - \mu| / \sigma \sim \chi_1</math>. | ||
* X/σ के वर्ग में स्वतंत्र की एक डिग्री के साथ गैर-केन्द्रीय ची-वर्ग वितरण है: <math display="inline">X^2 / \sigma^2 \sim \chi_1^2(\mu^2 / \sigma^2)</math>. यदि <math>\mu = 0</math>, वितरण को केवल ची-वर्ग कहा जाता है। | * X/σ के वर्ग में स्वतंत्र की एक डिग्री के साथ गैर-केन्द्रीय ची-वर्ग वितरण है: <math display="inline">X^2 / \sigma^2 \sim \chi_1^2(\mu^2 / \sigma^2)</math>. यदि <math>\mu = 0</math>, वितरण को केवल ची-वर्ग कहा जाता है। | ||
* एक सामान्य चर की लॉग | * एक सामान्य चर की लॉग प्रायिकता <math>x</math> केवल इसकी प्रायिकता घनत्व फलन का लघुगणक है,<math display="block">\ln p(x)= -\frac{1}{2} \left(\frac{x-\mu}{\sigma} \right)^2 -\ln \left(\sigma \sqrt{2\pi} \right) = -\frac{1}{2} z^2 -\ln \left(\sigma \sqrt{2\pi} \right).</math> चूंकि यह एक मानक सामान्य चर का एक स्केल्ड और स्थानांतरित वर्ग है, इसे स्केल्ड और शिफ्ट किए गए ची-स्क्वेर्ड चर के रूप में वितरित किया जाता है। | ||
* वेरिएबलX का वितरण एक अंतराल [a, b] तक सीमित है, जिसे छोटा सामान्य वितरण कहा जाता है। | * वेरिएबलX का वितरण एक अंतराल [a, b] तक सीमित है, जिसे छोटा सामान्य वितरण कहा जाता है। | ||
* (X- μ)<sup>−2</sup> का लेवी वितरण स्थान 0 और स्केल σ<sup>2 के साथ है | * (X- μ)<sup>−2</sup> का लेवी वितरण स्थान 0 और स्केल σ<sup>2 के साथ है | ||
===== दो स्वतंत्र सामान्य चर पर संचालन ===== | ===== दो स्वतंत्र सामान्य चर पर संचालन ===== | ||
* यदि <math>X_1</math> और <math>X_2</math> साधन के साथ दो [[स्वतंत्रता (संभाव्यता सिद्धांत)|स्वतंत्र ( प्रायिकता | * यदि <math>X_1</math> और <math>X_2</math> साधन के साथ दो [[स्वतंत्रता (संभाव्यता सिद्धांत)|स्वतंत्र ( प्रायिकता सिद्धांत)]] सामान्य यादृच्छिक चर हैं <math>\mu_1</math>, <math>\mu_2</math> और मानक विचलन <math>\sigma_1</math>, <math>\sigma_2</math>, फिर उनका योग <math>X_1 + X_2</math> भी सामान्य रूप से वितरित किया जाता है, सामान्य रूप से वितरित यादृच्छिक चर का योग माध्य के साथ <math>\mu_1 + \mu_2</math> और वेरिएंस <math>\sigma_1^2 + \sigma_2^2</math>.के रूप में होता है | ||
* विशेष रूप से, यदि <math>X</math> और <math>Y</math> शून्य माध्य और | * विशेष रूप से, यदि <math>X</math> और <math>Y</math> शून्य माध्य और वेरिएंस के साथ स्वतंत्र सामान्य विचलन <math>\sigma^2</math>हैं, तब <math>X + Y</math> और <math>X - Y</math> शून्य माध्य और वेरिएंस के साथ स्वतंत्र और सामान्य रूप से वितरित होते है <math>2\sigma^2</math> यह ध्रुवीकरण की पहचान की एक विशेष स्थिति है।<ref>{{harvtxt |Bryc |1995 |p=27 }}</ref> | ||
* यदि <math>X_1</math>, <math>X_2</math> माध्य के साथ दो स्वतंत्र सामान्य विचलन | * यदि <math>X_1</math>, <math>X_2</math> माध्य के साथ दो स्वतंत्र सामान्य विचलन <math>\mu</math> हैं और विचलन <math>\sigma</math>, और <math>a</math>, <math>b</math> यादृच्छिक वास्तविक संख्याएं हैं, इस प्रकार चर <math display="block"> | ||
X_3 = \frac{aX_1 + bX_2 - (a+b)\mu}{\sqrt{a^2+b^2}} + \mu | X_3 = \frac{aX_1 + bX_2 - (a+b)\mu}{\sqrt{a^2+b^2}} + \mu | ||
</math> भी सामान्य रूप से माध्य के साथ वितरित किया जाता है <math>\mu</math> और विचलन <math>\sigma</math>. यह इस प्रकार है कि सामान्य वितरण स्टेबल | </math> भी सामान्य रूप से माध्य के साथ वितरित किया जाता है <math>\mu</math> और विचलन <math>\sigma</math>. यह इस प्रकार है कि सामान्य वितरण स्टेबल वितरण घातांक के साथ <math>\alpha=2</math> है | ||
===== दो स्वतंत्र मानक सामान्य चर पर संचालन ===== | ===== दो स्वतंत्र मानक सामान्य चर पर संचालन ===== | ||
यदि <math>X_1</math> और <math>X_2</math> माध्य 0 और प्रसरण 1 के साथ दो स्वतंत्र मानक सामान्य यादृच्छिक चर हैं | यदि <math>X_1</math> और <math>X_2</math> माध्य 0 और प्रसरण 1 के साथ दो स्वतंत्र मानक सामान्य यादृच्छिक चर के रूप में हैं | ||
* उनका योग और अंतर सामान्य रूप से माध्य शून्य और | * उनका योग और अंतर सामान्य रूप से माध्य शून्य और वेरिएंस <math>X_1 \pm X_2 \sim N(0, 2)</math>.दो के साथ वितरित किया जाता है | ||
* उनका | * उनका गुणन <math>Z = X_1 X_2</math> घनत्व फलन के साथ सामान्य वितरण का अनुसरण करता है<ref>{{cite web|url = http://mathworld.wolfram.com/NormalProductDistribution.html |title = Normal Product Distribution|work = MathWorld |publisher =wolfram.com| first = Eric W. |last = Weisstein}}</ref> इस प्रकार <math>f_Z(z) = \pi^{-1} K_0(|z|)</math> जहाँ <math>K_0</math> दूसरे प्रकार का संशोधित बेसेल [[मैकडोनाल्ड समारोह|फलन]] है। यह वितरण <math>z = 0</math>, पर असंबद्ध शून्य के आसपास सममित है और इसका विशिष्ट फलन प्रायिकता सिद्धांत <math> \phi_Z(t) = (1 + t^2)^{-1/2}</math>.के रूप में है | ||
* उनका अनुपात मानक कॉची वितरण का अनुसरण करता है: <math>X_1/ X_2 \sim \operatorname{Cauchy}(0, 1)</math>. | * उनका अनुपात मानक कॉची वितरण का अनुसरण करता है: <math>X_1/ X_2 \sim \operatorname{Cauchy}(0, 1)</math>. | ||
* उनका यूक्लिडियन मानदंड <math>\sqrt{X_1^2 + X_2^2}</math> [[रेले वितरण|रेले]] वितरण है। | * उनका यूक्लिडियन मानदंड <math>\sqrt{X_1^2 + X_2^2}</math> [[रेले वितरण|रेले]] वितरण है। | ||
Line 435: | Line 435: | ||
==== कई स्वतंत्र सामान्य चर पर संचालन ==== | ==== कई स्वतंत्र सामान्य चर पर संचालन ==== | ||
* स्वतंत्र सामान्य विचलन का कोई भी [[रैखिक संयोजन]] एक सामान्य विचलन है। | * स्वतंत्र सामान्य विचलन का कोई भी [[रैखिक संयोजन]] एक सामान्य विचलन है। | ||
* यदि <math>X_1, X_2, \ldots, X_n</math> स्वतंत्र मानक सामान्य यादृच्छिक चर हैं, तो उनके वर्गों के योग में ची-वर्ग वितरण है <math>n</math> स्वतंत्र की कोटियां <math display="block">X_1^2 + \cdots + X_n^2 \sim \chi_n^2.</math> | * यदि <math>X_1, X_2, \ldots, X_n</math> स्वतंत्र मानक सामान्य यादृच्छिक चर हैं, तो उनके वर्गों के योग में ची-वर्ग वितरण है और <math>n</math> स्वतंत्र की कोटियां इस प्रकार है,<math display="block">X_1^2 + \cdots + X_n^2 \sim \chi_n^2.</math> | ||
* यदि <math>X_1, X_2, \ldots, X_n</math> साधन के साथ सामान्य रूप से वितरित यादृच्छिक चर स्वतंत्र हैं <math>\mu</math> और प्रसरण <math>\sigma^2</math>, तो उनका [[नमूना माध्य]] नमूना मानक विचलन से स्वतंत्र है,<ref>{{cite journal|title=A Characterization of the Normal Distribution |last=Lukacs |first=Eugene |journal=[[The Annals of Mathematical Statistics]] |issn=0003-4851 |volume=13|issue=1 |year=1942 |pages=91–3 |jstor=2236166 |doi=10.1214/aoms/1177731647 |doi-access=free}}</ref> जिसे बसु के प्रमेय या कोचरन के प्रमेय का उपयोग करके प्रदर्शित किया जा सकता है।<ref>{{cite journal |title=On Some Characterizations of the Normal Distribution | last1=Basu|first1=D. |last2=Laha|first2=R. G.|journal=[[Sankhyā (journal)|Sankhyā]]|issn=0036-4452| volume=13|issue=4|year=1954|pages=359–62| jstor=25048183}}</ref> इन दो मात्राओं के अनुपात में छात्र का | * यदि <math>X_1, X_2, \ldots, X_n</math> साधन के साथ सामान्य रूप से वितरित यादृच्छिक चर स्वतंत्र हैं <math>\mu</math> और प्रसरण <math>\sigma^2</math>, तो उनका [[नमूना माध्य]] नमूना मानक विचलन से स्वतंत्र है,<ref>{{cite journal|title=A Characterization of the Normal Distribution |last=Lukacs |first=Eugene |journal=[[The Annals of Mathematical Statistics]] |issn=0003-4851 |volume=13|issue=1 |year=1942 |pages=91–3 |jstor=2236166 |doi=10.1214/aoms/1177731647 |doi-access=free}}</ref> जिसे बसु के प्रमेय या कोचरन के प्रमेय का उपयोग करके प्रदर्शित किया जा सकता है।<ref>{{cite journal |title=On Some Characterizations of the Normal Distribution | last1=Basu|first1=D. |last2=Laha|first2=R. G.|journal=[[Sankhyā (journal)|Sankhyā]]|issn=0036-4452| volume=13|issue=4|year=1954|pages=359–62| jstor=25048183}}</ref> इन दो मात्राओं के अनुपात में छात्र का t-वितरण होता है <math>n-1</math> स्वतंत्र की कोटियो के रूप में होती है <math display="block">t = \frac{\overline X - \mu}{S/\sqrt{n}} = \frac{\frac{1}{n}(X_1+\cdots+X_n) - \mu}{\sqrt{\frac{1}{n(n-1)}\left[(X_1-\overline X)^2 + \cdots+(X_n-\overline X)^2\right]}} \sim t_{n-1}.</math> | ||
* यदि <math>X_1, X_2, \ldots, X_n</math>, <math>Y_1, Y_2, \ldots, Y_m</math> स्वतंत्र मानक सामान्य यादृच्छिक चर हैं, तो वर्गों के सामान्यीकृत योगों का अनुपात होता है | * यदि <math>X_1, X_2, \ldots, X_n</math>, <math>Y_1, Y_2, \ldots, Y_m</math> स्वतंत्र मानक सामान्य यादृच्छिक चर हैं, तो वर्गों के सामान्यीकृत योगों का अनुपात होता है {{nowrap|[[F-वितरण]]}} साथ {{math|(''n'', ''m'')}} स्वतंत्र की कोटियां होती है <ref>{{cite book |title=Testing Statistical Hypotheses |edition=2nd | first=E. L. | last=Lehmann | publisher=Springer |year=1997 | isbn=978-0-387-94919-2| page=199}}</ref> <math display="block">F = \frac{\left(X_1^2+X_2^2+\cdots+X_n^2\right)/n}{\left(Y_1^2+Y_2^2+\cdots+Y_m^2\right)/m} \sim F_{n,m}.</math> | ||
==== एकाधिक सहसंबद्ध सामान्य चर पर संचालन ==== | ==== एकाधिक सहसंबद्ध सामान्य चर पर संचालन ==== | ||
* सामान्य सदिश का [[द्विघात रूप]], | * सामान्य सदिश का [[द्विघात रूप]], अर्थात द्विघात फलन <math display="inline">q = \sum x_i^2 + \sum x_j + c</math> एकाधिक स्वतंत्र या सहसंबद्ध सामान्य चर का, एक [[सामान्यीकृत ची-स्क्वायर वितरण|सामान्यीकृत ची-स्क्वायर]] वितरण है। | ||
=== घनत्व फलन | === घनत्व फलन पर संचालन === | ||
[[विभाजित सामान्य वितरण|विभाजित सामान्य]] वितरण को विभिन्न सामान्य | [[विभाजित सामान्य वितरण|विभाजित सामान्य]] वितरण को विभिन्न सामान्य वितरण के घनत्व फलन के स्केल किए गए वर्गों के रूप में सम्मलित होने और एक में एकीकृत करने के लिए घनत्व को कम करने के संदर्भ में सबसे सीधे परिभाषित किया गया है। इस प्रकार छोटा किया गया सामान्य वितरण एकल घनत्व फलन के एक खंड को फिर से स्केल करने का परिणाम होता है। | ||
=== अनंत विभाज्यता और क्रैमर की प्रमेय === | === अनंत विभाज्यता और क्रैमर की प्रमेय === | ||
किसी भी धनात्मक पूर्णांक के लिए <math>\text{n}</math>, माध्य के साथ कोई भी सामान्य वितरण <math>\mu </math> और | किसी भी धनात्मक पूर्णांक के लिए <math>\text{n}</math>, माध्य के साथ कोई भी सामान्य वितरण <math>\mu </math> और वेरिएंस <math>\sigma^2</math> के योग का वितरण <math>\text{n}</math> है, इस प्रकार स्वतंत्र सामान्य विचलन प्रत्येक माध्य के साथ <math>\frac{\mu}{n}</math> और वेरिएंस <math>\frac{\sigma^2}{n}</math>. इस गुणधर्म को अनंत विभाज्यता प्रायिकता कहा जाता है।<ref>{{harvtxt |Patel |Read |1996 |loc=[2.3.6] }}</ref> | ||
इसके विपरीत यदि <math>X_1</math> और <math>X_2</math> स्वतंत्र यादृच्छिक चर और उनकी राशि हैं <math>X_1+X_2</math> एक सामान्य वितरण है, फिर दोनों <math>X_1</math> और <math>X_2</math> सामान्य विचलन के रूप में होना चाहिए।<ref>{{harvtxt |Galambos |Simonelli |2004 |loc=Theorem 3.5 }}</ref> | |||
इस परिणाम को क्रैमर के अपघटन प्रमेय के रूप में जाना जाता है और यह कहने के बराबर है कि दो वितरण का [[कनवल्शन]] सामान्य है यदि और केवल यदि दोनों सामान्य हैं। क्रैमर के प्रमेय का तात्पर्य है कि स्वतंत्र गैर-गाऊसी चरों के एक रैखिक संयोजन का कभी भी बिल्कुल सामान्य वितरण नहीं होता है, चूंकि यह यादृच्छिक ढंग से निकटता से संपर्क कर सकता है।<ref name="Bryc 1995 35">{{harvtxt |Bryc |1995 |p=35 }}</ref> | |||
=== बर्नस्टीन की प्रमेय === | === बर्नस्टीन की प्रमेय === | ||
बर्नस्टीन के प्रमेय में कहा गया है कि यदि <math>X</math> और <math>Y</math> स्वतंत्र हैं और <math>X + Y</math> और <math>X - Y</math> स्वतंत्र भी हैं, तो X और Y दोनों का सामान्य वितरण अनिवार्य रूप से | बर्नस्टीन के प्रमेय में कहा गया है कि यदि <math>X</math> और <math>Y</math> स्वतंत्र हैं और <math>X + Y</math> और <math>X - Y</math> स्वतंत्र भी हैं, तो X और Y दोनों का सामान्य वितरण अनिवार्य रूप से होते है।<ref name=LK>{{harvtxt |Lukacs |King |1954 }}</ref><ref>{{cite journal| last1=Quine| first1=M.P. |year=1993|title=On three characterisations of the normal distribution |url=http://www.math.uni.wroc.pl/~pms/publicationsArticle.php?nr=14.2&nrA=8&ppB=257&ppE=263 |journal=Probability and Mathematical Statistics|volume=14 |issue=2 |pages=257–263}}</ref> | ||
अधिक सामान्यतः, यदि <math>X_1, \ldots, X_n</math> स्वतंत्र यादृच्छिक चर हैं, फिर दो भिन्न रैखिक संयोजन <math display="inline">\sum{a_kX_k}</math> और <math display="inline">\sum{b_kX_k}</math> स्वतंत्र रूप में होता है, यदि और केवल यदि सभी <math>X_k</math> सामान्य हैं और <math display="inline">\sum{a_kb_k\sigma_k^2=0}</math>, जहाँ <math>\sigma_k^2</math> के वेरिएंस <math>X_k</math>.को दर्शाता है<ref name="LK" /> | |||
=== एक्सटेंशन === | === एक्सटेंशन === | ||
सामान्य वितरण की धारणा | सामान्य वितरण की धारणा प्रायिकता सिद्धांत में सबसे महत्वपूर्ण वितरण होने के कारण यूनीवेरिएट के मानक ढांचे से बहुत आगे तक बढ़ा दिया गया है, जो कि एक आयामी स्थिति (1) के रूप में है और इस प्रकार इन सभी विस्तारों को सामान्य या गाऊसी नियम भी कहा जाता है, इसलिए नामों में एक निश्चित अस्पष्टता उपस्थित होती है। | ||
* | * बहुभिन्नरूपी सामान्य वितरण के-आयामी [[यूक्लिडियन अंतरिक्ष|यूक्लिडियन स्थान]] में गॉसियन नियम का वर्णन करता है। एक सदिश {{nowrap|''X'' ∈ '''R'''<sup>''k''</sup>}} बहुभिन्नरूपी -सामान्य रूप से वितरित है यदि इसके घटकों का कोई रैखिक संयोजन {{nowrap|Σ{{su|p=''k''|b=''j''=1}}''a<sub>j</sub> X<sub>j</sub>''}} एक अविभाजित सामान्य वितरण है। इस प्रकार X का प्रसरण एक k×k सममित सकारात्मक-निश्चित आव्यूह V के रूप में है। बहुभिन्नरूपी सामान्य वितरण दीर्घवृत्ताकार वितरण का एक विशेष स्थिति है। जैसे, k = 2 स्थितियो में इसका आइसो-घनत्व लोकी दीर्घवृत्त हैं और यादृच्छिक k के स्थितियो में दीर्घवृत्त हैं। | ||
* [[संशोधित गाऊसी वितरण|संशोधित गाऊसी]] वितरण सामान्य वितरण का एक संशोधित संस्करण है जिसमें सभी | * [[संशोधित गाऊसी वितरण|संशोधित गाऊसी]] वितरण सामान्य वितरण का एक संशोधित संस्करण है जिसमें सभी ऋणात्मक तत्व 0 पर रीसमुच्चय हो जाते हैं | ||
* [[जटिल सामान्य वितरण|सम्मिश्र | * [[जटिल सामान्य वितरण|सम्मिश्र सामान्य]] वितरण सम्मिश्र सामान्य सदिश से संबंधित होते है। एक सम्मिश्र सदिश {{nowrap|''X'' ∈ '''C'''<sup>''k''</sup>}} सामान्य वितरण कहा जाता है यदि इसके वास्तविक और काल्पनिक दोनों घटक संयुक्त रूप से 2k-आयामी बहुभिन्नरूपी सामान्य वितरण होता है। इस प्रकार X की प्रसरण-सहप्रसरण संरचना को दो आव्यूहों द्वारा वर्णित किया जाता है, जबकि प्रसरण आव्यूह Γ और संबंध आव्यूह C के रूप में दर्शाया गया है। | ||
* आव्यूह सामान्य वितरण सामान्य रूप से वितरित आव्यूह के | * आव्यूह सामान्य वितरण सामान्य रूप से वितरित आव्यूह के स्थितियो का वर्णन करता है। | ||
* गॉसियन प्रक्रियाएं सामान्य रूप से वितरित स्टोकेस्टिक प्रक्रियाएं हैं। इन्हें कुछ अनंत-आयामी [[हिल्बर्ट अंतरिक्ष]] | * गॉसियन प्रक्रियाएं सामान्य रूप से वितरित स्टोकेस्टिक प्रक्रियाएं हैं। इन्हें कुछ अनंत-आयामी [[हिल्बर्ट अंतरिक्ष|हिल्बर्ट स्थान]] H के तत्वों के रूप में देखा जा सकता है और इस प्रकार सामान्य स्थितियो के लिए बहुभिन्नरूपी सामान्य सदिश के अनुरूप होती है {{nowrap|''k'' {{=}} ∞}}. एक यादृच्छिक तत्व {{nowrap|''h'' ∈ ''H''}} सामान्य कहा जाता है, यदि किसी स्थिरांक {{nowrap|''a'' ∈ ''H''}} के लिए अदिश गुणन {{nowrap|(''a'', ''h'')}} एक (अविभाजित) सामान्य वितरण है। ऐसे गॉसियन ऐसे यादृच्छिक तत्व की वेरिएंस संरचना को रैखिक सहप्रसरण ऑपरेटर K: H → H के संदर्भ में वर्णित किया जा सकता है। इस प्रकार कई गाऊसी प्रक्रियाएँ अपने स्वयं के नाम रखने के लिए बहुत लोकप्रिय हो गई है | ||
** | ** ब्राउनी गति | ||
** [[ब्राउनियन पुल]], | ** [[ब्राउनियन पुल|ब्राउनियन ब्रिज]], | ||
** | ** ऑर्नस्टीन-उहलेनबेक प्रक्रिया | ||
* [[गॉसियन क्यू-वितरण|गॉसियन | * [[गॉसियन क्यू-वितरण|गॉसियन q -]]वितरण एक सार गणितीय निर्माण है जो सामान्य वितरण के [[क्यू-एनालॉग|q -एनालॉग]] का प्रतिनिधित्व करता है। | ||
* [[क्ष-गाऊसी]] गॉसियन वितरण का एक एनालॉग है, इस अर्थ में कि यह सॉलिस | * q[[क्ष-गाऊसी|-गाऊसी]] गॉसियन वितरण का एक एनालॉग है, इस अर्थ में कि यह सॉलिस एंट्रॉp को अधिकतम करता है और एक प्रकार का सॉलिस वितरण है। ध्यान दें कि यह वितरण उपरोक्त गॉसियन q-वितरण से भिन्न होता है। | ||
* | * कनियादकिस κ-गाऊसी वितरण गॉसियन वितरण का एक सामान्यीकरण है, जो [[कनियादकिस वितरण|कनियादकिस]] वितरण से उत्पन्न होता है और जो कनियादाकिस वितरणों में से एक है। | ||
यदि यादृच्छिक चर X में वितरण होता है तो उसके पास दो खण्ड सामान्य वितरण के रूप में होते है। | |||
: <math> f_X( x ) = N( \mu, \sigma_1^2 ) \text{ if } x \le \mu</math> | : <math> f_X( x ) = N( \mu, \sigma_1^2 ) \text{ if } x \le \mu</math> | ||
: <math> f_X( x ) = N( \mu, \sigma_2^2 ) \text{ if } x \ge \mu</math> | : <math> f_X( x ) = N( \mu, \sigma_2^2 ) \text{ if } x \ge \mu</math> | ||
जहां μ माध्य है और σ<sub>1</sub> और | जहां μ माध्य है और σ<sub>1</sub> और σ<sub>2</sub> क्रमशः माध्य के बाएँ और दाएँ वितरण के मानक विचलन हैं। | ||
इस वितरण का माध्य, | इस वितरण का माध्य, वेरिएंस और तीसरा केंद्रीय मोमेंट निर्धारित किया जाता है,<ref name=John1982>{{cite journal|last1=John|first1=S|year=1982|title=The three parameter two-piece normal family of distributions and its fitting|journal=Communications in Statistics - Theory and Methods|volume=11|issue=8|pages=879–885|doi=10.1080/03610928208828279}}</ref> | ||
:<math> \operatorname{E}( X ) = \mu + \sqrt{\frac 2 \pi } ( \sigma_2 - \sigma_1 ) </math> | :<math> \operatorname{E}( X ) = \mu + \sqrt{\frac 2 \pi } ( \sigma_2 - \sigma_1 ) </math> | ||
:<math> \operatorname{V}( X ) = \left( 1 - \frac 2 \pi\right)( \sigma_2 - \sigma_1 )^2 + \sigma_1 \sigma_2 </math> | :<math> \operatorname{V}( X ) = \left( 1 - \frac 2 \pi\right)( \sigma_2 - \sigma_1 )^2 + \sigma_1 \sigma_2 </math> | ||
: <math> \operatorname{T}( X ) = \sqrt{ \frac 2 \pi}( \sigma_2 - \sigma_1 ) \left[ \left( \frac 4 \pi - 1 \right) ( \sigma_2 - \sigma_1)^2 + \sigma_1 \sigma_2 \right]</math> | : <math> \operatorname{T}( X ) = \sqrt{ \frac 2 \pi}( \sigma_2 - \sigma_1 ) \left[ \left( \frac 4 \pi - 1 \right) ( \sigma_2 - \sigma_1)^2 + \sigma_1 \sigma_2 \right]</math> | ||
जहाँ E(X), V(X) और T(X) क्रमशः माध्य, | जहाँ E(X), V(X) और T(X) क्रमशः माध्य, वेरिएंस और तीसरा केंद्रीय मोमेंट के रूप में होता है । | ||
गॉसियन | गॉसियन नियम के मुख्य व्यावहारिक उपयोगों में से एक व्यवहार में आने वाले कई भिन्न -भिन्न यादृच्छिक चरों के प्रयोगसिद्ध वितरण को मॉडल करना है। ऐसे स्थितियो में एक संभावित विस्तार वितरण का एक समृद्ध फॅमिली होता है, जिसमें दो से अधिक पैरामीटर होते है और इसलिए प्रयोगसिद्ध वितरण को अधिक अच्छे रूप से फिट करने में सक्षम होते है इस प्रकार एक्सटेंशन के उदाहरण होते है। | ||
* पियर्सन वितरण — प्रायिकता वितरण का एक चार-पैरामीटर फॅमिली जो विभिन्न | * पियर्सन वितरण — प्रायिकता वितरण का एक चार-पैरामीटर फॅमिली जो विभिन्न विषमता और कर्टोसिस मानों को सम्मलित करने के लिए सामान्य नियम का विस्तार करता है। | ||
* [[सामान्यीकृत सामान्य वितरण|सामान्यीकृत सामान्य | * [[सामान्यीकृत सामान्य वितरण|सामान्यीकृत सामान्य]] वितरण , जिसे घातांक घात वितरण के रूप में भी जाना जाता है और इस प्रकार मोटे या पतले ऐसिम्टाटिक व्यवहार के साथ वितरण टेल्ड की अनुमति देता है। | ||
== सांख्यिकीय निष्कर्ष == | == सांख्यिकीय निष्कर्ष == | ||
=== | === पैरामीटर का अनुमान === | ||
{{See also| | {{See also|अधिकतम संभावना $ सतत वितरण, सतत पैरामीटर स्थान|गॉसियन फलन मापदंडों का अनुमान}} | ||
अधिकांशतः ऐसा होता है कि हम सामान्य वितरण के | |||
अधिकांशतः ऐसा होता है कि हम सामान्य वितरण के पैरामीटर को नहीं जानते हैं, बल्कि इसके अतिरिक्त उन्हें [[अनुमान सिद्धांत]] से करना चाहते हैं। अर्थात एक सामान्य से <math>N(\mu, \sigma^2)</math> जनसंख्या से एक नमूना <math>(x_1, \ldots, x_n)</math> लेकर हम पैरामीटर के अनुमानित मानों को सीखना चाहते है और इस प्रकार <math>\mu</math> और <math>\sigma^2</math>. इस प्रॉब्लम का मानक दृष्टिकोण अधिकतम प्रायिकता विधि है, जिसके लिए लॉग-लाइबिलिटी फलन को अधिकतम करने की आवश्यकता होती है | |||
: <math> | : <math> | ||
\ln\mathcal{L}(\mu,\sigma^2) | \ln\mathcal{L}(\mu,\sigma^2) | ||
Line 497: | Line 495: | ||
= -\frac{n}{2}\ln(2\pi) - \frac{n}{2}\ln\sigma^2 - \frac{1}{2\sigma^2}\sum_{i=1}^n (x_i-\mu)^2. | = -\frac{n}{2}\ln(2\pi) - \frac{n}{2}\ln\sigma^2 - \frac{1}{2\sigma^2}\sum_{i=1}^n (x_i-\mu)^2. | ||
</math> | </math> | ||
<math>\mu</math> और <math>\sigma^2</math> के संबंध में अवकलन लेने और पहले क्रम की स्थितियों की परिणामी प्रणाली को हल करने से अधिकतम प्रायिकता अनुमान प्राप्त होता है, | |||
: <math> | : <math> | ||
\hat{\mu} = \overline{x} \equiv \frac{1}{n}\sum_{i=1}^n x_i, \qquad | \hat{\mu} = \overline{x} \equiv \frac{1}{n}\sum_{i=1}^n x_i, \qquad | ||
\hat{\sigma}^2 = \frac{1}{n} \sum_{i=1}^n (x_i - \overline{x})^2. | \hat{\sigma}^2 = \frac{1}{n} \sum_{i=1}^n (x_i - \overline{x})^2. | ||
</math> | </math><br /> | ||
==== नमूना मतलब ==== | ==== नमूना मतलब ==== | ||
{{See also| | {{See also|माध्य की मानक त्रुटि}} | ||
एस्टीमेटर <math>\mu</math> को नमूना माध्य कहा जाता है, क्योंकि यह सभी अवलोकनों का अंकगणितीय माध्य है। आँकड़ा <math>x</math>, <math>\mu</math> के लिए पूर्ण और पर्याप्त है और इसलिए लेहमैन-शेफ़े प्रमेय के अनुसार <math>\mu</math> समान रूप से न्यूनतम विचरण निष्पक्ष (यूएमवीयू) एस्टीमेटर है।.<ref name="Kri127">{{harvtxt |Krishnamoorthy |2006 |p=127 }}</ref> परिमित नमूनों में यह सामान्य रूप से वितरित किया जाता है: | |||
: <math> | : <math> | ||
\hat\mu \sim \mathcal{N}(\mu,\sigma^2/n). | \hat\mu \sim \mathcal{N}(\mu,\sigma^2/n). | ||
</math> | </math> | ||
इस | इस एस्टीमेटर का प्रसरण व्युत्क्रम फिशर सूचना आव्यूह <math>I-1</math> के μμ-तत्व के बराबर है। इसका तात्पर्य है कि एस्टीमेटर परिमित नमूना [[कुशल]] रूप में होते है। इस प्रकार व्यावहारिक महत्व का तथ्य यह है कि <math>\mu</math> की [[मानक त्रुटि (सांख्यिकी)]] <math>1/\sqrt{n}</math> के समानुपातिक होता है, अर्थात यदि कोई मानक त्रुटि को 10 के गुणक से घटाना चाहता है, तो उसे नमूने में अंकों की संख्या 100 के गुणक से बढ़ानी होती है। यह तथ्य जनमत सर्वेक्षणों के लिए नमूना आकार और [[मोंटे कार्लो सिमुलेशन]] में परीक्षणों की संख्या को निर्धारित करने में व्यापक रूप से उपयोग किया जाता है। | ||
[[स्पर्शोन्मुख सिद्धांत (सांख्यिकी)|ऐसिम्टाटिक | [[स्पर्शोन्मुख सिद्धांत (सांख्यिकी)|ऐसिम्टाटिक सिद्धांत (सांख्यिकी)]] के दृष्टिकोण से <math>\mu</math> संगत एस्टीमेटर है, अर्थात, यह [[संभाव्यता में अभिसरण|प्रायिकता में अभिसरण]] <math>\mu</math> के रूप में है, जैसा <math>n\rightarrow\infty</math>. एस्टीमेटर भी [[स्पर्शोन्मुख सामान्यता|ऐसिम्टाटिक सामान्यता]] है, जो इस तथ्य का एक सरल परिणाम है कि यह परिमित नमूनों में सामान्य है: | ||
: <math> | : <math> | ||
\sqrt{n}(\hat\mu-\mu) \,\xrightarrow{d}\, \mathcal{N}(0,\sigma^2). | \sqrt{n}(\hat\mu-\mu) \,\xrightarrow{d}\, \mathcal{N}(0,\sigma^2). | ||
</math> | </math> | ||
==== नमूना वेरिएंस ==== | |||
{{See also|मानक वेरियन्स$अनुमान|वेरियन्स$अनुमान}} | |||
एस्टीमेटर <math>(x1.....xn)</math>को नमूना प्रसरण कहा जाता है, क्योंकि यह नमूने का प्रसरण गणित <math>\sigma^2</math> है और इस प्रकार अभ्यास में,और इस प्रकार के अतिरिक्त अधिकांशतः एक अन्य एस्टीमेटर का उपयोग किया जाता है। यह अन्य एस्टीमेटर <math>s^2</math>से निरूपित करते है और इसे नमूना वेरिएंस भी कहा जाता है, जो शब्दावली में एक निश्चित अस्पष्टता का प्रतिनिधित्व करता है और इसका वर्गमूल <math>s</math> नमूना मानक विचलन कहा जाता है। एस्टीमेटर <math>s^2</math>, <math>\sigma^2</math> से भिन्न होता है और {{nowrap|(''n'' − 1)}} भाजक में n के अतिरिक्त तथाकथित बेसेल होता है | |||
: <math> | : <math> | ||
s^2 = \frac{n}{n-1} \hat\sigma^2 = \frac{1}{n-1} \sum_{i=1}^n (x_i - \overline{x})^2. | s^2 = \frac{n}{n-1} \hat\sigma^2 = \frac{1}{n-1} \sum_{i=1}^n (x_i - \overline{x})^2. | ||
</math> | </math> | ||
बीच में अंतर <math>s^2</math> और < | बीच में अंतर <math>s^2</math> और <math>\sigma^2</math> बड़े n के लिए नगण्य रूप से छोटा हो जाता है। चूंकि परिमित नमूनों में, के उपयोग के p छे की प्रेरणा <math>s^2</math> के रूप में यह है कि यह अंतर्निहित पैरामीटर का निष्पक्ष एस्टीमेटर <math>\sigma^2</math> है, जबकि <<math>\sigma^2</math> पक्षपातपूर्ण है। इसके अतिरिक्त , लेहमन-शेफ़े प्रमेय द्वारा एस्टीमेटर गणित <math>\sigma^2</math> समान रूप से न्यूनतम भिन्नता निष्पक्ष अनुमानक है,<ref name="Kri127" /> जो इसे सभी निष्पक्ष लोगों के बीच सबसे अच्छा एस्टीमेटर बनाता है। चूंकि यह दिखाया जा सकता है कि पक्षपाती एस्टीमेटर <math>\sigma^2</math> से अच्छे से है और इस प्रकार माध्य वर्ग त्रुटि (एमएसई) मानदंड के संदर्भ में <math>s^2</math> के रूप में होती है। परिमित नमूनों में दोनों <math>s^2</math> और <math>\sigma^2</math> के साथ स्केल किया हुआ ची-वर्ग वितरण {{nowrap|(''n'' − 1)}} स्वतंत्र की कोटियां होती है | ||
: <math> | : <math> | ||
s^2 \sim \frac{\sigma^2}{n-1} \cdot \chi^2_{n-1}, \qquad | s^2 \sim \frac{\sigma^2}{n-1} \cdot \chi^2_{n-1}, \qquad | ||
\hat\sigma^2 \sim \frac{\sigma^2}{n} \cdot \chi^2_{n-1}. | \hat\sigma^2 \sim \frac{\sigma^2}{n} \cdot \chi^2_{n-1}. | ||
</math> | </math> | ||
इन | इन अभिव्यक्ति में से पहला दर्शाता है कि <math>s^2</math> का वेरिएंस <math>2\sigma^4/(n-1)</math> के बराबर है, जो व्युत्क्रम फ़िशर सूचना आव्यूह <math>I-1</math> के σσ-तत्व से थोड़ा अधिक होता है। इस प्रकार, <math>s^2</math> के लिए एक कुशल आकलनकर्ता के रूप में <math>\sigma^2</math>नहीं है और इसके अतिरिक्त <math>s^2</math> UMVU के रूप में होते है, हम यह निष्कर्ष निकाल सकते हैं कि परिमित-नमूना कुशल एस्टीमेटर के लिए <math>\sigma^2</math> उपस्थित नहीं होता है। | ||
ऐसिम्टाटिक | ऐसिम्टाटिक सिद्धांत को प्रयुक्त करना, दोनों एस्टीमेटर <math>s^2</math> और <math>\sigma^2</math> संगत हैं, अर्थात वे प्रायिकता में अभिमुख होते है <math>\sigma^2</math> नमूना आकार के रूप में <math>n\longrightarrow\infty</math> होते है, दोनों अनुमानक भी स्पर्शोन्मुख रूप से सामान्य हैं, | ||
: <math> | : <math> | ||
\sqrt{n}(\hat\sigma^2 - \sigma^2) \simeq | \sqrt{n}(\hat\sigma^2 - \sigma^2) \simeq | ||
\sqrt{n}(s^2-\sigma^2) \,\xrightarrow{d}\, \mathcal{N}(0,2\sigma^4). | \sqrt{n}(s^2-\sigma^2) \,\xrightarrow{d}\, \mathcal{N}(0,2\sigma^4). | ||
</math> | </math> | ||
विशेष रूप से, दोनों | विशेष रूप से, दोनों एस्टीमेटर <math>\sigma^2</math>.के लिए स्पर्शोन्मुख रूप से कुशल हैं | ||
=== कॉन्फिडेंस अंतराल === | === कॉन्फिडेंस अंतराल === | ||
{{See also| | {{See also|विद्यार्थीकरण|3-सिग्मा नियम}} | ||
कोचरन के प्रमेय के अनुसार, सामान्य वितरण के लिए नमूने का | |||
कोचरन के प्रमेय के अनुसार, सामान्य वितरण के लिए नमूने का अर्थ <math>\mu</math> और नमूना प्रसरण s<sup>2</sup> स्वतंत्र (प्रायिकता सिद्धांत हैं, जिसका अर्थ है कि उनके [[संयुक्त वितरण|संयुक्त]] वितरण पर विचार करने से कोई लाभ नहीं हो सकता है। एक विलोम प्रमेय भी है, यदि एक नमूने में नमूना माध्य और नमूना वेरिएंस स्वतंत्र रूप में हैं, तो नमूना सामान्य वितरण के रूप में आया होता है । तथाकथित t-सांख्यिकी के निर्माण के लिए <math>\mu</math> और s के बीच की स्वतंत्र को नियोजित किया जा सकता है, | |||
: गणित> | : गणित> | ||
t = \frac{\hat\mu-\mu}{s/\sqrt{n}} = \frac{\overline{x}-\mu}{\sqrt{\frac{1}{n(n-1) )}\sum(x_i-\overline{x})^2}} \sim t_{n-1} | |||
<nowiki> </nowiki></ गणित> | |||
इस क्वांटाइल t में छात्र का t-वितरण | इस क्वांटाइल t में छात्र का t-वितरण {{nowrap|(''n'' − 1)}} है, इस प्रकार स्वतंत्र की डिग्री और यह एक सहायक आँकड़ा पैरामीटर के मान से स्वतंत्र है। इस t-सांख्यिकी के वितरण को बदलने से हमें μ के लिए कॉन्फिडेंस अंतराल का निर्माण करने की अनुमति मिलती है;<ref>{{harvtxt |Krishnamoorthy |2006 |p=130 }}</ref> इसी तरह, आँकड़ा s<sup>2</sup> के χ<sup>2</sup> वितरण को उलटने से हमें σ<sup>2</sup> के लिए कॉन्फ़िडेंस इंटरवल देता है:<ref>{{harvtxt |Krishnamoorthy |2006 |p=133 }}</ref> | ||
:<math>\mu \in \left[ \hat\mu - t_{n-1,1-\alpha/2} \frac{1}{\sqrt{n}}s, | :<math>\mu \in \left[ \hat\mu - t_{n-1,1-\alpha/2} \frac{1}{\sqrt{n}}s, | ||
\hat\mu + t_{n-1,1-\alpha/2} \frac{1}{\sqrt{n}}s \right],</math> | \hat\mu + t_{n-1,1-\alpha/2} \frac{1}{\sqrt{n}}s \right],</math> | ||
:<math>\sigma^2 \in \left[ \frac{(n-1)s^2}{\chi^2_{n-1,1-\alpha/2}}, | :<math>\sigma^2 \in \left[ \frac{(n-1)s^2}{\chi^2_{n-1,1-\alpha/2}}, | ||
\frac{(n-1)s^2}{\chi^2_{n-1,\alpha/2}} \right],</math> | \frac{(n-1)s^2}{\chi^2_{n-1,\alpha/2}} \right],</math> | ||
जहां | जहां t<sub>k,p</sub>और {{SubSup|χ|''k,p''|2}} क्रमशः t- और χ<sup>2</sup> वितरण की pth मात्राएँ हैं। ये कॉन्फिडेंस इंटरवल [[आत्मविश्वास स्तर|आत्मकॉन्फिडेंस स्तर]] {{nowrap|1 − ''α''}} के होते हैं, जिसका अर्थ है कि ट्रू मान μ और σ<sup>2</sup> प्रायिकता या सार्थकता स्तर α के साथ इन अंतरालों के बाहर आते हैं। इस प्रकार व्यवहार में लोग सामान्यतः {{nowrap|''α'' {{=}} 5%}} लेते हैं, जिसके परिणामस्वरूप 95% कॉन्फिडेंस अंतराल के रूप में होता है। | ||
अनुमानित सूत्र <math style= vertical-align:-.3em >\textstyle\hat\mu</math> और s के असिम्प्टोटिक वितरण से प्राप्त किए जा सकते हैं। | अनुमानित सूत्र <math style= vertical-align:-.3em >\textstyle\hat\mu</math> और s<sup>2</sup> के असिम्प्टोटिक वितरण से प्राप्त किए जा सकते हैं। | ||
:<math>\mu \in | :<math>\mu \in | ||
\left[ \hat\mu - |z_{\alpha/2}|\frac{1}{\sqrt n}s, | \left[ \hat\mu - |z_{\alpha/2}|\frac{1}{\sqrt n}s, | ||
Line 558: | Line 555: | ||
\left[ s^2 - |z_{\alpha/2}|\frac{\sqrt{2}}{\sqrt{n}}s^2, | \left[ s^2 - |z_{\alpha/2}|\frac{\sqrt{2}}{\sqrt{n}}s^2, | ||
s^2 + |z_{\alpha/2}|\frac{\sqrt{2}}{\sqrt{n}}s^2 \right],</math> | s^2 + |z_{\alpha/2}|\frac{\sqrt{2}}{\sqrt{n}}s^2 \right],</math> | ||
अनुमानित सूत्र n के बड़े मानों के लिए मान्य हो जाते हैं | अनुमानित सूत्र n के बड़े मानों के लिए मान्य रूप में हो जाते हैं और और मैन्युअल गणना के लिए अधिक सुविधाजनक होते हैं क्योंकि मानक सामान्य क्वांटाइल्स z<sub>''α''/2</sub> n पर निर्भर नहीं होती हैं। विशेष रूप से सबसे लोकप्रिय मान {{nowrap|''α'' {{=}} 5%}}, का परिणाम {{nowrap|{{!}}''z''<sub>0.025</sub>{{!}} {{=}} [[1.96]]}} के रूप में होता है, | ||
=== | === सामान्य टेस्ट्स === | ||
{{Main| | {{Main|नोर्मेलिटी टेस्ट्स }} | ||
सामान्यता टेस्ट्स इस प्रायिकता का आकलन करते हैं कि दिए गए डेटा समुच्चय {x<sub>1</sub>, ..., x<sub>n</sub>} सामान्य वितरण के रूप में होता है। सामान्यतः शून्य परिकल्पना H<sub>0</sub> यह है कि टेस्ट्स सामान्य रूप से अनिर्दिष्ट माध्य μ और वेरिएंस σ<sup>2</sup> के साथ वितरित किए जाते हैं और इस प्रकार वैकल्पिक H<sub>a</sub> कि वितरण यादृच्छिक है। इस प्रॉब्लम के लिए कई टेस्ट्स 40 से अधिक तैयार किए गए हैं। उनमें से अधिक प्रमुख नीचे उल्लिखित हैं | |||
''मोमेंट -आधारित | 'नैदानिक प्लॉट' अधिक सहज रूप से आकर्षक लेकिन एक ही समय में व्यक्तिपरक होते हैं, क्योंकि वे शून्य परिकल्पना को स्वीकार या अस्वीकार करने के लिए अनौपचारिक मानवीय निर्णय पर भरोसा करते हैं। | ||
* डी'ऑगस्टिनो का | * q -q प्लॉट, जिसे सामान्य प्रायिकता प्लॉट या रैंकिट प्लॉट के रूप में भी जाना जाता है - मानक सामान्य वितरण से संबंधित मात्राओं के अपेक्षित मानों के विरुद्ध डेटा समुच्चय से क्रमबद्ध मानों का एक प्लॉट है और इस प्रकार यह फॉर्म के बिंदु का एक प्लॉट (Φ<sup>-1</sup>(p<sub>k</sub>), x<sub>(''k'')</sub>) है, जहां प्लॉटिंग पॉइंट p<sub>k,</sub> ''p<sub>k</sub>'' = (''k'' − ''α'')/(''n'' + 1 − 2''α'') के बराबर हैं और α एक समायोजन स्थिरांक है, जो 0 और 1 के बीच कुछ भी हो सकता है। यदि शून्य परिकल्पना सत्य है, तो प्लॉट किए गए बिंदुओं को लगभग एक सीधी रेखा पर स्थित होना चाहिए। | ||
* जर्क-बेरा | * p -p प्लॉट - q -q प्लॉट के समान, लेकिन बहुत कम बार उपयोग किया जाता है। इस पद्धति में बिंदुओं की आलेखित करना सम्मलित है (Φ(z<sub>(''k'')</sub>), p <sub>k</sub>), जहाँ <math>\textstyle z_{(k)} = (x_{(k)}-\hat\mu)/\hat\sigma</math>. सामान्य रूप से वितरित डेटा के लिए यह प्लॉट (0, 0) और (1, 1) के बीच 45° रेखा पर स्थित होता है। | ||
* शापिरो-विल्क | |||
'' | ====== फिट टेस्ट की गुडनेस : ====== | ||
* एंडरसन-डार्लिंग | ''मोमेंट -आधारित टेस्ट'' : | ||
* लिलिफ़ोर्स | * डी'ऑगस्टिनो का k-स्क्वेर्ड टेस्ट | ||
* जर्क-बेरा टेस्ट | |||
* शापिरो-विल्क टेस्ट : यह इस तथ्य पर आधारित है कि q -q प्लॉट में रेखा का प्रवणता ''σ'' है। इस प्रकार टेस्ट्स नमूना वेरिएंस के मान के साथ उस प्रवणता के कम से कम वर्गों के अनुमान की तुलना करता है और यदि ये दो मात्राएँ महत्वपूर्ण रूप से भिन्न हैं, तो शून्य परिकल्पना को अस्वीकार कर देता है। | |||
''प्रयोगसिद्ध वितरण फलन के आधार पर टेस्ट'' : | |||
* एंडरसन-डार्लिंग टेस्ट | |||
* लिलिफ़ोर्स टेस्ट्स (कोल्मोगोरोव-स्मिर्नोव टेस्ट्स का एक रूपांतर) | |||
=== सामान्य वितरण का बायेसियन विश्लेषण === | === सामान्य वितरण का बायेसियन विश्लेषण === | ||
सामान्य रूप से वितरित डेटा का बायेसियन विश्लेषण कई | सामान्य रूप से वितरित डेटा का बायेसियन विश्लेषण कई भिन्न -भिन्न संभावनाओं के रूप में सम्मिश्र है जिन पर विचार किया जा सकता है, | ||
* या तो माध्य | * या तो माध्य या प्रसरण या दोनों में से किसी को भी निश्चित क्वांटाइल नहीं माना जा सकता है। | ||
* जब भिन्नता अज्ञात होती है, तो विश्लेषण सीधे भिन्नता के संदर्भ में | * जब भिन्नता अज्ञात होती है, तो विश्लेषण सीधे भिन्नता के संदर्भ में या परिशुद्धता (सांख्यिकी) भिन्नता के पारस्परिक के संदर्भ में किया जा सकता है। सूत्रों को सटीकता के रूप में व्यक्त करने का कारण यह है कि अधिकांश स्थितियो का विश्लेषण सरल रूप में होता है। | ||
* दोनों अविभाज्य और | * दोनों अविभाज्य और बहुभिन्न रूपी सामान्य वितरण स्थितियो पर विचार करने की आवश्यकता है। | ||
* अज्ञात चर पर या तो संयुग्म पूर्व या [[अनुचित पूर्व]] वितरण | * अज्ञात चर पर या तो संयुग्म पूर्व या [[अनुचित पूर्व]] वितरण के रूप में होते है । | ||
* [[बायेसियन रैखिक प्रतिगमन]] में | * [[बायेसियन रैखिक प्रतिगमन]] में स्थितियो का एक अतिरिक्त समुच्चय होता है, जहां मूल मॉडल में डेटा को सामान्य रूप से वितरित माना जाता है और सामान्य प्रायर को [[प्रतिगमन गुणांक]] पर रखा जाता है। इस प्रकार परिणामी विश्लेषण स्वतंत्र रूप से वितरित डेटा के मूल स्थितियो के समान है। | ||
गैर-रैखिक-प्रतिगमन | गैर-रैखिक-प्रतिगमन स्थितियो के सूत्रों को संयुग्मित पूर्व लेख में संक्षेपित किया गया है। | ||
==== दो द्विघातों का योग ==== | ==== दो द्विघातों का योग ==== | ||
===== अदिश रूप ===== | ===== अदिश रूप ===== | ||
निम्नलिखित सहायक सूत्र [[पश्च वितरण| | निम्नलिखित सहायक सूत्र [[पश्च वितरण|पोस्टीरियर]] वितरण अद्यतन समीकरणों को सरल बनाने के लिए उपयोगी है, जो अन्यथा बहुत कठिन रूप में होते है। | ||
:<math>a(x-y)^2 + b(x-z)^2 = (a + b)\left(x - \frac{ay+bz}{a+b}\right)^2 + \frac{ab}{a+b}(y-z)^2</math> | :<math>a(x-y)^2 + b(x-z)^2 = (a + b)\left(x - \frac{ay+bz}{a+b}\right)^2 + \frac{ab}{a+b}(y-z)^2</math> | ||
यह समीकरण वर्गों का विस्तार करके, x में पदों को समूहित | यह समीकरण वर्गों का विस्तार करके, x में पदों को समूहित करते है और वर्ग को पूरा करके x में दो द्विघातों के योग को फिर से लिखता है। कुछ शर्तों से जुड़े सम्मिश्र निरंतर कारकों के बारे में निम्नलिखित पर ध्यान देते है | ||
# कारण <math>\frac{ay+bz}{a+b}</math> y और z के भारित औसत का रूप है। | # कारण <math>\frac{ay+bz}{a+b}</math> y और z के भारित औसत का रूप है। | ||
# <math>\frac{ab}{a+b} = \frac{1}{\frac{1}{a}+\frac{1}{b}} = (a^{-1} + b^{-1})^{-1}.</math> इससे पता चलता है कि इस कारक को एक ऐसी स्थिति के परिणामस्वरूप माना जा सकता है जहां मात्राओं के गुणक व्युत्क्रम a और b सीधे जुड़ते हैं, इसलिए a और b को संयोजित करने के लिए, परिणाम को फिर से प्राप्त करना, जोड़ना और पुनः प्राप्त करना आवश्यक है। | # <math>\frac{ab}{a+b} = \frac{1}{\frac{1}{a}+\frac{1}{b}} = (a^{-1} + b^{-1})^{-1}.</math> इससे पता चलता है कि इस कारक को एक ऐसी स्थिति के परिणामस्वरूप माना जा सकता है, जहां मात्राओं के गुणक व्युत्क्रम a और b सीधे जुड़ते हैं, इसलिए a और b को संयोजित करने के लिए, परिणाम को फिर से प्राप्त करना, मूल इकाइयाँ को जोड़ना और पुनः प्राप्त करना आवश्यक होता है। यह उसी तरह का ऑपरेशन है जो [[अनुकूल माध्य]] द्वारा किया जाता है, इसलिए यह आश्चर्यजनक नहीं है <math>\frac{ab}{a+b}</math> a और b का वन हाफ हार्मोनिक माध्य है। | ||
===== सदिश रूप ===== | ===== सदिश रूप ===== | ||
दो | दो सदिश चतुष्कोणों के योग के लिए एक समान सूत्र लिखा जा सकता है, यदि x, y, z लंबाई ''k'' के सदिश हैं और A और B सममित आव्यूह के रूप में हैं और आकार के व्युत्क्रमणीय आव्यूह <math>k\times k</math>, तब इस प्रकार हैं, | ||
:<math> | :<math> | ||
Line 609: | Line 607: | ||
:<math>\mathbf{c} = (\mathbf{A} + \mathbf{B})^{-1}(\mathbf{A}\mathbf{y} + \mathbf{B} \mathbf{z}) </math> | :<math>\mathbf{c} = (\mathbf{A} + \mathbf{B})^{-1}(\mathbf{A}\mathbf{y} + \mathbf{B} \mathbf{z}) </math> | ||
ध्यान दें कि रूप x′ A x को द्विघात रूप कहा जाता है और यह एक [[अदिश (गणित)]] है | ध्यान दें कि रूप x′ A x को द्विघात रूप कहा जाता है और यह एक [[अदिश (गणित)]] है | ||
:<math>\mathbf{x}'\mathbf{A}\mathbf{x} = \sum_{i,j}a_{ij} x_i x_j</math> | :<math>\mathbf{x}'\mathbf{A}\mathbf{x} = \sum_{i,j}a_{ij} x_i x_j</math> | ||
दूसरे शब्दों में, यह x से तत्वों के जोड़े के | दूसरे शब्दों में, यह x से तत्वों के जोड़े के गुणन के सभी संभावित संयोजनों को जोड़ता है, प्रत्येक के लिए एक भिन्न गुणांक का सारांश देता इसके अतिरिक्त है, चूंकि <math>x_i x_j = x_j x_i</math>, केवल योग <math>a_{ij} + a_{ji}</math> a के किसी भी ऑफ-डायगोनल तत्वों के लिए मायने रखता है और यह मानने में व्यापकता का कोई नुकसान नहीं है कि a सममित आव्यूह है। इसके अतिरिक्त यदि a सममित है, तो फॉर्म <math>\mathbf{x}'\mathbf{A}\mathbf{y} = \mathbf{y}'\mathbf{A}\mathbf{x}.</math> के रूप में होते है | ||
==== माध्य से भिन्नताओं का योग ==== | ==== माध्य से भिन्नताओं का योग ==== | ||
एक अन्य उपयोगी सूत्र इस प्रकार है: | एक अन्य उपयोगी सूत्र इस प्रकार है: | ||
<math display="block">\sum_{i=1}^n (x_i-\mu)^2 = \sum_{i=1}^n (x_i-\bar{x})^2 + n(\bar{x} -\mu)^2</math> | <math display="block">\sum_{i=1}^n (x_i-\mu)^2 = \sum_{i=1}^n (x_i-\bar{x})^2 + n(\bar{x} -\mu)^2</math> | ||
जहाँ | जहाँ <math display="inline">\bar{x} = \frac{1}{n} \sum_{i=1}^n x_i.</math> | ||
=== ज्ञात वेरिएंस के साथ === | |||
i.i.d के एक समुच्चय के लिए सामान्य रूप से वितरित डेटा बिंदु X का आकार ''n'' है, जहां प्रत्येक व्यक्तिगत बिंदु ''x'' का अनुसरण करता है इस प्रकार <math>x \sim \mathcal{N}(\mu, \sigma^2)</math> ज्ञात वेरिएंस σ<sup>2</sup> के साथ संयुग्म पूर्व वितरण भी सामान्य रूप से वितरित किया जाता है। | |||
प्रसरण को परिशुद्धता सांख्यिकी के रूप में फिर से लिखकर, अर्थात τ = 1/σ<sup>2 का उपयोग करके इसे अधिक आसानी से दिखाया जा सकता है। तो यदि <math>x \sim \mathcal{N}(\mu, 1/\tau)</math> और <math>\mu \sim \mathcal{N}(\mu_0, 1/\tau_0),</math> हम निम्नानुसार आगे बढ़ते हैं। | |||
सबसे पहले, प्रायिकता फलन माध्य से अंतर के योग के लिए उपरोक्त सूत्र का उपयोग करता है | |||
सबसे पहले, | |||
:<math>\begin{align} | :<math>\begin{align} | ||
Line 642: | Line 637: | ||
&\propto \exp\left(-\frac{1}{2}(n\tau + \tau_0)\left(\mu - \dfrac{n\tau \bar{x} + \tau_0\mu_0}{n\tau + \tau_0}\right)^2\right) | &\propto \exp\left(-\frac{1}{2}(n\tau + \tau_0)\left(\mu - \dfrac{n\tau \bar{x} + \tau_0\mu_0}{n\tau + \tau_0}\right)^2\right) | ||
\end{align}</math> | \end{align}</math> | ||
उपरोक्त अवकलज | उपरोक्त अवकलज में, हमने दो द्विघातों के योग के लिए उपरोक्त सूत्र का उपयोग किया और μ को सम्मलित न करने वाले सभी स्टेबल कारकों को हटा दिया है। परिणाम औसत के साथ सामान्य वितरण का कर्नेल सांख्यिकी <math>\frac{n\tau \bar{x} + \tau_0\mu_0}{n\tau + \tau_0}</math> और सटीकता <math>n\tau + \tau_0</math> है, अर्थात। | ||
:<math>p(\mu\mid\mathbf{X}) \sim \mathcal{N}\left(\frac{n\tau \bar{x} + \tau_0\mu_0}{n\tau + \tau_0}, \frac{1}{n\tau + \tau_0}\right)</math> | :<math>p(\mu\mid\mathbf{X}) \sim \mathcal{N}\left(\frac{n\tau \bar{x} + \tau_0\mu_0}{n\tau + \tau_0}, \frac{1}{n\tau + \tau_0}\right)</math> | ||
इसे पूर्व | इसे पूर्व पैरामीटर के संदर्भ में पोस्टीरियर पैरामीटर के लिए बायेसियन अद्यतन समीकरणों के एक समुच्चय के रूप में लिखा जा सकता है | ||
:<math>\begin{align} | :<math>\begin{align} | ||
Line 652: | Line 647: | ||
\bar{x} &= \frac{1}{n}\sum_{i=1}^n x_i | \bar{x} &= \frac{1}{n}\sum_{i=1}^n x_i | ||
\end{align}</math> | \end{align}</math> | ||
अर्थात nτ की कुल सटीकता के साथ n डेटा बिंदुओं को संयोजित करने के लिए या समकक्ष, n/σ<sup>2</sup> का कुल प्रसरण और मानों का माध्य <math>\bar{x}</math>, डेटा की कुल सटीकता को पूर्व कुल परिशुद्धता में जोड़कर एक नई कुल सटीकता प्राप्त करता है और एक सटीक-भारित औसत के माध्यम से एक नया माध्य बनाता है, अर्थात डेटा का भारित औसत और पूर्व माध्य का भारित औसत प्रत्येक को संबंधित कुल परिशुद्धता द्वारा भारित किया जाता है। यह तर्कसंगत समझ में आता है यदि सटीकता को टिप्पणियों की निश्चितता के संकेत के रूप में माना जाता है पोस्टीरियर माध्य के वितरण में प्रत्येक इनपुट घटक को इसकी निश्चितता से भारित किया जाता है और इस वितरण की निश्चितता व्यक्तिगत निश्चितताओं का योग है, इसके अंतर्ज्ञान के लिए उस अभिव्यक्ति की तुलना करते है जो संपूर्ण है या उसके भागों के योग से अधिक है। इसके अतिरिक्त , विचार करते है कि पोस्टीरियर का ज्ञान पूर्व और प्रायिकता के ज्ञान के संयोजन से आता है, इसलिए यह समझ में आता है कि हम इसके किसी भी घटक की तुलना में इसके बारे में अधिक निश्चित हैं। | |||
उपरोक्त सूत्र से पता चलता है कि सटीकता के संदर्भ में सामान्य वितरण के लिए संयुग्मित | उपरोक्त सूत्र से पता चलता है कि सटीकता के संदर्भ में सामान्य वितरण के लिए संयुग्मित प्रायर का [[बायेसियन विश्लेषण]] करना अधिक सुविधाजनक होता है। पोस्टीरियर परिशुद्धता केवल पूर्व और प्रायिकता की सटीकता का योग है और पोस्टीरियर माध्य की गणना एक सटीक-भारित औसत के माध्यम से की जाती है, जैसा कि ऊपर वर्णित है। समान सूत्रों को वेरिएंस के रूप में लिखा जा सकता है और इस प्रकार सभी पूर्वसूचकों का आदान-प्रदान करके अधिक अजली सूत्रों को जनरेटिंग किया जा सकता है | ||
:<math>\begin{align} | :<math>\begin{align} | ||
Line 664: | Line 659: | ||
==== ज्ञात माध्य के साथ ==== | ==== ज्ञात माध्य के साथ ==== | ||
i.i.d के एक | i.i.d के एक समुच्चय के लिए सामान्य रूप से वितरित डेटा बिंदु X का आकार ''n'' है जहां प्रत्येक व्यक्तिगत बिंदु ''x'' अनुसरण करता है <math>x \sim \mathcal{N}(\mu, \sigma^2)</math> ज्ञात माध्य μ के साथ, वेरिएंस से पहले के संयुग्म में एक व्युत्क्रम गामा वितरण या एक स्केल्ड व्युत्क्रम ची-वर्ग वितरण होता है। इस प्रकार भिन्न -भिन्न पैरामीटर होने के अतिरिक्त दोनों समान हैं। यद्यपि व्युत्क्रम गामा का अधिक सामान्य रूप से उपयोग किया जाता है, हम सुविधा के लिए स्केल्ड व्युत्क्रम ची-वर्ग का उपयोग करते हैं। σ<sup>2</sup> के लिए प्रायर इस प्रकार है, | ||
:<math>p(\sigma^2\mid\nu_0,\sigma_0^2) = \frac{(\sigma_0^2\frac{\nu_0}{2})^{\nu_0/2}}{\Gamma\left(\frac{\nu_0}{2} \right)}~\frac{\exp\left[ \frac{-\nu_0 \sigma_0^2}{2 \sigma^2}\right]}{(\sigma^2)^{1+\frac{\nu_0}{2}}} \propto \frac{\exp\left[ \frac{-\nu_0 \sigma_0^2}{2 \sigma^2}\right]}{(\sigma^2)^{1+\frac{\nu_0}{2}}}</math> | :<math>p(\sigma^2\mid\nu_0,\sigma_0^2) = \frac{(\sigma_0^2\frac{\nu_0}{2})^{\nu_0/2}}{\Gamma\left(\frac{\nu_0}{2} \right)}~\frac{\exp\left[ \frac{-\nu_0 \sigma_0^2}{2 \sigma^2}\right]}{(\sigma^2)^{1+\frac{\nu_0}{2}}} \propto \frac{\exp\left[ \frac{-\nu_0 \sigma_0^2}{2 \sigma^2}\right]}{(\sigma^2)^{1+\frac{\nu_0}{2}}}</math> | ||
उपरोक्त प्रायिकता फलन वेरिएंस के संदर्भ में लिखा गया है: | |||
:<math>\begin{align} | :<math>\begin{align} | ||
Line 684: | Line 679: | ||
&= \frac{1}{(\sigma^2)^{1+\frac{\nu_0+n}{2}}} \exp\left[-\frac{\nu_0 \sigma_0^2 + S}{2\sigma^2}\right] | &= \frac{1}{(\sigma^2)^{1+\frac{\nu_0+n}{2}}} \exp\left[-\frac{\nu_0 \sigma_0^2 + S}{2\sigma^2}\right] | ||
\end{align}</math> | \end{align}</math> | ||
उपरोक्त एक स्केल्ड इनवर्स ची-स्क्वेर्ड वितरण है जहाँ | |||
:<math>\begin{align} | :<math>\begin{align} | ||
Line 696: | Line 691: | ||
{\sigma_0^2}' &= \frac{\nu_0 \sigma_0^2 + \sum_{i=1}^n (x_i-\mu)^2}{\nu_0+n} | {\sigma_0^2}' &= \frac{\nu_0 \sigma_0^2 + \sum_{i=1}^n (x_i-\mu)^2}{\nu_0+n} | ||
\end{align}</math> | \end{align}</math> | ||
व्युत्क्रम गामा वितरण के संदर्भ में पुनर्मान | व्युत्क्रम गामा वितरण के संदर्भ में पुनर्मान के रूप में अंकन परिणाम है: | ||
:<math>\begin{align} | :<math>\begin{align} | ||
Line 704: | Line 699: | ||
==== अज्ञात माध्य और अज्ञात | ==== अज्ञात माध्य और अज्ञात वेरिएंस के साथ ==== | ||
i.i.d के एक | i.i.d के एक समुच्चय के लिए सामान्य रूप से वितरित डेटा बिंदु X का आकार ''n'' है जहां प्रत्येक व्यक्तिगत बिंदु ''x'' अनुसरण करता है <math>x \sim \mathcal{N}(\mu, \sigma^2)</math> इस प्रकार अज्ञात माध्य μ और अज्ञात वेरिएंस σ<sup>2</sup> के साथ एक संयुक्त बहुभिन्नरूपी संयुग्म पूर्व को माध्य और वेरिएंस पर रखा जाता है, जिसमें [[सामान्य-उलटा-गामा वितरण|सामान्य- व्युत्क्रम -गामा]] वितरण के रूप में सम्मलित है। तर्कसंगत रूप से, यह निम्नानुसार उत्पन्न होता है, | ||
# अज्ञात माध्य लेकिन ज्ञात वेरिएंस वाले स्थितियो के विश्लेषण से, हम देखते हैं कि अद्यतन समीकरणों में डेटा से गणना किए गए पर्याप्त आँकड़े के रूप में सम्मलित होते हैं, जिसमें डेटा बिंदुओं का माध्य और डेटा बिंदुओं की संख्या से विभाजित ज्ञात विचरण से बदले में गणना किए गए डेटा बिंदुओं का कुल विचरण सम्मलित होता है। | |||
# अज्ञात माध्य लेकिन ज्ञात | # अज्ञात वेरिएंस लेकिन ज्ञात माध्य वाले स्थितियो के विश्लेषण से, हम देखते हैं कि अद्यतन समीकरणों में डेटा बिंदुओं की संख्या और अज्ञात विचलन के योग वाले डेटा पर पर्याप्त आँकड़े सम्मलित हैं। | ||
# अज्ञात | # ध्यान रखें कि जब आगे के डेटा को हैंडल किया जाता है तो पोस्टीरियर अद्यतन मान पूर्व वितरण के रूप में फलन करता है। इस प्रकार, हमें तर्कसंगत रूप से अपने पूर्ववर्तियों के बारे में पर्याप्त आंकड़ों के संदर्भ में जितना संभव हो उतना समान शब्दार्थों को ध्यान में रखते हुए सोचना चाहिए। | ||
# ध्यान रखें कि जब आगे के डेटा को हैंडल किया जाता है तो | # उस स्थितियो को संभालने के लिए जहां माध्य और वेरिएंस दोनों अज्ञात हैं, हम माध्य और वेरिएंस पर स्वतंत्र प्राथमिकताओ के रूप में रख सकते हैं, इस प्रकार औसत माध्य के निश्चित अनुमानों के साथ, कुल वेरिएंस पूर्व में वेरिएंस की गणना करने के लिए उपयोग किए जाने वाले डेटा बिंदुओं की संख्या और अज्ञात का योग विचलन करते है। चूंकि ध्यान दें कि वास्तव में, माध्य का कुल वेरिएंस अज्ञात वेरिएंस पर निर्भर करता है और अज्ञात विचलन का योग जो वेरिएंस के रूप में अज्ञात माध्य पर निर्भर करता है। इस प्रकार व्यवहार में, बाद की निर्भरता अपेक्षाकृत महत्वहीन रूप में होती है, वास्तविक माध्य को स्थानांतरित करने से उत्पन्न अंक एक समान राशि से बदल जाते हैं और औसतन अज्ञात विचलन समान रहता है। चूंकि, माध्य के कुल वेरिएंस के साथ ऐसा नहीं होता है, जैसे ही अज्ञात वेरिएंस बढ़ता है, माध्य का कुल वेरिएंस आनुपातिक रूप से बढ़ जाता है और हम इस निर्भरता को पकड़ना चाहते हैं। | ||
# उस | # इससे पता चलता है कि हम अज्ञात वेरिएंस पर माध्य से पहले एक सशर्त बनाते हैं, जिसमें एक हाइपरपैरामीटर पूर्व से जुड़े प्सयूडो -अवलोकन के माध्य को निर्दिष्ट करता है और एक अन्य पैरामीटर प्सयूडो टिप्पणियों की संख्या को निर्दिष्ट करता है। यह संख्या भिन्नता पर स्केलिंग पैरामीटर के रूप में फलन करती है, जिससे वास्तविक भिन्नता पैरामीटर के सापेक्ष माध्य के समग्र भिन्नता को नियंत्रित करना संभव हो जाता है। वेरिएंस के पूर्व में भी दो हाइपरपरमेटर्स होते हैं, एक पूर्व से जुड़े प्सयूडो -अवलोकनों के वर्ग विचलन के योग को निर्दिष्ट करता है और दूसरा एक बार फिर से प्सयूडो -टिप्पणियों की संख्या को निर्दिष्ट करता है। ध्यान दें कि प्रत्येक पूर्व में प्सयूडो -अवलोकन की संख्या निर्दिष्ट करने वाला एक हाइपरपैरामीटर होता है और प्रत्येक स्थितियो में यह उस पूर्व के सापेक्ष भिन्नता को नियंत्रित करता है। इन्हें दो भिन्न -भिन्न हाइपरपैरामीटर के रूप में दिखाया जाता है जिससे की दो प्रायर के प्रसरण को भिन्न -भिन्न विधियों को नियंत्रित किया जा सके। | ||
# इससे पता चलता है कि हम अज्ञात | # यह तुरंत सामान्य- व्युत्क्रम -गामा वितरण की ओर ले जाता है, जो अभी-अभी परिभाषित दो वितरण का गुणन है, जिसमें संयुग्मित प्रायर का उपयोग किया जाता है, वेरिएंस पर एक व्युत्क्रम गामा वितरण और माध्य पर एक सामान्य वितरण वेरिएंस पर सशर्त के रूप में होता है और उन्हीं चार पैरामीटर के साथ अभी-अभी परिभाषित किया जाता है। | ||
# यह तुरंत सामान्य- | |||
प्राथमिकताओं को सामान्य रूप से निम्नानुसार परिभाषित किया | प्राथमिकताओं को सामान्य रूप से निम्नानुसार परिभाषित किया जाता है | ||
:<math>\begin{align} | :<math>\begin{align} | ||
Line 720: | Line 714: | ||
p(\sigma^2; \nu_0,\sigma_0^2) &\sim I\chi^2(\nu_0,\sigma_0^2) = IG(\nu_0/2, \nu_0\sigma_0^2/2) | p(\sigma^2; \nu_0,\sigma_0^2) &\sim I\chi^2(\nu_0,\sigma_0^2) = IG(\nu_0/2, \nu_0\sigma_0^2/2) | ||
\end{align}</math> | \end{align}</math> | ||
अद्यतन समीकरण इस प्रकार प्राप्त किए जा सकते हैं और निम्नानुसार दिखाया जाता है | |||
अद्यतन समीकरण प्राप्त किए जा सकते हैं | |||
:<math>\begin{align} | :<math>\begin{align} | ||
Line 732: | Line 724: | ||
\nu_0'{\sigma_0^2}' &= \nu_0 \sigma_0^2 + \sum_{i=1}^n (x_i-\bar{x})^2 + \frac{n_0 n}{n_0 + n}(\mu_0 - \bar{x})^2 | \nu_0'{\sigma_0^2}' &= \nu_0 \sigma_0^2 + \sum_{i=1}^n (x_i-\bar{x})^2 + \frac{n_0 n}{n_0 + n}(\mu_0 - \bar{x})^2 | ||
\end{align}</math> | \end{align}</math> | ||
प्सयूडो टेस्ट्स की संबंधित संख्या वास्तविक टेस्ट्स की संख्या को उनके साथ जोड़ती है। नया माध्य हाइपरपैरामीटर एक बार फिर भारित औसत के रूप में होता है, इस बार अवलोकनों की सापेक्ष संख्या द्वारा भारित किया गया है। इस प्रकार अंत में <math>\nu_0'{\sigma_0^2}'</math> के लिए अद्यतन ज्ञात माध्य की स्थितियो के समान है, लेकिन इस स्थितियो में वर्ग विचलन का योग सही माध्य के अतिरिक्त देखे गए डेटा माध्य के संबंध में लिया जाता है और परिणामस्वरूप एक नई अंतःक्रिया शब्द की आवश्यकता होती है इस प्रकार पूर्व और डेटा माध्य के बीच विचलन से उत्पन्न अतिरिक्त त्रुटि स्रोत का ध्यान रखने के लिए जोड़ा जाता है। | |||
{{math proof | proof = | {{math proof | proof = | ||
The prior distributions are | The prior distributions are | ||
:<math>\begin{align} | :<math>\begin{align} | ||
p(\mu\mid\sigma^2; \mu_0, n_0) &\sim \mathcal{N}(\mu_0,\sigma^2/n_0) = \frac{1}{\sqrt{2\pi\frac{\sigma^2}{n_0}}} \exp\ | p(\mu\mid\sigma^2; \mu_0, n_0) &\sim \mathcal{N}(\mu_0,\sigma^2/n_0) = \frac{1}{\sqrt{2\pi\frac{\sigma^2}{n_0}}} \exp\left(-\frac{n_0}{2\sigma^2}(\mu-\mu_0)^2\right) \\ | ||
&\propto (\sigma^2)^{-1/2} \exp\ | &\propto (\sigma^2)^{-1/2} \exp\left(-\frac{n_0}{2\sigma^2}(\mu-\mu_0)^2\right) \\ | ||
p(\sigma^2; \nu_0,\sigma_0^2) &\sim I\chi^2(\nu_0,\sigma_0^2) = IG(\nu_0/2, \nu_0\sigma_0^2/2) \ \ | p(\sigma^2; \nu_0,\sigma_0^2) &\sim I\chi^2(\nu_0,\sigma_0^2) = IG(\nu_0/2, \nu_0\sigma_0^2/2) \\ | ||
&= \frac{(\sigma_0^2\nu_0/2)^{\nu_0/2}}{\Gamma(\nu_0/2)}~\frac{\exp\left[ \frac{-\nu_0 \sigma_0 ^2}{2 \sigma^2}\right]}{(\sigma^2)^{1+\nu_0/2}} \\ | &= \frac{(\sigma_0^2\nu_0/2)^{\nu_0/2}}{\Gamma(\nu_0/2)}~\frac{\exp\left[ \frac{-\nu_0 \sigma_0^2}{2 \sigma^2}\right]}{(\sigma^2)^{1+\nu_0/2}} \\ | ||
&\propto {(\sigma^2)^{-(1+\nu_0/2)}} \exp\ | &\propto {(\sigma^2)^{-(1+\nu_0/2)}} \exp\left[ \frac{-\nu_0 \sigma_0^2}{2 \sigma^2}\right]. | ||
\end{ | \end{align}</math> | ||
Therefore, the joint prior is | |||
: | :<math>\begin{align} | ||
p(\mu,\sigma^2; \mu_0, n_0, \nu_0,\sigma_0^2) &= p(\mu\mid\sigma^2; \mu_0, n_0)\,p(\sigma^2; \nu_0,\sigma_0^2) \\ | p(\mu,\sigma^2; \mu_0, n_0, \nu_0,\sigma_0^2) &= p(\mu\mid\sigma^2; \mu_0, n_0)\,p(\sigma^2; \nu_0,\sigma_0^2) \\ | ||
&\propto (\sigma^2)^{-(\nu_0+3)/2} \exp\ | &\propto (\sigma^2)^{-(\nu_0+3)/2} \exp\left[-\frac 1 {2\sigma^2}\left(\nu_0\sigma_0^2 + n_0(\mu-\mu_0)^2\right)\right]. | ||
\end{ | \end{align}</math> | ||
The [[likelihood function]] from the section above with known variance is: | |||
: | :<math>\begin{align} | ||
p(\mathbf{X}\mid\mu,\sigma^2) &= \left(\frac{1}{2\pi\sigma^2}\right)^{n/2} \exp\left[-\frac{1}{2\sigma^2} \left(\sum_{i=1}^n(x_i -\mu)^2\right)\right] | |||
p(\mathbf{X}\mid\mu,\sigma^2) &= \ | \end{align}</math> | ||
\end{ | |||
Writing it in terms of variance rather than precision, we get: | |||
: | :<math>\begin{align} | ||
p(\mathbf{X}\mid\mu,\sigma^2) &= \left(\frac{1}{2\pi\sigma^2}\right)^{n/2} \exp\left[-\frac{1}{2\sigma^2} \left(\sum_{i=1}^n(x_i-\bar{x})^2 + n(\bar{x} -\mu)^2\right)\right] \\ | |||
p(\mathbf{X}\mid\mu,\sigma^2) &= \ | &\propto {\sigma^2}^{-n/2} \exp\left[-\frac{1}{2\sigma^2} \left(S + n(\bar{x} -\mu)^2\right)\right] | ||
&\propto {\sigma^2}^{-n/2} \exp\ | \end{align}</math> | ||
\end{ | where <math display="inline">S = \sum_{i=1}^n(x_i-\bar{x})^2.</math> | ||
Therefore, the posterior is (dropping the hyperparameters as conditioning factors): | |||
: | :<math>\begin{align} | ||
p(\mu,\sigma^2\mid\mathbf{X}) & \propto p(\mu,\sigma^2) \, p(\mathbf{X}\mid\mu,\sigma^2) \\ | |||
p(\mu,\sigma^2\mid\mathbf{X}) | & \propto (\sigma^2)^{-(\nu_0+3)/2} \exp\left[-\frac{1}{2\sigma^2}\left(\nu_0\sigma_0^2 + n_0(\mu-\mu_0)^2\right)\right] {\sigma^2}^{-n/2} \exp\left[-\frac{1}{2\sigma^2} \left(S + n(\bar{x} -\mu)^2\right)\right] \\ | ||
& \propto (\sigma^2)^{-(\nu_0+3)/2} \exp\ | &= (\sigma^2)^{-(\nu_0+n+3)/2} \exp\left[-\frac{1}{2\sigma^2}\left(\nu_0\sigma_0^2 + S + n_0(\mu-\mu_0)^2 + n(\bar{x} -\mu)^2\right)\right] \\ | ||
&= (\sigma^2)^{-(\nu_0+n+3)/2} \exp\ | &= (\sigma^2)^{-(\nu_0+n+3)/2} \exp\left[-\frac{1}{2\sigma^2}\left(\nu_0\sigma_0^2 + S + \frac{n_0 n}{n_0+n}(\mu_0-\bar{x})^2 + (n_0+n)\left(\mu-\frac{n_0\mu_0 + n\bar{x}}{n_0 + n}\right)^2\right)\right] \\ | ||
&= (\sigma^2)^{-(\nu_0+n+3)/2} \exp\ | & \propto (\sigma^2)^{-1/2} \exp\left[-\frac{n_0+n}{2\sigma^2}\left(\mu-\frac{n_0\mu_0 + n\bar{x}}{n_0 + n}\right)^2\right] \\ | ||
& \propto (\sigma^2)^{-1/2} \exp\ | & \quad\times (\sigma^2)^{-(\nu_0/2+n/2+1)} \exp\left[-\frac{1}{2\sigma^2}\left(\nu_0\sigma_0^2 + S + \frac{n_0 n}{n_0+n}(\mu_0-\bar{x})^2\right)\right] \\ | ||
& \quad\times (\sigma^2)^{-(\nu_0/2+n/2+1)} \exp\ | & = \mathcal{N}_{\mu\mid\sigma^2}\left(\frac{n_0\mu_0 + n\bar{x}}{n_0 + n}, \frac{\sigma^2}{n_0+n}\right) \cdot {\rm IG}_{\sigma^2}\left(\frac12(\nu_0+n), \frac12\left(\nu_0\sigma_0^2 + S + \frac{n_0 n}{n_0+n}(\mu_0-\bar{x})^2\right)\right). | ||
& = \mathcal{N}_{\mu\mid\sigma^2}\left(\frac{n_0\mu_0 + n\bar{x}}{n_0 + n}, \frac{\sigma^2}{ n_0+n}\ | \end{align}</math> | ||
\end{ | |||
In other words, the posterior distribution has the form of a product of a normal distribution over <math display="inline">p(\mu|\sigma^2)</math> times an inverse gamma distribution over <math display="inline">p(\sigma^2)</math>, with parameters that are the same as the update equations above. | |||
}} | }} | ||
== घटना और अनुप्रयोग == | == घटना और अनुप्रयोग == | ||
व्यावहारिक समस्याओं में सामान्य वितरण की घटना को | व्यावहारिक समस्याओं में सामान्य वितरण की घटना को सामान्यतः रूप से चार श्रेणियों में वर्गीकृत किया जा सकता है | ||
# बिल्कुल सामान्य | # बिल्कुल सामान्य वितरण ; | ||
# लगभग सामान्य | # लगभग सामान्य नियम, उदाहरण के लिए जब इस तरह के सन्निकटन को केंद्रीय सीमा प्रमेय द्वारा उचित ठहराया जाता है | ||
# वितरण सामान्य के रूप में तैयार किया गया | # वितरण सामान्य के रूप में तैयार किया गया सामान्य वितरण किसी दिए गए माध्य और वेरिएंस के लिए अधिकतम एन्ट्रापी के सिद्धांत के साथ वितरण है। | ||
# प्रतिगमन समस्याएं - व्यवस्थित | # प्रतिगमन समस्याएं - व्यवस्थित अभिव्यक्ति के बाद पाए जाने वाले सामान्य वितरण को पर्याप्त रूप से अच्छी तरह से प्रतिरूपित किया जाता है। | ||
=== | === यथार्थ नोर्मेलिटी === | ||
[[File:QHarmonicOscillator.png|thumb|[[क्वांटम हार्मोनिक ऑसिलेटर]] की | [[File:QHarmonicOscillator.png|thumb|[[क्वांटम हार्मोनिक ऑसिलेटर]] की मूलअवस्था में गॉसियन वितरण होता है।]]भौतिकी में कुछ मात्राएँ सामान्य रूप से वितरित की जाती हैं, जैसा कि पहले [[जेम्स क्लर्क मैक्सवेल]] द्वारा प्रदर्शित किया गया था। ऐसी मात्राओं के उदाहरण इस प्रकार हैं, | ||
* एक क्वांटम हार्मोनिक ऑसिलेटर में | * एक क्वांटम हार्मोनिक ऑसिलेटर में मूल अवस्था का प्रायिकता घनत्व फलन प्रदर्शित किया गया है। | ||
* एक कण की स्थिति जो विसरण का अनुभव करती है। यदि प्रारंभ में कण एक विशिष्ट बिंदु पर स्थित है | * एक कण की स्थिति जो विसरण का अनुभव करती है। यदि प्रारंभ में कण एक विशिष्ट बिंदु पर स्थित है अर्थात इसका प्रायिकता वितरण [[डिराक डेल्टा समारोह|डिराक डेल्टा फलन]] है, तो समय t के बाद इसका स्थान वेरिएंस t के साथ एक सामान्य वितरण द्वारा वर्णित किया गया है, जो [[प्रसार]] समीकरण को <math>\frac{\partial}{\partial t} f(x,t) = \frac{1}{2} \frac{\partial^2}{\partial x^2} f(x,t)</math>.इस प्रकार संतुष्ट करता है, यदि प्रारंभिक स्थान एक निश्चित घनत्व फलन <math>g(x)</math> द्वारा दिया गया है, फिर समय t पर घनत्व g(x) और सामान्य Pdf का कनवल्शन है। | ||
=== अनुमानित | === अनुमानित नोर्मेलिटी === | ||
लगभग सामान्य वितरण कई स्थितियों में होते हैं, जैसा कि केंद्रीय सीमा प्रमेय द्वारा समझाया गया है। जब परिणाम कई छोटे | लगभग सामान्य वितरण कई स्थितियों में होते हैं, जैसा कि केंद्रीय सीमा प्रमेय द्वारा समझाया गया है। जब परिणाम कई छोटे अभिव्यक्ति से जोड़कर और स्वतंत्र रूप से फलन करता है, तो इसका वितरण सामान्य के निकटतम होता है । सामान्य सन्निकटन मान्य नहीं होता है यदि अभिव्यक्ति गुणात्मक रूप से फलन करते हैं योगात्मक के अतिरिक्त यदि कोई बाहरी अभिव्यक्ति है, जो बाकी अभिव्यक्ति की तुलना में बहुत बड़ा परिमाण प्रदान करते है। | ||
* गिनती की समस्याओं में, जहां केंद्रीय सीमा प्रमेय में असतत-से-निरंतर सन्निकटन | * गिनती की समस्याओं में, जहां केंद्रीय सीमा प्रमेय में असतत-से-निरंतर सन्निकटन के रूप में सम्मलित है और जहां [[अनंत विभाज्यता]] और अविघटनीय वितरण सम्मलित हैं, जैसे | ||
** द्विपद | ** द्विपद यादृच्छिक चर, द्विआधारी प्रतिक्रिया चर के साथ जुड़े होते है | ||
** पॉसन | ** पॉसन वितरण , दुर्लभ घटनाओं से जुड़े होते है | ||
* ऊष्मीय विकिरण में बोस-आइंस्टीन आँकड़े हैं | * ऊष्मीय विकिरण में बोस-आइंस्टीन आँकड़े हैं, बोस-आइंस्टीन वितरण बहुत कम समय के पैमाने पर और केंद्रीय सीमा प्रमेय के कारण लंबे समय के पैमाने पर एक सामान्य वितरण के रूप में होते है। | ||
=== अनुमानित | === अनुमानित नोर्मेलिटी === | ||
[[File:Fisher iris versicolor sepalwidth.svg|thumb|right|फिशर के [[आइरिस फूल डेटा सेट]] से आइरिस वर्सीकलर के लिए सीमोमेंट | [[File:Fisher iris versicolor sepalwidth.svg|thumb|right|फिशर के [[आइरिस फूल डेटा सेट|आइरिस फूल डेटा समुच्चय]] से आइरिस वर्सीकलर के लिए सीमोमेंट चौड़ाई का हिस्टोग्राम, सुपरइम्पोज़्ड बेस्ट-फिटिंग नॉर्मल वितरण के साथ।]] | ||
{{Blockquote| | {{Blockquote|इसे केवल सामान्य वक्र की घटनाओं को ही बड़ी असामान्य घटना के रूप में पहचान सकता हूं। इस कारण कुछ वितरणों में इसे अंदाजन लगभग अनुमानित किया गया है और इसकी सुंदर सादगी के कारण शायद हम इसे किसी सैद्धांतिक जांच के पहले सन्निकटन के रूप में प्रयुक्त कर सकते हैं।|{{harvtxt |Pearson |1901 }}}} | ||
प्रयोगसिद्ध रूप से उस धारणा का टेस्ट्स करने के लिए सांख्यिकीय विधि हैं; उपरोक्त सामान्यता टेस्ट्स अनुभाग देखें। | |||
* जीव विज्ञान में, विभिन्न चरों के लघुगणक में एक सामान्य वितरण होता है, अर्थात उदाहरण सहित पुरुष/महिला उप-जनसंख्या पर पृथक्करण के बाद उनका एक लॉग सामान्य वितरण होता है: | |||
** जीवित ऊतक के आकार की माप लंबाई, ऊंचाई, त्वचा क्षेत्र, वजन इस श्रेणी में आती है;<ref>{{harvtxt |Huxley |1932 }}</ref> | |||
**जैविक नमूनों के अक्रिय उपांगों के बाल, पंजे, नाखून, दांतों की लंबाई, वृद्धि की दिशा में संभवतः पेड़ की छाल की मोटाई भी इसी श्रेणी में आती है | |||
** कुछ शारीरिक माप, जैसे वयस्क मनुष्यों का रक्तचाप इस श्रेणी में आती है। | |||
* वित्त में, विशेष रूप से ब्लैक-स्कोल्स मॉडल, विनिमय दरों, मान सूचकांकों और शेयर बाजार सूचकांकों के लघुगणक में परिवर्तन को सामान्य माना जाता है, ये चर [[चक्रवृद्धि ब्याज]] की तरह व्यवहार करते हैं, साधारण ब्याज की तरह नहीं और इसलिए गुणक के रूप में होते है। [[बेनोइट मंडेलब्रॉट]] जैसे कुछ गणितज्ञों ने तर्क दिया है कि [[लॉग-लेवी]] वितरण जिसमें [[भारी पूंछ|भारी टेल्ड]] होती है और इस प्रकार विशेष रूप से स्टॉक मार्केट क्रैश के विश्लेषण के लिए अधिक उपयुक्त मॉडल होता है। [[नसीम निकोलस तालेब]] ने अपने फलन में वित्तीय मॉडल में होने वाले सामान्य वितरण की धारणा के उपयोग की भी आलोचना की है। | |||
* भौतिक प्रयोगों में अनिश्चितता का प्रसार अधिकांशतः सामान्य वितरण द्वारा प्रतिरूपित किया जाता है। सामान्य वितरण के इस प्रयोग का अर्थ यह नहीं है कि कोई यह मान रहा है कि माप त्रुटियां सामान्य रूप से वितरित की जाती हैं, बल्कि सामान्य वितरण का उपयोग करने से त्रुटियों के माध्य और वेरिएंस के बारे में केवल ज्ञान दिया जा सकता है।<ref>{{cite book|last=Jaynes|first=Edwin T.|year=2003|title=Probability Theory: The Logic of Science|publisher=Cambridge University Press|pages=592–593|url=https://books.google.com/books?id=tTN4HuUNXjgC&pg=PA592|isbn=9780521592710}}</ref> | |||
* [[मानकीकृत परीक्षण (सांख्यिकी)|मानकीकृत टेस्ट्स (सांख्यिकी)]] में, परिणामों को या तो प्रश्नों की संख्या और कठिनाई इंटेलिजेंस भागफल के रूप में चयन करके या सामान्य वितरण में फिट करके कच्चे टेस्ट्स स्कोर को आउटपुट स्कोर में बदलकर सामान्य वितरण किया जा सकता है। उदाहरण के लिए, [[SAT]] की 200-800 की पारंपरिक सीमा 500 के माध्य और 100 के मानक विचलन के साथ एक सामान्य वितरण पर आधारित है। | |||
* कई अंक सामान्य वितरण से प्राप्त होते हैं, जिनमें प्रतिशतक रैंक (प्रतिशत या मात्रा), [[सामान्य वक्र समकक्ष]], स्टैनिन, मानक स्कोर, जेड-स्कोर और t-स्कोर के रूप में सम्मलित हैं। इसके अतिरिक्त, कुछ व्यवहारिक सांख्यिकीय प्रक्रियाएं मानती हैं कि स्कोर सामान्य रूप से वितरित किए जाते हैं; उदाहरण के लिए, विद्यार्थी का t-टेस्ट्स और प्रसरण का विश्लेषण [[बेल वक्र ग्रेडिंग]] स्कोर के सामान्य वितरण के आधार पर संबंधित ग्रेड प्रदान करती है। | |||
* [[जल विज्ञान]] में लंबी अवधि के नदी प्रवाह या वर्षा का वितरण मासिक और वार्षिक योग, केंद्रीय सीमा प्रमेय के अनुसार अधिकांशतः व्यावहारिक रूप से सामान्य माना जाता है।<ref>{{cite book|last=Oosterbaan|first=Roland J. | editor-last=Ritzema |editor-first=Henk P.|chapter=Chapter 6: Frequency and Regression Analysis of Hydrologic Data|year=1994 | edition=second revised|title=Drainage Principles and Applications, Publication 16|publisher=International Institute for Land Reclamation and Improvement (ILRI)|location=Wageningen, The Netherlands|pages=175–224|chapter-url=http://www.waterlog.info/pdf/freqtxt.pdf|isbn=978-90-70754-33-4}}</ref> [[कमफ़्रीक]] के साथ बनाई गई नीली तस्वीर, द्विपद वितरण के आधार पर 90% [[आत्मविश्वास बेल्ट]] दिखाते हुए अक्टूबर की बारिश के लिए सामान्य वितरण को फिट करने का एक उदाहरण दिखाती है। संचयी बारंबारता विश्लेषण के भाग के रूप में वर्षा के आंकड़ों को [[साजिश रचने की स्थिति|प्लॉटिंग स्थितियों]] द्वारा दर्शाया जाता है। | |||
== | === पद्धति संबंधी समस्याएं और पीयर रिव्यू === | ||
जॉन आयोनिडिस का तर्क है कि सामान्य रूप से वितरित मानक विचलन का उपयोग अनुसंधान निष्कर्षों को मान्य करने के लिए मानकों के रूप में उन घटनाओं के बारे में मिथ्यात्व छोड़ देता है, जो सामान्य रूप से वितरित नहीं होते हैं। इसमें सम्मलित हैं उदाहरण के लिए, ऐसी घटनाएँ जो केवल तब प्रकट होती हैं जब सभी आवश्यक शर्तें उपस्थित होती हैं और एक दूसरे के लिए एक अतिरिक्त विधि से और ऐसी घटनाओं का विकल्प नहीं हो सकता है जो यादृच्छिक रूप से वितरित नहीं होती हैं। जॉन आयोनिडिस का तर्क है कि मानक विचलन-केंद्रित सत्यापन परिकल्पनाओं और सिद्धांतों को वैधता का एक झूठा रूप देता है जहां कुछ लेकिन सभी गलत भविष्यवाणियां सामान्य रूप से वितरित नहीं की जाती हैं क्योंकि गलत अनुमानों के भाग के बाद से सबूत हो सकता है और कुछ स्थितियो में गैर-सामान्य रूप से हो सकता है [[मिथ्याकरण]] भविष्यवाणियों की श्रेणी के वितरित भाग के निराधार रूप से उन परिकल्पनाओं को अस्वीकार कर देती है, जिनके लिए कोई भी मिथ्यापूर्ण भविष्यवाणियां सामान्य रूप से वितरित नहीं की जाती हैं जैसे कि वे असत्य थीं जब वास्तव में वे मिथ्यावाचक भविष्यवाणियां करती हैं। आयोनिडिस द्वारा यह तर्क दिया जाता है कि अनुसंधान पत्रिकाओं द्वारा मान्यता प्राप्त पारस्परिक रूप से अनन्य सिद्धांतों के कई स्थितियो गैर-सामान्य रूप से वितरित भविष्यवाणियों के प्रयोगसिद्ध मिथ्याकरण में पत्रिकाओं की विफलता के कारण होते हैं और इसलिए नहीं कि पारस्परिक रूप से अनन्य सिद्धांत सत्य हैं, जो वे नहीं कर सकते है, चूंकि दो परस्पर अनन्य सिद्धांत दोनों गलत हो सकते हैं और तीसरा सही हो सकता है।<ref>Why Most Published Research Findings Are False, John P. A. Ioannidis, 2005</ref> | |||
== अभिकलनी विधियाँ == | |||
=== सामान्य वितरण से मान | === सामान्य वितरण से मान निकालना === | ||
[[File:Planche de Galton.jpg|thumb|250px|right|[[बीन मशीन]], [[फ्रांसिस गैल्टन]] द्वारा आविष्कृत एक उपकरण, को सामान्य यादृच्छिक चर का पहला जनरेटर कहा जा सकता है। इस मशीन में पिनों की इंटरलीव्ड पंक्तियों के साथ एक वर्टिकल बोर्ड होता है। छोटी गेंदों को ऊपर से गिराया जाता है और फिर पिनों से टकराते ही बेतरतीब ढंग से बाएँ या दाएँ उछलते हैं। गेंदों को नीचे डिब्बे में एकत्र किया जाता है और गॉसियन वक्र के समान पैटर्न में व्यवस्थित किया जाता है।]]कंप्यूटर सिमुलेशन में, विशेष रूप से मोंटे-कार्लो पद्धति के अनुप्रयोगों में, सामान्य रूप से वितरित मानों | [[File:Planche de Galton.jpg|thumb|250px|right|[[बीन मशीन]], [[फ्रांसिस गैल्टन]] द्वारा आविष्कृत एक उपकरण, को सामान्य यादृच्छिक चर का पहला जनरेटर कहा जा सकता है। इस मशीन में पिनों की इंटरलीव्ड पंक्तियों के साथ एक वर्टिकल बोर्ड होता है। छोटी गेंदों को ऊपर से गिराया जाता है और फिर पिनों से टकराते ही बेतरतीब ढंग से बाएँ या दाएँ उछलते हैं। गेंदों को नीचे डिब्बे में एकत्र किया जाता है और गॉसियन वक्र के समान पैटर्न में व्यवस्थित किया जाता है।]]कंप्यूटर सिमुलेशन में, विशेष रूप से मोंटे-कार्लो पद्धति के अनुप्रयोगों में, सामान्य रूप से वितरित मानों को उत्पन्न करना अधिकांशतः वांछनीय होता है। इस प्रकार नीचे सूचीबद्ध सभी कलनविधि मानक सामान्य विचलन उत्पन्न करते हैं, क्योंकि a {{math|''N''(''μ'', ''σ''<sup>2</sup>)}} को {{math|1=''X'' = ''μ'' + ''σZ''}} के रूप में उत्पन्न किया जा सकता है, जहां Z मानक सामान्य रूप में है। ये सभी कलनविधि एक यादृच्छिक संख्या जनरेटर U की उपलब्धता पर निर्भर करते हैं जो समान यादृच्छिक चर उत्पन्न करने में सक्षम है। | ||
* सबसे सीधी विधि | * सबसे सीधी विधि [[संभाव्यता अभिन्न परिवर्तन|प्रायिकता अभिन्न परिवर्तन]] प्रॉपर्टी पर आधारित होती है, यदि U को (0,1) पर समान रूप से वितरित किया जाता है, तो Φ<sup>−1</sup>(U) का मानक सामान्य वितरण होता है । इस पद्धति का दोष यह है कि यह प्रोबिट फलन Φ<sup>1</sup> की गणना पर निर्भर करता है, जो विश्लेषणात्मक रूप से नहीं किया जा सकता। कुछ अनुमानित विधियों का वर्णन हार्ट 1968 और ईआरएफ लेख में किया गया है। विचुरा इस फलन को 16 दशमलव स्थानों पर गणना करने के लिए एक तेज़ कलनविधि देता है,<ref>{{cite journal|last=Wichura |first=Michael J.|year=1988|title=Algorithm AS241: The Percentage Points of the Normal Distribution|journal=Applied Statistics |volume=37|pages=477–84|doi=10.2307/2347330|jstor=2347330|issue=3}}</ref> जिसका उपयोग R [[आर प्रोग्रामिंग भाषा|प्रोग्रामिंग भाषा]] द्वारा सामान्य वितरण के यादृच्छिक चर की गणना करने के लिए किया जाता है। | ||
* | * एक आसान से प्रोग्राम अनुमानित दृष्टिकोण जो केंद्रीय सीमा प्रमेय पर निर्भर करता है, वह इस प्रकार है, 12 समान U(0,1) विचलन उत्पन्न करते है, उन सभी को जोड़ने और 6 घटाने से परिणामी यादृच्छिक चर का मानक सामान्य वितरण होता है । इस प्रकार वास्तव में, वितरण इरविन-हॉल वितरण होता है | इरविन-हॉल, जो सामान्य वितरण के लिए 12-खंड ग्यारहवें-क्रम बहुपद सन्निकटन के रूप में होते है। इस यादृच्छिक विचलन की सीमित सीमा (-6, 6) के रूप में होती है।<ref>{{harvtxt |Johnson |Kotz |Balakrishnan |1995 |loc=Equation (26.48) }}</ref> ध्यान दें कि एक सामान्य सामान्य वितरण में, सभी नमूनों का केवल 0.00034% ±6σ से बाहर होते है। | ||
* | * बॉक्स-मुलर विधि दो स्वतंत्र यादृच्छिक संख्या U और V (0,1) पर वितरित समान वितरण का उपयोग करती है। फिर दो यादृच्छिक चर X और Y के रूप में होते है<math display="block"> | ||
X = \sqrt{- 2 \ln U} \, \cos(2 \pi V) , \qquad | X = \sqrt{- 2 \ln U} \, \cos(2 \pi V) , \qquad | ||
Y = \sqrt{- 2 \ln U} \, \sin(2 \pi V) . | Y = \sqrt{- 2 \ln U} \, \sin(2 \pi V) . | ||
</math> दोनों का मानक सामान्य वितरण होता है | </math> दोनों का मानक सामान्य वितरण होता है और स्वतंत्र रूप में होती है। यह सूत्रीकरण इसलिए उत्पन्न होता है क्योंकि [[द्विभाजित सामान्य]] यादृच्छिक सदिश (X, Y) के लिए अज्ञात मानदंड {{math|''X''<sup>2</sup> + ''Y''<sup>2</sup>}} स्वतंत्र की दो डिग्री के साथ ची-वर्ग वितरण होता है , जो इन समीकरणों में -2ln(U) क्वांटाइल के अनुरूप आसानी से उत्पन्न घातांक वितरण है और कोण को वृत्त के चारों ओर समान रूप से वितरित किया जाता है, जिसे यादृच्छिक चर V द्वारा चुना जाता है। | ||
* मार्सग्लिया ध्रुवीय विधि बॉक्स-मुलर विधि का एक संशोधन है जिसमें साइन और कोसाइन फलन | * मार्सग्लिया ध्रुवीय विधि बॉक्स-मुलर विधि का एक संशोधन है, जिसमें साइन और कोसाइन फलन की गणना की आवश्यकता नहीं होती है। इस विधि में, U और V एकसमान (−1,1) वितरण से निकाले जाते हैं, और फिर {{math|1=''S'' = ''U''<sup>2</sup> + ''V''<sup>2</sup>}} की गणना की जाती है। यदि S 1 से अधिक या बराबर है, तो विधि फिर से शुरू होती है, अन्यथा दो मात्राएँ इस प्रकार होती है<math display="block">X = U\sqrt{\frac{-2\ln S}{S}}, \qquad Y = V\sqrt{\frac{-2\ln S}{S}}</math> फिर से वापस कर दिए जाते हैं, X और Y स्वतंत्र, मानक सामान्य यादृच्छिक चर के रूप में है। | ||
* अनुपात विधि<ref>{{harvtxt |Kinderman |Monahan |1977 }}</ref> अस्वीकृति पद्धति है। | * अनुपात विधि<ref>{{harvtxt |Kinderman |Monahan |1977 }}</ref> एक अस्वीकृति पद्धति है। कलनविधि निम्नानुसार आगे बढ़ता है | ||
** दो स्वतंत्र | ** दो स्वतंत्र एकरूप U और V उत्पन्न करते हैं | ||
** | ** अभिकलन X= {{sqrt|8/''e''}} (वी - 0.5)/U; | ||
** वैकल्पिक: यदि X<sup>2</sup> ≤ 5 − 4e<sup>1/4</sup> | ** वैकल्पिक: यदि X<sup>2</sup> ≤ 5 − 4e<sup>1/4</sup>U फिर एक्स को स्वीकार करते हैं और कलन विधि को समाप्त करते हैं; | ||
** वैकल्पिक: यदि X<sup>2</sup> ≥ 4e<sup>-1.35/U + 1.4 फिर X को अस्वीकार | ** वैकल्पिक: यदि X<sup>2</sup> ≥ 4e<sup>-1.35/U + 1.4 फिर X को अस्वीकार करते हैं और चरण 1 से शुरू करते हैं; | ||
** यदि | ** यदि X<sup>2</sup> ≤ −4 lnU फिर X को स्वीकार करते हैं, अन्यथा कलन विधि पर प्रारंभ करते हैं। | ||
*: दो वैकल्पिक चरण अंतिम चरण में लघुगणक के मान | *: दो वैकल्पिक चरण अंतिम चरण में लघुगणक के मान अंकन की अनुमति देते हैं, जिससे अधिकांश स्थितियो में बचा जा सकता है। इन कदमों में बहुत सुधार किया जा सकता है<ref>{{harvtxt|Leva|1992}}</ref> जिससे की लघुगणक का मान अंकन कभी-कभार ही किया जा सके। | ||
* ज़िगगुरैट | * ज़िगगुरैट कलन विधि <ref>{{harvtxt |Marsaglia |Tsang |2000 }}</ref> बॉक्स-मुलर रूपांतरण से तेज़ है और अभी भी अच्छे और सटीक है। लगभग 97% स्थितियो में यह केवल दो यादृच्छिक संख्याओं, एक यादृच्छिक पूर्णांक और एक यादृच्छिक समरूप , एक गुणन और एक परीक्षण का उपयोग करता है। और इस प्रकार केवल 3% स्थितियो में जहां उन दोनों का संयोजन जिगगुराट के कोर के बाहर पड़ता है वहाँ लघुगणक का उपयोग करके एक प्रकार का अस्वीकृति नमूनाकरण घातांक का प्रयोग किया जाता है और इस प्रकार समान यादृच्छिक संख्याओं को नियोजित करना पड़ता है। | ||
* पूर्णांक अंकगणित का उपयोग मानक सामान्य वितरण से नमूने के लिए किया जा सकता है।<ref>{{harvtxt|Karney|2016}}</ref> यह विधि इस अर्थ में अच्छे है कि यह आदर्श सन्निकटन की शर्तों को संतुष्ट करती है;<ref>{{harvtxt|Monahan|1985|loc=section 2}}</ref> | * पूर्णांक अंकगणित का उपयोग मानक सामान्य वितरण से नमूने के लिए किया जा सकता है।<ref>{{harvtxt|Karney|2016}}</ref> यह विधि इस अर्थ में अच्छे है कि यह आदर्श सन्निकटन की शर्तों को संतुष्ट करती है;<ref>{{harvtxt|Monahan|1985|loc=section 2}}</ref> अर्थात यह मानक सामान्य वितरण से एक वास्तविक संख्या का नमूना लेने और इसे निकटतम प्रतिनिधित्व योग्य फ़्लोटिंग पॉइंट नंबर पर गोल करने के बराबर होती है। | ||
* कुछ जांच भी है<ref>{{harvtxt |Wallace |1996}}</ref> तेजी से हैडमार्ड परिवर्तन और सामान्य वितरण के बीच संबंध में | * कुछ जांच भी है<ref>{{harvtxt |Wallace |1996}}</ref> जो तेजी से हैडमार्ड परिवर्तन और सामान्य वितरण के बीच संबंध में परिवर्तन केवल जोड़ने और घटाने को नियोजित करता है और केंद्रीय सीमा प्रमेय द्वारा लगभग किसी भी वितरण से यादृच्छिक संख्या सामान्य वितरण में बदल दी जाती है। इस संबंध में सामान्य रूप से वितरित डेटा में स्वैच्छिक डेटा समुच्चय को चालू करने के लिए हैडमार्ड रूपांतरणों की एक श्रृंखला को यादृच्छिक क्रमपरिवर्तन के साथ जोड़ा जा सकता है। | ||
=== सामान्य सीडीएफ और सामान्य क्वांटाइल फलन | === सामान्य सीडीएफ और सामान्य क्वांटाइल फलन के लिए संख्यात्मक अनुमान === | ||
मानक सामान्य | मानक सामान्य सीडीएफ का व्यापक रूप से वैज्ञानिक और सांख्यिकीय अभिकलन में उपयोग किया जाता है। | ||
मान Φ(x) को विभिन्न | मान Φ(x) को विभिन्न विधियों से बहुत अच्छी तरह से अनुमानित किया जा सकता है, जैसे कि [[संख्यात्मक एकीकरण]], टेलर श्रृंखला, टेलर श्रृंखला, स्पर्शोन्मुख श्रृंखला और निरंतर भिन्न कॉन्फ़्लूएंट हाइपरजियोमेट्रिक फलन का उपयोग किया जाता है। इस प्रकार सटीकता के वांछित स्तर के आधार पर विभिन्न अनुमानों का उपयोग किया जाता है। | ||
* {{harvtxt |Zelen |Severo |1964 }} पूर्ण त्रुटि के साथ x > 0 के लिए Φ(x) का सन्निकटन | * {{harvtxt |Zelen |Severo |1964 }} पूर्ण त्रुटि के साथ x > 0 के लिए Φ(x) का सन्निकटन {{math|{{abs|''ε''(''x'')}} < 7.5·10<sup>−8</sup>}} मान होता है, कलनविधि [https://secure.math.ubc.ca/~cbm/aands/page_932.htm 26.2.17]): <math display="block"> | ||
\Phi(x) = 1 - \varphi(x)\left(b_1 t + b_2 t^2 + b_3t^3 + b_4 t^4 + b_5 t^5\right) + \varepsilon(x), \qquad t = \frac{1}{1+b_0x}, | \Phi(x) = 1 - \varphi(x)\left(b_1 t + b_2 t^2 + b_3t^3 + b_4 t^4 + b_5 t^5\right) + \varepsilon(x), \qquad t = \frac{1}{1+b_0x}, | ||
</math> जहां ϕ(x) मानक सामान्य PDF है, | </math> जहां ϕ(x) मानक सामान्य PDF इस प्रकार है, ''b''<sub>0</sub> = 0.2316419, ''b''<sub>1</sub> = 0.319381530, ''b''<sub>2</sub> = −0.356563782, ''b''<sub>3</sub> = 1.781477937, ''b''<sub>4</sub> = −1.821255978, ''b''<sub>5</sub> = 1.330274429. | ||
* {{harvtxt |Hart |1968 }} | * {{harvtxt |Hart |1968 }} ने erfc() फलन के लिए घातांक के साथ या उसके बिना तर्कसंगत फलन के माध्यम से कुछ दर्जनों अनुमानों को सूचीबद्ध किया है। उनके कलनविधि 24 अंकों की अधिकतम पूर्ण सटीकता के साथ सम्मिश्रता की डिग्री और परिणामी सटीकता में भिन्न होते हैं। इस प्रकार एक कलनविधि {{harvtxt |West |2009 }} 16 अंकों की सटीकता के साथ एक तेज संगणना कलनविधि प्रदान करने के लिए टेल में एक [[निरंतर अंश|निरंतर भिन्न]] सन्निकटन के साथ हार्ट के कलनविधि 5666 को जोड़ता है। | ||
* {{harvtxt |Cody |1969 }} | * Hart68 समाधान erf के लिए उपयुक्त नहीं होता है, यह याद करने के बाद {{harvtxt |Cody |1969 }} erf और erfc दोनों के लिए तर्कसंगत चेबीशेव अनुमान के माध्यम से अधिकतम सापेक्ष त्रुटि के साथ एक समाधान देता है। | ||
* {{harvtxt |Marsaglia |2004 }} एक सरल | * {{harvtxt |Marsaglia |2004 }} टेलर श्रृंखला विस्तार के आधार पर एक सरल कलनविधि का सुझाव दिया है,{{NoteTag|For example, this algorithm is given in the article [[Bc programming language#A translated C function|Bc programming language]].}} <math display="block"> | ||
\Phi(x) = \frac12 + \varphi(x)\left( x + \frac{x^3} 3 + \frac{x^5}{3 \cdot 5} + \frac{x^7}{3 \cdot 5 \cdot 7} + \frac{x^9}{3 \cdot 5 \cdot 7 \cdot 9} + \cdots \right) | \Phi(x) = \frac12 + \varphi(x)\left( x + \frac{x^3} 3 + \frac{x^5}{3 \cdot 5} + \frac{x^7}{3 \cdot 5 \cdot 7} + \frac{x^9}{3 \cdot 5 \cdot 7 \cdot 9} + \cdots \right) | ||
</math> | </math> स्वेच्छ परिशुद्धता के साथ Φ(x) की गणना के लिए इस कलनविधि की कमी अपेक्षाकृत तुलनात्मक रूप से धीमी गणना समय है, उदाहरण के लिए जब x = 10 होता है तो 16 अंकों की सटीकता के साथ फलन की गणना करने में 300 से अधिक पुनरावृत्तियों की आवश्यकता होती है। | ||
* [[जीएनयू वैज्ञानिक पुस्तकालय]] हार्ट के | * [[जीएनयू वैज्ञानिक पुस्तकालय]] हार्ट के कलनविधि और [[चेबिशेव बहुपद]] के साथ सन्निकटन का उपयोग करके मानक सामान्य सीडीएफ के मानों की गणना करती है। | ||
नॉइज़ (1982) ने सरल सन्निकटन | नॉइज़ (1982) ने सरल सन्निकटन मान प्रदान करते है, जिन्हें इंजीनियरिंग और संचालन अनुसंधान के स्टोकेस्टिक अनुकूलन मॉडल के रूप में सम्मलित किया जाता है, जैसे विश्वसनीयता इंजीनियरिंग और इन्वेंट्री विश्लेषण इत्यादि। इस प्रकार {{math|1=''p'' = Φ(''z'')}} क्वांटाइल फलन के लिए सबसे सरल सन्निकटन के रूप में होते है | ||
<math display="block">z = \Phi^{-1}(p)=5.5556\left[1- \left( \frac{1-p} p \right)^{0.1186}\right],\qquad p\ge 1/2 </math> | <math display="block">z = \Phi^{-1}(p)=5.5556\left[1- \left( \frac{1-p} p \right)^{0.1186}\right],\qquad p\ge 1/2 </math> | ||
यह सन्निकटन z | यह सन्निकटन z के लिए {{math|0.5 ≤ ''p'' ≤ 0.9999}} के लिए 0.026 की अधिकतम निरपेक्ष त्रुटि प्रदान करता है, जो तदनुसार {{math|0 ≤ ''z'' ≤ 3.719}}) के अनुरूप है। इस प्रकार {{math|''p'' < 1/2}} p के लिए {{math|1 − ''p''}} से परिवर्तन चिह्न और एक और सन्निकटन चिह्न बदलते है और इस प्रकार एकल पैरामीटर सन्निकटन कुछ कम सटीक रूप में बदलते है, | ||
<math display="block"> z=-0.4115\left\{ \frac{1-p} p + \log \left[ \frac{1-p} p \right] - 1 \right\}, \qquad p\ge 1/2</math> | <math display="block"> z=-0.4115\left\{ \frac{1-p} p + \log \left[ \frac{1-p} p \right] - 1 \right\}, \qquad p\ge 1/2</math> | ||
उत्तरार्द्ध ने सामान्य वितरण के | उत्तरार्द्ध ने सामान्य वितरण के लॉस समाकलन के लिए एक सरल सन्निकटन अनुमान प्राप्त करने का काम किया था, जिसे परिभाषित किया गया था | ||
<math display="block">\begin{align} | <math display="block">\begin{align} | ||
L(z) & =\int_z^\infty (u-z)\varphi(u) \, du=\int_z^\infty [1-\Phi (u)] \, du \\[5pt] | L(z) & =\int_z^\infty (u-z)\varphi(u) \, du=\int_z^\infty [1-\Phi (u)] \, du \\[5pt] | ||
Line 875: | Line 872: | ||
\end{cases} | \end{cases} | ||
\end{align}</math> | \end{align}</math> | ||
यह सन्निकटन | यह सन्निकटन z≥1.4 के लिए 10<sup>-3</sup> की दाहिनी दूर-टेल्ड अधिकतम त्रुटि के लिए विशेष रूप से सटीक है और इस प्रकार [[प्रतिक्रिया मॉडलिंग पद्धति]] आरएमएम, शोर, 2011, 2012 के आधार पर सीडीएफ के लिए अत्यधिक अच्छे अनुमान नॉइज़ (2005) में दिखाए गए हैं। | ||
कुछ और सन्निकटन यहां देखे जा सकते | कुछ और सन्निकटन यहां देखे जा सकते है, जो त्रुष्टि फलन प्राथमिक फलन के साथ सन्निकटन रूप में होते है। विशेष रूप से, सीडीएफ के लिए पूरे डोमेन पर छोटी सापेक्ष त्रुटि <math>\Phi</math> और क्वांटाइल फलन <math>\Phi^{-1}</math> के साथ ही 2008 में सर्गेई विनित्ज़की द्वारा स्पष्ट रूप से व्युत्क्रम सूत्र के माध्यम से प्राप्त किया गया है। | ||
== इतिहास == | == इतिहास == | ||
=== विकास === | === विकास === | ||
कुछ लेखक<ref>{{harvtxt |Johnson |Kotz |Balakrishnan |1994 |p=85 }}</ref><ref>{{harvtxt |Le Cam | Lo Yang |2000 |p=74 }}</ref> सामान्य वितरण की खोज का श्रेय [[अब्राहम डी मोइवरे]] को देते हैं, जिन्होंने 1738 में{{NoteTag|De Moivre first published his findings in 1733, in a pamphlet "Approximatio ad Summam Terminorum Binomii {{math|(''a'' + ''b'')<sup>''n''</sup>}} in Seriem Expansi" that was designated for private circulation only. But it was not until the year 1738 that he made his results publicly available. The original pamphlet was reprinted several times, see for example {{harvtxt |Walker |1985 }}.}} द डॉक्ट्रिन ऑफ चांस के दूसरे संस्करण में [[द्विपद विस्तार]] | कुछ लेखक<ref>{{harvtxt |Johnson |Kotz |Balakrishnan |1994 |p=85 }}</ref><ref>{{harvtxt |Le Cam | Lo Yang |2000 |p=74 }}</ref> सामान्य वितरण की खोज का श्रेय [[अब्राहम डी मोइवरे]] को देते हैं, जिन्होंने 1738 में{{NoteTag|De Moivre first published his findings in 1733, in a pamphlet "Approximatio ad Summam Terminorum Binomii {{math|(''a'' + ''b'')<sup>''n''</sup>}} in Seriem Expansi" that was designated for private circulation only. But it was not until the year 1738 that he made his results publicly available. The original pamphlet was reprinted several times, see for example {{harvtxt |Walker |1985 }}.}} द डॉक्ट्रिन ऑफ चांस के दूसरे संस्करण में [[द्विपद विस्तार]] {{math|(''a'' + ''b'')<sup>''n''</sup>}} में गुणांक के अध्ययन में प्रकाशित किया है। डी मोइवर ने साबित किया कि इस विस्तार में मध्य पद का अनुमानित परिमाण <math display=inline>2^n/\sqrt{2\pi n}</math> के रूप में होता है और वह यदि m या {{sfrac|1|2}}n एक क्वांटाइल असीम रूप से बहुत बढ़िया होता है, तो इस प्रकार अनुपात का लघुगणक जो अंतराल ℓ द्वारा मध्य से दूर एक शब्द, मध्य अवधि के लिए <math display=inline>-\frac{2\ell\ell}{n}</math>.<ref>De Moivre, Abraham (1733), Corollary I – see {{harvtxt |Walker |1985 |p=77 }}</ref> है, यद्यपि इस प्रमेय की व्याख्या सामान्य प्रायिकता नियम के लिए पहली अस्पष्ट अभिव्यक्ति के रूप में व्याख्या किया जा सकता है, स्टीफन स्टिगलर बताते हैं कि डी मोइवर ने स्वयं अपने परिणामों की व्याख्या द्विपद गुणांकों के लिए अनुमानित नियम से अधिक कुछ भी नहीं की है और विशेष रूप से डी मोइवर में प्रायिकता घनत्व फलन की इस अवधारणा का अभिव्यक्ति था।<ref>{{harvtxt |Stigler |1986 |p=76 }}</ref> | ||
[[File:Carl Friedrich Gauss.jpg|thumb|180px|left|कार्ल फ्रेडरिक गॉस ने 1809 में [[कम से कम वर्गों की विधि]] को युक्तिसंगत बनाने के तरीके के रूप में सामान्य वितरण की खोज की।]]1823 में कार्ल फ्रेडरिक गॉस ने अपना मोनोग्राफ प्रकाशित किया <span title= थ्योरी ऑफ़ द कॉम्बिनेशन ऑफ़ ऑब्जर्वेशन्स लीस्ट सब्जेक्ट टू एरर्स>थ्योरीया कॉम्बिनेशनिस ऑब्जर्वेशनम त्रुष्टि िबस मिनिमिस ऑबनोक्सिया</span> जहां उन्होंने कई महत्वपूर्ण सांख्यिकीय अवधारणाओं को प्रस्तुत किया था, जैसे कि न्यूनतम वर्ग विधि [[अधिकतम संभावना की विधि|अधिकतम संभावना की विधि,]] और सामान्य वितरण इत्यादि के रूप में है। गॉस ने कुछ अज्ञात मात्रा V के माप को दर्शाने के लिए {{nobr|''M''′}}, {{nobr|''M''′′, ...}}का उपयोग किया और "उस क्वांटाइल के सबसे संभावित एस्टीमेटर की मांग की, जो प्रेक्षित प्रयोगात्मक परिणामों को प्राप्त करने की प्रायिकता {{math|''φ''(''M'' − ''V'') · ''φ''(''M′'' − ''V'') · ''φ''(''M''′′ − ''V'') · ...}} को अधिकतम करता है। इस प्रकार उनके अंकन में φΔ परिमाण की माप त्रुटियों की प्रायिकता घनत्व फलन है। इस प्रकार हम यह नहीं जानते कि फलन φ क्या है, गॉस की आवश्यकता होती है कि उसकी विधि को सुप्रसिद्ध उत्तर मापे गए मानों के अंकगणितीय माध्य को कम करना होता है। इन सिद्धांतों से शुरू करते हुए गॉस दर्शाता है कि स्थान पैरामीटर के अनुमानक के रूप में अंकगणित माध्य की पसंद को तर्कसंगत बनाने वाला एकमात्र नियम त्रुटियों का सामान्य नियम है।<ref>{{harvtxt |Gauss |1809 |loc=section 177 }}</ref> | |||
<math display="block"> | <math display="block"> | ||
\varphi\mathit{\Delta} = \frac h {\surd\pi} \, e^{-\mathrm{hh}\Delta\Delta}, | \varphi\mathit{\Delta} = \frac h {\surd\pi} \, e^{-\mathrm{hh}\Delta\Delta}, | ||
</math> | </math> | ||
जहाँ h | |||
जहाँ h टेस्ट्स की शुद्धता का माप है। प्रयोगों में त्रुटियों के लिए एक सामान्य मॉडल के रूप में इस सामान्य नियम का उपयोग करते हुए गॉस ने वह विधि तैयार की जिसे अब गैर-रैखिक भारित न्यूनतम वर्ग विधि के रूप में जाना जाता है।<ref>{{harvtxt |Gauss |1809 |loc=section 179 }}</ref> | |||
[[File:Pierre-Simon Laplace.jpg|thumb|180px|right| [[पियरे-साइमन लाप्लास]] ने 1810 में आंकड़ों में सामान्य वितरण के महत्व को मजबूत करते हुए केंद्रीय सीमा प्रमेय को सिद्ध किया।]]चूंकि गॉस सामान्य वितरण नियम का सुझाव देने वाले पहले व्यक्ति थे, [[पियरे साइमन डी लाप्लास]] ने महत्वपूर्ण योगदान दिया।{{NoteTag|"My custom of terming the curve the Gauss–Laplacian or ''normal'' curve saves us from proportioning the merit of discovery between the two great astronomer mathematicians." quote from {{harvtxt |Pearson |1905 |p=189 }} }} यह लाप्लास था जिसने पहली बार 1774 में कई अवलोकनों को एकत्रित करने की प्रॉब्लम प्रस्तुत की थी,<ref>{{harvtxt |Laplace |1774 |loc = Problem III }}</ref> चूंकि उनके अपने समाधान ने [[लाप्लासियन वितरण|लाप्लासियन]] वितरण को जन्म दिया था। यह लाप्लास था जिसने सबसे पहले गॉसियन समाकलन {{nowrap|∫ ''e''<sup>−''t''<sup>2</sup></sup> ''dt'' {{=}} {{sqrt|{{pi}}}}}} 1782 के मान की गणना की थी और इस प्रकार सामान्य वितरण के लिए सामान्यीकरण स्टेबल अंकन प्रदान करता है।<ref>{{harvtxt |Pearson |1905 |p=189 }}</ref> अंत में, यह लाप्लास था जिसने 1810 में मौलिक केंद्रीय सीमा प्रमेय को साबित किया और अकादमी को प्रस्तुत किया था, जिसने सामान्य वितरण के सैद्धांतिक महत्व पर जोर दिया था।<ref>{{harvtxt |Stigler |1986 |p=144 }}</ref> | |||
यह ध्यान रखना दिलचस्प है कि 1809 में एक आयरिश-अमेरिकी गणितज्ञ [[रॉबर्ट एड्रेन]] ने गॉस से एक साथ और स्वतंत्र रूप से सामान्य प्रायिकता नियम के दो व्यावहारिक लेकिन त्रुटिपूर्ण अवकलज प्रकाशित किए थे।<ref>{{harvtxt |Stigler |1978 |p=243 }}</ref> वैज्ञानिक समुदाय द्वारा उनके फलन पर बहुत सीमा तक ध्यान नहीं दिया गया था, जब तक कि 1871 में [[क्लीवलैंड एब्बे]] द्वारा उन्हें खोदकर नहीं निकाला गया था।<ref>{{harvtxt |Stigler |1978 |p=244 }}</ref> | |||
19वीं शताब्दी के मध्य में जेम्स क्लर्क मैक्सवेल ने प्रदर्शित किया कि सामान्य वितरण न केवल एक सुविधाजनक गणितीय उपकरण है, बल्कि प्राकृतिक घटनाओं में भी हो सकता है<ref>{{harvtxt |Maxwell |1860 |p=23 }}</ref> इस प्रकार कणों की संख्या जिसका वेग एक निश्चित दिशा में हल किया जाता है, x और x+dx के बीच होता है | |||
19वीं शताब्दी के मध्य में जेम्स क्लर्क मैक्सवेल ने प्रदर्शित किया कि सामान्य वितरण न केवल एक सुविधाजनक गणितीय उपकरण है, बल्कि प्राकृतिक घटनाओं में भी हो सकता है | |||
<math display="block"> | <math display="block"> | ||
\operatorname{N} \frac{1}{\alpha\;\sqrt\pi}\; e^{-\frac{x^2}{\alpha^2}} \, dx | \operatorname{N} \frac{1}{\alpha\;\sqrt\pi}\; e^{-\frac{x^2}{\alpha^2}} \, dx | ||
</math> | </math> | ||
=== नामकरण === | |||
आज, अवधारणा को सामान्यतः अंग्रेजी में सामान्य वितरण या गाऊसी वितरण के रूप में जाना जाता है। अन्य कम सामान्य नामों में गॉस वितरण, लाप्लास-गॉस वितरण, त्रुटि का नियम, त्रुटियों की सुविधा का नियम, लाप्लास का दूसरा नियम, गॉसियन नियम के रूप में सम्मलित हैं। | |||
गॉस ने स्पष्ट रूप से इस शब्द को इसके अनुप्रयोगों में सम्मलित सामान्य समीकरणों के संदर्भ में कॉइन किया था, जिसमें सामान्य के अतिरिक्त सामान्य रूप से ऑर्थोगोनल का तकनीकी अर्थ होता है।<ref>Jaynes, Edwin J.; ''Probability Theory: The Logic of Science'', [http://www-biba.inrialpes.fr/Jaynes/cc07s.pdf Ch. 7].</ref> चूंकि, 19 वीं शताब्दी के अंत तक कुछ लेखक{{NoteTag|Besides those specifically referenced here, such use is encountered in the works of [[Charles Sanders Peirce|Peirce]], [[Francis Galton|Galton]] ({{harvtxt |Galton |1889 |loc = chapter V }}) and [[Wilhelm Lexis|Lexis]] ({{harvtxt | Lexis |1878 }}, {{harvtxt |Rohrbasser |Véron |2003 }}) c. 1875.{{Citation needed |date=June 2011 }} }} सामान्य वितरण नाम का उपयोग करना शुरू कर दिया था, जहां सामान्य शब्द को विशेषण के रूप में उपयोग किया गया था। इस शब्द को अब इस तथ्य के प्रतिबिंब के रूप में देखा जा रहा है कि इस वितरण को विशिष्ट सामान्य प्रकार के रूप में देखा जाता था। [[चार्ल्स सैंडर्स पियर्स]] उन लेखकों में से एक जिन्होने एक पीयर्स "सामान्य" को परिभाषित किया था ' इस प्रकार 'सामान्य' वास्तव में जो घटित होता है इसका औसत या किसी अन्य प्रकार का माध्य नहीं है, लेकिन कुछ परिस्थितियों में लंबे समय में क्या घटित होता है इसका अर्थ है।<ref>Peirce, Charles S. (c. 1909 MS), ''[[Charles Sanders Peirce bibliography#CP|Collected Papers]]'' v. 6, paragraph 327.</ref> 20वीं शताब्दी के अंत में [[कार्ल पियर्सन]] ने इस वितरण के लिए एक पदनाम के रूप में सामान्य शब्द को लोकप्रिय बनाया था।<ref>{{harvtxt |Kruskal |Stigler |1997 }}.</ref> | |||
{{Blockquote|कई साल पहले मैंने लाप्लास गॉसियन वक्र को सामान्य वक्र कहा था, चूंकि यह नाम प्राथमिकता के एक अंतरराष्ट्रीय प्रश्न से बचता है, लेकिन इसमें लोगों को यह विश्वास दिलाने का नुकसान है कि आवृत्ति के अन्य सभी वितरण किसी न किसी अर्थ में 'असामान्य' हैं। | |||
|{{harvtxt |पियर्सन |1920 }}}} | |||
इसके अतिरिक्त, वे पियर्सन ही थे जिन्होंने सबसे पहले वितरण को आधुनिक संकेतन के रूप में मानक विचलन σ के रूप में लिखा था। इसके तुरंत बाद, वर्ष 1915 में, [[रोनाल्ड फिशर]] ने सामान्य वितरण के सूत्र में स्थान पैरामीटर जोड़ दिया था, इसे वर्तमान काल में लिखी गई विधि से व्यक्त करते है। | |||
<math display="block"> df = \frac{1}{\sqrt{2\sigma^2\pi}} e^{-(x - m)^2/(2\sigma^2)} \, dx.</math> | <math display="block"> df = \frac{1}{\sqrt{2\sigma^2\pi}} e^{-(x - m)^2/(2\sigma^2)} \, dx.</math> | ||
मानक सामान्य शब्द, जो शून्य माध्य और इकाई विचरण के साथ सामान्य वितरण को दर्शाता है और जो वर्ष 1950 के दशक के आसपास सामान्य उपयोग में आया है, जो पी. जी. होएल (1947) में गणितीय आंकड़ों का परिचय लोकप्रिय पाठ्यपुस्तकों में प्रकाशित हुआ। और इस प्रकार ए. एम. मूड (1950) द्वारा सांख्यिकी के सिद्धांत का परिचय दिया गया था<ref>{{cite web|title=Earliest uses... (entry STANDARD NORMAL CURVE)|url=http://jeff560.tripod.com/s.html}}</ref> | |||
== यह भी देखें == | == यह भी देखें == | ||
{{Portal|Mathematics}} | {{Portal|Mathematics}} | ||
* [[बेट्स वितरण|बेट्स]] वितरण - इरविन-हॉल वितरण के समान, लेकिन 0 से 1 श्रेणी में वापस आ | * [[बेट्स वितरण|बेट्स]] वितरण - इरविन-हॉल वितरण के समान होता है, लेकिन 0 से 1 श्रेणी में वापस आ जाता है | ||
* बेहरेंस-फिशर | * बेहरेंस-फिशर प्रॉब्लम - टेस्ट्स की लंबे समय से चली आ रही प्रॉब्लम है कि क्या भिन्न -भिन्न प्रसरण वाले दो सामान्य नमूनों का एक ही अर्थ होता है, | ||
* [[भट्टाचार्य दूरी]] - सामान्य वितरण के मिश्रण को भिन्न करने के लिए उपयोग की जाने वाली विधि | * [[भट्टाचार्य दूरी]] - सामान्य वितरण के मिश्रण को भिन्न करने के लिए उपयोग की जाने वाली विधि के रूप में होती है | ||
* एर्डोस-केएसी प्रमेय - [[संख्या सिद्धांत]] में सामान्य वितरण की घटना पर | * एर्डोस-केएसी प्रमेय - [[संख्या सिद्धांत]] में सामान्य वितरण की घटना पर आधारित होती है | ||
* [[अधिकतम अर्ध पर पूरी चौड़ाई]] | * [[अधिकतम अर्ध पर पूरी चौड़ाई|अधिकतम अर्ध पर पूरी चौड़ाई होती है]] | ||
* [[गौस्सियन धुंधलापन]] - कनवल्शन, जो कर्नेल के रूप में सामान्य वितरण का उपयोग करता है | * [[गौस्सियन धुंधलापन|गौस्सियन]] ब्लर - कनवल्शन, जो कर्नेल के रूप में सामान्य वितरण का उपयोग करता है | ||
* [[संशोधित आधा सामान्य वितरण|संशोधित | * [[संशोधित आधा सामान्य वितरण|संशोधित हाफ सामान्य]] वितरण <ref name="Sun, Kong and Pal">{{cite journal |last1=Sun |first1=Jingchao |last2=Kong |first2=Maiying |last3=Pal |first3=Subhadip |title=The Modified-Half-Normal distribution: Properties and an efficient sampling scheme |journal=Communications in Statistics - Theory and Methods |date=22 June 2021 |pages=1–23 |doi=10.1080/03610926.2021.1934700 |s2cid=237919587 |url=https://www.tandfonline.com/doi/abs/10.1080/03610926.2021.1934700?journalCode=lsta20 |issn=0361-0926}}</ref> p डीएफ के साथ <math>(0, \infty)</math> के रूप में दिया जाता है <math> f(x)= \frac{2\beta^{\frac{\alpha}{2}} x^{\alpha-1} \exp(-\beta x^2+ \gamma x )}{\Psi{\left(\frac{\alpha}{2}, \frac{ \gamma}{\sqrt{\beta}}\right)}}</math>, जहाँ <math>\Psi(\alpha,z)={}_1\Psi_1\left(\begin{matrix}\left(\alpha,\frac{1}{2}\right)\\(1,0)\end{matrix};z \right)</math> [[फॉक्स-राइट साई समारोह|फॉक्स-राइट पीसाई फलन]] को दर्शाता है। | ||
* [[सामान्य रूप से वितरित और असंबद्ध का अर्थ स्वतंत्र नहीं है]] | * [[सामान्य रूप से वितरित और असंबद्ध का अर्थ स्वतंत्र नहीं है]] | ||
* [[अनुपात सामान्य | * [[अनुपात सामान्य डिस्ट्रीब्यूशन|अनुपात सामान्य वितरण]] के रूप में होता है | ||
* [[पारस्परिक सामान्य | * [[पारस्परिक सामान्य डिस्ट्रीब्यूशन|पारस्परिक सामान्य वितरण]] के रूप में होता है | ||
* [[मानक सामान्य तालिका]] | * [[मानक सामान्य तालिका]] | ||
* स्टीन | * स्टीन लेम्मा | ||
* | * सब-गाऊसी वितरण | ||
* सामान्य रूप से वितरित यादृच्छिक चर का योग | * सामान्य रूप से वितरित यादृच्छिक चर का योग | ||
* ट्वीडी वितरण - सामान्य वितरण ट्वीडी | * ट्वीडी वितरण - सामान्य वितरण ट्वीडी घातांकी फैलाव मॉडल के फॅमिली का सदस्य है। | ||
* रैप्ड नॉर्मल | * रैप्ड नॉर्मल वितरण - सर्कुलर डोमेन पर प्रयुक्त नॉर्मल वितरण के रूप में होते है | ||
* जेड | * जेड टेस्ट्स - सामान्य वितरण का उपयोग करते है | ||
== टिप्पणियाँ == | == टिप्पणियाँ == | ||
Line 1,010: | Line 1,012: | ||
{{ProbDistributions|continuous-infinite}} | {{ProbDistributions|continuous-infinite}} | ||
{{Authority control}} | {{Authority control}} | ||
[[Category: | [[Category:All articles with unsourced statements]] | ||
[[Category:Articles with hatnote templates targeting a nonexistent page]] | |||
[[Category:Articles with invalid date parameter in template]] | |||
[[Category:Articles with unsourced statements from June 2011]] | |||
[[Category:CS1 Latina-language sources (la)]] | |||
[[Category:Collapse templates]] | |||
[[Category:Commons category link is locally defined]] | |||
[[Category:Created On 08/02/2023]] | [[Category:Created On 08/02/2023]] | ||
[[Category:Harv and Sfn no-target errors]] | |||
[[Category:Machine Translated Page]] | |||
[[Category:Vigyan Ready]] |
Latest revision as of 07:49, 16 October 2023
Probability density function | |||
Cumulative distribution function | |||
Notation | |||
---|---|---|---|
Parameters |
= mean (location) = variance (squared scale) | ||
Support | |||
Failed to parse (Conversion error. Server ("cli") reported: "SyntaxError: Expected "-", "[", "\\", "\\begin", "\\begin{", "]", "^", "_", "{", "}", [ \t\n\r], [%$], [().], [,:;?!'], [/|], [0-9], [><~], [\-+*=], or [a-zA-Z] but "ई" found.in 1:44"): {\displaystyle \frac{1}{\sigma\sqrt{2\pi}} ई^{-\frac{1}{2}\बाएं(\frac{x - \mu}{\sigma}\right)^2}} |
Part of a series on statistics |
Probability theory |
---|
सांख्यिकी में, एक सामान्य वितरण या गॉसियन वितरण वास्तविक मान यादृच्छिक चर के लिए निरंतर प्रायिकता वितरण का एक प्रकार है और जबकि इसकी चर की प्रायिकता घनत्व फलन का सामान्य प्रकार है
पैरामीटर वितरण का औसत माध्य अपेक्षित मान है और इसकी माध्यिका और मोड सांख्यिकी पद्धति है, जबकि पैरामीटर इसका मानक विचलन है और इस प्रकार वितरण का वेरिएंस के रूप में है, गाऊसी वितरण के साथ एक यादृच्छिक चर को सामान्य वितरण कहा जाता है और इसे सामान्य विचलन भी कहा जाता है।
सामान्य वितरण आंकड़ों में महत्वपूर्ण होते हैं और अधिकांशतः प्राकृतिक विज्ञान और सामाजिक विज्ञान में वास्तविक-मान वाले यादृच्छिक चर का प्रतिनिधित्व करने के लिए उपयोग किए जाते हैं जिनके वितरण ज्ञात नहीं होते हैं।[1][2] और इस प्रकार उनका महत्व आंशिक रूप से केंद्रीय सीमा प्रमेय के कारण होता है। इसमें कहा गया है कि, कुछ शर्तों के अनुसार परिमित माध्य और वेरिएंस के साथ एक यादृच्छिक चर के कई नमूनों टिप्पणियों का औसत स्वयं एक यादृच्छिक चर है, जिसका वितरण अभिसरण नमूने की संख्या बढ़ने पर सामान्य वितरण में होता है। इसलिए, भौतिक मात्राएँ जो कई स्वतंत्र प्रक्रियाओं का योग होने की आशंका की जाती हैं, जैसे माप त्रुटियां, अधिकांशतः ऐसे वितरण होते हैं जो लगभग सामान्य रूप में होते है।[3]
इसके अतिरिक्त, गॉसियन वितरण में कुछ अद्वितीय गुण हैं जो विश्लेषणात्मक अध्ययनों के रूप में मान हैं। उदाहरण के लिए, सामान्य विचलन के निश्चित संग्रह का कोई भी रैखिक संयोजन एक सामान्य विचलन है। इस प्रकार कई परिणाम और विधियाँ, जैसे कि अनिश्चितता का प्रसार और कम से कम वर्ग पैरामीटर फिटिंग विश्लेषणात्मक रूप से स्पष्ट रूप से प्राप्त की जा सकती हैं जब प्रासंगिक चर सामान्य रूप से वितरित किए जाते हैं।
एक सामान्य वितरण को कभी-कभी अनौपचारिक रूप से बेल कर्व कहा जाता है।[4] चूंकि, कई अन्य वितरण बेल के आकार के होते हैं, जैसे कॉची छात्र का t-वितरण और लॉजिस्टिक वितरण इत्यादि के रूप में होते है। अन्य नामों के लिए नेमिंग देखते हैं।
बहुभिन्नरूपी सामान्य वितरण में सदिश के लिए और आव्यूह सामान्य वितरण में मेट्रिसेस के लिए यूनीवेरिएट प्रायिकता वितरण सामान्यीकृत किया जाता है।
परिभाषाएँ
मानक सामान्य वितरण
सामान्य वितरण का सबसे सरल स्थिति मानक सामान्य वितरण या इकाई सामान्य वितरण के रूप में जाना जाता है। यह एक विशेष स्थिति है जब u = 0 और और इसे इस प्रायिकता घनत्व फलन (या घनत्व) द्वारा वर्णित किया गया है
चर z का माध्य 0 है और वेरिएंस और मानक विचलन घनत्व 1 है इसका शीर्ष पर है और मोड़ बिंदु और .के रूप में है
यद्यपि उपरोक्त घनत्व को सामान्यतः सामान्य मानक के रूप में जाना जाता है, कुछ लेखकों ने उस शब्द का उपयोग सामान्य वितरण के अन्य संस्करणों का वर्णन करने के लिए किया है। उदाहरण के लिए, कार्ल फ्रेडरिक गॉस ने एक बार मानक को सामान्य के रूप में परिभाषित किया था
जिसमें 1/2 का वेरिएंस होता है और स्टीफन स्टिगलर[5] एक बार मानक सामान्य के रूप में परिभाषित किया गया है
जिसका एक सरल फलन ात्मक रूप और एक वेरिएंस है
सामान्य वितरण
प्रत्येक सामान्य वितरण मानक सामान्य वितरण का एक संस्करण है, जिसका डोमेन एक कारक मानक विचलन द्वारा बढ़ाया गया है और फिर द्वारा औसत मान का अनुवाद किया गया है:
प्रायिकता घनत्व द्वारा स्केल किया जाना चाहिए जिससे की समाकलन 1 के रूप में होता है।
यदि एक मानक सामान्य विचलन के रूप में है, तो अपेक्षित मान के साथ एक सामान्य वितरण होता है और मानक विचलन . के बराबर है और मानक सामान्य वितरण के एक कारक द्वारा विस्तारित किया जा सकता है और इस प्रकार द्वारा स्थानांतरित किया जाता है, एक भिन्न सामान्य वितरण प्राप्त करने के लिए द्वारा स्थानांतरित किया जा सकता है, जिसे कहा जाता है. इसके विपरीत यदि पैरामीटर के साथ एक सामान्य विचलन और के रूप में है फिर यह वितरण को फिर से बढ़ाया जा सकता है और सूत्र के माध्यम से स्थानांतरित किया जा सकता है इसे मानक सामान्य वितरण में बदलने के लिए इस चर को का मानकीकृत रूप भी कहा जाता है.
अंकन
मानक गाऊसी वितरण की प्रायिकता घनत्व को अधिकांशतः ग्रीक अक्षर से निरूपित किया जाता है, इस प्रकार मानक सामान्य वितरण शून्य माध्य और इकाई प्रसरण के साथकिया जा सकता है।[6] ग्रीक अक्षर फी का वैकल्पिक रूप, , भी अधिकांशतः प्रयोग किया जाता है।
सामान्य वितरण को अधिकांशतः या कहा जाता है.[7] इस प्रकार जब एक यादृच्छिक चर सामान्य रूप से माध्य और मानक विचलन , के साथ वितरित किया जाता है, तो कोई
- लिख सकता है
वैकल्पिक मानकीकरण
कुछ लेखक विचलन या वेरिएंस के अतिरिक्त वितरण की चौड़ाई को परिभाषित करने वाले पैरामीटर के रूप में अच्छे का उपयोग करने की वकालत करते हैं और इस प्रकार परिशुद्धता को सामान्यतः वेरिएंस के व्युत्क्रम के रूप में परिभाषित किया जाता है,[8] तब इस प्रकार वितरण का सूत्र बन जाता है,
इस विकल्प का संख्यात्मक संगणना में लाभ होने का दावा किया जाता है शून्य के बहुत निकटतम होता है और कुछ संदर्भों में सूत्रों को सरल करता है, जैसे बहुभिन्नरूपी सामान्य वितरण वाले चर के बायेसियन आंकड़ों में करते हैं।
वैकल्पिक रूप से, मानक विचलन का व्युत्क्रम परिशुद्धता के रूप में परिभाषित किया जा सकता है, जिस स्थिति में सामान्य वितरण की अभिव्यक्ति बन जाती है
स्टिगलर के अनुसार, यह सूत्रीकरण बहुत सरल और याद रखने में आसान सूत्र और वितरण की मात्राओं के लिए सरल अनुमानित सूत्रों के कारण लाभप्रद है।
सामान्य वितरण प्राकृतिक और , पैरामीटर और प्राकृतिक सांख्यिकी x और x2 के साथ एक चरघातांकी फॅमिली बनाते हैं। सामान्य वितरण के लिए दोहरी अपेक्षा पैरामीटर η1 = μ और η2 = μ2 + σ2.के रूप में होते है,
संचयी वितरण फलन
मानक सामान्य वितरण का संचयी वितरण फलन (सीडीएफ), सामान्यतः बड़े ग्रीक अक्षर फाई से दर्शाया जाता है, जो अभिन्न रूप में है
संबंधित त्रुटि फलन एक यादृच्छिक चर की प्रायिकता देता है, इस प्रकार माध्य 0 के सामान्य वितरण के साथ और भिन्नता 1/2 सीमा में गिरती है . इस प्रकार है:
इन समाकलन को प्रारंभिक फलन के संदर्भ में व्यक्त नहीं किया जा सकता है और अधिकांशतः इन्हें विशेष फलन कहा जाता है। चूंकि, कई संख्यात्मक सन्निकटन ज्ञात हैं और इस प्रकार अधिक के लिए सामान्य सीडीएफ और सामान्य क्वांटाइल फलन के लिए संख्यात्मक सन्निकटन देखें।
दो फलन निकट सेसंबंधित हैं, अर्थात्
घनत्व के साथ सामान्य सामान्य वितरण के लिए , अर्थ और विचलन , संचयी वितरण फलन के रूप में होते है
मानक सामान्य सीडीएफ का पूरक, , अधिकांशतः Q फलन कहा जाता है, विशेष रूप से इंजीनियरिंग टेक्स्ट में,[9][10] यह प्रायिकता देता है कि एक मानक सामान्य यादृच्छिक चर का मान के रूप में अधिक हो जाता है : . की अन्य परिभाषाएँ -फलन जिनमें से सभी सरल रूपांतरण हैं , का भी कभी-कभी उपयोग किया जाता है।[11]
मानक सामान्य सीडीएफ के एक फलन का ग्राफ बिंदु (0,1/2) के चारों ओर 2 गुना घूर्णी समरूपता है; वह है, . इसका प्रतिपक्षी (अनिश्चितकालीन अभिन्न) निम्नानुसार व्यक्त किया जा सकता है,
मानक सामान्य वितरण के सीडीएफ को एक श्रृंखला में भागों द्वारा एकीकरण द्वारा विस्तारित किया जा सकता है,
जहाँ डबल क्रमगुणित को दर्शाता है।
बड़े x के लिए सीडीएफ का एक ऐसिम्टाटिक विस्तार द्वारा एकीकरण का उपयोग करके प्राप्त किया जा सकता है और इस प्रकार अधिक जानकारी के लिए, त्रुष्टि फलन #एसिम्प्टोटिक विस्तार देखते है।[12]
टेलर श्रृंखला सन्निकटन का उपयोग करके मानक सामान्य वितरण सीडीएफ के लिए एक त्वरित सन्निकटनके रूप में पाये जाते है,
मानक विचलन और कवरेज
एक सामान्य वितरण से निकाले गए लगभग 68% मान एक मानक विचलन σ माध्य से दूर होते हैं और इस प्रकार लगभग 95% मान दो मानक विचलन के भीतर होते हैं और लगभग 99.7% तीन मानक विचलन के भीतर होते हैं।[4] इस तथ्य को 68–95–99.7 एम्पिरिकल नियम या 3-सिग्मा नियम के रूप में जाना जाता है।
अधिक अच्छे रूप से, एक सामान्य विचलन के बीच की सीमा में होने की प्रायिकता और द्वारा दिया गया है
12 महत्वपूर्ण अंकों के लिए, का मान इस प्रकार हैं,
OEIS | ||||||
---|---|---|---|---|---|---|
1 | 0.682689492137 | 0.317310507863 |
|
OEIS: A178647 | ||
2 | 0.954499736104 | 0.045500263896 |
|
OEIS: A110894 | ||
3 | 0.997300203937 | 0.002699796063 |
|
OEIS: A270712 | ||
4 | 0.999936657516 | 0.000063342484 |
| |||
5 | 0.999999426697 | 0.000000573303 |
| |||
6 | 0.999999998027 | 0.000000001973 |
|
बड़े के लिए कोई सन्निकटन मान .का उपयोग किया जा सकता है
क्वांटाइल फलन
किसी वितरण का क्वांटाइल फलन संचयी वितरण फलन का व्युत्क्रम होता है। मानक सामान्य वितरण के क्वांटाइल फलन को प्रोबिट फलन कहा जाता है और इसे व्युत्क्रम त्रुटि फलन के रूप में संदर्भ में व्यक्त किया जा सकता है,
औसत के साथ एक सामान्य यादृच्छिक चर के लिए और वेरिएंस क्वांटाइल फलन के रूप में है
क्वांटाइल मानक सामान्य वितरण का सामान्य रूप से निरूपित किया जाता है . इन मानों का उपयोग परिकल्पना टेस्ट्स , कॉन्फिडेंस अंतराल के निर्माण और Q-Q प्लॉट में किया जाता है। एक सामान्य यादृच्छिक चर अधिक हो जाता है, इस प्रकार प्रायिकता के साथ अंतराल के बाहर होता है प्रायिकता के साथ . विशेष रूप से, क्वांटाइल 1.96 है; इसलिए केवल 5% स्थितियो में एक सामान्य यादृच्छिक चर अंतराल के बाहर होता है।
निम्न तालिका क्वांटाइल इस प्रकार देती है कि एक निर्दिष्ट प्रायिकता . के साथ श्रेणी के रूप में निर्दिष्ट होता है, ये मान नमूना औसत और ऐसिम्टाटिक रूप से सामान्य वितरण वाले अन्य सांख्यिकीय अनुमानकों के लिए टॉलरेंस अंतराल निर्धारित करने के लिए उपयोगी होते है। ध्यान दें कि निम्न तालिका दिखाती है , नहीं जैसा कि ऊपर परिभाषित किया गया है।
0.80 | 1.281551565545 | 0.999 | 3.290526731492 | |
0.90 | 1.644853626951 | 0.9999 | 3.890591886413 | |
0.95 | 1.959963984540 | 0.99999 | 4.417173413469 | |
0.98 | 2.326347874041 | 0.999999 | 4.891638475699 | |
0.99 | 2.575829303549 | 0.9999999 | 5.326723886384 | |
0.995 | 2.807033768344 | 0.99999999 | 5.730728868236 | |
0.998 | 3.090232306168 | 0.999999999 | 6.109410204869 |
छोटे के लिए , क्वांटाइल फलन में उपयोगी ऐसिम्टाटिक विस्तार के रूप में होते है
[13]
गुण
सामान्य वितरण ही एकमात्र ऐसा वितरण है जिसके पहले दो से परे संचयी शून्य होते हैं। अर्थात् माध्य और प्रसरण के अतिरिक्त यह निर्दिष्ट माध्य और वेरिएंस के लिए अधिकतम एन्ट्रापी प्रायिकता वितरण के साथ निरंतर वितरण है।[14][15] गीरी ने मानते हुए यह दिखाया है कि माध्य और वेरिएंस परिमित रूप में होते है और सामान्य वितरण ही एकमात्र वितरण है जहां स्वतंत्र ड्रा के समुच्चय से गणना की गई माध्य और वेरिएंस एक दूसरे से स्वतंत्र हैं।[16][17]
सामान्य वितरण दीर्घवृत्ताकार वितरण का एक उपवर्ग है। सामान्य वितरण अपने माध्य के बारे में सममित वितरण है और संपूर्ण वास्तविक रेखा पर गैर-शून्य है। जैसे कि यह उन चरों के लिए उपयुक्त मॉडल नहीं हो सकता है जो स्वाभाविक रूप से धनात्मक या दृढ़ता से विषम हैं, जैसे किसी व्यक्ति का वजन या शेयर (वित्त) की कीमत इत्यादि। ऐसे चरों को अन्य वितरण द्वारा अच्छे से वर्णित किया जा सकता है, जैसे लॉग-सामान्य वितरण या पारेटो वितरण इत्यादि।
सामान्य वितरण का मान व्यावहारिक रूप से शून्य होता है जब मान माध्य से कुछ मानक विचलनों से अधिक दूर स्थित होता है, उदाहरण के लिए, तीन मानक विचलनों का प्रसार कुल वितरण के 0.27% को छोड़कर सभी को कवर करता है। इसलिए, यह एक उपयुक्त मॉडल नहीं हो सकता है जब कोई आउटलेर्स मानों के एक महत्वपूर्ण भिन्न की अपेक्षा करता है जो कई मानक विचलन को माध्य से दूर करते हैं और कम से कम वर्ग और अन्य सांख्यिकीय अनुमान विधियां जो सामान्य रूप से वितरित चर के लिए इष्टतम हैं, ऐसे डेटा के लिए अधिकांशतः इस प्रकार प्रयुक्त होने पर अत्यधिक अविश्वसनीय हो जाती हैं। उन स्थितियो में, अधिक भारी टेल्ड वाले वितरण की कल्पना की जानी चाहिए और उचित मजबूत सांख्यिकीय अनुमान विधियों को प्रयुक्त किया जाना चाहिए।
गॉसियन वितरण स्टेबल वितरण के फॅमिली से संबंधित है, जो स्वतंत्र और समान रूप से वितरित यादृच्छिक चर के योगों के आकर्षण हैं | इस प्रकार स्वतंत्र, समान रूप से वितरित वितरण माध्य या वेरिएंस परिमित होते है या नहीं। गॉसियन को छोड़कर जो एक सीमित स्थिति में सभी स्टेबल वितरण में भारी टेल्ड और अनंत वेरिएंस होता है। यह उन कुछ वितरण में से एक है जो स्टेबल हैं और जिनमें प्रायिकता घनत्व फलन के रूप में हैं, जिन्हें विश्लेषणात्मक रूप से व्यक्त किया जा सकता है, अन्य कॉची वितरण और लेवी वितरण हैं।
समरूपता और डेरिवेटिव
घनत्व के साथ सामान्य वितरण (अर्थ और मानक विचलन ) के निम्नलिखित गुण हैं
- यह बिंदु के चारों ओर सममित है, जो एक ही समय में बहुलक सांख्यिकी, माध्यिका और वितरण का माध्य है।[18]
- यह अनिमॉडल है इसका पहला यौगिक के लिए धनात्मक है और के लिए ऋणात्मक और पर केवल शून्य के रूप में है
- वक्र और x-अक्ष से घिरा क्षेत्र इकाई है अर्थात एक के बराबर है।
- इसकी पहली अवकलज के रूप में है
- इसके घनत्व में दो विभक्ति बिंदु होते हैं जहाँ दूसरा अवकलज होता है शून्य है और चिह्न बदलता है, इसका अर्थ एक मानक विचलन दूर स्थित है, अर्थात् और [18]
- इसका घनत्व लघुगणकीय रूप से अवतल फलन है।[18]
- इसका घनत्व असीम रूप से भिन्न फलन है, वास्तव में ऑर्डर 2 का सुपरस्मूथ है।[19]
इसके अतिरिक्त घनत्व मानक सामान्य वितरण में निम्नलिखित गुण भी हैं, अर्थात और )
- इसकी पहली अवकलज है
- इसका दूसरा अवकलज है
- अधिक सामान्यतः, इसकी nवें अवकलज है जहाँ n(प्रायिकतात्मक ) हर्मिट बहुपद है।[20]
- प्रायिकता है कि एक सामान्य रूप से वितरित चर ज्ञात के साथ और एक विशेष समुच्चय में है, इस तथ्य का उपयोग करके गणना की जा सकती है कि भिन्न एक मानक सामान्य वितरण है।
मोमेंट
चर के अपेक्षित मान का प्लैन और निरपेक्ष मोमेंट और गणित के रूप में होते है। यदि अपेक्षित मान का शून्य है, इन पैरामीटर को केंद्रीय मोमेंट कहा जाता है; अन्यथा इन पैरामीटर को गैर-केंद्रीय मोमेंट कहा जाता है। सामान्यतः हम केवल पूर्णांक क्रम वाले मोमेंट .में रुचि रखते हैं
यदि एक सामान्य वितरण है, गैर-केंद्रीय मोमेंट के रूप में उपस्थित हैं और किसी के लिए परिमित हैं जिसका वास्तविक भाग −1 से बड़ा है। किसी भी गैर-ऋणात्मक पूर्णांक के लिए प्लैन केंद्रीय मोमेंट इस प्रकार हैं[21]
यहाँ दोहरे क्रमगुणन को दर्शाता है, अर्थात सभी संख्याओं का गुणनफल से 1 तक जिसमें समान समानता है
केंद्रीय निरपेक्ष मोमेंट सभी समान क्रम के लिए प्लैन मोमेंट के साथ मेल खाते हैं, लेकिन विषम क्रमागत के लिए अशून्य हैं। किसी भी गैर-ऋणात्मक पूर्णांक के लिए इस रूप में होते है
अंतिम सूत्र किसी भी गैर-पूर्णांक के लिए मान्य होते है, अर्थात जब प्लैन और निरपेक्ष मोमेंट को कॉन्फ़्लूएंट हाइपरज्यामितीय फलन और के संदर्भ में व्यक्त किया जा सकता है
ये अभिव्यक्ति मान्य रहते हैं यदि पूर्णांक नहीं है। सामान्यीकृत हर्माइट बहुपद भी देखें।
क्रम | अकेंद्रीय मोमेंट | केंद्रीय मोमेंट |
---|---|---|
1 | ||
2 | ||
3 | ||
4 | ||
5 | ||
6 | ||
7 | ||
8 |
गणितीय की अपेक्षा उस घटना पर आधारित थी सशर्त अन्तराल में द्वारा दिया गया है
जहाँ और क्रमशः घनत्व और संचयी वितरण फलन . के लिए के रूप में होता है, इसे व्युत्क्रम मिल्स अनुपात के रूप में जाना जाता है। ध्यान दें कि ऊपर, घनत्व का व्युत्क्रम मिल्स अनुपात में मानक सामान्य घनत्व के अतिरिक्त प्रयोग किया जाता है, इसलिए यहां हमारे पास के अतिरिक्त . हैं।
फूरियर रूपांतरण और विशिष्ट फलन
एक सामान्य घनत्व का फूरियर रूपांतरण माध्य के साथ और मानक विचलन के रूप में है[22]
जहाँ काल्पनिक इकाई है। यदि माध्य , पहला कारक 1 है और फूरियर ट्रांसफॉर्म एक स्टेबल कारक के अतिरिक्त आवृत्ति डोमेन पर एक सामान्य घनत्व है, इस प्रकार 0 और मानक विचलन के साथ . विशेष रूप से, मानक सामान्य वितरण एक फूरियर रूपांतरण का एक अभिलक्षणिक फलन है।
प्रायिकता सिद्धांत में, एक वास्तविक-मान यादृच्छिक चर के प्रायिकता वितरण का फूरियर रूपांतरण विशेष फलन प्रायिकता सिद्धांत से निकटता से जुड़ा हुआ है उस चर के रूप में होते है, जिसके अपेक्षित मान के रूप में परिभाषित किया गया है वास्तविक चर के एक फलन के रूप में फूरियर रूपांतरण की आवृत्ति पैरामीटर के रूप में होते है। इस परिभाषा को विश्लेषणात्मक रूप से एक सम्मिश्र -मान चर तक बढ़ाया जा सकता है[23] दोनों के बीच संबंध इस प्रकार है,
मोमेंट और संचयी जनरेटिंग फलन
एक वास्तविक यादृच्छिक चर का मोमेंट जनरेटिंग फलन का अपेक्षित मान है और इस प्रकार वास्तविक पैरामीटर के एक फलन के रूप में . घनत्व के साथ सामान्य वितरण के लिए , अर्थ और विचलन , मोमेंट जनरेटिंग फलन के रूप में उपस्थित है और इसके बराबर है
संचयी जनरेटिंग फलन मोमेंट जनरेटिंग फलन का लघुगणक है, अर्थात्
चूँकि यह एक द्विघात बहुपद के रूप में होते है, केवल पहले दो संचयी अशून्य हैं, अर्थात् माध्य और भिन्नता .के रूप में होते है
स्टीन ऑपरेटर और वर्ग
स्टीन की विधि के भीतर स्टीन ऑपरेटर और एक यादृच्छिक चर का वर्ग हैं और सभी बिल्कुल निरंतर फलन का वर्ग .के रूप में होता है
शून्य वेरिएंस सीमा
सीमा में (गणित) जब शून्य हो जाता है, प्रायिकता घनत्व अंततः शून्य हो जाता है , लेकिन यदि ,बिना सीमा के बढ़ता है जबकि इसका समाकल 1 के बराबर रहता है। इसलिए, सामान्य वितरण को साधारण फलन (गणित) के रूप में परिभाषित नहीं किया जा सकता जब होता है
चूंकि, सामान्य वितरण को एक सामान्यीकृत फलन के रूप में शून्य वेरिएंस के साथ परिभाषित किया जा सकता है; विशेष रूप से, डिराक का डेल्टा फलन के रूप में माध्यम से अनुवादित है, इसका सीडीएफ तब माध्य ,द्वारा अनुवादित हैवीसाइड स्टेप फलन है,
अधिकतम एन्ट्रापी
एक निर्दिष्ट माध्य के साथ वास्तविक पर सभी प्रायिकता वितरण में से और वेरिएंस , सामान्य वितरण अधिकतम एंट्रॉp प्रायिकता वितरण वाला एक है।[24] यदि प्रायिकता घनत्व फलन के साथ एक सतत यादृच्छिक चर है और इस प्रकार फिर एन्ट्रापी को परिभाषित किया जाता है[25][26][27]
जहाँ कभी भी शून्य समझा जाता है . इस फलन कार्यात्मकता को अधिकतम किया जा सकता है, इस शर्त के अधीन कि वितरण उचित रूप से सामान्यीकृत है और इसमें वैरिएबल कैलकुलस का उपयोग करके एक निर्दिष्ट भिन्नता है। दो लैग्रेंज गुणक वाले एक फलन को परिभाषित किया गया है
जहाँ अभी के लिए, माध्य के साथ कुछ घनत्व फलन के रूप में माना जाता है और मानक विचलन .के रूप में होता है
अधिकतम एन्ट्रापी पर, एक छोटा बदलाव के बारे में भिन्नता उत्पन्न करता है, के बारे में जो 0 के बराबर होता है
चूंकि यह किसी भी छोटे के लिए होना चाहिए, कोष्ठक में शब्द शून्य के रूप में होता है और यील्ड के लिए हल करना चाहिए:
और को हल करने के लिए कॉन्सट्रेंट समीकरणों का उपयोग करने से सामान्य वितरण का घनत्व प्राप्त होता है:
एक सामान्य वितरण की एन्ट्रॉp बराबर होती है
अन्य गुण
- यदि किसी यादृच्छिक चर का अभिलक्षणिक फलन रूप का है , जहां एक बहुपद है, तो जोज़ेफ़ मार्सिंकीविज़ के नाम पर मार्सिंकीविज़ प्रमेय का दावा है कि अधिक से अधिक एक द्विघात बहुपद हो सकता है, और इसलिए एक सामान्य यादृच्छिक चर है। इस परिणाम का परिणाम यह है कि सामान्य वितरण गैर-शून्य संचयकों की सीमित संख्या (दो) वाला एकमात्र वितरण है।
- यदि और संयुक्त रूप से सामान्य और असंबंधित हैं, तो वे स्वतंत्र हैं। यह आवश्यक है कि और संयुक्त रूप से सामान्य रूप में होते है और इस प्रकार गुणधर्म टिक नहीं पाती। गैर सामान्य यादृच्छिक चर के लिए असंबद्धता का अर्थ स्वतंत्र नहीं होता है।
- एक सामान्य वितरण का दूसरे से कुल्बैक-लीब्लर विचलन द्वारा दिया जाता है,
- सामान्य वितरण के लिए फिशर सूचना मैट्रिक्स wrt गणित> \ mu</ गणित>और >\sigma^2</math> विकर्ण है और फार्म लेता है गणित प्रदर्शन = ब्लॉक> \mathcal I (\mu, \sigma^2) = \begin{pmatrix} \frac{1}{\sigma^2} & 0 \\ 0 & \frac{1}{2\sigma^4} \end{ pmatrix} </ गणित> सामान्य वितरण के लिए फिशर सूचना मैट्रिक्स wrt गणित> \ mu</ गणित>और >\sigma^2</math> विकर्ण है और फार्म लेता है।
- एक सामान्य बंटन के माध्य से पहले का संयुग्मी एक अन्य सामान्य बंटन है।[28] विशेष रूप से, अगर आईआईडी हैं और पूर्व है , फिर के अनुमानक के लिए पश्च वितरण होगा
- सामान्य वितरण की फॅमिली न केवल घातीय फॅमिली (EF) बनाता है, जिससे कि वास्तव में द्विघात विस्थापन फलन (NEF) के साथ एक प्राकृतिक घातीय फॅमिली (NEF) बनाता है। सामान्य वितरण के कई गुण NEF-QVF वितरण, NEF वितरण या EF वितरण के सामान्य गुणों के अनुसार होते हैं।एन NEF or EF के वितरण में 6 फॅमिली के रूप में सम्मलित हैं, जिनमें पॉइसन, गामा, द्विपद और ऋणात्मक द्विपद वितरण के रूप में सम्मलित हैं, जबकि कई सामान्य फॅमिली संभावना और सांख्यिकी में अध्ययन कर रहे हैं
- सूचना ज्यामिति में, सामान्य वितरण की फॅमिली निरंतर वक्रता के साथ एक सांख्यिकीय कई गुना बनाता है . (±1)-कनेक्शन के संबंध में एक ही फॅमिली कई गुना फ्लैट है और .[29]
संबंधित वितरण
केंद्रीय सीमा प्रमेय
केंद्रीय सीमा प्रमेय कहता है कि कुछ बहुत सामान्य स्थितियों के अनुसार कई यादृच्छिक चरों के योग का लगभग सामान्य वितरण होता है। इस प्रकार विशेष रूप से, जहाँ स्वतंत्र और समान रूप से समान वितरण के रूप में होता है और शून्य माध्य और वेरिएंस के साथ समान रूप से वितरित यादृच्छिक चर और उनका माध्य द्वारा मापा जाता है
फिर, जैसे-जैसे बढ़ता है, की प्रायिकता वितरण शून्य माध्य और वेरिएंस .के साथ सामान्य वितरण की ओर प्रवृत्त होता है
प्रमेय को चरों तक बढ़ाया जाता है, जो स्वतंत्र रूप में नहीं हैं या समान रूप से वितरित नहीं हैं यदि कुछ कॉन्सट्रेंट को निर्भरता की डिग्री और वितरण के मोमेंट पर रखा जाता है।
व्यवहार में आने वाले अनेक परीक्षण सांख्यिकी, अंक (सांख्यिकी) और एस्टीमेटर अभ्यास में सामना करते हैं, उनमें कुछ यादृच्छिक चर के योग होते हैं और इससे भी अधिक अनुमानकों को अभिव्यक्ति फलन (सांख्यिकी) के उपयोग के माध्यम से यादृच्छिक चर के योग के रूप में दर्शाया जा सकता है। केंद्रीय सीमा प्रमेय का अर्थ है कि उन सांख्यिकीय पैरामीटर में असमान रूप से सामान्य वितरण होता है।
केंद्रीय सीमा प्रमेय का अर्थ यह भी है कि कुछ वितरण को सामान्य वितरण द्वारा अनुमानित किया जा सकता है, उदाहरण के लिए:
- द्विपद वितरण माध्य के साथ डी मोइवर-लाप्लास प्रमेय है और वेरिएंस बड़े के लिए और के लिए 0 या 1 के बहुत निकटतम रूप में नहीं होते है।
- पैरामीटर के साथ पॉइसन वितरण औसत के साथ लगभग सामान्य रूप में होते है और वेरिएंस , के बड़े मानों के लिए .के रूप में होते है[30]
- ची-वर्ग वितरण औसत के साथ लगभग सामान्य है और वेरिएंस , बड़े के लिए . रूप में होते है
- छात्र का टी-वितरण माध्य 0 और प्रसरण 1 के साथ लगभग सामान्य है जब बड़ी है।
ये अनुमान पर्याप्त रूप से अच्छे हैं या नहीं यह इस बात पर निर्भर करता है कि उनकी आवश्यकता किस प्रयोजन के लिए है और सामान्य वितरण के संयोजन की दर इस तरह के अनुमान वितरण के अंत में कम अच्छे होते हैं।
केंद्रीय सीमा प्रमेय में सन्निकटन त्रुटि के लिए एक सामान्य ऊपरी सीमा बेरी-एसेन प्रमेय द्वारा दी गई है और इस प्रकार सन्निकटन में सुधार एडगेवर्थ विस्तार द्वारा दिया गया है।
इस प्रमेय का उपयोग गॉसियन नॉइज़ के रूप में कई समान नॉइज़ स्रोतों के योग को सही ठहराने के लिए भी किया जा सकता है। इसको AWGN. में दिखाया गया है।
सामान्य चर के संचालन और फलन
प्रायिकता घनत्व फलन संचयी वितरण फलन और एक या एक से अधिक स्वतंत्र या सहसंबद्ध सामान्य चर के किसी भी फलन के व्युत्क्रम संचयी वितरण फलन की गणना रे-ट्रेसिंग की संख्यात्मक विधि से की जा सकती है।[31] (मैटलैब कोड) और इस प्रकार निम्नलिखित अनुभागों में हम कुछ विशेष स्थितियो को देख सकते है।
एकल सामान्य चर पर संचालन
यदि माध्य के साथ सामान्य रूप से वितरित किया जाता है और वेरिएंस , तब
- , किसी भी वास्तविक संख्या के लिए और , भी सामान्य रूप से माध्य के साथ वितरित किया जाता है और मानक विचलन . अर्थात्, रैखिक परिवर्तनों के अनुसार सामान्य वितरण का फॅमिली संवृत रूप में होते है।
- का घातांक लॉग-सामान्य रूप से: eX ~ ln(N (μ, σ2)). वितरित किया जाता है
- का पूर्ण मान सामान्य वितरण |X| ~ Nf (μ, σ2).को फोल्ड कर देता है, यदि इसे अर्ध-सामान्य वितरण के रूप में जाना जाता है।
- सामान्यीकृत अवशिष्टों का निरपेक्ष मान, |X - μ|/σ, में स्वतंत्र की एक डिग्री के साथ ची वितरण होते है। .
- X/σ के वर्ग में स्वतंत्र की एक डिग्री के साथ गैर-केन्द्रीय ची-वर्ग वितरण है: . यदि , वितरण को केवल ची-वर्ग कहा जाता है।
- एक सामान्य चर की लॉग प्रायिकता केवल इसकी प्रायिकता घनत्व फलन का लघुगणक है,चूंकि यह एक मानक सामान्य चर का एक स्केल्ड और स्थानांतरित वर्ग है, इसे स्केल्ड और शिफ्ट किए गए ची-स्क्वेर्ड चर के रूप में वितरित किया जाता है।
- वेरिएबलX का वितरण एक अंतराल [a, b] तक सीमित है, जिसे छोटा सामान्य वितरण कहा जाता है।
- (X- μ)−2 का लेवी वितरण स्थान 0 और स्केल σ2 के साथ है
दो स्वतंत्र सामान्य चर पर संचालन
- यदि और साधन के साथ दो स्वतंत्र ( प्रायिकता सिद्धांत) सामान्य यादृच्छिक चर हैं , और मानक विचलन , , फिर उनका योग भी सामान्य रूप से वितरित किया जाता है, सामान्य रूप से वितरित यादृच्छिक चर का योग माध्य के साथ और वेरिएंस .के रूप में होता है
- विशेष रूप से, यदि और शून्य माध्य और वेरिएंस के साथ स्वतंत्र सामान्य विचलन हैं, तब और शून्य माध्य और वेरिएंस के साथ स्वतंत्र और सामान्य रूप से वितरित होते है यह ध्रुवीकरण की पहचान की एक विशेष स्थिति है।[32]
- यदि , माध्य के साथ दो स्वतंत्र सामान्य विचलन हैं और विचलन , और , यादृच्छिक वास्तविक संख्याएं हैं, इस प्रकार चर भी सामान्य रूप से माध्य के साथ वितरित किया जाता है और विचलन . यह इस प्रकार है कि सामान्य वितरण स्टेबल वितरण घातांक के साथ है
दो स्वतंत्र मानक सामान्य चर पर संचालन
यदि और माध्य 0 और प्रसरण 1 के साथ दो स्वतंत्र मानक सामान्य यादृच्छिक चर के रूप में हैं
- उनका योग और अंतर सामान्य रूप से माध्य शून्य और वेरिएंस .दो के साथ वितरित किया जाता है
- उनका गुणन घनत्व फलन के साथ सामान्य वितरण का अनुसरण करता है[33] इस प्रकार जहाँ दूसरे प्रकार का संशोधित बेसेल फलन है। यह वितरण , पर असंबद्ध शून्य के आसपास सममित है और इसका विशिष्ट फलन प्रायिकता सिद्धांत .के रूप में है
- उनका अनुपात मानक कॉची वितरण का अनुसरण करता है: .
- उनका यूक्लिडियन मानदंड रेले वितरण है।
कई स्वतंत्र सामान्य चर पर संचालन
- स्वतंत्र सामान्य विचलन का कोई भी रैखिक संयोजन एक सामान्य विचलन है।
- यदि स्वतंत्र मानक सामान्य यादृच्छिक चर हैं, तो उनके वर्गों के योग में ची-वर्ग वितरण है और स्वतंत्र की कोटियां इस प्रकार है,
- यदि साधन के साथ सामान्य रूप से वितरित यादृच्छिक चर स्वतंत्र हैं और प्रसरण , तो उनका नमूना माध्य नमूना मानक विचलन से स्वतंत्र है,[34] जिसे बसु के प्रमेय या कोचरन के प्रमेय का उपयोग करके प्रदर्शित किया जा सकता है।[35] इन दो मात्राओं के अनुपात में छात्र का t-वितरण होता है स्वतंत्र की कोटियो के रूप में होती है
- यदि , स्वतंत्र मानक सामान्य यादृच्छिक चर हैं, तो वर्गों के सामान्यीकृत योगों का अनुपात होता है F-वितरण साथ (n, m) स्वतंत्र की कोटियां होती है [36]
एकाधिक सहसंबद्ध सामान्य चर पर संचालन
- सामान्य सदिश का द्विघात रूप, अर्थात द्विघात फलन एकाधिक स्वतंत्र या सहसंबद्ध सामान्य चर का, एक सामान्यीकृत ची-स्क्वायर वितरण है।
घनत्व फलन पर संचालन
विभाजित सामान्य वितरण को विभिन्न सामान्य वितरण के घनत्व फलन के स्केल किए गए वर्गों के रूप में सम्मलित होने और एक में एकीकृत करने के लिए घनत्व को कम करने के संदर्भ में सबसे सीधे परिभाषित किया गया है। इस प्रकार छोटा किया गया सामान्य वितरण एकल घनत्व फलन के एक खंड को फिर से स्केल करने का परिणाम होता है।
अनंत विभाज्यता और क्रैमर की प्रमेय
किसी भी धनात्मक पूर्णांक के लिए , माध्य के साथ कोई भी सामान्य वितरण और वेरिएंस के योग का वितरण है, इस प्रकार स्वतंत्र सामान्य विचलन प्रत्येक माध्य के साथ और वेरिएंस . इस गुणधर्म को अनंत विभाज्यता प्रायिकता कहा जाता है।[37]
इसके विपरीत यदि और स्वतंत्र यादृच्छिक चर और उनकी राशि हैं एक सामान्य वितरण है, फिर दोनों और सामान्य विचलन के रूप में होना चाहिए।[38]
इस परिणाम को क्रैमर के अपघटन प्रमेय के रूप में जाना जाता है और यह कहने के बराबर है कि दो वितरण का कनवल्शन सामान्य है यदि और केवल यदि दोनों सामान्य हैं। क्रैमर के प्रमेय का तात्पर्य है कि स्वतंत्र गैर-गाऊसी चरों के एक रैखिक संयोजन का कभी भी बिल्कुल सामान्य वितरण नहीं होता है, चूंकि यह यादृच्छिक ढंग से निकटता से संपर्क कर सकता है।[39]
बर्नस्टीन की प्रमेय
बर्नस्टीन के प्रमेय में कहा गया है कि यदि और स्वतंत्र हैं और और स्वतंत्र भी हैं, तो X और Y दोनों का सामान्य वितरण अनिवार्य रूप से होते है।[40][41]
अधिक सामान्यतः, यदि स्वतंत्र यादृच्छिक चर हैं, फिर दो भिन्न रैखिक संयोजन और स्वतंत्र रूप में होता है, यदि और केवल यदि सभी सामान्य हैं और , जहाँ के वेरिएंस .को दर्शाता है[40]
एक्सटेंशन
सामान्य वितरण की धारणा प्रायिकता सिद्धांत में सबसे महत्वपूर्ण वितरण होने के कारण यूनीवेरिएट के मानक ढांचे से बहुत आगे तक बढ़ा दिया गया है, जो कि एक आयामी स्थिति (1) के रूप में है और इस प्रकार इन सभी विस्तारों को सामान्य या गाऊसी नियम भी कहा जाता है, इसलिए नामों में एक निश्चित अस्पष्टता उपस्थित होती है।
- बहुभिन्नरूपी सामान्य वितरण के-आयामी यूक्लिडियन स्थान में गॉसियन नियम का वर्णन करता है। एक सदिश X ∈ Rk बहुभिन्नरूपी -सामान्य रूप से वितरित है यदि इसके घटकों का कोई रैखिक संयोजन Σk
j=1aj Xj एक अविभाजित सामान्य वितरण है। इस प्रकार X का प्रसरण एक k×k सममित सकारात्मक-निश्चित आव्यूह V के रूप में है। बहुभिन्नरूपी सामान्य वितरण दीर्घवृत्ताकार वितरण का एक विशेष स्थिति है। जैसे, k = 2 स्थितियो में इसका आइसो-घनत्व लोकी दीर्घवृत्त हैं और यादृच्छिक k के स्थितियो में दीर्घवृत्त हैं। - संशोधित गाऊसी वितरण सामान्य वितरण का एक संशोधित संस्करण है जिसमें सभी ऋणात्मक तत्व 0 पर रीसमुच्चय हो जाते हैं
- सम्मिश्र सामान्य वितरण सम्मिश्र सामान्य सदिश से संबंधित होते है। एक सम्मिश्र सदिश X ∈ Ck सामान्य वितरण कहा जाता है यदि इसके वास्तविक और काल्पनिक दोनों घटक संयुक्त रूप से 2k-आयामी बहुभिन्नरूपी सामान्य वितरण होता है। इस प्रकार X की प्रसरण-सहप्रसरण संरचना को दो आव्यूहों द्वारा वर्णित किया जाता है, जबकि प्रसरण आव्यूह Γ और संबंध आव्यूह C के रूप में दर्शाया गया है।
- आव्यूह सामान्य वितरण सामान्य रूप से वितरित आव्यूह के स्थितियो का वर्णन करता है।
- गॉसियन प्रक्रियाएं सामान्य रूप से वितरित स्टोकेस्टिक प्रक्रियाएं हैं। इन्हें कुछ अनंत-आयामी हिल्बर्ट स्थान H के तत्वों के रूप में देखा जा सकता है और इस प्रकार सामान्य स्थितियो के लिए बहुभिन्नरूपी सामान्य सदिश के अनुरूप होती है k = ∞. एक यादृच्छिक तत्व h ∈ H सामान्य कहा जाता है, यदि किसी स्थिरांक a ∈ H के लिए अदिश गुणन (a, h) एक (अविभाजित) सामान्य वितरण है। ऐसे गॉसियन ऐसे यादृच्छिक तत्व की वेरिएंस संरचना को रैखिक सहप्रसरण ऑपरेटर K: H → H के संदर्भ में वर्णित किया जा सकता है। इस प्रकार कई गाऊसी प्रक्रियाएँ अपने स्वयं के नाम रखने के लिए बहुत लोकप्रिय हो गई है
- ब्राउनी गति
- ब्राउनियन ब्रिज,
- ऑर्नस्टीन-उहलेनबेक प्रक्रिया
- गॉसियन q -वितरण एक सार गणितीय निर्माण है जो सामान्य वितरण के q -एनालॉग का प्रतिनिधित्व करता है।
- q-गाऊसी गॉसियन वितरण का एक एनालॉग है, इस अर्थ में कि यह सॉलिस एंट्रॉp को अधिकतम करता है और एक प्रकार का सॉलिस वितरण है। ध्यान दें कि यह वितरण उपरोक्त गॉसियन q-वितरण से भिन्न होता है।
- कनियादकिस κ-गाऊसी वितरण गॉसियन वितरण का एक सामान्यीकरण है, जो कनियादकिस वितरण से उत्पन्न होता है और जो कनियादाकिस वितरणों में से एक है।
यदि यादृच्छिक चर X में वितरण होता है तो उसके पास दो खण्ड सामान्य वितरण के रूप में होते है।
जहां μ माध्य है और σ1 और σ2 क्रमशः माध्य के बाएँ और दाएँ वितरण के मानक विचलन हैं।
इस वितरण का माध्य, वेरिएंस और तीसरा केंद्रीय मोमेंट निर्धारित किया जाता है,[42]
जहाँ E(X), V(X) और T(X) क्रमशः माध्य, वेरिएंस और तीसरा केंद्रीय मोमेंट के रूप में होता है ।
गॉसियन नियम के मुख्य व्यावहारिक उपयोगों में से एक व्यवहार में आने वाले कई भिन्न -भिन्न यादृच्छिक चरों के प्रयोगसिद्ध वितरण को मॉडल करना है। ऐसे स्थितियो में एक संभावित विस्तार वितरण का एक समृद्ध फॅमिली होता है, जिसमें दो से अधिक पैरामीटर होते है और इसलिए प्रयोगसिद्ध वितरण को अधिक अच्छे रूप से फिट करने में सक्षम होते है इस प्रकार एक्सटेंशन के उदाहरण होते है।
- पियर्सन वितरण — प्रायिकता वितरण का एक चार-पैरामीटर फॅमिली जो विभिन्न विषमता और कर्टोसिस मानों को सम्मलित करने के लिए सामान्य नियम का विस्तार करता है।
- सामान्यीकृत सामान्य वितरण , जिसे घातांक घात वितरण के रूप में भी जाना जाता है और इस प्रकार मोटे या पतले ऐसिम्टाटिक व्यवहार के साथ वितरण टेल्ड की अनुमति देता है।
सांख्यिकीय निष्कर्ष
पैरामीटर का अनुमान
अधिकांशतः ऐसा होता है कि हम सामान्य वितरण के पैरामीटर को नहीं जानते हैं, बल्कि इसके अतिरिक्त उन्हें अनुमान सिद्धांत से करना चाहते हैं। अर्थात एक सामान्य से जनसंख्या से एक नमूना लेकर हम पैरामीटर के अनुमानित मानों को सीखना चाहते है और इस प्रकार और . इस प्रॉब्लम का मानक दृष्टिकोण अधिकतम प्रायिकता विधि है, जिसके लिए लॉग-लाइबिलिटी फलन को अधिकतम करने की आवश्यकता होती है
और के संबंध में अवकलन लेने और पहले क्रम की स्थितियों की परिणामी प्रणाली को हल करने से अधिकतम प्रायिकता अनुमान प्राप्त होता है,
नमूना मतलब
एस्टीमेटर को नमूना माध्य कहा जाता है, क्योंकि यह सभी अवलोकनों का अंकगणितीय माध्य है। आँकड़ा , के लिए पूर्ण और पर्याप्त है और इसलिए लेहमैन-शेफ़े प्रमेय के अनुसार समान रूप से न्यूनतम विचरण निष्पक्ष (यूएमवीयू) एस्टीमेटर है।.[43] परिमित नमूनों में यह सामान्य रूप से वितरित किया जाता है:
इस एस्टीमेटर का प्रसरण व्युत्क्रम फिशर सूचना आव्यूह के μμ-तत्व के बराबर है। इसका तात्पर्य है कि एस्टीमेटर परिमित नमूना कुशल रूप में होते है। इस प्रकार व्यावहारिक महत्व का तथ्य यह है कि की मानक त्रुटि (सांख्यिकी) के समानुपातिक होता है, अर्थात यदि कोई मानक त्रुटि को 10 के गुणक से घटाना चाहता है, तो उसे नमूने में अंकों की संख्या 100 के गुणक से बढ़ानी होती है। यह तथ्य जनमत सर्वेक्षणों के लिए नमूना आकार और मोंटे कार्लो सिमुलेशन में परीक्षणों की संख्या को निर्धारित करने में व्यापक रूप से उपयोग किया जाता है।
ऐसिम्टाटिक सिद्धांत (सांख्यिकी) के दृष्टिकोण से संगत एस्टीमेटर है, अर्थात, यह प्रायिकता में अभिसरण के रूप में है, जैसा . एस्टीमेटर भी ऐसिम्टाटिक सामान्यता है, जो इस तथ्य का एक सरल परिणाम है कि यह परिमित नमूनों में सामान्य है:
नमूना वेरिएंस
एस्टीमेटर को नमूना प्रसरण कहा जाता है, क्योंकि यह नमूने का प्रसरण गणित है और इस प्रकार अभ्यास में,और इस प्रकार के अतिरिक्त अधिकांशतः एक अन्य एस्टीमेटर का उपयोग किया जाता है। यह अन्य एस्टीमेटर से निरूपित करते है और इसे नमूना वेरिएंस भी कहा जाता है, जो शब्दावली में एक निश्चित अस्पष्टता का प्रतिनिधित्व करता है और इसका वर्गमूल नमूना मानक विचलन कहा जाता है। एस्टीमेटर , से भिन्न होता है और (n − 1) भाजक में n के अतिरिक्त तथाकथित बेसेल होता है
बीच में अंतर और बड़े n के लिए नगण्य रूप से छोटा हो जाता है। चूंकि परिमित नमूनों में, के उपयोग के p छे की प्रेरणा के रूप में यह है कि यह अंतर्निहित पैरामीटर का निष्पक्ष एस्टीमेटर है, जबकि < पक्षपातपूर्ण है। इसके अतिरिक्त , लेहमन-शेफ़े प्रमेय द्वारा एस्टीमेटर गणित समान रूप से न्यूनतम भिन्नता निष्पक्ष अनुमानक है,[43] जो इसे सभी निष्पक्ष लोगों के बीच सबसे अच्छा एस्टीमेटर बनाता है। चूंकि यह दिखाया जा सकता है कि पक्षपाती एस्टीमेटर से अच्छे से है और इस प्रकार माध्य वर्ग त्रुटि (एमएसई) मानदंड के संदर्भ में के रूप में होती है। परिमित नमूनों में दोनों और के साथ स्केल किया हुआ ची-वर्ग वितरण (n − 1) स्वतंत्र की कोटियां होती है
इन अभिव्यक्ति में से पहला दर्शाता है कि का वेरिएंस के बराबर है, जो व्युत्क्रम फ़िशर सूचना आव्यूह के σσ-तत्व से थोड़ा अधिक होता है। इस प्रकार, के लिए एक कुशल आकलनकर्ता के रूप में नहीं है और इसके अतिरिक्त UMVU के रूप में होते है, हम यह निष्कर्ष निकाल सकते हैं कि परिमित-नमूना कुशल एस्टीमेटर के लिए उपस्थित नहीं होता है।
ऐसिम्टाटिक सिद्धांत को प्रयुक्त करना, दोनों एस्टीमेटर और संगत हैं, अर्थात वे प्रायिकता में अभिमुख होते है नमूना आकार के रूप में होते है, दोनों अनुमानक भी स्पर्शोन्मुख रूप से सामान्य हैं,
विशेष रूप से, दोनों एस्टीमेटर .के लिए स्पर्शोन्मुख रूप से कुशल हैं
कॉन्फिडेंस अंतराल
कोचरन के प्रमेय के अनुसार, सामान्य वितरण के लिए नमूने का अर्थ और नमूना प्रसरण s2 स्वतंत्र (प्रायिकता सिद्धांत हैं, जिसका अर्थ है कि उनके संयुक्त वितरण पर विचार करने से कोई लाभ नहीं हो सकता है। एक विलोम प्रमेय भी है, यदि एक नमूने में नमूना माध्य और नमूना वेरिएंस स्वतंत्र रूप में हैं, तो नमूना सामान्य वितरण के रूप में आया होता है । तथाकथित t-सांख्यिकी के निर्माण के लिए और s के बीच की स्वतंत्र को नियोजित किया जा सकता है,
- गणित>
t = \frac{\hat\mu-\mu}{s/\sqrt{n}} = \frac{\overline{x}-\mu}{\sqrt{\frac{1}{n(n-1) )}\sum(x_i-\overline{x})^2}} \sim t_{n-1} </ गणित>
इस क्वांटाइल t में छात्र का t-वितरण (n − 1) है, इस प्रकार स्वतंत्र की डिग्री और यह एक सहायक आँकड़ा पैरामीटर के मान से स्वतंत्र है। इस t-सांख्यिकी के वितरण को बदलने से हमें μ के लिए कॉन्फिडेंस अंतराल का निर्माण करने की अनुमति मिलती है;[44] इसी तरह, आँकड़ा s2 के χ2 वितरण को उलटने से हमें σ2 के लिए कॉन्फ़िडेंस इंटरवल देता है:[45]
जहां tk,pऔर χ 2
k,p क्रमशः t- और χ2 वितरण की pth मात्राएँ हैं। ये कॉन्फिडेंस इंटरवल आत्मकॉन्फिडेंस स्तर 1 − α के होते हैं, जिसका अर्थ है कि ट्रू मान μ और σ2 प्रायिकता या सार्थकता स्तर α के साथ इन अंतरालों के बाहर आते हैं। इस प्रकार व्यवहार में लोग सामान्यतः α = 5% लेते हैं, जिसके परिणामस्वरूप 95% कॉन्फिडेंस अंतराल के रूप में होता है।
अनुमानित सूत्र और s2 के असिम्प्टोटिक वितरण से प्राप्त किए जा सकते हैं।
अनुमानित सूत्र n के बड़े मानों के लिए मान्य रूप में हो जाते हैं और और मैन्युअल गणना के लिए अधिक सुविधाजनक होते हैं क्योंकि मानक सामान्य क्वांटाइल्स zα/2 n पर निर्भर नहीं होती हैं। विशेष रूप से सबसे लोकप्रिय मान α = 5%, का परिणाम |z0.025| = 1.96 के रूप में होता है,
सामान्य टेस्ट्स
सामान्यता टेस्ट्स इस प्रायिकता का आकलन करते हैं कि दिए गए डेटा समुच्चय {x1, ..., xn} सामान्य वितरण के रूप में होता है। सामान्यतः शून्य परिकल्पना H0 यह है कि टेस्ट्स सामान्य रूप से अनिर्दिष्ट माध्य μ और वेरिएंस σ2 के साथ वितरित किए जाते हैं और इस प्रकार वैकल्पिक Ha कि वितरण यादृच्छिक है। इस प्रॉब्लम के लिए कई टेस्ट्स 40 से अधिक तैयार किए गए हैं। उनमें से अधिक प्रमुख नीचे उल्लिखित हैं
'नैदानिक प्लॉट' अधिक सहज रूप से आकर्षक लेकिन एक ही समय में व्यक्तिपरक होते हैं, क्योंकि वे शून्य परिकल्पना को स्वीकार या अस्वीकार करने के लिए अनौपचारिक मानवीय निर्णय पर भरोसा करते हैं।
- q -q प्लॉट, जिसे सामान्य प्रायिकता प्लॉट या रैंकिट प्लॉट के रूप में भी जाना जाता है - मानक सामान्य वितरण से संबंधित मात्राओं के अपेक्षित मानों के विरुद्ध डेटा समुच्चय से क्रमबद्ध मानों का एक प्लॉट है और इस प्रकार यह फॉर्म के बिंदु का एक प्लॉट (Φ-1(pk), x(k)) है, जहां प्लॉटिंग पॉइंट pk, pk = (k − α)/(n + 1 − 2α) के बराबर हैं और α एक समायोजन स्थिरांक है, जो 0 और 1 के बीच कुछ भी हो सकता है। यदि शून्य परिकल्पना सत्य है, तो प्लॉट किए गए बिंदुओं को लगभग एक सीधी रेखा पर स्थित होना चाहिए।
- p -p प्लॉट - q -q प्लॉट के समान, लेकिन बहुत कम बार उपयोग किया जाता है। इस पद्धति में बिंदुओं की आलेखित करना सम्मलित है (Φ(z(k)), p k), जहाँ . सामान्य रूप से वितरित डेटा के लिए यह प्लॉट (0, 0) और (1, 1) के बीच 45° रेखा पर स्थित होता है।
फिट टेस्ट की गुडनेस :
मोमेंट -आधारित टेस्ट :
- डी'ऑगस्टिनो का k-स्क्वेर्ड टेस्ट
- जर्क-बेरा टेस्ट
- शापिरो-विल्क टेस्ट : यह इस तथ्य पर आधारित है कि q -q प्लॉट में रेखा का प्रवणता σ है। इस प्रकार टेस्ट्स नमूना वेरिएंस के मान के साथ उस प्रवणता के कम से कम वर्गों के अनुमान की तुलना करता है और यदि ये दो मात्राएँ महत्वपूर्ण रूप से भिन्न हैं, तो शून्य परिकल्पना को अस्वीकार कर देता है।
प्रयोगसिद्ध वितरण फलन के आधार पर टेस्ट :
- एंडरसन-डार्लिंग टेस्ट
- लिलिफ़ोर्स टेस्ट्स (कोल्मोगोरोव-स्मिर्नोव टेस्ट्स का एक रूपांतर)
सामान्य वितरण का बायेसियन विश्लेषण
सामान्य रूप से वितरित डेटा का बायेसियन विश्लेषण कई भिन्न -भिन्न संभावनाओं के रूप में सम्मिश्र है जिन पर विचार किया जा सकता है,
- या तो माध्य या प्रसरण या दोनों में से किसी को भी निश्चित क्वांटाइल नहीं माना जा सकता है।
- जब भिन्नता अज्ञात होती है, तो विश्लेषण सीधे भिन्नता के संदर्भ में या परिशुद्धता (सांख्यिकी) भिन्नता के पारस्परिक के संदर्भ में किया जा सकता है। सूत्रों को सटीकता के रूप में व्यक्त करने का कारण यह है कि अधिकांश स्थितियो का विश्लेषण सरल रूप में होता है।
- दोनों अविभाज्य और बहुभिन्न रूपी सामान्य वितरण स्थितियो पर विचार करने की आवश्यकता है।
- अज्ञात चर पर या तो संयुग्म पूर्व या अनुचित पूर्व वितरण के रूप में होते है ।
- बायेसियन रैखिक प्रतिगमन में स्थितियो का एक अतिरिक्त समुच्चय होता है, जहां मूल मॉडल में डेटा को सामान्य रूप से वितरित माना जाता है और सामान्य प्रायर को प्रतिगमन गुणांक पर रखा जाता है। इस प्रकार परिणामी विश्लेषण स्वतंत्र रूप से वितरित डेटा के मूल स्थितियो के समान है।
गैर-रैखिक-प्रतिगमन स्थितियो के सूत्रों को संयुग्मित पूर्व लेख में संक्षेपित किया गया है।
दो द्विघातों का योग
अदिश रूप
निम्नलिखित सहायक सूत्र पोस्टीरियर वितरण अद्यतन समीकरणों को सरल बनाने के लिए उपयोगी है, जो अन्यथा बहुत कठिन रूप में होते है।
यह समीकरण वर्गों का विस्तार करके, x में पदों को समूहित करते है और वर्ग को पूरा करके x में दो द्विघातों के योग को फिर से लिखता है। कुछ शर्तों से जुड़े सम्मिश्र निरंतर कारकों के बारे में निम्नलिखित पर ध्यान देते है
- कारण y और z के भारित औसत का रूप है।
- इससे पता चलता है कि इस कारक को एक ऐसी स्थिति के परिणामस्वरूप माना जा सकता है, जहां मात्राओं के गुणक व्युत्क्रम a और b सीधे जुड़ते हैं, इसलिए a और b को संयोजित करने के लिए, परिणाम को फिर से प्राप्त करना, मूल इकाइयाँ को जोड़ना और पुनः प्राप्त करना आवश्यक होता है। यह उसी तरह का ऑपरेशन है जो अनुकूल माध्य द्वारा किया जाता है, इसलिए यह आश्चर्यजनक नहीं है a और b का वन हाफ हार्मोनिक माध्य है।
सदिश रूप
दो सदिश चतुष्कोणों के योग के लिए एक समान सूत्र लिखा जा सकता है, यदि x, y, z लंबाई k के सदिश हैं और A और B सममित आव्यूह के रूप में हैं और आकार के व्युत्क्रमणीय आव्यूह , तब इस प्रकार हैं,
जहाँ
ध्यान दें कि रूप x′ A x को द्विघात रूप कहा जाता है और यह एक अदिश (गणित) है
दूसरे शब्दों में, यह x से तत्वों के जोड़े के गुणन के सभी संभावित संयोजनों को जोड़ता है, प्रत्येक के लिए एक भिन्न गुणांक का सारांश देता इसके अतिरिक्त है, चूंकि , केवल योग a के किसी भी ऑफ-डायगोनल तत्वों के लिए मायने रखता है और यह मानने में व्यापकता का कोई नुकसान नहीं है कि a सममित आव्यूह है। इसके अतिरिक्त यदि a सममित है, तो फॉर्म के रूप में होते है
माध्य से भिन्नताओं का योग
एक अन्य उपयोगी सूत्र इस प्रकार है:
ज्ञात वेरिएंस के साथ
i.i.d के एक समुच्चय के लिए सामान्य रूप से वितरित डेटा बिंदु X का आकार n है, जहां प्रत्येक व्यक्तिगत बिंदु x का अनुसरण करता है इस प्रकार ज्ञात वेरिएंस σ2 के साथ संयुग्म पूर्व वितरण भी सामान्य रूप से वितरित किया जाता है।
प्रसरण को परिशुद्धता सांख्यिकी के रूप में फिर से लिखकर, अर्थात τ = 1/σ2 का उपयोग करके इसे अधिक आसानी से दिखाया जा सकता है। तो यदि और हम निम्नानुसार आगे बढ़ते हैं।
सबसे पहले, प्रायिकता फलन माध्य से अंतर के योग के लिए उपरोक्त सूत्र का उपयोग करता है
फिर, हम निम्नानुसार आगे बढ़ते हैं:
उपरोक्त अवकलज में, हमने दो द्विघातों के योग के लिए उपरोक्त सूत्र का उपयोग किया और μ को सम्मलित न करने वाले सभी स्टेबल कारकों को हटा दिया है। परिणाम औसत के साथ सामान्य वितरण का कर्नेल सांख्यिकी और सटीकता है, अर्थात।
इसे पूर्व पैरामीटर के संदर्भ में पोस्टीरियर पैरामीटर के लिए बायेसियन अद्यतन समीकरणों के एक समुच्चय के रूप में लिखा जा सकता है
अर्थात nτ की कुल सटीकता के साथ n डेटा बिंदुओं को संयोजित करने के लिए या समकक्ष, n/σ2 का कुल प्रसरण और मानों का माध्य , डेटा की कुल सटीकता को पूर्व कुल परिशुद्धता में जोड़कर एक नई कुल सटीकता प्राप्त करता है और एक सटीक-भारित औसत के माध्यम से एक नया माध्य बनाता है, अर्थात डेटा का भारित औसत और पूर्व माध्य का भारित औसत प्रत्येक को संबंधित कुल परिशुद्धता द्वारा भारित किया जाता है। यह तर्कसंगत समझ में आता है यदि सटीकता को टिप्पणियों की निश्चितता के संकेत के रूप में माना जाता है पोस्टीरियर माध्य के वितरण में प्रत्येक इनपुट घटक को इसकी निश्चितता से भारित किया जाता है और इस वितरण की निश्चितता व्यक्तिगत निश्चितताओं का योग है, इसके अंतर्ज्ञान के लिए उस अभिव्यक्ति की तुलना करते है जो संपूर्ण है या उसके भागों के योग से अधिक है। इसके अतिरिक्त , विचार करते है कि पोस्टीरियर का ज्ञान पूर्व और प्रायिकता के ज्ञान के संयोजन से आता है, इसलिए यह समझ में आता है कि हम इसके किसी भी घटक की तुलना में इसके बारे में अधिक निश्चित हैं।
उपरोक्त सूत्र से पता चलता है कि सटीकता के संदर्भ में सामान्य वितरण के लिए संयुग्मित प्रायर का बायेसियन विश्लेषण करना अधिक सुविधाजनक होता है। पोस्टीरियर परिशुद्धता केवल पूर्व और प्रायिकता की सटीकता का योग है और पोस्टीरियर माध्य की गणना एक सटीक-भारित औसत के माध्यम से की जाती है, जैसा कि ऊपर वर्णित है। समान सूत्रों को वेरिएंस के रूप में लिखा जा सकता है और इस प्रकार सभी पूर्वसूचकों का आदान-प्रदान करके अधिक अजली सूत्रों को जनरेटिंग किया जा सकता है
ज्ञात माध्य के साथ
i.i.d के एक समुच्चय के लिए सामान्य रूप से वितरित डेटा बिंदु X का आकार n है जहां प्रत्येक व्यक्तिगत बिंदु x अनुसरण करता है ज्ञात माध्य μ के साथ, वेरिएंस से पहले के संयुग्म में एक व्युत्क्रम गामा वितरण या एक स्केल्ड व्युत्क्रम ची-वर्ग वितरण होता है। इस प्रकार भिन्न -भिन्न पैरामीटर होने के अतिरिक्त दोनों समान हैं। यद्यपि व्युत्क्रम गामा का अधिक सामान्य रूप से उपयोग किया जाता है, हम सुविधा के लिए स्केल्ड व्युत्क्रम ची-वर्ग का उपयोग करते हैं। σ2 के लिए प्रायर इस प्रकार है,
उपरोक्त प्रायिकता फलन वेरिएंस के संदर्भ में लिखा गया है:
जहाँ
तब:
उपरोक्त एक स्केल्ड इनवर्स ची-स्क्वेर्ड वितरण है जहाँ
या समकक्ष
व्युत्क्रम गामा वितरण के संदर्भ में पुनर्मान के रूप में अंकन परिणाम है:
अज्ञात माध्य और अज्ञात वेरिएंस के साथ
i.i.d के एक समुच्चय के लिए सामान्य रूप से वितरित डेटा बिंदु X का आकार n है जहां प्रत्येक व्यक्तिगत बिंदु x अनुसरण करता है इस प्रकार अज्ञात माध्य μ और अज्ञात वेरिएंस σ2 के साथ एक संयुक्त बहुभिन्नरूपी संयुग्म पूर्व को माध्य और वेरिएंस पर रखा जाता है, जिसमें सामान्य- व्युत्क्रम -गामा वितरण के रूप में सम्मलित है। तर्कसंगत रूप से, यह निम्नानुसार उत्पन्न होता है,
- अज्ञात माध्य लेकिन ज्ञात वेरिएंस वाले स्थितियो के विश्लेषण से, हम देखते हैं कि अद्यतन समीकरणों में डेटा से गणना किए गए पर्याप्त आँकड़े के रूप में सम्मलित होते हैं, जिसमें डेटा बिंदुओं का माध्य और डेटा बिंदुओं की संख्या से विभाजित ज्ञात विचरण से बदले में गणना किए गए डेटा बिंदुओं का कुल विचरण सम्मलित होता है।
- अज्ञात वेरिएंस लेकिन ज्ञात माध्य वाले स्थितियो के विश्लेषण से, हम देखते हैं कि अद्यतन समीकरणों में डेटा बिंदुओं की संख्या और अज्ञात विचलन के योग वाले डेटा पर पर्याप्त आँकड़े सम्मलित हैं।
- ध्यान रखें कि जब आगे के डेटा को हैंडल किया जाता है तो पोस्टीरियर अद्यतन मान पूर्व वितरण के रूप में फलन करता है। इस प्रकार, हमें तर्कसंगत रूप से अपने पूर्ववर्तियों के बारे में पर्याप्त आंकड़ों के संदर्भ में जितना संभव हो उतना समान शब्दार्थों को ध्यान में रखते हुए सोचना चाहिए।
- उस स्थितियो को संभालने के लिए जहां माध्य और वेरिएंस दोनों अज्ञात हैं, हम माध्य और वेरिएंस पर स्वतंत्र प्राथमिकताओ के रूप में रख सकते हैं, इस प्रकार औसत माध्य के निश्चित अनुमानों के साथ, कुल वेरिएंस पूर्व में वेरिएंस की गणना करने के लिए उपयोग किए जाने वाले डेटा बिंदुओं की संख्या और अज्ञात का योग विचलन करते है। चूंकि ध्यान दें कि वास्तव में, माध्य का कुल वेरिएंस अज्ञात वेरिएंस पर निर्भर करता है और अज्ञात विचलन का योग जो वेरिएंस के रूप में अज्ञात माध्य पर निर्भर करता है। इस प्रकार व्यवहार में, बाद की निर्भरता अपेक्षाकृत महत्वहीन रूप में होती है, वास्तविक माध्य को स्थानांतरित करने से उत्पन्न अंक एक समान राशि से बदल जाते हैं और औसतन अज्ञात विचलन समान रहता है। चूंकि, माध्य के कुल वेरिएंस के साथ ऐसा नहीं होता है, जैसे ही अज्ञात वेरिएंस बढ़ता है, माध्य का कुल वेरिएंस आनुपातिक रूप से बढ़ जाता है और हम इस निर्भरता को पकड़ना चाहते हैं।
- इससे पता चलता है कि हम अज्ञात वेरिएंस पर माध्य से पहले एक सशर्त बनाते हैं, जिसमें एक हाइपरपैरामीटर पूर्व से जुड़े प्सयूडो -अवलोकन के माध्य को निर्दिष्ट करता है और एक अन्य पैरामीटर प्सयूडो टिप्पणियों की संख्या को निर्दिष्ट करता है। यह संख्या भिन्नता पर स्केलिंग पैरामीटर के रूप में फलन करती है, जिससे वास्तविक भिन्नता पैरामीटर के सापेक्ष माध्य के समग्र भिन्नता को नियंत्रित करना संभव हो जाता है। वेरिएंस के पूर्व में भी दो हाइपरपरमेटर्स होते हैं, एक पूर्व से जुड़े प्सयूडो -अवलोकनों के वर्ग विचलन के योग को निर्दिष्ट करता है और दूसरा एक बार फिर से प्सयूडो -टिप्पणियों की संख्या को निर्दिष्ट करता है। ध्यान दें कि प्रत्येक पूर्व में प्सयूडो -अवलोकन की संख्या निर्दिष्ट करने वाला एक हाइपरपैरामीटर होता है और प्रत्येक स्थितियो में यह उस पूर्व के सापेक्ष भिन्नता को नियंत्रित करता है। इन्हें दो भिन्न -भिन्न हाइपरपैरामीटर के रूप में दिखाया जाता है जिससे की दो प्रायर के प्रसरण को भिन्न -भिन्न विधियों को नियंत्रित किया जा सके।
- यह तुरंत सामान्य- व्युत्क्रम -गामा वितरण की ओर ले जाता है, जो अभी-अभी परिभाषित दो वितरण का गुणन है, जिसमें संयुग्मित प्रायर का उपयोग किया जाता है, वेरिएंस पर एक व्युत्क्रम गामा वितरण और माध्य पर एक सामान्य वितरण वेरिएंस पर सशर्त के रूप में होता है और उन्हीं चार पैरामीटर के साथ अभी-अभी परिभाषित किया जाता है।
प्राथमिकताओं को सामान्य रूप से निम्नानुसार परिभाषित किया जाता है
अद्यतन समीकरण इस प्रकार प्राप्त किए जा सकते हैं और निम्नानुसार दिखाया जाता है
प्सयूडो टेस्ट्स की संबंधित संख्या वास्तविक टेस्ट्स की संख्या को उनके साथ जोड़ती है। नया माध्य हाइपरपैरामीटर एक बार फिर भारित औसत के रूप में होता है, इस बार अवलोकनों की सापेक्ष संख्या द्वारा भारित किया गया है। इस प्रकार अंत में के लिए अद्यतन ज्ञात माध्य की स्थितियो के समान है, लेकिन इस स्थितियो में वर्ग विचलन का योग सही माध्य के अतिरिक्त देखे गए डेटा माध्य के संबंध में लिया जाता है और परिणामस्वरूप एक नई अंतःक्रिया शब्द की आवश्यकता होती है इस प्रकार पूर्व और डेटा माध्य के बीच विचलन से उत्पन्न अतिरिक्त त्रुटि स्रोत का ध्यान रखने के लिए जोड़ा जाता है।
The prior distributions are
Therefore, the joint prior is
The likelihood function from the section above with known variance is:
Writing it in terms of variance rather than precision, we get:
where
Therefore, the posterior is (dropping the hyperparameters as conditioning factors):
In other words, the posterior distribution has the form of a product of a normal distribution over times an inverse gamma distribution over , with parameters that are the same as the update equations above.
घटना और अनुप्रयोग
व्यावहारिक समस्याओं में सामान्य वितरण की घटना को सामान्यतः रूप से चार श्रेणियों में वर्गीकृत किया जा सकता है
- बिल्कुल सामान्य वितरण ;
- लगभग सामान्य नियम, उदाहरण के लिए जब इस तरह के सन्निकटन को केंद्रीय सीमा प्रमेय द्वारा उचित ठहराया जाता है
- वितरण सामान्य के रूप में तैयार किया गया सामान्य वितरण किसी दिए गए माध्य और वेरिएंस के लिए अधिकतम एन्ट्रापी के सिद्धांत के साथ वितरण है।
- प्रतिगमन समस्याएं - व्यवस्थित अभिव्यक्ति के बाद पाए जाने वाले सामान्य वितरण को पर्याप्त रूप से अच्छी तरह से प्रतिरूपित किया जाता है।
यथार्थ नोर्मेलिटी
भौतिकी में कुछ मात्राएँ सामान्य रूप से वितरित की जाती हैं, जैसा कि पहले जेम्स क्लर्क मैक्सवेल द्वारा प्रदर्शित किया गया था। ऐसी मात्राओं के उदाहरण इस प्रकार हैं,
- एक क्वांटम हार्मोनिक ऑसिलेटर में मूल अवस्था का प्रायिकता घनत्व फलन प्रदर्शित किया गया है।
- एक कण की स्थिति जो विसरण का अनुभव करती है। यदि प्रारंभ में कण एक विशिष्ट बिंदु पर स्थित है अर्थात इसका प्रायिकता वितरण डिराक डेल्टा फलन है, तो समय t के बाद इसका स्थान वेरिएंस t के साथ एक सामान्य वितरण द्वारा वर्णित किया गया है, जो प्रसार समीकरण को .इस प्रकार संतुष्ट करता है, यदि प्रारंभिक स्थान एक निश्चित घनत्व फलन द्वारा दिया गया है, फिर समय t पर घनत्व g(x) और सामान्य Pdf का कनवल्शन है।
अनुमानित नोर्मेलिटी
लगभग सामान्य वितरण कई स्थितियों में होते हैं, जैसा कि केंद्रीय सीमा प्रमेय द्वारा समझाया गया है। जब परिणाम कई छोटे अभिव्यक्ति से जोड़कर और स्वतंत्र रूप से फलन करता है, तो इसका वितरण सामान्य के निकटतम होता है । सामान्य सन्निकटन मान्य नहीं होता है यदि अभिव्यक्ति गुणात्मक रूप से फलन करते हैं योगात्मक के अतिरिक्त यदि कोई बाहरी अभिव्यक्ति है, जो बाकी अभिव्यक्ति की तुलना में बहुत बड़ा परिमाण प्रदान करते है।
- गिनती की समस्याओं में, जहां केंद्रीय सीमा प्रमेय में असतत-से-निरंतर सन्निकटन के रूप में सम्मलित है और जहां अनंत विभाज्यता और अविघटनीय वितरण सम्मलित हैं, जैसे
- द्विपद यादृच्छिक चर, द्विआधारी प्रतिक्रिया चर के साथ जुड़े होते है
- पॉसन वितरण , दुर्लभ घटनाओं से जुड़े होते है
- ऊष्मीय विकिरण में बोस-आइंस्टीन आँकड़े हैं, बोस-आइंस्टीन वितरण बहुत कम समय के पैमाने पर और केंद्रीय सीमा प्रमेय के कारण लंबे समय के पैमाने पर एक सामान्य वितरण के रूप में होते है।
अनुमानित नोर्मेलिटी
इसे केवल सामान्य वक्र की घटनाओं को ही बड़ी असामान्य घटना के रूप में पहचान सकता हूं। इस कारण कुछ वितरणों में इसे अंदाजन लगभग अनुमानित किया गया है और इसकी सुंदर सादगी के कारण शायद हम इसे किसी सैद्धांतिक जांच के पहले सन्निकटन के रूप में प्रयुक्त कर सकते हैं।
प्रयोगसिद्ध रूप से उस धारणा का टेस्ट्स करने के लिए सांख्यिकीय विधि हैं; उपरोक्त सामान्यता टेस्ट्स अनुभाग देखें।
- जीव विज्ञान में, विभिन्न चरों के लघुगणक में एक सामान्य वितरण होता है, अर्थात उदाहरण सहित पुरुष/महिला उप-जनसंख्या पर पृथक्करण के बाद उनका एक लॉग सामान्य वितरण होता है:
- जीवित ऊतक के आकार की माप लंबाई, ऊंचाई, त्वचा क्षेत्र, वजन इस श्रेणी में आती है;[46]
- जैविक नमूनों के अक्रिय उपांगों के बाल, पंजे, नाखून, दांतों की लंबाई, वृद्धि की दिशा में संभवतः पेड़ की छाल की मोटाई भी इसी श्रेणी में आती है
- कुछ शारीरिक माप, जैसे वयस्क मनुष्यों का रक्तचाप इस श्रेणी में आती है।
- वित्त में, विशेष रूप से ब्लैक-स्कोल्स मॉडल, विनिमय दरों, मान सूचकांकों और शेयर बाजार सूचकांकों के लघुगणक में परिवर्तन को सामान्य माना जाता है, ये चर चक्रवृद्धि ब्याज की तरह व्यवहार करते हैं, साधारण ब्याज की तरह नहीं और इसलिए गुणक के रूप में होते है। बेनोइट मंडेलब्रॉट जैसे कुछ गणितज्ञों ने तर्क दिया है कि लॉग-लेवी वितरण जिसमें भारी टेल्ड होती है और इस प्रकार विशेष रूप से स्टॉक मार्केट क्रैश के विश्लेषण के लिए अधिक उपयुक्त मॉडल होता है। नसीम निकोलस तालेब ने अपने फलन में वित्तीय मॉडल में होने वाले सामान्य वितरण की धारणा के उपयोग की भी आलोचना की है।
- भौतिक प्रयोगों में अनिश्चितता का प्रसार अधिकांशतः सामान्य वितरण द्वारा प्रतिरूपित किया जाता है। सामान्य वितरण के इस प्रयोग का अर्थ यह नहीं है कि कोई यह मान रहा है कि माप त्रुटियां सामान्य रूप से वितरित की जाती हैं, बल्कि सामान्य वितरण का उपयोग करने से त्रुटियों के माध्य और वेरिएंस के बारे में केवल ज्ञान दिया जा सकता है।[47]
- मानकीकृत टेस्ट्स (सांख्यिकी) में, परिणामों को या तो प्रश्नों की संख्या और कठिनाई इंटेलिजेंस भागफल के रूप में चयन करके या सामान्य वितरण में फिट करके कच्चे टेस्ट्स स्कोर को आउटपुट स्कोर में बदलकर सामान्य वितरण किया जा सकता है। उदाहरण के लिए, SAT की 200-800 की पारंपरिक सीमा 500 के माध्य और 100 के मानक विचलन के साथ एक सामान्य वितरण पर आधारित है।
- कई अंक सामान्य वितरण से प्राप्त होते हैं, जिनमें प्रतिशतक रैंक (प्रतिशत या मात्रा), सामान्य वक्र समकक्ष, स्टैनिन, मानक स्कोर, जेड-स्कोर और t-स्कोर के रूप में सम्मलित हैं। इसके अतिरिक्त, कुछ व्यवहारिक सांख्यिकीय प्रक्रियाएं मानती हैं कि स्कोर सामान्य रूप से वितरित किए जाते हैं; उदाहरण के लिए, विद्यार्थी का t-टेस्ट्स और प्रसरण का विश्लेषण बेल वक्र ग्रेडिंग स्कोर के सामान्य वितरण के आधार पर संबंधित ग्रेड प्रदान करती है।
- जल विज्ञान में लंबी अवधि के नदी प्रवाह या वर्षा का वितरण मासिक और वार्षिक योग, केंद्रीय सीमा प्रमेय के अनुसार अधिकांशतः व्यावहारिक रूप से सामान्य माना जाता है।[48] कमफ़्रीक के साथ बनाई गई नीली तस्वीर, द्विपद वितरण के आधार पर 90% आत्मविश्वास बेल्ट दिखाते हुए अक्टूबर की बारिश के लिए सामान्य वितरण को फिट करने का एक उदाहरण दिखाती है। संचयी बारंबारता विश्लेषण के भाग के रूप में वर्षा के आंकड़ों को प्लॉटिंग स्थितियों द्वारा दर्शाया जाता है।
पद्धति संबंधी समस्याएं और पीयर रिव्यू
जॉन आयोनिडिस का तर्क है कि सामान्य रूप से वितरित मानक विचलन का उपयोग अनुसंधान निष्कर्षों को मान्य करने के लिए मानकों के रूप में उन घटनाओं के बारे में मिथ्यात्व छोड़ देता है, जो सामान्य रूप से वितरित नहीं होते हैं। इसमें सम्मलित हैं उदाहरण के लिए, ऐसी घटनाएँ जो केवल तब प्रकट होती हैं जब सभी आवश्यक शर्तें उपस्थित होती हैं और एक दूसरे के लिए एक अतिरिक्त विधि से और ऐसी घटनाओं का विकल्प नहीं हो सकता है जो यादृच्छिक रूप से वितरित नहीं होती हैं। जॉन आयोनिडिस का तर्क है कि मानक विचलन-केंद्रित सत्यापन परिकल्पनाओं और सिद्धांतों को वैधता का एक झूठा रूप देता है जहां कुछ लेकिन सभी गलत भविष्यवाणियां सामान्य रूप से वितरित नहीं की जाती हैं क्योंकि गलत अनुमानों के भाग के बाद से सबूत हो सकता है और कुछ स्थितियो में गैर-सामान्य रूप से हो सकता है मिथ्याकरण भविष्यवाणियों की श्रेणी के वितरित भाग के निराधार रूप से उन परिकल्पनाओं को अस्वीकार कर देती है, जिनके लिए कोई भी मिथ्यापूर्ण भविष्यवाणियां सामान्य रूप से वितरित नहीं की जाती हैं जैसे कि वे असत्य थीं जब वास्तव में वे मिथ्यावाचक भविष्यवाणियां करती हैं। आयोनिडिस द्वारा यह तर्क दिया जाता है कि अनुसंधान पत्रिकाओं द्वारा मान्यता प्राप्त पारस्परिक रूप से अनन्य सिद्धांतों के कई स्थितियो गैर-सामान्य रूप से वितरित भविष्यवाणियों के प्रयोगसिद्ध मिथ्याकरण में पत्रिकाओं की विफलता के कारण होते हैं और इसलिए नहीं कि पारस्परिक रूप से अनन्य सिद्धांत सत्य हैं, जो वे नहीं कर सकते है, चूंकि दो परस्पर अनन्य सिद्धांत दोनों गलत हो सकते हैं और तीसरा सही हो सकता है।[49]
अभिकलनी विधियाँ
सामान्य वितरण से मान निकालना
कंप्यूटर सिमुलेशन में, विशेष रूप से मोंटे-कार्लो पद्धति के अनुप्रयोगों में, सामान्य रूप से वितरित मानों को उत्पन्न करना अधिकांशतः वांछनीय होता है। इस प्रकार नीचे सूचीबद्ध सभी कलनविधि मानक सामान्य विचलन उत्पन्न करते हैं, क्योंकि a N(μ, σ2) को X = μ + σZ के रूप में उत्पन्न किया जा सकता है, जहां Z मानक सामान्य रूप में है। ये सभी कलनविधि एक यादृच्छिक संख्या जनरेटर U की उपलब्धता पर निर्भर करते हैं जो समान यादृच्छिक चर उत्पन्न करने में सक्षम है।
- सबसे सीधी विधि प्रायिकता अभिन्न परिवर्तन प्रॉपर्टी पर आधारित होती है, यदि U को (0,1) पर समान रूप से वितरित किया जाता है, तो Φ−1(U) का मानक सामान्य वितरण होता है । इस पद्धति का दोष यह है कि यह प्रोबिट फलन Φ1 की गणना पर निर्भर करता है, जो विश्लेषणात्मक रूप से नहीं किया जा सकता। कुछ अनुमानित विधियों का वर्णन हार्ट 1968 और ईआरएफ लेख में किया गया है। विचुरा इस फलन को 16 दशमलव स्थानों पर गणना करने के लिए एक तेज़ कलनविधि देता है,[50] जिसका उपयोग R प्रोग्रामिंग भाषा द्वारा सामान्य वितरण के यादृच्छिक चर की गणना करने के लिए किया जाता है।
- एक आसान से प्रोग्राम अनुमानित दृष्टिकोण जो केंद्रीय सीमा प्रमेय पर निर्भर करता है, वह इस प्रकार है, 12 समान U(0,1) विचलन उत्पन्न करते है, उन सभी को जोड़ने और 6 घटाने से परिणामी यादृच्छिक चर का मानक सामान्य वितरण होता है । इस प्रकार वास्तव में, वितरण इरविन-हॉल वितरण होता है | इरविन-हॉल, जो सामान्य वितरण के लिए 12-खंड ग्यारहवें-क्रम बहुपद सन्निकटन के रूप में होते है। इस यादृच्छिक विचलन की सीमित सीमा (-6, 6) के रूप में होती है।[51] ध्यान दें कि एक सामान्य सामान्य वितरण में, सभी नमूनों का केवल 0.00034% ±6σ से बाहर होते है।
- बॉक्स-मुलर विधि दो स्वतंत्र यादृच्छिक संख्या U और V (0,1) पर वितरित समान वितरण का उपयोग करती है। फिर दो यादृच्छिक चर X और Y के रूप में होते हैदोनों का मानक सामान्य वितरण होता है और स्वतंत्र रूप में होती है। यह सूत्रीकरण इसलिए उत्पन्न होता है क्योंकि द्विभाजित सामान्य यादृच्छिक सदिश (X, Y) के लिए अज्ञात मानदंड X2 + Y2 स्वतंत्र की दो डिग्री के साथ ची-वर्ग वितरण होता है , जो इन समीकरणों में -2ln(U) क्वांटाइल के अनुरूप आसानी से उत्पन्न घातांक वितरण है और कोण को वृत्त के चारों ओर समान रूप से वितरित किया जाता है, जिसे यादृच्छिक चर V द्वारा चुना जाता है।
- मार्सग्लिया ध्रुवीय विधि बॉक्स-मुलर विधि का एक संशोधन है, जिसमें साइन और कोसाइन फलन की गणना की आवश्यकता नहीं होती है। इस विधि में, U और V एकसमान (−1,1) वितरण से निकाले जाते हैं, और फिर S = U2 + V2 की गणना की जाती है। यदि S 1 से अधिक या बराबर है, तो विधि फिर से शुरू होती है, अन्यथा दो मात्राएँ इस प्रकार होती हैफिर से वापस कर दिए जाते हैं, X और Y स्वतंत्र, मानक सामान्य यादृच्छिक चर के रूप में है।
- अनुपात विधि[52] एक अस्वीकृति पद्धति है। कलनविधि निम्नानुसार आगे बढ़ता है
- दो स्वतंत्र एकरूप U और V उत्पन्न करते हैं
- अभिकलन X= √8/e (वी - 0.5)/U;
- वैकल्पिक: यदि X2 ≤ 5 − 4e1/4U फिर एक्स को स्वीकार करते हैं और कलन विधि को समाप्त करते हैं;
- वैकल्पिक: यदि X2 ≥ 4e-1.35/U + 1.4 फिर X को अस्वीकार करते हैं और चरण 1 से शुरू करते हैं;
- यदि X2 ≤ −4 lnU फिर X को स्वीकार करते हैं, अन्यथा कलन विधि पर प्रारंभ करते हैं।
- दो वैकल्पिक चरण अंतिम चरण में लघुगणक के मान अंकन की अनुमति देते हैं, जिससे अधिकांश स्थितियो में बचा जा सकता है। इन कदमों में बहुत सुधार किया जा सकता है[53] जिससे की लघुगणक का मान अंकन कभी-कभार ही किया जा सके।
- ज़िगगुरैट कलन विधि [54] बॉक्स-मुलर रूपांतरण से तेज़ है और अभी भी अच्छे और सटीक है। लगभग 97% स्थितियो में यह केवल दो यादृच्छिक संख्याओं, एक यादृच्छिक पूर्णांक और एक यादृच्छिक समरूप , एक गुणन और एक परीक्षण का उपयोग करता है। और इस प्रकार केवल 3% स्थितियो में जहां उन दोनों का संयोजन जिगगुराट के कोर के बाहर पड़ता है वहाँ लघुगणक का उपयोग करके एक प्रकार का अस्वीकृति नमूनाकरण घातांक का प्रयोग किया जाता है और इस प्रकार समान यादृच्छिक संख्याओं को नियोजित करना पड़ता है।
- पूर्णांक अंकगणित का उपयोग मानक सामान्य वितरण से नमूने के लिए किया जा सकता है।[55] यह विधि इस अर्थ में अच्छे है कि यह आदर्श सन्निकटन की शर्तों को संतुष्ट करती है;[56] अर्थात यह मानक सामान्य वितरण से एक वास्तविक संख्या का नमूना लेने और इसे निकटतम प्रतिनिधित्व योग्य फ़्लोटिंग पॉइंट नंबर पर गोल करने के बराबर होती है।
- कुछ जांच भी है[57] जो तेजी से हैडमार्ड परिवर्तन और सामान्य वितरण के बीच संबंध में परिवर्तन केवल जोड़ने और घटाने को नियोजित करता है और केंद्रीय सीमा प्रमेय द्वारा लगभग किसी भी वितरण से यादृच्छिक संख्या सामान्य वितरण में बदल दी जाती है। इस संबंध में सामान्य रूप से वितरित डेटा में स्वैच्छिक डेटा समुच्चय को चालू करने के लिए हैडमार्ड रूपांतरणों की एक श्रृंखला को यादृच्छिक क्रमपरिवर्तन के साथ जोड़ा जा सकता है।
सामान्य सीडीएफ और सामान्य क्वांटाइल फलन के लिए संख्यात्मक अनुमान
मानक सामान्य सीडीएफ का व्यापक रूप से वैज्ञानिक और सांख्यिकीय अभिकलन में उपयोग किया जाता है।
मान Φ(x) को विभिन्न विधियों से बहुत अच्छी तरह से अनुमानित किया जा सकता है, जैसे कि संख्यात्मक एकीकरण, टेलर श्रृंखला, टेलर श्रृंखला, स्पर्शोन्मुख श्रृंखला और निरंतर भिन्न कॉन्फ़्लूएंट हाइपरजियोमेट्रिक फलन का उपयोग किया जाता है। इस प्रकार सटीकता के वांछित स्तर के आधार पर विभिन्न अनुमानों का उपयोग किया जाता है।
- Zelen & Severo (1964) पूर्ण त्रुटि के साथ x > 0 के लिए Φ(x) का सन्निकटन |ε(x)| < 7.5·10−8 मान होता है, कलनविधि 26.2.17): जहां ϕ(x) मानक सामान्य PDF इस प्रकार है, b0 = 0.2316419, b1 = 0.319381530, b2 = −0.356563782, b3 = 1.781477937, b4 = −1.821255978, b5 = 1.330274429.
- Hart (1968) ने erfc() फलन के लिए घातांक के साथ या उसके बिना तर्कसंगत फलन के माध्यम से कुछ दर्जनों अनुमानों को सूचीबद्ध किया है। उनके कलनविधि 24 अंकों की अधिकतम पूर्ण सटीकता के साथ सम्मिश्रता की डिग्री और परिणामी सटीकता में भिन्न होते हैं। इस प्रकार एक कलनविधि West (2009) 16 अंकों की सटीकता के साथ एक तेज संगणना कलनविधि प्रदान करने के लिए टेल में एक निरंतर भिन्न सन्निकटन के साथ हार्ट के कलनविधि 5666 को जोड़ता है।
- Hart68 समाधान erf के लिए उपयुक्त नहीं होता है, यह याद करने के बाद Cody (1969) erf और erfc दोनों के लिए तर्कसंगत चेबीशेव अनुमान के माध्यम से अधिकतम सापेक्ष त्रुटि के साथ एक समाधान देता है।
- Marsaglia (2004) टेलर श्रृंखला विस्तार के आधार पर एक सरल कलनविधि का सुझाव दिया है,[note 1] स्वेच्छ परिशुद्धता के साथ Φ(x) की गणना के लिए इस कलनविधि की कमी अपेक्षाकृत तुलनात्मक रूप से धीमी गणना समय है, उदाहरण के लिए जब x = 10 होता है तो 16 अंकों की सटीकता के साथ फलन की गणना करने में 300 से अधिक पुनरावृत्तियों की आवश्यकता होती है।
- जीएनयू वैज्ञानिक पुस्तकालय हार्ट के कलनविधि और चेबिशेव बहुपद के साथ सन्निकटन का उपयोग करके मानक सामान्य सीडीएफ के मानों की गणना करती है।
नॉइज़ (1982) ने सरल सन्निकटन मान प्रदान करते है, जिन्हें इंजीनियरिंग और संचालन अनुसंधान के स्टोकेस्टिक अनुकूलन मॉडल के रूप में सम्मलित किया जाता है, जैसे विश्वसनीयता इंजीनियरिंग और इन्वेंट्री विश्लेषण इत्यादि। इस प्रकार p = Φ(z) क्वांटाइल फलन के लिए सबसे सरल सन्निकटन के रूप में होते है
कुछ और सन्निकटन यहां देखे जा सकते है, जो त्रुष्टि फलन प्राथमिक फलन के साथ सन्निकटन रूप में होते है। विशेष रूप से, सीडीएफ के लिए पूरे डोमेन पर छोटी सापेक्ष त्रुटि और क्वांटाइल फलन के साथ ही 2008 में सर्गेई विनित्ज़की द्वारा स्पष्ट रूप से व्युत्क्रम सूत्र के माध्यम से प्राप्त किया गया है।
इतिहास
विकास
कुछ लेखक[58][59] सामान्य वितरण की खोज का श्रेय अब्राहम डी मोइवरे को देते हैं, जिन्होंने 1738 में[note 2] द डॉक्ट्रिन ऑफ चांस के दूसरे संस्करण में द्विपद विस्तार (a + b)n में गुणांक के अध्ययन में प्रकाशित किया है। डी मोइवर ने साबित किया कि इस विस्तार में मध्य पद का अनुमानित परिमाण के रूप में होता है और वह यदि m या 1/2n एक क्वांटाइल असीम रूप से बहुत बढ़िया होता है, तो इस प्रकार अनुपात का लघुगणक जो अंतराल ℓ द्वारा मध्य से दूर एक शब्द, मध्य अवधि के लिए .[60] है, यद्यपि इस प्रमेय की व्याख्या सामान्य प्रायिकता नियम के लिए पहली अस्पष्ट अभिव्यक्ति के रूप में व्याख्या किया जा सकता है, स्टीफन स्टिगलर बताते हैं कि डी मोइवर ने स्वयं अपने परिणामों की व्याख्या द्विपद गुणांकों के लिए अनुमानित नियम से अधिक कुछ भी नहीं की है और विशेष रूप से डी मोइवर में प्रायिकता घनत्व फलन की इस अवधारणा का अभिव्यक्ति था।[61]
1823 में कार्ल फ्रेडरिक गॉस ने अपना मोनोग्राफ प्रकाशित किया थ्योरीया कॉम्बिनेशनिस ऑब्जर्वेशनम त्रुष्टि िबस मिनिमिस ऑबनोक्सिया जहां उन्होंने कई महत्वपूर्ण सांख्यिकीय अवधारणाओं को प्रस्तुत किया था, जैसे कि न्यूनतम वर्ग विधि अधिकतम संभावना की विधि, और सामान्य वितरण इत्यादि के रूप में है। गॉस ने कुछ अज्ञात मात्रा V के माप को दर्शाने के लिए M′, M′′, ...का उपयोग किया और "उस क्वांटाइल के सबसे संभावित एस्टीमेटर की मांग की, जो प्रेक्षित प्रयोगात्मक परिणामों को प्राप्त करने की प्रायिकता φ(M − V) · φ(M′ − V) · φ(M′′ − V) · ... को अधिकतम करता है। इस प्रकार उनके अंकन में φΔ परिमाण की माप त्रुटियों की प्रायिकता घनत्व फलन है। इस प्रकार हम यह नहीं जानते कि फलन φ क्या है, गॉस की आवश्यकता होती है कि उसकी विधि को सुप्रसिद्ध उत्तर मापे गए मानों के अंकगणितीय माध्य को कम करना होता है। इन सिद्धांतों से शुरू करते हुए गॉस दर्शाता है कि स्थान पैरामीटर के अनुमानक के रूप में अंकगणित माध्य की पसंद को तर्कसंगत बनाने वाला एकमात्र नियम त्रुटियों का सामान्य नियम है।[62]
जहाँ h टेस्ट्स की शुद्धता का माप है। प्रयोगों में त्रुटियों के लिए एक सामान्य मॉडल के रूप में इस सामान्य नियम का उपयोग करते हुए गॉस ने वह विधि तैयार की जिसे अब गैर-रैखिक भारित न्यूनतम वर्ग विधि के रूप में जाना जाता है।[63]
चूंकि गॉस सामान्य वितरण नियम का सुझाव देने वाले पहले व्यक्ति थे, पियरे साइमन डी लाप्लास ने महत्वपूर्ण योगदान दिया।[note 3] यह लाप्लास था जिसने पहली बार 1774 में कई अवलोकनों को एकत्रित करने की प्रॉब्लम प्रस्तुत की थी,[64] चूंकि उनके अपने समाधान ने लाप्लासियन वितरण को जन्म दिया था। यह लाप्लास था जिसने सबसे पहले गॉसियन समाकलन ∫ e−t2 dt = √π 1782 के मान की गणना की थी और इस प्रकार सामान्य वितरण के लिए सामान्यीकरण स्टेबल अंकन प्रदान करता है।[65] अंत में, यह लाप्लास था जिसने 1810 में मौलिक केंद्रीय सीमा प्रमेय को साबित किया और अकादमी को प्रस्तुत किया था, जिसने सामान्य वितरण के सैद्धांतिक महत्व पर जोर दिया था।[66]
यह ध्यान रखना दिलचस्प है कि 1809 में एक आयरिश-अमेरिकी गणितज्ञ रॉबर्ट एड्रेन ने गॉस से एक साथ और स्वतंत्र रूप से सामान्य प्रायिकता नियम के दो व्यावहारिक लेकिन त्रुटिपूर्ण अवकलज प्रकाशित किए थे।[67] वैज्ञानिक समुदाय द्वारा उनके फलन पर बहुत सीमा तक ध्यान नहीं दिया गया था, जब तक कि 1871 में क्लीवलैंड एब्बे द्वारा उन्हें खोदकर नहीं निकाला गया था।[68]
19वीं शताब्दी के मध्य में जेम्स क्लर्क मैक्सवेल ने प्रदर्शित किया कि सामान्य वितरण न केवल एक सुविधाजनक गणितीय उपकरण है, बल्कि प्राकृतिक घटनाओं में भी हो सकता है[69] इस प्रकार कणों की संख्या जिसका वेग एक निश्चित दिशा में हल किया जाता है, x और x+dx के बीच होता है
नामकरण
आज, अवधारणा को सामान्यतः अंग्रेजी में सामान्य वितरण या गाऊसी वितरण के रूप में जाना जाता है। अन्य कम सामान्य नामों में गॉस वितरण, लाप्लास-गॉस वितरण, त्रुटि का नियम, त्रुटियों की सुविधा का नियम, लाप्लास का दूसरा नियम, गॉसियन नियम के रूप में सम्मलित हैं।
गॉस ने स्पष्ट रूप से इस शब्द को इसके अनुप्रयोगों में सम्मलित सामान्य समीकरणों के संदर्भ में कॉइन किया था, जिसमें सामान्य के अतिरिक्त सामान्य रूप से ऑर्थोगोनल का तकनीकी अर्थ होता है।[70] चूंकि, 19 वीं शताब्दी के अंत तक कुछ लेखक[note 4] सामान्य वितरण नाम का उपयोग करना शुरू कर दिया था, जहां सामान्य शब्द को विशेषण के रूप में उपयोग किया गया था। इस शब्द को अब इस तथ्य के प्रतिबिंब के रूप में देखा जा रहा है कि इस वितरण को विशिष्ट सामान्य प्रकार के रूप में देखा जाता था। चार्ल्स सैंडर्स पियर्स उन लेखकों में से एक जिन्होने एक पीयर्स "सामान्य" को परिभाषित किया था ' इस प्रकार 'सामान्य' वास्तव में जो घटित होता है इसका औसत या किसी अन्य प्रकार का माध्य नहीं है, लेकिन कुछ परिस्थितियों में लंबे समय में क्या घटित होता है इसका अर्थ है।[71] 20वीं शताब्दी के अंत में कार्ल पियर्सन ने इस वितरण के लिए एक पदनाम के रूप में सामान्य शब्द को लोकप्रिय बनाया था।[72]
कई साल पहले मैंने लाप्लास गॉसियन वक्र को सामान्य वक्र कहा था, चूंकि यह नाम प्राथमिकता के एक अंतरराष्ट्रीय प्रश्न से बचता है, लेकिन इसमें लोगों को यह विश्वास दिलाने का नुकसान है कि आवृत्ति के अन्य सभी वितरण किसी न किसी अर्थ में 'असामान्य' हैं।
इसके अतिरिक्त, वे पियर्सन ही थे जिन्होंने सबसे पहले वितरण को आधुनिक संकेतन के रूप में मानक विचलन σ के रूप में लिखा था। इसके तुरंत बाद, वर्ष 1915 में, रोनाल्ड फिशर ने सामान्य वितरण के सूत्र में स्थान पैरामीटर जोड़ दिया था, इसे वर्तमान काल में लिखी गई विधि से व्यक्त करते है।
मानक सामान्य शब्द, जो शून्य माध्य और इकाई विचरण के साथ सामान्य वितरण को दर्शाता है और जो वर्ष 1950 के दशक के आसपास सामान्य उपयोग में आया है, जो पी. जी. होएल (1947) में गणितीय आंकड़ों का परिचय लोकप्रिय पाठ्यपुस्तकों में प्रकाशित हुआ। और इस प्रकार ए. एम. मूड (1950) द्वारा सांख्यिकी के सिद्धांत का परिचय दिया गया था[73]
यह भी देखें
- बेट्स वितरण - इरविन-हॉल वितरण के समान होता है, लेकिन 0 से 1 श्रेणी में वापस आ जाता है
- बेहरेंस-फिशर प्रॉब्लम - टेस्ट्स की लंबे समय से चली आ रही प्रॉब्लम है कि क्या भिन्न -भिन्न प्रसरण वाले दो सामान्य नमूनों का एक ही अर्थ होता है,
- भट्टाचार्य दूरी - सामान्य वितरण के मिश्रण को भिन्न करने के लिए उपयोग की जाने वाली विधि के रूप में होती है
- एर्डोस-केएसी प्रमेय - संख्या सिद्धांत में सामान्य वितरण की घटना पर आधारित होती है
- अधिकतम अर्ध पर पूरी चौड़ाई होती है
- गौस्सियन ब्लर - कनवल्शन, जो कर्नेल के रूप में सामान्य वितरण का उपयोग करता है
- संशोधित हाफ सामान्य वितरण [74] p डीएफ के साथ के रूप में दिया जाता है , जहाँ फॉक्स-राइट पीसाई फलन को दर्शाता है।
- सामान्य रूप से वितरित और असंबद्ध का अर्थ स्वतंत्र नहीं है
- अनुपात सामान्य वितरण के रूप में होता है
- पारस्परिक सामान्य वितरण के रूप में होता है
- मानक सामान्य तालिका
- स्टीन लेम्मा
- सब-गाऊसी वितरण
- सामान्य रूप से वितरित यादृच्छिक चर का योग
- ट्वीडी वितरण - सामान्य वितरण ट्वीडी घातांकी फैलाव मॉडल के फॅमिली का सदस्य है।
- रैप्ड नॉर्मल वितरण - सर्कुलर डोमेन पर प्रयुक्त नॉर्मल वितरण के रूप में होते है
- जेड टेस्ट्स - सामान्य वितरण का उपयोग करते है
टिप्पणियाँ
- ↑ For example, this algorithm is given in the article Bc programming language.
- ↑ De Moivre first published his findings in 1733, in a pamphlet "Approximatio ad Summam Terminorum Binomii (a + b)n in Seriem Expansi" that was designated for private circulation only. But it was not until the year 1738 that he made his results publicly available. The original pamphlet was reprinted several times, see for example Walker (1985).
- ↑ "My custom of terming the curve the Gauss–Laplacian or normal curve saves us from proportioning the merit of discovery between the two great astronomer mathematicians." quote from Pearson (1905, p. 189)
- ↑ Besides those specifically referenced here, such use is encountered in the works of Peirce, Galton (Galton (1889, chapter V)) and Lexis (Lexis (1878), Rohrbasser & Véron (2003)) c. 1875.[citation needed]
संदर्भ
उद्धरण
- ↑ Normal Distribution, Gale Encyclopedia of Psychology
- ↑ Casella & Berger (2001, p. 102)
- ↑ Lyon, A. (2014). Why are Normal Distributions Normal?, The British Journal for the Philosophy of Science.
- ↑ 4.0 4.1 "Normal Distribution". www.mathsisfun.com. Retrieved 2020-08-15.
- ↑ Stigler (1982)
- ↑ Halperin, Hartley & Hoel (1965, item 7)
- ↑ McPherson (1990, p. 110)
- ↑ Bernardo & Smith (2000, p. 121)
- ↑ Scott, Clayton; Nowak, Robert (August 7, 2003). "The Q-function". Connexions.
- ↑ Barak, Ohad (April 6, 2006). "Q Function and Error Function" (PDF). Tel Aviv University. Archived from the original (PDF) on March 25, 2009.
- ↑ Weisstein, Eric W. "Normal Distribution Function". MathWorld.
- ↑ Abramowitz, Milton; Stegun, Irene Ann, eds. (1983) [June 1964]. "Chapter 26, eqn 26.2.12". Handbook of Mathematical Functions with Formulas, Graphs, and Mathematical Tables. Applied Mathematics Series. Vol. 55 (Ninth reprint with additional corrections of tenth original printing with corrections (December 1972); first ed.). Washington D.C.; New York: United States Department of Commerce, National Bureau of Standards; Dover Publications. p. 932. ISBN 978-0-486-61272-0. LCCN 64-60036. MR 0167642. LCCN 65-12253.
- ↑ Reference needed
- ↑ Cover, Thomas M.; Thomas, Joy A. (2006). Elements of Information Theory. John Wiley and Sons. p. 254. ISBN 9780471748816.
- ↑ Park, Sung Y.; Bera, Anil K. (2009). "Maximum Entropy Autoregressive Conditional Heteroskedasticity Model" (PDF). Journal of Econometrics. 150 (2): 219–230. CiteSeerX 10.1.1.511.9750. doi:10.1016/j.jeconom.2008.12.014. Archived from the original (PDF) on March 7, 2016. Retrieved 2011-06-02.
- ↑ Geary RC(1936) The distribution of the "Student's" ratio for the non-normal samples". Supplement to the Journal of the Royal Statistical Society 3 (2): 178–184
- ↑ Lukacs, Eugene, No label or title -- debug: Q55897617, Wikidata Q55897617
- ↑ 18.0 18.1 18.2 Patel & Read (1996, [2.1.4])
- ↑ Fan (1991, p. 1258)
- ↑ Patel & Read (1996, [2.1.8])
- ↑ Papoulis, Athanasios. Probability, Random Variables and Stochastic Processes (4th ed.). p. 148.
- ↑ Bryc (1995, p. 23)
- ↑ Bryc (1995, p. 24)
- ↑ Cover & Thomas (2006, p. 254)
- ↑ Williams, David (2001). Weighing the odds : a course in probability and statistics (Reprinted. ed.). Cambridge [u.a.]: Cambridge Univ. Press. pp. 197–199. ISBN 978-0-521-00618-7.
- ↑ Smith, José M. Bernardo; Adrian F. M. (2000). Bayesian theory (Reprint ed.). Chichester [u.a.]: Wiley. pp. 209, 366. ISBN 978-0-471-49464-5.
{{cite book}}
: CS1 maint: multiple names: authors list (link) - ↑ O'Hagan, A. (1994) Kendall's Advanced Theory of statistics, Vol 2B, Bayesian Inference, Edward Arnold. ISBN 0-340-52922-9 (Section 5.40)
- ↑ Jordan, Michael I. (February 8, 2010). "Stat260: Bayesian Modeling and Inference: The Conjugate Prior for the Normal Distribution" (PDF).
- ↑ Amari & Nagaoka (2000)
- ↑ "Normal Approximation to Poisson Distribution". Stat.ucla.edu. Retrieved 2017-03-03.
- ↑ 31.0 31.1 Das, Abhranil (2020). "A method to integrate and classify normal distributions". arXiv:2012.14331 [stat.ML].
- ↑ Bryc (1995, p. 27)
- ↑ Weisstein, Eric W. "Normal Product Distribution". MathWorld. wolfram.com.
- ↑ Lukacs, Eugene (1942). "A Characterization of the Normal Distribution". The Annals of Mathematical Statistics. 13 (1): 91–3. doi:10.1214/aoms/1177731647. ISSN 0003-4851. JSTOR 2236166.
- ↑ Basu, D.; Laha, R. G. (1954). "On Some Characterizations of the Normal Distribution". Sankhyā. 13 (4): 359–62. ISSN 0036-4452. JSTOR 25048183.
- ↑ Lehmann, E. L. (1997). Testing Statistical Hypotheses (2nd ed.). Springer. p. 199. ISBN 978-0-387-94919-2.
- ↑ Patel & Read (1996, [2.3.6])
- ↑ Galambos & Simonelli (2004, Theorem 3.5)
- ↑ Bryc (1995, p. 35)
- ↑ 40.0 40.1 Lukacs & King (1954)
- ↑ Quine, M.P. (1993). "On three characterisations of the normal distribution". Probability and Mathematical Statistics. 14 (2): 257–263.
- ↑ John, S (1982). "The three parameter two-piece normal family of distributions and its fitting". Communications in Statistics - Theory and Methods. 11 (8): 879–885. doi:10.1080/03610928208828279.
- ↑ 43.0 43.1 Krishnamoorthy (2006, p. 127)
- ↑ Krishnamoorthy (2006, p. 130)
- ↑ Krishnamoorthy (2006, p. 133)
- ↑ Huxley (1932)
- ↑ Jaynes, Edwin T. (2003). Probability Theory: The Logic of Science. Cambridge University Press. pp. 592–593. ISBN 9780521592710.
- ↑ Oosterbaan, Roland J. (1994). "Chapter 6: Frequency and Regression Analysis of Hydrologic Data" (PDF). In Ritzema, Henk P. (ed.). Drainage Principles and Applications, Publication 16 (second revised ed.). Wageningen, The Netherlands: International Institute for Land Reclamation and Improvement (ILRI). pp. 175–224. ISBN 978-90-70754-33-4.
- ↑ Why Most Published Research Findings Are False, John P. A. Ioannidis, 2005
- ↑ Wichura, Michael J. (1988). "Algorithm AS241: The Percentage Points of the Normal Distribution". Applied Statistics. 37 (3): 477–84. doi:10.2307/2347330. JSTOR 2347330.
- ↑ Johnson, Kotz & Balakrishnan (1995, Equation (26.48))
- ↑ Kinderman & Monahan (1977)
- ↑ Leva (1992)
- ↑ Marsaglia & Tsang (2000)
- ↑ Karney (2016)
- ↑ Monahan (1985, section 2)
- ↑ Wallace (1996)
- ↑ Johnson, Kotz & Balakrishnan (1994, p. 85)
- ↑ Le Cam & Lo Yang (2000, p. 74)
- ↑ De Moivre, Abraham (1733), Corollary I – see Walker (1985, p. 77)
- ↑ Stigler (1986, p. 76)
- ↑ Gauss (1809, section 177)
- ↑ Gauss (1809, section 179)
- ↑ Laplace (1774, Problem III)
- ↑ Pearson (1905, p. 189)
- ↑ Stigler (1986, p. 144)
- ↑ Stigler (1978, p. 243)
- ↑ Stigler (1978, p. 244)
- ↑ Maxwell (1860, p. 23)
- ↑ Jaynes, Edwin J.; Probability Theory: The Logic of Science, Ch. 7.
- ↑ Peirce, Charles S. (c. 1909 MS), Collected Papers v. 6, paragraph 327.
- ↑ Kruskal & Stigler (1997).
- ↑ "Earliest uses... (entry STANDARD NORMAL CURVE)".
- ↑ Sun, Jingchao; Kong, Maiying; Pal, Subhadip (22 June 2021). "The Modified-Half-Normal distribution: Properties and an efficient sampling scheme". Communications in Statistics - Theory and Methods: 1–23. doi:10.1080/03610926.2021.1934700. ISSN 0361-0926. S2CID 237919587.
स्रोत
- Aldrich, John; Miller, Jeff. "संभाव्यता और सांख्यिकी में प्रतीकों का प्रारंभिक उपयोग".
- Aldrich, John; Miller, Jeff. "गणित के कुछ शब्दों का सबसे पुराना ज्ञात उपयोग". विशेष रूप से, घंटी-आकार और घंटी वक्र, सामान्य (वितरण), [http के लिए प्रविष्टियां ://jeff560.tripod.com/g.html गाऊसी], और त्रुटि, त्रुटि का नियम, त्रुटि का सिद्धांत, आदि।
- Amari, Shun-ichi; Nagaoka, Hiroshi (2000). सूचना ज्यामिति के तरीके. Oxford University Press. ISBN 978-0-8218-0531-2.
- Bernardo, José M.; Smith, Adrian F. M. (2000). बायेसियन थ्योरी. Wiley. ISBN 978-0-471-49464-5.
- Bryc, Wlodzimierz (1995). सामान्य वितरण: अनुप्रयोगों के साथ अभिलक्षण. Springer-Verlag. ISBN 978-0-387-97990-8.
- Casella, George; Berger, Roger L. (2001). सांख्यिकीय निष्कर्ष (2nd ed.). Duxbury. ISBN 978-0-534-24312-8.
- Cody, William J. (1969). "त्रुटि फ़ंक्शन के लिए वाजिब चेबीशेव सन्निकटन". Mathematics of Computation. 23 (107): 631–638. doi:10.1090/S0025-5718-1969-0247736-4.
- Cover, Thomas M.; Thomas, Joy A. (2006). सूचना सिद्धांत के तत्व. John Wiley and Sons.
- de Moivre, Abraham (1738). संभावना का सिद्धांत. ISBN 978-0-8218-2103-9.
- Fan, Jianqing (1991). "गैर पैरामीट्रिक विसंक्रमण समस्याओं के लिए अभिसरण की इष्टतम दरों पर". The Annals of Statistics. 19 (3): 1257–1272. doi:10.1214/aos/1176348248. JSTOR 2241949.
- Galton, Francis (1889). प्राकृतिक विरासत (PDF). London, UK: Richard Clay and Sons.
- Galambos, Janos; Simonelli, Italo (2004). यादृच्छिक चर के उत्पाद: भौतिकी की समस्याओं और अंकगणितीय कार्यों के अनुप्रयोग. Marcel Dekker, Inc. ISBN 978-0-8247-5402-0.
- Gauss, Carolo Friderico (1809). धारा ibvs conicvs सोलेम परिवेश में motvs corporvm coelestivm का सिद्धांत [Theory of the Motion of the Heavenly Bodies Moving about the Sun in Conic Sections] (in Latina). Hambvrgi, Svmtibvs F. Perthes et I. H. Besser. English translation.
- Gould, Stephen Jay (1981). मनुष्य का गलत माप (first ed.). W. W. Norton. ISBN 978-0-393-01489-1.
- Halperin, Max; Hartley, Herman O.; Hoel, Paul G. (1965). "सांख्यिकीय प्रतीकों और संकेतन के लिए अनुशंसित मानक। प्रतीक और संकेतन पर सीओपीएसएस समिति". The American Statistician. 19 (3): 12–14. doi:10.2307/2681417. JSTOR 2681417.
- Hart, John F.; et al. (1968). कंप्यूटर अनुमान. New York, NY: John Wiley & Sons, Inc. ISBN 978-0-88275-642-4.
- "Normal Distribution", Encyclopedia of Mathematics, EMS Press, 2001 [1994]
- Herrnstein, Richard J.; Murray, Charles (1994). द बेल कर्व: इंटेलिजेंस एंड क्लास स्ट्रक्चर इन अमेरिकन लाइफ. Free Press. ISBN 978-0-02-914673-6.
- Huxley, Julian S. (1932). सापेक्ष विकास की समस्याएं. London. ISBN 978-0-486-61114-3. OCLC 476909537.
- Johnson, Norman L.; Kotz, Samuel; Balakrishnan, Narayanaswamy (1994). निरंतर यूनीवेरिएट डिस्ट्रीब्यूशन, वॉल्यूम 1. Wiley. ISBN 978-0-471-58495-7.
- Johnson, Norman L.; Kotz, Samuel; Balakrishnan, Narayanaswamy (1995). निरंतर यूनीवेरिएट डिस्ट्रीब्यूशन, वॉल्यूम 2. Wiley. ISBN 978-0-471-58494-0.
- Karney, C. F. F. (2016). "सामान्य वितरण से बिल्कुल नमूना लेना". ACM Transactions on Mathematical Software. 42 (1): 3:1–14. arXiv:1303.6257. doi:10.1145/2710016. S2CID 14252035.
- Kinderman, Albert J.; Monahan, John F. (1977). "यूनिफ़ॉर्म डेविएट्स के अनुपात का उपयोग करके रैंडम वेरिएबल्स का कंप्यूटर जनरेशन". ACM Transactions on Mathematical Software. 3 (3): 257–260. doi:10.1145/355744.355750. S2CID 12884505.
- Krishnamoorthy, Kalimuthu (2006). अनुप्रयोगों के साथ सांख्यिकीय वितरण की पुस्तिका. Chapman & Hall/CRC. ISBN 978-1-58488-635-8.
- Kruskal, William H.; Stigler, Stephen M. (1997). Spencer, Bruce D. (ed.). सामान्य शब्दावली: सांख्यिकी और अन्यत्र में 'सामान्य'. Statistics and Public Policy. Oxford University Press. ISBN 978-0-19-852341-3.
- Laplace, Pierre-Simon de (1774). "घटनाओं द्वारा कारणों की संभावना पर संस्मरण". Mémoires de l'Académie Royale des Sciences de Paris (Savants étrangers), Tome 6: 621–656. सांख्यिकीय विज्ञान '1' (3), 1986 में स्टीफन एम. स्टिग्लर द्वारा अनुवादित: JSTOR 2245476.
- Laplace, Pierre-Simon (1812). विश्लेषणात्मक संभाव्यता सिद्धांत [Analytical theory of probabilities]. Paris, Ve. Courcier.
- Le Cam, Lucien; Lo Yang, Grace (2000). सांख्यिकी में स्पर्शोन्मुखता: कुछ बुनियादी अवधारणाएँ (second ed.). Springer. ISBN 978-0-387-95036-5.
- Leva, Joseph L. (1992). "एक तेज सामान्य यादृच्छिक संख्या जनरेटर" (PDF). ACM Transactions on Mathematical Software. 18 (4): 449–453. CiteSeerX 10.1.1.544.5806. doi:10.1145/138351.138364. S2CID 15802663. Archived from the original (PDF) on 16 July 2010.
- Lexis, Wilhelm (1878). "मानव जीवन की सामान्य लंबाई और सांख्यिकीय संबंधों की स्थिरता के सिद्धांत पर". Annales de Démographie Internationale. Paris. II: 447–462.
- Lukacs, Eugene; King, Edgar P. (1954). "सामान्य वितरण की संपत्ति". The Annals of Mathematical Statistics. 25 (2): 389–394. doi:10.1214/aoms/1177728796. JSTOR 2236741.
- McPherson, Glen (1990). वैज्ञानिक जांच में सांख्यिकी: इसका आधार, अनुप्रयोग और व्याख्या. Springer-Verlag. ISBN 978-0-387-97137-7.
- Marsaglia, George; Tsang, Wai Wan (2000). "यादृच्छिक चर उत्पन्न करने के लिए जिगुरत विधि". Journal of Statistical Software. 5 (8). doi:10.18637/jss.v005.i08.
- Marsaglia, George (2004). "सामान्य वितरण का मूल्यांकन". Journal of Statistical Software. 11 (4). doi:10.18637/jss.v011.i04.
- Maxwell, James Clerk (1860). "वी। गैसों के गतिशील सिद्धांत के उदाहरण। - भाग I: पूरी तरह से लोचदार क्षेत्रों की गति और टकराव पर". Philosophical Magazine. Series 4. 19 (124): 19–32. doi:10.1080/14786446008642818.
- Monahan, J. F. (1985). "यादृच्छिक संख्या पीढ़ी में सटीकता". Mathematics of Computation. 45 (172): 559–568. doi:10.1090/S0025-5718-1985-0804945-X.
- Patel, Jagdish K.; Read, Campbell B. (1996). सामान्य वितरण की पुस्तिका (2nd ed.). CRC Press. ISBN 978-0-8247-9342-5.
- Pearson, Karl (1901). "अंतरिक्ष में बिंदुओं के सिस्टम के निकटतम फिट की रेखाओं और विमानों पर" (PDF). Philosophical Magazine. 6. 2 (11): 559–572. doi:10.1080/14786440109462720.
- Pearson, Karl (1905). "'लॉ ऑफ एरर एंड इट्स जनरलाइजेशन बाय फेचनर एंड पियर्सन'। एक जॉइनर". Biometrika. 4 (1): 169–212. doi:10.2307/2331536. JSTOR 2331536.
- Pearson, Karl (1920). "सहसंबंध के इतिहास पर नोट्स". Biometrika. 13 (1): 25–45. doi:10.1093/biomet/13.1.25. JSTOR 2331722.
- Rohrbasser, Jean-Marc; Véron, Jacques (2003). "विल्हेम लेक्सिस: "चीजों की प्रकृति" की अभिव्यक्ति के रूप में जीवन की सामान्य लंबाई". Population. 58 (3): 303–322. doi:10.3917/pope.303.0303.
- Shore, H (1982). "प्रतिलोम संचयी फलन, घनत्व फलन और सामान्य वितरण के नुकसान समाकलन के लिए सरल अनुमान". Journal of the Royal Statistical Society. Series C (Applied Statistics). 31 (2): 108–114. doi:10.2307/2347972. JSTOR 2347972.
- Shore, H (2005). "सामान्य वितरण के सीडीएफ के लिए सटीक आरएमएम-आधारित अनुमान". Communications in Statistics – Theory and Methods. 34 (3): 507–513. doi:10.1081/sta-200052102. S2CID 122148043.
- Shore, H (2011). "प्रतिक्रिया मॉडलिंग पद्धति". WIREs Comput Stat. 3 (4): 357–372. doi:10.1002/wics.151. S2CID 62021374.
- Shore, H (2012). "प्रतिक्रिया मॉडलिंग पद्धति मॉडल का अनुमान लगाना". WIREs Comput Stat. 4 (3): 323–333. doi:10.1002/wics.1199. S2CID 122366147.
- Stigler, Stephen M. (1978). "प्रारंभिक राज्यों में गणितीय सांख्यिकी". The Annals of Statistics. 6 (2): 239–265. doi:10.1214/aos/1176344123. JSTOR 2958876.
- Stigler, Stephen M. (1982). "एक मामूली प्रस्ताव: सामान्य के लिए एक नया मानक". The American Statistician. 36 (2): 137–138. doi:10.2307/2684031. JSTOR 2684031.
- Stigler, Stephen M. (1986). सांख्यिकी का इतिहास: 1900 से पहले अनिश्चितता का मापन. Harvard University Press. ISBN 978-0-674-40340-6.
- Stigler, Stephen M. (1999). मेज पर आँकड़े. Harvard University Press. ISBN 978-0-674-83601-3.
- Walker, Helen M. (1985). "De Moivre on the Law of Normal Probability" (PDF). In Smith, David Eugene (ed.). गणित में एक स्रोत पुस्तक. Dover. ISBN 978-0-486-64690-9.
- Wallace, C. S. (1996). "सामान्य और घातीय चर के लिए तेज़ छद्म-यादृच्छिक जनरेटर". ACM Transactions on Mathematical Software. 22 (1): 119–127. doi:10.1145/225545.225554. S2CID 18514848.
- Weisstein, Eric W. "सामान्य वितरण". MathWorld.
- West, Graeme (2009). "संचयी सामान्य कार्यों के लिए बेहतर अनुमान" (PDF). Wilmott Magazine: 70–76.
- Zelen, Marvin; Severo, Norman C. (1964). संभाव्यता कार्य (अध्याय 26). Handbook of mathematical functions with formulas, graphs, and mathematical tables, by Abramowitz, M.; and Stegun, I. A.: National Bureau of Standards. New York, NY: Dover. ISBN 978-0-486-61272-0.