सामान्य वितरण: Difference between revisions
No edit summary |
m (52 revisions imported from alpha:सामान्य_वितरण) |
||
(29 intermediate revisions by 2 users not shown) | |||
Line 1: | Line 1: | ||
{{Short description|Probability distribution}} | {{Short description|Probability distribution}} | ||
{{Redirect| | {{Redirect|बेल्ल वक्र}} | ||
{{Infobox probability distribution | {{Infobox probability distribution | ||
Line 16: | Line 16: | ||
गणित>\frac{1}{2}\बाएं[1 + \ऑपरेटरनाम{erf}\बाएं( \frac{x-\mu}{\sigma\sqrt{2}} | गणित>\frac{1}{2}\बाएं[1 + \ऑपरेटरनाम{erf}\बाएं( \frac{x-\mu}{\sigma\sqrt{2}} | ||
{{Probability fundamentals}} | {{Probability fundamentals}} | ||
सांख्यिकी में, एक '''सामान्य''' वितरण या गॉसियन वितरण वास्तविक मान यादृच्छिक चर के लिए [[निरंतर संभाव्यता वितरण|निरंतर प्रायिकता]] वितरण का एक प्रकार है और जबकि इसकी चर की प्रायिकता घनत्व फलन का सामान्य प्रकार है | सांख्यिकी में, एक '''सामान्य''' '''वितरण''' या गॉसियन वितरण वास्तविक मान यादृच्छिक चर के लिए [[निरंतर संभाव्यता वितरण|निरंतर प्रायिकता]] वितरण का एक प्रकार है और जबकि इसकी चर की प्रायिकता घनत्व फलन का सामान्य प्रकार है | ||
:<math> | :<math> | ||
f(x) = \frac{1}{\sigma \sqrt{2\pi} } e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2} | f(x) = \frac{1}{\sigma \sqrt{2\pi} } e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2} | ||
Line 32: | Line 32: | ||
== परिभाषाएँ == | == परिभाषाएँ == | ||
=== मानक सामान्य | === मानक सामान्य वितरण === | ||
सामान्य वितरण का सबसे सरल स्थिति मानक सामान्य वितरण या इकाई सामान्य वितरण के रूप में जाना जाता है। यह एक विशेष स्थिति है जब u = 0 और <math>\sigma=1</math> और इसे इस प्रायिकता घनत्व फलन (या घनत्व) द्वारा वर्णित किया गया है | सामान्य वितरण का सबसे सरल स्थिति मानक सामान्य वितरण या इकाई सामान्य वितरण के रूप में जाना जाता है। यह एक विशेष स्थिति है जब u = 0 और <math>\sigma=1</math> और इसे इस प्रायिकता घनत्व फलन (या घनत्व) द्वारा वर्णित किया गया है | ||
Line 43: | Line 43: | ||
:<math> \varphi(z) = e^{-\pi z^2}</math> | :<math> \varphi(z) = e^{-\pi z^2}</math> | ||
जिसका एक सरल फलन ात्मक रूप और <math>\sigma^2 = 1/(2\pi)</math> एक वेरिएंस है | जिसका एक सरल फलन ात्मक रूप और <math>\sigma^2 = 1/(2\pi)</math> एक वेरिएंस है | ||
=== सामान्य | === सामान्य वितरण === | ||
प्रत्येक सामान्य वितरण मानक सामान्य वितरण का एक संस्करण है, जिसका डोमेन एक कारक <math>\sigma</math> मानक विचलन द्वारा बढ़ाया गया है और फिर <math>\mu</math> द्वारा औसत मान का अनुवाद किया गया है: | प्रत्येक सामान्य वितरण मानक सामान्य वितरण का एक संस्करण है, जिसका डोमेन एक कारक <math>\sigma</math> मानक विचलन द्वारा बढ़ाया गया है और फिर <math>\mu</math> द्वारा औसत मान का अनुवाद किया गया है: | ||
Line 108: | Line 108: | ||
==== मानक विचलन और कवरेज ==== | ==== मानक विचलन और कवरेज ==== | ||
{{Further|अंतराल अनुमान|कवरेज प्रायिकता}} | {{Further|अंतराल अनुमान|कवरेज प्रायिकता}} | ||
[[File:Standard deviation diagram.svg|thumb|350px|सामान्य वितरण के लिए, | [[File:Standard deviation diagram.svg|thumb|350px|सामान्य वितरण के लिए, माध्य से एक मानक विचलन से कम दूरी का मान सेट का 68.27% होता है जबकि माध्य से दो मानक विचलन 95.45% और तीन मानक विचलन 99.73% होता है।]]एक सामान्य वितरण से निकाले गए लगभग 68% मान एक मानक विचलन σ माध्य से दूर होते हैं और इस प्रकार लगभग 95% मान दो मानक विचलन के भीतर होते हैं और लगभग 99.7% तीन मानक विचलन के भीतर होते हैं।<ref name=":1" /> इस तथ्य को 68–95–99.7 एम्पिरिकल नियम या 3-सिग्मा नियम के रूप में जाना जाता है। | ||
अधिक अच्छे रूप से, एक सामान्य विचलन के बीच की सीमा में होने की प्रायिकता <math>\mu-n\sigma</math> और <math>\mu+n\sigma</math> द्वारा दिया गया है | अधिक अच्छे रूप से, एक सामान्य विचलन के बीच की सीमा में होने की प्रायिकता <math>\mu-n\sigma</math> और <math>\mu+n\sigma</math> द्वारा दिया गया है | ||
Line 168: | Line 168: | ||
= \mu + \sigma\sqrt 2 \operatorname{erf}^{-1}(2p - 1), \quad p\in(0,1). | = \mu + \sigma\sqrt 2 \operatorname{erf}^{-1}(2p - 1), \quad p\in(0,1). | ||
</math> | </math> | ||
क्वांटाइल <math>\Phi^{-1}(p)</math> मानक सामान्य वितरण का सामान्य रूप से निरूपित किया जाता है <math>z_p</math>. इन मानों का उपयोग [[परिकल्पना परीक्षण| | क्वांटाइल <math>\Phi^{-1}(p)</math> मानक सामान्य वितरण का सामान्य रूप से निरूपित किया जाता है <math>z_p</math>. इन मानों का उपयोग [[परिकल्पना परीक्षण|परिकल्पना]] टेस्ट्स , [[विश्वास अंतराल|कॉन्फिडेंस अंतराल]] के निर्माण और Q-Q प्लॉट में किया जाता है। एक सामान्य यादृच्छिक चर <math>X</math> अधिक हो जाता है, इस प्रकार <math>\mu + z_p\sigma</math> प्रायिकता के साथ <math>1-p</math> अंतराल के बाहर होता है <math>\mu \pm z_p\sigma</math> प्रायिकता के साथ <math>2(1-p)</math>. विशेष रूप से, क्वांटाइल <math>z_{0.975}</math> 1.96 है; इसलिए केवल 5% स्थितियो में एक सामान्य यादृच्छिक चर अंतराल <math>\mu \pm 1.96\sigma</math> के बाहर होता है। | ||
निम्न तालिका क्वांटाइल <math>z_p</math> इस प्रकार देती है कि <math>X</math>एक निर्दिष्ट प्रायिकता <math>p</math>. के साथ श्रेणी <math>\mu \pm z_p\sigma</math> के रूप में निर्दिष्ट होता है, ये मान नमूना औसत और ऐसिम्टाटिक रूप से सामान्य वितरण वाले अन्य सांख्यिकीय अनुमानकों के लिए टॉलरेंस अंतराल निर्धारित करने के लिए उपयोगी होते है। ध्यान दें कि निम्न तालिका दिखाती है <math>\sqrt 2 \operatorname{erf}^{-1}(p)=\Phi^{-1}\left(\frac{p+1}{2}\right)</math>, नहीं <math>\Phi^{-1}(p)</math> जैसा कि ऊपर परिभाषित किया गया है। | निम्न तालिका क्वांटाइल <math>z_p</math> इस प्रकार देती है कि <math>X</math>एक निर्दिष्ट प्रायिकता <math>p</math>. के साथ श्रेणी <math>\mu \pm z_p\sigma</math> के रूप में निर्दिष्ट होता है, ये मान नमूना औसत और ऐसिम्टाटिक रूप से सामान्य वितरण वाले अन्य सांख्यिकीय अनुमानकों के लिए टॉलरेंस अंतराल निर्धारित करने के लिए उपयोगी होते है। ध्यान दें कि निम्न तालिका दिखाती है <math>\sqrt 2 \operatorname{erf}^{-1}(p)=\Phi^{-1}\left(\frac{p+1}{2}\right)</math>, नहीं <math>\Phi^{-1}(p)</math> जैसा कि ऊपर परिभाषित किया गया है। | ||
Line 196: | Line 196: | ||
== गुण == | == गुण == | ||
सामान्य वितरण ही एकमात्र ऐसा वितरण है जिसके पहले दो से परे [[संचयी]] शून्य होते हैं। अर्थात् माध्य और प्रसरण के अतिरिक्त यह निर्दिष्ट माध्य और वेरिएंस के लिए [[अधिकतम एन्ट्रापी संभाव्यता वितरण|अधिकतम एन्ट्रापी प्रायिकता]] वितरण के साथ निरंतर वितरण है।<ref>{{cite book|last=Cover|first=Thomas M.|author2=Thomas, Joy A.|year=2006|title=Elements of Information Theory|url=https://archive.org/details/elementsinformat00cove|url-access=limited|publisher=John Wiley and Sons|page=[https://archive.org/details/elementsinformat00cove/page/n279 254]|isbn=9780471748816}}</ref><ref>{{cite journal|last1=Park|first1=Sung Y.|last2=Bera|first2=Anil K.|year=2009|title=Maximum Entropy Autoregressive Conditional Heteroskedasticity Model|journal=Journal of Econometrics|pages=219–230|url=http://www.wise.xmu.edu.cn/Master/Download/..%5C..%5CUploadFiles%5Cpaper-masterdownload%5C2009519932327055475115776.pdf|access-date=2011-06-02|doi=10.1016/j.jeconom.2008.12.014|volume=150|issue=2|citeseerx=10.1.1.511.9750|archive-date=March 7, 2016|archive-url=https://web.archive.org/web/20160307144515/http://wise.xmu.edu.cn/uploadfiles/paper-masterdownload/2009519932327055475115776.pdf|url-status=dead}}</ref> गीरी ने मानते हुए यह दिखाया है कि माध्य और वेरिएंस परिमित रूप में होते है और सामान्य वितरण ही एकमात्र वितरण है जहां स्वतंत्र ड्रा के | सामान्य वितरण ही एकमात्र ऐसा वितरण है जिसके पहले दो से परे [[संचयी]] शून्य होते हैं। अर्थात् माध्य और प्रसरण के अतिरिक्त यह निर्दिष्ट माध्य और वेरिएंस के लिए [[अधिकतम एन्ट्रापी संभाव्यता वितरण|अधिकतम एन्ट्रापी प्रायिकता]] वितरण के साथ निरंतर वितरण है।<ref>{{cite book|last=Cover|first=Thomas M.|author2=Thomas, Joy A.|year=2006|title=Elements of Information Theory|url=https://archive.org/details/elementsinformat00cove|url-access=limited|publisher=John Wiley and Sons|page=[https://archive.org/details/elementsinformat00cove/page/n279 254]|isbn=9780471748816}}</ref><ref>{{cite journal|last1=Park|first1=Sung Y.|last2=Bera|first2=Anil K.|year=2009|title=Maximum Entropy Autoregressive Conditional Heteroskedasticity Model|journal=Journal of Econometrics|pages=219–230|url=http://www.wise.xmu.edu.cn/Master/Download/..%5C..%5CUploadFiles%5Cpaper-masterdownload%5C2009519932327055475115776.pdf|access-date=2011-06-02|doi=10.1016/j.jeconom.2008.12.014|volume=150|issue=2|citeseerx=10.1.1.511.9750|archive-date=March 7, 2016|archive-url=https://web.archive.org/web/20160307144515/http://wise.xmu.edu.cn/uploadfiles/paper-masterdownload/2009519932327055475115776.pdf|url-status=dead}}</ref> गीरी ने मानते हुए यह दिखाया है कि माध्य और वेरिएंस परिमित रूप में होते है और सामान्य वितरण ही एकमात्र वितरण है जहां स्वतंत्र ड्रा के समुच्चय से गणना की गई माध्य और वेरिएंस एक दूसरे से स्वतंत्र हैं।<ref name=Geary1936>Geary RC(1936) The distribution of the "Student's" ratio for the non-normal samples". Supplement to the Journal of the Royal Statistical Society 3 (2): 178–184</ref><ref>{{Cite Q|Q55897617|author1=Lukacs, Eugene|author-link1=Eugene Lukacs}}</ref> | ||
सामान्य वितरण [[अण्डाकार वितरण|दीर्घवृत्ताकार]] वितरण का एक उपवर्ग है। सामान्य वितरण अपने माध्य के बारे में सममित वितरण है और संपूर्ण वास्तविक रेखा पर गैर-शून्य है। जैसे कि यह उन चरों के लिए उपयुक्त मॉडल नहीं हो सकता है जो स्वाभाविक रूप से धनात्मक या दृढ़ता से विषम हैं, जैसे किसी व्यक्ति का वजन या [[शेयर (वित्त)]] की कीमत इत्यादि। ऐसे चरों को अन्य वितरण द्वारा अच्छे से वर्णित किया जा सकता है, जैसे [[लॉग-सामान्य वितरण|लॉग-सामान्य]] वितरण या पारेटो वितरण इत्यादि। | सामान्य वितरण [[अण्डाकार वितरण|दीर्घवृत्ताकार]] वितरण का एक उपवर्ग है। सामान्य वितरण अपने माध्य के बारे में सममित वितरण है और संपूर्ण वास्तविक रेखा पर गैर-शून्य है। जैसे कि यह उन चरों के लिए उपयुक्त मॉडल नहीं हो सकता है जो स्वाभाविक रूप से धनात्मक या दृढ़ता से विषम हैं, जैसे किसी व्यक्ति का वजन या [[शेयर (वित्त)]] की कीमत इत्यादि। ऐसे चरों को अन्य वितरण द्वारा अच्छे से वर्णित किया जा सकता है, जैसे [[लॉग-सामान्य वितरण|लॉग-सामान्य]] वितरण या पारेटो वितरण इत्यादि। | ||
सामान्य वितरण का मान व्यावहारिक रूप से शून्य होता है जब मान <math>x</math> माध्य से कुछ मानक विचलनों से अधिक दूर स्थित होता है, उदाहरण के लिए, तीन मानक विचलनों का प्रसार कुल वितरण के 0.27% को छोड़कर सभी को कवर करता है। इसलिए, यह एक उपयुक्त मॉडल नहीं हो सकता है जब कोई [[आउटलेर्स]] मानों के एक महत्वपूर्ण | सामान्य वितरण का मान व्यावहारिक रूप से शून्य होता है जब मान <math>x</math> माध्य से कुछ मानक विचलनों से अधिक दूर स्थित होता है, उदाहरण के लिए, तीन मानक विचलनों का प्रसार कुल वितरण के 0.27% को छोड़कर सभी को कवर करता है। इसलिए, यह एक उपयुक्त मॉडल नहीं हो सकता है जब कोई [[आउटलेर्स]] मानों के एक महत्वपूर्ण भिन्न की अपेक्षा करता है जो कई मानक विचलन को माध्य से दूर करते हैं और कम से कम वर्ग और अन्य सांख्यिकीय अनुमान विधियां जो सामान्य रूप से वितरित चर के लिए इष्टतम हैं, ऐसे डेटा के लिए अधिकांशतः इस प्रकार प्रयुक्त होने पर अत्यधिक अविश्वसनीय हो जाती हैं। उन स्थितियो में, अधिक भारी टेल्ड वाले वितरण की कल्पना की जानी चाहिए और उचित मजबूत सांख्यिकीय अनुमान विधियों को प्रयुक्त किया जाना चाहिए। | ||
गॉसियन वितरण [[स्थिर वितरण|स्टेबल]] वितरण के फॅमिली से संबंधित है, जो स्वतंत्र और समान रूप से वितरित यादृच्छिक चर के योगों के आकर्षण हैं | इस प्रकार स्वतंत्र, समान रूप से वितरित वितरण माध्य या वेरिएंस परिमित होते है या नहीं। गॉसियन को छोड़कर जो एक सीमित स्थिति में सभी स्टेबल वितरण में [[भारी पूंछ|भारी टेल्ड]] और अनंत वेरिएंस होता है। यह उन कुछ वितरण में से एक है जो स्टेबल हैं और जिनमें प्रायिकता घनत्व फलन के रूप में हैं, जिन्हें विश्लेषणात्मक रूप से व्यक्त किया जा सकता है, अन्य कॉची वितरण और लेवी वितरण हैं। | गॉसियन वितरण [[स्थिर वितरण|स्टेबल]] वितरण के फॅमिली से संबंधित है, जो स्वतंत्र और समान रूप से वितरित यादृच्छिक चर के योगों के आकर्षण हैं | इस प्रकार स्वतंत्र, समान रूप से वितरित वितरण माध्य या वेरिएंस परिमित होते है या नहीं। गॉसियन को छोड़कर जो एक सीमित स्थिति में सभी स्टेबल वितरण में [[भारी पूंछ|भारी टेल्ड]] और अनंत वेरिएंस होता है। यह उन कुछ वितरण में से एक है जो स्टेबल हैं और जिनमें प्रायिकता घनत्व फलन के रूप में हैं, जिन्हें विश्लेषणात्मक रूप से व्यक्त किया जा सकता है, अन्य कॉची वितरण और लेवी वितरण हैं। | ||
Line 217: | Line 217: | ||
* इसका दूसरा अवकलज है <math>\varphi^{\prime\prime}(x)=(x^2-1)\varphi(x)</math> | * इसका दूसरा अवकलज है <math>\varphi^{\prime\prime}(x)=(x^2-1)\varphi(x)</math> | ||
* अधिक सामान्यतः, इसकी {{mvar|n}}वें अवकलज है <math>\varphi^{(n)}(x) = (-1)^n\operatorname{He}_n(x)\varphi(x),</math> जहाँ <math>\operatorname{He}_n(x)</math>{{mvar|n}}(प्रायिकतात्मक ) हर्मिट बहुपद है।<ref>{{harvtxt |Patel |Read |1996 |loc=[2.1.8] }}</ref> | * अधिक सामान्यतः, इसकी {{mvar|n}}वें अवकलज है <math>\varphi^{(n)}(x) = (-1)^n\operatorname{He}_n(x)\varphi(x),</math> जहाँ <math>\operatorname{He}_n(x)</math>{{mvar|n}}(प्रायिकतात्मक ) हर्मिट बहुपद है।<ref>{{harvtxt |Patel |Read |1996 |loc=[2.1.8] }}</ref> | ||
* प्रायिकता है कि एक सामान्य रूप से वितरित चर <math>X</math> ज्ञात के साथ <math>\mu</math> और <math>\sigma</math> एक विशेष | * प्रायिकता है कि एक सामान्य रूप से वितरित चर <math>X</math> ज्ञात के साथ <math>\mu</math> और <math>\sigma</math> एक विशेष समुच्चय में है, इस तथ्य का उपयोग करके गणना की जा सकती है कि भिन्न <math>Z = (X-\mu)/\sigma</math> एक मानक सामान्य वितरण है। | ||
=== मोमेंट === | === मोमेंट === | ||
Line 251: | Line 251: | ||
{| class="wikitable" style="background:#fff; margin: auto;" | {| class="wikitable" style="background:#fff; margin: auto;" | ||
|- | |- | ||
! | ! क्रम !! अकेंद्रीय मोमेंट !! केंद्रीय मोमेंट | ||
|- | |- | ||
| 1 | | 1 | ||
Line 325: | Line 325: | ||
=== अधिकतम एन्ट्रापी === | === अधिकतम एन्ट्रापी === | ||
एक निर्दिष्ट माध्य के साथ वास्तविक पर सभी प्रायिकता वितरण में से <math>\mu</math> और वेरिएंस <math>\sigma^2</math>, सामान्य वितरण <math>N(\mu,\sigma^2)</math> अधिकतम | एक निर्दिष्ट माध्य के साथ वास्तविक पर सभी प्रायिकता वितरण में से <math>\mu</math> और वेरिएंस <math>\sigma^2</math>, सामान्य वितरण <math>N(\mu,\sigma^2)</math> अधिकतम एंट्रॉp प्रायिकता वितरण वाला एक है।<ref>{{harvtxt |Cover |Thomas |2006 |p=254 }}</ref> यदि <math>X</math> प्रायिकता घनत्व फलन के साथ एक [[सतत यादृच्छिक चर]] <math>f(x)</math> है और इस प्रकार फिर <math>X</math> एन्ट्रापी को परिभाषित किया जाता है<ref>{{cite book|last1=Williams|first1=David|title=Weighing the odds : a course in probability and statistics|url=https://archive.org/details/weighingoddscour00will|url-access=limited|date=2001|publisher=Cambridge Univ. Press|location=Cambridge [u.a.]|isbn=978-0-521-00618-7|pages=[https://archive.org/details/weighingoddscour00will/page/n219 197]–199|edition=Reprinted.}}</ref><ref>{{cite book|last1=Smith|first1=José M. Bernardo; Adrian F. M.|title=Bayesian theory|url=https://archive.org/details/bayesiantheory00bern_963|url-access=limited|date=2000|publisher=Wiley|location=Chichester [u.a.]|isbn=978-0-471-49464-5|pages=[https://archive.org/details/bayesiantheory00bern_963/page/n224 209], 366|edition=Reprint}}</ref><ref>O'Hagan, A. (1994) ''Kendall's Advanced Theory of statistics, Vol 2B, Bayesian Inference'', Edward Arnold. {{isbn|0-340-52922-9}} (Section 5.40)</ref> | ||
:<math> | :<math> | ||
H(X) = - \int_{-\infty}^\infty f(x)\log f(x)\, dx | H(X) = - \int_{-\infty}^\infty f(x)\log f(x)\, dx | ||
Line 349: | Line 349: | ||
f(x, \mu, \sigma)=\frac{1}{\sqrt{2\pi\sigma^2}}e^{-\frac{(x-\mu)^2}{2\sigma^2}} | f(x, \mu, \sigma)=\frac{1}{\sqrt{2\pi\sigma^2}}e^{-\frac{(x-\mu)^2}{2\sigma^2}} | ||
</math> | </math> | ||
एक सामान्य वितरण की | एक सामान्य वितरण की एन्ट्रॉp बराबर होती है | ||
:<math> | :<math> | ||
H(X)=\tfrac{1}{2}(1+\log(2\sigma^2\pi)) | H(X)=\tfrac{1}{2}(1+\log(2\sigma^2\pi)) | ||
Line 377: | Line 377: | ||
}} | }} | ||
== संबंधित | == संबंधित वितरण == | ||
=== केंद्रीय सीमा प्रमेय === | === केंद्रीय सीमा प्रमेय === | ||
[[File:De moivre-laplace.gif|right|thumb|250px|जैसे-जैसे असतत घटनाओं की संख्या बढ़ती है, फलन एक सामान्य वितरण जैसा दिखने लगता है]] | [[File:De moivre-laplace.gif|right|thumb|250px|जैसे-जैसे असतत घटनाओं की संख्या बढ़ती है, फलन एक सामान्य वितरण जैसा दिखने लगता है]] | ||
[[File:Dice sum central limit theorem.svg|thumb|250px|प्रायिकता घनत्व फलन की तुलना, <math>p(k)</math> के योग के लिए <math>n</math> वृद्धि के साथ एक सामान्य वितरण के लिए उनके अभिसरण को दिखाने के लिए निष्पक्ष 6-पक्षीय | [[File:Dice sum central limit theorem.svg|thumb|250px|प्रायिकता घनत्व फलन की तुलना, <math>p(k)</math> के योग के लिए <math>n</math> वृद्धि के साथ एक सामान्य वितरण के लिए उनके अभिसरण को दिखाने के लिए निष्पक्ष 6-पक्षीय डाइस <math>na</math>, केंद्रीय सीमा प्रमेय के अनुसार नीचे-दाएं ग्राफ़ में, पिछले ग्राफ़ के स्मूथ प्रोफाइल को सामान्य वितरण (ब्लैक कर्व) के साथ पुन: व्यवस्थित प्रभारित रूप में तुलना की जाती है।]] | ||
{{Main|केंद्रीय सीमा प्रमेय}} | {{Main|केंद्रीय सीमा प्रमेय}} | ||
Line 406: | Line 406: | ||
=== सामान्य चर के संचालन और फलन === | === सामान्य चर के संचालन और फलन === | ||
[[File:Probabilities of functions of normal vectors.png|thumb|right|a: किसी फलन का प्रायिकता घनत्व <math>\cos x^2</math> एक सामान्य चर का <math>x</math> साथ <math>\mu=-2</math> और <math>\sigma=3</math>. | [[File:Probabilities of functions of normal vectors.png|thumb|right|a: किसी फलन का प्रायिकता घनत्व <math>\cos x^2</math> एक सामान्य चर का <math>x</math> साथ <math>\mu=-2</math> और <math>\sigma=3</math>. b: एक फलन की प्रायिकता घनत्व <math>x^y</math> दो सामान्य चर के <math>x</math> और <math>y</math>, जहाँ <math>\mu_x=1</math>, <math>\mu_y=2</math>, <math>\sigma_x = 0.1</math>, <math>\sigma_y = 0.2</math>, और <math>\rho_{xy} = 0.8</math>. c: दो सहसंबद्ध सामान्य चर के दो फलन की संयुक्त प्रायिकता घनत्व का हीट मैप <math>x</math> और <math>y</math>, जहाँ <math>\mu_x = -2</math>, <math>\mu_y=5</math>, <math>\sigma_x^2 = 10</math>, <math>\sigma_y^2 = 20</math>, और <math>\rho_{xy} = 0.495</math>. d: एक फलन की प्रायिकता घनत्व <math display="inline">\sum_{i=1}^4 \vert x_i \vert</math> 4 iid मानक सामान्य चर के रूप में होती है। इनकी गणना रे-ट्रेसिंग की संख्यात्मक विधि द्वारा की जाती है।<ref name="Das" />]]प्रायिकता घनत्व फलन संचयी वितरण फलन और एक या एक से अधिक स्वतंत्र या सहसंबद्ध सामान्य चर के किसी भी फलन के व्युत्क्रम संचयी वितरण फलन की गणना रे-ट्रेसिंग की संख्यात्मक विधि से की जा सकती है।<ref name="Das">{{cite arXiv | last=Das|first=Abhranil| eprint=2012.14331| title=A method to integrate and classify normal distributions|date=2020| class=stat.ML}}</ref> ([https://www.mathworks.com/matlabcentral/fileexchange/84973-integrate-and-classify-normal-distributions मैटलैब कोड]) और इस प्रकार निम्नलिखित अनुभागों में हम कुछ विशेष स्थितियो को देख सकते है। | ||
==== एकल सामान्य चर पर संचालन ==== | ==== एकल सामान्य चर पर संचालन ==== | ||
Line 456: | Line 456: | ||
=== एक्सटेंशन === | === एक्सटेंशन === | ||
सामान्य वितरण की धारणा प्रायिकता सिद्धांत में सबसे महत्वपूर्ण वितरण होने के कारण यूनीवेरिएट के मानक ढांचे से बहुत आगे तक बढ़ा दिया गया है, जो कि एक आयामी स्थिति (1) के रूप में है और इस प्रकार इन सभी विस्तारों को सामान्य या गाऊसी नियम भी कहा जाता है, इसलिए नामों में एक निश्चित अस्पष्टता उपस्थित होती है। | सामान्य वितरण की धारणा प्रायिकता सिद्धांत में सबसे महत्वपूर्ण वितरण होने के कारण यूनीवेरिएट के मानक ढांचे से बहुत आगे तक बढ़ा दिया गया है, जो कि एक आयामी स्थिति (1) के रूप में है और इस प्रकार इन सभी विस्तारों को सामान्य या गाऊसी नियम भी कहा जाता है, इसलिए नामों में एक निश्चित अस्पष्टता उपस्थित होती है। | ||
* बहुभिन्नरूपी सामान्य वितरण के-आयामी [[यूक्लिडियन अंतरिक्ष|यूक्लिडियन स्थान]] में गॉसियन नियम का वर्णन करता है। एक सदिश {{nowrap|''X'' ∈ '''R'''<sup>''k''</sup>}} बहुभिन्नरूपी-सामान्य रूप से वितरित है यदि इसके घटकों का कोई रैखिक संयोजन {{nowrap|Σ{{su|p=''k''|b=''j''=1}}''a<sub>j</sub> X<sub>j</sub>''}} एक अविभाजित सामान्य वितरण है। इस प्रकार X का प्रसरण एक k×k सममित सकारात्मक-निश्चित आव्यूह V के रूप में है। बहुभिन्नरूपी सामान्य वितरण दीर्घवृत्ताकार वितरण का एक विशेष स्थिति है। जैसे, k = 2 स्थितियो में इसका आइसो-घनत्व लोकी दीर्घवृत्त हैं और यादृच्छिक k के स्थितियो में दीर्घवृत्त हैं। | * बहुभिन्नरूपी सामान्य वितरण के-आयामी [[यूक्लिडियन अंतरिक्ष|यूक्लिडियन स्थान]] में गॉसियन नियम का वर्णन करता है। एक सदिश {{nowrap|''X'' ∈ '''R'''<sup>''k''</sup>}} बहुभिन्नरूपी -सामान्य रूप से वितरित है यदि इसके घटकों का कोई रैखिक संयोजन {{nowrap|Σ{{su|p=''k''|b=''j''=1}}''a<sub>j</sub> X<sub>j</sub>''}} एक अविभाजित सामान्य वितरण है। इस प्रकार X का प्रसरण एक k×k सममित सकारात्मक-निश्चित आव्यूह V के रूप में है। बहुभिन्नरूपी सामान्य वितरण दीर्घवृत्ताकार वितरण का एक विशेष स्थिति है। जैसे, k = 2 स्थितियो में इसका आइसो-घनत्व लोकी दीर्घवृत्त हैं और यादृच्छिक k के स्थितियो में दीर्घवृत्त हैं। | ||
* [[संशोधित गाऊसी वितरण|संशोधित गाऊसी]] वितरण सामान्य वितरण का एक संशोधित संस्करण है जिसमें सभी ऋणात्मक तत्व 0 पर | * [[संशोधित गाऊसी वितरण|संशोधित गाऊसी]] वितरण सामान्य वितरण का एक संशोधित संस्करण है जिसमें सभी ऋणात्मक तत्व 0 पर रीसमुच्चय हो जाते हैं | ||
* [[जटिल सामान्य वितरण|सम्मिश्र सामान्य]] वितरण सम्मिश्र सामान्य सदिश से संबंधित होते है। एक सम्मिश्र सदिश {{nowrap|''X'' ∈ '''C'''<sup>''k''</sup>}} सामान्य वितरण कहा जाता है यदि इसके वास्तविक और काल्पनिक दोनों घटक संयुक्त रूप से 2k-आयामी बहुभिन्नरूपी सामान्य वितरण होता है। इस प्रकार X की प्रसरण-सहप्रसरण संरचना को दो आव्यूहों द्वारा वर्णित किया जाता है, जबकि प्रसरण आव्यूह Γ और संबंध आव्यूह C के रूप में दर्शाया गया है। | * [[जटिल सामान्य वितरण|सम्मिश्र सामान्य]] वितरण सम्मिश्र सामान्य सदिश से संबंधित होते है। एक सम्मिश्र सदिश {{nowrap|''X'' ∈ '''C'''<sup>''k''</sup>}} सामान्य वितरण कहा जाता है यदि इसके वास्तविक और काल्पनिक दोनों घटक संयुक्त रूप से 2k-आयामी बहुभिन्नरूपी सामान्य वितरण होता है। इस प्रकार X की प्रसरण-सहप्रसरण संरचना को दो आव्यूहों द्वारा वर्णित किया जाता है, जबकि प्रसरण आव्यूह Γ और संबंध आव्यूह C के रूप में दर्शाया गया है। | ||
* आव्यूह सामान्य वितरण सामान्य रूप से वितरित आव्यूह के स्थितियो का वर्णन करता है। | * आव्यूह सामान्य वितरण सामान्य रूप से वितरित आव्यूह के स्थितियो का वर्णन करता है। | ||
Line 465: | Line 465: | ||
** ऑर्नस्टीन-उहलेनबेक प्रक्रिया | ** ऑर्नस्टीन-उहलेनबेक प्रक्रिया | ||
* [[गॉसियन क्यू-वितरण|गॉसियन q -]]वितरण एक सार गणितीय निर्माण है जो सामान्य वितरण के [[क्यू-एनालॉग|q -एनालॉग]] का प्रतिनिधित्व करता है। | * [[गॉसियन क्यू-वितरण|गॉसियन q -]]वितरण एक सार गणितीय निर्माण है जो सामान्य वितरण के [[क्यू-एनालॉग|q -एनालॉग]] का प्रतिनिधित्व करता है। | ||
* q[[क्ष-गाऊसी|-गाऊसी]] गॉसियन वितरण का एक एनालॉग है, इस अर्थ में कि यह सॉलिस | * q[[क्ष-गाऊसी|-गाऊसी]] गॉसियन वितरण का एक एनालॉग है, इस अर्थ में कि यह सॉलिस एंट्रॉp को अधिकतम करता है और एक प्रकार का सॉलिस वितरण है। ध्यान दें कि यह वितरण उपरोक्त गॉसियन q-वितरण से भिन्न होता है। | ||
* कनियादकिस κ-गाऊसी वितरण गॉसियन वितरण का एक सामान्यीकरण है, जो [[कनियादकिस वितरण|कनियादकिस]] वितरण से उत्पन्न होता है और जो कनियादाकिस वितरणों में से एक है। | * कनियादकिस κ-गाऊसी वितरण गॉसियन वितरण का एक सामान्यीकरण है, जो [[कनियादकिस वितरण|कनियादकिस]] वितरण से उत्पन्न होता है और जो कनियादाकिस वितरणों में से एक है। | ||
Line 489: | Line 489: | ||
{{See also|अधिकतम संभावना $ सतत वितरण, सतत पैरामीटर स्थान|गॉसियन फलन मापदंडों का अनुमान}} | {{See also|अधिकतम संभावना $ सतत वितरण, सतत पैरामीटर स्थान|गॉसियन फलन मापदंडों का अनुमान}} | ||
अधिकांशतः ऐसा होता है कि हम सामान्य वितरण के पैरामीटर को नहीं जानते हैं, बल्कि इसके अतिरिक्त उन्हें [[अनुमान सिद्धांत]] से करना चाहते हैं। अर्थात एक सामान्य से <math>N(\mu, \sigma^2)</math> जनसंख्या से एक नमूना <math>(x_1, \ldots, x_n)</math> लेकर हम पैरामीटर के अनुमानित मानों को सीखना चाहते है और इस प्रकार <math>\mu</math> और <math>\sigma^2</math>. इस | अधिकांशतः ऐसा होता है कि हम सामान्य वितरण के पैरामीटर को नहीं जानते हैं, बल्कि इसके अतिरिक्त उन्हें [[अनुमान सिद्धांत]] से करना चाहते हैं। अर्थात एक सामान्य से <math>N(\mu, \sigma^2)</math> जनसंख्या से एक नमूना <math>(x_1, \ldots, x_n)</math> लेकर हम पैरामीटर के अनुमानित मानों को सीखना चाहते है और इस प्रकार <math>\mu</math> और <math>\sigma^2</math>. इस प्रॉब्लम का मानक दृष्टिकोण अधिकतम प्रायिकता विधि है, जिसके लिए लॉग-लाइबिलिटी फलन को अधिकतम करने की आवश्यकता होती है | ||
: <math> | : <math> | ||
\ln\mathcal{L}(\mu,\sigma^2) | \ln\mathcal{L}(\mu,\sigma^2) | ||
Line 520: | Line 520: | ||
s^2 = \frac{n}{n-1} \hat\sigma^2 = \frac{1}{n-1} \sum_{i=1}^n (x_i - \overline{x})^2. | s^2 = \frac{n}{n-1} \hat\sigma^2 = \frac{1}{n-1} \sum_{i=1}^n (x_i - \overline{x})^2. | ||
</math> | </math> | ||
बीच में अंतर <math>s^2</math> और <math>\sigma^2</math> बड़े n के लिए नगण्य रूप से छोटा हो जाता है। चूंकि परिमित नमूनों में, के उपयोग के | बीच में अंतर <math>s^2</math> और <math>\sigma^2</math> बड़े n के लिए नगण्य रूप से छोटा हो जाता है। चूंकि परिमित नमूनों में, के उपयोग के p छे की प्रेरणा <math>s^2</math> के रूप में यह है कि यह अंतर्निहित पैरामीटर का निष्पक्ष एस्टीमेटर <math>\sigma^2</math> है, जबकि <<math>\sigma^2</math> पक्षपातपूर्ण है। इसके अतिरिक्त , लेहमन-शेफ़े प्रमेय द्वारा एस्टीमेटर गणित <math>\sigma^2</math> समान रूप से न्यूनतम भिन्नता निष्पक्ष अनुमानक है,<ref name="Kri127" /> जो इसे सभी निष्पक्ष लोगों के बीच सबसे अच्छा एस्टीमेटर बनाता है। चूंकि यह दिखाया जा सकता है कि पक्षपाती एस्टीमेटर <math>\sigma^2</math> से अच्छे से है और इस प्रकार माध्य वर्ग त्रुटि (एमएसई) मानदंड के संदर्भ में <math>s^2</math> के रूप में होती है। परिमित नमूनों में दोनों <math>s^2</math> और <math>\sigma^2</math> के साथ स्केल किया हुआ ची-वर्ग वितरण {{nowrap|(''n'' − 1)}} स्वतंत्र की कोटियां होती है | ||
: <math> | : <math> | ||
s^2 \sim \frac{\sigma^2}{n-1} \cdot \chi^2_{n-1}, \qquad | s^2 \sim \frac{\sigma^2}{n-1} \cdot \chi^2_{n-1}, \qquad | ||
\hat\sigma^2 \sim \frac{\sigma^2}{n} \cdot \chi^2_{n-1}. | \hat\sigma^2 \sim \frac{\sigma^2}{n} \cdot \chi^2_{n-1}. | ||
</math> | </math> | ||
इन अभिव्यक्ति में से पहला दर्शाता है कि <math>s^2</math> का वेरिएंस | इन अभिव्यक्ति में से पहला दर्शाता है कि <math>s^2</math> का वेरिएंस <math>2\sigma^4/(n-1)</math> के बराबर है, जो व्युत्क्रम फ़िशर सूचना आव्यूह <math>I-1</math> के σσ-तत्व से थोड़ा अधिक होता है। इस प्रकार, <math>s^2</math> के लिए एक कुशल आकलनकर्ता के रूप में <math>\sigma^2</math>नहीं है और इसके अतिरिक्त <math>s^2</math> UMVU के रूप में होते है, हम यह निष्कर्ष निकाल सकते हैं कि परिमित-नमूना कुशल एस्टीमेटर के लिए <math>\sigma^2</math> उपस्थित नहीं होता है। | ||
ऐसिम्टाटिक सिद्धांत को प्रयुक्त करना, दोनों एस्टीमेटर <math>s^2</math> और | ऐसिम्टाटिक सिद्धांत को प्रयुक्त करना, दोनों एस्टीमेटर <math>s^2</math> और <math>\sigma^2</math> संगत हैं, अर्थात वे प्रायिकता में अभिमुख होते है <math>\sigma^2</math> नमूना आकार के रूप में <math>n\longrightarrow\infty</math> होते है, दोनों अनुमानक भी स्पर्शोन्मुख रूप से सामान्य हैं, | ||
: <math> | : <math> | ||
\sqrt{n}(\hat\sigma^2 - \sigma^2) \simeq | \sqrt{n}(\hat\sigma^2 - \sigma^2) \simeq | ||
Line 535: | Line 535: | ||
=== कॉन्फिडेंस अंतराल === | === कॉन्फिडेंस अंतराल === | ||
{{See also| | {{See also|विद्यार्थीकरण|3-सिग्मा नियम}} | ||
कोचरन के प्रमेय के अनुसार, सामान्य वितरण के लिए नमूने का | |||
कोचरन के प्रमेय के अनुसार, सामान्य वितरण के लिए नमूने का अर्थ <math>\mu</math> और नमूना प्रसरण s<sup>2</sup> स्वतंत्र (प्रायिकता सिद्धांत हैं, जिसका अर्थ है कि उनके [[संयुक्त वितरण|संयुक्त]] वितरण पर विचार करने से कोई लाभ नहीं हो सकता है। एक विलोम प्रमेय भी है, यदि एक नमूने में नमूना माध्य और नमूना वेरिएंस स्वतंत्र रूप में हैं, तो नमूना सामान्य वितरण के रूप में आया होता है । तथाकथित t-सांख्यिकी के निर्माण के लिए <math>\mu</math> और s के बीच की स्वतंत्र को नियोजित किया जा सकता है, | |||
: गणित> | : गणित> | ||
t = \frac{\hat\mu-\mu}{s/\sqrt{n}} = \frac{\overline{x}-\mu}{\sqrt{\frac{1}{n(n-1) )}\sum(x_i-\overline{x})^2}} \sim t_{n-1} | t = \frac{\hat\mu-\mu}{s/\sqrt{n}} = \frac{\overline{x}-\mu}{\sqrt{\frac{1}{n(n-1) )}\sum(x_i-\overline{x})^2}} \sim t_{n-1} | ||
<nowiki> </nowiki></ गणित> | <nowiki> </nowiki></ गणित> | ||
इस क्वांटाइल t में छात्र का t-वितरण | इस क्वांटाइल t में छात्र का t-वितरण {{nowrap|(''n'' − 1)}} है, इस प्रकार स्वतंत्र की डिग्री और यह एक सहायक आँकड़ा पैरामीटर के मान से स्वतंत्र है। इस t-सांख्यिकी के वितरण को बदलने से हमें μ के लिए कॉन्फिडेंस अंतराल का निर्माण करने की अनुमति मिलती है;<ref>{{harvtxt |Krishnamoorthy |2006 |p=130 }}</ref> इसी तरह, आँकड़ा s<sup>2</sup> के χ<sup>2</sup> वितरण को उलटने से हमें σ<sup>2</sup> के लिए कॉन्फ़िडेंस इंटरवल देता है:<ref>{{harvtxt |Krishnamoorthy |2006 |p=133 }}</ref> | ||
:<math>\mu \in \left[ \hat\mu - t_{n-1,1-\alpha/2} \frac{1}{\sqrt{n}}s, | :<math>\mu \in \left[ \hat\mu - t_{n-1,1-\alpha/2} \frac{1}{\sqrt{n}}s, | ||
\hat\mu + t_{n-1,1-\alpha/2} \frac{1}{\sqrt{n}}s \right],</math> | \hat\mu + t_{n-1,1-\alpha/2} \frac{1}{\sqrt{n}}s \right],</math> | ||
:<math>\sigma^2 \in \left[ \frac{(n-1)s^2}{\chi^2_{n-1,1-\alpha/2}}, | :<math>\sigma^2 \in \left[ \frac{(n-1)s^2}{\chi^2_{n-1,1-\alpha/2}}, | ||
\frac{(n-1)s^2}{\chi^2_{n-1,\alpha/2}} \right],</math> | \frac{(n-1)s^2}{\chi^2_{n-1,\alpha/2}} \right],</math> | ||
जहां | जहां t<sub>k,p</sub>और {{SubSup|χ|''k,p''|2}} क्रमशः t- और χ<sup>2</sup> वितरण की pth मात्राएँ हैं। ये कॉन्फिडेंस इंटरवल [[आत्मविश्वास स्तर|आत्मकॉन्फिडेंस स्तर]] {{nowrap|1 − ''α''}} के होते हैं, जिसका अर्थ है कि ट्रू मान μ और σ<sup>2</sup> प्रायिकता या सार्थकता स्तर α के साथ इन अंतरालों के बाहर आते हैं। इस प्रकार व्यवहार में लोग सामान्यतः {{nowrap|''α'' {{=}} 5%}} लेते हैं, जिसके परिणामस्वरूप 95% कॉन्फिडेंस अंतराल के रूप में होता है। | ||
अनुमानित सूत्र <math style= vertical-align:-.3em >\textstyle\hat\mu</math> और s के असिम्प्टोटिक वितरण से प्राप्त किए जा सकते हैं। | अनुमानित सूत्र <math style= vertical-align:-.3em >\textstyle\hat\mu</math> और s<sup>2</sup> के असिम्प्टोटिक वितरण से प्राप्त किए जा सकते हैं। | ||
:<math>\mu \in | :<math>\mu \in | ||
\left[ \hat\mu - |z_{\alpha/2}|\frac{1}{\sqrt n}s, | \left[ \hat\mu - |z_{\alpha/2}|\frac{1}{\sqrt n}s, | ||
Line 554: | Line 555: | ||
\left[ s^2 - |z_{\alpha/2}|\frac{\sqrt{2}}{\sqrt{n}}s^2, | \left[ s^2 - |z_{\alpha/2}|\frac{\sqrt{2}}{\sqrt{n}}s^2, | ||
s^2 + |z_{\alpha/2}|\frac{\sqrt{2}}{\sqrt{n}}s^2 \right],</math> | s^2 + |z_{\alpha/2}|\frac{\sqrt{2}}{\sqrt{n}}s^2 \right],</math> | ||
अनुमानित सूत्र n के बड़े मानों के लिए मान्य हो जाते हैं | अनुमानित सूत्र n के बड़े मानों के लिए मान्य रूप में हो जाते हैं और और मैन्युअल गणना के लिए अधिक सुविधाजनक होते हैं क्योंकि मानक सामान्य क्वांटाइल्स z<sub>''α''/2</sub> n पर निर्भर नहीं होती हैं। विशेष रूप से सबसे लोकप्रिय मान {{nowrap|''α'' {{=}} 5%}}, का परिणाम {{nowrap|{{!}}''z''<sub>0.025</sub>{{!}} {{=}} [[1.96]]}} के रूप में होता है, | ||
=== | === सामान्य टेस्ट्स === | ||
{{Main| | {{Main|नोर्मेलिटी टेस्ट्स }} | ||
सामान्यता टेस्ट्स इस प्रायिकता का आकलन करते हैं कि दिए गए डेटा समुच्चय {x<sub>1</sub>, ..., x<sub>n</sub>} सामान्य वितरण के रूप में होता है। सामान्यतः शून्य परिकल्पना H<sub>0</sub> यह है कि टेस्ट्स सामान्य रूप से अनिर्दिष्ट माध्य μ और वेरिएंस σ<sup>2</sup> के साथ वितरित किए जाते हैं और इस प्रकार वैकल्पिक H<sub>a</sub> कि वितरण यादृच्छिक है। इस प्रॉब्लम के लिए कई टेस्ट्स 40 से अधिक तैयार किए गए हैं। उनमें से अधिक प्रमुख नीचे उल्लिखित हैं | |||
''मोमेंट -आधारित | 'नैदानिक प्लॉट' अधिक सहज रूप से आकर्षक लेकिन एक ही समय में व्यक्तिपरक होते हैं, क्योंकि वे शून्य परिकल्पना को स्वीकार या अस्वीकार करने के लिए अनौपचारिक मानवीय निर्णय पर भरोसा करते हैं। | ||
* डी'ऑगस्टिनो का | * q -q प्लॉट, जिसे सामान्य प्रायिकता प्लॉट या रैंकिट प्लॉट के रूप में भी जाना जाता है - मानक सामान्य वितरण से संबंधित मात्राओं के अपेक्षित मानों के विरुद्ध डेटा समुच्चय से क्रमबद्ध मानों का एक प्लॉट है और इस प्रकार यह फॉर्म के बिंदु का एक प्लॉट (Φ<sup>-1</sup>(p<sub>k</sub>), x<sub>(''k'')</sub>) है, जहां प्लॉटिंग पॉइंट p<sub>k,</sub> ''p<sub>k</sub>'' = (''k'' − ''α'')/(''n'' + 1 − 2''α'') के बराबर हैं और α एक समायोजन स्थिरांक है, जो 0 और 1 के बीच कुछ भी हो सकता है। यदि शून्य परिकल्पना सत्य है, तो प्लॉट किए गए बिंदुओं को लगभग एक सीधी रेखा पर स्थित होना चाहिए। | ||
* जर्क-बेरा | * p -p प्लॉट - q -q प्लॉट के समान, लेकिन बहुत कम बार उपयोग किया जाता है। इस पद्धति में बिंदुओं की आलेखित करना सम्मलित है (Φ(z<sub>(''k'')</sub>), p <sub>k</sub>), जहाँ <math>\textstyle z_{(k)} = (x_{(k)}-\hat\mu)/\hat\sigma</math>. सामान्य रूप से वितरित डेटा के लिए यह प्लॉट (0, 0) और (1, 1) के बीच 45° रेखा पर स्थित होता है। | ||
* शापिरो-विल्क | |||
''प्रयोगसिद्ध वितरण फलन के आधार पर | ====== फिट टेस्ट की गुडनेस : ====== | ||
* एंडरसन-डार्लिंग | ''मोमेंट -आधारित टेस्ट'' : | ||
* लिलिफ़ोर्स | * डी'ऑगस्टिनो का k-स्क्वेर्ड टेस्ट | ||
* जर्क-बेरा टेस्ट | |||
* शापिरो-विल्क टेस्ट : यह इस तथ्य पर आधारित है कि q -q प्लॉट में रेखा का प्रवणता ''σ'' है। इस प्रकार टेस्ट्स नमूना वेरिएंस के मान के साथ उस प्रवणता के कम से कम वर्गों के अनुमान की तुलना करता है और यदि ये दो मात्राएँ महत्वपूर्ण रूप से भिन्न हैं, तो शून्य परिकल्पना को अस्वीकार कर देता है। | |||
''प्रयोगसिद्ध वितरण फलन के आधार पर टेस्ट'' : | |||
* एंडरसन-डार्लिंग टेस्ट | |||
* लिलिफ़ोर्स टेस्ट्स (कोल्मोगोरोव-स्मिर्नोव टेस्ट्स का एक रूपांतर) | |||
=== सामान्य वितरण का बायेसियन विश्लेषण === | === सामान्य वितरण का बायेसियन विश्लेषण === | ||
सामान्य रूप से वितरित डेटा का बायेसियन विश्लेषण कई भिन्न -भिन्न संभावनाओं | सामान्य रूप से वितरित डेटा का बायेसियन विश्लेषण कई भिन्न -भिन्न संभावनाओं के रूप में सम्मिश्र है जिन पर विचार किया जा सकता है, | ||
* या तो माध्य | * या तो माध्य या प्रसरण या दोनों में से किसी को भी निश्चित क्वांटाइल नहीं माना जा सकता है। | ||
* जब भिन्नता अज्ञात होती है, तो विश्लेषण सीधे भिन्नता के संदर्भ में | * जब भिन्नता अज्ञात होती है, तो विश्लेषण सीधे भिन्नता के संदर्भ में या परिशुद्धता (सांख्यिकी) भिन्नता के पारस्परिक के संदर्भ में किया जा सकता है। सूत्रों को सटीकता के रूप में व्यक्त करने का कारण यह है कि अधिकांश स्थितियो का विश्लेषण सरल रूप में होता है। | ||
* दोनों अविभाज्य और | * दोनों अविभाज्य और बहुभिन्न रूपी सामान्य वितरण स्थितियो पर विचार करने की आवश्यकता है। | ||
* अज्ञात चर पर या तो संयुग्म पूर्व या [[अनुचित पूर्व]] वितरण | * अज्ञात चर पर या तो संयुग्म पूर्व या [[अनुचित पूर्व]] वितरण के रूप में होते है । | ||
* [[बायेसियन रैखिक प्रतिगमन]] में स्थितियो का एक अतिरिक्त | * [[बायेसियन रैखिक प्रतिगमन]] में स्थितियो का एक अतिरिक्त समुच्चय होता है, जहां मूल मॉडल में डेटा को सामान्य रूप से वितरित माना जाता है और सामान्य प्रायर को [[प्रतिगमन गुणांक]] पर रखा जाता है। इस प्रकार परिणामी विश्लेषण स्वतंत्र रूप से वितरित डेटा के मूल स्थितियो के समान है। | ||
गैर-रैखिक-प्रतिगमन स्थितियो के सूत्रों को संयुग्मित पूर्व लेख में संक्षेपित किया गया है। | गैर-रैखिक-प्रतिगमन स्थितियो के सूत्रों को संयुग्मित पूर्व लेख में संक्षेपित किया गया है। | ||
Line 586: | Line 588: | ||
===== अदिश रूप ===== | ===== अदिश रूप ===== | ||
निम्नलिखित सहायक सूत्र [[पश्च वितरण| | निम्नलिखित सहायक सूत्र [[पश्च वितरण|पोस्टीरियर]] वितरण अद्यतन समीकरणों को सरल बनाने के लिए उपयोगी है, जो अन्यथा बहुत कठिन रूप में होते है। | ||
:<math>a(x-y)^2 + b(x-z)^2 = (a + b)\left(x - \frac{ay+bz}{a+b}\right)^2 + \frac{ab}{a+b}(y-z)^2</math> | :<math>a(x-y)^2 + b(x-z)^2 = (a + b)\left(x - \frac{ay+bz}{a+b}\right)^2 + \frac{ab}{a+b}(y-z)^2</math> | ||
यह समीकरण वर्गों का विस्तार करके, x में पदों को समूहित | यह समीकरण वर्गों का विस्तार करके, x में पदों को समूहित करते है और वर्ग को पूरा करके x में दो द्विघातों के योग को फिर से लिखता है। कुछ शर्तों से जुड़े सम्मिश्र निरंतर कारकों के बारे में निम्नलिखित पर ध्यान देते है | ||
# कारण <math>\frac{ay+bz}{a+b}</math> y और z के भारित औसत का रूप है। | # कारण <math>\frac{ay+bz}{a+b}</math> y और z के भारित औसत का रूप है। | ||
# <math>\frac{ab}{a+b} = \frac{1}{\frac{1}{a}+\frac{1}{b}} = (a^{-1} + b^{-1})^{-1}.</math> इससे पता चलता है कि इस कारक को एक ऐसी स्थिति के परिणामस्वरूप माना जा सकता है जहां मात्राओं के गुणक व्युत्क्रम a और b सीधे जुड़ते हैं, इसलिए a और b को संयोजित करने के लिए, परिणाम को फिर से प्राप्त करना, जोड़ना और पुनः प्राप्त करना आवश्यक है। | # <math>\frac{ab}{a+b} = \frac{1}{\frac{1}{a}+\frac{1}{b}} = (a^{-1} + b^{-1})^{-1}.</math> इससे पता चलता है कि इस कारक को एक ऐसी स्थिति के परिणामस्वरूप माना जा सकता है, जहां मात्राओं के गुणक व्युत्क्रम a और b सीधे जुड़ते हैं, इसलिए a और b को संयोजित करने के लिए, परिणाम को फिर से प्राप्त करना, मूल इकाइयाँ को जोड़ना और पुनः प्राप्त करना आवश्यक होता है। यह उसी तरह का ऑपरेशन है जो [[अनुकूल माध्य]] द्वारा किया जाता है, इसलिए यह आश्चर्यजनक नहीं है <math>\frac{ab}{a+b}</math> a और b का वन हाफ हार्मोनिक माध्य है। | ||
===== सदिश रूप ===== | ===== सदिश रूप ===== | ||
दो सदिश चतुष्कोणों के योग के लिए एक समान सूत्र लिखा जा सकता है | दो सदिश चतुष्कोणों के योग के लिए एक समान सूत्र लिखा जा सकता है, यदि x, y, z लंबाई ''k'' के सदिश हैं और A और B सममित आव्यूह के रूप में हैं और आकार के व्युत्क्रमणीय आव्यूह <math>k\times k</math>, तब इस प्रकार हैं, | ||
:<math> | :<math> | ||
Line 605: | Line 607: | ||
:<math>\mathbf{c} = (\mathbf{A} + \mathbf{B})^{-1}(\mathbf{A}\mathbf{y} + \mathbf{B} \mathbf{z}) </math> | :<math>\mathbf{c} = (\mathbf{A} + \mathbf{B})^{-1}(\mathbf{A}\mathbf{y} + \mathbf{B} \mathbf{z}) </math> | ||
ध्यान दें कि रूप x′ A x को द्विघात रूप कहा जाता है और यह एक [[अदिश (गणित)]] है | ध्यान दें कि रूप x′ A x को द्विघात रूप कहा जाता है और यह एक [[अदिश (गणित)]] है | ||
:<math>\mathbf{x}'\mathbf{A}\mathbf{x} = \sum_{i,j}a_{ij} x_i x_j</math> | :<math>\mathbf{x}'\mathbf{A}\mathbf{x} = \sum_{i,j}a_{ij} x_i x_j</math> | ||
दूसरे शब्दों में, यह x से तत्वों के जोड़े के | दूसरे शब्दों में, यह x से तत्वों के जोड़े के गुणन के सभी संभावित संयोजनों को जोड़ता है, प्रत्येक के लिए एक भिन्न गुणांक का सारांश देता इसके अतिरिक्त है, चूंकि <math>x_i x_j = x_j x_i</math>, केवल योग <math>a_{ij} + a_{ji}</math> a के किसी भी ऑफ-डायगोनल तत्वों के लिए मायने रखता है और यह मानने में व्यापकता का कोई नुकसान नहीं है कि a सममित आव्यूह है। इसके अतिरिक्त यदि a सममित है, तो फॉर्म <math>\mathbf{x}'\mathbf{A}\mathbf{y} = \mathbf{y}'\mathbf{A}\mathbf{x}.</math> के रूप में होते है | ||
==== माध्य से भिन्नताओं का योग ==== | ==== माध्य से भिन्नताओं का योग ==== | ||
एक अन्य उपयोगी सूत्र इस प्रकार है: | एक अन्य उपयोगी सूत्र इस प्रकार है: | ||
<math display="block">\sum_{i=1}^n (x_i-\mu)^2 = \sum_{i=1}^n (x_i-\bar{x})^2 + n(\bar{x} -\mu)^2</math> | <math display="block">\sum_{i=1}^n (x_i-\mu)^2 = \sum_{i=1}^n (x_i-\bar{x})^2 + n(\bar{x} -\mu)^2</math> | ||
जहाँ <math display="inline">\bar{x} = \frac{1}{n} \sum_{i=1}^n x_i.</math> | जहाँ <math display="inline">\bar{x} = \frac{1}{n} \sum_{i=1}^n x_i.</math> | ||
=== ज्ञात वेरिएंस के साथ === | === ज्ञात वेरिएंस के साथ === | ||
i.i.d के एक | i.i.d के एक समुच्चय के लिए सामान्य रूप से वितरित डेटा बिंदु X का आकार ''n'' है, जहां प्रत्येक व्यक्तिगत बिंदु ''x'' का अनुसरण करता है इस प्रकार <math>x \sim \mathcal{N}(\mu, \sigma^2)</math> ज्ञात वेरिएंस σ<sup>2</sup> के साथ संयुग्म पूर्व वितरण भी सामान्य रूप से वितरित किया जाता है। | ||
प्रसरण को परिशुद्धता | प्रसरण को परिशुद्धता सांख्यिकी के रूप में फिर से लिखकर, अर्थात τ = 1/σ<sup>2 का उपयोग करके इसे अधिक आसानी से दिखाया जा सकता है। तो यदि <math>x \sim \mathcal{N}(\mu, 1/\tau)</math> और <math>\mu \sim \mathcal{N}(\mu_0, 1/\tau_0),</math> हम निम्नानुसार आगे बढ़ते हैं। | ||
सबसे पहले, प्रायिकता फलन | सबसे पहले, प्रायिकता फलन माध्य से अंतर के योग के लिए उपरोक्त सूत्र का उपयोग करता है | ||
:<math>\begin{align} | :<math>\begin{align} | ||
Line 638: | Line 637: | ||
&\propto \exp\left(-\frac{1}{2}(n\tau + \tau_0)\left(\mu - \dfrac{n\tau \bar{x} + \tau_0\mu_0}{n\tau + \tau_0}\right)^2\right) | &\propto \exp\left(-\frac{1}{2}(n\tau + \tau_0)\left(\mu - \dfrac{n\tau \bar{x} + \tau_0\mu_0}{n\tau + \tau_0}\right)^2\right) | ||
\end{align}</math> | \end{align}</math> | ||
उपरोक्त अवकलज में, हमने दो द्विघातों के योग के लिए उपरोक्त सूत्र का उपयोग किया और μ को सम्मलित न करने वाले सभी स्टेबल कारकों को हटा | उपरोक्त अवकलज में, हमने दो द्विघातों के योग के लिए उपरोक्त सूत्र का उपयोग किया और μ को सम्मलित न करने वाले सभी स्टेबल कारकों को हटा दिया है। परिणाम औसत के साथ सामान्य वितरण का कर्नेल सांख्यिकी <math>\frac{n\tau \bar{x} + \tau_0\mu_0}{n\tau + \tau_0}</math> और सटीकता <math>n\tau + \tau_0</math> है, अर्थात। | ||
:<math>p(\mu\mid\mathbf{X}) \sim \mathcal{N}\left(\frac{n\tau \bar{x} + \tau_0\mu_0}{n\tau + \tau_0}, \frac{1}{n\tau + \tau_0}\right)</math> | :<math>p(\mu\mid\mathbf{X}) \sim \mathcal{N}\left(\frac{n\tau \bar{x} + \tau_0\mu_0}{n\tau + \tau_0}, \frac{1}{n\tau + \tau_0}\right)</math> | ||
इसे पूर्व पैरामीटर के संदर्भ में | इसे पूर्व पैरामीटर के संदर्भ में पोस्टीरियर पैरामीटर के लिए बायेसियन अद्यतन समीकरणों के एक समुच्चय के रूप में लिखा जा सकता है | ||
:<math>\begin{align} | :<math>\begin{align} | ||
Line 648: | Line 647: | ||
\bar{x} &= \frac{1}{n}\sum_{i=1}^n x_i | \bar{x} &= \frac{1}{n}\sum_{i=1}^n x_i | ||
\end{align}</math> | \end{align}</math> | ||
अर्थात nτ की कुल सटीकता के साथ n डेटा बिंदुओं को संयोजित करने के लिए | अर्थात nτ की कुल सटीकता के साथ n डेटा बिंदुओं को संयोजित करने के लिए या समकक्ष, n/σ<sup>2</sup> का कुल प्रसरण और मानों का माध्य <math>\bar{x}</math>, डेटा की कुल सटीकता को पूर्व कुल परिशुद्धता में जोड़कर एक नई कुल सटीकता प्राप्त करता है और एक सटीक-भारित औसत के माध्यम से एक नया माध्य बनाता है, अर्थात डेटा का भारित औसत और पूर्व माध्य का भारित औसत प्रत्येक को संबंधित कुल परिशुद्धता द्वारा भारित किया जाता है। यह तर्कसंगत समझ में आता है यदि सटीकता को टिप्पणियों की निश्चितता के संकेत के रूप में माना जाता है पोस्टीरियर माध्य के वितरण में प्रत्येक इनपुट घटक को इसकी निश्चितता से भारित किया जाता है और इस वितरण की निश्चितता व्यक्तिगत निश्चितताओं का योग है, इसके अंतर्ज्ञान के लिए उस अभिव्यक्ति की तुलना करते है जो संपूर्ण है या उसके भागों के योग से अधिक है। इसके अतिरिक्त , विचार करते है कि पोस्टीरियर का ज्ञान पूर्व और प्रायिकता के ज्ञान के संयोजन से आता है, इसलिए यह समझ में आता है कि हम इसके किसी भी घटक की तुलना में इसके बारे में अधिक निश्चित हैं। | ||
उपरोक्त सूत्र से पता चलता है कि सटीकता के संदर्भ में सामान्य वितरण के लिए संयुग्मित | उपरोक्त सूत्र से पता चलता है कि सटीकता के संदर्भ में सामान्य वितरण के लिए संयुग्मित प्रायर का [[बायेसियन विश्लेषण]] करना अधिक सुविधाजनक होता है। पोस्टीरियर परिशुद्धता केवल पूर्व और प्रायिकता की सटीकता का योग है और पोस्टीरियर माध्य की गणना एक सटीक-भारित औसत के माध्यम से की जाती है, जैसा कि ऊपर वर्णित है। समान सूत्रों को वेरिएंस के रूप में लिखा जा सकता है और इस प्रकार सभी पूर्वसूचकों का आदान-प्रदान करके अधिक अजली सूत्रों को जनरेटिंग किया जा सकता है | ||
:<math>\begin{align} | :<math>\begin{align} | ||
Line 660: | Line 659: | ||
==== ज्ञात माध्य के साथ ==== | ==== ज्ञात माध्य के साथ ==== | ||
i.i.d के एक | i.i.d के एक समुच्चय के लिए सामान्य रूप से वितरित डेटा बिंदु X का आकार ''n'' है जहां प्रत्येक व्यक्तिगत बिंदु ''x'' अनुसरण करता है <math>x \sim \mathcal{N}(\mu, \sigma^2)</math> ज्ञात माध्य μ के साथ, वेरिएंस से पहले के संयुग्म में एक व्युत्क्रम गामा वितरण या एक स्केल्ड व्युत्क्रम ची-वर्ग वितरण होता है। इस प्रकार भिन्न -भिन्न पैरामीटर होने के अतिरिक्त दोनों समान हैं। यद्यपि व्युत्क्रम गामा का अधिक सामान्य रूप से उपयोग किया जाता है, हम सुविधा के लिए स्केल्ड व्युत्क्रम ची-वर्ग का उपयोग करते हैं। σ<sup>2</sup> के लिए प्रायर इस प्रकार है, | ||
:<math>p(\sigma^2\mid\nu_0,\sigma_0^2) = \frac{(\sigma_0^2\frac{\nu_0}{2})^{\nu_0/2}}{\Gamma\left(\frac{\nu_0}{2} \right)}~\frac{\exp\left[ \frac{-\nu_0 \sigma_0^2}{2 \sigma^2}\right]}{(\sigma^2)^{1+\frac{\nu_0}{2}}} \propto \frac{\exp\left[ \frac{-\nu_0 \sigma_0^2}{2 \sigma^2}\right]}{(\sigma^2)^{1+\frac{\nu_0}{2}}}</math> | :<math>p(\sigma^2\mid\nu_0,\sigma_0^2) = \frac{(\sigma_0^2\frac{\nu_0}{2})^{\nu_0/2}}{\Gamma\left(\frac{\nu_0}{2} \right)}~\frac{\exp\left[ \frac{-\nu_0 \sigma_0^2}{2 \sigma^2}\right]}{(\sigma^2)^{1+\frac{\nu_0}{2}}} \propto \frac{\exp\left[ \frac{-\nu_0 \sigma_0^2}{2 \sigma^2}\right]}{(\sigma^2)^{1+\frac{\nu_0}{2}}}</math> | ||
उपरोक्त प्रायिकता फलन वेरिएंस के संदर्भ में लिखा गया है: | |||
:<math>\begin{align} | :<math>\begin{align} | ||
Line 680: | Line 679: | ||
&= \frac{1}{(\sigma^2)^{1+\frac{\nu_0+n}{2}}} \exp\left[-\frac{\nu_0 \sigma_0^2 + S}{2\sigma^2}\right] | &= \frac{1}{(\sigma^2)^{1+\frac{\nu_0+n}{2}}} \exp\left[-\frac{\nu_0 \sigma_0^2 + S}{2\sigma^2}\right] | ||
\end{align}</math> | \end{align}</math> | ||
उपरोक्त एक स्केल्ड इनवर्स ची-स्क्वेर्ड वितरण है जहाँ | |||
:<math>\begin{align} | :<math>\begin{align} | ||
Line 692: | Line 691: | ||
{\sigma_0^2}' &= \frac{\nu_0 \sigma_0^2 + \sum_{i=1}^n (x_i-\mu)^2}{\nu_0+n} | {\sigma_0^2}' &= \frac{\nu_0 \sigma_0^2 + \sum_{i=1}^n (x_i-\mu)^2}{\nu_0+n} | ||
\end{align}</math> | \end{align}</math> | ||
व्युत्क्रम गामा वितरण के संदर्भ में पुनर्मान | व्युत्क्रम गामा वितरण के संदर्भ में पुनर्मान के रूप में अंकन परिणाम है: | ||
:<math>\begin{align} | :<math>\begin{align} | ||
Line 701: | Line 700: | ||
==== अज्ञात माध्य और अज्ञात वेरिएंस के साथ ==== | ==== अज्ञात माध्य और अज्ञात वेरिएंस के साथ ==== | ||
i.i.d के एक | i.i.d के एक समुच्चय के लिए सामान्य रूप से वितरित डेटा बिंदु X का आकार ''n'' है जहां प्रत्येक व्यक्तिगत बिंदु ''x'' अनुसरण करता है <math>x \sim \mathcal{N}(\mu, \sigma^2)</math> इस प्रकार अज्ञात माध्य μ और अज्ञात वेरिएंस σ<sup>2</sup> के साथ एक संयुक्त बहुभिन्नरूपी संयुग्म पूर्व को माध्य और वेरिएंस पर रखा जाता है, जिसमें [[सामान्य-उलटा-गामा वितरण|सामान्य- व्युत्क्रम -गामा]] वितरण के रूप में सम्मलित है। तर्कसंगत रूप से, यह निम्नानुसार उत्पन्न होता है, | ||
# अज्ञात माध्य लेकिन ज्ञात वेरिएंस वाले स्थितियो के विश्लेषण से, हम देखते हैं कि अद्यतन समीकरणों में डेटा से गणना किए गए पर्याप्त आँकड़े के रूप में सम्मलित होते हैं, जिसमें डेटा बिंदुओं का माध्य और डेटा बिंदुओं की संख्या से विभाजित ज्ञात विचरण से बदले में गणना किए गए डेटा बिंदुओं का कुल विचरण सम्मलित होता है। | |||
# अज्ञात माध्य लेकिन ज्ञात वेरिएंस वाले स्थितियो के विश्लेषण से, हम देखते हैं कि अद्यतन समीकरणों में | # अज्ञात वेरिएंस लेकिन ज्ञात माध्य वाले स्थितियो के विश्लेषण से, हम देखते हैं कि अद्यतन समीकरणों में डेटा बिंदुओं की संख्या और अज्ञात विचलन के योग वाले डेटा पर पर्याप्त आँकड़े सम्मलित हैं। | ||
# अज्ञात वेरिएंस लेकिन ज्ञात माध्य वाले स्थितियो के विश्लेषण से, हम देखते हैं कि अद्यतन समीकरणों में डेटा बिंदुओं की संख्या और | # ध्यान रखें कि जब आगे के डेटा को हैंडल किया जाता है तो पोस्टीरियर अद्यतन मान पूर्व वितरण के रूप में फलन करता है। इस प्रकार, हमें तर्कसंगत रूप से अपने पूर्ववर्तियों के बारे में पर्याप्त आंकड़ों के संदर्भ में जितना संभव हो उतना समान शब्दार्थों को ध्यान में रखते हुए सोचना चाहिए। | ||
# ध्यान रखें कि जब आगे के डेटा को हैंडल किया जाता है तो | # उस स्थितियो को संभालने के लिए जहां माध्य और वेरिएंस दोनों अज्ञात हैं, हम माध्य और वेरिएंस पर स्वतंत्र प्राथमिकताओ के रूप में रख सकते हैं, इस प्रकार औसत माध्य के निश्चित अनुमानों के साथ, कुल वेरिएंस पूर्व में वेरिएंस की गणना करने के लिए उपयोग किए जाने वाले डेटा बिंदुओं की संख्या और अज्ञात का योग विचलन करते है। चूंकि ध्यान दें कि वास्तव में, माध्य का कुल वेरिएंस अज्ञात वेरिएंस पर निर्भर करता है और अज्ञात विचलन का योग जो वेरिएंस के रूप में अज्ञात माध्य पर निर्भर करता है। इस प्रकार व्यवहार में, बाद की निर्भरता अपेक्षाकृत महत्वहीन रूप में होती है, वास्तविक माध्य को स्थानांतरित करने से उत्पन्न अंक एक समान राशि से बदल जाते हैं और औसतन अज्ञात विचलन समान रहता है। चूंकि, माध्य के कुल वेरिएंस के साथ ऐसा नहीं होता है, जैसे ही अज्ञात वेरिएंस बढ़ता है, माध्य का कुल वेरिएंस आनुपातिक रूप से बढ़ जाता है और हम इस निर्भरता को पकड़ना चाहते हैं। | ||
# उस स्थितियो को संभालने के लिए जहां माध्य और वेरिएंस दोनों अज्ञात हैं, हम माध्य और वेरिएंस पर स्वतंत्र | # इससे पता चलता है कि हम अज्ञात वेरिएंस पर माध्य से पहले एक सशर्त बनाते हैं, जिसमें एक हाइपरपैरामीटर पूर्व से जुड़े प्सयूडो -अवलोकन के माध्य को निर्दिष्ट करता है और एक अन्य पैरामीटर प्सयूडो टिप्पणियों की संख्या को निर्दिष्ट करता है। यह संख्या भिन्नता पर स्केलिंग पैरामीटर के रूप में फलन करती है, जिससे वास्तविक भिन्नता पैरामीटर के सापेक्ष माध्य के समग्र भिन्नता को नियंत्रित करना संभव हो जाता है। वेरिएंस के पूर्व में भी दो हाइपरपरमेटर्स होते हैं, एक पूर्व से जुड़े प्सयूडो -अवलोकनों के वर्ग विचलन के योग को निर्दिष्ट करता है और दूसरा एक बार फिर से प्सयूडो -टिप्पणियों की संख्या को निर्दिष्ट करता है। ध्यान दें कि प्रत्येक पूर्व में प्सयूडो -अवलोकन की संख्या निर्दिष्ट करने वाला एक हाइपरपैरामीटर होता है और प्रत्येक स्थितियो में यह उस पूर्व के सापेक्ष भिन्नता को नियंत्रित करता है। इन्हें दो भिन्न -भिन्न हाइपरपैरामीटर के रूप में दिखाया जाता है जिससे की दो प्रायर के प्रसरण को भिन्न -भिन्न विधियों को नियंत्रित किया जा सके। | ||
# इससे पता चलता है कि हम अज्ञात वेरिएंस पर माध्य से पहले एक सशर्त बनाते हैं, जिसमें एक हाइपरपैरामीटर पूर्व से जुड़े | # यह तुरंत सामान्य- व्युत्क्रम -गामा वितरण की ओर ले जाता है, जो अभी-अभी परिभाषित दो वितरण का गुणन है, जिसमें संयुग्मित प्रायर का उपयोग किया जाता है, वेरिएंस पर एक व्युत्क्रम गामा वितरण और माध्य पर एक सामान्य वितरण वेरिएंस पर सशर्त के रूप में होता है और उन्हीं चार पैरामीटर के साथ अभी-अभी परिभाषित किया जाता है। | ||
# यह तुरंत सामान्य- | |||
प्राथमिकताओं को सामान्य रूप से निम्नानुसार परिभाषित किया | प्राथमिकताओं को सामान्य रूप से निम्नानुसार परिभाषित किया जाता है | ||
:<math>\begin{align} | :<math>\begin{align} | ||
Line 716: | Line 714: | ||
p(\sigma^2; \nu_0,\sigma_0^2) &\sim I\chi^2(\nu_0,\sigma_0^2) = IG(\nu_0/2, \nu_0\sigma_0^2/2) | p(\sigma^2; \nu_0,\sigma_0^2) &\sim I\chi^2(\nu_0,\sigma_0^2) = IG(\nu_0/2, \nu_0\sigma_0^2/2) | ||
\end{align}</math> | \end{align}</math> | ||
अद्यतन समीकरण इस प्रकार प्राप्त किए जा सकते हैं और निम्नानुसार दिखाया जाता है | |||
अद्यतन समीकरण प्राप्त किए जा सकते हैं | |||
:<math>\begin{align} | :<math>\begin{align} | ||
Line 728: | Line 724: | ||
\nu_0'{\sigma_0^2}' &= \nu_0 \sigma_0^2 + \sum_{i=1}^n (x_i-\bar{x})^2 + \frac{n_0 n}{n_0 + n}(\mu_0 - \bar{x})^2 | \nu_0'{\sigma_0^2}' &= \nu_0 \sigma_0^2 + \sum_{i=1}^n (x_i-\bar{x})^2 + \frac{n_0 n}{n_0 + n}(\mu_0 - \bar{x})^2 | ||
\end{align}</math> | \end{align}</math> | ||
प्सयूडो टेस्ट्स की संबंधित संख्या वास्तविक टेस्ट्स की संख्या को उनके साथ जोड़ती है। नया माध्य हाइपरपैरामीटर एक बार फिर भारित औसत के रूप में होता है, इस बार अवलोकनों की सापेक्ष संख्या द्वारा भारित किया गया है। इस प्रकार अंत में <math>\nu_0'{\sigma_0^2}'</math> के लिए अद्यतन ज्ञात माध्य की स्थितियो के समान है, लेकिन इस स्थितियो में वर्ग विचलन का योग सही माध्य के अतिरिक्त देखे गए डेटा माध्य के संबंध में लिया जाता है और परिणामस्वरूप एक नई अंतःक्रिया शब्द की आवश्यकता होती है इस प्रकार पूर्व और डेटा माध्य के बीच विचलन से उत्पन्न अतिरिक्त त्रुटि स्रोत का ध्यान रखने के लिए जोड़ा जाता है। | |||
{{math proof | proof = | {{math proof | proof = | ||
The prior distributions are | The prior distributions are | ||
:<math>\begin{align} | :<math>\begin{align} | ||
p(\mu\mid\sigma^2; \mu_0, n_0) &\sim \mathcal{N}(\mu_0,\sigma^2/n_0) = \frac{1}{\sqrt{2\pi\frac{\sigma^2}{n_0}}} \exp\ | p(\mu\mid\sigma^2; \mu_0, n_0) &\sim \mathcal{N}(\mu_0,\sigma^2/n_0) = \frac{1}{\sqrt{2\pi\frac{\sigma^2}{n_0}}} \exp\left(-\frac{n_0}{2\sigma^2}(\mu-\mu_0)^2\right) \\ | ||
&\propto (\sigma^2)^{-1/2} \exp\ | &\propto (\sigma^2)^{-1/2} \exp\left(-\frac{n_0}{2\sigma^2}(\mu-\mu_0)^2\right) \\ | ||
p(\sigma^2; \nu_0,\sigma_0^2) &\sim I\chi^2(\nu_0,\sigma_0^2) = IG(\nu_0/2, \nu_0\sigma_0^2/2) \ \ | p(\sigma^2; \nu_0,\sigma_0^2) &\sim I\chi^2(\nu_0,\sigma_0^2) = IG(\nu_0/2, \nu_0\sigma_0^2/2) \\ | ||
&= \frac{(\sigma_0^2\nu_0/2)^{\nu_0/2}}{\Gamma(\nu_0/2)}~\frac{\exp\left[ \frac{-\nu_0 \sigma_0 ^2}{2 \sigma^2}\right]}{(\sigma^2)^{1+\nu_0/2}} \\ | &= \frac{(\sigma_0^2\nu_0/2)^{\nu_0/2}}{\Gamma(\nu_0/2)}~\frac{\exp\left[ \frac{-\nu_0 \sigma_0^2}{2 \sigma^2}\right]}{(\sigma^2)^{1+\nu_0/2}} \\ | ||
&\propto {(\sigma^2)^{-(1+\nu_0/2)}} \exp\ | &\propto {(\sigma^2)^{-(1+\nu_0/2)}} \exp\left[ \frac{-\nu_0 \sigma_0^2}{2 \sigma^2}\right]. | ||
\end{ | \end{align}</math> | ||
Therefore, the joint prior is | |||
: | :<math>\begin{align} | ||
p(\mu,\sigma^2; \mu_0, n_0, \nu_0,\sigma_0^2) &= p(\mu\mid\sigma^2; \mu_0, n_0)\,p(\sigma^2; \nu_0,\sigma_0^2) \\ | p(\mu,\sigma^2; \mu_0, n_0, \nu_0,\sigma_0^2) &= p(\mu\mid\sigma^2; \mu_0, n_0)\,p(\sigma^2; \nu_0,\sigma_0^2) \\ | ||
&\propto (\sigma^2)^{-(\nu_0+3)/2} \exp\ | &\propto (\sigma^2)^{-(\nu_0+3)/2} \exp\left[-\frac 1 {2\sigma^2}\left(\nu_0\sigma_0^2 + n_0(\mu-\mu_0)^2\right)\right]. | ||
\end{ | \end{align}</math> | ||
The [[likelihood function]] from the section above with known variance is: | |||
: | :<math>\begin{align} | ||
p(\mathbf{X}\mid\mu,\sigma^2) &= \left(\frac{1}{2\pi\sigma^2}\right)^{n/2} \exp\left[-\frac{1}{2\sigma^2} \left(\sum_{i=1}^n(x_i -\mu)^2\right)\right] | |||
p(\mathbf{X}\mid\mu,\sigma^2) &= \ | \end{align}</math> | ||
\end{ | |||
Writing it in terms of variance rather than precision, we get: | |||
: | :<math>\begin{align} | ||
p(\mathbf{X}\mid\mu,\sigma^2) &= \left(\frac{1}{2\pi\sigma^2}\right)^{n/2} \exp\left[-\frac{1}{2\sigma^2} \left(\sum_{i=1}^n(x_i-\bar{x})^2 + n(\bar{x} -\mu)^2\right)\right] \\ | |||
p(\mathbf{X}\mid\mu,\sigma^2) &= \ | &\propto {\sigma^2}^{-n/2} \exp\left[-\frac{1}{2\sigma^2} \left(S + n(\bar{x} -\mu)^2\right)\right] | ||
&\propto {\sigma^2}^{-n/2} \exp\ | \end{align}</math> | ||
\end{ | where <math display="inline">S = \sum_{i=1}^n(x_i-\bar{x})^2.</math> | ||
Therefore, the posterior is (dropping the hyperparameters as conditioning factors): | |||
: | :<math>\begin{align} | ||
p(\mu,\sigma^2\mid\mathbf{X}) & \propto p(\mu,\sigma^2) \, p(\mathbf{X}\mid\mu,\sigma^2) \\ | |||
p(\mu,\sigma^2\mid\mathbf{X}) | & \propto (\sigma^2)^{-(\nu_0+3)/2} \exp\left[-\frac{1}{2\sigma^2}\left(\nu_0\sigma_0^2 + n_0(\mu-\mu_0)^2\right)\right] {\sigma^2}^{-n/2} \exp\left[-\frac{1}{2\sigma^2} \left(S + n(\bar{x} -\mu)^2\right)\right] \\ | ||
& \propto (\sigma^2)^{-(\nu_0+3)/2} \exp\ | &= (\sigma^2)^{-(\nu_0+n+3)/2} \exp\left[-\frac{1}{2\sigma^2}\left(\nu_0\sigma_0^2 + S + n_0(\mu-\mu_0)^2 + n(\bar{x} -\mu)^2\right)\right] \\ | ||
&= (\sigma^2)^{-(\nu_0+n+3)/2} \exp\ | &= (\sigma^2)^{-(\nu_0+n+3)/2} \exp\left[-\frac{1}{2\sigma^2}\left(\nu_0\sigma_0^2 + S + \frac{n_0 n}{n_0+n}(\mu_0-\bar{x})^2 + (n_0+n)\left(\mu-\frac{n_0\mu_0 + n\bar{x}}{n_0 + n}\right)^2\right)\right] \\ | ||
&= (\sigma^2)^{-(\nu_0+n+3)/2} \exp\ | & \propto (\sigma^2)^{-1/2} \exp\left[-\frac{n_0+n}{2\sigma^2}\left(\mu-\frac{n_0\mu_0 + n\bar{x}}{n_0 + n}\right)^2\right] \\ | ||
& \propto (\sigma^2)^{-1/2} \exp\ | & \quad\times (\sigma^2)^{-(\nu_0/2+n/2+1)} \exp\left[-\frac{1}{2\sigma^2}\left(\nu_0\sigma_0^2 + S + \frac{n_0 n}{n_0+n}(\mu_0-\bar{x})^2\right)\right] \\ | ||
& \quad\times (\sigma^2)^{-(\nu_0/2+n/2+1)} \exp\ | & = \mathcal{N}_{\mu\mid\sigma^2}\left(\frac{n_0\mu_0 + n\bar{x}}{n_0 + n}, \frac{\sigma^2}{n_0+n}\right) \cdot {\rm IG}_{\sigma^2}\left(\frac12(\nu_0+n), \frac12\left(\nu_0\sigma_0^2 + S + \frac{n_0 n}{n_0+n}(\mu_0-\bar{x})^2\right)\right). | ||
& = \mathcal{N}_{\mu\mid\sigma^2}\left(\frac{n_0\mu_0 + n\bar{x}}{n_0 + n}, \frac{\sigma^2}{ n_0+n}\ | \end{align}</math> | ||
\end{ | |||
In other words, the posterior distribution has the form of a product of a normal distribution over <math display="inline">p(\mu|\sigma^2)</math> times an inverse gamma distribution over <math display="inline">p(\sigma^2)</math>, with parameters that are the same as the update equations above. | |||
}} | }} | ||
== घटना और अनुप्रयोग == | == घटना और अनुप्रयोग == | ||
व्यावहारिक समस्याओं में सामान्य वितरण की घटना को | व्यावहारिक समस्याओं में सामान्य वितरण की घटना को सामान्यतः रूप से चार श्रेणियों में वर्गीकृत किया जा सकता है | ||
# बिल्कुल सामान्य | # बिल्कुल सामान्य वितरण ; | ||
# लगभग सामान्य | # लगभग सामान्य नियम, उदाहरण के लिए जब इस तरह के सन्निकटन को केंद्रीय सीमा प्रमेय द्वारा उचित ठहराया जाता है | ||
# वितरण सामान्य के रूप में तैयार किया गया | # वितरण सामान्य के रूप में तैयार किया गया सामान्य वितरण किसी दिए गए माध्य और वेरिएंस के लिए अधिकतम एन्ट्रापी के सिद्धांत के साथ वितरण है। | ||
# प्रतिगमन समस्याएं - व्यवस्थित | # प्रतिगमन समस्याएं - व्यवस्थित अभिव्यक्ति के बाद पाए जाने वाले सामान्य वितरण को पर्याप्त रूप से अच्छी तरह से प्रतिरूपित किया जाता है। | ||
=== यथार्थ नोर्मेलिटी === | |||
[[File:QHarmonicOscillator.png|thumb|[[क्वांटम हार्मोनिक ऑसिलेटर]] की मूलअवस्था में गॉसियन वितरण होता है।]]भौतिकी में कुछ मात्राएँ सामान्य रूप से वितरित की जाती हैं, जैसा कि पहले [[जेम्स क्लर्क मैक्सवेल]] द्वारा प्रदर्शित किया गया था। ऐसी मात्राओं के उदाहरण इस प्रकार हैं, | |||
* एक क्वांटम हार्मोनिक ऑसिलेटर में मूल अवस्था का प्रायिकता घनत्व फलन प्रदर्शित किया गया है। | |||
* एक कण की स्थिति जो विसरण का अनुभव करती है। यदि प्रारंभ में कण एक विशिष्ट बिंदु पर स्थित है अर्थात इसका प्रायिकता वितरण [[डिराक डेल्टा समारोह|डिराक डेल्टा फलन]] है, तो समय t के बाद इसका स्थान वेरिएंस t के साथ एक सामान्य वितरण द्वारा वर्णित किया गया है, जो [[प्रसार]] समीकरण को <math>\frac{\partial}{\partial t} f(x,t) = \frac{1}{2} \frac{\partial^2}{\partial x^2} f(x,t)</math>.इस प्रकार संतुष्ट करता है, यदि प्रारंभिक स्थान एक निश्चित घनत्व फलन <math>g(x)</math> द्वारा दिया गया है, फिर समय t पर घनत्व g(x) और सामान्य Pdf का कनवल्शन है। | |||
=== | === अनुमानित नोर्मेलिटी === | ||
लगभग सामान्य वितरण कई स्थितियों में होते हैं, जैसा कि केंद्रीय सीमा प्रमेय द्वारा समझाया गया है। जब परिणाम कई छोटे अभिव्यक्ति से जोड़कर और स्वतंत्र रूप से फलन करता है, तो इसका वितरण सामान्य के निकटतम होता है । सामान्य सन्निकटन मान्य नहीं होता है यदि अभिव्यक्ति गुणात्मक रूप से फलन करते हैं योगात्मक के अतिरिक्त यदि कोई बाहरी अभिव्यक्ति है, जो बाकी अभिव्यक्ति की तुलना में बहुत बड़ा परिमाण प्रदान करते है। | |||
* गिनती की समस्याओं में, जहां केंद्रीय सीमा प्रमेय में असतत-से-निरंतर सन्निकटन के रूप में सम्मलित है और जहां [[अनंत विभाज्यता]] और अविघटनीय वितरण सम्मलित हैं, जैसे | |||
* | ** द्विपद यादृच्छिक चर, द्विआधारी प्रतिक्रिया चर के साथ जुड़े होते है | ||
** पॉसन वितरण , दुर्लभ घटनाओं से जुड़े होते है | |||
* ऊष्मीय विकिरण में बोस-आइंस्टीन आँकड़े हैं, बोस-आइंस्टीन वितरण बहुत कम समय के पैमाने पर और केंद्रीय सीमा प्रमेय के कारण लंबे समय के पैमाने पर एक सामान्य वितरण के रूप में होते है। | |||
=== अनुमानित | === अनुमानित नोर्मेलिटी === | ||
[[File:Fisher iris versicolor sepalwidth.svg|thumb|right|फिशर के [[आइरिस फूल डेटा सेट|आइरिस फूल डेटा समुच्चय]] से आइरिस वर्सीकलर के लिए सीमोमेंट चौड़ाई का हिस्टोग्राम, सुपरइम्पोज़्ड बेस्ट-फिटिंग नॉर्मल वितरण के साथ।]] | |||
{{Blockquote|इसे केवल सामान्य वक्र की घटनाओं को ही बड़ी असामान्य घटना के रूप में पहचान सकता हूं। इस कारण कुछ वितरणों में इसे अंदाजन लगभग अनुमानित किया गया है और इसकी सुंदर सादगी के कारण शायद हम इसे किसी सैद्धांतिक जांच के पहले सन्निकटन के रूप में प्रयुक्त कर सकते हैं।|{{harvtxt |Pearson |1901 }}}} | |||
प्रयोगसिद्ध रूप से उस धारणा का टेस्ट्स करने के लिए सांख्यिकीय विधि हैं; उपरोक्त सामान्यता टेस्ट्स अनुभाग देखें। | |||
* जीव विज्ञान में, विभिन्न चरों के लघुगणक में एक सामान्य वितरण होता है, अर्थात उदाहरण सहित पुरुष/महिला उप-जनसंख्या पर पृथक्करण के बाद उनका एक लॉग सामान्य वितरण होता है: | |||
** जीवित ऊतक के आकार की माप लंबाई, ऊंचाई, त्वचा क्षेत्र, वजन इस श्रेणी में आती है;<ref>{{harvtxt |Huxley |1932 }}</ref> | |||
प्रयोगसिद्ध रूप से उस धारणा का | **जैविक नमूनों के अक्रिय उपांगों के बाल, पंजे, नाखून, दांतों की लंबाई, वृद्धि की दिशा में संभवतः पेड़ की छाल की मोटाई भी इसी श्रेणी में आती है | ||
* जीव विज्ञान में, विभिन्न चरों के लघुगणक | ** कुछ शारीरिक माप, जैसे वयस्क मनुष्यों का रक्तचाप इस श्रेणी में आती है। | ||
** जीवित ऊतक के आकार | * वित्त में, विशेष रूप से ब्लैक-स्कोल्स मॉडल, विनिमय दरों, मान सूचकांकों और शेयर बाजार सूचकांकों के लघुगणक में परिवर्तन को सामान्य माना जाता है, ये चर [[चक्रवृद्धि ब्याज]] की तरह व्यवहार करते हैं, साधारण ब्याज की तरह नहीं और इसलिए गुणक के रूप में होते है। [[बेनोइट मंडेलब्रॉट]] जैसे कुछ गणितज्ञों ने तर्क दिया है कि [[लॉग-लेवी]] वितरण जिसमें [[भारी पूंछ|भारी टेल्ड]] होती है और इस प्रकार विशेष रूप से स्टॉक मार्केट क्रैश के विश्लेषण के लिए अधिक उपयुक्त मॉडल होता है। [[नसीम निकोलस तालेब]] ने अपने फलन में वित्तीय मॉडल में होने वाले सामान्य वितरण की धारणा के उपयोग की भी आलोचना की है। | ||
** | |||
** कुछ शारीरिक माप, जैसे वयस्क मनुष्यों का | |||
* वित्त में, विशेष रूप से ब्लैक-स्कोल्स मॉडल, विनिमय दरों, मान सूचकांकों और शेयर बाजार सूचकांकों के लघुगणक में परिवर्तन को सामान्य माना जाता है | |||
* भौतिक प्रयोगों में अनिश्चितता का प्रसार अधिकांशतः सामान्य वितरण द्वारा प्रतिरूपित किया जाता है। सामान्य वितरण के इस प्रयोग का अर्थ यह नहीं है कि कोई यह मान रहा है कि माप त्रुटियां सामान्य रूप से वितरित की जाती हैं, बल्कि सामान्य वितरण का उपयोग करने से त्रुटियों के माध्य और वेरिएंस के बारे में केवल ज्ञान दिया जा सकता है।<ref>{{cite book|last=Jaynes|first=Edwin T.|year=2003|title=Probability Theory: The Logic of Science|publisher=Cambridge University Press|pages=592–593|url=https://books.google.com/books?id=tTN4HuUNXjgC&pg=PA592|isbn=9780521592710}}</ref> | * भौतिक प्रयोगों में अनिश्चितता का प्रसार अधिकांशतः सामान्य वितरण द्वारा प्रतिरूपित किया जाता है। सामान्य वितरण के इस प्रयोग का अर्थ यह नहीं है कि कोई यह मान रहा है कि माप त्रुटियां सामान्य रूप से वितरित की जाती हैं, बल्कि सामान्य वितरण का उपयोग करने से त्रुटियों के माध्य और वेरिएंस के बारे में केवल ज्ञान दिया जा सकता है।<ref>{{cite book|last=Jaynes|first=Edwin T.|year=2003|title=Probability Theory: The Logic of Science|publisher=Cambridge University Press|pages=592–593|url=https://books.google.com/books?id=tTN4HuUNXjgC&pg=PA592|isbn=9780521592710}}</ref> | ||
* [[मानकीकृत परीक्षण (सांख्यिकी)|मानकीकृत | * [[मानकीकृत परीक्षण (सांख्यिकी)|मानकीकृत टेस्ट्स (सांख्यिकी)]] में, परिणामों को या तो प्रश्नों की संख्या और कठिनाई इंटेलिजेंस भागफल के रूप में चयन करके या सामान्य वितरण में फिट करके कच्चे टेस्ट्स स्कोर को आउटपुट स्कोर में बदलकर सामान्य वितरण किया जा सकता है। उदाहरण के लिए, [[SAT]] की 200-800 की पारंपरिक सीमा 500 के माध्य और 100 के मानक विचलन के साथ एक सामान्य वितरण पर आधारित है। | ||
* कई अंक सामान्य वितरण से प्राप्त होते हैं, जिनमें प्रतिशतक रैंक (प्रतिशत या मात्रा), [[सामान्य वक्र समकक्ष]], स्टैनिन, मानक स्कोर, जेड-स्कोर और t-स्कोर के रूप में सम्मलित हैं। इसके अतिरिक्त, कुछ व्यवहारिक सांख्यिकीय प्रक्रियाएं मानती हैं कि स्कोर सामान्य रूप से वितरित किए जाते हैं; उदाहरण के लिए, विद्यार्थी का t-टेस्ट्स और प्रसरण का विश्लेषण [[बेल वक्र ग्रेडिंग]] स्कोर के सामान्य वितरण के आधार पर संबंधित ग्रेड प्रदान करती है। | |||
* [[जल विज्ञान]] में लंबी अवधि के नदी प्रवाह या वर्षा का वितरण मासिक और वार्षिक योग, केंद्रीय सीमा प्रमेय के अनुसार अधिकांशतः व्यावहारिक रूप से सामान्य माना जाता है।<ref>{{cite book|last=Oosterbaan|first=Roland J. | editor-last=Ritzema |editor-first=Henk P.|chapter=Chapter 6: Frequency and Regression Analysis of Hydrologic Data|year=1994 | edition=second revised|title=Drainage Principles and Applications, Publication 16|publisher=International Institute for Land Reclamation and Improvement (ILRI)|location=Wageningen, The Netherlands|pages=175–224|chapter-url=http://www.waterlog.info/pdf/freqtxt.pdf|isbn=978-90-70754-33-4}}</ref> [[कमफ़्रीक]] के साथ बनाई गई नीली तस्वीर, द्विपद वितरण के आधार पर 90% [[आत्मविश्वास बेल्ट]] दिखाते हुए अक्टूबर की बारिश के लिए सामान्य वितरण को फिट करने का एक उदाहरण दिखाती है। संचयी बारंबारता विश्लेषण के भाग के रूप में वर्षा के आंकड़ों को [[साजिश रचने की स्थिति|प्लॉटिंग स्थितियों]] द्वारा दर्शाया जाता है। | |||
== | === पद्धति संबंधी समस्याएं और पीयर रिव्यू === | ||
जॉन आयोनिडिस का तर्क है कि सामान्य रूप से वितरित मानक विचलन का उपयोग अनुसंधान निष्कर्षों को मान्य करने के लिए मानकों के रूप में उन घटनाओं के बारे में मिथ्यात्व छोड़ देता है, जो सामान्य रूप से वितरित नहीं होते हैं। इसमें सम्मलित हैं उदाहरण के लिए, ऐसी घटनाएँ जो केवल तब प्रकट होती हैं जब सभी आवश्यक शर्तें उपस्थित होती हैं और एक दूसरे के लिए एक अतिरिक्त विधि से और ऐसी घटनाओं का विकल्प नहीं हो सकता है जो यादृच्छिक रूप से वितरित नहीं होती हैं। जॉन आयोनिडिस का तर्क है कि मानक विचलन-केंद्रित सत्यापन परिकल्पनाओं और सिद्धांतों को वैधता का एक झूठा रूप देता है जहां कुछ लेकिन सभी गलत भविष्यवाणियां सामान्य रूप से वितरित नहीं की जाती हैं क्योंकि गलत अनुमानों के भाग के बाद से सबूत हो सकता है और कुछ स्थितियो में गैर-सामान्य रूप से हो सकता है [[मिथ्याकरण]] भविष्यवाणियों की श्रेणी के वितरित भाग के निराधार रूप से उन परिकल्पनाओं को अस्वीकार कर देती है, जिनके लिए कोई भी मिथ्यापूर्ण भविष्यवाणियां सामान्य रूप से वितरित नहीं की जाती हैं जैसे कि वे असत्य थीं जब वास्तव में वे मिथ्यावाचक भविष्यवाणियां करती हैं। आयोनिडिस द्वारा यह तर्क दिया जाता है कि अनुसंधान पत्रिकाओं द्वारा मान्यता प्राप्त पारस्परिक रूप से अनन्य सिद्धांतों के कई स्थितियो गैर-सामान्य रूप से वितरित भविष्यवाणियों के प्रयोगसिद्ध मिथ्याकरण में पत्रिकाओं की विफलता के कारण होते हैं और इसलिए नहीं कि पारस्परिक रूप से अनन्य सिद्धांत सत्य हैं, जो वे नहीं कर सकते है, चूंकि दो परस्पर अनन्य सिद्धांत दोनों गलत हो सकते हैं और तीसरा सही हो सकता है।<ref>Why Most Published Research Findings Are False, John P. A. Ioannidis, 2005</ref> | |||
== अभिकलनी विधियाँ == | |||
=== सामान्य वितरण से मान | === सामान्य वितरण से मान निकालना === | ||
[[File:Planche de Galton.jpg|thumb|250px|right|[[बीन मशीन]], [[फ्रांसिस गैल्टन]] द्वारा आविष्कृत एक उपकरण, को सामान्य यादृच्छिक चर का पहला जनरेटर कहा जा सकता है। इस मशीन में पिनों की इंटरलीव्ड पंक्तियों के साथ एक वर्टिकल बोर्ड होता है। छोटी गेंदों को ऊपर से गिराया जाता है और फिर पिनों से टकराते ही बेतरतीब ढंग से बाएँ या दाएँ उछलते हैं। गेंदों को नीचे डिब्बे में एकत्र किया जाता है और गॉसियन वक्र के समान पैटर्न में व्यवस्थित किया जाता है।]]कंप्यूटर सिमुलेशन में, विशेष रूप से मोंटे-कार्लो पद्धति के अनुप्रयोगों में, सामान्य रूप से वितरित मानों को उत्पन्न करना अधिकांशतः वांछनीय होता है। नीचे सूचीबद्ध सभी | [[File:Planche de Galton.jpg|thumb|250px|right|[[बीन मशीन]], [[फ्रांसिस गैल्टन]] द्वारा आविष्कृत एक उपकरण, को सामान्य यादृच्छिक चर का पहला जनरेटर कहा जा सकता है। इस मशीन में पिनों की इंटरलीव्ड पंक्तियों के साथ एक वर्टिकल बोर्ड होता है। छोटी गेंदों को ऊपर से गिराया जाता है और फिर पिनों से टकराते ही बेतरतीब ढंग से बाएँ या दाएँ उछलते हैं। गेंदों को नीचे डिब्बे में एकत्र किया जाता है और गॉसियन वक्र के समान पैटर्न में व्यवस्थित किया जाता है।]]कंप्यूटर सिमुलेशन में, विशेष रूप से मोंटे-कार्लो पद्धति के अनुप्रयोगों में, सामान्य रूप से वितरित मानों को उत्पन्न करना अधिकांशतः वांछनीय होता है। इस प्रकार नीचे सूचीबद्ध सभी कलनविधि मानक सामान्य विचलन उत्पन्न करते हैं, क्योंकि a {{math|''N''(''μ'', ''σ''<sup>2</sup>)}} को {{math|1=''X'' = ''μ'' + ''σZ''}} के रूप में उत्पन्न किया जा सकता है, जहां Z मानक सामान्य रूप में है। ये सभी कलनविधि एक यादृच्छिक संख्या जनरेटर U की उपलब्धता पर निर्भर करते हैं जो समान यादृच्छिक चर उत्पन्न करने में सक्षम है। | ||
* सबसे सीधी विधि [[संभाव्यता अभिन्न परिवर्तन|प्रायिकता अभिन्न परिवर्तन]] प्रॉपर्टी पर आधारित है | * सबसे सीधी विधि [[संभाव्यता अभिन्न परिवर्तन|प्रायिकता अभिन्न परिवर्तन]] प्रॉपर्टी पर आधारित होती है, यदि U को (0,1) पर समान रूप से वितरित किया जाता है, तो Φ<sup>−1</sup>(U) का मानक सामान्य वितरण होता है । इस पद्धति का दोष यह है कि यह प्रोबिट फलन Φ<sup>1</sup> की गणना पर निर्भर करता है, जो विश्लेषणात्मक रूप से नहीं किया जा सकता। कुछ अनुमानित विधियों का वर्णन हार्ट 1968 और ईआरएफ लेख में किया गया है। विचुरा इस फलन को 16 दशमलव स्थानों पर गणना करने के लिए एक तेज़ कलनविधि देता है,<ref>{{cite journal|last=Wichura |first=Michael J.|year=1988|title=Algorithm AS241: The Percentage Points of the Normal Distribution|journal=Applied Statistics |volume=37|pages=477–84|doi=10.2307/2347330|jstor=2347330|issue=3}}</ref> जिसका उपयोग R [[आर प्रोग्रामिंग भाषा|प्रोग्रामिंग भाषा]] द्वारा सामान्य वितरण के यादृच्छिक चर की गणना करने के लिए किया जाता है। | ||
* | * एक आसान से प्रोग्राम अनुमानित दृष्टिकोण जो केंद्रीय सीमा प्रमेय पर निर्भर करता है, वह इस प्रकार है, 12 समान U(0,1) विचलन उत्पन्न करते है, उन सभी को जोड़ने और 6 घटाने से परिणामी यादृच्छिक चर का मानक सामान्य वितरण होता है । इस प्रकार वास्तव में, वितरण इरविन-हॉल वितरण होता है | इरविन-हॉल, जो सामान्य वितरण के लिए 12-खंड ग्यारहवें-क्रम बहुपद सन्निकटन के रूप में होते है। इस यादृच्छिक विचलन की सीमित सीमा (-6, 6) के रूप में होती है।<ref>{{harvtxt |Johnson |Kotz |Balakrishnan |1995 |loc=Equation (26.48) }}</ref> ध्यान दें कि एक सामान्य सामान्य वितरण में, सभी नमूनों का केवल 0.00034% ±6σ से बाहर होते है। | ||
* | * बॉक्स-मुलर विधि दो स्वतंत्र यादृच्छिक संख्या U और V (0,1) पर वितरित समान वितरण का उपयोग करती है। फिर दो यादृच्छिक चर X और Y के रूप में होते है<math display="block"> | ||
X = \sqrt{- 2 \ln U} \, \cos(2 \pi V) , \qquad | X = \sqrt{- 2 \ln U} \, \cos(2 \pi V) , \qquad | ||
Y = \sqrt{- 2 \ln U} \, \sin(2 \pi V) . | Y = \sqrt{- 2 \ln U} \, \sin(2 \pi V) . | ||
</math> दोनों का मानक सामान्य वितरण होता है | </math> दोनों का मानक सामान्य वितरण होता है और स्वतंत्र रूप में होती है। यह सूत्रीकरण इसलिए उत्पन्न होता है क्योंकि [[द्विभाजित सामान्य]] यादृच्छिक सदिश (X, Y) के लिए अज्ञात मानदंड {{math|''X''<sup>2</sup> + ''Y''<sup>2</sup>}} स्वतंत्र की दो डिग्री के साथ ची-वर्ग वितरण होता है , जो इन समीकरणों में -2ln(U) क्वांटाइल के अनुरूप आसानी से उत्पन्न घातांक वितरण है और कोण को वृत्त के चारों ओर समान रूप से वितरित किया जाता है, जिसे यादृच्छिक चर V द्वारा चुना जाता है। | ||
* मार्सग्लिया ध्रुवीय विधि बॉक्स-मुलर विधि का एक संशोधन है जिसमें साइन और कोसाइन फलन की गणना की आवश्यकता नहीं होती है। इस विधि में, U और V एकसमान (−1,1) वितरण से निकाले जाते हैं, और फिर {{math|1=''S'' = ''U''<sup>2</sup> + ''V''<sup>2</sup>}} गणना की जाती है। यदि S 1 से अधिक या बराबर है, तो विधि फिर से शुरू होती है, अन्यथा दो मात्राएँ <math display="block">X = U\sqrt{\frac{-2\ln S}{S}}, \qquad Y = V\sqrt{\frac{-2\ln S}{S}}</math> वापस कर दिए जाते | * मार्सग्लिया ध्रुवीय विधि बॉक्स-मुलर विधि का एक संशोधन है, जिसमें साइन और कोसाइन फलन की गणना की आवश्यकता नहीं होती है। इस विधि में, U और V एकसमान (−1,1) वितरण से निकाले जाते हैं, और फिर {{math|1=''S'' = ''U''<sup>2</sup> + ''V''<sup>2</sup>}} की गणना की जाती है। यदि S 1 से अधिक या बराबर है, तो विधि फिर से शुरू होती है, अन्यथा दो मात्राएँ इस प्रकार होती है<math display="block">X = U\sqrt{\frac{-2\ln S}{S}}, \qquad Y = V\sqrt{\frac{-2\ln S}{S}}</math> फिर से वापस कर दिए जाते हैं, X और Y स्वतंत्र, मानक सामान्य यादृच्छिक चर के रूप में है। | ||
* अनुपात विधि<ref>{{harvtxt |Kinderman |Monahan |1977 }}</ref> अस्वीकृति पद्धति है। | * अनुपात विधि<ref>{{harvtxt |Kinderman |Monahan |1977 }}</ref> एक अस्वीकृति पद्धति है। कलनविधि निम्नानुसार आगे बढ़ता है | ||
** दो स्वतंत्र | ** दो स्वतंत्र एकरूप U और V उत्पन्न करते हैं | ||
** | ** अभिकलन X= {{sqrt|8/''e''}} (वी - 0.5)/U; | ||
** वैकल्पिक: यदि X<sup>2</sup> ≤ 5 − 4e<sup>1/4</sup> | ** वैकल्पिक: यदि X<sup>2</sup> ≤ 5 − 4e<sup>1/4</sup>U फिर एक्स को स्वीकार करते हैं और कलन विधि को समाप्त करते हैं; | ||
** वैकल्पिक: यदि X<sup>2</sup> ≥ 4e<sup>-1.35/U + 1.4 फिर X को अस्वीकार | ** वैकल्पिक: यदि X<sup>2</sup> ≥ 4e<sup>-1.35/U + 1.4 फिर X को अस्वीकार करते हैं और चरण 1 से शुरू करते हैं; | ||
** यदि | ** यदि X<sup>2</sup> ≤ −4 lnU फिर X को स्वीकार करते हैं, अन्यथा कलन विधि पर प्रारंभ करते हैं। | ||
*: दो वैकल्पिक चरण अंतिम चरण में लघुगणक के मान | *: दो वैकल्पिक चरण अंतिम चरण में लघुगणक के मान अंकन की अनुमति देते हैं, जिससे अधिकांश स्थितियो में बचा जा सकता है। इन कदमों में बहुत सुधार किया जा सकता है<ref>{{harvtxt|Leva|1992}}</ref> जिससे की लघुगणक का मान अंकन कभी-कभार ही किया जा सके। | ||
* ज़िगगुरैट | * ज़िगगुरैट कलन विधि <ref>{{harvtxt |Marsaglia |Tsang |2000 }}</ref> बॉक्स-मुलर रूपांतरण से तेज़ है और अभी भी अच्छे और सटीक है। लगभग 97% स्थितियो में यह केवल दो यादृच्छिक संख्याओं, एक यादृच्छिक पूर्णांक और एक यादृच्छिक समरूप , एक गुणन और एक परीक्षण का उपयोग करता है। और इस प्रकार केवल 3% स्थितियो में जहां उन दोनों का संयोजन जिगगुराट के कोर के बाहर पड़ता है वहाँ लघुगणक का उपयोग करके एक प्रकार का अस्वीकृति नमूनाकरण घातांक का प्रयोग किया जाता है और इस प्रकार समान यादृच्छिक संख्याओं को नियोजित करना पड़ता है। | ||
* पूर्णांक अंकगणित का उपयोग मानक सामान्य वितरण से नमूने के लिए किया जा सकता है।<ref>{{harvtxt|Karney|2016}}</ref> यह विधि इस अर्थ में अच्छे है कि यह आदर्श सन्निकटन की शर्तों को संतुष्ट करती है;<ref>{{harvtxt|Monahan|1985|loc=section 2}}</ref> अर्थात | * पूर्णांक अंकगणित का उपयोग मानक सामान्य वितरण से नमूने के लिए किया जा सकता है।<ref>{{harvtxt|Karney|2016}}</ref> यह विधि इस अर्थ में अच्छे है कि यह आदर्श सन्निकटन की शर्तों को संतुष्ट करती है;<ref>{{harvtxt|Monahan|1985|loc=section 2}}</ref> अर्थात यह मानक सामान्य वितरण से एक वास्तविक संख्या का नमूना लेने और इसे निकटतम प्रतिनिधित्व योग्य फ़्लोटिंग पॉइंट नंबर पर गोल करने के बराबर होती है। | ||
* कुछ जांच भी है<ref>{{harvtxt |Wallace |1996}}</ref> तेजी से हैडमार्ड परिवर्तन और सामान्य वितरण के बीच संबंध में | * कुछ जांच भी है<ref>{{harvtxt |Wallace |1996}}</ref> जो तेजी से हैडमार्ड परिवर्तन और सामान्य वितरण के बीच संबंध में परिवर्तन केवल जोड़ने और घटाने को नियोजित करता है और केंद्रीय सीमा प्रमेय द्वारा लगभग किसी भी वितरण से यादृच्छिक संख्या सामान्य वितरण में बदल दी जाती है। इस संबंध में सामान्य रूप से वितरित डेटा में स्वैच्छिक डेटा समुच्चय को चालू करने के लिए हैडमार्ड रूपांतरणों की एक श्रृंखला को यादृच्छिक क्रमपरिवर्तन के साथ जोड़ा जा सकता है। | ||
=== सामान्य सीडीएफ और सामान्य क्वांटाइल फलन के लिए संख्यात्मक अनुमान === | === सामान्य सीडीएफ और सामान्य क्वांटाइल फलन के लिए संख्यात्मक अनुमान === | ||
मानक सामान्य | मानक सामान्य सीडीएफ का व्यापक रूप से वैज्ञानिक और सांख्यिकीय अभिकलन में उपयोग किया जाता है। | ||
मान Φ(x) को विभिन्न | मान Φ(x) को विभिन्न विधियों से बहुत अच्छी तरह से अनुमानित किया जा सकता है, जैसे कि [[संख्यात्मक एकीकरण]], टेलर श्रृंखला, टेलर श्रृंखला, स्पर्शोन्मुख श्रृंखला और निरंतर भिन्न कॉन्फ़्लूएंट हाइपरजियोमेट्रिक फलन का उपयोग किया जाता है। इस प्रकार सटीकता के वांछित स्तर के आधार पर विभिन्न अनुमानों का उपयोग किया जाता है। | ||
* {{harvtxt |Zelen |Severo |1964 }} पूर्ण त्रुटि के साथ x > 0 के लिए Φ(x) का सन्निकटन | * {{harvtxt |Zelen |Severo |1964 }} पूर्ण त्रुटि के साथ x > 0 के लिए Φ(x) का सन्निकटन {{math|{{abs|''ε''(''x'')}} < 7.5·10<sup>−8</sup>}} मान होता है, कलनविधि [https://secure.math.ubc.ca/~cbm/aands/page_932.htm 26.2.17]): <math display="block"> | ||
\Phi(x) = 1 - \varphi(x)\left(b_1 t + b_2 t^2 + b_3t^3 + b_4 t^4 + b_5 t^5\right) + \varepsilon(x), \qquad t = \frac{1}{1+b_0x}, | \Phi(x) = 1 - \varphi(x)\left(b_1 t + b_2 t^2 + b_3t^3 + b_4 t^4 + b_5 t^5\right) + \varepsilon(x), \qquad t = \frac{1}{1+b_0x}, | ||
</math> जहां ϕ(x) मानक सामान्य PDF है, | </math> जहां ϕ(x) मानक सामान्य PDF इस प्रकार है, ''b''<sub>0</sub> = 0.2316419, ''b''<sub>1</sub> = 0.319381530, ''b''<sub>2</sub> = −0.356563782, ''b''<sub>3</sub> = 1.781477937, ''b''<sub>4</sub> = −1.821255978, ''b''<sub>5</sub> = 1.330274429. | ||
* {{harvtxt |Hart |1968 }} | * {{harvtxt |Hart |1968 }} ने erfc() फलन के लिए घातांक के साथ या उसके बिना तर्कसंगत फलन के माध्यम से कुछ दर्जनों अनुमानों को सूचीबद्ध किया है। उनके कलनविधि 24 अंकों की अधिकतम पूर्ण सटीकता के साथ सम्मिश्रता की डिग्री और परिणामी सटीकता में भिन्न होते हैं। इस प्रकार एक कलनविधि {{harvtxt |West |2009 }} 16 अंकों की सटीकता के साथ एक तेज संगणना कलनविधि प्रदान करने के लिए टेल में एक [[निरंतर अंश|निरंतर भिन्न]] सन्निकटन के साथ हार्ट के कलनविधि 5666 को जोड़ता है। | ||
* {{harvtxt |Cody |1969 }} | * Hart68 समाधान erf के लिए उपयुक्त नहीं होता है, यह याद करने के बाद {{harvtxt |Cody |1969 }} erf और erfc दोनों के लिए तर्कसंगत चेबीशेव अनुमान के माध्यम से अधिकतम सापेक्ष त्रुटि के साथ एक समाधान देता है। | ||
* {{harvtxt |Marsaglia |2004 }} एक सरल | * {{harvtxt |Marsaglia |2004 }} टेलर श्रृंखला विस्तार के आधार पर एक सरल कलनविधि का सुझाव दिया है,{{NoteTag|For example, this algorithm is given in the article [[Bc programming language#A translated C function|Bc programming language]].}} <math display="block"> | ||
\Phi(x) = \frac12 + \varphi(x)\left( x + \frac{x^3} 3 + \frac{x^5}{3 \cdot 5} + \frac{x^7}{3 \cdot 5 \cdot 7} + \frac{x^9}{3 \cdot 5 \cdot 7 \cdot 9} + \cdots \right) | \Phi(x) = \frac12 + \varphi(x)\left( x + \frac{x^3} 3 + \frac{x^5}{3 \cdot 5} + \frac{x^7}{3 \cdot 5 \cdot 7} + \frac{x^9}{3 \cdot 5 \cdot 7 \cdot 9} + \cdots \right) | ||
</math> | </math> स्वेच्छ परिशुद्धता के साथ Φ(x) की गणना के लिए इस कलनविधि की कमी अपेक्षाकृत तुलनात्मक रूप से धीमी गणना समय है, उदाहरण के लिए जब x = 10 होता है तो 16 अंकों की सटीकता के साथ फलन की गणना करने में 300 से अधिक पुनरावृत्तियों की आवश्यकता होती है। | ||
* [[जीएनयू वैज्ञानिक पुस्तकालय]] हार्ट के | * [[जीएनयू वैज्ञानिक पुस्तकालय]] हार्ट के कलनविधि और [[चेबिशेव बहुपद]] के साथ सन्निकटन का उपयोग करके मानक सामान्य सीडीएफ के मानों की गणना करती है। | ||
नॉइज़ (1982) ने सरल सन्निकटन | नॉइज़ (1982) ने सरल सन्निकटन मान प्रदान करते है, जिन्हें इंजीनियरिंग और संचालन अनुसंधान के स्टोकेस्टिक अनुकूलन मॉडल के रूप में सम्मलित किया जाता है, जैसे विश्वसनीयता इंजीनियरिंग और इन्वेंट्री विश्लेषण इत्यादि। इस प्रकार {{math|1=''p'' = Φ(''z'')}} क्वांटाइल फलन के लिए सबसे सरल सन्निकटन के रूप में होते है | ||
<math display="block">z = \Phi^{-1}(p)=5.5556\left[1- \left( \frac{1-p} p \right)^{0.1186}\right],\qquad p\ge 1/2 </math> | <math display="block">z = \Phi^{-1}(p)=5.5556\left[1- \left( \frac{1-p} p \right)^{0.1186}\right],\qquad p\ge 1/2 </math> | ||
यह सन्निकटन z | यह सन्निकटन z के लिए {{math|0.5 ≤ ''p'' ≤ 0.9999}} के लिए 0.026 की अधिकतम निरपेक्ष त्रुटि प्रदान करता है, जो तदनुसार {{math|0 ≤ ''z'' ≤ 3.719}}) के अनुरूप है। इस प्रकार {{math|''p'' < 1/2}} p के लिए {{math|1 − ''p''}} से परिवर्तन चिह्न और एक और सन्निकटन चिह्न बदलते है और इस प्रकार एकल पैरामीटर सन्निकटन कुछ कम सटीक रूप में बदलते है, | ||
<math display="block"> z=-0.4115\left\{ \frac{1-p} p + \log \left[ \frac{1-p} p \right] - 1 \right\}, \qquad p\ge 1/2</math> | <math display="block"> z=-0.4115\left\{ \frac{1-p} p + \log \left[ \frac{1-p} p \right] - 1 \right\}, \qquad p\ge 1/2</math> | ||
उत्तरार्द्ध ने सामान्य वितरण के | उत्तरार्द्ध ने सामान्य वितरण के लॉस समाकलन के लिए एक सरल सन्निकटन अनुमान प्राप्त करने का काम किया था, जिसे परिभाषित किया गया था | ||
<math display="block">\begin{align} | <math display="block">\begin{align} | ||
L(z) & =\int_z^\infty (u-z)\varphi(u) \, du=\int_z^\infty [1-\Phi (u)] \, du \\[5pt] | L(z) & =\int_z^\infty (u-z)\varphi(u) \, du=\int_z^\infty [1-\Phi (u)] \, du \\[5pt] | ||
Line 871: | Line 872: | ||
\end{cases} | \end{cases} | ||
\end{align}</math> | \end{align}</math> | ||
यह सन्निकटन | यह सन्निकटन z≥1.4 के लिए 10<sup>-3</sup> की दाहिनी दूर-टेल्ड अधिकतम त्रुटि के लिए विशेष रूप से सटीक है और इस प्रकार [[प्रतिक्रिया मॉडलिंग पद्धति]] आरएमएम, शोर, 2011, 2012 के आधार पर सीडीएफ के लिए अत्यधिक अच्छे अनुमान नॉइज़ (2005) में दिखाए गए हैं। | ||
कुछ और सन्निकटन यहां देखे जा सकते | कुछ और सन्निकटन यहां देखे जा सकते है, जो त्रुष्टि फलन प्राथमिक फलन के साथ सन्निकटन रूप में होते है। विशेष रूप से, सीडीएफ के लिए पूरे डोमेन पर छोटी सापेक्ष त्रुटि <math>\Phi</math> और क्वांटाइल फलन <math>\Phi^{-1}</math> के साथ ही 2008 में सर्गेई विनित्ज़की द्वारा स्पष्ट रूप से व्युत्क्रम सूत्र के माध्यम से प्राप्त किया गया है। | ||
== इतिहास == | == इतिहास == | ||
=== विकास === | === विकास === | ||
कुछ लेखक<ref>{{harvtxt |Johnson |Kotz |Balakrishnan |1994 |p=85 }}</ref><ref>{{harvtxt |Le Cam | Lo Yang |2000 |p=74 }}</ref> सामान्य वितरण की खोज का श्रेय [[अब्राहम डी मोइवरे]] को देते हैं, जिन्होंने 1738 में{{NoteTag|De Moivre first published his findings in 1733, in a pamphlet "Approximatio ad Summam Terminorum Binomii {{math|(''a'' + ''b'')<sup>''n''</sup>}} in Seriem Expansi" that was designated for private circulation only. But it was not until the year 1738 that he made his results publicly available. The original pamphlet was reprinted several times, see for example {{harvtxt |Walker |1985 }}.}} द डॉक्ट्रिन ऑफ चांस के दूसरे संस्करण में [[द्विपद विस्तार]] | कुछ लेखक<ref>{{harvtxt |Johnson |Kotz |Balakrishnan |1994 |p=85 }}</ref><ref>{{harvtxt |Le Cam | Lo Yang |2000 |p=74 }}</ref> सामान्य वितरण की खोज का श्रेय [[अब्राहम डी मोइवरे]] को देते हैं, जिन्होंने 1738 में{{NoteTag|De Moivre first published his findings in 1733, in a pamphlet "Approximatio ad Summam Terminorum Binomii {{math|(''a'' + ''b'')<sup>''n''</sup>}} in Seriem Expansi" that was designated for private circulation only. But it was not until the year 1738 that he made his results publicly available. The original pamphlet was reprinted several times, see for example {{harvtxt |Walker |1985 }}.}} द डॉक्ट्रिन ऑफ चांस के दूसरे संस्करण में [[द्विपद विस्तार]] {{math|(''a'' + ''b'')<sup>''n''</sup>}} में गुणांक के अध्ययन में प्रकाशित किया है। डी मोइवर ने साबित किया कि इस विस्तार में मध्य पद का अनुमानित परिमाण <math display=inline>2^n/\sqrt{2\pi n}</math> के रूप में होता है और वह यदि m या {{sfrac|1|2}}n एक क्वांटाइल असीम रूप से बहुत बढ़िया होता है, तो इस प्रकार अनुपात का लघुगणक जो अंतराल ℓ द्वारा मध्य से दूर एक शब्द, मध्य अवधि के लिए <math display=inline>-\frac{2\ell\ell}{n}</math>.<ref>De Moivre, Abraham (1733), Corollary I – see {{harvtxt |Walker |1985 |p=77 }}</ref> है, यद्यपि इस प्रमेय की व्याख्या सामान्य प्रायिकता नियम के लिए पहली अस्पष्ट अभिव्यक्ति के रूप में व्याख्या किया जा सकता है, स्टीफन स्टिगलर बताते हैं कि डी मोइवर ने स्वयं अपने परिणामों की व्याख्या द्विपद गुणांकों के लिए अनुमानित नियम से अधिक कुछ भी नहीं की है और विशेष रूप से डी मोइवर में प्रायिकता घनत्व फलन की इस अवधारणा का अभिव्यक्ति था।<ref>{{harvtxt |Stigler |1986 |p=76 }}</ref> | ||
[[File:Carl Friedrich Gauss.jpg|thumb|180px|left|कार्ल फ्रेडरिक गॉस ने 1809 में [[कम से कम वर्गों की विधि]] को युक्तिसंगत बनाने के तरीके के रूप में सामान्य वितरण की खोज की।]]1823 में कार्ल फ्रेडरिक गॉस ने अपना मोनोग्राफ प्रकाशित किया <span title= थ्योरी ऑफ़ द कॉम्बिनेशन ऑफ़ ऑब्जर्वेशन्स लीस्ट सब्जेक्ट टू एरर्स>थ्योरीया कॉम्बिनेशनिस ऑब्जर्वेशनम त्रुष्टि िबस मिनिमिस ऑबनोक्सिया</span> जहां उन्होंने कई महत्वपूर्ण सांख्यिकीय अवधारणाओं को प्रस्तुत किया था, जैसे कि न्यूनतम वर्ग विधि [[अधिकतम संभावना की विधि|अधिकतम संभावना की विधि,]] और सामान्य वितरण इत्यादि के रूप में है। गॉस ने कुछ अज्ञात मात्रा V के माप को दर्शाने के लिए {{nobr|''M''′}}, {{nobr|''M''′′, ...}}का उपयोग किया और "उस क्वांटाइल के सबसे संभावित एस्टीमेटर की मांग की, जो प्रेक्षित प्रयोगात्मक परिणामों को प्राप्त करने की प्रायिकता {{math|''φ''(''M'' − ''V'') · ''φ''(''M′'' − ''V'') · ''φ''(''M''′′ − ''V'') · ...}} को अधिकतम करता है। इस प्रकार उनके अंकन में φΔ परिमाण की माप त्रुटियों की प्रायिकता घनत्व फलन है। इस प्रकार हम यह नहीं जानते कि फलन φ क्या है, गॉस की आवश्यकता होती है कि उसकी विधि को सुप्रसिद्ध उत्तर मापे गए मानों के अंकगणितीय माध्य को कम करना होता है। इन सिद्धांतों से शुरू करते हुए गॉस दर्शाता है कि स्थान पैरामीटर के अनुमानक के रूप में अंकगणित माध्य की पसंद को तर्कसंगत बनाने वाला एकमात्र नियम त्रुटियों का सामान्य नियम है।<ref>{{harvtxt |Gauss |1809 |loc=section 177 }}</ref> | |||
<math display="block"> | <math display="block"> | ||
\varphi\mathit{\Delta} = \frac h {\surd\pi} \, e^{-\mathrm{hh}\Delta\Delta}, | \varphi\mathit{\Delta} = \frac h {\surd\pi} \, e^{-\mathrm{hh}\Delta\Delta}, | ||
</math | </math> | ||
[[File:Pierre-Simon Laplace.jpg|thumb|180px|right| [[पियरे-साइमन लाप्लास]] ने 1810 में आंकड़ों में सामान्य वितरण के महत्व को मजबूत करते हुए केंद्रीय सीमा प्रमेय को सिद्ध किया।]]चूंकि गॉस सामान्य वितरण नियम का सुझाव देने वाले पहले व्यक्ति थे, [[पियरे साइमन डी लाप्लास]] ने महत्वपूर्ण योगदान दिया।{{NoteTag|"My custom of terming the curve the Gauss–Laplacian or ''normal'' curve saves us from proportioning the merit of discovery between the two great astronomer mathematicians." quote from {{harvtxt |Pearson |1905 |p=189 }} }} यह लाप्लास था जिसने पहली बार 1774 में कई अवलोकनों को एकत्रित करने की | जहाँ h टेस्ट्स की शुद्धता का माप है। प्रयोगों में त्रुटियों के लिए एक सामान्य मॉडल के रूप में इस सामान्य नियम का उपयोग करते हुए गॉस ने वह विधि तैयार की जिसे अब गैर-रैखिक भारित न्यूनतम वर्ग विधि के रूप में जाना जाता है।<ref>{{harvtxt |Gauss |1809 |loc=section 179 }}</ref> | ||
यह ध्यान रखना दिलचस्प है कि 1809 में एक आयरिश-अमेरिकी गणितज्ञ [[रॉबर्ट एड्रेन]] ने गॉस से एक साथ और स्वतंत्र रूप से सामान्य प्रायिकता नियम के दो व्यावहारिक लेकिन त्रुटिपूर्ण अवकलज प्रकाशित | |||
19वीं शताब्दी के मध्य में जेम्स क्लर्क मैक्सवेल ने प्रदर्शित किया कि सामान्य वितरण न केवल एक सुविधाजनक गणितीय उपकरण है, बल्कि प्राकृतिक घटनाओं में भी हो सकता है | [[File:Pierre-Simon Laplace.jpg|thumb|180px|right| [[पियरे-साइमन लाप्लास]] ने 1810 में आंकड़ों में सामान्य वितरण के महत्व को मजबूत करते हुए केंद्रीय सीमा प्रमेय को सिद्ध किया।]]चूंकि गॉस सामान्य वितरण नियम का सुझाव देने वाले पहले व्यक्ति थे, [[पियरे साइमन डी लाप्लास]] ने महत्वपूर्ण योगदान दिया।{{NoteTag|"My custom of terming the curve the Gauss–Laplacian or ''normal'' curve saves us from proportioning the merit of discovery between the two great astronomer mathematicians." quote from {{harvtxt |Pearson |1905 |p=189 }} }} यह लाप्लास था जिसने पहली बार 1774 में कई अवलोकनों को एकत्रित करने की प्रॉब्लम प्रस्तुत की थी,<ref>{{harvtxt |Laplace |1774 |loc = Problem III }}</ref> चूंकि उनके अपने समाधान ने [[लाप्लासियन वितरण|लाप्लासियन]] वितरण को जन्म दिया था। यह लाप्लास था जिसने सबसे पहले गॉसियन समाकलन {{nowrap|∫ ''e''<sup>−''t''<sup>2</sup></sup> ''dt'' {{=}} {{sqrt|{{pi}}}}}} 1782 के मान की गणना की थी और इस प्रकार सामान्य वितरण के लिए सामान्यीकरण स्टेबल अंकन प्रदान करता है।<ref>{{harvtxt |Pearson |1905 |p=189 }}</ref> अंत में, यह लाप्लास था जिसने 1810 में मौलिक केंद्रीय सीमा प्रमेय को साबित किया और अकादमी को प्रस्तुत किया था, जिसने सामान्य वितरण के सैद्धांतिक महत्व पर जोर दिया था।<ref>{{harvtxt |Stigler |1986 |p=144 }}</ref> | ||
यह ध्यान रखना दिलचस्प है कि 1809 में एक आयरिश-अमेरिकी गणितज्ञ [[रॉबर्ट एड्रेन]] ने गॉस से एक साथ और स्वतंत्र रूप से सामान्य प्रायिकता नियम के दो व्यावहारिक लेकिन त्रुटिपूर्ण अवकलज प्रकाशित किए थे।<ref>{{harvtxt |Stigler |1978 |p=243 }}</ref> वैज्ञानिक समुदाय द्वारा उनके फलन पर बहुत सीमा तक ध्यान नहीं दिया गया था, जब तक कि 1871 में [[क्लीवलैंड एब्बे]] द्वारा उन्हें खोदकर नहीं निकाला गया था।<ref>{{harvtxt |Stigler |1978 |p=244 }}</ref> | |||
19वीं शताब्दी के मध्य में जेम्स क्लर्क मैक्सवेल ने प्रदर्शित किया कि सामान्य वितरण न केवल एक सुविधाजनक गणितीय उपकरण है, बल्कि प्राकृतिक घटनाओं में भी हो सकता है<ref>{{harvtxt |Maxwell |1860 |p=23 }}</ref> इस प्रकार कणों की संख्या जिसका वेग एक निश्चित दिशा में हल किया जाता है, x और x+dx के बीच होता है | |||
<math display="block"> | <math display="block"> | ||
\operatorname{N} \frac{1}{\alpha\;\sqrt\pi}\; e^{-\frac{x^2}{\alpha^2}} \, dx | \operatorname{N} \frac{1}{\alpha\;\sqrt\pi}\; e^{-\frac{x^2}{\alpha^2}} \, dx | ||
</math> | </math> | ||
=== नामकरण === | |||
आज, अवधारणा को सामान्यतः अंग्रेजी में सामान्य वितरण या गाऊसी वितरण के रूप में जाना जाता है। अन्य कम सामान्य नामों में गॉस वितरण, लाप्लास-गॉस वितरण, त्रुटि का नियम, त्रुटियों की सुविधा का नियम, लाप्लास का दूसरा नियम, गॉसियन नियम के रूप में सम्मलित हैं। | |||
गॉस ने स्पष्ट रूप से इस शब्द को इसके अनुप्रयोगों में सम्मलित सामान्य समीकरणों के संदर्भ में कॉइन किया था, जिसमें सामान्य के अतिरिक्त सामान्य रूप से ऑर्थोगोनल का तकनीकी अर्थ होता है।<ref>Jaynes, Edwin J.; ''Probability Theory: The Logic of Science'', [http://www-biba.inrialpes.fr/Jaynes/cc07s.pdf Ch. 7].</ref> चूंकि, 19 वीं शताब्दी के अंत तक कुछ लेखक{{NoteTag|Besides those specifically referenced here, such use is encountered in the works of [[Charles Sanders Peirce|Peirce]], [[Francis Galton|Galton]] ({{harvtxt |Galton |1889 |loc = chapter V }}) and [[Wilhelm Lexis|Lexis]] ({{harvtxt | Lexis |1878 }}, {{harvtxt |Rohrbasser |Véron |2003 }}) c. 1875.{{Citation needed |date=June 2011 }} }} सामान्य वितरण नाम का उपयोग करना शुरू कर दिया था, जहां सामान्य शब्द को विशेषण के रूप में उपयोग किया गया था। इस शब्द को अब इस तथ्य के प्रतिबिंब के रूप में देखा जा रहा है कि इस वितरण को विशिष्ट सामान्य प्रकार के रूप में देखा जाता था। [[चार्ल्स सैंडर्स पियर्स]] उन लेखकों में से एक जिन्होने एक पीयर्स "सामान्य" को परिभाषित किया था ' इस प्रकार 'सामान्य' वास्तव में जो घटित होता है इसका औसत या किसी अन्य प्रकार का माध्य नहीं है, लेकिन कुछ परिस्थितियों में लंबे समय में क्या घटित होता है इसका अर्थ है।<ref>Peirce, Charles S. (c. 1909 MS), ''[[Charles Sanders Peirce bibliography#CP|Collected Papers]]'' v. 6, paragraph 327.</ref> 20वीं शताब्दी के अंत में [[कार्ल पियर्सन]] ने इस वितरण के लिए एक पदनाम के रूप में सामान्य शब्द को लोकप्रिय बनाया था।<ref>{{harvtxt |Kruskal |Stigler |1997 }}.</ref> | |||
{{Blockquote|कई साल पहले मैंने लाप्लास गॉसियन वक्र को सामान्य वक्र कहा था, चूंकि यह नाम प्राथमिकता के एक अंतरराष्ट्रीय प्रश्न से बचता है, लेकिन इसमें लोगों को यह विश्वास दिलाने का नुकसान है कि आवृत्ति के अन्य सभी वितरण किसी न किसी अर्थ में 'असामान्य' हैं। | |||
|{{harvtxt |पियर्सन |1920 }}}} | |||
इसके अतिरिक्त, वे पियर्सन ही थे जिन्होंने सबसे पहले वितरण को आधुनिक संकेतन के रूप में मानक विचलन σ के रूप में लिखा था। इसके तुरंत बाद, वर्ष 1915 में, [[रोनाल्ड फिशर]] ने सामान्य वितरण के सूत्र में स्थान पैरामीटर जोड़ दिया था, इसे वर्तमान काल में लिखी गई विधि से व्यक्त करते है। | |||
<math display="block"> df = \frac{1}{\sqrt{2\sigma^2\pi}} e^{-(x - m)^2/(2\sigma^2)} \, dx.</math> | <math display="block"> df = \frac{1}{\sqrt{2\sigma^2\pi}} e^{-(x - m)^2/(2\sigma^2)} \, dx.</math> | ||
मानक सामान्य शब्द, जो शून्य माध्य और इकाई विचरण के साथ सामान्य वितरण को दर्शाता है और जो वर्ष 1950 के दशक के आसपास सामान्य उपयोग में आया है, जो पी. जी. होएल (1947) में गणितीय आंकड़ों का परिचय लोकप्रिय पाठ्यपुस्तकों में प्रकाशित हुआ। और इस प्रकार ए. एम. मूड (1950) द्वारा सांख्यिकी के सिद्धांत का परिचय दिया गया था<ref>{{cite web|title=Earliest uses... (entry STANDARD NORMAL CURVE)|url=http://jeff560.tripod.com/s.html}}</ref> | |||
== यह भी देखें == | == यह भी देखें == | ||
{{Portal|Mathematics}} | {{Portal|Mathematics}} | ||
* [[बेट्स वितरण|बेट्स]] वितरण - इरविन-हॉल वितरण के समान, लेकिन 0 से 1 श्रेणी में वापस आ | * [[बेट्स वितरण|बेट्स]] वितरण - इरविन-हॉल वितरण के समान होता है, लेकिन 0 से 1 श्रेणी में वापस आ जाता है | ||
* बेहरेंस-फिशर | * बेहरेंस-फिशर प्रॉब्लम - टेस्ट्स की लंबे समय से चली आ रही प्रॉब्लम है कि क्या भिन्न -भिन्न प्रसरण वाले दो सामान्य नमूनों का एक ही अर्थ होता है, | ||
* [[भट्टाचार्य दूरी]] - सामान्य वितरण के मिश्रण को भिन्न करने के लिए उपयोग की जाने वाली विधि | * [[भट्टाचार्य दूरी]] - सामान्य वितरण के मिश्रण को भिन्न करने के लिए उपयोग की जाने वाली विधि के रूप में होती है | ||
* एर्डोस-केएसी प्रमेय - [[संख्या सिद्धांत]] में सामान्य वितरण की घटना पर | * एर्डोस-केएसी प्रमेय - [[संख्या सिद्धांत]] में सामान्य वितरण की घटना पर आधारित होती है | ||
* [[अधिकतम अर्ध पर पूरी चौड़ाई]] | * [[अधिकतम अर्ध पर पूरी चौड़ाई|अधिकतम अर्ध पर पूरी चौड़ाई होती है]] | ||
* [[गौस्सियन धुंधलापन]] - कनवल्शन, जो कर्नेल के रूप में सामान्य वितरण का उपयोग करता है | * [[गौस्सियन धुंधलापन|गौस्सियन]] ब्लर - कनवल्शन, जो कर्नेल के रूप में सामान्य वितरण का उपयोग करता है | ||
* [[संशोधित आधा सामान्य वितरण|संशोधित | * [[संशोधित आधा सामान्य वितरण|संशोधित हाफ सामान्य]] वितरण <ref name="Sun, Kong and Pal">{{cite journal |last1=Sun |first1=Jingchao |last2=Kong |first2=Maiying |last3=Pal |first3=Subhadip |title=The Modified-Half-Normal distribution: Properties and an efficient sampling scheme |journal=Communications in Statistics - Theory and Methods |date=22 June 2021 |pages=1–23 |doi=10.1080/03610926.2021.1934700 |s2cid=237919587 |url=https://www.tandfonline.com/doi/abs/10.1080/03610926.2021.1934700?journalCode=lsta20 |issn=0361-0926}}</ref> p डीएफ के साथ <math>(0, \infty)</math> के रूप में दिया जाता है <math> f(x)= \frac{2\beta^{\frac{\alpha}{2}} x^{\alpha-1} \exp(-\beta x^2+ \gamma x )}{\Psi{\left(\frac{\alpha}{2}, \frac{ \gamma}{\sqrt{\beta}}\right)}}</math>, जहाँ <math>\Psi(\alpha,z)={}_1\Psi_1\left(\begin{matrix}\left(\alpha,\frac{1}{2}\right)\\(1,0)\end{matrix};z \right)</math> [[फॉक्स-राइट साई समारोह|फॉक्स-राइट पीसाई फलन]] को दर्शाता है। | ||
* [[सामान्य रूप से वितरित और असंबद्ध का अर्थ स्वतंत्र नहीं है]] | * [[सामान्य रूप से वितरित और असंबद्ध का अर्थ स्वतंत्र नहीं है]] | ||
* [[अनुपात सामान्य | * [[अनुपात सामान्य डिस्ट्रीब्यूशन|अनुपात सामान्य वितरण]] के रूप में होता है | ||
* [[पारस्परिक सामान्य | * [[पारस्परिक सामान्य डिस्ट्रीब्यूशन|पारस्परिक सामान्य वितरण]] के रूप में होता है | ||
* [[मानक सामान्य तालिका]] | * [[मानक सामान्य तालिका]] | ||
* स्टीन | * स्टीन लेम्मा | ||
* | * सब-गाऊसी वितरण | ||
* सामान्य रूप से वितरित यादृच्छिक चर का योग | * सामान्य रूप से वितरित यादृच्छिक चर का योग | ||
* ट्वीडी वितरण - सामान्य वितरण ट्वीडी | * ट्वीडी वितरण - सामान्य वितरण ट्वीडी घातांकी फैलाव मॉडल के फॅमिली का सदस्य है। | ||
* रैप्ड नॉर्मल वितरण - सर्कुलर डोमेन पर प्रयुक्त नॉर्मल | * रैप्ड नॉर्मल वितरण - सर्कुलर डोमेन पर प्रयुक्त नॉर्मल वितरण के रूप में होते है | ||
* जेड | * जेड टेस्ट्स - सामान्य वितरण का उपयोग करते है | ||
== टिप्पणियाँ == | == टिप्पणियाँ == | ||
Line 1,006: | Line 1,012: | ||
{{ProbDistributions|continuous-infinite}} | {{ProbDistributions|continuous-infinite}} | ||
{{Authority control}} | {{Authority control}} | ||
[[Category: | [[Category:All articles with unsourced statements]] | ||
[[Category:Articles with hatnote templates targeting a nonexistent page]] | |||
[[Category:Articles with invalid date parameter in template]] | |||
[[Category:Articles with unsourced statements from June 2011]] | |||
[[Category:CS1 Latina-language sources (la)]] | |||
[[Category:Collapse templates]] | |||
[[Category:Commons category link is locally defined]] | |||
[[Category:Created On 08/02/2023]] | [[Category:Created On 08/02/2023]] | ||
[[Category:Harv and Sfn no-target errors]] | |||
[[Category:Machine Translated Page]] | |||
[[Category:Vigyan Ready]] |
Latest revision as of 07:49, 16 October 2023
Probability density function | |||
Cumulative distribution function | |||
Notation | |||
---|---|---|---|
Parameters |
= mean (location) = variance (squared scale) | ||
Support | |||
Failed to parse (Conversion error. Server ("cli") reported: "SyntaxError: Expected "-", "[", "\\", "\\begin", "\\begin{", "]", "^", "_", "{", "}", [ \t\n\r], [%$], [().], [,:;?!'], [/|], [0-9], [><~], [\-+*=], or [a-zA-Z] but "ई" found.in 1:44"): {\displaystyle \frac{1}{\sigma\sqrt{2\pi}} ई^{-\frac{1}{2}\बाएं(\frac{x - \mu}{\sigma}\right)^2}} |
Part of a series on statistics |
Probability theory |
---|
सांख्यिकी में, एक सामान्य वितरण या गॉसियन वितरण वास्तविक मान यादृच्छिक चर के लिए निरंतर प्रायिकता वितरण का एक प्रकार है और जबकि इसकी चर की प्रायिकता घनत्व फलन का सामान्य प्रकार है
पैरामीटर वितरण का औसत माध्य अपेक्षित मान है और इसकी माध्यिका और मोड सांख्यिकी पद्धति है, जबकि पैरामीटर इसका मानक विचलन है और इस प्रकार वितरण का वेरिएंस के रूप में है, गाऊसी वितरण के साथ एक यादृच्छिक चर को सामान्य वितरण कहा जाता है और इसे सामान्य विचलन भी कहा जाता है।
सामान्य वितरण आंकड़ों में महत्वपूर्ण होते हैं और अधिकांशतः प्राकृतिक विज्ञान और सामाजिक विज्ञान में वास्तविक-मान वाले यादृच्छिक चर का प्रतिनिधित्व करने के लिए उपयोग किए जाते हैं जिनके वितरण ज्ञात नहीं होते हैं।[1][2] और इस प्रकार उनका महत्व आंशिक रूप से केंद्रीय सीमा प्रमेय के कारण होता है। इसमें कहा गया है कि, कुछ शर्तों के अनुसार परिमित माध्य और वेरिएंस के साथ एक यादृच्छिक चर के कई नमूनों टिप्पणियों का औसत स्वयं एक यादृच्छिक चर है, जिसका वितरण अभिसरण नमूने की संख्या बढ़ने पर सामान्य वितरण में होता है। इसलिए, भौतिक मात्राएँ जो कई स्वतंत्र प्रक्रियाओं का योग होने की आशंका की जाती हैं, जैसे माप त्रुटियां, अधिकांशतः ऐसे वितरण होते हैं जो लगभग सामान्य रूप में होते है।[3]
इसके अतिरिक्त, गॉसियन वितरण में कुछ अद्वितीय गुण हैं जो विश्लेषणात्मक अध्ययनों के रूप में मान हैं। उदाहरण के लिए, सामान्य विचलन के निश्चित संग्रह का कोई भी रैखिक संयोजन एक सामान्य विचलन है। इस प्रकार कई परिणाम और विधियाँ, जैसे कि अनिश्चितता का प्रसार और कम से कम वर्ग पैरामीटर फिटिंग विश्लेषणात्मक रूप से स्पष्ट रूप से प्राप्त की जा सकती हैं जब प्रासंगिक चर सामान्य रूप से वितरित किए जाते हैं।
एक सामान्य वितरण को कभी-कभी अनौपचारिक रूप से बेल कर्व कहा जाता है।[4] चूंकि, कई अन्य वितरण बेल के आकार के होते हैं, जैसे कॉची छात्र का t-वितरण और लॉजिस्टिक वितरण इत्यादि के रूप में होते है। अन्य नामों के लिए नेमिंग देखते हैं।
बहुभिन्नरूपी सामान्य वितरण में सदिश के लिए और आव्यूह सामान्य वितरण में मेट्रिसेस के लिए यूनीवेरिएट प्रायिकता वितरण सामान्यीकृत किया जाता है।
परिभाषाएँ
मानक सामान्य वितरण
सामान्य वितरण का सबसे सरल स्थिति मानक सामान्य वितरण या इकाई सामान्य वितरण के रूप में जाना जाता है। यह एक विशेष स्थिति है जब u = 0 और और इसे इस प्रायिकता घनत्व फलन (या घनत्व) द्वारा वर्णित किया गया है
चर z का माध्य 0 है और वेरिएंस और मानक विचलन घनत्व 1 है इसका शीर्ष पर है और मोड़ बिंदु और .के रूप में है
यद्यपि उपरोक्त घनत्व को सामान्यतः सामान्य मानक के रूप में जाना जाता है, कुछ लेखकों ने उस शब्द का उपयोग सामान्य वितरण के अन्य संस्करणों का वर्णन करने के लिए किया है। उदाहरण के लिए, कार्ल फ्रेडरिक गॉस ने एक बार मानक को सामान्य के रूप में परिभाषित किया था
जिसमें 1/2 का वेरिएंस होता है और स्टीफन स्टिगलर[5] एक बार मानक सामान्य के रूप में परिभाषित किया गया है
जिसका एक सरल फलन ात्मक रूप और एक वेरिएंस है
सामान्य वितरण
प्रत्येक सामान्य वितरण मानक सामान्य वितरण का एक संस्करण है, जिसका डोमेन एक कारक मानक विचलन द्वारा बढ़ाया गया है और फिर द्वारा औसत मान का अनुवाद किया गया है:
प्रायिकता घनत्व द्वारा स्केल किया जाना चाहिए जिससे की समाकलन 1 के रूप में होता है।
यदि एक मानक सामान्य विचलन के रूप में है, तो अपेक्षित मान के साथ एक सामान्य वितरण होता है और मानक विचलन . के बराबर है और मानक सामान्य वितरण के एक कारक द्वारा विस्तारित किया जा सकता है और इस प्रकार द्वारा स्थानांतरित किया जाता है, एक भिन्न सामान्य वितरण प्राप्त करने के लिए द्वारा स्थानांतरित किया जा सकता है, जिसे कहा जाता है. इसके विपरीत यदि पैरामीटर के साथ एक सामान्य विचलन और के रूप में है फिर यह वितरण को फिर से बढ़ाया जा सकता है और सूत्र के माध्यम से स्थानांतरित किया जा सकता है इसे मानक सामान्य वितरण में बदलने के लिए इस चर को का मानकीकृत रूप भी कहा जाता है.
अंकन
मानक गाऊसी वितरण की प्रायिकता घनत्व को अधिकांशतः ग्रीक अक्षर से निरूपित किया जाता है, इस प्रकार मानक सामान्य वितरण शून्य माध्य और इकाई प्रसरण के साथकिया जा सकता है।[6] ग्रीक अक्षर फी का वैकल्पिक रूप, , भी अधिकांशतः प्रयोग किया जाता है।
सामान्य वितरण को अधिकांशतः या कहा जाता है.[7] इस प्रकार जब एक यादृच्छिक चर सामान्य रूप से माध्य और मानक विचलन , के साथ वितरित किया जाता है, तो कोई
- लिख सकता है
वैकल्पिक मानकीकरण
कुछ लेखक विचलन या वेरिएंस के अतिरिक्त वितरण की चौड़ाई को परिभाषित करने वाले पैरामीटर के रूप में अच्छे का उपयोग करने की वकालत करते हैं और इस प्रकार परिशुद्धता को सामान्यतः वेरिएंस के व्युत्क्रम के रूप में परिभाषित किया जाता है,[8] तब इस प्रकार वितरण का सूत्र बन जाता है,
इस विकल्प का संख्यात्मक संगणना में लाभ होने का दावा किया जाता है शून्य के बहुत निकटतम होता है और कुछ संदर्भों में सूत्रों को सरल करता है, जैसे बहुभिन्नरूपी सामान्य वितरण वाले चर के बायेसियन आंकड़ों में करते हैं।
वैकल्पिक रूप से, मानक विचलन का व्युत्क्रम परिशुद्धता के रूप में परिभाषित किया जा सकता है, जिस स्थिति में सामान्य वितरण की अभिव्यक्ति बन जाती है
स्टिगलर के अनुसार, यह सूत्रीकरण बहुत सरल और याद रखने में आसान सूत्र और वितरण की मात्राओं के लिए सरल अनुमानित सूत्रों के कारण लाभप्रद है।
सामान्य वितरण प्राकृतिक और , पैरामीटर और प्राकृतिक सांख्यिकी x और x2 के साथ एक चरघातांकी फॅमिली बनाते हैं। सामान्य वितरण के लिए दोहरी अपेक्षा पैरामीटर η1 = μ और η2 = μ2 + σ2.के रूप में होते है,
संचयी वितरण फलन
मानक सामान्य वितरण का संचयी वितरण फलन (सीडीएफ), सामान्यतः बड़े ग्रीक अक्षर फाई से दर्शाया जाता है, जो अभिन्न रूप में है
संबंधित त्रुटि फलन एक यादृच्छिक चर की प्रायिकता देता है, इस प्रकार माध्य 0 के सामान्य वितरण के साथ और भिन्नता 1/2 सीमा में गिरती है . इस प्रकार है:
इन समाकलन को प्रारंभिक फलन के संदर्भ में व्यक्त नहीं किया जा सकता है और अधिकांशतः इन्हें विशेष फलन कहा जाता है। चूंकि, कई संख्यात्मक सन्निकटन ज्ञात हैं और इस प्रकार अधिक के लिए सामान्य सीडीएफ और सामान्य क्वांटाइल फलन के लिए संख्यात्मक सन्निकटन देखें।
दो फलन निकट सेसंबंधित हैं, अर्थात्
घनत्व के साथ सामान्य सामान्य वितरण के लिए , अर्थ और विचलन , संचयी वितरण फलन के रूप में होते है
मानक सामान्य सीडीएफ का पूरक, , अधिकांशतः Q फलन कहा जाता है, विशेष रूप से इंजीनियरिंग टेक्स्ट में,[9][10] यह प्रायिकता देता है कि एक मानक सामान्य यादृच्छिक चर का मान के रूप में अधिक हो जाता है : . की अन्य परिभाषाएँ -फलन जिनमें से सभी सरल रूपांतरण हैं , का भी कभी-कभी उपयोग किया जाता है।[11]
मानक सामान्य सीडीएफ के एक फलन का ग्राफ बिंदु (0,1/2) के चारों ओर 2 गुना घूर्णी समरूपता है; वह है, . इसका प्रतिपक्षी (अनिश्चितकालीन अभिन्न) निम्नानुसार व्यक्त किया जा सकता है,
मानक सामान्य वितरण के सीडीएफ को एक श्रृंखला में भागों द्वारा एकीकरण द्वारा विस्तारित किया जा सकता है,
जहाँ डबल क्रमगुणित को दर्शाता है।
बड़े x के लिए सीडीएफ का एक ऐसिम्टाटिक विस्तार द्वारा एकीकरण का उपयोग करके प्राप्त किया जा सकता है और इस प्रकार अधिक जानकारी के लिए, त्रुष्टि फलन #एसिम्प्टोटिक विस्तार देखते है।[12]
टेलर श्रृंखला सन्निकटन का उपयोग करके मानक सामान्य वितरण सीडीएफ के लिए एक त्वरित सन्निकटनके रूप में पाये जाते है,
मानक विचलन और कवरेज
एक सामान्य वितरण से निकाले गए लगभग 68% मान एक मानक विचलन σ माध्य से दूर होते हैं और इस प्रकार लगभग 95% मान दो मानक विचलन के भीतर होते हैं और लगभग 99.7% तीन मानक विचलन के भीतर होते हैं।[4] इस तथ्य को 68–95–99.7 एम्पिरिकल नियम या 3-सिग्मा नियम के रूप में जाना जाता है।
अधिक अच्छे रूप से, एक सामान्य विचलन के बीच की सीमा में होने की प्रायिकता और द्वारा दिया गया है
12 महत्वपूर्ण अंकों के लिए, का मान इस प्रकार हैं,
OEIS | ||||||
---|---|---|---|---|---|---|
1 | 0.682689492137 | 0.317310507863 |
|
OEIS: A178647 | ||
2 | 0.954499736104 | 0.045500263896 |
|
OEIS: A110894 | ||
3 | 0.997300203937 | 0.002699796063 |
|
OEIS: A270712 | ||
4 | 0.999936657516 | 0.000063342484 |
| |||
5 | 0.999999426697 | 0.000000573303 |
| |||
6 | 0.999999998027 | 0.000000001973 |
|
बड़े के लिए कोई सन्निकटन मान .का उपयोग किया जा सकता है
क्वांटाइल फलन
किसी वितरण का क्वांटाइल फलन संचयी वितरण फलन का व्युत्क्रम होता है। मानक सामान्य वितरण के क्वांटाइल फलन को प्रोबिट फलन कहा जाता है और इसे व्युत्क्रम त्रुटि फलन के रूप में संदर्भ में व्यक्त किया जा सकता है,
औसत के साथ एक सामान्य यादृच्छिक चर के लिए और वेरिएंस क्वांटाइल फलन के रूप में है
क्वांटाइल मानक सामान्य वितरण का सामान्य रूप से निरूपित किया जाता है . इन मानों का उपयोग परिकल्पना टेस्ट्स , कॉन्फिडेंस अंतराल के निर्माण और Q-Q प्लॉट में किया जाता है। एक सामान्य यादृच्छिक चर अधिक हो जाता है, इस प्रकार प्रायिकता के साथ अंतराल के बाहर होता है प्रायिकता के साथ . विशेष रूप से, क्वांटाइल 1.96 है; इसलिए केवल 5% स्थितियो में एक सामान्य यादृच्छिक चर अंतराल के बाहर होता है।
निम्न तालिका क्वांटाइल इस प्रकार देती है कि एक निर्दिष्ट प्रायिकता . के साथ श्रेणी के रूप में निर्दिष्ट होता है, ये मान नमूना औसत और ऐसिम्टाटिक रूप से सामान्य वितरण वाले अन्य सांख्यिकीय अनुमानकों के लिए टॉलरेंस अंतराल निर्धारित करने के लिए उपयोगी होते है। ध्यान दें कि निम्न तालिका दिखाती है , नहीं जैसा कि ऊपर परिभाषित किया गया है।
0.80 | 1.281551565545 | 0.999 | 3.290526731492 | |
0.90 | 1.644853626951 | 0.9999 | 3.890591886413 | |
0.95 | 1.959963984540 | 0.99999 | 4.417173413469 | |
0.98 | 2.326347874041 | 0.999999 | 4.891638475699 | |
0.99 | 2.575829303549 | 0.9999999 | 5.326723886384 | |
0.995 | 2.807033768344 | 0.99999999 | 5.730728868236 | |
0.998 | 3.090232306168 | 0.999999999 | 6.109410204869 |
छोटे के लिए , क्वांटाइल फलन में उपयोगी ऐसिम्टाटिक विस्तार के रूप में होते है
[13]
गुण
सामान्य वितरण ही एकमात्र ऐसा वितरण है जिसके पहले दो से परे संचयी शून्य होते हैं। अर्थात् माध्य और प्रसरण के अतिरिक्त यह निर्दिष्ट माध्य और वेरिएंस के लिए अधिकतम एन्ट्रापी प्रायिकता वितरण के साथ निरंतर वितरण है।[14][15] गीरी ने मानते हुए यह दिखाया है कि माध्य और वेरिएंस परिमित रूप में होते है और सामान्य वितरण ही एकमात्र वितरण है जहां स्वतंत्र ड्रा के समुच्चय से गणना की गई माध्य और वेरिएंस एक दूसरे से स्वतंत्र हैं।[16][17]
सामान्य वितरण दीर्घवृत्ताकार वितरण का एक उपवर्ग है। सामान्य वितरण अपने माध्य के बारे में सममित वितरण है और संपूर्ण वास्तविक रेखा पर गैर-शून्य है। जैसे कि यह उन चरों के लिए उपयुक्त मॉडल नहीं हो सकता है जो स्वाभाविक रूप से धनात्मक या दृढ़ता से विषम हैं, जैसे किसी व्यक्ति का वजन या शेयर (वित्त) की कीमत इत्यादि। ऐसे चरों को अन्य वितरण द्वारा अच्छे से वर्णित किया जा सकता है, जैसे लॉग-सामान्य वितरण या पारेटो वितरण इत्यादि।
सामान्य वितरण का मान व्यावहारिक रूप से शून्य होता है जब मान माध्य से कुछ मानक विचलनों से अधिक दूर स्थित होता है, उदाहरण के लिए, तीन मानक विचलनों का प्रसार कुल वितरण के 0.27% को छोड़कर सभी को कवर करता है। इसलिए, यह एक उपयुक्त मॉडल नहीं हो सकता है जब कोई आउटलेर्स मानों के एक महत्वपूर्ण भिन्न की अपेक्षा करता है जो कई मानक विचलन को माध्य से दूर करते हैं और कम से कम वर्ग और अन्य सांख्यिकीय अनुमान विधियां जो सामान्य रूप से वितरित चर के लिए इष्टतम हैं, ऐसे डेटा के लिए अधिकांशतः इस प्रकार प्रयुक्त होने पर अत्यधिक अविश्वसनीय हो जाती हैं। उन स्थितियो में, अधिक भारी टेल्ड वाले वितरण की कल्पना की जानी चाहिए और उचित मजबूत सांख्यिकीय अनुमान विधियों को प्रयुक्त किया जाना चाहिए।
गॉसियन वितरण स्टेबल वितरण के फॅमिली से संबंधित है, जो स्वतंत्र और समान रूप से वितरित यादृच्छिक चर के योगों के आकर्षण हैं | इस प्रकार स्वतंत्र, समान रूप से वितरित वितरण माध्य या वेरिएंस परिमित होते है या नहीं। गॉसियन को छोड़कर जो एक सीमित स्थिति में सभी स्टेबल वितरण में भारी टेल्ड और अनंत वेरिएंस होता है। यह उन कुछ वितरण में से एक है जो स्टेबल हैं और जिनमें प्रायिकता घनत्व फलन के रूप में हैं, जिन्हें विश्लेषणात्मक रूप से व्यक्त किया जा सकता है, अन्य कॉची वितरण और लेवी वितरण हैं।
समरूपता और डेरिवेटिव
घनत्व के साथ सामान्य वितरण (अर्थ और मानक विचलन ) के निम्नलिखित गुण हैं
- यह बिंदु के चारों ओर सममित है, जो एक ही समय में बहुलक सांख्यिकी, माध्यिका और वितरण का माध्य है।[18]
- यह अनिमॉडल है इसका पहला यौगिक के लिए धनात्मक है और के लिए ऋणात्मक और पर केवल शून्य के रूप में है
- वक्र और x-अक्ष से घिरा क्षेत्र इकाई है अर्थात एक के बराबर है।
- इसकी पहली अवकलज के रूप में है
- इसके घनत्व में दो विभक्ति बिंदु होते हैं जहाँ दूसरा अवकलज होता है शून्य है और चिह्न बदलता है, इसका अर्थ एक मानक विचलन दूर स्थित है, अर्थात् और [18]
- इसका घनत्व लघुगणकीय रूप से अवतल फलन है।[18]
- इसका घनत्व असीम रूप से भिन्न फलन है, वास्तव में ऑर्डर 2 का सुपरस्मूथ है।[19]
इसके अतिरिक्त घनत्व मानक सामान्य वितरण में निम्नलिखित गुण भी हैं, अर्थात और )
- इसकी पहली अवकलज है
- इसका दूसरा अवकलज है
- अधिक सामान्यतः, इसकी nवें अवकलज है जहाँ n(प्रायिकतात्मक ) हर्मिट बहुपद है।[20]
- प्रायिकता है कि एक सामान्य रूप से वितरित चर ज्ञात के साथ और एक विशेष समुच्चय में है, इस तथ्य का उपयोग करके गणना की जा सकती है कि भिन्न एक मानक सामान्य वितरण है।
मोमेंट
चर के अपेक्षित मान का प्लैन और निरपेक्ष मोमेंट और गणित के रूप में होते है। यदि अपेक्षित मान का शून्य है, इन पैरामीटर को केंद्रीय मोमेंट कहा जाता है; अन्यथा इन पैरामीटर को गैर-केंद्रीय मोमेंट कहा जाता है। सामान्यतः हम केवल पूर्णांक क्रम वाले मोमेंट .में रुचि रखते हैं
यदि एक सामान्य वितरण है, गैर-केंद्रीय मोमेंट के रूप में उपस्थित हैं और किसी के लिए परिमित हैं जिसका वास्तविक भाग −1 से बड़ा है। किसी भी गैर-ऋणात्मक पूर्णांक के लिए प्लैन केंद्रीय मोमेंट इस प्रकार हैं[21]
यहाँ दोहरे क्रमगुणन को दर्शाता है, अर्थात सभी संख्याओं का गुणनफल से 1 तक जिसमें समान समानता है
केंद्रीय निरपेक्ष मोमेंट सभी समान क्रम के लिए प्लैन मोमेंट के साथ मेल खाते हैं, लेकिन विषम क्रमागत के लिए अशून्य हैं। किसी भी गैर-ऋणात्मक पूर्णांक के लिए इस रूप में होते है
अंतिम सूत्र किसी भी गैर-पूर्णांक के लिए मान्य होते है, अर्थात जब प्लैन और निरपेक्ष मोमेंट को कॉन्फ़्लूएंट हाइपरज्यामितीय फलन और के संदर्भ में व्यक्त किया जा सकता है
ये अभिव्यक्ति मान्य रहते हैं यदि पूर्णांक नहीं है। सामान्यीकृत हर्माइट बहुपद भी देखें।
क्रम | अकेंद्रीय मोमेंट | केंद्रीय मोमेंट |
---|---|---|
1 | ||
2 | ||
3 | ||
4 | ||
5 | ||
6 | ||
7 | ||
8 |
गणितीय की अपेक्षा उस घटना पर आधारित थी सशर्त अन्तराल में द्वारा दिया गया है
जहाँ और क्रमशः घनत्व और संचयी वितरण फलन . के लिए के रूप में होता है, इसे व्युत्क्रम मिल्स अनुपात के रूप में जाना जाता है। ध्यान दें कि ऊपर, घनत्व का व्युत्क्रम मिल्स अनुपात में मानक सामान्य घनत्व के अतिरिक्त प्रयोग किया जाता है, इसलिए यहां हमारे पास के अतिरिक्त . हैं।
फूरियर रूपांतरण और विशिष्ट फलन
एक सामान्य घनत्व का फूरियर रूपांतरण माध्य के साथ और मानक विचलन के रूप में है[22]
जहाँ काल्पनिक इकाई है। यदि माध्य , पहला कारक 1 है और फूरियर ट्रांसफॉर्म एक स्टेबल कारक के अतिरिक्त आवृत्ति डोमेन पर एक सामान्य घनत्व है, इस प्रकार 0 और मानक विचलन के साथ . विशेष रूप से, मानक सामान्य वितरण एक फूरियर रूपांतरण का एक अभिलक्षणिक फलन है।
प्रायिकता सिद्धांत में, एक वास्तविक-मान यादृच्छिक चर के प्रायिकता वितरण का फूरियर रूपांतरण विशेष फलन प्रायिकता सिद्धांत से निकटता से जुड़ा हुआ है उस चर के रूप में होते है, जिसके अपेक्षित मान के रूप में परिभाषित किया गया है वास्तविक चर के एक फलन के रूप में फूरियर रूपांतरण की आवृत्ति पैरामीटर के रूप में होते है। इस परिभाषा को विश्लेषणात्मक रूप से एक सम्मिश्र -मान चर तक बढ़ाया जा सकता है[23] दोनों के बीच संबंध इस प्रकार है,
मोमेंट और संचयी जनरेटिंग फलन
एक वास्तविक यादृच्छिक चर का मोमेंट जनरेटिंग फलन का अपेक्षित मान है और इस प्रकार वास्तविक पैरामीटर के एक फलन के रूप में . घनत्व के साथ सामान्य वितरण के लिए , अर्थ और विचलन , मोमेंट जनरेटिंग फलन के रूप में उपस्थित है और इसके बराबर है
संचयी जनरेटिंग फलन मोमेंट जनरेटिंग फलन का लघुगणक है, अर्थात्
चूँकि यह एक द्विघात बहुपद के रूप में होते है, केवल पहले दो संचयी अशून्य हैं, अर्थात् माध्य और भिन्नता .के रूप में होते है
स्टीन ऑपरेटर और वर्ग
स्टीन की विधि के भीतर स्टीन ऑपरेटर और एक यादृच्छिक चर का वर्ग हैं और सभी बिल्कुल निरंतर फलन का वर्ग .के रूप में होता है
शून्य वेरिएंस सीमा
सीमा में (गणित) जब शून्य हो जाता है, प्रायिकता घनत्व अंततः शून्य हो जाता है , लेकिन यदि ,बिना सीमा के बढ़ता है जबकि इसका समाकल 1 के बराबर रहता है। इसलिए, सामान्य वितरण को साधारण फलन (गणित) के रूप में परिभाषित नहीं किया जा सकता जब होता है
चूंकि, सामान्य वितरण को एक सामान्यीकृत फलन के रूप में शून्य वेरिएंस के साथ परिभाषित किया जा सकता है; विशेष रूप से, डिराक का डेल्टा फलन के रूप में माध्यम से अनुवादित है, इसका सीडीएफ तब माध्य ,द्वारा अनुवादित हैवीसाइड स्टेप फलन है,
अधिकतम एन्ट्रापी
एक निर्दिष्ट माध्य के साथ वास्तविक पर सभी प्रायिकता वितरण में से और वेरिएंस , सामान्य वितरण अधिकतम एंट्रॉp प्रायिकता वितरण वाला एक है।[24] यदि प्रायिकता घनत्व फलन के साथ एक सतत यादृच्छिक चर है और इस प्रकार फिर एन्ट्रापी को परिभाषित किया जाता है[25][26][27]
जहाँ कभी भी शून्य समझा जाता है . इस फलन कार्यात्मकता को अधिकतम किया जा सकता है, इस शर्त के अधीन कि वितरण उचित रूप से सामान्यीकृत है और इसमें वैरिएबल कैलकुलस का उपयोग करके एक निर्दिष्ट भिन्नता है। दो लैग्रेंज गुणक वाले एक फलन को परिभाषित किया गया है
जहाँ अभी के लिए, माध्य के साथ कुछ घनत्व फलन के रूप में माना जाता है और मानक विचलन .के रूप में होता है
अधिकतम एन्ट्रापी पर, एक छोटा बदलाव के बारे में भिन्नता उत्पन्न करता है, के बारे में जो 0 के बराबर होता है
चूंकि यह किसी भी छोटे के लिए होना चाहिए, कोष्ठक में शब्द शून्य के रूप में होता है और यील्ड के लिए हल करना चाहिए:
और को हल करने के लिए कॉन्सट्रेंट समीकरणों का उपयोग करने से सामान्य वितरण का घनत्व प्राप्त होता है:
एक सामान्य वितरण की एन्ट्रॉp बराबर होती है
अन्य गुण
- यदि किसी यादृच्छिक चर का अभिलक्षणिक फलन रूप का है , जहां एक बहुपद है, तो जोज़ेफ़ मार्सिंकीविज़ के नाम पर मार्सिंकीविज़ प्रमेय का दावा है कि अधिक से अधिक एक द्विघात बहुपद हो सकता है, और इसलिए एक सामान्य यादृच्छिक चर है। इस परिणाम का परिणाम यह है कि सामान्य वितरण गैर-शून्य संचयकों की सीमित संख्या (दो) वाला एकमात्र वितरण है।
- यदि और संयुक्त रूप से सामान्य और असंबंधित हैं, तो वे स्वतंत्र हैं। यह आवश्यक है कि और संयुक्त रूप से सामान्य रूप में होते है और इस प्रकार गुणधर्म टिक नहीं पाती। गैर सामान्य यादृच्छिक चर के लिए असंबद्धता का अर्थ स्वतंत्र नहीं होता है।
- एक सामान्य वितरण का दूसरे से कुल्बैक-लीब्लर विचलन द्वारा दिया जाता है,
- सामान्य वितरण के लिए फिशर सूचना मैट्रिक्स wrt गणित> \ mu</ गणित>और >\sigma^2</math> विकर्ण है और फार्म लेता है गणित प्रदर्शन = ब्लॉक> \mathcal I (\mu, \sigma^2) = \begin{pmatrix} \frac{1}{\sigma^2} & 0 \\ 0 & \frac{1}{2\sigma^4} \end{ pmatrix} </ गणित> सामान्य वितरण के लिए फिशर सूचना मैट्रिक्स wrt गणित> \ mu</ गणित>और >\sigma^2</math> विकर्ण है और फार्म लेता है।
- एक सामान्य बंटन के माध्य से पहले का संयुग्मी एक अन्य सामान्य बंटन है।[28] विशेष रूप से, अगर आईआईडी हैं और पूर्व है , फिर के अनुमानक के लिए पश्च वितरण होगा
- सामान्य वितरण की फॅमिली न केवल घातीय फॅमिली (EF) बनाता है, जिससे कि वास्तव में द्विघात विस्थापन फलन (NEF) के साथ एक प्राकृतिक घातीय फॅमिली (NEF) बनाता है। सामान्य वितरण के कई गुण NEF-QVF वितरण, NEF वितरण या EF वितरण के सामान्य गुणों के अनुसार होते हैं।एन NEF or EF के वितरण में 6 फॅमिली के रूप में सम्मलित हैं, जिनमें पॉइसन, गामा, द्विपद और ऋणात्मक द्विपद वितरण के रूप में सम्मलित हैं, जबकि कई सामान्य फॅमिली संभावना और सांख्यिकी में अध्ययन कर रहे हैं
- सूचना ज्यामिति में, सामान्य वितरण की फॅमिली निरंतर वक्रता के साथ एक सांख्यिकीय कई गुना बनाता है . (±1)-कनेक्शन के संबंध में एक ही फॅमिली कई गुना फ्लैट है और .[29]
संबंधित वितरण
केंद्रीय सीमा प्रमेय
केंद्रीय सीमा प्रमेय कहता है कि कुछ बहुत सामान्य स्थितियों के अनुसार कई यादृच्छिक चरों के योग का लगभग सामान्य वितरण होता है। इस प्रकार विशेष रूप से, जहाँ स्वतंत्र और समान रूप से समान वितरण के रूप में होता है और शून्य माध्य और वेरिएंस के साथ समान रूप से वितरित यादृच्छिक चर और उनका माध्य द्वारा मापा जाता है
फिर, जैसे-जैसे बढ़ता है, की प्रायिकता वितरण शून्य माध्य और वेरिएंस .के साथ सामान्य वितरण की ओर प्रवृत्त होता है
प्रमेय को चरों तक बढ़ाया जाता है, जो स्वतंत्र रूप में नहीं हैं या समान रूप से वितरित नहीं हैं यदि कुछ कॉन्सट्रेंट को निर्भरता की डिग्री और वितरण के मोमेंट पर रखा जाता है।
व्यवहार में आने वाले अनेक परीक्षण सांख्यिकी, अंक (सांख्यिकी) और एस्टीमेटर अभ्यास में सामना करते हैं, उनमें कुछ यादृच्छिक चर के योग होते हैं और इससे भी अधिक अनुमानकों को अभिव्यक्ति फलन (सांख्यिकी) के उपयोग के माध्यम से यादृच्छिक चर के योग के रूप में दर्शाया जा सकता है। केंद्रीय सीमा प्रमेय का अर्थ है कि उन सांख्यिकीय पैरामीटर में असमान रूप से सामान्य वितरण होता है।
केंद्रीय सीमा प्रमेय का अर्थ यह भी है कि कुछ वितरण को सामान्य वितरण द्वारा अनुमानित किया जा सकता है, उदाहरण के लिए:
- द्विपद वितरण माध्य के साथ डी मोइवर-लाप्लास प्रमेय है और वेरिएंस बड़े के लिए और के लिए 0 या 1 के बहुत निकटतम रूप में नहीं होते है।
- पैरामीटर के साथ पॉइसन वितरण औसत के साथ लगभग सामान्य रूप में होते है और वेरिएंस , के बड़े मानों के लिए .के रूप में होते है[30]
- ची-वर्ग वितरण औसत के साथ लगभग सामान्य है और वेरिएंस , बड़े के लिए . रूप में होते है
- छात्र का टी-वितरण माध्य 0 और प्रसरण 1 के साथ लगभग सामान्य है जब बड़ी है।
ये अनुमान पर्याप्त रूप से अच्छे हैं या नहीं यह इस बात पर निर्भर करता है कि उनकी आवश्यकता किस प्रयोजन के लिए है और सामान्य वितरण के संयोजन की दर इस तरह के अनुमान वितरण के अंत में कम अच्छे होते हैं।
केंद्रीय सीमा प्रमेय में सन्निकटन त्रुटि के लिए एक सामान्य ऊपरी सीमा बेरी-एसेन प्रमेय द्वारा दी गई है और इस प्रकार सन्निकटन में सुधार एडगेवर्थ विस्तार द्वारा दिया गया है।
इस प्रमेय का उपयोग गॉसियन नॉइज़ के रूप में कई समान नॉइज़ स्रोतों के योग को सही ठहराने के लिए भी किया जा सकता है। इसको AWGN. में दिखाया गया है।
सामान्य चर के संचालन और फलन
प्रायिकता घनत्व फलन संचयी वितरण फलन और एक या एक से अधिक स्वतंत्र या सहसंबद्ध सामान्य चर के किसी भी फलन के व्युत्क्रम संचयी वितरण फलन की गणना रे-ट्रेसिंग की संख्यात्मक विधि से की जा सकती है।[31] (मैटलैब कोड) और इस प्रकार निम्नलिखित अनुभागों में हम कुछ विशेष स्थितियो को देख सकते है।
एकल सामान्य चर पर संचालन
यदि माध्य के साथ सामान्य रूप से वितरित किया जाता है और वेरिएंस , तब
- , किसी भी वास्तविक संख्या के लिए और , भी सामान्य रूप से माध्य के साथ वितरित किया जाता है और मानक विचलन . अर्थात्, रैखिक परिवर्तनों के अनुसार सामान्य वितरण का फॅमिली संवृत रूप में होते है।
- का घातांक लॉग-सामान्य रूप से: eX ~ ln(N (μ, σ2)). वितरित किया जाता है
- का पूर्ण मान सामान्य वितरण |X| ~ Nf (μ, σ2).को फोल्ड कर देता है, यदि इसे अर्ध-सामान्य वितरण के रूप में जाना जाता है।
- सामान्यीकृत अवशिष्टों का निरपेक्ष मान, |X - μ|/σ, में स्वतंत्र की एक डिग्री के साथ ची वितरण होते है। .
- X/σ के वर्ग में स्वतंत्र की एक डिग्री के साथ गैर-केन्द्रीय ची-वर्ग वितरण है: . यदि , वितरण को केवल ची-वर्ग कहा जाता है।
- एक सामान्य चर की लॉग प्रायिकता केवल इसकी प्रायिकता घनत्व फलन का लघुगणक है,चूंकि यह एक मानक सामान्य चर का एक स्केल्ड और स्थानांतरित वर्ग है, इसे स्केल्ड और शिफ्ट किए गए ची-स्क्वेर्ड चर के रूप में वितरित किया जाता है।
- वेरिएबलX का वितरण एक अंतराल [a, b] तक सीमित है, जिसे छोटा सामान्य वितरण कहा जाता है।
- (X- μ)−2 का लेवी वितरण स्थान 0 और स्केल σ2 के साथ है
दो स्वतंत्र सामान्य चर पर संचालन
- यदि और साधन के साथ दो स्वतंत्र ( प्रायिकता सिद्धांत) सामान्य यादृच्छिक चर हैं , और मानक विचलन , , फिर उनका योग भी सामान्य रूप से वितरित किया जाता है, सामान्य रूप से वितरित यादृच्छिक चर का योग माध्य के साथ और वेरिएंस .के रूप में होता है
- विशेष रूप से, यदि और शून्य माध्य और वेरिएंस के साथ स्वतंत्र सामान्य विचलन हैं, तब और शून्य माध्य और वेरिएंस के साथ स्वतंत्र और सामान्य रूप से वितरित होते है यह ध्रुवीकरण की पहचान की एक विशेष स्थिति है।[32]
- यदि , माध्य के साथ दो स्वतंत्र सामान्य विचलन हैं और विचलन , और , यादृच्छिक वास्तविक संख्याएं हैं, इस प्रकार चर भी सामान्य रूप से माध्य के साथ वितरित किया जाता है और विचलन . यह इस प्रकार है कि सामान्य वितरण स्टेबल वितरण घातांक के साथ है
दो स्वतंत्र मानक सामान्य चर पर संचालन
यदि और माध्य 0 और प्रसरण 1 के साथ दो स्वतंत्र मानक सामान्य यादृच्छिक चर के रूप में हैं
- उनका योग और अंतर सामान्य रूप से माध्य शून्य और वेरिएंस .दो के साथ वितरित किया जाता है
- उनका गुणन घनत्व फलन के साथ सामान्य वितरण का अनुसरण करता है[33] इस प्रकार जहाँ दूसरे प्रकार का संशोधित बेसेल फलन है। यह वितरण , पर असंबद्ध शून्य के आसपास सममित है और इसका विशिष्ट फलन प्रायिकता सिद्धांत .के रूप में है
- उनका अनुपात मानक कॉची वितरण का अनुसरण करता है: .
- उनका यूक्लिडियन मानदंड रेले वितरण है।
कई स्वतंत्र सामान्य चर पर संचालन
- स्वतंत्र सामान्य विचलन का कोई भी रैखिक संयोजन एक सामान्य विचलन है।
- यदि स्वतंत्र मानक सामान्य यादृच्छिक चर हैं, तो उनके वर्गों के योग में ची-वर्ग वितरण है और स्वतंत्र की कोटियां इस प्रकार है,
- यदि साधन के साथ सामान्य रूप से वितरित यादृच्छिक चर स्वतंत्र हैं और प्रसरण , तो उनका नमूना माध्य नमूना मानक विचलन से स्वतंत्र है,[34] जिसे बसु के प्रमेय या कोचरन के प्रमेय का उपयोग करके प्रदर्शित किया जा सकता है।[35] इन दो मात्राओं के अनुपात में छात्र का t-वितरण होता है स्वतंत्र की कोटियो के रूप में होती है
- यदि , स्वतंत्र मानक सामान्य यादृच्छिक चर हैं, तो वर्गों के सामान्यीकृत योगों का अनुपात होता है F-वितरण साथ (n, m) स्वतंत्र की कोटियां होती है [36]
एकाधिक सहसंबद्ध सामान्य चर पर संचालन
- सामान्य सदिश का द्विघात रूप, अर्थात द्विघात फलन एकाधिक स्वतंत्र या सहसंबद्ध सामान्य चर का, एक सामान्यीकृत ची-स्क्वायर वितरण है।
घनत्व फलन पर संचालन
विभाजित सामान्य वितरण को विभिन्न सामान्य वितरण के घनत्व फलन के स्केल किए गए वर्गों के रूप में सम्मलित होने और एक में एकीकृत करने के लिए घनत्व को कम करने के संदर्भ में सबसे सीधे परिभाषित किया गया है। इस प्रकार छोटा किया गया सामान्य वितरण एकल घनत्व फलन के एक खंड को फिर से स्केल करने का परिणाम होता है।
अनंत विभाज्यता और क्रैमर की प्रमेय
किसी भी धनात्मक पूर्णांक के लिए , माध्य के साथ कोई भी सामान्य वितरण और वेरिएंस के योग का वितरण है, इस प्रकार स्वतंत्र सामान्य विचलन प्रत्येक माध्य के साथ और वेरिएंस . इस गुणधर्म को अनंत विभाज्यता प्रायिकता कहा जाता है।[37]
इसके विपरीत यदि और स्वतंत्र यादृच्छिक चर और उनकी राशि हैं एक सामान्य वितरण है, फिर दोनों और सामान्य विचलन के रूप में होना चाहिए।[38]
इस परिणाम को क्रैमर के अपघटन प्रमेय के रूप में जाना जाता है और यह कहने के बराबर है कि दो वितरण का कनवल्शन सामान्य है यदि और केवल यदि दोनों सामान्य हैं। क्रैमर के प्रमेय का तात्पर्य है कि स्वतंत्र गैर-गाऊसी चरों के एक रैखिक संयोजन का कभी भी बिल्कुल सामान्य वितरण नहीं होता है, चूंकि यह यादृच्छिक ढंग से निकटता से संपर्क कर सकता है।[39]
बर्नस्टीन की प्रमेय
बर्नस्टीन के प्रमेय में कहा गया है कि यदि और स्वतंत्र हैं और और स्वतंत्र भी हैं, तो X और Y दोनों का सामान्य वितरण अनिवार्य रूप से होते है।[40][41]
अधिक सामान्यतः, यदि स्वतंत्र यादृच्छिक चर हैं, फिर दो भिन्न रैखिक संयोजन और स्वतंत्र रूप में होता है, यदि और केवल यदि सभी सामान्य हैं और , जहाँ के वेरिएंस .को दर्शाता है[40]
एक्सटेंशन
सामान्य वितरण की धारणा प्रायिकता सिद्धांत में सबसे महत्वपूर्ण वितरण होने के कारण यूनीवेरिएट के मानक ढांचे से बहुत आगे तक बढ़ा दिया गया है, जो कि एक आयामी स्थिति (1) के रूप में है और इस प्रकार इन सभी विस्तारों को सामान्य या गाऊसी नियम भी कहा जाता है, इसलिए नामों में एक निश्चित अस्पष्टता उपस्थित होती है।
- बहुभिन्नरूपी सामान्य वितरण के-आयामी यूक्लिडियन स्थान में गॉसियन नियम का वर्णन करता है। एक सदिश X ∈ Rk बहुभिन्नरूपी -सामान्य रूप से वितरित है यदि इसके घटकों का कोई रैखिक संयोजन Σk
j=1aj Xj एक अविभाजित सामान्य वितरण है। इस प्रकार X का प्रसरण एक k×k सममित सकारात्मक-निश्चित आव्यूह V के रूप में है। बहुभिन्नरूपी सामान्य वितरण दीर्घवृत्ताकार वितरण का एक विशेष स्थिति है। जैसे, k = 2 स्थितियो में इसका आइसो-घनत्व लोकी दीर्घवृत्त हैं और यादृच्छिक k के स्थितियो में दीर्घवृत्त हैं। - संशोधित गाऊसी वितरण सामान्य वितरण का एक संशोधित संस्करण है जिसमें सभी ऋणात्मक तत्व 0 पर रीसमुच्चय हो जाते हैं
- सम्मिश्र सामान्य वितरण सम्मिश्र सामान्य सदिश से संबंधित होते है। एक सम्मिश्र सदिश X ∈ Ck सामान्य वितरण कहा जाता है यदि इसके वास्तविक और काल्पनिक दोनों घटक संयुक्त रूप से 2k-आयामी बहुभिन्नरूपी सामान्य वितरण होता है। इस प्रकार X की प्रसरण-सहप्रसरण संरचना को दो आव्यूहों द्वारा वर्णित किया जाता है, जबकि प्रसरण आव्यूह Γ और संबंध आव्यूह C के रूप में दर्शाया गया है।
- आव्यूह सामान्य वितरण सामान्य रूप से वितरित आव्यूह के स्थितियो का वर्णन करता है।
- गॉसियन प्रक्रियाएं सामान्य रूप से वितरित स्टोकेस्टिक प्रक्रियाएं हैं। इन्हें कुछ अनंत-आयामी हिल्बर्ट स्थान H के तत्वों के रूप में देखा जा सकता है और इस प्रकार सामान्य स्थितियो के लिए बहुभिन्नरूपी सामान्य सदिश के अनुरूप होती है k = ∞. एक यादृच्छिक तत्व h ∈ H सामान्य कहा जाता है, यदि किसी स्थिरांक a ∈ H के लिए अदिश गुणन (a, h) एक (अविभाजित) सामान्य वितरण है। ऐसे गॉसियन ऐसे यादृच्छिक तत्व की वेरिएंस संरचना को रैखिक सहप्रसरण ऑपरेटर K: H → H के संदर्भ में वर्णित किया जा सकता है। इस प्रकार कई गाऊसी प्रक्रियाएँ अपने स्वयं के नाम रखने के लिए बहुत लोकप्रिय हो गई है
- ब्राउनी गति
- ब्राउनियन ब्रिज,
- ऑर्नस्टीन-उहलेनबेक प्रक्रिया
- गॉसियन q -वितरण एक सार गणितीय निर्माण है जो सामान्य वितरण के q -एनालॉग का प्रतिनिधित्व करता है।
- q-गाऊसी गॉसियन वितरण का एक एनालॉग है, इस अर्थ में कि यह सॉलिस एंट्रॉp को अधिकतम करता है और एक प्रकार का सॉलिस वितरण है। ध्यान दें कि यह वितरण उपरोक्त गॉसियन q-वितरण से भिन्न होता है।
- कनियादकिस κ-गाऊसी वितरण गॉसियन वितरण का एक सामान्यीकरण है, जो कनियादकिस वितरण से उत्पन्न होता है और जो कनियादाकिस वितरणों में से एक है।
यदि यादृच्छिक चर X में वितरण होता है तो उसके पास दो खण्ड सामान्य वितरण के रूप में होते है।
जहां μ माध्य है और σ1 और σ2 क्रमशः माध्य के बाएँ और दाएँ वितरण के मानक विचलन हैं।
इस वितरण का माध्य, वेरिएंस और तीसरा केंद्रीय मोमेंट निर्धारित किया जाता है,[42]
जहाँ E(X), V(X) और T(X) क्रमशः माध्य, वेरिएंस और तीसरा केंद्रीय मोमेंट के रूप में होता है ।
गॉसियन नियम के मुख्य व्यावहारिक उपयोगों में से एक व्यवहार में आने वाले कई भिन्न -भिन्न यादृच्छिक चरों के प्रयोगसिद्ध वितरण को मॉडल करना है। ऐसे स्थितियो में एक संभावित विस्तार वितरण का एक समृद्ध फॅमिली होता है, जिसमें दो से अधिक पैरामीटर होते है और इसलिए प्रयोगसिद्ध वितरण को अधिक अच्छे रूप से फिट करने में सक्षम होते है इस प्रकार एक्सटेंशन के उदाहरण होते है।
- पियर्सन वितरण — प्रायिकता वितरण का एक चार-पैरामीटर फॅमिली जो विभिन्न विषमता और कर्टोसिस मानों को सम्मलित करने के लिए सामान्य नियम का विस्तार करता है।
- सामान्यीकृत सामान्य वितरण , जिसे घातांक घात वितरण के रूप में भी जाना जाता है और इस प्रकार मोटे या पतले ऐसिम्टाटिक व्यवहार के साथ वितरण टेल्ड की अनुमति देता है।
सांख्यिकीय निष्कर्ष
पैरामीटर का अनुमान
अधिकांशतः ऐसा होता है कि हम सामान्य वितरण के पैरामीटर को नहीं जानते हैं, बल्कि इसके अतिरिक्त उन्हें अनुमान सिद्धांत से करना चाहते हैं। अर्थात एक सामान्य से जनसंख्या से एक नमूना लेकर हम पैरामीटर के अनुमानित मानों को सीखना चाहते है और इस प्रकार और . इस प्रॉब्लम का मानक दृष्टिकोण अधिकतम प्रायिकता विधि है, जिसके लिए लॉग-लाइबिलिटी फलन को अधिकतम करने की आवश्यकता होती है
और के संबंध में अवकलन लेने और पहले क्रम की स्थितियों की परिणामी प्रणाली को हल करने से अधिकतम प्रायिकता अनुमान प्राप्त होता है,
नमूना मतलब
एस्टीमेटर को नमूना माध्य कहा जाता है, क्योंकि यह सभी अवलोकनों का अंकगणितीय माध्य है। आँकड़ा , के लिए पूर्ण और पर्याप्त है और इसलिए लेहमैन-शेफ़े प्रमेय के अनुसार समान रूप से न्यूनतम विचरण निष्पक्ष (यूएमवीयू) एस्टीमेटर है।.[43] परिमित नमूनों में यह सामान्य रूप से वितरित किया जाता है:
इस एस्टीमेटर का प्रसरण व्युत्क्रम फिशर सूचना आव्यूह के μμ-तत्व के बराबर है। इसका तात्पर्य है कि एस्टीमेटर परिमित नमूना कुशल रूप में होते है। इस प्रकार व्यावहारिक महत्व का तथ्य यह है कि की मानक त्रुटि (सांख्यिकी) के समानुपातिक होता है, अर्थात यदि कोई मानक त्रुटि को 10 के गुणक से घटाना चाहता है, तो उसे नमूने में अंकों की संख्या 100 के गुणक से बढ़ानी होती है। यह तथ्य जनमत सर्वेक्षणों के लिए नमूना आकार और मोंटे कार्लो सिमुलेशन में परीक्षणों की संख्या को निर्धारित करने में व्यापक रूप से उपयोग किया जाता है।
ऐसिम्टाटिक सिद्धांत (सांख्यिकी) के दृष्टिकोण से संगत एस्टीमेटर है, अर्थात, यह प्रायिकता में अभिसरण के रूप में है, जैसा . एस्टीमेटर भी ऐसिम्टाटिक सामान्यता है, जो इस तथ्य का एक सरल परिणाम है कि यह परिमित नमूनों में सामान्य है:
नमूना वेरिएंस
एस्टीमेटर को नमूना प्रसरण कहा जाता है, क्योंकि यह नमूने का प्रसरण गणित है और इस प्रकार अभ्यास में,और इस प्रकार के अतिरिक्त अधिकांशतः एक अन्य एस्टीमेटर का उपयोग किया जाता है। यह अन्य एस्टीमेटर से निरूपित करते है और इसे नमूना वेरिएंस भी कहा जाता है, जो शब्दावली में एक निश्चित अस्पष्टता का प्रतिनिधित्व करता है और इसका वर्गमूल नमूना मानक विचलन कहा जाता है। एस्टीमेटर , से भिन्न होता है और (n − 1) भाजक में n के अतिरिक्त तथाकथित बेसेल होता है
बीच में अंतर और बड़े n के लिए नगण्य रूप से छोटा हो जाता है। चूंकि परिमित नमूनों में, के उपयोग के p छे की प्रेरणा के रूप में यह है कि यह अंतर्निहित पैरामीटर का निष्पक्ष एस्टीमेटर है, जबकि < पक्षपातपूर्ण है। इसके अतिरिक्त , लेहमन-शेफ़े प्रमेय द्वारा एस्टीमेटर गणित समान रूप से न्यूनतम भिन्नता निष्पक्ष अनुमानक है,[43] जो इसे सभी निष्पक्ष लोगों के बीच सबसे अच्छा एस्टीमेटर बनाता है। चूंकि यह दिखाया जा सकता है कि पक्षपाती एस्टीमेटर से अच्छे से है और इस प्रकार माध्य वर्ग त्रुटि (एमएसई) मानदंड के संदर्भ में के रूप में होती है। परिमित नमूनों में दोनों और के साथ स्केल किया हुआ ची-वर्ग वितरण (n − 1) स्वतंत्र की कोटियां होती है
इन अभिव्यक्ति में से पहला दर्शाता है कि का वेरिएंस के बराबर है, जो व्युत्क्रम फ़िशर सूचना आव्यूह के σσ-तत्व से थोड़ा अधिक होता है। इस प्रकार, के लिए एक कुशल आकलनकर्ता के रूप में नहीं है और इसके अतिरिक्त UMVU के रूप में होते है, हम यह निष्कर्ष निकाल सकते हैं कि परिमित-नमूना कुशल एस्टीमेटर के लिए उपस्थित नहीं होता है।
ऐसिम्टाटिक सिद्धांत को प्रयुक्त करना, दोनों एस्टीमेटर और संगत हैं, अर्थात वे प्रायिकता में अभिमुख होते है नमूना आकार के रूप में होते है, दोनों अनुमानक भी स्पर्शोन्मुख रूप से सामान्य हैं,
विशेष रूप से, दोनों एस्टीमेटर .के लिए स्पर्शोन्मुख रूप से कुशल हैं
कॉन्फिडेंस अंतराल
कोचरन के प्रमेय के अनुसार, सामान्य वितरण के लिए नमूने का अर्थ और नमूना प्रसरण s2 स्वतंत्र (प्रायिकता सिद्धांत हैं, जिसका अर्थ है कि उनके संयुक्त वितरण पर विचार करने से कोई लाभ नहीं हो सकता है। एक विलोम प्रमेय भी है, यदि एक नमूने में नमूना माध्य और नमूना वेरिएंस स्वतंत्र रूप में हैं, तो नमूना सामान्य वितरण के रूप में आया होता है । तथाकथित t-सांख्यिकी के निर्माण के लिए और s के बीच की स्वतंत्र को नियोजित किया जा सकता है,
- गणित>
t = \frac{\hat\mu-\mu}{s/\sqrt{n}} = \frac{\overline{x}-\mu}{\sqrt{\frac{1}{n(n-1) )}\sum(x_i-\overline{x})^2}} \sim t_{n-1} </ गणित>
इस क्वांटाइल t में छात्र का t-वितरण (n − 1) है, इस प्रकार स्वतंत्र की डिग्री और यह एक सहायक आँकड़ा पैरामीटर के मान से स्वतंत्र है। इस t-सांख्यिकी के वितरण को बदलने से हमें μ के लिए कॉन्फिडेंस अंतराल का निर्माण करने की अनुमति मिलती है;[44] इसी तरह, आँकड़ा s2 के χ2 वितरण को उलटने से हमें σ2 के लिए कॉन्फ़िडेंस इंटरवल देता है:[45]
जहां tk,pऔर χ 2
k,p क्रमशः t- और χ2 वितरण की pth मात्राएँ हैं। ये कॉन्फिडेंस इंटरवल आत्मकॉन्फिडेंस स्तर 1 − α के होते हैं, जिसका अर्थ है कि ट्रू मान μ और σ2 प्रायिकता या सार्थकता स्तर α के साथ इन अंतरालों के बाहर आते हैं। इस प्रकार व्यवहार में लोग सामान्यतः α = 5% लेते हैं, जिसके परिणामस्वरूप 95% कॉन्फिडेंस अंतराल के रूप में होता है।
अनुमानित सूत्र और s2 के असिम्प्टोटिक वितरण से प्राप्त किए जा सकते हैं।
अनुमानित सूत्र n के बड़े मानों के लिए मान्य रूप में हो जाते हैं और और मैन्युअल गणना के लिए अधिक सुविधाजनक होते हैं क्योंकि मानक सामान्य क्वांटाइल्स zα/2 n पर निर्भर नहीं होती हैं। विशेष रूप से सबसे लोकप्रिय मान α = 5%, का परिणाम |z0.025| = 1.96 के रूप में होता है,
सामान्य टेस्ट्स
सामान्यता टेस्ट्स इस प्रायिकता का आकलन करते हैं कि दिए गए डेटा समुच्चय {x1, ..., xn} सामान्य वितरण के रूप में होता है। सामान्यतः शून्य परिकल्पना H0 यह है कि टेस्ट्स सामान्य रूप से अनिर्दिष्ट माध्य μ और वेरिएंस σ2 के साथ वितरित किए जाते हैं और इस प्रकार वैकल्पिक Ha कि वितरण यादृच्छिक है। इस प्रॉब्लम के लिए कई टेस्ट्स 40 से अधिक तैयार किए गए हैं। उनमें से अधिक प्रमुख नीचे उल्लिखित हैं
'नैदानिक प्लॉट' अधिक सहज रूप से आकर्षक लेकिन एक ही समय में व्यक्तिपरक होते हैं, क्योंकि वे शून्य परिकल्पना को स्वीकार या अस्वीकार करने के लिए अनौपचारिक मानवीय निर्णय पर भरोसा करते हैं।
- q -q प्लॉट, जिसे सामान्य प्रायिकता प्लॉट या रैंकिट प्लॉट के रूप में भी जाना जाता है - मानक सामान्य वितरण से संबंधित मात्राओं के अपेक्षित मानों के विरुद्ध डेटा समुच्चय से क्रमबद्ध मानों का एक प्लॉट है और इस प्रकार यह फॉर्म के बिंदु का एक प्लॉट (Φ-1(pk), x(k)) है, जहां प्लॉटिंग पॉइंट pk, pk = (k − α)/(n + 1 − 2α) के बराबर हैं और α एक समायोजन स्थिरांक है, जो 0 और 1 के बीच कुछ भी हो सकता है। यदि शून्य परिकल्पना सत्य है, तो प्लॉट किए गए बिंदुओं को लगभग एक सीधी रेखा पर स्थित होना चाहिए।
- p -p प्लॉट - q -q प्लॉट के समान, लेकिन बहुत कम बार उपयोग किया जाता है। इस पद्धति में बिंदुओं की आलेखित करना सम्मलित है (Φ(z(k)), p k), जहाँ . सामान्य रूप से वितरित डेटा के लिए यह प्लॉट (0, 0) और (1, 1) के बीच 45° रेखा पर स्थित होता है।
फिट टेस्ट की गुडनेस :
मोमेंट -आधारित टेस्ट :
- डी'ऑगस्टिनो का k-स्क्वेर्ड टेस्ट
- जर्क-बेरा टेस्ट
- शापिरो-विल्क टेस्ट : यह इस तथ्य पर आधारित है कि q -q प्लॉट में रेखा का प्रवणता σ है। इस प्रकार टेस्ट्स नमूना वेरिएंस के मान के साथ उस प्रवणता के कम से कम वर्गों के अनुमान की तुलना करता है और यदि ये दो मात्राएँ महत्वपूर्ण रूप से भिन्न हैं, तो शून्य परिकल्पना को अस्वीकार कर देता है।
प्रयोगसिद्ध वितरण फलन के आधार पर टेस्ट :
- एंडरसन-डार्लिंग टेस्ट
- लिलिफ़ोर्स टेस्ट्स (कोल्मोगोरोव-स्मिर्नोव टेस्ट्स का एक रूपांतर)
सामान्य वितरण का बायेसियन विश्लेषण
सामान्य रूप से वितरित डेटा का बायेसियन विश्लेषण कई भिन्न -भिन्न संभावनाओं के रूप में सम्मिश्र है जिन पर विचार किया जा सकता है,
- या तो माध्य या प्रसरण या दोनों में से किसी को भी निश्चित क्वांटाइल नहीं माना जा सकता है।
- जब भिन्नता अज्ञात होती है, तो विश्लेषण सीधे भिन्नता के संदर्भ में या परिशुद्धता (सांख्यिकी) भिन्नता के पारस्परिक के संदर्भ में किया जा सकता है। सूत्रों को सटीकता के रूप में व्यक्त करने का कारण यह है कि अधिकांश स्थितियो का विश्लेषण सरल रूप में होता है।
- दोनों अविभाज्य और बहुभिन्न रूपी सामान्य वितरण स्थितियो पर विचार करने की आवश्यकता है।
- अज्ञात चर पर या तो संयुग्म पूर्व या अनुचित पूर्व वितरण के रूप में होते है ।
- बायेसियन रैखिक प्रतिगमन में स्थितियो का एक अतिरिक्त समुच्चय होता है, जहां मूल मॉडल में डेटा को सामान्य रूप से वितरित माना जाता है और सामान्य प्रायर को प्रतिगमन गुणांक पर रखा जाता है। इस प्रकार परिणामी विश्लेषण स्वतंत्र रूप से वितरित डेटा के मूल स्थितियो के समान है।
गैर-रैखिक-प्रतिगमन स्थितियो के सूत्रों को संयुग्मित पूर्व लेख में संक्षेपित किया गया है।
दो द्विघातों का योग
अदिश रूप
निम्नलिखित सहायक सूत्र पोस्टीरियर वितरण अद्यतन समीकरणों को सरल बनाने के लिए उपयोगी है, जो अन्यथा बहुत कठिन रूप में होते है।
यह समीकरण वर्गों का विस्तार करके, x में पदों को समूहित करते है और वर्ग को पूरा करके x में दो द्विघातों के योग को फिर से लिखता है। कुछ शर्तों से जुड़े सम्मिश्र निरंतर कारकों के बारे में निम्नलिखित पर ध्यान देते है
- कारण y और z के भारित औसत का रूप है।
- इससे पता चलता है कि इस कारक को एक ऐसी स्थिति के परिणामस्वरूप माना जा सकता है, जहां मात्राओं के गुणक व्युत्क्रम a और b सीधे जुड़ते हैं, इसलिए a और b को संयोजित करने के लिए, परिणाम को फिर से प्राप्त करना, मूल इकाइयाँ को जोड़ना और पुनः प्राप्त करना आवश्यक होता है। यह उसी तरह का ऑपरेशन है जो अनुकूल माध्य द्वारा किया जाता है, इसलिए यह आश्चर्यजनक नहीं है a और b का वन हाफ हार्मोनिक माध्य है।
सदिश रूप
दो सदिश चतुष्कोणों के योग के लिए एक समान सूत्र लिखा जा सकता है, यदि x, y, z लंबाई k के सदिश हैं और A और B सममित आव्यूह के रूप में हैं और आकार के व्युत्क्रमणीय आव्यूह , तब इस प्रकार हैं,
जहाँ
ध्यान दें कि रूप x′ A x को द्विघात रूप कहा जाता है और यह एक अदिश (गणित) है
दूसरे शब्दों में, यह x से तत्वों के जोड़े के गुणन के सभी संभावित संयोजनों को जोड़ता है, प्रत्येक के लिए एक भिन्न गुणांक का सारांश देता इसके अतिरिक्त है, चूंकि , केवल योग a के किसी भी ऑफ-डायगोनल तत्वों के लिए मायने रखता है और यह मानने में व्यापकता का कोई नुकसान नहीं है कि a सममित आव्यूह है। इसके अतिरिक्त यदि a सममित है, तो फॉर्म के रूप में होते है
माध्य से भिन्नताओं का योग
एक अन्य उपयोगी सूत्र इस प्रकार है:
ज्ञात वेरिएंस के साथ
i.i.d के एक समुच्चय के लिए सामान्य रूप से वितरित डेटा बिंदु X का आकार n है, जहां प्रत्येक व्यक्तिगत बिंदु x का अनुसरण करता है इस प्रकार ज्ञात वेरिएंस σ2 के साथ संयुग्म पूर्व वितरण भी सामान्य रूप से वितरित किया जाता है।
प्रसरण को परिशुद्धता सांख्यिकी के रूप में फिर से लिखकर, अर्थात τ = 1/σ2 का उपयोग करके इसे अधिक आसानी से दिखाया जा सकता है। तो यदि और हम निम्नानुसार आगे बढ़ते हैं।
सबसे पहले, प्रायिकता फलन माध्य से अंतर के योग के लिए उपरोक्त सूत्र का उपयोग करता है
फिर, हम निम्नानुसार आगे बढ़ते हैं:
उपरोक्त अवकलज में, हमने दो द्विघातों के योग के लिए उपरोक्त सूत्र का उपयोग किया और μ को सम्मलित न करने वाले सभी स्टेबल कारकों को हटा दिया है। परिणाम औसत के साथ सामान्य वितरण का कर्नेल सांख्यिकी और सटीकता है, अर्थात।
इसे पूर्व पैरामीटर के संदर्भ में पोस्टीरियर पैरामीटर के लिए बायेसियन अद्यतन समीकरणों के एक समुच्चय के रूप में लिखा जा सकता है
अर्थात nτ की कुल सटीकता के साथ n डेटा बिंदुओं को संयोजित करने के लिए या समकक्ष, n/σ2 का कुल प्रसरण और मानों का माध्य , डेटा की कुल सटीकता को पूर्व कुल परिशुद्धता में जोड़कर एक नई कुल सटीकता प्राप्त करता है और एक सटीक-भारित औसत के माध्यम से एक नया माध्य बनाता है, अर्थात डेटा का भारित औसत और पूर्व माध्य का भारित औसत प्रत्येक को संबंधित कुल परिशुद्धता द्वारा भारित किया जाता है। यह तर्कसंगत समझ में आता है यदि सटीकता को टिप्पणियों की निश्चितता के संकेत के रूप में माना जाता है पोस्टीरियर माध्य के वितरण में प्रत्येक इनपुट घटक को इसकी निश्चितता से भारित किया जाता है और इस वितरण की निश्चितता व्यक्तिगत निश्चितताओं का योग है, इसके अंतर्ज्ञान के लिए उस अभिव्यक्ति की तुलना करते है जो संपूर्ण है या उसके भागों के योग से अधिक है। इसके अतिरिक्त , विचार करते है कि पोस्टीरियर का ज्ञान पूर्व और प्रायिकता के ज्ञान के संयोजन से आता है, इसलिए यह समझ में आता है कि हम इसके किसी भी घटक की तुलना में इसके बारे में अधिक निश्चित हैं।
उपरोक्त सूत्र से पता चलता है कि सटीकता के संदर्भ में सामान्य वितरण के लिए संयुग्मित प्रायर का बायेसियन विश्लेषण करना अधिक सुविधाजनक होता है। पोस्टीरियर परिशुद्धता केवल पूर्व और प्रायिकता की सटीकता का योग है और पोस्टीरियर माध्य की गणना एक सटीक-भारित औसत के माध्यम से की जाती है, जैसा कि ऊपर वर्णित है। समान सूत्रों को वेरिएंस के रूप में लिखा जा सकता है और इस प्रकार सभी पूर्वसूचकों का आदान-प्रदान करके अधिक अजली सूत्रों को जनरेटिंग किया जा सकता है
ज्ञात माध्य के साथ
i.i.d के एक समुच्चय के लिए सामान्य रूप से वितरित डेटा बिंदु X का आकार n है जहां प्रत्येक व्यक्तिगत बिंदु x अनुसरण करता है ज्ञात माध्य μ के साथ, वेरिएंस से पहले के संयुग्म में एक व्युत्क्रम गामा वितरण या एक स्केल्ड व्युत्क्रम ची-वर्ग वितरण होता है। इस प्रकार भिन्न -भिन्न पैरामीटर होने के अतिरिक्त दोनों समान हैं। यद्यपि व्युत्क्रम गामा का अधिक सामान्य रूप से उपयोग किया जाता है, हम सुविधा के लिए स्केल्ड व्युत्क्रम ची-वर्ग का उपयोग करते हैं। σ2 के लिए प्रायर इस प्रकार है,
उपरोक्त प्रायिकता फलन वेरिएंस के संदर्भ में लिखा गया है:
जहाँ
तब:
उपरोक्त एक स्केल्ड इनवर्स ची-स्क्वेर्ड वितरण है जहाँ
या समकक्ष
व्युत्क्रम गामा वितरण के संदर्भ में पुनर्मान के रूप में अंकन परिणाम है:
अज्ञात माध्य और अज्ञात वेरिएंस के साथ
i.i.d के एक समुच्चय के लिए सामान्य रूप से वितरित डेटा बिंदु X का आकार n है जहां प्रत्येक व्यक्तिगत बिंदु x अनुसरण करता है इस प्रकार अज्ञात माध्य μ और अज्ञात वेरिएंस σ2 के साथ एक संयुक्त बहुभिन्नरूपी संयुग्म पूर्व को माध्य और वेरिएंस पर रखा जाता है, जिसमें सामान्य- व्युत्क्रम -गामा वितरण के रूप में सम्मलित है। तर्कसंगत रूप से, यह निम्नानुसार उत्पन्न होता है,
- अज्ञात माध्य लेकिन ज्ञात वेरिएंस वाले स्थितियो के विश्लेषण से, हम देखते हैं कि अद्यतन समीकरणों में डेटा से गणना किए गए पर्याप्त आँकड़े के रूप में सम्मलित होते हैं, जिसमें डेटा बिंदुओं का माध्य और डेटा बिंदुओं की संख्या से विभाजित ज्ञात विचरण से बदले में गणना किए गए डेटा बिंदुओं का कुल विचरण सम्मलित होता है।
- अज्ञात वेरिएंस लेकिन ज्ञात माध्य वाले स्थितियो के विश्लेषण से, हम देखते हैं कि अद्यतन समीकरणों में डेटा बिंदुओं की संख्या और अज्ञात विचलन के योग वाले डेटा पर पर्याप्त आँकड़े सम्मलित हैं।
- ध्यान रखें कि जब आगे के डेटा को हैंडल किया जाता है तो पोस्टीरियर अद्यतन मान पूर्व वितरण के रूप में फलन करता है। इस प्रकार, हमें तर्कसंगत रूप से अपने पूर्ववर्तियों के बारे में पर्याप्त आंकड़ों के संदर्भ में जितना संभव हो उतना समान शब्दार्थों को ध्यान में रखते हुए सोचना चाहिए।
- उस स्थितियो को संभालने के लिए जहां माध्य और वेरिएंस दोनों अज्ञात हैं, हम माध्य और वेरिएंस पर स्वतंत्र प्राथमिकताओ के रूप में रख सकते हैं, इस प्रकार औसत माध्य के निश्चित अनुमानों के साथ, कुल वेरिएंस पूर्व में वेरिएंस की गणना करने के लिए उपयोग किए जाने वाले डेटा बिंदुओं की संख्या और अज्ञात का योग विचलन करते है। चूंकि ध्यान दें कि वास्तव में, माध्य का कुल वेरिएंस अज्ञात वेरिएंस पर निर्भर करता है और अज्ञात विचलन का योग जो वेरिएंस के रूप में अज्ञात माध्य पर निर्भर करता है। इस प्रकार व्यवहार में, बाद की निर्भरता अपेक्षाकृत महत्वहीन रूप में होती है, वास्तविक माध्य को स्थानांतरित करने से उत्पन्न अंक एक समान राशि से बदल जाते हैं और औसतन अज्ञात विचलन समान रहता है। चूंकि, माध्य के कुल वेरिएंस के साथ ऐसा नहीं होता है, जैसे ही अज्ञात वेरिएंस बढ़ता है, माध्य का कुल वेरिएंस आनुपातिक रूप से बढ़ जाता है और हम इस निर्भरता को पकड़ना चाहते हैं।
- इससे पता चलता है कि हम अज्ञात वेरिएंस पर माध्य से पहले एक सशर्त बनाते हैं, जिसमें एक हाइपरपैरामीटर पूर्व से जुड़े प्सयूडो -अवलोकन के माध्य को निर्दिष्ट करता है और एक अन्य पैरामीटर प्सयूडो टिप्पणियों की संख्या को निर्दिष्ट करता है। यह संख्या भिन्नता पर स्केलिंग पैरामीटर के रूप में फलन करती है, जिससे वास्तविक भिन्नता पैरामीटर के सापेक्ष माध्य के समग्र भिन्नता को नियंत्रित करना संभव हो जाता है। वेरिएंस के पूर्व में भी दो हाइपरपरमेटर्स होते हैं, एक पूर्व से जुड़े प्सयूडो -अवलोकनों के वर्ग विचलन के योग को निर्दिष्ट करता है और दूसरा एक बार फिर से प्सयूडो -टिप्पणियों की संख्या को निर्दिष्ट करता है। ध्यान दें कि प्रत्येक पूर्व में प्सयूडो -अवलोकन की संख्या निर्दिष्ट करने वाला एक हाइपरपैरामीटर होता है और प्रत्येक स्थितियो में यह उस पूर्व के सापेक्ष भिन्नता को नियंत्रित करता है। इन्हें दो भिन्न -भिन्न हाइपरपैरामीटर के रूप में दिखाया जाता है जिससे की दो प्रायर के प्रसरण को भिन्न -भिन्न विधियों को नियंत्रित किया जा सके।
- यह तुरंत सामान्य- व्युत्क्रम -गामा वितरण की ओर ले जाता है, जो अभी-अभी परिभाषित दो वितरण का गुणन है, जिसमें संयुग्मित प्रायर का उपयोग किया जाता है, वेरिएंस पर एक व्युत्क्रम गामा वितरण और माध्य पर एक सामान्य वितरण वेरिएंस पर सशर्त के रूप में होता है और उन्हीं चार पैरामीटर के साथ अभी-अभी परिभाषित किया जाता है।
प्राथमिकताओं को सामान्य रूप से निम्नानुसार परिभाषित किया जाता है
अद्यतन समीकरण इस प्रकार प्राप्त किए जा सकते हैं और निम्नानुसार दिखाया जाता है
प्सयूडो टेस्ट्स की संबंधित संख्या वास्तविक टेस्ट्स की संख्या को उनके साथ जोड़ती है। नया माध्य हाइपरपैरामीटर एक बार फिर भारित औसत के रूप में होता है, इस बार अवलोकनों की सापेक्ष संख्या द्वारा भारित किया गया है। इस प्रकार अंत में के लिए अद्यतन ज्ञात माध्य की स्थितियो के समान है, लेकिन इस स्थितियो में वर्ग विचलन का योग सही माध्य के अतिरिक्त देखे गए डेटा माध्य के संबंध में लिया जाता है और परिणामस्वरूप एक नई अंतःक्रिया शब्द की आवश्यकता होती है इस प्रकार पूर्व और डेटा माध्य के बीच विचलन से उत्पन्न अतिरिक्त त्रुटि स्रोत का ध्यान रखने के लिए जोड़ा जाता है।
The prior distributions are
Therefore, the joint prior is
The likelihood function from the section above with known variance is:
Writing it in terms of variance rather than precision, we get:
where
Therefore, the posterior is (dropping the hyperparameters as conditioning factors):
In other words, the posterior distribution has the form of a product of a normal distribution over times an inverse gamma distribution over , with parameters that are the same as the update equations above.
घटना और अनुप्रयोग
व्यावहारिक समस्याओं में सामान्य वितरण की घटना को सामान्यतः रूप से चार श्रेणियों में वर्गीकृत किया जा सकता है
- बिल्कुल सामान्य वितरण ;
- लगभग सामान्य नियम, उदाहरण के लिए जब इस तरह के सन्निकटन को केंद्रीय सीमा प्रमेय द्वारा उचित ठहराया जाता है
- वितरण सामान्य के रूप में तैयार किया गया सामान्य वितरण किसी दिए गए माध्य और वेरिएंस के लिए अधिकतम एन्ट्रापी के सिद्धांत के साथ वितरण है।
- प्रतिगमन समस्याएं - व्यवस्थित अभिव्यक्ति के बाद पाए जाने वाले सामान्य वितरण को पर्याप्त रूप से अच्छी तरह से प्रतिरूपित किया जाता है।
यथार्थ नोर्मेलिटी
भौतिकी में कुछ मात्राएँ सामान्य रूप से वितरित की जाती हैं, जैसा कि पहले जेम्स क्लर्क मैक्सवेल द्वारा प्रदर्शित किया गया था। ऐसी मात्राओं के उदाहरण इस प्रकार हैं,
- एक क्वांटम हार्मोनिक ऑसिलेटर में मूल अवस्था का प्रायिकता घनत्व फलन प्रदर्शित किया गया है।
- एक कण की स्थिति जो विसरण का अनुभव करती है। यदि प्रारंभ में कण एक विशिष्ट बिंदु पर स्थित है अर्थात इसका प्रायिकता वितरण डिराक डेल्टा फलन है, तो समय t के बाद इसका स्थान वेरिएंस t के साथ एक सामान्य वितरण द्वारा वर्णित किया गया है, जो प्रसार समीकरण को .इस प्रकार संतुष्ट करता है, यदि प्रारंभिक स्थान एक निश्चित घनत्व फलन द्वारा दिया गया है, फिर समय t पर घनत्व g(x) और सामान्य Pdf का कनवल्शन है।
अनुमानित नोर्मेलिटी
लगभग सामान्य वितरण कई स्थितियों में होते हैं, जैसा कि केंद्रीय सीमा प्रमेय द्वारा समझाया गया है। जब परिणाम कई छोटे अभिव्यक्ति से जोड़कर और स्वतंत्र रूप से फलन करता है, तो इसका वितरण सामान्य के निकटतम होता है । सामान्य सन्निकटन मान्य नहीं होता है यदि अभिव्यक्ति गुणात्मक रूप से फलन करते हैं योगात्मक के अतिरिक्त यदि कोई बाहरी अभिव्यक्ति है, जो बाकी अभिव्यक्ति की तुलना में बहुत बड़ा परिमाण प्रदान करते है।
- गिनती की समस्याओं में, जहां केंद्रीय सीमा प्रमेय में असतत-से-निरंतर सन्निकटन के रूप में सम्मलित है और जहां अनंत विभाज्यता और अविघटनीय वितरण सम्मलित हैं, जैसे
- द्विपद यादृच्छिक चर, द्विआधारी प्रतिक्रिया चर के साथ जुड़े होते है
- पॉसन वितरण , दुर्लभ घटनाओं से जुड़े होते है
- ऊष्मीय विकिरण में बोस-आइंस्टीन आँकड़े हैं, बोस-आइंस्टीन वितरण बहुत कम समय के पैमाने पर और केंद्रीय सीमा प्रमेय के कारण लंबे समय के पैमाने पर एक सामान्य वितरण के रूप में होते है।
अनुमानित नोर्मेलिटी
इसे केवल सामान्य वक्र की घटनाओं को ही बड़ी असामान्य घटना के रूप में पहचान सकता हूं। इस कारण कुछ वितरणों में इसे अंदाजन लगभग अनुमानित किया गया है और इसकी सुंदर सादगी के कारण शायद हम इसे किसी सैद्धांतिक जांच के पहले सन्निकटन के रूप में प्रयुक्त कर सकते हैं।
प्रयोगसिद्ध रूप से उस धारणा का टेस्ट्स करने के लिए सांख्यिकीय विधि हैं; उपरोक्त सामान्यता टेस्ट्स अनुभाग देखें।
- जीव विज्ञान में, विभिन्न चरों के लघुगणक में एक सामान्य वितरण होता है, अर्थात उदाहरण सहित पुरुष/महिला उप-जनसंख्या पर पृथक्करण के बाद उनका एक लॉग सामान्य वितरण होता है:
- जीवित ऊतक के आकार की माप लंबाई, ऊंचाई, त्वचा क्षेत्र, वजन इस श्रेणी में आती है;[46]
- जैविक नमूनों के अक्रिय उपांगों के बाल, पंजे, नाखून, दांतों की लंबाई, वृद्धि की दिशा में संभवतः पेड़ की छाल की मोटाई भी इसी श्रेणी में आती है
- कुछ शारीरिक माप, जैसे वयस्क मनुष्यों का रक्तचाप इस श्रेणी में आती है।
- वित्त में, विशेष रूप से ब्लैक-स्कोल्स मॉडल, विनिमय दरों, मान सूचकांकों और शेयर बाजार सूचकांकों के लघुगणक में परिवर्तन को सामान्य माना जाता है, ये चर चक्रवृद्धि ब्याज की तरह व्यवहार करते हैं, साधारण ब्याज की तरह नहीं और इसलिए गुणक के रूप में होते है। बेनोइट मंडेलब्रॉट जैसे कुछ गणितज्ञों ने तर्क दिया है कि लॉग-लेवी वितरण जिसमें भारी टेल्ड होती है और इस प्रकार विशेष रूप से स्टॉक मार्केट क्रैश के विश्लेषण के लिए अधिक उपयुक्त मॉडल होता है। नसीम निकोलस तालेब ने अपने फलन में वित्तीय मॉडल में होने वाले सामान्य वितरण की धारणा के उपयोग की भी आलोचना की है।
- भौतिक प्रयोगों में अनिश्चितता का प्रसार अधिकांशतः सामान्य वितरण द्वारा प्रतिरूपित किया जाता है। सामान्य वितरण के इस प्रयोग का अर्थ यह नहीं है कि कोई यह मान रहा है कि माप त्रुटियां सामान्य रूप से वितरित की जाती हैं, बल्कि सामान्य वितरण का उपयोग करने से त्रुटियों के माध्य और वेरिएंस के बारे में केवल ज्ञान दिया जा सकता है।[47]
- मानकीकृत टेस्ट्स (सांख्यिकी) में, परिणामों को या तो प्रश्नों की संख्या और कठिनाई इंटेलिजेंस भागफल के रूप में चयन करके या सामान्य वितरण में फिट करके कच्चे टेस्ट्स स्कोर को आउटपुट स्कोर में बदलकर सामान्य वितरण किया जा सकता है। उदाहरण के लिए, SAT की 200-800 की पारंपरिक सीमा 500 के माध्य और 100 के मानक विचलन के साथ एक सामान्य वितरण पर आधारित है।
- कई अंक सामान्य वितरण से प्राप्त होते हैं, जिनमें प्रतिशतक रैंक (प्रतिशत या मात्रा), सामान्य वक्र समकक्ष, स्टैनिन, मानक स्कोर, जेड-स्कोर और t-स्कोर के रूप में सम्मलित हैं। इसके अतिरिक्त, कुछ व्यवहारिक सांख्यिकीय प्रक्रियाएं मानती हैं कि स्कोर सामान्य रूप से वितरित किए जाते हैं; उदाहरण के लिए, विद्यार्थी का t-टेस्ट्स और प्रसरण का विश्लेषण बेल वक्र ग्रेडिंग स्कोर के सामान्य वितरण के आधार पर संबंधित ग्रेड प्रदान करती है।
- जल विज्ञान में लंबी अवधि के नदी प्रवाह या वर्षा का वितरण मासिक और वार्षिक योग, केंद्रीय सीमा प्रमेय के अनुसार अधिकांशतः व्यावहारिक रूप से सामान्य माना जाता है।[48] कमफ़्रीक के साथ बनाई गई नीली तस्वीर, द्विपद वितरण के आधार पर 90% आत्मविश्वास बेल्ट दिखाते हुए अक्टूबर की बारिश के लिए सामान्य वितरण को फिट करने का एक उदाहरण दिखाती है। संचयी बारंबारता विश्लेषण के भाग के रूप में वर्षा के आंकड़ों को प्लॉटिंग स्थितियों द्वारा दर्शाया जाता है।
पद्धति संबंधी समस्याएं और पीयर रिव्यू
जॉन आयोनिडिस का तर्क है कि सामान्य रूप से वितरित मानक विचलन का उपयोग अनुसंधान निष्कर्षों को मान्य करने के लिए मानकों के रूप में उन घटनाओं के बारे में मिथ्यात्व छोड़ देता है, जो सामान्य रूप से वितरित नहीं होते हैं। इसमें सम्मलित हैं उदाहरण के लिए, ऐसी घटनाएँ जो केवल तब प्रकट होती हैं जब सभी आवश्यक शर्तें उपस्थित होती हैं और एक दूसरे के लिए एक अतिरिक्त विधि से और ऐसी घटनाओं का विकल्प नहीं हो सकता है जो यादृच्छिक रूप से वितरित नहीं होती हैं। जॉन आयोनिडिस का तर्क है कि मानक विचलन-केंद्रित सत्यापन परिकल्पनाओं और सिद्धांतों को वैधता का एक झूठा रूप देता है जहां कुछ लेकिन सभी गलत भविष्यवाणियां सामान्य रूप से वितरित नहीं की जाती हैं क्योंकि गलत अनुमानों के भाग के बाद से सबूत हो सकता है और कुछ स्थितियो में गैर-सामान्य रूप से हो सकता है मिथ्याकरण भविष्यवाणियों की श्रेणी के वितरित भाग के निराधार रूप से उन परिकल्पनाओं को अस्वीकार कर देती है, जिनके लिए कोई भी मिथ्यापूर्ण भविष्यवाणियां सामान्य रूप से वितरित नहीं की जाती हैं जैसे कि वे असत्य थीं जब वास्तव में वे मिथ्यावाचक भविष्यवाणियां करती हैं। आयोनिडिस द्वारा यह तर्क दिया जाता है कि अनुसंधान पत्रिकाओं द्वारा मान्यता प्राप्त पारस्परिक रूप से अनन्य सिद्धांतों के कई स्थितियो गैर-सामान्य रूप से वितरित भविष्यवाणियों के प्रयोगसिद्ध मिथ्याकरण में पत्रिकाओं की विफलता के कारण होते हैं और इसलिए नहीं कि पारस्परिक रूप से अनन्य सिद्धांत सत्य हैं, जो वे नहीं कर सकते है, चूंकि दो परस्पर अनन्य सिद्धांत दोनों गलत हो सकते हैं और तीसरा सही हो सकता है।[49]
अभिकलनी विधियाँ
सामान्य वितरण से मान निकालना
कंप्यूटर सिमुलेशन में, विशेष रूप से मोंटे-कार्लो पद्धति के अनुप्रयोगों में, सामान्य रूप से वितरित मानों को उत्पन्न करना अधिकांशतः वांछनीय होता है। इस प्रकार नीचे सूचीबद्ध सभी कलनविधि मानक सामान्य विचलन उत्पन्न करते हैं, क्योंकि a N(μ, σ2) को X = μ + σZ के रूप में उत्पन्न किया जा सकता है, जहां Z मानक सामान्य रूप में है। ये सभी कलनविधि एक यादृच्छिक संख्या जनरेटर U की उपलब्धता पर निर्भर करते हैं जो समान यादृच्छिक चर उत्पन्न करने में सक्षम है।
- सबसे सीधी विधि प्रायिकता अभिन्न परिवर्तन प्रॉपर्टी पर आधारित होती है, यदि U को (0,1) पर समान रूप से वितरित किया जाता है, तो Φ−1(U) का मानक सामान्य वितरण होता है । इस पद्धति का दोष यह है कि यह प्रोबिट फलन Φ1 की गणना पर निर्भर करता है, जो विश्लेषणात्मक रूप से नहीं किया जा सकता। कुछ अनुमानित विधियों का वर्णन हार्ट 1968 और ईआरएफ लेख में किया गया है। विचुरा इस फलन को 16 दशमलव स्थानों पर गणना करने के लिए एक तेज़ कलनविधि देता है,[50] जिसका उपयोग R प्रोग्रामिंग भाषा द्वारा सामान्य वितरण के यादृच्छिक चर की गणना करने के लिए किया जाता है।
- एक आसान से प्रोग्राम अनुमानित दृष्टिकोण जो केंद्रीय सीमा प्रमेय पर निर्भर करता है, वह इस प्रकार है, 12 समान U(0,1) विचलन उत्पन्न करते है, उन सभी को जोड़ने और 6 घटाने से परिणामी यादृच्छिक चर का मानक सामान्य वितरण होता है । इस प्रकार वास्तव में, वितरण इरविन-हॉल वितरण होता है | इरविन-हॉल, जो सामान्य वितरण के लिए 12-खंड ग्यारहवें-क्रम बहुपद सन्निकटन के रूप में होते है। इस यादृच्छिक विचलन की सीमित सीमा (-6, 6) के रूप में होती है।[51] ध्यान दें कि एक सामान्य सामान्य वितरण में, सभी नमूनों का केवल 0.00034% ±6σ से बाहर होते है।
- बॉक्स-मुलर विधि दो स्वतंत्र यादृच्छिक संख्या U और V (0,1) पर वितरित समान वितरण का उपयोग करती है। फिर दो यादृच्छिक चर X और Y के रूप में होते हैदोनों का मानक सामान्य वितरण होता है और स्वतंत्र रूप में होती है। यह सूत्रीकरण इसलिए उत्पन्न होता है क्योंकि द्विभाजित सामान्य यादृच्छिक सदिश (X, Y) के लिए अज्ञात मानदंड X2 + Y2 स्वतंत्र की दो डिग्री के साथ ची-वर्ग वितरण होता है , जो इन समीकरणों में -2ln(U) क्वांटाइल के अनुरूप आसानी से उत्पन्न घातांक वितरण है और कोण को वृत्त के चारों ओर समान रूप से वितरित किया जाता है, जिसे यादृच्छिक चर V द्वारा चुना जाता है।
- मार्सग्लिया ध्रुवीय विधि बॉक्स-मुलर विधि का एक संशोधन है, जिसमें साइन और कोसाइन फलन की गणना की आवश्यकता नहीं होती है। इस विधि में, U और V एकसमान (−1,1) वितरण से निकाले जाते हैं, और फिर S = U2 + V2 की गणना की जाती है। यदि S 1 से अधिक या बराबर है, तो विधि फिर से शुरू होती है, अन्यथा दो मात्राएँ इस प्रकार होती हैफिर से वापस कर दिए जाते हैं, X और Y स्वतंत्र, मानक सामान्य यादृच्छिक चर के रूप में है।
- अनुपात विधि[52] एक अस्वीकृति पद्धति है। कलनविधि निम्नानुसार आगे बढ़ता है
- दो स्वतंत्र एकरूप U और V उत्पन्न करते हैं
- अभिकलन X= √8/e (वी - 0.5)/U;
- वैकल्पिक: यदि X2 ≤ 5 − 4e1/4U फिर एक्स को स्वीकार करते हैं और कलन विधि को समाप्त करते हैं;
- वैकल्पिक: यदि X2 ≥ 4e-1.35/U + 1.4 फिर X को अस्वीकार करते हैं और चरण 1 से शुरू करते हैं;
- यदि X2 ≤ −4 lnU फिर X को स्वीकार करते हैं, अन्यथा कलन विधि पर प्रारंभ करते हैं।
- दो वैकल्पिक चरण अंतिम चरण में लघुगणक के मान अंकन की अनुमति देते हैं, जिससे अधिकांश स्थितियो में बचा जा सकता है। इन कदमों में बहुत सुधार किया जा सकता है[53] जिससे की लघुगणक का मान अंकन कभी-कभार ही किया जा सके।
- ज़िगगुरैट कलन विधि [54] बॉक्स-मुलर रूपांतरण से तेज़ है और अभी भी अच्छे और सटीक है। लगभग 97% स्थितियो में यह केवल दो यादृच्छिक संख्याओं, एक यादृच्छिक पूर्णांक और एक यादृच्छिक समरूप , एक गुणन और एक परीक्षण का उपयोग करता है। और इस प्रकार केवल 3% स्थितियो में जहां उन दोनों का संयोजन जिगगुराट के कोर के बाहर पड़ता है वहाँ लघुगणक का उपयोग करके एक प्रकार का अस्वीकृति नमूनाकरण घातांक का प्रयोग किया जाता है और इस प्रकार समान यादृच्छिक संख्याओं को नियोजित करना पड़ता है।
- पूर्णांक अंकगणित का उपयोग मानक सामान्य वितरण से नमूने के लिए किया जा सकता है।[55] यह विधि इस अर्थ में अच्छे है कि यह आदर्श सन्निकटन की शर्तों को संतुष्ट करती है;[56] अर्थात यह मानक सामान्य वितरण से एक वास्तविक संख्या का नमूना लेने और इसे निकटतम प्रतिनिधित्व योग्य फ़्लोटिंग पॉइंट नंबर पर गोल करने के बराबर होती है।
- कुछ जांच भी है[57] जो तेजी से हैडमार्ड परिवर्तन और सामान्य वितरण के बीच संबंध में परिवर्तन केवल जोड़ने और घटाने को नियोजित करता है और केंद्रीय सीमा प्रमेय द्वारा लगभग किसी भी वितरण से यादृच्छिक संख्या सामान्य वितरण में बदल दी जाती है। इस संबंध में सामान्य रूप से वितरित डेटा में स्वैच्छिक डेटा समुच्चय को चालू करने के लिए हैडमार्ड रूपांतरणों की एक श्रृंखला को यादृच्छिक क्रमपरिवर्तन के साथ जोड़ा जा सकता है।
सामान्य सीडीएफ और सामान्य क्वांटाइल फलन के लिए संख्यात्मक अनुमान
मानक सामान्य सीडीएफ का व्यापक रूप से वैज्ञानिक और सांख्यिकीय अभिकलन में उपयोग किया जाता है।
मान Φ(x) को विभिन्न विधियों से बहुत अच्छी तरह से अनुमानित किया जा सकता है, जैसे कि संख्यात्मक एकीकरण, टेलर श्रृंखला, टेलर श्रृंखला, स्पर्शोन्मुख श्रृंखला और निरंतर भिन्न कॉन्फ़्लूएंट हाइपरजियोमेट्रिक फलन का उपयोग किया जाता है। इस प्रकार सटीकता के वांछित स्तर के आधार पर विभिन्न अनुमानों का उपयोग किया जाता है।
- Zelen & Severo (1964) पूर्ण त्रुटि के साथ x > 0 के लिए Φ(x) का सन्निकटन |ε(x)| < 7.5·10−8 मान होता है, कलनविधि 26.2.17): जहां ϕ(x) मानक सामान्य PDF इस प्रकार है, b0 = 0.2316419, b1 = 0.319381530, b2 = −0.356563782, b3 = 1.781477937, b4 = −1.821255978, b5 = 1.330274429.
- Hart (1968) ने erfc() फलन के लिए घातांक के साथ या उसके बिना तर्कसंगत फलन के माध्यम से कुछ दर्जनों अनुमानों को सूचीबद्ध किया है। उनके कलनविधि 24 अंकों की अधिकतम पूर्ण सटीकता के साथ सम्मिश्रता की डिग्री और परिणामी सटीकता में भिन्न होते हैं। इस प्रकार एक कलनविधि West (2009) 16 अंकों की सटीकता के साथ एक तेज संगणना कलनविधि प्रदान करने के लिए टेल में एक निरंतर भिन्न सन्निकटन के साथ हार्ट के कलनविधि 5666 को जोड़ता है।
- Hart68 समाधान erf के लिए उपयुक्त नहीं होता है, यह याद करने के बाद Cody (1969) erf और erfc दोनों के लिए तर्कसंगत चेबीशेव अनुमान के माध्यम से अधिकतम सापेक्ष त्रुटि के साथ एक समाधान देता है।
- Marsaglia (2004) टेलर श्रृंखला विस्तार के आधार पर एक सरल कलनविधि का सुझाव दिया है,[note 1] स्वेच्छ परिशुद्धता के साथ Φ(x) की गणना के लिए इस कलनविधि की कमी अपेक्षाकृत तुलनात्मक रूप से धीमी गणना समय है, उदाहरण के लिए जब x = 10 होता है तो 16 अंकों की सटीकता के साथ फलन की गणना करने में 300 से अधिक पुनरावृत्तियों की आवश्यकता होती है।
- जीएनयू वैज्ञानिक पुस्तकालय हार्ट के कलनविधि और चेबिशेव बहुपद के साथ सन्निकटन का उपयोग करके मानक सामान्य सीडीएफ के मानों की गणना करती है।
नॉइज़ (1982) ने सरल सन्निकटन मान प्रदान करते है, जिन्हें इंजीनियरिंग और संचालन अनुसंधान के स्टोकेस्टिक अनुकूलन मॉडल के रूप में सम्मलित किया जाता है, जैसे विश्वसनीयता इंजीनियरिंग और इन्वेंट्री विश्लेषण इत्यादि। इस प्रकार p = Φ(z) क्वांटाइल फलन के लिए सबसे सरल सन्निकटन के रूप में होते है
कुछ और सन्निकटन यहां देखे जा सकते है, जो त्रुष्टि फलन प्राथमिक फलन के साथ सन्निकटन रूप में होते है। विशेष रूप से, सीडीएफ के लिए पूरे डोमेन पर छोटी सापेक्ष त्रुटि और क्वांटाइल फलन के साथ ही 2008 में सर्गेई विनित्ज़की द्वारा स्पष्ट रूप से व्युत्क्रम सूत्र के माध्यम से प्राप्त किया गया है।
इतिहास
विकास
कुछ लेखक[58][59] सामान्य वितरण की खोज का श्रेय अब्राहम डी मोइवरे को देते हैं, जिन्होंने 1738 में[note 2] द डॉक्ट्रिन ऑफ चांस के दूसरे संस्करण में द्विपद विस्तार (a + b)n में गुणांक के अध्ययन में प्रकाशित किया है। डी मोइवर ने साबित किया कि इस विस्तार में मध्य पद का अनुमानित परिमाण के रूप में होता है और वह यदि m या 1/2n एक क्वांटाइल असीम रूप से बहुत बढ़िया होता है, तो इस प्रकार अनुपात का लघुगणक जो अंतराल ℓ द्वारा मध्य से दूर एक शब्द, मध्य अवधि के लिए .[60] है, यद्यपि इस प्रमेय की व्याख्या सामान्य प्रायिकता नियम के लिए पहली अस्पष्ट अभिव्यक्ति के रूप में व्याख्या किया जा सकता है, स्टीफन स्टिगलर बताते हैं कि डी मोइवर ने स्वयं अपने परिणामों की व्याख्या द्विपद गुणांकों के लिए अनुमानित नियम से अधिक कुछ भी नहीं की है और विशेष रूप से डी मोइवर में प्रायिकता घनत्व फलन की इस अवधारणा का अभिव्यक्ति था।[61]
1823 में कार्ल फ्रेडरिक गॉस ने अपना मोनोग्राफ प्रकाशित किया थ्योरीया कॉम्बिनेशनिस ऑब्जर्वेशनम त्रुष्टि िबस मिनिमिस ऑबनोक्सिया जहां उन्होंने कई महत्वपूर्ण सांख्यिकीय अवधारणाओं को प्रस्तुत किया था, जैसे कि न्यूनतम वर्ग विधि अधिकतम संभावना की विधि, और सामान्य वितरण इत्यादि के रूप में है। गॉस ने कुछ अज्ञात मात्रा V के माप को दर्शाने के लिए M′, M′′, ...का उपयोग किया और "उस क्वांटाइल के सबसे संभावित एस्टीमेटर की मांग की, जो प्रेक्षित प्रयोगात्मक परिणामों को प्राप्त करने की प्रायिकता φ(M − V) · φ(M′ − V) · φ(M′′ − V) · ... को अधिकतम करता है। इस प्रकार उनके अंकन में φΔ परिमाण की माप त्रुटियों की प्रायिकता घनत्व फलन है। इस प्रकार हम यह नहीं जानते कि फलन φ क्या है, गॉस की आवश्यकता होती है कि उसकी विधि को सुप्रसिद्ध उत्तर मापे गए मानों के अंकगणितीय माध्य को कम करना होता है। इन सिद्धांतों से शुरू करते हुए गॉस दर्शाता है कि स्थान पैरामीटर के अनुमानक के रूप में अंकगणित माध्य की पसंद को तर्कसंगत बनाने वाला एकमात्र नियम त्रुटियों का सामान्य नियम है।[62]
जहाँ h टेस्ट्स की शुद्धता का माप है। प्रयोगों में त्रुटियों के लिए एक सामान्य मॉडल के रूप में इस सामान्य नियम का उपयोग करते हुए गॉस ने वह विधि तैयार की जिसे अब गैर-रैखिक भारित न्यूनतम वर्ग विधि के रूप में जाना जाता है।[63]
चूंकि गॉस सामान्य वितरण नियम का सुझाव देने वाले पहले व्यक्ति थे, पियरे साइमन डी लाप्लास ने महत्वपूर्ण योगदान दिया।[note 3] यह लाप्लास था जिसने पहली बार 1774 में कई अवलोकनों को एकत्रित करने की प्रॉब्लम प्रस्तुत की थी,[64] चूंकि उनके अपने समाधान ने लाप्लासियन वितरण को जन्म दिया था। यह लाप्लास था जिसने सबसे पहले गॉसियन समाकलन ∫ e−t2 dt = √π 1782 के मान की गणना की थी और इस प्रकार सामान्य वितरण के लिए सामान्यीकरण स्टेबल अंकन प्रदान करता है।[65] अंत में, यह लाप्लास था जिसने 1810 में मौलिक केंद्रीय सीमा प्रमेय को साबित किया और अकादमी को प्रस्तुत किया था, जिसने सामान्य वितरण के सैद्धांतिक महत्व पर जोर दिया था।[66]
यह ध्यान रखना दिलचस्प है कि 1809 में एक आयरिश-अमेरिकी गणितज्ञ रॉबर्ट एड्रेन ने गॉस से एक साथ और स्वतंत्र रूप से सामान्य प्रायिकता नियम के दो व्यावहारिक लेकिन त्रुटिपूर्ण अवकलज प्रकाशित किए थे।[67] वैज्ञानिक समुदाय द्वारा उनके फलन पर बहुत सीमा तक ध्यान नहीं दिया गया था, जब तक कि 1871 में क्लीवलैंड एब्बे द्वारा उन्हें खोदकर नहीं निकाला गया था।[68]
19वीं शताब्दी के मध्य में जेम्स क्लर्क मैक्सवेल ने प्रदर्शित किया कि सामान्य वितरण न केवल एक सुविधाजनक गणितीय उपकरण है, बल्कि प्राकृतिक घटनाओं में भी हो सकता है[69] इस प्रकार कणों की संख्या जिसका वेग एक निश्चित दिशा में हल किया जाता है, x और x+dx के बीच होता है
नामकरण
आज, अवधारणा को सामान्यतः अंग्रेजी में सामान्य वितरण या गाऊसी वितरण के रूप में जाना जाता है। अन्य कम सामान्य नामों में गॉस वितरण, लाप्लास-गॉस वितरण, त्रुटि का नियम, त्रुटियों की सुविधा का नियम, लाप्लास का दूसरा नियम, गॉसियन नियम के रूप में सम्मलित हैं।
गॉस ने स्पष्ट रूप से इस शब्द को इसके अनुप्रयोगों में सम्मलित सामान्य समीकरणों के संदर्भ में कॉइन किया था, जिसमें सामान्य के अतिरिक्त सामान्य रूप से ऑर्थोगोनल का तकनीकी अर्थ होता है।[70] चूंकि, 19 वीं शताब्दी के अंत तक कुछ लेखक[note 4] सामान्य वितरण नाम का उपयोग करना शुरू कर दिया था, जहां सामान्य शब्द को विशेषण के रूप में उपयोग किया गया था। इस शब्द को अब इस तथ्य के प्रतिबिंब के रूप में देखा जा रहा है कि इस वितरण को विशिष्ट सामान्य प्रकार के रूप में देखा जाता था। चार्ल्स सैंडर्स पियर्स उन लेखकों में से एक जिन्होने एक पीयर्स "सामान्य" को परिभाषित किया था ' इस प्रकार 'सामान्य' वास्तव में जो घटित होता है इसका औसत या किसी अन्य प्रकार का माध्य नहीं है, लेकिन कुछ परिस्थितियों में लंबे समय में क्या घटित होता है इसका अर्थ है।[71] 20वीं शताब्दी के अंत में कार्ल पियर्सन ने इस वितरण के लिए एक पदनाम के रूप में सामान्य शब्द को लोकप्रिय बनाया था।[72]
कई साल पहले मैंने लाप्लास गॉसियन वक्र को सामान्य वक्र कहा था, चूंकि यह नाम प्राथमिकता के एक अंतरराष्ट्रीय प्रश्न से बचता है, लेकिन इसमें लोगों को यह विश्वास दिलाने का नुकसान है कि आवृत्ति के अन्य सभी वितरण किसी न किसी अर्थ में 'असामान्य' हैं।
इसके अतिरिक्त, वे पियर्सन ही थे जिन्होंने सबसे पहले वितरण को आधुनिक संकेतन के रूप में मानक विचलन σ के रूप में लिखा था। इसके तुरंत बाद, वर्ष 1915 में, रोनाल्ड फिशर ने सामान्य वितरण के सूत्र में स्थान पैरामीटर जोड़ दिया था, इसे वर्तमान काल में लिखी गई विधि से व्यक्त करते है।
मानक सामान्य शब्द, जो शून्य माध्य और इकाई विचरण के साथ सामान्य वितरण को दर्शाता है और जो वर्ष 1950 के दशक के आसपास सामान्य उपयोग में आया है, जो पी. जी. होएल (1947) में गणितीय आंकड़ों का परिचय लोकप्रिय पाठ्यपुस्तकों में प्रकाशित हुआ। और इस प्रकार ए. एम. मूड (1950) द्वारा सांख्यिकी के सिद्धांत का परिचय दिया गया था[73]
यह भी देखें
- बेट्स वितरण - इरविन-हॉल वितरण के समान होता है, लेकिन 0 से 1 श्रेणी में वापस आ जाता है
- बेहरेंस-फिशर प्रॉब्लम - टेस्ट्स की लंबे समय से चली आ रही प्रॉब्लम है कि क्या भिन्न -भिन्न प्रसरण वाले दो सामान्य नमूनों का एक ही अर्थ होता है,
- भट्टाचार्य दूरी - सामान्य वितरण के मिश्रण को भिन्न करने के लिए उपयोग की जाने वाली विधि के रूप में होती है
- एर्डोस-केएसी प्रमेय - संख्या सिद्धांत में सामान्य वितरण की घटना पर आधारित होती है
- अधिकतम अर्ध पर पूरी चौड़ाई होती है
- गौस्सियन ब्लर - कनवल्शन, जो कर्नेल के रूप में सामान्य वितरण का उपयोग करता है
- संशोधित हाफ सामान्य वितरण [74] p डीएफ के साथ के रूप में दिया जाता है , जहाँ फॉक्स-राइट पीसाई फलन को दर्शाता है।
- सामान्य रूप से वितरित और असंबद्ध का अर्थ स्वतंत्र नहीं है
- अनुपात सामान्य वितरण के रूप में होता है
- पारस्परिक सामान्य वितरण के रूप में होता है
- मानक सामान्य तालिका
- स्टीन लेम्मा
- सब-गाऊसी वितरण
- सामान्य रूप से वितरित यादृच्छिक चर का योग
- ट्वीडी वितरण - सामान्य वितरण ट्वीडी घातांकी फैलाव मॉडल के फॅमिली का सदस्य है।
- रैप्ड नॉर्मल वितरण - सर्कुलर डोमेन पर प्रयुक्त नॉर्मल वितरण के रूप में होते है
- जेड टेस्ट्स - सामान्य वितरण का उपयोग करते है
टिप्पणियाँ
- ↑ For example, this algorithm is given in the article Bc programming language.
- ↑ De Moivre first published his findings in 1733, in a pamphlet "Approximatio ad Summam Terminorum Binomii (a + b)n in Seriem Expansi" that was designated for private circulation only. But it was not until the year 1738 that he made his results publicly available. The original pamphlet was reprinted several times, see for example Walker (1985).
- ↑ "My custom of terming the curve the Gauss–Laplacian or normal curve saves us from proportioning the merit of discovery between the two great astronomer mathematicians." quote from Pearson (1905, p. 189)
- ↑ Besides those specifically referenced here, such use is encountered in the works of Peirce, Galton (Galton (1889, chapter V)) and Lexis (Lexis (1878), Rohrbasser & Véron (2003)) c. 1875.[citation needed]
संदर्भ
उद्धरण
- ↑ Normal Distribution, Gale Encyclopedia of Psychology
- ↑ Casella & Berger (2001, p. 102)
- ↑ Lyon, A. (2014). Why are Normal Distributions Normal?, The British Journal for the Philosophy of Science.
- ↑ 4.0 4.1 "Normal Distribution". www.mathsisfun.com. Retrieved 2020-08-15.
- ↑ Stigler (1982)
- ↑ Halperin, Hartley & Hoel (1965, item 7)
- ↑ McPherson (1990, p. 110)
- ↑ Bernardo & Smith (2000, p. 121)
- ↑ Scott, Clayton; Nowak, Robert (August 7, 2003). "The Q-function". Connexions.
- ↑ Barak, Ohad (April 6, 2006). "Q Function and Error Function" (PDF). Tel Aviv University. Archived from the original (PDF) on March 25, 2009.
- ↑ Weisstein, Eric W. "Normal Distribution Function". MathWorld.
- ↑ Abramowitz, Milton; Stegun, Irene Ann, eds. (1983) [June 1964]. "Chapter 26, eqn 26.2.12". Handbook of Mathematical Functions with Formulas, Graphs, and Mathematical Tables. Applied Mathematics Series. Vol. 55 (Ninth reprint with additional corrections of tenth original printing with corrections (December 1972); first ed.). Washington D.C.; New York: United States Department of Commerce, National Bureau of Standards; Dover Publications. p. 932. ISBN 978-0-486-61272-0. LCCN 64-60036. MR 0167642. LCCN 65-12253.
- ↑ Reference needed
- ↑ Cover, Thomas M.; Thomas, Joy A. (2006). Elements of Information Theory. John Wiley and Sons. p. 254. ISBN 9780471748816.
- ↑ Park, Sung Y.; Bera, Anil K. (2009). "Maximum Entropy Autoregressive Conditional Heteroskedasticity Model" (PDF). Journal of Econometrics. 150 (2): 219–230. CiteSeerX 10.1.1.511.9750. doi:10.1016/j.jeconom.2008.12.014. Archived from the original (PDF) on March 7, 2016. Retrieved 2011-06-02.
- ↑ Geary RC(1936) The distribution of the "Student's" ratio for the non-normal samples". Supplement to the Journal of the Royal Statistical Society 3 (2): 178–184
- ↑ Lukacs, Eugene, No label or title -- debug: Q55897617, Wikidata Q55897617
- ↑ 18.0 18.1 18.2 Patel & Read (1996, [2.1.4])
- ↑ Fan (1991, p. 1258)
- ↑ Patel & Read (1996, [2.1.8])
- ↑ Papoulis, Athanasios. Probability, Random Variables and Stochastic Processes (4th ed.). p. 148.
- ↑ Bryc (1995, p. 23)
- ↑ Bryc (1995, p. 24)
- ↑ Cover & Thomas (2006, p. 254)
- ↑ Williams, David (2001). Weighing the odds : a course in probability and statistics (Reprinted. ed.). Cambridge [u.a.]: Cambridge Univ. Press. pp. 197–199. ISBN 978-0-521-00618-7.
- ↑ Smith, José M. Bernardo; Adrian F. M. (2000). Bayesian theory (Reprint ed.). Chichester [u.a.]: Wiley. pp. 209, 366. ISBN 978-0-471-49464-5.
{{cite book}}
: CS1 maint: multiple names: authors list (link) - ↑ O'Hagan, A. (1994) Kendall's Advanced Theory of statistics, Vol 2B, Bayesian Inference, Edward Arnold. ISBN 0-340-52922-9 (Section 5.40)
- ↑ Jordan, Michael I. (February 8, 2010). "Stat260: Bayesian Modeling and Inference: The Conjugate Prior for the Normal Distribution" (PDF).
- ↑ Amari & Nagaoka (2000)
- ↑ "Normal Approximation to Poisson Distribution". Stat.ucla.edu. Retrieved 2017-03-03.
- ↑ 31.0 31.1 Das, Abhranil (2020). "A method to integrate and classify normal distributions". arXiv:2012.14331 [stat.ML].
- ↑ Bryc (1995, p. 27)
- ↑ Weisstein, Eric W. "Normal Product Distribution". MathWorld. wolfram.com.
- ↑ Lukacs, Eugene (1942). "A Characterization of the Normal Distribution". The Annals of Mathematical Statistics. 13 (1): 91–3. doi:10.1214/aoms/1177731647. ISSN 0003-4851. JSTOR 2236166.
- ↑ Basu, D.; Laha, R. G. (1954). "On Some Characterizations of the Normal Distribution". Sankhyā. 13 (4): 359–62. ISSN 0036-4452. JSTOR 25048183.
- ↑ Lehmann, E. L. (1997). Testing Statistical Hypotheses (2nd ed.). Springer. p. 199. ISBN 978-0-387-94919-2.
- ↑ Patel & Read (1996, [2.3.6])
- ↑ Galambos & Simonelli (2004, Theorem 3.5)
- ↑ Bryc (1995, p. 35)
- ↑ 40.0 40.1 Lukacs & King (1954)
- ↑ Quine, M.P. (1993). "On three characterisations of the normal distribution". Probability and Mathematical Statistics. 14 (2): 257–263.
- ↑ John, S (1982). "The three parameter two-piece normal family of distributions and its fitting". Communications in Statistics - Theory and Methods. 11 (8): 879–885. doi:10.1080/03610928208828279.
- ↑ 43.0 43.1 Krishnamoorthy (2006, p. 127)
- ↑ Krishnamoorthy (2006, p. 130)
- ↑ Krishnamoorthy (2006, p. 133)
- ↑ Huxley (1932)
- ↑ Jaynes, Edwin T. (2003). Probability Theory: The Logic of Science. Cambridge University Press. pp. 592–593. ISBN 9780521592710.
- ↑ Oosterbaan, Roland J. (1994). "Chapter 6: Frequency and Regression Analysis of Hydrologic Data" (PDF). In Ritzema, Henk P. (ed.). Drainage Principles and Applications, Publication 16 (second revised ed.). Wageningen, The Netherlands: International Institute for Land Reclamation and Improvement (ILRI). pp. 175–224. ISBN 978-90-70754-33-4.
- ↑ Why Most Published Research Findings Are False, John P. A. Ioannidis, 2005
- ↑ Wichura, Michael J. (1988). "Algorithm AS241: The Percentage Points of the Normal Distribution". Applied Statistics. 37 (3): 477–84. doi:10.2307/2347330. JSTOR 2347330.
- ↑ Johnson, Kotz & Balakrishnan (1995, Equation (26.48))
- ↑ Kinderman & Monahan (1977)
- ↑ Leva (1992)
- ↑ Marsaglia & Tsang (2000)
- ↑ Karney (2016)
- ↑ Monahan (1985, section 2)
- ↑ Wallace (1996)
- ↑ Johnson, Kotz & Balakrishnan (1994, p. 85)
- ↑ Le Cam & Lo Yang (2000, p. 74)
- ↑ De Moivre, Abraham (1733), Corollary I – see Walker (1985, p. 77)
- ↑ Stigler (1986, p. 76)
- ↑ Gauss (1809, section 177)
- ↑ Gauss (1809, section 179)
- ↑ Laplace (1774, Problem III)
- ↑ Pearson (1905, p. 189)
- ↑ Stigler (1986, p. 144)
- ↑ Stigler (1978, p. 243)
- ↑ Stigler (1978, p. 244)
- ↑ Maxwell (1860, p. 23)
- ↑ Jaynes, Edwin J.; Probability Theory: The Logic of Science, Ch. 7.
- ↑ Peirce, Charles S. (c. 1909 MS), Collected Papers v. 6, paragraph 327.
- ↑ Kruskal & Stigler (1997).
- ↑ "Earliest uses... (entry STANDARD NORMAL CURVE)".
- ↑ Sun, Jingchao; Kong, Maiying; Pal, Subhadip (22 June 2021). "The Modified-Half-Normal distribution: Properties and an efficient sampling scheme". Communications in Statistics - Theory and Methods: 1–23. doi:10.1080/03610926.2021.1934700. ISSN 0361-0926. S2CID 237919587.
स्रोत
- Aldrich, John; Miller, Jeff. "संभाव्यता और सांख्यिकी में प्रतीकों का प्रारंभिक उपयोग".
- Aldrich, John; Miller, Jeff. "गणित के कुछ शब्दों का सबसे पुराना ज्ञात उपयोग". विशेष रूप से, घंटी-आकार और घंटी वक्र, सामान्य (वितरण), [http के लिए प्रविष्टियां ://jeff560.tripod.com/g.html गाऊसी], और त्रुटि, त्रुटि का नियम, त्रुटि का सिद्धांत, आदि।
- Amari, Shun-ichi; Nagaoka, Hiroshi (2000). सूचना ज्यामिति के तरीके. Oxford University Press. ISBN 978-0-8218-0531-2.
- Bernardo, José M.; Smith, Adrian F. M. (2000). बायेसियन थ्योरी. Wiley. ISBN 978-0-471-49464-5.
- Bryc, Wlodzimierz (1995). सामान्य वितरण: अनुप्रयोगों के साथ अभिलक्षण. Springer-Verlag. ISBN 978-0-387-97990-8.
- Casella, George; Berger, Roger L. (2001). सांख्यिकीय निष्कर्ष (2nd ed.). Duxbury. ISBN 978-0-534-24312-8.
- Cody, William J. (1969). "त्रुटि फ़ंक्शन के लिए वाजिब चेबीशेव सन्निकटन". Mathematics of Computation. 23 (107): 631–638. doi:10.1090/S0025-5718-1969-0247736-4.
- Cover, Thomas M.; Thomas, Joy A. (2006). सूचना सिद्धांत के तत्व. John Wiley and Sons.
- de Moivre, Abraham (1738). संभावना का सिद्धांत. ISBN 978-0-8218-2103-9.
- Fan, Jianqing (1991). "गैर पैरामीट्रिक विसंक्रमण समस्याओं के लिए अभिसरण की इष्टतम दरों पर". The Annals of Statistics. 19 (3): 1257–1272. doi:10.1214/aos/1176348248. JSTOR 2241949.
- Galton, Francis (1889). प्राकृतिक विरासत (PDF). London, UK: Richard Clay and Sons.
- Galambos, Janos; Simonelli, Italo (2004). यादृच्छिक चर के उत्पाद: भौतिकी की समस्याओं और अंकगणितीय कार्यों के अनुप्रयोग. Marcel Dekker, Inc. ISBN 978-0-8247-5402-0.
- Gauss, Carolo Friderico (1809). धारा ibvs conicvs सोलेम परिवेश में motvs corporvm coelestivm का सिद्धांत [Theory of the Motion of the Heavenly Bodies Moving about the Sun in Conic Sections] (in Latina). Hambvrgi, Svmtibvs F. Perthes et I. H. Besser. English translation.
- Gould, Stephen Jay (1981). मनुष्य का गलत माप (first ed.). W. W. Norton. ISBN 978-0-393-01489-1.
- Halperin, Max; Hartley, Herman O.; Hoel, Paul G. (1965). "सांख्यिकीय प्रतीकों और संकेतन के लिए अनुशंसित मानक। प्रतीक और संकेतन पर सीओपीएसएस समिति". The American Statistician. 19 (3): 12–14. doi:10.2307/2681417. JSTOR 2681417.
- Hart, John F.; et al. (1968). कंप्यूटर अनुमान. New York, NY: John Wiley & Sons, Inc. ISBN 978-0-88275-642-4.
- "Normal Distribution", Encyclopedia of Mathematics, EMS Press, 2001 [1994]
- Herrnstein, Richard J.; Murray, Charles (1994). द बेल कर्व: इंटेलिजेंस एंड क्लास स्ट्रक्चर इन अमेरिकन लाइफ. Free Press. ISBN 978-0-02-914673-6.
- Huxley, Julian S. (1932). सापेक्ष विकास की समस्याएं. London. ISBN 978-0-486-61114-3. OCLC 476909537.
- Johnson, Norman L.; Kotz, Samuel; Balakrishnan, Narayanaswamy (1994). निरंतर यूनीवेरिएट डिस्ट्रीब्यूशन, वॉल्यूम 1. Wiley. ISBN 978-0-471-58495-7.
- Johnson, Norman L.; Kotz, Samuel; Balakrishnan, Narayanaswamy (1995). निरंतर यूनीवेरिएट डिस्ट्रीब्यूशन, वॉल्यूम 2. Wiley. ISBN 978-0-471-58494-0.
- Karney, C. F. F. (2016). "सामान्य वितरण से बिल्कुल नमूना लेना". ACM Transactions on Mathematical Software. 42 (1): 3:1–14. arXiv:1303.6257. doi:10.1145/2710016. S2CID 14252035.
- Kinderman, Albert J.; Monahan, John F. (1977). "यूनिफ़ॉर्म डेविएट्स के अनुपात का उपयोग करके रैंडम वेरिएबल्स का कंप्यूटर जनरेशन". ACM Transactions on Mathematical Software. 3 (3): 257–260. doi:10.1145/355744.355750. S2CID 12884505.
- Krishnamoorthy, Kalimuthu (2006). अनुप्रयोगों के साथ सांख्यिकीय वितरण की पुस्तिका. Chapman & Hall/CRC. ISBN 978-1-58488-635-8.
- Kruskal, William H.; Stigler, Stephen M. (1997). Spencer, Bruce D. (ed.). सामान्य शब्दावली: सांख्यिकी और अन्यत्र में 'सामान्य'. Statistics and Public Policy. Oxford University Press. ISBN 978-0-19-852341-3.
- Laplace, Pierre-Simon de (1774). "घटनाओं द्वारा कारणों की संभावना पर संस्मरण". Mémoires de l'Académie Royale des Sciences de Paris (Savants étrangers), Tome 6: 621–656. सांख्यिकीय विज्ञान '1' (3), 1986 में स्टीफन एम. स्टिग्लर द्वारा अनुवादित: JSTOR 2245476.
- Laplace, Pierre-Simon (1812). विश्लेषणात्मक संभाव्यता सिद्धांत [Analytical theory of probabilities]. Paris, Ve. Courcier.
- Le Cam, Lucien; Lo Yang, Grace (2000). सांख्यिकी में स्पर्शोन्मुखता: कुछ बुनियादी अवधारणाएँ (second ed.). Springer. ISBN 978-0-387-95036-5.
- Leva, Joseph L. (1992). "एक तेज सामान्य यादृच्छिक संख्या जनरेटर" (PDF). ACM Transactions on Mathematical Software. 18 (4): 449–453. CiteSeerX 10.1.1.544.5806. doi:10.1145/138351.138364. S2CID 15802663. Archived from the original (PDF) on 16 July 2010.
- Lexis, Wilhelm (1878). "मानव जीवन की सामान्य लंबाई और सांख्यिकीय संबंधों की स्थिरता के सिद्धांत पर". Annales de Démographie Internationale. Paris. II: 447–462.
- Lukacs, Eugene; King, Edgar P. (1954). "सामान्य वितरण की संपत्ति". The Annals of Mathematical Statistics. 25 (2): 389–394. doi:10.1214/aoms/1177728796. JSTOR 2236741.
- McPherson, Glen (1990). वैज्ञानिक जांच में सांख्यिकी: इसका आधार, अनुप्रयोग और व्याख्या. Springer-Verlag. ISBN 978-0-387-97137-7.
- Marsaglia, George; Tsang, Wai Wan (2000). "यादृच्छिक चर उत्पन्न करने के लिए जिगुरत विधि". Journal of Statistical Software. 5 (8). doi:10.18637/jss.v005.i08.
- Marsaglia, George (2004). "सामान्य वितरण का मूल्यांकन". Journal of Statistical Software. 11 (4). doi:10.18637/jss.v011.i04.
- Maxwell, James Clerk (1860). "वी। गैसों के गतिशील सिद्धांत के उदाहरण। - भाग I: पूरी तरह से लोचदार क्षेत्रों की गति और टकराव पर". Philosophical Magazine. Series 4. 19 (124): 19–32. doi:10.1080/14786446008642818.
- Monahan, J. F. (1985). "यादृच्छिक संख्या पीढ़ी में सटीकता". Mathematics of Computation. 45 (172): 559–568. doi:10.1090/S0025-5718-1985-0804945-X.
- Patel, Jagdish K.; Read, Campbell B. (1996). सामान्य वितरण की पुस्तिका (2nd ed.). CRC Press. ISBN 978-0-8247-9342-5.
- Pearson, Karl (1901). "अंतरिक्ष में बिंदुओं के सिस्टम के निकटतम फिट की रेखाओं और विमानों पर" (PDF). Philosophical Magazine. 6. 2 (11): 559–572. doi:10.1080/14786440109462720.
- Pearson, Karl (1905). "'लॉ ऑफ एरर एंड इट्स जनरलाइजेशन बाय फेचनर एंड पियर्सन'। एक जॉइनर". Biometrika. 4 (1): 169–212. doi:10.2307/2331536. JSTOR 2331536.
- Pearson, Karl (1920). "सहसंबंध के इतिहास पर नोट्स". Biometrika. 13 (1): 25–45. doi:10.1093/biomet/13.1.25. JSTOR 2331722.
- Rohrbasser, Jean-Marc; Véron, Jacques (2003). "विल्हेम लेक्सिस: "चीजों की प्रकृति" की अभिव्यक्ति के रूप में जीवन की सामान्य लंबाई". Population. 58 (3): 303–322. doi:10.3917/pope.303.0303.
- Shore, H (1982). "प्रतिलोम संचयी फलन, घनत्व फलन और सामान्य वितरण के नुकसान समाकलन के लिए सरल अनुमान". Journal of the Royal Statistical Society. Series C (Applied Statistics). 31 (2): 108–114. doi:10.2307/2347972. JSTOR 2347972.
- Shore, H (2005). "सामान्य वितरण के सीडीएफ के लिए सटीक आरएमएम-आधारित अनुमान". Communications in Statistics – Theory and Methods. 34 (3): 507–513. doi:10.1081/sta-200052102. S2CID 122148043.
- Shore, H (2011). "प्रतिक्रिया मॉडलिंग पद्धति". WIREs Comput Stat. 3 (4): 357–372. doi:10.1002/wics.151. S2CID 62021374.
- Shore, H (2012). "प्रतिक्रिया मॉडलिंग पद्धति मॉडल का अनुमान लगाना". WIREs Comput Stat. 4 (3): 323–333. doi:10.1002/wics.1199. S2CID 122366147.
- Stigler, Stephen M. (1978). "प्रारंभिक राज्यों में गणितीय सांख्यिकी". The Annals of Statistics. 6 (2): 239–265. doi:10.1214/aos/1176344123. JSTOR 2958876.
- Stigler, Stephen M. (1982). "एक मामूली प्रस्ताव: सामान्य के लिए एक नया मानक". The American Statistician. 36 (2): 137–138. doi:10.2307/2684031. JSTOR 2684031.
- Stigler, Stephen M. (1986). सांख्यिकी का इतिहास: 1900 से पहले अनिश्चितता का मापन. Harvard University Press. ISBN 978-0-674-40340-6.
- Stigler, Stephen M. (1999). मेज पर आँकड़े. Harvard University Press. ISBN 978-0-674-83601-3.
- Walker, Helen M. (1985). "De Moivre on the Law of Normal Probability" (PDF). In Smith, David Eugene (ed.). गणित में एक स्रोत पुस्तक. Dover. ISBN 978-0-486-64690-9.
- Wallace, C. S. (1996). "सामान्य और घातीय चर के लिए तेज़ छद्म-यादृच्छिक जनरेटर". ACM Transactions on Mathematical Software. 22 (1): 119–127. doi:10.1145/225545.225554. S2CID 18514848.
- Weisstein, Eric W. "सामान्य वितरण". MathWorld.
- West, Graeme (2009). "संचयी सामान्य कार्यों के लिए बेहतर अनुमान" (PDF). Wilmott Magazine: 70–76.
- Zelen, Marvin; Severo, Norman C. (1964). संभाव्यता कार्य (अध्याय 26). Handbook of mathematical functions with formulas, graphs, and mathematical tables, by Abramowitz, M.; and Stegun, I. A.: National Bureau of Standards. New York, NY: Dover. ISBN 978-0-486-61272-0.