गम्बेल वितरण: Difference between revisions
(Created page with "{{Short description|Particular case of the generalized extreme value distribution}} {{Probability distribution |name =Gumbel |type =density |pdf_image =File...") |
No edit summary |
||
Line 19: | Line 19: | ||
|char =<math>\Gamma(1-i\beta t) e^{i\mu t}</math> | |char =<math>\Gamma(1-i\beta t) e^{i\mu t}</math> | ||
|notation=<math>\text{Gumbel}(\mu, \beta)</math>}} | |notation=<math>\text{Gumbel}(\mu, \beta)</math>}} | ||
गम्बेल वितरण सामान्यीकृत चरम मूल्य | संभाव्यता सिद्धांत और सांख्यिकी में, गम्बेल वितरण (जिसे टाइप-I सामान्यीकृत चरम मूल्य वितरण के रूप में भी जाना जाता है) का उपयोग विभिन्न वितरणों के कई नमूनों के अधिकतम (या न्यूनतम) वितरण को मॉडल करने के लिए किया जाता है। | ||
इस वितरण का उपयोग किसी विशेष वर्ष में नदी के अधिकतम स्तर के वितरण को दर्शाने के लिए किया जा सकता है यदि पिछले दस वर्षों के लिए अधिकतम मूल्यों की सूची है। यह भीषण भूकंप, बाढ़ या अन्य प्राकृतिक आपदा घटित होने की संभावना का पूर्वानुमान लगाने में उपयोगी है। मैक्सिमा के वितरण का प्रतिनिधित्व करने के लिए गम्बेल वितरण की संभावित प्रयोज्यता [[चरम मूल्य सिद्धांत]] से संबंधित है, जो अनुरूपित करता है कि यदि अंतर्निहित नमूना डेटा का वितरण सामान्य या घातीय प्रकार का है तो यह उपयोगी होने की संभावना है। यह लेख अधिकतम मूल्य के वितरण को मॉडल करने के लिए गम्बेल वितरण का उपयोग करता है। न्यूनतम मान को मॉडल करने के लिए, मूल मानों के ऋणात्मक का उपयोग करता है। | |||
गम्बेल वितरण सामान्यीकृत चरम मूल्य वितरण (जिसे फिशर-टिपेट वितरण के रूप में भी जाना जाता है) का एक विशेष स्थिति है। इसे ''[[वेइबुल वितरण]]'' और दोहरा घातांकीय वितरण के रूप में भी जाना जाता है (एक शब्द जिसे वैकल्पिक रूप से कभी-कभी [[लाप्लास वितरण]] को संदर्भित करने के लिए उपयोग किया जाता है)। यह [[गोम्पर्ट्ज़ वितरण]] से संबंधित है जब इसका घनत्व पहले मूल के बारे में परिलक्षित होता है और फिर सकारात्मक आधी रेखा तक सीमित होता है तो एक गोम्पर्ट्ज़ फलन प्राप्त होता है। | |||
बहुपद लॉगिट मॉडल के अव्यक्त चर सूत्रीकरण में - असतत विकल्प सिद्धांत में समान्य - अव्यक्त चर की त्रुटियां एक गमबेल वितरण का पालन करती हैं। यह उपयोगी है क्योंकि दो गम्बेल-वितरित यादृच्छिक चर के अंतर में एक लॉजिस्टिक वितरण होता है। | |||
गंबेल वितरण का नाम [[एमिल जूलियस गम्बेल]] (1891-1966) के नाम पर रखा गया है, जो वितरण का वर्णन करने वाले उनके मूल पत्रों पर आधारित है।<ref>{{Citation |url= http://archive.numdam.org/article/AIHP_1935__5_2_115_0.pdf |title= Les valeurs extrêmes des distributions statistiques |last= Gumbel |first= E.J. |journal= Annales de l'Institut Henri Poincaré |volume= 5 |year= 1935 |pages= 115–158 |issue= 2}}</ref><ref>Gumbel E.J. (1941). "The return period of flood flows". The Annals of Mathematical Statistics, 12, 163–190.</ref> | |||
==परिभाषाएँ== | ==परिभाषाएँ== | ||
गम्बेल वितरण का [[संचयी वितरण कार्य]] है | गम्बेल वितरण का [[संचयी वितरण कार्य]] है | ||
Line 37: | Line 37: | ||
===मानक गम्बल वितरण=== | ===मानक गम्बल वितरण=== | ||
मानक गम्बेल वितरण वह | मानक गम्बेल वितरण वह स्थिति है जहां संचयी वितरण फलन के साथ <math>\mu = 0</math> और <math>\beta = 1</math> होता है | ||
:<math>F(x) = e^{-e^{(-x)}}\,</math> | :<math>F(x) = e^{-e^{(-x)}}\,</math> | ||
और संभाव्यता घनत्व | और संभाव्यता घनत्व फलन | ||
:<math>f(x) = e^{-(x+e^{-x})}.</math> | :<math>f(x) = e^{-(x+e^{-x})}.</math> | ||
इस | इस मामले में मोड 0 है, माध्य <math>-\ln(\ln(2)) \approx 0.3665</math> है, माध्य <math>\gamma\approx 0.5772</math> है (यूलर-माशेरोनी स्थिरांक), और मानक विचलन <math>\pi/\sqrt{6} \approx 1.2825.</math> है। | ||
n > 1 के लिए [[ संचयी ]] | |||
n > 1 के लिए [[ संचयी | संचयी]] द्वारा दिया गया है | |||
:<math>\kappa_n = (n-1)! \zeta(n).</math> | :<math>\kappa_n = (n-1)! \zeta(n).</math> | ||
==गुण== | ==गुण== | ||
मोड μ है, जबकि माध्यिका | मोड μ है, जबकि माध्यिका <math>\mu-\beta \ln\left(\ln 2\right),</math> है और माध्य इस प्रकार दिया गया है? | ||
:<math>\operatorname{E}(X)=\mu+\gamma\beta</math>, | :<math>\operatorname{E}(X)=\mu+\gamma\beta</math>, | ||
जहाँ <math> \gamma </math> यूलर-माशेरोनी स्थिरांक है। | |||
मानक विचलन <math> \sigma </math> | मानक विचलन <math> \sigma </math> <math>\beta \pi/\sqrt{6}</math>} है इसलिए <math>\beta = \sigma \sqrt{6} / \pi \approx 0.78 \sigma. </math> <ref name = "Oosterbaan" /> | ||
मोड पर, | मोड पर, जहां <math> x = \mu </math>, , <math> \beta. </math> के मान पर ध्यान दिए बिना, <math>F(x;\mu,\beta)</math> का मान <math> e^{-1} \approx 0.37 </math> हो जाता है। | ||
यदि <math>G_1,...,G_k</math> पैरामीटर्स <math>(\mu,\beta)</math> के साथ आईआईडी गम्बेल यादृच्छिक चर है तो <math>\max\{G_1,...,G_k\}</math> भी पैरामीटर <math>(\mu+\beta\ln k, \beta)</math> के साथ एक गम्बेल यादृच्छिक चर है। | |||
यदि <math>G_1, G_2,...</math> आईआईडी यादृच्छिक चर हैं जैसे कि सभी प्राकृतिक संख्याओं <math> k </math> के लिए <math>\max\{G_1,...,G_k\}-\beta\ln k </math> का वितरण <math>G_1</math> के समान है, तो <math>G_1</math> आवश्यक रूप से स्केल पैरामीटर <math>\beta</math> के साथ वितरित किया गया है (वास्तव में यह केवल दो पर विचार करने के लिए पर्याप्त है) k>1 के विशिष्ट मान जो सहअभाज्य हैं)। | |||
==संबंधित वितरण== | ==संबंधित वितरण== | ||
* | * यदि <math>X </math> एक गम्बेल वितरण है, तो Y = −X का नियमित वितरण यह देखते हुए कि Y सकारात्मक है, या समकक्ष रूप से दिया गया है कि X ऋणात्मक है, एक गोम्पर्टज़ वितरण है। सूत्र के अनुसार, Y का सीडीएफ G, X के सीडीएफ, F से संबंधित है <math>G(y) = P(Y \le y) = P(X \ge -y \mid X \le 0) = (F(0)-F(-y))/F(0)</math> y > 0 के लिए परिणाम स्वरुप घनत्व इससे संबंधित हैं <math>g(y) = f(-y)/F(0)</math>: [[गोम्पर्ट्ज़ फ़ंक्शन|गोम्पर्ट्ज़]] फलन प्रतिबिंबित गम्बेल घनत्व के समानुपाती होता है जो सकारात्मक अर्ध-रेखा तक सीमित होता है।<ref>{{Cite journal |doi=10.1016/j.insmatheco.2006.07.003 |title=गोम्पर्ट्ज़ के मृत्यु दर के नियम के सामान्यीकरण द्वारा कमज़ोरी-आधारित मृत्यु दर मॉडल का तर्कसंगत पुनर्निर्माण|year=2007 |last1=Willemse |first1=W.J. |last2=Kaas |first2=R. |journal=Insurance: Mathematics and Economics |volume=40 |issue=3 |pages=468|url=https://www.dnb.nl/binaries/Working%20Paper%20135-2007_tcm46-146792.pdf }}</ref> | ||
* यदि X माध्य 1 के साथ एक घातीय रूप से वितरित चर है, तो −log(X) में एक मानक गम्बेल वितरण है। | * यदि X माध्य 1 के साथ एक घातीय रूप से वितरित चर है, तो −log(X) में एक मानक गम्बेल वितरण है। | ||
* | * यदि <math>X \sim \mathrm{Gumbel}(\alpha_X, \beta) </math> और <math> Y \sim \mathrm{Gumbel}(\alpha_Y, \beta) </math> फिर स्वतंत्र हैं <math> X-Y \sim \mathrm{Logistic}(\alpha_X-\alpha_Y,\beta) \,</math> (लॉजिस्टिक वितरण देखें)। | ||
* | * यदि <math>X, Y \sim \mathrm{Gumbel}(\alpha, \beta) </math> फिर स्वतंत्र हैं <math>X+Y \nsim \mathrm{Logistic}(2 \alpha,\beta)</math>. ध्यान दें कि <math> E(X+Y) = 2\alpha+2\beta\gamma \neq 2\alpha = E\left(\mathrm{Logistic}(2 \alpha,\beta) \right) </math>. अधिक समान्य रूप से स्वतंत्र गुम्बेल यादृच्छिक चर के रैखिक संयोजनों का वितरण जीएनआईजी और जीआईजी वितरण द्वारा अनुमानित किया जा सकता है।<ref name="Marques">{{Cite journal | last1=Marques|first1 = F.| last2=Coelho| first2=C.| last3=de Carvalho|first3=M.| title = स्वतंत्र गुम्बेल यादृच्छिक चर के रैखिक संयोजनों के वितरण पर| journal=Statistics and Computing|year=2015|volume=25 | issue=3 | pages=683‒701| doi=10.1007/s11222-014-9453-5 | s2cid=255067312 | url=https://www.maths.ed.ac.uk/~mdecarv/papers/marques2015.pdf}}</ref> | ||
[[सामान्यीकृत बहुभिन्नरूपी लॉग-गामा वितरण]] से संबंधित सिद्धांत गम्बेल वितरण का एक बहुभिन्नरूपी संस्करण प्रदान करता है। | [[सामान्यीकृत बहुभिन्नरूपी लॉग-गामा वितरण]] से संबंधित सिद्धांत गम्बेल वितरण का एक बहुभिन्नरूपी संस्करण प्रदान करता है। | ||
==घटना और अनुप्रयोग== | ==घटना और अनुप्रयोग== | ||
गम्बेल ने दिखाया है<ref>[https://www.waterlog.info/cumfreq.htm CumFreq, software for probability distribution fitting]</ref> कि एक घातांकीय वितरण के बाद यादृच्छिक चर के नमूने में अधिकतम मूल्य (या अंतिम क्रम आँकड़ा) नमूना आकार के प्राकृतिक लघुगणक को घटाकर<ref>[https://math.stackexchange.com/questions/3527556/gumbel-distribution-and-exponential-distribution?noredirect=1#comment7669633_3527556 user49229, Gumbel distribution and exponential distribution ]</ref> नमूना आकार बढ़ने पर गम्बेल वितरण के पास पहुँच जाता है।<ref>{{cite book |last=Gumbel |first= E.J. |year=1954 |asin=B0007DSHG4 |title=चरम मूल्यों का सांख्यिकीय सिद्धांत और कुछ व्यावहारिक अनुप्रयोग|series=Applied Mathematics Series |volume= 33 |edition=1st |url= https://ntrl.ntis.gov/NTRL/dashboard/searchResults/titleDetail/PB175818.xhtml |publisher= U.S. Department of Commerce, National Bureau of Standards}}</ref>\ | |||
:<math>P(\tilde{x}-\log(N)\le X)=P(\tilde{x}\le X+\log(N))=[Q(X+\log(N))]^N=\left(1- \frac{e^{-X}}{N}\right)^N, </math> | सीधे रूप से मान लीजिए कि <math> \rho(x)=e^{-x} </math>, <math> x </math> का संभाव्यता वितरण है और <math> Q(x)=1- e^{-x} </math> इसका संचयी वितरण है। तब <math> x </math> के <math> N </math> प्राप्तियों में से अधिकतम मान <math> X </math> से छोटा होता है यदि और केवल तभी यदि सभी प्राप्तियाँ <math> X </math> से छोटी हों। तो अधिकतम मान का संचयी वितरण <math> \tilde{x} </math> संतुष्ट करता है | ||
और, बड़े | |||
[[जल विज्ञान]] में, इसलिए, गुम्बेल वितरण का उपयोग दैनिक वर्षा और नदी निर्वहन मात्रा के मासिक और वार्षिक | :<math>P(\tilde{x}-\log(N)\le X)=P(\tilde{x}\le X+\log(N))=[Q(X+\log(N))]^N=\left(1- \frac{e^{-X}}{N}\right)^N, | ||
</math> | |||
और, बड़े <math> N </math> के लिए, दाईं ओर <math> e^{-e^{(-X)}}. </math> पर परिवर्तित हो जाता है। | |||
[[जल विज्ञान]] में''', इसलिए, गुम्बेल वितरण का उपयोग दैनिक वर्षा और नदी निर्वहन मात्रा के मासिक और वार्षिक अधिक'''तम मूल्यों जैसे चर का विश्लेषण करने के लिए किया जाता है।<ref name="Oosterbaan">{{cite book |editor-last=Ritzema |editor-first=H.P. |first1=R.J. |last1=Oosterbaan |chapter=Chapter 6 Frequency and Regression Analysis |year=1994 |title=Drainage Principles and Applications, Publication 16 |publisher=International Institute for Land Reclamation and Improvement (ILRI) |location=Wageningen, The Netherlands |pages=[https://archive.org/details/drainageprincipl0000unse/page/175 175–224] |chapter-url=http://www.waterlog.info/pdf/freqtxt.pdf |isbn=90-70754-33-9 |url=https://archive.org/details/drainageprincipl0000unse/page/175 }}</ref> और सूखे का वर्णन भी करना है।<ref>{{cite journal |doi=10.1016/j.jhydrol.2010.04.035 |title=यूके के सूखे का एक चरम मूल्य विश्लेषण और भविष्य में परिवर्तन के अनुमान|year=2010 |last1=Burke |first1=Eleanor J. |last2=Perry |first2=Richard H.J. |last3=Brown |first3=Simon J. |journal=Journal of Hydrology |volume=388 |issue=1–2 |pages=131–143 |bibcode=2010JHyd..388..131B}}</ref> | |||
गम्बेल ने अनुमानक को भी दर्शाया है {{frac|''r''|(''n''+1)}} किसी घटना की संभावना के लिए - जहां r डेटा श्रृंखला में देखे गए मान की रैंक संख्या है और n अवलोकनों की कुल संख्या है - वितरण के [[मोड (सांख्यिकी)]] के आसपास संचयी संभावना का एक निष्पक्ष अनुमानक है। इसलिए, इस अनुमानक का उपयोग अक्सर [[प्लॉटिंग स्थिति]] के रूप में किया जाता है। | गम्बेल ने अनुमानक को भी दर्शाया है {{frac|''r''|(''n''+1)}} किसी घटना की संभावना के लिए - जहां r डेटा श्रृंखला में देखे गए मान की रैंक संख्या है और n अवलोकनों की कुल संख्या है - वितरण के [[मोड (सांख्यिकी)]] के आसपास संचयी संभावना का एक निष्पक्ष अनुमानक है। इसलिए, इस अनुमानक का उपयोग अक्सर [[प्लॉटिंग स्थिति]] के रूप में किया जाता है। | ||
Line 78: | Line 88: | ||
=== गम्बेल [[रिपैरामेट्रिज़ेशन ट्रिक]]्स === | === गम्बेल [[रिपैरामेट्रिज़ेशन ट्रिक]]्स === | ||
[[ यंत्र अधिगम ]] में, गम्बेल वितरण को कभी-कभी [[श्रेणीबद्ध वितरण]] से नमूने उत्पन्न करने के लिए नियोजित किया जाता है। इस तकनीक को गम्बेल-मैक्स ट्रिक कहा जाता है और यह रिपेरामेट्रिज़ेशन ट्रिक का एक विशेष उदाहरण है।<ref>{{Cite conference |first1=Eric |last1=Jang |first2=Shixiang |last2=Gu |first3=Ben |last3=Poole |date=April 2017 |title=गम्बेल-सॉफ्टमैक्स के साथ श्रेणीबद्ध पुनर्मूल्यांकन|url=https://pure.mpg.de/pubman/faces/ViewItemOverviewPage.jsp?itemId=item_2564872 |conference=International Conference on Learning Representations (ICLR) 2017}}</ref> | [[ यंत्र अधिगम ]] में, गम्बेल वितरण को कभी-कभी [[श्रेणीबद्ध वितरण]] से नमूने उत्पन्न करने के लिए नियोजित किया जाता है। इस तकनीक को गम्बेल-मैक्स ट्रिक कहा जाता है और यह रिपेरामेट्रिज़ेशन ट्रिक का एक विशेष उदाहरण है।<ref>{{Cite conference |first1=Eric |last1=Jang |first2=Shixiang |last2=Gu |first3=Ben |last3=Poole |date=April 2017 |title=गम्बेल-सॉफ्टमैक्स के साथ श्रेणीबद्ध पुनर्मूल्यांकन|url=https://pure.mpg.de/pubman/faces/ViewItemOverviewPage.jsp?itemId=item_2564872 |conference=International Conference on Learning Representations (ICLR) 2017}}</ref> | ||
आइए विस्तार से जानते हैं <math>(\pi_1, \ldots, \pi_n)</math> गैर- | आइए विस्तार से जानते हैं <math>(\pi_1, \ldots, \pi_n)</math> गैर-ऋणात्मक हो, और सभी शून्य नहीं, और चलो <math>g_1,\ldots , g_n</math> गम्बेल(0,1) के स्वतंत्र नमूने बनें, फिर नियमित एकीकरण द्वारा,<math display="block">Pr(j = \arg\max_i (g_i + \log\pi_i)) = \frac{\pi_j}{\sum_i \pi_i}</math>वह है, <math>\arg\max_i (g_i + \log\pi_i) \sim \text{Categorical}\left(\frac{\pi_j}{\sum_i \pi_i}\right)_j</math> | ||
समान रूप से, कोई भी दिया गया <math>x_1, ..., x_n\in \R</math>, हम इसके बोल्ट्ज़मैन वितरण से नमूना ले सकते हैं | समान रूप से, कोई भी दिया गया <math>x_1, ..., x_n\in \R</math>, हम इसके बोल्ट्ज़मैन वितरण से नमूना ले सकते हैं | ||
<math display="block">Pr(j = \arg\max_i (g_i + x_i)) = \frac{e^{x_j}}{\sum_i e^{x_i}}</math>संबंधित समीकरणों में शामिल हैं:<ref>{{Cite journal |last1=Balog |first1=Matej |last2=Tripuraneni |first2=Nilesh |last3=Ghahramani |first3=Zoubin |last4=Weller |first4=Adrian |date=2017-07-17 |title=गम्बेल ट्रिक के खोए हुए रिश्तेदार|url=https://proceedings.mlr.press/v70/balog17a.html |journal=International Conference on Machine Learning |language=en |publisher=PMLR |pages=371–379|arxiv=1706.04161 }}</ref> | <math display="block">Pr(j = \arg\max_i (g_i + x_i)) = \frac{e^{x_j}}{\sum_i e^{x_i}}</math>संबंधित समीकरणों में शामिल हैं:<ref>{{Cite journal |last1=Balog |first1=Matej |last2=Tripuraneni |first2=Nilesh |last3=Ghahramani |first3=Zoubin |last4=Weller |first4=Adrian |date=2017-07-17 |title=गम्बेल ट्रिक के खोए हुए रिश्तेदार|url=https://proceedings.mlr.press/v70/balog17a.html |journal=International Conference on Machine Learning |language=en |publisher=PMLR |pages=371–379|arxiv=1706.04161 }}</ref> | ||
* | * यदि <math>x\sim \operatorname{Exp}(\lambda)</math>, तब <math>(-\ln x - \gamma)\sim \text{Gumbel}(-\gamma + \ln\lambda, 1)</math>. | ||
* <math>\arg\max_i (g_i + \log\pi_i) \sim \text{Categorical}\left(\frac{\pi_j}{\sum_i \pi_i}\right)_j</math>. | * <math>\arg\max_i (g_i + \log\pi_i) \sim \text{Categorical}\left(\frac{\pi_j}{\sum_i \pi_i}\right)_j</math>. | ||
* <math>\max_i (g_i + \log\pi_i) \sim \text{Gumbel}\left(-\gamma + \log\left(\sum_i \pi_i \right), 1\right)</math>. अर्थात्, गम्बेल वितरण एक अधिकतम-स्थिर वितरण परिवार है। | * <math>\max_i (g_i + \log\pi_i) \sim \text{Gumbel}\left(-\gamma + \log\left(\sum_i \pi_i \right), 1\right)</math>. अर्थात्, गम्बेल वितरण एक अधिकतम-स्थिर वितरण परिवार है। | ||
Line 91: | Line 101: | ||
{{further|Non-uniform random variate generation}} | {{further|Non-uniform random variate generation}} | ||
चूंकि क्वांटाइल | चूंकि क्वांटाइल फलन (व्युत्क्रम संचयी वितरण फलन ), <math>Q(p)</math>, एक गम्बेल वितरण द्वारा दिया गया है | ||
:<math>Q(p)=\mu-\beta\ln(-\ln(p)),</math> | :<math>Q(p)=\mu-\beta\ln(-\ln(p)),</math> | ||
Line 97: | Line 107: | ||
===संभावना पत्र=== | ===संभावना पत्र=== | ||
[[File:Gumbel paper.JPG|thumb|320px|ग्राफ़ पेपर का एक टुकड़ा जिसमें गम्बेल वितरण शामिल है।]]पूर्व-सॉफ़्टवेयर समय में गम्बेल वितरण को चित्रित करने के लिए संभाव्यता पेपर का उपयोग किया जाता था (चित्रण देखें)। यह पेपर संचयी वितरण | [[File:Gumbel paper.JPG|thumb|320px|ग्राफ़ पेपर का एक टुकड़ा जिसमें गम्बेल वितरण शामिल है।]]पूर्व-सॉफ़्टवेयर समय में गम्बेल वितरण को चित्रित करने के लिए संभाव्यता पेपर का उपयोग किया जाता था (चित्रण देखें)। यह पेपर संचयी वितरण फलन के रैखिककरण पर आधारित है <math>F</math> : | ||
: <math> -\ln[-\ln(F)] = \frac{x-\mu}\beta </math> | : <math> -\ln[-\ln(F)] = \frac{x-\mu}\beta </math> | ||
कागज में क्षैतिज अक्ष का निर्माण दोहरे लॉग स्केल पर किया गया है। ऊर्ध्वाधर अक्ष रैखिक है. साजिश करके <math>F</math> कागज के क्षैतिज अक्ष पर और <math>x</math>-ऊर्ध्वाधर अक्ष पर चर, वितरण को ढलान 1 के साथ एक सीधी रेखा द्वारा दर्शाया जाता है<math>/\beta</math>. जब [[CumFreq]] जैसा वितरण फिटिंग सॉफ्टवेयर उपलब्ध हो गया, तो वितरण की योजना बनाने का कार्य आसान हो गया। | कागज में क्षैतिज अक्ष का निर्माण दोहरे लॉग स्केल पर किया गया है। ऊर्ध्वाधर अक्ष रैखिक है. साजिश करके <math>F</math> कागज के क्षैतिज अक्ष पर और <math>x</math>-ऊर्ध्वाधर अक्ष पर चर, वितरण को ढलान 1 के साथ एक सीधी रेखा द्वारा दर्शाया जाता है<math>/\beta</math>. जब [[CumFreq]] जैसा वितरण फिटिंग सॉफ्टवेयर उपलब्ध हो गया, तो वितरण की योजना बनाने का कार्य आसान हो गया। |
Revision as of 14:34, 13 July 2023
Probability density function | |||
Cumulative distribution function | |||
Notation | |||
---|---|---|---|
Parameters |
location (real) scale (real) | ||
Support | |||
where | |||
CDF | |||
Mean |
where is the Euler–Mascheroni constant | ||
Median | |||
Mode | |||
Variance | |||
Skewness | |||
Ex. kurtosis | |||
Entropy | |||
MGF | |||
CF |
संभाव्यता सिद्धांत और सांख्यिकी में, गम्बेल वितरण (जिसे टाइप-I सामान्यीकृत चरम मूल्य वितरण के रूप में भी जाना जाता है) का उपयोग विभिन्न वितरणों के कई नमूनों के अधिकतम (या न्यूनतम) वितरण को मॉडल करने के लिए किया जाता है।
इस वितरण का उपयोग किसी विशेष वर्ष में नदी के अधिकतम स्तर के वितरण को दर्शाने के लिए किया जा सकता है यदि पिछले दस वर्षों के लिए अधिकतम मूल्यों की सूची है। यह भीषण भूकंप, बाढ़ या अन्य प्राकृतिक आपदा घटित होने की संभावना का पूर्वानुमान लगाने में उपयोगी है। मैक्सिमा के वितरण का प्रतिनिधित्व करने के लिए गम्बेल वितरण की संभावित प्रयोज्यता चरम मूल्य सिद्धांत से संबंधित है, जो अनुरूपित करता है कि यदि अंतर्निहित नमूना डेटा का वितरण सामान्य या घातीय प्रकार का है तो यह उपयोगी होने की संभावना है। यह लेख अधिकतम मूल्य के वितरण को मॉडल करने के लिए गम्बेल वितरण का उपयोग करता है। न्यूनतम मान को मॉडल करने के लिए, मूल मानों के ऋणात्मक का उपयोग करता है।
गम्बेल वितरण सामान्यीकृत चरम मूल्य वितरण (जिसे फिशर-टिपेट वितरण के रूप में भी जाना जाता है) का एक विशेष स्थिति है। इसे वेइबुल वितरण और दोहरा घातांकीय वितरण के रूप में भी जाना जाता है (एक शब्द जिसे वैकल्पिक रूप से कभी-कभी लाप्लास वितरण को संदर्भित करने के लिए उपयोग किया जाता है)। यह गोम्पर्ट्ज़ वितरण से संबंधित है जब इसका घनत्व पहले मूल के बारे में परिलक्षित होता है और फिर सकारात्मक आधी रेखा तक सीमित होता है तो एक गोम्पर्ट्ज़ फलन प्राप्त होता है।
बहुपद लॉगिट मॉडल के अव्यक्त चर सूत्रीकरण में - असतत विकल्प सिद्धांत में समान्य - अव्यक्त चर की त्रुटियां एक गमबेल वितरण का पालन करती हैं। यह उपयोगी है क्योंकि दो गम्बेल-वितरित यादृच्छिक चर के अंतर में एक लॉजिस्टिक वितरण होता है।
गंबेल वितरण का नाम एमिल जूलियस गम्बेल (1891-1966) के नाम पर रखा गया है, जो वितरण का वर्णन करने वाले उनके मूल पत्रों पर आधारित है।[1][2]
परिभाषाएँ
गम्बेल वितरण का संचयी वितरण कार्य है
मानक गम्बल वितरण
मानक गम्बेल वितरण वह स्थिति है जहां संचयी वितरण फलन के साथ और होता है
और संभाव्यता घनत्व फलन
इस मामले में मोड 0 है, माध्य है, माध्य है (यूलर-माशेरोनी स्थिरांक), और मानक विचलन है।
n > 1 के लिए संचयी द्वारा दिया गया है
गुण
मोड μ है, जबकि माध्यिका है और माध्य इस प्रकार दिया गया है?
- ,
जहाँ यूलर-माशेरोनी स्थिरांक है।
मानक विचलन } है इसलिए [3]
मोड पर, जहां , , के मान पर ध्यान दिए बिना, का मान हो जाता है।
यदि पैरामीटर्स के साथ आईआईडी गम्बेल यादृच्छिक चर है तो भी पैरामीटर के साथ एक गम्बेल यादृच्छिक चर है।
यदि आईआईडी यादृच्छिक चर हैं जैसे कि सभी प्राकृतिक संख्याओं के लिए का वितरण के समान है, तो आवश्यक रूप से स्केल पैरामीटर के साथ वितरित किया गया है (वास्तव में यह केवल दो पर विचार करने के लिए पर्याप्त है) k>1 के विशिष्ट मान जो सहअभाज्य हैं)।
संबंधित वितरण
- यदि एक गम्बेल वितरण है, तो Y = −X का नियमित वितरण यह देखते हुए कि Y सकारात्मक है, या समकक्ष रूप से दिया गया है कि X ऋणात्मक है, एक गोम्पर्टज़ वितरण है। सूत्र के अनुसार, Y का सीडीएफ G, X के सीडीएफ, F से संबंधित है y > 0 के लिए परिणाम स्वरुप घनत्व इससे संबंधित हैं : गोम्पर्ट्ज़ फलन प्रतिबिंबित गम्बेल घनत्व के समानुपाती होता है जो सकारात्मक अर्ध-रेखा तक सीमित होता है।[4]
- यदि X माध्य 1 के साथ एक घातीय रूप से वितरित चर है, तो −log(X) में एक मानक गम्बेल वितरण है।
- यदि और फिर स्वतंत्र हैं (लॉजिस्टिक वितरण देखें)।
- यदि फिर स्वतंत्र हैं . ध्यान दें कि . अधिक समान्य रूप से स्वतंत्र गुम्बेल यादृच्छिक चर के रैखिक संयोजनों का वितरण जीएनआईजी और जीआईजी वितरण द्वारा अनुमानित किया जा सकता है।[5]
सामान्यीकृत बहुभिन्नरूपी लॉग-गामा वितरण से संबंधित सिद्धांत गम्बेल वितरण का एक बहुभिन्नरूपी संस्करण प्रदान करता है।
घटना और अनुप्रयोग
गम्बेल ने दिखाया है[6] कि एक घातांकीय वितरण के बाद यादृच्छिक चर के नमूने में अधिकतम मूल्य (या अंतिम क्रम आँकड़ा) नमूना आकार के प्राकृतिक लघुगणक को घटाकर[7] नमूना आकार बढ़ने पर गम्बेल वितरण के पास पहुँच जाता है।[8]\
सीधे रूप से मान लीजिए कि , का संभाव्यता वितरण है और इसका संचयी वितरण है। तब के प्राप्तियों में से अधिकतम मान से छोटा होता है यदि और केवल तभी यदि सभी प्राप्तियाँ से छोटी हों। तो अधिकतम मान का संचयी वितरण संतुष्ट करता है
और, बड़े के लिए, दाईं ओर पर परिवर्तित हो जाता है।
जल विज्ञान में, इसलिए, गुम्बेल वितरण का उपयोग दैनिक वर्षा और नदी निर्वहन मात्रा के मासिक और वार्षिक अधिकतम मूल्यों जैसे चर का विश्लेषण करने के लिए किया जाता है।[3] और सूखे का वर्णन भी करना है।[9]
गम्बेल ने अनुमानक को भी दर्शाया है r⁄(n+1) किसी घटना की संभावना के लिए - जहां r डेटा श्रृंखला में देखे गए मान की रैंक संख्या है और n अवलोकनों की कुल संख्या है - वितरण के मोड (सांख्यिकी) के आसपास संचयी संभावना का एक निष्पक्ष अनुमानक है। इसलिए, इस अनुमानक का उपयोग अक्सर प्लॉटिंग स्थिति के रूप में किया जाता है।
संख्या सिद्धांत में, गम्बेल वितरण एक पूर्णांक के यादृच्छिक विभाजन में पदों की संख्या का अनुमान लगाता है[10] साथ ही अधिकतम अभाज्य अंतरालों और अभाज्य तारामंडलों के बीच अधिकतम अंतरालों के प्रवृत्ति-समायोजित आकार।[11]
गम्बेल रिपैरामेट्रिज़ेशन ट्रिक्स
यंत्र अधिगम में, गम्बेल वितरण को कभी-कभी श्रेणीबद्ध वितरण से नमूने उत्पन्न करने के लिए नियोजित किया जाता है। इस तकनीक को गम्बेल-मैक्स ट्रिक कहा जाता है और यह रिपेरामेट्रिज़ेशन ट्रिक का एक विशेष उदाहरण है।[12] आइए विस्तार से जानते हैं गैर-ऋणात्मक हो, और सभी शून्य नहीं, और चलो गम्बेल(0,1) के स्वतंत्र नमूने बनें, फिर नियमित एकीकरण द्वारा,
- यदि , तब .
- .
- . अर्थात्, गम्बेल वितरण एक अधिकतम-स्थिर वितरण परिवार है।
यादृच्छिक भिन्न पीढ़ी
चूंकि क्वांटाइल फलन (व्युत्क्रम संचयी वितरण फलन ), , एक गम्बेल वितरण द्वारा दिया गया है
विविधता मापदंडों के साथ एक गम्बेल वितरण है और जब यादृच्छिक चर अंतराल पर समान वितरण (निरंतर) से निकाला जाता है .
संभावना पत्र
पूर्व-सॉफ़्टवेयर समय में गम्बेल वितरण को चित्रित करने के लिए संभाव्यता पेपर का उपयोग किया जाता था (चित्रण देखें)। यह पेपर संचयी वितरण फलन के रैखिककरण पर आधारित है :
कागज में क्षैतिज अक्ष का निर्माण दोहरे लॉग स्केल पर किया गया है। ऊर्ध्वाधर अक्ष रैखिक है. साजिश करके कागज के क्षैतिज अक्ष पर और -ऊर्ध्वाधर अक्ष पर चर, वितरण को ढलान 1 के साथ एक सीधी रेखा द्वारा दर्शाया जाता है. जब CumFreq जैसा वितरण फिटिंग सॉफ्टवेयर उपलब्ध हो गया, तो वितरण की योजना बनाने का कार्य आसान हो गया।
यह भी देखें
- टाइप-2 गम्बेल वितरण
- चरम मूल्य सिद्धांत
- सामान्यीकृत चरम मूल्य वितरण
- फिशर-टिपेट-गेडेन्को प्रमेय
- एमिल जूलियस गम्बेल
संदर्भ
- ↑ Gumbel, E.J. (1935), "Les valeurs extrêmes des distributions statistiques" (PDF), Annales de l'Institut Henri Poincaré, 5 (2): 115–158
- ↑ Gumbel E.J. (1941). "The return period of flood flows". The Annals of Mathematical Statistics, 12, 163–190.
- ↑ 3.0 3.1 Oosterbaan, R.J. (1994). "Chapter 6 Frequency and Regression Analysis" (PDF). In Ritzema, H.P. (ed.). Drainage Principles and Applications, Publication 16. Wageningen, The Netherlands: International Institute for Land Reclamation and Improvement (ILRI). pp. 175–224. ISBN 90-70754-33-9.
- ↑ Willemse, W.J.; Kaas, R. (2007). "गोम्पर्ट्ज़ के मृत्यु दर के नियम के सामान्यीकरण द्वारा कमज़ोरी-आधारित मृत्यु दर मॉडल का तर्कसंगत पुनर्निर्माण" (PDF). Insurance: Mathematics and Economics. 40 (3): 468. doi:10.1016/j.insmatheco.2006.07.003.
- ↑ Marques, F.; Coelho, C.; de Carvalho, M. (2015). "स्वतंत्र गुम्बेल यादृच्छिक चर के रैखिक संयोजनों के वितरण पर" (PDF). Statistics and Computing. 25 (3): 683‒701. doi:10.1007/s11222-014-9453-5. S2CID 255067312.
- ↑ CumFreq, software for probability distribution fitting
- ↑ user49229, Gumbel distribution and exponential distribution
- ↑ Gumbel, E.J. (1954). चरम मूल्यों का सांख्यिकीय सिद्धांत और कुछ व्यावहारिक अनुप्रयोग. Applied Mathematics Series. Vol. 33 (1st ed.). U.S. Department of Commerce, National Bureau of Standards. ASIN B0007DSHG4.
- ↑ Burke, Eleanor J.; Perry, Richard H.J.; Brown, Simon J. (2010). "यूके के सूखे का एक चरम मूल्य विश्लेषण और भविष्य में परिवर्तन के अनुमान". Journal of Hydrology. 388 (1–2): 131–143. Bibcode:2010JHyd..388..131B. doi:10.1016/j.jhydrol.2010.04.035.
- ↑ Erdös, Paul; Lehner, Joseph (1941). "एक धनात्मक पूर्णांक के विभाजनों में योगों की संख्या का वितरण". Duke Mathematical Journal. 8 (2): 335. doi:10.1215/S0012-7094-41-00826-8.
- ↑ Kourbatov, A. (2013). "Maximal gaps between prime k-tuples: a statistical approach". Journal of Integer Sequences. 16. arXiv:1301.2242. Bibcode:2013arXiv1301.2242K. Article 13.5.2.
- ↑ Jang, Eric; Gu, Shixiang; Poole, Ben (April 2017). गम्बेल-सॉफ्टमैक्स के साथ श्रेणीबद्ध पुनर्मूल्यांकन. International Conference on Learning Representations (ICLR) 2017.
- ↑ Balog, Matej; Tripuraneni, Nilesh; Ghahramani, Zoubin; Weller, Adrian (2017-07-17). "गम्बेल ट्रिक के खोए हुए रिश्तेदार". International Conference on Machine Learning (in English). PMLR: 371–379. arXiv:1706.04161.