गम्बेल वितरण: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 30: Line 30:


गंबेल वितरण का नाम [[एमिल जूलियस गम्बेल]] (1891-1966) के नाम पर रखा गया है, जो वितरण का वर्णन करने वाले उनके मूल पत्रों पर आधारित है।<ref>{{Citation |url= http://archive.numdam.org/article/AIHP_1935__5_2_115_0.pdf |title= Les valeurs extrêmes des distributions statistiques |last= Gumbel |first= E.J. |journal=  Annales de l'Institut Henri Poincaré |volume= 5 |year=  1935 |pages= 115–158 |issue= 2}}</ref><ref>Gumbel E.J. (1941). "The return period of flood flows". The Annals of Mathematical Statistics, 12, 163–190.</ref>
गंबेल वितरण का नाम [[एमिल जूलियस गम्बेल]] (1891-1966) के नाम पर रखा गया है, जो वितरण का वर्णन करने वाले उनके मूल पत्रों पर आधारित है।<ref>{{Citation |url= http://archive.numdam.org/article/AIHP_1935__5_2_115_0.pdf |title= Les valeurs extrêmes des distributions statistiques |last= Gumbel |first= E.J. |journal=  Annales de l'Institut Henri Poincaré |volume= 5 |year=  1935 |pages= 115–158 |issue= 2}}</ref><ref>Gumbel E.J. (1941). "The return period of flood flows". The Annals of Mathematical Statistics, 12, 163–190.</ref>
==परिभाषाएँ==
==परिभाषाएँ                                                             ==
गम्बेल वितरण का [[संचयी वितरण कार्य]] है
गम्बेल वितरण का [[संचयी वितरण कार्य]] है


Line 37: Line 37:


===मानक गम्बल वितरण===
===मानक गम्बल वितरण===
मानक गम्बेल वितरण वह स्थिति है जहां संचयी वितरण फलन के साथ <math>\mu = 0</math> और <math>\beta = 1</math> होता है
मानक गम्बेल वितरण वह स्थिति है जहां संचयी वितरण फलन के साथ <math>\mu = 0</math> और <math>\beta = 1</math> होता है
:<math>F(x) = e^{-e^{(-x)}}\,</math>
:<math>F(x) = e^{-e^{(-x)}}\,</math>
और संभाव्यता घनत्व फलन  
और संभाव्यता घनत्व फलन  
:<math>f(x) = e^{-(x+e^{-x})}.</math>
:<math>f(x) = e^{-(x+e^{-x})}.</math>
इस मामले में मोड 0 है, माध्य <math>-\ln(\ln(2)) \approx 0.3665</math> है, माध्य <math>\gamma\approx 0.5772</math> है (यूलर-माशेरोनी स्थिरांक), और मानक विचलन <math>\pi/\sqrt{6} \approx 1.2825.</math> है।
इस मामले में मोड 0 है, माध्य <math>-\ln(\ln(2)) \approx 0.3665                                                                                                                                                                                                                                                                                                                                                                                                                        
                                                                                                                                                                                                                       
                                                                                                                                                                          </math> है, माध्य <math>\gamma\approx 0.5772</math> है (यूलर-माशेरोनी स्थिरांक), और मानक विचलन <math>\pi/\sqrt{6} \approx 1.2825.</math> है।


n > 1 के लिए [[ संचयी | संचयी]] द्वारा दिया गया है
n > 1 के लिए [[ संचयी |संचयी]] द्वारा दिया गया है


:<math>\kappa_n = (n-1)! \zeta(n).</math>
:<math>\kappa_n = (n-1)! \zeta(n).</math>
Line 49: Line 51:


==गुण==
==गुण==
मोड μ है, जबकि माध्यिका <math>\mu-\beta \ln\left(\ln 2\right),</math> है और माध्य इस प्रकार दिया गया है?
मोड μ है, जबकि माध्यिका <math>\mu-\beta \ln\left(\ln 2\right),</math> है और माध्य इस प्रकार दिया गया है?
:<math>\operatorname{E}(X)=\mu+\gamma\beta</math>,
:<math>\operatorname{E}(X)=\mu+\gamma\beta</math>,
जहाँ <math> \gamma </math> यूलर-माशेरोनी स्थिरांक है।
जहाँ <math> \gamma </math> यूलर-माशेरोनी स्थिरांक है।
Line 71: Line 73:
गम्बेल ने दिखाया है<ref>[https://www.waterlog.info/cumfreq.htm CumFreq, software for probability distribution fitting]</ref> कि एक घातांकीय वितरण के बाद यादृच्छिक वेरिएबल के नमूने में अधिकतम मूल्य (या अंतिम क्रम आँकड़ा) नमूना आकार के प्राकृतिक लघुगणक को घटाकर<ref>[https://math.stackexchange.com/questions/3527556/gumbel-distribution-and-exponential-distribution?noredirect=1#comment7669633_3527556 user49229, Gumbel distribution and exponential distribution ]</ref> नमूना आकार बढ़ने पर गम्बेल वितरण के पास पहुँच जाता है।<ref>{{cite book |last=Gumbel |first= E.J. |year=1954 |asin=B0007DSHG4 |title=चरम मूल्यों का सांख्यिकीय सिद्धांत और कुछ व्यावहारिक अनुप्रयोग|series=Applied Mathematics Series |volume= 33 |edition=1st |url= https://ntrl.ntis.gov/NTRL/dashboard/searchResults/titleDetail/PB175818.xhtml |publisher= U.S. Department of Commerce, National Bureau of Standards}}</ref>\
गम्बेल ने दिखाया है<ref>[https://www.waterlog.info/cumfreq.htm CumFreq, software for probability distribution fitting]</ref> कि एक घातांकीय वितरण के बाद यादृच्छिक वेरिएबल के नमूने में अधिकतम मूल्य (या अंतिम क्रम आँकड़ा) नमूना आकार के प्राकृतिक लघुगणक को घटाकर<ref>[https://math.stackexchange.com/questions/3527556/gumbel-distribution-and-exponential-distribution?noredirect=1#comment7669633_3527556 user49229, Gumbel distribution and exponential distribution ]</ref> नमूना आकार बढ़ने पर गम्बेल वितरण के पास पहुँच जाता है।<ref>{{cite book |last=Gumbel |first= E.J. |year=1954 |asin=B0007DSHG4 |title=चरम मूल्यों का सांख्यिकीय सिद्धांत और कुछ व्यावहारिक अनुप्रयोग|series=Applied Mathematics Series |volume= 33 |edition=1st |url= https://ntrl.ntis.gov/NTRL/dashboard/searchResults/titleDetail/PB175818.xhtml |publisher= U.S. Department of Commerce, National Bureau of Standards}}</ref>\


सीधे रूप से मान लीजिए कि <math> \rho(x)=e^{-x} </math>, <math> x </math> का संभाव्यता वितरण है और <math> Q(x)=1- e^{-x} </math> इसका संचयी वितरण है। तब <math> x </math> के <math> N </math> प्राप्तियों में से अधिकतम मान <math> X </math> से छोटा होता है यदि और केवल तभी यदि सभी प्राप्तियाँ <math> X </math> से छोटी हों। तो अधिकतम मान का संचयी वितरण <math> \tilde{x} </math> संतुष्ट करता है
सीधे रूप से मान लीजिए कि <math> \rho(x)=e^{-x} </math>, <math> x </math> का संभाव्यता वितरण है और <math> Q(x)=1- e^{-x} </math> इसका संचयी वितरण है। तब <math> x </math> के <math> N </math> प्राप्तियों में से अधिकतम मान <math> X </math> से छोटा होता है यदि और केवल तभी यदि सभी प्राप्तियाँ <math> X </math> से छोटी हों। तो अधिकतम मान का संचयी वितरण <math> \tilde{x} </math> संतुष्ट करता है


:<math>P(\tilde{x}-\log(N)\le X)=P(\tilde{x}\le X+\log(N))=[Q(X+\log(N))]^N=\left(1- \frac{e^{-X}}{N}\right)^N,                                               
:<math>P(\tilde{x}-\log(N)\le X)=P(\tilde{x}\le X+\log(N))=[Q(X+\log(N))]^N=\left(1- \frac{e^{-X}}{N}\right)^N,                                               

Revision as of 14:50, 13 July 2023

Gumbel
Probability density function
Probability distribution function
Cumulative distribution function
Cumulative distribution function
Notation
Parameters location (real)
scale (real)
Support
PDF
where
CDF
Mean
where is the Euler–Mascheroni constant
Median
Mode
Variance
Skewness
Ex. kurtosis
Entropy
MGF
CF


संभाव्यता सिद्धांत और सांख्यिकी में, गम्बेल वितरण (जिसे टाइप-I सामान्यीकृत चरम मूल्य वितरण के रूप में भी जाना जाता है) का उपयोग विभिन्न वितरणों के कई नमूनों के अधिकतम (या न्यूनतम) वितरण को मॉडल करने के लिए किया जाता है।

इस वितरण का उपयोग किसी विशेष वर्ष में नदी के अधिकतम स्तर के वितरण को दर्शाने के लिए किया जा सकता है यदि पिछले दस वर्षों के लिए अधिकतम मूल्यों की सूची है। यह भीषण भूकंप, बाढ़ या अन्य प्राकृतिक आपदा घटित होने की संभावना का पूर्वानुमान लगाने में उपयोगी है। मैक्सिमा के वितरण का प्रतिनिधित्व करने के लिए गम्बेल वितरण की संभावित प्रयोज्यता चरम मूल्य सिद्धांत से संबंधित है, जो अनुरूपित करता है कि यदि अंतर्निहित नमूना डेटा का वितरण सामान्य या घातीय प्रकार का है तो यह उपयोगी होने की संभावना है। यह लेख अधिकतम मूल्य के वितरण को मॉडल करने के लिए गम्बेल वितरण का उपयोग करता है। न्यूनतम मान को मॉडल करने के लिए, मूल मानों के ऋणात्मक का उपयोग करता है।

गम्बेल वितरण सामान्यीकृत चरम मूल्य वितरण (जिसे फिशर-टिपेट वितरण के रूप में भी जाना जाता है) का एक विशेष स्थिति है। इसे वेइबुल वितरण और दोहरा घातांकीय वितरण के रूप में भी जाना जाता है (एक शब्द जिसे वैकल्पिक रूप से कभी-कभी लाप्लास वितरण को संदर्भित करने के लिए उपयोग किया जाता है)। यह गोम्पर्ट्ज़ वितरण से संबंधित है जब इसका घनत्व पहले मूल के बारे में परिलक्षित होता है और फिर सकारात्मक आधी रेखा तक सीमित होता है तो एक गोम्पर्ट्ज़ फलन प्राप्त होता है।

बहुपद लॉगिट मॉडल के अव्यक्त वेरिएबल सूत्रीकरण में - असतत विकल्प सिद्धांत में समान्य - अव्यक्त वेरिएबल की त्रुटियां एक गमबेल वितरण का पालन करती हैं। यह उपयोगी है क्योंकि दो गम्बेल-वितरित यादृच्छिक वेरिएबल के अंतर में एक लॉजिस्टिक वितरण होता है।

गंबेल वितरण का नाम एमिल जूलियस गम्बेल (1891-1966) के नाम पर रखा गया है, जो वितरण का वर्णन करने वाले उनके मूल पत्रों पर आधारित है।[1][2]

परिभाषाएँ

गम्बेल वितरण का संचयी वितरण कार्य है


मानक गम्बल वितरण

मानक गम्बेल वितरण वह स्थिति है जहां संचयी वितरण फलन के साथ और होता है

और संभाव्यता घनत्व फलन

इस मामले में मोड 0 है, माध्य है, माध्य है (यूलर-माशेरोनी स्थिरांक), और मानक विचलन है।

n > 1 के लिए संचयी द्वारा दिया गया है


गुण

मोड μ है, जबकि माध्यिका है और माध्य इस प्रकार दिया गया है?

,

जहाँ यूलर-माशेरोनी स्थिरांक है।

मानक विचलन } है इसलिए [3]

मोड पर, जहां , , के मान पर ध्यान दिए बिना, का मान हो जाता है।

यदि पैरामीटर्स के साथ आईआईडी गम्बेल यादृच्छिक वेरिएबल है तो भी पैरामीटर के साथ एक गम्बेल यादृच्छिक वेरिएबल है।

यदि आईआईडी यादृच्छिक वेरिएबल हैं जैसे कि सभी प्राकृतिक संख्याओं के लिए का वितरण के समान है, तो आवश्यक रूप से स्केल पैरामीटर के साथ वितरित किया गया है (वास्तव में यह केवल दो पर विचार करने के लिए पर्याप्त है) k>1 के विशिष्ट मान जो सहअभाज्य हैं)।

संबंधित वितरण

  • यदि एक गम्बेल वितरण है, तो Y = −X का नियमित वितरण यह देखते हुए कि Y सकारात्मक है, या समकक्ष रूप से दिया गया है कि X ऋणात्मक है, एक गोम्पर्टज़ वितरण है। सूत्र के अनुसार, Y का सीडीएफ G, X के सीडीएफ, F से संबंधित है y > 0 के लिए परिणाम स्वरुप घनत्व इससे संबंधित हैं : गोम्पर्ट्ज़ फलन प्रतिबिंबित गम्बेल घनत्व के समानुपाती होता है जो सकारात्मक अर्ध-रेखा तक सीमित होता है।[4]
  • यदि X माध्य 1 के साथ एक घातीय रूप से वितरित वेरिएबल है, तो −log(X) में एक मानक गम्बेल वितरण है।
  • यदि और फिर स्वतंत्र हैं (लॉजिस्टिक वितरण देखें)।
  • यदि फिर स्वतंत्र हैं . ध्यान दें कि . अधिक समान्य रूप से स्वतंत्र गुम्बेल यादृच्छिक वेरिएबल के रैखिक संयोजनों का वितरण जीएनआईजी और जीआईजी वितरण द्वारा अनुमानित किया जा सकता है।[5]

सामान्यीकृत बहुभिन्नरूपी लॉग-गामा वितरण से संबंधित सिद्धांत गम्बेल वितरण का एक बहुभिन्नरूपी संस्करण प्रदान करता है।

घटना और अनुप्रयोग

गम्बेल ने दिखाया है[6] कि एक घातांकीय वितरण के बाद यादृच्छिक वेरिएबल के नमूने में अधिकतम मूल्य (या अंतिम क्रम आँकड़ा) नमूना आकार के प्राकृतिक लघुगणक को घटाकर[7] नमूना आकार बढ़ने पर गम्बेल वितरण के पास पहुँच जाता है।[8]\

सीधे रूप से मान लीजिए कि , का संभाव्यता वितरण है और इसका संचयी वितरण है। तब के प्राप्तियों में से अधिकतम मान से छोटा होता है यदि और केवल तभी यदि सभी प्राप्तियाँ से छोटी हों। तो अधिकतम मान का संचयी वितरण संतुष्ट करता है

और, बड़े के लिए, दाईं ओर पर परिवर्तित हो जाता है।

जल विज्ञान में, इसलिए गम्बेल वितरण का उपयोग दैनिक वर्षा और नदी निर्वहन मात्रा के मासिक और वार्षिक अधिकतम मूल्यों जैसे वेरिएबल का विश्लेषण करने और सूखे का वर्णन करने के लिए भी किया जाता है।[9][3]

गम्बेल ने यह भी दिखाया है कि किसी घटना की संभावना के लिए अनुमानक r(n+1) - जहां r डेटा श्रृंखला में देखे गए मान की रैंक संख्या है और n अवलोकनों की कुल संख्या है - एक निष्पक्ष अनुमानक है वितरण के मोड के आसपास संचयी संभावना है इसलिए इस अनुमानक का उपयोग अधिकांशत:प्लॉटिंग स्थिति के रूप में किया जाता है।

संख्या सिद्धांत में, गम्बेल वितरण एक पूर्णांक[10] के यादृच्छिक विभाजन में शब्दों की संख्या के साथ-साथ अधिकतम अभाज्य अंतराल और अभाज्य नक्षत्रों के बीच अधिकतम अंतराल के प्रवृत्ति-समायोजित आकार का अनुमान लगाता है।[11]

गम्बेल रिपैरामेट्रिज़ेशन ट्रिक

मशीन लर्निंग में, गम्बेल वितरण को कभी-कभी श्रेणीबद्ध वितरण से नमूने उत्पन्न करने के लिए नियोजित किया जाता है। इस तकनीक को "गंबेल-मैक्स ट्रिक" कहा जाता है और यह "रेपैरामेट्रिज़ेशन ट्रिक" का एक विशेष उदाहरण है।[12] विस्तार से, मान लीजिए कि गैर-नकारात्मक है, और सभी शून्य नहीं हैं, और मान लीजिए कि गम्बेल (0, 1) के स्वतंत्र नमूने हैं, फिर नियमित एकीकरण द्वारा,

वह है, समान रूप से, कोई भी दिया गया , हम इसके बोल्ट्ज़मैन वितरण से नमूना ले सकते हैं


संबंधित समीकरणों में सम्मिलित हैं:[13]

  • यदि , तब .
  • .
  • . अर्थात्, गम्बेल वितरण एक अधिकतम-स्थिर वितरण वर्ग है।


यादृच्छिक भिन्न पीढ़ी

चूंकि क्वांटाइल फलन (व्युत्क्रम संचयी वितरण फलन ), , एक गम्बेल वितरण द्वारा दिया गया है

जब यादृच्छिक वेरिएबल को अंतराल पर समान वितरण से खींचा जाता है, तो वेरिएबल में पैरामीटर और के साथ एक गमबेल वितरण होता है।

संभावना पत्र

ग्राफ़ पेपर का एक टुकड़ा जिसमें गम्बेल वितरण सम्मिलित है।

पूर्व-सॉफ़्टवेयर समय में गम्बेल वितरण को चित्रित करने के लिए संभाव्यता पेपर का उपयोग किया जाता था (चित्रण देखें)। पेपर संचयी वितरण फलन के रैखिककरण पर आधारित है।

कागज में क्षैतिज अक्ष का निर्माण दोहरे लॉग स्केल पर किया गया है। ऊर्ध्वाधर अक्ष रैखिक है. कागज के क्षैतिज अक्ष पर और ऊर्ध्वाधर अक्ष पर -चर को आलेखित करके, वितरण को 1 ढलान वाली एक सीधी रेखा द्वारा दर्शाया जाता है। जब कम फ़्रीक जैसा वितरण फिटिंग सॉफ्टवेयर उपलब्ध हो गया था तो वितरण की योजना बनाने का कार्य आसान हो गया है ।

यह भी देखें

  • टाइप-2 गम्बेल वितरण
  • चरम मूल्य सिद्धांत
  • सामान्यीकृत चरम मूल्य वितरण
  • फिशर-टिपेट-गेडेन्को प्रमेय
  • एमिल जूलियस गम्बेल

संदर्भ

  1. Gumbel, E.J. (1935), "Les valeurs extrêmes des distributions statistiques" (PDF), Annales de l'Institut Henri Poincaré, 5 (2): 115–158
  2. Gumbel E.J. (1941). "The return period of flood flows". The Annals of Mathematical Statistics, 12, 163–190.
  3. 3.0 3.1 Oosterbaan, R.J. (1994). "Chapter 6 Frequency and Regression Analysis" (PDF). In Ritzema, H.P. (ed.). Drainage Principles and Applications, Publication 16. Wageningen, The Netherlands: International Institute for Land Reclamation and Improvement (ILRI). pp. 175–224. ISBN 90-70754-33-9.
  4. Willemse, W.J.; Kaas, R. (2007). "गोम्पर्ट्ज़ के मृत्यु दर के नियम के सामान्यीकरण द्वारा कमज़ोरी-आधारित मृत्यु दर मॉडल का तर्कसंगत पुनर्निर्माण" (PDF). Insurance: Mathematics and Economics. 40 (3): 468. doi:10.1016/j.insmatheco.2006.07.003.
  5. Marques, F.; Coelho, C.; de Carvalho, M. (2015). "स्वतंत्र गुम्बेल यादृच्छिक चर के रैखिक संयोजनों के वितरण पर" (PDF). Statistics and Computing. 25 (3): 683‒701. doi:10.1007/s11222-014-9453-5. S2CID 255067312.
  6. CumFreq, software for probability distribution fitting
  7. user49229, Gumbel distribution and exponential distribution
  8. Gumbel, E.J. (1954). चरम मूल्यों का सांख्यिकीय सिद्धांत और कुछ व्यावहारिक अनुप्रयोग. Applied Mathematics Series. Vol. 33 (1st ed.). U.S. Department of Commerce, National Bureau of Standards. ASIN B0007DSHG4.
  9. Burke, Eleanor J.; Perry, Richard H.J.; Brown, Simon J. (2010). "यूके के सूखे का एक चरम मूल्य विश्लेषण और भविष्य में परिवर्तन के अनुमान". Journal of Hydrology. 388 (1–2): 131–143. Bibcode:2010JHyd..388..131B. doi:10.1016/j.jhydrol.2010.04.035.
  10. Erdös, Paul; Lehner, Joseph (1941). "एक धनात्मक पूर्णांक के विभाजनों में योगों की संख्या का वितरण". Duke Mathematical Journal. 8 (2): 335. doi:10.1215/S0012-7094-41-00826-8.
  11. Kourbatov, A. (2013). "Maximal gaps between prime k-tuples: a statistical approach". Journal of Integer Sequences. 16. arXiv:1301.2242. Bibcode:2013arXiv1301.2242K. Article 13.5.2.
  12. Jang, Eric; Gu, Shixiang; Poole, Ben (April 2017). गम्बेल-सॉफ्टमैक्स के साथ श्रेणीबद्ध पुनर्मूल्यांकन. International Conference on Learning Representations (ICLR) 2017.
  13. Balog, Matej; Tripuraneni, Nilesh; Ghahramani, Zoubin; Weller, Adrian (2017-07-17). "गम्बेल ट्रिक के खोए हुए रिश्तेदार". International Conference on Machine Learning (in English). PMLR: 371–379. arXiv:1706.04161.


बाहरी संबंध