गम्बेल वितरण: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 21: Line 21:




संभाव्यता सिद्धांत और सांख्यिकी में, गम्बेल वितरण (जिसे टाइप-I सामान्यीकृत चरम मूल्य वितरण के रूप में भी जाना जाता है) का उपयोग विभिन्न वितरणों के कई नमूनों के अधिकतम (या न्यूनतम) वितरण को मॉडल करने के लिए किया जाता है।


इस वितरण का उपयोग किसी विशेष वर्ष में नदी के अधिकतम स्तर के वितरण को दर्शाने के लिए किया जा सकता है यदि पिछले दस वर्षों के लिए अधिकतम मूल्यों की सूची है। यह भीषण भूकंप, बाढ़ या अन्य प्राकृतिक आपदा घटित होने की संभावना का पूर्वानुमान लगाने में उपयोगी है। मैक्सिमा के वितरण का प्रतिनिधित्व करने के लिए गम्बेल वितरण की संभावित प्रयोज्यता [[चरम मूल्य सिद्धांत]] से संबंधित है, जो अनुरूपित करता है कि यदि अंतर्निहित नमूना डेटा का वितरण सामान्य या घातीय प्रकार का है तो यह उपयोगी होने की संभावना है। यह लेख अधिकतम मूल्य के वितरण को मॉडल करने के लिए गम्बेल वितरण का उपयोग करता है। न्यूनतम मान को मॉडल करने के लिए, मूल मानों के ऋणात्मक का उपयोग करता है।
संभाव्यता सिद्धांत और सांख्यिकी में, गम्बेल वितरण (जिसे टाइप-I सामान्यीकृत चरम मूल्य वितरण के रूप में भी जाना जाता है) का उपयोग विभिन्न वितरणों के अनेक प्रतिरूपों  के अधिकतम (या न्यूनतम) वितरण को मॉडल करने के लिए किया जाता है।


गम्बेल वितरण सामान्यीकृत चरम मूल्य वितरण (जिसे फिशर-टिपेट वितरण के रूप में भी जाना जाता है) का एक विशेष स्थिति है। इसे ''[[वेइबुल वितरण]]'' और दोहरा घातांकीय वितरण के रूप में भी जाना जाता है (एक शब्द जिसे वैकल्पिक रूप से कभी-कभी [[लाप्लास वितरण]] को संदर्भित करने के लिए उपयोग किया जाता है)। यह [[गोम्पर्ट्ज़ वितरण]] से संबंधित है जब इसका घनत्व पहले मूल के बारे में परिलक्षित होता है और फिर सकारात्मक आधी रेखा तक सीमित होता है तो एक गोम्पर्ट्ज़ फलन प्राप्त होता है।
इस वितरण का उपयोग किसी विशेष वर्ष में नदी के अधिकतम स्तर के वितरण को दर्शाने के लिए किया जा सकता है यदि पिछले दस वर्षों के लिए अधिकतम मूल्यों की सूची है। यह भीषण भूकंप, बाढ़ या अन्य प्राकृतिक आपदा घटित होने की संभावना का पूर्वानुमान लगाने में उपयोगी है। मैक्सिमा के वितरण का प्रतिनिधित्व करने के लिए गम्बेल वितरण की संभावित प्रयोज्यता [[चरम मूल्य सिद्धांत]] से संबंधित है, जो अनुरूपित करता है कि यदि अंतर्निहित प्रतिरूप  डेटा का वितरण सामान्य या घातीय प्रकार का है तो यह उपयोगी होने की संभावना है। यह लेख अधिकतम मूल्य के वितरण को मॉडल करने के लिए गम्बेल वितरण का उपयोग करता है। न्यूनतम मान को मॉडल करने के लिए, मूल मानों के ऋणात्मक का उपयोग करता है।
 
गम्बेल वितरण सामान्यीकृत चरम मूल्य वितरण (जिसे फिशर-टिपेट वितरण के रूप में भी जाना जाता है) का एक विशेष स्थिति है। इसे ''[[वेइबुल वितरण]]'' और दोहरा घातांकीय वितरण के रूप में भी जाना जाता है (एक शब्द जिसे वैकल्पिक रूप से कभी-कभी [[लाप्लास वितरण]] को संदर्भित करने के लिए उपयोग किया जाता है)। यह [[गोम्पर्ट्ज़ वितरण]] से संबंधित है जब इसका घनत्व पहले मूल के बारे में परिलक्षित होता है और फिर धनात्मक आधी रेखा तक सीमित होता है तब एक गोम्पर्ट्ज़ फलन प्राप्त होता है।


बहुपद लॉगिट मॉडल के अव्यक्त वेरिएबल सूत्रीकरण में - असतत विकल्प सिद्धांत में समान्य - अव्यक्त वेरिएबल की त्रुटियां एक गमबेल वितरण का पालन करती हैं। यह उपयोगी है क्योंकि दो गम्बेल-वितरित यादृच्छिक वेरिएबल के अंतर में एक लॉजिस्टिक वितरण होता है।
बहुपद लॉगिट मॉडल के अव्यक्त वेरिएबल सूत्रीकरण में - असतत विकल्प सिद्धांत में समान्य - अव्यक्त वेरिएबल की त्रुटियां एक गमबेल वितरण का पालन करती हैं। यह उपयोगी है क्योंकि दो गम्बेल-वितरित यादृच्छिक वेरिएबल के अंतर में एक लॉजिस्टिक वितरण होता है।
Line 41: Line 42:
और संभाव्यता घनत्व फलन  
और संभाव्यता घनत्व फलन  
:<math>f(x) = e^{-(x+e^{-x})}.</math>
:<math>f(x) = e^{-(x+e^{-x})}.</math>
इस मामले में मोड 0 है, माध्य <math>-\ln(\ln(2)) \approx 0.3665                                                                                                                                                                                                                                                                                                                                                                                                                         
इस स्तिथियों में मोड 0 है, माध्य <math>-\ln(\ln(2)) \approx 0.3665                                                                                                                                                                                                                                                                                                                                                                                                                         
                                                                                                                                                                                                                          
                                                                                                                                                                                                                          
                                                                                                                                                                           </math> है, माध्य <math>\gamma\approx 0.5772</math> है (यूलर-माशेरोनी स्थिरांक), और मानक विचलन <math>\pi/\sqrt{6} \approx 1.2825.</math> है।
                                                                                                                                                                           </math> है, माध्य <math>\gamma\approx 0.5772</math> है (यूलर-माशेरोनी स्थिरांक), और मानक विचलन <math>\pi/\sqrt{6} \approx 1.2825.</math> है।
Line 64: Line 65:


==संबंधित वितरण==
==संबंधित वितरण==
* यदि <math>X </math> एक गम्बेल वितरण है, तो Y = −X का नियमित वितरण यह देखते हुए कि Y सकारात्मक है, या समकक्ष रूप से दिया गया है कि X ऋणात्मक है, एक गोम्पर्टज़ वितरण है। सूत्र के अनुसार, Y का सीडीएफ G, X के सीडीएफ, F से संबंधित है <math>G(y) = P(Y \le y) = P(X \ge -y \mid X \le 0) = (F(0)-F(-y))/F(0)</math> y > 0 के लिए परिणाम स्वरुप घनत्व इससे संबंधित हैं <math>g(y) = f(-y)/F(0)</math>: [[गोम्पर्ट्ज़ फ़ंक्शन|गोम्पर्ट्ज़]] फलन प्रतिबिंबित गम्बेल घनत्व के समानुपाती होता है जो सकारात्मक अर्ध-रेखा तक सीमित होता है।<ref>{{Cite journal |doi=10.1016/j.insmatheco.2006.07.003 |title=गोम्पर्ट्ज़ के मृत्यु दर के नियम के सामान्यीकरण द्वारा कमज़ोरी-आधारित मृत्यु दर मॉडल का तर्कसंगत पुनर्निर्माण|year=2007 |last1=Willemse |first1=W.J. |last2=Kaas |first2=R. |journal=Insurance: Mathematics and Economics |volume=40 |issue=3 |pages=468|url=https://www.dnb.nl/binaries/Working%20Paper%20135-2007_tcm46-146792.pdf }}</ref>
* यदि <math>X </math> एक गम्बेल वितरण है, तो Y = −X का नियमित वितरण यह देखते हुए कि Y धनात्मक है, या समकक्ष रूप से दिया गया है कि X ऋणात्मक है, एक गोम्पर्टज़ वितरण है। सूत्र के अनुसार, Y का सीडीएफ G, X के सीडीएफ, F से संबंधित है <math>G(y) = P(Y \le y) = P(X \ge -y \mid X \le 0) = (F(0)-F(-y))/F(0)</math> y > 0 के लिए परिणाम स्वरुप घनत्व इससे संबंधित हैं <math>g(y) = f(-y)/F(0)</math>: [[गोम्पर्ट्ज़ फ़ंक्शन|गोम्पर्ट्ज़]] फलन प्रतिबिंबित गम्बेल घनत्व के समानुपाती होता है जो धनात्मक  अर्ध-रेखा तक सीमित होता है।<ref>{{Cite journal |doi=10.1016/j.insmatheco.2006.07.003 |title=गोम्पर्ट्ज़ के मृत्यु दर के नियम के सामान्यीकरण द्वारा कमज़ोरी-आधारित मृत्यु दर मॉडल का तर्कसंगत पुनर्निर्माण|year=2007 |last1=Willemse |first1=W.J. |last2=Kaas |first2=R. |journal=Insurance: Mathematics and Economics |volume=40 |issue=3 |pages=468|url=https://www.dnb.nl/binaries/Working%20Paper%20135-2007_tcm46-146792.pdf }}</ref>
* यदि X माध्य 1 के साथ एक घातीय रूप से वितरित वेरिएबल है, तो −log(X) में एक मानक गम्बेल वितरण है।
* यदि X माध्य 1 के साथ एक घातीय रूप से वितरित वेरिएबल है, तो −log(X) में एक मानक गम्बेल वितरण है।
* यदि <math>X \sim \mathrm{Gumbel}(\alpha_X, \beta) </math> और <math> Y \sim \mathrm{Gumbel}(\alpha_Y, \beta) </math> फिर स्वतंत्र हैं <math> X-Y \sim \mathrm{Logistic}(\alpha_X-\alpha_Y,\beta) \,</math> (लॉजिस्टिक वितरण देखें)।
* यदि <math>X \sim \mathrm{Gumbel}(\alpha_X, \beta) </math> और <math> Y \sim \mathrm{Gumbel}(\alpha_Y, \beta) </math> फिर स्वतंत्र हैं <math> X-Y \sim \mathrm{Logistic}(\alpha_X-\alpha_Y,\beta) \,</math> (लॉजिस्टिक वितरण देखें)।
Line 71: Line 72:


==घटना और अनुप्रयोग==
==घटना और अनुप्रयोग==
गम्बेल ने दिखाया है<ref>[https://www.waterlog.info/cumfreq.htm CumFreq, software for probability distribution fitting]</ref> कि एक घातांकीय वितरण के बाद यादृच्छिक वेरिएबल के नमूने में अधिकतम मूल्य (या अंतिम क्रम आँकड़ा) नमूना आकार के प्राकृतिक लघुगणक को घटाकर<ref>[https://math.stackexchange.com/questions/3527556/gumbel-distribution-and-exponential-distribution?noredirect=1#comment7669633_3527556 user49229, Gumbel distribution and exponential distribution ]</ref> नमूना आकार बढ़ने पर गम्बेल वितरण के पास पहुँच जाता है।<ref>{{cite book |last=Gumbel |first= E.J. |year=1954 |asin=B0007DSHG4 |title=चरम मूल्यों का सांख्यिकीय सिद्धांत और कुछ व्यावहारिक अनुप्रयोग|series=Applied Mathematics Series |volume= 33 |edition=1st |url= https://ntrl.ntis.gov/NTRL/dashboard/searchResults/titleDetail/PB175818.xhtml |publisher= U.S. Department of Commerce, National Bureau of Standards}}</ref>\
गम्बेल ने दिखाया है<ref>[https://www.waterlog.info/cumfreq.htm CumFreq, software for probability distribution fitting]</ref> कि एक घातांकीय वितरण के बाद यादृच्छिक वेरिएबल के प्रतिरूप में अधिकतम मूल्य (या अंतिम क्रम आँकड़ा) प्रतिरूप  आकार के प्राकृतिक लघुगणक को घटाकर<ref>[https://math.stackexchange.com/questions/3527556/gumbel-distribution-and-exponential-distribution?noredirect=1#comment7669633_3527556 user49229, Gumbel distribution and exponential distribution ]</ref> प्रतिरूप  आकार बढ़ने पर गम्बेल वितरण के पास पहुँच जाता है।<ref>{{cite book |last=Gumbel |first= E.J. |year=1954 |asin=B0007DSHG4 |title=चरम मूल्यों का सांख्यिकीय सिद्धांत और कुछ व्यावहारिक अनुप्रयोग|series=Applied Mathematics Series |volume= 33 |edition=1st |url= https://ntrl.ntis.gov/NTRL/dashboard/searchResults/titleDetail/PB175818.xhtml |publisher= U.S. Department of Commerce, National Bureau of Standards}}</ref>\


सीधे रूप से मान लीजिए कि <math> \rho(x)=e^{-x} </math>, <math> x </math> का संभाव्यता वितरण है और <math> Q(x)=1- e^{-x} </math> इसका संचयी वितरण है। तब <math> x </math> के <math> N </math> प्राप्तियों में से अधिकतम मान <math> X </math> से छोटा होता है यदि और केवल तभी यदि सभी प्राप्तियाँ <math> X </math> से छोटी हों। तो अधिकतम मान का संचयी वितरण <math> \tilde{x} </math> संतुष्ट करता है
सीधे रूप से मान लीजिए कि <math> \rho(x)=e^{-x} </math>, <math> x </math> का संभाव्यता वितरण है और <math> Q(x)=1- e^{-x} </math> इसका संचयी वितरण है। तब <math> x </math> के <math> N </math> प्राप्तियों में से अधिकतम मान <math> X </math> से छोटा होता है यदि और केवल तभी यदि सभी प्राप्तियाँ <math> X </math> से छोटी हों। तो अधिकतम मान का संचयी वितरण <math> \tilde{x} </math> संतुष्ट करता है
Line 87: Line 88:
संख्या सिद्धांत में, गम्बेल वितरण एक पूर्णांक<ref>{{cite journal |doi=10.1215/S0012-7094-41-00826-8 |title=एक धनात्मक पूर्णांक के विभाजनों में योगों की संख्या का वितरण|year=1941 |last1=Erdös |first1=Paul |last2=Lehner |first2=Joseph |journal=Duke Mathematical Journal |volume=8 |issue=2 |pages=335}}</ref> के यादृच्छिक विभाजन में शब्दों की संख्या के साथ-साथ अधिकतम अभाज्य अंतराल और अभाज्य नक्षत्रों के बीच अधिकतम अंतराल के प्रवृत्ति-समायोजित आकार का अनुमान लगाता है।<ref>{{cite journal |arxiv=1301.2242 |last=Kourbatov |first= A. |title=Maximal gaps between prime ''k''-tuples: a statistical approach |journal=Journal of Integer Sequences |volume=16 |year=2013|bibcode=2013arXiv1301.2242K }} Article 13.5.2.</ref>
संख्या सिद्धांत में, गम्बेल वितरण एक पूर्णांक<ref>{{cite journal |doi=10.1215/S0012-7094-41-00826-8 |title=एक धनात्मक पूर्णांक के विभाजनों में योगों की संख्या का वितरण|year=1941 |last1=Erdös |first1=Paul |last2=Lehner |first2=Joseph |journal=Duke Mathematical Journal |volume=8 |issue=2 |pages=335}}</ref> के यादृच्छिक विभाजन में शब्दों की संख्या के साथ-साथ अधिकतम अभाज्य अंतराल और अभाज्य नक्षत्रों के बीच अधिकतम अंतराल के प्रवृत्ति-समायोजित आकार का अनुमान लगाता है।<ref>{{cite journal |arxiv=1301.2242 |last=Kourbatov |first= A. |title=Maximal gaps between prime ''k''-tuples: a statistical approach |journal=Journal of Integer Sequences |volume=16 |year=2013|bibcode=2013arXiv1301.2242K }} Article 13.5.2.</ref>
=== गम्बेल [[रिपैरामेट्रिज़ेशन ट्रिक]] ===
=== गम्बेल [[रिपैरामेट्रिज़ेशन ट्रिक]] ===
मशीन लर्निंग में, गम्बेल वितरण को कभी-कभी श्रेणीबद्ध वितरण से नमूने उत्पन्न करने के लिए नियोजित किया जाता है। इस तकनीक को "गंबेल-मैक्स ट्रिक" कहा जाता है और यह "रेपैरामेट्रिज़ेशन ट्रिक" का एक विशेष उदाहरण है।<ref>{{Cite conference |first1=Eric |last1=Jang |first2=Shixiang |last2=Gu |first3=Ben |last3=Poole |date=April 2017 |title=गम्बेल-सॉफ्टमैक्स के साथ श्रेणीबद्ध पुनर्मूल्यांकन|url=https://pure.mpg.de/pubman/faces/ViewItemOverviewPage.jsp?itemId=item_2564872 |conference=International Conference on Learning Representations (ICLR) 2017}}</ref>
मशीन लर्निंग में, गम्बेल वितरण को कभी-कभी श्रेणीबद्ध वितरण से प्रतिरूप उत्पन्न करने के लिए नियोजित किया जाता है। इस तकनीक को "गंबेल-मैक्स ट्रिक" कहा जाता है और यह "रेपैरामेट्रिज़ेशन ट्रिक" का एक विशेष उदाहरण है।<ref>{{Cite conference |first1=Eric |last1=Jang |first2=Shixiang |last2=Gu |first3=Ben |last3=Poole |date=April 2017 |title=गम्बेल-सॉफ्टमैक्स के साथ श्रेणीबद्ध पुनर्मूल्यांकन|url=https://pure.mpg.de/pubman/faces/ViewItemOverviewPage.jsp?itemId=item_2564872 |conference=International Conference on Learning Representations (ICLR) 2017}}</ref>
विस्तार से, मान लीजिए कि <math>(\pi_1, \ldots, \pi_n)</math> गैर-नकारात्मक है, और सभी शून्य नहीं हैं, और मान लीजिए कि <math>g_1,\ldots , g_n</math> गम्बेल (0, 1) के स्वतंत्र नमूने हैं, फिर नियमित एकीकरण द्वारा,<math display="block">Pr(j = \arg\max_i (g_i + \log\pi_i)) = \frac{\pi_j}{\sum_i \pi_i}</math>वह है, <math>\arg\max_i (g_i + \log\pi_i) \sim \text{Categorical}\left(\frac{\pi_j}{\sum_i \pi_i}\right)_j</math>
विस्तार से, मान लीजिए कि <math>(\pi_1, \ldots, \pi_n)</math> गैर-नकारात्मक है, और सभी शून्य नहीं हैं, और मान लीजिए कि <math>g_1,\ldots , g_n</math> गम्बेल (0, 1) के स्वतंत्र प्रतिरूप हैं, फिर नियमित एकीकरण द्वारा,<math display="block">Pr(j = \arg\max_i (g_i + \log\pi_i)) = \frac{\pi_j}{\sum_i \pi_i}</math>वह है, <math>\arg\max_i (g_i + \log\pi_i) \sim \text{Categorical}\left(\frac{\pi_j}{\sum_i \pi_i}\right)_j</math>
समान रूप से, कोई भी दिया गया <math>x_1, ..., x_n\in \R</math>, हम इसके बोल्ट्ज़मैन वितरण से नमूना ले सकते हैं<math display="block">Pr(j = \arg\max_i (g_i + x_i)) = \frac{e^{x_j}}{\sum_i e^{x_i}}</math>
समान रूप से, कोई भी दिया गया <math>x_1, ..., x_n\in \R</math>, हम इसके बोल्ट्ज़मैन वितरण से प्रतिरूप  ले सकते हैं<math display="block">Pr(j = \arg\max_i (g_i + x_i)) = \frac{e^{x_j}}{\sum_i e^{x_i}}</math>
 


संबंधित समीकरणों में सम्मिलित हैं:<ref>{{Cite journal |last1=Balog |first1=Matej |last2=Tripuraneni |first2=Nilesh |last3=Ghahramani |first3=Zoubin |last4=Weller |first4=Adrian |date=2017-07-17 |title=गम्बेल ट्रिक के खोए हुए रिश्तेदार|url=https://proceedings.mlr.press/v70/balog17a.html |journal=International Conference on Machine Learning |language=en |publisher=PMLR |pages=371–379|arxiv=1706.04161 }}</ref>
संबंधित समीकरणों में सम्मिलित हैं:<ref>{{Cite journal |last1=Balog |first1=Matej |last2=Tripuraneni |first2=Nilesh |last3=Ghahramani |first3=Zoubin |last4=Weller |first4=Adrian |date=2017-07-17 |title=गम्बेल ट्रिक के खोए हुए रिश्तेदार|url=https://proceedings.mlr.press/v70/balog17a.html |journal=International Conference on Machine Learning |language=en |publisher=PMLR |pages=371–379|arxiv=1706.04161 }}</ref>
Line 105: Line 105:


:<math>Q(p)=\mu-\beta\ln(-\ln(p)),</math>
:<math>Q(p)=\mu-\beta\ln(-\ln(p)),</math>
जब यादृच्छिक वेरिएबल <math>U</math> को अंतराल <math>(0,1)</math> पर समान वितरण से खींचा जाता है, तो वेरिएबल <math>Q(U)</math> में पैरामीटर <math>\mu</math> और <math>\beta</math> के साथ एक गमबेल वितरण होता है।
जब यादृच्छिक वेरिएबल <math>U</math> को अंतराल <math>(0,1)</math> पर समान वितरण से खींचा जाता है, तब वेरिएबल <math>Q(U)</math> में पैरामीटर <math>\mu</math> और <math>\beta</math> के साथ एक गमबेल वितरण होता है।


===संभावना पत्र===
===संभावना पत्र===

Revision as of 14:30, 30 July 2023

Gumbel
Probability density function
Probability distribution function
Cumulative distribution function
Cumulative distribution function
Notation
Parameters location (real)
scale (real)
Support
PDF
where
CDF
Mean
where is the Euler–Mascheroni constant
Median
Mode
Variance
Skewness
Ex. kurtosis
Entropy
MGF
CF


संभाव्यता सिद्धांत और सांख्यिकी में, गम्बेल वितरण (जिसे टाइप-I सामान्यीकृत चरम मूल्य वितरण के रूप में भी जाना जाता है) का उपयोग विभिन्न वितरणों के अनेक प्रतिरूपों के अधिकतम (या न्यूनतम) वितरण को मॉडल करने के लिए किया जाता है।

इस वितरण का उपयोग किसी विशेष वर्ष में नदी के अधिकतम स्तर के वितरण को दर्शाने के लिए किया जा सकता है यदि पिछले दस वर्षों के लिए अधिकतम मूल्यों की सूची है। यह भीषण भूकंप, बाढ़ या अन्य प्राकृतिक आपदा घटित होने की संभावना का पूर्वानुमान लगाने में उपयोगी है। मैक्सिमा के वितरण का प्रतिनिधित्व करने के लिए गम्बेल वितरण की संभावित प्रयोज्यता चरम मूल्य सिद्धांत से संबंधित है, जो अनुरूपित करता है कि यदि अंतर्निहित प्रतिरूप डेटा का वितरण सामान्य या घातीय प्रकार का है तो यह उपयोगी होने की संभावना है। यह लेख अधिकतम मूल्य के वितरण को मॉडल करने के लिए गम्बेल वितरण का उपयोग करता है। न्यूनतम मान को मॉडल करने के लिए, मूल मानों के ऋणात्मक का उपयोग करता है।

गम्बेल वितरण सामान्यीकृत चरम मूल्य वितरण (जिसे फिशर-टिपेट वितरण के रूप में भी जाना जाता है) का एक विशेष स्थिति है। इसे वेइबुल वितरण और दोहरा घातांकीय वितरण के रूप में भी जाना जाता है (एक शब्द जिसे वैकल्पिक रूप से कभी-कभी लाप्लास वितरण को संदर्भित करने के लिए उपयोग किया जाता है)। यह गोम्पर्ट्ज़ वितरण से संबंधित है जब इसका घनत्व पहले मूल के बारे में परिलक्षित होता है और फिर धनात्मक आधी रेखा तक सीमित होता है तब एक गोम्पर्ट्ज़ फलन प्राप्त होता है।

बहुपद लॉगिट मॉडल के अव्यक्त वेरिएबल सूत्रीकरण में - असतत विकल्प सिद्धांत में समान्य - अव्यक्त वेरिएबल की त्रुटियां एक गमबेल वितरण का पालन करती हैं। यह उपयोगी है क्योंकि दो गम्बेल-वितरित यादृच्छिक वेरिएबल के अंतर में एक लॉजिस्टिक वितरण होता है।

गंबेल वितरण का नाम एमिल जूलियस गम्बेल (1891-1966) के नाम पर रखा गया है, जो वितरण का वर्णन करने वाले उनके मूल पत्रों पर आधारित है।[1][2]

परिभाषाएँ

गम्बेल वितरण का संचयी वितरण कार्य है


मानक गम्बल वितरण

मानक गम्बेल वितरण वह स्थिति है जहां संचयी वितरण फलन के साथ और होता है

और संभाव्यता घनत्व फलन

इस स्तिथियों में मोड 0 है, माध्य है, माध्य है (यूलर-माशेरोनी स्थिरांक), और मानक विचलन है।

n > 1 के लिए संचयी द्वारा दिया गया है


गुण

मोड μ है, जबकि माध्यिका है और माध्य इस प्रकार दिया गया है?

,

जहाँ यूलर-माशेरोनी स्थिरांक है।

मानक विचलन } है इसलिए [3]

मोड पर, जहां , , के मान पर ध्यान दिए बिना, का मान हो जाता है।

यदि पैरामीटर्स के साथ आईआईडी गम्बेल यादृच्छिक वेरिएबल है तो भी पैरामीटर के साथ एक गम्बेल यादृच्छिक वेरिएबल है।

यदि आईआईडी यादृच्छिक वेरिएबल हैं जैसे कि सभी प्राकृतिक संख्याओं के लिए का वितरण के समान है, तो आवश्यक रूप से स्केल पैरामीटर के साथ वितरित किया गया है (वास्तव में यह केवल दो पर विचार करने के लिए पर्याप्त है) k>1 के विशिष्ट मान जो सहअभाज्य हैं)।

संबंधित वितरण

  • यदि एक गम्बेल वितरण है, तो Y = −X का नियमित वितरण यह देखते हुए कि Y धनात्मक है, या समकक्ष रूप से दिया गया है कि X ऋणात्मक है, एक गोम्पर्टज़ वितरण है। सूत्र के अनुसार, Y का सीडीएफ G, X के सीडीएफ, F से संबंधित है y > 0 के लिए परिणाम स्वरुप घनत्व इससे संबंधित हैं : गोम्पर्ट्ज़ फलन प्रतिबिंबित गम्बेल घनत्व के समानुपाती होता है जो धनात्मक अर्ध-रेखा तक सीमित होता है।[4]
  • यदि X माध्य 1 के साथ एक घातीय रूप से वितरित वेरिएबल है, तो −log(X) में एक मानक गम्बेल वितरण है।
  • यदि और फिर स्वतंत्र हैं (लॉजिस्टिक वितरण देखें)।
  • यदि फिर स्वतंत्र हैं . ध्यान दें कि . अधिक समान्य रूप से स्वतंत्र गुम्बेल यादृच्छिक वेरिएबल के रैखिक संयोजनों का वितरण जीएनआईजी और जीआईजी वितरण द्वारा अनुमानित किया जा सकता है।[5]

सामान्यीकृत बहुभिन्नरूपी लॉग-गामा वितरण से संबंधित सिद्धांत गम्बेल वितरण का एक बहुभिन्नरूपी संस्करण प्रदान करता है।

घटना और अनुप्रयोग

गम्बेल ने दिखाया है[6] कि एक घातांकीय वितरण के बाद यादृच्छिक वेरिएबल के प्रतिरूप में अधिकतम मूल्य (या अंतिम क्रम आँकड़ा) प्रतिरूप आकार के प्राकृतिक लघुगणक को घटाकर[7] प्रतिरूप आकार बढ़ने पर गम्बेल वितरण के पास पहुँच जाता है।[8]\

सीधे रूप से मान लीजिए कि , का संभाव्यता वितरण है और इसका संचयी वितरण है। तब के प्राप्तियों में से अधिकतम मान से छोटा होता है यदि और केवल तभी यदि सभी प्राप्तियाँ से छोटी हों। तो अधिकतम मान का संचयी वितरण संतुष्ट करता है

और, बड़े के लिए, दाईं ओर पर परिवर्तित हो जाता है।

जल विज्ञान में, इसलिए गम्बेल वितरण का उपयोग दैनिक वर्षा और नदी निर्वहन मात्रा के मासिक और वार्षिक अधिकतम मूल्यों जैसे वेरिएबल का विश्लेषण करने और सूखे का वर्णन करने के लिए भी किया जाता है।[9][3]

गम्बेल ने यह भी दिखाया है कि किसी घटना की संभावना के लिए अनुमानक r(n+1) - जहां r डेटा श्रृंखला में देखे गए मान की रैंक संख्या है और n अवलोकनों की कुल संख्या है - एक निष्पक्ष अनुमानक है वितरण के मोड के आसपास संचयी संभावना है इसलिए इस अनुमानक का उपयोग अधिकांशत:प्लॉटिंग स्थिति के रूप में किया जाता है।

संख्या सिद्धांत में, गम्बेल वितरण एक पूर्णांक[10] के यादृच्छिक विभाजन में शब्दों की संख्या के साथ-साथ अधिकतम अभाज्य अंतराल और अभाज्य नक्षत्रों के बीच अधिकतम अंतराल के प्रवृत्ति-समायोजित आकार का अनुमान लगाता है।[11]

गम्बेल रिपैरामेट्रिज़ेशन ट्रिक

मशीन लर्निंग में, गम्बेल वितरण को कभी-कभी श्रेणीबद्ध वितरण से प्रतिरूप उत्पन्न करने के लिए नियोजित किया जाता है। इस तकनीक को "गंबेल-मैक्स ट्रिक" कहा जाता है और यह "रेपैरामेट्रिज़ेशन ट्रिक" का एक विशेष उदाहरण है।[12] विस्तार से, मान लीजिए कि गैर-नकारात्मक है, और सभी शून्य नहीं हैं, और मान लीजिए कि गम्बेल (0, 1) के स्वतंत्र प्रतिरूप हैं, फिर नियमित एकीकरण द्वारा,

वह है, समान रूप से, कोई भी दिया गया , हम इसके बोल्ट्ज़मैन वितरण से प्रतिरूप ले सकते हैं

संबंधित समीकरणों में सम्मिलित हैं:[13]

  • यदि , तब .
  • .
  • . अर्थात्, गम्बेल वितरण एक अधिकतम-स्थिर वितरण वर्ग है।


यादृच्छिक भिन्न पीढ़ी

चूंकि क्वांटाइल फलन (व्युत्क्रम संचयी वितरण फलन ), , एक गम्बेल वितरण द्वारा दिया गया है

जब यादृच्छिक वेरिएबल को अंतराल पर समान वितरण से खींचा जाता है, तब वेरिएबल में पैरामीटर और के साथ एक गमबेल वितरण होता है।

संभावना पत्र

ग्राफ़ पेपर का एक टुकड़ा जिसमें गम्बेल वितरण सम्मिलित है।

पूर्व-सॉफ़्टवेयर समय में गम्बेल वितरण को चित्रित करने के लिए संभाव्यता पेपर का उपयोग किया जाता था (चित्रण देखें)। पेपर संचयी वितरण फलन के रैखिककरण पर आधारित है।

कागज में क्षैतिज अक्ष का निर्माण दोहरे लॉग स्केल पर किया गया है। ऊर्ध्वाधर अक्ष रैखिक है. कागज के क्षैतिज अक्ष पर और ऊर्ध्वाधर अक्ष पर -चर को आलेखित करके, वितरण को 1 ढलान वाली एक सीधी रेखा द्वारा दर्शाया जाता है। जब कम फ़्रीक जैसा वितरण फिटिंग सॉफ्टवेयर उपलब्ध हो गया था तो वितरण की योजना बनाने का कार्य आसान हो गया है ।

यह भी देखें

  • टाइप-2 गम्बेल वितरण
  • चरम मूल्य सिद्धांत
  • सामान्यीकृत चरम मूल्य वितरण
  • फिशर-टिपेट-गेडेन्को प्रमेय
  • एमिल जूलियस गम्बेल

संदर्भ

  1. Gumbel, E.J. (1935), "Les valeurs extrêmes des distributions statistiques" (PDF), Annales de l'Institut Henri Poincaré, 5 (2): 115–158
  2. Gumbel E.J. (1941). "The return period of flood flows". The Annals of Mathematical Statistics, 12, 163–190.
  3. 3.0 3.1 Oosterbaan, R.J. (1994). "Chapter 6 Frequency and Regression Analysis" (PDF). In Ritzema, H.P. (ed.). Drainage Principles and Applications, Publication 16. Wageningen, The Netherlands: International Institute for Land Reclamation and Improvement (ILRI). pp. 175–224. ISBN 90-70754-33-9.
  4. Willemse, W.J.; Kaas, R. (2007). "गोम्पर्ट्ज़ के मृत्यु दर के नियम के सामान्यीकरण द्वारा कमज़ोरी-आधारित मृत्यु दर मॉडल का तर्कसंगत पुनर्निर्माण" (PDF). Insurance: Mathematics and Economics. 40 (3): 468. doi:10.1016/j.insmatheco.2006.07.003.
  5. Marques, F.; Coelho, C.; de Carvalho, M. (2015). "स्वतंत्र गुम्बेल यादृच्छिक चर के रैखिक संयोजनों के वितरण पर" (PDF). Statistics and Computing. 25 (3): 683‒701. doi:10.1007/s11222-014-9453-5. S2CID 255067312.
  6. CumFreq, software for probability distribution fitting
  7. user49229, Gumbel distribution and exponential distribution
  8. Gumbel, E.J. (1954). चरम मूल्यों का सांख्यिकीय सिद्धांत और कुछ व्यावहारिक अनुप्रयोग. Applied Mathematics Series. Vol. 33 (1st ed.). U.S. Department of Commerce, National Bureau of Standards. ASIN B0007DSHG4.
  9. Burke, Eleanor J.; Perry, Richard H.J.; Brown, Simon J. (2010). "यूके के सूखे का एक चरम मूल्य विश्लेषण और भविष्य में परिवर्तन के अनुमान". Journal of Hydrology. 388 (1–2): 131–143. Bibcode:2010JHyd..388..131B. doi:10.1016/j.jhydrol.2010.04.035.
  10. Erdös, Paul; Lehner, Joseph (1941). "एक धनात्मक पूर्णांक के विभाजनों में योगों की संख्या का वितरण". Duke Mathematical Journal. 8 (2): 335. doi:10.1215/S0012-7094-41-00826-8.
  11. Kourbatov, A. (2013). "Maximal gaps between prime k-tuples: a statistical approach". Journal of Integer Sequences. 16. arXiv:1301.2242. Bibcode:2013arXiv1301.2242K. Article 13.5.2.
  12. Jang, Eric; Gu, Shixiang; Poole, Ben (April 2017). गम्बेल-सॉफ्टमैक्स के साथ श्रेणीबद्ध पुनर्मूल्यांकन. International Conference on Learning Representations (ICLR) 2017.
  13. Balog, Matej; Tripuraneni, Nilesh; Ghahramani, Zoubin; Weller, Adrian (2017-07-17). "गम्बेल ट्रिक के खोए हुए रिश्तेदार". International Conference on Machine Learning (in English). PMLR: 371–379. arXiv:1706.04161.


बाहरी संबंध