अत्यधिक मूल्य सिद्धांत: Difference between revisions
No edit summary |
No edit summary |
||
Line 2: | Line 2: | ||
{{About|सांख्यिकीय सिद्धांत|कैलकुलस में परिणाम|अत्यधिक मूल्य प्रमेय}} | {{About|सांख्यिकीय सिद्धांत|कैलकुलस में परिणाम|अत्यधिक मूल्य प्रमेय}} | ||
[[File:1755 Lisbon earthquake.jpg|thumb|अत्यधिक मूल्य सिद्धांत का उपयोग 1755 के लिस्बन भूकंप जैसी अत्यधिक, दुर्लभ घटनाओं के संकट को मॉडल करने के लिए किया जाता है।]]'''अत्यधिक मूल्य सिद्धांत''' या अत्यधिक मूल्य विश्लेषण (ईवीए) सांख्यिकी की शाखा है जो संभाव्यता वितरण के मध्य से अत्यधिक [[विचलन (सांख्यिकी)]] से निवारण होता है। यह किसी | [[File:1755 Lisbon earthquake.jpg|thumb|अत्यधिक मूल्य सिद्धांत का उपयोग 1755 के लिस्बन भूकंप जैसी अत्यधिक, दुर्लभ घटनाओं के संकट को मॉडल करने के लिए किया जाता है।]]'''अत्यधिक मूल्य सिद्धांत''' या अत्यधिक मूल्य विश्लेषण (ईवीए) सांख्यिकी की शाखा है जो संभाव्यता वितरण के मध्य से अत्यधिक [[विचलन (सांख्यिकी)]] से निवारण होता है। यह किसी यादृच्छिक चर के दिए गए क्रमबद्ध प्रारूप (सांख्यिकी) से, उन घटनाओं की संभावना का आकलन करता है जो पहले देखी गई किसी भी घटना की तुलना में अधिक मूल्य हैं। अत्यधिक मूल्य विश्लेषण का व्यापक रूप से संरचनात्मक इंजीनियरिंग, वित्त, पृथ्वी विज्ञान, यातायात भविष्यवाणी और [[इंजीनियरिंग भूविज्ञान]] जैसे कई विषयों में उपयोग किया जाता है। उदाहरण के लिए, ईवीए का उपयोग [[जल विज्ञान]] के क्षेत्र में [[100 साल की बाढ़|100 वर्ष की बाढ़]] जैसे असामान्य रूप से बड़ी बाढ़ की घटना की संभावना का अनुमान लगाने के लिए किया जा सकता है। इसी प्रकार, [[ब्रेकवाटर (संरचना)]] के डिजाइन के लिए, [[तटीय इंजीनियर]] 50-वर्षीय लहर का अनुमान लगाएगा और उसके अनुसार संरचना को डिजाइन करेगा। | ||
==डेटा विश्लेषण== | ==डेटा विश्लेषण== | ||
Line 9: | Line 9: | ||
प्रथम विधि प्रारंभिक चरण के रूप में ब्लॉक मैक्सिमा (मिनीमा) श्रृंखला प्राप्त करने पर निर्भर करती है। कई स्थितियों में वार्षिक मैक्सिमा (मिनीमा) निकालना प्रथागत और सुविधाजनक है, जिससे "वार्षिक मैक्सिमा श्रृंखला" (एएमएस) उत्पन्न होती है। | प्रथम विधि प्रारंभिक चरण के रूप में ब्लॉक मैक्सिमा (मिनीमा) श्रृंखला प्राप्त करने पर निर्भर करती है। कई स्थितियों में वार्षिक मैक्सिमा (मिनीमा) निकालना प्रथागत और सुविधाजनक है, जिससे "वार्षिक मैक्सिमा श्रृंखला" (एएमएस) उत्पन्न होती है। | ||
दूसरी विधि, सतत रिकॉर्ड से, किसी भी अवधि के लिए पहुंचे अत्यधिक मूल्यों को निकालने पर निर्भर करती है, जिस समय मान निश्चित सीमा से अधिक हो जाते हैं ( निश्चित सीमा से नीचे आते हैं)। इस विधि को सामान्यतः पीक ओवर थ्रेशोल्ड | दूसरी विधि, सतत रिकॉर्ड से, किसी भी अवधि के लिए पहुंचे अत्यधिक मूल्यों को निकालने पर निर्भर करती है, जिस समय मान निश्चित सीमा से अधिक हो जाते हैं (निश्चित सीमा से नीचे आते हैं)। इस विधि को सामान्यतः पीक ओवर थ्रेशोल्ड (पीओटी) के रूप में जाना जाता है।<ref>{{cite journal | last1 = Leadbetter | first1 = M. R. | year = 1991 | title = 'पीक्स ओवर थ्रेशोल्ड' मॉडलिंग के आधार पर| journal = Statistics and Probability Letters | volume = 12 | issue = 4| pages = 357–362 | doi = 10.1016/0167-7152(91)90107-3 }}</ref> | ||
एएमएस डेटा के लिए, विश्लेषण आंशिक रूप से फिशर-टिपेट-गेडेन्को प्रमेय के परिणामों पर निर्भर हो सकता है, जिससे फिटिंग के लिए [[सामान्यीकृत चरम मूल्य वितरण|सामान्यीकृत अत्यधिक मूल्य वितरण]] का चयन किया जा सकता है।<ref>Fisher and Tippett (1928)</ref><ref>Gnedenko (1943)</ref> चूँकि, व्यवहार में, वितरण की व्यापक श्रेणी के मध्य चयन करने के लिए विभिन्न प्रक्रियाएँ प्रारम्भ की जाती हैं। यहां प्रमेय वितरण से [[सांख्यिकीय स्वतंत्रता|स्वतंत्र]] यादृच्छिक [[सांख्यिकीय स्वतंत्रता|सांख्यिकीय]] चर के अधिक बड़े संग्रह के न्यूनतम या अधिकतम के लिए सीमित वितरण से संबंधित है। यह देखते हुए कि वर्ष के भीतर प्रासंगिक यादृच्छिक घटनाओं की संख्या सीमित हो सकती है, यह आश्चर्यजनक नहीं है कि देखे गए एएमएस डेटा के विश्लेषण से प्रायः सामान्यीकृत अत्यधिक मूल्य वितरण (जीईवीडी) के अतिरिक्त अन्य वितरण का चयन किया जाता है।<ref>Embrechts, Klüppelberg, and Mikosch (1997)</ref> | एएमएस डेटा के लिए, विश्लेषण आंशिक रूप से फिशर-टिपेट-गेडेन्को प्रमेय के परिणामों पर निर्भर हो सकता है, जिससे फिटिंग के लिए [[सामान्यीकृत चरम मूल्य वितरण|सामान्यीकृत अत्यधिक मूल्य वितरण]] का चयन किया जा सकता है।<ref>Fisher and Tippett (1928)</ref><ref>Gnedenko (1943)</ref> चूँकि, व्यवहार में, वितरण की व्यापक श्रेणी के मध्य चयन करने के लिए विभिन्न प्रक्रियाएँ प्रारम्भ की जाती हैं। यहां प्रमेय वितरण से [[सांख्यिकीय स्वतंत्रता|स्वतंत्र]] यादृच्छिक [[सांख्यिकीय स्वतंत्रता|सांख्यिकीय]] चर के अधिक बड़े संग्रह के न्यूनतम या अधिकतम के लिए सीमित वितरण से संबंधित है। यह देखते हुए कि वर्ष के भीतर प्रासंगिक यादृच्छिक घटनाओं की संख्या सीमित हो सकती है, यह आश्चर्यजनक नहीं है कि देखे गए एएमएस डेटा के विश्लेषण से प्रायः सामान्यीकृत अत्यधिक मूल्य वितरण (जीईवीडी) के अतिरिक्त अन्य वितरण का चयन किया जाता है।<ref>Embrechts, Klüppelberg, and Mikosch (1997)</ref> | ||
Line 17: | Line 17: | ||
पहले के लिए साधारण धारणा पॉइसन वितरण है, जिसमें [[सामान्यीकृत पेरेटो वितरण]] का उपयोग अधिकता के लिए किया जाता है। टेल-फिटिंग पिकैंड्स-बाल्केमा-डी हान प्रमेय पर आधारित हो सकती है।<ref>Pickands (1975)</ref><ref>Balkema and de Haan (1974)</ref> | पहले के लिए साधारण धारणा पॉइसन वितरण है, जिसमें [[सामान्यीकृत पेरेटो वितरण]] का उपयोग अधिकता के लिए किया जाता है। टेल-फिटिंग पिकैंड्स-बाल्केमा-डी हान प्रमेय पर आधारित हो सकती है।<ref>Pickands (1975)</ref><ref>Balkema and de Haan (1974)</ref> | ||
नोवाक<ref>Novak (2011)</ref> उस स्तिथि "पीओटी विधि" शब्द को सुरक्षित रखता है जहां सीमा गैर-यादृच्छिक है, और इसे उस स्तिथि से भिन्न करता है जहां कोई यादृच्छिक सीमा से अधिक | नोवाक<ref>Novak (2011)</ref> उस स्तिथि में "पीओटी विधि" शब्द को सुरक्षित रखता है जहां सीमा गैर-यादृच्छिक है, और इसे उस स्तिथि से भिन्न करता है जहां कोई यादृच्छिक सीमा से अधिक निवारण करता है। | ||
==अनुप्रयोग== | ==अनुप्रयोग== | ||
Line 62: | Line 62: | ||
जहाँ <math>\zeta</math> वितरण की टेल के आकार पर निर्भर करता है। सामान्यीकृत होने पर, G निम्नलिखित गैर-अपक्षयी वितरण सदस्यता से संबंधित होता है: | जहाँ <math>\zeta</math> वितरण की टेल के आकार पर निर्भर करता है। सामान्यीकृत होने पर, G निम्नलिखित गैर-अपक्षयी वितरण सदस्यता से संबंधित होता है: | ||
[[वेइबुल वितरण]]: <math> G(z) = \begin{cases} \exp\left\{-\left( -\left( \frac{z-b}{a} \right) \right)^\alpha\right\} & z<b \\ 1 & z\geq b \end{cases} \text{ for }z\in\mathbb R</math> का वितरण <math>M_n</math> की परिमित ऊपरी सीमा वाली हल्की टेल है। इसे टाइप 3 के नाम से भी जाना जाता है। | [[वेइबुल वितरण|'''वेइबुल वितरण''']]: <math> G(z) = \begin{cases} \exp\left\{-\left( -\left( \frac{z-b}{a} \right) \right)^\alpha\right\} & z<b \\ 1 & z\geq b \end{cases} \text{ for }z\in\mathbb R</math> का वितरण <math>M_n</math> की परिमित ऊपरी सीमा वाली हल्की टेल है। इसे टाइप 3 के नाम से भी जाना जाता है। | ||
'''गम्बेल वितरण:''' <math> G(z) = \exp\left\{-\exp\left(-\left(\frac{z-b}{a}\right)\right)\right\}</math> का वितरण <math>M_n</math> घातीय टेल है, इसे टाइप 1 के नाम से भी जाना जाता है। | '''गम्बेल वितरण:''' <math> G(z) = \exp\left\{-\exp\left(-\left(\frac{z-b}{a}\right)\right)\right\}</math> का वितरण <math>M_n</math> घातीय टेल है, इसे टाइप 1 के नाम से भी जाना जाता है। | ||
Line 73: | Line 73: | ||
एक से अधिक चर में अत्यधिक मूल्य सिद्धांत अतिरिक्त विषय का परिचय देता है जिन्हें संबोधित किया जाना है। समस्या जो उत्पन्न होती है वह यह है कि किसी को यह निर्दिष्ट करना होगा कि अत्यधिक घटना क्या है।<ref name=":0">{{Cite journal|last1=Morton|first1=I.D.|last2=Bowers|first2=J.|date=December 1996|title=बहुभिन्नरूपी अपतटीय वातावरण में अत्यधिक मूल्य विश्लेषण|journal=Applied Ocean Research|volume=18|issue=6|pages=303–317|doi=10.1016/s0141-1187(97)00007-2|issn=0141-1187}}</ref> चूँकि यह विभिन्न स्तिथि में सरल है, बहुभिन्नरूपी स्तिथि में ऐसा करने की कोई स्पष्ट विधि नहीं है। मूलभूत समस्या यह है कि यद्यपि वास्तविक-मूल्यवान संख्याओं के सेट को ऑर्डर करना संभव है, किन्तु वैक्टर के सेट को ऑर्डर करने का कोई प्राकृतिक विधि नहीं है। | एक से अधिक चर में अत्यधिक मूल्य सिद्धांत अतिरिक्त विषय का परिचय देता है जिन्हें संबोधित किया जाना है। समस्या जो उत्पन्न होती है वह यह है कि किसी को यह निर्दिष्ट करना होगा कि अत्यधिक घटना क्या है।<ref name=":0">{{Cite journal|last1=Morton|first1=I.D.|last2=Bowers|first2=J.|date=December 1996|title=बहुभिन्नरूपी अपतटीय वातावरण में अत्यधिक मूल्य विश्लेषण|journal=Applied Ocean Research|volume=18|issue=6|pages=303–317|doi=10.1016/s0141-1187(97)00007-2|issn=0141-1187}}</ref> चूँकि यह विभिन्न स्तिथि में सरल है, बहुभिन्नरूपी स्तिथि में ऐसा करने की कोई स्पष्ट विधि नहीं है। मूलभूत समस्या यह है कि यद्यपि वास्तविक-मूल्यवान संख्याओं के सेट को ऑर्डर करना संभव है, किन्तु वैक्टर के सेट को ऑर्डर करने का कोई प्राकृतिक विधि नहीं है। | ||
उदाहरण के लिए, अविभाज्य अवस्था में, टिप्पणियों का सेट दिया गया है <math>x_i </math> केवल अधिकतम (या न्यूनतम) अवलोकनों को लेकर सबसे अत्यधिक घटना को ज्ञात करना सरल है। चूँकि, द्विचर अवस्था में, टिप्पणियों का सेट दिया गया है <math> (x_i, y_i) </math>, यह | उदाहरण के लिए, अविभाज्य अवस्था में, टिप्पणियों का सेट दिया गया है <math>x_i </math> केवल अधिकतम (या न्यूनतम) अवलोकनों को लेकर सबसे अत्यधिक घटना को ज्ञात करना सरल है। चूँकि, द्विचर अवस्था में, टिप्पणियों का सेट दिया गया है <math> (x_i, y_i) </math>, यह स्पष्ट नहीं है कि सबसे अत्यधिक घटना को कैसे ज्ञात किया जाए। मान लीजिए कि किसी ने मान माप लिया है <math>(3, 4)</math> विशिष्ट समय और मूल्यों पर <math>(5, 2)</math> पश्चात के समय में इनमें से कौन सी घटना अत्यधिक मानी जाएगी? इस प्रश्न का कोई सार्वभौमिक उत्तर नहीं है। | ||
बहुभिन्नरूपी अवस्था में विषय यह है कि सीमित मॉडल विभिन्न अवस्था पूर्ण रूप से निर्धारित नहीं है। यूनीवेरिएट अवस्था में, मॉडल (सामान्यीकृत अत्यधिक मूल्य वितरण) में तीन पैरामीटर होते हैं जिनके मूल्यों की भविष्यवाणी सिद्धांत द्वारा नहीं की जाती है और वितरण को डेटा में फिट करके प्राप्त किया जाना चाहिए। बहुभिन्नरूपी अवस्था में, मॉडल में न केवल अज्ञात पैरामीटर होते हैं, अन्यथा फलन भी होता है जिसका त्रुटिहीन रूप सिद्धांत द्वारा निर्धारित नहीं होता है। चूँकि, इस फलन को कुछ बाधाओं का पालन करना होगा।<ref>{{Cite book|title=Statistics of Extremes: Theory and Applications|last1=Beirlant|first1=Jan|last2=Goegebeur|first2=Yuri|last3=Teugels|first3=Jozef|last4=Segers|first4=Johan|date=2004-08-27|publisher=John Wiley & Sons, Ltd|isbn=9780470012383|series=Wiley Series in Probability and Statistics|location=Chichester, UK|doi=10.1002/0470012382}}</ref><ref>{{Cite book|last=Coles|first=Stuart|date=2001|title=चरम मूल्यों के सांख्यिकीय मॉडलिंग का परिचय|series=Springer Series in Statistics|doi=10.1007/978-1-4471-3675-0|issn=0172-7397|isbn=978-1-84996-874-4}}</ref> ऐसे अनुमानकर्ताओं को तैयार करना सरल नहीं है जो ऐसी बाधाओं का पालन करते हैं, चूँकि कुछ का निर्माण वर्तमान में ही किया गया है।<ref name="dC2014">{{Cite journal |last1=de Carvalho|first1=M.|last2=Davison|first2=A. C.| title = बहुभिन्नरूपी चरम सीमाओं के लिए वर्णक्रमीय घनत्व अनुपात मॉडल|journal=Journal of the American Statistical Association|year=2014|volume=109 |pages=764‒776| doi=10.1016/j.spl.2017.03.030|url = https://www.maths.ed.ac.uk/~mdecarv/papers/decarvalho2014a.pdf}}</ref><ref name="hanson2017">{{Cite journal |last1=Hanson|first1=T.|last2=de Carvalho|first2=M.| last3=Chen| first3=Yuhui| title = बर्नस्टीन बहुभिन्नरूपी चरम मूल्य वितरण के बहुपद कोणीय घनत्व|journal=Statistics and Probability Letters|year=2017|volume=128 |pages=60–66| doi=10.1016/j.spl.2017.03.030|url = https://www.maths.ed.ac.uk/~mdecarv/papers/hanson2017.pdf}}</ref><ref name="dC2013">{{Cite journal |last1=de Carvalho|first1=M.| title = द्विचर पूंछ निर्भरता के लिए एक यूक्लिडियन संभावना अनुमानक|journal=Communications in Statistics – Theory and Methods|year=2013|volume=42 |issue=7 |pages=1176–1192| doi= 10.1080/03610926.2012.709905|arxiv=1204.3524 |s2cid=42652601 |url = https://www.maths.ed.ac.uk/~mdecarv/papers/decarvalho2013.pdf}}</ref> | बहुभिन्नरूपी अवस्था में विषय यह है कि सीमित मॉडल विभिन्न अवस्था पूर्ण रूप से निर्धारित नहीं है। यूनीवेरिएट अवस्था में, मॉडल (सामान्यीकृत अत्यधिक मूल्य वितरण) में तीन पैरामीटर होते हैं जिनके मूल्यों की भविष्यवाणी सिद्धांत द्वारा नहीं की जाती है और वितरण को डेटा में फिट करके प्राप्त किया जाना चाहिए। बहुभिन्नरूपी अवस्था में, मॉडल में न केवल अज्ञात पैरामीटर होते हैं, अन्यथा फलन भी होता है जिसका त्रुटिहीन रूप सिद्धांत द्वारा निर्धारित नहीं होता है। चूँकि, इस फलन को कुछ बाधाओं का पालन करना होगा।<ref>{{Cite book|title=Statistics of Extremes: Theory and Applications|last1=Beirlant|first1=Jan|last2=Goegebeur|first2=Yuri|last3=Teugels|first3=Jozef|last4=Segers|first4=Johan|date=2004-08-27|publisher=John Wiley & Sons, Ltd|isbn=9780470012383|series=Wiley Series in Probability and Statistics|location=Chichester, UK|doi=10.1002/0470012382}}</ref><ref>{{Cite book|last=Coles|first=Stuart|date=2001|title=चरम मूल्यों के सांख्यिकीय मॉडलिंग का परिचय|series=Springer Series in Statistics|doi=10.1007/978-1-4471-3675-0|issn=0172-7397|isbn=978-1-84996-874-4}}</ref> ऐसे अनुमानकर्ताओं को तैयार करना सरल नहीं है जो ऐसी बाधाओं का पालन करते हैं, चूँकि कुछ का निर्माण वर्तमान में ही किया गया है।<ref name="dC2014">{{Cite journal |last1=de Carvalho|first1=M.|last2=Davison|first2=A. C.| title = बहुभिन्नरूपी चरम सीमाओं के लिए वर्णक्रमीय घनत्व अनुपात मॉडल|journal=Journal of the American Statistical Association|year=2014|volume=109 |pages=764‒776| doi=10.1016/j.spl.2017.03.030|url = https://www.maths.ed.ac.uk/~mdecarv/papers/decarvalho2014a.pdf}}</ref><ref name="hanson2017">{{Cite journal |last1=Hanson|first1=T.|last2=de Carvalho|first2=M.| last3=Chen| first3=Yuhui| title = बर्नस्टीन बहुभिन्नरूपी चरम मूल्य वितरण के बहुपद कोणीय घनत्व|journal=Statistics and Probability Letters|year=2017|volume=128 |pages=60–66| doi=10.1016/j.spl.2017.03.030|url = https://www.maths.ed.ac.uk/~mdecarv/papers/hanson2017.pdf}}</ref><ref name="dC2013">{{Cite journal |last1=de Carvalho|first1=M.| title = द्विचर पूंछ निर्भरता के लिए एक यूक्लिडियन संभावना अनुमानक|journal=Communications in Statistics – Theory and Methods|year=2013|volume=42 |issue=7 |pages=1176–1192| doi= 10.1080/03610926.2012.709905|arxiv=1204.3524 |s2cid=42652601 |url = https://www.maths.ed.ac.uk/~mdecarv/papers/decarvalho2013.pdf}}</ref> |
Revision as of 19:47, 6 July 2023
अत्यधिक मूल्य सिद्धांत या अत्यधिक मूल्य विश्लेषण (ईवीए) सांख्यिकी की शाखा है जो संभाव्यता वितरण के मध्य से अत्यधिक विचलन (सांख्यिकी) से निवारण होता है। यह किसी यादृच्छिक चर के दिए गए क्रमबद्ध प्रारूप (सांख्यिकी) से, उन घटनाओं की संभावना का आकलन करता है जो पहले देखी गई किसी भी घटना की तुलना में अधिक मूल्य हैं। अत्यधिक मूल्य विश्लेषण का व्यापक रूप से संरचनात्मक इंजीनियरिंग, वित्त, पृथ्वी विज्ञान, यातायात भविष्यवाणी और इंजीनियरिंग भूविज्ञान जैसे कई विषयों में उपयोग किया जाता है। उदाहरण के लिए, ईवीए का उपयोग जल विज्ञान के क्षेत्र में 100 वर्ष की बाढ़ जैसे असामान्य रूप से बड़ी बाढ़ की घटना की संभावना का अनुमान लगाने के लिए किया जा सकता है। इसी प्रकार, ब्रेकवाटर (संरचना) के डिजाइन के लिए, तटीय इंजीनियर 50-वर्षीय लहर का अनुमान लगाएगा और उसके अनुसार संरचना को डिजाइन करेगा।
डेटा विश्लेषण
व्यावहारिक अत्यधिक मूल्य विश्लेषण के लिए दो मुख्य दृष्टिकोण उपस्तिथ हैं।
प्रथम विधि प्रारंभिक चरण के रूप में ब्लॉक मैक्सिमा (मिनीमा) श्रृंखला प्राप्त करने पर निर्भर करती है। कई स्थितियों में वार्षिक मैक्सिमा (मिनीमा) निकालना प्रथागत और सुविधाजनक है, जिससे "वार्षिक मैक्सिमा श्रृंखला" (एएमएस) उत्पन्न होती है।
दूसरी विधि, सतत रिकॉर्ड से, किसी भी अवधि के लिए पहुंचे अत्यधिक मूल्यों को निकालने पर निर्भर करती है, जिस समय मान निश्चित सीमा से अधिक हो जाते हैं (निश्चित सीमा से नीचे आते हैं)। इस विधि को सामान्यतः पीक ओवर थ्रेशोल्ड (पीओटी) के रूप में जाना जाता है।[1]
एएमएस डेटा के लिए, विश्लेषण आंशिक रूप से फिशर-टिपेट-गेडेन्को प्रमेय के परिणामों पर निर्भर हो सकता है, जिससे फिटिंग के लिए सामान्यीकृत अत्यधिक मूल्य वितरण का चयन किया जा सकता है।[2][3] चूँकि, व्यवहार में, वितरण की व्यापक श्रेणी के मध्य चयन करने के लिए विभिन्न प्रक्रियाएँ प्रारम्भ की जाती हैं। यहां प्रमेय वितरण से स्वतंत्र यादृच्छिक सांख्यिकीय चर के अधिक बड़े संग्रह के न्यूनतम या अधिकतम के लिए सीमित वितरण से संबंधित है। यह देखते हुए कि वर्ष के भीतर प्रासंगिक यादृच्छिक घटनाओं की संख्या सीमित हो सकती है, यह आश्चर्यजनक नहीं है कि देखे गए एएमएस डेटा के विश्लेषण से प्रायः सामान्यीकृत अत्यधिक मूल्य वितरण (जीईवीडी) के अतिरिक्त अन्य वितरण का चयन किया जाता है।[4]
पीओटी डेटा के लिए, विश्लेषण में दो वितरणों को फिट करना सम्मिलित हो सकता है: एक समय अवधि में घटनाओं की संख्या के लिए और दूसरा अतिरिक्त के आकार के लिए है।
पहले के लिए साधारण धारणा पॉइसन वितरण है, जिसमें सामान्यीकृत पेरेटो वितरण का उपयोग अधिकता के लिए किया जाता है। टेल-फिटिंग पिकैंड्स-बाल्केमा-डी हान प्रमेय पर आधारित हो सकती है।[5][6]
नोवाक[7] उस स्तिथि में "पीओटी विधि" शब्द को सुरक्षित रखता है जहां सीमा गैर-यादृच्छिक है, और इसे उस स्तिथि से भिन्न करता है जहां कोई यादृच्छिक सीमा से अधिक निवारण करता है।
अनुप्रयोग
अत्यधिक मूल्य सिद्धांत के अनुप्रयोगों में संभाव्यता वितरण की भविष्यवाणी करना सम्मिलित है:
- अत्यधिक बाढ़; विचित्र तरंगों का आकार
- बवंडर का प्रकोप[8]
- पारिस्थितिक जनसंख्या का अधिकतम आकार[9]
- दवाओं के दुष्प्रभाव (उदाहरण के लिए, ज़िमेलैगट्रान)
- बड़े बीमा हानि की भयावहता
- इक्विटी संकट; दिन-प्रतिदिन बाज़ार का संकट
- विकास के समय उत्परिवर्तनीय घटनाएँ
- बड़े जंगल की आग[10]
- संरचनाओं पर पर्यावरणीय भार[11]
- मनुष्य सबसे तीव्र गति से 100 मीटर दौड़ने में सक्षम है[12] और अन्य एथलेटिक विषयों में प्रदर्शन[13][14][15]
- गड्ढों में जंग लगने के कारण पाइपलाइन में व्यर्थता
- अनियमित आईटी नेटवर्क ट्रैफ़िक, विरुधियों को महत्वपूर्ण डेटा तक जाने का अवरोध करता है।
- सड़क सुरक्षा विश्लेषण[16][17]
- वायरलेस संचार[18]
- महामारी[19]
- न्यूरोबायोलॉजी[20]
इतिहास
अत्यधिक मूल्य सिद्धांत के क्षेत्र का प्रारंभ लियोनार्ड टिपेट (1902-1985) ने की थी। टिपेट को ब्रिटिश कॉटन इंडस्ट्री रिसर्च एसोसिएशन द्वारा नियुक्त किया गया था, जहां उन्होंने सूती धागे को स्थिर बनाने के लिए कार्य किया था। अपने अध्ययन में, उन्होंने अनुभव किया कि धागे की ताकत उसके सबसे स्थिर तंतुओं की ताकत से नियंत्रित होती है। आर. ए. फिशर की सहायता से, टिपेट ने स्वतंत्र चर मानने वाले अत्यधिक के वितरण का वर्णन करते हुए तीन स्पर्शोन्मुख सीमाएँ प्राप्त कीं। एमिल जूलियस गम्बेल ने इस सिद्धांत को अपनी 1958 की पुस्तक स्टैटिस्टिक्स ऑफ एक्सट्रीम में संहिताबद्ध किया, जिसमें गंबेल वितरण भी सम्मिलित है जो उनके नाम पर है। चरों के मध्य साधारण सहसंबंधों की अनुमति देने के लिए इन परिणामों को बढ़ाया जा सकता है, किन्तु शास्त्रीय सिद्धांत विचरण के क्रम के स्थिर सहसंबंधों तक विस्तारित नहीं होता है। विशेष रुचि का सार्वभौमिकता वर्ग लॉग-सहसंबद्ध क्षेत्रों का है, जहां सहसंबंध दूरी के साथ लघुगणकीय रूप से घटते हैं।
विभिन्न सिद्धांत
मान लीजिये संचयी वितरण फलन F के साथ स्वतंत्र और समान रूप से वितरित यादृच्छिक चर का अनुक्रम है, अधिकतम को दर्शाता है।
सिद्धांत रूप में, अधिकतम का त्रुटिहीन वितरण प्राप्त किया जा सकता है:
संबंधित सूचक फलन सफलता की संभावना वाली बर्नौली प्रक्रिया है यह परिमाण पर निर्भर करता है कि अत्यधिक घटना का भीतर अत्यधिक घटनाओं की संख्या परीक्षण इस प्रकार द्विपद वितरण का अनुसरण करते हैं और जब तक कोई घटना घटित नहीं होती तब तक परीक्षणों की संख्या अपेक्षित मूल्य और उसी क्रम के मानक विचलन के साथ ज्यामितीय वितरण का अनुसरण करती है। .
व्यवहार में, हमारे पास वितरण फलन नहीं हो सकता है किन्तु फिशर-टिपेट-गेडेन्को प्रमेय स्पर्शोन्मुख परिणाम प्रदान करता है। यदि स्थिरांकों का क्रम उपस्तिथ है और ऐसा है कि
जैसा तब
जहाँ वितरण की टेल के आकार पर निर्भर करता है। सामान्यीकृत होने पर, G निम्नलिखित गैर-अपक्षयी वितरण सदस्यता से संबंधित होता है:
वेइबुल वितरण: का वितरण की परिमित ऊपरी सीमा वाली हल्की टेल है। इसे टाइप 3 के नाम से भी जाना जाता है।
गम्बेल वितरण: का वितरण घातीय टेल है, इसे टाइप 1 के नाम से भी जाना जाता है।
फ़्रेचेट वितरण: का वितरण इसमें भारी-टेल वाला वितरण (बहुपद क्षय सहित) है। इसे टाइप 2 के नाम से भी जाना जाता है।
वेइबुल और फ़्रेचेट वितरण के लिए, है।
बहुभिन्नरूपी सिद्धांत
एक से अधिक चर में अत्यधिक मूल्य सिद्धांत अतिरिक्त विषय का परिचय देता है जिन्हें संबोधित किया जाना है। समस्या जो उत्पन्न होती है वह यह है कि किसी को यह निर्दिष्ट करना होगा कि अत्यधिक घटना क्या है।[21] चूँकि यह विभिन्न स्तिथि में सरल है, बहुभिन्नरूपी स्तिथि में ऐसा करने की कोई स्पष्ट विधि नहीं है। मूलभूत समस्या यह है कि यद्यपि वास्तविक-मूल्यवान संख्याओं के सेट को ऑर्डर करना संभव है, किन्तु वैक्टर के सेट को ऑर्डर करने का कोई प्राकृतिक विधि नहीं है।
उदाहरण के लिए, अविभाज्य अवस्था में, टिप्पणियों का सेट दिया गया है केवल अधिकतम (या न्यूनतम) अवलोकनों को लेकर सबसे अत्यधिक घटना को ज्ञात करना सरल है। चूँकि, द्विचर अवस्था में, टिप्पणियों का सेट दिया गया है , यह स्पष्ट नहीं है कि सबसे अत्यधिक घटना को कैसे ज्ञात किया जाए। मान लीजिए कि किसी ने मान माप लिया है विशिष्ट समय और मूल्यों पर पश्चात के समय में इनमें से कौन सी घटना अत्यधिक मानी जाएगी? इस प्रश्न का कोई सार्वभौमिक उत्तर नहीं है।
बहुभिन्नरूपी अवस्था में विषय यह है कि सीमित मॉडल विभिन्न अवस्था पूर्ण रूप से निर्धारित नहीं है। यूनीवेरिएट अवस्था में, मॉडल (सामान्यीकृत अत्यधिक मूल्य वितरण) में तीन पैरामीटर होते हैं जिनके मूल्यों की भविष्यवाणी सिद्धांत द्वारा नहीं की जाती है और वितरण को डेटा में फिट करके प्राप्त किया जाना चाहिए। बहुभिन्नरूपी अवस्था में, मॉडल में न केवल अज्ञात पैरामीटर होते हैं, अन्यथा फलन भी होता है जिसका त्रुटिहीन रूप सिद्धांत द्वारा निर्धारित नहीं होता है। चूँकि, इस फलन को कुछ बाधाओं का पालन करना होगा।[22][23] ऐसे अनुमानकर्ताओं को तैयार करना सरल नहीं है जो ऐसी बाधाओं का पालन करते हैं, चूँकि कुछ का निर्माण वर्तमान में ही किया गया है।[24][25][26]
अनुप्रयोग के उदाहरण के रूप में, द्विचर अत्यधिक मूल्य सिद्धांत को समुद्री अनुसंधान में प्रारम्भ किया गया है।[21][27]
अस्थिर अत्यधिक
अस्थिर समय श्रृंखला के लिए सांख्यिकीय मॉडलिंग 1990 के दशक में विकसित की गई थी।[28] अस्थिर बहुभिन्नरूपी अत्यधिक सीमाओं के लिए विधि वर्तमान में ही प्रस्तुत की गई हैं।[29] उत्तरार्द्ध का उपयोग यह ट्रैक करने के लिए किया जा सकता है कि समय के साथ या किसी अन्य सहसंयोजक पर अत्यधिक मूल्यों के मध्य निर्भरता कैसे परिवर्तित होती है।[30][31][32]
यह भी देखें
- अत्यधिक संकट
- अत्यधिक मौसम
- फिशर-टिपेट-गेडेन्को प्रमेय
- सामान्यीकृत अत्यधिक मूल्य वितरण
- बड़ा विचलन सिद्धांत
- बाह्य
- पेरेटो वितरण
- पिकैंड्स-बाल्केमा-डी हान प्रमेय
- दुर्लभ घटनाएँ
- वेइबुल वितरण
- अतिरेक सिद्धांत (जीवविज्ञान)
टिप्पणियाँ
- ↑ Leadbetter, M. R. (1991). "'पीक्स ओवर थ्रेशोल्ड' मॉडलिंग के आधार पर". Statistics and Probability Letters. 12 (4): 357–362. doi:10.1016/0167-7152(91)90107-3.
- ↑ Fisher and Tippett (1928)
- ↑ Gnedenko (1943)
- ↑ Embrechts, Klüppelberg, and Mikosch (1997)
- ↑ Pickands (1975)
- ↑ Balkema and de Haan (1974)
- ↑ Novak (2011)
- ↑ Tippett, Michael K.; Lepore, Chiara; Cohen, Joel E. (16 December 2016). "सबसे भीषण अमेरिकी बवंडर के प्रकोप में अधिक बवंडर". Science. 354 (6318): 1419–1423. Bibcode:2016Sci...354.1419T. doi:10.1126/science.aah7393. PMID 27934705.
- ↑ Batt, Ryan D.; Carpenter, Stephen R.; Ives, Anthony R. (March 2017). "झील पारिस्थितिकी तंत्र समय श्रृंखला में चरम घटनाएँ". Limnology and Oceanography Letters. 2 (3): 63. doi:10.1002/lol2.10037.
- ↑ Alvardo (1998, p.68.)
- ↑ Makkonen (2008)
- ↑ J.H.J. Einmahl; S.G.W.R. Smeets (2009), "Ultimate 100m World Records Through Extreme-Value Theory" (PDF), CentER Discussion Paper, Tilburg University, 57, archived from the original (PDF) on 2016-03-12, retrieved 2009-08-12
- ↑ D. Gembris; J.Taylor; D. Suter (2002), "Trends and random fluctuations in athletics", Nature, 417 (6888): 506, Bibcode:2002Natur.417..506G, doi:10.1038/417506a, hdl:2003/25362, PMID 12037557, S2CID 13469470
- ↑ D. Gembris; J.Taylor; D. Suter (2007), "Evolution of athletic records : Statistical effects versus real improvements", Journal of Applied Statistics, 34 (5): 529–545, Bibcode:2007JApSt..34..529G, doi:10.1080/02664760701234850, hdl:2003/25404, S2CID 55378036
- ↑ H. Spearing, J. Tawn, D. Irons, T. Paulden & G. Bennett (2021), "Ranking, and other properties, of elite swimmers using extreme value theory", Journal of the Royal Statistical Society: Series A (Statistics in Society), 184 (1): 368–395, doi:10.1111/rssa.12628, S2CID 204823947
{{citation}}
: CS1 maint: uses authors parameter (link) - ↑ Songchitruksa, P.; Tarko, A. P. (2006). "सुरक्षा आकलन के लिए चरम मूल्य सिद्धांत दृष्टिकोण". Accident Analysis and Prevention. 38 (4): 811–822. doi:10.1016/j.aap.2006.02.003. PMID 16546103.
- ↑ Orsini, F.; Gecchele, G.; Gastaldi, M.; Rossi, R. (2019). "Collision prediction in roundabouts: a comparative study of extreme value theory approaches". Transportmetrica A: Transport Science. 15 (2): 556–572. doi:10.1080/23249935.2018.1515271. S2CID 158343873.
- ↑ C. G. Tsinos, F. Foukalas, T. Khattab and L. Lai, "On Channel Selection for Carrier Aggregation Systems." IEEE Transactions on Communications, vol. 66, no. 2, Feb. 2018 ) 808-818.
- ↑ Wong, Felix; Collins, James J. (2020-11-02). "सबूत है कि कोरोनोवायरस सुपरस्प्रेडिंग फैट-टेल्ड है". Proceedings of the National Academy of Sciences (in English). 117 (47): 29416–29418. Bibcode:2020PNAS..11729416W. doi:10.1073/pnas.2018490117. ISSN 0027-8424. PMC 7703634. PMID 33139561.
- ↑ Basnayake, Kanishka; Mazaud, David; Bemelmans, Alexis; Rouach, Nathalie; Korkotian, Eduard; Holcman, David (2019-06-04). "चरम आँकड़ों द्वारा संचालित डेंड्राइटिक स्पाइन में तेजी से कैल्शियम का परिवर्तन". PLOS Biology. 17 (6): e2006202. doi:10.1371/journal.pbio.2006202. ISSN 1545-7885. PMC 6548358. PMID 31163024.
- ↑ 21.0 21.1 Morton, I.D.; Bowers, J. (December 1996). "बहुभिन्नरूपी अपतटीय वातावरण में अत्यधिक मूल्य विश्लेषण". Applied Ocean Research. 18 (6): 303–317. doi:10.1016/s0141-1187(97)00007-2. ISSN 0141-1187.
- ↑ Beirlant, Jan; Goegebeur, Yuri; Teugels, Jozef; Segers, Johan (2004-08-27). Statistics of Extremes: Theory and Applications. Wiley Series in Probability and Statistics. Chichester, UK: John Wiley & Sons, Ltd. doi:10.1002/0470012382. ISBN 9780470012383.
- ↑ Coles, Stuart (2001). चरम मूल्यों के सांख्यिकीय मॉडलिंग का परिचय. Springer Series in Statistics. doi:10.1007/978-1-4471-3675-0. ISBN 978-1-84996-874-4. ISSN 0172-7397.
- ↑ de Carvalho, M.; Davison, A. C. (2014). "बहुभिन्नरूपी चरम सीमाओं के लिए वर्णक्रमीय घनत्व अनुपात मॉडल" (PDF). Journal of the American Statistical Association. 109: 764‒776. doi:10.1016/j.spl.2017.03.030.
- ↑ Hanson, T.; de Carvalho, M.; Chen, Yuhui (2017). "बर्नस्टीन बहुभिन्नरूपी चरम मूल्य वितरण के बहुपद कोणीय घनत्व" (PDF). Statistics and Probability Letters. 128: 60–66. doi:10.1016/j.spl.2017.03.030.
- ↑ de Carvalho, M. (2013). "द्विचर पूंछ निर्भरता के लिए एक यूक्लिडियन संभावना अनुमानक" (PDF). Communications in Statistics – Theory and Methods. 42 (7): 1176–1192. arXiv:1204.3524. doi:10.1080/03610926.2012.709905. S2CID 42652601.
- ↑ Zachary, S.; Feld, G.; Ward, G.; Wolfram, J. (October 1998). "अपतटीय वातावरण में बहुभिन्नरूपी एक्सट्रपलेशन". Applied Ocean Research. 20 (5): 273–295. doi:10.1016/s0141-1187(98)00027-3. ISSN 0141-1187.
- ↑ Davison, A.C.; Smith, Richard (1990). "उच्च सीमा से अधिक के लिए मॉडल". Journal of the Royal Statistical Society: Series B (Methodological). 52 (3): 393–425. doi:10.1111/j.2517-6161.1990.tb01796.x.
- ↑ de Carvalho, M. (2016). Statistics of extremes: Challenges and opportunities. In: Handbook of EVT and its Applications to Finance and Insurance (PDF). Hoboken: Wiley. p. 195--214. ISBN 978-1-118-65019-6.
- ↑ Castro, D.; de Carvalho, M.; Wadsworth, J. (2018). "अग्रणी यूरोपीय शेयर बाजारों में अनुप्रयोग के साथ समय-परिवर्तनशील चरम मूल्य निर्भरता" (PDF). Annals of Applied Statistics. 12: 283–309. doi:10.1214/17-AOAS1089. S2CID 33350408.
- ↑ Mhalla, L.; de Carvalho, M.; Chavez-Demoulin, V. (2019). "अत्यधिक निर्भरता के लिए प्रतिगमन प्रकार के मॉडल" (PDF). Scandinavian Journal of Statistics. 46 (4): 1141–1167. doi:10.1111/sjos.12388. S2CID 53570822.
- ↑ Mhalla, L.; de Carvalho, M.; Chavez-Demoulin, V. (2018). "पिकैंड्स निर्भरता फ़ंक्शन का स्थानीय मजबूत अनुमान". Annals of Statistics. 46 (6A): 2806–2843. doi:10.1214/17-AOS1640. S2CID 59467614.
संदर्भ
- Abarbanel, H.; Koonin, S.; Levine, H.; MacDonald, G.; Rothaus, O. (January 1992), "Statistics of Extreme Events with Application to Climate" (PDF), JASON, JSR-90-30S, retrieved 2015-03-03
- Alvarado, Ernesto; Sandberg, David V.; Pickford, Stewart G. (1998), "Modeling Large Forest Fires as Extreme Events" (PDF), Northwest Science, 72: 66–75, archived from the original (PDF) on 2009-02-26, retrieved 2009-02-06
- Balkema, A.; Laurens (1974), "Residual life time at great age", Annals of Probability, 2 (5): 792–804, doi:10.1214/aop/1176996548, JSTOR 2959306
- Burry K.V. (1975). Statistical Methods in Applied Science. John Wiley & Sons.
- Castillo E. (1988) Extreme value theory in engineering. Academic Press, Inc. New York. ISBN 0-12-163475-2.
- Castillo, E., Hadi, A. S., Balakrishnan, N. and Sarabia, J. M. (2005) Extreme Value and Related Models with Applications in Engineering and Science, Wiley Series in Probability and Statistics Wiley, Hoboken, New Jersey. ISBN 0-471-67172-X.
- Coles S. (2001) An Introduction to Statistical Modeling of Extreme Values. Springer, London.
- Embrechts P., Klüppelberg C. and Mikosch T. (1997) Modelling extremal events for insurance and finance. Berlin: Spring Verlag
- Fisher, R.A.; Tippett, L.H.C. (1928), "Limiting forms of the frequency distribution of the largest and smallest member of a sample", Proc. Camb. Phil. Soc., 24 (2): 180–190, Bibcode:1928PCPS...24..180F, doi:10.1017/s0305004100015681, S2CID 123125823
- Gnedenko, B.V. (1943), "Sur la distribution limite du terme maximum d'une serie aleatoire", Annals of Mathematics, 44 (3): 423–453, doi:10.2307/1968974, JSTOR 1968974
- Gumbel, E.J. (1935), "Les valeurs extrêmes des distributions statistiques" (PDF), Annales de l'Institut Henri Poincaré, 5 (2): 115–158, retrieved 2009-04-01
- Gumbel, E. J. (2004) [1958], Statistics of Extremes, Mineola, NY: Dover, ISBN 978-0-486-43604-3
- Makkonen, L. (2008), "Problems in the extreme value analysis", Structural Safety, 30 (5): 405–419, doi:10.1016/j.strusafe.2006.12.001
- Leadbetter, M. R. (1991), "On a basis for 'Peaks over Threshold' modeling", Statistics & Probability Letters, 12 (4): 357–362, doi:10.1016/0167-7152(91)90107-3
- Leadbetter M.R., Lindgren G. and Rootzen H. (1982) Extremes and related properties of random sequences and processes. Springer-Verlag, New York.
- Lindgren, G.; Rootzen, H. (1987), "Extreme values: Theory and technical applications", Scandinavian Journal of Statistics, Theory and Applications, 14: 241–279
- Novak S.Y. (2011) Extreme Value Methods with Applications to Finance. Chapman & Hall/CRC Press, London. ISBN 978-1-4398-3574-6
- Pickands, J (1975), "Statistical inference using extreme order statistics", Annals of Statistics, 3: 119–131, doi:10.1214/aos/1176343003
सॉफ़्टवेयर
- आर में अत्यधिक मूल्य सांख्यिकी - आर में अत्यधिक मूल्य सांख्यिकी के लिए पैकेज (प्रोग्रामिंग भाषा)
- ्सट्रीमस्टैट्स.jl और ्सट्रीम.jl - जूलिया में ्सट्रीम वैल्यू स्टैटिस्टिक्स (प्रोग्रामिंग भाषा)
बाहरी संबंध
- Extreme Value Theory can save your neck Easy non-mathematical introduction (pdf)
- Source Code for Stationary and Nonstationary Extreme Value Analysis University of California, Irvine
- Steps in Applying Extreme Value Theory to Finance: A Review
- Les valeurs extrêmes des distributions statistiques Full-text access to conferences held by E. J. Gumbel in 1933–34, in French (pdf)