हेवी-टेल्ड वितरण
संभाव्यता सिद्धांत में, हेवी-टेल्ड वितरण संभाव्यता वितरण होते हैं जिनकी टेल घातीय रूप से सीमित नहीं होती हैं:[1] अर्थात्, उनके पास घातीय वितरण की तुलना में भारी टेल हैं। कई अनुप्रयोगों में यह वितरण की दाहिनी टेल है जो रुचि की है, लेकिन एक वितरण में भारी बाईं टेल हो सकती है, या दोनों टेल भारी हो सकती हैं।
हेवी-टेल्ड वितरणों के तीन महत्वपूर्ण उपवर्ग हैं: फैट-टेल वितरण, हेवी-टेल्ड वितरण, और उपघातांकीय वितरण। व्यवहार में, सामान्यतः उपयोग किए जाने वाले सभी हेवी-टेल्ड वितरण जोसेफ ट्यूगल्स द्वारा प्रारम्भ किए गए सबएक्सपोनेंशियल वितरण से संबंधित हैं।[2]
हेवी-टेल्ड शब्द के प्रयोग पर अभी भी कुछ विसंगति है। दो अन्य परिभाषाएँ प्रयोग में हैं। कुछ लेखक इस शब्द का उपयोग उन वितरणों को संदर्भित करने के लिए करते हैं जिनकी सारी शक्ति क्षण (गणित) सीमित नहीं है; और कुछ अन्य उन वितरणों के लिए जिनमें कोई सीमित भिन्नता नहीं है। इस आलेख में दी गई परिभाषा उपयोग में सबसे सामान्य है, और इसमें वैकल्पिक परिभाषाओं में सम्मिलित सभी वितरण सम्मिलित हैं, साथ ही लॉग-सामान्य जैसे वितरण भी सम्मिलित हैं जिनमें उनके सभी शक्ति क्षण होते हैं, फिर भी जिन्हें सामान्यतः हेवी-टेल्ड माना जाता है . (कभी-कभी, हेवी-टेल्ड का उपयोग किसी भी वितरण के लिए किया जाता है जिसमें सामान्य वितरण की तुलना में भारी टेल होते हैं।)
परिभाषाएँ
हैवी-टेल्ड वितरण की परिभाषा
संचयी वितरण फलन F एक यादृच्छिक चर X के साथ X, MX(t),X(t), सभी t>0 के लिए अनंत है।[3]
इसका मतलब
इसे टेल डिस्ट्रीब्यूशन फलन के संदर्भ में भी लिखा गया है
जैसा
दीर्घ-टेल वितरण की परिभाषा
संचयी वितरण फलन F के साथ एक यादृच्छिक चर X के वितरण को एक लंबी दाहिनी टेल कहा जाता है[1]यदि सभी t > 0 के लिए,
या समकक्ष
इसमें दाएं-टेल वाली हेवी-टेल्ड वाली वितरित मात्रा के लिए सहज व्याख्या है कि यदि हेवी-टेल्ड वाली मात्रा कुछ उच्च स्तर से अधिक हो जाती है, तो संभावना 1 तक पहुंच जाती है कि यह किसी अन्य उच्च स्तर से अधिक हो जाएगी।
सभी हेवी-टेल्ड वाले वितरण हेवी-टेल्ड वाले होते हैं, लेकिन इसका विपरीत गलत है, और हेवी-टेल्ड वाले वितरणों का निर्माण करना संभव है जो हेवी-टेल्ड वाले नहीं हैं।
सबएक्सपोनेंशियल वितरण
सबएक्सपोनेंशियलिटी को संभाव्यता वितरण के कनवल्शन के संदर्भ में परिभाषित किया गया है। दो स्वतंत्र, समान रूप से वितरित यादृच्छिक चर के लिए एक सामान्य वितरण फलन के साथ , का कनवल्शन स्वयं के साथ, लिखा हुआ और कनवल्शन स्क्वायर कहा जाता है, इसे लेबेस्गु-स्टिल्टजेस एकीकरण का उपयोग करके परिभाषित किया गया है:
और n-फोल्ड कनवल्शन नियम द्वारा आगमनात्मक रूप से परिभाषित किया गया है:
टेल वितरण फलन परिभाषित किया जाता है .
एक वितरण घनात्मक अर्ध-रेखा पर उप-घातांकीय है[1][5][2] अगर
यह संकेत करता है[6] वह, किसी के लिए ,
संभाव्य व्याख्या[6]इसमें से वह है, कुल मिलाकर सांख्यिकीय स्वतंत्रता यादृच्छिक चर सामान्य वितरण के साथ ,
इसे प्रायः सिंगल बिग जम्प के सिद्धांत के रूप में जाना जाता है[7] या प्रलय सिद्धांत.[8] एक वितरण संपूर्ण वास्तविक रेखा पर यदि वितरण उपघातांकीय है है।[9] यहाँ घनात्मक अर्ध-रेखा का सूचक कार्य है। वैकल्पिक रूप से, एक यादृच्छिक चर वास्तविक रेखा पर समर्थित उपघातीय है यदि और केवल यदि उपघातीय है.
सभी उप-घातीय वितरण हेवी-टेल्ड वाले होते हैं, लेकिन ऐसे हेवी-टेल्ड वाले वितरणों के उदाहरण बनाए जा सकते हैं जो उप-घातांकीय नहीं होते हैं।
सामान्य हेवी-टेल्ड वाले वितरण
सामान्यतः उपयोग किए जाने वाले सभी हेवी-टेल्ड वितरण उप-घातांकीय होते हैं।[6]
जो एक-टेल वाले हैं उनमें सम्मिलित हैं:
- पेरेटो वितरण;
- लॉग-सामान्य वितरण;
- लेवी वितरण;
- 0 से अधिक लेकिन 1 से कम आकार पैरामीटर वाला वेइबुल वितरण;
- गड़गड़ाहट वितरण;
- लॉग-लॉजिस्टिक वितरण;
- लॉग-गामा वितरण;
- फ़्रेचेट वितरण;
- क्यू-गाऊसियन वितरण
- लॉग-कॉची वितरण, जिसे कभी-कभी ''सुपर-भारी टेल'' के रूप में वर्णित किया जाता है क्योंकि यह पैरेटो वितरण की तुलना में भारी टेल उत्पादन करने वाले लघुगणकीय विकास को प्रदर्शित करता है।[10][11]
जो दो-टेल वाले हैं उनमें सम्मिलित हैं:
- कॉची वितरण, स्वयं स्थिर वितरण और टी-वितरण दोनों का एक विशेष स्थिति है;
- स्थिर वितरण का समूह,[12] उस समूह के भीतर सामान्य वितरण के विशेष मामले को छोड़कर। कुछ स्थिर वितरण एकतरफ़ा होते हैं (या आधी-रेखा द्वारा समर्थित होते हैं), उदाहरण के लिए देखें। लेवी वितरण. हेवी-टेल्ड वाले वितरण और अस्थिरता क्लस्टरिंग वाले वित्तीय मॉडल भी देखें।
- छात्र का t-वितरण t-वितरण।
- स्क्यू लॉगनॉर्मल कैस्केड वितरण।[13]
फैट-टेल्ड वाले वितरण से संबंध
फैट-टेल्ड वितरण एक ऐसा वितरण है जिसके लिए संभाव्यता घनत्व फलन, बड़े x के लिए, एक शक्ति के रूप में शून्य हो जाता है . चूँकि ऐसी शक्ति हमेशा एक घातीय वितरण की संभाव्यता घनत्व फलन द्वारा नीचे बंधी होती है, फैट-टेल्ड वाले वितरण हमेशा हेवी-टेल्ड वाले होते हैं। हालाँकि, कुछ वितरणों में एक टेल होती है जो एक घातीय फलन की तुलना में धीमी गति से शून्य पर जाती है (जिसका अर्थ है कि वे हेवी-टेल्ड वाले हैं), लेकिन शक्ति से तेज़ हैं (जिसका अर्थ है कि वे फैट-टेल्ड वाले नहीं हैं)। एक उदाहरण लॉग-सामान्य वितरण हैl हालाँकि, कई अन्य हेवी-टेल्ड वितरण जैसे कि लॉग-लॉजिस्टिक डिस्ट्रीब्यूशन, लॉग-लॉजिस्टिक और पेरेटो डिस्ट्रीब्यूशन डिस्ट्रीब्यूशन भी फैट-टेल्ड हैं।
टेल-इंडेक्स का अनुमान लगाना
पैरामीट्रिक हैं[6]और गैर पैरामीट्रिक[14] टेल-इंडेक्स अनुमान की समस्या के लिए दृष्टिकोण।
पैरामीट्रिक दृष्टिकोण का उपयोग करके टेल-इंडेक्स का अनुमान लगाने के लिए, कुछ लेखक जीईवी वितरण या पेरेटो वितरण का उपयोग करते हैं; वे अधिकतम संभावना अनुमानक (एमएलई) लागू कर सकते हैं।
पिकैंड का टेल-इंडेक्स अनुमानक
साथ स्वतंत्र और समान घनत्व फलन का एक यादृच्छिक अनुक्रम , अधिकतम आकर्षण डोमेन[15] सामान्यीकृत चरम मूल्य घनत्व का , जहाँ . अगर और , तो पिकैंड्स टेल-इंडेक्स अनुमान है[6][15]:
जहाँ . यह अनुमानक संभाव्यता में परिवर्तित होता है .
हिल का टेल-इंडेक्स अनुमानक
मान लीजिये वितरण फलन के साथ स्वतंत्र और समान रूप से वितरित यादृच्छिक चर का एक अनुक्रम बनें , सामान्यीकृत चरम मूल्य वितरण के आकर्षण का अधिकतम क्षेत्र , जहाँ . नमूना पथ है जहाँ नमूना आकार है. अगर
एक मध्यवर्ती क्रम अनुक्रम है, अर्थात , और , तो हिल टेल-इंडेक्स अनुमानक है[16]
जहाँ है -वें क्रम का आँकड़ा . यह अनुमानक संभाव्यता में परिवर्तित होता है , और स्पर्शोन्मुख रूप से सामान्य प्रदान किया गया है उच्च क्रम की नियमित भिन्नता संपत्ति के आधार पर प्रतिबंधित है[17] .[18] संगति और स्पर्शोन्मुख सामान्यता आश्रित और विषम अनुक्रमों के एक बड़े वर्ग तक फैली हुई है,[19][20] चाहे कुछ भी हो देखा जाता है, या मॉडलों और अनुमानकों के एक बड़े वर्ग से अवशिष्ट या फ़िल्टर किए गए डेटा की गणना की जाती है, जिसमें गलत-निर्दिष्ट मॉडल और त्रुटियों वाले मॉडल सम्मिलित हैं जो निर्भर हैं।[21][22][23] ध्यान दें कि पिकैंड और हिल के टेल-इंडेक्स अनुमानक दोनों सामान्यतः ऑर्डर आंकड़ों के लघुगणक का उपयोग करते हैं।[24]
टेल-इंडेक्स का अनुपात अनुमानक
टेल-इंडेक्स का अनुपात अनुमानक (आरई-आकलनकर्ता) गोल्डी द्वारा पेश किया गया था और स्मिथ.[25] इसका निर्माण हिल के अनुमानक के समान ही किया गया है लेकिन यह एक गैर-यादृच्छिक ट्यूनिंग पैरामीटर का उपयोग करता है।
हिल-प्रकार और आरई-प्रकार के अनुमानकों की तुलना नोवाक में पाई जा सकती है।[14]
सॉफ़्टवेयर
- aest Archived 2020-11-25 at the Wayback Machine, हेवी-टेल इंडेक्स का अनुमान लगाने के लिए सी (प्रोग्रामिंग भाषा) उपकरण।[26]
हैवी-टेल्ड घनत्व का अनुमान
भारी और सुपरहैवी-टेल्ड संभाव्यता घनत्व कार्यों का अनुमान लगाने के लिए गैर-पैरामीट्रिक दृष्टिकोण दिए गए थे मार्कोविच।[27] ये परिवर्तनीय बैंडविड्थ और हेवी-टेल्ड वाले कर्नेल अनुमानकों पर आधारित दृष्टिकोण हैं; प्रारंभिक डेटा पर परिमित या अनंत अंतराल पर एक नए यादृच्छिक चर में परिवर्तन होता है, जो अनुमान के लिए अधिक सुविधाजनक होता है और फिर प्राप्त घनत्व अनुमान का उलटा परिवर्तन होता है; और टुकड़े-टुकड़े करने का दृष्टिकोण जो घनत्व की टेल के लिए एक निश्चित पैरामीट्रिक मॉडल और घनत्व के मोड का अनुमान लगाने के लिए एक गैर-पैरामीट्रिक मॉडल प्रदान करता है। गैर-पैरामीट्रिक अनुमानकों को कर्नेल अनुमानकों की बैंडविड्थ और हिस्टोग्राम की बिन चौड़ाई जैसे ट्यूनिंग (स्मूथिंग) मापदंडों के उचित चयन की आवश्यकता होती है। इस तरह के चयन की सुप्रसिद्ध डेटा-संचालित विधियां क्रॉस-सत्यापन और इसके संशोधन, माध्य वर्ग त्रुटि (एमएसई) और इसके स्पर्शोन्मुख और उनकी ऊपरी सीमा को कम करने पर आधारित विधियां हैं।[28] एक विसंगति विधि जो वितरण कार्यों (डीएफएस) के स्थान पर एक मीट्रिक के रूप में कोलमोगोरोव-स्मिरनोव, वॉन मिज़ और एंडरसन-डार्लिंग जैसे प्रसिद्ध गैरपैरामीट्रिक आंकड़ों का उपयोग करती है और बाद के आंकड़ों की मात्रा को ज्ञात अनिश्चितता या विसंगति मान के रूप में उपयोग करती है में पाया।[27]बूटस्ट्रैप पुन: नमूने चयन की विभिन्न योजनाओं द्वारा अज्ञात एमएसई के अनुमानों का उपयोग करके स्मूथिंग पैरामीटर खोजने के लिए एक और उपकरण है, उदाहरण के लिए देखें।[29]
यह भी देखें
- लेप्टोकर्टिक वितरण
- सामान्यीकृत चरम मूल्य वितरण
- सामान्यीकृत पेरेटो वितरण
- आउटलिएर
- लॉन्ग टेल
- बिजली नियम
- यादृच्छिकता की सात अवस्थाएँ
- फैट-टेल्ड वितरण
- तालेब वितरण और हौली ग्रेल वितरण
संदर्भ
- ↑ 1.0 1.1 1.2 Asmussen, S. R. (2003). "Steady-State Properties of GI/G/1". अनुप्रयुक्त संभाव्यता और कतारें. Stochastic Modelling and Applied Probability. Vol. 51. pp. 266–301. doi:10.1007/0-387-21525-5_10. ISBN 978-0-387-00211-8.
- ↑ 2.0 2.1 Teugels, Jozef L. (1975). "उपघातांकीय वितरण का वर्ग". Annals of Probability. University of Louvain. 3 (6). doi:10.1214/aop/1176996225. Retrieved April 7, 2019.
- ↑ Rolski, Schmidli, Scmidt, Teugels, Stochastic Processes for Insurance and Finance, 1999
- ↑ S. Foss, D. Korshunov, S. Zachary, An Introduction to Heavy-Tailed and Subexponential Distributions, Springer Science & Business Media, 21 May 2013
- ↑ Chistyakov, V. P. (1964). "स्वतंत्र सकारात्मक यादृच्छिक चर के योग पर एक प्रमेय और यादृच्छिक प्रक्रियाओं की शाखाओं में इसके अनुप्रयोग". ResearchGate (in English). Retrieved April 7, 2019.
- ↑ 6.0 6.1 6.2 6.3 6.4 Embrechts P.; Klueppelberg C.; Mikosch T. (1997). बीमा और वित्त के लिए चरम घटनाओं की मॉडलिंग करना. Stochastic Modelling and Applied Probability. Vol. 33. Berlin: Springer. doi:10.1007/978-3-642-33483-2. ISBN 978-3-642-08242-9.
- ↑ Foss, S.; Konstantopoulos, T.; Zachary, S. (2007). "असतत और निरंतर समय संशोधित भारी-पूंछ वृद्धि के साथ यादृच्छिक चलता है" (PDF). Journal of Theoretical Probability. 20 (3): 581. arXiv:math/0509605. CiteSeerX 10.1.1.210.1699. doi:10.1007/s10959-007-0081-2. S2CID 3047753.
- ↑ Wierman, Adam (January 9, 2014). "आपदाएँ, षडयंत्र, और उपघातांकीय वितरण (भाग III)". Rigor + Relevance blog. RSRG, Caltech. Retrieved January 9, 2014.
- ↑ Willekens, E. (1986). "वास्तविक रेखा पर उपघातांकीयता". Technical Report. K.U. Leuven.
- ↑ Falk, M., Hüsler, J. & Reiss, R. (2010). Laws of Small Numbers: Extremes and Rare Events. Springer. p. 80. ISBN 978-3-0348-0008-2.
{{cite book}}
: CS1 maint: multiple names: authors list (link) - ↑ Alves, M.I.F., de Haan, L. & Neves, C. (March 10, 2006). "भारी और अति-भारी पूंछ वाले वितरणों के लिए सांख्यिकीय अनुमान" (PDF). Archived from the original (PDF) on June 23, 2007. Retrieved November 1, 2011.
{{cite web}}
: CS1 maint: multiple names: authors list (link) - ↑ John P. Nolan (2009). "Stable Distributions: Models for Heavy Tailed Data" (PDF). Archived from the original (PDF) on 2011-07-17. Retrieved 2009-02-21.
- ↑ Stephen Lihn (2009). "तिरछा लॉगनॉर्मल कैस्केड वितरण". Archived from the original on 2014-04-07. Retrieved 2009-06-12.
- ↑ 14.0 14.1 Novak S.Y. (2011). Extreme value methods with applications to finance. London: CRC. ISBN 978-1-43983-574-6.
- ↑ 15.0 15.1 Pickands III, James (Jan 1975). "चरम क्रम सांख्यिकी का उपयोग करके सांख्यिकीय अनुमान". The Annals of Statistics. 3 (1): 119–131. doi:10.1214/aos/1176343003. JSTOR 2958083.
- ↑ Hill B.M. (1975) A simple general approach to inference about the tail of a distribution. Ann. Stat., v. 3, 1163–1174.
- ↑ Hall, P.(1982) On some estimates of an exponent of regular variation. J. R. Stat. Soc. Ser. B., v. 44, 37–42.
- ↑ Haeusler, E. and J. L. Teugels (1985) On asymptotic normality of Hill's estimator for the exponent of regular variation. Ann. Stat., v. 13, 743–756.
- ↑ Hsing, T. (1991) On tail index estimation using dependent data. Ann. Stat., v. 19, 1547–1569.
- ↑ Hill, J. (2010) On tail index estimation for dependent, heterogeneous data. Econometric Th., v. 26, 1398–1436.
- ↑ Resnick, S. and Starica, C. (1997). Asymptotic behavior of Hill’s estimator for autoregressive data. Comm. Statist. Stochastic Models 13, 703–721.
- ↑ Ling, S. and Peng, L. (2004). Hill’s estimator for the tail index of an ARMA model. J. Statist. Plann. Inference 123, 279–293.
- ↑ Hill, J. B. (2015). Tail index estimation for a filtered dependent time series. Stat. Sin. 25, 609–630.
- ↑ Lee, Seyoon; Kim, Joseph H. T. (2019). "Exponentiated generalized Pareto distribution: Properties and applications towards extreme value theory". Communications in Statistics - Theory and Methods. 48 (8): 2014–2038. arXiv:1708.01686. doi:10.1080/03610926.2018.1441418. S2CID 88514574.
- ↑ Goldie C.M., Smith R.L. (1987) Slow variation with remainder: theory and applications. Quart. J. Math. Oxford, v. 38, 45–71.
- ↑ Crovella, M. E.; Taqqu, M. S. (1999). "स्केलिंग गुणों से हेवी टेल इंडेक्स का अनुमान लगाना". Methodology and Computing in Applied Probability. 1: 55–79. doi:10.1023/A:1010012224103. S2CID 8917289.
- ↑ 27.0 27.1 Markovich N.M. (2007). Nonparametric Analysis of Univariate Heavy-Tailed data: Research and Practice. Chitester: Wiley. ISBN 978-0-470-72359-3.
- ↑ Wand M.P., Jones M.C. (1995). Kernel smoothing. New York: Chapman and Hall. ISBN 978-0412552700.
- ↑ Hall P. (1992). The Bootstrap and Edgeworth Expansion. Springer. ISBN 9780387945088.