बृहत् विचलन सिद्धांत: Difference between revisions

From Vigyanwiki
No edit summary
Line 1: Line 1:
{{Short description|Branch of probability theory}}
{{Short description|Branch of probability theory}}
{{Use dmy dates|date=August 2020}}
संभाव्यता सिद्धांत में, बड़े विचलन का सिद्धांत संभाव्यता वितरण के अनुक्रमों की दूरस्थ पूंछों के असममित व्यवहार से संबंधित है। कुछ सिद्धांत की मौलिक विचार व्यापकता की दिशा में जो [[पियरे-साइमन लाप्लास|लाप्लास]] के पूर्वक हैं, उनकी स्थापना बीमा गणित के साथ हुई, विशेषकर क्रैमर और [[फिलिप लुंडबर्ग|लुंडबर्ग]] के साथ [[बर्बाद सिद्धांत|संराशि सिद्धांत]] के साथ। एक समृद्धिकृत बड़े विचलन सिद्धांत का समर्पित स्वरूपीकरण 1966 में वाराधन के एक पेपर में विकसित हुआ था।<ref>S.R.S. Varadhan, ''Asymptotic probability and differential equations'', [[Communications on Pure and Applied Mathematics|Comm. Pure Appl. Math.]] 19 (1966),261-286.</ref> बड़े विचलन सिद्धांत ने मापों की समर्थन की आवधारणाओं को स्वरूपीकृत किया और संभावना मापों के संघटन की धारणा को व्यापकता से महसूस कराया।
संभाव्यता सिद्धांत में, बड़े विचलन का सिद्धांत संभाव्यता वितरण के अनुक्रमों की दूरस्थ पूंछों के स्पर्शोन्मुख व्यवहार से संबंधित है। जबकि सिद्धांत के कुछ बुनियादी विचारों का पता [[पियरे-साइमन लाप्लास]] से लगाया जा सकता है, औपचारिकता बीमा गणित के साथ शुरू हुई, अर्थात् हेराल्ड क्रैमर | क्रैमर और [[फिलिप लुंडबर्ग]] के साथ [[बर्बाद सिद्धांत]]बड़े विचलन सिद्धांत का एक एकीकृत औपचारिकीकरण 1966 में एस. आर. श्रीनिवास वर्धन के एक पेपर में विकसित किया गया था।<ref>S.R.S. Varadhan, ''Asymptotic probability and differential equations'', [[Communications on Pure and Applied Mathematics|Comm. Pure Appl. Math.]] 19 (1966),261-286.</ref> बड़े विचलन सिद्धांत उपायों की एकाग्रता के अनुमानी विचारों को औपचारिक बनाता है और उपायों के अभिसरण #यादृच्छिक चर के कमजोर अभिसरण की धारणा को व्यापक रूप से सामान्यीकृत करता है।


मोटे तौर पर कहें तो, बड़े विचलन का सिद्धांत कुछ प्रकार की चरम या पूंछ वाली घटनाओं की संभाव्यता उपायों की तेजी से गिरावट से संबंधित है।
मोटे तौर पर कहें तो, बड़े विचलन का सिद्धांत कुछ प्रकार की चरम या पूंछ वाली घटनाओं की संभाव्यता उपायों की तेजी से गिरावट से संबंधित है।
Line 8: Line 7:


=== एक प्रारंभिक उदाहरण ===
=== एक प्रारंभिक उदाहरण ===
एक निष्पक्ष सिक्के को स्वतंत्र रूप से उछालने के क्रम पर विचार करें। संभावित परिणाम चित या पट हो सकते हैं। आइए हम i-वें परीक्षण के संभावित परिणाम को निरूपित करें {{nowrap|<math>X_i</math>,}} जहां हम हेड को 1 और टेल को 0 के रूप में एन्कोड करते हैं। अब चलिए <math>M_N</math> बाद में माध्य मान निरूपित करें <math>N</math> परीक्षण, अर्थात्
एक निष्पक्ष सिक्के को स्वतंत्र रूप से उछालने के क्रम पर विचार करें। संभावित परिणाम हेड या टेल हो सकते हैं। आइए i-वें परीक्षण के संभावित परिणाम को {{nowrap|<math>X_i</math>,}} से निरूपित करें, जहां हम हेड को 1 और टेल को 0 के रूप में एन्कोड करते हैं। अब <math>N</math> परीक्षणों के बाद <math>M_N</math> को औसत मान दर्शाते हैं, अर्थात्


:{{nowrap|<math>M_N = \frac{1}{N}\sum_{i=1}^{N} X_i</math>.}}
:{{nowrap|<math>M_N = \frac{1}{N}\sum_{i=1}^{N} X_i</math>.}}


तब <math>M_N</math> 0 और 1 के बीच स्थित है। बड़ी संख्या के नियम से यह पता चलता है कि जैसे-जैसे N बढ़ता है, का वितरण होता है <math>M_N</math> में एकत्रित हो जाता है <math>0.5 = \operatorname{E}[X]</math> (एक सिक्का उछालने का अपेक्षित मूल्य)।
तब <math>M_N</math> 0 और 1 के बीच होता है। बड़ी संख्या के नियम से यह पता चलता है कि जैसे-जैसे N बढ़ता है, <math>M_N</math> का वितरण <math>0.5 = \operatorname{E}[X]</math> में परिवर्तित हो जाता है (एक सिक्के को उछालने का अपेक्षित मूल्य)।  


इसके अलावा, [[केंद्रीय सीमा प्रमेय]] के अनुसार, यह इसका अनुसरण करता है <math>M_N</math> लगभग सामान्य रूप से बड़े पैमाने पर वितरित किया जाता है {{nowrap|<math>N</math>.}} केंद्रीय सीमा प्रमेय के व्यवहार के बारे में अधिक विस्तृत जानकारी प्रदान कर सकता है <math>M_N</math> बड़ी संख्या के नियम की तुलना में. उदाहरण के लिए, हम लगभग एक पूँछ संभावना ज्ञात कर सकते हैं {{nowrap|<math>M_N</math>,}} {{nowrap|<math>P(M_N > x)</math>,}} वह <math>M_N</math> से बड़ा है {{nowrap|<math>x</math>,}} के एक निश्चित मान के लिए {{nowrap|<math>N</math>.}} हालाँकि, केंद्रीय सीमा प्रमेय द्वारा अनुमान सटीक नहीं हो सकता है यदि <math>x</math> दूर से है <math>\operatorname{E}[X_i]</math> जब तक <math>N</math> पर्याप्त रूप से बड़ा है. इसके अलावा, यह पूंछ संभावनाओं के अभिसरण के बारे में जानकारी प्रदान नहीं करता है {{nowrap|<math>N \to \infty</math>.}} हालाँकि, बड़ा विचलन सिद्धांत ऐसी समस्याओं का उत्तर प्रदान कर सकता है।
इसके अलावा, [[केंद्रीय सीमा प्रमेय]] के अनुसार, यह इस प्रकार है कि <math>M_N</math> लगभग सामान्य रूप से बड़े {{nowrap|<math>N</math>}} के लिए वितरित किया जाता है। केंद्रीय सीमा सिद्धांत <math>M_N</math> के व्यवहार के बारे में कानून की तुलना में अधिक विस्तृत जानकारी प्रदान कर सकता है। उदाहरण के लिए, हम लगभग {{nowrap|<math>M_N</math>,}} {{nowrap|<math>P(M_N > x)</math>,}} की एक टेल प्रायिकता पा सकते हैं, कि {{nowrap|<math>N</math>}} के निश्चित मान के लिए <math>M_N</math>, {{nowrap|<math>x</math>,}}से बड़ा है।हालाँकि, यदि <math>x</math>, <math>\operatorname{E}[X_i]</math>से दूर है तो केंद्रीय सीमा प्रमेय द्वारा सन्निकटन सटीक नहीं हो सकता है जब तक कि <math>N</math> पर्याप्त रूप से बड़ा न हो। इसके अलावा, यह {{nowrap|<math>N \to \infty</math>}} के रूप में पूंछ संभावनाओं के अभिसरण के बारे में जानकारी प्रदान नहीं करता है। हालांकि, बड़े विचलन सिद्धांत ऐसी समस्याओं के लिए उत्तर प्रदान कर सकता है।


आइए इस कथन को और अधिक सटीक बनाएं। किसी दिए गए मान के लिए {{nowrap|<math>0.5<x<1</math>,}}आइए हम पूँछ संभाव्यता की गणना करें {{nowrap|<math>P(M_N > x)</math>.}} परिभाषित करना
आइये इस कथन को और अधिक सटीक बनाते हैं। किसी दिए गए मान {{nowrap|<math>0.5<x<1</math>,}} के लिए, आइए हम पूँछ संभाव्यता {{nowrap|<math>P(M_N > x)</math>.}} की गणना करें। परिभाषित करें


:{{nowrap|<math>I(x) = x\ln{x} + (1-x) \ln(1-x) + \ln{2}</math>.}}
:{{nowrap|<math>I(x) = x\ln{x} + (1-x) \ln(1-x) + \ln{2}</math>.}}


ध्यान दें कि फ़ंक्शन <math>I(x)</math> एक उत्तल, अऋणात्मक फलन है जिसका मान शून्य है <math>x = \tfrac{1}{2}</math> और के रूप में बढ़ता है <math>x</math> दृष्टिकोण {{nowrap|<math>1</math>.}} यह [[बर्नौली एन्ट्रापी]] का नकारात्मक है {{nowrap|<math>p = \tfrac{1}{2}</math>;}} यह सिक्का उछालने के लिए उपयुक्त है, यह [[बर्नौली परीक्षण]] पर लागू स्पर्शोन्मुख समविभाजन गुण से पता चलता है। फिर चेरनॉफ़ की असमानता से यह दिखाया जा सकता है {{nowrap|<math>P(M_N > x) < \exp(-NI(x))</math>.}}<ref>"Large deviations for performance analysis: queues, communications, and computing", Shwartz, Adam, 1953- TN: 1228486</ref> यह बंधन इस अर्थ में काफी तीव्र है <math>I(x)</math> इसे बड़ी संख्या से प्रतिस्थापित नहीं किया जा सकता है जिससे सभी सकारात्मक के लिए सख्त असमानता उत्पन्न होगी {{nowrap|<math>N</math>.}}<ref>Varadhan, S.R.S.,The Annals of Probability 2008, Vol. 36, No. 2, 397–419, [https://math.nyu.edu/faculty/varadhan/wald.pdf]</ref> (हालाँकि, घातीय सीमा को अभी भी एक उप-घातीय कारक द्वारा कम किया जा सकता है {{nowrap|<math>1/\sqrt N</math>;}} यह [[बर्नौली वितरण]] में प्रदर्शित होने वाले [[द्विपद गुणांक]] पर लागू [[स्टर्लिंग सन्निकटन]] से अनुसरण करता है।) इसलिए, हम निम्नलिखित परिणाम प्राप्त करते हैं:
ध्यान दें कि फ़ंक्शन <math>I(x)</math> एक उत्तल, गैर-नकारात्मक फ़ंक्शन है जो <math>x = \tfrac{1}{2}</math> पर शून्य है और जैसे-जैसे <math>x</math>, {{nowrap|<math>1</math>}} के करीब पहुंचता है बढ़ता जाता है। यह {{nowrap|<math>p = \tfrac{1}{2}</math>;}} के साथ [[बर्नौली एन्ट्रापी]] का नकारात्मक है; यह सिक्का उछालने के लिए उपयुक्त है, यह [[बर्नौली परीक्षण]] पर लागू एसिम्प्टोटिक समविभाजन गुण से पता चलता है। फिर चेर्नॉफ़ की असमानता से, यह दिखाया जा सकता है कि {{nowrap|<math>P(M_N > x) < \exp(-NI(x))</math>}}<ref>"Large deviations for performance analysis: queues, communications, and computing", Shwartz, Adam, 1953- TN: 1228486</ref> यह सीमा काफी तीव्र है, इस अर्थ में कि <math>I(x)</math> को बड़ी संख्या से प्रतिस्थापित नहीं किया जा सकता है जो सभी सकारात्मक {{nowrap|<math>N</math>}} के लिए एक सख्त असमानता उत्पन्न करेगा।<ref>Varadhan, S.R.S.,The Annals of Probability 2008, Vol. 36, No. 2, 397–419, [https://math.nyu.edu/faculty/varadhan/wald.pdf]</ref> (हालाँकि, घातांकीय सीमा को अभी भी {{nowrap|<math>1/\sqrt N</math>;}} के क्रम पर एक उपघातीय कारक द्वारा कम किया जा सकता है; यह [[बर्नौली वितरण]] में प्रदर्शित [[द्विपद गुणांक]] पर लागू [[स्टर्लिंग सन्निकटन]] से होता है।) इसलिए, हम निम्नलिखित परिणाम प्राप्त करते हैं:


:{{nowrap|<math>P(M_N > x) \approx \exp(-NI(x))</math>.}}
:{{nowrap|<math>P(M_N > x) \approx \exp(-NI(x))</math>.}}


संभावना <math>P(M_N > x)</math> के रूप में तेजी से क्षय होता है <math>N \to \infty</math> x पर निर्भर दर पर। यह सूत्र i.i.d. के नमूना माध्य की किसी भी अंतिम संभावना का अनुमान लगाता है। नमूनों की संख्या बढ़ने पर यह परिवर्तनशील हो जाता है और अपना अभिसरण देता है।
संभावना <math>P(M_N > x)</math> x पर निर्भर दर पर तेजी से <math>N \to \infty</math> के रूप में घट जाती है। यह सूत्र आई.आई.डी. के नमूना माध्य की किसी भी पूंछ संभावना का अनुमान लगाता है। नमूनों की संख्या बढ़ने पर यह परिवर्तनशील हो जाता है और अपना अभिसरण देता है।


=== स्वतंत्र यादृच्छिक चर के योग के लिए बड़े विचलन ===
=== स्वतंत्र यादृच्छिक चर के योग के लिए बड़े विचलन ===
{{main|Cramér's theorem (large deviations)}}
{{main|Cramér's theorem (large deviations)}}
सिक्का उछालने के उपरोक्त उदाहरण में हमने स्पष्ट रूप से मान लिया है कि प्रत्येक उछाल एक है
सिक्का उछालने के उपरोक्त उदाहरण में हमने स्पष्ट रूप से मान लिया है कि प्रत्येक उछाल एक स्वतंत्र परीक्षण है, और हेड या टेल आने की संभावना हमेशा समान होती है।
स्वतंत्र परीक्षण, और हेड या टेल आने की संभावना हमेशा समान होती है।


होने देना <math>X,X_1,X_2, \ldots</math> आई.आई.डी. हो (i.i.d.) यादृच्छिक चर जिनका सामान्य वितरण एक निश्चित विकास स्थिति को संतुष्ट करता है। फिर निम्नलिखित सीमा मौजूद है:
मान लीजिए <math>X,X_1,X_2, \ldots</math> स्वतंत्र और समान रूप से वितरित (i.i.d.) यादृच्छिक चर हैं जिनका सामान्य वितरण एक निश्चित वृद्धि की स्थिति को संतुष्ट करता है। फिर निम्नलिखित सीमा मौजूद है:


:{{nowrap|<math>\lim_{N\to \infty} \frac{1}{N} \ln P(M_N > x) = - I(x)</math>.}}
:{{nowrap|<math>\lim_{N\to \infty} \frac{1}{N} \ln P(M_N > x) = - I(x)</math>.}}
Line 41: Line 39:
पहले जैसा।
पहले जैसा।


समारोह <math>I(\cdot)</math> इसे [[दर समारोह]] या क्रैमर फ़ंक्शन या कभी-कभी एन्ट्रॉपी फ़ंक्शन कहा जाता है।
फ़ंक्शन <math>I(\cdot)</math> को "[[दर समारोह|रेट फ़ंक्शन]]" या "क्रैमर फ़ंक्शन" या कभी-कभी "एंट्रॉपी फ़ंक्शन" कहा जाता है।


उपर्युक्त सीमा का अर्थ है कि बड़े के लिए {{nowrap|<math>N</math>,}}
उपर्युक्त सीमा का अर्थ है कि बड़े {{nowrap|<math>N</math>}} के लिए,


:{{nowrap|<math>P(M_N >x) \approx \exp[-NI(x) ]</math>,}}
:{{nowrap|<math>P(M_N >x) \approx \exp[-NI(x) ]</math>,}}


जो बड़े विचलन सिद्धांत का मूल परिणाम है।<ref>http://math.nyu.edu/faculty/varadhan/Spring2012/Chapters1-2.pdf {{Bare URL PDF|date=March 2022}}</ref><ref>S.R.S. Varadhan, Large Deviations and Applications (SIAM, Philadelphia, 1984)</ref>
जो कि बड़े विचलन सिद्धांत का मूल परिणाम है।<ref>http://math.nyu.edu/faculty/varadhan/Spring2012/Chapters1-2.pdf {{Bare URL PDF|date=March 2022}}</ref><ref>S.R.S. Varadhan, Large Deviations and Applications (SIAM, Philadelphia, 1984)</ref>
यदि हम संभाव्यता वितरण जानते हैं {{nowrap|<math>X</math>,}} दर फ़ंक्शन के लिए एक स्पष्ट अभिव्यक्ति प्राप्त की जा सकती है। यह लेजेंड्रे-फेन्चेल परिवर्तन द्वारा दिया गया है,<ref>{{cite journal|last=Touchette|first=Hugo|title=सांख्यिकीय यांत्रिकी के लिए बड़ा विचलन दृष्टिकोण|journal=Physics Reports|date=1 July 2009|volume=478|issue=1–3|pages=1–69|doi=10.1016/j.physrep.2009.05.002|arxiv=0804.0327|bibcode=2009PhR...478....1T|s2cid=118416390 }}</ref>
 
यदि हम {{nowrap|<math>X</math>}} का संभाव्यता वितरण जानते हैं, तो दर फलन के लिए एक स्पष्ट अभिव्यक्ति प्राप्त की जा सकती है। यह लीजेंड्रे-फेन्चेल परिवर्तन द्वारा दिया गया है,<ref>{{cite journal|last=Touchette|first=Hugo|title=सांख्यिकीय यांत्रिकी के लिए बड़ा विचलन दृष्टिकोण|journal=Physics Reports|date=1 July 2009|volume=478|issue=1–3|pages=1–69|doi=10.1016/j.physrep.2009.05.002|arxiv=0804.0327|bibcode=2009PhR...478....1T|s2cid=118416390 }}</ref>
:{{nowrap|<math>I(x) = \sup_{\theta > 0} [\theta x - \lambda(\theta)]</math>,}}
:{{nowrap|<math>I(x) = \sup_{\theta > 0} [\theta x - \lambda(\theta)]</math>,}}


Line 54: Line 53:


:<math>\lambda(\theta) = \ln \operatorname{E}[\exp(\theta X)]</math>
:<math>\lambda(\theta) = \ln \operatorname{E}[\exp(\theta X)]</math>
[[संचयी जनरेटिंग फ़ंक्शन]] (सीजीएफ) कहा जाता है और <math>\operatorname{E}</math> [[गणितीय अपेक्षा]] को दर्शाता है।
को [[संचयी जनरेटिंग फ़ंक्शन|क्यूम्युलेंट जेनरेटिंग फ़ंक्शन]] (सीजीएफ) कहा जाता है और <math>\operatorname{E}</math> [[गणितीय अपेक्षा]] को दर्शाता है।


अगर <math>X</math> [[सामान्य वितरण]] का अनुसरण करते हुए, दर फ़ंक्शन सामान्य वितरण के माध्य पर अपने शीर्ष के साथ एक परवलय बन जाता है।
यदि <math>X</math> एक [[सामान्य वितरण]] का अनुसरण करता है, तो दर फ़ंक्शन सामान्य वितरण के माध्य पर अपने शीर्ष के साथ एक परवलय बन जाता है।


अगर <math>\{X_i\}</math> एक इरेड्यूसिबल और एपेरियोडिक [[मार्कोव श्रृंखला]] है, जो ऊपर बताए गए बुनियादी बड़े विचलन परिणाम का प्रकार हो सकता है।{{Citation needed|date=June 2011}}
यदि <math>\{X_i\}</math> एक इरेड्यूसिबल और एपेरियोडिक [[मार्कोव श्रृंखला]] है, तो ऊपर बताए गए मूल बड़े विचलन परिणाम का प्रकार धारण किया जा सकता है।{{Citation needed|date=June 2011}}


=== स्वतंत्र यादृच्छिक चर के योग के लिए मध्यम विचलन ===
=== स्वतंत्र यादृच्छिक चर के योग के लिए मध्यम विचलन ===
पिछले उदाहरण ने घटना की संभावना को नियंत्रित किया <math>[M_N>x]</math>, अर्थात्, के नियम की एकाग्रता <math>M_N</math> [[कॉम्पैक्ट सेट]] पर <math>[-x,x]</math>. घटना की संभावना को नियंत्रित करना भी संभव है <math>[M_N>x a_N]</math> कुछ अनुक्रम के लिए <math>a_N\to 0</math>. निम्नलिखित मध्यम विचलन सिद्धांत का एक उदाहरण है:<ref>{{Cite book |last1=Dembo |first1=Amir |url=https://books.google.com/books?id=iT9JRlGPx5gC&dq=A.+Dembo+and+O.+Zeitouni.+Large+deviations+techniques+and+applications.+Springer%2C+New+York%2C+%281998%29.&pg=PR7 |title=बड़े विचलन तकनीकें और अनुप्रयोग|last2=Zeitouni |first2=Ofer |date=2009-11-03 |publisher=Springer Science & Business Media |isbn=978-3-642-03311-7 |pages=109 |language=en}}</ref><ref>{{Citation |last1=Sethuraman |first1=Jayaram |title=Moderate Deviations |date=2011 |url=http://link.springer.com/10.1007/978-3-642-04898-2_374 |encyclopedia=International Encyclopedia of Statistical Science |pages=847–849 |editor-last=Lovric |editor-first=Miodrag |access-date=2023-07-02 |place=Berlin, Heidelberg |publisher=Springer Berlin Heidelberg |language=en |doi=10.1007/978-3-642-04898-2_374 |isbn=978-3-642-04897-5 |last2=O. |first2=Robert}}</ref>
पिछले उदाहरण ने घटना <math>[M_N>x]</math> की संभाव्यता को नियंत्रित किया, अर्थात, [[कॉम्पैक्ट सेट]] <math>[-x,x]</math> पर <math>M_N</math> के नियम की एकाग्रता। कुछ अनुक्रम <math>a_N\to 0</math> के लिए घटना <math>[M_N>x a_N]</math> की प्रायिकता को नियंत्रित करना भी संभव है। निम्नलिखित एक मध्यम विचलन सिद्धांत का एक उदाहरण है:<ref>{{Cite book |last1=Dembo |first1=Amir |url=https://books.google.com/books?id=iT9JRlGPx5gC&dq=A.+Dembo+and+O.+Zeitouni.+Large+deviations+techniques+and+applications.+Springer%2C+New+York%2C+%281998%29.&pg=PR7 |title=बड़े विचलन तकनीकें और अनुप्रयोग|last2=Zeitouni |first2=Ofer |date=2009-11-03 |publisher=Springer Science & Business Media |isbn=978-3-642-03311-7 |pages=109 |language=en}}</ref><ref>{{Citation |last1=Sethuraman |first1=Jayaram |title=Moderate Deviations |date=2011 |url=http://link.springer.com/10.1007/978-3-642-04898-2_374 |encyclopedia=International Encyclopedia of Statistical Science |pages=847–849 |editor-last=Lovric |editor-first=Miodrag |access-date=2023-07-02 |place=Berlin, Heidelberg |publisher=Springer Berlin Heidelberg |language=en |doi=10.1007/978-3-642-04898-2_374 |isbn=978-3-642-04897-5 |last2=O. |first2=Robert}}</ref>
{{Math theorem
{{Math theorem
| math_statement = Let <math>X_1,X_2,\dots</math> be a sequence of centered i.i.d variables with finite variance <math>\sigma^2</math> such that <math>\forall \lambda \in \mathbb{R}, \ \ln\mathbb{E}[e^{\lambda X_1}]<\infty </math>. Define <math>M_N:=\frac{1}{N}\sum\limits_{n\leq N} X_N</math>. Then for any sequence <math>1\ll a_N \ll \sqrt{N}</math>:
| math_statement = Let <math>X_1,X_2,\dots</math> be a sequence of centered i.i.d variables with finite variance <math>\sigma^2</math> such that <math>\forall \lambda \in \mathbb{R}, \ \ln\mathbb{E}[e^{\lambda X_1}]<\infty </math>. Define <math>M_N:=\frac{1}{N}\sum\limits_{n\leq N} X_N</math>. Then for any sequence <math>1\ll a_N \ll \sqrt{N}</math>:

Revision as of 17:03, 29 November 2023

संभाव्यता सिद्धांत में, बड़े विचलन का सिद्धांत संभाव्यता वितरण के अनुक्रमों की दूरस्थ पूंछों के असममित व्यवहार से संबंधित है। कुछ सिद्धांत की मौलिक विचार व्यापकता की दिशा में जो लाप्लास के पूर्वक हैं, उनकी स्थापना बीमा गणित के साथ हुई, विशेषकर क्रैमर और लुंडबर्ग के साथ संराशि सिद्धांत के साथ। एक समृद्धिकृत बड़े विचलन सिद्धांत का समर्पित स्वरूपीकरण 1966 में वाराधन के एक पेपर में विकसित हुआ था।[1] बड़े विचलन सिद्धांत ने मापों की समर्थन की आवधारणाओं को स्वरूपीकृत किया और संभावना मापों के संघटन की धारणा को व्यापकता से महसूस कराया।

मोटे तौर पर कहें तो, बड़े विचलन का सिद्धांत कुछ प्रकार की चरम या पूंछ वाली घटनाओं की संभाव्यता उपायों की तेजी से गिरावट से संबंधित है।

परिचयात्मक उदाहरण

एक प्रारंभिक उदाहरण

एक निष्पक्ष सिक्के को स्वतंत्र रूप से उछालने के क्रम पर विचार करें। संभावित परिणाम हेड या टेल हो सकते हैं। आइए i-वें परीक्षण के संभावित परिणाम को , से निरूपित करें, जहां हम हेड को 1 और टेल को 0 के रूप में एन्कोड करते हैं। अब परीक्षणों के बाद को औसत मान दर्शाते हैं, अर्थात्

.

तब 0 और 1 के बीच होता है। बड़ी संख्या के नियम से यह पता चलता है कि जैसे-जैसे N बढ़ता है, का वितरण में परिवर्तित हो जाता है (एक सिक्के को उछालने का अपेक्षित मूल्य)।

इसके अलावा, केंद्रीय सीमा प्रमेय के अनुसार, यह इस प्रकार है कि लगभग सामान्य रूप से बड़े के लिए वितरित किया जाता है। केंद्रीय सीमा सिद्धांत के व्यवहार के बारे में कानून की तुलना में अधिक विस्तृत जानकारी प्रदान कर सकता है। उदाहरण के लिए, हम लगभग , , की एक टेल प्रायिकता पा सकते हैं, कि के निश्चित मान के लिए , ,से बड़ा है।हालाँकि, यदि , से दूर है तो केंद्रीय सीमा प्रमेय द्वारा सन्निकटन सटीक नहीं हो सकता है जब तक कि पर्याप्त रूप से बड़ा न हो। इसके अलावा, यह के रूप में पूंछ संभावनाओं के अभिसरण के बारे में जानकारी प्रदान नहीं करता है। हालांकि, बड़े विचलन सिद्धांत ऐसी समस्याओं के लिए उत्तर प्रदान कर सकता है।

आइये इस कथन को और अधिक सटीक बनाते हैं। किसी दिए गए मान , के लिए, आइए हम पूँछ संभाव्यता . की गणना करें। परिभाषित करें

.

ध्यान दें कि फ़ंक्शन एक उत्तल, गैर-नकारात्मक फ़ंक्शन है जो पर शून्य है और जैसे-जैसे , के करीब पहुंचता है बढ़ता जाता है। यह ; के साथ बर्नौली एन्ट्रापी का नकारात्मक है; यह सिक्का उछालने के लिए उपयुक्त है, यह बर्नौली परीक्षण पर लागू एसिम्प्टोटिक समविभाजन गुण से पता चलता है। फिर चेर्नॉफ़ की असमानता से, यह दिखाया जा सकता है कि [2] यह सीमा काफी तीव्र है, इस अर्थ में कि को बड़ी संख्या से प्रतिस्थापित नहीं किया जा सकता है जो सभी सकारात्मक के लिए एक सख्त असमानता उत्पन्न करेगा।[3] (हालाँकि, घातांकीय सीमा को अभी भी ; के क्रम पर एक उपघातीय कारक द्वारा कम किया जा सकता है; यह बर्नौली वितरण में प्रदर्शित द्विपद गुणांक पर लागू स्टर्लिंग सन्निकटन से होता है।) इसलिए, हम निम्नलिखित परिणाम प्राप्त करते हैं:

.

संभावना x पर निर्भर दर पर तेजी से के रूप में घट जाती है। यह सूत्र आई.आई.डी. के नमूना माध्य की किसी भी पूंछ संभावना का अनुमान लगाता है। नमूनों की संख्या बढ़ने पर यह परिवर्तनशील हो जाता है और अपना अभिसरण देता है।

स्वतंत्र यादृच्छिक चर के योग के लिए बड़े विचलन

सिक्का उछालने के उपरोक्त उदाहरण में हमने स्पष्ट रूप से मान लिया है कि प्रत्येक उछाल एक स्वतंत्र परीक्षण है, और हेड या टेल आने की संभावना हमेशा समान होती है।

मान लीजिए स्वतंत्र और समान रूप से वितरित (i.i.d.) यादृच्छिक चर हैं जिनका सामान्य वितरण एक निश्चित वृद्धि की स्थिति को संतुष्ट करता है। फिर निम्नलिखित सीमा मौजूद है:

.

यहाँ

,

पहले जैसा।

फ़ंक्शन को "रेट फ़ंक्शन" या "क्रैमर फ़ंक्शन" या कभी-कभी "एंट्रॉपी फ़ंक्शन" कहा जाता है।

उपर्युक्त सीमा का अर्थ है कि बड़े के लिए,

,

जो कि बड़े विचलन सिद्धांत का मूल परिणाम है।[4][5]

यदि हम का संभाव्यता वितरण जानते हैं, तो दर फलन के लिए एक स्पष्ट अभिव्यक्ति प्राप्त की जा सकती है। यह लीजेंड्रे-फेन्चेल परिवर्तन द्वारा दिया गया है,[6]

,

कहाँ

को क्यूम्युलेंट जेनरेटिंग फ़ंक्शन (सीजीएफ) कहा जाता है और गणितीय अपेक्षा को दर्शाता है।

यदि एक सामान्य वितरण का अनुसरण करता है, तो दर फ़ंक्शन सामान्य वितरण के माध्य पर अपने शीर्ष के साथ एक परवलय बन जाता है।

यदि एक इरेड्यूसिबल और एपेरियोडिक मार्कोव श्रृंखला है, तो ऊपर बताए गए मूल बड़े विचलन परिणाम का प्रकार धारण किया जा सकता है।[citation needed]

स्वतंत्र यादृच्छिक चर के योग के लिए मध्यम विचलन

पिछले उदाहरण ने घटना की संभाव्यता को नियंत्रित किया, अर्थात, कॉम्पैक्ट सेट पर के नियम की एकाग्रता। कुछ अनुक्रम के लिए घटना की प्रायिकता को नियंत्रित करना भी संभव है। निम्नलिखित एक मध्यम विचलन सिद्धांत का एक उदाहरण है:[7][8]

Theorem — Let be a sequence of centered i.i.d variables with finite variance such that . Define . Then for any sequence :

विशेष रूप से, सीमा मामला केंद्रीय सीमा प्रमेय है.

औपचारिक परिभाषा

पोलिश स्थान दिया गया होने देना बोरेल बीजगणित संभाव्यता उपायों का एक क्रम बनें , होने देना सकारात्मक वास्तविक संख्याओं का ऐसा अनुक्रम बनें , और अंत में जाने दो निम्न अर्ध-निरंतर क्रियाशील बनें क्रम ऐसा कहा जाता है कि यह गति के साथ एक बड़े विचलन सिद्धांत को संतुष्ट करता है और दर यदि, और केवल यदि, प्रत्येक बोरेल मापने योग्य सेट के लिए ,

,

कहाँ और क्रमशः समापन (टोपोलॉजी) और आंतरिक (टोपोलॉजी) को निरूपित करें .[citation needed]

संक्षिप्त इतिहास

बड़े विचलनों से संबंधित पहले कठोर परिणाम स्वीडिश गणितज्ञ हेराल्ड क्रैमर के कारण हैं, जिन्होंने उन्हें बीमा व्यवसाय के मॉडल के लिए लागू किया था।[9] बिन्दु से एक बीमा कंपनी की नजर में, कमाई प्रति माह एक स्थिर दर (मासिक प्रीमियम) पर होती है लेकिन दावे बेतरतीब ढंग से आते हैं। कंपनी को एक निश्चित अवधि (अधिमानतः कई महीनों) में सफल होने के लिए, कुल कमाई कुल दावे से अधिक होनी चाहिए। इस प्रकार प्रीमियम का अनुमान लगाने के लिए आपको निम्नलिखित प्रश्न पूछना होगा: हमें प्रीमियम के रूप में क्या चुनना चाहिए ऐसे कि खत्म महीनों में कुल दावा से कम होना चाहिए ?" यह स्पष्ट रूप से वही प्रश्न है जो बड़े विचलन सिद्धांत द्वारा पूछा गया है। क्रैमर ने आई.आई.डी. के लिए इस प्रश्न का समाधान दिया। यादृच्छिक चर, जहां दर फ़ंक्शन को शक्ति श्रृंखला के रूप में व्यक्त किया जाता है।

महत्वपूर्ण प्रगति करने वाले गणितज्ञों की एक बहुत ही अधूरी सूची में एलेक्सी ज़िनोविविच पेत्रोव शामिल होंगे,[10] सनोव का प्रमेय,[11] एस.आर.एस. वरदान (जिन्होंने सिद्धांत में अपने योगदान के लिए एबेल पुरस्कार जीता है), डी. रुएल, ऑस्कर लैनफोर्ड|ओ.ई. लैनफोर्ड, अमीर डेम्बो, और ओफ़र ओलिव।[12]


अनुप्रयोग

संभाव्य मॉडल से जानकारी इकट्ठा करने के लिए बड़े विचलन के सिद्धांतों को प्रभावी ढंग से लागू किया जा सकता है। इस प्रकार, बड़े विचलन का सिद्धांत सूचना सिद्धांत और जोखिम प्रबंधन में अपना अनुप्रयोग पाता है। भौतिकी में, बड़े विचलन सिद्धांत का सबसे प्रसिद्ध अनुप्रयोग ऊष्मप्रवैगिकी और सांख्यिकीय यांत्रिकी (दर फ़ंक्शन के साथ एन्ट्रापी से संबंधित संबंध में) में उत्पन्न होता है।

बड़े विचलन और एन्ट्रापी

दर फ़ंक्शन सांख्यिकीय यांत्रिकी में एन्ट्रापी से संबंधित है। इसे अनुमानतः निम्नलिखित प्रकार से देखा जा सकता है। सांख्यिकीय यांत्रिकी में एक विशेष मैक्रो-स्टेट की एन्ट्रापी सूक्ष्म-स्टेट्स की संख्या से संबंधित होती है जो इस मैक्रो-स्टेट से मेल खाती है। हमारे सिक्के उछालने के उदाहरण में माध्य मान एक विशेष मैक्रो-स्टेट को नामित कर सकता है। और चित और पट का विशेष क्रम जो एक विशेष मान को जन्म देता है एक विशेष सूक्ष्म अवस्था का गठन करता है। मोटे तौर पर कहें तो एक मैक्रो-स्टेट जिसमें अधिक संख्या में माइक्रो-स्टेट्स होते हैं, जो इसे जन्म देते हैं, में उच्च एन्ट्रापी होती है। और उच्च एन्ट्रापी वाले राज्य के वास्तविक प्रयोगों में साकार होने की संभावना अधिक होती है। 1/2 के माध्य मान वाले मैक्रो-स्टेट (जितने हेड उतने टेल) में सबसे अधिक संख्या में माइक्रो-स्टेट्स होते हैं जो इसे जन्म देते हैं और यह वास्तव में उच्चतम एन्ट्रापी वाला राज्य है। और अधिकांश व्यावहारिक स्थितियों में हम वास्तव में बड़ी संख्या में परीक्षणों के लिए इस मैक्रो-स्टेट को प्राप्त करेंगे। दूसरी ओर दर फ़ंक्शन किसी विशेष मैक्रो-स्टेट की उपस्थिति की संभावना को मापता है। दर फ़ंक्शन जितना छोटा होगा, मैक्रो-स्टेट प्रदर्शित होने की संभावना उतनी ही अधिक होगी। हमारे सिक्का उछालने में 1/2 के बराबर माध्य मान के लिए दर फ़ंक्शन का मान शून्य है। इस तरह कोई दर फ़ंक्शन को एन्ट्रापी के नकारात्मक के रूप में देख सकता है।

बड़े विचलन सिद्धांत में दर फ़ंक्शन और कुल्बैक-लीबलर विचलन के बीच एक संबंध है, यह संबंध सनोव के प्रमेय द्वारा स्थापित किया गया है (सनोव देखें)[11]और नोवाक,[13] चौ. 14.5).

एक विशेष मामले में, बड़े विचलन ग्रोमोव-हॉसडॉर्फ़ अभिसरण | ग्रोमोव-हॉसडॉर्फ़ सीमा की अवधारणा से निकटता से संबंधित हैं।[14]


यह भी देखें

संदर्भ

  1. S.R.S. Varadhan, Asymptotic probability and differential equations, Comm. Pure Appl. Math. 19 (1966),261-286.
  2. "Large deviations for performance analysis: queues, communications, and computing", Shwartz, Adam, 1953- TN: 1228486
  3. Varadhan, S.R.S.,The Annals of Probability 2008, Vol. 36, No. 2, 397–419, [1]
  4. http://math.nyu.edu/faculty/varadhan/Spring2012/Chapters1-2.pdf[bare URL PDF]
  5. S.R.S. Varadhan, Large Deviations and Applications (SIAM, Philadelphia, 1984)
  6. Touchette, Hugo (1 July 2009). "सांख्यिकीय यांत्रिकी के लिए बड़ा विचलन दृष्टिकोण". Physics Reports. 478 (1–3): 1–69. arXiv:0804.0327. Bibcode:2009PhR...478....1T. doi:10.1016/j.physrep.2009.05.002. S2CID 118416390.
  7. Dembo, Amir; Zeitouni, Ofer (2009-11-03). बड़े विचलन तकनीकें और अनुप्रयोग (in English). Springer Science & Business Media. p. 109. ISBN 978-3-642-03311-7.
  8. Sethuraman, Jayaram; O., Robert (2011), "Moderate Deviations", in Lovric, Miodrag (ed.), International Encyclopedia of Statistical Science (in English), Berlin, Heidelberg: Springer Berlin Heidelberg, pp. 847–849, doi:10.1007/978-3-642-04898-2_374, ISBN 978-3-642-04897-5, retrieved 2023-07-02
  9. Cramér, H. (1944). On a new limit theorem of the theory of probability. Uspekhi Matematicheskikh Nauk, (10), 166-178.
  10. Petrov V.V. (1954) Generalization of Cramér's limit theorem. Uspehi Matem. Nauk, v. 9, No 4(62), 195--202.(Russian)
  11. 11.0 11.1 Sanov I.N. (1957) On the probability of large deviations of random magnitudes. Matem. Sbornik, v. 42 (84), 11--44.
  12. Dembo, A., & Zeitouni, O. (2009). Large deviations techniques and applications (Vol. 38). Springer Science & Business Media
  13. Novak S.Y. (2011) Extreme value methods with applications to finance. Chapman & Hall/CRC Press. ISBN 978-1-4398-3574-6.
  14. Kotani M., Sunada T. Large deviation and the tangent cone at infinity of a crystal lattice, Math. Z. 254, (2006), 837-870.


ग्रन्थसूची