चेर्नॉफ़ बाध्य: Difference between revisions
No edit summary |
No edit summary |
||
Line 2: | Line 2: | ||
संभाव्यता सिद्धांत में, '''चेर्नॉफ़ बाउंड''' यादृच्छिक चर की पूंछ पर उसके क्षण उत्पन्न करने वाले फ़ंक्शन के आधार पर तेजी से घटती ऊपरी सीमा है। ऐसी सभी घातांकीय सीमाओं का न्यूनतम ''चेर्नॉफ़ या चेर्नॉफ़-क्रैमर बाउंड'' बनाता है, जो घातीय की तुलना में तेजी से क्षय हो सकता है (उदाहरण के लिए उप-गॉसियन वितरण|उप-गॉसियन)।<ref name="blm">{{Cite book|last=Boucheron|first=Stéphane|url=https://www.worldcat.org/oclc/837517674|title=Concentration Inequalities: a Nonasymptotic Theory of Independence|date=2013|publisher=Oxford University Press|others=Gábor Lugosi, Pascal Massart|isbn=978-0-19-953525-5|location=Oxford|page=21|oclc=837517674}}</ref><ref>{{Cite web|last=Wainwright|first=M.|date=January 22, 2015|title=मूल पूंछ और एकाग्रता सीमाएँ|url=https://www.stat.berkeley.edu/~mjwain/stat210b/Chap2_TailBounds_Jan22_2015.pdf|url-status=live|archive-url=https://web.archive.org/web/20160508170739/http://www.stat.berkeley.edu:80/~mjwain/stat210b/Chap2_TailBounds_Jan22_2015.pdf |archive-date=2016-05-08 }}</ref> यह विशेष रूप से स्वतंत्र यादृच्छिक चर के योग के लिए उपयोगी है, जैसे [[बर्नौली यादृच्छिक चर]] का योग।<ref>{{Cite book|last=Vershynin|first=Roman|url=https://www.worldcat.org/oclc/1029247498|title=High-dimensional probability : an introduction with applications in data science|date=2018|isbn=978-1-108-41519-4|location=Cambridge, United Kingdom|oclc=1029247498|page=19}}</ref><ref>{{Cite journal|last=Tropp|first=Joel A.|date=2015-05-26|title=मैट्रिक्स एकाग्रता असमानताओं का एक परिचय|url=https://www.nowpublishers.com/article/Details/MAL-048|journal=Foundations and Trends in Machine Learning|language=English|volume=8|issue=1–2|page=60|doi=10.1561/2200000048|arxiv=1501.01571|s2cid=5679583|issn=1935-8237}}</ref> | संभाव्यता सिद्धांत में, '''चेर्नॉफ़ बाउंड''' यादृच्छिक चर की पूंछ पर उसके क्षण उत्पन्न करने वाले फ़ंक्शन के आधार पर तेजी से घटती ऊपरी सीमा है। ऐसी सभी घातांकीय सीमाओं का न्यूनतम ''चेर्नॉफ़ या चेर्नॉफ़-क्रैमर बाउंड'' बनाता है, जो घातीय की तुलना में तेजी से क्षय हो सकता है (उदाहरण के लिए उप-गॉसियन वितरण|उप-गॉसियन)।<ref name="blm">{{Cite book|last=Boucheron|first=Stéphane|url=https://www.worldcat.org/oclc/837517674|title=Concentration Inequalities: a Nonasymptotic Theory of Independence|date=2013|publisher=Oxford University Press|others=Gábor Lugosi, Pascal Massart|isbn=978-0-19-953525-5|location=Oxford|page=21|oclc=837517674}}</ref><ref>{{Cite web|last=Wainwright|first=M.|date=January 22, 2015|title=मूल पूंछ और एकाग्रता सीमाएँ|url=https://www.stat.berkeley.edu/~mjwain/stat210b/Chap2_TailBounds_Jan22_2015.pdf|url-status=live|archive-url=https://web.archive.org/web/20160508170739/http://www.stat.berkeley.edu:80/~mjwain/stat210b/Chap2_TailBounds_Jan22_2015.pdf |archive-date=2016-05-08 }}</ref> यह विशेष रूप से स्वतंत्र यादृच्छिक चर के योग के लिए उपयोगी है, जैसे [[बर्नौली यादृच्छिक चर]] का योग।<ref>{{Cite book|last=Vershynin|first=Roman|url=https://www.worldcat.org/oclc/1029247498|title=High-dimensional probability : an introduction with applications in data science|date=2018|isbn=978-1-108-41519-4|location=Cambridge, United Kingdom|oclc=1029247498|page=19}}</ref><ref>{{Cite journal|last=Tropp|first=Joel A.|date=2015-05-26|title=मैट्रिक्स एकाग्रता असमानताओं का एक परिचय|url=https://www.nowpublishers.com/article/Details/MAL-048|journal=Foundations and Trends in Machine Learning|language=English|volume=8|issue=1–2|page=60|doi=10.1561/2200000048|arxiv=1501.01571|s2cid=5679583|issn=1935-8237}}</ref> | ||
बाउंड | इस बाउंड को आमतौर पर [[हरमन चेर्नॉफ़]] के नाम पर जाना जाता है, जिन्होंने 1952 के पेपर में इस विधि का वर्णन किया था,<ref>{{Cite journal|last=Chernoff|first=Herman|date=1952|title=अवलोकनों के योग के आधार पर एक परिकल्पना के परीक्षण के लिए स्पर्शोन्मुख दक्षता का एक उपाय|journal=The Annals of Mathematical Statistics|volume=23|issue=4|pages=493–507|doi=10.1214/aoms/1177729330|jstor=2236576|issn=0003-4851|doi-access=free}}</ref> हालाँकि चेर्नॉफ़ ने इसे स्वयं हरमन रूबिन को समर्पित किया था।<ref>{{cite book | url=http://www.crcpress.com/product/isbn/9781482204964 | title=सांख्यिकी का अतीत, वर्तमान और भविष्य| chapter=A career in statistics | page=35 | publisher=CRC Press | last1=Chernoff | first1=Herman | editor-first1=Xihong | editor-last1=Lin | editor-first2=Christian | editor-last2=Genest | editor-first3=David L. | editor-last3=Banks | editor-first4=Geert | editor-last4=Molenberghs | editor-first5=David W. | editor-last5=Scott | editor-first6=Jane-Ling | editor-last6=Wang | editor6-link = Jane-Ling Wang| year=2014 | isbn=9781482204964 | archive-url=https://web.archive.org/web/20150211232731/https://nisla05.niss.org/copss/past-present-future-copss.pdf | archive-date=2015-02-11 | chapter-url=https://nisla05.niss.org/copss/past-present-future-copss.pdf}}</ref> 1938 में हराल्ड क्रामर ने लगभग इसी धारणा को प्रकाशित किया था, जिसे अब क्रामर का सिद्धांत के नाम से जाना जाता है। | ||
यह मार्कोव की असमानता या चेबीशेव की असमानता जैसे पहले या दूसरे-क्षण-आधारित पूंछ सीमाओं की तुलना में तीव्र सीमा है, जो केवल पूंछ क्षय पर शक्ति-कानून सीमाएं उत्पन्न करती है। हालाँकि, जब चेर्नॉफ़ बाउंड को योगों पर लागू किया जाता है, तो चर को स्वतंत्र होने की आवश्यकता होती है, ऐसी स्थिति जो मार्कोव की असमानता या चेबीशेव की असमानता के लिए आवश्यक नहीं है (हालांकि चेबीशेव की | यह मार्कोव की असमानता या चेबीशेव की असमानता जैसे पहले या दूसरे-क्षण-आधारित पूंछ सीमाओं की तुलना में तीव्र सीमा है, जो केवल पूंछ क्षय पर शक्ति-कानून सीमाएं उत्पन्न करती है। हालाँकि, जब चेर्नॉफ़ बाउंड को योगों पर लागू किया जाता है, तो चर को स्वतंत्र होने की आवश्यकता होती है, ऐसी स्थिति जो मार्कोव की असमानता या चेबीशेव की असमानता के लिए आवश्यक नहीं है (हालांकि चेबीशेव की असम्भवता को योग होने के लिए व्यक्तिगत रूप से आवश्यकता होती है)। | ||
चेरनॉफ बाउंड बर्नस्टीन समीकरणों से संबंधित है। यह भी होफ्डिंग की असम्भवता, बेनेट की असम्भवता, और मैकडियर्मिड की असम्भवता को सिद्ध करने के लिए उपयोग किया जाता है। | |||
== जेनेरिक चेर्नॉफ़ सीमाएँ == | == जेनेरिक चेर्नॉफ़ सीमाएँ == | ||
[[File:Chernoff-bound.svg|thumb|दो-तरफा चेर्नॉफ़ [[ची-वर्ग वितरण]]|ची-वर्ग यादृच्छिक चर के लिए बाध्य है]] | [[File:Chernoff-bound.svg|thumb|दो-तरफा चेर्नॉफ़ [[ची-वर्ग वितरण]]|ची-वर्ग यादृच्छिक चर के लिए बाध्य है]]यादृच्छिक प्रतिस्थान के लिए जनेरिक चेरनॉफ बाउंड को लागू करने के लिए, मार्कोव की असम्भवता को उपयोग करते हुए यह बाउंड मिलता है, इसे आवश्यकतानुसार एक्सपोनेंशियल मार्कोव या एक्सपोनेंशियल मोमेंट्स बाउंड भी कहा जाता है। इसके लिए, सकारात्मक <math>t</math> के लिए हम <math>e^{tX}</math> का बाउंड प्राप्त करते हैं (इसी कारण इसे कभी-कभी एक्सपोनेंशियल मार्कोव या एक्सपोनेंशियल मोमेंट्स बाउंड कहा जाता है)। इस बाउंड के लिए, यदि <math>t</math> सकारात्मक है, तो यह बाउंड देता है <math>X</math> के दायां खंभे की ओर की सीमा, जिसे मायने के रूप में उसके मोमेंट-उत्पन्न कारक के साथ लिखा जा सकता है <math>M(t) = \operatorname E (e^{t X})</math>: | ||
<math>\operatorname P \left(X \geq a \right) = \operatorname P \left(e^{t X} \geq e^{t a}\right) \leq M(t) e^{-t a} \qquad (t > 0)</math> | |||
यह बाउंड हर सकारात्मक <math>t</math>,के लिए सत्य होता है, इसलिए हम [[सबसे निचला और उच्चतम]] को न्यूनतम मान ले सकते हैं: | |||
:<math>\operatorname P \left(X \geq a\right) \leq \inf_{t > 0} M(t) e^{-t a}</math> | :<math>\operatorname P \left(X \geq a\right) \leq \inf_{t > 0} M(t) e^{-t a}</math> | ||
इसी तरह के विश्लेषण को नकारात्मक <math>t</math> के साथ करने से हम बाएं खंभे की समान बाउंड प्राप्त करते हैं: | |||
:<math>\operatorname P \left(X \leq a \right) = \operatorname P \left(e^{t X} \geq e^{t a}\right) \leq M(t) e^{-t a} \qquad (t < 0)</math> | :<math>\operatorname P \left(X \leq a \right) = \operatorname P \left(e^{t X} \geq e^{t a}\right) \leq M(t) e^{-t a} \qquad (t < 0)</math> | ||
और | और | ||
:<math>\operatorname P \left(X \leq a\right) \leq \inf_{t < 0} M(t) e^{-t a}</math> | :<math>\operatorname P \left(X \leq a\right) \leq \inf_{t < 0} M(t) e^{-t a}</math> | ||
मात्रा <math>M(t) e^{-t a}</math> अपेक्षा मूल्य के रूप में व्यक्त किया जा सकता है <math>\operatorname E (e^{t X}) e^{-t a}</math>, या | मात्रा <math>M(t) e^{-t a}</math> अपेक्षा मूल्य के रूप में व्यक्त किया जा सकता है <math>\operatorname E (e^{t X}) e^{-t a}</math>, या समकालिक रूप में लिखा जा सकता है <math>\operatorname E (e^{t (X-a)})</math>। | ||
=== गुण === | === गुण === | ||
घाती संख्या के लिए तार्किक समान लिया जा सकता है क्योंकि एक्सपोनेंशियल फ़ंक्शन अभिप्रेत है, इसलिए जेनसेन की असम्भाविता के अनुसार <math>\operatorname E (e^{t X}) \ge e^{t \operatorname E (X)}</math>होता है। इससे यह प्राप्त होता है कि दायां खंभे की सीमा अवश्य हैं होता है जब <math>a \le \operatorname E (X)</math>; उसी तरह, बाएं खंभे के लिए बाउंड उचित होता है जब <math>a \ge \operatorname E (X)</math>। इसलिए हम दोनों infima को संयोजित कर सकते हैं और दो-तरफी चेरनॉफ बाउंड को परिभाषित कर सकते हैं .<math display="block">C(a) = \inf_{t} M(t) e^{-t a} </math>जो मुड़े हुए संचयी वितरण फ़ंक्शन पर ऊपरी सीमा प्रदान करता है <math>X</math> (माध्य पर मुड़ा हुआ, माध्यिका पर नहीं)। | |||
दो-तरफी चेर्नॉफ़ बाउंड के लघुगणक को [[दर समारोह|दर फ़ंक्शन]] (या क्रैमर ट्रांसफॉर्म) के रूप में जाना जाता है <math>I = -\log C</math>। यह लेजेन्ड्रे-फेन्चेल ट्रांसफॉर्मेशन के समतुल्य है|लेजेन्ड्रे-फेन्चेल ट्रांसफॉर्म या [[संचयी जनरेटिंग फ़ंक्शन]] का [[उत्तल संयुग्म]] <math>K = \log M</math>, के रूप में परिभाषित: | |||
<math display="block">I(a) = \sup_{t} at - K(t) </math> | |||
यहां, मायने उत्पन्न करने के लिए कुम्युलेटिव उत्पन्न कारक फ़ंक्शन का लघुकरण अभिप्रेत है, इसलिए चेरनॉफ बाउंड लघुकरण होना चाहिए। चेरनॉफ बाउंड अपनी अधिकतम मान्यता आवश्यकता के समय प्राप्त करता है, <math>C(\operatorname E(X))=1</math>, और अनुवर्तन के तहत समान होता है:<math display="inline">C_{X+k}(a) = C_X(a - k) </math>. | |||
चेरनॉफ बाउंड केवल तब सटीक होता है जब <math>X</math> एकल केंद्रित भार (असमवितरित वितरण) होता है। यह बाउंड केवल सीमित संख्यात्मक मानों के परे या उसके सीमाओं में सत्य होता है, जहां अनंत <math>t</math> के लिए निर्धारित होते हैं। असीमित संख्यात्मक मानों के लिए बाउंड कहीं भी सत्य नहीं होता है, हालांकि यह उप-घातीय कारकों (घातीय रूप से तंग) तक स्पर्शोन्मुख रूप से तंग है। व्यक्तिगत क्षण अधिक विश्लेषणात्मक जटिलता की कीमत पर, कड़ी सीमाएं प्रदान कर सकते हैं।<ref>{{Cite journal |last1=Philips |first1=Thomas K. |last2=Nelson |first2=Randolph |date=1995 |title=सकारात्मक पूंछ संभावनाओं के लिए बंधा हुआ क्षण चेर्नॉफ़ के बंधे से भी अधिक कठिन है|url=https://www.jstor.org/stable/2684633 |journal=The American Statistician |volume=49 |issue=2 |pages=175–178 |doi=10.2307/2684633 |jstor=2684633 |issn=0003-1305}}</ref> | |||
व्यावहारिक रूप में, सटीक चेरनॉफ बाउंड को असामर्थ्यपूर्ण या विश्लेषणात्मक रूप से मूल्यांकित करना कठिन हो सकता है, जिसके परिणामस्वरूप प्रतीक्षित कुम्युलेटिव वितरण फ़ंक्शन के ऊपरी सीमा (या कुम्युलेटिव उत्पन्न कारक) के लिए उचित ऊपरी बाउंड प्रयोग किया जा सकता है (जैसे कि उप-उपवाकीय सीजीएफ जो उप-गौसिय चेरनॉफ बाउंड देता है)। | |||
{| class="wikitable mw-collapsible" | {| class="wikitable mw-collapsible" | ||
|+ | |+सामान्य वितरण के लिए सटीक दर फ़ंक्शन और चेर्नॉफ़ सीमाएं | ||
!वितरण | !वितरण | ||
!<math>\operatorname E (X)</math> | !<math>\operatorname E (X)</math> | ||
Line 44: | Line 52: | ||
|<math>\exp \left( {-\frac{a^2}{2\sigma^2}} \right)</math> | |<math>\exp \left( {-\frac{a^2}{2\sigma^2}} \right)</math> | ||
|- | |- | ||
|[[Bernoulli distribution|बर्नौली वितरण]]नीचे विस्तृत) | |[[Bernoulli distribution|बर्नौली वितरण]] (नीचे विस्तृत) | ||
|<math>p</math> | |<math>p</math> | ||
|<math>\ln \left( 1-p + pe^t \right)</math> | |<math>\ln \left( 1-p + pe^t \right)</math> | ||
Line 81: | Line 89: | ||
|<math>(a/\lambda)^{-a} e^{a-\lambda}</math> | |<math>(a/\lambda)^{-a} e^{a-\lambda}</math> | ||
|} | |} | ||
=== एमजीएफ से निचली सीमा === | === एमजीएफ से निचली सीमा === | ||
मात्रात्मक उत्पन्न कारक का उपयोग करके, डेली-जयग्मंद असम्भवता को <math>e^{tX}</math>, पर लागू करके, पूर्विक को कोण प्राप्त किया जा सकता है, जो खंभे की संभावनाओं पर निचला बाउंड प्रदान करता है: <math display="block">\operatorname P \left(X > a\right) \geq \sup_{t > 0 \and M(t) \geq e^{ta}} \left( 1 - \frac{e^{ta}}{M(t)} \right)^2 \frac{M(t)^2}{M(2t)}</math>(नकारात्मक <math>t</math> के लिए बाईं पूंछ पर बाउंड प्राप्त किया जाता है) हालाँकि, चेर्नॉफ़ बाउंड के विपरीत, यह परिणाम तेजी से तंग नहीं है। | |||
थियोडोसोपोलोस<ref>{{Cite journal |last=Theodosopoulos |first=Ted |date=2007-03-01 |title=चेर्नॉफ़ बाउंड का प्रत्यावर्तन|url=https://www.sciencedirect.com/science/article/pii/S0167715206002884 |journal=Statistics & Probability Letters |language=en |volume=77 |issue=5 |pages=558–565 |doi=10.1016/j.spl.2006.09.003 |issn=0167-7152}}</ref> [[घातीय झुकाव]] प्रक्रिया का उपयोग करके | थियोडोसोपोलोस<ref>{{Cite journal |last=Theodosopoulos |first=Ted |date=2007-03-01 |title=चेर्नॉफ़ बाउंड का प्रत्यावर्तन|url=https://www.sciencedirect.com/science/article/pii/S0167715206002884 |journal=Statistics & Probability Letters |language=en |volume=77 |issue=5 |pages=558–565 |doi=10.1016/j.spl.2006.09.003 |issn=0167-7152}}</ref> ने बाउंड का निर्माण किया (जो अधिक) जैसे एक्सपोनेंशियल[[घातीय झुकाव]] प्रक्रिया का उपयोग करके ज्यादा सत्य होता है। | ||
विशेष | विशेष (जैसे कि [[द्विपद वितरण]]) वितरणों के लिए, चेरनॉफ बाउंड के समान घातीय क्रम की निचली सीमाएं अक्सर उपलब्ध होती हैं। | ||
== स्वतंत्र यादृच्छिक चर का योग == | == स्वतंत्र यादृच्छिक चर का योग == | ||
जब {{mvar|X}}, {{mvar|n}} अलग-अलग औपचारिक क्रमिक चरणिका {{math|''X''<sub>1</sub>, ..., ''X<sub>n</sub>''}}, के {{mvar|n}} निर्दिष्ट निर्देशांकों का योग होता है, तो {{mvar|X}} का उत्पन्न कारक उत्पन्नकों के व्यक्तिगत उत्पन्नकों के गुणक का होता है, जिससे प्राप्त होता है: | |||
{{NumBlk|:|<math>\Pr(X \geq a) \leq \inf_{t > 0} \frac{\operatorname E \left [\prod_i e^{t\cdot X_i}\right]}{e^{t\cdot a}} = \inf_{t > 0} e^{-t\cdot a}\prod_i\operatorname E\left[ e^{t\cdot X_i}\right].</math>|{{EquationRef|1}}}} | {{NumBlk|:|<math>\Pr(X \geq a) \leq \inf_{t > 0} \frac{\operatorname E \left [\prod_i e^{t\cdot X_i}\right]}{e^{t\cdot a}} = \inf_{t > 0} e^{-t\cdot a}\prod_i\operatorname E\left[ e^{t\cdot X_i}\right].</math>|{{EquationRef|1}}}} | ||
Line 100: | Line 107: | ||
विशिष्ट चेर्नॉफ़ सीमाएँ क्षण-उत्पन्न करने वाले फ़ंक्शन की गणना करके प्राप्त की जाती हैं <math>\operatorname E \left[e^{-t\cdot X_i} \right ]</math> यादृच्छिक चर के विशिष्ट उदाहरणों के लिए <math>X_i</math>. | विशिष्ट चेर्नॉफ़ सीमाएँ क्षण-उत्पन्न करने वाले फ़ंक्शन की गणना करके प्राप्त की जाती हैं <math>\operatorname E \left[e^{-t\cdot X_i} \right ]</math> यादृच्छिक चर के विशिष्ट उदाहरणों के लिए <math>X_i</math>. | ||
जब यादृच्छिक | जब यादृच्छिक निर्दिष्टानुसार भी अद्यतित रहते हैं ([[स्वतंत्र और समान रूप से वितरित यादृच्छिक चर]]),जब यादृच्छिक निर्दिष्टानुसार भी अद्यतित रहते हैं (आईआईडी), तो योग के लिए चेरनॉफ बाउंड को एकल चरणिक बाउंड का सरल पुनः-मापन मान लेते हैं। अर्थात, आईआईडी चरणिका योग के लिए चेरनॉफ बाउंड n वाली एकल चरणिका बाउंड की n वाली शक्ति के समान होती है (क्रामर का सिद्धांत देखें)। | ||
== स्वतंत्र परिबद्ध यादृच्छिक चरों का योग == | == स्वतंत्र परिबद्ध यादृच्छिक चरों का योग == | ||
{{main|होफ़डिंग की असमानता}} | {{main|होफ़डिंग की असमानता}} | ||
चेर्नॉफ़ सीमाएं उनके वितरण की परवाह किए बिना, स्वतंत्र, बंधे हुए यादृच्छिक चर के सामान्य योगों पर भी लागू की जा सकती हैं; इसे होफ़डिंग की असमानता के रूप में जाना जाता है। प्रमाण अन्य चेरनॉफ़ सीमाओं के समान दृष्टिकोण का अनुसरण करता है, लेकिन क्षण उत्पन्न करने वाले कार्यों को बाध्य करने के लिए होएफ़डिंग की लेम्मा को लागू करता है (होएफ़डिंग की | चेर्नॉफ़ सीमाएं उनके वितरण की परवाह किए बिना, स्वतंत्र, बंधे हुए यादृच्छिक चर के सामान्य योगों पर भी लागू की जा सकती हैं; इसे होफ़डिंग की असमानता के रूप में जाना जाता है। प्रमाण अन्य चेरनॉफ़ सीमाओं के समान दृष्टिकोण का अनुसरण करता है, लेकिन क्षण उत्पन्न करने वाले कार्यों को बाध्य करने के लिए होएफ़डिंग की लेम्मा को लागू करता है (होएफ़डिंग की असम्भवता देखें)। | ||
: | :हेफ़ोडिंग की असम्भवता: मानें {{math|''X''<sub>1</sub>, ..., ''X<sub>n</sub>''}} [[सांख्यिकीय स्वतंत्रता]] यादृच्छिक चर हैं जो मान लेते हैं {{math|[a,b].}} होने देना {{mvar|X}} को उनके योग का दर्शाता है और {{math|''μ'' {{=}} E[''X'']}}उनके योग की अपेक्षित मान दर्शाता है। तब किसी भी <math>t>0</math>, | ||
::<math>\Pr (X \le \mu-t) < e^{-2t^2/(n(b-a)^2)},</math> | ::<math>\Pr (X \le \mu-t) < e^{-2t^2/(n(b-a)^2)},</math> | ||
::<math>\Pr (X \ge \mu+t) < e^{-2t^2/(n(b-a)^2)}.</math> | ::<math>\Pr (X \ge \mu+t) < e^{-2t^2/(n(b-a)^2)}.</math> | ||
== स्वतंत्र बर्नौली यादृच्छिक चर का योग == | == स्वतंत्र बर्नौली यादृच्छिक चर का योग == | ||
निम्न खंडों में दिए गए बर्नौली यादृच्छिक चरणिकाओं के लिए बाउंड, उस तथ्य का उपयोग करके निर्मित किए गए है कि बर्नौली यादृच्छिक चरणिका <math>X_i</math> के लिए, 1 होने की संभावना p होती है। | |||
:<math>\operatorname E \left[e^{t\cdot X_i} \right] = (1 - p) e^0 + p e^t = 1 + p (e^t -1) \leq e^{p (e^t - 1)}.</math> | :<math>\operatorname E \left[e^{t\cdot X_i} \right] = (1 - p) e^0 + p e^t = 1 + p (e^t -1) \leq e^{p (e^t - 1)}.</math> | ||
चेरनॉफ बाउंड के कई प्रकार हो सकते हैं: मूल्यमान के साथ तुलनात्मक त्रुटि को बाउंड करने वाला मूलभूत जोड़ने का रूप (जो वास्तविक त्रुटि पर बाउंड देता है) या अधिक व्यावहारिक गुणकारी रूप (जो त्रुटि को माध्य के प्रति संबंधित बाउंड करता है)। | |||
===गुणात्मक रूप (सापेक्ष त्रुटि)=== | ===गुणात्मक रूप (सापेक्ष त्रुटि)=== | ||
यदि {{math|''X''<sub>1</sub>, ..., ''X<sub>n</sub>''}} स्वतंत्र यादृच्छिक चरणिका हैं जो {{math|{0, 1}.}} मान लेते हैं, तो {{mvar|X}} को उनके योग का दर्शाता है औ {{math|''μ'' {{=}} E[''X'']}} योग की अपेक्षित मान दर्शाता है। तब किसी भी {{math|''δ'' > 0}} । के लिए, | |||
:<math>\Pr ( X \ge (1+\delta)\mu) < \left(\frac{e^\delta}{(1+\delta)^{1+\delta}}\right)^\mu.</math> | :<math>\Pr ( X \ge (1+\delta)\mu) < \left(\frac{e^\delta}{(1+\delta)^{1+\delta}}\right)^\mu.</math> | ||
यह दिखाने के लिए समान प्रमाण रणनीति का उपयोग | यह दिखाने के लिए समान प्रमाण रणनीति का उपयोग करके दिखाया जा सकता है कि {{math|0 < ''δ'' < 1}} के लिए, | ||
:<math>\Pr(X \le (1-\delta)\mu) < \left(\frac{e^{-\delta}}{(1-\delta)^{1-\delta}}\right)^\mu.</math> | :<math>\Pr(X \le (1-\delta)\mu) < \left(\frac{e^{-\delta}}{(1-\delta)^{1-\delta}}\right)^\mu.</math> | ||
उपरोक्त सूत्र अक्सर | उपरोक्त सूत्र अक्सर अव्यवस्थित होता है, इसलिए आधारभूत लेकिन अधिक सुविधाजनक बाउंड<ref name="MitzenmacherUpfal">{{cite book | url=https://books.google.com/books?id=0bAYl6d7hvkC | title=Probability and Computing: Randomized Algorithms and Probabilistic Analysis | publisher=Cambridge University Press |author1=Mitzenmacher, Michael |author2=Upfal, Eli | year=2005 | isbn=978-0-521-83540-4}}</ref> उपयोग किए जाते हैं, जो लॉगरिद्धि समानताओं की सूची से अवधारित असमानता <math>\textstyle\frac{2\delta}{2+\delta} \le \log(1+\delta)</math> का पालन करते हैं: | ||
:<math>\Pr( X \ge (1+\delta)\mu)\le e^{-\delta^2\mu/(2+\delta)}, \qquad 0 \le \delta,</math> | :<math>\Pr( X \ge (1+\delta)\mu)\le e^{-\delta^2\mu/(2+\delta)}, \qquad 0 \le \delta,</math> | ||
:<math>\Pr( X \le (1-\delta)\mu) \le e^{-\delta^2\mu/2}, \qquad 0 < \delta < 1,</math> | :<math>\Pr( X \le (1-\delta)\mu) \le e^{-\delta^2\mu/2}, \qquad 0 < \delta < 1,</math> | ||
:<math>\Pr( |X - \mu| \ge \delta\mu) \le 2e^{-\delta^2\mu/3}, \qquad 0 < \delta < 1.</math> | :<math>\Pr( |X - \mu| \ge \delta\mu) \le 2e^{-\delta^2\mu/3}, \qquad 0 < \delta < 1.</math> | ||
ध्यान दें कि | ध्यान दें कि ये बाउंड जीर्ण होते हैं जब <math>\delta = 0</math>। | ||
=== योगात्मक रूप (पूर्ण त्रुटि) === | === योगात्मक रूप (पूर्ण त्रुटि) === | ||
निम्नलिखित | निम्नलिखित प्रमाण [[वासिली होफ़डिंग]] के द्वारा है और इसलिए इसे चेरनॉफ-हेफोडिंग प्रमाण कहा जाता है।<ref>{{cite journal | ||
|last1=Hoeffding |first1=W. | |last1=Hoeffding |first1=W. | ||
|year=1963 | |year=1963 | ||
Line 138: | Line 145: | ||
|jstor=2282952 | |jstor=2282952 | ||
|url=http://repository.lib.ncsu.edu/bitstream/1840.4/2170/1/ISMS_1962_326.pdf | |url=http://repository.lib.ncsu.edu/bitstream/1840.4/2170/1/ISMS_1962_326.pdf | ||
}}</ref> | }}</ref> | ||
::<math>\begin{align} | :चेरनॉफ-हेफोडिंग प्रमाण: मानें {{math|''X''<sub>1</sub>, ..., ''X<sub>n</sub>''}} i.i.d. यादृच्छिक चरणिका हैं, जो{{math|{0, 1}.}} मान लेते हैं। {{math|''p'' {{=}} E[''X''<sub>1</sub>]}} और {{math|''ε'' > 0}} हों।. | ||
:<math>\begin{align} | |||
\Pr \left (\frac{1}{n} \sum X_i \geq p + \varepsilon \right ) \leq \left (\left (\frac{p}{p + \varepsilon}\right )^{p+\varepsilon} {\left (\frac{1 - p}{1-p- \varepsilon}\right )}^{1 - p- \varepsilon}\right )^n &= e^{-D(p+\varepsilon\parallel p) n} \\ | \Pr \left (\frac{1}{n} \sum X_i \geq p + \varepsilon \right ) \leq \left (\left (\frac{p}{p + \varepsilon}\right )^{p+\varepsilon} {\left (\frac{1 - p}{1-p- \varepsilon}\right )}^{1 - p- \varepsilon}\right )^n &= e^{-D(p+\varepsilon\parallel p) n} \\ | ||
\Pr \left (\frac{1}{n} \sum X_i \leq p - \varepsilon \right ) \leq \left (\left (\frac{p}{p - \varepsilon}\right )^{p-\varepsilon} {\left (\frac{1 - p}{1-p+ \varepsilon}\right )}^{1 - p+ \varepsilon}\right )^n &= e^{-D(p-\varepsilon\parallel p) n} | \Pr \left (\frac{1}{n} \sum X_i \leq p - \varepsilon \right ) \leq \left (\left (\frac{p}{p - \varepsilon}\right )^{p-\varepsilon} {\left (\frac{1 - p}{1-p+ \varepsilon}\right )}^{1 - p+ \varepsilon}\right )^n &= e^{-D(p-\varepsilon\parallel p) n} | ||
\end{align}</math> | \end{align}</math>जहाँ | ||
::<math> D(x\parallel y) = x \ln \frac{x}{y} + (1-x) \ln \left (\frac{1-x}{1-y} \right )</math> | ::<math> D(x\parallel y) = x \ln \frac{x}{y} + (1-x) \ln \left (\frac{1-x}{1-y} \right )</math> | ||
:क्रमशः पैरामीटर x और y के साथ [[बर्नौली वितरण]] यादृच्छिक चर के बीच कुल्बैक-लीबलर विचलन है। यदि {{math|''p'' ≥ {{sfrac|1|2}},}} | :क्रमशः पैरामीटर x और y के साथ [[बर्नौली वितरण]] यादृच्छिक चर के बीच कुल्बैक-लीबलर विचलन है। यदि {{math|''p'' ≥ {{sfrac|1|2}},}} है, तो <math>D(p+\varepsilon\parallel p)\ge \tfrac{\varepsilon^2}{2p(1-p)}</math> है, जिसका अर्थ है | ||
::<math> \Pr\left ( \frac{1}{n}\sum X_i>p+x \right ) \leq \exp \left (-\frac{x^2n}{2p(1-p)} \right ).</math> | ::<math> \Pr\left ( \frac{1}{n}\sum X_i>p+x \right ) \leq \exp \left (-\frac{x^2n}{2p(1-p)} \right ).</math> | ||
इसके साथ सुगम बाउंड {{math|''D''(''p'' + ''ε'' {{!!}} ''p'') ≥ 2''ε''<sup>2</sup>}}, का उपयोग करके, जो {{math|''D''(''p'' + ''ε'' {{!!}} ''p'')}} की उत्तलता और तथ्य के कारण से होता है | |||
:<math>\frac{d^2}{d\varepsilon^2} D(p+\varepsilon\parallel p) = \frac{1}{(p+\varepsilon)(1-p-\varepsilon) } \geq 4 =\frac{d^2}{d\varepsilon^2}(2\varepsilon^2).</math> | :<math>\frac{d^2}{d\varepsilon^2} D(p+\varepsilon\parallel p) = \frac{1}{(p+\varepsilon)(1-p-\varepsilon) } \geq 4 =\frac{d^2}{d\varepsilon^2}(2\varepsilon^2).</math> | ||
यह परिणाम होफ़डिंग की असमानता का विशेष मामला है। कभी-कभी, | यह परिणाम होफ़डिंग की असमानता का विशेष मामला है। कभी-कभी, बाउंड्स | ||
:<math> | :<math> | ||
Line 164: | Line 169: | ||
\end{align} | \end{align} | ||
</math> | </math> | ||
जो | जो {{math|''p'' < {{sfrac|1|8}},}} के लिए मजबूत हैं, भी इस्तेमाल किए जाते हैं। | ||
==अनुप्रयोग== | ==अनुप्रयोग== | ||
[[विरल ग्राफ]] | [[विरल ग्राफ]] नेटवर्क में सेट संतुलन और [[पैकेट (सूचना प्रौद्योगिकी)]] [[मार्ग]] में चेर्नॉफ़ सीमा के बहुत उपयोगी अनुप्रयोग हैं। | ||
सांख्यिकीय प्रयोगों को डिज़ाइन करते समय सेट संतुलन की समस्या उत्पन्न होती है। आम तौर पर सांख्यिकीय प्रयोग को डिजाइन करते समय, प्रयोग में प्रत्येक भागीदार की विशेषताओं को देखते हुए, हमें यह जानना होगा कि प्रतिभागियों को 2 असंयुक्त समूहों में कैसे विभाजित किया जाए ताकि प्रत्येक विशेषता दोनों समूहों के बीच यथासंभव संतुलित हो।<ref name="0bAYl6d7hvkC">Refer to this [https://books.google.com/books?id=0bAYl6d7hvkC&pg=PA71 book section] for more info on the problem.</ref> | सांख्यिकीय प्रयोगों को डिज़ाइन करते समय सेट संतुलन की समस्या उत्पन्न होती है। आम तौर पर सांख्यिकीय प्रयोग को डिजाइन करते समय, प्रयोग में प्रत्येक भागीदार की विशेषताओं को देखते हुए, हमें यह जानना होगा कि प्रतिभागियों को 2 असंयुक्त समूहों में कैसे विभाजित किया जाए ताकि प्रत्येक विशेषता दोनों समूहों के बीच यथासंभव संतुलित हो।<ref name="0bAYl6d7hvkC">Refer to this [https://books.google.com/books?id=0bAYl6d7hvkC&pg=PA71 book section] for more info on the problem.</ref> | ||
Line 227: | Line 232: | ||
चेर्नॉफ़ के बाउंड का निम्नलिखित संस्करण प्रयोग किया जा सकता है जो आवदेन परिभाषित करने के लिए उपयुक्त है, जिसमें जनसंख्या में बहुमत नमूने में अल्पसंख्यक बन जाएगा, या इसके विपरीत।<ref>{{Cite book | doi = 10.1007/3-540-44676-1_35| chapter = Competitive Auctions for Multiple Digital Goods| title = Algorithms — ESA 2001| volume = 2161| pages = 416| series = Lecture Notes in Computer Science| year = 2001| last1 = Goldberg | first1 = A. V. | last2 = Hartline | first2 = J. D. | isbn = 978-3-540-42493-2| citeseerx = 10.1.1.8.5115}}; lemma 6.1</ref> | चेर्नॉफ़ के बाउंड का निम्नलिखित संस्करण प्रयोग किया जा सकता है जो आवदेन परिभाषित करने के लिए उपयुक्त है, जिसमें जनसंख्या में बहुमत नमूने में अल्पसंख्यक बन जाएगा, या इसके विपरीत।<ref>{{Cite book | doi = 10.1007/3-540-44676-1_35| chapter = Competitive Auctions for Multiple Digital Goods| title = Algorithms — ESA 2001| volume = 2161| pages = 416| series = Lecture Notes in Computer Science| year = 2001| last1 = Goldberg | first1 = A. V. | last2 = Hartline | first2 = J. D. | isbn = 978-3-540-42493-2| citeseerx = 10.1.1.8.5115}}; lemma 6.1</ref> | ||
मान लीजिये कि सामान्य जनसंख्या A है और उप-जनसंख्या B ⊆ A है। उप-जनसंख्या का सापेक्षिक आकार | मान लीजिये कि सामान्य जनसंख्या A है और उप-जनसंख्या B ⊆ A है। उप-जनसंख्या का सापेक्षिक आकार (|''B''|/|''A''|) को r से चिह्नित करता है। | ||
मान लीजिए कि हम पूर्णांक k और यादृच्छिक नमूना S ⊂ A चुनते हैं, जिसका आकार k है। नमूने में उप-जनसंख्या का सापेक्षिक आकार (|''B''∩''S''|/|''S''|) को ''r<sub>S</sub>'' से चिह्नित करते है। | मान लीजिए कि हम पूर्णांक k और यादृच्छिक नमूना S ⊂ A चुनते हैं, जिसका आकार k है। नमूने में उप-जनसंख्या का सापेक्षिक आकार (|''B''∩''S''|/|''S''|) को ''r<sub>S</sub>'' से चिह्नित करते है। | ||
Line 236: | Line 241: | ||
विशेष रूप से, यदि B A में बहुमत है (अर्थात् r > 0.5) तो हम निम्नलिखित लेकर बाउंड कर सकते हैं कि B S में अधिकांश रहेगा ''S''(''r<sub>S</sub>'' > 0.5):''d'' = 1 − 1/(2''r''): <ref>See graphs of: [https://www.desmos.com/calculator/eqvyjug0re the bound as a function of ''r'' when ''k'' changes] and [https://www.desmos.com/calculator/nxurzg7bqj the bound as a function of ''k'' when ''r'' changes].</ref> | विशेष रूप से, यदि B A में बहुमत है (अर्थात् r > 0.5) तो हम निम्नलिखित लेकर बाउंड कर सकते हैं कि B S में अधिकांश रहेगा ''S''(''r<sub>S</sub>'' > 0.5):''d'' = 1 − 1/(2''r''): <ref>See graphs of: [https://www.desmos.com/calculator/eqvyjug0re the bound as a function of ''r'' when ''k'' changes] and [https://www.desmos.com/calculator/nxurzg7bqj the bound as a function of ''k'' when ''r'' changes].</ref> | ||
:<math>\Pr\left(r_S > 0.5\right) > 1 - \exp\left(-r\cdot \left(1 - \frac{1}{2 r}\right)^2 \cdot \frac k 2 \right)</math> | :<math>\Pr\left(r_S > 0.5\right) > 1 - \exp\left(-r\cdot \left(1 - \frac{1}{2 r}\right)^2 \cdot \frac k 2 \right)</math> | ||
यह बाउंड बिल्कुल सटीक नहीं है। उदाहरण के लिए, जब r = 0.5 ता है, हमें | यह बाउंड बिल्कुल सटीक नहीं है। उदाहरण के लिए, जब r = 0.5 ता है, हमें साधारण बाउंड प्राप्त होता है: Prob > 0। | ||
==प्रमाण== | ==प्रमाण== |
Revision as of 22:38, 13 July 2023
संभाव्यता सिद्धांत में, चेर्नॉफ़ बाउंड यादृच्छिक चर की पूंछ पर उसके क्षण उत्पन्न करने वाले फ़ंक्शन के आधार पर तेजी से घटती ऊपरी सीमा है। ऐसी सभी घातांकीय सीमाओं का न्यूनतम चेर्नॉफ़ या चेर्नॉफ़-क्रैमर बाउंड बनाता है, जो घातीय की तुलना में तेजी से क्षय हो सकता है (उदाहरण के लिए उप-गॉसियन वितरण|उप-गॉसियन)।[1][2] यह विशेष रूप से स्वतंत्र यादृच्छिक चर के योग के लिए उपयोगी है, जैसे बर्नौली यादृच्छिक चर का योग।[3][4]
इस बाउंड को आमतौर पर हरमन चेर्नॉफ़ के नाम पर जाना जाता है, जिन्होंने 1952 के पेपर में इस विधि का वर्णन किया था,[5] हालाँकि चेर्नॉफ़ ने इसे स्वयं हरमन रूबिन को समर्पित किया था।[6] 1938 में हराल्ड क्रामर ने लगभग इसी धारणा को प्रकाशित किया था, जिसे अब क्रामर का सिद्धांत के नाम से जाना जाता है।
यह मार्कोव की असमानता या चेबीशेव की असमानता जैसे पहले या दूसरे-क्षण-आधारित पूंछ सीमाओं की तुलना में तीव्र सीमा है, जो केवल पूंछ क्षय पर शक्ति-कानून सीमाएं उत्पन्न करती है। हालाँकि, जब चेर्नॉफ़ बाउंड को योगों पर लागू किया जाता है, तो चर को स्वतंत्र होने की आवश्यकता होती है, ऐसी स्थिति जो मार्कोव की असमानता या चेबीशेव की असमानता के लिए आवश्यक नहीं है (हालांकि चेबीशेव की असम्भवता को योग होने के लिए व्यक्तिगत रूप से आवश्यकता होती है)।
चेरनॉफ बाउंड बर्नस्टीन समीकरणों से संबंधित है। यह भी होफ्डिंग की असम्भवता, बेनेट की असम्भवता, और मैकडियर्मिड की असम्भवता को सिद्ध करने के लिए उपयोग किया जाता है।
जेनेरिक चेर्नॉफ़ सीमाएँ
यादृच्छिक प्रतिस्थान के लिए जनेरिक चेरनॉफ बाउंड को लागू करने के लिए, मार्कोव की असम्भवता को उपयोग करते हुए यह बाउंड मिलता है, इसे आवश्यकतानुसार एक्सपोनेंशियल मार्कोव या एक्सपोनेंशियल मोमेंट्स बाउंड भी कहा जाता है। इसके लिए, सकारात्मक के लिए हम का बाउंड प्राप्त करते हैं (इसी कारण इसे कभी-कभी एक्सपोनेंशियल मार्कोव या एक्सपोनेंशियल मोमेंट्स बाउंड कहा जाता है)। इस बाउंड के लिए, यदि सकारात्मक है, तो यह बाउंड देता है के दायां खंभे की ओर की सीमा, जिसे मायने के रूप में उसके मोमेंट-उत्पन्न कारक के साथ लिखा जा सकता है :
यह बाउंड हर सकारात्मक ,के लिए सत्य होता है, इसलिए हम सबसे निचला और उच्चतम को न्यूनतम मान ले सकते हैं:
इसी तरह के विश्लेषण को नकारात्मक के साथ करने से हम बाएं खंभे की समान बाउंड प्राप्त करते हैं:
और
मात्रा अपेक्षा मूल्य के रूप में व्यक्त किया जा सकता है , या समकालिक रूप में लिखा जा सकता है ।
गुण
घाती संख्या के लिए तार्किक समान लिया जा सकता है क्योंकि एक्सपोनेंशियल फ़ंक्शन अभिप्रेत है, इसलिए जेनसेन की असम्भाविता के अनुसार होता है। इससे यह प्राप्त होता है कि दायां खंभे की सीमा अवश्य हैं होता है जब ; उसी तरह, बाएं खंभे के लिए बाउंड उचित होता है जब । इसलिए हम दोनों infima को संयोजित कर सकते हैं और दो-तरफी चेरनॉफ बाउंड को परिभाषित कर सकते हैं .
दो-तरफी चेर्नॉफ़ बाउंड के लघुगणक को दर फ़ंक्शन (या क्रैमर ट्रांसफॉर्म) के रूप में जाना जाता है । यह लेजेन्ड्रे-फेन्चेल ट्रांसफॉर्मेशन के समतुल्य है|लेजेन्ड्रे-फेन्चेल ट्रांसफॉर्म या संचयी जनरेटिंग फ़ंक्शन का उत्तल संयुग्म , के रूप में परिभाषित:
यहां, मायने उत्पन्न करने के लिए कुम्युलेटिव उत्पन्न कारक फ़ंक्शन का लघुकरण अभिप्रेत है, इसलिए चेरनॉफ बाउंड लघुकरण होना चाहिए। चेरनॉफ बाउंड अपनी अधिकतम मान्यता आवश्यकता के समय प्राप्त करता है, , और अनुवर्तन के तहत समान होता है:.
चेरनॉफ बाउंड केवल तब सटीक होता है जब एकल केंद्रित भार (असमवितरित वितरण) होता है। यह बाउंड केवल सीमित संख्यात्मक मानों के परे या उसके सीमाओं में सत्य होता है, जहां अनंत के लिए निर्धारित होते हैं। असीमित संख्यात्मक मानों के लिए बाउंड कहीं भी सत्य नहीं होता है, हालांकि यह उप-घातीय कारकों (घातीय रूप से तंग) तक स्पर्शोन्मुख रूप से तंग है। व्यक्तिगत क्षण अधिक विश्लेषणात्मक जटिलता की कीमत पर, कड़ी सीमाएं प्रदान कर सकते हैं।[7]
व्यावहारिक रूप में, सटीक चेरनॉफ बाउंड को असामर्थ्यपूर्ण या विश्लेषणात्मक रूप से मूल्यांकित करना कठिन हो सकता है, जिसके परिणामस्वरूप प्रतीक्षित कुम्युलेटिव वितरण फ़ंक्शन के ऊपरी सीमा (या कुम्युलेटिव उत्पन्न कारक) के लिए उचित ऊपरी बाउंड प्रयोग किया जा सकता है (जैसे कि उप-उपवाकीय सीजीएफ जो उप-गौसिय चेरनॉफ बाउंड देता है)।
वितरण | ||||
---|---|---|---|---|
सामान्य वितरण | ||||
बर्नौली वितरण (नीचे विस्तृत) | ||||
मानक बर्नौली | ||||
रेडमेकर वितरण | ||||
गामा वितरण | ||||
ची-वर्ग वितरण | [8] | |||
पोइसन वितरण |
एमजीएफ से निचली सीमा
मात्रात्मक उत्पन्न कारक का उपयोग करके, डेली-जयग्मंद असम्भवता को , पर लागू करके, पूर्विक को कोण प्राप्त किया जा सकता है, जो खंभे की संभावनाओं पर निचला बाउंड प्रदान करता है:
थियोडोसोपोलोस[9] ने बाउंड का निर्माण किया (जो अधिक) जैसे एक्सपोनेंशियलघातीय झुकाव प्रक्रिया का उपयोग करके ज्यादा सत्य होता है।
विशेष (जैसे कि द्विपद वितरण) वितरणों के लिए, चेरनॉफ बाउंड के समान घातीय क्रम की निचली सीमाएं अक्सर उपलब्ध होती हैं।
स्वतंत्र यादृच्छिक चर का योग
जब X, n अलग-अलग औपचारिक क्रमिक चरणिका X1, ..., Xn, के n निर्दिष्ट निर्देशांकों का योग होता है, तो X का उत्पन्न कारक उत्पन्नकों के व्यक्तिगत उत्पन्नकों के गुणक का होता है, जिससे प्राप्त होता है:
-
(1)
और:
विशिष्ट चेर्नॉफ़ सीमाएँ क्षण-उत्पन्न करने वाले फ़ंक्शन की गणना करके प्राप्त की जाती हैं यादृच्छिक चर के विशिष्ट उदाहरणों के लिए .
जब यादृच्छिक निर्दिष्टानुसार भी अद्यतित रहते हैं (स्वतंत्र और समान रूप से वितरित यादृच्छिक चर),जब यादृच्छिक निर्दिष्टानुसार भी अद्यतित रहते हैं (आईआईडी), तो योग के लिए चेरनॉफ बाउंड को एकल चरणिक बाउंड का सरल पुनः-मापन मान लेते हैं। अर्थात, आईआईडी चरणिका योग के लिए चेरनॉफ बाउंड n वाली एकल चरणिका बाउंड की n वाली शक्ति के समान होती है (क्रामर का सिद्धांत देखें)।
स्वतंत्र परिबद्ध यादृच्छिक चरों का योग
चेर्नॉफ़ सीमाएं उनके वितरण की परवाह किए बिना, स्वतंत्र, बंधे हुए यादृच्छिक चर के सामान्य योगों पर भी लागू की जा सकती हैं; इसे होफ़डिंग की असमानता के रूप में जाना जाता है। प्रमाण अन्य चेरनॉफ़ सीमाओं के समान दृष्टिकोण का अनुसरण करता है, लेकिन क्षण उत्पन्न करने वाले कार्यों को बाध्य करने के लिए होएफ़डिंग की लेम्मा को लागू करता है (होएफ़डिंग की असम्भवता देखें)।
- हेफ़ोडिंग की असम्भवता: मानें X1, ..., Xn सांख्यिकीय स्वतंत्रता यादृच्छिक चर हैं जो मान लेते हैं [a,b]. होने देना X को उनके योग का दर्शाता है और μ = E[X]उनके योग की अपेक्षित मान दर्शाता है। तब किसी भी ,
स्वतंत्र बर्नौली यादृच्छिक चर का योग
निम्न खंडों में दिए गए बर्नौली यादृच्छिक चरणिकाओं के लिए बाउंड, उस तथ्य का उपयोग करके निर्मित किए गए है कि बर्नौली यादृच्छिक चरणिका के लिए, 1 होने की संभावना p होती है।
चेरनॉफ बाउंड के कई प्रकार हो सकते हैं: मूल्यमान के साथ तुलनात्मक त्रुटि को बाउंड करने वाला मूलभूत जोड़ने का रूप (जो वास्तविक त्रुटि पर बाउंड देता है) या अधिक व्यावहारिक गुणकारी रूप (जो त्रुटि को माध्य के प्रति संबंधित बाउंड करता है)।
गुणात्मक रूप (सापेक्ष त्रुटि)
यदि X1, ..., Xn स्वतंत्र यादृच्छिक चरणिका हैं जो {0, 1}. मान लेते हैं, तो X को उनके योग का दर्शाता है औ μ = E[X] योग की अपेक्षित मान दर्शाता है। तब किसी भी δ > 0 । के लिए,
यह दिखाने के लिए समान प्रमाण रणनीति का उपयोग करके दिखाया जा सकता है कि 0 < δ < 1 के लिए,
उपरोक्त सूत्र अक्सर अव्यवस्थित होता है, इसलिए आधारभूत लेकिन अधिक सुविधाजनक बाउंड[10] उपयोग किए जाते हैं, जो लॉगरिद्धि समानताओं की सूची से अवधारित असमानता का पालन करते हैं:
ध्यान दें कि ये बाउंड जीर्ण होते हैं जब ।
योगात्मक रूप (पूर्ण त्रुटि)
निम्नलिखित प्रमाण वासिली होफ़डिंग के द्वारा है और इसलिए इसे चेरनॉफ-हेफोडिंग प्रमाण कहा जाता है।[11]
- चेरनॉफ-हेफोडिंग प्रमाण: मानें X1, ..., Xn i.i.d. यादृच्छिक चरणिका हैं, जो{0, 1}. मान लेते हैं। p = E[X1] और ε > 0 हों।.
- जहाँ
- क्रमशः पैरामीटर x और y के साथ बर्नौली वितरण यादृच्छिक चर के बीच कुल्बैक-लीबलर विचलन है। यदि p ≥ 1/2, है, तो है, जिसका अर्थ है
इसके साथ सुगम बाउंड D(p + ε || p) ≥ 2ε2, का उपयोग करके, जो D(p + ε || p) की उत्तलता और तथ्य के कारण से होता है
यह परिणाम होफ़डिंग की असमानता का विशेष मामला है। कभी-कभी, बाउंड्स
जो p < 1/8, के लिए मजबूत हैं, भी इस्तेमाल किए जाते हैं।
अनुप्रयोग
विरल ग्राफ नेटवर्क में सेट संतुलन और पैकेट (सूचना प्रौद्योगिकी) मार्ग में चेर्नॉफ़ सीमा के बहुत उपयोगी अनुप्रयोग हैं।
सांख्यिकीय प्रयोगों को डिज़ाइन करते समय सेट संतुलन की समस्या उत्पन्न होती है। आम तौर पर सांख्यिकीय प्रयोग को डिजाइन करते समय, प्रयोग में प्रत्येक भागीदार की विशेषताओं को देखते हुए, हमें यह जानना होगा कि प्रतिभागियों को 2 असंयुक्त समूहों में कैसे विभाजित किया जाए ताकि प्रत्येक विशेषता दोनों समूहों के बीच यथासंभव संतुलित हो।[12] चेर्नॉफ़ सीमा का उपयोग क्रमपरिवर्तन रूटिंग समस्याओं के लिए तंग सीमा प्राप्त करने के लिए भी किया जाता है जो विरल नेटवर्क में पैकेट को रूट करते समय नेटवर्क संकुलन भीड़ को कम करता है।[12]
चेर्नॉफ़ सीमाओं का उपयोग कम्प्यूटेशनल शिक्षण सिद्धांत में यह साबित करने के लिए किया जाता है कि लर्निंग एल्गोरिदम संभवतः लगभग सही लर्निंग है, अर्थात् उच्च संभावना के साथ एल्गोरिदम में पर्याप्त बड़े प्रशिक्षण डेटा सेट पर छोटी त्रुटि होती है।[13] यादृच्छिकरण के साथ इसके गड़बड़ी स्थान की खोज करके किसी एप्लिकेशन/एल्गोरिदम की मजबूती के स्तर का मूल्यांकन करने के लिए चेर्नॉफ़ सीमा का प्रभावी ढंग से उपयोग किया जा सकता है।[14] चेर्नॉफ़ बाउंड का उपयोग किसी को मजबूत - और अधिकतर अवास्तविक - छोटी गड़बड़ी परिकल्पना (परटर्बेशन परिमाण छोटा है) को त्यागने की अनुमति देता है। मजबूती स्तर का उपयोग, बदले में, किसी विशिष्ट एल्गोरिथम विकल्प, हार्डवेयर कार्यान्वयन या किसी समाधान की उपयुक्तता को मान्य या अस्वीकार करने के लिए किया जा सकता है, जिसके संरचनात्मक पैरामीटर अनिश्चितताओं से प्रभावित होते हैं।
चेर्नॉफ़ सीमा का सरल और सामान्य उपयोग यादृच्छिक एल्गोरिदम को बढ़ावा देने के लिए है। यदि किसी के पास एल्गोरिदम है जो अनुमान लगाता है कि संभावना पी> 1/2 के साथ वांछित उत्तर है, तो कोई एल्गोरिदम चलाकर उच्च सफलता दर प्राप्त कर सकता है समय और अनुमान आउटपुट करना जो एल्गोरिदम के n/2 रन से अधिक आउटपुट है। (पिजनहोल सिद्धांत द्वारा ऐसे से अधिक अनुमान नहीं हो सकते हैं।) यह मानते हुए कि ये एल्गोरिदम रन स्वतंत्र हैं, n/2 से अधिक अनुमानों के सही होने की संभावना इस संभावना के बराबर है कि स्वतंत्र बर्नौली यादृच्छिक चर का योग Xk जो कि 1 है और प्रायिकता p, n/2 से अधिक है। ऐसा कम से कम करके तो दिखाया जा सकता है गुणक चेर्नॉफ़ बाउंड के माध्यम से (सिंक्लेयर के क्लास नोट्स में परिणाम 13.3, μ = np).[15]:
मैट्रिक्स चेर्नॉफ़ बाउंड
रूडोल्फ अहलस्वेड और एंड्रियास विंटर ने मैट्रिक्स-मूल्यवान यादृच्छिक चर के लिए चेर्नॉफ़ बाउंड पेश किया।[16] असमानता का निम्नलिखित संस्करण ट्रॉप के काम में पाया जा सकता है।[17]
होने देना M1, ..., Mt स्वतंत्र मैट्रिक्स मान वाले यादृच्छिक चर बनें और . आइए हम इसे निरूपित करें मैट्रिक्स का ऑपरेटर मानदंड . यदि लगभग सभी के लिए निश्चित रूप से धारण करता है , फिर प्रत्येक के लिए ε > 0
ध्यान दें कि यह निष्कर्ष निकालने के लिए कि 0 से विचलन परिबद्ध है ε उच्च संभावना के साथ, हमें कई नमूने चुनने की आवश्यकता है के लघुगणक के समानुपाती . सामान्य तौर पर, दुर्भाग्य से, पर निर्भरता अपरिहार्य है: उदाहरण के लिए आयाम का विकर्ण यादृच्छिक संकेत मैट्रिक्स लें . टी स्वतंत्र नमूनों के योग का ऑपरेटर मानदंड सटीक रूप से लंबाई टी के डी स्वतंत्र यादृच्छिक वॉक के बीच अधिकतम विचलन है। निरंतर संभावना के साथ अधिकतम विचलन पर निश्चित सीमा प्राप्त करने के लिए, यह देखना आसान है कि इस परिदृश्य में t को d के साथ लघुगणकीय रूप से बढ़ना चाहिए।[18]
आयामों पर निर्भरता से बचने के लिए, यह मानकर निम्नलिखित प्रमेय प्राप्त किया जा सकता है कि एम की रैंक निम्न है।
आयामों पर निर्भरता के बिना प्रमेय
मान ले 0 < ε < 1 हो और M यादृच्छिक सममित वास्तविक मैट्रिक्स हो जिसके लिए और होता है लगभग निश्चितता के साथ, मान लें कि M के समर्थन में प्रत्येक तत्व मानक r से अधिकतम अवर्ध होता है। सेट करें
यदि लगभग निश्चितता के साथ माना जाता है, तो
यहाँ M1, ..., Mt की i.i.d. प्रतिलिपियाँ हैं।
नमूना संस्करण
चेर्नॉफ़ के बाउंड का निम्नलिखित संस्करण प्रयोग किया जा सकता है जो आवदेन परिभाषित करने के लिए उपयुक्त है, जिसमें जनसंख्या में बहुमत नमूने में अल्पसंख्यक बन जाएगा, या इसके विपरीत।[19]
मान लीजिये कि सामान्य जनसंख्या A है और उप-जनसंख्या B ⊆ A है। उप-जनसंख्या का सापेक्षिक आकार (|B|/|A|) को r से चिह्नित करता है।
मान लीजिए कि हम पूर्णांक k और यादृच्छिक नमूना S ⊂ A चुनते हैं, जिसका आकार k है। नमूने में उप-जनसंख्या का सापेक्षिक आकार (|B∩S|/|S|) को rS से चिह्नित करते है।
फिर, प्रत्येक भिन्न d ∈ [0,1] के लिए:
विशेष रूप से, यदि B A में बहुमत है (अर्थात् r > 0.5) तो हम निम्नलिखित लेकर बाउंड कर सकते हैं कि B S में अधिकांश रहेगा S(rS > 0.5):d = 1 − 1/(2r): [20]
यह बाउंड बिल्कुल सटीक नहीं है। उदाहरण के लिए, जब r = 0.5 ता है, हमें साधारण बाउंड प्राप्त होता है: Prob > 0।
प्रमाण
गुणात्मक रूप
गुणक चेर्नॉफ़ बाउंड की शर्तों का पालन करते हुए, X1, ..., Xn स्वतंत्र बर्नौली यादृच्छिक चर है, जिसका योग X है, जहाँ प्रत्येक घटक को 1 होने की की प्रायिकता pi के बराबर होती है। बर्नौली चर के लिए:
इसलिए, (1) का उपयोग करते हुए, जहाँ और यहाँ है, और यहाँ है,
यदि हम t = log(1 + δ) सेट करें ताकि t > 0 हो (जब δ > 0 हो), तो हम स्थानापन्न सकते हैं और प्राप्त करते हैं
यह हमारी वांछित परिणाम को सिद्ध करता है।
चेर्नॉफ़-होफ़डिंग प्रमेय (योगात्मक रूप)
q = p + ε मानते हुए (1) में a = nq लेते हैं, हम प्राप्त करते हैं:
अब, Pr(Xi = 1) = p, Pr(Xi = 0) = 1 − p, होने के कारण हमें मिलता है
इसलिए, हम तुरंत त्रिगणित का उपयोग करके अन्तिम सीमा की गणना कर सकते हैं:
समीकरण को शून्य पर सेट करना और हल करना, हमारे पास है
ताकि
इस प्रकार,
q = p + ε > p, होने के कारण हम देखते हैं कि t > 0, इसलिए हमारा बाउंड t पर संतुष्ट होता है। t के लिए समीकरणों में वापस प्रविष्ट करने से हम पाते हैं:
अब हमारे पास अपना वांछित परिणाम है, यानी
व्यास्तिगत मामले के लिए प्रमाण को पूरा करने के लिए, हम सदर्भीय चर Yi = 1 − Xi को परिभाषित करते हैं , वही समान प्रमाण का इस्तेमाल करते हैं, और हमारे बाउंड में इसे प्लगइन करते हैं।
यह भी देखें
- बर्नस्टीन असमानताएँ (संभावना सिद्धांत)
- एकाग्रता असमानता - यादृच्छिक चर पर टेल-बाउंड का सारांश।
- क्रैमर प्रमेय (बड़े विचलन)|क्रैमर प्रमेय
- एंट्रोपिक मूल्य खतरे में है
- होफ़डिंग की असमानता
- मैट्रिक्स चेर्नॉफ़ बाध्य
- क्षण उत्पन्न करने वाला कार्य
संदर्भ
- ↑ Boucheron, Stéphane (2013). Concentration Inequalities: a Nonasymptotic Theory of Independence. Gábor Lugosi, Pascal Massart. Oxford: Oxford University Press. p. 21. ISBN 978-0-19-953525-5. OCLC 837517674.
- ↑ Wainwright, M. (January 22, 2015). "मूल पूंछ और एकाग्रता सीमाएँ" (PDF). Archived (PDF) from the original on 2016-05-08.
- ↑ Vershynin, Roman (2018). High-dimensional probability : an introduction with applications in data science. Cambridge, United Kingdom. p. 19. ISBN 978-1-108-41519-4. OCLC 1029247498.
{{cite book}}
: CS1 maint: location missing publisher (link) - ↑ Tropp, Joel A. (2015-05-26). "मैट्रिक्स एकाग्रता असमानताओं का एक परिचय". Foundations and Trends in Machine Learning (in English). 8 (1–2): 60. arXiv:1501.01571. doi:10.1561/2200000048. ISSN 1935-8237. S2CID 5679583.
- ↑ Chernoff, Herman (1952). "अवलोकनों के योग के आधार पर एक परिकल्पना के परीक्षण के लिए स्पर्शोन्मुख दक्षता का एक उपाय". The Annals of Mathematical Statistics. 23 (4): 493–507. doi:10.1214/aoms/1177729330. ISSN 0003-4851. JSTOR 2236576.
- ↑ Chernoff, Herman (2014). "A career in statistics" (PDF). In Lin, Xihong; Genest, Christian; Banks, David L.; Molenberghs, Geert; Scott, David W.; Wang, Jane-Ling (eds.). सांख्यिकी का अतीत, वर्तमान और भविष्य. CRC Press. p. 35. ISBN 9781482204964. Archived from the original (PDF) on 2015-02-11.
- ↑ Philips, Thomas K.; Nelson, Randolph (1995). "सकारात्मक पूंछ संभावनाओं के लिए बंधा हुआ क्षण चेर्नॉफ़ के बंधे से भी अधिक कठिन है". The American Statistician. 49 (2): 175–178. doi:10.2307/2684633. ISSN 0003-1305. JSTOR 2684633.
- ↑ Ghosh, Malay (2021-03-04). "Exponential Tail Bounds for Chisquared Random Variables". Journal of Statistical Theory and Practice (in English). 15 (2): 35. doi:10.1007/s42519-020-00156-x. ISSN 1559-8616.
- ↑ Theodosopoulos, Ted (2007-03-01). "चेर्नॉफ़ बाउंड का प्रत्यावर्तन". Statistics & Probability Letters (in English). 77 (5): 558–565. doi:10.1016/j.spl.2006.09.003. ISSN 0167-7152.
- ↑ Mitzenmacher, Michael; Upfal, Eli (2005). Probability and Computing: Randomized Algorithms and Probabilistic Analysis. Cambridge University Press. ISBN 978-0-521-83540-4.
- ↑ Hoeffding, W. (1963). "Probability Inequalities for Sums of Bounded Random Variables" (PDF). Journal of the American Statistical Association. 58 (301): 13–30. doi:10.2307/2282952. JSTOR 2282952.
- ↑ 12.0 12.1 Refer to this book section for more info on the problem.
- ↑ Kearns, M.; Vazirani, U. (1994). कम्प्यूटेशनल लर्निंग थ्योरी का एक परिचय. MIT Press. Chapter 9 (Appendix), pages 190–192. ISBN 0-262-11193-4.
- ↑ Alippi, C. (2014). "Randomized Algorithms". एंबेडेड सिस्टम के लिए इंटेलिजेंस. Springer. ISBN 978-3-319-05278-6.
- ↑ Sinclair, Alistair (Fall 2011). "पाठ्यक्रम "यादृच्छिकता और संगणना" के लिए कक्षा नोट्स" (PDF). Archived from the original (PDF) on 31 October 2014. Retrieved 30 October 2014.
- ↑ Ahlswede, R.; Winter, A. (2003). "Strong Converse for Identification via Quantum Channels". IEEE Transactions on Information Theory. 48 (3): 569–579. arXiv:quant-ph/0012127. doi:10.1109/18.985947. S2CID 523176.
- ↑ Tropp, J. (2010). "User-friendly tail bounds for sums of random matrices". Foundations of Computational Mathematics. 12 (4): 389–434. arXiv:1004.4389. doi:10.1007/s10208-011-9099-z. S2CID 17735965.
- ↑ Magen, A.; Zouzias, A. (2011). "निम्न रैंक मैट्रिक्स-मूल्यवान चेर्नॉफ़ बाउंड्स और अनुमानित मैट्रिक्स गुणन". arXiv:1005.2724 [cs.DM].
- ↑ Goldberg, A. V.; Hartline, J. D. (2001). "Competitive Auctions for Multiple Digital Goods". Algorithms — ESA 2001. Lecture Notes in Computer Science. Vol. 2161. p. 416. CiteSeerX 10.1.1.8.5115. doi:10.1007/3-540-44676-1_35. ISBN 978-3-540-42493-2.; lemma 6.1
- ↑ See graphs of: the bound as a function of r when k changes and the bound as a function of k when r changes.
अग्रिम पठन
- Chernoff, H. (1952). "A Measure of Asymptotic Efficiency for Tests of a Hypothesis Based on the sum of Observations". Annals of Mathematical Statistics. 23 (4): 493–507. doi:10.1214/aoms/1177729330. JSTOR 2236576. MR 0057518. Zbl 0048.11804.
- Chernoff, H. (1981). "A Note on an Inequality Involving the Normal Distribution". Annals of Probability. 9 (3): 533–535. doi:10.1214/aop/1176994428. JSTOR 2243541. MR 0614640. Zbl 0457.60014.
- Hagerup, T.; Rüb, C. (1990). "A guided tour of Chernoff bounds". Information Processing Letters. 33 (6): 305. doi:10.1016/0020-0190(90)90214-I.
- Nielsen, F. (2011). "An Information-Geometric Characterization of Chernoff Information". IEEE Signal Processing Letters. 20 (3): 269–272. arXiv:1102.2684. doi:10.1109/LSP.2013.2243726. S2CID 15034953.