चेर्नॉफ़ बाध्य: Difference between revisions
(Created page with "{{Short description|Exponentially decreasing bounds on tail distributions of random variables}} संभाव्यता सिद्धांत में, एक चे...") |
No edit summary |
||
Line 1: | Line 1: | ||
{{Short description|Exponentially decreasing bounds on tail distributions of random variables}} | {{Short description|Exponentially decreasing bounds on tail distributions of random variables}} | ||
संभाव्यता सिद्धांत में, | संभाव्यता सिद्धांत में, चेर्नॉफ़ बाउंड यादृच्छिक चर की पूंछ पर उसके क्षण उत्पन्न करने वाले फ़ंक्शन के आधार पर तेजी से घटती ऊपरी सीमा है। ऐसी सभी घातांकीय सीमाओं का न्यूनतम ''चेर्नॉफ़ या चेर्नॉफ़-क्रैमर बाउंड'' बनाता है, जो घातीय की तुलना में तेजी से क्षय हो सकता है (उदाहरण के लिए उप-गॉसियन वितरण|उप-गॉसियन)।<ref name="blm">{{Cite book|last=Boucheron|first=Stéphane|url=https://www.worldcat.org/oclc/837517674|title=Concentration Inequalities: a Nonasymptotic Theory of Independence|date=2013|publisher=Oxford University Press|others=Gábor Lugosi, Pascal Massart|isbn=978-0-19-953525-5|location=Oxford|page=21|oclc=837517674}}</ref><ref>{{Cite web|last=Wainwright|first=M.|date=January 22, 2015|title=मूल पूंछ और एकाग्रता सीमाएँ|url=https://www.stat.berkeley.edu/~mjwain/stat210b/Chap2_TailBounds_Jan22_2015.pdf|url-status=live|archive-url=https://web.archive.org/web/20160508170739/http://www.stat.berkeley.edu:80/~mjwain/stat210b/Chap2_TailBounds_Jan22_2015.pdf |archive-date=2016-05-08 }}</ref> यह विशेष रूप से स्वतंत्र यादृच्छिक चर के योग के लिए उपयोगी है, जैसे [[बर्नौली यादृच्छिक चर]] का योग।<ref>{{Cite book|last=Vershynin|first=Roman|url=https://www.worldcat.org/oclc/1029247498|title=High-dimensional probability : an introduction with applications in data science|date=2018|isbn=978-1-108-41519-4|location=Cambridge, United Kingdom|oclc=1029247498|page=19}}</ref><ref>{{Cite journal|last=Tropp|first=Joel A.|date=2015-05-26|title=मैट्रिक्स एकाग्रता असमानताओं का एक परिचय|url=https://www.nowpublishers.com/article/Details/MAL-048|journal=Foundations and Trends in Machine Learning|language=English|volume=8|issue=1–2|page=60|doi=10.1561/2200000048|arxiv=1501.01571|s2cid=5679583|issn=1935-8237}}</ref> | ||
बाउंड का नाम आमतौर पर [[हरमन चेर्नॉफ़]] के नाम पर रखा गया है जिन्होंने 1952 के पेपर में इस विधि का वर्णन किया था,<ref>{{Cite journal|last=Chernoff|first=Herman|date=1952|title=अवलोकनों के योग के आधार पर एक परिकल्पना के परीक्षण के लिए स्पर्शोन्मुख दक्षता का एक उपाय|journal=The Annals of Mathematical Statistics|volume=23|issue=4|pages=493–507|doi=10.1214/aoms/1177729330|jstor=2236576|issn=0003-4851|doi-access=free}}</ref> हालाँकि चेर्नॉफ़ ने स्वयं इसका श्रेय हरमन रुबिन को दिया।<ref>{{cite book | url=http://www.crcpress.com/product/isbn/9781482204964 | title=सांख्यिकी का अतीत, वर्तमान और भविष्य| chapter=A career in statistics | page=35 | publisher=CRC Press | last1=Chernoff | first1=Herman | editor-first1=Xihong | editor-last1=Lin | editor-first2=Christian | editor-last2=Genest | editor-first3=David L. | editor-last3=Banks | editor-first4=Geert | editor-last4=Molenberghs | editor-first5=David W. | editor-last5=Scott | editor-first6=Jane-Ling | editor-last6=Wang | editor6-link = Jane-Ling Wang| year=2014 | isbn=9781482204964 | archive-url=https://web.archive.org/web/20150211232731/https://nisla05.niss.org/copss/past-present-future-copss.pdf | archive-date=2015-02-11 | chapter-url=https://nisla05.niss.org/copss/past-present-future-copss.pdf}}</ref> 1938 में हेराल्ड क्रैमर ने लगभग समान अवधारणा प्रकाशित की थी जिसे अब क्रैमर प्रमेय (बड़े विचलन)|क्रैमर प्रमेय के रूप में जाना जाता है। | बाउंड का नाम आमतौर पर [[हरमन चेर्नॉफ़]] के नाम पर रखा गया है जिन्होंने 1952 के पेपर में इस विधि का वर्णन किया था,<ref>{{Cite journal|last=Chernoff|first=Herman|date=1952|title=अवलोकनों के योग के आधार पर एक परिकल्पना के परीक्षण के लिए स्पर्शोन्मुख दक्षता का एक उपाय|journal=The Annals of Mathematical Statistics|volume=23|issue=4|pages=493–507|doi=10.1214/aoms/1177729330|jstor=2236576|issn=0003-4851|doi-access=free}}</ref> हालाँकि चेर्नॉफ़ ने स्वयं इसका श्रेय हरमन रुबिन को दिया।<ref>{{cite book | url=http://www.crcpress.com/product/isbn/9781482204964 | title=सांख्यिकी का अतीत, वर्तमान और भविष्य| chapter=A career in statistics | page=35 | publisher=CRC Press | last1=Chernoff | first1=Herman | editor-first1=Xihong | editor-last1=Lin | editor-first2=Christian | editor-last2=Genest | editor-first3=David L. | editor-last3=Banks | editor-first4=Geert | editor-last4=Molenberghs | editor-first5=David W. | editor-last5=Scott | editor-first6=Jane-Ling | editor-last6=Wang | editor6-link = Jane-Ling Wang| year=2014 | isbn=9781482204964 | archive-url=https://web.archive.org/web/20150211232731/https://nisla05.niss.org/copss/past-present-future-copss.pdf | archive-date=2015-02-11 | chapter-url=https://nisla05.niss.org/copss/past-present-future-copss.pdf}}</ref> 1938 में हेराल्ड क्रैमर ने लगभग समान अवधारणा प्रकाशित की थी जिसे अब क्रैमर प्रमेय (बड़े विचलन)|क्रैमर प्रमेय के रूप में जाना जाता है। | ||
यह मार्कोव की असमानता या चेबीशेव की असमानता जैसे पहले या दूसरे-क्षण-आधारित पूंछ सीमाओं की तुलना में | यह मार्कोव की असमानता या चेबीशेव की असमानता जैसे पहले या दूसरे-क्षण-आधारित पूंछ सीमाओं की तुलना में तीव्र सीमा है, जो केवल पूंछ क्षय पर शक्ति-कानून सीमाएं उत्पन्न करती है। हालाँकि, जब चेर्नॉफ़ बाउंड को योगों पर लागू किया जाता है, तो चर को स्वतंत्र होने की आवश्यकता होती है, ऐसी स्थिति जो मार्कोव की असमानता या चेबीशेव की असमानता के लिए आवश्यक नहीं है (हालांकि चेबीशेव की असमानता के लिए चर को जोड़ीदार स्वतंत्र होने की आवश्यकता होती है)। | ||
चेर्नॉफ़ बाउंड बर्नस्टीन असमानताओं (संभावना सिद्धांत) से संबंधित है। इसका उपयोग होफ़डिंग की असमानता, बेनेट की असमानता और Doob_martingale#McDiarmid's_inequality|McDiarmid की असमानता को साबित करने के लिए भी किया जाता है। | चेर्नॉफ़ बाउंड बर्नस्टीन असमानताओं (संभावना सिद्धांत) से संबंधित है। इसका उपयोग होफ़डिंग की असमानता, बेनेट की असमानता और Doob_martingale#McDiarmid's_inequality|McDiarmid की असमानता को साबित करने के लिए भी किया जाता है। | ||
== जेनेरिक चेर्नॉफ़ सीमाएँ == | == जेनेरिक चेर्नॉफ़ सीमाएँ == | ||
[[File:Chernoff-bound.svg|thumb|दो-तरफा चेर्नॉफ़ [[ची-वर्ग वितरण]]|ची-वर्ग यादृच्छिक चर के लिए बाध्य है]]जेनेरिक चेर्नॉफ़ | [[File:Chernoff-bound.svg|thumb|दो-तरफा चेर्नॉफ़ [[ची-वर्ग वितरण]]|ची-वर्ग यादृच्छिक चर के लिए बाध्य है]]जेनेरिक चेर्नॉफ़ यादृच्छिक चर के लिए बाध्य है <math>X</math> मार्कोव की असमानता को लागू करने से प्राप्त होता है <math>e^{tX}</math> (यही कारण है कि इसे कभी-कभी घातीय मार्कोव या घातांकीय क्षण बाउंड भी कहा जाता है)। सकारात्मक के लिए <math>t</math> यह उत्तरजीविता कार्य पर बंधन देता है <math>X</math> इसके क्षण-उत्पादक कार्य के संदर्भ में <math>M(t) = \operatorname E (e^{t X})</math>: | ||
:<math>\operatorname P \left(X \geq a \right) = \operatorname P \left(e^{t X} \geq e^{t a}\right) \leq M(t) e^{-t a} \qquad (t > 0)</math> | :<math>\operatorname P \left(X \geq a \right) = \operatorname P \left(e^{t X} \geq e^{t a}\right) \leq M(t) e^{-t a} \qquad (t > 0)</math> | ||
Line 14: | Line 14: | ||
:<math>\operatorname P \left(X \geq a\right) \leq \inf_{t > 0} M(t) e^{-t a}</math> | :<math>\operatorname P \left(X \geq a\right) \leq \inf_{t > 0} M(t) e^{-t a}</math> | ||
नकारात्मक के साथ वही विश्लेषण करना <math>t</math> हमें संचयी वितरण फ़ंक्शन पर | नकारात्मक के साथ वही विश्लेषण करना <math>t</math> हमें संचयी वितरण फ़ंक्शन पर समान सीमा मिलती है: | ||
:<math>\operatorname P \left(X \leq a \right) = \operatorname P \left(e^{t X} \geq e^{t a}\right) \leq M(t) e^{-t a} \qquad (t < 0)</math> | :<math>\operatorname P \left(X \leq a \right) = \operatorname P \left(e^{t X} \geq e^{t a}\right) \leq M(t) e^{-t a} \qquad (t < 0)</math> | ||
और | और | ||
Line 25: | Line 25: | ||
घातांकीय फलन उत्तल है, इसलिए जेन्सेन की असमानता से <math>\operatorname E (e^{t X}) \ge e^{t \operatorname E (X)}</math>. इसका तात्पर्य यह है कि दाहिनी पूँछ पर बाउंड तुच्छ रूप से 1 के बराबर है <math>a \le \operatorname E (X)</math>; इसी प्रकार, बायीं सीमा भी तुच्छ है <math>a \ge \operatorname E (X)</math>. इसलिए हम दोनों इन्फिमा को जोड़ सकते हैं और दो-तरफा चेर्नॉफ़ बाउंड को परिभाषित कर सकते हैं:<math display="block">C(a) = \inf_{t} M(t) e^{-t a} </math>जो मुड़े हुए संचयी वितरण फ़ंक्शन पर ऊपरी सीमा प्रदान करता है <math>X</math> (माध्य पर मुड़ा हुआ, माध्यिका पर नहीं)। | घातांकीय फलन उत्तल है, इसलिए जेन्सेन की असमानता से <math>\operatorname E (e^{t X}) \ge e^{t \operatorname E (X)}</math>. इसका तात्पर्य यह है कि दाहिनी पूँछ पर बाउंड तुच्छ रूप से 1 के बराबर है <math>a \le \operatorname E (X)</math>; इसी प्रकार, बायीं सीमा भी तुच्छ है <math>a \ge \operatorname E (X)</math>. इसलिए हम दोनों इन्फिमा को जोड़ सकते हैं और दो-तरफा चेर्नॉफ़ बाउंड को परिभाषित कर सकते हैं:<math display="block">C(a) = \inf_{t} M(t) e^{-t a} </math>जो मुड़े हुए संचयी वितरण फ़ंक्शन पर ऊपरी सीमा प्रदान करता है <math>X</math> (माध्य पर मुड़ा हुआ, माध्यिका पर नहीं)। | ||
दो-तरफा चेर्नॉफ़ बाउंड के लघुगणक को [[दर समारोह]] (या क्रैमर ट्रांसफॉर्म) के रूप में जाना जाता है। <math>I = -\log C</math>. यह लेजेन्ड्रे-फेन्चेल ट्रांसफॉर्मेशन के समतुल्य है|लेजेन्ड्रे-फेन्चेल ट्रांसफॉर्म या [[संचयी जनरेटिंग फ़ंक्शन]] का [[उत्तल संयुग्म]] <math>K = \log M</math>, के रूप में परिभाषित: <math display="block">I(a) = \sup_{t} at - K(t) </math>मोमेंट-जेनरेटिंग_फंक्शन#महत्वपूर्ण_प्रॉपर्टीज लॉगरिदमिक रूप से उत्तल फ़ंक्शन|लॉग-उत्तल है, इसलिए उत्तल संयुग्म की | दो-तरफा चेर्नॉफ़ बाउंड के लघुगणक को [[दर समारोह]] (या क्रैमर ट्रांसफॉर्म) के रूप में जाना जाता है। <math>I = -\log C</math>. यह लेजेन्ड्रे-फेन्चेल ट्रांसफॉर्मेशन के समतुल्य है|लेजेन्ड्रे-फेन्चेल ट्रांसफॉर्म या [[संचयी जनरेटिंग फ़ंक्शन]] का [[उत्तल संयुग्म]] <math>K = \log M</math>, के रूप में परिभाषित: <math display="block">I(a) = \sup_{t} at - K(t) </math>मोमेंट-जेनरेटिंग_फंक्शन#महत्वपूर्ण_प्रॉपर्टीज लॉगरिदमिक रूप से उत्तल फ़ंक्शन|लॉग-उत्तल है, इसलिए उत्तल संयुग्म की संपत्ति के अनुसार, चेर्नॉफ बाउंड को लॉगरिदमिक रूप से अवतल फ़ंक्शन|लॉग-अवतल होना चाहिए। चेर्नॉफ़ सीमा माध्य पर अपनी अधिकतम सीमा प्राप्त कर लेती है, <math>C(\operatorname E(X))=1</math>, और अनुवाद के अंतर्गत अपरिवर्तनीय है: <math display="inline">C_{X+k}(a) = C_X(a - k) </math>. | ||
चेर्नॉफ़ सीमा सटीक है यदि और केवल यदि <math>X</math> | चेर्नॉफ़ सीमा सटीक है यदि और केवल यदि <math>X</math> एकल संकेंद्रित द्रव्यमान (अपक्षयी वितरण) है। बाउंड केवल बाउंड रैंडम वैरिएबल के चरम पर या उससे परे तंग होता है, जहां अनंत के लिए इन्फिमा प्राप्त होती है <math>t</math>. असंबद्ध यादृच्छिक चर के लिए सीमा कहीं भी तंग नहीं है, हालांकि यह उप-घातीय कारकों (घातीय रूप से तंग) तक स्पर्शोन्मुख रूप से तंग है। व्यक्तिगत क्षण अधिक विश्लेषणात्मक जटिलता की कीमत पर, कड़ी सीमाएं प्रदान कर सकते हैं।<ref>{{Cite journal |last1=Philips |first1=Thomas K. |last2=Nelson |first2=Randolph |date=1995 |title=सकारात्मक पूंछ संभावनाओं के लिए बंधा हुआ क्षण चेर्नॉफ़ के बंधे से भी अधिक कठिन है|url=https://www.jstor.org/stable/2684633 |journal=The American Statistician |volume=49 |issue=2 |pages=175–178 |doi=10.2307/2684633 |jstor=2684633 |issn=0003-1305}}</ref> | ||
व्यवहार में, सटीक चेर्नॉफ़ बाउंड विश्लेषणात्मक रूप से मूल्यांकन करने के लिए बोझिल या कठिन हो सकता है, ऐसी स्थिति में इसके बजाय क्षण (या क्यूम्युलेंट) उत्पन्न करने वाले फ़ंक्शन पर | व्यवहार में, सटीक चेर्नॉफ़ बाउंड विश्लेषणात्मक रूप से मूल्यांकन करने के लिए बोझिल या कठिन हो सकता है, ऐसी स्थिति में इसके बजाय क्षण (या क्यूम्युलेंट) उत्पन्न करने वाले फ़ंक्शन पर उपयुक्त ऊपरी बाउंड का उपयोग किया जा सकता है (उदाहरण के लिए उप-परवलयिक सीजीएफ जो उप-गॉसियन चेर्नॉफ़ बाउंड देता है) ). | ||
{| class="wikitable mw-collapsible" | {| class="wikitable mw-collapsible" | ||
|+Exact rate functions and Chernoff bounds for common distributions | |+Exact rate functions and Chernoff bounds for common distributions | ||
Line 83: | Line 83: | ||
=== एमजीएफ से निचली सीमा === | === एमजीएफ से निचली सीमा === | ||
केवल क्षण उत्पन्न करने वाले फ़ंक्शन का उपयोग करके, पाले-ज़िगमंड असमानता को लागू करके पूंछ संभावनाओं पर | केवल क्षण उत्पन्न करने वाले फ़ंक्शन का उपयोग करके, पाले-ज़िगमंड असमानता को लागू करके पूंछ संभावनाओं पर निचली सीमा प्राप्त की जा सकती है। <math>e^{tX}</math>, उपज: <math display="block">\operatorname P \left(X > a\right) \geq \sup_{t > 0 \and M(t) \geq e^{ta}} \left( 1 - \frac{e^{ta}}{M(t)} \right)^2 \frac{M(t)^2}{M(2t)}</math>(नकारात्मक के लिए बाईं पूंछ पर बाउंड प्राप्त किया जाता है <math>t</math>). हालाँकि, चेर्नॉफ़ बाउंड के विपरीत, यह परिणाम तेजी से तंग नहीं है। | ||
थियोडोसोपोलोस<ref>{{Cite journal |last=Theodosopoulos |first=Ted |date=2007-03-01 |title=चेर्नॉफ़ बाउंड का प्रत्यावर्तन|url=https://www.sciencedirect.com/science/article/pii/S0167715206002884 |journal=Statistics & Probability Letters |language=en |volume=77 |issue=5 |pages=558–565 |doi=10.1016/j.spl.2006.09.003 |issn=0167-7152}}</ref> [[घातीय झुकाव]] प्रक्रिया का उपयोग करके | थियोडोसोपोलोस<ref>{{Cite journal |last=Theodosopoulos |first=Ted |date=2007-03-01 |title=चेर्नॉफ़ बाउंड का प्रत्यावर्तन|url=https://www.sciencedirect.com/science/article/pii/S0167715206002884 |journal=Statistics & Probability Letters |language=en |volume=77 |issue=5 |pages=558–565 |doi=10.1016/j.spl.2006.09.003 |issn=0167-7152}}</ref> [[घातीय झुकाव]] प्रक्रिया का उपयोग करके तंग (एर) एमजीएफ-आधारित निचली सीमा का निर्माण किया गया। | ||
विशेष वितरणों (जैसे कि [[द्विपद वितरण]]) के लिए चेरनॉफ बाउंड के समान घातीय क्रम की निचली सीमाएं अक्सर उपलब्ध होती हैं। | विशेष वितरणों (जैसे कि [[द्विपद वितरण]]) के लिए चेरनॉफ बाउंड के समान घातीय क्रम की निचली सीमाएं अक्सर उपलब्ध होती हैं। | ||
Line 99: | Line 99: | ||
विशिष्ट चेर्नॉफ़ सीमाएँ क्षण-उत्पन्न करने वाले फ़ंक्शन की गणना करके प्राप्त की जाती हैं <math>\operatorname E \left[e^{-t\cdot X_i} \right ]</math> यादृच्छिक चर के विशिष्ट उदाहरणों के लिए <math>X_i</math>. | विशिष्ट चेर्नॉफ़ सीमाएँ क्षण-उत्पन्न करने वाले फ़ंक्शन की गणना करके प्राप्त की जाती हैं <math>\operatorname E \left[e^{-t\cdot X_i} \right ]</math> यादृच्छिक चर के विशिष्ट उदाहरणों के लिए <math>X_i</math>. | ||
जब यादृच्छिक चर भी समान रूप से वितरित किए जाते हैं ([[स्वतंत्र और समान रूप से वितरित यादृच्छिक चर]]), तो योग के लिए बाध्य चेर्नॉफ़ एकल-चर चेर्नॉफ़ सीमा के | जब यादृच्छिक चर भी समान रूप से वितरित किए जाते हैं ([[स्वतंत्र और समान रूप से वितरित यादृच्छिक चर]]), तो योग के लिए बाध्य चेर्नॉफ़ एकल-चर चेर्नॉफ़ सीमा के सरल पुनर्मूल्यांकन में कम हो जाता है। अर्थात्, n iid चर के औसत के लिए बाध्य चेर्नॉफ़ एकल चर पर बंधे चेर्नोफ़ की nवीं शक्ति के बराबर है (देखें क्रैमर प्रमेय (बड़े विचलन) | क्रैमर प्रमेय)। | ||
== स्वतंत्र परिबद्ध यादृच्छिक चरों का योग == | == स्वतंत्र परिबद्ध यादृच्छिक चरों का योग == | ||
Line 114: | Line 114: | ||
:<math>\operatorname E \left[e^{t\cdot X_i} \right] = (1 - p) e^0 + p e^t = 1 + p (e^t -1) \leq e^{p (e^t - 1)}.</math> | :<math>\operatorname E \left[e^{t\cdot X_i} \right] = (1 - p) e^0 + p e^t = 1 + p (e^t -1) \leq e^{p (e^t - 1)}.</math> | ||
कोई भी चेर्नॉफ़ सीमा के कई स्वादों का सामना कर सकता है: मूल योगात्मक रूप (जो अनुमान त्रुटि पर | कोई भी चेर्नॉफ़ सीमा के कई स्वादों का सामना कर सकता है: मूल योगात्मक रूप (जो अनुमान त्रुटि पर सीमा देता है) या अधिक व्यावहारिक गुणात्मक रूप (जो अनुमान त्रुटि को माध्य तक सीमित करता है)। | ||
===गुणात्मक रूप (सापेक्ष त्रुटि)=== | ===गुणात्मक रूप (सापेक्ष त्रुटि)=== | ||
गुणक चेर्नॉफ़ बाध्य। कल्पना करना {{math|''X''<sub>1</sub>, ..., ''X<sub>n</sub>''}} सांख्यिकीय स्वतंत्रता यादृच्छिक चर हैं जो मान लेते हैं {{math|{0, 1}.}} होने देना {{mvar|X}} उनके योग को निरूपित करें और जाने दें {{math|''μ'' {{=}} E[''X'']}} योग के अपेक्षित मूल्य को निरूपित करें। फिर किसी के लिए {{math|''δ'' > 0}}, | गुणक चेर्नॉफ़ बाध्य। कल्पना करना {{math|''X''<sub>1</sub>, ..., ''X<sub>n</sub>''}} सांख्यिकीय स्वतंत्रता यादृच्छिक चर हैं जो मान लेते हैं {{math|{0, 1}.}} होने देना {{mvar|X}} उनके योग को निरूपित करें और जाने दें {{math|''μ'' {{=}} E[''X'']}} योग के अपेक्षित मूल्य को निरूपित करें। फिर किसी के लिए {{math|''δ'' > 0}}, | ||
:<math>\Pr ( X \ge (1+\delta)\mu) < \left(\frac{e^\delta}{(1+\delta)^{1+\delta}}\right)^\mu.</math> | :<math>\Pr ( X \ge (1+\delta)\mu) < \left(\frac{e^\delta}{(1+\delta)^{1+\delta}}\right)^\mu.</math> | ||
यह दिखाने के लिए | यह दिखाने के लिए समान प्रमाण रणनीति का उपयोग किया जा सकता है {{math|0 < ''δ'' < 1}} | ||
:<math>\Pr(X \le (1-\delta)\mu) < \left(\frac{e^{-\delta}}{(1-\delta)^{1-\delta}}\right)^\mu.</math> | :<math>\Pr(X \le (1-\delta)\mu) < \left(\frac{e^{-\delta}}{(1-\delta)^{1-\delta}}\right)^\mu.</math> | ||
Line 152: | Line 152: | ||
::<math> \Pr\left ( \frac{1}{n}\sum X_i>p+x \right ) \leq \exp \left (-\frac{x^2n}{2p(1-p)} \right ).</math> | ::<math> \Pr\left ( \frac{1}{n}\sum X_i>p+x \right ) \leq \exp \left (-\frac{x^2n}{2p(1-p)} \right ).</math> | ||
प्रमेय का उपयोग करके आराम करने से | प्रमेय का उपयोग करके आराम करने से सरल बंधन बनता है {{math|''D''(''p'' + ''ε'' {{!!}} ''p'') ≥ 2''ε''<sup>2</sup>}}, जो के उत्तल फलन से अनुसरण करता है {{math|''D''(''p'' + ''ε'' {{!!}} ''p'')}} और तथ्य यह है कि | ||
:<math>\frac{d^2}{d\varepsilon^2} D(p+\varepsilon\parallel p) = \frac{1}{(p+\varepsilon)(1-p-\varepsilon) } \geq 4 =\frac{d^2}{d\varepsilon^2}(2\varepsilon^2).</math> | :<math>\frac{d^2}{d\varepsilon^2} D(p+\varepsilon\parallel p) = \frac{1}{(p+\varepsilon)(1-p-\varepsilon) } \geq 4 =\frac{d^2}{d\varepsilon^2}(2\varepsilon^2).</math> | ||
यह परिणाम होफ़डिंग की असमानता का | यह परिणाम होफ़डिंग की असमानता का विशेष मामला है। कभी-कभी, सीमा | ||
:<math> | :<math> | ||
Line 170: | Line 170: | ||
[[विरल ग्राफ]]़ नेटवर्क में सेट संतुलन और [[पैकेट (सूचना प्रौद्योगिकी)]] [[मार्ग]] में चेर्नॉफ़ सीमा के बहुत उपयोगी अनुप्रयोग हैं। | [[विरल ग्राफ]]़ नेटवर्क में सेट संतुलन और [[पैकेट (सूचना प्रौद्योगिकी)]] [[मार्ग]] में चेर्नॉफ़ सीमा के बहुत उपयोगी अनुप्रयोग हैं। | ||
सांख्यिकीय प्रयोगों को डिज़ाइन करते समय सेट संतुलन की समस्या उत्पन्न होती है। आम तौर पर | सांख्यिकीय प्रयोगों को डिज़ाइन करते समय सेट संतुलन की समस्या उत्पन्न होती है। आम तौर पर सांख्यिकीय प्रयोग को डिजाइन करते समय, प्रयोग में प्रत्येक भागीदार की विशेषताओं को देखते हुए, हमें यह जानना होगा कि प्रतिभागियों को 2 असंयुक्त समूहों में कैसे विभाजित किया जाए ताकि प्रत्येक विशेषता दोनों समूहों के बीच यथासंभव संतुलित हो।<ref name="0bAYl6d7hvkC">Refer to this [https://books.google.com/books?id=0bAYl6d7hvkC&pg=PA71 book section] for more info on the problem.</ref> | ||
चेर्नॉफ़ सीमा का उपयोग क्रमपरिवर्तन रूटिंग समस्याओं के लिए तंग सीमा प्राप्त करने के लिए भी किया जाता है जो विरल नेटवर्क में पैकेट को रूट करते समय [[नेटवर्क संकुलन]] भीड़ को कम करता है।<ref name="0bAYl6d7hvkC" /> | चेर्नॉफ़ सीमा का उपयोग क्रमपरिवर्तन रूटिंग समस्याओं के लिए तंग सीमा प्राप्त करने के लिए भी किया जाता है जो विरल नेटवर्क में पैकेट को रूट करते समय [[नेटवर्क संकुलन]] भीड़ को कम करता है।<ref name="0bAYl6d7hvkC" /> | ||
चेर्नॉफ़ सीमाओं का उपयोग [[कम्प्यूटेशनल शिक्षण सिद्धांत]] में यह साबित करने के लिए किया जाता है कि | चेर्नॉफ़ सीमाओं का उपयोग [[कम्प्यूटेशनल शिक्षण सिद्धांत]] में यह साबित करने के लिए किया जाता है कि लर्निंग एल्गोरिदम संभवतः लगभग सही लर्निंग है, यानी उच्च संभावना के साथ एल्गोरिदम में पर्याप्त बड़े प्रशिक्षण डेटा सेट पर छोटी त्रुटि होती है।<ref>{{cite book |first1=M. |last1=Kearns |first2=U. |last2=Vazirani |title=कम्प्यूटेशनल लर्निंग थ्योरी का एक परिचय|at=Chapter 9 (Appendix), pages 190–192 |publisher=MIT Press |year=1994 |isbn=0-262-11193-4 }}</ref> | ||
यादृच्छिकरण के साथ इसके गड़बड़ी स्थान की खोज करके किसी एप्लिकेशन/एल्गोरिदम की मजबूती के स्तर का मूल्यांकन करने के लिए चेर्नॉफ़ सीमा का प्रभावी ढंग से उपयोग किया जा सकता है।<ref name="Alippi2014">{{cite book |first=C. |last=Alippi |chapter=Randomized Algorithms |title=एंबेडेड सिस्टम के लिए इंटेलिजेंस|publisher=Springer |year=2014 |isbn=978-3-319-05278-6 }}</ref> | यादृच्छिकरण के साथ इसके गड़बड़ी स्थान की खोज करके किसी एप्लिकेशन/एल्गोरिदम की मजबूती के स्तर का मूल्यांकन करने के लिए चेर्नॉफ़ सीमा का प्रभावी ढंग से उपयोग किया जा सकता है।<ref name="Alippi2014">{{cite book |first=C. |last=Alippi |chapter=Randomized Algorithms |title=एंबेडेड सिस्टम के लिए इंटेलिजेंस|publisher=Springer |year=2014 |isbn=978-3-319-05278-6 }}</ref> | ||
चेर्नॉफ़ बाउंड का उपयोग किसी को मजबूत - और अधिकतर अवास्तविक - छोटी गड़बड़ी परिकल्पना (परटर्बेशन परिमाण छोटा है) को त्यागने की अनुमति देता है। मजबूती स्तर का उपयोग, बदले में, किसी विशिष्ट एल्गोरिथम विकल्प, हार्डवेयर कार्यान्वयन या किसी समाधान की उपयुक्तता को मान्य या अस्वीकार करने के लिए किया जा सकता है, जिसके संरचनात्मक पैरामीटर अनिश्चितताओं से प्रभावित होते हैं। | चेर्नॉफ़ बाउंड का उपयोग किसी को मजबूत - और अधिकतर अवास्तविक - छोटी गड़बड़ी परिकल्पना (परटर्बेशन परिमाण छोटा है) को त्यागने की अनुमति देता है। मजबूती स्तर का उपयोग, बदले में, किसी विशिष्ट एल्गोरिथम विकल्प, हार्डवेयर कार्यान्वयन या किसी समाधान की उपयुक्तता को मान्य या अस्वीकार करने के लिए किया जा सकता है, जिसके संरचनात्मक पैरामीटर अनिश्चितताओं से प्रभावित होते हैं। | ||
चेर्नॉफ़ सीमा का | चेर्नॉफ़ सीमा का सरल और सामान्य उपयोग [[यादृच्छिक एल्गोरिदम]] को बढ़ावा देने के लिए है। यदि किसी के पास एल्गोरिदम है जो अनुमान लगाता है कि संभावना पी> 1/2 के साथ वांछित उत्तर है, तो कोई एल्गोरिदम चलाकर उच्च सफलता दर प्राप्त कर सकता है <math>n = \log(1/\delta) 2p/(p - 1/2)^2</math> समय और अनुमान आउटपुट करना जो एल्गोरिदम के n/2 रन से अधिक आउटपुट है। (पिजनहोल सिद्धांत द्वारा ऐसे से अधिक अनुमान नहीं हो सकते हैं।) यह मानते हुए कि ये एल्गोरिदम रन स्वतंत्र हैं, n/2 से अधिक अनुमानों के सही होने की संभावना इस संभावना के बराबर है कि स्वतंत्र बर्नौली यादृच्छिक चर का योग {{math|''X<sub>k</sub>''}} जो कि 1 है और प्रायिकता p, n/2 से अधिक है। ऐसा कम से कम करके तो दिखाया जा सकता है <math>1-\delta</math> गुणक चेर्नॉफ़ बाउंड के माध्यम से (सिंक्लेयर के क्लास नोट्स में परिणाम 13.3, {{math|''μ'' {{=}} ''np''}}).<ref>{{Cite web|url = http://www.cs.berkeley.edu/~sinclair/cs271/n13.pdf|title = पाठ्यक्रम "यादृच्छिकता और संगणना" के लिए कक्षा नोट्स|date = Fall 2011|access-date = 30 October 2014|last = Sinclair|first = Alistair|archive-url = https://web.archive.org/web/20141031035717/http://www.cs.berkeley.edu/~sinclair/cs271/n13.pdf|archive-date = 31 October 2014|url-status = dead}}</ref>: | ||
:<math>\Pr\left[X > {n \over 2}\right] \ge 1 - e^{-n \left(p - 1/2 \right)^2/(2p)} \geq 1-\delta</math> | :<math>\Pr\left[X > {n \over 2}\right] \ge 1 - e^{-n \left(p - 1/2 \right)^2/(2p)} \geq 1-\delta</math> | ||
Line 185: | Line 185: | ||
{{main|Matrix Chernoff bound}} | {{main|Matrix Chernoff bound}} | ||
[[रूडोल्फ अहलस्वेड]] और [[एंड्रियास विंटर]] ने मैट्रिक्स-मूल्यवान यादृच्छिक चर के लिए | [[रूडोल्फ अहलस्वेड]] और [[एंड्रियास विंटर]] ने मैट्रिक्स-मूल्यवान यादृच्छिक चर के लिए चेर्नॉफ़ बाउंड पेश किया।<ref>{{cite journal | ||
|last1=Ahlswede |first1=R. | |last1=Ahlswede |first1=R. | ||
|last2=Winter |first2=A. | |last2=Winter |first2=A. | ||
Line 211: | Line 211: | ||
:<math>\Pr\left( \left\| \frac{1}{t} \sum_{i=1}^t M_i \right\| > \varepsilon \right) \leq (d_1+d_2) \exp \left( -\frac{3\varepsilon^2 t}{8\gamma^2} \right).</math> | :<math>\Pr\left( \left\| \frac{1}{t} \sum_{i=1}^t M_i \right\| > \varepsilon \right) \leq (d_1+d_2) \exp \left( -\frac{3\varepsilon^2 t}{8\gamma^2} \right).</math> | ||
ध्यान दें कि यह निष्कर्ष निकालने के लिए कि 0 से विचलन परिबद्ध है {{math|''ε''}} उच्च संभावना के साथ, हमें कई नमूने चुनने की आवश्यकता है <math>t </math> के लघुगणक के समानुपाती <math> d_1+d_2 </math>. सामान्य तौर पर, दुर्भाग्य से, पर निर्भरता | ध्यान दें कि यह निष्कर्ष निकालने के लिए कि 0 से विचलन परिबद्ध है {{math|''ε''}} उच्च संभावना के साथ, हमें कई नमूने चुनने की आवश्यकता है <math>t </math> के लघुगणक के समानुपाती <math> d_1+d_2 </math>. सामान्य तौर पर, दुर्भाग्य से, पर निर्भरता <math> \log(\min(d_1,d_2)) </math> अपरिहार्य है: उदाहरण के लिए आयाम का विकर्ण यादृच्छिक संकेत मैट्रिक्स लें <math>d\times d </math>. टी स्वतंत्र नमूनों के योग का ऑपरेटर मानदंड सटीक रूप से लंबाई टी के डी स्वतंत्र यादृच्छिक वॉक के बीच अधिकतम विचलन है। निरंतर संभावना के साथ अधिकतम विचलन पर निश्चित सीमा प्राप्त करने के लिए, यह देखना आसान है कि इस परिदृश्य में t को d के साथ लघुगणकीय रूप से बढ़ना चाहिए।<ref>{{cite arXiv |last1=Magen |first1=A.|author1-link=Avner Magen |last2=Zouzias |first2=A. |year=2011 |title=निम्न रैंक मैट्रिक्स-मूल्यवान चेर्नॉफ़ बाउंड्स और अनुमानित मैट्रिक्स गुणन|class=cs.DM |eprint=1005.2724 }}</ref> | ||
आयामों पर निर्भरता से बचने के लिए, यह मानकर निम्नलिखित प्रमेय प्राप्त किया जा सकता है कि एम की रैंक निम्न है। | आयामों पर निर्भरता से बचने के लिए, यह मानकर निम्नलिखित प्रमेय प्राप्त किया जा सकता है कि एम की रैंक निम्न है। | ||
===आयामों पर निर्भरता के बिना प्रमेय=== | ===आयामों पर निर्भरता के बिना प्रमेय=== | ||
होने देना {{math|0 < ''ε'' < 1}} और एम | होने देना {{math|0 < ''ε'' < 1}} और एम यादृच्छिक सममित वास्तविक मैट्रिक्स हो <math>\| \operatorname E[M] \| \leq 1 </math> और <math>\| M\| \leq \gamma </math> लगभग निश्चित रूप से. मान लें कि M के समर्थन पर प्रत्येक तत्व की अधिकतम रैंक r है। तय करना | ||
:<math> t = \Omega \left( \frac{\gamma\log (\gamma/\varepsilon^2)}{\varepsilon^2} \right).</math> | :<math> t = \Omega \left( \frac{\gamma\log (\gamma/\varepsilon^2)}{\varepsilon^2} \right).</math> | ||
अगर <math> r \leq t </math> तो फिर, लगभग निश्चित रूप से धारण करता है | अगर <math> r \leq t </math> तो फिर, लगभग निश्चित रूप से धारण करता है | ||
Line 225: | Line 225: | ||
चेर्नॉफ़ की सीमा के निम्नलिखित संस्करण का उपयोग इस संभावना को सीमित करने के लिए किया जा सकता है कि किसी नमूने में आबादी का बहुमत अल्पसंख्यक बन जाएगा, या इसके विपरीत।<ref>{{Cite book | doi = 10.1007/3-540-44676-1_35| chapter = Competitive Auctions for Multiple Digital Goods| title = Algorithms — ESA 2001| volume = 2161| pages = 416| series = Lecture Notes in Computer Science| year = 2001| last1 = Goldberg | first1 = A. V. | last2 = Hartline | first2 = J. D. | isbn = 978-3-540-42493-2| citeseerx = 10.1.1.8.5115}}; lemma 6.1</ref> | चेर्नॉफ़ की सीमा के निम्नलिखित संस्करण का उपयोग इस संभावना को सीमित करने के लिए किया जा सकता है कि किसी नमूने में आबादी का बहुमत अल्पसंख्यक बन जाएगा, या इसके विपरीत।<ref>{{Cite book | doi = 10.1007/3-540-44676-1_35| chapter = Competitive Auctions for Multiple Digital Goods| title = Algorithms — ESA 2001| volume = 2161| pages = 416| series = Lecture Notes in Computer Science| year = 2001| last1 = Goldberg | first1 = A. V. | last2 = Hartline | first2 = J. D. | isbn = 978-3-540-42493-2| citeseerx = 10.1.1.8.5115}}; lemma 6.1</ref> | ||
मान लीजिए कि | मान लीजिए कि सामान्य जनसंख्या A और उप-जनसंख्या B ⊆ A है। उप-जनसंख्या के सापेक्ष आकार (|B|/|A|) को r से चिह्नित करें। | ||
मान लीजिए कि हम | मान लीजिए कि हम पूर्णांक k और आकार k का यादृच्छिक नमूना S ⊂ A चुनते हैं। नमूने में उप-जनसंख्या के सापेक्ष आकार को r द्वारा चिह्नित करें (|B∩S|/|S|)<sub>S</sub>. | ||
फिर, प्रत्येक भिन्न d ∈ [0,1] के लिए: | फिर, प्रत्येक भिन्न d ∈ [0,1] के लिए: | ||
Line 234: | Line 234: | ||
विशेष रूप से, यदि बी ए में बहुमत है (यानी आर > 0.5) तो हम इस संभावना को सीमित कर सकते हैं कि बी एस (आर) में बहुमत रहेगा<sub>S</sub>> 0.5) लेकर: d = 1 − 1/(2r):<ref>See graphs of: [https://www.desmos.com/calculator/eqvyjug0re the bound as a function of ''r'' when ''k'' changes] and [https://www.desmos.com/calculator/nxurzg7bqj the bound as a function of ''k'' when ''r'' changes].</ref> | विशेष रूप से, यदि बी ए में बहुमत है (यानी आर > 0.5) तो हम इस संभावना को सीमित कर सकते हैं कि बी एस (आर) में बहुमत रहेगा<sub>S</sub>> 0.5) लेकर: d = 1 − 1/(2r):<ref>See graphs of: [https://www.desmos.com/calculator/eqvyjug0re the bound as a function of ''r'' when ''k'' changes] and [https://www.desmos.com/calculator/nxurzg7bqj the bound as a function of ''k'' when ''r'' changes].</ref> | ||
:<math>\Pr\left(r_S > 0.5\right) > 1 - \exp\left(-r\cdot \left(1 - \frac{1}{2 r}\right)^2 \cdot \frac k 2 \right)</math> | :<math>\Pr\left(r_S > 0.5\right) > 1 - \exp\left(-r\cdot \left(1 - \frac{1}{2 r}\right)^2 \cdot \frac k 2 \right)</math> | ||
निःसंदेह यह सीमा बिल्कुल भी कड़ी नहीं है। उदाहरण के लिए, जब r = 0.5 हमें | निःसंदेह यह सीमा बिल्कुल भी कड़ी नहीं है। उदाहरण के लिए, जब r = 0.5 हमें तुच्छ बाध्य संभावना > 0 मिलती है। | ||
==प्रमाण== | ==प्रमाण== |
Revision as of 19:02, 13 July 2023
संभाव्यता सिद्धांत में, चेर्नॉफ़ बाउंड यादृच्छिक चर की पूंछ पर उसके क्षण उत्पन्न करने वाले फ़ंक्शन के आधार पर तेजी से घटती ऊपरी सीमा है। ऐसी सभी घातांकीय सीमाओं का न्यूनतम चेर्नॉफ़ या चेर्नॉफ़-क्रैमर बाउंड बनाता है, जो घातीय की तुलना में तेजी से क्षय हो सकता है (उदाहरण के लिए उप-गॉसियन वितरण|उप-गॉसियन)।[1][2] यह विशेष रूप से स्वतंत्र यादृच्छिक चर के योग के लिए उपयोगी है, जैसे बर्नौली यादृच्छिक चर का योग।[3][4] बाउंड का नाम आमतौर पर हरमन चेर्नॉफ़ के नाम पर रखा गया है जिन्होंने 1952 के पेपर में इस विधि का वर्णन किया था,[5] हालाँकि चेर्नॉफ़ ने स्वयं इसका श्रेय हरमन रुबिन को दिया।[6] 1938 में हेराल्ड क्रैमर ने लगभग समान अवधारणा प्रकाशित की थी जिसे अब क्रैमर प्रमेय (बड़े विचलन)|क्रैमर प्रमेय के रूप में जाना जाता है।
यह मार्कोव की असमानता या चेबीशेव की असमानता जैसे पहले या दूसरे-क्षण-आधारित पूंछ सीमाओं की तुलना में तीव्र सीमा है, जो केवल पूंछ क्षय पर शक्ति-कानून सीमाएं उत्पन्न करती है। हालाँकि, जब चेर्नॉफ़ बाउंड को योगों पर लागू किया जाता है, तो चर को स्वतंत्र होने की आवश्यकता होती है, ऐसी स्थिति जो मार्कोव की असमानता या चेबीशेव की असमानता के लिए आवश्यक नहीं है (हालांकि चेबीशेव की असमानता के लिए चर को जोड़ीदार स्वतंत्र होने की आवश्यकता होती है)।
चेर्नॉफ़ बाउंड बर्नस्टीन असमानताओं (संभावना सिद्धांत) से संबंधित है। इसका उपयोग होफ़डिंग की असमानता, बेनेट की असमानता और Doob_martingale#McDiarmid's_inequality|McDiarmid की असमानता को साबित करने के लिए भी किया जाता है।
जेनेरिक चेर्नॉफ़ सीमाएँ
जेनेरिक चेर्नॉफ़ यादृच्छिक चर के लिए बाध्य है मार्कोव की असमानता को लागू करने से प्राप्त होता है (यही कारण है कि इसे कभी-कभी घातीय मार्कोव या घातांकीय क्षण बाउंड भी कहा जाता है)। सकारात्मक के लिए यह उत्तरजीविता कार्य पर बंधन देता है इसके क्षण-उत्पादक कार्य के संदर्भ में :
चूँकि यह सीमा हर सकारात्मक के लिए लागू होती है , हम सबसे निचला और उच्चतम ले सकते हैं:
नकारात्मक के साथ वही विश्लेषण करना हमें संचयी वितरण फ़ंक्शन पर समान सीमा मिलती है:
और
मात्रा अपेक्षा मूल्य के रूप में व्यक्त किया जा सकता है , या समकक्ष .
गुण
घातांकीय फलन उत्तल है, इसलिए जेन्सेन की असमानता से . इसका तात्पर्य यह है कि दाहिनी पूँछ पर बाउंड तुच्छ रूप से 1 के बराबर है ; इसी प्रकार, बायीं सीमा भी तुच्छ है . इसलिए हम दोनों इन्फिमा को जोड़ सकते हैं और दो-तरफा चेर्नॉफ़ बाउंड को परिभाषित कर सकते हैं:
दो-तरफा चेर्नॉफ़ बाउंड के लघुगणक को दर समारोह (या क्रैमर ट्रांसफॉर्म) के रूप में जाना जाता है। . यह लेजेन्ड्रे-फेन्चेल ट्रांसफॉर्मेशन के समतुल्य है|लेजेन्ड्रे-फेन्चेल ट्रांसफॉर्म या संचयी जनरेटिंग फ़ंक्शन का उत्तल संयुग्म , के रूप में परिभाषित:
चेर्नॉफ़ सीमा सटीक है यदि और केवल यदि एकल संकेंद्रित द्रव्यमान (अपक्षयी वितरण) है। बाउंड केवल बाउंड रैंडम वैरिएबल के चरम पर या उससे परे तंग होता है, जहां अनंत के लिए इन्फिमा प्राप्त होती है . असंबद्ध यादृच्छिक चर के लिए सीमा कहीं भी तंग नहीं है, हालांकि यह उप-घातीय कारकों (घातीय रूप से तंग) तक स्पर्शोन्मुख रूप से तंग है। व्यक्तिगत क्षण अधिक विश्लेषणात्मक जटिलता की कीमत पर, कड़ी सीमाएं प्रदान कर सकते हैं।[7] व्यवहार में, सटीक चेर्नॉफ़ बाउंड विश्लेषणात्मक रूप से मूल्यांकन करने के लिए बोझिल या कठिन हो सकता है, ऐसी स्थिति में इसके बजाय क्षण (या क्यूम्युलेंट) उत्पन्न करने वाले फ़ंक्शन पर उपयुक्त ऊपरी बाउंड का उपयोग किया जा सकता है (उदाहरण के लिए उप-परवलयिक सीजीएफ जो उप-गॉसियन चेर्नॉफ़ बाउंड देता है) ).
Distribution | ||||
---|---|---|---|---|
Normal distribution | ||||
Bernoulli distribution(detailed below) | ||||
Standard Bernoulli
(H is the binary entropy function) |
||||
Rademacher distribution | ||||
Gamma distribution | ||||
Chi-squared distribution | [8] | |||
Poisson distribution |
एमजीएफ से निचली सीमा
केवल क्षण उत्पन्न करने वाले फ़ंक्शन का उपयोग करके, पाले-ज़िगमंड असमानता को लागू करके पूंछ संभावनाओं पर निचली सीमा प्राप्त की जा सकती है। , उपज:
थियोडोसोपोलोस[9] घातीय झुकाव प्रक्रिया का उपयोग करके तंग (एर) एमजीएफ-आधारित निचली सीमा का निर्माण किया गया।
विशेष वितरणों (जैसे कि द्विपद वितरण) के लिए चेरनॉफ बाउंड के समान घातीय क्रम की निचली सीमाएं अक्सर उपलब्ध होती हैं।
स्वतंत्र यादृच्छिक चर का योग
कब X का योग है n स्वतंत्र यादृच्छिक चर X1, ..., Xn, का क्षण उत्पन्न करने वाला कार्य X व्यक्तिगत क्षण उत्पन्न करने वाले कार्यों का उत्पाद है, जो यह देता है:
-
(1)
और:
विशिष्ट चेर्नॉफ़ सीमाएँ क्षण-उत्पन्न करने वाले फ़ंक्शन की गणना करके प्राप्त की जाती हैं यादृच्छिक चर के विशिष्ट उदाहरणों के लिए .
जब यादृच्छिक चर भी समान रूप से वितरित किए जाते हैं (स्वतंत्र और समान रूप से वितरित यादृच्छिक चर), तो योग के लिए बाध्य चेर्नॉफ़ एकल-चर चेर्नॉफ़ सीमा के सरल पुनर्मूल्यांकन में कम हो जाता है। अर्थात्, n iid चर के औसत के लिए बाध्य चेर्नॉफ़ एकल चर पर बंधे चेर्नोफ़ की nवीं शक्ति के बराबर है (देखें क्रैमर प्रमेय (बड़े विचलन) | क्रैमर प्रमेय)।
स्वतंत्र परिबद्ध यादृच्छिक चरों का योग
चेर्नॉफ़ सीमाएं उनके वितरण की परवाह किए बिना, स्वतंत्र, बंधे हुए यादृच्छिक चर के सामान्य योगों पर भी लागू की जा सकती हैं; इसे होफ़डिंग की असमानता के रूप में जाना जाता है। प्रमाण अन्य चेरनॉफ़ सीमाओं के समान दृष्टिकोण का अनुसरण करता है, लेकिन क्षण उत्पन्न करने वाले कार्यों को बाध्य करने के लिए होएफ़डिंग की लेम्मा को लागू करता है (होएफ़डिंग की असमानता देखें)।
- होफ़डिंग की असमानता. कल्पना करना X1, ..., Xn सांख्यिकीय स्वतंत्रता यादृच्छिक चर हैं जो मान लेते हैं [a,b]. होने देना X उनके योग को निरूपित करें और जाने दें μ = E[X] योग के अपेक्षित मूल्य को निरूपित करें। फिर किसी के लिए ,
स्वतंत्र बर्नौली यादृच्छिक चर का योग
बर्नौली यादृच्छिक चर के लिए निम्नलिखित अनुभागों में सीमाएं बर्नौली यादृच्छिक चर के लिए उपयोग करके प्राप्त की जाती हैं 1 के बराबर होने की प्रायिकता p के साथ,
कोई भी चेर्नॉफ़ सीमा के कई स्वादों का सामना कर सकता है: मूल योगात्मक रूप (जो अनुमान त्रुटि पर सीमा देता है) या अधिक व्यावहारिक गुणात्मक रूप (जो अनुमान त्रुटि को माध्य तक सीमित करता है)।
गुणात्मक रूप (सापेक्ष त्रुटि)
गुणक चेर्नॉफ़ बाध्य। कल्पना करना X1, ..., Xn सांख्यिकीय स्वतंत्रता यादृच्छिक चर हैं जो मान लेते हैं {0, 1}. होने देना X उनके योग को निरूपित करें और जाने दें μ = E[X] योग के अपेक्षित मूल्य को निरूपित करें। फिर किसी के लिए δ > 0,
यह दिखाने के लिए समान प्रमाण रणनीति का उपयोग किया जा सकता है 0 < δ < 1
उपरोक्त सूत्र अक्सर व्यवहार में बोझिल होता है, इसलिए निम्नलिखित की सीमाएं ढीली लेकिन अधिक सुविधाजनक हैं[10] अक्सर उपयोग किया जाता है, जो असमानता से उत्पन्न होता है लघुगणक_पहचान की सूची से#असमानताएं:
ध्यान दें कि सीमाएँ तुच्छ हैं .
योगात्मक रूप (पूर्ण त्रुटि)
निम्नलिखित प्रमेय वासिली होफ़डिंग के कारण है[11] और इसलिए इसे चेर्नॉफ़-होएफ़डिंग प्रमेय कहा जाता है।
- चेर्नॉफ़-होफ़डिंग प्रमेय। कल्पना करना X1, ..., Xn आई.आई.डी. हैं यादृच्छिक चर, मान लेते हुए {0, 1}. होने देना p = E[X1] और ε > 0.
- कहाँ
- क्रमशः पैरामीटर x और y के साथ बर्नौली वितरण यादृच्छिक चर के बीच कुल्बैक-लीबलर विचलन है। अगर p ≥ 1/2, तब मतलब
प्रमेय का उपयोग करके आराम करने से सरल बंधन बनता है D(p + ε || p) ≥ 2ε2, जो के उत्तल फलन से अनुसरण करता है D(p + ε || p) और तथ्य यह है कि
यह परिणाम होफ़डिंग की असमानता का विशेष मामला है। कभी-कभी, सीमा
जो के लिए मजबूत हैं p < 1/8, का भी प्रयोग किया जाता है।
अनुप्रयोग
विरल ग्राफ़ नेटवर्क में सेट संतुलन और पैकेट (सूचना प्रौद्योगिकी) मार्ग में चेर्नॉफ़ सीमा के बहुत उपयोगी अनुप्रयोग हैं।
सांख्यिकीय प्रयोगों को डिज़ाइन करते समय सेट संतुलन की समस्या उत्पन्न होती है। आम तौर पर सांख्यिकीय प्रयोग को डिजाइन करते समय, प्रयोग में प्रत्येक भागीदार की विशेषताओं को देखते हुए, हमें यह जानना होगा कि प्रतिभागियों को 2 असंयुक्त समूहों में कैसे विभाजित किया जाए ताकि प्रत्येक विशेषता दोनों समूहों के बीच यथासंभव संतुलित हो।[12] चेर्नॉफ़ सीमा का उपयोग क्रमपरिवर्तन रूटिंग समस्याओं के लिए तंग सीमा प्राप्त करने के लिए भी किया जाता है जो विरल नेटवर्क में पैकेट को रूट करते समय नेटवर्क संकुलन भीड़ को कम करता है।[12]
चेर्नॉफ़ सीमाओं का उपयोग कम्प्यूटेशनल शिक्षण सिद्धांत में यह साबित करने के लिए किया जाता है कि लर्निंग एल्गोरिदम संभवतः लगभग सही लर्निंग है, यानी उच्च संभावना के साथ एल्गोरिदम में पर्याप्त बड़े प्रशिक्षण डेटा सेट पर छोटी त्रुटि होती है।[13] यादृच्छिकरण के साथ इसके गड़बड़ी स्थान की खोज करके किसी एप्लिकेशन/एल्गोरिदम की मजबूती के स्तर का मूल्यांकन करने के लिए चेर्नॉफ़ सीमा का प्रभावी ढंग से उपयोग किया जा सकता है।[14] चेर्नॉफ़ बाउंड का उपयोग किसी को मजबूत - और अधिकतर अवास्तविक - छोटी गड़बड़ी परिकल्पना (परटर्बेशन परिमाण छोटा है) को त्यागने की अनुमति देता है। मजबूती स्तर का उपयोग, बदले में, किसी विशिष्ट एल्गोरिथम विकल्प, हार्डवेयर कार्यान्वयन या किसी समाधान की उपयुक्तता को मान्य या अस्वीकार करने के लिए किया जा सकता है, जिसके संरचनात्मक पैरामीटर अनिश्चितताओं से प्रभावित होते हैं।
चेर्नॉफ़ सीमा का सरल और सामान्य उपयोग यादृच्छिक एल्गोरिदम को बढ़ावा देने के लिए है। यदि किसी के पास एल्गोरिदम है जो अनुमान लगाता है कि संभावना पी> 1/2 के साथ वांछित उत्तर है, तो कोई एल्गोरिदम चलाकर उच्च सफलता दर प्राप्त कर सकता है समय और अनुमान आउटपुट करना जो एल्गोरिदम के n/2 रन से अधिक आउटपुट है। (पिजनहोल सिद्धांत द्वारा ऐसे से अधिक अनुमान नहीं हो सकते हैं।) यह मानते हुए कि ये एल्गोरिदम रन स्वतंत्र हैं, n/2 से अधिक अनुमानों के सही होने की संभावना इस संभावना के बराबर है कि स्वतंत्र बर्नौली यादृच्छिक चर का योग Xk जो कि 1 है और प्रायिकता p, n/2 से अधिक है। ऐसा कम से कम करके तो दिखाया जा सकता है गुणक चेर्नॉफ़ बाउंड के माध्यम से (सिंक्लेयर के क्लास नोट्स में परिणाम 13.3, μ = np).[15]:
मैट्रिक्स चेर्नॉफ़ बाउंड
रूडोल्फ अहलस्वेड और एंड्रियास विंटर ने मैट्रिक्स-मूल्यवान यादृच्छिक चर के लिए चेर्नॉफ़ बाउंड पेश किया।[16] असमानता का निम्नलिखित संस्करण ट्रॉप के काम में पाया जा सकता है।[17] होने देना M1, ..., Mt स्वतंत्र मैट्रिक्स मान वाले यादृच्छिक चर बनें और . आइए हम इसे निरूपित करें मैट्रिक्स का ऑपरेटर मानदंड . अगर लगभग सभी के लिए निश्चित रूप से धारण करता है , फिर प्रत्येक के लिए ε > 0
ध्यान दें कि यह निष्कर्ष निकालने के लिए कि 0 से विचलन परिबद्ध है ε उच्च संभावना के साथ, हमें कई नमूने चुनने की आवश्यकता है के लघुगणक के समानुपाती . सामान्य तौर पर, दुर्भाग्य से, पर निर्भरता अपरिहार्य है: उदाहरण के लिए आयाम का विकर्ण यादृच्छिक संकेत मैट्रिक्स लें . टी स्वतंत्र नमूनों के योग का ऑपरेटर मानदंड सटीक रूप से लंबाई टी के डी स्वतंत्र यादृच्छिक वॉक के बीच अधिकतम विचलन है। निरंतर संभावना के साथ अधिकतम विचलन पर निश्चित सीमा प्राप्त करने के लिए, यह देखना आसान है कि इस परिदृश्य में t को d के साथ लघुगणकीय रूप से बढ़ना चाहिए।[18] आयामों पर निर्भरता से बचने के लिए, यह मानकर निम्नलिखित प्रमेय प्राप्त किया जा सकता है कि एम की रैंक निम्न है।
आयामों पर निर्भरता के बिना प्रमेय
होने देना 0 < ε < 1 और एम यादृच्छिक सममित वास्तविक मैट्रिक्स हो और लगभग निश्चित रूप से. मान लें कि M के समर्थन पर प्रत्येक तत्व की अधिकतम रैंक r है। तय करना
अगर तो फिर, लगभग निश्चित रूप से धारण करता है
कहाँ M1, ..., Mt आई.आई.डी. हैं एम की प्रतियां
नमूना संस्करण
चेर्नॉफ़ की सीमा के निम्नलिखित संस्करण का उपयोग इस संभावना को सीमित करने के लिए किया जा सकता है कि किसी नमूने में आबादी का बहुमत अल्पसंख्यक बन जाएगा, या इसके विपरीत।[19] मान लीजिए कि सामान्य जनसंख्या A और उप-जनसंख्या B ⊆ A है। उप-जनसंख्या के सापेक्ष आकार (|B|/|A|) को r से चिह्नित करें।
मान लीजिए कि हम पूर्णांक k और आकार k का यादृच्छिक नमूना S ⊂ A चुनते हैं। नमूने में उप-जनसंख्या के सापेक्ष आकार को r द्वारा चिह्नित करें (|B∩S|/|S|)S.
फिर, प्रत्येक भिन्न d ∈ [0,1] के लिए:
विशेष रूप से, यदि बी ए में बहुमत है (यानी आर > 0.5) तो हम इस संभावना को सीमित कर सकते हैं कि बी एस (आर) में बहुमत रहेगाS> 0.5) लेकर: d = 1 − 1/(2r):[20]
निःसंदेह यह सीमा बिल्कुल भी कड़ी नहीं है। उदाहरण के लिए, जब r = 0.5 हमें तुच्छ बाध्य संभावना > 0 मिलती है।
प्रमाण
गुणात्मक रूप
गुणक चेर्नॉफ़ बाउंड की शर्तों का पालन करते हुए, आइए X1, ..., Xn स्वतंत्र बर्नौली यादृच्छिक चर हो, जिसका योग है X, प्रत्येक की प्रायिकता p हैi1 के बराबर होना। बर्नौली चर के लिए:
तो, (का उपयोग करते हुए)1) साथ किसी के लिए और कहाँ ,
अगर हम बस सेट करें t = log(1 + δ) ताकि t > 0 के लिए δ > 0, हम स्थानापन्न और खोज सकते हैं
इससे वांछित परिणाम सिद्ध होता है।
चेर्नॉफ़-होफ़डिंग प्रमेय (योगात्मक रूप)
होने देना q = p + ε. ले रहा a = nq में (1), हमने प्राप्त:
अब, यह जानना Pr(Xi = 1) = p, Pr(Xi = 0) = 1 − p, अपने पास
इसलिए, हम कैलकुलस का उपयोग करके आसानी से अनंत की गणना कर सकते हैं:
समीकरण को शून्य पर सेट करना और हल करना, हमारे पास है
ताकि
इस प्रकार,
जैसा q = p + ε > p, हमने देखा कि t > 0, इसलिए हमारी सीमा संतुष्ट है t. के लिए हल किया जा रहा है t, हम इसे खोजने के लिए उपरोक्त समीकरणों को वापस जोड़ सकते हैं
अब हमारे पास अपना वांछित परिणाम है, वह
सममित मामले के प्रमाण को पूरा करने के लिए, हम बस यादृच्छिक चर को परिभाषित करते हैं Yi = 1 − Xi, वही प्रमाण लागू करें, और इसे हमारी सीमा में प्लग करें।
यह भी देखें
- बर्नस्टीन असमानताएँ (संभावना सिद्धांत)
- एकाग्रता असमानता - यादृच्छिक चर पर टेल-बाउंड का सारांश।
- क्रैमर प्रमेय (बड़े विचलन)|क्रैमर प्रमेय
- एंट्रोपिक मूल्य खतरे में है
- होफ़डिंग की असमानता
- मैट्रिक्स चेर्नॉफ़ बाध्य
- क्षण उत्पन्न करने वाला कार्य
संदर्भ
- ↑ Boucheron, Stéphane (2013). Concentration Inequalities: a Nonasymptotic Theory of Independence. Gábor Lugosi, Pascal Massart. Oxford: Oxford University Press. p. 21. ISBN 978-0-19-953525-5. OCLC 837517674.
- ↑ Wainwright, M. (January 22, 2015). "मूल पूंछ और एकाग्रता सीमाएँ" (PDF). Archived (PDF) from the original on 2016-05-08.
- ↑ Vershynin, Roman (2018). High-dimensional probability : an introduction with applications in data science. Cambridge, United Kingdom. p. 19. ISBN 978-1-108-41519-4. OCLC 1029247498.
{{cite book}}
: CS1 maint: location missing publisher (link) - ↑ Tropp, Joel A. (2015-05-26). "मैट्रिक्स एकाग्रता असमानताओं का एक परिचय". Foundations and Trends in Machine Learning (in English). 8 (1–2): 60. arXiv:1501.01571. doi:10.1561/2200000048. ISSN 1935-8237. S2CID 5679583.
- ↑ Chernoff, Herman (1952). "अवलोकनों के योग के आधार पर एक परिकल्पना के परीक्षण के लिए स्पर्शोन्मुख दक्षता का एक उपाय". The Annals of Mathematical Statistics. 23 (4): 493–507. doi:10.1214/aoms/1177729330. ISSN 0003-4851. JSTOR 2236576.
- ↑ Chernoff, Herman (2014). "A career in statistics" (PDF). In Lin, Xihong; Genest, Christian; Banks, David L.; Molenberghs, Geert; Scott, David W.; Wang, Jane-Ling (eds.). सांख्यिकी का अतीत, वर्तमान और भविष्य. CRC Press. p. 35. ISBN 9781482204964. Archived from the original (PDF) on 2015-02-11.
- ↑ Philips, Thomas K.; Nelson, Randolph (1995). "सकारात्मक पूंछ संभावनाओं के लिए बंधा हुआ क्षण चेर्नॉफ़ के बंधे से भी अधिक कठिन है". The American Statistician. 49 (2): 175–178. doi:10.2307/2684633. ISSN 0003-1305. JSTOR 2684633.
- ↑ Ghosh, Malay (2021-03-04). "Exponential Tail Bounds for Chisquared Random Variables". Journal of Statistical Theory and Practice (in English). 15 (2): 35. doi:10.1007/s42519-020-00156-x. ISSN 1559-8616.
- ↑ Theodosopoulos, Ted (2007-03-01). "चेर्नॉफ़ बाउंड का प्रत्यावर्तन". Statistics & Probability Letters (in English). 77 (5): 558–565. doi:10.1016/j.spl.2006.09.003. ISSN 0167-7152.
- ↑ Mitzenmacher, Michael; Upfal, Eli (2005). Probability and Computing: Randomized Algorithms and Probabilistic Analysis. Cambridge University Press. ISBN 978-0-521-83540-4.
- ↑ Hoeffding, W. (1963). "Probability Inequalities for Sums of Bounded Random Variables" (PDF). Journal of the American Statistical Association. 58 (301): 13–30. doi:10.2307/2282952. JSTOR 2282952.
- ↑ 12.0 12.1 Refer to this book section for more info on the problem.
- ↑ Kearns, M.; Vazirani, U. (1994). कम्प्यूटेशनल लर्निंग थ्योरी का एक परिचय. MIT Press. Chapter 9 (Appendix), pages 190–192. ISBN 0-262-11193-4.
- ↑ Alippi, C. (2014). "Randomized Algorithms". एंबेडेड सिस्टम के लिए इंटेलिजेंस. Springer. ISBN 978-3-319-05278-6.
- ↑ Sinclair, Alistair (Fall 2011). "पाठ्यक्रम "यादृच्छिकता और संगणना" के लिए कक्षा नोट्स" (PDF). Archived from the original (PDF) on 31 October 2014. Retrieved 30 October 2014.
- ↑ Ahlswede, R.; Winter, A. (2003). "Strong Converse for Identification via Quantum Channels". IEEE Transactions on Information Theory. 48 (3): 569–579. arXiv:quant-ph/0012127. doi:10.1109/18.985947. S2CID 523176.
- ↑ Tropp, J. (2010). "User-friendly tail bounds for sums of random matrices". Foundations of Computational Mathematics. 12 (4): 389–434. arXiv:1004.4389. doi:10.1007/s10208-011-9099-z. S2CID 17735965.
- ↑ Magen, A.; Zouzias, A. (2011). "निम्न रैंक मैट्रिक्स-मूल्यवान चेर्नॉफ़ बाउंड्स और अनुमानित मैट्रिक्स गुणन". arXiv:1005.2724 [cs.DM].
- ↑ Goldberg, A. V.; Hartline, J. D. (2001). "Competitive Auctions for Multiple Digital Goods". Algorithms — ESA 2001. Lecture Notes in Computer Science. Vol. 2161. p. 416. CiteSeerX 10.1.1.8.5115. doi:10.1007/3-540-44676-1_35. ISBN 978-3-540-42493-2.; lemma 6.1
- ↑ See graphs of: the bound as a function of r when k changes and the bound as a function of k when r changes.
अग्रिम पठन
- Chernoff, H. (1952). "A Measure of Asymptotic Efficiency for Tests of a Hypothesis Based on the sum of Observations". Annals of Mathematical Statistics. 23 (4): 493–507. doi:10.1214/aoms/1177729330. JSTOR 2236576. MR 0057518. Zbl 0048.11804.
- Chernoff, H. (1981). "A Note on an Inequality Involving the Normal Distribution". Annals of Probability. 9 (3): 533–535. doi:10.1214/aop/1176994428. JSTOR 2243541. MR 0614640. Zbl 0457.60014.
- Hagerup, T.; Rüb, C. (1990). "A guided tour of Chernoff bounds". Information Processing Letters. 33 (6): 305. doi:10.1016/0020-0190(90)90214-I.
- Nielsen, F. (2011). "An Information-Geometric Characterization of Chernoff Information". IEEE Signal Processing Letters. 20 (3): 269–272. arXiv:1102.2684. doi:10.1109/LSP.2013.2243726. S2CID 15034953.