चेर्नॉफ़ बाध्य: Difference between revisions
No edit summary |
No edit summary |
||
Line 28: | Line 28: | ||
दो-तरफा चेर्नॉफ़ बाउंड के लघुगणक को [[दर समारोह]] (या क्रैमर ट्रांसफॉर्म) के रूप में जाना जाता है। <math>I = -\log C</math>. यह लेजेन्ड्रे-फेन्चेल ट्रांसफॉर्मेशन के समतुल्य है|लेजेन्ड्रे-फेन्चेल ट्रांसफॉर्म या [[संचयी जनरेटिंग फ़ंक्शन]] का [[उत्तल संयुग्म]] <math>K = \log M</math>, के रूप में परिभाषित: <math display="block">I(a) = \sup_{t} at - K(t) </math>मोमेंट-जेनरेटिंग_फंक्शन#महत्वपूर्ण_प्रॉपर्टीज लॉगरिदमिक रूप से उत्तल फ़ंक्शन|लॉग-उत्तल है, इसलिए उत्तल संयुग्म की संपत्ति के अनुसार, चेर्नॉफ बाउंड को लॉगरिदमिक रूप से अवतल फ़ंक्शन|लॉग-अवतल होना चाहिए। चेर्नॉफ़ सीमा माध्य पर अपनी अधिकतम सीमा प्राप्त कर लेती है, <math>C(\operatorname E(X))=1</math>, और अनुवाद के अंतर्गत अपरिवर्तनीय है: <math display="inline">C_{X+k}(a) = C_X(a - k) </math>. | दो-तरफा चेर्नॉफ़ बाउंड के लघुगणक को [[दर समारोह]] (या क्रैमर ट्रांसफॉर्म) के रूप में जाना जाता है। <math>I = -\log C</math>. यह लेजेन्ड्रे-फेन्चेल ट्रांसफॉर्मेशन के समतुल्य है|लेजेन्ड्रे-फेन्चेल ट्रांसफॉर्म या [[संचयी जनरेटिंग फ़ंक्शन]] का [[उत्तल संयुग्म]] <math>K = \log M</math>, के रूप में परिभाषित: <math display="block">I(a) = \sup_{t} at - K(t) </math>मोमेंट-जेनरेटिंग_फंक्शन#महत्वपूर्ण_प्रॉपर्टीज लॉगरिदमिक रूप से उत्तल फ़ंक्शन|लॉग-उत्तल है, इसलिए उत्तल संयुग्म की संपत्ति के अनुसार, चेर्नॉफ बाउंड को लॉगरिदमिक रूप से अवतल फ़ंक्शन|लॉग-अवतल होना चाहिए। चेर्नॉफ़ सीमा माध्य पर अपनी अधिकतम सीमा प्राप्त कर लेती है, <math>C(\operatorname E(X))=1</math>, और अनुवाद के अंतर्गत अपरिवर्तनीय है: <math display="inline">C_{X+k}(a) = C_X(a - k) </math>. | ||
चेर्नॉफ़ सीमा सटीक है यदि और केवल यदि <math>X</math> एकल संकेंद्रित द्रव्यमान (अपक्षयी वितरण) है। बाउंड केवल बाउंड रैंडम वैरिएबल के चरम पर या उससे परे तंग होता है, | चेर्नॉफ़ सीमा सटीक है यदि और केवल यदि <math>X</math> एकल संकेंद्रित द्रव्यमान (अपक्षयी वितरण) है। बाउंड केवल बाउंड रैंडम वैरिएबल के चरम पर या उससे परे तंग होता है, जहाँ अनंत के लिए इन्फिमा प्राप्त होती है <math>t</math>. असंबद्ध यादृच्छिक चर के लिए सीमा कहीं भी तंग नहीं है, हालांकि यह उप-घातीय कारकों (घातीय रूप से तंग) तक स्पर्शोन्मुख रूप से तंग है। व्यक्तिगत क्षण अधिक विश्लेषणात्मक जटिलता की कीमत पर, कड़ी सीमाएं प्रदान कर सकते हैं।<ref>{{Cite journal |last1=Philips |first1=Thomas K. |last2=Nelson |first2=Randolph |date=1995 |title=सकारात्मक पूंछ संभावनाओं के लिए बंधा हुआ क्षण चेर्नॉफ़ के बंधे से भी अधिक कठिन है|url=https://www.jstor.org/stable/2684633 |journal=The American Statistician |volume=49 |issue=2 |pages=175–178 |doi=10.2307/2684633 |jstor=2684633 |issn=0003-1305}}</ref> | ||
व्यवहार में, सटीक चेर्नॉफ़ बाउंड विश्लेषणात्मक रूप से मूल्यांकन करने के लिए बोझिल या कठिन हो सकता है, ऐसी स्थिति में इसके बजाय क्षण (या क्यूम्युलेंट) उत्पन्न करने वाले फ़ंक्शन पर उपयुक्त ऊपरी बाउंड का उपयोग किया जा सकता है (उदाहरण के लिए उप-परवलयिक सीजीएफ जो उप-गॉसियन चेर्नॉफ़ बाउंड देता है) ). | व्यवहार में, सटीक चेर्नॉफ़ बाउंड विश्लेषणात्मक रूप से मूल्यांकन करने के लिए बोझिल या कठिन हो सकता है, ऐसी स्थिति में इसके बजाय क्षण (या क्यूम्युलेंट) उत्पन्न करने वाले फ़ंक्शन पर उपयुक्त ऊपरी बाउंड का उपयोग किया जा सकता है (उदाहरण के लिए उप-परवलयिक सीजीएफ जो उप-गॉसियन चेर्नॉफ़ बाउंड देता है) ). | ||
{| class="wikitable mw-collapsible" | {| class="wikitable mw-collapsible" | ||
Line 148: | Line 148: | ||
:कहाँ | :कहाँ | ||
::<math> D(x\parallel y) = x \ln \frac{x}{y} + (1-x) \ln \left (\frac{1-x}{1-y} \right )</math> | ::<math> D(x\parallel y) = x \ln \frac{x}{y} + (1-x) \ln \left (\frac{1-x}{1-y} \right )</math> | ||
:क्रमशः पैरामीटर x और y के साथ [[बर्नौली वितरण]] यादृच्छिक चर के बीच कुल्बैक-लीबलर विचलन है। | :क्रमशः पैरामीटर x और y के साथ [[बर्नौली वितरण]] यादृच्छिक चर के बीच कुल्बैक-लीबलर विचलन है। यदि {{math|''p'' ≥ {{sfrac|1|2}},}} तब <math>D(p+\varepsilon\parallel p)\ge \tfrac{\varepsilon^2}{2p(1-p)}</math> मतलब | ||
::<math> \Pr\left ( \frac{1}{n}\sum X_i>p+x \right ) \leq \exp \left (-\frac{x^2n}{2p(1-p)} \right ).</math> | ::<math> \Pr\left ( \frac{1}{n}\sum X_i>p+x \right ) \leq \exp \left (-\frac{x^2n}{2p(1-p)} \right ).</math> | ||
Line 206: | Line 206: | ||
|s2cid=17735965 | |s2cid=17735965 | ||
}}</ref> | }}</ref> | ||
होने देना {{math|''M''<sub>1</sub>, ..., ''M<sub>t</sub>''}} स्वतंत्र मैट्रिक्स मान वाले यादृच्छिक चर बनें <math> M_i\in \mathbb{C}^{d_1 \times d_2} </math> और <math> \mathbb{E}[M_i]=0</math>. | होने देना {{math|''M''<sub>1</sub>, ..., ''M<sub>t</sub>''}} स्वतंत्र मैट्रिक्स मान वाले यादृच्छिक चर बनें <math> M_i\in \mathbb{C}^{d_1 \times d_2} </math> और <math> \mathbb{E}[M_i]=0</math>. | ||
आइए हम इसे निरूपित करें <math> \lVert M \rVert </math> मैट्रिक्स का ऑपरेटर मानदंड <math> M </math>. | आइए हम इसे निरूपित करें <math> \lVert M \rVert </math> मैट्रिक्स का ऑपरेटर मानदंड <math> M </math>. यदि <math> \lVert M_i \rVert \leq \gamma </math> लगभग सभी के लिए निश्चित रूप से धारण करता है <math> i\in\{1,\ldots, t\} </math>, फिर प्रत्येक के लिए {{math|''ε'' > 0}} | ||
:<math>\Pr\left( \left\| \frac{1}{t} \sum_{i=1}^t M_i \right\| > \varepsilon \right) \leq (d_1+d_2) \exp \left( -\frac{3\varepsilon^2 t}{8\gamma^2} \right).</math> | :<math>\Pr\left( \left\| \frac{1}{t} \sum_{i=1}^t M_i \right\| > \varepsilon \right) \leq (d_1+d_2) \exp \left( -\frac{3\varepsilon^2 t}{8\gamma^2} \right).</math> | ||
ध्यान दें कि यह निष्कर्ष निकालने के लिए कि 0 से विचलन परिबद्ध है {{math|''ε''}} उच्च संभावना के साथ, हमें कई नमूने चुनने की आवश्यकता है <math>t </math> के लघुगणक के समानुपाती <math> d_1+d_2 </math>. सामान्य तौर पर, दुर्भाग्य से, पर निर्भरता <math> \log(\min(d_1,d_2)) </math> अपरिहार्य है: उदाहरण के लिए आयाम का विकर्ण यादृच्छिक संकेत मैट्रिक्स लें <math>d\times d </math>. टी स्वतंत्र नमूनों के योग का ऑपरेटर मानदंड सटीक रूप से लंबाई टी के डी स्वतंत्र यादृच्छिक वॉक के बीच अधिकतम विचलन है। निरंतर संभावना के साथ अधिकतम विचलन पर निश्चित सीमा प्राप्त करने के लिए, यह देखना आसान है कि इस परिदृश्य में t को d के साथ लघुगणकीय रूप से बढ़ना चाहिए।<ref>{{cite arXiv |last1=Magen |first1=A.|author1-link=Avner Magen |last2=Zouzias |first2=A. |year=2011 |title=निम्न रैंक मैट्रिक्स-मूल्यवान चेर्नॉफ़ बाउंड्स और अनुमानित मैट्रिक्स गुणन|class=cs.DM |eprint=1005.2724 }}</ref> | ध्यान दें कि यह निष्कर्ष निकालने के लिए कि 0 से विचलन परिबद्ध है {{math|''ε''}} उच्च संभावना के साथ, हमें कई नमूने चुनने की आवश्यकता है <math>t </math> के लघुगणक के समानुपाती <math> d_1+d_2 </math>. सामान्य तौर पर, दुर्भाग्य से, पर निर्भरता <math> \log(\min(d_1,d_2)) </math> अपरिहार्य है: उदाहरण के लिए आयाम का विकर्ण यादृच्छिक संकेत मैट्रिक्स लें <math>d\times d </math>. टी स्वतंत्र नमूनों के योग का ऑपरेटर मानदंड सटीक रूप से लंबाई टी के डी स्वतंत्र यादृच्छिक वॉक के बीच अधिकतम विचलन है। निरंतर संभावना के साथ अधिकतम विचलन पर निश्चित सीमा प्राप्त करने के लिए, यह देखना आसान है कि इस परिदृश्य में t को d के साथ लघुगणकीय रूप से बढ़ना चाहिए।<ref>{{cite arXiv |last1=Magen |first1=A.|author1-link=Avner Magen |last2=Zouzias |first2=A. |year=2011 |title=निम्न रैंक मैट्रिक्स-मूल्यवान चेर्नॉफ़ बाउंड्स और अनुमानित मैट्रिक्स गुणन|class=cs.DM |eprint=1005.2724 }}</ref> | ||
आयामों पर निर्भरता से बचने के लिए, यह मानकर निम्नलिखित प्रमेय प्राप्त किया जा सकता है कि एम की रैंक निम्न है। | आयामों पर निर्भरता से बचने के लिए, यह मानकर निम्नलिखित प्रमेय प्राप्त किया जा सकता है कि एम की रैंक निम्न है। | ||
===आयामों पर निर्भरता के बिना प्रमेय=== | ===आयामों पर निर्भरता के बिना प्रमेय=== | ||
मान ले {{math|0 < ''ε'' < 1}} हो और M यादृच्छिक सममित वास्तविक मैट्रिक्स हो जिसके लिए <math>\| \operatorname E[M] \| \leq 1 </math> और <math>\| M\| \leq \gamma </math> होता है लगभग निश्चितता के साथ, मान लें कि M के समर्थन में प्रत्येक तत्व मानक r से अधिकतम अवर्ध होता है। सेट करें | |||
:<math> t = \Omega \left( \frac{\gamma\log (\gamma/\varepsilon^2)}{\varepsilon^2} \right).</math> | :<math> t = \Omega \left( \frac{\gamma\log (\gamma/\varepsilon^2)}{\varepsilon^2} \right).</math> | ||
यदि <math> r \leq t </math> लगभग निश्चितता के साथ माना जाता है, तो | |||
:<math>\Pr\left(\left\| \frac{1}{t} \sum_{i=1}^t M_i - \operatorname E[M] \right\| > \varepsilon \right) \leq \frac{1}{\mathbf{poly}(t)}</math> | :<math>\Pr\left(\left\| \frac{1}{t} \sum_{i=1}^t M_i - \operatorname E[M] \right\| > \varepsilon \right) \leq \frac{1}{\mathbf{poly}(t)}</math> | ||
यहाँ {{math|''M''<sub>1</sub>, ..., ''M<sub>t</sub>''}} की i.i.d. प्रतिलिपियाँ हैं। | |||
==नमूना संस्करण== | ==नमूना संस्करण== | ||
Line 239: | Line 241: | ||
===गुणात्मक रूप=== | ===गुणात्मक रूप=== | ||
गुणक चेर्नॉफ़ बाउंड की शर्तों का पालन करते हुए, {{math|''X''<sub>1</sub>, ..., ''X<sub>n</sub>''}} स्वतंत्र बर्नौली यादृच्छिक चर है, जिसका योग {{math|''X''}} है, | गुणक चेर्नॉफ़ बाउंड की शर्तों का पालन करते हुए, {{math|''X''<sub>1</sub>, ..., ''X<sub>n</sub>''}} स्वतंत्र बर्नौली यादृच्छिक चर है, जिसका योग {{math|''X''}} है, जहाँ प्रत्येक घटक को 1 होने की की प्रायिकता ''p<sub>i</sub>'' के बराबर होती है। बर्नौली चर के लिए: | ||
:<math>\operatorname E \left[e^{t\cdot X_i} \right] = (1 - p_i) e^0 + p_i e^t = 1 + p_i (e^t -1) \leq e^{p_i (e^t - 1)}</math> | :<math>\operatorname E \left[e^{t\cdot X_i} \right] = (1 - p_i) e^0 + p_i e^t = 1 + p_i (e^t -1) \leq e^{p_i (e^t - 1)}</math> | ||
इसलिए, ({{EquationNote|1}}) का उपयोग करते हुए, | इसलिए, ({{EquationNote|1}}) का उपयोग करते हुए, जहाँ <math>a = (1+\delta)\mu</math> और यहाँ <math>\delta>0</math> है, और यहाँ<math>\mu = \operatorname E[X] = \textstyle\sum_{i=1}^n p_i</math> है, | ||
:<math>\begin{align} | :<math>\begin{align} |
Revision as of 19:51, 13 July 2023
संभाव्यता सिद्धांत में, चेर्नॉफ़ बाउंड यादृच्छिक चर की पूंछ पर उसके क्षण उत्पन्न करने वाले फ़ंक्शन के आधार पर तेजी से घटती ऊपरी सीमा है। ऐसी सभी घातांकीय सीमाओं का न्यूनतम चेर्नॉफ़ या चेर्नॉफ़-क्रैमर बाउंड बनाता है, जो घातीय की तुलना में तेजी से क्षय हो सकता है (उदाहरण के लिए उप-गॉसियन वितरण|उप-गॉसियन)।[1][2] यह विशेष रूप से स्वतंत्र यादृच्छिक चर के योग के लिए उपयोगी है, जैसे बर्नौली यादृच्छिक चर का योग।[3][4]
बाउंड का नाम आमतौर पर हरमन चेर्नॉफ़ के नाम पर रखा गया है जिन्होंने 1952 के पेपर में इस विधि का वर्णन किया था,[5] हालाँकि चेर्नॉफ़ ने स्वयं इसका श्रेय हरमन रुबिन को दिया।[6] 1938 में हेराल्ड क्रैमर ने लगभग समान अवधारणा प्रकाशित की थी जिसे अब क्रैमर प्रमेय (बड़े विचलन)|क्रैमर प्रमेय के रूप में जाना जाता है।
यह मार्कोव की असमानता या चेबीशेव की असमानता जैसे पहले या दूसरे-क्षण-आधारित पूंछ सीमाओं की तुलना में तीव्र सीमा है, जो केवल पूंछ क्षय पर शक्ति-कानून सीमाएं उत्पन्न करती है। हालाँकि, जब चेर्नॉफ़ बाउंड को योगों पर लागू किया जाता है, तो चर को स्वतंत्र होने की आवश्यकता होती है, ऐसी स्थिति जो मार्कोव की असमानता या चेबीशेव की असमानता के लिए आवश्यक नहीं है (हालांकि चेबीशेव की असमानता के लिए चर को जोड़ीदार स्वतंत्र होने की आवश्यकता होती है)।
चेर्नॉफ़ बाउंड बर्नस्टीन असमानताओं (संभावना सिद्धांत) से संबंधित है। इसका उपयोग होफ़डिंग की असमानता, बेनेट की असमानता और Doob_martingale#McDiarmid's_inequality|McDiarmid की असमानता को साबित करने के लिए भी किया जाता है।
जेनेरिक चेर्नॉफ़ सीमाएँ
जेनेरिक चेर्नॉफ़ यादृच्छिक चर के लिए बाध्य है मार्कोव की असमानता को लागू करने से प्राप्त होता है (यही कारण है कि इसे कभी-कभी घातीय मार्कोव या घातांकीय क्षण बाउंड भी कहा जाता है)। सकारात्मक के लिए यह उत्तरजीविता कार्य पर बंधन देता है इसके क्षण-उत्पादक कार्य के संदर्भ में :
चूँकि यह सीमा हर सकारात्मक के लिए लागू होती है , हम सबसे निचला और उच्चतम ले सकते हैं:
नकारात्मक के साथ वही विश्लेषण करना हमें संचयी वितरण फ़ंक्शन पर समान सीमा मिलती है:
और
मात्रा अपेक्षा मूल्य के रूप में व्यक्त किया जा सकता है , या समकक्ष .
गुण
घातांकीय फलन उत्तल है, इसलिए जेन्सेन की असमानता से . इसका तात्पर्य यह है कि दाहिनी पूँछ पर बाउंड तुच्छ रूप से 1 के बराबर है ; इसी प्रकार, बायीं सीमा भी तुच्छ है . इसलिए हम दोनों इन्फिमा को जोड़ सकते हैं और दो-तरफा चेर्नॉफ़ बाउंड को परिभाषित कर सकते हैं:
दो-तरफा चेर्नॉफ़ बाउंड के लघुगणक को दर समारोह (या क्रैमर ट्रांसफॉर्म) के रूप में जाना जाता है। . यह लेजेन्ड्रे-फेन्चेल ट्रांसफॉर्मेशन के समतुल्य है|लेजेन्ड्रे-फेन्चेल ट्रांसफॉर्म या संचयी जनरेटिंग फ़ंक्शन का उत्तल संयुग्म , के रूप में परिभाषित:
चेर्नॉफ़ सीमा सटीक है यदि और केवल यदि एकल संकेंद्रित द्रव्यमान (अपक्षयी वितरण) है। बाउंड केवल बाउंड रैंडम वैरिएबल के चरम पर या उससे परे तंग होता है, जहाँ अनंत के लिए इन्फिमा प्राप्त होती है . असंबद्ध यादृच्छिक चर के लिए सीमा कहीं भी तंग नहीं है, हालांकि यह उप-घातीय कारकों (घातीय रूप से तंग) तक स्पर्शोन्मुख रूप से तंग है। व्यक्तिगत क्षण अधिक विश्लेषणात्मक जटिलता की कीमत पर, कड़ी सीमाएं प्रदान कर सकते हैं।[7] व्यवहार में, सटीक चेर्नॉफ़ बाउंड विश्लेषणात्मक रूप से मूल्यांकन करने के लिए बोझिल या कठिन हो सकता है, ऐसी स्थिति में इसके बजाय क्षण (या क्यूम्युलेंट) उत्पन्न करने वाले फ़ंक्शन पर उपयुक्त ऊपरी बाउंड का उपयोग किया जा सकता है (उदाहरण के लिए उप-परवलयिक सीजीएफ जो उप-गॉसियन चेर्नॉफ़ बाउंड देता है) ).
वितरण | ||||
---|---|---|---|---|
सामान्य वितरण | ||||
बर्नौली वितरणनीचे विस्तृत) | ||||
मानक बर्नौली | ||||
रेडमेकर वितरण | ||||
गामा वितरण | ||||
ची-वर्ग वितरण | [8] | |||
पोइसन वितरण |
एमजीएफ से निचली सीमा
केवल क्षण उत्पन्न करने वाले फ़ंक्शन का उपयोग करके, पाले-ज़िगमंड असमानता को लागू करके पूंछ संभावनाओं पर निचली सीमा प्राप्त की जा सकती है। , उपज:
थियोडोसोपोलोस[9] घातीय झुकाव प्रक्रिया का उपयोग करके तंग (एर) एमजीएफ-आधारित निचली सीमा का निर्माण किया गया।
विशेष वितरणों (जैसे कि द्विपद वितरण) के लिए चेरनॉफ बाउंड के समान घातीय क्रम की निचली सीमाएं अक्सर उपलब्ध होती हैं।
स्वतंत्र यादृच्छिक चर का योग
कब X का योग है n स्वतंत्र यादृच्छिक चर X1, ..., Xn, का क्षण उत्पन्न करने वाला कार्य X व्यक्तिगत क्षण उत्पन्न करने वाले कार्यों का उत्पाद है, जो यह देता है:
-
(1)
और:
विशिष्ट चेर्नॉफ़ सीमाएँ क्षण-उत्पन्न करने वाले फ़ंक्शन की गणना करके प्राप्त की जाती हैं यादृच्छिक चर के विशिष्ट उदाहरणों के लिए .
जब यादृच्छिक चर भी समान रूप से वितरित किए जाते हैं (स्वतंत्र और समान रूप से वितरित यादृच्छिक चर), तो योग के लिए बाध्य चेर्नॉफ़ एकल-चर चेर्नॉफ़ सीमा के सरल पुनर्मूल्यांकन में कम हो जाता है। अर्थात्, n iid चर के औसत के लिए बाध्य चेर्नॉफ़ एकल चर पर बंधे चेर्नोफ़ की nवीं शक्ति के बराबर है (देखें क्रैमर प्रमेय (बड़े विचलन) | क्रैमर प्रमेय)।
स्वतंत्र परिबद्ध यादृच्छिक चरों का योग
चेर्नॉफ़ सीमाएं उनके वितरण की परवाह किए बिना, स्वतंत्र, बंधे हुए यादृच्छिक चर के सामान्य योगों पर भी लागू की जा सकती हैं; इसे होफ़डिंग की असमानता के रूप में जाना जाता है। प्रमाण अन्य चेरनॉफ़ सीमाओं के समान दृष्टिकोण का अनुसरण करता है, लेकिन क्षण उत्पन्न करने वाले कार्यों को बाध्य करने के लिए होएफ़डिंग की लेम्मा को लागू करता है (होएफ़डिंग की असमानता देखें)।
- होफ़डिंग की असमानता. कल्पना करना X1, ..., Xn सांख्यिकीय स्वतंत्रता यादृच्छिक चर हैं जो मान लेते हैं [a,b]. होने देना X उनके योग को निरूपित करें और जाने दें μ = E[X] योग के अपेक्षित मूल्य को निरूपित करें। फिर किसी के लिए ,
स्वतंत्र बर्नौली यादृच्छिक चर का योग
बर्नौली यादृच्छिक चर के लिए निम्नलिखित अनुभागों में सीमाएं बर्नौली यादृच्छिक चर के लिए उपयोग करके प्राप्त की जाती हैं 1 के बराबर होने की प्रायिकता p के साथ,
कोई भी चेर्नॉफ़ सीमा के कई स्वादों का सामना कर सकता है: मूल योगात्मक रूप (जो अनुमान त्रुटि पर सीमा देता है) या अधिक व्यावहारिक गुणात्मक रूप (जो अनुमान त्रुटि को माध्य तक सीमित करता है)।
गुणात्मक रूप (सापेक्ष त्रुटि)
गुणक चेर्नॉफ़ बाध्य। कल्पना करना X1, ..., Xn सांख्यिकीय स्वतंत्रता यादृच्छिक चर हैं जो मान लेते हैं {0, 1}. होने देना X उनके योग को निरूपित करें और जाने दें μ = E[X] योग के अपेक्षित मूल्य को निरूपित करें। फिर किसी के लिए δ > 0,
यह दिखाने के लिए समान प्रमाण रणनीति का उपयोग किया जा सकता है 0 < δ < 1
उपरोक्त सूत्र अक्सर व्यवहार में बोझिल होता है, इसलिए निम्नलिखित की सीमाएं ढीली लेकिन अधिक सुविधाजनक हैं[10] अक्सर उपयोग किया जाता है, जो असमानता से उत्पन्न होता है लघुगणक_पहचान की सूची से#असमानताएं:
ध्यान दें कि सीमाएँ तुच्छ हैं .
योगात्मक रूप (पूर्ण त्रुटि)
निम्नलिखित प्रमेय वासिली होफ़डिंग के कारण है[11] और इसलिए इसे चेर्नॉफ़-होएफ़डिंग प्रमेय कहा जाता है।
- चेर्नॉफ़-होफ़डिंग प्रमेय। कल्पना करना X1, ..., Xn आई.आई.डी. हैं यादृच्छिक चर, मान लेते हुए {0, 1}. होने देना p = E[X1] और ε > 0.
- कहाँ
- क्रमशः पैरामीटर x और y के साथ बर्नौली वितरण यादृच्छिक चर के बीच कुल्बैक-लीबलर विचलन है। यदि p ≥ 1/2, तब मतलब
प्रमेय का उपयोग करके आराम करने से सरल बंधन बनता है D(p + ε || p) ≥ 2ε2, जो के उत्तल फलन से अनुसरण करता है D(p + ε || p) और तथ्य यह है कि
यह परिणाम होफ़डिंग की असमानता का विशेष मामला है। कभी-कभी, सीमा
जो के लिए मजबूत हैं p < 1/8, का भी प्रयोग किया जाता है।
अनुप्रयोग
विरल ग्राफ़ नेटवर्क में सेट संतुलन और पैकेट (सूचना प्रौद्योगिकी) मार्ग में चेर्नॉफ़ सीमा के बहुत उपयोगी अनुप्रयोग हैं।
सांख्यिकीय प्रयोगों को डिज़ाइन करते समय सेट संतुलन की समस्या उत्पन्न होती है। आम तौर पर सांख्यिकीय प्रयोग को डिजाइन करते समय, प्रयोग में प्रत्येक भागीदार की विशेषताओं को देखते हुए, हमें यह जानना होगा कि प्रतिभागियों को 2 असंयुक्त समूहों में कैसे विभाजित किया जाए ताकि प्रत्येक विशेषता दोनों समूहों के बीच यथासंभव संतुलित हो।[12] चेर्नॉफ़ सीमा का उपयोग क्रमपरिवर्तन रूटिंग समस्याओं के लिए तंग सीमा प्राप्त करने के लिए भी किया जाता है जो विरल नेटवर्क में पैकेट को रूट करते समय नेटवर्क संकुलन भीड़ को कम करता है।[12]
चेर्नॉफ़ सीमाओं का उपयोग कम्प्यूटेशनल शिक्षण सिद्धांत में यह साबित करने के लिए किया जाता है कि लर्निंग एल्गोरिदम संभवतः लगभग सही लर्निंग है, अर्थात् उच्च संभावना के साथ एल्गोरिदम में पर्याप्त बड़े प्रशिक्षण डेटा सेट पर छोटी त्रुटि होती है।[13] यादृच्छिकरण के साथ इसके गड़बड़ी स्थान की खोज करके किसी एप्लिकेशन/एल्गोरिदम की मजबूती के स्तर का मूल्यांकन करने के लिए चेर्नॉफ़ सीमा का प्रभावी ढंग से उपयोग किया जा सकता है।[14] चेर्नॉफ़ बाउंड का उपयोग किसी को मजबूत - और अधिकतर अवास्तविक - छोटी गड़बड़ी परिकल्पना (परटर्बेशन परिमाण छोटा है) को त्यागने की अनुमति देता है। मजबूती स्तर का उपयोग, बदले में, किसी विशिष्ट एल्गोरिथम विकल्प, हार्डवेयर कार्यान्वयन या किसी समाधान की उपयुक्तता को मान्य या अस्वीकार करने के लिए किया जा सकता है, जिसके संरचनात्मक पैरामीटर अनिश्चितताओं से प्रभावित होते हैं।
चेर्नॉफ़ सीमा का सरल और सामान्य उपयोग यादृच्छिक एल्गोरिदम को बढ़ावा देने के लिए है। यदि किसी के पास एल्गोरिदम है जो अनुमान लगाता है कि संभावना पी> 1/2 के साथ वांछित उत्तर है, तो कोई एल्गोरिदम चलाकर उच्च सफलता दर प्राप्त कर सकता है समय और अनुमान आउटपुट करना जो एल्गोरिदम के n/2 रन से अधिक आउटपुट है। (पिजनहोल सिद्धांत द्वारा ऐसे से अधिक अनुमान नहीं हो सकते हैं।) यह मानते हुए कि ये एल्गोरिदम रन स्वतंत्र हैं, n/2 से अधिक अनुमानों के सही होने की संभावना इस संभावना के बराबर है कि स्वतंत्र बर्नौली यादृच्छिक चर का योग Xk जो कि 1 है और प्रायिकता p, n/2 से अधिक है। ऐसा कम से कम करके तो दिखाया जा सकता है गुणक चेर्नॉफ़ बाउंड के माध्यम से (सिंक्लेयर के क्लास नोट्स में परिणाम 13.3, μ = np).[15]:
मैट्रिक्स चेर्नॉफ़ बाउंड
रूडोल्फ अहलस्वेड और एंड्रियास विंटर ने मैट्रिक्स-मूल्यवान यादृच्छिक चर के लिए चेर्नॉफ़ बाउंड पेश किया।[16] असमानता का निम्नलिखित संस्करण ट्रॉप के काम में पाया जा सकता है।[17]
होने देना M1, ..., Mt स्वतंत्र मैट्रिक्स मान वाले यादृच्छिक चर बनें और . आइए हम इसे निरूपित करें मैट्रिक्स का ऑपरेटर मानदंड . यदि लगभग सभी के लिए निश्चित रूप से धारण करता है , फिर प्रत्येक के लिए ε > 0
ध्यान दें कि यह निष्कर्ष निकालने के लिए कि 0 से विचलन परिबद्ध है ε उच्च संभावना के साथ, हमें कई नमूने चुनने की आवश्यकता है के लघुगणक के समानुपाती . सामान्य तौर पर, दुर्भाग्य से, पर निर्भरता अपरिहार्य है: उदाहरण के लिए आयाम का विकर्ण यादृच्छिक संकेत मैट्रिक्स लें . टी स्वतंत्र नमूनों के योग का ऑपरेटर मानदंड सटीक रूप से लंबाई टी के डी स्वतंत्र यादृच्छिक वॉक के बीच अधिकतम विचलन है। निरंतर संभावना के साथ अधिकतम विचलन पर निश्चित सीमा प्राप्त करने के लिए, यह देखना आसान है कि इस परिदृश्य में t को d के साथ लघुगणकीय रूप से बढ़ना चाहिए।[18]
आयामों पर निर्भरता से बचने के लिए, यह मानकर निम्नलिखित प्रमेय प्राप्त किया जा सकता है कि एम की रैंक निम्न है।
आयामों पर निर्भरता के बिना प्रमेय
मान ले 0 < ε < 1 हो और M यादृच्छिक सममित वास्तविक मैट्रिक्स हो जिसके लिए और होता है लगभग निश्चितता के साथ, मान लें कि M के समर्थन में प्रत्येक तत्व मानक r से अधिकतम अवर्ध होता है। सेट करें
यदि लगभग निश्चितता के साथ माना जाता है, तो
यहाँ M1, ..., Mt की i.i.d. प्रतिलिपियाँ हैं।
नमूना संस्करण
चेर्नॉफ़ के बाउंड का निम्नलिखित संस्करण प्रयोग किया जा सकता है जो आवदेन परिभाषित करने के लिए उपयुक्त है, जिसमें जनसंख्या में बहुमत नमूने में अल्पसंख्यक बन जाएगा, या इसके विपरीत।[19]
मान लीजिये कि सामान्य जनसंख्या A है और उप-जनसंख्या B ⊆ A है। उप-जनसंख्या का सापेक्षिक आकार (|B|/|A|) को r से चिह्नित करता है।
मान लीजिए कि हम पूर्णांक k और यादृच्छिक नमूना S ⊂ A चुनते हैं, जिसका आकार k है। नमूने में उप-जनसंख्या का सापेक्षिक आकार (|B∩S|/|S|) को rS से चिह्नित करते है।
फिर, प्रत्येक भिन्न d ∈ [0,1] के लिए:
विशेष रूप से, यदि B A में बहुमत है (अर्थात् r > 0.5) तो हम निम्नलिखित लेकर बाउंड कर सकते हैं कि B S में अधिकांश रहेगा S(rS > 0.5):d = 1 − 1/(2r): [20]
यह बाउंड बिल्कुल सटीक नहीं है। उदाहरण के लिए, जब r = 0.5 ता है, हमें एक साधारण बाउंड प्राप्त होता है: Prob > 0।
प्रमाण
गुणात्मक रूप
गुणक चेर्नॉफ़ बाउंड की शर्तों का पालन करते हुए, X1, ..., Xn स्वतंत्र बर्नौली यादृच्छिक चर है, जिसका योग X है, जहाँ प्रत्येक घटक को 1 होने की की प्रायिकता pi के बराबर होती है। बर्नौली चर के लिए:
इसलिए, (1) का उपयोग करते हुए, जहाँ और यहाँ है, और यहाँ है,
यदि हम t = log(1 + δ) सेट करें ताकि t > 0 हो (जब δ > 0 हो), तो हम स्थानापन्न सकते हैं और प्राप्त करते हैं
यह हमारी वांछित परिणाम को सिद्ध करता है।
चेर्नॉफ़-होफ़डिंग प्रमेय (योगात्मक रूप)
q = p + ε मानते हुए (1) में a = nq लेते हैं, हम प्राप्त करते हैं:
अब, Pr(Xi = 1) = p, Pr(Xi = 0) = 1 − p, होने के कारण हमें मिलता है
इसलिए, हम तुरंत त्रिगणित का उपयोग करके अन्तिम सीमा की गणना कर सकते हैं:
समीकरण को शून्य पर सेट करना और हल करना, हमारे पास है
ताकि
इस प्रकार,
q = p + ε > p, होने के कारण हम देखते हैं कि t > 0, इसलिए हमारा बाउंड t पर संतुष्ट होता है। t के लिए समीकरणों में वापस प्रविष्ट करने से हम पाते हैं:
अब हमारे पास अपना वांछित परिणाम है, यानी
व्यास्तिगत मामले के लिए प्रमाण को पूरा करने के लिए, हम सदर्भीय चर Yi = 1 − Xi को परिभाषित करते हैं , वही समान प्रमाण का इस्तेमाल करते हैं, और हमारे बाउंड में इसे प्लगइन करते हैं।
यह भी देखें
- बर्नस्टीन असमानताएँ (संभावना सिद्धांत)
- एकाग्रता असमानता - यादृच्छिक चर पर टेल-बाउंड का सारांश।
- क्रैमर प्रमेय (बड़े विचलन)|क्रैमर प्रमेय
- एंट्रोपिक मूल्य खतरे में है
- होफ़डिंग की असमानता
- मैट्रिक्स चेर्नॉफ़ बाध्य
- क्षण उत्पन्न करने वाला कार्य
संदर्भ
- ↑ Boucheron, Stéphane (2013). Concentration Inequalities: a Nonasymptotic Theory of Independence. Gábor Lugosi, Pascal Massart. Oxford: Oxford University Press. p. 21. ISBN 978-0-19-953525-5. OCLC 837517674.
- ↑ Wainwright, M. (January 22, 2015). "मूल पूंछ और एकाग्रता सीमाएँ" (PDF). Archived (PDF) from the original on 2016-05-08.
- ↑ Vershynin, Roman (2018). High-dimensional probability : an introduction with applications in data science. Cambridge, United Kingdom. p. 19. ISBN 978-1-108-41519-4. OCLC 1029247498.
{{cite book}}
: CS1 maint: location missing publisher (link) - ↑ Tropp, Joel A. (2015-05-26). "मैट्रिक्स एकाग्रता असमानताओं का एक परिचय". Foundations and Trends in Machine Learning (in English). 8 (1–2): 60. arXiv:1501.01571. doi:10.1561/2200000048. ISSN 1935-8237. S2CID 5679583.
- ↑ Chernoff, Herman (1952). "अवलोकनों के योग के आधार पर एक परिकल्पना के परीक्षण के लिए स्पर्शोन्मुख दक्षता का एक उपाय". The Annals of Mathematical Statistics. 23 (4): 493–507. doi:10.1214/aoms/1177729330. ISSN 0003-4851. JSTOR 2236576.
- ↑ Chernoff, Herman (2014). "A career in statistics" (PDF). In Lin, Xihong; Genest, Christian; Banks, David L.; Molenberghs, Geert; Scott, David W.; Wang, Jane-Ling (eds.). सांख्यिकी का अतीत, वर्तमान और भविष्य. CRC Press. p. 35. ISBN 9781482204964. Archived from the original (PDF) on 2015-02-11.
- ↑ Philips, Thomas K.; Nelson, Randolph (1995). "सकारात्मक पूंछ संभावनाओं के लिए बंधा हुआ क्षण चेर्नॉफ़ के बंधे से भी अधिक कठिन है". The American Statistician. 49 (2): 175–178. doi:10.2307/2684633. ISSN 0003-1305. JSTOR 2684633.
- ↑ Ghosh, Malay (2021-03-04). "Exponential Tail Bounds for Chisquared Random Variables". Journal of Statistical Theory and Practice (in English). 15 (2): 35. doi:10.1007/s42519-020-00156-x. ISSN 1559-8616.
- ↑ Theodosopoulos, Ted (2007-03-01). "चेर्नॉफ़ बाउंड का प्रत्यावर्तन". Statistics & Probability Letters (in English). 77 (5): 558–565. doi:10.1016/j.spl.2006.09.003. ISSN 0167-7152.
- ↑ Mitzenmacher, Michael; Upfal, Eli (2005). Probability and Computing: Randomized Algorithms and Probabilistic Analysis. Cambridge University Press. ISBN 978-0-521-83540-4.
- ↑ Hoeffding, W. (1963). "Probability Inequalities for Sums of Bounded Random Variables" (PDF). Journal of the American Statistical Association. 58 (301): 13–30. doi:10.2307/2282952. JSTOR 2282952.
- ↑ 12.0 12.1 Refer to this book section for more info on the problem.
- ↑ Kearns, M.; Vazirani, U. (1994). कम्प्यूटेशनल लर्निंग थ्योरी का एक परिचय. MIT Press. Chapter 9 (Appendix), pages 190–192. ISBN 0-262-11193-4.
- ↑ Alippi, C. (2014). "Randomized Algorithms". एंबेडेड सिस्टम के लिए इंटेलिजेंस. Springer. ISBN 978-3-319-05278-6.
- ↑ Sinclair, Alistair (Fall 2011). "पाठ्यक्रम "यादृच्छिकता और संगणना" के लिए कक्षा नोट्स" (PDF). Archived from the original (PDF) on 31 October 2014. Retrieved 30 October 2014.
- ↑ Ahlswede, R.; Winter, A. (2003). "Strong Converse for Identification via Quantum Channels". IEEE Transactions on Information Theory. 48 (3): 569–579. arXiv:quant-ph/0012127. doi:10.1109/18.985947. S2CID 523176.
- ↑ Tropp, J. (2010). "User-friendly tail bounds for sums of random matrices". Foundations of Computational Mathematics. 12 (4): 389–434. arXiv:1004.4389. doi:10.1007/s10208-011-9099-z. S2CID 17735965.
- ↑ Magen, A.; Zouzias, A. (2011). "निम्न रैंक मैट्रिक्स-मूल्यवान चेर्नॉफ़ बाउंड्स और अनुमानित मैट्रिक्स गुणन". arXiv:1005.2724 [cs.DM].
- ↑ Goldberg, A. V.; Hartline, J. D. (2001). "Competitive Auctions for Multiple Digital Goods". Algorithms — ESA 2001. Lecture Notes in Computer Science. Vol. 2161. p. 416. CiteSeerX 10.1.1.8.5115. doi:10.1007/3-540-44676-1_35. ISBN 978-3-540-42493-2.; lemma 6.1
- ↑ See graphs of: the bound as a function of r when k changes and the bound as a function of k when r changes.
अग्रिम पठन
- Chernoff, H. (1952). "A Measure of Asymptotic Efficiency for Tests of a Hypothesis Based on the sum of Observations". Annals of Mathematical Statistics. 23 (4): 493–507. doi:10.1214/aoms/1177729330. JSTOR 2236576. MR 0057518. Zbl 0048.11804.
- Chernoff, H. (1981). "A Note on an Inequality Involving the Normal Distribution". Annals of Probability. 9 (3): 533–535. doi:10.1214/aop/1176994428. JSTOR 2243541. MR 0614640. Zbl 0457.60014.
- Hagerup, T.; Rüb, C. (1990). "A guided tour of Chernoff bounds". Information Processing Letters. 33 (6): 305. doi:10.1016/0020-0190(90)90214-I.
- Nielsen, F. (2011). "An Information-Geometric Characterization of Chernoff Information". IEEE Signal Processing Letters. 20 (3): 269–272. arXiv:1102.2684. doi:10.1109/LSP.2013.2243726. S2CID 15034953.