चेर्नॉफ़ बाध्य

From Vigyanwiki

संभाव्यता सिद्धांत में, चेर्नॉफ़ बाउंड यादृच्छिक चर की पूंछ पर उसके क्षण उत्पन्न करने वाले फ़ंक्शन के आधार पर तेजी से घटती ऊपरी सीमा है। ऐसी सभी घातांकीय सीमाओं का न्यूनतम चेर्नॉफ़ या चेर्नॉफ़-क्रैमर बाउंड बनाता है, जो घातीय की तुलना में तेजी से क्षय हो सकता है (उदाहरण के लिए उप-गॉसियन वितरण|उप-गॉसियन)।[1][2] यह विशेष रूप से स्वतंत्र यादृच्छिक चर के योग के लिए उपयोगी है, जैसे बर्नौली यादृच्छिक चर का योग।[3][4]

इस बाउंड को आमतौर पर हरमन चेर्नॉफ़ के नाम पर जाना जाता है, जिन्होंने 1952 के पेपर में इस विधि का वर्णन किया था,[5] हालाँकि चेर्नॉफ़ ने इसे स्वयं हरमन रूबिन को समर्पित किया था।[6] 1938 में हराल्ड क्रामर ने लगभग इसी धारणा को प्रकाशित किया था, जिसे अब क्रामर का सिद्धांत के नाम से जाना जाता है।

यह मार्कोव की असमानता या चेबीशेव की असमानता जैसे पहले या दूसरे-क्षण-आधारित पूंछ सीमाओं की तुलना में तीव्र सीमा है, जो केवल पूंछ क्षय पर शक्ति-कानून सीमाएं उत्पन्न करती है। हालाँकि, जब चेर्नॉफ़ बाउंड को योगों पर लागू किया जाता है, तो चर को स्वतंत्र होने की आवश्यकता होती है, ऐसी स्थिति जो मार्कोव की असमानता या चेबीशेव की असमानता के लिए आवश्यक नहीं है (हालांकि चेबीशेव की असम्भवता को योग होने के लिए व्यक्तिगत रूप से आवश्यकता होती है)।

चेरनॉफ बाउंड बर्नस्टीन समीकरणों से संबंधित है। यह भी होफ्डिंग की असम्भवता, बेनेट की असम्भवता, और मैकडियर्मिड की असम्भवता को सिद्ध करने के लिए उपयोग किया जाता है।

जेनेरिक चेर्नॉफ़ सीमाएँ

ची-वर्ग यादृच्छिक चर के लिए बाध्य है

यादृच्छिक प्रतिस्थान के लिए जनेरिक चेरनॉफ बाउंड को लागू करने के लिए, मार्कोव की असम्भवता को उपयोग करते हुए यह बाउंड मिलता है, इसे आवश्यकतानुसार एक्सपोनेंशियल मार्कोव या एक्सपोनेंशियल मोमेंट्स बाउंड भी कहा जाता है। इसके लिए, सकारात्मक के लिए हम का बाउंड प्राप्त करते हैं (इसी कारण इसे कभी-कभी एक्सपोनेंशियल मार्कोव या एक्सपोनेंशियल मोमेंट्स बाउंड कहा जाता है)। इस बाउंड के लिए, यदि सकारात्मक है, तो यह बाउंड देता है के दायां खंभे की ओर की सीमा, जिसे मायने के रूप में उसके मोमेंट-उत्पन्न कारक के साथ लिखा जा सकता है :

यह बाउंड हर सकारात्मक ,के लिए सत्य होता है, इसलिए हम सबसे निचला और उच्चतम को न्यूनतम मान ले सकते हैं:

इसी तरह के विश्लेषण को नकारात्मक के साथ करने से हम बाएं खंभे की समान बाउंड प्राप्त करते हैं:

और

मात्रा अपेक्षा मूल्य के रूप में व्यक्त किया जा सकता है , या समकालिक रूप में लिखा जा सकता है

गुण

घाती संख्या के लिए तार्किक समान लिया जा सकता है क्योंकि एक्सपोनेंशियल फ़ंक्शन अभिप्रेत है, इसलिए जेनसेन की असम्भाविता के अनुसार होता है। इससे यह प्राप्त होता है कि दायां खंभे की सीमा अवश्य हैं होता है जब ; उसी तरह, बाएं खंभे के लिए बाउंड उचित होता है जब । इसलिए हम दोनों infima को संयोजित कर सकते हैं और दो-तरफी चेरनॉफ बाउंड को परिभाषित कर सकते हैं .

जो मुड़े हुए संचयी वितरण फ़ंक्शन पर ऊपरी सीमा प्रदान करता है (माध्य पर मुड़ा हुआ, माध्यिका पर नहीं)।


दो-तरफी चेर्नॉफ़ बाउंड के लघुगणक को दर फ़ंक्शन (या क्रैमर ट्रांसफॉर्म) के रूप में जाना जाता है । यह लेजेन्ड्रे-फेन्चेल ट्रांसफॉर्मेशन के समतुल्य है|लेजेन्ड्रे-फेन्चेल ट्रांसफॉर्म या संचयी जनरेटिंग फ़ंक्शन का उत्तल संयुग्म , के रूप में परिभाषित:


यहां, मायने उत्पन्न करने के लिए कुम्युलेटिव उत्पन्न कारक फ़ंक्शन का लघुकरण अभिप्रेत है, इसलिए चेरनॉफ बाउंड लघुकरण होना चाहिए। चेरनॉफ बाउंड अपनी अधिकतम मान्यता आवश्यकता के समय प्राप्त करता है, , और अनुवर्तन के तहत समान होता है:.

चेरनॉफ बाउंड केवल तब सटीक होता है जब एकल केंद्रित भार (असमवितरित वितरण) होता है। यह बाउंड केवल सीमित संख्यात्मक मानों के परे या उसके सीमाओं में सत्य होता है, जहां अनंत के लिए निर्धारित होते हैं। असीमित संख्यात्मक मानों के लिए बाउंड कहीं भी सत्य नहीं होता है, हालांकि यह उप-घातीय कारकों (घातीय रूप से तंग) तक स्पर्शोन्मुख रूप से तंग है। व्यक्तिगत क्षण अधिक विश्लेषणात्मक जटिलता की कीमत पर, कड़ी सीमाएं प्रदान कर सकते हैं।[7]

व्यावहारिक रूप में, सटीक चेरनॉफ बाउंड को असामर्थ्यपूर्ण या विश्लेषणात्मक रूप से मूल्यांकित करना कठिन हो सकता है, जिसके परिणामस्वरूप प्रतीक्षित कुम्युलेटिव वितरण फ़ंक्शन के ऊपरी सीमा (या कुम्युलेटिव उत्पन्न कारक) के लिए उचित ऊपरी बाउंड प्रयोग किया जा सकता है (जैसे कि उप-उपवाकीय सीजीएफ जो उप-गौसिय चेरनॉफ बाउंड देता है)।

सामान्य वितरण के लिए सटीक दर फ़ंक्शन और चेर्नॉफ़ सीमाएं
वितरण
सामान्य वितरण
बर्नौली वितरण (नीचे विस्तृत)
मानक बर्नौली

(H बाइनरी एन्ट्रॉपी फ़ंक्शन है)

रेडमेकर वितरण
गामा वितरण
ची-वर्ग वितरण [8]
पोइसन वितरण

एमजीएफ से निचली सीमा

मात्रात्मक उत्पन्न कारक का उपयोग करके, डेली-जयग्मंद असम्भवता को , पर लागू करके, पूर्विक को कोण प्राप्त किया जा सकता है, जो खंभे की संभावनाओं पर निचला बाउंड प्रदान करता है:

(नकारात्मक के लिए बाईं पूंछ पर बाउंड प्राप्त किया जाता है) हालाँकि, चेर्नॉफ़ बाउंड के विपरीत, यह परिणाम तेजी से तंग नहीं है।

थियोडोसोपोलोस[9] ने बाउंड का निर्माण किया (जो अधिक) जैसे एक्सपोनेंशियलघातीय झुकाव प्रक्रिया का उपयोग करके ज्यादा सत्य होता है।

विशेष (जैसे कि द्विपद वितरण) वितरणों के लिए, चेरनॉफ बाउंड के समान घातीय क्रम की निचली सीमाएं अक्सर उपलब्ध होती हैं।

स्वतंत्र यादृच्छिक चर का योग

जब X, n अलग-अलग औपचारिक क्रमिक चरणिका X1, ..., Xn, के n निर्दिष्ट निर्देशांकों का योग होता है, तो X का उत्पन्न कारक उत्पन्नकों के व्यक्तिगत उत्पन्नकों के गुणक का होता है, जिससे प्राप्त होता है:

 

 

 

 

(1)

और:

विशिष्ट चेर्नॉफ़ सीमाएँ क्षण-उत्पन्न करने वाले फ़ंक्शन की गणना करके प्राप्त की जाती हैं यादृच्छिक चर के विशिष्ट उदाहरणों के लिए .

जब यादृच्छिक निर्दिष्टानुसार भी अद्यतित रहते हैं (स्वतंत्र और समान रूप से वितरित यादृच्छिक चर),जब यादृच्छिक निर्दिष्टानुसार भी अद्यतित रहते हैं (आईआईडी), तो योग के लिए चेरनॉफ बाउंड को एकल चरणिक बाउंड का सरल पुनः-मापन मान लेते हैं। अर्थात, आईआईडी चरणिका योग के लिए चेरनॉफ बाउंड n वाली एकल चरणिका बाउंड की n वाली शक्ति के समान होती है (क्रामर का सिद्धांत देखें)।

स्वतंत्र परिबद्ध यादृच्छिक चरों का योग

चेर्नॉफ़ सीमाएं उनके वितरण की परवाह किए बिना, स्वतंत्र, बंधे हुए यादृच्छिक चर के सामान्य योगों पर भी लागू की जा सकती हैं; इसे होफ़डिंग की असमानता के रूप में जाना जाता है। प्रमाण अन्य चेरनॉफ़ सीमाओं के समान दृष्टिकोण का अनुसरण करता है, लेकिन क्षण उत्पन्न करने वाले कार्यों को बाध्य करने के लिए होएफ़डिंग की लेम्मा को लागू करता है (होएफ़डिंग की असम्भवता देखें)।

हेफ़ोडिंग की असम्भवता: मानें X1, ..., Xn सांख्यिकीय स्वतंत्रता यादृच्छिक चर हैं जो मान लेते हैं [a,b]. होने देना X को उनके योग का दर्शाता है और μ = E[X]उनके योग की अपेक्षित मान दर्शाता है। तब किसी भी ,

स्वतंत्र बर्नौली यादृच्छिक चर का योग

निम्न खंडों में दिए गए बर्नौली यादृच्छिक चरणिकाओं के लिए बाउंड, उस तथ्य का उपयोग करके निर्मित किए गए है कि बर्नौली यादृच्छिक चरणिका के लिए, 1 होने की संभावना p होती है।

चेरनॉफ बाउंड के कई प्रकार हो सकते हैं: मूल्यमान के साथ तुलनात्मक त्रुटि को बाउंड करने वाला मूलभूत जोड़ने का रूप (जो वास्तविक त्रुटि पर बाउंड देता है) या अधिक व्यावहारिक गुणकारी रूप (जो त्रुटि को माध्य के प्रति संबंधित बाउंड करता है)।

गुणात्मक रूप (सापेक्ष त्रुटि)

यदि X1, ..., Xn स्वतंत्र यादृच्छिक चरणिका हैं जो {0, 1}. मान लेते हैं, तो X को उनके योग का दर्शाता है औ μ = E[X] योग की अपेक्षित मान दर्शाता है। तब किसी भी δ > 0 । के लिए,

यह दिखाने के लिए समान प्रमाण रणनीति का उपयोग करके दिखाया जा सकता है कि 0 < δ < 1 के लिए,

उपरोक्त सूत्र अक्सर अव्यवस्थित होता है, इसलिए आधारभूत लेकिन अधिक सुविधाजनक बाउंड[10] उपयोग किए जाते हैं, जो लॉगरिद्धि समानताओं की सूची से अवधारित असमानता का पालन करते हैं:

ध्यान दें कि ये बाउंड जीर्ण होते हैं जब

योगात्मक रूप (पूर्ण त्रुटि)

निम्नलिखित प्रमाण वासिली होफ़डिंग के द्वारा है और इसलिए इसे चेरनॉफ-हेफोडिंग प्रमाण कहा जाता है।[11]

चेरनॉफ-हेफोडिंग प्रमाण: मानें X1, ..., Xn i.i.d. यादृच्छिक चरणिका हैं, जो{0, 1}. मान लेते हैं। p = E[X1] और ε > 0 हों।.
जहाँ
क्रमशः पैरामीटर x और y के साथ बर्नौली वितरण यादृच्छिक चर के बीच कुल्बैक-लीबलर विचलन है। यदि p1/2, है, तो है, जिसका अर्थ है

इसके साथ सुगम बाउंड D(p + ε || p) ≥ 2ε2, का उपयोग करके, जो D(p + ε || p) की उत्तलता और तथ्य के कारण से होता है

यह परिणाम होफ़डिंग की असमानता का विशेष मामला है। कभी-कभी, बाउंड्स

जो p < 1/8, के लिए मजबूत हैं, भी इस्तेमाल किए जाते हैं।

अनुप्रयोग

विरल ग्राफ नेटवर्क में सेट संतुलन और पैकेट (सूचना प्रौद्योगिकी) मार्ग में चेर्नॉफ़ सीमा के बहुत उपयोगी अनुप्रयोग हैं।

सांख्यिकीय प्रयोगों को डिज़ाइन करते समय सेट संतुलन की समस्या उत्पन्न होती है। आम तौर पर सांख्यिकीय प्रयोग को डिजाइन करते समय, प्रयोग में प्रत्येक भागीदार की विशेषताओं को देखते हुए, हमें यह जानना होगा कि प्रतिभागियों को 2 असंयुक्त समूहों में कैसे विभाजित किया जाए ताकि प्रत्येक विशेषता दोनों समूहों के बीच यथासंभव संतुलित हो।[12] चेर्नॉफ़ सीमा का उपयोग क्रमपरिवर्तन रूटिंग समस्याओं के लिए तंग सीमा प्राप्त करने के लिए भी किया जाता है जो विरल नेटवर्क में पैकेट को रूट करते समय नेटवर्क संकुलन भीड़ को कम करता है।[12]

चेर्नॉफ़ सीमाओं का उपयोग कम्प्यूटेशनल शिक्षण सिद्धांत में यह साबित करने के लिए किया जाता है कि लर्निंग एल्गोरिदम संभवतः लगभग सही लर्निंग है, अर्थात् उच्च संभावना के साथ एल्गोरिदम में पर्याप्त बड़े प्रशिक्षण डेटा सेट पर छोटी त्रुटि होती है।[13] यादृच्छिकरण के साथ इसके गड़बड़ी स्थान की खोज करके किसी एप्लिकेशन/एल्गोरिदम की मजबूती के स्तर का मूल्यांकन करने के लिए चेर्नॉफ़ सीमा का प्रभावी ढंग से उपयोग किया जा सकता है।[14] चेर्नॉफ़ बाउंड का उपयोग किसी को मजबूत - और अधिकतर अवास्तविक - छोटी गड़बड़ी परिकल्पना (परटर्बेशन परिमाण छोटा है) को त्यागने की अनुमति देता है। मजबूती स्तर का उपयोग, बदले में, किसी विशिष्ट एल्गोरिथम विकल्प, हार्डवेयर कार्यान्वयन या किसी समाधान की उपयुक्तता को मान्य या अस्वीकार करने के लिए किया जा सकता है, जिसके संरचनात्मक पैरामीटर अनिश्चितताओं से प्रभावित होते हैं।

चेर्नॉफ़ सीमा का सरल और सामान्य उपयोग यादृच्छिक एल्गोरिदम को बढ़ावा देने के लिए है। यदि किसी के पास एल्गोरिदम है जो अनुमान लगाता है कि संभावना पी> 1/2 के साथ वांछित उत्तर है, तो कोई एल्गोरिदम चलाकर उच्च सफलता दर प्राप्त कर सकता है समय और अनुमान आउटपुट करना जो एल्गोरिदम के n/2 रन से अधिक आउटपुट है। (पिजनहोल सिद्धांत द्वारा ऐसे से अधिक अनुमान नहीं हो सकते हैं।) यह मानते हुए कि ये एल्गोरिदम रन स्वतंत्र हैं, n/2 से अधिक अनुमानों के सही होने की संभावना इस संभावना के बराबर है कि स्वतंत्र बर्नौली यादृच्छिक चर का योग Xk जो कि 1 है और प्रायिकता p, n/2 से अधिक है। ऐसा कम से कम करके तो दिखाया जा सकता है गुणक चेर्नॉफ़ बाउंड के माध्यम से (सिंक्लेयर के क्लास नोट्स में परिणाम 13.3, μ = np).[15]:


मैट्रिक्स चेर्नॉफ़ बाउंड

रूडोल्फ अहलस्वेड और एंड्रियास विंटर ने मैट्रिक्स-मूल्यवान यादृच्छिक चर के लिए चेर्नॉफ़ बाउंड पेश किया।[16] असमानता का निम्नलिखित संस्करण ट्रॉप के काम में पाया जा सकता है।[17]

होने देना M1, ..., Mt स्वतंत्र मैट्रिक्स मान वाले यादृच्छिक चर बनें और . आइए हम इसे निरूपित करें मैट्रिक्स का ऑपरेटर मानदंड . यदि लगभग सभी के लिए निश्चित रूप से धारण करता है , फिर प्रत्येक के लिए ε > 0

ध्यान दें कि यह निष्कर्ष निकालने के लिए कि 0 से विचलन परिबद्ध है ε उच्च संभावना के साथ, हमें कई नमूने चुनने की आवश्यकता है के लघुगणक के समानुपाती . सामान्य तौर पर, दुर्भाग्य से, पर निर्भरता अपरिहार्य है: उदाहरण के लिए आयाम का विकर्ण यादृच्छिक संकेत मैट्रिक्स लें . टी स्वतंत्र नमूनों के योग का ऑपरेटर मानदंड सटीक रूप से लंबाई टी के डी स्वतंत्र यादृच्छिक वॉक के बीच अधिकतम विचलन है। निरंतर संभावना के साथ अधिकतम विचलन पर निश्चित सीमा प्राप्त करने के लिए, यह देखना आसान है कि इस परिदृश्य में t को d के साथ लघुगणकीय रूप से बढ़ना चाहिए।[18]

आयामों पर निर्भरता से बचने के लिए, यह मानकर निम्नलिखित प्रमेय प्राप्त किया जा सकता है कि एम की रैंक निम्न है।

आयामों पर निर्भरता के बिना प्रमेय

मान ले 0 < ε < 1 हो और M यादृच्छिक सममित वास्तविक मैट्रिक्स हो जिसके लिए और होता है लगभग निश्चितता के साथ, मान लें कि M के समर्थन में प्रत्येक तत्व मानक r से अधिकतम अवर्ध होता है। सेट करें

यदि लगभग निश्चितता के साथ माना जाता है, तो

यहाँ M1, ..., Mt की i.i.d. प्रतिलिपियाँ हैं।

नमूना संस्करण

चेर्नॉफ़ के बाउंड का निम्नलिखित संस्करण प्रयोग किया जा सकता है जो आवदेन परिभाषित करने के लिए उपयुक्त है, जिसमें जनसंख्या में बहुमत नमूने में अल्पसंख्यक बन जाएगा, या इसके विपरीत।[19]

मान लीजिये कि सामान्य जनसंख्या A है और उप-जनसंख्या B ⊆ A है। उप-जनसंख्या का सापेक्षिक आकार (|B|/|A|) को r से चिह्नित करता है।

मान लीजिए कि हम पूर्णांक k और यादृच्छिक नमूना S ⊂ A चुनते हैं, जिसका आकार k है। नमूने में उप-जनसंख्या का सापेक्षिक आकार (|BS|/|S|) को rS से चिह्नित करते है।

फिर, प्रत्येक भिन्न d ∈ [0,1] के लिए:

विशेष रूप से, यदि B A में बहुमत है (अर्थात् r > 0.5) तो हम निम्नलिखित लेकर बाउंड कर सकते हैं कि B S में अधिकांश रहेगा S(rS > 0.5):d = 1 − 1/(2r): [20]

यह बाउंड बिल्कुल सटीक नहीं है। उदाहरण के लिए, जब r = 0.5 ता है, हमें साधारण बाउंड प्राप्त होता है: Prob > 0।

प्रमाण

गुणात्मक रूप

गुणक चेर्नॉफ़ बाउंड की शर्तों का पालन करते हुए, X1, ..., Xn स्वतंत्र बर्नौली यादृच्छिक चर है, जिसका योग X है, जहाँ प्रत्येक घटक को 1 होने की की प्रायिकता pi के बराबर होती है। बर्नौली चर के लिए:

इसलिए, (1) का उपयोग करते हुए, जहाँ और यहाँ है, और यहाँ है,

यदि हम t = log(1 + δ) सेट करें ताकि t > 0 हो (जब δ > 0 हो), तो हम स्थानापन्न सकते हैं और प्राप्त करते हैं

यह हमारी वांछित परिणाम को सिद्ध करता है।

चेर्नॉफ़-होफ़डिंग प्रमेय (योगात्मक रूप)

q = p + ε मानते हुए (1) में a = nq लेते हैं, हम प्राप्त करते हैं:

अब, Pr(Xi = 1) = p, Pr(Xi = 0) = 1 − p, होने के कारण हमें मिलता है

इसलिए, हम तुरंत त्रिगणित का उपयोग करके अन्तिम सीमा की गणना कर सकते हैं:

समीकरण को शून्य पर सेट करना और हल करना, हमारे पास है

ताकि

इस प्रकार,

q = p + ε > p, होने के कारण हम देखते हैं कि t > 0, इसलिए हमारा बाउंड t पर संतुष्ट होता है। t के लिए समीकरणों में वापस प्रविष्ट करने से हम पाते हैं: