अधिकतम एन्ट्रापी संभाव्यता वितरण: Difference between revisions
No edit summary |
No edit summary |
||
Line 19: | Line 19: | ||
== मापा स्थिरांक के साथ वितरण == | == मापा स्थिरांक के साथ वितरण == | ||
लागू हित के कई सांख्यिकीय वितरण वे हैं जिनके लिए [[क्षण (गणित)]] या अन्य मापनीय मात्राएँ स्थिरांक होने के लिए बाध्य हैं। [[लुडविग बोल्ट्ज़मान]] द्वारा निम्नलिखित प्रमेय इन बाधाओं के | लागू हित के कई सांख्यिकीय वितरण वे हैं जिनके लिए [[क्षण (गणित)]] या अन्य मापनीय मात्राएँ स्थिरांक होने के लिए बाध्य हैं। [[लुडविग बोल्ट्ज़मान]] द्वारा निम्नलिखित प्रमेय इन बाधाओं के अनुसार संभाव्यता घनत्व का रूप देता है। | ||
=== सतत स्थिति === | === सतत स्थिति === | ||
Line 89: | Line 89: | ||
== उदाहरण == | == उदाहरण == | ||
प्रत्येक संभाव्यता वितरण इस बाधा के तहत तुच्छ रूप से अधिकतम एन्ट्रापी संभाव्यता वितरण है कि वितरण की अपनी एन्ट्रापी है। इसे देखने के लिए घनत्व को | प्रत्येक संभाव्यता वितरण इस बाधा के तहत तुच्छ रूप से एक अधिकतम एन्ट्रापी संभाव्यता वितरण है कि वितरण की अपनी एन्ट्रापी है। इसे देखने के लिए, घनत्व को <math>p(x)=\exp{(\ln{p(x)})}</math> के रूप में फिर से लिखें और उपरोक्त प्रमेय की अभिव्यक्ति से तुलना करें। मापने योग्य फ़ंक्शन के रूप में <math>\ln{p(x)} \rightarrow f(x)</math> को चुनकर और | ||
:<math>\int \exp{(f(x))} f(x) dx=-H</math> | :<math>\int \exp{(f(x))} f(x) dx=-H</math> | ||
स्थिर रहना, <math>p(x)</math> बाधा के | स्थिर रहना, <math>p(x)</math> बाधा के अनुसार अधिकतम एन्ट्रापी संभाव्यता वितरण है | ||
:<math>\int p(x)f(x)dx=-H</math>. | :<math>\int p(x)f(x)dx=-H</math>. | ||
गैर-तुच्छ उदाहरण ऐसे वितरण हैं जो कई बाधाओं के अधीन हैं जो एन्ट्रापी के असाइनमेंट से भिन्न हैं। इन्हें अधिकांश ही प्रक्रिया से | गैर-तुच्छ उदाहरण ऐसे वितरण हैं जो कई बाधाओं के अधीन हैं जो एन्ट्रापी के असाइनमेंट से भिन्न हैं। इन्हें अधिकांश ही प्रक्रिया से प्रारंभ करके <math>\ln{p(x)} \rightarrow f(x)</math> पाया जाता है और उसे ढूँढना <math>f(x)</math> भागों में विभाजित किया जा सकता है। | ||
अधिकतम एन्ट्रापी वितरण के उदाहरणों की एक तालिका लिस्मान (1972)<ref name="ReferenceA">{{cite journal |last1=Lisman |first1=J. H. C. |last2=van Zuylen |first2=M. C. A. |year=1972 |title=सर्वाधिक संभावित आवृत्ति वितरणों की उत्पत्ति पर ध्यान दें|journal=Statistica Neerlandica |volume=26 |issue=1 |pages=19–23 |doi=10.1111/j.1467-9574.1972.tb00152.x}}</ref> और पार्क एंड बेरा (2009) में दी गई है।<ref name="Elsevier">{{cite journal |last1=Park |first1=Sung Y. |last2=Bera |first2=Anil K. |year=2009 |title=अधिकतम एन्ट्रापी ऑटोरेग्रेसिव कंडीशनल हेटेरोस्केडैस्टिसिटी मॉडल|journal=Journal of Econometrics |volume=150 |issue=2 |pages=219–230 |doi=10.1016/j.jeconom.2008.12.014 |url=http://www.wise.xmu.edu.cn/Master/Download/..%5C..%5CUploadFiles%5Cpaper-masterdownload%5C2009519932327055475115776.pdf |access-date=2011-06-02 |citeseerx=10.1.1.511.9750 |archive-url=https://web.archive.org/web/20160307144515/http://wise.xmu.edu.cn/uploadfiles/paper-masterdownload/2009519932327055475115776.pdf |archive-date=2016-03-07 |url-status=dead }}</ref> | |||
=== समान और टुकड़े-टुकड़े समान वितरण === | === समान और टुकड़े-टुकड़े समान वितरण === | ||
अंतराल [ | अंतराल [''a'',''b''] पर [[समान वितरण (निरंतर)]] सभी निरंतर वितरणों के बीच अधिकतम एन्ट्रापी वितरण है जो अंतराल [''a'',''b''] में समर्थित हैं, और इस प्रकार अंतराल के बाहर संभाव्यता घनत्व 0 है। यह एकसमान घनत्व लाप्लास के उदासीनता के सिद्धांत से संबंधित हो सकता है, जिसे कभी-कभी अपर्याप्त कारण का सिद्धांत भी कहा जाता है। अधिक सामान्यतः, यदि हमें अंतराल [''a'',''b''] का एक उपविभाजन ''a''=''a''<sub>0</sub> < ''a''<sub>1</sub> < ... < ''a<sub>k</sub>'' = ''b'' दिया गया है और संभावनाएं p<sub>1</sub>,...,p<sub>k</sub> जो एक में जुड़ती हैं, तो हम इस पर विचार कर सकते हैं सभी सतत वितरणों का वर्ग जैसे कि | ||
:<math>\operatorname{Pr}(a_{j-1}\le X < a_j) = p_j \quad \mbox{ for } j=1,\ldots,k</math> | :<math>\operatorname{Pr}(a_{j-1}\le X < a_j) = p_j \quad \mbox{ for } j=1,\ldots,k</math> | ||
इस वर्ग के लिए अधिकतम एन्ट्रापी वितरण का घनत्व प्रत्येक अंतराल | इस वर्ग के लिए अधिकतम एन्ट्रापी वितरण का घनत्व प्रत्येक अंतराल [a<sub>j-1</sub>,a<sub>j</sub>) पर स्थिर है। परिमित सेट {x<sub>1</sub>,...,x<sub>n</sub>} पर समान वितरण (जो इनमें से प्रत्येक मान के लिए 1/n की संभावना निर्दिष्ट करता है) इस सेट पर समर्थित सभी असतत वितरणों के बीच अधिकतम एन्ट्रापी वितरण है। | ||
=== धनात्मक और निर्दिष्ट माध्य: घातीय वितरण === | === धनात्मक और निर्दिष्ट माध्य: घातीय वितरण === | ||
Line 127: | Line 127: | ||
p(x| \mu, \sigma) = \frac{1}{\sigma \sqrt{2\pi} } e^{ -\frac{(x-\mu)^2}{2\sigma^2} }, | p(x| \mu, \sigma) = \frac{1}{\sigma \sqrt{2\pi} } e^{ -\frac{(x-\mu)^2}{2\sigma^2} }, | ||
</math> | </math> | ||
निर्दिष्ट विचरण σ के साथ (−∞,∞) पर समर्थित सभी वास्तविक | एक निर्दिष्ट विचरण σ<sup>2</sup> (एक विशेष क्षण) के साथ (−∞,∞) पर समर्थित सभी वास्तविक-मूल्यवान वितरणों के बीच अधिकतम एन्ट्रापी है। यही बात तब सच है जब माध्य μ और विचरण σ<sup>2</sup> निर्दिष्ट किया जाता है (पहले दो क्षण), क्योंकि एन्ट्रापी (−∞,∞) पर अनुवाद अपरिवर्तनीय है। इसलिए, सामान्यता की धारणा इन क्षणों से परे न्यूनतम पूर्व संरचनात्मक बाधा लगाती है। (व्युत्पत्ति के लिए विभेदक एन्ट्रापी लेख देखें।) | ||
=== निर्दिष्ट माध्य के साथ असतत वितरण === | === निर्दिष्ट माध्य के साथ असतत वितरण === | ||
सेट पर समर्थित सभी असतत वितरणों के बीच {x<sub>1</sub>,..., | सेट पर समर्थित सभी असतत वितरणों के बीच {x<sub>1</sub>,...,x<sub>''n''</sub>} निर्दिष्ट माध्य μ के साथ, अधिकतम एन्ट्रापी वितरण का आकार निम्नलिखित है: | ||
:<math>\operatorname{Pr}(X=x_k) = Cr^{x_k} \quad\mbox{ for } k=1,\ldots, n</math> | :<math>\operatorname{Pr}(X=x_k) = Cr^{x_k} \quad\mbox{ for } k=1,\ldots, n</math> | ||
जहां धनात्मक स्थिरांक C और r को आवश्यकताओं द्वारा निर्धारित किया जा सकता है कि सभी संभावनाओं का योग 1 होना चाहिए और अपेक्षित मान μ होना चाहिए। | जहां धनात्मक स्थिरांक C और r को आवश्यकताओं द्वारा निर्धारित किया जा सकता है कि सभी संभावनाओं का योग 1 होना चाहिए और अपेक्षित मान μ होना चाहिए। | ||
उदाहरण के लिए, यदि बड़ी संख्या में N पासे फेंके जाते हैं, और आपको बताया जाता है कि सभी दिखाए गए नंबरों का योग S है। अकेले इस जानकारी के आधार पर, 1, 2 दिखाने वाले पासों की संख्या के लिए उचित धारणा क्या होगी। | उदाहरण के लिए, यदि बड़ी संख्या में N पासे फेंके जाते हैं, और आपको बताया जाता है कि सभी दिखाए गए नंबरों का योग S है। अकेले इस जानकारी के आधार पर, 1, 2..., 6? दिखाने वाले पासों की संख्या के लिए एक उचित धारणा क्या होगी। यह ऊपर मानी गई स्थिति का एक उदाहरण है, जिसमें, {''x''<sub>1</sub>,...,''x''<sub>6</sub>} = {1,...,6} और μ = ''S''/''N हैं''। | ||
अंत में, अनंत सेट पर समर्थित सभी असतत वितरणों के बीच <math>\{x_1, x_2,...\}</math> माध्य μ के साथ, अधिकतम एन्ट्रापी वितरण का आकार होता है: | अंत में, अनंत सेट पर समर्थित सभी असतत वितरणों के बीच <math>\{x_1, x_2,...\}</math> माध्य μ के साथ, अधिकतम एन्ट्रापी वितरण का आकार होता है: | ||
Line 153: | Line 153: | ||
निरंतर यादृच्छिक वेरिएबल की एन्ट्रापी पर ऊपरी सीमा उपस्थित होती है <math>\mathbb R</math> निर्दिष्ट माध्य, विचरण और तिरछापन के साथ। चूँकि, ऐसा कोई वितरण नहीं है जो इस ऊपरी सीमा को प्राप्त करता हो, क्योंकि <math>p(x) = c\exp{(\lambda_1x+\lambda_2x^2+\lambda_3x^3)}</math> जब असीमित है <math>\lambda_3 \neq 0</math> (देखें कवर और थॉमस (2006: अध्याय 12))। | निरंतर यादृच्छिक वेरिएबल की एन्ट्रापी पर ऊपरी सीमा उपस्थित होती है <math>\mathbb R</math> निर्दिष्ट माध्य, विचरण और तिरछापन के साथ। चूँकि, ऐसा कोई वितरण नहीं है जो इस ऊपरी सीमा को प्राप्त करता हो, क्योंकि <math>p(x) = c\exp{(\lambda_1x+\lambda_2x^2+\lambda_3x^3)}</math> जब असीमित है <math>\lambda_3 \neq 0</math> (देखें कवर और थॉमस (2006: अध्याय 12))। | ||
चूँकि, एन्ट्रापी अधिकतम है {{mvar|ε}}-प्राप्त करने योग्य: वितरण की एन्ट्रापी मनमाने ढंग से ऊपरी सीमा के करीब हो सकती है। निर्दिष्ट माध्य और विचरण के सामान्य वितरण से प्रारंभ करें। धनात्मक तिरछा परिचय देने के लिए, कई मान पर सामान्य वितरण को छोटी राशि से ऊपर की ओर परेशान करें {{mvar|σ}} माध्य से बड़ा. तिरछापन, तीसरे क्षण के समानुपाती होने के कारण, निचले क्रम के क्षणों की तुलना में अधिक प्रभावित होगा। | चूँकि, एन्ट्रापी अधिकतम है {{mvar|ε}}-प्राप्त करने योग्य: वितरण की एन्ट्रापी मनमाने ढंग से ऊपरी सीमा के करीब हो सकती है। निर्दिष्ट माध्य और विचरण के सामान्य वितरण से प्रारंभ करें। धनात्मक तिरछा परिचय देने के लिए, कई मान पर सामान्य वितरण को छोटी राशि से ऊपर की ओर परेशान करें {{mvar|σ}} माध्य से बड़ा. तिरछापन, तीसरे क्षण के समानुपाती होने के कारण, निचले क्रम के क्षणों की तुलना में अधिक प्रभावित होगा। | ||
Revision as of 11:20, 13 July 2023
सांख्यिकी और सूचना सिद्धांत में, अधिकतम एन्ट्रापी संभाव्यता वितरण में सूचना एन्ट्रापी होती है जो कम से कम संभाव्यता वितरण के निर्दिष्ट वर्ग के अन्य सभी सदस्यों जितनी महान होती है। अधिकतम एन्ट्रापी के सिद्धांत के अनुसार, यदि किसी वितरण के बारे में कुछ भी ज्ञात नहीं है, अतिरिक्त इसके कि वह निश्चित वर्ग (सामान्यतः निर्दिष्ट गुणों या मापों के संदर्भ में परिभाषित) से संबंधित है, तो सबसे बड़ी एन्ट्रापी वाले वितरण को सबसे कम जानकारी वाले डिफ़ॉल्ट के रूप में चुना जाना चाहिए। प्रेरणा दुगनी है: सबसे पहले, एन्ट्रापी को अधिकतम करने से वितरण में निर्मित पूर्व संभाव्यता की मात्रा कम हो जाती है; दूसरा, कई भौतिक प्रणालियाँ समय के साथ अधिकतम एन्ट्रापी विन्यास की ओर बढ़ती हैं।
एन्ट्रापी और विभेदक एन्ट्रापी की परिभाषा
यदि वितरण के साथ असतत यादृच्छिक वेरिएबल है
फिर की एन्ट्रापी परिभाषित किया जाता है
यदि संभाव्यता घनत्व फ़ंक्शन के साथ सतत यादृच्छिक वेरिएबल है, फिर अंतर एन्ट्रापी परिभाषित किया जाता है[1][2][3]
जब भी होता है तो मात्रा शून्य समझा जाता है।
यह एन्ट्रॉपी (सूचना सिद्धांत), अधिकतम एन्ट्रॉपी का सिद्धांत, और अंतर एन्ट्रॉपी लेखों में वर्णित अधिक सामान्य रूपों का विशेष स्थिति है। अधिकतम एन्ट्रॉपी वितरण के संबंध में, यह एकमात्र आवश्यक है, क्योंकि को अधिकतम करने से अधिक सामान्य रूप भी अधिकतम हो जाएंगे।
लघुगणक का आधार तब तक महत्वपूर्ण नहीं है जब तक कि ही का लगातार उपयोग किया जाता है: आधार के परिवर्तन से केवल एन्ट्रापी में पुनः वृद्धि होती है। सूचना सिद्धांतकार एन्ट्रापी को बिट्स में व्यक्त करने के लिए आधार 2 का उपयोग करना पसंद कर सकते हैं; गणितज्ञ और भौतिक विज्ञानी अधिकांश प्राकृतिक लघुगणक को प्राथमिकता देंगे, जिसके परिणामस्वरूप एन्ट्रापी के लिए नेट्स (इकाई) की एक इकाई बनेगी।
चूँकि, माप का चुनाव एन्ट्रापी और परिणामी अधिकतम एन्ट्रापी वितरण को निर्धारित करने में महत्वपूर्ण है, यद्यपि लेब्सेग माप के सामान्य सहारा को अक्सर "प्राकृतिक" के रूप में बचाव किया जाता है।
मापा स्थिरांक के साथ वितरण
लागू हित के कई सांख्यिकीय वितरण वे हैं जिनके लिए क्षण (गणित) या अन्य मापनीय मात्राएँ स्थिरांक होने के लिए बाध्य हैं। लुडविग बोल्ट्ज़मान द्वारा निम्नलिखित प्रमेय इन बाधाओं के अनुसार संभाव्यता घनत्व का रूप देता है।
सतत स्थिति
मान लीजिए कि वास्तविक संख्याओं का एक संवृत उपसमुच्चय है और हम मापने योग्य फ़ंक्शन, और संख्याओं को निर्दिष्ट करना चुनते हैं। हम सभी वास्तविक-मूल्य वाले यादृच्छिक वेरिएबल के वर्ग पर विचार करते हैं जो (अर्थात् जिसका घनत्व फलन के बाहर शून्य है) पर समर्थित हैं और जो क्षण की शर्तों को पूरा करते हैं:
- यदि में कोई सदस्य है जिसका घनत्व फ़ंक्शन में प्रत्येक स्थान धनात्मक है, और यदि के लिए अधिकतम एन्ट्रापी वितरण उपस्थित है, तो इसकी संभाव्यता घनत्व का निम्न रूप है:
जहां हम मानते हैं कि है। स्थिरांक और लैग्रेंज गुणक , (यह स्थिति सुनिश्चित करती है कि एकता में एकीकृत हो) के साथ बाधित अनुकूलन समस्या का समाधान करते हैं:[4]
करुश-कुह्न-टकर स्थितियों का उपयोग करके, यह दिखाया जा सकता है कि अनुकूलन समस्या का अद्धितीय समाधान है क्योंकि अनुकूलन में उद्देश्य फ़ंक्शन अवतल है।
ध्यान दें कि यदि क्षणिक स्थितियाँ समानताएँ (असमानताओं के अतिरिक्त) हैं, अर्थात,
- फिर बाधा की स्थिति हटा दिया गया है, जिससे लैग्रेंज मल्टीप्लायरों पर अनुकूलन अप्रतिबंधित हो गया है।
असतत स्थिति
मान लीजिए वास्तविक का एक (परिमित या अनंत) असतत उपसमुच्चय है और हम फ़ंक्शन f1,...,fn और n संख्या a1,...,an निर्दिष्ट करना चुनते हैं . हम सभी असतत यादृच्छिक वेरिएबल X के वर्ग C पर विचार करते हैं जो S पर समर्थित हैं और जो n क्षण की शर्तों को पूरा करते हैं
- यदि C का कोई सदस्य उपस्थित है जो S के सभी सदस्यों को धनात्मक संभावना प्रदान करता है और यदि C के लिए अधिकतम एन्ट्रापी वितरण उपस्थित है, तो इस वितरण का निम्नलिखित आकार है:
जहां हम मानते हैं कि और स्थिरांक के साथ विवश अनुकूलन समस्या का समाधान करते हैं:[5]
पुनः, यदि क्षण स्थितियाँ समानताएँ (असमानताओं के अतिरिक्त) हैं, तो बाधा स्थिति अनुकूलन में उपस्थित नहीं है।
समानता बाधाओं के स्थिति में प्रमाण
समानता बाधाओं की स्थिति में, यह प्रमेय विविधताओं की गणना और लैग्रेंज गुणकों के साथ सिद्ध होता है। बाधाओं को इस प्रकार लिखा जा सकता है
हम कार्यात्मक (गणित) पर विचार करते हैं
जहाँ और लैग्रेंज गुणक हैं। शून्यवाँ अवरोध संभाव्यता स्वयंसिद्ध#दूसरा सिद्धांत सुनिश्चित करता है। अन्य बाधाएं यह हैं कि फ़ंक्शन के माप को क्रम के अनुसार स्थिरांक दिए जाते है। जब कार्यात्मक व्युत्पन्न शून्य के बराबर होता है तो एन्ट्रापी चरम सीमा पर पहुंच जाती है:
इसलिए, इस स्थिति में चरम एन्ट्रापी संभाव्यता वितरण () के रूप का होना चाहिए,
याद रखें कि है। यह जाँच कर सत्यापित किया जा सकता है कि यह अधिकतम समाधान है कि इस समाधान के आसपास भिन्नता हमेशा ऋणात्मक होती है।
अधिकतम की विशिष्टता
मान लीजिए कि , अपेक्षा-बाधाओं को संतुष्ट करने वाले वितरण हैं। माने और वितरण पर विचार करने से यह स्पष्ट है कि यह वितरण अपेक्षा-बाधाओं को संतुष्ट करता है और इसके अतिरिक्त का समर्थन करता है। एन्ट्रापी के बारे में मुलभुत तथ्यों से यह माना जाता है कि । क्रमशः सीमा और लेने पर प्राप्त होता है
इसका तात्पर्य यह है कि अपेक्षा-बाधाओं को संतुष्ट करने वाले और एन्ट्रापी को अधिकतम करने वाले वितरण को आवश्यक रूप से पूर्ण समर्थन होना चाहिए। वितरण लगभग प्रत्येक स्थान सकारात्मक है। इसका तात्पर्य यह है कि अधिकतम वितरण अपेक्षा-बाधाओं को संतुष्ट करने वाले वितरण के स्थान में एक आंतरिक बिंदु होना चाहिए, अर्थात यह एक स्थानीय चरम होना चाहिए। इस प्रकार यह दिखाना पर्याप्त है कि स्थानीय चरम अद्वितीय है, दोनों को यह दिखाने के लिए कि एन्ट्रापी-अधिकतम वितरण अद्वितीय है (और इससे यह भी पता चलता है कि स्थानीय चरम वैश्विक अधिकतम है)।
उपरोक्त गणनाओं को पुन: स्वरूपित करते हुए इन्हें पैरामीटर एल, आर से पी(एक्स और इसी तरह) पी, जहां डीएक्स द्वारा चित्रित किया गया है।
मान लीजिए कि स्थानीय चरम सीमाएँ हैं। उपरोक्त गणनाओं को पुन: स्वरूपित करते हुए इन्हें मापदंडों से और इसी तरह के लिए , जहाँ है। अब हम पहचानों की श्रृंखला पर ध्यान देते हैं: अपेक्षा-बाधाओं की संतुष्टि और ग्रेडिएंट/दिशात्मक डेरिवेटिव का उपयोग करके, किसी के पास है और इसी प्रकार के लिए। मान ले कोई प्राप्त करता है:
जहाँ कुछ के लिए हैं। आगे की गणना करना किसी के पास है
जहाँ उपरोक्त वितरण के समान है, केवल पैरामीटरयुक्त है . यह मानते हुए कि वेधशालाओं का कोई भी गैर-तुच्छ रैखिक संयोजन लगभग हर जगह (एई) स्थिर नहीं है, (उदाहरण के लिए यदि वेधशालाएं स्वतंत्र हैं और यानी स्थिर नहीं हैं), तो यह माना जाता है कि गैर-शून्य विचरण है, जब तक कि न हो। उपरोक्त समीकरण से यह स्पष्ट है कि उत्तरार्द्ध स्थिति होना चाहिए। इस तरह , इसलिए स्थानीय एक्स्ट्रेमा की विशेषता बताने वाले पैरामीटर समान हैं, जिसका अर्थ है कि वितरण स्वयं समान हैं। इस प्रकार, स्थानीय चरम अद्वितीय है और उपरोक्त चर्चा के अनुसार, अधिकतम अद्वितीय है - बशर्ते कि स्थानीय चरम वास्तव में उपस्थित हो।
चेतावनी
ध्यान दें कि वितरण के सभी वर्गों में अधिकतम एन्ट्रापी वितरण नहीं होता है। यह संभव है कि किसी वर्ग में मनमाने ढंग से बड़े एन्ट्रॉपी के वितरण हों (उदाहरण के लिए आर पर सभी निरंतर वितरणों का वर्ग जिसका मतलब 0 है किन्तु स्वैच्छिक मानक विचलन है), या कि एन्ट्रॉपी ऊपर सीमित हैं किन्तु कोई वितरण नहीं है जो अधिकतम एन्ट्रॉपी प्राप्त करता है।[lower-alpha 1] यह भी संभव है कि वर्ग सी के लिए अपेक्षित मूल्य प्रतिबंध S के कुछ सबसेट में संभाव्यता वितरण को शून्य होने के लिए विवश करते हैं। उस स्थिति में हमारी प्रमेय लागू नहीं होता है, किन्तु सेट एस को सिकोड़कर कोई इसके आसपास काम कर सकता है।
उदाहरण
प्रत्येक संभाव्यता वितरण इस बाधा के तहत तुच्छ रूप से एक अधिकतम एन्ट्रापी संभाव्यता वितरण है कि वितरण की अपनी एन्ट्रापी है। इसे देखने के लिए, घनत्व को के रूप में फिर से लिखें और उपरोक्त प्रमेय की अभिव्यक्ति से तुलना करें। मापने योग्य फ़ंक्शन के रूप में को चुनकर और
स्थिर रहना, बाधा के अनुसार अधिकतम एन्ट्रापी संभाव्यता वितरण है
- .
गैर-तुच्छ उदाहरण ऐसे वितरण हैं जो कई बाधाओं के अधीन हैं जो एन्ट्रापी के असाइनमेंट से भिन्न हैं। इन्हें अधिकांश ही प्रक्रिया से प्रारंभ करके पाया जाता है और उसे ढूँढना भागों में विभाजित किया जा सकता है।
अधिकतम एन्ट्रापी वितरण के उदाहरणों की एक तालिका लिस्मान (1972)[6] और पार्क एंड बेरा (2009) में दी गई है।[7]
समान और टुकड़े-टुकड़े समान वितरण
अंतराल [a,b] पर समान वितरण (निरंतर) सभी निरंतर वितरणों के बीच अधिकतम एन्ट्रापी वितरण है जो अंतराल [a,b] में समर्थित हैं, और इस प्रकार अंतराल के बाहर संभाव्यता घनत्व 0 है। यह एकसमान घनत्व लाप्लास के उदासीनता के सिद्धांत से संबंधित हो सकता है, जिसे कभी-कभी अपर्याप्त कारण का सिद्धांत भी कहा जाता है। अधिक सामान्यतः, यदि हमें अंतराल [a,b] का एक उपविभाजन a=a0 < a1 < ... < ak = b दिया गया है और संभावनाएं p1,...,pk जो एक में जुड़ती हैं, तो हम इस पर विचार कर सकते हैं सभी सतत वितरणों का वर्ग जैसे कि
इस वर्ग के लिए अधिकतम एन्ट्रापी वितरण का घनत्व प्रत्येक अंतराल [aj-1,aj) पर स्थिर है। परिमित सेट {x1,...,xn} पर समान वितरण (जो इनमें से प्रत्येक मान के लिए 1/n की संभावना निर्दिष्ट करता है) इस सेट पर समर्थित सभी असतत वितरणों के बीच अधिकतम एन्ट्रापी वितरण है।
धनात्मक और निर्दिष्ट माध्य: घातीय वितरण
घातीय वितरण, जिसके लिए घनत्व फ़ंक्शन है
[0,∞) में समर्थित सभी निरंतर वितरणों के बीच अधिकतम एन्ट्रापी वितरण है जिसका निर्दिष्ट माध्य 1/λ है।
[0,∞) पर समर्थित वितरण के स्थिति में, अधिकतम एन्ट्रापी वितरण पहले और दूसरे क्षण के बीच संबंधों पर निर्भर करता है। विशिष्ट मामलों में, यह घातीय वितरण हो सकता है, या कोई अन्य वितरण हो सकता है, या अपरिभाषित हो सकता है।[8]
निर्दिष्ट माध्य और विचरण: सामान्य वितरण
सामान्य वितरण N(μ,σ2), जिसके लिए घनत्व फ़ंक्शन है
एक निर्दिष्ट विचरण σ2 (एक विशेष क्षण) के साथ (−∞,∞) पर समर्थित सभी वास्तविक-मूल्यवान वितरणों के बीच अधिकतम एन्ट्रापी है। यही बात तब सच है जब माध्य μ और विचरण σ2 निर्दिष्ट किया जाता है (पहले दो क्षण), क्योंकि एन्ट्रापी (−∞,∞) पर अनुवाद अपरिवर्तनीय है। इसलिए, सामान्यता की धारणा इन क्षणों से परे न्यूनतम पूर्व संरचनात्मक बाधा लगाती है। (व्युत्पत्ति के लिए विभेदक एन्ट्रापी लेख देखें।)
निर्दिष्ट माध्य के साथ असतत वितरण
सेट पर समर्थित सभी असतत वितरणों के बीच {x1,...,xn} निर्दिष्ट माध्य μ के साथ, अधिकतम एन्ट्रापी वितरण का आकार निम्नलिखित है:
जहां धनात्मक स्थिरांक C और r को आवश्यकताओं द्वारा निर्धारित किया जा सकता है कि सभी संभावनाओं का योग 1 होना चाहिए और अपेक्षित मान μ होना चाहिए।
उदाहरण के लिए, यदि बड़ी संख्या में N पासे फेंके जाते हैं, और आपको बताया जाता है कि सभी दिखाए गए नंबरों का योग S है। अकेले इस जानकारी के आधार पर, 1, 2..., 6? दिखाने वाले पासों की संख्या के लिए एक उचित धारणा क्या होगी। यह ऊपर मानी गई स्थिति का एक उदाहरण है, जिसमें, {x1,...,x6} = {1,...,6} और μ = S/N हैं।
अंत में, अनंत सेट पर समर्थित सभी असतत वितरणों के बीच माध्य μ के साथ, अधिकतम एन्ट्रापी वितरण का आकार होता है:
जहां फिर से स्थिरांक सी और आर को आवश्यकताओं द्वारा निर्धारित किया गया था कि सभी संभावनाओं का योग 1 होना चाहिए और अपेक्षित मूल्य μ होना चाहिए। उदाहरण के लिए, उस स्थिति में xk = k, यह देता है
ऐसा कि संबंधित अधिकतम एन्ट्रापी वितरण ज्यामितीय वितरण है।
वृत्ताकार यादृच्छिक वेरिएबल
सतत यादृच्छिक वेरिएबल के लिए यूनिट सर्कल के बारे में वितरित, वॉन मिज़ वितरण एन्ट्रापी को अधिकतम करता है जब पहले दिशात्मक आंकड़ों के वास्तविक और काल्पनिक भाग निर्दिष्ट होते हैं[9] या, समकक्ष, वृत्ताकार माध्य और वृत्ताकार विचरण निर्दिष्ट हैं।
जब कोणों का माध्य और प्रसरण मापांक निर्दिष्ट हैं, लपेटा हुआ सामान्य वितरण एन्ट्रापी को अधिकतम करता है।[9]
निर्दिष्ट माध्य, विचरण और तिरछा के लिए मैक्सिमाइज़र
निरंतर यादृच्छिक वेरिएबल की एन्ट्रापी पर ऊपरी सीमा उपस्थित होती है निर्दिष्ट माध्य, विचरण और तिरछापन के साथ। चूँकि, ऐसा कोई वितरण नहीं है जो इस ऊपरी सीमा को प्राप्त करता हो, क्योंकि जब असीमित है (देखें कवर और थॉमस (2006: अध्याय 12))।
चूँकि, एन्ट्रापी अधिकतम है ε-प्राप्त करने योग्य: वितरण की एन्ट्रापी मनमाने ढंग से ऊपरी सीमा के करीब हो सकती है। निर्दिष्ट माध्य और विचरण के सामान्य वितरण से प्रारंभ करें। धनात्मक तिरछा परिचय देने के लिए, कई मान पर सामान्य वितरण को छोटी राशि से ऊपर की ओर परेशान करें σ माध्य से बड़ा. तिरछापन, तीसरे क्षण के समानुपाती होने के कारण, निचले क्रम के क्षणों की तुलना में अधिक प्रभावित होगा।
यह सामान्य स्थिति का विशेष स्थिति है जिसमें x में किसी भी विषम-क्रम बहुपद का घातांक असीमित होगा . उदाहरण के लिए, इसी तरह अबाधित होगा , किन्तु जब समर्थन सीमित या अर्ध-सीमाबद्ध अंतराल तक सीमित होता है तो ऊपरी एन्ट्रापी सीमा प्राप्त की जा सकती है (उदाहरण के लिए यदि x अंतराल [0,∞] और λ< 0 में स्थित है, तो घातीय वितरण परिणाम होगा)।
निर्दिष्ट माध्य और विचलन जोखिम माप के लिए अधिकतमीकरण
लॉगरिदमिक रूप से अवतल फ़ंक्शन के साथ प्रत्येक वितरण | लॉग-अवतल घनत्व निर्दिष्ट माध्य μ और विचलन जोखिम माप डी के साथ अधिकतम एन्ट्रापी वितरण है।[10] विशेष रूप से, निर्दिष्ट माध्य के साथ अधिकतम एन्ट्रापी वितरण और विचलन है:
- सामान्य वितरण , यदि मानक विचलन है;
- लाप्लास वितरण, यदि औसत निरपेक्ष विचलन है;[6]* प्रपत्र के घनत्व के साथ वितरण यदि मानक निचला अर्ध-विचलन है, जहां , और ए, बी, सी स्थिरांक हैं।[10]
अन्य उदाहरण
नीचे दी गई तालिका में, प्रत्येक सूचीबद्ध वितरण तीसरे कॉलम में सूचीबद्ध कार्यात्मक बाधाओं के विशेष सेट के लिए एन्ट्रापी को अधिकतम करता है, और यह बाधा कि x को संभाव्यता घनत्व के समर्थन में शामिल किया जाता है, जो चौथे कॉलम में सूचीबद्ध है।[6][7]सूचीबद्ध कई उदाहरण (बर्नौली, ज्यामितीय, घातीय, लाप्लास, पेरेटो) तुच्छ रूप से सत्य हैं क्योंकि उनकी संबद्ध बाधाएं उनकी एन्ट्रॉपी के असाइनमेंट के बराबर हैं। उन्हें वैसे भी शामिल किया गया है क्योंकि उनकी बाधा सामान्य या आसानी से मापी जाने वाली मात्रा से संबंधित है। संदर्भ के लिए, गामा फ़ंक्शन है, डिगामा फ़ंक्शन है, बीटा फ़ंक्शन है, और γE यूलर-माशेरोनी स्थिरांक है।
Distribution Name | Probability density/mass function | Maximum Entropy Constraint | Support |
---|---|---|---|
Uniform (discrete) | None | ||
Uniform (continuous) | None | ||
Bernoulli | |||
Geometric | |||
Exponential | |||
Laplace | Failed to parse (Conversion error. Server ("cli") reported: "SyntaxError: Expected "-", "[", "\\", "\\begin", "\\begin{", "]", "^", "_", "{", "}", [ \t\n\r], [%$], [().], [,:;?!'], [/|], [0-9], [><~], [\-+*=], or [a-zA-Z] but "ब" found.in 1:64"): {\displaystyle f(x) = \frac{1}{2b} \exp\left(-\frac{|x - \mu|}{बी}\दाएं)</गणित> || गणित>\ऑपरेटरनाम{E}(|x-\mu|)=b\,} | ||
असममित लाप्लास वितरण | |||
पेरेटो वितरण | |||
सामान्य वितरण | |||
सामान्य वितरण छोटा कर दिया गया | (लेख देखें) | ||
वॉन मिज़ कास्ट | |||
रेले वितरण | |||
बीटा वितरण | के लिए | ||
कॉची वितरण | |||
ची वितरण | |||
ची-वर्ग वितरण|ची-वर्ग | |||
एर्लांग वितरण | |||
गामा वितरण | |||
लॉग-सामान्य वितरण | |||
मैक्सवेल-बोल्ट्ज़मैन | |||
वेइबुल वितरण | |||
बहुभिन्नरूपी सामान्य वितरण | |||
द्विपद वितरण | [11] | ||
पॉइसन वितरण | [11] | ||
लॉजिस्टिक वितरण |
अधिकतम एन्ट्रापी सिद्धांत का उपयोग सांख्यिकीय मिश्रण की एन्ट्रापी को ऊपरी सीमा तक सीमित करने के लिए किया जा सकता है।[12]
यह भी देखें
- घातीय परिवार
- गिब्स माप
- विभाजन फलन (गणित)
- अधिकतम एन्ट्रापी रैंडम वॉक - ग्राफ के लिए एन्ट्रापी दर को अधिकतम करना
टिप्पणियाँ
- ↑ For example, the class of all continuous distributions X on R with E(X) = 0 and E(X2) = E(X3) = 1 (see Cover, Ch 12).
उद्धरण
- ↑ Williams, D. (2001), Weighing the Odds, Cambridge University Press, ISBN 0-521-00618-X (pages 197-199).
- ↑ Bernardo, J. M., Smith, A. F. M. (2000), Bayesian Theory, Wiley. ISBN 0-471-49464-X (pages 209, 366)
- ↑ O'Hagan, A. (1994), Kendall's Advanced Theory of Statistics, Vol 2B, Bayesian Inference, Edward Arnold. ISBN 0-340-52922-9 (Section 5.40)
- ↑ Botev, Z. I.; Kroese, D. P. (2011). "संभाव्यता घनत्व अनुमान के अनुप्रयोगों के साथ सामान्यीकृत क्रॉस एन्ट्रॉपी विधि" (PDF). Methodology and Computing in Applied Probability. 13 (1): 1–27. doi:10.1007/s11009-009-9133-7. S2CID 18155189.
- ↑ Botev, Z. I.; Kroese, D. P. (2008). "असतत डेटा के घनत्व अनुमान के लिए गैर-स्पर्शोन्मुख बैंडविड्थ चयन". Methodology and Computing in Applied Probability. 10 (3): 435. doi:10.1007/s11009-007-9057-z. S2CID 122047337.
- ↑ 6.0 6.1 6.2 Lisman, J. H. C.; van Zuylen, M. C. A. (1972). "सर्वाधिक संभावित आवृत्ति वितरणों की उत्पत्ति पर ध्यान दें". Statistica Neerlandica. 26 (1): 19–23. doi:10.1111/j.1467-9574.1972.tb00152.x.
- ↑ 7.0 7.1 Park, Sung Y.; Bera, Anil K. (2009). "अधिकतम एन्ट्रापी ऑटोरेग्रेसिव कंडीशनल हेटेरोस्केडैस्टिसिटी मॉडल" (PDF). Journal of Econometrics. 150 (2): 219–230. CiteSeerX 10.1.1.511.9750. doi:10.1016/j.jeconom.2008.12.014. Archived from the original (PDF) on 2016-03-07. Retrieved 2011-06-02.
- ↑ Dowson, D.; Wragg, A. (September 1973). "अधिकतम-एन्ट्रापी वितरण जिसमें पहले और दूसरे क्षण निर्धारित हैं". IEEE Transactions on Information Theory (correspondance). 19 (5): 689–693. doi:10.1109/tit.1973.1055060. ISSN 0018-9448.
- ↑ 9.0 9.1 Jammalamadaka, S. Rao; SenGupta, A. (2001). वृत्ताकार सांख्यिकी में विषय. New Jersey: World Scientific. ISBN 978-981-02-3778-3. Retrieved 2011-05-15.
- ↑ 10.0 10.1 Grechuk, B., Molyboha, A., Zabarankin, M. (2009) Maximum Entropy Principle with General Deviation Measures, Mathematics of Operations Research 34(2), 445--467, 2009.
- ↑ 11.0 11.1 Harremös, Peter (2001), "Binomial and Poisson distributions as maximum entropy distributions", IEEE Transactions on Information Theory, 47 (5): 2039–2041, doi:10.1109/18.930936, S2CID 16171405.
- ↑ Frank Nielsen; Richard Nock (2017). "MaxEnt upper bounds for the differential entropy of univariate continuous distributions". IEEE Signal Processing Letters. IEEE. 24 (4): 402-406. Bibcode:2017ISPL...24..402N. doi:10.1109/LSP.2017.2666792. S2CID 14092514.
संदर्भ
- Cover, T. M.; Thomas, J. A. (2006). "Chapter 12, Maximum Entropy" (PDF). Elements of Information Theory (2 ed.). Wiley. ISBN 978-0471241959.
- F. Nielsen, R. Nock (2017), MaxEnt upper bounds for the differential entropy of univariate continuous distributions, IEEE Signal Processing Letters, 24(4), 402-406
- I. J. Taneja (2001), Generalized Information Measures and Their Applications. Chapter 1
- Nader Ebrahimi, Ehsan S. Soofi, Refik Soyer (2008), "Multivariate maximum entropy identification, transformation, and dependence", Journal of Multivariate Analysis 99: 1217–1231, doi:10.1016/j.jmva.2007.08.004