सूचना दूरी

From Vigyanwiki
Revision as of 13:25, 24 April 2023 by alpha>Indicwiki (Created page with "सूचना दूरी दो परिमित वस्तुओं (कंप्यूटर फ़ाइलों के रूप में प्रतिन...")
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

सूचना दूरी दो परिमित वस्तुओं (कंप्यूटर फ़ाइलों के रूप में प्रतिनिधित्व) के बीच की दूरी है जो सबसे छोटे कार्यक्रम में बिट्स की संख्या के रूप में व्यक्त की जाती है जो एक वस्तु को दूसरे में या इसके विपरीत एक में बदल देती है। यूनिवर्सल कंप्यूटर। यह कोलमोगोरोव जटिलता का विस्तार है।[1] एकल परिमित वस्तु की कोलमोगोरोव जटिलता उस वस्तु की जानकारी है; परिमित वस्तुओं की एक जोड़ी के बीच की सूचना दूरी एक वस्तु से दूसरी या इसके विपरीत जाने के लिए आवश्यक न्यूनतम जानकारी है। सूचना दूरी को पहली बार में परिभाषित और जांच की गई थी [2] thermodynamic सिद्धांतों पर आधारित, यह भी देखें।[3] इसके बाद, में अंतिम रूप प्राप्त किया।[4] यह सामान्यीकृत संपीड़न दूरी और सामान्यीकृत Google दूरी में लागू होता है।

गुण

औपचारिक रूप से सूचना दूरी बीच में और द्वारा परिभाषित किया गया है

साथ फिक्स्ड यूनिवर्सल कंप्यूटर के लिए एक परिमित बाइनरी प्रोग्राम इनपुट के रूप में बाइनरी स्ट्रिंग्स को परिमित करें . में [4]यह सिद्ध है साथ

कहाँ द्वारा परिभाषित कोलमोगोरोव जटिलता है [1]उपसर्ग प्रकार का।[5] यह महत्वपूर्ण मात्रा है।

सार्वभौमिकता

होने देना ऊपरी अर्द्धगणना योग्य दूरियों का वर्ग हो जो घनत्व की स्थिति को संतुष्ट करता है

यह अप्रासंगिक दूरियों को बाहर करता है जैसे के लिए ; यह इस बात का ध्यान रखता है कि यदि दूरी बढ़ती है तो दी गई वस्तु की उस दूरी के भीतर वस्तुओं की संख्या बढ़ती है। अगर तब एक निरंतर योगात्मक शब्द तक।[4]दूरी की संभाव्यता अभिव्यक्तियाँ सूचना सममित कोहोलॉजी में पहला कोहोमोलॉजिकल वर्ग है,[6] जिसे सार्वभौमिकता संपत्ति के रूप में माना जा सकता है।

मीट्रिक

दूरी एक योज्य तक एक मीट्रिक स्थान है मीट्रिक (इन) समानता में शब्द।[4]1981 में हान द्वारा दिखाया गया मीट्रिक का संभाव्य संस्करण वास्तव में अद्वितीय है।[7]


अधिकतम ओवरलैप

अगर , फिर एक कार्यक्रम होता है लंबाई का जो परिवर्तित हो जाता है को , और एक कार्यक्रम लंबाई का ऐसा है कि कार्यक्रम धर्मान्तरित को . (कार्यक्रम स्व-परिसीमन प्रारूप के होते हैं, जिसका अर्थ है कि कोई यह तय कर सकता है कि एक कार्यक्रम कहाँ समाप्त होता है और दूसरा कार्यक्रमों के संयोजन में शुरू होता है।) अर्थात, दो वस्तुओं के बीच परिवर्तित होने वाले सबसे छोटे कार्यक्रमों को अधिकतम अतिव्यापी बनाया जा सकता है: इसे एक प्रोग्राम में विभाजित किया जा सकता है जो ऑब्जेक्ट को परिवर्तित करता है वस्तु के लिए , और दूसरा प्रोग्राम जो पहले धर्मान्तरित के साथ जुड़ा हुआ है को जबकि इन दो कार्यक्रमों का संयोजन इन वस्तुओं के बीच परिवर्तित करने के लिए सबसे छोटा कार्यक्रम है।[4]


न्यूनतम ओवरलैप

प्रोग्राम वस्तुओं के बीच कनवर्ट करने के लिए और न्यूनतम ओवरलैपिंग भी बनाया जा सकता है। एक कार्यक्रम होता है लंबाई का की योगात्मक अवधि तक वह मानचित्र को और छोटी जटिलता है जब ज्ञात है (). हमारे पास दो वस्तुओं का आदान-प्रदान करने के लिए दूसरा कार्यक्रम है[8] शैनन सूचना सिद्धांत और कोल्मोगोरोव जटिलता सिद्धांत के बीच समानता को ध्यान में रखते हुए, कोई कह सकता है कि यह परिणाम स्लीपियन-वुल्फ कोडिंग | स्लीपियन-वुल्फ और कोर्नर-इमरे सिस्ज़ार-मार्टन प्रमेयों के समानांतर है।

अनुप्रयोग

सैद्धांतिक

An.A का परिणाम। ऊपर न्यूनतम ओवरलैप पर मुचनिक एक महत्वपूर्ण सैद्धांतिक अनुप्रयोग दिखा रहा है कि कुछ कोड मौजूद हैं: किसी भी वस्तु से परिमित लक्ष्य वस्तु पर जाने के लिए एक कार्यक्रम है जो लगभग केवल लक्ष्य वस्तु पर निर्भर करता है! यह परिणाम काफी सटीक है और त्रुटि शब्द में महत्वपूर्ण सुधार नहीं किया जा सकता है।[9] पाठ्यपुस्तक में सूचना दूरी सामग्री थी,[10] यह एनसाइक्लोपीडिया ऑन डिस्टेंस में होता है।[11]


व्यावहारिक

जीनोम, भाषा, संगीत, इंटरनेट हमले और वर्म्स, सॉफ़्टवेयर प्रोग्राम आदि जैसी वस्तुओं की समानता निर्धारित करने के लिए, सूचना दूरी को सामान्यीकृत किया जाता है और कोलमोगोरोव जटिलता की शर्तों को वास्तविक दुनिया कंप्रेशर्स द्वारा अनुमानित किया जाता है (कोलमोगोरोव जटिलता एक निम्न सीमा है वस्तु के एक संकुचित संस्करण के बिट्स में लंबाई)। परिणाम वस्तुओं के बीच सामान्यीकृत संपीड़न दूरी (NCD) है। यह कंप्यूटर फ़ाइलों के रूप में दी गई वस्तुओं से संबंधित है जैसे कि माउस का जीनोम या किसी पुस्तक का पाठ। यदि वस्तुओं को सिर्फ 'आइंस्टीन' या 'टेबल' या किसी पुस्तक के नाम या 'माउस' नाम से दिया जाता है, तो संपीड़न का कोई मतलब नहीं है। नाम का अर्थ क्या है, इसके बारे में हमें बाहरी जानकारी चाहिए। डेटा बेस (जैसे इंटरनेट) और डेटाबेस को खोजने के साधन (जैसे Google जैसे खोज इंजन) का उपयोग करके यह जानकारी प्रदान की जाती है। डेटा बेस पर प्रत्येक खोज इंजन जो समग्र पृष्ठ गणना प्रदान करता है, सामान्यीकृत Google दूरी (NGD) में उपयोग किया जा सकता है। एन वेरिएबल्स के डेटासेट में सभी सूचनाओं की दूरी और वॉल्यूम, बहुभिन्नरूपी पारस्परिक जानकारी, सशर्त पारस्परिक जानकारी, संयुक्त एन्ट्रापी, कुल सहसंबंधों की गणना के लिए एक पायथन पैकेज उपलब्ध है।[12]


संदर्भ

  1. 1.0 1.1 A.N. Kolmogorov, Three approaches to the quantitative definition of information, Problems Inform. Transmission, 1:1(1965), 1–7
  2. M. Li, P.M.B. Vitanyi, Theory of Thermodynamics of Computation, Proc. IEEE Physics of Computation Workshop, Dallas, Texas, USA, 1992, 42–46
  3. M. Li, P.M.B. Vitanyi, Reversibility and Adiabatic Computation: Trading Time and Space for Energy, Proc. R. Soc. Lond. A 9 April 1996 vol. 452 no. 1947 769–789
  4. 4.0 4.1 4.2 4.3 4.4 C.H. Bennett, P. Gacs, M. Li, P.M.B. Vitanyi, W. Zurek, Information distance, IEEE Transactions on Information Theory, 44:4(1998), 1407–1423
  5. L.A. Levin, Laws of Information Conservation (Nongrowth) and Aspects of the Foundation of Probability Theory, Problems Inform. Transmission, 10:3(1974), 30–35
  6. P. Baudot, The Poincaré-Shannon Machine: Statistical Physics and Machine Learning Aspects of Information Cohomology , Entropy, 21:9 - 881 (2019)
  7. Te Sun Han, A uniqueness of Shannon information distance and related nonnegativity problems, Journal of combinatorics. 6:4 p.320-331 (1981), 30–35
  8. Muchnik, Andrej A. (2002). "सशर्त जटिलता और कोड". Theoretical Computer Science. 271 (1–2): 97–109. doi:10.1016/S0304-3975(01)00033-0.
  9. N.K Vereshchagin, M.V. Vyugin, Independent minimum length programs to translate between given strings, Proc. 15th Ann. Conf. Computational Complexity, 2000, 138–144
  10. M.Hutter, Universal Artificial Intelligence: Sequential Decisions Based on Algorithmic Probability, Springer, 1998
  11. M.M. Deza, E Deza, Encyclopedia of Distances, Springer, 2009, doi:10.1007/978-3-642-00234-2
  12. "InfoTopo: Topological Information Data Analysis. Deep statistical unsupervised and supervised learning - File Exchange - Github". github.com/pierrebaudot/infotopopy/. Retrieved 26 September 2020.


संबंधित साहित्य

  • Arkhangel'skii, A. V.; Pontryagin, L. S. (1990), General Topology I: Basic Concepts and Constructions Dimension Theory, Encyclopaedia of Mathematical Sciences, Springer, ISBN 3-540-18178-4

श्रेणी:सांख्यिकीय दूरी