एंट्रॉपी कोडिंग: Difference between revisions

From Vigyanwiki
(Created page with "{{Short description|Lossless data compression scheme}} {{more footnotes|date=December 2013}} सूचना सिद्धांत में, एक एंट्रॉ...")
 
No edit summary
Line 1: Line 1:
{{Short description|Lossless data compression scheme}}
{{Short description|Lossless data compression scheme}}
{{more footnotes|date=December 2013}}
[[सूचना सिद्धांत]] में, एक एन्ट्रॉपी कोडन (या एंट्रॉपी विकोडन) कोई हानि रहित संपीड़न विधि है जो शैनन के [[स्रोत कोडिंग प्रमेय|स्रोत कोडन प्रमेय]] द्वारा घोषित निचली सीमा तक पहुंचने का प्रयास करती है, जो बताता है कि किसी भी हानिरहित डेटा संपीड़न विधि में अपेक्षित कोड लंबाई स्रोत की एन्ट्रापी से अधिक या बराबर होनी चाहिए।<ref>{{Cite journal |last1=Duda |first1=Jarek |last2=Tahboub |first2=Khalid |last3=Gadgil |first3=Neeraj J. |last4=Delp |first4=Edward J. |date=May 2015 |title=हफ़मैन कोडिंग के सटीक प्रतिस्थापन के रूप में असममित अंक प्रणाली का उपयोग|url=https://ieeexplore.ieee.org/document/7170048/;jsessionid=wI8UmMMsBsrAYcNN1Ux2gHW5ReVUf0HhrXFHlaZZVSmlJdKWDIv8!-2026188604 |journal=2015 Picture Coding Symposium (PCS) |pages=65–69 |doi=10.1109/PCS.2015.7170048|isbn=978-1-4799-7783-3 |s2cid=20260346 }}</ref>
[[सूचना सिद्धांत]] में, एक एंट्रॉपी कोडिंग (या एंट्रॉपी एन्कोडिंग) कोई हानि रहित संपीड़न विधि है जो क्लॉड शैनन | शैनन के [[स्रोत कोडिंग प्रमेय]] द्वारा घोषित निचली सीमा तक पहुंचने का प्रयास करती है, जिसमें कहा गया है कि किसी भी दोषरहित डेटा संपीड़न विधि में अपेक्षित कोड लंबाई अधिक या बराबर होनी चाहिए। स्रोत की एन्ट्रापी के लिए।<ref>{{Cite journal |last1=Duda |first1=Jarek |last2=Tahboub |first2=Khalid |last3=Gadgil |first3=Neeraj J. |last4=Delp |first4=Edward J. |date=May 2015 |title=हफ़मैन कोडिंग के सटीक प्रतिस्थापन के रूप में असममित अंक प्रणाली का उपयोग|url=https://ieeexplore.ieee.org/document/7170048/;jsessionid=wI8UmMMsBsrAYcNN1Ux2gHW5ReVUf0HhrXFHlaZZVSmlJdKWDIv8!-2026188604 |journal=2015 Picture Coding Symposium (PCS) |pages=65–69 |doi=10.1109/PCS.2015.7170048|isbn=978-1-4799-7783-3 |s2cid=20260346 }}</ref>
अधिक सटीक रूप से, स्रोत कोडिंग प्रमेय बताता है कि किसी भी स्रोत वितरण के लिए, अपेक्षित कोड लंबाई संतुष्ट करती है <math>\operatorname E_{x\sim P}[\ell(d(x))] \geq \operatorname E_{x\sim P}[-\log_b(P(x))]</math>, कहाँ <math>\ell</math> एक कोड शब्द में प्रतीकों की संख्या है, <math>d</math> कोडिंग समारोह है, <math>b</math> आउटपुट कोड और बनाने के लिए उपयोग किए जाने वाले प्रतीकों की संख्या है <math>P</math> स्रोत प्रतीक की संभावना है। एक एंट्रॉपी कोडिंग इस निचली सीमा तक पहुंचने का प्रयास करती है।


[[हफ़मैन कोडिंग]] और [[अंकगणितीय कोडिंग]] दो सबसे आम एन्ट्रॉपी कोडिंग तकनीकें हैं। <रेफरी नाम = हफमैन 1952 पीपी। 1098-1101>{{cite journal |last=Huffman |first=David |title=न्यूनतम अतिरेक कोड के निर्माण के लिए एक विधि|journal=Proceedings of the IRE |publisher=Institute of Electrical and Electronics Engineers (IEEE) |volume=40 |issue=9 |year=1952 |issn=0096-8390 |doi=10.1109/jrproc.1952.273898 |pages=1098–1101}}</ref>
अधिक यथार्थ रूप से, स्रोत कोडन प्रमेय बताता है कि किसी भी स्रोत वितरण के लिए, अपेक्षित कोड लंबाई <math>\operatorname E_{x\sim P}[\ell(d(x))] \geq \operatorname E_{x\sim P}[-\log_b(P(x))]</math> को संतुष्ट करती है, जहां <math>\ell</math> कोड शब्द में प्रतीकों की संख्या है, <math>d</math> कोडन फलन है, <math>b</math> निर्गम कोड बनाने के लिए उपयोग किए जाने वाले प्रतीकों की संख्या है और <math>P</math> स्रोत प्रतीक की प्रायिकता है। एक एन्ट्रॉपी कोडन इस निचली सीमा तक पहुंचने का प्रयास करती है।
यदि डेटा स्ट्रीम की अनुमानित एंट्रॉपी विशेषताओं को पहले से जाना जाता है (विशेष रूप से सिग्नल संपीड़न के लिए), एक सरल स्थिर कोड उपयोगी हो सकता है।
इन स्टैटिक कोड में यूनिवर्सल कोड (डेटा कंप्रेशन) (जैसे [[एलियास गामा कोडिंग]] या [[फाइबोनैचि कोडिंग]]) और [[गोलोम्ब कोडिंग]] (जैसे [[यूनरी कोडिंग]] या [[ चावल कोडिंग ]]) शामिल हैं।


2014 के बाद से, डेटा कंप्रेशर्स ने एन्ट्रापी कोडिंग तकनीकों के [[असममित अंक प्रणाली]] परिवार का उपयोग करना शुरू कर दिया है, जो हफ़मैन कोडिंग के समान प्रसंस्करण लागत के साथ अंकगणितीय कोडिंग के संपीड़न अनुपात के संयोजन की अनुमति देता है।
[[हफ़मैन कोडिंग|हफ़मैन कोडन]] और [[अंकगणितीय कोडिंग|अंकगणितीय कोडन]] दो सबसे सामान्य एन्ट्रॉपी कोडन तकनीकें हैं।
 
<रेफरी नाम = हफमैन 1952 पीपी। 1098-1101>{{cite journal |last=Huffman |first=David |title=न्यूनतम अतिरेक कोड के निर्माण के लिए एक विधि|journal=Proceedings of the IRE |publisher=Institute of Electrical and Electronics Engineers (IEEE) |volume=40 |issue=9 |year=1952 |issn=0096-8390 |doi=10.1109/jrproc.1952.273898 |pages=1098–1101}}<nowiki></ref></nowiki>
 
यदि डेटा स्ट्रीम की अनुमानित एंट्रॉपी विशेषताओं को पहले से जाना जाता है (विशेष रूप से संकेत संपीड़न के लिए), एक सरल स्थिर कोड उपयोगी हो सकता है। इन स्थैतिक कोड में सार्वभौमिक कोड (डेटा संपीडन) (जैसे [[एलियास गामा कोडिंग|एलियास गामा कोडन]] या [[फाइबोनैचि कोडिंग|फाइबोनैचि कोडन]]) और [[गोलोम्ब कोडिंग|गोलोम्ब कोडन]] (जैसे [[यूनरी कोडिंग|यूनरी कोडन]] या [[ चावल कोडिंग |गोलोम्ब कोडन]]) सम्मिलित हैं।
 
2014 के बाद से, डेटा संपीडन ने एन्ट्रापी कोडन तकनीकों के [[असममित अंक प्रणाली]] वर्ग का उपयोग करना प्रारम्भ कर दिया है, जो हफ़मैन कोडन के समान प्रसंस्करण लागत के साथ अंकगणितीय कोडन के संपीड़न अनुपात के संयोजन की अनुमति देते है।


== समानता के उपाय के रूप में एंट्रॉपी ==
== समानता के उपाय के रूप में एंट्रॉपी ==


डिजिटल डेटा को संपीड़ित करने के तरीके के रूप में एंट्रॉपी कोडिंग का उपयोग करने के अलावा, [[आकड़ों का प्रवाह]] और डेटा के पहले से मौजूद वर्गों के बीच समानता माप की मात्रा को मापने के लिए एंट्रॉपी एन्कोडर का भी उपयोग किया जा सकता है। यह डेटा के प्रत्येक वर्ग के लिए एन्ट्रॉपी कोडर/कंप्रेसर उत्पन्न करके किया जाता है; अज्ञात डेटा तब प्रत्येक कंप्रेसर को असम्पीडित डेटा खिलाकर [[सांख्यिकीय वर्गीकरण]] होता है और देखते हैं कि कौन सा कंप्रेसर उच्चतम संपीड़न उत्पन्न करता है। सबसे अच्छा संपीड़न वाला सांकेतिक शब्दों में बदलनेवाला संभवतः उस डेटा पर प्रशिक्षित कोडर है जो अज्ञात डेटा के समान था।
अंकीय डेटा को संपीड़ित करने की विधि के रूप में एन्ट्रॉपी कोडन का उपयोग करने के अतिरिक्त, [[आकड़ों का प्रवाह]] और डेटा के पहले से स्थित वर्गों के बीच समानता माप की मात्रा को मापने के लिए एंट्रॉपी कोडक का भी उपयोग किया जा सकता है। यह डेटा के प्रत्येक वर्ग के लिए एन्ट्रॉपी कोडक/ संपीड़क उत्पन्न करके किया जाता है; अज्ञात डेटा तब प्रत्येक संपीड़क को असम्पीडित डेटा भरण कर [[सांख्यिकीय वर्गीकरण]] होता है और देखते हैं कि कौन सा संपीड़क उच्चतम संपीड़न उत्पन्न करता है। सबसे ठीक संपीड़न वाला सांकेतिक शब्दों में बदलनेवाला संभवतः उस डेटा पर प्रशिक्षित कोडक है जो अज्ञात डेटा के समान था।


== यह भी देखें ==
== यह भी देखें ==
* अंकगणित कोडिंग
* अंकगणित कोडन
* असममित अंक प्रणाली (ANS)
* असममित अंक प्रणाली (एएनएस)
* संदर्भ-अनुकूली बाइनरी अंकगणितीय कोडिंग (सीएबीएसी)
* संदर्भ-अनुकूली द्विआधारी अंकगणितीय कोडन (सीएबीएसी)
* हफ़मैन कोडिंग
* हफ़मैन कोडन
* [[रेंज कोडिंग]]
* [[रेंज कोडिंग|श्रेणी कोडन]]


==संदर्भ==
==संदर्भ==

Revision as of 22:43, 12 June 2023

सूचना सिद्धांत में, एक एन्ट्रॉपी कोडन (या एंट्रॉपी विकोडन) कोई हानि रहित संपीड़न विधि है जो शैनन के स्रोत कोडन प्रमेय द्वारा घोषित निचली सीमा तक पहुंचने का प्रयास करती है, जो बताता है कि किसी भी हानिरहित डेटा संपीड़न विधि में अपेक्षित कोड लंबाई स्रोत की एन्ट्रापी से अधिक या बराबर होनी चाहिए।[1]

अधिक यथार्थ रूप से, स्रोत कोडन प्रमेय बताता है कि किसी भी स्रोत वितरण के लिए, अपेक्षित कोड लंबाई को संतुष्ट करती है, जहां कोड शब्द में प्रतीकों की संख्या है, कोडन फलन है, निर्गम कोड बनाने के लिए उपयोग किए जाने वाले प्रतीकों की संख्या है और स्रोत प्रतीक की प्रायिकता है। एक एन्ट्रॉपी कोडन इस निचली सीमा तक पहुंचने का प्रयास करती है।

हफ़मैन कोडन और अंकगणितीय कोडन दो सबसे सामान्य एन्ट्रॉपी कोडन तकनीकें हैं।

<रेफरी नाम = हफमैन 1952 पीपी। 1098-1101>Huffman, David (1952). "न्यूनतम अतिरेक कोड के निर्माण के लिए एक विधि". Proceedings of the IRE. Institute of Electrical and Electronics Engineers (IEEE). 40 (9): 1098–1101. doi:10.1109/jrproc.1952.273898. ISSN 0096-8390.</ref>

यदि डेटा स्ट्रीम की अनुमानित एंट्रॉपी विशेषताओं को पहले से जाना जाता है (विशेष रूप से संकेत संपीड़न के लिए), एक सरल स्थिर कोड उपयोगी हो सकता है। इन स्थैतिक कोड में सार्वभौमिक कोड (डेटा संपीडन) (जैसे एलियास गामा कोडन या फाइबोनैचि कोडन) और गोलोम्ब कोडन (जैसे यूनरी कोडन या गोलोम्ब कोडन) सम्मिलित हैं।

2014 के बाद से, डेटा संपीडन ने एन्ट्रापी कोडन तकनीकों के असममित अंक प्रणाली वर्ग का उपयोग करना प्रारम्भ कर दिया है, जो हफ़मैन कोडन के समान प्रसंस्करण लागत के साथ अंकगणितीय कोडन के संपीड़न अनुपात के संयोजन की अनुमति देते है।

समानता के उपाय के रूप में एंट्रॉपी

अंकीय डेटा को संपीड़ित करने की विधि के रूप में एन्ट्रॉपी कोडन का उपयोग करने के अतिरिक्त, आकड़ों का प्रवाह और डेटा के पहले से स्थित वर्गों के बीच समानता माप की मात्रा को मापने के लिए एंट्रॉपी कोडक का भी उपयोग किया जा सकता है। यह डेटा के प्रत्येक वर्ग के लिए एन्ट्रॉपी कोडक/ संपीड़क उत्पन्न करके किया जाता है; अज्ञात डेटा तब प्रत्येक संपीड़क को असम्पीडित डेटा भरण कर सांख्यिकीय वर्गीकरण होता है और देखते हैं कि कौन सा संपीड़क उच्चतम संपीड़न उत्पन्न करता है। सबसे ठीक संपीड़न वाला सांकेतिक शब्दों में बदलनेवाला संभवतः उस डेटा पर प्रशिक्षित कोडक है जो अज्ञात डेटा के समान था।

यह भी देखें

  • अंकगणित कोडन
  • असममित अंक प्रणाली (एएनएस)
  • संदर्भ-अनुकूली द्विआधारी अंकगणितीय कोडन (सीएबीएसी)
  • हफ़मैन कोडन
  • श्रेणी कोडन

संदर्भ


बाहरी संबंध