एंट्रॉपी कोडिंग: Difference between revisions
(Created page with "{{Short description|Lossless data compression scheme}} {{more footnotes|date=December 2013}} सूचना सिद्धांत में, एक एंट्रॉ...") |
No edit summary |
||
(4 intermediate revisions by 4 users not shown) | |||
Line 1: | Line 1: | ||
{{Short description|Lossless data compression scheme}} | {{Short description|Lossless data compression scheme}} | ||
[[सूचना सिद्धांत]] में, एक एन्ट्रॉपी कोडन (या एंट्रॉपी विकोडन) कोई हानि रहित संपीड़न विधि है जो शैनन के [[स्रोत कोडिंग प्रमेय|स्रोत कोडन प्रमेय]] द्वारा घोषित निचली सीमा तक पहुंचने का प्रयास करती है, जो बताता है कि किसी भी हानिरहित डेटा संपीड़न विधि में अपेक्षित कोड लंबाई स्रोत की एन्ट्रापी से अधिक या बराबर होनी चाहिए।<ref>{{Cite journal |last1=Duda |first1=Jarek |last2=Tahboub |first2=Khalid |last3=Gadgil |first3=Neeraj J. |last4=Delp |first4=Edward J. |date=May 2015 |title=हफ़मैन कोडिंग के सटीक प्रतिस्थापन के रूप में असममित अंक प्रणाली का उपयोग|url=https://ieeexplore.ieee.org/document/7170048/;jsessionid=wI8UmMMsBsrAYcNN1Ux2gHW5ReVUf0HhrXFHlaZZVSmlJdKWDIv8!-2026188604 |journal=2015 Picture Coding Symposium (PCS) |pages=65–69 |doi=10.1109/PCS.2015.7170048|isbn=978-1-4799-7783-3 |s2cid=20260346 }}</ref> | |||
[[सूचना सिद्धांत]] में, एक | |||
[ | अधिक यथार्थ रूप से, स्रोत कोडन प्रमेय बताता है कि किसी भी स्रोत वितरण के लिए, अपेक्षित कोड लंबाई <math>\operatorname E_{x\sim P}[\ell(d(x))] \geq \operatorname E_{x\sim P}[-\log_b(P(x))]</math> को संतुष्ट करती है, जहां <math>\ell</math> कोड शब्द में प्रतीकों की संख्या है, <math>d</math> कोडन फलन है, <math>b</math> निर्गम कोड बनाने के लिए उपयोग किए जाने वाले प्रतीकों की संख्या है और <math>P</math> स्रोत प्रतीक की प्रायिकता है। एक एन्ट्रॉपी कोडन इस निचली सीमा तक पहुंचने का प्रयास करती है। | ||
2014 के बाद से, डेटा | [[हफ़मैन कोडिंग|हफ़मैन कोडन]] और [[अंकगणितीय कोडिंग|अंकगणितीय कोडन]] दो सबसे सामान्य एन्ट्रॉपी कोडन तकनीकें हैं। | ||
यदि डेटा स्ट्रीम की अनुमानित एंट्रॉपी विशेषताओं को पहले से जाना जाता है (विशेष रूप से संकेत संपीड़न के लिए), एक सरल स्थिर कोड उपयोगी हो सकता है। इन स्थैतिक कोड में सार्वभौमिक कोड (डेटा संपीडन) (जैसे [[एलियास गामा कोडिंग|एलियास गामा कोडन]] या [[फाइबोनैचि कोडिंग|फाइबोनैचि कोडन]]) और [[गोलोम्ब कोडिंग|गोलोम्ब कोडन]] (जैसे [[यूनरी कोडिंग|यूनरी कोडन]] या [[ चावल कोडिंग |गोलोम्ब कोडन]]) सम्मिलित हैं। | |||
2014 के बाद से, डेटा संपीडन ने एन्ट्रापी कोडन तकनीकों के [[असममित अंक प्रणाली]] वर्ग का उपयोग करना प्रारम्भ कर दिया है, जो हफ़मैन कोडन के समान प्रसंस्करण लागत के साथ अंकगणितीय कोडन के संपीड़न अनुपात के संयोजन की अनुमति देते है। | |||
== समानता के उपाय के रूप में एंट्रॉपी == | == समानता के उपाय के रूप में एंट्रॉपी == | ||
अंकीय डेटा को संपीड़ित करने की विधि के रूप में एन्ट्रॉपी कोडन का उपयोग करने के अतिरिक्त, [[आकड़ों का प्रवाह]] और डेटा के पहले से स्थित वर्गों के बीच समानता माप की मात्रा को मापने के लिए एंट्रॉपी कोडक का भी उपयोग किया जा सकता है। यह डेटा के प्रत्येक वर्ग के लिए एन्ट्रॉपी कोडक/ संपीड़क उत्पन्न करके किया जाता है; अज्ञात डेटा तब प्रत्येक संपीड़क को असम्पीडित डेटा भरण कर [[सांख्यिकीय वर्गीकरण]] होता है और देखते हैं कि कौन सा संपीड़क उच्चतम संपीड़न उत्पन्न करता है। सबसे ठीक संपीड़न वाला सांकेतिक शब्दों में बदलनेवाला संभवतः उस डेटा पर प्रशिक्षित कोडक है जो अज्ञात डेटा के समान था। | |||
== यह भी देखें == | == यह भी देखें == | ||
* अंकगणित | * अंकगणित कोडन | ||
* असममित अंक प्रणाली ( | * असममित अंक प्रणाली (एएनएस) | ||
* संदर्भ-अनुकूली | * संदर्भ-अनुकूली द्विआधारी अंकगणितीय कोडन (सीएबीएसी) | ||
* हफ़मैन | * हफ़मैन कोडन | ||
* [[रेंज कोडिंग]] | * [[रेंज कोडिंग|श्रेणी कोडन]] | ||
==संदर्भ== | ==संदर्भ== | ||
Line 29: | Line 29: | ||
* ''[http://iphome.hhi.de/wiegand/assets/pdfs/VBpart1.pdf Source Coding],'' by [[Thomas Wiegand|T. Wiegand]] and H. Schwarz (2011). | * ''[http://iphome.hhi.de/wiegand/assets/pdfs/VBpart1.pdf Source Coding],'' by [[Thomas Wiegand|T. Wiegand]] and H. Schwarz (2011). | ||
[[Category:Created On 08/06/2023]] | [[Category:Created On 08/06/2023]] | ||
[[Category:Lua-based templates]] | |||
[[Category:Machine Translated Page]] | |||
[[Category:Pages with script errors]] | |||
[[Category:Templates Vigyan Ready]] | |||
[[Category:Templates that add a tracking category]] | |||
[[Category:Templates that generate short descriptions]] | |||
[[Category:Templates using TemplateData]] | |||
[[Category:एंट्रॉपी और सूचना]] | |||
[[Category:दोषरहित संपीड़न एल्गोरिदम]] |
Latest revision as of 14:08, 14 June 2023
सूचना सिद्धांत में, एक एन्ट्रॉपी कोडन (या एंट्रॉपी विकोडन) कोई हानि रहित संपीड़न विधि है जो शैनन के स्रोत कोडन प्रमेय द्वारा घोषित निचली सीमा तक पहुंचने का प्रयास करती है, जो बताता है कि किसी भी हानिरहित डेटा संपीड़न विधि में अपेक्षित कोड लंबाई स्रोत की एन्ट्रापी से अधिक या बराबर होनी चाहिए।[1]
अधिक यथार्थ रूप से, स्रोत कोडन प्रमेय बताता है कि किसी भी स्रोत वितरण के लिए, अपेक्षित कोड लंबाई को संतुष्ट करती है, जहां कोड शब्द में प्रतीकों की संख्या है, कोडन फलन है, निर्गम कोड बनाने के लिए उपयोग किए जाने वाले प्रतीकों की संख्या है और स्रोत प्रतीक की प्रायिकता है। एक एन्ट्रॉपी कोडन इस निचली सीमा तक पहुंचने का प्रयास करती है।
हफ़मैन कोडन और अंकगणितीय कोडन दो सबसे सामान्य एन्ट्रॉपी कोडन तकनीकें हैं।
यदि डेटा स्ट्रीम की अनुमानित एंट्रॉपी विशेषताओं को पहले से जाना जाता है (विशेष रूप से संकेत संपीड़न के लिए), एक सरल स्थिर कोड उपयोगी हो सकता है। इन स्थैतिक कोड में सार्वभौमिक कोड (डेटा संपीडन) (जैसे एलियास गामा कोडन या फाइबोनैचि कोडन) और गोलोम्ब कोडन (जैसे यूनरी कोडन या गोलोम्ब कोडन) सम्मिलित हैं।
2014 के बाद से, डेटा संपीडन ने एन्ट्रापी कोडन तकनीकों के असममित अंक प्रणाली वर्ग का उपयोग करना प्रारम्भ कर दिया है, जो हफ़मैन कोडन के समान प्रसंस्करण लागत के साथ अंकगणितीय कोडन के संपीड़न अनुपात के संयोजन की अनुमति देते है।
समानता के उपाय के रूप में एंट्रॉपी
अंकीय डेटा को संपीड़ित करने की विधि के रूप में एन्ट्रॉपी कोडन का उपयोग करने के अतिरिक्त, आकड़ों का प्रवाह और डेटा के पहले से स्थित वर्गों के बीच समानता माप की मात्रा को मापने के लिए एंट्रॉपी कोडक का भी उपयोग किया जा सकता है। यह डेटा के प्रत्येक वर्ग के लिए एन्ट्रॉपी कोडक/ संपीड़क उत्पन्न करके किया जाता है; अज्ञात डेटा तब प्रत्येक संपीड़क को असम्पीडित डेटा भरण कर सांख्यिकीय वर्गीकरण होता है और देखते हैं कि कौन सा संपीड़क उच्चतम संपीड़न उत्पन्न करता है। सबसे ठीक संपीड़न वाला सांकेतिक शब्दों में बदलनेवाला संभवतः उस डेटा पर प्रशिक्षित कोडक है जो अज्ञात डेटा के समान था।
यह भी देखें
- अंकगणित कोडन
- असममित अंक प्रणाली (एएनएस)
- संदर्भ-अनुकूली द्विआधारी अंकगणितीय कोडन (सीएबीएसी)
- हफ़मैन कोडन
- श्रेणी कोडन
संदर्भ
- ↑ Duda, Jarek; Tahboub, Khalid; Gadgil, Neeraj J.; Delp, Edward J. (May 2015). "हफ़मैन कोडिंग के सटीक प्रतिस्थापन के रूप में असममित अंक प्रणाली का उपयोग". 2015 Picture Coding Symposium (PCS): 65–69. doi:10.1109/PCS.2015.7170048. ISBN 978-1-4799-7783-3. S2CID 20260346.
बाहरी संबंध
- Information Theory, Inference, and Learning Algorithms, by David MacKay (2003), gives an introduction to Shannon theory and data compression, including the Huffman coding and arithmetic coding.
- Source Coding, by T. Wiegand and H. Schwarz (2011).