कॉन्टेक्स्ट-अडाप्टिव बाइनरी अरिथमेटिक कोडिंग: Difference between revisions
(Created page with "{{Short description|Entropy coding method}}संदर्भ-अनुकूली बाइनरी अंकगणित कोडिंग (सीएबीएसी) ए...") |
|||
(5 intermediate revisions by 5 users not shown) | |||
Line 1: | Line 1: | ||
कॉन्टेक्स्ट-अडाप्टिव बाइनरी अरिथमेटिक कोडिंग (सीएबीएसी) एच.264/एमपीईजी-4 एवीसी में प्रयुक्त [[एन्ट्रापी एन्कोडिंग]] का एक रूप है <ref name="H.264_overview" /><ref name="H.264_book" /> और [[उच्च दक्षता वीडियो कोडिंग|हाई एफिशिएंसी वीडियो कोडिंग]] (एचईवीसी) स्टैंडर्ड। यह एक [[दोषरहित संपीड़न|लॉसलेस कम्प्रेशन]] तकनीक है, हालाँकि जिन वीडियो कोडिंग स्टैंडर्ड में इसका उपयोग किया जाता है वे सामान्यतः [[हानिपूर्ण संपीड़न|लॉसी कम्प्रेशन]] एप्लीकेशन के लिए होते हैं। सीएबीएसी वीडियो एन्कोडिंग में उपयोग किए जाने वाले अधिकांश अन्य एन्ट्रापी एन्कोडिंग एल्गोरिदम की तुलना में बहुत बेहतर डेटा कम्प्रेशन प्रदान करने के लिए उल्लेखनीय है, और यह उन प्रमुख एलिमेंट में से एक है जो H.264/एवीसी एन्कोडिंग स्कीम को अपने प्रीडेसर की तुलना में बेहतर कम्प्रेशन कैपेबिलिटी प्रदान करता है। <ref name="LiDrew2014">{{cite book|author1=Ze-Nian Li|author2=Mark S. Drew|author3=Jiangchuan Liu|title=मल्टीमीडिया के मूल सिद्धांत|url=https://books.google.com/books?id=R6vBBAAAQBAJ|date=9 April 2014|publisher=Springer Science & Business Media|isbn=978-3-319-05290-8}}</ref> H.264/एमपीईजी-4 एवीसी में, सीएबीएसी केवल स्टैंडर्ड के मुख्य और उच्चतर H.264/एमपीईजी-4 एवीसी (लेकिन विस्तारित प्रोफ़ाइल नहीं) में समर्थित है, क्योंकि इसे स्टैंडर्ड के बेसलाइन प्रोफ़ाइल में उपयोग की जाने वाली [[संदर्भ-अनुकूली चर-लंबाई कोडिंग|कॉन्टेक्स्ट-अडाप्टिव वेरिएबल-लेंथ कोडिंग]] (सीएवीएलसी) के रूप में ज्ञात सिम्पलर स्कीम की तुलना में डिकोड करने के लिए बड़ी मात्रा में प्रोसेसिंग की आवश्यकता होती है। सीएबीएसी को पैरेललाईज बनाना और वेक्टोराइज़ बनाना भी कठिन है, इसलिए समानता के अन्य रूपों (जैसे स्थानिक क्षेत्र समानता) को इसके उपयोग के साथ जोड़ा जा सकता है। एचईवीसी में, सीएबीएसी का उपयोग स्टैंडर्ड के सभी प्रोफाइलों में किया जाता है। | |||
==एल्गोरिदम== | ==एल्गोरिदम== | ||
सीएबीएसी अरिथमेटिक कोडिंग पर आधारित है, इसे वीडियो एन्कोडिंग स्टैंडर्ड की नीड्स अडेप्ट करने के लिए कुछ इनोवेशन और चेंज के साथ:<ref name="CABAC_paper" /> | |||
यह बाइनरी सिंबल को एन्कोड करता है, जो कॉम्पलेक्सिटी कम रखता है और किसी भी सिंबल के अधिक बार उपयोग किए जाने वाले बिट्स के लिए प्रोबेबिलिटी मॉडलिंग की अनुमति देता है। | |||
[[ | * प्रोबेबिलिटी मॉडल को लोकल कॉन्टेक्स्ट के आधार पर अडाप्टिवली चुना जाता है, जिससे [[संभावना|प्रोबेबिलिटी]] के बेहतर मॉडलिंग की अनुमति मिलती है, क्योंकि कोडिंग मोड सामान्यतः लोकली अच्छी तरह से कोरिलेटेड होते हैं। | ||
* यह [[ परिमाणीकरण (सिग्नल प्रोसेसिंग) |क्वान्टिजेशन (सिग्नल प्रोसेसिंग)]] प्रोबेबिलिटी रेंज और प्रोबेबिलिटी स्टेट के उपयोग द्वारा मल्टिप्लिकेशन-फ्री श्रेणी विभाजन का उपयोग करता है। | |||
डेटा सिंबल को कोड करने में निम्नलिखित चरण | सीएबीएसी में डिफरेंट संदर्भों के लिए कई प्रोबेबिलिटी मोड हैं। यह सबसे पहले सभी नॉन-बाइनरी नंबर सिस्टम सिंबल को बाइनरी में परिवर्तित करता है। फिर, प्रत्येक बिट के लिए, कोडर सिलेक्शन करता है कि किस प्रोबेबिलिटी मॉडल का उपयोग करना है, फिर प्रोबेबिलिटी एस्टीमेट को ऑप्टिमाइज़ करने के लिए आस-पास के एलिमेंट से इन्फॉर्मेशन का उपयोग करता है। डेटा को कंप्रेस करने के लिए अंततः अरिथमेटिक कोडिंग लागू की जाती है। | ||
* बाइनराइजेशन: सीएबीएसी बाइनरी | [[File:CABAC Encoder Workflow Diagram.png|alt=|center|thumb|800x800px|एंट्रॉपी एन्कोडिंग की सीएबीएसी मेथड अंग्रेजी में H264 वीडियो कम्प्रेशन स्टैंडर्ड के भीतर उपयोग की जाती है]]कॉन्टेक्स्ट मॉडलिंग कोडिंग सिंबल की कंडीशनल प्रोबेबिलिटी का एस्टीमेट प्रदान करता है। सूटेबल कॉन्टेक्स्ट मॉडल को यूटीलाइज़ करते हुए, एन्कोड करने के लिए करंट सिंबल के नेबर में पहले से कोडित सिंबल के अनुसार डिफरेंट प्रोबेबिलिटी मॉडल के बीच स्विच करके दिए गए इंटर-सिंबल अतिरेक का लाभ उठाया जा सकता है। [[CAVLC|सीएवीएलसी]] एन्ट्रापी कोडिंग विधि की तुलना में सीएबीएसी की [[बिट दर]] में लगभग 10% की बचत के लिए कॉन्टेक्स्ट मॉडलिंग रीस्पोंसिबल है। | ||
* बाइनराइज़्ड | |||
* | डेटा सिंबल को कोड करने में निम्नलिखित चरण सम्मिलित होते हैं। | ||
* | * बाइनराइजेशन: सीएबीएसी बाइनरी अरिथमेटिक कोडिंग का उपयोग करता है जिसका अर्थ है कि केवल बाइनरी डिसीज़न (1 या 0) एन्कोड किए गए हैं। एक नॉन-बाइनरी-वैल्यूड सिंबल (उदाहरण के लिए एक ट्रांसफॉर्म कोफीशिएंट या मोशन वेक्टर) को अरिथमेटिक कोडिंग से पहले बाईनरीज़ या बाइनरी कोड में परिवर्तित किया जाता है। यह प्रोसेस डेटा सिंबल को एक वेरिएबल लेंथ कोड में परिवर्तित करने की प्रोसेस के समान है लेकिन ट्रांसमिशन से पहले बाइनरी कोड को आगे एन्कोड किया जाता है (अरिथमेटिक कोडर द्वारा)। | ||
* | * बाइनराइज़्ड सिंबल के प्रत्येक बिट (या बिन) के लिए स्टेज रिपीट किये जाते हैं। | ||
* कॉन्टेक्स्ट मॉडल सिलेक्शन: एक कॉन्टेक्स्ट मॉडल बाइनराइज्ड सिंबल के एक या अधिक बॉक्स के लिए एक प्रोबेबिलिटी मॉडल है। इस मॉडल को हाल ही में कोड किए गए डेटा सिंबल के आंकड़ों के आधार पर उपलब्ध मॉडलों के सिलेक्शन में से चुना जा सकता है। कॉन्टेक्स्ट मॉडल प्रत्येक बिन के 1 या 0 होने की प्रोबेबिलिटी को स्टोर करता है। | |||
* अरिथमेटिक एन्कोडिंग: एक अरिथमेटिक कोडर सिलेक्टेड प्रोबेबिलिटी मॉडल के अनुसार प्रत्येक बिन को एन्कोड करता है। ध्यान दें कि प्रत्येक बिन के लिए केवल दो सब-रेंज हैं (0 और 1 के अनुरूप)। | |||
* प्रोबेबिलिटी अपडेट: सिलेक्टेड कॉन्टेक्स्ट मॉडल को वास्तविक कोडित मान के आधार पर अपडेट किया जाता है (उदाहरण के लिए यदि बिन मान 1 था, तो 1 s की आवृत्ति गणना बढ़ जाती है)। | |||
==उदाहरण== | ==उदाहरण== | ||
1. मान MVDx को बिनाराइज़ करें, | 1. मान MVDx को बिनाराइज़ करें, डिफरेंस वेक्टर अंतर {{var|x}} दिशा। | ||
{| class="wikitable floatright" | {| class="wikitable floatright" | ||
! | ! MVDx | ||
! | ! बाइनाराईज़ेशन | ||
|- | |- | ||
| 0 | | 0 | ||
Line 54: | Line 56: | ||
बाइनराइज़्ड कोडवर्ड का पहला बिट बिन 1 है; दूसरा बिट बिन 2 है; और इसी तरह। | बाइनराइज़्ड कोडवर्ड का पहला बिट बिन 1 है; दूसरा बिट बिन 2 है; और इसी तरह। | ||
2. प्रत्येक बिन के लिए एक | 2. प्रत्येक बिन के लिए एक कॉन्टेक्स्ट मॉडल चुनें। पिछले कोडित एमवीडी वैल्यू के आधार पर, बिन 1 के लिए 3 मॉडलों में से एक का सिलेक्शन किया जाता है। दो -कोडेड वैल्यू वैल्यू का L1 मानदंड, उदा<sub>k</sub>, अकोर्डिंगली: | ||
{| class="wikitable floatright" | {| class="wikitable floatright" | ||
! e<sub>k</sub> | ! e<sub>k</sub> | ||
! | ! कॉन्टेक्स्ट मॉडल फॉर बिन | ||
|- | |- | ||
| 0 ≤ e<sub>k</sub> < 3 | | 0 ≤ e<sub>k</sub> < 3 | ||
Line 69: | Line 71: | ||
| Model 2 | | Model 2 | ||
|} | |} | ||
यदि ई<sub>k</sub> छोटा है, तो इस बात की बहुत अधिक | यदि ई<sub>k</sub> छोटा है, तो इस बात की बहुत अधिक प्रोबेबिलिटी है कि वर्तमान एमवीडी का मैग्नीट्यूड छोटा होगा; इसके विपरीत, यदि ई<sub>k</sub> बड़ा है तो यह अधिक प्रोबेबिलिटी है कि वर्तमान एमवीडी का मैग्नीट्यूड बड़ा होगा। हम तदनुसार एक प्रोबेबिलिटी टेबल (कॉन्टेक्स्ट मॉडल) का सिलेक्शन करते हैं। शेष डिब्बे को 4 अतिरिक्त कॉन्टेक्स्ट मॉडलों में से एक का उपयोग करके कोडित किया गया है: | ||
{| class="wikitable floatright" | {| class="wikitable floatright" | ||
! | ! बिन | ||
! | ! कॉन्टेक्स्ट मॉडल | ||
|- | |- | ||
| 1 | | 1 | ||
Line 87: | Line 89: | ||
| 5 | | 5 | ||
|- | |- | ||
| 5 | | 5 और उच्चतर | ||
| 6 | | 6 | ||
|} | |} | ||
3. प्रत्येक बिन को एन्कोड करें। | 3. प्रत्येक बिन को एन्कोड करें। सिलेक्टेड कॉन्टेक्स्ट मॉडल दो प्रोबेबिलिटी एस्टीमेट प्रदान करता है: प्रोबेबिलिटी कि बिन में "1" है और प्रोबेबिलिटी है कि बिन में "0" है। ये एस्टीमेट उन दो सब-रेंज को निर्धारित करते हैं जिनका उपयोग अरिथमेटिक कोडर बिन को एनकोड करने के लिए करता है। | ||
4. कॉन्टेक्स्ट मॉडल अपडेट करें- उदाहरण के लिए, यदि कॉन्टेक्स्ट मॉडल 2 को बिन 1 के लिए चुना गया था और बिन 1 की वैल्यू "0" थी, तो "0" की आवृत्ति गणना बढ़ जाती है। इसका अर्थ यह है कि अगली बार जब यह मॉडल चुना जाएगा, तो "0" की प्रोबेबिलिटी थोड़ी अधिक होगी। जब किसी मॉडल की घटनाओं की कुल संख्या एक सीमा मान से अधिक हो जाती है, तो "0" और "1" के लिए फ्रीक्वेंसी काउंट को कम कर दिया जाएगा, जो वास्तव में हाल के ऑब्जरवेशन को उच्च प्रायोरिटी देता है। | |||
==अरिथमेटिक डिकोडिंग इंजन== | |||
स्टैंडर्ड में अरिथमेटिक डिकोडर का कुछ डिटेल से डिस्क्राइब किया गया है। इसके तीन विशिष्ट गुण हैं: | |||
#प्रोबेबिलिटी का एस्टिमेशन लीस्ट प्रोबेबल सिंबल (एलपीएस, दो बाइनरी डिसीज़न 0 या 1 में से सबसे कम संभावित) के लिए 64 अलग-अलग प्रोबेबिलिटी स्टेट के बीच एक ट्रांजीशन प्रोसेस द्वारा किया जाता है। | |||
#सीमा {{var|R}} अरिथमेटिक कोडर की करंट स्टेट का प्रतिनिधित्व प्रत्येक चरण में नई रेंज का काउंट करने से पहले प्री-सेट वैल्यू की एक स्माल रेंज में किया जाता है, जिससे लुक-अप टेबल (यानी मल्टिप्लिकेशन-फ्री) का उपयोग करके नई रेंज को काउंट करना संभव हो जाता है। | |||
#एक सिम्प्लिफाईड एन्कोडिंग के साथ डेटा सिंबल के लिए एक सिम्प्लिफाईड एन्कोडिंग और डिकोडिंग प्रोसेस को डिफाइन किया गया है। | |||
डिकोडिंग प्रोसेस की परिभाषा कम जटिलता को फैसिलिटेट करने के लिए डिज़ाइन की गई है | |||
अरिथमेटिक एन्कोडिंग और डिकोडिंग का कार्यान्वयन। कुल मिलाकर, सीएबीएसी प्रदान करता है | |||
सीएवीएलसी-आधारित कोडिंग की तुलना में बेहतर कोडिंग दक्षता, अधिक कीमत पर अभिकलनात्मक जटिलता। | |||
अभिकलनात्मक जटिलता। | |||
==इतिहास== | ==इतिहास== | ||
1986 में, [[आईबीएम]] के शोधकर्ताओं कोट्टप्पुरम एम. ए. मोहिउद्दीन और जोर्मा जोहानन रिसानन ने | 1986 में, [[आईबीएम]] के शोधकर्ताओं कोट्टप्पुरम एम. ए. मोहिउद्दीन और जोर्मा जोहानन रिसानन ने मल्टिप्लिकेशन-फ्री बाइनरी अरिथमेटिक कोडिंग एल्गोरिदम के लिए एक [[पेटेंट]] सबमिट किया। <ref name="t81">{{cite web |title=T.81 – DIGITAL COMPRESSION AND CODING OF CONTINUOUS-TONE STILL IMAGES – REQUIREMENTS AND GUIDELINES |url=https://www.w3.org/Graphics/JPEG/itu-t81.pdf |publisher=[[CCITT]] |date=September 1992 |accessdate=12 July 2019}}</ref><ref>{{US patent|4652856}}</ref> 1988 में, आर.बी. आर्प्स, टी.के. सहित आईबीएम अनुसंधान दल। ट्रूंग, डी.जे. लू, डब्ल्यू.बी. पेनेबेकर, एल. मिशेल और जी.जी. लैंगडन ने क्यू-कोडर नामक एक अडाप्टिव बाइनरी अरिथमेटिक कोडिंग (एबीएसी) एल्गोरिदम प्रस्तुत किया। <ref>{{cite journal |last1=Arps |first1=R. B. |last2=Truong |first2=T. K. |last3=Lu |first3=D. J. |last4=Pasco |first4=R. C. |last5=Friedman |first5=T. D. |title=बाइलेवल छवियों के अनुकूली डेटा संपीड़न के लिए एक बहुउद्देश्यीय वीएलएसआई चिप|journal=IBM Journal of Research and Development |date=November 1988 |volume=32 |issue=6 |pages=775–795 |doi=10.1147/rd.326.0775 |issn=0018-8646}}</ref><ref>{{cite journal |last1=Pennebaker |first1=W. B. |last2=Mitchell |first2=J. L. |last3=Langdon |first3=G. G. |last4=Arps |first4=R. B. |title=क्यू-कोडर अनुकूली बाइनरी अंकगणितीय कोडर के बुनियादी सिद्धांतों का अवलोकन|journal=IBM Journal of Research and Development |date=November 1988 |volume=32 |issue=6 |pages=717–726 |doi=10.1147/rd.326.0717 |issn=0018-8646}}</ref> | ||
अबव पेटेंट और रिसर्च पेपर्स, आईबीएम और [[मित्सुबिशी इलेक्ट्रिक]] के कई अन्य पेटेंटों के साथ, बाद में [[सीसीआईटीटी]] और जॉइंट फोटोग्राफिक एक्सपर्ट ग्रुप द्वारा 1992 में [[जेपीईजी]] [[छवि संपीड़न|इमेज कम्प्रेशन]] फॉर्मेट के अडाप्टिव बाइनरी अरिथमेटिक कोडिंग एल्गोरिदम के बेसिस के रूप में उद्धृत किए गए थे।<ref name="t81" /> हालाँकि, जेपीईजी फ़ाइल फॉर्मेट के एनकोडर और डिकोडर, जिनमें [[हफ़मैन एन्कोडिंग]] और अरिथमेटिक कोडिंग दोनों के ऑप्शन हैं, सामान्यतः केवल हफ़मैन एन्कोडिंग ऑप्शन को सपोर्ट करते हैं, जो मूल रूप से पेटेंट कंसर्न के कारण था, हालाँकि जेपीईजी के अरिथमेटिक कोडिंग पेटेंट <ref>{{cite web |url=http://www.itu.int/rec/T-REC-T.81-200401-I!Cor1/dologin.asp?lang=e&id=T-REC-T.81-200401-I!Cor1!PDF-E&type=items |title=Recommendation T.81 (1992) Corrigendum 1 (01/04) |author= |date=9 November 2004 |work=Recommendation T.81 (1992) |publisher=International Telecommunication Union |accessdate=3 February 2011}}</ref> जेपीईजी स्टैंडर्ड की उम्र के कारण यह समाप्त हो चुका है। <ref>''JPEG Still Image Data Compression Standard'', W. B. Pennebaker and [[Joan L. Mitchell|J. L. Mitchell]], Kluwer Academic Press, 1992. {{ISBN|0-442-01272-1}}</ref> मोशन वीडियो कम्प्रेशन में अडाप्टिव बाइनरी अरिथमेटिक कोडिंग का पहला उपयोग 1989 में आईबीएम साइंटिस्ट द्वारा एमपीईजी समूह के एक प्रस्ताव में किया गया था। <ref>''DCT Coding for Motion Video Storage using Adaptive Arithmetic Coding'', C. A. Gonzales. L. Allman, T. McCarthy, P. Wendt and A. N. Akansu, Signal Processing: Image Communication, 2, 145, 1990.</ref><ref>''Encoding of motion video sequences for the MPEG environment using arithmetic coding'', E. Viscito and C. Gonzales, SPIE Visual Communications and Image Processing '90, October 2-4, 1990.</ref> इस प्रस्ताव ने इंट्राफ्रेम जेपीईजी से इंटरफ्रेम वीडियो कोडिंग तक अरिथमेटिक कोडिंग के उपयोग को बढ़ाया। | |||
1999 में, यंगजुन यू ([[ टेक्सस उपकरण |टेक्सस इंस्ट्रूमेंट्स]]), यंग गैप क्वोन और एंटोनियो ओर्टेगा ([[दक्षिणी कैलिफोर्निया विश्वविद्यालय]]) ने बाइनरी अरिथमेटिक कोडिंग का एक कॉन्टेक्स्ट-अडाप्टिव रूप प्रस्तुत किया। <ref>{{cite book |last1=Ortega |first1=A. |title=Proceedings 1999 International Conference on Image Processing (Cat. 99CH36348) |chapter=Embedded image-domain compression using context models |date=October 1999 |volume=1 |pages=477–481 vol.1 |doi=10.1109/ICIP.1999.821655|isbn=0-7803-5467-2 |s2cid=27303716 }}</ref> आधुनिक कॉन्टेक्स्ट-अडाप्टिव बाइनरी अरिथमेटिक कोडिंग (सीएबीएसी) एल्गोरिदम को 2003 में H.264/एमपीईजी-4 एवीसी फॉर्मेट के साथ प्रोफेशनल रूप से रिप्रेजेंट किया गया था। <ref>{{cite web |title=संदर्भ-आधारित अनुकूली बाइनरी अंकगणित कोडिंग (सीएबीएसी)|url=https://www.hhi.fraunhofer.de/en/departments/vca/research-groups/image-video-coding/research-topics/context-based-adaptive-binary-arithmetic-coding-cabac.html |website=Fraunhofer Heinrich Hertz Institute |accessdate=13 July 2019 |language=en}}</ref> एवीसी फॉर्मेट के लिए मैक्सिमम पेटेंट [[ PANASONIC |पैनासोनिक]], [[ पांचवी कंपनी | गोडो कैशा आई- पी ब्रिज]] और [[एलजी इलेक्ट्रॉनिक्स]] के पास हैं। <ref name="patents">{{cite web |title=AVC/H.264 {{ndash}} Patent List |url=https://www.mpegla.com/wp-content/uploads/avc-att1.pdf |website=MPEG LA |accessdate=6 July 2019}}</ref> | |||
==यह भी देखें== | ==यह भी देखें== | ||
* | *अरिथमेटिक कोडिंग | ||
*आधार - सामग्री संकोचन | *आधार - सामग्री संकोचन | ||
* | *लॉसलेस कम्प्रेशन | ||
* | *कॉन्टेक्स्ट-अडाप्टिव वेरिएबल-लंबाई कोडिंग|कॉन्टेक्स्ट-अडाप्टिव वेरिएबल-लंबाई कोडिंग (सीएवीएलसी) | ||
== | ==कॉन्टेक्स्ट== | ||
{{Reflist| | {{Reflist| | ||
refs= | refs= | ||
Line 125: | Line 130: | ||
<ref name="CABAC_paper">Marpe, D., Schwarz, H., and Wiegand, T., [http://iphome.hhi.de/marpe/download/cabac_ieee03.pdf Context-Based Adaptive Binary Arithmetic Coding in the H.264/AVC Video Compression Standard], ''IEEE Trans. Circuits and Systems for Video Technology'', Vol. 13, No. 7, pp. 620–636, July, 2003.</ref> | <ref name="CABAC_paper">Marpe, D., Schwarz, H., and Wiegand, T., [http://iphome.hhi.de/marpe/download/cabac_ieee03.pdf Context-Based Adaptive Binary Arithmetic Coding in the H.264/AVC Video Compression Standard], ''IEEE Trans. Circuits and Systems for Video Technology'', Vol. 13, No. 7, pp. 620–636, July, 2003.</ref> | ||
}} | }} | ||
[[Category:2003 में दृश्य-श्रव्य परिचय]] | |||
[[Category:CS1 English-language sources (en)]] | |||
[[Category:Collapse templates]] | |||
[[Category: | |||
[[Category:Created On 26/07/2023]] | [[Category:Created On 26/07/2023]] | ||
[[Category:Data compression]] | |||
[[Category:Lua-based templates]] | |||
[[Category:Machine Translated Page]] | |||
[[Category:Navigational boxes| ]] | |||
[[Category:Navigational boxes without horizontal lists]] | |||
[[Category:Pages with script errors]] | |||
[[Category:Short description with empty Wikidata description]] | |||
[[Category:Sidebars with styles needing conversion]] | |||
[[Category:Template documentation pages|Documentation/doc]] | |||
[[Category:Templates Vigyan Ready]] | |||
[[Category:Templates generating microformats]] | |||
[[Category:Templates that add a tracking category]] | |||
[[Category:Templates that are not mobile friendly]] | |||
[[Category:Templates that generate short descriptions]] | |||
[[Category:Templates using TemplateData]] | |||
[[Category:Wikipedia metatemplates]] | |||
[[Category:एमपीईजी]] | |||
[[Category:दोषरहित संपीड़न एल्गोरिदम]] | |||
[[Category:वीडियो संपीड़न]] |
Latest revision as of 17:35, 30 August 2023
कॉन्टेक्स्ट-अडाप्टिव बाइनरी अरिथमेटिक कोडिंग (सीएबीएसी) एच.264/एमपीईजी-4 एवीसी में प्रयुक्त एन्ट्रापी एन्कोडिंग का एक रूप है [1][2] और हाई एफिशिएंसी वीडियो कोडिंग (एचईवीसी) स्टैंडर्ड। यह एक लॉसलेस कम्प्रेशन तकनीक है, हालाँकि जिन वीडियो कोडिंग स्टैंडर्ड में इसका उपयोग किया जाता है वे सामान्यतः लॉसी कम्प्रेशन एप्लीकेशन के लिए होते हैं। सीएबीएसी वीडियो एन्कोडिंग में उपयोग किए जाने वाले अधिकांश अन्य एन्ट्रापी एन्कोडिंग एल्गोरिदम की तुलना में बहुत बेहतर डेटा कम्प्रेशन प्रदान करने के लिए उल्लेखनीय है, और यह उन प्रमुख एलिमेंट में से एक है जो H.264/एवीसी एन्कोडिंग स्कीम को अपने प्रीडेसर की तुलना में बेहतर कम्प्रेशन कैपेबिलिटी प्रदान करता है। [3] H.264/एमपीईजी-4 एवीसी में, सीएबीएसी केवल स्टैंडर्ड के मुख्य और उच्चतर H.264/एमपीईजी-4 एवीसी (लेकिन विस्तारित प्रोफ़ाइल नहीं) में समर्थित है, क्योंकि इसे स्टैंडर्ड के बेसलाइन प्रोफ़ाइल में उपयोग की जाने वाली कॉन्टेक्स्ट-अडाप्टिव वेरिएबल-लेंथ कोडिंग (सीएवीएलसी) के रूप में ज्ञात सिम्पलर स्कीम की तुलना में डिकोड करने के लिए बड़ी मात्रा में प्रोसेसिंग की आवश्यकता होती है। सीएबीएसी को पैरेललाईज बनाना और वेक्टोराइज़ बनाना भी कठिन है, इसलिए समानता के अन्य रूपों (जैसे स्थानिक क्षेत्र समानता) को इसके उपयोग के साथ जोड़ा जा सकता है। एचईवीसी में, सीएबीएसी का उपयोग स्टैंडर्ड के सभी प्रोफाइलों में किया जाता है।
एल्गोरिदम
सीएबीएसी अरिथमेटिक कोडिंग पर आधारित है, इसे वीडियो एन्कोडिंग स्टैंडर्ड की नीड्स अडेप्ट करने के लिए कुछ इनोवेशन और चेंज के साथ:[4]
यह बाइनरी सिंबल को एन्कोड करता है, जो कॉम्पलेक्सिटी कम रखता है और किसी भी सिंबल के अधिक बार उपयोग किए जाने वाले बिट्स के लिए प्रोबेबिलिटी मॉडलिंग की अनुमति देता है।
- प्रोबेबिलिटी मॉडल को लोकल कॉन्टेक्स्ट के आधार पर अडाप्टिवली चुना जाता है, जिससे प्रोबेबिलिटी के बेहतर मॉडलिंग की अनुमति मिलती है, क्योंकि कोडिंग मोड सामान्यतः लोकली अच्छी तरह से कोरिलेटेड होते हैं।
- यह क्वान्टिजेशन (सिग्नल प्रोसेसिंग) प्रोबेबिलिटी रेंज और प्रोबेबिलिटी स्टेट के उपयोग द्वारा मल्टिप्लिकेशन-फ्री श्रेणी विभाजन का उपयोग करता है।
सीएबीएसी में डिफरेंट संदर्भों के लिए कई प्रोबेबिलिटी मोड हैं। यह सबसे पहले सभी नॉन-बाइनरी नंबर सिस्टम सिंबल को बाइनरी में परिवर्तित करता है। फिर, प्रत्येक बिट के लिए, कोडर सिलेक्शन करता है कि किस प्रोबेबिलिटी मॉडल का उपयोग करना है, फिर प्रोबेबिलिटी एस्टीमेट को ऑप्टिमाइज़ करने के लिए आस-पास के एलिमेंट से इन्फॉर्मेशन का उपयोग करता है। डेटा को कंप्रेस करने के लिए अंततः अरिथमेटिक कोडिंग लागू की जाती है।
कॉन्टेक्स्ट मॉडलिंग कोडिंग सिंबल की कंडीशनल प्रोबेबिलिटी का एस्टीमेट प्रदान करता है। सूटेबल कॉन्टेक्स्ट मॉडल को यूटीलाइज़ करते हुए, एन्कोड करने के लिए करंट सिंबल के नेबर में पहले से कोडित सिंबल के अनुसार डिफरेंट प्रोबेबिलिटी मॉडल के बीच स्विच करके दिए गए इंटर-सिंबल अतिरेक का लाभ उठाया जा सकता है। सीएवीएलसी एन्ट्रापी कोडिंग विधि की तुलना में सीएबीएसी की बिट दर में लगभग 10% की बचत के लिए कॉन्टेक्स्ट मॉडलिंग रीस्पोंसिबल है।
डेटा सिंबल को कोड करने में निम्नलिखित चरण सम्मिलित होते हैं।
- बाइनराइजेशन: सीएबीएसी बाइनरी अरिथमेटिक कोडिंग का उपयोग करता है जिसका अर्थ है कि केवल बाइनरी डिसीज़न (1 या 0) एन्कोड किए गए हैं। एक नॉन-बाइनरी-वैल्यूड सिंबल (उदाहरण के लिए एक ट्रांसफॉर्म कोफीशिएंट या मोशन वेक्टर) को अरिथमेटिक कोडिंग से पहले बाईनरीज़ या बाइनरी कोड में परिवर्तित किया जाता है। यह प्रोसेस डेटा सिंबल को एक वेरिएबल लेंथ कोड में परिवर्तित करने की प्रोसेस के समान है लेकिन ट्रांसमिशन से पहले बाइनरी कोड को आगे एन्कोड किया जाता है (अरिथमेटिक कोडर द्वारा)।
- बाइनराइज़्ड सिंबल के प्रत्येक बिट (या बिन) के लिए स्टेज रिपीट किये जाते हैं।
- कॉन्टेक्स्ट मॉडल सिलेक्शन: एक कॉन्टेक्स्ट मॉडल बाइनराइज्ड सिंबल के एक या अधिक बॉक्स के लिए एक प्रोबेबिलिटी मॉडल है। इस मॉडल को हाल ही में कोड किए गए डेटा सिंबल के आंकड़ों के आधार पर उपलब्ध मॉडलों के सिलेक्शन में से चुना जा सकता है। कॉन्टेक्स्ट मॉडल प्रत्येक बिन के 1 या 0 होने की प्रोबेबिलिटी को स्टोर करता है।
- अरिथमेटिक एन्कोडिंग: एक अरिथमेटिक कोडर सिलेक्टेड प्रोबेबिलिटी मॉडल के अनुसार प्रत्येक बिन को एन्कोड करता है। ध्यान दें कि प्रत्येक बिन के लिए केवल दो सब-रेंज हैं (0 और 1 के अनुरूप)।
- प्रोबेबिलिटी अपडेट: सिलेक्टेड कॉन्टेक्स्ट मॉडल को वास्तविक कोडित मान के आधार पर अपडेट किया जाता है (उदाहरण के लिए यदि बिन मान 1 था, तो 1 s की आवृत्ति गणना बढ़ जाती है)।
उदाहरण
1. मान MVDx को बिनाराइज़ करें, डिफरेंस वेक्टर अंतर x दिशा।
MVDx | बाइनाराईज़ेशन |
---|---|
0 | 0 |
1 | 10 |
2 | 110 |
3 | 1110 |
4 | 11110 |
5 | 111110 |
6 | 1111110 |
7 | 11111110 |
8 | 111111110 |
बाइनराइज़्ड कोडवर्ड का पहला बिट बिन 1 है; दूसरा बिट बिन 2 है; और इसी तरह।
2. प्रत्येक बिन के लिए एक कॉन्टेक्स्ट मॉडल चुनें। पिछले कोडित एमवीडी वैल्यू के आधार पर, बिन 1 के लिए 3 मॉडलों में से एक का सिलेक्शन किया जाता है। दो -कोडेड वैल्यू वैल्यू का L1 मानदंड, उदाk, अकोर्डिंगली:
ek | कॉन्टेक्स्ट मॉडल फॉर बिन |
---|---|
0 ≤ ek < 3 | Model 0 |
3 ≤ ek < 33 | Model 1 |
33 ≤ ek | Model 2 |
यदि ईk छोटा है, तो इस बात की बहुत अधिक प्रोबेबिलिटी है कि वर्तमान एमवीडी का मैग्नीट्यूड छोटा होगा; इसके विपरीत, यदि ईk बड़ा है तो यह अधिक प्रोबेबिलिटी है कि वर्तमान एमवीडी का मैग्नीट्यूड बड़ा होगा। हम तदनुसार एक प्रोबेबिलिटी टेबल (कॉन्टेक्स्ट मॉडल) का सिलेक्शन करते हैं। शेष डिब्बे को 4 अतिरिक्त कॉन्टेक्स्ट मॉडलों में से एक का उपयोग करके कोडित किया गया है:
बिन | कॉन्टेक्स्ट मॉडल |
---|---|
1 | 0, 1 or 2 depending on ek |
2 | 3 |
3 | 4 |
4 | 5 |
5 और उच्चतर | 6 |
3. प्रत्येक बिन को एन्कोड करें। सिलेक्टेड कॉन्टेक्स्ट मॉडल दो प्रोबेबिलिटी एस्टीमेट प्रदान करता है: प्रोबेबिलिटी कि बिन में "1" है और प्रोबेबिलिटी है कि बिन में "0" है। ये एस्टीमेट उन दो सब-रेंज को निर्धारित करते हैं जिनका उपयोग अरिथमेटिक कोडर बिन को एनकोड करने के लिए करता है।
4. कॉन्टेक्स्ट मॉडल अपडेट करें- उदाहरण के लिए, यदि कॉन्टेक्स्ट मॉडल 2 को बिन 1 के लिए चुना गया था और बिन 1 की वैल्यू "0" थी, तो "0" की आवृत्ति गणना बढ़ जाती है। इसका अर्थ यह है कि अगली बार जब यह मॉडल चुना जाएगा, तो "0" की प्रोबेबिलिटी थोड़ी अधिक होगी। जब किसी मॉडल की घटनाओं की कुल संख्या एक सीमा मान से अधिक हो जाती है, तो "0" और "1" के लिए फ्रीक्वेंसी काउंट को कम कर दिया जाएगा, जो वास्तव में हाल के ऑब्जरवेशन को उच्च प्रायोरिटी देता है।
अरिथमेटिक डिकोडिंग इंजन
स्टैंडर्ड में अरिथमेटिक डिकोडर का कुछ डिटेल से डिस्क्राइब किया गया है। इसके तीन विशिष्ट गुण हैं:
- प्रोबेबिलिटी का एस्टिमेशन लीस्ट प्रोबेबल सिंबल (एलपीएस, दो बाइनरी डिसीज़न 0 या 1 में से सबसे कम संभावित) के लिए 64 अलग-अलग प्रोबेबिलिटी स्टेट के बीच एक ट्रांजीशन प्रोसेस द्वारा किया जाता है।
- सीमा R अरिथमेटिक कोडर की करंट स्टेट का प्रतिनिधित्व प्रत्येक चरण में नई रेंज का काउंट करने से पहले प्री-सेट वैल्यू की एक स्माल रेंज में किया जाता है, जिससे लुक-अप टेबल (यानी मल्टिप्लिकेशन-फ्री) का उपयोग करके नई रेंज को काउंट करना संभव हो जाता है।
- एक सिम्प्लिफाईड एन्कोडिंग के साथ डेटा सिंबल के लिए एक सिम्प्लिफाईड एन्कोडिंग और डिकोडिंग प्रोसेस को डिफाइन किया गया है।
डिकोडिंग प्रोसेस की परिभाषा कम जटिलता को फैसिलिटेट करने के लिए डिज़ाइन की गई है
अरिथमेटिक एन्कोडिंग और डिकोडिंग का कार्यान्वयन। कुल मिलाकर, सीएबीएसी प्रदान करता है
सीएवीएलसी-आधारित कोडिंग की तुलना में बेहतर कोडिंग दक्षता, अधिक कीमत पर अभिकलनात्मक जटिलता।
इतिहास
1986 में, आईबीएम के शोधकर्ताओं कोट्टप्पुरम एम. ए. मोहिउद्दीन और जोर्मा जोहानन रिसानन ने मल्टिप्लिकेशन-फ्री बाइनरी अरिथमेटिक कोडिंग एल्गोरिदम के लिए एक पेटेंट सबमिट किया। [5][6] 1988 में, आर.बी. आर्प्स, टी.के. सहित आईबीएम अनुसंधान दल। ट्रूंग, डी.जे. लू, डब्ल्यू.बी. पेनेबेकर, एल. मिशेल और जी.जी. लैंगडन ने क्यू-कोडर नामक एक अडाप्टिव बाइनरी अरिथमेटिक कोडिंग (एबीएसी) एल्गोरिदम प्रस्तुत किया। [7][8]
अबव पेटेंट और रिसर्च पेपर्स, आईबीएम और मित्सुबिशी इलेक्ट्रिक के कई अन्य पेटेंटों के साथ, बाद में सीसीआईटीटी और जॉइंट फोटोग्राफिक एक्सपर्ट ग्रुप द्वारा 1992 में जेपीईजी इमेज कम्प्रेशन फॉर्मेट के अडाप्टिव बाइनरी अरिथमेटिक कोडिंग एल्गोरिदम के बेसिस के रूप में उद्धृत किए गए थे।[5] हालाँकि, जेपीईजी फ़ाइल फॉर्मेट के एनकोडर और डिकोडर, जिनमें हफ़मैन एन्कोडिंग और अरिथमेटिक कोडिंग दोनों के ऑप्शन हैं, सामान्यतः केवल हफ़मैन एन्कोडिंग ऑप्शन को सपोर्ट करते हैं, जो मूल रूप से पेटेंट कंसर्न के कारण था, हालाँकि जेपीईजी के अरिथमेटिक कोडिंग पेटेंट [9] जेपीईजी स्टैंडर्ड की उम्र के कारण यह समाप्त हो चुका है। [10] मोशन वीडियो कम्प्रेशन में अडाप्टिव बाइनरी अरिथमेटिक कोडिंग का पहला उपयोग 1989 में आईबीएम साइंटिस्ट द्वारा एमपीईजी समूह के एक प्रस्ताव में किया गया था। [11][12] इस प्रस्ताव ने इंट्राफ्रेम जेपीईजी से इंटरफ्रेम वीडियो कोडिंग तक अरिथमेटिक कोडिंग के उपयोग को बढ़ाया।
1999 में, यंगजुन यू (टेक्सस इंस्ट्रूमेंट्स), यंग गैप क्वोन और एंटोनियो ओर्टेगा (दक्षिणी कैलिफोर्निया विश्वविद्यालय) ने बाइनरी अरिथमेटिक कोडिंग का एक कॉन्टेक्स्ट-अडाप्टिव रूप प्रस्तुत किया। [13] आधुनिक कॉन्टेक्स्ट-अडाप्टिव बाइनरी अरिथमेटिक कोडिंग (सीएबीएसी) एल्गोरिदम को 2003 में H.264/एमपीईजी-4 एवीसी फॉर्मेट के साथ प्रोफेशनल रूप से रिप्रेजेंट किया गया था। [14] एवीसी फॉर्मेट के लिए मैक्सिमम पेटेंट पैनासोनिक, गोडो कैशा आई- पी ब्रिज और एलजी इलेक्ट्रॉनिक्स के पास हैं। [15]
यह भी देखें
- अरिथमेटिक कोडिंग
- आधार - सामग्री संकोचन
- लॉसलेस कम्प्रेशन
- कॉन्टेक्स्ट-अडाप्टिव वेरिएबल-लंबाई कोडिंग|कॉन्टेक्स्ट-अडाप्टिव वेरिएबल-लंबाई कोडिंग (सीएवीएलसी)
कॉन्टेक्स्ट
- ↑ Richardson, Iain E. G., H.264 / MPEG-4 Part 10 White Paper, 17 October 2002.
- ↑ Richardson, Iain E. G. (2003). H.264 and MPEG-4 Video Compression: Video Coding for Next-generation Multimedia. Chichester: John Wiley & Sons Ltd.
- ↑ Ze-Nian Li; Mark S. Drew; Jiangchuan Liu (9 April 2014). मल्टीमीडिया के मूल सिद्धांत. Springer Science & Business Media. ISBN 978-3-319-05290-8.
- ↑ Marpe, D., Schwarz, H., and Wiegand, T., Context-Based Adaptive Binary Arithmetic Coding in the H.264/AVC Video Compression Standard, IEEE Trans. Circuits and Systems for Video Technology, Vol. 13, No. 7, pp. 620–636, July, 2003.
- ↑ 5.0 5.1 "T.81 – DIGITAL COMPRESSION AND CODING OF CONTINUOUS-TONE STILL IMAGES – REQUIREMENTS AND GUIDELINES" (PDF). CCITT. September 1992. Retrieved 12 July 2019.
- ↑ U.S. Patent 4,652,856
- ↑ Arps, R. B.; Truong, T. K.; Lu, D. J.; Pasco, R. C.; Friedman, T. D. (November 1988). "बाइलेवल छवियों के अनुकूली डेटा संपीड़न के लिए एक बहुउद्देश्यीय वीएलएसआई चिप". IBM Journal of Research and Development. 32 (6): 775–795. doi:10.1147/rd.326.0775. ISSN 0018-8646.
- ↑ Pennebaker, W. B.; Mitchell, J. L.; Langdon, G. G.; Arps, R. B. (November 1988). "क्यू-कोडर अनुकूली बाइनरी अंकगणितीय कोडर के बुनियादी सिद्धांतों का अवलोकन". IBM Journal of Research and Development. 32 (6): 717–726. doi:10.1147/rd.326.0717. ISSN 0018-8646.
- ↑ "Recommendation T.81 (1992) Corrigendum 1 (01/04)". Recommendation T.81 (1992). International Telecommunication Union. 9 November 2004. Retrieved 3 February 2011.
- ↑ JPEG Still Image Data Compression Standard, W. B. Pennebaker and J. L. Mitchell, Kluwer Academic Press, 1992. ISBN 0-442-01272-1
- ↑ DCT Coding for Motion Video Storage using Adaptive Arithmetic Coding, C. A. Gonzales. L. Allman, T. McCarthy, P. Wendt and A. N. Akansu, Signal Processing: Image Communication, 2, 145, 1990.
- ↑ Encoding of motion video sequences for the MPEG environment using arithmetic coding, E. Viscito and C. Gonzales, SPIE Visual Communications and Image Processing '90, October 2-4, 1990.
- ↑ Ortega, A. (October 1999). "Embedded image-domain compression using context models". Proceedings 1999 International Conference on Image Processing (Cat. 99CH36348). Vol. 1. pp. 477–481 vol.1. doi:10.1109/ICIP.1999.821655. ISBN 0-7803-5467-2. S2CID 27303716.
- ↑ "संदर्भ-आधारित अनुकूली बाइनरी अंकगणित कोडिंग (सीएबीएसी)". Fraunhofer Heinrich Hertz Institute (in English). Retrieved 13 July 2019.
- ↑ "AVC/H.264 – Patent List" (PDF). MPEG LA. Retrieved 6 July 2019.