गति प्रतिकरण

From Vigyanwiki
एमपीईजी खंड गति प्रतिकरण का विजुअलाइजेशन। एक प्रधार से दूसरे प्रधार में जाने वाले खंड सफेद तीरों के रूप में दिखाए जाते हैं, जिससे विभिन्न प्लेटफार्मों की गति और चरित्र स्पष्ट रूप से दिखाई देते हैं।

कंप्यूटिंग में गति प्रतिकरण, एक कलन विधि तकनीक है जिसका उपयोग वीडियो में कैमरे और/या वस्तुओं की गति के हिसाब से पिछले और/या भविष्य के प्रधार दिए जाने पर वीडियो में एक प्रधार का पूर्वानुमान करने के लिए किया जाता है। यह वीडियो संपीड़न के लिए वीडियो डेटा के कूटलेखन में कार्यरत है, उदाहरण के लिए MPEG-2 संचिकाओं की पीढ़ी में कार्यरत है। गति प्रतिकरण एक तस्वीर का वर्णन एक संदर्भ तस्वीर को वर्तमान तस्वीर में बदलने के संदर्भ में करता है। संदर्भ चित्र समय से पहले या भविष्य से भी हो सकता है। जब छवियों को पहले प्रेषित/संग्रहीत छवियों से यथार्थ रूप से संश्लेषित किया जा सकता है, तो संपीड़न दक्षता में सुधार किया जा सकता है।

असतत कोटिज्या परिवर्तन (डीसीटी) के साथ-साथ गति प्रतिकरण वीडियो कूटलेखन मानकों में उपयोग की जाने वाली दो प्रमुख वीडियो संपीड़न तकनीकों में से एक है। अधिकांश वीडियो कूटलेखन मानक, जैसे कि H.26x और MPEG प्रारूप, सामान्यतः गति-क्षतिपूर्ति DCT संकर कूटलेखन का उपयोग करते हैं,[1][2] खंड गति प्रतिकरण (बीएमसी) या गति-प्रतिकरण डीसीटी (एमसी डीसीटी) के रूप में जाना जाता है।

कार्यक्षमता

गति प्रतिकरण इस तथ्य का लाभ उठाता है कि, प्रायः, एक चलचित्र के कई फिल्म प्रधार के लिए, एक प्रधार और दूसरे के बीच एकमात्र अंतर या तो कैमरे के हिलने या प्रधार में किसी वस्तु के हिलने का परिणाम होता है। एक वीडियो संचिका के संदर्भ में, इसका अर्थ है कि एक प्रधार का प्रतिनिधित्व करने वाली अधिकांश जानकारी अगले प्रधार में उपयोग की जाने वाली जानकारी के समान होगी।

गति प्रतिकरण का उपयोग करते हुए, एक वीडियो स्ट्रीम में कुछ पूर्ण (संदर्भ) प्रधार होंगे; तब बीच में प्रधार के लिए संग्रहीत एकमात्र जानकारी पिछले प्रधार को अगले प्रधार में बदलने के लिए आवश्यक जानकारी होगी।

सचित्र उदाहरण

गति क्षतिपूर्ति कैसे काम करती है, इसकी एक सरल सचित्र व्याख्या निम्नलिखित है।हाथी का सपना चलचित्र से लगातार दो प्रधार लिए गए। जैसा कि छवियों से देखा जा सकता है, दो प्रधारों के बीच नीचे (गति प्रतिकरण) अंतर में पहले की छवियों की तुलना में काफी कम विवरण होता है, और इस प्रकार यह बाकी की तुलना में बहुत बेहतर होता है। इस प्रकार प्रतिकरण प्रधार को कोडित करने के लिए आवश्यक जानकारी अंतर प्रधार के मुकाबले बहुत छोटी होगी। इसका अर्थ यह भी है कि कम संपीड़न दक्षता की लागत पर अंतर छवि का उपयोग करके जानकारी को सांकेतिक शब्दों में बदलना भी संभव है, लेकिन बिना गति प्रतिपूर्ति कूटलेखन के कूटलेखन जटिलता को बचाकर; वस्तुतः गति प्रतिपूर्ति कूटलेखन (गति आकलन, गति क्षतिपूर्ति सहित) कूटलेखन जटिलता के 90% से अधिक पर अधिग्रहण कर लेती है।

प्रकार उदहारण प्रधार वर्णन
मौलिक Motion compensation example-original.jpg पूर्ण मूल प्रधार, जैसा कि चित्रपट पर दिखाया गया है।
भिन्नता Motion compensation example-difference.jpg मूल प्रधार और अगले प्रधार के बीच अंतर।
गति प्रतिकारित भिन्नता Motion compensation example-compensated difference.jpg मूल प्रधार और अगले प्रधार के बीच अंतर, 2 पिक्सेल द्वारा दाईं ओर स्थानांतरित किया गया। प्रधार को स्थानांतरित करने से कैमरे के पैनिंग की क्षतिपूर्ति होती है, इस प्रकार दो प्रधारों के बीच अधिक अतिछादित होता है।


एमपीईजी

MPEG में, छवियों का पूर्वानुमान पिछले प्रधारों से लगाया जाता है (P frames) या पिछले और भविष्य के प्रधार से अप्रत्यक्ष रूप से (B frames). B frames अधिक जटिल हैं क्योंकि छवि अनुक्रम को प्रेषित किया जाना चाहिए और अनुक्रम से बाहर संग्रहीत किया जाना चाहिए ताकि भविष्य का प्रधार उत्पन्न करने के लिए उपलब्ध हो B frames.[3] गति प्रतिकरण का उपयोग करके प्रधार की भविष्यवाणी करने के बाद, सांकेतिक शब्दों में बदलनेवाला अवशिष्ट पाता है, जो तब संकुचित और प्रसारित होता है।

वैश्विक गति प्रतिकरण

वैश्विक गति प्रतिकरण में, गति प्रतिरूप मूल रूप से कैमरा गतियों को दर्शाता है जैसे:

  • डॉली — कैमरे को आगे या पीछे ले जाना
  • ट्रैक — कैमरे को बाएँ या दाएँ ले जाना
  • बूम — कैमरे को ऊपर या नीचे ले जाना
  • पैन — कैमरे को उसके Y अक्ष के चारों ओर घुमाते हुए, दृश्य को बाएँ या दाएँ घुमाते हुए
  • टिल्ट — कैमरे को उसके X अक्ष के चारों ओर घुमाना, दृश्य को ऊपर या नीचे ले जाना
  • रोल - व्यू एक्सिस के चारों ओर कैमरे को घुमाना

यह गतिमान वस्तुओं के बिना स्थिर दृश्यों के लिए सबसे अच्छा काम करता है।

वैश्विक गति प्रतिकरण के कई लाभ हैं:

  • यह सामान्यतः वीडियो अनुक्रमों में पाए जाने वाले प्रमुख गति को केवल कुछ मापदंडों के साथ प्रतिरूप करता है। इन मापदण्ड की बिट-दर में हिस्सेदारी नगण्य है।
  • यह प्रधार का विभाजन नहीं करता है। यह विभाजन सीमाओं पर कलाकृतियों से बचा जाता है।
  • प्रधार में समान स्थानिक स्थिति वाले पिक्सेल की एक सीधी रेखा (समय की दिशा में) वास्तविक दृश्य में एक निरंतर गतिमान बिंदु से मेल खाती है। अन्य एमसी योजनाएं समय की दिशा में निरंतरता का परिचय देती हैं।

एमपीईजी-4 एएसपी तीन संदर्भ बिंदुओं के साथ वैश्विक गति प्रतिकरण का समर्थन करता है, हालांकि कुछ कार्यान्वयन केवल एक का उपयोग कर सकते हैं। एक एकल संदर्भ बिंदु केवल ट्रांसलेशनल गति की अनुमति देता है जो अपेक्षाकृत बड़ी प्रदर्शन लागत के लिए खंड आधारित गति प्रतिकरण पर थोड़ा लाभ प्रदान करता है।

एक प्रधार के भीतर चलती वस्तुओं को वैश्विक गति प्रतिकरण द्वारा पर्याप्त रूप से प्रदर्शित नहीं किया जाता है।

इस प्रकार, स्थानीय गति अनुमान भी आवश्यक है।

गति-प्रतिकरण डीसीटी

खंड गति प्रतिकरण

खंड गति प्रतिकरण (बीएमसी), जिसे गति-प्रतिकरण असतत कोटिज्या रूपांतरण (एमसी डीसीटी) के रूप में भी जाना जाता है, सबसे व्यापक रूप से इस्तेमाल की जाने वाली गति प्रतिकरण तकनीक है। [2] BMC में, प्रधार को पिक्सेल के खंड में विभाजित किया जाता है (उदाहरण के लिए MPEG में 16×16 पिक्सेल के दीर्घ-खंड)। संदर्भ प्रधार में समान आकार के खंड से प्रत्येक खंड की भविष्यवाणी की जाती है। पूर्वानुमानित खंड की स्थिति में स्थानांतरित किए जाने के अतिरिक्त खंड किसी भी तरह से रूपांतरित नहीं होते हैं। यह बदलाव एक गति सदिश द्वारा दर्शाया गया है।

प्रतिवैस खंड सदिश के बीच अतिरेक का लाभ उठाने के लिए, (उदाहरण के लिए कई खंडों द्वारा आच्छादित की गई एकल चलती वस्तु के लिए) बिट-स्ट्रीम में केवल वर्तमान और पिछले गति सदिश के बीच के अंतर को सांकेतिक शब्दों में बदलना सामान्य है। इस विभेदीकरण प्रक्रिया का परिणाम गणितीय रूप से पैनिंग करने में सक्षम वैश्विक गति प्रतिकरण के बराबर है। आगे कूटलेखन पाइपलाइन के नीचे, एक एन्ट्रापी कूटलेखन प्रक्षेपण आकार को कम करने के लिए शून्य सदिश के आसपास गति सदिशों के परिणामी सांख्यिकीय वितरण का लाभ उठाएगी।

पिक्सेल की एक गैर-पूर्णांक संख्या द्वारा एक खंड को स्थानांतरित करना संभव है, जिसे उप-पिक्सेल परिशुद्धता कहा जाता है। इन-बीच के पिक्सेल प्रतिवैस पिक्सेल को प्रक्षेपित करके उत्पन्न होते हैं। सामान्यतः, आधा-पिक्सेल या चौथाई पिक्सेल परिशुद्धता (क्यूपेल, H.264 और MPEG-4/ASP द्वारा उपयोग किया जाता है) का उपयोग किया जाता है। उप-पिक्सेल परिशुद्धता का कम्प्यूटेशनल व्यय अंतःक्षेप के लिए आवश्यक अतिरिक्त प्रसंस्करण और संकेतक पक्ष पर, संभावित स्रोत खंडों की एक बड़ी संख्या के मूल्यांकन के कारण बहुत अधिक है।

खंड गति प्रतिकरण का मुख्य हानि यह है कि यह खंड सीमाओं (अवरुद्ध कलाकृतियों) पर असंतोष का परिचय देता है। ये कलाकृतियां तीव्र क्षैतिज और ऊर्ध्वाधर किनारों के रूप में दिखाई देती हैं जो मानव आंखों द्वारा आसानी से देखी जाती हैं और फूरियर-संबंधित परिवर्तनों की सूची के गुणांकों के परिमाणीकरण के कारण झूठे किनारों और रिंगिंग प्रभाव (उच्च आवृत्ति उप-पट्ट में बड़े गुणांक) उत्पन्न करती हैं। फूरियर से संबंधित कूटलेखन बदलना उपयोग अवशिष्ट प्रधार के कूटलेखन को बदलने के लिए किया जाता है[4] खंड गति प्रतिकरण वर्तमान प्रधार को अनतिव्यापी खंड में विभाजित करता है, और गति प्रतिकरण सदिश बताता है कि वे खंड कहां से आए हैं (एक सामान्य भ्रम यह है कि पिछले प्रधार को गैर-अतिव्यापी खंडों में विभाजित किया गया है, और गति क्षतिपूर्ति सदिश बताते हैं कि वे खंड कहाँ जाते हैं)। स्रोत खंड सामान्यतः स्रोत प्रधार में अतिछादित होते हैं। कुछ वीडियो संपीड़न आयाम वर्तमान प्रधार को कई अलग-अलग पूर्व-संचारित प्रधारों के टुकड़ों से इकट्ठा करते हैं।

प्रधार्स को भविष्य के प्रधार से भी भविष्यवाणी की जा सकती है। भविष्य के प्रधार को अनुमानित प्रधार से पहले कोडित करने की आवश्यकता होती है और इस प्रकार, कूटलेखन अनुक्रम वास्तविक प्रधार अनुक्रम से मेल नहीं खाता है। इस तरह के प्रधारों की भविष्यवाणी सामान्यतः दो दिशाओं से की जाती है, यानी I- या P-प्रधार से जो अनुमानित प्रधार से तुरंत पहले या बाद में होते हैं। इन द्विदिश रूप से अनुमानित प्रधारों को वीडियो संपीड़न बी-प्रधार कहा जाता है। उदाहरण के लिए, एक कूटलेखन योजना IBBPBBPBBBPBB हो सकती है।

इसके अतिरिक्त, गति क्षतिपूर्ति के लिए त्रिकोणीय खपरैलों का उपयोग भी प्रस्तावित किया गया है। इस योजना के अंतर्गत, प्रधार को त्रिकोणों के साथ खपरैल किया जाता है, और इन त्रिकोणों पर एक परिशोधन परिवर्तन करके अगला प्रधार उत्पन्न किया जाता है। [5] केवल सजातीय परिवर्तन अभिलेखन/प्रेषित किए जाते हैं। यह आकारण, क्रमावर्तन, अनुवाद आदि से निपटने में सक्षम है।

परिवर्तनीय खंड-आकार गति प्रतिकरण

परिवर्तनशील खंड-माप गति प्रतिकरण (VBSMC) BMC का उपयोग है जिसमें संकेतक के लिए गतिशील रूप से खंड के आकार का चयन करने की क्षमता होती है। वीडियो कूटलेखन करते समय, बड़े खंडों का उपयोग गति सदिश का प्रतिनिधित्व करने के लिए आवश्यक बिट्स की संख्या को कम कर सकता है, जबकि छोटे खंडों के उपयोग से कोडित करने के लिए भविष्यवाणी की अवशिष्ट जानकारी कम हो सकती है। कार्य के अन्य क्षेत्रों ने खंड सीमाओं से परे चर-आकार सुविधा आव्यूह के उपयोग की जांच की है, जिससे अंतराफ्रेम सदिश की गणना की जा सकती है।[6] पुरानी अभिकल्पना जैसे H.261 और MPEG-1 वीडियो सामान्यतः एक निश्चित खंड आकार का उपयोग करते हैं, जबकि नए जैसे H.263, MPEG-4 भाग 2, H.264/MPEG-4 AVC, और VC-1 संकेतक देते हैं गति का प्रतिनिधित्व करने के लिए किस खंड आकार का उपयोग किया जाएगा, इसे गतिशील रूप से चुनने की क्षमता है।

अतिछादित्ड खंड गति प्रतिकरण

अतिछादित्ड खंड गति प्रतिकरण (ओबीएमसी) इन समस्याओं का एक अच्छा समाधान है क्योंकि यह न केवल भविष्यवाणी यथार्थता को बढ़ाता है बल्कि कलाकृतियों को अवरुद्ध करने से भी बचाता है। ओबीएमसी का उपयोग करते समय, खंड सामान्यतः प्रत्येक आयाम में दोगुने बड़े होते हैं और सभी 8 प्रतिवैस खंडों के साथ चतुर्भुज-वार अतिछादित होते हैं। इस प्रकार, प्रत्येक पिक्सेल 4 खंडों से संबंधित है। ऐसी योजना में, प्रत्येक पिक्सेल के लिए 4 भविष्यवाणियाँ होती हैं जिन्हें एक भारित माध्य तक अभिव्यक्त किया जाता है। इस उद्देश्य के लिए, खंड एक गवाक्ष फलन से जुड़े होते हैं जिसमें गुण होता है कि 4 अतिछादित्ड गवाक्ष फलन का योग हर जगह 1 के बराबर होता है।

ओबीएमसी की जटिलता को कम करने के तरीकों के अध्ययन से पता चला है कि तिरछे-आसन्न खंड के लिए गवाक्ष फलन में योगदान सबसे छोटा है। इस योगदान के लिए भार को शून्य तक कम करने और अन्य भार को समान मात्रा में बढ़ाने से गुणवत्ता में बड़े दंड के बिना जटिलता में पर्याप्त कमी आती है। ऐसी योजना में, प्रत्येक पिक्सेल तब 4 के स्थान पर 3 खंडों से संबंधित होता है, और 8 प्रतिवैस खंडों का उपयोग करने के स्थान पर, प्रत्येक खंड के क्षतिपूरण के लिए केवल 4 का उपयोग किया जाता है। ऐसी योजना H.263 अनुलग्नक F उन्नत भविष्यवाणी प्रणाली में पाई जाती है

चतुर्थाँश पिक्सेल (क्यूपेल) और आधा पिक्सेल गति प्रतिकरण

गति प्रतिकरण में, चौथाई या आधे प्रतिरूप वस्तुतः भिन्नात्मक गति सदिश के कारण प्रक्षेपित उप-प्रतिरूप होते हैं। सदिश और पूर्ण-प्रतिरूप के आधार पर, उप-प्रतिरूप की गणना बाइबिक या बिलिनियर 2-डी निस्यंदन का उपयोग करके की जा सकती है। H.264 मानक के उपखंड 8.4.2.2 भिन्नात्मक नमूना प्रक्षेप प्रक्रिया देखें।

3डी छवि कूटलेखन तकनीक

गति क्षतिपूर्ति का उपयोग त्रिविमदर्शी वीडियो कूटलेखन में किया जाता है

वीडियो में, समय को प्रायः तीसरे आयाम के रूप में माना जाता है। स्थिर कूटलेखन तकनीकों को एक अतिरिक्त आयाम में विस्तारित किया जा सकता है।

जेपीईजी 2000 ऊर्मिका का उपयोग करता है, और इन्हें अनुकूली तरीके से खंड के बीच अंतराल के बिना गति को कोडित करने के लिए भी इस्तेमाल किया जा सकता है। भिन्नीय पिक्सेल सजातीय परिवर्तन से आसन्न पिक्सेल के बीच रक्तस्राव होता है। यदि कोई उच्च आंतरिक विश्लेषण का उपयोग नहीं किया जाता है, तो मई + डेल्टा छवियां ज्यादातर छवि को धुंधला करने के विरुद्ध लड़ती हैं। डेल्टा छवि को ऊर्मिका के रूप में भी कोडित किया जा सकता है, ताकि अनुकूली खंडों की सीमाएं मेल खा सकें।

2D+डेल्टा कूटलेखन तकनीक H.264 और MPEG-2 संगत कूटलेखन का उपयोग करती है और त्रिविम छवियों के बीच संपीड़ित करने के लिए गति क्षतिपूर्ति का उपयोग कर सकती है।

इतिहास

गति प्रतिकरण की अवधारणा का एक अग्रदूत 1929 से प्रारम्भ होता है, जब ब्रिटेन में आर.डी. केल ने एक रेखीय वीडियो दृश्य के केवल भागों को प्रसारित करने की अवधारणा का प्रस्ताव रखा था जो प्रधार-से-प्रधार पर बदल गया था। 1959 में, एनएचके के शोधकर्ताओं वाई. टाकी, एम. होतोरी और एस. तनाका द्वारा अंतर-प्रधार गति प्रतिकरण की अवधारणा प्रस्तावित की गई थी, जिन्होंने अस्थायी आयाम में अनुमानित पर-प्रधार वीडियो कूटलेखन प्रस्तावित की थी। [7]


गति-प्रतिकरण डीसीटी

क्रियात्मक गति-प्रतिकरण वीडियो संपीड़न गति-प्रतिकरण असतत कोटिज्या रूपांतरण (MC DCT) कूटलेखन के विकास के साथ उभरा,[8] खंड गति प्रतिकरण (BMC) या DCT गति प्रतिकरण भी कहा जाता है। यह एक संकरित कूटलेखन कलन विधि है,[7] जो दो प्रमुख डेटा संपीड़न तकनीकों को जोड़ती है: असतत कोटिज्या रूपांतरण (DCT) कूटलेखन [8] स्थानिक आयाम में, और लौकिक आयाम में भविष्यसूचक गति प्रतिकरण है। [7] डीसीटी कूटलेखन एक हानिपूर्ण संपीड़न खंड संपीड़न परिवर्तन कूटलेखन तकनीक है जिसे पहली बार एन. अहमद द्वारा प्रस्तावित किया गया था, जो प्रारम्भ में इसे 1972 में छवि संपीड़न के लिए अभिप्रेत था। [9] 1974 में, दक्षिणी कैलिफोर्निया विश्वविद्यालय में अली हबीबी ने संकरित कूटलेखन को प्रारम्भ की,[10][11] जो भविष्यसूचक कूटलेखन को रूपांतरण कूटलेखन के साथ जोड़ती है। [7][12] हालाँकि, उनका कलन विधि प्रारम्भ में स्थानिक आयाम में अतः-प्रधार कूटलेखन तक सीमित था। 1975 में, जॉन ए. रोएज़ और गनर एस. रॉबिन्सन ने हबीबी के संकरित कूटलेखन कलन विधि को लौकिक आयाम में रूपांतरण कूटलेखन और लौकिक आयाम में भविष्यसूचक कूटलेखन का उपयोग करते हुए अंतर-प्रधार गति-प्रतिकरण संकरित कूटलेखन विकसित करते हुए, लौकिक आयाम तक बढ़ाया। [7][13] स्थानिक परिवर्तन कूटलेखन के लिए, उन्होंने डीसीटी और फास्ट फूरियर रूपांतरण (एफएफटी) के साथ प्रयोग किया, दोनों के लिए अंतर-प्रधार संकरित संकेतक विकसित किया, और पाया कि डीसीटी इसकी कम जटिलता के कारण सबसे कुशल है, छवि डेटा को कम करने में सक्षम है 2-अंश प्रति पिक्सेल की आवश्यकता वाले अंतर-प्रधार संकेतक की तुलना में छवि गुणवत्ता वाले वीडियो फोन दृश्य के लिए 0.25-बिट प्रति पिक्सेल है। [14][13]

1977 में, वेन-सिउंग चेन ने सी.एच. के साथ एक तीव्ऱ डीसीटी आयाम विकसित किया। स्मिथ और एस.सी. फ्रलिक।[15] 1979 में, अनिल के. जैन (इलेक्ट्रिकल इंजीनियर, जन्म 1946) | अनिल के. जैन और जसवंत आर. जैन ने गति-प्रतिपूर्ति डीसीटी वीडियो संपीड़न विकसित किया,[16][7] खंड गति प्रतिकरण भी कहा जाता है।[7] इसने 1981 में चेन को एक व्यावहारिक वीडियो संपीड़न कलन विधि विकसित करने के लिए प्रेरित किया, जिसे गति-क्षतिपूर्ति DCT या अनुकूली दृश्य कूटलेखन कहा जाता है।[7] गति-प्रतिकरण DCT बाद में 1980 के दशक के अंत से वीडियो संपीड़न के लिए मानक कूटलेखन तकनीक बन गया ।[17][2]

पहला डिजिटल वीडियो कूटलेखन मानक H.120 था, जिसे 1984 में ITU-T (अब ITU-T) द्वारा विकसित किया गया था।[18] H.120 ने गति-क्षतिपूर्ति DPCM कूटलेखन का उपयोग किया,[7]जो वीडियो कूटलेखन के लिए अक्षम था,[17]और H.120 इस प्रकार कम प्रदर्शन के कारण अव्यावहारिक था।[18]H.261 मानक 1988 में गति-क्षतिपूर्ति DCT संपीड़न के आधार पर विकसित किया गया था,[17][2]और यह पहला व्यावहारिक वीडियो कूटलेखन मानक था।[18]तब से, गति-कंपेंसेटेड DCT कम्प्रेशन को सभी प्रमुख वीडियो कूटलेखन मानकों (H.26x और MPEG फॉर्मेट सहित) द्वारा अपनाया गया है।[17][2]


यह भी देखें

अनुप्रयोग

संदर्भ

  1. Chen, Jie; Koc, Ut-Va; Liu, KJ Ray (2001). Design of Digital Video Coding Systems: A Complete Compressed Domain Approach. CRC Press. p. 71. ISBN 9780203904183.
  2. Jump up to: 2.0 2.1 2.2 2.3 2.4 Li, Jian Ping (2006). Proceedings of the International Computer Conference 2006 on Wavelet Active Media Technology and Information Processing: Chongqing, China, 29-31 August 2006. World Scientific. p. 847. ISBN 9789812709998.
  3. "MPEG-2 FAQ". February 20, 2009. Archived from the original on 2009-02-20.
  4. Zeng, Kai, et al. "Characterizing perceptual artifacts in compressed video streams." IS&T/SPIE Electronic Imaging. International Society for Optics and Photonics, 2014.
  5. Aizawa, Kiyoharu, and Thomas S. Huang. "Model-based image coding advanced video coding techniques for very low bit-rate applications." Proceedings of the IEEE 83.2 (1995): 259-271.
  6. Garnham, Nigel W. (1995). गति मुआवजा वीडियो कोडिंग - पीएचडी थीसिस (PDF). University of Nottingham. OCLC 59633188.
  7. Jump up to: 7.0 7.1 7.2 7.3 7.4 7.5 7.6 7.7 7.8 "वीडियो संपीड़न का इतिहास". ITU-T. Joint Video Team (JVT) of ISO/IEC MPEG & ITU-T VCEG (ISO/IEC JTC1/SC29/WG11 and ITU-T SG16 Q.6). July 2002. pp. 11, 24–9, 33, 40–1, 53–6. Retrieved 3 November 2019.
  8. Jump up to: 8.0 8.1 Lea, William (1994). Video on demand: Research Paper 94/68. House of Commons Library. Archived from the original on 20 September 2019. Retrieved 20 September 2019.
  9. Ahmed, Nasir (January 1991). "मैं असतत कोसाइन परिवर्तन के साथ कैसे आया". Digital Signal Processing. 1 (1): 4–5. doi:10.1016/1051-2004(91)90086-Z.
  10. Habibi, Ali (1974). "सचित्र डेटा की हाइब्रिड कोडिंग". IEEE Transactions on Communications. 22 (5): 614–624. doi:10.1109/TCOM.1974.1092258.
  11. Chen, Z.; He, T.; Jin, X.; Wu, F. (2020). "वीडियो संपीड़न के लिए सीखना". IEEE Transactions on Circuits and Systems for Video Technology. 30 (2): 566–576. arXiv:1804.09869. doi:10.1109/TCSVT.2019.2892608. S2CID 13743007.
  12. Ohm, Jens-Rainer (2015). मल्टीमीडिया सिग्नल कोडिंग और ट्रांसमिशन. Springer. p. 364. ISBN 9783662466919.
  13. Jump up to: 13.0 13.1 Roese, John A.; Robinson, Guner S. (30 October 1975). "डिजिटल इमेज सीक्वेंस की संयुक्त स्थानिक और टेम्पोरल कोडिंग". Efficient Transmission of Pictorial Information. International Society for Optics and Photonics. 0066: 172–181. Bibcode:1975SPIE...66..172R. doi:10.1117/12.965361. S2CID 62725808.
  14. Huang, T. S. (1981). छवि अनुक्रम विश्लेषण. Springer Science & Business Media. p. 29. ISBN 9783642870378.
  15. Chen, Wen-Hsiung; Smith, C. H.; Fralick, S. C. (September 1977). "असतत कोज्या रूपांतरण के लिए एक तेज़ कम्प्यूटेशनल एल्गोरिथम". IEEE Transactions on Communications. 25 (9): 1004–1009. doi:10.1109/TCOM.1977.1093941.
  16. Cianci, Philip J. (2014). High Definition Television: The Creation, Development and Implementation of HDTV Technology. McFarland. p. 63. ISBN 9780786487974.
  17. Jump up to: 17.0 17.1 17.2 17.3 Ghanbari, Mohammed (2003). Standard Codecs: Image Compression to Advanced Video Coding. Institution of Engineering and Technology. pp. 1–2. ISBN 9780852967102.
  18. Jump up to: 18.0 18.1 18.2 "वीडियो फ़ाइल स्वरूपों का इतिहास इन्फोग्राफिक". RealNetworks. 22 April 2012. Retrieved 5 August 2019.


बाहरी संबंध