गति प्रतिकरण: Difference between revisions

From Vigyanwiki
(Created page with "{{Short description|Video compression technique, used to efficiently predict and generate video frames}} Image:Elephantsdream_vectorstill04_crop.png|thumb|एमपीईज...")
 
No edit summary
Line 1: Line 1:
{{Short description|Video compression technique, used to efficiently predict and generate video frames}}
{{Short description|Video compression technique, used to efficiently predict and generate video frames}}
[[Image:Elephantsdream_vectorstill04_crop.png|thumb|एमपीईजी ब्लॉक मोशन मुआवजे का विजुअलाइजेशन। एक फ्रेम से दूसरे फ्रेम में जाने वाले ब्लॉक सफेद तीरों के रूप में दिखाए जाते हैं, जिससे विभिन्न प्लेटफार्मों की गति और चरित्र स्पष्ट रूप से दिखाई देते हैं।]]कंप्यूटिंग में गति मुआवजा, एक एल्गोरिथम तकनीक है जिसका उपयोग वीडियो में कैमरे और/या वस्तुओं की गति के हिसाब से पिछले और/या भविष्य के फ्रेम दिए जाने पर वीडियो में एक फ्रेम की भविष्यवाणी करने के लिए किया जाता है। यह [[वीडियो संपीड़न]] के लिए वीडियो डेटा के एन्कोडिंग में कार्यरत है, उदाहरण के लिए [[MPEG]]-2 फ़ाइलों की पीढ़ी में। मोशन कंपंसेशन एक तस्वीर का वर्णन एक संदर्भ तस्वीर को वर्तमान तस्वीर में बदलने के संदर्भ में करता है। संदर्भ चित्र समय से पहले या भविष्य से भी हो सकता है। जब छवियों को पहले प्रेषित/संग्रहीत छवियों से सटीक रूप से संश्लेषित किया जा सकता है, तो संपीड़न दक्षता में सुधार किया जा सकता है।
[[Image:Elephantsdream_vectorstill04_crop.png|thumb|एमपीईजी ब्लॉक गति प्रतिकरण का विजुअलाइजेशन। एक प्रधार से दूसरे प्रधार में जाने वाले ब्लॉक सफेद तीरों के रूप में दिखाए जाते हैं, जिससे विभिन्न प्लेटफार्मों की गति और चरित्र स्पष्ट रूप से दिखाई देते हैं।]]कंप्यूटिंग में गति प्रतिकरण, एक कलन विधि तकनीक है जिसका उपयोग वीडियो में कैमरे और/या वस्तुओं की गति के हिसाब से पिछले और/या भविष्य के प्रधार दिए जाने पर वीडियो में एक प्रधार का पूर्वानुमान करने के लिए किया जाता है। यह [[वीडियो संपीड़न]] के लिए वीडियो डेटा के कूटलेखन में कार्यरत है, उदाहरण के लिए [[MPEG]]-2 संचिकाओं की पीढ़ी में कार्यरत है। गति प्रतिकरण एक तस्वीर का वर्णन एक संदर्भ तस्वीर को वर्तमान तस्वीर में बदलने के संदर्भ में करता है। संदर्भ चित्र समय से पहले या भविष्य से भी हो सकता है। जब छवियों को पहले प्रेषित/संग्रहीत छवियों से यथार्थ रूप से संश्लेषित किया जा सकता है, तो संपीड़न दक्षता में सुधार किया जा सकता है।


[[असतत कोसाइन परिवर्तन]] (डीसीटी) के साथ-साथ मोशन मुआवजा [[वीडियो कोडिंग मानकों]] में उपयोग की जाने वाली दो प्रमुख वीडियो संपीड़न तकनीकों में से एक है। अधिकांश वीडियो कोडिंग मानक, जैसे कि H.26x और MPEG प्रारूप, आमतौर पर गति-क्षतिपूर्ति DCT हाइब्रिड कोडिंग का उपयोग करते हैं,<ref>{{cite book |last1=Chen |first1=Jie |last2=Koc |first2=Ut-Va |last3=Liu |first3=KJ Ray |title=Design of Digital Video Coding Systems: A Complete Compressed Domain Approach |date=2001 |publisher=[[CRC Press]] |isbn=9780203904183 |page=71 |url=https://books.google.com/books?id=LUzFKU3HeegC&pg=PA71}}</ref><ref name="Li"/>ब्लॉक मोशन मुआवजा (बीएमसी) या गति-मुआवजा डीसीटी (एमसी डीसीटी) के रूप में जाना जाता है।
[[असतत कोसाइन परिवर्तन|असतत कोटिज्या परिवर्तन]] (डीसीटी) के साथ-साथ गति प्रतिकरण [[वीडियो कोडिंग मानकों|वीडियो कूटलेखन मानकों]] में उपयोग की जाने वाली दो प्रमुख वीडियो संपीड़न तकनीकों में से एक है। अधिकांश वीडियो कूटलेखन मानक, जैसे कि H.26x और MPEG प्रारूप, सामान्यतः गति-क्षतिपूर्ति DCT संकर कूटलेखन का उपयोग करते हैं,<ref>{{cite book |last1=Chen |first1=Jie |last2=Koc |first2=Ut-Va |last3=Liu |first3=KJ Ray |title=Design of Digital Video Coding Systems: A Complete Compressed Domain Approach |date=2001 |publisher=[[CRC Press]] |isbn=9780203904183 |page=71 |url=https://books.google.com/books?id=LUzFKU3HeegC&pg=PA71}}</ref><ref name="Li"/> ब्लॉक गति प्रतिकरण (बीएमसी) या गति-प्रतिकरण डीसीटी (एमसी डीसीटी) के रूप में जाना जाता है।


== कार्यक्षमता ==
== कार्यक्षमता ==
मोशन मुआवजा इस तथ्य का फायदा उठाता है कि, अक्सर, एक फिल्म के कई [[फिल्म फ्रेम]] के लिए, एक फ्रेम और दूसरे के बीच एकमात्र अंतर या तो कैमरे के हिलने या फ्रेम में किसी वस्तु के हिलने का परिणाम होता है। एक वीडियो फ़ाइल के संदर्भ में, इसका अर्थ है कि एक फ्रेम का प्रतिनिधित्व करने वाली अधिकांश जानकारी अगले फ्रेम में उपयोग की जाने वाली जानकारी के समान होगी।
गति प्रतिकरण इस तथ्य का लाभ उठाता है कि, प्रायः, एक चलचित्र के कई [[फिल्म फ्रेम|फिल्म प्रधार]] के लिए, एक प्रधार और दूसरे के बीच एकमात्र अंतर या तो कैमरे के हिलने या प्रधार में किसी वस्तु के हिलने का परिणाम होता है। एक वीडियो संचिका के संदर्भ में, इसका अर्थ है कि एक प्रधार का प्रतिनिधित्व करने वाली अधिकांश जानकारी अगले प्रधार में उपयोग की जाने वाली जानकारी के समान होगी।


गति मुआवजे का उपयोग करते हुए, एक वीडियो स्ट्रीम में कुछ पूर्ण (संदर्भ) फ़्रेम होंगे; तब बीच में फ़्रेम के लिए संग्रहीत एकमात्र जानकारी पिछले फ़्रेम को अगले फ़्रेम में बदलने के लिए आवश्यक जानकारी होगी।
गति प्रतिकरण का उपयोग करते हुए, एक वीडियो स्ट्रीम में कुछ पूर्ण (संदर्भ) प्रधार होंगे; तब बीच में प्रधार के लिए संग्रहीत एकमात्र जानकारी पिछले प्रधार को अगले प्रधार में बदलने के लिए आवश्यक जानकारी होगी।


== सचित्र उदाहरण ==
== सचित्र उदाहरण ==
गति क्षतिपूर्ति कैसे काम करती है, इसकी एक सरल सचित्र व्याख्या निम्नलिखित है। [[ हाथी का सपना ]] फिल्म से लगातार दो फ्रेम लिए गए। जैसा कि छवियों से देखा जा सकता है, दो फ़्रेमों के बीच नीचे (गति मुआवजा) अंतर में पहले की छवियों की तुलना में काफी कम विवरण होता है, और इस प्रकार यह बाकी की तुलना में बहुत बेहतर होता है। इस प्रकार मुआवजा फ्रेम को एन्कोड करने के लिए आवश्यक जानकारी अंतर फ्रेम के मुकाबले बहुत छोटी होगी। इसका मतलब यह भी है कि कम संपीड़न दक्षता की लागत पर अंतर छवि का उपयोग करके जानकारी को सांकेतिक शब्दों में बदलना भी संभव है, लेकिन बिना गति प्रतिपूर्ति कोडिंग के कोडिंग जटिलता को बचाकर; वास्तव में गति प्रतिपूर्ति कोडिंग (गति आकलन, गति क्षतिपूर्ति सहित) एन्कोडिंग जटिलता के 90% से अधिक पर कब्जा कर लेती है।
गति क्षतिपूर्ति कैसे काम करती है, इसकी एक सरल सचित्र व्याख्या निम्नलिखित है।[[ हाथी का सपना ]]चलचित्र से लगातार दो प्रधार लिए गए। जैसा कि छवियों से देखा जा सकता है, दो प्रधारों के बीच नीचे (गति प्रतिकरण) अंतर में पहले की छवियों की तुलना में काफी कम विवरण होता है, और इस प्रकार यह बाकी की तुलना में बहुत बेहतर होता है। इस प्रकार प्रतिकरण प्रधार को कोडित करने के लिए आवश्यक जानकारी अंतर प्रधार के मुकाबले बहुत छोटी होगी। इसका अर्थ यह भी है कि कम संपीड़न दक्षता की लागत पर अंतर छवि का उपयोग करके जानकारी को सांकेतिक शब्दों में बदलना भी संभव है, लेकिन बिना गति प्रतिपूर्ति कूटलेखन के कूटलेखन जटिलता को बचाकर; वस्तुतः गति प्रतिपूर्ति कूटलेखन (गति आकलन, गति क्षतिपूर्ति सहित) कूटलेखन जटिलता के 90% से अधिक पर अधिग्रहण कर लेती है।


  {| class="wikitable"
  {| class="wikitable"
|-
|-
! Type
! प्रकार
! Example Frame
! उदहारण प्रधार
! Description
! वर्णन
|-
|-
| Original
| मौलिक
| [[File:Motion compensation example-original.jpg|160px]]
| [[File:Motion compensation example-original.jpg|160px]]
| Full original frame, as shown on screen.
| पूर्ण मूल प्रधार, जैसा कि चित्रपट पर दिखाया गया है।
|-
|-
| Difference
| भिन्नता
| [[File:Motion compensation example-difference.jpg|160px]]
| [[File:Motion compensation example-difference.jpg|160px]]
| Differences between the original frame and the next frame.
| मूल प्रधार और अगले प्रधार के बीच अंतर।
|-
|-
| Motion compensated difference
| गति प्रतिकारित भिन्नता
| [[File:Motion compensation example-compensated difference.jpg|160px]]
| [[File:Motion compensation example-compensated difference.jpg|160px]]
| Differences between the original frame and the next frame, shifted right by 2 pixels. Shifting the frame ''compensates'' for the [[panning (camera)|panning]] of the camera, thus there is greater overlap between the two frames.
| मूल प्रधार और अगले प्रधार के बीच अंतर, 2 पिक्सेल द्वारा दाईं ओर स्थानांतरित किया गया। प्रधार को स्थानांतरित करने से कैमरे के पैनिंग की क्षतिपूर्ति होती है, इस प्रकार दो प्रधारों के बीच अधिक अतिछादित होता है।
|}
|}


Line 34: Line 34:
== एमपीईजी ==
== एमपीईजी ==


MPEG में, छवियों का पूर्वानुमान पिछले फ़्रेमों से लगाया जाता है {{nowrap|([[Video compression picture types|P frames]])}} या पिछले और भविष्य के फ्रेम से अप्रत्यक्ष रूप से {{nowrap|([[Video compression picture types|B frames]]).}} {{nowrap|B frames}} अधिक जटिल हैं क्योंकि छवि अनुक्रम को प्रेषित किया जाना चाहिए और ऑर्डर से बाहर संग्रहीत किया जाना चाहिए ताकि भविष्य का फ्रेम उत्पन्न करने के लिए उपलब्ध हो {{nowrap|B frames.}}<ref>{{Cite web|url=http://bmrc.berkeley.edu/research/mpeg/faq/mpeg2-v38/faq_v38.html#tag40|title=MPEG-2 FAQ|date=February 20, 2009|archive-url=https://web.archive.org/web/20090220062554/http://bmrc.berkeley.edu/research/mpeg/faq/mpeg2-v38/faq_v38.html#tag40 |archive-date=2009-02-20 }}</ref>
MPEG में, छवियों का पूर्वानुमान पिछले प्रधारों से लगाया जाता है {{nowrap|([[Video compression picture types|P frames]])}} या पिछले और भविष्य के प्रधार से अप्रत्यक्ष रूप से {{nowrap|([[Video compression picture types|B frames]]).}} {{nowrap|B frames}} अधिक जटिल हैं क्योंकि छवि अनुक्रम को प्रेषित किया जाना चाहिए और ऑर्डर से बाहर संग्रहीत किया जाना चाहिए ताकि भविष्य का प्रधार उत्पन्न करने के लिए उपलब्ध हो {{nowrap|B frames.}}<ref>{{Cite web|url=http://bmrc.berkeley.edu/research/mpeg/faq/mpeg2-v38/faq_v38.html#tag40|title=MPEG-2 FAQ|date=February 20, 2009|archive-url=https://web.archive.org/web/20090220062554/http://bmrc.berkeley.edu/research/mpeg/faq/mpeg2-v38/faq_v38.html#tag40 |archive-date=2009-02-20 }}</ref>
गति मुआवजे का उपयोग करके फ़्रेम की भविष्यवाणी करने के बाद, सांकेतिक शब्दों में बदलनेवाला अवशिष्ट पाता है, जो तब संकुचित और प्रसारित होता है।
गति प्रतिकरण का उपयोग करके प्रधार की भविष्यवाणी करने के बाद, सांकेतिक शब्दों में बदलनेवाला अवशिष्ट पाता है, जो तब संकुचित और प्रसारित होता है।


== [[वैश्विक गति मुआवजा]] ==
== [[वैश्विक गति मुआवजा|वैश्विक गति प्रतिकरण]] ==


वैश्विक गति मुआवजे में, गति मॉडल मूल रूप से कैमरा गतियों को दर्शाता है जैसे:
वैश्विक गति प्रतिकरण में, गति मॉडल मूल रूप से कैमरा गतियों को दर्शाता है जैसे:
* डॉली — कैमरे को आगे या पीछे ले जाना
* डॉली — कैमरे को आगे या पीछे ले जाना
* ट्रैक — कैमरे को बाएँ या दाएँ ले जाना
* ट्रैक — कैमरे को बाएँ या दाएँ ले जाना
Line 49: Line 49:
यह गतिमान वस्तुओं के बिना स्थिर दृश्यों के लिए सबसे अच्छा काम करता है।
यह गतिमान वस्तुओं के बिना स्थिर दृश्यों के लिए सबसे अच्छा काम करता है।


वैश्विक गति मुआवजे के कई फायदे हैं:
वैश्विक गति प्रतिकरण के कई फायदे हैं:
* यह आमतौर पर वीडियो अनुक्रमों में पाए जाने वाले प्रमुख गति को केवल कुछ मापदंडों के साथ मॉडल करता है। इन पैरामीटरों की बिट-दर में हिस्सेदारी नगण्य है।
* यह सामान्यतः वीडियो अनुक्रमों में पाए जाने वाले प्रमुख गति को केवल कुछ मापदंडों के साथ मॉडल करता है। इन पैरामीटरों की बिट-दर में हिस्सेदारी नगण्य है।
* यह फ्रेम का विभाजन नहीं करता है। यह विभाजन सीमाओं पर कलाकृतियों से बचा जाता है।
* यह प्रधार का विभाजन नहीं करता है। यह विभाजन सीमाओं पर कलाकृतियों से बचा जाता है।
* फ्रेम में समान स्थानिक स्थिति वाले पिक्सेल की एक सीधी रेखा (समय की दिशा में) वास्तविक दृश्य में एक निरंतर गतिमान बिंदु से मेल खाती है। अन्य एमसी योजनाएं समय की दिशा में निरंतरता का परिचय देती हैं।
* प्रधार में समान स्थानिक स्थिति वाले पिक्सेल की एक सीधी रेखा (समय की दिशा में) वास्तविक दृश्य में एक निरंतर गतिमान बिंदु से मेल खाती है। अन्य एमसी योजनाएं समय की दिशा में निरंतरता का परिचय देती हैं।


एमपीईजी-4 एएसपी तीन संदर्भ बिंदुओं के साथ वैश्विक गति मुआवजे का समर्थन करता है, हालांकि कुछ कार्यान्वयन केवल एक का उपयोग कर सकते हैं। एक एकल संदर्भ बिंदु केवल ट्रांसलेशनल गति की अनुमति देता है जो अपेक्षाकृत बड़ी प्रदर्शन लागत के लिए ब्लॉक आधारित गति मुआवजे पर थोड़ा लाभ प्रदान करता है।
एमपीईजी-4 एएसपी तीन संदर्भ बिंदुओं के साथ वैश्विक गति प्रतिकरण का समर्थन करता है, हालांकि कुछ कार्यान्वयन केवल एक का उपयोग कर सकते हैं। एक एकल संदर्भ बिंदु केवल ट्रांसलेशनल गति की अनुमति देता है जो अपेक्षाकृत बड़ी प्रदर्शन लागत के लिए ब्लॉक आधारित गति प्रतिकरण पर थोड़ा लाभ प्रदान करता है।


एक फ्रेम के भीतर चलती वस्तुओं को वैश्विक गति मुआवजे द्वारा पर्याप्त रूप से प्रदर्शित नहीं किया जाता है।
एक प्रधार के भीतर चलती वस्तुओं को वैश्विक गति प्रतिकरण द्वारा पर्याप्त रूप से प्रदर्शित नहीं किया जाता है।
इस प्रकार, स्थानीय गति अनुमान भी आवश्यक है।
इस प्रकार, स्थानीय गति अनुमान भी आवश्यक है।


== मोशन-मुआवजा डीसीटी ==
== गति-प्रतिकरण डीसीटी ==


=== ब्लॉक मोशन मुआवजा ===
=== ब्लॉक गति प्रतिकरण ===
{{See also|Block-matching algorithm}}
{{See also|Block-matching algorithm}}
ब्लॉक मोशन मुआवजा (बीएमसी), जिसे गति-मुआवजा असतत कोसाइन ट्रांसफॉर्म (एमसी डीसीटी) के रूप में भी जाना जाता है, सबसे व्यापक रूप से इस्तेमाल की जाने वाली गति मुआवजा तकनीक है।<ref name="Li">{{cite book |last1=Li |first1=Jian Ping |title=Proceedings of the International Computer Conference 2006 on Wavelet Active Media Technology and Information Processing: Chongqing, China, 29-31 August 2006 |date=2006 |publisher=[[World Scientific]] |isbn=9789812709998 |page=847 |url=https://books.google.com/books?id=FZiK3zXdK7sC&pg=PA847}}</ref> BMC में, फ़्रेम को पिक्सेल के ब्लॉक में विभाजित किया जाता है (उदाहरण के लिए MPEG में 16×16 पिक्सेल के मैक्रो-ब्लॉक)।
ब्लॉक गति प्रतिकरण (बीएमसी), जिसे गति-प्रतिकरण असतत कोटिज्या ट्रांसफॉर्म (एमसी डीसीटी) के रूप में भी जाना जाता है, सबसे व्यापक रूप से इस्तेमाल की जाने वाली गति प्रतिकरण तकनीक है।<ref name="Li">{{cite book |last1=Li |first1=Jian Ping |title=Proceedings of the International Computer Conference 2006 on Wavelet Active Media Technology and Information Processing: Chongqing, China, 29-31 August 2006 |date=2006 |publisher=[[World Scientific]] |isbn=9789812709998 |page=847 |url=https://books.google.com/books?id=FZiK3zXdK7sC&pg=PA847}}</ref> BMC में, प्रधार को पिक्सेल के ब्लॉक में विभाजित किया जाता है (उदाहरण के लिए MPEG में 16×16 पिक्सेल के मैक्रो-ब्लॉक)।
संदर्भ फ्रेम में समान आकार के ब्लॉक से प्रत्येक ब्लॉक की भविष्यवाणी की जाती है।
संदर्भ प्रधार में समान आकार के ब्लॉक से प्रत्येक ब्लॉक की भविष्यवाणी की जाती है।
पूर्वानुमानित ब्लॉक की स्थिति में स्थानांतरित किए जाने के अलावा ब्लॉक किसी भी तरह से रूपांतरित नहीं होते हैं।
पूर्वानुमानित ब्लॉक की स्थिति में स्थानांतरित किए जाने के अलावा ब्लॉक किसी भी तरह से रूपांतरित नहीं होते हैं।
यह बदलाव एक मोशन वेक्टर द्वारा दर्शाया गया है।
यह बदलाव एक गति वेक्टर द्वारा दर्शाया गया है।


पड़ोसी ब्लॉक वैक्टर के बीच अतिरेक का फायदा उठाने के लिए, (उदाहरण के लिए कई ब्लॉकों द्वारा कवर की गई एकल चलती वस्तु के लिए) बिट-स्ट्रीम में केवल वर्तमान और पिछले गति वेक्टर के बीच के अंतर को सांकेतिक शब्दों में बदलना आम है। इस विभेदीकरण प्रक्रिया का परिणाम गणितीय रूप से पैनिंग करने में सक्षम वैश्विक गति मुआवजे के बराबर है।
पड़ोसी ब्लॉक वैक्टर के बीच अतिरेक का लाभ उठाने के लिए, (उदाहरण के लिए कई ब्लॉकों द्वारा कवर की गई एकल चलती वस्तु के लिए) बिट-स्ट्रीम में केवल वर्तमान और पिछले गति वेक्टर के बीच के अंतर को सांकेतिक शब्दों में बदलना आम है। इस विभेदीकरण प्रक्रिया का परिणाम गणितीय रूप से पैनिंग करने में सक्षम वैश्विक गति प्रतिकरण के बराबर है।
आगे एन्कोडिंग पाइपलाइन के नीचे, एक [[एन्ट्रापी एन्कोडिंग]] आउटपुट आकार को कम करने के लिए शून्य वेक्टर के आसपास गति वैक्टरों के परिणामी सांख्यिकीय वितरण का लाभ उठाएगी।
आगे कूटलेखन पाइपलाइन के नीचे, एक [[एन्ट्रापी एन्कोडिंग|एन्ट्रापी कूटलेखन]] आउटपुट आकार को कम करने के लिए शून्य वेक्टर के आसपास गति वैक्टरों के परिणामी सांख्यिकीय वितरण का लाभ उठाएगी।


पिक्सेल की एक गैर-पूर्णांक संख्या द्वारा एक ब्लॉक को स्थानांतरित करना संभव है, जिसे उप-पिक्सेल परिशुद्धता कहा जाता है।
पिक्सेल की एक गैर-पूर्णांक संख्या द्वारा एक ब्लॉक को स्थानांतरित करना संभव है, जिसे उप-पिक्सेल परिशुद्धता कहा जाता है।
इन-बीच के पिक्सेल पड़ोसी पिक्सेल को प्रक्षेपित करके उत्पन्न होते हैं। सामान्यतः, आधा-पिक्सेल या चौथाई पिक्सेल परिशुद्धता ([[Qpel]], H.264 और MPEG-4/ASP द्वारा उपयोग किया जाता है) का उपयोग किया जाता है। उप-पिक्सेल परिशुद्धता का कम्प्यूटेशनल खर्च इंटरपोलेशन के लिए आवश्यक अतिरिक्त प्रसंस्करण और एन्कोडर पक्ष पर, संभावित स्रोत ब्लॉकों की एक बड़ी संख्या के मूल्यांकन के कारण बहुत अधिक है।
इन-बीच के पिक्सेल पड़ोसी पिक्सेल को प्रक्षेपित करके उत्पन्न होते हैं। सामान्यतः, आधा-पिक्सेल या चौथाई पिक्सेल परिशुद्धता ([[Qpel]], H.264 और MPEG-4/ASP द्वारा उपयोग किया जाता है) का उपयोग किया जाता है। उप-पिक्सेल परिशुद्धता का कम्प्यूटेशनल खर्च इंटरपोलेशन के लिए आवश्यक अतिरिक्त प्रसंस्करण और कोडितर पक्ष पर, संभावित स्रोत ब्लॉकों की एक बड़ी संख्या के मूल्यांकन के कारण बहुत अधिक है।


ब्लॉक मोशन मुआवजे का मुख्य नुकसान यह है कि यह ब्लॉक सीमाओं (अवरुद्ध कलाकृतियों) पर असंतोष का परिचय देता है।
ब्लॉक गति प्रतिकरण का मुख्य नुकसान यह है कि यह ब्लॉक सीमाओं (अवरुद्ध कलाकृतियों) पर असंतोष का परिचय देता है।
ये कलाकृतियां तेज क्षैतिज और ऊर्ध्वाधर किनारों के रूप में दिखाई देती हैं जो मानव आंखों द्वारा आसानी से देखी जाती हैं और फूरियर-संबंधित परिवर्तनों की सूची के गुणांकों के परिमाणीकरण के कारण झूठे किनारों और रिंगिंग प्रभाव (उच्च आवृत्ति उप-बैंड में बड़े गुणांक) उत्पन्न करती हैं। |फूरियर से संबंधित [[कोडिंग बदलना]] उपयोग [[अवशिष्ट फ्रेम]] के कोडिंग को बदलने के लिए किया जाता है<ref>Zeng, Kai, et al. "Characterizing perceptual artifacts in compressed video streams." IS&T/SPIE Electronic Imaging. International Society for Optics and Photonics, 2014.</ref>
ये कलाकृतियां तेज क्षैतिज और ऊर्ध्वाधर किनारों के रूप में दिखाई देती हैं जो मानव आंखों द्वारा आसानी से देखी जाती हैं और फूरियर-संबंधित परिवर्तनों की सूची के गुणांकों के परिमाणीकरण के कारण झूठे किनारों और रिंगिंग प्रभाव (उच्च आवृत्ति उप-बैंड में बड़े गुणांक) उत्पन्न करती हैं। |फूरियर से संबंधित [[कोडिंग बदलना|कूटलेखन बदलना]] उपयोग [[अवशिष्ट फ्रेम|अवशिष्ट प्रधार]] के कूटलेखन को बदलने के लिए किया जाता है<ref>Zeng, Kai, et al. "Characterizing perceptual artifacts in compressed video streams." IS&T/SPIE Electronic Imaging. International Society for Optics and Photonics, 2014.</ref>
ब्लॉक मोशन कंपंसेशन मौजूदा फ्रेम को नॉन-ओवरलैपिंग ब्लॉक्स में विभाजित करता है, और मोशन कंपंसेशन वेक्टर बताता है कि वे ब्लॉक कहां से आए हैं
ब्लॉक गति प्रतिकरण मौजूदा प्रधार को नॉन-अतिछादितिंग ब्लॉक्स में विभाजित करता है, और गति प्रतिकरण वेक्टर बताता है कि वे ब्लॉक कहां से आए हैं
(एक आम ग़लतफ़हमी यह है कि पिछले फ्रेम को गैर-अतिव्यापी ब्लॉकों में विभाजित किया गया है, और गति क्षतिपूर्ति वैक्टर बताते हैं कि वे ब्लॉक कहाँ जाते हैं)।
(एक आम ग़लतफ़हमी यह है कि पिछले प्रधार को गैर-अतिव्यापी ब्लॉकों में विभाजित किया गया है, और गति क्षतिपूर्ति वैक्टर बताते हैं कि वे ब्लॉक कहाँ जाते हैं)।
स्रोत ब्लॉक आमतौर पर स्रोत फ्रेम में ओवरलैप होते हैं।
स्रोत ब्लॉक सामान्यतः स्रोत प्रधार में अतिछादित होते हैं।
कुछ वीडियो संपीड़न एल्गोरिदम वर्तमान फ़्रेम को कई अलग-अलग पूर्व-संचारित फ़्रेमों के टुकड़ों से इकट्ठा करते हैं।
कुछ वीडियो संपीड़न एल्गोरिदम वर्तमान प्रधार को कई अलग-अलग पूर्व-संचारित प्रधारों के टुकड़ों से इकट्ठा करते हैं।


फ्रेम्स को भविष्य के फ्रेम से भी भविष्यवाणी की जा सकती है।
प्रधार्स को भविष्य के प्रधार से भी भविष्यवाणी की जा सकती है।
भविष्य के फ्रेम को अनुमानित फ्रेम से पहले एन्कोड करने की आवश्यकता होती है और इस प्रकार, एन्कोडिंग ऑर्डर वास्तविक फ्रेम ऑर्डर से मेल नहीं खाता है।
भविष्य के प्रधार को अनुमानित प्रधार से पहले कोडित करने की आवश्यकता होती है और इस प्रकार, कूटलेखन ऑर्डर वास्तविक प्रधार ऑर्डर से मेल नहीं खाता है।
इस तरह के फ़्रेमों की भविष्यवाणी आमतौर पर दो दिशाओं से की जाती है, यानी I- या P-फ़्रेम से जो अनुमानित फ़्रेम से तुरंत पहले या बाद में होते हैं।
इस तरह के प्रधारों की भविष्यवाणी सामान्यतः दो दिशाओं से की जाती है, यानी I- या P-प्रधार से जो अनुमानित प्रधार से तुरंत पहले या बाद में होते हैं।
इन द्विदिश रूप से अनुमानित फ़्रेमों को वीडियो संपीड़न चित्र प्रकार | बी-फ़्रेम कहा जाता है।
इन द्विदिश रूप से अनुमानित प्रधारों को वीडियो संपीड़न चित्र प्रकार | बी-प्रधार कहा जाता है।
उदाहरण के लिए, एक कोडिंग योजना IBBPBBPBBBPBB हो सकती है।
उदाहरण के लिए, एक कूटलेखन योजना IBBPBBPBBBPBB हो सकती है।


इसके अलावा, गति क्षतिपूर्ति के लिए त्रिकोणीय टाइलों का उपयोग भी प्रस्तावित किया गया है। इस योजना के तहत, फ्रेम को त्रिकोणों के साथ टाइल किया जाता है, और इन त्रिकोणों पर एक परिशोधन परिवर्तन करके अगला फ्रेम उत्पन्न किया जाता है।<ref>Aizawa, Kiyoharu, and Thomas S. Huang. "Model-based image coding advanced video coding techniques for very low bit-rate applications." Proceedings of the IEEE 83.2 (1995): 259-271.</ref> केवल एफ़िन परिवर्तन रिकॉर्ड/प्रेषित किए जाते हैं। यह जूमिंग, रोटेशन, ट्रांसलेशन आदि से निपटने में सक्षम है।
इसके अलावा, गति क्षतिपूर्ति के लिए त्रिकोणीय टाइलों का उपयोग भी प्रस्तावित किया गया है। इस योजना के तहत, प्रधार को त्रिकोणों के साथ टाइल किया जाता है, और इन त्रिकोणों पर एक परिशोधन परिवर्तन करके अगला प्रधार उत्पन्न किया जाता है।<ref>Aizawa, Kiyoharu, and Thomas S. Huang. "Model-based image coding advanced video coding techniques for very low bit-rate applications." Proceedings of the IEEE 83.2 (1995): 259-271.</ref> केवल एफ़िन परिवर्तन रिकॉर्ड/प्रेषित किए जाते हैं। यह जूमिंग, रोटेशन, ट्रांसलेशन आदि से निपटने में सक्षम है।


=== परिवर्तनीय ब्लॉक-आकार गति मुआवजा ===
=== परिवर्तनीय ब्लॉक-आकार गति प्रतिकरण ===
वेरिएबल ब्लॉक-साइज़ मोशन कंपनसेशन (VBSMC) BMC का उपयोग है जिसमें एनकोडर के लिए गतिशील रूप से ब्लॉक के आकार का चयन करने की क्षमता होती है। वीडियो कोडिंग करते समय, बड़े ब्लॉकों का उपयोग गति वैक्टर का प्रतिनिधित्व करने के लिए आवश्यक बिट्स की संख्या को कम कर सकता है, जबकि छोटे ब्लॉकों के उपयोग से एन्कोड करने के लिए भविष्यवाणी की अवशिष्ट जानकारी कम हो सकती है। कार्य के अन्य क्षेत्रों ने ब्लॉक सीमाओं से परे चर-आकार सुविधा मेट्रिक्स के उपयोग की जांच की है, जिससे इंटरफ्रेम वैक्टर की गणना की जा सकती है।<ref>{{Cite book|last=Garnham|first=Nigel W.|title=गति मुआवजा वीडियो कोडिंग - पीएचडी थीसिस|publisher=University of Nottingham|year=1995|url=http://eprints.nottingham.ac.uk/13447/1/thesis.pdf|oclc=59633188}}</ref> पुराने डिज़ाइन जैसे H.261 और [[MPEG-1]] वीडियो आमतौर पर एक निश्चित ब्लॉक आकार का उपयोग करते हैं, जबकि नए जैसे H.263, MPEG-4 भाग 2, H.264/MPEG-4 AVC, और [[VC-1]] एनकोडर देते हैं गति का प्रतिनिधित्व करने के लिए किस ब्लॉक आकार का उपयोग किया जाएगा, इसे गतिशील रूप से चुनने की क्षमता।
वेरिएबल ब्लॉक-साइज़ गति कंपनसेशन (VBSMC) BMC का उपयोग है जिसमें एनकोडर के लिए गतिशील रूप से ब्लॉक के आकार का चयन करने की क्षमता होती है। वीडियो कूटलेखन करते समय, बड़े ब्लॉकों का उपयोग गति वैक्टर का प्रतिनिधित्व करने के लिए आवश्यक बिट्स की संख्या को कम कर सकता है, जबकि छोटे ब्लॉकों के उपयोग से कोडित करने के लिए भविष्यवाणी की अवशिष्ट जानकारी कम हो सकती है। कार्य के अन्य क्षेत्रों ने ब्लॉक सीमाओं से परे चर-आकार सुविधा मेट्रिक्स के उपयोग की जांच की है, जिससे इंटरप्रधार वैक्टर की गणना की जा सकती है।<ref>{{Cite book|last=Garnham|first=Nigel W.|title=गति मुआवजा वीडियो कोडिंग - पीएचडी थीसिस|publisher=University of Nottingham|year=1995|url=http://eprints.nottingham.ac.uk/13447/1/thesis.pdf|oclc=59633188}}</ref> पुराने डिज़ाइन जैसे H.261 और [[MPEG-1]] वीडियो सामान्यतः एक निश्चित ब्लॉक आकार का उपयोग करते हैं, जबकि नए जैसे H.263, MPEG-4 भाग 2, H.264/MPEG-4 AVC, और [[VC-1]] एनकोडर देते हैं गति का प्रतिनिधित्व करने के लिए किस ब्लॉक आकार का उपयोग किया जाएगा, इसे गतिशील रूप से चुनने की क्षमता।


=== ओवरलैप्ड ब्लॉक मोशन मुआवजा ===
=== अतिछादित्ड ब्लॉक गति प्रतिकरण ===


ओवरलैप्ड ब्लॉक मोशन मुआवजा (ओबीएमसी) इन समस्याओं का एक अच्छा समाधान है क्योंकि यह न केवल भविष्यवाणी सटीकता को बढ़ाता है बल्कि कलाकृतियों को अवरुद्ध करने से भी बचाता है। ओबीएमसी का उपयोग करते समय,
अतिछादित्ड ब्लॉक गति प्रतिकरण (ओबीएमसी) इन समस्याओं का एक अच्छा समाधान है क्योंकि यह न केवल भविष्यवाणी यथार्थता को बढ़ाता है बल्कि कलाकृतियों को अवरुद्ध करने से भी बचाता है। ओबीएमसी का उपयोग करते समय,
ब्लॉक आमतौर पर प्रत्येक आयाम में दोगुने बड़े होते हैं और सभी 8 पड़ोसी ब्लॉकों के साथ चतुर्भुज-वार ओवरलैप होते हैं।
ब्लॉक सामान्यतः प्रत्येक आयाम में दोगुने बड़े होते हैं और सभी 8 पड़ोसी ब्लॉकों के साथ चतुर्भुज-वार अतिछादित होते हैं।
इस प्रकार, प्रत्येक पिक्सेल 4 ब्लॉकों से संबंधित है। ऐसी योजना में, प्रत्येक पिक्सेल के लिए 4 भविष्यवाणियाँ होती हैं जिन्हें एक भारित माध्य तक अभिव्यक्त किया जाता है।
इस प्रकार, प्रत्येक पिक्सेल 4 ब्लॉकों से संबंधित है। ऐसी योजना में, प्रत्येक पिक्सेल के लिए 4 भविष्यवाणियाँ होती हैं जिन्हें एक भारित माध्य तक अभिव्यक्त किया जाता है।
इस उद्देश्य के लिए, ब्लॉक एक विंडो फ़ंक्शन से जुड़े होते हैं जिसमें गुण होता है कि 4 ओवरलैप्ड विंडो का योग हर जगह 1 के बराबर होता है।
इस उद्देश्य के लिए, ब्लॉक एक विंडो फ़ंक्शन से जुड़े होते हैं जिसमें गुण होता है कि 4 अतिछादित्ड विंडो का योग हर जगह 1 के बराबर होता है।


ओबीएमसी की जटिलता को कम करने के तरीकों के अध्ययन से पता चला है कि तिरछे-आसन्न ब्लॉक के लिए विंडो फ़ंक्शन में योगदान सबसे छोटा है। इस योगदान के लिए वजन को शून्य तक कम करने और अन्य वजन को समान मात्रा में बढ़ाने से गुणवत्ता में बड़े दंड के बिना जटिलता में पर्याप्त कमी आती है। ऐसी योजना में, प्रत्येक पिक्सेल तब 4 के बजाय 3 ब्लॉकों से संबंधित होता है, और 8 पड़ोसी ब्लॉकों का उपयोग करने के बजाय, प्रत्येक ब्लॉक के मुआवजे के लिए केवल 4 का उपयोग किया जाता है। ऐसी योजना H.263 अनुलग्नक F उन्नत भविष्यवाणी मोड में पाई जाती है
ओबीएमसी की जटिलता को कम करने के तरीकों के अध्ययन से पता चला है कि तिरछे-आसन्न ब्लॉक के लिए विंडो फ़ंक्शन में योगदान सबसे छोटा है। इस योगदान के लिए वजन को शून्य तक कम करने और अन्य वजन को समान मात्रा में बढ़ाने से गुणवत्ता में बड़े दंड के बिना जटिलता में पर्याप्त कमी आती है। ऐसी योजना में, प्रत्येक पिक्सेल तब 4 के बजाय 3 ब्लॉकों से संबंधित होता है, और 8 पड़ोसी ब्लॉकों का उपयोग करने के बजाय, प्रत्येक ब्लॉक के मुआवजे के लिए केवल 4 का उपयोग किया जाता है। ऐसी योजना H.263 अनुलग्नक F उन्नत भविष्यवाणी मोड में पाई जाती है


== क्वार्टर पिक्सेल (QPel) और आधा पिक्सेल गति मुआवजा ==
== क्वार्टर पिक्सेल (QPel) और आधा पिक्सेल गति प्रतिकरण ==


गति मुआवजे में, चौथाई या आधे नमूने वास्तव में भिन्नात्मक गति वैक्टर के कारण प्रक्षेपित उप-नमूने होते हैं। वैक्टर और पूर्ण-नमूने के आधार पर, उप-नमूने की गणना बाइबिक या बिलिनियर 2-डी फ़िल्टरिंग का उपयोग करके की जा सकती है। H.264 मानक के उपखंड 8.4.2.2 भिन्नात्मक नमूना प्रक्षेप प्रक्रिया देखें।
गति प्रतिकरण में, चौथाई या आधे नमूने वस्तुतः भिन्नात्मक गति वैक्टर के कारण प्रक्षेपित उप-नमूने होते हैं। वैक्टर और पूर्ण-नमूने के आधार पर, उप-नमूने की गणना बाइबिक या बिलिनियर 2-डी फ़िल्टरिंग का उपयोग करके की जा सकती है। H.264 मानक के उपखंड 8.4.2.2 भिन्नात्मक नमूना प्रक्षेप प्रक्रिया देखें।


== 3डी इमेज कोडिंग तकनीक ==
== 3डी इमेज कूटलेखन तकनीक ==


गति क्षतिपूर्ति का उपयोग [[स्टीरियोस्कोपिक वीडियो कोडिंग]] में किया जाता है
गति क्षतिपूर्ति का उपयोग [[स्टीरियोस्कोपिक वीडियो कोडिंग|स्टीरियोस्कोपिक वीडियो कूटलेखन]] में किया जाता है


वीडियो में, समय को अक्सर तीसरे आयाम के रूप में माना जाता है। स्टिल इमेज कोडिंग तकनीकों को एक अतिरिक्त आयाम में विस्तारित किया जा सकता है।
वीडियो में, समय को प्रायः तीसरे आयाम के रूप में माना जाता है। स्टिल इमेज कूटलेखन तकनीकों को एक अतिरिक्त आयाम में विस्तारित किया जा सकता है।


[[जेपीईजी 2000]] वेवलेट्स का उपयोग करता है, और इन्हें अनुकूली तरीके से ब्लॉक के बीच अंतराल के बिना गति को एन्कोड करने के लिए भी इस्तेमाल किया जा सकता है। फ्रैक्शनल पिक्सेल [[affine परिवर्तन]] से आसन्न पिक्सेल के बीच रक्तस्राव होता है। यदि कोई उच्च आंतरिक रिज़ॉल्यूशन का उपयोग नहीं किया जाता है, तो [[मई + डेल्टा]] छवियां ज्यादातर छवि को धुंधला करने के खिलाफ लड़ती हैं। डेल्टा छवि को वेवलेट्स के रूप में भी एन्कोड किया जा सकता है, ताकि अनुकूली ब्लॉकों की सीमाएं मेल खा सकें।
[[जेपीईजी 2000]] वेवलेट्स का उपयोग करता है, और इन्हें अनुकूली तरीके से ब्लॉक के बीच अंतराल के बिना गति को कोडित करने के लिए भी इस्तेमाल किया जा सकता है। फ्रैक्शनल पिक्सेल [[affine परिवर्तन]] से आसन्न पिक्सेल के बीच रक्तस्राव होता है। यदि कोई उच्च आंतरिक रिज़ॉल्यूशन का उपयोग नहीं किया जाता है, तो [[मई + डेल्टा]] छवियां ज्यादातर छवि को धुंधला करने के खिलाफ लड़ती हैं। डेल्टा छवि को वेवलेट्स के रूप में भी कोडित किया जा सकता है, ताकि अनुकूली ब्लॉकों की सीमाएं मेल खा सकें।


2D+डेल्टा एन्कोडिंग तकनीक H.264 और MPEG-2 संगत कोडिंग का उपयोग करती है और त्रिविम छवियों के बीच संपीड़ित करने के लिए गति क्षतिपूर्ति का उपयोग कर सकती है।
2D+डेल्टा कूटलेखन तकनीक H.264 और MPEG-2 संगत कूटलेखन का उपयोग करती है और त्रिविम छवियों के बीच संपीड़ित करने के लिए गति क्षतिपूर्ति का उपयोग कर सकती है।


== इतिहास ==
== इतिहास ==
{{Main|Video coding format}}
{{Main|Video coding format}}


गति मुआवजे की अवधारणा का एक अग्रदूत 1929 से शुरू होता है, जब ब्रिटेन में आर.डी. केल ने एक [[एनालॉग वीडियो]] दृश्य के केवल भागों को प्रसारित करने की अवधारणा का प्रस्ताव रखा था जो फ्रेम-टू-फ्रेम से बदल गया था। 1959 में, [[एनएचके]] के शोधकर्ताओं वाई. टाकी, एम. होतोरी और एस. तनाका द्वारा [[ अंतर-फ्रेम ]] मोशन मुआवजे की अवधारणा प्रस्तावित की गई थी, जिन्होंने अस्थायी आयाम में अनुमानित इंटर-फ्रेम [[वीडियो कोडिंग]] प्रस्तावित की थी।<ref name="ITU">{{cite web |title=वीडियो संपीड़न का इतिहास|url=https://www.itu.int/wftp3/av-arch/jvt-site/2002_07_Klagenfurt/JVT-D068.doc |website=[[ITU-T]] |publisher=Joint Video Team (JVT) of ISO/IEC MPEG & ITU-T VCEG (ISO/IEC JTC1/SC29/WG11 and ITU-T SG16 Q.6) |date=July 2002 |pages=11, 24-9, 33, 40-1, 53-6 |access-date=3 November 2019}}</ref>
गति प्रतिकरण की अवधारणा का एक अग्रदूत 1929 से शुरू होता है, जब ब्रिटेन में आर.डी. केल ने एक [[एनालॉग वीडियो]] दृश्य के केवल भागों को प्रसारित करने की अवधारणा का प्रस्ताव रखा था जो प्रधार-टू-प्रधार से बदल गया था। 1959 में, [[एनएचके]] के शोधकर्ताओं वाई. टाकी, एम. होतोरी और एस. तनाका द्वारा [[ अंतर-फ्रेम | अंतर-प्रधार]] गति प्रतिकरण की अवधारणा प्रस्तावित की गई थी, जिन्होंने अस्थायी आयाम में अनुमानित इंटर-प्रधार [[वीडियो कोडिंग|वीडियो कूटलेखन]] प्रस्तावित की थी।<ref name="ITU">{{cite web |title=वीडियो संपीड़न का इतिहास|url=https://www.itu.int/wftp3/av-arch/jvt-site/2002_07_Klagenfurt/JVT-D068.doc |website=[[ITU-T]] |publisher=Joint Video Team (JVT) of ISO/IEC MPEG & ITU-T VCEG (ISO/IEC JTC1/SC29/WG11 and ITU-T SG16 Q.6) |date=July 2002 |pages=11, 24-9, 33, 40-1, 53-6 |access-date=3 November 2019}}</ref>




=== गति-मुआवजा डीसीटी ===
=== गति-प्रतिकरण डीसीटी ===
प्रैक्टिकल गति-मुआवजा वीडियो संपीड़न गति-मुआवजा असतत कोसाइन ट्रांसफ़ॉर्म (MC DCT) कोडिंग के विकास के साथ उभरा,<ref name="Lea">{{cite book |last1=Lea |first1=William |title=Video on demand: Research Paper 94/68 |date=1994 |publisher=[[House of Commons Library]] |url=https://researchbriefings.parliament.uk/ResearchBriefing/Summary/RP94-68 |access-date=20 September 2019 |archive-url=https://web.archive.org/web/20190920082623/https://researchbriefings.parliament.uk/ResearchBriefing/Summary/RP94-68 |archive-date=20 September 2019 |url-status=dead }}</ref> ब्लॉक मोशन मुआवजा (BMC) या DCT मोशन मुआवजा भी कहा जाता है। यह एक हाइब्रिड कोडिंग एल्गोरिथम है,<ref name="ITU"/>जो दो प्रमुख डेटा संपीड़न तकनीकों को जोड़ती है: असतत कोसाइन ट्रांसफ़ॉर्म (DCT) कोडिंग<ref name="Lea"/>[[स्थानिक आयाम]] में, और लौकिक आयाम में भविष्य कहनेवाला गति मुआवजा।<ref name="ITU"/>डीसीटी कोडिंग एक [[हानिपूर्ण संपीड़न]] ब्लॉक संपीड़न परिवर्तन कोडिंग तकनीक है जिसे पहली बार एन. अहमद द्वारा प्रस्तावित किया गया था, जो शुरू में इसे 1972 में [[छवि संपीड़न]] के लिए अभिप्रेत था।<ref name="Ahmed">{{cite journal |last=Ahmed |first=Nasir |author-link=N. Ahmed |title=मैं असतत कोसाइन परिवर्तन के साथ कैसे आया|journal=[[Digital Signal Processing (journal)|Digital Signal Processing]] |date=January 1991 |volume=1 |issue=1 |pages=4–5 |doi=10.1016/1051-2004(91)90086-Z |url=https://www.scribd.com/doc/52879771/DCT-History-How-I-Came-Up-with-the-Discrete-Cosine-Transform}}</ref>
प्रैक्टिकल गति-प्रतिकरण वीडियो संपीड़न गति-प्रतिकरण असतत कोटिज्या ट्रांसफ़ॉर्म (MC DCT) कूटलेखन के विकास के साथ उभरा,<ref name="Lea">{{cite book |last1=Lea |first1=William |title=Video on demand: Research Paper 94/68 |date=1994 |publisher=[[House of Commons Library]] |url=https://researchbriefings.parliament.uk/ResearchBriefing/Summary/RP94-68 |access-date=20 September 2019 |archive-url=https://web.archive.org/web/20190920082623/https://researchbriefings.parliament.uk/ResearchBriefing/Summary/RP94-68 |archive-date=20 September 2019 |url-status=dead }}</ref> ब्लॉक गति प्रतिकरण (BMC) या DCT गति प्रतिकरण भी कहा जाता है। यह एक हाइब्रिड कूटलेखन कलन विधि है,<ref name="ITU"/>जो दो प्रमुख डेटा संपीड़न तकनीकों को जोड़ती है: असतत कोटिज्या ट्रांसफ़ॉर्म (DCT) कूटलेखन<ref name="Lea"/>[[स्थानिक आयाम]] में, और लौकिक आयाम में भविष्य कहनेवाला गति प्रतिकरण।<ref name="ITU"/>डीसीटी कूटलेखन एक [[हानिपूर्ण संपीड़न]] ब्लॉक संपीड़न परिवर्तन कूटलेखन तकनीक है जिसे पहली बार एन. अहमद द्वारा प्रस्तावित किया गया था, जो शुरू में इसे 1972 में [[छवि संपीड़न]] के लिए अभिप्रेत था।<ref name="Ahmed">{{cite journal |last=Ahmed |first=Nasir |author-link=N. Ahmed |title=मैं असतत कोसाइन परिवर्तन के साथ कैसे आया|journal=[[Digital Signal Processing (journal)|Digital Signal Processing]] |date=January 1991 |volume=1 |issue=1 |pages=4–5 |doi=10.1016/1051-2004(91)90086-Z |url=https://www.scribd.com/doc/52879771/DCT-History-How-I-Came-Up-with-the-Discrete-Cosine-Transform}}</ref>
1974 में, [[दक्षिणी कैलिफोर्निया विश्वविद्यालय]] में अली हबीबी ने हाइब्रिड कोडिंग की शुरुआत की,<ref>{{cite journal |last1=Habibi |first1=Ali |title=सचित्र डेटा की हाइब्रिड कोडिंग|journal=IEEE Transactions on Communications |date=1974 |volume=22 |issue=5 |pages=614–624 |doi=10.1109/TCOM.1974.1092258}}</ref><ref>{{cite journal |last1=Chen |first1=Z. |last2=He |first2=T. |last3=Jin |first3=X. |last4=Wu |first4=F. |title=वीडियो संपीड़न के लिए सीखना|journal=IEEE Transactions on Circuits and Systems for Video Technology |volume=30 |issue=2 |pages=566–576 |doi=10.1109/TCSVT.2019.2892608 |arxiv=1804.09869 |year=2020 |s2cid=13743007 }}</ref> जो प्रिडिक्टिव कोडिंग को ट्रांसफॉर्म कोडिंग के साथ जोड़ती है।<ref name="ITU"/><ref>{{cite book |last1=Ohm |first1=Jens-Rainer |title=मल्टीमीडिया सिग्नल कोडिंग और ट्रांसमिशन|date=2015 |publisher=Springer |isbn=9783662466919 |pages=364 |url=https://books.google.com/books?id=e7xnBwAAQBAJ&pg=PA364}}</ref> हालाँकि, उनका एल्गोरिथ्म शुरू में स्थानिक आयाम में [[इंट्रा-फ्रेम]] कोडिंग तक सीमित था। 1975 में, जॉन ए. रोएज़ और गनर एस. रॉबिन्सन ने हबीबी के हाइब्रिड कोडिंग एल्गोरिद्म को टेम्पोरल डाइमेंशन में ट्रांसफ़ॉर्म कोडिंग और टेम्पोरल डायमेंशन में प्रेडिक्टिव कोडिंग का उपयोग करते हुए इंटर-फ़्रेम मोशन-मुआवज़ा हाइब्रिड कोडिंग विकसित करते हुए, टेम्पोरल डायमेंशन तक बढ़ाया।<ref name="ITU"/><ref name="Roese">{{cite journal |last1=Roese |first1=John A. |last2=Robinson |first2=Guner S. |title=डिजिटल इमेज सीक्वेंस की संयुक्त स्थानिक और टेम्पोरल कोडिंग|journal=Efficient Transmission of Pictorial Information |date=30 October 1975 |volume=0066 |pages=172–181 |doi=10.1117/12.965361 |bibcode=1975SPIE...66..172R |publisher=International Society for Optics and Photonics|s2cid=62725808 }}</ref> स्थानिक परिवर्तन कोडिंग के लिए, उन्होंने डीसीटी और [[फास्ट फूरियर ट्रांसफॉर्म]] (एफएफटी) के साथ प्रयोग किया, दोनों के लिए इंटर-फ्रेम हाइब्रिड कोडर विकसित किया, और पाया कि डीसीटी इसकी कम जटिलता के कारण सबसे कुशल है, छवि डेटा को कम करने में सक्षम है 2-[[ अंश ]] प्रति [[पिक्सेल]] की आवश्यकता वाले इंट्रा-फ्रेम कोडर की तुलना में छवि गुणवत्ता वाले [[videotelephone]] दृश्य के लिए 0.25-बिट प्रति पिक्सेल।<ref>{{cite book |last1=Huang |first1=T. S. |title=छवि अनुक्रम विश्लेषण|date=1981 |publisher=[[Springer Science & Business Media]] |isbn=9783642870378 |page=29 |url=https://books.google.com/books?id=bAirCAAAQBAJ&pg=PA29}}</ref><ref name="Roese"/>
1974 में, [[दक्षिणी कैलिफोर्निया विश्वविद्यालय]] में अली हबीबी ने हाइब्रिड कूटलेखन की शुरुआत की,<ref>{{cite journal |last1=Habibi |first1=Ali |title=सचित्र डेटा की हाइब्रिड कोडिंग|journal=IEEE Transactions on Communications |date=1974 |volume=22 |issue=5 |pages=614–624 |doi=10.1109/TCOM.1974.1092258}}</ref><ref>{{cite journal |last1=Chen |first1=Z. |last2=He |first2=T. |last3=Jin |first3=X. |last4=Wu |first4=F. |title=वीडियो संपीड़न के लिए सीखना|journal=IEEE Transactions on Circuits and Systems for Video Technology |volume=30 |issue=2 |pages=566–576 |doi=10.1109/TCSVT.2019.2892608 |arxiv=1804.09869 |year=2020 |s2cid=13743007 }}</ref> जो प्रिडिक्टिव कूटलेखन को ट्रांसफॉर्म कूटलेखन के साथ जोड़ती है।<ref name="ITU"/><ref>{{cite book |last1=Ohm |first1=Jens-Rainer |title=मल्टीमीडिया सिग्नल कोडिंग और ट्रांसमिशन|date=2015 |publisher=Springer |isbn=9783662466919 |pages=364 |url=https://books.google.com/books?id=e7xnBwAAQBAJ&pg=PA364}}</ref> हालाँकि, उनका एल्गोरिथ्म शुरू में स्थानिक आयाम में [[इंट्रा-फ्रेम|इंट्रा-प्रधार]] कूटलेखन तक सीमित था। 1975 में, जॉन ए. रोएज़ और गनर एस. रॉबिन्सन ने हबीबी के हाइब्रिड कूटलेखन एल्गोरिद्म को टेम्पोरल डाइमेंशन में ट्रांसफ़ॉर्म कूटलेखन और टेम्पोरल डायमेंशन में प्रेडिक्टिव कूटलेखन का उपयोग करते हुए इंटर-प्रधार गति-मुआवज़ा हाइब्रिड कूटलेखन विकसित करते हुए, टेम्पोरल डायमेंशन तक बढ़ाया।<ref name="ITU"/><ref name="Roese">{{cite journal |last1=Roese |first1=John A. |last2=Robinson |first2=Guner S. |title=डिजिटल इमेज सीक्वेंस की संयुक्त स्थानिक और टेम्पोरल कोडिंग|journal=Efficient Transmission of Pictorial Information |date=30 October 1975 |volume=0066 |pages=172–181 |doi=10.1117/12.965361 |bibcode=1975SPIE...66..172R |publisher=International Society for Optics and Photonics|s2cid=62725808 }}</ref> स्थानिक परिवर्तन कूटलेखन के लिए, उन्होंने डीसीटी और [[फास्ट फूरियर ट्रांसफॉर्म]] (एफएफटी) के साथ प्रयोग किया, दोनों के लिए इंटर-प्रधार हाइब्रिड कोडर विकसित किया, और पाया कि डीसीटी इसकी कम जटिलता के कारण सबसे कुशल है, छवि डेटा को कम करने में सक्षम है 2-[[ अंश ]] प्रति [[पिक्सेल]] की आवश्यकता वाले इंट्रा-प्रधार कोडर की तुलना में छवि गुणवत्ता वाले [[videotelephone]] दृश्य के लिए 0.25-बिट प्रति पिक्सेल।<ref>{{cite book |last1=Huang |first1=T. S. |title=छवि अनुक्रम विश्लेषण|date=1981 |publisher=[[Springer Science & Business Media]] |isbn=9783642870378 |page=29 |url=https://books.google.com/books?id=bAirCAAAQBAJ&pg=PA29}}</ref><ref name="Roese"/>


1977 में, वेन-सिउंग चेन ने सी.एच. के साथ एक तेज़ डीसीटी एल्गोरिदम विकसित किया। स्मिथ और एस.सी. फ्रलिक।<ref>{{cite journal |last1=Chen |first1=Wen-Hsiung |last2=Smith |first2=C. H. |last3=Fralick |first3=S. C. |title=असतत कोज्या रूपांतरण के लिए एक तेज़ कम्प्यूटेशनल एल्गोरिथम|journal=[[IEEE Transactions on Communications]] |date=September 1977 |volume=25 |issue=9 |pages=1004–1009 |doi=10.1109/TCOM.1977.1093941}}</ref> 1979 में, अनिल के. जैन (इलेक्ट्रिकल इंजीनियर, जन्म 1946) | अनिल के. जैन और जसवंत आर. जैन ने गति-प्रतिपूर्ति डीसीटी वीडियो संपीड़न विकसित किया,<ref>{{cite book |last1=Cianci |first1=Philip J. |title=High Definition Television: The Creation, Development and Implementation of HDTV Technology |date=2014 |publisher=McFarland |isbn=9780786487974 |page=63 |url=https://books.google.com/books?id=0mbsfr38GTgC&pg=PA63}}</ref><ref name="ITU"/>ब्लॉक मोशन मुआवजा भी कहा जाता है।<ref name="ITU"/>इसने 1981 में चेन को एक व्यावहारिक वीडियो संपीड़न एल्गोरिथ्म विकसित करने के लिए प्रेरित किया, जिसे गति-क्षतिपूर्ति DCT या अनुकूली दृश्य कोडिंग कहा जाता है।<ref name="ITU"/>मोशन-मुआवजा DCT बाद में 1980 के दशक के अंत से वीडियो संपीड़न के लिए मानक कोडिंग तकनीक बन गया।<ref name="Ghanbari">{{cite book |last1=Ghanbari |first1=Mohammed |title=Standard Codecs: Image Compression to Advanced Video Coding |date=2003 |publisher=[[Institution of Engineering and Technology]] |isbn=9780852967102 |pages=1–2 |url=https://books.google.com/books?id=7XuU8T3ooOAC&pg=PA1}}</ref><ref name="Li"/>
1977 में, वेन-सिउंग चेन ने सी.एच. के साथ एक तेज़ डीसीटी एल्गोरिदम विकसित किया। स्मिथ और एस.सी. फ्रलिक।<ref>{{cite journal |last1=Chen |first1=Wen-Hsiung |last2=Smith |first2=C. H. |last3=Fralick |first3=S. C. |title=असतत कोज्या रूपांतरण के लिए एक तेज़ कम्प्यूटेशनल एल्गोरिथम|journal=[[IEEE Transactions on Communications]] |date=September 1977 |volume=25 |issue=9 |pages=1004–1009 |doi=10.1109/TCOM.1977.1093941}}</ref> 1979 में, अनिल के. जैन (इलेक्ट्रिकल इंजीनियर, जन्म 1946) | अनिल के. जैन और जसवंत आर. जैन ने गति-प्रतिपूर्ति डीसीटी वीडियो संपीड़न विकसित किया,<ref>{{cite book |last1=Cianci |first1=Philip J. |title=High Definition Television: The Creation, Development and Implementation of HDTV Technology |date=2014 |publisher=McFarland |isbn=9780786487974 |page=63 |url=https://books.google.com/books?id=0mbsfr38GTgC&pg=PA63}}</ref><ref name="ITU"/>ब्लॉक गति प्रतिकरण भी कहा जाता है।<ref name="ITU"/>इसने 1981 में चेन को एक व्यावहारिक वीडियो संपीड़न एल्गोरिथ्म विकसित करने के लिए प्रेरित किया, जिसे गति-क्षतिपूर्ति DCT या अनुकूली दृश्य कूटलेखन कहा जाता है।<ref name="ITU"/>गति-प्रतिकरण DCT बाद में 1980 के दशक के अंत से वीडियो संपीड़न के लिए मानक कूटलेखन तकनीक बन गया।<ref name="Ghanbari">{{cite book |last1=Ghanbari |first1=Mohammed |title=Standard Codecs: Image Compression to Advanced Video Coding |date=2003 |publisher=[[Institution of Engineering and Technology]] |isbn=9780852967102 |pages=1–2 |url=https://books.google.com/books?id=7XuU8T3ooOAC&pg=PA1}}</ref><ref name="Li"/>


पहला डिजिटल [[वीडियो कोडिंग मानक]] H.120 था, जिसे 1984 में [[ITU-T]] (अब ITU-T) द्वारा विकसित किया गया था।<ref name="history">{{cite web |title=वीडियो फ़ाइल स्वरूपों का इतिहास इन्फोग्राफिक|url=http://www.real.com/resources/digital-video-file-formats/ |website=[[RealNetworks]] |access-date=5 August 2019 |date=22 April 2012}}</ref> H.120 ने गति-क्षतिपूर्ति DPCM कोडिंग का उपयोग किया,<ref name="ITU"/>जो वीडियो कोडिंग के लिए अक्षम था,<ref name="Ghanbari"/>और H.120 इस प्रकार कम प्रदर्शन के कारण अव्यावहारिक था।<ref name="history"/>H.261 मानक 1988 में गति-क्षतिपूर्ति DCT संपीड़न के आधार पर विकसित किया गया था,<ref name="Ghanbari"/><ref name="Li"/>और यह पहला व्यावहारिक वीडियो कोडिंग मानक था।<ref name="history"/>तब से, मोशन-कंपेंसेटेड DCT कम्प्रेशन को सभी प्रमुख वीडियो कोडिंग मानकों (H.26x और MPEG फॉर्मेट सहित) द्वारा अपनाया गया है।<ref name="Ghanbari"/><ref name="Li"/>
पहला डिजिटल [[वीडियो कोडिंग मानक|वीडियो कूटलेखन मानक]] H.120 था, जिसे 1984 में [[ITU-T]] (अब ITU-T) द्वारा विकसित किया गया था।<ref name="history">{{cite web |title=वीडियो फ़ाइल स्वरूपों का इतिहास इन्फोग्राफिक|url=http://www.real.com/resources/digital-video-file-formats/ |website=[[RealNetworks]] |access-date=5 August 2019 |date=22 April 2012}}</ref> H.120 ने गति-क्षतिपूर्ति DPCM कूटलेखन का उपयोग किया,<ref name="ITU"/>जो वीडियो कूटलेखन के लिए अक्षम था,<ref name="Ghanbari"/>और H.120 इस प्रकार कम प्रदर्शन के कारण अव्यावहारिक था।<ref name="history"/>H.261 मानक 1988 में गति-क्षतिपूर्ति DCT संपीड़न के आधार पर विकसित किया गया था,<ref name="Ghanbari"/><ref name="Li"/>और यह पहला व्यावहारिक वीडियो कूटलेखन मानक था।<ref name="history"/>तब से, गति-कंपेंसेटेड DCT कम्प्रेशन को सभी प्रमुख वीडियो कूटलेखन मानकों (H.26x और MPEG फॉर्मेट सहित) द्वारा अपनाया गया है।<ref name="Ghanbari"/><ref name="Li"/>




== यह भी देखें ==
== यह भी देखें ==
* मोशन अनुमान
* गति अनुमान
*[[छवि स्थिरीकरण]]
*[[छवि स्थिरीकरण]]
* [[इंटर फ्रेम]]
* [[इंटर फ्रेम|इंटर प्रधार]]
* [[ एचडीटीवी धुंधला ]]
* [[ एचडीटीवी धुंधला ]]
* [[टेलीविजन मानक रूपांतरण]]
* [[टेलीविजन मानक रूपांतरण]]
*[[विडफायर]]
*[[विडफायर]]
*[[एक्स-वीडियो मोशन मुआवजा]]
*[[एक्स-वीडियो मोशन मुआवजा|एक्स-वीडियो गति प्रतिकरण]]


== अनुप्रयोग ==
== अनुप्रयोग ==
* वीडियो संपीड़न
* वीडियो संपीड़न
* 60 हर्ट्ज [[एलसीडी]] या 100 हर्ट्ज [[ interlaced ]] [[कैथोड रे ट्यूब]] पर 24 फ्रेम प्रति सेकेंड मूवी प्लेबैक के लिए [[फ्रेम रेट]] का परिवर्तन
* 60 हर्ट्ज [[एलसीडी]] या 100 हर्ट्ज [[ interlaced ]] [[कैथोड रे ट्यूब]] पर 24 प्रधार प्रति सेकेंड मूवी प्लेबैक के लिए [[फ्रेम रेट|प्रधार रेट]] का परिवर्तन


== संदर्भ ==
== संदर्भ ==

Revision as of 01:02, 16 June 2023

एमपीईजी ब्लॉक गति प्रतिकरण का विजुअलाइजेशन। एक प्रधार से दूसरे प्रधार में जाने वाले ब्लॉक सफेद तीरों के रूप में दिखाए जाते हैं, जिससे विभिन्न प्लेटफार्मों की गति और चरित्र स्पष्ट रूप से दिखाई देते हैं।

कंप्यूटिंग में गति प्रतिकरण, एक कलन विधि तकनीक है जिसका उपयोग वीडियो में कैमरे और/या वस्तुओं की गति के हिसाब से पिछले और/या भविष्य के प्रधार दिए जाने पर वीडियो में एक प्रधार का पूर्वानुमान करने के लिए किया जाता है। यह वीडियो संपीड़न के लिए वीडियो डेटा के कूटलेखन में कार्यरत है, उदाहरण के लिए MPEG-2 संचिकाओं की पीढ़ी में कार्यरत है। गति प्रतिकरण एक तस्वीर का वर्णन एक संदर्भ तस्वीर को वर्तमान तस्वीर में बदलने के संदर्भ में करता है। संदर्भ चित्र समय से पहले या भविष्य से भी हो सकता है। जब छवियों को पहले प्रेषित/संग्रहीत छवियों से यथार्थ रूप से संश्लेषित किया जा सकता है, तो संपीड़न दक्षता में सुधार किया जा सकता है।

असतत कोटिज्या परिवर्तन (डीसीटी) के साथ-साथ गति प्रतिकरण वीडियो कूटलेखन मानकों में उपयोग की जाने वाली दो प्रमुख वीडियो संपीड़न तकनीकों में से एक है। अधिकांश वीडियो कूटलेखन मानक, जैसे कि H.26x और MPEG प्रारूप, सामान्यतः गति-क्षतिपूर्ति DCT संकर कूटलेखन का उपयोग करते हैं,[1][2] ब्लॉक गति प्रतिकरण (बीएमसी) या गति-प्रतिकरण डीसीटी (एमसी डीसीटी) के रूप में जाना जाता है।

कार्यक्षमता

गति प्रतिकरण इस तथ्य का लाभ उठाता है कि, प्रायः, एक चलचित्र के कई फिल्म प्रधार के लिए, एक प्रधार और दूसरे के बीच एकमात्र अंतर या तो कैमरे के हिलने या प्रधार में किसी वस्तु के हिलने का परिणाम होता है। एक वीडियो संचिका के संदर्भ में, इसका अर्थ है कि एक प्रधार का प्रतिनिधित्व करने वाली अधिकांश जानकारी अगले प्रधार में उपयोग की जाने वाली जानकारी के समान होगी।

गति प्रतिकरण का उपयोग करते हुए, एक वीडियो स्ट्रीम में कुछ पूर्ण (संदर्भ) प्रधार होंगे; तब बीच में प्रधार के लिए संग्रहीत एकमात्र जानकारी पिछले प्रधार को अगले प्रधार में बदलने के लिए आवश्यक जानकारी होगी।

सचित्र उदाहरण

गति क्षतिपूर्ति कैसे काम करती है, इसकी एक सरल सचित्र व्याख्या निम्नलिखित है।हाथी का सपना चलचित्र से लगातार दो प्रधार लिए गए। जैसा कि छवियों से देखा जा सकता है, दो प्रधारों के बीच नीचे (गति प्रतिकरण) अंतर में पहले की छवियों की तुलना में काफी कम विवरण होता है, और इस प्रकार यह बाकी की तुलना में बहुत बेहतर होता है। इस प्रकार प्रतिकरण प्रधार को कोडित करने के लिए आवश्यक जानकारी अंतर प्रधार के मुकाबले बहुत छोटी होगी। इसका अर्थ यह भी है कि कम संपीड़न दक्षता की लागत पर अंतर छवि का उपयोग करके जानकारी को सांकेतिक शब्दों में बदलना भी संभव है, लेकिन बिना गति प्रतिपूर्ति कूटलेखन के कूटलेखन जटिलता को बचाकर; वस्तुतः गति प्रतिपूर्ति कूटलेखन (गति आकलन, गति क्षतिपूर्ति सहित) कूटलेखन जटिलता के 90% से अधिक पर अधिग्रहण कर लेती है।

प्रकार उदहारण प्रधार वर्णन
मौलिक Motion compensation example-original.jpg पूर्ण मूल प्रधार, जैसा कि चित्रपट पर दिखाया गया है।
भिन्नता Motion compensation example-difference.jpg मूल प्रधार और अगले प्रधार के बीच अंतर।
गति प्रतिकारित भिन्नता Motion compensation example-compensated difference.jpg मूल प्रधार और अगले प्रधार के बीच अंतर, 2 पिक्सेल द्वारा दाईं ओर स्थानांतरित किया गया। प्रधार को स्थानांतरित करने से कैमरे के पैनिंग की क्षतिपूर्ति होती है, इस प्रकार दो प्रधारों के बीच अधिक अतिछादित होता है।


एमपीईजी

MPEG में, छवियों का पूर्वानुमान पिछले प्रधारों से लगाया जाता है (P frames) या पिछले और भविष्य के प्रधार से अप्रत्यक्ष रूप से (B frames). B frames अधिक जटिल हैं क्योंकि छवि अनुक्रम को प्रेषित किया जाना चाहिए और ऑर्डर से बाहर संग्रहीत किया जाना चाहिए ताकि भविष्य का प्रधार उत्पन्न करने के लिए उपलब्ध हो B frames.[3] गति प्रतिकरण का उपयोग करके प्रधार की भविष्यवाणी करने के बाद, सांकेतिक शब्दों में बदलनेवाला अवशिष्ट पाता है, जो तब संकुचित और प्रसारित होता है।

वैश्विक गति प्रतिकरण

वैश्विक गति प्रतिकरण में, गति मॉडल मूल रूप से कैमरा गतियों को दर्शाता है जैसे:

  • डॉली — कैमरे को आगे या पीछे ले जाना
  • ट्रैक — कैमरे को बाएँ या दाएँ ले जाना
  • बूम — कैमरे को ऊपर या नीचे ले जाना
  • पैन — कैमरे को उसके Y अक्ष के चारों ओर घुमाते हुए, दृश्य को बाएँ या दाएँ घुमाते हुए
  • झुकाएँ — कैमरे को उसके X अक्ष के चारों ओर घुमाना, दृश्य को ऊपर या नीचे ले जाना
  • रोल - व्यू एक्सिस के चारों ओर कैमरे को घुमाना

यह गतिमान वस्तुओं के बिना स्थिर दृश्यों के लिए सबसे अच्छा काम करता है।

वैश्विक गति प्रतिकरण के कई फायदे हैं:

  • यह सामान्यतः वीडियो अनुक्रमों में पाए जाने वाले प्रमुख गति को केवल कुछ मापदंडों के साथ मॉडल करता है। इन पैरामीटरों की बिट-दर में हिस्सेदारी नगण्य है।
  • यह प्रधार का विभाजन नहीं करता है। यह विभाजन सीमाओं पर कलाकृतियों से बचा जाता है।
  • प्रधार में समान स्थानिक स्थिति वाले पिक्सेल की एक सीधी रेखा (समय की दिशा में) वास्तविक दृश्य में एक निरंतर गतिमान बिंदु से मेल खाती है। अन्य एमसी योजनाएं समय की दिशा में निरंतरता का परिचय देती हैं।

एमपीईजी-4 एएसपी तीन संदर्भ बिंदुओं के साथ वैश्विक गति प्रतिकरण का समर्थन करता है, हालांकि कुछ कार्यान्वयन केवल एक का उपयोग कर सकते हैं। एक एकल संदर्भ बिंदु केवल ट्रांसलेशनल गति की अनुमति देता है जो अपेक्षाकृत बड़ी प्रदर्शन लागत के लिए ब्लॉक आधारित गति प्रतिकरण पर थोड़ा लाभ प्रदान करता है।

एक प्रधार के भीतर चलती वस्तुओं को वैश्विक गति प्रतिकरण द्वारा पर्याप्त रूप से प्रदर्शित नहीं किया जाता है। इस प्रकार, स्थानीय गति अनुमान भी आवश्यक है।

गति-प्रतिकरण डीसीटी

ब्लॉक गति प्रतिकरण

ब्लॉक गति प्रतिकरण (बीएमसी), जिसे गति-प्रतिकरण असतत कोटिज्या ट्रांसफॉर्म (एमसी डीसीटी) के रूप में भी जाना जाता है, सबसे व्यापक रूप से इस्तेमाल की जाने वाली गति प्रतिकरण तकनीक है।[2] BMC में, प्रधार को पिक्सेल के ब्लॉक में विभाजित किया जाता है (उदाहरण के लिए MPEG में 16×16 पिक्सेल के मैक्रो-ब्लॉक)। संदर्भ प्रधार में समान आकार के ब्लॉक से प्रत्येक ब्लॉक की भविष्यवाणी की जाती है। पूर्वानुमानित ब्लॉक की स्थिति में स्थानांतरित किए जाने के अलावा ब्लॉक किसी भी तरह से रूपांतरित नहीं होते हैं। यह बदलाव एक गति वेक्टर द्वारा दर्शाया गया है।

पड़ोसी ब्लॉक वैक्टर के बीच अतिरेक का लाभ उठाने के लिए, (उदाहरण के लिए कई ब्लॉकों द्वारा कवर की गई एकल चलती वस्तु के लिए) बिट-स्ट्रीम में केवल वर्तमान और पिछले गति वेक्टर के बीच के अंतर को सांकेतिक शब्दों में बदलना आम है। इस विभेदीकरण प्रक्रिया का परिणाम गणितीय रूप से पैनिंग करने में सक्षम वैश्विक गति प्रतिकरण के बराबर है। आगे कूटलेखन पाइपलाइन के नीचे, एक एन्ट्रापी कूटलेखन आउटपुट आकार को कम करने के लिए शून्य वेक्टर के आसपास गति वैक्टरों के परिणामी सांख्यिकीय वितरण का लाभ उठाएगी।

पिक्सेल की एक गैर-पूर्णांक संख्या द्वारा एक ब्लॉक को स्थानांतरित करना संभव है, जिसे उप-पिक्सेल परिशुद्धता कहा जाता है। इन-बीच के पिक्सेल पड़ोसी पिक्सेल को प्रक्षेपित करके उत्पन्न होते हैं। सामान्यतः, आधा-पिक्सेल या चौथाई पिक्सेल परिशुद्धता (Qpel, H.264 और MPEG-4/ASP द्वारा उपयोग किया जाता है) का उपयोग किया जाता है। उप-पिक्सेल परिशुद्धता का कम्प्यूटेशनल खर्च इंटरपोलेशन के लिए आवश्यक अतिरिक्त प्रसंस्करण और कोडितर पक्ष पर, संभावित स्रोत ब्लॉकों की एक बड़ी संख्या के मूल्यांकन के कारण बहुत अधिक है।

ब्लॉक गति प्रतिकरण का मुख्य नुकसान यह है कि यह ब्लॉक सीमाओं (अवरुद्ध कलाकृतियों) पर असंतोष का परिचय देता है। ये कलाकृतियां तेज क्षैतिज और ऊर्ध्वाधर किनारों के रूप में दिखाई देती हैं जो मानव आंखों द्वारा आसानी से देखी जाती हैं और फूरियर-संबंधित परिवर्तनों की सूची के गुणांकों के परिमाणीकरण के कारण झूठे किनारों और रिंगिंग प्रभाव (उच्च आवृत्ति उप-बैंड में बड़े गुणांक) उत्पन्न करती हैं। |फूरियर से संबंधित कूटलेखन बदलना उपयोग अवशिष्ट प्रधार के कूटलेखन को बदलने के लिए किया जाता है[4] ब्लॉक गति प्रतिकरण मौजूदा प्रधार को नॉन-अतिछादितिंग ब्लॉक्स में विभाजित करता है, और गति प्रतिकरण वेक्टर बताता है कि वे ब्लॉक कहां से आए हैं (एक आम ग़लतफ़हमी यह है कि पिछले प्रधार को गैर-अतिव्यापी ब्लॉकों में विभाजित किया गया है, और गति क्षतिपूर्ति वैक्टर बताते हैं कि वे ब्लॉक कहाँ जाते हैं)। स्रोत ब्लॉक सामान्यतः स्रोत प्रधार में अतिछादित होते हैं। कुछ वीडियो संपीड़न एल्गोरिदम वर्तमान प्रधार को कई अलग-अलग पूर्व-संचारित प्रधारों के टुकड़ों से इकट्ठा करते हैं।

प्रधार्स को भविष्य के प्रधार से भी भविष्यवाणी की जा सकती है। भविष्य के प्रधार को अनुमानित प्रधार से पहले कोडित करने की आवश्यकता होती है और इस प्रकार, कूटलेखन ऑर्डर वास्तविक प्रधार ऑर्डर से मेल नहीं खाता है। इस तरह के प्रधारों की भविष्यवाणी सामान्यतः दो दिशाओं से की जाती है, यानी I- या P-प्रधार से जो अनुमानित प्रधार से तुरंत पहले या बाद में होते हैं। इन द्विदिश रूप से अनुमानित प्रधारों को वीडियो संपीड़न चित्र प्रकार | बी-प्रधार कहा जाता है। उदाहरण के लिए, एक कूटलेखन योजना IBBPBBPBBBPBB हो सकती है।

इसके अलावा, गति क्षतिपूर्ति के लिए त्रिकोणीय टाइलों का उपयोग भी प्रस्तावित किया गया है। इस योजना के तहत, प्रधार को त्रिकोणों के साथ टाइल किया जाता है, और इन त्रिकोणों पर एक परिशोधन परिवर्तन करके अगला प्रधार उत्पन्न किया जाता है।[5] केवल एफ़िन परिवर्तन रिकॉर्ड/प्रेषित किए जाते हैं। यह जूमिंग, रोटेशन, ट्रांसलेशन आदि से निपटने में सक्षम है।

परिवर्तनीय ब्लॉक-आकार गति प्रतिकरण

वेरिएबल ब्लॉक-साइज़ गति कंपनसेशन (VBSMC) BMC का उपयोग है जिसमें एनकोडर के लिए गतिशील रूप से ब्लॉक के आकार का चयन करने की क्षमता होती है। वीडियो कूटलेखन करते समय, बड़े ब्लॉकों का उपयोग गति वैक्टर का प्रतिनिधित्व करने के लिए आवश्यक बिट्स की संख्या को कम कर सकता है, जबकि छोटे ब्लॉकों के उपयोग से कोडित करने के लिए भविष्यवाणी की अवशिष्ट जानकारी कम हो सकती है। कार्य के अन्य क्षेत्रों ने ब्लॉक सीमाओं से परे चर-आकार सुविधा मेट्रिक्स के उपयोग की जांच की है, जिससे इंटरप्रधार वैक्टर की गणना की जा सकती है।[6] पुराने डिज़ाइन जैसे H.261 और MPEG-1 वीडियो सामान्यतः एक निश्चित ब्लॉक आकार का उपयोग करते हैं, जबकि नए जैसे H.263, MPEG-4 भाग 2, H.264/MPEG-4 AVC, और VC-1 एनकोडर देते हैं गति का प्रतिनिधित्व करने के लिए किस ब्लॉक आकार का उपयोग किया जाएगा, इसे गतिशील रूप से चुनने की क्षमता।

अतिछादित्ड ब्लॉक गति प्रतिकरण

अतिछादित्ड ब्लॉक गति प्रतिकरण (ओबीएमसी) इन समस्याओं का एक अच्छा समाधान है क्योंकि यह न केवल भविष्यवाणी यथार्थता को बढ़ाता है बल्कि कलाकृतियों को अवरुद्ध करने से भी बचाता है। ओबीएमसी का उपयोग करते समय, ब्लॉक सामान्यतः प्रत्येक आयाम में दोगुने बड़े होते हैं और सभी 8 पड़ोसी ब्लॉकों के साथ चतुर्भुज-वार अतिछादित होते हैं। इस प्रकार, प्रत्येक पिक्सेल 4 ब्लॉकों से संबंधित है। ऐसी योजना में, प्रत्येक पिक्सेल के लिए 4 भविष्यवाणियाँ होती हैं जिन्हें एक भारित माध्य तक अभिव्यक्त किया जाता है। इस उद्देश्य के लिए, ब्लॉक एक विंडो फ़ंक्शन से जुड़े होते हैं जिसमें गुण होता है कि 4 अतिछादित्ड विंडो का योग हर जगह 1 के बराबर होता है।

ओबीएमसी की जटिलता को कम करने के तरीकों के अध्ययन से पता चला है कि तिरछे-आसन्न ब्लॉक के लिए विंडो फ़ंक्शन में योगदान सबसे छोटा है। इस योगदान के लिए वजन को शून्य तक कम करने और अन्य वजन को समान मात्रा में बढ़ाने से गुणवत्ता में बड़े दंड के बिना जटिलता में पर्याप्त कमी आती है। ऐसी योजना में, प्रत्येक पिक्सेल तब 4 के बजाय 3 ब्लॉकों से संबंधित होता है, और 8 पड़ोसी ब्लॉकों का उपयोग करने के बजाय, प्रत्येक ब्लॉक के मुआवजे के लिए केवल 4 का उपयोग किया जाता है। ऐसी योजना H.263 अनुलग्नक F उन्नत भविष्यवाणी मोड में पाई जाती है

क्वार्टर पिक्सेल (QPel) और आधा पिक्सेल गति प्रतिकरण

गति प्रतिकरण में, चौथाई या आधे नमूने वस्तुतः भिन्नात्मक गति वैक्टर के कारण प्रक्षेपित उप-नमूने होते हैं। वैक्टर और पूर्ण-नमूने के आधार पर, उप-नमूने की गणना बाइबिक या बिलिनियर 2-डी फ़िल्टरिंग का उपयोग करके की जा सकती है। H.264 मानक के उपखंड 8.4.2.2 भिन्नात्मक नमूना प्रक्षेप प्रक्रिया देखें।

3डी इमेज कूटलेखन तकनीक

गति क्षतिपूर्ति का उपयोग स्टीरियोस्कोपिक वीडियो कूटलेखन में किया जाता है

वीडियो में, समय को प्रायः तीसरे आयाम के रूप में माना जाता है। स्टिल इमेज कूटलेखन तकनीकों को एक अतिरिक्त आयाम में विस्तारित किया जा सकता है।

जेपीईजी 2000 वेवलेट्स का उपयोग करता है, और इन्हें अनुकूली तरीके से ब्लॉक के बीच अंतराल के बिना गति को कोडित करने के लिए भी इस्तेमाल किया जा सकता है। फ्रैक्शनल पिक्सेल affine परिवर्तन से आसन्न पिक्सेल के बीच रक्तस्राव होता है। यदि कोई उच्च आंतरिक रिज़ॉल्यूशन का उपयोग नहीं किया जाता है, तो मई + डेल्टा छवियां ज्यादातर छवि को धुंधला करने के खिलाफ लड़ती हैं। डेल्टा छवि को वेवलेट्स के रूप में भी कोडित किया जा सकता है, ताकि अनुकूली ब्लॉकों की सीमाएं मेल खा सकें।

2D+डेल्टा कूटलेखन तकनीक H.264 और MPEG-2 संगत कूटलेखन का उपयोग करती है और त्रिविम छवियों के बीच संपीड़ित करने के लिए गति क्षतिपूर्ति का उपयोग कर सकती है।

इतिहास

गति प्रतिकरण की अवधारणा का एक अग्रदूत 1929 से शुरू होता है, जब ब्रिटेन में आर.डी. केल ने एक एनालॉग वीडियो दृश्य के केवल भागों को प्रसारित करने की अवधारणा का प्रस्ताव रखा था जो प्रधार-टू-प्रधार से बदल गया था। 1959 में, एनएचके के शोधकर्ताओं वाई. टाकी, एम. होतोरी और एस. तनाका द्वारा अंतर-प्रधार गति प्रतिकरण की अवधारणा प्रस्तावित की गई थी, जिन्होंने अस्थायी आयाम में अनुमानित इंटर-प्रधार वीडियो कूटलेखन प्रस्तावित की थी।[7]


गति-प्रतिकरण डीसीटी

प्रैक्टिकल गति-प्रतिकरण वीडियो संपीड़न गति-प्रतिकरण असतत कोटिज्या ट्रांसफ़ॉर्म (MC DCT) कूटलेखन के विकास के साथ उभरा,[8] ब्लॉक गति प्रतिकरण (BMC) या DCT गति प्रतिकरण भी कहा जाता है। यह एक हाइब्रिड कूटलेखन कलन विधि है,[7]जो दो प्रमुख डेटा संपीड़न तकनीकों को जोड़ती है: असतत कोटिज्या ट्रांसफ़ॉर्म (DCT) कूटलेखन[8]स्थानिक आयाम में, और लौकिक आयाम में भविष्य कहनेवाला गति प्रतिकरण।[7]डीसीटी कूटलेखन एक हानिपूर्ण संपीड़न ब्लॉक संपीड़न परिवर्तन कूटलेखन तकनीक है जिसे पहली बार एन. अहमद द्वारा प्रस्तावित किया गया था, जो शुरू में इसे 1972 में छवि संपीड़न के लिए अभिप्रेत था।[9] 1974 में, दक्षिणी कैलिफोर्निया विश्वविद्यालय में अली हबीबी ने हाइब्रिड कूटलेखन की शुरुआत की,[10][11] जो प्रिडिक्टिव कूटलेखन को ट्रांसफॉर्म कूटलेखन के साथ जोड़ती है।[7][12] हालाँकि, उनका एल्गोरिथ्म शुरू में स्थानिक आयाम में इंट्रा-प्रधार कूटलेखन तक सीमित था। 1975 में, जॉन ए. रोएज़ और गनर एस. रॉबिन्सन ने हबीबी के हाइब्रिड कूटलेखन एल्गोरिद्म को टेम्पोरल डाइमेंशन में ट्रांसफ़ॉर्म कूटलेखन और टेम्पोरल डायमेंशन में प्रेडिक्टिव कूटलेखन का उपयोग करते हुए इंटर-प्रधार गति-मुआवज़ा हाइब्रिड कूटलेखन विकसित करते हुए, टेम्पोरल डायमेंशन तक बढ़ाया।[7][13] स्थानिक परिवर्तन कूटलेखन के लिए, उन्होंने डीसीटी और फास्ट फूरियर ट्रांसफॉर्म (एफएफटी) के साथ प्रयोग किया, दोनों के लिए इंटर-प्रधार हाइब्रिड कोडर विकसित किया, और पाया कि डीसीटी इसकी कम जटिलता के कारण सबसे कुशल है, छवि डेटा को कम करने में सक्षम है 2-अंश प्रति पिक्सेल की आवश्यकता वाले इंट्रा-प्रधार कोडर की तुलना में छवि गुणवत्ता वाले videotelephone दृश्य के लिए 0.25-बिट प्रति पिक्सेल।[14][13]

1977 में, वेन-सिउंग चेन ने सी.एच. के साथ एक तेज़ डीसीटी एल्गोरिदम विकसित किया। स्मिथ और एस.सी. फ्रलिक।[15] 1979 में, अनिल के. जैन (इलेक्ट्रिकल इंजीनियर, जन्म 1946) | अनिल के. जैन और जसवंत आर. जैन ने गति-प्रतिपूर्ति डीसीटी वीडियो संपीड़न विकसित किया,[16][7]ब्लॉक गति प्रतिकरण भी कहा जाता है।[7]इसने 1981 में चेन को एक व्यावहारिक वीडियो संपीड़न एल्गोरिथ्म विकसित करने के लिए प्रेरित किया, जिसे गति-क्षतिपूर्ति DCT या अनुकूली दृश्य कूटलेखन कहा जाता है।[7]गति-प्रतिकरण DCT बाद में 1980 के दशक के अंत से वीडियो संपीड़न के लिए मानक कूटलेखन तकनीक बन गया।[17][2]

पहला डिजिटल वीडियो कूटलेखन मानक H.120 था, जिसे 1984 में ITU-T (अब ITU-T) द्वारा विकसित किया गया था।[18] H.120 ने गति-क्षतिपूर्ति DPCM कूटलेखन का उपयोग किया,[7]जो वीडियो कूटलेखन के लिए अक्षम था,[17]और H.120 इस प्रकार कम प्रदर्शन के कारण अव्यावहारिक था।[18]H.261 मानक 1988 में गति-क्षतिपूर्ति DCT संपीड़न के आधार पर विकसित किया गया था,[17][2]और यह पहला व्यावहारिक वीडियो कूटलेखन मानक था।[18]तब से, गति-कंपेंसेटेड DCT कम्प्रेशन को सभी प्रमुख वीडियो कूटलेखन मानकों (H.26x और MPEG फॉर्मेट सहित) द्वारा अपनाया गया है।[17][2]


यह भी देखें

अनुप्रयोग

संदर्भ

  1. Chen, Jie; Koc, Ut-Va; Liu, KJ Ray (2001). Design of Digital Video Coding Systems: A Complete Compressed Domain Approach. CRC Press. p. 71. ISBN 9780203904183.
  2. 2.0 2.1 2.2 2.3 2.4 Li, Jian Ping (2006). Proceedings of the International Computer Conference 2006 on Wavelet Active Media Technology and Information Processing: Chongqing, China, 29-31 August 2006. World Scientific. p. 847. ISBN 9789812709998.
  3. "MPEG-2 FAQ". February 20, 2009. Archived from the original on 2009-02-20.
  4. Zeng, Kai, et al. "Characterizing perceptual artifacts in compressed video streams." IS&T/SPIE Electronic Imaging. International Society for Optics and Photonics, 2014.
  5. Aizawa, Kiyoharu, and Thomas S. Huang. "Model-based image coding advanced video coding techniques for very low bit-rate applications." Proceedings of the IEEE 83.2 (1995): 259-271.
  6. Garnham, Nigel W. (1995). गति मुआवजा वीडियो कोडिंग - पीएचडी थीसिस (PDF). University of Nottingham. OCLC 59633188.
  7. 7.0 7.1 7.2 7.3 7.4 7.5 7.6 7.7 7.8 "वीडियो संपीड़न का इतिहास". ITU-T. Joint Video Team (JVT) of ISO/IEC MPEG & ITU-T VCEG (ISO/IEC JTC1/SC29/WG11 and ITU-T SG16 Q.6). July 2002. pp. 11, 24–9, 33, 40–1, 53–6. Retrieved 3 November 2019.
  8. 8.0 8.1 Lea, William (1994). Video on demand: Research Paper 94/68. House of Commons Library. Archived from the original on 20 September 2019. Retrieved 20 September 2019.
  9. Ahmed, Nasir (January 1991). "मैं असतत कोसाइन परिवर्तन के साथ कैसे आया". Digital Signal Processing. 1 (1): 4–5. doi:10.1016/1051-2004(91)90086-Z.
  10. Habibi, Ali (1974). "सचित्र डेटा की हाइब्रिड कोडिंग". IEEE Transactions on Communications. 22 (5): 614–624. doi:10.1109/TCOM.1974.1092258.
  11. Chen, Z.; He, T.; Jin, X.; Wu, F. (2020). "वीडियो संपीड़न के लिए सीखना". IEEE Transactions on Circuits and Systems for Video Technology. 30 (2): 566–576. arXiv:1804.09869. doi:10.1109/TCSVT.2019.2892608. S2CID 13743007.
  12. Ohm, Jens-Rainer (2015). मल्टीमीडिया सिग्नल कोडिंग और ट्रांसमिशन. Springer. p. 364. ISBN 9783662466919.
  13. 13.0 13.1 Roese, John A.; Robinson, Guner S. (30 October 1975). "डिजिटल इमेज सीक्वेंस की संयुक्त स्थानिक और टेम्पोरल कोडिंग". Efficient Transmission of Pictorial Information. International Society for Optics and Photonics. 0066: 172–181. Bibcode:1975SPIE...66..172R. doi:10.1117/12.965361. S2CID 62725808.
  14. Huang, T. S. (1981). छवि अनुक्रम विश्लेषण. Springer Science & Business Media. p. 29. ISBN 9783642870378.
  15. Chen, Wen-Hsiung; Smith, C. H.; Fralick, S. C. (September 1977). "असतत कोज्या रूपांतरण के लिए एक तेज़ कम्प्यूटेशनल एल्गोरिथम". IEEE Transactions on Communications. 25 (9): 1004–1009. doi:10.1109/TCOM.1977.1093941.
  16. Cianci, Philip J. (2014). High Definition Television: The Creation, Development and Implementation of HDTV Technology. McFarland. p. 63. ISBN 9780786487974.
  17. 17.0 17.1 17.2 17.3 Ghanbari, Mohammed (2003). Standard Codecs: Image Compression to Advanced Video Coding. Institution of Engineering and Technology. pp. 1–2. ISBN 9780852967102.
  18. 18.0 18.1 18.2 "वीडियो फ़ाइल स्वरूपों का इतिहास इन्फोग्राफिक". RealNetworks. 22 April 2012. Retrieved 5 August 2019.


बाहरी संबंध