संशोधित असतत कोसाइन परिवर्तन: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 4: Line 4:
संशोधित  असतत कोसाइन परिवर्तन (एमडीसीटी) टाइप-IV [[असतत कोसाइन परिवर्तन]] (डीसीटी-IV) पर आधारित एक परिवर्तन है। [[लैप्ड ट्रांसफॉर्म]] होने की अतिरिक्त गुण के साथ: इसे एक बड़े [[ डाटासेट ]] के निरंतर ब्लॉक पर निष्पादित करने के लिए यह प्रारूपित किया गया है। जहाँ बाद के ब्लॉकों को ओवरलैप किया जाता है। जिससे एक ब्लॉक का अंतिम आधा अगले ब्लॉक के पहले भाग के साथ मिलान करता है। यह ओवरलैपिंग डीसीटी के ऊर्जा-संघनन गुणों के अतिरिक्त एमडीसीटी को सिग्नल संपीड़न अनुप्रयोगों के लिए विशेष रूप से आकर्षक बनाता है क्योंकि यह ब्लॉक सीमाओं से उत्पन्न [[संपीड़न विरूपण साक्ष्य]] से बचने में सहायता करता है। इन लाभ के परिणामस्वरूप एमडीसीटी [[ऑडियो डेटा संपीड़न]] में सबसे व्यापक रूप से उपयोग की जाने वाली [[हानिपूर्ण संपीड़न]] विधि है। यह [[MP3|एमपी3]], [[डॉल्बी डिजिटल]] (एसी-3), [[वॉर्बिस]] (ओजीजी), [[विंडोज मीडिया ऑडियो]] (डब्लूएमए), [[ATRAC|एटीआऱसी]], [[कुक कोडेक]], [[ उन्नत ऑडियो कोडिंग ]] (एएसी), [[हाई-डेफिनिशन कोडिंग]] (एचडीसी),<ref>{{cite book |last1=Jones |first1=Graham A. |last2=Layer |first2=David H. |last3=Osenkowsky |first3=Thomas G. |title=National Association of Broadcasters Engineering Handbook: NAB Engineering Handbook |date=2013 |publisher=[[Taylor & Francis]] |isbn=978-1-136-03410-7 |pages=558–9 |url=https://books.google.com/books?id=K9N1TVhf82YC&pg=PA558}}</ref> [[एलडीएसी (कोडेक)]], [[डॉल्बी एसी-4]],<ref>{{cite web |title=Dolby AC-4: Audio Delivery for Next-Generation Entertainment Services |url=https://www.dolby.com/us/en/technologies/ac-4/Next-Generation-Entertainment-Services.pdf |website=[[Dolby Laboratories]] |date=June 2015 |access-date=11 November 2019}}</ref> और [[एमपीईजी-एच 3डी ऑडियो]]<ref name="Luo">{{cite book |last1=Luo |first1=Fa-Long |title=Mobile Multimedia Broadcasting Standards: Technology and Practice |date=2008 |publisher=[[Springer Science & Business Media]] |isbn=9780387782638 |page=590 |url=https://books.google.com/books?id=l6PovWat8SMC&pg=PA590}}</ref><ref>{{cite journal |last1=Bleidt |first1=R. L. |last2=Sen |first2=D. |last3=Niedermeier |first3=A. |last4=Czelhan |first4=B. |last5=Füg |first5=S. |display-authors=etal |title=Development of the MPEG-H TV Audio System for ATSC 3.0 |journal=IEEE Transactions on Broadcasting |date=2017 |volume=63 |issue=1 |pages=202–236 |doi=10.1109/TBC.2017.2661258 |s2cid=30821673 |url=https://www.iis.fraunhofer.de/content/dam/iis/en/doc/ame/Conference-Paper/BleidtR-IEEE-2017-Development-of-MPEG-H-TV-Audio-System-for-ATSC-3-0.pdf}}</ref> सहित अधिकांश आधुनिक [[ऑडियो कोडिंग मानकों]] में निरंतर कार्यरत है। इनके साथ ही [[भाषण कोडिंग]] मानकों जैसे [[एएसी-एलडी]] (एलडी-एमडीसीटी),<ref>{{cite conference |last1=Schnell |first1=Markus |last2=Schmidt |first2=Markus |last3=Jander |first3=Manuel |last4=Albert |first4=Tobias |last5=Geiger |first5=Ralf |last6=Ruoppila |first6=Vesa |last7=Ekstrand |first7=Per |last8=Bernhard |first8=Grill |title=MPEG-4 Enhanced Low Delay AAC - A New Standard for High Quality Communication |conference=125th AES Convention |date=October 2008 |publisher=[[Audio Engineering Society]] |url=https://www.iis.fraunhofer.de/content/dam/iis/de/doc/ame/conference/AES-125-Convention_AAC-ELD-NewStandardForHighQualityCommunication_AES7503.pdf |website=[[Fraunhofer IIS]] |access-date=20 October 2019}}</ref> जी.722.1,<ref>{{cite conference |last1=Lutzky |first1=Manfred |last2=Schuller |first2=Gerald |last3=Gayer |first3=Marc |last4=Krämer |first4=Ulrich |last5=Wabnik |first5=Stefan |title=ऑडियो कोडेक विलंब के लिए एक दिशानिर्देश|url=https://www.iis.fraunhofer.de/content/dam/iis/de/doc/ame/conference/AES-116-Convention_guideline-to-audio-codec-delay_AES116.pdf |website=[[Fraunhofer IIS]] |conference=116th AES Convention |publisher=[[Audio Engineering Society]] |date=May 2004 |access-date=24 October 2019}}</ref> जी.729.1,<ref name="Nagireddi">{{cite book |last1=Nagireddi |first1=Sivannarayana |title=वीओआईपी आवाज और फैक्स सिग्नल प्रोसेसिंग|date=2008 |publisher=[[John Wiley & Sons]] |isbn=9780470377864 |page=69 |url=https://books.google.com/books?id=5AneeZFE71MC&pg=PA69}}</ref> सीईएलटी<ref name="presentation">[http://people.xiph.org/~greg/video/linux_conf_au_CELT_2.ogv Presentation of the CELT codec] by Timothy B. Terriberry (65 minutes of video, see also [http://www.celt-codec.org/presentations/misc/lca-celt.pdf presentation slides] in PDF)</ref> और ओपस (ऑडियो प्रारूप) आदि का भी प्रयोग किया जाता है्।<ref name="homepage">{{cite web |url=http://opus-codec.org/ |title=ओपस कोडेक|work=Opus |publisher=Xiph.org Foundation |type=Home page |access-date=July 31, 2012}}</ref><ref name="ars-role">{{cite web |url=https://arstechnica.com/gadgets/2012/09/newly-standardized-opus-audio-codec-fills-every-role-from-online-chat-to-music/ |title=नया मानकीकृत ओपस ऑडियो कोडेक ऑनलाइन चैट से लेकर संगीत तक हर भूमिका को पूरा करता है|first=Peter |last=Bright |work=[[Ars Technica]] |date=2012-09-12 |access-date=2014-05-28}}</ref>
संशोधित  असतत कोसाइन परिवर्तन (एमडीसीटी) टाइप-IV [[असतत कोसाइन परिवर्तन]] (डीसीटी-IV) पर आधारित एक परिवर्तन है। [[लैप्ड ट्रांसफॉर्म]] होने की अतिरिक्त गुण के साथ: इसे एक बड़े [[ डाटासेट ]] के निरंतर ब्लॉक पर निष्पादित करने के लिए यह प्रारूपित किया गया है। जहाँ बाद के ब्लॉकों को ओवरलैप किया जाता है। जिससे एक ब्लॉक का अंतिम आधा अगले ब्लॉक के पहले भाग के साथ मिलान करता है। यह ओवरलैपिंग डीसीटी के ऊर्जा-संघनन गुणों के अतिरिक्त एमडीसीटी को सिग्नल संपीड़न अनुप्रयोगों के लिए विशेष रूप से आकर्षक बनाता है क्योंकि यह ब्लॉक सीमाओं से उत्पन्न [[संपीड़न विरूपण साक्ष्य]] से बचने में सहायता करता है। इन लाभ के परिणामस्वरूप एमडीसीटी [[ऑडियो डेटा संपीड़न]] में सबसे व्यापक रूप से उपयोग की जाने वाली [[हानिपूर्ण संपीड़न]] विधि है। यह [[MP3|एमपी3]], [[डॉल्बी डिजिटल]] (एसी-3), [[वॉर्बिस]] (ओजीजी), [[विंडोज मीडिया ऑडियो]] (डब्लूएमए), [[ATRAC|एटीआऱसी]], [[कुक कोडेक]], [[ उन्नत ऑडियो कोडिंग ]] (एएसी), [[हाई-डेफिनिशन कोडिंग]] (एचडीसी),<ref>{{cite book |last1=Jones |first1=Graham A. |last2=Layer |first2=David H. |last3=Osenkowsky |first3=Thomas G. |title=National Association of Broadcasters Engineering Handbook: NAB Engineering Handbook |date=2013 |publisher=[[Taylor & Francis]] |isbn=978-1-136-03410-7 |pages=558–9 |url=https://books.google.com/books?id=K9N1TVhf82YC&pg=PA558}}</ref> [[एलडीएसी (कोडेक)]], [[डॉल्बी एसी-4]],<ref>{{cite web |title=Dolby AC-4: Audio Delivery for Next-Generation Entertainment Services |url=https://www.dolby.com/us/en/technologies/ac-4/Next-Generation-Entertainment-Services.pdf |website=[[Dolby Laboratories]] |date=June 2015 |access-date=11 November 2019}}</ref> और [[एमपीईजी-एच 3डी ऑडियो]]<ref name="Luo">{{cite book |last1=Luo |first1=Fa-Long |title=Mobile Multimedia Broadcasting Standards: Technology and Practice |date=2008 |publisher=[[Springer Science & Business Media]] |isbn=9780387782638 |page=590 |url=https://books.google.com/books?id=l6PovWat8SMC&pg=PA590}}</ref><ref>{{cite journal |last1=Bleidt |first1=R. L. |last2=Sen |first2=D. |last3=Niedermeier |first3=A. |last4=Czelhan |first4=B. |last5=Füg |first5=S. |display-authors=etal |title=Development of the MPEG-H TV Audio System for ATSC 3.0 |journal=IEEE Transactions on Broadcasting |date=2017 |volume=63 |issue=1 |pages=202–236 |doi=10.1109/TBC.2017.2661258 |s2cid=30821673 |url=https://www.iis.fraunhofer.de/content/dam/iis/en/doc/ame/Conference-Paper/BleidtR-IEEE-2017-Development-of-MPEG-H-TV-Audio-System-for-ATSC-3-0.pdf}}</ref> सहित अधिकांश आधुनिक [[ऑडियो कोडिंग मानकों]] में निरंतर कार्यरत है। इनके साथ ही [[भाषण कोडिंग]] मानकों जैसे [[एएसी-एलडी]] (एलडी-एमडीसीटी),<ref>{{cite conference |last1=Schnell |first1=Markus |last2=Schmidt |first2=Markus |last3=Jander |first3=Manuel |last4=Albert |first4=Tobias |last5=Geiger |first5=Ralf |last6=Ruoppila |first6=Vesa |last7=Ekstrand |first7=Per |last8=Bernhard |first8=Grill |title=MPEG-4 Enhanced Low Delay AAC - A New Standard for High Quality Communication |conference=125th AES Convention |date=October 2008 |publisher=[[Audio Engineering Society]] |url=https://www.iis.fraunhofer.de/content/dam/iis/de/doc/ame/conference/AES-125-Convention_AAC-ELD-NewStandardForHighQualityCommunication_AES7503.pdf |website=[[Fraunhofer IIS]] |access-date=20 October 2019}}</ref> जी.722.1,<ref>{{cite conference |last1=Lutzky |first1=Manfred |last2=Schuller |first2=Gerald |last3=Gayer |first3=Marc |last4=Krämer |first4=Ulrich |last5=Wabnik |first5=Stefan |title=ऑडियो कोडेक विलंब के लिए एक दिशानिर्देश|url=https://www.iis.fraunhofer.de/content/dam/iis/de/doc/ame/conference/AES-116-Convention_guideline-to-audio-codec-delay_AES116.pdf |website=[[Fraunhofer IIS]] |conference=116th AES Convention |publisher=[[Audio Engineering Society]] |date=May 2004 |access-date=24 October 2019}}</ref> जी.729.1,<ref name="Nagireddi">{{cite book |last1=Nagireddi |first1=Sivannarayana |title=वीओआईपी आवाज और फैक्स सिग्नल प्रोसेसिंग|date=2008 |publisher=[[John Wiley & Sons]] |isbn=9780470377864 |page=69 |url=https://books.google.com/books?id=5AneeZFE71MC&pg=PA69}}</ref> सीईएलटी<ref name="presentation">[http://people.xiph.org/~greg/video/linux_conf_au_CELT_2.ogv Presentation of the CELT codec] by Timothy B. Terriberry (65 minutes of video, see also [http://www.celt-codec.org/presentations/misc/lca-celt.pdf presentation slides] in PDF)</ref> और ओपस (ऑडियो प्रारूप) आदि का भी प्रयोग किया जाता है्।<ref name="homepage">{{cite web |url=http://opus-codec.org/ |title=ओपस कोडेक|work=Opus |publisher=Xiph.org Foundation |type=Home page |access-date=July 31, 2012}}</ref><ref name="ars-role">{{cite web |url=https://arstechnica.com/gadgets/2012/09/newly-standardized-opus-audio-codec-fills-every-role-from-online-chat-to-music/ |title=नया मानकीकृत ओपस ऑडियो कोडेक ऑनलाइन चैट से लेकर संगीत तक हर भूमिका को पूरा करता है|first=Peter |last=Bright |work=[[Ars Technica]] |date=2012-09-12 |access-date=2014-05-28}}</ref>


असतत कोज्या रूपांतरण (DCT) पहली बार 1972 में एन. अहमद द्वारा प्रस्तावित किया गया था,<ref name="Ahmed">{{cite journal |last=Ahmed |first=Nasir |author-link=N. Ahmed |title=मैं असतत कोसाइन परिवर्तन के साथ कैसे आया|journal=[[Digital Signal Processing (journal)|Digital Signal Processing]] |date=January 1991 |volume=1 |issue=1 |pages=4–5 |doi=10.1016/1051-2004(91)90086-Z |url=https://www.scribd.com/doc/52879771/DCT-History-How-I-Came-Up-with-the-Discrete-Cosine-Transform}}</ref> और 1974 में टी. नटराजन और के.आर. राव के साथ अहमद द्वारा प्रदर्शित किया गया।<ref name="pubDCT">{{Citation |first1=Nasir |last1=Ahmed |author1-link=N. Ahmed |first2=T. |last2=Natarajan |first3=K. R. |last3=Rao |title=Discrete Cosine Transform |journal=IEEE Transactions on Computers |date=January 1974 |volume=C-23 |issue=1 |pages=90–93 |doi=10.1109/T-C.1974.223784|s2cid=149806273 }}</ref> एमडीसीटी को बाद में जॉन पी. प्रिंसन, ए.डब्ल्यू. द्वारा प्रस्तावित किया गया था। 1987 में [[सरे विश्वविद्यालय]] में जॉनसन और एलन बी. ब्राडली,<ref>{{cite journal |last1=Princen |first1=John P. |last2=Johnson |first2=A.W. |last3=Bradley |first3=Alan B. |title=Subband/Transform coding using filter bank designs based on time domain aliasing cancellation |journal=ICASSP '87. IEEE International Conference on Acoustics, Speech, and Signal Processing |date=1987 |volume=12 |pages=2161–2164 |doi=10.1109/ICASSP.1987.1169405|s2cid=58446992 }}</ref> प्रिंसेन और ब्रैडली (1986) द्वारा पहले के काम के बाद<ref>John P. Princen, Alan B. Bradley: ''Analysis/synthesis filter bank design based on time domain aliasing cancellation'', IEEE Trans. Acoust. Speech Signal Processing, ''ASSP-34'' (5), 1153–1161, 1986.  Described a precursor to the MDCT using a combination of discrete cosine and sine transforms.</ref> एमडीसीटी के टाइम-डोमेन अलियासिंग रद्दीकरण (टीडीएसी) के अंतर्निहित सिद्धांत को विकसित करने के लिए, नीचे वर्णित है। (विभिन्न प्रकार के डीसीटी या डीसीटी/डीएसटी संयोजनों के आधार पर अलग-अलग साइन ट्रांसफॉर्म के साथ-साथ अन्य, शायद ही कभी इस्तेमाल किए जाने वाले एमडीसीटी के रूपों के आधार पर एक अनुरूप परिवर्तन, एमडीएसटी भी मौजूद है।)
असतत कोज्या रूपांतरण (डीसीटी) पहली बार 1972 में एन. अहमद द्वारा प्रस्तावित किया गया था<ref name="Ahmed">{{cite journal |last=Ahmed |first=Nasir |author-link=N. Ahmed |title=मैं असतत कोसाइन परिवर्तन के साथ कैसे आया|journal=[[Digital Signal Processing (journal)|Digital Signal Processing]] |date=January 1991 |volume=1 |issue=1 |pages=4–5 |doi=10.1016/1051-2004(91)90086-Z |url=https://www.scribd.com/doc/52879771/DCT-History-How-I-Came-Up-with-the-Discrete-Cosine-Transform}}</ref> और 1974 में टी. नटराजन और के.आर. राव के साथ अहमद द्वारा प्रस्तुत किया गया।<ref name="pubDCT">{{Citation |first1=Nasir |last1=Ahmed |author1-link=N. Ahmed |first2=T. |last2=Natarajan |first3=K. R. |last3=Rao |title=Discrete Cosine Transform |journal=IEEE Transactions on Computers |date=January 1974 |volume=C-23 |issue=1 |pages=90–93 |doi=10.1109/T-C.1974.223784|s2cid=149806273 }}</ref> एमडीसीटी को बाद में जॉन पी. प्रिंसन, ए.डब्ल्यू. द्वारा प्रस्तावित किया गया था। 1987 में [[सरे विश्वविद्यालय]] में जॉनसन और एलन बी. ब्राडली,<ref>{{cite journal |last1=Princen |first1=John P. |last2=Johnson |first2=A.W. |last3=Bradley |first3=Alan B. |title=Subband/Transform coding using filter bank designs based on time domain aliasing cancellation |journal=ICASSP '87. IEEE International Conference on Acoustics, Speech, and Signal Processing |date=1987 |volume=12 |pages=2161–2164 |doi=10.1109/ICASSP.1987.1169405|s2cid=58446992 }}</ref> प्रिंसेन और ब्रैडली (1986) द्वारा पहले कार्य के बाद<ref>John P. Princen, Alan B. Bradley: ''Analysis/synthesis filter bank design based on time domain aliasing cancellation'', IEEE Trans. Acoust. Speech Signal Processing, ''ASSP-34'' (5), 1153–1161, 1986.  Described a precursor to the MDCT using a combination of discrete cosine and sine transforms.</ref> एमडीसीटी के टाइम-डोमेन अलियासिंग कैन्सिलेशन (टीडीएसी) के अंतर्निहित सिद्धांत को विकसित करने के लिए नीचे वर्णित किया गया है। (विभिन्न प्रकार के डीसीटी या डीसीटी/डीएसटी संयोजनों के आधार पर विभिन्न प्रकार के साइन ट्रांसफॉर्म के साथ-साथ अन्य, संभवतः ही कभी प्रयोग किए जाने वाले एमडीसीटी के रूपों के आधार पर एक अनुरूप परिवर्तन, एमडीएसटी भी उपस्थित है।)


MP3 में, MDCT सीधे ऑडियो सिग्नल पर लागू नहीं होता है, बल्कि 32-बैंड [[पॉलीफ़ेज़ क्वाडरेचर फ़िल्टर]] (PQF) बैंक के आउटपुट पर लागू होता है। PQF फ़िल्टर बैंक के विशिष्ट अलियासिंग को कम करने के लिए इस MDCT के आउटपुट को उपनाम कमी सूत्र द्वारा पोस्टप्रोसेस किया जाता है। MDCT के साथ फ़िल्टर बैंक के इस तरह के संयोजन को ''हाइब्रिड'' फ़िल्टर बैंक या ''सबबैंड'' MDCT कहा जाता है। दूसरी ओर, एएसी सामान्य रूप से एक शुद्ध एमडीसीटी का उपयोग करता है; केवल (शायद ही कभी इस्तेमाल किया जाने वाला) [[एमपीईजी-4 एएसी-एसएसआर]] संस्करण ([[सोनी]] द्वारा) एमडीसीटी के बाद चार-बैंड पीक्यूएफ बैंक का उपयोग करता है। MP3 के समान, ATRAC एक MDCT के बाद स्टैक्ड [[चतुर्भुज दर्पण फिल्टर]] (QMF) का उपयोग करता है।
एमपी3 में, एमडीसीटी सीधे ऑडियो सिग्नल पर संचालित नहीं होता है। बल्कि 32-बैंड [[पॉलीफ़ेज़ क्वाडरेचर फ़िल्टर]] (पीक्यूएफ) बैंक के आउटपुट पर संचालित होता है। पीक्यूएफ फ़िल्टर बैंक के विशिष्ट अलियासिंग को कम करने के लिए इस एमडीसीटी के आउटपुट को उपनाम रिडक्शन सूत्र द्वारा पोस्टप्रोसेस किया जाता है। एमडीसीटी के साथ फ़िल्टर बैंक के इस प्रकार के संयोजन को ''हाइब्रिड'' फ़िल्टर बैंक या ''सबबैंड'' एमडीसीटी कहा जाता है। दूसरी ओर एएसी सामान्य रूप से एक शुद्ध एमडीसीटी का उपयोग करता है। केवल (संभवतः ही कभी प्रयोग किया जाने वाला) [[एमपीईजी-4 एएसी-एसएसआर]] संस्करण ([[सोनी]] द्वारा) एमडीसीटी के बाद चार-बैंड पीक्यूएफ बैंक का उपयोग करता है। एमपी3 के समान, एटीआरएसी एक एमडीसीटी के बाद स्टैक्ड [[चतुर्भुज दर्पण फिल्टर]] (क्यूएमएफ) का उपयोग किया जाता है।


== परिभाषा ==
== परिभाषा ==


लैप्ड ट्रांसफ़ॉर्म के रूप में, MDCT अन्य फूरियर-संबंधित ट्रांसफ़ॉर्म की तुलना में थोड़ा असामान्य है, जिसमें इनपुट के रूप में आधे आउटपुट हैं (समान संख्या के बजाय)। विशेष रूप से, यह एक रैखिक कार्य है <math>F\colon \mathbf{R}^{2N} \to \mathbf{R}^N</math> (जहाँ R [[वास्तविक संख्या]]ओं के समुच्चय को दर्शाता है)। 2''N'' वास्तविक संख्या ''x''<sub>0</sub>, ..., एक्स<sub>2''N''-1</sub> एन वास्तविक संख्या एक्स में परिवर्तित हो जाते हैं<sub>0</sub>, ..., एक्स<sub>''N''-1</sub> सूत्र के अनुसार:
लैप्ड ट्रांसफ़ॉर्म के रूप में, Mडीसीटी अन्य फूरियर-संबंधित ट्रांसफ़ॉर्म की तुलना में थोड़ा असामान्य है, जिसमें इनपुट के रूप में आधे आउटपुट हैं (समान संख्या के बजाय)। विशेष रूप से, यह एक रैखिक कार्य है <math>F\colon \mathbf{R}^{2N} \to \mathbf{R}^N</math> (जहाँ R [[वास्तविक संख्या]]ओं के समुच्चय को दर्शाता है)। 2''N'' वास्तविक संख्या ''x''<sub>0</sub>, ..., एक्स<sub>2''N''-1</sub> एन वास्तविक संख्या एक्स में परिवर्तित हो जाते हैं<sub>0</sub>, ..., एक्स<sub>''N''-1</sub> सूत्र के अनुसार:


:<math>X_k = \sum_{n=0}^{2N-1} x_n \cos \left[\frac{\pi}{N} \left(n+\frac{1}{2}+\frac{N}{2}\right) \left(k+\frac{1}{2}\right) \right]</math>
:<math>X_k = \sum_{n=0}^{2N-1} x_n \cos \left[\frac{\pi}{N} \left(n+\frac{1}{2}+\frac{N}{2}\right) \left(k+\frac{1}{2}\right) \right]</math>
(इस परिवर्तन के सामने सामान्यीकरण गुणांक, यहाँ एकता, एक मनमाना सम्मेलन है और उपचारों के बीच भिन्न है। केवल MDCT और IMDCT के सामान्यीकरण का उत्पाद, नीचे, विवश है।)
(इस परिवर्तन के सामने सामान्यीकरण गुणांक, यहाँ एकता, एक मनमाना सम्मेलन है और उपचारों के बीच भिन्न है। केवल Mडीसीटी और IMडीसीटी के सामान्यीकरण का उत्पाद, नीचे, विवश है।)


=== उलटा परिवर्तन ===
=== उलटा परिवर्तन ===


व्युत्क्रम MDCT को IMDCT के रूप में जाना जाता है। क्योंकि इनपुट और आउटपुट की अलग-अलग संख्याएँ हैं, पहली नज़र में ऐसा लग सकता है कि MDCT उलटा नहीं होना चाहिए। हालाँकि, बाद के ओवरलैपिंग ब्लॉकों के ओवरलैप किए गए IMDCTs को 'जोड़' द्वारा पूर्ण अपवर्तनीयता प्राप्त की जाती है, जिससे त्रुटियाँ 'रद्द' हो जाती हैं और मूल डेटा को पुनः प्राप्त किया जा सकता है; इस तकनीक को 'टाइम-डोमेन अलियासिंग कैंसलेशन' (TDAC) के रूप में जाना जाता है।
व्युत्क्रम Mडीसीटी को IMडीसीटी के रूप में जाना जाता है। क्योंकि इनपुट और आउटपुट की अलग-अलग संख्याएँ हैं, पहली नज़र में ऐसा लग सकता है कि Mडीसीटी उलटा नहीं होना चाहिए। हालाँकि, बाद के ओवरलैपिंग ब्लॉकों के ओवरलैप किए गए IMडीसीटीs को 'जोड़' द्वारा पूर्ण अपवर्तनीयता प्राप्त की जाती है, जिससे त्रुटियाँ 'रद्द' हो जाती हैं और मूल डेटा को पुनः प्राप्त किया जा सकता है; इस तकनीक को 'टाइम-डोमेन अलियासिंग कैंसलेशन' (TDAC) के रूप में जाना जाता है।


आईएमडीसीटी ''एन'' वास्तविक संख्या ''एक्स'' को रूपांतरित करता है<sub>0</sub>, ..., एक्स<sub>''N''-1</sub> 2N वास्तविक संख्या y में<sub>0</sub>, ..., और<sub>2''N''-1</sub> सूत्र के अनुसार:
आईएमडीसीटी ''एन'' वास्तविक संख्या ''एक्स'' को रूपांतरित करता है<sub>0</sub>, ..., एक्स<sub>''N''-1</sub> 2N वास्तविक संख्या y में<sub>0</sub>, ..., और<sub>2''N''-1</sub> सूत्र के अनुसार:


:<math>y_n = \frac{1}{N} \sum_{k=0}^{N-1} X_k \cos \left[\frac{\pi}{N} \left(n+\frac{1}{2}+\frac{N}{2}\right) \left(k+\frac{1}{2}\right) \right]</math>
:<math>y_n = \frac{1}{N} \sum_{k=0}^{N-1} X_k \cos \left[\frac{\pi}{N} \left(n+\frac{1}{2}+\frac{N}{2}\right) \left(k+\frac{1}{2}\right) \right]</math>
(जैसे Discrete_cosine_transform#DCT-IV|DCT-IV, एक ओर्थोगोनल रूपांतरण के लिए, व्युत्क्रम का वही रूप है जो आगे के रूपांतरण का है।)
(जैसे Discrete_cosine_transform#डीसीटी-IV|डीसीटी-IV, एक ओर्थोगोनल रूपांतरण के लिए, व्युत्क्रम का वही रूप है जो आगे के रूपांतरण का है।)


सामान्य विंडो सामान्यीकरण (नीचे देखें) के साथ एक विंडो एमडीसीटी के मामले में, आईएमडीसीटी के सामने सामान्यीकरण गुणांक को 2 से गुणा किया जाना चाहिए (अर्थात, 2/एन बनना)।
सामान्य विंडो सामान्यीकरण (नीचे देखें) के साथ एक विंडो एमडीसीटी के मामले में, आईएमडीसीटी के सामने सामान्यीकरण गुणांक को 2 से गुणा किया जाना चाहिए (अर्थात, 2/एन बनना)।
Line 28: Line 28:
=== गणना ===
=== गणना ===


हालांकि MDCT फॉर्मूले के सीधे आवेदन के लिए O(N<sup>2</sup>) ऑपरेशंस, [[फास्ट फूरियर ट्रांसफॉर्म]] (एफएफटी) के रूप में गणना को पुनरावर्ती रूप से कारक बनाकर केवल ओ (एन लॉग एन) जटिलता के साथ एक ही चीज़ की गणना करना संभव है। कोई अन्य रूपांतरणों के माध्यम से MDCTs की गणना भी कर सकता है, आमतौर पर एक DFT (FFT) या DCT, O(N) पूर्व और बाद के प्रसंस्करण चरणों के साथ। इसके अतिरिक्त, जैसा कि नीचे बताया गया है, DCT-IV के लिए कोई भी एल्गोरिथम समान आकार के MDCT और IMDCT की गणना करने के लिए तुरंत एक विधि प्रदान करता है।
हालांकि Mडीसीटी फॉर्मूले के सीधे आवेदन के लिए O(N<sup>2</sup>) ऑपरेशंस, [[फास्ट फूरियर ट्रांसफॉर्म]] (एफएफटी) के रूप में गणना को पुनरावर्ती रूप से कारक बनाकर केवल ओ (एन लॉग एन) जटिलता के साथ एक ही चीज़ की गणना करना संभव है। कोई अन्य रूपांतरणों के माध्यम से Mडीसीटीs की गणना भी कर सकता है, आमतौर पर एक DFT (FFT) या डीसीटी, O(N) पूर्व और बाद के प्रसंस्करण चरणों के साथ। इसके अतिरिक्त, जैसा कि नीचे बताया गया है, डीसीटी-IV के लिए कोई भी एल्गोरिथम समान आकार के Mडीसीटी और IMडीसीटी की गणना करने के लिए तुरंत एक विधि प्रदान करता है।


== विंडो फ़ंक्शंस ==
== विंडो फ़ंक्शंस ==


[[file:MDCT_WF.png|thumb|upright=1.8|MDCT विंडो फ़ंक्शंस:<br>नीला: कोसाइन, लाल: साइन-कोसाइन, हरा: संशोधित कैसर-बेसेल]]विशिष्ट सिग्नल-संपीड़न अनुप्रयोगों में, [[खिड़की समारोह]] w का उपयोग करके रूपांतरण गुणों को और बेहतर बनाया जाता है<sub>''n''</sub> (n = 0, ..., 2N−1) जिसे x से गुणा किया जाता है<sub>''n''</sub> और वाई<sub>''n''</sub> उपरोक्त एमडीसीटी और आईएमडीसीटी सूत्रों में, एन = 0 और 2एन सीमाओं पर असंतुलन से बचने के लिए फ़ंक्शन को उन बिंदुओं पर सुचारू रूप से शून्य पर ले जाने के लिए। (अर्थात, हम डेटा को MDCT से पहले और IMDCT के बाद विंडो करते हैं।) सिद्धांत रूप में, x और y में अलग-अलग विंडो फ़ंक्शन हो सकते हैं, और विंडो फ़ंक्शन भी एक ब्लॉक से अगले ब्लॉक में बदल सकता है (विशेष रूप से उस मामले में जहां डेटा ब्लॉक होता है) विभिन्न आकारों के संयुक्त होते हैं), लेकिन सादगी के लिए हम समान आकार के ब्लॉकों के लिए समान विंडो फ़ंक्शंस के सामान्य मामले पर विचार करते हैं।
[[file:MDCT_WF.png|thumb|upright=1.8|Mडीसीटी विंडो फ़ंक्शंस:<br>नीला: कोसाइन, लाल: साइन-कोसाइन, हरा: संशोधित कैसर-बेसेल]]विशिष्ट सिग्नल-संपीड़न अनुप्रयोगों में, [[खिड़की समारोह]] w का उपयोग करके रूपांतरण गुणों को और बेहतर बनाया जाता है<sub>''n''</sub> (n = 0, ..., 2N−1) जिसे x से गुणा किया जाता है<sub>''n''</sub> और वाई<sub>''n''</sub> उपरोक्त एमडीसीटी और आईएमडीसीटी सूत्रों में, एन = 0 और 2एन सीमाओं पर असंतुलन से बचने के लिए फ़ंक्शन को उन बिंदुओं पर सुचारू रूप से शून्य पर ले जाने के लिए। (अर्थात, हम डेटा को Mडीसीटी से पहले और IMडीसीटी के बाद विंडो करते हैं।) सिद्धांत रूप में, x और y में अलग-अलग विंडो फ़ंक्शन हो सकते हैं, और विंडो फ़ंक्शन भी एक ब्लॉक से अगले ब्लॉक में बदल सकता है (विशेष रूप से उस मामले में जहां डेटा ब्लॉक होता है) विभिन्न आकारों के संयुक्त होते हैं), लेकिन सादगी के लिए हम समान आकार के ब्लॉकों के लिए समान विंडो फ़ंक्शंस के सामान्य मामले पर विचार करते हैं।


एक सममित विंडो डब्ल्यू के लिए परिवर्तन उलटा रहता है (यानी, टीडीएसी काम करता है)।<sub>''n''</sub> = डब्ल्यू<sub>2''N''−1−''n''</sub>, जब तक w प्रिंसेन-ब्रैडली शर्त को संतुष्ट करता है:
एक सममित विंडो डब्ल्यू के लिए परिवर्तन उलटा रहता है (यानी, टीडीएसी काम करता है)।<sub>''n''</sub> = डब्ल्यू<sub>2''N''−1−''n''</sub>, जब तक w प्रिंसेन-ब्रैडली शर्त को संतुष्ट करता है:
Line 46: Line 46:
वोरबिस के लिए। AC-3 कैसर-बेसेल व्युत्पन्न (KBD) विंडो का उपयोग करता है, और MPEG-4 AAC भी KBD विंडो का उपयोग कर सकता है।
वोरबिस के लिए। AC-3 कैसर-बेसेल व्युत्पन्न (KBD) विंडो का उपयोग करता है, और MPEG-4 AAC भी KBD विंडो का उपयोग कर सकता है।


ध्यान दें कि MDCT पर लागू विंडो कुछ अन्य प्रकार के सिग्नल विश्लेषण के लिए उपयोग की जाने वाली विंडो से अलग हैं, क्योंकि उन्हें प्रिंसन-ब्रैडली शर्त को पूरा करना होगा। इस अंतर के कारणों में से एक यह है कि MDCT विंडो को MDCT (विश्लेषण) और IMDCT (संश्लेषण) दोनों के लिए दो बार लागू किया जाता है।
ध्यान दें कि Mडीसीटी पर संचालित विंडो कुछ अन्य प्रकार के सिग्नल विश्लेषण के लिए उपयोग की जाने वाली विंडो से अलग हैं, क्योंकि उन्हें प्रिंसन-ब्रैडली शर्त को पूरा करना होगा। इस अंतर के कारणों में से एक यह है कि Mडीसीटी विंडो को Mडीसीटी (विश्लेषण) और IMडीसीटी (संश्लेषण) दोनों के लिए दो बार संचालित किया जाता है।


== DCT-IV से संबंध और TDAC की उत्पत्ति ==
== डीसीटी-IV से संबंध और TDAC की उत्पत्ति ==


जैसा कि परिभाषाओं के निरीक्षण से देखा जा सकता है, यहां तक ​​कि ''N'' के लिए भी MDCT अनिवार्य रूप से DCT-IV के समतुल्य है, जहां इनपुट को ''N''/2 और दो ''N''-ब्लॉक द्वारा स्थानांतरित किया जाता है डेटा का एक बार में रूपांतरण किया जाता है। इस समानता की अधिक सावधानी से जांच करके, टीडीएसी जैसे महत्वपूर्ण गुणों को आसानी से प्राप्त किया जा सकता है।
जैसा कि परिभाषाओं के निरीक्षण से देखा जा सकता है, यहां तक ​​कि ''N'' के लिए भी Mडीसीटी अनिवार्य रूप से डीसीटी-IV के समतुल्य है, जहां इनपुट को ''N''/2 और दो ''N''-ब्लॉक द्वारा स्थानांतरित किया जाता है डेटा का एक बार में रूपांतरण किया जाता है। इस समानता की अधिक सावधानी से जांच करके, टीडीएसी जैसे महत्वपूर्ण गुणों को आसानी से प्राप्त किया जा सकता है।


DCT-IV से सटीक संबंध को परिभाषित करने के लिए, किसी को यह महसूस करना चाहिए कि DCT-IV वैकल्पिक सम/विषम सीमा स्थितियों से मेल खाता है: यहां तक ​​​​कि इसकी बाईं सीमा पर भी (''n'' = −1/2 के आसपास), विषम इसकी दाहिनी सीमा पर (लगभग ''n'' = ''N'' − 1/2), और इसी तरह (अलग-अलग फूरियर रूपांतरण के लिए आवधिक सीमाओं के बजाय)। यह पहचान से अनुसरण करता है <math>\cos\left[\frac{\pi}{N} \left(-n-1+\frac{1}{2}\right) \left(k+\frac{1}{2}\right)\right] = \cos\left[\frac{\pi}{N} \left(n+\frac{1}{2}\right) \left(k+\frac{1}{2}\right)\right]</math> और <math>\cos\left[\frac{\pi}{N} \left(2N-n-1+\frac{1}{2}\right) \left(k+\frac{1}{2}\right)\right] = -\cos\left[\frac{\pi}{N} \left(n+\frac{1}{2}\right) \left(k+\frac{1}{2}\right)\right]</math>. इस प्रकार, यदि इसके इनपुट लंबाई N की एक सरणी x हैं, तो हम इस सरणी को (x, −x) तक विस्तारित करने की कल्पना कर सकते हैं<sub>''R''</sub>, -एक्स, एक्स<sub>''R''</sub>, ...) और इसी तरह, जहां x<sub>''R''</sub> एक्स को उल्टे क्रम में दर्शाता है।
डीसीटी-IV से सटीक संबंध को परिभाषित करने के लिए, किसी को यह महसूस करना चाहिए कि डीसीटी-IV वैकल्पिक सम/विषम सीमा स्थितियों से मेल खाता है: यहां तक ​​​​कि इसकी बाईं सीमा पर भी (''n'' = −1/2 के आसपास), विषम इसकी दाहिनी सीमा पर (लगभग ''n'' = ''N'' − 1/2), और इसी तरह (अलग-अलग फूरियर रूपांतरण के लिए आवधिक सीमाओं के बजाय)। यह पहचान से अनुसरण करता है <math>\cos\left[\frac{\pi}{N} \left(-n-1+\frac{1}{2}\right) \left(k+\frac{1}{2}\right)\right] = \cos\left[\frac{\pi}{N} \left(n+\frac{1}{2}\right) \left(k+\frac{1}{2}\right)\right]</math> और <math>\cos\left[\frac{\pi}{N} \left(2N-n-1+\frac{1}{2}\right) \left(k+\frac{1}{2}\right)\right] = -\cos\left[\frac{\pi}{N} \left(n+\frac{1}{2}\right) \left(k+\frac{1}{2}\right)\right]</math>. इस प्रकार, यदि इसके इनपुट लंबाई N की एक सरणी x हैं, तो हम इस सरणी को (x, −x) तक विस्तारित करने की कल्पना कर सकते हैं<sub>''R''</sub>, -एक्स, एक्स<sub>''R''</sub>, ...) और इसी तरह, जहां x<sub>''R''</sub> एक्स को उल्टे क्रम में दर्शाता है।


2एन इनपुट और एन आउटपुट के साथ एक एमडीसीटी पर विचार करें, जहां हम इनपुट को चार ब्लॉक (ए, बी, सी, डी) में विभाजित करते हैं, जिनमें से प्रत्येक का आकार एन/2 है। यदि हम इन्हें N/2 (MDCT परिभाषा में +N/2 शब्द से) द्वारा दाईं ओर स्थानांतरित करते हैं, तो (b, c, d) N DCT-IV इनपुट के अंत से आगे बढ़ते हैं, इसलिए हमें उन्हें मोड़ना चाहिए ऊपर वर्णित सीमा शर्तों के अनुसार वापस।
2एन इनपुट और एन आउटपुट के साथ एक एमडीसीटी पर विचार करें, जहां हम इनपुट को चार ब्लॉक (ए, बी, सी, डी) में विभाजित करते हैं, जिनमें से प्रत्येक का आकार एन/2 है। यदि हम इन्हें N/2 (Mडीसीटी परिभाषा में +N/2 शब्द से) द्वारा दाईं ओर स्थानांतरित करते हैं, तो (b, c, d) N डीसीटी-IV इनपुट के अंत से आगे बढ़ते हैं, इसलिए हमें उन्हें मोड़ना चाहिए ऊपर वर्णित सीमा शर्तों के अनुसार वापस।


: इस प्रकार, 2N इनपुट का MDCT (a, b, c, d) N इनपुट के DCT-IV के बिल्कुल बराबर है: (−c<sub>''R''</sub>-डी, ए-बी<sub>''R''</sub>), जहां आर ऊपर के रूप में उत्क्रमण को दर्शाता है।
: इस प्रकार, 2N इनपुट का Mडीसीटी (a, b, c, d) N इनपुट के डीसीटी-IV के बिल्कुल बराबर है: (−c<sub>''R''</sub>-डी, ए-बी<sub>''R''</sub>), जहां आर ऊपर के रूप में उत्क्रमण को दर्शाता है।


(इस तरह, DCT-IV की गणना करने के लिए किसी भी एल्गोरिथ्म को मामूली रूप से MDCT पर लागू किया जा सकता है।)
(इस तरह, डीसीटी-IV की गणना करने के लिए किसी भी एल्गोरिथ्म को मामूली रूप से Mडीसीटी पर संचालित किया जा सकता है।)


इसी तरह, ऊपर दिया गया IMDCT सूत्र DCT-IV (जो इसका अपना प्रतिलोम है) का ठीक 1/2 है, जहां आउटपुट को (सीमा स्थितियों के माध्यम से) लंबाई 2N तक बढ़ाया जाता है और N/2 द्वारा बाईं ओर वापस स्थानांतरित कर दिया जाता है। व्युत्क्रम DCT-IV केवल इनपुट वापस देगा (−c<sub>''R''</sub>-डी, ए-बी<sub>''R''</sub>) उपर से। जब इसे सीमा शर्तों के माध्यम से बढ़ाया जाता है और स्थानांतरित किया जाता है, तो एक प्राप्त होता है:
इसी तरह, ऊपर दिया गया IMडीसीटी सूत्र डीसीटी-IV (जो इसका अपना प्रतिलोम है) का ठीक 1/2 है, जहां आउटपुट को (सीमा स्थितियों के माध्यम से) लंबाई 2N तक बढ़ाया जाता है और N/2 द्वारा बाईं ओर वापस स्थानांतरित कर दिया जाता है। व्युत्क्रम डीसीटी-IV केवल इनपुट वापस देगा (−c<sub>''R''</sub>-डी, ए-बी<sub>''R''</sub>) उपर से। जब इसे सीमा शर्तों के माध्यम से बढ़ाया जाता है और स्थानांतरित किया जाता है, तो एक प्राप्त होता है:


:IMDCT (MDCT (a, b, c, d)) = (a−b<sub>''R''</sub>, बी-ए<sub>''R''</sub>, सी + डी<sub>''R''</sub>, डी + सी<sub>''R''</sub>)/ 2.
:IMडीसीटी (Mडीसीटी (a, b, c, d)) = (a−b<sub>''R''</sub>, बी-ए<sub>''R''</sub>, सी + डी<sub>''R''</sub>, डी + सी<sub>''R''</sub>)/ 2.


IMDCT आउटपुट का आधा इस प्रकार बेमानी है, जैसा कि b−a<sub>''R''</sub> = -(ए−बी<sub>''R''</sub>)<sub>''R''</sub>, और इसी तरह पिछले दो शब्दों के लिए। यदि हम इनपुट को N आकार के बड़े ब्लॉक A,B में समूहित करते हैं, जहाँ A = (a, b) और B = (c, d), हम इस परिणाम को सरल तरीके से लिख सकते हैं:
IMडीसीटी आउटपुट का आधा इस प्रकार बेमानी है, जैसा कि b−a<sub>''R''</sub> = -(ए−बी<sub>''R''</sub>)<sub>''R''</sub>, और इसी तरह पिछले दो शब्दों के लिए। यदि हम इनपुट को N आकार के बड़े ब्लॉक A,B में समूहित करते हैं, जहाँ A = (a, b) और B = (c, d), हम इस परिणाम को सरल तरीके से लिख सकते हैं:


:IMDCT (MDCT (A, B)) = (A−A<sub>''R''</sub>, बी + बी<sub>''R''</sub>)/ 2
:IMडीसीटी (Mडीसीटी (A, B)) = (A−A<sub>''R''</sub>, बी + बी<sub>''R''</sub>)/ 2


अब कोई भी समझ सकता है कि टीडीएसी कैसे काम करता है। मान लीजिए कि कोई बाद के एमडीसीटी की गणना करता है, 50% ओवरलैप, 2 एन ब्लॉक (बी, सी)। इसके बाद IMDCT उपरोक्त के अनुरूप परिणाम देगा: (B−B<sub>''R''</sub>, सी + सी<sub>''R''</sub>) / 2. जब इसे पिछले IMDCT परिणाम के साथ ओवरलैपिंग आधे में जोड़ा जाता है, तो उलटी शर्तें रद्द हो जाती हैं और मूल डेटा को पुनर्प्राप्त करते हुए केवल B प्राप्त होता है।
अब कोई भी समझ सकता है कि टीडीएसी कैसे काम करता है। मान लीजिए कि कोई बाद के एमडीसीटी की गणना करता है, 50% ओवरलैप, 2 एन ब्लॉक (बी, सी)। इसके बाद IMडीसीटी उपरोक्त के अनुरूप परिणाम देगा: (B−B<sub>''R''</sub>, सी + सी<sub>''R''</sub>) / 2. जब इसे पिछले IMडीसीटी परिणाम के साथ ओवरलैपिंग आधे में जोड़ा जाता है, तो उलटी शर्तें रद्द हो जाती हैं और मूल डेटा को पुनर्प्राप्त करते हुए केवल B प्राप्त होता है।


=== टीडीएसी की उत्पत्ति ===
=== टीडीएसी की उत्पत्ति ===


टाइम-डोमेन [[अलियासिंग]] रद्दीकरण शब्द की उत्पत्ति अब स्पष्ट है। तार्किक DCT-IV की सीमाओं से परे विस्तार करने वाले इनपुट डेटा का उपयोग डेटा को उसी तरह से अलियास करने का कारण बनता है जैसे कि Nyquist फ़्रीक्वेंसी से परे फ़्रीक्वेंसी कम फ़्रीक्वेंसी के लिए एलियासिंग कर रहे हैं, सिवाय इसके कि यह अलियासिंग टाइम डोमेन के बजाय समय डोमेन में होता है। फ़्रीक्वेंसी डोमेन: हम के योगदान को अलग नहीं कर सकते
टाइम-डोमेन [[अलियासिंग]] रद्दीकरण शब्द की उत्पत्ति अब स्पष्ट है। तार्किक डीसीटी-IV की सीमाओं से परे विस्तार करने वाले इनपुट डेटा का उपयोग डेटा को उसी तरह से अलियास करने का कारण बनता है जैसे कि Nyquist फ़्रीक्वेंसी से परे फ़्रीक्वेंसी कम फ़्रीक्वेंसी के लिए एलियासिंग कर रहे हैं, सिवाय इसके कि यह अलियासिंग टाइम डोमेन के बजाय समय डोमेन में होता है। फ़्रीक्वेंसी डोमेन: हम के योगदान को अलग नहीं कर सकते
ए और बी का<sub>''R''</sub> (ए, बी, सी, डी) के एमडीसीटी या समकक्ष के लिए
ए और बी का<sub>''R''</sub> (ए, बी, सी, डी) के एमडीसीटी या समकक्ष के लिए
का परिणाम
का परिणाम
:IMDCT (MDCT (a, b, c, d)) = (a−b<sub>''R''</sub>, बी-ए<sub>''R''</sub>, सी + डी<sub>''R''</sub>, डी + सी<sub>''R''</sub>) / 2.
:IMडीसीटी (Mडीसीटी (a, b, c, d)) = (a−b<sub>''R''</sub>, बी-ए<sub>''R''</sub>, सी + डी<sub>''R''</sub>, डी + सी<sub>''R''</sub>) / 2.
संयोजन सी-डी<sub>''R''</sub> और इसी तरह, जोड़े जाने पर संयोजनों को रद्द करने के लिए सटीक रूप से सही संकेत होते हैं।
संयोजन सी-डी<sub>''R''</sub> और इसी तरह, जोड़े जाने पर संयोजनों को रद्द करने के लिए सटीक रूप से सही संकेत होते हैं।


विषम ''N'' के लिए (जो शायद ही कभी व्यवहार में उपयोग किया जाता है), ''N''/2 एक पूर्णांक नहीं है इसलिए MDCT केवल DCT-IV का शिफ्ट क्रमचय नहीं है। इस मामले में, आधे नमूने द्वारा अतिरिक्त बदलाव का मतलब है कि MDCT/IMDCT DCT-III/II के बराबर हो जाता है, और विश्लेषण ऊपर के अनुरूप है।
विषम ''N'' के लिए (जो शायद ही कभी व्यवहार में उपयोग किया जाता है), ''N''/2 एक पूर्णांक नहीं है इसलिए Mडीसीटी केवल डीसीटी-IV का शिफ्ट क्रमचय नहीं है। इस मामले में, आधे नमूने द्वारा अतिरिक्त बदलाव का मतलब है कि Mडीसीटी/IMडीसीटी डीसीटी-III/II के बराबर हो जाता है, और विश्लेषण ऊपर के अनुरूप है।


=== चिकनाई और असंततता ===
=== चिकनाई और असंततता ===


हमने ऊपर देखा है कि 2N इनपुट का MDCT (a, b,
हमने ऊपर देखा है कि 2N इनपुट का Mडीसीटी (a, b,
c, d) N इनपुट के DCT-IV के बराबर है
c, d) N इनपुट के डीसीटी-IV के बराबर है
(-सी<sub>''R''</sub>−d,
(-सी<sub>''R''</sub>−d,
एक-बी<sub>''R''</sub>).
एक-बी<sub>''R''</sub>).
DCT-IV को इसके लिए डिज़ाइन किया गया है
डीसीटी-IV को इसके लिए डिज़ाइन किया गया है
मामला जहां सही सीमा पर कार्य विषम है, और इसलिए
मामला जहां सही सीमा पर कार्य विषम है, और इसलिए
सही सीमा के पास के मान 0 के करीब हैं। यदि इनपुट सिग्नल सुचारू है,
सही सीमा के पास के मान 0 के करीब हैं। यदि इनपुट सिग्नल सुचारू है,
Line 107: Line 107:
=== विंडो एमडीसीटी === के लिए टीडीएसी
=== विंडो एमडीसीटी === के लिए टीडीएसी


ऊपर, TDAC संपत्ति सामान्य MDCT के लिए सिद्ध हुई थी, यह दिखाते हुए कि बाद के ब्लॉकों के IMDCTs को उनके अतिव्यापी आधे हिस्से में जोड़ने से मूल डेटा ठीक हो जाता है। विंडो वाले MDCT के लिए इस उलटे गुण की व्युत्पत्ति केवल थोड़ी अधिक जटिल है।
ऊपर, TDAC संपत्ति सामान्य Mडीसीटी के लिए सिद्ध हुई थी, यह दिखाते हुए कि बाद के ब्लॉकों के IMडीसीटीs को उनके अतिव्यापी आधे हिस्से में जोड़ने से मूल डेटा ठीक हो जाता है। विंडो वाले Mडीसीटी के लिए इस उलटे गुण की व्युत्पत्ति केवल थोड़ी अधिक जटिल है।


आकार एन के ब्लॉक ए, बी, सी के लिए 2 एन इनपुट (ए, बी) और (बी, सी) के लगातार सेट ओवरलैप करने पर विचार करें।
आकार एन के ब्लॉक ए, बी, सी के लिए 2 एन इनपुट (ए, बी) और (बी, सी) के लगातार सेट ओवरलैप करने पर विचार करें।
ऊपर से याद करें कि कब <math>(A,B)</math> और <math>(B,C)</math> MDCTed, IMDCTed हैं, और उनके अतिव्यापी आधे हिस्से में जोड़े गए हैं, हम प्राप्त करते हैं <math>(B+B_R) / 2 + (B-B_R) / 2 = B</math>, मूल डेटा।
ऊपर से याद करें कि कब <math>(A,B)</math> और <math>(B,C)</math> Mडीसीटीed, IMडीसीटीed हैं, और उनके अतिव्यापी आधे हिस्से में जोड़े गए हैं, हम प्राप्त करते हैं <math>(B+B_R) / 2 + (B-B_R) / 2 = B</math>, मूल डेटा।


अब हम मानते हैं कि हम MDCT इनपुट और IMDCT आउटपुट दोनों को 2N लंबाई के विंडो फ़ंक्शन से गुणा करते हैं। ऊपर के रूप में, हम एक सममित विंडो फ़ंक्शन मानते हैं, जो कि फॉर्म का है <math>(W,W_R)</math> जहां W लंबाई-N वेक्टर है और R पहले की तरह उत्क्रमण को दर्शाता है। तब प्रिंसेन-ब्रैडली स्थिति को इस रूप में लिखा जा सकता है <math>W^2 + W_R^2 = (1,1,\ldots)</math>, वर्गों और परिवर्धन के साथ तत्ववार प्रदर्शन किया।
अब हम मानते हैं कि हम Mडीसीटी इनपुट और IMडीसीटी आउटपुट दोनों को 2N लंबाई के विंडो फ़ंक्शन से गुणा करते हैं। ऊपर के रूप में, हम एक सममित विंडो फ़ंक्शन मानते हैं, जो कि फॉर्म का है <math>(W,W_R)</math> जहां W लंबाई-N वेक्टर है और R पहले की तरह उत्क्रमण को दर्शाता है। तब प्रिंसेन-ब्रैडली स्थिति को इस रूप में लिखा जा सकता है <math>W^2 + W_R^2 = (1,1,\ldots)</math>, वर्गों और परिवर्धन के साथ तत्ववार प्रदर्शन किया।


इसलिए, MDCTing के बजाय <math>(A,B)</math>, अब हम एमडीसीटी <math>(WA,W_R B)</math> (सभी गुणाओं के साथ तत्ववार प्रदर्शन किया गया)। जब इसे IMDCTed किया जाता है और विंडो फ़ंक्शन द्वारा फिर से गुणा (तत्ववार) किया जाता है, तो अंतिम-एन आधा बन जाता है:
इसलिए, Mडीसीटीing के बजाय <math>(A,B)</math>, अब हम एमडीसीटी <math>(WA,W_R B)</math> (सभी गुणाओं के साथ तत्ववार प्रदर्शन किया गया)। जब इसे IMडीसीटीed किया जाता है और विंडो फ़ंक्शन द्वारा फिर से गुणा (तत्ववार) किया जाता है, तो अंतिम-एन आधा बन जाता है:
:<math>W_R \cdot (W_R B+(W_R B)_R) =W_R \cdot (W_R B+W B_R) = W_R^2 B+WW_R B_R</math>.
:<math>W_R \cdot (W_R B+(W_R B)_R) =W_R \cdot (W_R B+W B_R) = W_R^2 B+WW_R B_R</math>.
(ध्यान दें कि अब हमारे पास 1/2 से गुणा नहीं है, क्योंकि विंडो वाले मामले में IMDCT सामान्यीकरण 2 के कारक से भिन्न होता है।)
(ध्यान दें कि अब हमारे पास 1/2 से गुणा नहीं है, क्योंकि विंडो वाले मामले में IMडीसीटी सामान्यीकरण 2 के कारक से भिन्न होता है।)


इसी तरह, विंडो एमडीसीटी और आईएमडीसीटी की <math>(B,C)</math> पैदावार, इसकी पहली-एन छमाही में:
इसी तरह, विंडो एमडीसीटी और आईएमडीसीटी की <math>(B,C)</math> पैदावार, इसकी पहली-एन छमाही में:
Line 144: Line 144:
* For algorithms, see examples:
* For algorithms, see examples:
** Chi-Min Liu and Wen-Chieh Lee, "[http://wenchiehlee1020.googlepages.com/AES-paper-vol.47.PDF A unified fast algorithm for cosine modulated filterbanks in current audio standards]{{dead link|date=February 2018 |bot=InternetArchiveBot |fix-attempted=yes }}", ''J. Audio Engineering'' '''47''' (12), 1061-1075 (1999).
** Chi-Min Liu and Wen-Chieh Lee, "[http://wenchiehlee1020.googlepages.com/AES-paper-vol.47.PDF A unified fast algorithm for cosine modulated filterbanks in current audio standards]{{dead link|date=February 2018 |bot=InternetArchiveBot |fix-attempted=yes }}", ''J. Audio Engineering'' '''47''' (12), 1061-1075 (1999).
** V. Britanak and K. R. Rao, "A new fast algorithm for the unified forward and inverse MDCT/MDST computation," ''Signal Processing'' '''82''', 433-459 (2002)
** V. Britanak and K. R. Rao, "A new fast algorithm for the unified forward and inverse Mडीसीटी/MDST computation," ''Signal Processing'' '''82''', 433-459 (2002)
** Vladimir Nikolajevic and Gerhard Fettweis, "Computation of forward and inverse MDCT using Clenshaw's recurrence formula," ''IEEE Trans. Sig. Proc.'' '''51''' (5), 1439-1444 (2003)
** Vladimir Nikolajevic and Gerhard Fettweis, "Computation of forward and inverse Mडीसीटी using Clenshaw's recurrence formula," ''IEEE Trans. Sig. Proc.'' '''51''' (5), 1439-1444 (2003)
** Che-Hong Chen, Bin-Da Liu, and Jar-Ferr Yang, "Recursive architectures for realizing modified discrete cosine transform and its inverse," ''IEEE Trans. Circuits Syst. II: Analog Dig. Sig. Proc.'' '''50''' (1), 38-45 (2003)
** Che-Hong Chen, Bin-Da Liu, and Jar-Ferr Yang, "Recursive architectures for realizing modified discrete cosine transform and its inverse," ''IEEE Trans. Circuits Syst. II: Analog Dig. Sig. Proc.'' '''50''' (1), 38-45 (2003)
** J.S. Wu, H.Z. Shu, L. Senhadji, and L.M. Luo, "Mixed-radix algorithm for the computation of forward and inverse MDCTs," ''IEEE Trans. Circuits Syst. I: Reg. Papers'' '''56''' (4), 784-794 (2009)
** J.S. Wu, H.Z. Shu, L. Senhadji, and L.M. Luo, "Mixed-radix algorithm for the computation of forward and inverse Mडीसीटीs," ''IEEE Trans. Circuits Syst. I: Reg. Papers'' '''56''' (4), 784-794 (2009)
** V. Britanak, "A survey of efficient MDCT implementations in MP3 audio coding standard: retrospective and state-of-the-art," ''Signal. Process.'' '''91''' (4), 624-672(2011)
** V. Britanak, "A survey of efficient Mडीसीटी implementations in MP3 audio coding standard: retrospective and state-of-the-art," ''Signal. Process.'' '''91''' (4), 624-672(2011)


{{Compression Methods}}
{{Compression Methods}}

Revision as of 08:28, 18 May 2023

संशोधित असतत कोसाइन परिवर्तन (एमडीसीटी) टाइप-IV असतत कोसाइन परिवर्तन (डीसीटी-IV) पर आधारित एक परिवर्तन है। लैप्ड ट्रांसफॉर्म होने की अतिरिक्त गुण के साथ: इसे एक बड़े डाटासेट के निरंतर ब्लॉक पर निष्पादित करने के लिए यह प्रारूपित किया गया है। जहाँ बाद के ब्लॉकों को ओवरलैप किया जाता है। जिससे एक ब्लॉक का अंतिम आधा अगले ब्लॉक के पहले भाग के साथ मिलान करता है। यह ओवरलैपिंग डीसीटी के ऊर्जा-संघनन गुणों के अतिरिक्त एमडीसीटी को सिग्नल संपीड़न अनुप्रयोगों के लिए विशेष रूप से आकर्षक बनाता है क्योंकि यह ब्लॉक सीमाओं से उत्पन्न संपीड़न विरूपण साक्ष्य से बचने में सहायता करता है। इन लाभ के परिणामस्वरूप एमडीसीटी ऑडियो डेटा संपीड़न में सबसे व्यापक रूप से उपयोग की जाने वाली हानिपूर्ण संपीड़न विधि है। यह एमपी3, डॉल्बी डिजिटल (एसी-3), वॉर्बिस (ओजीजी), विंडोज मीडिया ऑडियो (डब्लूएमए), एटीआऱसी, कुक कोडेक, उन्नत ऑडियो कोडिंग (एएसी), हाई-डेफिनिशन कोडिंग (एचडीसी),[1] एलडीएसी (कोडेक), डॉल्बी एसी-4,[2] और एमपीईजी-एच 3डी ऑडियो[3][4] सहित अधिकांश आधुनिक ऑडियो कोडिंग मानकों में निरंतर कार्यरत है। इनके साथ ही भाषण कोडिंग मानकों जैसे एएसी-एलडी (एलडी-एमडीसीटी),[5] जी.722.1,[6] जी.729.1,[7] सीईएलटी[8] और ओपस (ऑडियो प्रारूप) आदि का भी प्रयोग किया जाता है्।[9][10]

असतत कोज्या रूपांतरण (डीसीटी) पहली बार 1972 में एन. अहमद द्वारा प्रस्तावित किया गया था[11] और 1974 में टी. नटराजन और के.आर. राव के साथ अहमद द्वारा प्रस्तुत किया गया।[12] एमडीसीटी को बाद में जॉन पी. प्रिंसन, ए.डब्ल्यू. द्वारा प्रस्तावित किया गया था। 1987 में सरे विश्वविद्यालय में जॉनसन और एलन बी. ब्राडली,[13] प्रिंसेन और ब्रैडली (1986) द्वारा पहले कार्य के बाद[14] एमडीसीटी के टाइम-डोमेन अलियासिंग कैन्सिलेशन (टीडीएसी) के अंतर्निहित सिद्धांत को विकसित करने के लिए नीचे वर्णित किया गया है। (विभिन्न प्रकार के डीसीटी या डीसीटी/डीएसटी संयोजनों के आधार पर विभिन्न प्रकार के साइन ट्रांसफॉर्म के साथ-साथ अन्य, संभवतः ही कभी प्रयोग किए जाने वाले एमडीसीटी के रूपों के आधार पर एक अनुरूप परिवर्तन, एमडीएसटी भी उपस्थित है।)

एमपी3 में, एमडीसीटी सीधे ऑडियो सिग्नल पर संचालित नहीं होता है। बल्कि 32-बैंड पॉलीफ़ेज़ क्वाडरेचर फ़िल्टर (पीक्यूएफ) बैंक के आउटपुट पर संचालित होता है। पीक्यूएफ फ़िल्टर बैंक के विशिष्ट अलियासिंग को कम करने के लिए इस एमडीसीटी के आउटपुट को उपनाम रिडक्शन सूत्र द्वारा पोस्टप्रोसेस किया जाता है। एमडीसीटी के साथ फ़िल्टर बैंक के इस प्रकार के संयोजन को हाइब्रिड फ़िल्टर बैंक या सबबैंड एमडीसीटी कहा जाता है। दूसरी ओर एएसी सामान्य रूप से एक शुद्ध एमडीसीटी का उपयोग करता है। केवल (संभवतः ही कभी प्रयोग किया जाने वाला) एमपीईजी-4 एएसी-एसएसआर संस्करण (सोनी द्वारा) एमडीसीटी के बाद चार-बैंड पीक्यूएफ बैंक का उपयोग करता है। एमपी3 के समान, एटीआरएसी एक एमडीसीटी के बाद स्टैक्ड चतुर्भुज दर्पण फिल्टर (क्यूएमएफ) का उपयोग किया जाता है।

परिभाषा

लैप्ड ट्रांसफ़ॉर्म के रूप में, Mडीसीटी अन्य फूरियर-संबंधित ट्रांसफ़ॉर्म की तुलना में थोड़ा असामान्य है, जिसमें इनपुट के रूप में आधे आउटपुट हैं (समान संख्या के बजाय)। विशेष रूप से, यह एक रैखिक कार्य है (जहाँ R वास्तविक संख्याओं के समुच्चय को दर्शाता है)। 2N वास्तविक संख्या x0, ..., एक्स2N-1 एन वास्तविक संख्या एक्स में परिवर्तित हो जाते हैं0, ..., एक्सN-1 सूत्र के अनुसार:

(इस परिवर्तन के सामने सामान्यीकरण गुणांक, यहाँ एकता, एक मनमाना सम्मेलन है और उपचारों के बीच भिन्न है। केवल Mडीसीटी और IMडीसीटी के सामान्यीकरण का उत्पाद, नीचे, विवश है।)

उलटा परिवर्तन

व्युत्क्रम Mडीसीटी को IMडीसीटी के रूप में जाना जाता है। क्योंकि इनपुट और आउटपुट की अलग-अलग संख्याएँ हैं, पहली नज़र में ऐसा लग सकता है कि Mडीसीटी उलटा नहीं होना चाहिए। हालाँकि, बाद के ओवरलैपिंग ब्लॉकों के ओवरलैप किए गए IMडीसीटीs को 'जोड़' द्वारा पूर्ण अपवर्तनीयता प्राप्त की जाती है, जिससे त्रुटियाँ 'रद्द' हो जाती हैं और मूल डेटा को पुनः प्राप्त किया जा सकता है; इस तकनीक को 'टाइम-डोमेन अलियासिंग कैंसलेशन' (TDAC) के रूप में जाना जाता है।

आईएमडीसीटी एन वास्तविक संख्या एक्स को रूपांतरित करता है0, ..., एक्सN-1 2N वास्तविक संख्या y में0, ..., और2N-1 सूत्र के अनुसार:

(जैसे Discrete_cosine_transform#डीसीटी-IV|डीसीटी-IV, एक ओर्थोगोनल रूपांतरण के लिए, व्युत्क्रम का वही रूप है जो आगे के रूपांतरण का है।)

सामान्य विंडो सामान्यीकरण (नीचे देखें) के साथ एक विंडो एमडीसीटी के मामले में, आईएमडीसीटी के सामने सामान्यीकरण गुणांक को 2 से गुणा किया जाना चाहिए (अर्थात, 2/एन बनना)।

गणना

हालांकि Mडीसीटी फॉर्मूले के सीधे आवेदन के लिए O(N2) ऑपरेशंस, फास्ट फूरियर ट्रांसफॉर्म (एफएफटी) के रूप में गणना को पुनरावर्ती रूप से कारक बनाकर केवल ओ (एन लॉग एन) जटिलता के साथ एक ही चीज़ की गणना करना संभव है। कोई अन्य रूपांतरणों के माध्यम से Mडीसीटीs की गणना भी कर सकता है, आमतौर पर एक DFT (FFT) या डीसीटी, O(N) पूर्व और बाद के प्रसंस्करण चरणों के साथ। इसके अतिरिक्त, जैसा कि नीचे बताया गया है, डीसीटी-IV के लिए कोई भी एल्गोरिथम समान आकार के Mडीसीटी और IMडीसीटी की गणना करने के लिए तुरंत एक विधि प्रदान करता है।

विंडो फ़ंक्शंस

Mडीसीटी विंडो फ़ंक्शंस:
नीला: कोसाइन, लाल: साइन-कोसाइन, हरा: संशोधित कैसर-बेसेल

विशिष्ट सिग्नल-संपीड़न अनुप्रयोगों में, खिड़की समारोह w का उपयोग करके रूपांतरण गुणों को और बेहतर बनाया जाता हैn (n = 0, ..., 2N−1) जिसे x से गुणा किया जाता हैn और वाईn उपरोक्त एमडीसीटी और आईएमडीसीटी सूत्रों में, एन = 0 और 2एन सीमाओं पर असंतुलन से बचने के लिए फ़ंक्शन को उन बिंदुओं पर सुचारू रूप से शून्य पर ले जाने के लिए। (अर्थात, हम डेटा को Mडीसीटी से पहले और IMडीसीटी के बाद विंडो करते हैं।) सिद्धांत रूप में, x और y में अलग-अलग विंडो फ़ंक्शन हो सकते हैं, और विंडो फ़ंक्शन भी एक ब्लॉक से अगले ब्लॉक में बदल सकता है (विशेष रूप से उस मामले में जहां डेटा ब्लॉक होता है) विभिन्न आकारों के संयुक्त होते हैं), लेकिन सादगी के लिए हम समान आकार के ब्लॉकों के लिए समान विंडो फ़ंक्शंस के सामान्य मामले पर विचार करते हैं।

एक सममित विंडो डब्ल्यू के लिए परिवर्तन उलटा रहता है (यानी, टीडीएसी काम करता है)।n = डब्ल्यू2N−1−n, जब तक w प्रिंसेन-ब्रैडली शर्त को संतुष्ट करता है:

.

विभिन्न विंडो फ़ंक्शंस का उपयोग किया जाता है। एक विंडो जो मॉड्युलेटेड लैप्ड ट्रांसफ़ॉर्म (MLT) के रूप में जाना जाने वाला फ़ॉर्म उत्पन्न करती है[15][16] द्वारा दिया गया है

और MP3 और MPEG-2 AAC के लिए प्रयोग किया जाता है, और

वोरबिस के लिए। AC-3 कैसर-बेसेल व्युत्पन्न (KBD) विंडो का उपयोग करता है, और MPEG-4 AAC भी KBD विंडो का उपयोग कर सकता है।

ध्यान दें कि Mडीसीटी पर संचालित विंडो कुछ अन्य प्रकार के सिग्नल विश्लेषण के लिए उपयोग की जाने वाली विंडो से अलग हैं, क्योंकि उन्हें प्रिंसन-ब्रैडली शर्त को पूरा करना होगा। इस अंतर के कारणों में से एक यह है कि Mडीसीटी विंडो को Mडीसीटी (विश्लेषण) और IMडीसीटी (संश्लेषण) दोनों के लिए दो बार संचालित किया जाता है।

डीसीटी-IV से संबंध और TDAC की उत्पत्ति

जैसा कि परिभाषाओं के निरीक्षण से देखा जा सकता है, यहां तक ​​कि N के लिए भी Mडीसीटी अनिवार्य रूप से डीसीटी-IV के समतुल्य है, जहां इनपुट को N/2 और दो N-ब्लॉक द्वारा स्थानांतरित किया जाता है डेटा का एक बार में रूपांतरण किया जाता है। इस समानता की अधिक सावधानी से जांच करके, टीडीएसी जैसे महत्वपूर्ण गुणों को आसानी से प्राप्त किया जा सकता है।

डीसीटी-IV से सटीक संबंध को परिभाषित करने के लिए, किसी को यह महसूस करना चाहिए कि डीसीटी-IV वैकल्पिक सम/विषम सीमा स्थितियों से मेल खाता है: यहां तक ​​​​कि इसकी बाईं सीमा पर भी (n = −1/2 के आसपास), विषम इसकी दाहिनी सीमा पर (लगभग n = N − 1/2), और इसी तरह (अलग-अलग फूरियर रूपांतरण के लिए आवधिक सीमाओं के बजाय)। यह पहचान से अनुसरण करता है और . इस प्रकार, यदि इसके इनपुट लंबाई N की एक सरणी x हैं, तो हम इस सरणी को (x, −x) तक विस्तारित करने की कल्पना कर सकते हैंR, -एक्स, एक्सR, ...) और इसी तरह, जहां xR एक्स को उल्टे क्रम में दर्शाता है।

2एन इनपुट और एन आउटपुट के साथ एक एमडीसीटी पर विचार करें, जहां हम इनपुट को चार ब्लॉक (ए, बी, सी, डी) में विभाजित करते हैं, जिनमें से प्रत्येक का आकार एन/2 है। यदि हम इन्हें N/2 (Mडीसीटी परिभाषा में +N/2 शब्द से) द्वारा दाईं ओर स्थानांतरित करते हैं, तो (b, c, d) N डीसीटी-IV इनपुट के अंत से आगे बढ़ते हैं, इसलिए हमें उन्हें मोड़ना चाहिए ऊपर वर्णित सीमा शर्तों के अनुसार वापस।

इस प्रकार, 2N इनपुट का Mडीसीटी (a, b, c, d) N इनपुट के डीसीटी-IV के बिल्कुल बराबर है: (−cR-डी, ए-बीR), जहां आर ऊपर के रूप में उत्क्रमण को दर्शाता है।

(इस तरह, डीसीटी-IV की गणना करने के लिए किसी भी एल्गोरिथ्म को मामूली रूप से Mडीसीटी पर संचालित किया जा सकता है।)

इसी तरह, ऊपर दिया गया IMडीसीटी सूत्र डीसीटी-IV (जो इसका अपना प्रतिलोम है) का ठीक 1/2 है, जहां आउटपुट को (सीमा स्थितियों के माध्यम से) लंबाई 2N तक बढ़ाया जाता है और N/2 द्वारा बाईं ओर वापस स्थानांतरित कर दिया जाता है। व्युत्क्रम डीसीटी-IV केवल इनपुट वापस देगा (−cR-डी, ए-बीR) उपर से। जब इसे सीमा शर्तों के माध्यम से बढ़ाया जाता है और स्थानांतरित किया जाता है, तो एक प्राप्त होता है:

IMडीसीटी (Mडीसीटी (a, b, c, d)) = (a−bR, बी-एR, सी + डीR, डी + सीR)/ 2.

IMडीसीटी आउटपुट का आधा इस प्रकार बेमानी है, जैसा कि b−aR = -(ए−बीR)R, और इसी तरह पिछले दो शब्दों के लिए। यदि हम इनपुट को N आकार के बड़े ब्लॉक A,B में समूहित करते हैं, जहाँ A = (a, b) और B = (c, d), हम इस परिणाम को सरल तरीके से लिख सकते हैं:

IMडीसीटी (Mडीसीटी (A, B)) = (A−AR, बी + बीR)/ 2

अब कोई भी समझ सकता है कि टीडीएसी कैसे काम करता है। मान लीजिए कि कोई बाद के एमडीसीटी की गणना करता है, 50% ओवरलैप, 2 एन ब्लॉक (बी, सी)। इसके बाद IMडीसीटी उपरोक्त के अनुरूप परिणाम देगा: (B−BR, सी + सीR) / 2. जब इसे पिछले IMडीसीटी परिणाम के साथ ओवरलैपिंग आधे में जोड़ा जाता है, तो उलटी शर्तें रद्द हो जाती हैं और मूल डेटा को पुनर्प्राप्त करते हुए केवल B प्राप्त होता है।

टीडीएसी की उत्पत्ति

टाइम-डोमेन अलियासिंग रद्दीकरण शब्द की उत्पत्ति अब स्पष्ट है। तार्किक डीसीटी-IV की सीमाओं से परे विस्तार करने वाले इनपुट डेटा का उपयोग डेटा को उसी तरह से अलियास करने का कारण बनता है जैसे कि Nyquist फ़्रीक्वेंसी से परे फ़्रीक्वेंसी कम फ़्रीक्वेंसी के लिए एलियासिंग कर रहे हैं, सिवाय इसके कि यह अलियासिंग टाइम डोमेन के बजाय समय डोमेन में होता है। फ़्रीक्वेंसी डोमेन: हम के योगदान को अलग नहीं कर सकते ए और बी काR (ए, बी, सी, डी) के एमडीसीटी या समकक्ष के लिए का परिणाम

IMडीसीटी (Mडीसीटी (a, b, c, d)) = (a−bR, बी-एR, सी + डीR, डी + सीR) / 2.

संयोजन सी-डीR और इसी तरह, जोड़े जाने पर संयोजनों को रद्द करने के लिए सटीक रूप से सही संकेत होते हैं।

विषम N के लिए (जो शायद ही कभी व्यवहार में उपयोग किया जाता है), N/2 एक पूर्णांक नहीं है इसलिए Mडीसीटी केवल डीसीटी-IV का शिफ्ट क्रमचय नहीं है। इस मामले में, आधे नमूने द्वारा अतिरिक्त बदलाव का मतलब है कि Mडीसीटी/IMडीसीटी डीसीटी-III/II के बराबर हो जाता है, और विश्लेषण ऊपर के अनुरूप है।

चिकनाई और असंततता

हमने ऊपर देखा है कि 2N इनपुट का Mडीसीटी (a, b, c, d) N इनपुट के डीसीटी-IV के बराबर है (-सीR−d, एक-बीR). डीसीटी-IV को इसके लिए डिज़ाइन किया गया है मामला जहां सही सीमा पर कार्य विषम है, और इसलिए सही सीमा के पास के मान 0 के करीब हैं। यदि इनपुट सिग्नल सुचारू है, यह मामला है: ए और बी के सबसे दाहिने घटकR हैं इनपुट अनुक्रम में लगातार (ए, बी, सी, डी), और इसलिए उनका अंतर छोटा है। आइए अंतराल के मध्य को देखें: अगर हम उपरोक्त अभिव्यक्ति को फिर से लिखते हैं (-सीR−d, एक-बीR) = (-डी, ए) - (बी, सी)R, दूसरा कार्यकाल, (बी, सी)R, चिकना देता है बीच में संक्रमण। हालाँकि, पहले पद में, (−d, a), एक है संभावित विच्छेदन जहां का सही अंत −d, a के बाएँ सिरे से मिलता है। विंडो फ़ंक्शन का उपयोग करने का यही कारण है जो घटकों को कम करता है इनपुट अनुक्रम की सीमाओं के पास (ए, बी, सी, डी) 0 की ओर।

=== विंडो एमडीसीटी === के लिए टीडीएसी

ऊपर, TDAC संपत्ति सामान्य Mडीसीटी के लिए सिद्ध हुई थी, यह दिखाते हुए कि बाद के ब्लॉकों के IMडीसीटीs को उनके अतिव्यापी आधे हिस्से में जोड़ने से मूल डेटा ठीक हो जाता है। विंडो वाले Mडीसीटी के लिए इस उलटे गुण की व्युत्पत्ति केवल थोड़ी अधिक जटिल है।

आकार एन के ब्लॉक ए, बी, सी के लिए 2 एन इनपुट (ए, बी) और (बी, सी) के लगातार सेट ओवरलैप करने पर विचार करें। ऊपर से याद करें कि कब और Mडीसीटीed, IMडीसीटीed हैं, और उनके अतिव्यापी आधे हिस्से में जोड़े गए हैं, हम प्राप्त करते हैं , मूल डेटा।

अब हम मानते हैं कि हम Mडीसीटी इनपुट और IMडीसीटी आउटपुट दोनों को 2N लंबाई के विंडो फ़ंक्शन से गुणा करते हैं। ऊपर के रूप में, हम एक सममित विंडो फ़ंक्शन मानते हैं, जो कि फॉर्म का है जहां W लंबाई-N वेक्टर है और R पहले की तरह उत्क्रमण को दर्शाता है। तब प्रिंसेन-ब्रैडली स्थिति को इस रूप में लिखा जा सकता है , वर्गों और परिवर्धन के साथ तत्ववार प्रदर्शन किया।

इसलिए, Mडीसीटीing के बजाय , अब हम एमडीसीटी (सभी गुणाओं के साथ तत्ववार प्रदर्शन किया गया)। जब इसे IMडीसीटीed किया जाता है और विंडो फ़ंक्शन द्वारा फिर से गुणा (तत्ववार) किया जाता है, तो अंतिम-एन आधा बन जाता है:

.

(ध्यान दें कि अब हमारे पास 1/2 से गुणा नहीं है, क्योंकि विंडो वाले मामले में IMडीसीटी सामान्यीकरण 2 के कारक से भिन्न होता है।)

इसी तरह, विंडो एमडीसीटी और आईएमडीसीटी की पैदावार, इसकी पहली-एन छमाही में:

.

जब हम इन दो हिस्सों को एक साथ जोड़ते हैं, तो हम प्राप्त करते हैं:

मूल डेटा पुनर्प्राप्त करना।

यह भी देखें

संदर्भ

  1. Jones, Graham A.; Layer, David H.; Osenkowsky, Thomas G. (2013). National Association of Broadcasters Engineering Handbook: NAB Engineering Handbook. Taylor & Francis. pp. 558–9. ISBN 978-1-136-03410-7.
  2. "Dolby AC-4: Audio Delivery for Next-Generation Entertainment Services" (PDF). Dolby Laboratories. June 2015. Retrieved 11 November 2019.
  3. Luo, Fa-Long (2008). Mobile Multimedia Broadcasting Standards: Technology and Practice. Springer Science & Business Media. p. 590. ISBN 9780387782638.
  4. Bleidt, R. L.; Sen, D.; Niedermeier, A.; Czelhan, B.; Füg, S.; et al. (2017). "Development of the MPEG-H TV Audio System for ATSC 3.0" (PDF). IEEE Transactions on Broadcasting. 63 (1): 202–236. doi:10.1109/TBC.2017.2661258. S2CID 30821673.
  5. Schnell, Markus; Schmidt, Markus; Jander, Manuel; Albert, Tobias; Geiger, Ralf; Ruoppila, Vesa; Ekstrand, Per; Bernhard, Grill (October 2008). MPEG-4 Enhanced Low Delay AAC - A New Standard for High Quality Communication (PDF). 125th AES Convention. Fraunhofer IIS. Audio Engineering Society. Retrieved 20 October 2019.
  6. Lutzky, Manfred; Schuller, Gerald; Gayer, Marc; Krämer, Ulrich; Wabnik, Stefan (May 2004). ऑडियो कोडेक विलंब के लिए एक दिशानिर्देश (PDF). 116th AES Convention. Fraunhofer IIS. Audio Engineering Society. Retrieved 24 October 2019.
  7. Nagireddi, Sivannarayana (2008). वीओआईपी आवाज और फैक्स सिग्नल प्रोसेसिंग. John Wiley & Sons. p. 69. ISBN 9780470377864.
  8. Presentation of the CELT codec by Timothy B. Terriberry (65 minutes of video, see also presentation slides in PDF)
  9. "ओपस कोडेक". Opus (Home page). Xiph.org Foundation. Retrieved July 31, 2012.
  10. Bright, Peter (2012-09-12). "नया मानकीकृत ओपस ऑडियो कोडेक ऑनलाइन चैट से लेकर संगीत तक हर भूमिका को पूरा करता है". Ars Technica. Retrieved 2014-05-28.
  11. Ahmed, Nasir (January 1991). "मैं असतत कोसाइन परिवर्तन के साथ कैसे आया". Digital Signal Processing. 1 (1): 4–5. doi:10.1016/1051-2004(91)90086-Z.
  12. Ahmed, Nasir; Natarajan, T.; Rao, K. R. (January 1974), "Discrete Cosine Transform", IEEE Transactions on Computers, C-23 (1): 90–93, doi:10.1109/T-C.1974.223784, S2CID 149806273
  13. Princen, John P.; Johnson, A.W.; Bradley, Alan B. (1987). "Subband/Transform coding using filter bank designs based on time domain aliasing cancellation". ICASSP '87. IEEE International Conference on Acoustics, Speech, and Signal Processing. 12: 2161–2164. doi:10.1109/ICASSP.1987.1169405. S2CID 58446992.
  14. John P. Princen, Alan B. Bradley: Analysis/synthesis filter bank design based on time domain aliasing cancellation, IEEE Trans. Acoust. Speech Signal Processing, ASSP-34 (5), 1153–1161, 1986. Described a precursor to the MDCT using a combination of discrete cosine and sine transforms.
  15. H. S. Malvar, "Lapped Transforms for Efficient Transform/Subband Coding", IEEE Trans. on Acoustics, Speech, and Signal Processing, vol. 38, no. 6, pp. 969–978 (Equation 22), June 1990.
  16. H. S. Malvar, "Modulated QMF Filter Banks with Perfect Reconstruction", Electronics Letters, vol. 26, no. 13, pp. 906–907 (Equation 13), June 1990.


ग्रन्थसूची

  • Henrique S. Malvar, Signal Processing with Lapped Transforms (Artech House: Norwood MA, 1992).
  • A. W. Johnson and A. B. Bradley, "Adaptive transform coding incorporating time domain aliasing cancellation," Speech Comm. 6, 299-308 (1987).
  • For algorithms, see examples:
    • Chi-Min Liu and Wen-Chieh Lee, "A unified fast algorithm for cosine modulated filterbanks in current audio standards[permanent dead link]", J. Audio Engineering 47 (12), 1061-1075 (1999).
    • V. Britanak and K. R. Rao, "A new fast algorithm for the unified forward and inverse Mडीसीटी/MDST computation," Signal Processing 82, 433-459 (2002)
    • Vladimir Nikolajevic and Gerhard Fettweis, "Computation of forward and inverse Mडीसीटी using Clenshaw's recurrence formula," IEEE Trans. Sig. Proc. 51 (5), 1439-1444 (2003)
    • Che-Hong Chen, Bin-Da Liu, and Jar-Ferr Yang, "Recursive architectures for realizing modified discrete cosine transform and its inverse," IEEE Trans. Circuits Syst. II: Analog Dig. Sig. Proc. 50 (1), 38-45 (2003)
    • J.S. Wu, H.Z. Shu, L. Senhadji, and L.M. Luo, "Mixed-radix algorithm for the computation of forward and inverse Mडीसीटीs," IEEE Trans. Circuits Syst. I: Reg. Papers 56 (4), 784-794 (2009)
    • V. Britanak, "A survey of efficient Mडीसीटी implementations in MP3 audio coding standard: retrospective and state-of-the-art," Signal. Process. 91 (4), 624-672(2011)