संशोधित असतत कोसाइन परिवर्तन: Difference between revisions
No edit summary |
No edit summary |
||
(18 intermediate revisions by 3 users not shown) | |||
Line 1: | Line 1: | ||
{{Redirect|एमडीसीटी|[[मेडिकल इमेजिंग]] का रूप|मल्टीडिटेक्टर कंप्यूटेड टोमोग्राफी}} | {{Redirect|एमडीसीटी|[[मेडिकल इमेजिंग]] का रूप|मल्टीडिटेक्टर कंप्यूटेड टोमोग्राफी}} | ||
संशोधित | '''संशोधित असतत कोसाइन''' '''परिवर्तन''' (एमडीसीटी) टाइप-IV [[असतत कोसाइन परिवर्तन]] (डीसीटी-IV) पर आधारित एक परिवर्तन है। [[लैप्ड ट्रांसफॉर्म]] होने की अतिरिक्त गुण के साथ इसे एक बड़े [[ डाटासेट |डाटासेट]] के निरंतर ब्लॉक पर निष्पादित करने के लिए यह प्रारूपित किया गया है, जहाँ सबसीक्वेन्ट ब्लॉकों को ओवरलैप किया जाता है। जिससे एक ब्लॉक का अंतिम आधा अगले ब्लॉक के पहले भाग के साथ मिलान करता है। यह ओवरलैपिंग डीसीटी के ऊर्जा-संघनन गुणों के अतिरिक्त एमडीसीटी को सिग्नल संपीड़न अनुप्रयोगों के लिए विशेष रूप से आकर्षक बनाता है क्योंकि यह ब्लॉक सीमाओं से उत्पन्न [[संपीड़न विरूपण साक्ष्य]] से बचने में सहायता करता है। इन लाभ के परिणामस्वरूप एमडीसीटी [[ऑडियो डेटा संपीड़न]] में सबसे व्यापक रूप से उपयोग की जाने वाली [[हानिपूर्ण संपीड़न|लूजी कम्प्रेशन]] विधि है। यह [[MP3|एमपी3]], [[डॉल्बी डिजिटल]] (एसी-3), [[वॉर्बिस]](ओजीजी), [[विंडोज मीडिया ऑडियो]] (डब्लूएमए), [[ATRAC|एटीआऱसी]], [[कुक कोडेक]], [[ उन्नत ऑडियो कोडिंग |हाई ऑडियो कोडिंग]] (एएसी), [[हाई-डेफिनिशन कोडिंग]] (एचडीसी),<ref>{{cite book |last1=Jones |first1=Graham A. |last2=Layer |first2=David H. |last3=Osenkowsky |first3=Thomas G. |title=National Association of Broadcasters Engineering Handbook: NAB Engineering Handbook |date=2013 |publisher=[[Taylor & Francis]] |isbn=978-1-136-03410-7 |pages=558–9 |url=https://books.google.com/books?id=K9N1TVhf82YC&pg=PA558}}</ref> [[एलडीएसी (कोडेक)]], [[डॉल्बी एसी-4]],<ref>{{cite web |title=Dolby AC-4: Audio Delivery for Next-Generation Entertainment Services |url=https://www.dolby.com/us/en/technologies/ac-4/Next-Generation-Entertainment-Services.pdf |website=[[Dolby Laboratories]] |date=June 2015 |access-date=11 November 2019}}</ref> और [[एमपीईजी-एच 3डी ऑडियो]]<ref name="Luo">{{cite book |last1=Luo |first1=Fa-Long |title=Mobile Multimedia Broadcasting Standards: Technology and Practice |date=2008 |publisher=[[Springer Science & Business Media]] |isbn=9780387782638 |page=590 |url=https://books.google.com/books?id=l6PovWat8SMC&pg=PA590}}</ref><ref>{{cite journal |last1=Bleidt |first1=R. L. |last2=Sen |first2=D. |last3=Niedermeier |first3=A. |last4=Czelhan |first4=B. |last5=Füg |first5=S. |display-authors=etal |title=Development of the MPEG-H TV Audio System for ATSC 3.0 |journal=IEEE Transactions on Broadcasting |date=2017 |volume=63 |issue=1 |pages=202–236 |doi=10.1109/TBC.2017.2661258 |s2cid=30821673 |url=https://www.iis.fraunhofer.de/content/dam/iis/en/doc/ame/Conference-Paper/BleidtR-IEEE-2017-Development-of-MPEG-H-TV-Audio-System-for-ATSC-3-0.pdf}}</ref> सहित अधिकांश आधुनिक [[ऑडियो कोडिंग मानकों]] में निरंतर कार्यरत है। इनके साथ ही [[भाषण कोडिंग]] मानकों जैसे [[एएसी-एलडी]] (एलडी-एमडीसीटी),<ref>{{cite conference |last1=Schnell |first1=Markus |last2=Schmidt |first2=Markus |last3=Jander |first3=Manuel |last4=Albert |first4=Tobias |last5=Geiger |first5=Ralf |last6=Ruoppila |first6=Vesa |last7=Ekstrand |first7=Per |last8=Bernhard |first8=Grill |title=MPEG-4 Enhanced Low Delay AAC - A New Standard for High Quality Communication |conference=125th AES Convention |date=October 2008 |publisher=[[Audio Engineering Society]] |url=https://www.iis.fraunhofer.de/content/dam/iis/de/doc/ame/conference/AES-125-Convention_AAC-ELD-NewStandardForHighQualityCommunication_AES7503.pdf |website=[[Fraunhofer IIS]] |access-date=20 October 2019}}</ref> G.722.1,<ref>{{cite conference |last1=Lutzky |first1=Manfred |last2=Schuller |first2=Gerald |last3=Gayer |first3=Marc |last4=Krämer |first4=Ulrich |last5=Wabnik |first5=Stefan |title=ऑडियो कोडेक विलंब के लिए एक दिशानिर्देश|url=https://www.iis.fraunhofer.de/content/dam/iis/de/doc/ame/conference/AES-116-Convention_guideline-to-audio-codec-delay_AES116.pdf |website=[[Fraunhofer IIS]] |conference=116th AES Convention |publisher=[[Audio Engineering Society]] |date=May 2004 |access-date=24 October 2019}}</ref> G.729.1,<ref name="Nagireddi">{{cite book |last1=Nagireddi |first1=Sivannarayana |title=वीओआईपी आवाज और फैक्स सिग्नल प्रोसेसिंग|date=2008 |publisher=[[John Wiley & Sons]] |isbn=9780470377864 |page=69 |url=https://books.google.com/books?id=5AneeZFE71MC&pg=PA69}}</ref> सीईएलटी<ref name="presentation">[http://people.xiph.org/~greg/video/linux_conf_au_CELT_2.ogv Presentation of the CELT codec] by Timothy B. Terriberry (65 minutes of video, see also [http://www.celt-codec.org/presentations/misc/lca-celt.pdf presentation slides] in PDF)</ref> और ओपस (ऑडियो प्रारूप) आदि का भी प्रयोग किया जाता है्।<ref name="homepage">{{cite web |url=http://opus-codec.org/ |title=ओपस कोडेक|work=Opus |publisher=Xiph.org Foundation |type=Home page |access-date=July 31, 2012}}</ref><ref name="ars-role">{{cite web |url=https://arstechnica.com/gadgets/2012/09/newly-standardized-opus-audio-codec-fills-every-role-from-online-chat-to-music/ |title=नया मानकीकृत ओपस ऑडियो कोडेक ऑनलाइन चैट से लेकर संगीत तक हर भूमिका को पूरा करता है|first=Peter |last=Bright |work=[[Ars Technica]] |date=2012-09-12 |access-date=2014-05-28}}</ref> | ||
असतत कोज्या रूपांतरण (डीसीटी) पहली बार 1972 में एन. अहमद द्वारा प्रस्तावित किया गया था<ref name="Ahmed">{{cite journal |last=Ahmed |first=Nasir |author-link=N. Ahmed |title=मैं असतत कोसाइन परिवर्तन के साथ कैसे आया|journal=[[Digital Signal Processing (journal)|Digital Signal Processing]] |date=January 1991 |volume=1 |issue=1 |pages=4–5 |doi=10.1016/1051-2004(91)90086-Z |url=https://www.scribd.com/doc/52879771/DCT-History-How-I-Came-Up-with-the-Discrete-Cosine-Transform}}</ref> और 1974 में टी. नटराजन और के.आर. राव के साथ अहमद द्वारा प्रस्तुत किया गया।<ref name="pubDCT">{{Citation |first1=Nasir |last1=Ahmed |author1-link=N. Ahmed |first2=T. |last2=Natarajan |first3=K. R. |last3=Rao |title=Discrete Cosine Transform |journal=IEEE Transactions on Computers |date=January 1974 |volume=C-23 |issue=1 |pages=90–93 |doi=10.1109/T-C.1974.223784|s2cid=149806273 }}</ref> एमडीसीटी को | असतत कोज्या रूपांतरण (डीसीटी) पहली बार 1972 में एन. अहमद द्वारा प्रस्तावित किया गया था<ref name="Ahmed">{{cite journal |last=Ahmed |first=Nasir |author-link=N. Ahmed |title=मैं असतत कोसाइन परिवर्तन के साथ कैसे आया|journal=[[Digital Signal Processing (journal)|Digital Signal Processing]] |date=January 1991 |volume=1 |issue=1 |pages=4–5 |doi=10.1016/1051-2004(91)90086-Z |url=https://www.scribd.com/doc/52879771/DCT-History-How-I-Came-Up-with-the-Discrete-Cosine-Transform}}</ref> और 1974 में टी. नटराजन और के.आर. राव के साथ अहमद द्वारा प्रस्तुत किया गया।<ref name="pubDCT">{{Citation |first1=Nasir |last1=Ahmed |author1-link=N. Ahmed |first2=T. |last2=Natarajan |first3=K. R. |last3=Rao |title=Discrete Cosine Transform |journal=IEEE Transactions on Computers |date=January 1974 |volume=C-23 |issue=1 |pages=90–93 |doi=10.1109/T-C.1974.223784|s2cid=149806273 }}</ref> एमडीसीटी को बाद में जॉन पी. प्रिंसन, ए.डब्ल्यू. द्वारा प्रस्तावित किया गया था। 1987 में [[सरे विश्वविद्यालय]] में जॉनसन और एलन बी. ब्राडली,<ref>{{cite journal |last1=Princen |first1=John P. |last2=Johnson |first2=A.W. |last3=Bradley |first3=Alan B. |title=Subband/Transform coding using filter bank designs based on time domain aliasing cancellation |journal=ICASSP '87. IEEE International Conference on Acoustics, Speech, and Signal Processing |date=1987 |volume=12 |pages=2161–2164 |doi=10.1109/ICASSP.1987.1169405|s2cid=58446992 }}</ref> प्रिंसेन और ब्रैडली (1986) द्वारा पहले कार्य के बाद<ref>John P. Princen, Alan B. Bradley: ''Analysis/synthesis filter bank design based on time domain aliasing cancellation'', IEEE Trans. Acoust. Speech Signal Processing, ''ASSP-34'' (5), 1153–1161, 1986. Described a precursor to the MDCT using a combination of discrete cosine and sine transforms.</ref> एमडीसीटी के टाइम-डोमेन अलियासिंग कैन्सिलेशन (टीडीएसी) के अंतर्निहित सिद्धांत को विकसित करने के लिए नीचे वर्णित किया गया है। (विभिन्न प्रकार के डीसीटी या डीसीटी/डीएसटी संयोजनों के आधार पर विभिन्न प्रकार के साइन ट्रांसफॉर्म के साथ-साथ अन्य, संभवतः ही कभी प्रयोग किए जाने वाले एमडीसीटी के रूपों के आधार पर एक अनुरूप परिवर्तन एमडीएसटी भी उपस्थित हैं।) | ||
एमपी3 में, एमडीसीटी सीधे ऑडियो सिग्नल पर संचालित नहीं होता है। बल्कि 32-बैंड [[पॉलीफ़ेज़ क्वाडरेचर फ़िल्टर]] (पीक्यूएफ) बैंक के आउटपुट पर संचालित होता है। पीक्यूएफ फ़िल्टर बैंक के विशिष्ट अलियासिंग को कम करने के लिए इस एमडीसीटी के आउटपुट को उपनाम रिडक्शन सूत्र द्वारा पोस्टप्रोसेस किया जाता है। एमडीसीटी के साथ फ़िल्टर बैंक के इस प्रकार के संयोजन को ''हाइब्रिड'' फ़िल्टर बैंक या ''सबबैंड'' एमडीसीटी कहा जाता है। दूसरी ओर एएसी सामान्य रूप से एक शुद्ध एमडीसीटी का उपयोग करता है। केवल (संभवतः ही कभी प्रयोग किया जाने वाला) [[एमपीईजी-4 एएसी-एसएसआर]] संस्करण ([[सोनी]] द्वारा) एमडीसीटी के पश्चात चार-बैंड पीक्यूएफ बैंक का उपयोग करता है। एमपी3 के समान, एटीआरएसी एक एमडीसीटी के पश्चात स्टैक्ड [[चतुर्भुज दर्पण फिल्टर]] (क्यूएमएफ) का उपयोग किया जाता है। | एमपी3 में, एमडीसीटी सीधे ऑडियो सिग्नल पर संचालित नहीं होता है। बल्कि 32-बैंड [[पॉलीफ़ेज़ क्वाडरेचर फ़िल्टर]] (पीक्यूएफ) बैंक के आउटपुट पर संचालित होता है। पीक्यूएफ फ़िल्टर बैंक के विशिष्ट अलियासिंग को कम करने के लिए इस एमडीसीटी के आउटपुट को उपनाम रिडक्शन सूत्र द्वारा पोस्टप्रोसेस किया जाता है। एमडीसीटी के साथ फ़िल्टर बैंक के इस प्रकार के संयोजन को ''हाइब्रिड'' फ़िल्टर बैंक या ''सबबैंड'' एमडीसीटी कहा जाता है। दूसरी ओर एएसी सामान्य रूप से एक शुद्ध एमडीसीटी का उपयोग करता है। केवल (संभवतः ही कभी प्रयोग किया जाने वाला) [[एमपीईजी-4 एएसी-एसएसआर]] संस्करण ([[सोनी]] द्वारा) एमडीसीटी के पश्चात चार-बैंड पीक्यूएफ बैंक का उपयोग करता है। एमपी3 के समान, एटीआरएसी एक एमडीसीटी के पश्चात स्टैक्ड [[चतुर्भुज दर्पण फिल्टर]] (क्यूएमएफ) का उपयोग किया जाता है। | ||
Line 10: | Line 9: | ||
== परिभाषा == | == परिभाषा == | ||
लैप्ड ट्रांसफ़ॉर्म के रूप में, एमडीसीटी अन्य फूरियर-संबंधित ट्रांसफ़ॉर्म की तुलना में कुछ असामान्य होता है। जिसमें इनपुट के रूप में आधे आउटपुट हैं (समान संख्या के | लैप्ड ट्रांसफ़ॉर्म के रूप में, एमडीसीटी अन्य फूरियर-संबंधित ट्रांसफ़ॉर्म की तुलना में कुछ असामान्य होता है। जिसमें इनपुट के रूप में आधे आउटपुट हैं (समान संख्या के अतिरिक्त)। विशेष रूप से यह एक रैखिक <math>F\colon \mathbf{R}^{2N} \to \mathbf{R}^N</math> फलन है (जहाँ R [[वास्तविक संख्या]]ओं के समुच्चय को है)। 2''N'' वास्तविक संख्या ''x''<sub>0</sub>, ..., x<sub>2''N''-1</sub> N वास्तविक संख्या ''X''<sub>0</sub>, ..., ''X<sub>N</sub>''<sub>-1</sub> में परिवर्तित हो जाते हैं। सूत्र के अनुसार: | ||
:<math>X_k = \sum_{n=0}^{2N-1} x_n \cos \left[\frac{\pi}{N} \left(n+\frac{1}{2}+\frac{N}{2}\right) \left(k+\frac{1}{2}\right) \right]</math> | :<math>X_k = \sum_{n=0}^{2N-1} x_n \cos \left[\frac{\pi}{N} \left(n+\frac{1}{2}+\frac{N}{2}\right) \left(k+\frac{1}{2}\right) \right]</math> | ||
(इस परिवर्तन के सामने सामान्यीकरण गुणांक, यहाँ एकता, एक अनियमित सम्मेलन है और उपचारों के बीच भिन्न | (इस परिवर्तन के सामने सामान्यीकरण गुणांक, यहाँ एकता, एक अनियमित सम्मेलन है और उपचारों के बीच भिन्न होते हैं। केवल एमडीसीटी और एमडीसीटी के सामान्यीकरण का प्रोडक्ट नीचे कॉन्सट्रेन्ड होता हैं।) | ||
=== | === <u>विपरीत परिवर्तन-</u> === | ||
व्युत्क्रम एमडीसीटी को एमडीसीटी के रूप में जाना जाता है क्योंकि इनपुट और आउटपुट की विभिन्न संख्याएँ होती हैं। प्रथम | व्युत्क्रम एमडीसीटी को एमडीसीटी के रूप में जाना जाता है क्योंकि इनपुट और आउटपुट की विभिन्न संख्याएँ होती हैं। प्रथम बार ऐसा प्रतीत होता है कि एमडीसीटी विपरीत नहीं होना चाहिए। चूंकि इसके पश्चात के ओवरलैपिंग ब्लॉकों के ओवरलैप किए गए एमडीसीटी को 'जोड़' द्वारा पूर्ण अपवर्तनीय बनाया जा सकता है। जिससे त्रुटियाँ 'नष्ट' हो जाती हैं और मूल डेटा को पुनः प्राप्त किया जा सकता है। इस विधि को 'टाइम-डोमेन अलियासिंग कैंसलेशन' (टीडीएसी) के रूप में जाना जाता है। | ||
आईएमडीसीटी ''N'' वास्तविक संख्या ''X''<sub>0</sub>, ..., ''X<sub>N</sub>''<sub>-1</sub> | आईएमडीसीटी ''N'' वास्तविक संख्या ''X''<sub>0</sub>, ..., ''X<sub>N</sub>''<sub>-1</sub> को 2''N वास्तविक संख्या y<sub>0</sub>, ..., y<sub>2N-1</sub>'' के रूप में रूपान्तरित करता है। सूत्र के अनुसार: | ||
:<math>y_n = \frac{1}{N} \sum_{k=0}^{N-1} X_k \cos \left[\frac{\pi}{N} \left(n+\frac{1}{2}+\frac{N}{2}\right) \left(k+\frac{1}{2}\right) \right]</math> | :<math>y_n = \frac{1}{N} \sum_{k=0}^{N-1} X_k \cos \left[\frac{\pi}{N} \left(n+\frac{1}{2}+\frac{N}{2}\right) \left(k+\frac{1}{2}\right) \right]</math> | ||
(डीसीटी-IV के समान एक ऑर्थोगोनल ट्रांसफ़ॉर्म, व्युत्क्रम का वही रूप | (डीसीटी-IV के समान एक ऑर्थोगोनल ट्रांसफ़ॉर्म, व्युत्क्रम का वही रूप है, जो फ़ॉरवर्ड ट्रांसफ़ॉर्म का रूप होता है।) | ||
सामान्य विंडो सामान्यीकरण (नीचे देखें) के साथ एक विंडो एमडीसीटी की स्थिति में आईएमडीसीटी के सामने सामान्यीकरण गुणांक को 2 से गुणा किया जाना चाहिए (अर्थात | सामान्य विंडो सामान्यीकरण (नीचे देखें) के साथ एक विंडो एमडीसीटी की स्थिति में आईएमडीसीटी के सामने सामान्यीकरण गुणांक को 2 से गुणा किया जाना चाहिए (अर्थात 2/N बनाना)। | ||
=== गणना === | === गणना === | ||
चूंकि एमडीसीटी सूत्र के सीधे आवेदन के लिए O(N<sup>2</sup>) ऑपरेशन [[फास्ट फूरियर ट्रांसफॉर्म]] (एफएफटी) के रूप में गणना को पुनरावर्ती रूप से कारक बनाकर केवल O(''N'' log ''N'') जटिलता के साथ एक ही वस्तु की गणना करना संभव है। कोई अन्य रूपांतरणों के माध्यम से एमडीसीटीएल की गणना भी कर सकता है। सामान्यतः एक डीएफटी (एफएफटी) या डीसीटी, O(N) पूर्व और पश्चात के प्रसंस्करण चरणों के साथ कम्प्यूट करता है। जैसा कि नीचे | चूंकि एमडीसीटी सूत्र के सीधे आवेदन के लिए O(N<sup>2</sup>) ऑपरेशन [[फास्ट फूरियर ट्रांसफॉर्म]] (एफएफटी) के रूप में गणना को पुनरावर्ती रूप से कारक बनाकर केवल O(''N'' log ''N'') जटिलता के साथ एक ही वस्तु की गणना करना संभव है। कोई अन्य रूपांतरणों के माध्यम से एमडीसीटीएल की गणना भी कर सकता है। सामान्यतः एक डीएफटी (एफएफटी) या डीसीटी, O(N) पूर्व और पश्चात के प्रसंस्करण चरणों के साथ कम्प्यूट करता है। जैसा कि नीचे वर्णित किया गया है कि इसके अतिरिक्त डीसीटी-IV के लिए कोई भी एल्गोरिथम समान आकार के एमडीसीटी और एमडीसीटी की गणना करने के लिए तुरंत एक विधि प्रदान करता है। | ||
== विंडो फलन == | == विंडो फलन == | ||
[[file:MDCT_WF.png|thumb|upright=1.8|एमडीसीटी विंडो फलन:<br>नीला: कोसाइन, लाल: साइन-कोसाइन, हरा: संशोधित कैसर-बेसेल]]विशिष्ट सिग्नल-संपीड़न अनुप्रयोगों में, [[खिड़की समारोह|विंडो फलन]] | [[file:MDCT_WF.png|thumb|upright=1.8|एमडीसीटी विंडो फलन:<br>नीला: कोसाइन, लाल: साइन-कोसाइन, हरा: संशोधित कैसर-बेसेल]]विशिष्ट सिग्नल-संपीड़न अनुप्रयोगों में, [[खिड़की समारोह|विंडो फलन]] ''w<sub>n</sub>'' (''n'' = 0, ..., 2''N''−1) का उपयोग करके रूपांतरण गुणों को अधिक उत्कृष्ट बनाया जाता है। जिसे उपरोक्त एमडीसीटी और आईएमडीसीटी सूत्रों में ''x<sub>n</sub>'' और ''y<sub>n</sub>'' से गुणा किया गया है। जिससे n = 0 और 2N लिमिट पर अनिरंतरता से बचा जा सके और उन बिंदुओं पर फलन निरंतर रूप से शून्य हो जाए। (अर्थात हम डेटा को एमडीसीटी से पहले और आईएमडीसीटी के पश्चात विंडो करते हैं।) सैद्धान्तिक रूप में x और y में विभिन्न विंडो फलन हो सकते हैं और विंडो फलन भी एक ब्लॉक से अगले ब्लॉक में परिवर्तित किया सकता है (विशेष रूप से उस स्थिति में जहां डेटा ब्लॉक होता है) विभिन्न आकारों के संयुक्त होते हैं, किन्तु सिम्प्लीसिटी के लिए हम समान आकार के ब्लॉकों के लिए समान विंडो फलन की सामान्य स्थिति पर विचार करते हैं। | ||
सिमिट्रिक विंडो ''w<sub>n</sub>'' = ''w''<sub>2''N''−1−''n''</sub> के लिए परिवर्तन विपरीत प्रदर्शित होता है (अर्थात् टीडीएसी काम करता है)। जब तक w प्रिंसेन-ब्रैडली नियम को संतुष्ट करता है: | |||
:<math>w_n^2 + w_{n + N}^2 = 1</math>. | :<math>w_n^2 + w_{n + N}^2 = 1</math>. | ||
Line 48: | Line 47: | ||
ध्यान दें कि एमडीसीटी पर संचालित विंडो कुछ अन्य प्रकार के सिग्नल विश्लेषण के लिए उपयोग की जाने वाली विंडो से पूर्णतयः भिन्न हैं क्योंकि उन्हें प्रिंसन-ब्रैडली नियम को पूरा करना होगा। इस अंतर के कारणों में से एक यह है कि एमडीसीटी विंडो को एमडीसीटी (विश्लेषण) और आईएमडीसीटी (संश्लेषण) दोनों के लिए दो बार संचालित किया जाता है। | ध्यान दें कि एमडीसीटी पर संचालित विंडो कुछ अन्य प्रकार के सिग्नल विश्लेषण के लिए उपयोग की जाने वाली विंडो से पूर्णतयः भिन्न हैं क्योंकि उन्हें प्रिंसन-ब्रैडली नियम को पूरा करना होगा। इस अंतर के कारणों में से एक यह है कि एमडीसीटी विंडो को एमडीसीटी (विश्लेषण) और आईएमडीसीटी (संश्लेषण) दोनों के लिए दो बार संचालित किया जाता है। | ||
== डीसीटी-IV से संबंध और टीडीएसी की उत्पत्ति == | == डीसीटी-IV से संबंध और टीडीएसी की उत्पत्ति- == | ||
जैसा कि परिभाषाओं के निरीक्षण से देखा जा सकता है। यहां तक कि ''N'' के लिए भी एमडीसीटी अनिवार्य रूप से डीसीटी-IV के | जैसा कि परिभाषाओं के निरीक्षण से देखा जा सकता है। यहां तक कि ''N'' के लिए भी एमडीसीटी अनिवार्य रूप से डीसीटी-IV के समान होते है। जहां इनपुट को ''N''/2 और दो ''N''-ब्लॉक द्वारा स्थानांतरित किया जाता है। डेटा का एक बार में रूपांतरण किया जाता है। इस समानता की अधिक सावधानी से जांच करके टीडीएसी जैसे महत्वपूर्ण गुणों को सरलतम प्रकार से प्राप्त किया जा सकता है। | ||
डीसीटी-IV से स्पष्ट संबंध को परिभाषित करने के लिए किसी को यह आभास कराना चाहिए कि डीसीटी-IV वैकल्पिक सम/विषम सीमा स्थितियों से मिलता जुलता है। यहां तक कि इसकी बाईं सीमा पर भी (''n'' = −1/2 के | डीसीटी-IV से स्पष्ट संबंध को परिभाषित करने के लिए किसी को यह आभास कराना चाहिए कि डीसीटी-IV वैकल्पिक सम/विषम सीमा स्थितियों से मिलता जुलता है। यहां तक कि इसकी बाईं सीमा पर भी (''n'' = −1/2 के समान), विषम इसकी दाहिनी लिमिट पर (लगभग ''n'' = ''N'' − 1/2) और इसी प्रकार (विभिन्न फूरियर रूपांतरण के लिए आवधिक सीमाओं के अतिरिक्त) यह पहचान से अनुसरण करता है। <math>\cos\left[\frac{\pi}{N} \left(-n-1+\frac{1}{2}\right) \left(k+\frac{1}{2}\right)\right] = \cos\left[\frac{\pi}{N} \left(n+\frac{1}{2}\right) \left(k+\frac{1}{2}\right)\right]</math> और <math>\cos\left[\frac{\pi}{N} \left(2N-n-1+\frac{1}{2}\right) \left(k+\frac{1}{2}\right)\right] = -\cos\left[\frac{\pi}{N} \left(n+\frac{1}{2}\right) \left(k+\frac{1}{2}\right)\right]</math>. | ||
इस प्रकार, यदि इसके इनपुट लंबाई N की एक सरणी x हैं। जिससे हम इस सरणी को (''x'', −''x<sub>R</sub>'', −''x'', ''x<sub>R</sub>'', ...) तक विस्तारित करने की कल्पना कर सकते हैं और इसी प्रकार जहां x<sub>''R''</sub> | इस प्रकार, यदि इसके इनपुट लंबाई N की एक सरणी x हैं। जिससे हम इस सरणी को (''x'', −''x<sub>R</sub>'', −''x'', ''x<sub>R</sub>'', ...) तक विस्तारित करने की कल्पना कर सकते हैं और इसी प्रकार जहां x<sub>''R''</sub> को विपरीत क्रम में प्रदर्शित करता है। | ||
2N इनपुट और N आउटपुट के साथ एक एमडीसीटी पर विचार करें। जहां हम इनपुट को चार ब्लॉक (''a'', ''b'', ''c'', ''d'') में विभाजित करते हैं। जिनमें से प्रत्येक का आकार N/2 है। यदि हम इन्हें N/2 (एमडीसीटी परिभाषा में +N/2 शब्द से) द्वारा दाईं ओर स्थानांतरित करते हैं। जिससे (b, c, d) N डीसीटी-IV इनपुट के अंत से आगे बढ़ते हैं। इसलिए हमें उन्हें ऊपर वर्णित लिमिट नियमों के अनुसार पुनः मोड़ना चाहिए। | 2N इनपुट और N आउटपुट के साथ एक एमडीसीटी पर विचार करें। जहां हम इनपुट को चार ब्लॉक (''a'', ''b'', ''c'', ''d'') में विभाजित करते हैं। जिनमें से प्रत्येक का आकार N/2 है। यदि हम इन्हें N/2 (एमडीसीटी परिभाषा में +N/2 शब्द से) द्वारा दाईं ओर स्थानांतरित करते हैं। जिससे (b, c, d) N डीसीटी-IV इनपुट के अंत से आगे बढ़ते हैं। इसलिए हमें उन्हें ऊपर वर्णित लिमिट नियमों के अनुसार पुनः मोड़ना चाहिए। | ||
: इस प्रकार 2N इनपुट का एमडीसीटी (a, b, c, d) N इनपुट के डीसीटी-IV के बिल्कुल बराबर है: (−''c<sub>R</sub>''−''d'', ''a''−''b<sub>R</sub>'') जहां | : इस प्रकार 2N इनपुट का एमडीसीटी (a, b, c, d) N इनपुट के डीसीटी-IV के बिल्कुल बराबर है: (−''c<sub>R</sub>''−''d'', ''a''−''b<sub>R</sub>'') जहां ''R'' ऊपर के रूप में उत्क्रमण को दर्शाता है। | ||
(इस प्रकार डीसीटी-IV की गणना करने के लिए किसी भी एल्गोरिथ्म को सामान्य रूप से एमडीसीटी पर संचालित किया जा सकता है।) | (इस प्रकार डीसीटी-IV की गणना करने के लिए किसी भी एल्गोरिथ्म को सामान्य रूप से एमडीसीटी पर संचालित किया जा सकता है।) | ||
इसी प्रकार ऊपर दिया गया आईएमडीसीटी सूत्र डीसीटी-IV (जो इसका अपना प्रतिलोम है) का ठीक 1/2 है। जहां आउटपुट को (सीमा स्थितियों के माध्यम से) लंबाई 2N तक बढ़ाया जाता है और N/2 द्वारा बाईं ओर वापस स्थानांतरित कर दिया जाता है। व्युत्क्रम डीसीटी-IV केवल ऊपर से इनपुट (−''c<sub>R</sub>''−''d'', ''a''−''b<sub>R</sub>'') वापस | इसी प्रकार ऊपर दिया गया आईएमडीसीटी सूत्र डीसीटी-IV (जो इसका अपना प्रतिलोम है) का ठीक 1/2 है। जहां आउटपुट को (सीमा स्थितियों के माध्यम से) लंबाई 2N तक बढ़ाया जाता है और N/2 द्वारा बाईं ओर वापस स्थानांतरित कर दिया जाता है। व्युत्क्रम डीसीटी-IV केवल ऊपर से इनपुट (−''c<sub>R</sub>''−''d'', ''a''−''b<sub>R</sub>'') वापस प्रदान करेगा। जब इसे लिमिट नियमों के माध्यम से बढ़ाया जाता है और स्थानांतरित किया जाता है। जिससे एक प्राप्त होता है: | ||
:आईएमडीसीटी (एमडीसीटी (a, b, c, d)) = (''a''−''b<sub>R</sub>'', ''b''−''a<sub>R</sub>'', ''c''+''d<sub>R</sub>'', ''d''+''c<sub>R</sub>'') / 2. | :आईएमडीसीटी (एमडीसीटी (a, b, c, d)) = (''a''−''b<sub>R</sub>'', ''b''−''a<sub>R</sub>'', ''c''+''d<sub>R</sub>'', ''d''+''c<sub>R</sub>'') / 2. | ||
आईएमडीसीटी आउटपुट का आधा इस प्रकार | आईएमडीसीटी आउटपुट का आधा इस प्रकार रिडन्डेन्ट होता है। जैसा कि ''b''−''a<sub>R</sub>'' = −(''a''−''b<sub>R</sub>'')<sub>''R''</sub> और इसी प्रकार पिछले दो शब्दों के लिए यदि हम इनपुट को N आकार के बड़े ब्लॉक A,B में सामूहित करते हैं। जहाँ A = (a, b) और B = (c, d), हम इस परिणाम को सरल प्रकार से लिख सकते हैं: | ||
:आईएमडीसीटी (एमडीसीटी (A, B)) = (''A''−''A<sub>R</sub>'', ''B''+''B<sub>R</sub>'') / 2 | :आईएमडीसीटी (एमडीसीटी (A, B)) = (''A''−''A<sub>R</sub>'', ''B''+''B<sub>R</sub>'') / 2 | ||
कोई यह समझ सकता है कि टीडीएसी कैसे कार्य करता है। माना कि कोई पश्चात के एमडीसीटी 50% ओवरलैप, 2 N ब्लॉक (B,C) की गणना करता है। इसके पश्चात आईएमडीसीटी उपरोक्त के अनुरूप परिणाम (''B''−''B<sub>R</sub>'', ''C''+''C<sub>R</sub>'') / 2 प्रदान करेगा। जब इसे पिछले आईएमडीसीटी परिणाम के साथ ओवरलैपिंग आधे में जोड़ा जाता है। जिससे विपरीत नियम समाप्त हो जाते हैं और मूल डेटा को पुनर्प्राप्त करते हुए केवल B प्राप्त होता है। | |||
=== टीडीएसी की उत्पत्ति === | === <u>टीडीएसी की उत्पत्ति-</u> === | ||
टाइम-डोमेन [[अलियासिंग]] | टाइम-डोमेन [[अलियासिंग]] कैन्सिलेशन शब्द की उत्पत्ति अब स्पष्ट है। तार्किक डीसीटी-IV की सीमाओं से परे जाने वाले इनपुट डेटा का उपयोग डेटा को उसी प्रकार से अलियास करने का कारण बनता है जैसे कि न्यक्वीस्ट फ़्रीक्वेंसी से दूर फ़्रीक्वेंसी को कम फ़्रीक्वेंसी के लिए अलियास किया जाता है। इसके अतिरिक्त कि यह अलियासिंग टाइम डोमेन के स्थान पर समय डोमेन में होता है। फ़्रीक्वेंसी डोमेन: हम (''a'', ''b'', ''c'', ''d'') के एमडीसीटी के लिए ''a'' और ''b<sub>R</sub>'' के योगदान को अलग नहीं कर सकते हैं या समकक्ष के परिणाम के लिए- | ||
:आईएमडीसीटी (एमडीसीटी (a, b, c, d)) = (''a''−''b<sub>R</sub>'', ''b''−''a<sub>R</sub>'', ''c''+''d<sub>R</sub>'', ''d''+''c<sub>R</sub>'') / 2. | |||
संयोजन ''c''−''d<sub>R</sub>'' और इसी प्रकार, जोड़े जाने पर संयोजनों को नष्ट करने के लिए स्पष्ट रूप से सही संकेत प्राप्त होते हैं। | |||
:आईएमडीसीटी (एमडीसीटी (a, b, c, d)) = ( | |||
संयोजन | |||
विषम ''N'' के लिए (जो | विषम ''N'' के लिए (जो संभवतः ही कभी व्यवहार में उपयोग किया जाता है), ''N''/2 एक पूर्णांक नहीं है। इसलिए एमडीसीटी केवल डीसीटी-IV का शिफ्ट क्रमचय नहीं है। इस स्थिति में आधे नमूने द्वारा अतिरिक्त बदलाव का अर्थ यह है कि एमडीसीटी/आईएमडीसीटी डीसीटी-III/II के बराबर हो जाता है और विश्लेषण ऊपर के अनुरूप होता है। | ||
=== | === स्मूथनेस और असंततता === | ||
हमने ऊपर देखा है कि 2N इनपुट का एमडीसीटी (a, b, | हमने ऊपर देखा है कि 2N इनपुट का एमडीसीटी (a, b,c, d) N इनपुट (−''c<sub>R</sub>''−''d'', ''a''−''b<sub>R</sub>'') के डीसीटी-IV के बराबर है। डीसीटी-IV को इसके लिए प्रारूपित किया गया है। जहां सही सीमा पर फलन विषम है और इसलिए सही सीमा के निकट मान 0 के पास हैं। यदि इनपुट सिग्नल स्मूथ है। जिससे यह स्थिति है: ''a'' और ''b<sub>R</sub>'' के सबसे दाहिने घटक इनपुट अनुक्रम (a, b,c, d) में निरंतर होता हैं और इसलिए उनका अंतर छोटा है। आइए अंतराल के मध्य को देखें: यदि हम उपरोक्त अभिव्यक्ति को (−''c<sub>R</sub>''−''d'', ''a''−''b<sub>R</sub>'') = (−''d'', ''a'')−(''b'',''c'')<sub>''R''</sub>, दूसरा पद, (b,c) के रूप में पुनः लिखते हैं और बीच में एक स्मूथ संक्रमण प्रदान करता है। चूंकि प्रथम पद में, (-d, a), एक संभावित विच्छिन्नता है। जहाँ -d का दाहिना सिरा a के बाएँ सिरे से मिलता है। यह विंडो फलन का उपयोग करने का कारण होता है। जो इनपुट अनुक्रम (a, b,c, d) की सीमाओं के पास घटकों को 0 की ओर कम करता है। | ||
c, d) N इनपुट | |||
( | |||
डीसीटी-IV को इसके लिए | |||
सही सीमा के | |||
यह | |||
इनपुट अनुक्रम | |||
इसलिए उनका अंतर छोटा है। | |||
आइए अंतराल के मध्य को देखें: | |||
( | |||
दूसरा | |||
बीच में | |||
चूंकि | |||
संभावित | |||
विंडो फलन का उपयोग करने का | |||
इनपुट अनुक्रम | |||
'''<big><u>विंडो एमडीसीटी के लिए टीडीएसी-</u></big>''' | |||
ऊपर, टीडीएसी संपत्ति सामान्य एमडीसीटी के लिए | ऊपर, टीडीएसी संपत्ति सामान्य एमडीसीटी के लिए प्रमाणित हुई थी। यह प्रदर्शित करते हुए कि पश्चात के ब्लॉकों के आईएमडीसीटीएस को उनके अतिव्यापी आधे भाग में जोड़ने से मुख्य डेटा सही हो जाता है। विंडो वाले एमडीसीटी के लिए इस विपरीत गुण की व्युत्पत्ति केवल थोड़ी अधिक जटिल है। | ||
आकार | आकार N के ब्लॉक A,B,C के लिए 2''N'' इनपुट (''A'',''B'') और (''B'',''C'') के निरंतर समुच्चय ओवरलैप करने पर विचार करें। ऊपर से याद करें कि जब <math>(A,B)</math> और <math>(B,C)</math> एमडीसीटी, आईएमडीसीटी हैं और उनके अतिव्यापी आधे भाग में जोड़े गए हैं। हम <math>(B+B_R) / 2 + (B-B_R) / 2 = B</math> प्राप्त करते हैं। | ||
ऊपर से याद करें कि | |||
अब हम मानते हैं कि हम एमडीसीटी इनपुट और आईएमडीसीटी आउटपुट दोनों को 2N लंबाई के विंडो फलन से गुणा करते हैं। | अब हम मानते हैं कि हम एमडीसीटी इनपुट और आईएमडीसीटी आउटपुट दोनों को 2N लंबाई के विंडो फलन से गुणा करते हैं। उपरोक्त हम एक सममित विंडो फलन मानते हैं। जो कि <math>(W,W_R)</math> फॉर्म का है। जहां W लंबाई-N वेक्टर है और R पहले की प्रकार उत्क्रमण को प्रदर्शित करता है। तब प्रिंसेन-ब्रैडली स्थिति को इस रूप में लिखा जा सकता है और <math>W^2 + W_R^2 = (1,1,\ldots)</math> वर्गों और परिवर्धन के साथ इलेमेन्टवाइज प्रदर्शन किया गया है। | ||
इसलिए | इसलिए एमडीसीटी के अतिरिक्त <math>(A,B)</math>, अब हम एमडीसीटी <math>(WA,W_R B)</math> (सभी गुणाओं के साथ तत्ववार प्रदर्शन किया गया)। जब इसे आईएमडीसीटी किया जाता है और विंडो फलन द्वारा फिर से गुणा (इलीमेन्टवाइज) किया जाता है। जिससे अंतिम-N आधा बन जाता है: | ||
:<math>W_R \cdot (W_R B+(W_R B)_R) =W_R \cdot (W_R B+W B_R) = W_R^2 B+WW_R B_R</math>. | :<math>W_R \cdot (W_R B+(W_R B)_R) =W_R \cdot (W_R B+W B_R) = W_R^2 B+WW_R B_R</math>. | ||
(ध्यान दें कि अब हमारे पास 1/2 से गुणा नहीं है | (ध्यान दें कि अब हमारे पास 1/2 से गुणा नहीं है क्योंकि विंडो वाली स्थिति में आईएमडीसीटी सामान्यीकरण 2 के फैक्टर से भिन्न होता है।) | ||
इसी प्रकार | इसी प्रकार विंडो एमडीसीटी और आईएमडीसीटी की <math>(B,C)</math> को उत्पन्न करता है। इसकी पहली-''N'' छमाही में: | ||
:<math>W \cdot (WB - W_R B_R) = W^2 B - W W_R B_R</math>. | :<math>W \cdot (WB - W_R B_R) = W^2 B - W W_R B_R</math>. | ||
जब हम इन दो | जब हम इन दो भागों को एक साथ जोड़ते हैं। जिससे हम प्राप्त करते हैं: | ||
:<math>(W_R^2 B+WW_R B_R) + (W^2 B - W W_R B_R)= \left(W_R^2 + W^2\right)B = B,</math> | :<math>(W_R^2 B+WW_R B_R) + (W^2 B - W W_R B_R)= \left(W_R^2 + W^2\right)B = B,</math> | ||
Line 130: | Line 105: | ||
== यह भी देखें == | == यह भी देखें == | ||
* असतत कोज्या परिवर्तन | * असतत कोज्या परिवर्तन | ||
* अन्य अतिव्यापी विंडो वाले फूरियर रूपांतरणों में | * अन्य अतिव्यापी विंडो वाले फूरियर रूपांतरणों में सम्मिलित होता हैं: | ||
** [[संग्राहक जटिल लैप्ड रूपांतरण]] | ** [[संग्राहक जटिल लैप्ड रूपांतरण]] | ||
** [[शॉर्ट-टाइम फूरियर रूपांतरण]] | ** [[शॉर्ट-टाइम फूरियर रूपांतरण]] | ||
Line 153: | Line 128: | ||
{{Compression Methods}} | {{Compression Methods}} | ||
[[Category: | [[Category:All articles with dead external links]] | ||
[[Category:Articles with dead external links from February 2018]] | |||
[[Category:Articles with hatnote templates targeting a nonexistent page]] | |||
[[Category:Articles with permanently dead external links]] | |||
[[Category:Collapse templates]] | |||
[[Category:Created On 12/05/2023]] | [[Category:Created On 12/05/2023]] | ||
[[Category:Data compression]] | |||
[[Category:Machine Translated Page]] | |||
[[Category:Missing redirects]] | |||
[[Category:Navigational boxes| ]] | |||
[[Category:Navigational boxes without horizontal lists]] | |||
[[Category:Pages with script errors]] | |||
[[Category:Sidebars with styles needing conversion]] | |||
[[Category:Template documentation pages|Documentation/doc]] | |||
[[Category:Templates Vigyan Ready]] | |||
[[Category:Templates generating microformats]] | |||
[[Category:Templates that are not mobile friendly]] | |||
[[Category:Templates using TemplateData]] | |||
[[Category:Wikipedia metatemplates]] | |||
[[Category:असतत परिवर्तन]] | |||
[[Category:आधार - सामग्री संकोचन]] | |||
[[Category:फूरियर विश्लेषण]] |
Latest revision as of 15:30, 15 June 2023
संशोधित असतत कोसाइन परिवर्तन (एमडीसीटी) टाइप-IV असतत कोसाइन परिवर्तन (डीसीटी-IV) पर आधारित एक परिवर्तन है। लैप्ड ट्रांसफॉर्म होने की अतिरिक्त गुण के साथ इसे एक बड़े डाटासेट के निरंतर ब्लॉक पर निष्पादित करने के लिए यह प्रारूपित किया गया है, जहाँ सबसीक्वेन्ट ब्लॉकों को ओवरलैप किया जाता है। जिससे एक ब्लॉक का अंतिम आधा अगले ब्लॉक के पहले भाग के साथ मिलान करता है। यह ओवरलैपिंग डीसीटी के ऊर्जा-संघनन गुणों के अतिरिक्त एमडीसीटी को सिग्नल संपीड़न अनुप्रयोगों के लिए विशेष रूप से आकर्षक बनाता है क्योंकि यह ब्लॉक सीमाओं से उत्पन्न संपीड़न विरूपण साक्ष्य से बचने में सहायता करता है। इन लाभ के परिणामस्वरूप एमडीसीटी ऑडियो डेटा संपीड़न में सबसे व्यापक रूप से उपयोग की जाने वाली लूजी कम्प्रेशन विधि है। यह एमपी3, डॉल्बी डिजिटल (एसी-3), वॉर्बिस(ओजीजी), विंडोज मीडिया ऑडियो (डब्लूएमए), एटीआऱसी, कुक कोडेक, हाई ऑडियो कोडिंग (एएसी), हाई-डेफिनिशन कोडिंग (एचडीसी),[1] एलडीएसी (कोडेक), डॉल्बी एसी-4,[2] और एमपीईजी-एच 3डी ऑडियो[3][4] सहित अधिकांश आधुनिक ऑडियो कोडिंग मानकों में निरंतर कार्यरत है। इनके साथ ही भाषण कोडिंग मानकों जैसे एएसी-एलडी (एलडी-एमडीसीटी),[5] G.722.1,[6] G.729.1,[7] सीईएलटी[8] और ओपस (ऑडियो प्रारूप) आदि का भी प्रयोग किया जाता है्।[9][10]
असतत कोज्या रूपांतरण (डीसीटी) पहली बार 1972 में एन. अहमद द्वारा प्रस्तावित किया गया था[11] और 1974 में टी. नटराजन और के.आर. राव के साथ अहमद द्वारा प्रस्तुत किया गया।[12] एमडीसीटी को बाद में जॉन पी. प्रिंसन, ए.डब्ल्यू. द्वारा प्रस्तावित किया गया था। 1987 में सरे विश्वविद्यालय में जॉनसन और एलन बी. ब्राडली,[13] प्रिंसेन और ब्रैडली (1986) द्वारा पहले कार्य के बाद[14] एमडीसीटी के टाइम-डोमेन अलियासिंग कैन्सिलेशन (टीडीएसी) के अंतर्निहित सिद्धांत को विकसित करने के लिए नीचे वर्णित किया गया है। (विभिन्न प्रकार के डीसीटी या डीसीटी/डीएसटी संयोजनों के आधार पर विभिन्न प्रकार के साइन ट्रांसफॉर्म के साथ-साथ अन्य, संभवतः ही कभी प्रयोग किए जाने वाले एमडीसीटी के रूपों के आधार पर एक अनुरूप परिवर्तन एमडीएसटी भी उपस्थित हैं।)
एमपी3 में, एमडीसीटी सीधे ऑडियो सिग्नल पर संचालित नहीं होता है। बल्कि 32-बैंड पॉलीफ़ेज़ क्वाडरेचर फ़िल्टर (पीक्यूएफ) बैंक के आउटपुट पर संचालित होता है। पीक्यूएफ फ़िल्टर बैंक के विशिष्ट अलियासिंग को कम करने के लिए इस एमडीसीटी के आउटपुट को उपनाम रिडक्शन सूत्र द्वारा पोस्टप्रोसेस किया जाता है। एमडीसीटी के साथ फ़िल्टर बैंक के इस प्रकार के संयोजन को हाइब्रिड फ़िल्टर बैंक या सबबैंड एमडीसीटी कहा जाता है। दूसरी ओर एएसी सामान्य रूप से एक शुद्ध एमडीसीटी का उपयोग करता है। केवल (संभवतः ही कभी प्रयोग किया जाने वाला) एमपीईजी-4 एएसी-एसएसआर संस्करण (सोनी द्वारा) एमडीसीटी के पश्चात चार-बैंड पीक्यूएफ बैंक का उपयोग करता है। एमपी3 के समान, एटीआरएसी एक एमडीसीटी के पश्चात स्टैक्ड चतुर्भुज दर्पण फिल्टर (क्यूएमएफ) का उपयोग किया जाता है।
परिभाषा
लैप्ड ट्रांसफ़ॉर्म के रूप में, एमडीसीटी अन्य फूरियर-संबंधित ट्रांसफ़ॉर्म की तुलना में कुछ असामान्य होता है। जिसमें इनपुट के रूप में आधे आउटपुट हैं (समान संख्या के अतिरिक्त)। विशेष रूप से यह एक रैखिक फलन है (जहाँ R वास्तविक संख्याओं के समुच्चय को है)। 2N वास्तविक संख्या x0, ..., x2N-1 N वास्तविक संख्या X0, ..., XN-1 में परिवर्तित हो जाते हैं। सूत्र के अनुसार:
(इस परिवर्तन के सामने सामान्यीकरण गुणांक, यहाँ एकता, एक अनियमित सम्मेलन है और उपचारों के बीच भिन्न होते हैं। केवल एमडीसीटी और एमडीसीटी के सामान्यीकरण का प्रोडक्ट नीचे कॉन्सट्रेन्ड होता हैं।)
विपरीत परिवर्तन-
व्युत्क्रम एमडीसीटी को एमडीसीटी के रूप में जाना जाता है क्योंकि इनपुट और आउटपुट की विभिन्न संख्याएँ होती हैं। प्रथम बार ऐसा प्रतीत होता है कि एमडीसीटी विपरीत नहीं होना चाहिए। चूंकि इसके पश्चात के ओवरलैपिंग ब्लॉकों के ओवरलैप किए गए एमडीसीटी को 'जोड़' द्वारा पूर्ण अपवर्तनीय बनाया जा सकता है। जिससे त्रुटियाँ 'नष्ट' हो जाती हैं और मूल डेटा को पुनः प्राप्त किया जा सकता है। इस विधि को 'टाइम-डोमेन अलियासिंग कैंसलेशन' (टीडीएसी) के रूप में जाना जाता है।
आईएमडीसीटी N वास्तविक संख्या X0, ..., XN-1 को 2N वास्तविक संख्या y0, ..., y2N-1 के रूप में रूपान्तरित करता है। सूत्र के अनुसार:
(डीसीटी-IV के समान एक ऑर्थोगोनल ट्रांसफ़ॉर्म, व्युत्क्रम का वही रूप है, जो फ़ॉरवर्ड ट्रांसफ़ॉर्म का रूप होता है।)
सामान्य विंडो सामान्यीकरण (नीचे देखें) के साथ एक विंडो एमडीसीटी की स्थिति में आईएमडीसीटी के सामने सामान्यीकरण गुणांक को 2 से गुणा किया जाना चाहिए (अर्थात 2/N बनाना)।
गणना
चूंकि एमडीसीटी सूत्र के सीधे आवेदन के लिए O(N2) ऑपरेशन फास्ट फूरियर ट्रांसफॉर्म (एफएफटी) के रूप में गणना को पुनरावर्ती रूप से कारक बनाकर केवल O(N log N) जटिलता के साथ एक ही वस्तु की गणना करना संभव है। कोई अन्य रूपांतरणों के माध्यम से एमडीसीटीएल की गणना भी कर सकता है। सामान्यतः एक डीएफटी (एफएफटी) या डीसीटी, O(N) पूर्व और पश्चात के प्रसंस्करण चरणों के साथ कम्प्यूट करता है। जैसा कि नीचे वर्णित किया गया है कि इसके अतिरिक्त डीसीटी-IV के लिए कोई भी एल्गोरिथम समान आकार के एमडीसीटी और एमडीसीटी की गणना करने के लिए तुरंत एक विधि प्रदान करता है।
विंडो फलन
विशिष्ट सिग्नल-संपीड़न अनुप्रयोगों में, विंडो फलन wn (n = 0, ..., 2N−1) का उपयोग करके रूपांतरण गुणों को अधिक उत्कृष्ट बनाया जाता है। जिसे उपरोक्त एमडीसीटी और आईएमडीसीटी सूत्रों में xn और yn से गुणा किया गया है। जिससे n = 0 और 2N लिमिट पर अनिरंतरता से बचा जा सके और उन बिंदुओं पर फलन निरंतर रूप से शून्य हो जाए। (अर्थात हम डेटा को एमडीसीटी से पहले और आईएमडीसीटी के पश्चात विंडो करते हैं।) सैद्धान्तिक रूप में x और y में विभिन्न विंडो फलन हो सकते हैं और विंडो फलन भी एक ब्लॉक से अगले ब्लॉक में परिवर्तित किया सकता है (विशेष रूप से उस स्थिति में जहां डेटा ब्लॉक होता है) विभिन्न आकारों के संयुक्त होते हैं, किन्तु सिम्प्लीसिटी के लिए हम समान आकार के ब्लॉकों के लिए समान विंडो फलन की सामान्य स्थिति पर विचार करते हैं।
सिमिट्रिक विंडो wn = w2N−1−n के लिए परिवर्तन विपरीत प्रदर्शित होता है (अर्थात् टीडीएसी काम करता है)। जब तक w प्रिंसेन-ब्रैडली नियम को संतुष्ट करता है:
- .
विभिन्न विंडो फलन का उपयोग किया जाता है। एक विंडो, जो मॉड्युलेटेड लैप्ड ट्रांसफ़ॉर्म (एमएलटी) के रूप में जाना जाने वाला फ़ॉर्म उत्पन्न करती है,[15][16] द्वारा प्रदान किया गया है-
और एमपी3 और एमपीएजी-2 एएसी के लिए प्रयोग किया जाता है और
वोरबिस के लिए एसी-3 कैसर-बेसेल व्युत्पन्न (केबीडी) विंडो का उपयोग करता है और एमपीएजी-4 एएसी भी केबीडी विंडो का उपयोग कर सकता है।
ध्यान दें कि एमडीसीटी पर संचालित विंडो कुछ अन्य प्रकार के सिग्नल विश्लेषण के लिए उपयोग की जाने वाली विंडो से पूर्णतयः भिन्न हैं क्योंकि उन्हें प्रिंसन-ब्रैडली नियम को पूरा करना होगा। इस अंतर के कारणों में से एक यह है कि एमडीसीटी विंडो को एमडीसीटी (विश्लेषण) और आईएमडीसीटी (संश्लेषण) दोनों के लिए दो बार संचालित किया जाता है।
डीसीटी-IV से संबंध और टीडीएसी की उत्पत्ति-
जैसा कि परिभाषाओं के निरीक्षण से देखा जा सकता है। यहां तक कि N के लिए भी एमडीसीटी अनिवार्य रूप से डीसीटी-IV के समान होते है। जहां इनपुट को N/2 और दो N-ब्लॉक द्वारा स्थानांतरित किया जाता है। डेटा का एक बार में रूपांतरण किया जाता है। इस समानता की अधिक सावधानी से जांच करके टीडीएसी जैसे महत्वपूर्ण गुणों को सरलतम प्रकार से प्राप्त किया जा सकता है।
डीसीटी-IV से स्पष्ट संबंध को परिभाषित करने के लिए किसी को यह आभास कराना चाहिए कि डीसीटी-IV वैकल्पिक सम/विषम सीमा स्थितियों से मिलता जुलता है। यहां तक कि इसकी बाईं सीमा पर भी (n = −1/2 के समान), विषम इसकी दाहिनी लिमिट पर (लगभग n = N − 1/2) और इसी प्रकार (विभिन्न फूरियर रूपांतरण के लिए आवधिक सीमाओं के अतिरिक्त) यह पहचान से अनुसरण करता है। और .
इस प्रकार, यदि इसके इनपुट लंबाई N की एक सरणी x हैं। जिससे हम इस सरणी को (x, −xR, −x, xR, ...) तक विस्तारित करने की कल्पना कर सकते हैं और इसी प्रकार जहां xR को विपरीत क्रम में प्रदर्शित करता है।
2N इनपुट और N आउटपुट के साथ एक एमडीसीटी पर विचार करें। जहां हम इनपुट को चार ब्लॉक (a, b, c, d) में विभाजित करते हैं। जिनमें से प्रत्येक का आकार N/2 है। यदि हम इन्हें N/2 (एमडीसीटी परिभाषा में +N/2 शब्द से) द्वारा दाईं ओर स्थानांतरित करते हैं। जिससे (b, c, d) N डीसीटी-IV इनपुट के अंत से आगे बढ़ते हैं। इसलिए हमें उन्हें ऊपर वर्णित लिमिट नियमों के अनुसार पुनः मोड़ना चाहिए।
- इस प्रकार 2N इनपुट का एमडीसीटी (a, b, c, d) N इनपुट के डीसीटी-IV के बिल्कुल बराबर है: (−cR−d, a−bR) जहां R ऊपर के रूप में उत्क्रमण को दर्शाता है।
(इस प्रकार डीसीटी-IV की गणना करने के लिए किसी भी एल्गोरिथ्म को सामान्य रूप से एमडीसीटी पर संचालित किया जा सकता है।)
इसी प्रकार ऊपर दिया गया आईएमडीसीटी सूत्र डीसीटी-IV (जो इसका अपना प्रतिलोम है) का ठीक 1/2 है। जहां आउटपुट को (सीमा स्थितियों के माध्यम से) लंबाई 2N तक बढ़ाया जाता है और N/2 द्वारा बाईं ओर वापस स्थानांतरित कर दिया जाता है। व्युत्क्रम डीसीटी-IV केवल ऊपर से इनपुट (−cR−d, a−bR) वापस प्रदान करेगा। जब इसे लिमिट नियमों के माध्यम से बढ़ाया जाता है और स्थानांतरित किया जाता है। जिससे एक प्राप्त होता है:
- आईएमडीसीटी (एमडीसीटी (a, b, c, d)) = (a−bR, b−aR, c+dR, d+cR) / 2.
आईएमडीसीटी आउटपुट का आधा इस प्रकार रिडन्डेन्ट होता है। जैसा कि b−aR = −(a−bR)R और इसी प्रकार पिछले दो शब्दों के लिए यदि हम इनपुट को N आकार के बड़े ब्लॉक A,B में सामूहित करते हैं। जहाँ A = (a, b) और B = (c, d), हम इस परिणाम को सरल प्रकार से लिख सकते हैं:
- आईएमडीसीटी (एमडीसीटी (A, B)) = (A−AR, B+BR) / 2
कोई यह समझ सकता है कि टीडीएसी कैसे कार्य करता है। माना कि कोई पश्चात के एमडीसीटी 50% ओवरलैप, 2 N ब्लॉक (B,C) की गणना करता है। इसके पश्चात आईएमडीसीटी उपरोक्त के अनुरूप परिणाम (B−BR, C+CR) / 2 प्रदान करेगा। जब इसे पिछले आईएमडीसीटी परिणाम के साथ ओवरलैपिंग आधे में जोड़ा जाता है। जिससे विपरीत नियम समाप्त हो जाते हैं और मूल डेटा को पुनर्प्राप्त करते हुए केवल B प्राप्त होता है।
टीडीएसी की उत्पत्ति-
टाइम-डोमेन अलियासिंग कैन्सिलेशन शब्द की उत्पत्ति अब स्पष्ट है। तार्किक डीसीटी-IV की सीमाओं से परे जाने वाले इनपुट डेटा का उपयोग डेटा को उसी प्रकार से अलियास करने का कारण बनता है जैसे कि न्यक्वीस्ट फ़्रीक्वेंसी से दूर फ़्रीक्वेंसी को कम फ़्रीक्वेंसी के लिए अलियास किया जाता है। इसके अतिरिक्त कि यह अलियासिंग टाइम डोमेन के स्थान पर समय डोमेन में होता है। फ़्रीक्वेंसी डोमेन: हम (a, b, c, d) के एमडीसीटी के लिए a और bR के योगदान को अलग नहीं कर सकते हैं या समकक्ष के परिणाम के लिए-
- आईएमडीसीटी (एमडीसीटी (a, b, c, d)) = (a−bR, b−aR, c+dR, d+cR) / 2.
संयोजन c−dR और इसी प्रकार, जोड़े जाने पर संयोजनों को नष्ट करने के लिए स्पष्ट रूप से सही संकेत प्राप्त होते हैं।
विषम N के लिए (जो संभवतः ही कभी व्यवहार में उपयोग किया जाता है), N/2 एक पूर्णांक नहीं है। इसलिए एमडीसीटी केवल डीसीटी-IV का शिफ्ट क्रमचय नहीं है। इस स्थिति में आधे नमूने द्वारा अतिरिक्त बदलाव का अर्थ यह है कि एमडीसीटी/आईएमडीसीटी डीसीटी-III/II के बराबर हो जाता है और विश्लेषण ऊपर के अनुरूप होता है।
स्मूथनेस और असंततता
हमने ऊपर देखा है कि 2N इनपुट का एमडीसीटी (a, b,c, d) N इनपुट (−cR−d, a−bR) के डीसीटी-IV के बराबर है। डीसीटी-IV को इसके लिए प्रारूपित किया गया है। जहां सही सीमा पर फलन विषम है और इसलिए सही सीमा के निकट मान 0 के पास हैं। यदि इनपुट सिग्नल स्मूथ है। जिससे यह स्थिति है: a और bR के सबसे दाहिने घटक इनपुट अनुक्रम (a, b,c, d) में निरंतर होता हैं और इसलिए उनका अंतर छोटा है। आइए अंतराल के मध्य को देखें: यदि हम उपरोक्त अभिव्यक्ति को (−cR−d, a−bR) = (−d, a)−(b,c)R, दूसरा पद, (b,c) के रूप में पुनः लिखते हैं और बीच में एक स्मूथ संक्रमण प्रदान करता है। चूंकि प्रथम पद में, (-d, a), एक संभावित विच्छिन्नता है। जहाँ -d का दाहिना सिरा a के बाएँ सिरे से मिलता है। यह विंडो फलन का उपयोग करने का कारण होता है। जो इनपुट अनुक्रम (a, b,c, d) की सीमाओं के पास घटकों को 0 की ओर कम करता है।
विंडो एमडीसीटी के लिए टीडीएसी-
ऊपर, टीडीएसी संपत्ति सामान्य एमडीसीटी के लिए प्रमाणित हुई थी। यह प्रदर्शित करते हुए कि पश्चात के ब्लॉकों के आईएमडीसीटीएस को उनके अतिव्यापी आधे भाग में जोड़ने से मुख्य डेटा सही हो जाता है। विंडो वाले एमडीसीटी के लिए इस विपरीत गुण की व्युत्पत्ति केवल थोड़ी अधिक जटिल है।
आकार N के ब्लॉक A,B,C के लिए 2N इनपुट (A,B) और (B,C) के निरंतर समुच्चय ओवरलैप करने पर विचार करें। ऊपर से याद करें कि जब और एमडीसीटी, आईएमडीसीटी हैं और उनके अतिव्यापी आधे भाग में जोड़े गए हैं। हम प्राप्त करते हैं।
अब हम मानते हैं कि हम एमडीसीटी इनपुट और आईएमडीसीटी आउटपुट दोनों को 2N लंबाई के विंडो फलन से गुणा करते हैं। उपरोक्त हम एक सममित विंडो फलन मानते हैं। जो कि फॉर्म का है। जहां W लंबाई-N वेक्टर है और R पहले की प्रकार उत्क्रमण को प्रदर्शित करता है। तब प्रिंसेन-ब्रैडली स्थिति को इस रूप में लिखा जा सकता है और वर्गों और परिवर्धन के साथ इलेमेन्टवाइज प्रदर्शन किया गया है।
इसलिए एमडीसीटी के अतिरिक्त , अब हम एमडीसीटी (सभी गुणाओं के साथ तत्ववार प्रदर्शन किया गया)। जब इसे आईएमडीसीटी किया जाता है और विंडो फलन द्वारा फिर से गुणा (इलीमेन्टवाइज) किया जाता है। जिससे अंतिम-N आधा बन जाता है:
- .
(ध्यान दें कि अब हमारे पास 1/2 से गुणा नहीं है क्योंकि विंडो वाली स्थिति में आईएमडीसीटी सामान्यीकरण 2 के फैक्टर से भिन्न होता है।)
इसी प्रकार विंडो एमडीसीटी और आईएमडीसीटी की को उत्पन्न करता है। इसकी पहली-N छमाही में:
- .
जब हम इन दो भागों को एक साथ जोड़ते हैं। जिससे हम प्राप्त करते हैं:
मूल डेटा पुनर्प्राप्त करना।
यह भी देखें
- असतत कोज्या परिवर्तन
- अन्य अतिव्यापी विंडो वाले फूरियर रूपांतरणों में सम्मिलित होता हैं:
- संग्राहक जटिल लैप्ड रूपांतरण
- शॉर्ट-टाइम फूरियर रूपांतरण
- वेल्च की विधि
- ऑडियो कोडिंग प्रारूप
- ऑडियो संपीड़न (डेटा)
संदर्भ
- ↑ Jones, Graham A.; Layer, David H.; Osenkowsky, Thomas G. (2013). National Association of Broadcasters Engineering Handbook: NAB Engineering Handbook. Taylor & Francis. pp. 558–9. ISBN 978-1-136-03410-7.
- ↑ "Dolby AC-4: Audio Delivery for Next-Generation Entertainment Services" (PDF). Dolby Laboratories. June 2015. Retrieved 11 November 2019.
- ↑ Luo, Fa-Long (2008). Mobile Multimedia Broadcasting Standards: Technology and Practice. Springer Science & Business Media. p. 590. ISBN 9780387782638.
- ↑ Bleidt, R. L.; Sen, D.; Niedermeier, A.; Czelhan, B.; Füg, S.; et al. (2017). "Development of the MPEG-H TV Audio System for ATSC 3.0" (PDF). IEEE Transactions on Broadcasting. 63 (1): 202–236. doi:10.1109/TBC.2017.2661258. S2CID 30821673.
- ↑ Schnell, Markus; Schmidt, Markus; Jander, Manuel; Albert, Tobias; Geiger, Ralf; Ruoppila, Vesa; Ekstrand, Per; Bernhard, Grill (October 2008). MPEG-4 Enhanced Low Delay AAC - A New Standard for High Quality Communication (PDF). 125th AES Convention. Fraunhofer IIS. Audio Engineering Society. Retrieved 20 October 2019.
- ↑ Lutzky, Manfred; Schuller, Gerald; Gayer, Marc; Krämer, Ulrich; Wabnik, Stefan (May 2004). ऑडियो कोडेक विलंब के लिए एक दिशानिर्देश (PDF). 116th AES Convention. Fraunhofer IIS. Audio Engineering Society. Retrieved 24 October 2019.
- ↑ Nagireddi, Sivannarayana (2008). वीओआईपी आवाज और फैक्स सिग्नल प्रोसेसिंग. John Wiley & Sons. p. 69. ISBN 9780470377864.
- ↑ Presentation of the CELT codec by Timothy B. Terriberry (65 minutes of video, see also presentation slides in PDF)
- ↑ "ओपस कोडेक". Opus (Home page). Xiph.org Foundation. Retrieved July 31, 2012.
- ↑ Bright, Peter (2012-09-12). "नया मानकीकृत ओपस ऑडियो कोडेक ऑनलाइन चैट से लेकर संगीत तक हर भूमिका को पूरा करता है". Ars Technica. Retrieved 2014-05-28.
- ↑ Ahmed, Nasir (January 1991). "मैं असतत कोसाइन परिवर्तन के साथ कैसे आया". Digital Signal Processing. 1 (1): 4–5. doi:10.1016/1051-2004(91)90086-Z.
- ↑ Ahmed, Nasir; Natarajan, T.; Rao, K. R. (January 1974), "Discrete Cosine Transform", IEEE Transactions on Computers, C-23 (1): 90–93, doi:10.1109/T-C.1974.223784, S2CID 149806273
- ↑ Princen, John P.; Johnson, A.W.; Bradley, Alan B. (1987). "Subband/Transform coding using filter bank designs based on time domain aliasing cancellation". ICASSP '87. IEEE International Conference on Acoustics, Speech, and Signal Processing. 12: 2161–2164. doi:10.1109/ICASSP.1987.1169405. S2CID 58446992.
- ↑ John P. Princen, Alan B. Bradley: Analysis/synthesis filter bank design based on time domain aliasing cancellation, IEEE Trans. Acoust. Speech Signal Processing, ASSP-34 (5), 1153–1161, 1986. Described a precursor to the MDCT using a combination of discrete cosine and sine transforms.
- ↑ H. S. Malvar, "Lapped Transforms for Efficient Transform/Subband Coding", IEEE Trans. on Acoustics, Speech, and Signal Processing, vol. 38, no. 6, pp. 969–978 (Equation 22), June 1990.
- ↑ H. S. Malvar, "Modulated QMF Filter Banks with Perfect Reconstruction", Electronics Letters, vol. 26, no. 13, pp. 906–907 (Equation 13), June 1990.
ग्रन्थसूची
- Henrique S. Malvar, Signal Processing with Lapped Transforms (Artech House: Norwood MA, 1992).
- A. W. Johnson and A. B. Bradley, "Adaptive transform coding incorporating time domain aliasing cancellation," Speech Comm. 6, 299-308 (1987).
- For algorithms, see examples:
- Chi-Min Liu and Wen-Chieh Lee, "A unified fast algorithm for cosine modulated filterbanks in current audio standards[permanent dead link]", J. Audio Engineering 47 (12), 1061-1075 (1999).
- V. Britanak and K. R. Rao, "A new fast algorithm for the unified forward and inverse एमडीसीटी/MDST computation," Signal Processing 82, 433-459 (2002)
- Vladimir Nikolajevic and Gerhard Fettweis, "Computation of forward and inverse एमडीसीटी using Clenshaw's recurrence formula," IEEE Trans. Sig. Proc. 51 (5), 1439-1444 (2003)
- Che-Hong Chen, Bin-Da Liu, and Jar-Ferr Yang, "Recursive architectures for realizing modified discrete cosine transform and its inverse," IEEE Trans. Circuits Syst. II: Analog Dig. Sig. Proc. 50 (1), 38-45 (2003)
- J.S. Wu, H.Z. Shu, L. Senhadji, and L.M. Luo, "Mixed-radix algorithm for the computation of forward and inverse एमडीसीटीs," IEEE Trans. Circuits Syst. I: Reg. Papers 56 (4), 784-794 (2009)
- V. Britanak, "A survey of efficient एमडीसीटी implementations in MP3 audio coding standard: retrospective and state-of-the-art," Signal. Process. 91 (4), 624-672(2011)