ट्रांसफॉर्म कोडिंग: Difference between revisions
No edit summary |
No edit summary |
||
Line 1: | Line 1: | ||
ट्रांसफॉर्म कोडिंग ध्वनि रिकॉर्डिंग [[सिग्नल (सूचना सिद्धांत)]] या फोटोग्राफिक | '''ट्रांसफॉर्म कोडिंग''' को मुख्य रूप से ध्वनि की रिकॉर्डिंग करने के लिए [[सिग्नल (सूचना सिद्धांत)|आडियो सिंग्नेल्स (सूचना सिद्धांत)]] या फोटोग्राफिक इमेज के प्रति जैसे प्राकृतिक डेटा के लिए प्रकार का डेटा कंप्रेस्ड करना है। इस प्रकार होने वाले परिवर्तन के फलस्वरूप सामान्यतः अपने आप में लासलेस (पूर्ण रूप से प्रतिवर्ती) होता है, अपितु इसका उपयोग उत्तम (अधिक लक्षित) [[परिमाणीकरण (सिग्नल प्रोसेसिंग)]] को सक्षम करने के लिए किया जाता है, जिसके परिणामस्वरूप मूल इनपुट की कम गुणवत्ता वाली प्रतिलिपि ([[हानिपूर्ण संपीड़न|हानिपूर्ण कंप्रेस्ड]]) होती है। | ||
ट्रांसफॉर्म कोडिंग में, एप्लिकेशन के ज्ञान का उपयोग त्यागने के लिए जानकारी चुनने के लिए किया जाता है, जिससे इसकी [[बैंडविड्थ (कंप्यूटिंग)]] कम हो जाती है। | ट्रांसफॉर्म कोडिंग में, एप्लिकेशन के ज्ञान का उपयोग त्यागने के लिए जानकारी चुनने के लिए किया जाता है, जिससे इसकी [[बैंडविड्थ (कंप्यूटिंग)]] कम हो जाती है। इसके पश्चात शेष जानकारी को विभिन्न विधियों से कंप्रेस्ड किया जा सकता है। जब आउटपुट डीकोड किया जाता है, तो परिणाम मूल इनपुट के समान नहीं हो सकता है, अपितु इस प्रकार एप्लिकेशन के उद्देश्य के लिए पर्याप्त दूरी इसके समीप होने का आशय है। | ||
==रंगीन टेलीविजन== | ==रंगीन टेलीविजन== | ||
{{Details| | {{Details|वाईआईक्यू}} | ||
=== [[एनटीएससी]] === | === [[एनटीएससी]] === | ||
सबसे | सबसे उपयोगी ट्रांसफॉर्म एन्कोडिंग सिस्टम में से को सामान्यतः इस प्रकार संदर्भित नहीं किया जाता है - उदाहरण एनटीएससी रंगीन [[टेलीविजन]] है। जिसके आधार पर 1950 के दशक में अध्ययनों की विस्तृत श्रृंखला के बाद, [[एल्डा बेडफोर्ड]] ने दिखाया कि मानव आंख में केवल काले और सफेद रंग के लिए उच्च रिज़ॉल्यूशन है, इस प्रकार पीले और हरे जैसे मध्य-श्रेणी के रंगों के लिए कुछ सीमा तक कम है, और स्पेक्ट्रम के अंत में रंगों लाल और नीला के लिए बहुत कम है। | ||
इस ज्ञान का उपयोग करके [[आरसीए]] को ऐसी प्रणाली विकसित करने की अनुमति मिली जिसमें उन्होंने कैमरे से आने के बाद अधिकांश नीले सिग्नल को हटा दिया, अधिकांश को हरा और केवल कुछ को लाल रखा | इस ज्ञान का उपयोग करके [[आरसीए]] को ऐसी प्रणाली विकसित करने की अनुमति मिली जिसमें उन्होंने कैमरे से आने के बाद अधिकांश नीले सिग्नल को हटा दिया, अधिकांश को हरा और केवल कुछ को लाल रखा गया था, यह [[YIQ|वाईआईक्यू]] [[ रंगीन स्थान |रंगीन स्थान]] में [[क्रोमा सबसैंपलिंग]] है। | ||
परिणाम काफी कम सामग्री वाला सिग्नल है, जो चरण मॉड्यूलेटेड अंतर सिग्नल के रूप में मौजूदा 6 मेगाहर्ट्ज ब्लैक-एंड-व्हाइट सिग्नल के भीतर फिट होगा। औसत टीवी लाइन पर 350 पिक्सेल के बराबर प्रदर्शित करता है, | परिणाम काफी कम सामग्री वाला सिग्नल है, जो चरण मॉड्यूलेटेड अंतर सिग्नल के रूप में मौजूदा 6 मेगाहर्ट्ज ब्लैक-एंड-व्हाइट सिग्नल के भीतर फिट होगा। औसत टीवी लाइन पर 350 पिक्सेल के बराबर प्रदर्शित करता है, अपितु टीवी सिग्नल में नीले रंग के केवल 50 पिक्सेल और संभवतः लाल रंग के 150 पिक्सेल के लिए पर्याप्त जानकारी होती है। इस प्रकार अधिकांश स्थितियों में यह दर्शकों को स्पष्ट नहीं होता है, क्योंकि आंखें वैसे भी लुप्त जानकारी का बहुत कम उपयोग करती हैं। | ||
=== | === पीएएल और सेकम === | ||
पीएएल और सेकम सिस्टम रंग संचारित करने के लिए लगभग समान या बहुत समान विधियों का उपयोग करते हैं। किसी भी स्थिति में दोनों प्रणालियाँ उप-प्रमाणीकरण हैं। | |||
==डिजिटल== | ==डिजिटल== | ||
यह शब्द | यह शब्द सामान्यतः [[ डिजीटल मीडिया |डिजीटल मीडिया]] और [[ अंकीय संकेत प्रक्रिया |अंकीय संकेत प्रक्रिया]] में अधिक उपयोग किया जाता है। इस संबंध में सबसे व्यापक रूप से उपयोग की जाने वाली ट्रांसफ़ॉर्म कोडिंग तकनीक [[असतत कोसाइन परिवर्तन]] (डीसीटी) है,<ref name="Muchahary">{{cite book |last1=Muchahary |first1=D. |last2=Mondal |first2=A. J. |last3=Parmar |first3=R. S. |last4=Borah |first4=A. D. |last5=Majumder |first5=A. |title=2015 Fifth International Conference on Communication Systems and Network Technologies |chapter=A Simplified Design Approach for Efficient Computation of DCT |date=2015 |pages=483–487 |doi=10.1109/CSNT.2015.134|isbn=978-1-4799-1797-6 |s2cid=16411333 }}</ref><ref>{{cite book |last1=Chen |first1=Wai Kai |title=इलेक्ट्रिकल इंजीनियरिंग हैंडबुक|date=2004 |publisher=[[Elsevier]] |isbn=9780080477480 |page=906 |url=https://books.google.com/books?id=qhHsSlazGrQC&pg=PA906}}</ref> इसके आधार पर 1972 में एन. अहमद द्वारा प्रस्तावित,<ref name="Ahmed">{{cite journal |last=Ahmed |first=Nasir |author-link=N. Ahmed |title=मैं असतत कोसाइन परिवर्तन के साथ कैसे आया|journal=[[Digital Signal Processing (journal)|Digital Signal Processing]] |date=January 1991 |volume=1 |issue=1 |pages=4–5 |doi=10.1016/1051-2004(91)90086-Z |url=https://www.scribd.com/doc/52879771/DCT-History-How-I-Came-Up-with-the-Discrete-Cosine-Transform}}</ref><ref name="Stankovic">{{cite journal |last1=Stanković |first1=Radomir S. |last2=Astola |first2=Jaakko T. |title=Reminiscences of the Early Work in DCT: Interview with K.R. Rao |journal=Reprints from the Early Days of Information Sciences |date=2012 |volume=60 |url=http://ticsp.cs.tut.fi/reports/ticsp-report-60-reprint-rao-corrected.pdf |access-date=13 October 2019}}</ref> और 1974 में अहमद द्वारा टी. नटराजन और के.आर. राव के साथ प्रस्तुत किया गया था।<ref name="pubDCT">{{Citation |first1=Nasir |last1=Ahmed |author1-link=N. Ahmed |first2=T. |last2=Natarajan |first3=K. R. |last3=Rao |title=Discrete Cosine Transform |journal=IEEE Transactions on Computers |date=January 1974 |volume=C-23 |issue=1 |pages=90–93 |doi=10.1109/T-C.1974.223784|s2cid=149806273 }}</ref> इस प्रकार असतत कोसाइन परिवर्तनों के परिवार के संदर्भ में यह डीसीटी, डीसीटी-II है। इस प्रकार यह सामान्य [[JPEG|जेपीईजी]] [[छवि संपीड़न|इमेज कंप्रेस्ड]] मानक का आधार है,<ref name="t81">{{cite web |title=T.81 – Digital compression and coding of continuous-tone still images – Requirements and guidelines |url=https://www.w3.org/Graphics/JPEG/itu-t81.pdf |publisher=[[CCITT]] |date=September 1992 |access-date=12 July 2019}}</ref> जो इमेज के छोटे ब्लॉकों की जांच करता है और उन्हें अधिक कुशल परिमाणीकरण (हानिपूर्ण) और डेटा कंप्रेस्ड के लिए [[आवृत्ति डोमेन]] में परिवर्तित कर देता है। जिसके कारण [[वीडियो कोडिंग]] में, एच.26एक्स और एमपीईजी मानक गति क्षतिपूर्ति का उपयोग करके मोशन इमेज में फ्रेम में इस डीसीटी इमेज कंप्रेस्ड तकनीक को संशोधित करते हैं, जिससे जेपीईजी की श्रृंखला की तुलना में आकार कम हो जाता है। | ||
[[ऑडियो कोडिंग]] में, [[एमपीईजी]] ऑडियो | [[ऑडियो कोडिंग]] में, [[एमपीईजी]] ऑडियो कंप्रेस्ड [[मनोध्वनिक मॉडल]] के अनुसार रूपांतरित डेटा का विश्लेषण करता है जो टीवी मॉडल के समान, सिग्नल के कुछ हिस्सों के प्रति मानव कान की संवेदनशीलता का वर्णन करता है। इस प्रकार [[बिका हुआ]] संशोधित असतत कोसाइन ट्रांसफॉर्म (एमडीसीटी) और [[फास्ट फूरियर ट्रांसफॉर्म]] (एफएफटी) को मिलाकर हाइब्रिड कोडिंग एल्गोरिदम का उपयोग करता है।<ref name="Guckert">{{cite web |last1=Guckert |first1=John |title=The Use of FFT and MDCT in MP3 Audio Compression |url=http://www.math.utah.edu/~gustafso/s2012/2270/web-projects/Guckert-audio-compression-svd-mdct-MP3.pdf |website=[[University of Utah]] |date=Spring 2012 |access-date=14 July 2019}}</ref> इसे [[उन्नत ऑडियो कोडिंग]] (एएसी) द्वारा सफल बनाया गया, जो कंप्रेस्ड दक्षता में उल्लेखनीय सुधार के लिए शुद्ध एमडीसीटी एल्गोरिदम का उपयोग करता है।<ref name=brandenburg>{{cite web|url=http://graphics.ethz.ch/teaching/mmcom12/slides/mp3_and_aac_brandenburg.pdf|title=MP3 and AAC Explained|last=Brandenburg|first=Karlheinz|year=1999|url-status=live|archive-url=https://web.archive.org/web/20170213191747/https://graphics.ethz.ch/teaching/mmcom12/slides/mp3_and_aac_brandenburg.pdf|archive-date=2017-02-13}}</ref> | ||
एनालॉग सिग्नल को [[अंकीयकरण]] करने की मूल प्रक्रिया प्रकार की ट्रांसफ़ॉर्म कोडिंग है जो ट्रांसफ़ॉर्म के रूप में या अधिक डोमेन में [[ नमूना (संकेत) | | एनालॉग सिग्नल को [[अंकीयकरण|डिजिटाईजिंग]] करने की मूल प्रक्रिया प्रकार की ट्रांसफ़ॉर्म कोडिंग है जो ट्रांसफ़ॉर्म के रूप में या अधिक डोमेन में [[ नमूना (संकेत) |सैम्पलिंग (संकेत)]] का उपयोग करती है। | ||
==यह भी देखें== | ==यह भी देखें== | ||
* करहुनेन-लोवे प्रमेय | * करहुनेन-लोवे प्रमेय | ||
* [[परिवर्तन (कार्य)]] | * [[परिवर्तन (कार्य)]] | ||
* [[तरंगिका परिवर्तन]] | * [[तरंगिका परिवर्तन|वेवलेट परिवर्तन]] | ||
==संदर्भ== | ==संदर्भ== |
Revision as of 23:31, 12 December 2023
ट्रांसफॉर्म कोडिंग को मुख्य रूप से ध्वनि की रिकॉर्डिंग करने के लिए आडियो सिंग्नेल्स (सूचना सिद्धांत) या फोटोग्राफिक इमेज के प्रति जैसे प्राकृतिक डेटा के लिए प्रकार का डेटा कंप्रेस्ड करना है। इस प्रकार होने वाले परिवर्तन के फलस्वरूप सामान्यतः अपने आप में लासलेस (पूर्ण रूप से प्रतिवर्ती) होता है, अपितु इसका उपयोग उत्तम (अधिक लक्षित) परिमाणीकरण (सिग्नल प्रोसेसिंग) को सक्षम करने के लिए किया जाता है, जिसके परिणामस्वरूप मूल इनपुट की कम गुणवत्ता वाली प्रतिलिपि (हानिपूर्ण कंप्रेस्ड) होती है।
ट्रांसफॉर्म कोडिंग में, एप्लिकेशन के ज्ञान का उपयोग त्यागने के लिए जानकारी चुनने के लिए किया जाता है, जिससे इसकी बैंडविड्थ (कंप्यूटिंग) कम हो जाती है। इसके पश्चात शेष जानकारी को विभिन्न विधियों से कंप्रेस्ड किया जा सकता है। जब आउटपुट डीकोड किया जाता है, तो परिणाम मूल इनपुट के समान नहीं हो सकता है, अपितु इस प्रकार एप्लिकेशन के उद्देश्य के लिए पर्याप्त दूरी इसके समीप होने का आशय है।
रंगीन टेलीविजन
एनटीएससी
सबसे उपयोगी ट्रांसफॉर्म एन्कोडिंग सिस्टम में से को सामान्यतः इस प्रकार संदर्भित नहीं किया जाता है - उदाहरण एनटीएससी रंगीन टेलीविजन है। जिसके आधार पर 1950 के दशक में अध्ययनों की विस्तृत श्रृंखला के बाद, एल्डा बेडफोर्ड ने दिखाया कि मानव आंख में केवल काले और सफेद रंग के लिए उच्च रिज़ॉल्यूशन है, इस प्रकार पीले और हरे जैसे मध्य-श्रेणी के रंगों के लिए कुछ सीमा तक कम है, और स्पेक्ट्रम के अंत में रंगों लाल और नीला के लिए बहुत कम है।
इस ज्ञान का उपयोग करके आरसीए को ऐसी प्रणाली विकसित करने की अनुमति मिली जिसमें उन्होंने कैमरे से आने के बाद अधिकांश नीले सिग्नल को हटा दिया, अधिकांश को हरा और केवल कुछ को लाल रखा गया था, यह वाईआईक्यू रंगीन स्थान में क्रोमा सबसैंपलिंग है।
परिणाम काफी कम सामग्री वाला सिग्नल है, जो चरण मॉड्यूलेटेड अंतर सिग्नल के रूप में मौजूदा 6 मेगाहर्ट्ज ब्लैक-एंड-व्हाइट सिग्नल के भीतर फिट होगा। औसत टीवी लाइन पर 350 पिक्सेल के बराबर प्रदर्शित करता है, अपितु टीवी सिग्नल में नीले रंग के केवल 50 पिक्सेल और संभवतः लाल रंग के 150 पिक्सेल के लिए पर्याप्त जानकारी होती है। इस प्रकार अधिकांश स्थितियों में यह दर्शकों को स्पष्ट नहीं होता है, क्योंकि आंखें वैसे भी लुप्त जानकारी का बहुत कम उपयोग करती हैं।
पीएएल और सेकम
पीएएल और सेकम सिस्टम रंग संचारित करने के लिए लगभग समान या बहुत समान विधियों का उपयोग करते हैं। किसी भी स्थिति में दोनों प्रणालियाँ उप-प्रमाणीकरण हैं।
डिजिटल
यह शब्द सामान्यतः डिजीटल मीडिया और अंकीय संकेत प्रक्रिया में अधिक उपयोग किया जाता है। इस संबंध में सबसे व्यापक रूप से उपयोग की जाने वाली ट्रांसफ़ॉर्म कोडिंग तकनीक असतत कोसाइन परिवर्तन (डीसीटी) है,[1][2] इसके आधार पर 1972 में एन. अहमद द्वारा प्रस्तावित,[3][4] और 1974 में अहमद द्वारा टी. नटराजन और के.आर. राव के साथ प्रस्तुत किया गया था।[5] इस प्रकार असतत कोसाइन परिवर्तनों के परिवार के संदर्भ में यह डीसीटी, डीसीटी-II है। इस प्रकार यह सामान्य जेपीईजी इमेज कंप्रेस्ड मानक का आधार है,[6] जो इमेज के छोटे ब्लॉकों की जांच करता है और उन्हें अधिक कुशल परिमाणीकरण (हानिपूर्ण) और डेटा कंप्रेस्ड के लिए आवृत्ति डोमेन में परिवर्तित कर देता है। जिसके कारण वीडियो कोडिंग में, एच.26एक्स और एमपीईजी मानक गति क्षतिपूर्ति का उपयोग करके मोशन इमेज में फ्रेम में इस डीसीटी इमेज कंप्रेस्ड तकनीक को संशोधित करते हैं, जिससे जेपीईजी की श्रृंखला की तुलना में आकार कम हो जाता है।
ऑडियो कोडिंग में, एमपीईजी ऑडियो कंप्रेस्ड मनोध्वनिक मॉडल के अनुसार रूपांतरित डेटा का विश्लेषण करता है जो टीवी मॉडल के समान, सिग्नल के कुछ हिस्सों के प्रति मानव कान की संवेदनशीलता का वर्णन करता है। इस प्रकार बिका हुआ संशोधित असतत कोसाइन ट्रांसफॉर्म (एमडीसीटी) और फास्ट फूरियर ट्रांसफॉर्म (एफएफटी) को मिलाकर हाइब्रिड कोडिंग एल्गोरिदम का उपयोग करता है।[7] इसे उन्नत ऑडियो कोडिंग (एएसी) द्वारा सफल बनाया गया, जो कंप्रेस्ड दक्षता में उल्लेखनीय सुधार के लिए शुद्ध एमडीसीटी एल्गोरिदम का उपयोग करता है।[8]
एनालॉग सिग्नल को डिजिटाईजिंग करने की मूल प्रक्रिया प्रकार की ट्रांसफ़ॉर्म कोडिंग है जो ट्रांसफ़ॉर्म के रूप में या अधिक डोमेन में सैम्पलिंग (संकेत) का उपयोग करती है।
यह भी देखें
- करहुनेन-लोवे प्रमेय
- परिवर्तन (कार्य)
- वेवलेट परिवर्तन
संदर्भ
- ↑ Muchahary, D.; Mondal, A. J.; Parmar, R. S.; Borah, A. D.; Majumder, A. (2015). "A Simplified Design Approach for Efficient Computation of DCT". 2015 Fifth International Conference on Communication Systems and Network Technologies. pp. 483–487. doi:10.1109/CSNT.2015.134. ISBN 978-1-4799-1797-6. S2CID 16411333.
- ↑ Chen, Wai Kai (2004). इलेक्ट्रिकल इंजीनियरिंग हैंडबुक. Elsevier. p. 906. ISBN 9780080477480.
- ↑ Ahmed, Nasir (January 1991). "मैं असतत कोसाइन परिवर्तन के साथ कैसे आया". Digital Signal Processing. 1 (1): 4–5. doi:10.1016/1051-2004(91)90086-Z.
- ↑ Stanković, Radomir S.; Astola, Jaakko T. (2012). "Reminiscences of the Early Work in DCT: Interview with K.R. Rao" (PDF). Reprints from the Early Days of Information Sciences. 60. Retrieved 13 October 2019.
- ↑ Ahmed, Nasir; Natarajan, T.; Rao, K. R. (January 1974), "Discrete Cosine Transform", IEEE Transactions on Computers, C-23 (1): 90–93, doi:10.1109/T-C.1974.223784, S2CID 149806273
- ↑ "T.81 – Digital compression and coding of continuous-tone still images – Requirements and guidelines" (PDF). CCITT. September 1992. Retrieved 12 July 2019.
- ↑ Guckert, John (Spring 2012). "The Use of FFT and MDCT in MP3 Audio Compression" (PDF). University of Utah. Retrieved 14 July 2019.
- ↑ Brandenburg, Karlheinz (1999). "MP3 and AAC Explained" (PDF). Archived (PDF) from the original on 2017-02-13.