रव रूपण: Difference between revisions
m (Arti Shah moved page शोर आकार देना to रव रूपण without leaving a redirect) |
No edit summary |
||
Line 1: | Line 1: | ||
{{short description|Digital signal performance enhancement}} | {{short description|Digital signal performance enhancement}} | ||
शोर आकार देना | शोर आकार देना ऐसी तकनीक है जिसका उपयोग आमतौर पर [[डिजिटल ऑडियो]], [[ मूर्ति प्रोद्योगिकी ]] और [[ वीडियो प्रसंस्करण ]] में किया जाता है, आमतौर पर डिजिटल सिग्नल की [[ परिमाणीकरण (सिग्नल प्रोसेसिंग) ]] या [[ ऑडियो बिट गहराई ]]|बिट-डेप्थ कमी की प्रक्रिया के हिस्से के रूप में [[ कटौती ]] के संयोजन में। इसका उद्देश्य परिणामी सिग्नल के स्पष्ट सिग्नल-टू-शोर अनुपात को बढ़ाना है। यह त्रुटि के [[पावर स्पेक्ट्रम]] को बदलकर ऐसा करता है जो डिथरिंग और परिमाणीकरण द्वारा प्रस्तुत किया जाता है; जैसे कि ध्वनि शक्ति आवृत्ति बैंड में निचले स्तर पर होती है, जिस पर शोर कम वांछनीय माना जाता है और बैंड में तदनुरूप उच्च स्तर पर होता है, जहां इसे अधिक वांछनीय माना जाता है। छवि प्रसंस्करण में उपयोग किया जाने वाला लोकप्रिय शोर आकार देने वाला एल्गोरिदम '[[फ्लोयड स्टाइनबर्ग डगमगाते हुए]]' के रूप में जाना जाता है; और ऑडियो प्रोसेसिंग में उपयोग किए जाने वाले कई शोर आकार देने वाले एल्गोरिदम '[[सुनने की पूर्ण सीमा]]' मॉडल पर आधारित हैं। | ||
== ऑपरेशन == | == ऑपरेशन == | ||
Line 61: | Line 61: | ||
}}</ref> जबकि 16-बिट ऑडियो को आमतौर पर 96 डीबी की गतिशील रेंज माना जाता है (क्वांटिज़ेशन विरूपण गणना देखें), इसे वास्तव में शोर-आकार के डिथर का उपयोग करके 120 डीबी तक बढ़ाया जा सकता है।<ref>{{Cite web|title = 24/192 Music Downloads are Very Silly Indeed|url = http://xiph.org/~xiphmont/demo/neil-young.html|website = xiph.org|access-date = 2015-08-01}}</ref> | }}</ref> जबकि 16-बिट ऑडियो को आमतौर पर 96 डीबी की गतिशील रेंज माना जाता है (क्वांटिज़ेशन विरूपण गणना देखें), इसे वास्तव में शोर-आकार के डिथर का उपयोग करके 120 डीबी तक बढ़ाया जा सकता है।<ref>{{Cite web|title = 24/192 Music Downloads are Very Silly Indeed|url = http://xiph.org/~xiphmont/demo/neil-young.html|website = xiph.org|access-date = 2015-08-01}}</ref> | ||
'''शोर आकार और 1-बिट कन्वर्टर्स''' | |||
1989 के आसपास से, 1 बिट [[डेल्टा-सिग्मा मॉड्यूलेशन]]|डेल्टा-सिग्मा मॉड्यूलेटर का उपयोग [[एनॉलॉग से डिजिटल परिवर्तित करने वाला उपकरण]] में किया गया है। इसमें बहुत उच्च दर पर ऑडियो का नमूना लेना शामिल है (उदाहरण के लिए 2.8224 नमूना आवृत्ति) लेकिन केवल बिट का उपयोग करना। क्योंकि केवल 1 बिट का उपयोग किया जाता है, इस कनवर्टर में केवल 6.02 डीबी की गतिशील रेंज होती है। हालाँकि, शोर तल 1.4112 मेगाहर्ट्ज की [[नाइक्विस्ट आवृत्ति]] के नीचे संपूर्ण गैर-[[ एलियासिंग ]] आवृत्ति रेंज में फैला हुआ है। शोर आकार देने का उपयोग श्रव्य सीमा (20 हर्ट्ज से 20 किलोहर्ट्ज़) में मौजूद शोर को कम करने और श्रव्य सीमा से ऊपर शोर को बढ़ाने के लिए किया जाता है। इसके परिणामस्वरूप ब्रॉडबैंड [[डानामिक रेंज]] केवल 7.78 डीबी है, लेकिन यह फ़्रीक्वेंसी बैंड के बीच सुसंगत नहीं है, और सबसे कम आवृत्तियों (श्रव्य रेंज) में डायनामिक रेंज बहुत अधिक है - 100 डीबी से अधिक। शोर आकार देना स्वाभाविक रूप से डेल्टा-सिग्मा मॉड्यूलेटर में बनाया गया है। | |||
1 बिट कनवर्टर सोनी द्वारा [[डायरेक्ट स्ट्रीम डिजिटल]] प्रारूप का आधार है। 1 बिट कनवर्टर (और इस प्रकार डीएसडी सिस्टम) की आलोचना यह है कि क्योंकि सिग्नल और फीडबैक लूप दोनों में केवल 1 बिट का उपयोग किया जाता है, फीडबैक लूप में पर्याप्त मात्रा में डिथर का उपयोग नहीं किया जा सकता है और कुछ शर्तों के तहत विरूपण सुना जा सकता है। .<ref>S. Lipschitz and J. Vanderkooy, "[http://peufeu.free.fr/audio/extremist_dac/files/1-Bit-Is-Bad.pdf Why Professional 1-Bit Sigma-Delta Conversion is a Bad Idea]" AES 109th Convention, Sep 2000</ref><ref>S. Lipschitz and J. Vanderkooy, "[http://sjeng.org/ftp/SACD.pdf Why 1-Bit Sigma-Delta Conversion is Unsuitable for High-Quality Applications]" AES 110th convention, May 2001</ref> 2000 के बाद से बनाए गए अधिकांश ए/डी कन्वर्टर्स मल्टी-बिट या मल्टी-लेवल डेल्टा सिग्मा मॉड्यूलेटर का उपयोग करते हैं जो 1 बिट से अधिक आउटपुट उत्पन्न करते हैं ताकि फीडबैक लूप में उचित डीथर जोड़ा जा सके। पारंपरिक [[ पल्स कोड मॉडुलेशन ]] सैंपलिंग के लिए सिग्नल को डेसीमेशन (सिग्नल प्रोसेसिंग) से 44.1 kHz या अन्य उपयुक्त सैंपल दरों पर ले जाया जाता है। | |||
1 बिट कनवर्टर सोनी द्वारा [[डायरेक्ट स्ट्रीम डिजिटल]] प्रारूप का आधार है। 1 बिट कनवर्टर (और इस प्रकार डीएसडी सिस्टम) की | |||
=== आधुनिक एडीसी में === | === आधुनिक एडीसी में === | ||
[[एनालॉग डिवाइस]]ेज़ जिसे वे नॉइज़ शेपिंग रिक्वांटाइज़र के रूप में संदर्भित करते हैं, उसका उपयोग करते हैं,<ref>[http://www.analog.com/static/imported-files/data_sheets/AD6677.pdf AD6677 80 MHz Bandwidth IF Receiver] (on Page 23)</ref> और [[ टेक्सस उपकरण ]]्स जिसे वे SNRBoost के रूप में संदर्भित करते हैं उसका उपयोग करते हैं<ref>[http://www.ti.com/lit/pdf/slaa445 Using Windowing With SNRBoost3G Technology] (PDF)</ref><ref>[http://www.ti.com/lit/pdf/sboa133 Understanding Low-Amplitude Behavior of 11-bit ADCs] (PDF)</ref> आसपास की आवृत्तियों की तुलना में शोर स्तर को लगभग 30db कम करना। यह गैर-निरंतर संचालन की लागत पर आता है लेकिन स्पेक्ट्रम फर्श पर | [[एनालॉग डिवाइस]]ेज़ जिसे वे नॉइज़ शेपिंग रिक्वांटाइज़र के रूप में संदर्भित करते हैं, उसका उपयोग करते हैं,<ref>[http://www.analog.com/static/imported-files/data_sheets/AD6677.pdf AD6677 80 MHz Bandwidth IF Receiver] (on Page 23)</ref> और [[ टेक्सस उपकरण ]]्स जिसे वे SNRBoost के रूप में संदर्भित करते हैं उसका उपयोग करते हैं<ref>[http://www.ti.com/lit/pdf/slaa445 Using Windowing With SNRBoost3G Technology] (PDF)</ref><ref>[http://www.ti.com/lit/pdf/sboa133 Understanding Low-Amplitude Behavior of 11-bit ADCs] (PDF)</ref> आसपास की आवृत्तियों की तुलना में शोर स्तर को लगभग 30db कम करना। यह गैर-निरंतर संचालन की लागत पर आता है लेकिन स्पेक्ट्रम फर्श पर अच्छा बाथटब आकार तैयार करता है। इसे बिट-बूस्ट जैसी अन्य तकनीकों के साथ जोड़ा जा सकता है{{specify|reason=No mention found in SNRBoost refs}} स्पेक्ट्रम के रिज़ॉल्यूशन को और बढ़ाने के लिए। | ||
== संदर्भ == | == संदर्भ == |
Revision as of 19:34, 7 October 2023
शोर आकार देना ऐसी तकनीक है जिसका उपयोग आमतौर पर डिजिटल ऑडियो, मूर्ति प्रोद्योगिकी और वीडियो प्रसंस्करण में किया जाता है, आमतौर पर डिजिटल सिग्नल की परिमाणीकरण (सिग्नल प्रोसेसिंग) या ऑडियो बिट गहराई |बिट-डेप्थ कमी की प्रक्रिया के हिस्से के रूप में कटौती के संयोजन में। इसका उद्देश्य परिणामी सिग्नल के स्पष्ट सिग्नल-टू-शोर अनुपात को बढ़ाना है। यह त्रुटि के पावर स्पेक्ट्रम को बदलकर ऐसा करता है जो डिथरिंग और परिमाणीकरण द्वारा प्रस्तुत किया जाता है; जैसे कि ध्वनि शक्ति आवृत्ति बैंड में निचले स्तर पर होती है, जिस पर शोर कम वांछनीय माना जाता है और बैंड में तदनुरूप उच्च स्तर पर होता है, जहां इसे अधिक वांछनीय माना जाता है। छवि प्रसंस्करण में उपयोग किया जाने वाला लोकप्रिय शोर आकार देने वाला एल्गोरिदम 'फ्लोयड स्टाइनबर्ग डगमगाते हुए' के रूप में जाना जाता है; और ऑडियो प्रोसेसिंग में उपयोग किए जाने वाले कई शोर आकार देने वाले एल्गोरिदम 'सुनने की पूर्ण सीमा' मॉडल पर आधारित हैं।
ऑपरेशन
शोर को आकार देने का काम परिमाणीकरण त्रुटि को प्रतिक्रिया लूप में डालकर किया जाता है। कोई भी फीडबैक लूप फ़िल्टर (सिग्नल प्रोसेसिंग) के रूप में कार्य करता है, इसलिए त्रुटि के लिए फीडबैक लूप बनाकर, त्रुटि को इच्छानुसार फ़िल्टर किया जा सकता है।
उदाहरण के लिए, फीडबैक प्रणाली पर विचार करें:
कहाँ y[n] आउटपुट नमूना मान है जो क्वांटिज़ेशन (सिग्नल प्रोसेसिंग) होना है, x[n] इनपुट नमूना मान है, n नमूना संख्या है, और e[n] नमूने में प्रस्तुत परिमाणीकरण त्रुटि है n:
इस मॉडल में, जब किसी नमूने की बिट गहराई कम हो जाती है, तो परिमाणित मान और मूल मान के बीच परिमाणीकरण त्रुटि को मापा और संग्रहीत किया जाता है। उस त्रुटि मान को उसके परिमाणीकरण से पहले अगले नमूने में फिर से जोड़ा जाता है। प्रभाव यह है कि परिमाणीकरण त्रुटि लो पास फिल्टर है | लो-पास को 2-सैंपल बॉक्सकार फ़ंक्शन फ़िल्टर द्वारा फ़िल्टर किया जाता है (जिसे मूविंग_एवरेज#सिंपल मूविंग एवरेज के रूप में भी जाना जाता है)। परिणामस्वरूप, पहले की तुलना में, परिमाणीकरण त्रुटि में उच्च आवृत्तियों पर कम शक्ति और कम आवृत्तियों पर उच्च शक्ति होती है।
ध्यान दें कि हम अनुपात को संशोधित करके फ़िल्टर की कटऑफ़ आवृत्ति को समायोजित कर सकते हैं, b, पिछले नमूने की त्रुटि के बारे में जिसे वापस फीड किया गया है:
अधिक सामान्यतः, किसी भी FIR फ़िल्टर या IIR फ़िल्टर का उपयोग अधिक जटिल आवृत्ति प्रतिक्रिया वक्र बनाने के लिए किया जा सकता है। ऐसे फ़िल्टरों को Least_squares#भारित न्यूनतम वर्ग विधि का उपयोग करके डिज़ाइन किया जा सकता है।[1] डिजिटल ऑडियो के मामले में, आम तौर पर उपयोग किए जाने वाले वेटिंग फ़ंक्शन को श्रवण वक्र की पूर्ण सीमा से विभाजित किया जाता है, अर्थात।
शोर को आकार देने में हमेशा प्रक्रिया के भीतर ही उचित मात्रा में तड़पना शामिल होना चाहिए ताकि सिग्नल में निर्धारित और सहसंबद्ध त्रुटियों को रोका जा सके। यदि डिथर का उपयोग नहीं किया जाता है तो शोर आकार देना प्रभावी रूप से केवल विरूपण आकार देने के रूप में कार्य करता है - विरूपण ऊर्जा को विभिन्न आवृत्ति बैंडों में धकेलता है, लेकिन यह अभी भी विरूपण है। यदि इस प्रक्रिया में डीथर जोड़ा जाता है
तब परिमाणीकरण त्रुटि वास्तव में शोर बन जाती है, और प्रक्रिया वास्तव में शोर को आकार देती है।
डिजिटल ऑडियो में
750 Hz sinusoidal tone sampled at 48 kHz and quantized to 4 bits with no dithering and no noise shaping. This process introduces periodic rounding error with period 64 samples, seen in the frequency domain as harmonics which reach as high as −40 dB with respect to the reference tone.
The same pure tone with triangular dither but no noise shaping. Note that the overall noise power has increased, but no frequencies reach higher than −60 dB.
ऑडियो में शोर को आकार देना आमतौर पर बिट-रिडक्शन योजना के रूप में लागू किया जाता है। डिथर का सबसे बुनियादी रूप सपाट, सफेद शोर है। हालाँकि, कान निम्न स्तर पर दूसरों की तुलना में कुछ आवृत्तियों के प्रति कम संवेदनशील होते हैं (समान-ज़ोर समोच्च देखें)। शोर को आकार देने का उपयोग करके परिमाणीकरण त्रुटि को प्रभावी ढंग से चारों ओर फैलाया जा सकता है ताकि इसका अधिक हिस्सा उन आवृत्तियों पर केंद्रित हो जिन्हें सुना नहीं जा सकता है और इसका कम हिस्सा उन आवृत्तियों पर केंद्रित है जिन्हें सुना जा सकता है। इसका परिणाम यह होता है कि जहां कान सबसे अधिक महत्वपूर्ण होते हैं, वहां परिमाणीकरण त्रुटि को काफी कम किया जा सकता है और जहां कान कम संवेदनशील होते हैं, वहां शोर बहुत अधिक होता है। यह सीधे डिथर की तुलना में 4 बिट्स की कथित शोर में कमी दे सकता है।[2] जबकि 16-बिट ऑडियो को आमतौर पर 96 डीबी की गतिशील रेंज माना जाता है (क्वांटिज़ेशन विरूपण गणना देखें), इसे वास्तव में शोर-आकार के डिथर का उपयोग करके 120 डीबी तक बढ़ाया जा सकता है।[3]
शोर आकार और 1-बिट कन्वर्टर्स
1989 के आसपास से, 1 बिट डेल्टा-सिग्मा मॉड्यूलेशन|डेल्टा-सिग्मा मॉड्यूलेटर का उपयोग एनॉलॉग से डिजिटल परिवर्तित करने वाला उपकरण में किया गया है। इसमें बहुत उच्च दर पर ऑडियो का नमूना लेना शामिल है (उदाहरण के लिए 2.8224 नमूना आवृत्ति) लेकिन केवल बिट का उपयोग करना। क्योंकि केवल 1 बिट का उपयोग किया जाता है, इस कनवर्टर में केवल 6.02 डीबी की गतिशील रेंज होती है। हालाँकि, शोर तल 1.4112 मेगाहर्ट्ज की नाइक्विस्ट आवृत्ति के नीचे संपूर्ण गैर-एलियासिंग आवृत्ति रेंज में फैला हुआ है। शोर आकार देने का उपयोग श्रव्य सीमा (20 हर्ट्ज से 20 किलोहर्ट्ज़) में मौजूद शोर को कम करने और श्रव्य सीमा से ऊपर शोर को बढ़ाने के लिए किया जाता है। इसके परिणामस्वरूप ब्रॉडबैंड डानामिक रेंज केवल 7.78 डीबी है, लेकिन यह फ़्रीक्वेंसी बैंड के बीच सुसंगत नहीं है, और सबसे कम आवृत्तियों (श्रव्य रेंज) में डायनामिक रेंज बहुत अधिक है - 100 डीबी से अधिक। शोर आकार देना स्वाभाविक रूप से डेल्टा-सिग्मा मॉड्यूलेटर में बनाया गया है।
1 बिट कनवर्टर सोनी द्वारा डायरेक्ट स्ट्रीम डिजिटल प्रारूप का आधार है। 1 बिट कनवर्टर (और इस प्रकार डीएसडी सिस्टम) की आलोचना यह है कि क्योंकि सिग्नल और फीडबैक लूप दोनों में केवल 1 बिट का उपयोग किया जाता है, फीडबैक लूप में पर्याप्त मात्रा में डिथर का उपयोग नहीं किया जा सकता है और कुछ शर्तों के तहत विरूपण सुना जा सकता है। .[4][5] 2000 के बाद से बनाए गए अधिकांश ए/डी कन्वर्टर्स मल्टी-बिट या मल्टी-लेवल डेल्टा सिग्मा मॉड्यूलेटर का उपयोग करते हैं जो 1 बिट से अधिक आउटपुट उत्पन्न करते हैं ताकि फीडबैक लूप में उचित डीथर जोड़ा जा सके। पारंपरिक पल्स कोड मॉडुलेशन सैंपलिंग के लिए सिग्नल को डेसीमेशन (सिग्नल प्रोसेसिंग) से 44.1 kHz या अन्य उपयुक्त सैंपल दरों पर ले जाया जाता है।
आधुनिक एडीसी में
एनालॉग डिवाइसेज़ जिसे वे नॉइज़ शेपिंग रिक्वांटाइज़र के रूप में संदर्भित करते हैं, उसका उपयोग करते हैं,[6] और टेक्सस उपकरण ्स जिसे वे SNRBoost के रूप में संदर्भित करते हैं उसका उपयोग करते हैं[7][8] आसपास की आवृत्तियों की तुलना में शोर स्तर को लगभग 30db कम करना। यह गैर-निरंतर संचालन की लागत पर आता है लेकिन स्पेक्ट्रम फर्श पर अच्छा बाथटब आकार तैयार करता है। इसे बिट-बूस्ट जैसी अन्य तकनीकों के साथ जोड़ा जा सकता है[specify] स्पेक्ट्रम के रिज़ॉल्यूशन को और बढ़ाने के लिए।
संदर्भ
- ↑ Verhelst, Werner; De Koning, Dreten (24 October 2001). Noise shaping filter design for minimally audible signal requantization. IEEE Workshop on Applications of Signal Processing to Audio and Acoustics. IEEE.
- ↑ Gerzon, Michael; Peter Craven; Robert Stuart; Rhonda Wilson (16–19 March 1993). Psychoacoustic Noise Shaped Improvements in CD and Other Linear Digital Media. 94th Convention of the Audio Engineering Society, Berlin. AES. Preprint 3501.
- ↑ "24/192 Music Downloads are Very Silly Indeed". xiph.org. Retrieved 2015-08-01.
- ↑ S. Lipschitz and J. Vanderkooy, "Why Professional 1-Bit Sigma-Delta Conversion is a Bad Idea" AES 109th Convention, Sep 2000
- ↑ S. Lipschitz and J. Vanderkooy, "Why 1-Bit Sigma-Delta Conversion is Unsuitable for High-Quality Applications" AES 110th convention, May 2001
- ↑ AD6677 80 MHz Bandwidth IF Receiver (on Page 23)
- ↑ Using Windowing With SNRBoost3G Technology (PDF)
- ↑ Understanding Low-Amplitude Behavior of 11-bit ADCs (PDF)