रव रूपण

शोर आकार देना एक ऐसी तकनीक है जिसका उपयोग आमतौर पर डिजिटल ऑडियो, मूर्ति प्रोद्योगिकी और वीडियो प्रसंस्करण में किया जाता है, आमतौर पर डिजिटल सिग्नल की परिमाणीकरण (सिग्नल प्रोसेसिंग) या ऑडियो बिट गहराई |बिट-डेप्थ कमी की प्रक्रिया के हिस्से के रूप में कटौती के संयोजन में। इसका उद्देश्य परिणामी सिग्नल के स्पष्ट सिग्नल-टू-शोर अनुपात को बढ़ाना है। यह त्रुटि के पावर स्पेक्ट्रम को बदलकर ऐसा करता है जो डिथरिंग और परिमाणीकरण द्वारा प्रस्तुत किया जाता है; जैसे कि ध्वनि शक्ति आवृत्ति बैंड में निचले स्तर पर होती है, जिस पर शोर कम वांछनीय माना जाता है और बैंड में तदनुरूप उच्च स्तर पर होता है, जहां इसे अधिक वांछनीय माना जाता है। छवि प्रसंस्करण में उपयोग किया जाने वाला एक लोकप्रिय शोर आकार देने वाला एल्गोरिदम 'फ्लोयड स्टाइनबर्ग डगमगाते हुए' के रूप में जाना जाता है; और ऑडियो प्रोसेसिंग में उपयोग किए जाने वाले कई शोर आकार देने वाले एल्गोरिदम 'सुनने की पूर्ण सीमा' मॉडल पर आधारित हैं।

ऑपरेशन

शोर को आकार देने का काम परिमाणीकरण त्रुटि को प्रतिक्रिया लूप में डालकर किया जाता है। कोई भी फीडबैक लूप फ़िल्टर (सिग्नल प्रोसेसिंग) के रूप में कार्य करता है, इसलिए त्रुटि के लिए फीडबैक लूप बनाकर, त्रुटि को इच्छानुसार फ़िल्टर किया जा सकता है।

उदाहरण के लिए, फीडबैक प्रणाली पर विचार करें:

\ y[n]=x[n]+e[n-1],

कहाँ $y [n]$ आउटपुट नमूना मान है जो क्वांटिज़ेशन (सिग्नल प्रोसेसिंग) होना है, $x [n]$ इनपुट नमूना मान है, $n$ नमूना संख्या है, और $e [n]$ नमूने में प्रस्तुत परिमाणीकरण त्रुटि है $n$ :

\ e[n]=y_{\text{quantized}}[n]-y[n].

इस मॉडल में, जब किसी नमूने की बिट गहराई कम हो जाती है, तो परिमाणित मान और मूल मान के बीच परिमाणीकरण त्रुटि को मापा और संग्रहीत किया जाता है। उस त्रुटि मान को उसके परिमाणीकरण से पहले अगले नमूने में फिर से जोड़ा जाता है। प्रभाव यह है कि परिमाणीकरण त्रुटि लो पास फिल्टर है | लो-पास को 2-सैंपल बॉक्सकार फ़ंक्शन फ़िल्टर द्वारा फ़िल्टर किया जाता है (जिसे मूविंग_एवरेज#सिंपल मूविंग एवरेज के रूप में भी जाना जाता है)। परिणामस्वरूप, पहले की तुलना में, परिमाणीकरण त्रुटि में उच्च आवृत्तियों पर कम शक्ति और कम आवृत्तियों पर उच्च शक्ति होती है।

ध्यान दें कि हम अनुपात को संशोधित करके फ़िल्टर की कटऑफ़ आवृत्ति को समायोजित कर सकते हैं, $b$ , पिछले नमूने की त्रुटि के बारे में जिसे वापस फीड किया गया है:

\ y[n]=x[n]+be[n-1]

अधिक सामान्यतः, किसी भी FIR फ़िल्टर या IIR फ़िल्टर का उपयोग अधिक जटिल आवृत्ति प्रतिक्रिया वक्र बनाने के लिए किया जा सकता है। ऐसे फ़िल्टरों को Least_squares#भारित न्यूनतम वर्ग विधि का उपयोग करके डिज़ाइन किया जा सकता है।^[1] डिजिटल ऑडियो के मामले में, आम तौर पर उपयोग किए जाने वाले वेटिंग फ़ंक्शन को श्रवण वक्र की पूर्ण सीमा से विभाजित किया जाता है, अर्थात।

\ W(f)={\frac {1}{A(f)}}.

शोर को आकार देने में हमेशा प्रक्रिया के भीतर ही उचित मात्रा में तड़पना शामिल होना चाहिए ताकि सिग्नल में निर्धारित और सहसंबद्ध त्रुटियों को रोका जा सके। यदि डिथर का उपयोग नहीं किया जाता है तो शोर आकार देना प्रभावी रूप से केवल विरूपण आकार देने के रूप में कार्य करता है - विरूपण ऊर्जा को विभिन्न आवृत्ति बैंडों में धकेलता है, लेकिन यह अभी भी विरूपण है। यदि इस प्रक्रिया में डीथर जोड़ा जाता है

\ y[n]=x[n]+be[n-1]+\mathrm {dither} ,

तब परिमाणीकरण त्रुटि वास्तव में शोर बन जाती है, और प्रक्रिया वास्तव में शोर को आकार देती है।

डिजिटल ऑडियो में

750 Hz sinusoidal tone sampled at 48 kHz and quantized to 4 bits with no dithering and no noise shaping. This process introduces periodic rounding error with period 64 samples, seen in the frequency domain as harmonics which reach as high as −40 dB with respect to the reference tone.
The same pure tone with triangular dither but no noise shaping. Note that the overall noise power has increased, but no frequencies reach higher than −60 dB.
The same pure tone with triangular dither and noise shaping. Note that the noise is lowest (−80 dB) around 4 kHz where the ear is the most sensitive.

ऑडियो में शोर को आकार देना आमतौर पर बिट-रिडक्शन योजना के रूप में लागू किया जाता है। डिथर का सबसे बुनियादी रूप सपाट, सफेद शोर है। हालाँकि, कान निम्न स्तर पर दूसरों की तुलना में कुछ आवृत्तियों के प्रति कम संवेदनशील होते हैं (समान-ज़ोर समोच्च देखें)। शोर को आकार देने का उपयोग करके परिमाणीकरण त्रुटि को प्रभावी ढंग से चारों ओर फैलाया जा सकता है ताकि इसका अधिक हिस्सा उन आवृत्तियों पर केंद्रित हो जिन्हें सुना नहीं जा सकता है और इसका कम हिस्सा उन आवृत्तियों पर केंद्रित है जिन्हें सुना जा सकता है। इसका परिणाम यह होता है कि जहां कान सबसे अधिक महत्वपूर्ण होते हैं, वहां परिमाणीकरण त्रुटि को काफी कम किया जा सकता है और जहां कान कम संवेदनशील होते हैं, वहां शोर बहुत अधिक होता है। यह सीधे डिथर की तुलना में 4 बिट्स की कथित शोर में कमी दे सकता है।^[2] जबकि 16-बिट ऑडियो को आमतौर पर 96 डीबी की गतिशील रेंज माना जाता है (क्वांटिज़ेशन विरूपण गणना देखें), इसे वास्तव में शोर-आकार के डिथर का उपयोग करके 120 डीबी तक बढ़ाया जा सकता है।^[3]

शोर आकार और 1-बिट कन्वर्टर्स

1989 के आसपास से, 1 बिट डेल्टा-सिग्मा मॉड्यूलेशन|डेल्टा-सिग्मा मॉड्यूलेटर का उपयोग एनॉलॉग से डिजिटल परिवर्तित करने वाला उपकरण में किया गया है। इसमें बहुत उच्च दर पर ऑडियो का नमूना लेना शामिल है (उदाहरण के लिए 2.8224 नमूना आवृत्ति) लेकिन केवल एक बिट का उपयोग करना। क्योंकि केवल 1 बिट का उपयोग किया जाता है, इस कनवर्टर में केवल 6.02 डीबी की गतिशील रेंज होती है। हालाँकि, शोर तल 1.4112 मेगाहर्ट्ज की नाइक्विस्ट आवृत्ति के नीचे संपूर्ण गैर-एलियासिंग आवृत्ति रेंज में फैला हुआ है। शोर आकार देने का उपयोग श्रव्य सीमा (20 हर्ट्ज से 20 किलोहर्ट्ज़) में मौजूद शोर को कम करने और श्रव्य सीमा से ऊपर शोर को बढ़ाने के लिए किया जाता है। इसके परिणामस्वरूप ब्रॉडबैंड डानामिक रेंज केवल 7.78 डीबी है, लेकिन यह फ़्रीक्वेंसी बैंड के बीच सुसंगत नहीं है, और सबसे कम आवृत्तियों (श्रव्य रेंज) में डायनामिक रेंज बहुत अधिक है - 100 डीबी से अधिक। शोर आकार देना स्वाभाविक रूप से डेल्टा-सिग्मा मॉड्यूलेटर में बनाया गया है।

1 बिट कनवर्टर सोनी द्वारा डायरेक्ट स्ट्रीम डिजिटल प्रारूप का आधार है। 1 बिट कनवर्टर (और इस प्रकार डीएसडी सिस्टम) की एक आलोचना यह है कि क्योंकि सिग्नल और फीडबैक लूप दोनों में केवल 1 बिट का उपयोग किया जाता है, फीडबैक लूप में पर्याप्त मात्रा में डिथर का उपयोग नहीं किया जा सकता है और कुछ शर्तों के तहत विरूपण सुना जा सकता है। .^[4]^[5] 2000 के बाद से बनाए गए अधिकांश ए/डी कन्वर्टर्स मल्टी-बिट या मल्टी-लेवल डेल्टा सिग्मा मॉड्यूलेटर का उपयोग करते हैं जो 1 बिट से अधिक आउटपुट उत्पन्न करते हैं ताकि फीडबैक लूप में उचित डीथर जोड़ा जा सके। पारंपरिक पल्स कोड मॉडुलेशन सैंपलिंग के लिए सिग्नल को डेसीमेशन (सिग्नल प्रोसेसिंग) से 44.1 kHz या अन्य उपयुक्त सैंपल दरों पर ले जाया जाता है।

आधुनिक एडीसी में

एनालॉग डिवाइसेज़ जिसे वे नॉइज़ शेपिंग रिक्वांटाइज़र के रूप में संदर्भित करते हैं, उसका उपयोग करते हैं,^[6] और टेक्सस उपकरण ्स जिसे वे SNRBoost के रूप में संदर्भित करते हैं उसका उपयोग करते हैं^[7]^[8] आसपास की आवृत्तियों की तुलना में शोर स्तर को लगभग 30db कम करना। यह गैर-निरंतर संचालन की लागत पर आता है लेकिन स्पेक्ट्रम फर्श पर एक अच्छा बाथटब आकार तैयार करता है। इसे बिट-बूस्ट जैसी अन्य तकनीकों के साथ जोड़ा जा सकता है^[specify] स्पेक्ट्रम के रिज़ॉल्यूशन को और बढ़ाने के लिए।

संदर्भ

↑ Verhelst, Werner; De Koning, Dreten (24 October 2001). Noise shaping filter design for minimally audible signal requantization. IEEE Workshop on Applications of Signal Processing to Audio and Acoustics. IEEE.
↑ Gerzon, Michael; Peter Craven; Robert Stuart; Rhonda Wilson (16–19 March 1993). Psychoacoustic Noise Shaped Improvements in CD and Other Linear Digital Media. 94th Convention of the Audio Engineering Society, Berlin. AES. Preprint 3501.
↑ "24/192 Music Downloads are Very Silly Indeed". xiph.org. Retrieved 2015-08-01.
↑ S. Lipschitz and J. Vanderkooy, "Why Professional 1-Bit Sigma-Delta Conversion is a Bad Idea" AES 109th Convention, Sep 2000
↑ S. Lipschitz and J. Vanderkooy, "Why 1-Bit Sigma-Delta Conversion is Unsuitable for High-Quality Applications" AES 110th convention, May 2001
↑ AD6677 80 MHz Bandwidth IF Receiver (on Page 23)
↑ Using Windowing With SNRBoost3G Technology (PDF)
↑ Understanding Low-Amplitude Behavior of 11-bit ADCs (PDF)

[1] Verhelst, Werner; De Koning, Dreten (24 October 2001). Noise shaping filter design for minimally audible signal requantization. IEEE Workshop on Applications of Signal Processing to Audio and Acoustics. IEEE.

[2] Gerzon, Michael; Peter Craven; Robert Stuart; Rhonda Wilson (16–19 March 1993). Psychoacoustic Noise Shaped Improvements in CD and Other Linear Digital Media. 94th Convention of the Audio Engineering Society, Berlin. AES. Preprint 3501.

[3] "24/192 Music Downloads are Very Silly Indeed". xiph.org. Retrieved 2015-08-01.

[4] S. Lipschitz and J. Vanderkooy, "Why Professional 1-Bit Sigma-Delta Conversion is a Bad Idea" AES 109th Convention, Sep 2000

[5] S. Lipschitz and J. Vanderkooy, "Why 1-Bit Sigma-Delta Conversion is Unsuitable for High-Quality Applications" AES 110th convention, May 2001

[6] AD6677 80 MHz Bandwidth IF Receiver (on Page 23)

[7] Using Windowing With SNRBoost3G Technology (PDF)

[8] Understanding Low-Amplitude Behavior of 11-bit ADCs (PDF)

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

Anonymous

Search

रव रूपण

Namespaces

More

Page actions

Contents

ऑपरेशन

डिजिटल ऑडियो में

शोर आकार और 1-बिट कन्वर्टर्स

आधुनिक एडीसी में

संदर्भ

Navigation

Navigation

Wiki tools

Wiki tools

Anonymous

Search

रव रूपण

ऑपरेशन

डिजिटल ऑडियो में

शोर आकार और 1-बिट कन्वर्टर्स

आधुनिक एडीसी में

संदर्भ

Navigation

Wiki tools

Page tools

Other projects

Categories