रव रूपण: Difference between revisions

From Vigyanwiki
m (Arti Shah moved page शोर आकार देना to रव रूपण without leaving a redirect)
m (9 revisions imported from alpha:रव_रूपण)
 
(6 intermediate revisions by 2 users not shown)
Line 1: Line 1:
{{short description|Digital signal performance enhancement}}
{{short description|Digital signal performance enhancement}}
शोर आकार देना एक ऐसी तकनीक है जिसका उपयोग आमतौर पर [[डिजिटल ऑडियो]], [[ मूर्ति प्रोद्योगिकी ]] और [[ वीडियो प्रसंस्करण ]] में किया जाता है, आमतौर पर डिजिटल सिग्नल की [[ परिमाणीकरण (सिग्नल प्रोसेसिंग) ]] या [[ ऑडियो बिट गहराई ]]|बिट-डेप्थ कमी की प्रक्रिया के हिस्से के रूप में [[ कटौती ]] के संयोजन में। इसका उद्देश्य परिणामी सिग्नल के स्पष्ट सिग्नल-टू-शोर अनुपात को बढ़ाना है। यह त्रुटि के [[पावर स्पेक्ट्रम]] को बदलकर ऐसा करता है जो डिथरिंग और परिमाणीकरण द्वारा प्रस्तुत किया जाता है; जैसे कि ध्वनि शक्ति आवृत्ति बैंड में निचले स्तर पर होती है, जिस पर शोर कम वांछनीय माना जाता है और बैंड में तदनुरूप उच्च स्तर पर होता है, जहां इसे अधिक वांछनीय माना जाता है। छवि प्रसंस्करण में उपयोग किया जाने वाला एक लोकप्रिय शोर आकार देने वाला एल्गोरिदम '[[फ्लोयड स्टाइनबर्ग डगमगाते हुए]]' के रूप में जाना जाता है; और ऑडियो प्रोसेसिंग में उपयोग किए जाने वाले कई शोर आकार देने वाले एल्गोरिदम '[[सुनने की पूर्ण सीमा]]' मॉडल पर आधारित हैं।
'''नॉइज़ शेपिंग''' देना ऐसी टेकनीक है जिसका उपयोग सामान्यतः [[डिजिटल ऑडियो]], [[ मूर्ति प्रोद्योगिकी |इमेज]] और [[ वीडियो प्रसंस्करण |वीडियो प्रोसेसिंग]] में किया जाता है, सामान्यतः डिजिटल सिग्नल की [[ परिमाणीकरण (सिग्नल प्रोसेसिंग) |क्वान्टिजेशन (सिग्नल प्रोसेसिंग)]] या [[ ऑडियो बिट गहराई |ऑडियो बिट डेप्थ]] रिडक्शन के प्रोसेस के भाग के रूप में [[ कटौती |डिथरिंग]] के कॉम्बिनेशन में इसका उद्देश्य रिजल्टएंट सिग्नल के स्पष्ट सिग्नल-टू-नॉइज़ अनुपात को इनक्रीस करना है। यह एरर के [[पावर स्पेक्ट्रम]] को परिवर्तित करके ऐसा करता है जो डिथरिंग और क्वान्टिजेशन द्वारा प्रस्तुत किया जाता है; जैसे कि नॉइज़ पॉवर फ्रीक्वेंसी बैंड में लो लेवल पर होती है, जिस पर नॉइज़ कम डिजायरेबल माना जाता है और बैंड करेस्पोंडिंगली हाई लेवल पर होता है, जहां इसे अधिक डिजायरेबल माना जाता है। इमेज प्रोसेसिंग में उपयोग किया जाने वाला पोपुलर नॉइज़ शेपिंग देने वाला एल्गोरिदम '[[फ्लोयड स्टाइनबर्ग डगमगाते हुए|फ्लोयड स्टाइनबर्ग डिथरिंग]]' के रूप में जाना जाता है; और ऑडियो प्रोसेसिंग में उपयोग किए जाने वाले कई नॉइज़ शेपिंग देने वाले एल्गोरिदम '[[सुनने की पूर्ण सीमा|अब्सोल्यूट थ्रेसहोल्ड हियरिंग]]' मॉडल पर आधारित हैं।


== ऑपरेशन ==
== ऑपरेशन ==


शोर को आकार देने का काम परिमाणीकरण त्रुटि को [[ प्रतिक्रिया ]] लूप में डालकर किया जाता है। कोई भी फीडबैक लूप [[फ़िल्टर (सिग्नल प्रोसेसिंग)]] के रूप में कार्य करता है, इसलिए त्रुटि के लिए फीडबैक लूप बनाकर, त्रुटि को इच्छानुसार फ़िल्टर किया जा सकता है।
कोई भी फीडबैक लूप [[फ़िल्टर (सिग्नल प्रोसेसिंग)]] के रूप में कार्य करता है, डिजायरेबल नॉइज़ को फ़िल्टर करने के लिए डिज़ाइन किए गए फीडबैक लूप में क्वान्टिजेशन नॉइज़ क्रिएट करके नॉइज़ को शेप देने का कार्य किया जाता है।  


उदाहरण के लिए, फीडबैक प्रणाली पर विचार करें:
==== '''लो-पास बॉक्सकार फ़िल्टर उदाहरण:''' ====
उदाहरण के लिए, फीडबैक सिस्टम पर विचार करें:


: <math>\ y[n] = x[n] + e[n-1],</math>
: <math>\ y[n] = x[n] + b e[n-1] </math>
कहाँ {{math|''y''[''n'']}} आउटपुट नमूना मान है जो क्वांटिज़ेशन (सिग्नल प्रोसेसिंग) होना है, {{math|''x''[''n'']}} इनपुट नमूना मान है, {{mvar|n}} नमूना संख्या है, और {{math|''e''[''n'']}} नमूने में प्रस्तुत परिमाणीकरण त्रुटि है {{mvar|n}}:
जहाँ b कांस्टेंट है, {{mvar|n}} साइकिल नंबर है, {{math|''x''[''n'']}} इनपुट सैंपल वैल्यू है, {{math|''y''[''n'']}} क्वांटिज़ेड किया जा रहा मान है, और {{math|''e''[''n'']}} इसकी क्वान्टिजेशन एरर है:


: <math>\ e[n] = y_\text{quantized}[n] - y[n].</math>
: <math>\ e[n] = y_\text{quantized}[n] - y[n].</math>
इस मॉडल में, जब किसी नमूने की बिट गहराई कम हो जाती है, तो परिमाणित मान और मूल मान के बीच परिमाणीकरण त्रुटि को मापा और संग्रहीत किया जाता है। उस त्रुटि मान को उसके परिमाणीकरण से पहले अगले नमूने में फिर से जोड़ा जाता है। प्रभाव यह है कि परिमाणीकरण त्रुटि [[लो पास फिल्टर]] है | लो-पास को 2-सैंपल [[बॉक्सकार फ़ंक्शन]] फ़िल्टर द्वारा फ़िल्टर किया जाता है (जिसे मूविंग_एवरेज#सिंपल मूविंग एवरेज के रूप में भी जाना जाता है)परिणामस्वरूप, पहले की तुलना में, परिमाणीकरण त्रुटि में उच्च आवृत्तियों पर कम शक्ति और कम आवृत्तियों पर उच्च शक्ति होती है।
इस मॉडल में, जब किसी सैंपल की बिट डेप्थ कम हो जाती है, तो क्वान्टिजेशन एरर को मापा जाता है और नेक्स्ट साइकिल पर क्वान्टिजेशन से पहले नेक्स्ट सैंपल के साथ ऐड किया  जाता है। इसका प्रभाव यह है कि क्वान्टिजेशन एरर को 2-सैंपल [[बॉक्सकार फ़ंक्शन|बॉक्सकार फ़िल्टर]] (जिसे सिंपल मूविंग एवरेज फ़िल्टर के रूप में भी जाना जाता है) द्वारा [[लो पास फिल्टर]] किया जाता है। परिणामस्वरूप, पहले की कम्पेयर में, क्वान्टिजेशन एरर में हाई फ्रीक्वेंसी पर लो पॉवर और लो फ्रीक्वेंसी पर हाई पॉवर होती है। फ़िल्टर की कटऑफ़ फ्रीक्वेंसी {{mvar|b}} को मॉडिफाई करके समायोजित किया जा सकता है, जो पिछले सैंपल से एरर का अनुपात है, जिसे फेड बैक किया जाता है।


ध्यान दें कि हम अनुपात को संशोधित करके फ़िल्टर की कटऑफ़ आवृत्ति को समायोजित कर सकते हैं, {{mvar|b}}, पिछले नमूने की त्रुटि के बारे में जिसे वापस फीड किया गया है:
==== '''सामान्यतः इम्पल्स रेस्पोंस फ़िल्टर''' ====
 
अधिक सामान्यतः, किसी भी एफआईआर फ़िल्टर या आईआईआर फ़िल्टर का उपयोग अधिक काम्प्लेक्स [[आवृत्ति प्रतिक्रिया|फ्रीक्वेंसी रेस्पोंस]] कर्व बनाने के लिए किया जा सकता है। ऐसे फ़िल्टरों को वेटेड लीस्ट स्क्वायर मेथड का उपयोग करके डिज़ाइन किया जा सकता है।<ref>{{cite conference
: <math>\ y[n] = x[n] + b e[n-1] </math>
अधिक सामान्यतः, किसी भी FIR फ़िल्टर या IIR फ़िल्टर का उपयोग अधिक जटिल [[आवृत्ति प्रतिक्रिया]] वक्र बनाने के लिए किया जा सकता है। ऐसे फ़िल्टरों को Least_squares#भारित न्यूनतम वर्ग विधि का उपयोग करके डिज़ाइन किया जा सकता है।<ref>{{cite conference
| title        = Noise shaping filter design for minimally audible signal requantization
| title        = Noise shaping filter design for minimally audible signal requantization
| first1        = Werner
| first1        = Werner
Line 27: Line 26:
| conference-url = http://www.waspaa.com/
| conference-url = http://www.waspaa.com/
| publisher    = [[IEEE]]
| publisher    = [[IEEE]]
}}</ref> डिजिटल ऑडियो के मामले में, आम तौर पर उपयोग किए जाने वाले वेटिंग फ़ंक्शन को श्रवण वक्र की पूर्ण सीमा से विभाजित किया जाता है, अर्थात।
}}</ref> डिजिटल ऑडियो के केस में, सामान्यतः उपयोग किए जाने वाले वेटिंग फ़ंक्शन को हियरिंग कर्व की अब्सोल्यूट थ्रेसहोल्ड से डिवाइड किया जाता है, अर्थात


: <math>\ W(f) = \frac{1}{A(f)}.</math>
: <math>\ W(f) = \frac{1}{A(f)}.</math>
शोर को आकार देने में हमेशा प्रक्रिया के भीतर ही उचित मात्रा में [[ तड़पना ]] शामिल होना चाहिए ताकि सिग्नल में निर्धारित और सहसंबद्ध त्रुटियों को रोका जा सके। यदि डिथर का उपयोग नहीं किया जाता है तो शोर आकार देना प्रभावी रूप से केवल विरूपण आकार देने के रूप में कार्य करता है - विरूपण ऊर्जा को विभिन्न आवृत्ति बैंडों में धकेलता है, लेकिन यह अभी भी विरूपण है। यदि इस प्रक्रिया में डीथर जोड़ा जाता है
 
==== '''डिथरिंग''' ====
क्वान्टिजेशन के समय उचित अमाउंट डीथर ऐड करने से सिग्नल से संबंधित डेटर्मिनाबल एररस को प्रिवेंट किया जा सकता है। यदि डिथर का उपयोग नहीं किया जाता है तो नॉइज़ शेपिंग देना एफ्फेक्टिवेली रूप से केवल डिस्टॉरशन शेपिंग देने के रूप में कार्य करता है- डिस्टॉरशन एनर्जी को विभिन्न फ्रीक्वेंसी बैंडों में पुश करता है, किंतु यह अभी भी डिस्टॉरशन है। यदि इस प्रोसेस में डीथर ऐड किया जाता है:


:<math>\ y[n] = x[n] + b e[n-1] + \mathrm{dither},</math>
:<math>\ y[n] = x[n] + b e[n-1] + \mathrm{dither},</math>
तब परिमाणीकरण त्रुटि वास्तव में शोर बन जाती है, और प्रक्रिया वास्तव में शोर को आकार देती है।
तब क्वान्टिजेशन एरर वास्तव में नॉइज़ बन जाती है, और प्रोसेस वास्तव में नॉइज़ को शेपिंग देती है।


== डिजिटल ऑडियो में ==
== डिजिटल ऑडियो में ==
Line 40: Line 41:
|align=center
|align=center
|File:Quantization nodither noshaping spectrum.png
|File:Quantization nodither noshaping spectrum.png
  |750 Hz sinusoidal tone sampled at 48 kHz and quantized to 4 bits with no dithering and no noise shaping. This process introduces [[Periodic function|periodic]] rounding error with period 64 samples, seen in the [[frequency domain]] as [[harmonics]] which reach as high as &minus;40 [[Decibel|dB]] with respect to the reference tone.
  |750 हर्ट्ज़ साइनसोइडल टोन को 48 किलोहर्ट्ज़ पर सैंपल किया गया और बिना किसी डिथरिंग और बिना किसी नॉइज़ शेप के 4 बिट्स तक क्वांटीजेड किया गया। यह प्रक्रिया अवधि 64 सैंपल के साथ [[पेरोडिक फ़ंक्शन|पेरोडिक]] रौंडिंग एरर प्रस्तुत करती है, जिसे [[फ्रीक्वेंसी डोमेन]] में [[हार्मोनिक्स]] के रूप में देखा जाता है, जो सम्मान के साथ रिफरेन्स टोन के लिए &minus;40 [[डेसीबल|dB]] तक पहुंच जाता है।
 


|File:Quantization dither noshaping spectrum.png
|File:Quantization dither noshaping spectrum.png
  |The same pure tone with [[Triangular distribution|triangular]] [[dither]] but no noise shaping. Note that the overall noise power has increased, but no frequencies reach higher than &minus;60 dB.
  |[[ट्रेगुलर डिस्ट्रीब्यूशन|ट्रेगुलर]] [[डिथर]] के साथ वही प्योर टोन किंतु कोई नॉइज़ शेप नहीं। ध्यान दें कि ओवरआल नॉइज़ से पॉवर इनक्रीस हुई है, किंतु कोई भी फ्रीक्वेंसी -60 डीबी से अधिक नहीं पहुंचती है।|File:Quantization shaped dither spectrum.png
|File:Quantization shaped dither spectrum.png
  |ट्रेगुलर डीथर और नॉइज़ शेप के साथ वही प्योर टोन। ध्यान दें कि नॉइज़ सबसे लोवेस्ट (&minus;80 dB) 4 किलोहर्ट्ज़ के अराउंड है जहां इअर सबसे अधिक सेंसिटिव है।}}
  |The same pure tone with triangular dither and noise shaping. Note that the noise is lowest (&minus;80 dB) around 4 kHz where the ear is the most sensitive.
}}


ऑडियो में शोर को आकार देना आमतौर पर बिट-रिडक्शन योजना के रूप में लागू किया जाता है। डिथर का सबसे बुनियादी रूप सपाट, सफेद शोर है। हालाँकि, कान निम्न स्तर पर दूसरों की तुलना में कुछ आवृत्तियों के प्रति कम संवेदनशील होते हैं (समान-ज़ोर समोच्च देखें)। शोर को आकार देने का उपयोग करके परिमाणीकरण त्रुटि को प्रभावी ढंग से चारों ओर फैलाया जा सकता है ताकि इसका अधिक हिस्सा उन आवृत्तियों पर केंद्रित हो जिन्हें सुना नहीं जा सकता है और इसका कम हिस्सा उन आवृत्तियों पर केंद्रित है जिन्हें सुना जा सकता है। इसका परिणाम यह होता है कि जहां कान सबसे अधिक महत्वपूर्ण होते हैं, वहां परिमाणीकरण त्रुटि को काफी कम किया जा सकता है और जहां कान कम संवेदनशील होते हैं, वहां शोर बहुत अधिक होता है। यह सीधे डिथर की तुलना में 4 बिट्स की कथित शोर में कमी दे सकता है।<ref>{{cite conference
ऑडियो में नॉइज़ को शेपिंग देना सामान्यतः बिट-रिडक्शन स्कीम के रूप में प्रारम्भ किया जाता है। डिथर का सबसे बेसिक फॉर्म फ्लैट, वाइट नॉइज़ है। चूँकि, इअर लो लेवल पर दूसरों के कम्पेयर में कुछ फ्रीक्वेंसी के प्रति कम सेंसिटिव होते हैं (इक्वल-लाउडनेस कंटूर देखें)। नॉइज़ को शेपिंग देने का उपयोग करके क्वान्टिजेशन एरर को एफ्फेक्टिवेली रूप से चारों ओर स्प्रेड किया जा सकता है जिससे इसका अधिक भाग उन फ्रीक्वेंसी पर फोकस्ड हो जिन्हें सुना नहीं जा सकता है इसका परिणाम यह होता है कि जहां इअर सबसे अधिक महत्वपूर्ण होते हैं, वहां क्वान्टिजेशन एरर को अधिक कम किया जा सकता है और जहां इअर कम सेंसिटिव होते हैं, वहां नॉइज़ अधिक होती है। यह सीधे डिथर के कम्पेयर में 4 बिट्स की प्रेसीवड नॉइज़ में कमी दे सकता है।<ref>{{cite conference
| title        = Psychoacoustic Noise Shaped Improvements in CD and Other Linear Digital Media
| title        = Psychoacoustic Noise Shaped Improvements in CD and Other Linear Digital Media
| first        = Michael
| first        = Michael
Line 59: Line 57:
| publisher    = [[Audio Engineering Society|AES]]
| publisher    = [[Audio Engineering Society|AES]]
| at            = Preprint 3501
| at            = Preprint 3501
}}</ref> जबकि 16-बिट ऑडियो को आमतौर पर 96 डीबी की गतिशील रेंज माना जाता है (क्वांटिज़ेशन विरूपण गणना देखें), इसे वास्तव में शोर-आकार के डिथर का उपयोग करके 120 डीबी तक बढ़ाया जा सकता है।<ref>{{Cite web|title = 24/192 Music Downloads are Very Silly Indeed|url = http://xiph.org/~xiphmont/demo/neil-young.html|website = xiph.org|access-date = 2015-08-01}}</ref>
}}</ref> जबकि 16-बिट सैंपल एनटायर स्पेक्ट्रम में केवल 96 डीबी की डायनामिक रेंज होती है (क्वांटिज़ेशन डिस्टॉरशन गणना देखें), इसे वास्तव में नॉइज़-शेपिंग के डिथर का उपयोग करके 120 डीबी तक इनक्रीस किया जा सकता है।<ref>{{Cite web|title = 24/192 Music Downloads are Very Silly Indeed|url = http://xiph.org/~xiphmont/demo/neil-young.html|website = xiph.org|access-date = 2015-08-01}}</ref>


'''नॉइज़ शेपिंग और 1-बिट कन्वर्टर्स'''


=== शोर आकार और 1-बिट कन्वर्टर्स ===
1989 के निकट से, 1 बिट [[डेल्टा-सिग्मा मॉड्यूलेशन]] का उपयोग [[एनॉलॉग से डिजिटल परिवर्तित करने वाला उपकरण|एनॉलॉग-टू-डिजिटल कन्वर्टर्स]] में किया गया है। इसमें अधिक हाई रेट पर ऑडियो का सैंपल लेना सम्मिलित है (उदाहरण के लिए पर सेकंड 2.8224 मिलियन सैंपल) किंतु केवल एक बिट का उपयोग करना। इस कनवर्टर में केवल 6.02 डीबी की डायनामिक रेंज होती है। चूँकि, नॉइज़ फ्लोर 1.4112 मेगाहर्ट्ज की [[नाइक्विस्ट आवृत्ति|नाइक्विस्ट फ्रीक्वेंसी]] के नीचे एनटायर नॉन-[[ एलियासिंग |एलियास्ड]] फ्रीक्वेंसी रेंज में स्प्रेड है। नॉइज़ शेपिंग देने का उपयोग ऑडिबल रेंज (20 हर्ट्ज से 20 किलोहर्ट्ज़) में उपस्थित नॉइज़ को कम करने और ऑडिबल रेंज से ऊपर नॉइज़ को इनक्रीस करने के लिए किया जाता है। इसके परिणामस्वरूप ब्रॉडबैंड [[डानामिक रेंज]] केवल 7.78 डीबी है, किंतु यह फ़्रीक्वेंसी बैंड के मध्य कंसिस्टेंट नहीं है, और सबसे कम फ्रीक्वेंसी (ऑडिबल रेंज) में डायनामिक रेंज 100 डीबी से अधिक है। नॉइज़ शेपिंग देना स्वाभाविक रूप से डेल्टा-सिग्मा मॉड्यूलेटर में बनाया गया है।


1989 के आसपास से, 1 बिट [[डेल्टा-सिग्मा मॉड्यूलेशन]]|डेल्टा-सिग्मा मॉड्यूलेटर का उपयोग [[एनॉलॉग से डिजिटल परिवर्तित करने वाला उपकरण]] में किया गया है। इसमें बहुत उच्च दर पर ऑडियो का नमूना लेना शामिल है (उदाहरण के लिए 2.8224 नमूना आवृत्ति) लेकिन केवल एक बिट का उपयोग करना। क्योंकि केवल 1 बिट का उपयोग किया जाता है, इस कनवर्टर में केवल 6.02 डीबी की गतिशील रेंज होती है। हालाँकि, शोर तल 1.4112 मेगाहर्ट्ज की [[नाइक्विस्ट आवृत्ति]] के नीचे संपूर्ण गैर-[[ एलियासिंग ]] आवृत्ति रेंज में फैला हुआ है। शोर आकार देने का उपयोग श्रव्य सीमा (20 हर्ट्ज से 20 किलोहर्ट्ज़) में मौजूद शोर को कम करने और श्रव्य सीमा से ऊपर शोर को बढ़ाने के लिए किया जाता है। इसके परिणामस्वरूप ब्रॉडबैंड [[डानामिक रेंज]] केवल 7.78 डीबी है, लेकिन यह फ़्रीक्वेंसी बैंड के बीच सुसंगत नहीं है, और सबसे कम आवृत्तियों (श्रव्य रेंज) में डायनामिक रेंज बहुत अधिक है - 100 डीबी से अधिक। शोर आकार देना स्वाभाविक रूप से डेल्टा-सिग्मा मॉड्यूलेटर में बनाया गया है।
1 बिट कनवर्टर सोनी द्वारा [[डायरेक्ट स्ट्रीम डिजिटल]] फॉर्मेट का आधार है। 1 बिट कनवर्टर (और इस प्रकार डीएसडी सिस्टम) की आलोचना यह है कि क्योंकि सिग्नल और फीडबैक लूप दोनों में केवल 1 बिट का उपयोग किया जाता है, फीडबैक लूप में पर्याप्त अमाउंट में डिथर का उपयोग नहीं किया जा सकता है और कुछ के अंतर्गत डिस्टॉरशन हेयर किया जा सकता है। स्थितियाँ (अधिक वर्णन डायरेक्ट स्ट्रीम डिजिटल § डीएसडी के प्रति पीसीएम)


1 बिट कनवर्टर सोनी द्वारा [[डायरेक्ट स्ट्रीम डिजिटल]] प्रारूप का आधार है। 1 बिट कनवर्टर (और इस प्रकार डीएसडी सिस्टम) की एक आलोचना यह है कि क्योंकि सिग्नल और फीडबैक लूप दोनों में केवल 1 बिट का उपयोग किया जाता है, फीडबैक लूप में पर्याप्त मात्रा में डिथर का उपयोग नहीं किया जा सकता है और कुछ शर्तों के तहत विरूपण सुना जा सकता है। .<ref>S. Lipschitz and J. Vanderkooy, "[http://peufeu.free.fr/audio/extremist_dac/files/1-Bit-Is-Bad.pdf Why Professional 1-Bit Sigma-Delta Conversion is a Bad Idea]" AES 109th Convention, Sep 2000</ref><ref>S. Lipschitz and J. Vanderkooy, "[http://sjeng.org/ftp/SACD.pdf Why 1-Bit Sigma-Delta Conversion is Unsuitable for High-Quality Applications]" AES 110th convention, May 2001</ref> 2000 के बाद से बनाए गए अधिकांश ए/डी कन्वर्टर्स मल्टी-बिट या मल्टी-लेवल डेल्टा सिग्मा मॉड्यूलेटर का उपयोग करते हैं जो 1 बिट से अधिक आउटपुट उत्पन्न करते हैं ताकि फीडबैक लूप में उचित डीथर जोड़ा जा सके। पारंपरिक [[ पल्स कोड मॉडुलेशन ]] सैंपलिंग के लिए सिग्नल को डेसीमेशन (सिग्नल प्रोसेसिंग) से 44.1 kHz या अन्य उपयुक्त सैंपल दरों पर ले जाया जाता है।
<ref>S. Lipschitz and J. Vanderkooy, "[http://peufeu.free.fr/audio/extremist_dac/files/1-Bit-Is-Bad.pdf Why Professional 1-Bit Sigma-Delta Conversion is a Bad Idea]" AES 109th Convention, Sep 2000</ref><ref>S. Lipschitz and J. Vanderkooy, "[http://sjeng.org/ftp/SACD.pdf Why 1-Bit Sigma-Delta Conversion is Unsuitable for High-Quality Applications]" AES 110th convention, May 2001</ref> 2000 के पश्चात से बनाए गए अधिकांश ए/डी कन्वर्टर्स मल्टी-बिट या मल्टी-लेवल डेल्टा सिग्मा मॉड्यूलेटर का उपयोग करते हैं जो 1 बिट से अधिक आउटपुट उत्पन्न करते हैं जिससे फीडबैक लूप में प्रॉपर डीथर ऐड किया जा सके। ट्रेडिशनल[[ पल्स कोड मॉडुलेशन | पल्स कोड मॉडुलेशन]] सैंपलिंग के लिए सिग्नल को 44.1 kHz या अन्य उपयुक्त सैंपल रेटों पर ले जाया जाता है।


=== आधुनिक एडीसी में ===
=== मॉडर्न एडीसी में ===


[[एनालॉग डिवाइस]]ेज़ जिसे वे नॉइज़ शेपिंग रिक्वांटाइज़र के रूप में संदर्भित करते हैं, उसका उपयोग करते हैं,<ref>[http://www.analog.com/static/imported-files/data_sheets/AD6677.pdf AD6677 80 MHz Bandwidth IF Receiver] (on Page 23)</ref> और [[ टेक्सस उपकरण ]]्स जिसे वे SNRBoost के रूप में संदर्भित करते हैं उसका उपयोग करते हैं<ref>[http://www.ti.com/lit/pdf/slaa445 Using Windowing With SNRBoost3G Technology] (PDF)</ref><ref>[http://www.ti.com/lit/pdf/sboa133 Understanding Low-Amplitude Behavior of 11-bit ADCs] (PDF)</ref> आसपास की आवृत्तियों की तुलना में शोर स्तर को लगभग 30db कम करना। यह गैर-निरंतर संचालन की लागत पर आता है लेकिन स्पेक्ट्रम फर्श पर एक अच्छा बाथटब आकार तैयार करता है। इसे बिट-बूस्ट जैसी अन्य तकनीकों के साथ जोड़ा जा सकता है{{specify|reason=No mention found in SNRBoost refs}} स्पेक्ट्रम के रिज़ॉल्यूशन को और बढ़ाने के लिए।
[[एनालॉग डिवाइस|एनालॉग डिवाइसेज़]] जिसे वे नॉइज़ शेपिंग रिक्वेंटाइज़र के रूप में संदर्भित करते हैं, उसका उपयोग करते हैं,<ref>[http://www.analog.com/static/imported-files/data_sheets/AD6677.pdf AD6677 80 MHz Bandwidth IF Receiver] (on Page 23)</ref> और [[ टेक्सस उपकरण |टेक्सास इंस्ट्रूमेंट्स]] जिसे वे "एसएनआरबूस्ट" के रूप में संदर्भित करते हैं उसका उपयोग करते हैं<ref>[http://www.ti.com/lit/pdf/slaa445 Using Windowing With SNRBoost3G Technology] (PDF)</ref><ref>[http://www.ti.com/lit/pdf/sboa133 Understanding Low-Amplitude Behavior of 11-bit ADCs] (PDF)</ref> साराउनडिंग फ्रीक्वेंसी के कम्पेयर में नॉइज़ लेवल को लगभग 30db कम करने के लिए यह नॉन-कंटीन्यूअस ऑपरेशन की कास्ट पर आता है किंतु स्पेक्ट्रम फ्लोर पर नाइज बाथटब शेपिंग तैयार करता है। स्पेक्ट्रम के रिज़ॉल्यूशन को इनक्रीस करने के लिए इसे बिट-बूस्ट जैसी अन्य टेकनीक के साथ ऐड किया जा सकता है  


== संदर्भ ==
== सन्दर्भ ==
{{Reflist}}
{{Reflist}}
[[Category: ऑडियो इंजीनियरिंग]] [[Category: अंकीय संकेत प्रक्रिया]] [[Category: शोर (इलेक्ट्रॉनिक्स)]]  
[[Category: ऑडियो इंजीनियरिंग]] [[Category: अंकीय संकेत प्रक्रिया]] [[Category: शोर (इलेक्ट्रॉनिक्स)]]  
Line 80: Line 79:
[[Category: Machine Translated Page]]
[[Category: Machine Translated Page]]
[[Category:Created On 16/08/2023]]
[[Category:Created On 16/08/2023]]
[[Category:Vigyan Ready]]

Latest revision as of 07:43, 13 October 2023

नॉइज़ शेपिंग देना ऐसी टेकनीक है जिसका उपयोग सामान्यतः डिजिटल ऑडियो, इमेज और वीडियो प्रोसेसिंग में किया जाता है, सामान्यतः डिजिटल सिग्नल की क्वान्टिजेशन (सिग्नल प्रोसेसिंग) या ऑडियो बिट डेप्थ रिडक्शन के प्रोसेस के भाग के रूप में डिथरिंग के कॉम्बिनेशन में इसका उद्देश्य रिजल्टएंट सिग्नल के स्पष्ट सिग्नल-टू-नॉइज़ अनुपात को इनक्रीस करना है। यह एरर के पावर स्पेक्ट्रम को परिवर्तित करके ऐसा करता है जो डिथरिंग और क्वान्टिजेशन द्वारा प्रस्तुत किया जाता है; जैसे कि नॉइज़ पॉवर फ्रीक्वेंसी बैंड में लो लेवल पर होती है, जिस पर नॉइज़ कम डिजायरेबल माना जाता है और बैंड करेस्पोंडिंगली हाई लेवल पर होता है, जहां इसे अधिक डिजायरेबल माना जाता है। इमेज प्रोसेसिंग में उपयोग किया जाने वाला पोपुलर नॉइज़ शेपिंग देने वाला एल्गोरिदम 'फ्लोयड स्टाइनबर्ग डिथरिंग' के रूप में जाना जाता है; और ऑडियो प्रोसेसिंग में उपयोग किए जाने वाले कई नॉइज़ शेपिंग देने वाले एल्गोरिदम 'अब्सोल्यूट थ्रेसहोल्ड हियरिंग' मॉडल पर आधारित हैं।

ऑपरेशन

कोई भी फीडबैक लूप फ़िल्टर (सिग्नल प्रोसेसिंग) के रूप में कार्य करता है, डिजायरेबल नॉइज़ को फ़िल्टर करने के लिए डिज़ाइन किए गए फीडबैक लूप में क्वान्टिजेशन नॉइज़ क्रिएट करके नॉइज़ को शेप देने का कार्य किया जाता है।

लो-पास बॉक्सकार फ़िल्टर उदाहरण:

उदाहरण के लिए, फीडबैक सिस्टम पर विचार करें:

जहाँ b कांस्टेंट है, n साइकिल नंबर है, x[n] इनपुट सैंपल वैल्यू है, y[n] क्वांटिज़ेड किया जा रहा मान है, और e[n] इसकी क्वान्टिजेशन एरर है:

इस मॉडल में, जब किसी सैंपल की बिट डेप्थ कम हो जाती है, तो क्वान्टिजेशन एरर को मापा जाता है और नेक्स्ट साइकिल पर क्वान्टिजेशन से पहले नेक्स्ट सैंपल के साथ ऐड किया जाता है। इसका प्रभाव यह है कि क्वान्टिजेशन एरर को 2-सैंपल बॉक्सकार फ़िल्टर (जिसे सिंपल मूविंग एवरेज फ़िल्टर के रूप में भी जाना जाता है) द्वारा लो पास फिल्टर किया जाता है। परिणामस्वरूप, पहले की कम्पेयर में, क्वान्टिजेशन एरर में हाई फ्रीक्वेंसी पर लो पॉवर और लो फ्रीक्वेंसी पर हाई पॉवर होती है। फ़िल्टर की कटऑफ़ फ्रीक्वेंसी b को मॉडिफाई करके समायोजित किया जा सकता है, जो पिछले सैंपल से एरर का अनुपात है, जिसे फेड बैक किया जाता है।

सामान्यतः इम्पल्स रेस्पोंस फ़िल्टर

अधिक सामान्यतः, किसी भी एफआईआर फ़िल्टर या आईआईआर फ़िल्टर का उपयोग अधिक काम्प्लेक्स फ्रीक्वेंसी रेस्पोंस कर्व बनाने के लिए किया जा सकता है। ऐसे फ़िल्टरों को वेटेड लीस्ट स्क्वायर मेथड का उपयोग करके डिज़ाइन किया जा सकता है।[1] डिजिटल ऑडियो के केस में, सामान्यतः उपयोग किए जाने वाले वेटिंग फ़ंक्शन को हियरिंग कर्व की अब्सोल्यूट थ्रेसहोल्ड से डिवाइड किया जाता है, अर्थात

डिथरिंग

क्वान्टिजेशन के समय उचित अमाउंट डीथर ऐड करने से सिग्नल से संबंधित डेटर्मिनाबल एररस को प्रिवेंट किया जा सकता है। यदि डिथर का उपयोग नहीं किया जाता है तो नॉइज़ शेपिंग देना एफ्फेक्टिवेली रूप से केवल डिस्टॉरशन शेपिंग देने के रूप में कार्य करता है- डिस्टॉरशन एनर्जी को विभिन्न फ्रीक्वेंसी बैंडों में पुश करता है, किंतु यह अभी भी डिस्टॉरशन है। यदि इस प्रोसेस में डीथर ऐड किया जाता है:

तब क्वान्टिजेशन एरर वास्तव में नॉइज़ बन जाती है, और प्रोसेस वास्तव में नॉइज़ को शेपिंग देती है।

डिजिटल ऑडियो में

ऑडियो में नॉइज़ को शेपिंग देना सामान्यतः बिट-रिडक्शन स्कीम के रूप में प्रारम्भ किया जाता है। डिथर का सबसे बेसिक फॉर्म फ्लैट, वाइट नॉइज़ है। चूँकि, इअर लो लेवल पर दूसरों के कम्पेयर में कुछ फ्रीक्वेंसी के प्रति कम सेंसिटिव होते हैं (इक्वल-लाउडनेस कंटूर देखें)। नॉइज़ को शेपिंग देने का उपयोग करके क्वान्टिजेशन एरर को एफ्फेक्टिवेली रूप से चारों ओर स्प्रेड किया जा सकता है जिससे इसका अधिक भाग उन फ्रीक्वेंसी पर फोकस्ड हो जिन्हें सुना नहीं जा सकता है इसका परिणाम यह होता है कि जहां इअर सबसे अधिक महत्वपूर्ण होते हैं, वहां क्वान्टिजेशन एरर को अधिक कम किया जा सकता है और जहां इअर कम सेंसिटिव होते हैं, वहां नॉइज़ अधिक होती है। यह सीधे डिथर के कम्पेयर में 4 बिट्स की प्रेसीवड नॉइज़ में कमी दे सकता है।[2] जबकि 16-बिट सैंपल एनटायर स्पेक्ट्रम में केवल 96 डीबी की डायनामिक रेंज होती है (क्वांटिज़ेशन डिस्टॉरशन गणना देखें), इसे वास्तव में नॉइज़-शेपिंग के डिथर का उपयोग करके 120 डीबी तक इनक्रीस किया जा सकता है।[3]

नॉइज़ शेपिंग और 1-बिट कन्वर्टर्स

1989 के निकट से, 1 बिट डेल्टा-सिग्मा मॉड्यूलेशन का उपयोग एनॉलॉग-टू-डिजिटल कन्वर्टर्स में किया गया है। इसमें अधिक हाई रेट पर ऑडियो का सैंपल लेना सम्मिलित है (उदाहरण के लिए पर सेकंड 2.8224 मिलियन सैंपल) किंतु केवल एक बिट का उपयोग करना। इस कनवर्टर में केवल 6.02 डीबी की डायनामिक रेंज होती है। चूँकि, नॉइज़ फ्लोर 1.4112 मेगाहर्ट्ज की नाइक्विस्ट फ्रीक्वेंसी के नीचे एनटायर नॉन-एलियास्ड फ्रीक्वेंसी रेंज में स्प्रेड है। नॉइज़ शेपिंग देने का उपयोग ऑडिबल रेंज (20 हर्ट्ज से 20 किलोहर्ट्ज़) में उपस्थित नॉइज़ को कम करने और ऑडिबल रेंज से ऊपर नॉइज़ को इनक्रीस करने के लिए किया जाता है। इसके परिणामस्वरूप ब्रॉडबैंड डानामिक रेंज केवल 7.78 डीबी है, किंतु यह फ़्रीक्वेंसी बैंड के मध्य कंसिस्टेंट नहीं है, और सबसे कम फ्रीक्वेंसी (ऑडिबल रेंज) में डायनामिक रेंज 100 डीबी से अधिक है। नॉइज़ शेपिंग देना स्वाभाविक रूप से डेल्टा-सिग्मा मॉड्यूलेटर में बनाया गया है।

1 बिट कनवर्टर सोनी द्वारा डायरेक्ट स्ट्रीम डिजिटल फॉर्मेट का आधार है। 1 बिट कनवर्टर (और इस प्रकार डीएसडी सिस्टम) की आलोचना यह है कि क्योंकि सिग्नल और फीडबैक लूप दोनों में केवल 1 बिट का उपयोग किया जाता है, फीडबैक लूप में पर्याप्त अमाउंट में डिथर का उपयोग नहीं किया जा सकता है और कुछ के अंतर्गत डिस्टॉरशन हेयर किया जा सकता है। स्थितियाँ (अधिक वर्णन डायरेक्ट स्ट्रीम डिजिटल § डीएसडी के प्रति पीसीएम)।

[4][5] 2000 के पश्चात से बनाए गए अधिकांश ए/डी कन्वर्टर्स मल्टी-बिट या मल्टी-लेवल डेल्टा सिग्मा मॉड्यूलेटर का उपयोग करते हैं जो 1 बिट से अधिक आउटपुट उत्पन्न करते हैं जिससे फीडबैक लूप में प्रॉपर डीथर ऐड किया जा सके। ट्रेडिशनल पल्स कोड मॉडुलेशन सैंपलिंग के लिए सिग्नल को 44.1 kHz या अन्य उपयुक्त सैंपल रेटों पर ले जाया जाता है।

मॉडर्न एडीसी में

एनालॉग डिवाइसेज़ जिसे वे नॉइज़ शेपिंग रिक्वेंटाइज़र के रूप में संदर्भित करते हैं, उसका उपयोग करते हैं,[6] और टेक्सास इंस्ट्रूमेंट्स जिसे वे "एसएनआरबूस्ट" के रूप में संदर्भित करते हैं उसका उपयोग करते हैं[7][8] साराउनडिंग फ्रीक्वेंसी के कम्पेयर में नॉइज़ लेवल को लगभग 30db कम करने के लिए यह नॉन-कंटीन्यूअस ऑपरेशन की कास्ट पर आता है किंतु स्पेक्ट्रम फ्लोर पर नाइज बाथटब शेपिंग तैयार करता है। स्पेक्ट्रम के रिज़ॉल्यूशन को इनक्रीस करने के लिए इसे बिट-बूस्ट जैसी अन्य टेकनीक के साथ ऐड किया जा सकता है

सन्दर्भ

  1. Verhelst, Werner; De Koning, Dreten (24 October 2001). Noise shaping filter design for minimally audible signal requantization. IEEE Workshop on Applications of Signal Processing to Audio and Acoustics. IEEE.
  2. Gerzon, Michael; Peter Craven; Robert Stuart; Rhonda Wilson (16–19 March 1993). Psychoacoustic Noise Shaped Improvements in CD and Other Linear Digital Media. 94th Convention of the Audio Engineering Society, Berlin. AES. Preprint 3501.
  3. "24/192 Music Downloads are Very Silly Indeed". xiph.org. Retrieved 2015-08-01.
  4. S. Lipschitz and J. Vanderkooy, "Why Professional 1-Bit Sigma-Delta Conversion is a Bad Idea" AES 109th Convention, Sep 2000
  5. S. Lipschitz and J. Vanderkooy, "Why 1-Bit Sigma-Delta Conversion is Unsuitable for High-Quality Applications" AES 110th convention, May 2001
  6. AD6677 80 MHz Bandwidth IF Receiver (on Page 23)
  7. Using Windowing With SNRBoost3G Technology (PDF)
  8. Understanding Low-Amplitude Behavior of 11-bit ADCs (PDF)