ऑडियो बिट डेप्थ

From Vigyanwiki
Revision as of 13:12, 20 June 2023 by alpha>Neeraja (added Category:Vigyan Ready using HotCat)
एनालॉग सिग्नल (लाल रंग में) 4-बिट पीसीएम डिजिटल नमूनों (नीले रंग में) के लिए एन्कोड किया गया; बिट गहराई चार है, इसलिए प्रत्येक नमूने का आयाम 16 संभावित मानों में से है।

डिजिटल ऑडियो में पल्स कोड मॉडुलेशन (पीसीएम) का उपयोग करते हुए, अंश डेप्थ प्रत्येक नमूनाकरण (सिग्नल प्रोसेसिंग) में सूचना के बिट्स की संख्या है और यह सीधे प्रत्येक नमूने के रिज़ॉल्यूशन से मेल खाती है। बिट गहराई के उदाहरणों में कॉम्पैक्ट डिस्क डिजिटल ऑडियो सम्मिलित है, जो प्रति नमूना 16 बिट का उपयोग करता है, और डीवीडी ऑडियो और ब्लू - रे डिस्क जो प्रति नमूना 24 बिट तक का समर्थन कर सकता है।

बुनियादी कार्यान्वयन में, बिट गहराई में भिन्नता मुख्य रूप से परिमाणीकरण त्रुटि से ध्वनि सिग्नल-टू-ध्वनि अनुपात (एसएनआर) और गतिशील सीमा स्तर को प्रभावित करती है। इस प्रकार चूँकि, तकनीकें जैसे कि तड़पना, ध्वनि को आकार देना और अधिप्रतिचयन इन प्रभावों को थोड़ा सा गहराई बदले बिना कम कर सकते हैं। बिट गहराई भी बिट दर और फ़ाइल आकार को प्रभावित करती है।

पीसीएम डिजिटल सिग्नल (सिग्नल प्रोसेसिंग) का वर्णन करने के लिए बिट डेप्थ उपयोगी है। गैर-पीसीएम प्रारूप, जैसे हानिपूर्ण संपीड़न का उपयोग करने वाले, संबंधित बिट गहराई नहीं रखते हैं।[lower-alpha 1]

बाइनरी प्रतिनिधित्व

पीसीएम सिग्नल डिजिटल ऑडियो नमूनों का क्रम है जिसमें डेटा मूल एनालॉग संकेत के सिग्नल पुनर्निर्माण के लिए आवश्यक जानकारी प्रदान करता है। प्रत्येक नमूना समय में विशिष्ट बिंदु पर संकेत के आयाम का प्रतिनिधित्व करता है और नमूने समय में समान रूप से स्थान पर होते हैं। आयाम एकमात्र जानकारी है जो स्पष्ट रूप से नमूने में संग्रहीत है और यह सामान्यतः या तब पूर्णांक या फ़्लोटिंग पॉइंट नंबर के रूप में संग्रहीत होता है, जो अंकों की निश्चित संख्या के साथ बाइनरी संख्या के रूप में एन्कोड किया जाता है: नमूना की बिट गहराई, जिसे शब्द की लंबाई या शब्द का आकार भी कहा जाता है।

रिज़ॉल्यूशन असतत मानों की संख्या को इंगित करता है जिन्हें एनालॉग मानों की श्रेणी में प्रदर्शित किया जा सकता है। जैसे-जैसे शब्द की लंबाई बढ़ती है, बाइनरी पूर्णांकों का रिज़ॉल्यूशन घातांक बढ़ता है। बिट जोड़ने से रिज़ॉल्यूशन दोगुना हो जाता है, दो चौगुना जोड़ दिया जाता है, और इसी तरह। पूर्णांक बिट गहराई द्वारा प्रदर्शित किए जा सकने वाले संभावित मानों की संख्या की गणना दो की शक्ति का उपयोग करके की जा सकती हैएवं 2n, जहाँ n बिट डेप्थ है।[1]इस प्रकार, 16-बिट सिस्टम का रिज़ॉल्यूशन 65,536 (216) संभावित मान है।

पूर्णांक पीसीएम ऑडियो डेटा को सामान्यतः दो के पूरक प्रारूप में हस्ताक्षर संख्या के रूप में संग्रहीत किया जाता है।[2]

आज, अधिकांश ऑडियो फ़ाइल स्वरूप और डिजिटल ऑडियो वर्कस्टेशन (डीएडब्ल्यू एस) पीसीएम स्वरूपों का समर्थन करते हैं, जिनमें फ़्लोटिंग पॉइंट नंबरों द्वारा दर्शाए गए नमूने हैं।[3][4][5][6] डब्ल्यू ए वी फ़ाइल स्वरूप और ऑडियो इंटरचेंज फ़ाइल स्वरूप फ़ाइल स्वरूप दोनों फ़्लोटिंग पॉइंट प्रस्तुतियों का समर्थन करते हैं।[7][8]पूर्णांकों के विपरीत, जिसका बिट पैटर्न बिट्स की एकल श्रृंखला है, इसके अतिरिक्त फ्लोटिंग पॉइंट नंबर भिन्न-भिन्न क्षेत्रों से बना होता है जिसका गणितीय संबंध संख्या बनाता है। सबसे आम मानक आई.ई.ई.ई 754 है जो तीन क्षेत्रों से बना है: साइन बिट जो दर्शाता है कि संख्या सकारात्मक है या नकारात्मक, एक्सपोनेंट, और महत्व जो एक्सपोनेंट द्वारा उठाया जाता है। मंटिसा को आई.ई.ई.ई बेस-दो फ़्लोटिंग पॉइंट स्वरूपों में बाइनरी अंश के रूप में व्यक्त किया गया है।[9]

परिमाणीकरण

बिट गहराई पुनर्निर्मित सिग्नल के सिग्नल-टू-ध्वनि अनुपात (एसएनआर) को परिमाणीकरण त्रुटि द्वारा निर्धारित अधिकतम स्तर तक सीमित करती है। बिट गहराई का आवृत्ति प्रतिक्रिया पर कोई प्रभाव नहीं पड़ता है, जो नमूना दर से विवश है।

एनॉलॉग से डिजिटल परिवर्तित करने वाला उपकरण के समय क्वांटिज़ेशन त्रुटि प्रारंभ की गई एवं एनालॉग-टू-डिजिटल रूपांतरण (एडीसी) क्वांटिज़ेशन ध्वनि के रूप में मॉडल (सार) हो सकता है। यह एडीसी के अनुरूप इनपुट वोल्टेज और आउटपुट डिजीटल मान के मध्य राउंडिंग त्रुटि है। जो ध्वनि नॉनलाइनियर सिस्टम और सिग्नल पर निर्भर है।

8 बिट बाइनरी नंबर (दशमलव में 149), जिसमें एलएसबी हाइलाइट किया गया है

आदर्श एडीसी में, जहां क्वांटिज़ेशन त्रुटि समान रूप से वितरित की जाती है कम से कम महत्वपूर्ण बिट (एलएसबी) और जहां सिग्नल में सभी मात्राकरण स्तरों को कवर करने वाला समान वितरण होता है, सिग्नल-टू-क्वांटिज़ेशन-ध्वनि अनुपात (एसक्यूएनआर) की गणना की जा सकती है

जहाँ b परिमाणीकरण बिट्स की संख्या है और परिणाम डेसिबल (डीबी) में मापा जाता है।[10][11]

इसलिए, सीडी पर पाए जाने वाले 16-बिट डिजिटल ऑडियो में 98 डीबी का सैद्धांतिक अधिकतम एसएनआर होता है और प्रस्तुतेवर 24-बिट डिजिटल ऑडियो 146 डीबी के रूप में सबसे ऊपर होता है। डिजिटल ऑडियो कन्वर्टर तकनीक लगभग 123 डीबी के एसएनआर तक सीमित है[12][13][14] (बिट्स 21-बिट्स की प्रभावी संख्या) एकीकृत सर्किट डिजाइन में वास्तविक दुनिया की सीमाओं के कारण है।[lower-alpha 2] फिर भी, यह लगभग मानव श्रवण प्रणाली के प्रदर्शन से मेल खाता है।[17][18] एकाधिक कन्वर्टर्स का उपयोग ही सिग्नल की विभिन्न श्रेणियों को कवर करने के लिए किया जा सकता है, लंबी अवधि में व्यापक गतिशील सीमा रिकॉर्ड करने के लिए संयुक्त किया जा रहा है, जबकि अभी भी लघु अवधि में एकल कनवर्टर की गतिशील सीमा द्वारा सीमित किया जा रहा है, जिसे डायनेमिक सीमा एक्सटेंशन कहा जाता है।[19][20]

सिग्नल-टू-ध्वनि अनुपात और बिट डेप्थ का रिज़ॉल्यूशन (अनवेटेड)
# बिट्स एसएनआर (ऑडियो) एसएनआर (वीडियो) न्यूनतम डीबी चरण अंतर (परिमाणीकरण पूर्णांकन त्रुटि) संभावित मानों की संख्या (प्रति नमूना) हस्ताक्षरित प्रतिनिधित्व के लिए सीमा (प्रति नमूना)।
4 25.84 डीबी 34.31 डीबी 1.578 डीबी 16 −8 to +7
8 49.93 डीबी 58.92 डीबी 0.1948 डीबी 256 −128 to +127
11 67.99 डीबी 77.01 डीबी 0.0331 डीबी 2,048 −1,024 to +1,023
12 74.01 डीबी 83.04 डीबी 0.01806 डीबी 4,096 −2,048 to +2,047
16 98.09 डीबी 107.12 डीबी 0.00598 डीबी 65,536 −32,768 to +32,767
18 110.13 डीबी - 0.000420 डीबी 262,144 −131,072 to +131,071
20 122.17 डीबी - 0.000116 डीबी 1,048,576 −524,288 to +524,287
24 146.26 डीबी - 0.00000871 डीबी 16,777,216 −8,388,608 to +8,388,607
32 194.42 डीबी - 4.52669337E−8 डीबी 4,294,967,296 −2,147,483,648 to +2,147,483,647
48 290.75 डीबी - 1.03295150E−12 डीबी 281,474,976,710,656 −140,737,488,355,328 to +140,737,488,355,327
64 387.08 डीबी - 2.09836488E−17 डीबी 18,446,744,073,709,551,616 −9,223,372,036,854,775,808 to +9,223,372,036,854,775,807

फ़्लोटिंग पॉइंट

फ़्लोटिंग-पॉइंट नमूनों का रिज़ॉल्यूशन पूर्णांक नमूनों की तुलना में कम सीधा होता है जिससे कि फ़्लोटिंग-पॉइंट मान समान रूप से नहीं होते हैं। इस प्रकार फ़्लोटिंग-पॉइंट प्रतिनिधित्व में, किन्हीं दो आसन्न मानों के मध्य का स्थान मान के अनुपात में होता है। यह पूर्णांक प्रणाली की तुलना में एसएनआर को बहुत बढ़ाता है, जिससे कि उच्च-स्तरीय सिग्नल की त्रुटिहीनता निम्न स्तर पर समान सिग्नल की त्रुटिहीनता के समान होती है।[21]

फ़्लोटिंग पॉइंट्स और पूर्णांकों के मध्य ट्रेड-ऑफ़ यह है कि बड़े फ़्लोटिंग-पॉइंट मानों के मध्य का स्थान समान बिट गहराई के बड़े पूर्णांक मानों के मध्य के स्थान से अधिक होता है। बड़ी फ़्लोटिंग-पॉइंट संख्या को राउंड करने से छोटी फ़्लोटिंग-पॉइंट संख्या को राउंड करने की तुलना में अधिक त्रुटि होती है, जबकि पूर्णांक संख्या को राउंड करने से हमेशा समान स्तर की त्रुटि होती है। दूसरे शब्दों में, पूर्णांक में राउंड-ऑफ होता है जो एकसमान होता है, हमेशा एलएसबी को 0 या 1 पर गोल करता है और फ़्लोटिंग पॉइंट में समान एसएनआर होता है, परिमाणीकरण ध्वनि स्तर हमेशा सिग्नल स्तर के निश्चित अनुपात का होता है।[21] फ़्लोटिंग-पॉइंट नॉइज़ फ़्लोर सिग्नल के ऊपर उठेगा और सिग्नल के गिरते ही गिर जाता है, जिसके परिणामस्वरूप श्रव्य विचरण होगा यदि बिट गहराई पर्याप्त कम होती है।[22]

ऑडियो प्रोसेसिंग

सामान्यतः डिजिटल ऑडियो पर अधिकांश प्रोसेसिंग ऑपरेशंस में नमूनों का पुनः परिमाणीकरण सम्मिलित होता है और इस प्रकार एनालॉग-टू-डिजिटल रूपांतरण के समय प्रारंभ की गई मूल परिमाणीकरण त्रुटि के अनुरूप अतिरिक्त राउंडिंग त्रुटियां होती हैं। एडीसी के समय अन्तर्निहित त्रुटि से बड़ी राउंडिंग त्रुटियों को रोकने के लिए, प्रसंस्करण के समय गणना इनपुट नमूने की तुलना में उच्च त्रुटिहीनता पर की जाती है।[23]

डिजिटल सिग्नल प्रोसेसिंग (डीएसपी) संचालन निश्चित बिंदु अंकगणितीय या फ़्लोटिंग-पॉइंट परिशुद्धता में किया जा सकता है। किसी भी स्थितियों में, प्रत्येक ऑपरेशन की त्रुटिहीनता प्रसंस्करण के प्रत्येक चरण को करने के लिए उपयोग किए जाने वाले हार्डवेयर संचालन की त्रुटिहीनता से निर्धारित होती है, न कि इनपुट डेटा के रिज़ॉल्यूशन से। उदाहरण के लिए, x86 प्रोसेसर पर, फ्लोटिंग-पॉइंट ऑपरेशंस एकल-परिशुद्धता फ़्लोटिंग-पॉइंट प्रारूप या डबल-त्रुटिहीन फ़्लोटिंग-पॉइंट प्रारूप और 16-, 32- या 64-बिट रेजोल्यूशन पर फिक्स्ड-पॉइंट ऑपरेशंस के साथ किए जाते हैं। परिणाम स्वरुप, इंटेल-आधारित हार्डवेयर पर किए गए सभी प्रसंस्करण इन बाधाओं के साथ स्रोत प्रारूप की परवाह किए बिना किए जाएंगे।[lower-alpha 3]

निश्चित बिंदु डिजिटल सिग्नल प्रोसेसर अधिकांशतः विशिष्ट सिग्नल रिज़ॉल्यूशन का समर्थन करने के लिए विशिष्ट शब्द लंबाई का समर्थन करते हैं। उदाहरण के लिए, मोटोरोला 56000 डीएसपी चिप 24-बिट मल्टीप्लायरों और 56-बिट संचायक का उपयोग दो 24-बिट नमूनों पर अतिप्रवाह या ट्रंकेशन के बिना बहु-संचित संचालन करने के लिए करता है।[24] उन उपकरणों पर जो बड़े संचायक का समर्थन नहीं करते हैं, त्रुटिहीनता को कम करते हुए निश्चित बिंदु परिणामों को छोटा किया जा सकता है। डीएसपी के कई चरणों के माध्यम से त्रुटियाँ दर पर मिश्रित होती हैं जो कि किए जा रहे संचालन पर निर्भर करती हैं। डीसी ऑफसेट के बिना ऑडियो डेटा पर असंबद्ध प्रसंस्करण चरणों के लिए, त्रुटियों को शून्य साधनों के साथ यादृच्छिक माना जाता है। इस धारणा के अनुसार , वितरण का मानक विचलन संचालन की संख्या के वर्गमूल के साथ त्रुटि संकेत और परिमाणीकरण त्रुटि पैमानों का प्रतिनिधित्व करता है।[25] एल्गोरिदम के लिए उच्च स्तर की त्रुटिहीनता आवश्यक है जिसमें बार-बार प्रसंस्करण सम्मिलित होती है, जैसे कि कनवल्शन[23] पुनरावर्ती एल्गोरिदम में उच्च स्तर की त्रुटिहीनता भी आवश्यक होती है, जैसे कि अनंत आवेग प्रतिक्रिया (आईआईआर) फ़िल्टर।[26] आईआईआर फ़िल्टर के विशेष स्थितियों में, राउंडिंग त्रुटि आवृत्ति प्रतिक्रिया को कम कर सकती है और अस्थिरता उत्पन्न कर सकती है।[23]

डिथर

ध्वनि स्तर के साथ तुलना के उद्देश्य के लिए ऑडियो प्रक्रिया चरणों में हेडरूम और ध्वनि तल

राउंडिंग एरर और ऑडियो प्रोसेसिंग के समय प्रारंभ की गई परिशुद्धता के नुकसान सहित परिमाणीकरण त्रुटि द्वारा प्रस्तुत किए गए ध्वनि को परिमाणित करने से पहले सिग्नल में थोड़ी मात्रा में रैंडम ध्वनि, जिसे डाइथर कहा जाता है, को जोड़कर कम किया जा सकता है। डिथरिंग गैर-रैखिक परिमाणीकरण त्रुटि व्यवहार को समाप्त करता है, किन्तु थोड़ा ऊंचा ध्वनि तल की कीमत पर बहुत कम विरूपण देता है। आईटीयू-आर 468 का उपयोग करके मापे गए 16-बिट डिजिटल ऑडियो के लिए अनुशंसित ध्वनि भार संरेखण स्तर से लगभग 66 डीबी नीचे है, या डिजिटल पूर्ण पैमाने से 84 डीबी नीचे है, जो माइक्रोफ़ोन और कमरे के ध्वनि स्तर के बराबर है और इसलिए 16-बिट ऑडियो में बहुत कम परिणाम है।

24-बिट और 32-बिट ऑडियो को डिथरिंग की आवश्यकता नहीं होती है, जिससे कि डिजिटल कन्वर्टर का ध्वनि स्तर हमेशा प्रयुक्त होने वाले किसी भी आवश्यक स्तर से अधिक होता है। सैद्धांतिक रूप से 24-बिट ऑडियो डायनामिक सीमा के 144 डीबी को एनकोड कर सकता है, और 32-बिट ऑडियो 192 डीबी प्राप्त कर सकता है, किन्तु वास्तविक दुनिया में इसे प्राप्त करना लगभग असंभव है, जिससे कि यहां तक ​​कि सबसे अच्छे सेंसर और माइक्रोफ़ोन भी संभवतः ही कभी 130 डीबी से अधिक होते हैं।[27]

प्रभावी गतिशील सीमा को बढ़ाने के लिए डाइथर का भी उपयोग किया जा सकता है। इस प्रकार 16-बिट ऑडियो की कथित डायनामिक सीमा नॉइज़ शेपिंगएवंनॉइज़-शेप्ड डिथर के साथ 120 डीबी या उससे अधिक हो सकती है, जो मानव कान की आवृत्ति प्रतिक्रिया का लाभ उठाती है।[28][29]

डायनेमिक सीमा और हेडरूम

डायनेमिक सीमा सबसे बड़े और सबसे छोटे सिग्नल के मध्य का अंतर है जिसे सिस्टम रिकॉर्ड या पुन: प्रस्तुत कर सकता है। बिना किसी कठिनाई के, डायनेमिक सीमा क्वांटिज़ेशन नॉइज़ फ्लोर से संबंधित है। उदाहरण के लिए, 16-बिट पूर्णांक रिज़ॉल्यूशन लगभग 96 डीबी की गतिशील सीमा की अनुमति देता है। डिथर के उचित आवेदन के साथ, डिजिटल सिस्टम उनके संकल्प से कम स्तर के संकेतों को पुन: प्रस्तुत कर सकते हैं, सामान्य रूप से संकल्प द्वारा लगाए गए सीमा से अधिक प्रभावी गतिशील सीमा का विस्तार करते हैं।[30] इस प्रकार ओवरसैंपलिंग और नॉइज़ शेपिंग जैसी तकनीकों का उपयोग ब्याज की आवृत्ति बैंड से परिमाणीकरण त्रुटि को स्थानांतरित करके नमूना ऑडियो की गतिशील सीमा को और बढ़ा सकता है।

यदि सिग्नल का अधिकतम स्तर बिट गहराई द्वारा अनुमत स्तर से कम है, तब रिकॉर्डिंग में हेडरूम (ऑडियो सिग्नल प्रोसेसिंग) है। रिकॉर्डिंग स्टूडियो के समय उच्च बिट गहराई का उपयोग करने से समान गतिशील सीमा बनाए रखते हुए हेडरूम उपलब्ध हो सकता है। यह कम मात्रा में परिमाणीकरण त्रुटियों को बढ़ाए बिना क्लिपिंग (ऑडियो) के जोखिम को कम करता है।

ओवरसैंपलिंग

प्रति नमूना बिट्स की संख्या को बदले बिना पीसीएम ऑडियो की गतिशील सीमा को बढ़ाने के लिए ओवरसैंपलिंग वैकल्पिक विधि है।[31] ओवरसैंपलिंग में, वांछित नमूना दर के गुणकों पर ऑडियो नमूने प्राप्त किए जाते हैं। जिससे कि परिमाणीकरण त्रुटि को आवृत्ति के साथ समान रूप से वितरित माना जाता है, अधिकांश परिमाणीकरण त्रुटि को अल्ट्रासोनिक आवृत्तियों में स्थानांतरित कर दिया जाता है और प्लेबैक के समय डिज़िटल से एनालॉग कन्वर्टर द्वारा हटाया जा सकता है।

संकल्प एन के अतिरिक्त बिट्स के समतुल्य वृद्धि के लिए, सिग्नल को ओवरसैंपल किया जाना चाहिए।

उदाहरण के लिए, 14-बिट ADC 16× ओवरसैंपलिंग या 768 किलोहर्ट्‍जपर संचालित होने पर 16-बिट 48 किलोहर्ट्‍जऑडियो उत्पन्न कर सकता है। इस प्रकार ओवरसैंपल्ड पीसीएम, इसलिए समान रिज़ॉल्यूशन प्राप्त करने के लिए अधिक नमूनों के लिए प्रति नमूना कम बिट्स का आदान-प्रदान करता है।

सिग्नल पुनर्निर्माण पर ओवरसैंपलिंग, स्रोत पर अनुपस्थित ओवरसैंपलिंग के साथ डायनेमिक सीमा को भी बढ़ाया जा सकता है। पुनर्निर्माण के समय 16× ओवरसैंपलिंग पर विचार करें। पुनर्निर्माण पर प्रत्येक नमूना अद्वितीय होगा जिसमें मूल नमूना बिंदुओं में से प्रत्येक के लिए सोलह सम्मिलित किए गए हैं, सभी की गणना डिजिटल पुनर्निर्माण फ़िल्टर द्वारा की गई है। बढ़ी हुई प्रभावी बिट गहराई का तंत्र जैसा कि पहले चर्चा की गई है, अर्थात क्वांटिज़ेशन ध्वनि शक्ति को कम नहीं किया गया है, किन्तु ध्वनि स्पेक्ट्रम को 16 × ऑडियो बैंडविड्थ में फैलाया गया है।

ऐतिहासिक नोट—कॉम्पैक्ट डिस्क मानक सोनी और फिलिप्स के सहयोग से विकसित किया गया था। पहली सोनी उपभोक्ता इकाई में 16-बिट डीएसी था। पहली फिलिप्स इकाइयों में दोहरे 14-बिट डीएसी थे। इसने बाज़ार और यहां तक ​​कि प्रस्तुतेवर हलकों में भी भ्रमित किया, जिससे कि 14-बिट पीसीएम 84 डीबी एसएनआर, 12 डीबी 16-बिट पीसीएम से कम की अनुमति देता है। फिलिप्स ने पहले क्रम के नॉइज़ शेपिंग के साथ 4× ओवरसैंपलिंग को प्रयुक्त किया था जो सैद्धांतिक रूप से सीडी प्रारूप की पूर्ण 96 डीबी डायनेमिक सीमा को महसूस करता था।[32] इस प्रकार व्यावहारिक रूप से फ़िलिप्स सीडी100 को 20 हर्ट्ज–20 किलोहर्ट्‍ज के ऑडियो बैंड में 90 डीबी एसएनआर पर रेट किया गया था, जो सोनी के सीडीपी-101 के समान था।[33][34]

ध्वनि को आकार देना

किसी सिग्नल के ओवरसैंपलिंग से सभी फ्रीक्वेंसी पर बैंडविथ की प्रति यूनिट समान परिमाणीकरण ध्वनि होता है और डायनेमिक सीमा होती है जो ओवरसैंपलिंग अनुपात के केवल वर्गमूल के साथ उत्तम होती है। इस प्रकार नॉइज़ शेपिंग ऐसी तकनीक है जो उच्च आवृत्तियों पर अतिरिक्त ध्वनि जोड़ती है जो कम आवृत्तियों पर कुछ त्रुटि को रद्द कर देती है, जिसके परिणामस्वरूप ओवरसैंपलिंग के समय गतिशील सीमा में बड़ी वृद्धि होती है। nवें क्रम के नॉइज़ शेपिंग के लिए, ओवरसैंपल्ड सिग्नल की डायनेमिक सीमा बिना नॉइज़ शेपिंग के ओवरसैंपलिंग की तुलना में अतिरिक्त 6n डीबी से उत्तम हो जाती है।[35] उदाहरण के लिए, दूसरे क्रम के नॉइज़ शेपिंग के साथ 4× ओवरसैंपलिंग पर सैंपल लिए गए 20 किलोहर्ट्‍जएनालॉग ऑडियो के लिए, डायनेमिक सीमा 30 डीबी बढ़ जाती है। इसलिए, 176 किलोहर्ट्‍ज पर सैंपल किए गए 16-बिट सिग्नल की थोड़ी गहराई 21-बिट सिग्नल के बराबर होती है, जो नॉइज़ शेपिंग के बिना 44.1 किलोहर्ट्‍जपर सैंपल किया जाता है।

नॉइज़ शेपिंग को सामान्यतः डेल्टा-सिग्मा मॉड्यूलेशन के साथ प्रयुक्त किया जाता है। इस प्रकार डेल्टा-सिग्मा मॉड्यूलेशन का उपयोग करके, डायरेक्ट स्ट्रीम डिजिटल 64× ओवरसैंपलिंग के साथ 1-बिट ऑडियो का उपयोग करके ऑडियो फ़्रीक्वेंसी पर सैद्धांतिक 120 डीबी एसएनआर प्राप्त करता है।

अनुप्रयोग

बिट डेप्थ डिजिटल ऑडियो कार्यान्वयन की मूलभूत संपत्ति है। आवेदन आवश्यकताओं और उपकरण क्षमताओं के आधार पर, भिन्न-भिन्न अनुप्रयोगों के लिए भिन्न-भिन्न बिट गहराई का उपयोग किया जाता है।

उदाहरण अनुप्रयोग और समर्थित ऑडियो बिट गहराई
आवेदन विवरण ऑडियो प्रारूप
सीडी-डीए (लाल किताब)[36] डिजीटल मीडिया 16-बिट एलपीसीएम
डीवीडी ऑडियो [37] डिजीटल मीडिया 16-, 20- और 24-बिट एलपीसीएम[upper-alpha 1]
सुपर ऑडियो सीडी [38] डिजीटल मीडिया 1-बिट डायरेक्ट स्ट्रीम डिजिटल (पीडीएम)
ब्लू-रे डिस्क ऑडियो [39] डिजीटल मीडिया 16-, 20- and 24-बिट एलपीसीएम और अन्य [upper-alpha 2]
डीवी ऑडियो [40] डिजीटल मीडिया 12- और 16-बिट असम्पीडित पीसीएम
आईटीयू- टी अनुशंसा जी.711[41] टेलीफोनी के लिए संपीड़न मानक 8-बिट पीसीएम के साथ कंपैंडिंग [upper-alpha 3]
NICAM-1, NICAM-2 and NICAM-3[42] संपीड़न मानक के लिए प्रसारण कंपाउंडिंग के साथ क्रमशः 10-, 11- और 10-बिट पीसीएम [upper-alpha 4]
ललक डी ए डब्ल्यू द्वारा पॉल डेविस और अर्दोर समुदाय 32-बिट फ़्लोटिंग पॉइंट [43]
प्रो उपकरण 11 डीएडब्ल्यू द्वारा शौकीन चावला प्रौद्योगिकी 16- और 24-बिट या 32-बिट फ़्लोटिंग पॉइंट सत्र और 64-बिट फ़्लोटिंग पॉइंट मिश्रण [44]
तर्क प्रो एक्स डीएडब्ल्यू द्वारा एप्पल इंक. 16- और 24-बिट प्रोजेक्ट और 32-बिट या 64-बिट फ़्लोटिंग पॉइंट मिश्रण[45]
घनफल डीएडब्ल्यू द्वारा स्टाइनबर्ग 32-बिट फ्लोट या 64-बिट फ्लोट के लिए ऑडियो प्रोसेसिंग त्रुटिहीनता की अनुमति देता है [46]
एबलटन लाइव [6] डीएडब्ल्यू द्वारा एबलटन 32-बिट फ्लोटिंग पॉइंट बिट डेप्थ और 64-बिट समिंग
कारण 7 डीएडब्ल्यू द्वारा प्रोपेलरहेड सॉफ्टवेयर 16-, 20- और 24-बिट I/O, 32-बिट फ्लोटिंग पॉइंट अंकगणित और 64-बिट योग [47]
रीपर 5 डीएडब्ल्यू द्वारा कोकोस इंक 8-बिट पीसीएम, 16-बिट पीसीएम, 24-बिट पीसीएम, 32-बिट पीसीएम, 32-बिट एफपी, 64-बिट एफपी, 4-बिट आईएमए एडीपीसीएम और 2-बिट सीएडीपीसीएम प्रतिपादन;

8-बिट इंट, 16-बिट इंट, 24-बिट इंट, 32-बिट इंट, 32-बिट फ्लोट और 64-बिट फ्लोट मिश्रण

गैराज बैण्ड '11 (संस्करण 6) ऐप्पल इंक द्वारा डीएडब्ल्यू। 24-बिट वास्तविक उपकरण रिकॉर्डिंग के साथ 16-बिट डिफ़ॉल्ट [48]
धृष्टता ओपन सोर्स ऑडियो एडिटर 16- और 24-बिट एलपीसीएम और 32-बिट फ्लोटिंग पॉइंट [49]
एफएल स्टूडियो डीएडब्ल्यू द्वारा छवि लाइन 16- और 24-बिट इंट और 32-बिट फ्लोटिंग पॉइंट (OS द्वारा नियंत्रित) [50]

बिट दर और फ़ाइल का आकार

बिट गहराई बिट दर और फ़ाइल आकार को प्रभावित करती है। बिट्स कंप्यूटिंग और डिजिटल संचार में उपयोग की जाने वाली डेटा की मूल इकाई है। बिट दर डेटा की मात्रा को संदर्भित करती है, विशेष रूप से बिट्स, प्रेषित या प्रति सेकंड प्राप्त होती है। इस प्रकार बिका हुआ और अन्य हानिकारक संपीड़ित ऑडियो प्रारूपों में, बिट दर ऑडियो सिग्नल को एन्कोड करने के लिए उपयोग की जाने वाली जानकारी की मात्रा का वर्णन करती है। अतः इसे सामान्यतः केबी/एस में मापा जाता है।[51]

यह भी देखें

  • ऑडियो सिस्टम माप
  • रंग गहराई, डिजिटल छवियों के लिए इसी अवधारणा
  • बिट्स की प्रभावी संख्या

टिप्पणियाँ

  1. For example, in MP3, quantization is performed on the frequency domain representation of the signal, not on the time domain samples relevant to bit depth.
  2. While 32-bit converters exist, they are purely for marketing purposes and provide no practical benefit over 24-bit converters; the extra bits are either zero or encode only noise.[15][16]
  3. Intel and AMD x86 hardware can handle higher precision than 64 bit, or even arbitrarily large float points or integers, but processing takes a lot longer than the native types.

संदर्भ

  1. Thompson, Dan (2005). Understanding Audio. Berklee Press. ISBN 978-0-634-00959-4.
  2. Smith, Julius (2007). "Pulse Code Modulation (PCM)". Mathematics of the Discrete Fourier Transform (DFT) with Audio Applications, Second Edition, online book. Retrieved 22 October 2012.
  3. Campbell, Robert (2013). Pro Tools 10 Advanced Music Production Techniques, pg. 247. Cengage Learning. ISBN 978-1133728016. Retrieved 12 August 2013.
  4. Wherry, Mark (March 2012). "Avid Pro Tools 10". Sound On Sound. Retrieved 10 August 2013.
  5. Price, Simon (October 2005). "Reason Mixing Masterclass". Sound On Sound. Retrieved 10 August 2013.
  6. 6.0 6.1 "Ableton Reference Manual Version 10, 32. Audio Fact Sheet". Ableton. 2019. Retrieved September 3, 2019.
  7. Kabal, Peter (3 January 2011). "Audio File Format Specifications, WAVE Specifications". McGill University. Retrieved 10 August 2013.
  8. Kabal, Peter (3 January 2011). "Audio File Format Specifications, AIFF / AIFF-C Specifications". McGill University. Retrieved 10 August 2013.
  9. Smith, Steven (1997–98). "The Scientist and Engineer's Guide to Digital Signal Processing, Chapter 4 – DSP Software / Floating Point (Real Numbers)". www.dspguide.com. Retrieved 10 August 2013.
  10. See Signal-to-noise ratio#Fixed point
  11. Kester, Walt (2007). "Taking the Mystery out of the Infamous Formula, "SNR = 6.02N + 1.76dB," and Why You Should Care" (PDF). Analog Devices. Retrieved 26 July 2011.
  12. Nwavguy (2011-09-06). "NwAvGuy: Noise & Dynamic Range". NwAvGuy. Retrieved 2016-12-02. 24 bit DACs often only manage approximately 16-bit performance and the very best reach 21 bit (ENOB) performance.
  13. "PCM4222". Retrieved 21 April 2011. Dynamic Range (–60dB input, A-weighted): 124dB typical Dynamic Range (–60dB input, 20 kHz Bandwidth): 122dB typical
  14. "WM8741 : High-Performance Stereo DAC". Cirrus Logic. Retrieved 2016-12-02. 128dB SNR ('A'-weighted mono @ 48 kHz) 123dB SNR (non-weighted stereo @ 48 kHz)
  15. "The great audio myth: why you don't need that 32-bit DAC". Android Authority (in English). 19 January 2016. Retrieved 2016-12-02. So your 32-bit DAC is only ever going to be able to output at most 21-bits of useful data and the other bits will be masked by circuit noise.
  16. "32-bit capable DACs". hydrogenaud.io. Retrieved 2016-12-02. all the '32 bit capable' DAC chips existent today have an actual resolution less than 24 bit.
  17. D. R. Campbell. "मानव सुनवाई के पहलू" (PDF). Archived from the original (PDF) on 21 August 2011. Retrieved 21 April 2011. The dynamic range of human hearing is [approximately] 120 dB
  18. "मानव कान की संवेदनशीलता". Archived from the original on 4 June 2011. Retrieved 21 April 2011. The practical dynamic range could be said to be from the threshold of hearing to the threshold of pain [130 dB]
  19. US6317065B1, "उन्नत गतिशील रेंज के लिए एकाधिक ए से डी कन्वर्टर्स", issued 1999-07-01 
  20. Christodoulou, Lakis; Lane, John; Kasparis, Takis (2010-03-01). "Dynamic range extension using multiple A/D converters". 2010 4th International Symposium on Communications, Control and Signal Processing (ISCCSP): 1–4. doi:10.1109/ISCCSP.2010.5463427. ISBN 978-1-4244-6285-8. S2CID 16501096.
  21. 21.0 21.1 Smith, Steven (1997–98). "The Scientist and Engineer's Guide to Digital Signal Processing, Chapter 28 – Digital Signal Processors / Fixed versus Floating Point". www.dspguide.com. Retrieved 10 August 2013.
  22. Moorer, James (September 1999). "48-Bit Integer Processing Beats 32-Bit Floating-Point for Professional Audio Applications" (PDF). www.jamminpower.com. Retrieved 12 August 2013.
  23. 23.0 23.1 23.2 Tomarakos, John. "डिजिटल ऑडियो प्रोसेसिंग अनुप्रयोगों में डेटा वर्ड साइज का डायनेमिक रेंज और सिग्नल क्वालिटी से संबंध". www.analog.com. Analog Devices. Retrieved 16 August 2013.
  24. "DSP56001A" (PDF). Freescale. Retrieved 15 August 2013.
  25. Smith, Steven (1997–98). "The Scientist and Engineer's Guide to Digital Signal Processing, Chapter 4 – DSP Software / Number Precision". Retrieved 19 August 2013.
  26. Carletta, Joan (2003). "फिक्स्ड-प्वाइंट IIR फिल्टर में सिग्नल के लिए उपयुक्त परिशुद्धता का निर्धारण". DAC. CiteSeerX 10.1.1.92.1266.
  27. Choosing a high-performance audio ADC, 14 September 2011, retrieved 2019-05-07
  28. Montgomery, Chris (25 March 2012). "24/192 Music Downloads ...and why they make no sense". xiph.org. Archived from the original on 7 July 2013. Retrieved 26 May 2013. With use of shaped dither, which moves quantization noise energy into frequencies where it's harder to hear, the effective dynamic range of 16-bit audio reaches 120dB in practice, more than fifteen times deeper than the 96dB claim. 120dB is greater than the difference between a mosquito somewhere in the same room and a jackhammer a foot away.... or the difference between a deserted 'soundproof' room and a sound loud enough to cause hearing damage in seconds. 16 bits is enough to store all we can hear and will be enough forever.
  29. Stuart, J. Robert (1997). "उच्च गुणवत्ता वाले डिजिटल ऑडियो कोडिंग" (PDF). Meridian Audio Ltd. Archived from the original (PDF) on 7 April 2016. Retrieved 25 February 2016. पीसीएम में महान खोजों में से एक यह था कि एक छोटे से यादृच्छिक शोर (जिसे हम डिथर कहते हैं) जोड़कर ट्रंकेशन प्रभाव गायब हो सकता है। इससे भी अधिक महत्वपूर्ण यह अहसास था कि जोड़ने के लिए एक 'सही' प्रकार का यादृच्छिक शोर है और जब सही डाइर का उपयोग किया जाता है, तो डिजिटल सिस्टम का संकल्प 'अनंत' हो जाता है।
  30. "एनालॉग-टू-डिजिटल रूपांतरण में दुविधा" (PDF). e2v Semiconductors. 2007. Archived from the original (PDF) on 4 October 2011. Retrieved 26 July 2011.
  31. Kester, Walt. "ओवरसैंपलिंग इंटरपोलिंग डीएसी" (PDF). Analog Devices. Archived from the original (PDF) on 19 May 2012. Retrieved 19 August 2013.
  32. "सीडी का इतिहास". philips.com. Retrieved 7 October 2020.
  33. "फिलिप्स सीडी 100". hifiengine.
  34. "सोनी सीडीपी-101". hifiengine.
  35. "B.1 पहले और दूसरे क्रम के शोर को आकार देने वाले लूप". Retrieved 19 August 2013.
  36. "Sweetwater Knowledge Base, Masterlink: What is a "Red Book" CD?". www.sweetwater.com. Sweetwater. 27 April 2007. Retrieved 25 August 2013.
  37. "Understanding DVD-Audio" (PDF). Sonic Solutions. Archived from the original (PDF) on 4 March 2012. Retrieved 25 August 2013.
  38. Shapiro, L. (2 July 2001). "Surround Sound, Page 10". ExtremeTech. Retrieved 26 August 2013.
  39. "White paper Blu-ray Disc Format, 2.B Audio Visual Application Format Specifications for BD-ROM Version 2.4" (PDF). Blu-ray Disc Association. April 2010. Retrieved 25 August 2013.
  40. Puhovski, Nenad (April 2000). "DV – A SUCCESS STORY". www.stanford.edu. Archived from the original on 27 October 2004. Retrieved 26 August 2013.
  41. "G.711 : Pulse code modulation (PCM) of voice frequencies" (PDF). International Telecommunication Union. Retrieved 25 August 2013.
  42. "DIGITAL SOUND SIGNALS: tests to compare the performance of five companding systems for high-quality sound signals" (PDF). BBC Research Department. August 1978. Archived from the original (PDF) on 8 November 2012. Retrieved 26 August 2013.
  43. "Ardour Key Features". Ardour Community. 2014. Retrieved 8 April 2014.
  44. "Pro Tools Documentation, Pro Tools Reference Guide" (ZIP/PDF). Avid. 2013. Retrieved 26 August 2013.
  45. "Logic Pro X: User Guide" (PDF). Apple. January 2010. Retrieved 26 August 2013.[permanent dead link]
  46. "Cubase Pro 10.5 Manual" (PDF). Steinberg. 2020. Retrieved September 2, 2020.
  47. "Reason 7 Operation Manual" (PDF). Propellerhead Software. 2013. Archived from the original (PDF) on 24 May 2013. Retrieved 26 August 2013.
  48. "GarageBand '11: Set the audio resolution". Apple. 13 March 2012. Retrieved 26 August 2013.
  49. "Audacity: Features". wiki.audacityteam.com. Audacity development team. Retrieved 13 September 2014.
  50. "Audio Settings". www.image-line.com. Retrieved 2019-02-12.
  51. "Sample Rate, Bit-Depth & Bitrate | Exclusivemusicplus". Exclusivemusicplus (in English). 2018-10-26. Retrieved 2018-11-30.
  • Ken C. Pohlmann (15 February 2000). Principles of Digital Audio (4th ed.). McGraw-Hill Professional. ISBN 978-0-07-134819-5.


Cite error: <ref> tags exist for a group named "upper-alpha", but no corresponding <references group="upper-alpha"/> tag was found