बैंडविड्थ एक्सटेंशन: Difference between revisions
m (Sugatha moved page बैंडविड्थ विस्तार to बैंडविड्थ एक्सटेंशन without leaving a redirect) |
No edit summary |
||
Line 1: | Line 1: | ||
[[सिग्नल (इलेक्ट्रिकल इंजीनियरिंग)]] के '''बैंडविड्थ | [[सिग्नल (इलेक्ट्रिकल इंजीनियरिंग)]] के '''बैंडविड्थ एक्सटेंशन''' को सिग्नल की आवृत्ति रेंज ([[बैंडविड्थ (सिग्नल प्रोसेसिंग)]]) का एक्सटेंशन करने की जानबूझकर प्रक्रिया के रूप में परिभाषित किया गया है जिसमें एक सराहनीय और उपयोगी सामग्री होती है, और/या आवृत्ति रेंज जिसमें इसके प्रभाव होते हैंl हाल के वर्षों में इसकी महत्वपूर्ण प्रगति के कारण प्रौद्योगिकी को कई क्षेत्रों में व्यावसायिक रूप से अपनाया जा रहा है, जिसमें सूक्ष्म [[ ध्वनि-विस्तारक यंत्र | ध्वनि-एक्सटेंशनक यंत्र]] की [[मनो]] बास वृद्धि और कोडित भाषण और ऑडियो की उच्च आवृत्ति वृद्धि सम्मिलित है। | ||
बैंडविड्थ एक्सटेंशन का उपयोग वाक् और ऑडियो संपीड़न अनुप्रयोगों दोनों में किया गया है। G.729.1 और [[स्पेक्ट्रल बैंड प्रतिकृति]] (एसबीआर) में प्रयुक्त एल्गोरिदम वर्तमान में उपयोग में आने वाले बैंडविड्थ एक्सटेंशन एल्गोरिदम के कई उदाहरणों में से दो हैं। इन तरीकों में, स्पेक्ट्रम के निचले बैंड को उपलब्ध कोडेक का उपयोग करके एन्कोड किया जाता है, जबकि उच्च बैंड को कम मापदंडों का उपयोग करके मोटे तौर पर पैरामीटरयुक्त किया जाता है। इनमें से कई बैंडविड्थ एक्सटेंशन एल्गोरिदम निकाले गए निचले-बैंड सुविधाओं से व्यापक बैंड सिग्नल की भविष्यवाणी करने के लिए निम्न बैंड और उच्च बैंड के बीच सहसंबंध का उपयोग करते हैं। अन्य लोग बहुत कम बिट्स का उपयोग करके उच्च बैंड को एन्कोड करते हैं। यह प्रायः पर्याप्त होता है क्योंकि कान निचले बैंड की तुलना में उच्च बैंड में विकृतियों के प्रति कम संवेदनशील होते हैं। | बैंडविड्थ एक्सटेंशन का उपयोग वाक् और ऑडियो संपीड़न अनुप्रयोगों दोनों में किया गया है। G.729.1 और [[स्पेक्ट्रल बैंड प्रतिकृति]] (रेप्लिकेशन) (एसबीआर) में प्रयुक्त एल्गोरिदम वर्तमान में उपयोग में आने वाले बैंडविड्थ एक्सटेंशन एल्गोरिदम के कई उदाहरणों में से दो हैं। इन तरीकों में, स्पेक्ट्रम के निचले बैंड को उपलब्ध कोडेक का उपयोग करके एन्कोड किया जाता है, जबकि उच्च बैंड को कम मापदंडों का उपयोग करके मोटे तौर पर पैरामीटरयुक्त किया जाता है। इनमें से कई बैंडविड्थ एक्सटेंशन एल्गोरिदम निकाले गए निचले-बैंड सुविधाओं से व्यापक बैंड सिग्नल की भविष्यवाणी करने के लिए निम्न बैंड और उच्च बैंड के बीच सहसंबंध का उपयोग करते हैं। अन्य लोग बहुत कम बिट्स का उपयोग करके उच्च बैंड को एन्कोड करते हैं। यह प्रायः पर्याप्त होता है क्योंकि कान निचले बैंड की तुलना में उच्च बैंड में विकृतियों के प्रति कम संवेदनशील होते हैं। | ||
== सूक्ष्म लाउडस्पीकरों की बास वृद्धि == | == सूक्ष्म लाउडस्पीकरों की बास वृद्धि == | ||
Line 8: | Line 8: | ||
उच्च आवृत्ति प्रतिक्रिया को हार्मोनिक्स की पीढ़ी के माध्यम से भी बढ़ाया जा सकता है। स्पीकर के प्रतिलिपि प्रस्तुत करने योग्य क्षेत्र के अंदर आवृत्तियों को मैप करने के बजाय, स्पीकर का उपयोग सामान्य प्रतिलिपि प्रस्तुत करने योग्य क्षेत्र के बाहर आवृत्तियों को उत्पन्न करने के लिए किया जाता है। उच्च आवृत्तियों को बढ़ाकर और स्पीकर या एम्पलीफायर को थोड़ा अधिक चलाकर, उच्च हार्मोनिक्स उत्पन्न किया जा सकता है। | उच्च आवृत्ति प्रतिक्रिया को हार्मोनिक्स की पीढ़ी के माध्यम से भी बढ़ाया जा सकता है। स्पीकर के प्रतिलिपि प्रस्तुत करने योग्य क्षेत्र के अंदर आवृत्तियों को मैप करने के बजाय, स्पीकर का उपयोग सामान्य प्रतिलिपि प्रस्तुत करने योग्य क्षेत्र के बाहर आवृत्तियों को उत्पन्न करने के लिए किया जाता है। उच्च आवृत्तियों को बढ़ाकर और स्पीकर या एम्पलीफायर को थोड़ा अधिक चलाकर, उच्च हार्मोनिक्स उत्पन्न किया जा सकता है। | ||
== टेलीफोन प्रणालियों में भाषण (स्पीच) का बैंडविड्थ | == टेलीफोन प्रणालियों में भाषण (स्पीच) का बैंडविड्थ एक्सटेंशन == | ||
टेलीफोन भाषण सिग्नल सामान्यतः गुणवत्ता में बहुत खराब होते हैं। इस गिरावट का एक हिस्सा टेलीफोन प्रणालियों में उपयोग की जाने वाली सीमित बैंडविड्थ के कारण है। अधिकांश प्रणालियों में 250 हर्ट्ज से कम आवृत्तियों में कटौती की जाती है और बैंडविड्थ केवल 4 या 8 किलोहर्ट्ज़ की आवृत्तियों तक | टेलीफोन भाषण सिग्नल सामान्यतः गुणवत्ता में बहुत खराब होते हैं। इस गिरावट का एक हिस्सा टेलीफोन प्रणालियों में उपयोग की जाने वाली सीमित बैंडविड्थ के कारण है। अधिकांश प्रणालियों में 250 हर्ट्ज से कम आवृत्तियों में कटौती की जाती है और बैंडविड्थ केवल 4 या 8 किलोहर्ट्ज़ की आवृत्तियों तक एक्सटेंशनित होता है। फ़िल्टरिंग और वेवशेपिंग का उपयोग करके कम और उच्च-आवृत्ति प्रतिक्रिया को बढ़ाया जा सकता है। | ||
निम्न पास फ़िल्टरिंग द्वारा सबसे कम ऑक्टेव और अर्ध-तरंग को सुधारकर एक तरंग को मूल आवृत्ति के मौलिक आधे के साथ बनाया जाता है। तरंगरूप में असंतोष के कारण सभी हार्मोनिक्स को फ़िल्टर करने के लिए कम पास फ़िल्टरिंग की आवश्यकता होती है। ऐसे [[सबहार्मोनिक सिंथेसाइज़र]] का उपयोग करके 125 - 250 हर्ट्ज के बीच आवश्यक आवृत्ति बैंड को फिर से बनाया जाता है, जिससे सिग्नल में वजन जुड़ जाता है। | निम्न पास फ़िल्टरिंग द्वारा सबसे कम ऑक्टेव और अर्ध-तरंग को सुधारकर एक तरंग को मूल आवृत्ति के मौलिक आधे के साथ बनाया जाता है। तरंगरूप में असंतोष के कारण सभी हार्मोनिक्स को फ़िल्टर करने के लिए कम पास फ़िल्टरिंग की आवश्यकता होती है। ऐसे [[सबहार्मोनिक सिंथेसाइज़र]] का उपयोग करके 125 - 250 हर्ट्ज के बीच आवश्यक आवृत्ति बैंड को फिर से बनाया जाता है, जिससे सिग्नल में वजन जुड़ जाता है। | ||
उच्च-आवृत्ति बैंडविड्थ को बढ़ाने के लिए, हम उच्च पास फ़िल्टरिंग का उपयोग करके शीर्ष ऑक्टेव को अलग कर सकते हैं और फिर इसके हार्मोनिक्स उत्पन्न कर सकते हैं। हार्मोनिक्स का निर्माण एक सरल पूर्ण-तरंग सुधार के माध्यम से किया जा सकता है, जो कम्प्यूटेशनल रूप से सस्ता है और आयाम-निर्भर नहीं है। एक विकल्प के रूप में [[सिंगल-साइडबैंड मॉड्यूलेशन]] का उपयोग किया जा सकता है, जो हार्मोनिक्स की संख्या और आयाम पर सटीक नियंत्रण देता है। सिद्धांत रूप में, | उच्च-आवृत्ति बैंडविड्थ को बढ़ाने के लिए, हम उच्च पास फ़िल्टरिंग का उपयोग करके शीर्ष ऑक्टेव को अलग कर सकते हैं और फिर इसके हार्मोनिक्स उत्पन्न कर सकते हैं। हार्मोनिक्स का निर्माण एक सरल पूर्ण-तरंग सुधार के माध्यम से किया जा सकता है, जो कम्प्यूटेशनल रूप से सस्ता है और आयाम-निर्भर नहीं है। एक विकल्प के रूप में [[सिंगल-साइडबैंड मॉड्यूलेशन]] का उपयोग किया जा सकता है, जो हार्मोनिक्स की संख्या और आयाम पर सटीक नियंत्रण देता है। सिद्धांत रूप में, अन्वालोप अनुमान का उपयोग मूल उच्च-आवृत्ति अन्वालोप को निकालने और रव स्रोत का उपयोग करके उच्च आवृत्तियों को पुनर्जीवित करने के लिए किया जा सकता है। छोटी बैंडविड्थ में उपलब्ध विरल जानकारी संभवतः एक उचित अन्वालोप निकालने के लिए बहुत सीमित होगी। | ||
== ऑडियो का बैंडविड्थ | == ऑडियो का बैंडविड्थ एक्सटेंशन == | ||
[[स्पेक्ट्रल बैंड प्रतिकृति]] (एसबीआर) एक नई तकनीक है जिसने एमपी3 और [[उन्नत ऑडियो कोडिंग]] (एएसी) जैसी लोकप्रिय [[अवधारणात्मक ऑडियो कोडिंग]] में "एड-ऑन" के रूप में लोकप्रियता प्राप्त की है। एसबीआर और पारंपरिक ऑडियो कोडर के बीच मेल से नए ऑडियो कोडर बनाए गए हैं, अर्थात् [[एमपी3प्रो]] और [[एएसी+]] हैंl इन एल्गोरिदम में, निचले [[स्पेक्ट्रम]] को एमपी-3 या | [[स्पेक्ट्रल बैंड प्रतिकृति]] (एसबीआर) एक नई तकनीक है जिसने एमपी3 और [[उन्नत ऑडियो कोडिंग]] (एएसी) जैसी लोकप्रिय [[अवधारणात्मक ऑडियो कोडिंग]] में "एड-ऑन" के रूप में लोकप्रियता प्राप्त की है। एसबीआर और पारंपरिक ऑडियो कोडर के बीच मेल से नए ऑडियो कोडर बनाए गए हैं, अर्थात् [[एमपी3प्रो]] और [[एएसी+]] हैंl इन एल्गोरिदम में, निचले [[स्पेक्ट्रम]] को एमपी-3 या [[एएसी+|एएसी]] का उपयोग करके एन्कोड किया जाता है, जबकि उच्च बैंड को एसबीआर का उपयोग करके एन्कोड किया जाता है। एसबीआर एल्गोरिदम की कुंजी सिग्नल के उच्च-आवृत्ति भाग का वर्णन करने के लिए उपयोग की जाने वाली जानकारी है। इस एल्गोरिदम का प्राथमिक डिज़ाइन लक्ष्य किसी भी [[अलियासिंग]] कलाकृतियों को पेश किए बिना उच्च बैंड स्पेक्ट्रम का पुनर्निर्माण करना और अच्छा वर्णक्रमीय और समय रिज़ॉल्यूशन प्रदान करना है। विश्लेषण भाग में 64-बैंड कॉम्प्लेक्स-वैल्यू पॉलीफ़ेज़ [[फ़िल्टर बैंक]] का उपयोग किया जाता है। एनकोडर पर, फ़िल्टरबैंक का उपयोग मूल इनपुट सिग्नल के उच्च बैंड के ऊर्जा नमूने प्राप्त करने के लिए किया जाता है। फिर इन ऊर्जा नमूनों को डिकोडर में उपयोग की जाने वाली अन्वालोप समायोजन योजना के लिए संदर्भ मान के रूप में उपयोग किया जाता है। | ||
==टिप्पणियाँ== | ==टिप्पणियाँ== | ||
{{reflist}} | {{reflist}} | ||
==संदर्भ== | ==संदर्भ== | ||
* R.M. Aarts, Erik Larsen and O. Ouweltjes (2003), "A unified approach to low- and high-frequency bandwidth extension", Convention paper 5921 presented at the [[Audio Engineering Society]] 115th Convention 2003, Oct. 10–13, New York, USA | * R.M. Aarts, Erik Larsen and O. Ouweltjes (2003), "A unified approach to low- and high-frequency bandwidth extension", Convention paper 5921 presented at the [[Audio Engineering Society]] 115th Convention 2003, Oct. 10–13, New York, USA |
Revision as of 16:52, 21 September 2023
सिग्नल (इलेक्ट्रिकल इंजीनियरिंग) के बैंडविड्थ एक्सटेंशन को सिग्नल की आवृत्ति रेंज (बैंडविड्थ (सिग्नल प्रोसेसिंग)) का एक्सटेंशन करने की जानबूझकर प्रक्रिया के रूप में परिभाषित किया गया है जिसमें एक सराहनीय और उपयोगी सामग्री होती है, और/या आवृत्ति रेंज जिसमें इसके प्रभाव होते हैंl हाल के वर्षों में इसकी महत्वपूर्ण प्रगति के कारण प्रौद्योगिकी को कई क्षेत्रों में व्यावसायिक रूप से अपनाया जा रहा है, जिसमें सूक्ष्म ध्वनि-एक्सटेंशनक यंत्र की मनो बास वृद्धि और कोडित भाषण और ऑडियो की उच्च आवृत्ति वृद्धि सम्मिलित है।
बैंडविड्थ एक्सटेंशन का उपयोग वाक् और ऑडियो संपीड़न अनुप्रयोगों दोनों में किया गया है। G.729.1 और स्पेक्ट्रल बैंड प्रतिकृति (रेप्लिकेशन) (एसबीआर) में प्रयुक्त एल्गोरिदम वर्तमान में उपयोग में आने वाले बैंडविड्थ एक्सटेंशन एल्गोरिदम के कई उदाहरणों में से दो हैं। इन तरीकों में, स्पेक्ट्रम के निचले बैंड को उपलब्ध कोडेक का उपयोग करके एन्कोड किया जाता है, जबकि उच्च बैंड को कम मापदंडों का उपयोग करके मोटे तौर पर पैरामीटरयुक्त किया जाता है। इनमें से कई बैंडविड्थ एक्सटेंशन एल्गोरिदम निकाले गए निचले-बैंड सुविधाओं से व्यापक बैंड सिग्नल की भविष्यवाणी करने के लिए निम्न बैंड और उच्च बैंड के बीच सहसंबंध का उपयोग करते हैं। अन्य लोग बहुत कम बिट्स का उपयोग करके उच्च बैंड को एन्कोड करते हैं। यह प्रायः पर्याप्त होता है क्योंकि कान निचले बैंड की तुलना में उच्च बैंड में विकृतियों के प्रति कम संवेदनशील होते हैं।
सूक्ष्म लाउडस्पीकरों की बास वृद्धि
प्रायः सूक्ष्म लाउडस्पीकर कम आवृत्ति वाली सामग्री को पुन: प्रस्तुत करने में शारीरिक रूप से असमर्थ होते हैं।[1] लापता मौलिक जैसी मनो-ध्वनिक घटना का उपयोग करके, कम आवृत्तियों की धारणा को काफी बढ़ाया जा सकता है। निम्न आवृत्तियों के हार्मोनिक्स उत्पन्न करके और निम्न आवृत्तियों को स्वयं हटाकर, यह सुझाव दिया जाता है कि ये आवृत्तियाँ अभी भी सिग्नल में शेष हैं। यह प्रक्रिया सामान्यतः बाहरी उपकरणों के माध्यम से लागू की जाती है या डिजिटल सिग्नल प्रोसेसर का उपयोग करके स्पीकर सिस्टम में एम्बेडेड होती है।
उच्च आवृत्ति प्रतिक्रिया को हार्मोनिक्स की पीढ़ी के माध्यम से भी बढ़ाया जा सकता है। स्पीकर के प्रतिलिपि प्रस्तुत करने योग्य क्षेत्र के अंदर आवृत्तियों को मैप करने के बजाय, स्पीकर का उपयोग सामान्य प्रतिलिपि प्रस्तुत करने योग्य क्षेत्र के बाहर आवृत्तियों को उत्पन्न करने के लिए किया जाता है। उच्च आवृत्तियों को बढ़ाकर और स्पीकर या एम्पलीफायर को थोड़ा अधिक चलाकर, उच्च हार्मोनिक्स उत्पन्न किया जा सकता है।
टेलीफोन प्रणालियों में भाषण (स्पीच) का बैंडविड्थ एक्सटेंशन
टेलीफोन भाषण सिग्नल सामान्यतः गुणवत्ता में बहुत खराब होते हैं। इस गिरावट का एक हिस्सा टेलीफोन प्रणालियों में उपयोग की जाने वाली सीमित बैंडविड्थ के कारण है। अधिकांश प्रणालियों में 250 हर्ट्ज से कम आवृत्तियों में कटौती की जाती है और बैंडविड्थ केवल 4 या 8 किलोहर्ट्ज़ की आवृत्तियों तक एक्सटेंशनित होता है। फ़िल्टरिंग और वेवशेपिंग का उपयोग करके कम और उच्च-आवृत्ति प्रतिक्रिया को बढ़ाया जा सकता है।
निम्न पास फ़िल्टरिंग द्वारा सबसे कम ऑक्टेव और अर्ध-तरंग को सुधारकर एक तरंग को मूल आवृत्ति के मौलिक आधे के साथ बनाया जाता है। तरंगरूप में असंतोष के कारण सभी हार्मोनिक्स को फ़िल्टर करने के लिए कम पास फ़िल्टरिंग की आवश्यकता होती है। ऐसे सबहार्मोनिक सिंथेसाइज़र का उपयोग करके 125 - 250 हर्ट्ज के बीच आवश्यक आवृत्ति बैंड को फिर से बनाया जाता है, जिससे सिग्नल में वजन जुड़ जाता है।
उच्च-आवृत्ति बैंडविड्थ को बढ़ाने के लिए, हम उच्च पास फ़िल्टरिंग का उपयोग करके शीर्ष ऑक्टेव को अलग कर सकते हैं और फिर इसके हार्मोनिक्स उत्पन्न कर सकते हैं। हार्मोनिक्स का निर्माण एक सरल पूर्ण-तरंग सुधार के माध्यम से किया जा सकता है, जो कम्प्यूटेशनल रूप से सस्ता है और आयाम-निर्भर नहीं है। एक विकल्प के रूप में सिंगल-साइडबैंड मॉड्यूलेशन का उपयोग किया जा सकता है, जो हार्मोनिक्स की संख्या और आयाम पर सटीक नियंत्रण देता है। सिद्धांत रूप में, अन्वालोप अनुमान का उपयोग मूल उच्च-आवृत्ति अन्वालोप को निकालने और रव स्रोत का उपयोग करके उच्च आवृत्तियों को पुनर्जीवित करने के लिए किया जा सकता है। छोटी बैंडविड्थ में उपलब्ध विरल जानकारी संभवतः एक उचित अन्वालोप निकालने के लिए बहुत सीमित होगी।
ऑडियो का बैंडविड्थ एक्सटेंशन
स्पेक्ट्रल बैंड प्रतिकृति (एसबीआर) एक नई तकनीक है जिसने एमपी3 और उन्नत ऑडियो कोडिंग (एएसी) जैसी लोकप्रिय अवधारणात्मक ऑडियो कोडिंग में "एड-ऑन" के रूप में लोकप्रियता प्राप्त की है। एसबीआर और पारंपरिक ऑडियो कोडर के बीच मेल से नए ऑडियो कोडर बनाए गए हैं, अर्थात् एमपी3प्रो और एएसी+ हैंl इन एल्गोरिदम में, निचले स्पेक्ट्रम को एमपी-3 या एएसी का उपयोग करके एन्कोड किया जाता है, जबकि उच्च बैंड को एसबीआर का उपयोग करके एन्कोड किया जाता है। एसबीआर एल्गोरिदम की कुंजी सिग्नल के उच्च-आवृत्ति भाग का वर्णन करने के लिए उपयोग की जाने वाली जानकारी है। इस एल्गोरिदम का प्राथमिक डिज़ाइन लक्ष्य किसी भी अलियासिंग कलाकृतियों को पेश किए बिना उच्च बैंड स्पेक्ट्रम का पुनर्निर्माण करना और अच्छा वर्णक्रमीय और समय रिज़ॉल्यूशन प्रदान करना है। विश्लेषण भाग में 64-बैंड कॉम्प्लेक्स-वैल्यू पॉलीफ़ेज़ फ़िल्टर बैंक का उपयोग किया जाता है। एनकोडर पर, फ़िल्टरबैंक का उपयोग मूल इनपुट सिग्नल के उच्च बैंड के ऊर्जा नमूने प्राप्त करने के लिए किया जाता है। फिर इन ऊर्जा नमूनों को डिकोडर में उपयोग की जाने वाली अन्वालोप समायोजन योजना के लिए संदर्भ मान के रूप में उपयोग किया जाता है।
टिप्पणियाँ
संदर्भ
- R.M. Aarts, Erik Larsen and O. Ouweltjes (2003), "A unified approach to low- and high-frequency bandwidth extension", Convention paper 5921 presented at the Audio Engineering Society 115th Convention 2003, Oct. 10–13, New York, USA
- V. Berisha and A. Spanias "Wideband Speech Recovery Using Psychoacoustic Criteria" EURASIP Journal on Audio, Speech, and Music Processing, 2007
- V. Berisha and A. Spanias "A Scalable Bandwidth Extension Algorithm", Proceedings of IEEE International Conference on Acoustics, Speech and Signal Processing, 2007. Vol. 4, Pages: 601–604, April 2007
- A. McCree, T. Unno, A. Anandakumar, A. Bernard, and E. Paksoy, "An embedded adaptive multi-rate wideband speech coder", in Proc. IEEE Int. Conf. Acoust., Speech Signal Processing, vol. 2, May 2001, pp. 761–764.
- P. Jax and P. Vary, "Enhancement of band-limited speech signals", in Proc. of Aachen Symposium on Signal Theory, September 2001, pp. 331–336.
- M. Nilsson and W. Kleijn, "Avoiding over-estimation in bandwidth extension of telephony speech", in Proc. IEEE Int. Conf. Acoust., Speech Signal Processing, vol. 2, May 2001, pp. 869–872.