ऑडियो कोडिंग प्रारूप: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
 
(17 intermediate revisions by 4 users not shown)
Line 1: Line 1:
[[File:Opus quality comparison colorblind compatible.svg|thumb|लोकप्रिय ऑडियो प्रारूपों के बीच कोडिंग दक्षता की तुलना]]ऑडियो कोडिंग प्रारूप<ref>The term "audio coding" can be seen in e.g. the name [[Advanced Audio Coding]], and is analogous to the term [[video coding format|video coding]]</ref> (या कभी-कभी ऑडियो संपीड़न प्रारूप) [[डिजिटल ऑडियो]] (जैसे [[डिजिटल टेलीविजन]], [[डिजिटल रेडियो]] और ऑडियो और वीडियो फ़ाइलों में) के भंडारण या प्रसारण के लिए [[सामग्री प्रारूप]] है। ऑडियो कोडिंग स्वरूपों के उदाहरणों में [[MP3]], [[उन्नत ऑडियो कोडिंग]], [[Vorbis|वॉर्बिस]] , [[FLAC|फ्लैक]], और ओपुस (ऑडियो प्रारूप) सम्मलित हैं। विशिष्ट सॉफ़्टवेयर या हार्डवेयर कार्यान्वयन जो डेटा संपीड़न ऑडियो और विशिष्ट ऑडियो कोडिंग प्रारूप के लिए सक्षम है, उसे '[[ऑडियो कोडेक]]' कहा जाता है; ऑडियो कोडेक का उदाहरण [[LAME|लेम]] है, जो कई अलग-अलग कोडेक में से है जो सॉफ्टवेयर में MP3 ऑडियो कोडिंग प्रारूप में ऑडियो को एन्कोडिंग और डिकोडिंग लागू करता है।
[[File:Opus quality comparison colorblind compatible.svg|thumb|लोकप्रिय ऑडियो प्रारूपों के बीच कोडिंग दक्षता की तुलना]]ऑडियो कोडिंग प्रारूप<ref>The term "audio coding" can be seen in e.g. the name [[Advanced Audio Coding]], and is analogous to the term [[video coding format|video coding]]</ref> (या कभी-कभी ऑडियो संपीड़न प्रारूप) [[डिजिटल ऑडियो]] जैसे [[डिजिटल टेलीविजन]], [[डिजिटल रेडियो]] और ऑडियो और वीडियो फ़ाइलों के भंडारण या प्रसारण के लिए [[सामग्री प्रारूप]] है। ऑडियो कोडिंग स्वरूपों के उदाहरणों में [[MP3|एमपी 3]], [[उन्नत ऑडियो कोडिंग]], [[Vorbis|वॉर्बिस]] , [[FLAC|फ्लैक]] और ओपुस (ऑडियो प्रारूप) सम्मलित हैं। विशिष्ट सॉफ़्टवेयर या हार्डवेयर कार्यान्वयन जो डेटा संपीड़न ऑडियो और विशिष्ट ऑडियो कोडिंग प्रारूप के लिए सक्षम है, उसे '[[ऑडियो कोडेक]]' कहा जाता है। ऑडियो कोडेक का उदाहरण [[LAME|लेम]] है, जो कई अलग-अलग कोडेक में से है जो सॉफ्टवेयर में एमपी 3 ऑडियो कोडिंग प्रारूप में ऑडियो को एन्कोडिंग और डिकोडिंग लागू करता है।


कुछ ऑडियो कोडिंग प्रारूपों को विस्तृत [[तकनीकी विनिर्देश|प्राविधिक विनिर्देश]] प्रलेख द्वारा प्रलेखित किया जाता है जिसे ऑडियो कोडिंग विनिर्देश के रूप में जाना जाता है। कुछ ऐसी विशिष्टताओं को [[मानकीकरण संगठन]] द्वारा [[तकनीकी मानक|प्राविधिक मानक]] के रूप में लिखा और अनुमोदित किया जाता है, और इस प्रकार ऑडियो कोडिंग मानक के रूप में जाना जाता है। मानक शब्द का प्रयोग कभी-कभी वास्तविक मानक के लिए भी किया जाता है। और वास्तविक मानकों के साथ-साथ औपचारिक मानकों के लिए भी किया जाता है।
कुछ ऑडियो कोडिंग प्रारूपों को विस्तृत [[तकनीकी विनिर्देश|प्राविधिक विनिर्देश]] प्रलेख द्वारा प्रलेखित किया जाता है जिसे ऑडियो कोडिंग विनिर्देश के रूप में जाना जाता है। कुछ ऐसी विशिष्टताओं को [[मानकीकरण संगठन]] द्वारा [[तकनीकी मानक|प्राविधिक मानक]] के रूप में लिखा और अनुमोदित किया जाता है और इस प्रकार ऑडियो कोडिंग मानक के रूप में जाना जाता है। मानक शब्द का प्रयोग कभी-कभी वास्तविक मानक के लिए भी किया जाता है और वास्तविक मानकों के साथ-साथ औपचारिक मानकों के लिए भी किया जाता है।


विशेष ऑडियो कोडिंग प्रारूप में एन्कोडेड ऑडियो सामग्री सामान्य रूप से [[कंटेनर प्रारूप (डिजिटल)]] के भीतर समाहित होती है। इस प्रकार, उपयोगकर्ता के पास सामान्य रूप से कच्ची उन्नत ऑडियो कोडिंग फ़ाइल नहीं होती है, जबकि इसके अतिरिक्त m4a [[ऑडियो फ़ाइल स्वरूप]] होता है, जो [[एमपीईजी-1|एमपीईजी-4 भाग 14]] कंटेनर होता है जिसमें AAC-एन्कोडेड ऑडियो होता है। कंटेनर में शीर्षक और अन्य टैग जैसे [[ मेटा डेटा |मेटा डेटा]] भी होते हैं, और संभवतः तेजी से खोज के लिए अनुक्रमणिका भी होती है।<ref>{{Cite web | url=http://superuser.com/questions/357686/where-is-synchronization-information-stored-in-container-formats | title=Video - Where is synchronization information stored in container formats?}}</ref> उल्लेखनीय अपवाद MP3 फाइलें हैं, जो कंटेनर प्रारूप के बिना अपरिष्कृत ऑडियो कोडिंग हैं। MP3 में शीर्षक और कलाकार जैसे मेटाडेटा टैग जोड़ने के लिए वास्तविक मानक, जैसे आईडी3, हैक (कंप्यूटर विज्ञान) हैं  कंप्यूटर विज्ञान में जो MP3 में टैग जोड़कर कार्य करते हैं और फिर चंक को पहचानने के लिए MP3 प्लेयर पर भरोसा करते हैं विकृत ऑडियो कोडिंग के रूप में और इसलिए इसे छोड़ दें। ऑडियो के साथ वीडियो फ़ाइलों में, एन्कोडेड ऑडियो सामग्री को [[मल्टीमीडिया कंटेनर प्रारूप]] के अंदर वीडियो ([[वीडियो कोडिंग प्रारूप]] में) के साथ बंडल किया जाता है।
विशेष ऑडियो कोडिंग प्रारूप में एन्कोडेड ऑडियो सामग्री सामान्य रूप से [[कंटेनर प्रारूप (डिजिटल)]] के भीतर समाहित होती है। इस प्रकार, उपयोगकर्ता के पास सामान्य रूप से कच्ची उन्नत ऑडियो कोडिंग फ़ाइल नहीं होती है, जबकि इसके अतिरिक्त m4a [[ऑडियो फ़ाइल स्वरूप]] होता है, जो [[एमपीईजी-1|एमपीईजी-4 भाग 14]] कंटेनर होता है जिसमें एएसी-एन्कोडेड ऑडियो होता है। कंटेनर में शीर्षक और अन्य टैग जैसे [[ मेटा डेटा |मेटा डेटा]] भी होते हैं और संभवतः तेजी से खोज के लिए अनुक्रमणिका भी होती है।<ref>{{Cite web | url=http://superuser.com/questions/357686/where-is-synchronization-information-stored-in-container-formats | title=Video - Where is synchronization information stored in container formats?}}</ref> उल्लेखनीय अपवाद एमपी 3 फाइलें हैं, जो कंटेनर प्रारूप के बिना अपरिष्कृत ऑडियो कोडिंग हैं। एमपी 3 में शीर्षक और कलाकार जैसे मेटाडेटा टैग जोड़ने के लिए वास्तविक मानक, जैसे आईडी3, हैक (कंप्यूटर विज्ञान) हैं। कंप्यूटर विज्ञान में जो एमपी 3 में टैग जोड़कर कार्य करते हैं और फिर चंक को पहचानने के लिए एमपी 3 प्लेयर पर भरोसा करते हैं विकृत ऑडियो कोडिंग के रूप में और इसलिए इसे छोड़ दें। ऑडियो के साथ वीडियो फ़ाइलों में एन्कोडेड ऑडियो सामग्री को [[मल्टीमीडिया कंटेनर प्रारूप]] के अंदर वीडियो ([[वीडियो कोडिंग प्रारूप]] में) के साथ बंडल किया जाता है।


ऑडियो कोडिंग प्रारूप प्रारूप को लागू करने वाले [[कोडेक]] द्वारा उपयोग किए जाने वाले सभी [[कलन विधि]] को निर्देशित नहीं करता है। मनोविश्लेषक मॉडल के अनुसार, हानिपूर्ण ऑडियो संपीड़न कैसे कार्य करता है इसका महत्वपूर्ण भाग डेटा को उन विधियों से हटाकर है जिन्हें मनुष्य सुन नहीं सकता है। एनकोडर के कार्यान्वयनकर्ता के पास पसंद की कुछ स्वतंत्रता होती है जिसमें डेटा को हटाना होता है (उनके मनोध्वनिक मॉडल के अनुसार)।
ऑडियो कोडिंग प्रारूप प्रारूप को लागू करने वाले [[कोडेक]] द्वारा उपयोग किए जाने वाले सभी [[कलन विधि]] को निर्देशित नहीं करता है। मनोविश्लेषक मॉडल के अनुसार, हानिपूर्ण ऑडियो संपीड़न कैसे कार्य करता है इसका महत्वपूर्ण भाग डेटा को उन विधियों से हटाकर है जिन्हें मनुष्य सुन नहीं सकता है। एनकोडर के कार्यान्वयनकर्ता के पास पसंद की कुछ स्वतंत्रता होती है जिसमें डेटा को हटाना होता है (उनके मनोध्वनिक मॉडल के अनुसार)।


== दोषरहित, हानिपूर्ण और [[असम्पीडित ऑडियो]] कोडिंग प्रारूप ==
== दोषरहित, हानिपूर्ण और [[असम्पीडित ऑडियो]] कोडिंग प्रारूप ==
[[दोषरहित संपीड़न]] ऑडियो कोडिंग प्रारूप ध्वनि का प्रतिनिधित्व करने के लिए आवश्यक कुल डेटा को कम कर देता है किन्तु इसके मूल, असम्पीडित रूप में डी-कोड किया जा सकता है। [[हानिपूर्ण संपीड़न]] ऑडियो कोडिंग प्रारूप अतिरिक्त रूप से संपीड़न के शीर्ष पर ध्वनि की [[ऑडियो बिट गहराई]] को कम करता है, जिसके परिणामस्वरूप अपरिवर्तनीय रूप से खोई हुई जानकारी की कीमत पर बहुत कम डेटा होता है।
[[दोषरहित संपीड़न]] ऑडियो कोडिंग प्रारूप ध्वनि का प्रतिनिधित्व करने के लिए आवश्यक कुल डेटा को कम कर देता है किन्तु इसके मूल, असम्पीडित रूप में डी-कोड किया जा सकता है। [[हानिपूर्ण संपीड़न]] ऑडियो कोडिंग प्रारूप अतिरिक्त रूप से संपीड़न के शीर्ष पर ध्वनि की [[ऑडियो बिट गहराई]] को कम करता है, जिसके परिणामस्वरूप अपरिवर्तनीय रूप से खोई हुई जानकारी की मूल्य पर बहुत कम डेटा होता है।


उपभोक्ता ऑडियो अक्सर हानिपूर्ण ऑडियो कोडेक का उपयोग करके संकुचित होता है क्योंकि छोटा आकार वितरण के लिए कहीं अधिक सुविधाजनक होता है। सबसे व्यापक रूप से उपयोग किए जाने वाले ऑडियो कोडिंग प्रारूप MP3 और उन्नत ऑडियो कोडिंग (एएसी) हैं, जिनमें से दोनों संशोधित असतत कोसाइन परिवर्तन (एमडीसीटी) और [[अवधारणात्मक कोडिंग]] एल्गोरिदम के आधार पर हानिकारक प्रारूप हैं।
उपभोक्ता ऑडियो अधिकांशतः हानिपूर्ण ऑडियो कोडेक का उपयोग करके संकुचित होता है क्योंकि छोटा आकार वितरण के लिए कहीं अधिक सुविधाजनक होता है। सबसे व्यापक रूप से उपयोग किए जाने वाले ऑडियो कोडिंग प्रारूप एमपी 3 और उन्नत ऑडियो कोडिंग (एएसी) हैं, जिनमें से दोनों संशोधित असतत कोसाइन परिवर्तन (एमडीसीटी) और [[अवधारणात्मक कोडिंग]] एल्गोरिदम के आधार पर हानिकारक प्रारूप हैं।


चूंकि बड़ी फ़ाइलों की कीमत पर दोषरहित ऑडियो कोडिंग प्रारूप जैसे फ्लैक और [[Apple Lossless|सेब दोषरहित]] कभी-कभी उपलब्ध होते हैं ।
चूंकि बड़ी फ़ाइलों की मूल्य पर दोषरहित ऑडियो कोडिंग प्रारूप जैसे फ्लैक और [[Apple Lossless|सेब दोषरहित]] कभी-कभी उपलब्ध होते हैं ।


असम्पीडित ऑडियो प्रारूप जैसे [[ पल्स कोड मॉडुलेशन |पल्स कोड मॉडुलेशन]] भी कभी-कभी उपयोग किए जाते हैं। पीसीएम [[कॉम्पैक्ट डिस्क डिजिटल ऑडियो]] (सीडीडीए) के लिए मानक प्रारूप था, MP3 की प्रारंभिक के बाद हानिकारक संपीड़न अंततः मानक बनने से पहले था।
असम्पीडित ऑडियो प्रारूप जैसे [[ पल्स कोड मॉडुलेशन |पल्स कोड मॉडुलेशन]] भी कभी-कभी उपयोग किए जाते हैं। पीसीएम [[कॉम्पैक्ट डिस्क डिजिटल ऑडियो]] (सीडीडीए) के लिए मानक प्रारूप था, एमपी 3 की प्रारंभिक के बाद हानिकारक संपीड़न अंततः मानक बनने से पहले था।


== इतिहास ==
== इतिहास ==
[[File:Placa-audioPC-925.jpg|right|thumb|सॉलिडाइन 922: पीसी, 1990 के लिए दुनिया का पहला व्यावसायिक ऑडियो बिट कम्प्रेशन [[ अच्छा पत्रक |अच्छा पत्रक]]]]1950 में, [[बेल लैब्स]] ने [[ अंतर पल्स-कोड मॉड्यूलेशन |अंतर पल्स-कोड मॉड्यूलेशन]] (डीपीसीएम ) पर पेटेंट अंकित किया।<ref name="DPCM">{{US patent reference|inventor=C. Chapin Cutler|title=Differential Quantization of Communication Signals|number=2605361|A-Datum=1950-06-29|issue-date=1952-07-29}}</ref> अनुकूली डीपीसीएम (एडीपीसीएम) को 1973 में बेल लैब्स में पी. कमिस्की, निकिल एस. जयंत और जेम्स एल. फ्लानागन द्वारा प्रस्तुत किया गया था।<ref>{{cite journal|doi=10.1002/j.1538-7305.1973.tb02007.x|url=https://ieeexplore.ieee.org/document/6770730|title=भाषण के विभेदक पीसीएम कोडिंग में अनुकूली परिमाणीकरण|year=1973|last1=Cummiskey|first1=P.|last2=Jayant|first2=N. S.|last3=Flanagan|first3=J. L.|journal=Bell System Technical Journal|volume=52|issue=7|pages=1105–1118}}</ref><ref>{{cite journal |last1=Cummiskey |first1=P. |last2=Jayant |first2=Nikil S. |last3=Flanagan |first3=J. L. |title=भाषण के अंतर पीसीएम कोडिंग में अनुकूली परिमाणीकरण|journal=The Bell System Technical Journal |date=1973 |volume=52 |issue=7 |pages=1105–1118 |doi=10.1002/j.1538-7305.1973.tb02007.x |issn=0005-8580}}</ref>
[[File:Placa-audioPC-925.jpg|right|thumb|सॉलिडाइन 922: पीसी, 1990 के लिए दुनिया का पहला व्यावसायिक ऑडियो बिट संपीड़न [[साउंड कार्ड]]]]1950 में, [[बेल लैब्स]] ने [[ अंतर पल्स-कोड मॉड्यूलेशन |अंतर पल्स-कोड मॉड्यूलेशन]] (डीपीसीएम ) पर पेटेंट अंकित किया।<ref name="DPCM">{{US patent reference|inventor=C. Chapin Cutler|title=Differential Quantization of Communication Signals|number=2605361|A-Datum=1950-06-29|issue-date=1952-07-29}}</ref> अनुकूली डीपीसीएम (एडीपीसीएम) को 1973 में बेल लैब्स में पी. कमिस्की, निकिल एस. जयंत और जेम्स एल. फ्लानागन द्वारा प्रस्तुत किया गया था।<ref>{{cite journal|doi=10.1002/j.1538-7305.1973.tb02007.x|url=https://ieeexplore.ieee.org/document/6770730|title=भाषण के विभेदक पीसीएम कोडिंग में अनुकूली परिमाणीकरण|year=1973|last1=Cummiskey|first1=P.|last2=Jayant|first2=N. S.|last3=Flanagan|first3=J. L.|journal=Bell System Technical Journal|volume=52|issue=7|pages=1105–1118}}</ref><ref>{{cite journal |last1=Cummiskey |first1=P. |last2=Jayant |first2=Nikil S. |last3=Flanagan |first3=J. L. |title=भाषण के अंतर पीसीएम कोडिंग में अनुकूली परिमाणीकरण|journal=The Bell System Technical Journal |date=1973 |volume=52 |issue=7 |pages=1105–1118 |doi=10.1002/j.1538-7305.1973.tb02007.x |issn=0005-8580}}</ref>
[[रैखिक भविष्य कहनेवाला कोडिंग]] (LPC) के साथ अवधारणात्मक कोडिंग का उपयोग पहली बार वाक् कोडिंग संपीड़न के लिए किया गया था।<ref name="Schroeder2014">{{cite book |last1=Schroeder |first=Manfred R. |title=Acoustics, Information, and Communication: Memorial Volume in Honor of Manfred R. Schroeder |date=2014 |publisher=Springer |isbn=9783319056609 |chapter=Bell Laboratories |page=388 |chapter-url=https://books.google.com/books?id=d9IkBAAAQBAJ&pg=PA388}}</ref> एलपीसी के लिए प्रारंभिक अवधारणाएं 1966 में [[बुंददा इटाकुरा]] ([[नागोया विश्वविद्यालय]]) और शुजो सैटो ([[निप्पॉन टेलीग्राफ और टेलीफोन]]) के कार्य से जुड़ी हैं।<ref>{{cite journal |last1=Gray |first1=Robert M. |title=A History of Realtime Digital Speech on Packet Networks: Part II of Linear Predictive Coding and the Internet Protocol |journal=Found. Trends Signal Process. |date=2010 |volume=3 |issue=4 |pages=203–303 |doi=10.1561/2000000036 |url=https://ee.stanford.edu/~gray/lpcip.pdf |issn=1932-8346|doi-access=free }}</ref> 1970 के दशक के पर्यन्त, बेल लैब्स में बिष्णु एस. अटल और मैनफ़्रेड आर. श्रोएडर ने LPC का रूप विकसित किया, जिसे [[ अनुकूली भविष्य कहनेवाला कोडिंग |अनुकूली भविष्य कहनेवाला कोडिंग]] (APC) कहा जाता है, जो अवधारणात्मक कोडिंग एल्गोरिथम है, जो मानव कान के मास्किंग गुणों का शोषण करता है, 1980 के दशक की प्रारंभिक में [[कोड-उत्साहित रैखिक भविष्यवाणी]] (सीईएलपी) एल्गोरिदम जिसने अपने समय के लिए महत्वपूर्ण संपीड़न अनुपात प्राप्त किया।<ref name="Schroeder2014"/>अवधारणात्मक कोडिंग का उपयोग MP3 जैसे आधुनिक ऑडियो संपीड़न प्रारूपों द्वारा किया जाता है<ref name="Schroeder2014"/>और [[उन्नत ऑडियो कोडेक]]।
अवधारणात्मक कोडिंग का उपयोग पहली बार [[रेखीय भविष्य कहनेवाला कोडिंग]] (एलपीसी)के साथ भाषण कोडिंग संपीड़न के लिए किया गया था।<ref name="Schroeder2014">{{cite book |last1=Schroeder |first=Manfred R. |title=Acoustics, Information, and Communication: Memorial Volume in Honor of Manfred R. Schroeder |date=2014 |publisher=Springer |isbn=9783319056609 |chapter=Bell Laboratories |page=388 |chapter-url=https://books.google.com/books?id=d9IkBAAAQBAJ&pg=PA388}}</ref> एलपीसी के लिए प्रारंभिक अवधारणाएं 1966 में [[बुंददा इटाकुरा]] ([[नागोया विश्वविद्यालय]]) और शुजो सैटो ([[निप्पॉन टेलीग्राफ और टेलीफोन]]) के कार्य से जुड़ी हैं।<ref>{{cite journal |last1=Gray |first1=Robert M. |title=A History of Realtime Digital Speech on Packet Networks: Part II of Linear Predictive Coding and the Internet Protocol |journal=Found. Trends Signal Process. |date=2010 |volume=3 |issue=4 |pages=203–303 |doi=10.1561/2000000036 |url=https://ee.stanford.edu/~gray/lpcip.pdf |issn=1932-8346|doi-access=free }}</ref> 1970 के दशक के पर्यन्त, बेल लैब्स में बिष्णु एस. अटल और मैनफ़्रेड आर. श्रोएडर ने एलपीसी का रूप विकसित किया, जिसे [[ अनुकूली भविष्य कहनेवाला कोडिंग |अनुकूली भविष्य कहनेवाला कोडिंग]] (एपीसी) कहा जाता है, जो अवधारणात्मक कोडिंग एल्गोरिथम है, जो मानव कान के मास्किंग गुणों का शोषण करता है, 1980 के दशक की प्रारंभिक में [[कोड-उत्साहित रैखिक भविष्यवाणी]] (सीईएलपी) एल्गोरिदम जिसने अपने समय के लिए महत्वपूर्ण संपीड़न अनुपात प्राप्त किया।<ref name="Schroeder2014"/>अवधारणात्मक कोडिंग का उपयोग एमपी3 और एएसी जैसे [[आधुनिक ऑडियो संपीड़न]] प्रारूपों द्वारा किया जाता है।<ref name="Schroeder2014"/>


1974 में [[नासिर अहमद (इंजीनियर)]], टी. नटराजन और के.आर. राव द्वारा विकसित [[असतत कोज्या परिवर्तन]] (DCT),<ref name="DCT">{{cite journal |author1=Nasir Ahmed |author1-link=N. Ahmed |author2=T. Natarajan |author3=Kamisetty Ramamohan Rao |journal=IEEE Transactions on Computers|title=असतत कोसाइन रूपांतरण|volume=C-23|issue=1|pages=90–93|date=January 1974 |doi=10.1109/T-C.1974.223784 |s2cid=149806273 |url=https://www.ic.tu-berlin.de/fileadmin/fg121/Source-Coding_WS12/selected-readings/Ahmed_et_al.__1974.pdf}}</ref> MP3 जैसे आधुनिक ऑडियो संपीड़न प्रारूपों द्वारा उपयोग किए जाने वाले संशोधित असतत कोसाइन परिवर्तन (एमडीसीटी) के लिए आधार प्रदान किया<ref name="Guckert">{{cite web |last1=Guckert |first1=John |title=The Use of FFT and MDCT in MP3 Audio Compression |url=http://www.math.utah.edu/~gustafso/s2012/2270/web-projects/Guckert-audio-compression-svd-mdct-MP3.pdf |website=[[University of Utah]] |date=Spring 2012 |access-date=14 July 2019}}</ref> और एएसी। MDCT का प्रस्ताव 1987 में J. P. प्रिंसेन, A. W. जॉनसन और A. B. ब्राडली द्वारा किया गया था,<ref>{{cite book|doi=10.1109/ICASSP.1987.1169405|chapter-url=https://ieeexplore.ieee.org/document/1169405|chapter=Subband/Transform coding using filter bank designs based on time domain aliasing cancellation|title=ICASSP '87. IEEE International Conference on Acoustics, Speech, and Signal Processing|year=1987|last1=Princen|first1=J.|last2=Johnson|first2=A.|last3=Bradley|first3=A.|volume=12|pages=2161–2164|s2cid=58446992}}</ref> 1986 में प्रिंसेन और ब्रैडली द्वारा पहले के कार्य के बाद।<ref>{{cite journal|doi=10.1109/TASSP.1986.1164954|url=https://ieeexplore.ieee.org/document/1164954|title=Analysis/Synthesis filter bank design based on time domain aliasing cancellation|year=1986|last1=Princen|first1=J.|last2=Bradley|first2=A.|journal=IEEE Transactions on Acoustics, Speech, and Signal Processing|volume=34|issue=5|pages=1153–1161}}</ref> एमडीसीटी का उपयोग आधुनिक ऑडियो संपीड़न प्रारूपों जैसे [[डॉल्बी डिजिटल]],<ref name="Luo">{{cite book |last1=Luo |first1=Fa-Long |title=Mobile Multimedia Broadcasting Standards: Technology and Practice |date=2008 |publisher=[[Springer Science & Business Media]] |isbn=9780387782638 |page=590 |url=https://books.google.com/books?id=l6PovWat8SMC&pg=PA590}}</ref><ref>{{cite journal |last1=Britanak |first1=V. |title=On Properties, Relations, and Simplified Implementation of Filter Banks in the Dolby Digital (Plus) AC-3 Audio Coding Standards |journal=IEEE Transactions on Audio, Speech, and Language Processing |date=2011 |volume=19 |issue=5 |pages=1231–1241 |doi=10.1109/TASL.2010.2087755|s2cid=897622 }}</ref> बिका हुआ,<ref name="Guckert">{{cite web |last1=Guckert |first1=John |title=The Use of FFT and MDCT in MP3 Audio Compression |url=http://www.math.utah.edu/~gustafso/s2012/2270/web-projects/Guckert-audio-compression-svd-mdct-MP3.pdf |website=[[University of Utah]] |date=Spring 2012 |access-date=14 July 2019}}</ref> और उन्नत ऑडियो कोडिंग (एएसी)<ref name=brandenburg>{{cite web|url=http://graphics.ethz.ch/teaching/mmcom12/slides/mp3_and_aac_brandenburg.pdf|title=MP3 and AAC Explained|last=Brandenburg|first=Karlheinz|year=1999|url-status=live|archive-url=https://web.archive.org/web/20170213191747/https://graphics.ethz.ch/teaching/mmcom12/slides/mp3_and_aac_brandenburg.pdf|archive-date=2017-02-13}}</ref>
1974 में [[नासिर अहमद (इंजीनियर)]], टी. नटराजन और के.आर. राव द्वारा विकसित [[असतत कोज्या परिवर्तन]] (DCT),<ref name="DCT">{{cite journal |author1=Nasir Ahmed |author1-link=N. Ahmed |author2=T. Natarajan |author3=Kamisetty Ramamohan Rao |journal=IEEE Transactions on Computers|title=असतत कोसाइन रूपांतरण|volume=C-23|issue=1|pages=90–93|date=January 1974 |doi=10.1109/T-C.1974.223784 |s2cid=149806273 |url=https://www.ic.tu-berlin.de/fileadmin/fg121/Source-Coding_WS12/selected-readings/Ahmed_et_al.__1974.pdf}}</ref> संशोधित असतत कोसाइन परिवर्तन (एमडीसीटी) के लिए आधार प्रदान किया, जिसका उपयोग एमपी 3<ref name="Guckert">{{cite web |last1=Guckert |first1=John |title=The Use of FFT and MDCT in MP3 Audio Compression |url=http://www.math.utah.edu/~gustafso/s2012/2270/web-projects/Guckert-audio-compression-svd-mdct-MP3.pdf |website=[[University of Utah]] |date=Spring 2012 |access-date=14 July 2019}}</ref> और एएसी जैसे आधुनिक ऑडियो संपीड़न प्रारूपों द्वारा किया जाता है। एमडीसीटी का प्रस्ताव 1987 में जे. पी. प्रिंसेन, .डब्ल्यू. जॉनसन और .बी. ब्राडली द्वारा किया गया था,<ref>{{cite book|doi=10.1109/ICASSP.1987.1169405|chapter-url=https://ieeexplore.ieee.org/document/1169405|chapter=Subband/Transform coding using filter bank designs based on time domain aliasing cancellation|title=ICASSP '87. IEEE International Conference on Acoustics, Speech, and Signal Processing|year=1987|last1=Princen|first1=J.|last2=Johnson|first2=A.|last3=Bradley|first3=A.|volume=12|pages=2161–2164|s2cid=58446992}}</ref> 1986 में प्रिंसेन और ब्रैडली द्वारा पहले के कार्य के बाद।<ref>{{cite journal|doi=10.1109/TASSP.1986.1164954|url=https://ieeexplore.ieee.org/document/1164954|title=Analysis/Synthesis filter bank design based on time domain aliasing cancellation|year=1986|last1=Princen|first1=J.|last2=Bradley|first2=A.|journal=IEEE Transactions on Acoustics, Speech, and Signal Processing|volume=34|issue=5|pages=1153–1161}}</ref> एमडीसीटी का उपयोग [[डॉल्बी डिजिटल]]<ref name="Luo">{{cite book |last1=Luo |first1=Fa-Long |title=Mobile Multimedia Broadcasting Standards: Technology and Practice |date=2008 |publisher=[[Springer Science & Business Media]] |isbn=9780387782638 |page=590 |url=https://books.google.com/books?id=l6PovWat8SMC&pg=PA590}}</ref><ref>{{cite journal |last1=Britanak |first1=V. |title=On Properties, Relations, and Simplified Implementation of Filter Banks in the Dolby Digital (Plus) AC-3 Audio Coding Standards |journal=IEEE Transactions on Audio, Speech, and Language Processing |date=2011 |volume=19 |issue=5 |pages=1231–1241 |doi=10.1109/TASL.2010.2087755|s2cid=897622 }}</ref> एमपी 3,<ref name="Guckert">{{cite web |last1=Guckert |first1=John |title=The Use of FFT and MDCT in MP3 Audio Compression |url=http://www.math.utah.edu/~gustafso/s2012/2270/web-projects/Guckert-audio-compression-svd-mdct-MP3.pdf |website=[[University of Utah]] |date=Spring 2012 |access-date=14 July 2019}}</ref> और उन्नत ऑडियो कोडिंग (एएसी) जैसे आधुनिक ऑडियो संपीड़न प्रारूपों द्वारा किया जाता है।<ref name=brandenburg>{{cite web|url=http://graphics.ethz.ch/teaching/mmcom12/slides/mp3_and_aac_brandenburg.pdf|title=MP3 and AAC Explained|last=Brandenburg|first=Karlheinz|year=1999|url-status=live|archive-url=https://web.archive.org/web/20170213191747/https://graphics.ethz.ch/teaching/mmcom12/slides/mp3_and_aac_brandenburg.pdf|archive-date=2017-02-13}}</ref>
== हानिपूर्ण स्वरूपों की सूची ==
== हानिपूर्ण स्वरूपों की सूची ==


Line 26: Line 26:
{| class="wikitable sortable"
{| class="wikitable sortable"
|-
|-
! Basic compression algorithm
! मूलभूत संपीड़न एल्गोरिथ्म
! Audio coding standard
! ऑडियो कोडिंग मानक
! Abbreviation
! संक्षिप्तीकरण
! Introduction
! परिचय
! Market share {{small|(2019)}}<ref name="Bitmovin">{{cite web |url=https://cdn2.hubspot.net/hubfs/3411032/Bitmovin%20Magazine/Video%20Developer%20Report%202019/bitmovin-video-developer-report-2019.pdf |title=Video Developer Report 2019 |website=[[Bitmovin]] |year=2019 |access-date=5 November 2019}}</ref>
! बाजार में भागेदारी {{small|(2019)}}<ref name="Bitmovin">{{cite web |url=https://cdn2.hubspot.net/hubfs/3411032/Bitmovin%20Magazine/Video%20Developer%20Report%202019/bitmovin-video-developer-report-2019.pdf |title=Video Developer Report 2019 |website=[[Bitmovin]] |year=2019 |access-date=5 November 2019}}</ref>
! {{Abbr|Ref|Reference(s)}}
! {{Abbr|संदर्भ|संदर्भ}}
|-
|-
| rowspan="9" | [[Modified discrete cosine transform]] (MDCT)
| rowspan="9" | [[Modified discrete cosine transform|संशोधित असतत कोज्या परिवर्तन]] (एमडीसीटी)
| [[Dolby Digital]] (AC-3)
| [[डॉल्बी डिजिटल]] (एसी-3)
| AC3
| एसी 3
| 1991
| 1991
| 58%
| 58%
| <ref name="Luo">{{cite book |last1=Luo |first1=Fa-Long |title=Mobile Multimedia Broadcasting Standards: Technology and Practice |date=2008 |publisher=[[Springer Science & Business Media]] |isbn=9780387782638 |page=590 |url=https://books.google.com/books?id=l6PovWat8SMC&pg=PA590}}</ref><ref name="Britanak2011">{{cite journal |last1=Britanak |first1=V. |title=On Properties, Relations, and Simplified Implementation of Filter Banks in the Dolby Digital (Plus) AC-3 Audio Coding Standards |journal=IEEE Transactions on Audio, Speech, and Language Processing |date=2011 |volume=19 |issue=5 |pages=1231–1241 |doi=10.1109/TASL.2010.2087755|s2cid=897622 }}</ref>
| <ref name="Luo">{{cite book |last1=Luo |first1=Fa-Long |title=Mobile Multimedia Broadcasting Standards: Technology and Practice |date=2008 |publisher=[[Springer Science & Business Media]] |isbn=9780387782638 |page=590 |url=https://books.google.com/books?id=l6PovWat8SMC&pg=PA590}}</ref><ref name="Britanak2011">{{cite journal |last1=Britanak |first1=V. |title=On Properties, Relations, and Simplified Implementation of Filter Banks in the Dolby Digital (Plus) AC-3 Audio Coding Standards |journal=IEEE Transactions on Audio, Speech, and Language Processing |date=2011 |volume=19 |issue=5 |pages=1231–1241 |doi=10.1109/TASL.2010.2087755|s2cid=897622 }}</ref>
|-
|-
| [[Adaptive Transform Acoustic Coding]]
| [[Adaptive Transform Acoustic Coding|अनुकूली परिवर्तन ध्वनिक कोडिंग]]
| ATRAC
| एटीआरएसी
| 1992
| 1992
| {{unk}}
| {{unk}}
| <ref name="Luo"/>
| <ref name="Luo"/>
|-
|-
| [[MPEG Layer III]]
| [[MPEG Layer III|एमपीईजी परत III]]
| MP3
| एमपी 3
| 1993
| 1993
| 49%
| 49%
| <ref name="Guckert">{{cite web |last1=Guckert |first1=John |title=The Use of FFT and MDCT in MP3 Audio Compression |url=http://www.math.utah.edu/~gustafso/s2012/2270/web-projects/Guckert-audio-compression-svd-mdct-MP3.pdf |website=[[University of Utah]] |date=Spring 2012 |access-date=14 July 2019}}</ref><ref name="Stankovic">{{cite journal |last1=Stanković |first1=Radomir S. |last2=Astola |first2=Jaakko T. |title=Reminiscences of the Early Work in DCT: Interview with K.R. Rao |journal=Reprints from the Early Days of Information Sciences |date=2012 |volume=60 |url=http://ticsp.cs.tut.fi/reports/ticsp-report-60-reprint-rao-corrected.pdf |access-date=13 October 2019}}</ref>
| <ref name="Guckert">{{cite web |last1=Guckert |first1=John |title=The Use of FFT and MDCT in MP3 Audio Compression |url=http://www.math.utah.edu/~gustafso/s2012/2270/web-projects/Guckert-audio-compression-svd-mdct-MP3.pdf |website=[[University of Utah]] |date=Spring 2012 |access-date=14 July 2019}}</ref><ref name="Stankovic">{{cite journal |last1=Stanković |first1=Radomir S. |last2=Astola |first2=Jaakko T. |title=Reminiscences of the Early Work in DCT: Interview with K.R. Rao |journal=Reprints from the Early Days of Information Sciences |date=2012 |volume=60 |url=http://ticsp.cs.tut.fi/reports/ticsp-report-60-reprint-rao-corrected.pdf |access-date=13 October 2019}}</ref>
|-
|-
| [[Advanced Audio Coding|Advanced ऑडियो Coding]] ([[MPEG-2]] / [[MPEG-4]])
| [[उन्नत ऑडियो कोडिंग (MPEG-2 / MPEG-4)|उन्नत ऑडियो कोडिंग (एमपीईजी-2 / एमपीईजी-4)]]
| AAC
| एएसी
| 1997
| 1997
| 88%
| 88%
| <ref name=brandenburg>{{cite web|url=http://graphics.ethz.ch/teaching/mmcom12/slides/mp3_and_aac_brandenburg.pdf|title=MP3 and AAC Explained|last=Brandenburg|first=Karlheinz|year=1999|url-status=live|archive-url=https://web.archive.org/web/20170213191747/https://graphics.ethz.ch/teaching/mmcom12/slides/mp3_and_aac_brandenburg.pdf|archive-date=2017-02-13}}</ref><ref name="Luo"/>
| <ref name=brandenburg>{{cite web|url=http://graphics.ethz.ch/teaching/mmcom12/slides/mp3_and_aac_brandenburg.pdf|title=MP3 and AAC Explained|last=Brandenburg|first=Karlheinz|year=1999|url-status=live|archive-url=https://web.archive.org/web/20170213191747/https://graphics.ethz.ch/teaching/mmcom12/slides/mp3_and_aac_brandenburg.pdf|archive-date=2017-02-13}}</ref><ref name="Luo"/>
|-
|-
| [[Windows Media Audio]]
| [[Windows Media Audio|विंडोज मीडिया ऑडियो]]
| WMA
| डब्ल्यूएमए
| 1999
| 1999
| {{unk}}
| {{unk}}
| <ref name="Luo"/>
| <ref name="Luo"/>
|-
|-
| [[Ogg]] [[Vorbis|वॉर्बिस]]  
| [[ओग वोरबिस]]
| Ogg
| ऑग
| 2000
| 2000
| 7%
| 7%
| <ref name="vorbis-mdct">{{cite web |author=Xiph.Org Foundation |publisher=Xiph.Org Foundation |url=http://www.xiph.org/vorbis/doc/Vorbis_I_spec.html#x1-50001.1.2 |title=Vorbis I specification - 1.1.2 Classification |date=2009-06-02 |access-date=2009-09-22}}</ref><ref name="Luo"/>
| <ref name="vorbis-mdct">{{cite web |author=Xiph.Org Foundation |publisher=Xiph.Org Foundation |url=http://www.xiph.org/vorbis/doc/Vorbis_I_spec.html#x1-50001.1.2 |title=Vorbis I specification - 1.1.2 Classification |date=2009-06-02 |access-date=2009-09-22}}</ref><ref name="Luo"/>
|-
|-
| [[Constrained Energy Lapped Transform]]
| [[Constrained Energy Lapped Transform|विवश ऊर्जा लैप्ड रूपांतरण]]
| CELT
| सेल्ट
| 2011
| 2011
| {{n/a}}
| {{n/a}}
| <ref name="presentation">{{cite AV media|url=http://people.xiph.org/~greg/video/linux_conf_au_CELT_2.ogv|title=Presentation of the CELT codec|first=Timothy B.|last=Terriberry|transcript-url=http://www.celt-codec.org/presentations/misc/lca-celt.pdf|transcript=Presentation}}</ref>
| <ref name="presentation">{{cite AV media|url=http://people.xiph.org/~greg/video/linux_conf_au_CELT_2.ogv|title=Presentation of the CELT codec|first=Timothy B.|last=Terriberry|transcript-url=http://www.celt-codec.org/presentations/misc/lca-celt.pdf|transcript=Presentation}}</ref>
|-
|-
| [[Opus (codec)|Opus]]
| [[Opus (codec)|ओपुस]]
| Opus
| ओपुस
| 2012
| 2012
| 8%
| 8%
| <ref>{{cite conference|last1=Valin|first1=Jean-Marc|last2=Maxwell|first2=Gregory|last3=Terriberry|first3=Timothy B.|last4=Vos|first4=Koen|date=October 2013|title=High-Quality, Low-Delay Music Coding in the Opus Codec|conference=135th AES Convention|publisher=[[Audio Engineering Society]]|arxiv=1602.04845}}</ref>
| <ref>{{cite conference|last1=Valin|first1=Jean-Marc|last2=Maxwell|first2=Gregory|last3=Terriberry|first3=Timothy B.|last4=Vos|first4=Koen|date=October 2013|title=High-Quality, Low-Delay Music Coding in the Opus Codec|conference=135th AES Convention|publisher=[[Audio Engineering Society]]|arxiv=1602.04845}}</ref>
|-
|-
| [[LDAC (codec)|LDAC]]
| [[LDAC (codec)|एलडीएसी]]
| LDAC
| एलडीएसी
| 2015
| 2015
| {{unk}}
| {{unk}}
| <ref name="Darko 2017">{{cite web | last=Darko | first=John H. | title=The inconvenient truth about Bluetooth audio | website=DAR__KO | date=2017-03-29 | url=http://www.digitalaudioreview.net/2017/03/the-inconvenient-truth-about-bluetooth-audio/ | access-date=2018-01-13 | archive-url=https://web.archive.org/web/20180114020200/http://www.digitalaudioreview.net/2017/03/the-inconvenient-truth-about-bluetooth-audio/ | archive-date=2018-01-14 | url-status=dead }}</ref><ref name="AVHub 2015">{{cite web|url=http://www.avhub.com.au/news/sound-image/what-is-sony-ldac-and-how-does-it-do-it-408285|title=What is Sony LDAC, and how does it do it?|last=Ford|first=Jez|date=2015-08-24|website=AVHub|access-date=2018-01-13}}</ref>
| <ref name="Darko 2017">{{cite web | last=Darko | first=John H. | title=The inconvenient truth about Bluetooth audio | website=DAR__KO | date=2017-03-29 | url=http://www.digitalaudioreview.net/2017/03/the-inconvenient-truth-about-bluetooth-audio/ | access-date=2018-01-13 | archive-url=https://web.archive.org/web/20180114020200/http://www.digitalaudioreview.net/2017/03/the-inconvenient-truth-about-bluetooth-audio/ | archive-date=2018-01-14 | url-status=dead }}</ref><ref name="AVHub 2015">{{cite web|url=http://www.avhub.com.au/news/sound-image/what-is-sony-ldac-and-how-does-it-do-it-408285|title=What is Sony LDAC, and how does it do it?|last=Ford|first=Jez|date=2015-08-24|website=AVHub|access-date=2018-01-13}}</ref>
|-
|-
| rowspan="3" | [[Adaptive differential pulse-code modulation]] (ADPCM)
| rowspan="3" | [[Adaptive differential pulse-code modulation|अनुकूली अंतर पल्स-कोड मॉड्यूलेशन]] (एडीपीसीएम)
| [[AptX|aptX / aptX-HD]]
| [[AptX|एपीटीएक्स / एपीटीएक्स-एचडी]]
| aptX
| एपीटीएक्स
| 1989
| 1989
| {{unk}}
| {{unk}}
| <ref name="AVHub 2016">{{cite web|url=http://www.avhub.com.au/news/sound-image/aptx-hd---lossless-or-lossy-442124|title=aptX HD - lossless or lossy?|last=Ford|first=Jez|date=2016-11-22|website=AVHub|access-date=2018-01-13}}</ref>
| <ref name="AVHub 2016">{{cite web|url=http://www.avhub.com.au/news/sound-image/aptx-hd---lossless-or-lossy-442124|title=aptX HD - lossless or lossy?|last=Ford|first=Jez|date=2016-11-22|website=AVHub|access-date=2018-01-13}}</ref>
|-
|-
| [[DTS (sound system)#DTS audio codec|Digital Theater Systems]]
| [[DTS (sound system)#DTS audio codec|डिजिटल थिएटर सिस्टम्स]]
| DTS
| डीटीएस
| 1990
| 1990
| 14%
| 14%
| <ref>{{cite web |title=Digital Theater Systems Audio Formats |url=https://www.loc.gov/preservation/digital/formats/fdd/fdd000232.shtml |website=[[Library of Congress]] |access-date=10 November 2019 |date=27 December 2011}}</ref><ref>{{cite book |last1=Spanias |first1=Andreas |last2=Painter |first2=Ted |last3=Atti |first3=Venkatraman |title=Audio Signal Processing and Coding |date=2006 |publisher=[[John Wiley & Sons]] |isbn=9780470041963 |page=338 |url=https://books.google.com/books?id=a1RULRErhOYC&pg=PA338}}</ref>
| <ref>{{cite web |title=Digital Theater Systems Audio Formats |url=https://www.loc.gov/preservation/digital/formats/fdd/fdd000232.shtml |website=[[Library of Congress]] |access-date=10 November 2019 |date=27 December 2011}}</ref><ref>{{cite book |last1=Spanias |first1=Andreas |last2=Painter |first2=Ted |last3=Atti |first3=Venkatraman |title=Audio Signal Processing and Coding |date=2006 |publisher=[[John Wiley & Sons]] |isbn=9780470041963 |page=338 |url=https://books.google.com/books?id=a1RULRErhOYC&pg=PA338}}</ref>
|-
|-
| [[Master Quality Authenticated]]
| [[Master Quality Authenticated|मास्टर गुणवत्ता प्रमाणित]]
| MQA
| एमक्यूए
| 2014
| 2014
| {{unk}}
| {{unk}}
|  
|  
|-
|-
| rowspan="2" | [[Sub-band coding]] (SBC)
| rowspan="2" | [[Sub-band coding|सब-बैंड कोडिंग]] (एसबीसी)
| [[MPEG-1 Audio Layer II]]
| [[MPEG-1 Audio Layer II|एमपीईजी -1 ऑडियो लेयर II]]
| MP2
| एमपी 2
| 1993
| 1993
| rowspan="2" {{unk}}
| rowspan="2" {{unk}}
| rowspan="2" |  
| rowspan="2" |  
|-
|-
| [[Musepack]]
| [[Musepack|म्यूजपैक]]
| MPC
| एमपीसी
| 1997
| 1997
|}
|}
=== भाषण ===
=== भाषण ===
{{further|Speech coding}}
{{further|भाषण कोडिंग}}


* लीनियर प्रेडिक्टिव कोडिंग (LPC)
* रैखिक भविष्य कहनेवाला कोडिंग (LPC)
** अनुकूली भविष्य कहनेवाला कोडिंग (APC)
** अनुकूली भविष्य कहनेवाला कोडिंग (एपीसी)
** कोड-उत्तेजित रैखिक भविष्यवाणी (सीईएलपी)
** कोड-उत्तेजित रैखिक भविष्यवाणी (सीईएलपी)
** बीजगणितीय कोड-उत्तेजित रैखिक भविष्यवाणी (एसीईएलपी)
** बीजगणितीय कोड-उत्तेजित रैखिक भविष्यवाणी (एसीईएलपी)
** रिलैक्स्ड [[बीजगणितीय कोड-उत्साहित रैखिक भविष्यवाणी]]RCELP)
** शिथिलीकृत बीजगणितीय कोड-उत्साहित रैखिक भविष्यवाणी (RCELP)
** कम-विलंब CELP (LD-CELP)
** कम-विलंब CELP (LD-CELP)
** [[अनुकूली मल्टी-रेट ऑडियो कोडेक]] | अडैप्टिव मल्टी-रेट ([[GSM]] और [[3GPP]] में प्रयुक्त)
** अनुकूली मल्टी-रेट ऑडियो कोडेक ([[GSM]] और [[3GPP]] में प्रयुक्त)
** [[कोडेक2]] (पेटेंट प्रतिबंधों की कमी के लिए विख्यात)
** कोडेक2 (पेटेंट प्रतिबंधों की कमी के लिए विख्यात)
** [[स्पीक्स]] (पेटेंट प्रतिबंधों की कमी के लिए विख्यात)
** [[स्पीक्स]] (पेटेंट प्रतिबंधों की कमी के लिए विख्यात)
* संशोधित असतत कोज्या परिवर्तन (एमडीसीटी)
* संशोधित असतत कोज्या परिवर्तन (एमडीसीटी)
Line 136: Line 136:


== दोषरहित स्वरूपों की सूची ==
== दोषरहित स्वरूपों की सूची ==
* Apple दोषरहित (ALAC - Apple दोषरहित ऑडियो कोडेक)
* एप्प्ल दोषरहित (एएलएसी- एप्प्ल दोषरहित ऑडियो कोडेक)
* [[अनुकूली परिवर्तन ध्वनिक कोडिंग]] (एटीआरएसी)
* [[अनुकूली परिवर्तन ध्वनिक कोडिंग]] (एटीआरएसी)
* [[ऑडियो दोषरहित कोडिंग]] (एमपीईजी-4 ALS के रूप में भी जाना जाता है)
* [[ऑडियो दोषरहित कोडिंग]] (एमपीईजी-4 एएलएस के रूप में भी जाना जाता है)
* सुपर ऑडियो सीडी#डीएसटी (डीएसटी)
* सुपर ऑडियो सीडी डीएसटी (डीएसटी)
* [[डॉल्बी ट्रूएचडी]]
* [[डॉल्बी ट्रूएचडी]]
* [[डीटीएस-एचडी मास्टर ऑडियो]]
* [[डीटीएस-एचडी मास्टर ऑडियो]]
* मुफ्त दोषरहित ऑडियो कोडेक (एफ़एलएसी)
* मुफ्त दोषरहित ऑडियो कोडेक (एफ़एलएसी)
* असतत कोज्या परिवर्तन (LDCT)
* असतत कोज्या परिवर्तन (एलडीसीटी)
* [[ मेरिडियन दोषरहित पैकिंग | मेरिडियन दोषरहित पैकिंग]] (एमएलपी)
* [[ मेरिडियन दोषरहित पैकिंग | मेरिडियन दोषरहित पैकिंग]] (एमएलपी)
* बंदर का ऑडियो (बंदर का ऑडियो एपीई)
* मंकी ऑडियो (मंकी ऑडियो एपीई)
* [[MPEG-4 SLS|एमपीईजी-4 SLS]] (HD-AAC के रूप में भी जाना जाता है)
* [[MPEG-4 SLS|एमपीईजी-4 एसएलएस]] (एच.डी-एएसी के रूप में भी जाना जाता है)
* [[ऑप्टिमफ्रॉग]]
* [[ऑप्टिमफ्रॉग]]
* मूल ध्वनि गुणवत्ता (OSQ)
* मूल ध्वनि गुणवत्ता (ओएसक्यू)
* [[RealPlayer]] (Realऑडियो Lossless)
* [[RealPlayer|रियल प्लेयर]] (रियल ऑडियो दोषरहित)
* छोटा करें (फ़ाइल स्वरूप) (SHN)
* छोटा करें (एसएचएन)
* [[टीटीए (कोडेक)]] (ट्रू ऑडियो लॉसलेस)
* [[टीटीए (कोडेक)]] (सच्चा ऑडियो दोषरहित)
* [[WavPack]] (WavPack दोषरहित)
* [[WavPack|वावपैक]] (वावपैक दोषरहित)
* [[विंडोज मीडिया ऑडियो 9 दोषरहित]] (विंडोज मीडिया दोषरहित)
* [[विंडोज मीडिया ऑडियो 9 दोषरहित]] (विंडोज मीडिया दोषरहित)


== यह भी देखें ==
== यह भी देखें ==
* [[ऑडियो कोडिंग स्वरूपों की तुलना]]
* [[ऑडियो कोडिंग स्वरूपों की तुलना]]
* डेटा संपीड़न # ऑडियो
* डेटा संपीड़न ऑडियो
* ऑडियो फ़ाइल स्वरूप
* ऑडियो फ़ाइल स्वरूप
* [[ऑडियो संपीड़न प्रारूपों की सूची]]
* [[ऑडियो संपीड़न प्रारूपों की सूची]]
Line 163: Line 163:
==संदर्भ==
==संदर्भ==
<references/>
<references/>
[[Category: ऑडियो फ़ाइल स्वरूप | ऑडियो फ़ाइल स्वरूप ]]


 
[[Category:Articles with hatnote templates targeting a nonexistent page]]
 
[[Category: Machine Translated Page]]
[[Category:Created On 12/05/2023]]
[[Category:Created On 12/05/2023]]
[[Category:Machine Translated Page]]
[[Category:Templates Vigyan Ready]]
[[Category:ऑडियो फ़ाइल स्वरूप| ऑडियो फ़ाइल स्वरूप ]]

Latest revision as of 09:39, 26 May 2023

लोकप्रिय ऑडियो प्रारूपों के बीच कोडिंग दक्षता की तुलना

ऑडियो कोडिंग प्रारूप[1] (या कभी-कभी ऑडियो संपीड़न प्रारूप) डिजिटल ऑडियो जैसे डिजिटल टेलीविजन, डिजिटल रेडियो और ऑडियो और वीडियो फ़ाइलों के भंडारण या प्रसारण के लिए सामग्री प्रारूप है। ऑडियो कोडिंग स्वरूपों के उदाहरणों में एमपी 3, उन्नत ऑडियो कोडिंग, वॉर्बिस , फ्लैक और ओपुस (ऑडियो प्रारूप) सम्मलित हैं। विशिष्ट सॉफ़्टवेयर या हार्डवेयर कार्यान्वयन जो डेटा संपीड़न ऑडियो और विशिष्ट ऑडियो कोडिंग प्रारूप के लिए सक्षम है, उसे 'ऑडियो कोडेक' कहा जाता है। ऑडियो कोडेक का उदाहरण लेम है, जो कई अलग-अलग कोडेक में से है जो सॉफ्टवेयर में एमपी 3 ऑडियो कोडिंग प्रारूप में ऑडियो को एन्कोडिंग और डिकोडिंग लागू करता है।

कुछ ऑडियो कोडिंग प्रारूपों को विस्तृत प्राविधिक विनिर्देश प्रलेख द्वारा प्रलेखित किया जाता है जिसे ऑडियो कोडिंग विनिर्देश के रूप में जाना जाता है। कुछ ऐसी विशिष्टताओं को मानकीकरण संगठन द्वारा प्राविधिक मानक के रूप में लिखा और अनुमोदित किया जाता है और इस प्रकार ऑडियो कोडिंग मानक के रूप में जाना जाता है। मानक शब्द का प्रयोग कभी-कभी वास्तविक मानक के लिए भी किया जाता है और वास्तविक मानकों के साथ-साथ औपचारिक मानकों के लिए भी किया जाता है।

विशेष ऑडियो कोडिंग प्रारूप में एन्कोडेड ऑडियो सामग्री सामान्य रूप से कंटेनर प्रारूप (डिजिटल) के भीतर समाहित होती है। इस प्रकार, उपयोगकर्ता के पास सामान्य रूप से कच्ची उन्नत ऑडियो कोडिंग फ़ाइल नहीं होती है, जबकि इसके अतिरिक्त m4a ऑडियो फ़ाइल स्वरूप होता है, जो एमपीईजी-4 भाग 14 कंटेनर होता है जिसमें एएसी-एन्कोडेड ऑडियो होता है। कंटेनर में शीर्षक और अन्य टैग जैसे मेटा डेटा भी होते हैं और संभवतः तेजी से खोज के लिए अनुक्रमणिका भी होती है।[2] उल्लेखनीय अपवाद एमपी 3 फाइलें हैं, जो कंटेनर प्रारूप के बिना अपरिष्कृत ऑडियो कोडिंग हैं। एमपी 3 में शीर्षक और कलाकार जैसे मेटाडेटा टैग जोड़ने के लिए वास्तविक मानक, जैसे आईडी3, हैक (कंप्यूटर विज्ञान) हैं। कंप्यूटर विज्ञान में जो एमपी 3 में टैग जोड़कर कार्य करते हैं और फिर चंक को पहचानने के लिए एमपी 3 प्लेयर पर भरोसा करते हैं विकृत ऑडियो कोडिंग के रूप में और इसलिए इसे छोड़ दें। ऑडियो के साथ वीडियो फ़ाइलों में एन्कोडेड ऑडियो सामग्री को मल्टीमीडिया कंटेनर प्रारूप के अंदर वीडियो (वीडियो कोडिंग प्रारूप में) के साथ बंडल किया जाता है।

ऑडियो कोडिंग प्रारूप प्रारूप को लागू करने वाले कोडेक द्वारा उपयोग किए जाने वाले सभी कलन विधि को निर्देशित नहीं करता है। मनोविश्लेषक मॉडल के अनुसार, हानिपूर्ण ऑडियो संपीड़न कैसे कार्य करता है इसका महत्वपूर्ण भाग डेटा को उन विधियों से हटाकर है जिन्हें मनुष्य सुन नहीं सकता है। एनकोडर के कार्यान्वयनकर्ता के पास पसंद की कुछ स्वतंत्रता होती है जिसमें डेटा को हटाना होता है (उनके मनोध्वनिक मॉडल के अनुसार)।

दोषरहित, हानिपूर्ण और असम्पीडित ऑडियो कोडिंग प्रारूप

दोषरहित संपीड़न ऑडियो कोडिंग प्रारूप ध्वनि का प्रतिनिधित्व करने के लिए आवश्यक कुल डेटा को कम कर देता है किन्तु इसके मूल, असम्पीडित रूप में डी-कोड किया जा सकता है। हानिपूर्ण संपीड़न ऑडियो कोडिंग प्रारूप अतिरिक्त रूप से संपीड़न के शीर्ष पर ध्वनि की ऑडियो बिट गहराई को कम करता है, जिसके परिणामस्वरूप अपरिवर्तनीय रूप से खोई हुई जानकारी की मूल्य पर बहुत कम डेटा होता है।

उपभोक्ता ऑडियो अधिकांशतः हानिपूर्ण ऑडियो कोडेक का उपयोग करके संकुचित होता है क्योंकि छोटा आकार वितरण के लिए कहीं अधिक सुविधाजनक होता है। सबसे व्यापक रूप से उपयोग किए जाने वाले ऑडियो कोडिंग प्रारूप एमपी 3 और उन्नत ऑडियो कोडिंग (एएसी) हैं, जिनमें से दोनों संशोधित असतत कोसाइन परिवर्तन (एमडीसीटी) और अवधारणात्मक कोडिंग एल्गोरिदम के आधार पर हानिकारक प्रारूप हैं।

चूंकि बड़ी फ़ाइलों की मूल्य पर दोषरहित ऑडियो कोडिंग प्रारूप जैसे फ्लैक और सेब दोषरहित कभी-कभी उपलब्ध होते हैं ।

असम्पीडित ऑडियो प्रारूप जैसे पल्स कोड मॉडुलेशन भी कभी-कभी उपयोग किए जाते हैं। पीसीएम कॉम्पैक्ट डिस्क डिजिटल ऑडियो (सीडीडीए) के लिए मानक प्रारूप था, एमपी 3 की प्रारंभिक के बाद हानिकारक संपीड़न अंततः मानक बनने से पहले था।

इतिहास

सॉलिडाइन 922: पीसी, 1990 के लिए दुनिया का पहला व्यावसायिक ऑडियो बिट संपीड़न साउंड कार्ड

1950 में, बेल लैब्स ने अंतर पल्स-कोड मॉड्यूलेशन (डीपीसीएम ) पर पेटेंट अंकित किया।[3] अनुकूली डीपीसीएम (एडीपीसीएम) को 1973 में बेल लैब्स में पी. कमिस्की, निकिल एस. जयंत और जेम्स एल. फ्लानागन द्वारा प्रस्तुत किया गया था।[4][5]

अवधारणात्मक कोडिंग का उपयोग पहली बार रेखीय भविष्य कहनेवाला कोडिंग (एलपीसी)के साथ भाषण कोडिंग संपीड़न के लिए किया गया था।[6] एलपीसी के लिए प्रारंभिक अवधारणाएं 1966 में बुंददा इटाकुरा (नागोया विश्वविद्यालय) और शुजो सैटो (निप्पॉन टेलीग्राफ और टेलीफोन) के कार्य से जुड़ी हैं।[7] 1970 के दशक के पर्यन्त, बेल लैब्स में बिष्णु एस. अटल और मैनफ़्रेड आर. श्रोएडर ने एलपीसी का रूप विकसित किया, जिसे अनुकूली भविष्य कहनेवाला कोडिंग (एपीसी) कहा जाता है, जो अवधारणात्मक कोडिंग एल्गोरिथम है, जो मानव कान के मास्किंग गुणों का शोषण करता है, 1980 के दशक की प्रारंभिक में कोड-उत्साहित रैखिक भविष्यवाणी (सीईएलपी) एल्गोरिदम जिसने अपने समय के लिए महत्वपूर्ण संपीड़न अनुपात प्राप्त किया।[6]अवधारणात्मक कोडिंग का उपयोग एमपी3 और एएसी जैसे आधुनिक ऑडियो संपीड़न प्रारूपों द्वारा किया जाता है।[6]

1974 में नासिर अहमद (इंजीनियर), टी. नटराजन और के.आर. राव द्वारा विकसित असतत कोज्या परिवर्तन (DCT),[8] संशोधित असतत कोसाइन परिवर्तन (एमडीसीटी) के लिए आधार प्रदान किया, जिसका उपयोग एमपी 3[9] और एएसी जैसे आधुनिक ऑडियो संपीड़न प्रारूपों द्वारा किया जाता है। एमडीसीटी का प्रस्ताव 1987 में जे. पी. प्रिंसेन, ए.डब्ल्यू. जॉनसन और ए.बी. ब्राडली द्वारा किया गया था,[10] 1986 में प्रिंसेन और ब्रैडली द्वारा पहले के कार्य के बाद।[11] एमडीसीटी का उपयोग डॉल्बी डिजिटल[12][13] एमपी 3,[9] और उन्नत ऑडियो कोडिंग (एएसी) जैसे आधुनिक ऑडियो संपीड़न प्रारूपों द्वारा किया जाता है।[14]

हानिपूर्ण स्वरूपों की सूची

सामान्य

मूलभूत संपीड़न एल्गोरिथ्म ऑडियो कोडिंग मानक संक्षिप्तीकरण परिचय बाजार में भागेदारी (2019)[15] संदर्भ
संशोधित असतत कोज्या परिवर्तन (एमडीसीटी) डॉल्बी डिजिटल (एसी-3) एसी 3 1991 58% [12][16]
अनुकूली परिवर्तन ध्वनिक कोडिंग एटीआरएसी 1992 Un­known [12]
एमपीईजी परत III एमपी 3 1993 49% [9][17]
उन्नत ऑडियो कोडिंग (एमपीईजी-2 / एमपीईजी-4) एएसी 1997 88% [14][12]
विंडोज मीडिया ऑडियो डब्ल्यूएमए 1999 Un­known [12]
ओग वोरबिस ऑग 2000 7% [18][12]
विवश ऊर्जा लैप्ड रूपांतरण सेल्ट 2011 [19]
ओपुस ओपुस 2012 8% [20]
एलडीएसी एलडीएसी 2015 Un­known [21][22]
अनुकूली अंतर पल्स-कोड मॉड्यूलेशन (एडीपीसीएम) एपीटीएक्स / एपीटीएक्स-एचडी एपीटीएक्स 1989 Un­known [23]
डिजिटल थिएटर सिस्टम्स डीटीएस 1990 14% [24][25]
मास्टर गुणवत्ता प्रमाणित एमक्यूए 2014 Un­known
सब-बैंड कोडिंग (एसबीसी) एमपीईजी -1 ऑडियो लेयर II एमपी 2 1993 Un­known
म्यूजपैक एमपीसी 1997

भाषण

  • रैखिक भविष्य कहनेवाला कोडिंग (LPC)
    • अनुकूली भविष्य कहनेवाला कोडिंग (एपीसी)
    • कोड-उत्तेजित रैखिक भविष्यवाणी (सीईएलपी)
    • बीजगणितीय कोड-उत्तेजित रैखिक भविष्यवाणी (एसीईएलपी)
    • शिथिलीकृत बीजगणितीय कोड-उत्साहित रैखिक भविष्यवाणी (RCELP)
    • कम-विलंब CELP (LD-CELP)
    • अनुकूली मल्टी-रेट ऑडियो कोडेक (GSM और 3GPP में प्रयुक्त)
    • कोडेक2 (पेटेंट प्रतिबंधों की कमी के लिए विख्यात)
    • स्पीक्स (पेटेंट प्रतिबंधों की कमी के लिए विख्यात)
  • संशोधित असतत कोज्या परिवर्तन (एमडीसीटी)

दोषरहित स्वरूपों की सूची

यह भी देखें

संदर्भ

  1. The term "audio coding" can be seen in e.g. the name Advanced Audio Coding, and is analogous to the term video coding
  2. "Video - Where is synchronization information stored in container formats?".
  3. US patent 2605361, C. Chapin Cutler, "Differential Quantization of Communication Signals", issued 1952-07-29 
  4. Cummiskey, P.; Jayant, N. S.; Flanagan, J. L. (1973). "भाषण के विभेदक पीसीएम कोडिंग में अनुकूली परिमाणीकरण". Bell System Technical Journal. 52 (7): 1105–1118. doi:10.1002/j.1538-7305.1973.tb02007.x.
  5. Cummiskey, P.; Jayant, Nikil S.; Flanagan, J. L. (1973). "भाषण के अंतर पीसीएम कोडिंग में अनुकूली परिमाणीकरण". The Bell System Technical Journal. 52 (7): 1105–1118. doi:10.1002/j.1538-7305.1973.tb02007.x. ISSN 0005-8580.
  6. 6.0 6.1 6.2 Schroeder, Manfred R. (2014). "Bell Laboratories". Acoustics, Information, and Communication: Memorial Volume in Honor of Manfred R. Schroeder. Springer. p. 388. ISBN 9783319056609.
  7. Gray, Robert M. (2010). "A History of Realtime Digital Speech on Packet Networks: Part II of Linear Predictive Coding and the Internet Protocol" (PDF). Found. Trends Signal Process. 3 (4): 203–303. doi:10.1561/2000000036. ISSN 1932-8346.
  8. Nasir Ahmed; T. Natarajan; Kamisetty Ramamohan Rao (January 1974). "असतत कोसाइन रूपांतरण" (PDF). IEEE Transactions on Computers. C-23 (1): 90–93. doi:10.1109/T-C.1974.223784. S2CID 149806273.
  9. 9.0 9.1 9.2 Guckert, John (Spring 2012). "The Use of FFT and MDCT in MP3 Audio Compression" (PDF). University of Utah. Retrieved 14 July 2019.
  10. Princen, J.; Johnson, A.; Bradley, A. (1987). "Subband/Transform coding using filter bank designs based on time domain aliasing cancellation". ICASSP '87. IEEE International Conference on Acoustics, Speech, and Signal Processing. Vol. 12. pp. 2161–2164. doi:10.1109/ICASSP.1987.1169405. S2CID 58446992.
  11. Princen, J.; Bradley, A. (1986). "Analysis/Synthesis filter bank design based on time domain aliasing cancellation". IEEE Transactions on Acoustics, Speech, and Signal Processing. 34 (5): 1153–1161. doi:10.1109/TASSP.1986.1164954.
  12. 12.0 12.1 12.2 12.3 12.4 12.5 Luo, Fa-Long (2008). Mobile Multimedia Broadcasting Standards: Technology and Practice. Springer Science & Business Media. p. 590. ISBN 9780387782638.
  13. Britanak, V. (2011). "On Properties, Relations, and Simplified Implementation of Filter Banks in the Dolby Digital (Plus) AC-3 Audio Coding Standards". IEEE Transactions on Audio, Speech, and Language Processing. 19 (5): 1231–1241. doi:10.1109/TASL.2010.2087755. S2CID 897622.
  14. 14.0 14.1 Brandenburg, Karlheinz (1999). "MP3 and AAC Explained" (PDF). Archived (PDF) from the original on 2017-02-13.
  15. "Video Developer Report 2019" (PDF). Bitmovin. 2019. Retrieved 5 November 2019.
  16. Britanak, V. (2011). "On Properties, Relations, and Simplified Implementation of Filter Banks in the Dolby Digital (Plus) AC-3 Audio Coding Standards". IEEE Transactions on Audio, Speech, and Language Processing. 19 (5): 1231–1241. doi:10.1109/TASL.2010.2087755. S2CID 897622.
  17. Stanković, Radomir S.; Astola, Jaakko T. (2012). "Reminiscences of the Early Work in DCT: Interview with K.R. Rao" (PDF). Reprints from the Early Days of Information Sciences. 60. Retrieved 13 October 2019.
  18. Xiph.Org Foundation (2009-06-02). "Vorbis I specification - 1.1.2 Classification". Xiph.Org Foundation. Retrieved 2009-09-22.
  19. Terriberry, Timothy B. Presentation of the CELT codec. Presentation (PDF).
  20. Valin, Jean-Marc; Maxwell, Gregory; Terriberry, Timothy B.; Vos, Koen (October 2013). High-Quality, Low-Delay Music Coding in the Opus Codec. 135th AES Convention. Audio Engineering Society. arXiv:1602.04845.
  21. Darko, John H. (2017-03-29). "The inconvenient truth about Bluetooth audio". DAR__KO. Archived from the original on 2018-01-14. Retrieved 2018-01-13.
  22. Ford, Jez (2015-08-24). "What is Sony LDAC, and how does it do it?". AVHub. Retrieved 2018-01-13.
  23. Ford, Jez (2016-11-22). "aptX HD - lossless or lossy?". AVHub. Retrieved 2018-01-13.
  24. "Digital Theater Systems Audio Formats". Library of Congress. 27 December 2011. Retrieved 10 November 2019.
  25. Spanias, Andreas; Painter, Ted; Atti, Venkatraman (2006). Audio Signal Processing and Coding. John Wiley & Sons. p. 338. ISBN 9780470041963.