उन्नत ऑडियो कोडिंग

From Vigyanwiki
Revision as of 18:33, 28 January 2023 by alpha>Indicwiki (Created page with "{{Short description|Lossy audio compression format}} {{Infobox file format | name = Advanced Audio Coding | screenshot = | caption = | extension = '''M...")
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Advanced Audio Coding
Filename extensionMPEG/3GPP container

Apple container

ADTS stream

Internet media type
audio/aac
audio/aacp
audio/3gpp
audio/3gpp2
audio/mp4
audio/mp4a-latm
audio/mpeg4-generic
Developed byBell, Fraunhofer, Dolby, Sony, Nokia, LG Electronics, NEC, NTT Docomo, Panasonic[1]
Initial releaseDecember 1997; 26 years ago (1997-12)[2]
Latest release
ISO/IEC 14496-3:2019
December 2019; 4 years ago (2019-12)
Type of formatLossy audio
Contained byMPEG-4 Part 14, 3GP and 3G2, ISO base media file format and Audio Data Interchange Format (ADIF)
StandardISO/IEC 13818-7,
ISO/IEC 14496-3
Open format?Yes
Free format?No[3]

उन्नत ऑडियो कोडिंग (AAC) हानिकारक डेटा संपीड़न डिजिटल ऑडियो ऑडियो डेटा संपीड़न के लिए एक ऑडियो कोडिंग मानक है। बेचा प्रारूप के उत्तराधिकारी बनने के लिए डिज़ाइन किया गया, एएसी आम तौर पर एक ही बिट दर पर एमपी3 एन्कोडर्स की तुलना में उच्च ध्वनि गुणवत्ता प्राप्त करता है।[4] AAC को MPEG-2 और MPEG-4 विनिर्देशों के भाग के रूप में मानकीकरण के लिए अंतर्राष्ट्रीय संगठन और अंतर्राष्ट्रीय इलेक्ट्रोटेक्निकल कमीशन द्वारा मानकीकृत किया गया है।[5][6] AAC का हिस्सा, उच्च-दक्षता उन्नत ऑडियो कोडिंग|HE-AAC (AAC+), MPEG-4 ऑडियो का हिस्सा है और इसे डिजिटल रेडियो मानकों DAB+ और डिजिटल रेडियो वर्ल्ड, और मोबाइल टेलीविजन मानकों DVB-H और ATSC-M/ में अपनाया गया है एच।

AAC एक स्ट्रीम में 48 पूर्ण-बैंडविड्थ (कंप्यूटिंग) (96 kHz तक) ऑडियो चैनलों के साथ-साथ 16 कम आवृत्ति प्रभाव (कम-आवृत्ति प्रभाव, 120 Hz तक सीमित) चैनल, 16 युग्मन या संवाद चैनल तक, और ऊपर का समर्थन करता है 16 डेटा स्ट्रीम के लिए। संयुक्त स्टीरियो मोड में 96 kbit/s पर मामूली आवश्यकताओं के लिए स्टीरियो की गुणवत्ता संतोषजनक है; हालांकि, पारदर्शिता (डेटा संपीड़न) | हाई-फाई पारदर्शिता कम से कम 128 kbit/s (वैरिएबल बिटरेट) की डेटा दरों की मांग करती है। परीक्षण[which?] MPEG-4 ऑडियो में से अधिकांश ने दिखाया है कि AAC स्टीरियो के लिए 128 kbit/s पर ITU के लिए पारदर्शी और 5.1 सराउंड साउंड|5.1 ऑडियो के लिए 320 kbit/s की आवश्यकताओं को पूरा करता है।[citation needed] AAC केवल एक संशोधित असतत कोसाइन ट्रांसफ़ॉर्म (MDCT) एल्गोरिथम का उपयोग करता है, जो इसे MP3 की तुलना में उच्च संपीड़न दक्षता देता है, जो एक हाइब्रिड कोडिंग एल्गोरिथम का उपयोग करता है जो कि MDCT और पार्ट फास्ट फूरियर ट्रांसफॉर्म है।[4]

AAC iPhone, iPod, iPad, Nintendo DSi, Nintendo 3DS, YouTube Music, Music (सॉफ़्टवेयर) के लिए डिफ़ॉल्ट या मानक ऑडियो फ़ॉर्मैट है,[7] ई धुन, डिवएक्स#डिवएक्स प्लस वेब प्लेयर, प्लेस्टेशन 4 और विभिन्न नोकिया श्रृंखला 40 फोन। यह PlayStation Vita, Wii, Sony Walkman या SanDisk क्लिप, Android (ऑपरेटिंग सिस्टम) और BlackBerry डिवाइस जैसे डिजिटल ऑडियो प्लेयर, विभिन्न इन-डैश कार ऑडियो सिस्टम जैसे उपकरणों और सॉफ़्टवेयर की एक विस्तृत श्रृंखला पर समर्थित है।[when?][vague] और Spotify वेब प्लेयर पर उपयोग किए जाने वाले ऑडियो प्रारूपों में से एक है।[8]


इतिहास

पृष्ठभूमि

असतत कोज्या परिवर्तन (DCT), हानिपूर्ण संपीड़न के लिए एक प्रकार का रूपांतरण कोडिंग, 1972 में एन. अहमद द्वारा प्रस्तावित किया गया था, और 1973 में टी. नटराजन और के.आर. राव के साथ अहमद द्वारा विकसित किया गया था, 1974 में उनके परिणाम प्रकाशित किए।[9][10][11] इसने 1987 में जेपी प्रिंसन, ए.डब्ल्यू. जॉनसन और ए.बी. ब्रैडली द्वारा प्रस्तावित संशोधित असतत कोसाइन ट्रांसफॉर्म (एमडीसीटी) के विकास को प्रेरित किया।[12] 1986 में प्रिंसेन और ब्रैडली द्वारा पहले के काम के बाद।[13] 1994 में पेश किए गए एमपी3 ऑडियो कोडिंग मानक में एक हाइब्रिड कोडिंग एल्गोरिथम का इस्तेमाल किया गया था जो एमडीसीटी का हिस्सा है और फास्ट फूरियर रूपांतरण का हिस्सा है।[14] AAC शुद्ध रूप से MDCT एल्गोरिथम का उपयोग करता है, जो इसे MP3 की तुलना में उच्च संपीड़न दक्षता देता है।[4]

एएसी को बेल लैब्स, फ्राउनहोफर सोसायटी, डॉल्बी प्रयोगशालाएँ, एलजी इलेक्ट्रॉनिक्स, एनईसी, एनटीटी डोकोमो, पैनासोनिक, सोनी कॉर्पोरेशन, सहित कंपनियों के सहयोग और योगदान से विकसित किया गया था।[1] ETRI, JVC केनवुड, PHILIPS, माइक्रोसॉफ्ट और निप्पॉन टेलीग्राफ और टेलीफोन[15] इसे अप्रैल 1997 में मूविंग पिक्चर एक्सपर्ट्स ग्रुप द्वारा आधिकारिक रूप से एक अंतरराष्ट्रीय मानक घोषित किया गया था। इसे MPEG-2 मानक के भाग 7 और MPEG-4 मानक के भाग 3 में सबपार्ट 4 दोनों के रूप में निर्दिष्ट किया गया है।[16]


मानकीकरण

1997 में, AAC को पहली बार MPEG-2 भाग 7 के रूप में पेश किया गया था, जिसे औपचारिक रूप से मानकीकरण के लिए अंतर्राष्ट्रीय संगठन/अंतर्राष्ट्रीय इलेक्ट्रोटेक्निकल कमीशन 13818-7:1997 के रूप में जाना जाता है। MPEG-2 का यह हिस्सा एक नया हिस्सा था, क्योंकि MPEG-2 में पहले से ही MPEG-2 भाग 3 शामिल था, जिसे औपचारिक रूप से ISO/IEC 13818-3: MPEG-2 BC (पीछे की ओर संगत) के रूप में जाना जाता है।[17][18] इसलिए, MPEG-2 भाग 7 को MPEG-2 NBC (गैर-पिछड़े संगत) के रूप में भी जाना जाता है, क्योंकि यह MPEG-1 ऑडियो प्रारूपों (MP1, MPEG-1 ऑडियो लेयर II और MP3) के साथ संगत नहीं है।[17][19][20][21] MPEG-2 भाग 7 में तीन प्रोफाइल परिभाषित किए गए हैं: लो-कॉम्प्लेक्सिटी प्रोफाइल (AAC-LC / LC-AAC), मेन प्रोफाइल (AAC मेन) और स्केलेबल सैंपलिंग रेट प्रोफाइल (AAC-SSR)। एएसी-एलसी प्रोफाइल में एटी एंड टी के अवधारणात्मक ऑडियो कोडिंग (पीएसी) कोडिंग प्रारूप की तरह एक आधार प्रारूप होता है,[22][23][24] शोर को आकार देना (TNS) के साथ,[25] कैसर खिड़की (नीचे वर्णित), एक गैर-समान परिमाणीकरण (सिग्नल प्रोसेसिंग), और 16 स्टीरियो चैनल, 16 मोनो चैनल, 16 कम-आवृत्ति प्रभाव (LFE) चैनल और 16 कमेंटरी चैनल को एक में संभालने के लिए बिटस्ट्रीम प्रारूप का पुनर्विक्रय bitstream. मुख्य प्रोफ़ाइल पुनरावर्ती भविष्यवक्ताओं का एक सेट जोड़ता है जिसकी गणना फ़िल्टरबैंक के प्रत्येक टैप पर की जाती है। स्केलेबल नमूनाकरण दर प्रोफ़ाइल स्केलेबल सैंपलिंग दरों की अनुमति देने के लिए चार छोटे फिल्टरबैंक के साथ 4-बैंड छद्म चतुर्भुज दर्पण फ़िल्टर फिल्टरबैंक का उपयोग करता है।

1999 में, MPEG-2 भाग 7 को अद्यतन किया गया और मानकों के MPEG-4 परिवार में शामिल किया गया और इसे MPEG-4 भाग 3, MPEG-4 ऑडियो या ISO/IEC 14496-3:1999 के रूप में जाना जाने लगा। इस अद्यतन में कई सुधार शामिल थे। इन सुधारों में से एक एमपीईजी-4 भाग 3#एमपीईजी-4 ऑडियो ऑब्जेक्ट प्रकार को शामिल करना था जो कि ट्विनवीक्यू, सीईएलपी, एचवीएक्ससी, टेक्स्ट टू स्पीच जैसे अन्य ऑडियो प्रारूपों की एक विविध रेंज के साथ इंटरऑपरेबिलिटी की अनुमति देने के लिए उपयोग किया जाता है। टेक्स्ट-टू- स्पीच इंटरफेस और MPEG-4 संरचित ऑडियो एएसी मानक के इस संस्करण में एक और उल्लेखनीय जोड़ अवधारणात्मक शोर प्रतिस्थापन (पीएनएस) है। उस संबंध में, AAC प्रोफाइल (AAC-LC, AAC Main और AAC-SSR प्रोफाइल) को अवधारणात्मक शोर प्रतिस्थापन के साथ जोड़ा जाता है और MPEG-4 ऑडियो मानक में ऑडियो ऑब्जेक्ट प्रकार के रूप में परिभाषित किया जाता है।[26] MPEG-4 ऑडियो ऑब्जेक्ट प्रकार चार MPEG-4 ऑडियो प्रोफाइल में संयुक्त हैं: मुख्य (जिसमें अधिकांश MPEG-4 ऑडियो ऑब्जेक्ट प्रकार शामिल हैं), स्केलेबल (AAC LC, AAC LTP, CELP, HVXC, TwinVQ, वेवटेबल सिंथेसिस, TTSI) , स्पीच (CELP, HVXC, TTSI) और लो रेट सिंथेसिस (वेवटेबल सिंथेसिस, TTSI)।[26][27] एमपीईजी-4 भाग 3 के लिए संदर्भ सॉफ्टवेयर एमपीईजी-4 भाग 5 में निर्दिष्ट है और एमपीईजी-4 भाग 4 में अनुरूपता बिट-स्ट्रीम निर्दिष्ट हैं। एमपीईजी-4 ऑडियो एमपीईजी-2 भाग 7 के साथ पिछड़े-संगत रहता है।[28] MPEG-4 ऑडियो संस्करण 2 (ISO/IEC 14496-3:1999/Amd 1:2000) ने नए ऑडियो ऑब्जेक्ट प्रकारों को परिभाषित किया: निम्न विलंब AAC (AAC-LD) ऑब्जेक्ट प्रकार, बिट-स्लाइस अंकगणितीय कोडिंग (BSAC) ऑब्जेक्ट प्रकार हार्मोनिक और इंडिविजुअल लाइन्स और ऑब्जेक्ट प्रकारों के शोर और त्रुटि लचीला (ईआर) संस्करणों का उपयोग करके पैरामीट्रिक ऑडियो कोडिंग।[29][30][31] इसमें चार नए ऑडियो प्रोफाइल भी परिभाषित किए गए हैं: हाई क्वालिटी ऑडियो प्रोफाइल, लो डिले ऑडियो प्रोफाइल, नेचुरल ऑडियो प्रोफाइल और मोबाइल ऑडियो इंटरनेटवर्किंग प्रोफाइल।[32] HE-AAC प्रोफ़ाइल (स्पेक्ट्रल बैंड प्रतिकृति के साथ AAC LC) और AAC प्रोफ़ाइल (AAC LC) को पहले ISO/IEC 14496-3:2001/Amd 1:2003 में मानकीकृत किया गया था।[33] HE-AAC v2 प्रोफ़ाइल (SBR और पैरामीट्रिक स्टीरियो के साथ AAC LC) को पहले ISO/IEC 14496-3:2005/Amd 2:2006 में निर्दिष्ट किया गया था।[34]<रेफरी नाम = आईएसओ 14496-3:2005/एएमडी.2 >"ऑडियो लॉसलेस कोडिंग (ALS), नए ऑडियो प्रोफाइल और BSAC एक्सटेंशन, ISO/IEC 14496-3:2005/Amd 2:2006". ISO. 2006. Archived from the original on 2012-01-04. Retrieved 2009-10-13.</रेफरी>[35] HE-AAC v2 में प्रयुक्त पैरामीट्रिक स्टीरियो ऑडियो ऑब्जेक्ट प्रकार को पहली बार ISO/IEC 14496-3:2001/Amd 2:2004 में परिभाषित किया गया था।[36][37][38] AAC मानक के वर्तमान संस्करण को ISO/IEC 14496-3:2009 में परिभाषित किया गया है।[39] AAC+ v2 को ETSI (यूरोपीय दूरसंचार मानक संस्थान) द्वारा TS 102005 के रूप में भी मानकीकृत किया गया है।[36]

MPEG-4 भाग 3 मानक में ध्वनि को संपीड़ित करने के अन्य तरीके भी शामिल हैं। इनमें आमतौर पर भाषण के लिए उपयोग किए जाने वाले दोषरहित संपीड़न प्रारूप, सिंथेटिक ऑडियो और कम बिट-दर संपीड़न प्रारूप शामिल हैं।

=== एमपी3 === पर एएसी का सुधार उन्नत ऑडियो कोडिंग को MP3|MPEG-1 ऑडियो लेयर 3 के उत्तराधिकारी के रूप में डिज़ाइन किया गया है, जिसे MP3 प्रारूप के रूप में जाना जाता है, जिसे 11172-3 (MPEG-1 ऑडियो) और 13818- में मानकीकरण के लिए अंतर्राष्ट्रीय संगठन/अंतर्राष्ट्रीय इलेक्ट्रोटेक्निकल कमीशन द्वारा निर्दिष्ट किया गया था। 3 (एमपीईजी-2 ऑडियो)।

1990 के दशक के अंत में किए गए नेत्रहीन परीक्षणों से पता चला कि AAC ने समान बिट दर पर कोडित फ़ाइलों के लिए MP3 की तुलना में अधिक ध्वनि गुणवत्ता और पारदर्शिता प्रदर्शित की।[4]

सुधारों में शामिल हैं:

  • MP3 (16 से 48 kHz) की तुलना में अधिक नमूना दर (8 से 96 किलोहर्ट्ज़ तक);
  • 48 चैनल तक (MP3, MPEG-1 मोड में दो चैनल तक और 5.1 सराउंड साउंड तक सपोर्ट करता है। MPEG-2 मोड में 5.1 चैनल);
  • मनमाने ढंग से बिट दर और चर फ्रेम लंबाई। बिट जलाशय के साथ मानकीकृत निरंतर बिट दर;
  • उच्च दक्षता और सरल फ़िल्टर बैंक। एएसी एमपी3 के हाइब्रिड कोडिंग (जो भाग एमडीसीटी और भाग फास्ट फूरियर रूपांतरण था) के बजाय एक शुद्ध संशोधित असतत कोज्या परिवर्तन (संशोधित असतत कोज्या परिवर्तन) का उपयोग करता है;
  • स्थिर प्रक्रिया के लिए उच्च कोडिंग दक्षता (AAC 1024 या 960 नमूनों के ब्लॉक आकार का उपयोग करता है, MP3 के 576 नमूना ब्लॉकों की तुलना में अधिक कुशल कोडिंग की अनुमति देता है);
  • क्षणिक (ध्वनिकी) के लिए उच्च कोडिंग सटीकता (AAC 128 या 120 नमूनों के ब्लॉक आकार का उपयोग करता है, एमपी 3 के 192 नमूना ब्लॉकों की तुलना में अधिक सटीक कोडिंग की अनुमति देता है);
  • मुख्य लोब को चौड़ा करने की कीमत पर स्पेक्ट्रल रिसाव को खत्म करने के लिए कैसर विंडो | कैसर-बेसेल व्युत्पन्न विंडो फ़ंक्शन का उपयोग करने की संभावना;
  • 16 kHz से ऊपर की ऑडियो फ़्रीक्वेंसी की बेहतर हैंडलिंग;
  • अधिक लचीला संयुक्त स्टीरियो (विभिन्न आवृत्ति रेंज में विभिन्न तरीकों का उपयोग किया जा सकता है);
  • अतिरिक्त मॉड्यूल (उपकरण) संपीड़न दक्षता बढ़ाने के लिए जोड़े गए: शोर को आकार देना, पीछे की ओर भविष्यवाणी, अवधारणात्मक शोर प्रतिस्थापन (पीएनएस), आदि। इन मॉड्यूल को अलग-अलग एन्कोडिंग प्रोफाइल बनाने के लिए जोड़ा जा सकता है।

कुल मिलाकर, एएसी प्रारूप डेवलपर्स को एमपी3 की तुलना में कोडेक्स डिजाइन करने के लिए अधिक लचीलेपन की अनुमति देता है, और मूल एमपीईजी-1 ऑडियो विनिर्देश में किए गए कई डिज़ाइन विकल्पों को सही करता है। यह बढ़ा हुआ लचीलापन अक्सर अधिक समवर्ती एन्कोडिंग रणनीतियों की ओर जाता है और, परिणामस्वरूप, अधिक कुशल संपीड़न के लिए। यह बहुत कम बिट दरों पर विशेष रूप से सच है जहां बेहतर स्टीरियो कोडिंग, शुद्ध एमडीसीटी, और बेहतर रूपांतरण विंडो आकार एमपी3 को प्रतिस्पर्धा करने में असमर्थ छोड़ देते हैं।

जबकि MP3 प्रारूप में लगभग-सार्वभौमिक हार्डवेयर और सॉफ़्टवेयर समर्थन है, मुख्य रूप से क्योंकि इंटरनेट पर व्यापक संगीत फ़ाइल-साझाकरण/वितरण के पहले कुछ वर्षों के दौरान एमपी3 पसंद का प्रारूप था, कुछ अटूट उद्योग समर्थन के कारण AAC एक मजबूत दावेदार है। .[40]


कार्यक्षमता

एएसी एक वाइडबैंड ऑडियो कोडिंग एल्गोरिदम है जो उच्च गुणवत्ता वाले डिजिटल ऑडियो का प्रतिनिधित्व करने के लिए आवश्यक डेटा की मात्रा को नाटकीय रूप से कम करने के लिए दो प्राथमिक कोडिंग रणनीतियों का शोषण करता है:

  • सिग्नल घटक जो अवधारणात्मक रूप से अप्रासंगिक हैं, त्याग दिए जाते हैं।
  • कोडेड ऑडियो सिग्नल में अतिरेक समाप्त हो जाता है।

वास्तविक एन्कोडिंग प्रक्रिया में निम्नलिखित चरण होते हैं:

  • सिग्नल को आगे संशोधित असतत कोज्या परिवर्तन | संशोधित असतत कोज्या परिवर्तन (एमडीसीटी) का उपयोग करके समय-डोमेन से आवृत्ति-डोमेन में परिवर्तित किया जाता है। यह फ़िल्टर बैंकों का उपयोग करके किया जाता है जो उचित समय के नमूने लेते हैं और उन्हें आवृत्ति नमूने में परिवर्तित करते हैं।
  • फ़्रीक्वेंसी डोमेन सिग्नल को मनो मॉडल के आधार पर परिमाणित किया जाता है और एन्कोड किया जाता है।
  • आंतरिक त्रुटि सुधार कोड जोड़े गए हैं।
  • सिग्नल संग्रहीत या प्रसारित होता है।
  • दूषित नमूनों को रोकने के लिए, Luhn mod N एल्गोरिथम का एक आधुनिक कार्यान्वयन प्रत्येक फ़्रेम पर लागू किया जाता है।[41]

MPEG-4 ऑडियो मानक अत्यधिक कुशल संपीड़न योजनाओं के एक या छोटे सेट को परिभाषित नहीं करता है, बल्कि कम बिट दर भाषण कोडिंग से लेकर उच्च-गुणवत्ता वाले ऑडियो कोडिंग और संगीत संश्लेषण तक विस्तृत संचालन करने के लिए एक जटिल टूलबॉक्स है।

  • MPEG-4 ऑडियो कोडिंग एल्गोरिद्म परिवार निम्न बिट दर स्पीच एन्कोडिंग (2 kbit/s से कम) से लेकर उच्च-गुणवत्ता ऑडियो कोडिंग (64 kbit/s प्रति चैनल और उच्चतर) तक की सीमा तक फैला हुआ है।
  • एएसी 8 किलोहर्ट्ज़ और 96 किलोहर्ट्ज़ के बीच और 1 और 48 के बीच किसी भी संख्या में चैनलों की नमूना आवृत्ति प्रदान करता है।
  • एमपी3 के हाइब्रिड फिल्टर बैंक के विपरीत, एएसी 1024 या 960 अंकों की बढ़ी हुई विंडो लंबाई के साथ संशोधित असतत कोसाइन ट्रांसफॉर्म (संशोधित असतत कोसाइन ट्रांसफॉर्म) का उपयोग करता है।

AAC एनकोडर गतिशील रूप से 1024 पॉइंट लंबाई के एकल MDCT ब्लॉक या 128 पॉइंट के 8 ब्लॉक (या क्रमशः 960 पॉइंट और 120 पॉइंट के बीच) के बीच स्विच कर सकते हैं।

  • यदि कोई सिग्नल बदलता है या क्षणिक होता है, तो उनके बेहतर अस्थायी समाधान के लिए 128/120 बिंदुओं की 8 छोटी विंडो चुनी जाती हैं।
  • डिफ़ॉल्ट रूप से, 1024-पॉइंट / 960-पॉइंट विंडो का अन्यथा उपयोग किया जाता है क्योंकि बढ़ी हुई आवृत्ति रिज़ॉल्यूशन अधिक परिष्कृत मनोध्वनिक मॉडल के लिए अनुमति देता है, जिसके परिणामस्वरूप कोडिंग दक्षता में सुधार होता है।

मॉड्यूलर एन्कोडिंग

एएसी एन्कोडिंग के लिए एक मॉड्यूलर दृष्टिकोण लेता है। एन्कोड किए जाने वाले बिटस्ट्रीम की जटिलता, वांछित प्रदर्शन और स्वीकार्य आउटपुट के आधार पर, कार्यान्वयनकर्ता यह परिभाषित करने के लिए प्रोफ़ाइल बना सकते हैं कि वे किसी विशेष एप्लिकेशन के लिए कौन से टूल का उपयोग करना चाहते हैं।

MPEG-2 भाग 7 मानक (उन्नत ऑडियो कोडिंग) पहली बार 1997 में प्रकाशित हुआ था और तीन डिफ़ॉल्ट प्रोफाइल प्रदान करता है:[2][42]

  • कम जटिलता (एलसी) - सबसे सरल और सबसे व्यापक रूप से इस्तेमाल और समर्थित
  • मेन प्रोफाइल (मेन) - एलसी प्रोफाइल की तरह, बैकवर्ड प्रेडिक्शन के साथ
  • MPEG-4 AAC-SSR|स्केलेबल सैंपल रेट (SSR) उर्फ ​​सैंपल-रेट स्केलेबल (SRS)

MPEG-4 भाग 3 मानक (MPEG-4 ऑडियो) ने विभिन्न नए संपीड़न उपकरण (उर्फ MPEG-4 भाग 3#MPEG-4 ऑडियो ऑब्जेक्ट प्रकार) और नए प्रोफाइल में उनके उपयोग को परिभाषित किया। कुछ MPEG-4 ऑडियो प्रोफाइल में AAC का उपयोग नहीं किया जाता है। MPEG-2 भाग 7 AAC LC प्रोफ़ाइल, AAC मुख्य प्रोफ़ाइल और AAC SSR प्रोफ़ाइल को अवधारणात्मक शोर प्रतिस्थापन के साथ जोड़ा गया है और MPEG-4 ऑडियो मानक में ऑडियो ऑब्जेक्ट प्रकार (AAC LC, AAC मुख्य और AAC SSR नाम के तहत) के रूप में परिभाषित किया गया है। ये MPEG-4 ऑडियो प्रोफाइल में अन्य ऑब्जेक्ट प्रकारों के साथ संयुक्त हैं।[26]यहाँ MPEG-4 मानक में परिभाषित कुछ ऑडियो प्रोफाइल की सूची दी गई है:[34][43]

  • मुख्य ऑडियो प्रोफ़ाइल - 1999 में परिभाषित, अधिकांश MPEG-4 ऑडियो ऑब्जेक्ट प्रकार (AAC Main, AAC-LC, AAC-SSR, AAC-LTP, AAC स्केलेबल, TwinVQ, CELP, HVXC, TTSI, मुख्य संश्लेषण) का उपयोग करता है।
  • स्केलेबल ऑडियो प्रोफाइल - 1999 में परिभाषित, एएसी-एलसी, एएसी-एलटीपी, एएसी स्केलेबल, ट्विनवीक्यू, सीईएलपी, एचवीएक्ससी, टीटीएसआई का उपयोग करता है
  • भाषण ऑडियो प्रोफाइल - 1999 में परिभाषित, CELP, HVXC, TTSI का उपयोग करता है
  • सिंथेटिक ऑडियो प्रोफाइल - 1999 में परिभाषित, टीटीएसआई, मुख्य संश्लेषण
  • उच्च गुणवत्ता ऑडियो प्रोफाइल - 2000 में परिभाषित, एएसी-एलसी, एएसी-एलटीपी, एएसी स्केलेबल, सीईएलपी, ईआर-एएसी-एलसी, ईआर-एएसी-एलटीपी, ईआर-एएसी स्केलेबल, ईआर-सीईएलपी का उपयोग करता है
  • कम विलंब ऑडियो प्रोफ़ाइल - 2000 में परिभाषित, CELP, HVXC, TTSI, ER-AAC-LD, ER-CELP, ER-HVXC का उपयोग करता है
  • निम्न विलंब AAC v2 - 2012 में परिभाषित, AAC-LD, AAC-ELD और AAC-ELDv2 का उपयोग करता है[44]
  • मोबाइल ऑडियो इंटरनेटवर्किंग प्रोफाइल - 2000 में परिभाषित, ईआर-एएसी-एलसी, ईआर-एएसी-स्केलेबल, ईआर-ट्विनवीक्यू, ईआर-बीएसएसी, ईआर-एएसी-एलडी का उपयोग करता है
  • एएसी प्रोफाइल - 2003 में परिभाषित, एएसी-एलसी का उपयोग करता है
  • उच्च दक्षता एएसी प्रोफाइल - 2003 में परिभाषित, एएसी-एलसी, एसबीआर का उपयोग करता है
  • उच्च दक्षता AAC v2 प्रोफ़ाइल - 2006 में परिभाषित, AAC-LC, SBR, PS का उपयोग करता है
  • विस्तारित उच्च दक्षता एएसी एक्सएचई-एएसी - 2012 में परिभाषित, एकीकृत भाषण और ऑडियो कोडिंग का उपयोग करता है

MPEG-4 ऑडियो में कई सुधारों में से एक लॉन्ग टर्म प्रेडिक्शन (LTP) नामक एक ऑब्जेक्ट प्रकार है, जो कम कम्प्यूटेशनल जटिलता के साथ फॉरवर्ड प्रेडिक्टर का उपयोग करके मेन प्रोफाइल में सुधार है।[28]


एएसी त्रुटि सुरक्षा टूलकिट

त्रुटि सुरक्षा लागू करने से कुछ हद तक त्रुटि सुधार सक्षम होता है। त्रुटि सुधार कोड आमतौर पर पूरे पेलोड पर समान रूप से लागू होते हैं। हालांकि, चूंकि एएसी पेलोड के विभिन्न हिस्से ट्रांसमिशन त्रुटियों के प्रति अलग संवेदनशीलता दिखाते हैं, यह एक बहुत ही कुशल दृष्टिकोण नहीं होगा।

एएसी पेलोड को विभिन्न त्रुटि संवेदनशीलता वाले भागों में विभाजित किया जा सकता है।

  • MPEG-4 ऑडियो मानक में परिभाषित त्रुटि सुरक्षा (EP) टूल का उपयोग करके इनमें से किसी भी भाग पर स्वतंत्र त्रुटि सुधार कोड लागू किए जा सकते हैं।
  • यह टूलकिट अतिरिक्त ओवरहेड को कम रखने के लिए पेलोड के सबसे संवेदनशील भागों को त्रुटि सुधार क्षमता प्रदान करता है।
  • टूलकिट सरल और पूर्व-मौजूदा एएसी डिकोडर्स के साथ पिछड़े संगत है। टूलकिट के त्रुटि सुधार कार्यों का एक बड़ा सौदा डेटास्ट्रीम में समान रूप से ऑडियो सिग्नल के बारे में जानकारी फैलाने पर आधारित है।

त्रुटि लचीला (ईआर) एएसी

त्रुटि लचीलापन (ईआर) तकनीकों का उपयोग कोडिंग योजना को त्रुटियों के प्रति अधिक मजबूत बनाने के लिए किया जा सकता है।

एएसी के लिए, एमपीईजी-4 ऑडियो में तीन कस्टम-अनुरूप तरीके विकसित और परिभाषित किए गए थे

  • वर्णक्रमीय डेटा के भीतर त्रुटि प्रसार से बचने के लिए हफ़मैन कोडवर्ड रीऑर्डरिंग (HCR)।
  • वर्णक्रमीय डेटा के भीतर गंभीर त्रुटियों का पता लगाने के लिए वर्चुअल कोडबुक (VCB11)।
  • प्रतिवर्ती चर लंबाई कोड (RVLC) पैमाने कारक डेटा के भीतर त्रुटि प्रसार को कम करने के लिए

एएसी कम विलंब

ऑडियो कोडिंग मानक MPEG-4 निम्न विलंब (AAC-LD), उन्नत निम्न विलंब (AAC-ELD), और उन्नत निम्न विलंब v2 (AAC-ELDv2) जैसा कि ISO/IEC 14496-3:2009 और ISO/IEC 14496 में परिभाषित किया गया है -3:2009/एएमडी 3 को दो-तरफ़ा संचार के लिए आवश्यक कम विलंब के साथ अवधारणात्मक ऑडियो कोडिंग के लाभों को संयोजित करने के लिए डिज़ाइन किया गया है। वे MPEG-2 उन्नत ऑडियो कोडिंग (AAC) प्रारूप से निकटता से प्राप्त हुए हैं।[45][46][47] हाई डेफिनिशन वीडियो कॉन्फ्रेंस (HDVC) सेवा के लिए IMS प्रोफाइल में सुपर-वाइडबैंड वॉयस कोडेक के रूप में GSM एसोसिएशन द्वारा AAC-ELD की सिफारिश की गई है।[48]


लाइसेंसिंग और पेटेंट

Template:Time-context एएसी प्रारूप में सामग्री को स्ट्रीम करने या वितरित करने के लिए उपयोगकर्ता को किसी लाइसेंस या भुगतान की आवश्यकता नहीं होती है।[49] अकेले इस कारण ने एएसी को अपने पूर्ववर्ती एमपी3 की तुलना में सामग्री वितरित करने के लिए अधिक आकर्षक प्रारूप बना दिया है, विशेष रूप से उपयोग के मामले के आधार पर स्ट्रीमिंग सामग्री (जैसे इंटरनेट रेडियो) के लिए।

हालाँकि, एक पेटेंट लाइसेंस है[when?] AAC कोडेक्स के सभी निर्माताओं या डेवलपर्स के लिए आवश्यक है।[50] इस कारण से, पेटेंट उल्लंघन से बचने के लिए FFmpeg और FAAC जैसे मुक्त और मुक्त स्रोत सॉफ़्टवेयर कार्यान्वयन को केवल स्रोत कोड के रूप में वितरित किया जा सकता है। (एएसी, सॉफ्टवेयर का समर्थन करने वाले उत्पादों के तहत नीचे देखें।)

एएसी पेटेंट धारकों में बेल लैब्स, डॉल्बी लेबोरेटरीज, फ्रौनहोफर सोसाइटी, एलजी इलेक्ट्रॉनिक्स, एनईसी, एनटीटी डोकोमो, पैनासोनिक, सोनी कॉर्पोरेशन, शामिल हैं।[1]ETRI, JVC केनवुड, फिलिप्स, माइक्रोसॉफ्ट और निप्पॉन टेलीग्राफ और टेलीफोन।[15]


एक्सटेंशन और सुधार

पहले AAC मानक में कुछ एक्सटेंशन जोड़े गए हैं (1997 में MPEG-2 भाग 7 में परिभाषित):

  • अवधारणात्मक शोर प्रतिस्थापन (PNS), MPEG-4 भाग 3 में जोड़ा गया। 1999 में MPEG-4। यह छद्म यादृच्छिक डेटा के रूप में शोर की कोडिंग की अनुमति देता है।
  • लॉन्ग टर्म प्रिडिक्टर (LTP), 1999 में MPEG-4 में जोड़ा गया। यह कम कम्प्यूटेशनल जटिलता वाला फॉरवर्ड प्रेडिक्टर है।[28]* 2000 में एमपीईजी-4 ऑडियो संस्करण 2 में जोड़ा गया त्रुटि लचीलापन (ईआर), त्रुटि प्रवण चैनलों पर परिवहन के लिए उपयोग किया जाता है[51]
  • एएसी-एलडी (कम विलंब), 2000 में परिभाषित, रीयल-टाइम वार्तालाप अनुप्रयोगों के लिए उपयोग किया जाता है
  • उच्च दक्षता उन्नत ऑडियो कोडिंग (HE-AAC), a.k.a. aacPlus v1 या AAC+, स्पेक्ट्रल बैंड प्रतिकृति का संयोजन|SBR (स्पेक्ट्रल बैंड प्रतिकृति) और AAC LC। कम बिटरेट के लिए उपयोग किया जाता है। 2003 में परिभाषित।
  • उच्च दक्षता उन्नत ऑडियो कोडिंग|HE-AAC v2, a.k.a. aacPlus v2, eAAC+ या उन्नत aacPlus, पैरामीट्रिक स्टीरियो|पैरामेट्रिक स्टीरियो (PS) और HE-AAC का संयोजन; इससे भी कम बिटरेट के लिए उपयोग किया जाता है। 2004 और 2006 में परिभाषित।
  • MPEG-4 SLS|MPEG-4 स्केलेबल टू लॉसलेस (SLS), अभी तक प्रकाशित नहीं हुआ है,[52] दोषरहित डिकोडिंग विकल्प प्रदान करने के लिए AAC स्ट्रीम को पूरक कर सकता है, जैसे कि Fraunhofer IIS के HD-AAC उत्पाद में

कंटेनर प्रारूप

फाइल स्टोरेज के लिए आईएसओ आधार मीडिया फ़ाइल स्वरूप पर आधारित MP4, 3GP और अन्य कंटेनर फॉर्मेट के अलावा, AAC ऑडियो डेटा को पहले ऑडियो डेटा इंटरचेंज फॉर्मेट (ADIF) का उपयोग करके MPEG-2 मानक के लिए एक फाइल में पैक किया गया था।[53] कच्चे AAC ऑडियो डेटा ब्लॉक के बाद एकल हेडर से मिलकर।[54] हालाँकि, यदि डेटा को MPEG-2 ट्रांसपोर्ट स्ट्रीम के भीतर स्ट्रीम किया जाना है, तो ऑडियो डेटा ट्रांसपोर्ट स्ट्रीम (ADTS) नामक एक सेल्फ-सिंक्रनाइज़िंग फॉर्मेट का उपयोग किया जाता है, जिसमें फ़्रेम की एक श्रृंखला होती है, प्रत्येक फ़्रेम में AAC के बाद एक हेडर होता है। ऑडियो डेटा।[53]यह फ़ाइल और स्ट्रीमिंग-आधारित प्रारूप MPEG-2 भाग 7 में परिभाषित किया गया है, लेकिन MPEG-4 द्वारा केवल सूचनात्मक माना जाता है, इसलिए MPEG-4 डिकोडर को किसी भी प्रारूप का समर्थन करने की आवश्यकता नहीं है।[53]इन कंटेनरों के साथ-साथ एक कच्ची AAC स्ट्रीम में .aac फ़ाइल एक्सटेंशन हो सकता है। MPEG-4 भाग 3 अपने स्वयं के सिंक्रनाइज़िंग प्रारूप को भी परिभाषित करता है जिसे लो ओवरहेड ऑडियो स्ट्रीम (LOAS) कहा जाता है जो न केवल AAC, बल्कि किसी भी MPEG-4 ऑडियो संपीड़न योजना जैसे कि TwinVQ और ऑडियो दोषरहित कोडिंग को समाहित करता है। यह प्रारूप वह है जिसे DVB ट्रांसपोर्ट स्ट्रीम में उपयोग के लिए परिभाषित किया गया था जब एनकोडर या तो स्पेक्ट्रल बैंड प्रतिकृति या पैरामीट्रिक स्टीरियो AAC एक्सटेंशन का उपयोग करते हैं। हालांकि, यह केवल एक गैर-मल्टीप्लेक्स एएसी स्ट्रीम तक ही सीमित है। इस प्रारूप को लो ओवरहेड ऑडियो ट्रांसपोर्ट मल्टीप्लेक्स (LATM) के रूप में भी जाना जाता है, जो कि LOAS का एक इंटरलीव्ड मल्टीपल स्ट्रीम संस्करण है।[53]


== AAC == का समर्थन करने वाले उत्पाद


एचडीटीवी मानक

जापानी आईएसडीबी-टी

दिसंबर 2003 में, जापान ने स्थलीय DTV ISDB-T मानक का प्रसारण शुरू किया जो MPEG-2 वीडियो और MPEG-2 AAC ऑडियो को लागू करता है। अप्रैल 2006 में जापान ने 1seg नामक ISDB-T मोबाइल उप-कार्यक्रम का प्रसारण शुरू किया, जो ग्रह पर स्थलीय HDTV प्रसारण सेवा में ऑडियो HE-AAC के साथ वीडियो H.264/AVC का पहला कार्यान्वयन था।

अंतर्राष्ट्रीय आईएसडीबी-टीबी

दिसंबर 2007 में, ब्राज़ील ने अंतर्राष्ट्रीय ISDB-Tb नामक स्थलीय DTV मानक का प्रसारण शुरू किया जो मुख्य कार्यक्रम (एकल या बहु) पर ऑडियो AAC-LC के साथ H.264/AVC वीडियो कोडिंग लागू करता है और ऑडियो HE-AACv2 के साथ वीडियो H.264/AVC लागू करता है। 1seg मोबाइल उप-कार्यक्रम।

डीवीबी === ETSI, डिजिटल वीडियो प्रसारण के लिए शासी निकाय, कम से कम 2004 से DVB अनुप्रयोगों में AAC, HE-AAC और HE-AAC v2 ऑडियो कोडिंग का समर्थन करता है।[55] DVB प्रसारण जो वीडियो के लिए H.264/MPEG-4 AVC|H.264 संपीड़न का उपयोग करते हैं, सामान्य रूप से ऑडियो के लिए HE-AAC का उपयोग करते हैं।[citation needed]


हार्डवेयर

आईट्यून्स और आइपॉड

अप्रैल 2003 में, Apple Inc. ने घोषणा करके AAC की ओर मुख्यधारा का ध्यान आकर्षित किया कि इसके iTunes और iPod उत्पाद MPEG-4 AAC प्रारूप (पुराने iPods के लिए फर्मवेयर अपडेट के माध्यम से) में गानों का समर्थन करेंगे। ग्राहक एक बंद-स्रोत डिजिटल अधिकार प्रबंधन|डिजिटल राइट्स मैनेजमेंट (DRM)-प्रतिबंधित 128 kbit/s AAC (फेयर प्ले देखें) के रूप में iTunes स्टोर के माध्यम से संगीत डाउनलोड कर सकते हैं या iTunes का उपयोग करके अपनी स्वयं की सीडी से DRM के बिना फ़ाइलें बना सकते हैं। बाद के वर्षों में, Apple ने संगीत वीडियो और फिल्में पेश करना शुरू किया, जो ऑडियो एन्कोडिंग के लिए AAC का भी उपयोग करते हैं।

29 मई, 2007 को, Apple ने उच्च बिटरेट (256 kbit/s cVBR) पर भाग लेने वाले रिकॉर्ड लेबल से गाने और संगीत वीडियो बेचना शुरू किया और DRM से मुक्त, एक प्रारूप जिसे iTunes Plus करार दिया गया। ये फ़ाइलें ज्यादातर AAC मानक का पालन करती हैं और कई गैर-Apple उत्पादों पर चलाने योग्य होती हैं, लेकिन इनमें कस्टम iTunes जानकारी जैसे एल्बम कलाकृति और खरीदारी रसीद शामिल होती है, ताकि फ़ाइल के पीयर-टू पर लीक होने की स्थिति में ग्राहक की पहचान की जा सके। -पीयर नेटवर्क। हालांकि, एएसी विनिर्देशों के अनुरूप सख्ती से अनुरूप खिलाड़ियों के साथ इंटरऑपरेबिलिटी बहाल करने के लिए इन कस्टम टैग को हटाना संभव है। 6 जनवरी, 2009 तक, संयुक्त राज्य अमेरिका के आईतून भण्डार पर लगभग सभी संगीत डीआरएम-मुक्त हो गए, शेष मार्च 2009 के अंत तक डीआरएम-मुक्त हो गए।[56] आइट्यून्स एक परिवर्तनीय बिट दर एन्कोडिंग विकल्प प्रदान करता है जो औसत बिटरेट योजना (एबीआर एन्कोडिंग का एक कम सख्त संस्करण) में एएसी ट्रैक्स को एन्कोड करता है; हालांकि अंतर्निहित QuickTime API एक वास्तविक VBR एन्कोडिंग प्रोफ़ाइल प्रदान करता है।[57] सितंबर 2009 तक, Apple ने केवल रेडियो स्ट्रीम के लिए HE-AAC (जो MP4 मानक का पूरी तरह से हिस्सा है) के लिए समर्थन जोड़ा है, फ़ाइल प्लेबैक के लिए नहीं, और iTunes में अभी भी वास्तविक VBR एन्कोडिंग के लिए समर्थन की कमी है।

अन्य पोर्टेबल खिलाड़ी

मोबाइल फोन

कई वर्षों से, Nokia, Motorola, Samsung, Sony Ericsson, BenQ-Siemens और Philips जैसे निर्माताओं के कई मोबाइल फ़ोनों ने AAC प्लेबैक का समर्थन किया है। पहला ऐसा फ़ोन Nokia 5510 था जो 2002 में जारी किया गया था जो MP3 भी चलाता है। हालाँकि, यह फोन एक व्यावसायिक विफलता थी[citation needed] और एकीकृत म्यूजिक प्लेयर वाले ऐसे फोन 2005 तक मुख्यधारा की लोकप्रियता हासिल नहीं कर पाए, जब AAC के साथ-साथ MP3 समर्थन का चलन जारी रहा। अधिकांश नए स्मार्टफ़ोन और संगीत-थीम वाले फ़ोन इन स्वरूपों के प्लेबैक का समर्थन करते हैं।

  • Sony Ericsson फ़ोन MP4 कंटेनर में विभिन्न AAC स्वरूपों का समर्थन करते हैं। सोनी एरिक्सन K700 से शुरू होने वाले सभी फोन में AAC-LC समर्थित है, Sony Ericsson W550 से शुरू होने वाले फोन में HE-AAC का समर्थन है। नवीनतम उपकरण जैसे Sony Ericsson P990, Sony Ericsson K610, W890i और बाद में HE-AAC v2.
  • Nokia XpressMusic और अन्य नई पीढ़ी के Nokia मल्टीमीडिया फोन जैसे N- और E-Series भी LC, HE, M4A और HEv2 प्रोफाइल में AAC फॉर्मेट को सपोर्ट करते हैं। ये एलटीपी-एन्कोडेड एएसी ऑडियो चलाने का भी समर्थन करते हैं।
  • BlackBerry 10 ऑपरेटिंग सिस्टम चलाने वाले BlackBerry फ़ोन मूल रूप से AAC प्लेबैक का समर्थन करते हैं। पिछली पीढ़ी का चयन करें BlackBerry OS डिवाइस भी AAC का समर्थन करते हैं।
  • खराब ओएस
  • Apple Inc. का iPhone AAC और FairPlay संरक्षित AAC फ़ाइलों का समर्थन करता है जिन्हें पहले iTunes Store में डिफ़ॉल्ट एन्कोडिंग स्वरूप के रूप में उपयोग किया जाता था जब तक कि FairPlay#FairPlay प्रतिबंध हटाने की घोषणा नहीं हो जाती।
  • एंड्रॉइड (ऑपरेटिंग सिस्टम) 2.3[58] और बाद में कई अन्य ऑडियो प्रारूपों के साथ MP4 या M4A कंटेनरों में AAC-LC, HE-AAC और HE-AAC v2 का समर्थन करता है। Android 3.1 और बाद में कच्चे ADTS फ़ाइलों का समर्थन करता है। Android 4.1 AAC को एनकोड कर सकता है।[59]
  • HP/Palm का WebOS AAC, AAC+, eAAC+, और .m4a कंटेनरों को इसके नेटिव म्यूजिक प्लेयर के साथ-साथ कई थर्ड-पार्टी प्लेयर्स को सपोर्ट करता है। हालाँकि, यह iTunes से डाउनलोड की गई Apple की फेयरप्ले DRM फ़ाइलों का समर्थन नहीं करता है।[60]
  • विंडोज फोन का सिल्वरलाइट रनटाइम AAC-LC, HE-AAC और HE-AAC v2 डिकोडिंग को सपोर्ट करता है।

अन्य उपकरण

  • Apple Inc. का iPad: AAC और FairPlay संरक्षित AAC फ़ाइलों का समर्थन करता है जिनका उपयोग iTunes Store में डिफ़ॉल्ट एन्कोडिंग प्रारूप के रूप में किया जाता है
  • पाम ओएस पर्सनल डिज़िटल एसिस्टेंट: कई पाम ओएस आधारित पीडीए और स्मार्टफोन तीसरे पक्ष के सॉफ्टवेयर पॉकेट ट्यून्स के साथ एएसी और एचई-एएसी चला सकते हैं। संस्करण 4.0, दिसंबर 2006 में जारी किया गया, देशी AAC और HE-AAC फ़ाइलों के लिए समर्थन जोड़ा गया। टीसीपीएमपी के लिए एएसी कोडेक, एक लोकप्रिय वीडियो प्लेयर, पेटेंट मुद्दों के कारण संस्करण 0.66 के बाद वापस ले लिया गया था, लेकिन अभी भी corecodec.org के अलावा अन्य साइटों से डाउनलोड किया जा सकता है। CorePlayer, TCPMP का व्यावसायिक अनुवर्ती है, जिसमें AAC समर्थन शामिल है। एएसी का समर्थन करने वाले अन्य पाम ओएस प्रोग्रामों में किनोमा प्लेयर और एरोप्लेयर शामिल हैं।
  • विंडोज़ मोबाइल: देशी विंडोज मीडिया प्लेयर या तीसरे पक्ष के उत्पादों (टीसीपीएमपी, कोरप्लेयर) द्वारा एएसी का समर्थन करता है[citation needed]
  • Epson: Epson P-2000|P-2000 और Epson P-4000|P-4000 मल्टीमीडिया/फोटो स्टोरेज व्यूअर्स में AAC प्लेबैक को सपोर्ट करता है
  • सोनी रीडर: AAC वाली M4A फाइलें चलाता है, और iTunes द्वारा बनाए गए मेटाडेटा को प्रदर्शित करता है। ए और ई श्रृंखला नेटवर्क वॉकमैन सहित अन्य सोनी उत्पाद, फर्मवेयर अपडेट के साथ एएसी का समर्थन करते हैं (मई 2006 को जारी) जबकि एस श्रृंखला बॉक्स से बाहर इसका समर्थन करती है।
  • सोनोस डिजिटल मीडिया प्लेयर: एएसी फाइलों के प्लेबैक का समर्थन करता है
  • बार्न्स एंड नोबल नुक्कड़ रंग: AAC एन्कोडेड फ़ाइलों के प्लेबैक का समर्थन करता है
  • रोकू साउंडब्रिज: एक नेटवर्क ऑडियो प्लेयर, एएसी एन्कोडेड फाइलों के प्लेबैक का समर्थन करता है
  • स्क्वीज़बॉक्स (नेटवर्क म्यूजिक प्लेयर): नेटवर्क ऑडियो प्लेयर (स्लिम डिवाइसेस, एक LOGITECH कंपनी द्वारा बनाया गया) जो एएसी फाइलों के प्लेबैक का समर्थन करता है
  • प्लेस्टेशन 3: एएसी फाइलों की एन्कोडिंग और डिकोडिंग का समर्थन करता है
  • Xbox 360: Zune सॉफ़्टवेयर के माध्यम से AAC की स्ट्रीमिंग और USB पोर्ट के माध्यम से जुड़े समर्थित iPods का समर्थन करता है
  • Wii: 11 दिसंबर, 2007 तक फोटो चैनल के संस्करण 1.1 के माध्यम से एएसी फाइलों का समर्थन करता है। सभी एएसी प्रोफाइल और बिटरेट तब तक समर्थित हैं जब तक यह .m4a फ़ाइल एक्सटेंशन में है। इस अद्यतन ने MP3 संगतता को हटा दिया, लेकिन जिन उपयोगकर्ताओं ने इसे स्थापित किया है, वे चाहें तो पुराने संस्करण में स्वतंत्र रूप से डाउनग्रेड कर सकते हैं।[61]
  • लाइवस्क्राइब पल्स और इको स्मार्टपेंस: एएसी फॉर्मेट में ऑडियो रिकॉर्ड और स्टोर करें। ऑडियो फ़ाइलों को पेन के एकीकृत स्पीकर, संलग्न हेडफ़ोन, या लाइवस्क्राइब डेस्कटॉप सॉफ़्टवेयर का उपयोग करके कंप्यूटर पर फिर से चलाया जा सकता है। AAC फ़ाइलें उपयोगकर्ता के Windows OS के मेरे दस्तावेज़ फ़ोल्डर में संग्रहीत की जाती हैं और इन्हें Livescribe के विशेष हार्डवेयर या सॉफ़्टवेयर के बिना वितरित और चलाया जा सकता है।
  • Google Chromecast: LC-AAC और HE-AAC ऑडियो के प्लेबैक का समर्थन करता है[62]


सॉफ्टवेयर

लगभग सभी पुस्तकालय (कंप्यूटर विज्ञान) प्लेयर्स में AAC के लिए बिल्ट-इन डिकोडर्स शामिल हैं, या इसे डिकोड करने के लिए एक लाइब्रेरी (कंप्यूटर साइंस) का उपयोग कर सकते हैं। Microsoft Windows पर, DirectShow का उपयोग किसी भी DirectShow आधारित प्लेयर में AAC प्लेबैक को सक्षम करने के लिए संबंधित फ़िल्टर के साथ इस तरह किया जा सकता है। Mac OS X जल्दी समय लाइब्रेरी के माध्यम से एएसी का समर्थन करता है।

Adobe Flash Player, संस्करण 9 अपडेट 3 के बाद से, AAC स्ट्रीम भी चला सकता है।[63][64] चूँकि फ़्लैश प्लेयर भी एक ब्राउज़र प्लगइन है, यह AAC फ़ाइलों को ब्राउज़र के माध्यम से भी चला सकता है।

रॉकबॉक्स खुला स्रोत सॉफ्टवेयर फ़र्मवेयर (कई पोर्टेबल प्लेयर्स के लिए उपलब्ध) AAC को अलग-अलग डिग्री के लिए समर्थन प्रदान करता है, जो खिलाड़ी के मॉडल और AAC प्रोफ़ाइल पर निर्भर करता है।

Xbox 360 के लिए वैकल्पिक iPod समर्थन (असुरक्षित AAC फ़ाइलों का प्लेबैक) Xbox Live से मुफ्त डाउनलोड के रूप में उपलब्ध है।[65] निम्नलिखित अन्य सॉफ़्टवेयर प्लेयर अनुप्रयोगों की एक गैर-व्यापक सूची है:

  • 3ivx|3ivx MPEG-4: DirectShow और QuickTime प्लगइन्स का एक सूट जो किसी भी DirectShow एप्लिकेशन में AAC एन्कोडिंग या AAC/HE-AAC डिकोडिंग का समर्थन करता है
  • CorePlayer: LC और HE AAC को भी सपोर्ट करता है
  • ffdshow: Microsoft Windows के लिए एक निःशुल्क ओपन-सोर्स सॉफ़्टवेयर DirectShow फ़िल्टर जो AAC डिकोडिंग का समर्थन करने के लिए FAAD2 का उपयोग करता है
  • Foobar2000: Microsoft Windows के लिए एक फ्रीवेयर ऑडियो प्लेयर (सॉफ़्टवेयर) जो LC और HE AAC को सपोर्ट करता है
  • [[केएम प्लेयर]]
  • मीडियाबंदर
  • एआईएमपी
  • मीडिया प्लेयर क्लासिक#फोर्क्स
  • एमपी टैग
  • MPlayer या xine: अक्सर Linux या Mac (कंप्यूटर) पर AAC डिकोडर के रूप में उपयोग किया जाता है
  • MusicBee: एक उन्नत संगीत प्रबंधक और प्लेयर जो एक प्लगइन के माध्यम से एन्कोडिंग और रिपिंग का भी समर्थन करता है
  • RealPlayer: में RealNetworks' RealAudio 10 AAC एनकोडर शामिल है
  • सोंगबर्ड (सॉफ़्टवेयर): Microsoft Windows, Linux और Mac OS X पर AAC को सपोर्ट करता है, जिसमें प्लग-इन के साथ iTunes Store से ख़रीदे गए संगीत के लिए उपयोग किए जाने वाले DRM अधिकार प्रबंधन एन्कोडिंग भी शामिल है।
  • सोनिकस्टेज
  • VLC मीडिया प्लेयर: MP4 और रॉ AAC फ़ाइलों के प्लेबैक और एन्कोडिंग का समर्थन करता है
  • Microsoft Windows के लिए Winamp: एक AAC एनकोडर शामिल है जो LC और HE AAC का समर्थन करता है
  • Windows Media Player 12: Windows 7 के साथ जारी किया गया, AAC फ़ाइलों के मूल रूप से प्लेबैक का समर्थन करता है
  • एक और वास्तविक: रैप्सोडी (ऑनलाइन संगीत सेवा) एएसी के साथ एन्कोड किए गए सब्सक्रिप्शन ट्रैक की पेशकश के अलावा रियलऑडियो एएसी कोडेक का समर्थन करता है
  • XBMC: AAC (LC और HE दोनों) को सपोर्ट करता है।
  • XMMS: faad2 लाइब्रेरी द्वारा प्रदान किए गए प्लगइन का उपयोग करके MP4 प्लेबैक का समर्थन करता है

इनमें से कुछ प्लेयर (उदाहरण के लिए, foobar2000, Winamp, और VLC) भी SHOUTcast प्रोटोकॉल का उपयोग करके ADTS (ऑडियो डेटा ट्रांसपोर्ट स्ट्रीम) के डिकोडिंग का समर्थन करते हैं। Winamp और foobar2000 के लिए प्लग-इन ऐसी धाराओं के निर्माण को सक्षम करते हैं।

नीरो डिजिटल ऑडियो

मई 2006 में, Nero AG ने नि:शुल्क एक AAC एन्कोडिंग टूल, Nero Digital Audio (AAC कोडेक भाग Nero AAC कोडेक बन गया है) जारी किया।[66] जो LC-AAC, HE-AAC और HE-AAC v2 स्ट्रीम को एनकोड करने में सक्षम है। टूल केवल एक कमांड लाइन इंटरफेस टूल है। PCM WAV को डिकोड करने के लिए एक अलग उपयोगिता भी शामिल है।

फ़ोबार 2000 ऑडियो प्लेयर और मीडियाकोडर सहित विभिन्न उपकरण इस एनकोडर के लिए एक जीयूआई प्रदान कर सकते हैं।

FAAC और FAAD2

FAAC और FAAD2 क्रमशः फ्रीवेयर एडवांस्ड ऑडियो कोडर और डिकोडर 2 के लिए हैं। FAAC ऑडियो ऑब्जेक्ट प्रकार LC, Main और LTP का समर्थन करता है।[67] FAAD2 ऑडियो ऑब्जेक्ट प्रकार LC, Main, LTP, SBR और PS का समर्थन करता है।[68] हालांकि FAAD2 मुफ्त सॉफ्टवेयर है, FAAC मुफ्त सॉफ्टवेयर नहीं है।

फ्राउनहोफर एफडीके एएसी

Android (ऑपरेटिंग सिस्टम) में शामिल एक Fraunhofer IIS-लेखक ओपन-सोर्स एनकोडर/डिकोडर को अन्य प्लेटफॉर्म पर पोर्ट किया गया है। FFmpeg का मूल AAC एनकोडर HE-AAC और HE-AACv2 का समर्थन नहीं करता है, लेकिन ffmpeg का GPL 2.0+ FDK AAC के साथ संगत नहीं है, इसलिए libfdk-aac के साथ ffmpeg पुनर्वितरण योग्य नहीं है। QAAC एनकोडर जो Apple के कोर मीडिया ऑडियो का उपयोग कर रहा है, अभी भी FDK की तुलना में उच्च गुणवत्ता वाला है।

FFmpeg और लिबाव

FFmpeg के libavcodec में बनाए गए देशी AAC एनकोडर, और Libav के साथ फोर्क किए गए, को प्रायोगिक और खराब माना गया। FFmpeg (फरवरी 2016) के 3.0 रिलीज के लिए इसके संस्करण को प्रयोग करने योग्य और बाकी AAC एनकोडर के साथ प्रतिस्पर्धी बनाने के लिए काफी काम किया गया था।[69] लिबाव ने इस काम को विलय नहीं किया है और एएसी एन्कोडर के पुराने संस्करण का उपयोग करना जारी रखता है। ये एनकोडर LGPL-लाइसेंस प्राप्त ओपन-सोर्स हैं और इन्हें किसी भी प्लेटफॉर्म के लिए बनाया जा सकता है जिसे FFmpeg या Libav फ्रेमवर्क बनाया जा सकता है।

FFmpeg और Libav दोनों ही libfdk-aac के माध्यम से Fraunhofer FDK AAC लाइब्रेरी का उपयोग कर सकते हैं, और जबकि FFmpeg देशी एनकोडर सामान्य उपयोग के लिए स्थिर और काफी अच्छा हो गया है, FDK को अभी भी FFmpeg के साथ उपयोग के लिए उपलब्ध उच्चतम गुणवत्ता वाला एनकोडर माना जाता है।[70] लिबाव एफडीके एएसी उपलब्ध होने पर इसका उपयोग करने की भी सिफारिश करता है।[71]


यह भी देखें

संदर्भ

  1. 1.0 1.1 1.2 "Via Licensing Announces Updated AAC Joint Patent License". Business Wire. 5 January 2009. Retrieved 18 June 2019.
  2. 2.0 2.1 ISO (1997). "ISO/IEC 13818-7:1997, Information technology -- Generic coding of moving pictures and associated audio information -- Part 7: Advanced Audio Coding (AAC)". Archived from the original on 2012-09-25. Retrieved 2010-07-18.
  3. Advanced Audio Coding (MPEG-4) (Full draft). Sustainability of Digital Formats. Washington, D.C.: Library of Congress. 22 June 2010. Retrieved 1 December 2021.
  4. 4.0 4.1 4.2 4.3 Brandenburg, Karlheinz (1999). "MP3 and AAC Explained" (PDF). Archived from the original (PDF) on 2017-02-13.
  5. ISO (2006) ISO/IEC 13818-7:2006 - Information technology -- Generic coding of moving pictures and associated audio information -- Part 7: Advanced Audio Coding (AAC) Archived 2016-03-03 at the Wayback Machine, Retrieved on 2009-08-06
  6. ISO (2006) ISO/IEC 14496-3:2005 - Information technology -- Coding of audio-visual objects -- Part 3: Audio Archived 2016-04-13 at the Wayback Machine, Retrieved on 2009-08-06
  7. only used on web player, Google Home, Amazon Alexa, and Microsoft Windows app.
  8. "Audio file formats for Spotify". Spotify. Retrieved 20 September 2021.
  9. Ahmed, Nasir (January 1991). "How I Came Up With the Discrete Cosine Transform". Digital Signal Processing. 1 (1): 4–5. doi:10.1016/1051-2004(91)90086-Z.
  10. Ahmed, Nasir; Natarajan, T.; Rao, K. R. (January 1974), "Discrete Cosine Transform", IEEE Transactions on Computers, C-23 (1): 90–93, doi:10.1109/T-C.1974.223784
  11. Rao, K. R.; Yip, P. (1990), Discrete Cosine Transform: Algorithms, Advantages, Applications, Boston: Academic Press, ISBN 978-0-12-580203-1
  12. J. P. Princen, A. W. Johnson und A. B. Bradley: Subband/transform coding using filter bank designs based on time domain aliasing cancellation, IEEE Proc. Intl. Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2161–2164, 1987
  13. John P. Princen, Alan B. Bradley: Analysis/synthesis filter bank design based on time domain aliasing cancellation, IEEE Trans. Acoust. Speech Signal Processing, ASSP-34 (5), 1153–1161, 1986
  14. Guckert, John (Spring 2012). "The Use of FFT and MDCT in MP3 Audio Compression" (PDF). University of Utah. Retrieved 14 July 2019.
  15. 15.0 15.1 "AAC Licensors". Via Corp. Retrieved 15 January 2020.
  16. ISO/IEC 14496-3:2009 - Information technology -- Coding of audio-visual objects -- Part 3: Audio (PDF) (Technical report). ISO/IEC. 1 September 2009. Archived (PDF) from the original on 14 June 2011. Retrieved 2009-10-07.
  17. 17.0 17.1 "AAC". MPEG.ORG. Archived from the original on 3 October 2009. Retrieved 2009-10-28.
  18. "ISO/IEC 13818-7, Fourth edition, Part 7 - Advanced Audio Coding (AAC)" (PDF). ISO. 15 January 2006. Archived (PDF) from the original on 6 March 2009. Retrieved 2009-10-28.
  19. Bouvigne, Gabriel (2003). "MPEG-2/MPEG-4 - AAC". MP3'Tech. Archived from the original on 2010-01-05. Retrieved 2009-10-28.
  20. "MPEG Audio FAQ Version 9 - MPEG-1 and MPEG-2 BC". ISO. October 1998. Archived from the original on 2010-02-18. Retrieved 2009-10-28.
  21. "Florence Press Release". ISO. March 1996. Archived from the original on 2010-04-08. Retrieved 2009-10-28.
  22. Johnston, J. D. and Ferreira, A. J., "Sum-difference stereo transform coding", ICASSP '92, March 1992, pp. II-569-572.
  23. Sinha, D. and Johnston, J. D., "Audio compression at low bit rates using a signal adaptive switched filterbank", IEEE ASSP, 1996, pp. 1053-1057.
  24. Johnston, J. D., Sinha, D., Dorward, S. and Quackenbush, S., "AT&T perceptual audio coder (PAC)" in Collected Papers on Digital Audio Bit-Rate Reduction, Gilchrist, N. and Grewin, C. (Ed.), Audio Engineering Society, 1996.
  25. Herre, J. and Johnston, J. D., "Enhancing the performance of perceptual audio coders by using temporal noise shaping", AES 101st Convention, no. preprint 4384, 1996
  26. 26.0 26.1 26.2 Brandenburg, Karlheinz; Kunz, Oliver; Sugiyama, Akihiko. "MPEG-4 Natural Audio Coding - Audio profiles and levels". chiariglione.org. Archived from the original on 2010-07-17. Retrieved 2009-10-06.
  27. "ISO/IEC FCD 14496-3 Subpart 1 - Draft - N2203" (PDF). ISO/IEC JTC 1/SC 29/WG 11. 15 May 1998. Retrieved 2009-10-07.
  28. 28.0 28.1 28.2 Brandenburg, Karlheinz; Kunz, Oliver; Sugiyama, Akihiko (1999). "MPEG-4 Natural Audio Coding - General Audio Coding (AAC based)". chiariglione.org. Archived from the original on 2010-02-19. Retrieved 2009-10-06.
  29. "ISO/IEC 14496-3:1999/Amd 1:2000 - Audio extensions". ISO. 2000. Archived from the original on 2011-06-06. Retrieved 2009-10-07.
  30. "ISO/IEC 14496-3:/Amd.1 - Final Committee Draft - MPEG-4 Audio Version 2" (PDF). ISO/IEC JTC 1/SC 29/WG 11. July 1999. Archived from the original (PDF) on 2012-08-01. Retrieved 2009-10-07.
  31. Purnhagen, Heiko (19 February 2000). "MPEG-4 Version 2 Audio Workshop:HILN - Parametric Audio Coding" (PDF). Paris. AES 108th Convention: MPEG-4 Version 2 Audio What is it about?. Retrieved 2009-10-07.
  32. Pereira, Fernando (October 2001). "Levels for Audio Profiles". MPEG Industry Forum. Archived from the original on 2010-01-08. Retrieved 2009-10-15.
  33. "ISO/IEC 14496-3:2001/Amd 1:2003 - Bandwidth extension". ISO. 2003. Archived from the original on 2011-06-06. Retrieved 2009-10-07.
  34. 34.0 34.1 "Text of ISO/IEC 14496-3:2001/FPDAM 4, Audio Lossless Coding (ALS), new audio profiles and BSAC extensions". ISO/IEC JTC1/SC29/WG11/N7016. 11 January 2005. Archived from the original (DOC) on 12 May 2014. Retrieved 2009-10-09.
  35. Mody, Mihir (6 June 2005). "Audio compression gets better and more complex". Embedded.com. Archived from the original on 8 February 2016. Retrieved 2009-10-13.
  36. 36.0 36.1 "MPEG-4 aacPlus - Audio coding for today's digital media world" (PDF). Archived from the original (PDF) on 2006-10-26. Retrieved 2007-01-29.
  37. "Parametric coding for high-quality audio, ISO/IEC 14496-3:2001/Amd 2:2004". ISO. 2004. Archived from the original on 2012-01-04. Retrieved 2009-10-13.
  38. "3GPP TS 26.401 V6.0.0 (2004-09), General Audio Codec audio processing functions; Enhanced aacPlus General Audio Codec; General Description (Release 6)" (DOC). 3GPP. 30 September 2004. Archived from the original on 19 August 2006. Retrieved 2009-10-13.
  39. "ISO/IEC 14496-3:2009 - Information technology -- Coding of audio-visual objects -- Part 3: Audio". ISO. 2009. Archived from the original on 2011-06-06. Retrieved 2009-10-07.
  40. "AAC". Hydrogenaudio. Archived from the original on 2014-07-06. Retrieved 2011-01-24.
  41. US patent application 20070297624 Digital audio encoding
  42. "ISO/IEC 13818-7, Third edition, Part 7 - Advanced Audio Coding (AAC)" (PDF). ISO. 15 October 2004. p. 32. Archived from the original (PDF) on 13 July 2011. Retrieved 2009-10-19.
  43. Grill, Bernhard; Geyersberger, Stefan; Hilpert, Johannes; Teichmann, Bodo (July 2004). Implementation of MPEG-4 Audio Components on various Platforms (PDF). 109th AES Convention 2000 September 22–25 Los Angeles. Fraunhofer Gesellschaft. Archived from the original (PDF) on 2007-06-10. Retrieved 2009-10-09.
  44. "ISO/IEC 14496-3:2009/Amd 3:2012 - Transport of unified speech and audio coding (USAC)". ISO. Archived from the original on 2016-03-08. Retrieved 2016-08-03.
  45. "ISO/IEC 14496-3:2009 - Information technology -- Coding of audio-visual objects -- Part 3: Audio". ISO. Archived from the original on 2016-05-20. Retrieved 2016-08-02.
  46. "ISO/IEC 14496-3:2009/Amd 3:2012 - Transport of unified speech and audio coding (USAC)". ISO. Archived from the original on 2016-08-19. Retrieved 2016-08-02.
  47. "The AAC-ELD Family for High Quality Communication Services | MPEG". mpeg.chiariglione.org. Archived from the original on 2016-08-20. Retrieved 2016-08-02.
  48. IMS Profile for High Definition Video Conference (HDVC) Service (PDF). GSMA. 24 May 2016. p. 10. Archived (PDF) from the original on 18 August 2016.
  49. "AAC Licensing FAQ Q5". Via Licensing. Retrieved 2020-01-15.
  50. "AAC License Fees". Via Licensing. Retrieved 2020-01-15.
  51. Thom, D.; Purnhagen, H. (October 1998). "MPEG Audio FAQ Version 9 - MPEG-4". chiariglione.org. MPEG Audio Subgroup. Archived from the original on 2010-02-14. Retrieved 2009-10-06.
  52. "ISO/IEC 14496-3:2019". ISO (in English). Retrieved 2022-02-19.
  53. 53.0 53.1 53.2 53.3 Wolters, Martin; Kjorling, Kristofer; Homm, Daniel; Purnhagen, Heiko. A closer look into MPEG-4 High Efficiency AAC (PDF). p. 3. Archived from the original (PDF) on 2003-12-19. Retrieved 2008-07-31. Presented at the 115th Convention of the Audio Engineering Society, 10–13 October 2003.
  54. "Advanced Audio Coding (MPEG-2), Audio Data Interchange Format". Library of Congress / National Digital Information Infrastructure and Preservation Program. 7 March 2007. Archived from the original on 30 July 2008. Retrieved 2008-07-31.
  55. ETSI TS 101 154 v1.5.1: Specification for the use of Video and Audio Coding in Broadcasting Applications based on the MPEG transport stream
  56. Cohen, Peter (2010-05-27). "iTunes Store goes DRM-free". Macworld. Mac Publishing. Archived from the original on 18 February 2009. Retrieved 2009-02-10.
  57. "Apple AAC". Hydrogenaudio. Archived from the original on 2021-11-23. Retrieved 2021-11-22.
  58. "Gingerbread - Android Developers". Android Developers. Archived from the original on 29 December 2017. Retrieved 8 May 2018.
  59. "Supported media formats - Android Developers". Android Developers. Archived from the original on 11 March 2012. Retrieved 8 May 2018.
  60. "Palm Pre Phone / Features, Details". Palm USA. Archived from the original on 2011-05-24.
  61. "Nintendo - Customer Service - Wii - Photo Channel". nintendo.com. Archived from the original on 5 May 2017. Retrieved 8 May 2018.
  62. "Supported Media for Google Cast". Archived from the original on 2015-09-23. Retrieved 2015-09-22. | Supported Media for Google Cast
  63. "Statistics - Adobe Flash runtimes". www.adobe.com. Archived from the original on 2 October 2011. Retrieved 8 May 2018.
  64. "Adobe Delivers Flash Player 9 with H.264 Video Support". Adobe press release. 2007-12-04. Archived from the original on 2014-08-21. Retrieved 2014-08-20.
  65. "Xbox.com | System Use - Use an Apple iPod with Xbox 360". Archived from the original on April 8, 2007.
  66. "Nero Platinum 2018 Suite - Award-winning all-rounder". Nero AG. Archived from the original on 14 December 2012. Retrieved 8 May 2018.
  67. "FAAC". AudioCoding.com. Archived from the original on 2009-12-11. Retrieved 2009-11-03.
  68. "FAAD2". AudioCoding.com. Archived from the original on 2009-12-11. Retrieved 2009-11-03.
  69. "December 5th, 2015, The native FFmpeg AAC encoder is now stable!". ffmpeg.org. Archived from the original on 16 July 2016. Retrieved 26 June 2016.
  70. "FFmpeg AAC Encoding Guide". Archived from the original on 17 April 2016. Retrieved 11 April 2016. Which encoder provides the best quality? ... the likely answer is: libfdk_aac
  71. "Libav Wiki - Encoding AAC". Archived from the original on 2016-04-20. Retrieved 11 April 2016.


बाहरी कड़ियाँ

Lua error in Module:Navboxes at line 53: attempt to call local 'p' (a table value).

Lua error in Module:Navboxes at line 53: attempt to call local 'p' (a table value).