डेटा संपीड़न

From Vigyanwiki

सूचना सिद्धांत में, डेटा संपीडन, स्रोत कूटलेखन,[1]या काटा -दर में कमी मूल प्रतिनिधित्व की तुलना में कम बिट्स का उपयोग करके जानकारी कूटलेखन की प्रक्रिया है।[2]कोई विशेष संपीडन या तो हानिपूर्ण संपीडन या हासहीन संपीडन है। हासहीन संपीडन अतिरेक (सूचना सिद्धांत) की पहचान और समाप्त करके बिट्स को कम करता है। हासहीन संपीडन में कोई जानकारी नहीं खो जाती है। हासहीन संपीडन अनावश्यक या कम महत्वपूर्ण जानकारी को हटाकर बिट्स को कम कर देता है।[3]सामान्यतः, एक उपकरण जो डेटा संपीडन करता है, उसे कूटलेखक के रूप में संदर्भित किया जाता है, और एक जो प्रक्रिया के उलट को एक कूटवाचक के रूप में करता है।

डेटा फ़ाइल के आकार को कम करने की प्रक्रिया को प्रायः डेटा संपीडन के रूप में संदर्भित किया जाता है।डेटा ट्रांसमिशन के संदर्भ में, इसे स्रोत कूटलेखन कहा जाता है;संग्रहीत या प्रेषित होने से पहले डेटा के स्रोत पर किए गए कूटलेखन।[4]स्रोत कूटलेखन को चैनल कोडन के साथ भ्रमित नहीं किया जाना चाहिए, त्रुटि का पता लगाने और सुधार या लाइन कूटलेखन के लिए, संकेत पर डेटा को मैप करने के लिए साधन।

संपीडन उपयोगी है क्योंकि यह डेटा को स्टोर करने और प्रसारित करने के लिए आवश्यक संसाधनों को कम करता है।कम्प्यूटेशनल संसाधन ों को संपीडन और अपघटन प्रक्रियाओं में खाया जाता है। डेटा संपीडन एक दिक्काल ट्रेडऑफ के अधीन है। दिक्काल जटिलता व्यापार बंद।उदाहरण के लिए, #Video को वीडियो के लिए महंगे इलेक्ट्रॉनिक हार्डवेयर की आवश्यकता हो सकती है, जिसे देखने के लिए तेजी से विघटित किया जा सकता है क्योंकि इसे विघटित किया जा रहा है, और यह देखने से पहले वीडियो को पूर्णतया से विघटित करने का विकल्प असुविधाजनक हो सकता है या अतिरिक्त भंडारण की आवश्यकता हो सकती है। डेटा संपीडन योजनाओं के डिजाइन में विभिन्न कारकों के मध्य व्यापार-बंद सम्मिलित हैं, जिनमें संपीडन की डिग्री, प्रारंभ की गई विकृति की मात्रा (हानि डेटा संपीडन का उपयोग करते समय), और डेटा को संपीड़ित और विघटित करने के लिए आवश्यक कम्प्यूटेशनल संसाधनों सहित सम्मिलित हैं[5]


हासहीन

हासहीन डेटा संपीडन कलन विधि सामान्यतः किसी भी आत्म-सूचना को खोने के बिना डेटा का प्रतिनिधित्व करने के लिए अतिरेक (सूचना सिद्धांत) का शोषण करते हैं, ताकि प्रक्रिया प्रतिवर्ती हो।हासहीन संपीडन संभव है क्योंकि अधिकांश वास्तविक दुनिया डेटा सांख्यिकीय अतिरेक प्रदर्शित करता है।उदाहरण के लिए, एक छवि में रंग के क्षेत्र हो सकते हैं जो कई पिक्सेल में नहीं बदलते हैं;लाल पिक्सेल, लाल पिक्सेल को कोड करने के बजाय, ... डेटा को 279 लाल पिक्सेल के रूप में एन्कोड किया जा सकता है।यह रन-लंबाई कूटलेखन का एक मूल उदाहरण है;अतिरेक को समाप्त करके फ़ाइल के आकार को कम करने के लिए कई योजनाएं हैं।

Lempel -Ziv (LZ) संपीडन विधियाँ हासहीन भंडारण के लिए सबसे लोकप्रिय कलनविधि में से हैं।[6] Deflate Decompression गति और संपीडन अनुपात के लिए अनुकूलित LZ पर एक भिन्नता है, लेकिन संपीडन धीमा हो सकता है।1980 के दशक के मध्य में, टेरी वेल्च के काम के बाद, लेम्पेल-ज़िव-वेल्च (एलजेडडब्ल्यू) कलनविधि तेजी से अधिकांश सामान्य-उद्देश्य संपीडन प्रणालियों के लिए पसंद की विधि बन गया।LZW का उपयोग ग्राफिक्स बदलाव प्रारूप छवियों, PKZIP जैसे प्रोग्राम और मोडेम जैसे हार्डवेयर डिवाइस में किया जाता है।[7] LZ विधियाँ एक तालिका-आधारित संपीडन मॉडल का उपयोग करती हैं जहां तालिका प्रविष्टियों को डेटा के बार-बार तार के लिए प्रतिस्थापित किया जाता है।अधिकांश LZ विधियों के लिए, यह तालिका इनपुट में पहले के डेटा से गतिशील रूप से उत्पन्न होती है।तालिका ही प्रायः हफ़मैन कूटलेखन होती है।इस तरह के व्याकरण-आधारित कोड अत्यधिक दोहरावदार इनपुट को बहुत प्रभावी ढंग से संपीड़ित कर सकते हैं, उदाहरण के लिए, समान या निकट से संबंधित प्रजातियों का एक जैविक डेटा संग्रह, एक विशाल संस्करण संग्रह संग्रह, इंटरनेट अभिलेखीय, आदि। व्याकरण-आधारित कोड का मूल कार्य निर्माण कर रहा हैएक संदर्भ-मुक्त व्याकरण एक एकल श्रृंखला प्राप्त करता है।अन्य व्यावहारिक व्याकरण संपीडन कलनविधि में अनुक्रमिक कलनविधि और फिर से जोड़ी सम्मिलित हैं।

सबसे प्रबल आधुनिक हासहीन कंप्रेशर्स यादृच्छिक कलनविधि मॉडल का उपयोग करते हैं, जैसे कि आंशिक मिलान द्वारा भविष्यवाणी ।बरोज़ -व्हीलर ट्रांसफॉर्म को सांख्यिकीय मॉडलिंग के अप्रत्यक्ष रूप के रूप में भी देखा जा सकता है।[8]संभाव्य मॉडल िंग के प्रत्यक्ष उपयोग के एक और शोधन में, सांख्यिकीय अनुमानों को अंकगणित कूटलेखन नामक एक कलनविधि के लिए युग्मित किया जा सकता है। अंकगणित कूटलेखन एक अधिक आधुनिक कूटलेखन तकनीक है जो इनपुट डेटा प्रतीकों की एक श्रृंखला से एन्कोडेड बिट्स की एक श्रृंखला का उत्पादन करने के लिए एक परिमित-राज्य मशीन की गणितीय गणना का उपयोग करती है। यह अन्य तकनीकों जैसे कि बेहतर-ज्ञात हफमैन कलनविधि की तुलना में बेहतर संपीडन प्राप्त कर सकता है। यह एक आंतरिक मेमोरी स्टेट का उपयोग करता है, जो अलग-अलग प्रतिनिधित्व के लिए व्यक्तिगत इनपुट प्रतीकों के एक-से-एक मैपिंग करने की आवश्यकता से बचता है जो बिट्स की एक पूर्णांक संख्या का उपयोग करते हैं, और यह डेटा प्रतीकों के पूरे श्रृंखला को कूटलेखन के बाद ही आंतरिक मेमोरी को साफ करता है । अंकगणित कूटलेखन विशेष रूप से अनुकूली डेटा संपीडन कार्यों पर अनुप्रयुक्त होती है जहां आँकड़े भिन्न होते हैं और संदर्भ-निर्भर होते हैं, क्योंकि इसे सरलता से इनपुट डेटा के संभाव्यता वितरण के एक अनुकूली मॉडल के साथ मिलाया जा सकता है। अंकगणित कूटलेखन के उपयोग का एक प्रारंभिक उदाहरण JPEG छवि कूटलेखन मानक के एक वैकल्पिक (लेकिन व्यापक रूप से उपयोग नहीं किया गया) सुविधा में था।[9]यह तब से विभिन्न अन्य डिजाइनों में अनुप्रयुक्त किया गया है जिसमें वीडियो कूटलेखन के लिए H.263, H.264/MPEG-4 AVC और HEVC सम्मिलित हैं।[10]

आर्काइव सॉफ्टवेयर में सामान्यतः शब्दकोश आकार को समायोजित करने की क्षमता होती है, जहां एक बड़ा आकार संपीडन और विघटन के पर्यन्त अधिक यादृच्छिक एक्सेस मेमोरी की मांग करता है, लेकिन प्रबल को संपीड़ित करता है, विशेष रूप से फ़ाइलों की सामग्री में पैटर्न को दोहराने पर।[11][12]


हानि

1980 के दशक के उत्तरार्ध में, डिजिटल छवियां अधिक सामान्य हो गईं, और हासहीन छवि संपीडन के लिए मानक उभरे।1990 के दशक की शुरुआत में, हानिपूर्ण संपीडन विधियों का व्यापक रूप से उपयोग किया जाने लगा।[13]इन योजनाओं में, जानकारी के कुछ नुकसान को स्वीकार किया जाता है क्योंकि गैर -विस्तार को छोड़ने से भंडारण स्थान को बचा सकता है।जानकारी को संरक्षित करने और आकार को कम करने के मध्य एक समान व्यापार बंद है।हानि डेटा संपीडन योजनाओं को शोध द्वारा डिज़ाइन किया गया है कि लोग प्रश्न में डेटा को कैसे देखते हैं।उदाहरण के लिए, मानव आंख रंग में भिन्नता की तुलना में luminance में सूक्ष्म विविधताओं के लिए अधिक संवेदनशील है।JPEG छवि संपीडन सूचना के गैर -बिट्स को गोल करके भाग में काम करता है।[14] कई लोकप्रिय संपीडन प्रारूप इन अवधारणात्मक अंतरों का फायदा उठाते हैं, जिसमें ध्वनि के लिए मनो विश्लेषण, और छवियों और वीडियो के लिए मनोचिकित्सा सम्मिलित हैं।

हानिपूर्ण संपीडन के अधिकांश रूप ट्रांसफ़ॉर्म कूटलेखन पर आधारित होते हैं, विशेष रूप से असतत कोसाइन परिवर्तन (डीसीटी)।यह पहली बार 1972 में एन। अहमद द्वारा प्रस्तावित किया गया था, जिन्होंने जनवरी 1974 में इसे प्रारंभ करने से पहले 1973 में टी। नटराजन और के। आर। राव के साथ एक कामकाजी कलनविधि विकसित किया था।[15][16]DCT सबसे व्यापक रूप से उपयोग किया जाने वाला हासहीन संपीडन विधि है, और इसका उपयोग छवि संपीडन (जैसे JPEG और HEIF ) के लिए मल्टीमीडिया प्रारूपों में किया जाता है,[17]वीडियो संपीडन (जैसे कि MPEG , H.264/AVC और HEVC) और श्रव्य (जैसे MP3 , उन्नत श्रव्य कूटलेखन और VORBIS)।

भंडारण क्षमता बढ़ाने के लिए, डिजिटल कैमरा में हानिपूर्ण छवि संपीडन का उपयोग किया जाता है।इसी तरह, डीवीडी , ब्लू-राई और स्ट्रीमिंग वीडियो हानि वीडियो कूटलेखन प्रारूपों का उपयोग करते हैं।वीडियो में बड़े पैमाने पर संपीडन का बड़े पैमाने पर उपयोग किया जाता है।

हानिपूर्ण श्रव्य संपीडन में, श्रव्य संकेत के गैर-ऑडिबल (या कम श्रव्य) घटकों को हटाने के लिए मनोविश्लेषण के तरीकों का उपयोग किया जाता है।मानव भाषण का संपीडन प्रायः और भी अधिक विशिष्ट तकनीकों के साथ किया जाता है;स्पीच कूटलेखन को सामान्य-उद्देश्य श्रव्य संपीडन से एक अलग अनुशासन के रूप में प्रतिष्ठित किया जाता है।स्पीच कूटलेखन का उपयोग इंटरनेट टेलीफ़ोनी में किया जाता है, उदाहरण के लिए, श्रव्य संपीडन का उपयोग सीडी रिपिंग के लिए किया जाता है और इसे श्रव्य खिलाड़ियों द्वारा डिकोड किया जाता है।[8]

हानिपूर्ण संपीडन से पीढ़ी के नुकसान का कारण बन सकता है।

सिद्धांत

संपीडन के लिए सैद्धांतिक आधार सूचना सिद्धांत द्वारा प्रदान किया जाता है और, विशेष रूप से, हासहीन संपीडन के लिए एल्गोरिथम सूचना सिद्धांत और हासहीन संपीडन के लिए दर -विवाद सिद्धांत।अध्ययन के इन क्षेत्रों को अनिवार्य रूप से क्लाउड शैनन द्वारा बनाया गया था, जिन्होंने 1940 के दशक के अंत और 1950 के दशक की शुरुआत में इस विषय पर मौलिक पत्र प्रकाशित किए थे।संपीडन से जुड़े अन्य विषयों में कूटलेखन सिद्धांत और सांख्यिकीय अनुमान सम्मिलित हैं।[18]


यंत्र अधिगम

यंत्र अधिगमऔर संपीडन के मध्य घनिष्ठ संबंध है।एक प्रणाली जो अपने पूरे इतिहास को दिए गए अनुक्रम की पोस्टीरियर संभावनाओं की भविष्यवाणी करती है, इसका उपयोग इष्टतम डेटा संपीडन (आउटपुट वितरण पर अंकगणित कूटलेखन का उपयोग करके) के लिए किया जा सकता है।इसके विपरीत, एक इष्टतम कंप्रेसर का उपयोग भविष्यवाणी के लिए किया जा सकता है (प्रतीक को खोजकर जो पिछले इतिहास को देखते हुए सबसे अच्छा संकुचित करता है)।इस तुल्यता का उपयोग सामान्य बुद्धि के लिए एक बेंचमार्क के रूप में डेटा संपीडन का उपयोग करने के औचित्य के रूप में किया गया है।[19][20][21]

एक वैकल्पिक दृश्य संपीडन कलनविधि को निहित सुविधा समष्टि सदिश में स्पष्ट रूप से मैप स्ट्रिंग्स दिखा सकता है, और संपीडन-आधारित समानता उपाय इन फीचर रिक्त स्थान के भीतर समानता की गणना करते हैं।प्रत्येक कंप्रेसर c (।) के लिए हम एक संबद्ध वेक्टर समष्टि को परिभाषित करते हैं, जैसे कि c (।) एक इनपुट श्रृंखला x को मैप करता है, वेक्टर मानदंड के अनुरूप || ~ x ||सभी संपीडन कलनविधि को अंतर्निहित सुविधा स्थानों की एक विस्तृत परीक्षा समष्टि द्वारा रोक दी गई है;इसके बजाय, फीचर सदिश तीन प्रतिनिधि हासहीन संपीडन विधियों, LZW, LZ77 और PPM की जांच करने के लिए चुनता है।[22]

Aixi थ्योरी के अनुसार, हटर पुरस्कार में सीधे एक कनेक्शन अधिक समझाया गया है, इस तरह का सबसे अच्छा संभव संपीडन सबसे छोटा संभव सॉफ्टवेयर है जो एक्स उत्पन्न करता है।उदाहरण के लिए, उस मॉडल में, एक ज़िप फ़ाइल के संपीड़ित आकार में ज़िप फ़ाइल और अनजिंग सॉफ्टवेयर दोनों सम्मिलित हैं, क्योंकि आप इसे दोनों के बिना अनजान नहीं कर सकते हैं, लेकिन एक भी छोटा संयुक्त रूप हो सकता है।

डेटा विभेदक

डेटा संपीडन को डेटा भिन्नता के एक विशेष स्थिति के रूप में देखा जा सकता है।[23][24]डेटा डिफरेंसिंग में एक स्रोत और एक लक्ष्य को देखते हुए एक अंतर का उत्पादन होता है, जिसमें एक स्रोत और एक अंतर दिए गए लक्ष्य को पुन: प्रस्तुत करने के साथ।चूंकि डेटा संपीडन में कोई अलग स्रोत और लक्ष्य नहीं है, इसलिए कोई भी डेटा संपीडन को खाली स्रोत डेटा के साथ डेटा विभेदन के रूप में मान सकता है, कुछ भी नहीं से अंतर के अनुरूप संपीड़ित फ़ाइल।यह पूर्ण एन्ट्रापी (सूचना सिद्धांत) (डेटा संपीडन के अनुरूप) पर विचार करने के समान है, जो बिना किसी प्रारंभिक डेटा के सापेक्ष एन्ट्रापी (डेटा भिन्नता के अनुरूप) के एक विशेष स्थिति के रूप में है।

डेटा डिफरेंसिंग कनेक्शन पर जोर देने के लिए टर्म डिफरेंशियल कम्प्रेशन शब्द का उपयोग किया जाता है।

उपयोग

छवि

एन्ट्रॉपी कोडन की उत्पत्ति 1940 के दशक में शैनन -फानो कूटलेखन की शुरूआत के साथ हुई,[25]हफमैन कूटलेखन का आधार जो 1950 में विकसित किया गया था।[26]1960 के दशक के उत्तरार्ध में ट्रांसफॉर्म कूटलेखन की तारीखें, 1968 में फास्ट फूरियर ट्रांसफॉर्म (एफएफटी) कूटलेखन और 1969 में हदामार्ड ट्रांसफॉर्म की शुरूआत के साथ।[27]

एक महत्वपूर्ण छवि संपीडन तकनीक 1970 के दशक की शुरुआत में विकसित की गई एक तकनीक है।[15]DCT JPEG के लिए आधार है, एक हानिपूर्ण संपीडन प्रारूप जो 1992 में संयुक्त फोटोग्राफिक विशेषज्ञों समूह (JPEG) द्वारा प्रस्तुत किया गया था।[28] JPEG छवि गुणवत्ता में अपेक्षाकृत कम कमी की लागत पर एक छवि का प्रतिनिधित्व करने के लिए आवश्यक डेटा की मात्रा को कम करता है और सबसे व्यापक रूप से उपयोग की जाने वाली छवि फ़ाइल प्रारूप बन गया है।[29][30] इसका अत्यधिक कुशल डीसीटी-आधारित संपीडन कलनविधि डिजिटल छवियों और डिजिटल तस्वीरों के व्यापक प्रसार के लिए काफी हद तक जिम्मेदार था।[31] Lempel -Ziv -Welch (LZW) 1984 में विकसित एक हासहीन संपीडन कलनविधि है। इसका उपयोग GIF प्रारूप में किया जाता है, जिसे 1987 में प्रस्तुत किया गया था।[32] 1996 में निर्दिष्ट एक हासहीन संपीडन कलनविधि को हवा निकालना , पोर्टेबल नेटवर्क ग्राफ़िक्स (पीएनजी) प्रारूप में उपयोग किया जाता है।[33] वेवलेट संपीडन, छवि संपीडन में तरंगों का उपयोग, डीसीटी कूटलेखन के विकास के बाद प्रारंभ हुआ।[34]JPEG 2000 मानक 2000 में प्रस्तुत किया गया था।[35] मूल JPEG प्रारूप द्वारा उपयोग किए जाने वाले DCT कलनविधि के विपरीत, JPEG 2000 इसके बजाय असतत तरंग रूपांतरण (DWT) कलनविधि का उपयोग करता है।[36][37][38] JPEG 2000 तकनीक, जिसमें मोशन JPEG 2000 एक्सटेंशन सम्मिलित है, को 2004 में अंकीय सिनेमा के लिए वीडियो कूटलेखन मानक के रूप में चुना गया था।[39]


श्रव्य

श्रव्य डेटा संपीडन, गतिशील रेंज संपीडन के साथ भ्रमित नहीं होने के लिए, ट्रांसमिशन बैंडविड्थ (कम्प्यूटिंग) और श्रव्य डेटा की भंडारण आवश्यकताओं को कम करने की क्षमता है।Codecs#श्रव्य की सूची श्रव्य कोडेक के रूप में सॉफ्टवेयर में अनुप्रयुक्त की जाती है।हानिपूर्ण और हासहीन संपीडन दोनों में, अतिरेक (सूचना सिद्धांत) को कम कर दिया जाता है, कूटलेखन सिद्धांत, परिमाणीकरण (संकेत प्रोसेसिंग), असतत कोसाइन ट्रांसफॉर्म और रैखिक भविष्यवाणी जैसे तरीकों का उपयोग करते हुए, जो कि असम्पीडित डेटा का प्रतिनिधित्व करने के लिए उपयोग की जाने वाली जानकारी की मात्रा को कम करते हैं।

हानि श्रव्य संपीडन कलनविधि उच्च संपीडन प्रदान करते हैं और वोरबिस और एमपी 3 सहित कई श्रव्य अनुप्रयोगों में उपयोग किए जाते हैं।ये कलनविधि लगभग सभी कम श्रव्य ध्वनियों की निष्ठा को खत्म करने या कम करने के लिए मनोविश्लेषण पर भरोसा करते हैं, जिससे उन्हें स्टोर या संचारित करने के लिए आवश्यक स्थान को कम किया जाता है।[2][40] श्रव्य गुणवत्ता और संचरण या भंडारण आकार के नुकसान के मध्य स्वीकार्य व्यापार-बंद आवेदन पर निर्भर करता है।उदाहरण के लिए, एक 640 एमबी कॉम्पैक्ट डिस्क (सीडी) लगभग एक घंटे का असम्पीडित उच्च निष्ठा संगीत, 2 घंटे से कम संगीत संपीड़ित हानिकारक, या 7 घंटे से कम संगीत एमपी 3 प्रारूप में एक मध्यम बिट दर पर संपीड़ित होता है।एक डिजिटल साउंड रिकॉर्डर सामान्यतः 640 एमबी में स्पष्ट रूप से समझदार भाषण के लगभग 200 घंटे स्टोर कर सकता है।[41]

हासहीन श्रव्य संपीडन डिजिटल डेटा का एक प्रतिनिधित्व करता है जिसे मूल के सटीक डिजिटल डुप्लिकेट के लिए डिकोड किया जा सकता है।संपीडन अनुपात मूल आकार के लगभग 50-60% हैं,[42]जो कि जेनेरिक हासहीन डेटा संपीडन के लिए समान है।हासहीन कोडेक संकेत का आकलन करने के लिए एक आधार के रूप में वक्र फिटिंग या रैखिक भविष्यवाणी का उपयोग करते हैं।अनुमान का वर्णन करने वाले पैरामीटर और अनुमान और वास्तविक संकेत के मध्य अंतर को अलग से कोडित किया जाता है।[43]

कई हासहीन श्रव्य संपीडन प्रारूप मौजूद हैं। एक सूची के लिए कोडेक्स#हासहीन संपीडन की सूची देखें। कुछ प्रारूप एक अलग प्रणाली से जुड़े होते हैं, जैसे कि प्रत्यक्ष धारा अंतरण , सुपर श्रव्य सीडी और मेरिडियन हासहीन पैकिंग में उपयोग किया जाता है, जिसका उपयोग DVD श्रव्य , डॉल्बी ट्रूहद , ब्लू-रे और एचडी डीवीडी में किया जाता है।

कुछ श्रव्य फ़ाइल स्वरूपों में एक हानिपूर्ण प्रारूप और एक हासहीन सुधार का संयोजन होता है; यह सुधार को सरलता से एक हानिपूर्ण फ़ाइल प्राप्त करने की अनुमति देता है। इस तरह के प्रारूपों में MPEG-4 SLS (स्केलेबल टू लॉसलेस), WAVPACK और ITTEMFROG ड्यूलस्ट्रीम सम्मिलित हैं।

जब श्रव्य फ़ाइलों को संसाधित किया जाना है, या तो आगे संपीडन द्वारा या श्रव्य संपादन के लिए, यह एक अपरिवर्तित मूल (असम्पीडित या हासहीन रूप से संपीड़ित) से काम करने के लिए वांछनीय है। किसी उद्देश्य के लिए एक हानिकारक संपीड़ित फ़ाइल का प्रसंस्करण सामान्यतः एक असम्पीडित मूल से एक ही संपीड़ित फ़ाइल के निर्माण के लिए एक अंतिम परिणाम हीन होता है। ध्वनि संपादन या मिश्रण के अतिरिक्त, हासहीन श्रव्य संपीडन का उपयोग प्रायः अभिलेखीय भंडारण के लिए, या मास्टर प्रतियों के रूप में किया जाता है।

हानि श्रव्य संपीडन

एक असम्पीडित प्रारूप और कई हानिपूर्ण प्रारूपों में श्रव्य के स्पेक्ट्रोग्राम की तुलना।हानिपूर्ण स्पेक्ट्रोग्राम उच्च आवृत्तियों के Busylimit दिखाते हैं, जो एक सामान्य तकनीक है जो हानिपूर्ण श्रव्य संपीडन से जुड़ी है।

हानि श्रव्य संपीडन का उपयोग अनुप्रयोगों की एक विस्तृत श्रृंखला में किया जाता है।एमपी 3 खिलाड़ियों या कंप्यूटरों में फाइल प्लेबैक के केवल स्टैंडअलोन श्रव्य-केवल एप्लिकेशन के अतिरिक्त, डिजिटल रूप से संपीड़ित श्रव्य स्ट्रीम का उपयोग अधिकांश वीडियो डीवीडी, डिजिटल टेलीविजन, इंटरनेट पर स्ट्रीमिंग मीडिया, सैटेलाइट और केबल रेडियो में किया जाता है, और टेरस्ट्रियल रेडियो प्रसारण में तेजी से होता है।हानिपूर्ण संपीडन सामान्यतः मनो विश्लेषण अनुकूलन के आधार पर कम-आलोचनात्मक डेटा को छोड़कर, हासहीन संपीडन की तुलना में कहीं अधिक संपीडन प्राप्त करता है।[44]

मनोविश्लेषक मानता है कि श्रव्य स्ट्रीम में सभी डेटा मानव श्रवण प्रणाली द्वारा नहीं माना जा सकता है।अधिकांश हानिपूर्ण संपीडन पहले अवधारणात्मक रूप से अप्रासंगिक ध्वनियों की पहचान करके अतिरेक को कम कर देता है, अर्थात लगता है कि सुनने में बहुत मुश्किल है।विशिष्ट उदाहरणों में उच्च आवृत्तियों या ध्वनियों को सम्मिलित किया जाता है जो एक ही समय में लाउड साउंड्स के रूप में होते हैं।उन अप्रासंगिक ध्वनियों को कम सटीकता के साथ कोडित किया जाता है या बिल्कुल नहीं।

हानिपूर्ण कलनविधि की प्रकृति के कारण, श्रव्य गुणवत्ता एक डिजिटल पीढ़ी के नुकसान का सामना करती है जब एक फ़ाइल को विघटित और पुन: व्यवस्थित किया जाता है।यह पेशेवर श्रव्य इंजीनियरिंग अनुप्रयोगों में मध्यवर्ती परिणामों को संग्रहीत करने के लिए हानिकारक संपीडन को अनुपयुक्त बनाता है, जैसे कि साउंड एडिटिंग और मल्टीट्रैक रिकॉर्डिंग।हालांकि, एमपी 3 जैसे हानिपूर्ण प्रारूप अंत-उपयोगकर्ताओं के साथ बहुत लोकप्रिय हैं क्योंकि फ़ाइल का आकार मूल आकार के 5-20% तक कम हो जाता है और एक मेगाबाइट पर्याप्त गुणवत्ता पर एक मिनट के संगीत के बारे में एक मिनट के लायक हो सकता है।

कूटलेखन विधियाँ

यह निर्धारित करने के लिए कि एक श्रव्य संकेत में क्या जानकारी अवधारणात्मक रूप से अप्रासंगिक है, अधिकांश हासहीन संपीडन कलनविधि परिवर्तन का उपयोग करते हैं जैसे कि संशोधित असतत कोसाइन ट्रांसफॉर्म (MDCT) समय कार्यक्षेत्र नमूना तरंगों को एक ट्रांसफ़ॉर्म कार्यक्षेत्र में परिवर्तित करने के लिए, सामान्यतः आवृत्ति कार्यक्षेत्र में।एक बार रूपांतरित होने के बाद, घटक आवृत्तियों को प्राथमिकता दी जा सकती है कि वे कितने श्रव्य हैं।वर्णक्रमीय घटकों की ऑडिबिलिटी का मूल्यांकन सुनने की पूर्ण सीमा और एक साथ मास्किंग के सिद्धांतों का उपयोग करके किया जाता है - घटना जिसमें एक संकेत आवृत्ति द्वारा अलग किए गए एक अन्य संकेत द्वारा मास्क किया जाता है - और, कुछ स्थितियों में, टेम्पोरल मास्किंग -जहां एक संकेत एक अन्य संकेत द्वारा मास्क किया जाता है।समय के साथ अलग हो गया।घटकों के अवधारणात्मक महत्व को तौलने के लिए समान-लाउडनेस आकृति का भी उपयोग किया जा सकता है।इस तरह के प्रभावों को सम्मिलित करने वाले मानव कान-मस्तिष्क संयोजन के मॉडल को प्रायः मनोविश्लेषण मॉडल कहा जाता है।[45]

अन्य प्रकार के हानिपूर्ण कंप्रेशर्स, जैसे कि रैखिक भविष्य कहनेवाला कूटलेखन (एलपीसी) का उपयोग भाषण के साथ किया जाता है, स्रोत-आधारित कोडर्स हैं।एलपीसी भाषण ध्वनियों का विश्लेषण करने के लिए मानव मुखर पथ के एक मॉडल का उपयोग करता है और मॉडल द्वारा उपयोग किए जाने वाले मापदंडों का अनुमान लगाता है ताकि उन्हें पल -पल का उत्पादन किया जा सके।ये बदलते मापदंडों को प्रेषित या संग्रहीत किया जाता है और कूटवाचक में एक और मॉडल को चलाने के लिए उपयोग किया जाता है जो ध्वनि को पुन: प्रस्तुत करता है।

घातक प्रारूपों का उपयोग प्रायः स्ट्रीमिंग श्रव्य या इंटरैक्टिव संचार (जैसे सेल फोन नेटवर्क में) के वितरण के लिए किया जाता है।ऐसे अनुप्रयोगों में, डेटा प्रवाह के रूप में डेटा को विघटित किया जाना चाहिए, बजाय इसके कि पूरे डेटा स्ट्रीम को प्रेषित किया गया है।सभी श्रव्य कोडेक का उपयोग स्ट्रीमिंग अनुप्रयोगों के लिए नहीं किया जा सकता है।[44]

विलंबता (इंजीनियरिंग) को डेटा को एनकोड और डिकोड करने के लिए उपयोग किए जाने वाले तरीकों से प्रस्तुत किया जाता है। कुछ कोडेक एक लंबे खंड का विश्लेषण करेंगे, जो दक्षता का अनुकूलन करने के लिए डेटा का एक फ्रेम कहा जाता है, और फिर इसे इस तरह से कोडित करेगा कि डिकोड करने के लिए एक समय में डेटा के एक बड़े सेगमेंट की आवश्यकता होती है। कूटलेखन कलनविधि की अंतर्निहित विलंबता महत्वपूर्ण हो सकती है; उदाहरण के लिए, जब डेटा का दो-तरफ़ा ट्रांसमिशन होता है, जैसे कि टेलीफोन बातचीत के साथ, महत्वपूर्ण देरी कथित गुणवत्ता को गंभीरता से कम कर सकती है।

संपीडन की गति के विपरीत, जो कलनविधि द्वारा आवश्यक संचालन की संख्या के लिए आनुपातिक है, यहां विलंबता उन नमूनों की संख्या को संदर्भित करती है, जिन्हें श्रव्य के एक खंड से पहले विश्लेषण किया जाना चाहिए। न्यूनतम स्थिति में, विलंबता शून्य नमूने है (जैसे, यदि कोडर/कूटवाचक संकेत को मात्राबद्ध करने के लिए उपयोग किए जाने वाले बिट्स की संख्या को कम कर देता है)। एलपीसी जैसे समय कार्यक्षेत्र कलनविधि में भी प्रायः कम विलंबता होती है, इसलिए टेलीफोनी के लिए भाषण कूटलेखन में उनकी लोकप्रियता। एमपी 3 जैसे कलनविधि में, हालांकि, आवृत्ति कार्यक्षेत्र में एक मनोविश्लेषण मॉडल को अनुप्रयुक्त करने के लिए बड़ी संख्या में नमूनों का विश्लेषण किया जाना चाहिए, और विलंबता 23 & nbsp; एमएस के आदेश पर है।

भाषण कूटलेखन

भाषण कूटलेखन श्रव्य डेटा संपीडन की एक महत्वपूर्ण श्रेणी है।अवधारणात्मक मॉडल यह अनुमान लगाने के लिए उपयोग किए जाते हैं कि एक मानव कान के भाषण के कौन से पहलू सुन सकते हैं, सामान्यतः संगीत के लिए उपयोग किए जाने वाले लोगों से कुछ अलग हैं।मानवीय आवाज की आवाज़ों को व्यक्त करने के लिए आवश्यक आवृत्तियों की सीमा सामान्य रूप से संगीत के लिए आवश्यक की तुलना में बहुत अधिक संकीर्ण है, और ध्वनि सामान्य रूप से कम जटिल है।नतीजतन, भाषण को अपेक्षाकृत कम बिट दर का उपयोग करके उच्च गुणवत्ता पर एन्कोड किया जा सकता है।

यह सामान्य रूप से, दो दृष्टिकोणों के कुछ संयोजन द्वारा पूरा किया जाता है:

  • केवल कूटलेखन ध्वनियों को एक ही मानवीय आवाज द्वारा बनाया जा सकता है।
  • संकेत में डेटा को और अधिक फेंकना - मानव सुनवाई (सेंस) की पूर्ण आवृत्ति रेंज के बजाय एक समझदार आवाज को फिर से बनाने के लिए पर्याप्त है।

भाषण कूटलेखन (और सामान्य रूप से श्रव्य डेटा संपीडन) में उपयोग किए जाने वाले शुरुआती कलनविधि ए-लॉ कलनविधि और μ- कानून कलनविधि थे।

इतिहास

Solidyne 922: दुनिया का पहला वाणिज्यिक श्रव्य बिट संपीडन साउंड कार्ड पीसी के लिए, 1990

बेल लैब्स में प्रारंभिक श्रव्य अनुसंधान आयोजित किया गया था।वहां, 1950 में, सी। चैपिन कटलर ने विभेदक पल्स-कोड मॉड्यूलेशन (DPCM) पर पेटेंट दायर किया।[46]1973 में, अनुकूली DPCM (एडीपीसीएम) को पी। कमिसकी, निकिल जयंत | निकिल एस। जयंत और जेम्स एल। फ्लैगन द्वारा प्रस्तुत किया गया था।[47][48] रेखीय कूटलेखन संपीडन के लिए सबसे पहले, रेखीय भविष्य कहनेवाला कूटलेखन (एलपीसी) के साथ अवधारणात्मक कूटलेखन का उपयोग किया गया था।[49] एलपीसी के लिए प्रारंभिक अवधारणाएं 1966 में फुमितादा इताकुरा (नागोया विश्वविद्यालय ) और शुजो सैटो (निप्पॉन टेलीग्राफ और टेलीफोन ) के काम के लिए वापस आ गईं।[50] 1970 के दशक के पर्यन्त, बेल लैब्स में बिशनू एस। अटल और मैनफ्रेड आर। श्रोएडर ने एलपीसी का एक रूप विकसित किया, जिसे अनुकूली भविष्य कहनेवाला कूटलेखन (एपीसी) कहा जाता था, एक अवधारणात्मक कूटलेखन कलनविधि जिसने मानव कान के मास्किंग गुणों का शोषण किया, 1980 के दशक की शुरुआत में 1980 के दशक में इसके बाद के साथ किया।कोड-उत्तेजित रैखिक भविष्यवाणी (CELP) कलनविधि जिसने अपने समय के लिए एक महत्वपूर्ण संपीडन अनुपात प्राप्त किया।[49]अवधारणात्मक कूटलेखन का उपयोग आधुनिक श्रव्य संपीडन प्रारूपों जैसे एमपी 3 द्वारा किया जाता है[49]और उन्नत श्रव्य कोडेक

1974 में एन। अहमद, टी। नटराजन और के। आर। राव द्वारा विकसित असतत कोसाइन ट्रांसफॉर्म (डीसीटी),[16]आधुनिक श्रव्य संपीडन प्रारूपों जैसे एमपी 3 द्वारा उपयोग किए जाने वाले संशोधित असतत कोसाइन ट्रांसफॉर्म (एमडीसीटी) के लिए आधार प्रदान किया गया,[51] डॉल्बी डिजिटल ,[52][53] और एएसी।[54] एमडीसीटी को जे। पी। प्रिंसेन, ए। डब्ल्यू। जॉनसन और ए। बी। ब्रैडली ने 1987 में प्रस्तावित किया था,[55] 1986 में प्रिंसन और ब्रैडली द्वारा पहले के काम के बाद।[56] दुनिया का पहला वाणिज्यिक प्रसारण स्वचालन श्रव्य संपीडन प्रणाली ऑस्कर बोनेलो द्वारा विकसित की गई थी, जो ब्यूनस आयर्स विश्वविद्यालय में एक इंजीनियरिंग प्रोफेसर है।[57][failed verification] 1983 में, 1967 में पहली बार प्रकाशित क्रिटिकल बैंड के मास्किंग के मनोचिकित्सा सिद्धांत का उपयोग करते हुए,[58]उन्होंने हाल ही में विकसित आईबीएम पीसी कंप्यूटर के आधार पर एक व्यावहारिक अनुप्रयोग विकसित करना प्रारंभ कर दिया, और प्रसारण स्वचालन प्रणाली को 1987 में ऑडिकॉम के नाम से लॉन्च किया गया था।बीस साल बाद, दुनिया के लगभग सभी रेडियो स्टेशन कई कंपनियों द्वारा निर्मित समान तकनीक का उपयोग कर रहे थे।

श्रव्य कूटलेखन सिस्टम की एक बड़ी विविधता के लिए एक साहित्य संकलन, फरवरी 1988 में IEEE's जर्नल ऑन चयने्टेड एरियाज इन कम्युनिकेशंस (JSAC) में प्रकाशित किया गया था। जबकि उस समय से पहले से कुछ पेपर थे, इस संग्रह ने पूर्णतया से समाप्त कर दिया, काम कर रहे थे, काम कर रहे थे, काम कर रहे थे।श्रव्य कोडर्स, उनमें से लगभग सभी अवधारणात्मक तकनीकों और कुछ प्रकार के आवृत्ति विश्लेषण और बैक-एंड नीरव कूटलेखन का उपयोग करते हैं।[59]


वीडियो

असम्पीडित वीडियो के लिए एक बहुत ही उच्चतर वीडियो#स्टोरेज और डेटा दरों को असम्पीडित वीडियो के लिए आवश्यकता होती है।यद्यपि CODECS की सूची#हासहीन वीडियो संपीडन कोडेक्स 5 से 12 के एक संपीडन कारक पर प्रदर्शन करते हैं, एक विशिष्ट H.264/MPEG-4 AVC | H.264 हासहीन संपीडन वीडियो में 20 और 200 के मध्य एक संपीडन कारक है।[60]

वीडियो कूटलेखन मानकों में उपयोग की जाने वाली दो प्रमुख वीडियो संपीडन तकनीक असतत कोसाइन ट्रांसफॉर्म (डीसीटी) और मोशन मुआवजा (एमसी) हैं।अधिकांश वीडियो कूटलेखन मानक, जैसे कि H.26X और MPEG प्रारूप, सामान्यतः गति-मुआवजा DCT वीडियो कूटलेखन (खंड मोशन मुआवजा) का उपयोग करते हैं।[61][62] अधिकांश वीडियो कोडक का उपयोग श्रव्य संपीडन तकनीकों के साथ किया जाता है, जो तथाकथित डिजिटल कंटेनर प्रारूपों का उपयोग करके एक संयुक्त पैकेज के रूप में अलग लेकिन पूरक डेटा स्ट्रीम को संग्रहीत करने के लिए होता है।[63]


कूटलेखन सिद्धांत

वीडियो डेटा को अभी भी छवि फ्रेम की एक श्रृंखला के रूप में दर्शाया जा सकता है।इस तरह के डेटा में सामान्यतः प्रचुर मात्रा में स्थानिक और लौकिक अतिरेक (सूचना सिद्धांत) होता है।वीडियो संपीडन कलनविधि अतिरेक को कम करने और जानकारी को अधिक कॉम्पैक्ट रूप से संग्रहीत करने का प्रयास करता है।

अधिकांश वीडियो संपीडन प्रारूप और वीडियो कोडेक दोनों स्थानिक और अस्थायी अतिरेक दोनों का शोषण करते हैं (उदाहरण के लिए गति मुआवजे के साथ अंतर कूटलेखन के माध्यम से)।समानताएं केवल उदा।अस्थायी रूप से आसन्न फ्रेम (इंटर-फ्रेम कूटलेखन) या स्थानिक रूप से आसन्न पिक्सेल ( इंट्रा फ्रेम कूटलेखन )।अंतर -फ्रेम | इंटर-फ्रेम संपीडन (एक टेम्पोरल डेल्टा कूटलेखन ) (आरई) वर्तमान फ्रेम का वर्णन करने के लिए एक अनुक्रम में एक या उससे पहले या बाद के फ्रेम से डेटा का उपयोग करता है।दूसरी ओर, इंट्रा-फ्रेम कूटलेखन, वर्तमान फ्रेम के भीतर से केवल डेटा का उपयोग करता है, प्रभावी रूप से अभी भी-छवि संपीडन है।[45]

वीडियो कूटलेखन प्रारूप#इंट्रा-फ्रेम वीडियो कूटलेखन प्रारूप | इंट्रा-फ्रेम वीडियो कूटलेखन प्रारूप कैमकॉर्डर्स और वीडियो एडिटिंग में उपयोग किए जाने वाले सरल संपीडन को नियोजित करते हैं जो केवल इंट्रा-फ्रेम भविष्यवाणी का उपयोग करता है।यह वीडियो एडिटिंग सॉफ्टवेयर को सरल बनाता है, क्योंकि यह एक ऐसी स्थिति को रोकता है जिसमें एक संपीड़ित फ्रेम डेटा को संदर्भित करता है जिसे संपादक ने हटा दिया है।

सामान्यतः, वीडियो संपीडन अतिरिक्त रूप से परिमाणीकरण (छवि प्रसंस्करण) जैसी हानिपूर्ण संपीडन तकनीकों को नियोजित करता है जो स्रोत डेटा के पहलुओं को कम करता है जो मानव दृष्टि की अवधारणात्मक विशेषताओं का शोषण करके मानव दृश्य धारणा के लिए (अधिक या कम) अप्रासंगिक हैं।उदाहरण के लिए, रंग में छोटे अंतर चमक में परिवर्तन की तुलना में अधिक कठिन होते हैं।संपीडन कलनविधि जेपीईजी छवि संपीडन में उपयोग किए जाने वाले लोगों के समान इन समान क्षेत्रों में एक रंग का औसत कर सकता है।[9]जैसा कि सभी हानिपूर्ण संपीडन में, वीडियो गुणवत्ता और बिट दर, संपीडन और विघटन, और सिस्टम आवश्यकताओं के प्रसंस्करण की लागत के मध्य एक व्यापार-बंद है।अत्यधिक संपीड़ित वीडियो दृश्यमान या विचलित करने वाले संपीडन कलाकृतियों को प्रस्तुत कर सकता है।

प्रचलित डीसीटी-आधारित ट्रांसफॉर्म प्रारूपों के अतिरिक्त अन्य तरीके, जैसे कि फ्रैक्टल संपीडन , मैचिंग का पीछा और असतत वेवलेट ट्रांसफॉर्म (डीडब्ल्यूटी) का उपयोग, कुछ शोधों का विषय रहा है, लेकिन सामान्यतः व्यावहारिक उत्पादों में उपयोग नहीं किया जाता है।वेवलेट संपीडन का उपयोग अभी भी-छवि कोडर्स और वीडियो कोडर्स में गति मुआवजे के बिना किया जाता है।हाल ही में सैद्धांतिक विश्लेषण के कारण फ्रैक्टल कम्प्रेशन में रुचि इस तरह के तरीकों की प्रभावशीलता की तुलनात्मक कमी दिखाती है।[45]


इंटर-फ्रेम कूटलेखन

इंटर-फ्रेम कूटलेखन में, एक वीडियो अनुक्रम के व्यक्तिगत फ्रेम की तुलना एक फ्रेम से दूसरे फ्रेम से की जाती है, और वीडियो कोडेक अवशिष्ट फ्रेम को संदर्भ फ्रेम में रिकॉर्ड करता है। यदि फ्रेम में ऐसे क्षेत्र हैं जहां कुछ भी नहीं स्थानांतरित किया गया है, तो सिस्टम बस एक छोटी कमांड जारी कर सकता है जो पिछले फ्रेम के उस हिस्से को अगले एक में कॉपी करता है। यदि फ्रेम के खंड एक साधारण तरीके से चलते हैं, तो कंप्रेसर एक (थोड़ा लंबा) कमांड का उत्सर्जन कर सकता है जो डिकम्प्रेसर को शिफ्ट, रोटेट, हल्का या कॉपी को काला करने के लिए कहता है। यह लंबा कमांड अभी भी इंट्रा-फ्रेम संपीडन द्वारा उत्पन्न डेटा की तुलना में बहुत कम है। सामान्यतः, कूटलेखक एक अवशेष संकेत भी प्रसारित करेगा जो संदर्भ इमेजरी के लिए शेष अधिक सूक्ष्म अंतरों का वर्णन करता है। एन्ट्रापी कूटलेखन का उपयोग करते हुए, इन अवशेषों के संकेतों में पूर्ण संकेत की तुलना में अधिक कॉम्पैक्ट प्रतिनिधित्व होता है। अधिक गति वाले वीडियो के क्षेत्रों में, संपीडन को बड़ी संख्या में पिक्सेल के साथ रखने के लिए अधिक डेटा को एन्कोड करना चाहिए जो बदल रहे हैं। सामान्यतः विस्फोट, आग की लपटों, जानवरों के झुंड, और कुछ पैनिंग शॉट्स में, उच्च-आवृत्ति विस्तार से गुणवत्ता में कमी आती है या चर बिटरेट में वृद्धि होती है।

हाइब्रिड खंड-आधारित ट्रांसफॉर्म प्रारूप

एक विशिष्ट वीडियो कूटलेखक के प्रसंस्करण चरण

आज, लगभग सभी सामान्यतः उपयोग किए जाने वाले वीडियो संपीडन विधियों (जैसे, ITU-T या अंतर्राष्ट्रीय संगठन द्वारा अनुमोदित मानकों में, मानकीकरण के लिए अंतर्राष्ट्रीय संगठन) उसी मूल वास्तुकला को साझा करते हैं जो H.261 से वापस आता है जिसे 1988 में ITU-T द्वारा मानकीकृत किया गया था। वे ज्यादातर डीसीटी पर भरोसा करते हैं, पड़ोसी पिक्सेल के आयताकार खंडों पर अनुप्रयुक्त होते हैं, और गति सदिश का उपयोग करके अस्थायी भविष्यवाणी, साथ ही आजकल भी एक इन-लूप फ़िल्टरिंग कदम भी है।

भविष्यवाणी चरण में, विभिन्न आंकड़ा समर्पण और अंतर-कूटलेखन तकनीक अनुप्रयुक्त की जाती हैं जो डेटा को डिकॉर्लेट करने में सहायता करती हैं और पहले से प्रेषित डेटा के आधार पर नए डेटा का वर्णन करती हैं।

फिर शेष पिक्सेल डेटा के आयताकार खंड आवृत्ति कार्यक्षेत्र में बदल जाते हैं। मुख्य हानिपूर्ण प्रसंस्करण चरण में, आवृत्ति कार्यक्षेत्र डेटा मानव दृश्य धारणा के लिए अप्रासंगिक जानकारी को कम करने के लिए मात्राबद्ध हो जाता है।

अंतिम चरण में सांख्यिकीय अतिरेक काफी हद तक एक एन्ट्रॉपी कूटलेखन द्वारा समाप्त हो जाता है जो प्रायः अंकगणित कूटलेखन के कुछ रूप को अनुप्रयुक्त करता है।

एक अतिरिक्त इन-लूप फ़िल्टरिंग चरण में विभिन्न फ़िल्टर को पुनर्निर्मित छवि संकेत पर अनुप्रयुक्त किया जा सकता है। इन फिल्टर को कूटलेखन लूप के अंदर भी गणना करके वे संपीडन में मदद कर सकते हैं क्योंकि उन्हें भविष्यवाणी प्रक्रिया में उपयोग करने से पहले संदर्भ सामग्री पर अनुप्रयुक्त किया जा सकता है और उन्हें मूल संकेत का उपयोग करके निर्देशित किया जा सकता है। सबसे लोकप्रिय उदाहरण फ़िल्टर को डीबॉकिंग कर रहे हैं जो कि ट्रांसफ़ॉर्मेशन खंड सीमाओं पर मात्रा में छूट से कलाकृतियों को अवरुद्ध करते हैं।

इतिहास

1967 में, ए.एच. रॉबिन्सन और सी। चेरी ने एनालॉग टेलीविजन संकेतों के प्रसारण के लिए एक रन-लंबाई कूटलेखन बैंडविड्थ संपीडन योजना का प्रस्ताव रखा।[64] असतत कोसाइन ट्रांसफॉर्म (डीसीटी), जो आधुनिक वीडियो संपीडन के लिए मौलिक है,[65]1974 में एन। अहमद, टी। नटराजन और के। आर। राव द्वारा प्रस्तुत किया गया था।[16][66]

H.261, जिसने 1988 में शुरुआत की थी, ने व्यावसायिक रूप से वीडियो संपीडन प्रौद्योगिकी के प्रचलित बुनियादी वास्तुकला की शुरुआत की।[67] यह डीसीटी संपीडन पर आधारित पहला वीडियो कूटलेखन प्रारूप था।[65] H.261 को कई कंपनियों द्वारा विकसित किया गया था, जिसमें Hitachi , पिक्टुरिटेल , निप्पॉन टेलीग्राफ और टेलीफोन, बीटी पीएलसी और तोशिबा सम्मिलित हैं।[68] CODECs के लिए उपयोग किए जाने वाले सबसे लोकप्रिय वीडियो कूटलेखन मानक MPEG मानक हैं।MPEG-1 को 1991 में मोशन पिक्चर एक्सपर्ट्स ग्रुप (MPEG) द्वारा विकसित किया गया था, और इसे VHS- गुणवत्ता वाले वीडियो को संपीड़ित करने के लिए डिज़ाइन किया गया था।यह 1994 में MPEG-2 /H.262/MPEG-2 भाग 2 | H.262 द्वारा सफल हुआ था,[67]जिसे कई कंपनियों द्वारा विकसित किया गया था, मुख्य रूप से सोनी, टेक्नीकलर एसए और मित्सुबिशी इलेक्ट्रिक [69] MPEG-2 डीवीडी और एसडी डिजिटल टेलीविजन के लिए मानक वीडियो प्रारूप बन गया।[67]1999 में, इसके बाद MPEG-4 Visual | MPEG-4/H.263[67]यह कई कंपनियों द्वारा भी विकसित किया गया था, मुख्य रूप से मित्सुबिशी इलेक्ट्रिक, हिताची और पैनासोनिक [70] H.264/MPEG-4 AVC को 2003 में कई संगठनों, मुख्य रूप से पैनासोनिक, पचास -क्लास कंपनी और एलजी इलेक्ट्रॉनिक्स द्वारा विकसित किया गया था।[71] AVC ने व्यावसायिक रूप से आधुनिक संदर्भ-अनुकूली बाइनरी अंकगणित कूटलेखन (CABAC) और संदर्भ-अनुकूली चर-लंबाई कूटलेखन (CAVLC) कलनविधि प्रस्तुत किया।AVC ब्लू - रे डिस्क के लिए मुख्य वीडियो कूटलेखन मानक है, और व्यापक रूप से वीडियो साझा करने वाली वेबसाइटों और YouTube, Netflix , Vimeo, और iTunes Store , वेब सॉफ़्टवेयर जैसे Adobe Flash Player और Microsoft Silverlight , और विभिन्न जैसे इंटरनेट सेवाओं को स्ट्रीमिंग द्वारा उपयोग किया जाता है।एचडीटीवी स्थलीय और उपग्रह टेलीविजन पर प्रसारण करता है।

जेनेटिक्स

जीनोमिक री-सीक्वेंसिंग डेटा का संपीडन हासहीन कलनविधि की नवीनतम पीढ़ी है जो पारंपरिक संपीडन कलनविधि और विशिष्ट डेटाटाइप के अनुकूल दोनों पारंपरिक संपीडन कलनविधि और आनुवंशिक कलनविधि दोनों का उपयोग करके डेटा (सामान्यतः न्यूक्लियोटाइड्स के अनुक्रम) को संपीड़ित करता है।2012 में, जॉन्स हॉपकिंस विश्वविद्यालय के वैज्ञानिकों की एक टीम ने एक आनुवंशिक संपीडन कलनविधि प्रकाशित किया जो संपीडन के लिए एक संदर्भ जीनोम का उपयोग नहीं करता है।Hapzipper को अंतरराष्ट्रीय HAPMAP परियोजना डेटा के लिए सिलवाया गया था और 20-गुना संपीडन (फ़ाइल आकार में 95% की कमी) से अधिक प्राप्त होता है, जो 2- से 4 गुना बेहतर संपीडन प्रदान करता है और प्रमुख सामान्य-उद्देश्य संपीडन उपयोगिताओं की तुलना में कम कम्प्यूटेशनल रूप से गहन होता है।इसके लिए, चंदा, एलहाइक और बैडर ने MAF- आधारित कूटलेखन (MAFE) प्रस्तुत किया, जो अपने मामूली एलील आवृत्ति द्वारा SNPs को छांटकर डेटासेट की विषमता को कम करता है, इस प्रकार डेटासेट को समरूप बनाता है।[72]2009 और 2013 में विकसित अन्य कलनविधि (DNAZIP और GENOMEZIP) में 1200-गुना तक का संपीडन अनुपात है-2.5 मेगाबाइट्स (एक संदर्भ जीनोम के सापेक्ष या कई जीनोम पर औसतन) में संग्रहीत किए जाने वाले 6 बिलियन बेसपेयर द्विगुणित मानव जीनोम की अनुमति दी गई है।[73][74]जेनेटिक्स/जीनोमिक्स डेटा कंप्रेशर्स में एक बेंचमार्क के लिए, देखें [75]


आउटलुक और वर्तमान में अप्रयुक्त क्षमता

यह अनुमान लगाया जाता है कि दुनिया के भंडारण उपकरणों पर संग्रहीत डेटा की कुल मात्रा 4.5: 1 के शेष औसत कारक द्वारा मौजूदा संपीडन कलनविधि के साथ और संपीड़ित की जा सकती है।[76] यह अनुमान लगाया जाता है कि जानकारी को संग्रहीत करने के लिए दुनिया की संयुक्त तकनीकी क्षमता 2007 में 1,300 एक्साबाइट हार्डवेयर अंक प्रदान करती है, लेकिन जब इसी सामग्री को बेहतर रूप से संपीड़ित किया जाता है, तो यह केवल शैनन जानकारी के 295 एक्सबाइट्स का प्रतिनिधित्व करता है।[77]


यह भी देखें


संदर्भ

  1. Wade, Graham (1994). Signal coding and processing (2 ed.). Cambridge University Press. p. 34. ISBN 978-0-521-42336-6. Retrieved 2011-12-22. The broad objective of source coding is to exploit or remove 'inefficient' redundancy in the PCM source and thereby achieve a reduction in the overall source rate R.
  2. 2.0 2.1 Mahdi, O.A.; Mohammed, M.A.; Mohamed, A.J. (November 2012). "Implementing a Novel Approach an Convert Audio Compression to Text Coding via Hybrid Technique" (PDF). International Journal of Computer Science Issues. 9 (6, No. 3): 53–59. Retrieved 6 March 2013.
  3. Pujar, J.H.; Kadlaskar, L.M. (May 2010). "A New Lossless Method of Image Compression and Decompression Using Huffman Coding Techniques" (PDF). Journal of Theoretical and Applied Information Technology. 15 (1): 18–23.
  4. Salomon, David (2008). A Concise Introduction to Data Compression. Berlin: Springer. ISBN 9781848000728.
  5. Tank, M.K. (2011). "Implementation of Lempel-ZIV algorithm for lossless compression using VHDL". Implementation of Limpel-Ziv algorithm for lossless compression using VHDL. pp. 275–283. doi:10.1007/978-81-8489-989-4_51. ISBN 978-81-8489-988-7. {{cite book}}: |work= ignored (help)
  6. Navqi, Saud; Naqvi, R.; Riaz, R.A.; Siddiqui, F. (April 2011). "Optimized RTL design and implementation of LZW algorithm for high bandwidth applications" (PDF). Electrical Review. 2011 (4): 279–285.
  7. Stephen, Wolfram (2002). New Kind of Science. Champaign, IL. p. 1069. ISBN 1-57955-008-8.{{cite book}}: CS1 maint: location missing publisher (link)
  8. 8.0 8.1 Mahmud, Salauddin (March 2012). "An Improved Data Compression Method for General Data" (PDF). International Journal of Scientific & Engineering Research. 3 (3): 2. Retrieved 6 March 2013.
  9. 9.0 9.1 Lane, Tom. "JPEG Image Compression FAQ, Part 1". Internet FAQ Archives. Independent JPEG Group. Retrieved 6 March 2013.
  10. G. J. Sullivan; J.-R. Ohm; W.-J. Han; T. Wiegand (December 2012). "Overview of the High Efficiency Video Coding (HEVC) Standard". IEEE Transactions on Circuits and Systems for Video Technology. IEEE. 22 (12): 1649–1668. doi:10.1109/TCSVT.2012.2221191.
  11. "How to choose optimal archiving settings – WinRAR".
  12. "(Set compression Method) switch – 7zip".
  13. Wolfram, Stephen (2002). A New Kind of Science. Wolfram Media, Inc. p. 1069. ISBN 978-1-57955-008-0.
  14. Arcangel, Cory. "On Compression" (PDF). Retrieved 6 March 2013.
  15. 15.0 15.1 Ahmed, Nasir (January 1991). "How I Came Up With the Discrete Cosine Transform". Digital Signal Processing. 1 (1): 4–5. doi:10.1016/1051-2004(91)90086-Z.
  16. 16.0 16.1 16.2 Nasir Ahmed; T. Natarajan; Kamisetty Ramamohan Rao (January 1974). "Discrete Cosine Transform" (PDF). IEEE Transactions on Computers. C-23 (1): 90–93. doi:10.1109/T-C.1974.223784. S2CID 149806273.
  17. CCITT Study Group VIII und die Joint Photographic Experts Group (JPEG) von ISO/IEC Joint Technical Committee 1/Subcommittee 29/Working Group 10 (1993), "Annex D – Arithmetic coding", Recommendation T.81: Digital Compression and Coding of Continuous-tone Still images – Requirements and guidelines (PDF), pp. 54 ff, retrieved 2009-11-07
  18. Marak, Laszlo. "On image compression" (PDF). University of Marne la Vallee. Archived from the original (PDF) on 28 May 2015. Retrieved 6 March 2013.
  19. Mahoney, Matt. "Rationale for a Large Text Compression Benchmark". Florida Institute of Technology. Retrieved 5 March 2013.
  20. Shmilovici A.; Kahiri Y.; Ben-Gal I.; Hauser S. (2009). "Measuring the Efficiency of the Intraday Forex Market with a Universal Data Compression Algorithm" (PDF). Computational Economics. 33 (2): 131–154. CiteSeerX 10.1.1.627.3751. doi:10.1007/s10614-008-9153-3. S2CID 17234503.
  21. I. Ben-Gal (2008). "On the Use of Data Compression Measures to Analyze Robust Designs" (PDF). IEEE Transactions on Reliability. 54 (3): 381–388. doi:10.1109/TR.2005.853280. S2CID 9376086.
  22. D. Scully; Carla E. Brodley (2006). "Compression and machine learning: A new perspective on feature space vectors". Data Compression Conference, 2006: 332. doi:10.1109/DCC.2006.13. ISBN 0-7695-2545-8. S2CID 12311412.
  23. Korn, D.; et al. "RFC 3284: The VCDIFF Generic Differencing and Compression Data Format". Internet Engineering Task Force. Retrieved 5 March 2013.
  24. Korn, D.G.; Vo, K.P. (1995). B. Krishnamurthy (ed.). Vdelta: Differencing and Compression. Practical Reusable Unix Software. New York: John Wiley & Sons, Inc.
  25. Claude Elwood Shannon (1948). Alcatel-Lucent (ed.). "A Mathematical Theory of Communication" (PDF). Bell System Technical Journal. 27 (3–4): 379–423, 623–656. doi:10.1002/j.1538-7305.1948.tb01338.x. hdl:11858/00-001M-0000-002C-4314-2. Retrieved 2019-04-21.
  26. David Albert Huffman (September 1952), "A method for the construction of minimum-redundancy codes" (PDF), Proceedings of the IRE, vol. 40, no. 9, pp. 1098–1101, doi:10.1109/JRPROC.1952.273898
  27. Pratt, W.K.; Kane, J.; Andrews, H.C. (1969). "Hadamard transform image coding". Proceedings of the IEEE. 57: 58–68. doi:10.1109/PROC.1969.6869.
  28. "T.81 – DIGITAL COMPRESSION AND CODING OF CONTINUOUS-TONE STILL IMAGES – REQUIREMENTS AND GUIDELINES" (PDF). CCITT. September 1992. Retrieved 12 July 2019.
  29. "The JPEG image format explained". BT.com. BT Group. 31 May 2018. Archived from the original on 5 August 2019. Retrieved 5 August 2019.
  30. Baraniuk, Chris (15 October 2015). "Copy protections could come to JPEGs". BBC News. BBC. Retrieved 13 September 2019.
  31. "What Is a JPEG? The Invisible Object You See Every Day". The Atlantic. 24 September 2013. Retrieved 13 September 2019.
  32. "The GIF Controversy: A Software Developer's Perspective". Retrieved 26 May 2015.
  33. L. Peter Deutsch (May 1996). DEFLATE Compressed Data Format Specification version 1.3. IETF. p. 1. sec. Abstract. doi:10.17487/RFC1951. RFC 1951. Retrieved 2014-04-23.
  34. Hoffman, Roy (2012). Data Compression in Digital Systems. Springer Science & Business Media. p. 124. ISBN 9781461560319. Basically, wavelet coding is a variant on DCT-based transform coding that reduces or eliminates some of its limitations. (...) Another advantage is that rather than working with 8 × 8 blocks of pixels, as do JPEG and other block-based DCT techniques, wavelet coding can simultaneously compress the entire image.
  35. Taubman, David; Marcellin, Michael (2012). JPEG2000 Image Compression Fundamentals, Standards and Practice: Image Compression Fundamentals, Standards and Practice. Springer Science & Business Media. ISBN 9781461507994.
  36. Unser, M.; Blu, T. (2003). "Mathematical properties of the JPEG2000 wavelet filters". IEEE Transactions on Image Processing. 12 (9): 1080–1090. Bibcode:2003ITIP...12.1080U. doi:10.1109/TIP.2003.812329. PMID 18237979. S2CID 2765169.
  37. Sullivan, Gary (8–12 December 2003). "General characteristics and design considerations for temporal subband video coding". ITU-T. Video Coding Experts Group. Retrieved 13 September 2019.
  38. Bovik, Alan C. (2009). The Essential Guide to Video Processing. Academic Press. p. 355. ISBN 9780080922508.
  39. Swartz, Charles S. (2005). Understanding Digital Cinema: A Professional Handbook. Taylor & Francis. p. 147. ISBN 9780240806174.
  40. Cunningham, Stuart; McGregor, Iain (2019). "Subjective Evaluation of Music Compressed with the ACER Codec Compared to AAC, MP3, and Uncompressed PCM". International Journal of Digital Multimedia Broadcasting (in English). 2019: 1–16. doi:10.1155/2019/8265301.
  41. The Olympus WS-120 digital speech recorder, according to its manual, can store about 178 hours of speech-quality audio in .WMA format in 500 MB of flash memory.
  42. Coalson, Josh. "FLAC Comparison". Retrieved 2020-08-23.
  43. "Format overview". Retrieved 2020-08-23.
  44. 44.0 44.1 Jaiswal, R.C. (2009). Audio-Video Engineering. Pune, Maharashtra: Nirali Prakashan. p. 3.41. ISBN 9788190639675.
  45. 45.0 45.1 45.2 Faxin Yu; Hao Luo; Zheming Lu (2010). Three-Dimensional Model Analysis and Processing. Berlin: Springer. p. 47. ISBN 9783642126512.
  46. US patent 2605361, C. Chapin Cutler, "Differential Quantization of Communication Signals", issued 1952-07-29 
  47. Cummiskey, P.; Jayant, N. S.; Flanagan, J. L. (1973). "Adaptive Quantization in Differential PCM Coding of Speech". Bell System Technical Journal. 52 (7): 1105–1118. doi:10.1002/j.1538-7305.1973.tb02007.x.
  48. Cummiskey, P.; Jayant, Nikil S.; Flanagan, J. L. (1973). "Adaptive quantization in differential PCM coding of speech". The Bell System Technical Journal. 52 (7): 1105–1118. doi:10.1002/j.1538-7305.1973.tb02007.x. ISSN 0005-8580.
  49. 49.0 49.1 49.2 Schroeder, Manfred R. (2014). "Bell Laboratories". Acoustics, Information, and Communication: Memorial Volume in Honor of Manfred R. Schroeder. Springer. p. 388. ISBN 9783319056609.
  50. Gray, Robert M. (2010). "A History of Realtime Digital Speech on Packet Networks: Part II of Linear Predictive Coding and the Internet Protocol" (PDF). Found. Trends Signal Process. 3 (4): 203–303. doi:10.1561/2000000036. ISSN 1932-8346.
  51. Guckert, John (Spring 2012). "The Use of FFT and MDCT in MP3 Audio Compression" (PDF). University of Utah. Retrieved 14 July 2019.
  52. Luo, Fa-Long (2008). Mobile Multimedia Broadcasting Standards: Technology and Practice. Springer Science & Business Media. p. 590. ISBN 9780387782638.
  53. Britanak, V. (2011). "On Properties, Relations, and Simplified Implementation of Filter Banks in the Dolby Digital (Plus) AC-3 Audio Coding Standards". IEEE Transactions on Audio, Speech, and Language Processing. 19 (5): 1231–1241. doi:10.1109/TASL.2010.2087755. S2CID 897622.
  54. Brandenburg, Karlheinz (1999). "MP3 and AAC Explained" (PDF). Archived (PDF) from the original on 2017-02-13.
  55. Princen, J.; Johnson, A.; Bradley, A. (1987). "Subband/Transform coding using filter bank designs based on time domain aliasing cancellation". ICASSP '87. IEEE International Conference on Acoustics, Speech, and Signal Processing. Vol. 12. pp. 2161–2164. doi:10.1109/ICASSP.1987.1169405. S2CID 58446992.
  56. Princen, J.; Bradley, A. (1986). "Analysis/Synthesis filter bank design based on time domain aliasing cancellation". IEEE Transactions on Acoustics, Speech, and Signal Processing. 34 (5): 1153–1161. doi:10.1109/TASSP.1986.1164954.
  57. "Summary of some of Solidyne's contributions to Broadcast Engineering". Brief History of Solidyne. Buenos Aires: Solidyne. Archived from the original on 8 March 2013. Retrieved 6 March 2013.[self-published source?]
  58. Zwicker, Eberhard; et al. (1967). The Ear As A Communication Receiver. Melville, NY: Acoustical Society of America. Archived from the original on 2000-09-14. Retrieved 2011-11-11.
  59. "File Compression Possibilities". A Brief guide to compress a file in 4 different ways. 17 February 2017.
  60. Dmitriy Vatolin; et al. (Graphics & Media Lab Video Group) (March 2007). Lossless Video Codecs Comparison '2007 (PDF) (Report). Moscow State University.
  61. Chen, Jie; Koc, Ut-Va; Liu, KJ Ray (2001). Design of Digital Video Coding Systems: A Complete Compressed Domain Approach. CRC Press. p. 71. ISBN 9780203904183.
  62. Li, Jian Ping (2006). Proceedings of the International Computer Conference 2006 on Wavelet Active Media Technology and Information Processing: Chongqing, China, 29-31 August 2006. World Scientific. p. 847. ISBN 9789812709998.
  63. "Video Coding". CSIP website. Center for Signal and Information Processing, Georgia Institute of Technology. Archived from the original on 23 May 2013. Retrieved 6 March 2013.
  64. Robinson, A. H.; Cherry, C. (1967). "Results of a prototype television bandwidth compression scheme". Proceedings of the IEEE. IEEE. 55 (3): 356–364. doi:10.1109/PROC.1967.5493.
  65. 65.0 65.1 Ghanbari, Mohammed (2003). Standard Codecs: Image Compression to Advanced Video Coding. Institution of Engineering and Technology. pp. 1–2. ISBN 9780852967102.
  66. Reader, Cliff (2016-08-31). "Patent landscape for royalty-free video coding". In Tescher, Andrew G (ed.). Applications of Digital Image Processing XXXIX. Applications of Digital Image Processing XXXIX. Vol. 9971. San Diego, California: Society of Photo-Optical Instrumentation Engineers. pp. 99711B. Bibcode:2016SPIE.9971E..1BR. doi:10.1117/12.2239493. Archived from the original on 2016-12-08. Lecture recording, from 3:05:10.
  67. 67.0 67.1 67.2 67.3 "The History of Video File Formats Infographic — RealPlayer". 22 April 2012.
  68. "Patent statement declaration registered as H261-07". ITU. Retrieved 11 July 2019.
  69. "MPEG-2 Patent List" (PDF). MPEG LA. Retrieved 7 July 2019.
  70. "MPEG-4 Visual - Patent List" (PDF). MPEG LA. Retrieved 6 July 2019.
  71. "AVC/H.264 – Patent List" (PDF). MPEG LA. Retrieved 6 July 2019.
  72. Chanda P, Bader JS, Elhaik E (27 Jul 2012). "HapZipper: sharing HapMap populations just got easier". Nucleic Acids Research. 40 (20): e159. doi:10.1093/nar/gks709. PMC 3488212. PMID 22844100.
  73. Christley S, Lu Y, Li C, Xie X (Jan 15, 2009). "Human genomes as email attachments". Bioinformatics. 25 (2): 274–5. doi:10.1093/bioinformatics/btn582. PMID 18996942.
  74. Pavlichin DS, Weissman T, Yona G (September 2013). "The human genome contracts again". Bioinformatics. 29 (17): 2199–202. doi:10.1093/bioinformatics/btt362. PMID 23793748.
  75. Hosseini, Morteza; Pratas, Diogo; Pinho, Armando (2016). "A Survey on Data Compression Methods for Biological Sequences". Information. 7 (4): 56. doi:10.3390/info7040056.
  76. "Data Compression via Logic Synthesis" (PDF).
  77. Hilbert, Martin; López, Priscila (1 April 2011). "The World's Technological Capacity to Store, Communicate, and Compute Information". Science. 332 (6025): 60–65. Bibcode:2011Sci...332...60H. doi:10.1126/science.1200970. PMID 21310967. S2CID 206531385.


इस पृष्ठ में गुम आंतरिक लिंक की सूची

  • हानिक डेटा संपीडन
  • हासहीन आंकड़ा संपीडन
  • हवा निकालना
  • प्रायिकता वितरण
  • अंकगणितीय कोडन
  • परिमित अवस्था मशीन
  • मनोभ्रंश संबंधी
  • सृजन हानि
  • कोडन सिद्धांत
  • पीछे की संभावनाएं
  • समष्टि वेक्टर की सुविधा
  • हटर प्राइज़
  • आँकड़ा विभाजन
  • एन्ट्रॉपी (सूचना सिद्धांत)
  • फ़ोटोग्राफ़ी संबंधी विशेषज्ञों का संयुक्त समूह
  • छवि संचिका प्रारूप
  • डिजिटल फोटो
  • अंकीय छवि
  • मोशन जेपीईजी 2000
  • गतिशील सीमा संपीडन
  • इष्टतम द्वंद्व
  • श्रव्य संचिका प्रारूप
  • श्रव्य संपादन
  • डिजिटल पीढ़ी हानि
  • सुनवाई की पूर्ण सीमा
  • समानता समोच्च
  • संशोधित असतत कोसाइन परिवर्तन
  • सुनवाई (भावना)
  • अवधारणात्मक कोडन
  • सजा जस्ट कडकुरा
  • दबाव अनुपात
  • प्रस्ताव मुआवजा
  • अंकीय कंटेनर प्रारूप
  • संपीडन कलाकृतियाँ
  • मिलान का पीछा
  • निरंकुश फ़िल्टर
  • अंतरराष्ट्रीय मानकीकरण संगठन
  • गति वेक्टर
  • संदर्भ-अनुकूली द्विआधारी अंकगणितीय कूटलेखन
  • अंतर्राष्ट्रीय हापमप परियोजना
  • जीनोमिक पुन: अनुक्रमण डेटा का संपीडन

बाहरी संबंध