हानिपूर्ण संपीड़न: Difference between revisions

From Vigyanwiki
No edit summary
Line 12: Line 12:
| image4    = Ruby-HighCompression-Tiny.jpg
| image4    = Ruby-HighCompression-Tiny.jpg
| caption4  = High-compression (low quality) JPEG}}
| caption4  = High-compression (low quality) JPEG}}
सूचना प्रौद्योगिकी में, हानिपूर्ण संपीड़न या अपरिवर्तनीय संपीड़न डेटा संपीड़न विधियों का वर्ग है जो सामग्री का प्रतिनिधित्व करने के लिए अचूक अनुमानों और आंशिक डेटा का उपयोग करता है। इन तकनीकों का उपयोग सामग्री को संग्रहीत करने, संभालने और प्रसारित करने के लिए डेटा आकार को कम करने के लिए किया जाता है। इस पृष्ठ पर बिल्ली की तस्वीर के विभिन्न संस्करणों से पता चलता है कि अधिक विवरण हटा दिए जाने पर अनुमान की उच्च डिग्री मोटे चित्र कैसे बनाती है। यह [[ दोषरहित संपीड़न ]] (प्रतिवर्ती डेटा संपीड़न) के विपरीत है जो डेटा को नीचा नहीं करता है। हानि रहित संपीड़न का उपयोग करके संभव डेटा कमी की मात्रा दोषरहित तकनीकों के उपयोग की तुलना में बहुत अधिक है।
सूचना प्रौद्योगिकी में, '''हानिपूर्ण संपीड़न''' या अपरिवर्तनीय संपीड़न डेटा संपीड़न विधियों का वर्ग है जो सूचना का प्रतिनिधित्व करने के लिए अचूक अनुमानों और आंशिक डेटा का उपयोग करता है। इन पद्यतियों का उपयोग सूचना को संग्रहीत करने, संभालने और प्रसारित करने के लिए डेटा आकार को कम करने के लिए किया जाता है। इस पृष्ठ पर बिल्ली की तस्वीर के विभिन्न संस्करणों से पता चलता है कि अधिक विवरण हटा दिए जाने पर अनुमान की उच्च डिग्री मोटे चित्र कैसे बनाती है। यह [[ दोषरहित संपीड़न ]] (प्रतिवर्ती डेटा संपीड़न) के विपरीत है जो डेटा को निम्न नहीं करता है। हानि रहित संपीड़न का उपयोग करके संभव डेटा कमी की मात्रा दोषरहित पद्यतियों के उपयोग की तुलना में बहुत अधिक है।


अंत-उपयोगकर्ता द्वारा गिरावट पर ध्यान दिए जाने से पहले अच्छी तरह से डिज़ाइन की गई हानिपूर्ण संपीड़न तकनीक अक्सर फ़ाइल के आकार को काफी कम कर देती है। उपयोगकर्ता द्वारा ध्यान देने योग्य होने पर भी,डेटा में और कमी वांछनीय हो सकती है (जैसे, रीयल-टाइम संचार के लिए या ट्रांसमिशन समय या भंडारण आवश्यकताओं को कम करने के लिए)। सबसे व्यापक रूप से इस्तेमाल किया जाने वाला हानिपूर्ण संपीड़न एल्गोरिदम [[ असतत कोसाइन परिवर्तन ]] (डीसीटी) है, जिसे पहली बार नासिर अहमद, टी। नटराजन और केआर राव द्वारा 1974 में प्रकाशित किया गया था। 2019 में साइनसॉइडल-हाइपरबोलिक ट्रांसफ़ॉर्म फ़ंक्शंस का एक नया परिवार, जिसमें तुलनीय गुण और प्रदर्शन हैं डीसीटी, हानिपूर्ण संपीड़न के लिए प्रस्तावित किए गए थे।<ref>{{Cite journal|last1=Abedi|first1=M.|last2=Sun|first2=B.|last3=Zheng|first3=Z.|date=July 2019|title=A Sinusoidal-Hyperbolic Family of Transforms With Potential Applications in Compressive Sensing|journal=IEEE Transactions on Image Processing|volume=28|issue=7|pages=3571–3583|doi=10.1109/TIP.2019.2912355|pmid=31071031|bibcode=2019ITIP...28.3571A |s2cid=174820107 }}</ref>
अंत-उपयोगकर्ता द्वारा गिरावट पर ध्यान दिए जाने से पहले अच्छी तरह से डिज़ाइन की गई हानिपूर्ण संपीड़न पद्यति यद्यपि फ़ाइल के आकार को काफी कम कर देती है। उपयोगकर्ता द्वारा ध्यान देने योग्य होने पर भी डेटा में और कमी वांछनीय हो सकती है (जैसे, रीयल-टाइम संचार के लिए या ट्रांसमिशन समय या भंडारण आवश्यकताओं को कम करने के लिए)। सबसे व्यापक रूप से इस्तेमाल किया जाने वाला हानिपूर्ण संपीड़न एल्गोरिदम [[ असतत कोसाइन परिवर्तन ]] (डीसीटी) है, जिसे पहली बार नासिर अहमद, टी नटराजन और केआर राव द्वारा 1974 में प्रकाशित किया गया था। 2019 में साइनसॉइडल-हाइपरबोलिक ट्रांसफ़ॉर्म फ़ंक्शंस का एक नया परिवार, जिसमें तुलनीय गुण और प्रदर्शन हैं डीसीटी, हानिपूर्ण संपीड़न के लिए प्रस्तावित किए गए थे।<ref>{{Cite journal|last1=Abedi|first1=M.|last2=Sun|first2=B.|last3=Zheng|first3=Z.|date=July 2019|title=A Sinusoidal-Hyperbolic Family of Transforms With Potential Applications in Compressive Sensing|journal=IEEE Transactions on Image Processing|volume=28|issue=7|pages=3571–3583|doi=10.1109/TIP.2019.2912355|pmid=31071031|bibcode=2019ITIP...28.3571A |s2cid=174820107 }}</ref>
हानिपूर्ण संपीड़न का उपयोग व्यापक रूप से [[ मल्टीमीडिया ]] डेटा ([[ ध्वनि रिकॉर्डिंग और प्रजनन ]], [[ वीडियो ]] और [[ छवि ]]यों) को संपीड़ित करने के लिए किया जाता है, विशेष रूप से [[ स्ट्रीमिंग मीडिया ]] और वीओआइपी जैसे अनुप्रयोगों में। इसके विपरीत,दोषरहित संपीड़न आमतौर पर टेक्स्ट और डेटा फ़ाइलों, जैसे बैंक रिकॉर्ड और टेक्स्ट लेखों के लिए आवश्यक होता है। एक [[ मास्टर रिकॉर्डिंग ]] बनाना लाभप्रद हो सकता है जिसका उपयोग तब अतिरिक्त प्रतियाँ बनाने के लिए किया जा सकता है। यह किसी को एक हानिपूर्ण स्रोत फ़ाइल से नई संपीड़ित प्रतियों को आधार बनाने से बचने की अनुमति देता है, जो अतिरिक्त कलाकृतियों और अतिरिक्त अनावश्यक जानकारी हानि उत्पन्न करेगा।
हानिपूर्ण संपीड़न का उपयोग व्यापक रूप से [[ मल्टीमीडिया ]] डेटा ([[ ध्वनि रिकॉर्डिंग और प्रजनन ]], [[ वीडियो ]] और [[ छवि ]]यों) को संपीड़ित करने के लिए किया जाता है, विशेष रूप से [[ स्ट्रीमिंग मीडिया ]] और वीओआइपी जैसे अनुप्रयोगों में। इसके विपरीत,दोषरहित संपीड़न आमतौर पर टेक्स्ट और डेटा फ़ाइलों, जैसे बैंक रिकॉर्ड और टेक्स्ट लेखों के लिए आवश्यक होता है। एक [[ मास्टर रिकॉर्डिंग ]] बनाना लाभप्रद हो सकता है जिसका उपयोग तब अतिरिक्त प्रतियाँ बनाने के लिए किया जा सकता है। यह किसी को एक हानिपूर्ण स्रोत फ़ाइल से नई संपीड़ित प्रतियों को आधार बनाने से बचने की अनुमति देता है, जो अतिरिक्त कलाकृतियों और अतिरिक्त अनावश्यक जानकारी हानि उत्पन्न करेगा।


Line 22: Line 22:
मूल डेटा में एक निश्चित मात्रा में जानकारी होती है, और फ़ाइल के आकार की एक निचली सीमा होती है जिसमें सभी जानकारी हो सकती है। बुनियादी [[ सूचना सिद्धांत ]] कहता है कि इस डेटा के आकार को कम करने की एक पूर्ण सीमा है। जब डेटा संपीड़ित होता है, तो इसकी [[ सॉफ्टवेयर एन्ट्रापी ]] बढ़ जाती है, और यह अनिश्चित काल तक नहीं बढ़ सकती है। उदाहरण के लिए, एक संपीड़ित [[ ज़िप (फ़ाइल प्रारूप) ]] अपने मूल से छोटी होती है,लेकिन एक ही फ़ाइल को बार-बार संपीड़ित करने से आकार कम नहीं होगा। अधिकांश संपीड़न एल्गोरिदम यह पहचान सकते हैं कि आगे संपीड़न कब व्यर्थ होगा और वास्तव में डेटा के आकार को बढ़ाएगा।
मूल डेटा में एक निश्चित मात्रा में जानकारी होती है, और फ़ाइल के आकार की एक निचली सीमा होती है जिसमें सभी जानकारी हो सकती है। बुनियादी [[ सूचना सिद्धांत ]] कहता है कि इस डेटा के आकार को कम करने की एक पूर्ण सीमा है। जब डेटा संपीड़ित होता है, तो इसकी [[ सॉफ्टवेयर एन्ट्रापी ]] बढ़ जाती है, और यह अनिश्चित काल तक नहीं बढ़ सकती है। उदाहरण के लिए, एक संपीड़ित [[ ज़िप (फ़ाइल प्रारूप) ]] अपने मूल से छोटी होती है,लेकिन एक ही फ़ाइल को बार-बार संपीड़ित करने से आकार कम नहीं होगा। अधिकांश संपीड़न एल्गोरिदम यह पहचान सकते हैं कि आगे संपीड़न कब व्यर्थ होगा और वास्तव में डेटा के आकार को बढ़ाएगा।


कई मामलों में, फ़ाइलों या डेटा स्ट्रीम में ज़रूरत से ज़्यादा जानकारी होती है। उदाहरण के लिए, एक चित्र में अधिक विवरण हो सकता है, जब आंख सबसे बड़े आकार में पुन: प्रस्तुत करने पर अंतर कर सकती है; इसी तरह, एक ऑडियो फ़ाइल को बहुत तेज़ आवाज़ के दौरान बहुत अधिक बारीक विवरण की आवश्यकता नहीं होती है। हानिपूर्ण संपीड़न तकनीकों को विकसित करना जितना संभव हो सके मानवीय धारणा से मेल खाता है, एक जटिल कार्य है। कभी-कभी आदर्श एक फ़ाइल होती है जो मूल के समान ही धारणा प्रदान करती है, जितनी संभव हो उतनी डिजिटल जानकारी को हटा दिया जाता है; दूसरी बार, गुणवत्ता के प्रत्यक्ष नुकसान को एक वैध व्यापार माना जाता है।
कई मामलों में, फ़ाइलों या डेटा स्ट्रीम में ज़रूरत से ज़्यादा जानकारी होती है। उदाहरण के लिए, एक चित्र में अधिक विवरण हो सकता है, जब आंख सबसे बड़े आकार में पुन: प्रस्तुत करने पर अंतर कर सकती है; इसी तरह, एक ऑडियो फ़ाइल को बहुत तेज़ आवाज़ के दौरान बहुत अधिक बारीक विवरण की आवश्यकता नहीं होती है। हानिपूर्ण संपीड़न पद्यतियों को विकसित करना जितना संभव हो सके मानवीय धारणा से मेल खाता है, एक जटिल कार्य है। कभी-कभी आदर्श एक फ़ाइल होती है जो मूल के समान ही धारणा प्रदान करती है, जितनी संभव हो उतनी डिजिटल जानकारी को हटा दिया जाता है; दूसरी बार, गुणवत्ता के प्रत्यक्ष नुकसान को एक वैध व्यापार माना जाता है।


"नुकसान" के नकारात्मक प्रभावों को रोकने के लिए, कुछ अनुप्रयोगों, जैसे कि चिकित्सा छवि संपीड़न, के लिए "अपरिवर्तनीय" और "प्रतिवर्ती" शब्द क्रमशः "हानिपूर्ण" और "दोषरहित" पसंद किए जाते हैं। नुकसान का प्रकार और मात्रा छवियों की उपयोगिता को प्रभावित कर सकती है। संपीड़न के विरूपण साक्ष्य या अवांछनीय प्रभाव स्पष्ट रूप से देखे जा सकते हैं फिर भी परिणाम अभी भी इच्छित उद्देश्य के लिए उपयोगी हैं। या हानिपूर्ण संपीड़ित छवियां 'नेत्रहीन दोषरहित' हो सकती हैं, या चिकित्सा छवियों के मामले में,मानों [[ नैदानिक ​​रूप से स्वीकार्य अपरिवर्तनीय संपीड़न (DAIC) ]] को लागू किया जा सकता है।<ref>{{cite journal|last=European Society of Radiology|title=Usability of irreversible image compression in radiological imaging. A position paper by the European Society of Radiology (ESR)|date=2011|pmc=3259360|pmid=22347940|doi=10.1007/s13244-011-0071-x|volume=2|issue=2|journal=Insights Imaging|pages=103–115}}</ref>  
"नुकसान" के नकारात्मक प्रभावों को रोकने के लिए, कुछ अनुप्रयोगों, जैसे कि चिकित्सा छवि संपीड़न, के लिए "अपरिवर्तनीय" और "प्रतिवर्ती" शब्द क्रमशः "हानिपूर्ण" और "दोषरहित" पसंद किए जाते हैं। नुकसान का प्रकार और मात्रा छवियों की उपयोगिता को प्रभावित कर सकती है। संपीड़न के विरूपण साक्ष्य या अवांछनीय प्रभाव स्पष्ट रूप से देखे जा सकते हैं फिर भी परिणाम अभी भी इच्छित उद्देश्य के लिए उपयोगी हैं। या हानिपूर्ण संपीड़ित छवियां 'नेत्रहीन दोषरहित' हो सकती हैं, या चिकित्सा छवियों के मामले में,मानों [[ नैदानिक ​​रूप से स्वीकार्य अपरिवर्तनीय संपीड़न (DAIC) ]] को लागू किया जा सकता है।<ref>{{cite journal|last=European Society of Radiology|title=Usability of irreversible image compression in radiological imaging. A position paper by the European Society of Radiology (ESR)|date=2011|pmc=3259360|pmid=22347940|doi=10.1007/s13244-011-0071-x|volume=2|issue=2|journal=Insights Imaging|pages=103–115}}</ref>  
Line 32: Line 32:
हानिपूर्ण संपीड़न का सबसे सामान्य रूप एक ट्रांसफ़ॉर्म कोडिंग विधि है,कोसाइन ट्रांसफ़ॉर्म (DCT),<ref>{{cite web |title=Data compression |url=https://www.britannica.com/technology/data-compression |website=[[Encyclopedia Britannica]] |access-date=13 August 2019 }}</ref> जिसे पहली बार 1974 में नासिर अहमद, टी. नटराजन और के.आर. राव ने प्रकाशित किया था।<ref name="pubDCT">{{Citation |first1=Nasir |last1=Ahmed |author1-link=N. Ahmed |first2=T. |last2=Natarajan |first3=K. R. |last3=Rao |author3-link=K. R. Rao |title=Discrete Cosine Transform |journal=IEEE Transactions on Computers |date=January 1974 |volume=C-23 |issue=1 |pages=90–93 |doi=10.1109/T-C.1974.223784|s2cid=149806273 }}</ref> लोकप्रिय [[ छवि संपीड़न ]] प्रारूपों (जैसे [[ जेपीईजी |जेपीईजी]] ) ,<ref>{{cite web|url=https://www.w3.org/Graphics/JPEG/itu-t81.pdf|title=T.81 – DIGITAL COMPRESSION AND CODING OF CONTINUOUS-TONE STILL IMAGES – REQUIREMENTS AND GUIDELINES|date=September 1992|publisher=CCITT|access-date=12 July 2019}}</ref> [[ वीडियो कोडिंग मानक ]] (जैसे [[ MPEG ]] और H.264/AVC) और [[ ऑडियो संपीड़न (डेटा) ]] प्रारूप (जैसे [[ MP3 ]] और [[ उन्नत ऑडियो कोडेक ]]) के लिए DCT हानिपूर्ण संपीड़न का सबसे व्यापक रूप से उपयोग किया जाने वाला रूप है।  
हानिपूर्ण संपीड़न का सबसे सामान्य रूप एक ट्रांसफ़ॉर्म कोडिंग विधि है,कोसाइन ट्रांसफ़ॉर्म (DCT),<ref>{{cite web |title=Data compression |url=https://www.britannica.com/technology/data-compression |website=[[Encyclopedia Britannica]] |access-date=13 August 2019 }}</ref> जिसे पहली बार 1974 में नासिर अहमद, टी. नटराजन और के.आर. राव ने प्रकाशित किया था।<ref name="pubDCT">{{Citation |first1=Nasir |last1=Ahmed |author1-link=N. Ahmed |first2=T. |last2=Natarajan |first3=K. R. |last3=Rao |author3-link=K. R. Rao |title=Discrete Cosine Transform |journal=IEEE Transactions on Computers |date=January 1974 |volume=C-23 |issue=1 |pages=90–93 |doi=10.1109/T-C.1974.223784|s2cid=149806273 }}</ref> लोकप्रिय [[ छवि संपीड़न ]] प्रारूपों (जैसे [[ जेपीईजी |जेपीईजी]] ) ,<ref>{{cite web|url=https://www.w3.org/Graphics/JPEG/itu-t81.pdf|title=T.81 – DIGITAL COMPRESSION AND CODING OF CONTINUOUS-TONE STILL IMAGES – REQUIREMENTS AND GUIDELINES|date=September 1992|publisher=CCITT|access-date=12 July 2019}}</ref> [[ वीडियो कोडिंग मानक ]] (जैसे [[ MPEG ]] और H.264/AVC) और [[ ऑडियो संपीड़न (डेटा) ]] प्रारूप (जैसे [[ MP3 ]] और [[ उन्नत ऑडियो कोडेक ]]) के लिए DCT हानिपूर्ण संपीड़न का सबसे व्यापक रूप से उपयोग किया जाने वाला रूप है।  


ऑडियो डेटा के मामले में, ट्रांसफ़ॉर्मिंग कोडिंग का एक लोकप्रिय रूप [[ अवधारणात्मक कोडिंग ]] है,जो कच्चे डेटा को एक ऐसे डोमेन में बदल देता है जो सूचना सामग्री को अधिक सटीक रूप से दर्शाता है। उदाहरण के लिए, समय के साथ आयाम स्तरों के रूप में ध्वनि फ़ाइल को व्यक्त करने के बजाय, कोई इसे समय के साथ आवृत्ति स्पेक्ट्रम के रूप में व्यक्त कर सकता है, जो मानव ऑडियो धारणा से अधिक सही रूप से मेल खाता है। जबकि डेटा में कमी (संपीड़न, यह हानिपूर्ण या दोषरहित हो) कोडिंग को बदलने का एक मुख्य लक्ष्य है, यह अन्य लक्ष्यों की भी अनुमति देता है: कोई व्यक्ति अंतरिक्ष की मूल मात्रा के लिए डेटा को अधिक सही रूप से प्रस्तुत कर सकता है<ref>“Although one main goal of digital audio perceptual coders is data reduction, this is not a necessary characteristic. As we shall see, perceptual coding can be used to improve the representation of digital audio through advanced bit allocation.” [http://www.noisebetweenstations.com/personal/essays/audio_on_the_internet/MaskingPaper.html Masking and Perceptual Coding], Victor Lombardi, noisebetweenstations.com</ref> - उदाहरण के लिए, सिद्धांत रूप में, यदि कोई एनालॉग या उच्च-रिज़ॉल्यूशन वाले [[ डिजिटल मास्टर ]] से शुरू होता है, तो किसी दिए गए आकार की एमपी3 फ़ाइल को उसी आकार की [[ WAV ]] या [[ AIFF ]]फ़ाइल में कच्चे असम्पीडित ऑडियो की तुलना में बेहतर प्रतिनिधित्व प्रदान करना चाहिए। ऐसा इसलिए है क्योंकि असम्पीडित ऑडियो केवल बिट दर या गहराई को कम करके फ़ाइल का आकार कम कर सकता है, जबकि ऑडियो को संपीड़ित करने से बिट दर और गहराई को बनाए रखते हुए आकार कम किया जा सकता है। यह संपीड़न पूरे बोर्ड में डेटा खोने के बजाय कम से कम महत्वपूर्ण डेटा का एक चुनिंदा नुकसान बन जाता है। इसके अलावा, एक ट्रांसफॉर्म कोडिंग डेटा में हेरफेर करने या अन्यथा संपादित करने के लिए एक बेहतर डोमेन प्रदान कर सकती है - उदाहरण के लिए, ऑडियो का [[ समानता (ऑडियो) ]]ऑडियो) सबसे स्वाभाविक रूप से रॉ टाइम डोमेन के बजाय फ़्रीक्वेंसी डोमेन (उदाहरण के लिए, बास को बढ़ावा देना) में व्यक्त किया जाता है। .
ऑडियो डेटा के मामले में, ट्रांसफ़ॉर्मिंग कोडिंग का एक लोकप्रिय रूप [[ अवधारणात्मक कोडिंग ]] है,जो कच्चे डेटा को एक ऐसे डोमेन में बदल देता है जो सूचना सूचना को अधिक सटीक रूप से दर्शाता है। उदाहरण के लिए, समय के साथ आयाम स्तरों के रूप में ध्वनि फ़ाइल को व्यक्त करने के बजाय, कोई इसे समय के साथ आवृत्ति स्पेक्ट्रम के रूप में व्यक्त कर सकता है, जो मानव ऑडियो धारणा से अधिक सही रूप से मेल खाता है। जबकि डेटा में कमी (संपीड़न, यह हानिपूर्ण या दोषरहित हो) कोडिंग को बदलने का एक मुख्य लक्ष्य है, यह अन्य लक्ष्यों की भी अनुमति देता है: कोई व्यक्ति अंतरिक्ष की मूल मात्रा के लिए डेटा को अधिक सही रूप से प्रस्तुत कर सकता है<ref>“Although one main goal of digital audio perceptual coders is data reduction, this is not a necessary characteristic. As we shall see, perceptual coding can be used to improve the representation of digital audio through advanced bit allocation.” [http://www.noisebetweenstations.com/personal/essays/audio_on_the_internet/MaskingPaper.html Masking and Perceptual Coding], Victor Lombardi, noisebetweenstations.com</ref> - उदाहरण के लिए, सिद्धांत रूप में, यदि कोई एनालॉग या उच्च-रिज़ॉल्यूशन वाले [[ डिजिटल मास्टर ]] से शुरू होता है, तो किसी दिए गए आकार की एमपी3 फ़ाइल को उसी आकार की [[ WAV ]] या [[ AIFF ]]फ़ाइल में कच्चे असम्पीडित ऑडियो की तुलना में बेहतर प्रतिनिधित्व प्रदान करना चाहिए। ऐसा इसलिए है क्योंकि असम्पीडित ऑडियो केवल बिट दर या गहराई को कम करके फ़ाइल का आकार कम कर सकता है, जबकि ऑडियो को संपीड़ित करने से बिट दर और गहराई को बनाए रखते हुए आकार कम किया जा सकता है। यह संपीड़न पूरे बोर्ड में डेटा खोने के बजाय कम से कम महत्वपूर्ण डेटा का एक चुनिंदा नुकसान बन जाता है। इसके अलावा, एक ट्रांसफॉर्म कोडिंग डेटा में हेरफेर करने या अन्यथा संपादित करने के लिए एक बेहतर डोमेन प्रदान कर सकती है - उदाहरण के लिए, ऑडियो का [[ समानता (ऑडियो) ]]ऑडियो) सबसे स्वाभाविक रूप से रॉ टाइम डोमेन के बजाय फ़्रीक्वेंसी डोमेन (उदाहरण के लिए, बास को बढ़ावा देना) में व्यक्त किया जाता है। .


इस दृष्टिकोण से, अवधारणात्मक एन्कोडिंग अनिवार्य रूप से डेटा को त्यागने के बारे में नहीं है, बल्कि डेटा का बेहतर प्रतिनिधित्व करने के बारे में है। एक अन्य उपयोग पिछड़ा संगतता और सुंदर गिरावट के लिए है: रंगीन टेलीविजन में एक [[ चमक (वीडियो) ]] -[[ क्रोमिनेंस ]] ट्रांसफ़ॉर्म डोमेन (जैसे [[ YUV ]]) के माध्यम से एन्कोडिंग रंग का अर्थ है कि काले और सफेद सेट रंग की जानकारी को अनदेखा करते हुए ल्यूमिनेन्स प्रदर्शित करते हैं। एक अन्य उदाहरण [[ क्रोमा सबसैंपलिंग ]] है: [[ एनटीएससी ]] में उपयोग किए जाने वाले वाईआईक्यू जैसे रंग रिक्त स्थान का उपयोग, मानव धारणा के अनुरूप घटकों पर संकल्प को कम करने की अनुमति देता है - मनुष्यों के पास काले और सफेद (लुमा) के लिए उच्चतम संकल्प होता है, कम संकल्प पीले और हरे जैसे मध्य-स्पेक्ट्रम रंगों के लिए, और लाल और नीले रंग के लिए सबसे कम -इस प्रकार NTSC लगभग 350 पिक्सेल लूमा प्रति[[ स्कैनलाइन ]],150 पिक्सेल पीला बनाम हरा, और 50 पिक्सेल नीला बनाम लाल प्रदर्शित करता है, जो मानव के लिए आनुपातिक हैं  और प्रत्येक घटक की संवेदनशीलता है।
इस दृष्टिकोण से, अवधारणात्मक एन्कोडिंग अनिवार्य रूप से डेटा को त्यागने के बारे में नहीं है, बल्कि डेटा का बेहतर प्रतिनिधित्व करने के बारे में है। एक अन्य उपयोग पिछड़ा संगतता और सुंदर गिरावट के लिए है: रंगीन टेलीविजन में एक [[ चमक (वीडियो) ]] -[[ क्रोमिनेंस ]] ट्रांसफ़ॉर्म डोमेन (जैसे [[ YUV ]]) के माध्यम से एन्कोडिंग रंग का अर्थ है कि काले और सफेद सेट रंग की जानकारी को अनदेखा करते हुए ल्यूमिनेन्स प्रदर्शित करते हैं। एक अन्य उदाहरण [[ क्रोमा सबसैंपलिंग ]] है: [[ एनटीएससी ]] में उपयोग किए जाने वाले वाईआईक्यू जैसे रंग रिक्त स्थान का उपयोग, मानव धारणा के अनुरूप घटकों पर संकल्प को कम करने की अनुमति देता है - मनुष्यों के पास काले और सफेद (लुमा) के लिए उच्चतम संकल्प होता है, कम संकल्प पीले और हरे जैसे मध्य-स्पेक्ट्रम रंगों के लिए, और लाल और नीले रंग के लिए सबसे कम -इस प्रकार NTSC लगभग 350 पिक्सेल लूमा प्रति[[ स्कैनलाइन ]],150 पिक्सेल पीला बनाम हरा, और 50 पिक्सेल नीला बनाम लाल प्रदर्शित करता है, जो मानव के लिए आनुपातिक हैं  और प्रत्येक घटक की संवेदनशीलता है।
Line 44: Line 44:
* हानिपूर्ण भविष्य कहनेवाला कोडेक्स में, पिछले और/या बाद के डिकोड किए गए डेटा का उपयोग वर्तमान ध्वनि नमूने या छवि फ़्रेम की भविष्यवाणी करने के लिए किया जाता है। पूर्वानुमानित डेटा और वास्तविक डेटा के बीच त्रुटि, भविष्यवाणी को पुन: पेश करने के लिए आवश्यक किसी भी अतिरिक्त जानकारी के साथ,  फिर परिमाणित (सिग्नल प्रोसेसिंग) और कोडित किया जाता है।
* हानिपूर्ण भविष्य कहनेवाला कोडेक्स में, पिछले और/या बाद के डिकोड किए गए डेटा का उपयोग वर्तमान ध्वनि नमूने या छवि फ़्रेम की भविष्यवाणी करने के लिए किया जाता है। पूर्वानुमानित डेटा और वास्तविक डेटा के बीच त्रुटि, भविष्यवाणी को पुन: पेश करने के लिए आवश्यक किसी भी अतिरिक्त जानकारी के साथ,  फिर परिमाणित (सिग्नल प्रोसेसिंग) और कोडित किया जाता है।


कुछ प्रणालियों में दो तकनीकों को जोड़ दिया जाता है, जिसमें ट्रांसफॉर्म कोडेक्स का उपयोग भविष्य कहनेवाला चरण द्वारा उत्पन्न त्रुटि संकेतों को संपीड़ित करने के लिए किया जाता है।
कुछ प्रणालियों में दो पद्यतियों को जोड़ दिया जाता है, जिसमें ट्रांसफॉर्म कोडेक्स का उपयोग भविष्य कहनेवाला चरण द्वारा उत्पन्न त्रुटि संकेतों को संपीड़ित करने के लिए किया जाता है।


== तुलना ==
== तुलना ==
Line 61: Line 61:


* वीडियो को अत्यधिक संपीड़ित  किया जा सकता है (उदाहरण के लिए, 100:1) जिसमें गुणवत्ता कम दिखाई देती है।
* वीडियो को अत्यधिक संपीड़ित  किया जा सकता है (उदाहरण के लिए, 100:1) जिसमें गुणवत्ता कम दिखाई देती है।
* गुणवत्ता के लगभग अगोचर नुकसान के साथ ऑडियो को अक्सर 10:1 पर संपीड़ित किया जा सकता है।
* गुणवत्ता के लगभग अगोचर नुकसान के साथ ऑडियो को यद्यपि 10:1 पर संपीड़ित किया जा सकता है।
* स्थिर छवियों को अक्सर ऑडियो के साथ 10:1 पर हानिपूर्ण रूप से संकुचित किया जाता है,विशेष रूप से करीब निरीक्षण पर गुणवत्ता का नुकसान अधिक ध्यान देने योग्य है ।
* स्थिर छवियों को यद्यपि ऑडियो के साथ 10:1 पर हानिपूर्ण रूप से संकुचित किया जाता है,विशेष रूप से करीब निरीक्षण पर गुणवत्ता का नुकसान अधिक ध्यान देने योग्य है ।


== ट्रांसकोडिंग और संपादन ==
== ट्रांसकोडिंग और संपादन ==
Line 88: Line 88:


==== [[ डाउनसैंपल ]]िंग/संपीड़ित प्रतिनिधित्व मापनीयता ====
==== [[ डाउनसैंपल ]]िंग/संपीड़ित प्रतिनिधित्व मापनीयता ====
[[ बिटरेट छीलने ]]के रूप में, कोई भी पुन: एन्कोडिंग के बिना प्रतिनिधित्व किए गए स्रोत सिग्नल के रिज़ॉल्यूशन और इसके संपीड़ित प्रतिनिधित्व के लिए उपयोग किए गए डेटा की मात्रा को कम करना या अन्यथा कम करना चाहता है, लेकिन यह कार्यक्षमता सभी डिज़ाइनों में समर्थित नहीं है, क्योंकि सभी कोडेक एन्कोड नहीं करते हैं। डेटा एक ऐसे रूप में है जो कम महत्वपूर्ण विवरण को आसानी से छोड़ देता है।कुछ प्रसिद्ध डिज़ाइन जिनमें यह क्षमता होती है उनमें स्थिर छवियों के लिए[[ JPEG 2000 ]] और वीडियो के लिए H.264/MPEG-4 AVC आधारित [[ स्केलेबल वीडियो कोडिंग ]] शामिल हैं। इस तरह की योजनाओं को पुराने डिजाइनों के लिए भी मानकीकृत किया गया है, जैसे कि प्रगतिशील एन्कोडिंग के साथ जेपीईजी छवियां, और  [[ एमपीईजी -2 ]] और [[ एमपीईजी -4 भाग 2 ]] वीडियो,हालांकि उन पूर्व योजनाओं को वास्तविक दुनिया के सामान्य उपयोग में अपनाने के मामले में सीमित सफलता मिली थी। इस क्षमता के बिना, जो अक्सर व्यवहार में होता है, किसी दिए गए की तुलना में कम रिज़ॉल्यूशन या कम निष्ठा के साथ एक प्रतिनिधित्व का उत्पादन करने के लिए, किसी को मूल स्रोत सिग्नल और एन्कोड से शुरू करने की आवश्यकता होती है, या एक संपीड़ित प्रतिनिधित्व से शुरू होता है और फिर डीकंप्रेस और फिर से -इसे ([[ ट्रांसकोडिंग ]]) एन्कोड करें, हालांकि बाद वाले में डिजिटल पीढ़ी के नुकसान की प्रवृत्ति होती है।
[[ बिटरेट छीलने ]]के रूप में, कोई भी पुन: एन्कोडिंग के बिना प्रतिनिधित्व किए गए स्रोत सिग्नल के रिज़ॉल्यूशन और इसके संपीड़ित प्रतिनिधित्व के लिए उपयोग किए गए डेटा की मात्रा को कम करना या अन्यथा कम करना चाहता है, लेकिन यह कार्यक्षमता सभी डिज़ाइनों में समर्थित नहीं है, क्योंकि सभी कोडेक एन्कोड नहीं करते हैं। डेटा एक ऐसे रूप में है जो कम महत्वपूर्ण विवरण को आसानी से छोड़ देता है।कुछ प्रसिद्ध डिज़ाइन जिनमें यह क्षमता होती है उनमें स्थिर छवियों के लिए[[ JPEG 2000 ]] और वीडियो के लिए H.264/MPEG-4 AVC आधारित [[ स्केलेबल वीडियो कोडिंग ]] शामिल हैं। इस तरह की योजनाओं को पुराने डिजाइनों के लिए भी मानकीकृत किया गया है, जैसे कि प्रगतिशील एन्कोडिंग के साथ जेपीईजी छवियां, और  [[ एमपीईजी -2 ]] और [[ एमपीईजी -4 भाग 2 ]] वीडियो,हालांकि उन पूर्व योजनाओं को वास्तविक दुनिया के सामान्य उपयोग में अपनाने के मामले में सीमित सफलता मिली थी। इस क्षमता के बिना, जो यद्यपि व्यवहार में होता है, किसी दिए गए की तुलना में कम रिज़ॉल्यूशन या कम निष्ठा के साथ एक प्रतिनिधित्व का उत्पादन करने के लिए, किसी को मूल स्रोत सिग्नल और एन्कोड से शुरू करने की आवश्यकता होती है, या एक संपीड़ित प्रतिनिधित्व से शुरू होता है और फिर डीकंप्रेस और फिर से -इसे ([[ ट्रांसकोडिंग ]]) एन्कोड करें, हालांकि बाद वाले में डिजिटल पीढ़ी के नुकसान की प्रवृत्ति होती है।


एक अन्य दृष्टिकोण मूल सिग्नल को कई अलग-अलग बिटरेट पर एन्कोड करना है, और फिर या तो चुनें कि किसका उपयोग करना है (जैसे कि इंटरनेट पर स्ट्रीमिंग करते समय - जैसे कि [[ RealNetworks ]] के [[ श्योरस्ट्रीम ]] में - या अलग-अलग डाउनलोड की पेशकश, जैसे कि Apple के iTunes स्टोर पर), या प्रसारण कई, जहां सबसे अच्छा जो सफलतापूर्वक प्राप्त होता है, का उपयोग किया जाता है, जैसा कि [[ पदानुक्रमित मॉडुलन ]] के विभिन्न कार्यान्वयन में होता है। इसी तरह की तकनीकों का उपयोग [[ मिपमैप ]]्स, [[ पिरामिड (छवि प्रसंस्करण) ]] और अधिक परिष्कृत [[ स्केल स्पेस ]] विधियों में किया जाता है। कुछ ऑडियो प्रारूपों में एक हानिपूर्ण प्रारूप और एक दोषरहित सुधार का संयोजन होता है जो संयुक्त होने पर मूल संकेत को पुन: उत्पन्न करता है; सुधार को छीन लिया जा सकता है, एक छोटी, हानिपूर्ण रूप से संकुचित, फ़ाइल को छोड़कर। इस तरह के प्रारूपों में [[ एमपीईजी -4 एसएलएस ]] (लापरवाह के लिए स्केलेबल), [[ वावपैक ]], [[ ऑप्टिमफ्रोग डुअलस्ट्रीम ]], और [[ डीटीएस-एचडी मास्टर ऑडियो ]] | डीटीएस-एचडी मास्टर ऑडियो दोषरहित (एक्सएलएल) मोड में शामिल हैं)।
एक अन्य दृष्टिकोण मूल सिग्नल को कई अलग-अलग बिटरेट पर एन्कोड करना है, और फिर या तो चुनें कि किसका उपयोग करना है (जैसे कि इंटरनेट पर स्ट्रीमिंग करते समय - जैसे कि [[ RealNetworks ]] के [[ श्योरस्ट्रीम ]] में - या अलग-अलग डाउनलोड की पेशकश, जैसे कि Apple के iTunes स्टोर पर), या प्रसारण कई, जहां सबसे अच्छा जो सफलतापूर्वक प्राप्त होता है, का उपयोग किया जाता है, जैसा कि [[ पदानुक्रमित मॉडुलन ]] के विभिन्न कार्यान्वयन में होता है। इसी तरह की पद्यतियों का उपयोग [[ मिपमैप ]]्स, [[ पिरामिड (छवि प्रसंस्करण) ]] और अधिक परिष्कृत [[ स्केल स्पेस ]] विधियों में किया जाता है। कुछ ऑडियो प्रारूपों में एक हानिपूर्ण प्रारूप और एक दोषरहित सुधार का संयोजन होता है जो संयुक्त होने पर मूल संकेत को पुन: उत्पन्न करता है; सुधार को छीन लिया जा सकता है, एक छोटी, हानिपूर्ण रूप से संकुचित, फ़ाइल को छोड़कर। इस तरह के प्रारूपों में [[ एमपीईजी -4 एसएलएस ]] (लापरवाह के लिए स्केलेबल), [[ वावपैक ]], [[ ऑप्टिमफ्रोग डुअलस्ट्रीम ]], और [[ डीटीएस-एचडी मास्टर ऑडियो ]] | डीटीएस-एचडी मास्टर ऑडियो दोषरहित (एक्सएलएल) मोड में शामिल हैं)।


== तरीके ==
== तरीके ==

Revision as of 11:16, 9 November 2022

Low-compression (high quality) JPEG
High-compression (low quality) JPEG

सूचना प्रौद्योगिकी में, हानिपूर्ण संपीड़न या अपरिवर्तनीय संपीड़न डेटा संपीड़न विधियों का वर्ग है जो सूचना का प्रतिनिधित्व करने के लिए अचूक अनुमानों और आंशिक डेटा का उपयोग करता है। इन पद्यतियों का उपयोग सूचना को संग्रहीत करने, संभालने और प्रसारित करने के लिए डेटा आकार को कम करने के लिए किया जाता है। इस पृष्ठ पर बिल्ली की तस्वीर के विभिन्न संस्करणों से पता चलता है कि अधिक विवरण हटा दिए जाने पर अनुमान की उच्च डिग्री मोटे चित्र कैसे बनाती है। यह दोषरहित संपीड़न (प्रतिवर्ती डेटा संपीड़न) के विपरीत है जो डेटा को निम्न नहीं करता है। हानि रहित संपीड़न का उपयोग करके संभव डेटा कमी की मात्रा दोषरहित पद्यतियों के उपयोग की तुलना में बहुत अधिक है।

अंत-उपयोगकर्ता द्वारा गिरावट पर ध्यान दिए जाने से पहले अच्छी तरह से डिज़ाइन की गई हानिपूर्ण संपीड़न पद्यति यद्यपि फ़ाइल के आकार को काफी कम कर देती है। उपयोगकर्ता द्वारा ध्यान देने योग्य होने पर भी डेटा में और कमी वांछनीय हो सकती है (जैसे, रीयल-टाइम संचार के लिए या ट्रांसमिशन समय या भंडारण आवश्यकताओं को कम करने के लिए)। सबसे व्यापक रूप से इस्तेमाल किया जाने वाला हानिपूर्ण संपीड़न एल्गोरिदम असतत कोसाइन परिवर्तन (डीसीटी) है, जिसे पहली बार नासिर अहमद, टी नटराजन और केआर राव द्वारा 1974 में प्रकाशित किया गया था। 2019 में साइनसॉइडल-हाइपरबोलिक ट्रांसफ़ॉर्म फ़ंक्शंस का एक नया परिवार, जिसमें तुलनीय गुण और प्रदर्शन हैं डीसीटी, हानिपूर्ण संपीड़न के लिए प्रस्तावित किए गए थे।[1] हानिपूर्ण संपीड़न का उपयोग व्यापक रूप से मल्टीमीडिया डेटा (ध्वनि रिकॉर्डिंग और प्रजनन , वीडियो और छवि यों) को संपीड़ित करने के लिए किया जाता है, विशेष रूप से स्ट्रीमिंग मीडिया और वीओआइपी जैसे अनुप्रयोगों में। इसके विपरीत,दोषरहित संपीड़न आमतौर पर टेक्स्ट और डेटा फ़ाइलों, जैसे बैंक रिकॉर्ड और टेक्स्ट लेखों के लिए आवश्यक होता है। एक मास्टर रिकॉर्डिंग बनाना लाभप्रद हो सकता है जिसका उपयोग तब अतिरिक्त प्रतियाँ बनाने के लिए किया जा सकता है। यह किसी को एक हानिपूर्ण स्रोत फ़ाइल से नई संपीड़ित प्रतियों को आधार बनाने से बचने की अनुमति देता है, जो अतिरिक्त कलाकृतियों और अतिरिक्त अनावश्यक जानकारी हानि उत्पन्न करेगा।

प्रकार

कई प्रकार के डिजिटल डेटा को इस तरह से संपीड़ित करना संभव है जो इसे संग्रहीत करने के लिएआवश्यक कम्प्यूटर फाइल के आकार को कम कर देता है, या इसे प्रसारित करने के लिए आवश्यकबैंडविड्थ (कंप्यूटिंग) , मूल फ़ाइल में निहित पूरी जानकारी के बिना किसी नुकसान के। उदाहरण के लिए, एक तस्वीर को डॉट्स की एक सरणी मानकर और प्रत्येक बिंदु के रंग और चमक को निर्दिष्ट करके एक डिजिटल फ़ाइल में परिवर्तित किया जाता है। यदि चित्र में एक ही रंग का क्षेत्र है, तो इसे "लाल बिंदु, लाल बिंदु, ...(197 अधिक बार)..., लाल बिंदु" के बजाय "200 लाल बिंदु" कहकर बिना किसी नुकसान के संपीड़ित किया जा सकता है।

मूल डेटा में एक निश्चित मात्रा में जानकारी होती है, और फ़ाइल के आकार की एक निचली सीमा होती है जिसमें सभी जानकारी हो सकती है। बुनियादी सूचना सिद्धांत कहता है कि इस डेटा के आकार को कम करने की एक पूर्ण सीमा है। जब डेटा संपीड़ित होता है, तो इसकी सॉफ्टवेयर एन्ट्रापी बढ़ जाती है, और यह अनिश्चित काल तक नहीं बढ़ सकती है। उदाहरण के लिए, एक संपीड़ित ज़िप (फ़ाइल प्रारूप) अपने मूल से छोटी होती है,लेकिन एक ही फ़ाइल को बार-बार संपीड़ित करने से आकार कम नहीं होगा। अधिकांश संपीड़न एल्गोरिदम यह पहचान सकते हैं कि आगे संपीड़न कब व्यर्थ होगा और वास्तव में डेटा के आकार को बढ़ाएगा।

कई मामलों में, फ़ाइलों या डेटा स्ट्रीम में ज़रूरत से ज़्यादा जानकारी होती है। उदाहरण के लिए, एक चित्र में अधिक विवरण हो सकता है, जब आंख सबसे बड़े आकार में पुन: प्रस्तुत करने पर अंतर कर सकती है; इसी तरह, एक ऑडियो फ़ाइल को बहुत तेज़ आवाज़ के दौरान बहुत अधिक बारीक विवरण की आवश्यकता नहीं होती है। हानिपूर्ण संपीड़न पद्यतियों को विकसित करना जितना संभव हो सके मानवीय धारणा से मेल खाता है, एक जटिल कार्य है। कभी-कभी आदर्श एक फ़ाइल होती है जो मूल के समान ही धारणा प्रदान करती है, जितनी संभव हो उतनी डिजिटल जानकारी को हटा दिया जाता है; दूसरी बार, गुणवत्ता के प्रत्यक्ष नुकसान को एक वैध व्यापार माना जाता है।

"नुकसान" के नकारात्मक प्रभावों को रोकने के लिए, कुछ अनुप्रयोगों, जैसे कि चिकित्सा छवि संपीड़न, के लिए "अपरिवर्तनीय" और "प्रतिवर्ती" शब्द क्रमशः "हानिपूर्ण" और "दोषरहित" पसंद किए जाते हैं। नुकसान का प्रकार और मात्रा छवियों की उपयोगिता को प्रभावित कर सकती है। संपीड़न के विरूपण साक्ष्य या अवांछनीय प्रभाव स्पष्ट रूप से देखे जा सकते हैं फिर भी परिणाम अभी भी इच्छित उद्देश्य के लिए उपयोगी हैं। या हानिपूर्ण संपीड़ित छवियां 'नेत्रहीन दोषरहित' हो सकती हैं, या चिकित्सा छवियों के मामले में,मानों नैदानिक ​​रूप से स्वीकार्य अपरिवर्तनीय संपीड़न (DAIC) को लागू किया जा सकता है।[2]

ट्रांसफॉर्म कोडिंग

हानिपूर्ण संपीड़न के कुछ रूपों को ट्रांसफॉर्म कोडिंग के एक अनुप्रयोग के रूप में माना जा सकता है, जो डिजिटल छवियों, डिजिटल ऑडियो सिग्नल (सूचना सिद्धांत) और डिजिटल वीडियो के लिए उपयोग किया जाने वाला डेटा संपीड़न का एक प्रकार है। रूपांतरण आमतौर पर बेहतर (अधिक लक्षित) परिमाणीकरण (सिग्नल प्रोसेसिंग) करने के लिए उपयोग किया जाता है। एप्लिकेशन के ज्ञान का उपयोग जानकारी को त्यागने के लिए और चुनने के लिए किया जाता है, जिससे इसकी बैंडविड्थ कम हो जाती है। फिर शेष जानकारी को विभिन्न तरीकों से संपीड़ित किया जा सकता है। जब आउटपुट को डीकोड किया जाता है, तो परिणाम मूल इनपुट के समान नहीं हो सकता है, लेकिन आवेदन के उद्देश्य के लिए पर्याप्त रूप से करीब होने की उम्मीद है।

हानिपूर्ण संपीड़न का सबसे सामान्य रूप एक ट्रांसफ़ॉर्म कोडिंग विधि है,कोसाइन ट्रांसफ़ॉर्म (DCT),[3] जिसे पहली बार 1974 में नासिर अहमद, टी. नटराजन और के.आर. राव ने प्रकाशित किया था।[4] लोकप्रिय छवि संपीड़न प्रारूपों (जैसे जेपीईजी ) ,[5] वीडियो कोडिंग मानक (जैसे MPEG और H.264/AVC) और ऑडियो संपीड़न (डेटा) प्रारूप (जैसे MP3 और उन्नत ऑडियो कोडेक ) के लिए DCT हानिपूर्ण संपीड़न का सबसे व्यापक रूप से उपयोग किया जाने वाला रूप है।

ऑडियो डेटा के मामले में, ट्रांसफ़ॉर्मिंग कोडिंग का एक लोकप्रिय रूप अवधारणात्मक कोडिंग है,जो कच्चे डेटा को एक ऐसे डोमेन में बदल देता है जो सूचना सूचना को अधिक सटीक रूप से दर्शाता है। उदाहरण के लिए, समय के साथ आयाम स्तरों के रूप में ध्वनि फ़ाइल को व्यक्त करने के बजाय, कोई इसे समय के साथ आवृत्ति स्पेक्ट्रम के रूप में व्यक्त कर सकता है, जो मानव ऑडियो धारणा से अधिक सही रूप से मेल खाता है। जबकि डेटा में कमी (संपीड़न, यह हानिपूर्ण या दोषरहित हो) कोडिंग को बदलने का एक मुख्य लक्ष्य है, यह अन्य लक्ष्यों की भी अनुमति देता है: कोई व्यक्ति अंतरिक्ष की मूल मात्रा के लिए डेटा को अधिक सही रूप से प्रस्तुत कर सकता है[6] - उदाहरण के लिए, सिद्धांत रूप में, यदि कोई एनालॉग या उच्च-रिज़ॉल्यूशन वाले डिजिटल मास्टर से शुरू होता है, तो किसी दिए गए आकार की एमपी3 फ़ाइल को उसी आकार की WAV या AIFF फ़ाइल में कच्चे असम्पीडित ऑडियो की तुलना में बेहतर प्रतिनिधित्व प्रदान करना चाहिए। ऐसा इसलिए है क्योंकि असम्पीडित ऑडियो केवल बिट दर या गहराई को कम करके फ़ाइल का आकार कम कर सकता है, जबकि ऑडियो को संपीड़ित करने से बिट दर और गहराई को बनाए रखते हुए आकार कम किया जा सकता है। यह संपीड़न पूरे बोर्ड में डेटा खोने के बजाय कम से कम महत्वपूर्ण डेटा का एक चुनिंदा नुकसान बन जाता है। इसके अलावा, एक ट्रांसफॉर्म कोडिंग डेटा में हेरफेर करने या अन्यथा संपादित करने के लिए एक बेहतर डोमेन प्रदान कर सकती है - उदाहरण के लिए, ऑडियो का समानता (ऑडियो) ऑडियो) सबसे स्वाभाविक रूप से रॉ टाइम डोमेन के बजाय फ़्रीक्वेंसी डोमेन (उदाहरण के लिए, बास को बढ़ावा देना) में व्यक्त किया जाता है। .

इस दृष्टिकोण से, अवधारणात्मक एन्कोडिंग अनिवार्य रूप से डेटा को त्यागने के बारे में नहीं है, बल्कि डेटा का बेहतर प्रतिनिधित्व करने के बारे में है। एक अन्य उपयोग पिछड़ा संगतता और सुंदर गिरावट के लिए है: रंगीन टेलीविजन में एक चमक (वीडियो) -क्रोमिनेंस ट्रांसफ़ॉर्म डोमेन (जैसे YUV ) के माध्यम से एन्कोडिंग रंग का अर्थ है कि काले और सफेद सेट रंग की जानकारी को अनदेखा करते हुए ल्यूमिनेन्स प्रदर्शित करते हैं। एक अन्य उदाहरण क्रोमा सबसैंपलिंग है: एनटीएससी में उपयोग किए जाने वाले वाईआईक्यू जैसे रंग रिक्त स्थान का उपयोग, मानव धारणा के अनुरूप घटकों पर संकल्प को कम करने की अनुमति देता है - मनुष्यों के पास काले और सफेद (लुमा) के लिए उच्चतम संकल्प होता है, कम संकल्प पीले और हरे जैसे मध्य-स्पेक्ट्रम रंगों के लिए, और लाल और नीले रंग के लिए सबसे कम -इस प्रकार NTSC लगभग 350 पिक्सेल लूमा प्रतिस्कैनलाइन ,150 पिक्सेल पीला बनाम हरा, और 50 पिक्सेल नीला बनाम लाल प्रदर्शित करता है, जो मानव के लिए आनुपातिक हैं  और प्रत्येक घटक की संवेदनशीलता है।

सूचना हानि

हानिपूर्ण संपीड़न प्रारूप पीढ़ी हानि से ग्रस्त हैं: फ़ाइल को बार-बार संपीड़ित करने और विघटित करने से यह उत्तरोत्तर गुणवत्ता खो देगा। यह दोषरहित डेटा संपीड़न के विपरीत है, जहां इस तरह की प्रक्रिया के उपयोग से डेटा खो नहीं जाएगा। हानिपूर्ण डेटा संपीड़न के लिए सूचना-सैद्धांतिक नींव दर-विकृति सिद्धांत द्वारा प्रदान की जाती है। इष्टतम कोडिंग सिद्धांत में संभाव्यता के उपयोग की तरह,दर-विरूपण सिद्धांत अवधारणात्मक विकृति और यहां तक ​​कि सौंदर्य निर्णय को प्रतिरूप करने के लिए बायेसियन सिद्धांत अनुमान सिद्धांत और निर्णय सिद्धांत पर भारी पड़ता है।

दो मूल हानिपूर्ण संपीड़न योजनाएँ हैं:

  • हानिपूर्ण रूपांतरण कोडेक ्स में, चित्र या ध्वनि के नमूने लिए जाते हैं, छोटे खंडों में काटे जाते हैं, एक नए आधार (रैखिक बीजगणित) स्थान में रूपांतरित होते हैं, और परिमाणीकरण (सिग्नल प्रोसेसिंग) होते हैं। परिणामी परिमाणित मान तब एन्ट्रॉपी एन्कोडिंग हैं।
  • हानिपूर्ण भविष्य कहनेवाला कोडेक्स में, पिछले और/या बाद के डिकोड किए गए डेटा का उपयोग वर्तमान ध्वनि नमूने या छवि फ़्रेम की भविष्यवाणी करने के लिए किया जाता है। पूर्वानुमानित डेटा और वास्तविक डेटा के बीच त्रुटि, भविष्यवाणी को पुन: पेश करने के लिए आवश्यक किसी भी अतिरिक्त जानकारी के साथ, फिर परिमाणित (सिग्नल प्रोसेसिंग) और कोडित किया जाता है।

कुछ प्रणालियों में दो पद्यतियों को जोड़ दिया जाता है, जिसमें ट्रांसफॉर्म कोडेक्स का उपयोग भविष्य कहनेवाला चरण द्वारा उत्पन्न त्रुटि संकेतों को संपीड़ित करने के लिए किया जाता है।

तुलना

दोषरहित विधियों पर हानिपूर्ण विधियों का लाभ यह है कि कुछ मामलों में एक हानिपूर्ण विधि किसी भी दोषरहित विधि की तुलना में बहुत छोटी संपीड़ित फ़ाइल उत्पन्न कर सकती है, जबकि अभी भी अनुप्रयोग की आवश्यकताओं को पूरा करती है। ध्वनि, छवियों या वीडियो को संपीड़ित करने के लिए हानिपूर्ण तरीकों का सबसे अधिक उपयोग किया जाता है। ऐसा इसलिए है क्योंकि इस प्रकार के डेटा मानवीय व्याख्या के लिए अभिप्रेत हैं, जहां दिमाग आसानी से "रिक्त स्थान भर सकता है" या पिछली बहुत छोटी त्रुटियों या विसंगतियों को देख सकता है - आदर्श रूप से हानिपूर्ण संपीड़नपारदर्शिता (डेटा संपीड़न) (अगोचर) होता है, जिसे एबीएक्स परीक्षण माध्यम से सत्यापित किया जा सकता है। परीक्षण। हानिपूर्ण संपीड़न का उपयोग करने वाली डेटा फ़ाइलें आकार में छोटी होती हैं और इस प्रकार इंटरनेट पर स्टोर करने और संचारित करने के लिए कम लागत होती है, Netflix जैसी वीडियो सेवाओं को स्ट्रीमिंग करने और Spotify जैसी ऑडियो सेवाओं को स्ट्रीमिंग करने के लिए एक महत्वपूर्ण विचार है।

भावनात्मक प्रभाव

ऑडियो इंजीनियरिंग लाइब्रेरी द्वारा किए गए एक अध्ययन ने निष्कर्ष निकाला कि कम बिट दर (112 केबीपीएस) हानिपूर्ण संपीड़न प्रारूप जैसे एमपी3 का टिम्ब्रल और भावनात्मक विशेषताओं पर अलग प्रभाव पड़ता है, नकारात्मक भावनात्मक गुणों को मजबूत करने और सकारात्मक को कमजोर करने के लिए प्रवृत्त होता है।[7] अध्ययन में आगे कहा गया है कि तुरही संपीड़न से सबसे अधिक प्रभावित होने वाला उपकरण है, जबकि हॉर्न (वाद्य) सबसे कम है।

पारदर्शिता

जब कोई उपयोगकर्ता हानिपूर्ण रूप से संपीड़ित फ़ाइल प्राप्त करता है, (उदाहरण के लिए, डाउनलोड समय को कम करने के लिए) पुनर्प्राप्त फ़ाइल बिट स्तर पर मूल से काफी भिन्न हो सकती है जबकि अधिकांश व्यावहारिक उद्देश्यों के लिए मानव कान या आंख से अलग नहीं हो सकती है। उदाहरण के लिए,कई संपीड़न विधियां मानव शरीर क्रिया विज्ञान की विशिष्टताओं पर ध्यान केंद्रित करती हैं, उदाहरण के लिए, कि मानव आंख प्रकाश की केवल कुछ तरंग दैर्ध्य देख सकती है। मनो-ध्वनिक मॉडल बताता है कि कथित गुणवत्ता को कम किए बिना ध्वनि को अत्यधिक संकुचित कैसे किया जा सकता है। हानिपूर्ण संपीड़न के कारण होने वाली खामियां जो मानव आंख या कान पर ध्यान देने योग्य होती हैं, उन्हें संपीड़न कलाकृतियों के रूप में जाना जाता है।

संपीड़न अनुपात

हानिपूर्ण वीडियो कोडेक्स का डेटा संपीड़न अनुपात (अर्थात, असम्पीडित फ़ाइल की तुलना में संपीड़ित फ़ाइल का आकार) लगभग हमेशा ऑडियो और स्थिर-छवि समकक्षों की तुलना में बहुत बेहतर होता है।

  • वीडियो को अत्यधिक संपीड़ित किया जा सकता है (उदाहरण के लिए, 100:1) जिसमें गुणवत्ता कम दिखाई देती है।
  • गुणवत्ता के लगभग अगोचर नुकसान के साथ ऑडियो को यद्यपि 10:1 पर संपीड़ित किया जा सकता है।
  • स्थिर छवियों को यद्यपि ऑडियो के साथ 10:1 पर हानिपूर्ण रूप से संकुचित किया जाता है,विशेष रूप से करीब निरीक्षण पर गुणवत्ता का नुकसान अधिक ध्यान देने योग्य है ।

ट्रांसकोडिंग और संपादन

हानिपूर्ण संपीड़न (औपचारिक रूप से ट्रांसकोडिंग) के बारे में एक महत्वपूर्ण चेतावनी यह है कि हानिपूर्ण रूप से संपीड़ित फ़ाइलों को संपादित करने से पुन: एन्कोडिंग सेडिजिटल पीढ़ी का नुकसान होता है।इसे केवल (दोषरहित) मूल से हानिपूर्ण फ़ाइलों का निर्माण करके और केवल मूल फ़ाइलों को संपादित (प्रतियां) करके टाला जा सकता है, जैसे कि जेपीईजी के बजायकच्ची छवि प्रारूप में छवियां।यदि डेटा जो हानिपूर्ण रूप से संकुचित किया गया है, डीकोड किया गया है और दोषरहित रूप से संपीड़ित किया गया है, तो परिणाम का आकार हानिपूर्ण संपीड़न से पहले डेटा के आकार के साथ तुलनीय हो सकता है, लेकिन पहले से खोए हुए डेटा को पुनर्प्राप्त नहीं किया जा सकता है। मूल को रखे बिना हानिपूर्ण रूपांतरण का उपयोग करने का निर्णय लेते समय, भविष्य में सॉफ़्टवेयर या (प्रारूप स्थानांतरण ) के साथ संगतता प्राप्त करने के लिए, या संकुचित फ़ाइलों के डिकोडिंग या वितरण के लिए सॉफ्टवेयर पेटेंट का भुगतान करने से बचने के लिए प्रारूप रूपांतरण की आवश्यकता हो सकती है।

हानिपूर्ण फाइलों का संपादन

डीकोडिंग और री-एन्कोडिंग के बिना सीधे संपीड़ित डेटा को संशोधित करके, गुणवत्ता में गिरावट के बिना हानिपूर्ण संपीड़ित फ़ाइलों का कुछ संपादन संभव है। संपादन जो फ़ाइल के आकार को कम कर देता है जैसे कि इसे अधिक से अधिक मात्रा में संकुचित किया गया हो, लेकिन इससे अधिक हानि के बिना, कभी-कभी संभव भी होता है।

जेपीईजी

JPEG के दोषरहित संपादन के लिए प्राथमिक कार्यक्रम हैं: jpegtran, और व्युत्पन्न exiftran (जो Exif जानकारी भी सुरक्षित रखता है), और Jpegcrop (जो एक विंडोज़ इंटरफ़ेस प्रदान करता है)।

ये छवि को फसल (छवि) छवि)करने, घुमाने, फ़्लिप करने और फ़्लॉप करने की अनुमति देते हैं, या यहां तक ​​कि ग्रेस्केल में परिवर्तित हो जाते हैं (क्रोमिनेंस चैनल को छोड़कर)। जबकि अवांछित जानकारी को नष्ट कर दिया जाता है, शेष भाग की गुणवत्ता अपरिवर्तित रहती है।

कुछ अन्य रूपांतरण कुछ हद तक संभव हैं, जैसे समान एन्कोडिंग वाली छवियों को जोड़ना (एक साथ मिलकर, जैसे कि ग्रिड पर रचना करना) या मौजूदा छवियों पर लोगो जैसे चित्र चिपकाना (दोनों के माध्यम से) /jpegjoin/ Jpegjoin), या स्केलिंग।[8] पुन: एन्कोडिंग के बिना संपीड़न में कुछ परिवर्तन किए जा सकते हैं:

  • संपीड़न को अनुकूलित करना (डीकोड की गई छवि में बदलाव किए बिना आकार को कम करने के लिए)
  • प्रगतिशील और गैर-प्रगतिशील एन्कोडिंग के बीच रूपांतरण।

फ्रीवेयर विंडोज-ओनली इरफान व्यू JPG_TRANSFORM प्लग-इन (कंप्यूटिंग) में कुछ दोषरहित JPEG संचालन हैं।।

मेटाडेटा

मेटाडेटा, जैसे कि ID3 टैग, वोरबिस टिप्पणियाँ, या Exif जानकारी, आमतौर पर अंतर्निहित डेटा को संशोधित किए बिना संशोधित या हटाई जा सकती हैं।

डाउनसैंपल िंग/संपीड़ित प्रतिनिधित्व मापनीयता

बिटरेट छीलने के रूप में, कोई भी पुन: एन्कोडिंग के बिना प्रतिनिधित्व किए गए स्रोत सिग्नल के रिज़ॉल्यूशन और इसके संपीड़ित प्रतिनिधित्व के लिए उपयोग किए गए डेटा की मात्रा को कम करना या अन्यथा कम करना चाहता है, लेकिन यह कार्यक्षमता सभी डिज़ाइनों में समर्थित नहीं है, क्योंकि सभी कोडेक एन्कोड नहीं करते हैं। डेटा एक ऐसे रूप में है जो कम महत्वपूर्ण विवरण को आसानी से छोड़ देता है।कुछ प्रसिद्ध डिज़ाइन जिनमें यह क्षमता होती है उनमें स्थिर छवियों के लिएJPEG 2000 और वीडियो के लिए H.264/MPEG-4 AVC आधारित स्केलेबल वीडियो कोडिंग शामिल हैं। इस तरह की योजनाओं को पुराने डिजाइनों के लिए भी मानकीकृत किया गया है, जैसे कि प्रगतिशील एन्कोडिंग के साथ जेपीईजी छवियां, और एमपीईजी -2 और एमपीईजी -4 भाग 2 वीडियो,हालांकि उन पूर्व योजनाओं को वास्तविक दुनिया के सामान्य उपयोग में अपनाने के मामले में सीमित सफलता मिली थी। इस क्षमता के बिना, जो यद्यपि व्यवहार में होता है, किसी दिए गए की तुलना में कम रिज़ॉल्यूशन या कम निष्ठा के साथ एक प्रतिनिधित्व का उत्पादन करने के लिए, किसी को मूल स्रोत सिग्नल और एन्कोड से शुरू करने की आवश्यकता होती है, या एक संपीड़ित प्रतिनिधित्व से शुरू होता है और फिर डीकंप्रेस और फिर से -इसे (ट्रांसकोडिंग ) एन्कोड करें, हालांकि बाद वाले में डिजिटल पीढ़ी के नुकसान की प्रवृत्ति होती है।

एक अन्य दृष्टिकोण मूल सिग्नल को कई अलग-अलग बिटरेट पर एन्कोड करना है, और फिर या तो चुनें कि किसका उपयोग करना है (जैसे कि इंटरनेट पर स्ट्रीमिंग करते समय - जैसे कि RealNetworks के श्योरस्ट्रीम में - या अलग-अलग डाउनलोड की पेशकश, जैसे कि Apple के iTunes स्टोर पर), या प्रसारण कई, जहां सबसे अच्छा जो सफलतापूर्वक प्राप्त होता है, का उपयोग किया जाता है, जैसा कि पदानुक्रमित मॉडुलन के विभिन्न कार्यान्वयन में होता है। इसी तरह की पद्यतियों का उपयोग मिपमैप ्स, पिरामिड (छवि प्रसंस्करण) और अधिक परिष्कृत स्केल स्पेस विधियों में किया जाता है। कुछ ऑडियो प्रारूपों में एक हानिपूर्ण प्रारूप और एक दोषरहित सुधार का संयोजन होता है जो संयुक्त होने पर मूल संकेत को पुन: उत्पन्न करता है; सुधार को छीन लिया जा सकता है, एक छोटी, हानिपूर्ण रूप से संकुचित, फ़ाइल को छोड़कर। इस तरह के प्रारूपों में एमपीईजी -4 एसएलएस (लापरवाह के लिए स्केलेबल), वावपैक , ऑप्टिमफ्रोग डुअलस्ट्रीम , और डीटीएस-एचडी मास्टर ऑडियो | डीटीएस-एचडी मास्टर ऑडियो दोषरहित (एक्सएलएल) मोड में शामिल हैं)।

तरीके

ग्राफिक्स

छवि

3डी कंप्यूटर ग्राफिक्स

  • ग्लटीएफ

वीडियो

ऑडियो


सामान्य


भाषण

  1. Abedi, M.; Sun, B.; Zheng, Z. (July 2019). "A Sinusoidal-Hyperbolic Family of Transforms With Potential Applications in Compressive Sensing". IEEE Transactions on Image Processing. 28 (7): 3571–3583. Bibcode:2019ITIP...28.3571A. doi:10.1109/TIP.2019.2912355. PMID 31071031. S2CID 174820107.
  2. European Society of Radiology (2011). "Usability of irreversible image compression in radiological imaging. A position paper by the European Society of Radiology (ESR)". Insights Imaging. 2 (2): 103–115. doi:10.1007/s13244-011-0071-x. PMC 3259360. PMID 22347940.
  3. "Data compression". Encyclopedia Britannica. Retrieved 13 August 2019.
  4. Ahmed, Nasir; Natarajan, T.; Rao, K. R. (January 1974), "Discrete Cosine Transform", IEEE Transactions on Computers, C-23 (1): 90–93, doi:10.1109/T-C.1974.223784, S2CID 149806273
  5. "T.81 – DIGITAL COMPRESSION AND CODING OF CONTINUOUS-TONE STILL IMAGES – REQUIREMENTS AND GUIDELINES" (PDF). CCITT. September 1992. Retrieved 12 July 2019.
  6. “Although one main goal of digital audio perceptual coders is data reduction, this is not a necessary characteristic. As we shall see, perceptual coding can be used to improve the representation of digital audio through advanced bit allocation.” Masking and Perceptual Coding, Victor Lombardi, noisebetweenstations.com
  7. Svetlik, Joe (December 5, 2016). "MP3s make you less happy, study says". What Hi Fi?. What Hi Fi?. Retrieved December 17, 2018.
  8. "New jpegtran features". sylvana.net. Retrieved 2019-09-20.
  9. 9.0 9.1 9.2 9.3 9.4 9.5 Stanković, Radomir S.; Astola, Jaakko T. (2012). "Reminiscences of the Early Work in DCT: Interview with K.R. Rao" (PDF). Reprints from the Early Days of Information Sciences. 60. Retrieved 13 October 2019.
  10. 10.0 10.1 K. R. Rao and J. J. Hwang, Techniques and Standards for Image, Video, and Audio Coding, Prentice Hall, 1996; JPEG: Chapter 8; H.261: Chapter 9; MPEG-1: Chapter 10; MPEG-2: Chapter 11.
  11. Guckert, John (Spring 2012). "The Use of FFT and MDCT in MP3 Audio Compression" (PDF). University of Utah. Retrieved 14 July 2019.
  12. Brandenburg, Karlheinz (1999). "MP3 and AAC Explained" (PDF). Archived (PDF) from the original on 2017-02-13.
  13. Darko, John H. (2017-03-29). "The inconvenient truth about Bluetooth audio". DAR__KO. Archived from the original on 2018-01-14. Retrieved 2018-01-13.
  14. Ford, Jez (2015-08-24). "What is Sony LDAC, and how does it do it?". AVHub. Retrieved 2018-01-13.
  15. Ford, Jez (2016-11-22). "aptX HD - lossless or lossy?". AVHub. Retrieved 2018-01-13.