परिमाणीकरण (छवि प्रसंस्करण): Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
 
(4 intermediate revisions by 3 users not shown)
Line 1: Line 1:
[[छवि]] प्रसंस्करण में शामिल क्वांटाइजेशन, [[हानिपूर्ण संपीड़न]] तकनीक है जो मानों की श्रृंखला को क्वांटम (असतत) मान में संपीड़ित करके प्राप्त की जाती है। जब किसी दिए गए स्ट्रीम में अलग-अलग प्रतीकों की संख्या कम हो जाती है, तो स्ट्रीम अधिक संपीड़ित हो जाती है। उदाहरण के लिए, किसी डिजिटल छवि को दर्शाने के लिए आवश्यक रंगों की संख्या कम करने से इसके फ़ाइल आकार को कम करना संभव हो जाता है। विशिष्ट अनुप्रयोगों में [[JPEG]] में [[असतत कोसाइन परिवर्तन]] डेटा परिमाणीकरण और [[JPEG 2000]] में [[असतत तरंगिका परिवर्तन]] डेटा परिमाणीकरण शामिल हैं।
प्रतिरूप प्रसंस्करण में सम्मिलित '''परिमाणीकरण''', एक ऐसी [[हानिपूर्ण संपीड़न]] तकनीक है जो मानों की श्रृंखला को क्वांटम (असतत) मान में संपीड़ित करके प्राप्त की जाती है। जब किसी दिए गए प्रवाह में अलग-अलग प्रतीकों की संख्या कम हो जाती है, तो प्रवाह अधिक संपीड़ित हो जाती है। इस प्रकार से उदाहरण के लिए, किसी डिजिटल प्रतिरूप को दर्शाने के लिए आवश्यक वर्णों की संख्या कम करने से इसके फ़ाइल आकार को कम करना संभव हो जाता है। विशिष्ट अनुप्रयोगों में [[JPEG|जेपीइजी]] में [[असतत कोसाइन परिवर्तन|असतत कोज्या परिवर्तन]] डेटा परिमाणीकरण और [[JPEG 2000|जेपीइजी 2000]] में [[असतत तरंगिका परिवर्तन]] डेटा परिमाणीकरण सम्मिलित हैं।


== रंग परिमाणीकरण ==
== वर्ण परिमाणीकरण ==
{{main|Color quantization}}
{{main|वर्ण परिमाणीकरण}}


रंग परिमाणीकरण किसी छवि में उपयोग किए गए रंगों की संख्या को कम कर देता है; यह उन उपकरणों पर छवियों को प्रदर्शित करने के लिए महत्वपूर्ण है जो सीमित संख्या में रंगों का समर्थन करते हैं और कुछ प्रकार की छवियों को कुशलतापूर्वक संपीड़ित करने के लिए महत्वपूर्ण हैं। अधिकांश बिटमैप संपादकों और कई ऑपरेटिंग सिस्टमों में रंग परिमाणीकरण के लिए अंतर्निहित समर्थन होता है। लोकप्रिय आधुनिक रंग परिमाणीकरण एल्गोरिदम में निकटतम रंग एल्गोरिदम (निश्चित पैलेट के लिए), [[मध्य कट]] और [[ अष्टक ]]ज़ पर आधारित एल्गोरिदम शामिल हैं।
वर्ण परिमाणीकरण किसी प्रतिरूप में उपयोग किए गए वर्णों की संख्या को कम कर देता है; यह उन उपकरणों पर प्रतिरूपों को प्रदर्शित करने के लिए महत्वपूर्ण है जो सीमित संख्या में वर्णों का समर्थन करते हैं और कुछ प्रकार की प्रतिरूपों को कुशलतापूर्वक संपीड़ित करने के लिए महत्वपूर्ण हैं। अतः अधिकांश बिट प्रतिचित्र संपादकों और कई ऑपरेटिंग सिस्टमों में वर्ण परिमाणीकरण के लिए अंतर्निहित समर्थन होता है। लोकप्रिय आधुनिक वर्ण परिमाणीकरण एल्गोरिदम में निकटतम वर्ण एल्गोरिदम (निश्चित पैलेट के लिए), [[मध्य कट]] और [[ अष्टक |ओक्ट्रीज]] पर आधारित एल्गोरिदम सम्मिलित हैं।


बड़ी संख्या में रंगों की छाप बनाने और [[रंग बैंडिंग]] कलाकृतियों को खत्म करने के लिए रंग परिमाणीकरण को [[ तड़पना ]]िंग के साथ जोड़ना आम बात है।
इस प्रकार से बड़ी संख्या में वर्णों की धारणा बनाने और [[रंग बैंडिंग|वर्ण बैंडिंग]] कलाकृतियों को समाप्त करने के लिए वर्ण परिमाणीकरण को [[ तड़पना |स्पंदन]] के साथ जोड़ना सामान्य बात है।


== छवि संपीड़न के लिए आवृत्ति परिमाणीकरण ==
== प्रतिरूप संपीड़न के लिए आवृत्ति परिमाणीकरण ==


मानव आंख अपेक्षाकृत बड़े क्षेत्र में [[चमक]] में छोटे अंतर देखने में काफी अच्छी है, लेकिन उच्च आवृत्ति (तेजी से बदलती) चमक भिन्नता की सटीक ताकत को पहचानने में इतनी अच्छी नहीं है। यह तथ्य उच्च आवृत्ति घटकों को अनदेखा करके आवश्यक जानकारी की मात्रा को कम करने की अनुमति देता है। यह केवल आवृत्ति डोमेन में प्रत्येक घटक को उस घटक के लिए स्थिरांक से विभाजित करके और फिर निकटतम पूर्णांक तक पूर्णांकित करके किया जाता है। यह पूरी प्रक्रिया में मुख्य हानिपूर्ण ऑपरेशन है। इसके परिणामस्वरूप, आम तौर पर ऐसा होता है कि उच्च आवृत्ति वाले कई घटकों को शून्य तक पूर्णांकित कर दिया जाता है, और बाकी कई छोटे सकारात्मक या नकारात्मक संख्या बन जाते हैं।
अतः मानव नेत्र अपेक्षाकृत बड़े क्षेत्र में [[चमक|प्रकाश]] में छोटे अंतर देखने में अत्यधिक ठीक है, परन्तु उच्च आवृत्ति (तीव्रता से परिवर्तित होती) प्रकाश भिन्नता की यथार्थ दृढ़ता को पहचानने में इतना स्पष्ट नहीं है। इस प्रकार से यह तथ्य उच्च आवृत्ति घटकों को अनदेखा करके आवश्यक सूचना की मात्रा को कम करने की अनुमति देता है। अतः यह मात्र आवृत्ति डोमेन में प्रत्येक घटक को उस घटक के लिए स्थिरांक से विभाजित करके और फिर निकटतम पूर्णांक तक पूर्णांकित करके किया जाता है। यह पूर्ण प्रक्रिया में मुख्य हानिपूर्ण संचालन है। इस प्रकार से इसके परिणामस्वरूप, सामान्यतः ऐसा होता है कि उच्च आवृत्ति वाले कई घटकों को शून्य तक पूर्णांकित कर दिया जाता है, और शेष कई छोटे धनात्मक या ऋणात्मक संख्या बन जाते हैं।


चूंकि मानव दृष्टि भी [[क्रोमिनेंस]] की तुलना में [[luminance]] के प्रति अधिक संवेदनशील है, गैर-आरजीबी रंग स्थान में काम करके और अधिक संपीड़न प्राप्त किया जा सकता है जो दोनों को अलग करता है (उदाहरण के लिए, [[वाईसीबीसीआर]]), और चैनलों को अलग-अलग मात्राबद्ध करता है।<ref name="wiseman">John Wiseman, ''An Introduction to MPEG Video Compression'', https://web.archive.org/web/20111115004238/http://www.john-wiseman.com/technical/MPEG_tutorial.htm</ref>
चूंकि मानव दृष्टि भी [[क्रोमिनेंस]] की तुलना में [[luminance|ल्युमिनेंस]] के प्रति अधिक संवेदनशील है, गैर-आरजीबी वर्ण स्थान में कार्य करके और अधिक संपीड़न प्राप्त किया जा सकता है जो दोनों को अलग करता है (उदाहरण के लिए, [[वाईसीबीसीआर]]), और चैनलों को अलग-अलग मात्राबद्ध करता है।<ref name="wiseman">John Wiseman, ''An Introduction to MPEG Video Compression'', https://web.archive.org/web/20111115004238/http://www.john-wiseman.com/technical/MPEG_tutorial.htm</ref>
=== परिमाणीकरण मैट्रिक्स ===
=== परिमाणीकरण आव्यूह ===


एक विशिष्ट वीडियो कोडेक चित्र को अलग-अलग ब्लॉकों (एमपीईजी के मामले में 8×8 पिक्सेल) में तोड़कर काम करता है<ref name="wiseman"/>). इन ब्लॉकों को क्षैतिज और लंबवत दोनों तरह से आवृत्ति घटकों की गणना करने के लिए असतत कोसाइन ट्रांसफॉर्म (डीसीटी) के अधीन किया जा सकता है।<ref name="wiseman"/>परिणामी ब्लॉक (मूल ब्लॉक के समान आकार) को फिर परिमाणीकरण स्केल कोड द्वारा पूर्व-गुणा किया जाता है और परिमाणीकरण मैट्रिक्स द्वारा तत्व-वार विभाजित किया जाता है, और प्रत्येक परिणामी तत्व को गोल किया जाता है। परिमाणीकरण मैट्रिक्स को अधिक से अधिक घटकों को 0 में बदलने के अलावा कम बोधगम्य घटकों (आमतौर पर उच्च आवृत्तियों पर कम आवृत्तियों) की तुलना में अधिक बोधगम्य आवृत्ति घटकों को अधिक रिज़ॉल्यूशन प्रदान करने के लिए डिज़ाइन किया गया है, जिसे सबसे बड़ी दक्षता के साथ एन्कोड किया जा सकता है। कई वीडियो एनकोडर (जैसे [[DivX]], [[Xvid]], और [[3ivx]]) और संपीड़न मानक (जैसे [[MPEG-2]] और H.264/AVC) कस्टम मैट्रिक्स का उपयोग करने की अनुमति देते हैं। पूर्ण क्वांटाइज़र मैट्रिक्स की तुलना में बहुत कम बैंडविड्थ लेते हुए, क्वांटाइज़र स्केल कोड को बदलकर कमी की सीमा भिन्न हो सकती है।<ref name="wiseman"/>  
अतः एक विशिष्ट वीडियो कोडेक चित्र को अलग-अलग कक्षों (एमपीईजी की स्थिति में 8×8 पिक्सेल) में तोड़कर कार्य करता है।<ref name="wiseman"/> इन कक्षों को क्षैतिज और लंबवत दोनों रूप से आवृत्ति घटकों की गणना करने के लिए असतत कोज्या परिवर्तन (डीसीटी) के अधीन किया जा सकता है।<ref name="wiseman"/> इस प्रकार से परिणामी कक्ष (मूल कक्ष के समान आकार) को फिर परिमाणीकरण स्तर कोड द्वारा पूर्व-गुणा किया जाता है और परिमाणीकरण आव्यूह द्वारा अवयव-वार विभाजित किया जाता है, और प्रत्येक परिणामी अवयव को गोल किया जाता है। परिमाणीकरण आव्यूह को अधिक से अधिक घटकों को 0 में परिवर्तित होने के अतिरिक्त कम बोधगम्य घटकों (सामान्यतः उच्च आवृत्तियों पर कम आवृत्तियों) की तुलना में अधिक बोधगम्य आवृत्ति घटकों को अधिक विभेदन प्रदान करने के लिए डिज़ाइन किया गया है, जिसे सबसे बड़ी दक्षता के साथ एन्कोड किया जा सकता है। अतः कई वीडियो एनकोडर (जैसे [[DivX|डिवएक्स]], [[Xvid|एक्सविड]], और [[3ivx|3आईवीएक्स]]) और संपीड़न मानक (जैसे [[MPEG-2|एमपीईजी-2]] और एच.264/एवीसी) कस्टम आव्यूह का उपयोग करने की अनुमति देते हैं। पूर्ण क्वान्टमक आव्यूह की तुलना में बहुत कम बैंडविस्तार लेते हुए, क्वान्टमक माप कोड को परिवर्तित करके कमी की सीमा भिन्न हो सकती है।<ref name="wiseman"/>  
यह DCT गुणांक मैट्रिक्स का उदाहरण है:  
 
इस प्रकार से यह डीसीटी गुणांक आव्यूह का उदाहरण है:  
:<math>
:<math>
\begin{bmatrix}
\begin{bmatrix}
Line 29: Line 30:
\end{bmatrix}
\end{bmatrix}
</math>
</math>
एक सामान्य परिमाणीकरण मैट्रिक्स है:  
एक सामान्य परिमाणीकरण आव्यूह है:  
:<math>
:<math>
\begin{bmatrix}
\begin{bmatrix}
Line 42: Line 43:
\end{bmatrix}
\end{bmatrix}
</math>
</math>
इस परिमाणीकरण मैट्रिक्स के साथ डीसीटी गुणांक मैट्रिक्स को तत्व-वार विभाजित करने और पूर्णांक में पूर्णांकित करने पर परिणाम मिलता है:
इस परिमाणीकरण आव्यूह के साथ डीसीटी गुणांक आव्यूह को अवयव-वार विभाजित करने और पूर्णांक में पूर्णांकित करने पर परिणाम मिलता है:


:<math>
:<math>
Line 56: Line 57:
\end{bmatrix}
\end{bmatrix}
</math>
</math>
उदाहरण के लिए, -415 (डीसी गुणांक) का उपयोग करके और निकटतम पूर्णांक तक पूर्णांकित करना
उदाहरण के लिए, -415 (डीसी गुणांक) का उपयोग करके और निकटतम पूर्णांक


:<math>
:<math>
Line 69: Line 70:
\right)
\right)
=-26
=-26
</math>
</math> तक पूर्णांकित करना
आमतौर पर इस प्रक्रिया के परिणामस्वरूप मुख्य रूप से ऊपरी बाएँ (कम आवृत्ति) कोने में मान वाले मैट्रिक्स उत्पन्न होंगे। गैर-शून्य प्रविष्टियों को समूहीकृत करने [[लम्बाई एन्कोडिंग चलाएँ]] चलाने के लिए ज़िग-ज़ैग ऑर्डर का उपयोग करके, परिमाणित मैट्रिक्स को गैर-परिमाणित संस्करण की तुलना में अधिक कुशलता से संग्रहीत किया जा सकता है।<ref name="wiseman"/>
सामान्यतः इस प्रक्रिया के परिणामस्वरूप मुख्य रूप से ऊपरी बाएँ (कम आवृत्ति) कोण में मान वाले आव्यूह उत्पन्न होंगे। इस प्रकार से गैर-शून्य प्रविष्टियों को समूहीकृत करने [[लम्बाई एन्कोडिंग चलाएँ|लम्बाई एन्कोडिंग]] चलाने के लिए असम्मरूप क्रम का उपयोग करके, परिमाणित आव्यूह को गैर-परिमाणित संस्करण की तुलना में अधिक कुशलता से संग्रहीत किया जा सकता है।<ref name="wiseman" />
==यह भी देखें==
==यह भी देखें==
* [[छवि विभाजन]]
* [[छवि विभाजन|प्रतिरूप विभाजन]]
* [[छवि-आधारित मेशिंग]]
* [[छवि-आधारित मेशिंग|प्रतिरूप-आधारित मेशिंग]]
* [[रेंज विभाजन]]
* [[रेंज विभाजन|श्रेणी विभाजन]]


==संदर्भ==
==संदर्भ==
Line 81: Line 82:
{{Compression Methods}}
{{Compression Methods}}


{{DEFAULTSORT:Quantization (Image Processing)}}[[Category: हानिपूर्ण संपीड़न एल्गोरिदम]] [[Category: छवि संपीड़न]]
{{DEFAULTSORT:Quantization (Image Processing)}}
 
 


[[Category: Machine Translated Page]]
[[Category:Articles with hatnote templates targeting a nonexistent page|Quantization (Image Processing)]]
[[Category:Created On 25/07/2023]]
[[Category:Collapse templates|Quantization (Image Processing)]]
[[Category:Created On 25/07/2023|Quantization (Image Processing)]]
[[Category:Data compression|Quantization (Image Processing)]]
[[Category:Machine Translated Page|Quantization (Image Processing)]]
[[Category:Navigational boxes| ]]
[[Category:Navigational boxes without horizontal lists|Quantization (Image Processing)]]
[[Category:Pages with script errors|Quantization (Image Processing)]]
[[Category:Sidebars with styles needing conversion|Quantization (Image Processing)]]
[[Category:Template documentation pages|Documentation/doc]]
[[Category:Templates Vigyan Ready|Quantization (Image Processing)]]
[[Category:Templates generating microformats|Quantization (Image Processing)]]
[[Category:Templates that are not mobile friendly|Quantization (Image Processing)]]
[[Category:Templates using TemplateData|Quantization (Image Processing)]]
[[Category:Wikipedia metatemplates|Quantization (Image Processing)]]
[[Category:छवि संपीड़न|Quantization (Image Processing)]]
[[Category:हानिपूर्ण संपीड़न एल्गोरिदम|Quantization (Image Processing)]]

Latest revision as of 18:14, 10 August 2023

प्रतिरूप प्रसंस्करण में सम्मिलित परिमाणीकरण, एक ऐसी हानिपूर्ण संपीड़न तकनीक है जो मानों की श्रृंखला को क्वांटम (असतत) मान में संपीड़ित करके प्राप्त की जाती है। जब किसी दिए गए प्रवाह में अलग-अलग प्रतीकों की संख्या कम हो जाती है, तो प्रवाह अधिक संपीड़ित हो जाती है। इस प्रकार से उदाहरण के लिए, किसी डिजिटल प्रतिरूप को दर्शाने के लिए आवश्यक वर्णों की संख्या कम करने से इसके फ़ाइल आकार को कम करना संभव हो जाता है। विशिष्ट अनुप्रयोगों में जेपीइजी में असतत कोज्या परिवर्तन डेटा परिमाणीकरण और जेपीइजी 2000 में असतत तरंगिका परिवर्तन डेटा परिमाणीकरण सम्मिलित हैं।

वर्ण परिमाणीकरण

वर्ण परिमाणीकरण किसी प्रतिरूप में उपयोग किए गए वर्णों की संख्या को कम कर देता है; यह उन उपकरणों पर प्रतिरूपों को प्रदर्शित करने के लिए महत्वपूर्ण है जो सीमित संख्या में वर्णों का समर्थन करते हैं और कुछ प्रकार की प्रतिरूपों को कुशलतापूर्वक संपीड़ित करने के लिए महत्वपूर्ण हैं। अतः अधिकांश बिट प्रतिचित्र संपादकों और कई ऑपरेटिंग सिस्टमों में वर्ण परिमाणीकरण के लिए अंतर्निहित समर्थन होता है। लोकप्रिय आधुनिक वर्ण परिमाणीकरण एल्गोरिदम में निकटतम वर्ण एल्गोरिदम (निश्चित पैलेट के लिए), मध्य कट और ओक्ट्रीज पर आधारित एल्गोरिदम सम्मिलित हैं।

इस प्रकार से बड़ी संख्या में वर्णों की धारणा बनाने और वर्ण बैंडिंग कलाकृतियों को समाप्त करने के लिए वर्ण परिमाणीकरण को स्पंदन के साथ जोड़ना सामान्य बात है।

प्रतिरूप संपीड़न के लिए आवृत्ति परिमाणीकरण

अतः मानव नेत्र अपेक्षाकृत बड़े क्षेत्र में प्रकाश में छोटे अंतर देखने में अत्यधिक ठीक है, परन्तु उच्च आवृत्ति (तीव्रता से परिवर्तित होती) प्रकाश भिन्नता की यथार्थ दृढ़ता को पहचानने में इतना स्पष्ट नहीं है। इस प्रकार से यह तथ्य उच्च आवृत्ति घटकों को अनदेखा करके आवश्यक सूचना की मात्रा को कम करने की अनुमति देता है। अतः यह मात्र आवृत्ति डोमेन में प्रत्येक घटक को उस घटक के लिए स्थिरांक से विभाजित करके और फिर निकटतम पूर्णांक तक पूर्णांकित करके किया जाता है। यह पूर्ण प्रक्रिया में मुख्य हानिपूर्ण संचालन है। इस प्रकार से इसके परिणामस्वरूप, सामान्यतः ऐसा होता है कि उच्च आवृत्ति वाले कई घटकों को शून्य तक पूर्णांकित कर दिया जाता है, और शेष कई छोटे धनात्मक या ऋणात्मक संख्या बन जाते हैं।

चूंकि मानव दृष्टि भी क्रोमिनेंस की तुलना में ल्युमिनेंस के प्रति अधिक संवेदनशील है, गैर-आरजीबी वर्ण स्थान में कार्य करके और अधिक संपीड़न प्राप्त किया जा सकता है जो दोनों को अलग करता है (उदाहरण के लिए, वाईसीबीसीआर), और चैनलों को अलग-अलग मात्राबद्ध करता है।[1]

परिमाणीकरण आव्यूह

अतः एक विशिष्ट वीडियो कोडेक चित्र को अलग-अलग कक्षों (एमपीईजी की स्थिति में 8×8 पिक्सेल) में तोड़कर कार्य करता है।[1] इन कक्षों को क्षैतिज और लंबवत दोनों रूप से आवृत्ति घटकों की गणना करने के लिए असतत कोज्या परिवर्तन (डीसीटी) के अधीन किया जा सकता है।[1] इस प्रकार से परिणामी कक्ष (मूल कक्ष के समान आकार) को फिर परिमाणीकरण स्तर कोड द्वारा पूर्व-गुणा किया जाता है और परिमाणीकरण आव्यूह द्वारा अवयव-वार विभाजित किया जाता है, और प्रत्येक परिणामी अवयव को गोल किया जाता है। परिमाणीकरण आव्यूह को अधिक से अधिक घटकों को 0 में परिवर्तित होने के अतिरिक्त कम बोधगम्य घटकों (सामान्यतः उच्च आवृत्तियों पर कम आवृत्तियों) की तुलना में अधिक बोधगम्य आवृत्ति घटकों को अधिक विभेदन प्रदान करने के लिए डिज़ाइन किया गया है, जिसे सबसे बड़ी दक्षता के साथ एन्कोड किया जा सकता है। अतः कई वीडियो एनकोडर (जैसे डिवएक्स, एक्सविड, और 3आईवीएक्स) और संपीड़न मानक (जैसे एमपीईजी-2 और एच.264/एवीसी) कस्टम आव्यूह का उपयोग करने की अनुमति देते हैं। पूर्ण क्वान्टमक आव्यूह की तुलना में बहुत कम बैंडविस्तार लेते हुए, क्वान्टमक माप कोड को परिवर्तित करके कमी की सीमा भिन्न हो सकती है।[1]

इस प्रकार से यह डीसीटी गुणांक आव्यूह का उदाहरण है:

एक सामान्य परिमाणीकरण आव्यूह है:

इस परिमाणीकरण आव्यूह के साथ डीसीटी गुणांक आव्यूह को अवयव-वार विभाजित करने और पूर्णांक में पूर्णांकित करने पर परिणाम मिलता है:

उदाहरण के लिए, -415 (डीसी गुणांक) का उपयोग करके और निकटतम पूर्णांक

तक पूर्णांकित करना

सामान्यतः इस प्रक्रिया के परिणामस्वरूप मुख्य रूप से ऊपरी बाएँ (कम आवृत्ति) कोण में मान वाले आव्यूह उत्पन्न होंगे। इस प्रकार से गैर-शून्य प्रविष्टियों को समूहीकृत करने लम्बाई एन्कोडिंग चलाने के लिए असम्मरूप क्रम का उपयोग करके, परिमाणित आव्यूह को गैर-परिमाणित संस्करण की तुलना में अधिक कुशलता से संग्रहीत किया जा सकता है।[1]

यह भी देखें

संदर्भ