परिमाणीकरण (छवि प्रसंस्करण): Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 1: Line 1:
[[छवि]] प्रसंस्करण में शामिल क्वांटाइजेशन, [[हानिपूर्ण संपीड़न]] तकनीक है जो मानों की श्रृंखला को क्वांटम (असतत) मान में संपीड़ित करके प्राप्त की जाती है। जब किसी दिए गए स्ट्रीम में अलग-अलग प्रतीकों की संख्या कम हो जाती है, तो स्ट्रीम अधिक संपीड़ित हो जाती है। उदाहरण के लिए, किसी डिजिटल छवि को दर्शाने के लिए आवश्यक रंगों की संख्या कम करने से इसके फ़ाइल आकार को कम करना संभव हो जाता है। विशिष्ट अनुप्रयोगों में [[JPEG]] में [[असतत कोसाइन परिवर्तन]] डेटा परिमाणीकरण और [[JPEG 2000]] में [[असतत तरंगिका परिवर्तन]] डेटा परिमाणीकरण शामिल हैं।
प्रतिरूप प्रसंस्करण में सम्मिलित '''परिमाणीकरण''', एक ऐसी [[हानिपूर्ण संपीड़न]] तकनीक है जो मानों की श्रृंखला को क्वांटम (असतत) मान में संपीड़ित करके प्राप्त की जाती है। जब किसी दिए गए प्रवाह में अलग-अलग प्रतीकों की संख्या कम हो जाती है, तो प्रवाह अधिक संपीड़ित हो जाती है। इस प्रकार से उदाहरण के लिए, किसी डिजिटल प्रतिरूप को दर्शाने के लिए आवश्यक वर्णों की संख्या कम करने से इसके फ़ाइल आकार को कम करना संभव हो जाता है। विशिष्ट अनुप्रयोगों में [[JPEG|जेपीइजी]] में [[असतत कोसाइन परिवर्तन|असतत कोज्या परिवर्तन]] डेटा परिमाणीकरण और [[JPEG 2000|जेपीइजी 2000]] में [[असतत तरंगिका परिवर्तन]] डेटा परिमाणीकरण सम्मिलित हैं।


== रंग परिमाणीकरण ==
== वर्ण परिमाणीकरण ==
{{main|Color quantization}}
{{main|वर्ण परिमाणीकरण}}


रंग परिमाणीकरण किसी छवि में उपयोग किए गए रंगों की संख्या को कम कर देता है; यह उन उपकरणों पर छवियों को प्रदर्शित करने के लिए महत्वपूर्ण है जो सीमित संख्या में रंगों का समर्थन करते हैं और कुछ प्रकार की छवियों को कुशलतापूर्वक संपीड़ित करने के लिए महत्वपूर्ण हैं। अधिकांश बिटमैप संपादकों और कई ऑपरेटिंग सिस्टमों में रंग परिमाणीकरण के लिए अंतर्निहित समर्थन होता है। लोकप्रिय आधुनिक रंग परिमाणीकरण एल्गोरिदम में निकटतम रंग एल्गोरिदम (निश्चित पैलेट के लिए), [[मध्य कट]] और [[ अष्टक ]]ज़ पर आधारित एल्गोरिदम शामिल हैं।
वर्ण परिमाणीकरण किसी प्रतिरूप में उपयोग किए गए वर्णों की संख्या को कम कर देता है; यह उन उपकरणों पर प्रतिरूपों को प्रदर्शित करने के लिए महत्वपूर्ण है जो सीमित संख्या में वर्णों का समर्थन करते हैं और कुछ प्रकार की प्रतिरूपों को कुशलतापूर्वक संपीड़ित करने के लिए महत्वपूर्ण हैं। अतः अधिकांश बिट प्रतिचित्र संपादकों और कई ऑपरेटिंग सिस्टमों में वर्ण परिमाणीकरण के लिए अंतर्निहित समर्थन होता है। लोकप्रिय आधुनिक वर्ण परिमाणीकरण एल्गोरिदम में निकटतम वर्ण एल्गोरिदम (निश्चित पैलेट के लिए), [[मध्य कट]] और [[ अष्टक |ओक्ट्रीज]] पर आधारित एल्गोरिदम सम्मिलित हैं।


बड़ी संख्या में रंगों की छाप बनाने और [[रंग बैंडिंग]] कलाकृतियों को खत्म करने के लिए रंग परिमाणीकरण को [[ तड़पना ]]िंग के साथ जोड़ना आम बात है।
इस प्रकार से बड़ी संख्या में वर्णों की धारणा बनाने और [[रंग बैंडिंग|वर्ण बैंडिंग]] कलाकृतियों को समाप्त करने के लिए वर्ण परिमाणीकरण को [[ तड़पना |स्पंदन]] के साथ जोड़ना सामान्य बात है।


== छवि संपीड़न के लिए आवृत्ति परिमाणीकरण ==
== प्रतिरूप संपीड़न के लिए आवृत्ति परिमाणीकरण ==


मानव आंख अपेक्षाकृत बड़े क्षेत्र में [[चमक]] में छोटे अंतर देखने में काफी अच्छी है, लेकिन उच्च आवृत्ति (तेजी से बदलती) चमक भिन्नता की सटीक ताकत को पहचानने में इतनी अच्छी नहीं है। यह तथ्य उच्च आवृत्ति घटकों को अनदेखा करके आवश्यक जानकारी की मात्रा को कम करने की अनुमति देता है। यह केवल आवृत्ति डोमेन में प्रत्येक घटक को उस घटक के लिए स्थिरांक से विभाजित करके और फिर निकटतम पूर्णांक तक पूर्णांकित करके किया जाता है। यह पूरी प्रक्रिया में मुख्य हानिपूर्ण ऑपरेशन है। इसके परिणामस्वरूप, आम तौर पर ऐसा होता है कि उच्च आवृत्ति वाले कई घटकों को शून्य तक पूर्णांकित कर दिया जाता है, और बाकी कई छोटे सकारात्मक या नकारात्मक संख्या बन जाते हैं।
अतः मानव नेत्र अपेक्षाकृत बड़े क्षेत्र में [[चमक|प्रकाश]] में छोटे अंतर देखने में अत्यधिक ठीक है, परन्तु उच्च आवृत्ति (तीव्रता से बदलती) प्रकाश भिन्नता की यथार्थ दृढ़ता को पहचानने में इतना स्पष्ट नहीं है। इस प्रकार से यह तथ्य उच्च आवृत्ति घटकों को अनदेखा करके आवश्यक सूचना की मात्रा को कम करने की अनुमति देता है। अतः यह मात्र आवृत्ति डोमेन में प्रत्येक घटक को उस घटक के लिए स्थिरांक से विभाजित करके और फिर निकटतम पूर्णांक तक पूर्णांकित करके किया जाता है। यह पूर्ण प्रक्रिया में मुख्य हानिपूर्ण संचालन है। इस प्रकार से इसके परिणामस्वरूप, सामान्यतः ऐसा होता है कि उच्च आवृत्ति वाले कई घटकों को शून्य तक पूर्णांकित कर दिया जाता है, और शेष कई छोटे धनात्मक या ऋणात्मक संख्या बन जाते हैं।


चूंकि मानव दृष्टि भी [[क्रोमिनेंस]] की तुलना में [[luminance]] के प्रति अधिक संवेदनशील है, गैर-आरजीबी रंग स्थान में काम करके और अधिक संपीड़न प्राप्त किया जा सकता है जो दोनों को अलग करता है (उदाहरण के लिए, [[वाईसीबीसीआर]]), और चैनलों को अलग-अलग मात्राबद्ध करता है।<ref name="wiseman">John Wiseman, ''An Introduction to MPEG Video Compression'', https://web.archive.org/web/20111115004238/http://www.john-wiseman.com/technical/MPEG_tutorial.htm</ref>
चूंकि मानव दृष्टि भी [[क्रोमिनेंस]] की तुलना में [[luminance|ल्युमिनेंस]] के प्रति अधिक संवेदनशील है, गैर-आरजीबी वर्ण स्थान में कार्य करके और अधिक संपीड़न प्राप्त किया जा सकता है जो दोनों को अलग करता है (उदाहरण के लिए, [[वाईसीबीसीआर]]), और चैनलों को अलग-अलग मात्राबद्ध करता है।<ref name="wiseman">John Wiseman, ''An Introduction to MPEG Video Compression'', https://web.archive.org/web/20111115004238/http://www.john-wiseman.com/technical/MPEG_tutorial.htm</ref>
=== परिमाणीकरण मैट्रिक्स ===
=== परिमाणीकरण आव्यूह ===


एक विशिष्ट वीडियो कोडेक चित्र को अलग-अलग ब्लॉकों (एमपीईजी के मामले में 8×8 पिक्सेल) में तोड़कर काम करता है<ref name="wiseman"/>). इन ब्लॉकों को क्षैतिज और लंबवत दोनों तरह से आवृत्ति घटकों की गणना करने के लिए असतत कोसाइन ट्रांसफॉर्म (डीसीटी) के अधीन किया जा सकता है।<ref name="wiseman"/>परिणामी ब्लॉक (मूल ब्लॉक के समान आकार) को फिर परिमाणीकरण स्केल कोड द्वारा पूर्व-गुणा किया जाता है और परिमाणीकरण मैट्रिक्स द्वारा तत्व-वार विभाजित किया जाता है, और प्रत्येक परिणामी तत्व को गोल किया जाता है। परिमाणीकरण मैट्रिक्स को अधिक से अधिक घटकों को 0 में बदलने के अलावा कम बोधगम्य घटकों (आमतौर पर उच्च आवृत्तियों पर कम आवृत्तियों) की तुलना में अधिक बोधगम्य आवृत्ति घटकों को अधिक रिज़ॉल्यूशन प्रदान करने के लिए डिज़ाइन किया गया है, जिसे सबसे बड़ी दक्षता के साथ एन्कोड किया जा सकता है। कई वीडियो एनकोडर (जैसे [[DivX]], [[Xvid]], और [[3ivx]]) और संपीड़न मानक (जैसे [[MPEG-2]] और H.264/AVC) कस्टम मैट्रिक्स का उपयोग करने की अनुमति देते हैं। पूर्ण क्वांटाइज़र मैट्रिक्स की तुलना में बहुत कम बैंडविड्थ लेते हुए, क्वांटाइज़र स्केल कोड को बदलकर कमी की सीमा भिन्न हो सकती है।<ref name="wiseman"/>  
अतः एक विशिष्ट वीडियो कोडेक चित्र को अलग-अलग कक्षों (एमपीईजी की स्थिति में 8×8 पिक्सेल) में तोड़कर कार्य करता है।<ref name="wiseman"/> इन कक्षों को क्षैतिज और लंबवत दोनों रूप से आवृत्ति घटकों की गणना करने के लिए असतत कोज्या परिवर्तन (डीसीटी) के अधीन किया जा सकता है।<ref name="wiseman"/> इस प्रकार से परिणामी कक्ष (मूल कक्ष के समान आकार) को फिर परिमाणीकरण स्तर कोड द्वारा पूर्व-गुणा किया जाता है और परिमाणीकरण आव्यूह द्वारा अवयव-वार विभाजित किया जाता है, और प्रत्येक परिणामी अवयव को गोल किया जाता है। परिमाणीकरण आव्यूह को अधिक से अधिक घटकों को 0 में बदलने के अतिरिक्त कम बोधगम्य घटकों (सामान्यतः उच्च आवृत्तियों पर कम आवृत्तियों) की तुलना में अधिक बोधगम्य आवृत्ति घटकों को अधिक विभेदन प्रदान करने के लिए डिज़ाइन किया गया है, जिसे सबसे बड़ी दक्षता के साथ एन्कोड किया जा सकता है। अतः कई वीडियो एनकोडर (जैसे [[DivX|डिवएक्स]], [[Xvid|एक्सविड]], और [[3ivx|3आईवीएक्स]]) और संपीड़न मानक (जैसे [[MPEG-2|एमपीईजी-2]] और एच.264/एवीसी) कस्टम आव्यूह का उपयोग करने की अनुमति देते हैं। पूर्ण क्वान्टमक आव्यूह की तुलना में बहुत कम बैंडविस्तार लेते हुए, क्वान्टमक माप कोड को बदलकर कमी की सीमा भिन्न हो सकती है।<ref name="wiseman"/>  
यह DCT गुणांक मैट्रिक्स का उदाहरण है:  
 
इस प्रकार से यह डीसीटी गुणांक आव्यूह का उदाहरण है:  
:<math>
:<math>
\begin{bmatrix}
\begin{bmatrix}
Line 29: Line 30:
\end{bmatrix}
\end{bmatrix}
</math>
</math>
एक सामान्य परिमाणीकरण मैट्रिक्स है:  
एक सामान्य परिमाणीकरण आव्यूह है:  
:<math>
:<math>
\begin{bmatrix}
\begin{bmatrix}
Line 42: Line 43:
\end{bmatrix}
\end{bmatrix}
</math>
</math>
इस परिमाणीकरण मैट्रिक्स के साथ डीसीटी गुणांक मैट्रिक्स को तत्व-वार विभाजित करने और पूर्णांक में पूर्णांकित करने पर परिणाम मिलता है:
इस परिमाणीकरण आव्यूह के साथ डीसीटी गुणांक आव्यूह को अवयव-वार विभाजित करने और पूर्णांक में पूर्णांकित करने पर परिणाम मिलता है:


:<math>
:<math>
Line 56: Line 57:
\end{bmatrix}
\end{bmatrix}
</math>
</math>
उदाहरण के लिए, -415 (डीसी गुणांक) का उपयोग करके और निकटतम पूर्णांक तक पूर्णांकित करना
उदाहरण के लिए, -415 (डीसी गुणांक) का उपयोग करके और निकटतम पूर्णांक


:<math>
:<math>
Line 69: Line 70:
\right)
\right)
=-26
=-26
</math>
</math> तक पूर्णांकित करना
आमतौर पर इस प्रक्रिया के परिणामस्वरूप मुख्य रूप से ऊपरी बाएँ (कम आवृत्ति) कोने में मान वाले मैट्रिक्स उत्पन्न होंगे। गैर-शून्य प्रविष्टियों को समूहीकृत करने [[लम्बाई एन्कोडिंग चलाएँ]] चलाने के लिए ज़िग-ज़ैग ऑर्डर का उपयोग करके, परिमाणित मैट्रिक्स को गैर-परिमाणित संस्करण की तुलना में अधिक कुशलता से संग्रहीत किया जा सकता है।<ref name="wiseman"/>
सामान्यतः इस प्रक्रिया के परिणामस्वरूप मुख्य रूप से ऊपरी बाएँ (कम आवृत्ति) कोण में मान वाले आव्यूह उत्पन्न होंगे। इस प्रकार से गैर-शून्य प्रविष्टियों को समूहीकृत करने [[लम्बाई एन्कोडिंग चलाएँ|लम्बाई एन्कोडिंग]] चलाने के लिए असम्मरूप क्रम का उपयोग करके, परिमाणित आव्यूह को गैर-परिमाणित संस्करण की तुलना में अधिक कुशलता से संग्रहीत किया जा सकता है।<ref name="wiseman" />
==यह भी देखें==
==यह भी देखें==
* [[छवि विभाजन]]
* [[छवि विभाजन|प्रतिरूप विभाजन]]
* [[छवि-आधारित मेशिंग]]
* [[छवि-आधारित मेशिंग|प्रतिरूप-आधारित मेशिंग]]
* [[रेंज विभाजन]]
* [[रेंज विभाजन|श्रेणी विभाजन]]


==संदर्भ==
==संदर्भ==

Revision as of 16:53, 30 July 2023

प्रतिरूप प्रसंस्करण में सम्मिलित परिमाणीकरण, एक ऐसी हानिपूर्ण संपीड़न तकनीक है जो मानों की श्रृंखला को क्वांटम (असतत) मान में संपीड़ित करके प्राप्त की जाती है। जब किसी दिए गए प्रवाह में अलग-अलग प्रतीकों की संख्या कम हो जाती है, तो प्रवाह अधिक संपीड़ित हो जाती है। इस प्रकार से उदाहरण के लिए, किसी डिजिटल प्रतिरूप को दर्शाने के लिए आवश्यक वर्णों की संख्या कम करने से इसके फ़ाइल आकार को कम करना संभव हो जाता है। विशिष्ट अनुप्रयोगों में जेपीइजी में असतत कोज्या परिवर्तन डेटा परिमाणीकरण और जेपीइजी 2000 में असतत तरंगिका परिवर्तन डेटा परिमाणीकरण सम्मिलित हैं।

वर्ण परिमाणीकरण

वर्ण परिमाणीकरण किसी प्रतिरूप में उपयोग किए गए वर्णों की संख्या को कम कर देता है; यह उन उपकरणों पर प्रतिरूपों को प्रदर्शित करने के लिए महत्वपूर्ण है जो सीमित संख्या में वर्णों का समर्थन करते हैं और कुछ प्रकार की प्रतिरूपों को कुशलतापूर्वक संपीड़ित करने के लिए महत्वपूर्ण हैं। अतः अधिकांश बिट प्रतिचित्र संपादकों और कई ऑपरेटिंग सिस्टमों में वर्ण परिमाणीकरण के लिए अंतर्निहित समर्थन होता है। लोकप्रिय आधुनिक वर्ण परिमाणीकरण एल्गोरिदम में निकटतम वर्ण एल्गोरिदम (निश्चित पैलेट के लिए), मध्य कट और ओक्ट्रीज पर आधारित एल्गोरिदम सम्मिलित हैं।

इस प्रकार से बड़ी संख्या में वर्णों की धारणा बनाने और वर्ण बैंडिंग कलाकृतियों को समाप्त करने के लिए वर्ण परिमाणीकरण को स्पंदन के साथ जोड़ना सामान्य बात है।

प्रतिरूप संपीड़न के लिए आवृत्ति परिमाणीकरण

अतः मानव नेत्र अपेक्षाकृत बड़े क्षेत्र में प्रकाश में छोटे अंतर देखने में अत्यधिक ठीक है, परन्तु उच्च आवृत्ति (तीव्रता से बदलती) प्रकाश भिन्नता की यथार्थ दृढ़ता को पहचानने में इतना स्पष्ट नहीं है। इस प्रकार से यह तथ्य उच्च आवृत्ति घटकों को अनदेखा करके आवश्यक सूचना की मात्रा को कम करने की अनुमति देता है। अतः यह मात्र आवृत्ति डोमेन में प्रत्येक घटक को उस घटक के लिए स्थिरांक से विभाजित करके और फिर निकटतम पूर्णांक तक पूर्णांकित करके किया जाता है। यह पूर्ण प्रक्रिया में मुख्य हानिपूर्ण संचालन है। इस प्रकार से इसके परिणामस्वरूप, सामान्यतः ऐसा होता है कि उच्च आवृत्ति वाले कई घटकों को शून्य तक पूर्णांकित कर दिया जाता है, और शेष कई छोटे धनात्मक या ऋणात्मक संख्या बन जाते हैं।

चूंकि मानव दृष्टि भी क्रोमिनेंस की तुलना में ल्युमिनेंस के प्रति अधिक संवेदनशील है, गैर-आरजीबी वर्ण स्थान में कार्य करके और अधिक संपीड़न प्राप्त किया जा सकता है जो दोनों को अलग करता है (उदाहरण के लिए, वाईसीबीसीआर), और चैनलों को अलग-अलग मात्राबद्ध करता है।[1]

परिमाणीकरण आव्यूह

अतः एक विशिष्ट वीडियो कोडेक चित्र को अलग-अलग कक्षों (एमपीईजी की स्थिति में 8×8 पिक्सेल) में तोड़कर कार्य करता है।[1] इन कक्षों को क्षैतिज और लंबवत दोनों रूप से आवृत्ति घटकों की गणना करने के लिए असतत कोज्या परिवर्तन (डीसीटी) के अधीन किया जा सकता है।[1] इस प्रकार से परिणामी कक्ष (मूल कक्ष के समान आकार) को फिर परिमाणीकरण स्तर कोड द्वारा पूर्व-गुणा किया जाता है और परिमाणीकरण आव्यूह द्वारा अवयव-वार विभाजित किया जाता है, और प्रत्येक परिणामी अवयव को गोल किया जाता है। परिमाणीकरण आव्यूह को अधिक से अधिक घटकों को 0 में बदलने के अतिरिक्त कम बोधगम्य घटकों (सामान्यतः उच्च आवृत्तियों पर कम आवृत्तियों) की तुलना में अधिक बोधगम्य आवृत्ति घटकों को अधिक विभेदन प्रदान करने के लिए डिज़ाइन किया गया है, जिसे सबसे बड़ी दक्षता के साथ एन्कोड किया जा सकता है। अतः कई वीडियो एनकोडर (जैसे डिवएक्स, एक्सविड, और 3आईवीएक्स) और संपीड़न मानक (जैसे एमपीईजी-2 और एच.264/एवीसी) कस्टम आव्यूह का उपयोग करने की अनुमति देते हैं। पूर्ण क्वान्टमक आव्यूह की तुलना में बहुत कम बैंडविस्तार लेते हुए, क्वान्टमक माप कोड को बदलकर कमी की सीमा भिन्न हो सकती है।[1]

इस प्रकार से यह डीसीटी गुणांक आव्यूह का उदाहरण है:

एक सामान्य परिमाणीकरण आव्यूह है:

इस परिमाणीकरण आव्यूह के साथ डीसीटी गुणांक आव्यूह को अवयव-वार विभाजित करने और पूर्णांक में पूर्णांकित करने पर परिणाम मिलता है:

उदाहरण के लिए, -415 (डीसी गुणांक) का उपयोग करके और निकटतम पूर्णांक

तक पूर्णांकित करना

सामान्यतः इस प्रक्रिया के परिणामस्वरूप मुख्य रूप से ऊपरी बाएँ (कम आवृत्ति) कोण में मान वाले आव्यूह उत्पन्न होंगे। इस प्रकार से गैर-शून्य प्रविष्टियों को समूहीकृत करने लम्बाई एन्कोडिंग चलाने के लिए असम्मरूप क्रम का उपयोग करके, परिमाणित आव्यूह को गैर-परिमाणित संस्करण की तुलना में अधिक कुशलता से संग्रहीत किया जा सकता है।[1]

यह भी देखें

संदर्भ