थ्रेशोल्डिंग (छवि प्रसंस्करण)

From Vigyanwiki
Revision as of 11:19, 26 July 2023 by Manidh (talk | contribs)
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
मूल छवि।
मूल छवि की थ्रेशोल्डिंग से उत्पन्न द्विआधारी छवि।

डिजिटल छवि प्रोसेसिंग में, थ्रेशोल्डिंग (छवि प्रसंस्करण) को विभाजित करने की सबसे सरल विधि है। ग्रेस्केल छवि से, बाइनरी छवियां बनाने के लिए थ्रेशोल्डिंग का उपयोग किया जा सकता है।[1]

परिभाषा

सबसे सरल थ्रेशोल्डिंग विधियाँ छवि की तीव्रता के अनुसार छवि में प्रत्येक पिक्सेल को काले पिक्सेल से बदल देती हैं यदि छवि निश्चित मान से कम है जिसे सीमा रेखा को कहा जाता है, या सफेद पिक्सेल यदि पिक्सेल की तीव्रता उस सीमा से अधिक है। दाईं ओर की उदाहरण छवि में, इसके परिणामस्वरूप गहरा पेड़ पूरी तरह से काला हो जाता है, और चमकदार बर्फ पूरी तरह से सफेद हो जाती है।

स्वचालित थ्रेशोल्डिंग

चूँकि कुछ स्थितियों में, सीमा रेखा उपयोगकर्ता द्वारा नियमावली रूप से चुना जा सकता है, किन्तु ऐसे कई स्थितियों में होता हैं जहां उपयोगकर्ता चाहता है कि सीमा स्वचालित रूप से एल्गोरिदम द्वारा निर्धारित की जाती है। उन स्थितियों में, थ्रेशोल्ड इस अर्थ में "सर्वोत्तम" थ्रेशोल्ड होना चाहिए जिसका अर्थ होता है कि थ्रेशोल्ड के ऊपर और नीचे के पिक्सेल का विभाजन उन पिक्सेल द्वारा प्रदर्शित वस्तुओं के दो वर्गों के बीच वास्तविक विभाजन के जितना संभव हो सके (उदाहरण के लिए, नीचे के पिक्सेल सीमा को पृष्ठभूमि के अनुरूप होना चाहिए और ऊपर वाले को छवि में रुचि की कुछ वस्तुओं के अनुरूप होना चाहिए) मिलता जुलता होना आवश्यक है।

कई प्रकार की स्वचालित थ्रेशोल्डिंग विधियाँ उपस्थित हैं, सबसे प्रसिद्ध और व्यापक रूप से उपयोग की जाने वाली ओट्सू की विधि है। निम्नलिखित सूची, सेज़गिन एट अल. के कार्यों पर आधारित है। (2004) में एल्गोरिदम द्वारा हेरफेर की गई जानकारी के आधार पर थ्रेशोल्डिंग विधियों को व्यापक समूहों में वर्गीकृत किया गया है। चूँकि ध्यान दें कि ऐसा वर्गीकरण आवश्यक रूप से अस्पष्ट है क्योंकि कुछ विधियाँ कई श्रेणियों में आ सकती हैं (उदाहरण के लिए, ओट्सू की विधि को हिस्टोग्राम-आकार और क्लस्टरिंग एल्गोरिदम दोनों माना जा सकता है)

  • हिस्टोग्राम आकृति-आधारित विधियां, जहां संशोधित हिस्टोग्राम की ऊचाई, घाटियाँ और कुर्वात्मकता का विश्लेषण किया जाता है।[2] ध्यान दें कि ये विधियां, अन्यों की समानता में, छवि तीव्रता प्रायोजित वितरण (अर्थात हिस्टोग्राम की आकृति) के बारे में कुछ मान्यताएं करती हैं।
  • गुच्छबद्धता-आधारित विधियां, जहां ग्रे-स्तर नमूनों को पृष्ठभूमि और प्रतिमान में दो भागों में गुच्छित किया जाता है।[3][4]
  • एन्ट्रॉपी (सूचना सिद्धांत)-आधारित विधियां पृष्ठभूमि और प्रतिमान क्षेत्रों की एंट्रोपी, मूल और बाइनरीकृत छवि के बीच संक्रोय-एंट्रोपी आदि का उपयोग करने वाले एल्गोरिदम प्रदान करते हैं।[5]
  • वस्तु गुणधर्म-आधारित विधियां ग्रे-स्तर और बाइनरीकृत छवि के बीच समानता की माप की खोज करती हैं, जैसे कि धुंधलापन की आकृति की समानता, किनारों का साथीपन, आदि होती है ।
  • स्थानिक विधियां अधिकाधिक प्रायदर्शिता और पिक्सल के बीच सहसंबंध का उपयोग करती हैं।
अमानवीय प्रकाश व्यवस्था के स्थितियों में स्थानीय थ्रेशोल्डिंग के लाभ का उदाहरण। छवि [1] से अनुकूलित।

वैश्विक बनाम स्थानीय सीमा

अधिकांश विधियों में, छवि के सभी पिक्सेल पर समान सीमा लागू होती है। यद्यपि, कुछ स्थितियों में, पिक्सेल के स्थानीय मूल्य के आधार पर, छवि के विभिन्न भाग पर अलग सीमा लागू करना लाभदायक हो सकता है। इस श्रेणी के विधियों की स्थानीय या अनुकूलनशील थ्रेशोल्डिंग कहा जाता है। वे विशेष रूप से उन स्थितियों के लिए अनुकूलित होते हैं जहां छवियों में विषम प्रकाश व्यवस्था होती है, जैसे कि दाहिने ओर सुडोकू छवि में। उन स्थितियों में, निकट परिभाषित किया जाता है और प्रत्येक पिक्सेल और उसके निकट के लिए सीमा थ्रेशोल्ड की गणना की जाती है। कई वैश्विक थ्रेशोल्डिंग विधियों को स्थानीय विधि से काम करने के लिए अनुकूलित किया जा सकता है, किन्तु स्थानीय थ्रेशोल्डिंग के लिए विशेष रूप से विधियां भी विकसित की गई हैं, जैसे कि निब्लैक[6] या बर्नसेन एल्गोरिदम आदि।

इमेजेज जैसे सॉफ़्टवेयर ग्लोबल और local दोनों में विभिन्न, स्वचालित थ्रेशोल्ड विधियों की विस्तृत श्रृंखला का प्रस्ताव करते हैं।

बाइनरी थ्रेशोल्डिंग का विस्तार

मल्टी-बैंड छवियां

रंगीन छवियों को भी थ्रेशोल्ड किया जा सकता है। दृष्टिकोण छवि के प्रत्येक आरजीबी रंग मॉडल घटकों के लिए अलग सीमा निर्धारित करना होता है और फिर उन्हें बाइनरी और ऑपरेशन के साथ संयोजित करना होता है। यह कैमरे की कार्यप्रणाली और डेटा के कंप्यूटर में संग्रहीत होने की विधियों को प्रतिबिंबित करता है, लेकिन यह वह विधि नहीं है जिससे लोग रंग को पहचानते हैं। इसलिए,एचएसएल और एचएसवी रंग मॉडल अधिक उपयोग होते हैं; ध्यान दें कि क्योंकि रंगवत्ता एक पूर्णांकीय मात्रा है, इसलिए वृत्ताकार थ्रेशोल्डिंग की आवश्यकता होती है। सीएमवाईके रंग मॉडल रंग मॉडल का उपयोग भी संभव है।[7]

एकाधिक सीमाएँ

बाइनरी छवि के परिणामस्वरूप एकल सीमा के अतिरिक्त, कई बढ़ती हुई सीमाएँ प्रस्तुत करना भी संभव होता है T_{n}. उस स्थिति में, कार्यान्वयन थ्रेशोल्ड के परिणाम स्वरूप छवि को बनेगी वर्गों के साथ परिणामित किया जाता है, जहां तीव्रता के साथ पिक्सेल ऐसा है कि T_{n}<I_{ij}<T_{n+1} कक्षा को सौंपा जाएगा जहां . अधिकांश बाइनरी स्वचालित थ्रेशोल्डिंग विधियों में मल्टी-थ्रेशोल्डिंग के लिए प्राकृतिक विस्तार होता है।

सीमाएँ

थ्रेशोल्डिंग निम्नलिखित शर्तों के अनुसार सर्वोत्तम रूप से काम करेगी:

  • ध्वनि का स्तर कम होना
  • इंटर-कक्षा विचार में अंतर से अधिक भीतर-कक्षा विचार का अधिक होना, अर्थात्, एक ही समूह के पिक्सेल्स एक-दूसरे के प्रति अधिक संवेदी होंगे तथा दूसरे समूह के पिक्सेल्स से।
  • समान प्रकाशी आदि।

कठिन स्थितियों में, थ्रेशोल्डिंग अवांछित रूप से काम करेगी और एक बाइनरी छवि देगी जिसमें गलत सक्षमता और गलत नकारात्मकता हो सकती है।

संदर्भ

  1. (Shapiro, et al. 2001:83)
  2. Zack, G W; Rogers, W E; Latt, S A (July 1977). "बहन क्रोमैटिड विनिमय आवृत्ति का स्वचालित माप।". Journal of Histochemistry & Cytochemistry (in English). 25 (7): 741–753. doi:10.1177/25.7.70454. ISSN 0022-1554. PMID 70454. S2CID 15339151.
  3. "पुनरावृत्तीय चयन विधि का उपयोग करके चित्र थ्रेशोल्डिंग". IEEE Transactions on Systems, Man, and Cybernetics. 8 (8): 630–632. 1978. doi:10.1109/TSMC.1978.4310039. ISSN 0018-9472.
  4. Barghout, L.; Sheynin, J. (2013-07-25). "Real-world scene perception and perceptual organization: Lessons from Computer Vision". Journal of Vision (in English). 13 (9): 709. doi:10.1167/13.9.709. ISSN 1534-7362.
  5. Kapur, J. N.; Sahoo, P. K.; Wong, A. K. C. (1985-03-01). "हिस्टोग्राम की एन्ट्रापी का उपयोग करके ग्रे-लेवल पिक्चर थ्रेशोल्डिंग के लिए एक नई विधि". Computer Vision, Graphics, and Image Processing (in English). 29 (3): 273–285. doi:10.1016/0734-189X(85)90125-2. ISSN 0734-189X.
  6. Niblack, Wayne (1986). डिजिटल इमेज प्रोसेसिंग का परिचय. Prentice-Hall International. ISBN 0-13-480600-X. OCLC 1244113797.
  7. Pham, Nhu-An; Morrison, Andrew; Schwock, Joerg; Aviel-Ronen, Sarit; Iakovlev, Vladimir; Tsao, Ming-Sound; Ho, James; Hedley, David W. (2007-02-27). "सीएमवाईके रंग मॉडल का उपयोग करके इम्यूनोहिस्टोकेमिकल दागों का मात्रात्मक छवि विश्लेषण". Diagnostic Pathology. 2 (1): 8. doi:10.1186/1746-1596-2-8. ISSN 1746-1596. PMC 1810239. PMID 17326824.


स्रोत

  • <उद्धरण आईडी=फाम2007> फाम एन, मॉरिसन ए, श्वॉक जे एट अल। (2007)। सीएमवाईके रंग मॉडल का उपयोग करके इम्यूनोहिस्टोकेमिकल दागों का मात्रात्मक छवि विश्लेषण। निदान पथ। '2:'8.</उद्धरण>
  • <उद्धरण आईडी=शापिरो2001> लिंडा शापिरो|शापिरो, लिंडा जी. और स्टॉकमैन, जॉर्ज सी. (2002)। कंप्यूटर दृष्टि । शागिर्द कक्ष। ISBN 0-13-030796-3</उद्धरण>
  • <उद्धरण आईडी=सेजिन2004> मेहमत सेजिन और बुलेंट संकुर, छवि थ्रेशोल्डिंग तकनीक और मात्रात्मक प्रदर्शन मूल्यांकन पर सर्वेक्षण, जर्नल ऑफ इलेक्ट्रॉनिक इमेजिंग 13(1), 146-165 (जनवरी 2004)। doi:10.1117/1.1631315</उद्धरण>

अग्रिम पठन

  • Gonzalez, Rafael C. & Woods, Richard E. (2002). Thresholding. In Digital Image Processing, pp. 595–611. Pearson Education. ISBN 81-7808-629-8
  • M. Luessi, M. Eichmann, G. M. Schuster, and A. K. Katsaggelos, Framework for efficient optimal multilevel image thresholding, Journal of Electronic Imaging, vol. 18, pp. 013004+, 2009. doi:10.1117/1.3073891
  • Y.K. Lai, P.L. Rosin, Efficient Circular Thresholding, IEEE Trans. on Image Processing 23(3), pp. 992–1001 (2014). doi:10.1109/TIP.2013.2297014
  • Scott E. Umbaugh (2018). Digital Image Processing and Analysis, pp 93–96. CRC Press. ISBN 978-1-4987-6602-9