बिंदु वितरण मॉडल: Difference between revisions

From Vigyanwiki
(Created page with "बिंदु वितरण मॉडल किसी आकृति की औसत ज्यामिति और आकृतियों के प्रशिक...")
 
No edit summary
Line 1: Line 1:
बिंदु वितरण मॉडल किसी आकृति की औसत ज्यामिति और आकृतियों के प्रशिक्षण सेट से अनुमानित ज्यामितीय भिन्नता के कुछ सांख्यिकीय तरीकों का प्रतिनिधित्व करने के लिए एक मॉडल है।
बिंदु वितरण मॉडल किसी आकृति की औसत ज्यामिति और आकृतियों के प्रशिक्षण सेट से अनुमानित ज्यामितीय भिन्नता के कुछ सांख्यिकीय तरीकों का प्रतिनिधित्व करने के लिए मॉडल है।


==पृष्ठभूमि==
==पृष्ठभूमि==
Line 14: Line 14:
|year = 1995
|year = 1995
|author1=D.H. Cooper |author2=T.F. Cootes |author3=C.J. Taylor |author4=J. Graham |issue = 61
|author1=D.H. Cooper |author2=T.F. Cootes |author3=C.J. Taylor |author4=J. Graham |issue = 61
}}</ref> और [[सांख्यिकीय आकार विश्लेषण]] के लिए [[कंप्यूटर दृष्टि]] में एक मानक बन गया<ref>{{cite conference
}}</ref> और [[सांख्यिकीय आकार विश्लेषण]] के लिए [[कंप्यूटर दृष्टि]] में मानक बन गया<ref>{{cite conference
|title = Shape discrimination in the Hippocampus using an MDL Model
|title = Shape discrimination in the Hippocampus using an MDL Model
|year = 2003
|year = 2003
Line 26: Line 26:
}}</ref> और [[मेडिकल इमेजिंग]] की [[छवि विभाजन]] के लिए<ref name=taylor/>जहां आकार पुजारी वास्तव में शोर और कम-विपरीत [[पिक्सेल]]/स्वर की व्याख्या में मदद करते हैं। बाद वाला बिंदु [[सक्रिय आकार मॉडल]] (एएसएम) और [[सक्रिय उपस्थिति मॉडल]] (एएएम) की ओर ले जाता है।
}}</ref> और [[मेडिकल इमेजिंग]] की [[छवि विभाजन]] के लिए<ref name=taylor/>जहां आकार पुजारी वास्तव में शोर और कम-विपरीत [[पिक्सेल]]/स्वर की व्याख्या में मदद करते हैं। बाद वाला बिंदु [[सक्रिय आकार मॉडल]] (एएसएम) और [[सक्रिय उपस्थिति मॉडल]] (एएएम) की ओर ले जाता है।


बिंदु वितरण मॉडल [[ऐतिहासिक बिंदु]]ओं पर निर्भर करते हैं। एक मील का पत्थर एक एनोटेटिंग बिंदु है जो एक एनाटोमिस्ट द्वारा प्रशिक्षण सेट आबादी में प्रत्येक आकार के उदाहरण के लिए दिए गए स्थान पर लगाया जाता है। उदाहरण के लिए, वही लैंडमार्क 2डी हाथों की रूपरेखा के प्रशिक्षण सेट में [[तर्जनी]] की नोक को नामित करेगा। उदाहरण के लिए, प्रमुख घटक विश्लेषण (पीसीए), प्रशिक्षण सेट आबादी के बीच स्थलों के समूहों के बीच आंदोलन के सहसंबंधों का अध्ययन करने के लिए एक प्रासंगिक उपकरण है। आमतौर पर, यह पता लगा सकता है कि एक ही उंगली के साथ स्थित सभी स्थलचिह्न प्रशिक्षण सेट उदाहरणों में एक साथ बिल्कुल एक साथ चलते हैं, जो सपाट हाथों के संग्रह के लिए अलग-अलग अंगुलियों के बीच का अंतर दिखाते हैं।
बिंदु वितरण मॉडल [[ऐतिहासिक बिंदु]]ओं पर निर्भर करते हैं। मील का पत्थर एनोटेटिंग बिंदु है जो एनाटोमिस्ट द्वारा प्रशिक्षण सेट आबादी में प्रत्येक आकार के उदाहरण के लिए दिए गए स्थान पर लगाया जाता है। उदाहरण के लिए, वही लैंडमार्क 2डी हाथों की रूपरेखा के प्रशिक्षण सेट में [[तर्जनी]] की नोक को नामित करेगा। उदाहरण के लिए, प्रमुख घटक विश्लेषण (पीसीए), प्रशिक्षण सेट आबादी के बीच स्थलों के समूहों के बीच आंदोलन के सहसंबंधों का अध्ययन करने के लिए प्रासंगिक उपकरण है। आमतौर पर, यह पता लगा सकता है कि ही उंगली के साथ स्थित सभी स्थलचिह्न प्रशिक्षण सेट उदाहरणों में साथ बिल्कुल साथ चलते हैं, जो सपाट हाथों के संग्रह के लिए अलग-अलग अंगुलियों के बीच का अंतर दिखाते हैं।


==विवरण==
==विवरण==


सबसे पहले, प्रशिक्षण छवियों का एक सेट मूल आकृतियों की ज्यामिति को पर्याप्त रूप से अनुमानित करने के लिए पर्याप्त संबंधित स्थलों के साथ मैन्युअल रूप से चिह्नित किया जाता है। इन स्थलों को [[सामान्यीकृत प्रोक्रस्टेस विश्लेषण]] का उपयोग करके संरेखित किया गया है, जो बिंदुओं के बीच न्यूनतम वर्ग त्रुटि को कम करता है।
सबसे पहले, प्रशिक्षण छवियों का सेट मूल आकृतियों की ज्यामिति को पर्याप्त रूप से अनुमानित करने के लिए पर्याप्त संबंधित स्थलों के साथ मैन्युअल रूप से चिह्नित किया जाता है। इन स्थलों को [[सामान्यीकृत प्रोक्रस्टेस विश्लेषण]] का उपयोग करके संरेखित किया गया है, जो बिंदुओं के बीच न्यूनतम वर्ग त्रुटि को कम करता है।


<math>k</math> दो आयामों में संरेखित स्थलचिह्न इस प्रकार दिए गए हैं
<math>k</math> दो आयामों में संरेखित स्थलचिह्न इस प्रकार दिए गए हैं
Line 38: Line 38:
यह ध्यान रखना महत्वपूर्ण है कि प्रत्येक मील का पत्थर <math>i \in \lbrace 1, \ldots k \rbrace </math> समान संरचनात्मक स्थान का प्रतिनिधित्व करना चाहिए। उदाहरण के लिए, मील का पत्थर #3, <math>(x_3, y_3)</math> सभी प्रशिक्षण छवियों में अनामिका की नोक का प्रतिनिधित्व हो सकता है।
यह ध्यान रखना महत्वपूर्ण है कि प्रत्येक मील का पत्थर <math>i \in \lbrace 1, \ldots k \rbrace </math> समान संरचनात्मक स्थान का प्रतिनिधित्व करना चाहिए। उदाहरण के लिए, मील का पत्थर #3, <math>(x_3, y_3)</math> सभी प्रशिक्षण छवियों में अनामिका की नोक का प्रतिनिधित्व हो सकता है।


अब आकृति की रूपरेखा को अनुक्रमों में घटा दिया गया है <math>k</math> स्थलचिह्न, ताकि किसी दिए गए प्रशिक्षण आकार को वेक्टर के रूप में परिभाषित किया जा सके <math>\mathbf{X} \in \mathbb{R}^{2k}</math>. यह मानते हुए कि बिखराव इस स्थान में [[गाऊसी वितरण]] है, पीसीए का उपयोग सभी प्रशिक्षण आकृतियों में सहप्रसरण मैट्रिक्स के सामान्यीकृत [[eigenvectors]] और [[eigenvalues]] की गणना करने के लिए किया जाता है। शीर्ष का मैट्रिक्स <math>d</math> eigenvectors के रूप में दिया गया है <math>\mathbf{P} \in \mathbb{R}^{2k \times d}</math>, और प्रत्येक eigenvector सेट के साथ भिन्नता के एक प्रमुख मोड का वर्णन करता है।
अब आकृति की रूपरेखा को अनुक्रमों में घटा दिया गया है <math>k</math> स्थलचिह्न, ताकि किसी दिए गए प्रशिक्षण आकार को वेक्टर के रूप में परिभाषित किया जा सके <math>\mathbf{X} \in \mathbb{R}^{2k}</math>. यह मानते हुए कि बिखराव इस स्थान में [[गाऊसी वितरण]] है, पीसीए का उपयोग सभी प्रशिक्षण आकृतियों में सहप्रसरण मैट्रिक्स के सामान्यीकृत [[eigenvectors]] और [[eigenvalues]] की गणना करने के लिए किया जाता है। शीर्ष का मैट्रिक्स <math>d</math> eigenvectors के रूप में दिया गया है <math>\mathbf{P} \in \mathbb{R}^{2k \times d}</math>, और प्रत्येक eigenvector सेट के साथ भिन्नता के प्रमुख मोड का वर्णन करता है।


अंत में, एक नए आकार को परिभाषित करने के लिए आइजेनवेक्टरों के एक [[रैखिक संयोजन]] का उपयोग किया जाता है <math>\mathbf{X}'</math>, गणितीय रूप से परिभाषित:
अंत में, नए आकार को परिभाषित करने के लिए आइजेनवेक्टरों के [[रैखिक संयोजन]] का उपयोग किया जाता है <math>\mathbf{X}'</math>, गणितीय रूप से परिभाषित:


:<math>\mathbf{X}' = \overline{\mathbf{X}} + \mathbf{P} \mathbf{b}</math>
:<math>\mathbf{X}' = \overline{\mathbf{X}} + \mathbf{P} \mathbf{b}</math>
कहाँ <math>\overline{\mathbf{X}}</math> सभी प्रशिक्षण छवियों में औसत आकार के रूप में परिभाषित किया गया है, और <math>\mathbf{b}</math> प्रत्येक प्रमुख घटक के लिए स्केलिंग मानों का एक वेक्टर है। इसलिए, वेरिएबल को संशोधित करके <math>\mathbf{b}</math> आकृतियों की अनंत संख्या को परिभाषित किया जा सकता है। यह सुनिश्चित करने के लिए कि सभी नए आकार प्रशिक्षण सेट में देखी गई भिन्नता के भीतर हैं, केवल प्रत्येक तत्व को अनुमति देना आम बात है <math>\mathbf{b}</math> भीतर होना <math>\pm</math>3 मानक विचलन, जहां किसी दिए गए प्रमुख घटक के मानक विचलन को उसके संबंधित eigenvalue के वर्गमूल के रूप में परिभाषित किया गया है।
कहाँ <math>\overline{\mathbf{X}}</math> सभी प्रशिक्षण छवियों में औसत आकार के रूप में परिभाषित किया गया है, और <math>\mathbf{b}</math> प्रत्येक प्रमुख घटक के लिए स्केलिंग मानों का वेक्टर है। इसलिए, वेरिएबल को संशोधित करके <math>\mathbf{b}</math> आकृतियों की अनंत संख्या को परिभाषित किया जा सकता है। यह सुनिश्चित करने के लिए कि सभी नए आकार प्रशिक्षण सेट में देखी गई भिन्नता के भीतर हैं, केवल प्रत्येक तत्व को अनुमति देना आम बात है <math>\mathbf{b}</math> भीतर होना <math>\pm</math>3 मानक विचलन, जहां किसी दिए गए प्रमुख घटक के मानक विचलन को उसके संबंधित eigenvalue के वर्गमूल के रूप में परिभाषित किया गया है।


पीडीएम को किसी भी मनमानी संख्या में आयामों तक बढ़ाया जा सकता है, लेकिन आमतौर पर 2डी छवि और 3डी वॉल्यूम अनुप्रयोगों में उपयोग किया जाता है (जहां प्रत्येक लैंडमार्क बिंदु <math>\mathbb{R}^2</math> या <math>\mathbb{R}^3</math>).
पीडीएम को किसी भी मनमानी संख्या में आयामों तक बढ़ाया जा सकता है, लेकिन आमतौर पर 2डी छवि और 3डी वॉल्यूम अनुप्रयोगों में उपयोग किया जाता है (जहां प्रत्येक लैंडमार्क बिंदु <math>\mathbb{R}^2</math> या <math>\mathbb{R}^3</math>).
Line 49: Line 49:
==चर्चा==
==चर्चा==


यूक्लिडियन अंतरिक्ष में व्याख्या किए गए एक आइजनवेक्टर को एक अनुक्रम के रूप में देखा जा सकता है <math>k</math> यूक्लिडियन वैक्टर संबंधित लैंडमार्क से जुड़े हैं और पूरे आकार के लिए एक मिश्रित चाल को निर्दिष्ट करते हैं। वैश्विक अरैखिक भिन्नता को आमतौर पर अच्छी तरह से नियंत्रित किया जाता है, बशर्ते अरेखीय भिन्नता को उचित स्तर पर रखा जाए। आमतौर पर, [[कर्नेल पीसीए]]-आधारित विधियों के शिक्षण में एक ट्विस्टिंग [[ निमेटोड ]] वर्म का उपयोग एक उदाहरण के रूप में किया जाता है।
यूक्लिडियन अंतरिक्ष में व्याख्या किए गए आइजनवेक्टर को अनुक्रम के रूप में देखा जा सकता है <math>k</math> यूक्लिडियन वैक्टर संबंधित लैंडमार्क से जुड़े हैं और पूरे आकार के लिए मिश्रित चाल को निर्दिष्ट करते हैं। वैश्विक अरैखिक भिन्नता को आमतौर पर अच्छी तरह से नियंत्रित किया जाता है, बशर्ते अरेखीय भिन्नता को उचित स्तर पर रखा जाए। आमतौर पर, [[कर्नेल पीसीए]]-आधारित विधियों के शिक्षण में ट्विस्टिंग [[ निमेटोड |निमेटोड]] वर्म का उपयोग उदाहरण के रूप में किया जाता है।


पीसीए गुणों के कारण: ईजेनवेक्टर परस्पर [[ ओर्थोगोनल ]] होते हैं, आकार स्थान में प्रशिक्षण सेट क्लाउड का आधार बनाते हैं, और इस स्थान में 0 पर क्रॉस करते हैं, जो औसत आकार का प्रतिनिधित्व करता है। इसके अलावा, पीसीए एक बंद दीर्घवृत्त को बिंदुओं के गाऊसी बादल (उनके आयाम जो भी हो) में फिट करने का एक पारंपरिक तरीका है: यह सीमित भिन्नता की अवधारणा का सुझाव देता है।
पीसीए गुणों के कारण: ईजेनवेक्टर परस्पर [[ ओर्थोगोनल |ओर्थोगोनल]] होते हैं, आकार स्थान में प्रशिक्षण सेट क्लाउड का आधार बनाते हैं, और इस स्थान में 0 पर क्रॉस करते हैं, जो औसत आकार का प्रतिनिधित्व करता है। इसके अलावा, पीसीए बंद दीर्घवृत्त को बिंदुओं के गाऊसी बादल (उनके आयाम जो भी हो) में फिट करने का पारंपरिक तरीका है: यह सीमित भिन्नता की अवधारणा का सुझाव देता है।


पीडीएम के पीछे विचार यह है कि ईजेनवेक्टरों को रैखिक रूप से जोड़कर नए आकार के उदाहरण तैयार किए जा सकते हैं जो प्रशिक्षण सेट में 'जैसा दिखेंगे'। गुणांकों को संबंधित eigenvalues ​​​​के मानों के समान सीमित किया गया है, ताकि यह सुनिश्चित किया जा सके कि उत्पन्न 2n/3n-आयामी बिंदु हाइपर-दीर्घवृत्ताकार अनुमत डोमेन-[[स्वीकार्य आकार डोमेन]] (एएसडी) में रहेगा।<ref name=taylor/>
पीडीएम के पीछे विचार यह है कि ईजेनवेक्टरों को रैखिक रूप से जोड़कर नए आकार के उदाहरण तैयार किए जा सकते हैं जो प्रशिक्षण सेट में 'जैसा दिखेंगे'। गुणांकों को संबंधित eigenvalues ​​​​के मानों के समान सीमित किया गया है, ताकि यह सुनिश्चित किया जा सके कि उत्पन्न 2n/3n-आयामी बिंदु हाइपर-दीर्घवृत्ताकार अनुमत डोमेन-[[स्वीकार्य आकार डोमेन]] (एएसडी) में रहेगा।<ref name=taylor/>
Line 61: Line 61:
==संदर्भ==
==संदर्भ==
<references/>
<references/>
<!-- Not referenced [4]{{citation
 
|title = A Brief Introduction to Statistical Shape Analysis
|year = 2002
|publisher = Informatics and Mathematical Modelling, Technical University of Denmark, DTU
|address = Richard Petersens Plads, Building 321, DK-2800 Kgs. Lyngby, |month = March
|url=http://www2.imm.dtu.dk/pubdb/views/publication_details.php?id=403
|quote=Images, annotations and data reports are placed in the enclosed zip-file.
|author1=Stegmann, M. B.  |author2=Gomez, D. D.
|name-list-style=amp }} -->





Revision as of 09:36, 3 August 2023

बिंदु वितरण मॉडल किसी आकृति की औसत ज्यामिति और आकृतियों के प्रशिक्षण सेट से अनुमानित ज्यामितीय भिन्नता के कुछ सांख्यिकीय तरीकों का प्रतिनिधित्व करने के लिए मॉडल है।

पृष्ठभूमि

बिंदु वितरण मॉडल अवधारणा कूट्स द्वारा विकसित की गई है,[1] टेलर एट अल.[2] और सांख्यिकीय आकार विश्लेषण के लिए कंप्यूटर दृष्टि में मानक बन गया[3] और मेडिकल इमेजिंग की छवि विभाजन के लिए[2]जहां आकार पुजारी वास्तव में शोर और कम-विपरीत पिक्सेल/स्वर की व्याख्या में मदद करते हैं। बाद वाला बिंदु सक्रिय आकार मॉडल (एएसएम) और सक्रिय उपस्थिति मॉडल (एएएम) की ओर ले जाता है।

बिंदु वितरण मॉडल ऐतिहासिक बिंदुओं पर निर्भर करते हैं। मील का पत्थर एनोटेटिंग बिंदु है जो एनाटोमिस्ट द्वारा प्रशिक्षण सेट आबादी में प्रत्येक आकार के उदाहरण के लिए दिए गए स्थान पर लगाया जाता है। उदाहरण के लिए, वही लैंडमार्क 2डी हाथों की रूपरेखा के प्रशिक्षण सेट में तर्जनी की नोक को नामित करेगा। उदाहरण के लिए, प्रमुख घटक विश्लेषण (पीसीए), प्रशिक्षण सेट आबादी के बीच स्थलों के समूहों के बीच आंदोलन के सहसंबंधों का अध्ययन करने के लिए प्रासंगिक उपकरण है। आमतौर पर, यह पता लगा सकता है कि ही उंगली के साथ स्थित सभी स्थलचिह्न प्रशिक्षण सेट उदाहरणों में साथ बिल्कुल साथ चलते हैं, जो सपाट हाथों के संग्रह के लिए अलग-अलग अंगुलियों के बीच का अंतर दिखाते हैं।

विवरण

सबसे पहले, प्रशिक्षण छवियों का सेट मूल आकृतियों की ज्यामिति को पर्याप्त रूप से अनुमानित करने के लिए पर्याप्त संबंधित स्थलों के साथ मैन्युअल रूप से चिह्नित किया जाता है। इन स्थलों को सामान्यीकृत प्रोक्रस्टेस विश्लेषण का उपयोग करके संरेखित किया गया है, जो बिंदुओं के बीच न्यूनतम वर्ग त्रुटि को कम करता है।

दो आयामों में संरेखित स्थलचिह्न इस प्रकार दिए गए हैं

.

यह ध्यान रखना महत्वपूर्ण है कि प्रत्येक मील का पत्थर समान संरचनात्मक स्थान का प्रतिनिधित्व करना चाहिए। उदाहरण के लिए, मील का पत्थर #3, सभी प्रशिक्षण छवियों में अनामिका की नोक का प्रतिनिधित्व हो सकता है।

अब आकृति की रूपरेखा को अनुक्रमों में घटा दिया गया है स्थलचिह्न, ताकि किसी दिए गए प्रशिक्षण आकार को वेक्टर के रूप में परिभाषित किया जा सके . यह मानते हुए कि बिखराव इस स्थान में गाऊसी वितरण है, पीसीए का उपयोग सभी प्रशिक्षण आकृतियों में सहप्रसरण मैट्रिक्स के सामान्यीकृत eigenvectors और eigenvalues की गणना करने के लिए किया जाता है। शीर्ष का मैट्रिक्स eigenvectors के रूप में दिया गया है , और प्रत्येक eigenvector सेट के साथ भिन्नता के प्रमुख मोड का वर्णन करता है।

अंत में, नए आकार को परिभाषित करने के लिए आइजेनवेक्टरों के रैखिक संयोजन का उपयोग किया जाता है , गणितीय रूप से परिभाषित:

कहाँ सभी प्रशिक्षण छवियों में औसत आकार के रूप में परिभाषित किया गया है, और प्रत्येक प्रमुख घटक के लिए स्केलिंग मानों का वेक्टर है। इसलिए, वेरिएबल को संशोधित करके आकृतियों की अनंत संख्या को परिभाषित किया जा सकता है। यह सुनिश्चित करने के लिए कि सभी नए आकार प्रशिक्षण सेट में देखी गई भिन्नता के भीतर हैं, केवल प्रत्येक तत्व को अनुमति देना आम बात है भीतर होना 3 मानक विचलन, जहां किसी दिए गए प्रमुख घटक के मानक विचलन को उसके संबंधित eigenvalue के वर्गमूल के रूप में परिभाषित किया गया है।

पीडीएम को किसी भी मनमानी संख्या में आयामों तक बढ़ाया जा सकता है, लेकिन आमतौर पर 2डी छवि और 3डी वॉल्यूम अनुप्रयोगों में उपयोग किया जाता है (जहां प्रत्येक लैंडमार्क बिंदु या ).

चर्चा

यूक्लिडियन अंतरिक्ष में व्याख्या किए गए आइजनवेक्टर को अनुक्रम के रूप में देखा जा सकता है यूक्लिडियन वैक्टर संबंधित लैंडमार्क से जुड़े हैं और पूरे आकार के लिए मिश्रित चाल को निर्दिष्ट करते हैं। वैश्विक अरैखिक भिन्नता को आमतौर पर अच्छी तरह से नियंत्रित किया जाता है, बशर्ते अरेखीय भिन्नता को उचित स्तर पर रखा जाए। आमतौर पर, कर्नेल पीसीए-आधारित विधियों के शिक्षण में ट्विस्टिंग निमेटोड वर्म का उपयोग उदाहरण के रूप में किया जाता है।

पीसीए गुणों के कारण: ईजेनवेक्टर परस्पर ओर्थोगोनल होते हैं, आकार स्थान में प्रशिक्षण सेट क्लाउड का आधार बनाते हैं, और इस स्थान में 0 पर क्रॉस करते हैं, जो औसत आकार का प्रतिनिधित्व करता है। इसके अलावा, पीसीए बंद दीर्घवृत्त को बिंदुओं के गाऊसी बादल (उनके आयाम जो भी हो) में फिट करने का पारंपरिक तरीका है: यह सीमित भिन्नता की अवधारणा का सुझाव देता है।

पीडीएम के पीछे विचार यह है कि ईजेनवेक्टरों को रैखिक रूप से जोड़कर नए आकार के उदाहरण तैयार किए जा सकते हैं जो प्रशिक्षण सेट में 'जैसा दिखेंगे'। गुणांकों को संबंधित eigenvalues ​​​​के मानों के समान सीमित किया गया है, ताकि यह सुनिश्चित किया जा सके कि उत्पन्न 2n/3n-आयामी बिंदु हाइपर-दीर्घवृत्ताकार अनुमत डोमेन-स्वीकार्य आकार डोमेन (एएसडी) में रहेगा।[2]


यह भी देखें

संदर्भ

  1. T. F. Cootes (May 2004), Statistical models of appearance for computer vision (PDF)
  2. 2.0 2.1 2.2 D.H. Cooper; T.F. Cootes; C.J. Taylor; J. Graham (1995), "Active shape models—their training and application", Computer Vision and Image Understanding (61): 38–59
  3. Rhodri H. Davies and Carole J. Twining and P. Daniel Allen and Tim F. Cootes and Chris J. Taylor (2003). Shape discrimination in the Hippocampus using an MDL Model. IMPI. Archived from the original on 2008-10-08. Retrieved 2007-07-27.


बाहरी संबंध