बिंदु वितरण मॉडल: Difference between revisions
(Created page with "बिंदु वितरण मॉडल किसी आकृति की औसत ज्यामिति और आकृतियों के प्रशिक...") |
No edit summary |
||
Line 1: | Line 1: | ||
बिंदु वितरण मॉडल किसी आकृति की औसत ज्यामिति और आकृतियों के प्रशिक्षण सेट से अनुमानित ज्यामितीय भिन्नता के कुछ सांख्यिकीय तरीकों का प्रतिनिधित्व करने के लिए | बिंदु वितरण मॉडल किसी आकृति की औसत ज्यामिति और आकृतियों के प्रशिक्षण सेट से अनुमानित ज्यामितीय भिन्नता के कुछ सांख्यिकीय तरीकों का प्रतिनिधित्व करने के लिए मॉडल है। | ||
==पृष्ठभूमि== | ==पृष्ठभूमि== | ||
Line 14: | Line 14: | ||
|year = 1995 | |year = 1995 | ||
|author1=D.H. Cooper |author2=T.F. Cootes |author3=C.J. Taylor |author4=J. Graham |issue = 61 | |author1=D.H. Cooper |author2=T.F. Cootes |author3=C.J. Taylor |author4=J. Graham |issue = 61 | ||
}}</ref> और [[सांख्यिकीय आकार विश्लेषण]] के लिए [[कंप्यूटर दृष्टि]] में | }}</ref> और [[सांख्यिकीय आकार विश्लेषण]] के लिए [[कंप्यूटर दृष्टि]] में मानक बन गया<ref>{{cite conference | ||
|title = Shape discrimination in the Hippocampus using an MDL Model | |title = Shape discrimination in the Hippocampus using an MDL Model | ||
|year = 2003 | |year = 2003 | ||
Line 26: | Line 26: | ||
}}</ref> और [[मेडिकल इमेजिंग]] की [[छवि विभाजन]] के लिए<ref name=taylor/>जहां आकार पुजारी वास्तव में शोर और कम-विपरीत [[पिक्सेल]]/स्वर की व्याख्या में मदद करते हैं। बाद वाला बिंदु [[सक्रिय आकार मॉडल]] (एएसएम) और [[सक्रिय उपस्थिति मॉडल]] (एएएम) की ओर ले जाता है। | }}</ref> और [[मेडिकल इमेजिंग]] की [[छवि विभाजन]] के लिए<ref name=taylor/>जहां आकार पुजारी वास्तव में शोर और कम-विपरीत [[पिक्सेल]]/स्वर की व्याख्या में मदद करते हैं। बाद वाला बिंदु [[सक्रिय आकार मॉडल]] (एएसएम) और [[सक्रिय उपस्थिति मॉडल]] (एएएम) की ओर ले जाता है। | ||
बिंदु वितरण मॉडल [[ऐतिहासिक बिंदु]]ओं पर निर्भर करते हैं। | बिंदु वितरण मॉडल [[ऐतिहासिक बिंदु]]ओं पर निर्भर करते हैं। मील का पत्थर एनोटेटिंग बिंदु है जो एनाटोमिस्ट द्वारा प्रशिक्षण सेट आबादी में प्रत्येक आकार के उदाहरण के लिए दिए गए स्थान पर लगाया जाता है। उदाहरण के लिए, वही लैंडमार्क 2डी हाथों की रूपरेखा के प्रशिक्षण सेट में [[तर्जनी]] की नोक को नामित करेगा। उदाहरण के लिए, प्रमुख घटक विश्लेषण (पीसीए), प्रशिक्षण सेट आबादी के बीच स्थलों के समूहों के बीच आंदोलन के सहसंबंधों का अध्ययन करने के लिए प्रासंगिक उपकरण है। आमतौर पर, यह पता लगा सकता है कि ही उंगली के साथ स्थित सभी स्थलचिह्न प्रशिक्षण सेट उदाहरणों में साथ बिल्कुल साथ चलते हैं, जो सपाट हाथों के संग्रह के लिए अलग-अलग अंगुलियों के बीच का अंतर दिखाते हैं। | ||
==विवरण== | ==विवरण== | ||
सबसे पहले, प्रशिक्षण छवियों का | सबसे पहले, प्रशिक्षण छवियों का सेट मूल आकृतियों की ज्यामिति को पर्याप्त रूप से अनुमानित करने के लिए पर्याप्त संबंधित स्थलों के साथ मैन्युअल रूप से चिह्नित किया जाता है। इन स्थलों को [[सामान्यीकृत प्रोक्रस्टेस विश्लेषण]] का उपयोग करके संरेखित किया गया है, जो बिंदुओं के बीच न्यूनतम वर्ग त्रुटि को कम करता है। | ||
<math>k</math> दो आयामों में संरेखित स्थलचिह्न इस प्रकार दिए गए हैं | <math>k</math> दो आयामों में संरेखित स्थलचिह्न इस प्रकार दिए गए हैं | ||
Line 38: | Line 38: | ||
यह ध्यान रखना महत्वपूर्ण है कि प्रत्येक मील का पत्थर <math>i \in \lbrace 1, \ldots k \rbrace </math> समान संरचनात्मक स्थान का प्रतिनिधित्व करना चाहिए। उदाहरण के लिए, मील का पत्थर #3, <math>(x_3, y_3)</math> सभी प्रशिक्षण छवियों में अनामिका की नोक का प्रतिनिधित्व हो सकता है। | यह ध्यान रखना महत्वपूर्ण है कि प्रत्येक मील का पत्थर <math>i \in \lbrace 1, \ldots k \rbrace </math> समान संरचनात्मक स्थान का प्रतिनिधित्व करना चाहिए। उदाहरण के लिए, मील का पत्थर #3, <math>(x_3, y_3)</math> सभी प्रशिक्षण छवियों में अनामिका की नोक का प्रतिनिधित्व हो सकता है। | ||
अब आकृति की रूपरेखा को अनुक्रमों में घटा दिया गया है <math>k</math> स्थलचिह्न, ताकि किसी दिए गए प्रशिक्षण आकार को वेक्टर के रूप में परिभाषित किया जा सके <math>\mathbf{X} \in \mathbb{R}^{2k}</math>. यह मानते हुए कि बिखराव इस स्थान में [[गाऊसी वितरण]] है, पीसीए का उपयोग सभी प्रशिक्षण आकृतियों में सहप्रसरण मैट्रिक्स के सामान्यीकृत [[eigenvectors]] और [[eigenvalues]] की गणना करने के लिए किया जाता है। शीर्ष का मैट्रिक्स <math>d</math> eigenvectors के रूप में दिया गया है <math>\mathbf{P} \in \mathbb{R}^{2k \times d}</math>, और प्रत्येक eigenvector सेट के साथ भिन्नता के | अब आकृति की रूपरेखा को अनुक्रमों में घटा दिया गया है <math>k</math> स्थलचिह्न, ताकि किसी दिए गए प्रशिक्षण आकार को वेक्टर के रूप में परिभाषित किया जा सके <math>\mathbf{X} \in \mathbb{R}^{2k}</math>. यह मानते हुए कि बिखराव इस स्थान में [[गाऊसी वितरण]] है, पीसीए का उपयोग सभी प्रशिक्षण आकृतियों में सहप्रसरण मैट्रिक्स के सामान्यीकृत [[eigenvectors]] और [[eigenvalues]] की गणना करने के लिए किया जाता है। शीर्ष का मैट्रिक्स <math>d</math> eigenvectors के रूप में दिया गया है <math>\mathbf{P} \in \mathbb{R}^{2k \times d}</math>, और प्रत्येक eigenvector सेट के साथ भिन्नता के प्रमुख मोड का वर्णन करता है। | ||
अंत में, | अंत में, नए आकार को परिभाषित करने के लिए आइजेनवेक्टरों के [[रैखिक संयोजन]] का उपयोग किया जाता है <math>\mathbf{X}'</math>, गणितीय रूप से परिभाषित: | ||
:<math>\mathbf{X}' = \overline{\mathbf{X}} + \mathbf{P} \mathbf{b}</math> | :<math>\mathbf{X}' = \overline{\mathbf{X}} + \mathbf{P} \mathbf{b}</math> | ||
कहाँ <math>\overline{\mathbf{X}}</math> सभी प्रशिक्षण छवियों में औसत आकार के रूप में परिभाषित किया गया है, और <math>\mathbf{b}</math> प्रत्येक प्रमुख घटक के लिए स्केलिंग मानों का | कहाँ <math>\overline{\mathbf{X}}</math> सभी प्रशिक्षण छवियों में औसत आकार के रूप में परिभाषित किया गया है, और <math>\mathbf{b}</math> प्रत्येक प्रमुख घटक के लिए स्केलिंग मानों का वेक्टर है। इसलिए, वेरिएबल को संशोधित करके <math>\mathbf{b}</math> आकृतियों की अनंत संख्या को परिभाषित किया जा सकता है। यह सुनिश्चित करने के लिए कि सभी नए आकार प्रशिक्षण सेट में देखी गई भिन्नता के भीतर हैं, केवल प्रत्येक तत्व को अनुमति देना आम बात है <math>\mathbf{b}</math> भीतर होना <math>\pm</math>3 मानक विचलन, जहां किसी दिए गए प्रमुख घटक के मानक विचलन को उसके संबंधित eigenvalue के वर्गमूल के रूप में परिभाषित किया गया है। | ||
पीडीएम को किसी भी मनमानी संख्या में आयामों तक बढ़ाया जा सकता है, लेकिन आमतौर पर 2डी छवि और 3डी वॉल्यूम अनुप्रयोगों में उपयोग किया जाता है (जहां प्रत्येक लैंडमार्क बिंदु <math>\mathbb{R}^2</math> या <math>\mathbb{R}^3</math>). | पीडीएम को किसी भी मनमानी संख्या में आयामों तक बढ़ाया जा सकता है, लेकिन आमतौर पर 2डी छवि और 3डी वॉल्यूम अनुप्रयोगों में उपयोग किया जाता है (जहां प्रत्येक लैंडमार्क बिंदु <math>\mathbb{R}^2</math> या <math>\mathbb{R}^3</math>). | ||
Line 49: | Line 49: | ||
==चर्चा== | ==चर्चा== | ||
यूक्लिडियन अंतरिक्ष में व्याख्या किए गए | यूक्लिडियन अंतरिक्ष में व्याख्या किए गए आइजनवेक्टर को अनुक्रम के रूप में देखा जा सकता है <math>k</math> यूक्लिडियन वैक्टर संबंधित लैंडमार्क से जुड़े हैं और पूरे आकार के लिए मिश्रित चाल को निर्दिष्ट करते हैं। वैश्विक अरैखिक भिन्नता को आमतौर पर अच्छी तरह से नियंत्रित किया जाता है, बशर्ते अरेखीय भिन्नता को उचित स्तर पर रखा जाए। आमतौर पर, [[कर्नेल पीसीए]]-आधारित विधियों के शिक्षण में ट्विस्टिंग [[ निमेटोड |निमेटोड]] वर्म का उपयोग उदाहरण के रूप में किया जाता है। | ||
पीसीए गुणों के कारण: ईजेनवेक्टर परस्पर [[ ओर्थोगोनल ]] होते हैं, आकार स्थान में प्रशिक्षण सेट क्लाउड का आधार बनाते हैं, और इस स्थान में 0 पर क्रॉस करते हैं, जो औसत आकार का प्रतिनिधित्व करता है। इसके अलावा, पीसीए | पीसीए गुणों के कारण: ईजेनवेक्टर परस्पर [[ ओर्थोगोनल |ओर्थोगोनल]] होते हैं, आकार स्थान में प्रशिक्षण सेट क्लाउड का आधार बनाते हैं, और इस स्थान में 0 पर क्रॉस करते हैं, जो औसत आकार का प्रतिनिधित्व करता है। इसके अलावा, पीसीए बंद दीर्घवृत्त को बिंदुओं के गाऊसी बादल (उनके आयाम जो भी हो) में फिट करने का पारंपरिक तरीका है: यह सीमित भिन्नता की अवधारणा का सुझाव देता है। | ||
पीडीएम के पीछे विचार यह है कि ईजेनवेक्टरों को रैखिक रूप से जोड़कर नए आकार के उदाहरण तैयार किए जा सकते हैं जो प्रशिक्षण सेट में 'जैसा दिखेंगे'। गुणांकों को संबंधित eigenvalues के मानों के समान सीमित किया गया है, ताकि यह सुनिश्चित किया जा सके कि उत्पन्न 2n/3n-आयामी बिंदु हाइपर-दीर्घवृत्ताकार अनुमत डोमेन-[[स्वीकार्य आकार डोमेन]] (एएसडी) में रहेगा।<ref name=taylor/> | पीडीएम के पीछे विचार यह है कि ईजेनवेक्टरों को रैखिक रूप से जोड़कर नए आकार के उदाहरण तैयार किए जा सकते हैं जो प्रशिक्षण सेट में 'जैसा दिखेंगे'। गुणांकों को संबंधित eigenvalues के मानों के समान सीमित किया गया है, ताकि यह सुनिश्चित किया जा सके कि उत्पन्न 2n/3n-आयामी बिंदु हाइपर-दीर्घवृत्ताकार अनुमत डोमेन-[[स्वीकार्य आकार डोमेन]] (एएसडी) में रहेगा।<ref name=taylor/> | ||
Line 61: | Line 61: | ||
==संदर्भ== | ==संदर्भ== | ||
<references/> | <references/> | ||
Revision as of 09:36, 3 August 2023
बिंदु वितरण मॉडल किसी आकृति की औसत ज्यामिति और आकृतियों के प्रशिक्षण सेट से अनुमानित ज्यामितीय भिन्नता के कुछ सांख्यिकीय तरीकों का प्रतिनिधित्व करने के लिए मॉडल है।
पृष्ठभूमि
बिंदु वितरण मॉडल अवधारणा कूट्स द्वारा विकसित की गई है,[1] टेलर एट अल.[2] और सांख्यिकीय आकार विश्लेषण के लिए कंप्यूटर दृष्टि में मानक बन गया[3] और मेडिकल इमेजिंग की छवि विभाजन के लिए[2]जहां आकार पुजारी वास्तव में शोर और कम-विपरीत पिक्सेल/स्वर की व्याख्या में मदद करते हैं। बाद वाला बिंदु सक्रिय आकार मॉडल (एएसएम) और सक्रिय उपस्थिति मॉडल (एएएम) की ओर ले जाता है।
बिंदु वितरण मॉडल ऐतिहासिक बिंदुओं पर निर्भर करते हैं। मील का पत्थर एनोटेटिंग बिंदु है जो एनाटोमिस्ट द्वारा प्रशिक्षण सेट आबादी में प्रत्येक आकार के उदाहरण के लिए दिए गए स्थान पर लगाया जाता है। उदाहरण के लिए, वही लैंडमार्क 2डी हाथों की रूपरेखा के प्रशिक्षण सेट में तर्जनी की नोक को नामित करेगा। उदाहरण के लिए, प्रमुख घटक विश्लेषण (पीसीए), प्रशिक्षण सेट आबादी के बीच स्थलों के समूहों के बीच आंदोलन के सहसंबंधों का अध्ययन करने के लिए प्रासंगिक उपकरण है। आमतौर पर, यह पता लगा सकता है कि ही उंगली के साथ स्थित सभी स्थलचिह्न प्रशिक्षण सेट उदाहरणों में साथ बिल्कुल साथ चलते हैं, जो सपाट हाथों के संग्रह के लिए अलग-अलग अंगुलियों के बीच का अंतर दिखाते हैं।
विवरण
सबसे पहले, प्रशिक्षण छवियों का सेट मूल आकृतियों की ज्यामिति को पर्याप्त रूप से अनुमानित करने के लिए पर्याप्त संबंधित स्थलों के साथ मैन्युअल रूप से चिह्नित किया जाता है। इन स्थलों को सामान्यीकृत प्रोक्रस्टेस विश्लेषण का उपयोग करके संरेखित किया गया है, जो बिंदुओं के बीच न्यूनतम वर्ग त्रुटि को कम करता है।
दो आयामों में संरेखित स्थलचिह्न इस प्रकार दिए गए हैं
- .
यह ध्यान रखना महत्वपूर्ण है कि प्रत्येक मील का पत्थर समान संरचनात्मक स्थान का प्रतिनिधित्व करना चाहिए। उदाहरण के लिए, मील का पत्थर #3, सभी प्रशिक्षण छवियों में अनामिका की नोक का प्रतिनिधित्व हो सकता है।
अब आकृति की रूपरेखा को अनुक्रमों में घटा दिया गया है स्थलचिह्न, ताकि किसी दिए गए प्रशिक्षण आकार को वेक्टर के रूप में परिभाषित किया जा सके . यह मानते हुए कि बिखराव इस स्थान में गाऊसी वितरण है, पीसीए का उपयोग सभी प्रशिक्षण आकृतियों में सहप्रसरण मैट्रिक्स के सामान्यीकृत eigenvectors और eigenvalues की गणना करने के लिए किया जाता है। शीर्ष का मैट्रिक्स eigenvectors के रूप में दिया गया है , और प्रत्येक eigenvector सेट के साथ भिन्नता के प्रमुख मोड का वर्णन करता है।
अंत में, नए आकार को परिभाषित करने के लिए आइजेनवेक्टरों के रैखिक संयोजन का उपयोग किया जाता है , गणितीय रूप से परिभाषित:
कहाँ सभी प्रशिक्षण छवियों में औसत आकार के रूप में परिभाषित किया गया है, और प्रत्येक प्रमुख घटक के लिए स्केलिंग मानों का वेक्टर है। इसलिए, वेरिएबल को संशोधित करके आकृतियों की अनंत संख्या को परिभाषित किया जा सकता है। यह सुनिश्चित करने के लिए कि सभी नए आकार प्रशिक्षण सेट में देखी गई भिन्नता के भीतर हैं, केवल प्रत्येक तत्व को अनुमति देना आम बात है भीतर होना 3 मानक विचलन, जहां किसी दिए गए प्रमुख घटक के मानक विचलन को उसके संबंधित eigenvalue के वर्गमूल के रूप में परिभाषित किया गया है।
पीडीएम को किसी भी मनमानी संख्या में आयामों तक बढ़ाया जा सकता है, लेकिन आमतौर पर 2डी छवि और 3डी वॉल्यूम अनुप्रयोगों में उपयोग किया जाता है (जहां प्रत्येक लैंडमार्क बिंदु या ).
चर्चा
यूक्लिडियन अंतरिक्ष में व्याख्या किए गए आइजनवेक्टर को अनुक्रम के रूप में देखा जा सकता है यूक्लिडियन वैक्टर संबंधित लैंडमार्क से जुड़े हैं और पूरे आकार के लिए मिश्रित चाल को निर्दिष्ट करते हैं। वैश्विक अरैखिक भिन्नता को आमतौर पर अच्छी तरह से नियंत्रित किया जाता है, बशर्ते अरेखीय भिन्नता को उचित स्तर पर रखा जाए। आमतौर पर, कर्नेल पीसीए-आधारित विधियों के शिक्षण में ट्विस्टिंग निमेटोड वर्म का उपयोग उदाहरण के रूप में किया जाता है।
पीसीए गुणों के कारण: ईजेनवेक्टर परस्पर ओर्थोगोनल होते हैं, आकार स्थान में प्रशिक्षण सेट क्लाउड का आधार बनाते हैं, और इस स्थान में 0 पर क्रॉस करते हैं, जो औसत आकार का प्रतिनिधित्व करता है। इसके अलावा, पीसीए बंद दीर्घवृत्त को बिंदुओं के गाऊसी बादल (उनके आयाम जो भी हो) में फिट करने का पारंपरिक तरीका है: यह सीमित भिन्नता की अवधारणा का सुझाव देता है।
पीडीएम के पीछे विचार यह है कि ईजेनवेक्टरों को रैखिक रूप से जोड़कर नए आकार के उदाहरण तैयार किए जा सकते हैं जो प्रशिक्षण सेट में 'जैसा दिखेंगे'। गुणांकों को संबंधित eigenvalues के मानों के समान सीमित किया गया है, ताकि यह सुनिश्चित किया जा सके कि उत्पन्न 2n/3n-आयामी बिंदु हाइपर-दीर्घवृत्ताकार अनुमत डोमेन-स्वीकार्य आकार डोमेन (एएसडी) में रहेगा।[2]
यह भी देखें
संदर्भ
- ↑ T. F. Cootes (May 2004), Statistical models of appearance for computer vision (PDF)
- ↑ 2.0 2.1 2.2 D.H. Cooper; T.F. Cootes; C.J. Taylor; J. Graham (1995), "Active shape models—their training and application", Computer Vision and Image Understanding (61): 38–59
- ↑ Rhodri H. Davies and Carole J. Twining and P. Daniel Allen and Tim F. Cootes and Chris J. Taylor (2003). Shape discrimination in the Hippocampus using an MDL Model. IMPI. Archived from the original on 2008-10-08. Retrieved 2007-07-27.
बाहरी संबंध
- Flexible Models for Computer Vision, Tim Cootes, Manchester University.
- A practical introduction to PDM and ASMs.