बहुरेखीय प्रमुख घटक विश्लेषण: Difference between revisions
No edit summary |
No edit summary |
||
Line 1: | Line 1: | ||
{{short description|Multilinear extension of principal component analysis}} | {{short description|Multilinear extension of principal component analysis}} | ||
मल्टीलीनियर [[ प्रमुख कंपोनेंट विश्लेषण |प्रमुख कंपोनेंट विश्लेषण]] (एमपीसीए) प्रिंसिपल कंपोनेंट एनालिसिस (पीसीए) का मल्टीलीनियर बीजगणित विस्तार है। एमपीसीए का उपयोग एम-वे | मल्टीलीनियर [[ प्रमुख कंपोनेंट विश्लेषण |प्रमुख कंपोनेंट विश्लेषण]] (एमपीसीए) प्रिंसिपल कंपोनेंट एनालिसिस (पीसीए) का मल्टीलीनियर बीजगणित विस्तार है। एमपीसीए का उपयोग एम-वे सारणियों के विश्लेषण में किया जाता है, अर्थात संख्याओं का घन या हाइपर-क्यूब, जिसे अनौपचारिक रूप से डेटा टेंसर भी कहा जाता है। एम-वे सारणियों को इसके द्वारा प्रतिरूपित किया जा सकता है| | ||
* रैखिक टेंसर मॉडल जैसे | * रैखिक टेंसर मॉडल जैसे कैंडेकॉम्प/पैराफैक, या | ||
* मल्टीलीनियर टेंसर मॉडल, जैसे मल्टीलीनियर प्रिंसिपल कंपोनेंट एनालिसिस (एमपीसीए), या मल्टीलीनियर इंडिपेंडेंट कंपोनेंट एनालिसिस (एमआईसीए), | * मल्टीलीनियर टेंसर मॉडल, जैसे मल्टीलीनियर प्रिंसिपल कंपोनेंट एनालिसिस (एमपीसीए), या मल्टीलीनियर इंडिपेंडेंट कंपोनेंट एनालिसिस (एमआईसीए), आदि हैं। | ||
एमपीसीए की उत्पत्ति का पता [[टकर अपघटन]] से लगाया जा सकता है<ref>{{Cite journal|last1=Tucker| first1=Ledyard R | एमपीसीए की उत्पत्ति का पता [[टकर अपघटन]] से लगाया जा सकता है<ref>{{Cite journal|last1=Tucker| first1=Ledyard R | ||
| authorlink1 = Ledyard R Tucker | | authorlink1 = Ledyard R Tucker | ||
Line 10: | Line 10: | ||
|date=September 1966 | |date=September 1966 | ||
| doi = 10.1007/BF02289464 | pmid = 5221127 | | doi = 10.1007/BF02289464 | pmid = 5221127 | ||
}}</ref> और पीटर क्रूनबर्ग का 3-मोड पीसीए | }}</ref> और पीटर क्रूनबर्ग का 3-मोड पीसीए कार्य से लगाया जा सकता हैं।<ref name="Kroonenberg1980">P. M. Kroonenberg and J. de Leeuw, [https://doi.org/10.1007%2FBF02293599 Principal component analysis of three-mode data by means of alternating least squares algorithms], Psychometrika, 45 (1980), pp. 69–97.</ref> 2000 में, डी लाथौवर एट अल। टकर और क्रूनेनबर्ग के काम को उनके एसआईएएम पेपर में [[बहुरेखीय एकवचन मान अपघटन]] नामक (एचओएसवीडी) और उनके पेपर में सर्वश्रेष्ठ रैंक-1 और रैंक-(आर) पर<sub>1</sub>, आर<sub>2</sub>, ..., आर<sub>N</sub> ) '''उनके एसआईएएम पेपर में''' स्पष्ट और संक्षिप्त संख्यात्मक कम्प्यूटेशनल शब्दों में दोहराया गया है ,<ref name="DeLathauwer2000a">{{cite journal | last1 = Lathauwer | first1 = L.D. | last2 = Moor | first2 = B.D. | last3 = Vandewalle | first3 = J. | year = 2000 | title = एक बहुरेखीय एकवचन मूल्य अपघटन| url = http://portal.acm.org/citation.cfm?id=354398 | journal = SIAM Journal on Matrix Analysis and Applications | volume = 21 | issue = 4| pages = 1253–1278 | doi = 10.1137/s0895479896305696 }}</ref> '''(एचओएसवीडी) और उनके पेपर में सर्वश्रेष्ठ रैंक-1 और रैंक-(आर) पर<sub>1</sub>, आर<sub>2</sub>, ..., आर<sub>N</sub> )''' उच्च-क्रम टेन्सर्स का अनुमान हैं।<ref name=DeLathauwer2000b>{{cite journal | last1 = Lathauwer | first1 = L. D. | last2 = Moor | first2 = B. D. | last3 = Vandewalle | first3 = J. | year = 2000 | title = On the best rank-1 and rank-(R1, R2, ..., RN ) approximation of higher-order tensors | url = http://portal.acm.org/citation.cfm?id=354405 | journal = SIAM Journal on Matrix Analysis and Applications | volume = 21 | issue = 4| pages = 1324–1342 | doi = 10.1137/s0895479898346995 }}</ref> | ||
लगभग 2001 में, वासिलेस्कु और टेरज़ोपोलोस ने डेटा विश्लेषण, पहचान और संश्लेषण समस्याओं को मल्टीलाइनर टेंसर समस्याओं के रूप में पुनः परिभाषित किया। टेन्सर फ़ैक्टर विश्लेषण डेटा निर्माण के कई कारण कारकों का संरचनात्मक परिणाम है, और मल्टी-मोडल डेटा टेन्सर विश्लेषण के लिए उपयुक्त है। निम्नलिखित कार्यों में डेटा निर्माण के उनके कारण कारकों के संदर्भ में मानव गति संयुक्त कोणों, चेहरे की छवियों या बनावट का विश्लेषण करके टेंसर ढांचे की शक्ति का प्रदर्शन किया गया था: मानव गति हस्ताक्षर<ref name="Vasilescu2002b">M.A.O. Vasilescu (2002) [http://www.media.mit.edu/~maov/motionsignatures/hms_icpr02_corrected.pdf "Human Motion Signatures: Analysis, Synthesis, Recognition," Proceedings of International Conference on Pattern Recognition (ICPR 2002), Vol. 3, Quebec City, Canada, Aug, 2002, 456–460.]</ref>(सीवीपीआर 2001, आईसीपीआर 2002), चेहरा पहचान - टेन्सरफेसेस,<ref name="Vasilescu2002a" /><ref name="Vasilescu2003" />(ईसीसीवी 2002, सी वीपी आर '''CVPR''' 2003, आदि) और कंप्यूटर ग्राफ़िक्स - [[Index.php?title=टेंसर टेक्सचर|टेंसर टेक्सचर]]<ref name="Vasilescu2004" />(सिग्राफ 2004)। | |||
ऐतिहासिक रूप से, एमपीसीए को एम-मोड पीसीए के रूप में संदर्भित किया गया है, शब्दावली जिसे 1980 में पीटर क्रूनबर्ग द्वारा गढ़ा गया था।<ref name="Kroonenberg1980" />2005 में, वासिलेस्कु और [[दिमित्रिस टेरज़ोपोलोस]] ने रैखिक और बहुरेखीय टेंसर अपघटन के बीच बेहतर अंतर करने के साथ-साथ कार्य के बीच बेहतर अंतर करने के तरीके के रूप में शब्दावली की शुरुआत की हैं| <ref name="Vasilescu2002b" /> <ref name="Vasilescu2002a" /> <ref name="Vasilescu2003" /> <ref name="Vasilescu2004" /> जिसने प्रत्येक डेटा टेंसर मोड (अक्ष) से जुड़े दूसरे क्रम के आँकड़ों की गणना की गई, और मल्टीलिनियर इंडिपेंडेंट कंपोनेंट विश्लेषण पर बाद में काम किया।<ref name="MPCA-MICA2005">M. A. O. Vasilescu, D. Terzopoulos (2005) [http://www.media.mit.edu/~maov/mica/mica05.pdf "Multilinear Independent Component Analysis"], "Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR’05), San Diego, CA, June 2005, vol.1, 547–553."</ref> जिसमे प्रत्येक टेंसर मोड/अक्ष से जुड़े उच्च क्रम के आँकड़ों की गणना की गई हैं है। | |||
एमपीसीए डेटा टेंसर के प्रत्येक मोड से जुड़े ऑर्थोनॉर्मल | मल्टीलिनियर पीसीए को डेटा निर्माण के कारण कारकों की गणना करने के लिए या डेटा टेंसर पर सिग्नल प्रोसेसिंग टूल के रूप में लागू किया जा सकता है, जिनके व्यक्तिगत अवलोकन को या तो सदिश किया गया है,<ref name="Vasilescu2002b" /><ref name="Vasilescu2002a">M.A.O. Vasilescu, [[Demetri Terzopoulos|D. Terzopoulos]] (2002) [http://www.media.mit.edu/~maov/tensorfaces/eccv02_corrected.pdf "Multilinear Analysis of Image Ensembles: TensorFaces," Proc. 7th European Conference on Computer Vision (ECCV'02), Copenhagen, Denmark, May, 2002, in Computer Vision – ECCV 2002, Lecture Notes in Computer Science, Vol. 2350, A. Heyden et al. (Eds.), Springer-Verlag, Berlin, 2002, 447–460. ]</ref><ref name="Vasilescu2003">M.A.O. Vasilescu, D. Terzopoulos (2003) [http://www.media.mit.edu/~maov/tensorfaces/cvpr03.pdf "Multilinear Subspace Analysis for Image Ensembles,'' M. A. O. Vasilescu, D. Terzopoulos, Proc. Computer Vision and Pattern Recognition Conf. (CVPR '03), Vol.2, Madison, WI, June, 2003, 93–99.'']</ref><ref name="Vasilescu2004">M.A.O. Vasilescu, D. Terzopoulos (2004) [http://www.media.mit.edu/~maov/tensortextures/Vasilescu_siggraph04.pdf "TensorTextures: Multilinear Image-Based Rendering", M. A. O. Vasilescu and D. Terzopoulos, Proc. ACM SIGGRAPH 2004 Conference Los Angeles, CA, August, 2004, in Computer Graphics Proceedings, Annual Conference Series, 2004, 336–342. ]</ref> या जिनके अवलोकनों को संग्रह के रूप में माना जाता है स्तंभ/पंक्ति अवलोकनों, डेटा आव्युह के और डेटा टेंसर में संयोजित किया जाता है। इस दृष्टिकोण का मुख्य नुकसान सभी संभावित संयोजनों की गणना करना है | ||
एमपीसीए डेटा टेंसर के प्रत्येक मोड से जुड़े ऑर्थोनॉर्मल आव्युह के सेट की गणना करता है जो आव्युह एसवीडी द्वारा गणना किए गए आव्युह की ऑर्थोनॉर्मल पंक्ति और कॉलम सम्मिस्ट के अनुरूप होते हैं। इस परिवर्तन का उद्देश्य प्रत्येक डेटा टेंसर मोड (अक्ष) से जुड़े डेटा में अधिक से अधिक परिवर्तनशीलता को ध्यान में रखते हुए, जितना संभव हो उतना उच्च भिन्नता प्राप्त करना है। | |||
== एल्गोरिथ्म == | == एल्गोरिथ्म == | ||
Line 23: | Line 24: | ||
== सुविधा चयन == | == सुविधा चयन == | ||
एमपीसीए विशेषताएं: पर्यवेक्षित एमपीसीए कारण कारक विश्लेषण में | एमपीसीए विशेषताएं: पर्यवेक्षित एमपीसीए को कारण कारक विश्लेषण में नियोजित किया जाता है जो वस्तु पहचान की सुविधा प्रदान करता है<ref name="MPCA">M. A. O. Vasilescu, D. Terzopoulos (2003) [http://www.cs.toronto.edu/~maov/tensorfaces/cvpr03.pdf "Multilinear Subspace Analysis of Image Ensembles"], "Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR’03), Madison, WI, June, 2003"</ref> जबकि अर्ध-पर्यवेक्षित एमपीसीए सुविधा चयन आभासीकरण कार्यों में नियोजित किया जाता है।<ref>H. Lu, H.-L. Eng, M. Thida, and K.N. Plataniotis, "[http://www.dsp.utoronto.ca/~haiping/Publication/CrowdMPCA_CIKM2010.pdf Visualization and Clustering of Crowd Video Content in MPCA Subspace]," in Proceedings of the 19th ACM Conference on Information and Knowledge Management (CIKM 2010), Toronto, ON, Canada, October, 2010.</ref> | ||
== एक्सटेंशन == | == एक्सटेंशन == | ||
एमपीसीए के विभिन्न विस्तार: | एमपीसीए के विभिन्न विस्तार: |
Revision as of 18:24, 12 July 2023
मल्टीलीनियर प्रमुख कंपोनेंट विश्लेषण (एमपीसीए) प्रिंसिपल कंपोनेंट एनालिसिस (पीसीए) का मल्टीलीनियर बीजगणित विस्तार है। एमपीसीए का उपयोग एम-वे सारणियों के विश्लेषण में किया जाता है, अर्थात संख्याओं का घन या हाइपर-क्यूब, जिसे अनौपचारिक रूप से डेटा टेंसर भी कहा जाता है। एम-वे सारणियों को इसके द्वारा प्रतिरूपित किया जा सकता है|
- रैखिक टेंसर मॉडल जैसे कैंडेकॉम्प/पैराफैक, या
- मल्टीलीनियर टेंसर मॉडल, जैसे मल्टीलीनियर प्रिंसिपल कंपोनेंट एनालिसिस (एमपीसीए), या मल्टीलीनियर इंडिपेंडेंट कंपोनेंट एनालिसिस (एमआईसीए), आदि हैं।
एमपीसीए की उत्पत्ति का पता टकर अपघटन से लगाया जा सकता है[1] और पीटर क्रूनबर्ग का 3-मोड पीसीए कार्य से लगाया जा सकता हैं।[2] 2000 में, डी लाथौवर एट अल। टकर और क्रूनेनबर्ग के काम को उनके एसआईएएम पेपर में बहुरेखीय एकवचन मान अपघटन नामक (एचओएसवीडी) और उनके पेपर में सर्वश्रेष्ठ रैंक-1 और रैंक-(आर) पर1, आर2, ..., आरN ) उनके एसआईएएम पेपर में स्पष्ट और संक्षिप्त संख्यात्मक कम्प्यूटेशनल शब्दों में दोहराया गया है ,[3] (एचओएसवीडी) और उनके पेपर में सर्वश्रेष्ठ रैंक-1 और रैंक-(आर) पर1, आर2, ..., आरN ) उच्च-क्रम टेन्सर्स का अनुमान हैं।[4]
लगभग 2001 में, वासिलेस्कु और टेरज़ोपोलोस ने डेटा विश्लेषण, पहचान और संश्लेषण समस्याओं को मल्टीलाइनर टेंसर समस्याओं के रूप में पुनः परिभाषित किया। टेन्सर फ़ैक्टर विश्लेषण डेटा निर्माण के कई कारण कारकों का संरचनात्मक परिणाम है, और मल्टी-मोडल डेटा टेन्सर विश्लेषण के लिए उपयुक्त है। निम्नलिखित कार्यों में डेटा निर्माण के उनके कारण कारकों के संदर्भ में मानव गति संयुक्त कोणों, चेहरे की छवियों या बनावट का विश्लेषण करके टेंसर ढांचे की शक्ति का प्रदर्शन किया गया था: मानव गति हस्ताक्षर[5](सीवीपीआर 2001, आईसीपीआर 2002), चेहरा पहचान - टेन्सरफेसेस,[6][7](ईसीसीवी 2002, सी वीपी आर CVPR 2003, आदि) और कंप्यूटर ग्राफ़िक्स - टेंसर टेक्सचर[8](सिग्राफ 2004)।
ऐतिहासिक रूप से, एमपीसीए को एम-मोड पीसीए के रूप में संदर्भित किया गया है, शब्दावली जिसे 1980 में पीटर क्रूनबर्ग द्वारा गढ़ा गया था।[2]2005 में, वासिलेस्कु और दिमित्रिस टेरज़ोपोलोस ने रैखिक और बहुरेखीय टेंसर अपघटन के बीच बेहतर अंतर करने के साथ-साथ कार्य के बीच बेहतर अंतर करने के तरीके के रूप में शब्दावली की शुरुआत की हैं| [5] [6] [7] [8] जिसने प्रत्येक डेटा टेंसर मोड (अक्ष) से जुड़े दूसरे क्रम के आँकड़ों की गणना की गई, और मल्टीलिनियर इंडिपेंडेंट कंपोनेंट विश्लेषण पर बाद में काम किया।[9] जिसमे प्रत्येक टेंसर मोड/अक्ष से जुड़े उच्च क्रम के आँकड़ों की गणना की गई हैं है।
मल्टीलिनियर पीसीए को डेटा निर्माण के कारण कारकों की गणना करने के लिए या डेटा टेंसर पर सिग्नल प्रोसेसिंग टूल के रूप में लागू किया जा सकता है, जिनके व्यक्तिगत अवलोकन को या तो सदिश किया गया है,[5][6][7][8] या जिनके अवलोकनों को संग्रह के रूप में माना जाता है स्तंभ/पंक्ति अवलोकनों, डेटा आव्युह के और डेटा टेंसर में संयोजित किया जाता है। इस दृष्टिकोण का मुख्य नुकसान सभी संभावित संयोजनों की गणना करना है
एमपीसीए डेटा टेंसर के प्रत्येक मोड से जुड़े ऑर्थोनॉर्मल आव्युह के सेट की गणना करता है जो आव्युह एसवीडी द्वारा गणना किए गए आव्युह की ऑर्थोनॉर्मल पंक्ति और कॉलम सम्मिस्ट के अनुरूप होते हैं। इस परिवर्तन का उद्देश्य प्रत्येक डेटा टेंसर मोड (अक्ष) से जुड़े डेटा में अधिक से अधिक परिवर्तनशीलता को ध्यान में रखते हुए, जितना संभव हो उतना उच्च भिन्नता प्राप्त करना है।
एल्गोरिथ्म
एमपीसीए समाधान वैकल्पिक न्यूनतम वर्ग (एएलएस) दृष्टिकोण का पालन करता है। यह प्रकृति में पुनरावर्ती है. पीसीए की तरह, एमपीसीए केंद्रित डेटा पर काम करता है। टेंसरों के लिए केंद्रीकरण थोड़ा अधिक जटिल है, और यह समस्या पर निर्भर है।
सुविधा चयन
एमपीसीए विशेषताएं: पर्यवेक्षित एमपीसीए को कारण कारक विश्लेषण में नियोजित किया जाता है जो वस्तु पहचान की सुविधा प्रदान करता है[10] जबकि अर्ध-पर्यवेक्षित एमपीसीए सुविधा चयन आभासीकरण कार्यों में नियोजित किया जाता है।[11]
एक्सटेंशन
एमपीसीए के विभिन्न विस्तार:
- मजबूत एमपीसीए (आरएमपीसीए)[12]
- मल्टी-टेंसर फ़ैक्टराइज़ेशन, जो स्वचालित रूप से घटकों की संख्या भी ढूंढता है (MTF)[13]
संदर्भ
- ↑ Tucker, Ledyard R (September 1966). "Some mathematical notes on three-mode factor analysis". Psychometrika. 31 (3): 279–311. doi:10.1007/BF02289464. PMID 5221127.
- ↑ 2.0 2.1 P. M. Kroonenberg and J. de Leeuw, Principal component analysis of three-mode data by means of alternating least squares algorithms, Psychometrika, 45 (1980), pp. 69–97.
- ↑ Lathauwer, L.D.; Moor, B.D.; Vandewalle, J. (2000). "एक बहुरेखीय एकवचन मूल्य अपघटन". SIAM Journal on Matrix Analysis and Applications. 21 (4): 1253–1278. doi:10.1137/s0895479896305696.
- ↑ Lathauwer, L. D.; Moor, B. D.; Vandewalle, J. (2000). "On the best rank-1 and rank-(R1, R2, ..., RN ) approximation of higher-order tensors". SIAM Journal on Matrix Analysis and Applications. 21 (4): 1324–1342. doi:10.1137/s0895479898346995.
- ↑ 5.0 5.1 5.2 M.A.O. Vasilescu (2002) "Human Motion Signatures: Analysis, Synthesis, Recognition," Proceedings of International Conference on Pattern Recognition (ICPR 2002), Vol. 3, Quebec City, Canada, Aug, 2002, 456–460.
- ↑ 6.0 6.1 6.2 M.A.O. Vasilescu, D. Terzopoulos (2002) "Multilinear Analysis of Image Ensembles: TensorFaces," Proc. 7th European Conference on Computer Vision (ECCV'02), Copenhagen, Denmark, May, 2002, in Computer Vision – ECCV 2002, Lecture Notes in Computer Science, Vol. 2350, A. Heyden et al. (Eds.), Springer-Verlag, Berlin, 2002, 447–460.
- ↑ 7.0 7.1 7.2 M.A.O. Vasilescu, D. Terzopoulos (2003) "Multilinear Subspace Analysis for Image Ensembles, M. A. O. Vasilescu, D. Terzopoulos, Proc. Computer Vision and Pattern Recognition Conf. (CVPR '03), Vol.2, Madison, WI, June, 2003, 93–99.
- ↑ 8.0 8.1 8.2 M.A.O. Vasilescu, D. Terzopoulos (2004) "TensorTextures: Multilinear Image-Based Rendering", M. A. O. Vasilescu and D. Terzopoulos, Proc. ACM SIGGRAPH 2004 Conference Los Angeles, CA, August, 2004, in Computer Graphics Proceedings, Annual Conference Series, 2004, 336–342.
- ↑ M. A. O. Vasilescu, D. Terzopoulos (2005) "Multilinear Independent Component Analysis", "Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR’05), San Diego, CA, June 2005, vol.1, 547–553."
- ↑ M. A. O. Vasilescu, D. Terzopoulos (2003) "Multilinear Subspace Analysis of Image Ensembles", "Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR’03), Madison, WI, June, 2003"
- ↑ H. Lu, H.-L. Eng, M. Thida, and K.N. Plataniotis, "Visualization and Clustering of Crowd Video Content in MPCA Subspace," in Proceedings of the 19th ACM Conference on Information and Knowledge Management (CIKM 2010), Toronto, ON, Canada, October, 2010.
- ↑ K. Inoue, K. Hara, K. Urahama, "Robust multilinear principal component analysis", Proc. IEEE Conference on Computer Vision, 2009, pp. 591–597.
- ↑ Khan, Suleiman A.; Leppäaho, Eemeli; Kaski, Samuel (2016-06-10). "बायेसियन मल्टी-टेंसर फ़ैक्टराइज़ेशन". Machine Learning (in English). 105 (2): 233–253. arXiv:1412.4679. doi:10.1007/s10994-016-5563-y. ISSN 0885-6125.
बाहरी संबंध
- Matlab code: MPCA.
- Matlab code: UMPCA (including data).
- R code: MTF