आंशिक न्यूनतम वर्ग प्रतिगमन
एक श्रृंखला का हिस्सा |
प्रतिगमन विश्लेषण |
---|
मॉडल |
अनुमान |
पार्श्वभूमि |
|
आंशिक न्यूनतम वर्ग प्रतिगमन (पीएलएस प्रतिगमन) एक सांख्यिकीय पद्धति है जिसका प्रमुख घटक प्रतिगमन से निम्नतम संबंध है, जो प्रतिक्रिया और स्वतंत्र चर के बीच अधिकतम विचरण के अधिसमतल खोजने के बजाय, एक नए स्थान पर अनुमानित चर और अवलोकन योग्य चर को प्रक्षेपित करके एक रेखीय प्रतिगमन प्रतिरूप प्राप्त करता है। क्योंकि X और Y डेटा दोनों को नई जगहों पर प्रक्षेपित किया जाता है, तथा विधियों के पीएलएस परिवार को द्विरैखिक गुणक प्रतिरूप के रूप में जाना जाता है। आंशिक न्यूनतम वर्ग विभेदक विश्लेषण (पीएलएस-डीए) एक प्रकार है जिसका उपयोग तब किया जाता है जब Y श्रेणीबद्ध होता है।
पीएलएस का उपयोग दो आव्यूह (X और Y) के बीच मूलभूत संबंधों को खोजने के लिए किया जाता है, यानी इन दो स्थानों में सहप्रसरण संरचनाओं को प्रतिरूपित करने के लिए एक अव्यक्त चर दृष्टिकोण की आवश्कता होती है। एक पीएलएस प्रतिरूप 'X' समष्टि में बहुआयामी दिशा खोजने की कोशिश करेगा जो 'वाई' समष्टि में अधिकतम बहुआयामी विचरण दिशा की व्याख्या करता है। पीएलएस प्रतिगमन विशेष रूप से अनुकूल होता है जब भविष्यवक्ताओं के आव्यूह में अवलोकनों की तुलना में अधिक चर होते हैं, और जब 'X' मानों के बीच बहुसंरेखता होती है। इसके विपरीत, इन स्थितियोंं में मानक प्रतिगमन विफल हो जाएगा (जब तक कि इसे नियमित नहीं किया जाता)।
स्वीडिश सांख्यिकीविद हरमन ओ.ए. वोल्ड द्वारा आंशिक न्यूनतम वर्गों की शुरुआत की गई थी, जिन्होंने बाद में इसे अपने बेटे स्वंते वोल्ड के साथ विकसित किया। पीएलएस के लिए एक वैकल्पिक शब्द अव्यक्त संरचनाओं का प्रक्षेपण है,[1][2] लेकिन कई क्षेत्रों में आंशिक न्यूनतम वर्ग शब्द अभी भी प्रभावी है। यद्यपि मूल अनुप्रयोग सामाजिक विज्ञान में थे, इसलिए पीएलएस प्रतिगमन आज रसायन विज्ञान और संबंधित क्षेत्रों में सबसे व्यापक रूप से उपयोग किया जाता है। इसका उपयोग जैव सूचना विज्ञान, सेंसोमेट्रिक्स, तंत्रिका विज्ञान और नृविज्ञान में भी किया जाता है।
अंतर्निहित प्रतिरूप
बहुभिन्नरूपी पीएलएस का सामान्य अंतर्निहित प्रतिरूप
है , जहाँ X भविष्यवक्ताओं का आव्यूह है, तथा Y प्रतिक्रियाओं का आव्यूह है, T और U आव्यूह हैं जो क्रमशः X (X प्राप्तांक, घटक या गुणक आव्यूह) के प्रक्षेप और Y (Y प्राप्तांक) के प्रक्षेप हैं, P और Q क्रमशः, और लाम्बिक भरण आव्यूह हैं, और आव्यूह E और F त्रुटि शब्द हैं, जिन्हें स्वतंत्र और समान रूप से वितरित यादृच्छिक सामान्य चर माना जाता है। T और U के बीच सहप्रसरण को अधिकतम करने के लिए X और Y का अपघटन किया जाता है।
एल्गोरिदम (कलन विधि )
गुणक और भरण आव्यूह T, U, P और Q का अनुमान लगाने के लिए पीएलएस के कई प्रकार मौजूद हैं। उनमें से अधिकांश X और Y के बीच के रूप में रैखिक प्रतिगमन का अनुमान लगाते हैं। कुछ पीएलएस कलन गणित केवल उस स्थिति के लिए उपयुक्त होते हैं जहां Y एक स्तंभ सदिश है, जबकि अन्य आव्यूह Y की सामान्य स्थिति का वर्णन करते हैं। कलन गणित इस बात में भी भिन्न होते हैं कि क्या वे गुणक आव्यूह T का लाम्बिक (यानी, प्रसामान्य लांबिक विश्लेषण) आव्यूह के रूप में मूल्याकंन करते हैं या नहीं।[3][4][5][6][7][8] पीएलएस की इन सभी प्रकारो के लिए अंतिम भविष्यवाणी समान होगी, लेकिन घटक अलग-अलग होंगे।
पीएलएस निम्नलिखित चरणों की k परिस्थिति (k घटकों के लिए) बार-बार पुनरावृत्ति से बनी है,
- निविष्ट और निर्गत समष्टि में अधिकतम सहप्रसरण की दिशाओं का पता लगाना
- निविष्ट प्राप्तांक पर कम से कम वर्ग प्रतिगमन करना
- निविष्ट और/या लक्ष्य को अपस्फीति करना
पीएलएस 1
पीएलएस1 एक व्यापक रूप से उपयोग किया जाने वाला कलन गणित है जो सदिश Y स्थिति के लिए उपयुक्त है। यह T का प्रसामान्य लांबिक विश्लेषण आव्यूह के रूप में मूल्याकंन करता है। (सावधानी, नीचे दिए गए कोड में t सदिश उचित रूप से सामान्यीकृत नहीं हो सकते ,बातचीत देखें।) स्यूडोकोड में इसे नीचे व्यक्त किया गया है (बड़े अक्षर आव्यूह हैं, छोटे गुणक अक्षर सदिश हैं यदि वे उपरिलेख किए गए हैं और अदिश वे है जो पादांकित हैं)।
1 फलन पीएलएस1(X, y, l) 2 3 ,w का प्रारंभिक अनुमान। 4 for to 5 6 (ध्यान दें यह एक अदिश राशि है) 7 8 9 (ध्यान दें यह एक अदिश राशि है) 10 if 11 , break the for loop 12 if 13 14 15 end for 16 स्तंभ के साथ W को आव्यूह के रूप में परिभाषित करें। P आव्यूह और q सदिश बनाने के लिए ऐसा ही करें। 17 18 19 पुनरावृत्ति
कलन गणित के इस रूप में निविष्ट X और Y को केंद्रित करने की आवश्यकता नहीं है, क्योंकि यह कलन गणित द्वारा अंतर्निहित रूप से किया जाता है। इस कलन गणित में आव्यूह X का 'अपस्फीति' ( का घटाव) है, लेकिन सदिश y का अपस्फीति नहीं किया जाता है, क्योंकि यह आवश्यक नहीं है (यह सिद्ध किया जा सकता है कि y की अवस्फीति करने से वही परिणाम मिलते हैं जो अवक्षेपित नहीं होते हैं [9])। उपयोगकर्ता द्वारा आपूर्ति किया गया चर l प्रतिगमन में अव्यक्त गुणकों की संख्या की सीमा है, यदि यह आव्यूह X की कोटि के बराबर है, तो कलन गणित B और के लिए कम से कम वर्ग प्रतिगमन अनुमान प्राप्त करेगा।
विस्तारण
ओपीएलएस
2002 में एक नई विधि प्रकाशित हुई थी जिसे अव्यक्त संरचनाओं के लिए लाम्बिक अनुमान (ओपीएलएस) कहा जाता है। ओपीएलएस में, निरंतर चर डेटा को अनुमानित और असंबद्ध (लाम्बिक) जानकारी में अलग किया जाता है। यह बेहतर निदान के साथ-साथ अधिक आसानी से व्याख्या किए गए कल्पना की ओर जाता है। हालाँकि, ये परिवर्तन केवल व्याख्यात्मकता में सुधार करते हैं, न कि पीएलएस प्रतिरूप की भविष्यवाणी में।[10] इसी तरह, ओपीएलएस-डीए (विविक्तकर विश्लेषण) को असतत चर के साथ काम करते समय लागू किया जा सकता है, जैसा कि वर्गीकरण और बायोमार्कर अध्ययनों में होता है।
ओपीएलएस का सामान्य अंतर्निहित प्रतिरूप है
या O2-पीएलएस में[11]
एल-पीएलएस
पीएलएस प्रतिगमन का एक और विस्तार, जिसका नाम एल-पीएलएस है जो इसके एल-आकार के आव्यूह के लिए के लिए है, तथा भविष्यवाणी में सुधार के लिए 3 संबंधित डेटा ब्लॉक को जोड़ता है।[12] संक्षेप में, एक नया Z आव्यूह, X आव्यूह के समान स्तंभों के साथ, पीएलएस प्रतिगमन विश्लेषण में जोड़ा जाता है और भविष्यवक्ता चर की अन्योन्याश्रितता पर अतिरिक्त पृष्ठभूमि जानकारी सम्मिलित करने के लिए उपयुक्त हो सकता है।
3पीआरएफ
2015 में आंशिक न्यूनतम वर्ग तीन-पास प्रतिगमन निस्यंदक (3पीआरएफ) नामक एक प्रक्रिया से संबंधित था।[13] मान लें कि टिप्पणियों और चरों की संख्या बड़ी है, 3पीआरएफ (और इसलिए पीएलएस) एक रैखिक अव्यक्त गुणक प्रतिरूप द्वारा निहित सर्वोत्तम पूर्वानुमान के लिए विषम रूप से सामान्य है। स्टॉक मार्केट डेटा में, पीएलएस को प्रतिलाभ और नकदी प्रवाह वृद्धि के सटीक आउट-ऑफ-सैंपल पूर्वानुमान प्रदान करने के लिए दिखाया गया है।[14]
आंशिक कम वर्ग एसवीडी
एकवचन मूल्य अपघटन (एसवीडी) पर आधारित एक पीएलएस संस्करण एक मेमोरी कुशल कार्यान्वयन प्रदान करता है जिसका उपयोग उच्च-आयामी समस्याओं को हल करने के लिए किया जा सकता है, जैसे उपभोक्ता श्रेणी हार्डवेयर पर लाखों आनुवंशिक सूचको को प्रतिबिंबन आनुवंशिकी में हजारों प्रतिबिंबन सुविधाओं से संबंधित करना।[15]
पीएलएस सहसंबंध
पीएलएस सहसंबंध (पीएलएससी) पीएलएस प्रतिगमन से संबंधित एक अन्य पद्धति है,[16] जिसका उपयोग डेटा सेट के बीच संबंध की ताकत को मापने के लिए, न्यूरोइमेजिंग और खेल विज्ञान में किया गया है। [16][17][18] [19] आमतौर पर, पीएलएससी डेटा को दो ब्लॉकों (उप-समूहों) में विभाजित करता है, जिनमें से प्रत्येक में एक या एक से अधिक चर होते हैं, और फिर दो घटक उप-समूहों के बीच मौजूद किसी भी संबंध (यानी साझा जानकारी की मात्रा) की ताकत स्थापित करने के लिए एकवचन मूल्य अपघटन (एसवीडी) का उपयोग करता है।[20] यह विचाराधीन उप-समूहों के सहप्रसरण आव्यूह की जड़ता (यानी एकवचन मानों का योग) निर्धारित करने के लिए एसवीडी का उपयोग करके करता है।[20][16]
यह भी देखें
- विहित सहसंबंध
- डेटा खनन
- डेमिंग प्रतिगमन
- विशेषता निष्कर्षण
- यंत्र अधिगम
- आंशिक न्यूनतम वर्ग पथ प्रतिरूपण
- प्रमुख घटक विश्लेषण
- प्रतिगमन विश्लेषण
- वर्गों का कुल योग
साहित्य
- Kramer, R. (1998). मात्रात्मक विश्लेषण के लिए रसायनमितीय तकनीक. Marcel-Dekker. ISBN 978-0-8247-0198-7.
- Frank, Ildiko E.; Friedman, Jerome H. (1993). "कुछ रसायनमिति प्रतिगमन उपकरणों का एक सांख्यिकीय दृश्य". Technometrics. 35 (2): 109–148. doi:10.1080/00401706.1993.10485033.
- Haenlein, Michael; Kaplan, Andreas M. (2004). "आंशिक न्यूनतम वर्ग विश्लेषण के लिए एक प्रारंभिक मार्गदर्शिका". Understanding Statistics. 3 (4): 283–297. doi:10.1207/s15328031us0304_4.
- Henseler, Joerg; Fassott, Georg (2005). "पीएलएस पथ मॉडल में परीक्षण मॉडरेटिंग प्रभाव। उपलब्ध प्रक्रियाओं का एक उदाहरण".
{{cite journal}}
: Cite journal requires|journal=
(help) - Lingjærde, Ole-Christian; Christophersen, Nils (2000). "आंशिक न्यूनतम वर्गों की सिकुड़न संरचना". Scandinavian Journal of Statistics. 27 (3): 459–473. doi:10.1111/1467-9469.00201. S2CID 121489764.
- Tenenhaus, Michel (1998). पीएलएस प्रतिगमन: सिद्धांत और व्यवहार। पेरिस: तकनीक।.
- Rosipal, Roman; Kramer, Nicole (2006). "उप-स्थान, अव्यक्त संरचना और फ़ीचर चयन तकनीकों में आंशिक कम से कम वर्गों में अवलोकन और हाल के अग्रिम": 34–51.
{{cite journal}}
: Cite journal requires|journal=
(help) - Helland, Inge S. (1990). "पीएलएस प्रतिगमन और सांख्यिकीय मॉडल". Scandinavian Journal of Statistics. 17 (2): 97–114. JSTOR 4616159.
- Wold, Herman (1966). "Estimation of principal components and related models by iterative least squares". In Krishnaiaah, P.R. (ed.). बहुभिन्नरूपी विश्लेषण. New York: Academic Press. pp. 391–420.
- Wold, Herman (1981). अन्योन्याश्रित प्रणालियों के लिए फिक्स-पॉइंट दृष्टिकोण. Amsterdam: North Holland.
- Wold, Herman (1985). "Partial least squares". In Kotz, Samuel; Johnson, Norman L. (eds.). सांख्यिकीय विज्ञान का विश्वकोश. Vol. 6. New York: Wiley. pp. 581–591.
- Wold, Svante; Ruhe, Axel; Wold, Herman; Dunn, W.J. (1984). "रेखीय प्रतिगमन में संरेखता समस्या। सामान्यीकृत व्युत्क्रमों के लिए आंशिक न्यूनतम वर्ग (PLS) दृष्टिकोण". SIAM Journal on Scientific and Statistical Computing. 5 (3): 735–743. doi:10.1137/0905052.
- Garthwaite, Paul H. (1994). "आंशिक कम वर्गों की व्याख्या". Journal of the American Statistical Association. 89 (425): 122–7. doi:10.1080/01621459.1994.10476452. JSTOR 2291207.
- Wang, H., ed. (2010). आंशिक कम वर्गों की पुस्तिका. ISBN 978-3-540-32825-4.
- Stone, M.; Brooks, R.J. (1990). "कॉन्टिनम रिग्रेशन: क्रॉस-वैलिडेटेड सीक्वेंसली क्रिएटेड प्रेडिक्शन, जिसमें ऑर्डिनरी लीस्ट स्क्वेयर, पार्शियल लीस्ट स्क्वेयर और प्रिंसिपल कंपोनेंट्स रिग्रेशन शामिल हैं". Journal of the Royal Statistical Society, Series B. 52 (2): 237–269. JSTOR 2345437.
वेबलिंक्स
- पीएलएस प्रतिगमन और इसके इतिहास का संक्षिप्त परिचय
- वीडियो: प्रो. एच. हैरी असदा द्वारा पीएलएस की व्युत्पत्ति
संदर्भ
- ↑ Wold, S; Sjöström, M.; Eriksson, L. (2001). "पीएलएस-रिग्रेशन: केमोमेट्रिक्स का एक बुनियादी उपकरण". Chemometrics and Intelligent Laboratory Systems. 58 (2): 109–130. doi:10.1016/S0169-7439(01)00155-1. S2CID 11920190.
- ↑ Abdi, Hervé (2010). "आंशिक न्यूनतम वर्ग प्रतिगमन और अव्यक्त संरचना प्रतिगमन पर प्रक्षेपण (PLS प्रतिगमन)". WIREs Computational Statistics. 2: 97–106. doi:10.1002/wics.51. S2CID 122685021.
- ↑ Lindgren, F; Geladi, P; Wold, S (1993). "The kernel algorithm for PLS". J. Chemometrics. 7: 45–59. doi:10.1002/cem.1180070104. S2CID 122950427.
- ↑ de Jong, S.; ter Braak, C.J.F. (1994). "पीएलएस कर्नेल एल्गोरिथम पर टिप्पणियाँ". J. Chemometrics. 8 (2): 169–174. doi:10.1002/cem.1180080208. S2CID 221549296.
- ↑ Dayal, B.S.; MacGregor, J.F. (1997). "बेहतर पीएलएस एल्गोरिदम". J. Chemometrics. 11 (1): 73–85. doi:10.1002/(SICI)1099-128X(199701)11:1<73::AID-CEM435>3.0.CO;2-#. S2CID 120753851.
- ↑ de Jong, S. (1993). "SIMPLS: an alternative approach to partial least squares regression". Chemometrics and Intelligent Laboratory Systems. 18 (3): 251–263. doi:10.1016/0169-7439(93)85002-X.
- ↑ Rannar, S.; Lindgren, F.; Geladi, P.; Wold, S. (1994). "A PLS Kernel Algorithm for Data Sets with Many Variables and Fewer Objects. Part 1: Theory and Algorithm". J. Chemometrics. 8 (2): 111–125. doi:10.1002/cem.1180080204. S2CID 121613293.
- ↑ Abdi, H. (2010). "आंशिक न्यूनतम वर्ग प्रतिगमन और अव्यक्त संरचना प्रतिगमन पर प्रक्षेपण (PLS-प्रतिगमन)". Wiley Interdisciplinary Reviews: Computational Statistics. 2: 97–106. doi:10.1002/wics.51. S2CID 122685021.
- ↑ Höskuldsson, Agnar (1988). "पीएलएस प्रतिगमन के तरीके". Journal of Chemometrics. 2 (3): 219. doi:10.1002/cem.1180020306. S2CID 120052390.
- ↑ Trygg, J; Wold, S (2002). "Orthogonal Projections to Latent Structures". Journal of Chemometrics. 16 (3): 119–128. doi:10.1002/cem.695. S2CID 122699039.
- ↑ Eriksson, S. Wold, and J. Tryg. "O2PLS® for improved analysis and visualization of complex data." https://www.dynacentrix.com/telecharg/SimcaP/O2PLS.pdf
- ↑ Sæbøa, S.; Almøya, T.; Flatbergb, A.; Aastveita, A.H.; Martens, H. (2008). "LPLS-regression: a method for prediction and classification under the influence of background information on predictor variables". Chemometrics and Intelligent Laboratory Systems. 91 (2): 121–132. doi:10.1016/j.chemolab.2007.10.006.
- ↑ Kelly, Bryan; Pruitt, Seth (2015-06-01). "The three-pass regression filter: A new approach to forecasting using many predictors". Journal of Econometrics. High Dimensional Problems in Econometrics. 186 (2): 294–316. doi:10.1016/j.jeconom.2015.02.011.
- ↑ Kelly, Bryan; Pruitt, Seth (2013-10-01). "वर्तमान मूल्यों के क्रॉस-सेक्शन में बाजार की उम्मीदें". The Journal of Finance. 68 (5): 1721–1756. CiteSeerX 10.1.1.498.5973. doi:10.1111/jofi.12060. ISSN 1540-6261.
- ↑ Lorenzi, Marco; Altmann, Andre; Gutman, Boris; Wray, Selina; Arber, Charles; Hibar, Derrek P.; Jahanshad, Neda; Schott, Jonathan M.; Alexander, Daniel C. (2018-03-20). "Susceptibility of brain atrophy to TRIB3 in Alzheimer's disease, evidence from functional prioritization in imaging genetics". Proceedings of the National Academy of Sciences. 115 (12): 3162–3167. doi:10.1073/pnas.1706100115. ISSN 0027-8424. PMC 5866534. PMID 29511103.
- ↑ 16.0 16.1 16.2 Krishnan, Anjali; Williams, Lynne J.; McIntosh, Anthony Randal; Abdi, Hervé (May 2011). "Partial Least Squares (PLS) methods for neuroimaging: A tutorial and review". NeuroImage. 56 (2): 455–475. doi:10.1016/j.neuroimage.2010.07.034. PMID 20656037. S2CID 8796113.
- ↑ McIntosh, Anthony R.; Mišić, Bratislav (2013-01-03). "न्यूरोइमेजिंग डेटा के लिए बहुभिन्नरूपी सांख्यिकीय विश्लेषण". Annual Review of Psychology. 64 (1): 499–525. doi:10.1146/annurev-psych-113011-143804. ISSN 0066-4308. PMID 22804773.
- ↑ Beggs, Clive B.; Magnano, Christopher; Belov, Pavel; Krawiecki, Jacqueline; Ramasamy, Deepa P.; Hagemeier, Jesper; Zivadinov, Robert (2016-05-02). de Castro, Fernando (ed.). "Internal Jugular Vein Cross-Sectional Area and Cerebrospinal Fluid Pulsatility in the Aqueduct of Sylvius: A Comparative Study between Healthy Subjects and Multiple Sclerosis Patients". PLOS ONE. 11 (5): e0153960. Bibcode:2016PLoSO..1153960B. doi:10.1371/journal.pone.0153960. ISSN 1932-6203. PMC 4852898. PMID 27135831.
- ↑ Weaving, Dan; Jones, Ben; Ireton, Matt; Whitehead, Sarah; Till, Kevin; Beggs, Clive B. (2019-02-14). Connaboy, Chris (ed.). "Overcoming the problem of multicollinearity in sports performance data: A novel application of partial least squares correlation analysis". PLOS ONE. 14 (2): e0211776. Bibcode:2019PLoSO..1411776W. doi:10.1371/journal.pone.0211776. ISSN 1932-6203. PMC 6375576. PMID 30763328.
- ↑ 20.0 20.1 Abdi, Hervé; Williams, Lynne J. (2013), Reisfeld, Brad; Mayeno, Arthur N. (eds.), "Partial Least Squares Methods: Partial Least Squares Correlation and Partial Least Square Regression", Computational Toxicology, Humana Press, vol. 930, pp. 549–579, doi:10.1007/978-1-62703-059-5_23, ISBN 9781627030588, PMID 23086857