प्रक्षेपण आव्यूह
सांख्यिकी में, प्रक्षेपण मैट्रिक्स ,[1] कभी-कभी इसे प्रभाव मैट्रिक्स भी कहा जाता है[2] या टोपी मैट्रिक्स , प्रतिक्रिया चर (आश्रित चर मान) के वेक्टर को फिट किए गए मान (या अनुमानित मान) के वेक्टर में मैप करता है। यह प्रत्येक फिट मूल्य पर प्रत्येक प्रतिक्रिया मूल्य के प्रभाव फ़ंक्शन (सांख्यिकी) का वर्णन करता है।[3][4] प्रक्षेपण मैट्रिक्स के विकर्ण तत्व उत्तोलन (सांख्यिकी) हैं, जो उसी अवलोकन के लिए फिट किए गए मूल्य पर प्रत्येक प्रतिक्रिया मूल्य के प्रभाव का वर्णन करते हैं।
परिभाषा
यदि रिस्पांस वेरिएबल के वेक्टर को निरूपित किया जाता है और द्वारा फिट किए गए मानों का वेक्टर ,
जैसा आमतौर पर इसका उच्चारण y-hat, प्रक्षेपण मैट्रिक्स होता है इसे हैट मैट्रिक्स भी कहा जाता है क्योंकि यह सिकमफ़्लक्स लगाता है .
ith पंक्ति और jth कॉलम में तत्व जेवें प्रतिक्रिया मान और आईटीवें फिट मूल्य के बीच सहप्रसरण के बराबर है, जिसे पूर्व के विचरण से विभाजित किया जाता है:[5]
अवशेषों के लिए आवेदन
आँकड़ों में त्रुटियों और अवशेषों के वेक्टर का सूत्र प्रक्षेपण मैट्रिक्स का उपयोग करके भी संक्षिप्त रूप से व्यक्त किया जा सकता है:
कहाँ पहचान मैट्रिक्स है. गणित का सवाल इसे कभी-कभी अवशिष्ट निर्माता मैट्रिक्स या विनाशक मैट्रिक्स के रूप में जाना जाता है।
अवशेषों का सहप्रसरण मैट्रिक्स , त्रुटि प्रसार द्वारा, बराबर होता है
- ,
कहाँ is the covariance matrix of the error vector (and by extension, the response vector as well). For the case of linear models with independent and identically distributed errors in which , यह कम हो जाता है:[3]:.
अंतर्ज्ञान
चित्र से यह स्पष्ट है कि वेक्टर से निकटतम बिंदु के कॉलम स्थान पर , है , और यह वह जगह है जहां हम कॉलम स्पेस के लिए ओर्थोगोनल रेखा खींच सकते हैं . वेक्टर जो मैट्रिक्स के कॉलम स्पेस के लिए ऑर्थोगोनल है, मैट्रिक्स ट्रांसपोज़ के शून्य स्थान में है, इसलिए
वहां से, कोई पुनर्व्यवस्थित करता है, इसलिए
इसलिए, जब से के कॉलम स्पेस पर है , प्रक्षेपण मैट्रिक्स, जो मानचित्रण करता है पर बस है , या
रेखीय मॉडल
मान लीजिए कि हम रैखिक न्यूनतम वर्गों का उपयोग करके रैखिक मॉडल का अनुमान लगाना चाहते हैं। मॉडल को इस प्रकार लिखा जा सकता है
कहाँ व्याख्यात्मक चर (डिजाइन मैट्रिक्स) का मैट्रिक्स है, β अनुमान लगाए जाने वाले अज्ञात मापदंडों का वेक्टर है, और ε त्रुटि वेक्टर है।
कई प्रकार के मॉडल और तकनीकें इस फॉर्मूलेशन के अधीन हैं। कुछ उदाहरण रैखिक न्यूनतम वर्ग (गणित), स्प्लिन को चौरसाई करना, प्रतिगमन विभाजन, स्थानीय रिग्रेशन, स्थानीय प्रतिगमन और रैखिक फ़िल्टरिंग हैं।
सामान्य न्यूनतम वर्ग
जब प्रत्येक अवलोकन के लिए वजन समान होते हैं और आंकड़ों में त्रुटियां और अवशेष असंबंधित होते हैं, तो अनुमानित पैरामीटर होते हैं
तो फिट किए गए मान हैं
इसलिए, प्रोजेक्शन मैट्रिक्स (और हैट मैट्रिक्स) द्वारा दिया गया है
भारित और सामान्यीकृत न्यूनतम वर्ग
उपरोक्त को उन मामलों के लिए सामान्यीकृत किया जा सकता है जहां वजन समान नहीं हैं और/या त्रुटियां सहसंबद्ध हैं। मान लीजिए कि त्रुटियों का सहप्रसरण मैट्रिक्स Σ है। तब से
- .
टोपी मैट्रिक्स इस प्रकार है
और फिर से ऐसा देखने को मिल सकता है , हालाँकि अब यह सममित नहीं रह गया है।
गुण
प्रक्षेपण मैट्रिक्स में कई उपयोगी बीजगणितीय गुण हैं।[6][7] रैखिक बीजगणित की भाषा में, प्रक्षेपण मैट्रिक्स डिज़ाइन मैट्रिक्स के स्तंभ स्थान पर ऑर्थोगोनल प्रक्षेपण है .[4](ध्यान दें कि मूर-पेनरोज़ स्यूडोइनवर्स#पूर्ण रैंक है।) इस सेटिंग में प्रक्षेपण मैट्रिक्स के कुछ तथ्य निम्नानुसार संक्षेप में प्रस्तुत किए गए हैं:[4]* और
- सममित है, और ऐसा ही है .
- निष्क्रिय है: , और ऐसे ही .
- अगर n × r मैट्रिक्स के साथ , तब
- के eigenvalues आर वाले से मिलकर बनता है और n − r शून्य, जबकि eigenvalues से बना हुआ n − r और आर शून्य.[8]
- के अंतर्गत अपरिवर्तनीय है : इस तरह .
- कुछ उप-स्थानों के लिए अद्वितीय है।
रैखिक मॉडल के अनुरूप प्रक्षेपण मैट्रिक्स सममित मैट्रिक्स और निष्क्रिय मैट्रिक्स है, अर्थात, . हालांकि, यह मामला हमेशा नहीं होता है; स्थानीय प्रतिगमन में | स्थानीय रूप से भारित स्कैटरप्लॉट स्मूथिंग (LOESS), उदाहरण के लिए, हैट मैट्रिक्स सामान्य रूप से न तो सममित है और न ही निष्क्रिय है।
रैखिक मॉडल के लिए, प्रक्षेपण मैट्रिक्स का ट्रेस (रैखिक बीजगणित) रैंक (रैखिक बीजगणित) के बराबर है , जो रैखिक मॉडल के स्वतंत्र मापदंडों की संख्या है।[9] LOESS जैसे अन्य मॉडलों के लिए जो अभी भी अवलोकनों में रैखिक हैं , प्रक्षेपण मैट्रिक्स का उपयोग मॉडल की स्वतंत्रता की डिग्री (सांख्यिकी)#प्रभावी स्वतंत्रता की डिग्री को परिभाषित करने के लिए किया जा सकता है।
प्रतिगमन विश्लेषण में प्रक्षेपण मैट्रिक्स के व्यावहारिक अनुप्रयोगों में लीवरेज (सांख्यिकी) और कुक की दूरी शामिल है, जो प्रभावशाली अवलोकनों की पहचान करने से संबंधित हैं, यानी अवलोकन जो प्रतिगमन के परिणामों पर बड़ा प्रभाव डालते हैं।
ब्लॉकवार सूत्र
मान लीजिए डिज़ाइन मैट्रिक्स स्तंभों द्वारा विघटित किया जा सकता है . टोपी या प्रक्षेपण ऑपरेटर को इस प्रकार परिभाषित करें . इसी प्रकार, अवशिष्ट ऑपरेटर को इस प्रकार परिभाषित करें .
फिर प्रक्षेपण मैट्रिक्स को निम्नानुसार विघटित किया जा सकता है:[10]
कहाँ, उदा., और .
इस तरह के अपघटन के कई अनुप्रयोग हैं। शास्त्रीय अनुप्रयोग में सभी का स्तंभ है, जो किसी को प्रतिगमन में अवरोधन शब्द जोड़ने के प्रभावों का विश्लेषण करने की अनुमति देता है। अन्य उपयोग निश्चित प्रभाव मॉडल में है, जहां निश्चित प्रभाव शर्तों के लिए डमी चर का बड़ा विरल मैट्रिक्स है। हैट मैट्रिक्स की गणना करने के लिए कोई इस विभाजन का उपयोग कर सकता है स्पष्ट रूप से मैट्रिक्स बनाए बिना , जो कंप्यूटर मेमोरी में फिट होने के लिए बहुत बड़ा हो सकता है।
यह भी देखें
- प्रक्षेपण (रैखिक बीजगणित)
- विद्यार्थीकृत अवशेष
- स्वतंत्रता की डिग्री (सांख्यिकी)#स्वतंत्रता की प्रभावी डिग्री
- माध्य और अनुमानित प्रतिक्रिया
संदर्भ
- ↑ Basilevsky, Alexander (2005). सांख्यिकीय विज्ञान में अनुप्रयुक्त मैट्रिक्स बीजगणित. Dover. pp. 160–176. ISBN 0-486-44538-0.
- ↑ "Data Assimilation: Observation influence diagnostic of a data assimilation system" (PDF). Archived from the original (PDF) on 2014-09-03.
- ↑ 3.0 3.1 Hoaglin, David C.; Welsch, Roy E. (February 1978). "The Hat Matrix in Regression and ANOVA" (PDF). The American Statistician. 32 (1): 17–22. doi:10.2307/2683469. hdl:1721.1/1920. JSTOR 2683469.
- ↑ 4.0 4.1 4.2 David A. Freedman (2009). Statistical Models: Theory and Practice. Cambridge University Press.
- ↑ Wood, Simon N. Generalized additive models: an introduction with R. chapman and hall/CRC, 2006.
- ↑ Gans, P. (1992). रासायनिक विज्ञान में डेटा फिटिंग. Wiley. ISBN 0-471-93412-7.
- ↑ Draper, N. R.; Smith, H. (1998). अनुप्रयुक्त प्रतिगमन विश्लेषण. Wiley. ISBN 0-471-17082-8.
- ↑ Amemiya, Takeshi (1985). उन्नत अर्थमिति. Cambridge: Harvard University Press. pp. 460–461. ISBN 0-674-00560-0.
- ↑ "प्रमाण है कि रैखिक प्रतिगमन में 'हैट' मैट्रिक्स का निशान एक्स की रैंक है". Stack Exchange. April 13, 2017.
- ↑ Rao, C. Radhakrishna; Toutenburg, Helge; Shalabh; Heumann, Christian (2008). रैखिक मॉडल और सामान्यीकरण (3rd ed.). Berlin: Springer. pp. 323. ISBN 978-3-540-74226-5.