प्रक्षेपण आव्यूह

From Vigyanwiki

आधारभूत सांख्यिकी में, प्रक्षेपण मैट्रिक्स ,[1] कभी-कभी प्रभाव मैट्रिक्स[2] या हैट मैट्रिक्स विभिन्न प्रयोजनों में उपयोग की जाती है। यह प्रतिक्रिया चर (आश्रित चर मान) के वेक्टर को फिट किए गए मान (या अनुमानित मान) के वेक्टर में मैप करता है। यह प्रत्येक फिट मूल्य पर प्रत्येक प्रतिक्रिया मूल्य के प्रभाव फ़ंक्शन (सांख्यिकी) का वर्णन करता है।[3][4] प्रक्षेपण मैट्रिक्स के विकर्ण तत्व उत्तोलन (सांख्यिकी) हैं, जो उसी अवलोकन के लिए फिट किए गए मूल्य पर प्रत्येक प्रतिक्रिया मूल्य के प्रभाव का वर्णन करते हैं।

परिभाषा

यदि प्रतिक्रिया मूल्यों का वेक्टर द्वारा निरूपित किया जाता है और पूर्वानुमानित मूल्यों का वेक्टर है, तो

जैसा कि को आमतौर पर "वाई-हैट" के रूप में उच्चारित किया जाता है, प्रक्षेपण मैट्रिक्स भी "हैट मैट्रिक्स" के नाम से जानी जाती है, क्योंकि यह पर "हैट" लगाती है।

के ith वर्ग और jth स्तंभ में तत्व जो इस समान अवलोकन के लिए पूर्वानुमानित मूल्यों और उत्तर में वे पूर्वानुमानित मूल्यों के बीच सहप्रसरण है, उसे खण्ड व्युत्क्रमण कहा जाता है:[5]


अवशेषों के लिए आवेदन

आँकड़ों में त्रुटियों और अवशेषों के वेक्टर का सूत्र प्रक्षेपण मैट्रिक्स का उपयोग करके भी संक्षिप्त रूप से व्यक्त किया जा सकता है:

यहाँ आईडेंटिटी मैट्रिक्स है। मैट्रिक्स इसे कभी-कभी अवशिष्ट निर्माता मैट्रिक्स या विनाशक मैट्रिक्स के रूप में जाना जाता है।

अवशेषों का सहप्रसरण मैट्रिक्स के लिए, त्रुटि प्रसार द्वारा, निम्नलिखित होता है:

,

यहाँ त्रुटि वेक्टर के सहप्रसरण आव्यूह है (और विस्तार से प्रतिक्रिया वेक्टर का भी)। स्वतंत्र और समान रूप से वितरित त्रुटियों वाले रैखिक मॉडल के मामले में , इसे यह घटाया जा सकता है:[3]

.

अंतर्ज्ञान

मैट्रिक्स, इसके स्तंभ स्थान को हरी रेखा के रूप में दर्शाया गया है। कुछ वेक्टर का प्रक्षेपण के कॉलम स्थान पर वेक्टर है

चित्र से यह स्पष्ट है कि वेक्टर के लिए के स्तंभ स्थान का सबसे निकटतम बिंदु है, और यह एक बिंदु है जहां हम के स्तंभ स्थान के लिए एक लाइन लंबकोण खींच सकते हैं। एक मैट्रिक्स के स्तंभ स्थान के लिए लंबकोण खींचा गया वेक्टर उस मैट्रिक्स के प्रतिरोध स्थान में होता है, इसलिए

होता है। इसके बाद, हम इसे पुनर्व्यवस्थित करते हैं, इससे

इसलिए, जब से के कॉलम स्पेस पर है, प्रक्षेपण मैट्रिक्स, जो मानचित्रण करता है को के स्तंभ स्थान पर मान निर्धारित करता है, बस है, या होता है।


रेखीय मॉडल

मान लीजिए कि हम रैखिक न्यूनतम वर्गों का उपयोग करके रैखिक मॉडल का अनुमान लगाना चाहते हैं।मॉडल को निम्नलिखित रूप में लिखा जा सकता है:

जहाँ व्याख्यात्मक चर (डिजाइन मैट्रिक्स) का मैट्रिक्स है, β अज्ञात पैरामीटर का एक वेक्टर है जिसे अनुमानित किया जाना है, और ε त्रुटि वेक्टर है।

इस प्रपत्रणा के अधीन अनेक प्रकार के मॉडल और तकनीक हो सकते हैं। कुछ उदाहरण रैखिक न्यूनतम वर्ग (गणित), स्प्लिन को चौरसाई करना, प्रतिगमन विभाजन, स्थानीय रिग्रेशन, स्थानीय प्रतिगमन और रैखिक फिल्टर हैं।

सामान्य न्यूनतम वर्ग

जब प्रत्येक अवलोकन के लिए वजन समान होते हैं और त्रुटियां असंबद्ध होती हैं, तो अनुमानित पैरामीटर दिए गए होते हैं:

इसलिए फिटेड मान होते हैं:

इसलिए, प्रक्षेपण मैट्रिक्स (और हैट मैट्रिक्स) निम्नलिखित द्वारा दी जाती है:


भारित और सामान्यीकृत न्यूनतम वर्ग

उपरोक्त को उन मामलों के लिए सामान्यीकृत किया जा सकता है जहां वजन समान नहीं हैं और/या त्रुटियां सहसंबद्ध हैं। मान लीजिए कि त्रुटियों का सहप्रसरण मैट्रिक्स Σ है। तो क्योंकि

.

है, इसलिए प्रक्षेपण मैट्रिक्स इस प्रकार होती है:

और फिर फिर यह देखा जा सकता है कि , हालाँकि अब यह सममित नहीं रह गया है।

गुण

प्रक्षेपण मैट्रिक्स में कई उपयोगी बीजगणितीय गुणधर्म हैं।[6][7] रैखिक बीजगणित की भाषा में, प्रक्षेपण मैट्रिक्स डिज़ाइन मैट्रिक्स के स्तंभ स्थान पर ऑर्थोगोनल प्रक्षेपण है।[4](ध्यान दें कि डीडूर्वारा यह पसुचित जोरदार मैट्रिक्स है।) इस संस्करण में प्रोजेक्शन मैट्रिक्स के कुछ तथ्य संक्षेप में निम्नलिखित हैं:[4]* और

  • सममित है, और ऐसा ही है
  • निष्क्रिय है: , और ऐसे ही
  • अगर n × r मैट्रिक्स है, जिसमें , तो होता है।
  • के इजनवैल्यूज एकाधिकता में r और nr शून्य, होते हैं, जबकि के इजनवैल्यूज में nr शून्य होते हैं।[8]
  • के अंतर्गत अपरिवर्तनीय है: इसलिए
  • कुछ विशेष स्थानों के लिए अद्वितीय होती है।

रैखिक मॉडल के अनुरूप प्रक्षेपण मैट्रिक्स सममित मैट्रिक्स और निष्क्रिय मैट्रिक्स होती है, अर्थात, कहा जाता है। हालांकि, यह मामला हमेशा नहीं होता है; उदाहरण के लिए, स्थानीय वज्रछाया प्लॉट स्मूदिंग (LOESS) में, सामान्य रूप से न तो प्रोजेक्शन मैट्रिक्स संवेगीय होती है और न ही आईडेम्पोटेंट होती है।

रैखिक मॉडल के लिए, प्रक्षेपण मैट्रिक्स का ट्रेस (रैखिक बीजगणित) रैंक (रैखिक बीजगणित) के बराबर है , जो रैखिक मॉडल के स्वतंत्र मापदंडों की संख्या है।[9] LOESS जैसे अन्य मॉडलों के लिए जो अभी भी अवलोकनों में रैखिक हैं, प्रक्षेपण मैट्रिक्स का प्रयोग मॉडल की प्रभावशीलता के परिभाषित करने के लिए किया जा सकता है।

प्रतिगमन विश्लेषण में प्रक्षेपण मैट्रिक्स के व्यावहारिक अनुप्रयोगों में लीवरेज (सांख्यिकी) और कुक की दूरी शामिल है, जो प्रभावशाली अवलोकन की पहचान करने से संबंधित हैं, यानी अवलोकन जो प्रतिगमन के परिणामों पर बड़ा प्रभाव डालते हैं।

ब्लॉकवार सूत्र

मान लीजिए डिज़ाइन मैट्रिक्स को स्तंभों के रूप में इस तरह विभाजित किया जा सकता है: हैट या प्रक्षेपण ऑपरेटर को इस प्रकार निर्धारित किया जा सकता है:उसी तरह, रेजिड्यूअल ऑपरेटर को इस प्रकार निर्धारित किया जा सकता है: .

तो प्रक्षेपण मैट्रिक्स इस प्रकार विभाजित की जा सकती है:[10]

जहाँ, जैसे कि, और .

इस तरह के अपघटन के कई अनुप्रयोग हैं। शास्त्रीय अनुप्रयोग में सभी का स्तंभ है, जो किसी को प्रतिगमन में अवरोधन शब्द जोड़ने के प्रभावों का विश्लेषण करने की अनुमति देता है। अन्य उपयोग निश्चित प्रभाव मॉडल में है, जहां निश्चित प्रभाव शर्तों के लिए डमी चर का बड़ा विरल मैट्रिक्स है। हैट मैट्रिक्स की गणना करने के लिए कोई इस विभाजन का उपयोग कर सकता है स्पष्ट रूप से मैट्रिक्स बनाए बिना , जो कंप्यूटर मेमोरी में फिट होने के लिए बहुत बड़ा हो सकता है।

यह भी देखें

संदर्भ

  1. Basilevsky, Alexander (2005). सांख्यिकीय विज्ञान में अनुप्रयुक्त मैट्रिक्स बीजगणित. Dover. pp. 160–176. ISBN 0-486-44538-0.
  2. "Data Assimilation: Observation influence diagnostic of a data assimilation system" (PDF). Archived from the original (PDF) on 2014-09-03.
  3. 3.0 3.1 Hoaglin, David C.; Welsch, Roy E. (February 1978). "The Hat Matrix in Regression and ANOVA" (PDF). The American Statistician. 32 (1): 17–22. doi:10.2307/2683469. hdl:1721.1/1920. JSTOR 2683469.
  4. 4.0 4.1 4.2 David A. Freedman (2009). Statistical Models: Theory and Practice. Cambridge University Press.
  5. Wood, Simon N. Generalized additive models: an introduction with R. chapman and hall/CRC, 2006.
  6. Gans, P. (1992). रासायनिक विज्ञान में डेटा फिटिंग. Wiley. ISBN 0-471-93412-7.
  7. Draper, N. R.; Smith, H. (1998). अनुप्रयुक्त प्रतिगमन विश्लेषण. Wiley. ISBN 0-471-17082-8.
  8. Amemiya, Takeshi (1985). उन्नत अर्थमिति. Cambridge: Harvard University Press. pp. 460–461. ISBN 0-674-00560-0.
  9. "प्रमाण है कि रैखिक प्रतिगमन में 'हैट' मैट्रिक्स का निशान एक्स की रैंक है". Stack Exchange. April 13, 2017.
  10. Rao, C. Radhakrishna; Toutenburg, Helge; Shalabh; Heumann, Christian (2008). रैखिक मॉडल और सामान्यीकरण (3rd ed.). Berlin: Springer. pp. 323. ISBN 978-3-540-74226-5.