प्रक्षेपण आव्यूह

From Vigyanwiki

आधारभूत सांख्यिकी में, प्रक्षेपण आव्यूह ,[1] कभी-कभी प्रभाव आव्यूह[2] या हैट आव्यूह विभिन्न प्रयोजनों में उपयोग की जाती है। यह प्रतिक्रिया चर (आश्रित चर मान) के सदिश को फिट किए गए मान (या अनुमानित मान) के सदिश में मानचित्र करता है। यह प्रत्येक फिट मूल्य पर प्रत्येक प्रतिक्रिया मूल्य के प्रभाव फलन (सांख्यिकी) का वर्णन करता है।[3][4] प्रक्षेपण आव्यूह के विकर्ण तत्व उत्तबलन (सांख्यिकी) हैं, जो उसी अवलोकन के लिए फिट किए गए मूल्य पर प्रत्येक प्रतिक्रिया मूल्य के प्रभाव का वर्णन करते हैं।

परिभाषा

यदि प्रतिक्रिया मूल्यों का सदिश द्वारा निरूपित किया जाता है और पूर्वानुमानित मूल्यों का सदिश है, तब

जैसा कि को सामान्यतः "वाई-हैट" के रूप में उच्चारित किया जाता है, प्रक्षेपण आव्यूह भी "हैट आव्यूह" के नाम से जानी जाती है, क्योंकि यह पर "हैट" लगाती है।

के ith वर्ग और jth स्तंभ में तत्व जो इस समान अवलोकन के लिए पूर्वानुमानित मूल्यों और उत्तर में वह पूर्वानुमानित मूल्यों के बीच सहप्रसरण है, उसे खण्ड व्युत्क्रमण कहा जाता है:[5]


अवशेषों के लिए आवेदन

आँकड़ों में त्रुटियों और अवशेषों के सदिश का सूत्र प्रक्षेपण आव्यूह का उपयोग करके भी संक्षिप्त रूप से व्यक्त किया जा सकता है:

यहाँ आईडेंटिटी आव्यूह है। आव्यूह इसे कभी-कभी अवशिष्ट निर्माता आव्यूह या विनाशक आव्यूह के रूप में जाना जाता है।

अवशेषों का सहप्रसरण आव्यूह के लिए, त्रुटि प्रसार द्वारा, निम्नलिखित होता है:

,

यहाँ त्रुटि सदिश के सहप्रसरण आव्यूह है (और विस्तार से प्रतिक्रिया सदिश का भी)। स्वतंत्र और समान रूप से वितरित त्रुटियों वाले रैखिक मॉडल के स्थितियों में , इसे यह घटाया जा सकता है:[3]

.

अंतर्ज्ञान

आव्यूह, इसके स्तंभ स्थान को हरी रेखा के रूप में दर्शाया गया है। कुछ सदिश का प्रक्षेपण के कॉलम स्थान पर सदिश है

चित्र से यह स्पष्ट है कि सदिश के लिए के स्तंभ स्थान का सबसे निकटतम बिंदु है, और यह बिंदु है जहां हम के स्तंभ स्थान के लिए लाइन लंबकोण खींच सकते हैं। आव्यूह के स्तंभ स्थान के लिए लंबकोण खींचा गया सदिश उस आव्यूह के प्रतिरोध स्थान में होता है, इसलिए

होता है। इसके पश्चात्, हम इसे पुनर्व्यवस्थित करते हैं, इससे

इसलिए, जब से के कॉलम स्पेस पर है, प्रक्षेपण आव्यूह, जो मानचित्रण करता है को के स्तंभ स्थान पर मान निर्धारित करता है, बस है, या होता है।

रेखीय मॉडल

मान लीजिए कि हम रैखिक न्यूनतम वर्गों का उपयोग करके रैखिक मॉडल का अनुमान लगाना चाहते हैं। मॉडल को निम्नलिखित रूप में लिखा जा सकता है:

जहाँ व्याख्यात्मक चर (डिजाइन आव्यूह) का आव्यूह है, β अज्ञात पैरामीटर का सदिश है जिसे अनुमानित किया जाना है, और ε त्रुटि सदिश है।

इस प्रपत्रणा के अधीन अनेक प्रकार के मॉडल और विधि हो सकते हैं। कुछ उदाहरण रैखिक न्यूनतम वर्ग (गणित), स्प्लिन को चौरसाई करना, प्रतिगमन विभाजन, स्थानीय रिग्रेशन, स्थानीय प्रतिगमन और रैखिक फिल्टर हैं।

सामान्य न्यूनतम वर्ग

जब प्रत्येक अवलोकन के लिए वजन समान होते हैं और त्रुटियां असंबद्ध होती हैं, तब अनुमानित पैरामीटर दिए गए होते हैं:

इसलिए फिटेड मान होते हैं:

इसलिए, प्रक्षेपण आव्यूह (और हैट आव्यूह) निम्नलिखित द्वारा दी जाती है:


भारित और सामान्यीकृत न्यूनतम वर्ग

उपरोक्त को उन स्थितियों के लिए सामान्यीकृत किया जा सकता है जहां वजन समान नहीं हैं और/या त्रुटियां सहसंबद्ध हैं। मान लीजिए कि त्रुटियों का सहप्रसरण आव्यूह Σ है। तब क्योंकि

.

है, इसलिए प्रक्षेपण आव्यूह इस प्रकार होती है:

और फिर यह देखा जा सकता है कि , चूंकि अब यह सममित नहीं रह गया है।

गुण

प्रक्षेपण आव्यूह में अनेक उपयोगी बीजगणितीय गुणधर्म हैं।[6][7] रैखिक बीजगणित की भाषा में, प्रक्षेपण आव्यूह डिज़ाइन आव्यूह के स्तंभ स्थान पर ऑर्थोगोनल प्रक्षेपण है।[4](ध्यान दें कि डीडूर्वारा यह पसुचित जोरदार आव्यूह है।) इस संस्करण में प्रोजेक्शन आव्यूह के कुछ तथ्य संक्षेप में निम्नलिखित हैं:[4]* और

  • सममित है, और ऐसा ही है
  • निष्क्रिय है: , और ऐसे ही
  • यदि n × r आव्यूह है, जिसमें , तब होता है।
  • के इजनवैल्यूज एकाधिकता में r और nr शून्य, होते हैं, जबकि के इजनवैल्यूज में nr शून्य होते हैं।[8]
  • के अंतर्गत अपरिवर्तनीय है: इसलिए
  • कुछ विशेष स्थानों के लिए अद्वितीय होती है।

रैखिक मॉडल के अनुरूप प्रक्षेपण आव्यूह सममित आव्यूह और निष्क्रिय आव्यूह होती है, अर्थात, कहा जाता है। चूंकि, यह स्थितियों सदैव नहीं होता है; उदाहरण के लिए, स्थानीय वज्रछाया प्लॉट स्मूदिंग (LOESS) में, सामान्य रूप से न तब प्रोजेक्शन आव्यूह संवेगीय होती है और न ही आईडेम्पोटेंट होती है।

रैखिक मॉडल के लिए, प्रक्षेपण आव्यूह का ट्रेस (रैखिक बीजगणित) रैंक (रैखिक बीजगणित) के सामान्तर है , जो रैखिक मॉडल के स्वतंत्र मापदंडों की संख्या है।[9] LOESS जैसे अन्य मॉडलों के लिए जो अभी भी अवलोकनों में रैखिक हैं, प्रक्षेपण आव्यूह का प्रयोग मॉडल की प्रभावशीलता के परिभाषित करने के लिए किया जा सकता है।

प्रतिगमन विश्लेषण में प्रक्षेपण आव्यूह के व्यावहारिक अनुप्रयोगों में लीवरेज (सांख्यिकी) और कुक की दूरी सम्मिलित है, जो प्रभावशाली अवलोकन की पहचान करने से संबंधित हैं, अर्थात अवलोकन जो प्रतिगमन के परिणामों पर बड़ा प्रभाव डालते हैं।

ब्लॉकवार सूत्र

मान लीजिए डिज़ाइन आव्यूह को स्तंभों के रूप में इस प्रकार विभाजित किया जा सकता है: हैट या प्रक्षेपण ऑपरेटर को इस प्रकार निर्धारित किया जा सकता है:उसी प्रकार, रेजिड्यूअल ऑपरेटर को इस प्रकार निर्धारित किया जा सकता है: .

तब प्रक्षेपण आव्यूह इस प्रकार विभाजित की जा सकती है:[10]

जहाँ, जैसे कि, और .

इस प्रकार के अपघटन के अनेक अनुप्रयोग हैं। शास्त्रीय अनुप्रयोग में सभी का स्तंभ होता है, जिससे विश्लेषण करने की अनुमति मिलती है कि प्रशासनिक शब्द को प्रतिस्थापित शब्द में जोड़ने के प्रभावों का विश्लेषण किया जा सकता है। अन्य उपयोग निश्चित प्रभाव मॉडल में होता है, जहां निश्चित प्रभाव शर्तबं के लिए डमी चर का बड़ा विरल आव्यूह होता है। इस पार्टिशन का उपयोग करके आप संगठित कर सकते हैं बिना के प्रोजेक्शन आव्यूह को गणना किये, जो संभवतः कंप्यूटर मेमोरी में फिट नहीं हो सकती है।

यह भी देखें

संदर्भ

  1. Basilevsky, Alexander (2005). सांख्यिकीय विज्ञान में अनुप्रयुक्त मैट्रिक्स बीजगणित. Dover. pp. 160–176. ISBN 0-486-44538-0.
  2. "Data Assimilation: Observation influence diagnostic of a data assimilation system" (PDF). Archived from the original (PDF) on 2014-09-03.
  3. 3.0 3.1 Hoaglin, David C.; Welsch, Roy E. (February 1978). "The Hat Matrix in Regression and ANOVA" (PDF). The American Statistician. 32 (1): 17–22. doi:10.2307/2683469. hdl:1721.1/1920. JSTOR 2683469.
  4. 4.0 4.1 4.2 David A. Freedman (2009). Statistical Models: Theory and Practice. Cambridge University Press.
  5. Wood, Simon N. Generalized additive models: an introduction with R. chapman and hall/CRC, 2006.
  6. Gans, P. (1992). रासायनिक विज्ञान में डेटा फिटिंग. Wiley. ISBN 0-471-93412-7.
  7. Draper, N. R.; Smith, H. (1998). अनुप्रयुक्त प्रतिगमन विश्लेषण. Wiley. ISBN 0-471-17082-8.
  8. Amemiya, Takeshi (1985). उन्नत अर्थमिति. Cambridge: Harvard University Press. pp. 460–461. ISBN 0-674-00560-0.
  9. "प्रमाण है कि रैखिक प्रतिगमन में 'हैट' मैट्रिक्स का निशान एक्स की रैंक है". Stack Exchange. April 13, 2017.
  10. Rao, C. Radhakrishna; Toutenburg, Helge; Shalabh; Heumann, Christian (2008). रैखिक मॉडल और सामान्यीकरण (3rd ed.). Berlin: Springer. pp. 323. ISBN 978-3-540-74226-5.