प्रक्षेपण आव्यूह: Difference between revisions
No edit summary |
No edit summary |
||
Line 2: | Line 2: | ||
{{For|रैखिक परिवर्तन|प्रक्षेपण (रैखिक बीजगणित)}} | {{For|रैखिक परिवर्तन|प्रक्षेपण (रैखिक बीजगणित)}} | ||
आधारभूत सांख्यिकी में, प्रक्षेपण | आधारभूत सांख्यिकी में, '''प्रक्षेपण आव्यूह''' <math>(\mathbf{P})</math>,<ref>{{cite book |first=Alexander |last=Basilevsky |title=सांख्यिकीय विज्ञान में अनुप्रयुक्त मैट्रिक्स बीजगणित|publisher=Dover |year=2005 |isbn=0-486-44538-0 |pages=160–176 |url=https://books.google.com/books?id=ScssAwAAQBAJ&pg=PA160 }}</ref> कभी-कभी प्रभाव आव्यूह<ref>{{cite web |title=Data Assimilation: Observation influence diagnostic of a data assimilation system |url=http://old.ecmwf.int/newsevents/training/lecture_notes/pdf_files/ASSIM/ObservationInfluence.pdf |archive-url=https://web.archive.org/web/20140903115021/http://old.ecmwf.int/newsevents/training/lecture_notes/pdf_files/ASSIM/ObservationInfluence.pdf |url-status=dead |archive-date=2014-09-03 }}</ref> या हैट आव्यूह <math>(\mathbf{H})</math> विभिन्न प्रयोजनों में उपयोग की जाती है। यह प्रतिक्रिया चर (आश्रित चर मान) के सदिश को फिट किए गए मान (या अनुमानित मान) के सदिश में मानचित्र करता है। यह प्रत्येक [[फिट मूल्य]] पर प्रत्येक प्रतिक्रिया मूल्य के प्रभाव फलन (सांख्यिकी) का वर्णन करता है।<ref name="Hoaglin1977" >{{Cite journal | title = The Hat Matrix in Regression and ANOVA | ||
| first1= David C. | last1= Hoaglin |first2= Roy E. | last2=Welsch |journal= [[The American Statistician]] | volume=32 |date=February 1978| pages=17–22 | doi = 10.2307/2683469 |issue=1| jstor = 2683469 |url=http://dspace.mit.edu/bitstream/1721.1/1920/1/SWP-0901-02752210.pdf | hdl= 1721.1/1920 | hdl-access= free }}</ref><ref name = "Freedman09">{{cite book |author=David A. Freedman |author-link=David A. Freedman |year=2009|title=Statistical Models: Theory and Practice |publisher=[[Cambridge University Press]]}}</ref> प्रक्षेपण | | first1= David C. | last1= Hoaglin |first2= Roy E. | last2=Welsch |journal= [[The American Statistician]] | volume=32 |date=February 1978| pages=17–22 | doi = 10.2307/2683469 |issue=1| jstor = 2683469 |url=http://dspace.mit.edu/bitstream/1721.1/1920/1/SWP-0901-02752210.pdf | hdl= 1721.1/1920 | hdl-access= free }}</ref><ref name = "Freedman09">{{cite book |author=David A. Freedman |author-link=David A. Freedman |year=2009|title=Statistical Models: Theory and Practice |publisher=[[Cambridge University Press]]}}</ref> प्रक्षेपण आव्यूह के विकर्ण तत्व [[उत्तोलन (सांख्यिकी)|उत्तबलन (सांख्यिकी)]] हैं, जो उसी अवलोकन के लिए फिट किए गए मूल्य पर प्रत्येक प्रतिक्रिया मूल्य के प्रभाव का वर्णन करते हैं। | ||
==परिभाषा== | ==परिभाषा== | ||
यदि प्रतिक्रिया मूल्यों का | यदि प्रतिक्रिया मूल्यों का सदिश द्वारा निरूपित किया जाता है <math>\mathbf{y}</math> और पूर्वानुमानित मूल्यों का सदिश <math>\mathbf{\hat{y}}</math> है, तब | ||
:<math>\mathbf{\hat{y}} = \mathbf{P} \mathbf{y}.</math> | :<math>\mathbf{\hat{y}} = \mathbf{P} \mathbf{y}.</math> | ||
जैसा कि <math>\mathbf{\hat{y}}</math> को | जैसा कि <math>\mathbf{\hat{y}}</math> को सामान्यतः "वाई-हैट" के रूप में उच्चारित किया जाता है, प्रक्षेपण आव्यूह <math>\mathbf{P}</math> भी "हैट आव्यूह" के नाम से जानी जाती है, क्योंकि यह <math>\mathbf{y}</math> पर "हैट" लगाती है। | ||
<math>\mathbf{P}</math> के ith वर्ग और jth स्तंभ में तत्व जो इस समान अवलोकन के लिए पूर्वानुमानित मूल्यों और उत्तर में | <math>\mathbf{P}</math> के ith वर्ग और jth स्तंभ में तत्व जो इस समान अवलोकन के लिए पूर्वानुमानित मूल्यों और उत्तर में वह पूर्वानुमानित मूल्यों के बीच [[सहप्रसरण]] है, उसे खण्ड व्युत्क्रमण कहा जाता है:<ref>Wood, Simon N. Generalized additive models: an introduction with R. chapman and hall/CRC, 2006.</ref> | ||
:<math>p_{ij} = \frac{\operatorname{Cov}\left[ \hat{y}_i, y_j \right]}{\operatorname{Var}\left[y_j \right]}</math> | :<math>p_{ij} = \frac{\operatorname{Cov}\left[ \hat{y}_i, y_j \right]}{\operatorname{Var}\left[y_j \right]}</math> | ||
==अवशेषों के लिए आवेदन== | ==अवशेषों के लिए आवेदन== | ||
आँकड़ों में त्रुटियों और अवशेषों के | आँकड़ों में त्रुटियों और अवशेषों के सदिश का सूत्र <math>\mathbf{r}</math> प्रक्षेपण आव्यूह का उपयोग करके भी संक्षिप्त रूप से व्यक्त किया जा सकता है: | ||
:<math>\mathbf{r} = \mathbf{y} - \mathbf{\hat{y}} = \mathbf{y} - \mathbf{P} \mathbf{y} = \left( \mathbf{I} - \mathbf{P} \right) \mathbf{y}.</math> | :<math>\mathbf{r} = \mathbf{y} - \mathbf{\hat{y}} = \mathbf{y} - \mathbf{P} \mathbf{y} = \left( \mathbf{I} - \mathbf{P} \right) \mathbf{y}.</math> | ||
यहाँ <math>\mathbf{I}</math> आईडेंटिटी | यहाँ <math>\mathbf{I}</math> आईडेंटिटी आव्यूह है। आव्यूह <math>\mathbf{M} \equiv \mathbf{I} - \mathbf{P}</math> इसे कभी-कभी अवशिष्ट निर्माता आव्यूह या विनाशक आव्यूह के रूप में जाना जाता है। | ||
अवशेषों का सहप्रसरण | अवशेषों का सहप्रसरण आव्यूह <math>\mathbf{r}</math> के लिए, [[त्रुटि प्रसार]] द्वारा, निम्नलिखित होता है: | ||
:<math>\mathbf{\Sigma}_\mathbf{r} = \left( \mathbf{I} - \mathbf{P} \right)^\textsf{T} \mathbf{\Sigma} \left( \mathbf{I}-\mathbf{P} \right)</math>, | :<math>\mathbf{\Sigma}_\mathbf{r} = \left( \mathbf{I} - \mathbf{P} \right)^\textsf{T} \mathbf{\Sigma} \left( \mathbf{I}-\mathbf{P} \right)</math>, | ||
यहाँ <math>\mathbf{\Sigma}</matH> त्रुटि | यहाँ <math>\mathbf{\Sigma}</matH> त्रुटि सदिश के [[covariance matrix|सहप्रसरण आव्यूह]] है (और विस्तार से प्रतिक्रिया सदिश का भी)। [[independent and identically distributed|स्वतंत्र और समान रूप से वितरित]] त्रुटियों वाले रैखिक मॉडल के स्थितियों में <math>\mathbf{\Sigma} = \sigma^{2} \mathbf{I}</math>, इसे यह घटाया जा सकता है:<ref name="Hoaglin1977"/> | ||
<math>\mathbf{\Sigma}_\mathbf{r} = \left( \mathbf{I} - \mathbf{P} \right) \sigma^{2}</math>. | <math>\mathbf{\Sigma}_\mathbf{r} = \left( \mathbf{I} - \mathbf{P} \right) \sigma^{2}</math>. | ||
==अंतर्ज्ञान== | ==अंतर्ज्ञान== | ||
[[File:Projection of a vector onto the column space of a matrix.svg|thumb| | [[File:Projection of a vector onto the column space of a matrix.svg|thumb|आव्यूह, <math>\mathbf{A}</math> इसके स्तंभ स्थान को हरी रेखा के रूप में दर्शाया गया है। कुछ सदिश का प्रक्षेपण <math>\mathbf{b}</math> के कॉलम स्थान पर <math>\mathbf{A}</math> सदिश है <math>\mathbf{x}</math>]]चित्र से यह स्पष्ट है कि सदिश <math>\mathbf{b}</math> के लिए <math>\mathbf{A}</math> के स्तंभ स्थान का सबसे निकटतम बिंदु <math>\mathbf{Ax}</math> है, और यह बिंदु है जहां हम <math>\mathbf{A}</math> के स्तंभ स्थान के लिए लाइन लंबकोण खींच सकते हैं। आव्यूह के स्तंभ स्थान के लिए लंबकोण खींचा गया सदिश उस आव्यूह के प्रतिरोध स्थान में होता है, इसलिए | ||
:<math>\mathbf{A}^\textsf{T}(\mathbf{b}-\mathbf{Ax}) = 0</math> | :<math>\mathbf{A}^\textsf{T}(\mathbf{b}-\mathbf{Ax}) = 0</math> | ||
होता है। इसके | होता है। इसके पश्चात्, हम इसे पुनर्व्यवस्थित करते हैं, इससे | ||
:<math>\begin{align} | :<math>\begin{align} | ||
&& \mathbf{A}^\textsf{T}\mathbf{b} &- \mathbf{A}^\textsf{T}\mathbf{Ax} = 0 \\ | && \mathbf{A}^\textsf{T}\mathbf{b} &- \mathbf{A}^\textsf{T}\mathbf{Ax} = 0 \\ | ||
Line 34: | Line 34: | ||
\Rightarrow && \mathbf{x} &= \left(\mathbf{A}^\textsf{T}\mathbf{A}\right)^{-1}\mathbf{A}^\textsf{T}\mathbf{b} | \Rightarrow && \mathbf{x} &= \left(\mathbf{A}^\textsf{T}\mathbf{A}\right)^{-1}\mathbf{A}^\textsf{T}\mathbf{b} | ||
\end{align}</math> | \end{align}</math> | ||
इसलिए, जब से <math>\mathbf{x}</math> के कॉलम स्पेस <math>\mathbf{A}</math> पर है, प्रक्षेपण | इसलिए, जब से <math>\mathbf{x}</math> के कॉलम स्पेस <math>\mathbf{A}</math> पर है, प्रक्षेपण आव्यूह, जो मानचित्रण करता है <math>\mathbf{b}</math> को <math>\mathbf{x}</math> के स्तंभ स्थान पर मान निर्धारित करता है, बस <math>\mathbf{A}</math> है, या <math>\mathbf{A}\left(\mathbf{A}^\textsf{T}\mathbf{A}\right)^{-1}\mathbf{A}^\textsf{T}</math>होता है। | ||
==रेखीय मॉडल == | ==रेखीय मॉडल == | ||
मान लीजिए कि हम रैखिक न्यूनतम वर्गों का उपयोग करके रैखिक मॉडल का अनुमान लगाना चाहते | मान लीजिए कि हम रैखिक न्यूनतम वर्गों का उपयोग करके रैखिक मॉडल का अनुमान लगाना चाहते हैं। मॉडल को निम्नलिखित रूप में लिखा जा सकता है: | ||
:<math>\mathbf{y} = \mathbf{X} \boldsymbol\beta + \boldsymbol\varepsilon,</math> | :<math>\mathbf{y} = \mathbf{X} \boldsymbol\beta + \boldsymbol\varepsilon,</math> | ||
जहाँ <math>\mathbf{X}</math> व्याख्यात्मक चर ([[डिजाइन मैट्रिक्स]]) का | जहाँ <math>\mathbf{X}</math> व्याख्यात्मक चर ([[डिजाइन मैट्रिक्स|डिजाइन आव्यूह]]) का आव्यूह है, ''β'' अज्ञात पैरामीटर का सदिश है जिसे अनुमानित किया जाना है, और ε त्रुटि सदिश है। | ||
इस प्रपत्रणा के अधीन अनेक प्रकार के मॉडल और | इस प्रपत्रणा के अधीन अनेक प्रकार के मॉडल और विधि हो सकते हैं। कुछ उदाहरण [[रैखिक न्यूनतम वर्ग (गणित)]], [[स्प्लिन को चौरसाई करना]], [[प्रतिगमन विभाजन]], स्थानीय रिग्रेशन, [[स्थानीय प्रतिगमन]] और [[रैखिक फ़िल्टर|रैखिक फिल्टर]] हैं। | ||
=== सामान्य न्यूनतम वर्ग === | === सामान्य न्यूनतम वर्ग === | ||
{{further|सामान्य कम चौकोर}} | {{further|सामान्य कम चौकोर}} | ||
जब प्रत्येक अवलोकन के लिए वजन समान होते हैं और त्रुटियां असंबद्ध होती हैं, | जब प्रत्येक अवलोकन के लिए वजन समान होते हैं और त्रुटियां असंबद्ध होती हैं, तब अनुमानित पैरामीटर दिए गए होते हैं: | ||
:<math>\hat{\boldsymbol\beta} = \left( \mathbf{X}^\textsf{T} \mathbf{X} \right)^{-1} \mathbf{X}^\textsf{T} \mathbf{y},</math> | :<math>\hat{\boldsymbol\beta} = \left( \mathbf{X}^\textsf{T} \mathbf{X} \right)^{-1} \mathbf{X}^\textsf{T} \mathbf{y},</math> | ||
Line 53: | Line 52: | ||
:<math>\hat{\mathbf{y}} = \mathbf{X} \hat{\boldsymbol \beta} = \mathbf{X} \left( \mathbf{X}^\textsf{T} \mathbf{X} \right)^{-1} \mathbf{X}^\textsf{T} \mathbf{y}.</math> | :<math>\hat{\mathbf{y}} = \mathbf{X} \hat{\boldsymbol \beta} = \mathbf{X} \left( \mathbf{X}^\textsf{T} \mathbf{X} \right)^{-1} \mathbf{X}^\textsf{T} \mathbf{y}.</math> | ||
इसलिए, प्रक्षेपण | इसलिए, प्रक्षेपण आव्यूह (और हैट आव्यूह) निम्नलिखित द्वारा दी जाती है: | ||
:<math>\mathbf{P} \equiv \mathbf{X} \left(\mathbf{X}^\textsf{T} \mathbf{X} \right)^{-1} \mathbf{X}^\textsf{T}.</math> | :<math>\mathbf{P} \equiv \mathbf{X} \left(\mathbf{X}^\textsf{T} \mathbf{X} \right)^{-1} \mathbf{X}^\textsf{T}.</math> | ||
Line 61: | Line 60: | ||
{{further|भारित न्यूनतम वर्ग|सामान्यीकृत न्यूनतम वर्ग}} | {{further|भारित न्यूनतम वर्ग|सामान्यीकृत न्यूनतम वर्ग}} | ||
उपरोक्त को उन | उपरोक्त को उन स्थितियों के लिए सामान्यीकृत किया जा सकता है जहां वजन समान नहीं हैं और/या त्रुटियां सहसंबद्ध हैं। मान लीजिए कि त्रुटियों का सहप्रसरण आव्यूह Σ है। तब क्योंकि | ||
: <math> | : <math> | ||
Line 67: | Line 66: | ||
</math>. | </math>. | ||
है, इसलिए प्रक्षेपण | है, इसलिए प्रक्षेपण आव्यूह इस प्रकार होती है: | ||
: <math> | : <math> | ||
\mathbf{H} = \mathbf{X}\left( \mathbf{X}^\textsf{T} \mathbf{\Sigma}^{-1} \mathbf{X} \right)^{-1} \mathbf{X}^\textsf{T} \mathbf{\Sigma}^{-1} | \mathbf{H} = \mathbf{X}\left( \mathbf{X}^\textsf{T} \mathbf{\Sigma}^{-1} \mathbf{X} \right)^{-1} \mathbf{X}^\textsf{T} \mathbf{\Sigma}^{-1} | ||
</math> | </math> | ||
और | और फिर यह देखा जा सकता है कि <math>H^2 = H\cdot H = H</math>, चूंकि अब यह सममित नहीं रह गया है। | ||
== गुण == | == गुण == | ||
प्रक्षेपण | प्रक्षेपण आव्यूह में अनेक उपयोगी बीजगणितीय गुणधर्म हैं।<ref>{{cite book |last=Gans |first=P. |year=1992 |title=रासायनिक विज्ञान में डेटा फिटिंग|url=https://archive.org/details/datafittinginche0000gans |url-access=registration |publisher=Wiley |isbn=0-471-93412-7 }}</ref><ref>{{cite book |last=Draper |first=N. R. |last2=Smith |first2=H. |year=1998 |title=अनुप्रयुक्त प्रतिगमन विश्लेषण|publisher=Wiley |isbn=0-471-17082-8 }}</ref> रैखिक बीजगणित की भाषा में, प्रक्षेपण आव्यूह डिज़ाइन आव्यूह <math>\mathbf{X}</math> के [[स्तंभ स्थान]] पर [[ऑर्थोगोनल प्रक्षेपण]] है।<ref name = "Freedman09" />(ध्यान दें कि <math>\left( \mathbf{X}^\textsf{T} \mathbf{X} \right)^{-1} \mathbf{X}^\textsf{T}</math> डीडूर्वारा यह पसुचित जोरदार आव्यूह है।) इस संस्करण में प्रोजेक्शन आव्यूह के कुछ तथ्य संक्षेप में निम्नलिखित हैं:<ref name = "Freedman09" />* <math>\mathbf{u} = (\mathbf{I} - \mathbf{P})\mathbf{y},</math> और <math>\mathbf{u} = \mathbf{y} - \mathbf{P} \mathbf{y} \perp \mathbf{X}.</math> | ||
* <math>\mathbf{P}</math> सममित है, और ऐसा ही है <math>\mathbf{M} \equiv \mathbf{I} - \mathbf{P}</math>। | * <math>\mathbf{P}</math> सममित है, और ऐसा ही है <math>\mathbf{M} \equiv \mathbf{I} - \mathbf{P}</math>। | ||
* <math>\mathbf{P}</math> निष्क्रिय है: <math>\mathbf{P}^2 = \mathbf{P}</math>, और ऐसे ही <math>\mathbf{M}</math>। | * <math>\mathbf{P}</math> निष्क्रिय है: <math>\mathbf{P}^2 = \mathbf{P}</math>, और ऐसे ही <math>\mathbf{M}</math>। | ||
* | * यदि <math>\mathbf{X}</math> {{nowrap|''n'' × ''r''}} आव्यूह है, जिसमें <math>\operatorname{rank}(\mathbf{X}) = r</math>, तब <math>\operatorname{rank}(\mathbf{P}) = r</math> होता है। | ||
*<math>\mathbf{P}</math> के [[eigenvalue|इजनवैल्यूज]] | *<math>\mathbf{P}</math> के [[eigenvalue|इजनवैल्यूज]] एकाधिकता में r और {{nowrap|''n'' − ''r''}} शून्य, होते हैं, जबकि <math>\mathbf{M}</math> के इजनवैल्यूज में {{nowrap|''n'' − ''r''}} शून्य होते हैं।<ref>{{cite book |first=Takeshi |last=Amemiya |title=उन्नत अर्थमिति|location=Cambridge |publisher=Harvard University Press |year=1985 |isbn=0-674-00560-0 |pages=[https://archive.org/details/advancedeconomet00amem/page/460 460]–461 |url=https://archive.org/details/advancedeconomet00amem |url-access=registration }}</ref> | ||
* <math>\mathbf{X}</math> के अंतर्गत <math>\mathbf{P}</math> अपरिवर्तनीय है: <math>\mathbf{P X} = \mathbf{X},</math> इसलिए <math>\left( \mathbf{I} - \mathbf{P} \right) \mathbf{X} = \mathbf{0}</math>। | * <math>\mathbf{X}</math> के अंतर्गत <math>\mathbf{P}</math> अपरिवर्तनीय है: <math>\mathbf{P X} = \mathbf{X},</math> इसलिए <math>\left( \mathbf{I} - \mathbf{P} \right) \mathbf{X} = \mathbf{0}</math>। | ||
* <math>\left( \mathbf{I} - \mathbf{P} \right) \mathbf{P} = \mathbf{P} \left( \mathbf{I} - \mathbf{P} \right) = \mathbf{0}.</math> | * <math>\left( \mathbf{I} - \mathbf{P} \right) \mathbf{P} = \mathbf{P} \left( \mathbf{I} - \mathbf{P} \right) = \mathbf{0}.</math> | ||
* <math>\mathbf{P}</math> कुछ विशेष स्थानों के लिए अद्वितीय होती है। | * <math>\mathbf{P}</math> कुछ विशेष स्थानों के लिए अद्वितीय होती है। | ||
[[रैखिक मॉडल]] के अनुरूप प्रक्षेपण | [[रैखिक मॉडल]] के अनुरूप प्रक्षेपण आव्यूह [[सममित मैट्रिक्स|सममित आव्यूह]] और [[निष्क्रिय मैट्रिक्स|निष्क्रिय आव्यूह]] होती है, अर्थात, <math>\mathbf{P}^2 = \mathbf{P}</math> कहा जाता है। चूंकि, यह स्थितियों सदैव नहीं होता है; उदाहरण के लिए, स्थानीय वज्रछाया प्लॉट स्मूदिंग (LOESS) में, सामान्य रूप से न तब प्रोजेक्शन आव्यूह संवेगीय होती है और न ही आईडेम्पोटेंट होती है। | ||
[[रैखिक मॉडल]] के लिए, प्रक्षेपण | [[रैखिक मॉडल]] के लिए, प्रक्षेपण आव्यूह का [[ट्रेस (रैखिक बीजगणित)]] [[रैंक (रैखिक बीजगणित)]] के सामान्तर है <math>\mathbf{X}</math>, जो रैखिक मॉडल के स्वतंत्र मापदंडों की संख्या है।<ref>{{cite web |title=प्रमाण है कि रैखिक प्रतिगमन में 'हैट' मैट्रिक्स का निशान एक्स की रैंक है|work=Stack Exchange |date=April 13, 2017 |url=https://math.stackexchange.com/q/1582567 }}</ref> LOESS जैसे अन्य मॉडलों के लिए जो अभी भी <math>\mathbf{y}</math> अवलोकनों में रैखिक हैं, प्रक्षेपण आव्यूह का प्रयोग मॉडल की प्रभावशीलता के परिभाषित करने के लिए किया जा सकता है। | ||
प्रतिगमन विश्लेषण में प्रक्षेपण | प्रतिगमन विश्लेषण में प्रक्षेपण आव्यूह के व्यावहारिक अनुप्रयोगों में लीवरेज (सांख्यिकी) और कुक की दूरी सम्मिलित है, जो [[प्रभावशाली अवलोकन]] की पहचान करने से संबंधित हैं, अर्थात अवलोकन जो प्रतिगमन के परिणामों पर बड़ा प्रभाव डालते हैं। | ||
== ब्लॉकवार सूत्र == | == ब्लॉकवार सूत्र == | ||
मान लीजिए डिज़ाइन | मान लीजिए डिज़ाइन आव्यूह <math>X</math> को स्तंभों के रूप में इस प्रकार विभाजित किया जा सकता है: <math>X = \begin{bmatrix} A & B \end{bmatrix}</math> हैट या प्रक्षेपण ऑपरेटर को इस प्रकार निर्धारित किया जा सकता है:<math>P\{X\} = X \left(X^\textsf{T} X \right)^{-1} X^\textsf{T}</math>उसी प्रकार, रेजिड्यूअल ऑपरेटर को इस प्रकार निर्धारित किया जा सकता है: <math>M\{X\} = I - P\{X\}</math>. | ||
तब प्रक्षेपण आव्यूह इस प्रकार विभाजित की जा सकती है:<ref>{{cite book|last1=Rao|first1=C. Radhakrishna|last2=Toutenburg|first2=Helge|author3=Shalabh|first4=Christian|last4=Heumann|title=रैखिक मॉडल और सामान्यीकरण|url=https://archive.org/details/linearmodelsgene00raop|url-access=limited|year=2008|publisher=Springer|location=Berlin|isbn=978-3-540-74226-5|pages=[https://archive.org/details/linearmodelsgene00raop/page/n335 323]|edition=3rd}}</ref> | |||
:<math> P\{X\} = P\{A\} + P\{M\{A\} B\}, </math> | :<math> P\{X\} = P\{A\} + P\{M\{A\} B\}, </math> | ||
जहाँ, जैसे कि, <math>P\{A\} = A \left(A^\textsf{T} A \right)^{-1} A^\textsf{T}</math> और <math>M\{A\} = I - P\{A\}</math>. | जहाँ, जैसे कि, <math>P\{A\} = A \left(A^\textsf{T} A \right)^{-1} A^\textsf{T}</math> और <math>M\{A\} = I - P\{A\}</math>. | ||
इस | इस प्रकार के अपघटन के अनेक अनुप्रयोग हैं। शास्त्रीय अनुप्रयोग में <math>A</math> सभी का स्तंभ होता है, जिससे विश्लेषण करने की अनुमति मिलती है कि प्रशासनिक शब्द को प्रतिस्थापित शब्द में जोड़ने के प्रभावों का विश्लेषण किया जा सकता है। अन्य उपयोग [[निश्चित प्रभाव मॉडल]] में होता है, जहां <math>A</math> निश्चित प्रभाव शर्तबं के लिए डमी चर का बड़ा [[विरल मैट्रिक्स|विरल आव्यूह]] होता है। इस पार्टिशन का उपयोग करके आप संगठित कर सकते हैं बिना <math>X </math> के प्रोजेक्शन आव्यूह को गणना किये, जो संभवतः कंप्यूटर मेमोरी में फिट नहीं हो सकती है। | ||
== यह भी देखें == | == यह भी देखें == |
Revision as of 22:12, 4 August 2023
आधारभूत सांख्यिकी में, प्रक्षेपण आव्यूह ,[1] कभी-कभी प्रभाव आव्यूह[2] या हैट आव्यूह विभिन्न प्रयोजनों में उपयोग की जाती है। यह प्रतिक्रिया चर (आश्रित चर मान) के सदिश को फिट किए गए मान (या अनुमानित मान) के सदिश में मानचित्र करता है। यह प्रत्येक फिट मूल्य पर प्रत्येक प्रतिक्रिया मूल्य के प्रभाव फलन (सांख्यिकी) का वर्णन करता है।[3][4] प्रक्षेपण आव्यूह के विकर्ण तत्व उत्तबलन (सांख्यिकी) हैं, जो उसी अवलोकन के लिए फिट किए गए मूल्य पर प्रत्येक प्रतिक्रिया मूल्य के प्रभाव का वर्णन करते हैं।
परिभाषा
यदि प्रतिक्रिया मूल्यों का सदिश द्वारा निरूपित किया जाता है और पूर्वानुमानित मूल्यों का सदिश है, तब
जैसा कि को सामान्यतः "वाई-हैट" के रूप में उच्चारित किया जाता है, प्रक्षेपण आव्यूह भी "हैट आव्यूह" के नाम से जानी जाती है, क्योंकि यह पर "हैट" लगाती है।
के ith वर्ग और jth स्तंभ में तत्व जो इस समान अवलोकन के लिए पूर्वानुमानित मूल्यों और उत्तर में वह पूर्वानुमानित मूल्यों के बीच सहप्रसरण है, उसे खण्ड व्युत्क्रमण कहा जाता है:[5]
अवशेषों के लिए आवेदन
आँकड़ों में त्रुटियों और अवशेषों के सदिश का सूत्र प्रक्षेपण आव्यूह का उपयोग करके भी संक्षिप्त रूप से व्यक्त किया जा सकता है:
यहाँ आईडेंटिटी आव्यूह है। आव्यूह इसे कभी-कभी अवशिष्ट निर्माता आव्यूह या विनाशक आव्यूह के रूप में जाना जाता है।
अवशेषों का सहप्रसरण आव्यूह के लिए, त्रुटि प्रसार द्वारा, निम्नलिखित होता है:
- ,
यहाँ त्रुटि सदिश के सहप्रसरण आव्यूह है (और विस्तार से प्रतिक्रिया सदिश का भी)। स्वतंत्र और समान रूप से वितरित त्रुटियों वाले रैखिक मॉडल के स्थितियों में , इसे यह घटाया जा सकता है:[3]
.
अंतर्ज्ञान
चित्र से यह स्पष्ट है कि सदिश के लिए के स्तंभ स्थान का सबसे निकटतम बिंदु है, और यह बिंदु है जहां हम के स्तंभ स्थान के लिए लाइन लंबकोण खींच सकते हैं। आव्यूह के स्तंभ स्थान के लिए लंबकोण खींचा गया सदिश उस आव्यूह के प्रतिरोध स्थान में होता है, इसलिए
होता है। इसके पश्चात्, हम इसे पुनर्व्यवस्थित करते हैं, इससे
इसलिए, जब से के कॉलम स्पेस पर है, प्रक्षेपण आव्यूह, जो मानचित्रण करता है को के स्तंभ स्थान पर मान निर्धारित करता है, बस है, या होता है।
रेखीय मॉडल
मान लीजिए कि हम रैखिक न्यूनतम वर्गों का उपयोग करके रैखिक मॉडल का अनुमान लगाना चाहते हैं। मॉडल को निम्नलिखित रूप में लिखा जा सकता है:
जहाँ व्याख्यात्मक चर (डिजाइन आव्यूह) का आव्यूह है, β अज्ञात पैरामीटर का सदिश है जिसे अनुमानित किया जाना है, और ε त्रुटि सदिश है।
इस प्रपत्रणा के अधीन अनेक प्रकार के मॉडल और विधि हो सकते हैं। कुछ उदाहरण रैखिक न्यूनतम वर्ग (गणित), स्प्लिन को चौरसाई करना, प्रतिगमन विभाजन, स्थानीय रिग्रेशन, स्थानीय प्रतिगमन और रैखिक फिल्टर हैं।
सामान्य न्यूनतम वर्ग
जब प्रत्येक अवलोकन के लिए वजन समान होते हैं और त्रुटियां असंबद्ध होती हैं, तब अनुमानित पैरामीटर दिए गए होते हैं:
इसलिए फिटेड मान होते हैं:
इसलिए, प्रक्षेपण आव्यूह (और हैट आव्यूह) निम्नलिखित द्वारा दी जाती है:
भारित और सामान्यीकृत न्यूनतम वर्ग
उपरोक्त को उन स्थितियों के लिए सामान्यीकृत किया जा सकता है जहां वजन समान नहीं हैं और/या त्रुटियां सहसंबद्ध हैं। मान लीजिए कि त्रुटियों का सहप्रसरण आव्यूह Σ है। तब क्योंकि
- .
है, इसलिए प्रक्षेपण आव्यूह इस प्रकार होती है:
और फिर यह देखा जा सकता है कि , चूंकि अब यह सममित नहीं रह गया है।
गुण
प्रक्षेपण आव्यूह में अनेक उपयोगी बीजगणितीय गुणधर्म हैं।[6][7] रैखिक बीजगणित की भाषा में, प्रक्षेपण आव्यूह डिज़ाइन आव्यूह के स्तंभ स्थान पर ऑर्थोगोनल प्रक्षेपण है।[4](ध्यान दें कि डीडूर्वारा यह पसुचित जोरदार आव्यूह है।) इस संस्करण में प्रोजेक्शन आव्यूह के कुछ तथ्य संक्षेप में निम्नलिखित हैं:[4]* और
- सममित है, और ऐसा ही है ।
- निष्क्रिय है: , और ऐसे ही ।
- यदि n × r आव्यूह है, जिसमें , तब होता है।
- के इजनवैल्यूज एकाधिकता में r और n − r शून्य, होते हैं, जबकि के इजनवैल्यूज में n − r शून्य होते हैं।[8]
- के अंतर्गत अपरिवर्तनीय है: इसलिए ।
- कुछ विशेष स्थानों के लिए अद्वितीय होती है।
रैखिक मॉडल के अनुरूप प्रक्षेपण आव्यूह सममित आव्यूह और निष्क्रिय आव्यूह होती है, अर्थात, कहा जाता है। चूंकि, यह स्थितियों सदैव नहीं होता है; उदाहरण के लिए, स्थानीय वज्रछाया प्लॉट स्मूदिंग (LOESS) में, सामान्य रूप से न तब प्रोजेक्शन आव्यूह संवेगीय होती है और न ही आईडेम्पोटेंट होती है।
रैखिक मॉडल के लिए, प्रक्षेपण आव्यूह का ट्रेस (रैखिक बीजगणित) रैंक (रैखिक बीजगणित) के सामान्तर है , जो रैखिक मॉडल के स्वतंत्र मापदंडों की संख्या है।[9] LOESS जैसे अन्य मॉडलों के लिए जो अभी भी अवलोकनों में रैखिक हैं, प्रक्षेपण आव्यूह का प्रयोग मॉडल की प्रभावशीलता के परिभाषित करने के लिए किया जा सकता है।
प्रतिगमन विश्लेषण में प्रक्षेपण आव्यूह के व्यावहारिक अनुप्रयोगों में लीवरेज (सांख्यिकी) और कुक की दूरी सम्मिलित है, जो प्रभावशाली अवलोकन की पहचान करने से संबंधित हैं, अर्थात अवलोकन जो प्रतिगमन के परिणामों पर बड़ा प्रभाव डालते हैं।
ब्लॉकवार सूत्र
मान लीजिए डिज़ाइन आव्यूह को स्तंभों के रूप में इस प्रकार विभाजित किया जा सकता है: हैट या प्रक्षेपण ऑपरेटर को इस प्रकार निर्धारित किया जा सकता है:उसी प्रकार, रेजिड्यूअल ऑपरेटर को इस प्रकार निर्धारित किया जा सकता है: .
तब प्रक्षेपण आव्यूह इस प्रकार विभाजित की जा सकती है:[10]
जहाँ, जैसे कि, और .
इस प्रकार के अपघटन के अनेक अनुप्रयोग हैं। शास्त्रीय अनुप्रयोग में सभी का स्तंभ होता है, जिससे विश्लेषण करने की अनुमति मिलती है कि प्रशासनिक शब्द को प्रतिस्थापित शब्द में जोड़ने के प्रभावों का विश्लेषण किया जा सकता है। अन्य उपयोग निश्चित प्रभाव मॉडल में होता है, जहां निश्चित प्रभाव शर्तबं के लिए डमी चर का बड़ा विरल आव्यूह होता है। इस पार्टिशन का उपयोग करके आप संगठित कर सकते हैं बिना के प्रोजेक्शन आव्यूह को गणना किये, जो संभवतः कंप्यूटर मेमोरी में फिट नहीं हो सकती है।
यह भी देखें
- प्रक्षेपण (रैखिक बीजगणित)
- विद्यार्थीकृत अवशेष
- स्वतंत्रता की डिग्री (सांख्यिकी)#स्वतंत्रता की प्रभावी डिग्री
- माध्य और अनुमानित प्रतिक्रिया
संदर्भ
- ↑ Basilevsky, Alexander (2005). सांख्यिकीय विज्ञान में अनुप्रयुक्त मैट्रिक्स बीजगणित. Dover. pp. 160–176. ISBN 0-486-44538-0.
- ↑ "Data Assimilation: Observation influence diagnostic of a data assimilation system" (PDF). Archived from the original (PDF) on 2014-09-03.
- ↑ 3.0 3.1 Hoaglin, David C.; Welsch, Roy E. (February 1978). "The Hat Matrix in Regression and ANOVA" (PDF). The American Statistician. 32 (1): 17–22. doi:10.2307/2683469. hdl:1721.1/1920. JSTOR 2683469.
- ↑ 4.0 4.1 4.2 David A. Freedman (2009). Statistical Models: Theory and Practice. Cambridge University Press.
- ↑ Wood, Simon N. Generalized additive models: an introduction with R. chapman and hall/CRC, 2006.
- ↑ Gans, P. (1992). रासायनिक विज्ञान में डेटा फिटिंग. Wiley. ISBN 0-471-93412-7.
- ↑ Draper, N. R.; Smith, H. (1998). अनुप्रयुक्त प्रतिगमन विश्लेषण. Wiley. ISBN 0-471-17082-8.
- ↑ Amemiya, Takeshi (1985). उन्नत अर्थमिति. Cambridge: Harvard University Press. pp. 460–461. ISBN 0-674-00560-0.
- ↑ "प्रमाण है कि रैखिक प्रतिगमन में 'हैट' मैट्रिक्स का निशान एक्स की रैंक है". Stack Exchange. April 13, 2017.
- ↑ Rao, C. Radhakrishna; Toutenburg, Helge; Shalabh; Heumann, Christian (2008). रैखिक मॉडल और सामान्यीकरण (3rd ed.). Berlin: Springer. pp. 323. ISBN 978-3-540-74226-5.