प्रक्षेपण आव्यूह: Difference between revisions
No edit summary |
No edit summary |
||
(5 intermediate revisions by 4 users not shown) | |||
Line 1: | Line 1: | ||
{{Short description|Concept in statistics}} | {{Short description|Concept in statistics}} | ||
{{For| | {{For|रैखिक परिवर्तन|प्रक्षेपण (रैखिक बीजगणित)}} | ||
सांख्यिकी में, प्रक्षेपण | |||
| first1= David C. | last1= Hoaglin |first2= Roy E. | last2=Welsch |journal= [[The American Statistician]] | volume=32 |date=February 1978| pages=17–22 | doi = 10.2307/2683469 |issue=1| jstor = 2683469 |url=http://dspace.mit.edu/bitstream/1721.1/1920/1/SWP-0901-02752210.pdf | hdl= 1721.1/1920 | hdl-access= free }}</ref><ref name = "Freedman09">{{cite book |author=David A. Freedman |author-link=David A. Freedman |year=2009|title=Statistical Models: Theory and Practice |publisher=[[Cambridge University Press]]}}</ref> प्रक्षेपण | आधारभूत सांख्यिकी में, '''प्रक्षेपण आव्यूह''' <math>(\mathbf{P})</math>,<ref>{{cite book |first=Alexander |last=Basilevsky |title=सांख्यिकीय विज्ञान में अनुप्रयुक्त मैट्रिक्स बीजगणित|publisher=Dover |year=2005 |isbn=0-486-44538-0 |pages=160–176 |url=https://books.google.com/books?id=ScssAwAAQBAJ&pg=PA160 }}</ref> कभी-कभी प्रभाव आव्यूह<ref>{{cite web |title=Data Assimilation: Observation influence diagnostic of a data assimilation system |url=http://old.ecmwf.int/newsevents/training/lecture_notes/pdf_files/ASSIM/ObservationInfluence.pdf |archive-url=https://web.archive.org/web/20140903115021/http://old.ecmwf.int/newsevents/training/lecture_notes/pdf_files/ASSIM/ObservationInfluence.pdf |url-status=dead |archive-date=2014-09-03 }}</ref> या हैट आव्यूह <math>(\mathbf{H})</math> विभिन्न प्रयोजनों में उपयोग की जाती है। यह प्रतिक्रिया चर (आश्रित चर मान) के सदिश को फिट किए गए मान (या अनुमानित मान) के सदिश में मानचित्र करता है। यह प्रत्येक [[फिट मूल्य]] पर प्रत्येक प्रतिक्रिया मूल्य के प्रभाव फलन (सांख्यिकी) का वर्णन करता है।<ref name="Hoaglin1977" >{{Cite journal | title = The Hat Matrix in Regression and ANOVA | ||
| first1= David C. | last1= Hoaglin |first2= Roy E. | last2=Welsch |journal= [[The American Statistician]] | volume=32 |date=February 1978| pages=17–22 | doi = 10.2307/2683469 |issue=1| jstor = 2683469 |url=http://dspace.mit.edu/bitstream/1721.1/1920/1/SWP-0901-02752210.pdf | hdl= 1721.1/1920 | hdl-access= free }}</ref><ref name = "Freedman09">{{cite book |author=David A. Freedman |author-link=David A. Freedman |year=2009|title=Statistical Models: Theory and Practice |publisher=[[Cambridge University Press]]}}</ref> प्रक्षेपण आव्यूह के विकर्ण तत्व [[उत्तोलन (सांख्यिकी)|उत्तबलन (सांख्यिकी)]] हैं, जो उसी अवलोकन के लिए फिट किए गए मूल्य पर प्रत्येक प्रतिक्रिया मूल्य के प्रभाव का वर्णन करते हैं। | |||
==परिभाषा== | ==परिभाषा== | ||
यदि | यदि प्रतिक्रिया मूल्यों का सदिश द्वारा निरूपित किया जाता है <math>\mathbf{y}</math> और पूर्वानुमानित मूल्यों का सदिश <math>\mathbf{\hat{y}}</math> है, तब | ||
:<math>\mathbf{\hat{y}} = \mathbf{P} \mathbf{y}.</math> | :<math>\mathbf{\hat{y}} = \mathbf{P} \mathbf{y}.</math> | ||
जैसा <math>\mathbf{\hat{y}}</math> | जैसा कि <math>\mathbf{\hat{y}}</math> को सामान्यतः "वाई-हैट" के रूप में उच्चारित किया जाता है, प्रक्षेपण आव्यूह <math>\mathbf{P}</math> भी "हैट आव्यूह" के नाम से जानी जाती है, क्योंकि यह <math>\mathbf{y}</math> पर "हैट" लगाती है। | ||
<math>\mathbf{P}</math> के ith वर्ग और jth स्तंभ में तत्व जो इस समान अवलोकन के लिए पूर्वानुमानित मूल्यों और उत्तर में वह पूर्वानुमानित मूल्यों के बीच [[सहप्रसरण]] है, उसे खण्ड व्युत्क्रमण कहा जाता है:<ref>Wood, Simon N. Generalized additive models: an introduction with R. chapman and hall/CRC, 2006.</ref> | |||
:<math>p_{ij} = \frac{\operatorname{Cov}\left[ \hat{y}_i, y_j \right]}{\operatorname{Var}\left[y_j \right]}</math> | :<math>p_{ij} = \frac{\operatorname{Cov}\left[ \hat{y}_i, y_j \right]}{\operatorname{Var}\left[y_j \right]}</math> | ||
==अवशेषों के लिए आवेदन== | ==अवशेषों के लिए आवेदन== | ||
आँकड़ों में त्रुटियों और अवशेषों के | आँकड़ों में त्रुटियों और अवशेषों के सदिश का सूत्र <math>\mathbf{r}</math> प्रक्षेपण आव्यूह का उपयोग करके भी संक्षिप्त रूप से व्यक्त किया जा सकता है: | ||
:<math>\mathbf{r} = \mathbf{y} - \mathbf{\hat{y}} = \mathbf{y} - \mathbf{P} \mathbf{y} = \left( \mathbf{I} - \mathbf{P} \right) \mathbf{y}.</math> | :<math>\mathbf{r} = \mathbf{y} - \mathbf{\hat{y}} = \mathbf{y} - \mathbf{P} \mathbf{y} = \left( \mathbf{I} - \mathbf{P} \right) \mathbf{y}.</math> | ||
यहाँ <math>\mathbf{I}</math> आईडेंटिटी आव्यूह है। आव्यूह <math>\mathbf{M} \equiv \mathbf{I} - \mathbf{P}</math> इसे कभी-कभी अवशिष्ट निर्माता आव्यूह या विनाशक आव्यूह के रूप में जाना जाता है। | |||
अवशेषों का सहप्रसरण | अवशेषों का सहप्रसरण आव्यूह <math>\mathbf{r}</math> के लिए, [[त्रुटि प्रसार]] द्वारा, निम्नलिखित होता है: | ||
:<math>\mathbf{\Sigma}_\mathbf{r} = \left( \mathbf{I} - \mathbf{P} \right)^\textsf{T} \mathbf{\Sigma} \left( \mathbf{I}-\mathbf{P} \right)</math>, | :<math>\mathbf{\Sigma}_\mathbf{r} = \left( \mathbf{I} - \mathbf{P} \right)^\textsf{T} \mathbf{\Sigma} \left( \mathbf{I}-\mathbf{P} \right)</math>, | ||
यहाँ <math>\mathbf{\Sigma}</matH> त्रुटि सदिश के [[covariance matrix|सहप्रसरण आव्यूह]] है (और विस्तार से प्रतिक्रिया सदिश का भी)। [[independent and identically distributed|स्वतंत्र और समान रूप से वितरित]] त्रुटियों वाले रैखिक मॉडल के स्थितियों में <math>\mathbf{\Sigma} = \sigma^{2} \mathbf{I}</math>, इसे यह घटाया जा सकता है:<ref name="Hoaglin1977"/> | |||
<math>\mathbf{\Sigma}_\mathbf{r} = \left( \mathbf{I} - \mathbf{P} \right) \sigma^{2}</math>. | |||
==अंतर्ज्ञान== | ==अंतर्ज्ञान== | ||
[[File:Projection of a vector onto the column space of a matrix.svg|thumb| | [[File:Projection of a vector onto the column space of a matrix.svg|thumb|आव्यूह, <math>\mathbf{A}</math> इसके स्तंभ स्थान को हरी रेखा के रूप में दर्शाया गया है। कुछ सदिश का प्रक्षेपण <math>\mathbf{b}</math> के कॉलम स्थान पर <math>\mathbf{A}</math> सदिश है <math>\mathbf{x}</math>]]चित्र से यह स्पष्ट है कि सदिश <math>\mathbf{b}</math> के लिए <math>\mathbf{A}</math> के स्तंभ स्थान का सबसे निकटतम बिंदु <math>\mathbf{Ax}</math> है, और यह बिंदु है जहां हम <math>\mathbf{A}</math> के स्तंभ स्थान के लिए लाइन लंबकोण खींच सकते हैं। आव्यूह के स्तंभ स्थान के लिए लंबकोण खींचा गया सदिश उस आव्यूह के प्रतिरोध स्थान में होता है, इसलिए | ||
:<math>\mathbf{A}^\textsf{T}(\mathbf{b}-\mathbf{Ax}) = 0</math> | :<math>\mathbf{A}^\textsf{T}(\mathbf{b}-\mathbf{Ax}) = 0</math> | ||
होता है। इसके पश्चात्, हम इसे पुनर्व्यवस्थित करते हैं, इससे | |||
:<math>\begin{align} | :<math>\begin{align} | ||
&& \mathbf{A}^\textsf{T}\mathbf{b} &- \mathbf{A}^\textsf{T}\mathbf{Ax} = 0 \\ | && \mathbf{A}^\textsf{T}\mathbf{b} &- \mathbf{A}^\textsf{T}\mathbf{Ax} = 0 \\ | ||
Line 31: | Line 34: | ||
\Rightarrow && \mathbf{x} &= \left(\mathbf{A}^\textsf{T}\mathbf{A}\right)^{-1}\mathbf{A}^\textsf{T}\mathbf{b} | \Rightarrow && \mathbf{x} &= \left(\mathbf{A}^\textsf{T}\mathbf{A}\right)^{-1}\mathbf{A}^\textsf{T}\mathbf{b} | ||
\end{align}</math> | \end{align}</math> | ||
इसलिए, जब से <math>\mathbf{x}</math> के कॉलम स्पेस | इसलिए, जब से <math>\mathbf{x}</math> के कॉलम स्पेस <math>\mathbf{A}</math> पर है, प्रक्षेपण आव्यूह, जो मानचित्रण करता है <math>\mathbf{b}</math> को <math>\mathbf{x}</math> के स्तंभ स्थान पर मान निर्धारित करता है, बस <math>\mathbf{A}</math> है, या <math>\mathbf{A}\left(\mathbf{A}^\textsf{T}\mathbf{A}\right)^{-1}\mathbf{A}^\textsf{T}</math>होता है। | ||
==रेखीय मॉडल == | ==रेखीय मॉडल == | ||
मान लीजिए कि हम रैखिक न्यूनतम वर्गों का उपयोग करके रैखिक मॉडल का अनुमान लगाना चाहते हैं। मॉडल को | मान लीजिए कि हम रैखिक न्यूनतम वर्गों का उपयोग करके रैखिक मॉडल का अनुमान लगाना चाहते हैं। मॉडल को निम्नलिखित रूप में लिखा जा सकता है: | ||
:<math>\mathbf{y} = \mathbf{X} \boldsymbol\beta + \boldsymbol\varepsilon,</math> | :<math>\mathbf{y} = \mathbf{X} \boldsymbol\beta + \boldsymbol\varepsilon,</math> | ||
जहाँ <math>\mathbf{X}</math> व्याख्यात्मक चर ([[डिजाइन मैट्रिक्स|डिजाइन आव्यूह]]) का आव्यूह है, ''β'' अज्ञात पैरामीटर का सदिश है जिसे अनुमानित किया जाना है, और ε त्रुटि सदिश है। | |||
इस प्रपत्रणा के अधीन अनेक प्रकार के मॉडल और विधि हो सकते हैं। कुछ उदाहरण [[रैखिक न्यूनतम वर्ग (गणित)]], [[स्प्लिन को चौरसाई करना]], [[प्रतिगमन विभाजन]], स्थानीय रिग्रेशन, [[स्थानीय प्रतिगमन]] और [[रैखिक फ़िल्टर|रैखिक फिल्टर]] हैं। | |||
=== सामान्य न्यूनतम वर्ग === | === सामान्य न्यूनतम वर्ग === | ||
{{further| | {{further|सामान्य कम चौकोर}} | ||
जब प्रत्येक अवलोकन के लिए वजन समान होते हैं और | |||
जब प्रत्येक अवलोकन के लिए वजन समान होते हैं और त्रुटियां असंबद्ध होती हैं, तब अनुमानित पैरामीटर दिए गए होते हैं: | |||
:<math>\hat{\boldsymbol\beta} = \left( \mathbf{X}^\textsf{T} \mathbf{X} \right)^{-1} \mathbf{X}^\textsf{T} \mathbf{y},</math> | :<math>\hat{\boldsymbol\beta} = \left( \mathbf{X}^\textsf{T} \mathbf{X} \right)^{-1} \mathbf{X}^\textsf{T} \mathbf{y},</math> | ||
इसलिए फिटेड मान होते हैं: | |||
:<math>\hat{\mathbf{y}} = \mathbf{X} \hat{\boldsymbol \beta} = \mathbf{X} \left( \mathbf{X}^\textsf{T} \mathbf{X} \right)^{-1} \mathbf{X}^\textsf{T} \mathbf{y}.</math> | :<math>\hat{\mathbf{y}} = \mathbf{X} \hat{\boldsymbol \beta} = \mathbf{X} \left( \mathbf{X}^\textsf{T} \mathbf{X} \right)^{-1} \mathbf{X}^\textsf{T} \mathbf{y}.</math> | ||
इसलिए, | इसलिए, प्रक्षेपण आव्यूह (और हैट आव्यूह) निम्नलिखित द्वारा दी जाती है: | ||
:<math>\mathbf{P} \equiv \mathbf{X} \left(\mathbf{X}^\textsf{T} \mathbf{X} \right)^{-1} \mathbf{X}^\textsf{T}.</math> | :<math>\mathbf{P} \equiv \mathbf{X} \left(\mathbf{X}^\textsf{T} \mathbf{X} \right)^{-1} \mathbf{X}^\textsf{T}.</math> | ||
Line 55: | Line 58: | ||
=== भारित और सामान्यीकृत न्यूनतम वर्ग === | === भारित और सामान्यीकृत न्यूनतम वर्ग === | ||
{{further| | {{further|भारित न्यूनतम वर्ग|सामान्यीकृत न्यूनतम वर्ग}} | ||
उपरोक्त को उन | |||
उपरोक्त को उन स्थितियों के लिए सामान्यीकृत किया जा सकता है जहां वजन समान नहीं हैं और/या त्रुटियां सहसंबद्ध हैं। मान लीजिए कि त्रुटियों का सहप्रसरण आव्यूह Σ है। तब क्योंकि | |||
: <math> | : <math> | ||
Line 62: | Line 66: | ||
</math>. | </math>. | ||
है, इसलिए प्रक्षेपण आव्यूह इस प्रकार होती है: | |||
: <math> | : <math> | ||
\mathbf{H} = \mathbf{X}\left( \mathbf{X}^\textsf{T} \mathbf{\Sigma}^{-1} \mathbf{X} \right)^{-1} \mathbf{X}^\textsf{T} \mathbf{\Sigma}^{-1} | \mathbf{H} = \mathbf{X}\left( \mathbf{X}^\textsf{T} \mathbf{\Sigma}^{-1} \mathbf{X} \right)^{-1} \mathbf{X}^\textsf{T} \mathbf{\Sigma}^{-1} | ||
</math> | </math> | ||
और फिर | और फिर यह देखा जा सकता है कि <math>H^2 = H\cdot H = H</math>, चूंकि अब यह सममित नहीं रह गया है। | ||
== गुण == | == गुण == | ||
प्रक्षेपण | प्रक्षेपण आव्यूह में अनेक उपयोगी बीजगणितीय गुणधर्म हैं।<ref>{{cite book |last=Gans |first=P. |year=1992 |title=रासायनिक विज्ञान में डेटा फिटिंग|url=https://archive.org/details/datafittinginche0000gans |url-access=registration |publisher=Wiley |isbn=0-471-93412-7 }}</ref><ref>{{cite book |last=Draper |first=N. R. |last2=Smith |first2=H. |year=1998 |title=अनुप्रयुक्त प्रतिगमन विश्लेषण|publisher=Wiley |isbn=0-471-17082-8 }}</ref> रैखिक बीजगणित की भाषा में, प्रक्षेपण आव्यूह डिज़ाइन आव्यूह <math>\mathbf{X}</math> के [[स्तंभ स्थान]] पर [[ऑर्थोगोनल प्रक्षेपण]] है।<ref name = "Freedman09" />(ध्यान दें कि <math>\left( \mathbf{X}^\textsf{T} \mathbf{X} \right)^{-1} \mathbf{X}^\textsf{T}</math> डीडूर्वारा यह पसुचित जोरदार आव्यूह है।) इस संस्करण में प्रोजेक्शन आव्यूह के कुछ तथ्य संक्षेप में निम्नलिखित हैं:<ref name = "Freedman09" />* <math>\mathbf{u} = (\mathbf{I} - \mathbf{P})\mathbf{y},</math> और <math>\mathbf{u} = \mathbf{y} - \mathbf{P} \mathbf{y} \perp \mathbf{X}.</math> | ||
* <math>\mathbf{P}</math> सममित है, और ऐसा ही है <math>\mathbf{M} \equiv \mathbf{I} - \mathbf{P}</math> | * <math>\mathbf{P}</math> सममित है, और ऐसा ही है <math>\mathbf{M} \equiv \mathbf{I} - \mathbf{P}</math>। | ||
* <math>\mathbf{P}</math> निष्क्रिय है: <math>\mathbf{P}^2 = \mathbf{P}</math>, और ऐसे ही <math>\mathbf{M}</math> | * <math>\mathbf{P}</math> निष्क्रिय है: <math>\mathbf{P}^2 = \mathbf{P}</math>, और ऐसे ही <math>\mathbf{M}</math>। | ||
* | * यदि <math>\mathbf{X}</math> {{nowrap|''n'' × ''r''}} आव्यूह है, जिसमें <math>\operatorname{rank}(\mathbf{X}) = r</math>, तब <math>\operatorname{rank}(\mathbf{P}) = r</math> होता है। | ||
* | *<math>\mathbf{P}</math> के [[eigenvalue|इजनवैल्यूज]] एकाधिकता में r और {{nowrap|''n'' − ''r''}} शून्य, होते हैं, जबकि <math>\mathbf{M}</math> के इजनवैल्यूज में {{nowrap|''n'' − ''r''}} शून्य होते हैं।<ref>{{cite book |first=Takeshi |last=Amemiya |title=उन्नत अर्थमिति|location=Cambridge |publisher=Harvard University Press |year=1985 |isbn=0-674-00560-0 |pages=[https://archive.org/details/advancedeconomet00amem/page/460 460]–461 |url=https://archive.org/details/advancedeconomet00amem |url-access=registration }}</ref> | ||
* <math>\mathbf{X}</math> के अंतर्गत | * <math>\mathbf{X}</math> के अंतर्गत <math>\mathbf{P}</math> अपरिवर्तनीय है: <math>\mathbf{P X} = \mathbf{X},</math> इसलिए <math>\left( \mathbf{I} - \mathbf{P} \right) \mathbf{X} = \mathbf{0}</math>। | ||
* <math>\left( \mathbf{I} - \mathbf{P} \right) \mathbf{P} = \mathbf{P} \left( \mathbf{I} - \mathbf{P} \right) = \mathbf{0}.</math> | * <math>\left( \mathbf{I} - \mathbf{P} \right) \mathbf{P} = \mathbf{P} \left( \mathbf{I} - \mathbf{P} \right) = \mathbf{0}.</math> | ||
* <math>\mathbf{P}</math> कुछ | * <math>\mathbf{P}</math> कुछ विशेष स्थानों के लिए अद्वितीय होती है। | ||
[[रैखिक मॉडल]] के अनुरूप प्रक्षेपण | [[रैखिक मॉडल]] के अनुरूप प्रक्षेपण आव्यूह [[सममित मैट्रिक्स|सममित आव्यूह]] और [[निष्क्रिय मैट्रिक्स|निष्क्रिय आव्यूह]] होती है, अर्थात, <math>\mathbf{P}^2 = \mathbf{P}</math> कहा जाता है। चूंकि, यह स्थितियों सदैव नहीं होता है; उदाहरण के लिए, स्थानीय वज्रछाया प्लॉट स्मूदिंग (LOESS) में, सामान्य रूप से न तब प्रोजेक्शन आव्यूह संवेगीय होती है और न ही आईडेम्पोटेंट होती है। | ||
[[रैखिक मॉडल]] के लिए, प्रक्षेपण | [[रैखिक मॉडल]] के लिए, प्रक्षेपण आव्यूह का [[ट्रेस (रैखिक बीजगणित)]] [[रैंक (रैखिक बीजगणित)]] के सामान्तर है <math>\mathbf{X}</math>, जो रैखिक मॉडल के स्वतंत्र मापदंडों की संख्या है।<ref>{{cite web |title=प्रमाण है कि रैखिक प्रतिगमन में 'हैट' मैट्रिक्स का निशान एक्स की रैंक है|work=Stack Exchange |date=April 13, 2017 |url=https://math.stackexchange.com/q/1582567 }}</ref> LOESS जैसे अन्य मॉडलों के लिए जो अभी भी <math>\mathbf{y}</math> अवलोकनों में रैखिक हैं, प्रक्षेपण आव्यूह का प्रयोग मॉडल की प्रभावशीलता के परिभाषित करने के लिए किया जा सकता है। | ||
प्रतिगमन विश्लेषण में प्रक्षेपण | प्रतिगमन विश्लेषण में प्रक्षेपण आव्यूह के व्यावहारिक अनुप्रयोगों में लीवरेज (सांख्यिकी) और कुक की दूरी सम्मिलित है, जो [[प्रभावशाली अवलोकन]] की पहचान करने से संबंधित हैं, अर्थात अवलोकन जो प्रतिगमन के परिणामों पर बड़ा प्रभाव डालते हैं। | ||
== ब्लॉकवार सूत्र == | == ब्लॉकवार सूत्र == | ||
मान लीजिए डिज़ाइन | मान लीजिए डिज़ाइन आव्यूह <math>X</math> को स्तंभों के रूप में इस प्रकार विभाजित किया जा सकता है: <math>X = \begin{bmatrix} A & B \end{bmatrix}</math> हैट या प्रक्षेपण ऑपरेटर को इस प्रकार निर्धारित किया जा सकता है:<math>P\{X\} = X \left(X^\textsf{T} X \right)^{-1} X^\textsf{T}</math>उसी प्रकार, रेजिड्यूअल ऑपरेटर को इस प्रकार निर्धारित किया जा सकता है: <math>M\{X\} = I - P\{X\}</math>. | ||
तब प्रक्षेपण आव्यूह इस प्रकार विभाजित की जा सकती है:<ref>{{cite book|last1=Rao|first1=C. Radhakrishna|last2=Toutenburg|first2=Helge|author3=Shalabh|first4=Christian|last4=Heumann|title=रैखिक मॉडल और सामान्यीकरण|url=https://archive.org/details/linearmodelsgene00raop|url-access=limited|year=2008|publisher=Springer|location=Berlin|isbn=978-3-540-74226-5|pages=[https://archive.org/details/linearmodelsgene00raop/page/n335 323]|edition=3rd}}</ref> | |||
:<math> P\{X\} = P\{A\} + P\{M\{A\} B\}, </math> | :<math> P\{X\} = P\{A\} + P\{M\{A\} B\}, </math> | ||
जहाँ, जैसे कि, <math>P\{A\} = A \left(A^\textsf{T} A \right)^{-1} A^\textsf{T}</math> और <math>M\{A\} = I - P\{A\}</math>. | |||
इस | इस प्रकार के अपघटन के अनेक अनुप्रयोग हैं। शास्त्रीय अनुप्रयोग में <math>A</math> सभी का स्तंभ होता है, जिससे विश्लेषण करने की अनुमति मिलती है कि प्रशासनिक शब्द को प्रतिस्थापित शब्द में जोड़ने के प्रभावों का विश्लेषण किया जा सकता है। अन्य उपयोग [[निश्चित प्रभाव मॉडल]] में होता है, जहां <math>A</math> निश्चित प्रभाव शर्तबं के लिए डमी चर का बड़ा [[विरल मैट्रिक्स|विरल आव्यूह]] होता है। इस पार्टिशन का उपयोग करके आप संगठित कर सकते हैं बिना <math>X </math> के प्रोजेक्शन आव्यूह को गणना किये, जो संभवतः कंप्यूटर मेमोरी में फिट नहीं हो सकती है। | ||
== यह भी देखें == | == यह भी देखें == | ||
Line 103: | Line 106: | ||
== संदर्भ == | == संदर्भ == | ||
{{Reflist}} | {{Reflist}} | ||
[[Category: | [[Category:Articles with hatnote templates targeting a nonexistent page]] | ||
[[Category:Created On 26/07/2023]] | [[Category:Created On 26/07/2023]] | ||
[[Category:Lua-based templates]] | |||
[[Category:Machine Translated Page]] | |||
[[Category:Pages with script errors]] | |||
[[Category:Short description with empty Wikidata description]] | |||
[[Category:Templates Vigyan Ready]] | |||
[[Category:Templates that add a tracking category]] | |||
[[Category:Templates that generate short descriptions]] | |||
[[Category:Templates using TemplateData]] | |||
[[Category:प्रतिगमन विश्लेषण]] | |||
[[Category:मैट्रिसेस]] |
Latest revision as of 11:37, 14 August 2023
आधारभूत सांख्यिकी में, प्रक्षेपण आव्यूह ,[1] कभी-कभी प्रभाव आव्यूह[2] या हैट आव्यूह विभिन्न प्रयोजनों में उपयोग की जाती है। यह प्रतिक्रिया चर (आश्रित चर मान) के सदिश को फिट किए गए मान (या अनुमानित मान) के सदिश में मानचित्र करता है। यह प्रत्येक फिट मूल्य पर प्रत्येक प्रतिक्रिया मूल्य के प्रभाव फलन (सांख्यिकी) का वर्णन करता है।[3][4] प्रक्षेपण आव्यूह के विकर्ण तत्व उत्तबलन (सांख्यिकी) हैं, जो उसी अवलोकन के लिए फिट किए गए मूल्य पर प्रत्येक प्रतिक्रिया मूल्य के प्रभाव का वर्णन करते हैं।
परिभाषा
यदि प्रतिक्रिया मूल्यों का सदिश द्वारा निरूपित किया जाता है और पूर्वानुमानित मूल्यों का सदिश है, तब
जैसा कि को सामान्यतः "वाई-हैट" के रूप में उच्चारित किया जाता है, प्रक्षेपण आव्यूह भी "हैट आव्यूह" के नाम से जानी जाती है, क्योंकि यह पर "हैट" लगाती है।
के ith वर्ग और jth स्तंभ में तत्व जो इस समान अवलोकन के लिए पूर्वानुमानित मूल्यों और उत्तर में वह पूर्वानुमानित मूल्यों के बीच सहप्रसरण है, उसे खण्ड व्युत्क्रमण कहा जाता है:[5]
अवशेषों के लिए आवेदन
आँकड़ों में त्रुटियों और अवशेषों के सदिश का सूत्र प्रक्षेपण आव्यूह का उपयोग करके भी संक्षिप्त रूप से व्यक्त किया जा सकता है:
यहाँ आईडेंटिटी आव्यूह है। आव्यूह इसे कभी-कभी अवशिष्ट निर्माता आव्यूह या विनाशक आव्यूह के रूप में जाना जाता है।
अवशेषों का सहप्रसरण आव्यूह के लिए, त्रुटि प्रसार द्वारा, निम्नलिखित होता है:
- ,
यहाँ त्रुटि सदिश के सहप्रसरण आव्यूह है (और विस्तार से प्रतिक्रिया सदिश का भी)। स्वतंत्र और समान रूप से वितरित त्रुटियों वाले रैखिक मॉडल के स्थितियों में , इसे यह घटाया जा सकता है:[3]
.
अंतर्ज्ञान
चित्र से यह स्पष्ट है कि सदिश के लिए के स्तंभ स्थान का सबसे निकटतम बिंदु है, और यह बिंदु है जहां हम के स्तंभ स्थान के लिए लाइन लंबकोण खींच सकते हैं। आव्यूह के स्तंभ स्थान के लिए लंबकोण खींचा गया सदिश उस आव्यूह के प्रतिरोध स्थान में होता है, इसलिए
होता है। इसके पश्चात्, हम इसे पुनर्व्यवस्थित करते हैं, इससे
इसलिए, जब से के कॉलम स्पेस पर है, प्रक्षेपण आव्यूह, जो मानचित्रण करता है को के स्तंभ स्थान पर मान निर्धारित करता है, बस है, या होता है।
रेखीय मॉडल
मान लीजिए कि हम रैखिक न्यूनतम वर्गों का उपयोग करके रैखिक मॉडल का अनुमान लगाना चाहते हैं। मॉडल को निम्नलिखित रूप में लिखा जा सकता है:
जहाँ व्याख्यात्मक चर (डिजाइन आव्यूह) का आव्यूह है, β अज्ञात पैरामीटर का सदिश है जिसे अनुमानित किया जाना है, और ε त्रुटि सदिश है।
इस प्रपत्रणा के अधीन अनेक प्रकार के मॉडल और विधि हो सकते हैं। कुछ उदाहरण रैखिक न्यूनतम वर्ग (गणित), स्प्लिन को चौरसाई करना, प्रतिगमन विभाजन, स्थानीय रिग्रेशन, स्थानीय प्रतिगमन और रैखिक फिल्टर हैं।
सामान्य न्यूनतम वर्ग
जब प्रत्येक अवलोकन के लिए वजन समान होते हैं और त्रुटियां असंबद्ध होती हैं, तब अनुमानित पैरामीटर दिए गए होते हैं:
इसलिए फिटेड मान होते हैं:
इसलिए, प्रक्षेपण आव्यूह (और हैट आव्यूह) निम्नलिखित द्वारा दी जाती है:
भारित और सामान्यीकृत न्यूनतम वर्ग
उपरोक्त को उन स्थितियों के लिए सामान्यीकृत किया जा सकता है जहां वजन समान नहीं हैं और/या त्रुटियां सहसंबद्ध हैं। मान लीजिए कि त्रुटियों का सहप्रसरण आव्यूह Σ है। तब क्योंकि
- .
है, इसलिए प्रक्षेपण आव्यूह इस प्रकार होती है:
और फिर यह देखा जा सकता है कि , चूंकि अब यह सममित नहीं रह गया है।
गुण
प्रक्षेपण आव्यूह में अनेक उपयोगी बीजगणितीय गुणधर्म हैं।[6][7] रैखिक बीजगणित की भाषा में, प्रक्षेपण आव्यूह डिज़ाइन आव्यूह के स्तंभ स्थान पर ऑर्थोगोनल प्रक्षेपण है।[4](ध्यान दें कि डीडूर्वारा यह पसुचित जोरदार आव्यूह है।) इस संस्करण में प्रोजेक्शन आव्यूह के कुछ तथ्य संक्षेप में निम्नलिखित हैं:[4]* और
- सममित है, और ऐसा ही है ।
- निष्क्रिय है: , और ऐसे ही ।
- यदि n × r आव्यूह है, जिसमें , तब होता है।
- के इजनवैल्यूज एकाधिकता में r और n − r शून्य, होते हैं, जबकि के इजनवैल्यूज में n − r शून्य होते हैं।[8]
- के अंतर्गत अपरिवर्तनीय है: इसलिए ।
- कुछ विशेष स्थानों के लिए अद्वितीय होती है।
रैखिक मॉडल के अनुरूप प्रक्षेपण आव्यूह सममित आव्यूह और निष्क्रिय आव्यूह होती है, अर्थात, कहा जाता है। चूंकि, यह स्थितियों सदैव नहीं होता है; उदाहरण के लिए, स्थानीय वज्रछाया प्लॉट स्मूदिंग (LOESS) में, सामान्य रूप से न तब प्रोजेक्शन आव्यूह संवेगीय होती है और न ही आईडेम्पोटेंट होती है।
रैखिक मॉडल के लिए, प्रक्षेपण आव्यूह का ट्रेस (रैखिक बीजगणित) रैंक (रैखिक बीजगणित) के सामान्तर है , जो रैखिक मॉडल के स्वतंत्र मापदंडों की संख्या है।[9] LOESS जैसे अन्य मॉडलों के लिए जो अभी भी अवलोकनों में रैखिक हैं, प्रक्षेपण आव्यूह का प्रयोग मॉडल की प्रभावशीलता के परिभाषित करने के लिए किया जा सकता है।
प्रतिगमन विश्लेषण में प्रक्षेपण आव्यूह के व्यावहारिक अनुप्रयोगों में लीवरेज (सांख्यिकी) और कुक की दूरी सम्मिलित है, जो प्रभावशाली अवलोकन की पहचान करने से संबंधित हैं, अर्थात अवलोकन जो प्रतिगमन के परिणामों पर बड़ा प्रभाव डालते हैं।
ब्लॉकवार सूत्र
मान लीजिए डिज़ाइन आव्यूह को स्तंभों के रूप में इस प्रकार विभाजित किया जा सकता है: हैट या प्रक्षेपण ऑपरेटर को इस प्रकार निर्धारित किया जा सकता है:उसी प्रकार, रेजिड्यूअल ऑपरेटर को इस प्रकार निर्धारित किया जा सकता है: .
तब प्रक्षेपण आव्यूह इस प्रकार विभाजित की जा सकती है:[10]
जहाँ, जैसे कि, और .
इस प्रकार के अपघटन के अनेक अनुप्रयोग हैं। शास्त्रीय अनुप्रयोग में सभी का स्तंभ होता है, जिससे विश्लेषण करने की अनुमति मिलती है कि प्रशासनिक शब्द को प्रतिस्थापित शब्द में जोड़ने के प्रभावों का विश्लेषण किया जा सकता है। अन्य उपयोग निश्चित प्रभाव मॉडल में होता है, जहां निश्चित प्रभाव शर्तबं के लिए डमी चर का बड़ा विरल आव्यूह होता है। इस पार्टिशन का उपयोग करके आप संगठित कर सकते हैं बिना के प्रोजेक्शन आव्यूह को गणना किये, जो संभवतः कंप्यूटर मेमोरी में फिट नहीं हो सकती है।
यह भी देखें
- प्रक्षेपण (रैखिक बीजगणित)
- विद्यार्थीकृत अवशेष
- स्वतंत्रता की डिग्री (सांख्यिकी)#स्वतंत्रता की प्रभावी डिग्री
- माध्य और अनुमानित प्रतिक्रिया
संदर्भ
- ↑ Basilevsky, Alexander (2005). सांख्यिकीय विज्ञान में अनुप्रयुक्त मैट्रिक्स बीजगणित. Dover. pp. 160–176. ISBN 0-486-44538-0.
- ↑ "Data Assimilation: Observation influence diagnostic of a data assimilation system" (PDF). Archived from the original (PDF) on 2014-09-03.
- ↑ 3.0 3.1 Hoaglin, David C.; Welsch, Roy E. (February 1978). "The Hat Matrix in Regression and ANOVA" (PDF). The American Statistician. 32 (1): 17–22. doi:10.2307/2683469. hdl:1721.1/1920. JSTOR 2683469.
- ↑ 4.0 4.1 4.2 David A. Freedman (2009). Statistical Models: Theory and Practice. Cambridge University Press.
- ↑ Wood, Simon N. Generalized additive models: an introduction with R. chapman and hall/CRC, 2006.
- ↑ Gans, P. (1992). रासायनिक विज्ञान में डेटा फिटिंग. Wiley. ISBN 0-471-93412-7.
- ↑ Draper, N. R.; Smith, H. (1998). अनुप्रयुक्त प्रतिगमन विश्लेषण. Wiley. ISBN 0-471-17082-8.
- ↑ Amemiya, Takeshi (1985). उन्नत अर्थमिति. Cambridge: Harvard University Press. pp. 460–461. ISBN 0-674-00560-0.
- ↑ "प्रमाण है कि रैखिक प्रतिगमन में 'हैट' मैट्रिक्स का निशान एक्स की रैंक है". Stack Exchange. April 13, 2017.
- ↑ Rao, C. Radhakrishna; Toutenburg, Helge; Shalabh; Heumann, Christian (2008). रैखिक मॉडल और सामान्यीकरण (3rd ed.). Berlin: Springer. pp. 323. ISBN 978-3-540-74226-5.