वर्गों के योग का अभाव: Difference between revisions

From Vigyanwiki
(Created page with "आंकड़ों में, फिट की कमी के कारण वर्गों का योग, या अधिक संक्षेप में वर...")
 
No edit summary
Line 1: Line 1:
आंकड़ों में, फिट की कमी के कारण वर्गों का योग, या अधिक संक्षेप में वर्गों का फिट न होने वाला योग, विचरण के विश्लेषण में अवशेषों के वर्गों (सांख्यिकी) के योग के विभाजन के घटकों में से एक है, [[शून्य परिकल्पना]] के एफ-परीक्षण में अंश में उपयोग किया जाता है जो कहता है कि एक प्रस्तावित मॉडल अच्छी तरह से फिट बैठता है। अन्य घटक वर्गों का शुद्ध-त्रुटि योग है।
आंकड़ों में, फिट की कमी के कारण वर्गों का योग, या अधिक संक्षेप में वर्गों का फिट न होने वाला योग, विचरण के विश्लेषण में अवशेषों के वर्गों (सांख्यिकी) के योग के विभाजन के घटकों में से एक है, [[शून्य परिकल्पना]] के F-परीक्षण में अंश में उपयोग किया जाता है जो कहता है कि एक प्रस्तावित मॉडल अच्छी तरह से फिट बैठता है। अन्य घटक वर्गों का शुद्ध-त्रुटि योग है।


वर्गों का शुद्ध-त्रुटि योग उसके [[स्वतंत्र चर]] मान(मानों) को साझा करने वाले सभी अवलोकनों के औसत मूल्य से आश्रित चर के प्रत्येक मान के वर्ग विचलन का योग है। ये ऐसी त्रुटियां हैं जिन्हें किसी भी पूर्वानुमानित समीकरण से कभी नहीं टाला जा सकता है जो स्वतंत्र चर के मूल्य के एक फ़ंक्शन के रूप में आश्रित चर के लिए अनुमानित मान निर्दिष्ट करता है। वर्गों के शेष योग को मॉडल की फिट की कमी के लिए जिम्मेदार ठहराया जाता है क्योंकि इन त्रुटियों को पूरी तरह से खत्म करना गणितीय रूप से संभव होगा।
वर्गों का शुद्ध-त्रुटि योग उसके [[स्वतंत्र चर]] मान(मानों) को साझा करने वाले सभी अवलोकनों के औसत मूल्य से आश्रित चर के प्रत्येक मान के वर्ग विचलन का योग है। ये ऐसी त्रुटियां हैं जिन्हें किसी भी पूर्वानुमानित समीकरण से कभी नहीं टाला जा सकता है जो स्वतंत्र चर के मूल्य के एक फ़ंक्शन के रूप में आश्रित चर के लिए अनुमानित मान निर्दिष्ट करता है। वर्गों के शेष योग को मॉडल की फिट की कमी के लिए जिम्मेदार ठहराया जाता है क्योंकि इन त्रुटियों को पूरी तरह से खत्म करना गणितीय रूप से संभव होगा।
Line 8: Line 8:


: <math> y = \alpha x + \beta \, </math>
: <math> y = \alpha x + \beta \, </math>
न्यूनतम वर्ग विधि द्वारा. कोई α और β के अनुमान के रूप में उन मानों को लेता है जो अवशेषों के वर्गों के योग को कम करते हैं, यानी, देखे गए y-मान और फिट किए गए y-मान के बीच अंतर के वर्गों का योग। वर्गों के अवशिष्ट योग से भिन्न वर्गों के योग की कमी के लिए, किसी को एक या अधिक x-मानों में से प्रत्येक के लिए एक से अधिक y-मान का निरीक्षण करना होगा। फिर त्रुटि के कारण वर्गों के योग को, यानी, अवशेषों के वर्गों के योग को, दो घटकों में विभाजित किया जाता है:
न्यूनतम वर्ग विधि द्वारा. कोई α और β के अनुमान के रूप में उन मानों को लेता है जो अवशेषों के वर्गों के योग को कम करते हैं, अर्थात, देखे गए y-मान और फिट किए गए y-मान के बीच अंतर के वर्गों का योग। वर्गों के अवशिष्ट योग से भिन्न वर्गों के योग की कमी के लिए, किसी को एक या अधिक x-मानों में से प्रत्येक के लिए एक से अधिक y-मान का निरीक्षण करना होगा। फिर त्रुटि के कारण वर्गों के योग को, अर्थात, अवशेषों के वर्गों के योग को, दो घटकों में विभाजित किया जाता है:


: त्रुटि के कारण वर्गों का योग = (शुद्ध त्रुटि के कारण वर्गों का योग) + (फिट की कमी के कारण वर्गों का योग)।
: त्रुटि के कारण वर्गों का योग = (शुद्ध त्रुटि के कारण वर्गों का योग) + (फिट की कमी के कारण वर्गों का योग)।
Line 14: Line 14:
शुद्ध त्रुटि के कारण वर्गों का योग प्रत्येक देखे गए y-मान और समान x-मान के अनुरूप सभी y-मानों के औसत के बीच अंतर के वर्गों का योग है।
शुद्ध त्रुटि के कारण वर्गों का योग प्रत्येक देखे गए y-मान और समान x-मान के अनुरूप सभी y-मानों के औसत के बीच अंतर के वर्गों का योग है।


फिट की कमी के कारण वर्गों का योग समान x-मान के अनुरूप y-मानों के प्रत्येक औसत और संबंधित y-मान के बीच अंतर के वर्गों का भारित योग है, प्रत्येक मामले में वजन केवल देखे गए की संख्या है उस x-मान के लिए y-मान।<ref>{{cite book |first=Richard J. |last=Brook |first2=Gregory C. |last2=Arnold |title=अनुप्रयुक्त प्रतिगमन विश्लेषण और प्रायोगिक डिजाइन|publisher=[[CRC Press]] |year=1985 |pages=[https://archive.org/details/appliedregressio0000broo/page/48 48–49] |isbn=0824772520 |url=https://archive.org/details/appliedregressio0000broo/page/48 }}</ref><ref>{{cite book |first=John |last=Neter |first2=Michael H. |last2=Kutner |first3=Christopher J. |last3=Nachstheim |first4=William |last4=Wasserman |title=अनुप्रयुक्त रैखिक सांख्यिकीय मॉडल|edition=Fourth |publisher=Irwin |location=Chicago |year=1996 |pages=121–122 |isbn=0256117365 }}</ref> क्योंकि यह कम से कम वर्ग प्रतिगमन की एक संपत्ति है कि वेक्टर जिसके घटक शुद्ध त्रुटियां हैं और कमी-फिट घटकों के वेक्टर एक-दूसरे के लिए ऑर्थोगोनल हैं, निम्नलिखित समानता रखती है:
फिट की कमी के कारण वर्गों का योग समान x-मान के अनुरूप y-मानों के प्रत्येक औसत और संबंधित y-मान के बीच अंतर के वर्गों का भारित योग है, प्रत्येक स्थितियों में वजन केवल देखे गए की संख्या है उस x-मान के लिए y-मान।<ref>{{cite book |first=Richard J. |last=Brook |first2=Gregory C. |last2=Arnold |title=अनुप्रयुक्त प्रतिगमन विश्लेषण और प्रायोगिक डिजाइन|publisher=[[CRC Press]] |year=1985 |pages=[https://archive.org/details/appliedregressio0000broo/page/48 48–49] |isbn=0824772520 |url=https://archive.org/details/appliedregressio0000broo/page/48 }}</ref><ref>{{cite book |first=John |last=Neter |first2=Michael H. |last2=Kutner |first3=Christopher J. |last3=Nachstheim |first4=William |last4=Wasserman |title=अनुप्रयुक्त रैखिक सांख्यिकीय मॉडल|edition=Fourth |publisher=Irwin |location=Chicago |year=1996 |pages=121–122 |isbn=0256117365 }}</ref> क्योंकि यह कम से कम वर्ग प्रतिगमन की एक संपत्ति है कि वेक्टर जिसके घटक शुद्ध त्रुटियां हैं और कमी-फिट घटकों के वेक्टर एक-दूसरे के लिए ऑर्थोगोनल हैं, निम्नलिखित समानता रखती है:


:<math>
:<math>
Line 26: Line 26:


== गणितीय विवरण ==
== गणितीय विवरण ==
एक भविष्यवक्ता चर के साथ एक रेखा फिट करने पर विचार करें। i को प्रत्येक n विशिष्ट x मानों के सूचकांक के रूप में परिभाषित करें, j को किसी दिए गए x मान के लिए प्रतिक्रिया चर अवलोकनों के सूचकांक के रूप में परिभाषित करें, और n<sub>''i''</sub> i से संबद्ध y मानों की संख्या के रूप में <sup>वें</sup>x मान. प्रत्येक प्रतिक्रिया चर अवलोकन के मूल्य का प्रतिनिधित्व किया जा सकता है
एक भविष्यवक्ता चर के साथ एक रेखा फिट करने पर विचार करें। i को प्रत्येक n विशिष्ट x मानों के सूचकांक के रूप में परिभाषित करें, j को किसी दिए गए x मान के लिए प्रतिक्रिया चर अवलोकनों के सूचकांक के रूप में परिभाषित करें, और n<sub>''i''</sub> i से संबद्ध y मानों की संख्या के रूप में X<sup>वें</sup> मान. प्रत्येक प्रतिक्रिया चर अवलोकन के मूल्य का प्रतिनिधित्व किया जा सकता है


: <math> Y_{ij} = \alpha x_i + \beta + \varepsilon_{ij},\qquad i = 1,\dots, n,\quad j = 1,\dots,n_i.</math>
: <math> Y_{ij} = \alpha x_i + \beta + \varepsilon_{ij},\qquad i = 1,\dots, n,\quad j = 1,\dots,n_i.</math>
Line 32: Line 32:


: <math> \widehat\alpha, \widehat\beta \,</math>
: <math> \widehat\alpha, \widehat\beta \,</math>
x के प्रेक्षित मानों के आधार पर अप्राप्य मापदंडों α और β का न्यूनतम वर्ग अनुमान हो<sub>&nbsp;''i''</sub> और वाई<sub>&nbsp;''i&nbsp;j''</sub>.
x के प्रेक्षित मानों के आधार पर अप्राप्य मापदंडों α और β का न्यूनतम वर्ग अनुमान हो<sub>&nbsp;''i''</sub> और Y<sub>&nbsp;''i&nbsp;j''</sub>.


होने देना
होने देना
Line 47: Line 47:
: <math> \sum_{i=1}^n \sum_{j=1}^{n_i} \widehat\varepsilon_{ij} = 0 \,</math>
: <math> \sum_{i=1}^n \sum_{j=1}^{n_i} \widehat\varepsilon_{ij} = 0 \,</math>
: <math> \sum_{i=1}^n \left(x_i \sum_{j=1}^{n_i} \widehat\varepsilon_{ij} \right) = 0. \,</math>
: <math> \sum_{i=1}^n \left(x_i \sum_{j=1}^{n_i} \widehat\varepsilon_{ij} \right) = 0. \,</math>
इस प्रकार यह 'R' के (N − 2)-आयामी उप-स्थान में स्थित होने के लिए बाध्य है।<sup>एन</sup>, यानी त्रुटि के लिए स्वतंत्रता की एन -2 डिग्री (आंकड़े) हैं।
इस प्रकार यह 'R' के (N − 2)-आयामी उप-स्थान में स्थित होने के लिए बाध्य है।N, अर्थात त्रुटि के लिए स्वतंत्रता की N -2 डिग्री (आंकड़े) हैं।


अब चलो
अब चलो


: <math> \overline{Y}_{i\bullet} = \frac{1}{n_i} \sum_{j=1}^{n_i} Y_{ij} </math>
: <math> \overline{Y}_{i\bullet} = \frac{1}{n_i} \sum_{j=1}^{n_i} Y_{ij} </math>
i से जुड़े सभी Y-मानों का औसत हो <sup>वें</sup>x-मूल्य.
i से जुड़े सभी Y-मानों का औसत हो x <sup>वें</sup>-मूल्य.


हम त्रुटि के कारण वर्गों के योग को दो घटकों में विभाजित करते हैं:
हम त्रुटि के कारण वर्गों के योग को दो घटकों में विभाजित करते हैं:
Line 70: Line 70:
=== वर्गों का योग ===
=== वर्गों का योग ===


मान लीजिए आँकड़ों में त्रुटियाँ और अवशेष ε<sub>&nbsp;''i&nbsp;j''</sub> अपेक्षित मान 0 और विचरण σ के साथ [[सांख्यिकीय स्वतंत्रता]] और [[सामान्य वितरण]] हैं<sup>2</sup>. हम एक्स का इलाज करते हैं<sub>&nbsp;''i''</sub> यादृच्छिक के बजाय स्थिर के रूप में। फिर प्रतिक्रिया चर Y<sub>&nbsp;''i&nbsp;j''</sub> केवल इसलिए यादृच्छिक हैं क्योंकि त्रुटियाँ ε हैं<sub>&nbsp;''i&nbsp;j''</sub> यादृच्छिक हैं.
मान लीजिए आँकड़ों में त्रुटियाँ और अवशेष ε<sub>&nbsp;''i&nbsp;j''</sub> अपेक्षित मान 0 और विचरण σ के साथ [[सांख्यिकीय स्वतंत्रता]] और [[सामान्य वितरण]] हैं<sup>2</sup>. हम x का इलाज करते हैं<sub>&nbsp;''i''</sub> यादृच्छिक के अतिरिक्स् के रूप में। फिर प्रतिक्रिया चर Y<sub>&nbsp;''i&nbsp;j''</sub> केवल इसलिए यादृच्छिक हैं क्योंकि त्रुटियाँ ε हैं<sub>&nbsp;''i&nbsp;j''</sub> यादृच्छिक हैं.


इसका अनुसरण करके दिखाया जा सकता है कि यदि सीधी-रेखा मॉडल सही है, तो त्रुटि के कारण वर्गों के योग को त्रुटि विचरण से विभाजित किया जाता है,
इसका अनुसरण करके दिखाया जा सकता है कि यदि सीधी-रेखा मॉडल सही है, तो त्रुटि के कारण वर्गों के योग को त्रुटि विचरण से विभाजित किया जाता है,
Line 77: Line 77:
स्वतंत्रता की N − 2 डिग्री के साथ एक [[ची-वर्ग वितरण]] है।
स्वतंत्रता की N − 2 डिग्री के साथ एक [[ची-वर्ग वितरण]] है।


इसके अलावा, अवलोकनों की कुल संख्या N, स्वतंत्र चर n के स्तरों की संख्या और मॉडल p में मापदंडों की संख्या दी गई है:
इसके अतिरिक्त, अवलोकनों की कुल संख्या N, स्वतंत्र चर n के स्तरों की संख्या और मॉडल p में मापदंडों की संख्या दी गई है:


* शुद्ध त्रुटि के कारण वर्गों के योग को त्रुटि विचरण σ से विभाजित किया जाता है<sup>2</sup>, स्वतंत्रता की N − n डिग्री के साथ एक ची-वर्ग वितरण है;
* शुद्ध त्रुटि के कारण वर्गों के योग को त्रुटि विचरण σ से विभाजित किया जाता है<sup>2</sup>, स्वतंत्रता की N − n डिग्री के साथ एक ची-वर्ग वितरण है;
Line 91: Line 91:
\end{align}
\end{align}
</math>
</math>
अंश और हर में स्वतंत्रता की डिग्री की संगत संख्या के साथ एक एफ-वितरण है, बशर्ते कि मॉडल सही हो। यदि मॉडल गलत है, तो हर का संभाव्यता वितरण अभी भी ऊपर बताया गया है, और अंश और हर अभी भी स्वतंत्र हैं। लेकिन तब अंश में एक गैर-केंद्रीय ची-वर्ग वितरण होता है, और परिणामस्वरूप पूरे भागफल में एक [[गैर-केंद्रीय एफ-वितरण]] होता है।
अंश और हर में स्वतंत्रता की डिग्री की संगत संख्या के साथ एक F-वितरण है, बशर्ते कि मॉडल सही हो। यदि मॉडल गलत है, तो हर का संभाव्यता वितरण अभी भी ऊपर बताया गया है, और अंश और हर अभी भी स्वतंत्र हैं। लेकिन तब अंश में एक गैर-केंद्रीय ची-वर्ग वितरण होता है, और परिणामस्वरूप पूरे भागफल में एक [[गैर-केंद्रीय एफ-वितरण]] होता है।


कोई इस एफ-सांख्यिकी का उपयोग शून्य परिकल्पना का परीक्षण करने के लिए करता है कि रैखिक मॉडल सही है। चूँकि गैर-केंद्रीय एफ-वितरण (केंद्रीय) एफ-वितरण की तुलना में [[स्टोकेस्टिक क्रम]] है, यदि एफ-आँकड़ा महत्वपूर्ण एफ मान से बड़ा है, तो कोई शून्य परिकल्पना को अस्वीकार कर देता है। महत्वपूर्ण मान वांछित [[आत्मविश्वास स्तर]] के बराबर x और स्वतंत्रता की डिग्री d के साथ F वितरण के संचयी वितरण फ़ंक्शन से मेल खाता है<sub>1</sub>= (एन पी) और डी<sub>2</sub>= (एन एन).
कोई इस F-सांख्यिकी का उपयोग शून्य परिकल्पना का परीक्षण करने के लिए करता है कि रैखिक मॉडल सही है। चूँकि गैर-केंद्रीय F-वितरण (केंद्रीय) F-वितरण की तुलना में [[स्टोकेस्टिक क्रम]] है, यदि F-आँकड़ा महत्वपूर्ण F मान से बड़ा है, तो कोई शून्य परिकल्पना को अस्वीकार कर देता है। महत्वपूर्ण मान वांछित [[आत्मविश्वास स्तर]] के बराबर x और स्वतंत्रता की डिग्री d के साथ F वितरण के संचयी वितरण फ़ंक्शन से मेल खाता है<sub>1</sub>= (N P) और D<sub>2</sub>= (N N).


त्रुटियों और [[स्वतंत्रता (संभावना सिद्धांत)]] के सामान्य वितरण की धारणाओं को यह दिखाया जा सकता है कि यह फिट की अच्छाई | फिट की कमी परीक्षण इस अशक्त परिकल्पना की संभावना-अनुपात परीक्षण है।
त्रुटियों और [[स्वतंत्रता (संभावना सिद्धांत)]] के सामान्य वितरण की धारणाओं को यह दिखाया जा सकता है कि यह फिट की अच्छाई | फिट की कमी परीक्षण इस अशक्त परिकल्पना की संभावना-अनुपात परीक्षण है।

Revision as of 22:40, 11 July 2023

आंकड़ों में, फिट की कमी के कारण वर्गों का योग, या अधिक संक्षेप में वर्गों का फिट न होने वाला योग, विचरण के विश्लेषण में अवशेषों के वर्गों (सांख्यिकी) के योग के विभाजन के घटकों में से एक है, शून्य परिकल्पना के F-परीक्षण में अंश में उपयोग किया जाता है जो कहता है कि एक प्रस्तावित मॉडल अच्छी तरह से फिट बैठता है। अन्य घटक वर्गों का शुद्ध-त्रुटि योग है।

वर्गों का शुद्ध-त्रुटि योग उसके स्वतंत्र चर मान(मानों) को साझा करने वाले सभी अवलोकनों के औसत मूल्य से आश्रित चर के प्रत्येक मान के वर्ग विचलन का योग है। ये ऐसी त्रुटियां हैं जिन्हें किसी भी पूर्वानुमानित समीकरण से कभी नहीं टाला जा सकता है जो स्वतंत्र चर के मूल्य के एक फ़ंक्शन के रूप में आश्रित चर के लिए अनुमानित मान निर्दिष्ट करता है। वर्गों के शेष योग को मॉडल की फिट की कमी के लिए जिम्मेदार ठहराया जाता है क्योंकि इन त्रुटियों को पूरी तरह से खत्म करना गणितीय रूप से संभव होगा।

सिद्धांत

वर्गों के कमी-योग्य योग को वर्गों के अवशिष्ट योग से भिन्न करने के लिए, भविष्यवक्ता चर के सेट के कम से कम एक मान के लिए प्रतिक्रिया चर का प्रतिकृति (सांख्यिकी) मूल्य होना चाहिए। उदाहरण के लिए, एक लाइन फ़िट करने पर विचार करें

न्यूनतम वर्ग विधि द्वारा. कोई α और β के अनुमान के रूप में उन मानों को लेता है जो अवशेषों के वर्गों के योग को कम करते हैं, अर्थात, देखे गए y-मान और फिट किए गए y-मान के बीच अंतर के वर्गों का योग। वर्गों के अवशिष्ट योग से भिन्न वर्गों के योग की कमी के लिए, किसी को एक या अधिक x-मानों में से प्रत्येक के लिए एक से अधिक y-मान का निरीक्षण करना होगा। फिर त्रुटि के कारण वर्गों के योग को, अर्थात, अवशेषों के वर्गों के योग को, दो घटकों में विभाजित किया जाता है:

त्रुटि के कारण वर्गों का योग = (शुद्ध त्रुटि के कारण वर्गों का योग) + (फिट की कमी के कारण वर्गों का योग)।

शुद्ध त्रुटि के कारण वर्गों का योग प्रत्येक देखे गए y-मान और समान x-मान के अनुरूप सभी y-मानों के औसत के बीच अंतर के वर्गों का योग है।

फिट की कमी के कारण वर्गों का योग समान x-मान के अनुरूप y-मानों के प्रत्येक औसत और संबंधित y-मान के बीच अंतर के वर्गों का भारित योग है, प्रत्येक स्थितियों में वजन केवल देखे गए की संख्या है उस x-मान के लिए y-मान।[1][2] क्योंकि यह कम से कम वर्ग प्रतिगमन की एक संपत्ति है कि वेक्टर जिसके घटक शुद्ध त्रुटियां हैं और कमी-फिट घटकों के वेक्टर एक-दूसरे के लिए ऑर्थोगोनल हैं, निम्नलिखित समानता रखती है:

इसलिए वर्गों का शेष योग पूरी तरह से दो घटकों में विघटित हो गया है।

गणितीय विवरण

एक भविष्यवक्ता चर के साथ एक रेखा फिट करने पर विचार करें। i को प्रत्येक n विशिष्ट x मानों के सूचकांक के रूप में परिभाषित करें, j को किसी दिए गए x मान के लिए प्रतिक्रिया चर अवलोकनों के सूचकांक के रूप में परिभाषित करें, और ni i से संबद्ध y मानों की संख्या के रूप में Xवें मान. प्रत्येक प्रतिक्रिया चर अवलोकन के मूल्य का प्रतिनिधित्व किया जा सकता है

होने देना

x के प्रेक्षित मानों के आधार पर अप्राप्य मापदंडों α और β का न्यूनतम वर्ग अनुमान हो i और Y i j.

होने देना

प्रतिक्रिया चर के फिट किए गए मान हों। तब

आँकड़ों में त्रुटियाँ और अवशेष हैं, जो त्रुटि शब्द के अप्राप्य मूल्यों के अवलोकनीय अनुमान हैं ε ij. कम से कम वर्गों की विधि की प्रकृति के कारण, अवशेषों का पूरा वेक्टर, साथ

अदिश घटक, आवश्यक रूप से दो बाधाओं को संतुष्ट करते हैं

इस प्रकार यह 'R' के (N − 2)-आयामी उप-स्थान में स्थित होने के लिए बाध्य है।N, अर्थात त्रुटि के लिए स्वतंत्रता की N -2 डिग्री (आंकड़े) हैं।

अब चलो

i से जुड़े सभी Y-मानों का औसत हो x वें-मूल्य.

हम त्रुटि के कारण वर्गों के योग को दो घटकों में विभाजित करते हैं:


संभाव्यता वितरण

वर्गों का योग

मान लीजिए आँकड़ों में त्रुटियाँ और अवशेष ε i j अपेक्षित मान 0 और विचरण σ के साथ सांख्यिकीय स्वतंत्रता और सामान्य वितरण हैं2. हम x का इलाज करते हैं i यादृच्छिक के अतिरिक्स् के रूप में। फिर प्रतिक्रिया चर Y i j केवल इसलिए यादृच्छिक हैं क्योंकि त्रुटियाँ ε हैं i j यादृच्छिक हैं.

इसका अनुसरण करके दिखाया जा सकता है कि यदि सीधी-रेखा मॉडल सही है, तो त्रुटि के कारण वर्गों के योग को त्रुटि विचरण से विभाजित किया जाता है,

स्वतंत्रता की N − 2 डिग्री के साथ एक ची-वर्ग वितरण है।

इसके अतिरिक्त, अवलोकनों की कुल संख्या N, स्वतंत्र चर n के स्तरों की संख्या और मॉडल p में मापदंडों की संख्या दी गई है:

  • शुद्ध त्रुटि के कारण वर्गों के योग को त्रुटि विचरण σ से विभाजित किया जाता है2, स्वतंत्रता की N − n डिग्री के साथ एक ची-वर्ग वितरण है;
  • फिट की कमी के कारण वर्गों के योग को त्रुटि विचरण σ से विभाजित किया जाता है2, इसमें स्वतंत्रता की n-p डिग्री के साथ एक ची-वर्ग वितरण है (यहां p=2 क्योंकि सीधी-रेखा मॉडल में दो पैरामीटर हैं);
  • वर्गों के दो योग संभावित रूप से स्वतंत्र हैं।

परीक्षण आँकड़ा

इसके बाद यह आंकड़े सामने आते हैं

अंश और हर में स्वतंत्रता की डिग्री की संगत संख्या के साथ एक F-वितरण है, बशर्ते कि मॉडल सही हो। यदि मॉडल गलत है, तो हर का संभाव्यता वितरण अभी भी ऊपर बताया गया है, और अंश और हर अभी भी स्वतंत्र हैं। लेकिन तब अंश में एक गैर-केंद्रीय ची-वर्ग वितरण होता है, और परिणामस्वरूप पूरे भागफल में एक गैर-केंद्रीय एफ-वितरण होता है।

कोई इस F-सांख्यिकी का उपयोग शून्य परिकल्पना का परीक्षण करने के लिए करता है कि रैखिक मॉडल सही है। चूँकि गैर-केंद्रीय F-वितरण (केंद्रीय) F-वितरण की तुलना में स्टोकेस्टिक क्रम है, यदि F-आँकड़ा महत्वपूर्ण F मान से बड़ा है, तो कोई शून्य परिकल्पना को अस्वीकार कर देता है। महत्वपूर्ण मान वांछित आत्मविश्वास स्तर के बराबर x और स्वतंत्रता की डिग्री d के साथ F वितरण के संचयी वितरण फ़ंक्शन से मेल खाता है1= (N − P) और D2= (N − N).

त्रुटियों और स्वतंत्रता (संभावना सिद्धांत) के सामान्य वितरण की धारणाओं को यह दिखाया जा सकता है कि यह फिट की अच्छाई | फिट की कमी परीक्षण इस अशक्त परिकल्पना की संभावना-अनुपात परीक्षण है।

यह भी देखें

टिप्पणियाँ

  1. Brook, Richard J.; Arnold, Gregory C. (1985). अनुप्रयुक्त प्रतिगमन विश्लेषण और प्रायोगिक डिजाइन. CRC Press. pp. 48–49. ISBN 0824772520.
  2. Neter, John; Kutner, Michael H.; Nachstheim, Christopher J.; Wasserman, William (1996). अनुप्रयुक्त रैखिक सांख्यिकीय मॉडल (Fourth ed.). Chicago: Irwin. pp. 121–122. ISBN 0256117365.

[Category:Statistical hypothesis testi