वर्गों के योग का अभाव: Difference between revisions
No edit summary |
No edit summary |
||
Line 8: | Line 8: | ||
: <math> y = \alpha x + \beta \, </math> | : <math> y = \alpha x + \beta \, </math> | ||
न्यूनतम वर्ग विधि द्वारा. कोई α और β के अनुमान के रूप में उन मानों को लेता है जो अवशेषों के वर्गों के योग को कम करते हैं, अर्थात, देखे गए y-मान और फिट किए गए y-मान के बीच अंतर के वर्गों का | न्यूनतम वर्ग विधि द्वारा. कोई α और β के अनुमान के रूप में उन मानों को लेता है जो अवशेषों के वर्गों के योग को कम करते हैं, अर्थात, देखे गए y-मान और फिट किए गए y-मान के बीच अंतर के वर्गों का योग होता है। वर्गों के अवशिष्ट योग से भिन्न वर्गों के योग की कमी के लिए, किसी को एक या अधिक x-मानों में से प्रत्येक के लिए एक से अधिक y-मान का निरीक्षण करना होगा। फिर त्रुटि के कारण वर्गों के योग को, अर्थात, अवशेषों के वर्गों के योग को, दो घटकों में विभाजित किया जाता है: | ||
: त्रुटि के कारण वर्गों का योग = (शुद्ध त्रुटि के कारण वर्गों का योग) + (फिट की कमी के कारण वर्गों का योग) | : त्रुटि के कारण वर्गों का योग = (शुद्ध त्रुटि के कारण वर्गों का योग) + (फिट की कमी के कारण वर्गों का योग) होता है। | ||
शुद्ध त्रुटि के कारण वर्गों का योग प्रत्येक देखे गए y-मान और समान x-मान के अनुरूप सभी y-मानों के औसत के बीच अंतर के वर्गों का योग है। | शुद्ध त्रुटि के कारण वर्गों का योग प्रत्येक देखे गए y-मान और समान x-मान के अनुरूप सभी y-मानों के औसत के बीच अंतर के वर्गों का योग है। | ||
Line 29: | Line 29: | ||
: <math> Y_{ij} = \alpha x_i + \beta + \varepsilon_{ij},\qquad i = 1,\dots, n,\quad j = 1,\dots,n_i.</math> | : <math> Y_{ij} = \alpha x_i + \beta + \varepsilon_{ij},\qquad i = 1,\dots, n,\quad j = 1,\dots,n_i.</math> | ||
होने देना | होने देना | ||
: <math> \widehat\alpha, \widehat\beta \,</math> | : <math> \widehat\alpha, \widehat\beta \,</math> | ||
Line 70: | Line 70: | ||
=== वर्गों का योग === | === वर्गों का योग === | ||
मान लीजिए आँकड़ों में त्रुटियाँ और अवशेष ε<sub> ''i j''</sub> अपेक्षित मान 0 और विचरण σ के साथ [[सांख्यिकीय स्वतंत्रता]] और [[सामान्य वितरण]] हैं | मान लीजिए आँकड़ों में त्रुटियाँ और अवशेष ε<sub> ''i j''</sub> अपेक्षित मान 0 और विचरण σ<sup>2</sup> के साथ [[सांख्यिकीय स्वतंत्रता]] और [[सामान्य वितरण]] हैं. हम x का इलाज करते हैं<sub> ''i''</sub> यादृच्छिक के अतिरिक्स् के रूप में होता है। फिर प्रतिक्रिया चर Y<sub> ''i j''</sub> केवल इसलिए यादृच्छिक हैं क्योंकि त्रुटियाँ ε हैं<sub> ''i j''</sub> यादृच्छिक हैं. | ||
इसका अनुसरण करके दिखाया जा सकता है कि यदि सीधी-रेखा मॉडल सही है, तो त्रुटि के कारण वर्गों के योग को त्रुटि विचरण से विभाजित किया जाता है, | इसका अनुसरण करके दिखाया जा सकता है कि यदि सीधी-रेखा मॉडल सही है, तो त्रुटि के कारण वर्गों के योग को त्रुटि विचरण से विभाजित किया जाता है, | ||
Line 79: | Line 79: | ||
इसके अतिरिक्त, अवलोकनों की कुल संख्या N, स्वतंत्र चर n के स्तरों की संख्या और मॉडल p में मापदंडों की संख्या दी गई है: | इसके अतिरिक्त, अवलोकनों की कुल संख्या N, स्वतंत्र चर n के स्तरों की संख्या और मॉडल p में मापदंडों की संख्या दी गई है: | ||
* शुद्ध त्रुटि के कारण वर्गों के योग को त्रुटि विचरण σ | * शुद्ध त्रुटि के कारण वर्गों के योग को त्रुटि विचरण σ<sup>2</sup> से विभाजित किया जाता है, स्वतंत्रता की N − n डिग्री के साथ एक ची-वर्ग वितरण है; | ||
* फिट की कमी के कारण वर्गों के योग को त्रुटि विचरण σ | * फिट की कमी के कारण वर्गों के योग को त्रुटि विचरण σ<sup>2</sup> से विभाजित किया जाता है, इसमें स्वतंत्रता की n-p डिग्री के साथ एक ची-वर्ग वितरण है (यहां p=2 क्योंकि सीधी-रेखा मॉडल में दो पैरामीटर हैं); | ||
* वर्गों के दो योग संभावित रूप से स्वतंत्र हैं। | * वर्गों के दो योग संभावित रूप से स्वतंत्र हैं। | ||
Line 91: | Line 91: | ||
\end{align} | \end{align} | ||
</math> | </math> | ||
अंश और हर में स्वतंत्रता की डिग्री की संगत संख्या के साथ एक F-वितरण है, | अंश और हर में स्वतंत्रता की डिग्री की संगत संख्या के साथ एक F-वितरण है, अनुबंध यह है कि मॉडल सही हो। यदि मॉडल गलत है, तो हर का संभाव्यता वितरण अभी भी ऊपर बताया गया है, और अंश और हर अभी भी स्वतंत्र हैं। किन्तु तब अंश में एक गैर-केंद्रीय ची-वर्ग वितरण होता है, और परिणामस्वरूप पूरे भागफल में एक [[गैर-केंद्रीय एफ-वितरण|गैर-केंद्रीय F-वितरण]] होता है। | ||
कोई इस F-सांख्यिकी का उपयोग शून्य परिकल्पना का परीक्षण करने के लिए करता है कि रैखिक मॉडल सही है। चूँकि गैर-केंद्रीय F-वितरण (केंद्रीय) F-वितरण की | कोई इस F-सांख्यिकी का उपयोग शून्य परिकल्पना का परीक्षण करने के लिए करता है कि रैखिक मॉडल सही है। चूँकि गैर-केंद्रीय F-वितरण (केंद्रीय) F-वितरण की समानता में [[स्टोकेस्टिक क्रम]] है, यदि F-आँकड़ा महत्वपूर्ण F मान से बड़ा है, तो कोई शून्य परिकल्पना को अस्वीकार कर देता है। महत्वपूर्ण मान वांछित [[आत्मविश्वास स्तर]] के बराबर x और स्वतंत्रता की डिग्री के साथ F वितरण के संचयी वितरण फ़ंक्शन से मेल खाता है ''d''<sub>1</sub> = (''n'' − ''p'') और ''d''<sub>2</sub> = (''N'' − ''n''). | ||
त्रुटियों और [[स्वतंत्रता (संभावना सिद्धांत)]] के सामान्य वितरण की धारणाओं को यह दिखाया जा सकता है कि यह फिट की अच्छाई | फिट की कमी परीक्षण इस अशक्त परिकल्पना की संभावना-अनुपात परीक्षण है। | त्रुटियों और [[स्वतंत्रता (संभावना सिद्धांत)]] के सामान्य वितरण की धारणाओं को यह दिखाया जा सकता है कि यह फिट की अच्छाई | फिट की कमी परीक्षण इस अशक्त परिकल्पना की संभावना-अनुपात परीक्षण है। |
Revision as of 23:36, 11 July 2023
आंकड़ों में, फिट की कमी के कारण वर्गों का योग, या अधिक संक्षेप में वर्गों का फिट न होने वाला योग, विचरण के विश्लेषण में अवशेषों के वर्गों (सांख्यिकी) के योग के विभाजन के घटकों में से एक है, शून्य परिकल्पना के F-परीक्षण में अंश में उपयोग किया जाता है जो कहता है कि एक प्रस्तावित मॉडल अच्छी तरह से फिट बैठता है। अन्य घटक वर्गों का शुद्ध-त्रुटि योग है।
वर्गों का शुद्ध-त्रुटि योग उसके स्वतंत्र चर मान(मानों) को साझा करने वाले सभी अवलोकनों के औसत मूल्य से आश्रित चर के प्रत्येक मान के वर्ग विचलन का योग है। ये ऐसी त्रुटियां हैं जिन्हें किसी भी पूर्वानुमानित समीकरण से कभी नहीं टाला जा सकता है जो स्वतंत्र चर के मूल्य के एक फ़ंक्शन के रूप में आश्रित चर के लिए अनुमानित मान निर्दिष्ट करता है। वर्गों के शेष योग को मॉडल की फिट की कमी के लिए जिम्मेदार ठहराया जाता है क्योंकि इन त्रुटियों को पूरी तरह से खत्म करना गणितीय रूप से संभव होगा।
सिद्धांत
वर्गों के कमी-योग्य योग को वर्गों के अवशिष्ट योग से भिन्न करने के लिए, भविष्यवक्ता चर के सेट के कम से कम एक मान के लिए प्रतिक्रिया चर का प्रतिकृति (सांख्यिकी) मूल्य होना चाहिए। उदाहरण के लिए, एक लाइन फ़िट करने पर विचार करें
न्यूनतम वर्ग विधि द्वारा. कोई α और β के अनुमान के रूप में उन मानों को लेता है जो अवशेषों के वर्गों के योग को कम करते हैं, अर्थात, देखे गए y-मान और फिट किए गए y-मान के बीच अंतर के वर्गों का योग होता है। वर्गों के अवशिष्ट योग से भिन्न वर्गों के योग की कमी के लिए, किसी को एक या अधिक x-मानों में से प्रत्येक के लिए एक से अधिक y-मान का निरीक्षण करना होगा। फिर त्रुटि के कारण वर्गों के योग को, अर्थात, अवशेषों के वर्गों के योग को, दो घटकों में विभाजित किया जाता है:
- त्रुटि के कारण वर्गों का योग = (शुद्ध त्रुटि के कारण वर्गों का योग) + (फिट की कमी के कारण वर्गों का योग) होता है।
शुद्ध त्रुटि के कारण वर्गों का योग प्रत्येक देखे गए y-मान और समान x-मान के अनुरूप सभी y-मानों के औसत के बीच अंतर के वर्गों का योग है।
फिट की कमी के कारण वर्गों का योग समान x-मान के अनुरूप y-मानों के प्रत्येक औसत और संबंधित y-मान के बीच अंतर के वर्गों का भारित योग है, प्रत्येक स्थितियों में वजन केवल देखे गए की संख्या है उस x-मान के लिए y-मान।[1][2] क्योंकि यह कम से कम वर्ग प्रतिगमन की एक संपत्ति है कि वेक्टर जिसके घटक शुद्ध त्रुटियां हैं और कमी-फिट घटकों के वेक्टर एक-दूसरे के लिए ऑर्थोगोनल हैं, निम्नलिखित समानता रखती है:
इसलिए वर्गों का शेष योग पूरी तरह से दो घटकों में विघटित हो गया है।
गणितीय विवरण
एक भविष्यवक्ता चर के साथ एक रेखा फिट करने पर विचार करें। i को प्रत्येक n विशिष्ट x मानों के सूचकांक के रूप में परिभाषित करें, j को किसी दिए गए x मान के लिए प्रतिक्रिया चर अवलोकनों के सूचकांक के रूप में परिभाषित करें, और ni i से संबद्ध y मानों की संख्या के रूप में Xवें मान. प्रत्येक प्रतिक्रिया चर अवलोकन के मूल्य का प्रतिनिधित्व किया जा सकता है
होने देना
x के प्रेक्षित मानों के आधार पर अप्राप्य मापदंडों α और β का न्यूनतम वर्ग अनुमान हो i और Y i j.
होने देना
प्रतिक्रिया चर के फिट किए गए मान हों। तब
आँकड़ों में त्रुटियाँ और अवशेष हैं, जो त्रुटि शब्द के अप्राप्य मूल्यों के अवलोकनीय अनुमान हैं ε ij. कम से कम वर्गों की विधि की प्रकृति के कारण, अवशेषों का पूरा वेक्टर, साथ
अदिश घटक, आवश्यक रूप से दो बाधाओं को संतुष्ट करते हैं
इस प्रकार यह 'R' के (N − 2)-आयामी उप-स्थान में स्थित होने के लिए बाध्य है।N, अर्थात त्रुटि के लिए स्वतंत्रता की N -2 डिग्री (आंकड़े) हैं।
अब चलो
i से जुड़े सभी Y-मानों का औसत हो x वें-मूल्य.
हम त्रुटि के कारण वर्गों के योग को दो घटकों में विभाजित करते हैं:
संभाव्यता वितरण
वर्गों का योग
मान लीजिए आँकड़ों में त्रुटियाँ और अवशेष ε i j अपेक्षित मान 0 और विचरण σ2 के साथ सांख्यिकीय स्वतंत्रता और सामान्य वितरण हैं. हम x का इलाज करते हैं i यादृच्छिक के अतिरिक्स् के रूप में होता है। फिर प्रतिक्रिया चर Y i j केवल इसलिए यादृच्छिक हैं क्योंकि त्रुटियाँ ε हैं i j यादृच्छिक हैं.
इसका अनुसरण करके दिखाया जा सकता है कि यदि सीधी-रेखा मॉडल सही है, तो त्रुटि के कारण वर्गों के योग को त्रुटि विचरण से विभाजित किया जाता है,
स्वतंत्रता की N − 2 डिग्री के साथ एक ची-वर्ग वितरण है।
इसके अतिरिक्त, अवलोकनों की कुल संख्या N, स्वतंत्र चर n के स्तरों की संख्या और मॉडल p में मापदंडों की संख्या दी गई है:
- शुद्ध त्रुटि के कारण वर्गों के योग को त्रुटि विचरण σ2 से विभाजित किया जाता है, स्वतंत्रता की N − n डिग्री के साथ एक ची-वर्ग वितरण है;
- फिट की कमी के कारण वर्गों के योग को त्रुटि विचरण σ2 से विभाजित किया जाता है, इसमें स्वतंत्रता की n-p डिग्री के साथ एक ची-वर्ग वितरण है (यहां p=2 क्योंकि सीधी-रेखा मॉडल में दो पैरामीटर हैं);
- वर्गों के दो योग संभावित रूप से स्वतंत्र हैं।
परीक्षण आँकड़ा
इसके बाद यह आंकड़े सामने आते हैं
अंश और हर में स्वतंत्रता की डिग्री की संगत संख्या के साथ एक F-वितरण है, अनुबंध यह है कि मॉडल सही हो। यदि मॉडल गलत है, तो हर का संभाव्यता वितरण अभी भी ऊपर बताया गया है, और अंश और हर अभी भी स्वतंत्र हैं। किन्तु तब अंश में एक गैर-केंद्रीय ची-वर्ग वितरण होता है, और परिणामस्वरूप पूरे भागफल में एक गैर-केंद्रीय F-वितरण होता है।
कोई इस F-सांख्यिकी का उपयोग शून्य परिकल्पना का परीक्षण करने के लिए करता है कि रैखिक मॉडल सही है। चूँकि गैर-केंद्रीय F-वितरण (केंद्रीय) F-वितरण की समानता में स्टोकेस्टिक क्रम है, यदि F-आँकड़ा महत्वपूर्ण F मान से बड़ा है, तो कोई शून्य परिकल्पना को अस्वीकार कर देता है। महत्वपूर्ण मान वांछित आत्मविश्वास स्तर के बराबर x और स्वतंत्रता की डिग्री के साथ F वितरण के संचयी वितरण फ़ंक्शन से मेल खाता है d1 = (n − p) और d2 = (N − n).
त्रुटियों और स्वतंत्रता (संभावना सिद्धांत) के सामान्य वितरण की धारणाओं को यह दिखाया जा सकता है कि यह फिट की अच्छाई | फिट की कमी परीक्षण इस अशक्त परिकल्पना की संभावना-अनुपात परीक्षण है।
यह भी देखें
- विचरण का अंश अस्पष्ट
- स्वस्थ भलाई
- रेखीय प्रतिगमन
टिप्पणियाँ
- ↑ Brook, Richard J.; Arnold, Gregory C. (1985). अनुप्रयुक्त प्रतिगमन विश्लेषण और प्रायोगिक डिजाइन. CRC Press. pp. 48–49. ISBN 0824772520.
- ↑ Neter, John; Kutner, Michael H.; Nachstheim, Christopher J.; Wasserman, William (1996). अनुप्रयुक्त रैखिक सांख्यिकीय मॉडल (Fourth ed.). Chicago: Irwin. pp. 121–122. ISBN 0256117365.
[Category:Statistical hypothesis testi