वर्गों के योग का अभाव: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 1: Line 1:
आंकड़ों में, फिट की कमी के कारण वर्गों का योग, या अधिक संक्षेप में वर्गों का फिट न होने वाला योग, विचरण के विश्लेषण में अवशेषों के वर्गों (सांख्यिकी) के योग के विभाजन के घटकों में से है, [[शून्य परिकल्पना]] के F-परीक्षण में अंश में उपयोग किया जाता है जो कहता है कि प्रस्तावित मॉडल अच्छी प्रकार से फिट बैठता है। अन्य घटक वर्गों का शुद्ध-त्रुटि योग है।
आंकड़ों में, फिट की कमी के कारण वर्गों का योग, या अधिक संक्षेप में वर्गों का फिट न होने वाला योग, विचरण के विश्लेषण में अवशेषों के वर्गों (सांख्यिकी) के योग के विभाजन के घटकों में से है, [[शून्य परिकल्पना]] के F-परीक्षण में अंश में उपयोग किया जाता है जो कहता है कि प्रस्तावित मॉडल अच्छी प्रकार से फिट बैठता है। अनुपस्थिति के वर्ग का योग अन्य घटक होता है।


वर्गों का शुद्ध-त्रुटि योग उसके [[स्वतंत्र चर]] मान(मानों) को साझा करने वाले सभी अवलोकनों के औसत मूल्य से आश्रित चर के प्रत्येक मान के वर्ग विचलन का योग है। ये ऐसी त्रुटियां हैं जिन्हें किसी भी पूर्वानुमानित समीकरण से कभी नहीं टाला जा सकता है जो स्वतंत्र चर के मूल्य के फ़ंक्शन के रूप में आश्रित चर के लिए अनुमानित मान निर्दिष्ट करता है। वर्गों के शेष योग को मॉडल की फिट की कमी के लिए जिम्मेदार ठहराया जाता है क्योंकि इन त्रुटियों को पूरी प्रकार से खत्म करना गणितीय रूप से संभव होता है।  
वर्गों का शुद्ध-त्रुटि योग उसके [[स्वतंत्र चर]] मान(मानों) को साझा करने वाले सभी अवलोकनों के औसत मूल्य से आश्रित चर के प्रत्येक मान के वर्ग विचलन का योग है। ये त्रुटियाँ ऐसी हैं जो किसी भी पूर्वानुमानित समीकरण द्वारा नहीं बच सकतीं हैं जो निर्भरता चर के लिए विश्लेषणात्मक मान को स्वतंत्र चर (ओं) के मान (ओं) के विचलन के एक कार्यकारी के रूप में नियुक्त करता है। अवशेषित शेषों के वर्ग का योग अवलोकन में अवलोकन की अनुपस्थिति के लिए समर्पित होता है क्योंकि यह गणितीय रूप से संपूर्ण रूप से इन त्रुटियों को पूर्णतः नष्ट करना संभव होता है।  


== सिद्धांत ==
== सिद्धांत ==


वर्गों के कमी-योग्य योग को वर्गों के अवशिष्ट योग से भिन्न करने के लिए, भविष्यवक्ता चर के सेट के कम से कम मान के लिए प्रतिक्रिया चर का [[प्रतिकृति (सांख्यिकी)]] मूल्य होना चाहिए। उदाहरण के लिए, लाइन फ़िट करने पर विचार करें,
वर्गों के कमी-योग्य योग को वर्गों के अवशिष्ट योग से भिन्न करने के लिए, भविष्यवक्ता चर के सेट के कम से कम मान के लिए प्रतिक्रिया चर का [[प्रतिकृति (सांख्यिकी)]] मूल्य होना चाहिए, उदाहरण के लिए, लाइन फ़िट करने पर विचार करें,


: <math> y = \alpha x + \beta \, </math>
: <math> y = \alpha x + \beta \, </math>
न्यूनतम वर्ग विधि द्वारा. कोई α और β के अनुमान के रूप में उन मानों को लेता है जो अवशेषों के वर्गों के योग को कम करते हैं, अर्थात, देखे गए y-मान और फिट किए गए y-मान के बीच अंतर के वर्गों का योग होता है। वर्गों के अवशिष्ट योग से भिन्न वर्गों के योग की कमी के लिए, किसी को एक या अधिक x-मानों में से प्रत्येक के लिए एक से अधिक y-मान का निरीक्षण करना होगा। फिर त्रुटि के कारण वर्गों के योग को, अर्थात, अवशेषों के वर्गों के योग को, दो घटकों में विभाजित किया जाता है:
लीस्ट स्क्वेयर्स की विधि के द्वारा। α और β के अनुमान के रूप में हम संख्याओं को लेते हैं जो रेशियल्स के वर्गों की योग को कम से कम करें, अर्थात, देखे गए y मान और मेलित y मान के बीच के अंतर के वर्गों की योग। लैक ऑफ़ फिट सम के वर्ग को रेशियल्स के वर्गों से अलग होने के लिए, हमें एक या अधिक x मानों के लिए प्रत्येक में एक से अधिक y मान देखने की आवश्यकता होती है। फिर, हम "त्रुटि के कारण होने वाले वर्ग" अर्थात रेशियल्स के वर्गों को दो घटकों में विभाजित करते हैं:


: त्रुटि के कारण वर्गों का योग = (शुद्ध त्रुटि के कारण वर्गों का योग) + (फिट की कमी के कारण वर्गों का योग) होता है।
: त्रुटि के कारण वर्गों का योग = ("पक्की" त्रुटि के कारण होने वाले वर्ग) + (फिट के कारण होने वाले वर्ग) होता है।


शुद्ध त्रुटि के कारण वर्गों का योग प्रत्येक देखे गए y-मान और समान x-मान के अनुरूप सभी y-मानों के औसत के बीच अंतर के वर्गों का योग है।
"पक्की" त्रुटि के कारण होने वाले वर्ग वही होते हैं जो हर देखे गए y मान और उसी x मान के लिए सभी y मानों के औसत के बीच के अंतरों के वर्गों की योग होती हैं।


फिट की कमी के कारण वर्गों का योग समान x-मान के अनुरूप y-मानों के प्रत्येक औसत और संबंधित y-मान के बीच अंतर के वर्गों का भारित योग है, प्रत्येक स्थितियों में वजन केवल देखे गए की संख्या है उस x-मान के लिए y-मान।<ref>{{cite book |first=Richard J. |last=Brook |first2=Gregory C. |last2=Arnold |title=अनुप्रयुक्त प्रतिगमन विश्लेषण और प्रायोगिक डिजाइन|publisher=[[CRC Press]] |year=1985 |pages=[https://archive.org/details/appliedregressio0000broo/page/48 48–49] |isbn=0824772520 |url=https://archive.org/details/appliedregressio0000broo/page/48 }}</ref><ref>{{cite book |first=John |last=Neter |first2=Michael H. |last2=Kutner |first3=Christopher J. |last3=Nachstheim |first4=William |last4=Wasserman |title=अनुप्रयुक्त रैखिक सांख्यिकीय मॉडल|edition=Fourth |publisher=Irwin |location=Chicago |year=1996 |pages=121–122 |isbn=0256117365 }}</ref> क्योंकि यह कम से कम वर्ग प्रतिगमन की संपत्ति है कि वेक्टर जिसके घटक शुद्ध त्रुटियां हैं और कमी-फिट घटकों के वेक्टर एक-दूसरे के लिए ऑर्थोगोनल हैं, निम्नलिखित समानता रखती है:
फिट के कारण होने वाले वर्ग वही होते हैं जो हर x मान के लिए संबंधित सभी y मानों के औसत और संबंधित फिट किए गए y मान के बीच के अंतरों के वर्गों का वजनित योग होती हैं, जहां प्रत्येक मामले में वजन सीधे तौर पर उस x मान के लिए देखे गए y मानों की संख्या होती है।<ref>{{cite book |first=Richard J. |last=Brook |first2=Gregory C. |last2=Arnold |title=अनुप्रयुक्त प्रतिगमन विश्लेषण और प्रायोगिक डिजाइन|publisher=[[CRC Press]] |year=1985 |pages=[https://archive.org/details/appliedregressio0000broo/page/48 48–49] |isbn=0824772520 |url=https://archive.org/details/appliedregressio0000broo/page/48 }}</ref><ref>{{cite book |first=John |last=Neter |first2=Michael H. |last2=Kutner |first3=Christopher J. |last3=Nachstheim |first4=William |last4=Wasserman |title=अनुप्रयुक्त रैखिक सांख्यिकीय मॉडल|edition=Fourth |publisher=Irwin |location=Chicago |year=1996 |pages=121–122 |isbn=0256117365 }}</ref> क्योंकि लीस्ट स्क्वेयर्स रीग्रेशन की गुणधर्म है कि "पक्की त्रुटियों" के घटक और लैक ऑफ़ फिट के घटक आपस में लंबक अंग होते हैं, इसलिए निम्नलिखित समानता होती है:


:<math>
:<math>
Line 26: Line 26:


== गणितीय विवरण ==
== गणितीय विवरण ==
भविष्यवक्ता चर के साथ रेखा फिट करने पर विचार करें। i को प्रत्येक n विशिष्ट x मानों के सूचकांक के रूप में परिभाषित करें, j को किसी दिए गए x मान के लिए प्रतिक्रिया चर अवलोकनों के सूचकांक के रूप में परिभाषित करें, और n<sub>''i''</sub> i से संबद्ध y मानों की संख्या के रूप में X<sup>th</sup> मान. प्रत्येक प्रतिक्रिया चर अवलोकन के मूल्य का प्रतिनिधित्व किया जा सकता है
भविष्यवक्ता चर के साथ रेखा फिट करने पर विचार करें। n अलग-अलग ''x'' मानों के प्रति सूचकांक के रूप में ''i'' को परिभाषित करें, दिए गए ''x'' मान के लिए प्रतिक्रिया चर अवलोकनों के लिए सूचकांक के रूप में j को परिभाषित करें, और ''i'' <sup>th</sup> ''x'' मान के साथ जुड़े y मानों की संख्या को ni के रूप में परिभाषित करें। प्रत्येक प्रतिक्रिया चर अवलोकन के मान को निम्न रूप में प्रदर्शित किया जा सकता है:


: <math> Y_{ij} = \alpha x_i + \beta + \varepsilon_{ij},\qquad i = 1,\dots, n,\quad j = 1,\dots,n_i.</math>
: <math> Y_{ij} = \alpha x_i + \beta + \varepsilon_{ij},\qquad i = 1,\dots, n,\quad j = 1,\dots,n_i.</math>
होने देना
यहां,


: <math> \widehat\alpha, \widehat\beta \,</math>
: <math> \widehat\alpha, \widehat\beta \,</math>
x के प्रेक्षित मानों के आधार पर अप्राप्य मापदंडों α और β का न्यूनतम वर्ग अनुमान हो<sub>&nbsp;''i''</sub> और Y<sub>&nbsp;''i&nbsp;j''</sub>.
अवर्जित पैरामीटर एल्फा और बीटा के लिए न्यूनतम वर्गों के अनुमान हैं, जो ''x'' <sub>''i''</sub> और ''Y'' <sub>''i j''</sub> के देखे गए मानों पर आधारित हैं।


होने देना
यहां,


: <math> \widehat Y_i = \widehat\alpha x_i + \widehat\beta \,</math>
: <math> \widehat Y_i = \widehat\alpha x_i + \widehat\beta \,</math>
प्रतिक्रिया चर के फिट किए गए मान हों। तब
प्रतिक्रिया चर के मान हैं। इसके बाद,


: <math> \widehat\varepsilon_{ij} = Y_{ij} - \widehat Y_i \,</math>
: <math> \widehat\varepsilon_{ij} = Y_{ij} - \widehat Y_i \,</math>
[[आँकड़ों में त्रुटियाँ और अवशेष]] हैं, जो त्रुटि शब्द के अप्राप्य मूल्यों के अवलोकनीय अनुमान हैं ε<sub>&nbsp;''ij''</sub>. कम से कम वर्गों की विधि की प्रकृति के कारण, अवशेषों का पूरा वेक्टर, साथ
[[आँकड़ों में त्रुटियाँ और अवशेष]] हैं, जो त्रुटि परिमाण  ε<sub>''ij''</sub> के अनुमान के रूप में देखे गए मान होती हैं। न्यूनतम वर्गों के विधि के स्वरूप के कारण, पूरे वेक्टर त्रुटियों को देखा जा सकता है, जिनमें सम्मिलित है


:<math> N = \sum_{i=1}^n n_i </math>
:<math> N = \sum_{i=1}^n n_i </math>
अदिश घटक, आवश्यक रूप से दो बाधाओं को संतुष्ट करते हैं
स्केलर घटक होते हैं, आवश्यक रूप से दो सीमाएँ पूरी करते हैं


: <math> \sum_{i=1}^n \sum_{j=1}^{n_i} \widehat\varepsilon_{ij} = 0 \,</math>
: <math> \sum_{i=1}^n \sum_{j=1}^{n_i} \widehat\varepsilon_{ij} = 0 \,</math>
: <math> \sum_{i=1}^n \left(x_i \sum_{j=1}^{n_i} \widehat\varepsilon_{ij} \right) = 0. \,</math>
: <math> \sum_{i=1}^n \left(x_i \sum_{j=1}^{n_i} \widehat\varepsilon_{ij} \right) = 0. \,</math>
इस प्रकार यह 'R' के (N − 2)-आयामी उप-स्थान में स्थित होने के लिए बाध्य है।N, अर्थात त्रुटि के लिए स्वतंत्रता की N -2 डिग्री (आंकड़े) हैं।
इस प्रकार यह 'R' के (N − 2)-आयामी उप-स्थान में स्थित होने के लिए बाध्य है। N, अर्थात त्रुटि के लिए स्वतंत्रता की N -2 डिग्री (आंकड़े) हैं।


अब चलो
अब यहां,


: <math> \overline{Y}_{i\bullet} = \frac{1}{n_i} \sum_{j=1}^{n_i} Y_{ij} </math>
: <math> \overline{Y}_{i\bullet} = \frac{1}{n_i} \sum_{j=1}^{n_i} Y_{ij} </math>
i से जुड़े सभी Y-मानों का औसत हो x<sup>वें</sup>-मूल्य.
''i'' <sup>th</sup> , x मान के संबंधित सभी Y मानों का औसत है।.


हम त्रुटि के कारण वर्गों के योग को दो घटकों में विभाजित करते हैं:
हम त्रुटि के वारियंस के योग को दो घटकों में विभाजित करते हैं।


:<math>
:<math>
Line 70: Line 70:
=== वर्गों का योग ===
=== वर्गों का योग ===


मान लीजिए आँकड़ों में त्रुटियाँ और अवशेष ε<sub>&nbsp;''i&nbsp;j''</sub> अपेक्षित मान 0 और विचरण σ<sup>2</sup> के साथ [[सांख्यिकीय स्वतंत्रता]] और [[सामान्य वितरण]] हैं. हम x का इलाज करते हैं<sub>&nbsp;''i''</sub> यादृच्छिक के अतिरिक्स् के रूप में होता है। फिर प्रतिक्रिया चर Y<sub>&nbsp;''i&nbsp;j''</sub> केवल इसलिए यादृच्छिक हैं क्योंकि त्रुटियाँ ε हैं<sub>&nbsp;''i&nbsp;j''</sub> यादृच्छिक हैं.
यदि त्रिज्या मॉडल सही है, तो यद्यपि त्रुटि चर ''ε'' <sub>''i j''</sub> यांत्रिकी हैं और उम्मीदवार वास्तविकता 0 और विचलन ''σ''<sup>2</sup> के साथ [[सांख्यिकीय स्वतंत्रता]] और [[सामान्य वितरण]] होती हैं तब हम ''x'' <sub>''i''</sub> को यांत्रिक मान के बजाय स्थिर मान के रूप में लेते हैं। फिर प्रतिक्रिया मात्राएं ''Y'' <sub>''i j''</sub> केवल इसलिए यांत्रिक होती हैं क्योंकि त्रुटियाँ ''ε'' <sub>''i j''</sub> यांत्रिक होती हैं।


इसका अनुसरण करके दिखाया जा सकता है कि यदि सीधी-रेखा मॉडल सही है, तो त्रुटि के कारण वर्गों के योग को त्रुटि विचरण से विभाजित किया जाता है,
यह सिद्ध हो सकता है कि यदि रैखिक मॉडल सही है, तो त्रुटि के कारण से होने वाले वर्ग का योग (त्रुटि वारियंस से भाग किया गया) निम्न रूप में लिखा जा सकता है:


: <math> \frac{1}{\sigma^2}\sum_{i=1}^n \sum_{j=1}^{n_i} \widehat\varepsilon_{ij}^{\,2} </math>
: <math> \frac{1}{\sigma^2}\sum_{i=1}^n \sum_{j=1}^{n_i} \widehat\varepsilon_{ij}^{\,2} </math>
स्वतंत्रता की N − 2 डिग्री के साथ [[ची-वर्ग वितरण]] है।
स्वतंत्रता की N − 2 डिग्री के साथ [[ची-वर्ग वितरण]] होता है।


इसके अतिरिक्त, अवलोकनों की कुल संख्या N, स्वतंत्र चर n के स्तरों की संख्या और मॉडल p में मापदंडों की संख्या दी गई है:
इसके अतिरिक्त, कुल अवलोकनों की कुल संख्या N, स्वतंत्र प्राधान्य में स्तरों की संख्या n, और मॉडल में पैरामीटरों की संख्या p दी गई होने के कारण:


* शुद्ध त्रुटि के कारण वर्गों के योग को त्रुटि विचरण σ<sup>2</sup> से विभाजित किया जाता है, स्वतंत्रता की N − n डिग्री के साथ ची-वर्ग वितरण है;
* शुद्ध त्रुटि के कारण वर्गों के योग को त्रुटि विचरण σ<sup>2</sup> से विभाजित किया जाता है, स्वतंत्रता की N − n डिग्री के साथ ची-वर्ग वितरण होता है;
* फिट की कमी के कारण वर्गों के योग को त्रुटि विचरण σ<sup>2</sup> से विभाजित किया जाता है, इसमें स्वतंत्रता की n-p डिग्री के साथ ची-वर्ग वितरण है (यहां p=2 क्योंकि सीधी-रेखा मॉडल में दो पैरामीटर हैं);
* अपूर्णता के कारण वर्गों के योग को त्रुटि विचरण σ<sup>2</sup> से विभाजित किया जाता है, इसमें स्वतंत्रता की n-p डिग्री के साथ ची-वर्ग वितरण है (यहां p=2 है रैखिक मॉडल में दो पैरामीटर होते हैं)
* वर्गों के दो योग संभावित रूप से स्वतंत्र हैं।
* दो वर्गों के बीच प्रायोगिकतापूर्णता का कोई संबंध नहीं होता है।


=== परीक्षण आँकड़ा ===
=== परीक्षण आँकड़ा ===
Line 91: Line 91:
\end{align}
\end{align}
</math>
</math>
अंश और हर में स्वतंत्रता की डिग्री की संगत संख्या के साथ F-वितरण है, अनुबंध यह है कि मॉडल सही हो। यदि मॉडल गलत है, तो हर का संभाव्यता वितरण अभी भी ऊपर बताया गया है, और अंश और हर अभी भी स्वतंत्र हैं। किन्तु तब अंश में गैर-केंद्रीय ची-वर्ग वितरण होता है, और परिणामस्वरूप पूरे भागफल में [[गैर-केंद्रीय एफ-वितरण|गैर-केंद्रीय F-वितरण]] होता है।
यदि मॉडल सही है तो F-वितरण अग्रणीकारी और नामवारी गुणों के साथ देने वाले डिग्री में अस्थायीता के साथ होता है। यदि मॉडल गलत है, तो नियमितता की प्राप्ति की प्रायिकता वितरण अभी भी उपरोक्त ढंग से होती है, और प्राणांककारी और नामकारी अभी भी असंबंधित होते हैं। किन्तु अग्रणीकारी फ़ीच्योर अब गैर-केंद्रीय चाइ-स्क्वेयर्ड वितरण होती है, और इस प्रकार भाग [[गैर-केंद्रीय एफ-वितरण|गैर-केंद्रीय F-वितरण]] होता है।


कोई इस F-सांख्यिकी का उपयोग शून्य परिकल्पना का परीक्षण करने के लिए करता है कि रैखिक मॉडल सही है। चूँकि गैर-केंद्रीय F-वितरण (केंद्रीय) F-वितरण की समानता में [[स्टोकेस्टिक क्रम]] है, यदि F-आँकड़ा महत्वपूर्ण F मान से बड़ा है, तो कोई शून्य परिकल्पना को अस्वीकार कर देता है। महत्वपूर्ण मान वांछित [[आत्मविश्वास स्तर]] के बराबर x और स्वतंत्रता की डिग्री के साथ F वितरण के संचयी वितरण फ़ंक्शन से मेल खाता है ''d''<sub>1</sub> = (''n'' − ''p'') और ''d''<sub>2</sub> = (''N'' − ''n'').
इस F-परीक्षण का उपयोग इस प्राथमिकता-निराकरण हाइपोथेसिस का परीक्षण करने के लिए किया जाता है कि रैखिक मॉडल सही है। नॉन-सेंट्रल F-वितरण के कारण, यदि F-वैश्विक वितरण से यह व्यापकतापूर्ण रूप से बड़ा होता है, तो हम निराकरण हाइपोथेसिस को त्यागते हैं। महत्वपूर्ण मान का अर्थ सूचकांक वही होता है जो x बराबर होता है, जहां वांछित [[आत्मविश्वास स्तर]] के साथ F वितरण के कक्ष दिए गए हैं, और डिग्री नियामक ''d''<sub>1</sub> = (''n'' − ''p'') और ''d''<sub>2</sub> = (''N'' − ''n'') होते हैं।


त्रुटियों और [[स्वतंत्रता (संभावना सिद्धांत)]] के सामान्य वितरण की धारणाओं को यह दिखाया जा सकता है कि यह फिट की अच्छाई और फिट की कमी परीक्षण इस अशक्त परिकल्पना की संभावना-अनुपात परीक्षण है।
त्रुटियों और [[स्वतंत्रता (संभावना सिद्धांत)]] के सामान्य वितरण की धारणाओं को यह दिखाया जा सकता है कि यह अभिकलन रूपी परीक्षण इस शून्य हाइपोथेसिस की व्यापारित्व-अनुपात परीक्षा है।


== यह भी देखें ==
== यह भी देखें ==

Revision as of 08:10, 12 July 2023

आंकड़ों में, फिट की कमी के कारण वर्गों का योग, या अधिक संक्षेप में वर्गों का फिट न होने वाला योग, विचरण के विश्लेषण में अवशेषों के वर्गों (सांख्यिकी) के योग के विभाजन के घटकों में से है, शून्य परिकल्पना के F-परीक्षण में अंश में उपयोग किया जाता है जो कहता है कि प्रस्तावित मॉडल अच्छी प्रकार से फिट बैठता है। अनुपस्थिति के वर्ग का योग अन्य घटक होता है।

वर्गों का शुद्ध-त्रुटि योग उसके स्वतंत्र चर मान(मानों) को साझा करने वाले सभी अवलोकनों के औसत मूल्य से आश्रित चर के प्रत्येक मान के वर्ग विचलन का योग है। ये त्रुटियाँ ऐसी हैं जो किसी भी पूर्वानुमानित समीकरण द्वारा नहीं बच सकतीं हैं जो निर्भरता चर के लिए विश्लेषणात्मक मान को स्वतंत्र चर (ओं) के मान (ओं) के विचलन के एक कार्यकारी के रूप में नियुक्त करता है। अवशेषित शेषों के वर्ग का योग अवलोकन में अवलोकन की अनुपस्थिति के लिए समर्पित होता है क्योंकि यह गणितीय रूप से संपूर्ण रूप से इन त्रुटियों को पूर्णतः नष्ट करना संभव होता है।

सिद्धांत

वर्गों के कमी-योग्य योग को वर्गों के अवशिष्ट योग से भिन्न करने के लिए, भविष्यवक्ता चर के सेट के कम से कम मान के लिए प्रतिक्रिया चर का प्रतिकृति (सांख्यिकी) मूल्य होना चाहिए, उदाहरण के लिए, लाइन फ़िट करने पर विचार करें,

लीस्ट स्क्वेयर्स की विधि के द्वारा। α और β के अनुमान के रूप में हम संख्याओं को लेते हैं जो रेशियल्स के वर्गों की योग को कम से कम करें, अर्थात, देखे गए y मान और मेलित y मान के बीच के अंतर के वर्गों की योग। लैक ऑफ़ फिट सम के वर्ग को रेशियल्स के वर्गों से अलग होने के लिए, हमें एक या अधिक x मानों के लिए प्रत्येक में एक से अधिक y मान देखने की आवश्यकता होती है। फिर, हम "त्रुटि के कारण होने वाले वर्ग" अर्थात रेशियल्स के वर्गों को दो घटकों में विभाजित करते हैं:

त्रुटि के कारण वर्गों का योग = ("पक्की" त्रुटि के कारण होने वाले वर्ग) + (फिट के कारण होने वाले वर्ग) होता है।

"पक्की" त्रुटि के कारण होने वाले वर्ग वही होते हैं जो हर देखे गए y मान और उसी x मान के लिए सभी y मानों के औसत के बीच के अंतरों के वर्गों की योग होती हैं।

फिट के कारण होने वाले वर्ग वही होते हैं जो हर x मान के लिए संबंधित सभी y मानों के औसत और संबंधित फिट किए गए y मान के बीच के अंतरों के वर्गों का वजनित योग होती हैं, जहां प्रत्येक मामले में वजन सीधे तौर पर उस x मान के लिए देखे गए y मानों की संख्या होती है।[1][2] क्योंकि लीस्ट स्क्वेयर्स रीग्रेशन की गुणधर्म है कि "पक्की त्रुटियों" के घटक और लैक ऑफ़ फिट के घटक आपस में लंबक अंग होते हैं, इसलिए निम्नलिखित समानता होती है:

इसलिए वर्गों का शेष योग पूरी प्रकार से दो घटकों में विघटित हो गया है।

गणितीय विवरण

भविष्यवक्ता चर के साथ रेखा फिट करने पर विचार करें। n अलग-अलग x मानों के प्रति सूचकांक के रूप में i को परिभाषित करें, दिए गए x मान के लिए प्रतिक्रिया चर अवलोकनों के लिए सूचकांक के रूप में j को परिभाषित करें, और i th x मान के साथ जुड़े y मानों की संख्या को ni के रूप में परिभाषित करें। प्रत्येक प्रतिक्रिया चर अवलोकन के मान को निम्न रूप में प्रदर्शित किया जा सकता है:

यहां,

अवर्जित पैरामीटर एल्फा और बीटा के लिए न्यूनतम वर्गों के अनुमान हैं, जो x i और Y i j के देखे गए मानों पर आधारित हैं।

यहां,

प्रतिक्रिया चर के मान हैं। इसके बाद,

आँकड़ों में त्रुटियाँ और अवशेष हैं, जो त्रुटि परिमाण εij के अनुमान के रूप में देखे गए मान होती हैं। न्यूनतम वर्गों के विधि के स्वरूप के कारण, पूरे वेक्टर त्रुटियों को देखा जा सकता है, जिनमें सम्मिलित है

स्केलर घटक होते हैं, आवश्यक रूप से दो सीमाएँ पूरी करते हैं

इस प्रकार यह 'R' के (N − 2)-आयामी उप-स्थान में स्थित होने के लिए बाध्य है। N, अर्थात त्रुटि के लिए स्वतंत्रता की N -2 डिग्री (आंकड़े) हैं।

अब यहां,

i th , x मान के संबंधित सभी Y मानों का औसत है।.

हम त्रुटि के वारियंस के योग को दो घटकों में विभाजित करते हैं।


संभाव्यता वितरण

वर्गों का योग

यदि त्रिज्या मॉडल सही है, तो यद्यपि त्रुटि चर ε i j यांत्रिकी हैं और उम्मीदवार वास्तविकता 0 और विचलन σ2 के साथ सांख्यिकीय स्वतंत्रता और सामान्य वितरण होती हैं तब हम x i को यांत्रिक मान के बजाय स्थिर मान के रूप में लेते हैं। फिर प्रतिक्रिया मात्राएं Y i j केवल इसलिए यांत्रिक होती हैं क्योंकि त्रुटियाँ ε i j यांत्रिक होती हैं।

यह सिद्ध हो सकता है कि यदि रैखिक मॉडल सही है, तो त्रुटि के कारण से होने वाले वर्ग का योग (त्रुटि वारियंस से भाग किया गया) निम्न रूप में लिखा जा सकता है:

स्वतंत्रता की N − 2 डिग्री के साथ ची-वर्ग वितरण होता है।

इसके अतिरिक्त, कुल अवलोकनों की कुल संख्या N, स्वतंत्र प्राधान्य में स्तरों की संख्या n, और मॉडल में पैरामीटरों की संख्या p दी गई होने के कारण:

  • शुद्ध त्रुटि के कारण वर्गों के योग को त्रुटि विचरण σ2 से विभाजित किया जाता है, स्वतंत्रता की N − n डिग्री के साथ ची-वर्ग वितरण होता है;
  • अपूर्णता के कारण वर्गों के योग को त्रुटि विचरण σ2 से विभाजित किया जाता है, इसमें स्वतंत्रता की n-p डिग्री के साथ ची-वर्ग वितरण है (यहां p=2 है रैखिक मॉडल में दो पैरामीटर होते हैं)।
  • दो वर्गों के बीच प्रायोगिकतापूर्णता का कोई संबंध नहीं होता है।

परीक्षण आँकड़ा

इसके बाद यह आंकड़े सामने आते हैं

यदि मॉडल सही है तो F-वितरण अग्रणीकारी और नामवारी गुणों के साथ देने वाले डिग्री में अस्थायीता के साथ होता है। यदि मॉडल गलत है, तो नियमितता की प्राप्ति की प्रायिकता वितरण अभी भी उपरोक्त ढंग से होती है, और प्राणांककारी और नामकारी अभी भी असंबंधित होते हैं। किन्तु अग्रणीकारी फ़ीच्योर अब गैर-केंद्रीय चाइ-स्क्वेयर्ड वितरण होती है, और इस प्रकार भाग गैर-केंद्रीय F-वितरण होता है।

इस F-परीक्षण का उपयोग इस प्राथमिकता-निराकरण हाइपोथेसिस का परीक्षण करने के लिए किया जाता है कि रैखिक मॉडल सही है। नॉन-सेंट्रल F-वितरण के कारण, यदि F-वैश्विक वितरण से यह व्यापकतापूर्ण रूप से बड़ा होता है, तो हम निराकरण हाइपोथेसिस को त्यागते हैं। महत्वपूर्ण मान का अर्थ सूचकांक वही होता है जो x बराबर होता है, जहां वांछित आत्मविश्वास स्तर के साथ F वितरण के कक्ष दिए गए हैं, और डिग्री नियामक d1 = (np) और d2 = (Nn) होते हैं।

त्रुटियों और स्वतंत्रता (संभावना सिद्धांत) के सामान्य वितरण की धारणाओं को यह दिखाया जा सकता है कि यह अभिकलन रूपी परीक्षण इस शून्य हाइपोथेसिस की व्यापारित्व-अनुपात परीक्षा है।

यह भी देखें

टिप्पणियाँ

  1. Brook, Richard J.; Arnold, Gregory C. (1985). अनुप्रयुक्त प्रतिगमन विश्लेषण और प्रायोगिक डिजाइन. CRC Press. pp. 48–49. ISBN 0824772520.
  2. Neter, John; Kutner, Michael H.; Nachstheim, Christopher J.; Wasserman, William (1996). अनुप्रयुक्त रैखिक सांख्यिकीय मॉडल (Fourth ed.). Chicago: Irwin. pp. 121–122. ISBN 0256117365.

[Category:Statistical hypothesis testi