वर्गों के योग का अभाव: Difference between revisions

From Vigyanwiki
No edit summary
Line 109: Line 109:
[[Category: Machine Translated Page]]
[[Category: Machine Translated Page]]
[[Category:Created On 07/07/2023]]
[[Category:Created On 07/07/2023]]
[[Category:Vigyan Ready]]

Revision as of 12:42, 14 July 2023

आंकड़ों में, फिट की कमी के कारण वर्गों का योग, या अधिक संक्षेप में वर्गों का फिट न होने वाला योग, विचरण के विश्लेषण में अवशेषों के वर्गों (सांख्यिकी) के योग के विभाजन के घटकों में से है, शून्य परिकल्पना के F-परीक्षण में अंश में उपयोग किया जाता है जो कहता है कि प्रस्तावित मॉडल अच्छी प्रकार से फिट बैठता है। अनुपस्थिति के वर्ग का योग अन्य घटक होता है।

वर्गों का शुद्ध-त्रुटि योग उसके स्वतंत्र चर मान(मानों) को साझा करने वाले सभी अवलोकनों के औसत मूल्य से आश्रित चर के प्रत्येक मान के वर्ग विचलन का योग है। ये त्रुटियाँ ऐसी हैं जो किसी भी पूर्वानुमानित समीकरण द्वारा नहीं बच सकतीं हैं जो निर्भरता चर के लिए विश्लेषणात्मक मान को स्वतंत्र चर (ओं) के मान (ओं) के विचलन के एक कार्यकारी के रूप में नियुक्त करता है। अवशेषित शेषों के वर्ग का योग अवलोकन में अवलोकन की अनुपस्थिति के लिए समर्पित होता है क्योंकि यह गणितीय रूप से संपूर्ण रूप से इन त्रुटियों को पूर्णतः नष्ट करना संभव होता है।

सिद्धांत

वर्गों के कमी-योग्य योग को वर्गों के अवशिष्ट योग से भिन्न करने के लिए, भविष्यवक्ता चर के सेट के कम से कम मान के लिए प्रतिक्रिया चर का प्रतिकृति (सांख्यिकी) मूल्य होना चाहिए, उदाहरण के लिए, लाइन फ़िट करने पर विचार करें,

लीस्ट स्क्वेयर्स की विधि के द्वारा। α और β के अनुमान के रूप में हम संख्याओं को लेते हैं जो रेशियल्स के वर्गों की योग को कम से कम करें, अर्थात, देखे गए y मान और मेलित y मान के बीच के अंतर के वर्गों की योग। लैक ऑफ़ फिट सम के वर्ग को रेशियल्स के वर्गों से अलग होने के लिए, हमें एक या अधिक x मानों के लिए प्रत्येक में एक से अधिक y मान देखने की आवश्यकता होती है। फिर, हम "त्रुटि के कारण होने वाले वर्ग" अर्थात रेशियल्स के वर्गों को दो घटकों में विभाजित करते हैं:

त्रुटि के कारण वर्गों का योग = ("पक्की" त्रुटि के कारण होने वाले वर्ग) + (फिट के कारण होने वाले वर्ग) होता है।

"पक्की" त्रुटि के कारण होने वाले वर्ग वही होते हैं जो हर देखे गए y मान और उसी x मान के लिए सभी y मानों के औसत के बीच के अंतरों के वर्गों की योग होती हैं।

फिट के कारण होने वाले वर्ग वही होते हैं जो हर x मान के लिए संबंधित सभी y मानों के औसत और संबंधित फिट किए गए y मान के बीच के अंतरों के वर्गों का वजनित योग होती हैं, जहां प्रत्येक मामले में वजन सीधे तौर पर उस x मान के लिए देखे गए y मानों की संख्या होती है।[1][2] क्योंकि लीस्ट स्क्वेयर्स रीग्रेशन की गुणधर्म है कि "पक्की त्रुटियों" के घटक और लैक ऑफ़ फिट के घटक आपस में लंबक अंग होते हैं, इसलिए निम्नलिखित समानता होती है:

इसलिए वर्गों का शेष योग पूरी प्रकार से दो घटकों में विघटित हो गया है।

गणितीय विवरण

भविष्यवक्ता चर के साथ रेखा फिट करने पर विचार करें। n अलग-अलग x मानों के प्रति सूचकांक के रूप में i को परिभाषित करें, दिए गए x मान के लिए प्रतिक्रिया चर अवलोकनों के लिए सूचकांक के रूप में j को परिभाषित करें, और i th x मान के साथ जुड़े y मानों की संख्या को ni के रूप में परिभाषित करें। प्रत्येक प्रतिक्रिया चर अवलोकन के मान को निम्न रूप में प्रदर्शित किया जा सकता है:

यहां,

अवर्जित पैरामीटर एल्फा और बीटा के लिए न्यूनतम वर्गों के अनुमान हैं, जो x i और Y i j के देखे गए मानों पर आधारित हैं।

यहां,

प्रतिक्रिया चर के मान हैं। इसके बाद,

आँकड़ों में त्रुटियाँ और अवशेष हैं, जो त्रुटि परिमाण εij के अनुमान के रूप में देखे गए मान होती हैं। न्यूनतम वर्गों के विधि के स्वरूप के कारण, पूरे वेक्टर त्रुटियों को देखा जा सकता है, जिनमें सम्मिलित है

स्केलर घटक होते हैं, आवश्यक रूप से दो सीमाएँ पूरी करते हैं

इस प्रकार यह 'R' के (N − 2)-आयामी उप-स्थान में स्थित होने के लिए बाध्य है। N, अर्थात त्रुटि के लिए स्वतंत्रता की N -2 डिग्री (आंकड़े) हैं।

अब यहां,

i th , x मान के संबंधित सभी Y मानों का औसत है।.

हम त्रुटि के वारियंस के योग को दो घटकों में विभाजित करते हैं।


संभाव्यता वितरण

वर्गों का योग

यदि त्रिज्या मॉडल सही है, तो यद्यपि त्रुटि चर ε i j यांत्रिकी हैं और उम्मीदवार वास्तविकता 0 और विचलन σ2 के साथ सांख्यिकीय स्वतंत्रता और सामान्य वितरण होती हैं तब हम x i को यांत्रिक मान के बजाय स्थिर मान के रूप में लेते हैं। फिर प्रतिक्रिया मात्राएं Y i j केवल इसलिए यांत्रिक होती हैं क्योंकि त्रुटियाँ ε i j यांत्रिक होती हैं।

यह सिद्ध हो सकता है कि यदि रैखिक मॉडल सही है, तो त्रुटि के कारण से होने वाले वर्ग का योग (त्रुटि वारियंस से भाग किया गया) निम्न रूप में लिखा जा सकता है:

स्वतंत्रता की N − 2 डिग्री के साथ ची-वर्ग वितरण होता है।

इसके अतिरिक्त, कुल अवलोकनों की कुल संख्या N, स्वतंत्र प्राधान्य में स्तरों की संख्या n, और मॉडल में पैरामीटरों की संख्या p दी गई होने के कारण:

  • शुद्ध त्रुटि के कारण वर्गों के योग को त्रुटि विचरण σ2 से विभाजित किया जाता है, स्वतंत्रता की N − n डिग्री के साथ ची-वर्ग वितरण होता है;
  • अपूर्णता के कारण वर्गों के योग को त्रुटि विचरण σ2 से विभाजित किया जाता है, इसमें स्वतंत्रता की n-p डिग्री के साथ ची-वर्ग वितरण है (यहां p=2 है रैखिक मॉडल में दो पैरामीटर होते हैं)।
  • दो वर्गों के बीच प्रायोगिकतापूर्णता का कोई संबंध नहीं होता है।

परीक्षण आँकड़ा

इसके बाद यह आंकड़े सामने आते हैं

यदि मॉडल सही है तो F-वितरण अग्रणीकारी और नामवारी गुणों के साथ देने वाले डिग्री में अस्थायीता के साथ होता है। यदि मॉडल गलत है, तो नियमितता की प्राप्ति की प्रायिकता वितरण अभी भी उपरोक्त ढंग से होती है, और प्राणांककारी और नामकारी अभी भी असंबंधित होते हैं। किन्तु अग्रणीकारी फ़ीच्योर अब गैर-केंद्रीय चाइ-स्क्वेयर्ड वितरण होती है, और इस प्रकार भाग गैर-केंद्रीय F-वितरण होता है।

इस F-परीक्षण का उपयोग इस प्राथमिकता-निराकरण हाइपोथेसिस का परीक्षण करने के लिए किया जाता है कि रैखिक मॉडल सही है। नॉन-सेंट्रल F-वितरण के कारण, यदि F-वैश्विक वितरण से यह व्यापकतापूर्ण रूप से बड़ा होता है, तो हम निराकरण हाइपोथेसिस को त्यागते हैं। महत्वपूर्ण मान का अर्थ सूचकांक वही होता है जो x बराबर होता है, जहां वांछित आत्मविश्वास स्तर के साथ F वितरण के कक्ष दिए गए हैं, और डिग्री नियामक d1 = (np) और d2 = (Nn) होते हैं।

त्रुटियों और स्वतंत्रता (संभावना सिद्धांत) के सामान्य वितरण की धारणाओं को यह दिखाया जा सकता है कि यह अभिकलन रूपी परीक्षण इस शून्य हाइपोथेसिस की व्यापारित्व-अनुपात परीक्षा है।

यह भी देखें

टिप्पणियाँ

  1. Brook, Richard J.; Arnold, Gregory C. (1985). अनुप्रयुक्त प्रतिगमन विश्लेषण और प्रायोगिक डिजाइन. CRC Press. pp. 48–49. ISBN 0824772520.
  2. Neter, John; Kutner, Michael H.; Nachstheim, Christopher J.; Wasserman, William (1996). अनुप्रयुक्त रैखिक सांख्यिकीय मॉडल (Fourth ed.). Chicago: Irwin. pp. 121–122. ISBN 0256117365.

[Category:Statistical hypothesis testi