स्वतंत्रता की डिग्री (सांख्यिकी): Difference between revisions

Revision as of 08:51, 17 May 2023

आंकड़ों में, स्वतंत्रता की डिग्री की संख्या आंकड़े की अंतिम गणना में मूल्यों की संख्या है जो अलग-अलग होने के लिए स्वतंत्र हैं।^[1]

सांख्यिकीय मापदंडों का आकलन सूचना या डेटा की विभिन्न मात्राओं पर आधारित हो सकता है। मापदण्ड के आकलन में जाने वाली जानकारी के स्वतंत्र टुकड़ों की संख्या को स्वतंत्रता की डिग्री कहा जाता है। सामान्यतः, मापदण्ड के आकलन की स्वतंत्रता की डिग्री स्वतंत्र बोध (संभावना) की संख्या के सामान होती है जो आकलन में जाती है,| मापदण्ड के आकलन में मध्यवर्ती चरणों के रूप में उपयोग किए जाने वाले मापदंडों की संख्या है। उदाहरण के लिए, यदि n स्वतंत्र स्कोर के यादृच्छिक प्रतिरूप से भिन्नता का आकलन लगाया जाना है, तो स्वतंत्रता की डिग्री स्वतंत्र स्कोर (n) की संख्या के सामान होती है, मध्यवर्ती चरणों के रूप में अनुमानित मापदण्ड की संख्या (, अर्थात्, प्रतिरूप माध्य) और इसलिए N − 1 के सामान है।^[2]

गणितीय रूप से, स्वतंत्रता की डिग्री यादृच्छिक सदिश के डोमेन के आयाम की संख्या है, या अनिवार्य रूप से मुक्त घटकों की संख्या (सदिश पूरी तरह से निर्धारित होने से पहले कितने घटकों को जानने की आवश्यकता है)।

शब्द का प्रयोग अधिकांशतः रैखिक मॉडल (रैखिक प्रतिगमन, भिन्नता का विश्लेषण) के संदर्भ में किया जाता है, जहां कुछ यादृच्छिक सदिश रैखिक उप-स्थानों में झूठ बोलने के लिए बाध्य होते हैं, और स्वतंत्रता की डिग्री की संख्या रैखिक उप-स्थान का आयाम है। स्वतंत्रता की डिग्री भी सामान्यतः ऐसे सदिशो की वर्ग लंबाई (या निर्देशांक के वर्गों का योग) और ची-स्क्वायर वितरण के मापदण्ड ची-स्क्वेर्ड और अन्य वितरणों से जुड़ी होती है जो संबद्ध सांख्यिकीय परीक्षण समस्याओं में उत्पन्न होती हैं।

जबकि परिचयात्मक पाठ्यपुस्तकें स्वतंत्रता की डिग्री को वितरण मापदंडों के रूप में या परिकल्पना परीक्षण के माध्यम से प्रस्तुत कर सकती हैं, यह अंतर्निहित ज्यामिति है जो स्वतंत्रता की डिग्री को परिभाषित करती है, और अवधारणा की उचित समझ के लिए महत्वपूर्ण है।

इतिहास

यद्यपि स्वतंत्रता की डिग्री की मूल अवधारणा को जर्मन खगोलशास्त्री और गणितज्ञ कार्ल फ्रेडरिक गॉस के काम में 1821 की प्रारंभ में मान्यता दी गई थी,|^[3] इसकी आधुनिक परिभाषा और उपयोग को पहली बार अंग्रेजी सांख्यिकीविद् विलियम सीली गॉसेट ने अपने 1908 के बॉयोमेट्रिक्स लेख द प्रोबेबल एरर ऑफ ए मीन में कलम नाम छात्र के अनुसार प्रकाशित किया था।^[4] जबकि गॉसेट ने वास्तव में 'डिग्री ऑफ फ्रीडम' शब्द का उपयोग नहीं किया था, उन्होंने इस अवधारणा को विकसित करने के समय समझाया जिसे छात्र के टी-वितरण के रूप में जाना जाता है। अंग्रेजी सांख्यिकीविद् और जीवविज्ञानी रोनाल्ड फिशर द्वारा इस शब्द को लोकप्रिय बनाया गया था, जिसकी प्रारंभ ची स्क्वायर पर उनके 1922 के काम से हुई थी।^[5]

टिप्पणी

समीकरणों में, स्वतंत्रता की डिग्री के लिए विशिष्ट प्रतीक ν (लोअरकेस नू (अक्षर)) है। पाठ और तालिकाओं में, संक्षिप्त नाम d.f. सामान्यतः प्रयोग किया जाता है। रोनाल्ड ए. फिशर आर. A. फिशर स्वतंत्रता की डिग्री का प्रतीक करने के लिए n का उपयोग करता है किन्तु आधुनिक उपयोग सामान्यतः प्रतिरूप आकार के लिए n आरक्षित करता है।

यादृच्छिक सदिश की ज्यामितीय रूप से, स्वतंत्रता की डिग्री की व्याख्या कुछ सदिश उपसमष्टि के आयाम के रूप में की जा सकती है। प्रारंभिक बिंदु के रूप में, मान लीजिए कि हमारे पास स्वतंत्र सामान्य रूप से वितरित अवलोकनों का प्रतिरूप है,

X_{1},\dots ,X_{n}.\,

इसे n-यादृच्छिक आयामी सदिश के रूप में दर्शाया जा सकता है:|

{\begin{pmatrix}X_{1}\\\vdots \\X_{n}\end{pmatrix}}.

चूँकि यह यादृच्छिक सदिश n-आयामी स्थान में कहीं भी स्थित हो सकता है, इसमें स्वतंत्रता की n कोटि होती है।

अब ${\bar {X}}$ कों प्रतिरूप माध्य होने दे। यादृच्छिक सदिश को प्रतिरूप माध्य के योग के साथ-साथ अवशेषों के सदिश के रूप में विघटित किया जा सकता है:

{\begin{pmatrix}X_{1}\\\vdots \\X_{n}\end{pmatrix}}={\bar {X}}{\begin{pmatrix}1\\\vdots \\1\end{pmatrix}}+{\begin{pmatrix}X_{1}-{\bar {X}}\\\vdots \\X_{n}-{\bar {X}}\end{pmatrix}}.

दायीं ओर का पहला सदिश 1 के सदिश का गुणक होने के लिए बाध्य है, और केवल मुक्त मात्रा ${\bar {X}}$ है . इसलिए इसमें 1 डिग्री की स्वतंत्रता है।

दूसरा सदिश संबंध ${\textstyle \sum _{i=1}^{n}(X_{i}-{\bar {X}})=0}$ .से बाध्य है | इस सदिश के पहले n−1 घटक कुछ भी हो सकते हैं। चूँकि, एक बार जब आप पहले n − 1 घटकों को जान जाते हैं, तो बाधा आपको nवें घटक का मान बताती है। इसलिए, इस सदिश के पास स्वतंत्रता की n − 1 कोटि है।

गणितीय रूप से, पहला सदिश 1 के सदिश द्वारा यूक्लिडियन उपक्षेत्र रैखिक अवधि पर डेटा सदिश का तिरछा प्रक्षेपण है। स्वतंत्रता की 1 डिग्री इस उप-स्थान का आयाम है। दूसरा अवशिष्ट सदिश इस उप-स्थान के (n − 1)-आयामी ऑर्थोगोनल पूरक पर सबसे कम-वर्ग प्रक्षेपण है, और इसमें n − 1 डिग्री की स्वतंत्रता है।

सांख्यिकीय परीक्षण अनुप्रयोगों में, अधिकांशतः किसी को सीधे घटक सदिश में रोचक नहीं होती है, किन्तु उपरोक्त उदाहरण में, उनकी लंबाई में वर्ग का अवशिष्ट योग है |

\sum _{i=1}^{n}(X_{i}-{\bar {X}})^{2}={\begin{Vmatrix}X_{1}-{\bar {X}}\\\vdots \\X_{n}-{\bar {X}}\end{Vmatrix}}^{2}.

यदि डेटा $X_{i}$ सामान्य रूप से माध्य 0 और प्रसरण $\sigma ^{2}$ के साथ वितरित किए जाते हैं , तब वर्गों के अवशिष्ट योग का स्केल किया हुआ ची-स्क्वेर्ड वितरण होता है (कारक $\sigma ^{2}$ द्वारा स्केल किया जाता है),साथ में n − 1 स्वतंत्रता की डिग्री है | डिग्रियों-ऑफ-फ्रीडम, यहां वितरण का मापदण्ड, अभी भी अंतर्निहित सदिश उप-स्थान के आयाम के रूप में व्याख्या किया जा सकता है।

इसी तरह, एक-प्रतिरूप t-परीक्षण आँकड़ा,है |

{\frac {{\sqrt {n}}({\bar {X}}-\mu _{0})}{\sqrt {\sum \limits _{i=1}^{n}(X_{i}-{\bar {X}})^{2}/(n-1)}}}

परिकल्पित माध्य $\mu _{0}$ सही होने पर स्वतंत्रता की n − 1 डिग्री के साथ छात्र के t वितरण का अनुसरण करता है। फिर से, प्रत्येक में अवशिष्ट सदिश से स्वतंत्रता की डिग्री उत्पन्न होती है।

संरचनात्मक समीकरण मॉडल

जब संरचनात्मक समीकरण मॉडल (एसईएम) के परिणाम प्रस्तुत किए जाते हैं, तो वे सामान्यतः समग्र मॉडल फिट के एक या अधिक सूचकांकों को सम्मिलित करते हैं, जिनमें से सबसे आम χ² आँकड़ा है। यह अन्य सूचकांकों के लिए आधार बनाता है जो सामान्यतः सूची किए जाते हैं। चूँकि यह ये अन्य आँकड़े हैं जिनकी सबसे अधिक व्याख्या की जाती है, χ² की स्वतंत्रता की डिग्री मॉडल फ़िट और साथ ही मॉडल की प्रकृति को समझने के लिए आवश्यक हैं।

एसईएम में स्वतंत्रता की डिग्री की गणना विश्लेषण में इनपुट के रूप में उपयोग की जाने वाली जानकारी के अनूठे टुकड़ों की संख्या के बीच अंतर के रूप में की जाती है, जिसे कभी-कभी ज्ञात कहा जाता है, और मापदण्ड की संख्या जो विशिष्ट रूप से अनुमानित होती है, कभी-कभी अज्ञात कहलाती है। उदाहरण के लिए, 4 के साथ -कारक पुष्टि कारक विश्लेषण में, 10 ज्ञात हैं (चार मदों और चार मद प्रसरणों के बीच छह अद्वितीय सहप्रसरण) और 8 अज्ञात (4 कारक भार और 4 त्रुटि प्रसरण) 2 डिग्री के लिए आज़ादी है। मॉडल फिट की समझ के लिए स्वतंत्रता की डिग्री महत्वपूर्ण हैं यदि इसके अतिरिक्त और कोई कारण नहीं है, तो बाकी सभी समान हैं, स्वतंत्रता की कम डिग्री, उत्तम सूचकांक जैसे कि χ² होगा।

यह दिखाया गया है कि स्वतंत्रता की डिग्री का उपयोग कागजात के पाठकों द्वारा किया जा सकता है जिसमें एसईएम सम्मिलित हैं यह निर्धारित करने के लिए कि क्या उन पत्रों के लेखक वास्तव में सही मॉडल फिट आंकड़ों की सूची कर रहे हैं। उदाहरण के लिए, संगठनात्मक विज्ञान में, शीर्ष पत्रिकाओं में प्रकाशित लगभग आधे पत्र स्वतंत्रता की डिग्री की सूची करते हैं जो उन पत्रों में वर्णित मॉडलों के साथ असंगत हैं, पाठक को आश्चर्य होता है कि वास्तव में कौन से मॉडल का परीक्षण किया गया था।^[6]

अवशेष

स्वतंत्रता की डिग्री के बारे में सोचने का सामान्य विधि जानकारी के एक और टुकड़े का आकलन लगाने के लिए उपलब्ध स्वतंत्र टुकड़ों की संख्या है। अधिक ठोस रूप से, स्वतंत्रता की डिग्री की संख्या डेटा के प्रतिरूप में स्वतंत्र टिप्पणियों की संख्या है जो उस जनसंख्या के मापदण्ड का आकलन लगाने के लिए उपलब्ध है जिससे वह प्रतिरूप तैयार किया गया है। उदाहरण के लिए, यदि हमारे पास दो प्रेक्षण हैं, तो माध्य की गणना करते समय हमारे पास दो स्वतंत्र प्रेक्षण होते हैं; चूँकि, प्रसरण की गणना करते समय, हमारे पास केवल स्वतंत्र अवलोकन होता है, क्योंकि दो अवलोकन प्रतिरूप माध्य से समान रूप से दूर होते हैं।

डेटा के लिए सांख्यिकीय मॉडल फिट करने में, अवशिष्ट के सदिश सदिश में घटकों की संख्या की तुलना में छोटे आयाम की जगह में झूठ बोलने के लिए बाध्य हैं। वह छोटा आयाम त्रुटि के लिए स्वतंत्रता की डिग्री की संख्या है, जिसे स्वतंत्रता की अवशिष्ट डिग्री भी कहा जाता है।

उदाहरण

संभवतः सबसे सरल उदाहरण यह मान लीजिए

X_{1},\dots ,X_{n}

यादृच्छिक चर हैं जिनमें से प्रत्येक अपेक्षित मूल्य μ और m माना

{\overline {X}}_{n}={\frac {X_{1}+\cdots +X_{n}}{n}}

प्रतिरूप माध्य हो फिर मात्राएँ |

X_{i}-{\overline {X}}_{n}

अवशिष्ट हैं जिन्हें त्रुटियों का आकलन सिद्धांत माना जा सकता है | X_i- μ। अवशिष्टों का योग (त्रुटियों के योग के विपरीत) आवश्यक रूप से 0 है। यदि कोई अवशिष्टों के किसी भी n − 1 का मान जानता है, तो वह इस प्रकार अंतिम का पता लगा सकता है। इसका कारण है कि वे आयाम n - 1 के स्थान पर रहने के लिए बाध्य हैं। एक कहता है कि त्रुटियों के लिए स्वतंत्रता की n - 1 डिग्री हैं।

उदाहरण जो केवल थोड़ा कम सरल है, मॉडल में ए और बी के कम से कम वर्गों का आकलन है |

Y_{i}=a+bx_{i}+e_{i}{\text{ for }}i=1,\dots ,n

जहाँ x_i दिया गया है किन्तु e_i और इसलिए y_i यादृच्छिक हैं। मान लें कि ${\widehat {a}}$ और ${\widehat {b}}$ a और b के न्यूनतम-वर्ग अनुमान हैं,|

{\widehat {e}}_{i}=y_{i}-({\widehat {a}}+{\widehat {b}}x_{i})

दो समीकरणों द्वारा परिभाषित स्थान के अन्दर रहने के लिए बाध्य हैं |

{\widehat {e}}_{1}+\cdots +{\widehat {e}}_{n}=0,

x_{1}{\widehat {e}}_{1}+\cdots +x_{n}{\widehat {e}}_{n}=0.

एक कहता है कि त्रुटि के लिए स्वतंत्रता की n−−2 डिग्री हैं।

सांकेतिक रूप से, कैपिटल लेटर Y का उपयोग मॉडल को निर्दिष्ट करने के लिए किया जाता है, जबकि रेजिडुअल्स की परिभाषा में लोअर-केस y; ऐसा इसलिए है क्योंकि पूर्व परिकल्पित यादृच्छिक चर हैं और बाद वाले वास्तविक डेटा हैं।

हम इसे कई प्रतिगमन के लिए सामान्यीकृत कर सकते हैं जिसमें p मापदण्ड और कोवरिएट्स सम्मिलित हैं (उदाहरण के लिए p − 1 भविष्यवक्ता और एक माध्य (= प्रतिगमन में अवरोधन)), इस स्थिति में फिट की स्वतंत्रता की डिग्री में लागत p है, n - p डिग्री छोड़कर त्रुटियों के लिए स्वतंत्रता का परिचालन होता है |

रैखिक मॉडल

उपरोक्त एक-प्रतिरूप समस्याओं के लिए टी और ची-वर्ग वितरण का प्रदर्शन सबसे सरल उदाहरण है जहां स्वतंत्रता की डिग्री उत्पन्न होती है। चूँकि, समान ज्यामिति और सदिश अपघटन रैखिक प्रतिगमन और प्रसरण के विश्लेषण सहित रैखिक मॉडल के सिद्धांत के बहुत से आधार हैं। तीन साधनों की तुलना के आधार पर स्पष्ट उदाहरण यहाँ प्रस्तुत किया गया है; रेखीय मॉडल की ज्यामिति पर क्रिस्टेंसेन (2002) द्वारा अधिक पूर्ण विस्तार से चर्चा की गई है।^[7]

मान लीजिए तीन आबादी $X_{1},\ldots ,X_{n}$ , $Y_{1},\ldots ,Y_{n}$ और $Z_{1},\ldots ,Z_{n}$ . के लिए स्वतंत्र अवलोकन किए जाते हैं, तीन समूहों और समान प्रतिरूप आकार पर प्रतिबंध अंकन को सरल करता है, किन्तु विचारों को आसानी से सामान्यीकृत किया जाता है। अवलोकन के रूप में विघटित किया जा सकता है |

{\begin{aligned}X_{i}&={\bar {M}}+({\bar {X}}-{\bar {M}})+(X_{i}-{\bar {X}})\\Y_{i}&={\bar {M}}+({\bar {Y}}-{\bar {M}})+(Y_{i}-{\bar {Y}})\\Z_{i}&={\bar {M}}+({\bar {Z}}-{\bar {M}})+(Z_{i}-{\bar {Z}})\end{aligned}}

जहाँ ${\bar {X}},{\bar {Y}},{\bar {Z}}$ व्यक्तिगत नमूनों के साधन हैं, और ${\bar {M}}=({\bar {X}}+{\bar {Y}}+{\bar {Z}})/3$ सभी 3n प्रेक्षणों का माध्य है। सदिश संकेतन में इस अपघटन को इस प्रकार लिखा जा सकता है |

{\begin{pmatrix}X_{1}\\\vdots \\X_{n}\\Y_{1}\\\vdots \\Y_{n}\\Z_{1}\\\vdots \\Z_{n}\end{pmatrix}}={\bar {M}}{\begin{pmatrix}1\\\vdots \\1\\1\\\vdots \\1\\1\\\vdots \\1\end{pmatrix}}+{\begin{pmatrix}{\bar {X}}-{\bar {M}}\\\vdots \\{\bar {X}}-{\bar {M}}\\{\bar {Y}}-{\bar {M}}\\\vdots \\{\bar {Y}}-{\bar {M}}\\{\bar {Z}}-{\bar {M}}\\\vdots \\{\bar {Z}}-{\bar {M}}\end{pmatrix}}+{\begin{pmatrix}X_{1}-{\bar {X}}\\\vdots \\X_{n}-{\bar {X}}\\Y_{1}-{\bar {Y}}\\\vdots \\Y_{n}-{\bar {Y}}\\Z_{1}-{\bar {Z}}\\\vdots \\Z_{n}-{\bar {Z}}\end{pmatrix}}.

बाईं ओर प्रेक्षण सदिश की स्वतंत्रता की कोटि 3n है। दायीं ओर पहले सदिश में समग्र माध्य के लिए एक डिग्री की स्वतंत्रता (या आयाम) है। दूसरा सदिश तीन यादृच्छिक चर ${\bar {X}}-{\bar {M}}$ , ${\bar {Y}}-{\bar {M}}$ और ${\overline {Z}}-{\overline {M}}$ . पर निर्भर करता है। चूँकि, इनका योग 0 होना चाहिए और इसलिए सदिश को बाध्य किया जाता है इसलिए इसे 2-आयामी उप-स्थान में होना चाहिए, और इसमें 2 डिग्री की स्वतंत्रता होनी चाहिए। शेष 3n − 3 स्वतंत्रता की डिग्री अवशिष्ट सदिश में हैं (प्रत्येक आबादी के भीतर स्वतंत्रता की n − 1 डिग्री से बना) है।

प्रसरण के विश्लेषण (एनोवा)

सांख्यिकीय परीक्षण समस्याओं में, सामान्यतः घटक सदिश में रुचि नहीं होती है, किन्तु उनकी वर्ग लंबाई, या वर्गों के योग में होती है। वर्गों के योग से जुड़ी स्वतंत्रता की डिग्री संबंधित घटक सदिश की स्वतंत्रता की डिग्री है।

उपरोक्त तीन-जनसंख्या का उदाहरण वन-वे एनोवा वन-वे एनालिसिस ऑफ़ वेरिएंस का उदाहरण है। मॉडल, या उपचार, वर्गों का योग दूसरे सदिश की वर्ग लंबाई है,|

{\text{SST}}=n({\bar {X}}-{\bar {M}})^{2}+n({\bar {Y}}-{\bar {M}})^{2}+n({\bar {Z}}-{\bar {M}})^{2}

स्वतंत्रता की 2 डिग्री के साथ अवशिष्ट या त्रुटि योग-वर्ग है

{\text{SSE}}=\sum _{i=1}^{n}(X_{i}-{\bar {X}})^{2}+\sum _{i=1}^{n}(Y_{i}-{\bar {Y}})^{2}+\sum _{i=1}^{n}(Z_{i}-{\bar {Z}})^{2}

3(n−1) स्वतंत्रता की डिग्री के साथ एनोवा पर परिचयात्मक पुस्तकें सामान्यतः सदिश दिखाए बिना सूत्र बताती हैं, किन्तु यह अंतर्निहित ज्यामिति है जो एसएस सूत्रों को जन्म देती है, और दिखाती है कि किसी भी स्थिति में स्वतंत्रता की डिग्री को स्पष्ट रूप से कैसे निर्धारित किया जाए।

आबादी के साधनों के बीच कोई अंतर नहीं होने की शून्य परिकल्पना के अनुसार (और यह मानकर कि मानक एनोवा नियमितता धारणाएं संतुष्ट हैं) वर्गों की रकम ने ची-स्क्वायर वितरण को स्वतंत्रता की इसी डिग्री के साथ बढ़ाया है। स्वतंत्रता की डिग्री द्वारा स्केल करने के बाद एफ-परीक्षण आंकड़ा अनुपात है। यदि जनसंख्या के बीच कोई अंतर नहीं है, तो इसका कारण है कि यह अनुपात F-वितरण के बाद 2 और 3n − 3 स्वतंत्रता की डिग्री का अनुसरण करता है।

कुछ जटिल सेटिंग्स में, जैसे कि असंतुलित विभाजन की साजिश रचना, सम-ऑफ-स्क्वायर में अब ची-स्क्वायर वितरण को स्केल नहीं किया जाता है। वर्गों के योग की स्वतंत्रता की डिग्री के साथ तुलना अब अर्थपूर्ण नहीं है, और सॉफ्टवेयर इन स्थितियों में कुछ आंशिक 'स्वतंत्रता की डिग्री' की सूची कर सकता है। इस तरह की संख्याओं की कोई वास्तविक डिग्री-ऑफ़-फ्रीडम व्याख्या नहीं होती है, किन्तु ये संबंधित योग-वर्गों के लिए केवल अनुमानित ची-स्क्वायर वितरण प्रदान करते हैं। ऐसे अनुमानों का विवरण इस पृष्ठ के दायरे से बाहर है।

संभाव्यता वितरण

कई सामान्यतः सामना किए जाने वाले सांख्यिकीय वितरण (छात्र का टी वितरण छात्र का टी, ची-स्क्वेर्ड वितरण | ची-स्क्वेर्ड, एफ-वितरण) में ऐसे मापदण्ड होते हैं जिन्हें सामान्यतः स्वतंत्रता की डिग्री के रूप में संदर्भित किया जाता है। यह शब्दावली केवल यह दर्शाती है कि कई अनुप्रयोगों में जहां ये वितरण होते हैं, मापदण्ड अंतर्निहित यादृच्छिक सदिश की स्वतंत्रता की डिग्री के अनुरूप होता है, जैसा कि पिछले एनोवा उदाहरण में है। एक और सरल उदाहरण है: यदि $X_{i};i=1,\ldots ,n$ स्वतंत्र सामान्य हैं $(\mu ,\sigma ^{2})$ यादृच्छिक चर, आँकड़ा है |

{\frac {\sum _{i=1}^{n}(X_{i}-{\bar {X}})^{2}}{\sigma ^{2}}}

स्वतंत्रता की n − 1 डिग्री के साथ ची-स्क्वायर वितरण का अनुसरण करता है। यहां, स्वतंत्रता की डिग्री अंश में अवशिष्ट योग-वर्ग से उत्पन्न होती है, और बदले में अंतर्निहित अवशिष्ट सदिश $\{X_{i}-{\bar {X}}\}$ की स्वतंत्रता की n−1 डिग्री होती है .

रैखिक मॉडल के लिए इन वितरणों के अनुप्रयोग में, स्वतंत्रता मापदंडों की डिग्री केवल पूर्णांक मान ले सकती है। वितरण के अंतर्निहित परिवार डिग्री-ऑफ-फ्रीडम मापदण्ड के लिए आंशिक मूल्यों की अनुमति देते हैं, जो अधिक परिष्कृत उपयोगों में उत्पन्न हो सकते हैं। उदाहरणों का एक समुच्चय ऐसी समस्याएँ हैं जहाँ स्वतंत्रता की प्रभावी डिग्री के आधार पर ची-स्क्वायर सन्निकटन का उपयोग किया जाता है। अन्य अनुप्रयोगों में, भारी पूंछ वितरण मॉडलिंग हैवी-टेल डेटा, टी या एफ-डिस्ट्रीब्यूशन को अनुभवजन्य मॉडल के रूप में उपयोग किया जा सकता है। इन स्थितियों में, वितरण मापदंडों के लिए स्वतंत्रता की कोई विशेष डिग्री नहीं है, तथापि शब्दावली का उपयोग जारी रहे हो।

गैर-मानक प्रतिगमन

कई गैर-मानक प्रतिगमन विधियाँ, जिनमें नियमित न्यूनतम वर्ग (जैसे, रिज प्रतिगमन), स्मूथिंग लीनियर स्मूथर्स, चौरसाई स्प्लिन, और सेमीपैरामेट्रिक प्रतिगमन सम्मिलित हैं, सामान्य कम से कम वर्गों के अनुमानों पर आधारित नहीं हैं, किन्तु नियमितीकरण (गणित) (सामान्यीकृत न्यूनतम वर्ग और) पर आधारित हैं। कम से कम वर्ग, और इसलिए आयाम के संदर्भ में परिभाषित स्वतंत्रता की डिग्री सामान्यतः इन प्रक्रियाओं के लिए उपयोगी नहीं होती है। चूँकि, ये प्रक्रियाएँ अभी भी टिप्पणियों में रैखिक हैं, और प्रतिगमन के फिट किए गए मूल्यों को रूप में व्यक्त किया जा सकता है

{\hat {y}}=Hy,

जहाँ ${\hat {y}}$ फिट किए गए मॉडल y से प्रत्येक मूल सहसंयोजक मूल्यों पर फिट किए गए मूल्यों का सदिश है, प्रतिक्रियाओं का मूल सदिश है, और H आवरण आव्यूह या अधिक सामान्यतः, चिकनी आव्यूह है।

सांख्यिकीय आकलन के लिए, वर्गों का योग अभी भी बनाया जा सकता है: वर्गों का योग मॉडल है $\|Hy\|^{2}$ ; अवशिष्ट योग-का $\|y-Hy\|^{2}$ वर्ग है . चूँकि, क्योंकि H सामान्य न्यूनतम-स्क्वायर फिट के अनुरूप नहीं है (अर्थात ऑर्थोगोनल प्रक्षेपण नहीं है), इन योगों के वर्गों में अब (स्केल्ड, गैर-केंद्रीय) ची-स्क्वायर वितरण और आयामी रूप से परिभाषित डिग्री नहीं हैं। स्वतंत्रता उपयोगी नहीं है।

फिट की स्वतंत्रता की प्रभावी डिग्री को फिट-ऑफ-फिट परीक्षण, क्रॉस-सत्यापन (सांख्यिकी) और अन्य सांख्यिकीय अनुमान प्रक्रियाओं को प्रयुक्त करने के विभिन्न विधियों से परिभाषित किया जा सकता है। यहां कोई प्रतिगमन प्रभावी स्वतंत्रता की डिग्री और स्वतंत्रता की अवशिष्ट प्रभावी डिग्री के बीच अंतर कर सकता है।

स्वतंत्रता की प्रतिगमन प्रभावी डिग्री

प्रतिगमन प्रभावी स्वतंत्रता की डिग्री के लिए, उपयुक्त परिभाषाओं में हैट आव्यूह का निशान (रैखिक बीजगणित) सम्मिलित हो सकता है,^[8] tr(H), हैट आव्यूह के द्विघात रूप का निशान, tr(H'H), फॉर्म tr(2H - HH'), या वेल्च-सैटरथवेट समीकरण, tr(H'H)²/tr(H'HH'H).^[9] रेखीय प्रतिगमन के स्थिति में, हैट आव्यूह H है X(X 'X)⁻¹X ', और ये सभी परिभाषाएं स्वतंत्रता की सामान्य डिग्री तक कम हो जाती हैं।

\operatorname {tr} (H)=\sum _{i}h_{ii}=\sum _{i}{\frac {\partial {\hat {y}}_{i}}{\partial y_{i}}},

रैखिक मॉडल में स्वतंत्रता की प्रतिगमन (अवशिष्ट नहीं) डिग्री देखी गई प्रतिक्रिया मूल्यों के संबंध में फिट किए गए मूल्यों की संवेदनशीलता का योग है,^[10] अर्थात उत्तोलन स्कोर का योग है।

इसकी संकल्पना करने में सहायता करने की विधि डेटा ध्वनि को कम करने के लिए उपयोग किए जाने वाले गौस्सियन धुंधलापन जैसे सरल स्मूथिंग आव्यूह पर विचार करना है। साधारण रेखीय या बहुपद फिट के विपरीत, चौरसाई समारोह की स्वतंत्रता की प्रभावी डिग्री की गणना सीधे-आगे नहीं होती है। इन स्थितियों में, द्वारा अनुमत स्वतंत्रता की डिग्री का आकलन लगाना महत्वपूर्ण है $H$ आव्यूह जिससे स्वतंत्रता की अवशिष्ट डिग्री का उपयोग सांख्यिकीय परीक्षणों जैसे $\chi ^{2}$ आकलन लगाने के लिए किया जा सकता है |

स्वतंत्रता की अवशिष्ट प्रभावी डिग्री

अवशिष्ट प्रभावी डिग्री-ऑफ़-फ़्रीडम (redf) की संबंधित परिभाषाएँ हैं, जिनमें H को I − H से प्रतिस्थापित किया गया है। उदाहरण के लिए, यदि लक्ष्य त्रुटि प्रसरण का आकलन लगाना है, तो redf को tr((I − H)'(I - H ) और निष्पक्ष आकलन है (के साथ ${\hat {r}}=y-Hy$ ), के रूप में परिभाषित किया जाएगा |

{\hat {\sigma }}^{2}={\frac {\|{\hat {r}}\|^{2}}{\operatorname {tr} \left((I-H)'(I-H)\right)}},

या:^[11]^[12]^[13]^[14]

{\hat {\sigma }}^{2}={\frac {\|{\hat {r}}\|^{2}}{n-\operatorname {tr} (2H-HH')}}={\frac {\|{\hat {r}}\|^{2}}{n-2\operatorname {tr} (H)+\operatorname {tr} (HH')}}

{\hat {\sigma }}^{2}\approx {\frac {\|{\hat {r}}\|^{2}}{n-1.25\operatorname {tr} (H)+0.5}}.

ऊपर अंतिम सन्निकटन ^[12] कम्प्यूटेशनल लागत को O(n²) से केवल O(n). कर देता है | सामान्यतः अंश कम किया जा रहा उद्देश्य कार्य होगा; उदाहरण के लिए, यदि हैट आव्यूह में अवलोकन सहप्रसरण आव्यूह, Σ सम्मिलित है, तो $\|{\hat {r}}\|^{2}$ ${\hat {r}}'\Sigma ^{-1}{\hat {r}}$ बन जाता है |

सामान्य

ध्यान दें कि मूल स्थिति के विपरीत, स्वतंत्रता की गैर-पूर्णांक डिग्री की अनुमति है, चूँकि मान सामान्यतः अभी भी 0 और n के बीच सीमित होना चाहिए।^[15]

उदाहरण के रूप में, k-निकटतम एल्गोरिथ्म पर विचार करें, जो दिए गए बिंदु पर k के निकटतम मापा मूल्यों का औसत है। फिर, n मापे गए बिंदुओं में से प्रत्येक पर, अनुमानित मान बनाने वाले रैखिक संयोजन पर मूल मान का भार केवल 1/k है। इस प्रकार, हैट आव्यूह का पता n/k है। इस प्रकार सहज लागत n/k स्वतंत्रता की प्रभावी डिग्री है।

अन्य उदाहरण के रूप में, लगभग दोहराई गई टिप्पणियों के अस्तित्व पर विचार करें। मौलिक सूत्र, n-p के सरल अनुप्रयोग, अवशिष्ट स्वतंत्रता की डिग्री के अति-आकलन को जन्म देंगे, जैसे कि प्रत्येक अवलोकन स्वतंत्र थे। अधिक वास्तविक रूप से, चूँकि, आवरण आव्यूह H = X(X ' Σ⁻¹ X)⁻¹X ' Σ⁻¹ में अवलोकन सहप्रसरण आव्यूह Σ सम्मिलित होगा जो टिप्पणियों के बीच गैर-शून्य सहसंबंध को दर्शाता है।

स्वतंत्रता की प्रभावी डिग्री के अधिक सामान्य सूत्रीकरण के परिणामस्वरूप अधिक यथार्थवादी आकलन होगा, उदाहरण के लिए, त्रुटि प्रसरण σ², जो अपनी बारी में अज्ञात मापदंडो के पश्चवर्ती मानक विचलन को मापता है; स्वतंत्रता की डिग्री किसी दिए गए आत्मविश्वास स्तर के लिए त्रुटि दीर्घवृत्त उत्पन्न करने के लिए आवश्यक विस्तार कारक को भी प्रभावित करेगी।

अन्य फॉर्मूलेशन

इसी तरह की अवधारणाएं गैर-पैरामीट्रिक प्रतिगमन में स्वतंत्रता की समतुल्य डिग्री हैं,^[16] वायुमंडलीय अध्ययन में संकेत की स्वतंत्रता की डिग्री,^[17]^[18] और भूगणित में स्वतंत्रता की गैर-पूर्णांक डिग्री है।^[19]^[20]

अवशिष्ट योग-का-वर्ग $\|y-Hy\|^{2}$ सामान्यीकृत ची-वर्ग वितरण है, और इस वितरण से जुड़ा सिद्धांत है ^[21] ऊपर दिए गए उत्तरों के लिए वैकल्पिक मार्ग प्रदान करता है।

यह भी देखें

बेसेल का सुधार
ची-वर्ग प्रति स्वतंत्रता की डिग्री
स्वतंत्रता की जमा डिग्री
प्रतिकृति (सांख्यिकी)
प्रतिरूप का आकार
सांख्यिकीय मॉडल
प्रसरण

संदर्भ

↑ "स्वतंत्रता की कोटियां". Glossary of Statistical Terms. Animated Software. Retrieved 2008-08-21.
↑ Lane, David M. "स्वतंत्रता की कोटियां". HyperStat Online. Statistics Solutions. Retrieved 2008-08-21.
↑ Walker, H. M. (April 1940). "स्वतंत्रता की कोटियां" (PDF). Journal of Educational Psychology. 31 (4): 253–269. doi:10.1037/h0054588.
↑ Student (March 1908). "माध्य की संभावित त्रुटि". Biometrika. 6 (1): 1–25. doi:10.2307/2331554. JSTOR 2331554.
↑ Fisher, R. A. (January 1922). "On the Interpretation of χ2 from Contingency Tables, and the Calculation of P". Journal of the Royal Statistical Society. 85 (1): 87–94. doi:10.2307/2340521. JSTOR 2340521.
↑ Cortina, J. M., Green, J. P., Keeler, K. R., & Vandenberg, R. J. (2017). Degrees of freedom in SEM: Are we testing the models that we claim to test?. Organizational Research Methods, 20(3), 350-378.
↑ Christensen, Ronald (2002). Plane Answers to Complex Questions: The Theory of Linear Models (Third ed.). New York: Springer. ISBN 0-387-95361-2.
↑ Trevor Hastie, Robert Tibshirani, Jerome H. Friedman (2009), The elements of statistical learning: data mining, inference, and prediction, 2nd ed., 746 p. ISBN 978-0-387-84857-0, doi:10.1007/978-0-387-84858-7, [1] (eq.(5.16))
↑ Fox, J.; Sage Publications, inc; SAGE. (2000). Nonparametric Simple Regression: Smoothing Scatterplots. Nonparametric Simple Regression: Smoothing Scatterplots. SAGE Publications. p. 58. ISBN 978-0-7619-1585-0. Retrieved 2020-08-28. {{cite book}}: |first2= has generic name (help)
↑ Ye, J. (1998), "On Measuring and Correcting the Effects of Data Mining and Model Selection", Journal of the American Statistical Association, 93 (441), 120–131. JSTOR 2669609 (eq.(7))
↑ Clive Loader (1999), Local regression and likelihood, ISBN 978-0-387-98775-0, doi:10.1007/b98858, (eq.(2.18), p. 30)
↑ ^12.0 ^12.1 Trevor Hastie, Robert Tibshirani (1990), Generalized additive models, CRC Press, (p. 54) and (eq.(B.1), p. 305))
↑ Simon N. Wood (2006), Generalized additive models: an introduction with R, CRC Press, (eq.(4,14), p. 172)
↑ David Ruppert, M. P. Wand, R. J. Carroll (2003), Semiparametric Regression, Cambridge University Press (eq.(3.28), p. 82)
↑ James S. Hodges (2014) Richly Parameterized Linear Models, CRC Press. [2]
↑ Peter J. Green, B. W. Silverman (1994), Nonparametric regression and generalized linear models: a roughness penalty approach, CRC Press (eq.(3.15), p. 37)
↑ Clive D. Rodgers (2000), Inverse methods for atmospheric sounding: theory and practice, World Scientific (eq.(2.56), p. 31)
↑ Adrian Doicu, Thomas Trautmann, Franz Schreier (2010), Numerical Regularization for Atmospheric Inverse Problems, Springer (eq.(4.26), p. 114)
↑ D. Dong, T. A. Herring and R. W. King (1997), Estimating regional deformation from a combination of space and terrestrial geodetic data, J. Geodesy, 72 (4), 200–214, doi:10.1007/s001900050161 (eq.(27), p. 205)
↑ H. Theil (1963), "On the Use of Incomplete Prior Information in Regression Analysis", Journal of the American Statistical Association, 58 (302), 401–414 JSTOR 2283275 (eq.(5.19)–(5.20))
↑ Jones, D.A. (1983) "Statistical analysis of empirical models fitted by optimisation", Biometrika, 70 (1), 67–88

अग्रिम पठन

Bowers, David (1982). Statistics for Economists. London: Macmillan. pp. 175–178. ISBN 0-333-30110-2.
Eisenhauer, J. G. (2008). "Degrees of Freedom". Teaching Statistics. 30 (3): 75–78. doi:10.1111/j.1467-9639.2008.00324.x. S2CID 121982952.
Good, I. J. (1973). "What Are Degrees of Freedom?". The American Statistician. 27 (5): 227–228. doi:10.1080/00031305.1973.10479042. JSTOR 3087407.
Walker, H. W. (1940). "Degrees of Freedom". Journal of Educational Psychology. 31 (4): 253–269. doi:10.1037/h0054588. Transcription by C Olsen with errata

बाहरी संबंध

Yu, Chong-ho (1997) Illustrating degrees of freedom in terms of sample size and dimensionality
Dallal, GE. (2003) Degrees of Freedom

[1] "स्वतंत्रता की कोटियां". Glossary of Statistical Terms. Animated Software. Retrieved 2008-08-21.

[2] Lane, David M. "स्वतंत्रता की कोटियां". HyperStat Online. Statistics Solutions. Retrieved 2008-08-21.

[3] Walker, H. M. (April 1940). "स्वतंत्रता की कोटियां" (PDF). Journal of Educational Psychology. 31 (4): 253–269. doi:10.1037/h0054588.

[4] Student (March 1908). "माध्य की संभावित त्रुटि". Biometrika. 6 (1): 1–25. doi:10.2307/2331554. JSTOR 2331554.

[5] Fisher, R. A. (January 1922). "On the Interpretation of χ2 from Contingency Tables, and the Calculation of P". Journal of the Royal Statistical Society. 85 (1): 87–94. doi:10.2307/2340521. JSTOR 2340521.

[6] Cortina, J. M., Green, J. P., Keeler, K. R., & Vandenberg, R. J. (2017). Degrees of freedom in SEM: Are we testing the models that we claim to test?. Organizational Research Methods, 20(3), 350-378.

[7] Christensen, Ronald (2002). Plane Answers to Complex Questions: The Theory of Linear Models (Third ed.). New York: Springer. ISBN 0-387-95361-2.

[8] Trevor Hastie, Robert Tibshirani, Jerome H. Friedman (2009), The elements of statistical learning: data mining, inference, and prediction, 2nd ed., 746 p. ISBN 978-0-387-84857-0, doi:10.1007/978-0-387-84858-7, [1] (eq.(5.16))

[Fox_Sage_Publications_SAGE._2000_p._58-9] Fox, J.; Sage Publications, inc; SAGE. (2000). Nonparametric Simple Regression: Smoothing Scatterplots. Nonparametric Simple Regression: Smoothing Scatterplots. SAGE Publications. p. 58. ISBN 978-0-7619-1585-0. Retrieved 2020-08-28. {{cite book}}: |first2= has generic name (help)

[10] Ye, J. (1998), "On Measuring and Correcting the Effects of Data Mining and Model Selection", Journal of the American Statistical Association, 93 (441), 120–131. JSTOR 2669609 (eq.(7))

[11] Clive Loader (1999), Local regression and likelihood, ISBN 978-0-387-98775-0, doi:10.1007/b98858, (eq.(2.18), p. 30)

[Hastie1990-12] 12.0 ^12.1 Trevor Hastie, Robert Tibshirani (1990), Generalized additive models, CRC Press, (p. 54) and (eq.(B.1), p. 305))

[Wood2006-13] Simon N. Wood (2006), Generalized additive models: an introduction with R, CRC Press, (eq.(4,14), p. 172)

[14] David Ruppert, M. P. Wand, R. J. Carroll (2003), Semiparametric Regression, Cambridge University Press (eq.(3.28), p. 82)

[15] James S. Hodges (2014) Richly Parameterized Linear Models, CRC Press. [2]

[16] Peter J. Green, B. W. Silverman (1994), Nonparametric regression and generalized linear models: a roughness penalty approach, CRC Press (eq.(3.15), p. 37)

[17] Clive D. Rodgers (2000), Inverse methods for atmospheric sounding: theory and practice, World Scientific (eq.(2.56), p. 31)

[18] Adrian Doicu, Thomas Trautmann, Franz Schreier (2010), Numerical Regularization for Atmospheric Inverse Problems, Springer (eq.(4.26), p. 114)

[19] D. Dong, T. A. Herring and R. W. King (1997), Estimating regional deformation from a combination of space and terrestrial geodetic data, J. Geodesy, 72 (4), 200–214, doi:10.1007/s001900050161 (eq.(27), p. 205)

[20] H. Theil (1963), "On the Use of Incomplete Prior Information in Regression Analysis", Journal of the American Statistical Association, 58 (302), 401–414 JSTOR 2283275 (eq.(5.19)–(5.20))

[Jones1-21] Jones, D.A. (1983) "Statistical analysis of empirical models fitted by optimisation", Biometrika, 70 (1), 67–88

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

Anonymous

Search

स्वतंत्रता की डिग्री (सांख्यिकी): Difference between revisions

Namespaces

More

Page actions

Revision as of 08:51, 17 May 2023

Contents

इतिहास

टिप्पणी