जैकनाइफ क्रॉस-वैलिडेशन: Difference between revisions

From Vigyanwiki
(text)
No edit summary
 
(9 intermediate revisions by 3 users not shown)
Line 2: Line 2:
आँकड़ों में, जैकनाइफ़ (जैकनाइफ़ अंतः वैधीकरण) एक अंतः वैधीकरण तकनीक है और इसलिए, यह पुनः प्रतिचयन का एक रूप है।
आँकड़ों में, जैकनाइफ़ (जैकनाइफ़ अंतः वैधीकरण) एक अंतः वैधीकरण तकनीक है और इसलिए, यह पुनः प्रतिचयन का एक रूप है।


यह पूर्वाग्रह और भिन्नता आकलन के लिए विशेष रूप से उपयोगी है। जैकनाइफ़ [[बूटस्ट्रैप (सांख्यिकी)]] जैसी अन्य सामान्य पुन: प्रतिचयन विधियों को पूर्व-दिनांकित करता है। आकार n के एक प्रतिरूप को देखते हुए, एक अवलोकन को छोड़कर प्राप्त आकार (n-1) के प्रत्येक उप-प्रतिरूप से मापदण्ड प्राक्कलन को एकत्रित करके एक जैकनाइफ प्राक्कलक बनाया जा सकता है। {{sfn|Efron|1982|p=2}}
यह पूर्वाग्रह और प्रसरण परिमापन के लिए विशेष रूप से उपयोगी है। जैकनाइफ़ [[बूटस्ट्रैप (सांख्यिकी)]] जैसी अन्य सामान्य पुन: प्रतिचयन विधियों को पूर्व-दिनांकित करता है। आकार n के एक प्रतिरूप को देखते हुए, एक अवलोकन को छोड़कर प्राप्त आकार (n-1) के प्रत्येक उप-प्रतिरूप से मापदण्ड परिमापन को एकत्रित करके एक जैकनाइफ परिमापनक बनाया जा सकता है। {{sfn|Efron|1982|p=2}}


जैकनाइफ तकनीक को मौरिस क्वेनोइल (1924-1973) द्वारा 1949 में विकसित किया गया था और 1956 में परिष्कृत किया गया था।[[ जॉन तुकी | जॉन तुकी]] ने 1958 में इस तकनीक का विस्तार किया और "जैकनाइफ" नाम प्रस्तावित किया, क्योंकि एक भौतिक जैक-नाइफ (एक कॉम्पैक्ट फोल्डिंग चाकू) की तरह, यह एक काम चलाऊ उपकरण है जो विभिन्न प्रकार की समस्याओं के लिए भी समाधान निकाल सकता है। हालाँकि उद्देश्य-डिज़ाइन किए गए उपकरण से विशिष्ट समस्याओं को अधिक निपूणता से हल किया जा सकता है। {{sfn|Cameron|Trivedi|2005|p=375}}
जैकनाइफ तकनीक को मौरिस क्वेनोइल (1924-1973) द्वारा 1949 में विकसित किया गया था और 1956 में परिष्कृत किया गया था।[[ जॉन तुकी | जॉन तुकी]] ने 1958 में इस तकनीक का विस्तार किया और "जैकनाइफ" नाम प्रस्तावित किया, क्योंकि एक भौतिक जैक-नाइफ (एक सघन वलन चाकू) की तरह, यह एक काम चलाऊ उपकरण है जो विभिन्न प्रकार की समस्याओं के लिए भी समाधान निकाल सकता है। हालाँकि उद्देश्य-प्रतिरूप किए गए उपकरण से विशिष्ट समस्याओं को अधिक निपूणता से हल किया जा सकता है। {{sfn|Cameron|Trivedi|2005|p=375}}


जैकनाइफ़ बूटस्ट्रैप (सांख्यिकी) का '''एक रैखिक सादृश्य है।''' {{sfn|Cameron|Trivedi|2005|p=375}}
जैकनाइफ़ बूटस्ट्रैप (सांख्यिकी) का एक रैखिक सादृश्य है। {{sfn|Cameron|Trivedi|2005|p=375}}


==एक सरल उदाहरण: माध्य अनुमान==
==एक सरल उदाहरण: माध्य परिमापन==
एक पैरामीटर का जैकनाइफ़ अनुमानक एक डेटासेट से प्रत्येक अवलोकन को व्यवस्थित रूप से छोड़कर और शेष अवलोकनों पर पैरामीटर अनुमान की गणना करके और फिर इन गणनाओं को एकत्रित करके पाया जाता है।
एक मापदण्ड का जैकनाइफ परिमापनक एक आंकड़े समुच्चय से प्रत्येक अवलोकन को व्यवस्थित रूप से छोड़कर और शेष अवलोकनों पर मापदण्ड परिमापन की गणना करके और फिर इन गणनाओं को एकत्रित करके पाया जाता है।


उदाहरण के लिए, यदि अनुमान लगाया जाने वाला पैरामीटर यादृच्छिक चर का जनसंख्या माध्य है<math>x</math>, फिर आई.आई.डी. के दिए गए सेट के लिए टिप्पणियों <math>x_1, ..., x_n</math> प्राकृतिक अनुमानक नमूना माध्य है:
उदाहरण के लिए, यदि परिमापन लगाया जाने वाला मापदण्ड यादृच्छिक चर x का जनसंख्या माध्य है, फिर आई.आई.डी. के दिए गए समुच्चय के लिए प्रेक्षण <math>x_1, ..., x_n</math> प्राकृतिक परिमापनक प्रतिरूप माध्य है:


:<math>\bar{x} =\frac{1}{n} \sum_{i=1}^{n} x_i =\frac{1}{n} \sum_{i \in [n]} x_i,</math>
:<math>\bar{x} =\frac{1}{n} \sum_{i=1}^{n} x_i =\frac{1}{n} \sum_{i \in [n]} x_i,</math>
जहां अंतिम योग सूचकांक को इंगित करने के लिए दूसरे तरीके का उपयोग करता है <math>i</math> सेट पर दौड़ता है <math>[n] = \{ 1,\ldots,n\}</math>.
जहां अंतिम योग यह इंगित करने के लिए अन्य तरीके का उपयोग करता है कि सूचकांक i <math>[n] = \{ 1,\ldots,n\}</math> समुच्चय पर चलता है।


फिर हम इस प्रकार आगे बढ़ते हैं: प्रत्येक के लिए <math>i \in [n]</math> हम माध्य की गणना करते हैं <math>\bar{x}_{(i)}</math> जैकनाइफ़ उपनमूना में के अलावा सभी शामिल हैं<math>i</math>-वां डेटा बिंदु, और इसे कहा जाता है <math>i</math>-वें जैकनाइफ़ प्रतिकृति:
फिर हम निम्नानुसार आगे बढ़ते हैं: प्रत्येक <math>i \in [n]</math> के लिए हम i-वें आंकड़े बिंदु को छोड़कर सभी से युक्त जैकनाइफ उप-प्रतिरूप के माध्य <math>\bar{x}_{(i)}</math>की गणना करते हैं, और इसे i-वें जैकनाइफ प्रतिकृति कहा जाता है:


:<math>\bar{x}_{(i)} =\frac{1}{n-1} \sum_{j \in [n], j\ne i} x_j, \quad \quad i=1, \dots ,n.</math>
:<math>\bar{x}_{(i)} =\frac{1}{n-1} \sum_{j \in [n], j\ne i} x_j, \quad \quad i=1, \dots ,n.</math>
यह सोचने में मदद मिल सकती है कि ये<math>n</math>जैकनाइफ़ प्रतिकृति बनाता है <math>\bar{x}_{(1)},\ldots,\bar{x}_{(n)}</math> हमें नमूना माध्य के वितरण का एक अनुमान दीजिए <math>\bar{x}</math> और उतना ही बड़ा <math>n</math> यह अनुमान उतना ही बेहतर होगा. फिर अंततः जैकनाइफ़ अनुमानक प्राप्त करने के लिए हम इनका औसत निकालते हैं <math>n</math> जैकनाइफ़ प्रतिकृति:
यह सोचने में सहायता मिल सकती है कि ये <math>n</math> जैकनाइफ़ <math>\bar{x}_{(1)},\ldots,\bar{x}_{(n)}</math> की प्रतिकृति बनाते हैं, जो हमें प्रतिरूप माध्य के वितरण का एक परिमापन देते हैं, <math>\bar{x}</math> और <math>n</math> जितना बड़ा होगा, यह परिमापन उतना ही बेहतर होगा। फिर अंततः जैकनाइफ परिमापनक प्राप्त करने के लिए हम इन <math>n</math> जैकनाइफ प्रतिकृतियों का औसत लेते हैं:


:<math>\bar{x}_{\mathrm{jack}} = \frac{1}{n}\sum_{i=1}^n \bar{x}_{(i)}.</math>
:<math>\bar{x}_{\mathrm{jack}} = \frac{1}{n}\sum_{i=1}^n \bar{x}_{(i)}.</math>
कोई पूर्वाग्रह और भिन्नता के बारे में पूछ सकता है <math>\bar{x}_{\mathrm{jack}}</math>. की परिभाषा से <math>\bar{x}_{\mathrm{jack}}</math> जैसा कि जैकनाइफ़ के औसत की प्रतिकृति से कोई स्पष्ट रूप से गणना करने का प्रयास कर सकता है, और पूर्वाग्रह एक तुच्छ गणना है लेकिन इसका विचरण <math>\bar{x}_{\mathrm{jack}}</math> अधिक शामिल है क्योंकि जैकनाइफ़ प्रतिकृति स्वतंत्र नहीं हैं।
कोई व्यक्ति <math>\bar{x}_{\mathrm{jack}}</math> पूर्वाग्रह और भिन्नता के बारे में पूछ सकता है। <math>\bar{x}_{\mathrm{jack}}</math> की परिभाषा से, क्योंकि जैकनाइफ की औसत प्रतिकृति स्पष्ट रूप से गणना करने का प्रयास कर सकती है, और पूर्वाग्रह एक तुच्छ गणना है लेकिन <math>\bar{x}_{\mathrm{jack}}</math> अधिक सम्मिलित है क्योंकि जैकनाइफ प्रतिकृति स्वतंत्र नहीं हैं।


माध्य के विशेष मामले के लिए, कोई स्पष्ट रूप से दिखा सकता है कि जैकनाइफ़ अनुमान सामान्य अनुमान के बराबर है:
माध्य के विशेष स्तिथि के लिए, कोई स्पष्ट रूप से दिखा सकता है कि जैकनाइफ़ परिमापन सामान्य परिमापन के बराबर है:


:<math>\frac{1}{n}\sum_{i=1}^n \bar{x}_{(i)} = \bar{x}.</math>
:<math>\frac{1}{n}\sum_{i=1}^n \bar{x}_{(i)} = \bar{x}.</math>
इससे पहचान स्थापित होती है <math>\bar{x}_{\mathrm{jack}} = \bar{x}</math>. फिर उम्मीदें लेकर हम मिलते हैं <math>E[\bar{x}_{\mathrm{jack}}] = E[\bar{x}] =E[x]</math>, इसलिए <math>\bar{x}_{\mathrm{jack}}</math> निष्पक्ष है, भिन्नता लेते हुए हमें मिलता है <math>V[\bar{x}_{\mathrm{jack}}] = V[\bar{x}] =V[x]/n</math>. हालाँकि, ये गुण सामान्य रूप से माध्य के अलावा अन्य मापदंडों के लिए मान्य नहीं हैं।
इससे <math>\bar{x}_{\mathrm{jack}} = \bar{x}</math> सर्वसमिका स्थापित होती है। फिर अपेक्षाओं को ध्यान में रखते हुए हमें <math>E[\bar{x}_{\mathrm{jack}}] = E[\bar{x}] =E[x]</math> मिलता है, इसलिए <math>\bar{x}_{\mathrm{jack}}</math> निष्पक्ष है, भिन्नता लेते समय हमें '''<math>V[\bar{x}_{\mathrm{jack}}] = V[\bar{x}] =V[x]/n</math>''' मिलता है।


माध्य अनुमान के मामले के लिए यह सरल उदाहरण केवल जैकनाइफ अनुमानक के निर्माण को दर्शाने के लिए है, जबकि वास्तविक सूक्ष्मताएं (और उपयोगिता) अन्य मापदंडों के अनुमान के मामले में उभरती हैं, जैसे कि माध्य से अधिक क्षण या वितरण के अन्य कार्य।
माध्य परिमापन के स्तिथि के लिए यह सरल उदाहरण केवल जैकनाइफ परिमापनक के निर्माण को दर्शाने के लिए है, जबकि वास्तविक सूक्ष्मताएं (और उपयोगिता) अन्य मापदंडों के परिमापन के स्तिथि में उभरती हैं, जैसे कि माध्य से अधिक क्षण या वितरण के अन्य कार्य हैं।


ध्यान दें कि <math>\bar{x}_{\mathrm{jack}}</math> के पूर्वाग्रह का अनुभवजन्य अनुमान बनाने के लिए इस्तेमाल किया जा सकता है <math>\bar{x}</math>, अर्थात् <math>\widehat{\operatorname{bias}}(\bar{x})_{\mathrm{jack}} = c(\bar{x}_{\mathrm{jack}} - \bar{x})</math> कुछ उपयुक्त कारक के साथ <math>c>0</math>, हालाँकि इस मामले में हम यह जानते हैं <math>\bar{x}_{\mathrm{jack}} = \bar{x}</math> इसलिए यह निर्माण कोई सार्थक ज्ञान नहीं जोड़ता है, लेकिन यह ध्यान देने योग्य है कि यह पूर्वाग्रह का सही अनुमान देता है (जो शून्य है)।
ध्यान दें कि <math>\bar{x}_{\mathrm{jack}}</math> के पूर्वाग्रह का अनुभवजन्य परिमापन बनाने के लिए <math>\bar{x}</math> का इस्तेमाल किया जा सकता है , अर्थात् <math>\widehat{\operatorname{bias}}(\bar{x})_{\mathrm{jack}} = c(\bar{x}_{\mathrm{jack}} - \bar{x})</math> कुछ उपयुक्त कारक <math>c>0</math> के साथ है, हालाँकि इस स्तिथि में हम यह जानते हैं कि <math>\bar{x}_{\mathrm{jack}} = \bar{x}</math> है इसलिए यह निर्माण कोई सार्थक ज्ञान नहीं जोड़ता है, लेकिन यह ध्यान देने योग्य है कि यह पूर्वाग्रह का सही परिमापन देता है (जो शून्य है)।


के विचरण का एक जैकनाइफ़ अनुमान <math>\bar{x}</math> जैकनाइफ प्रतिकृति के विचरण से गणना की जा सकती है <math>\bar{x}_{(i)}</math>:{{sfn|Efron|1982|p=14}}<ref>{{cite web|last1=McIntosh|first1=Avery I.|title=जैकनाइफ़ आकलन विधि|url=http://people.bu.edu/aimcinto/jackknife.pdf|website=Boston University|publisher=Avery I. McIntosh|access-date=2016-04-30|archive-date=2016-05-14|archive-url=https://web.archive.org/web/20160514022307/http://people.bu.edu/aimcinto/jackknife.pdf|url-status=dead}}: p. 3.</ref>
जैकनाइफ के प्रसरण के परिमापन <math>\bar{x}</math> की गणना जैकनाइफ प्रतिकृति <math>\bar{x}_{(i)}</math>के प्रसरण से की जा सकती है: {{sfn|Efron|1982|p=14}}<ref>{{cite web|last1=McIntosh|first1=Avery I.|title=जैकनाइफ़ आकलन विधि|url=http://people.bu.edu/aimcinto/jackknife.pdf|website=Boston University|publisher=Avery I. McIntosh|access-date=2016-04-30|archive-date=2016-05-14|archive-url=https://web.archive.org/web/20160514022307/http://people.bu.edu/aimcinto/jackknife.pdf|url-status=dead}}: p. 3.</ref>
:<math>\widehat{\operatorname{var}}(\bar{x})_{\mathrm{jack}}
:<math>\widehat{\operatorname{var}}(\bar{x})_{\mathrm{jack}}
=\frac{n-1}{n} \sum_{i=1}^n (\bar{x}_{(i)} - \bar{x}_{\mathrm{jack}})^2  
=\frac{n-1}{n} \sum_{i=1}^n (\bar{x}_{(i)} - \bar{x}_{\mathrm{jack}})^2  
=\frac{1}{n(n-1)} \sum_{i=1}^n (x_i - \bar{x})^2.</math>
=\frac{1}{n(n-1)} \sum_{i=1}^n (x_i - \bar{x})^2.</math>
बाईं समानता अनुमानक को परिभाषित करती है <math>\widehat{\operatorname{var}}(\bar{x})_{\mathrm{jack}}</math> और सही समानता एक पहचान है जिसे सीधे सत्यापित किया जा सकता है। फिर उम्मीदें लेकर हम मिलते हैं <math>E[\widehat{\operatorname{var}}(\bar{x})_{\mathrm{jack}}] = V[x]/n = V[\bar{x}]</math>, इसलिए यह विचरण का एक निष्पक्ष अनुमानक है <math>\bar{x}</math>.
बाईं ओर की समानता परिमापनक <math>\widehat{\operatorname{var}}(\bar{x})_{\mathrm{jack}}</math>को परिभाषित करती है, और सही समानता एक सर्वसमिका है जिसे सीधे सत्यापित किया जा सकता है। फिर अपेक्षाओं को ध्यान में रखते हुए हमें <math>E[\widehat{\operatorname{var}}(\bar{x})_{\mathrm{jack}}] = V[x]/n = V[\bar{x}]</math> मिलता है, इसलिए यह विचरण का एक निष्पक्ष परिमापनक <math>\bar{x}</math> है।


==आकलनकर्ता के पूर्वाग्रह का अनुमान लगाना==
==आकलनकर्ता के पूर्वाग्रह का परिमापन लगाना==
जैकनाइफ तकनीक का उपयोग पूरे प्रतिरूपपर गणना किए गए अनुमानक के पूर्वाग्रह का अनुमान लगाने (और सही करने) के लिए किया जा सकता है।
जैकनाइफ तकनीक का उपयोग संपूर्ण प्रतिरूप पर गणना किए गए परिमापनक के पूर्वाग्रह का परिमापन लगाने (और सही करने) के लिए किया जा सकता है।


कल्पना करना <math>\theta</math> रुचि का लक्ष्य पैरामीटर है, जिसे वितरण के कुछ कार्यात्मक माना जाता है <math>x</math>. अवलोकनों के एक सीमित सेट पर आधारित <math>x_1, ..., x_n</math>, जिसमें आई.आई.डी. शामिल माना जाता है। की प्रतियाँ <math>x</math>, अनुमानक <math>\hat{\theta}</math> निर्माण किया है:
मान लीजिए <math>\theta</math> ब्याज का लक्ष्य मापदण्ड है, जिसे <math>x</math> के वितरण की कुछ कार्यात्मकता माना जाता है। अवलोकनों के एक सीमित समुच्चय पर आधारित <math>x_1, ..., x_n</math>, जिसमें आई.आई.डी. सम्मिलित माना जाता है। '''<math>x</math>''' की प्रतियों से, परिमापनक <math>\hat{\theta}</math> का निर्माण किया जाता है''':'''


:<math>\hat{\theta} =f_n(x_1,\ldots,x_n).</math>
:<math>\hat{\theta} =f_n(x_1,\ldots,x_n).</math>
का मान है <math>\hat{\theta}</math> नमूना-निर्भर है, इसलिए यह मान एक यादृच्छिक प्रतिरूपसे दूसरे में बदल जाएगा।
<math>\hat{\theta}</math> का मान प्रतिरूप-निर्भर है, इसलिए यह मान एक यादृच्छिक प्रतिरूप से अन्य यादृच्छिक प्रतिरूप में बदल जाएगा।


परिभाषा के अनुसार, का पूर्वाग्रह <math>\hat{\theta}</math> इस प्रकार है:
परिभाषा के अनुसार, <math>\hat{\theta}</math> का पूर्वाग्रह इस प्रकार है:


:<math>\text{bias}(\hat{\theta}) = E[\hat{\theta}] - \theta.</math>
:<math>\text{bias}(\hat{\theta}) = E[\hat{\theta}] - \theta.</math>
कोई व्यक्ति कई मानों की गणना करना चाह सकता है <math>\hat{\theta}</math> अनुभवजन्य अनुमान की गणना करने के लिए, कई नमूनों से, और उनका औसत निकालें <math>E[\hat{\theta}]</math>, लेकिन यह तब असंभव है जब उपलब्ध अवलोकनों के पूरे सेट में कोई अन्य प्रतिरूपन हों <math>x_1, ..., x_n</math> गणना करने के लिए प्रयोग किया जाता था <math>\hat{\theta}</math>. इस तरह की स्थिति में जैकनाइफ रीसैंपलिंग तकनीक मददगार हो सकती है।
कोई व्यक्ति अनेक प्रतिरूपों से <math>\hat{\theta}</math> के अनेक मानों की गणना करना चाह सकता है, अनेक प्रतिरूपों से, और उनका औसत <math>E[\hat{\theta}]</math> निकालें, लेकिन यह तब असंभव है जब उपलब्ध अवलोकनों के पूरे समुच्चय में कोई अन्य प्रतिरूपन <math>x_1, ..., x_n</math> हों  गणना करने के लिए <math>\hat{\theta}</math> प्रयोग किया जाता था। इस तरह की स्थिति में जैकनाइफ पुनः प्रतिचयन तकनीक मददगार हो सकती है।


हम जैकनाइफ प्रतिकृति का निर्माण करते हैं:
हम जैकनाइफ प्रतिकृति का निर्माण करते हैं:


:<math>\hat{\theta}_{(1)} =f_{n-1}(x_{2},x_{3}\ldots,x_{n})</math>
:<math>\hat{\theta}_{(1)} =f_{n-1}(x_{2},x_{3}\ldots,x_{n})</math>
:<math>\hat{\theta}_{(2)} =f_{n-1}(x_{1},x_{3},\ldots,x_{n})</math>
:<math>\hat{\theta}_{(2)} =f_{n-1}(x_{1},x_{3},\ldots,x_{n})</math> <math>\vdots</math>
:<math>\vdots</math>
:<math>\hat{\theta}_{(n)} =f_{n-1}(x_1,x_{2},\ldots,x_{n-1})</math>
:<math>\hat{\theta}_{(n)} =f_{n-1}(x_1,x_{2},\ldots,x_{n-1})</math>
जहां प्रत्येक प्रतिकृति जैकनाइफ सबसैंपल के आधार पर एक लीव-वन-आउट अनुमान है, जिसमें डेटा बिंदुओं में से एक को छोड़कर सभी शामिल हैं:
जहां प्रत्येक प्रतिकृति जैकनाइफ उपप्रतिदर्श के आधार पर एक लीव-वन-आउट परिमापन है, जिसमें आंकड़े बिंदुओं में से एक को छोड़कर सभी सम्मिलित हैं:


:<math>\hat{\theta}_{(i)} =f_{n-1}(x_{1},\ldots,x_{i-1},x_{i+1},\ldots,x_{n}) \quad \quad i=1, \dots,n.</math>
:<math>\hat{\theta}_{(i)} =f_{n-1}(x_{1},\ldots,x_{i-1},x_{i+1},\ldots,x_{n}) \quad \quad i=1, \dots,n.</math>
Line 64: Line 63:


:<math>\hat{\theta}_\mathrm{jack}=\frac{1}{n} \sum_{i=1}^n \hat{\theta}_{(i)}</math>
:<math>\hat{\theta}_\mathrm{jack}=\frac{1}{n} \sum_{i=1}^n \hat{\theta}_{(i)}</math>
जैकनाइफ़ के पूर्वाग्रह का अनुमान <math>\hat{\theta}</math> द्वारा दिया गया है:
जैकनाइफ़ के पूर्वाग्रह का परिमापन <math>\hat{\theta}</math> द्वारा दिया गया है:
:<math>\widehat{\text{bias}}(\hat{\theta})_\mathrm{jack} =(n-1)(\hat{\theta}_\mathrm{jack} - \hat{\theta})</math>
:<math>\widehat{\text{bias}}(\hat{\theta})_\mathrm{jack} =(n-1)(\hat{\theta}_\mathrm{jack} - \hat{\theta})</math>
और परिणामी पूर्वाग्रह-सुधारित जैकनाइफ़ अनुमान <math>\theta</math> द्वारा दिया गया है:
और परिणामी पूर्वाग्रह-सुधारित जैकनाइफ़ परिमापन <math>\theta</math> द्वारा दिया गया है:
:<math>\hat{\theta}_{\text{jack}}^{*}  
:<math>\hat{\theta}_{\text{jack}}^{*}  
=\hat{\theta} - \widehat{\text{bias}}(\hat{\theta})_\mathrm{jack}
=\hat{\theta} - \widehat{\text{bias}}(\hat{\theta})_\mathrm{jack}
=n\hat{\theta} - (n-1)\hat{\theta}_\mathrm{jack}.</math>
=n\hat{\theta} - (n-1)\hat{\theta}_\mathrm{jack}.</math>
यह उस विशेष मामले में पूर्वाग्रह को दूर करता है जो पूर्वाग्रह है <math>O(n^{-1})</math> और इसे कम कर देता है <math>O(n^{-2})</math> अन्य मामलों में।{{sfn|Cameron|Trivedi|2005|p=375}}
यह उस विशेष स्तिथि में पूर्वाग्रह को हटा देता है जिसमें पूर्वाग्रह <math>O(n^{-1})</math> है, और अन्य स्तिथियों में इसे घटाकर <math>O(n^{-2})</math> कर देता है। {{sfn|Cameron|Trivedi|2005|p=375}}


==एक अनुमानक के विचरण का अनुमान लगाना==
==एक परिमापनक के विचरण का परिमापन लगाना==
जैकनाइफ तकनीक का उपयोग पूरे प्रतिरूपपर गणना किए गए अनुमानक के विचरण का अनुमान लगाने के लिए भी किया जा सकता है।
जैकनाइफ तकनीक का उपयोग संपूर्ण प्रतिरूप पर गणना किए गए परिमापनक के विचरण का परिमापन लगाने के लिए भी किया जा सकता है।


== यह भी देखें ==
== यह भी देखें ==
Line 107: Line 106:


{{Statistics|hide}}
{{Statistics|hide}}
[[Category: कम्प्यूटेशनल सांख्यिकी]] [[Category: पुन: नमूनाकरण (सांख्यिकी)]]


 
[[Category:Collapse templates]]
 
[[Category: Machine Translated Page]]
[[Category:Created On 26/07/2023]]
[[Category:Created On 26/07/2023]]
[[Category:Lua-based templates]]
[[Category:Machine Translated Page]]
[[Category:Navigational boxes| ]]
[[Category:Navigational boxes without horizontal lists]]
[[Category:Pages with empty portal template]]
[[Category:Pages with script errors]]
[[Category:Portal-inline template with redlinked portals]]
[[Category:Short description with empty Wikidata description]]
[[Category:Sidebars with styles needing conversion]]
[[Category:Template documentation pages|Documentation/doc]]
[[Category:Templates Vigyan Ready]]
[[Category:Templates generating microformats]]
[[Category:Templates that add a tracking category]]
[[Category:Templates that are not mobile friendly]]
[[Category:Templates that generate short descriptions]]
[[Category:Templates using TemplateData]]
[[Category:Wikipedia metatemplates]]
[[Category:कम्प्यूटेशनल सांख्यिकी]]
[[Category:पुन]]

Latest revision as of 14:32, 11 August 2023

आँकड़ों में, जैकनाइफ़ (जैकनाइफ़ अंतः वैधीकरण) एक अंतः वैधीकरण तकनीक है और इसलिए, यह पुनः प्रतिचयन का एक रूप है।

यह पूर्वाग्रह और प्रसरण परिमापन के लिए विशेष रूप से उपयोगी है। जैकनाइफ़ बूटस्ट्रैप (सांख्यिकी) जैसी अन्य सामान्य पुन: प्रतिचयन विधियों को पूर्व-दिनांकित करता है। आकार n के एक प्रतिरूप को देखते हुए, एक अवलोकन को छोड़कर प्राप्त आकार (n-1) के प्रत्येक उप-प्रतिरूप से मापदण्ड परिमापन को एकत्रित करके एक जैकनाइफ परिमापनक बनाया जा सकता है। [1]

जैकनाइफ तकनीक को मौरिस क्वेनोइल (1924-1973) द्वारा 1949 में विकसित किया गया था और 1956 में परिष्कृत किया गया था। जॉन तुकी ने 1958 में इस तकनीक का विस्तार किया और "जैकनाइफ" नाम प्रस्तावित किया, क्योंकि एक भौतिक जैक-नाइफ (एक सघन वलन चाकू) की तरह, यह एक काम चलाऊ उपकरण है जो विभिन्न प्रकार की समस्याओं के लिए भी समाधान निकाल सकता है। हालाँकि उद्देश्य-प्रतिरूप किए गए उपकरण से विशिष्ट समस्याओं को अधिक निपूणता से हल किया जा सकता है। [2]

जैकनाइफ़ बूटस्ट्रैप (सांख्यिकी) का एक रैखिक सादृश्य है। [2]

एक सरल उदाहरण: माध्य परिमापन

एक मापदण्ड का जैकनाइफ परिमापनक एक आंकड़े समुच्चय से प्रत्येक अवलोकन को व्यवस्थित रूप से छोड़कर और शेष अवलोकनों पर मापदण्ड परिमापन की गणना करके और फिर इन गणनाओं को एकत्रित करके पाया जाता है।

उदाहरण के लिए, यदि परिमापन लगाया जाने वाला मापदण्ड यादृच्छिक चर x का जनसंख्या माध्य है, फिर आई.आई.डी. के दिए गए समुच्चय के लिए प्रेक्षण प्राकृतिक परिमापनक प्रतिरूप माध्य है:

जहां अंतिम योग यह इंगित करने के लिए अन्य तरीके का उपयोग करता है कि सूचकांक i समुच्चय पर चलता है।

फिर हम निम्नानुसार आगे बढ़ते हैं: प्रत्येक के लिए हम i-वें आंकड़े बिंदु को छोड़कर सभी से युक्त जैकनाइफ उप-प्रतिरूप के माध्य की गणना करते हैं, और इसे i-वें जैकनाइफ प्रतिकृति कहा जाता है:

यह सोचने में सहायता मिल सकती है कि ये जैकनाइफ़ की प्रतिकृति बनाते हैं, जो हमें प्रतिरूप माध्य के वितरण का एक परिमापन देते हैं, और जितना बड़ा होगा, यह परिमापन उतना ही बेहतर होगा। फिर अंततः जैकनाइफ परिमापनक प्राप्त करने के लिए हम इन जैकनाइफ प्रतिकृतियों का औसत लेते हैं:

कोई व्यक्ति पूर्वाग्रह और भिन्नता के बारे में पूछ सकता है। की परिभाषा से, क्योंकि जैकनाइफ की औसत प्रतिकृति स्पष्ट रूप से गणना करने का प्रयास कर सकती है, और पूर्वाग्रह एक तुच्छ गणना है लेकिन अधिक सम्मिलित है क्योंकि जैकनाइफ प्रतिकृति स्वतंत्र नहीं हैं। ।

माध्य के विशेष स्तिथि के लिए, कोई स्पष्ट रूप से दिखा सकता है कि जैकनाइफ़ परिमापन सामान्य परिमापन के बराबर है:

इससे सर्वसमिका स्थापित होती है। फिर अपेक्षाओं को ध्यान में रखते हुए हमें मिलता है, इसलिए निष्पक्ष है, भिन्नता लेते समय हमें मिलता है।

माध्य परिमापन के स्तिथि के लिए यह सरल उदाहरण केवल जैकनाइफ परिमापनक के निर्माण को दर्शाने के लिए है, जबकि वास्तविक सूक्ष्मताएं (और उपयोगिता) अन्य मापदंडों के परिमापन के स्तिथि में उभरती हैं, जैसे कि माध्य से अधिक क्षण या वितरण के अन्य कार्य हैं।

ध्यान दें कि के पूर्वाग्रह का अनुभवजन्य परिमापन बनाने के लिए का इस्तेमाल किया जा सकता है , अर्थात् कुछ उपयुक्त कारक के साथ है, हालाँकि इस स्तिथि में हम यह जानते हैं कि है इसलिए यह निर्माण कोई सार्थक ज्ञान नहीं जोड़ता है, लेकिन यह ध्यान देने योग्य है कि यह पूर्वाग्रह का सही परिमापन देता है (जो शून्य है)।

जैकनाइफ के प्रसरण के परिमापन की गणना जैकनाइफ प्रतिकृति के प्रसरण से की जा सकती है: [3][4]

बाईं ओर की समानता परिमापनक को परिभाषित करती है, और सही समानता एक सर्वसमिका है जिसे सीधे सत्यापित किया जा सकता है। फिर अपेक्षाओं को ध्यान में रखते हुए हमें मिलता है, इसलिए यह विचरण का एक निष्पक्ष परिमापनक है।

आकलनकर्ता के पूर्वाग्रह का परिमापन लगाना

जैकनाइफ तकनीक का उपयोग संपूर्ण प्रतिरूप पर गणना किए गए परिमापनक के पूर्वाग्रह का परिमापन लगाने (और सही करने) के लिए किया जा सकता है।

मान लीजिए ब्याज का लक्ष्य मापदण्ड है, जिसे के वितरण की कुछ कार्यात्मकता माना जाता है। अवलोकनों के एक सीमित समुच्चय पर आधारित , जिसमें आई.आई.डी. सम्मिलित माना जाता है। की प्रतियों से, परिमापनक का निर्माण किया जाता है:

का मान प्रतिरूप-निर्भर है, इसलिए यह मान एक यादृच्छिक प्रतिरूप से अन्य यादृच्छिक प्रतिरूप में बदल जाएगा।

परिभाषा के अनुसार, का पूर्वाग्रह इस प्रकार है:

कोई व्यक्ति अनेक प्रतिरूपों से के अनेक मानों की गणना करना चाह सकता है, अनेक प्रतिरूपों से, और उनका औसत निकालें, लेकिन यह तब असंभव है जब उपलब्ध अवलोकनों के पूरे समुच्चय में कोई अन्य प्रतिरूपन हों गणना करने के लिए प्रयोग किया जाता था। इस तरह की स्थिति में जैकनाइफ पुनः प्रतिचयन तकनीक मददगार हो सकती है।

हम जैकनाइफ प्रतिकृति का निर्माण करते हैं:

जहां प्रत्येक प्रतिकृति जैकनाइफ उपप्रतिदर्श के आधार पर एक लीव-वन-आउट परिमापन है, जिसमें आंकड़े बिंदुओं में से एक को छोड़कर सभी सम्मिलित हैं:

फिर हम उनका औसत परिभाषित करते हैं:

जैकनाइफ़ के पूर्वाग्रह का परिमापन द्वारा दिया गया है:

और परिणामी पूर्वाग्रह-सुधारित जैकनाइफ़ परिमापन द्वारा दिया गया है:

यह उस विशेष स्तिथि में पूर्वाग्रह को हटा देता है जिसमें पूर्वाग्रह है, और अन्य स्तिथियों में इसे घटाकर कर देता है। [2]

एक परिमापनक के विचरण का परिमापन लगाना

जैकनाइफ तकनीक का उपयोग संपूर्ण प्रतिरूप पर गणना किए गए परिमापनक के विचरण का परिमापन लगाने के लिए भी किया जा सकता है।

यह भी देखें

साहित्य

टिप्पणियाँ

  1. Efron 1982, p. 2.
  2. 2.0 2.1 2.2 Cameron & Trivedi 2005, p. 375.
  3. Efron 1982, p. 14.
  4. McIntosh, Avery I. "जैकनाइफ़ आकलन विधि" (PDF). Boston University. Avery I. McIntosh. Archived from the original (PDF) on 2016-05-14. Retrieved 2016-04-30.: p. 3.


संदर्भ