जैकनाइफ क्रॉस-वैलिडेशन: Difference between revisions

Revision as of 15:12, 4 August 2023

आंकड़ों में, जैकनाइफ (जैकनाइफ क्रॉस-वैलिडेशन) एक क्रॉस-वैलिडेशन (सांख्यिकी)|क्रॉस-वैलिडेशन तकनीक है और इसलिए, पुनः नमूनाकरण (सांख्यिकी) का एक रूप है। यह अनुमानक के पूर्वाग्रह और विचरण अनुमान के लिए विशेष रूप से उपयोगी है। जैकनाइफ़ बूटस्ट्रैप (सांख्यिकी) जैसी अन्य सामान्य पुन: नमूनाकरण विधियों को पूर्व-दिनांकित करता है। आकार का एक नमूना दिया गया है $n$ , आकार के प्रत्येक उप-नमूने से पैरामीटर अनुमानों को एकत्रित करके एक जैकनाइफ अनुमानक बनाया जा सकता है $(n-1)$ एक अवलोकन को छोड़ कर प्राप्त किया गया।^[1]

जैकनाइफ तकनीक मौरिस क्वेनोइल (1924-1973) द्वारा 1949 में विकसित की गई थी और 1956 में परिष्कृत की गई थी। जॉन तुकी ने 1958 में तकनीक का विस्तार किया और जैकनाइफ नाम प्रस्तावित किया क्योंकि, एक भौतिक :विकट:जैक-नाइफ|जैक-चाकू (एक कॉम्पैक्ट फोल्डिंग चाकू) की तरह, यह एक :विकेट:रफ-एंड-रेडी|रफ-एंड-रेडी उपकरण है जो समाधान में सुधार कर सकता है। विभिन्न प्रकार की समस्याएँ, भले ही विशिष्ट समस्याओं को एक उद्देश्य-डिज़ाइन किए गए उपकरण के साथ अधिक कुशलता से हल किया जा सकता है।^[2]

जैकनाइफ़ बूटस्ट्रैप (सांख्यिकी) का एक रैखिक सन्निकटन है।^[2]

एक सरल उदाहरण: माध्य अनुमान

एक पैरामीटर का जैकनाइफ़ अनुमानक एक डेटासेट से प्रत्येक अवलोकन को व्यवस्थित रूप से छोड़कर और शेष अवलोकनों पर पैरामीटर अनुमान की गणना करके और फिर इन गणनाओं को एकत्रित करके पाया जाता है।

उदाहरण के लिए, यदि अनुमान लगाया जाने वाला पैरामीटर यादृच्छिक चर का जनसंख्या माध्य है $x$ , फिर आई.आई.डी. के दिए गए सेट के लिए टिप्पणियों $x_{1},...,x_{n}$ प्राकृतिक अनुमानक नमूना माध्य है:

{\bar {x}}={\frac {1}{n}}\sum _{i=1}^{n}x_{i}={\frac {1}{n}}\sum _{i\in [n]}x_{i},

जहां अंतिम योग सूचकांक को इंगित करने के लिए दूसरे तरीके का उपयोग करता है $i$ सेट पर दौड़ता है $[n]=\{1,\ldots ,n\}$ .

फिर हम इस प्रकार आगे बढ़ते हैं: प्रत्येक के लिए $i\in [n]$ हम माध्य की गणना करते हैं ${\bar {x}}_{(i)}$ जैकनाइफ़ उपनमूना में के अलावा सभी शामिल हैं $i$ -वां डेटा बिंदु, और इसे कहा जाता है $i$ -वें जैकनाइफ़ प्रतिकृति:

{\bar {x}}_{(i)}={\frac {1}{n-1}}\sum _{j\in [n],j\neq i}x_{j},\quad \quad i=1,\dots ,n.

यह सोचने में मदद मिल सकती है कि ये $n$ जैकनाइफ़ प्रतिकृति बनाता है ${\bar {x}}_{(1)},\ldots ,{\bar {x}}_{(n)}$ हमें नमूना माध्य के वितरण का एक अनुमान दीजिए ${\bar {x}}$ और उतना ही बड़ा $n$ यह अनुमान उतना ही बेहतर होगा. फिर अंततः जैकनाइफ़ अनुमानक प्राप्त करने के लिए हम इनका औसत निकालते हैं $n$ जैकनाइफ़ प्रतिकृति:

{\bar {x}}_{\mathrm {jack} }={\frac {1}{n}}\sum _{i=1}^{n}{\bar {x}}_{(i)}.

कोई पूर्वाग्रह और भिन्नता के बारे में पूछ सकता है ${\bar {x}}_{\mathrm {jack} }$ . की परिभाषा से ${\bar {x}}_{\mathrm {jack} }$ जैसा कि जैकनाइफ़ के औसत की प्रतिकृति से कोई स्पष्ट रूप से गणना करने का प्रयास कर सकता है, और पूर्वाग्रह एक तुच्छ गणना है लेकिन इसका विचरण ${\bar {x}}_{\mathrm {jack} }$ अधिक शामिल है क्योंकि जैकनाइफ़ प्रतिकृति स्वतंत्र नहीं हैं।

माध्य के विशेष मामले के लिए, कोई स्पष्ट रूप से दिखा सकता है कि जैकनाइफ़ अनुमान सामान्य अनुमान के बराबर है:

{\frac {1}{n}}\sum _{i=1}^{n}{\bar {x}}_{(i)}={\bar {x}}.

इससे पहचान स्थापित होती है ${\bar {x}}_{\mathrm {jack} }={\bar {x}}$ . फिर उम्मीदें लेकर हम मिलते हैं $E[{\bar {x}}_{\mathrm {jack} }]=E[{\bar {x}}]=E[x]$ , इसलिए ${\bar {x}}_{\mathrm {jack} }$ निष्पक्ष है, भिन्नता लेते हुए हमें मिलता है $V[{\bar {x}}_{\mathrm {jack} }]=V[{\bar {x}}]=V[x]/n$ . हालाँकि, ये गुण सामान्य रूप से माध्य के अलावा अन्य मापदंडों के लिए मान्य नहीं हैं।

माध्य अनुमान के मामले के लिए यह सरल उदाहरण केवल जैकनाइफ अनुमानक के निर्माण को दर्शाने के लिए है, जबकि वास्तविक सूक्ष्मताएं (और उपयोगिता) अन्य मापदंडों के अनुमान के मामले में उभरती हैं, जैसे कि माध्य से अधिक क्षण या वितरण के अन्य कार्य।

ध्यान दें कि ${\bar {x}}_{\mathrm {jack} }$ के पूर्वाग्रह का अनुभवजन्य अनुमान बनाने के लिए इस्तेमाल किया जा सकता है ${\bar {x}}$ , अर्थात् ${\widehat {\operatorname {bias} }}({\bar {x}})_{\mathrm {jack} }=c({\bar {x}}_{\mathrm {jack} }-{\bar {x}})$ कुछ उपयुक्त कारक के साथ $c>0$ , हालाँकि इस मामले में हम यह जानते हैं ${\bar {x}}_{\mathrm {jack} }={\bar {x}}$ इसलिए यह निर्माण कोई सार्थक ज्ञान नहीं जोड़ता है, लेकिन यह ध्यान देने योग्य है कि यह पूर्वाग्रह का सही अनुमान देता है (जो शून्य है)।

के विचरण का एक जैकनाइफ़ अनुमान ${\bar {x}}$ जैकनाइफ प्रतिकृति के विचरण से गणना की जा सकती है ${\bar {x}}_{(i)}$ :^[3]^[4]

{\widehat {\operatorname {var} }}({\bar {x}})_{\mathrm {jack} }={\frac {n-1}{n}}\sum _{i=1}^{n}({\bar {x}}_{(i)}-{\bar {x}}_{\mathrm {jack} })^{2}={\frac {1}{n(n-1)}}\sum _{i=1}^{n}(x_{i}-{\bar {x}})^{2}.

बाईं समानता अनुमानक को परिभाषित करती है ${\widehat {\operatorname {var} }}({\bar {x}})_{\mathrm {jack} }$ और सही समानता एक पहचान है जिसे सीधे सत्यापित किया जा सकता है। फिर उम्मीदें लेकर हम मिलते हैं $E[{\widehat {\operatorname {var} }}({\bar {x}})_{\mathrm {jack} }]=V[x]/n=V[{\bar {x}}]$ , इसलिए यह विचरण का एक निष्पक्ष अनुमानक है ${\bar {x}}$ .

आकलनकर्ता के पूर्वाग्रह का अनुमान लगाना

जैकनाइफ तकनीक का उपयोग पूरे नमूने पर गणना किए गए अनुमानक के पूर्वाग्रह का अनुमान लगाने (और सही करने) के लिए किया जा सकता है।

कल्पना करना $\theta$ रुचि का लक्ष्य पैरामीटर है, जिसे वितरण के कुछ कार्यात्मक माना जाता है $x$ . अवलोकनों के एक सीमित सेट पर आधारित $x_{1},...,x_{n}$ , जिसमें आई.आई.डी. शामिल माना जाता है। की प्रतियाँ $x$ , अनुमानक ${\hat {\theta }}$ निर्माण किया है:

{\hat {\theta }}=f_{n}(x_{1},\ldots ,x_{n}).

का मान है ${\hat {\theta }}$ नमूना-निर्भर है, इसलिए यह मान एक यादृच्छिक नमूने से दूसरे में बदल जाएगा।

परिभाषा के अनुसार, का पूर्वाग्रह ${\hat {\theta }}$ इस प्रकार है:

{\text{bias}}({\hat {\theta }})=E[{\hat {\theta }}]-\theta .

कोई व्यक्ति कई मानों की गणना करना चाह सकता है ${\hat {\theta }}$ अनुभवजन्य अनुमान की गणना करने के लिए, कई नमूनों से, और उनका औसत निकालें $E[{\hat {\theta }}]$ , लेकिन यह तब असंभव है जब उपलब्ध अवलोकनों के पूरे सेट में कोई अन्य नमूने न हों $x_{1},...,x_{n}$ गणना करने के लिए प्रयोग किया जाता था ${\hat {\theta }}$ . इस तरह की स्थिति में जैकनाइफ रीसैंपलिंग तकनीक मददगार हो सकती है।

हम जैकनाइफ प्रतिकृति का निर्माण करते हैं:

{\hat {\theta }}_{(1)}=f_{n-1}(x_{2},x_{3}\ldots ,x_{n})

{\hat {\theta }}_{(2)}=f_{n-1}(x_{1},x_{3},\ldots ,x_{n})

\vdots

{\hat {\theta }}_{(n)}=f_{n-1}(x_{1},x_{2},\ldots ,x_{n-1})

जहां प्रत्येक प्रतिकृति जैकनाइफ सबसैंपल के आधार पर एक लीव-वन-आउट अनुमान है, जिसमें डेटा बिंदुओं में से एक को छोड़कर सभी शामिल हैं:

{\hat {\theta }}_{(i)}=f_{n-1}(x_{1},\ldots ,x_{i-1},x_{i+1},\ldots ,x_{n})\quad \quad i=1,\dots ,n.

फिर हम उनका औसत परिभाषित करते हैं:

{\hat {\theta }}_{\mathrm {jack} }={\frac {1}{n}}\sum _{i=1}^{n}{\hat {\theta }}_{(i)}

जैकनाइफ़ के पूर्वाग्रह का अनुमान ${\hat {\theta }}$ द्वारा दिया गया है:

{\widehat {\text{bias}}}({\hat {\theta }})_{\mathrm {jack} }=(n-1)({\hat {\theta }}_{\mathrm {jack} }-{\hat {\theta }})

और परिणामी पूर्वाग्रह-सुधारित जैकनाइफ़ अनुमान $\theta$ द्वारा दिया गया है:

{\hat {\theta }}_{\text{jack}}^{*}={\hat {\theta }}-{\widehat {\text{bias}}}({\hat {\theta }})_{\mathrm {jack} }=n{\hat {\theta }}-(n-1){\hat {\theta }}_{\mathrm {jack} }.

यह उस विशेष मामले में पूर्वाग्रह को दूर करता है जो पूर्वाग्रह है $O(n^{-1})$ और इसे कम कर देता है $O(n^{-2})$ अन्य मामलों में।^[2]

एक अनुमानक के विचरण का अनुमान लगाना

जैकनाइफ तकनीक का उपयोग पूरे नमूने पर गणना किए गए अनुमानक के विचरण का अनुमान लगाने के लिए भी किया जा सकता है।

यह भी देखें

लीव-वन-आउट त्रुटि

साहित्य

Berger, Y.G. (2007). "असमान संभावनाओं वाले अनस्टेज स्तरीकृत नमूनों के लिए एक जैकनाइफ़ विचरण अनुमानक". Biometrika. 94 (4): 953–964. doi:10.1093/biomet/asm072.
Berger, Y.G.; Rao, J.N.K. (2006). "प्रतिस्थापन के बिना असमान संभाव्यता नमूने के तहत आरोपण के लिए समायोजित जैकनाइफ". Journal of the Royal Statistical Society, Series B. 68 (3): 531–547. doi:10.1111/j.1467-9868.2006.00555.x.
Berger, Y.G.; Skinner, C.J. (2005). "असमान संभाव्यता नमूने के लिए एक जैकनाइफ़ विचरण अनुमानक". Journal of the Royal Statistical Society, Series B. 67 (1): 79–89. doi:10.1111/j.1467-9868.2005.00489.x.
Jiang, J.; Lahiri, P.; Wan, S-M. (2002). "एम-आकलन के साथ अनुभवजन्य सर्वोत्तम भविष्यवाणी के लिए एक एकीकृत जैकनाइफ सिद्धांत". The Annals of Statistics. 30 (6): 1782–810. doi:10.1214/aos/1043351257.
Jones, H.L. (1974). "स्ट्रेटम साधनों के कार्यों का जैकनाइफ आकलन". Biometrika. 61 (2): 343–348. doi:10.2307/2334363. JSTOR 2334363.
Kish, L.; Frankel, M.R. (1974). "जटिल नमूनों से अनुमान". Journal of the Royal Statistical Society, Series B. 36 (1): 1–37.
Krewski, D.; Rao, J.N.K. (1981). "स्तरीकृत नमूनों से निष्कर्ष: रैखिकरण, जैकनाइफ और संतुलित दोहराया प्रतिकृति विधियों के गुण". The Annals of Statistics. 9 (5): 1010–1019. doi:10.1214/aos/1176345580.
Quenouille, M.H. (1956). "आकलन में पूर्वाग्रह पर नोट्स". Biometrika. 43 (3–4): 353–360. doi:10.1093/biomet/43.3-4.353.
Rao, J.N.K.; Shao, J. (1992). "हॉट डेक इंप्यूटेशन के तहत सर्वेक्षण डेटा के साथ जैकनाइफ विचरण अनुमान". Biometrika. 79 (4): 811–822. doi:10.1093/biomet/79.4.811.
Rao, J.N.K.; Wu, C.F.J.; Yue, K. (1992). "जटिल सर्वेक्षणों के लिए पुन: नमूनाकरण विधियों पर कुछ हालिया कार्य". Survey Methodology. 18 (2): 209–217.
शाओ, जे. और तू, डी. (1995)। जैकनाइफ और बूटस्ट्रैप। स्प्रिंगर-वेरलाग, इंक.
Tukey, J.W. (1958). "बहुत बड़े नमूनों में पूर्वाग्रह और विश्वास (सार)". The Annals of Mathematical Statistics. 29 (2): 614.
Wu, C.F.J. (1986). "प्रतिगमन विश्लेषण में जैकनाइफ, बूटस्ट्रैप और अन्य पुन: नमूनाकरण विधियां". The Annals of Statistics. 14 (4): 1261–1295. doi:10.1214/aos/1176350142.

संदर्भ

Cameron, Adrian; Trivedi, Pravin K. (2005). Microeconometrics : methods and applications. Cambridge New York: Cambridge University Press. ISBN 9780521848053.
Efron, Bradley; Stein, Charles (May 1981). "The Jackknife Estimate of Variance". The Annals of Statistics. 9 (3): 586–596. doi:10.1214/aos/1176345462. JSTOR 2240822.
Efron, Bradley (1982). The jackknife, the bootstrap, and other resampling plans. Philadelphia, PA: Society for Industrial and Applied Mathematics. ISBN 9781611970319.
Quenouille, Maurice H. (September 1949). "Problems in Plane Sampling". The Annals of Mathematical Statistics. 20 (3): 355–375. doi:10.1214/aoms/1177729989. JSTOR 2236533.
Quenouille, Maurice H. (1956). "Notes on Bias in Estimation". Biometrika. 43 (3–4): 353–360. doi:10.1093/biomet/43.3-4.353. JSTOR 2332914.
Tukey, John W. (1958). "Bias and confidence in not quite large samples (abstract)". The Annals of Mathematical Statistics. 29 (2): 614. doi:10.1214/aoms/1177706647.

[FOOTNOTEEfron19822-1] Efron 1982, p. 2.

[FOOTNOTECameronTrivedi2005375-2] 2.0 ^2.1 ^2.2 Cameron & Trivedi 2005, p. 375.

[FOOTNOTEEfron198214-3] Efron 1982, p. 14.

[4] McIntosh, Avery I. "जैकनाइफ़ आकलन विधि" (PDF). Boston University. Avery I. McIntosh. Archived from the original (PDF) on 2016-05-14. Retrieved 2016-04-30.: p. 3.

[1]

[2]

[3]

[4]

Anonymous

Search

जैकनाइफ क्रॉस-वैलिडेशन: Difference between revisions

Namespaces

More

Page actions

Revision as of 15:12, 4 August 2023

Contents

एक सरल उदाहरण: माध्य अनुमान

आकलनकर्ता के पूर्वाग्रह का अनुमान लगाना

एक अनुमानक के विचरण का अनुमान लगाना

यह भी देखें

साहित्य

टिप्पणियाँ

संदर्भ

Navigation

Navigation

Wiki tools

Wiki tools

Revision as of 01:23, 26 July 2023 (view source) alpha>Indicwiki (Created page with "{{Short description\|Statistical method for resampling}} आंकड़ों में, जैकनाइफ (जैकनाइफ क्रॉस-वैलिडेशन)...")	Revision as of 15:12, 4 August 2023 (view source) alpha>Deepak m (Deepak moved page जैकनाइफ़ पुनः नमूनाकरण to जैकनाइफ क्रॉस-वैलिडेशन without leaving a redirect) Newer edit →
(No difference)

Anonymous

Search

जैकनाइफ क्रॉस-वैलिडेशन: Difference between revisions

Revision as of 15:12, 4 August 2023

एक सरल उदाहरण: माध्य अनुमान

आकलनकर्ता के पूर्वाग्रह का अनुमान लगाना

एक अनुमानक के विचरण का अनुमान लगाना

यह भी देखें

साहित्य

टिप्पणियाँ

संदर्भ

Navigation

Wiki tools

Page tools

Other projects

Hidden categories