सहायक आँकड़ा: Difference between revisions
No edit summary |
No edit summary |
||
Line 1: | Line 1: | ||
एक सहायक आँकड़ा एक नमूने | एक सहायक आँकड़ा एक नमूने का एक माप है जिसका वितरण (या जिसका पीएमएफ या पीडीएफ) मॉडल के मापदंडों पर निर्भर नहीं करता है।<ref>{{Cite journal |last=Lehmann |first=E. L. |last2=Scholz |first2=F. W. |date=1992 |title=सहायकता|url=https://www.jstor.org/stable/4355624 |journal=Lecture Notes-Monograph Series |volume=17 |pages=32–51 |issn=0749-2170}}</ref><ref name=fraser>{{Cite journal |last=Ghosh |first=M. |last2=Reid |first2=N. |last3=Fraser |first3=D. A. S. |date=2010 |title=Ancillary statistics: A review |url=https://www.jstor.org/stable/24309506 |journal=Statistica Sinica |volume=20 |issue=4 |pages=1309–1332 |issn=1017-0405}}</ref><ref name=":0">{{Cite book|last=Mukhopadhyay|first=Nitis|title=संभाव्यता और सांख्यिकीय अनुमान|publisher=Marcel Dekker, Inc.|year=2000|isbn=0-8247-0379-0|location=United States of America|pages=309 - 318}}</ref> सहायक आँकड़ा एक निर्णायक मात्रा है जो एक आँकड़ा भी है। पूर्वानुमान अंतराल के निर्माण के लिए सहायक सांख्यिकी का उपयोग किया जा सकता है। इनका उपयोग आंकड़ों के बीच स्वतंत्रता सिद्ध करने के लिए बसु के प्रमेय के संबंध में भी किया जाता है।<ref>{{Citation |last=Dawid |first=Philip |title=Basu on Ancillarity |date=2011 |url=https://doi.org/10.1007/978-1-4419-5825-9_2 |work=Selected Works of Debabrata Basu |pages=5–8 |editor-last=DasGupta |editor-first=Anirban |access-date=2023-04-25 |place=New York, NY |publisher=Springer |language=en |doi=10.1007/978-1-4419-5825-9_2 |isbn=978-1-4419-5825-9}}</ref> | ||
यह अवधारणा पहली बार 1920 के दशक में [[रोनाल्ड फिशर]] द्वारा प्रस्तुत की गई थी,<ref>{{Cite journal |last=Fisher |first=R. A. |date=1925 |title=सांख्यिकीय अनुमान का सिद्धांत|url=https://www.cambridge.org/core/product/identifier/S0305004100009580/type/journal_article |journal=Mathematical Proceedings of the Cambridge Philosophical Society |language=en |volume=22 |issue=5 |pages=700–725 |doi=10.1017/S0305004100009580 |issn=0305-0041}}</ref> लेकिन इसकी औपचारिक परिभाषा केवल 1964 में | |||
यह अवधारणा पहली बार 1920 के दशक में [[रोनाल्ड फिशर]] द्वारा प्रस्तुत की गई थी,<ref>{{Cite journal |last=Fisher |first=R. A. |date=1925 |title=सांख्यिकीय अनुमान का सिद्धांत|url=https://www.cambridge.org/core/product/identifier/S0305004100009580/type/journal_article |journal=Mathematical Proceedings of the Cambridge Philosophical Society |language=en |volume=22 |issue=5 |pages=700–725 |doi=10.1017/S0305004100009580 |issn=0305-0041}}</ref> लेकिन इसकी औपचारिक परिभाषा केवल 1964 में देबा बी एट अल. बस द्वारा प्रदान की गई थी।<ref>{{Cite journal |last=Basu |first=D. |date=1964 |title=सहायक सूचना की पुनर्प्राप्ति|url=https://www.jstor.org/stable/25049300 |journal=Sankhyā: The Indian Journal of Statistics, Series A (1961-2002) |volume=26 |issue=1 |pages=3–16 |issn=0581-572X}}</ref><ref>{{Citation |last=Stigler |first=Stephen M. |title=Ancillary history |date=2001 |url=http://projecteuclid.org/euclid.lnms/1215090089 |work=Institute of Mathematical Statistics Lecture Notes - Monograph Series |pages=555–567 |access-date=2023-04-24 |place=Beachwood, OH |publisher=Institute of Mathematical Statistics |language=en |doi=10.1214/lnms/1215090089 |isbn=978-0-940600-50-8}}</ref> | |||
==उदाहरण== | ==उदाहरण== | ||
मान लीजिए | मान लीजिए ''X''<sub>1</sub>, ..., ''X<sub>n</sub>'' स्वतंत्र समान रूप से वितरित यादृच्छिक चर हैं, और अज्ञात [[अपेक्षित मूल्य]] μ और ज्ञात भिन्नता 1 के साथ [[सामान्य वितरण]] हैं। | ||
:<math>\overline{X}_n = \frac{X_1+\,\cdots\,+X_n}{n}</math> | :<math>\overline{X}_n = \frac{X_1+\,\cdots\,+X_n}{n}</math> | ||
अंकगणित माध्य हो. | अंकगणित माध्य हो. | ||
नमूने के | नमूने के प्रसार के निम्नलिखित सांख्यिकीय उपाय | ||
* | *रेंज (सांख्यिकी): अधिकतम (''X''<sub>1</sub>, ..., ''X<sub>n</sub>'') - मिनट (''X''<sub>1</sub>, ..., ''X<sub>n</sub>'') | ||
*अंतरचतुर्थक सीमा: Q<sub>3</sub> − | *अंतरचतुर्थक सीमा: ''Q''<sub>3</sub> − ''Q''<sub>1</sub> | ||
* | *नमूना विचरण: | ||
:: <math>\hat{\sigma}^2:=\,\frac{\sum \left(X_i-\overline{X}\right)^2}{n}</math> | :: <math>\hat{\sigma}^2:=\,\frac{\sum \left(X_i-\overline{X}\right)^2}{n}</math> | ||
सभी सहायक आँकड़े हैं, क्योंकि उनके नमूना वितरण μ परिवर्तन के रूप में नहीं बदलते हैं। कम्प्यूटेशनल रूप से, ऐसा इसलिए है क्योंकि सूत्रों में, μ शब्द रद्द हो जाते हैं - एक वितरण (और सभी नमूनों) में एक निरंतर संख्या जोड़ने से इसका नमूना अधिकतम और न्यूनतम एक ही मात्रा में बदल जाता है, इसलिए यह उनके अंतर को नहीं बदलता है, और इसी तरह दूसरों के लिए भी: फैलाव के ये उपाय स्थान पर निर्भर नहीं करते हैं। | सभी सहायक आँकड़े हैं, क्योंकि उनके नमूना वितरण μ परिवर्तन के रूप में नहीं बदलते हैं। कम्प्यूटेशनल रूप से, ऐसा इसलिए है क्योंकि, सूत्रों में, μ शब्द रद्द हो जाते हैं - एक वितरण (और सभी नमूनों) में एक निरंतर संख्या जोड़ने से इसका नमूना अधिकतम और न्यूनतम एक ही मात्रा में बदल जाता है, इसलिए यह उनके अंतर को नहीं बदलता है, और इसी तरह दूसरों के लिए भी: फैलाव के ये उपाय स्थान पर निर्भर नहीं करते हैं। | ||
इसके विपरीत, आई.आई.डी. ज्ञात माध्य 1 और अज्ञात विचरण ''σ''<sup>2</sup> के साथ सामान्य चर, नमूना माध्य <math>\overline{X}</math> विचरण का सहायक आँकड़ा नहीं है, क्योंकि नमूना माध्य का नमूना वितरण N(1, ''σ''<sup>2</sup>/n) है, जो ''σ''<sup>2</sup> पर निर्भर करता है - स्थान का यह माप (विशेष रूप से, इसकी मानक त्रुटि) विचरण पर निर्भर करता है।<ref>{{Cite journal |last=Buehler |first=Robert J. |date=1982 |title=कुछ सहायक आँकड़े और उनके गुण|url=https://www.tandfonline.com/doi/abs/10.1080/01621459.1982.10477850 |journal=Journal of the American Statistical Association |volume=77 |issue=379 |pages=581–589 |doi=10.1080/01621459.1982.10477850 |issn=0162-1459}}</ref> | |||
=== स्थान-स्तरीय फॅमिली में === | |||
एक स्थान फॅमिली में, <math>(X_1 - X_n, X_2 - X_n, \dots, X_{n-1} - X_n)</math> एक सहायक आँकड़ा है. | |||
एक स्केल फॅमिली में, <math>(\frac{X_1}{X_n}, \frac{X_2}{X_n}, \dots, \frac{X_{n-1}}{X_n})</math> एक सहायक आँकड़ा है. | |||
एक | |||
स्थान-पैमाने पर वितरण के फॅमिली स्थान-पैमाने पर फॅमिली में, <math>(\frac{X_1 - X_n}{S}, \frac{X_2 - X_n}{S}, \dots, \frac{X_{n - 1} - X_n}{S})</math>, कहाँ <math>S^2</math> नमूना विचरण है, एक सहायक आँकड़ा है।<ref name=":0" /><ref>{{Cite web |title=सहायक आँकड़े|url=https://ani.stat.fsu.edu/~debdeep/ancillary.pdf}}</ref> | |||
== | == सूचना की पुनर्प्राप्ति में == | ||
यह पता चला है कि, अगर <math>T_1</math> एक गैर-पर्याप्त आँकड़ा है और <math>T_2</math> सहायक है, कोई भी कभी-कभी रिपोर्टिंग द्वारा संपूर्ण डेटा में निहित अज्ञात पैरामीटर के बारे में सारी | यह पता चला है कि, अगर <math>T_1</math> एक गैर-पर्याप्त आँकड़ा है और <math>T_2</math> सहायक है, कोई भी कभी-कभी रिपोर्टिंग द्वारा संपूर्ण डेटा में निहित अज्ञात पैरामीटर के बारे में सारी सूचना पुनर्प्राप्त कर सकता है <math>T_1</math> के प्रेक्षित मूल्य पर कंडीशनिंग करते समय <math>T_2</math>. इसे सशर्त अनुमान के रूप में जाना जाता है।<ref name=":0" /> | ||
उदाहरण के लिए, मान लीजिये <math>X_1, X_2</math> का पीछा करो <math>N(\theta, 1)</math> वितरण कहां <math>\theta</math> अज्ञात है। हालाँकि, ध्यान दें <math>X_1</math> के लिए पर्याप्त नहीं है <math>\theta</math> (चूंकि इसकी फिशर | उदाहरण के लिए, मान लीजिये <math>X_1, X_2</math> का पीछा करो <math>N(\theta, 1)</math> वितरण कहां <math>\theta</math> अज्ञात है। हालाँकि, ध्यान दें <math>X_1</math> के लिए पर्याप्त नहीं है <math>\theta</math> (चूंकि इसकी फिशर सूचना 1 है, जबकि फिशर सूचना पूर्ण आँकड़ा है <math>\overline{X}</math> 2 है), अतिरिक्त रूप से सहायक आँकड़ा रिपोर्ट करके <math>X_1 - X_2</math>, कोई फिशर सूचना 2 के साथ एक सम्मिलित वितरण प्राप्त करता है।<ref name=":0" /> | ||
==सहायक पूरक== | ==सहायक पूरक== | ||
एक आँकड़ा टी दिया गया है जो [[पर्याप्तता (सांख्यिकी)]] नहीं है, एक 'सहायक पूरक' एक आँकड़ा यू है जो सहायक है और ऐसा है कि (टी, यू) पर्याप्त है।<ref name=fraser></ref> सहज रूप से, एक सहायक पूरक छूटी हुई | एक आँकड़ा टी दिया गया है जो [[पर्याप्तता (सांख्यिकी)]] नहीं है, एक 'सहायक पूरक' एक आँकड़ा यू है जो सहायक है और ऐसा है कि (टी, यू) पर्याप्त है।<ref name=fraser></ref> सहज रूप से, एक सहायक पूरक छूटी हुई सूचना को जोड़ता है (बिना किसी नकल के)। | ||
यह आँकड़ा विशेष रूप से उपयोगी है यदि कोई टी को [[अधिकतम संभावना अनुमानक]] मानता है, जो सामान्य तौर पर पर्याप्त नहीं होगा; तो कोई सहायक पूरक मांग सकता है। इस मामले में, फिशर का तर्क है कि किसी को सूचना सामग्री निर्धारित करने के लिए एक सहायक पूरक पर शर्त लगानी चाहिए: किसी को टी की फिशर सूचना सामग्री को टी का सीमांत नहीं मानना चाहिए, बल्कि टी का सशर्त वितरण, दिया गया यू: कितनी | यह आँकड़ा विशेष रूप से उपयोगी है यदि कोई टी को [[अधिकतम संभावना अनुमानक]] मानता है, जो सामान्य तौर पर पर्याप्त नहीं होगा; तो कोई सहायक पूरक मांग सकता है। इस मामले में, फिशर का तर्क है कि किसी को सूचना सामग्री निर्धारित करने के लिए एक सहायक पूरक पर शर्त लगानी चाहिए: किसी को टी की फिशर सूचना सामग्री को टी का सीमांत नहीं मानना चाहिए, बल्कि टी का सशर्त वितरण, दिया गया यू: कितनी सूचना है टी जोड़ें? यह सामान्य रूप से संभव नहीं है, क्योंकि किसी सहायक पूरक की आवश्यकता मौजूद नहीं है, और यदि कोई मौजूद है, तो उसे अद्वितीय होने की आवश्यकता नहीं है, न ही अधिकतम सहायक पूरक मौजूद है। | ||
===उदाहरण=== | ===उदाहरण=== | ||
Line 49: | Line 52: | ||
* बसु का प्रमेय | * बसु का प्रमेय | ||
* भविष्यवाणी अंतराल | * भविष्यवाणी अंतराल | ||
* [[समूह परिवार]] | * [[समूह परिवार|समूह फॅमिली]] | ||
* [[सशर्तता सिद्धांत]] | * [[सशर्तता सिद्धांत]] | ||
Revision as of 19:03, 25 July 2023
एक सहायक आँकड़ा एक नमूने का एक माप है जिसका वितरण (या जिसका पीएमएफ या पीडीएफ) मॉडल के मापदंडों पर निर्भर नहीं करता है।[1][2][3] सहायक आँकड़ा एक निर्णायक मात्रा है जो एक आँकड़ा भी है। पूर्वानुमान अंतराल के निर्माण के लिए सहायक सांख्यिकी का उपयोग किया जा सकता है। इनका उपयोग आंकड़ों के बीच स्वतंत्रता सिद्ध करने के लिए बसु के प्रमेय के संबंध में भी किया जाता है।[4]
यह अवधारणा पहली बार 1920 के दशक में रोनाल्ड फिशर द्वारा प्रस्तुत की गई थी,[5] लेकिन इसकी औपचारिक परिभाषा केवल 1964 में देबा बी एट अल. बस द्वारा प्रदान की गई थी।[6][7]
उदाहरण
मान लीजिए X1, ..., Xn स्वतंत्र समान रूप से वितरित यादृच्छिक चर हैं, और अज्ञात अपेक्षित मूल्य μ और ज्ञात भिन्नता 1 के साथ सामान्य वितरण हैं।
अंकगणित माध्य हो.
नमूने के प्रसार के निम्नलिखित सांख्यिकीय उपाय
- रेंज (सांख्यिकी): अधिकतम (X1, ..., Xn) - मिनट (X1, ..., Xn)
- अंतरचतुर्थक सीमा: Q3 − Q1
- नमूना विचरण:
सभी सहायक आँकड़े हैं, क्योंकि उनके नमूना वितरण μ परिवर्तन के रूप में नहीं बदलते हैं। कम्प्यूटेशनल रूप से, ऐसा इसलिए है क्योंकि, सूत्रों में, μ शब्द रद्द हो जाते हैं - एक वितरण (और सभी नमूनों) में एक निरंतर संख्या जोड़ने से इसका नमूना अधिकतम और न्यूनतम एक ही मात्रा में बदल जाता है, इसलिए यह उनके अंतर को नहीं बदलता है, और इसी तरह दूसरों के लिए भी: फैलाव के ये उपाय स्थान पर निर्भर नहीं करते हैं।
इसके विपरीत, आई.आई.डी. ज्ञात माध्य 1 और अज्ञात विचरण σ2 के साथ सामान्य चर, नमूना माध्य विचरण का सहायक आँकड़ा नहीं है, क्योंकि नमूना माध्य का नमूना वितरण N(1, σ2/n) है, जो σ2 पर निर्भर करता है - स्थान का यह माप (विशेष रूप से, इसकी मानक त्रुटि) विचरण पर निर्भर करता है।[8]
स्थान-स्तरीय फॅमिली में
एक स्थान फॅमिली में, एक सहायक आँकड़ा है.
एक स्केल फॅमिली में, एक सहायक आँकड़ा है.
स्थान-पैमाने पर वितरण के फॅमिली स्थान-पैमाने पर फॅमिली में, , कहाँ नमूना विचरण है, एक सहायक आँकड़ा है।[3][9]
सूचना की पुनर्प्राप्ति में
यह पता चला है कि, अगर एक गैर-पर्याप्त आँकड़ा है और सहायक है, कोई भी कभी-कभी रिपोर्टिंग द्वारा संपूर्ण डेटा में निहित अज्ञात पैरामीटर के बारे में सारी सूचना पुनर्प्राप्त कर सकता है के प्रेक्षित मूल्य पर कंडीशनिंग करते समय . इसे सशर्त अनुमान के रूप में जाना जाता है।[3]
उदाहरण के लिए, मान लीजिये का पीछा करो वितरण कहां अज्ञात है। हालाँकि, ध्यान दें के लिए पर्याप्त नहीं है (चूंकि इसकी फिशर सूचना 1 है, जबकि फिशर सूचना पूर्ण आँकड़ा है 2 है), अतिरिक्त रूप से सहायक आँकड़ा रिपोर्ट करके , कोई फिशर सूचना 2 के साथ एक सम्मिलित वितरण प्राप्त करता है।[3]
सहायक पूरक
एक आँकड़ा टी दिया गया है जो पर्याप्तता (सांख्यिकी) नहीं है, एक 'सहायक पूरक' एक आँकड़ा यू है जो सहायक है और ऐसा है कि (टी, यू) पर्याप्त है।[2] सहज रूप से, एक सहायक पूरक छूटी हुई सूचना को जोड़ता है (बिना किसी नकल के)।
यह आँकड़ा विशेष रूप से उपयोगी है यदि कोई टी को अधिकतम संभावना अनुमानक मानता है, जो सामान्य तौर पर पर्याप्त नहीं होगा; तो कोई सहायक पूरक मांग सकता है। इस मामले में, फिशर का तर्क है कि किसी को सूचना सामग्री निर्धारित करने के लिए एक सहायक पूरक पर शर्त लगानी चाहिए: किसी को टी की फिशर सूचना सामग्री को टी का सीमांत नहीं मानना चाहिए, बल्कि टी का सशर्त वितरण, दिया गया यू: कितनी सूचना है टी जोड़ें? यह सामान्य रूप से संभव नहीं है, क्योंकि किसी सहायक पूरक की आवश्यकता मौजूद नहीं है, और यदि कोई मौजूद है, तो उसे अद्वितीय होने की आवश्यकता नहीं है, न ही अधिकतम सहायक पूरक मौजूद है।
उदाहरण
बेसबॉल में, मान लीजिए कि एक स्काउट एन एट-बैट में एक बल्लेबाज को देखता है। मान लीजिए (अवास्तविक रूप से) कि नंबर एन को कुछ यादृच्छिक प्रक्रिया द्वारा चुना जाता है जो बल्लेबाज की क्षमता की सांख्यिकीय स्वतंत्रता है - मान लें कि प्रत्येक बल्लेबाजी के बाद एक सिक्का उछाला जाता है और परिणाम यह निर्धारित करता है कि स्काउट बल्लेबाज की अगली बल्लेबाजी को देखने के लिए रुकेगा या नहीं . अंतिम डेटा एट-बैट की संख्या एन और हिट की संख्या एक्स है: डेटा (एक्स, एन) एक पर्याप्त आँकड़ा है। देखा गया बल्लेबाजी औसत (बेसबॉल) चैंपियन, केवल पांच एट-बैट पर आधारित 100 एट-बैट पर आधारित 0.400 औसत की तुलना में खिलाड़ी की क्षमता में कहीं भी उतना आत्मविश्वास पैदा नहीं करता है)। एट-बैट की संख्या एन एक सहायक आँकड़ा है क्योंकि
- यह अवलोकन योग्य डेटा का एक हिस्सा है (यह एक आँकड़ा है), और
- इसका संभाव्यता वितरण बल्लेबाज की क्षमता पर निर्भर नहीं करता है, क्योंकि इसे बल्लेबाज की क्षमता से स्वतंत्र एक यादृच्छिक प्रक्रिया द्वारा चुना गया था।
यह सहायक आँकड़ा प्रेक्षित बल्लेबाजी औसत X/N के लिए एक 'सहायक पूरक' है, अर्थात, बल्लेबाजी औसत एन के साथ मिलकर यह पर्याप्त हो जाता है।
यह भी देखें
- बसु का प्रमेय
- भविष्यवाणी अंतराल
- समूह फॅमिली
- सशर्तता सिद्धांत
टिप्पणियाँ
- ↑ Lehmann, E. L.; Scholz, F. W. (1992). "सहायकता". Lecture Notes-Monograph Series. 17: 32–51. ISSN 0749-2170.
- ↑ 2.0 2.1 Ghosh, M.; Reid, N.; Fraser, D. A. S. (2010). "Ancillary statistics: A review". Statistica Sinica. 20 (4): 1309–1332. ISSN 1017-0405.
- ↑ 3.0 3.1 3.2 3.3 Mukhopadhyay, Nitis (2000). संभाव्यता और सांख्यिकीय अनुमान. United States of America: Marcel Dekker, Inc. pp. 309–318. ISBN 0-8247-0379-0.
- ↑ Dawid, Philip (2011), DasGupta, Anirban (ed.), "Basu on Ancillarity", Selected Works of Debabrata Basu (in English), New York, NY: Springer, pp. 5–8, doi:10.1007/978-1-4419-5825-9_2, ISBN 978-1-4419-5825-9, retrieved 2023-04-25
- ↑ Fisher, R. A. (1925). "सांख्यिकीय अनुमान का सिद्धांत". Mathematical Proceedings of the Cambridge Philosophical Society (in English). 22 (5): 700–725. doi:10.1017/S0305004100009580. ISSN 0305-0041.
- ↑ Basu, D. (1964). "सहायक सूचना की पुनर्प्राप्ति". Sankhyā: The Indian Journal of Statistics, Series A (1961-2002). 26 (1): 3–16. ISSN 0581-572X.
- ↑ Stigler, Stephen M. (2001), "Ancillary history", Institute of Mathematical Statistics Lecture Notes - Monograph Series (in English), Beachwood, OH: Institute of Mathematical Statistics, pp. 555–567, doi:10.1214/lnms/1215090089, ISBN 978-0-940600-50-8, retrieved 2023-04-24
- ↑ Buehler, Robert J. (1982). "कुछ सहायक आँकड़े और उनके गुण". Journal of the American Statistical Association. 77 (379): 581–589. doi:10.1080/01621459.1982.10477850. ISSN 0162-1459.
- ↑ "सहायक आँकड़े" (PDF).
[Category:Statistical theo