सहायक आँकड़ा: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
 
(5 intermediate revisions by 4 users not shown)
Line 1: Line 1:
एक सहायक आँकड़ा एक नमूने (सांख्यिकी) का एक आँकड़ा है जिसका नमूना वितरण (या जिसकी संभाव्यता द्रव्यमान फ़ंक्शन या संभाव्यता घनत्व फ़ंक्शन) मॉडल के [[सांख्यिकीय]] पैरामीटर पर निर्भर नहीं करता है।<ref>{{Cite journal |last=Lehmann |first=E. L. |last2=Scholz |first2=F. W. |date=1992 |title=सहायकता|url=https://www.jstor.org/stable/4355624 |journal=Lecture Notes-Monograph Series |volume=17 |pages=32–51 |issn=0749-2170}}</ref><ref name=fraser>{{Cite journal |last=Ghosh |first=M. |last2=Reid |first2=N. |last3=Fraser |first3=D. A. S. |date=2010 |title=Ancillary statistics: A review |url=https://www.jstor.org/stable/24309506 |journal=Statistica Sinica |volume=20 |issue=4 |pages=1309–1332 |issn=1017-0405}}</ref><ref name=":0">{{Cite book|last=Mukhopadhyay|first=Nitis|title=संभाव्यता और सांख्यिकीय अनुमान|publisher=Marcel Dekker, Inc.|year=2000|isbn=0-8247-0379-0|location=United States of America|pages=309 - 318}}</ref> एक सहायक आँकड़ा एक [[निर्णायक मात्रा]] है जो एक आँकड़ा भी है। पूर्वानुमान अंतरालों के निर्माण के लिए सहायक आँकड़ों का उपयोग किया जा सकता है। इनका उपयोग सांख्यिकी के बीच स्वतंत्रता सिद्ध करने के लिए बसु के प्रमेय के संबंध में भी किया जाता है।<ref>{{Citation |last=Dawid |first=Philip |title=Basu on Ancillarity |date=2011 |url=https://doi.org/10.1007/978-1-4419-5825-9_2 |work=Selected Works of Debabrata Basu |pages=5–8 |editor-last=DasGupta |editor-first=Anirban |access-date=2023-04-25 |place=New York, NY |publisher=Springer |language=en |doi=10.1007/978-1-4419-5825-9_2 |isbn=978-1-4419-5825-9}}</ref>
'''सहायक आँकड़ा''' एक नमूने का एक माप है जिसका वितरण (या जिसका पीएमएफ या पीडीएफ) मॉडल के मापदंडों पर निर्भर नहीं करता है।<ref>{{Cite journal |last=Lehmann |first=E. L. |last2=Scholz |first2=F. W. |date=1992 |title=सहायकता|url=https://www.jstor.org/stable/4355624 |journal=Lecture Notes-Monograph Series |volume=17 |pages=32–51 |issn=0749-2170}}</ref><ref name=fraser>{{Cite journal |last=Ghosh |first=M. |last2=Reid |first2=N. |last3=Fraser |first3=D. A. S. |date=2010 |title=Ancillary statistics: A review |url=https://www.jstor.org/stable/24309506 |journal=Statistica Sinica |volume=20 |issue=4 |pages=1309–1332 |issn=1017-0405}}</ref><ref name=":0">{{Cite book|last=Mukhopadhyay|first=Nitis|title=संभाव्यता और सांख्यिकीय अनुमान|publisher=Marcel Dekker, Inc.|year=2000|isbn=0-8247-0379-0|location=United States of America|pages=309 - 318}}</ref> सहायक आँकड़ा एक निर्णायक मात्रा है जो एक आँकड़ा भी है। पूर्वानुमान अंतराल के निर्माण के लिए सहायक सांख्यिकी का उपयोग किया जा सकता है। इनका उपयोग आंकड़ों के बीच स्वतंत्रता सिद्ध करने के लिए बसु के प्रमेय के संबंध में भी किया जाता है।<ref>{{Citation |last=Dawid |first=Philip |title=Basu on Ancillarity |date=2011 |url=https://doi.org/10.1007/978-1-4419-5825-9_2 |work=Selected Works of Debabrata Basu |pages=5–8 |editor-last=DasGupta |editor-first=Anirban |access-date=2023-04-25 |place=New York, NY |publisher=Springer |language=en |doi=10.1007/978-1-4419-5825-9_2 |isbn=978-1-4419-5825-9}}</ref>
यह अवधारणा पहली बार 1920 के दशक में [[रोनाल्ड फिशर]] द्वारा प्रस्तुत की गई थी,<ref>{{Cite journal |last=Fisher |first=R. A. |date=1925 |title=सांख्यिकीय अनुमान का सिद्धांत|url=https://www.cambridge.org/core/product/identifier/S0305004100009580/type/journal_article |journal=Mathematical Proceedings of the Cambridge Philosophical Society |language=en |volume=22 |issue=5 |pages=700–725 |doi=10.1017/S0305004100009580 |issn=0305-0041}}</ref> लेकिन इसकी औपचारिक परिभाषा केवल 1964 में [[ देबा बी एट अल. बस ]] द्वारा प्रदान की गई थी।<ref>{{Cite journal |last=Basu |first=D. |date=1964 |title=सहायक सूचना की पुनर्प्राप्ति|url=https://www.jstor.org/stable/25049300 |journal=Sankhyā: The Indian Journal of Statistics, Series A (1961-2002) |volume=26 |issue=1 |pages=3–16 |issn=0581-572X}}</ref><ref>{{Citation |last=Stigler |first=Stephen M. |title=Ancillary history |date=2001 |url=http://projecteuclid.org/euclid.lnms/1215090089 |work=Institute of Mathematical Statistics Lecture Notes - Monograph Series |pages=555–567 |access-date=2023-04-24 |place=Beachwood, OH |publisher=Institute of Mathematical Statistics |language=en |doi=10.1214/lnms/1215090089 |isbn=978-0-940600-50-8}}</ref>
 


यह अवधारणा पहली बार 1920 के दशक में [[रोनाल्ड फिशर]] द्वारा प्रस्तुत की गई थी,<ref>{{Cite journal |last=Fisher |first=R. A. |date=1925 |title=सांख्यिकीय अनुमान का सिद्धांत|url=https://www.cambridge.org/core/product/identifier/S0305004100009580/type/journal_article |journal=Mathematical Proceedings of the Cambridge Philosophical Society |language=en |volume=22 |issue=5 |pages=700–725 |doi=10.1017/S0305004100009580 |issn=0305-0041}}</ref> लेकिन इसकी औपचारिक परिभाषा केवल 1964 में  देबा बी एट अल. बस  द्वारा प्रदान की गई थी।<ref>{{Cite journal |last=Basu |first=D. |date=1964 |title=सहायक सूचना की पुनर्प्राप्ति|url=https://www.jstor.org/stable/25049300 |journal=Sankhyā: The Indian Journal of Statistics, Series A (1961-2002) |volume=26 |issue=1 |pages=3–16 |issn=0581-572X}}</ref><ref>{{Citation |last=Stigler |first=Stephen M. |title=Ancillary history |date=2001 |url=http://projecteuclid.org/euclid.lnms/1215090089 |work=Institute of Mathematical Statistics Lecture Notes - Monograph Series |pages=555–567 |access-date=2023-04-24 |place=Beachwood, OH |publisher=Institute of Mathematical Statistics |language=en |doi=10.1214/lnms/1215090089 |isbn=978-0-940600-50-8}}</ref>
==उदाहरण==
==उदाहरण==


मान लीजिए एक्स<sub>1</sub>, ..., एक्स<sub>''n''</sub> [[स्वतंत्र समान रूप से वितरित यादृच्छिक चर]] हैं, और अज्ञात [[अपेक्षित मूल्य]] μ और ज्ञात भिन्नता 1 के साथ [[सामान्य वितरण]] हैं।
मान लीजिए ''X''<sub>1</sub>, ..., ''X<sub>n</sub>'' स्वतंत्र समान रूप से वितरित यादृच्छिक चर हैं, और अज्ञात [[अपेक्षित मूल्य]] μ और ज्ञात भिन्नता 1 के साथ [[सामान्य वितरण]] हैं।


:<math>\overline{X}_n = \frac{X_1+\,\cdots\,+X_n}{n}</math>
:<math>\overline{X}_n = \frac{X_1+\,\cdots\,+X_n}{n}</math>
अंकगणित माध्य हो.
अंकगणित माध्य हो.


नमूने के फैलाव के निम्नलिखित सांख्यिकीय उपाय
नमूने के प्रसार के निम्नलिखित सांख्यिकीय उपाय
*[[रेंज (सांख्यिकी)]]: अधिकतम(एक्स<sub>1</sub>, ..., एक्स<sub>''n''</sub>) - मिनट(एक्स<sub>1</sub>, ..., एक्स<sub>n</sub>)
*रेंज (सांख्यिकी): अधिकतम (''X''<sub>1</sub>, ..., ''X<sub>n</sub>'') - मिनट (''X''<sub>1</sub>, ..., ''X<sub>n</sub>'')
*अंतरचतुर्थक सीमा: Q<sub>3</sub> − प्र<sub>1</sub>
*अंतरचतुर्थक सीमा: ''Q''<sub>3</sub> − ''Q''<sub>1</sub>
*[[नमूना विचरण]]:
*नमूना विचरण:
:: <math>\hat{\sigma}^2:=\,\frac{\sum \left(X_i-\overline{X}\right)^2}{n}</math>
:: <math>\hat{\sigma}^2:=\,\frac{\sum \left(X_i-\overline{X}\right)^2}{n}</math>
सभी सहायक आँकड़े हैं, क्योंकि उनके नमूना वितरण μ परिवर्तन के रूप में नहीं बदलते हैं। कम्प्यूटेशनल रूप से, ऐसा इसलिए है क्योंकि सूत्रों में, μ शब्द रद्द हो जाते हैं - एक वितरण (और सभी नमूनों) में एक निरंतर संख्या जोड़ने से इसका नमूना अधिकतम और न्यूनतम एक ही मात्रा में बदल जाता है, इसलिए यह उनके अंतर को नहीं बदलता है, और इसी तरह दूसरों के लिए भी: फैलाव के ये उपाय स्थान पर निर्भर नहीं करते हैं।
सभी सहायक आँकड़े हैं, क्योंकि उनके नमूना वितरण μ परिवर्तन के रूप में नहीं बदलते हैं। कम्प्यूटेशनल रूप से, ऐसा इसलिए है क्योंकि, सूत्रों में, μ शब्द रद्द हो जाते हैं - एक वितरण (और सभी नमूनों) में एक निरंतर संख्या जोड़ने से इसका नमूना अधिकतम और न्यूनतम एक ही मात्रा में बदल जाता है, इसलिए यह उनके अंतर को नहीं बदलता है, और इसी तरह दूसरों के लिए भी: प्रसार के ये उपाय स्थान पर निर्भर नहीं करते हैं।
 
इसके विपरीत, आई.आई.डी. ज्ञात माध्य 1 और अज्ञात प्रसरण σ के साथ सामान्य चर<sup>2</sup>, नमूना माध्य <math>\overline{X}</math> विचरण का सहायक आँकड़ा नहीं है, क्योंकि नमूना माध्य का नमूना वितरण N(1,σ) है<sup>2</sup>/n), जो σ पर निर्भर करता है <sup>2</sup> – स्थान का यह माप (विशेष रूप से, इसकी [[मानक त्रुटि]]) फैलाव पर निर्भर करता है।<ref>{{Cite journal |last=Buehler |first=Robert J. |date=1982 |title=कुछ सहायक आँकड़े और उनके गुण|url=https://www.tandfonline.com/doi/abs/10.1080/01621459.1982.10477850 |journal=Journal of the American Statistical Association |volume=77 |issue=379 |pages=581–589 |doi=10.1080/01621459.1982.10477850 |issn=0162-1459}}</ref>
 
 
=== स्थान-स्तरीय परिवारों में ===
एक [[स्थान परिवार]] में, <math>(X_1 - X_n, X_2 - X_n, \dots, X_{n-1} - X_n)</math> एक सहायक आँकड़ा है.
 
एक [[स्केल परिवार]] में, <math>(\frac{X_1}{X_n}, \frac{X_2}{X_n}, \dots, \frac{X_{n-1}}{X_n})</math> एक सहायक आँकड़ा है.
 
स्थान-पैमाने पर वितरण के परिवार|[[स्थान-पैमाने पर परिवार]] में, <math>(\frac{X_1 - X_n}{S}, \frac{X_2 - X_n}{S}, \dots, \frac{X_{n - 1} - X_n}{S})</math>, कहाँ <math>S^2</math> नमूना विचरण है, एक सहायक आँकड़ा है।<ref name=":0" /><ref>{{Cite web |title=सहायक आँकड़े|url=https://ani.stat.fsu.edu/~debdeep/ancillary.pdf}}</ref>
 


== जानकारी की पुनर्प्राप्ति में ==
इसके विपरीत, आई.आई.डी. ज्ञात माध्य 1 और अज्ञात विचरण ''σ''<sup>2</sup> के साथ सामान्य चर, नमूना माध्य <math>\overline{X}</math> विचरण का सहायक आँकड़ा नहीं है, क्योंकि नमूना माध्य का नमूना वितरण ''N(1, σ<sup>2</sup>/n'') है, जो ''σ''<sup>2</sup> -  पर निर्भर करता है स्थान का यह माप (विशेष रूप से, इसकी मानक त्रुटि) विचरण पर निर्भर करता है।<ref>{{Cite journal |last=Buehler |first=Robert J. |date=1982 |title=कुछ सहायक आँकड़े और उनके गुण|url=https://www.tandfonline.com/doi/abs/10.1080/01621459.1982.10477850 |journal=Journal of the American Statistical Association |volume=77 |issue=379 |pages=581–589 |doi=10.1080/01621459.1982.10477850 |issn=0162-1459}}</ref>
यह पता चला है कि, अगर <math>T_1</math> एक गैर-पर्याप्त आँकड़ा है और <math>T_2</math> सहायक है, कोई भी कभी-कभी रिपोर्टिंग द्वारा संपूर्ण डेटा में निहित अज्ञात पैरामीटर के बारे में सारी जानकारी पुनर्प्राप्त कर सकता है <math>T_1</math> के प्रेक्षित मूल्य पर कंडीशनिंग करते समय <math>T_2</math>. इसे सशर्त अनुमान के रूप में जाना जाता है।<ref name=":0" />
=== स्थान-स्तरीय फॅमिली में ===
एक स्थान फॅमिली में, <math>(X_1 - X_n, X_2 - X_n, \dots, X_{n-1} - X_n)</math> एक सहायक आँकड़ा है.


उदाहरण के लिए, मान लीजिये <math>X_1, X_2</math> का पीछा करो <math>N(\theta, 1)</math> वितरण कहां <math>\theta</math> अज्ञात है। हालाँकि, ध्यान दें <math>X_1</math> के लिए पर्याप्त नहीं है <math>\theta</math> (चूंकि इसकी फिशर जानकारी 1 है, जबकि फिशर जानकारी पूर्ण आँकड़ा है <math>\overline{X}</math> 2 है), अतिरिक्त रूप से सहायक आँकड़ा रिपोर्ट करके <math>X_1 - X_2</math>, कोई फिशर जानकारी 2 के साथ एक सम्मिलित वितरण प्राप्त करता है।<ref name=":0" />
एक स्केल फॅमिली में, <math>(\frac{X_1}{X_n}, \frac{X_2}{X_n}, \dots, \frac{X_{n-1}}{X_n})</math> एक सहायक आँकड़ा है.


स्थान-पैमाने पर वितरण के फॅमिली स्थान-पैमाने पर फॅमिली में, <math>(\frac{X_1 - X_n}{S}, \frac{X_2 - X_n}{S}, \dots, \frac{X_{n - 1} - X_n}{S})</math>, जहाँ <math>S^2</math> नमूना विचरण है, एक सहायक आँकड़ा है।<ref name=":0" /><ref>{{Cite web |title=सहायक आँकड़े|url=https://ani.stat.fsu.edu/~debdeep/ancillary.pdf}}</ref>
== सूचना की पुनर्प्राप्ति में ==
यह पता चला है कि, यदि <math>T_1</math> एक गैर-पर्याप्त आँकड़ा है और <math>T_2</math> सहायक है, कोई भी कभी-कभी रिपोर्टिंग द्वारा संपूर्ण डेटा में निहित अज्ञात पैरामीटर के बारे में सारी सूचना पुनर्प्राप्त कर सकता है <math>T_1</math> के प्रेक्षित मूल्य पर अनुकूलन करते समय <math>T_2</math>. इसे सशर्त अनुमान के रूप में जाना जाता है।<ref name=":0" />


उदाहरण के लिए, मान लीजिये <math>X_1, X_2</math> का पीछा करो <math>N(\theta, 1)</math> वितरण कहां <math>\theta</math> अज्ञात है। हालाँकि, ध्यान दें <math>X_1</math> के लिए पर्याप्त नहीं है <math>\theta</math> (चूंकि इसकी फिशर सूचना 1 है, जबकि फिशर सूचना पूर्ण आँकड़ा है <math>\overline{X}</math> 2 है), अतिरिक्त रूप से सहायक आँकड़ा रिपोर्ट करके <math>X_1 - X_2</math>, कोई फिशर सूचना 2 के साथ एक सम्मिलित वितरण प्राप्त करता है।<ref name=":0" />
==सहायक पूरक==
==सहायक पूरक==
एक आँकड़ा टी दिया गया है जो [[पर्याप्तता (सांख्यिकी)]] नहीं है, एक 'सहायक पूरक' एक आँकड़ा यू है जो सहायक है और ऐसा है कि (टी, यू) पर्याप्त है।<ref name=fraser></ref> सहज रूप से, एक सहायक पूरक छूटी हुई जानकारी को जोड़ता है (बिना किसी नकल के)।
एक आँकड़ा ''T'' दिया गया है जो पर्याप्तता (सांख्यिकी) नहीं है, एक ''''सहायक पूरक'''<nowiki/>' एक आँकड़ा ''U'' है जो सहायक है और ऐसा है कि (''T'', ''U'') पर्याप्त है।<ref name=fraser></ref> सहज रूप से, एक सहायक पूरक T हुई (बिना किसी नकल के) सूचना को जोड़ता है


यह आँकड़ा विशेष रूप से उपयोगी है यदि कोई टी को [[अधिकतम संभावना अनुमानक]] मानता है, जो सामान्य तौर पर पर्याप्त नहीं होगा; तो कोई सहायक पूरक मांग सकता है। इस मामले में, फिशर का तर्क है कि किसी को सूचना सामग्री निर्धारित करने के लिए एक सहायक पूरक पर शर्त लगानी चाहिए: किसी को टी की फिशर सूचना सामग्री को टी का सीमांत नहीं मानना ​​चाहिए, बल्कि टी का सशर्त वितरण, दिया गया यू: कितनी जानकारी है टी जोड़ें? यह सामान्य रूप से संभव नहीं है, क्योंकि किसी सहायक पूरक की आवश्यकता मौजूद नहीं है, और यदि कोई मौजूद है, तो उसे अद्वितीय होने की आवश्यकता नहीं है, न ही अधिकतम सहायक पूरक मौजूद है।
यह आँकड़ा विशेष रूप से उपयोगी है यदि कोई T को अधिकतम संभावना अनुमानक मानता है, जो सामान्य तौर पर पर्याप्त नहीं होगा; तो कोई सहायक पूरक मांग सकता है। इस मामले में, फिशर का तर्क है कि किसी को सूचना सामग्री निर्धारित करने के लिए एक सहायक पूरक पर शर्त लगानी चाहिए: किसी को T की फिशर सूचना सामग्री को T का सीमांत नहीं मानना ​​चाहिए, बल्कि T का सशर्त वितरण, दिया गया ''U'' सूचना है जिसे T जोड़ें? यह सामान्य रूप से संभव नहीं है, क्योंकि किसी सहायक पूरक की आवश्यकता उपस्थित नहीं है, और यदि कोई उपस्थित है, तो उसे अद्वितीय होने की आवश्यकता नहीं है, न ही अधिकतम सहायक पूरक उपस्थित है।


===उदाहरण===
===उदाहरण===
[[बेसबॉल]] में, मान लीजिए कि एक स्काउट एन एट-बैट में एक बल्लेबाज को देखता है। मान लीजिए (अवास्तविक रूप से) कि नंबर एन को कुछ यादृच्छिक प्रक्रिया द्वारा चुना जाता है जो बल्लेबाज की क्षमता की [[सांख्यिकीय स्वतंत्रता]] है - मान लें कि प्रत्येक बल्लेबाजी के बाद एक सिक्का उछाला जाता है और परिणाम यह निर्धारित करता है कि स्काउट बल्लेबाज की अगली बल्लेबाजी को देखने के लिए रुकेगा या नहीं . अंतिम डेटा एट-बैट की संख्या एन और हिट की संख्या एक्स है: डेटा (एक्स, एन) एक पर्याप्त आँकड़ा है। देखा गया [[बल्लेबाजी औसत (बेसबॉल)]] चैंपियन, केवल पांच एट-बैट पर आधारित 100 एट-बैट पर आधारित 0.400 औसत की तुलना में खिलाड़ी की क्षमता में कहीं भी उतना आत्मविश्वास पैदा नहीं करता है)। एट-बैट की संख्या एन एक सहायक आँकड़ा है क्योंकि
[[बेसबॉल]] में, मान लीजिए कि एक स्काउट N एट-बैट (''N'' at-bats) में एक बल्लेबाज को देखता है। मान लीजिए (अवास्तविक रूप से) कि नंबर N को कुछ यादृच्छिक प्रक्रिया द्वारा चुना जाता है जो बल्लेबाज की क्षमता की सांख्यिकीय स्वतंत्रता है - मान लें कि प्रत्येक बल्लेबाजी के बाद एक सिक्का उछाला जाता है और परिणाम यह निर्धारित करता है कि स्काउट बल्लेबाज की अगली बल्लेबाजी को देखने के लिए रुकेगा या नहीं . अंतिम डेटा एट-बैट की संख्या N और हिट की संख्या एक्स है: डेटा (''X''/''N'' एक पर्याप्त आँकड़ा है। देखा गया [[बल्लेबाजी औसत (बेसबॉल)]] चैंपियन, केवल पांच एट-बैट पर आधारित 100 एट-बैट पर आधारित 0.400 औसत की तुलना में खिलाड़ी की क्षमता में कहीं भी उतना आत्मविश्वास उत्पन्न नहीं करता है)। एट-बैट की संख्या N एक सहायक आँकड़ा है क्योंकि
* यह अवलोकन योग्य डेटा का एक हिस्सा है (यह एक आँकड़ा है), और
* यह अवलोकन योग्य डेटा का एक हिस्सा है (यह एक आँकड़ा है), और
* इसका संभाव्यता वितरण बल्लेबाज की क्षमता पर निर्भर नहीं करता है, क्योंकि इसे बल्लेबाज की क्षमता से स्वतंत्र एक यादृच्छिक प्रक्रिया द्वारा चुना गया था।
* इसका संभाव्यता वितरण बल्लेबाज की क्षमता पर निर्भर नहीं करता है, क्योंकि इसे बल्लेबाज की क्षमता से स्वतंत्र एक यादृच्छिक प्रक्रिया द्वारा चुना गया था।
यह सहायक आँकड़ा प्रेक्षित बल्लेबाजी औसत X/N के लिए एक 'सहायक पूरक' है, अर्थात, बल्लेबाजी औसत एन के साथ मिलकर यह पर्याप्त हो जाता है।
यह सहायक आँकड़ा प्रेक्षित बल्लेबाजी औसत X/N के लिए एक ''''सहायक पूरक'''<nowiki/>' है, अर्थात, बल्लेबाजी औसत N के साथ मिलकर यह पर्याप्त हो जाता है।


==यह भी देखें==
==यह भी देखें==
Line 49: Line 42:
* बसु का प्रमेय
* बसु का प्रमेय
* भविष्यवाणी अंतराल
* भविष्यवाणी अंतराल
* [[समूह परिवार]]
* [[समूह परिवार|समूह फॅमिली]]
* [[सशर्तता सिद्धांत]]
* [[सशर्तता सिद्धांत]]


Line 55: Line 48:
{{reflist}}
{{reflist}}


{{DEFAULTSORT:Ancillary Statistic}}[[Category: सांख्यिकीय]] [Category:Statistical theo
{{DEFAULTSORT:Ancillary Statistic}} [Category:Statistical theo
 


[[Category: Machine Translated Page]]
[[Category:CS1 English-language sources (en)]]
[[Category:Created On 07/07/2023]]
[[Category:Created On 07/07/2023|Ancillary Statistic]]
[[Category:Machine Translated Page|Ancillary Statistic]]
[[Category:Pages with script errors|Ancillary Statistic]]
[[Category:Templates Vigyan Ready]]
[[Category:सांख्यिकीय|Ancillary Statistic]]

Latest revision as of 10:46, 7 August 2023

सहायक आँकड़ा एक नमूने का एक माप है जिसका वितरण (या जिसका पीएमएफ या पीडीएफ) मॉडल के मापदंडों पर निर्भर नहीं करता है।[1][2][3] सहायक आँकड़ा एक निर्णायक मात्रा है जो एक आँकड़ा भी है। पूर्वानुमान अंतराल के निर्माण के लिए सहायक सांख्यिकी का उपयोग किया जा सकता है। इनका उपयोग आंकड़ों के बीच स्वतंत्रता सिद्ध करने के लिए बसु के प्रमेय के संबंध में भी किया जाता है।[4]

यह अवधारणा पहली बार 1920 के दशक में रोनाल्ड फिशर द्वारा प्रस्तुत की गई थी,[5] लेकिन इसकी औपचारिक परिभाषा केवल 1964 में देबा बी एट अल. बस द्वारा प्रदान की गई थी।[6][7]

उदाहरण

मान लीजिए X1, ..., Xn स्वतंत्र समान रूप से वितरित यादृच्छिक चर हैं, और अज्ञात अपेक्षित मूल्य μ और ज्ञात भिन्नता 1 के साथ सामान्य वितरण हैं।

अंकगणित माध्य हो.

नमूने के प्रसार के निम्नलिखित सांख्यिकीय उपाय

  • रेंज (सांख्यिकी): अधिकतम (X1, ..., Xn) - मिनट (X1, ..., Xn)
  • अंतरचतुर्थक सीमा: Q3Q1
  • नमूना विचरण:

सभी सहायक आँकड़े हैं, क्योंकि उनके नमूना वितरण μ परिवर्तन के रूप में नहीं बदलते हैं। कम्प्यूटेशनल रूप से, ऐसा इसलिए है क्योंकि, सूत्रों में, μ शब्द रद्द हो जाते हैं - एक वितरण (और सभी नमूनों) में एक निरंतर संख्या जोड़ने से इसका नमूना अधिकतम और न्यूनतम एक ही मात्रा में बदल जाता है, इसलिए यह उनके अंतर को नहीं बदलता है, और इसी तरह दूसरों के लिए भी: प्रसार के ये उपाय स्थान पर निर्भर नहीं करते हैं।

इसके विपरीत, आई.आई.डी. ज्ञात माध्य 1 और अज्ञात विचरण σ2 के साथ सामान्य चर, नमूना माध्य विचरण का सहायक आँकड़ा नहीं है, क्योंकि नमूना माध्य का नमूना वितरण N(1, σ2/n) है, जो σ2 - पर निर्भर करता है स्थान का यह माप (विशेष रूप से, इसकी मानक त्रुटि) विचरण पर निर्भर करता है।[8]

स्थान-स्तरीय फॅमिली में

एक स्थान फॅमिली में, एक सहायक आँकड़ा है.

एक स्केल फॅमिली में, एक सहायक आँकड़ा है.

स्थान-पैमाने पर वितरण के फॅमिली स्थान-पैमाने पर फॅमिली में, , जहाँ नमूना विचरण है, एक सहायक आँकड़ा है।[3][9]

सूचना की पुनर्प्राप्ति में

यह पता चला है कि, यदि एक गैर-पर्याप्त आँकड़ा है और सहायक है, कोई भी कभी-कभी रिपोर्टिंग द्वारा संपूर्ण डेटा में निहित अज्ञात पैरामीटर के बारे में सारी सूचना पुनर्प्राप्त कर सकता है के प्रेक्षित मूल्य पर अनुकूलन करते समय . इसे सशर्त अनुमान के रूप में जाना जाता है।[3]

उदाहरण के लिए, मान लीजिये का पीछा करो वितरण कहां अज्ञात है। हालाँकि, ध्यान दें के लिए पर्याप्त नहीं है (चूंकि इसकी फिशर सूचना 1 है, जबकि फिशर सूचना पूर्ण आँकड़ा है 2 है), अतिरिक्त रूप से सहायक आँकड़ा रिपोर्ट करके , कोई फिशर सूचना 2 के साथ एक सम्मिलित वितरण प्राप्त करता है।[3]

सहायक पूरक

एक आँकड़ा T दिया गया है जो पर्याप्तता (सांख्यिकी) नहीं है, एक 'सहायक पूरक' एक आँकड़ा U है जो सहायक है और ऐसा है कि (T, U) पर्याप्त है।[2] सहज रूप से, एक सहायक पूरक T हुई (बिना किसी नकल के) सूचना को जोड़ता है ।

यह आँकड़ा विशेष रूप से उपयोगी है यदि कोई T को अधिकतम संभावना अनुमानक मानता है, जो सामान्य तौर पर पर्याप्त नहीं होगा; तो कोई सहायक पूरक मांग सकता है। इस मामले में, फिशर का तर्क है कि किसी को सूचना सामग्री निर्धारित करने के लिए एक सहायक पूरक पर शर्त लगानी चाहिए: किसी को T की फिशर सूचना सामग्री को T का सीमांत नहीं मानना ​​चाहिए, बल्कि T का सशर्त वितरण, दिया गया U सूचना है जिसे T जोड़ें? यह सामान्य रूप से संभव नहीं है, क्योंकि किसी सहायक पूरक की आवश्यकता उपस्थित नहीं है, और यदि कोई उपस्थित है, तो उसे अद्वितीय होने की आवश्यकता नहीं है, न ही अधिकतम सहायक पूरक उपस्थित है।

उदाहरण

बेसबॉल में, मान लीजिए कि एक स्काउट N एट-बैट (N at-bats) में एक बल्लेबाज को देखता है। मान लीजिए (अवास्तविक रूप से) कि नंबर N को कुछ यादृच्छिक प्रक्रिया द्वारा चुना जाता है जो बल्लेबाज की क्षमता की सांख्यिकीय स्वतंत्रता है - मान लें कि प्रत्येक बल्लेबाजी के बाद एक सिक्का उछाला जाता है और परिणाम यह निर्धारित करता है कि स्काउट बल्लेबाज की अगली बल्लेबाजी को देखने के लिए रुकेगा या नहीं . अंतिम डेटा एट-बैट की संख्या N और हिट की संख्या एक्स है: डेटा (X/N एक पर्याप्त आँकड़ा है। देखा गया बल्लेबाजी औसत (बेसबॉल) चैंपियन, केवल पांच एट-बैट पर आधारित 100 एट-बैट पर आधारित 0.400 औसत की तुलना में खिलाड़ी की क्षमता में कहीं भी उतना आत्मविश्वास उत्पन्न नहीं करता है)। एट-बैट की संख्या N एक सहायक आँकड़ा है क्योंकि

  • यह अवलोकन योग्य डेटा का एक हिस्सा है (यह एक आँकड़ा है), और
  • इसका संभाव्यता वितरण बल्लेबाज की क्षमता पर निर्भर नहीं करता है, क्योंकि इसे बल्लेबाज की क्षमता से स्वतंत्र एक यादृच्छिक प्रक्रिया द्वारा चुना गया था।

यह सहायक आँकड़ा प्रेक्षित बल्लेबाजी औसत X/N के लिए एक 'सहायक पूरक' है, अर्थात, बल्लेबाजी औसत N के साथ मिलकर यह पर्याप्त हो जाता है।

यह भी देखें

टिप्पणियाँ

  1. Lehmann, E. L.; Scholz, F. W. (1992). "सहायकता". Lecture Notes-Monograph Series. 17: 32–51. ISSN 0749-2170.
  2. 2.0 2.1 Ghosh, M.; Reid, N.; Fraser, D. A. S. (2010). "Ancillary statistics: A review". Statistica Sinica. 20 (4): 1309–1332. ISSN 1017-0405.
  3. 3.0 3.1 3.2 3.3 Mukhopadhyay, Nitis (2000). संभाव्यता और सांख्यिकीय अनुमान. United States of America: Marcel Dekker, Inc. pp. 309–318. ISBN 0-8247-0379-0.
  4. Dawid, Philip (2011), DasGupta, Anirban (ed.), "Basu on Ancillarity", Selected Works of Debabrata Basu (in English), New York, NY: Springer, pp. 5–8, doi:10.1007/978-1-4419-5825-9_2, ISBN 978-1-4419-5825-9, retrieved 2023-04-25
  5. Fisher, R. A. (1925). "सांख्यिकीय अनुमान का सिद्धांत". Mathematical Proceedings of the Cambridge Philosophical Society (in English). 22 (5): 700–725. doi:10.1017/S0305004100009580. ISSN 0305-0041.
  6. Basu, D. (1964). "सहायक सूचना की पुनर्प्राप्ति". Sankhyā: The Indian Journal of Statistics, Series A (1961-2002). 26 (1): 3–16. ISSN 0581-572X.
  7. Stigler, Stephen M. (2001), "Ancillary history", Institute of Mathematical Statistics Lecture Notes - Monograph Series (in English), Beachwood, OH: Institute of Mathematical Statistics, pp. 555–567, doi:10.1214/lnms/1215090089, ISBN 978-0-940600-50-8, retrieved 2023-04-24
  8. Buehler, Robert J. (1982). "कुछ सहायक आँकड़े और उनके गुण". Journal of the American Statistical Association. 77 (379): 581–589. doi:10.1080/01621459.1982.10477850. ISSN 0162-1459.
  9. "सहायक आँकड़े" (PDF).
[Category:Statistical theo