संभावना-अनुपात परीक्षण: Difference between revisions
(Created page with "{{distinguish|text=the use of likelihood ratios in diagnostic testing}} {{Short description|Statistical test to compare goodness of fit}} आंकड़ों में,...") |
No edit summary |
||
Line 2: | Line 2: | ||
{{Short description|Statistical test to compare goodness of fit}} | {{Short description|Statistical test to compare goodness of fit}} | ||
आंकड़ों में, संभावना-अनुपात परीक्षण दो प्रतिस्पर्धी [[सांख्यिकीय मॉडल]]ों के फिट होने की अच्छाई का आकलन करता है, विशेष रूप से | आंकड़ों में, संभावना-अनुपात परीक्षण दो प्रतिस्पर्धी [[सांख्यिकीय मॉडल]]ों के फिट होने की अच्छाई का आकलन करता है, विशेष रूप से पूरे [[पैरामीटर स्थान]] पर [[गणितीय अनुकूलन]] द्वारा पाया जाता है और दूसरा उनके संभावना फ़ंक्शन के अनुपात के आधार पर कुछ [[बाधा (गणित)]] लगाने के बाद पाया जाता है। यदि बाधा (यानी, [[शून्य परिकल्पना]]) को [[अहसास (संभावना)]] द्वारा समर्थित किया जाता है, तो दो संभावनाओं में [[नमूनाकरण त्रुटि]] से अधिक अंतर नहीं होना चाहिए।<ref>{{cite book |first=Gary |last=King |author-link=Gary King (political scientist) |title=Unifying Political Methodology : The Likelihood Theory of Statistical Inference |location=New York |publisher=Cambridge University Press |year=1989 |isbn=0-521-36697-6 |page=84 |url=https://books.google.com/books?id=cligOwrd7XoC&pg=PA84 }}</ref> इस प्रकार संभाव्यता-अनुपात परीक्षण परीक्षण करता है कि क्या यह अनुपात से सांख्यिकीय महत्व है, या समकक्ष क्या इसका [[प्राकृतिक]] लघुगणक शून्य से काफी भिन्न है। | ||
संभाव्यता-अनुपात परीक्षण, जिसे विल्क्स परीक्षण भी कहा जाता है,<ref>{{cite book |first1=Bing |last1=Li |first2=G. Jogesh |last2=Babu |title=सांख्यिकीय अनुमान पर एक स्नातक पाठ्यक्रम|location= |publisher=Springer |year=2019 |page=331 |isbn=978-1-4939-9759-6 }}</ref> [[लैग्रेंज गुणक परीक्षण]] और [[वाल्ड परीक्षण]] सहित, परिकल्पना परीक्षण के तीन शास्त्रीय दृष्टिकोणों में से सबसे पुराना है।<ref>{{cite book |first1=G. S. |last1=Maddala |author-link=G. S. Maddala |first2=Kajal |last2=Lahiri |title=अर्थमिति का परिचय|location=New York |publisher=Wiley |edition=Fourth |year=2010 |page=200 }}</ref> वास्तव में, बाद वाले दो को संभावना-अनुपात परीक्षण के सन्निकटन के रूप में परिकल्पित किया जा सकता है, और स्पर्शोन्मुख रूप से समतुल्य हैं।<ref>{{cite journal |first=A. |last=Buse |title=The Likelihood Ratio, Wald, and Lagrange Multiplier Tests: An Expository Note |journal=[[The American Statistician]] |volume=36 |issue=3a |year=1982 |pages=153–157 |doi=10.1080/00031305.1982.10482817 }}</ref><ref>{{cite book |first=Andrew |last=Pickles |title=संभावना विश्लेषण का एक परिचय|location=Norwich |publisher=W. H. Hutchins & Sons |year=1985 |isbn=0-86094-190-6 |pages=[https://archive.org/details/introductiontoli0000pick/page/24 24–27] |url=https://archive.org/details/introductiontoli0000pick/page/24 }}</ref><ref>{{cite book |first=Thomas A. |last=Severini |title=सांख्यिकी में संभावना पद्धतियाँ|location=New York |publisher=Oxford University Press |year=2000 |isbn=0-19-850650-3 |pages=120–121 }}</ref> दो मॉडलों की तुलना करने के मामले में, जिनमें से प्रत्येक में कोई अज्ञात [[सांख्यिकीय पैरामीटर]] नहीं है, संभावना-अनुपात परीक्षण का उपयोग नेमैन-पियर्सन लेम्मा द्वारा उचित ठहराया जा सकता है। लेम्मा दर्शाता है कि परीक्षण में सभी प्रतिस्पर्धियों के बीच उच्चतम [[सांख्यिकीय शक्ति]] है।<ref name="NeymanPearson1933">{{citation | last1 = Neyman | first1 = J. | author-link1 = Jerzy Neyman| last2 = Pearson | first2 = E. S. | author-link2 = Egon Pearson| doi = 10.1098/rsta.1933.0009 | title = On the problem of the most efficient tests of statistical hypotheses | journal = [[Philosophical Transactions of the Royal Society of London A]] | volume = 231 | issue = 694–706 | pages = 289–337 | year = 1933 | jstor = 91247 |bibcode = 1933RSPTA.231..289N | url = http://www.stats.org.uk/statistical-inference/NeymanPearson1933.pdf | doi-access = free }}</ref> | संभाव्यता-अनुपात परीक्षण, जिसे विल्क्स परीक्षण भी कहा जाता है,<ref>{{cite book |first1=Bing |last1=Li |first2=G. Jogesh |last2=Babu |title=सांख्यिकीय अनुमान पर एक स्नातक पाठ्यक्रम|location= |publisher=Springer |year=2019 |page=331 |isbn=978-1-4939-9759-6 }}</ref> [[लैग्रेंज गुणक परीक्षण]] और [[वाल्ड परीक्षण]] सहित, परिकल्पना परीक्षण के तीन शास्त्रीय दृष्टिकोणों में से सबसे पुराना है।<ref>{{cite book |first1=G. S. |last1=Maddala |author-link=G. S. Maddala |first2=Kajal |last2=Lahiri |title=अर्थमिति का परिचय|location=New York |publisher=Wiley |edition=Fourth |year=2010 |page=200 }}</ref> वास्तव में, बाद वाले दो को संभावना-अनुपात परीक्षण के सन्निकटन के रूप में परिकल्पित किया जा सकता है, और स्पर्शोन्मुख रूप से समतुल्य हैं।<ref>{{cite journal |first=A. |last=Buse |title=The Likelihood Ratio, Wald, and Lagrange Multiplier Tests: An Expository Note |journal=[[The American Statistician]] |volume=36 |issue=3a |year=1982 |pages=153–157 |doi=10.1080/00031305.1982.10482817 }}</ref><ref>{{cite book |first=Andrew |last=Pickles |title=संभावना विश्लेषण का एक परिचय|location=Norwich |publisher=W. H. Hutchins & Sons |year=1985 |isbn=0-86094-190-6 |pages=[https://archive.org/details/introductiontoli0000pick/page/24 24–27] |url=https://archive.org/details/introductiontoli0000pick/page/24 }}</ref><ref>{{cite book |first=Thomas A. |last=Severini |title=सांख्यिकी में संभावना पद्धतियाँ|location=New York |publisher=Oxford University Press |year=2000 |isbn=0-19-850650-3 |pages=120–121 }}</ref> दो मॉडलों की तुलना करने के मामले में, जिनमें से प्रत्येक में कोई अज्ञात [[सांख्यिकीय पैरामीटर]] नहीं है, संभावना-अनुपात परीक्षण का उपयोग नेमैन-पियर्सन लेम्मा द्वारा उचित ठहराया जा सकता है। लेम्मा दर्शाता है कि परीक्षण में सभी प्रतिस्पर्धियों के बीच उच्चतम [[सांख्यिकीय शक्ति]] है।<ref name="NeymanPearson1933">{{citation | last1 = Neyman | first1 = J. | author-link1 = Jerzy Neyman| last2 = Pearson | first2 = E. S. | author-link2 = Egon Pearson| doi = 10.1098/rsta.1933.0009 | title = On the problem of the most efficient tests of statistical hypotheses | journal = [[Philosophical Transactions of the Royal Society of London A]] | volume = 231 | issue = 694–706 | pages = 289–337 | year = 1933 | jstor = 91247 |bibcode = 1933RSPTA.231..289N | url = http://www.stats.org.uk/statistical-inference/NeymanPearson1933.pdf | doi-access = free }}</ref> | ||
Line 10: | Line 10: | ||
===सामान्य=== | ===सामान्य=== | ||
मान लीजिए कि हमारे पास [[सांख्यिकीय पैरामीटर]] वाला | मान लीजिए कि हमारे पास [[सांख्यिकीय पैरामीटर]] वाला सांख्यिकीय मॉडल है <math>\Theta</math>. शून्य परिकल्पना को अक्सर पैरामीटर कहकर बताया जाता है <math>\theta</math> निर्दिष्ट उपसमुच्चय में है <math>\Theta_0</math> का <math>\Theta</math>. [[वैकल्पिक परिकल्पना]] इस प्रकार है <math>\theta</math> के [[पूरक (सेट सिद्धांत)]] में है <math>\Theta_0</math>, यानी में <math>\Theta ~ \backslash ~ \Theta_0</math>, जिसे द्वारा दर्शाया जाता है <math>\Theta_0^\text{c}</math>. शून्य परिकल्पना के लिए संभावना अनुपात परीक्षण आँकड़ा <math>H_0 \, : \, \theta \in \Theta_0</math> द्वारा दिया गया है:<ref>{{cite book |first=Karl-Rudolf |last=Koch |author-link=Karl-Rudolf Koch |title=रैखिक मॉडल में पैरामीटर अनुमान और परिकल्पना परीक्षण|url=https://archive.org/details/parameterestimat0000koch |url-access=registration |location=New York |publisher=Springer |year=1988 |isbn=0-387-18840-1 |page=[https://archive.org/details/parameterestimat0000koch/page/306 306]}}</ref> | ||
:<math>\lambda_\text{LR} = -2 \ln \left[ \frac{~ \sup_{\theta \in \Theta_0} \mathcal{L}(\theta) ~}{~ \sup_{\theta \in \Theta} \mathcal{L}(\theta) ~} \right]</math> | :<math>\lambda_\text{LR} = -2 \ln \left[ \frac{~ \sup_{\theta \in \Theta_0} \mathcal{L}(\theta) ~}{~ \sup_{\theta \in \Theta} \mathcal{L}(\theta) ~} \right]</math> | ||
जहां कोष्ठक के अंदर की मात्रा को संभावना अनुपात कहा जाता है। यहां ही <math>\sup</math> अंकन सर्वोच्च को संदर्भित करता है। चूँकि सभी संभावनाएँ सकारात्मक हैं, और चूँकि बाधित अधिकतम अप्रतिबंधित अधिकतम से अधिक नहीं हो सकता है, संभावना अनुपात शून्य और | जहां कोष्ठक के अंदर की मात्रा को संभावना अनुपात कहा जाता है। यहां ही <math>\sup</math> अंकन सर्वोच्च को संदर्भित करता है। चूँकि सभी संभावनाएँ सकारात्मक हैं, और चूँकि बाधित अधिकतम अप्रतिबंधित अधिकतम से अधिक नहीं हो सकता है, संभावना अनुपात शून्य और के बीच निर्धारित है। | ||
अक्सर संभावना-अनुपात परीक्षण आँकड़ा लॉग-संभावनाओं के बीच अंतर के रूप में व्यक्त किया जाता है | अक्सर संभावना-अनुपात परीक्षण आँकड़ा लॉग-संभावनाओं के बीच अंतर के रूप में व्यक्त किया जाता है | ||
Line 23: | Line 23: | ||
संभावना-अनुपात परीक्षण के लिए आवश्यक है कि मॉडल सांख्यिकीय मॉडल#नेस्टेड मॉडल हों - यानी अधिक जटिल मॉडल को पहले के मापदंडों पर बाधाएं लगाकर सरल मॉडल में बदला जा सकता है। कई सामान्य परीक्षण आँकड़े नेस्टेड मॉडल के लिए परीक्षण हैं और इन्हें लॉग-संभावना अनुपात या उसके अनुमान के रूप में व्यक्त किया जा सकता है: उदाहरण के लिए Z-परीक्षण|Z-परीक्षण, F-परीक्षण|F-परीक्षण, G-परीक्षण|G-परीक्षण, और पियर्सन का ची-स्क्वेर्ड परीक्षण; विद्यार्थी के t-test#One-sample t-test|one-sample t-test के उदाहरण के लिए, नीचे देखें। | संभावना-अनुपात परीक्षण के लिए आवश्यक है कि मॉडल सांख्यिकीय मॉडल#नेस्टेड मॉडल हों - यानी अधिक जटिल मॉडल को पहले के मापदंडों पर बाधाएं लगाकर सरल मॉडल में बदला जा सकता है। कई सामान्य परीक्षण आँकड़े नेस्टेड मॉडल के लिए परीक्षण हैं और इन्हें लॉग-संभावना अनुपात या उसके अनुमान के रूप में व्यक्त किया जा सकता है: उदाहरण के लिए Z-परीक्षण|Z-परीक्षण, F-परीक्षण|F-परीक्षण, G-परीक्षण|G-परीक्षण, और पियर्सन का ची-स्क्वेर्ड परीक्षण; विद्यार्थी के t-test#One-sample t-test|one-sample t-test के उदाहरण के लिए, नीचे देखें। | ||
यदि मॉडल नेस्टेड नहीं हैं, तो संभावना-अनुपात परीक्षण के बजाय, परीक्षण का | यदि मॉडल नेस्टेड नहीं हैं, तो संभावना-अनुपात परीक्षण के बजाय, परीक्षण का सामान्यीकरण होता है जिसका आमतौर पर उपयोग किया जा सकता है: विवरण के लिए, [[सापेक्ष संभावना]] देखें। | ||
===सरल परिकल्पनाओं का मामला=== | ===सरल परिकल्पनाओं का मामला=== | ||
{{Main|Neyman–Pearson lemma}} | {{Main|Neyman–Pearson lemma}} | ||
सरल-बनाम-सरल परिकल्पना परीक्षण में शून्य परिकल्पना और वैकल्पिक परिकल्पना दोनों के तहत पूरी तरह से निर्दिष्ट मॉडल होते हैं, जो सुविधा के लिए काल्पनिक पैरामीटर के निश्चित मूल्यों के संदर्भ में लिखे जाते हैं। <math>\theta</math>: | |||
:<math> | :<math> | ||
Line 35: | Line 35: | ||
\end{align} | \end{align} | ||
</math> | </math> | ||
इस मामले में, किसी भी परिकल्पना के तहत, डेटा का वितरण पूरी तरह से निर्दिष्ट है: अनुमान लगाने के लिए कोई अज्ञात पैरामीटर नहीं हैं। इस मामले के लिए, संभावना-अनुपात परीक्षण का | इस मामले में, किसी भी परिकल्पना के तहत, डेटा का वितरण पूरी तरह से निर्दिष्ट है: अनुमान लगाने के लिए कोई अज्ञात पैरामीटर नहीं हैं। इस मामले के लिए, संभावना-अनुपात परीक्षण का प्रकार उपलब्ध है:<ref>{{cite book |last1=Mood |first1=A.M. |last2=Graybill |first2=F.A. |first3=D.C. |last3=Boes |year=1974 |title=सांख्यिकी के सिद्धांत का परिचय|edition=3rd |publisher=[[McGraw-Hill]] |at=§9.2}}</ref><रेफरी नाम= स्टुअर्ट एट अल। 20.10–20.13 >{{citation |last1=Stuart|first1=A. |last2=Ord |first2=K. |last3=Arnold |first3=S. |year=1999 |title=Kendall's Advanced Theory of Statistics |volume=2A |publisher=[[Edward Arnold (publisher)|Arnold]] |at=§§20.10–20.13}}</ref> | ||
:<math> | :<math> | ||
Line 48: | Line 48: | ||
:अगर <math>~\Lambda = c ~</math>, अस्वीकार करना <math>H_0</math> संभाव्यता के साथ <math>~q~</math>. | :अगर <math>~\Lambda = c ~</math>, अस्वीकार करना <math>H_0</math> संभाव्यता के साथ <math>~q~</math>. | ||
: | : | ||
मूल्य <math>c</math> और <math>q</math> आमतौर पर | मूल्य <math>c</math> और <math>q</math> आमतौर पर निर्दिष्ट महत्व स्तर प्राप्त करने के लिए चुना जाता है <math>\alpha</math>, संबंध के माध्यम से | ||
:<math>~q~</math> <math> \operatorname{P}(\Lambda=c \mid H_0)~+~\operatorname{P}(\Lambda < c \mid H_0)~=~\alpha~. </math> | :<math>~q~</math> <math> \operatorname{P}(\Lambda=c \mid H_0)~+~\operatorname{P}(\Lambda < c \mid H_0)~=~\alpha~. </math> | ||
नेमैन-पियर्सन लेम्मा का कहना है कि यह संभावना-अनुपात परीक्षण सभी स्तरों के बीच सांख्यिकीय शक्ति है <math>\alpha</math> इस मामले के लिए परीक्षण.<ref name="NeymanPearson1933"/><रेफरी नाम= स्टुअर्ट एट अल। 20.10–20.13 /> | नेमैन-पियर्सन लेम्मा का कहना है कि यह संभावना-अनुपात परीक्षण सभी स्तरों के बीच सांख्यिकीय शक्ति है <math>\alpha</math> इस मामले के लिए परीक्षण.<ref name="NeymanPearson1933"/><रेफरी नाम= स्टुअर्ट एट अल। 20.10–20.13 /> | ||
==व्याख्या== | ==व्याख्या== | ||
संभावना अनुपात डेटा का | संभावना अनुपात डेटा का कार्य है <math>x</math>; इसलिए, यह आँकड़ा है, हालाँकि यह असामान्य है कि आँकड़े का मान पैरामीटर पर निर्भर करता है, <math>\theta</math>. यदि इस आँकड़े का मान बहुत छोटा है तो संभावना-अनुपात परीक्षण शून्य परिकल्पना को अस्वीकार कर देता है। कितना छोटा कितना छोटा है यह परीक्षण के महत्व स्तर पर निर्भर करता है, यानी टाइप I त्रुटि की किस संभावना को सहनीय माना जाता है (टाइप I त्रुटियों में अशक्त परिकल्पना की अस्वीकृति शामिल होती है जो सत्य है)। | ||
अंश शून्य परिकल्पना के तहत देखे गए परिणाम की संभावना से मेल खाता है। हर | अंश शून्य परिकल्पना के तहत देखे गए परिणाम की संभावना से मेल खाता है। हर देखे गए परिणाम की अधिकतम संभावना से मेल खाता है, पूरे पैरा[[मीटर]] स्थान पर अलग-अलग पैरामीटर। इस अनुपात का अंश हर से कम है; इसलिए, संभावना अनुपात 0 और 1 के बीच है। संभावना अनुपात के कम मूल्यों का मतलब है कि देखे गए परिणाम विकल्प की तुलना में शून्य परिकल्पना के तहत घटित होने की बहुत कम संभावना थी। आँकड़ों के उच्च मूल्यों का मतलब है कि देखा गया परिणाम शून्य परिकल्पना के तहत विकल्प के रूप में घटित होने की लगभग संभावना थी, और इसलिए शून्य परिकल्पना को अस्वीकार नहीं किया जा सकता है। | ||
=== | ===उदाहरण=== | ||
निम्नलिखित उदाहरण से अनुकूलित और संक्षिप्त किया गया है {{Harvtxt|Stuart|Ord|Arnold|1999|loc=§22.2}}. | निम्नलिखित उदाहरण से अनुकूलित और संक्षिप्त किया गया है {{Harvtxt|Stuart|Ord|Arnold|1999|loc=§22.2}}. | ||
मान लीजिए कि हमारे पास आकार का | मान लीजिए कि हमारे पास आकार का यादृच्छिक नमूना है {{mvar|n}}, ऐसी आबादी से जो सामान्य रूप से वितरित है। दोनों का मतलब, {{mvar|μ}}, और मानक विचलन, {{mvar|σ}}, जनसंख्या अज्ञात है। हम परीक्षण करना चाहते हैं कि माध्य किसी दिए गए मान के बराबर है या नहीं, {{math|''μ''{{sub|0}} }}. | ||
इस प्रकार, हमारी शून्य परिकल्पना है {{math|''H''{{sub|0}}: ''μ'' {{=}} ''μ''{{sub|0}} }} और हमारी वैकल्पिक परिकल्पना है {{math|''H''{{sub|1}}: ''μ'' ≠ ''μ''{{sub|0}} }}. संभाव्यता फलन है | इस प्रकार, हमारी शून्य परिकल्पना है {{math|''H''{{sub|0}}: ''μ'' {{=}} ''μ''{{sub|0}} }} और हमारी वैकल्पिक परिकल्पना है {{math|''H''{{sub|1}}: ''μ'' ≠ ''μ''{{sub|0}} }}. संभाव्यता फलन है | ||
Line 72: | Line 72: | ||
यदि किसी विशेष शून्य और वैकल्पिक परिकल्पना के अनुरूप संभावना अनुपात का वितरण स्पष्ट रूप से निर्धारित किया जा सकता है तो इसका उपयोग सीधे निर्णय क्षेत्र बनाने (शून्य परिकल्पना को बनाए रखने या अस्वीकार करने के लिए) के लिए किया जा सकता है। हालाँकि, ज्यादातर मामलों में, विशिष्ट परिकल्पनाओं के अनुरूप संभावना अनुपात का सटीक वितरण निर्धारित करना बहुत मुश्किल है।{{Citation needed|date=September 2018}} | यदि किसी विशेष शून्य और वैकल्पिक परिकल्पना के अनुरूप संभावना अनुपात का वितरण स्पष्ट रूप से निर्धारित किया जा सकता है तो इसका उपयोग सीधे निर्णय क्षेत्र बनाने (शून्य परिकल्पना को बनाए रखने या अस्वीकार करने के लिए) के लिए किया जा सकता है। हालाँकि, ज्यादातर मामलों में, विशिष्ट परिकल्पनाओं के अनुरूप संभावना अनुपात का सटीक वितरण निर्धारित करना बहुत मुश्किल है।{{Citation needed|date=September 2018}} | ||
यह मानते हुए {{math|''H''<sub>0</sub>}} सच है, सैमुअल एस विल्क्स द्वारा | यह मानते हुए {{math|''H''<sub>0</sub>}} सच है, सैमुअल एस विल्क्स द्वारा मौलिक परिणाम है: नमूना आकार के रूप में <math>n</math> अनंत तक पहुंचता है|<math>\infty</math>, परीक्षण आँकड़ा <math>\lambda_\text{LR}</math> ऊपर परिभाषित एसिम्प्टोटिक सिद्धांत (सांख्यिकी) ची-स्क्वेर्ड वितरण होगा | ची-स्क्वेर्ड वितरित (<math>\chi^2</math>) [[स्वतंत्रता की डिग्री (सांख्यिकी)]] के साथ आयामीता में अंतर के बराबर <math>\Theta</math> और <math>\Theta_0</math>.<ref>{{cite journal |last=Wilks |first=S.S. |author-link=Samuel S. Wilks |doi=10.1214/aoms/1177732360 |title=मिश्रित परिकल्पनाओं के परीक्षण के लिए संभावना अनुपात का बड़ा-नमूना वितरण|journal=[[Annals of Mathematical Statistics]] |volume=9 |issue=1 |pages=60–62 |year=1938 |doi-access=free}}</ref> इसका तात्पर्य यह है कि विभिन्न प्रकार की परिकल्पनाओं के लिए, हम संभावना अनुपात की गणना कर सकते हैं <math>\lambda</math> डेटा के लिए और फिर देखे गए की तुलना करें <math>\lambda_\text{LR}</math> तक <math>\chi^2</math> अनुमानित सांख्यिकीय परीक्षण के रूप में वांछित सांख्यिकीय महत्व के अनुरूप मूल्य। अन्य ्सटेंशन मौजूद हैं.{{which|date=March 2019}} | ||
==यह भी देखें== | ==यह भी देखें== |
Revision as of 15:10, 11 July 2023
आंकड़ों में, संभावना-अनुपात परीक्षण दो प्रतिस्पर्धी सांख्यिकीय मॉडलों के फिट होने की अच्छाई का आकलन करता है, विशेष रूप से पूरे पैरामीटर स्थान पर गणितीय अनुकूलन द्वारा पाया जाता है और दूसरा उनके संभावना फ़ंक्शन के अनुपात के आधार पर कुछ बाधा (गणित) लगाने के बाद पाया जाता है। यदि बाधा (यानी, शून्य परिकल्पना) को अहसास (संभावना) द्वारा समर्थित किया जाता है, तो दो संभावनाओं में नमूनाकरण त्रुटि से अधिक अंतर नहीं होना चाहिए।[1] इस प्रकार संभाव्यता-अनुपात परीक्षण परीक्षण करता है कि क्या यह अनुपात से सांख्यिकीय महत्व है, या समकक्ष क्या इसका प्राकृतिक लघुगणक शून्य से काफी भिन्न है।
संभाव्यता-अनुपात परीक्षण, जिसे विल्क्स परीक्षण भी कहा जाता है,[2] लैग्रेंज गुणक परीक्षण और वाल्ड परीक्षण सहित, परिकल्पना परीक्षण के तीन शास्त्रीय दृष्टिकोणों में से सबसे पुराना है।[3] वास्तव में, बाद वाले दो को संभावना-अनुपात परीक्षण के सन्निकटन के रूप में परिकल्पित किया जा सकता है, और स्पर्शोन्मुख रूप से समतुल्य हैं।[4][5][6] दो मॉडलों की तुलना करने के मामले में, जिनमें से प्रत्येक में कोई अज्ञात सांख्यिकीय पैरामीटर नहीं है, संभावना-अनुपात परीक्षण का उपयोग नेमैन-पियर्सन लेम्मा द्वारा उचित ठहराया जा सकता है। लेम्मा दर्शाता है कि परीक्षण में सभी प्रतिस्पर्धियों के बीच उच्चतम सांख्यिकीय शक्ति है।[7]
परिभाषा
सामान्य
मान लीजिए कि हमारे पास सांख्यिकीय पैरामीटर वाला सांख्यिकीय मॉडल है . शून्य परिकल्पना को अक्सर पैरामीटर कहकर बताया जाता है निर्दिष्ट उपसमुच्चय में है का . वैकल्पिक परिकल्पना इस प्रकार है के पूरक (सेट सिद्धांत) में है , यानी में , जिसे द्वारा दर्शाया जाता है . शून्य परिकल्पना के लिए संभावना अनुपात परीक्षण आँकड़ा द्वारा दिया गया है:[8]
जहां कोष्ठक के अंदर की मात्रा को संभावना अनुपात कहा जाता है। यहां ही अंकन सर्वोच्च को संदर्भित करता है। चूँकि सभी संभावनाएँ सकारात्मक हैं, और चूँकि बाधित अधिकतम अप्रतिबंधित अधिकतम से अधिक नहीं हो सकता है, संभावना अनुपात शून्य और के बीच निर्धारित है।
अक्सर संभावना-अनुपात परीक्षण आँकड़ा लॉग-संभावनाओं के बीच अंतर के रूप में व्यक्त किया जाता है
कहाँ
अधिकतम संभावना फ़ंक्शन का लघुगणक है , और विशेष मामले में अधिकतम मान है कि शून्य परिकल्पना सत्य है (लेकिन जरूरी नहीं कि ऐसा मान हो जो अधिकतम हो नमूना किए गए डेटा के लिए) और
संबंधित arg अधिकतम और उन अनुमत श्रेणियों को निरूपित करें जिनमें वे अंतर्निहित हैं। -2 से गुणा करने पर गणितीय रूप से यह सुनिश्चित होता है (विल्क्स प्रमेय द्वारा) ची-वर्ग वितरण होने के लिए स्पर्शोन्मुख रूप से अभिसरण होता है|χ²-वितरित यदि शून्य परिकल्पना सत्य होती है।[9] संभावना-अनुपात परीक्षणों के नमूनाकरण वितरण आम तौर पर अज्ञात हैं।[10] संभावना-अनुपात परीक्षण के लिए आवश्यक है कि मॉडल सांख्यिकीय मॉडल#नेस्टेड मॉडल हों - यानी अधिक जटिल मॉडल को पहले के मापदंडों पर बाधाएं लगाकर सरल मॉडल में बदला जा सकता है। कई सामान्य परीक्षण आँकड़े नेस्टेड मॉडल के लिए परीक्षण हैं और इन्हें लॉग-संभावना अनुपात या उसके अनुमान के रूप में व्यक्त किया जा सकता है: उदाहरण के लिए Z-परीक्षण|Z-परीक्षण, F-परीक्षण|F-परीक्षण, G-परीक्षण|G-परीक्षण, और पियर्सन का ची-स्क्वेर्ड परीक्षण; विद्यार्थी के t-test#One-sample t-test|one-sample t-test के उदाहरण के लिए, नीचे देखें।
यदि मॉडल नेस्टेड नहीं हैं, तो संभावना-अनुपात परीक्षण के बजाय, परीक्षण का सामान्यीकरण होता है जिसका आमतौर पर उपयोग किया जा सकता है: विवरण के लिए, सापेक्ष संभावना देखें।
सरल परिकल्पनाओं का मामला
सरल-बनाम-सरल परिकल्पना परीक्षण में शून्य परिकल्पना और वैकल्पिक परिकल्पना दोनों के तहत पूरी तरह से निर्दिष्ट मॉडल होते हैं, जो सुविधा के लिए काल्पनिक पैरामीटर के निश्चित मूल्यों के संदर्भ में लिखे जाते हैं। :
इस मामले में, किसी भी परिकल्पना के तहत, डेटा का वितरण पूरी तरह से निर्दिष्ट है: अनुमान लगाने के लिए कोई अज्ञात पैरामीटर नहीं हैं। इस मामले के लिए, संभावना-अनुपात परीक्षण का प्रकार उपलब्ध है:[11]<रेफरी नाम= स्टुअर्ट एट अल। 20.10–20.13 >Stuart, A.; Ord, K.; Arnold, S. (1999), Kendall's Advanced Theory of Statistics, vol. 2A, Arnold, §§20.10–20.13</ref>
कुछ पुराने संदर्भ उपरोक्त फ़ंक्शन के व्युत्क्रम को परिभाषा के रूप में उपयोग कर सकते हैं।[12] इस प्रकार, यदि वैकल्पिक मॉडल शून्य मॉडल से बेहतर है तो संभावना अनुपात छोटा है।
संभाव्यता-अनुपात परीक्षण निम्नानुसार निर्णय नियम प्रदान करता है:
- अगर , अस्वीकार मत करो ;
- अगर , अस्वीकार करना ;
- अगर , अस्वीकार करना संभाव्यता के साथ .
मूल्य और आमतौर पर निर्दिष्ट महत्व स्तर प्राप्त करने के लिए चुना जाता है , संबंध के माध्यम से
नेमैन-पियर्सन लेम्मा का कहना है कि यह संभावना-अनुपात परीक्षण सभी स्तरों के बीच सांख्यिकीय शक्ति है इस मामले के लिए परीक्षण.[7]<रेफरी नाम= स्टुअर्ट एट अल। 20.10–20.13 />
व्याख्या
संभावना अनुपात डेटा का कार्य है ; इसलिए, यह आँकड़ा है, हालाँकि यह असामान्य है कि आँकड़े का मान पैरामीटर पर निर्भर करता है, . यदि इस आँकड़े का मान बहुत छोटा है तो संभावना-अनुपात परीक्षण शून्य परिकल्पना को अस्वीकार कर देता है। कितना छोटा कितना छोटा है यह परीक्षण के महत्व स्तर पर निर्भर करता है, यानी टाइप I त्रुटि की किस संभावना को सहनीय माना जाता है (टाइप I त्रुटियों में अशक्त परिकल्पना की अस्वीकृति शामिल होती है जो सत्य है)।
अंश शून्य परिकल्पना के तहत देखे गए परिणाम की संभावना से मेल खाता है। हर देखे गए परिणाम की अधिकतम संभावना से मेल खाता है, पूरे पैरामीटर स्थान पर अलग-अलग पैरामीटर। इस अनुपात का अंश हर से कम है; इसलिए, संभावना अनुपात 0 और 1 के बीच है। संभावना अनुपात के कम मूल्यों का मतलब है कि देखे गए परिणाम विकल्प की तुलना में शून्य परिकल्पना के तहत घटित होने की बहुत कम संभावना थी। आँकड़ों के उच्च मूल्यों का मतलब है कि देखा गया परिणाम शून्य परिकल्पना के तहत विकल्प के रूप में घटित होने की लगभग संभावना थी, और इसलिए शून्य परिकल्पना को अस्वीकार नहीं किया जा सकता है।
उदाहरण
निम्नलिखित उदाहरण से अनुकूलित और संक्षिप्त किया गया है Stuart, Ord & Arnold (1999, §22.2).
मान लीजिए कि हमारे पास आकार का यादृच्छिक नमूना है n, ऐसी आबादी से जो सामान्य रूप से वितरित है। दोनों का मतलब, μ, और मानक विचलन, σ, जनसंख्या अज्ञात है। हम परीक्षण करना चाहते हैं कि माध्य किसी दिए गए मान के बराबर है या नहीं, μ0 .
इस प्रकार, हमारी शून्य परिकल्पना है H0: μ = μ0 और हमारी वैकल्पिक परिकल्पना है H1: μ ≠ μ0 . संभाव्यता फलन है
कुछ गणना (यहां छोड़ दी गई) के साथ, इसे दिखाया जा सकता है
- कहाँ t टी-सांख्यिकी है|t-सांख्यिकी के साथ n − 1 स्वतंत्रता की कोटियां। इसलिए हम ज्ञात सटीक वितरण का उपयोग कर सकते हैं tn−1 निष्कर्ष निकालने के लिए.
स्पर्शोन्मुख वितरण: विल्क्स प्रमेय
यदि किसी विशेष शून्य और वैकल्पिक परिकल्पना के अनुरूप संभावना अनुपात का वितरण स्पष्ट रूप से निर्धारित किया जा सकता है तो इसका उपयोग सीधे निर्णय क्षेत्र बनाने (शून्य परिकल्पना को बनाए रखने या अस्वीकार करने के लिए) के लिए किया जा सकता है। हालाँकि, ज्यादातर मामलों में, विशिष्ट परिकल्पनाओं के अनुरूप संभावना अनुपात का सटीक वितरण निर्धारित करना बहुत मुश्किल है।[citation needed]
यह मानते हुए H0 सच है, सैमुअल एस विल्क्स द्वारा मौलिक परिणाम है: नमूना आकार के रूप में अनंत तक पहुंचता है|, परीक्षण आँकड़ा ऊपर परिभाषित एसिम्प्टोटिक सिद्धांत (सांख्यिकी) ची-स्क्वेर्ड वितरण होगा | ची-स्क्वेर्ड वितरित () स्वतंत्रता की डिग्री (सांख्यिकी) के साथ आयामीता में अंतर के बराबर और .[13] इसका तात्पर्य यह है कि विभिन्न प्रकार की परिकल्पनाओं के लिए, हम संभावना अनुपात की गणना कर सकते हैं डेटा के लिए और फिर देखे गए की तुलना करें तक अनुमानित सांख्यिकीय परीक्षण के रूप में वांछित सांख्यिकीय महत्व के अनुरूप मूल्य। अन्य ्सटेंशन मौजूद हैं.[which?]
यह भी देखें
- अकैके सूचना मानदंड
- बेयस फैक्टर
- जोहान्सन परीक्षण
- मॉडल चयन
- वुओंग की निकटता परीक्षण
- सुपर-एलआर परीक्षण
- परिकल्पना परीक्षण में त्रुटि प्रतिपादक
संदर्भ
- ↑ King, Gary (1989). Unifying Political Methodology : The Likelihood Theory of Statistical Inference. New York: Cambridge University Press. p. 84. ISBN 0-521-36697-6.
- ↑ Li, Bing; Babu, G. Jogesh (2019). सांख्यिकीय अनुमान पर एक स्नातक पाठ्यक्रम. Springer. p. 331. ISBN 978-1-4939-9759-6.
- ↑ Maddala, G. S.; Lahiri, Kajal (2010). अर्थमिति का परिचय (Fourth ed.). New York: Wiley. p. 200.
- ↑ Buse, A. (1982). "The Likelihood Ratio, Wald, and Lagrange Multiplier Tests: An Expository Note". The American Statistician. 36 (3a): 153–157. doi:10.1080/00031305.1982.10482817.
- ↑ Pickles, Andrew (1985). संभावना विश्लेषण का एक परिचय. Norwich: W. H. Hutchins & Sons. pp. 24–27. ISBN 0-86094-190-6.
- ↑ Severini, Thomas A. (2000). सांख्यिकी में संभावना पद्धतियाँ. New York: Oxford University Press. pp. 120–121. ISBN 0-19-850650-3.
- ↑ 7.0 7.1 Neyman, J.; Pearson, E. S. (1933), "On the problem of the most efficient tests of statistical hypotheses" (PDF), Philosophical Transactions of the Royal Society of London A, 231 (694–706): 289–337, Bibcode:1933RSPTA.231..289N, doi:10.1098/rsta.1933.0009, JSTOR 91247
- ↑ Koch, Karl-Rudolf (1988). रैखिक मॉडल में पैरामीटर अनुमान और परिकल्पना परीक्षण. New York: Springer. p. 306. ISBN 0-387-18840-1.
- ↑ Silvey, S.D. (1970). सांख्यिकीय निष्कर्ष. London: Chapman & Hall. pp. 112–114. ISBN 0-412-13820-4.
- ↑ Mittelhammer, Ron C.; Judge, George G.; Miller, Douglas J. (2000). अर्थमितीय नींव. New York: Cambridge University Press. p. 66. ISBN 0-521-62394-4.
- ↑ Mood, A.M.; Graybill, F.A.; Boes, D.C. (1974). सांख्यिकी के सिद्धांत का परिचय (3rd ed.). McGraw-Hill. §9.2.
- ↑ Cox, D. R.; Hinkley, D. V. (1974), Theoretical Statistics, Chapman & Hall, p. 92, ISBN 0-412-12420-3
- ↑ Wilks, S.S. (1938). "मिश्रित परिकल्पनाओं के परीक्षण के लिए संभावना अनुपात का बड़ा-नमूना वितरण". Annals of Mathematical Statistics. 9 (1): 60–62. doi:10.1214/aoms/1177732360.
अग्रिम पठन
- Glover, Scott; Dixon, Peter (2004), "Likelihood ratios: A simple and flexible statistic for empirical psychologists", Psychonomic Bulletin & Review, 11 (5): 791–806, doi:10.3758/BF03196706, PMID 15732688
- Held, Leonhard; Sabanés Bové, Daniel (2014), Applied Statistical Inference—Likelihood and Bayes, Springer
- Kalbfleisch, J. G. (1985), Probability and Statistical Inference, vol. 2, Springer-Verlag
- Perlman, Michael D.; Wu, Lang (1999), "The emperor's new tests", Statistical Science, 14 (4): 355–381, doi:10.1214/ss/1009212517
- Perneger, Thomas V. (2001), "Sifting the evidence: Likelihood ratios are alternatives to P values", The BMJ, 322 (7295): 1184–5, doi:10.1136/bmj.322.7295.1184, PMC 1120301, PMID 11379590
- Pinheiro, José C.; Bates, Douglas M. (2000), Mixed-Effects Models in S and S-PLUS, Springer-Verlag, pp. 82–93
- Solomon, Daniel L. (1975), "A note on the non-equivalence of the Neyman-Pearson and generalized likelihood ratio tests for testing a simple null versus a simple alternative hypothesis" (PDF), The American Statistician, 29 (2): 101–102, doi:10.1080/00031305.1975.10477383, hdl:1813/32605