क्रमपरिवर्तन परीक्षण: Difference between revisions

From Vigyanwiki
Line 1: Line 1:
{{Short description|Exact statistical hypothesis test}}
{{Short description|Exact statistical hypothesis test}}
'''क्रमपरिवर्तन परीक्षण''' (जिसे पुन: यादृच्छिकीकरण परीक्षण या शफ़ल परीक्षण भी कहा जाता है) विरोधाभास द्वारा प्रमाण का उपयोग करने वाला एक सटीक सांख्यिकीय परिकल्पना परीक्षण है। एक क्रमपरिवर्तन परीक्षण में दो या अधिक नमूने सम्मिलित होते हैं। अशक्त परिकल्पना यह है कि सभी नमूने एक ही वितरण <math>H_0: F=G</math> से आते हैं। अशक्त परिकल्पना के तहत, परीक्षण सांख्यिकी का वितरण प्रेक्षित डेटा के संभावित पुनर्व्यवस्था के तहत परीक्षण सांख्यिकी के सभी संभावित मूल्यों की गणना करके प्राप्त किया जाता है। इसलिए, क्रमपरिवर्तन परीक्षण पुनः नमूनाकरण का एक रूप हैं।
'''क्रमपरिवर्तन परीक्षण''' (जिसे पुन: यादृच्छिकीकरण परीक्षण या मिश्रण परीक्षण भी कहा जाता है) विरोधाभास द्वारा प्रमाण का उपयोग करने वाला एक सटीक सांख्यिकीय परिकल्पना परीक्षण है। एक क्रमपरिवर्तन परीक्षण में दो या अधिक नमूने सम्मिलित होते हैं। अशक्त परिकल्पना यह है कि सभी नमूने एक ही वितरण <math>H_0: F=G</math> से आते हैं। अशक्त परिकल्पना के तहत, परीक्षण सांख्यिकी का वितरण प्रेक्षित डेटा के संभावित पुनर्व्यवस्था के तहत परीक्षण सांख्यिकी के सभी संभावित मूल्यों की गणना करके प्राप्त किया जाता है। इसलिए, क्रमपरिवर्तन परीक्षण पुनः नमूनाकरण का एक रूप हैं।


क्रमपरिवर्तन परीक्षणों को सरोगेट डेटा परीक्षण के रूप में समझा जा सकता है जहां अशक्त परिकल्पना के तहत सरोगेट डेटा मूल डेटा के क्रमपरिवर्तन के माध्यम से प्राप्त किया जाता है।<ref>Moore, Jason H. "Bootstrapping, permutation testing and the method of surrogate data." Physics in Medicine & Biology 44.6 (1999): L11.</ref>
क्रमपरिवर्तन परीक्षणों को सरोगेट डेटा परीक्षण के रूप में समझा जा सकता है जहां अशक्त परिकल्पना के तहत सरोगेट डेटा मूल डेटा के क्रमपरिवर्तन के माध्यम से प्राप्त किया जाता है।<ref>Moore, Jason H. "Bootstrapping, permutation testing and the method of surrogate data." Physics in Medicine & Biology 44.6 (1999): L11.</ref>
Line 8: Line 8:
क्रमपरिवर्तन परीक्षण को यादृच्छिक परीक्षण के साथ भ्रमित नहीं किया जाना चाहिए।<ref>{{Citation|last=Onghena|first=Patrick|title=Randomization Tests or Permutation Tests? A Historical and Terminological Clarification|date=2017-10-30|url=https://www.taylorfrancis.com/books/9781315305103/chapters/10.1201/9781315305110-14|work=Randomization, Masking, and Allocation Concealment|pages=209–228|editor-last=Berger|editor-first=Vance W.|edition=1|location=Boca Raton, FL|publisher=Chapman and Hall/CRC|language=en|doi=10.1201/9781315305110-14|isbn=978-1-315-30511-0|access-date=2021-10-08}}</ref>
क्रमपरिवर्तन परीक्षण को यादृच्छिक परीक्षण के साथ भ्रमित नहीं किया जाना चाहिए।<ref>{{Citation|last=Onghena|first=Patrick|title=Randomization Tests or Permutation Tests? A Historical and Terminological Clarification|date=2017-10-30|url=https://www.taylorfrancis.com/books/9781315305103/chapters/10.1201/9781315305110-14|work=Randomization, Masking, and Allocation Concealment|pages=209–228|editor-last=Berger|editor-first=Vance W.|edition=1|location=Boca Raton, FL|publisher=Chapman and Hall/CRC|language=en|doi=10.1201/9781315305110-14|isbn=978-1-315-30511-0|access-date=2021-10-08}}</ref>
== विधि ==
== विधि ==
[[File:Permutation_test_example_animation.gif|thumb|300px|4 और 5 यादृच्छिक मानों के सेट पर गणना किए जा रहे क्रमपरिवर्तन परीक्षण का एनीमेशन। लाल रंग में 4 मान एक वितरण से और नीले रंग में 5 मान दूसरे वितरण से लिए गए हैं; हम परीक्षण करना चाहेंगे कि क्या दोनों वितरणों के माध्य मान भिन्न हैं। परिकल्पना यह है कि पहले वितरण का माध्य दूसरे के माध्य से अधिक है; शून्य परिकल्पना यह है कि नमूनों के दोनों समूह एक ही वितरण से लिए गए हैं। 4 मानों को एक समूह में और 5 को दूसरे समूह में रखने के 126 अलग-अलग तरीके हैं (9-चुनें-4 या 9-चुनें-5)। इनमें से एक मूल लेबलिंग के अनुसार है, और अन्य 125 क्रमपरिवर्तन हैं जो माध्य अंतर का हिस्टोग्राम उत्पन्न करते हैं <math>\hat{\mu}_1-\hat{\mu}_2</math> दिखाया गया. परिकल्पना के p-मूल्य का अनुमान उन क्रमपरिवर्तनों के अनुपात के रूप में लगाया जाता है जो मूल नमूनों के साधनों के अंतर से बड़ा या बड़ा अंतर देते हैं। इस उदाहरण में, शून्य परिकल्पना {{math|''p'' {{=}} 5%}} को अस्वीकार नहीं किया जा सकता है।]]क्रमपरिवर्तन परीक्षण के मूल विचार को स्पष्ट करने के लिए, मान लीजिए कि हम दो समूहों <math>X_A</math> और <math>X_B</math> से प्रत्येक व्यक्ति के लिए यादृच्छिक चर <math>A</math> और <math>B</math> एकत्र करते हैं, जिनका नमूना माध्य <math>\bar{x}_{A}</math>और <math>\bar{x}_{B}</math> है, और वह हम जानना चाहते हैं कि क्या <math>X_A</math>और <math>X_B</math> एक ही वितरण से आते हैं। मान लीजिए <math>n_{A}</math>और <math>n_{B}</math> प्रत्येक समूह से एकत्रित नमूना आकार हैं। क्रमपरिवर्तन परीक्षण यह निर्धारित करने के लिए डिज़ाइन किया गया है कि क्या नमूना साधनों के बीच मनाया गया अंतर कुछ महत्व स्तर पर, शून्य परिकल्पना H<math>_{0}</math> को अस्वीकार करने के लिए पर्याप्त है कि <math>A</math> से लिया गया डेटा उसी वितरण से है जैसा कि <math>B</math> से लिया गया डेटा है।
[[File:Permutation_test_example_animation.gif|thumb|300px|4 और 5 यादृच्छिक मानों के सेट पर गणना किए जा रहे क्रमपरिवर्तन परीक्षण का एनीमेशन। लाल रंग में 4 मान एक वितरण से और नीले रंग में 5 मान दूसरे वितरण से लिए गए हैं; हम परीक्षण करना चाहेंगे कि क्या दोनों वितरणों के माध्य मान भिन्न हैं। परिकल्पना यह है कि पहले वितरण का माध्य दूसरे के माध्य से अधिक है; शून्य परिकल्पना यह है कि नमूनों के दोनों समूह एक ही वितरण से लिए गए हैं। 4 मानों को एक समूह में और 5 को दूसरे समूह में रखने के 126 अलग-अलग विधि हैं (9-चुनें-4 या 9-चुनें-5)। इनमें से एक मूल लेबलिंग के अनुसार है, और अन्य 125 क्रमपरिवर्तन हैं जो माध्य अंतर का हिस्टोग्राम उत्पन्न करते हैं <math>\hat{\mu}_1-\hat{\mu}_2</math> दिखाया गया. परिकल्पना के p-मूल्य का अनुमान उन क्रमपरिवर्तनों के अनुपात के रूप में लगाया जाता है जो मूल नमूनों के साधनों के अंतर से बड़ा या बड़ा अंतर देते हैं। इस उदाहरण में, शून्य परिकल्पना {{math|''p'' {{=}} 5%}} को अस्वीकार नहीं किया जा सकता है।]]क्रमपरिवर्तन परीक्षण के मूल विचार को स्पष्ट करने के लिए, मान लीजिए कि हम दो समूहों <math>X_A</math> और <math>X_B</math> से प्रत्येक व्यक्ति के लिए यादृच्छिक चर <math>A</math> और <math>B</math> एकत्र करते हैं, जिनका नमूना माध्य <math>\bar{x}_{A}</math>और <math>\bar{x}_{B}</math> है, और वह हम जानना चाहते हैं कि क्या <math>X_A</math>और <math>X_B</math> एक ही वितरण से आते हैं। मान लीजिए <math>n_{A}</math>और <math>n_{B}</math> प्रत्येक समूह से एकत्रित नमूना आकार हैं। क्रमपरिवर्तन परीक्षण यह निर्धारित करने के लिए डिज़ाइन किया गया है कि क्या नमूना साधनों के बीच मनाया गया अंतर कुछ महत्व स्तर पर, शून्य परिकल्पना H<math>_{0}</math> को अस्वीकार करने के लिए पर्याप्त है कि <math>A</math> से लिया गया डेटा उसी वितरण से है जैसा कि <math>B</math> से लिया गया डेटा है।


परीक्षण इस प्रकार आगे बढ़ता है. सबसे पहले, दो नमूनों के बीच के अंतर की गणना की जाती है: यह परीक्षण सांख्यिकीय, <math>T_\text{obs}</math> का मनाया गया मूल्य है।
परीक्षण इस प्रकार आगे बढ़ता है. सबसे पहले, दो नमूनों के बीच के अंतर की गणना की जाती है: यह परीक्षण सांख्यिकीय, <math>T_\text{obs}</math> का मनाया गया मूल्य है।


इसके बाद, समूह <math>A</math> और <math>B</math> के अवलोकनों को पूल किया जाता है, और नमूना साधनों में अंतर की गणना की जाती है और पूल किए गए मानों को आकार के दो समूहों <math>n_{A}</math>और <math>n_{B}</math> में विभाजित करने के हर संभव तरीके के लिए रिकॉर्ड किया जाता है (यानी, समूह लेबल ए और बी के प्रत्येक क्रमपरिवर्तन के लिए)। इन गणना किए गए अंतरों का सेट अशक्त परिकल्पना के तहत संभावित अंतरों (इस नमूने के लिए) का सटीक वितरण है कि समूह लेबल विनिमेय हैं (यानी, यादृच्छिक रूप से निर्दिष्ट हैं)।
इसके बाद, समूह <math>A</math> और <math>B</math> के अवलोकनों को पूल किया जाता है, और नमूना साधनों में अंतर की गणना की जाती है और पूल किए गए मानों को आकार के दो समूहों <math>n_{A}</math>और <math>n_{B}</math> में विभाजित करने के हर संभव विधि के लिए रिकॉर्ड किया जाता है (यानी, समूह लेबल ए और बी के प्रत्येक क्रमपरिवर्तन के लिए)। इन गणना किए गए अंतरों का सेट अशक्त परिकल्पना के तहत संभावित अंतरों (इस नमूने के लिए) का सटीक वितरण है कि समूह लेबल विनिमेय हैं (यानी, यादृच्छिक रूप से निर्दिष्ट हैं)।


परीक्षण के एक तरफा p-वैल्यू की गणना नमूना क्रमपरिवर्तन के अनुपात के रूप में की जाती है जहां साधनों में अंतर <math>T_\text{obs}</math> से अधिक था। परीक्षण के दो-तरफा p-मान की गणना नमूना क्रमपरिवर्तन के अनुपात के रूप में की जाती है जहां पूर्ण अंतर <math>|T_\text{obs}|</math> से अधिक था। क्रमपरिवर्तन परीक्षणों के कई कार्यान्वयन के लिए आवश्यक है कि देखे गए डेटा को स्वयं क्रमपरिवर्तन में से एक के रूप में गिना जाए ताकि क्रमपरिवर्तन p-मान कभी भी शून्य न हो।<ref>{{cite journal|first1=Belinda|last1=Phipson|first2=Gordon K|last2=Smyth|title=Permutation p-values should never be zero: calculating exact p-values when permutations are randomly drawn|journal=[[Statistical Applications in Genetics and Molecular Biology]]|year=2010|volume=9|issue=1|pages=Article 39|doi=10.2202/1544-6115.1585|pmid=21044043 |arxiv=1603.05766|s2cid=10735784 }}</ref>
परीक्षण के एक तरफा p-वैल्यू की गणना नमूना क्रमपरिवर्तन के अनुपात के रूप में की जाती है जहां साधनों में अंतर <math>T_\text{obs}</math> से अधिक था। परीक्षण के दो-तरफा p-मान की गणना नमूना क्रमपरिवर्तन के अनुपात के रूप में की जाती है जहां पूर्ण अंतर <math>|T_\text{obs}|</math> से अधिक था। क्रमपरिवर्तन परीक्षणों के कई कार्यान्वयन के लिए आवश्यक है कि देखे गए डेटा को स्वयं क्रमपरिवर्तन में से एक के रूप में गिना जाए ताकि क्रमपरिवर्तन p-मान कभी भी शून्य न हो।<ref>{{cite journal|first1=Belinda|last1=Phipson|first2=Gordon K|last2=Smyth|title=Permutation p-values should never be zero: calculating exact p-values when permutations are randomly drawn|journal=[[Statistical Applications in Genetics and Molecular Biology]]|year=2010|volume=9|issue=1|pages=Article 39|doi=10.2202/1544-6115.1585|pmid=21044043 |arxiv=1603.05766|s2cid=10735784 }}</ref>
Line 24: Line 24:
क्रमपरिवर्तन परीक्षण गैर-पैरामीट्रिक सांख्यिकी का एक उपसमूह हैं। यह मानते हुए कि हमारा प्रयोगात्मक डेटा दो उपचार समूहों से मापा गया डेटा से आता है, विधि केवल इस धारणा के तहत औसत अंतर का वितरण उत्पन्न करती है कि दोनों समूह मापा चर के संदर्भ में अलग नहीं हैं। इससे, फिर कोई देखे गए सांख्यिकी (<math>T_\text{obs}</math>) का उपयोग यह देखने के लिए करता है कि यह सांख्यिकी किस हद तक विशेष है, यानी, यदि उपचार के बाद उपचार लेबल को यादृच्छिक रूप से यादृच्छिक किया गया था, तो ऐसे मूल्य (या बड़े) के परिमाण को देखने की संभावना।
क्रमपरिवर्तन परीक्षण गैर-पैरामीट्रिक सांख्यिकी का एक उपसमूह हैं। यह मानते हुए कि हमारा प्रयोगात्मक डेटा दो उपचार समूहों से मापा गया डेटा से आता है, विधि केवल इस धारणा के तहत औसत अंतर का वितरण उत्पन्न करती है कि दोनों समूह मापा चर के संदर्भ में अलग नहीं हैं। इससे, फिर कोई देखे गए सांख्यिकी (<math>T_\text{obs}</math>) का उपयोग यह देखने के लिए करता है कि यह सांख्यिकी किस हद तक विशेष है, यानी, यदि उपचार के बाद उपचार लेबल को यादृच्छिक रूप से यादृच्छिक किया गया था, तो ऐसे मूल्य (या बड़े) के परिमाण को देखने की संभावना।


क्रमपरिवर्तन परीक्षणों के विपरीत, कई लोकप्रिय "शास्त्रीय" सांख्यिकीय परीक्षणों, जैसे ''t-''परीक्षण, ''f''-परीक्षण, ''z''-परीक्षण और <math display="inline">\chi^2</math> परीक्षण के अंतर्निहित वितरण सैद्धांतिक संभाव्यता वितरण से प्राप्त किए जाते हैं। फिशर का सटीक परीक्षण दो द्विभाजित चरों के बीच संबंध का मूल्यांकन करने के लिए सामान्यतः उपयोग किए जाने वाले क्रमपरिवर्तन परीक्षण का एक उदाहरण है। जब नमूना आकार बहुत बड़ा होता है, तो पियर्सन का ची-स्क्वायर परीक्षण सटीक परिणाम देगा। छोटे नमूनों के लिए, ची-स्क्वायर संदर्भ वितरण को परीक्षण आंकड़ों के संभाव्यता वितरण का सही विवरण देने के लिए नहीं माना जा सकता है, और इस स्थिति में फिशर के सटीक परीक्षण का उपयोग अधिक उपयुक्त हो जाता है।
क्रमपरिवर्तन परीक्षणों के विपरीत, कई लोकप्रिय "चिरसम्मत" सांख्यिकीय परीक्षणों, जैसे ''t-''परीक्षण, ''f''-परीक्षण, ''z''-परीक्षण और <math display="inline">\chi^2</math> परीक्षण के अंतर्निहित वितरण सैद्धांतिक संभाव्यता वितरण से प्राप्त किए जाते हैं। फिशर का सटीक परीक्षण दो द्विभाजित चरों के बीच संबंध का मूल्यांकन करने के लिए सामान्यतः उपयोग किए जाने वाले क्रमपरिवर्तन परीक्षण का एक उदाहरण है। जब नमूना आकार बहुत बड़ा होता है, तो पियर्सन का ची-स्क्वायर परीक्षण सटीक परिणाम देगा। छोटे नमूनों के लिए, ची-स्क्वायर संदर्भ वितरण को परीक्षण आंकड़ों के संभाव्यता वितरण का सही विवरण देने के लिए नहीं माना जा सकता है, और इस स्थिति में फिशर के सटीक परीक्षण का उपयोग अधिक उपयुक्त हो जाता है।


क्रमपरिवर्तन परीक्षण कई स्थितियों में उपस्थित होते हैं जहां पैरामीट्रिक परीक्षण नहीं होते हैं (उदाहरण के लिए, जब एक इष्टतम परीक्षण प्राप्त होता है जब हानि उसके वर्ग के स्थान पर त्रुटि के आकार के समानुपाती होता है)। सभी सरल और कई अपेक्षाकृत जटिल पैरामीट्रिक परीक्षणों में एक अनुरूप क्रमपरिवर्तन परीक्षण संस्करण होता है जिसे पैरामीट्रिक परीक्षण के समान परीक्षण आंकड़ों का उपयोग करके परिभाषित किया जाता है, लेकिन पैरामीट्रिक धारणा से प्राप्त सैद्धांतिक वितरण के स्थान पर उस आंकड़े के नमूना-विशिष्ट क्रमपरिवर्तन वितरण से p-मान प्राप्त करता है। उदाहरण के लिए, इस तरीके से क्रमपरिवर्तन टी-परीक्षण, एसोसिएशन का क्रमपरिवर्तन $2 परीक्षण, भिन्नताओं की तुलना करने के लिए एली के परीक्षण का क्रमपरिवर्तन संस्करण इत्यादि बनाना संभव है।
क्रमपरिवर्तन परीक्षण कई स्थितियों में उपस्थित होते हैं जहां पैरामीट्रिक परीक्षण नहीं होते हैं (उदाहरण के लिए, जब एक इष्टतम परीक्षण प्राप्त होता है जब हानि उसके वर्ग के स्थान पर त्रुटि के आकार के समानुपाती होता है)। सभी सरल और कई अपेक्षाकृत जटिल पैरामीट्रिक परीक्षणों में एक अनुरूप क्रमपरिवर्तन परीक्षण संस्करण होता है जिसे पैरामीट्रिक परीक्षण के समान परीक्षण आंकड़ों का उपयोग करके परिभाषित किया जाता है, लेकिन पैरामीट्रिक धारणा से प्राप्त सैद्धांतिक वितरण के स्थान पर उस सांख्यिकी के नमूना-विशिष्ट क्रमपरिवर्तन वितरण से p-मान प्राप्त करता है। उदाहरण के लिए, इस विधि से क्रमपरिवर्तन t-परीक्षण, एसोसिएशन का क्रमपरिवर्तन $2 परीक्षण, भिन्नताओं की तुलना करने के लिए एली के परीक्षण का क्रमपरिवर्तन संस्करण इत्यादि बनाना संभव है।


क्रमपरिवर्तन परीक्षणों की प्रमुख कमियां यह हैं कि वे
क्रमपरिवर्तन परीक्षणों की प्रमुख कमियां यह हैं कि वे
Line 34: Line 34:


==लाभ==
==लाभ==
क्रमपरिवर्तन परीक्षण किसी भी परीक्षण सांख्यिकी के लिए उपस्थित होते हैं, भले ही उसका वितरण ज्ञात हो या नहीं। इस प्रकार कोई भी उस आंकड़े को चुनने के लिए हमेशा स्वतंत्र होता है जो परिकल्पना और विकल्प के बीच सबसे अच्छा भेदभाव करता है और जो हानि को कम करता है।
क्रमपरिवर्तन परीक्षण किसी भी परीक्षण सांख्यिकी के लिए उपस्थित होते हैं, भले ही उसका वितरण ज्ञात हो या नहीं। इस प्रकार कोई भी उस सांख्यिकी को चुनने के लिए हमेशा स्वतंत्र होता है जो परिकल्पना और विकल्प के बीच सबसे अच्छा भेदभाव करता है और जो हानि को कम करता है।


क्रमपरिवर्तन परीक्षणों का उपयोग असंतुलित डिज़ाइनों का विश्लेषण करने के लिए किया जा सकता है<ref>{{cite journal |date=Fall 2011 |title=आमंत्रित लेख|url=http://tbf.coe.wayne.edu/jmasm/vol1_no2.pdf |journal=[[Journal of Modern Applied Statistical Methods]] |volume=1 |issue=2 |pages=202–522  |archive-url=https://web.archive.org/web/20030505044125/http://tbf.coe.wayne.edu/jmasm/vol1_no2.pdf |archive-date=May 5, 2003}}</ref> और श्रेणीबद्ध, क्रमसूचक और मीट्रिक डेटा के मिश्रण पर निर्भर परीक्षणों के संयोजन के लिए (पेसारिन, 2001)। उनका उपयोग गुणात्मक डेटा का विश्लेषण करने के लिए भी किया जा सकता है जिसे मात्राबद्ध किया गया है (यानी, संख्याओं में बदल दिया गया है)। क्रमपरिवर्तन परीक्षण परिमाणित डेटा का विश्लेषण करने के लिए आदर्श हो सकते हैं जो पारंपरिक पैरामीट्रिक परीक्षणों (जैसे, टी-परीक्षण, एनोवा) में अंतर्निहित सांख्यिकीय मान्यताओं को संतुष्ट नहीं करते हैं,<ref>{{cite journal |last1=Collingridge |first1=Dave S. |title=परिमाणित डेटा विश्लेषण और क्रमपरिवर्तन परीक्षण पर एक प्राइमर|journal=Journal of Mixed Methods Research |date=11 September 2012 |volume=7 |issue=1 |pages=81–97 |doi=10.1177/1558689812454457|s2cid=124618343 }}</ref> पर्मानोवा देखें।
क्रमपरिवर्तन परीक्षणों का उपयोग असंतुलित डिज़ाइनों का विश्लेषण करने के लिए किया जा सकता है<ref>{{cite journal |date=Fall 2011 |title=आमंत्रित लेख|url=http://tbf.coe.wayne.edu/jmasm/vol1_no2.pdf |journal=[[Journal of Modern Applied Statistical Methods]] |volume=1 |issue=2 |pages=202–522  |archive-url=https://web.archive.org/web/20030505044125/http://tbf.coe.wayne.edu/jmasm/vol1_no2.pdf |archive-date=May 5, 2003}}</ref> और श्रेणीबद्ध, क्रमसूचक और मीट्रिक डेटा के मिश्रण पर निर्भर परीक्षणों के संयोजन के लिए (पेसारिन, 2001)। उनका उपयोग गुणात्मक डेटा का विश्लेषण करने के लिए भी किया जा सकता है जिसे मात्राबद्ध किया गया है (यानी, संख्याओं में बदल दिया गया है)। क्रमपरिवर्तन परीक्षण परिमाणित डेटा का विश्लेषण करने के लिए आदर्श हो सकते हैं जो पारंपरिक पैरामीट्रिक परीक्षणों (जैसे, t-परीक्षण, एनोवा) में अंतर्निहित सांख्यिकीय मान्यताओं को संतुष्ट नहीं करते हैं,<ref>{{cite journal |last1=Collingridge |first1=Dave S. |title=परिमाणित डेटा विश्लेषण और क्रमपरिवर्तन परीक्षण पर एक प्राइमर|journal=Journal of Mixed Methods Research |date=11 September 2012 |volume=7 |issue=1 |pages=81–97 |doi=10.1177/1558689812454457|s2cid=124618343 }}</ref> पर्मानोवा देखें।


1980 के दशक से पहले, छोटे नमूना आकार वाले डेटा सेट को छोड़कर संदर्भ वितरण बनाने का बोझ अत्यधिक था।
1980 के दशक से पहले, छोटे नमूना आकार वाले डेटा सेट को छोड़कर संदर्भ वितरण बनाने का बोझ अत्यधिक था।
Line 43: Line 43:


==सीमाएँ==
==सीमाएँ==
क्रमपरिवर्तन परीक्षण के पीछे एक महत्वपूर्ण धारणा यह है कि शून्य परिकल्पना के तहत अवलोकन विनिमय योग्य हैं। इस धारणा का एक महत्वपूर्ण परिणाम यह है कि स्थान में अंतर के परीक्षण (क्रमपरिवर्तन टी-परीक्षण की तरह) को सामान्यता धारणा के तहत समान भिन्नता की आवश्यकता होती है। इस संबंध में, क्रमपरिवर्तन टी-परीक्षण चिरसम्मत छात्र के टी-परीक्षण (बेहरेंस-फिशर समस्या) के समान ही कमजोरी साझा करता है। इस स्थिति में तीसरा विकल्प बूटस्ट्रैप-आधारित परीक्षण का उपयोग करना है। सांख्यिकीविद् फिलिप गुड क्रमपरिवर्तन परीक्षण और बूटस्ट्रैप परीक्षण के बीच अंतर को इस प्रकार समझाते हैं: "क्रमपरिवर्तन वितरण से संबंधित परिकल्पनाओं का परीक्षण करता है; बूटस्ट्रैप मापदंडों से संबंधित परिकल्पनाओं का परीक्षण करता है। परिणामस्वरूप, बूटस्ट्रैप कम-कठोर मान्यताओं पर जोर देता है।"<ref>{{cite book |last=Good |first=Phillip I. |year=2005 |title=Resampling Methods: A Practical Guide to Data Analysis |edition=3rd |publisher=Birkhäuser |isbn= 978-0817643867}}</ref> बूटस्ट्रैप परीक्षण सटीक नहीं हैं . कुछ स्थितियों में, उचित रूप से छात्रीकृत सांख्यिकी पर आधारित एक क्रमपरिवर्तन परीक्षण विनिमयशीलता धारणा का उल्लंघन होने पर भी स्पर्शोन्मुख रूप से सटीक हो सकता है।<ref>{{Cite journal|last1=Chung|first1=EY|last2=Romano|first2=JP|title=सटीक और स्पर्शोन्मुख रूप से मजबूत क्रमपरिवर्तन परीक्षण|journal=[[The Annals of Statistics]]|year=2013|volume=41|issue=2|pages=487–507|doi=10.1214/13-AOS1090|arxiv=1304.5939|doi-access=free}}</ref> बूटस्ट्रैप-आधारित परीक्षण शून्य परिकल्पना <math>H_0: F \neq G </math> के साथ परीक्षण कर सकते हैं और इसलिए, समकक्ष परीक्षण करने के लिए उपयुक्त हैं।
क्रमपरिवर्तन परीक्षण के पीछे एक महत्वपूर्ण धारणा यह है कि शून्य परिकल्पना के तहत अवलोकन विनिमय योग्य हैं। इस धारणा का एक महत्वपूर्ण परिणाम यह है कि स्थान में अंतर के परीक्षण (क्रमपरिवर्तन t-परीक्षण की तरह) को सामान्यता धारणा के तहत समान भिन्नता की आवश्यकता होती है। इस संबंध में, क्रमपरिवर्तन t-परीक्षण चिरसम्मत छात्र के t-परीक्षण (बेहरेंस-फिशर समस्या) के समान ही कमजोरी साझा करता है। इस स्थिति में तीसरा विकल्प बूटस्ट्रैप-आधारित परीक्षण का उपयोग करना है। सांख्यिकीविद् फिलिप गुड क्रमपरिवर्तन परीक्षण और बूटस्ट्रैप परीक्षण के बीच अंतर को इस प्रकार समझाते हैं: "क्रमपरिवर्तन वितरण से संबंधित परिकल्पनाओं का परीक्षण करता है; बूटस्ट्रैप मापदंडों से संबंधित परिकल्पनाओं का परीक्षण करता है। परिणामस्वरूप, बूटस्ट्रैप कम-कठोर मान्यताओं पर जोर देता है।"<ref>{{cite book |last=Good |first=Phillip I. |year=2005 |title=Resampling Methods: A Practical Guide to Data Analysis |edition=3rd |publisher=Birkhäuser |isbn= 978-0817643867}}</ref> बूटस्ट्रैप परीक्षण सटीक नहीं हैं . कुछ स्थितियों में, उचित रूप से छात्रीकृत सांख्यिकी पर आधारित एक क्रमपरिवर्तन परीक्षण विनिमयशीलता धारणा का उल्लंघन होने पर भी स्पर्शोन्मुख रूप से सटीक हो सकता है।<ref>{{Cite journal|last1=Chung|first1=EY|last2=Romano|first2=JP|title=सटीक और स्पर्शोन्मुख रूप से मजबूत क्रमपरिवर्तन परीक्षण|journal=[[The Annals of Statistics]]|year=2013|volume=41|issue=2|pages=487–507|doi=10.1214/13-AOS1090|arxiv=1304.5939|doi-access=free}}</ref> बूटस्ट्रैप-आधारित परीक्षण शून्य परिकल्पना <math>H_0: F \neq G </math> के साथ परीक्षण कर सकते हैं और इसलिए, समकक्ष परीक्षण करने के लिए उपयुक्त हैं।


==मोंटे कार्लो परीक्षण==
==मोंटे कार्लो परीक्षण==
एक सुविधाजनक तरीके से पूर्ण गणना की अनुमति देने के लिए डेटा के बहुत अधिक संभावित क्रम होने पर एक असम्बद्ध रूप से समकक्ष क्रमपरिवर्तन परीक्षण बनाया जा सकता है। यह मोंटे कार्लो नमूनाकरण द्वारा संदर्भ वितरण उत्पन्न करके किया जाता है, जो संभावित प्रतिकृति का एक छोटा (कुल क्रमपरिवर्तन के सापेक्ष) यादृच्छिक नमूना लेता है। यह अहसास कि इसे किसी भी डेटासेट पर किसी भी क्रमपरिवर्तन परीक्षण पर लागू किया जा सकता है, लागू सांख्यिकी के क्षेत्र में एक महत्वपूर्ण सफलता थी। इस दृष्टिकोण के सबसे पहले ज्ञात संदर्भ ईडन और येट्स (1933) और डवास (1957) हैं।<ref>{{cite journal |last1=Eden | last2=Yates |first1=T | first2=F |title=गैर-सामान्य डेटा के वास्तविक उदाहरण पर लागू होने पर फिशर के जेड परीक्षण की वैधता पर। (पाँच पाठ-चित्रों के साथ।)|journal=The Journal of Agricultural Science |date=1933 |volume=23 |issue=1 |pages=6–17 |doi=10.1017/S0021859600052862 | s2cid=84802682 |url=https://www.cambridge.org/core/journals/journal-of-agricultural-science/article/abs/on-the-validity-of-fishers-z-test-when-applied-to-an-actual-example-of-nonnormal-data-with-five-textfigures/6232D2A79D698995B23E1A1AF4CEA8AB |access-date=3 June 2021}}</ref><ref>{{cite journal |first=Meyer |last=Dwass |title=गैर-पैरामीट्रिक परिकल्पनाओं के लिए संशोधित यादृच्छिकीकरण परीक्षण|journal=[[Annals of Mathematical Statistics]] |volume=28 |issue=1 |pages=181–187 |year=1957 |jstor=2237031 |doi=10.1214/aoms/1177707045|doi-access=free }}</ref> इस प्रकार के क्रमपरिवर्तन परीक्षण को विभिन्न नामों से जाना जाता है: अनुमानित क्रमपरिवर्तन परीक्षण, मोंटे कार्लो क्रमपरिवर्तन परीक्षण या यादृच्छिक क्रमपरिवर्तन परीक्षण।<ref>{{Cite journal  | author = [[Thomas E. Nichols]], [[Andrew P. Holmes]]  | url = http://www.fil.ion.ucl.ac.uk/spm/doc/papers/NicholsHolmes.pdf  | title = Nonparametric Permutation Tests For Functional Neuroimaging: A Primer with Examples  |journal = [[Human Brain Mapping (journal)|Human Brain Mapping]]  | volume = 15  | pages = 1–25  | year = 2001  | doi = 10.1002/hbm.1058  | pmid = 11747097  | issue = 1 | pmc = 6871862 | hdl = 2027.42/35194 }}</ref>  
एक सुविधाजनक विधि से पूर्ण गणना की अनुमति देने के लिए डेटा के बहुत अधिक संभावित क्रम होने पर एक असम्बद्ध रूप से समकक्ष क्रमपरिवर्तन परीक्षण बनाया जा सकता है। यह मोंटे कार्लो नमूनाकरण द्वारा संदर्भ वितरण उत्पन्न करके किया जाता है, जो संभावित प्रतिकृति का एक छोटा (कुल क्रमपरिवर्तन के सापेक्ष) यादृच्छिक नमूना लेता है। यह अहसास कि इसे किसी भी डेटासेट पर किसी भी क्रमपरिवर्तन परीक्षण पर लागू किया जा सकता है, लागू सांख्यिकी के क्षेत्र में एक महत्वपूर्ण सफलता थी। इस दृष्टिकोण के सबसे पहले ज्ञात संदर्भ ईडन और येट्स (1933) और डवास (1957) हैं।<ref>{{cite journal |last1=Eden | last2=Yates |first1=T | first2=F |title=गैर-सामान्य डेटा के वास्तविक उदाहरण पर लागू होने पर फिशर के जेड परीक्षण की वैधता पर। (पाँच पाठ-चित्रों के साथ।)|journal=The Journal of Agricultural Science |date=1933 |volume=23 |issue=1 |pages=6–17 |doi=10.1017/S0021859600052862 | s2cid=84802682 |url=https://www.cambridge.org/core/journals/journal-of-agricultural-science/article/abs/on-the-validity-of-fishers-z-test-when-applied-to-an-actual-example-of-nonnormal-data-with-five-textfigures/6232D2A79D698995B23E1A1AF4CEA8AB |access-date=3 June 2021}}</ref><ref>{{cite journal |first=Meyer |last=Dwass |title=गैर-पैरामीट्रिक परिकल्पनाओं के लिए संशोधित यादृच्छिकीकरण परीक्षण|journal=[[Annals of Mathematical Statistics]] |volume=28 |issue=1 |pages=181–187 |year=1957 |jstor=2237031 |doi=10.1214/aoms/1177707045|doi-access=free }}</ref> इस प्रकार के क्रमपरिवर्तन परीक्षण को विभिन्न नामों से जाना जाता है: अनुमानित क्रमपरिवर्तन परीक्षण, मोंटे कार्लो क्रमपरिवर्तन परीक्षण या यादृच्छिक क्रमपरिवर्तन परीक्षण।<ref>{{Cite journal  | author = [[Thomas E. Nichols]], [[Andrew P. Holmes]]  | url = http://www.fil.ion.ucl.ac.uk/spm/doc/papers/NicholsHolmes.pdf  | title = Nonparametric Permutation Tests For Functional Neuroimaging: A Primer with Examples  |journal = [[Human Brain Mapping (journal)|Human Brain Mapping]]  | volume = 15  | pages = 1–25  | year = 2001  | doi = 10.1002/hbm.1058  | pmid = 11747097  | issue = 1 | pmc = 6871862 | hdl = 2027.42/35194 }}</ref>  


<math>N </math> यादृच्छिक क्रमपरिवर्तन बाद, द्विपद वितरण के आधार पर p-मान के लिए विश्वास अंतराल प्राप्त करना संभव है, [[द्विपद अनुपात विश्वास अंतराल]] देखें। उदाहरण के लिए, यदि बाद में <math> N = 10000</math> यादृच्छिक क्रमपरिवर्तन से p-मान <math>\widehat{p}=0.05 </math> का अनुमान लगाया जाता है, फिर सत्य के लिए 99% विश्वास अंतराल <math>p</math> (वह जो सभी संभावित क्रमपरिवर्तनों को आज़माने का परिणाम होगा) है।
<math>N </math> यादृच्छिक क्रमपरिवर्तन बाद, द्विपद वितरण के आधार पर p-मान के लिए विश्वास अंतराल प्राप्त करना संभव है, [[द्विपद अनुपात विश्वास अंतराल]] देखें। उदाहरण के लिए, यदि बाद में <math> N = 10000</math> यादृच्छिक क्रमपरिवर्तन से p-मान <math>\widehat{p}=0.05 </math> का अनुमान लगाया जाता है, फिर सत्य के लिए 99% विश्वास अंतराल <math>p</math> (वह जो सभी संभावित क्रमपरिवर्तनों को आज़माने का परिणाम होगा) है।
Line 72: Line 72:
* पेसारिन, एफ. (2001)। बहुभिन्नरूपी क्रमपरिवर्तन परीक्षण: जैवसांख्यिकी में अनुप्रयोगों के साथ, जॉन विले एंड संस। {{ISBN|978-0471496700}}
* पेसारिन, एफ. (2001)। बहुभिन्नरूपी क्रमपरिवर्तन परीक्षण: जैवसांख्यिकी में अनुप्रयोगों के साथ, जॉन विले एंड संस। {{ISBN|978-0471496700}}
* {{cite journal | last1 = Welch | first1 = W. J. | year = 1990 | title = क्रमपरिवर्तन परीक्षणों का निर्माण| journal = [[Journal of the American Statistical Association]] | volume = 85 | issue = 411| pages = 693–698 | doi=10.1080/01621459.1990.10474929}}
* {{cite journal | last1 = Welch | first1 = W. J. | year = 1990 | title = क्रमपरिवर्तन परीक्षणों का निर्माण| journal = [[Journal of the American Statistical Association]] | volume = 85 | issue = 411| pages = 693–698 | doi=10.1080/01621459.1990.10474929}}
कम्प्यूटेशनल तरीके:
कम्प्यूटेशनल विधि:
* {{cite journal | last1 = Mehta | first1 = C. R. | last2 = Patel | first2 = N. R. | year = 1983 | title = आरएक्ससी आकस्मिकता तालिकाओं में फिशर का सटीक परीक्षण करने के लिए एक नेटवर्क एल्गोरिदम| journal = [[Journal of the American Statistical Association]] | volume = 78 | issue = 382| pages = 427–434 | doi=10.1080/01621459.1983.10477989}}
* {{cite journal | last1 = Mehta | first1 = C. R. | last2 = Patel | first2 = N. R. | year = 1983 | title = आरएक्ससी आकस्मिकता तालिकाओं में फिशर का सटीक परीक्षण करने के लिए एक नेटवर्क एल्गोरिदम| journal = [[Journal of the American Statistical Association]] | volume = 78 | issue = 382| pages = 427–434 | doi=10.1080/01621459.1983.10477989}}
* {{cite journal | last1 = Mehta | first1 = C. R. | last2 = Patel | first2 = N. R. | last3 = Senchaudhuri | first3 = P. | year = 1988 | title = क्रमपरिवर्तनीय अनुमान में सटीक संभावनाओं का अनुमान लगाने के लिए नमूनाकरण का महत्व| journal = [[Journal of the American Statistical Association]] | volume = 83 | issue = 404| pages = 999–1005 | doi=10.1080/01621459.1988.10478691}}
* {{cite journal | last1 = Mehta | first1 = C. R. | last2 = Patel | first2 = N. R. | last3 = Senchaudhuri | first3 = P. | year = 1988 | title = क्रमपरिवर्तनीय अनुमान में सटीक संभावनाओं का अनुमान लगाने के लिए नमूनाकरण का महत्व| journal = [[Journal of the American Statistical Association]] | volume = 83 | issue = 404| pages = 999–1005 | doi=10.1080/01621459.1988.10478691}}
Line 80: Line 80:
* अच्छा, पी.आई. (2012) पुन: नमूनाकरण विधियों के लिए प्रैक्टिशनर्स गाइड।
* अच्छा, पी.आई. (2012) पुन: नमूनाकरण विधियों के लिए प्रैक्टिशनर्स गाइड।
* अच्छा, पी.आई. (2005) परिकल्पनाओं का क्रमपरिवर्तन, पैरामीट्रिक और बूटस्ट्रैप परीक्षण
* अच्छा, पी.आई. (2005) परिकल्पनाओं का क्रमपरिवर्तन, पैरामीट्रिक और बूटस्ट्रैप परीक्षण
* हेस्टरबर्ग, टी.सी., डी.एस. मूर, एस. मोनाघन, ए. क्लिपसन, और आर. एपस्टीन (2005): [https://web.archive.org/web/20060215221403/http://bcs.whfreeman.com/ips5e /content/cat_080/pdf/moore14.pdf बूटस्ट्रैप तरीके और क्रमपरिवर्तन परीक्षण], [https://web.archive.org/web/20060110182635/http://www.insightful.com/Hesterberg/bootstrap/ सॉफ्टवेयर]।
* हेस्टरबर्ग, टी.सी., डी.एस. मूर, एस. मोनाघन, ए. क्लिपसन, और आर. एपस्टीन (2005): [https://web.archive.org/web/20060215221403/http://bcs.whfreeman.com/ips5e /content/cat_080/pdf/moore14.pdf बूटस्ट्रैप विधि और क्रमपरिवर्तन परीक्षण], [https://web.archive.org/web/20060110182635/http://www.insightful.com/Hesterberg/bootstrap/ सॉफ्टवेयर]।
* मूर, डी.एस., जी. मैककेबे, डब्ल्यू. डकवर्थ, और एस. स्कोलोव (2003): [https://statweb.stanford.edu/~tibs/stat315a/Supplements/bootstrap.pdf बूटस्ट्रैप तरीके और क्रमपरिवर्तन परीक्षण]
* मूर, डी.एस., जी. मैककेबे, डब्ल्यू. डकवर्थ, और एस. स्कोलोव (2003): [https://statweb.stanford.edu/~tibs/stat315a/Supplements/bootstrap.pdf बूटस्ट्रैप विधि और क्रमपरिवर्तन परीक्षण]
* साइमन, जे.एल. (1997): [https://web.archive.org/web/20051223034539/http://www.resample.com/content/text/index.shtml रेज़ैम्पलिंग: द न्यू स्टैटिस्टिक्स]।
* साइमन, जे.एल. (1997): [https://web.archive.org/web/20051223034539/http://www.resample.com/content/text/index.shtml रेज़ैम्पलिंग: द न्यू स्टैटिस्टिक्स]।
* यू, चोंग हो (2003): [http://PAREonline.net/getvn.asp?v=8&n=19 पुन: नमूनाकरण विधियां: अवधारणाएं, अनुप्रयोग और औचित्य। व्यावहारिक मूल्यांकन, अनुसंधान एवं मूल्यांकन, 8(19)]। (सांख्यिकीय बूटस्ट्रैपिंग)
* यू, चोंग हो (2003): [http://PAREonline.net/getvn.asp?v=8&n=19 पुन: नमूनाकरण विधियां: अवधारणाएं, अनुप्रयोग और औचित्य। व्यावहारिक मूल्यांकन, अनुसंधान एवं मूल्यांकन, 8(19)]। (सांख्यिकीय बूटस्ट्रैपिंग)

Revision as of 00:08, 5 December 2023

क्रमपरिवर्तन परीक्षण (जिसे पुन: यादृच्छिकीकरण परीक्षण या मिश्रण परीक्षण भी कहा जाता है) विरोधाभास द्वारा प्रमाण का उपयोग करने वाला एक सटीक सांख्यिकीय परिकल्पना परीक्षण है। एक क्रमपरिवर्तन परीक्षण में दो या अधिक नमूने सम्मिलित होते हैं। अशक्त परिकल्पना यह है कि सभी नमूने एक ही वितरण से आते हैं। अशक्त परिकल्पना के तहत, परीक्षण सांख्यिकी का वितरण प्रेक्षित डेटा के संभावित पुनर्व्यवस्था के तहत परीक्षण सांख्यिकी के सभी संभावित मूल्यों की गणना करके प्राप्त किया जाता है। इसलिए, क्रमपरिवर्तन परीक्षण पुनः नमूनाकरण का एक रूप हैं।

क्रमपरिवर्तन परीक्षणों को सरोगेट डेटा परीक्षण के रूप में समझा जा सकता है जहां अशक्त परिकल्पना के तहत सरोगेट डेटा मूल डेटा के क्रमपरिवर्तन के माध्यम से प्राप्त किया जाता है।[1]

दूसरे शब्दों में, वह विधि जिसके द्वारा प्रयोगात्मक डिजाइन में विषयों को उपचार आवंटित किया जाता है, उस डिजाइन के विश्लेषण में प्रतिबिंबित होता है। यदि लेबल अशक्त परिकल्पना के तहत विनिमेय हैं, तो परिणामी परीक्षण सटीक महत्व स्तर प्राप्त करते हैं; विनिमयशीलता भी देखें. फिर परीक्षणों से आत्मविश्वास अंतराल प्राप्त किया जा सकता है। यह सिद्धांत 1930 के दशक में रोनाल्ड फिशर और ई.जे.जी. पिटमैन के कार्यों से विकसित हुआ है।

क्रमपरिवर्तन परीक्षण को यादृच्छिक परीक्षण के साथ भ्रमित नहीं किया जाना चाहिए।[2]

विधि

4 और 5 यादृच्छिक मानों के सेट पर गणना किए जा रहे क्रमपरिवर्तन परीक्षण का एनीमेशन। लाल रंग में 4 मान एक वितरण से और नीले रंग में 5 मान दूसरे वितरण से लिए गए हैं; हम परीक्षण करना चाहेंगे कि क्या दोनों वितरणों के माध्य मान भिन्न हैं। परिकल्पना यह है कि पहले वितरण का माध्य दूसरे के माध्य से अधिक है; शून्य परिकल्पना यह है कि नमूनों के दोनों समूह एक ही वितरण से लिए गए हैं। 4 मानों को एक समूह में और 5 को दूसरे समूह में रखने के 126 अलग-अलग विधि हैं (9-चुनें-4 या 9-चुनें-5)। इनमें से एक मूल लेबलिंग के अनुसार है, और अन्य 125 क्रमपरिवर्तन हैं जो माध्य अंतर का हिस्टोग्राम उत्पन्न करते हैं दिखाया गया. परिकल्पना के p-मूल्य का अनुमान उन क्रमपरिवर्तनों के अनुपात के रूप में लगाया जाता है जो मूल नमूनों के साधनों के अंतर से बड़ा या बड़ा अंतर देते हैं। इस उदाहरण में, शून्य परिकल्पना p = 5% को अस्वीकार नहीं किया जा सकता है।

क्रमपरिवर्तन परीक्षण के मूल विचार को स्पष्ट करने के लिए, मान लीजिए कि हम दो समूहों और से प्रत्येक व्यक्ति के लिए यादृच्छिक चर और एकत्र करते हैं, जिनका नमूना माध्य और है, और वह हम जानना चाहते हैं कि क्या और एक ही वितरण से आते हैं। मान लीजिए और प्रत्येक समूह से एकत्रित नमूना आकार हैं। क्रमपरिवर्तन परीक्षण यह निर्धारित करने के लिए डिज़ाइन किया गया है कि क्या नमूना साधनों के बीच मनाया गया अंतर कुछ महत्व स्तर पर, शून्य परिकल्पना H को अस्वीकार करने के लिए पर्याप्त है कि से लिया गया डेटा उसी वितरण से है जैसा कि से लिया गया डेटा है।

परीक्षण इस प्रकार आगे बढ़ता है. सबसे पहले, दो नमूनों के बीच के अंतर की गणना की जाती है: यह परीक्षण सांख्यिकीय, का मनाया गया मूल्य है।

इसके बाद, समूह और के अवलोकनों को पूल किया जाता है, और नमूना साधनों में अंतर की गणना की जाती है और पूल किए गए मानों को आकार के दो समूहों और में विभाजित करने के हर संभव विधि के लिए रिकॉर्ड किया जाता है (यानी, समूह लेबल ए और बी के प्रत्येक क्रमपरिवर्तन के लिए)। इन गणना किए गए अंतरों का सेट अशक्त परिकल्पना के तहत संभावित अंतरों (इस नमूने के लिए) का सटीक वितरण है कि समूह लेबल विनिमेय हैं (यानी, यादृच्छिक रूप से निर्दिष्ट हैं)।

परीक्षण के एक तरफा p-वैल्यू की गणना नमूना क्रमपरिवर्तन के अनुपात के रूप में की जाती है जहां साधनों में अंतर से अधिक था। परीक्षण के दो-तरफा p-मान की गणना नमूना क्रमपरिवर्तन के अनुपात के रूप में की जाती है जहां पूर्ण अंतर से अधिक था। क्रमपरिवर्तन परीक्षणों के कई कार्यान्वयन के लिए आवश्यक है कि देखे गए डेटा को स्वयं क्रमपरिवर्तन में से एक के रूप में गिना जाए ताकि क्रमपरिवर्तन p-मान कभी भी शून्य न हो।[3]

वैकल्पिक रूप से, यदि परीक्षण का एकमात्र उद्देश्य शून्य परिकल्पना को अस्वीकार करना या अस्वीकार करना है, तो कोई रिकॉर्ड किए गए मतभेदों को हल कर सकता है, और फिर देखें कि क्या कुछ महत्व स्तर के लिए उनमें से मध्य के भीतर समाहित है। यदि ऐसा नहीं है, तो हम महत्व स्तर पर समान संभाव्यता वक्रों की परिकल्पना को अस्वीकार कर देते हैं।

युग्मित नमूनों के लिए युग्मित क्रमपरिवर्तन परीक्षण लागू करने की आवश्यकता है।

पैरामीट्रिक परीक्षणों से संबंध

क्रमपरिवर्तन परीक्षण गैर-पैरामीट्रिक सांख्यिकी का एक उपसमूह हैं। यह मानते हुए कि हमारा प्रयोगात्मक डेटा दो उपचार समूहों से मापा गया डेटा से आता है, विधि केवल इस धारणा के तहत औसत अंतर का वितरण उत्पन्न करती है कि दोनों समूह मापा चर के संदर्भ में अलग नहीं हैं। इससे, फिर कोई देखे गए सांख्यिकी () का उपयोग यह देखने के लिए करता है कि यह सांख्यिकी किस हद तक विशेष है, यानी, यदि उपचार के बाद उपचार लेबल को यादृच्छिक रूप से यादृच्छिक किया गया था, तो ऐसे मूल्य (या बड़े) के परिमाण को देखने की संभावना।

क्रमपरिवर्तन परीक्षणों के विपरीत, कई लोकप्रिय "चिरसम्मत" सांख्यिकीय परीक्षणों, जैसे t-परीक्षण, f-परीक्षण, z-परीक्षण और परीक्षण के अंतर्निहित वितरण सैद्धांतिक संभाव्यता वितरण से प्राप्त किए जाते हैं। फिशर का सटीक परीक्षण दो द्विभाजित चरों के बीच संबंध का मूल्यांकन करने के लिए सामान्यतः उपयोग किए जाने वाले क्रमपरिवर्तन परीक्षण का एक उदाहरण है। जब नमूना आकार बहुत बड़ा होता है, तो पियर्सन का ची-स्क्वायर परीक्षण सटीक परिणाम देगा। छोटे नमूनों के लिए, ची-स्क्वायर संदर्भ वितरण को परीक्षण आंकड़ों के संभाव्यता वितरण का सही विवरण देने के लिए नहीं माना जा सकता है, और इस स्थिति में फिशर के सटीक परीक्षण का उपयोग अधिक उपयुक्त हो जाता है।

क्रमपरिवर्तन परीक्षण कई स्थितियों में उपस्थित होते हैं जहां पैरामीट्रिक परीक्षण नहीं होते हैं (उदाहरण के लिए, जब एक इष्टतम परीक्षण प्राप्त होता है जब हानि उसके वर्ग के स्थान पर त्रुटि के आकार के समानुपाती होता है)। सभी सरल और कई अपेक्षाकृत जटिल पैरामीट्रिक परीक्षणों में एक अनुरूप क्रमपरिवर्तन परीक्षण संस्करण होता है जिसे पैरामीट्रिक परीक्षण के समान परीक्षण आंकड़ों का उपयोग करके परिभाषित किया जाता है, लेकिन पैरामीट्रिक धारणा से प्राप्त सैद्धांतिक वितरण के स्थान पर उस सांख्यिकी के नमूना-विशिष्ट क्रमपरिवर्तन वितरण से p-मान प्राप्त करता है। उदाहरण के लिए, इस विधि से क्रमपरिवर्तन t-परीक्षण, एसोसिएशन का क्रमपरिवर्तन $2 परीक्षण, भिन्नताओं की तुलना करने के लिए एली के परीक्षण का क्रमपरिवर्तन संस्करण इत्यादि बनाना संभव है।

क्रमपरिवर्तन परीक्षणों की प्रमुख कमियां यह हैं कि वे

  • कम्प्यूटेशनल रूप से गहन हो सकता है और कठिन-से-गणना सांख्यिकी के लिए "कस्टम" कोड की आवश्यकता हो सकती है। इसे प्रत्येक स्थिति के लिए पुनः लिखा जाना चाहिए।
  • इनका उपयोग मुख्य रूप से p-वैल्यू प्रदान करने के लिए किया जाता है। विश्वास क्षेत्रों/अंतरालों को प्राप्त करने के लिए परीक्षण के व्युत्क्रमण के लिए और भी अधिक गणना की आवश्यकता होती है।

लाभ

क्रमपरिवर्तन परीक्षण किसी भी परीक्षण सांख्यिकी के लिए उपस्थित होते हैं, भले ही उसका वितरण ज्ञात हो या नहीं। इस प्रकार कोई भी उस सांख्यिकी को चुनने के लिए हमेशा स्वतंत्र होता है जो परिकल्पना और विकल्प के बीच सबसे अच्छा भेदभाव करता है और जो हानि को कम करता है।

क्रमपरिवर्तन परीक्षणों का उपयोग असंतुलित डिज़ाइनों का विश्लेषण करने के लिए किया जा सकता है[4] और श्रेणीबद्ध, क्रमसूचक और मीट्रिक डेटा के मिश्रण पर निर्भर परीक्षणों के संयोजन के लिए (पेसारिन, 2001)। उनका उपयोग गुणात्मक डेटा का विश्लेषण करने के लिए भी किया जा सकता है जिसे मात्राबद्ध किया गया है (यानी, संख्याओं में बदल दिया गया है)। क्रमपरिवर्तन परीक्षण परिमाणित डेटा का विश्लेषण करने के लिए आदर्श हो सकते हैं जो पारंपरिक पैरामीट्रिक परीक्षणों (जैसे, t-परीक्षण, एनोवा) में अंतर्निहित सांख्यिकीय मान्यताओं को संतुष्ट नहीं करते हैं,[5] पर्मानोवा देखें।

1980 के दशक से पहले, छोटे नमूना आकार वाले डेटा सेट को छोड़कर संदर्भ वितरण बनाने का बोझ अत्यधिक था।

1980 के दशक के बाद से, अपेक्षाकृत सस्ते तेज़ कंप्यूटरों के संगम और विशेष परिस्थितियों में लागू होने वाले नए परिष्कृत पथ एल्गोरिदम के विकास ने समस्याओं की एक विस्तृत श्रृंखला के लिए क्रमपरिवर्तन परीक्षण विधियों के अनुप्रयोग को व्यावहारिक बना दिया है। इसने मुख्य सांख्यिकीय सॉफ़्टवेयर पैकेजों में सटीक-परीक्षण विकल्पों को जोड़ने और यूनी- और बहु-परिवर्तनीय सटीक परीक्षणों की एक विस्तृत श्रृंखला करने और परीक्षण-आधारित "सटीक" आत्मविश्वास अंतराल की गणना करने के लिए विशेष सॉफ़्टवेयर की उपस्थिति को भी प्रारंभ किया।

सीमाएँ

क्रमपरिवर्तन परीक्षण के पीछे एक महत्वपूर्ण धारणा यह है कि शून्य परिकल्पना के तहत अवलोकन विनिमय योग्य हैं। इस धारणा का एक महत्वपूर्ण परिणाम यह है कि स्थान में अंतर के परीक्षण (क्रमपरिवर्तन t-परीक्षण की तरह) को सामान्यता धारणा के तहत समान भिन्नता की आवश्यकता होती है। इस संबंध में, क्रमपरिवर्तन t-परीक्षण चिरसम्मत छात्र के t-परीक्षण (बेहरेंस-फिशर समस्या) के समान ही कमजोरी साझा करता है। इस स्थिति में तीसरा विकल्प बूटस्ट्रैप-आधारित परीक्षण का उपयोग करना है। सांख्यिकीविद् फिलिप गुड क्रमपरिवर्तन परीक्षण और बूटस्ट्रैप परीक्षण के बीच अंतर को इस प्रकार समझाते हैं: "क्रमपरिवर्तन वितरण से संबंधित परिकल्पनाओं का परीक्षण करता है; बूटस्ट्रैप मापदंडों से संबंधित परिकल्पनाओं का परीक्षण करता है। परिणामस्वरूप, बूटस्ट्रैप कम-कठोर मान्यताओं पर जोर देता है।"[6] बूटस्ट्रैप परीक्षण सटीक नहीं हैं . कुछ स्थितियों में, उचित रूप से छात्रीकृत सांख्यिकी पर आधारित एक क्रमपरिवर्तन परीक्षण विनिमयशीलता धारणा का उल्लंघन होने पर भी स्पर्शोन्मुख रूप से सटीक हो सकता है।[7] बूटस्ट्रैप-आधारित परीक्षण शून्य परिकल्पना के साथ परीक्षण कर सकते हैं और इसलिए, समकक्ष परीक्षण करने के लिए उपयुक्त हैं।

मोंटे कार्लो परीक्षण

एक सुविधाजनक विधि से पूर्ण गणना की अनुमति देने के लिए डेटा के बहुत अधिक संभावित क्रम होने पर एक असम्बद्ध रूप से समकक्ष क्रमपरिवर्तन परीक्षण बनाया जा सकता है। यह मोंटे कार्लो नमूनाकरण द्वारा संदर्भ वितरण उत्पन्न करके किया जाता है, जो संभावित प्रतिकृति का एक छोटा (कुल क्रमपरिवर्तन के सापेक्ष) यादृच्छिक नमूना लेता है। यह अहसास कि इसे किसी भी डेटासेट पर किसी भी क्रमपरिवर्तन परीक्षण पर लागू किया जा सकता है, लागू सांख्यिकी के क्षेत्र में एक महत्वपूर्ण सफलता थी। इस दृष्टिकोण के सबसे पहले ज्ञात संदर्भ ईडन और येट्स (1933) और डवास (1957) हैं।[8][9] इस प्रकार के क्रमपरिवर्तन परीक्षण को विभिन्न नामों से जाना जाता है: अनुमानित क्रमपरिवर्तन परीक्षण, मोंटे कार्लो क्रमपरिवर्तन परीक्षण या यादृच्छिक क्रमपरिवर्तन परीक्षण।[10]

यादृच्छिक क्रमपरिवर्तन बाद, द्विपद वितरण के आधार पर p-मान के लिए विश्वास अंतराल प्राप्त करना संभव है, द्विपद अनुपात विश्वास अंतराल देखें। उदाहरण के लिए, यदि बाद में यादृच्छिक क्रमपरिवर्तन से p-मान का अनुमान लगाया जाता है, फिर सत्य के लिए 99% विश्वास अंतराल (वह जो सभी संभावित क्रमपरिवर्तनों को आज़माने का परिणाम होगा) है।

.

दूसरी ओर, p-वैल्यू का अनुमान लगाने का उद्देश्य प्रायः यह तय करना होता है कि क्या , जहां वह सीमा है जिस पर शून्य परिकल्पना अस्वीकृत कर दी जाएगी (सामान्यतः = । उपरोक्त उदाहरण में, आत्मविश्वास अंतराल हमें केवल बताता है इसकी लगभग 50% संभावना है कि p-वैल्यू 0.05 से कम है, यानी यह पूरी तरह से अस्पष्ट है कि क्या शून्य परिकल्पना को के स्तर पर अस्वीकृत किया जाना चाहिए।

यदि केवल यह जानना महत्वपूर्ण है कि क्या किसी दिए गए के लिए है, तो तब तक अनुकरण जारी रखना तर्कसंगत है जब तक कि त्रुटि की बहुत कम संभावना के साथ कथन को सही या गलत के रूप में स्थापित नहीं किया जा सकता। त्रुटि की स्वीकार्य संभावना पर एक बाध्य को देखते हुए (उस को खोजने की संभावना जब वास्तव में या इसके विपरीत), कितने क्रमपरिवर्तन उत्पन्न करने का प्रश्न इस प्रश्न के रूप में देखा जा सकता है कि कब उत्पादन बंद करना है अब तक के सिमुलेशन के परिणामों के आधार पर क्रमपरिवर्तन, यह गारंटी देने के लिए कि निष्कर्ष (जो या तो या है) कम से कम जितनी बड़ी संभावना के साथ सही है। (को सामान्यतः बेहद छोटा चुना जाएगा, उदाहरण के लिए 1/1000।) इसे प्राप्त करने के लिए स्टॉपिंग नियम विकसित किए गए हैं [11] जिसे न्यूनतम अतिरिक्त कम्प्यूटेशनल लागत के साथ सम्मिलित किया जा सकता है। वास्तव में, वास्तविक अंतर्निहित पी-वैल्यू के आधार पर यह प्रायः पाया जाएगा कि वर्चुअल निश्चितता के साथ किसी निर्णय पर पहुंचने से पहले आवश्यक सिमुलेशन की संख्या उल्लेखनीय रूप से छोटी है (उदाहरण के लिए 5 जितनी कम और प्रायः 100 से बड़ी नहीं)।

उदाहरण परीक्षण

  • विचरण का क्रमपरिवर्तन विश्लेषण

साहित्य

मूल संदर्भ:

  • आर. ए. फिशर|फिशर, आर.ए. (1935) प्रयोगों का डिज़ाइन, न्यूयॉर्क: हाफनर प्रकाशन
  • ई. जे. जी. पिटमैन|पिटमैन, ई. जे. जी. (1937) महत्व परीक्षण जो किसी भी आबादी के नमूनों पर लागू किए जा सकते हैं, रॉयल स्टैटिस्टिकल सोसाइटी सप्लीमेंट, 4: 119-130 और 225-32 (भाग I और II)। JSTOR 2984124 JSTOR 2983647
  • Pitman, E. J. G. (1938). "महत्व परीक्षण जो किसी भी जनसंख्या के नमूनों पर लागू किए जा सकते हैं। भाग III. विचरण परीक्षण का विश्लेषण". Biometrika. 29 (3–4): 322–335. doi:10.1093/biomet/29.3-4.322.

आधुनिक संदर्भ:

कम्प्यूटेशनल विधि:

क्रमपरिवर्तन परीक्षणों पर वर्तमान शोध

संदर्भ

  1. Moore, Jason H. "Bootstrapping, permutation testing and the method of surrogate data." Physics in Medicine & Biology 44.6 (1999): L11.
  2. Onghena, Patrick (2017-10-30), Berger, Vance W. (ed.), "Randomization Tests or Permutation Tests? A Historical and Terminological Clarification", Randomization, Masking, and Allocation Concealment (in English) (1 ed.), Boca Raton, FL: Chapman and Hall/CRC, pp. 209–228, doi:10.1201/9781315305110-14, ISBN 978-1-315-30511-0, retrieved 2021-10-08
  3. Phipson, Belinda; Smyth, Gordon K (2010). "Permutation p-values should never be zero: calculating exact p-values when permutations are randomly drawn". Statistical Applications in Genetics and Molecular Biology. 9 (1): Article 39. arXiv:1603.05766. doi:10.2202/1544-6115.1585. PMID 21044043. S2CID 10735784.
  4. "आमंत्रित लेख" (PDF). Journal of Modern Applied Statistical Methods. 1 (2): 202–522. Fall 2011. Archived from the original (PDF) on May 5, 2003.
  5. Collingridge, Dave S. (11 September 2012). "परिमाणित डेटा विश्लेषण और क्रमपरिवर्तन परीक्षण पर एक प्राइमर". Journal of Mixed Methods Research. 7 (1): 81–97. doi:10.1177/1558689812454457. S2CID 124618343.
  6. Good, Phillip I. (2005). Resampling Methods: A Practical Guide to Data Analysis (3rd ed.). Birkhäuser. ISBN 978-0817643867.
  7. Chung, EY; Romano, JP (2013). "सटीक और स्पर्शोन्मुख रूप से मजबूत क्रमपरिवर्तन परीक्षण". The Annals of Statistics. 41 (2): 487–507. arXiv:1304.5939. doi:10.1214/13-AOS1090.
  8. Eden, T; Yates, F (1933). "गैर-सामान्य डेटा के वास्तविक उदाहरण पर लागू होने पर फिशर के जेड परीक्षण की वैधता पर। (पाँच पाठ-चित्रों के साथ।)". The Journal of Agricultural Science. 23 (1): 6–17. doi:10.1017/S0021859600052862. S2CID 84802682. Retrieved 3 June 2021.
  9. Dwass, Meyer (1957). "गैर-पैरामीट्रिक परिकल्पनाओं के लिए संशोधित यादृच्छिकीकरण परीक्षण". Annals of Mathematical Statistics. 28 (1): 181–187. doi:10.1214/aoms/1177707045. JSTOR 2237031.
  10. Thomas E. Nichols, Andrew P. Holmes (2001). "Nonparametric Permutation Tests For Functional Neuroimaging: A Primer with Examples" (PDF). Human Brain Mapping. 15 (1): 1–25. doi:10.1002/hbm.1058. hdl:2027.42/35194. PMC 6871862. PMID 11747097.
  11. Gandy, Axel (2009). "समान रूप से सीमित पुन: नमूनाकरण जोखिम के साथ मोंटे कार्लो परीक्षणों का अनुक्रमिक कार्यान्वयन". Journal of the American Statistical Association. 104 (488): 1504–1511. arXiv:math/0612488. doi:10.1198/jasa.2009.tm08368. S2CID 15935787.