नमूना आकार निर्धारण: Difference between revisions

From Vigyanwiki
(Created page with "{{Short description|Statistical way determining sample size of population}} नमूना आकार निर्धारण एक सांख्यिकीय नम...")
 
No edit summary
 
(23 intermediate revisions by 3 users not shown)
Line 1: Line 1:
{{Short description|Statistical way determining sample size of population}}
{{Short description|Statistical way determining sample size of population}}
नमूना आकार निर्धारण एक सांख्यिकीय नमूने में शामिल करने के लिए टिप्पणियों या [[प्रतिकृति (सांख्यिकी)]] की संख्या को चुनने का कार्य है। नमूना आकार किसी भी अनुभवजन्य अध्ययन की एक महत्वपूर्ण विशेषता है जिसमें लक्ष्य एक नमूने से सांख्यिकीय आबादी के बारे में [[सांख्यिकीय निष्कर्ष]] निकालना है। व्यवहार में, एक अध्ययन में प्रयुक्त नमूना आकार आमतौर पर डेटा एकत्र करने की लागत, समय या सुविधा के आधार पर निर्धारित किया जाता है, और इसके लिए पर्याप्त [[सांख्यिकीय शक्ति]] प्रदान करने की आवश्यकता होती है। जटिल अध्ययनों में कई अलग-अलग नमूना आकार हो सकते हैं: उदाहरण के लिए, स्तरीकृत नमूनाकरण सर्वेक्षण नमूने में प्रत्येक स्तर के लिए अलग-अलग आकार होंगे। [[जनगणना]] में, संपूर्ण जनसंख्या के लिए डेटा मांगा जाता है, इसलिए इच्छित नमूना आकार जनसंख्या के बराबर होता है। प्रायोगिक डिजाइन में, जहां एक अध्ययन को विभिन्न [[उपचार समूह]]ों में विभाजित किया जा सकता है, वहां प्रत्येक समूह के लिए अलग-अलग नमूना आकार हो सकते हैं।
नमूना आकार निर्धारण सांख्यिकीय नमूना में सम्मिलित करने के लिए टिप्पणियों या [[प्रतिकृति (सांख्यिकी)]] की संख्या को चुनने का कार्य है। नमूना आकार किसी भी अनुभवजन्य अध्ययन की एक महत्वपूर्ण विशेषता है। जिसमें लक्ष्य एक नमूना से सांख्यिकीय आबादी के बारे में [[सांख्यिकीय निष्कर्ष]] निकालना है। व्यवहार में अध्ययन में प्रयुक्त नमूना आकार सामान्यतः डेटा एकत्र करने की लागत समय या सुविधा के आधार पर निर्धारित किया जाता है। और इसके लिए पर्याप्त [[सांख्यिकीय शक्ति]] प्रदान करने की आवश्यकता होती है। जटिल अध्ययनों में कई अलग-अलग नमूना आकार हो सकते हैं। उदाहरण के लिए स्तरीकृत नमूनाकरण सर्वेक्षण नमूना में प्रत्येक स्तर के लिए अलग-अलग आकार होंगे। [[जनगणना]] में संपूर्ण जनसंख्या के लिए डेटा मांगा जाता है। इसलिए इच्छित नमूना आकार जनसंख्या के बराबर होता है। प्रायोगिक डिजाइन में जहां एक अध्ययन को विभिन्न [[उपचार समूह|उपचार समूहो]] में विभाजित किया जा सकता है। वहां प्रत्येक समूह के लिए अलग-अलग नमूना आकार हो सकते हैं।


नमूना आकार कई तरीकों से चुने जा सकते हैं:
नमूना आकार कई तरीकों से चुने जा सकते हैं।
*अनुभव का उपयोग - छोटे नमूने, हालांकि कभी-कभी अपरिहार्य होते हैं, व्यापक [[विश्वास अंतराल]] और [[सांख्यिकीय परिकल्पना परीक्षण]] में त्रुटियों का जोखिम हो सकता है।
*अनुभव का उपयोग - छोटे नमूना चूंकि कभी-कभी अपरिहार्य होते हैं। व्यापक [[विश्वास अंतराल]] और [[सांख्यिकीय परिकल्पना परीक्षण]] में त्रुटियों का जोखिम हो सकता है।
* अंततः प्राप्त नमूने से प्राप्त होने वाले अनुमान के लिए एक लक्ष्य भिन्नता का उपयोग करना, यानी, यदि उच्च परिशुद्धता की आवश्यकता होती है (संकीर्ण आत्मविश्वास अंतराल) यह अनुमानक के निम्न लक्ष्य भिन्नता में अनुवाद करता है।
* अंततः प्राप्त नमूना से प्राप्त होने वाले अनुमान के लिए एक लक्ष्य भिन्नता का उपयोग करना। अर्थात उच्च परिशुद्धता की आवश्यकता होती है। (संकीर्ण आत्मविश्वास अंतराल) यह अनुमानक के निम्न लक्ष्य भिन्नता में अनुवाद करता है।
*नमूना एकत्र करने के बाद लागू किए जाने वाले सांख्यिकीय परिकल्पना परीक्षण की शक्ति के लिए एक लक्ष्य का उपयोग करना।
*नमूना एकत्र करने के बाद लागू किए जाने वाले सांख्यिकीय परिकल्पना परीक्षण की शक्ति के लिए एक लक्ष्य का उपयोग करना।
*आत्मविश्वास स्तर का उपयोग करना, यानी आवश्यक आत्मविश्वास स्तर जितना बड़ा होगा, नमूना आकार उतना ही बड़ा होगा (निरंतर सटीकता की आवश्यकता को देखते हुए)।
*आत्मविश्वास स्तर का उपयोग करना। अर्थात आवश्यक आत्मविश्वास स्तर जितना बड़ा होगा।  नमूना आकार उतना ही बड़ा होगा। (निरंतर सटीकता की आवश्यकता को देखते हुए)।


== परिचय ==
== परिचय ==


[[सांख्यिकीय अनुमान]] अज्ञात पैरामीटर होने पर बड़े नमूना आकार आम तौर पर सटीकता और सटीकता में वृद्धि करते हैं। उदाहरण के लिए, यदि हम मछली की एक निश्चित प्रजाति के अनुपात को जानना चाहते हैं जो एक रोगज़नक़ से संक्रमित है, तो हम आम तौर पर इस अनुपात का अधिक सटीक अनुमान लगा सकते हैं यदि हम 100 मछलियों के बजाय 200 मछलियों का नमूना लेते हैं और उनकी जांच करते हैं। गणितीय आँकड़ों के कई मूलभूत तथ्य इस घटना का वर्णन करते हैं, जिसमें बड़ी संख्या का नियम और [[केंद्रीय सीमा प्रमेय]] शामिल हैं।
[[सांख्यिकीय अनुमान]] अज्ञात पैरामीटर होने पर बड़े नमूना आकार सामान्यतः सटीकता में वृद्धि करते हैं। उदाहरण के लिए यदि हम मछली की एक निश्चित प्रजाति के अनुपात को जानना चाहते हैं। जो एक रोगज़नक़ से संक्रमित है। तो हम सामान्यतः इस अनुपात का अधिक सटीक अनुमान लगा सकते हैं। यदि हम 100 मछलियों के बजाय 200 मछलियों का नमूना लेते हैं। और उनकी जांच करते हैं। गणितीय आँकड़ों के कई मूलभूत तथ्य इस घटना का वर्णन करते हैं। जिसमें बड़ी संख्या का नियम और [[केंद्रीय सीमा प्रमेय]] सम्मिलित हैं।


कुछ स्थितियों में, बड़े नमूना आकारों के लिए सटीकता में वृद्धि न्यूनतम या न के बराबर होती है। यह डेटा में व्यवस्थित त्रुटियों या मजबूत [[सहसंबंध और निर्भरता]] की उपस्थिति के परिणामस्वरूप हो सकता है, या यदि डेटा भारी-पूंछ वाले वितरण का अनुसरण करता है।
कुछ स्थितियों में बड़े नमूना आकारों के लिए सटीकता में वृद्धि न्यूनतम या न के बराबर होती है। यह डेटा में व्यवस्थित त्रुटियों या मजबूत [[सहसंबंध और निर्भरता]] की उपस्थिति के परिणामस्वरूप हो सकता है। या यदि डेटा भारी-पूंछ वाले वितरण का अनुसरण करता है।


परिणामी अनुमानों की गुणवत्ता द्वारा नमूना आकार का मूल्यांकन किया जा सकता है। उदाहरण के लिए, यदि किसी अनुपात का अनुमान लगाया जा रहा है, तो कोई चाहता है कि 95% विश्वास अंतराल 0.06 इकाइयों से कम चौड़ा हो। वैकल्पिक रूप से, परिकल्पना परीक्षण की सांख्यिकीय शक्ति के आधार पर नमूना आकार का मूल्यांकन किया जा सकता है। उदाहरण के लिए, यदि हम पुरुषों के बीच उस उम्मीदवार के समर्थन के साथ महिलाओं के बीच एक निश्चित राजनीतिक उम्मीदवार के समर्थन की तुलना कर रहे हैं, तो हम 0.04 इकाइयों के समर्थन स्तरों में अंतर का पता लगाने के लिए 80% शक्ति प्राप्त करना चाह सकते हैं।
परिणामी अनुमानों की गुणवत्ता द्वारा नमूना आकार का मूल्यांकन किया जा सकता है। उदाहरण के लिए यदि किसी अनुपात का अनुमान लगाया जा रहा है। तो कोई चाहता है कि 95% विश्वास अंतराल 0.06 इकाइयों से कम चौड़ा हो। वैकल्पिक रूप से परिकल्पना परीक्षण की सांख्यिकीय शक्ति के आधार पर नमूना आकार का मूल्यांकन किया जा सकता है। उदाहरण के लिए यदि हम पुरुषों के बीच उस उम्मीदवार के समर्थन के साथ महिलाओं के बीच एक निश्चित राजनीतिक उम्मीदवार के समर्थन की तुलना कर रहे हैं। तो हम 0.04 इकाइयों के समर्थन स्तरों में अंतर का पता लगाने के लिए 80% शक्ति प्राप्त करना चाह सकते हैं।


== अनुमान ==
== अनुमान ==


=== एक अनुपात का अनुमान ===
=== एक अनुपात का अनुमान ===
{{main|Population proportion}}
{{main|जनसंख्या अनुपात}}
अपेक्षाकृत सरल स्थिति [[आनुपातिकता (गणित)]] का अनुमान है। उदाहरण के लिए, हम किसी समुदाय में कम से कम 65 वर्ष के निवासियों के अनुपात का अनुमान लगाना चाह सकते हैं।
अपेक्षाकृत सरल स्थिति [[आनुपातिकता (गणित)]] का अनुमान है। उदाहरण के लिए हम किसी समुदाय में कम से कम 65 वर्ष के निवासियों के अनुपात का अनुमान लगाना चाह सकते हैं।


एक आनुपातिकता (गणित) का अनुमानक है <math> \hat p = X/n</math>, जहां X 'पॉजिटिव' की संख्या है, उदाहरण के लिए, n सैंपल किए गए लोगों में से उन लोगों की संख्या जो कम से कम 65 वर्ष के हैं)। जब अवलोकन [[स्वतंत्र (सांख्यिकी)]] होते हैं, तो इस अनुमानक के पास एक (स्केल्ड) [[द्विपद वितरण]] होता है (और बर्नौली वितरण से डेटा का [[नमूना (सांख्यिकी)]] अंकगणितीय माध्य भी होता है)। इस वितरण का अधिकतम विचरण 0.25 है, जो तब होता है जब सही [[पैरामीटर]] p = 0.5 होता है। व्यवहार में, चूंकि पी अज्ञात है, नमूना आकार के आकलन के लिए अक्सर अधिकतम भिन्नता का उपयोग किया जाता है। यदि पी के लिए उचित अनुमान मात्रा ज्ञात है <math>p(1-p)</math> 0.25 के स्थान पर उपयोग किया जा सकता है।
एक आनुपातिकता (गणित) का अनुमानक है <math> \hat p = X/n</math> जहां X 'पॉजिटिव' की संख्या है। उदाहरण के लिए n नमूना किए गए लोगों में से उन लोगों की संख्या जो कम से कम 65 वर्ष के हैं)। जब अवलोकन [[स्वतंत्र (सांख्यिकी)]] होते हैं। तो इस अनुमानक के पास एक (स्केल्ड) [[द्विपद वितरण]] होता है। (और बर्नौली वितरण से डेटा का [[नमूना (सांख्यिकी)]] अंकगणितीय माध्य भी होता है)। इस वितरण का अधिकतम विचरण 0.25 है। जो तब होता है जब सही [[पैरामीटर]] p = 0.5 होता है। व्यवहार में चूंकि पी अज्ञात है।  नमूना आकार के आकलन के लिए अधिकांशतः अधिकतम भिन्नता का उपयोग किया जाता है। यदि पी के लिए उचित अनुमान मात्रा ज्ञात है। <math>p(1-p)</math> 0.25 के स्थान पर उपयोग किया जा सकता है।


पर्याप्त रूप से बड़े एन के लिए, का वितरण <math>\hat{p}</math> एक [[सामान्य वितरण]] द्वारा बारीकी से अनुमानित किया जाएगा।<ref>[[NIST]]/[[SEMATECH]], [http://www.itl.nist.gov/div898/handbook/prc/section2/prc242.htm "7.2.4.2. Sample sizes required"], ''e-Handbook of Statistical Methods.''</ref> इसका और द्विपद बंटन#कॉन्फ़िडेंस इंटरवल का उपयोग करने से फ़ॉर्म का कॉन्फ़िडेंस इंटरवल प्राप्त होता है
पर्याप्त रूप से बड़े एन के लिए वितरण <math>\hat{p}</math> एक [[सामान्य वितरण]] द्वारा बारीकी से अनुमानित किया जाएगा।<ref>[[NIST]]/[[SEMATECH]], [http://www.itl.nist.gov/div898/handbook/prc/section2/prc242.htm "7.2.4.2. Sample sizes required"], ''e-Handbook of Statistical Methods.''</ref> इसका और द्विपद बंटन कॉन्फ़िडेंस इंटरवल का उपयोग करने से फ़ॉर्म का कॉन्फ़िडेंस इंटरवल प्राप्त होता है।


:<math>\left (\widehat p - Z\sqrt{\frac{0.25}{n}}, \quad \widehat p + Z\sqrt{\frac{0.25}{n}} \right )</math> ,
:<math>\left (\widehat p - Z\sqrt{\frac{0.25}{n}}, \quad \widehat p + Z\sqrt{\frac{0.25}{n}} \right )</math>  
:जहाँ Z एक मानक मानक स्कोर है | आत्मविश्वास के वांछित स्तर के लिए Z-स्कोर (95% विश्वास अंतराल के लिए 1.96)।
:जहाँ Z एक मानक स्कोर है | आत्मविश्वास के वांछित स्तर के लिए Z-स्कोर (95% विश्वास अंतराल के लिए 1.96)।


अगर हम एक कॉन्फिडेंस इंटरवल चाहते हैं, जो चौड़ाई में कुल W यूनिट है (नमूना माध्य के प्रत्येक तरफ W/2), तो हम हल करेंगे
अगर हम एक कॉन्फिडेंस इंटरवल चाहते हैं। जो चौड़ाई में कुल W यूनिट है। ( नमूना माध्य के प्रत्येक तरफ W/2) तो हम हल करेंगे।


:<math>Z\sqrt{\frac{0.25}{n}} = W/2</math>
:<math>Z\sqrt{\frac{0.25}{n}} = W/2</math>
एन के लिए, नमूना आकार उपज
एन के लिए नमूना आकार उपज
[[File:Sample size proportions.svg|thumb|द्विपद अनुपात के लिए नमूना आकार अलग-अलग आत्मविश्वास स्तर और त्रुटि के मार्जिन दिए गए हैं]]
[[File:Sample size proportions.svg|thumb|द्विपद अनुपात के लिए नमूना आकार अलग-अलग आत्मविश्वास स्तर और त्रुटि के मार्जिन दिए गए हैं]]
<math>n=\frac{Z^2}{W^2}</math> अनुपात के सबसे रूढ़िवादी अनुमान के रूप में .5 का उपयोग करने के मामले में। (नोट: W/2 = त्रुटि का मार्जिन।)
<math>n=\frac{Z^2}{W^2}</math> अनुपात के सबसे रूढ़िवादी अनुमान के रूप में .5 का उपयोग करने के स्थितियों में (नोट: W/2 = त्रुटि का मार्जिन।)


नीचे दिए गए चित्र में कोई भी यह देख सकता है कि द्विपद अनुपात के लिए नमूना आकार अलग-अलग आत्मविश्वास के स्तर और [[त्रुटि के मार्जिन]] को कैसे बदलता है।
नीचे दिए गए चित्र में कोई भी यह देख सकता है। कि द्विपद अनुपात के लिए नमूना आकार अलग-अलग आत्मविश्वास के स्तर और [[त्रुटि के मार्जिन]] को कैसे बदलता है।






अन्यथा, सूत्र होगा <math>Z\sqrt{\frac{p(1-p)}{n}} = W/2</math> , कौन सी पैदावार  <math>n = \frac{4Z^2p(1-p)}{W^2}</math>.
अन्यथा सूत्र होगा <math>Z\sqrt{\frac{p(1-p)}{n}} = W/2</math> कौन सी पैदावार  <math>n = \frac{4Z^2p(1-p)}{W^2}</math>.


उदाहरण के लिए, यदि हम किसी विशेष राष्ट्रपति पद के उम्मीदवार का समर्थन करने वाली अमेरिकी आबादी के अनुपात का अनुमान लगाने में रुचि रखते हैं, और हम चाहते हैं कि 95% विश्वास अंतराल की चौड़ाई अधिकतम 2 प्रतिशत अंक (0.02) हो, तो हमें एक नमूना आकार की आवश्यकता होगी का (1.96)<sup>2</sup>/ (0.02<sup>2</sup>) = 9604। इस मामले में पी के लिए 0.5 अनुमान का उपयोग करना उचित है क्योंकि राष्ट्रपति पद की दौड़ अक्सर 50/50 के करीब होती है, और रूढ़िवादी अनुमान का उपयोग करना भी विवेकपूर्ण है। इस मामले में त्रुटि का मार्जिन 1 प्रतिशत बिंदु (0.02 का आधा) है।
उदाहरण के लिए यदि हम किसी विशेष राष्ट्रपति पद के उम्मीदवार का समर्थन करने वाली अमेरिकी आबादी के अनुपात का अनुमान लगाने में रुचि रखते हैं और हम चाहते हैं कि 95% विश्वास अंतराल की चौड़ाई अधिकतम 2 प्रतिशत अंक (0.02) हो। तो हमें एक नमूना (1.96)<sup>2</sup>/ (0.02<sup>2</sup>) = 9604) आकार की आवश्यकता होगी। इस स्थितियों में पी के लिए 0.5 अनुमान का उपयोग करना उचित है क्योंकि राष्ट्रपति पद की दौड़ अधिकांशतः 50/50 के करीब होती है और रूढ़िवादी अनुमान का उपयोग करना भी विवेकपूर्ण है। इस स्थितियों में त्रुटि का मार्जिन 1 प्रतिशत बिंदु (0.02 का आधा) है।


पूर्वगामी आमतौर पर सरलीकृत है
पूर्वगामी सामान्यतः सरलीकृत है।
:<math>\left (\widehat p -1.96\sqrt{\frac{0.25}{n}}, \widehat p +1.96\sqrt{\frac{0.25}{n}} \right )</math>
:<math>\left (\widehat p -1.96\sqrt{\frac{0.25}{n}}, \widehat p +1.96\sqrt{\frac{0.25}{n}} \right )</math>
सही अनुपात के लिए 95% कॉन्फ़िडेंस इंटरवल बनाएगा। यदि इस अंतराल को डब्ल्यू इकाइयों से अधिक चौड़ा नहीं होना चाहिए, तो समीकरण
सही अनुपात के लिए 95% कॉन्फ़िडेंस इंटरवल बनाएगा। यदि इस अंतराल को डब्ल्यू इकाइयों से अधिक चौड़ा नहीं होना चाहिए। तो समीकरण


:<math>4\sqrt{\frac{0.25}{n}} = W</math>
:<math>4\sqrt{\frac{0.25}{n}} = W</math>
n, उपज के लिए हल किया जा सकता है<ref>{{cite web|url=http://www.utdallas.edu/~ammann/stat3355/node25.html|title=प्रतिगमन के लिए अनुमान|work=utdallas.edu}}</ref><ref>[http://nebula.deanza.fhda.edu/~bloom/Math10/M10ConfIntNotes.pdf "Confidence Interval for a Proportion"] {{webarchive|url=https://web.archive.org/web/20110823021440/http://nebula.deanza.fhda.edu/~bloom/Math10/M10ConfIntNotes.pdf |date=2011-08-23 }}</ref> एन = 4/डब्ल्यू<sup>2</sup> = 1/बी<sup>2</sup> जहां बी अनुमान पर बाध्य त्रुटि है, यानी, अनुमान आमतौर पर ± बी के रूप में दिया जाता है। बी = 10% के लिए एन = 100 की आवश्यकता होती है, बी = 5% के लिए एन = 400 की आवश्यकता होती है B = 3% आवश्यकता लगभग n = 1000 है, जबकि B = 1% के लिए n = 10000 का एक नमूना आकार आवश्यक है। [[जनमत सर्वेक्षण]]ों और अन्य [[नमूना सर्वेक्षण]]ों की समाचार रिपोर्टों में इन नंबरों को अक्सर उद्धृत किया जाता है। हालाँकि, रिपोर्ट किए गए परिणाम सटीक मान नहीं हो सकते हैं क्योंकि संख्याओं को अधिमानतः गोल किया जाता है। यह जानते हुए कि n का मान वांछित परिणाम प्राप्त करने के लिए आवश्यक प्राथमिक घटनाओं की न्यूनतम संख्या है, तब उत्तरदाताओं की संख्या न्यूनतम पर या उससे अधिक होनी चाहिए।
n उपज के लिए हल किया जा सकता है।<ref>{{cite web|url=http://www.utdallas.edu/~ammann/stat3355/node25.html|title=प्रतिगमन के लिए अनुमान|work=utdallas.edu}}</ref><ref>[http://nebula.deanza.fhda.edu/~bloom/Math10/M10ConfIntNotes.pdf "Confidence Interval for a Proportion"] {{webarchive|url=https://web.archive.org/web/20110823021440/http://nebula.deanza.fhda.edu/~bloom/Math10/M10ConfIntNotes.pdf |date=2011-08-23 }}</ref> ''n'' = 4/''W''<sup>2</sup> = 1/''B''<sup>2</sup> जहां ''B'' अनुमान पर बाध्य त्रुटि है। अर्थात अनुमान सामान्यतः ''± B'' के रूप में दिया जाता है। ''B'' = 10% के लिए ''n'' = 100 की आवश्यकता होती है। ''B'' = 5% के लिए ''n'' = 400 की आवश्यकता होती है। B = 3% आवश्यकता लगभग n = 1000 है। जबकि B = 1% के लिए n = 10000 का एक नमूना आकार आवश्यक है। [[जनमत सर्वेक्षण|जनमत सर्वेक्षणों]] और अन्य [[नमूना सर्वेक्षण|नमूना सर्वेक्षणों]] की समाचार रिपोर्टों में इन नंबरों को अधिकांशतः उद्धृत किया जाता है। हालाँकि रिपोर्ट किए गए परिणाम सटीक मान नहीं हो सकते हैं क्योंकि संख्याओं को अधिमानतः गोल किया जाता है। यह जानते हुए कि n का मान वांछित परिणाम प्राप्त करने के लिए आवश्यक प्राथमिक घटनाओं की न्यूनतम संख्या है तब उत्तरदाताओं की संख्या न्यूनतम पर या उससे अधिक होनी चाहिए।


=== माध्य का अनुमान ===
=== माध्य का अनुमान ===
जनसंख्या का आकलन करते समय मतलब n आकार के एक स्वतंत्र और समान रूप से वितरित (iid) नमूने का उपयोग करना, जहां प्रत्येक डेटा मान में भिन्नता σ है<sup>2</sup>, नमूना माध्य की मानक त्रुटि (आँकड़े) है:
जनसंख्या का आकलन करते समय मतलब n आकार के एक स्वतंत्र और समान रूप से वितरित (iid) नमूना का उपयोग करना जहां प्रत्येक डेटा मान में भिन्नता ''σ''<sup>2</sup> है।  नमूना माध्य की मानक त्रुटि (आँकड़े) है।


:<math>\frac{\sigma}{\sqrt{n}}.</math>
:<math>\frac{\sigma}{\sqrt{n}}.</math>
यह अभिव्यक्ति मात्रात्मक रूप से वर्णन करती है कि कैसे नमूना आकार बढ़ने पर अनुमान अधिक सटीक हो जाता है। सामान्य वितरण के साथ नमूना माध्य का अनुमान लगाने के औचित्य के लिए केंद्रीय सीमा प्रमेय का उपयोग करने से प्रपत्र का विश्वास अंतराल प्राप्त होता है
यह अभिव्यक्ति मात्रात्मक रूप से वर्णन करती है कि कैसे नमूना आकार बढ़ने पर अनुमान अधिक सटीक हो जाता है। सामान्य वितरण के साथ नमूना माध्य का अनुमान लगाने के औचित्य के लिए केंद्रीय सीमा प्रमेय का उपयोग करने से प्रपत्र का विश्वास अंतराल प्राप्त होता है।


:<math> \left(\bar x - \frac{Z\sigma}{\sqrt{n}}, \quad \bar x + \frac{Z\sigma}{\sqrt{n}} \right )</math> ,
:<math> \left(\bar x - \frac{Z\sigma}{\sqrt{n}}, \quad \bar x + \frac{Z\sigma}{\sqrt{n}} \right )</math>  
:जहाँ Z एक मानक मानक स्कोर है | आत्मविश्वास के वांछित स्तर के लिए Z-स्कोर (95% विश्वास अंतराल के लिए 1.96)।
:जहाँ Z एक मानक स्कोर है | आत्मविश्वास के वांछित स्तर के लिए Z-स्कोर (95% विश्वास अंतराल के लिए 1.96)।


अगर हम एक कॉन्फिडेंस इंटरवल चाहते हैं, जो W यूनिट्स टोटल इन विड्थ (W/2 सैंपल मीन के हर साइड पर एरर का मार्जिन है) हो, तो हम हल करेंगे
अगर हम एक कॉन्फिडेंस इंटरवल चाहते हैं जो W यूनिट्स टोटल इन विड्थ (W/2 नमूना मीन के हर साइड पर एरर का मार्जिन है) तो हम हल करेंगे।


:<math> \frac{Z\sigma}{\sqrt{n}} = W/2</math>
:<math> \frac{Z\sigma}{\sqrt{n}} = W/2</math>
एन के लिए, नमूना आकार उपज
''n'' के लिए नमूना आकार उपज


<math>n = \frac{4Z^2\sigma^2}{W^2}</math>.
<math>n = \frac{4Z^2\sigma^2}{W^2}</math>.


उदाहरण के लिए, यदि हम उस राशि का अनुमान लगाने में रुचि रखते हैं जिसके द्वारा एक दवा किसी व्यक्ति के रक्तचाप को 95% कॉन्फिडेंस इंटरवल के साथ कम करती है जो कि छह यूनिट चौड़ा है, और हम जानते हैं कि जनसंख्या में रक्तचाप का मानक विचलन 15 है, तो आवश्यक नमूना आकार है <math>\frac{4\times1.96^2\times15^2}{6^2} = 96.04</math>, जिसे 97 तक गोल किया जाएगा, क्योंकि प्राप्त मूल्य न्यूनतम नमूना आकार है, और नमूना आकार पूर्णांक होना चाहिए और परिकलित न्यूनतम पर या उससे ऊपर होना चाहिए।
उदाहरण के लिए यदि हम उस राशि का अनुमान लगाने में रुचि रखते हैं। जिसके द्वारा एक दवा किसी व्यक्ति के रक्तचाप को 95% कॉन्फिडेंस इंटरवल के साथ कम करती है जो कि छह यूनिट चौड़ा है और हम जानते हैं कि जनसंख्या में रक्तचाप का मानक विचलन 15 है। तो आवश्यक नमूना आकार है <math>\frac{4\times1.96^2\times15^2}{6^2} = 96.04</math> जिसे 97 तक गोल किया जाएगा क्योंकि प्राप्त मूल्य न्यूनतम नमूना आकार है और नमूना आकार पूर्णांक होना चाहिए और परिकलित न्यूनतम पर या उससे ऊपर होना चाहिए।


== परिकल्पना परीक्षण के लिए आवश्यक नमूना आकार {{anchor|Estimating sample sizes}}==
== परिकल्पना परीक्षण के लिए आवश्यक नमूना आकार {{anchor|Estimating sample sizes}}==
सांख्यिकीविदों द्वारा सामना की जाने वाली एक आम समस्या एक पूर्व निर्धारित प्रकार I त्रुटि दर α दिए जाने पर परीक्षण के लिए एक निश्चित सांख्यिकीय शक्ति प्राप्त करने के लिए आवश्यक नमूना आकार की गणना करना है। निम्नानुसार, इसका अनुमान कुछ मानों के लिए पूर्व-निर्धारित तालिकाओं द्वारा, मीड के संसाधन समीकरण द्वारा, या अधिक सामान्यतः, संचयी वितरण फ़ंक्शन द्वारा लगाया जा सकता है:
सांख्यिकीविदों द्वारा सामना की जाने वाली एक आम समस्या एक पूर्व निर्धारित प्रकार त्रुटि दर α दिए जाने पर परीक्षण के लिए एक निश्चित सांख्यिकीय शक्ति प्राप्त करने के लिए आवश्यक नमूना आकार की गणना करना है। निम्नानुसार इसका अनुमान कुछ मानों के लिए पूर्व-निर्धारित तालिकाओं द्वारा मीड के संसाधन समीकरण द्वारा या अधिक सामान्यतः संचयी वितरण फ़ंक्शन द्वारा लगाया जा सकता है।


=== टेबल्स ===
=== टेबल्स ===
Line 102: Line 102:
| 920 || 148 || 58
| 920 || 148 || 58
|}
|}
दाईं ओर दिखाई गई तालिका का उपयोग [[दो-नमूना टी-टेस्ट]] में एक प्रायोगिक समूह और एक [[नियंत्रण समूह]] के नमूने के आकार का अनुमान लगाने के लिए किया जा सकता है जो समान आकार के हैं, यानी परीक्षण में व्यक्तियों की कुल संख्या दोगुनी है। संख्या दी गई है, और वांछित महत्व स्तर 0.05 है।<ref name=Kenny1987>[http://davidakenny.net/doc/statbook/chapter_13.pdf Chapter 13], page 215, in: {{cite book |author=Kenny, David A. |title=Statistics for the social and behavioral sciences |publisher=Little, Brown |location=Boston |year=1987 |isbn=978-0-316-48915-7 }}</ref> उपयोग किए गए पैरामीटर हैं:
दाईं ओर दिखाई गई तालिका का उपयोग [[दो-नमूना टी-टेस्ट|दो- नमूना टी-टेस्ट]] में एक प्रायोगिक समूह और एक [[नियंत्रण समूह]] के नमूना के आकार का अनुमान लगाने के लिए किया जा सकता है। जो समान आकार के हैं। अर्थात परीक्षण में व्यक्तियों की कुल संख्या दोगुनी है। संख्या दी गई है और वांछित महत्व स्तर 0.05 है।<ref name=Kenny1987>[http://davidakenny.net/doc/statbook/chapter_13.pdf Chapter 13], page 215, in: {{cite book |author=Kenny, David A. |title=Statistics for the social and behavioral sciences |publisher=Little, Brown |location=Boston |year=1987 |isbn=978-0-316-48915-7 }}</ref> उपयोग किए गए पैरामीटर हैं।
* परीक्षण की वांछित सांख्यिकीय शक्ति, बाईं ओर के कॉलम में दिखाई गई है।
* परीक्षण की वांछित सांख्यिकीय शक्ति बाईं ओर के कॉलम में दिखाई गई है।
*कोहेन का डी (= प्रभाव आकार), जो प्रायोगिक समूह और नियंत्रण समूह के बीच लक्ष्य मूल्यों के माध्य के बीच अपेक्षित अंतर है, जिसे अपेक्षित [[मानक विचलन]] से विभाजित किया जाता है।
*कोहेन का डी (= प्रभाव आकार) जो प्रायोगिक समूह और नियंत्रण समूह के बीच लक्ष्य मूल्यों के माध्य के बीच अपेक्षित अंतर है। जिसे अपेक्षित [[मानक विचलन]] से विभाजित किया जाता है।


===मीड का संसाधन समीकरण===
===मीड का संसाधन समीकरण===
मीड के संसाधन समीकरण का उपयोग अक्सर प्रयोगशाला पशुओं के नमूने के आकार के आकलन के साथ-साथ कई अन्य प्रयोगशाला प्रयोगों में किया जाता है। यह नमूना आकार का अनुमान लगाने में अन्य तरीकों के उपयोग के रूप में सटीक नहीं हो सकता है, लेकिन उचित नमूना आकार क्या है इसका संकेत देता है जहां अपेक्षित मानक विचलन या समूहों के बीच मानों में अपेक्षित अंतर अज्ञात या अनुमान लगाने में बहुत कठिन हैं।<ref name=Hubrecht&Kirkwood2010>{{cite book |author1=Kirkwood, James |author2=Robert Hubrecht |title=प्रयोगशाला और अन्य अनुसंधान पशुओं की देखभाल और प्रबंधन पर UFAW हैंडबुक|publisher=Wiley-Blackwell |year=2010 |pages=29 |isbn=978-1-4051-7523-4 }} [https://books.google.com/books?id=Wjr9u1AAht4C&pg=PA29 online Page 29]</ref>
मीड के संसाधन समीकरण का उपयोग अधिकांशतः प्रयोगशाला पशुओं के नमूना के आकार के आकलन के साथ-साथ कई अन्य प्रयोगशाला प्रयोगों में किया जाता है। यह नमूना आकार का अनुमान लगाने में अन्य तरीकों के उपयोग के रूप में सटीक नहीं हो सकता है। लेकिन उचित नमूना आकार क्या है इसका संकेत देता है। जहां अपेक्षित मानक विचलन या समूहों के बीच मानों में अपेक्षित अंतर अज्ञात या अनुमान लगाने में बहुत कठिन हैं।<ref name=Hubrecht&Kirkwood2010>{{cite book |author1=Kirkwood, James |author2=Robert Hubrecht |title=प्रयोगशाला और अन्य अनुसंधान पशुओं की देखभाल और प्रबंधन पर UFAW हैंडबुक|publisher=Wiley-Blackwell |year=2010 |pages=29 |isbn=978-1-4051-7523-4 }} [https://books.google.com/books?id=Wjr9u1AAht4C&pg=PA29 online Page 29]</ref>
समीकरण में सभी पैरामीटर वास्तव में उनकी अवधारणाओं की संख्या की स्वतंत्रता (सांख्यिकी) की डिग्री हैं, और इसलिए, समीकरण में सम्मिलन से पहले उनकी संख्या 1 से घटा दी जाती है।
 
समीकरण में सभी पैरामीटर वास्तव में उनकी अवधारणाओं की संख्या की स्वतंत्रता (सांख्यिकी) की डिग्री हैं। इसलिए समीकरण में सम्मिलन से पहले उनकी संख्या 1 से घटा दी जाती है।


समीकरण है:<ref name=Hubrecht&Kirkwood2010/>
समीकरण है:<ref name=Hubrecht&Kirkwood2010/>
Line 114: Line 115:
:<math> E = N - B - T,</math>
:<math> E = N - B - T,</math>
कहाँ:
कहाँ:
*एन अध्ययन में व्यक्तियों या इकाइयों की कुल संख्या है (शून्य से 1)
*''N'' अध्ययन में व्यक्तियों या इकाइयों की कुल संख्या है (शून्य से 1)
*बी अवरोधक घटक है, जो डिजाइन में अनुमत पर्यावरणीय प्रभावों का प्रतिनिधित्व करता है (शून्य से 1)
*''B'' अवरोधक घटक है। जो डिजाइन में अनुमत पर्यावरणीय प्रभावों का प्रतिनिधित्व करता है (शून्य से 1)
* टी उपचार घटक है, जो [[उपचार समूहों]] (नियंत्रण समूह सहित) की संख्या के अनुरूप है, या पूछे जाने वाले प्रश्नों की संख्या (शून्य से 1)
* ''T'' उपचार घटक है जो [[उपचार समूहों]] (नियंत्रण समूह सहित) की संख्या के अनुरूप है या पूछे जाने वाले प्रश्नों की संख्या (शून्य से 1)
*त्रुटि घटक की स्वतंत्रता की डिग्री है और कहीं 10 और 20 के बीच होना चाहिए।
*''E'' त्रुटि घटक की स्वतंत्रता की डिग्री है और कहीं 10 और 20 के बीच होना चाहिए।


उदाहरण के लिए, यदि चार उपचार समूहों (टी = 3) के साथ प्रयोगशाला जानवरों का अध्ययन करने की योजना बनाई गई है, प्रति समूह आठ जानवरों के साथ, 32 जानवरों को कुल मिलाकर (एन = 31), बिना किसी स्तरीकृत नमूने (बी = 0) के, फिर 28 के बराबर होगा, जो 20 के कटऑफ से ऊपर है, यह दर्शाता है कि नमूना आकार थोड़ा बड़ा हो सकता है, और प्रति समूह छह जानवर अधिक उपयुक्त हो सकते हैं।<ref>[http://www.isogenic.info/html/resource_equation.html Isogenic.info > Resource equation] by Michael FW Festing. Updated Sept. 2006</ref>
उदाहरण के लिए यदि चार उपचार समूहों (''T''=3) के साथ प्रयोगशाला जानवरों का अध्ययन करने की योजना बनाई गई है। प्रति समूह आठ जानवरों के साथ 32 जानवरों को कुल मिलाकर(''N''=31) बिना किसी स्तरीकृत नमूना (''B''=0) के फिर ''E'' 28 के बराबर होगा। जो 20 के कटऑफ से ऊपर है। यह दर्शाता है कि नमूना आकार थोड़ा बड़ा हो सकता है और प्रति समूह छह जानवर अधिक उपयुक्त हो सकते हैं।<ref>[http://www.isogenic.info/html/resource_equation.html Isogenic.info > Resource equation] by Michael FW Festing. Updated Sept. 2006</ref>




=== संचयी वितरण समारोह ===
=== संचयी वितरण समारोह ===
चलो एक्स<sub>i</sub>, i = 1, 2, ..., n अज्ञात माध्य μ और ज्ञात विचरण σ के साथ एक सामान्य वितरण से लिए गए स्वतंत्र अवलोकन हैं<sup>2</उप>। दो परिकल्पनाओं पर विचार करें, एक अशक्त परिकल्पना:
चलो ''X<sub>i</sub>'', ''i'' = 1, 2, ..., n अज्ञात माध्य μ और ज्ञात विचरण σ<sup>2</sup> के साथ एक सामान्य वितरण से लिए गए स्वतंत्र अवलोकन हैं। <sup>दो परिकल्पनाओं पर विचार करें अशक्त परिकल्पना:


: <math> H_0:\mu=0 </math>
: <math> H_0:\mu=0 </math>
Line 129: Line 130:


: <math> H_a:\mu=\mu^* </math>
: <math> H_a:\mu=\mu^* </math>
कुछ 'सबसे छोटे महत्वपूर्ण अंतर' μ के लिए<sup>*</sup> > 0. यह सबसे छोटा मान है जिसके लिए हम किसी अंतर को ध्यान में रखते हैं। अब, यदि हम (1) एच को अस्वीकार करना चाहते हैं<sub>0</sub> कम से कम 1 − β की संभावना के साथ जब
कुछ 'सबसे छोटे महत्वपूर्ण अंतर' '''<sup>*</sup> > 0 यह सबसे छोटा मान है। जिसके लिए हम किसी अंतर को ध्यान में रखते हैं। यदि हम (1) ''H''<sub>0</sub> को अस्वीकार करना चाहते हैं। कम से कम 1 − β की संभावना के साथ जब
एच<sub>a</sub> सत्य है (अर्थात् 1 − β की एक सांख्यिकीय शक्ति), और (2) H को अस्वीकार करता है<sub>0</sub> संभाव्यता के साथ α जब एच<sub>0</sub> सत्य है, तो हमें निम्नलिखित की आवश्यकता है:


अगर जेड<sub>''α''</sub> मानक सामान्य वितरण का ऊपरी α प्रतिशत बिंदु है, तब
''H''<sub>0</sub> सत्य है (अर्थात् 1 − β की एक सांख्यिकीय शक्ति) और''z<sub>α</sub>'' को अस्वीकार करता है। संभाव्यता के साथ α जब ''H''<sub>0</sub> सत्य है। तो हमें निम्नलिखित की आवश्यकता है।
 
अगर ''z<sub>α</sub>'' मानक सामान्य वितरण का ऊपरी α प्रतिशत बिंदु है, तब


: <math> \Pr(\bar x >z_\alpha \sigma/\sqrt{n}\mid H_0)=\alpha </math>
: <math> \Pr(\bar x >z_\alpha \sigma/\sqrt{n}\mid H_0)=\alpha </math>
इसलिए
इसलिए


: 'अस्वीकार एच<sub>0</sub> यदि हमारा नमूना औसत (<math>\bar x</math>) से अधिक होता है <math>z_{\alpha}\sigma/\sqrt{n}</math>'
: 'अस्वीकार ''H''<sub>0</sub> यदि हमारा नमूना औसत (<math>\bar x</math>) से अधिक होता है <math>z_{\alpha}\sigma/\sqrt{n}</math>'
 
एक [[निर्णय नियम]] है जो (2) को संतुष्ट करता है। (यह एक 1- टेल वाला परीक्षण है।)


एक [[निर्णय नियम]] है जो (2) को संतुष्ट करता है। (यह एक 1-पूंछ वाला परीक्षण है।)
अब हम चाहते हैं कि ऐसा कम से कम 1 − β की प्रायिकता के साथ हो।


अब हम चाहते हैं कि ऐसा कम से कम 1 − β की प्रायिकता के साथ हो
''H''<sub>a</sub> क्या सच है। इस स्थितियों में हमारा नमूना औसत औसत μ के साथ सामान्य वितरण से आएगा।
एच<sub>a</sub> क्या सच है। इस मामले में, हमारा नमूना औसत औसत μ के साथ सामान्य वितरण से आएगा<sup>*</सुप>. इसलिए, हमें चाहिए


: <math> \Pr(\bar x >z_\alpha \sigma/\sqrt{n}\mid H_a)\geq 1-\beta </math>
: <math> \Pr(\bar x >z_\alpha \sigma/\sqrt{n}\mid H_a)\geq 1-\beta </math>
सावधानीपूर्वक हेरफेर के माध्यम से, यह दिखाया जा सकता है (सांख्यिकीय शक्ति # उदाहरण देखें) कब होना है
सावधानीपूर्वक हेरफेर के माध्यम से यह दिखाया जा सकता है (सांख्यिकीय शक्ति # उदाहरण देखें) कब होना है।


: <math> n \geq \left(\frac{z_\alpha+\Phi^{-1}(1-\beta)}{\mu^{*}/\sigma}\right)^2 </math>
: <math> n \geq \left(\frac{z_\alpha+\Phi^{-1}(1-\beta)}{\mu^{*}/\sigma}\right)^2 </math>
कहाँ <math>\Phi</math> सामान्य संचयी बंटन फलन है।
कहाँ <math>\Phi</math> सामान्य संचयी बंटन फलन है।


== स्तरीकृत नमूना आकार ==
== स्तरीकृत नमूना आकार ==
अधिक जटिल नमूनाकरण तकनीकों के साथ, जैसे स्तरीकृत नमूनाकरण, नमूने को अक्सर उप-नमूने में विभाजित किया जा सकता है। आमतौर पर, यदि एच ऐसे उप-नमूने हैं (एच विभिन्न स्तरों से) तो उनमें से प्रत्येक का नमूना आकार n होगा<sub>h</sub>, h = 1, 2, ..., H. ये n<sub>h</sub>नियम के अनुरूप होना चाहिए कि एन<sub>1</sub> + एन<sub>2</sub> + ... + एन<sub>''H''</sub> = n (यानी, कि कुल नमूना आकार उप-नमूना आकार के योग द्वारा दिया गया है)। इनका चयन एन<sub>h</sub>(उदाहरण के लिए) नेमैन के इष्टतम आवंटन का उपयोग करके विभिन्न तरीकों से इष्टतम रूप से किया जा सकता है।
अधिक जटिल नमूनाकरण तकनीकों के साथ जैसे स्तरीकृत नमूनाकरण नमूना को अधिकांशतः उप- नमूना में विभाजित किया जा सकता है। सामान्यतः यदि ''H'' ऐसे उप- नमूना हैं (''H'' विभिन्न स्तरों से) तो उनमें से प्रत्येक का नमूना आकार ''n<sub>h</sub>'', ''h'' = 1, 2, ..., ''H''होगा। ये n<sub>h</sub>नियम के अनुरूप होना चाहिए कि ''n''<sub>1</sub> + ''n''<sub>2</sub> + ... + ''n<sub>H</sub>'' = ''n'' (अर्थात कुल नमूना आकार उप- नमूना आकार के योग द्वारा दिया गया है)। इनका चयन ''n<sub>h</sub>'' (उदाहरण के लिए) नेमैन के इष्टतम आवंटन का उपयोग करके विभिन्न तरीकों से इष्टतम रूप से किया जा सकता है।
 
स्तरीकृत  नमूना का उपयोग करने के कई कारण हैं।<ref>Kish (1965, Section 3.1)</ref>  नमूना अनुमानों के प्रसरण को कम करने के लिए आंशिक रूप से गैर-यादृच्छिक विधियों का उपयोग करने के लिए या अलग-अलग स्तरों का अध्ययन करने के लिए एक उपयोगी आंशिक रूप से गैर-यादृच्छिक तरीका व्यक्तियों का  नमूना लेना होगा। जहां आसानी से पहुंचा जा सकता है। लेकिन जहां नहीं यात्रा लागत बचाने के लिए  नमूना क्लस्टर।<ref>Kish (1965), p. 148.</ref>


स्तरीकृत नमूने का उपयोग करने के कई कारण हैं:<ref>Kish (1965, Section 3.1)</ref> नमूना अनुमानों के प्रसरण को कम करने के लिए, आंशिक रूप से गैर-यादृच्छिक विधियों का उपयोग करने के लिए, या अलग-अलग स्तरों का अध्ययन करने के लिए। एक उपयोगी, आंशिक रूप से गैर-यादृच्छिक तरीका व्यक्तियों का नमूना लेना होगा जहां आसानी से पहुंचा जा सकता है, लेकिन जहां नहीं, यात्रा लागत बचाने के लिए नमूना क्लस्टर।<ref>Kish (1965), p. 148.</ref>
सामान्य तौर पर ''H'' स्तर के लिए एक भारित नमूना माध्य होता है।
सामान्य तौर पर, एच स्तर के लिए, एक भारित नमूना माध्य होता है
: <math> \bar x_w  = \sum_{h=1}^H W_h \bar x_h, </math>
: <math> \bar x_w  = \sum_{h=1}^H W_h \bar x_h, </math>
साथ
साथ


: <math> \operatorname{Var}(\bar x_w) = \sum_{h=1}^H W_h^2 \operatorname{Var}(\bar x_h). </math><ref>Kish (1965), p. 78.</ref>
: <math> \operatorname{Var}(\bar x_w) = \sum_{h=1}^H W_h^2 \operatorname{Var}(\bar x_h). </math><ref>Kish (1965), p. 78.</ref>
वजन, <math>W_h</math>, अक्सर, लेकिन हमेशा नहीं, स्तर में जनसंख्या तत्वों के अनुपात का प्रतिनिधित्व करते हैं, और <math>W_h=N_h/N</math>. एक निश्चित नमूना आकार के लिए, अर्थात <math> n = \sum n_h </math>,
भार <math>W_h</math> अधिकांशतः लेकिन हमेशा नहीं स्तर में जनसंख्या तत्वों के अनुपात का प्रतिनिधित्व करते हैं और <math>W_h=N_h/N</math>. एक निश्चित नमूना आकार के लिए अर्थात <math> n = \sum n_h </math>,


: <math>  \operatorname{Var}(\bar x_w) = \sum_{h=1}^H W_h^2 \operatorname{Var}(\bar x_h) \left(\frac{1}{n_h} - \frac{1}{N_h}\right), </math><ref>Kish (1965), p. 81.</ref>
: <math>  \operatorname{Var}(\bar x_w) = \sum_{h=1}^H W_h^2 \operatorname{Var}(\bar x_h) \left(\frac{1}{n_h} - \frac{1}{N_h}\right), </math><ref>Kish (1965), p. 81.</ref>
जिसे न्यूनतम बनाया जा सकता है यदि प्रत्येक स्तर के भीतर [[नमूना दर]] बनाई जाए
जिसे न्यूनतम बनाया जा सकता है यदि प्रत्येक स्तर के भीतर [[नमूना दर]] बनाई जाए।
 
प्रत्येक स्तर के भीतर मानक विचलन के लिए आनुपातिक: <math> n_h/N_h=k S_h </math>, कहाँ <math> S_h = \sqrt{\operatorname{Var} (\bar x_h)} </math> और <math>k</math> एक स्थिरांक ऐसा है <math> \sum{n_h} = n </math>.
प्रत्येक स्तर के भीतर मानक विचलन के लिए आनुपातिक: <math> n_h/N_h=k S_h </math>, कहाँ <math> S_h = \sqrt{\operatorname{Var} (\bar x_h)} </math> और <math>k</math> एक स्थिरांक ऐसा है <math> \sum{n_h} = n </math>.


एक इष्टतम आवंटन तब प्राप्त होता है जब स्तर के भीतर नमूनाकरण दर होती है
एक इष्टतम आवंटन तब प्राप्त होता है जब स्तर के भीतर नमूनाकरण दर होती है।
स्तर के भीतर मानक विचलन के सीधे आनुपातिक बना दिया जाता है
 
और प्रति तत्व नमूनाकरण लागत के वर्गमूल के व्युत्क्रमानुपाती होता है
स्तर के भीतर मानक विचलन के सीधे आनुपातिक बना दिया जाता है।
 
और प्रति तत्व नमूनाकरण लागत के वर्गमूल के व्युत्क्रमानुपाती होता है।
 
परत के भीतर, <math>C_h</math>:
परत के भीतर, <math>C_h</math>:
: <math> \frac{n_h}{N_h} = \frac{K S_h}{\sqrt{C_h}}, </math><ref>Kish (1965), p. 93.</ref>
: <math> \frac{n_h}{N_h} = \frac{K S_h}{\sqrt{C_h}}, </math><ref>Kish (1965), p. 93.</ref>
कहाँ <math>K</math> एक स्थिरांक ऐसा है <math> \sum{n_h} = n </math>, या, अधिक आम तौर पर, जब
कहाँ <math>K</math> एक स्थिरांक ऐसा है। <math> \sum{n_h} = n </math> या अधिक सामान्यतः जब


: <math> n_h = \frac{K' W_h S_h}{\sqrt{C_h}}. </math><ref>Kish (1965), p. 94.</ref>
: <math> n_h = \frac{K' W_h S_h}{\sqrt{C_h}}. </math><ref>Kish (1965), p. 94.</ref>
Line 176: Line 184:


== गुणात्मक शोध ==
== गुणात्मक शोध ==
गुणात्मक अध्ययन में नमूना आकार निर्धारण एक अलग दृष्टिकोण लेता है। यह आम तौर पर एक व्यक्तिपरक निर्णय होता है, जिसे शोध की प्रगति के रूप में लिया जाता है।<ref>Sandelowski, M. (1995). Sample size in qualitative research. ''Research in Nursing & Health'', 18, 179–183</ref> सैद्धांतिक नमूनाकरण # सैद्धांतिक संतृप्ति तक पहुंचने तक एक दृष्टिकोण आगे प्रतिभागियों या सामग्री को शामिल करना जारी रखना है।<ref>Glaser, B. (1965). The constant comparative method of qualitative analysis. ''Social Problems'', 12, 436–445</ref> संतृप्ति तक पहुंचने के लिए आवश्यक संख्या की अनुभवजन्य रूप से जांच की गई है।<ref>{{Cite journal|doi=10.1080/08870440903194015|title=What is an adequate sample size? Operationalising data saturation for theory-based interview studies|year=2010|last1=Francis|first1=Jill J.|last2=Johnston|first2=Marie|last3=Robertson|first3=Clare|last4=Glidewell|first4=Liz|last5=Entwistle|first5=Vikki|last6=Eccles|first6=Martin P.|last7=Grimshaw|first7=Jeremy M.|journal=Psychology & Health|volume=25|issue=10|pages=1229–1245|pmid=20204937|s2cid=28152749|url=https://openaccess.city.ac.uk/id/eprint/1732/1/What%20is%20an%20adequate%20sample%20size.pdf}}</ref><ref name="Guest2006" /><ref>{{Cite journal|doi = 10.1186/1472-6947-11-36|title = Clinician attitudes toward and use of electronic problem lists: A thematic analysis|year = 2011|last1 = Wright|first1 = Adam|last2 = Maloney|first2 = Francine L.|last3 = Feblowitz|first3 = Joshua C.|journal = BMC Medical Informatics and Decision Making|volume = 11|page = 36|pmid = 21612639|pmc = 3120635}}</ref><ref>{{cite journal|first=Mark |last=Mason|year=2010|url=http://www.qualitative-research.net/index.php/fqs/article/view/1428/3027|title=गुणात्मक साक्षात्कारों का उपयोग करके पीएचडी अध्ययन में नमूना आकार और संतृप्ति|volume=11|issue=3|journal=Forum Qualitative Sozialforschung |page=8}}</ref>
गुणात्मक अध्ययन में नमूना आकार निर्धारण एक अलग दृष्टिकोण लेता है। यह सामान्यतः एक व्यक्तिपरक निर्णय होता है। जिसे शोध की प्रगति के रूप में लिया जाता है।<ref>Sandelowski, M. (1995). Sample size in qualitative research. ''Research in Nursing & Health'', 18, 179–183</ref> सैद्धांतिक नमूनाकरण सैद्धांतिक संतृप्ति तक पहुंचने तक एक दृष्टिकोण आगे प्रतिभागियों या सामग्री को सम्मिलित करना जारी रखना है।<ref>Glaser, B. (1965). The constant comparative method of qualitative analysis. ''Social Problems'', 12, 436–445</ref> संतृप्ति तक पहुंचने के लिए आवश्यक संख्या की अनुभवजन्य रूप से जांच की गई है।<ref>{{Cite journal|doi=10.1080/08870440903194015|title=What is an adequate sample size? Operationalising data saturation for theory-based interview studies|year=2010|last1=Francis|first1=Jill J.|last2=Johnston|first2=Marie|last3=Robertson|first3=Clare|last4=Glidewell|first4=Liz|last5=Entwistle|first5=Vikki|last6=Eccles|first6=Martin P.|last7=Grimshaw|first7=Jeremy M.|journal=Psychology & Health|volume=25|issue=10|pages=1229–1245|pmid=20204937|s2cid=28152749|url=https://openaccess.city.ac.uk/id/eprint/1732/1/What%20is%20an%20adequate%20sample%20size.pdf}}</ref><ref name="Guest2006" /><ref>{{Cite journal|doi = 10.1186/1472-6947-11-36|title = Clinician attitudes toward and use of electronic problem lists: A thematic analysis|year = 2011|last1 = Wright|first1 = Adam|last2 = Maloney|first2 = Francine L.|last3 = Feblowitz|first3 = Joshua C.|journal = BMC Medical Informatics and Decision Making|volume = 11|page = 36|pmid = 21612639|pmc = 3120635}}</ref><ref>{{cite journal|first=Mark |last=Mason|year=2010|url=http://www.qualitative-research.net/index.php/fqs/article/view/1428/3027|title=गुणात्मक साक्षात्कारों का उपयोग करके पीएचडी अध्ययन में नमूना आकार और संतृप्ति|volume=11|issue=3|journal=Forum Qualitative Sozialforschung |page=8}}</ref>
दिए गए सुझावों की एक श्रृंखला के साथ, शोध शुरू करने से पहले नमूना आकार का अनुमान लगाने पर विश्वसनीय मार्गदर्शन की कमी है।<ref name="Guest2006">{{Cite journal|doi = 10.1177/1525822X05279903|title = How Many Interviews Are Enough?|year = 2006|last1 = Guest|first1 = Greg|last2 = Bunce|first2 = Arwen|last3 = Johnson|first3 = Laura|journal = Field Methods|volume = 18|pages = 59–82|s2cid = 62237589}}</ref><ref>Emmel, N. (2013). ''Sampling and choosing cases in qualitative research: A realist approach.'' London: Sage.</ref><ref>{{Cite journal|doi=10.1007/s11135-005-1098-1|title=गुणात्मक शक्ति विश्लेषण के लिए एक कॉल|year=2007|last1=Onwuegbuzie|first1=Anthony J.|last2=Leech|first2=Nancy L.|journal=Quality & Quantity|volume=41|pages=105–121|s2cid=62179911}}</ref><ref name="Fugard2015">{{cite journal |author1=Fugard AJB |author2=Potts HWW | title = Supporting thinking on sample sizes for thematic analyses: A quantitative tool | journal = International Journal of Social Research Methodology | volume =  18| issue =  6| pages =  669–684| date = 10 February 2015 | doi = 10.1080/13645579.2015.1005453 |s2cid=59047474 | url =http://discovery.ucl.ac.uk/1498831/3/Potts_10-7-2015_Supporting.pdf | doi-access =free }}</ref> [[विषयगत विश्लेषण]] के लिए [[नकारात्मक द्विपद वितरण]] के आधार पर मात्रात्मक शक्ति गणना के समान एक उपकरण का सुझाव दिया गया है।<ref>Galvin R (2015). How many interviews are enough? Do qualitative interviews in building energy consumption research produce reliable knowledge? Journal of Building Engineering, 1:2–12.</ref><ref name="Fugard2015" />
 
दिए गए सुझावों की एक श्रृंखला के साथ शोध शुरू करने से पहले नमूना आकार का अनुमान लगाने पर विश्वसनीय मार्गदर्शन की कमी है।<ref name="Guest2006">{{Cite journal|doi = 10.1177/1525822X05279903|title = How Many Interviews Are Enough?|year = 2006|last1 = Guest|first1 = Greg|last2 = Bunce|first2 = Arwen|last3 = Johnson|first3 = Laura|journal = Field Methods|volume = 18|pages = 59–82|s2cid = 62237589}}</ref><ref>Emmel, N. (2013). ''Sampling and choosing cases in qualitative research: A realist approach.'' London: Sage.</ref><ref>{{Cite journal|doi=10.1007/s11135-005-1098-1|title=गुणात्मक शक्ति विश्लेषण के लिए एक कॉल|year=2007|last1=Onwuegbuzie|first1=Anthony J.|last2=Leech|first2=Nancy L.|journal=Quality & Quantity|volume=41|pages=105–121|s2cid=62179911}}</ref><ref name="Fugard2015">{{cite journal |author1=Fugard AJB |author2=Potts HWW | title = Supporting thinking on sample sizes for thematic analyses: A quantitative tool | journal = International Journal of Social Research Methodology | volume =  18| issue =  6| pages =  669–684| date = 10 February 2015 | doi = 10.1080/13645579.2015.1005453 |s2cid=59047474 | url =http://discovery.ucl.ac.uk/1498831/3/Potts_10-7-2015_Supporting.pdf | doi-access =free }}</ref> [[विषयगत विश्लेषण]] के लिए [[नकारात्मक द्विपद वितरण]] के आधार पर मात्रात्मक शक्ति गणना के समान एक उपकरण का सुझाव दिया गया है।<ref>Galvin R (2015). How many interviews are enough? Do qualitative interviews in building energy consumption research produce reliable knowledge? Journal of Building Engineering, 1:2–12.</ref><ref name="Fugard2015" />
 




Line 195: Line 205:
*{{cite web|last1=Smith|first1=Scott|title=नमूना आकार निर्धारित करना: यह कैसे सुनिश्चित करें कि आपको सही नमूना आकार मिले|url=https://www.qualtrics.com/experience-management/research/determine-sample-size/|website=Qualtrics|access-date=19 September 2018|date=8 April 2013}}
*{{cite web|last1=Smith|first1=Scott|title=नमूना आकार निर्धारित करना: यह कैसे सुनिश्चित करें कि आपको सही नमूना आकार मिले|url=https://www.qualtrics.com/experience-management/research/determine-sample-size/|website=Qualtrics|access-date=19 September 2018|date=8 April 2013}}
*{{cite journal|last1=Israel|first1=Glenn D.|title=नमूना आकार का निर्धारण|url=https://www.academia.edu/21353552|journal=University of Florida, PEOD-6|year=1992|access-date=29 June 2019}}
*{{cite journal|last1=Israel|first1=Glenn D.|title=नमूना आकार का निर्धारण|url=https://www.academia.edu/21353552|journal=University of Florida, PEOD-6|year=1992|access-date=29 June 2019}}
*रेन वैन डे शूट, मिलिका मियोसेविक (संपा.). 2020. doi:10.4324/9780429273872|स्मॉल सैंपल साइज सॉल्यूशंस (ओपन एक्सेस): ए गाइड फॉर एप्लाइड रिसर्चर्स एंड प्रैक्टिशनर्स। रूटलेज।
*रेन वैन डे शूट, मिलिका मियोसेविक (संपा.). 2020. doi:10.4324/9780429273872|स्मॉल नमूना साइज सॉल्यूशंस (ओपन एक्सेस): ए गाइड फॉर एप्लाइड रिसर्चर्स एंड प्रैक्टिशनर्स। रूटलेज।


==अग्रिम पठन==
==अग्रिम पठन==
Line 207: Line 217:
{{Statistics|collection|state=expanded}}
{{Statistics|collection|state=expanded}}


{{DEFAULTSORT:Sample Size}}[[Category: नमूनाकरण (सांख्यिकी)]]
{{DEFAULTSORT:Sample Size}}  


[[de:Zufallsstichprobe#Stichprobenumfang]]
[[de:Zufallsstichprobe#Stichprobenumfang]]


 
[[Category:Articles with hatnote templates targeting a nonexistent page|Sample Size]]
 
[[Category:Collapse templates|Sample Size]]
[[Category: Machine Translated Page]]
[[Category:Created On 20/03/2023|Sample Size]]
[[Category:Created On 20/03/2023]]
[[Category:Lua-based templates|Sample Size]]
[[Category:Machine Translated Page|Sample Size]]
[[Category:Navigational boxes| ]]
[[Category:Navigational boxes without horizontal lists|Sample Size]]
[[Category:Pages with empty portal template|Sample Size]]
[[Category:Pages with script errors|Sample Size]]
[[Category:Portal-inline template with redlinked portals|Sample Size]]
[[Category:Portal templates with redlinked portals|Sample Size]]
[[Category:Sidebars with styles needing conversion|Sample Size]]
[[Category:Template documentation pages|Documentation/doc]]
[[Category:Templates Vigyan Ready|Sample Size]]
[[Category:Templates generating microformats|Sample Size]]
[[Category:Templates that add a tracking category|Sample Size]]
[[Category:Templates that are not mobile friendly|Sample Size]]
[[Category:Templates that generate short descriptions|Sample Size]]
[[Category:Templates using TemplateData|Sample Size]]
[[Category:Webarchive template wayback links]]
[[Category:Wikipedia metatemplates|Sample Size]]
[[Category:नमूनाकरण (सांख्यिकी)|Sample Size]]

Latest revision as of 17:56, 17 April 2023

नमूना आकार निर्धारण सांख्यिकीय नमूना में सम्मिलित करने के लिए टिप्पणियों या प्रतिकृति (सांख्यिकी) की संख्या को चुनने का कार्य है। नमूना आकार किसी भी अनुभवजन्य अध्ययन की एक महत्वपूर्ण विशेषता है। जिसमें लक्ष्य एक नमूना से सांख्यिकीय आबादी के बारे में सांख्यिकीय निष्कर्ष निकालना है। व्यवहार में अध्ययन में प्रयुक्त नमूना आकार सामान्यतः डेटा एकत्र करने की लागत समय या सुविधा के आधार पर निर्धारित किया जाता है। और इसके लिए पर्याप्त सांख्यिकीय शक्ति प्रदान करने की आवश्यकता होती है। जटिल अध्ययनों में कई अलग-अलग नमूना आकार हो सकते हैं। उदाहरण के लिए स्तरीकृत नमूनाकरण सर्वेक्षण नमूना में प्रत्येक स्तर के लिए अलग-अलग आकार होंगे। जनगणना में संपूर्ण जनसंख्या के लिए डेटा मांगा जाता है। इसलिए इच्छित नमूना आकार जनसंख्या के बराबर होता है। प्रायोगिक डिजाइन में जहां एक अध्ययन को विभिन्न उपचार समूहो में विभाजित किया जा सकता है। वहां प्रत्येक समूह के लिए अलग-अलग नमूना आकार हो सकते हैं।

नमूना आकार कई तरीकों से चुने जा सकते हैं।

  • अनुभव का उपयोग - छोटे नमूना चूंकि कभी-कभी अपरिहार्य होते हैं। व्यापक विश्वास अंतराल और सांख्यिकीय परिकल्पना परीक्षण में त्रुटियों का जोखिम हो सकता है।
  • अंततः प्राप्त नमूना से प्राप्त होने वाले अनुमान के लिए एक लक्ष्य भिन्नता का उपयोग करना। अर्थात उच्च परिशुद्धता की आवश्यकता होती है। (संकीर्ण आत्मविश्वास अंतराल) यह अनुमानक के निम्न लक्ष्य भिन्नता में अनुवाद करता है।
  • नमूना एकत्र करने के बाद लागू किए जाने वाले सांख्यिकीय परिकल्पना परीक्षण की शक्ति के लिए एक लक्ष्य का उपयोग करना।
  • आत्मविश्वास स्तर का उपयोग करना। अर्थात आवश्यक आत्मविश्वास स्तर जितना बड़ा होगा। नमूना आकार उतना ही बड़ा होगा। (निरंतर सटीकता की आवश्यकता को देखते हुए)।

परिचय

सांख्यिकीय अनुमान अज्ञात पैरामीटर होने पर बड़े नमूना आकार सामान्यतः सटीकता में वृद्धि करते हैं। उदाहरण के लिए यदि हम मछली की एक निश्चित प्रजाति के अनुपात को जानना चाहते हैं। जो एक रोगज़नक़ से संक्रमित है। तो हम सामान्यतः इस अनुपात का अधिक सटीक अनुमान लगा सकते हैं। यदि हम 100 मछलियों के बजाय 200 मछलियों का नमूना लेते हैं। और उनकी जांच करते हैं। गणितीय आँकड़ों के कई मूलभूत तथ्य इस घटना का वर्णन करते हैं। जिसमें बड़ी संख्या का नियम और केंद्रीय सीमा प्रमेय सम्मिलित हैं।

कुछ स्थितियों में बड़े नमूना आकारों के लिए सटीकता में वृद्धि न्यूनतम या न के बराबर होती है। यह डेटा में व्यवस्थित त्रुटियों या मजबूत सहसंबंध और निर्भरता की उपस्थिति के परिणामस्वरूप हो सकता है। या यदि डेटा भारी-पूंछ वाले वितरण का अनुसरण करता है।

परिणामी अनुमानों की गुणवत्ता द्वारा नमूना आकार का मूल्यांकन किया जा सकता है। उदाहरण के लिए यदि किसी अनुपात का अनुमान लगाया जा रहा है। तो कोई चाहता है कि 95% विश्वास अंतराल 0.06 इकाइयों से कम चौड़ा हो। वैकल्पिक रूप से परिकल्पना परीक्षण की सांख्यिकीय शक्ति के आधार पर नमूना आकार का मूल्यांकन किया जा सकता है। उदाहरण के लिए यदि हम पुरुषों के बीच उस उम्मीदवार के समर्थन के साथ महिलाओं के बीच एक निश्चित राजनीतिक उम्मीदवार के समर्थन की तुलना कर रहे हैं। तो हम 0.04 इकाइयों के समर्थन स्तरों में अंतर का पता लगाने के लिए 80% शक्ति प्राप्त करना चाह सकते हैं।

अनुमान

एक अनुपात का अनुमान

अपेक्षाकृत सरल स्थिति आनुपातिकता (गणित) का अनुमान है। उदाहरण के लिए हम किसी समुदाय में कम से कम 65 वर्ष के निवासियों के अनुपात का अनुमान लगाना चाह सकते हैं।

एक आनुपातिकता (गणित) का अनुमानक है जहां X 'पॉजिटिव' की संख्या है। उदाहरण के लिए n नमूना किए गए लोगों में से उन लोगों की संख्या जो कम से कम 65 वर्ष के हैं)। जब अवलोकन स्वतंत्र (सांख्यिकी) होते हैं। तो इस अनुमानक के पास एक (स्केल्ड) द्विपद वितरण होता है। (और बर्नौली वितरण से डेटा का नमूना (सांख्यिकी) अंकगणितीय माध्य भी होता है)। इस वितरण का अधिकतम विचरण 0.25 है। जो तब होता है जब सही पैरामीटर p = 0.5 होता है। व्यवहार में चूंकि पी अज्ञात है। नमूना आकार के आकलन के लिए अधिकांशतः अधिकतम भिन्नता का उपयोग किया जाता है। यदि पी के लिए उचित अनुमान मात्रा ज्ञात है। 0.25 के स्थान पर उपयोग किया जा सकता है।

पर्याप्त रूप से बड़े एन के लिए वितरण एक सामान्य वितरण द्वारा बारीकी से अनुमानित किया जाएगा।[1] इसका और द्विपद बंटन कॉन्फ़िडेंस इंटरवल का उपयोग करने से फ़ॉर्म का कॉन्फ़िडेंस इंटरवल प्राप्त होता है।

जहाँ Z एक मानक स्कोर है | आत्मविश्वास के वांछित स्तर के लिए Z-स्कोर (95% विश्वास अंतराल के लिए 1.96)।

अगर हम एक कॉन्फिडेंस इंटरवल चाहते हैं। जो चौड़ाई में कुल W यूनिट है। ( नमूना माध्य के प्रत्येक तरफ W/2) तो हम हल करेंगे।

एन के लिए नमूना आकार उपज

द्विपद अनुपात के लिए नमूना आकार अलग-अलग आत्मविश्वास स्तर और त्रुटि के मार्जिन दिए गए हैं

अनुपात के सबसे रूढ़िवादी अनुमान के रूप में .5 का उपयोग करने के स्थितियों में (नोट: W/2 = त्रुटि का मार्जिन।)

नीचे दिए गए चित्र में कोई भी यह देख सकता है। कि द्विपद अनुपात के लिए नमूना आकार अलग-अलग आत्मविश्वास के स्तर और त्रुटि के मार्जिन को कैसे बदलता है।


अन्यथा सूत्र होगा कौन सी पैदावार .

उदाहरण के लिए यदि हम किसी विशेष राष्ट्रपति पद के उम्मीदवार का समर्थन करने वाली अमेरिकी आबादी के अनुपात का अनुमान लगाने में रुचि रखते हैं और हम चाहते हैं कि 95% विश्वास अंतराल की चौड़ाई अधिकतम 2 प्रतिशत अंक (0.02) हो। तो हमें एक नमूना (1.96)2/ (0.022) = 9604) आकार की आवश्यकता होगी। इस स्थितियों में पी के लिए 0.5 अनुमान का उपयोग करना उचित है क्योंकि राष्ट्रपति पद की दौड़ अधिकांशतः 50/50 के करीब होती है और रूढ़िवादी अनुमान का उपयोग करना भी विवेकपूर्ण है। इस स्थितियों में त्रुटि का मार्जिन 1 प्रतिशत बिंदु (0.02 का आधा) है।

पूर्वगामी सामान्यतः सरलीकृत है।

सही अनुपात के लिए 95% कॉन्फ़िडेंस इंटरवल बनाएगा। यदि इस अंतराल को डब्ल्यू इकाइयों से अधिक चौड़ा नहीं होना चाहिए। तो समीकरण

n उपज के लिए हल किया जा सकता है।[2][3] n = 4/W2 = 1/B2 जहां B अनुमान पर बाध्य त्रुटि है। अर्थात अनुमान सामान्यतः ± B के रूप में दिया जाता है। B = 10% के लिए n = 100 की आवश्यकता होती है। B = 5% के लिए n = 400 की आवश्यकता होती है। B = 3% आवश्यकता लगभग n = 1000 है। जबकि B = 1% के लिए n = 10000 का एक नमूना आकार आवश्यक है। जनमत सर्वेक्षणों और अन्य नमूना सर्वेक्षणों की समाचार रिपोर्टों में इन नंबरों को अधिकांशतः उद्धृत किया जाता है। हालाँकि रिपोर्ट किए गए परिणाम सटीक मान नहीं हो सकते हैं क्योंकि संख्याओं को अधिमानतः गोल किया जाता है। यह जानते हुए कि n का मान वांछित परिणाम प्राप्त करने के लिए आवश्यक प्राथमिक घटनाओं की न्यूनतम संख्या है तब उत्तरदाताओं की संख्या न्यूनतम पर या उससे अधिक होनी चाहिए।

माध्य का अनुमान

जनसंख्या का आकलन करते समय मतलब n आकार के एक स्वतंत्र और समान रूप से वितरित (iid) नमूना का उपयोग करना जहां प्रत्येक डेटा मान में भिन्नता σ2 है। नमूना माध्य की मानक त्रुटि (आँकड़े) है।

यह अभिव्यक्ति मात्रात्मक रूप से वर्णन करती है कि कैसे नमूना आकार बढ़ने पर अनुमान अधिक सटीक हो जाता है। सामान्य वितरण के साथ नमूना माध्य का अनुमान लगाने के औचित्य के लिए केंद्रीय सीमा प्रमेय का उपयोग करने से प्रपत्र का विश्वास अंतराल प्राप्त होता है।

जहाँ Z एक मानक स्कोर है | आत्मविश्वास के वांछित स्तर के लिए Z-स्कोर (95% विश्वास अंतराल के लिए 1.96)।

अगर हम एक कॉन्फिडेंस इंटरवल चाहते हैं जो W यूनिट्स टोटल इन विड्थ (W/2 नमूना मीन के हर साइड पर एरर का मार्जिन है) तो हम हल करेंगे।

n के लिए नमूना आकार उपज

.

उदाहरण के लिए यदि हम उस राशि का अनुमान लगाने में रुचि रखते हैं। जिसके द्वारा एक दवा किसी व्यक्ति के रक्तचाप को 95% कॉन्फिडेंस इंटरवल के साथ कम करती है जो कि छह यूनिट चौड़ा है और हम जानते हैं कि जनसंख्या में रक्तचाप का मानक विचलन 15 है। तो आवश्यक नमूना आकार है जिसे 97 तक गोल किया जाएगा क्योंकि प्राप्त मूल्य न्यूनतम नमूना आकार है और नमूना आकार पूर्णांक होना चाहिए और परिकलित न्यूनतम पर या उससे ऊपर होना चाहिए।

परिकल्पना परीक्षण के लिए आवश्यक नमूना आकार

सांख्यिकीविदों द्वारा सामना की जाने वाली एक आम समस्या एक पूर्व निर्धारित प्रकार त्रुटि दर α दिए जाने पर परीक्षण के लिए एक निश्चित सांख्यिकीय शक्ति प्राप्त करने के लिए आवश्यक नमूना आकार की गणना करना है। निम्नानुसार इसका अनुमान कुछ मानों के लिए पूर्व-निर्धारित तालिकाओं द्वारा मीड के संसाधन समीकरण द्वारा या अधिक सामान्यतः संचयी वितरण फ़ंक्शन द्वारा लगाया जा सकता है।

टेबल्स

[4]
 
Power
Cohen's d
0.2 0.5 0.8
0.25 84 14 6
0.50 193 32 13
0.60 246 40 16
0.70 310 50 20
0.80 393 64 26
0.90 526 85 34
0.95 651 105 42
0.99 920 148 58

दाईं ओर दिखाई गई तालिका का उपयोग दो- नमूना टी-टेस्ट में एक प्रायोगिक समूह और एक नियंत्रण समूह के नमूना के आकार का अनुमान लगाने के लिए किया जा सकता है। जो समान आकार के हैं। अर्थात परीक्षण में व्यक्तियों की कुल संख्या दोगुनी है। संख्या दी गई है और वांछित महत्व स्तर 0.05 है।[4] उपयोग किए गए पैरामीटर हैं।

  • परीक्षण की वांछित सांख्यिकीय शक्ति बाईं ओर के कॉलम में दिखाई गई है।
  • कोहेन का डी (= प्रभाव आकार) जो प्रायोगिक समूह और नियंत्रण समूह के बीच लक्ष्य मूल्यों के माध्य के बीच अपेक्षित अंतर है। जिसे अपेक्षित मानक विचलन से विभाजित किया जाता है।

मीड का संसाधन समीकरण

मीड के संसाधन समीकरण का उपयोग अधिकांशतः प्रयोगशाला पशुओं के नमूना के आकार के आकलन के साथ-साथ कई अन्य प्रयोगशाला प्रयोगों में किया जाता है। यह नमूना आकार का अनुमान लगाने में अन्य तरीकों के उपयोग के रूप में सटीक नहीं हो सकता है। लेकिन उचित नमूना आकार क्या है इसका संकेत देता है। जहां अपेक्षित मानक विचलन या समूहों के बीच मानों में अपेक्षित अंतर अज्ञात या अनुमान लगाने में बहुत कठिन हैं।[5]

समीकरण में सभी पैरामीटर वास्तव में उनकी अवधारणाओं की संख्या की स्वतंत्रता (सांख्यिकी) की डिग्री हैं। इसलिए समीकरण में सम्मिलन से पहले उनकी संख्या 1 से घटा दी जाती है।

समीकरण है:[5]

कहाँ:

  • N अध्ययन में व्यक्तियों या इकाइयों की कुल संख्या है (शून्य से 1)।
  • B अवरोधक घटक है। जो डिजाइन में अनुमत पर्यावरणीय प्रभावों का प्रतिनिधित्व करता है (शून्य से 1)।
  • T उपचार घटक है जो उपचार समूहों (नियंत्रण समूह सहित) की संख्या के अनुरूप है या पूछे जाने वाले प्रश्नों की संख्या (शून्य से 1)।
  • E त्रुटि घटक की स्वतंत्रता की डिग्री है और कहीं 10 और 20 के बीच होना चाहिए।

उदाहरण के लिए यदि चार उपचार समूहों (T=3) के साथ प्रयोगशाला जानवरों का अध्ययन करने की योजना बनाई गई है। प्रति समूह आठ जानवरों के साथ 32 जानवरों को कुल मिलाकर(N=31) बिना किसी स्तरीकृत नमूना (B=0) के फिर E 28 के बराबर होगा। जो 20 के कटऑफ से ऊपर है। यह दर्शाता है कि नमूना आकार थोड़ा बड़ा हो सकता है और प्रति समूह छह जानवर अधिक उपयुक्त हो सकते हैं।[6]


संचयी वितरण समारोह

चलो Xi, i = 1, 2, ..., n अज्ञात माध्य μ और ज्ञात विचरण σ2 के साथ एक सामान्य वितरण से लिए गए स्वतंत्र अवलोकन हैं। दो परिकल्पनाओं पर विचार करें अशक्त परिकल्पना:

और एक वैकल्पिक परिकल्पना:

कुछ 'सबसे छोटे महत्वपूर्ण अंतर' μ* > 0 यह सबसे छोटा मान है। जिसके लिए हम किसी अंतर को ध्यान में रखते हैं। यदि हम (1) H0 को अस्वीकार करना चाहते हैं। कम से कम 1 − β की संभावना के साथ जब

H0 सत्य है (अर्थात् 1 − β की एक सांख्यिकीय शक्ति) औरzα को अस्वीकार करता है। संभाव्यता के साथ α जब H0 सत्य है। तो हमें निम्नलिखित की आवश्यकता है।

अगर zα मानक सामान्य वितरण का ऊपरी α प्रतिशत बिंदु है, तब

इसलिए

'अस्वीकार H0 यदि हमारा नमूना औसत () से अधिक होता है '

एक निर्णय नियम है जो (2) को संतुष्ट करता है। (यह एक 1- टेल वाला परीक्षण है।)

अब हम चाहते हैं कि ऐसा कम से कम 1 − β की प्रायिकता के साथ हो।

Ha क्या सच है। इस स्थितियों में हमारा नमूना औसत औसत μ के साथ सामान्य वितरण से आएगा।

सावधानीपूर्वक हेरफेर के माध्यम से यह दिखाया जा सकता है (सांख्यिकीय शक्ति # उदाहरण देखें) कब होना है।

कहाँ सामान्य संचयी बंटन फलन है।

स्तरीकृत नमूना आकार

अधिक जटिल नमूनाकरण तकनीकों के साथ जैसे स्तरीकृत नमूनाकरण नमूना को अधिकांशतः उप- नमूना में विभाजित किया जा सकता है। सामान्यतः यदि H ऐसे उप- नमूना हैं (H विभिन्न स्तरों से) तो उनमें से प्रत्येक का नमूना आकार nh, h = 1, 2, ..., Hहोगा। ये nhनियम के अनुरूप होना चाहिए कि n1 + n2 + ... + nH = n (अर्थात कुल नमूना आकार उप- नमूना आकार के योग द्वारा दिया गया है)। इनका चयन nh (उदाहरण के लिए) नेमैन के इष्टतम आवंटन का उपयोग करके विभिन्न तरीकों से इष्टतम रूप से किया जा सकता है।

स्तरीकृत नमूना का उपयोग करने के कई कारण हैं।[7] नमूना अनुमानों के प्रसरण को कम करने के लिए आंशिक रूप से गैर-यादृच्छिक विधियों का उपयोग करने के लिए या अलग-अलग स्तरों का अध्ययन करने के लिए एक उपयोगी आंशिक रूप से गैर-यादृच्छिक तरीका व्यक्तियों का नमूना लेना होगा। जहां आसानी से पहुंचा जा सकता है। लेकिन जहां नहीं यात्रा लागत बचाने के लिए नमूना क्लस्टर।[8]

सामान्य तौर पर H स्तर के लिए एक भारित नमूना माध्य होता है।

साथ

[9]

भार अधिकांशतः लेकिन हमेशा नहीं स्तर में जनसंख्या तत्वों के अनुपात का प्रतिनिधित्व करते हैं और . एक निश्चित नमूना आकार के लिए अर्थात ,

[10]

जिसे न्यूनतम बनाया जा सकता है यदि प्रत्येक स्तर के भीतर नमूना दर बनाई जाए।

प्रत्येक स्तर के भीतर मानक विचलन के लिए आनुपातिक: , कहाँ और एक स्थिरांक ऐसा है .

एक इष्टतम आवंटन तब प्राप्त होता है जब स्तर के भीतर नमूनाकरण दर होती है।

स्तर के भीतर मानक विचलन के सीधे आनुपातिक बना दिया जाता है।

और प्रति तत्व नमूनाकरण लागत के वर्गमूल के व्युत्क्रमानुपाती होता है।

परत के भीतर, :

[11]

कहाँ एक स्थिरांक ऐसा है। या अधिक सामान्यतः जब

[12]


गुणात्मक शोध

गुणात्मक अध्ययन में नमूना आकार निर्धारण एक अलग दृष्टिकोण लेता है। यह सामान्यतः एक व्यक्तिपरक निर्णय होता है। जिसे शोध की प्रगति के रूप में लिया जाता है।[13] सैद्धांतिक नमूनाकरण सैद्धांतिक संतृप्ति तक पहुंचने तक एक दृष्टिकोण आगे प्रतिभागियों या सामग्री को सम्मिलित करना जारी रखना है।[14] संतृप्ति तक पहुंचने के लिए आवश्यक संख्या की अनुभवजन्य रूप से जांच की गई है।[15][16][17][18]

दिए गए सुझावों की एक श्रृंखला के साथ शोध शुरू करने से पहले नमूना आकार का अनुमान लगाने पर विश्वसनीय मार्गदर्शन की कमी है।[16][19][20][21] विषयगत विश्लेषण के लिए नकारात्मक द्विपद वितरण के आधार पर मात्रात्मक शक्ति गणना के समान एक उपकरण का सुझाव दिया गया है।[22][21]


यह भी देखें

संदर्भ

  1. NIST/SEMATECH, "7.2.4.2. Sample sizes required", e-Handbook of Statistical Methods.
  2. "प्रतिगमन के लिए अनुमान". utdallas.edu.
  3. "Confidence Interval for a Proportion" Archived 2011-08-23 at the Wayback Machine
  4. 4.0 4.1 Chapter 13, page 215, in: Kenny, David A. (1987). Statistics for the social and behavioral sciences. Boston: Little, Brown. ISBN 978-0-316-48915-7.
  5. 5.0 5.1 Kirkwood, James; Robert Hubrecht (2010). प्रयोगशाला और अन्य अनुसंधान पशुओं की देखभाल और प्रबंधन पर UFAW हैंडबुक. Wiley-Blackwell. p. 29. ISBN 978-1-4051-7523-4. online Page 29
  6. Isogenic.info > Resource equation by Michael FW Festing. Updated Sept. 2006
  7. Kish (1965, Section 3.1)
  8. Kish (1965), p. 148.
  9. Kish (1965), p. 78.
  10. Kish (1965), p. 81.
  11. Kish (1965), p. 93.
  12. Kish (1965), p. 94.
  13. Sandelowski, M. (1995). Sample size in qualitative research. Research in Nursing & Health, 18, 179–183
  14. Glaser, B. (1965). The constant comparative method of qualitative analysis. Social Problems, 12, 436–445
  15. Francis, Jill J.; Johnston, Marie; Robertson, Clare; Glidewell, Liz; Entwistle, Vikki; Eccles, Martin P.; Grimshaw, Jeremy M. (2010). "What is an adequate sample size? Operationalising data saturation for theory-based interview studies" (PDF). Psychology & Health. 25 (10): 1229–1245. doi:10.1080/08870440903194015. PMID 20204937. S2CID 28152749.
  16. 16.0 16.1 Guest, Greg; Bunce, Arwen; Johnson, Laura (2006). "How Many Interviews Are Enough?". Field Methods. 18: 59–82. doi:10.1177/1525822X05279903. S2CID 62237589.
  17. Wright, Adam; Maloney, Francine L.; Feblowitz, Joshua C. (2011). "Clinician attitudes toward and use of electronic problem lists: A thematic analysis". BMC Medical Informatics and Decision Making. 11: 36. doi:10.1186/1472-6947-11-36. PMC 3120635. PMID 21612639.
  18. Mason, Mark (2010). "गुणात्मक साक्षात्कारों का उपयोग करके पीएचडी अध्ययन में नमूना आकार और संतृप्ति". Forum Qualitative Sozialforschung. 11 (3): 8.
  19. Emmel, N. (2013). Sampling and choosing cases in qualitative research: A realist approach. London: Sage.
  20. Onwuegbuzie, Anthony J.; Leech, Nancy L. (2007). "गुणात्मक शक्ति विश्लेषण के लिए एक कॉल". Quality & Quantity. 41: 105–121. doi:10.1007/s11135-005-1098-1. S2CID 62179911.
  21. 21.0 21.1 Fugard AJB; Potts HWW (10 February 2015). "Supporting thinking on sample sizes for thematic analyses: A quantitative tool" (PDF). International Journal of Social Research Methodology. 18 (6): 669–684. doi:10.1080/13645579.2015.1005453. S2CID 59047474.
  22. Galvin R (2015). How many interviews are enough? Do qualitative interviews in building energy consumption research produce reliable knowledge? Journal of Building Engineering, 1:2–12.


सामान्य संदर्भ

अग्रिम पठन

  • NIST: Selecting Sample Sizes
  • ASTM E122-07: Standard Practice for Calculating Sample Size to Estimate, With Specified Precision, the Average for a Characteristic of a Lot or Process


बाहरी संबंध