नमूने का वितरण

From Vigyanwiki
Revision as of 12:40, 1 June 2023 by alpha>Indicwiki (Created page with "{{Short description|Probability distribution of the possible sample outcomes}} {{Use dmy dates|date=September 2015}} आँकड़ों में, एक नमूना...")
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

आँकड़ों में, एक नमूना वितरण या परिमित-नमूना वितरण एक दिए गए यादृच्छिक नमूने का संभाव्यता वितरण है। यादृच्छिक-नमूना-आधारित आँकड़ा। यदि मनमाने ढंग से बड़ी संख्या में नमूने, जिनमें से प्रत्येक में कई अवलोकन (डेटा बिंदु) शामिल हैं, को प्रत्येक नमूने के लिए एक आँकड़ा (जैसे, उदाहरण के लिए, नमूना माध्य या नमूना प्रसरण) के एक मूल्य की गणना करने के लिए अलग-अलग उपयोग किया जाता है, तो नमूनाकरण बंटन उन मानों का संभाव्यता बंटन है जिन पर आँकड़ा लगता है। कई संदर्भों में, केवल एक नमूना देखा जाता है, लेकिन नमूनाकरण वितरण सैद्धांतिक रूप से पाया जा सकता है।

प्रतिचयन वितरण आंकड़ों में महत्वपूर्ण हैं क्योंकि वे सांख्यिकीय अनुमान के मार्ग में एक प्रमुख सरलीकरण प्रदान करते हैं। अधिक विशेष रूप से, वे सभी व्यक्तिगत नमूना मूल्यों के संयुक्त संभाव्यता वितरण के बजाय विश्लेषणात्मक विचारों को एक आंकड़े के संभाव्यता वितरण पर आधारित होने की अनुमति देते हैं।

परिचय

एक आंकड़े का नमूनाकरण वितरण उस आंकड़े का संभाव्यता वितरण है, जिसे एक यादृच्छिक चर के रूप में माना जाता है, जब आकार के एक यादृच्छिक नमूने से प्राप्त किया जाता है। . इसे दिए गए नमूना आकार की समान जनसंख्या से सभी संभावित नमूनों के लिए आंकड़ों के वितरण के रूप में माना जा सकता है। नमूनाकरण वितरण जनसंख्या के अंतर्निहित संभाव्यता वितरण पर निर्भर करता है, आंकड़े पर विचार किया जा रहा है, नमूनाकरण प्रक्रिया नियोजित है, और नमूना आकार का उपयोग किया जाता है। अक्सर इस बात में काफी रुचि होती है कि क्या नमूनाकरण वितरण को एक स्पर्शोन्मुख वितरण द्वारा अनुमानित किया जा सकता है, जो सीमित मामले से मेल खाता है या तो परिमित आकार के यादृच्छिक नमूनों की संख्या के रूप में, एक अनंत आबादी से लिया जाता है और वितरण का उत्पादन करने के लिए उपयोग किया जाता है, अनंत की ओर जाता है , या जब समान जनसंख्या का केवल एक समान-अनंत-आकार का नमूना लिया जाता है।

उदाहरण के लिए, माध्य के साथ एक सामान्य वितरण जनसंख्या पर विचार करें और विचरण . मान लें कि हम बार-बार इस जनसंख्या से दिए गए आकार के नमूने लेते हैं और अंकगणितीय माध्य की गणना करते हैं प्रत्येक नमूने के लिए - इस आंकड़े को नमूना माध्य कहा जाता है। इन साधनों, या औसतों के वितरण को नमूना माध्य का नमूना वितरण कहा जाता है। यह वितरण सामान्य है (n नमूना आकार है) चूंकि अंतर्निहित जनसंख्या सामान्य है, हालांकि नमूना वितरण भी अक्सर सामान्य के करीब हो सकता है, भले ही जनसंख्या वितरण न हो (केंद्रीय सीमा प्रमेय देखें)। नमूना माध्य का एक विकल्प नमूना माध्यिका है। जब एक ही जनसंख्या से गणना की जाती है, तो इसका मतलब के लिए एक अलग नमूनाकरण वितरण होता है और आम तौर पर सामान्य नहीं होता है (लेकिन यह बड़े नमूना आकारों के करीब हो सकता है)।

सामान्य वितरण वाली आबादी से नमूने का मतलब सबसे सरल सांख्यिकीय आबादी में से एक से लिया गया एक साधारण आंकड़ा है। अन्य आँकड़ों और अन्य आबादी के लिए सूत्र अधिक जटिल होते हैं, और अक्सर वे बंद-रूप अभिव्यक्ति में मौजूद नहीं होते हैं। बंद-रूप। ऐसे मामलों में नमूनाकरण वितरण को मोंटे कार्लो सिमुलेशन के माध्यम से अनुमानित किया जा सकता है,[1] बूटस्ट्रैपिंग (सांख्यिकी) विधियाँ, या स्पर्शोन्मुख वितरण सिद्धांत।

मानक त्रुटि

किसी सांख्यिकी के प्रतिचयन वितरण के मानक विचलन को कहा जाता है उस मात्रा की मानक त्रुटि (सांख्यिकी)। ऐसे मामले के लिए जहां आँकड़ा नमूना माध्य है, और नमूने असंबद्ध हैं, मानक त्रुटि है:

कहाँ उस मात्रा के जनसंख्या वितरण का मानक विचलन है और नमूना आकार है (नमूने में वस्तुओं की संख्या)।

इस सूत्र का एक महत्वपूर्ण निहितार्थ यह है कि आधा (1/2) माप त्रुटि प्राप्त करने के लिए नमूना आकार को चौगुना (4 से गुणा) किया जाना चाहिए। सांख्यिकीय अध्ययनों को डिजाइन करते समय जहां लागत एक कारक है, लागत-लाभ व्यापार को समझने में इसकी भूमिका हो सकती है।

ऐसे मामले के लिए जहां आंकड़ा कुल नमूना है, और नमूने असंबद्ध हैं, मानक त्रुटि है:

कहाँ, फिर से, उस मात्रा के जनसंख्या वितरण का मानक विचलन है और नमूना आकार है (नमूने में वस्तुओं की संख्या)।

उदाहरण

Population Statistic Sampling distribution
Normal: Sample mean from samples of size n .

If the standard deviation is not known, one can consider , which follows the Student's t-distribution with degrees of freedom. Here is the sample variance, and is a pivotal quantity, whose distribution does not depend on .

Bernoulli: Sample proportion of "successful trials"
Two independent normal populations:

 and 

Difference between sample means,
Any absolutely continuous distribution F with density f Median from a sample of size n = 2k − 1, where sample is ordered to
Any distribution with distribution function F Maximum from a random sample of size n


संदर्भ

  1. Mooney, Christopher Z. (1999). मोंटे कार्लो सिमुलेशन. Thousand Oaks, Calif.: Sage. p. 2. ISBN 9780803959439.


बाहरी संबंध