जनसंख्या अनुपात: Difference between revisions

From Vigyanwiki
Line 33: Line 33:


=== प्रमाण ===
=== प्रमाण ===
'''एक-सांख्यिकी अनुपात Z-अंतराल''' के लिए सूत्र निर्धारित करने के लिए, सांख्यिकी अनुपातों के एक सांख्यिकी संग्रह का ध्यान देना आवश्यक होता है। सांख्यिकी अनुपातों के सांख्यिकी संग्रह की साधारित औसत आमतौर पर <math>\mu_\hat{p}</math>के रूप में दर्शाया जाता है।<ref name=":0" />  
'''एक-सांख्यिकी अनुपात Z-अंतराल''' के लिए सूत्र निर्धारित करने के लिए, सांख्यिकी अनुपातों के एक सांख्यिकी संग्रह का ध्यान देना आवश्यक होता है। सांख्यिकी अनुपातों के सांख्यिकी संग्रह की साधारित औसत सामान्यतः  <math>\mu_\hat{p}</math>के रूप में दर्शाया जाता है।<ref name=":0" />  
:<math>\sigma_\hat{p} = \sqrt{\frac{P(1-P)}{n}}</math>
:<math>\sigma_\hat{p} = \sqrt{\frac{P(1-P)}{n}}</math>
क्योंकि <math>P</math> का मान अज्ञात होता है, इसलिए <math>P</math> के लिए एक निष्पक्ष सांख्यिकीय आंकड़ा <math>\hat{p}</math> का उपयोग किया जाएगा। औसत और मानक विचलन इस प्रकार से पुनः लिखे जाते हैं:
क्योंकि <math>P</math> का मान अज्ञात होता है, इसलिए <math>P</math> के लिए एक निष्पक्ष सांख्यिकीय आंकड़ा <math>\hat{p}</math> का उपयोग किया जाएगा। औसत और मानक विचलन इस प्रकार से पुनः लिखे जाते हैं:
Line 94: Line 94:


=== उदाहरण ===
=== उदाहरण ===
मान लीजिए लोकतंत्र में राष्ट्रपति का चुनाव हो रहा है। लोकतंत्र की मतदाता आबादी में 400 पात्र मतदाताओं का एक यादृच्छिक सांख्यिकी दर्शाता है कि 272 मतदाता उम्मीदवार बी का समर्थन करते हैं। एक राजनीतिक वैज्ञानिक यह निर्धारित करना चाहता है कि मतदाता आबादी का कितना प्रतिशत उम्मीदवार बी का समर्थन करता है।
मान लीजिए लोकतंत्र में राष्ट्रपति का चुनाव हो रहा है। लोकतंत्र की मतदाता आबादी में 400 पात्र मतदाताओं का एक यादृच्छिक सांख्यिकी दर्शाता है कि 272 मतदाता उम्मीदवार बी का समर्थन करते हैं। एक राजनीतिक वैज्ञानिक यह निर्धारित करना चाहता है कि मतदाता आबादी का कितना प्रतिशत उम्मीदवार बी का समर्थन करता है।


राजनीतिक वैज्ञानिक के प्रश्न का उत्तर देने के लिए, इस लोकतंत्र में उम्मीदवार बी का समर्थन करने वाले योग्य मतदाताओं के जनसंख्या अनुपात को निर्धारित करने के लिए 95% के विश्वास स्तर के साथ जेड-अंतराल में एक-सांख्यिकी अनुपात का निर्माण किया जा सकता है।
राजनीतिक वैज्ञानिक के प्रश्न का उत्तर देने के लिए, इस लोकतंत्र में उम्मीदवार बी का समर्थन करने वाले योग्य मतदाताओं के जनसंख्या अनुपात को निर्धारित करने के लिए 95% के विश्वास स्तर के साथ जेड-अंतराल में एक-सांख्यिकी अनुपात का निर्माण किया जा सकता है।


==== समाधान ====
==== समाधान ====
रैंडम सैंपल से ये पता चलता है <math>\hat{p}
रैंडम सैंपल से ये पता चलता है कि  <math>\hat{p}
=
=
\frac{272}{400}
\frac{272}{400}
=
=
0.68</math> सांख्यिकी  आकार के साथ <math>n
0.68</math> मानक आकार के रूप में <math>n
=
=
400</math>. विश्वास अंतराल के निर्माण से पहले, अनुमान की शर्तों को सत्यापित किया जाएगा।
400</math>. संदर्भ के लिए एक विश्वसनीयता अंतराल निर्माण से पहले, संक्षेप में यांत्रिकी की शर्तें सत्यापित की जाएंगी।
* चूंकि मतदान करने वाली आबादी से 400 मतदाताओं का एक यादृच्छिक सांख्यिकी  प्राप्त किया गया था, इसलिए एक साधारण यादृच्छिक नमूने की शर्त पूरी हो गई है।
* चुनावी जनसंख्या से 400 मतदाताओं का एक यादृच्छिक मानक प्राप्त किया गया है, इसलिए सरल यादृच्छिक मानकों की शर्त पूरी हुई है।
* होने देना <math>n
* यदि <math>n
=
=
400</math> और <math>\hat{p}
400</math> और <math>\hat{p}
=
=
0.68</math>, इसकी जांच की जाएगी <math>n
0.68</math>, इसकी जांच की जाए तो  <math>n
\hat{p}
\hat{p}
\geq
\geq
Line 131: Line 131:
10</math>
10</math>
:सामान्य स्थिति की शर्त पूरी कर ली गई है।
:सामान्य स्थिति की शर्त पूरी कर ली गई है।
*होने देना <math>N</math> इस लोकतंत्र में मतदाता जनसंख्या का आकार हो, और रहने दो <math>n
*यदि इस लोकतंत्र में मतदाता जनसंख्या का आकार <math>N</math> हो,और यदि <math>n
=
=
400</math>. अगर <math>N
400</math>. है, तो यदि  <math>N
\geq
\geq
10
10
n</math>, तो स्वतंत्रता है।
n</math>, हो, तो अन्योन्यता होती है।
:<math>N
:<math>N
\geq
\geq
Line 144: Line 144:
\geq
\geq
4000</math>
4000</math>
:जनसंख्या का आकार <math>N</math> इस लोकतंत्र के मतदाताओं की संख्या कम से कम 4,000 मानी जा सकती है। अत: स्वतंत्रता की शर्त पूरी हो गई है।
:इस लोकतंत्र के मतदाताओं के लिए जनसंख्या <math>N</math> को कम से कम 4,000 माना जा सकता है। इसलिए, अन्योन्यता की शर्त पूरी हुई है।


अनुमान की शर्तों को सत्यापित करने के साथ, एक विश्वास अंतराल का निर्माण करने की अनुमति है।
यांत्रिकी की शर्तों की पुष्टि के बाद, एक विश्वसनीयता अंतराल निर्माण करना स्वीकार्य है।


होने देना <math>\hat{p}
यदि  <math>\hat{p}
=
=
0.68
0.68
Line 157: Line 157:
,</math> और <math>C
,</math> और <math>C
=
=
0.95</math>
0.95</math> समाधान के लिए <math>z^*</math>, [[अभिव्यक्ति (गणित)|अभिव्यक्ति]] <math>\frac{1-C}{2}</math> प्रयोग किया जाता है।
के लिए समाधान करना <math>z^*</math>, [[अभिव्यक्ति (गणित)]] <math>\frac{1-C}{2}</math> प्रयोग किया जाता है।


<math>\frac{1-C}{2}
<math>\frac{1-C}{2}
Line 170: Line 169:
\leq
\leq
z^*</math>.]]
z^*</math>.]]
[[File:Table of Standard Normal Probabilities.png|thumb|के लिए मानक सामान्य संभावनाओं वाली एक तालिका  <math>Z\leq z</math>.]]एक मानक सामान्य घंटी वक्र की जांच करके, के लिए मूल्य <math>z^*</math> यह पहचान कर निर्धारित किया जा सकता है कि कौन सा मानक स्कोर मानक सामान्य वक्र को 0.0250 का ऊपरी पूंछ क्षेत्र या 1 - 0.0250 = 0.9750 का क्षेत्र देता है। के लिए मूल्य <math>z^*</math> इसे मानक सामान्य संभावनाओं की तालिका के माध्यम से भी पाया जा सकता है।
[[File:Table of Standard Normal Probabilities.png|thumb|के लिए मानक सामान्य संभावनाओं वाली एक तालिका  <math>Z\leq z</math>.]]एक मानक साधारित घण्टीदार वक्र की जांच करके <math>z^*</math> के मान को निर्धारित किया जा सकता है,जहां मानक स्कोर को पहचानकर स्टैंडर्ड सामान्य वक्र को 0.0250 का ऊपरी पूंछ क्षेत्र या 1 - 0.0250 = 0.9750 का क्षेत्र देता है। <math>z^*</math> इसे मानक सामान्य संभावनाओं की तालिका के माध्यम से भी पाया जा सकता है।


मानक सामान्य संभावनाओं की तालिका से, का मान <math>Z</math> जो 0.9750 का क्षेत्रफल देता है वह 1.96 है। इसलिए, के लिए मूल्य <math>z^*</math> 1.96 है.
मानक सामान्य संभावनाओं की तालिका से, का मान <math>Z</math> जो 0.9750 का क्षेत्रफल देता है वह 1.96 है। इसलिए, के लिए मूल्य <math>z^*</math> 1.96 है.

Revision as of 10:58, 14 July 2023

सांख्यिकी में, जनसंख्या अनुपात सामान्यतः या यूनानी वर्णमाला Pi (π) से दर्शाया जाता है, जो जनसंख्या से संबंधित प्रतिशत मान का विवरण करता है। उदाहरण के रूप में, 2010 के संयुक्त राज्य जनगणना ने दिखाया कि अमेरिकी जनसंख्या के 83.7% को हिस्पैनिक या लैटिनो होने के रूप में की गई थी; 837 की मान्यता एक जनसंख्या अनुपात है। सामान्य रूप से, जनसंख्या अनुपात और अन्य जनसंख्या प्रामाणिकाएं अज्ञात होती हैं। जनसंख्या मापदंडों का वास्तविक मूल्य निर्धारित करने के लिए जनगणना आयोजित की जा सकती है जिससे जनसंख्या प्रामाणिका का वास्तविक मान निर्धारित किया जा सके, परंतु प्रायः जनगणना आर्थिक और समय के अधिकार कारणों से संभव नहीं होती है।

जनसंख्या अनुपात का अनुमान सामान्यतः एक अवलोकन अध्ययन या प्रयोग से प्राप्त पूर्वाग्रह सांख्यिकी के माध्यम से लगाया जाता है। उदाहरण के लिए, राष्ट्रीय प्रौद्योगिकी साक्षरता सम्मेलन ने 2,000 वयस्कों का एक राष्ट्रीय सर्वेक्षण आयोजित किया था जिससे ऐसे वयस्कों का प्रतिशत निर्धारित किया जा सके जो आर्थिक रूप से अशिक्षित हैं। इस अध्ययन से पता चला कि 2,000 वयस्कों में से 72% को यह समझ में नहीं आया कि सकल घरेलू उत्पाद क्या है।[1] 72% का मान एक सांख्यिकी अनुपात है। सांख्यिकी अनुपात को सामान्यतः से दर्शाया जाता है और कुछ पाठ्यपुस्तकों में से भी दर्शाया जाता है। [2][3]


गणितीय परिभाषा

एक सेट का वेन आरेख चित्रण और इसका उपसमुच्चय . कितना मापकर अनुपात की गणना की जा सकती है में है .

एक अनुपात गणितीय रूप से परिभाषित है कि यह एक उपसमुच्चय में तत्वों की योग्यता के अनुपात को एक समुच्चय के आकार के साथ व्यक्त करता है।

यहां जनसंख्या में सफलताओं की गिनती है, और जनसंख्या का आकार है।

यह गणितीय परिभाषा सामान्यता प्राप्त करके सांख्यिकी अनुपात की परिभाषा प्रदान करती है:

यहां सांख्यिकी में सफलताओं की गिनती है, और सांख्यिकी का आकार है जो जनसंख्या से प्राप्त होता है।[4][2]


अनुमान

अनुमानित सांख्यिकी में अध्ययन का एक मुख्य ध्येय प्रामाणिका के "सच्चे" मान का निर्धारण करना है। सामान्यतः, एक निश्चित प्रामाणिका के वास्तविक मान को नहीं पाया जा सकता है, जब तक अध्ययन की जनसंख्या पर एक जनगणना नहीं होती है। यद्यपि, यहां तक कि प्रामाणिका के लिए एक सार्वजनिक गणना की जाए, सांख्यिकीय विधियां हैं जो इसका उचित आंकलन प्राप्त करने के लिए प्रयोग की जा सकती हैं। इन विधियों में समायोजन अंतराल और अनुमानित मान की निश्चितता की परीक्षा सम्मिलित होती है।

जनसंख्या अनुपात के मूल्य का अनुमान लगाना कृषि, व्यवसाय, अर्थशास्त्र, शिक्षा, अभियांत्रिकी, पर्यावरण अध्ययन, चिकित्सा, कानून, राजनीति विज्ञान, मनोविज्ञान और समाजशास्त्र के क्षेत्रों में बहुत महत्वपूर्ण हो सकता है।

जनसंख्या अनुपात का अनुमान z -अंतराल में एक-सांख्यिकी अनुपात के रूप में ज्ञात आत्मविश्वास अंतराल के उपयोग के माध्यम से लगाया जा सकता है जिसका सूत्र नीचे दिया गया है:

यहाँ सांख्यिकी अनुपात है, सांख्यिकी का आकार है, और संकेतांक है जो अनुमान स्तर के लिए मानक साधारित वितरण के ऊपरी छिद्रान्वेषी मान है। .[5]


प्रमाण

एक-सांख्यिकी अनुपात Z-अंतराल के लिए सूत्र निर्धारित करने के लिए, सांख्यिकी अनुपातों के एक सांख्यिकी संग्रह का ध्यान देना आवश्यक होता है। सांख्यिकी अनुपातों के सांख्यिकी संग्रह की साधारित औसत सामान्यतः के रूप में दर्शाया जाता है।[2]

क्योंकि का मान अज्ञात होता है, इसलिए के लिए एक निष्पक्ष सांख्यिकीय आंकड़ा का उपयोग किया जाएगा। औसत और मानक विचलन इस प्रकार से पुनः लिखे जाते हैं:

और केंद्रीय सीमा सिद्धांत को आह्वान करते हुए, सांख्यिकी अनुपातों का सांख्यिकी संग्रह लगभग सामान्य वितरण का होता है—प्रदान कि सांख्यिकी पर्याप्त बड़ा हो और विकृतिहीन हो।

मान लीजिए कि निम्नलिखित संभाव्यता की गणना की जाती है:

,

यहां, है और मानक महत्वपूर्ण मान हैं

बीजगणितीय रूप से इस प्रकार पुनः लिखा जा सकता है:

ऊपर किए गए बीजगणित के माध्यम से, एक प्रमाणिका के मान के बीच में एक निश्चितता स्तर से स्पष्ट रूप से ज्ञात होता है।

.

अनुमान के लिए परिस्थितियाँ

सामान्य तौर पर, जनसंख्या अनुपात का अनुमान लगाने के लिए उपयोग किए जाने वाले सूत्र को ज्ञात संख्यात्मक मानों के प्रतिस्थापन की आवश्यकता होती है। यद्यपि, इन संख्यात्मक मानों को सूत्र में आँख बंद करके प्रतिस्थापित नहीं किया जा सकता क्योंकि सांख्यिकीय अनुमान के लिए आवश्यक है कि किसी अज्ञात पैरामीटर का अनुमान उचित हो। किसी पैरामीटर के अनुमान को उचित ठहराने के लिए, तीन शर्तें हैं जिन्हें सत्यापित करने की आवश्यकता है:

  1. डेटा की व्यक्तिगत अवलोकन को रुचिकर जनसंख्या के एक सरल यादृच्छिक आकड़ें से प्राप्त किया जाना चाहिए।
  2. डेटा के व्यक्तिगत अवलोकनों में सामान्यता (सांख्यिकी) प्रदर्शित होनी चाहिए। इसे निम्नलिखित परिभाषा से गणितीय रूप से सत्यापित किया जा सकता है:

यदि एक दिए गए यादृच्छिक प्रतिदर्श का आकार हो और उसका प्रतिदर्श अनुपात हो, तब यदि और , , तो डेटा की व्यक्तिगत अवलोकन सामान्यता को प्रदर्शित करेगा।

  1. डेटा के व्यक्तिगत अवलोकन एक-दूसरे पर निर्भर और स्वतंत्र चर होने चाहिए। इसे निम्नलिखित परिभाषा से गणितीय रूप से सत्यापित किया जा सकता है:

यदि रुचिकर जनसंख्या का आकार हो और जनसंख्या के एक सरल यादृच्छिक नमूने का प्रतिदर्श आकार हो, तब यदि हो, तो डेटा की व्यक्तिगत अवलोकन एक-दूसरे के निर्भर नहीं होंगे। अधिकांश सांख्यिकीय पाठ्यपुस्तकों में एसआरएस, सामान्यता और स्वतंत्रता की शर्तों को कभी-कभी अनुमान टूल बॉक्स की शर्तों के रूप में संदर्भित किया जाता है।

उदाहरण

मान लीजिए लोकतंत्र में राष्ट्रपति का चुनाव हो रहा है। लोकतंत्र की मतदाता आबादी में 400 पात्र मतदाताओं का एक यादृच्छिक सांख्यिकी दर्शाता है कि 272 मतदाता उम्मीदवार बी का समर्थन करते हैं। एक राजनीतिक वैज्ञानिक यह निर्धारित करना चाहता है कि मतदाता आबादी का कितना प्रतिशत उम्मीदवार बी का समर्थन करता है।

राजनीतिक वैज्ञानिक के प्रश्न का उत्तर देने के लिए, इस लोकतंत्र में उम्मीदवार बी का समर्थन करने वाले योग्य मतदाताओं के जनसंख्या अनुपात को निर्धारित करने के लिए 95% के विश्वास स्तर के साथ जेड-अंतराल में एक-सांख्यिकी अनुपात का निर्माण किया जा सकता है।

समाधान

रैंडम सैंपल से ये पता चलता है कि मानक आकार के रूप में . संदर्भ के लिए एक विश्वसनीयता अंतराल निर्माण से पहले, संक्षेप में यांत्रिकी की शर्तें सत्यापित की जाएंगी।

  • चुनावी जनसंख्या से 400 मतदाताओं का एक यादृच्छिक मानक प्राप्त किया गया है, इसलिए सरल यादृच्छिक मानकों की शर्त पूरी हुई है।
  • यदि और , इसकी जांच की जाए तो और
और
सामान्य स्थिति की शर्त पूरी कर ली गई है।
  • यदि इस लोकतंत्र में मतदाता जनसंख्या का आकार हो,और यदि . है, तो यदि , हो, तो अन्योन्यता होती है।
इस लोकतंत्र के मतदाताओं के लिए जनसंख्या को कम से कम 4,000 माना जा सकता है। इसलिए, अन्योन्यता की शर्त पूरी हुई है।

यांत्रिकी की शर्तों की पुष्टि के बाद, एक विश्वसनीयता अंतराल निर्माण करना स्वीकार्य है।

यदि और समाधान के लिए , अभिव्यक्ति प्रयोग किया जाता है।

मानक सामान्य वक्र के साथ जो 0.0250 का ऊपरी पूंछ क्षेत्र और 0.9750 का क्षेत्र देता है .
के लिए मानक सामान्य संभावनाओं वाली एक तालिका .

एक मानक साधारित घण्टीदार वक्र की जांच करके के मान को निर्धारित किया जा सकता है,जहां मानक स्कोर को पहचानकर स्टैंडर्ड सामान्य वक्र को 0.0250 का ऊपरी पूंछ क्षेत्र या 1 - 0.0250 = 0.9750 का क्षेत्र देता है। इसे मानक सामान्य संभावनाओं की तालिका के माध्यम से भी पाया जा सकता है।

मानक सामान्य संभावनाओं की तालिका से, का मान जो 0.9750 का क्षेत्रफल देता है वह 1.96 है। इसलिए, के लिए मूल्य 1.96 है.

के लिए मान , , अब इसे Z-अंतराल में एक-सांख्यिकी अनुपात के सूत्र में प्रतिस्थापित किया जा सकता है:

अनुमान की शर्तों और ज़ेड-अंतराल में एक-सांख्यिकी अनुपात के सूत्र के आधार पर, 95% विश्वास स्तर के साथ यह निष्कर्ष निकाला जा सकता है कि इस लोकतंत्र में उम्मीदवार बी का समर्थन करने वाले मतदाता आबादी का प्रतिशत 63.429% और 72.571 के बीच है। %.

कॉन्फिडेंस इंटरवल रेंज में पैरामीटर का मान

अनुमानित आँकड़ों में आमतौर पर पूछा जाने वाला प्रश्न यह है कि क्या पैरामीटर को विश्वास अंतराल के भीतर शामिल किया गया है। इस प्रश्न का उत्तर देने का एकमात्र तरीका जनगणना आयोजित करना है। ऊपर दिए गए उदाहरण का संदर्भ लेते हुए, जनसंख्या अनुपात विश्वास अंतराल की सीमा में होने की संभावना या तो 1 या 0 है। यानी, पैरामीटर अंतराल सीमा में शामिल है या नहीं। कॉन्फिडेंस इंटरवल का मुख्य उद्देश्य यह बेहतर ढंग से बताना है कि किसी पैरामीटर के लिए आदर्श मान संभवतः क्या हो सकता है।

अनुमान से सामान्य त्रुटियाँ और गलत व्याख्याएँ

आत्मविश्वास अंतराल के निर्माण से उत्पन्न होने वाली एक बहुत ही सामान्य त्रुटि यह विश्वास है कि आत्मविश्वास का स्तर, जैसे , मतलब 95% संभावना. ये ग़लत है. आत्मविश्वास का स्तर निश्चितता के माप पर आधारित है, संभावना पर नहीं। इसलिए, के मूल्य विशेष रूप से 0 और 1 के बीच गिरना।

रैंक सेट सैंपलिंग का उपयोग करके पी का अनुमान

सरल यादृच्छिक नमूने के बजाय रैंक सेट सांख्यिकी करण चुनकर पी का अधिक सटीक अनुमान प्राप्त किया जा सकता है[6][7]


यह भी देखें

संदर्भ

  1. Ott, R. Lyman (1993). सांख्यिकीय विधियों और डेटा विश्लेषण का परिचय. ISBN 0-534-93150-2.
  2. 2.0 2.1 2.2 Weisstein, Eric W. "नमूना अनुपात". mathworld.wolfram.com (in English). Retrieved 2020-08-22.
  3. "6.3: The Sample Proportion". Statistics LibreTexts (in English). 2014-04-16. Retrieved 2020-08-22.
  4. Weisstein, Eric (1998). सीआरसी गणित का संक्षिप्त विश्वकोश. Chapman & Hall/CRC. Bibcode:1998ccem.book.....W.
  5. Hinders, Duane (2008). एनोटेटेड शिक्षक संस्करण सांख्यिकी का अभ्यास. ISBN 978-0-7167-7703-8.
  6. Abbasi, Azhar Mehmood; Yousaf Shad, Muhammad (2021-05-15). "सहवर्ती आधारित रैंक सेट नमूने का उपयोग करके जनसंख्या अनुपात का अनुमान". Communications in Statistics - Theory and Methods. 51 (9): 2689–2709. doi:10.1080/03610926.2021.1916529. ISSN 0361-0926. S2CID 236554602.
  7. Abbasi, Azhar Mehmood; Shad, Muhammad Yousaf (2021-05-15). "सहवर्ती आधारित रैंक सेट नमूने का उपयोग करके जनसंख्या अनुपात का अनुमान". Communications in Statistics - Theory and Methods. 51 (9): 2689–2709. doi:10.1080/03610926.2021.1916529. ISSN 0361-0926. S2CID 236554602.