जनसंख्या अनुपात: Difference between revisions
No edit summary |
No edit summary |
||
(17 intermediate revisions by 3 users not shown) | |||
Line 3: | Line 3: | ||
[[सांख्यिकीय|सांख्यिकी]] में, '''जनसंख्या अनुपात''' सामान्यतः <math>P</math> या यूनानी वर्णमाला Pi (π) से दर्शाया जाता है, जो जनसंख्या से संबंधित प्रतिशत मान का विवरण करता है। उदाहरण के रूप में, 2010 के संयुक्त राज्य [[जनगणना]] ने दिखाया कि अमेरिकी जनसंख्या के 83.7% को हिस्पैनिक या लैटिनो होने के रूप में की गई थी; 837 की मान्यता एक जनसंख्या अनुपात है। सामान्य रूप से, जनसंख्या अनुपात और अन्य जनसंख्या प्रामाणिकाएं अज्ञात होती हैं। जनसंख्या मापदंडों का वास्तविक मूल्य निर्धारित करने के लिए जनगणना आयोजित की जा सकती है जिससे जनसंख्या प्रामाणिका का वास्तविक मान निर्धारित किया जा सके, परंतु प्रायः जनगणना आर्थिक और समय के अधिकार कारणों से संभव नहीं होती है। | [[सांख्यिकीय|सांख्यिकी]] में, '''जनसंख्या अनुपात''' सामान्यतः <math>P</math> या यूनानी वर्णमाला Pi (π) से दर्शाया जाता है, जो जनसंख्या से संबंधित प्रतिशत मान का विवरण करता है। उदाहरण के रूप में, 2010 के संयुक्त राज्य [[जनगणना]] ने दिखाया कि अमेरिकी जनसंख्या के 83.7% को हिस्पैनिक या लैटिनो होने के रूप में की गई थी; 837 की मान्यता एक जनसंख्या अनुपात है। सामान्य रूप से, जनसंख्या अनुपात और अन्य जनसंख्या प्रामाणिकाएं अज्ञात होती हैं। जनसंख्या मापदंडों का वास्तविक मूल्य निर्धारित करने के लिए जनगणना आयोजित की जा सकती है जिससे जनसंख्या प्रामाणिका का वास्तविक मान निर्धारित किया जा सके, परंतु प्रायः जनगणना आर्थिक और समय के अधिकार कारणों से संभव नहीं होती है। | ||
जनसंख्या अनुपात का अनुमान सामान्यतः एक [[अवलोकन अध्ययन]] या [[प्रयोग (संभावना सिद्धांत)|प्रयोग]] से प्राप्त | जनसंख्या अनुपात का अनुमान सामान्यतः एक [[अवलोकन अध्ययन]] या [[प्रयोग (संभावना सिद्धांत)|प्रयोग]] से प्राप्त पूर्वाग्रह सांख्यिकी के माध्यम से लगाया जाता है। उदाहरण के लिए, राष्ट्रीय प्रौद्योगिकी साक्षरता सम्मेलन ने 2,000 वयस्कों का एक राष्ट्रीय सर्वेक्षण आयोजित किया था जिससे ऐसे वयस्कों का प्रतिशत निर्धारित किया जा सके जो आर्थिक रूप से अशिक्षित हैं। इस अध्ययन से पता चला कि 2,000 वयस्कों में से 72% को यह समझ में नहीं आया कि [[सकल घरेलू उत्पाद]] क्या है।<ref>{{Cite book|title=सांख्यिकीय विधियों और डेटा विश्लेषण का परिचय|last=Ott|first=R. Lyman|year=1993|isbn=0-534-93150-2}}</ref> 72% का मान एक सांख्यिकी अनुपात है। सांख्यिकी अनुपात को सामान्यतः <math>\hat{p}</math>से दर्शाया जाता है और कुछ पाठ्यपुस्तकों में <math>p</math> से भी दर्शाया जाता है। <ref name=":0">{{Cite web|last=Weisstein|first=Eric W.|title=नमूना अनुपात|url=https://mathworld.wolfram.com/SampleProportion.html|access-date=2020-08-22|website=mathworld.wolfram.com|language=en}}</ref><ref>{{Cite web|date=2014-04-16|title=6.3: The Sample Proportion|url=https://stats.libretexts.org/Bookshelves/Introductory_Statistics/Book%3A_Introductory_Statistics_(Shafer_and_Zhang)/06%3A_Sampling_Distributions/6.03%3A_The_Sample_Proportion|access-date=2020-08-22|website=Statistics LibreTexts|language=en}}</ref> | ||
== गणितीय परिभाषा == | == गणितीय परिभाषा == | ||
[[File:SubsetMine.png|thumb|एक | [[File:SubsetMine.png|thumb|एक समुच्चय का वेन आरेख चित्रण <math>R</math> और इसका उपसमुच्चय <math>S</math>. कितना मापकर अनुपात की गणना की जा सकती है <math>S</math> में है <math>R</math>.]]एक [[अनुपात]] गणितीय रूप से परिभाषित है कि यह एक उपसमुच्चय <math>S</math> में तत्वों की योग्यता के अनुपात को एक समुच्चय <math>R</math> के आकार के साथ व्यक्त करता है। | ||
:<math>P= \frac{X}{N},</math> | :<math>P= \frac{X}{N},</math> | ||
यहां <math>X </math> जनसंख्या में सफलताओं की गिनती है, और <math>N </math> जनसंख्या का आकार है। | |||
यह गणितीय परिभाषा सामान्यता प्राप्त करके सांख्यिकी अनुपात की परिभाषा प्रदान करती है: | |||
:<math>\hat{p}= \frac{x}{n} </math> | :<math>\hat{p}= \frac{x}{n} </math> | ||
यहां <math>x </math> सांख्यिकी में सफलताओं की गिनती है, और <math>n </math> सांख्यिकी का आकार है जो जनसंख्या से प्राप्त होता है।<ref>{{Cite book|title=सीआरसी गणित का संक्षिप्त विश्वकोश|last=Weisstein|first=Eric|year=1998|publisher=Chapman & Hall/CRC|bibcode=1998ccem.book.....W}}</ref><ref name=":0" /> | |||
== अनुमान == | == अनुमान == | ||
{{see also| | {{see also|नमूना आकार निर्धारण अनुपात का अनुमान}} | ||
अनुमानित | अनुमानित सांख्यिकी में अध्ययन का एक मुख्य ध्येय प्रामाणिका के "सच्चे" मान का निर्धारण करना है। सामान्यतः, एक निश्चित प्रामाणिका के वास्तविक मान को नहीं पाया जा सकता है, जब तक अध्ययन की जनसंख्या पर एक जनगणना नहीं होती है। यद्यपि, यहां तक कि प्रामाणिका के लिए एक सार्वजनिक गणना की जाए, सांख्यिकीय विधियां हैं जो इसका उचित आंकलन प्राप्त करने के लिए प्रयोग की जा सकती हैं। इन विधियों में समायोजन [[विश्वास अंतराल|अंतराल]] और [[परिकल्पना परीक्षण|अनुमानित मान]] की निश्चितता की परीक्षा सम्मिलित होती है। | ||
जनसंख्या अनुपात के मूल्य का अनुमान लगाना [[कृषि]], [[व्यवसाय]], [[अर्थशास्त्र]], [[शिक्षा]], [[ अभियांत्रिकी ]], [[पर्यावरण अध्ययन]], चिकित्सा, [[कानून]], [[राजनीति विज्ञान]], [[मनोविज्ञान]] और समाजशास्त्र के क्षेत्रों में बहुत महत्वपूर्ण हो सकता है। | जनसंख्या अनुपात के मूल्य का अनुमान लगाना [[कृषि]], [[व्यवसाय]], [[अर्थशास्त्र]], [[शिक्षा]], [[ अभियांत्रिकी |अभियांत्रिकी]], [[पर्यावरण अध्ययन]], चिकित्सा, [[कानून]], [[राजनीति विज्ञान]], [[मनोविज्ञान]] और समाजशास्त्र के क्षेत्रों में बहुत महत्वपूर्ण हो सकता है। | ||
जनसंख्या अनुपात का अनुमान | जनसंख्या अनुपात का अनुमान z -अंतराल में एक-सांख्यिकी अनुपात के रूप में ज्ञात आत्मविश्वास अंतराल के उपयोग के माध्यम से लगाया जा सकता है जिसका सूत्र नीचे दिया गया है: | ||
:<math>\hat{p} | :<math>\hat{p} | ||
\pm | \pm | ||
z^* | z^* | ||
\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}</math> | \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}</math> यहाँ <math>\hat{p}</math> सांख्यिकी अनुपात है, <math>n</math> सांख्यिकी का आकार है, और <math>z^*</math>संकेतांक है जो अनुमान स्तर <math>C</math> के लिए मानक साधारित वितरण के ऊपरी <math>\frac{1-C}{2}</math> छिद्रान्वेषी मान है। .<ref>{{Cite book|title=एनोटेटेड शिक्षक संस्करण सांख्यिकी का अभ्यास|last=Hinders|first=Duane|year=2008|isbn=978-0-7167-7703-8}}</ref> | ||
=== प्रमाण === | === प्रमाण === | ||
Z-अंतराल | '''एक-सांख्यिकी अनुपात Z-अंतराल''' के लिए सूत्र निर्धारित करने के लिए, सांख्यिकी अनुपातों के एक सांख्यिकी संग्रह का ध्यान देना आवश्यक होता है। सांख्यिकी अनुपातों के सांख्यिकी संग्रह की साधारित औसत सामान्यतः <math>\mu_\hat{p}</math>के रूप में दर्शाया जाता है।<ref name=":0" /> | ||
:<math>\sigma_\hat{p} = \sqrt{\frac{P(1-P)}{n}}</math> | :<math>\sigma_\hat{p} = \sqrt{\frac{P(1-P)}{n}}</math> | ||
क्योंकि <math>P</math> का मान अज्ञात होता है, इसलिए <math>P</math> के लिए एक निष्पक्ष सांख्यिकीय आंकड़ा <math>\hat{p}</math> का उपयोग किया जाएगा। औसत और मानक विचलन इस प्रकार से पुनः लिखे जाते हैं: | |||
:<math>\mu_\hat{p} | :<math>\mu_\hat{p} | ||
= \hat{p}</math> और <math>\sigma_\hat{p} | = \hat{p}</math> और <math>\sigma_\hat{p} | ||
= \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}</math> [[केंद्रीय सीमा | = \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}</math>[[केंद्रीय सीमा सिद्धांत]] को आह्वान करते हुए, सांख्यिकी अनुपातों का सांख्यिकी संग्रह लगभग [[सामान्य वितरण]] का होता है—प्रदान कि सांख्यिकी पर्याप्त बड़ा हो और विकृतिहीन हो। | ||
मान लीजिए कि निम्नलिखित संभाव्यता की गणना की जाती है: | मान लीजिए कि निम्नलिखित संभाव्यता की गणना की जाती है: | ||
:<math>P(-z^*<\frac{\hat{p}-P}{\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}}<z^*) = C | :<math>P(-z^*<\frac{\hat{p}-P}{\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}}<z^*) = C | ||
</math>, | </math>, | ||
यहां, <math>0<C<1</math> है और <math>\pm | |||
z^*</math> मानक महत्वपूर्ण मान हैं | z^*</math>मानक महत्वपूर्ण मान हैं | ||
:<math>-z^*<\frac{\hat{p}-P}{\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}}<z^* | :<math>-z^*<\frac{\hat{p}-P}{\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}}<z^* | ||
</math> | </math> | ||
Line 59: | Line 56: | ||
\hat{p}-z^*{\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}}<P<\hat{p}+z^*{\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}} | \hat{p}-z^*{\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}}<P<\hat{p}+z^*{\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}} | ||
</math> | </math> | ||
ऊपर किए गए | ऊपर किए गए बीजगणित के माध्यम से, एक प्रमाणिका <math>P</math> के मान के बीच में एक निश्चितता स्तर <math>C</math> से स्पष्ट रूप से ज्ञात होता है। | ||
:<math>\hat{p} | :<math>\hat{p} | ||
\pm | \pm | ||
z^* | z^* | ||
\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}</math>. | \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}</math>. | ||
=== अनुमान के लिए शर्तें === | === अनुमान के लिए शर्तें === | ||
सामान्य तौर पर, जनसंख्या अनुपात का अनुमान लगाने के लिए उपयोग किए जाने वाले सूत्र को ज्ञात संख्यात्मक मानों के प्रतिस्थापन की आवश्यकता होती है। | सामान्य तौर पर, जनसंख्या अनुपात का अनुमान लगाने के लिए उपयोग किए जाने वाले सूत्र को ज्ञात संख्यात्मक मानों के प्रतिस्थापन की आवश्यकता होती है। यद्यपि, इन संख्यात्मक मानों को सूत्र में आँख बंद करके प्रतिस्थापित नहीं किया जा सकता क्योंकि सांख्यिकीय अनुमान के लिए आवश्यक है कि किसी अज्ञात पैरामीटर का अनुमान उचित हो। किसी पैरामीटर के अनुमान को उचित ठहराने के लिए, तीन शर्तें हैं जिन्हें सत्यापित करने की आवश्यकता है: | ||
# डेटा | # डेटा की व्यक्तिगत अवलोकन को रुचिकर जनसंख्या के एक सरल यादृच्छिक आकड़ें से प्राप्त किया जाना चाहिए। | ||
# डेटा के व्यक्तिगत अवलोकनों में [[सामान्यता (सांख्यिकी)]] प्रदर्शित होनी चाहिए। इसे निम्नलिखित परिभाषा से गणितीय रूप से सत्यापित किया जा सकता है: | # डेटा के व्यक्तिगत अवलोकनों में [[सामान्यता (सांख्यिकी)]] प्रदर्शित होनी चाहिए। इसे निम्नलिखित परिभाषा से गणितीय रूप से सत्यापित किया जा सकता है: | ||
यदि एक दिए गए यादृच्छिक प्रतिदर्श का आकार <math>n</math> हो और उसका प्रतिदर्श अनुपात <math>\hat{p}</math> हो, तब यदि <math>n\hat{p}\geq 10</math> और , <math>n(1-\hat{p})\geq 10</math>, तो डेटा की व्यक्तिगत अवलोकन सामान्यता को प्रदर्शित करेगा। | |||
\hat{p} | |||
\geq | |||
10</math> और | |||
# डेटा के व्यक्तिगत अवलोकन एक-दूसरे पर निर्भर और स्वतंत्र चर होने चाहिए। इसे निम्नलिखित परिभाषा से गणितीय रूप से सत्यापित किया जा सकता है: | # डेटा के व्यक्तिगत अवलोकन एक-दूसरे पर निर्भर और स्वतंत्र चर होने चाहिए। इसे निम्नलिखित परिभाषा से गणितीय रूप से सत्यापित किया जा सकता है: | ||
यदि रुचिकर जनसंख्या का आकार <math>N</math> हो और जनसंख्या के एक सरल यादृच्छिक नमूने का प्रतिदर्श आकार <math>n</math> हो, तब यदि <math>N\geq10n</math> हो, तो डेटा की व्यक्तिगत अवलोकन एक-दूसरे के निर्भर नहीं होंगे। अधिकांश सांख्यिकीय पाठ्यपुस्तकों में एसआरएस, सामान्यता और स्वतंत्रता की शर्तों को कभी-कभी अनुमान टूल बॉक्स की शर्तों के रूप में संदर्भित किया जाता है। | |||
अधिकांश सांख्यिकीय पाठ्यपुस्तकों में एसआरएस, सामान्यता और स्वतंत्रता की शर्तों को कभी-कभी अनुमान टूल बॉक्स की शर्तों के रूप में संदर्भित किया जाता है। | |||
=== उदाहरण === | === उदाहरण === | ||
मान लीजिए लोकतंत्र में राष्ट्रपति का चुनाव हो रहा है। लोकतंत्र की मतदाता आबादी में 400 पात्र मतदाताओं का एक यादृच्छिक | मान लीजिए लोकतंत्र में राष्ट्रपति का चुनाव हो रहा है। लोकतंत्र की मतदाता आबादी में 400 पात्र मतदाताओं का एक यादृच्छिक सांख्यिकी दर्शाता है कि 272 मतदाता उम्मीदवार बी का समर्थन करते हैं। एक राजनीतिक वैज्ञानिक यह निर्धारित करना चाहता है कि मतदाता आबादी का कितना प्रतिशत उम्मीदवार बी का समर्थन करता है। | ||
राजनीतिक वैज्ञानिक के प्रश्न का उत्तर देने के लिए, इस लोकतंत्र में उम्मीदवार बी का समर्थन करने वाले योग्य मतदाताओं के जनसंख्या अनुपात को निर्धारित करने के लिए 95% के विश्वास स्तर के साथ जेड-अंतराल में एक- | राजनीतिक वैज्ञानिक के प्रश्न का उत्तर देने के लिए, इस लोकतंत्र में उम्मीदवार बी का समर्थन करने वाले योग्य मतदाताओं के जनसंख्या अनुपात को निर्धारित करने के लिए 95% के विश्वास स्तर के साथ जेड-अंतराल में एक-सांख्यिकी अनुपात का निर्माण किया जा सकता है। | ||
==== समाधान ==== | ==== समाधान ==== | ||
रैंडम सैंपल से ये पता चलता है <math>\hat{p} | रैंडम सैंपल से ये पता चलता है कि <math>\hat{p} | ||
= | = | ||
\frac{272}{400} | \frac{272}{400} | ||
= | = | ||
0.68</math> | 0.68</math> मानक आकार के रूप में <math>n | ||
= | = | ||
400</math>. | 400</math>. संदर्भ के लिए एक विश्वसनीयता अंतराल निर्माण से पहले, संक्षेप में यांत्रिकी की शर्तें सत्यापित की जाएंगी। | ||
* | * चुनावी जनसंख्या से 400 मतदाताओं का एक यादृच्छिक मानक प्राप्त किया गया है, इसलिए सरल यादृच्छिक मानकों की शर्त पूरी हुई है। | ||
* | * यदि <math>n | ||
= | = | ||
400</math> और <math>\hat{p} | 400</math> और <math>\hat{p} | ||
= | = | ||
0.68</math>, इसकी जांच की | 0.68</math>, इसकी जांच की जाए तो <math>n | ||
\hat{p} | \hat{p} | ||
\geq | \geq | ||
Line 115: | Line 131: | ||
10</math> | 10</math> | ||
:सामान्य स्थिति की शर्त पूरी कर ली गई है। | :सामान्य स्थिति की शर्त पूरी कर ली गई है। | ||
* | *यदि इस लोकतंत्र में मतदाता जनसंख्या का आकार <math>N</math> हो,और यदि <math>n | ||
= | = | ||
400</math>. | 400</math>. है, तो यदि <math>N | ||
\geq | \geq | ||
10 | 10 | ||
n</math>, तो | n</math>, हो, तो अन्योन्यता होती है। | ||
:<math>N | :<math>N | ||
\geq | \geq | ||
Line 128: | Line 144: | ||
\geq | \geq | ||
4000</math> | 4000</math> | ||
:जनसंख्या | :इस लोकतंत्र के मतदाताओं के लिए जनसंख्या <math>N</math> को कम से कम 4,000 माना जा सकता है। इसलिए, अन्योन्यता की शर्त पूरी हुई है। | ||
यांत्रिकी की शर्तों की पुष्टि के बाद, एक विश्वसनीयता अंतराल निर्माण करना स्वीकार्य है। | |||
यदि <math>\hat{p} | |||
= | = | ||
0.68 | 0.68 | ||
Line 141: | Line 157: | ||
,</math> और <math>C | ,</math> और <math>C | ||
= | = | ||
0.95</math> | 0.95</math> समाधान के लिए <math>z^*</math>, [[अभिव्यक्ति (गणित)|अभिव्यक्ति]] <math>\frac{1-C}{2}</math> प्रयोग किया जाता है। | ||
के लिए | |||
<math>\frac{1-C}{2}</math> is used. | |||
<math>\frac{1-C}{2} | <math>\frac{1-C}{2} | ||
Line 154: | Line 171: | ||
\leq | \leq | ||
z^*</math>.]] | z^*</math>.]] | ||
[[File: | [[File:BELL CURVE.png|thumb|The standard normal curve with <math>z^*</math> which gives an upper tail area of 0.0250 and an area of 0.9750 for <math>Z | ||
\leq | |||
z^*</math>.]] | |||
[[चित्र:गुणात्मक औसत वक्र.png||<math>Z \leq z^*</math>]] | |||
एक मानक साधारित वक्र की जांच करके,[[चित्र:गुणात्मक औसत वक्र.png|<math>Z \leq z^*</math>]] के मान को निर्धारित किया जा सकता है।जहां मानक स्कोर को पहचानकर स्टैंडर्ड नॉर्मल कर्व को 0.0250 की ऊपरी पूंछ भाग के क्षेत्र या 1 - 0.0250 = 0.9750 क्षेत्र को देता है। <math>z^*</math>के मान को मानक साधारित संभावना की एक सारणी से भी ढूंढा जा सकता है।. | |||
मानक | मानक साधारित संभावना की एक सारणी से, 0.9750 क्षेत्र देने वाले <math>Z</math> के मान हैं इसीलिए <math>z^*</math>का 1.96 मान हैं। | ||
अब <math>\hat{p}=0.68</math>, <math>n=400</math>, <math>z^*=1.96</math> के मानों को एक-नमूना अनुपात Z-अंतराल के लिए सूत्र में स्थानांतरित किया जा सकता है: | |||
= | |||
0.68</math>, <math>n | |||
= | |||
400</math>, <math>z^* | |||
= | |||
1.96</math> | |||
<math>\hat{p} | <math>\hat{p} | ||
Line 181: | Line 197: | ||
\sqrt{0.000544}</math> <math>\Rightarrow | \sqrt{0.000544}</math> <math>\Rightarrow | ||
\bigl(0.63429,0.72571\bigr)</math> | \bigl(0.63429,0.72571\bigr)</math> | ||
=== | यांत्रिकी की शर्तों और एक-नमूना अनुपात Z-अंतराल के सूत्र के आधार पर, 95% विश्वसनीयता स्तर के साथ निष्कर्ष निकाला जा सकता है कि इस लोकतंत्र में मतदाता जनसंख्या का उम्मीदवार बी का समर्थन करने वाले वोटरों का प्रतिशत 63.429% से 72.571% के मध्य है। | ||
अनुमानित | |||
=== विश्वसनीयता अंतराल सीमा में पैरामीटर का मान === | |||
अनुमानित सांख्यिकी में सामान्यतः पूछा जाने वाला प्रश्न यह है कि क्या पैरामीटर को विश्वसनीयता अंतराल के भीतर सम्मिलित किया गया है। इस प्रश्न का उत्तर देने का एकमात्र विधि जनगणना आयोजित करना है। ऊपर दिए गए उदाहरण का संदर्भ लेते हुए, जनसंख्या अनुपात विश्वसनीयता अंतराल की सीमा में होने की संभावना या तो 1 या 0 है। अर्थात, पैरामीटर अंतराल सीमा में सम्मिलित है या नहीं। विश्वसनीयता अंतराल का मुख्य उद्देश्य यह बेहतर ढंग से बताना है कि किसी पैरामीटर के लिए आदर्श मान संभवतः क्या हो सकता है। | |||
=== अनुमान से सामान्य त्रुटियाँ और गलत व्याख्याएँ === | === अनुमान से सामान्य त्रुटियाँ और गलत व्याख्याएँ === | ||
एक विश्वसनीयता अंतराल के निर्माण से उत्पन्न एक बहुत सामान्य त्रुटि है कि विश्वसनीयता स्तर, जैसे <math>C | |||
= | = | ||
95%</math>, | 95%</math>, अर्थात 95% संभावना ये ग़लत है विश्वसनीयता स्तर सत्यापन की एक मापदंड पर आधारित होता है, न कि संभावना पर। इसलिए, <math>C</math> के मान 0 और 1 के बीच, केवल यहीं तक सीमित होते हैं। | ||
=== रैंक | === रैंक समुच्चय मानकों का उपयोग करके P का अनुमान === | ||
एक सामान्य यादृच्छिक मानक लेने के अतिरिक्त,श्रेणीबद्ध समुच्चय मानकों का चयन करके P का और अधिक सटीक अनुमान प्राप्त किया जा सकता है।<ref>{{Cite journal|last1=Abbasi|first1=Azhar Mehmood|last2=Yousaf Shad|first2=Muhammad|date=2021-05-15|title=सहवर्ती आधारित रैंक सेट नमूने का उपयोग करके जनसंख्या अनुपात का अनुमान|url=https://www.tandfonline.com/doi/ref/10.1080/03610926.2021.1916529|journal=Communications in Statistics - Theory and Methods|volume=51 |issue=9 |pages=2689–2709|doi=10.1080/03610926.2021.1916529|s2cid=236554602|issn=0361-0926}}</ref><ref>{{Cite journal|last1=Abbasi|first1=Azhar Mehmood|last2=Shad|first2=Muhammad Yousaf|date=2021-05-15|title=सहवर्ती आधारित रैंक सेट नमूने का उपयोग करके जनसंख्या अनुपात का अनुमान|url=https://doi.org/10.1080/03610926.2021.1916529|journal=Communications in Statistics - Theory and Methods|volume=51 |issue=9 |pages=2689–2709|doi=10.1080/03610926.2021.1916529|s2cid=236554602|issn=0361-0926}}</ref> | |||
Line 206: | Line 234: | ||
== संदर्भ == | == संदर्भ == | ||
{{Reflist}} | {{Reflist}} | ||
[[Category: | [[Category:Articles with hatnote templates targeting a nonexistent page]] | ||
[[Category:CS1 English-language sources (en)]] | |||
[[Category:Created On 06/07/2023]] | [[Category:Created On 06/07/2023]] | ||
[[Category:Lua-based templates]] | |||
[[Category:Machine Translated Page]] | |||
[[Category:Pages with math errors]] | |||
[[Category:Pages with math render errors]] | |||
[[Category:Pages with maths render errors]] | |||
[[Category:Pages with script errors]] | |||
[[Category:Short description with empty Wikidata description]] | |||
[[Category:Template documentation pages|Short description/doc]] | |||
[[Category:Templates Vigyan Ready]] | |||
[[Category:Templates that add a tracking category]] | |||
[[Category:Templates that generate short descriptions]] | |||
[[Category:Templates using TemplateData]] | |||
[[Category:अनुपात]] |
Latest revision as of 21:44, 15 July 2023
सांख्यिकी में, जनसंख्या अनुपात सामान्यतः या यूनानी वर्णमाला Pi (π) से दर्शाया जाता है, जो जनसंख्या से संबंधित प्रतिशत मान का विवरण करता है। उदाहरण के रूप में, 2010 के संयुक्त राज्य जनगणना ने दिखाया कि अमेरिकी जनसंख्या के 83.7% को हिस्पैनिक या लैटिनो होने के रूप में की गई थी; 837 की मान्यता एक जनसंख्या अनुपात है। सामान्य रूप से, जनसंख्या अनुपात और अन्य जनसंख्या प्रामाणिकाएं अज्ञात होती हैं। जनसंख्या मापदंडों का वास्तविक मूल्य निर्धारित करने के लिए जनगणना आयोजित की जा सकती है जिससे जनसंख्या प्रामाणिका का वास्तविक मान निर्धारित किया जा सके, परंतु प्रायः जनगणना आर्थिक और समय के अधिकार कारणों से संभव नहीं होती है।
जनसंख्या अनुपात का अनुमान सामान्यतः एक अवलोकन अध्ययन या प्रयोग से प्राप्त पूर्वाग्रह सांख्यिकी के माध्यम से लगाया जाता है। उदाहरण के लिए, राष्ट्रीय प्रौद्योगिकी साक्षरता सम्मेलन ने 2,000 वयस्कों का एक राष्ट्रीय सर्वेक्षण आयोजित किया था जिससे ऐसे वयस्कों का प्रतिशत निर्धारित किया जा सके जो आर्थिक रूप से अशिक्षित हैं। इस अध्ययन से पता चला कि 2,000 वयस्कों में से 72% को यह समझ में नहीं आया कि सकल घरेलू उत्पाद क्या है।[1] 72% का मान एक सांख्यिकी अनुपात है। सांख्यिकी अनुपात को सामान्यतः से दर्शाया जाता है और कुछ पाठ्यपुस्तकों में से भी दर्शाया जाता है। [2][3]
गणितीय परिभाषा
एक अनुपात गणितीय रूप से परिभाषित है कि यह एक उपसमुच्चय में तत्वों की योग्यता के अनुपात को एक समुच्चय के आकार के साथ व्यक्त करता है।
यहां जनसंख्या में सफलताओं की गिनती है, और जनसंख्या का आकार है।
यह गणितीय परिभाषा सामान्यता प्राप्त करके सांख्यिकी अनुपात की परिभाषा प्रदान करती है:
यहां सांख्यिकी में सफलताओं की गिनती है, और सांख्यिकी का आकार है जो जनसंख्या से प्राप्त होता है।[4][2]
अनुमान
अनुमानित सांख्यिकी में अध्ययन का एक मुख्य ध्येय प्रामाणिका के "सच्चे" मान का निर्धारण करना है। सामान्यतः, एक निश्चित प्रामाणिका के वास्तविक मान को नहीं पाया जा सकता है, जब तक अध्ययन की जनसंख्या पर एक जनगणना नहीं होती है। यद्यपि, यहां तक कि प्रामाणिका के लिए एक सार्वजनिक गणना की जाए, सांख्यिकीय विधियां हैं जो इसका उचित आंकलन प्राप्त करने के लिए प्रयोग की जा सकती हैं। इन विधियों में समायोजन अंतराल और अनुमानित मान की निश्चितता की परीक्षा सम्मिलित होती है।
जनसंख्या अनुपात के मूल्य का अनुमान लगाना कृषि, व्यवसाय, अर्थशास्त्र, शिक्षा, अभियांत्रिकी, पर्यावरण अध्ययन, चिकित्सा, कानून, राजनीति विज्ञान, मनोविज्ञान और समाजशास्त्र के क्षेत्रों में बहुत महत्वपूर्ण हो सकता है।
जनसंख्या अनुपात का अनुमान z -अंतराल में एक-सांख्यिकी अनुपात के रूप में ज्ञात आत्मविश्वास अंतराल के उपयोग के माध्यम से लगाया जा सकता है जिसका सूत्र नीचे दिया गया है:
- यहाँ सांख्यिकी अनुपात है, सांख्यिकी का आकार है, और संकेतांक है जो अनुमान स्तर के लिए मानक साधारित वितरण के ऊपरी छिद्रान्वेषी मान है। .[5]
प्रमाण
एक-सांख्यिकी अनुपात Z-अंतराल के लिए सूत्र निर्धारित करने के लिए, सांख्यिकी अनुपातों के एक सांख्यिकी संग्रह का ध्यान देना आवश्यक होता है। सांख्यिकी अनुपातों के सांख्यिकी संग्रह की साधारित औसत सामान्यतः के रूप में दर्शाया जाता है।[2]
क्योंकि का मान अज्ञात होता है, इसलिए के लिए एक निष्पक्ष सांख्यिकीय आंकड़ा का उपयोग किया जाएगा। औसत और मानक विचलन इस प्रकार से पुनः लिखे जाते हैं:
- और केंद्रीय सीमा सिद्धांत को आह्वान करते हुए, सांख्यिकी अनुपातों का सांख्यिकी संग्रह लगभग सामान्य वितरण का होता है—प्रदान कि सांख्यिकी पर्याप्त बड़ा हो और विकृतिहीन हो।
मान लीजिए कि निम्नलिखित संभाव्यता की गणना की जाती है:
- ,
यहां, है और मानक महत्वपूर्ण मान हैं
बीजगणितीय रूप से इस प्रकार पुनः लिखा जा सकता है:
ऊपर किए गए बीजगणित के माध्यम से, एक प्रमाणिका के मान के बीच में एक निश्चितता स्तर से स्पष्ट रूप से ज्ञात होता है।
- .
अनुमान के लिए शर्तें
सामान्य तौर पर, जनसंख्या अनुपात का अनुमान लगाने के लिए उपयोग किए जाने वाले सूत्र को ज्ञात संख्यात्मक मानों के प्रतिस्थापन की आवश्यकता होती है। यद्यपि, इन संख्यात्मक मानों को सूत्र में आँख बंद करके प्रतिस्थापित नहीं किया जा सकता क्योंकि सांख्यिकीय अनुमान के लिए आवश्यक है कि किसी अज्ञात पैरामीटर का अनुमान उचित हो। किसी पैरामीटर के अनुमान को उचित ठहराने के लिए, तीन शर्तें हैं जिन्हें सत्यापित करने की आवश्यकता है:
- डेटा की व्यक्तिगत अवलोकन को रुचिकर जनसंख्या के एक सरल यादृच्छिक आकड़ें से प्राप्त किया जाना चाहिए।
- डेटा के व्यक्तिगत अवलोकनों में सामान्यता (सांख्यिकी) प्रदर्शित होनी चाहिए। इसे निम्नलिखित परिभाषा से गणितीय रूप से सत्यापित किया जा सकता है:
यदि एक दिए गए यादृच्छिक प्रतिदर्श का आकार हो और उसका प्रतिदर्श अनुपात हो, तब यदि और , , तो डेटा की व्यक्तिगत अवलोकन सामान्यता को प्रदर्शित करेगा।
- डेटा के व्यक्तिगत अवलोकन एक-दूसरे पर निर्भर और स्वतंत्र चर होने चाहिए। इसे निम्नलिखित परिभाषा से गणितीय रूप से सत्यापित किया जा सकता है:
यदि रुचिकर जनसंख्या का आकार हो और जनसंख्या के एक सरल यादृच्छिक नमूने का प्रतिदर्श आकार हो, तब यदि हो, तो डेटा की व्यक्तिगत अवलोकन एक-दूसरे के निर्भर नहीं होंगे। अधिकांश सांख्यिकीय पाठ्यपुस्तकों में एसआरएस, सामान्यता और स्वतंत्रता की शर्तों को कभी-कभी अनुमान टूल बॉक्स की शर्तों के रूप में संदर्भित किया जाता है।
उदाहरण
मान लीजिए लोकतंत्र में राष्ट्रपति का चुनाव हो रहा है। लोकतंत्र की मतदाता आबादी में 400 पात्र मतदाताओं का एक यादृच्छिक सांख्यिकी दर्शाता है कि 272 मतदाता उम्मीदवार बी का समर्थन करते हैं। एक राजनीतिक वैज्ञानिक यह निर्धारित करना चाहता है कि मतदाता आबादी का कितना प्रतिशत उम्मीदवार बी का समर्थन करता है।
राजनीतिक वैज्ञानिक के प्रश्न का उत्तर देने के लिए, इस लोकतंत्र में उम्मीदवार बी का समर्थन करने वाले योग्य मतदाताओं के जनसंख्या अनुपात को निर्धारित करने के लिए 95% के विश्वास स्तर के साथ जेड-अंतराल में एक-सांख्यिकी अनुपात का निर्माण किया जा सकता है।
समाधान
रैंडम सैंपल से ये पता चलता है कि मानक आकार के रूप में . संदर्भ के लिए एक विश्वसनीयता अंतराल निर्माण से पहले, संक्षेप में यांत्रिकी की शर्तें सत्यापित की जाएंगी।
- चुनावी जनसंख्या से 400 मतदाताओं का एक यादृच्छिक मानक प्राप्त किया गया है, इसलिए सरल यादृच्छिक मानकों की शर्त पूरी हुई है।
- यदि और , इसकी जांच की जाए तो और
- और
- सामान्य स्थिति की शर्त पूरी कर ली गई है।
- यदि इस लोकतंत्र में मतदाता जनसंख्या का आकार हो,और यदि . है, तो यदि , हो, तो अन्योन्यता होती है।
- इस लोकतंत्र के मतदाताओं के लिए जनसंख्या को कम से कम 4,000 माना जा सकता है। इसलिए, अन्योन्यता की शर्त पूरी हुई है।
यांत्रिकी की शर्तों की पुष्टि के बाद, एक विश्वसनीयता अंतराल निर्माण करना स्वीकार्य है।
यदि और समाधान के लिए , अभिव्यक्ति प्रयोग किया जाता है।
is used.
एक मानक साधारित वक्र की जांच करके, के मान को निर्धारित किया जा सकता है।जहां मानक स्कोर को पहचानकर स्टैंडर्ड नॉर्मल कर्व को 0.0250 की ऊपरी पूंछ भाग के क्षेत्र या 1 - 0.0250 = 0.9750 क्षेत्र को देता है। के मान को मानक साधारित संभावना की एक सारणी से भी ढूंढा जा सकता है।.
मानक साधारित संभावना की एक सारणी से, 0.9750 क्षेत्र देने वाले के मान हैं इसीलिए का 1.96 मान हैं।
अब , , के मानों को एक-नमूना अनुपात Z-अंतराल के लिए सूत्र में स्थानांतरित किया जा सकता है:
यांत्रिकी की शर्तों और एक-नमूना अनुपात Z-अंतराल के सूत्र के आधार पर, 95% विश्वसनीयता स्तर के साथ निष्कर्ष निकाला जा सकता है कि इस लोकतंत्र में मतदाता जनसंख्या का उम्मीदवार बी का समर्थन करने वाले वोटरों का प्रतिशत 63.429% से 72.571% के मध्य है।
विश्वसनीयता अंतराल सीमा में पैरामीटर का मान
अनुमानित सांख्यिकी में सामान्यतः पूछा जाने वाला प्रश्न यह है कि क्या पैरामीटर को विश्वसनीयता अंतराल के भीतर सम्मिलित किया गया है। इस प्रश्न का उत्तर देने का एकमात्र विधि जनगणना आयोजित करना है। ऊपर दिए गए उदाहरण का संदर्भ लेते हुए, जनसंख्या अनुपात विश्वसनीयता अंतराल की सीमा में होने की संभावना या तो 1 या 0 है। अर्थात, पैरामीटर अंतराल सीमा में सम्मिलित है या नहीं। विश्वसनीयता अंतराल का मुख्य उद्देश्य यह बेहतर ढंग से बताना है कि किसी पैरामीटर के लिए आदर्श मान संभवतः क्या हो सकता है।
अनुमान से सामान्य त्रुटियाँ और गलत व्याख्याएँ
एक विश्वसनीयता अंतराल के निर्माण से उत्पन्न एक बहुत सामान्य त्रुटि है कि विश्वसनीयता स्तर, जैसे , अर्थात 95% संभावना ये ग़लत है विश्वसनीयता स्तर सत्यापन की एक मापदंड पर आधारित होता है, न कि संभावना पर। इसलिए, के मान 0 और 1 के बीच, केवल यहीं तक सीमित होते हैं।
रैंक समुच्चय मानकों का उपयोग करके P का अनुमान
एक सामान्य यादृच्छिक मानक लेने के अतिरिक्त,श्रेणीबद्ध समुच्चय मानकों का चयन करके P का और अधिक सटीक अनुमान प्राप्त किया जा सकता है।[6][7]
यह भी देखें
- द्विपद अनुपात विश्वास अंतराल
- विश्वास अंतराल
- व्यापकता
- सांख्यिकीय परिकल्पना परीक्षण
- सांख्यिकीय निष्कर्ष
- सांख्यिकीय पैरामीटर
- सहिष्णुता अंतराल
संदर्भ
- ↑ Ott, R. Lyman (1993). सांख्यिकीय विधियों और डेटा विश्लेषण का परिचय. ISBN 0-534-93150-2.
- ↑ 2.0 2.1 2.2 Weisstein, Eric W. "नमूना अनुपात". mathworld.wolfram.com (in English). Retrieved 2020-08-22.
- ↑ "6.3: The Sample Proportion". Statistics LibreTexts (in English). 2014-04-16. Retrieved 2020-08-22.
- ↑ Weisstein, Eric (1998). सीआरसी गणित का संक्षिप्त विश्वकोश. Chapman & Hall/CRC. Bibcode:1998ccem.book.....W.
- ↑ Hinders, Duane (2008). एनोटेटेड शिक्षक संस्करण सांख्यिकी का अभ्यास. ISBN 978-0-7167-7703-8.
- ↑ Abbasi, Azhar Mehmood; Yousaf Shad, Muhammad (2021-05-15). "सहवर्ती आधारित रैंक सेट नमूने का उपयोग करके जनसंख्या अनुपात का अनुमान". Communications in Statistics - Theory and Methods. 51 (9): 2689–2709. doi:10.1080/03610926.2021.1916529. ISSN 0361-0926. S2CID 236554602.
- ↑ Abbasi, Azhar Mehmood; Shad, Muhammad Yousaf (2021-05-15). "सहवर्ती आधारित रैंक सेट नमूने का उपयोग करके जनसंख्या अनुपात का अनुमान". Communications in Statistics - Theory and Methods. 51 (9): 2689–2709. doi:10.1080/03610926.2021.1916529. ISSN 0361-0926. S2CID 236554602.