जनसंख्या अनुपात

सांख्यिकी में, जनसंख्या अनुपात सामान्यतः $P$ या यूनानी वर्णमाला Pi (π) से दर्शाया जाता है, जो जनसंख्या से संबंधित प्रतिशत मान का विवरण करता है। उदाहरण के रूप में, 2010 के संयुक्त राज्य जनगणना ने दिखाया कि अमेरिकी जनसंख्या के 83.7% को हिस्पैनिक या लैटिनो होने के रूप में की गई थी; 837 की मान्यता एक जनसंख्या अनुपात है। सामान्य रूप से, जनसंख्या अनुपात और अन्य जनसंख्या प्रामाणिकाएं अज्ञात होती हैं। जनसंख्या मापदंडों का वास्तविक मूल्य निर्धारित करने के लिए जनगणना आयोजित की जा सकती है जिससे जनसंख्या प्रामाणिका का वास्तविक मान निर्धारित किया जा सके, परंतु प्रायः जनगणना आर्थिक और समय के अधिकार कारणों से संभव नहीं होती है।

जनसंख्या अनुपात का अनुमान सामान्यतः एक अवलोकन अध्ययन या प्रयोग से प्राप्त पूर्वाग्रह सांख्यिकी के माध्यम से लगाया जाता है। उदाहरण के लिए, राष्ट्रीय प्रौद्योगिकी साक्षरता सम्मेलन ने 2,000 वयस्कों का एक राष्ट्रीय सर्वेक्षण आयोजित किया था जिससे ऐसे वयस्कों का प्रतिशत निर्धारित किया जा सके जो आर्थिक रूप से अशिक्षित हैं। इस अध्ययन से पता चला कि 2,000 वयस्कों में से 72% को यह समझ में नहीं आया कि सकल घरेलू उत्पाद क्या है।^[1] 72% का मान एक सांख्यिकी अनुपात है। सांख्यिकी अनुपात को सामान्यतः ${\hat {p}}$ से दर्शाया जाता है और कुछ पाठ्यपुस्तकों में $p$ से भी दर्शाया जाता है। ^[2]^[3]

गणितीय परिभाषा

एक सेट का वेन आरेख चित्रण

R

और इसका उपसमुच्चय

S

. कितना मापकर अनुपात की गणना की जा सकती है

S

में है

R

.

एक अनुपात गणितीय रूप से परिभाषित है कि यह एक उपसमुच्चय $S$ में तत्वों की योग्यता के अनुपात को एक समुच्चय $R$ के आकार के साथ व्यक्त करता है।

P={\frac {X}{N}},

यहां $X$ जनसंख्या में सफलताओं की गिनती है, और $N$ जनसंख्या का आकार है।

यह गणितीय परिभाषा सामान्यता प्राप्त करके सांख्यिकी अनुपात की परिभाषा प्रदान करती है:

{\hat {p}}={\frac {x}{n}}

यहां $x$ सांख्यिकी में सफलताओं की गिनती है, और $n$ सांख्यिकी का आकार है जो जनसंख्या से प्राप्त होता है।^[4]^[2]

अनुमान

अनुमानित सांख्यिकी में अध्ययन का एक मुख्य ध्येय प्रामाणिका के "सच्चे" मान का निर्धारण करना है। सामान्यतः, एक निश्चित प्रामाणिका के वास्तविक मान को नहीं पाया जा सकता है, जब तक अध्ययन की जनसंख्या पर एक जनगणना नहीं होती है। यद्यपि, यहां तक कि प्रामाणिका के लिए एक सार्वजनिक गणना की जाए, सांख्यिकीय विधियां हैं जो इसका उचित आंकलन प्राप्त करने के लिए प्रयोग की जा सकती हैं। इन विधियों में समायोजन अंतराल और अनुमानित मान की निश्चितता की परीक्षा सम्मिलित होती है।

जनसंख्या अनुपात के मूल्य का अनुमान लगाना कृषि, व्यवसाय, अर्थशास्त्र, शिक्षा, अभियांत्रिकी, पर्यावरण अध्ययन, चिकित्सा, कानून, राजनीति विज्ञान, मनोविज्ञान और समाजशास्त्र के क्षेत्रों में बहुत महत्वपूर्ण हो सकता है।

जनसंख्या अनुपात का अनुमान z -अंतराल में एक-सांख्यिकी अनुपात के रूप में ज्ञात आत्मविश्वास अंतराल के उपयोग के माध्यम से लगाया जा सकता है जिसका सूत्र नीचे दिया गया है:

{\hat {p}}\pm z^{*}{\sqrt {\frac {{\hat {p}}(1-{\hat {p}})}{n}}}

यहाँ

{\hat {p}}

सांख्यिकी अनुपात है,

n

सांख्यिकी का आकार है, और

z^{*}

संकेतांक है जो अनुमान स्तर

C

के लिए मानक साधारित वितरण के ऊपरी

{\frac {1-C}{2}}

छिद्रान्वेषी मान है। .^[5]

प्रमाण

एक-सांख्यिकी अनुपात Z-अंतराल के लिए सूत्र निर्धारित करने के लिए, सांख्यिकी अनुपातों के एक सांख्यिकी संग्रह का ध्यान देना आवश्यक होता है। सांख्यिकी अनुपातों के सांख्यिकी संग्रह की साधारित औसत सामान्यतः $\mu _{\hat {p}}$ के रूप में दर्शाया जाता है।^[2]

\sigma _{\hat {p}}={\sqrt {\frac {P(1-P)}{n}}}

क्योंकि $P$ का मान अज्ञात होता है, इसलिए $P$ के लिए एक निष्पक्ष सांख्यिकीय आंकड़ा ${\hat {p}}$ का उपयोग किया जाएगा। औसत और मानक विचलन इस प्रकार से पुनः लिखे जाते हैं:

\mu _{\hat {p}}={\hat {p}}

और

\sigma _{\hat {p}}={\sqrt {\frac {{\hat {p}}(1-{\hat {p}})}{n}}}

केंद्रीय सीमा सिद्धांत को आह्वान करते हुए, सांख्यिकी अनुपातों का सांख्यिकी संग्रह लगभग सामान्य वितरण का होता है—प्रदान कि सांख्यिकी पर्याप्त बड़ा हो और विकृतिहीन हो।

मान लीजिए कि निम्नलिखित संभाव्यता की गणना की जाती है:

P(-z^{*}<{\frac {{\hat {p}}-P}{\sqrt {\frac {{\hat {p}}(1-{\hat {p}})}{n}}}}<z^{*})=C

,

यहां, $0<C<1$ है और $\pm z^{*}$ मानक महत्वपूर्ण मान हैं

-z^{*}<{\frac {{\hat {p}}-P}{\sqrt {\frac {{\hat {p}}(1-{\hat {p}})}{n}}}}<z^{*}

बीजगणितीय रूप से इस प्रकार पुनः लिखा जा सकता है:

-z^{*}<{\frac {{\hat {p}}-P}{\sqrt {\frac {{\hat {p}}(1-{\hat {p}})}{n}}}}<z^{*}\Rightarrow -z^{*}{\sqrt {\frac {{\hat {p}}(1-{\hat {p}})}{n}}}<{\hat {p}}-P<z^{*}{\sqrt {\frac {{\hat {p}}(1-{\hat {p}})}{n}}}\Rightarrow -{\hat {p}}-z^{*}{\sqrt {\frac {{\hat {p}}(1-{\hat {p}})}{n}}}<-P<-{\hat {p}}+z^{*}{\sqrt {\frac {{\hat {p}}(1-{\hat {p}})}{n}}}\Rightarrow {\hat {p}}-z^{*}{\sqrt {\frac {{\hat {p}}(1-{\hat {p}})}{n}}}<P<{\hat {p}}+z^{*}{\sqrt {\frac {{\hat {p}}(1-{\hat {p}})}{n}}}

ऊपर किए गए बीजगणित के माध्यम से, एक प्रमाणिका $P$ के मान के बीच में एक निश्चितता स्तर $C$ से स्पष्ट रूप से ज्ञात होता है।

{\hat {p}}\pm z^{*}{\sqrt {\frac {{\hat {p}}(1-{\hat {p}})}{n}}}

.

अनुमान के लिए शर्तें

सामान्य तौर पर, जनसंख्या अनुपात का अनुमान लगाने के लिए उपयोग किए जाने वाले सूत्र को ज्ञात संख्यात्मक मानों के प्रतिस्थापन की आवश्यकता होती है। यद्यपि, इन संख्यात्मक मानों को सूत्र में आँख बंद करके प्रतिस्थापित नहीं किया जा सकता क्योंकि सांख्यिकीय अनुमान के लिए आवश्यक है कि किसी अज्ञात पैरामीटर का अनुमान उचित हो। किसी पैरामीटर के अनुमान को उचित ठहराने के लिए, तीन शर्तें हैं जिन्हें सत्यापित करने की आवश्यकता है:

डेटा की व्यक्तिगत अवलोकन को रुचिकर जनसंख्या के एक सरल यादृच्छिक आकड़ें से प्राप्त किया जाना चाहिए।
डेटा के व्यक्तिगत अवलोकनों में सामान्यता (सांख्यिकी) प्रदर्शित होनी चाहिए। इसे निम्नलिखित परिभाषा से गणितीय रूप से सत्यापित किया जा सकता है:

यदि एक दिए गए यादृच्छिक प्रतिदर्श का आकार $n$ हो और उसका प्रतिदर्श अनुपात ${\hat {p}}$ हो, तब यदि $n{\hat {p}}\geq 10$ और , $n(1-{\hat {p}})\geq 10$ , तो डेटा की व्यक्तिगत अवलोकन सामान्यता को प्रदर्शित करेगा।

डेटा के व्यक्तिगत अवलोकन एक-दूसरे पर निर्भर और स्वतंत्र चर होने चाहिए। इसे निम्नलिखित परिभाषा से गणितीय रूप से सत्यापित किया जा सकता है:

यदि रुचिकर जनसंख्या का आकार $N$ हो और जनसंख्या के एक सरल यादृच्छिक नमूने का प्रतिदर्श आकार $n$ हो, तब यदि $N\geq 10n$ हो, तो डेटा की व्यक्तिगत अवलोकन एक-दूसरे के निर्भर नहीं होंगे। अधिकांश सांख्यिकीय पाठ्यपुस्तकों में एसआरएस, सामान्यता और स्वतंत्रता की शर्तों को कभी-कभी अनुमान टूल बॉक्स की शर्तों के रूप में संदर्भित किया जाता है।

उदाहरण

मान लीजिए लोकतंत्र में राष्ट्रपति का चुनाव हो रहा है। लोकतंत्र की मतदाता आबादी में 400 पात्र मतदाताओं का एक यादृच्छिक सांख्यिकी दर्शाता है कि 272 मतदाता उम्मीदवार बी का समर्थन करते हैं। एक राजनीतिक वैज्ञानिक यह निर्धारित करना चाहता है कि मतदाता आबादी का कितना प्रतिशत उम्मीदवार बी का समर्थन करता है।

राजनीतिक वैज्ञानिक के प्रश्न का उत्तर देने के लिए, इस लोकतंत्र में उम्मीदवार बी का समर्थन करने वाले योग्य मतदाताओं के जनसंख्या अनुपात को निर्धारित करने के लिए 95% के विश्वास स्तर के साथ जेड-अंतराल में एक-सांख्यिकी अनुपात का निर्माण किया जा सकता है।

समाधान

रैंडम सैंपल से ये पता चलता है कि ${\hat {p}}={\frac {272}{400}}=0.68$ मानक आकार के रूप में $n=400$ . संदर्भ के लिए एक विश्वसनीयता अंतराल निर्माण से पहले, संक्षेप में यांत्रिकी की शर्तें सत्यापित की जाएंगी।

चुनावी जनसंख्या से 400 मतदाताओं का एक यादृच्छिक मानक प्राप्त किया गया है, इसलिए सरल यादृच्छिक मानकों की शर्त पूरी हुई है।
यदि $n=400$ और ${\hat {p}}=0.68$ , इसकी जांच की जाए तो $n{\hat {p}}\geq 10$ और $n(1-{\hat {p}})\geq 10$

(400)(0.68)\geq 10\Rightarrow 272\geq 10

और

(400)(1-0.68)\geq 10\Rightarrow 128\geq 10

सामान्य स्थिति की शर्त पूरी कर ली गई है।

यदि इस लोकतंत्र में मतदाता जनसंख्या का आकार $N$ हो,और यदि $n=400$ . है, तो यदि $N\geq 10n$ , हो, तो अन्योन्यता होती है।

N\geq 10(400)\Rightarrow N\geq 4000

इस लोकतंत्र के मतदाताओं के लिए जनसंख्या

N

को कम से कम 4,000 माना जा सकता है। इसलिए, अन्योन्यता की शर्त पूरी हुई है।

यांत्रिकी की शर्तों की पुष्टि के बाद, एक विश्वसनीयता अंतराल निर्माण करना स्वीकार्य है।

यदि ${\hat {p}}=0.68,n=400,$ और $C=0.95$ समाधान के लिए $z^{*}$ , अभिव्यक्ति ${\frac {1-C}{2}}$ प्रयोग किया जाता है।

${\frac {1-C}{2}}={\frac {1-0.95}{2}}={\frac {0.05}{2}}=0.0250$

मानक सामान्य वक्र के साथ

z^{*}

जो 0.0250 का ऊपरी पूंछ क्षेत्र और 0.9750 का क्षेत्र देता है

Z\leq z^{*}

.

The standard normal curve with

z^{*}

which gives an upper tail area of 0.0250 and an area of 0.9750 for

Z\leq z^{*}

.

A table with standard normal probabilities for

Z\leq z

.

By examining a standard normal bell curve, the value for $z^{*}$ can be determined by identifying which standard score gives the standard normal curve an upper tail area of 0.0250 or an area of 1 - 0.0250 = 0.9750. The value for $z^{*}$ can also be found through a table of standard normal probabilities. मानक साधारित संभावना की एक सारणी से, 0.9750 क्षेत्र देने वाले $Z$ के मान हैं 1.96। इसलिए, $Z$ के मान हैं 1.96। इसलिए, $z^{*}$ के मान हैं 1.96।]]

${\hat {p}}=0.68$ , $n=400$ , $z^{*}=1.96$ के मानों को एक-नमूना अनुपात Z-अंतराल के लिए सूत्र में स्थानांतरित किया जा सकता है:

${\hat {p}}\pm z^{*}{\sqrt {\frac {{\hat {p}}(1-{\hat {p}})}{n}}}\Rightarrow (0.68)\pm (1.96){\sqrt {\frac {(0.68)(1-0.68)}{(400)}}}\Rightarrow 0.68\pm 1.96{\sqrt {0.000544}}$ $\Rightarrow {\bigl (}0.63429,0.72571{\bigr )}$

यांत्रिकी की शर्तों और एक-नमूना अनुपात Z-अंतराल के सूत्र के आधार पर, 95% विश्वसनीयता स्तर के साथ निष्कर्ष निकाला जा सकता है कि इस लोकतंत्र में मतदाता जनसंख्या का उम्मीदवार बी का समर्थन करने वाले वोटरों का प्रतिशत 63.429% से 72.571% के बीच है।

कॉन्फिडेंस इंटरवल रेंज में पैरामीटर का मान

अनुमानित आँकड़ों में आमतौर पर पूछा जाने वाला प्रश्न यह है कि क्या पैरामीटर को विश्वास अंतराल के भीतर शामिल किया गया है। इस प्रश्न का उत्तर देने का एकमात्र तरीका जनगणना आयोजित करना है। ऊपर दिए गए उदाहरण का संदर्भ लेते हुए, जनसंख्या अनुपात विश्वास अंतराल की सीमा में होने की संभावना या तो 1 या 0 है। यानी, पैरामीटर अंतराल सीमा में शामिल है या नहीं। कॉन्फिडेंस इंटरवल का मुख्य उद्देश्य यह बेहतर ढंग से बताना है कि किसी पैरामीटर के लिए आदर्श मान संभवतः क्या हो सकता है।

अनुमान से सामान्य त्रुटियाँ और गलत व्याख्याएँ

आत्मविश्वास अंतराल के निर्माण से उत्पन्न होने वाली एक बहुत ही सामान्य त्रुटि यह विश्वास है कि आत्मविश्वास का स्तर, जैसे $C=95\%$ , मतलब 95% संभावना. ये ग़लत है. आत्मविश्वास का स्तर निश्चितता के माप पर आधारित है, संभावना पर नहीं। इसलिए, के मूल्य $C$ विशेष रूप से 0 और 1 के बीच गिरना।

रैंक सेट सैंपलिंग का उपयोग करके पी का अनुमान

सरल यादृच्छिक नमूने के बजाय रैंक सेट सांख्यिकी करण चुनकर पी का अधिक सटीक अनुमान प्राप्त किया जा सकता है^[6]^[7]

यह भी देखें

द्विपद अनुपात विश्वास अंतराल
विश्वास अंतराल
व्यापकता
सांख्यिकीय परिकल्पना परीक्षण
सांख्यिकीय निष्कर्ष
सांख्यिकीय पैरामीटर
सहिष्णुता अंतराल

संदर्भ

↑ Ott, R. Lyman (1993). सांख्यिकीय विधियों और डेटा विश्लेषण का परिचय. ISBN 0-534-93150-2.
↑ ^2.0 ^2.1 ^2.2 Weisstein, Eric W. "नमूना अनुपात". mathworld.wolfram.com (in English). Retrieved 2020-08-22.
↑ "6.3: The Sample Proportion". Statistics LibreTexts (in English). 2014-04-16. Retrieved 2020-08-22.
↑ Weisstein, Eric (1998). सीआरसी गणित का संक्षिप्त विश्वकोश. Chapman & Hall/CRC. Bibcode:1998ccem.book.....W.
↑ Hinders, Duane (2008). एनोटेटेड शिक्षक संस्करण सांख्यिकी का अभ्यास. ISBN 978-0-7167-7703-8.
↑ Abbasi, Azhar Mehmood; Yousaf Shad, Muhammad (2021-05-15). "सहवर्ती आधारित रैंक सेट नमूने का उपयोग करके जनसंख्या अनुपात का अनुमान". Communications in Statistics - Theory and Methods. 51 (9): 2689–2709. doi:10.1080/03610926.2021.1916529. ISSN 0361-0926. S2CID 236554602.
↑ Abbasi, Azhar Mehmood; Shad, Muhammad Yousaf (2021-05-15). "सहवर्ती आधारित रैंक सेट नमूने का उपयोग करके जनसंख्या अनुपात का अनुमान". Communications in Statistics - Theory and Methods. 51 (9): 2689–2709. doi:10.1080/03610926.2021.1916529. ISSN 0361-0926. S2CID 236554602.

[1] Ott, R. Lyman (1993). सांख्यिकीय विधियों और डेटा विश्लेषण का परिचय. ISBN 0-534-93150-2.

[:0-2] 2.0 ^2.1 ^2.2 Weisstein, Eric W. "नमूना अनुपात". mathworld.wolfram.com (in English). Retrieved 2020-08-22.

[3] "6.3: The Sample Proportion". Statistics LibreTexts (in English). 2014-04-16. Retrieved 2020-08-22.

[4] Weisstein, Eric (1998). सीआरसी गणित का संक्षिप्त विश्वकोश. Chapman & Hall/CRC. Bibcode:1998ccem.book.....W.

[5] Hinders, Duane (2008). एनोटेटेड शिक्षक संस्करण सांख्यिकी का अभ्यास. ISBN 978-0-7167-7703-8.

[6] Abbasi, Azhar Mehmood; Yousaf Shad, Muhammad (2021-05-15). "सहवर्ती आधारित रैंक सेट नमूने का उपयोग करके जनसंख्या अनुपात का अनुमान". Communications in Statistics - Theory and Methods. 51 (9): 2689–2709. doi:10.1080/03610926.2021.1916529. ISSN 0361-0926. S2CID 236554602.

[7] Abbasi, Azhar Mehmood; Shad, Muhammad Yousaf (2021-05-15). "सहवर्ती आधारित रैंक सेट नमूने का उपयोग करके जनसंख्या अनुपात का अनुमान". Communications in Statistics - Theory and Methods. 51 (9): 2689–2709. doi:10.1080/03610926.2021.1916529. ISSN 0361-0926. S2CID 236554602.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

Anonymous

Search

जनसंख्या अनुपात

Namespaces

More

Page actions

Contents

गणितीय परिभाषा