जनसंख्या अनुपात: Difference between revisions
(→समाधान) |
(→समाधान) |
||
Line 8: | Line 8: | ||
== गणितीय परिभाषा == | == गणितीय परिभाषा == | ||
[[File:SubsetMine.png|thumb|एक | [[File:SubsetMine.png|thumb|एक समुच्चय का वेन आरेख चित्रण <math>R</math> और इसका उपसमुच्चय <math>S</math>. कितना मापकर अनुपात की गणना की जा सकती है <math>S</math> में है <math>R</math>.]]एक [[अनुपात]] गणितीय रूप से परिभाषित है कि यह एक उपसमुच्चय <math>S</math> में तत्वों की योग्यता के अनुपात को एक समुच्चय <math>R</math> के आकार के साथ व्यक्त करता है। | ||
:<math>P= \frac{X}{N},</math> | :<math>P= \frac{X}{N},</math> | ||
यहां <math>X </math> जनसंख्या में सफलताओं की गिनती है, और <math>N </math> जनसंख्या का आकार है। | यहां <math>X </math> जनसंख्या में सफलताओं की गिनती है, और <math>N </math> जनसंख्या का आकार है। | ||
Line 174: | Line 174: | ||
\leq | \leq | ||
z^*</math>.]] | z^*</math>.]] | ||
[[चित्र:गुणात्मक औसत वक्र.png| | [[चित्र:गुणात्मक औसत वक्र.png||<math>Z \leq z^*</math>]] | ||
एक मानक साधारित वक्र की जांच करके, <math>z^</math> के मान को निर्धारित किया जा सकता | एक मानक साधारित वक्र की जांच करके,[[चित्र:गुणात्मक औसत वक्र.png|<math>Z \leq z^*</math>]] के मान को निर्धारित किया जा सकता है।जहां मानक स्कोर को पहचानकर स्टैंडर्ड नॉर्मल कर्व को 0.0250 की ऊपरी पूंछ भाग के क्षेत्र या 1 - 0.0250 = 0.9750 क्षेत्र को देता है। <math>z^*</math>के मान को मानक साधारित संभावना की एक सारणी से भी ढूंढा जा सकता है।. | ||
<math>\hat{p}=0.68</math>, <math>n=400</math>, <math>z^*=1.96</math> के मानों को एक-नमूना अनुपात Z-अंतराल के लिए सूत्र में स्थानांतरित किया जा सकता है: | मानक साधारित संभावना की एक सारणी से, 0.9750 क्षेत्र देने वाले <math>Z</math> के मान हैं इसीलिए <math>z^*</math>का 1.96 मान हैं। | ||
अब <math>\hat{p}=0.68</math>, <math>n=400</math>, <math>z^*=1.96</math> के मानों को एक-नमूना अनुपात Z-अंतराल के लिए सूत्र में स्थानांतरित किया जा सकता है: | |||
<math>\hat{p} | <math>\hat{p} | ||
Line 198: | Line 198: | ||
\bigl(0.63429,0.72571\bigr)</math> | \bigl(0.63429,0.72571\bigr)</math> | ||
यांत्रिकी की शर्तों और एक-नमूना अनुपात Z-अंतराल के सूत्र के आधार पर, 95% विश्वसनीयता स्तर के साथ निष्कर्ष निकाला जा सकता है कि इस लोकतंत्र में मतदाता जनसंख्या का उम्मीदवार बी का समर्थन करने वाले वोटरों का प्रतिशत 63.429% से 72.571% के | यांत्रिकी की शर्तों और एक-नमूना अनुपात Z-अंतराल के सूत्र के आधार पर, 95% विश्वसनीयता स्तर के साथ निष्कर्ष निकाला जा सकता है कि इस लोकतंत्र में मतदाता जनसंख्या का उम्मीदवार बी का समर्थन करने वाले वोटरों का प्रतिशत 63.429% से 72.571% के मध्य है। | ||
[[Category:Articles with hatnote templates targeting a nonexistent page]] | [[Category:Articles with hatnote templates targeting a nonexistent page]] | ||
Line 211: | Line 211: | ||
[[Category:Templates that add a tracking category]] | [[Category:Templates that add a tracking category]] | ||
=== | === विश्वसनीयता अंतराल सीमा में पैरामीटर का मान === | ||
अनुमानित | अनुमानित सांख्यिकी में सामान्यतः पूछा जाने वाला प्रश्न यह है कि क्या पैरामीटर को विश्वसनीयता अंतराल के भीतर सम्मिलित किया गया है। इस प्रश्न का उत्तर देने का एकमात्र विधि जनगणना आयोजित करना है। ऊपर दिए गए उदाहरण का संदर्भ लेते हुए, जनसंख्या अनुपात विश्वसनीयता अंतराल की सीमा में होने की संभावना या तो 1 या 0 है। अर्थात, पैरामीटर अंतराल सीमा में सम्मिलित है या नहीं। विश्वसनीयता अंतराल का मुख्य उद्देश्य यह बेहतर ढंग से बताना है कि किसी पैरामीटर के लिए आदर्श मान संभवतः क्या हो सकता है। | ||
=== अनुमान से सामान्य त्रुटियाँ और गलत व्याख्याएँ === | === अनुमान से सामान्य त्रुटियाँ और गलत व्याख्याएँ === | ||
एक विश्वसनीयता अंतराल के निर्माण से उत्पन्न एक बहुत सामान्य त्रुटि है कि विश्वसनीयता स्तर, जैसे <math>C | |||
= | = | ||
95%</math>, | 95%</math>, अर्थात 95% संभावना ये ग़लत है विश्वसनीयता स्तर सत्यापन की एक मापदंड पर आधारित होता है, न कि संभावना पर। इसलिए, <math>C</math> के मान 0 और 1 के बीच, केवल यहीं तक सीमित होते हैं। | ||
=== रैंक | === रैंक समुच्चय मानकों का उपयोग करके P का अनुमान === | ||
एक सामान्य यादृच्छिक मानक लेने के अतिरिक्त,श्रेणीबद्ध समुच्चय मानकों का चयन करके P का और अधिक सटीक अनुमान प्राप्त किया जा सकता है।<ref>{{Cite journal|last1=Abbasi|first1=Azhar Mehmood|last2=Yousaf Shad|first2=Muhammad|date=2021-05-15|title=सहवर्ती आधारित रैंक सेट नमूने का उपयोग करके जनसंख्या अनुपात का अनुमान|url=https://www.tandfonline.com/doi/ref/10.1080/03610926.2021.1916529|journal=Communications in Statistics - Theory and Methods|volume=51 |issue=9 |pages=2689–2709|doi=10.1080/03610926.2021.1916529|s2cid=236554602|issn=0361-0926}}</ref><ref>{{Cite journal|last1=Abbasi|first1=Azhar Mehmood|last2=Shad|first2=Muhammad Yousaf|date=2021-05-15|title=सहवर्ती आधारित रैंक सेट नमूने का उपयोग करके जनसंख्या अनुपात का अनुमान|url=https://doi.org/10.1080/03610926.2021.1916529|journal=Communications in Statistics - Theory and Methods|volume=51 |issue=9 |pages=2689–2709|doi=10.1080/03610926.2021.1916529|s2cid=236554602|issn=0361-0926}}</ref> | |||
Revision as of 12:00, 14 July 2023
सांख्यिकी में, जनसंख्या अनुपात सामान्यतः या यूनानी वर्णमाला Pi (π) से दर्शाया जाता है, जो जनसंख्या से संबंधित प्रतिशत मान का विवरण करता है। उदाहरण के रूप में, 2010 के संयुक्त राज्य जनगणना ने दिखाया कि अमेरिकी जनसंख्या के 83.7% को हिस्पैनिक या लैटिनो होने के रूप में की गई थी; 837 की मान्यता एक जनसंख्या अनुपात है। सामान्य रूप से, जनसंख्या अनुपात और अन्य जनसंख्या प्रामाणिकाएं अज्ञात होती हैं। जनसंख्या मापदंडों का वास्तविक मूल्य निर्धारित करने के लिए जनगणना आयोजित की जा सकती है जिससे जनसंख्या प्रामाणिका का वास्तविक मान निर्धारित किया जा सके, परंतु प्रायः जनगणना आर्थिक और समय के अधिकार कारणों से संभव नहीं होती है।
जनसंख्या अनुपात का अनुमान सामान्यतः एक अवलोकन अध्ययन या प्रयोग से प्राप्त पूर्वाग्रह सांख्यिकी के माध्यम से लगाया जाता है। उदाहरण के लिए, राष्ट्रीय प्रौद्योगिकी साक्षरता सम्मेलन ने 2,000 वयस्कों का एक राष्ट्रीय सर्वेक्षण आयोजित किया था जिससे ऐसे वयस्कों का प्रतिशत निर्धारित किया जा सके जो आर्थिक रूप से अशिक्षित हैं। इस अध्ययन से पता चला कि 2,000 वयस्कों में से 72% को यह समझ में नहीं आया कि सकल घरेलू उत्पाद क्या है।[1] 72% का मान एक सांख्यिकी अनुपात है। सांख्यिकी अनुपात को सामान्यतः से दर्शाया जाता है और कुछ पाठ्यपुस्तकों में से भी दर्शाया जाता है। [2][3]
गणितीय परिभाषा
एक अनुपात गणितीय रूप से परिभाषित है कि यह एक उपसमुच्चय में तत्वों की योग्यता के अनुपात को एक समुच्चय के आकार के साथ व्यक्त करता है।
यहां जनसंख्या में सफलताओं की गिनती है, और जनसंख्या का आकार है।
यह गणितीय परिभाषा सामान्यता प्राप्त करके सांख्यिकी अनुपात की परिभाषा प्रदान करती है:
यहां सांख्यिकी में सफलताओं की गिनती है, और सांख्यिकी का आकार है जो जनसंख्या से प्राप्त होता है।[4][2]
अनुमान
अनुमानित सांख्यिकी में अध्ययन का एक मुख्य ध्येय प्रामाणिका के "सच्चे" मान का निर्धारण करना है। सामान्यतः, एक निश्चित प्रामाणिका के वास्तविक मान को नहीं पाया जा सकता है, जब तक अध्ययन की जनसंख्या पर एक जनगणना नहीं होती है। यद्यपि, यहां तक कि प्रामाणिका के लिए एक सार्वजनिक गणना की जाए, सांख्यिकीय विधियां हैं जो इसका उचित आंकलन प्राप्त करने के लिए प्रयोग की जा सकती हैं। इन विधियों में समायोजन अंतराल और अनुमानित मान की निश्चितता की परीक्षा सम्मिलित होती है।
जनसंख्या अनुपात के मूल्य का अनुमान लगाना कृषि, व्यवसाय, अर्थशास्त्र, शिक्षा, अभियांत्रिकी, पर्यावरण अध्ययन, चिकित्सा, कानून, राजनीति विज्ञान, मनोविज्ञान और समाजशास्त्र के क्षेत्रों में बहुत महत्वपूर्ण हो सकता है।
जनसंख्या अनुपात का अनुमान z -अंतराल में एक-सांख्यिकी अनुपात के रूप में ज्ञात आत्मविश्वास अंतराल के उपयोग के माध्यम से लगाया जा सकता है जिसका सूत्र नीचे दिया गया है:
- यहाँ सांख्यिकी अनुपात है, सांख्यिकी का आकार है, और संकेतांक है जो अनुमान स्तर के लिए मानक साधारित वितरण के ऊपरी छिद्रान्वेषी मान है। .[5]
प्रमाण
एक-सांख्यिकी अनुपात Z-अंतराल के लिए सूत्र निर्धारित करने के लिए, सांख्यिकी अनुपातों के एक सांख्यिकी संग्रह का ध्यान देना आवश्यक होता है। सांख्यिकी अनुपातों के सांख्यिकी संग्रह की साधारित औसत सामान्यतः के रूप में दर्शाया जाता है।[2]
क्योंकि का मान अज्ञात होता है, इसलिए के लिए एक निष्पक्ष सांख्यिकीय आंकड़ा का उपयोग किया जाएगा। औसत और मानक विचलन इस प्रकार से पुनः लिखे जाते हैं:
- और केंद्रीय सीमा सिद्धांत को आह्वान करते हुए, सांख्यिकी अनुपातों का सांख्यिकी संग्रह लगभग सामान्य वितरण का होता है—प्रदान कि सांख्यिकी पर्याप्त बड़ा हो और विकृतिहीन हो।
मान लीजिए कि निम्नलिखित संभाव्यता की गणना की जाती है:
- ,
यहां, है और मानक महत्वपूर्ण मान हैं
बीजगणितीय रूप से इस प्रकार पुनः लिखा जा सकता है:
ऊपर किए गए बीजगणित के माध्यम से, एक प्रमाणिका के मान के बीच में एक निश्चितता स्तर से स्पष्ट रूप से ज्ञात होता है।
- .
अनुमान के लिए शर्तें
सामान्य तौर पर, जनसंख्या अनुपात का अनुमान लगाने के लिए उपयोग किए जाने वाले सूत्र को ज्ञात संख्यात्मक मानों के प्रतिस्थापन की आवश्यकता होती है। यद्यपि, इन संख्यात्मक मानों को सूत्र में आँख बंद करके प्रतिस्थापित नहीं किया जा सकता क्योंकि सांख्यिकीय अनुमान के लिए आवश्यक है कि किसी अज्ञात पैरामीटर का अनुमान उचित हो। किसी पैरामीटर के अनुमान को उचित ठहराने के लिए, तीन शर्तें हैं जिन्हें सत्यापित करने की आवश्यकता है:
- डेटा की व्यक्तिगत अवलोकन को रुचिकर जनसंख्या के एक सरल यादृच्छिक आकड़ें से प्राप्त किया जाना चाहिए।
- डेटा के व्यक्तिगत अवलोकनों में सामान्यता (सांख्यिकी) प्रदर्शित होनी चाहिए। इसे निम्नलिखित परिभाषा से गणितीय रूप से सत्यापित किया जा सकता है:
यदि एक दिए गए यादृच्छिक प्रतिदर्श का आकार हो और उसका प्रतिदर्श अनुपात हो, तब यदि और , , तो डेटा की व्यक्तिगत अवलोकन सामान्यता को प्रदर्शित करेगा।
- डेटा के व्यक्तिगत अवलोकन एक-दूसरे पर निर्भर और स्वतंत्र चर होने चाहिए। इसे निम्नलिखित परिभाषा से गणितीय रूप से सत्यापित किया जा सकता है:
यदि रुचिकर जनसंख्या का आकार हो और जनसंख्या के एक सरल यादृच्छिक नमूने का प्रतिदर्श आकार हो, तब यदि हो, तो डेटा की व्यक्तिगत अवलोकन एक-दूसरे के निर्भर नहीं होंगे। अधिकांश सांख्यिकीय पाठ्यपुस्तकों में एसआरएस, सामान्यता और स्वतंत्रता की शर्तों को कभी-कभी अनुमान टूल बॉक्स की शर्तों के रूप में संदर्भित किया जाता है।
उदाहरण
मान लीजिए लोकतंत्र में राष्ट्रपति का चुनाव हो रहा है। लोकतंत्र की मतदाता आबादी में 400 पात्र मतदाताओं का एक यादृच्छिक सांख्यिकी दर्शाता है कि 272 मतदाता उम्मीदवार बी का समर्थन करते हैं। एक राजनीतिक वैज्ञानिक यह निर्धारित करना चाहता है कि मतदाता आबादी का कितना प्रतिशत उम्मीदवार बी का समर्थन करता है।
राजनीतिक वैज्ञानिक के प्रश्न का उत्तर देने के लिए, इस लोकतंत्र में उम्मीदवार बी का समर्थन करने वाले योग्य मतदाताओं के जनसंख्या अनुपात को निर्धारित करने के लिए 95% के विश्वास स्तर के साथ जेड-अंतराल में एक-सांख्यिकी अनुपात का निर्माण किया जा सकता है।
समाधान
रैंडम सैंपल से ये पता चलता है कि मानक आकार के रूप में . संदर्भ के लिए एक विश्वसनीयता अंतराल निर्माण से पहले, संक्षेप में यांत्रिकी की शर्तें सत्यापित की जाएंगी।
- चुनावी जनसंख्या से 400 मतदाताओं का एक यादृच्छिक मानक प्राप्त किया गया है, इसलिए सरल यादृच्छिक मानकों की शर्त पूरी हुई है।
- यदि और , इसकी जांच की जाए तो और
- और
- सामान्य स्थिति की शर्त पूरी कर ली गई है।
- यदि इस लोकतंत्र में मतदाता जनसंख्या का आकार हो,और यदि . है, तो यदि , हो, तो अन्योन्यता होती है।
- इस लोकतंत्र के मतदाताओं के लिए जनसंख्या को कम से कम 4,000 माना जा सकता है। इसलिए, अन्योन्यता की शर्त पूरी हुई है।
यांत्रिकी की शर्तों की पुष्टि के बाद, एक विश्वसनीयता अंतराल निर्माण करना स्वीकार्य है।
यदि और समाधान के लिए , अभिव्यक्ति प्रयोग किया जाता है।
is used.
एक मानक साधारित वक्र की जांच करके, के मान को निर्धारित किया जा सकता है।जहां मानक स्कोर को पहचानकर स्टैंडर्ड नॉर्मल कर्व को 0.0250 की ऊपरी पूंछ भाग के क्षेत्र या 1 - 0.0250 = 0.9750 क्षेत्र को देता है। के मान को मानक साधारित संभावना की एक सारणी से भी ढूंढा जा सकता है।.
मानक साधारित संभावना की एक सारणी से, 0.9750 क्षेत्र देने वाले के मान हैं इसीलिए का 1.96 मान हैं।
अब , , के मानों को एक-नमूना अनुपात Z-अंतराल के लिए सूत्र में स्थानांतरित किया जा सकता है:
यांत्रिकी की शर्तों और एक-नमूना अनुपात Z-अंतराल के सूत्र के आधार पर, 95% विश्वसनीयता स्तर के साथ निष्कर्ष निकाला जा सकता है कि इस लोकतंत्र में मतदाता जनसंख्या का उम्मीदवार बी का समर्थन करने वाले वोटरों का प्रतिशत 63.429% से 72.571% के मध्य है।
विश्वसनीयता अंतराल सीमा में पैरामीटर का मान
अनुमानित सांख्यिकी में सामान्यतः पूछा जाने वाला प्रश्न यह है कि क्या पैरामीटर को विश्वसनीयता अंतराल के भीतर सम्मिलित किया गया है। इस प्रश्न का उत्तर देने का एकमात्र विधि जनगणना आयोजित करना है। ऊपर दिए गए उदाहरण का संदर्भ लेते हुए, जनसंख्या अनुपात विश्वसनीयता अंतराल की सीमा में होने की संभावना या तो 1 या 0 है। अर्थात, पैरामीटर अंतराल सीमा में सम्मिलित है या नहीं। विश्वसनीयता अंतराल का मुख्य उद्देश्य यह बेहतर ढंग से बताना है कि किसी पैरामीटर के लिए आदर्श मान संभवतः क्या हो सकता है।
अनुमान से सामान्य त्रुटियाँ और गलत व्याख्याएँ
एक विश्वसनीयता अंतराल के निर्माण से उत्पन्न एक बहुत सामान्य त्रुटि है कि विश्वसनीयता स्तर, जैसे , अर्थात 95% संभावना ये ग़लत है विश्वसनीयता स्तर सत्यापन की एक मापदंड पर आधारित होता है, न कि संभावना पर। इसलिए, के मान 0 और 1 के बीच, केवल यहीं तक सीमित होते हैं।
रैंक समुच्चय मानकों का उपयोग करके P का अनुमान
एक सामान्य यादृच्छिक मानक लेने के अतिरिक्त,श्रेणीबद्ध समुच्चय मानकों का चयन करके P का और अधिक सटीक अनुमान प्राप्त किया जा सकता है।[6][7]
यह भी देखें
- द्विपद अनुपात विश्वास अंतराल
- विश्वास अंतराल
- व्यापकता
- सांख्यिकीय परिकल्पना परीक्षण
- सांख्यिकीय निष्कर्ष
- सांख्यिकीय पैरामीटर
- सहिष्णुता अंतराल
संदर्भ
- ↑ Ott, R. Lyman (1993). सांख्यिकीय विधियों और डेटा विश्लेषण का परिचय. ISBN 0-534-93150-2.
- ↑ 2.0 2.1 2.2 Weisstein, Eric W. "नमूना अनुपात". mathworld.wolfram.com (in English). Retrieved 2020-08-22.
- ↑ "6.3: The Sample Proportion". Statistics LibreTexts (in English). 2014-04-16. Retrieved 2020-08-22.
- ↑ Weisstein, Eric (1998). सीआरसी गणित का संक्षिप्त विश्वकोश. Chapman & Hall/CRC. Bibcode:1998ccem.book.....W.
- ↑ Hinders, Duane (2008). एनोटेटेड शिक्षक संस्करण सांख्यिकी का अभ्यास. ISBN 978-0-7167-7703-8.
- ↑ Abbasi, Azhar Mehmood; Yousaf Shad, Muhammad (2021-05-15). "सहवर्ती आधारित रैंक सेट नमूने का उपयोग करके जनसंख्या अनुपात का अनुमान". Communications in Statistics - Theory and Methods. 51 (9): 2689–2709. doi:10.1080/03610926.2021.1916529. ISSN 0361-0926. S2CID 236554602.
- ↑ Abbasi, Azhar Mehmood; Shad, Muhammad Yousaf (2021-05-15). "सहवर्ती आधारित रैंक सेट नमूने का उपयोग करके जनसंख्या अनुपात का अनुमान". Communications in Statistics - Theory and Methods. 51 (9): 2689–2709. doi:10.1080/03610926.2021.1916529. ISSN 0361-0926. S2CID 236554602.