प्रतिचयन त्रुटि: Difference between revisions

From Vigyanwiki
(Created page with "{{Short description|Statistical error}} आँकड़ों में, नमूनाकरण त्रुटियां तब होती हैं जब एक स...")
 
No edit summary
Line 1: Line 1:
{{Short description|Statistical error}}
{{Short description|Statistical error}}
आँकड़ों में, नमूनाकरण त्रुटियां तब होती हैं जब एक [[सांख्यिकीय जनसंख्या]] की सांख्यिकीय विशेषताओं का अनुमान उस जनसंख्या के एक सबसेट, या नमूने (सांख्यिकी) से लगाया जाता है। चूंकि नमूने में जनसंख्या के सभी सदस्य शामिल नहीं होते हैं, नमूने के [[आंकड़े]] (अक्सर अनुमानक के रूप में जाने जाते हैं), जैसे साधन और चतुर्थक, आम तौर पर पूरी आबादी के आंकड़ों से भिन्न होते हैं (सांख्यिकीय_पैरामीटर के रूप में जाना जाता है)। नमूना आंकड़े और जनसंख्या पैरामीटर के बीच के अंतर को नमूनाकरण [[त्रुटियां और अवशेष]] माना जाता है।<ref name="Sarndal">Sarndal, Swenson, and Wretman (1992), Model Assisted Survey Sampling, Springer-Verlag, {{ISBN|0-387-40620-4}}</ref> उदाहरण के लिए, यदि कोई दस लाख की आबादी से एक हजार व्यक्तियों की ऊंचाई को मापता है, तो हजार की औसत ऊंचाई आम तौर पर देश के सभी दस लाख लोगों की औसत ऊंचाई के समान नहीं होती है।
आँकड़ों में, प्रतिचयन त्रुटियां तब होती हैं जब एक [[सांख्यिकीय जनसंख्या]] की सांख्यिकीय विशेषताओं का अनुमान उस जनसंख्या के एक उपवर्ग, या प्रतिरूप (सांख्यिकी) से लगाया जाता है। चूंकि प्रतिरूप में जनसंख्या के सभी सदस्य सम्मिलित नहीं होते हैं, प्रतिरूप के [[आंकड़े]] (प्रायः अनुमानक के रूप में जाने जाते हैं), जैसे साधन और चतुर्थक, सामान्यतः पूरी आबादी के आंकड़ों से भिन्न होते हैं (सांख्यिकीय_मापदण्ड के रूप में जाना जाता है)। प्रतिरूप आंकड़े और जनसंख्या मापदण्ड के बीच के अंतर को प्रतिचयन [[त्रुटियां और अवशेष]] माना जाता है। <ref name="Sarndal">Sarndal, Swenson, and Wretman (1992), Model Assisted Survey Sampling, Springer-Verlag, {{ISBN|0-387-40620-4}}</ref> उदाहरण के लिए, यदि कोई दस लाख की आबादी से एक हजार व्यक्तियों की ऊंचाई को मापता है, तो हजार की औसत ऊंचाई सामान्यतः देश के सभी दस लाख लोगों की औसत ऊंचाई के समान नहीं होती है।


चूंकि नमूनाकरण लगभग हमेशा अज्ञात जनसंख्या मापदंडों का अनुमान लगाने के लिए किया जाता है, परिभाषा के अनुसार नमूनाकरण त्रुटियों का सटीक माप संभव नहीं होगा; हालाँकि, उनका अक्सर अनुमान लगाया जा सकता है, या तो बूटस्ट्रैपिंग_ (सांख्यिकी) जैसे सामान्य तरीकों से, या वास्तविक जनसंख्या वितरण और उसके मापदंडों के बारे में कुछ मान्यताओं (या अनुमान) को शामिल करते हुए विशिष्ट तरीकों से।
चूंकि प्रतिचयन लगभग हमेशा अज्ञात जनसंख्या मापदंडों का अनुमान लगाने के लिए किया जाता है, परिभाषा के अनुसार प्रतिचयन त्रुटियों का सटीक माप संभव नहीं होगा; हालाँकि, उनका प्रायः अनुमान लगाया जा सकता है, या तो स्वोत्थान_ (सांख्यिकी) जैसे सामान्य तरीकों से, या वास्तविक जनसंख्या वितरण और उसके मापदंडों के बारे में कुछ मान्यताओं (या अनुमान) को सम्मिलित करते हुए विशिष्ट तरीकों से अनुमान लगाया जा सकता है।


== विवरण ==
== विवरण ==


=== नमूनाकरण त्रुटि ===
=== प्रतिचयन त्रुटि ===
नमूनाकरण त्रुटि आंकड़ों में त्रुटियां और अवशेष हैं जो संपूर्ण जनसंख्या के बजाय एक नमूने के अवलोकन के कारण होती हैं।<ref name="Sarndal"/>नमूनाकरण त्रुटि जनसंख्या पैरामीटर और पैरामीटर के वास्तविक लेकिन अज्ञात मान का अनुमान लगाने के लिए उपयोग किए जाने वाले नमूना आंकड़े के बीच का अंतर है।<ref name="Burns & Grove, 2009">{{cite book |last=Burns |first=N. |last2=Grove |first2=S. K. |year=2009 |title=The Practice of Nursing Research: Appraisal, Synthesis, and Generation of Evidence |edition=6th |location=St. Louis, MO |publisher=Saunders Elsevier |isbn=978-1-4557-0736-2 }}</ref>
'''प्रतिचयन''' त्रुटि आंकड़ों में त्रुटियां और अवशेष हैं जो संपूर्ण जनसंख्या के बजाय एक प्रतिरूप के अवलोकन के कारण होती हैं।<ref name="Sarndal"/>प्रतिचयन त्रुटि जनसंख्या मापदण्ड और मापदण्ड के वास्तविक लेकिन अज्ञात मान का अनुमान लगाने के लिए उपयोग किए जाने वाले प्रतिरूप आंकड़े के बीच का अंतर है।<ref name="Burns & Grove, 2009">{{cite book |last=Burns |first=N. |last2=Grove |first2=S. K. |year=2009 |title=The Practice of Nursing Research: Appraisal, Synthesis, and Generation of Evidence |edition=6th |location=St. Louis, MO |publisher=Saunders Elsevier |isbn=978-1-4557-0736-2 }}</ref>




=== प्रभावी नमूनाकरण ===
=== प्रभावी प्रतिचयन ===
आँकड़ों में, वास्तव में यादृच्छिक नमूने का अर्थ है समतुल्य संभाव्यता वाले जनसंख्या से व्यक्तियों का चयन करना; दूसरे शब्दों में, बिना पक्षपात के एक समूह से व्यक्तियों को चुनना। इसे सही ढंग से करने में विफल होने पर एक नमूनाकरण पूर्वाग्रह होगा, जो व्यवस्थित त्रुटियों के तरीके से नमूना त्रुटि को नाटकीय रूप से बढ़ा सकता है। उदाहरण के लिए, पृथ्वी की संपूर्ण मानव आबादी की औसत ऊँचाई को मापने का प्रयास, लेकिन केवल एक देश से एक नमूने को मापने का परिणाम एक बड़े या कम अनुमान के रूप में हो सकता है। हकीकत में, एक निष्पक्ष नमूना प्राप्त करना मुश्किल हो सकता है क्योंकि कई पैरामीटर (इस उदाहरण में, देश, आयु, लिंग, और इसी तरह) अनुमानक को दृढ़ता से पक्षपात कर सकते हैं और यह सुनिश्चित किया जाना चाहिए कि इनमें से कोई भी कारक चयन प्रक्रिया में भाग नहीं लेता है .
आँकड़ों में, वास्तव में यादृच्छिक प्रतिरूप का अर्थ है समतुल्य संभाव्यता वाले जनसंख्या से व्यक्तियों का चयन करना; दूसरे शब्दों में, बिना पक्षपात के एक समूह से व्यक्तियों को चुनना। इसे सही ढंग से करने में विफल होने पर एक प्रतिचयन पूर्वाग्रह होगा, जो व्यवस्थित त्रुटियों के तरीके से प्रतिरूप त्रुटि को नाटकीय रूप से बढ़ा सकता है। उदाहरण के लिए, पृथ्वी की संपूर्ण मानव आबादी की औसत ऊँचाई को मापने का प्रयास, लेकिन केवल एक देश से एक प्रतिरूप को मापने का परिणाम एक बड़े या कम अनुमान के रूप में हो सकता है। हकीकत में, एक निष्पक्ष प्रतिरूप प्राप्त करना मुश्किल हो सकता है क्योंकि कई मापदण्ड (इस उदाहरण में, देश, आयु, लिंग, और इसी तरह) अनुमानक को दृढ़ता से पक्षपात कर सकते हैं और यह सुनिश्चित किया जाना चाहिए कि इनमें से कोई भी कारक चयन प्रक्रिया में भाग नहीं लेता है .


यहां तक ​​कि एक पूरी तरह से गैर-पक्षपातपूर्ण नमूने में, शेष सांख्यिकीय घटक के कारण नमूना त्रुटि अभी भी मौजूद रहेगी; विचार करें कि केवल दो या तीन व्यक्तियों को मापने और औसत लेने से हर बार बेतहाशा भिन्न परिणाम उत्पन्न होंगे। नमूना त्रुटि के संभावित आकार को आम तौर पर बड़ा नमूना लेकर कम किया जा सकता है।<ref name="Scheuren">{{cite book |first=Fritz |last=Scheuren |year=2005 |chapter=What is a Margin of Error? |url=http://www.amstat.org/sections/srms/pamphlet.pdf |title=What is a Survey? |publisher=American Statistical Association |location=Washington, D.C. |access-date=2008-01-08 |archive-date=2013-03-12 |archive-url=https://web.archive.org/web/20130312125540/http://www.amstat.org/sections/srms/pamphlet.pdf |url-status=dead }}</ref>
यहां तक ​​कि एक पूरी तरह से गैर-पक्षपातपूर्ण प्रतिरूप में, शेष सांख्यिकीय घटक के कारण प्रतिरूप त्रुटि अभी भी मौजूद रहेगी; विचार करें कि केवल दो या तीन व्यक्तियों को मापने और औसत लेने से हर बार बेतहाशा भिन्न परिणाम उत्पन्न होंगे। प्रतिरूप त्रुटि के संभावित आकार को सामान्यतः बड़ा प्रतिरूप लेकर कम किया जा सकता है।<ref name="Scheuren">{{cite book |first=Fritz |last=Scheuren |year=2005 |chapter=What is a Margin of Error? |url=http://www.amstat.org/sections/srms/pamphlet.pdf |title=What is a Survey? |publisher=American Statistical Association |location=Washington, D.C. |access-date=2008-01-08 |archive-date=2013-03-12 |archive-url=https://web.archive.org/web/20130312125540/http://www.amstat.org/sections/srms/pamphlet.pdf |url-status=dead }}</ref>




=== [[नमूना आकार निर्धारण]] ===
=== [[नमूना आकार निर्धारण|प्रतिरूप आकार निर्धारण]] ===
एक नमूना आकार बढ़ाने की लागत वास्तव में निषेधात्मक हो सकती है। चूंकि नमूना त्रुटि को अक्सर नमूना आकार के कार्य के रूप में पहले से अनुमान लगाया जा सकता है, नमूना आकार निर्धारण के विभिन्न तरीकों का उपयोग बड़े नमूने लेने की अनुमानित लागत के खिलाफ अनुमानक की अनुमानित सटीकता को तौलने के लिए किया जाता है।
एक प्रतिरूप आकार बढ़ाने की लागत वास्तव में निषेधात्मक हो सकती है। चूंकि प्रतिरूप त्रुटि को प्रायः प्रतिरूप आकार के कार्य के रूप में पहले से अनुमान लगाया जा सकता है, प्रतिरूप आकार निर्धारण के विभिन्न तरीकों का उपयोग बड़े प्रतिरूप लेने की अनुमानित लागत के खिलाफ अनुमानक की अनुमानित सटीकता को तौलने के लिए किया जाता है।


=== बूटस्ट्रैपिंग और मानक त्रुटि ===
=== स्वोत्थान और मानक त्रुटि ===
{{main|Bootstrapping (statistics)}}
{{main|Bootstrapping (statistics)}}
जैसा कि चर्चा की गई है, एक नमूना आँकड़ा, जैसे औसत या प्रतिशत, आम तौर पर नमूना-से-नमूना भिन्नता के अधीन होगा।<ref name="Sarndal"/>कई नमूनों की तुलना करके, या एक बड़े नमूने को छोटे लोगों (संभावित रूप से ओवरलैप के साथ) में विभाजित करके, परिणामी नमूना आँकड़ों के प्रसार का उपयोग नमूने पर [[मानक त्रुटि]] का अनुमान लगाने के लिए किया जा सकता है।
जैसा कि चर्चा की गई है, एक प्रतिरूप आँकड़ा, जैसे औसत या प्रतिशत, सामान्यतः प्रतिरूप-से-प्रतिरूप भिन्नता के अधीन होगा।<ref name="Sarndal"/>कई नमूनों की तुलना करके, या एक बड़े प्रतिरूप को छोटे लोगों (संभावित रूप से ओवरलैप के साथ) में विभाजित करके, परिणामी प्रतिरूप आँकड़ों के प्रसार का उपयोग प्रतिरूप पर [[मानक त्रुटि]] का अनुमान लगाने के लिए किया जा सकता है।


== [[ आनुवंशिकी ]] में ==
== [[ आनुवंशिकी ]] में ==
सैंपलिंग एरर शब्द का उपयोग आनुवांशिकी के क्षेत्र में संबंधित लेकिन मौलिक रूप से भिन्न अर्थों में भी किया गया है; उदाहरण के लिए [[जनसंख्या अड़चन]] या [[संस्थापक प्रभाव]] में, जब प्राकृतिक आपदाएँ या पलायन जनसंख्या के आकार को नाटकीय रूप से कम कर देते हैं, जिसके परिणामस्वरूप एक छोटी आबादी होती है जो मूल रूप से प्रतिनिधित्व कर सकती है या नहीं भी कर सकती है। यह [[आनुवंशिक बहाव]] का एक स्रोत है, क्योंकि कुछ युग्मविकल्पी अधिक या कम सामान्य हो जाते हैं), और इसे नमूनाकरण त्रुटि के रूप में संदर्भित किया गया है,<ref>{{Cite book | last1 = Campbell | first1 = Neil A.  | last2 = Reece  | first2 = Jane B.  | title = जीवविज्ञान| publisher = Benjamin Cummings |pages = 450–451  | year = 2002  | isbn = 0-536-68045-0 }}</ref> सांख्यिकीय अर्थ में त्रुटि नहीं होने के बावजूद।
सैंपलिंग एरर शब्द का उपयोग आनुवांशिकी के क्षेत्र में संबंधित लेकिन मौलिक रूप से भिन्न अर्थों में भी किया गया है; उदाहरण के लिए [[जनसंख्या अड़चन]] या [[संस्थापक प्रभाव]] में, जब प्राकृतिक आपदाएँ या पलायन जनसंख्या के आकार को नाटकीय रूप से कम कर देते हैं, जिसके परिणामस्वरूप एक छोटी आबादी होती है जो मूल रूप से प्रतिनिधित्व कर सकती है या नहीं भी कर सकती है। यह [[आनुवंशिक बहाव]] का एक स्रोत है, क्योंकि कुछ युग्मविकल्पी अधिक या कम सामान्य हो जाते हैं), और इसे प्रतिचयन त्रुटि के रूप में संदर्भित किया गया है,<ref>{{Cite book | last1 = Campbell | first1 = Neil A.  | last2 = Reece  | first2 = Jane B.  | title = जीवविज्ञान| publisher = Benjamin Cummings |pages = 450–451  | year = 2002  | isbn = 0-536-68045-0 }}</ref> सांख्यिकीय अर्थ में त्रुटि नहीं होने के बावजूद।


== यह भी देखें ==
== यह भी देखें ==
Line 30: Line 30:
* [[अनिश्चितता का प्रसार]]
* [[अनिश्चितता का प्रसार]]
* [[अनुपात अनुमानक]]
* [[अनुपात अनुमानक]]
* [[नमूनाकरण (सांख्यिकी)]]
* [[नमूनाकरण (सांख्यिकी)|प्रतिचयन (सांख्यिकी)]]


==संदर्भ==
==संदर्भ==

Revision as of 12:20, 11 June 2023

आँकड़ों में, प्रतिचयन त्रुटियां तब होती हैं जब एक सांख्यिकीय जनसंख्या की सांख्यिकीय विशेषताओं का अनुमान उस जनसंख्या के एक उपवर्ग, या प्रतिरूप (सांख्यिकी) से लगाया जाता है। चूंकि प्रतिरूप में जनसंख्या के सभी सदस्य सम्मिलित नहीं होते हैं, प्रतिरूप के आंकड़े (प्रायः अनुमानक के रूप में जाने जाते हैं), जैसे साधन और चतुर्थक, सामान्यतः पूरी आबादी के आंकड़ों से भिन्न होते हैं (सांख्यिकीय_मापदण्ड के रूप में जाना जाता है)। प्रतिरूप आंकड़े और जनसंख्या मापदण्ड के बीच के अंतर को प्रतिचयन त्रुटियां और अवशेष माना जाता है। [1] उदाहरण के लिए, यदि कोई दस लाख की आबादी से एक हजार व्यक्तियों की ऊंचाई को मापता है, तो हजार की औसत ऊंचाई सामान्यतः देश के सभी दस लाख लोगों की औसत ऊंचाई के समान नहीं होती है।

चूंकि प्रतिचयन लगभग हमेशा अज्ञात जनसंख्या मापदंडों का अनुमान लगाने के लिए किया जाता है, परिभाषा के अनुसार प्रतिचयन त्रुटियों का सटीक माप संभव नहीं होगा; हालाँकि, उनका प्रायः अनुमान लगाया जा सकता है, या तो स्वोत्थान_ (सांख्यिकी) जैसे सामान्य तरीकों से, या वास्तविक जनसंख्या वितरण और उसके मापदंडों के बारे में कुछ मान्यताओं (या अनुमान) को सम्मिलित करते हुए विशिष्ट तरीकों से अनुमान लगाया जा सकता है।

विवरण

प्रतिचयन त्रुटि

प्रतिचयन त्रुटि आंकड़ों में त्रुटियां और अवशेष हैं जो संपूर्ण जनसंख्या के बजाय एक प्रतिरूप के अवलोकन के कारण होती हैं।[1]प्रतिचयन त्रुटि जनसंख्या मापदण्ड और मापदण्ड के वास्तविक लेकिन अज्ञात मान का अनुमान लगाने के लिए उपयोग किए जाने वाले प्रतिरूप आंकड़े के बीच का अंतर है।[2]


प्रभावी प्रतिचयन

आँकड़ों में, वास्तव में यादृच्छिक प्रतिरूप का अर्थ है समतुल्य संभाव्यता वाले जनसंख्या से व्यक्तियों का चयन करना; दूसरे शब्दों में, बिना पक्षपात के एक समूह से व्यक्तियों को चुनना। इसे सही ढंग से करने में विफल होने पर एक प्रतिचयन पूर्वाग्रह होगा, जो व्यवस्थित त्रुटियों के तरीके से प्रतिरूप त्रुटि को नाटकीय रूप से बढ़ा सकता है। उदाहरण के लिए, पृथ्वी की संपूर्ण मानव आबादी की औसत ऊँचाई को मापने का प्रयास, लेकिन केवल एक देश से एक प्रतिरूप को मापने का परिणाम एक बड़े या कम अनुमान के रूप में हो सकता है। हकीकत में, एक निष्पक्ष प्रतिरूप प्राप्त करना मुश्किल हो सकता है क्योंकि कई मापदण्ड (इस उदाहरण में, देश, आयु, लिंग, और इसी तरह) अनुमानक को दृढ़ता से पक्षपात कर सकते हैं और यह सुनिश्चित किया जाना चाहिए कि इनमें से कोई भी कारक चयन प्रक्रिया में भाग नहीं लेता है .

यहां तक ​​कि एक पूरी तरह से गैर-पक्षपातपूर्ण प्रतिरूप में, शेष सांख्यिकीय घटक के कारण प्रतिरूप त्रुटि अभी भी मौजूद रहेगी; विचार करें कि केवल दो या तीन व्यक्तियों को मापने और औसत लेने से हर बार बेतहाशा भिन्न परिणाम उत्पन्न होंगे। प्रतिरूप त्रुटि के संभावित आकार को सामान्यतः बड़ा प्रतिरूप लेकर कम किया जा सकता है।[3]


प्रतिरूप आकार निर्धारण

एक प्रतिरूप आकार बढ़ाने की लागत वास्तव में निषेधात्मक हो सकती है। चूंकि प्रतिरूप त्रुटि को प्रायः प्रतिरूप आकार के कार्य के रूप में पहले से अनुमान लगाया जा सकता है, प्रतिरूप आकार निर्धारण के विभिन्न तरीकों का उपयोग बड़े प्रतिरूप लेने की अनुमानित लागत के खिलाफ अनुमानक की अनुमानित सटीकता को तौलने के लिए किया जाता है।

स्वोत्थान और मानक त्रुटि

जैसा कि चर्चा की गई है, एक प्रतिरूप आँकड़ा, जैसे औसत या प्रतिशत, सामान्यतः प्रतिरूप-से-प्रतिरूप भिन्नता के अधीन होगा।[1]कई नमूनों की तुलना करके, या एक बड़े प्रतिरूप को छोटे लोगों (संभावित रूप से ओवरलैप के साथ) में विभाजित करके, परिणामी प्रतिरूप आँकड़ों के प्रसार का उपयोग प्रतिरूप पर मानक त्रुटि का अनुमान लगाने के लिए किया जा सकता है।

आनुवंशिकी में

सैंपलिंग एरर शब्द का उपयोग आनुवांशिकी के क्षेत्र में संबंधित लेकिन मौलिक रूप से भिन्न अर्थों में भी किया गया है; उदाहरण के लिए जनसंख्या अड़चन या संस्थापक प्रभाव में, जब प्राकृतिक आपदाएँ या पलायन जनसंख्या के आकार को नाटकीय रूप से कम कर देते हैं, जिसके परिणामस्वरूप एक छोटी आबादी होती है जो मूल रूप से प्रतिनिधित्व कर सकती है या नहीं भी कर सकती है। यह आनुवंशिक बहाव का एक स्रोत है, क्योंकि कुछ युग्मविकल्पी अधिक या कम सामान्य हो जाते हैं), और इसे प्रतिचयन त्रुटि के रूप में संदर्भित किया गया है,[4] सांख्यिकीय अर्थ में त्रुटि नहीं होने के बावजूद।

यह भी देखें

संदर्भ

  1. 1.0 1.1 1.2 Sarndal, Swenson, and Wretman (1992), Model Assisted Survey Sampling, Springer-Verlag, ISBN 0-387-40620-4
  2. Burns, N.; Grove, S. K. (2009). The Practice of Nursing Research: Appraisal, Synthesis, and Generation of Evidence (6th ed.). St. Louis, MO: Saunders Elsevier. ISBN 978-1-4557-0736-2.
  3. Scheuren, Fritz (2005). "What is a Margin of Error?". What is a Survey? (PDF). Washington, D.C.: American Statistical Association. Archived from the original (PDF) on 2013-03-12. Retrieved 2008-01-08.
  4. Campbell, Neil A.; Reece, Jane B. (2002). जीवविज्ञान. Benjamin Cummings. pp. 450–451. ISBN 0-536-68045-0.