सहनशीलता अंतराल: Difference between revisions

From Vigyanwiki
(Created page with "{{Short description|Type of statistical probability}} {{distinguish|Engineering tolerance}} सहिष्णुता अंतराल (टीआई) एक सां...")
 
No edit summary
Line 1: Line 1:
{{Short description|Type of statistical probability}}
{{Short description|Type of statistical probability}}
{{distinguish|Engineering tolerance}}
{{distinguish|इंजीनियरिंग सहिष्णुता}}


सहिष्णुता अंतराल (टीआई) एक [[सांख्यिकीय अंतराल]] है जिसके भीतर, कुछ [[आत्मविश्वास स्तर]] के साथ, जनसंख्या का एक निर्दिष्ट नमूना (सांख्यिकी) अनुपात आता है। अधिक विशेष रूप से, ए {{math|100×''p''%/100×(1−α)}} सहनशीलता अंतराल वह सीमाएं प्रदान करता है जिसके भीतर जनसंख्या का कम से कम एक निश्चित अनुपात (पी) आत्मविश्वास के दिए गए स्तर (1−α) के साथ आता है।<ref>D. S. Young (2010), Book Reviews: "Statistical Tolerance Regions: Theory, Applications, and Computation", TECHNOMETRICS, FEBRUARY 2010, VOL. 52, NO. 1, pp.143-144.</ref> एक नमूने के आधार पर ए (पी, 1−α) सहनशीलता अंतराल (टीआई) का निर्माण किया जाता है ताकि इसमें आत्मविश्वास 1−α के साथ नमूना आबादी का कम से कम अनुपात पी शामिल हो; ऐसे TI को आमतौर पर p-content - (1−α) कवरेज TI कहा जाता है।<ref name=Krishnamoorthy2011>Krishnamoorthy, K. and Lian, Xiaodong(2011) 'Closed-form approximate tolerance intervals for some general linear models and comparison studies', Journal of Statistical Computation and Simulation, First published on: 13 June 2011 {{doi|10.1080/00949655.2010.545061}}</ref> A (p, 1−α) ऊपरी सहनशीलता सीमा (TL) जनसंख्या के 100 ''p'' प्रतिशत के लिए बस 1−α ऊपरी आत्मविश्वास सीमा है।<ref name=Krishnamoorthy2011/>




सहिष्णुता अंतराल (टीआई) एक सांख्यिकीय अंतराल है जिसके अंदर, कुछ आत्मविश्वास स्तर के साथ, जनसंख्या का एक निर्दिष्ट नमूना अनुपात आता है। "अधिक विशेष रूप से, एक {{math|100×''p''%/100×(1−α)}} सहनशीलता अंतराल सीमा प्रदान करता है जिसके अंदर  जनसंख्या का कम से कम एक निश्चित अनुपात (p) आत्मविश्वास के एक निश्चित स्तर (1−α) के साथ आता है।"<ref>D. S. Young (2010), Book Reviews: "Statistical Tolerance Regions: Theory, Applications, and Computation", TECHNOMETRICS, FEBRUARY 2010, VOL. 52, NO. 1, pp.143-144.</ref> "एक नमूने के आधार पर a  (p, 1−α) सहनशीलता अंतराल (टीआई) का निर्माण किया जाता है जिससे इसमें आत्मविश्वास 1−α के साथ नमूना संख्या का कम से कम अनुपात पी सम्मिलित हो; ऐसे TI को समान्यत:  p-content - (1−α) कवरेज TI कहा जाता है।"<ref name="Krishnamoorthy2011">Krishnamoorthy, K. and Lian, Xiaodong(2011) 'Closed-form approximate tolerance intervals for some general linear models and comparison studies', Journal of Statistical Computation and Simulation, First published on: 13 June 2011 {{doi|10.1080/00949655.2010.545061}}</ref> "A (p, 1−α) ऊपरी सहनशीलता सीमा (टीएल) जनसंख्या के 100 पी प्रतिशतक के लिए बस 1−α ऊपरी आत्मविश्वास सीमा है।"<ref name="Krishnamoorthy2011" />
==गणना==
==गणना==
एक तरफा सामान्य सहनशीलता अंतराल का गैर-केंद्रीय टी-वितरण|गैरकेंद्रीय टी-वितरण के आधार पर नमूना माध्य और नमूना विचरण के संदर्भ में एक सटीक समाधान होता है।<ref name=Young/>
एक पक्ष के सामान्य सहनशीलता अंतराल का गैर-केंद्रीय टी-वितरण या गैरकेंद्रीय टी-वितरण के आधार पर नमूना माध्य और नमूना विचरण के संदर्भ में एक स्पष्ट  समाधान होता है।<ref name=Young/>  
गैर-केंद्रीय ची-वर्ग वितरण के आधार पर दो-तरफा सामान्य सहिष्णुता अंतराल प्राप्त किया जा सकता है।<ref name=Young>{{cite journal| author=Derek S. Young| title=tolerance: An R Package for Estimating Tolerance Intervals| journal=Journal of Statistical Software|date=August 2010| volume=36| number=5| pages=1–39| issn=1548-7660| url=http://www.jstatsoft.org/v36/i05| access-date=19 February 2013}}, p.23</ref>


गैर-केंद्रीय ची-वर्ग वितरण के आधार पर दो-पक्षीय सामान्य सहिष्णुता अंतराल प्राप्त किया जा सकता है।<ref name="Young">{{cite journal| author=Derek S. Young| title=tolerance: An R Package for Estimating Tolerance Intervals| journal=Journal of Statistical Software|date=August 2010| volume=36| number=5| pages=1–39| issn=1548-7660| url=http://www.jstatsoft.org/v36/i05| access-date=19 February 2013}}, p.23</ref>
==अन्य अंतरालों से संबंध==
{{further|अंतराल अनुमान}}
"पैरामीटर-ज्ञात स्थिति में, 95% सहिष्णुता अंतराल और 95% पूर्वानुमान अंतराल समान हैं।"<ref name="Ryan2007">{{cite book|author=Thomas P. Ryan|title=आधुनिक इंजीनियरिंग सांख्यिकी|url=https://books.google.com/books?id=aZn7XNphKcgC&pg=PA222|access-date=22 February 2013|date=22 June 2007|publisher=John Wiley & Sons|isbn=978-0-470-12843-5|pages=222–}}</ref> यदि हमें जनसंख्या के स्पष्ट  पैरामीटर पता होते, तो हम एक सीमा की गणना करने में सक्षम होते जिसके अंदर एक निश्चित अनुपात होता है। जनसंख्या गिरती है. उदाहरण के लिए, यदि हम जानते हैं कि एक जनसंख्या सामान्यतः माध्य <math>\mu</math> और मानक विचलन <math>\sigma</math> के साथ वितरित की जाती है, तो अंतराल <math>\mu \pm 1.96\sigma</math> में 95% जनसंख्या सम्मिलित होती है (1.96 सामान्य रूप से वितरित जनसंख्या के 95% कवरेज के लिए [[z के स्कोर]] है)।
चूँकि , यदि हमारे पास जनसंख्या से केवल एक नमूना है, तो हम केवल नमूना माध्य <math>\hat{\mu}</math>  और नमूना मानक विचलन <math>\hat{\sigma}</math> जानते हैं, जो केवल सही मापदंडों के अनुमान हैं। उस स्थिति में, इन अनुमानों में भिन्नता के कारण, <math>\hat{\mu} \pm 1.96\hat{\sigma}</math>  में आवश्यक रूप से 95% जनसंख्या सम्मिलित नहीं होगी। एक सहिष्णुता अंतराल एक आत्मविश्वास स्तर <math>\gamma</math> का परिचय देकर इस भिन्नता को सीमित करता है , जो वह आत्मविश्वास है जिसके साथ यह अंतराल वास्तव में जनसंख्या के निर्दिष्ट अनुपात को सम्मिलित करता है। सामान्य रूप से वितरित जनसंख्या के लिए एक z-स्कोर को लुकअप तालिकाओं या कई सन्निकटन सूत्रों के माध्यम से किसी दिए गए <math>\gamma</math> के लिए "k कारक" या सहिष्णुता कारक<ref>{{cite web|year=2014|title=Statistical interpretation of data — Part 6: Determination of statistical tolerance intervals|url=https://www.iso.org/standard/57191.html|publisher=ISO 16269-6|page=2}}</ref>  में परिवर्तित किया जा सकता है।<ref>{{cite book | chapter = Tolerance intervals for a normal distribution | chapter-url = http://www.itl.nist.gov/div898/handbook/prc/section2/prc263.htm | title = इंजीनियरिंग सांख्यिकी पुस्तिका| publisher = NIST/Sematech | year = 2010 | access-date = 2011-08-26}}</ref> जैसे-जैसे स्वतंत्रता की डिग्री अनंत तक पहुंचती है, पूर्वानुमान और सहनशीलता का अंतराल समान हो जाता है।<ref name="Example2006">{{Cite journal | last1 = De Gryze | first1 = S. | last2 = Langhans | first2 = I. | last3 = Vandebroek | first3 = M. | doi = 10.1016/j.chemolab.2007.03.002 | title = Using the correct intervals for prediction: A tutorial on tolerance intervals for ordinary least-squares regression | journal = Chemometrics and Intelligent Laboratory Systems | volume = 87 | issue = 2 | pages = 147 | year = 2007 }}</ref>


==अन्य अंतरालों से संबंध==
सहिष्णुता अंतराल को आत्म[[विश्वास अंतराल]] और पूर्वानुमान अंतराल की तुलना में कम व्यापक रूप से जाना जाता है, इस स्थिति पर कुछ शिक्षकों ने खेद व्यक्त किया है, क्योंकि इससे अन्य अंतरालों का दुरुपयोग हो सकता है जहां सहिष्णुता अंतराल अधिक उपयुक्त है।<ref name="vardeman">{{cite journal | author = Stephen B. Vardeman | title = What about the Other Intervals? | journal = The American Statistician | volume = 46 | issue = 3 | year = 1992 | pages = 193–197 | jstor = 2685212 | doi=10.2307/2685212}}</ref><ref name="nelson">{{cite web | author = Mark J. Nelson | title = आपको सहनशीलता अंतराल की आवश्यकता हो सकती है| url = http://www.kmjn.org/notes/tolerance_intervals.html | date = 2011-08-14 | access-date = 2011-08-26}}</ref>
{{further|Interval estimation}}


पैरामीटर-ज्ञात मामले में, 95% सहनशीलता अंतराल और 95% पूर्वानुमान अंतराल समान हैं।<ref name="Ryan2007">{{cite book|author=Thomas P. Ryan|title=आधुनिक इंजीनियरिंग सांख्यिकी|url=https://books.google.com/books?id=aZn7XNphKcgC&pg=PA222|access-date=22 February 2013|date=22 June 2007|publisher=John Wiley & Sons|isbn=978-0-470-12843-5|pages=222–}}</ref> यदि हम किसी जनसंख्या के सटीक मापदंडों को जानते हैं, तो हम उस सीमा की गणना करने में सक्षम होंगे जिसके भीतर जनसंख्या का एक निश्चित अनुपात आता है। उदाहरण के लिए, यदि हम जानते हैं कि जनसंख्या माध्य के साथ [[सामान्य वितरण]] है <math>\mu</math> और [[मानक विचलन]] <math>\sigma</math>, फिर अंतराल <math>\mu \pm 1.96\sigma</math> इसमें 95% जनसंख्या शामिल है (1.96 सामान्य रूप से वितरित जनसंख्या के 95% कवरेज के लिए [[z के स्कोर]] है)।
सहिष्णुता अंतराल आत्मविश्वास अंतराल से भिन्न होता है जिसमें आत्मविश्वास अंतराल एकल-मूल्य वाले जनसंख्या पैरामीटर (उदाहरण के लिए माध्य या विचरण) को कुछ आत्मविश्वास के साथ बांधता है, जबकि सहिष्णुता अंतराल डेटा मानों की सीमा को सीमित करता है जिसमें एक विशिष्ट अनुपात सम्मिलित होता है संख्या जबकि आत्मविश्वास अंतराल का आकार पूरी तरह से [[नमूनाकरण त्रुटि]] के कारण होता है, और नमूना आकार बढ़ने पर वास्तविक जनसंख्या पैरामीटर पर शून्य-चौड़ाई अंतराल तक पहुंच जाएगा, जिससे सहिष्णुता अंतराल का आकार आंशिक रूप से नमूनाकरण त्रुटि और आंशिक रूप से जनसंख्या में वास्तविक भिन्नता के कारण होता है, और जैसे-जैसे नमूना आकार बढ़ेगा, जनसंख्या की संभाव्यता अंतराल के समीप पहुंच जाएगी।<ref name="vardeman" /><ref name="nelson" />


हालाँकि, यदि हमारे पास जनसंख्या से केवल एक नमूना है, तो हम केवल [[नमूना माध्य]] ही जानते हैं <math>\hat{\mu}</math> और नमूना मानक विचलन <math>\hat{\sigma}</math>, जो केवल वास्तविक मापदंडों के अनुमान हैं। उस मामले में, <math>\hat{\mu} \pm 1.96\hat{\sigma}</math> इन अनुमानों में भिन्नता के कारण जरूरी नहीं कि इसमें 95% आबादी शामिल हो। एक सहिष्णुता अंतराल एक आत्मविश्वास स्तर का परिचय देकर इस भिन्नता को सीमित करता है <math>\gamma</math>, जो वह आत्मविश्वास है जिसके साथ यह अंतराल वास्तव में जनसंख्या के निर्दिष्ट अनुपात को शामिल करता है। सामान्य रूप से वितरित जनसंख्या के लिए, z-स्कोर को ak फ़ैक्टर या 'सहिष्णुता फ़ैक्टर' में बदला जा सकता है<ref>{{cite web|year=2014|title=Statistical interpretation of data — Part 6: Determination of statistical tolerance intervals|url=https://www.iso.org/standard/57191.html|publisher=ISO 16269-6|page=2}}</ref> किसी प्रदत्त के लिए <math>\gamma</math> लुकअप तालिकाओं या कई सन्निकटन सूत्रों के माध्यम से।<ref>{{cite book | chapter = Tolerance intervals for a normal distribution | chapter-url = http://www.itl.nist.gov/div898/handbook/prc/section2/prc263.htm | title = इंजीनियरिंग सांख्यिकी पुस्तिका| publisher = NIST/Sematech | year = 2010 | access-date = 2011-08-26}}</ref> जैसे-जैसे स्वतंत्रता की डिग्री अनंत तक पहुंचती है, भविष्यवाणी और सहनशीलता का अंतराल बराबर हो जाता है।<ref name=Example2006>{{Cite journal | last1 = De Gryze | first1 = S. | last2 = Langhans | first2 = I. | last3 = Vandebroek | first3 = M. | doi = 10.1016/j.chemolab.2007.03.002 | title = Using the correct intervals for prediction: A tutorial on tolerance intervals for ordinary least-squares regression | journal = Chemometrics and Intelligent Laboratory Systems | volume = 87 | issue = 2 | pages = 147 | year = 2007 }}</ref>
सहिष्णुता अंतराल एक पूर्वानुमान अंतराल से संबंधित है जिसमें दोनों भविष्य के नमूनों में भिन्नता पर सीमाएं लगाते हैं। चूँकि पूर्वानुमान अंतराल केवल एक भविष्य के नमूने को सीमित करता है, जबकि एक सहिष्णुता अंतराल पूरी संख्या को सीमित करता है (समकक्ष, भविष्य के नमूनों का एक इच्छानुसार अनुक्रम)। दूसरे शब्दों में, एक पूर्वानुमान अंतराल औसतन जनसंख्या के एक निर्दिष्ट अनुपात को आवरण करता है, जबकि एक सहिष्णुता अंतराल इसे एक निश्चित आत्मविश्वास स्तर के साथ आवरण करता है, जिससे सहिष्णुता अंतराल अधिक उपयुक्त हो जाता है यदि एक अंतराल का उद्देश्य कई भविष्य के नमूनों को बाध्य करना है।<ref name="nelson" /><ref name="Krishnamoorthy">{{cite book | author = K. Krishnamoorthy| title = Statistical Tolerance Regions: Theory, Applications, and Computation | publisher = John Wiley and Sons | year = 2009 | isbn = 978-0-470-38026-0 | pages = 1–6}}</ref>
सहिष्णुता अंतराल को आत्म[[विश्वास अंतराल]] और भविष्यवाणी अंतराल की तुलना में कम व्यापक रूप से जाना जाता है, इस स्थिति पर कुछ शिक्षकों ने खेद व्यक्त किया है, क्योंकि इससे अन्य अंतरालों का दुरुपयोग हो सकता है जहां सहिष्णुता अंतराल अधिक उपयुक्त है।<ref name=vardeman>{{cite journal | author = Stephen B. Vardeman | title = What about the Other Intervals? | journal = The American Statistician | volume = 46 | issue = 3 | year = 1992 | pages = 193–197 | jstor = 2685212 | doi=10.2307/2685212}}</ref><ref name=nelson>{{cite web | author = Mark J. Nelson | title = आपको सहनशीलता अंतराल की आवश्यकता हो सकती है| url = http://www.kmjn.org/notes/tolerance_intervals.html | date = 2011-08-14 | access-date = 2011-08-26}}</ref>
सहिष्णुता अंतराल आत्मविश्वास अंतराल से भिन्न होता है जिसमें आत्मविश्वास अंतराल एकल-मूल्य वाले जनसंख्या पैरामीटर (उदाहरण के लिए माध्य या विचरण) को कुछ आत्मविश्वास के साथ बांधता है, जबकि सहिष्णुता अंतराल डेटा मानों की सीमा को सीमित करता है जिसमें एक विशिष्ट अनुपात शामिल होता है आबादी। जबकि आत्मविश्वास अंतराल का आकार पूरी तरह से [[नमूनाकरण त्रुटि]] के कारण होता है, और नमूना आकार बढ़ने पर वास्तविक जनसंख्या पैरामीटर पर शून्य-चौड़ाई अंतराल तक पहुंच जाएगा, सहिष्णुता अंतराल का आकार आंशिक रूप से नमूनाकरण त्रुटि और आंशिक रूप से जनसंख्या में वास्तविक भिन्नता के कारण होता है, और जैसे-जैसे नमूना आकार बढ़ेगा, जनसंख्या की संभाव्यता अंतराल के करीब पहुंच जाएगी।<ref name=vardeman /><ref name=nelson />


सहिष्णुता अंतराल एक भविष्यवाणी अंतराल से संबंधित है जिसमें दोनों भविष्य के नमूनों में भिन्नता पर सीमाएं लगाते हैं। हालाँकि, पूर्वानुमान अंतराल केवल एक भविष्य के नमूने को सीमित करता है, जबकि एक सहिष्णुता अंतराल पूरी आबादी को सीमित करता है (समकक्ष, भविष्य के नमूनों का एक मनमाना अनुक्रम)। दूसरे शब्दों में, एक पूर्वानुमान अंतराल औसतन जनसंख्या के एक निर्दिष्ट अनुपात को कवर करता है, जबकि एक सहिष्णुता अंतराल इसे एक निश्चित आत्मविश्वास स्तर के साथ कवर करता है, जिससे सहिष्णुता अंतराल अधिक उपयुक्त हो जाता है यदि एक अंतराल का उद्देश्य कई भविष्य के नमूनों को बाध्य करना है।<ref name=nelson /><ref name=Krishnamoorthy>{{cite book | author = K. Krishnamoorthy| title = Statistical Tolerance Regions: Theory, Applications, and Computation | publisher = John Wiley and Sons | year = 2009 | isbn = 978-0-470-38026-0 | pages = 1–6}}</ref>




==उदाहरण==
==उदाहरण==


<ref name=vardeman/>निम्नलिखित उदाहरण देता है: <ब्लॉकउद्धरण>तो एक बार फिर से एक कहावत पर विचार करें संयुक्त राज्य अमेरिका पर्यावरण संरक्षण एजेंसी ऑटोमोबाइल परीक्षण परिदृश्य में ईंधन अर्थव्यवस्था, जिसमें माइलेज के आंकड़े उत्पन्न करने के लिए एक विशेष मॉडल के कई नाममात्र समान ऑटो का परीक्षण किया जाता है <math>y_1, y_2, ..., y_n</math>. यदि इस तरह के डेटा को मॉडल के औसत माइलेज के लिए 95% विश्वास अंतराल उत्पन्न करने के लिए संसाधित किया जाता है, तो उदाहरण के लिए, ऐसे ऑटो के निर्मित बेड़े के पहले 5,000 मील के दौरान औसत या कुल गैसोलीन खपत का अनुमान लगाने के लिए इसका उपयोग करना संभव है। उपयोग के। हालाँकि, इस तरह का अंतराल, इन कारों में से किसी एक को किराए पर लेने वाले व्यक्ति के लिए बहुत मददगार नहीं होगा और सोच रहा होगा कि गैस का (पूरा) 10-गैलन टैंक उसे 350 मील अपने गंतव्य तक ले जाने के लिए पर्याप्त होगा या नहीं। उस कार्य के लिए, पूर्वानुमान अंतराल अधिक उपयोगी होगा। (95% आश्वस्त होने के विभिन्न निहितार्थों पर विचार करें <math>\mu \ge 35</math> 95% आश्वस्त होने के विपरीत <math>y_{n+1} \ge 35</math>.) लेकिन न तो इसके लिए कोई कॉन्फिडेंस इंटरवल है <math>\mu</math> न ही एक भी अतिरिक्त माइलेज के लिए पूर्वानुमान अंतराल बिल्कुल वही है जिसकी आवश्यकता एक डिज़ाइन इंजीनियर को होती है जिसे यह निर्धारित करने का काम सौंपा जाता है कि मॉडल को वास्तव में कितने बड़े गैस टैंक की गारंटी देने की आवश्यकता है कि उत्पादित 99% ऑटो में 400-मील की क्रूज़िंग रेंज होगी। इंजीनियर को वास्तव में एक अंश के लिए सहनशीलता अंतराल की आवश्यकता होती है <math>p = .99</math> ऐसे ऑटो के माइलेज की.</blockquote>
<ref name=vardeman/>निम्नलिखित उदाहरण देता है:  
 
<ब्लॉकउद्धरण>
 
तो एक बार फिर से एक लौकिक ईपीए माइलेज परीक्षण परिदृश्य पर विचार करें, जिसमें माइलेज आंकड़े <math>y_1, y_2, ..., y_n</math> उत्पन्न करने के लिए एक विशेष मॉडल के कई नाममात्र समान ऑटो का परीक्षण किया जाता है। यदि इस तरह के डेटा को मॉडल के औसत माइलेज के लिए 95% विश्वास अंतराल उत्पन्न करने के लिए संसाधित किया जाता है, तो उदाहरण के लिए, ऐसे ऑटो के निर्मित बेड़े के पहले 5,000 मील के समय औसत या कुल गैसोलीन उपयोग `का अनुमान लगाने के लिए इसका उपयोग करना संभव है। उपयोग के। चूँकि  इस तरह का अंतराल, इन कारों में से किसी एक को किराए पर लेने वाले व्यक्ति के लिए बहुत सहायता  नहीं होगा और सोच रहा होगा कि गैस का (पूरा) 10-गैलन टैंक उसे 350 मील अपने गंतव्य तक ले जाने के लिए पर्याप्त होगा या नहीं  उस कार्य के लिए, पूर्वानुमान अंतराल अधिक उपयोगी होगा। ("95% आश्वस्त" होने के विभिन्न निहितार्थों पर विचार करें कि <math>\mu \ge 35</math> न कि "95% आश्वस्त" होने के विपरीत कि <math>y_{n+1} \ge 35</math> लेकिन न तो <math>\mu</math> के लिए कोई विश्वास अंतराल है और न ही एक अतिरिक्त माइलेज के लिए पूर्वानुमान अंतराल ठीक वैसा ही है जैसा एक डिज़ाइन इंजीनियर को चाहिए होता है जो यह निर्धारित करता है कि मॉडल को वास्तव में कितने बड़े गैस टैंक की आवश्यकता है जिससे  यह आश्वासन  दी जा सकता है  कि उत्पादित 99% ऑटो में 400-मील की क्रूज़िंग रेंज होगी। इंजीनियर को वास्तव में ऐसे ऑटो के माइलेज के अंश <math>p = .99</math> के लिए सहनशीलता अंतराल की आवश्यकता होती है।
 
एक और उदाहरण दिया गया है:<ref name="Krishnamoorthy" />
 
<ब्लॉककोट>


एक और उदाहरण दिया गया है:<ref name=Krishnamoorthy/><ब्लॉककोट>एयर लेड का स्तर कहां से एकत्र किया गया <math>n=15</math> सुविधा के भीतर विभिन्न क्षेत्र। यह नोट किया गया कि लॉग-रूपांतरित लीड स्तर एक सामान्य वितरण को अच्छी तरह से फिट करते हैं (अर्थात, डेटा एक [[लॉगनॉर्मल वितरण]] से हैं। चलो <math>\mu</math> और <math>\sigma^2</math>क्रमशः, लॉग-रूपांतरित डेटा के लिए जनसंख्या माध्य और विचरण को निरूपित करें। अगर <math>X</math> इस प्रकार हमारे पास संगत यादृच्छिक चर को दर्शाता है <math>X \sim \mathcal{N}(\mu, \sigma^2)</math>. हमने ध्यान दिया कि <math>\exp(\mu)</math> औसत वायु नेतृत्व स्तर है। के लिए एक विश्वास अंतराल <math>\mu</math> विद्यार्थी के t-वितरण|t-वितरण के आधार पर, सामान्य तरीके से बनाया जा सकता है; यह बदले में औसत वायु नेतृत्व स्तर के लिए एक विश्वास अंतराल प्रदान करेगा। अगर <math>\bar{X}</math> और <math>S</math> आकार n के नमूने के लिए लॉग-रूपांतरित डेटा के नमूना माध्य और मानक विचलन को निरूपित करें, इसके लिए 95% विश्वास अंतराल <math>\mu</math> द्वारा दिया गया है <math>\bar{X} \pm t_{n-1,0.975} S / \sqrt{n}</math>, कहाँ <math>t_{m,1-\alpha}</math> को दर्शाता है <math>1-\alpha</math> एक विद्यार्थी के t-वितरण की मात्रा|t-वितरण के साथ <math>m</math> स्वतंत्रता की कोटियां। मध्य वायु नेतृत्व स्तर के लिए बाध्य 95% ऊपरी विश्वास प्राप्त करना भी रुचिकर हो सकता है। इस तरह के लिए बाध्य <math>\mu</math> द्वारा दिया गया है <math>\bar{X} + t_{n-1,0.95} S / \sqrt{n}</math>. परिणामस्वरूप, मध्य वायु नेतृत्व के लिए बाध्य 95% ऊपरी विश्वास द्वारा दिया जाता है <math>\exp{\left( \bar{X} + t_{n-1,0.95} S / \sqrt{n} \right)}</math>. अब मान लीजिए कि हम प्रयोगशाला के भीतर एक विशेष क्षेत्र में वायु सीसे के स्तर की भविष्यवाणी करना चाहते हैं। लॉग-रूपांतरित लीड स्तर के लिए 95% ऊपरी पूर्वानुमान सीमा दी गई है <math>\bar{X} + t_{n-1,0.95} S \sqrt{\left( 1 + 1/n \right)}</math>. दो-तरफा भविष्यवाणी अंतराल की गणना इसी तरह की जा सकती है। इन अंतरालों का अर्थ और व्याख्या सर्वविदित है। उदाहरण के लिए, यदि विश्वास अंतराल <math>\bar{X} \pm t_{n-1,0.975} S / \sqrt{n}</math> स्वतंत्र नमूनों से बार-बार गणना की जाती है, इस प्रकार गणना किए गए 95% अंतरालों में का सही मूल्य शामिल होगा <math>\mu</math>, लंबे समय में। दूसरे शब्दों में, अंतराल का उद्देश्य पैरामीटर से संबंधित जानकारी प्रदान करना है <math>\mu</math> केवल। एक पूर्वानुमान अंतराल की एक समान व्याख्या होती है, और इसका उद्देश्य केवल एकल लीड स्तर से संबंधित जानकारी प्रदान करना होता है। अब मान लीजिए कि हम नमूने का उपयोग करके यह निष्कर्ष निकालना चाहते हैं कि कम से कम 95% जनसंख्या का नेतृत्व स्तर एक सीमा से नीचे है या नहीं। विश्वास अंतराल और पूर्वानुमान अंतराल इस प्रश्न का उत्तर नहीं दे सकते, क्योंकि विश्वास अंतराल केवल मध्य लीड स्तर के लिए है, और पूर्वानुमान अंतराल केवल एकल लीड स्तर के लिए है। जो आवश्यक है वह एक सहनशीलता अंतराल है; अधिक विशेष रूप से, ऊपरी सहनशीलता सीमा। ऊपरी सहनशीलता सीमा की गणना इस शर्त के अधीन की जानी है कि कम से कम 95% आबादी का नेतृत्व स्तर एक निश्चित आत्मविश्वास स्तर, मान लीजिए 99% के साथ, सीमा से नीचे है।</blockquote>
एयर लेड का स्तर सुविधा के अंदर <math>n=15</math> विभिन्न क्षेत्रों से एकत्र किया गया था। यह नोट किया गया था कि लॉग-रूपांतरित लीड स्तर एक सामान्य वितरण को अच्छी तरह से फिट करते हैं (अर्थात, डेटा एक [[लॉगनॉर्मल वितरण]] से हैं। चलो <math>\mu</math> और <math>\sigma^2</math>क्रमशः, लॉग-रूपांतरित डेटा के लिए जनसंख्या माध्य और विचरण को निरूपित करें। यदि <math>X</math> इस प्रकार हमारे पास संगत यादृच्छिक चर को दर्शाता है तो हमारे पास <math>X \sim \mathcal{N}(\mu, \sigma^2)</math>.है  हमने ध्यान दिया कि <math>\exp(\mu)</math> औसत वायु नेतृत्व स्तर है। t-वितरण के आधार पर, <math>\mu</math> के लिए एक विश्वास अंतराल का निर्माण सामान्य विधि से किया जा सकता है; यह बदले में औसत वायु नेतृत्व स्तर के लिए एक विश्वास अंतराल प्रदान करेगा। यदि <math>\bar{X}</math> और <math>S</math> आकार n के नमूने के लिए लॉग-रूपांतरित डेटा के नमूना माध्य और मानक विचलन को निरूपित करें, इसके लिए 95% विश्वास अंतराल <math>\mu</math> द्वारा दिया गया है <math>\bar{X} \pm t_{n-1,0.975} S / \sqrt{n}</math>, जहाँ <math>t_{m,1-\alpha}</math> को दर्शाता है <math>1-\alpha</math> एक विद्यार्थी के t-वितरण की मात्रा|t-वितरण के साथ <math>m</math> स्वतंत्रता की कोटियां। मध्य वायु नेतृत्व स्तर के लिए बाध्य 95% ऊपरी विश्वास प्राप्त करना भी रुचिकर हो सकता है। इस तरह के लिए बाध्य <math>\mu</math> द्वारा दिया गया है <math>\bar{X} + t_{n-1,0.95} S / \sqrt{n}</math>. परिणामस्वरूप, मध्य वायु नेतृत्व के लिए बाध्य 95% ऊपरी विश्वास द्वारा दिया जाता है <math>\exp{\left( \bar{X} + t_{n-1,0.95} S / \sqrt{n} \right)}</math>. अब मान लीजिए कि हम प्रयोगशाला के अंदर  एक विशेष क्षेत्र में वायु सीसे के स्तर की पूर्वानुमान करना चाहते हैं। लॉग-रूपांतरित लीड स्तर के लिए 95% ऊपरी पूर्वानुमान सीमा दी गई है <math>\bar{X} + t_{n-1,0.95} S \sqrt{\left( 1 + 1/n \right)}</math>. दो-तरफा पूर्वानुमान अंतराल की गणना इसी तरह की जा सकती है। इन अंतरालों का अर्थ और व्याख्या सर्वविदित है। उदाहरण के लिए, यदि विश्वास अंतराल <math>\bar{X} \pm t_{n-1,0.975} S / \sqrt{n}</math> स्वतंत्र नमूनों से बार-बार गणना की जाती है, इस प्रकार गणना किए गए 95% अंतरालों में का सही मूल्य सम्मिलित होगा <math>\mu</math>, लंबे समय में दूसरे शब्दों में, अंतराल का उद्देश्य पैरामीटर से संबंधित जानकारी प्रदान करना है जो की <math>\mu</math> केवल एक पूर्वानुमान अंतराल की एक समान व्याख्या होती है, और इसका उद्देश्य केवल एकल लीड स्तर से संबंधित जानकारी प्रदान करना होता है। अब मान लीजिए कि हम नमूने का उपयोग करके यह निष्कर्ष निकालना चाहते हैं कि कम से कम 95% जनसंख्या का नेतृत्व स्तर एक सीमा से नीचे है या नहीं। विश्वास अंतराल और पूर्वानुमान अंतराल इस प्रश्न का उत्तर नहीं दे सकते है, क्योंकि विश्वास अंतराल केवल मध्य लीड स्तर के लिए है, और पूर्वानुमान अंतराल केवल एकल लीड स्तर के लिए है। जो आवश्यक है वह एक सहनशीलता अंतराल है; अधिक विशेष रूप से, ऊपरी सहनशीलता सीमा को ऊपरी सहनशीलता सीमा की गणना इस नियम के अधीन की जानी है कि कम से कम 95% संख्या का नेतृत्व स्तर एक निश्चित आत्मविश्वास स्तर, मान लीजिए 99% के साथ, सीमा से नीचे है।


==यह भी देखें==
==यह भी देखें==

Revision as of 09:10, 14 July 2023


सहिष्णुता अंतराल (टीआई) एक सांख्यिकीय अंतराल है जिसके अंदर, कुछ आत्मविश्वास स्तर के साथ, जनसंख्या का एक निर्दिष्ट नमूना अनुपात आता है। "अधिक विशेष रूप से, एक 100×p%/100×(1−α) सहनशीलता अंतराल सीमा प्रदान करता है जिसके अंदर जनसंख्या का कम से कम एक निश्चित अनुपात (p) आत्मविश्वास के एक निश्चित स्तर (1−α) के साथ आता है।"[1] "एक नमूने के आधार पर a (p, 1−α) सहनशीलता अंतराल (टीआई) का निर्माण किया जाता है जिससे इसमें आत्मविश्वास 1−α के साथ नमूना संख्या का कम से कम अनुपात पी सम्मिलित हो; ऐसे TI को समान्यत: p-content - (1−α) कवरेज TI कहा जाता है।"[2] "A (p, 1−α) ऊपरी सहनशीलता सीमा (टीएल) जनसंख्या के 100 पी प्रतिशतक के लिए बस 1−α ऊपरी आत्मविश्वास सीमा है।"[2]

गणना

एक पक्ष के सामान्य सहनशीलता अंतराल का गैर-केंद्रीय टी-वितरण या गैरकेंद्रीय टी-वितरण के आधार पर नमूना माध्य और नमूना विचरण के संदर्भ में एक स्पष्ट समाधान होता है।[3]

गैर-केंद्रीय ची-वर्ग वितरण के आधार पर दो-पक्षीय सामान्य सहिष्णुता अंतराल प्राप्त किया जा सकता है।[3]

अन्य अंतरालों से संबंध

"पैरामीटर-ज्ञात स्थिति में, 95% सहिष्णुता अंतराल और 95% पूर्वानुमान अंतराल समान हैं।"[4] यदि हमें जनसंख्या के स्पष्ट पैरामीटर पता होते, तो हम एक सीमा की गणना करने में सक्षम होते जिसके अंदर एक निश्चित अनुपात होता है। जनसंख्या गिरती है. उदाहरण के लिए, यदि हम जानते हैं कि एक जनसंख्या सामान्यतः माध्य और मानक विचलन के साथ वितरित की जाती है, तो अंतराल में 95% जनसंख्या सम्मिलित होती है (1.96 सामान्य रूप से वितरित जनसंख्या के 95% कवरेज के लिए z के स्कोर है)।

चूँकि , यदि हमारे पास जनसंख्या से केवल एक नमूना है, तो हम केवल नमूना माध्य और नमूना मानक विचलन जानते हैं, जो केवल सही मापदंडों के अनुमान हैं। उस स्थिति में, इन अनुमानों में भिन्नता के कारण, में आवश्यक रूप से 95% जनसंख्या सम्मिलित नहीं होगी। एक सहिष्णुता अंतराल एक आत्मविश्वास स्तर का परिचय देकर इस भिन्नता को सीमित करता है , जो वह आत्मविश्वास है जिसके साथ यह अंतराल वास्तव में जनसंख्या के निर्दिष्ट अनुपात को सम्मिलित करता है। सामान्य रूप से वितरित जनसंख्या के लिए एक z-स्कोर को लुकअप तालिकाओं या कई सन्निकटन सूत्रों के माध्यम से किसी दिए गए के लिए "k कारक" या सहिष्णुता कारक[5] में परिवर्तित किया जा सकता है।[6] जैसे-जैसे स्वतंत्रता की डिग्री अनंत तक पहुंचती है, पूर्वानुमान और सहनशीलता का अंतराल समान हो जाता है।[7]

सहिष्णुता अंतराल को आत्मविश्वास अंतराल और पूर्वानुमान अंतराल की तुलना में कम व्यापक रूप से जाना जाता है, इस स्थिति पर कुछ शिक्षकों ने खेद व्यक्त किया है, क्योंकि इससे अन्य अंतरालों का दुरुपयोग हो सकता है जहां सहिष्णुता अंतराल अधिक उपयुक्त है।[8][9]

सहिष्णुता अंतराल आत्मविश्वास अंतराल से भिन्न होता है जिसमें आत्मविश्वास अंतराल एकल-मूल्य वाले जनसंख्या पैरामीटर (उदाहरण के लिए माध्य या विचरण) को कुछ आत्मविश्वास के साथ बांधता है, जबकि सहिष्णुता अंतराल डेटा मानों की सीमा को सीमित करता है जिसमें एक विशिष्ट अनुपात सम्मिलित होता है संख्या जबकि आत्मविश्वास अंतराल का आकार पूरी तरह से नमूनाकरण त्रुटि के कारण होता है, और नमूना आकार बढ़ने पर वास्तविक जनसंख्या पैरामीटर पर शून्य-चौड़ाई अंतराल तक पहुंच जाएगा, जिससे सहिष्णुता अंतराल का आकार आंशिक रूप से नमूनाकरण त्रुटि और आंशिक रूप से जनसंख्या में वास्तविक भिन्नता के कारण होता है, और जैसे-जैसे नमूना आकार बढ़ेगा, जनसंख्या की संभाव्यता अंतराल के समीप पहुंच जाएगी।[8][9]

सहिष्णुता अंतराल एक पूर्वानुमान अंतराल से संबंधित है जिसमें दोनों भविष्य के नमूनों में भिन्नता पर सीमाएं लगाते हैं। चूँकि पूर्वानुमान अंतराल केवल एक भविष्य के नमूने को सीमित करता है, जबकि एक सहिष्णुता अंतराल पूरी संख्या को सीमित करता है (समकक्ष, भविष्य के नमूनों का एक इच्छानुसार अनुक्रम)। दूसरे शब्दों में, एक पूर्वानुमान अंतराल औसतन जनसंख्या के एक निर्दिष्ट अनुपात को आवरण करता है, जबकि एक सहिष्णुता अंतराल इसे एक निश्चित आत्मविश्वास स्तर के साथ आवरण करता है, जिससे सहिष्णुता अंतराल अधिक उपयुक्त हो जाता है यदि एक अंतराल का उद्देश्य कई भविष्य के नमूनों को बाध्य करना है।[9][10]


उदाहरण

[8]निम्नलिखित उदाहरण देता है:

<ब्लॉकउद्धरण>

तो एक बार फिर से एक लौकिक ईपीए माइलेज परीक्षण परिदृश्य पर विचार करें, जिसमें माइलेज आंकड़े उत्पन्न करने के लिए एक विशेष मॉडल के कई नाममात्र समान ऑटो का परीक्षण किया जाता है। यदि इस तरह के डेटा को मॉडल के औसत माइलेज के लिए 95% विश्वास अंतराल उत्पन्न करने के लिए संसाधित किया जाता है, तो उदाहरण के लिए, ऐसे ऑटो के निर्मित बेड़े के पहले 5,000 मील के समय औसत या कुल गैसोलीन उपयोग `का अनुमान लगाने के लिए इसका उपयोग करना संभव है। उपयोग के। चूँकि इस तरह का अंतराल, इन कारों में से किसी एक को किराए पर लेने वाले व्यक्ति के लिए बहुत सहायता नहीं होगा और सोच रहा होगा कि गैस का (पूरा) 10-गैलन टैंक उसे 350 मील अपने गंतव्य तक ले जाने के लिए पर्याप्त होगा या नहीं उस कार्य के लिए, पूर्वानुमान अंतराल अधिक उपयोगी होगा। ("95% आश्वस्त" होने के विभिन्न निहितार्थों पर विचार करें कि न कि "95% आश्वस्त" होने के विपरीत कि लेकिन न तो के लिए कोई विश्वास अंतराल है और न ही एक अतिरिक्त माइलेज के लिए पूर्वानुमान अंतराल ठीक वैसा ही है जैसा एक डिज़ाइन इंजीनियर को चाहिए होता है जो यह निर्धारित करता है कि मॉडल को वास्तव में कितने बड़े गैस टैंक की आवश्यकता है जिससे यह आश्वासन दी जा सकता है कि उत्पादित 99% ऑटो में 400-मील की क्रूज़िंग रेंज होगी। इंजीनियर को वास्तव में ऐसे ऑटो के माइलेज के अंश के लिए सहनशीलता अंतराल की आवश्यकता होती है।

एक और उदाहरण दिया गया है:[10]

<ब्लॉककोट>

एयर लेड का स्तर सुविधा के अंदर विभिन्न क्षेत्रों से एकत्र किया गया था। यह नोट किया गया था कि लॉग-रूपांतरित लीड स्तर एक सामान्य वितरण को अच्छी तरह से फिट करते हैं (अर्थात, डेटा एक लॉगनॉर्मल वितरण से हैं। चलो और क्रमशः, लॉग-रूपांतरित डेटा के लिए जनसंख्या माध्य और विचरण को निरूपित करें। यदि इस प्रकार हमारे पास संगत यादृच्छिक चर को दर्शाता है तो हमारे पास .है हमने ध्यान दिया कि औसत वायु नेतृत्व स्तर है। t-वितरण के आधार पर, के लिए एक विश्वास अंतराल का निर्माण सामान्य विधि से किया जा सकता है; यह बदले में औसत वायु नेतृत्व स्तर के लिए एक विश्वास अंतराल प्रदान करेगा। यदि और आकार n के नमूने के लिए लॉग-रूपांतरित डेटा के नमूना माध्य और मानक विचलन को निरूपित करें, इसके लिए 95% विश्वास अंतराल द्वारा दिया गया है , जहाँ को दर्शाता है एक विद्यार्थी के t-वितरण की मात्रा|t-वितरण के साथ स्वतंत्रता की कोटियां। मध्य वायु नेतृत्व स्तर के लिए बाध्य 95% ऊपरी विश्वास प्राप्त करना भी रुचिकर हो सकता है। इस तरह के लिए बाध्य द्वारा दिया गया है . परिणामस्वरूप, मध्य वायु नेतृत्व के लिए बाध्य 95% ऊपरी विश्वास द्वारा दिया जाता है . अब मान लीजिए कि हम प्रयोगशाला के अंदर एक विशेष क्षेत्र में वायु सीसे के स्तर की पूर्वानुमान करना चाहते हैं। लॉग-रूपांतरित लीड स्तर के लिए 95% ऊपरी पूर्वानुमान सीमा दी गई है . दो-तरफा पूर्वानुमान अंतराल की गणना इसी तरह की जा सकती है। इन अंतरालों का अर्थ और व्याख्या सर्वविदित है। उदाहरण के लिए, यदि विश्वास अंतराल स्वतंत्र नमूनों से बार-बार गणना की जाती है, इस प्रकार गणना किए गए 95% अंतरालों में का सही मूल्य सम्मिलित होगा , लंबे समय में दूसरे शब्दों में, अंतराल का उद्देश्य पैरामीटर से संबंधित जानकारी प्रदान करना है जो की केवल एक पूर्वानुमान अंतराल की एक समान व्याख्या होती है, और इसका उद्देश्य केवल एकल लीड स्तर से संबंधित जानकारी प्रदान करना होता है। अब मान लीजिए कि हम नमूने का उपयोग करके यह निष्कर्ष निकालना चाहते हैं कि कम से कम 95% जनसंख्या का नेतृत्व स्तर एक सीमा से नीचे है या नहीं। विश्वास अंतराल और पूर्वानुमान अंतराल इस प्रश्न का उत्तर नहीं दे सकते है, क्योंकि विश्वास अंतराल केवल मध्य लीड स्तर के लिए है, और पूर्वानुमान अंतराल केवल एकल लीड स्तर के लिए है। जो आवश्यक है वह एक सहनशीलता अंतराल है; अधिक विशेष रूप से, ऊपरी सहनशीलता सीमा को ऊपरी सहनशीलता सीमा की गणना इस नियम के अधीन की जानी है कि कम से कम 95% संख्या का नेतृत्व स्तर एक निश्चित आत्मविश्वास स्तर, मान लीजिए 99% के साथ, सीमा से नीचे है।

यह भी देखें

संदर्भ

  1. D. S. Young (2010), Book Reviews: "Statistical Tolerance Regions: Theory, Applications, and Computation", TECHNOMETRICS, FEBRUARY 2010, VOL. 52, NO. 1, pp.143-144.
  2. 2.0 2.1 Krishnamoorthy, K. and Lian, Xiaodong(2011) 'Closed-form approximate tolerance intervals for some general linear models and comparison studies', Journal of Statistical Computation and Simulation, First published on: 13 June 2011 doi:10.1080/00949655.2010.545061
  3. 3.0 3.1 Derek S. Young (August 2010). "tolerance: An R Package for Estimating Tolerance Intervals". Journal of Statistical Software. 36 (5): 1–39. ISSN 1548-7660. Retrieved 19 February 2013., p.23
  4. Thomas P. Ryan (22 June 2007). आधुनिक इंजीनियरिंग सांख्यिकी. John Wiley & Sons. pp. 222–. ISBN 978-0-470-12843-5. Retrieved 22 February 2013.
  5. "Statistical interpretation of data — Part 6: Determination of statistical tolerance intervals". ISO 16269-6. 2014. p. 2.
  6. "Tolerance intervals for a normal distribution". इंजीनियरिंग सांख्यिकी पुस्तिका. NIST/Sematech. 2010. Retrieved 2011-08-26.
  7. De Gryze, S.; Langhans, I.; Vandebroek, M. (2007). "Using the correct intervals for prediction: A tutorial on tolerance intervals for ordinary least-squares regression". Chemometrics and Intelligent Laboratory Systems. 87 (2): 147. doi:10.1016/j.chemolab.2007.03.002.
  8. 8.0 8.1 8.2 Stephen B. Vardeman (1992). "What about the Other Intervals?". The American Statistician. 46 (3): 193–197. doi:10.2307/2685212. JSTOR 2685212.
  9. 9.0 9.1 9.2 Mark J. Nelson (2011-08-14). "आपको सहनशीलता अंतराल की आवश्यकता हो सकती है". Retrieved 2011-08-26.
  10. 10.0 10.1 K. Krishnamoorthy (2009). Statistical Tolerance Regions: Theory, Applications, and Computation. John Wiley and Sons. pp. 1–6. ISBN 978-0-470-38026-0.


अग्रिम पठन

  • Hahn, Gerald J.; Meeker, William Q.; Escobar, Luis A. (2017). Statistical Intervals: A Guide for Practitioners and Researchers (2nd ed.). John Wiley & Sons, Incorporated. ISBN 978-0-471-68717-7.