फैलाव का सूचकांक: Difference between revisions

From Vigyanwiki
(Created page with "{{Short description|Normalized measure of the dispersion of a probability distribution}} {{broader|Statistical dispersion}} संभाव्यता सिद्धां...")
 
No edit summary
 
(12 intermediate revisions by 3 users not shown)
Line 1: Line 1:
{{Short description|Normalized measure of the dispersion of a probability distribution}}
{{Short description|Normalized measure of the dispersion of a probability distribution}}
{{broader|Statistical dispersion}}
{{broader|सांख्यिकीय फैलाव}}
संभाव्यता सिद्धांत और सांख्यिकी में, फैलाव का सूचकांक,<ref>Cox &Lewis (1966)</ref> फैलाव सूचकांक, फैलाव का गुणांक, सापेक्ष भिन्नता, या भिन्नता-से-माध्य अनुपात (वीएमआर), भिन्नता के गुणांक की तरह, संभाव्यता वितरण के [[सांख्यिकीय फैलाव]] का एक [[सामान्यीकरण (सांख्यिकी)]] उपाय है: यह मात्रा निर्धारित करने के लिए उपयोग किया जाने वाला एक उपाय है मानक सांख्यिकीय मॉडल की तुलना में देखी गई घटनाओं का एक सेट क्लस्टर या फैला हुआ है या नहीं।
संभाव्यता सिद्धांत और सांख्यिकी में, '''फैलाव का सूचकांक''',और<ref>Cox &Lewis (1966)</ref> '''फैलाव का गुणांक''', '''सापेक्ष भिन्नता''', या '''भिन्नता-से-माध्य अनुपात''' (वीएमआर), भिन्नता के गुणांक की प्रकार, संभाव्यता वितरण के [[सांख्यिकीय फैलाव|सांख्यिकीय]] फैलाव का [[सामान्यीकरण (सांख्यिकी)]] उपाय है, यह मात्रा निर्धारित करने के लिए उपयोग किया जाता है मानक सांख्यिकीय नमूना की समानता में देखी गई घटनाओं का सेट क्लस्टर फैला हुआ है या फैला हुआ नहीं है।


इसे विचरण के अनुपात के रूप में परिभाषित किया गया है <math>\sigma^2</math> मतलब के लिए <math>\mu</math>,
इसे विचरण <math>\sigma^2</math> के अनुपात <math>\mu</math> के रूप में परिभाषित किया जाता है,
:<math>D = {\sigma^2 \over \mu }.</math>
:<math>D = {\sigma^2 \over \mu }.</math>
इसे फ़ैनो फ़ैक्टर के रूप में भी जाना जाता है, हालांकि यह शब्द कभी-कभी ''विंडो'' डेटा के लिए आरक्षित होता है (माध्य और विचरण की गणना उप-जनसंख्या पर की जाती है), जहां फैलाव के सूचकांक का उपयोग विशेष मामले में किया जाता है जहां विंडो अनंत है . विंडोइंग डेटा अक्सर किया जाता है: वीएमआर की गणना अक्सर समय के विभिन्न अंतरालों या अंतरिक्ष के छोटे क्षेत्रों में की जाती है, जिसे विंडोज़ कहा जा सकता है, और परिणामी आंकड़े को [[फैनो फैक्टर]] कहा जाता है।
इसे फ़ैनो फ़ैक्टर के रूप में भी जाना जाता है, चूंकि यह शब्द कभी-कभी ''विंडो'' डेटा के लिए सुरक्षित रखा जाता है इसलिए (माध्य और विचरण की गणना उप-जनसंख्या पर की जाती है), जहां फैलाव के सूचकांक का उपयोग विशेष स्थितियों में किया जाता है जहां विंडो अनंत है इसलिए विंडोइंग डेटा को विंडोवड करना अधिकांशतः किया जाता है: VMR की गणना अधिकांशतः समय के विभिन्न अंतरालों या अंतरिक्ष के छोटे क्षेत्रों में की जाती है, जिसे विंडोज़ कहा जा सकता है, और परिणामी आंकड़े को [[फैनो फैक्टर]] कहा जाता है।


इसे केवल तभी परिभाषित किया जाता है जब माध्य हो <math>\mu</math> गैर-शून्य है, और आम तौर पर इसका उपयोग केवल सकारात्मक आंकड़ों के लिए किया जाता है, जैसे घटनाओं के बीच डेटा या समय की गणना करना, या जहां अंतर्निहित वितरण को घातीय वितरण या पॉइसन वितरण माना जाता है।
इसे केवल तभी परिभाषित किया जाता है जब माध्य <math>\mu</math> गैर-शून्य हो, और सामान्यतः इसका उपयोग केवल सकारात्मक आंकड़ों के लिए किया जाता है, जैसे घटनाओं के बीच डेटा या समय की गणना करना, या अंतर्निहित वितरण को घातीय वितरण या पॉइसन वितरण माना जाता है।


== शब्दावली ==
== शब्दावली ==
इस संदर्भ में, देखे गए डेटासेट में पूर्वनिर्धारित घटनाओं के घटित होने का समय शामिल हो सकता है, जैसे किसी दिए गए क्षेत्र में किसी दिए गए परिमाण से अधिक भूकंप, या किसी दिए गए प्रजाति के पौधों के भौगोलिक स्थान में स्थान। ऐसी घटनाओं का विवरण पहले समान आकार के समय- या स्थान-क्षेत्रों के प्रत्येक सेट में घटनाओं या घटनाओं की संख्या की गणना में परिवर्तित किया जाता है।
इस संदर्भ में, देखे गए डेटासेट में पूर्व निर्धारित घटनाओं के घटित होने का समय सम्मलित हो सकता है, जैसे कि निश्चित क्षेत्र में होने वाले भूकंपों की घटनाओं के समय या निश्चित प्रजाति के पौधों के भूगोलीय अंतरिक्ष में स्थान, संख्या के रूप में परिवर्तित किए जाते हैं। इस तरह की घटनाओं के आयतन की गणना की जाती है, जिसमें समान आकार के समय- या स्थान-क्षेत्रों में प्रत्येक घटनाओं या घटनाओं की संख्या की गणना की जाती है।


उपरोक्त गणनाओं के लिए फैलाव सूचकांक को परिभाषित करता है।<ref>Cox & Lewis (1966), p72</ref> अंतरालों के लिए फैलाव सूचकांक के लिए एक अलग परिभाषा लागू होती है,<ref>Cox & Lewis (1966), p71</ref> जहां उपचारित मात्राएं घटनाओं के बीच के समय-अंतराल की लंबाई हैं। सामान्य उपयोग यह है कि फैलाव सूचकांक का अर्थ गिनती के लिए फैलाव सूचकांक है।
इसलिए उपरोक्त गणनाओं के लिए फैलाव सूचकांक को परिभाषित करता है।<ref>Cox & Lewis (1966), p72</ref> अंतरालों के लिए फैलाव सूचकांक के लिए अलग परिभाषा लागू होती है, जहां संख्याओं की विस्तार होती है,<ref>Cox & Lewis (1966), p71</ref> जिन्हें घटनाओं के बीच समय-अंतराल की लंबाई के रूप में देखा जाता है। सामान्यतः उपयोग किया जाने वाला शब्द "फैलाव सूचकांक" गिनती के लिए फैलाव सूचकांक का अर्थ होता है।


== व्याख्या ==
== व्याख्या ==
कुछ वितरण, विशेष रूप से पॉइसन वितरण, में समान भिन्नता और माध्य होता है, जिससे उन्हें VMR = 1 मिलता है। [[ज्यामितीय वितरण]] और नकारात्मक [[द्विपद वितरण]] में VMR > 1 होता है, जबकि द्विपद वितरण में VMR <1 होता है, और [[निरंतर यादृच्छिक चर]] होता है वीएमआर = 0. इससे निम्नलिखित तालिका प्राप्त होती है:
कुछ वितरण, विशेष रूप से पॉइसन वितरण में फैलाव और माध्य समान होता है, जिसके कारण उनका VMR = 1 होता है। [[ज्यामितीय वितरण]] और नकारात्मक [[द्विपद वितरण]] में VMR > 1 होता है, चूँकि द्विपद वितरण में VMR <1 होता है, और [[निरंतर यादृच्छिक चर]] VMR = 0 होता है। इससे निम्नलिखित तालिका प्राप्त होती है:
{|
{|
! Distribution !! VMR !!
! वितरण !! VMR !!
|-
|-
| [[constant random variable]] || VMR = 0 || not dispersed
| [[constant random variable|स्थिर यादृच्छिक चर]] || VMR = 0 ||अविस्पंशित
|-
|-
| [[binomial distribution]] || 0 < VMR < 1 || under-dispersed
| [[binomial distribution|बाइनोमियल वितरण]] || 0 < VMR < 1 ||अविस्पंशित
|-
|-
| [[Poisson distribution]] || VMR = 1 ||
| [[Poisson distribution|पॉइसन वितरण]] || VMR = 1 ||
|-
|-
| [[negative binomial distribution]] || VMR > 1 || over-dispersed
| [[negative binomial distribution|नकारात्मक बाइनोमियल वितरण]] || VMR > 1 ||अधिक विस्पंशित
|}
|}
इसे [[विलक्षणता (गणित)]] द्वारा शंकु वर्गों के वर्गीकरण के अनुरूप माना जा सकता है; विवरण के लिए कुछ असतत संभाव्यता वितरणों के Cumulant#Cumulant देखें।
इसे [[विलक्षणता (गणित)]] के लिए शंकु वर्गों के वर्गीकरण के अनुरूप माना जा सकता है; विवरण के लिए कुछ असतत संभाव्यता वितरणों के संचयी देखें गए है।


फैलाव सूचकांक की प्रासंगिकता यह है कि इसका मान 1 होता है जब किसी अंतराल में घटनाओं की संख्या का संभाव्यता वितरण एक पॉइसन वितरण होता है। इस प्रकार माप का उपयोग यह आकलन करने के लिए किया जा सकता है कि क्या देखे गए डेटा को [[पॉइसन प्रक्रिया]] का उपयोग करके मॉडल किया जा सकता है। जब फैलाव का गुणांक 1 से कम होता है, तो एक डेटासेट को कम-फैला हुआ कहा जाता है: यह स्थिति घटना के पैटर्न से संबंधित हो सकती है जो पॉइसन प्रक्रिया से जुड़ी यादृच्छिकता से अधिक नियमित होती है। उदाहरण के लिए, नियमित, आवधिक घटनाओं को कम फैलाया जाएगा। यदि फैलाव का सूचकांक 1 से बड़ा है, तो एक डेटासेट को अति-फैलाव|अति-फैला हुआ कहा जाता है।
फैलाव सूचकांक की प्रासंगिकता यह है कि जब अंतराल में घटनाओं की संभावना वितरण पॉइसन वितरण होता है, तो यह 1 का मान रखता है। इस प्रकार माप का उपयोग किया जा सकता है ताकि देखा गया डेटा को [[पॉइसन प्रक्रिया]] का उपयोग करके नमूना किया जा सकता है। जब फैलाव सूचकांक 1 से कम होता है, तो डेटासेट को "अविस्पंशित" कहा जाता है: यह स्थिति पॉइसन प्रक्रिया के साथ संबद्ध यादृच्छिकता की समानता में नियमितता वाले प्रायिकताओं से संबंधित हो सकती है। उदाहरण के लिए, नियमित, आवर्ती घटनाएं अविस्पंशित होंगी। अगर फैलाव सूचकांक 1 से अधिक होता है, तो डेटासेट "अधिक विस्पंशित" कहलाता है।


फैलाव सूचकांक के एक नमूना-आधारित अनुमान का उपयोग मॉडल की पर्याप्तता के लिए एक औपचारिक [[सांख्यिकीय परिकल्पना परीक्षण]] के निर्माण के लिए किया जा सकता है कि गिनती की एक श्रृंखला पॉइसन वितरण का पालन करती है।<ref>Cox & Lewis (1966), p158</ref><ref>Upton & Cook(2006), under index of dispersion</ref> अंतराल-गिनती के संदर्भ में, अति-फैलाव, पॉइसन वितरण की तुलना में कम गिनती के साथ अधिक अंतराल और उच्च गिनती के साथ अधिक अंतराल से मेल खाता है: इसके विपरीत, कम-फैलाव की विशेषता अधिक अंतराल होने से होती है, जिसकी गिनती करीब होती है पॉइसन वितरण की तुलना में माध्य गणना।
फैलाव सूचकांक के नमूना-आधारित अनुमान का उपयोग नमूना की पर्याप्तता के लिए औपचारिक [[सांख्यिकीय परिकल्पना परीक्षण]] के निर्माण के लिए किया जा सकता है इसलिए गिनती की श्रृंखला पॉइसन वितरण का पालन करती है।<ref>Cox & Lewis (1966), p158</ref><ref>Upton & Cook(2006), under index of dispersion</ref> जिससे अंतराल-गिनती के संदर्भ में, अति-फैलाव, पॉइसन वितरण की समानता में कम गिनती के साथ अधिक अंतराल और उच्च गिनती के साथ अधिक अंतराल से मेल खाता है: इसके विपरीत, कम-फैलाव की विशेषता अधिक अंतराल होने से होती है, जिसकी गिनती करीब होती है पॉइसन वितरण की समानता में माध्य गणना होती है ।


वीएमआर किसी दी गई घटना की यादृच्छिकता की डिग्री का भी एक अच्छा माप है। उदाहरण के लिए, इस तकनीक का उपयोग आमतौर पर मुद्रा प्रबंधन में किया जाता है।
VMR किसी दी गई घटना की यादृच्छिकता की डिग्री का भी अच्छा माप है। उदाहरण के लिए, इस कार्यपद्धति का उपयोग सामान्यतः मुद्रा प्रबंधन में किया जाता है।


== उदाहरण ==
== उदाहरण ==
बेतरतीब ढंग से फैलने वाले कणों ([[एक प्रकार कि गति]]) के लिए, किसी दिए गए आयतन के अंदर कणों की संख्या का वितरण पॉइसोनियन है, यानी वीएमआर = 1। इसलिए, यह आकलन करने के लिए कि क्या दिया गया स्थानिक पैटर्न (यह मानते हुए कि आपके पास इसे मापने का एक तरीका है) पूरी तरह से प्रसार के कारण है या यदि कुछ कण-कण संपर्क शामिल है: अंतरिक्ष को पैच, क्वाड्रेट या नमूना इकाइयों (एसयू) में विभाजित करें, गिनती करें प्रत्येक पैच या एसयू में व्यक्तियों की संख्या, और वीएमआर की गणना करें। 1 से काफी अधिक वीएमआर एक क्लस्टर्ड वितरण को दर्शाता है, जहां आकर्षक अंतर-कण क्षमता को कम करने के लिए यादृच्छिक चलना पर्याप्त नहीं है।
यदि यादृच्छिक रूप से फैली हुई कणों ( [[एक प्रकार कि गति|प्रकार कि गति]]) के लिए, दिए गए आयतन में कणों की संख्या का वितरण पॉइसोनियन होता है, अर्थात् VMR=1 होता है। इसलिए, यदि आपके पास उसे मापने का तरीका होता है, तो यह निर्धारित करने के लिए कि क्या दिए गए आवर्तन में किसी कण-कण के बीच कुछ प्रभावशीलता सम्मलित है या नहीं: स्थान को पैचों, चतुष्कोणों या नमूना इकाइयों (SU) में विभाजित करें, प्रत्येक पैच या SU में व्यक्तियों की संख्या गणना करें, और VMR की गणना करें। 1 से काफी अधिक VMR के द्वारा पुष्टि की जाती है कि वहां क्लस्टर वितरण है, जहां संयोजक कण-कण की आकर्षक शक्ति को स्मोथर करने के लिए यादृच्छिक चलन पर पर्याप्त नहीं होता है।


== इतिहास ==
== इतिहास ==


पॉइसन या द्विपद वितरण से विचलन का पता लगाने के लिए परीक्षण के उपयोग पर चर्चा करने वाला पहला व्यक्ति 1877 में लेक्सिस था। उनके द्वारा विकसित परीक्षणों में से एक लेक्सिस अनुपात था।
पॉइसन या द्विपद वितरण से विचलन का पता लगाने के लिए परीक्षण के उपयोग पर चर्चा करने वाला पहला व्यक्ति 1877 में लेक्सिस था। उनके द्वारा विकसित परीक्षणों में से लेक्सिस अनुपात था।  


वनस्पति विज्ञान में इस सूचकांक का प्रयोग पहली बार 1936 में [[आर्थर रॉय क्लैफम]] द्वारा किया गया था।
इस सूचकांक का पहली बार वनस्पति विज्ञान में 1936 में [[आर्थर रॉय क्लैफम]] ने उपयोग किया था।


यदि चर को पॉइसन वितरित किया जाता है तो फैलाव का सूचकांक χ के रूप में वितरित किया जाता है<sup>2</sup> n के साथ आँकड़ा - 1 स्वतंत्रता की डिग्री जब n बड़ा हो और μ > 3 हो।<ref name=Frome1982>{{cite journal |last=Frome |first=E. L. |year=1982 |title=Algorithm AS 171: Fisher's Exact Variance Test for the Poisson Distribution |journal=[[Journal of the Royal Statistical Society, Series C]]|volume=31 |issue=1 |pages=67–71 |doi=10.2307/2347079 |jstor=2347079 }}</ref> रुचि के कई मामलों के लिए यह अनुमान सटीक है और फिशर ने 1950 में इसके लिए एक सटीक परीक्षण निकाला।
यदि विविधताएँ पॉइसन वितरित हैं, तो फैलाव का सूचकांक χ<sup>2</sup> सांख्यिकी है जिसकी ''n'' - 1 स्वतंत्रता संख्या होती है जब n बड़ा होता है और ''μ'' > 3 होता है।<ref name=Frome1982>{{cite journal |last=Frome |first=E. L. |year=1982 |title=Algorithm AS 171: Fisher's Exact Variance Test for the Poisson Distribution |journal=[[Journal of the Royal Statistical Society, Series C]]|volume=31 |issue=1 |pages=67–71 |doi=10.2307/2347079 |jstor=2347079 }}</ref> बहुत सारे स्थितियों के लिए यह अनुमान त्रुटिहीन होता है और 1950 में फिशर ने इसके लिए त्रुटिहीन परीक्षा निर्धारित की थी।


पॉल जी. होएल ने इसके वितरण के पहले चार क्षणों का अध्ययन किया।<ref name=Hoel1943>{{cite journal |last=Hoel |first=P. G. |year=1943 |title=फैलाव के सूचकांकों पर|journal=[[Annals of Mathematical Statistics]] |volume=14 |issue=2 |pages=155–162 |doi= 10.1214/aoms/1177731457|jstor=2235818 |doi-access=free }}</ref> उन्होंने पाया कि χ का सन्निकटन<sup>2</sup> आँकड़ा उचित है यदि μ > 5.
पॉल जी. होएल ने इसके वितरण के पहले चार केंद्रीय विसंगतियों का अध्ययन किया था।<ref name=Hoel1943>{{cite journal |last=Hoel |first=P. G. |year=1943 |title=फैलाव के सूचकांकों पर|journal=[[Annals of Mathematical Statistics]] |volume=14 |issue=2 |pages=155–162 |doi= 10.1214/aoms/1177731457|jstor=2235818 |doi-access=free }}</ref> उन्होंने पाया कि यदि μ > 5 है तो χ<sup>2</sup> सांख्यिकी के प्रतिनिधित्व के लिए अनुमान उचित होता है।


==तिरछा वितरण==
==विषम वितरण==
अत्यधिक विषम वितरणों के लिए, द्विघात वितरण के विपरीत, रैखिक हानि फ़ंक्शन का उपयोग करना अधिक उपयुक्त हो सकता है। इस मामले में फैलाव का अनुरूप गुणांक डेटा के माध्यिका से माध्यिका तक औसत पूर्ण विचलन का अनुपात है,<ref name=Bonett2006>{{cite journal | last1 = Bonett | first1 = DG | last2 = Seier | first2 = E | year = 2006 | title = गैर-सामान्य वितरणों में फैलाव के गुणांक के लिए विश्वास अंतराल| journal = Biometrical Journal | volume = 48 | issue = 1| pages = 144–148 | doi=10.1002/bimj.200410148| pmid = 16544819 | s2cid = 33665632 }}</ref> या, प्रतीकों में:
जिससे अत्यधिक विषम वितरणों के लिए, द्विघात वितरण के विपरीत, रैखिक हानि फ़ंक्शन का उपयोग करना अधिक उपयुक्त हो सकता है। इस स्थितियों में फैलाव का अनुरूप गुणांक डेटा के माध्यिका से माध्यिका तक माध्य पूर्ण विचलन का अनुपात है,<ref name=Bonett2006>{{cite journal | last1 = Bonett | first1 = DG | last2 = Seier | first2 = E | year = 2006 | title = गैर-सामान्य वितरणों में फैलाव के गुणांक के लिए विश्वास अंतराल| journal = Biometrical Journal | volume = 48 | issue = 1| pages = 144–148 | doi=10.1002/bimj.200410148| pmid = 16544819 | s2cid = 33665632 }}</ref> या, प्रतीकों में प्रयोग किया जाता है:  


: <math> CD = \frac{1}{n}\frac{\sum_j{|m - x_j|}}{ m } </math> जहाँ n नमूना आकार है, m नमूना माध्यिका है और पूरे नमूने पर लिया गया योग है। [[आयोवा]], न्यूयॉर्क (राज्य) और दक्षिण डकोटा बकाया करों का अनुमान लगाने के लिए फैलाव के इस रैखिक गुणांक का उपयोग करते हैं।<ref>{{cite web |url=http://www.iowa.gov/tax/locgov/Statistical_Calculation_Definitions.pdf|title=सामूहिक मूल्यांकन के लिए सांख्यिकीय गणना परिभाषाएँ|work=Iowa.gov |quote=Median Ratio: The ratio located midway between the highest ratio and the lowest ratio when individual ratios for a class of realty are ranked in ascending or descending order. The median ratio is most frequently used to determine the level of assessment for a given class of real estate.|archive-url=https://web.archive.org/web/20101111214903/http://iowa.gov/tax/locgov/Statistical_Calculation_Definitions.pdf|archive-date=11 November 2010}}</ref><ref>{{cite web|url=http://www.tax.ny.gov/research/property/reports/cod/2010mvs/reporttext.htm|title=Assessment equity in New York: Results from the 2010 market value survey|archive-url=https://web.archive.org/web/20121106015231/http://www.tax.ny.gov/research/property/reports/cod/2010mvs/reporttext.htm|archive-date=6 November 2012}}</ref><ref>{{cite web|url=http://www.state.sd.us/drr2/publications/assess1199.pdf|title=मूल्यांकन प्रक्रिया का सारांश|work=state.sd.us|publisher=South Dakota Department of Revenue - Property/Special Taxes Division|archive-url=https://web.archive.org/web/20090510034115/http://www.state.sd.us/drr2/publications/assess1199.pdf|archive-date=10 May 2009}}</ref>
: <math> CD = \frac{1}{n}\frac{\sum_j{|m - x_j|}}{ m } </math>  
दो-नमूना परीक्षण के लिए, जिसमें नमूना आकार बड़े होते हैं, दोनों नमूनों में एक ही माध्यिका होती है, और इसके चारों ओर फैलाव में भिन्नता होती है, फैलाव के रैखिक गुणांक के लिए एक आत्मविश्वास अंतराल निम्न से घिरा होता है
यहाँ n नमूना का आकार है, m नमूना माध्यिका है और यह समूह पर कुल योग किया जाता है। [[आयोवा]], न्यूयॉर्क (राज्य) और दक्षिण डकोटा बकाया करों का अनुमान लगाने के लिए फैलाव के इस रैखिक गुणांक का उपयोग करते हैं।<ref>{{cite web |url=http://www.iowa.gov/tax/locgov/Statistical_Calculation_Definitions.pdf|title=सामूहिक मूल्यांकन के लिए सांख्यिकीय गणना परिभाषाएँ|work=Iowa.gov |quote=Median Ratio: The ratio located midway between the highest ratio and the lowest ratio when individual ratios for a class of realty are ranked in ascending or descending order. The median ratio is most frequently used to determine the level of assessment for a given class of real estate.|archive-url=https://web.archive.org/web/20101111214903/http://iowa.gov/tax/locgov/Statistical_Calculation_Definitions.pdf|archive-date=11 November 2010}}</ref><ref>{{cite web|url=http://www.tax.ny.gov/research/property/reports/cod/2010mvs/reporttext.htm|title=Assessment equity in New York: Results from the 2010 market value survey|archive-url=https://web.archive.org/web/20121106015231/http://www.tax.ny.gov/research/property/reports/cod/2010mvs/reporttext.htm|archive-date=6 November 2012}}</ref><ref>{{cite web|url=http://www.state.sd.us/drr2/publications/assess1199.pdf|title=मूल्यांकन प्रक्रिया का सारांश|work=state.sd.us|publisher=South Dakota Department of Revenue - Property/Special Taxes Division|archive-url=https://web.archive.org/web/20090510034115/http://www.state.sd.us/drr2/publications/assess1199.pdf|archive-date=10 May 2009}}</ref>
 
दो-नमूना परीक्षण के लिए, जिसमें नमूना आकार बड़े होते हैं, दोनों नमूनों का समान माध्यिका होती है, और उसके चारों ओर विस्तार में अंतर होता है, रैखिक CD के लिए विश्वसनीयता अंतराल निम्न द्वारा सीमित होता है:


: <math> \frac{t_a}{t_b}\exp{\left(-\sqrt{z_\alpha \left( \operatorname{var} \left[ \log \left( \frac{t_a} {t_b} \right) \right] \right)}\right)}</math>
: <math> \frac{t_a}{t_b}\exp{\left(-\sqrt{z_\alpha \left( \operatorname{var} \left[ \log \left( \frac{t_a} {t_b} \right) \right] \right)}\right)}</math>
जहां टी<sub>j</sub> j का माध्य निरपेक्ष विचलन है<sup>वें</sup>नमूना और z<sub>α</sub>आत्मविश्वास α के सामान्य वितरण के लिए विश्वास अंतराल की लंबाई है (उदाहरण के लिए, α = 0.05, z के लिए)<sub>α</sub>= 1.96).<ref name=Bonett2006>{{cite journal | last1 = Bonett | first1 = DG | last2 = Seier | first2 = E | year = 2006 | title = गैर-सामान्य वितरणों में फैलाव के गुणांक के लिए विश्वास अंतराल| journal = Biometrical Journal | volume = 48 | issue = 1| pages = 144–148 | doi=10.1002/bimj.200410148| pmid = 16544819 | s2cid = 33665632 }}</ref>
यहाँ ''t''<sub>j ,</sub>''j''<sup>th</sup> नमूने की माध्य वास्तविकता है और z<sub>α</sub>आत्मविश्वास α के लिए सामान्य वितरण विश्वसनीयता अंतराल की लंबाई है (उदाहरण के लिए, α = 0.05,और z<sub>α</sub>= 1.96 होता है)|<ref name="Bonett2006">{{cite journal | last1 = Bonett | first1 = DG | last2 = Seier | first2 = E | year = 2006 | title = गैर-सामान्य वितरणों में फैलाव के गुणांक के लिए विश्वास अंतराल| journal = Biometrical Journal | volume = 48 | issue = 1| pages = 144–148 | doi=10.1002/bimj.200410148| pmid = 16544819 | s2cid = 33665632 }}</ref>
 
 
== यह भी देखें ==
== यह भी देखें ==


Line 68: Line 68:
*[[मानकीकृत क्षण]], <math>\mu_k/\sigma^k</math>
*[[मानकीकृत क्षण]], <math>\mu_k/\sigma^k</math>
*फैनो फैक्टर, <math>\sigma^2_W/\mu_W</math> (विंडोड वम्र)
*फैनो फैक्टर, <math>\sigma^2_W/\mu_W</math> (विंडोड वम्र)
* [[शोर अनुपात करने के लिए संकेत]], <math>\mu/\sigma</math> ([[ संकेत आगे बढ़ाना ]] में)
* [[शोर अनुपात करने के लिए संकेत]], <math>\mu/\sigma</math> ([[ संकेत आगे बढ़ाना | संकेत आगे बढ़ाना]] में)


== टिप्पणियाँ ==
== टिप्पणियाँ ==
{{Reflist}}
{{Reflist}}


== संदर्भ ==
== संदर्भ ==
Line 78: Line 77:
*{{cite book |last1=Upton |first1=G. |last2=Cook |first2=I. |year=2006 |title=Oxford Dictionary of Statistics |edition=2nd |publisher=Oxford University Press |isbn=978-0-19-954145-4 }}
*{{cite book |last1=Upton |first1=G. |last2=Cook |first2=I. |year=2006 |title=Oxford Dictionary of Statistics |edition=2nd |publisher=Oxford University Press |isbn=978-0-19-954145-4 }}


{{Statistics|descriptive}}
[[Category:Articles with hatnote templates targeting a nonexistent page]]
[[Category: सांख्यिकीय विचलन और फैलाव]] [[Category: सांख्यिकीय अनुपात]] [[Category: सांख्यिकीय यादृच्छिकता]] [[Category: बिंदु प्रक्रियाएं]]
 
 
 
[[Category: Machine Translated Page]]
[[Category:Created On 08/07/2023]]
[[Category:Created On 08/07/2023]]
[[Category:Lua-based templates]]
[[Category:Machine Translated Page]]
[[Category:Pages with script errors]]
[[Category:Templates Vigyan Ready]]
[[Category:Templates that add a tracking category]]
[[Category:Templates that generate short descriptions]]
[[Category:Templates using TemplateData]]
[[Category:बिंदु प्रक्रियाएं]]
[[Category:सांख्यिकीय अनुपात]]
[[Category:सांख्यिकीय यादृच्छिकता]]
[[Category:सांख्यिकीय विचलन और फैलाव]]

Latest revision as of 13:52, 28 July 2023

संभाव्यता सिद्धांत और सांख्यिकी में, फैलाव का सूचकांक,और[1] फैलाव का गुणांक, सापेक्ष भिन्नता, या भिन्नता-से-माध्य अनुपात (वीएमआर), भिन्नता के गुणांक की प्रकार, संभाव्यता वितरण के सांख्यिकीय फैलाव का सामान्यीकरण (सांख्यिकी) उपाय है, यह मात्रा निर्धारित करने के लिए उपयोग किया जाता है मानक सांख्यिकीय नमूना की समानता में देखी गई घटनाओं का सेट क्लस्टर फैला हुआ है या फैला हुआ नहीं है।

इसे विचरण के अनुपात के रूप में परिभाषित किया जाता है,

इसे फ़ैनो फ़ैक्टर के रूप में भी जाना जाता है, चूंकि यह शब्द कभी-कभी विंडो डेटा के लिए सुरक्षित रखा जाता है इसलिए (माध्य और विचरण की गणना उप-जनसंख्या पर की जाती है), जहां फैलाव के सूचकांक का उपयोग विशेष स्थितियों में किया जाता है जहां विंडो अनंत है इसलिए विंडोइंग डेटा को विंडोवड करना अधिकांशतः किया जाता है: VMR की गणना अधिकांशतः समय के विभिन्न अंतरालों या अंतरिक्ष के छोटे क्षेत्रों में की जाती है, जिसे विंडोज़ कहा जा सकता है, और परिणामी आंकड़े को फैनो फैक्टर कहा जाता है।

इसे केवल तभी परिभाषित किया जाता है जब माध्य गैर-शून्य हो, और सामान्यतः इसका उपयोग केवल सकारात्मक आंकड़ों के लिए किया जाता है, जैसे घटनाओं के बीच डेटा या समय की गणना करना, या अंतर्निहित वितरण को घातीय वितरण या पॉइसन वितरण माना जाता है।

शब्दावली

इस संदर्भ में, देखे गए डेटासेट में पूर्व निर्धारित घटनाओं के घटित होने का समय सम्मलित हो सकता है, जैसे कि निश्चित क्षेत्र में होने वाले भूकंपों की घटनाओं के समय या निश्चित प्रजाति के पौधों के भूगोलीय अंतरिक्ष में स्थान, संख्या के रूप में परिवर्तित किए जाते हैं। इस तरह की घटनाओं के आयतन की गणना की जाती है, जिसमें समान आकार के समय- या स्थान-क्षेत्रों में प्रत्येक घटनाओं या घटनाओं की संख्या की गणना की जाती है।

इसलिए उपरोक्त गणनाओं के लिए फैलाव सूचकांक को परिभाषित करता है।[2] अंतरालों के लिए फैलाव सूचकांक के लिए अलग परिभाषा लागू होती है, जहां संख्याओं की विस्तार होती है,[3] जिन्हें घटनाओं के बीच समय-अंतराल की लंबाई के रूप में देखा जाता है। सामान्यतः उपयोग किया जाने वाला शब्द "फैलाव सूचकांक" गिनती के लिए फैलाव सूचकांक का अर्थ होता है।

व्याख्या

कुछ वितरण, विशेष रूप से पॉइसन वितरण में फैलाव और माध्य समान होता है, जिसके कारण उनका VMR = 1 होता है। ज्यामितीय वितरण और नकारात्मक द्विपद वितरण में VMR > 1 होता है, चूँकि द्विपद वितरण में VMR <1 होता है, और निरंतर यादृच्छिक चर VMR = 0 होता है। इससे निम्नलिखित तालिका प्राप्त होती है:

वितरण VMR
स्थिर यादृच्छिक चर VMR = 0 अविस्पंशित
बाइनोमियल वितरण 0 < VMR < 1 अविस्पंशित
पॉइसन वितरण VMR = 1
नकारात्मक बाइनोमियल वितरण VMR > 1 अधिक विस्पंशित

इसे विलक्षणता (गणित) के लिए शंकु वर्गों के वर्गीकरण के अनुरूप माना जा सकता है; विवरण के लिए कुछ असतत संभाव्यता वितरणों के संचयी देखें गए है।

फैलाव सूचकांक की प्रासंगिकता यह है कि जब अंतराल में घटनाओं की संभावना वितरण पॉइसन वितरण होता है, तो यह 1 का मान रखता है। इस प्रकार माप का उपयोग किया जा सकता है ताकि देखा गया डेटा को पॉइसन प्रक्रिया का उपयोग करके नमूना किया जा सकता है। जब फैलाव सूचकांक 1 से कम होता है, तो डेटासेट को "अविस्पंशित" कहा जाता है: यह स्थिति पॉइसन प्रक्रिया के साथ संबद्ध यादृच्छिकता की समानता में नियमितता वाले प्रायिकताओं से संबंधित हो सकती है। उदाहरण के लिए, नियमित, आवर्ती घटनाएं अविस्पंशित होंगी। अगर फैलाव सूचकांक 1 से अधिक होता है, तो डेटासेट "अधिक विस्पंशित" कहलाता है।

फैलाव सूचकांक के नमूना-आधारित अनुमान का उपयोग नमूना की पर्याप्तता के लिए औपचारिक सांख्यिकीय परिकल्पना परीक्षण के निर्माण के लिए किया जा सकता है इसलिए गिनती की श्रृंखला पॉइसन वितरण का पालन करती है।[4][5] जिससे अंतराल-गिनती के संदर्भ में, अति-फैलाव, पॉइसन वितरण की समानता में कम गिनती के साथ अधिक अंतराल और उच्च गिनती के साथ अधिक अंतराल से मेल खाता है: इसके विपरीत, कम-फैलाव की विशेषता अधिक अंतराल होने से होती है, जिसकी गिनती करीब होती है पॉइसन वितरण की समानता में माध्य गणना होती है ।

VMR किसी दी गई घटना की यादृच्छिकता की डिग्री का भी अच्छा माप है। उदाहरण के लिए, इस कार्यपद्धति का उपयोग सामान्यतः मुद्रा प्रबंधन में किया जाता है।

उदाहरण

यदि यादृच्छिक रूप से फैली हुई कणों ( प्रकार कि गति) के लिए, दिए गए आयतन में कणों की संख्या का वितरण पॉइसोनियन होता है, अर्थात् VMR=1 होता है। इसलिए, यदि आपके पास उसे मापने का तरीका होता है, तो यह निर्धारित करने के लिए कि क्या दिए गए आवर्तन में किसी कण-कण के बीच कुछ प्रभावशीलता सम्मलित है या नहीं: स्थान को पैचों, चतुष्कोणों या नमूना इकाइयों (SU) में विभाजित करें, प्रत्येक पैच या SU में व्यक्तियों की संख्या गणना करें, और VMR की गणना करें। 1 से काफी अधिक VMR के द्वारा पुष्टि की जाती है कि वहां क्लस्टर वितरण है, जहां संयोजक कण-कण की आकर्षक शक्ति को स्मोथर करने के लिए यादृच्छिक चलन पर पर्याप्त नहीं होता है।

इतिहास

पॉइसन या द्विपद वितरण से विचलन का पता लगाने के लिए परीक्षण के उपयोग पर चर्चा करने वाला पहला व्यक्ति 1877 में लेक्सिस था। उनके द्वारा विकसित परीक्षणों में से लेक्सिस अनुपात था।

इस सूचकांक का पहली बार वनस्पति विज्ञान में 1936 में आर्थर रॉय क्लैफम ने उपयोग किया था।

यदि विविधताएँ पॉइसन वितरित हैं, तो फैलाव का सूचकांक χ2 सांख्यिकी है जिसकी n - 1 स्वतंत्रता संख्या होती है जब n बड़ा होता है और μ > 3 होता है।[6] बहुत सारे स्थितियों के लिए यह अनुमान त्रुटिहीन होता है और 1950 में फिशर ने इसके लिए त्रुटिहीन परीक्षा निर्धारित की थी।

पॉल जी. होएल ने इसके वितरण के पहले चार केंद्रीय विसंगतियों का अध्ययन किया था।[7] उन्होंने पाया कि यदि μ > 5 है तो χ2 सांख्यिकी के प्रतिनिधित्व के लिए अनुमान उचित होता है।

विषम वितरण

जिससे अत्यधिक विषम वितरणों के लिए, द्विघात वितरण के विपरीत, रैखिक हानि फ़ंक्शन का उपयोग करना अधिक उपयुक्त हो सकता है। इस स्थितियों में फैलाव का अनुरूप गुणांक डेटा के माध्यिका से माध्यिका तक माध्य पूर्ण विचलन का अनुपात है,[8] या, प्रतीकों में प्रयोग किया जाता है:

यहाँ n नमूना का आकार है, m नमूना माध्यिका है और यह समूह पर कुल योग किया जाता है। आयोवा, न्यूयॉर्क (राज्य) और दक्षिण डकोटा बकाया करों का अनुमान लगाने के लिए फैलाव के इस रैखिक गुणांक का उपयोग करते हैं।[9][10][11]

दो-नमूना परीक्षण के लिए, जिसमें नमूना आकार बड़े होते हैं, दोनों नमूनों का समान माध्यिका होती है, और उसके चारों ओर विस्तार में अंतर होता है, रैखिक CD के लिए विश्वसनीयता अंतराल निम्न द्वारा सीमित होता है:

यहाँ tj ,jth नमूने की माध्य वास्तविकता है और zαआत्मविश्वास α के लिए सामान्य वितरण विश्वसनीयता अंतराल की लंबाई है (उदाहरण के लिए, α = 0.05,और zα= 1.96 होता है)|[8]

यह भी देखें

समान अनुपात

टिप्पणियाँ

  1. Cox &Lewis (1966)
  2. Cox & Lewis (1966), p72
  3. Cox & Lewis (1966), p71
  4. Cox & Lewis (1966), p158
  5. Upton & Cook(2006), under index of dispersion
  6. Frome, E. L. (1982). "Algorithm AS 171: Fisher's Exact Variance Test for the Poisson Distribution". Journal of the Royal Statistical Society, Series C. 31 (1): 67–71. doi:10.2307/2347079. JSTOR 2347079.
  7. Hoel, P. G. (1943). "फैलाव के सूचकांकों पर". Annals of Mathematical Statistics. 14 (2): 155–162. doi:10.1214/aoms/1177731457. JSTOR 2235818.
  8. 8.0 8.1 Bonett, DG; Seier, E (2006). "गैर-सामान्य वितरणों में फैलाव के गुणांक के लिए विश्वास अंतराल". Biometrical Journal. 48 (1): 144–148. doi:10.1002/bimj.200410148. PMID 16544819. S2CID 33665632.
  9. "सामूहिक मूल्यांकन के लिए सांख्यिकीय गणना परिभाषाएँ" (PDF). Iowa.gov. Archived from the original (PDF) on 11 November 2010. Median Ratio: The ratio located midway between the highest ratio and the lowest ratio when individual ratios for a class of realty are ranked in ascending or descending order. The median ratio is most frequently used to determine the level of assessment for a given class of real estate.
  10. "Assessment equity in New York: Results from the 2010 market value survey". Archived from the original on 6 November 2012.
  11. "मूल्यांकन प्रक्रिया का सारांश" (PDF). state.sd.us. South Dakota Department of Revenue - Property/Special Taxes Division. Archived from the original (PDF) on 10 May 2009.

संदर्भ

  • Cox, D. R.; Lewis, P. A. W. (1966). The Statistical Analysis of Series of Events. London: Methuen.
  • Upton, G.; Cook, I. (2006). Oxford Dictionary of Statistics (2nd ed.). Oxford University Press. ISBN 978-0-19-954145-4.