फैलाव का सूचकांक: Difference between revisions
No edit summary |
No edit summary |
||
Line 1: | Line 1: | ||
{{Short description|Normalized measure of the dispersion of a probability distribution}} | {{Short description|Normalized measure of the dispersion of a probability distribution}} | ||
{{broader|सांख्यिकीय फैलाव}} | {{broader|सांख्यिकीय फैलाव}} | ||
संभाव्यता सिद्धांत और सांख्यिकी में, फैलाव का सूचकांक,<ref>Cox &Lewis (1966)</ref> फैलाव का गुणांक, सापेक्ष भिन्नता, या भिन्नता-से-माध्य अनुपात (वीएमआर), भिन्नता के गुणांक की प्रकार, संभाव्यता वितरण के [[सांख्यिकीय फैलाव]] का [[सामान्यीकरण (सांख्यिकी)]] उपाय है: यह मात्रा निर्धारित करने के लिए उपयोग किया | संभाव्यता सिद्धांत और सांख्यिकी में, फैलाव का सूचकांक,और<ref>Cox &Lewis (1966)</ref> फैलाव का गुणांक, सापेक्ष भिन्नता, या भिन्नता-से-माध्य अनुपात (वीएमआर), भिन्नता के गुणांक की प्रकार, संभाव्यता वितरण के [[सांख्यिकीय फैलाव]] का [[सामान्यीकरण (सांख्यिकी)]] उपाय है: यह मात्रा निर्धारित करने के लिए उपयोग किया जाता है मानक सांख्यिकीय मॉडल की समानता में देखी गई घटनाओं का सेट क्लस्टर फैला हुआ है या नहीं। | ||
इसे विचरण के अनुपात के रूप में परिभाषित किया गया है <math>\sigma^2</math> अर्थ के लिए <math>\mu</math>, | इसे विचरण के अनुपात के रूप में परिभाषित किया गया है <math>\sigma^2</math> अर्थ के लिए <math>\mu</math>, | ||
:<math>D = {\sigma^2 \over \mu }.</math> | :<math>D = {\sigma^2 \over \mu }.</math> | ||
इसे फ़ैनो फ़ैक्टर के रूप में भी जाना जाता है, चूंकि यह शब्द कभी-कभी ''विंडो'' डेटा के लिए आरक्षित होता है (माध्य और विचरण की गणना उप-जनसंख्या पर की जाती है), जहां फैलाव के सूचकांक का उपयोग विशेष स्थितियों में किया जाता है जहां विंडो अनंत है | इसे फ़ैनो फ़ैक्टर के रूप में भी जाना जाता है, चूंकि यह शब्द कभी-कभी ''विंडो'' डेटा के लिए आरक्षित होता है इसलिए (माध्य और विचरण की गणना उप-जनसंख्या पर की जाती है), जहां फैलाव के सूचकांक का उपयोग विशेष स्थितियों में किया जाता है जहां विंडो अनंत है इसलिए विंडोइंग डेटा अधिकांशतः प्रयोग किया जाता है: वीएमआर की गणना अधिकांशतः समय के विभिन्न अंतरालों या अंतरिक्ष के छोटे क्षेत्रों में की जाती है, जिसे विंडोज़ कहा जा सकता है, और परिणामी आंकड़े को [[फैनो फैक्टर]] कहा जाता है। | ||
इसे केवल तभी परिभाषित किया जाता है जब माध्य | इसे केवल तभी परिभाषित किया जाता है जब माध्य <math>\mu</math> गैर-शून्य है, और सामान्यतः इसका उपयोग केवल सकारात्मक आंकड़ों के लिए किया जाता है, जैसे घटनाओं के बीच डेटा या समय की गणना करना, या अंतर्निहित वितरण को घातीय वितरण या पॉइसन वितरण माना जाता है। | ||
== शब्दावली == | == शब्दावली == | ||
इस संदर्भ में, देखे गए डेटासेट में | इस संदर्भ में, देखे गए डेटासेट में पूर्व निर्धारित घटनाओं के घटित होने का समय सम्मलित हो सकता है, जैसे किसी दिए गए क्षेत्र में किसी दिए गए परिमाण से अधिक भूकंप, या किसी दिए गए प्रजाति के पौधों के भौगोलिक स्थान पर ऐसी घटनाओं का विवरण होने से पहले समान आकार के समय या स्थान क्षेत्रों के प्रत्येक सेट में घटनाओं की संख्या को गणना में परिवर्तित किया जाता है। | ||
उपरोक्त गणनाओं के लिए फैलाव सूचकांक को परिभाषित करता है।<ref>Cox & Lewis (1966), p72</ref> अंतरालों के लिए फैलाव सूचकांक के लिए अलग परिभाषा लागू होती है,<ref>Cox & Lewis (1966), p71</ref> जहां उपचारित मात्राएं घटनाओं के बीच के समय-अंतराल की लंबाई हैं। सामान्य उपयोग यह है कि फैलाव सूचकांक का अर्थ गिनती के लिए फैलाव सूचकांक है। | उपरोक्त गणनाओं के लिए फैलाव सूचकांक को परिभाषित करता है।<ref>Cox & Lewis (1966), p72</ref> अंतरालों के लिए फैलाव सूचकांक के लिए अलग परिभाषा लागू होती है,<ref>Cox & Lewis (1966), p71</ref> जहां उपचारित मात्राएं घटनाओं के बीच के समय-अंतराल की लंबाई हैं। सामान्य उपयोग यह है कि फैलाव सूचकांक का अर्थ गिनती के लिए फैलाव सूचकांक है। | ||
== व्याख्या == | == व्याख्या == | ||
कुछ वितरण, विशेष रूप से पॉइसन वितरण | इसलिए कुछ वितरण, विशेष रूप से पॉइसन वितरण में समान भिन्नता और माध्य होता है, जिससे उन्हें VMR = 1 मिलता है। [[ज्यामितीय वितरण]] और नकारात्मक [[द्विपद वितरण]] में VMR > 1 होता है, चूँकि द्विपद वितरण में VMR <1 होता है, और [[निरंतर यादृच्छिक चर]] होता है वीएमआर = 0. इससे निम्नलिखित तालिका प्राप्त होती है: | ||
{| | {| | ||
! Distribution !! VMR !! | ! Distribution !! VMR !! | ||
Line 27: | Line 27: | ||
| [[negative binomial distribution]] || VMR > 1 || over-dispersed | | [[negative binomial distribution]] || VMR > 1 || over-dispersed | ||
|} | |} | ||
इसे [[विलक्षणता (गणित)]] के लिए शंकु वर्गों के वर्गीकरण के अनुरूप माना जा सकता है; विवरण के लिए कुछ असतत संभाव्यता वितरणों के संचयी | इसे [[विलक्षणता (गणित)]] के लिए शंकु वर्गों के वर्गीकरण के अनुरूप माना जा सकता है;इसलिए विवरण के लिए कुछ असतत संभाव्यता वितरणों के संचयी देखें गए है। | ||
फैलाव सूचकांक की प्रासंगिकता यह है कि इसका मान 1 होता है जब किसी अंतराल में घटनाओं की संख्या का संभाव्यता वितरण पॉइसन वितरण होता है। इस प्रकार माप का उपयोग यह आकलन करने के लिए किया जा सकता है कि क्या देखे गए डेटा को [[पॉइसन प्रक्रिया]] का उपयोग करके मॉडल किया जा सकता है। जब फैलाव का गुणांक 1 से कम होता है, तो डेटासेट को कम-फैला हुआ कहा जाता है: यह स्थिति घटना के पैटर्न से संबंधित हो सकती है जो पॉइसन प्रक्रिया से जुड़ी यादृच्छिकता से अधिक नियमित होती है। उदाहरण के लिए, नियमित, आवधिक घटनाओं को कम फैलाया जाएगा। यदि फैलाव का सूचकांक 1 से बड़ा है, तो डेटासेट को अति-फैलाव | फैलाव सूचकांक की प्रासंगिकता यह है कि इसका मान 1 होता है जब किसी अंतराल में घटनाओं की संख्या का संभाव्यता वितरण पॉइसन वितरण होता है। इस प्रकार माप का उपयोग यह आकलन करने के लिए किया जा सकता है कि क्या देखे गए डेटा को [[पॉइसन प्रक्रिया]] का उपयोग करके मॉडल किया जा सकता है। इसलिए जब फैलाव का गुणांक 1 से कम होता है, तो डेटासेट को कम-फैला हुआ कहा जाता है: यह स्थिति घटना के पैटर्न से संबंधित हो सकती है जो पॉइसन प्रक्रिया से जुड़ी यादृच्छिकता से अधिक नियमित होती है। उदाहरण के लिए, नियमित, आवधिक घटनाओं को कम फैलाया जाएगा। यदि फैलाव का सूचकांक 1 से बड़ा है, तो डेटासेट को अति-फैलाव कहा जाता है। | ||
फैलाव सूचकांक के नमूना-आधारित अनुमान का उपयोग मॉडल की पर्याप्तता के लिए औपचारिक [[सांख्यिकीय परिकल्पना परीक्षण]] के निर्माण के लिए किया जा सकता है | फैलाव सूचकांक के नमूना-आधारित अनुमान का उपयोग मॉडल की पर्याप्तता के लिए औपचारिक [[सांख्यिकीय परिकल्पना परीक्षण]] के निर्माण के लिए किया जा सकता है इसलिए गिनती की श्रृंखला पॉइसन वितरण का पालन करती है।<ref>Cox & Lewis (1966), p158</ref><ref>Upton & Cook(2006), under index of dispersion</ref> जिससे अंतराल-गिनती के संदर्भ में, अति-फैलाव, पॉइसन वितरण की समानता में कम गिनती के साथ अधिक अंतराल और उच्च गिनती के साथ अधिक अंतराल से मेल खाता है: इसके विपरीत, कम-फैलाव की विशेषता अधिक अंतराल होने से होती है, जिसकी गिनती करीब होती है पॉइसन वितरण की समानता में माध्य गणना होती है । | ||
वीएमआर किसी दी गई घटना की यादृच्छिकता की डिग्री का भी अच्छा माप है। उदाहरण के लिए, इस कार्यपद्धति का उपयोग सामान्यतः मुद्रा प्रबंधन में किया जाता है। | वीएमआर किसी दी गई घटना की यादृच्छिकता की डिग्री का भी अच्छा माप है। उदाहरण के लिए, इस कार्यपद्धति का उपयोग सामान्यतः मुद्रा प्रबंधन में किया जाता है। | ||
== उदाहरण == | == उदाहरण == | ||
अव्यवस्थित ढंग से फैलने वाले कणों ( [[एक प्रकार कि गति|प्रकार कि गति]]) के लिए, किसी दिए गए आयतन के अंदर कणों की संख्या का वितरण पॉइसोनियन है, बरकरार वीएमआर = 1। इसलिए, यह आकलन करने के लिए कि | अव्यवस्थित ढंग से फैलने वाले कणों ( [[एक प्रकार कि गति|प्रकार कि गति]]) के लिए, किसी दिए गए आयतन के अंदर कणों की संख्या का वितरण पॉइसोनियन है, बरकरार वीएमआर = 1। इसलिए, यह आकलन करने के लिए उपयोग किया जाता है कि दिया गया स्थानिक पैटर्न (यह मानते हुए कि आपके पास इसे मापने का विधि है) पूरी प्रकार से प्रसार के कारण है या यदि कुछ कण-कण संपर्क सम्मलित है: जिससे अंतरिक्ष को पैच, क्वाड्रेट या नमूना इकाइयों (एसयू) में विभाजित कर सकते है , इसलिए प्रत्येक पैच या एसयू में व्यक्तियों की संख्या, और वीएमआर की गणना करें। 1 से काफी अधिक वीएमआर क्लस्टर्ड वितरण को दर्शाता है, जहां आकर्षक अंतर-कण क्षमता को कम करने के लिए यादृच्छिक चलना पर्याप्त नहीं है। | ||
== इतिहास == | == इतिहास == | ||
Line 44: | Line 44: | ||
वनस्पति विज्ञान में इस सूचकांक का प्रयोग पहली बार 1936 में [[आर्थर रॉय क्लैफम]] के लिए किया गया था। | वनस्पति विज्ञान में इस सूचकांक का प्रयोग पहली बार 1936 में [[आर्थर रॉय क्लैफम]] के लिए किया गया था। | ||
यदि चर को पॉइसन वितरित किया जाता है तो फैलाव का सूचकांक χ के रूप में वितरित किया जाता है<sup>2</sup> n के साथ आँकड़ा - 1 स्वतंत्रता की डिग्री जब n बड़ा हो और μ > 3 हो।<ref name=Frome1982>{{cite journal |last=Frome |first=E. L. |year=1982 |title=Algorithm AS 171: Fisher's Exact Variance Test for the Poisson Distribution |journal=[[Journal of the Royal Statistical Society, Series C]]|volume=31 |issue=1 |pages=67–71 |doi=10.2307/2347079 |jstor=2347079 }}</ref> रुचि के कई स्थितियों के लिए यह अनुमान सटीक है और फिशर ने 1950 में इसके लिए सटीक परीक्षण | यदि चर को पॉइसन वितरित किया जाता है तो फैलाव का सूचकांक χ के रूप में वितरित किया जाता है<sup>2</sup> n के साथ आँकड़ा - 1 स्वतंत्रता की डिग्री जब n बड़ा हो और μ > 3 हो।<ref name=Frome1982>{{cite journal |last=Frome |first=E. L. |year=1982 |title=Algorithm AS 171: Fisher's Exact Variance Test for the Poisson Distribution |journal=[[Journal of the Royal Statistical Society, Series C]]|volume=31 |issue=1 |pages=67–71 |doi=10.2307/2347079 |jstor=2347079 }}</ref> रुचि के कई स्थितियों के लिए यह अनुमान सटीक है और फिशर ने 1950 में इसके लिए सटीक परीक्षण निकाला गया था । | ||
पॉल जी. होएल ने इसके वितरण के पहले चार क्षणों का अध्ययन किया।<ref name=Hoel1943>{{cite journal |last=Hoel |first=P. G. |year=1943 |title=फैलाव के सूचकांकों पर|journal=[[Annals of Mathematical Statistics]] |volume=14 |issue=2 |pages=155–162 |doi= 10.1214/aoms/1177731457|jstor=2235818 |doi-access=free }}</ref> उन्होंने पाया कि χ का सन्निकटन<sup>2</sup> आँकड़ा उचित है यदि μ > 5. | पॉल जी. होएल ने इसके वितरण के पहले चार क्षणों का अध्ययन किया।<ref name=Hoel1943>{{cite journal |last=Hoel |first=P. G. |year=1943 |title=फैलाव के सूचकांकों पर|journal=[[Annals of Mathematical Statistics]] |volume=14 |issue=2 |pages=155–162 |doi= 10.1214/aoms/1177731457|jstor=2235818 |doi-access=free }}</ref> उन्होंने पाया कि χ का सन्निकटन<sup>2</sup> आँकड़ा उचित है यदि μ > 5. | ||
==तिरछा वितरण== | ==तिरछा वितरण== | ||
अत्यधिक विषम वितरणों के लिए, द्विघात वितरण के विपरीत, रैखिक हानि फ़ंक्शन का उपयोग करना अधिक उपयुक्त हो सकता है। इस स्थितियों में फैलाव का अनुरूप गुणांक डेटा के माध्यिका से माध्यिका तक औसत पूर्ण विचलन का अनुपात है,<ref name=Bonett2006>{{cite journal | last1 = Bonett | first1 = DG | last2 = Seier | first2 = E | year = 2006 | title = गैर-सामान्य वितरणों में फैलाव के गुणांक के लिए विश्वास अंतराल| journal = Biometrical Journal | volume = 48 | issue = 1| pages = 144–148 | doi=10.1002/bimj.200410148| pmid = 16544819 | s2cid = 33665632 }}</ref> या, प्रतीकों में | जिससे अत्यधिक विषम वितरणों के लिए, द्विघात वितरण के विपरीत, रैखिक हानि फ़ंक्शन का उपयोग करना अधिक उपयुक्त हो सकता है। इस स्थितियों में फैलाव का अनुरूप गुणांक डेटा के माध्यिका से माध्यिका तक औसत पूर्ण विचलन का अनुपात है,<ref name=Bonett2006>{{cite journal | last1 = Bonett | first1 = DG | last2 = Seier | first2 = E | year = 2006 | title = गैर-सामान्य वितरणों में फैलाव के गुणांक के लिए विश्वास अंतराल| journal = Biometrical Journal | volume = 48 | issue = 1| pages = 144–148 | doi=10.1002/bimj.200410148| pmid = 16544819 | s2cid = 33665632 }}</ref> या, प्रतीकों में प्रयोग किया जाता है | | ||
: <math> CD = \frac{1}{n}\frac{\sum_j{|m - x_j|}}{ m } </math> जहाँ n नमूना आकार है, m नमूना माध्यिका है और पूरे नमूने पर लिया गया योग है। [[आयोवा]], न्यूयॉर्क (राज्य) और दक्षिण डकोटा बकाया करों का अनुमान लगाने के लिए फैलाव के इस रैखिक गुणांक का उपयोग करते हैं।<ref>{{cite web |url=http://www.iowa.gov/tax/locgov/Statistical_Calculation_Definitions.pdf|title=सामूहिक मूल्यांकन के लिए सांख्यिकीय गणना परिभाषाएँ|work=Iowa.gov |quote=Median Ratio: The ratio located midway between the highest ratio and the lowest ratio when individual ratios for a class of realty are ranked in ascending or descending order. The median ratio is most frequently used to determine the level of assessment for a given class of real estate.|archive-url=https://web.archive.org/web/20101111214903/http://iowa.gov/tax/locgov/Statistical_Calculation_Definitions.pdf|archive-date=11 November 2010}}</ref><ref>{{cite web|url=http://www.tax.ny.gov/research/property/reports/cod/2010mvs/reporttext.htm|title=Assessment equity in New York: Results from the 2010 market value survey|archive-url=https://web.archive.org/web/20121106015231/http://www.tax.ny.gov/research/property/reports/cod/2010mvs/reporttext.htm|archive-date=6 November 2012}}</ref><ref>{{cite web|url=http://www.state.sd.us/drr2/publications/assess1199.pdf|title=मूल्यांकन प्रक्रिया का सारांश|work=state.sd.us|publisher=South Dakota Department of Revenue - Property/Special Taxes Division|archive-url=https://web.archive.org/web/20090510034115/http://www.state.sd.us/drr2/publications/assess1199.pdf|archive-date=10 May 2009}}</ref> | : <math> CD = \frac{1}{n}\frac{\sum_j{|m - x_j|}}{ m } </math> जहाँ n नमूना आकार है, m नमूना माध्यिका है और पूरे नमूने पर लिया गया योग है। [[आयोवा]], न्यूयॉर्क (राज्य) और दक्षिण डकोटा बकाया करों का अनुमान लगाने के लिए फैलाव के इस रैखिक गुणांक का उपयोग करते हैं।<ref>{{cite web |url=http://www.iowa.gov/tax/locgov/Statistical_Calculation_Definitions.pdf|title=सामूहिक मूल्यांकन के लिए सांख्यिकीय गणना परिभाषाएँ|work=Iowa.gov |quote=Median Ratio: The ratio located midway between the highest ratio and the lowest ratio when individual ratios for a class of realty are ranked in ascending or descending order. The median ratio is most frequently used to determine the level of assessment for a given class of real estate.|archive-url=https://web.archive.org/web/20101111214903/http://iowa.gov/tax/locgov/Statistical_Calculation_Definitions.pdf|archive-date=11 November 2010}}</ref><ref>{{cite web|url=http://www.tax.ny.gov/research/property/reports/cod/2010mvs/reporttext.htm|title=Assessment equity in New York: Results from the 2010 market value survey|archive-url=https://web.archive.org/web/20121106015231/http://www.tax.ny.gov/research/property/reports/cod/2010mvs/reporttext.htm|archive-date=6 November 2012}}</ref><ref>{{cite web|url=http://www.state.sd.us/drr2/publications/assess1199.pdf|title=मूल्यांकन प्रक्रिया का सारांश|work=state.sd.us|publisher=South Dakota Department of Revenue - Property/Special Taxes Division|archive-url=https://web.archive.org/web/20090510034115/http://www.state.sd.us/drr2/publications/assess1199.pdf|archive-date=10 May 2009}}</ref> | ||
दो-नमूना परीक्षण के लिए, जिसमें नमूना आकार बड़े होते हैं, दोनों नमूनों में ही माध्यिका होती है, और इसके चारों ओर फैलाव में भिन्नता होती है, फैलाव के रैखिक गुणांक के लिए आत्मविश्वास अंतराल निम्न से घिरा होता है | दो-नमूना परीक्षण के लिए, जिसमें नमूना आकार बड़े होते हैं, दोनों नमूनों में ही माध्यिका होती है, और इसके चारों ओर फैलाव में भिन्नता होती है,इसलिए फैलाव के रैखिक गुणांक के लिए आत्मविश्वास अंतराल निम्न से घिरा होता है | | ||
: <math> \frac{t_a}{t_b}\exp{\left(-\sqrt{z_\alpha \left( \operatorname{var} \left[ \log \left( \frac{t_a} {t_b} \right) \right] \right)}\right)}</math> | : <math> \frac{t_a}{t_b}\exp{\left(-\sqrt{z_\alpha \left( \operatorname{var} \left[ \log \left( \frac{t_a} {t_b} \right) \right] \right)}\right)}</math> | ||
जहां टी | जहां टी j का माध्य निरपेक्ष विचलन है नमूना और z<sub>α</sub>आत्मविश्वास α के सामान्य वितरण के लिए विश्वास अंतराल की लंबाई है (उदाहरण के लिए, α = 0.05, z के लिए)<sub>α</sub>= 1.96).<ref name=Bonett2006>{{cite journal | last1 = Bonett | first1 = DG | last2 = Seier | first2 = E | year = 2006 | title = गैर-सामान्य वितरणों में फैलाव के गुणांक के लिए विश्वास अंतराल| journal = Biometrical Journal | volume = 48 | issue = 1| pages = 144–148 | doi=10.1002/bimj.200410148| pmid = 16544819 | s2cid = 33665632 }}</ref> होता है | | ||
Revision as of 19:59, 13 July 2023
संभाव्यता सिद्धांत और सांख्यिकी में, फैलाव का सूचकांक,और[1] फैलाव का गुणांक, सापेक्ष भिन्नता, या भिन्नता-से-माध्य अनुपात (वीएमआर), भिन्नता के गुणांक की प्रकार, संभाव्यता वितरण के सांख्यिकीय फैलाव का सामान्यीकरण (सांख्यिकी) उपाय है: यह मात्रा निर्धारित करने के लिए उपयोग किया जाता है मानक सांख्यिकीय मॉडल की समानता में देखी गई घटनाओं का सेट क्लस्टर फैला हुआ है या नहीं।
इसे विचरण के अनुपात के रूप में परिभाषित किया गया है अर्थ के लिए ,
इसे फ़ैनो फ़ैक्टर के रूप में भी जाना जाता है, चूंकि यह शब्द कभी-कभी विंडो डेटा के लिए आरक्षित होता है इसलिए (माध्य और विचरण की गणना उप-जनसंख्या पर की जाती है), जहां फैलाव के सूचकांक का उपयोग विशेष स्थितियों में किया जाता है जहां विंडो अनंत है इसलिए विंडोइंग डेटा अधिकांशतः प्रयोग किया जाता है: वीएमआर की गणना अधिकांशतः समय के विभिन्न अंतरालों या अंतरिक्ष के छोटे क्षेत्रों में की जाती है, जिसे विंडोज़ कहा जा सकता है, और परिणामी आंकड़े को फैनो फैक्टर कहा जाता है।
इसे केवल तभी परिभाषित किया जाता है जब माध्य गैर-शून्य है, और सामान्यतः इसका उपयोग केवल सकारात्मक आंकड़ों के लिए किया जाता है, जैसे घटनाओं के बीच डेटा या समय की गणना करना, या अंतर्निहित वितरण को घातीय वितरण या पॉइसन वितरण माना जाता है।
शब्दावली
इस संदर्भ में, देखे गए डेटासेट में पूर्व निर्धारित घटनाओं के घटित होने का समय सम्मलित हो सकता है, जैसे किसी दिए गए क्षेत्र में किसी दिए गए परिमाण से अधिक भूकंप, या किसी दिए गए प्रजाति के पौधों के भौगोलिक स्थान पर ऐसी घटनाओं का विवरण होने से पहले समान आकार के समय या स्थान क्षेत्रों के प्रत्येक सेट में घटनाओं की संख्या को गणना में परिवर्तित किया जाता है।
उपरोक्त गणनाओं के लिए फैलाव सूचकांक को परिभाषित करता है।[2] अंतरालों के लिए फैलाव सूचकांक के लिए अलग परिभाषा लागू होती है,[3] जहां उपचारित मात्राएं घटनाओं के बीच के समय-अंतराल की लंबाई हैं। सामान्य उपयोग यह है कि फैलाव सूचकांक का अर्थ गिनती के लिए फैलाव सूचकांक है।
व्याख्या
इसलिए कुछ वितरण, विशेष रूप से पॉइसन वितरण में समान भिन्नता और माध्य होता है, जिससे उन्हें VMR = 1 मिलता है। ज्यामितीय वितरण और नकारात्मक द्विपद वितरण में VMR > 1 होता है, चूँकि द्विपद वितरण में VMR <1 होता है, और निरंतर यादृच्छिक चर होता है वीएमआर = 0. इससे निम्नलिखित तालिका प्राप्त होती है:
Distribution | VMR | |
---|---|---|
constant random variable | VMR = 0 | not dispersed |
binomial distribution | 0 < VMR < 1 | under-dispersed |
Poisson distribution | VMR = 1 | |
negative binomial distribution | VMR > 1 | over-dispersed |
इसे विलक्षणता (गणित) के लिए शंकु वर्गों के वर्गीकरण के अनुरूप माना जा सकता है;इसलिए विवरण के लिए कुछ असतत संभाव्यता वितरणों के संचयी देखें गए है।
फैलाव सूचकांक की प्रासंगिकता यह है कि इसका मान 1 होता है जब किसी अंतराल में घटनाओं की संख्या का संभाव्यता वितरण पॉइसन वितरण होता है। इस प्रकार माप का उपयोग यह आकलन करने के लिए किया जा सकता है कि क्या देखे गए डेटा को पॉइसन प्रक्रिया का उपयोग करके मॉडल किया जा सकता है। इसलिए जब फैलाव का गुणांक 1 से कम होता है, तो डेटासेट को कम-फैला हुआ कहा जाता है: यह स्थिति घटना के पैटर्न से संबंधित हो सकती है जो पॉइसन प्रक्रिया से जुड़ी यादृच्छिकता से अधिक नियमित होती है। उदाहरण के लिए, नियमित, आवधिक घटनाओं को कम फैलाया जाएगा। यदि फैलाव का सूचकांक 1 से बड़ा है, तो डेटासेट को अति-फैलाव कहा जाता है।
फैलाव सूचकांक के नमूना-आधारित अनुमान का उपयोग मॉडल की पर्याप्तता के लिए औपचारिक सांख्यिकीय परिकल्पना परीक्षण के निर्माण के लिए किया जा सकता है इसलिए गिनती की श्रृंखला पॉइसन वितरण का पालन करती है।[4][5] जिससे अंतराल-गिनती के संदर्भ में, अति-फैलाव, पॉइसन वितरण की समानता में कम गिनती के साथ अधिक अंतराल और उच्च गिनती के साथ अधिक अंतराल से मेल खाता है: इसके विपरीत, कम-फैलाव की विशेषता अधिक अंतराल होने से होती है, जिसकी गिनती करीब होती है पॉइसन वितरण की समानता में माध्य गणना होती है ।
वीएमआर किसी दी गई घटना की यादृच्छिकता की डिग्री का भी अच्छा माप है। उदाहरण के लिए, इस कार्यपद्धति का उपयोग सामान्यतः मुद्रा प्रबंधन में किया जाता है।
उदाहरण
अव्यवस्थित ढंग से फैलने वाले कणों ( प्रकार कि गति) के लिए, किसी दिए गए आयतन के अंदर कणों की संख्या का वितरण पॉइसोनियन है, बरकरार वीएमआर = 1। इसलिए, यह आकलन करने के लिए उपयोग किया जाता है कि दिया गया स्थानिक पैटर्न (यह मानते हुए कि आपके पास इसे मापने का विधि है) पूरी प्रकार से प्रसार के कारण है या यदि कुछ कण-कण संपर्क सम्मलित है: जिससे अंतरिक्ष को पैच, क्वाड्रेट या नमूना इकाइयों (एसयू) में विभाजित कर सकते है , इसलिए प्रत्येक पैच या एसयू में व्यक्तियों की संख्या, और वीएमआर की गणना करें। 1 से काफी अधिक वीएमआर क्लस्टर्ड वितरण को दर्शाता है, जहां आकर्षक अंतर-कण क्षमता को कम करने के लिए यादृच्छिक चलना पर्याप्त नहीं है।
इतिहास
पॉइसन या द्विपद वितरण से विचलन का पता लगाने के लिए परीक्षण के उपयोग पर चर्चा करने वाला पहला व्यक्ति 1877 में लेक्सिस था। उनके के लिए विकसित परीक्षणों में से लेक्सिस अनुपात था।
वनस्पति विज्ञान में इस सूचकांक का प्रयोग पहली बार 1936 में आर्थर रॉय क्लैफम के लिए किया गया था।
यदि चर को पॉइसन वितरित किया जाता है तो फैलाव का सूचकांक χ के रूप में वितरित किया जाता है2 n के साथ आँकड़ा - 1 स्वतंत्रता की डिग्री जब n बड़ा हो और μ > 3 हो।[6] रुचि के कई स्थितियों के लिए यह अनुमान सटीक है और फिशर ने 1950 में इसके लिए सटीक परीक्षण निकाला गया था ।
पॉल जी. होएल ने इसके वितरण के पहले चार क्षणों का अध्ययन किया।[7] उन्होंने पाया कि χ का सन्निकटन2 आँकड़ा उचित है यदि μ > 5.
तिरछा वितरण
जिससे अत्यधिक विषम वितरणों के लिए, द्विघात वितरण के विपरीत, रैखिक हानि फ़ंक्शन का उपयोग करना अधिक उपयुक्त हो सकता है। इस स्थितियों में फैलाव का अनुरूप गुणांक डेटा के माध्यिका से माध्यिका तक औसत पूर्ण विचलन का अनुपात है,[8] या, प्रतीकों में प्रयोग किया जाता है |
- जहाँ n नमूना आकार है, m नमूना माध्यिका है और पूरे नमूने पर लिया गया योग है। आयोवा, न्यूयॉर्क (राज्य) और दक्षिण डकोटा बकाया करों का अनुमान लगाने के लिए फैलाव के इस रैखिक गुणांक का उपयोग करते हैं।[9][10][11]
दो-नमूना परीक्षण के लिए, जिसमें नमूना आकार बड़े होते हैं, दोनों नमूनों में ही माध्यिका होती है, और इसके चारों ओर फैलाव में भिन्नता होती है,इसलिए फैलाव के रैखिक गुणांक के लिए आत्मविश्वास अंतराल निम्न से घिरा होता है |
जहां टी j का माध्य निरपेक्ष विचलन है नमूना और zαआत्मविश्वास α के सामान्य वितरण के लिए विश्वास अंतराल की लंबाई है (उदाहरण के लिए, α = 0.05, z के लिए)α= 1.96).[8] होता है |
यह भी देखें
- डेटा गिनें
- अनुकूल माध्य
समान अनुपात
- गुणांक का परिवर्तन,
- मानकीकृत क्षण,
- फैनो फैक्टर, (विंडोड वम्र)
- शोर अनुपात करने के लिए संकेत, ( संकेत आगे बढ़ाना में)
टिप्पणियाँ
- ↑ Cox &Lewis (1966)
- ↑ Cox & Lewis (1966), p72
- ↑ Cox & Lewis (1966), p71
- ↑ Cox & Lewis (1966), p158
- ↑ Upton & Cook(2006), under index of dispersion
- ↑ Frome, E. L. (1982). "Algorithm AS 171: Fisher's Exact Variance Test for the Poisson Distribution". Journal of the Royal Statistical Society, Series C. 31 (1): 67–71. doi:10.2307/2347079. JSTOR 2347079.
- ↑ Hoel, P. G. (1943). "फैलाव के सूचकांकों पर". Annals of Mathematical Statistics. 14 (2): 155–162. doi:10.1214/aoms/1177731457. JSTOR 2235818.
- ↑ 8.0 8.1 Bonett, DG; Seier, E (2006). "गैर-सामान्य वितरणों में फैलाव के गुणांक के लिए विश्वास अंतराल". Biometrical Journal. 48 (1): 144–148. doi:10.1002/bimj.200410148. PMID 16544819. S2CID 33665632.
- ↑ "सामूहिक मूल्यांकन के लिए सांख्यिकीय गणना परिभाषाएँ" (PDF). Iowa.gov. Archived from the original (PDF) on 11 November 2010.
Median Ratio: The ratio located midway between the highest ratio and the lowest ratio when individual ratios for a class of realty are ranked in ascending or descending order. The median ratio is most frequently used to determine the level of assessment for a given class of real estate.
- ↑ "Assessment equity in New York: Results from the 2010 market value survey". Archived from the original on 6 November 2012.
- ↑ "मूल्यांकन प्रक्रिया का सारांश" (PDF). state.sd.us. South Dakota Department of Revenue - Property/Special Taxes Division. Archived from the original (PDF) on 10 May 2009.
संदर्भ
- Cox, D. R.; Lewis, P. A. W. (1966). The Statistical Analysis of Series of Events. London: Methuen.
- Upton, G.; Cook, I. (2006). Oxford Dictionary of Statistics (2nd ed.). Oxford University Press. ISBN 978-0-19-954145-4.