विचरण-स्थिरीकरण परिवर्तन: Difference between revisions

From Vigyanwiki
(Created page with "लागू आँकड़ों में, एक विचरण-स्थिरीकरण परिवर्तन एक डेटा परिवर्तन (स...")
 
No edit summary
Line 1: Line 1:
लागू आँकड़ों में, एक विचरण-स्थिरीकरण परिवर्तन एक [[डेटा परिवर्तन (सांख्यिकी)]] है जिसे विशेष रूप से ग्राफिकल खोजपूर्ण डेटा विश्लेषण में विचारों को सरल बनाने या सरल प्रतिगमन-आधारित या विचरण तकनीकों के विश्लेषण की अनुमति देने के लिए चुना जाता है।<ref>{{cite book |last=Everitt |first=B. S. |year=2002 |title=कैम्ब्रिज डिक्शनरी ऑफ स्टैटिस्टिक्स|edition=2nd |publisher=CUP |isbn=0-521-81099-X }}</ref>
प्रयुक्त आँकड़ों में, एक विचरण-स्थिरीकरण परिवर्तन एक [[डेटा परिवर्तन (सांख्यिकी)|आंकड़े परिवर्तन]] है जिसे विशेष रूप से या तो ग्राफिकल खोजपूर्ण आंकड़े विश्लेषण में विचारों को सरल बनाने या सरल प्रतिगमन-आधारित या विचरण तकनीकों के विश्लेषण की अनुमति देने के लिए चुना जाता है।<ref>{{cite book |last=Everitt |first=B. S. |year=2002 |title=कैम्ब्रिज डिक्शनरी ऑफ स्टैटिस्टिक्स|edition=2nd |publisher=CUP |isbn=0-521-81099-X }}</ref>
 
== अवलोकन ==
 
विचरण-स्थिरीकरण परिवर्तन को चयन के पीछे का उद्देश्य नए मान बनाने के लिए आंकड़े समूह में मान x पर प्रयुक्त करने के लिए नए मान y = ƒ(x) बनाने के लिए एक सरल फलन ढूंढना है ताकि मान y की परिवर्तनशीलता उनके औसत मूल्य से संबंधित न हो। उदाहरण के लिए, मान लीजिए कि मान x अलग-अलग पॉइसन वितरण से प्राप्तियां हैं यानी प्रत्येक वितरण का अलग-अलग माध्य मान μ है। फिर, क्योंकि पॉइसन वितरण के लिए प्रसरण माध्य के समान है, प्रसरण माध्य के साथ बदलता रहता है। यद्यपि, यदि सरल विचरण-स्थिरीकरण परिवर्तन
== सिंहावलोकन ==
विचरण-स्थिरीकरण परिवर्तन को चुनने के पीछे का उद्देश्य नए मान बनाने के लिए डेटा सेट में मान x पर लागू करने के लिए एक सरल फ़ंक्शन ढूंढना है। {{math|1=''y'' = ''ƒ''(''x'')}} जैसे कि मान y की परिवर्तनशीलता उनके माध्य मान से संबंधित नहीं है। उदाहरण के लिए, मान लीजिए कि मान x अलग-अलग पॉइसन वितरण से प्राप्तियां हैं: यानी प्रत्येक वितरण का अलग-अलग माध्य मान μ है। फिर, क्योंकि पॉइसन वितरण के लिए प्रसरण माध्य के समान है, प्रसरण माध्य के साथ बदलता रहता है। हालाँकि, यदि सरल विचरण-स्थिरीकरण परिवर्तन


:<math>y=\sqrt{x} \, </math>
:<math>y=\sqrt{x} \, </math>
लागू किया जाता है, तो अवलोकन से जुड़ा नमूनाकरण विचरण लगभग स्थिर रहेगा: विवरण और कुछ वैकल्पिक परिवर्तनों के लिए [[Anscombe परिवर्तन]] देखें।
प्रयुक्त किया जाता है, तो अवलोकन से जुड़ा उदाहरण विचरण लगभग स्थिर रहेगा विवरण और वैकल्पिक परिवर्तनों के लिए [[Index.php?title=अनसोमबे|अनसोमबे]] [[Index.php?title=अनसोमबे|परिवर्तन]] देखें।


जबकि विचरण-स्थिरीकरण परिवर्तन वितरण के कुछ पैरामीट्रिक परिवारों के लिए अच्छी तरह से जाने जाते हैं, जैसे कि पॉइसन और [[द्विपद वितरण]], कुछ प्रकार के डेटा विश्लेषण अधिक अनुभवजन्य रूप से आगे बढ़ते हैं: उदाहरण के लिए एक उपयुक्त निश्चित परिवर्तन खोजने के लिए बिजली परिवर्तनों के बीच खोज करके। वैकल्पिक रूप से, यदि डेटा विश्लेषण विचरण और माध्य के बीच संबंध के लिए एक कार्यात्मक रूप सुझाता है, तो इसका उपयोग विचरण-स्थिरीकरण परिवर्तन निकालने के लिए किया जा सकता है।<ref>{{cite book |last=Dodge |first=Y. |year=2003 |title=सांख्यिकी शर्तों का ऑक्सफोर्ड डिक्शनरी|publisher=OUP |isbn=0-19-920613-9 |url-access=registration |url=https://archive.org/details/oxforddictionary0000unse }}</ref> इस प्रकार यदि, एक माध्य μ के लिए,
जबकि विचरण-स्थिरीकरण परिवर्तन वितरण के कुछ पैरामापीय परिवारों जैसे कि पॉइसन और [[द्विपद वितरण]] के लिए अच्छी तरह से जाने जाते हैं, कुछ प्रकार के आंकड़े विश्लेषण अधिक अनुभवजन्य रूप से आगे बढ़ते हैं उदाहरण के लिए एक उपयुक्त निश्चित परिवर्तन खोजने के लिए शक्ति परिवर्तनों के बीच खोज करके। वैकल्पिक रूप से, यदि आंकड़े विश्लेषण विचरण और माध्य के बीच संबंध के लिए एक कार्यात्मक रूप सुझाता है, तो इसका उपयोग विचरण-स्थिरीकरण परिवर्तन निकालने के लिए किया जा सकता है।<ref>{{cite book |last=Dodge |first=Y. |year=2003 |title=सांख्यिकी शर्तों का ऑक्सफोर्ड डिक्शनरी|publisher=OUP |isbn=0-19-920613-9 |url-access=registration |url=https://archive.org/details/oxforddictionary0000unse }}</ref> इस प्रकार यदि, एक माध्य μ के लिए,


:<math>\operatorname{var}(X)=h(\mu), \,</math>
:<math>\operatorname{var}(X)=h(\mu), \,</math>
Line 14: Line 12:


:<math>y \propto \int^x \frac{1}{\sqrt{h(\mu)}} \, d\mu, </math>
:<math>y \propto \int^x \frac{1}{\sqrt{h(\mu)}} \, d\mu, </math>
जहां सुविधा के लिए एकीकरण के मनमाने स्थिरांक और मनमाने स्केलिंग कारक को चुना जा सकता है।
जहां सुविधा के लिए एकीकरण के यथेच्छाचार स्थिरांक और यथेच्छाचार परिमाण कारक को चुना जा सकता है।


===उदाहरण: सापेक्ष विचरण===
===उदाहरण: सापेक्ष विचरण===
अगर {{math|''X''}} एक सकारात्मक यादृच्छिक चर है और विचरण इस प्रकार दिया गया है {{math|1=''h''(''μ'') = ''s''<sup>2</sup>''μ''<sup>2</sup>}} तो मानक विचलन माध्य के समानुपाती होता है, जिसे निश्चित सापेक्ष त्रुटि कहते हैं। इस मामले में, विचरण-स्थिरीकरण परिवर्तन है
अगर {{math|''X''}} एक सकारात्मक यादृच्छिक प्रतिरूप है और विचरण {{math|1=''h''(''μ'') = ''s''<sup>2</sup>''μ''<sup>2</sup>}} के रूप में दिया गया है  तो मानक विचलन माध्य के समानुपाती होता है, जिसे निश्चित सापेक्ष त्रुटि कहा जाता है। इस स्थिति में, विचरण-स्थिरीकरण परिवर्तन है
:<math>y = \int^x \frac{d\mu}{\sqrt{s^2\mu^2}} = \frac{1}{s} \ln(x) \propto \log(x)\,.</math>
:<math>y = \int^x \frac{d\mu}{\sqrt{s^2\mu^2}} = \frac{1}{s} \ln(x) \propto \log(x)\,.</math>
अर्थात्, विचरण-स्थिरीकरण परिवर्तन लघुगणकीय परिवर्तन है।
अर्थात्, विचरण-स्थिरीकरण परिवर्तन लघुगणकीय परिवर्तन है।


===उदाहरण: निरपेक्ष प्लस सापेक्ष विचरण===
===उदाहरण: निरपेक्ष प्लस सापेक्ष विचरण===
यदि विचरण इस प्रकार दिया गया है {{math|1=''h''(''μ'') = ''σ''<sup>2</sup> + ''s''<sup>2</sup>''μ''<sup>2</sup>}} तो विचरण पर एक निश्चित विचरण का प्रभुत्व होता है {{math|''σ''<sup>2</sup>}} कब {{math|{{mabs|''μ''}}}} काफी छोटा है और सापेक्ष भिन्नता पर हावी है {{math|''s''<sup>2</sup>''μ''<sup>2</sup>}} कब {{math|{{mabs|''μ''}}}} काफी बड़ा है. इस मामले में, विचरण-स्थिरीकरण परिवर्तन है
यदि विचरण {{math|1=''h''(''μ'') = ''σ''<sup>2</sup> + ''s''<sup>2</sup>''μ''<sup>2</sup>}} के रूप में दिया गया है तो विचरण पर एक निश्चित विचरण σ2 का प्रभुत्व होता है जब {{math|{{mabs|''μ''}}}} काफी छोटा है और सापेक्ष विचरण {{math|''s''<sup>2</sup>''μ''<sup>2</sup>}} पर आच्छादित है जब {{math|{{mabs|''μ''}}}} पर्याप्त बड़ा है. इस स्थिति में, विचरण-स्थिरीकरण परिवर्तन है
:<math>y = \int^x \frac{d\mu}{\sqrt{\sigma^2 + s^2\mu^2}}
:<math>y = \int^x \frac{d\mu}{\sqrt{\sigma^2 + s^2\mu^2}}
= \frac{1}{s} \operatorname{asinh} \frac{x}{\sigma / s}
= \frac{1}{s} \operatorname{asinh} \frac{x}{\sigma / s}
\propto \operatorname{asinh} \frac{x}{\lambda}\,.</math>
\propto \operatorname{asinh} \frac{x}{\lambda}\,.</math>
अर्थात्, विचरण-स्थिरीकरण परिवर्तन स्केल किए गए मान का [[व्युत्क्रम अतिपरवलयिक ज्या]] है {{math|''x'' / ''λ''}} के लिए {{math|1=''λ'' = ''σ'' / ''s''}}.
अर्थात्, विचरण-स्थिरीकरण परिवर्तन {{math|1=''λ'' = ''σ'' / ''s''}} के लिए स्केल किए गए मान {{math|''x'' / ''λ''}} का [[व्युत्क्रम अतिपरवलयिक ज्या]] है


==[[डेल्टा विधि]] से संबंध==
==[[डेल्टा विधि]] से संबंध==
यहां, डेल्टा विधि को मोटे तौर पर प्रस्तुत किया गया है, लेकिन यह विचरण-स्थिरीकरण परिवर्तनों के साथ संबंध देखने के लिए पर्याप्त है। अधिक औपचारिक दृष्टिकोण देखने के लिए डेल्टा विधि देखें।
यहां, डेल्टा विधि को व्यावहारिक रूप से प्रस्तुत किया गया है, लेकिन यह विचरण-स्थिरीकरण परिवर्तनों के साथ संबंध देखने के लिए पर्याप्त है। अधिक औपचारिक दृष्टिकोण देखने के लिए डेल्टा विधि देखें।


होने देना <math> X </math> एक यादृच्छिक चर बनें, साथ में <math> E[X]=\mu </math> और <math> \operatorname{Var}(X)=\sigma^2 </math>.
माना कि <math> X </math> , <math> E[X]=\mu </math> और <math> \operatorname{Var}(X)=\sigma^2 </math> साथ में एक यादृच्छिक प्रतिरूप है <math> Y=g(X) </math> परिभाषित है, जहाँ <math>g</math> एक नियमित फलन है. टेलर के लिए पहला क्रम सन्निकटन <math>  Y=g(x) </math> है:
परिभाषित करना <math> Y=g(X) </math>, कहाँ <math>g</math> एक नियमित कार्य है. टेलर के लिए पहला ऑर्डर सन्निकटन <math>  Y=g(x) </math> है:
:


<math>
<math>
Y=g(X)\approx g(\mu)+g'(\mu)(X-\mu)  
Y=g(X)\approx g(\mu)+g'(\mu)(X-\mu)  
</math>
</math>
उपरोक्त समीकरण से, हम प्राप्त करते हैं:
 
उपरोक्त समीकरण से, हम प्राप्त करते हैं


: <math> E[Y] = g(\mu)</math> और <math>\operatorname{Var}[Y]=\sigma^2g'(\mu)^2 </math>
: <math> E[Y] = g(\mu)</math> और <math>\operatorname{Var}[Y]=\sigma^2g'(\mu)^2 </math>
इस सन्निकटन विधि को डेल्टा विधि कहा जाता है।
इस सन्निकटन विधि को डेल्टा विधि कहा जाता है।


अब एक यादृच्छिक चर पर विचार करें <math> X </math> ऐसा है कि <math> E[X]=\mu </math> और <math> \operatorname{Var}[X]=h(\mu) </math>.
अब एक यादृच्छिक प्रतिरूप पर विचार करें <math> X </math> ऐसा है कि <math> E[X]=\mu </math> और <math> \operatorname{Var}[X]=h(\mu) </math>.विचरण और माध्य के बीच संबंध पर ध्यान दें, उदाहरण के लिए, एक रैखिक प्रतिरूप में विषमलैंगिकता जिसका तात्पर्य है। इसलिए, लक्ष्य एक फलन ढूंढना है <math> g </math> ऐसा कि <math> Y=g(X) </math> का भिन्नता इसकी अपेक्षा से स्वतंत्र (कम से कम लगभग) है।
विचरण और माध्य के बीच संबंध पर ध्यान दें, जिसका तात्पर्य है, उदाहरण के लिए, एक रैखिक मॉडल में [[विषमलैंगिकता]]। इसलिए, लक्ष्य एक फ़ंक्शन ढूंढना है <math> g </math> ऐसा है कि <math> Y=g(X) </math> इसकी अपेक्षा से स्वतंत्र (कम से कम लगभग) भिन्नता है।


शर्त थोपना <math> \operatorname{Var}[Y]\approx h(\mu)g'(\mu)^2=\text{constant} </math>, यह समानता अंतर समीकरण को दर्शाती है:
समानता अंतर समीकरण <math> \operatorname{Var}[Y]\approx h(\mu)g'(\mu)^2=\text{constant} </math>, प्रभावशाली स्थिति को दर्शाती है:


: <math>
: <math>
\frac{dg}{d\mu}=\frac{C}{\sqrt{h(\mu)}}
\frac{dg}{d\mu}=\frac{C}{\sqrt{h(\mu)}}
</math>
</math>
चरों को अलग करके इस साधारण अवकल समीकरण का निम्नलिखित समाधान है:
प्रतिरूप को अलग करके इस साधारण अवकल समीकरण का निम्नलिखित समाधान है


: <math>
: <math>
Line 57: Line 53:
</math>
</math>
यह अंतिम अभिव्यक्ति पहली बार एम. एस. बार्टलेट पेपर में छपी।<ref>{{cite journal |last=Bartlett |first=M. S. |year=1947 |title=परिवर्तनों का उपयोग|journal=Biometrics |volume=3 |pages=39–52 |doi=10.2307/3001536 }}</ref>
यह अंतिम अभिव्यक्ति पहली बार एम. एस. बार्टलेट पेपर में छपी।<ref>{{cite journal |last=Bartlett |first=M. S. |year=1947 |title=परिवर्तनों का उपयोग|journal=Biometrics |volume=3 |pages=39–52 |doi=10.2307/3001536 }}</ref>
==संदर्भ==
==संदर्भ==
<references/>
<references/>

Revision as of 10:32, 14 July 2023

प्रयुक्त आँकड़ों में, एक विचरण-स्थिरीकरण परिवर्तन एक आंकड़े परिवर्तन है जिसे विशेष रूप से या तो ग्राफिकल खोजपूर्ण आंकड़े विश्लेषण में विचारों को सरल बनाने या सरल प्रतिगमन-आधारित या विचरण तकनीकों के विश्लेषण की अनुमति देने के लिए चुना जाता है।[1]

अवलोकन

विचरण-स्थिरीकरण परिवर्तन को चयन के पीछे का उद्देश्य नए मान बनाने के लिए आंकड़े समूह में मान x पर प्रयुक्त करने के लिए नए मान y = ƒ(x) बनाने के लिए एक सरल फलन ढूंढना है ताकि मान y की परिवर्तनशीलता उनके औसत मूल्य से संबंधित न हो। उदाहरण के लिए, मान लीजिए कि मान x अलग-अलग पॉइसन वितरण से प्राप्तियां हैं यानी प्रत्येक वितरण का अलग-अलग माध्य मान μ है। फिर, क्योंकि पॉइसन वितरण के लिए प्रसरण माध्य के समान है, प्रसरण माध्य के साथ बदलता रहता है। यद्यपि, यदि सरल विचरण-स्थिरीकरण परिवर्तन

प्रयुक्त किया जाता है, तो अवलोकन से जुड़ा उदाहरण विचरण लगभग स्थिर रहेगा विवरण और वैकल्पिक परिवर्तनों के लिए अनसोमबे परिवर्तन देखें।

जबकि विचरण-स्थिरीकरण परिवर्तन वितरण के कुछ पैरामापीय परिवारों जैसे कि पॉइसन और द्विपद वितरण के लिए अच्छी तरह से जाने जाते हैं, कुछ प्रकार के आंकड़े विश्लेषण अधिक अनुभवजन्य रूप से आगे बढ़ते हैं उदाहरण के लिए एक उपयुक्त निश्चित परिवर्तन खोजने के लिए शक्ति परिवर्तनों के बीच खोज करके। वैकल्पिक रूप से, यदि आंकड़े विश्लेषण विचरण और माध्य के बीच संबंध के लिए एक कार्यात्मक रूप सुझाता है, तो इसका उपयोग विचरण-स्थिरीकरण परिवर्तन निकालने के लिए किया जा सकता है।[2] इस प्रकार यदि, एक माध्य μ के लिए,

विचरण स्थिरीकरण परिवर्तन के लिए एक उपयुक्त आधार होगा

जहां सुविधा के लिए एकीकरण के यथेच्छाचार स्थिरांक और यथेच्छाचार परिमाण कारक को चुना जा सकता है।

उदाहरण: सापेक्ष विचरण

अगर X एक सकारात्मक यादृच्छिक प्रतिरूप है और विचरण h(μ) = s2μ2 के रूप में दिया गया है तो मानक विचलन माध्य के समानुपाती होता है, जिसे निश्चित सापेक्ष त्रुटि कहा जाता है। इस स्थिति में, विचरण-स्थिरीकरण परिवर्तन है

अर्थात्, विचरण-स्थिरीकरण परिवर्तन लघुगणकीय परिवर्तन है।

उदाहरण: निरपेक्ष प्लस सापेक्ष विचरण

यदि विचरण h(μ) = σ2 + s2μ2 के रूप में दिया गया है तो विचरण पर एक निश्चित विचरण σ2 का प्रभुत्व होता है जब |μ| काफी छोटा है और सापेक्ष विचरण s2μ2 पर आच्छादित है जब |μ| पर्याप्त बड़ा है. इस स्थिति में, विचरण-स्थिरीकरण परिवर्तन है

अर्थात्, विचरण-स्थिरीकरण परिवर्तन λ = σ / s के लिए स्केल किए गए मान x / λ का व्युत्क्रम अतिपरवलयिक ज्या है

डेल्टा विधि से संबंध

यहां, डेल्टा विधि को व्यावहारिक रूप से प्रस्तुत किया गया है, लेकिन यह विचरण-स्थिरीकरण परिवर्तनों के साथ संबंध देखने के लिए पर्याप्त है। अधिक औपचारिक दृष्टिकोण देखने के लिए डेल्टा विधि देखें।

माना कि , और साथ में एक यादृच्छिक प्रतिरूप है परिभाषित है, जहाँ एक नियमित फलन है. टेलर के लिए पहला क्रम सन्निकटन है:

उपरोक्त समीकरण से, हम प्राप्त करते हैं

और

इस सन्निकटन विधि को डेल्टा विधि कहा जाता है।

अब एक यादृच्छिक प्रतिरूप पर विचार करें ऐसा है कि और .विचरण और माध्य के बीच संबंध पर ध्यान दें, उदाहरण के लिए, एक रैखिक प्रतिरूप में विषमलैंगिकता जिसका तात्पर्य है। इसलिए, लक्ष्य एक फलन ढूंढना है ऐसा कि का भिन्नता इसकी अपेक्षा से स्वतंत्र (कम से कम लगभग) है।

समानता अंतर समीकरण , प्रभावशाली स्थिति को दर्शाती है:

प्रतिरूप को अलग करके इस साधारण अवकल समीकरण का निम्नलिखित समाधान है

यह अंतिम अभिव्यक्ति पहली बार एम. एस. बार्टलेट पेपर में छपी।[3]

संदर्भ

  1. Everitt, B. S. (2002). कैम्ब्रिज डिक्शनरी ऑफ स्टैटिस्टिक्स (2nd ed.). CUP. ISBN 0-521-81099-X.
  2. Dodge, Y. (2003). सांख्यिकी शर्तों का ऑक्सफोर्ड डिक्शनरी. OUP. ISBN 0-19-920613-9.
  3. Bartlett, M. S. (1947). "परिवर्तनों का उपयोग". Biometrics. 3: 39–52. doi:10.2307/3001536.