पियर्सन वितरण: Difference between revisions

From Vigyanwiki
(Created page with "{{short description|Family of continuous probability distributions}} Image:Pearson system.png|300px|thumb|पियर्सन प्रणाली का आरेख, β...")
 
No edit summary
Line 1: Line 1:
{{short description|Family of continuous probability distributions}}
{{short description|Family of continuous probability distributions}}
[[Image:Pearson system.png|300px|thumb|पियर्सन प्रणाली का आरेख, β के संदर्भ में प्रकार I, III, VI, V और IV के वितरण को दर्शाता है<sub>1</sub> (वर्ग तिरछापन) और β<sub>2</sub> (पारंपरिक कुर्टोसिस)]]पियर्सन वितरण [[सतत संभाव्यता वितरण]] संभाव्यता वितरण का एक परिवार है। इसे पहली बार 1895 में [[कार्ल पियर्सन]] द्वारा प्रकाशित किया गया था और बाद में उनके द्वारा 1901 और 1916 में [[ जैव सांख्यिकी ]] पर लेखों की एक श्रृंखला में विस्तारित किया गया था।
[[Image:Pearson system.png|300px|thumb|पियर्सन प्रणाली का आरेख, β के संदर्भ में प्रकार I, III, VI, V और IV के वितरण को दर्शाता है<sub>1</sub> (वर्ग तिरछापन) और β<sub>2</sub> (पारंपरिक कुर्टोसिस)]]'''पियर्सन वितरण''' [[सतत संभाव्यता वितरण]] संभाव्यता वितरण का एक समूह है। इसे पहली बार 1895 में [[कार्ल पियर्सन]] द्वारा प्रकाशित किया गया था और बाद में उनके द्वारा 1901 और 1916 में [[ जैव सांख्यिकी ]] पर लेखों की एक श्रृंखला में विस्तारित किया गया था।


== इतिहास ==
== इतिहास ==
पियर्सन प्रणाली मूल रूप से दृश्यमान विषम टिप्पणियों को मॉडल करने के प्रयास में तैयार की गई थी। उस समय यह सर्वविदित था कि किसी सैद्धांतिक मॉडल को प्रेक्षित डेटा के पहले दो संचयकों या [[क्षण (गणित)]] में फिट करने के लिए कैसे समायोजित किया जाए: किसी भी संभाव्यता वितरण को [[स्थान-पैमाने पर परिवार]] बनाने के लिए सीधे बढ़ाया जा सकता है। [[पैथोलॉजिकल (गणित)]] मामलों को छोड़कर, एक स्थान-स्तरीय परिवार को देखे गए [[माध्य (गणित)]] (प्रथम [[संचयी]]) और विचरण (द्वितीय संचयी) को मनमाने ढंग से अच्छी तरह से फिट करने के लिए बनाया जा सकता है। हालाँकि, यह ज्ञात नहीं था कि संभाव्यता वितरण का निर्माण कैसे किया जाए जिसमें [[तिरछापन]] (मानकीकृत तीसरा क्यूमुलेंट) और [[कुकुदता]] (मानकीकृत चौथा क्यूमुलेंट) को समान रूप से स्वतंत्र रूप से समायोजित किया जा सके। यह आवश्यकता तब स्पष्ट हो गई जब ज्ञात सैद्धांतिक मॉडलों को तिरछापन प्रदर्शित करने वाले प्रेक्षित डेटा में फिट करने का प्रयास किया गया। पियर्सन के उदाहरणों में उत्तरजीविता डेटा शामिल है, जो आमतौर पर असममित होता है।
पियर्सन प्रणाली मूल रूप से दृश्यमान विषम टिप्पणियों को मॉडल करने के प्रयास में तैयार की गई थी। उस समय यह सर्वविदित था कि किसी सैद्धांतिक मॉडल को प्रेक्षित डेटा के पहले दो संचयकों या [[क्षण (गणित)]] में फिट करने के लिए कैसे समायोजित किया जाए: किसी भी संभाव्यता वितरण को [[स्थान-पैमाने पर परिवार|स्थान-पैमाने पर समूह]] बनाने के लिए सीधे बढ़ाया जा सकता है। [[पैथोलॉजिकल (गणित)]] स्थितियों को छोड़कर, एक स्थान-स्तरीय समूह को देखे गए [[माध्य (गणित)]] (प्रथम [[संचयी]]) और विचरण (द्वितीय संचयी) को '''मनमाने ढंग''' से अच्छी तरह से फिट करने के लिए बनाया जा सकता है। हालाँकि, यह ज्ञात नहीं था कि संभाव्यता वितरण का निर्माण कैसे किया जाए जिसमें [[तिरछापन]] (मानकीकृत तीसरा क्यूमुलेंट) और [[कुकुदता]] (मानकीकृत चौथा क्यूमुलेंट) को समान रूप से स्वतंत्र रूप से समायोजित किया जा सके। यह आवश्यकता तब स्पष्ट हो गई जब ज्ञात सैद्धांतिक मॉडलों को तिरछापन प्रदर्शित करने वाले प्रेक्षित डेटा में फिट करने का प्रयास किया गया। पियर्सन के उदाहरणों में उत्तरजीविता डेटा सम्मिलितहै, जो सामान्यतः असममित होता है।


अपने मूल पेपर में, पियर्सन (1895, पृष्ठ 360) ने [[सामान्य वितरण]] (जिसे मूल रूप से प्रकार V के रूप में जाना जाता था) के अलावा चार प्रकार के वितरण (I से IV तक क्रमांकित) की पहचान की। वर्गीकरण इस बात पर निर्भर करता था कि क्या वितरण एक सीमित अंतराल पर, आधी रेखा पर, या पूरी वास्तविक रेखा पर समर्थित (गणित) थे; और क्या वे संभावित रूप से तिरछे थे या आवश्यक रूप से सममित थे। एक दूसरे पेपर (पियर्सन 1901) ने दो चूक तय कीं: इसने प्रकार V वितरण को फिर से परिभाषित किया (मूल रूप से केवल सामान्य वितरण, लेकिन अब [[व्युत्क्रम-गामा वितरण]]) और प्रकार VI वितरण की शुरुआत की। पहले दो पेपर मिलकर पियर्सन प्रणाली के पांच मुख्य प्रकारों (I, III, IV, V, और VI) को कवर करते हैं। तीसरे पेपर में, पियर्सन (1916) ने और विशेष मामले और उपप्रकार (VII से XII) पेश किए।
अपने मूल पेपर में, पियर्सन (1895, पृष्ठ 360) ने [[सामान्य वितरण]] (जिसे मूल रूप से प्रकार V के रूप में जाना जाता था) के अलावा चार प्रकार के वितरण (I से IV तक क्रमांकित) की पहचान की। वर्गीकरण इस बात पर निर्भर करता था कि क्या वितरण एक सीमित अंतराल पर, आधी रेखा पर, या पूरी वास्तविक रेखा पर समर्थित (गणित) थे; और क्या वे संभावित रूप से तिरछे थे या आवश्यक रूप से सममित थे। एक दूसरे पेपर (पियर्सन 1901) ने दो चूक तय कीं: इसने प्रकार V वितरण को फिर से परिभाषित किया (मूल रूप से केवल सामान्य वितरण, लेकिन अब [[व्युत्क्रम-गामा वितरण]]) और प्रकार VI वितरण की प्रारम्भ की। पहले दो पेपर मिलकर पियर्सन प्रणाली के पांच मुख्य प्रकारों (I, III, IV, V, और VI) को कवर करते हैं। तीसरे पेपर में, पियर्सन (1916) ने और विशेष मामले और उपप्रकार (VII से XII) पेश किए।


रिहंद (1909, पृ. 430-432) ने पियर्सन प्रणाली के पैरामीटर स्पेस को देखने का एक सरल तरीका तैयार किया, जिसे बाद में पियर्सन (1916, प्लेट 1 और पृ. 430एफएफ., 448एफएफ.) द्वारा अपनाया गया। पियर्सन प्रकार की विशेषता दो मात्राओं से होती है, जिन्हें आमतौर पर β कहा जाता है<sub>1</sub> और β<sub>2</sub>. पहला तिरछापन का वर्ग है: <math>\beta_1 = \gamma_1^2</math> कहां γ<sub>1</sub> तिरछापन, या तीसरा [[मानकीकृत क्षण]] है। दूसरा पारंपरिक कर्टोसिस या चौथा मानकीकृत क्षण है: β<sub>2</sub> = सी<sub>2</sub> + 3. (आधुनिक उपचार कर्टोसिस γ को परिभाषित करते हैं<sub>2</sub> क्षणों के बजाय संचयकों के संदर्भ में, ताकि सामान्य वितरण के लिए हमारे पास γ हो<sub>2</sub> = 0 और β<sub>2</sub> = 3. यहां हम ऐतिहासिक मिसाल का पालन करते हैं और β का उपयोग करते हैं<sub>2</sub>.) दाईं ओर का आरेख दिखाता है कि कौन सा पियर्सन किसी दिए गए ठोस वितरण को टाइप करता है (एक बिंदु (β) द्वारा पहचाना जाता है<sub>1</sub>, बी<sub>2</sub>)) से संबंधित।
रिहंद (1909, पृ. 430-432) ने पियर्सन प्रणाली के पैरामीटर स्पेस को देखने का एक सरल तरीका तैयार किया, जिसे बाद में पियर्सन (1916, प्लेट 1 और पृ. 430एफएफ., 448एफएफ.) द्वारा अपनाया गया। पियर्सन प्रकार की विशेषता दो मात्राओं से होती है, जिन्हें सामान्यतः β कहा जाता है<sub>1</sub> और β<sub>2</sub>. पहला '''तिरछापन''' का वर्ग है: <math>\beta_1 = \gamma_1^2</math> कहां γ<sub>1</sub> तिरछापन, या तीसरा [[मानकीकृत क्षण]] है। दूसरा पारंपरिक कर्टोसिस या चौथा मानकीकृत क्षण है: β<sub>2</sub> = सी<sub>2</sub> + 3. (आधुनिक उपचार कर्टोसिस γ को परिभाषित करते हैं<sub>2</sub> क्षणों के बजाय संचयकों के संदर्भ में, ताकि सामान्य वितरण के लिए हमारे पास γ हो<sub>2</sub> = 0 और β<sub>2</sub> = 3. यहां हम ऐतिहासिक मिसाल का पालन करते हैं और β का उपयोग करते हैं<sub>2</sub>.) दाईं ओर का आरेख दिखाता है कि कौन सा पियर्सन किसी दिए गए ठोस वितरण को टाइप करता है (एक बिंदु (β) द्वारा पहचाना जाता है<sub>1</sub>, बी<sub>2</sub>)) से संबंधित।


आज हम जिन तिरछे और/या गैर-[[ मेसोकुर्टिक ]] वितरणों से परिचित हैं उनमें से कई 1890 के दशक की शुरुआत में अभी भी अज्ञात थे। जिसे अब [[बीटा वितरण]] के रूप में जाना जाता है, उसका उपयोग [[थॉमस बेयस]] ने व्युत्क्रम संभाव्यता पर अपने 1763 के कार्य में [[बर्नौली वितरण]] के पैरामीटर के [[पश्च वितरण]] के रूप में किया था। पियर्सन प्रणाली में इसकी सदस्यता के कारण बीटा वितरण को प्रमुखता मिली और 1940 के दशक तक इसे पियर्सन प्रकार I वितरण के रूप में जाना जाता था।<ref>{{cite web | url = http://jeff560.tripod.com/b.html | title = बीटा वितरण| access-date = 2006-12-09 | last = Miller | first = Jeff
आज हम जिन '''तिरछे और/या गैर'''-[[ मेसोकुर्टिक ]] वितरणों से परिचित हैं उनमें से कई 1890 के दशक की प्रारम्भ में अभी भी अज्ञात थे। जिसे अब [[बीटा वितरण]] के रूप में जाना जाता है, उसका उपयोग [[थॉमस बेयस]] ने व्युत्क्रम संभाव्यता पर अपने 1763 के कार्य में [[बर्नौली वितरण]] के पैरामीटर के [[पश्च वितरण]] के रूप में किया था। पियर्सन प्रणाली में इसकी सदस्यता के कारण बीटा वितरण को प्रमुखता मिली और 1940 के दशक तक इसे पियर्सन प्रकार I वितरण के रूप में जाना जाता था।<ref>{{cite web | url = http://jeff560.tripod.com/b.html | title = बीटा वितरण| access-date = 2006-12-09 | last = Miller | first = Jeff
| date = 2006-07-09 | work = Earliest Known Uses of Some of the Words of Mathematics |display-authors=etal}}</ref> (पियर्सन का प्रकार II वितरण प्रकार I का एक विशेष मामला है, लेकिन आमतौर पर इसे अलग नहीं किया जाता है।) [[गामा वितरण]] पियर्सन के काम से उत्पन्न हुआ (पियर्सन 1893, पृष्ठ 331; पियर्सन 1895, पृष्ठ 357, 360, 373-376) और 1930 और 1940 के दशक में अपना आधुनिक नाम प्राप्त करने से पहले, इसे पियर्सन टाइप III वितरण के रूप में जाना जाता था।<ref>{{cite web | url = http://jeff560.tripod.com/g.html | title = गामा वितरण| access-date = 2006-12-09 | last = Miller | first = Jeff | date = 2006-12-07| work = Earliest Known Uses of Some of the Words of Mathematics |display-authors=etal}}</ref> पियर्सन के 1895 के पेपर ने प्रकार IV वितरण की शुरुआत की, जिसमें एक विशेष मामले के रूप में छात्र का टी-वितरण|छात्र का टी-वितरण शामिल है, जो [[विलियम सीली गॉसेट]] के बाद के कई वर्षों के उपयोग से पहले का है। उनके 1901 के पेपर ने व्युत्क्रम-गामा वितरण (प्रकार V) और [[बीटा प्राइम वितरण]] (प्रकार VI) की शुरुआत की।
| date = 2006-07-09 | work = Earliest Known Uses of Some of the Words of Mathematics |display-authors=etal}}</ref> (पियर्सन का प्रकार II वितरण प्रकार I का एक विशेष स्थिति है, लेकिन सामान्यतः इसे अलग नहीं किया जाता है।) [[गामा वितरण]] पियर्सन के काम से उत्पन्न हुआ (पियर्सन 1893, पृष्ठ 331; पियर्सन 1895, पृष्ठ 357, 360, 373-376) और 1930 और 1940 के दशक में अपना आधुनिक नाम प्राप्त करने से पहले, इसे पियर्सन टाइप III वितरण के रूप में जाना जाता था।<ref>{{cite web | url = http://jeff560.tripod.com/g.html | title = गामा वितरण| access-date = 2006-12-09 | last = Miller | first = Jeff | date = 2006-12-07| work = Earliest Known Uses of Some of the Words of Mathematics |display-authors=etal}}</ref> पियर्सन के 1895 के पेपर ने प्रकार IV वितरण की प्रारम्भ की, जिसमें एक विशेष मामले के रूप में छात्र का ''t''-वितरण|छात्र का टी-वितरण सम्मिलित है, जो [[विलियम सीली गॉसेट]] के बाद के कई वर्षों के उपयोग से पहले का है। उनके 1901 के पेपर ने व्युत्क्रम-गामा वितरण (प्रकार V) और [[बीटा प्राइम वितरण]] (प्रकार VI) की प्रारम्भ की थी।


== परिभाषा ==
== परिभाषा ==
पियर्सन संभाव्यता घनत्व फ़ंक्शन पी को [[अंतर समीकरण]] के किसी भी वैध समाधान के रूप में परिभाषित किया गया है (सीएफ. पियर्सन 1895, पृष्ठ 381)
पियर्सन संभाव्यता घनत्व फलन ''p'' को [[अंतर समीकरण]] के किसी भी वैध समाधान के रूप में परिभाषित किया गया है (सीएफ. पियर्सन 1895, पृष्ठ 381)


:<math>\frac{p'(x)}{p(x)} + \frac{a+(x-\mu)}{b_0+b_1(x-\mu)+b_2(x-\mu)^2} = 0. \qquad (1)</math>
:<math>\frac{p'(x)}{p(x)} + \frac{a+(x-\mu)}{b_0+b_1(x-\mu)+b_2(x-\mu)^2} = 0. \qquad (1)</math>
Line 22: Line 22:
b_2 &= \frac{2 \beta_2-3 \beta_1 -6}{10 \beta_2-12\beta_1 -18}.
b_2 &= \frac{2 \beta_2-3 \beta_1 -6}{10 \beta_2-12\beta_1 -18}.
\end{align}</math>
\end{align}</math>
ऑर्ड के अनुसार,<ref>Ord J.K. (1972) p. 2</ref> पियर्सन ने समीकरण (1) का अंतर्निहित रूप, सबसे पहले, सामान्य वितरण के घनत्व फ़ंक्शन के लघुगणक के व्युत्पन्न के लिए सूत्र (जो एक रैखिक फ़ंक्शन देता है) और दूसरे, मूल्यों के लिए पुनरावृत्ति संबंध के आधार पर तैयार किया। [[हाइपरज्यामितीय वितरण]] की संभाव्यता द्रव्यमान फ़ंक्शन में (जो रैखिक-विभाजित-द्विघात संरचना उत्पन्न करता है)।
ऑर्ड के अनुसार,<ref>Ord J.K. (1972) p. 2</ref> पियर्सन ने समीकरण (1) का अंतर्निहित रूप, सबसे पहले, सामान्य वितरण के घनत्व फलन के लघुगणक के व्युत्पन्न के लिए सूत्र (जो एक रैखिक फलन देता है) और दूसरे, मूल्यों के लिए पुनरावृत्ति संबंध के आधार पर तैयार किया। [[हाइपरज्यामितीय वितरण]] की संभाव्यता द्रव्यमान फलन में (जो रैखिक-विभाजित-द्विघात संरचना उत्पन्न करता है)।


समीकरण (1) में, पैरामीटर एक [[स्थिर बिंदु]] निर्धारित करता है, और इसलिए कुछ शर्तों के तहत वितरण का एक [[मोड (सांख्यिकी)]] निर्धारित करता है, क्योंकि
समीकरण (1) में, पैरामीटर एक [[स्थिर बिंदु]] निर्धारित करता है, और इसलिए कुछ शर्तों के तहत वितरण का एक [[मोड (सांख्यिकी)]] निर्धारित करता है, क्योंकि
Line 32: Line 32:


:<math>p(x) \propto \exp\left( -\int\frac{x+a}{b_2 x^2 + b_1 x + b_0} \,dx \right).</math>
:<math>p(x) \propto \exp\left( -\int\frac{x+a}{b_2 x^2 + b_1 x + b_0} \,dx \right).</math>
जब इंटीग्रैंड के कुछ विशेष मामलों पर विचार किया जाता है तो इस समाधान में इंटीग्रल काफी सरल हो जाता है। पियर्सन (1895, पृ. 367) ने दो मुख्य मामलों की पहचान की, जो द्विघात फलन के विवेचक के चिन्ह (और इसलिए किसी फलन के वास्तविक मूल की संख्या) द्वारा निर्धारित होते हैं।
जब इंटीग्रैंड के कुछ विशेष स्थितियों पर विचार किया जाता है तो इस समाधान में इंटीग्रल काफी सरल हो जाता है। पियर्सन (1895, पृ. 367) ने दो मुख्य स्थितियों की पहचान की, जो द्विघात फलन के विवेचक के चिन्ह (और इसलिए किसी फलन के वास्तविक मूल की संख्या) द्वारा निर्धारित होते हैं।


:<math>f(x) = b_2x^2 + b_1x + b_0. \qquad (2)</math>
:<math>f(x) = b_2x^2 + b_1x + b_0. \qquad (2)</math>
Line 51: Line 51:


:<math>f(x) = b_2(y^2 + \alpha^2).</math>
:<math>f(x) = b_2(y^2 + \alpha^2).</math>
<!--NB: ^^^ don't change this to y, f is still a function of x.-->
 
इस सूत्रीकरण से वास्तविक जड़ों की अनुपस्थिति स्पष्ट है, क्योंकि α<sup>2</sup>आवश्यक रूप से सकारात्मक है।
इस सूत्रीकरण से वास्तविक जड़ों की अनुपस्थिति स्पष्ट है, क्योंकि α<sup>2</sup>आवश्यक रूप से सकारात्मक है।


Line 57: Line 57:


:<math>p(y) \propto \exp\left(- \frac{1}{b_2} \int\frac{y - \frac{b_1}{2b_2} + a}{y^2 + \alpha^2} \,dy  \right).</math>
:<math>p(y) \propto \exp\left(- \frac{1}{b_2} \int\frac{y - \frac{b_1}{2b_2} + a}{y^2 + \alpha^2} \,dy  \right).</math>
पियर्सन (1895, पृष्ठ 362) ने इसे त्रिकोणमितीय कहा<!--sic--> मामला, क्योंकि अभिन्न
पियर्सन (1895, पृष्ठ 362) ने इसे त्रिकोणमितीय कहा<!--sic--> स्थिति, क्योंकि अभिन्न


:<math>\int\frac{y-\frac{2b_2a - b_1}{2b_2}}{y^2 + \alpha^2} \,dy = \frac{1}{2} \ln(y^2 + \alpha^2) - \frac{2b_2a - b_1}{2b_2\alpha}\arctan\left(\frac{y}{\alpha}\right) + C_0</math>
:<math>\int\frac{y-\frac{2b_2a - b_1}{2b_2}}{y^2 + \alpha^2} \,dy = \frac{1}{2} \ln(y^2 + \alpha^2) - \frac{2b_2a - b_1}{2b_2\alpha}\arctan\left(\frac{y}{\alpha}\right) + C_0</math>
व्युत्क्रम [[त्रिकोणमितीय फलन]] त्रिकोणमितीय फलन आर्कटान फलन शामिल है। तब
व्युत्क्रम [[त्रिकोणमितीय फलन]] त्रिकोणमितीय फलन आर्कटान फलन सम्मिलितहै। तब


:<math>p(y) \propto \exp\left[ -\frac{1}{2b_2} \ln\left(1+\frac{y^2}{\alpha^2}\right) -\frac{\ln\alpha}{b_2} +\frac{2b_2a - b_1}{2b_2^2\alpha} \arctan\left(\frac{y}{\alpha}\right) + C_1 \right].</math>
:<math>p(y) \propto \exp\left[ -\frac{1}{2b_2} \ln\left(1+\frac{y^2}{\alpha^2}\right) -\frac{\ln\alpha}{b_2} +\frac{2b_2a - b_1}{2b_2^2\alpha} \arctan\left(\frac{y}{\alpha}\right) + C_1 \right].</math>
Line 69: Line 69:
\nu &= -\frac{2b_2a - b_1}{2b_2^2\alpha}.
\nu &= -\frac{2b_2a - b_1}{2b_2^2\alpha}.
\end{align}</math>
\end{align}</math>
इन प्रतिस्थापनों को लागू करने पर, हमें पैरामीट्रिक फ़ंक्शन प्राप्त होता है:
इन प्रतिस्थापनों को लागू करने पर, हमें पैरामीट्रिक फलन प्राप्त होता है:


:<math>p(y) \propto  \left[1 + \frac{y^2}{\alpha^2}\right]^{-m} \exp\left[-\nu \arctan\left(\frac{y}{\alpha}\right) \right]. </math>
:<math>p(y) \propto  \left[1 + \frac{y^2}{\alpha^2}\right]^{-m} \exp\left[-\nu \arctan\left(\frac{y}{\alpha}\right) \right]. </math>
इस असामान्य घनत्व को संपूर्ण वास्तविक रेखा पर समर्थन (गणित) प्राप्त है। यह [[स्केल पैरामीटर]] α > 0 और [[आकार पैरामीटर]] m > 1/2 और ν पर निर्भर करता है। जब हमने अंतर समीकरण (1) का समाधान x के बजाय y के फ़ंक्शन के रूप में ढूंढना चुना तो एक पैरामीटर खो गया। इसलिए हम चौथे पैरामीटर को पुनः प्रस्तुत करते हैं, अर्थात् [[स्थान पैरामीटर]] λ। इस प्रकार हमने 'पियर्सन टाइप IV वितरण' का घनत्व प्राप्त किया है:
इस असामान्य घनत्व को संपूर्ण वास्तविक रेखा पर समर्थन (गणित) प्राप्त है। यह [[स्केल पैरामीटर]] α > 0 और [[आकार पैरामीटर]] m > 1/2 और ν पर निर्भर करता है। जब हमने अंतर समीकरण (1) का समाधान x के बजाय y के फलन के रूप में ढूंढना चुना तो एक पैरामीटर खो गया। इसलिए हम चौथे पैरामीटर को पुनः प्रस्तुत करते हैं, अर्थात् [[स्थान पैरामीटर]] λ। इस प्रकार हमने 'पियर्सन टाइप IV वितरण' का घनत्व प्राप्त किया है:


:<math>p(x) = \frac{\left|\frac{\operatorname{\Gamma}\left(m+\frac{\nu}{2}i\right)}{\Gamma(m)}\right|^2}{\alpha\operatorname{\Beta}\left(m-\frac12, \frac12\right)}
:<math>p(x) = \frac{\left|\frac{\operatorname{\Gamma}\left(m+\frac{\nu}{2}i\right)}{\Gamma(m)}\right|^2}{\alpha\operatorname{\Beta}\left(m-\frac12, \frac12\right)}
\left[1 + \left(\frac{x-\lambda}{\alpha}\right)^2 \right]^{-m} \exp\left[-\nu \arctan\left(\frac{x-\lambda} \alpha \right)\right]. </math>
\left[1 + \left(\frac{x-\lambda}{\alpha}\right)^2 \right]^{-m} \exp\left[-\nu \arctan\left(\frac{x-\lambda} \alpha \right)\right]. </math>
सामान्यीकृत स्थिरांक में जटिल फ़ंक्शन [[गामा फ़ंक्शन]] (Γ) और [[बीटा फ़ंक्शन]] (बी) शामिल होते हैं।
सामान्यीकृत स्थिरांक में जटिल फलन [[गामा फ़ंक्शन|गामा फलन]] (Γ) और [[बीटा फ़ंक्शन|बीटा फलन]] (बी) सम्मिलितहोते हैं।
ध्यान दें कि यहां स्थान पैरामीटर λ सामान्य फॉर्मूलेशन में पेश किए गए मूल स्थान पैरामीटर के समान नहीं है, लेकिन इसके माध्यम से संबंधित है
ध्यान दें कि यहां स्थान पैरामीटर λ सामान्य फॉर्मूलेशन में पेश किए गए मूल स्थान पैरामीटर के समान नहीं है, लेकिन इसके माध्यम से संबंधित है
:<math>\lambda = \lambda_{original} + \frac{\alpha \nu}{2(m-1)}. </math>
:<math>\lambda = \lambda_{original} + \frac{\alpha \nu}{2(m-1)}. </math>
==== पियर्सन प्रकार VII वितरण ====
==== पियर्सन प्रकार VII वितरण ====
[[Image:Pearson type VII distribution PDF.svg|300px|thumb|λ = 0, σ = 1, और: γ के साथ पियर्सन प्रकार VII घनत्व का प्लॉट<sub>2</sub> = ∞ (लाल); सी<sub>2</sub> = 4 (नीला); और γ<sub>2</sub> = 0 (काला)]]पियर्सन प्रकार IV वितरण का आकार पैरामीटर ν इसकी विषमता को नियंत्रित करता है। यदि हम इसका मान शून्य पर स्थिर करते हैं, तो हमें एक सममित तीन-पैरामीटर परिवार प्राप्त होता है। इस विशेष मामले को 'पियर्सन टाइप VII डिस्ट्रीब्यूशन' के रूप में जाना जाता है (cf. पियर्सन 1916, पृष्ठ 450)। इसका घनत्व है
[[Image:Pearson type VII distribution PDF.svg|300px|thumb|λ = 0, σ = 1, और: γ के साथ पियर्सन प्रकार VII घनत्व का प्लॉट<sub>2</sub> = ∞ (लाल); सी<sub>2</sub> = 4 (नीला); और γ<sub>2</sub> = 0 (काला)]]पियर्सन प्रकार IV वितरण का आकार पैरामीटर ν इसकी विषमता को नियंत्रित करता है। यदि हम इसका मान शून्य पर स्थिर करते हैं, तो हमें एक सममित तीन-पैरामीटर समूह प्राप्त होता है। इस विशेष मामले को 'पियर्सन टाइप VII डिस्ट्रीब्यूशन' के रूप में जाना जाता है (cf. पियर्सन 1916, पृष्ठ 450)। इसका घनत्व है


:<math>p(x) = \frac{1}{\alpha\operatorname{\Beta}\left(m-\frac12, \frac12\right)} \left[1 + \left(\frac{x-\lambda} \alpha \right)^2 \right]^{-m},</math>
:<math>p(x) = \frac{1}{\alpha\operatorname{\Beta}\left(m-\frac12, \frac12\right)} \left[1 + \left(\frac{x-\lambda} \alpha \right)^2 \right]^{-m},</math>
जहां B बीटा फ़ंक्शन है.
जहां B बीटा फलन है.


प्रकार VII वितरण का एक वैकल्पिक मानकीकरण (और मामूली विशेषज्ञता) लेटिंग द्वारा प्राप्त किया जाता है
प्रकार VII वितरण का एक वैकल्पिक मानकीकरण (और मामूली विशेषज्ञता) लेटिंग द्वारा प्राप्त किया जाता है
Line 126: Line 124:
m &= \frac{\nu+1}{2},
m &= \frac{\nu+1}{2},
\end{align}</math>
\end{align}</math>
इस प्रतिबंधित एक-पैरामीटर परिवार का घनत्व एक मानक छात्र का t है:
इस प्रतिबंधित एक-पैरामीटर समूह का घनत्व एक मानक छात्र का t है:


:<math>p(x) = \frac{1}{\sqrt{\nu}\,\operatorname{\Beta}\left(\frac{\nu}{2}, \frac12\right)} \left(1 + \frac{x^2}{\nu} \right)^{-\frac{\nu+1}{2}},</math>
:<math>p(x) = \frac{1}{\sqrt{\nu}\,\operatorname{\Beta}\left(\frac{\nu}{2}, \frac12\right)} \left(1 + \frac{x^2}{\nu} \right)^{-\frac{\nu+1}{2}},</math>
Line 144: Line 142:


:<math>p(x) \propto \exp\left( -\frac{1}{b_2} \int\frac{x-a}{(x - a_1) (x - a_2)} \,dx \right).</math>
:<math>p(x) \propto \exp\left( -\frac{1}{b_2} \int\frac{x-a}{(x - a_1) (x - a_2)} \,dx \right).</math>
पियर्सन (1895, पृ. 362) ने इसे लघुगणक मामला कहा, क्योंकि अभिन्न
पियर्सन (1895, पृ. 362) ने इसे लघुगणक स्थिति कहा, क्योंकि अभिन्न


:<math>\int\frac{x-a}{(x - a_1) (x - a_2)} \,dx = \frac{(a_1-a)\ln(x-a_1) - (a_2-a)\ln(x-a_2)}{a_1-a_2} + C</math>
:<math>\int\frac{x-a}{(x - a_1) (x - a_2)} \,dx = \frac{(a_1-a)\ln(x-a_1) - (a_2-a)\ln(x-a_2)}{a_1-a_2} + C</math>
पिछले मामले की तरह केवल लघुगणक फ़ंक्शन शामिल है न कि आर्कटान फ़ंक्शन।
पिछले मामले की तरह केवल लघुगणक फलन सम्मिलितहै न कि आर्कटान फलन।


प्रतिस्थापन का उपयोग करना
प्रतिस्थापन का उपयोग करना
Line 178: Line 176:


==== पियर्सन प्रकार II वितरण ====
==== पियर्सन प्रकार II वितरण ====
पियर्सन प्रकार II वितरण सममित वितरण तक सीमित पियर्सन प्रकार I परिवार का एक विशेष मामला है।
पियर्सन प्रकार II वितरण सममित वितरण तक सीमित पियर्सन प्रकार I समूह का एक विशेष स्थिति है।


पियर्सन टाइप II कर्व के लिए,<ref>{{cite journal | jstor = 1165017 | title = स्पीयरमैन के रैंक ऑर्डर सहसंबंध के लिए महत्वपूर्ण मूल्य| journal = Journal of Educational Statistics | volume = 14 | issue = 3 | pages = 245–253 | last = Ramsey| first = Philip H.| date = 1989-09-01}}</ref>
पियर्सन टाइप II कर्व के लिए,<ref>{{cite journal | jstor = 1165017 | title = स्पीयरमैन के रैंक ऑर्डर सहसंबंध के लिए महत्वपूर्ण मूल्य| journal = Journal of Educational Statistics | volume = 14 | issue = 3 | pages = 245–253 | last = Ramsey| first = Philip H.| date = 1989-09-01}}</ref>
Line 198: Line 196:
\beta_2 &= \frac{3(25n^4-13n^3-73n^2+37n+72)}{25n(n+1)^2(n-1)}.
\beta_2 &= \frac{3(25n^4-13n^3-73n^2+37n+72)}{25n(n+1)^2(n-1)}.
\end{align}</math>
\end{align}</math>
==== पियर्सन प्रकार III वितरण ====
==== पियर्सन प्रकार III वितरण ====
परिभाषित
परिभाषित
Line 219: Line 215:


== अन्य वितरणों से संबंध ==
== अन्य वितरणों से संबंध ==
पियर्सन परिवार में निम्नलिखित वितरण शामिल हैं:
पियर्सन समूह में निम्नलिखित वितरण सम्मिलितहैं:
* बीटा वितरण (प्रकार I)
* बीटा वितरण (प्रकार I)
* बीटा प्राइम वितरण (प्रकार VI)
* बीटा प्राइम वितरण (प्रकार VI)
Line 233: Line 229:
* विद्यार्थी का t-वितरण|छात्र का t-वितरण (प्रकार VII, जो प्रकार IV का गैर-तिरछा उपप्रकार है)
* विद्यार्थी का t-वितरण|छात्र का t-वितरण (प्रकार VII, जो प्रकार IV का गैर-तिरछा उपप्रकार है)


डेटा में वितरण को फिट करने के उद्देश्य से वितरण की पियर्सन प्रणाली के विकल्प [[मात्रात्मक-पैरामीटरीकृत वितरण]] (क्यूपीडी) और मेटालॉग वितरण हैं। क्यूपीडी और मेटलॉग पियर्सन प्रणाली की तुलना में अधिक आकार और सीमा लचीलापन प्रदान कर सकते हैं। फिटिंग क्षणों के बजाय, क्यूपीडी आम तौर पर अनुभवजन्य वितरण फ़ंक्शन या [[रैखिक न्यूनतम वर्ग]]ों वाले अन्य डेटा के लिए उपयुक्त होते हैं।
डेटा में वितरण को फिट करने के उद्देश्य से वितरण की पियर्सन प्रणाली के विकल्प [[मात्रात्मक-पैरामीटरीकृत वितरण]] (क्यूपीडी) और मेटालॉग वितरण हैं। क्यूपीडी और मेटलॉग पियर्सन प्रणाली की तुलना में अधिक आकार और सीमा लचीलापन प्रदान कर सकते हैं। फिटिंग क्षणों के बजाय, क्यूपीडी सामान्यतः अनुभवजन्य वितरण फलन या [[रैखिक न्यूनतम वर्ग]]ों वाले अन्य डेटा के लिए उपयुक्त होते हैं।


== अनुप्रयोग ==
== अनुप्रयोग ==
इन मॉडलों का उपयोग वित्तीय बाजारों में किया जाता है, क्योंकि उनकी इस तरह से पैरामीट्रिज्ड होने की क्षमता होती है जिसका बाजार व्यापारियों के लिए सहज अर्थ होता है। कई मॉडल वर्तमान में उपयोग में हैं जो दरों, स्टॉक आदि की अस्थिरता की स्टोकेस्टिक प्रकृति को पकड़ते हैं।{{which|date=February 2018}}{{citation needed|date=February 2018}} और वितरण का यह परिवार अधिक महत्वपूर्ण में से एक साबित हो सकता है।
इन मॉडलों का उपयोग वित्तीय बाजारों में किया जाता है, क्योंकि उनकी इस तरह से पैरामीट्रिज्ड होने की क्षमता होती है जिसका बाजार व्यापारियों के लिए सहज अर्थ होता है। कई मॉडल वर्तमान में उपयोग में हैं जो दरों, स्टॉक आदि की अस्थिरता की स्टोकेस्टिक प्रकृति को पकड़ते हैं और वितरण का यह समूह अधिक महत्वपूर्ण में से एक साबित हो सकता है।


संयुक्त राज्य अमेरिका में, लॉग-पियर्सन III बाढ़ आवृत्ति विश्लेषण के लिए डिफ़ॉल्ट वितरण है।<ref>{{Cite web|url=https://water.usgs.gov/osw/bulletin17b/dl_flow.pdf|title=बाढ़ प्रवाह आवृत्ति निर्धारित करने के लिए दिशानिर्देश|date=March 1982|website=USGS Water|access-date=2019-06-14}}</ref>
संयुक्त राज्य अमेरिका में, लॉग-पियर्सन III बाढ़ आवृत्ति विश्लेषण के लिए डिफ़ॉल्ट वितरण है।<ref>{{Cite web|url=https://water.usgs.gov/osw/bulletin17b/dl_flow.pdf|title=बाढ़ प्रवाह आवृत्ति निर्धारित करने के लिए दिशानिर्देश|date=March 1982|website=USGS Water|access-date=2019-06-14}}</ref>
हाल ही में, पियर्सन वितरण के लिए ऐसे विकल्प विकसित किए गए हैं जो अधिक लचीले हैं और डेटा में फिट होने में आसान हैं। मेटलॉग वितरण देखें.
हाल ही में, पियर्सन वितरण के लिए ऐसे विकल्प विकसित किए गए हैं जो अधिक लचीले हैं और डेटा में फिट होने में आसान हैं। मेटलॉग वितरण देखें.



Revision as of 22:22, 17 July 2023

पियर्सन प्रणाली का आरेख, β के संदर्भ में प्रकार I, III, VI, V और IV के वितरण को दर्शाता है1 (वर्ग तिरछापन) और β2 (पारंपरिक कुर्टोसिस)

पियर्सन वितरण सतत संभाव्यता वितरण संभाव्यता वितरण का एक समूह है। इसे पहली बार 1895 में कार्ल पियर्सन द्वारा प्रकाशित किया गया था और बाद में उनके द्वारा 1901 और 1916 में जैव सांख्यिकी पर लेखों की एक श्रृंखला में विस्तारित किया गया था।

इतिहास

पियर्सन प्रणाली मूल रूप से दृश्यमान विषम टिप्पणियों को मॉडल करने के प्रयास में तैयार की गई थी। उस समय यह सर्वविदित था कि किसी सैद्धांतिक मॉडल को प्रेक्षित डेटा के पहले दो संचयकों या क्षण (गणित) में फिट करने के लिए कैसे समायोजित किया जाए: किसी भी संभाव्यता वितरण को स्थान-पैमाने पर समूह बनाने के लिए सीधे बढ़ाया जा सकता है। पैथोलॉजिकल (गणित) स्थितियों को छोड़कर, एक स्थान-स्तरीय समूह को देखे गए माध्य (गणित) (प्रथम संचयी) और विचरण (द्वितीय संचयी) को मनमाने ढंग से अच्छी तरह से फिट करने के लिए बनाया जा सकता है। हालाँकि, यह ज्ञात नहीं था कि संभाव्यता वितरण का निर्माण कैसे किया जाए जिसमें तिरछापन (मानकीकृत तीसरा क्यूमुलेंट) और कुकुदता (मानकीकृत चौथा क्यूमुलेंट) को समान रूप से स्वतंत्र रूप से समायोजित किया जा सके। यह आवश्यकता तब स्पष्ट हो गई जब ज्ञात सैद्धांतिक मॉडलों को तिरछापन प्रदर्शित करने वाले प्रेक्षित डेटा में फिट करने का प्रयास किया गया। पियर्सन के उदाहरणों में उत्तरजीविता डेटा सम्मिलितहै, जो सामान्यतः असममित होता है।

अपने मूल पेपर में, पियर्सन (1895, पृष्ठ 360) ने सामान्य वितरण (जिसे मूल रूप से प्रकार V के रूप में जाना जाता था) के अलावा चार प्रकार के वितरण (I से IV तक क्रमांकित) की पहचान की। वर्गीकरण इस बात पर निर्भर करता था कि क्या वितरण एक सीमित अंतराल पर, आधी रेखा पर, या पूरी वास्तविक रेखा पर समर्थित (गणित) थे; और क्या वे संभावित रूप से तिरछे थे या आवश्यक रूप से सममित थे। एक दूसरे पेपर (पियर्सन 1901) ने दो चूक तय कीं: इसने प्रकार V वितरण को फिर से परिभाषित किया (मूल रूप से केवल सामान्य वितरण, लेकिन अब व्युत्क्रम-गामा वितरण) और प्रकार VI वितरण की प्रारम्भ की। पहले दो पेपर मिलकर पियर्सन प्रणाली के पांच मुख्य प्रकारों (I, III, IV, V, और VI) को कवर करते हैं। तीसरे पेपर में, पियर्सन (1916) ने और विशेष मामले और उपप्रकार (VII से XII) पेश किए।

रिहंद (1909, पृ. 430-432) ने पियर्सन प्रणाली के पैरामीटर स्पेस को देखने का एक सरल तरीका तैयार किया, जिसे बाद में पियर्सन (1916, प्लेट 1 और पृ. 430एफएफ., 448एफएफ.) द्वारा अपनाया गया। पियर्सन प्रकार की विशेषता दो मात्राओं से होती है, जिन्हें सामान्यतः β कहा जाता है1 और β2. पहला तिरछापन का वर्ग है: कहां γ1 तिरछापन, या तीसरा मानकीकृत क्षण है। दूसरा पारंपरिक कर्टोसिस या चौथा मानकीकृत क्षण है: β2 = सी2 + 3. (आधुनिक उपचार कर्टोसिस γ को परिभाषित करते हैं2 क्षणों के बजाय संचयकों के संदर्भ में, ताकि सामान्य वितरण के लिए हमारे पास γ हो2 = 0 और β2 = 3. यहां हम ऐतिहासिक मिसाल का पालन करते हैं और β का उपयोग करते हैं2.) दाईं ओर का आरेख दिखाता है कि कौन सा पियर्सन किसी दिए गए ठोस वितरण को टाइप करता है (एक बिंदु (β) द्वारा पहचाना जाता है1, बी2)) से संबंधित।

आज हम जिन तिरछे और/या गैर-मेसोकुर्टिक वितरणों से परिचित हैं उनमें से कई 1890 के दशक की प्रारम्भ में अभी भी अज्ञात थे। जिसे अब बीटा वितरण के रूप में जाना जाता है, उसका उपयोग थॉमस बेयस ने व्युत्क्रम संभाव्यता पर अपने 1763 के कार्य में बर्नौली वितरण के पैरामीटर के पश्च वितरण के रूप में किया था। पियर्सन प्रणाली में इसकी सदस्यता के कारण बीटा वितरण को प्रमुखता मिली और 1940 के दशक तक इसे पियर्सन प्रकार I वितरण के रूप में जाना जाता था।[1] (पियर्सन का प्रकार II वितरण प्रकार I का एक विशेष स्थिति है, लेकिन सामान्यतः इसे अलग नहीं किया जाता है।) गामा वितरण पियर्सन के काम से उत्पन्न हुआ (पियर्सन 1893, पृष्ठ 331; पियर्सन 1895, पृष्ठ 357, 360, 373-376) और 1930 और 1940 के दशक में अपना आधुनिक नाम प्राप्त करने से पहले, इसे पियर्सन टाइप III वितरण के रूप में जाना जाता था।[2] पियर्सन के 1895 के पेपर ने प्रकार IV वितरण की प्रारम्भ की, जिसमें एक विशेष मामले के रूप में छात्र का t-वितरण|छात्र का टी-वितरण सम्मिलित है, जो विलियम सीली गॉसेट के बाद के कई वर्षों के उपयोग से पहले का है। उनके 1901 के पेपर ने व्युत्क्रम-गामा वितरण (प्रकार V) और बीटा प्राइम वितरण (प्रकार VI) की प्रारम्भ की थी।

परिभाषा

पियर्सन संभाव्यता घनत्व फलन p को अंतर समीकरण के किसी भी वैध समाधान के रूप में परिभाषित किया गया है (सीएफ. पियर्सन 1895, पृष्ठ 381)

साथ:

ऑर्ड के अनुसार,[3] पियर्सन ने समीकरण (1) का अंतर्निहित रूप, सबसे पहले, सामान्य वितरण के घनत्व फलन के लघुगणक के व्युत्पन्न के लिए सूत्र (जो एक रैखिक फलन देता है) और दूसरे, मूल्यों के लिए पुनरावृत्ति संबंध के आधार पर तैयार किया। हाइपरज्यामितीय वितरण की संभाव्यता द्रव्यमान फलन में (जो रैखिक-विभाजित-द्विघात संरचना उत्पन्न करता है)।

समीकरण (1) में, पैरामीटर एक स्थिर बिंदु निर्धारित करता है, और इसलिए कुछ शर्तों के तहत वितरण का एक मोड (सांख्यिकी) निर्धारित करता है, क्योंकि

विभेदक समीकरण से सीधे अनुसरण करता है।

चूँकि हमारा सामना एक रेखीय अवकल समीकरण से होता है#परिवर्तनीय गुणांकों के साथ प्रथम-क्रम समीकरण|परिवर्तनीय गुणांकों के साथ प्रथम-क्रम रेखीय अवकल समीकरण, इसका समाधान सीधा है:

जब इंटीग्रैंड के कुछ विशेष स्थितियों पर विचार किया जाता है तो इस समाधान में इंटीग्रल काफी सरल हो जाता है। पियर्सन (1895, पृ. 367) ने दो मुख्य स्थितियों की पहचान की, जो द्विघात फलन के विवेचक के चिन्ह (और इसलिए किसी फलन के वास्तविक मूल की संख्या) द्वारा निर्धारित होते हैं।


वितरण के विशेष प्रकार

केस 1, नकारात्मक विभेदक

पियर्सन प्रकार IV वितरण

यदि द्विघात फलन (2) का विभेदक ऋणात्मक है (), इसकी कोई वास्तविक जड़ें नहीं हैं। फिर परिभाषित करें

उसका अवलोकन करो α एक अच्छी तरह से परिभाषित वास्तविक संख्या है और α ≠ 0, क्योंकि अनुमान से और इसलिए b2 ≠ 0. इन प्रतिस्थापनों को लागू करने पर, द्विघात फलन (2) में रूपांतरित हो जाता है

इस सूत्रीकरण से वास्तविक जड़ों की अनुपस्थिति स्पष्ट है, क्योंकि α2आवश्यक रूप से सकारात्मक है।

अब हम अवकल समीकरण (1) के समाधान को y के फलन के रूप में व्यक्त करते हैं:

पियर्सन (1895, पृष्ठ 362) ने इसे त्रिकोणमितीय कहा स्थिति, क्योंकि अभिन्न

व्युत्क्रम त्रिकोणमितीय फलन त्रिकोणमितीय फलन आर्कटान फलन सम्मिलितहै। तब

अंत में, चलो

इन प्रतिस्थापनों को लागू करने पर, हमें पैरामीट्रिक फलन प्राप्त होता है:

इस असामान्य घनत्व को संपूर्ण वास्तविक रेखा पर समर्थन (गणित) प्राप्त है। यह स्केल पैरामीटर α > 0 और आकार पैरामीटर m > 1/2 और ν पर निर्भर करता है। जब हमने अंतर समीकरण (1) का समाधान x के बजाय y के फलन के रूप में ढूंढना चुना तो एक पैरामीटर खो गया। इसलिए हम चौथे पैरामीटर को पुनः प्रस्तुत करते हैं, अर्थात् स्थान पैरामीटर λ। इस प्रकार हमने 'पियर्सन टाइप IV वितरण' का घनत्व प्राप्त किया है:

सामान्यीकृत स्थिरांक में जटिल फलन गामा फलन (Γ) और बीटा फलन (बी) सम्मिलितहोते हैं। ध्यान दें कि यहां स्थान पैरामीटर λ सामान्य फॉर्मूलेशन में पेश किए गए मूल स्थान पैरामीटर के समान नहीं है, लेकिन इसके माध्यम से संबंधित है

पियर्सन प्रकार VII वितरण

λ = 0, σ = 1, और: γ के साथ पियर्सन प्रकार VII घनत्व का प्लॉट2 = ∞ (लाल); सी2 = 4 (नीला); और γ2 = 0 (काला)

पियर्सन प्रकार IV वितरण का आकार पैरामीटर ν इसकी विषमता को नियंत्रित करता है। यदि हम इसका मान शून्य पर स्थिर करते हैं, तो हमें एक सममित तीन-पैरामीटर समूह प्राप्त होता है। इस विशेष मामले को 'पियर्सन टाइप VII डिस्ट्रीब्यूशन' के रूप में जाना जाता है (cf. पियर्सन 1916, पृष्ठ 450)। इसका घनत्व है

जहां B बीटा फलन है.

प्रकार VII वितरण का एक वैकल्पिक मानकीकरण (और मामूली विशेषज्ञता) लेटिंग द्वारा प्राप्त किया जाता है

जिसके लिए m > 3/2 की आवश्यकता है। इसमें व्यापकता का मामूली नुकसान होता है लेकिन यह सुनिश्चित होता है कि वितरण का विचरण मौजूद है और σ के बराबर है2. अब पैरामीटर m केवल वितरण के कुर्टोसिस को नियंत्रित करता है। यदि λ और σ को स्थिर रखा जाता है तो m अनंत तक पहुंचता है, सामान्य वितरण एक विशेष मामले के रूप में उत्पन्न होता है:

यह माध्य λ और मानक विचलन σ के साथ सामान्य वितरण का घनत्व है।

यह आवश्यक है कि m > 5/2 और देना सुविधाजनक है

यह एक और विशेषज्ञता है, और यह गारंटी देता है कि वितरण के पहले चार क्षण मौजूद हैं। अधिक विशेष रूप से, पियर्सन प्रकार VII वितरण को (λ, σ, γ) के संदर्भ में मानकीकृत किया गया है2) का माध्य λ, σ का मानक विचलन, शून्य का तिरछापन और γ का सकारात्मक अतिरिक्त कर्टोसिस है।2.

विद्यार्थी का t-वितरण

पियर्सन प्रकार VII वितरण गैर-मानकीकृत छात्र के टी-वितरण के बराबर है | पैरामीटर ν > 0, μ, σ के साथ छात्र का टी-वितरण2 इसके मूल मानकीकरण में निम्नलिखित प्रतिस्थापन लागू करके:

उस बाधा का निरीक्षण करें m > 1/2 संतुष्ट है।

परिणामी घनत्व है

जिसे विद्यार्थी के टी-वितरण के घनत्व के रूप में आसानी से पहचाना जा सकता है।

इसका तात्पर्य यह है कि पियर्सन प्रकार VII वितरण मानक छात्र के टी-वितरण|छात्र के टी-वितरण और मानक कॉची वितरण को भी समाहित करता है। विशेष रूप से, मानक छात्र का टी-वितरण एक उपकेस के रूप में उत्पन्न होता है, जब μ = 0 और σ2 = 1, निम्नलिखित प्रतिस्थापन के बराबर:

इस प्रतिबंधित एक-पैरामीटर समूह का घनत्व एक मानक छात्र का t है:


केस 2, गैर-नकारात्मक विभेदक

यदि द्विघात फलन (2) में एक गैर-नकारात्मक विभेदक है (), इसकी वास्तविक जड़ें हैं a1 और ए2 (जरूरी नहीं कि अलग हो):

वास्तविक मूलों की उपस्थिति में द्विघात फलन (2) को इस प्रकार लिखा जा सकता है

और अंतर समीकरण का समाधान इसलिए है

पियर्सन (1895, पृ. 362) ने इसे लघुगणक स्थिति कहा, क्योंकि अभिन्न

पिछले मामले की तरह केवल लघुगणक फलन सम्मिलितहै न कि आर्कटान फलन।

प्रतिस्थापन का उपयोग करना

हमें अवकल समीकरण (1) का निम्नलिखित समाधान प्राप्त होता है:

चूँकि यह घनत्व केवल आनुपातिकता के एक छिपे हुए स्थिरांक तक ही जाना जाता है, उस स्थिरांक को बदला जा सकता है और घनत्व को इस प्रकार लिखा जा सकता है:


पियर्सन प्रकार I वितरण

पियर्सन प्रकार I वितरण (बीटा वितरण का एक सामान्यीकरण) तब उत्पन्न होता है जब द्विघात समीकरण (2) की जड़ें विपरीत चिह्न की होती हैं, अर्थात, . फिर समाधान पी अंतराल पर समर्थित है . प्रतिस्थापन लागू करें

कहाँ , जो y के संदर्भ में एक समाधान देता है जो अंतराल (0, 1) पर समर्थित है:

कोई परिभाषित कर सकता है:

स्थिरांकों और मापदंडों को पुनः समूहित करने से यह सरल हो जाता है:

इस प्रकार ए का अनुसरण करता है साथ . यह पता चला है कि एम1, एम2 > −1 एक उचित संभाव्यता घनत्व फलन होने के लिए p के लिए आवश्यक और पर्याप्त है।

पियर्सन प्रकार II वितरण

पियर्सन प्रकार II वितरण सममित वितरण तक सीमित पियर्सन प्रकार I समूह का एक विशेष स्थिति है।

पियर्सन टाइप II कर्व के लिए,[4]

कहाँ

कोटि, y, की आवृत्ति है . पियर्सन टाइप II कर्व का उपयोग स्पीयरमैन के रैंक सहसंबंध गुणांक के लिए महत्वपूर्ण सहसंबंध गुणांक की तालिका की गणना करने में किया जाता है जब श्रृंखला में वस्तुओं की संख्या 100 (या कुछ स्रोतों के आधार पर 30) से कम होती है। उसके बाद, वितरण एक मानक छात्र के टी-वितरण की नकल करता है। मानों की तालिका के लिए, कुछ मानों का उपयोग पिछले समीकरण में स्थिरांक के रूप में किया जाता है:

उपयोग किए गए x के क्षण हैं

पियर्सन प्रकार III वितरण

परिभाषित

है . पियर्सन प्रकार III वितरण एक गामा वितरण या ची-वर्ग वितरण है।

पियर्सन प्रकार V वितरण

नए पैरामीटर परिभाषित करना:

एक का अनुसरण करता है . पियर्सन प्रकार V वितरण एक व्युत्क्रम-गामा वितरण है।

पियर्सन प्रकार VI वितरण

परिभाषित

ए का अनुसरण करता है . पियर्सन प्रकार VI वितरण एक बीटा प्राइम वितरण या एफ-वितरण|एफ-वितरण है।

अन्य वितरणों से संबंध

पियर्सन समूह में निम्नलिखित वितरण सम्मिलितहैं:

  • बीटा वितरण (प्रकार I)
  • बीटा प्राइम वितरण (प्रकार VI)
  • कॉची वितरण (प्रकार IV)
  • ची-वर्ग वितरण (प्रकार III)
  • समान वितरण (निरंतर) (प्रकार I की सीमा)
  • घातीय वितरण (प्रकार III)
  • गामा वितरण (प्रकार III)
  • एफ-वितरण|एफ-वितरण (प्रकार VI)
  • व्युत्क्रम-ची-वर्ग वितरण (प्रकार V)
  • व्युत्क्रम-गामा वितरण (प्रकार V)
  • सामान्य वितरण (प्रकार I, III, IV, V, या VI की सीमा)
  • विद्यार्थी का t-वितरण|छात्र का t-वितरण (प्रकार VII, जो प्रकार IV का गैर-तिरछा उपप्रकार है)

डेटा में वितरण को फिट करने के उद्देश्य से वितरण की पियर्सन प्रणाली के विकल्प मात्रात्मक-पैरामीटरीकृत वितरण (क्यूपीडी) और मेटालॉग वितरण हैं। क्यूपीडी और मेटलॉग पियर्सन प्रणाली की तुलना में अधिक आकार और सीमा लचीलापन प्रदान कर सकते हैं। फिटिंग क्षणों के बजाय, क्यूपीडी सामान्यतः अनुभवजन्य वितरण फलन या रैखिक न्यूनतम वर्गों वाले अन्य डेटा के लिए उपयुक्त होते हैं।

अनुप्रयोग

इन मॉडलों का उपयोग वित्तीय बाजारों में किया जाता है, क्योंकि उनकी इस तरह से पैरामीट्रिज्ड होने की क्षमता होती है जिसका बाजार व्यापारियों के लिए सहज अर्थ होता है। कई मॉडल वर्तमान में उपयोग में हैं जो दरों, स्टॉक आदि की अस्थिरता की स्टोकेस्टिक प्रकृति को पकड़ते हैं और वितरण का यह समूह अधिक महत्वपूर्ण में से एक साबित हो सकता है।

संयुक्त राज्य अमेरिका में, लॉग-पियर्सन III बाढ़ आवृत्ति विश्लेषण के लिए डिफ़ॉल्ट वितरण है।[5]

हाल ही में, पियर्सन वितरण के लिए ऐसे विकल्प विकसित किए गए हैं जो अधिक लचीले हैं और डेटा में फिट होने में आसान हैं। मेटलॉग वितरण देखें.

टिप्पणियाँ

  1. Miller, Jeff; et al. (2006-07-09). "बीटा वितरण". Earliest Known Uses of Some of the Words of Mathematics. Retrieved 2006-12-09.
  2. Miller, Jeff; et al. (2006-12-07). "गामा वितरण". Earliest Known Uses of Some of the Words of Mathematics. Retrieved 2006-12-09.
  3. Ord J.K. (1972) p. 2
  4. Ramsey, Philip H. (1989-09-01). "स्पीयरमैन के रैंक ऑर्डर सहसंबंध के लिए महत्वपूर्ण मूल्य". Journal of Educational Statistics. 14 (3): 245–253. JSTOR 1165017.
  5. "बाढ़ प्रवाह आवृत्ति निर्धारित करने के लिए दिशानिर्देश" (PDF). USGS Water. March 1982. Retrieved 2019-06-14.


स्रोत

प्राथमिक स्रोत

द्वितीयक स्रोत

संदर्भ

  • Elderton, Sir W.P, Johnson, N.L. (1969) Systems of Frequency Curves. Cambridge University Press.
  • Ord J.K. (1972) Families of Frequency Distributions. Griffin, London.