पियर्सन वितरण
पियर्सन वितरण सतत संभाव्यता वितरण संभाव्यता वितरण का एक परिवार है। इसे पहली बार 1895 में कार्ल पियर्सन द्वारा प्रकाशित किया गया था और बाद में उनके द्वारा 1901 और 1916 में जैव सांख्यिकी पर लेखों की एक श्रृंखला में विस्तारित किया गया था।
इतिहास
पियर्सन प्रणाली मूल रूप से दृश्यमान विषम टिप्पणियों को मॉडल करने के प्रयास में तैयार की गई थी। उस समय यह सर्वविदित था कि किसी सैद्धांतिक मॉडल को प्रेक्षित डेटा के पहले दो संचयकों या क्षण (गणित) में फिट करने के लिए कैसे समायोजित किया जाए: किसी भी संभाव्यता वितरण को स्थान-पैमाने पर परिवार बनाने के लिए सीधे बढ़ाया जा सकता है। पैथोलॉजिकल (गणित) मामलों को छोड़कर, एक स्थान-स्तरीय परिवार को देखे गए माध्य (गणित) (प्रथम संचयी) और विचरण (द्वितीय संचयी) को मनमाने ढंग से अच्छी तरह से फिट करने के लिए बनाया जा सकता है। हालाँकि, यह ज्ञात नहीं था कि संभाव्यता वितरण का निर्माण कैसे किया जाए जिसमें तिरछापन (मानकीकृत तीसरा क्यूमुलेंट) और कुकुदता (मानकीकृत चौथा क्यूमुलेंट) को समान रूप से स्वतंत्र रूप से समायोजित किया जा सके। यह आवश्यकता तब स्पष्ट हो गई जब ज्ञात सैद्धांतिक मॉडलों को तिरछापन प्रदर्शित करने वाले प्रेक्षित डेटा में फिट करने का प्रयास किया गया। पियर्सन के उदाहरणों में उत्तरजीविता डेटा शामिल है, जो आमतौर पर असममित होता है।
अपने मूल पेपर में, पियर्सन (1895, पृष्ठ 360) ने सामान्य वितरण (जिसे मूल रूप से प्रकार V के रूप में जाना जाता था) के अलावा चार प्रकार के वितरण (I से IV तक क्रमांकित) की पहचान की। वर्गीकरण इस बात पर निर्भर करता था कि क्या वितरण एक सीमित अंतराल पर, आधी रेखा पर, या पूरी वास्तविक रेखा पर समर्थित (गणित) थे; और क्या वे संभावित रूप से तिरछे थे या आवश्यक रूप से सममित थे। एक दूसरे पेपर (पियर्सन 1901) ने दो चूक तय कीं: इसने प्रकार V वितरण को फिर से परिभाषित किया (मूल रूप से केवल सामान्य वितरण, लेकिन अब व्युत्क्रम-गामा वितरण) और प्रकार VI वितरण की शुरुआत की। पहले दो पेपर मिलकर पियर्सन प्रणाली के पांच मुख्य प्रकारों (I, III, IV, V, और VI) को कवर करते हैं। तीसरे पेपर में, पियर्सन (1916) ने और विशेष मामले और उपप्रकार (VII से XII) पेश किए।
रिहंद (1909, पृ. 430-432) ने पियर्सन प्रणाली के पैरामीटर स्पेस को देखने का एक सरल तरीका तैयार किया, जिसे बाद में पियर्सन (1916, प्लेट 1 और पृ. 430एफएफ., 448एफएफ.) द्वारा अपनाया गया। पियर्सन प्रकार की विशेषता दो मात्राओं से होती है, जिन्हें आमतौर पर β कहा जाता है1 और β2. पहला तिरछापन का वर्ग है: कहां γ1 तिरछापन, या तीसरा मानकीकृत क्षण है। दूसरा पारंपरिक कर्टोसिस या चौथा मानकीकृत क्षण है: β2 = सी2 + 3. (आधुनिक उपचार कर्टोसिस γ को परिभाषित करते हैं2 क्षणों के बजाय संचयकों के संदर्भ में, ताकि सामान्य वितरण के लिए हमारे पास γ हो2 = 0 और β2 = 3. यहां हम ऐतिहासिक मिसाल का पालन करते हैं और β का उपयोग करते हैं2.) दाईं ओर का आरेख दिखाता है कि कौन सा पियर्सन किसी दिए गए ठोस वितरण को टाइप करता है (एक बिंदु (β) द्वारा पहचाना जाता है1, बी2)) से संबंधित।
आज हम जिन तिरछे और/या गैर-मेसोकुर्टिक वितरणों से परिचित हैं उनमें से कई 1890 के दशक की शुरुआत में अभी भी अज्ञात थे। जिसे अब बीटा वितरण के रूप में जाना जाता है, उसका उपयोग थॉमस बेयस ने व्युत्क्रम संभाव्यता पर अपने 1763 के कार्य में बर्नौली वितरण के पैरामीटर के पश्च वितरण के रूप में किया था। पियर्सन प्रणाली में इसकी सदस्यता के कारण बीटा वितरण को प्रमुखता मिली और 1940 के दशक तक इसे पियर्सन प्रकार I वितरण के रूप में जाना जाता था।[1] (पियर्सन का प्रकार II वितरण प्रकार I का एक विशेष मामला है, लेकिन आमतौर पर इसे अलग नहीं किया जाता है।) गामा वितरण पियर्सन के काम से उत्पन्न हुआ (पियर्सन 1893, पृष्ठ 331; पियर्सन 1895, पृष्ठ 357, 360, 373-376) और 1930 और 1940 के दशक में अपना आधुनिक नाम प्राप्त करने से पहले, इसे पियर्सन टाइप III वितरण के रूप में जाना जाता था।[2] पियर्सन के 1895 के पेपर ने प्रकार IV वितरण की शुरुआत की, जिसमें एक विशेष मामले के रूप में छात्र का टी-वितरण|छात्र का टी-वितरण शामिल है, जो विलियम सीली गॉसेट के बाद के कई वर्षों के उपयोग से पहले का है। उनके 1901 के पेपर ने व्युत्क्रम-गामा वितरण (प्रकार V) और बीटा प्राइम वितरण (प्रकार VI) की शुरुआत की।
परिभाषा
पियर्सन संभाव्यता घनत्व फ़ंक्शन पी को अंतर समीकरण के किसी भी वैध समाधान के रूप में परिभाषित किया गया है (सीएफ. पियर्सन 1895, पृष्ठ 381)
साथ:
ऑर्ड के अनुसार,[3] पियर्सन ने समीकरण (1) का अंतर्निहित रूप, सबसे पहले, सामान्य वितरण के घनत्व फ़ंक्शन के लघुगणक के व्युत्पन्न के लिए सूत्र (जो एक रैखिक फ़ंक्शन देता है) और दूसरे, मूल्यों के लिए पुनरावृत्ति संबंध के आधार पर तैयार किया। हाइपरज्यामितीय वितरण की संभाव्यता द्रव्यमान फ़ंक्शन में (जो रैखिक-विभाजित-द्विघात संरचना उत्पन्न करता है)।
समीकरण (1) में, पैरामीटर एक स्थिर बिंदु निर्धारित करता है, और इसलिए कुछ शर्तों के तहत वितरण का एक मोड (सांख्यिकी) निर्धारित करता है, क्योंकि
विभेदक समीकरण से सीधे अनुसरण करता है।
चूँकि हमारा सामना एक रेखीय अवकल समीकरण से होता है#परिवर्तनीय गुणांकों के साथ प्रथम-क्रम समीकरण|परिवर्तनीय गुणांकों के साथ प्रथम-क्रम रेखीय अवकल समीकरण, इसका समाधान सीधा है:
जब इंटीग्रैंड के कुछ विशेष मामलों पर विचार किया जाता है तो इस समाधान में इंटीग्रल काफी सरल हो जाता है। पियर्सन (1895, पृ. 367) ने दो मुख्य मामलों की पहचान की, जो द्विघात फलन के विवेचक के चिन्ह (और इसलिए किसी फलन के वास्तविक मूल की संख्या) द्वारा निर्धारित होते हैं।
वितरण के विशेष प्रकार
केस 1, नकारात्मक विभेदक
पियर्सन प्रकार IV वितरण
यदि द्विघात फलन (2) का विभेदक ऋणात्मक है (), इसकी कोई वास्तविक जड़ें नहीं हैं। फिर परिभाषित करें
उसका अवलोकन करो α एक अच्छी तरह से परिभाषित वास्तविक संख्या है और α ≠ 0, क्योंकि अनुमान से और इसलिए b2 ≠ 0. इन प्रतिस्थापनों को लागू करने पर, द्विघात फलन (2) में रूपांतरित हो जाता है
इस सूत्रीकरण से वास्तविक जड़ों की अनुपस्थिति स्पष्ट है, क्योंकि α2आवश्यक रूप से सकारात्मक है।
अब हम अवकल समीकरण (1) के समाधान को y के फलन के रूप में व्यक्त करते हैं:
पियर्सन (1895, पृष्ठ 362) ने इसे त्रिकोणमितीय कहा मामला, क्योंकि अभिन्न
व्युत्क्रम त्रिकोणमितीय फलन त्रिकोणमितीय फलन आर्कटान फलन शामिल है। तब
अंत में, चलो
इन प्रतिस्थापनों को लागू करने पर, हमें पैरामीट्रिक फ़ंक्शन प्राप्त होता है:
इस असामान्य घनत्व को संपूर्ण वास्तविक रेखा पर समर्थन (गणित) प्राप्त है। यह स्केल पैरामीटर α > 0 और आकार पैरामीटर m > 1/2 और ν पर निर्भर करता है। जब हमने अंतर समीकरण (1) का समाधान x के बजाय y के फ़ंक्शन के रूप में ढूंढना चुना तो एक पैरामीटर खो गया। इसलिए हम चौथे पैरामीटर को पुनः प्रस्तुत करते हैं, अर्थात् स्थान पैरामीटर λ। इस प्रकार हमने 'पियर्सन टाइप IV वितरण' का घनत्व प्राप्त किया है:
सामान्यीकृत स्थिरांक में जटिल फ़ंक्शन गामा फ़ंक्शन (Γ) और बीटा फ़ंक्शन (बी) शामिल होते हैं। ध्यान दें कि यहां स्थान पैरामीटर λ सामान्य फॉर्मूलेशन में पेश किए गए मूल स्थान पैरामीटर के समान नहीं है, लेकिन इसके माध्यम से संबंधित है
पियर्सन प्रकार VII वितरण
पियर्सन प्रकार IV वितरण का आकार पैरामीटर ν इसकी विषमता को नियंत्रित करता है। यदि हम इसका मान शून्य पर स्थिर करते हैं, तो हमें एक सममित तीन-पैरामीटर परिवार प्राप्त होता है। इस विशेष मामले को 'पियर्सन टाइप VII डिस्ट्रीब्यूशन' के रूप में जाना जाता है (cf. पियर्सन 1916, पृष्ठ 450)। इसका घनत्व है
जहां B बीटा फ़ंक्शन है.
प्रकार VII वितरण का एक वैकल्पिक मानकीकरण (और मामूली विशेषज्ञता) लेटिंग द्वारा प्राप्त किया जाता है
जिसके लिए m > 3/2 की आवश्यकता है। इसमें व्यापकता का मामूली नुकसान होता है लेकिन यह सुनिश्चित होता है कि वितरण का विचरण मौजूद है और σ के बराबर है2. अब पैरामीटर m केवल वितरण के कुर्टोसिस को नियंत्रित करता है। यदि λ और σ को स्थिर रखा जाता है तो m अनंत तक पहुंचता है, सामान्य वितरण एक विशेष मामले के रूप में उत्पन्न होता है:
यह माध्य λ और मानक विचलन σ के साथ सामान्य वितरण का घनत्व है।
यह आवश्यक है कि m > 5/2 और देना सुविधाजनक है
यह एक और विशेषज्ञता है, और यह गारंटी देता है कि वितरण के पहले चार क्षण मौजूद हैं। अधिक विशेष रूप से, पियर्सन प्रकार VII वितरण को (λ, σ, γ) के संदर्भ में मानकीकृत किया गया है2) का माध्य λ, σ का मानक विचलन, शून्य का तिरछापन और γ का सकारात्मक अतिरिक्त कर्टोसिस है।2.
विद्यार्थी का t-वितरण
पियर्सन प्रकार VII वितरण गैर-मानकीकृत छात्र के टी-वितरण के बराबर है | पैरामीटर ν > 0, μ, σ के साथ छात्र का टी-वितरण2 इसके मूल मानकीकरण में निम्नलिखित प्रतिस्थापन लागू करके:
उस बाधा का निरीक्षण करें m > 1/2 संतुष्ट है।
परिणामी घनत्व है
जिसे विद्यार्थी के टी-वितरण के घनत्व के रूप में आसानी से पहचाना जा सकता है।
इसका तात्पर्य यह है कि पियर्सन प्रकार VII वितरण मानक छात्र के टी-वितरण|छात्र के टी-वितरण और मानक कॉची वितरण को भी समाहित करता है। विशेष रूप से, मानक छात्र का टी-वितरण एक उपकेस के रूप में उत्पन्न होता है, जब μ = 0 और σ2 = 1, निम्नलिखित प्रतिस्थापन के बराबर:
इस प्रतिबंधित एक-पैरामीटर परिवार का घनत्व एक मानक छात्र का t है:
केस 2, गैर-नकारात्मक विभेदक
यदि द्विघात फलन (2) में एक गैर-नकारात्मक विभेदक है (), इसकी वास्तविक जड़ें हैं a1 और ए2 (जरूरी नहीं कि अलग हो):
वास्तविक मूलों की उपस्थिति में द्विघात फलन (2) को इस प्रकार लिखा जा सकता है
और अंतर समीकरण का समाधान इसलिए है
पियर्सन (1895, पृ. 362) ने इसे लघुगणक मामला कहा, क्योंकि अभिन्न
पिछले मामले की तरह केवल लघुगणक फ़ंक्शन शामिल है न कि आर्कटान फ़ंक्शन।
प्रतिस्थापन का उपयोग करना
हमें अवकल समीकरण (1) का निम्नलिखित समाधान प्राप्त होता है:
चूँकि यह घनत्व केवल आनुपातिकता के एक छिपे हुए स्थिरांक तक ही जाना जाता है, उस स्थिरांक को बदला जा सकता है और घनत्व को इस प्रकार लिखा जा सकता है:
पियर्सन प्रकार I वितरण
पियर्सन प्रकार I वितरण (बीटा वितरण का एक सामान्यीकरण) तब उत्पन्न होता है जब द्विघात समीकरण (2) की जड़ें विपरीत चिह्न की होती हैं, अर्थात, . फिर समाधान पी अंतराल पर समर्थित है . प्रतिस्थापन लागू करें
कहाँ , जो y के संदर्भ में एक समाधान देता है जो अंतराल (0, 1) पर समर्थित है:
कोई परिभाषित कर सकता है:
स्थिरांकों और मापदंडों को पुनः समूहित करने से यह सरल हो जाता है:
इस प्रकार ए का अनुसरण करता है साथ . यह पता चला है कि एम1, एम2 > −1 एक उचित संभाव्यता घनत्व फलन होने के लिए p के लिए आवश्यक और पर्याप्त है।
पियर्सन प्रकार II वितरण
पियर्सन प्रकार II वितरण सममित वितरण तक सीमित पियर्सन प्रकार I परिवार का एक विशेष मामला है।
पियर्सन टाइप II कर्व के लिए,[4]
कहाँ
कोटि, y, की आवृत्ति है . पियर्सन टाइप II कर्व का उपयोग स्पीयरमैन के रैंक सहसंबंध गुणांक के लिए महत्वपूर्ण सहसंबंध गुणांक की तालिका की गणना करने में किया जाता है जब श्रृंखला में वस्तुओं की संख्या 100 (या कुछ स्रोतों के आधार पर 30) से कम होती है। उसके बाद, वितरण एक मानक छात्र के टी-वितरण की नकल करता है। मानों की तालिका के लिए, कुछ मानों का उपयोग पिछले समीकरण में स्थिरांक के रूप में किया जाता है:
उपयोग किए गए x के क्षण हैं
पियर्सन प्रकार III वितरण
परिभाषित
है . पियर्सन प्रकार III वितरण एक गामा वितरण या ची-वर्ग वितरण है।
पियर्सन प्रकार V वितरण
नए पैरामीटर परिभाषित करना:
एक का अनुसरण करता है . पियर्सन प्रकार V वितरण एक व्युत्क्रम-गामा वितरण है।
पियर्सन प्रकार VI वितरण
परिभाषित
ए का अनुसरण करता है . पियर्सन प्रकार VI वितरण एक बीटा प्राइम वितरण या एफ-वितरण|एफ-वितरण है।
अन्य वितरणों से संबंध
पियर्सन परिवार में निम्नलिखित वितरण शामिल हैं:
- बीटा वितरण (प्रकार I)
- बीटा प्राइम वितरण (प्रकार VI)
- कॉची वितरण (प्रकार IV)
- ची-वर्ग वितरण (प्रकार III)
- समान वितरण (निरंतर) (प्रकार I की सीमा)
- घातीय वितरण (प्रकार III)
- गामा वितरण (प्रकार III)
- एफ-वितरण|एफ-वितरण (प्रकार VI)
- व्युत्क्रम-ची-वर्ग वितरण (प्रकार V)
- व्युत्क्रम-गामा वितरण (प्रकार V)
- सामान्य वितरण (प्रकार I, III, IV, V, या VI की सीमा)
- विद्यार्थी का t-वितरण|छात्र का t-वितरण (प्रकार VII, जो प्रकार IV का गैर-तिरछा उपप्रकार है)
डेटा में वितरण को फिट करने के उद्देश्य से वितरण की पियर्सन प्रणाली के विकल्प मात्रात्मक-पैरामीटरीकृत वितरण (क्यूपीडी) और मेटालॉग वितरण हैं। क्यूपीडी और मेटलॉग पियर्सन प्रणाली की तुलना में अधिक आकार और सीमा लचीलापन प्रदान कर सकते हैं। फिटिंग क्षणों के बजाय, क्यूपीडी आम तौर पर अनुभवजन्य वितरण फ़ंक्शन या रैखिक न्यूनतम वर्गों वाले अन्य डेटा के लिए उपयुक्त होते हैं।
अनुप्रयोग
इन मॉडलों का उपयोग वित्तीय बाजारों में किया जाता है, क्योंकि उनकी इस तरह से पैरामीट्रिज्ड होने की क्षमता होती है जिसका बाजार व्यापारियों के लिए सहज अर्थ होता है। कई मॉडल वर्तमान में उपयोग में हैं जो दरों, स्टॉक आदि की अस्थिरता की स्टोकेस्टिक प्रकृति को पकड़ते हैं।[which?][citation needed] और वितरण का यह परिवार अधिक महत्वपूर्ण में से एक साबित हो सकता है।
संयुक्त राज्य अमेरिका में, लॉग-पियर्सन III बाढ़ आवृत्ति विश्लेषण के लिए डिफ़ॉल्ट वितरण है।[5] हाल ही में, पियर्सन वितरण के लिए ऐसे विकल्प विकसित किए गए हैं जो अधिक लचीले हैं और डेटा में फिट होने में आसान हैं। मेटलॉग वितरण देखें.
टिप्पणियाँ
- ↑ Miller, Jeff; et al. (2006-07-09). "बीटा वितरण". Earliest Known Uses of Some of the Words of Mathematics. Retrieved 2006-12-09.
- ↑ Miller, Jeff; et al. (2006-12-07). "गामा वितरण". Earliest Known Uses of Some of the Words of Mathematics. Retrieved 2006-12-09.
- ↑ Ord J.K. (1972) p. 2
- ↑ Ramsey, Philip H. (1989-09-01). "स्पीयरमैन के रैंक ऑर्डर सहसंबंध के लिए महत्वपूर्ण मूल्य". Journal of Educational Statistics. 14 (3): 245–253. JSTOR 1165017.
- ↑ "बाढ़ प्रवाह आवृत्ति निर्धारित करने के लिए दिशानिर्देश" (PDF). USGS Water. March 1982. Retrieved 2019-06-14.
स्रोत
प्राथमिक स्रोत
- Pearson, Karl (1893). "विकास के गणितीय सिद्धांत में योगदान [सार]". Proceedings of the Royal Society. 54 (326–330): 329–333. doi:10.1098/rspl.1893.0079. JSTOR 115538.
- Pearson, Karl (1895). "विकास के गणितीय सिद्धांत में योगदान, II: सजातीय सामग्री में विषम भिन्नता" (PDF). Philosophical Transactions of the Royal Society. 186: 343–414. Bibcode:1895RSPTA.186..343P. doi:10.1098/rsta.1895.0010. JSTOR 90649.
- Pearson, Karl (1901). "विकास के सिद्धांत में गणितीय योगदान, एक्स: तिरछी भिन्नता पर एक संस्मरण का पूरक". Philosophical Transactions of the Royal Society A. 197 (287–299): 443–459. Bibcode:1901RSPTA.197..443P. doi:10.1098/rsta.1901.0023. JSTOR 90841.
- Pearson, Karl (1916). "विकास के सिद्धांत में गणितीय योगदान, XIX: तिरछी भिन्नता पर एक संस्मरण का दूसरा पूरक". Philosophical Transactions of the Royal Society A. 216 (538–548): 429–457. Bibcode:1916RSPTA.216..429P. doi:10.1098/rsta.1916.0009. JSTOR 91092.
- Rhind, A. (July–October 1909). "तिरछी आवृत्ति वितरण के मुख्य स्थिरांक की संभावित त्रुटियों की गणना की सुविधा के लिए तालिकाएँ". Biometrika. 7 (1/2): 127–147. doi:10.1093/biomet/7.1-2.127. JSTOR 2345367.
द्वितीयक स्रोत
- मिल्टन अब्रामोविट्ज़ और आइरीन ए. स्टेगन (1964)। सूत्रों, ग्राफ़ और गणितीय तालिकाओं के साथ अब्रामोविट्ज़ और स्टेगन। राष्ट्रीय मानक ब्यूरो।
- एरिक डब्ल्यू वीसस्टीन एट अल। पियर्सन टाइप III डिस्ट्रीब्यूशन। मैथवर्ल्ड से.
संदर्भ
- Elderton, Sir W.P, Johnson, N.L. (1969) Systems of Frequency Curves. Cambridge University Press.
- Ord J.K. (1972) Families of Frequency Distributions. Griffin, London.