पियर्सन वितरण

From Vigyanwiki
पियर्सन प्रणाली का आरेख, β के संदर्भ में प्रकार I, III, VI, V और IV के वितरण को दर्शाता है1 (वर्ग स्केवेनेस्स) और β2 (पारंपरिक कुर्टोसिस)

पियर्सन वितरण सतत संभाव्यता वितरण संभाव्यता वितरण का एक समूह है। इसे पहली बार 1895 में कार्ल पियर्सन द्वारा प्रकाशित किया गया था और बाद में उनके द्वारा 1901 और 1916 में जैव सांख्यिकी पर लेखों की एक श्रृंखला में विस्तारित किया गया था।

इतिहास

पियर्सन प्रणाली मूल रूप से दृश्यमान विषम टिप्पणियों को मॉडल करने के प्रयास में तैयार की गई थी। उस समय यह सर्वविदित था कि किसी सैद्धांतिक मॉडल को प्रेक्षित डेटा के पहले दो संचयकों या क्षण (गणित) में फिट करने के लिए कैसे समायोजित किया जाए: किसी भी संभाव्यता वितरण को स्थान-पैमाने पर समूह बनाने के लिए सीधे बढ़ाया जा सकता है। पैथोलॉजिकल (गणित) स्थितियों को छोड़कर, एक स्थान-स्तरीय समूह को देखे गए माध्य (गणित) (प्रथम संचयी) और विचरण (द्वितीय संचयी) को अव्यवस्थिततः अच्छी तरह से फिट करने के लिए बनाया जा सकता है। हालाँकि, यह ज्ञात नहीं था कि संभाव्यता वितरण का निर्माण कैसे किया जाए जिसमें स्केवेनेस्स (मानकीकृत तीसरा क्यूमुलेंट) और कर्टोसिस (मानकीकृत चौथा क्यूमुलेंट) को समान रूप से स्वतंत्र रूप से समायोजित किया जा सके। यह आवश्यकता तब स्पष्ट हो गई जब ज्ञात सैद्धांतिक मॉडलों को स्केवेनेस्स प्रदर्शित करने वाले प्रेक्षित डेटा में फिट करने का प्रयास किया गया। पियर्सन के उदाहरणों में उत्तरजीविता डेटा सम्मिलित है, जो सामान्यतः असममित होता है।

अपने मूल पेपर में, पियर्सन (1895, पृष्ठ 360) ने सामान्य वितरण (जिसे मूल रूप से प्रकार V के रूप में जाना जाता था) के अलावा चार प्रकार के वितरण (I से IV तक क्रमांकित) की पहचान की। वर्गीकरण इस बात पर निर्भर करता था कि क्या वितरण एक सीमित अंतराल पर, आधी रेखा पर, या पूरी वास्तविक रेखा पर समर्थित (गणित) थे; और क्या वे संभावित रूप से तिरछे थे या आवश्यक रूप से सममित थे। एक दूसरे पेपर (पियर्सन 1901) ने दो चूक तय कीं: इसने प्रकार V वितरण को फिर से परिभाषित किया (मूल रूप से केवल सामान्य वितरण, लेकिन अब व्युत्क्रम-गामा वितरण) और प्रकार VI वितरण की प्रारम्भ की। पहले दो पेपर मिलकर पियर्सन प्रणाली के पांच मुख्य प्रकारों (I, III, IV, V, और VI) को कवर करते हैं। तीसरे पेपर में, पियर्सन (1916) ने और विशेष स्थिति और उपप्रकार (VII से XII) पेश किए।

रिहंद (1909, पृ. 430-432) ने पियर्सन प्रणाली के पैरामीटर स्पेस को देखने का एक सरल तरीका तैयार किया, जिसे बाद में पियर्सन (1916, प्लेट 1 और पृ. 430एफएफ., 448एफएफ.) द्वारा अपनाया गया। पियर्सन प्रकार की विशेषता दो मात्राओं से होती है, जिन्हें सामान्यतः β1 कहा जाता है और β2. पहला स्क्यूडनेस्स का वर्ग है: जहाँ γ1 स्केवेनेस्स, या तीसरा मानकीकृत क्षण है। दूसरा पारंपरिक कर्टोसिस या चौथा मानकीकृत क्षण है: β2 = γ2 + 3. (आधुनिक उपचार कर्टोसिस γ2 को परिभाषित करते हैं क्षणों के बजाय संचयकों के संदर्भ में, ताकि सामान्य वितरण के लिए हमारे पास हो γ2 = 0 और β2 = 3. यहां हम ऐतिहासिक मिसाल का पालन करते हैं और β2 का उपयोग करते हैं.) दाईं ओर का आरेख दिखाता है कि कौन सा पियर्सन किसी दिए गए ठोस वितरण को टाइप करता है (एक बिंदु ( द्वारा पहचाना जाता है (β1, β2)) से संबंधित।

आज हम जिन स्क्यूड और/या गैर-मेसोकुर्टिक वितरणों से परिचित हैं उनमें से कई 1890 के दशक की प्रारम्भ में अभी भी अज्ञात थे। जिसे अब बीटा वितरण के रूप में जाना जाता है, उसका उपयोग थॉमस बेयस ने व्युत्क्रम संभाव्यता पर अपने 1763 के कार्य में बर्नौली वितरण के पैरामीटर के पश्च वितरण के रूप में किया था। पियर्सन प्रणाली में इसकी सदस्यता के कारण बीटा वितरण को प्रमुखता मिली और 1940 के दशक तक इसे पियर्सन प्रकार I वितरण के रूप में जाना जाता था।[1] (पियर्सन का प्रकार II वितरण प्रकार I का एक विशेष स्थिति है, लेकिन सामान्यतः इसे अलग नहीं किया जाता है।) गामा वितरण पियर्सन के काम से उत्पन्न हुआ (पियर्सन 1893, पृष्ठ 331; पियर्सन 1895, पृष्ठ 357, 360, 373-376) और 1930 और 1940 के दशक में अपना आधुनिक नाम प्राप्त करने से पहले, इसे पियर्सन टाइप III वितरण के रूप में जाना जाता था।[2] पियर्सन के 1895 के पेपर ने प्रकार IV वितरण की प्रारम्भ की, जिसमें एक विशेष स्थिति के रूप में छात्र का t-वितरण|छात्र का t-वितरण सम्मिलित है, जो विलियम सीली गॉसेट के बाद के कई वर्षों के उपयोग से पहले का है। उनके 1901 के पेपर ने व्युत्क्रम-गामा वितरण (प्रकार V) और बीटा प्राइम वितरण (प्रकार VI) की प्रारम्भ की थी।

परिभाषा

पियर्सन संभाव्यता घनत्व फलन p को अंतर समीकरण के किसी भी वैध समाधान के रूप में परिभाषित किया गया है (सीएफ. पियर्सन 1895, पृष्ठ 381)

साथ:

ऑर्ड के अनुसार,[3] पियर्सन ने समीकरण (1) का अंतर्निहित रूप, सबसे पहले, सामान्य वितरण के घनत्व फलन के लघुगणक के व्युत्पन्न के लिए सूत्र (जो एक रैखिक फलन देता है) और दूसरे, मूल्यों के लिए पुनरावृत्ति संबंध के आधार पर तैयार किया। हाइपरज्यामितीय वितरण की संभाव्यता द्रव्यमान फलन में (जो रैखिक-विभाजित-द्विघात संरचना उत्पन्न करता है)।

समीकरण (1) में, पैरामीटर एक स्थिर बिंदु निर्धारित करता है, और इसलिए कुछ शर्तों के तहत वितरण का एक मोड (सांख्यिकी) निर्धारित करता है, क्योंकि

विभेदक समीकरण से सीधे अनुसरण करता है।

चूँकि हमारा सामना एक रेखीय अवकल समीकरण से होता है#परिवर्तनीय गुणांकों के साथ प्रथम-क्रम समीकरण|परिवर्तनीय गुणांकों के साथ प्रथम-क्रम रेखीय अवकल समीकरण, इसका समाधान सीधा है:

जब इंtग्रैंड के कुछ विशेष स्थितियों पर विचार किया जाता है तो इस समाधान में इंtग्रल काफी सरल हो जाता है। पियर्सन (1895, पृ. 367) ने दो मुख्य स्थितियों की पहचान की, जो द्विघात फलन के विवेचक के चिन्ह (और इसलिए किसी फलन के वास्तविक मूल की संख्या) द्वारा निर्धारित होते हैं।

वितरण के विशेष प्रकार

केस 1, ऋणात्मक विभेदक

पियर्सन प्रकार IV वितरण

यदि द्विघात फलन (2) का विभेदक ऋणात्मक है (), इसकी कोई वास्तविक जड़ें नहीं हैं। फिर परिभाषित करें

उसका अवलोकन करो α एक अच्छी तरह से परिभाषित वास्तविक संख्या है और α ≠ 0, क्योंकि अनुमान से और इसलिए b2 ≠ 0. इन प्रतिस्थापनों को लागू करने पर, द्विघात फलन (2) में रूपांतरित हो जाता है

इस सूत्रीकरण से वास्तविक जड़ों की अनुपस्थिति स्पष्ट है, क्योंकि α2आवश्यक रूप से घनात्मक है।

अब हम अवकल समीकरण (1) के समाधान को y के फलन के रूप में व्यक्त करते हैं:

पियर्सन (1895, पृष्ठ 362) ने इसे त्रिकोणमितीय कहा स्थिति, क्योंकि अभिन्न

व्युत्क्रम त्रिकोणमितीय फलन त्रिकोणमितीय फलन आर्कटान फलन सम्मिलितहै। तब

अंत में, चलो

इन प्रतिस्थापनों को लागू करने पर, हमें पैरामीट्रिक फलन प्राप्त होता है:

इस असामान्य घनत्व को संपूर्ण वास्तविक रेखा पर समर्थन (गणित) प्राप्त है। यह स्केल पैरामीटर α > 0 और आकार पैरामीटर m > 1/2 और ν पर निर्भर करता है। जब हमने अंतर समीकरण (1) का समाधान x के बजाय y के फलन के रूप में ढूंढना चुना तो एक पैरामीटर खो गया। इसलिए हम चौथे पैरामीटर को पुनः प्रस्तुत करते हैं, अर्थात् स्थान पैरामीटर λ। इस प्रकार हमने 'पियर्सन टाइप IV वितरण' का घनत्व प्राप्त किया है:

सामान्यीकृत स्थिरांक में जटिल फलन गामा फलन (Γ) और बीटा फलन (बी) सम्मिलित होते हैं। ध्यान दें कि यहां स्थान पैरामीटर λ सामान्य फॉर्मूलेशन में पेश किए गए मूल स्थान पैरामीटर के समान नहीं है, लेकिन इसके माध्यम से संबंधित है

पियर्सन प्रकार VII वितरण

λ = 0, σ = 1, और: γ के साथ पियर्सन प्रकार VII घनत्व का प्लॉट γ2 = ∞ (लाल); γ2 = 4 (नीला); और γ2 = 0 (काला)

पियर्सन प्रकार IV वितरण का आकार पैरामीटर ν इसकी विषमता को नियंत्रित करता है। यदि हम इसका मान शून्य पर स्थिर करते हैं, तो हमें एक सममित तीन-पैरामीटर समूह प्राप्त होता है। इस विशेष स्थिति को 'पियर्सन टाइप VII डिस्ट्रीब्यूशन' के रूप में जाना जाता है (cf. पियर्सन 1916, पृष्ठ 450)। इसका घनत्व है

जहां B बीटा फलन है.

प्रकार VII वितरण का एक वैकल्पिक मानकीकरण (और मामूली विशेषज्ञता) लेटिंग द्वारा प्राप्त किया जाता है

जिसके लिए m > 3/2 की आवश्यकता है। इसमें व्यापकता का मामूली नुकसान होता है लेकिन यह सुनिश्चित होता है कि वितरण का विचरण साधारण है और σ2 के बराबर है. अब पैरामीटर m केवल वितरण के कुर्टोसिस को नियंत्रित करता है। यदि λ और σ को स्थिर रखा जाता है तो m अनंत तक पहुंचता है, सामान्य वितरण एक विशेष स्थिति के रूप में उत्पन्न होता है:

यह माध्य λ और मानक विचलन σ के साथ सामान्य वितरण का घनत्व है।

यह आवश्यक है कि m > 5/2 और देना सुविधाजनक है

यह एक और विशेषज्ञता है, और यह गारंt देता है कि वितरण के पहले चार क्षण साधारण हैं। अधिक विशेष रूप से, पियर्सन प्रकार VII वितरण को (λ, σ, γ2) के संदर्भ में मानकीकृत किया गया है) का माध्य λ, σ का मानक विचलन, शून्य का स्केवेनेस्स और γ2 का घनात्मक अतिरिक्त कर्टोसिस है।.

छात्र का t-वितरण

पियर्सन प्रकार VII वितरण गैर-मानकीकृत छात्र के t-वितरण के बराबर है | पैरामीटर ν > 0, μ, σ2 के साथ छात्र का t-वितरण इसके मूल मानकीकरण में निम्नलिखित प्रतिस्थापन लागू करके:

उस बाधा का निरीक्षण करें m > 1/2 संतुष्ट है।

परिणामी घनत्व है

जिसे विद्यार्थी के t-वितरण के घनत्व के रूप में आसानी से पहचाना जा सकता है।

इसका तात्पर्य यह है कि पियर्सन प्रकार VII वितरण मानक छात्र के t-वितरण|छात्र के t-वितरण और मानक कॉची वितरण को भी समाहित करता है। विशेष रूप से, मानक छात्र का t-वितरण एक उपकेस के रूप में उत्पन्न होता है, जब μ = 0 और σ2 = 1, निम्नलिखित प्रतिस्थापन के बराबर:

इस प्रतिबंधित एक-पैरामीटर समूह का घनत्व एक मानक छात्र का t है:


केस 2, गैर-ऋणात्मक विभेदक

यदि द्विघात फलन (2) में एक गैर-ऋणात्मक विभेदक है (), इसकी वास्तविक जड़ें हैं a1 और a2 (जरूरी नहीं कि अलग हो):

वास्तविक मूलों की उपस्थिति में द्विघात फलन (2) को इस प्रकार लिखा जा सकता है

और अंतर समीकरण का समाधान इसलिए है

पियर्सन (1895, पृ. 362) ने इसे लघुगणक स्थिति कहा, क्योंकि अभिन्न

पिछले स्थिति की तरह केवल लघुगणक फलन सम्मिलितहै न कि आर्कटान फलन।

प्रतिस्थापन का उपयोग करना

हमें अवकल समीकरण (1) का निम्नलिखित समाधान प्राप्त होता है:

चूँकि यह घनत्व केवल आनुपातिकता के एक छिपे हुए स्थिरांक तक ही जाना जाता है, उस स्थिरांक को बदला जा सकता है और घनत्व को इस प्रकार लिखा जा सकता है:

पियर्सन प्रकार I वितरण

पियर्सन प्रकार I वितरण (बीटा वितरण का एक सामान्यीकरण) तब उत्पन्न होता है जब द्विघात समीकरण (2) की जड़ें विपरीत चिह्न की होती हैं, अर्थात, . फिर समाधान पी अंतराल पर समर्थित है . प्रतिस्थापन लागू करें

जहाँ , जो y के संदर्भ में एक समाधान देता है जो अंतराल (0, 1) पर समर्थित है:

कोई परिभाषित कर सकता है:

स्थिरांकों और मापदंडों को पुनः समूहित करने से यह सरल हो जाता है:

इस प्रकार ए का अनुसरण करता है साथ . यह पता चला है कि एम1, एम2 > −1 एक उचित संभाव्यता घनत्व फलन होने के लिए p के लिए आवश्यक और पर्याप्त है।

पियर्सन प्रकार II वितरण

पियर्सन प्रकार II वितरण सममित वितरण तक सीमित पियर्सन प्रकार I समूह का एक विशेष स्थिति है।

पियर्सन टाइप II कर्व के लिए,[4]

जहाँ

कोटि, y, की आवृत्ति है . पियर्सन टाइप II कर्व का उपयोग स्पीयरमैन के रैंक सहसंबंध गुणांक के लिए महत्वपूर्ण सहसंबंध गुणांक की तालिका की गणना करने में किया जाता है जब श्रृंखला में वस्तुओं की संख्या 100 (या कुछ स्रोतों के आधार पर 30) से कम होती है। उसके बाद, वितरण एक मानक छात्र के t-वितरण की नकल करता है। मानों की तालिका के लिए, कुछ मानों का उपयोग पिछले समीकरण में स्थिरांक के रूप में किया जाता है:

उपयोग किए गए x के क्षण हैं

पियर्सन प्रकार III वितरण

परिभाषित

है . पियर्सन प्रकार III वितरण एक गामा वितरण या ची-वर्ग वितरण है।

पियर्सन प्रकार V वितरण

नए पैरामीटर परिभाषित करना:

एक का अनुसरण करता है . पियर्सन प्रकार V वितरण एक व्युत्क्रम-गामा वितरण है।

पियर्सन प्रकार VI वितरण

परिभाषित

ए का अनुसरण करता है . पियर्सन प्रकार VI वितरण एक बीटा प्राइम वितरण या एफ-वितरण|एफ-वितरण है।

अन्य वितरणों से संबंध

पियर्सन समूह में निम्नलिखित वितरण सम्मिलितहैं:

  • बीटा वितरण (प्रकार I)
  • बीटा प्राइम वितरण (प्रकार VI)
  • कॉची वितरण (प्रकार IV)
  • ची-वर्ग वितरण (प्रकार III)
  • समान वितरण (निरंतर) (प्रकार I की सीमा)
  • घातीय वितरण (प्रकार III)
  • गामा वितरण (प्रकार III)
  • एफ-वितरण|एफ-वितरण (प्रकार VI)
  • व्युत्क्रम-ची-वर्ग वितरण (प्रकार V)
  • व्युत्क्रम-गामा वितरण (प्रकार V)
  • सामान्य वितरण (प्रकार I, III, IV, V, या VI की सीमा)
  • विद्यार्थी का t-वितरण|छात्र का t-वितरण (प्रकार VII, जो प्रकार IV का गैर-तिरछा उपप्रकार है)

डेटा में वितरण को फिट करने के उद्देश्य से वितरण की पियर्सन प्रणाली के विकल्प मात्रात्मक-पैरामीटरीकृत वितरण (QPDs) और मेटालॉग वितरण हैं। (QPDs)और मेटलॉग पियर्सन प्रणाली की तुलना में अधिक आकार और सीमा लचीलापन प्रदान कर सकते हैं। फिटिंग क्षणों के बजाय, QPD सामान्यतः अनुभवजन्य वितरण फलन या रैखिक न्यूनतम वर्ग वाले अन्य डेटा के लिए उपयुक्त होते हैं।

अनुप्रयोग

इन मॉडलों का उपयोग वित्तीय बाजारों में किया जाता है, क्योंकि उनकी इस तरह से पैरामीट्रिज्ड होने की क्षमता होती है जिसका बाजार व्यापारियों के लिए सहज अर्थ होता है। कई मॉडल वर्तमान में उपयोग में हैं जो दरों, स्टॉक आदि की अस्थिरता की स्टोकेस्टिक प्रकृति को पकड़ते हैं और वितरण का यह समूह अधिक महत्वपूर्ण में से एक साबित हो सकता है।

संयुक्त राज्य अमेरिका में, लॉग-पियर्सन III बाढ़ आवृत्ति विश्लेषण के लिए डिफ़ॉल्ट वितरण है।[5]

हाल ही में, पियर्सन वितरण के लिए ऐसे विकल्प विकसित किए गए हैं जो अधिक लचीले हैं और डेटा में फिट होने में आसान हैं। मेटलॉग वितरण देखें.

टिप्पणियाँ

  1. Miller, Jeff; et al. (2006-07-09). "बीटा वितरण". Earliest Known Uses of Some of the Words of Mathematics. Retrieved 2006-12-09.
  2. Miller, Jeff; et al. (2006-12-07). "गामा वितरण". Earliest Known Uses of Some of the Words of Mathematics. Retrieved 2006-12-09.
  3. Ord J.K. (1972) p. 2
  4. Ramsey, Philip H. (1989-09-01). "स्पीयरमैन के रैंक ऑर्डर सहसंबंध के लिए महत्वपूर्ण मूल्य". Journal of Educational Statistics. 14 (3): 245–253. JSTOR 1165017.
  5. "बाढ़ प्रवाह आवृत्ति निर्धारित करने के लिए दिशानिर्देश" (PDF). USGS Water. March 1982. Retrieved 2019-06-14.

स्रोत

प्राथमिक स्रोत

द्वितीयक स्रोत

संदर्भ

  • Elderton, Sir W.P, Johnson, N.L. (1969) Systems of Frequency Curves. Cambridge University Press.
  • Ord J.K. (1972) Families of Frequency Distributions. Griffin, London.