पियर्सन वितरण

From Vigyanwiki
Revision as of 10:45, 7 July 2023 by alpha>Indicwiki (Created page with "{{short description|Family of continuous probability distributions}} Image:Pearson system.png|300px|thumb|पियर्सन प्रणाली का आरेख, β...")
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
पियर्सन प्रणाली का आरेख, β के संदर्भ में प्रकार I, III, VI, V और IV के वितरण को दर्शाता है1 (वर्ग तिरछापन) और β2 (पारंपरिक कुर्टोसिस)

पियर्सन वितरण सतत संभाव्यता वितरण संभाव्यता वितरण का एक परिवार है। इसे पहली बार 1895 में कार्ल पियर्सन द्वारा प्रकाशित किया गया था और बाद में उनके द्वारा 1901 और 1916 में जैव सांख्यिकी पर लेखों की एक श्रृंखला में विस्तारित किया गया था।

इतिहास

पियर्सन प्रणाली मूल रूप से दृश्यमान विषम टिप्पणियों को मॉडल करने के प्रयास में तैयार की गई थी। उस समय यह सर्वविदित था कि किसी सैद्धांतिक मॉडल को प्रेक्षित डेटा के पहले दो संचयकों या क्षण (गणित) में फिट करने के लिए कैसे समायोजित किया जाए: किसी भी संभाव्यता वितरण को स्थान-पैमाने पर परिवार बनाने के लिए सीधे बढ़ाया जा सकता है। पैथोलॉजिकल (गणित) मामलों को छोड़कर, एक स्थान-स्तरीय परिवार को देखे गए माध्य (गणित) (प्रथम संचयी) और विचरण (द्वितीय संचयी) को मनमाने ढंग से अच्छी तरह से फिट करने के लिए बनाया जा सकता है। हालाँकि, यह ज्ञात नहीं था कि संभाव्यता वितरण का निर्माण कैसे किया जाए जिसमें तिरछापन (मानकीकृत तीसरा क्यूमुलेंट) और कुकुदता (मानकीकृत चौथा क्यूमुलेंट) को समान रूप से स्वतंत्र रूप से समायोजित किया जा सके। यह आवश्यकता तब स्पष्ट हो गई जब ज्ञात सैद्धांतिक मॉडलों को तिरछापन प्रदर्शित करने वाले प्रेक्षित डेटा में फिट करने का प्रयास किया गया। पियर्सन के उदाहरणों में उत्तरजीविता डेटा शामिल है, जो आमतौर पर असममित होता है।

अपने मूल पेपर में, पियर्सन (1895, पृष्ठ 360) ने सामान्य वितरण (जिसे मूल रूप से प्रकार V के रूप में जाना जाता था) के अलावा चार प्रकार के वितरण (I से IV तक क्रमांकित) की पहचान की। वर्गीकरण इस बात पर निर्भर करता था कि क्या वितरण एक सीमित अंतराल पर, आधी रेखा पर, या पूरी वास्तविक रेखा पर समर्थित (गणित) थे; और क्या वे संभावित रूप से तिरछे थे या आवश्यक रूप से सममित थे। एक दूसरे पेपर (पियर्सन 1901) ने दो चूक तय कीं: इसने प्रकार V वितरण को फिर से परिभाषित किया (मूल रूप से केवल सामान्य वितरण, लेकिन अब व्युत्क्रम-गामा वितरण) और प्रकार VI वितरण की शुरुआत की। पहले दो पेपर मिलकर पियर्सन प्रणाली के पांच मुख्य प्रकारों (I, III, IV, V, और VI) को कवर करते हैं। तीसरे पेपर में, पियर्सन (1916) ने और विशेष मामले और उपप्रकार (VII से XII) पेश किए।

रिहंद (1909, पृ. 430-432) ने पियर्सन प्रणाली के पैरामीटर स्पेस को देखने का एक सरल तरीका तैयार किया, जिसे बाद में पियर्सन (1916, प्लेट 1 और पृ. 430एफएफ., 448एफएफ.) द्वारा अपनाया गया। पियर्सन प्रकार की विशेषता दो मात्राओं से होती है, जिन्हें आमतौर पर β कहा जाता है1 और β2. पहला तिरछापन का वर्ग है: कहां γ1 तिरछापन, या तीसरा मानकीकृत क्षण है। दूसरा पारंपरिक कर्टोसिस या चौथा मानकीकृत क्षण है: β2 = सी2 + 3. (आधुनिक उपचार कर्टोसिस γ को परिभाषित करते हैं2 क्षणों के बजाय संचयकों के संदर्भ में, ताकि सामान्य वितरण के लिए हमारे पास γ हो2 = 0 और β2 = 3. यहां हम ऐतिहासिक मिसाल का पालन करते हैं और β का उपयोग करते हैं2.) दाईं ओर का आरेख दिखाता है कि कौन सा पियर्सन किसी दिए गए ठोस वितरण को टाइप करता है (एक बिंदु (β) द्वारा पहचाना जाता है1, बी2)) से संबंधित।

आज हम जिन तिरछे और/या गैर-मेसोकुर्टिक वितरणों से परिचित हैं उनमें से कई 1890 के दशक की शुरुआत में अभी भी अज्ञात थे। जिसे अब बीटा वितरण के रूप में जाना जाता है, उसका उपयोग थॉमस बेयस ने व्युत्क्रम संभाव्यता पर अपने 1763 के कार्य में बर्नौली वितरण के पैरामीटर के पश्च वितरण के रूप में किया था। पियर्सन प्रणाली में इसकी सदस्यता के कारण बीटा वितरण को प्रमुखता मिली और 1940 के दशक तक इसे पियर्सन प्रकार I वितरण के रूप में जाना जाता था।[1] (पियर्सन का प्रकार II वितरण प्रकार I का एक विशेष मामला है, लेकिन आमतौर पर इसे अलग नहीं किया जाता है।) गामा वितरण पियर्सन के काम से उत्पन्न हुआ (पियर्सन 1893, पृष्ठ 331; पियर्सन 1895, पृष्ठ 357, 360, 373-376) और 1930 और 1940 के दशक में अपना आधुनिक नाम प्राप्त करने से पहले, इसे पियर्सन टाइप III वितरण के रूप में जाना जाता था।[2] पियर्सन के 1895 के पेपर ने प्रकार IV वितरण की शुरुआत की, जिसमें एक विशेष मामले के रूप में छात्र का टी-वितरण|छात्र का टी-वितरण शामिल है, जो विलियम सीली गॉसेट के बाद के कई वर्षों के उपयोग से पहले का है। उनके 1901 के पेपर ने व्युत्क्रम-गामा वितरण (प्रकार V) और बीटा प्राइम वितरण (प्रकार VI) की शुरुआत की।

परिभाषा

पियर्सन संभाव्यता घनत्व फ़ंक्शन पी को अंतर समीकरण के किसी भी वैध समाधान के रूप में परिभाषित किया गया है (सीएफ. पियर्सन 1895, पृष्ठ 381)

साथ:

ऑर्ड के अनुसार,[3] पियर्सन ने समीकरण (1) का अंतर्निहित रूप, सबसे पहले, सामान्य वितरण के घनत्व फ़ंक्शन के लघुगणक के व्युत्पन्न के लिए सूत्र (जो एक रैखिक फ़ंक्शन देता है) और दूसरे, मूल्यों के लिए पुनरावृत्ति संबंध के आधार पर तैयार किया। हाइपरज्यामितीय वितरण की संभाव्यता द्रव्यमान फ़ंक्शन में (जो रैखिक-विभाजित-द्विघात संरचना उत्पन्न करता है)।

समीकरण (1) में, पैरामीटर एक स्थिर बिंदु निर्धारित करता है, और इसलिए कुछ शर्तों के तहत वितरण का एक मोड (सांख्यिकी) निर्धारित करता है, क्योंकि

विभेदक समीकरण से सीधे अनुसरण करता है।

चूँकि हमारा सामना एक रेखीय अवकल समीकरण से होता है#परिवर्तनीय गुणांकों के साथ प्रथम-क्रम समीकरण|परिवर्तनीय गुणांकों के साथ प्रथम-क्रम रेखीय अवकल समीकरण, इसका समाधान सीधा है:

जब इंटीग्रैंड के कुछ विशेष मामलों पर विचार किया जाता है तो इस समाधान में इंटीग्रल काफी सरल हो जाता है। पियर्सन (1895, पृ. 367) ने दो मुख्य मामलों की पहचान की, जो द्विघात फलन के विवेचक के चिन्ह (और इसलिए किसी फलन के वास्तविक मूल की संख्या) द्वारा निर्धारित होते हैं।


वितरण के विशेष प्रकार

केस 1, नकारात्मक विभेदक

पियर्सन प्रकार IV वितरण

यदि द्विघात फलन (2) का विभेदक ऋणात्मक है (), इसकी कोई वास्तविक जड़ें नहीं हैं। फिर परिभाषित करें

उसका अवलोकन करो α एक अच्छी तरह से परिभाषित वास्तविक संख्या है और α ≠ 0, क्योंकि अनुमान से और इसलिए b2 ≠ 0. इन प्रतिस्थापनों को लागू करने पर, द्विघात फलन (2) में रूपांतरित हो जाता है

इस सूत्रीकरण से वास्तविक जड़ों की अनुपस्थिति स्पष्ट है, क्योंकि α2आवश्यक रूप से सकारात्मक है।

अब हम अवकल समीकरण (1) के समाधान को y के फलन के रूप में व्यक्त करते हैं:

पियर्सन (1895, पृष्ठ 362) ने इसे त्रिकोणमितीय कहा मामला, क्योंकि अभिन्न

व्युत्क्रम त्रिकोणमितीय फलन त्रिकोणमितीय फलन आर्कटान फलन शामिल है। तब

अंत में, चलो

इन प्रतिस्थापनों को लागू करने पर, हमें पैरामीट्रिक फ़ंक्शन प्राप्त होता है:

इस असामान्य घनत्व को संपूर्ण वास्तविक रेखा पर समर्थन (गणित) प्राप्त है। यह स्केल पैरामीटर α > 0 और आकार पैरामीटर m > 1/2 और ν पर निर्भर करता है। जब हमने अंतर समीकरण (1) का समाधान x के बजाय y के फ़ंक्शन के रूप में ढूंढना चुना तो एक पैरामीटर खो गया। इसलिए हम चौथे पैरामीटर को पुनः प्रस्तुत करते हैं, अर्थात् स्थान पैरामीटर λ। इस प्रकार हमने 'पियर्सन टाइप IV वितरण' का घनत्व प्राप्त किया है:

सामान्यीकृत स्थिरांक में जटिल फ़ंक्शन गामा फ़ंक्शन (Γ) और बीटा फ़ंक्शन (बी) शामिल होते हैं। ध्यान दें कि यहां स्थान पैरामीटर λ सामान्य फॉर्मूलेशन में पेश किए गए मूल स्थान पैरामीटर के समान नहीं है, लेकिन इसके माध्यम से संबंधित है


पियर्सन प्रकार VII वितरण

λ = 0, σ = 1, और: γ के साथ पियर्सन प्रकार VII घनत्व का प्लॉट2 = ∞ (लाल); सी2 = 4 (नीला); और γ2 = 0 (काला)

पियर्सन प्रकार IV वितरण का आकार पैरामीटर ν इसकी विषमता को नियंत्रित करता है। यदि हम इसका मान शून्य पर स्थिर करते हैं, तो हमें एक सममित तीन-पैरामीटर परिवार प्राप्त होता है। इस विशेष मामले को 'पियर्सन टाइप VII डिस्ट्रीब्यूशन' के रूप में जाना जाता है (cf. पियर्सन 1916, पृष्ठ 450)। इसका घनत्व है

जहां B बीटा फ़ंक्शन है.

प्रकार VII वितरण का एक वैकल्पिक मानकीकरण (और मामूली विशेषज्ञता) लेटिंग द्वारा प्राप्त किया जाता है

जिसके लिए m > 3/2 की आवश्यकता है। इसमें व्यापकता का मामूली नुकसान होता है लेकिन यह सुनिश्चित होता है कि वितरण का विचरण मौजूद है और σ के बराबर है2. अब पैरामीटर m केवल वितरण के कुर्टोसिस को नियंत्रित करता है। यदि λ और σ को स्थिर रखा जाता है तो m अनंत तक पहुंचता है, सामान्य वितरण एक विशेष मामले के रूप में उत्पन्न होता है:

यह माध्य λ और मानक विचलन σ के साथ सामान्य वितरण का घनत्व है।

यह आवश्यक है कि m > 5/2 और देना सुविधाजनक है

यह एक और विशेषज्ञता है, और यह गारंटी देता है कि वितरण के पहले चार क्षण मौजूद हैं। अधिक विशेष रूप से, पियर्सन प्रकार VII वितरण को (λ, σ, γ) के संदर्भ में मानकीकृत किया गया है2) का माध्य λ, σ का मानक विचलन, शून्य का तिरछापन और γ का सकारात्मक अतिरिक्त कर्टोसिस है।2.

विद्यार्थी का t-वितरण

पियर्सन प्रकार VII वितरण गैर-मानकीकृत छात्र के टी-वितरण के बराबर है | पैरामीटर ν > 0, μ, σ के साथ छात्र का टी-वितरण2 इसके मूल मानकीकरण में निम्नलिखित प्रतिस्थापन लागू करके:

उस बाधा का निरीक्षण करें m > 1/2 संतुष्ट है।

परिणामी घनत्व है

जिसे विद्यार्थी के टी-वितरण के घनत्व के रूप में आसानी से पहचाना जा सकता है।

इसका तात्पर्य यह है कि पियर्सन प्रकार VII वितरण मानक छात्र के टी-वितरण|छात्र के टी-वितरण और मानक कॉची वितरण को भी समाहित करता है। विशेष रूप से, मानक छात्र का टी-वितरण एक उपकेस के रूप में उत्पन्न होता है, जब μ = 0 और σ2 = 1, निम्नलिखित प्रतिस्थापन के बराबर:

इस प्रतिबंधित एक-पैरामीटर परिवार का घनत्व एक मानक छात्र का t है:


केस 2, गैर-नकारात्मक विभेदक

यदि द्विघात फलन (2) में एक गैर-नकारात्मक विभेदक है (), इसकी वास्तविक जड़ें हैं a1 और ए2 (जरूरी नहीं कि अलग हो):

वास्तविक मूलों की उपस्थिति में द्विघात फलन (2) को इस प्रकार लिखा जा सकता है

और अंतर समीकरण का समाधान इसलिए है

पियर्सन (1895, पृ. 362) ने इसे लघुगणक मामला कहा, क्योंकि अभिन्न

पिछले मामले की तरह केवल लघुगणक फ़ंक्शन शामिल है न कि आर्कटान फ़ंक्शन।

प्रतिस्थापन का उपयोग करना

हमें अवकल समीकरण (1) का निम्नलिखित समाधान प्राप्त होता है:

चूँकि यह घनत्व केवल आनुपातिकता के एक छिपे हुए स्थिरांक तक ही जाना जाता है, उस स्थिरांक को बदला जा सकता है और घनत्व को इस प्रकार लिखा जा सकता है:


पियर्सन प्रकार I वितरण

पियर्सन प्रकार I वितरण (बीटा वितरण का एक सामान्यीकरण) तब उत्पन्न होता है जब द्विघात समीकरण (2) की जड़ें विपरीत चिह्न की होती हैं, अर्थात, . फिर समाधान पी अंतराल पर समर्थित है . प्रतिस्थापन लागू करें

कहाँ , जो y के संदर्भ में एक समाधान देता है जो अंतराल (0, 1) पर समर्थित है:

कोई परिभाषित कर सकता है:

स्थिरांकों और मापदंडों को पुनः समूहित करने से यह सरल हो जाता है:

इस प्रकार ए का अनुसरण करता है साथ . यह पता चला है कि एम1, एम2 > −1 एक उचित संभाव्यता घनत्व फलन होने के लिए p के लिए आवश्यक और पर्याप्त है।

पियर्सन प्रकार II वितरण

पियर्सन प्रकार II वितरण सममित वितरण तक सीमित पियर्सन प्रकार I परिवार का एक विशेष मामला है।

पियर्सन टाइप II कर्व के लिए,[4]

कहाँ

कोटि, y, की आवृत्ति है . पियर्सन टाइप II कर्व का उपयोग स्पीयरमैन के रैंक सहसंबंध गुणांक के लिए महत्वपूर्ण सहसंबंध गुणांक की तालिका की गणना करने में किया जाता है जब श्रृंखला में वस्तुओं की संख्या 100 (या कुछ स्रोतों के आधार पर 30) से कम होती है। उसके बाद, वितरण एक मानक छात्र के टी-वितरण की नकल करता है। मानों की तालिका के लिए, कुछ मानों का उपयोग पिछले समीकरण में स्थिरांक के रूप में किया जाता है:

उपयोग किए गए x के क्षण हैं


पियर्सन प्रकार III वितरण

परिभाषित

है . पियर्सन प्रकार III वितरण एक गामा वितरण या ची-वर्ग वितरण है।

पियर्सन प्रकार V वितरण

नए पैरामीटर परिभाषित करना:

एक का अनुसरण करता है . पियर्सन प्रकार V वितरण एक व्युत्क्रम-गामा वितरण है।

पियर्सन प्रकार VI वितरण

परिभाषित

ए का अनुसरण करता है . पियर्सन प्रकार VI वितरण एक बीटा प्राइम वितरण या एफ-वितरण|एफ-वितरण है।

अन्य वितरणों से संबंध

पियर्सन परिवार में निम्नलिखित वितरण शामिल हैं:

  • बीटा वितरण (प्रकार I)
  • बीटा प्राइम वितरण (प्रकार VI)
  • कॉची वितरण (प्रकार IV)
  • ची-वर्ग वितरण (प्रकार III)
  • समान वितरण (निरंतर) (प्रकार I की सीमा)
  • घातीय वितरण (प्रकार III)
  • गामा वितरण (प्रकार III)
  • एफ-वितरण|एफ-वितरण (प्रकार VI)
  • व्युत्क्रम-ची-वर्ग वितरण (प्रकार V)
  • व्युत्क्रम-गामा वितरण (प्रकार V)
  • सामान्य वितरण (प्रकार I, III, IV, V, या VI की सीमा)
  • विद्यार्थी का t-वितरण|छात्र का t-वितरण (प्रकार VII, जो प्रकार IV का गैर-तिरछा उपप्रकार है)

डेटा में वितरण को फिट करने के उद्देश्य से वितरण की पियर्सन प्रणाली के विकल्प मात्रात्मक-पैरामीटरीकृत वितरण (क्यूपीडी) और मेटालॉग वितरण हैं। क्यूपीडी और मेटलॉग पियर्सन प्रणाली की तुलना में अधिक आकार और सीमा लचीलापन प्रदान कर सकते हैं। फिटिंग क्षणों के बजाय, क्यूपीडी आम तौर पर अनुभवजन्य वितरण फ़ंक्शन या रैखिक न्यूनतम वर्गों वाले अन्य डेटा के लिए उपयुक्त होते हैं।

अनुप्रयोग

इन मॉडलों का उपयोग वित्तीय बाजारों में किया जाता है, क्योंकि उनकी इस तरह से पैरामीट्रिज्ड होने की क्षमता होती है जिसका बाजार व्यापारियों के लिए सहज अर्थ होता है। कई मॉडल वर्तमान में उपयोग में हैं जो दरों, स्टॉक आदि की अस्थिरता की स्टोकेस्टिक प्रकृति को पकड़ते हैं।[which?][citation needed] और वितरण का यह परिवार अधिक महत्वपूर्ण में से एक साबित हो सकता है।

संयुक्त राज्य अमेरिका में, लॉग-पियर्सन III बाढ़ आवृत्ति विश्लेषण के लिए डिफ़ॉल्ट वितरण है।[5] हाल ही में, पियर्सन वितरण के लिए ऐसे विकल्प विकसित किए गए हैं जो अधिक लचीले हैं और डेटा में फिट होने में आसान हैं। मेटलॉग वितरण देखें.

टिप्पणियाँ

  1. Miller, Jeff; et al. (2006-07-09). "बीटा वितरण". Earliest Known Uses of Some of the Words of Mathematics. Retrieved 2006-12-09.
  2. Miller, Jeff; et al. (2006-12-07). "गामा वितरण". Earliest Known Uses of Some of the Words of Mathematics. Retrieved 2006-12-09.
  3. Ord J.K. (1972) p. 2
  4. Ramsey, Philip H. (1989-09-01). "स्पीयरमैन के रैंक ऑर्डर सहसंबंध के लिए महत्वपूर्ण मूल्य". Journal of Educational Statistics. 14 (3): 245–253. JSTOR 1165017.
  5. "बाढ़ प्रवाह आवृत्ति निर्धारित करने के लिए दिशानिर्देश" (PDF). USGS Water. March 1982. Retrieved 2019-06-14.


स्रोत

प्राथमिक स्रोत

द्वितीयक स्रोत

संदर्भ

  • Elderton, Sir W.P, Johnson, N.L. (1969) Systems of Frequency Curves. Cambridge University Press.
  • Ord J.K. (1972) Families of Frequency Distributions. Griffin, London.