पियर्सन वितरण
पियर्सन वितरण सतत संभाव्यता वितरण संभाव्यता वितरण का एक समूह है। इसे पहली बार 1895 में कार्ल पियर्सन द्वारा प्रकाशित किया गया था और बाद में उनके द्वारा 1901 और 1916 में जैव सांख्यिकी पर लेखों की एक श्रृंखला में विस्तारित किया गया था।
इतिहास
पियर्सन प्रणाली मूल रूप से दृश्यमान विषम टिप्पणियों को मॉडल करने के प्रयास में तैयार की गई थी। उस समय यह सर्वविदित था कि किसी सैद्धांतिक मॉडल को प्रेक्षित डेटा के पहले दो संचयकों या क्षण (गणित) में फिट करने के लिए कैसे समायोजित किया जाए: किसी भी संभाव्यता वितरण को स्थान-पैमाने पर समूह बनाने के लिए सीधे बढ़ाया जा सकता है। पैथोलॉजिकल (गणित) स्थितियों को छोड़कर, एक स्थान-स्तरीय समूह को देखे गए माध्य (गणित) (प्रथम संचयी) और विचरण (द्वितीय संचयी) को अव्यवस्थिततः अच्छी तरह से फिट करने के लिए बनाया जा सकता है। हालाँकि, यह ज्ञात नहीं था कि संभाव्यता वितरण का निर्माण कैसे किया जाए जिसमें स्केवेनेस्स (मानकीकृत तीसरा क्यूमुलेंट) और कर्टोसिस (मानकीकृत चौथा क्यूमुलेंट) को समान रूप से स्वतंत्र रूप से समायोजित किया जा सके। यह आवश्यकता तब स्पष्ट हो गई जब ज्ञात सैद्धांतिक मॉडलों को स्केवेनेस्स प्रदर्शित करने वाले प्रेक्षित डेटा में फिट करने का प्रयास किया गया। पियर्सन के उदाहरणों में उत्तरजीविता डेटा सम्मिलित है, जो सामान्यतः असममित होता है।
अपने मूल पेपर में, पियर्सन (1895, पृष्ठ 360) ने सामान्य वितरण (जिसे मूल रूप से प्रकार V के रूप में जाना जाता था) के अलावा चार प्रकार के वितरण (I से IV तक क्रमांकित) की पहचान की। वर्गीकरण इस बात पर निर्भर करता था कि क्या वितरण एक सीमित अंतराल पर, आधी रेखा पर, या पूरी वास्तविक रेखा पर समर्थित (गणित) थे; और क्या वे संभावित रूप से तिरछे थे या आवश्यक रूप से सममित थे। एक दूसरे पेपर (पियर्सन 1901) ने दो चूक तय कीं: इसने प्रकार V वितरण को फिर से परिभाषित किया (मूल रूप से केवल सामान्य वितरण, लेकिन अब व्युत्क्रम-गामा वितरण) और प्रकार VI वितरण की प्रारम्भ की। पहले दो पेपर मिलकर पियर्सन प्रणाली के पांच मुख्य प्रकारों (I, III, IV, V, और VI) को कवर करते हैं। तीसरे पेपर में, पियर्सन (1916) ने और विशेष स्थिति और उपप्रकार (VII से XII) पेश किए।
रिहंद (1909, पृ. 430-432) ने पियर्सन प्रणाली के पैरामीटर स्पेस को देखने का एक सरल तरीका तैयार किया, जिसे बाद में पियर्सन (1916, प्लेट 1 और पृ. 430एफएफ., 448एफएफ.) द्वारा अपनाया गया। पियर्सन प्रकार की विशेषता दो मात्राओं से होती है, जिन्हें सामान्यतः β1 कहा जाता है और β2. पहला स्क्यूडनेस्स का वर्ग है: जहाँ γ1 स्केवेनेस्स, या तीसरा मानकीकृत क्षण है। दूसरा पारंपरिक कर्टोसिस या चौथा मानकीकृत क्षण है: β2 = γ2 + 3. (आधुनिक उपचार कर्टोसिस γ2 को परिभाषित करते हैं क्षणों के बजाय संचयकों के संदर्भ में, ताकि सामान्य वितरण के लिए हमारे पास हो γ2 = 0 और β2 = 3. यहां हम ऐतिहासिक मिसाल का पालन करते हैं और β2 का उपयोग करते हैं.) दाईं ओर का आरेख दिखाता है कि कौन सा पियर्सन किसी दिए गए ठोस वितरण को टाइप करता है (एक बिंदु ( द्वारा पहचाना जाता है (β1, β2)) से संबंधित।
आज हम जिन स्क्यूड और/या गैर-मेसोकुर्टिक वितरणों से परिचित हैं उनमें से कई 1890 के दशक की प्रारम्भ में अभी भी अज्ञात थे। जिसे अब बीटा वितरण के रूप में जाना जाता है, उसका उपयोग थॉमस बेयस ने व्युत्क्रम संभाव्यता पर अपने 1763 के कार्य में बर्नौली वितरण के पैरामीटर के पश्च वितरण के रूप में किया था। पियर्सन प्रणाली में इसकी सदस्यता के कारण बीटा वितरण को प्रमुखता मिली और 1940 के दशक तक इसे पियर्सन प्रकार I वितरण के रूप में जाना जाता था।[1] (पियर्सन का प्रकार II वितरण प्रकार I का एक विशेष स्थिति है, लेकिन सामान्यतः इसे अलग नहीं किया जाता है।) गामा वितरण पियर्सन के काम से उत्पन्न हुआ (पियर्सन 1893, पृष्ठ 331; पियर्सन 1895, पृष्ठ 357, 360, 373-376) और 1930 और 1940 के दशक में अपना आधुनिक नाम प्राप्त करने से पहले, इसे पियर्सन टाइप III वितरण के रूप में जाना जाता था।[2] पियर्सन के 1895 के पेपर ने प्रकार IV वितरण की प्रारम्भ की, जिसमें एक विशेष स्थिति के रूप में छात्र का t-वितरण|छात्र का t-वितरण सम्मिलित है, जो विलियम सीली गॉसेट के बाद के कई वर्षों के उपयोग से पहले का है। उनके 1901 के पेपर ने व्युत्क्रम-गामा वितरण (प्रकार V) और बीटा प्राइम वितरण (प्रकार VI) की प्रारम्भ की थी।
परिभाषा
पियर्सन संभाव्यता घनत्व फलन p को अंतर समीकरण के किसी भी वैध समाधान के रूप में परिभाषित किया गया है (सीएफ. पियर्सन 1895, पृष्ठ 381)
साथ:
ऑर्ड के अनुसार,[3] पियर्सन ने समीकरण (1) का अंतर्निहित रूप, सबसे पहले, सामान्य वितरण के घनत्व फलन के लघुगणक के व्युत्पन्न के लिए सूत्र (जो एक रैखिक फलन देता है) और दूसरे, मूल्यों के लिए पुनरावृत्ति संबंध के आधार पर तैयार किया। हाइपरज्यामितीय वितरण की संभाव्यता द्रव्यमान फलन में (जो रैखिक-विभाजित-द्विघात संरचना उत्पन्न करता है)।
समीकरण (1) में, पैरामीटर एक स्थिर बिंदु निर्धारित करता है, और इसलिए कुछ शर्तों के तहत वितरण का एक मोड (सांख्यिकी) निर्धारित करता है, क्योंकि
विभेदक समीकरण से सीधे अनुसरण करता है।
चूँकि हमारा सामना एक रेखीय अवकल समीकरण से होता है#परिवर्तनीय गुणांकों के साथ प्रथम-क्रम समीकरण|परिवर्तनीय गुणांकों के साथ प्रथम-क्रम रेखीय अवकल समीकरण, इसका समाधान सीधा है:
जब इंtग्रैंड के कुछ विशेष स्थितियों पर विचार किया जाता है तो इस समाधान में इंtग्रल काफी सरल हो जाता है। पियर्सन (1895, पृ. 367) ने दो मुख्य स्थितियों की पहचान की, जो द्विघात फलन के विवेचक के चिन्ह (और इसलिए किसी फलन के वास्तविक मूल की संख्या) द्वारा निर्धारित होते हैं।
वितरण के विशेष प्रकार
केस 1, ऋणात्मक विभेदक
पियर्सन प्रकार IV वितरण
यदि द्विघात फलन (2) का विभेदक ऋणात्मक है (), इसकी कोई वास्तविक जड़ें नहीं हैं। फिर परिभाषित करें