अपरिवर्तनीय अनुमानक
आंकड़ों में, एक अपरिवर्तनीय अनुमानक होने की अवधारणा एक मानदंड है जिसका उपयोग एक ही मात्रा के लिए विभिन्न अनुमानकों के गुणों की तुलना करने के लिए किया जा सकता है। यह इस विचार को औपचारिक रूप देने का एक तरीका है कि एक अनुमानकर्ता के पास कुछ सहज रूप से आकर्षक गुण होने चाहिए। कड़ाई से बोलते हुए, "अपरिवर्तनीय" का अर्थ यह होगा कि जब माप और पैरामीटर दोनों को संगत विधियों से बदल दिया जाता है तो अनुमान स्वयं अपरिवर्तित होते हैं, किन्तु ऐसे परिवर्तनों के साथ अनुमानों को उचित विधियों से बदलने की अनुमति देने के लिए अर्थ बढ़ाया गया है।[1] शब्द समतुल्य अनुमानक का उपयोग औपचारिक गणितीय संदर्भों में किया जाता है जिसमें डेटासेट और पैरामीटराइजेशन में परिवर्तन के जवाब में अनुमानक के परिवर्तन के विधियों के संबंध का सटीक विवरण शामिल होता है: यह अधिक सामान्य गणित में "समतुल्य" के उपयोग से मेल खाता है।
सामान्य सेटिंग
पृष्ठभूमि
सांख्यिकीय अनुमान में, अनुमान सिद्धांत के कई दृष्टिकोण हैं जिनका उपयोग तुरंत यह तय करने के लिए किया जा सकता है कि उन दृष्टिकोणों के अनुसार कौन से अनुमानकों का उपयोग किया जाना चाहिए। उदाहरण के लिए, बायेसियन अनुमान के विचार सीधे बायेसियन अनुमानकों तक ले जाएंगे। इसी प्रकार, पारंपरिक सांख्यिकीय अनुमान का सिद्धांत कभी-कभी इस बारे में मजबूत निष्कर्ष निकाल सकता है कि किस अनुमानक का उपयोग किया जाना चाहिए। चूँकि, इन सिद्धांतों की उपयोगिता पूरी तरह से निर्धारित सांख्यिकीय मॉडल पर निर्भर करती है और अनुमानक को निर्धारित करने के लिए प्रासंगिक हानि फ़ंक्शन पर भी निर्भर हो सकती है। इस प्रकार एक बायेसियन विश्लेषण किया जा सकता है, जिससे प्रासंगिक मापदंडों के लिए एक पश्च वितरण हो सकता है, लेकिन एक विशिष्ट उपयोगिता या हानि फ़ंक्शन का उपयोग अस्पष्ट हो सकता है। अपरिवर्तनीयता के विचारों को पश्च वितरण को सारांशित करने के कार्य पर लागू किया जा सकता है। अन्य स्थितियों में, सांख्यिकीय विश्लेषण पूरी तरह से परिभाषित सांख्यिकीय मॉडल के बिना किए जाते हैं या सांख्यिकीय अनुमान के पारंपरिक सिद्धांत को आसानी से लागू नहीं किया जा सकता है क्योंकि जिन मॉडलों के परिवार पर विचार किया जा रहा है वे इस प्रकार के उपचार के लिए उत्तरदायी नहीं हैं। इन स्थितियों के अतिरिक्त जहां सामान्य सिद्धांत एक अनुमानक को निर्धारित नहीं करता है, एक अनुमानक के अपरिवर्तनीयता की अवधारणा को वैकल्पिक रूपों के अनुमानकों की तलाश करते समय लागू किया जा सकता है, या तो अनुमानक के आवेदन की सादगी के लिए या जिससे अनुमानक मजबूत आँकड़े हो।
अपरिवर्तनीयता की अवधारणा का उपयोग कभी-कभी अनुमानकर्ताओं के बीच चयन करने के विधियों के रूप में किया जाता है, किन्तु यह आवश्यक रूप से निश्चित नहीं है। उदाहरण के लिए, अपरिवर्तनीयता की आवश्यकता इस आवश्यकता के साथ असंगत हो सकती है कि अनुमानक का पूर्वाग्रह माध्य-निष्पक्ष हो; दूसरी ओर, मध्य-निष्पक्षता की कसौटी को अनुमानक के नमूना वितरण के संदर्भ में परिभाषित किया गया है और इसलिए यह कई परिवर्तनों के तहत अपरिवर्तनीय है।
अपरिवर्तनशीलता की अवधारणा का उपयोग वह है जहां आकलनकर्ताओं का वर्ग या परिवार प्रस्तावित किया जाता है और इनमें से विशेष सूत्रीकरण का चयन किया जाना चाहिए। प्रक्रिया प्रासंगिक अपरिवर्तनीय गुणों को लागू करना है और फिर इस वर्ग के अन्दर उस फॉर्मूलेशन को ढूंढना है जिसमें सर्वोत्तम गुण हैं, जिससे इष्टतम अपरिवर्तनीय अनुमानक कहा जाता है।
अपरिवर्तनीय अनुमानकों के कुछ वर्ग
ऐसे कई प्रकार के परिवर्तन हैं जिन पर अपरिवर्तनीय अनुमानकों के साथ व्यवहार करते समय उपयोगी रूप से विचार किया जाता है। प्रत्येक आकलनकर्ताओं के वर्ग को जन्म देता है जो उन विशेष प्रकार के परिवर्तनों के लिए अपरिवर्तनीय हैं।
- शिफ्ट इनवेरिएंस: सैद्धांतिक रूप से, किसी स्थान पैरामीटर का अनुमान डेटा मानों के सरल बदलावों के लिए अपरिवर्तनीय होना चाहिए। यदि सभी डेटा मान निश्चित राशि से बढ़ जाते हैं, तो अनुमान उसी राशि से बदलना चाहिए। भारित औसत का उपयोग करके अनुमान पर विचार करते समय, इस अपरिवर्तनीय आवश्यकता का तुरंत तात्पर्य यह है कि भार का योग होना चाहिए। जबकि समान परिणाम अक्सर निष्पक्षता की आवश्यकता से प्राप्त होता है, अपरिवर्तनीयता के उपयोग के लिए यह आवश्यक नहीं है कि कोई औसत मान मौजूद हो और किसी भी संभाव्यता वितरण का कोई उपयोग नहीं होता है।
- स्केल अपरिवर्तनीयता: ध्यान दें कि अनुमानक स्केल पैरामीटर के इनवेरिएंस के बारे में इस विषय को समग्र गुणों (भौतिकी में) के तहत सिस्टम के व्यवहार के बारे में अधिक सामान्य पैमाने के इनवेरिएंस के साथ भ्रमित नहीं किया जाना चाहिए।
- पैरामीटर-परिवर्तन अपरिवर्तनीयता: यहां, परिवर्तन अकेले पैरामीटर पर लागू होता है। यहां अवधारणा यह है कि अनिवार्य रूप से डेटा और पैरामीटर θ वाले मॉडल से ही अनुमान लगाया जाना चाहिए, जैसा कि उसी डेटा से बनाया जाएगा यदि मॉडल पैरामीटर φ का उपयोग करता है, जहां φ, θ, φ=h(θ) का एक-से-परिवर्तन है। इस प्रकार के अपरिवर्तनीयता के अनुसार, परिवर्तन-अपरिवर्तनीय अनुमानकों के परिणाम भी φ=h(θ) से संबंधित होने चाहिए। जब परिवर्तन मोनोटोनिक फ़ंक्शन होता है तो अधिकतम संभावना अनुमानकों के पास यह संपत्ति होती है। यद्यपि अनुमानक के स्पर्शोन्मुख गुण अपरिवर्तनीय हो सकते हैं, छोटे नमूना गुण भिन्न हो सकते हैं, और विशिष्ट वितरण प्राप्त करने की आवश्यकता होती है।[2]
- क्रमपरिवर्तन अपरिवर्तनीयता: जहां डेटा मानों के सेट को सांख्यिकीय मॉडल द्वारा दर्शाया जा सकता है कि वे स्वतंत्र और समान रूप से वितरित यादृच्छिक चर के परिणाम हैं, यह आवश्यकता लागू करना उचित है कि सामान्य वितरण की किसी भी संपत्ति का कोई भी अनुमानक क्रमपरिवर्तन-अपरिवर्तनीय होना चाहिए: विशेष रूप से अनुमानक, डेटा-मूल्यों के सेट के फ़ंक्शन के रूप में माना जाता है, यदि डेटा की वस्तुओं को डेटासेट के अन्दर स्वैप किया जाता है तो उसे बदलना नहीं चाहिए।
भारित औसत का उपयोग करके स्वतंत्र और समान रूप से वितरित डेटासेट से स्थान पैरामीटर का अनुमान लगाने के लिए क्रमपरिवर्तन अपरिवर्तनीयता और स्थान अपरिवर्तनीयता का संयोजन यह दर्शाता है कि वजन समान होना चाहिए और के बराबर होना चाहिए। बेशक, भारित औसत के अतिरिक्त अन्य अनुमानक बेहतर हो सकते हैं।
इष्टतम अपरिवर्तनीय अनुमानक
इस सेटिंग के अंतर्गत, हमें माप का सेट दिया जाता है जिसमें किसी अज्ञात पैरामीटर के बारे में जानकारी शामिल है . माप संभाव्यता घनत्व फ़ंक्शन वाले यादृच्छिक वेक्टर के रूप में तैयार किया गया है जो पैरामीटर वेक्टर पर निर्भर करता है .
समस्या अनुमान लगाने की है दिया गया . अनुमान, द्वारा निरूपित , माप का कार्य है और सेट से संबंधित है . परिणाम की गुणवत्ता हानि फ़ंक्शन द्वारा परिभाषित की जाती है जो जोखिम कार्य को निर्धारित करता है . के संभावित मानों का समुच्चय , , और द्वारा निरूपित किये जाते हैं , , और , क्रमश।
वर्गीकरण में
सांख्यिकीय वर्गीकरण में, वह नियम जो नए डेटा-आइटम को वर्ग निर्दिष्ट करता है, उसे विशेष प्रकार का अनुमानक माना जा सकता है। पैटर्न पहचान के लिए पूर्व ज्ञान तैयार करने में कई अपरिवर्तन-प्रकार के विचारों को ध्यान में रखा जा सकता है।
गणितीय सेटिंग
परिभाषा
अपरिवर्तनीय अनुमानक अनुमानक है जो निम्नलिखित दो नियमों का पालन करता है:[citation needed]
- तर्कसंगत अपरिवर्तनशीलता का सिद्धांत: किसी निर्णय समस्या में की गई कार्रवाई उपयोग किए गए माप पर परिवर्तन पर निर्भर नहीं होनी चाहिए
- अपरिवर्तनशील सिद्धांत: यदि दो निर्णय समस्याओं की औपचारिक संरचना समान है (के संदर्भ में)। , , और ), तो प्रत्येक समस्या में समान निर्णय नियम का उपयोग किया जाना चाहिए।
अपरिवर्तनीय या समतुल्य अनुमानक को औपचारिक रूप से परिभाषित करने के लिए, पहले परिवर्तनों के समूहों से संबंधित कुछ परिभाषाओं की आवश्यकता होती है। होने देना संभावित डेटा-नमूनों के सेट को निरूपित करें। के परिवर्तनों का समूह , द्वारा निरूपित किया जाना है , (मापने योग्य) 1:1 और के परिवर्तनों का सेट है अपने आप में, जो निम्नलिखित शर्तों को पूरा करता है:
- अगर और तब
- अगर तब , कहाँ (अर्थात, प्रत्येक परिवर्तन का समूह के अन्दर व्युत्क्रम होता है।)
- (अर्थात पहचान परिवर्तन है )
डेटासेट और में यदि समतुल्य हैं कुछ के लिए . सभी समतुल्य बिंदु समतुल्य वर्ग बनाते हैं। ऐसे तुल्यता वर्ग को कक्षा (समूह सिद्धांत) कहा जाता है ). h> कक्षा, , सेट है . अगर तब इसमें ही कक्षा होती है सकर्मक कहा गया है।
घनत्व का परिवार समूह के अंतर्गत अपरिवर्तनीय कहा जाता है यदि, प्रत्येक के लिए और वहाँ अनोखा अस्तित्व है ऐसा है कि घनत्व है . निरूपित किया जाएगा .
अगर समूह के अंतर्गत अपरिवर्तनीय है फिर हानि फ़ंक्शन के अंतर्गत अपरिवर्तनीय कहा गया है यदि प्रत्येक के लिए और वहाँ मौजूद है ऐसा है कि सभी के लिए . परिवर्तित मूल्य द्वारा निरूपित किया जाएगा .
ऊपरोक्त में, से परिवर्तनों का समूह है अपने आप को और से परिवर्तनों का समूह है खुद को।
अनुमान समस्या के अंतर्गत अपरिवर्तनीय (समतुल्य) है यदि तीन समूह मौजूद हैं जैसा कि ऊपर परिभाषित किया गया है।
अनुमान समस्या के लिए जो अपरिवर्तनीय है , अनुमानक के अंतर्गत अपरिवर्तनीय अनुमानक है यदि, सभी के लिए और ,
गुण
- अपरिवर्तनीय अनुमानक का जोखिम कार्य, , की कक्षाओं पर स्थिर है . इसके तुल्य सभी के लिए और .
- संक्रमणीय के साथ अपरिवर्तनीय अनुमानक का जोखिम कार्य स्थिर है.
किसी दी गई समस्या के लिए, सबसे कम जोखिम वाले अपरिवर्तनीय अनुमानक को सर्वोत्तम अपरिवर्तनीय अनुमानक कहा जाता है। सर्वोत्तम अपरिवर्तनीय अनुमानक हमेशा प्राप्त नहीं किया जा सकता। विशेष मामला जिसके लिए इसे हासिल किया जा सकता है वह है जब सकर्मक है.
उदाहरण: स्थान पैरामीटर
कल्पना करना यदि घनत्व स्थान पैरामीटर है स्वरूप का है . के लिए और , के अंतर्गत समस्या अपरिवर्तनीय है . इस मामले में अपरिवर्तनीय अनुमानक को संतुष्ट होना चाहिए
इस प्रकार यह स्वरूप का है (). पर सकर्मक है इसलिए जोखिम भिन्न नहीं होता है : वह है, . सबसे अच्छा अपरिवर्तनीय अनुमानक वह है जो जोखिम लाता है न्यूनतम करने के लिए.
उस स्थिति में जब L वर्ग त्रुटि है
पिटमैन अनुमानक
अनुमान की समस्या यही है घनत्व है , जहां θ अनुमान लगाया जाने वाला पैरामीटर है, और जहां हानि फ़ंक्शन है . यह समस्या निम्नलिखित (योगात्मक) परिवर्तन समूहों के साथ अपरिवर्तनीय है:
सर्वोत्तम अपरिवर्तनीय अनुमानक वह है जो न्यूनतम करता है
और यह पिटमैन का अनुमानक (1939) है।
चुकता त्रुटि हानि मामले के लिए, परिणाम है
अगर (यानी स्वतंत्र, इकाई-विचरण घटकों के साथ बहुभिन्नरूपी सामान्य वितरण)।
अगर (स्केल पैरामीटर σ के साथ कॉची वितरण वाले स्वतंत्र घटक) फिर ,. चूँकि परिणाम है
साथ
संदर्भ
- Berger, James O. (1985). Statistical decision theory and Bayesian Analysis (2nd ed.). New York: Springer-Verlag. ISBN 0-387-96098-8. MR 0804611.[page needed]
- Freue, Gabriela V. Cohen (2007). "The Pitman estimator of the Cauchy location parameter". Journal of Statistical Planning and Inference. 137 (6): 1900–1913. doi:10.1016/j.jspi.2006.05.002.
- Pitman, E.J.G. (1939). "The estimation of the location and scale parameters of a continuous population of any given form". Biometrika. 30 (3/4): 391–421. doi:10.1093/biomet/30.3-4.391. JSTOR 2332656.
- Pitman, E.J.G. (1939). "Tests of Hypotheses Concerning Location and Scale Parameters". Biometrika. 31 (1/2): 200–215. doi:10.1093/biomet/31.1-2.200. JSTOR 2334983.