अनुमानक का पूर्वाग्रह

From Vigyanwiki

आंकड़ों में, अनुमानक (या पूर्वाग्रह समारोह) का पूर्वाग्रह इस अनुमानक के अपेक्षित मूल्य और अनुमानित पैरामीटर के वास्तविक मूल्य के बीच का अंतर है। शून्य पूर्वाग्रह वाला अनुमानक या निर्णय नियम निष्पक्ष कहलाता है। सांख्यिकी में पूर्वाग्रह एक है objective एक अनुमानक की संपत्ति। पूर्वाग्रह संगत अनुमानक से एक अलग अवधारणा है: सुसंगत अनुमानक संभाव्यता में पैरामीटर के वास्तविक मूल्य में अभिसरण करते हैं, लेकिन पक्षपातपूर्ण या निष्पक्ष हो सकते हैं; अधिक जानकारी के लिए संगत अनुमानक#पूर्वाग्रह बनाम संगति देखें।

अन्य सभी समान होने के नाते, एक निष्पक्ष अनुमानक एक पक्षपाती अनुमानक के लिए बेहतर है, हालांकि व्यवहार में, पक्षपाती अनुमानक (आमतौर पर छोटे पूर्वाग्रह के साथ) अक्सर उपयोग किए जाते हैं। जब एक पक्षपाती अनुमानक का उपयोग किया जाता है, तो पूर्वाग्रह की सीमा की गणना की जाती है। एक पक्षपाती अनुमानक का उपयोग विभिन्न कारणों से किया जा सकता है: क्योंकि जनसंख्या के बारे में और धारणाओं के बिना एक निष्पक्ष अनुमानक मौजूद नहीं है; क्योंकि एक अनुमानक की गणना करना मुश्किल है (मानक विचलन के निष्पक्ष अनुमान के रूप में); क्योंकि केंद्रीय प्रवृत्ति के विभिन्न उपायों के संबंध में एक पक्षपाती अनुमानक निष्पक्ष हो सकता है; क्योंकि एक पक्षपाती अनुमानक निष्पक्ष अनुमानकों (विशेष रूप से संकोचन अनुमानकों में) की तुलना में कुछ हानि फ़ंक्शन (विशेष रूप से चुकता त्रुटि) का कम मूल्य देता है; या क्योंकि कुछ मामलों में निष्पक्ष होना बहुत मजबूत स्थिति है, और केवल निष्पक्ष अनुमानक उपयोगी नहीं होते हैं।

पूर्वाग्रह को औसत (अपेक्षित मूल्य) के बजाय माध्यिका के संबंध में भी मापा जा सकता है, इस मामले में सामान्य औसत-निष्पक्षता संपत्ति से औसत-निष्पक्षता को अलग करता है। गैर-रैखिक डेटा परिवर्तन (सांख्यिकी) के तहत माध्य-निष्पक्षता संरक्षित नहीं है, हालांकि औसत-निष्पक्षता है (देखें § Effect of transformations); उदाहरण के लिए, नमूना प्रसरण जनसंख्या विचरण के लिए एक पक्षपाती अनुमानक है। ये सभी नीचे सचित्र हैं।

परिभाषा

मान लीजिए कि हमारे पास एक सांख्यिकीय मॉडल है, जिसे वास्तविक संख्या θ द्वारा परिचालित किया गया है, जो देखे गए डेटा के लिए संभाव्यता वितरण को जन्म देता है, , और एक आँकड़ा जो किसी भी देखे गए डेटा के आधार पर θ के अनुमानक के रूप में कार्य करता है . अर्थात्, हम मानते हैं कि हमारा डेटा किसी अज्ञात वितरण का अनुसरण करता है (जहां θ एक निश्चित, अज्ञात स्थिरांक है जो इस वितरण का हिस्सा है), और फिर हम कुछ अनुमानक का निर्माण करते हैं मानचित्रों ने डेटा को उन मूल्यों पर देखा जो हम आशा करते हैं कि वे θ के करीब हैं। का 'पक्षपात' के सापेक्ष परिभाषित किया जाता है[1]

कहाँ वितरण पर अपेक्षित मूल्य दर्शाता है (यानी, सभी संभावित अवलोकनों का औसत ). दूसरा समीकरण अनुसरण करता है क्योंकि θ सशर्त वितरण के संबंध में औसत दर्जे का है .

एक अनुमानक को निष्पक्ष कहा जाता है यदि इसका पूर्वाग्रह पैरामीटर θ के सभी मानों के लिए शून्य के बराबर है, या समतुल्य है, यदि अनुमानक का अपेक्षित मान पैरामीटर से मेल खाता है।[2] अनुमानक के गुणों से संबंधित सिमुलेशन प्रयोग में, अनुमानित अंतर का उपयोग करके अनुमानक के पूर्वाग्रह का आकलन किया जा सकता है।

उदाहरण

नमूना विचरण

एक यादृच्छिक चर का नमूना प्रसरण अनुमानक पूर्वाग्रह के दो पहलुओं को प्रदर्शित करता है: सबसे पहले, सहज अनुमानक पक्षपाती है, जिसे स्केल कारक द्वारा ठीक किया जा सकता है; दूसरा, निष्पक्ष अनुमानक माध्य चुकता त्रुटि (MSE) के मामले में इष्टतम नहीं है, जिसे एक अलग पैमाने के कारक का उपयोग करके कम किया जा सकता है, जिसके परिणामस्वरूप निष्पक्ष अनुमानक की तुलना में कम MSE वाला पक्षपाती अनुमानक होता है। ठोस रूप से, भोले अनुमानक चुकता विचलन का योग करते हैं और n से विभाजित होते हैं, जो पक्षपाती है। इसके बजाय n − 1 से विभाजित करने पर एक निष्पक्ष अनुमानक प्राप्त होता है। इसके विपरीत, MSE को एक अलग संख्या (वितरण के आधार पर) से विभाजित करके कम किया जा सकता है, लेकिन इसका परिणाम एक पक्षपाती अनुमानक होता है। यह संख्या हमेशा n − 1 से बड़ी होती है, इसलिए इसे संकोचन अनुमानक के रूप में जाना जाता है, क्योंकि यह निष्पक्ष अनुमानक को शून्य की ओर सिकोड़ता है; सामान्य वितरण के लिए इष्टतम मान n + 1 है।

मान लीजिए एक्स1, ..., एक्सn अपेक्षित मान μ और विचरण σ के साथ स्वतंत्र और समान रूप से वितरित (i.i.d.) यादृच्छिक चर हैं2</उप>। यदि नमूना माध्य और असंशोधित नमूना प्रसरण को इस रूप में परिभाषित किया गया है

तब एस2 σ का पक्षपाती अनुमानक है2, क्योंकि