आनुपातिक संकट नमूना: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 1: Line 1:
{{short description|Class of statistical survival models}}
{{short description|Class of statistical survival models}}
'''आनुपातिक संकट नमूना''' सांख्यिकी में [[उत्तरजीविता विश्लेषण]] का एक वर्ग होता है। उत्तरजीविता नमूना किसी घटना के घटित होने से पहले बीतने वाले समय को एक या अधिक [[सहसंयोजक|सहसंयोजकों]] से जोड़ता है। आनुपातिक संकटों के नमूने में, सहसंयोजक में एक इकाई वृद्धि का अनूठा प्रभाव संकट की दर के संबंध में गुणक होता है। उदाहरण के लिए, दवा लेने से स्ट्रोक होने की [[जोखिम दर|संकट दर]] आधी हो सकती है, या, जिस सामग्री से निर्मित घटक का निर्माण किया जाता है उसे बदलने से विफलता की संकट दर दोगुनी हो सकती है। अन्य प्रकार के उत्तरजीविता नमूना जैसे [[त्वरित विफलता समय मॉडल|त्वरित विफलता समय नमूना]] आनुपातिक संकटों को प्रदर्शित नहीं करते है। त्वरित विफलता समय नमूना उस स्थिति का वर्णन करता है जहां किसी घटना का जैविक या यांत्रिक जीवन इतिहास त्वरित (या धीमा) हो जाता है।ka
'''आनुपातिक संकट नमूना''' सांख्यिकी में [[उत्तरजीविता विश्लेषण]] का एक वर्ग होता है। उत्तरजीविता नमूना किसी घटना के घटित होने से पहले बीतने वाले समय को एक या अधिक [[सहसंयोजक|सहसंयोजकों]] से जोड़ता है। आनुपातिक संकटों के नमूने में, सहसंयोजक में एक इकाई वृद्धि का अनूठा प्रभाव संकट की दर के संबंध में गुणक होता है। उदाहरण के लिए, दवा लेने से स्ट्रोक होने की [[जोखिम दर|संकट दर]] आधी हो सकती है, या, जिस सामग्री से निर्मित घटक का निर्माण किया जाता है उसे बदलने से विफलता की संकट दर दोगुनी हो सकती है। अन्य प्रकार के उत्तरजीविता नमूना जैसे [[त्वरित विफलता समय मॉडल|त्वरित विफलता समय नमूना]] आनुपातिक संकटों को प्रदर्शित नहीं करते है। त्वरित विफलता समय नमूना उस स्थिति का वर्णन करता है जहां किसी घटना का जैविक या यांत्रिक जीवन इतिहास त्वरित (या धीमा) हो जाता है।


==पृष्ठभूमि==
==पृष्ठभूमि==

Revision as of 02:08, 14 July 2023

आनुपातिक संकट नमूना सांख्यिकी में उत्तरजीविता विश्लेषण का एक वर्ग होता है। उत्तरजीविता नमूना किसी घटना के घटित होने से पहले बीतने वाले समय को एक या अधिक सहसंयोजकों से जोड़ता है। आनुपातिक संकटों के नमूने में, सहसंयोजक में एक इकाई वृद्धि का अनूठा प्रभाव संकट की दर के संबंध में गुणक होता है। उदाहरण के लिए, दवा लेने से स्ट्रोक होने की संकट दर आधी हो सकती है, या, जिस सामग्री से निर्मित घटक का निर्माण किया जाता है उसे बदलने से विफलता की संकट दर दोगुनी हो सकती है। अन्य प्रकार के उत्तरजीविता नमूना जैसे त्वरित विफलता समय नमूना आनुपातिक संकटों को प्रदर्शित नहीं करते है। त्वरित विफलता समय नमूना उस स्थिति का वर्णन करता है जहां किसी घटना का जैविक या यांत्रिक जीवन इतिहास त्वरित (या धीमा) हो जाता है।

पृष्ठभूमि

उत्तरजीविता नमूना को दो भागों से मिलकर देखा जा सकता है: अंतर्निहित आधारभूत संकट फलन, जिसे अधिकांशतः दर्शाया जाता है , यह वर्णन करते हुए कि सहसंयोजकों के आधारभूत स्तरों पर प्रति समय इकाई घटना का संकट समय के साथ कैसे बदलता है, और प्रभाव प्राचल, यह वर्णन करते है कि व्याख्यात्मक सहसंयोजकों की प्रतिक्रिया में संकट कैसे भिन्न होता है। एक विशिष्ट चिकित्सा उदाहरण में परिवर्तनशीलता को कम करने और भ्रम को नियंत्रित करने के लिए सहसंयोजक जैसे उपचार, साथ ही रोगी की विशेषताएं जैसे अध्ययन की प्रारंभ में उम्र, लिंग और अध्ययन की प्रारंभ में अन्य बीमारियों की उपस्थिति सम्मलित होती है।

आनुपातिक संकटों की स्थिति[1] बताता है कि सहसंयोजक संकट से गुणात्मक रूप से संबंधित है। स्थिर गुणांक के सबसे सरल स्थिति में, उदाहरण के लिए, किसी दवा के साथ उपचार, किसी भी समय किसी विषय के संकट को आधा कर सकता है , जबकि आधारभूत संकट भिन्न हो सकता है। चूँकि, ध्यान दें कि इससे विषय का जीवनकाल दोगुना नहीं होता है, जीवनकाल पर सहसंयोजकों का त्रुटिहीन प्रभाव किस प्रकार पर निर्भर करता है . यह सहसंयोजक द्विआधारी भविष्यवक्ताओं तक ही सीमित नहीं होता है, सतत सहसंयोजक के स्थिति में , सामान्यतः यह माना जाता है कि संकट तेजी से प्रतिक्रिया करता है, प्रत्येक इकाई में वृद्धि होती है इसके परिणामस्वरूप संकट आनुपातिक रूप से बढ़ जाता है।

कॉक्स नमूना

परिचय

डेविड कॉक्स (सांख्यिकीविद्) ने देखा कि यदि आनुपातिक संकटों की धारणा स्वीकृत है (या, स्वीकृत मानी जाती है) तो प्रभाव प्राचल का अनुमान लगाना संभव होता है, जिसे दर्शाया जाता है नीचे, पूर्ण संकट फलन पर कोई विचार किए बिना उत्तरजीविता डेटा के इस दृष्टिकोण को कॉक्स आनुपातिक संकट नमूना का अनुप्रयोग कहा जाता है,[2] कभी-कभी इसे कॉक्स नमूना या आनुपातिक संकट नमूना के रूप में संक्षिप्त किया जाता है।[3] चूँकि, कॉक्स ने यह भी कहा कि आनुपातिक संकटों की धारणा की जैविक व्याख्या अधिक कठिन हो सकती है।[4][5]

मान लेते है Xi = (Xi1, … , Xip) विषय i के लिए सहसंयोजकों के वास्तविक मूल्य कॉक्स आनुपातिक संकट नमूना के लिए संकट फलन का रूप होता है

यह अभिव्यक्ति सहसंयोजक वेक्टर (व्याख्यात्मक चर) एक्स के साथ विषय i के लिए समय टी पर संकट फलन प्रस्तुत करता हैi. ध्यान दें कि विषयों के बीच, आधारभूत संकट समरूप होते है (i पर कोई निर्भरता नहीं होती है)। विषयों के संकटों के बीच एकमात्र अंतर आधारभूत स्केलिंग कारक से आता है .

इसे आनुपातिक क्यों कहा जाता है

आरंभ करने के लिए, मान लीजिए कि हमारे पास केवल एक ही सहसंयोजक है, , और इसलिए एक एकल गुणांक, . बढ़ने के प्रभाव पर विचार करते है 1 इसके द्वारा:

हम देख सकते है कि एक सहसंयोजक को 1 से बढ़ाने से मूल संकट स्थिरांक से बढ़ जाता है . वस्तुओं को थोड़ा पुनर्व्यवस्थित करने पर, हम देखते है कि:

दायीं ओर का भाग समय के साथ स्थिर रहता है (किसी भी पद का कोई मतलब नहीं होता है)। इस संबंध, , को आनुपातिकता_(गणित) कहा जाता है।

अधिक सामान्यतः, सहसंयोजकों के साथ दो विषयों, i और j पर विचार करते है और । उनके संकटों के अनुपात पर विचार करते है:

दायीं ओर का भाग समय पर निर्भर नहीं होता है, केवल समय पर निर्भर कारक के रूप में, , समाप्त कर दिया जाता है। इस प्रकार दो विषयों के संकटों का अनुपात स्थिर होता है, अर्थात संकट आनुपातिक होता है।

अवरोधन पद का अभाव

प्रतिगमन नमूने में अधिकांशतः एक अवरोधन शब्द (जिसे स्थिर शब्द या पूर्वाग्रह शब्द भी कहा जाता है) का उपयोग किया जाता है। कॉक्स नमूने में आधारभूत संकट के कारण एक का अभाव होता है, , यह उसका स्थान ले लेता है। हम यह देखते कि क्या होगा यदि हम किसी भी तरह से निरूपित एक अवरोधन शब्द सम्मलित करते है :

जहां हमने पुनः परिभाषित किया है एक नया आधारभूत संकट बन जाता है, . इस प्रकार, आधारभूत संकट में संकट के सभी भाग सम्मलित होते है जो विषयों के सहसंयोजकों पर निर्भर नहीं होते है, जिसमें कोई भी अवरोधन शब्द सम्मलित होता है (जो परिभाषा के अनुसार सभी विषयों के लिए स्थिर होते है)।

अद्वितीय समय की संभावना

कॉक्स आंशिक संभावना, आधारभूत संकट फलन के ब्रेस्लो के अनुमान का उपयोग करके प्राप्त किया जाता है, इसे पूर्ण संभावना में उपयुक्त किया जाता है और फिर यह देखा जाता है कि परिणाम दो कारकों का एक उत्पाद है। पहला कारक नीचे दिखाई गई आंशिक संभावना है, जिसमें आधारभूत संकट समाप्त हो जाता है। दूसरा कारक प्रतिगमन गुणांक से मुक्त है और केवल सेंसरिंग (सांख्यिकी) के माध्यम से डेटा पर निर्भर करता है। किसी भी आनुपातिक संकट नमूने द्वारा अनुमानित सहसंयोजकों के प्रभाव को इस प्रकार संकट के अनुपात के रूप में रिपोर्ट किया जा सकता है।

समय Y पर विषय i के लिए देखी जाने वाली घटना के घटित होने की संभावनाi इस प्रकार लिखा जा सकता है:

जहाँ θj = exp(Xjβ) और सारांश विषयों j के समूह पर है जहां घटना समय Y से पहले नहीं हुई हैi (स्वयं विषय सहित)। सामान्यतः 0 <Li(β) ≤ 1. यह एक संभावना फलन आंशिक संभावना है: समय के साथ संकट के परिवर्तन के सहसंयोजकों के प्रभाव का अनुमान लगाया जा सकता है।

विषये सांख्यिकीय रूप से एक-दूसरे से स्वतंत्र होते है, सभी वास्तविक घटनाओं की संयुक्त संभावना[6] निम्नलिखित आंशिक संभावना होती है, जहां घटना को घटना सी द्वारा इंगित किया जाता हैi = 1:

संगत लॉग आंशिक संभावना है

नमूने मापदंडों के अधिकतम आंशिक संभावना अनुमान उत्पन्न करने के लिए इस फलन को β से अधिक बढ़ाया जा सकता है।

आंशिक अंक (सांख्यिकी) है

और आंशिक लॉग संभावना का हेस्सियन आव्यूह है

इस अंक फलन और हेस्सियन आव्यूह का उपयोग करके, न्यूटन की विधि का उपयोग करके आंशिक संभावना को अधिकतम किया जा सकता है। हेसियन आव्यूह का व्युत्क्रम, जिसका मूल्यांकन β के अनुमान पर किया जाता है, इसका उपयोग अनुमान के लिए अनुमानित विचरण-सहप्रसरण आव्यूह के रूप में किया जा सकता है, और प्रतिगमन गुणांक के लिए अनुमानित मानक त्रुटियां उत्पन्न करने के लिए इसका उपयोग किया जा सकता है।

बंधे हुए समय के उपस्थित होने की संभावना

उन स्थितियों को संभालने के लिए कई दृष्टिकोण प्रस्तावित किए गए है जिनमें समय डेटा में संबंध होता है। ब्रेस्लो की विधि उस दृष्टिकोण का वर्णन करती है जिसमें ऊपर वर्णित प्रक्रिया को असंशोधित रूप से उपयोग किया जाता है, तब भी जब संबंध उपस्थित होता है। एक वैकल्पिक दृष्टिकोण जिसे बेहतर परिणाम देने वाला माना जाता है वह एफ्रॉन की विधि होती है।[7] टीj अद्वितीय समय को निरूपित करता है, मान लेते है Hj सूचकांकों के समुच्चय को इस प्रकार निरूपित करता कि Yi= टीj और सीi= 1, और एमj= |एचj| एफ्रॉन का दृष्टिकोण निम्नलिखित आंशिक संभावना को अधिकतम करता है।

संगत लॉग आंशिक संभावना है

अंक फलन है

और हेस्सियन आव्यूह है

जहाँ

ध्यान दें कि जब hj शून्य है (समय tj के साथ सभी अवलोकन सेंसर किया गया है), इन अभिव्यक्तियों में सारांश को शून्य माना जाता है।

उदाहरण

व्यवहार में कॉक्स नमूने के कुछ व्यावहारिक उदाहरण नीचे दिए गए है।

एक एकल द्विआधारी सहसंयोजक

मान लेते है कि जिस अंतिम बिंदु में हम रुचि रखते है वह सर्जरी के बाद 5 साल की अवलोकन अवधि के समय में रोगी जीवित रहता है। मरीज़ 5 साल की अवधि के भीतर मर सकता है, और हम रिकॉर्ड करते है कि उनकी मृत्यु कब हुई, या मरीज़ 5 साल से अधिक जीवित रह सकते है, और हम केवल यह रिकॉर्ड करते है कि वे 5 साल से अधिक जीवित रहते है। सर्जरी दो अस्पतालों, A या B में से एक में की गई थी, और हमे यह जानना होता है कि क्या अस्पताल का स्थान 5 साल के जीवित रहने से जुड़ा होता है। विशेष रूप से, हम अस्पताल बी की तुलना में अस्पताल ए में की गई सर्जरी से संकट में सापेक्ष वृद्धि (या कमी) जानना चाहा जाता है। कुछ डेटा प्रदान किया जाता है, जहां प्रत्येक पंक्ति एक मरीज का प्रतिनिधित्व करते है: T यह दर्शाता है कि मृत्यु से पहले मरीज़ पर कितने समय तक निगरानी रखी जाती है या 5 साल (महीनों में मापा गया), और C दर्शाता है कि मरीज़ की मृत्यु 5 साल की अवधि में हुई थी या नहीं हुई थी। हमने अस्पताल को एक द्विआधारी प्रकार के रूप में एन्कोड किया जाता है जिसे X के रूप दर्शाया जाता है: 1 यदि अस्पताल A से है, 0 यदि अस्पताल B से है।

अस्पताल एक्स टी सी
बी 0 60 गलत
बी 0 32 सही
बी 0 60 गलत
बी 0 60 गलत
बी 0 60 गलत
1 4 सही
1 18 सही
1 60 गलत
1 9 सही
1 31 सही
1 53 सही
1 17 सही

हमारा एकल-सहसंयोजक कॉक्स आनुपातिक नमूना निम्नलिखित दिखाता है अस्पताल के प्रभाव का प्रतिनिधित्व करता है, और i प्रत्येक रोगी को अनुक्रमित करता है:

सांख्यिकीय सॉफ्टवेयर का उपयोग करके हम अनुमान लगा सकते है 2.12 संकट अनुपात इस मान का घातीय होते है, . इसका कारण जानने के लिए, विशेष रूप से संकटों के अनुपात पर विचार करता है:

इस प्रकार, अस्पताल ए और अस्पताल बी का संकट अनुपात है . एक पल के लिए सांख्यिकीय महत्व को अलग रखते हुए, हम यह कहते हुए एक उत्तर दे सकते है कि अस्पताल ए में मरीज़ अस्पताल बी की तुलना में किसी भी कम समय में मृत्यु के 8.3 गुना अधिक संकट से जुड़ा होता है।

व्याख्या के बारे में उल्लेख करने योग्य महत्वपूर्ण संकेत है:

  1. मृत्यु के 8.3 गुना अधिक संकट का मतलब यह नहीं है कि अस्पताल बी में 8.3 गुना अधिक मरीज मरेंगे: उत्तरजीविता विश्लेषण यह प्राप्त करता है कि घटनाएं कितनी जल्दी घटित होती है, न कि केवल यह कि वे घटित होती है या नहीं होता है।
  2. अधिक विशेष रूप से, मृत्यु का संकट एक दर का माप होता है। दर में इकाइयाँ होती है, जैसे मीटर प्रति सेकंड। चूँकि, एक सापेक्ष दर नहीं है: एक साइकिल किसी अन्य साइकिल (संदर्भ साइकिल) की तुलना में दो गुना तेज चल सकती है, बिना किसी इकाई को निर्दिष्ट किए हुए। इसी तरह, अस्पताल में मृत्यु का संकट (मृत्यु की दर) अस्पताल बी (संदर्भ समूह) में मृत्यु के संकट की तुलना में 8.3 गुना अधिक (तेज़) होता है।
  3. व्युत्क्रम मात्रा, अस्पताल A के सापेक्ष अस्पताल B का संकट अनुपात है।
  4. हम अस्पतालों के बीच जीवित रहने की संभावनाओं के बारे में कोई अनुमान नहीं लगा सकते है। ऐसा इसलिए है क्योंकि हमें आधारभूत संकट दर के अनुमान की आवश्यकता होती, , साथ ही हमारा भी अनुमान लगाया जाता है। चूँकि, कॉक्स आनुपातिक संकट नमूने का मानक अनुमान सामान्यतः आधारभूत संकट की दर का अनुमान नहीं लगाता है।
  5. क्योंकि हमने नमूना के एकमात्र समय-परिवर्तनशील घटक, आधारभूत संकट दर को देखते नहीं है, हमारा अनुमान समय स्केल-अपरिवर्तनीय होता है। उदाहरण के लिए, यदि हमने समय को महीनों के अतिरिक्त वर्षों में मापा होता, तो हमें वही अनुमान प्राप्त होता है।
  6. यह कहना आकर्षक है कि अस्पताल ने दोनों समूहों के बीच संकटों में अंतर उत्पन्न किया था, लेकिन चूंकि हमारा अध्ययन कारणात्मक नहीं है (अर्थात्, हम नहीं जानते कि डेटा कैसे उत्पन्न हुआ), हम स्वीकृत होते है जैसी शब्दावली के साथ संबद्ध।

एक एकल सतत सहसंयोजक

उत्तरजीविता विश्लेषण के कम पारंपरिक उपयोग के स्थिति को प्रदर्शित करने के लिए, अगला उदाहरण एक अर्थशास्त्र प्रश्न होता है: संगठनों के आईपीओ की 1 साल की सालगिरह पर मूल्य-से-आय अनुपात (पी/ई) और उनके भविष्य के अस्तित्व के बीच क्या संबंध होता है ? अधिक विशेष रूप से, यदि हम किसी संगठन के जन्म की घटना को उनकी 1-वर्षीय आईपीओ वर्षगांठ मानते है, और किसी दिवालियापन, बिक्री, निजी होने आदि को संगठन की मृत्यु की घटना मानते है, तो हम संगठनों के पी के प्रभाव को जानना चाहेंगे।

प्रदान किया गया ए डेटासमूह है जिसमें 12 संगठनों के अस्तित्व डेटा होते है: T 1-वर्षीय आईपीओ वर्षगांठ और मृत्यु (या 2022-01-01 की अंतिम तिथि, यदि नहीं किया गया है) के बीच दिनों की संख्या का प्रतिनिधित्व करता है)। सी दर्शाता है कि संगठन 2022-01-01 से पहले समाप्त हो जाती है। पी/ई संगठनों की 1-वर्षीय आईपीओ वर्षगांठ पर मूल्य-से-आय अनुपात का प्रतिनिधित्व करता है।

सीओ. 1 साल की आईपीओ तारीख मौत की तिथि* सी टी पी/ई
0 2000-11-05 2011-01-22 सही 3730 9.7
1 2000-12-01 2003-03-30 सही 849 12.0
2 2011-01-05 2012-03-30 सही 450 3.0
3 2010-05-29 2011-02-22 सही 269 5.3
4 2005-06-23 2022-01-01 गलत 6036 10.8
5 2000-06-10 2002-07-24 सही 774 6.3
6 2011-07-11 2014-05-01 सही 1025 11.6
7 2007-09-27 2022-01-01 गलत 5210 10.3
8 2006-07-30 2010-06-03 सही 1404 8.0
9 2000-07-13 2001-07-19 सही 371 4.0
10 2013-06-10 2018-10-10 सही 1948 5.9
11 2011-07-16 2014-08-15 सही 1126 8.3

पिछले उदाहरण के विपरीत जहां एक द्विआधारी प्रकार था, इस डेटासमूह में एक सतत प्रकार, पी/ई है। चूँकि, नमूना समान दिखता है:

जहाँ किसी संगठन के पी/ई अनुपात का प्रतिनिधित्व करता है। कॉक्स नमूने के माध्यम से इस डेटासमूह को चलाने से अज्ञात के मूल्य का अनुमान उत्पन्न होता है , जो -0.34 है। इसलिए, संपूर्ण संकट का एक अनुमान इस प्रकार है:

आधारभूत संकट के बाद से, , यह अनुमान लगाया गया था, कि पूरे संकट की गणना नहीं की जा सकती है। चूँकि, संगठनों i और j के संकटों के अनुपात पर विचार करते है:

दाईं ओर सभी स्थितियां ज्ञात होती है, इसलिए संगठनों के बीच संकटों के अनुपात की गणना करना संभव होता है। चूँकि दाईं ओर कोई समय-निर्भर शब्द नहीं होता है (सभी पद स्थिर है), संकट एक-दूसरे के लिए आनुपातिक होते है। उदाहरण के लिए, संगठन 5 से संगठन 2 का संकट अनुपात है . इसका मतलब यह है कि, अध्ययन के समय के भीतर, संगठन 5 की मृत्यु का संकट संगठन 2 की मृत्यु के संकट के बराबर 0.33 ≈ 1/3 है।

व्याख्या के बारे में उल्लेख करने योग्य महत्वपूर्ण संकेत है:

  1. संकट अनुपात मात्रा है , जो है उपरोक्त उदाहरण में. उपरोक्त अंतिम गणना से, इसकी व्याख्या दो विषयों के बीच संकटों के अनुपात के रूप में होती है जिनके चर एक इकाई से भिन्न होते है: यदि , तब एक इकाई त्रुटिहीन रूप से मूल्य का संचार करता है .
  2. आधारभूत संकट का प्रतिनिधित्व तब किया जा सकता है जब स्केलिंग वर्ग होता है, अर्थात . <पी>

    क्या हम आधारभूत संकट की व्याख्या उस आधारभूत संगठन के संकट के रूप में कर सकते है जिसका पी/ई 0 है? आधारभूत विषय के संकट के रूप में आधारभूत संकट की यह व्याख्या अपूर्ण होती है, क्योंकि यह संभव है कि सहसंयोजक 0 होना असंभव है। इस उपकरण में, 0 का पी/ई अर्थहीन होता है (इसका मतलब है कि संगठन का मूल्य 0 है, अर्थात, वे मर चुके है)। संकट की अधिक उपयुक्त व्याख्या तब होती है जब सभी चर शून्य होते है।
  3. जैसे मूल्य को समझना और व्याख्या करना आकर्षक होता है किसी संगठन के संकट का प्रतिनिधित्व करने के लिए होता है। चूँकि, विचार करते है कि यह वास्तव में क्या दर्शाता है: . यहां संकटों का अनुपात स्पष्ट रूप से होता है, संगठन के संकट की तुलना 0 पी/ई वाली एक काल्पनिक आधारभूत संगठन से की जाती है। चूँकि, जैसा कि ऊपर बताया गया है, इस उपकरण में 0 का पी/ई असंभव होता है इस उदाहरण में अर्थहीन होते है. चूँकि, संभावित संकटों के बीच अनुपात सार्थक होता है।

समय-परिवर्तनशील भविष्यवक्ता और गुणांक

समय पर निर्भर चर, समय पर निर्भर स्तर और प्रति विषय कई घटनाओं के विस्तार को एंडरसन और गिल की गिनती प्रक्रिया सूत्रीकरण द्वारा सम्मलित किया जा सकता है।[8] समय-भिन्न प्रतिगामी के साथ संकट नमूने का उपयोग एक उदाहरण बेरोजगारी बीमा के प्रभाव का अनुमान लगाना होता है।[9][10]

समय-भिन्न सहसंयोजकों (अर्थात, भविष्यवक्ताओं) की अनुमति देने के अतिरिक्त, कॉक्स नमूने को समय-भिन्न गुणांकों के लिए भी सामान्यीकृत किया जा सकता है। अर्थात्, उपचार का आनुपातिक प्रभाव समय के साथ भिन्न हो सकता है, जैसे यदि कोई दवा रुग्णता के एक महीने के भीतर दी जाए तो वह बहुत प्रभावी हो सकती है, और समय बीतने के साथ कम प्रभावी हो जाती है। तब गुणांक के समय (स्थिरता) के साथ कोई परिवर्तन नहीं होने की परिकल्पना का परीक्षण किया जा सकता है। विवरण और सॉफ्टवेयर (आर (प्रोग्रामिंग भाषा)पैकेज) मार्टिनुसेन और शेइक (2006) में उपलब्ध है।[11][12]

इस संदर्भ में, यह भी उल्लेख किया जा सकता है कि योगात्मक संकटों का उपयोग करके सहसंयोजकों के प्रभाव को निर्दिष्ट करना सैद्धांतिक रूप से संभव होता है,[13] अर्थात निर्दिष्ट करता है

यदि ऐसे योगात्मक संकटों के नमूने का उपयोग उन स्थितियों में किया जाता है जहां (लॉग-)संभावना अधिकतमकरण उद्देश्य होते है, तो इसे सावधानी से प्रतिबंधित करा जाता है गैर-ऋणात्मक मानों के लिए संभवतः इसी जटिलता के परिणामस्वरूप ऐसे नमूने कम ही देखने को मिलते है। यदि उद्देश्य न्यूनतम वर्ग है तो गैर-ऋणात्मक प्रतिबंध की आवश्यकता नहीं होती है।

आधारभूत संकट फलन निर्दिष्ट करना

कॉक्स नमूने को विशिष्ट बनाया जा सकता है यदि यह मानने का कोई कारण उपस्थित होता है कि आधारभूत संकट एक विशेष रूप का अनुसरण करता है। इस स्थिति में, आधारभूत संकट किसी दिए गए फलन द्वारा प्रतिस्थापित किया जाता है। उदाहरण के लिए, संकट फलन को वेइबुल वितरण संचयी वितरण फलन मानने से वेइबुल आनुपातिक संकट नमूना प्राप्त होता है।

संयोग से, वेइबुल आधारभूत संकट का उपयोग नमूने आनुपातिक संकटों और त्वरित विफलता समय नमूने दोनों को संतुष्ट करता है।

सामान्य शब्द प्राचलिक आनुपातिक संकट नमूने का उपयोग आनुपातिक संकट नमूने का वर्णन करने के लिए किया जा सकता है जिसमें संकट कार्य निर्दिष्ट होते है। इसके विपरीत कॉक्स आनुपातिक संकट नमूने को कभी-कभी अर्धप्राचलिक नमूना कहा जाता है।

कुछ लेखक अंतर्निहित संकट के कार्य को निर्दिष्ट करते समय भी कॉक्स आनुपातिक संकट नमूने शब्द का उपयोग करते है।[14]

कॉक्स प्रतिगमन नमूना (आनुपातिक संकटों को छोड़ना) शब्द का उपयोग कभी-कभी समय-निर्भर कारकों को सम्मलित करने के लिए कॉक्स नमूना के विस्तार का वर्णन करने के लिए किया जाता है। चूँकि, यह उपयोग संभावित रूप से अस्पष्ट होते है क्योंकि कॉक्स आनुपातिक संकट नमूना स्वयं एक प्रतिगमन नमूने के रूप में वर्णित किया जा सकता है।

पॉइसन नमूना से संबंध

आनुपातिक संकटों के नमूने और पॉइसन प्रतिगमन नमूने के बीच एक संबंध होता है जिसे कभी-कभी पॉइसन प्रतिगमन के लिए सॉफ़्टवेयर में अनुमानित आनुपातिक संकटों के नमूना को उपयुक्त करने के लिए उपयोग किया जाता है। ऐसा करने का सामान्य कारण यह है कि गणना बहुत तेज होती है। धीमे कंप्यूटरों के दिनों में यह अधिक महत्वपूर्ण था लेकिन विशेष रूप से बड़े डेटा समूह या जटिल समस्याओं के लिए अभी भी उपयोगी हो सकता है। लैयर्ड और ओलिवियर (1981)[15] गणितीय विवरण प्रदान करते है वे ध्यान देते है, हम यह नहीं मानते है कि [पॉइसन नमूना] सत्य है, लेकिन इसे केवल संभावना प्राप्त करने के लिए एक उपकरण के रूप में उपयोग करते है। मैक्कलघ और नेल्डर का[16] सामान्यीकृत रैखिक नमूने पर पुस्तक में आनुपातिक संकटों के नमूने को सामान्यीकृत रैखिक नमूने में परिवर्तित करने पर एक अध्याय है।

उच्च-आयामी समूह के अंतर्गत

उच्च-आयाम में, जब नमूना आकार n की तुलना में सहसंयोजक p की संख्या बड़ी होती है, तो लैस्सो (सांख्यिकी) मौलिक नमूना-चयन रणनीतियों में से एक होता है। (1997) में आनुपातिक संकट प्रतिगमन प्राचल के लिए एक लासो प्रक्रिया प्रस्तावित की गयी थी।[17] प्रतिगमन प्राचल β के लैस्सो अनुमानक को L1-मानदंड L के अनुसार कॉक्स आंशिक लॉग-संभावना के विपरीत के न्यूनतम के रूप में परिभाषित किया गया है।1

इस विषय पर हाल ही में सैद्धांतिक प्रगति हुई है।[18][19][20]

सॉफ़्टवेयर कार्यान्वयन

  • गणित: CoxModelFit फलन।[21]
  • आर: coxph() फलन, उत्तरजीविता पैकेज में स्थित है।
  • एसएएस: phreg प्रक्रिया
  • स्टेटा: stcox आज्ञा
  • पायथन: CoxPHFitter लाइफलाइन्स लाइब्रेरी में स्थित है। phreg स्टेटनमूना लाइब्रेरी में।
  • एसपीएसएस: कॉक्स रिग्रेशन के अंतर्गत उपलब्ध है।
  • मतलब: coxphfit फलन
  • जूलिया: Survival.jl लाइब्रेरी में उपलब्ध है।
  • जेएमपी: फिट आनुपातिक संकटों प्लेटफॉर्म में उपलब्ध है।
  • प्रिज्म: उत्तरजीविता विश्लेषण और बहु प्रकार विश्लेषण में उपलब्ध

यह भी देखें

टिप्पणियाँ

  1. Breslow, N. E. (1975). "Analysis of Survival Data under the Proportional Hazards Model". International Statistical Review / Revue Internationale de Statistique. 43 (1): 45–57. doi:10.2307/1402659. JSTOR 1402659.
  2. Cox, David R (1972). "प्रतिगमन मॉडल और जीवन तालिका". Journal of the Royal Statistical Society, Series B. 34 (2): 187–220. JSTOR 2985181. MR 0341758.
  3. Kalbfleisch, John D.; Schaubel, Douglas E. (10 March 2023). "कॉक्स मॉडल के पचास वर्ष". Annual Review of Statistics and Its Application (in English). 10 (1): 1–23. doi:10.1146/annurev-statistics-033021-014043. ISSN 2326-8298.
  4. Reid, N. (1994). "A Conversation with Sir David Cox". Statistical Science. 9 (3): 439–455. doi:10.1214/ss/1177010394.
  5. Cox, D. R. (1997). Some remarks on the analysis of survival data. the First Seattle Symposium of Biostatistics: Survival Analysis.
  6. "Each failure contributes to the likelihood function", Cox (1972), page 191.
  7. Efron, Bradley (1974). "सेंसर किए गए डेटा के लिए कॉक्स के संभावना फ़ंक्शन की दक्षता". Journal of the American Statistical Association. 72 (359): 557–565. doi:10.1080/01621459.1977.10480613. JSTOR 2286217.
  8. Andersen, P.; Gill, R. (1982). "Cox's regression model for counting processes, a large sample study". Annals of Statistics. 10 (4): 1100–1120. doi:10.1214/aos/1176345976. JSTOR 2240714.
  9. Meyer, B. D. (1990). "बेरोजगारी बीमा और बेरोजगारी मंत्र" (PDF). Econometrica. 58 (4): 757–782. doi:10.2307/2938349. JSTOR 2938349.
  10. Bover, O.; Arellano, M.; Bentolila, S. (2002). "बेरोजगारी की अवधि, लाभ की अवधि और व्यापार चक्र" (PDF). The Economic Journal. 112 (479): 223–265. doi:10.1111/1468-0297.00034.
  11. Martinussen; Scheike (2006). उत्तरजीविता डेटा के लिए गतिशील प्रतिगमन मॉडल. Springer. doi:10.1007/0-387-33960-4. ISBN 978-0-387-20274-7.
  12. "timereg: Flexible Regression Models for Survival Data". CRAN.
  13. Cox, D. R. (1997). Some remarks on the analysis of survival data. the First Seattle Symposium of Biostatistics: Survival Analysis.
  14. Bender, R.; Augustin, T.; Blettner, M. (2006). "कॉक्स आनुपातिक खतरों के मॉडल का अनुकरण करने के लिए जीवित रहने का समय उत्पन्न करना". Statistics in Medicine. 24 (11): 1713–1723. doi:10.1002/sim.2369. PMID 16680804.
  15. Nan Laird and Donald Olivier (1981). "Covariance Analysis of Censored Survival Data Using Log-Linear Analysis Techniques". Journal of the American Statistical Association. 76 (374): 231–240. doi:10.2307/2287816. JSTOR 2287816.
  16. P. McCullagh and J. A. Nelder (2000). "Chapter 13: Models for Survival Data". Generalized Linear Models (Second ed.). Boca Raton, Florida: Chapman & Hall/CRC. ISBN 978-0-412-31760-6. (Second edition 1989; first CRC reprint 1999.)
  17. Tibshirani, R. (1997). "कॉक्स मॉडल में चर चयन के लिए लैस्सो विधि". Statistics in Medicine. 16 (4): 385–395. CiteSeerX 10.1.1.411.8024. doi:10.1002/(SICI)1097-0258(19970228)16:4<385::AID-SIM380>3.0.CO;2-3.
  18. Bradić, J.; Fan, J.; Jiang, J. (2011). "एनपी-आयामीता के साथ कॉक्स के आनुपातिक खतरों के मॉडल के लिए नियमितीकरण". Annals of Statistics. 39 (6): 3092–3120. arXiv:1010.5233. doi:10.1214/11-AOS911. PMC 3468162. PMID 23066171.
  19. Kong, S.; Nan, B. (2014). "लैस्सो के माध्यम से उच्च-आयामी कॉक्स प्रतिगमन के लिए गैर-स्पर्शोन्मुख दैवज्ञ असमानताएँ". Statistica Sinica. 24 (1): 25–42. arXiv:1204.1992. doi:10.5705/ss.2012.240. PMC 3916829. PMID 24516328.
  20. Huang, J.; Sun, T.; Ying, Z.; Yu, Y.; Zhang, C. H. (2011). "कॉक्स मॉडल में लैस्सो के लिए ओरेकल असमानताएँ". The Annals of Statistics. 41 (3): 1142–1165. arXiv:1306.4847. doi:10.1214/13-AOS1098. PMC 3786146. PMID 24086091.
  21. "कॉक्समॉडलफिट". Wolfram Language & System Documentation Center.


संदर्भ