आनुपातिक संकट नमूना: Difference between revisions

From Vigyanwiki
(Created page with "{{short description|Class of statistical survival models}} आनुपातिक ख़तरे मॉडल सांख्यिकी में उत्तरजी...")
 
No edit summary
Line 1: Line 1:
{{short description|Class of statistical survival models}}
{{short description|Class of statistical survival models}}
आनुपातिक ख़तरे मॉडल सांख्यिकी में [[उत्तरजीविता विश्लेषण]] का एक वर्ग है। उत्तरजीविता मॉडल किसी घटना के घटित होने से पहले बीतने वाले समय को एक या अधिक [[सहसंयोजक]]ों से जोड़ते हैं जो उस समय की मात्रा के साथ जुड़ाव (सांख्यिकी) हो सकते हैं। आनुपातिक खतरों के मॉडल में, सहसंयोजक में एक इकाई वृद्धि का अनूठा प्रभाव खतरे की दर के संबंध में गुणक होता है। उदाहरण के लिए, दवा लेने से स्ट्रोक होने की [[जोखिम दर]] आधी हो सकती है, या, जिस सामग्री से निर्मित घटक का निर्माण किया जाता है उसे बदलने से विफलता की जोखिम दर दोगुनी हो सकती है। अन्य प्रकार के उत्तरजीविता मॉडल जैसे [[त्वरित विफलता समय मॉडल]] आनुपातिक खतरों को प्रदर्शित नहीं करते हैं। त्वरित विफलता समय मॉडल उस स्थिति का वर्णन करता है जहां किसी घटना का जैविक या यांत्रिक जीवन इतिहास त्वरित (या धीमा) हो जाता है।
'''आनुपातिक संकट नमूना''' सांख्यिकी में [[उत्तरजीविता विश्लेषण]] का एक वर्ग होता है। उत्तरजीविता नमूना किसी घटना के घटित होने से पहले बीतने वाले समय को एक या अधिक [[सहसंयोजक|सहसंयोजकों]] से जोड़ता है। आनुपातिक संकटों के नमूने में, सहसंयोजक में एक इकाई वृद्धि का अनूठा प्रभाव संकट की दर के संबंध में गुणक होता है। उदाहरण के लिए, दवा लेने से स्ट्रोक होने की [[जोखिम दर|संकट दर]] आधी हो सकती है, या, जिस सामग्री से निर्मित घटक का निर्माण किया जाता है उसे बदलने से विफलता की संकट दर दोगुनी हो सकती है। अन्य प्रकार के उत्तरजीविता नमूना जैसे [[त्वरित विफलता समय मॉडल|त्वरित विफलता समय नमूना]] आनुपातिक संकटों को प्रदर्शित नहीं करते है। त्वरित विफलता समय नमूना उस स्थिति का वर्णन करता है जहां किसी घटना का जैविक या यांत्रिक जीवन इतिहास त्वरित (या धीमा) हो जाता है।ka


==पृष्ठभूमि==
==पृष्ठभूमि==


उत्तरजीविता मॉडल को दो भागों से मिलकर देखा जा सकता है: अंतर्निहित आधारभूत खतरा फ़ंक्शन, जिसे अक्सर दर्शाया जाता है <math>\lambda_0(t)</math>, यह वर्णन करते हुए कि सहसंयोजकों के आधारभूत स्तरों पर प्रति समय इकाई घटना का जोखिम समय के साथ कैसे बदलता है; और प्रभाव पैरामीटर, यह वर्णन करते हुए कि व्याख्यात्मक सहसंयोजकों की प्रतिक्रिया में खतरा कैसे भिन्न होता है। एक विशिष्ट चिकित्सा उदाहरण में परिवर्तनशीलता को कम करने और/या भ्रम को नियंत्रित करने के लिए सहसंयोजक जैसे उपचार असाइनमेंट, साथ ही रोगी की विशेषताएं जैसे अध्ययन की शुरुआत में उम्र, लिंग और अध्ययन की शुरुआत में अन्य बीमारियों की उपस्थिति शामिल होगी।
उत्तरजीविता नमूना को दो भागों से मिलकर देखा जा सकता है: अंतर्निहित आधारभूत संकट फलन, जिसे अधिकांशतः दर्शाया जाता है <math>\lambda_0(t)</math>, यह वर्णन करते हुए कि सहसंयोजकों के आधारभूत स्तरों पर प्रति समय इकाई घटना का संकट समय के साथ कैसे बदलता है, और प्रभाव प्राचल, यह वर्णन करते है कि व्याख्यात्मक सहसंयोजकों की प्रतिक्रिया में संकट कैसे भिन्न होता है। एक विशिष्ट चिकित्सा उदाहरण में परिवर्तनशीलता को कम करने और भ्रम को नियंत्रित करने के लिए सहसंयोजक जैसे उपचार, साथ ही रोगी की विशेषताएं जैसे अध्ययन की प्रारंभ में उम्र, लिंग और अध्ययन की प्रारंभ में अन्य बीमारियों की उपस्थिति सम्मलित होती है।


आनुपातिक खतरों की स्थिति<ref>{{cite journal
आनुपातिक संकटों की स्थिति<ref>{{cite journal
| doi = 10.2307/1402659
| doi = 10.2307/1402659
| last = Breslow |first = N. E. |author-link= Norman Breslow
| last = Breslow |first = N. E. |author-link= Norman Breslow
Line 12: Line 12:
| journal = International Statistical Review / Revue Internationale de Statistique
| journal = International Statistical Review / Revue Internationale de Statistique
| year = 1975 | volume = 43 | issue=1 |pages = 45–57
| year = 1975 | volume = 43 | issue=1 |pages = 45–57
| jstor = 1402659}}</ref> बताता है कि सहसंयोजक खतरे से गुणात्मक रूप से संबंधित हैं। स्थिर गुणांक के सबसे सरल मामले में, उदाहरण के लिए, किसी दवा के साथ उपचार, किसी भी समय किसी विषय के खतरे को आधा कर सकता है <math>t</math>, जबकि आधारभूत खतरा भिन्न हो सकता है। हालाँकि, ध्यान दें कि इससे विषय का जीवनकाल दोगुना नहीं हो जाता है; जीवनकाल पर सहसंयोजकों का सटीक प्रभाव किस प्रकार पर निर्भर करता है <math>\lambda_0(t)</math>. सहसंयोजक द्विआधारी भविष्यवक्ताओं तक ही सीमित नहीं है; सतत सहसंयोजक के मामले में <math>x</math>, आमतौर पर यह माना जाता है कि खतरा तेजी से प्रतिक्रिया करता है; प्रत्येक इकाई में वृद्धि होती है <math>x</math> इसके परिणामस्वरूप ख़तरा आनुपातिक रूप से बढ़ जाता है।
| jstor = 1402659}}</ref> बताता है कि सहसंयोजक संकट से गुणात्मक रूप से संबंधित है। स्थिर गुणांक के सबसे सरल स्थिति में, उदाहरण के लिए, किसी दवा के साथ उपचार, किसी भी समय किसी विषय के संकट को आधा कर सकता है <math>t</math>, जबकि आधारभूत संकट भिन्न हो सकता है। चूँकि, ध्यान दें कि इससे विषय का जीवनकाल दोगुना नहीं होता है, जीवनकाल पर सहसंयोजकों का त्रुटिहीन प्रभाव किस प्रकार पर निर्भर करता है <math>\lambda_0(t)</math>. यह सहसंयोजक द्विआधारी भविष्यवक्ताओं तक ही सीमित नहीं होता है, सतत सहसंयोजक के स्थिति में <math>x</math>, सामान्यतः यह माना जाता है कि संकट तेजी से प्रतिक्रिया करता है, प्रत्येक इकाई में वृद्धि होती है <math>x</math> इसके परिणामस्वरूप संकट आनुपातिक रूप से बढ़ जाता है।


==कॉक्स मॉडल==
==कॉक्स नमूना==


=== परिचय ===
=== परिचय ===


[[डेविड कॉक्स (सांख्यिकीविद्)]] ने देखा कि यदि आनुपातिक खतरों की धारणा कायम है (या, कायम मानी जाती है) तो प्रभाव पैरामीटर का अनुमान लगाना संभव है, जिसे दर्शाया गया है <math>\beta_i</math> नीचे, पूर्ण जोखिम फ़ंक्शन पर कोई विचार किए बिना। उत्तरजीविता डेटा के इस दृष्टिकोण को ''कॉक्स आनुपातिक खतरों मॉडल'' का अनुप्रयोग कहा जाता है,<ref>{{cite journal | last=Cox | first=David R | author-link=David Cox (statistician) | year=1972 | journal=Journal of the Royal Statistical Society, Series B | volume=34 | issue=2 | title=प्रतिगमन मॉडल और जीवन तालिका| pages=187–220 | jstor=2985181 |mr=0341758}}</ref> कभी-कभी इसे ''कॉक्स मॉडल'' या ''आनुपातिक ख़तरा मॉडल'' के रूप में संक्षिप्त किया जाता है।<ref name="Kalbfleisch">{{cite journal |last1=Kalbfleisch |first1=John D. |last2=Schaubel |first2=Douglas E. |title=कॉक्स मॉडल के पचास वर्ष|journal=Annual Review of Statistics and Its Application |date=10 March 2023 |volume=10 |issue=1 |pages=1–23 |doi=10.1146/annurev-statistics-033021-014043 |url=https://doi.org/10.1146/annurev-statistics-033021-014043 |language=en |issn=2326-8298}}</ref> हालाँकि, कॉक्स ने यह भी कहा कि आनुपातिक खतरों की धारणा की जैविक व्याख्या काफी मुश्किल हो सकती है।<ref>{{cite journal
[[डेविड कॉक्स (सांख्यिकीविद्)]] ने देखा कि यदि आनुपातिक संकटों की धारणा स्वीकृत है (या, स्वीकृत मानी जाती है) तो प्रभाव प्राचल का अनुमान लगाना संभव होता है, जिसे दर्शाया जाता है <math>\beta_i</math> नीचे, पूर्ण संकट फलन पर कोई विचार किए बिना उत्तरजीविता डेटा के इस दृष्टिकोण को ''कॉक्स आनुपातिक संकट नमूना'' का अनुप्रयोग कहा जाता है,<ref>{{cite journal | last=Cox | first=David R | author-link=David Cox (statistician) | year=1972 | journal=Journal of the Royal Statistical Society, Series B | volume=34 | issue=2 | title=प्रतिगमन मॉडल और जीवन तालिका| pages=187–220 | jstor=2985181 |mr=0341758}}</ref> कभी-कभी इसे ''कॉक्स नमूना'' या ''आनुपातिक संकट नमूना'' के रूप में संक्षिप्त किया जाता है।<ref name="Kalbfleisch">{{cite journal |last1=Kalbfleisch |first1=John D. |last2=Schaubel |first2=Douglas E. |title=कॉक्स मॉडल के पचास वर्ष|journal=Annual Review of Statistics and Its Application |date=10 March 2023 |volume=10 |issue=1 |pages=1–23 |doi=10.1146/annurev-statistics-033021-014043 |url=https://doi.org/10.1146/annurev-statistics-033021-014043 |language=en |issn=2326-8298}}</ref> चूँकि, कॉक्स ने यह भी कहा कि आनुपातिक संकटों की धारणा की जैविक व्याख्या अधिक कठिन हो सकती है।<ref>{{cite journal
| last = Reid |first = N.
| last = Reid |first = N.
| title = A Conversation with Sir David Cox
| title = A Conversation with Sir David Cox
Line 28: Line 28:
| conference = the First Seattle Symposium of Biostatistics: Survival Analysis
| conference = the First Seattle Symposium of Biostatistics: Survival Analysis
| year = 1997 }}</ref>
| year = 1997 }}</ref>
होने देना {{math|1=''X''<sub>''i''</sub> = (''X''<sub>''i''1</sub>, … , ''X''<sub>''ip''</sub>)}} विषय i के लिए सहसंयोजकों के वास्तविक मूल्य बनें। कॉक्स आनुपातिक ख़तरे मॉडल के लिए ख़तरे फ़ंक्शन का रूप है
 
मान लेते है {{math|1=''X''<sub>''i''</sub> = (''X''<sub>''i''1</sub>, … , ''X''<sub>''ip''</sub>)}} विषय i के लिए सहसंयोजकों के वास्तविक मूल्य कॉक्स आनुपातिक संकट नमूना के लिए संकट फलन का रूप होता है


::<math>
::<math>
Line 36: Line 37:
\end{align}
\end{align}
</math>
</math>
यह अभिव्यक्ति सहसंयोजक वेक्टर (व्याख्यात्मक चर) एक्स के साथ विषय i के लिए समय टी पर खतरा फ़ंक्शन देती है<sub>''i''</sub>. ध्यान दें कि विषयों के बीच, आधारभूत खतरा <math>\lambda_0(t)</math> समरूप है (i पर कोई निर्भरता नहीं है)। विषयों के खतरों के बीच एकमात्र अंतर बेसलाइन स्केलिंग कारक से आता है <math>\exp(X_i \cdot \beta)</math>.
यह अभिव्यक्ति सहसंयोजक वेक्टर (व्याख्यात्मक चर) एक्स के साथ विषय i के लिए समय टी पर संकट फलन प्रस्तुत करता है<sub>''i''</sub>. ध्यान दें कि विषयों के बीच, आधारभूत संकट <math>\lambda_0(t)</math> समरूप होते है (i पर कोई निर्भरता नहीं होती है)। विषयों के संकटों के बीच एकमात्र अंतर आधारभूत स्केलिंग कारक से आता है <math>\exp(X_i \cdot \beta)</math>.


=== इसे आनुपातिक क्यों कहा जाता है ===
=== इसे आनुपातिक क्यों कहा जाता है ===


आरंभ करने के लिए, मान लीजिए कि हमारे पास केवल एक ही सहसंयोजक है, <math>x</math>, और इसलिए एक एकल गुणांक, <math>\beta_1</math>. बढ़ने के प्रभाव पर विचार करें <math>x</math> 1 द्वारा:
आरंभ करने के लिए, मान लीजिए कि हमारे पास केवल एक ही सहसंयोजक है, <math>x</math>, और इसलिए एक एकल गुणांक, <math>\beta_1</math>. बढ़ने के प्रभाव पर विचार करते है <math>x</math> 1 इसके द्वारा:


::<math>
::<math>
Line 50: Line 51:
\end{align}
\end{align}
</math>
</math>
हम देख सकते हैं कि एक सहसंयोजक को 1 से बढ़ाने से मूल खतरा स्थिरांक से बढ़ जाता है <math>\exp(\beta_1)</math>. चीजों को थोड़ा पुनर्व्यवस्थित करने पर, हम देखते हैं कि:
हम देख सकते है कि एक सहसंयोजक को 1 से बढ़ाने से मूल संकट स्थिरांक से बढ़ जाता है <math>\exp(\beta_1)</math>. वस्तुओं को थोड़ा पुनर्व्यवस्थित करने पर, हम देखते है कि:


::<math>
::<math>
\frac{\lambda(t|x+1)}{\lambda(t|x)} = \exp(\beta_1)
\frac{\lambda(t|x+1)}{\lambda(t|x)} = \exp(\beta_1)
</math>
</math>
दायीं ओर का भाग समय के साथ स्थिर रहता है (किसी भी पद का कोई मतलब नहीं है)। <math>t</math> इस में)। यह रिश्ते, <math>x/y = \text{constant}</math>, को आनुपातिकता_(गणित) कहा जाता है।
दायीं ओर का भाग समय के साथ स्थिर रहता है (किसी भी पद का कोई मतलब नहीं होता है)। <math>t</math> इस संबंध, <math>x/y = \text{constant}</math>, को आनुपातिकता_(गणित) कहा जाता है।


 
अधिक सामान्यतः, सहसंयोजकों के साथ दो विषयों, <i>i</i> और <i>j</i> पर विचार करते है <math>X_i</math> और <math>X_j</math>उनके संकटों के अनुपात पर विचार करते है:
अधिक सामान्यतः, सहसंयोजकों के साथ दो विषयों, <i>i</i> और <i>j</i> पर विचार करें <math>X_i</math> और <math>X_j</math> क्रमश। उनके खतरों के अनुपात पर विचार करें:


::<math>
::<math>
Line 67: Line 67:
\end{align}
\end{align}
</math>
</math>
दायीं ओर का भाग समय पर निर्भर नहीं है, केवल समय पर निर्भर कारक के रूप में, <math>\lambda_0(t)</math>, रद्द कर दिया गया। इस प्रकार दो विषयों के खतरों का अनुपात स्थिर है, यानी खतरे आनुपातिक हैं।
दायीं ओर का भाग समय पर निर्भर नहीं होता है, केवल समय पर निर्भर कारक के रूप में, <math>\lambda_0(t)</math>, समाप्त कर दिया जाता है। इस प्रकार दो विषयों के संकटों का अनुपात स्थिर होता है, अर्थात संकट आनुपातिक होता है।


=== अवरोधन पद का अभाव ===
=== अवरोधन पद का अभाव ===
प्रतिगमन मॉडल में अक्सर एक अवरोधन शब्द (जिसे स्थिर शब्द या पूर्वाग्रह शब्द भी कहा जाता है) का उपयोग किया जाता है। कॉक्स मॉडल में आधारभूत खतरे के कारण एक का अभाव है, <math>\lambda_0(t)</math>, उसका स्थान ले लेता है। आइए देखें कि क्या होगा यदि हम किसी भी तरह से निरूपित एक अवरोधन शब्द शामिल करें <math>\beta_0</math>:  
प्रतिगमन नमूने में अधिकांशतः एक अवरोधन शब्द (जिसे स्थिर शब्द या पूर्वाग्रह शब्द भी कहा जाता है) का उपयोग किया जाता है। कॉक्स नमूने में आधारभूत संकट के कारण एक का अभाव होता है, <math>\lambda_0(t)</math>, यह उसका स्थान ले लेता है। हम यह देखते कि क्या होगा यदि हम किसी भी तरह से निरूपित एक अवरोधन शब्द सम्मलित करते है <math>\beta_0</math>:  


::<math>
::<math>
Line 80: Line 80:
\end{align}
\end{align}
</math>
</math>
जहां हमने पुनः परिभाषित किया है <math>\exp(\beta_0)\lambda_0(t)</math> एक नया आधारभूत ख़तरा बनना, <math>\lambda^*_0(t)</math>. इस प्रकार, आधारभूत खतरे में खतरे के <i>सभी</i> भाग शामिल होते हैं जो विषयों के सहसंयोजकों पर निर्भर नहीं होते हैं, जिसमें कोई भी अवरोधन शब्द शामिल होता है (जो परिभाषा के अनुसार सभी विषयों के लिए स्थिर है)।
जहां हमने पुनः परिभाषित किया है <math>\exp(\beta_0)\lambda_0(t)</math> एक नया आधारभूत संकट बन जाता है, <math>\lambda^*_0(t)</math>. इस प्रकार, आधारभूत संकट में संकट के <i>सभी</i> भाग सम्मलित होते है जो विषयों के सहसंयोजकों पर निर्भर नहीं होते है, जिसमें कोई भी अवरोधन शब्द सम्मलित होता है (जो परिभाषा के अनुसार सभी विषयों के लिए स्थिर होते है)।


=== अद्वितीय समय की संभावना ===
=== अद्वितीय समय की संभावना ===


कॉक्स [[आंशिक संभावना]], जो नीचे दिखाई गई है, बेसलाइन खतरा फ़ंक्शन के ब्रेस्लो के अनुमान का उपयोग करके प्राप्त की जाती है, इसे पूर्ण संभावना में प्लग किया जाता है और फिर यह देखा जाता है कि परिणाम दो कारकों का एक उत्पाद है। पहला कारक नीचे दिखाई गई आंशिक संभावना है, जिसमें आधारभूत खतरा रद्द हो गया है। दूसरा कारक प्रतिगमन गुणांक से मुक्त है और केवल [[सेंसरिंग (सांख्यिकी)]] के माध्यम से डेटा पर निर्भर करता है। किसी भी आनुपातिक खतरे मॉडल द्वारा अनुमानित सहसंयोजकों के प्रभाव को इस प्रकार खतरे के अनुपात के रूप में रिपोर्ट किया जा सकता है।
कॉक्स [[आंशिक संभावना]], आधारभूत संकट फलन के ब्रेस्लो के अनुमान का उपयोग करके प्राप्त किया जाता है, इसे पूर्ण संभावना में उपयुक्त किया जाता है और फिर यह देखा जाता है कि परिणाम दो कारकों का एक उत्पाद है। पहला कारक नीचे दिखाई गई आंशिक संभावना है, जिसमें आधारभूत संकट समाप्त हो जाता है। दूसरा कारक प्रतिगमन गुणांक से मुक्त है और केवल [[सेंसरिंग (सांख्यिकी)]] के माध्यम से डेटा पर निर्भर करता है। किसी भी आनुपातिक संकट नमूने द्वारा अनुमानित सहसंयोजकों के प्रभाव को इस प्रकार संकट के अनुपात के रूप में रिपोर्ट किया जा सकता है।


समय Y पर विषय i के लिए देखी जाने वाली घटना के घटित होने की संभावना<sub>''i''</sub> इस प्रकार लिखा जा सकता है:
समय Y पर विषय i के लिए देखी जाने वाली घटना के घटित होने की संभावना<sub>''i''</sub> इस प्रकार लिखा जा सकता है:
Line 93: Line 93:
  =\frac{\theta_i}{\sum_{j:Y_j\ge Y_i}\theta_j},
  =\frac{\theta_i}{\sum_{j:Y_j\ge Y_i}\theta_j},
</math>
</math>
कहाँ {{math|1=''θ''<sub>''j''</sub> = exp(''X''<sub>''j''</sub> ⋅ ''β''}}) और सारांश विषयों j के सेट पर है जहां घटना समय Y से पहले नहीं हुई है<sub>''i''</sub> (स्वयं विषय सहित)। जाहिर तौर पर 0 <L<sub>''i''</sub>(β) ≤ 1. यह एक संभावना फ़ंक्शन #आंशिक संभावना है: समय के साथ खतरे के परिवर्तन को मॉडल करने की आवश्यकता के बिना सहसंयोजकों के प्रभाव का अनुमान लगाया जा सकता है।
जहाँ {{math|1=''θ''<sub>''j''</sub> = exp(''X''<sub>''j''</sub> ⋅ ''β''}}) और सारांश विषयों j के समूह पर है जहां घटना समय Y से पहले नहीं हुई है<sub>''i''</sub> (स्वयं विषय सहित)। सामान्यतः 0 <L<sub>''i''</sub>(β) ≤ 1. यह एक संभावना फलन आंशिक संभावना है: समय के साथ संकट के परिवर्तन के सहसंयोजकों के प्रभाव का अनुमान लगाया जा सकता है।


विषयों के साथ ऐसा व्यवहार करना जैसे कि वे सांख्यिकीय रूप से एक-दूसरे से स्वतंत्र हों, सभी वास्तविक घटनाओं की संयुक्त संभावना<ref>"Each failure contributes to the likelihood function", Cox (1972), page 191.</ref> निम्नलिखित आंशिक संभावना है, जहां घटना की घटना सी द्वारा इंगित की जाती है<sub>''i''</sub> = 1:
विषये सांख्यिकीय रूप से एक-दूसरे से स्वतंत्र होते है, सभी वास्तविक घटनाओं की संयुक्त संभावना<ref>"Each failure contributes to the likelihood function", Cox (1972), page 191.</ref> निम्नलिखित आंशिक संभावना होती है, जहां घटना को घटना सी द्वारा इंगित किया जाता है<sub>''i''</sub> = 1:
::<math>
::<math>
L(\beta) = \prod_{i:C_i=1} L_i(\beta) .
L(\beta) = \prod_{i:C_i=1} L_i(\beta) .
Line 103: Line 103:
\ell(\beta) = \sum_{i:C_i=1} \left(X_i \cdot \beta - \log \sum_{j:Y_j\ge Y_i}\theta_j\right).
\ell(\beta) = \sum_{i:C_i=1} \left(X_i \cdot \beta - \log \sum_{j:Y_j\ge Y_i}\theta_j\right).
</math>
</math>
मॉडल मापदंडों के अधिकतम आंशिक संभावना अनुमान उत्पन्न करने के लिए इस फ़ंक्शन को β से अधिक बढ़ाया जा सकता है।
नमूने मापदंडों के अधिकतम आंशिक संभावना अनुमान उत्पन्न करने के लिए इस फलन को β से अधिक बढ़ाया जा सकता है।


आंशिक [[स्कोर (सांख्यिकी)]] है
आंशिक [[स्कोर (सांख्यिकी)|अंक (सांख्यिकी)]] है
::<math>
::<math>
\ell^\prime(\beta) = \sum_{i:C_i=1} \left(X_i - \frac{\sum_{j:Y_j\ge Y_i}\theta_jX_j}{\sum_{j:Y_j\ge Y_i}\theta_j}\right),
\ell^\prime(\beta) = \sum_{i:C_i=1} \left(X_i - \frac{\sum_{j:Y_j\ge Y_i}\theta_jX_j}{\sum_{j:Y_j\ge Y_i}\theta_j}\right),
</math>
</math>
और आंशिक लॉग संभावना का [[ हेस्सियन मैट्रिक्स ]] है
और आंशिक लॉग संभावना का [[ हेस्सियन मैट्रिक्स | हेस्सियन आव्यूह]] है
::<math>
::<math>
\ell^{\prime\prime}(\beta) = -\sum_{i:C_i=1} \left(\frac{\sum_{j:Y_j\ge Y_i}\theta_jX_jX_j^\prime}{\sum_{j:Y_j\ge Y_i}\theta_j} - \frac{\left[\sum_{j:Y_j\ge Y_i}\theta_jX_j\right] \left[\sum_{j:Y_j\ge Y_i}\theta_jX_j^\prime\right]}{\left[\sum_{j:Y_j\ge Y_i}\theta_j\right]^2}\right).
\ell^{\prime\prime}(\beta) = -\sum_{i:C_i=1} \left(\frac{\sum_{j:Y_j\ge Y_i}\theta_jX_jX_j^\prime}{\sum_{j:Y_j\ge Y_i}\theta_j} - \frac{\left[\sum_{j:Y_j\ge Y_i}\theta_jX_j\right] \left[\sum_{j:Y_j\ge Y_i}\theta_jX_j^\prime\right]}{\left[\sum_{j:Y_j\ge Y_i}\theta_j\right]^2}\right).
</math>
</math>
इस स्कोर फ़ंक्शन और हेस्सियन मैट्रिक्स का उपयोग करके, न्यूटन की विधि | न्यूटन-रेफसन एल्गोरिदम का उपयोग करके आंशिक संभावना को अधिकतम किया जा सकता है। हेसियन मैट्रिक्स का व्युत्क्रम, जिसका मूल्यांकन β के अनुमान पर किया जाता है, का उपयोग अनुमान के लिए अनुमानित विचरण-सहप्रसरण मैट्रिक्स के रूप में किया जा सकता है, और प्रतिगमन गुणांक के लिए अनुमानित [[मानक त्रुटि]]यां उत्पन्न करने के लिए उपयोग किया जा सकता है।
इस अंक फलन और हेस्सियन आव्यूह का उपयोग करके, न्यूटन की विधि का उपयोग करके आंशिक संभावना को अधिकतम किया जा सकता है। हेसियन आव्यूह का व्युत्क्रम, जिसका मूल्यांकन β के अनुमान पर किया जाता है, इसका उपयोग अनुमान के लिए अनुमानित विचरण-सहप्रसरण आव्यूह के रूप में किया जा सकता है, और प्रतिगमन गुणांक के लिए अनुमानित [[मानक त्रुटि|मानक त्रुटियां]] उत्पन्न करने के लिए इसका उपयोग किया जा सकता है।


===संभावना जब बंधे हुए समय मौजूद हों===
===बंधे हुए समय के उपस्थित होने की संभावना===


उन स्थितियों को संभालने के लिए कई दृष्टिकोण प्रस्तावित किए गए हैं जिनमें समय डेटा में संबंध हैं। ब्रेस्लो की विधि उस दृष्टिकोण का वर्णन करती है जिसमें ऊपर वर्णित प्रक्रिया को असंशोधित रूप से उपयोग किया जाता है, तब भी जब संबंध मौजूद हों। एक वैकल्पिक दृष्टिकोण जिसे बेहतर परिणाम देने वाला माना जाता है वह एफ्रॉन की विधि है।<ref>{{cite journal | last=Efron | first=Bradley | year=1974 | journal=Journal of the American Statistical Association | pages=557–565 | volume=72 | title=सेंसर किए गए डेटा के लिए कॉक्स के संभावना फ़ंक्शन की दक्षता| issue=359 | jstor=2286217 | doi = 10.1080/01621459.1977.10480613 }}</ref> चलो टी<sub>''j''</sub> अद्वितीय समय को निरूपित करें, मान लीजिए H<sub>''j''</sub> सूचकांकों के समुच्चय को इस प्रकार निरूपित करें कि Y<sub>''i''</sub>= टी<sub>''j''</sub> और सी<sub>''i''</sub>= 1, और चलो एम<sub>''j''</sub>= |एच<sub>''j''</sub>|. एफ्रॉन का दृष्टिकोण निम्नलिखित आंशिक संभावना को अधिकतम करता है।
उन स्थितियों को संभालने के लिए कई दृष्टिकोण प्रस्तावित किए गए है जिनमें समय डेटा में संबंध होता है। ब्रेस्लो की विधि उस दृष्टिकोण का वर्णन करती है जिसमें ऊपर वर्णित प्रक्रिया को असंशोधित रूप से उपयोग किया जाता है, तब भी जब संबंध उपस्थित होता है। एक वैकल्पिक दृष्टिकोण जिसे बेहतर परिणाम देने वाला माना जाता है वह एफ्रॉन की विधि होती है।<ref>{{cite journal | last=Efron | first=Bradley | year=1974 | journal=Journal of the American Statistical Association | pages=557–565 | volume=72 | title=सेंसर किए गए डेटा के लिए कॉक्स के संभावना फ़ंक्शन की दक्षता| issue=359 | jstor=2286217 | doi = 10.1080/01621459.1977.10480613 }}</ref> टी<sub>''j''</sub> अद्वितीय समय को निरूपित करता है, मान लेते है H<sub>''j''</sub> सूचकांकों के समुच्चय को इस प्रकार निरूपित करता कि Y<sub>''i''</sub>= टी<sub>''j''</sub> और सी<sub>''i''</sub>= 1, और एम<sub>''j''</sub>= |एच<sub>''j''</sub>| एफ्रॉन का दृष्टिकोण निम्नलिखित आंशिक संभावना को अधिकतम करता है।


::<math>
::<math>
Line 128: Line 128:
\ell(\beta) = \sum_j \left(\sum_{i\in H_j} X_i \cdot \beta -\sum_{\ell=0}^{m_j-1}\log\left(\sum_{i:Y_i\ge t_j}\theta_i - \frac{\ell}{m_j} \sum_{i\in H_j}\theta_i\right)\right),
\ell(\beta) = \sum_j \left(\sum_{i\in H_j} X_i \cdot \beta -\sum_{\ell=0}^{m_j-1}\log\left(\sum_{i:Y_i\ge t_j}\theta_i - \frac{\ell}{m_j} \sum_{i\in H_j}\theta_i\right)\right),
</math>
</math>
स्कोर फ़ंक्शन है
अंक फलन है


::<math>
::<math>
\ell^\prime(\beta) = \sum_j \left(\sum_{i\in H_j} X_i -\sum_{\ell=0}^{m_j-1}\frac{\sum_{i:Y_i\ge t_j}\theta_iX_i - \frac{\ell}{m_j}\sum_{i\in H_j}\theta_iX_i}{\sum_{i:Y_i\ge t_j}\theta_i - \frac{\ell}{m_j}\sum_{i\in H_j}\theta_i}\right),
\ell^\prime(\beta) = \sum_j \left(\sum_{i\in H_j} X_i -\sum_{\ell=0}^{m_j-1}\frac{\sum_{i:Y_i\ge t_j}\theta_iX_i - \frac{\ell}{m_j}\sum_{i\in H_j}\theta_iX_i}{\sum_{i:Y_i\ge t_j}\theta_i - \frac{\ell}{m_j}\sum_{i\in H_j}\theta_i}\right),
</math>
</math>
और हेस्सियन मैट्रिक्स है
और हेस्सियन आव्यूह है


::<math>
::<math>
\ell^{\prime\prime}(\beta) = -\sum_j \sum_{\ell=0}^{m_j-1} \left(\frac{\sum_{i:Y_i\ge t_j}\theta_iX_iX_i^\prime - \frac{\ell}{m_j}\sum_{i\in H_j}\theta_iX_iX_i^\prime}{\phi_{j,\ell,m_j}} - \frac{Z_{j,\ell,m_j} Z_{j,\ell,m_j}^\prime}{\phi_{j,\ell,m_j}^2}\right),
\ell^{\prime\prime}(\beta) = -\sum_j \sum_{\ell=0}^{m_j-1} \left(\frac{\sum_{i:Y_i\ge t_j}\theta_iX_iX_i^\prime - \frac{\ell}{m_j}\sum_{i\in H_j}\theta_iX_iX_i^\prime}{\phi_{j,\ell,m_j}} - \frac{Z_{j,\ell,m_j} Z_{j,\ell,m_j}^\prime}{\phi_{j,\ell,m_j}^2}\right),
</math>
</math>
कहाँ
जहाँ


::<math>
::<math>
Line 146: Line 146:
Z_{j,\ell,m_j} = \sum_{i:Y_i\ge t_j}\theta_iX_i - \frac{\ell}{m_j}\sum_{i\in H_j}\theta_iX_i.
Z_{j,\ell,m_j} = \sum_{i:Y_i\ge t_j}\theta_iX_i - \frac{\ell}{m_j}\sum_{i\in H_j}\theta_iX_i.
</math>
</math>
ध्यान दें कि जब एच<sub>''j''</sub> खाली है (समय t के साथ सभी अवलोकन<sub>''j''</sub> सेंसर किया गया है), इन अभिव्यक्तियों में सारांश को शून्य माना जाता है।
ध्यान दें कि जब h<sub>''j''</sub> शून्य है (समय t<sub>''j''</sub> के साथ सभी अवलोकन सेंसर किया गया है), इन अभिव्यक्तियों में सारांश को शून्य माना जाता है।


===उदाहरण===
===उदाहरण===


व्यवहार में कॉक्स मॉडल के कुछ व्यावहारिक उदाहरण नीचे दिए गए हैं।
व्यवहार में कॉक्स नमूने के कुछ व्यावहारिक उदाहरण नीचे दिए गए है।


====एक एकल बाइनरी सहसंयोजक====
====एक एकल द्विआधारी सहसंयोजक====


मान लीजिए कि जिस अंतिम बिंदु में हम रुचि रखते हैं वह सर्जरी के बाद 5 साल की अवलोकन अवधि के दौरान रोगी का जीवित रहना है। मरीज़ 5 साल की अवधि के भीतर मर सकते हैं, और हम रिकॉर्ड करते हैं कि उनकी मृत्यु कब हुई, या मरीज़ 5 साल से अधिक जीवित रह सकते हैं, और हम केवल यह रिकॉर्ड करते हैं कि वे 5 साल से अधिक जीवित रहे। सर्जरी दो अस्पतालों, <i>A</i> या <i>B</i> में से एक में की गई थी, और हम जानना चाहेंगे कि क्या अस्पताल का स्थान 5 साल के जीवित रहने से जुड़ा है। विशेष रूप से, हम अस्पताल बी की तुलना में अस्पताल ए में की गई सर्जरी से खतरे में <i>सापेक्ष</i> वृद्धि (या कमी) जानना चाहेंगे। कुछ (नकली) डेटा प्रदान किया गया है, जहां प्रत्येक पंक्ति एक मरीज का प्रतिनिधित्व करती है: <i>T</i> यह दर्शाता है कि मृत्यु से पहले मरीज़ पर कितने समय तक निगरानी रखी गई थी या 5 साल (महीनों में मापा गया), और <i>C</i> दर्शाता है कि मरीज़ की मृत्यु 5 साल की अवधि में हुई थी या नहीं। हमने अस्पताल को एक बाइनरी वेरिएबल के रूप में एन्कोड किया है जिसे <i>X</i> दर्शाया गया है: 1 यदि अस्पताल <i>A</i> से है, 0 अस्पताल <i>B</i> से है।
मान लेते है कि जिस अंतिम बिंदु में हम रुचि रखते है वह सर्जरी के बाद 5 साल की अवलोकन अवधि के समय में रोगी जीवित रहता है। मरीज़ 5 साल की अवधि के भीतर मर सकता है, और हम रिकॉर्ड करते है कि उनकी मृत्यु कब हुई, या मरीज़ 5 साल से अधिक जीवित रह सकते है, और हम केवल यह रिकॉर्ड करते है कि वे 5 साल से अधिक जीवित रहते है। सर्जरी दो अस्पतालों, <i>A</i> या <i>B</i> में से एक में की गई थी, और हमे यह जानना होता है कि क्या अस्पताल का स्थान 5 साल के जीवित रहने से जुड़ा होता है। विशेष रूप से, हम अस्पताल बी की तुलना में अस्पताल ए में की गई सर्जरी से संकट में <i>सापेक्ष</i> वृद्धि (या कमी) जानना चाहा जाता है। कुछ डेटा प्रदान किया जाता है, जहां प्रत्येक पंक्ति एक मरीज का प्रतिनिधित्व करते है: <i>T</i> यह दर्शाता है कि मृत्यु से पहले मरीज़ पर कितने समय तक निगरानी रखी जाती है या 5 साल (महीनों में मापा गया), और <i>C</i> दर्शाता है कि मरीज़ की मृत्यु 5 साल की अवधि में हुई थी या नहीं हुई थी। हमने अस्पताल को एक द्विआधारी प्रकार के रूप में एन्कोड किया जाता है जिसे <i>X</i> के रूप दर्शाया जाता है: 1 यदि अस्पताल <i>A</i> से है, 0 यदि अस्पताल <i>B</i> से है।


  {| class="wikitable floatright"  
  {| class="wikitable floatright"  
|-
|-
! hospital
! अस्पताल
! X
! एक्स
! T
! टी
! C
! सी
|-
|-
| B
| बी
| 0
| 0
| 60
| 60
| False
| गलत
|-
|-
| B
| बी
| 0
| 0
| 32
| 32
| True
| सही
|-
|-
| B
| बी
| 0
| 0
| 60
| 60
| False
| गलत
|-
|-
| B
| बी
| 0
| 0
| 60
| 60
| False
| गलत
|-
|-
| B
| बी
| 0
| 0
| 60
| 60
| False
| गलत
|-
|-
| A
|
| 1
| 1
| 4
| 4
| True
| सही
|-
|-
| A
|
| 1
| 1
| 18
| 18
| True
| सही
|-
|-
| A
|
| 1
| 1
| 60
| 60
| False
| गलत
|-
|-
| A
|
| 1
| 1
| 9
| 9
| True
| सही
|-
|-
| A
|
| 1
| 1
| 31
| 31
| True
| सही
|-
|-
| A
|
| 1
| 1
| 53
| 53
| True
| सही
|-
|-
| A
|
| 1
| 1
| 17
| 17
| True
| सही
|}
|}
हमारा एकल-सहसंयोजक कॉक्स आनुपातिक मॉडल निम्नलिखित जैसा दिखता है <math>\beta_1</math> अस्पताल के प्रभाव का प्रतिनिधित्व करना, और <i>i</i> प्रत्येक रोगी को अनुक्रमित करना:
हमारा एकल-सहसंयोजक कॉक्स आनुपातिक नमूना निम्नलिखित दिखाता है <math>\beta_1</math> अस्पताल के प्रभाव का प्रतिनिधित्व करता है, और <i>i</i> प्रत्येक रोगी को अनुक्रमित करता है:
::<math>
::<math>
\overbrace{\lambda(t|X_{i})}^{\text{hazard for i}} = \underbrace{\lambda_0(t)}_{\text{baseline} \atop \text{hazard} }\cdot\overbrace{\exp(\beta_1 X_{i})}^{\text{scaling factor for i}}
\overbrace{\lambda(t|X_{i})}^{\text{hazard for i}} = \underbrace{\lambda_0(t)}_{\text{baseline} \atop \text{hazard} }\cdot\overbrace{\exp(\beta_1 X_{i})}^{\text{scaling factor for i}}
</math>
</math>
सांख्यिकीय सॉफ्टवेयर का उपयोग करके हम अनुमान लगा सकते हैं <math>\beta_1</math> 2.12 होना. जोखिम अनुपात इस मान का <i>घातीय</i> है, <math>\exp(\beta_1) = \exp(2.12)</math>. इसका कारण जानने के लिए, विशेष रूप से खतरों के अनुपात पर विचार करें:
सांख्यिकीय सॉफ्टवेयर का उपयोग करके हम अनुमान लगा सकते है <math>\beta_1</math> 2.12 संकट अनुपात इस मान का <i>घातीय</i> होते है, <math>\exp(\beta_1) = \exp(2.12)</math>. इसका कारण जानने के लिए, विशेष रूप से संकटों के अनुपात पर विचार करता है:


::<math>
::<math>
\frac{\lambda(t|X=1)}{\lambda(t|X=0)} = \frac{\cancel{\lambda_0(t)}\exp(\beta_1 \cdot 1)}{\cancel{\lambda_0(t)}\exp(\beta_1 \cdot 0)} = \exp(\beta_1)
\frac{\lambda(t|X=1)}{\lambda(t|X=0)} = \frac{\cancel{\lambda_0(t)}\exp(\beta_1 \cdot 1)}{\cancel{\lambda_0(t)}\exp(\beta_1 \cdot 0)} = \exp(\beta_1)
</math>
</math>
इस प्रकार, अस्पताल ए और अस्पताल बी का जोखिम अनुपात है <math>\exp(2.12) = 8.32 </math>. एक पल के लिए सांख्यिकीय महत्व को अलग रखते हुए, हम यह कहते हुए एक बयान दे सकते हैं कि अस्पताल ए में मरीज़ अस्पताल बी की तुलना में किसी भी कम समय में मृत्यु के 8.3 गुना अधिक जोखिम से जुड़े हैं।
इस प्रकार, अस्पताल ए और अस्पताल बी का संकट अनुपात है <math>\exp(2.12) = 8.32 </math>. एक पल के लिए सांख्यिकीय महत्व को अलग रखते हुए, हम यह कहते हुए एक उत्तर दे सकते है कि अस्पताल ए में मरीज़ अस्पताल बी की तुलना में किसी भी कम समय में मृत्यु के 8.3 गुना अधिक संकट से जुड़ा होता है।


व्याख्या के बारे में उल्लेख करने योग्य महत्वपूर्ण चेतावनियाँ हैं:
व्याख्या के बारे में उल्लेख करने योग्य महत्वपूर्ण संकेत है:


# मृत्यु के 8.3 गुना अधिक जोखिम का मतलब यह नहीं है कि अस्पताल बी में 8.3 गुना अधिक मरीज मरेंगे: उत्तरजीविता विश्लेषण यह जांचता है कि घटनाएं कितनी जल्दी घटित होती हैं, न कि केवल यह कि वे घटित होती हैं या नहीं।
# मृत्यु के 8.3 गुना अधिक संकट का मतलब यह नहीं है कि अस्पताल बी में 8.3 गुना अधिक मरीज मरेंगे: उत्तरजीविता विश्लेषण यह प्राप्त करता है कि घटनाएं कितनी जल्दी घटित होती है, न कि केवल यह कि वे घटित होती है या नहीं होता है।
# अधिक विशेष रूप से, मृत्यु का जोखिम एक दर का माप है। दर में इकाइयाँ होती हैं, जैसे मीटर प्रति सेकंड। हालाँकि, एक <i>सापेक्ष</i> दर नहीं है: एक साइकिल किसी अन्य साइकिल (संदर्भ साइकिल) की तुलना में दो गुना तेज चल सकती है, बिना किसी इकाई को निर्दिष्ट किए। इसी तरह, अस्पताल <i>ए</i> में मृत्यु का जोखिम (मृत्यु की दर) अस्पताल <i>बी</i> (संदर्भ समूह) में मृत्यु के जोखिम की तुलना में 8.3 गुना अधिक (तेज़) है।
# अधिक विशेष रूप से, मृत्यु का संकट एक दर का माप होता है। दर में इकाइयाँ होती है, जैसे मीटर प्रति सेकंड। चूँकि, एक <i>सापेक्ष</i> दर नहीं है: एक साइकिल किसी अन्य साइकिल (संदर्भ साइकिल) की तुलना में दो गुना तेज चल सकती है, बिना किसी इकाई को निर्दिष्ट किए हुए। इसी तरह, अस्पताल <i>ए</i> में मृत्यु का संकट (मृत्यु की दर) अस्पताल <i>बी</i> (संदर्भ समूह) में मृत्यु के संकट की तुलना में 8.3 गुना अधिक (तेज़) होता है।
# व्युत्क्रम मात्रा, <math> 1/8.32 = \frac{1}{\exp(2.12)} = \exp(-2.12) = 0.12</math> अस्पताल <i>A</i> के सापेक्ष अस्पताल <i>B</i> का जोखिम अनुपात है।
# व्युत्क्रम मात्रा, <math> 1/8.32 = \frac{1}{\exp(2.12)} = \exp(-2.12) = 0.12</math> अस्पताल <i>A</i> के सापेक्ष अस्पताल <i>B</i> का संकट अनुपात है।
# हमने अस्पतालों के बीच जीवित रहने की <i>संभावनाओं</i> के बारे में कोई अनुमान नहीं लगाया है। ऐसा इसलिए है क्योंकि हमें आधारभूत जोखिम दर के अनुमान की आवश्यकता होगी, <math>\lambda_0(t)</math>, साथ ही हमारा भी <math>\beta_1</math> अनुमान लगाना। हालाँकि, कॉक्स आनुपातिक खतरा मॉडल का मानक अनुमान सीधे तौर पर आधारभूत खतरे की दर का अनुमान नहीं लगाता है।
# हम अस्पतालों के बीच जीवित रहने की <i>संभावनाओं</i> के बारे में कोई अनुमान नहीं लगा सकते है। ऐसा इसलिए है क्योंकि हमें आधारभूत संकट दर के अनुमान की आवश्यकता होती, <math>\lambda_0(t)</math>, साथ ही हमारा भी <math>\beta_1</math> अनुमान लगाया जाता है। चूँकि, कॉक्स आनुपातिक संकट नमूने का मानक अनुमान सामान्यतः आधारभूत संकट की दर का अनुमान नहीं लगाता है।                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                              
# क्योंकि हमने मॉडल के एकमात्र समय-परिवर्तनशील घटक, आधारभूत जोखिम दर को नजरअंदाज कर दिया है, हमारा अनुमान टाइमस्केल-अपरिवर्तनीय है। उदाहरण के लिए, यदि हमने समय को महीनों के बजाय वर्षों में मापा होता, तो हमें वही अनुमान मिलता।
# क्योंकि हमने नमूना के एकमात्र समय-परिवर्तनशील घटक, आधारभूत संकट दर को देखते नहीं है, हमारा अनुमान समय स्केल-अपरिवर्तनीय होता है। उदाहरण के लिए, यदि हमने समय को महीनों के अतिरिक्त वर्षों में मापा होता, तो हमें वही अनुमान प्राप्त होता है।
# यह कहना आकर्षक है कि अस्पताल ने दोनों समूहों के बीच खतरों में अंतर पैदा किया, लेकिन चूंकि हमारा अध्ययन कारणात्मक नहीं है (अर्थात्, हम नहीं जानते कि डेटा कैसे उत्पन्न हुआ), हम कायम हैं जैसी शब्दावली के साथ संबद्ध।
# यह कहना आकर्षक है कि अस्पताल ने दोनों समूहों के बीच संकटों में अंतर उत्पन्न किया था, लेकिन चूंकि हमारा अध्ययन कारणात्मक नहीं है (अर्थात्, हम नहीं जानते कि डेटा कैसे उत्पन्न हुआ), हम स्वीकृत होते है जैसी शब्दावली के साथ संबद्ध।


====एक एकल सतत सहसंयोजक====
====एक एकल सतत सहसंयोजक====
उत्तरजीविता विश्लेषण के कम पारंपरिक उपयोग के मामले को प्रदर्शित करने के लिए, अगला उदाहरण एक अर्थशास्त्र प्रश्न होगा: कंपनियों के आईपीओ की 1 साल की सालगिरह पर मूल्य-से-आय अनुपात (पी/ई) और उनके भविष्य के अस्तित्व के बीच क्या संबंध है ? अधिक विशेष रूप से, यदि हम किसी कंपनी के जन्म की घटना को उनकी 1-वर्षीय आईपीओ वर्षगांठ मानते हैं, और किसी दिवालियापन, बिक्री, निजी होने आदि को कंपनी की मृत्यु की घटना मानते हैं, तो हम कंपनियों के पी के प्रभाव को जानना चाहेंगे। / उनके जन्म पर ई अनुपात (1-वर्ष आईपीओ वर्षगांठ) उनके जीवित रहने पर।
उत्तरजीविता विश्लेषण के कम पारंपरिक उपयोग के स्थिति को प्रदर्शित करने के लिए, अगला उदाहरण एक अर्थशास्त्र प्रश्न होता है: संगठनों के आईपीओ की 1 साल की सालगिरह पर मूल्य-से-आय अनुपात (पी/ई) और उनके भविष्य के अस्तित्व के बीच क्या संबंध होता है ? अधिक विशेष रूप से, यदि हम किसी संगठन के जन्म की घटना को उनकी 1-वर्षीय आईपीओ वर्षगांठ मानते है, और किसी दिवालियापन, बिक्री, निजी होने आदि को संगठन की मृत्यु की घटना मानते है, तो हम संगठनों के पी के प्रभाव को जानना चाहेंगे।


प्रदान किया गया एक (नकली) डेटासेट है जिसमें 12 कंपनियों के अस्तित्व डेटा हैं: <i>T</i> 1-वर्षीय आईपीओ वर्षगांठ और मृत्यु (या 2022-01-01 की अंतिम तिथि, यदि नहीं किया गया है) के बीच दिनों की संख्या का प्रतिनिधित्व करता है मरना)। <i>सी</i> दर्शाता है कि कंपनी 2022-01-01 से पहले समाप्त हो गई या नहीं। पी/ई कंपनियों की 1-वर्षीय आईपीओ वर्षगांठ पर मूल्य-से-आय अनुपात का प्रतिनिधित्व करता है।
प्रदान किया गया ए डेटासमूह है जिसमें 12 संगठनों के अस्तित्व डेटा होते है: <i>T</i> 1-वर्षीय आईपीओ वर्षगांठ और मृत्यु (या 2022-01-01 की अंतिम तिथि, यदि नहीं किया गया है) के बीच दिनों की संख्या का प्रतिनिधित्व करता है)। <i>सी</i> दर्शाता है कि संगठन 2022-01-01 से पहले समाप्त हो जाती है। पी/ई संगठनों की 1-वर्षीय आईपीओ वर्षगांठ पर मूल्य-से-आय अनुपात का प्रतिनिधित्व करता है।


  {| class="wikitable floatright"  
  {| class="wikitable floatright"  
|-
|-
! Co.
! सीओ.
! 1 year IPO date
! 1 साल की आईपीओ तारीख
! Death date*
! मौत की तिथि*
! C
! सी
! T
! टी
! P/E
! पी/
|-
|-
| 0
| 0
| 2000-11-05
| 2000-11-05
| 2011-01-22
| 2011-01-22
| True
| सही
| 3730
| 3730
| 9.7
| 9.7
Line 267: Line 267:
| 2000-12-01
| 2000-12-01
| 2003-03-30
| 2003-03-30
| True
| सही
| 849
| 849
| 12.0
| 12.0
Line 274: Line 274:
| 2011-01-05
| 2011-01-05
| 2012-03-30
| 2012-03-30
| True
| सही
| 450
| 450
| 3.0
| 3.0
Line 281: Line 281:
| 2010-05-29
| 2010-05-29
| 2011-02-22
| 2011-02-22
| True
| सही
| 269
| 269
| 5.3
| 5.3
Line 288: Line 288:
| 2005-06-23
| 2005-06-23
| 2022-01-01
| 2022-01-01
| False
| गलत
| 6036
| 6036
| 10.8
| 10.8
Line 295: Line 295:
| 2000-06-10
| 2000-06-10
| 2002-07-24
| 2002-07-24
| True
| सही
| 774
| 774
| 6.3
| 6.3
Line 302: Line 302:
| 2011-07-11
| 2011-07-11
| 2014-05-01
| 2014-05-01
| True
| सही
| 1025
| 1025
| 11.6
| 11.6
Line 309: Line 309:
| 2007-09-27
| 2007-09-27
| 2022-01-01
| 2022-01-01
| False
| गलत
| 5210
| 5210
| 10.3
| 10.3
Line 316: Line 316:
| 2006-07-30
| 2006-07-30
| 2010-06-03
| 2010-06-03
| True
| सही
| 1404
| 1404
| 8.0
| 8.0
Line 323: Line 323:
| 2000-07-13
| 2000-07-13
| 2001-07-19
| 2001-07-19
| True
| सही
| 371
| 371
| 4.0
| 4.0
Line 330: Line 330:
| 2013-06-10
| 2013-06-10
| 2018-10-10
| 2018-10-10
| True
| सही
| 1948
| 1948
| 5.9
| 5.9
Line 337: Line 337:
| 2011-07-16
| 2011-07-16
| 2014-08-15
| 2014-08-15
| True
| सही
| 1126
| 1126
| 8.3
| 8.3
|}
|}
पिछले उदाहरण के विपरीत जहां एक बाइनरी वैरिएबल था, इस डेटासेट में एक सतत वैरिएबल, पी/ई है। हालाँकि, मॉडल समान दिखता है:
पिछले उदाहरण के विपरीत जहां एक द्विआधारी प्रकार था, इस डेटासमूह में एक सतत प्रकार, पी/ई है। चूँकि, नमूना समान दिखता है:


::<math>
::<math>
\lambda(t|P_{i}) = \lambda_0(t)\cdot\exp(\beta_1 P_{i})
\lambda(t|P_{i}) = \lambda_0(t)\cdot\exp(\beta_1 P_{i})
</math>
</math>
कहाँ <math>P_i</math> किसी कंपनी के पी/ई अनुपात का प्रतिनिधित्व करता है। कॉक्स मॉडल के माध्यम से इस डेटासेट को चलाने से अज्ञात के मूल्य का <i>अनुमान</i> उत्पन्न होता है <math>\beta_1</math>, जो -0.34 है। इसलिए, संपूर्ण खतरे का एक अनुमान इस प्रकार है:
जहाँ <math>P_i</math> किसी संगठन के पी/ई अनुपात का प्रतिनिधित्व करता है। कॉक्स नमूने के माध्यम से इस डेटासमूह को चलाने से अज्ञात के मूल्य का <i>अनुमान</i> उत्पन्न होता है <math>\beta_1</math>, जो -0.34 है। इसलिए, संपूर्ण संकट का एक अनुमान इस प्रकार है:


::<math>
::<math>
\lambda(t|P_{i}) = \lambda_0(t)\cdot\exp(-0.34 P_{i})
\lambda(t|P_{i}) = \lambda_0(t)\cdot\exp(-0.34 P_{i})
</math>
</math>
आधारभूत खतरे के बाद से, <math>\lambda_0(t)</math>, अनुमान नहीं लगाया गया था, पूरे खतरे की गणना नहीं की जा सकी है। हालाँकि, कंपनियों <i>i</i> और <i>j</i> के खतरों के अनुपात पर विचार करें:
आधारभूत संकट के बाद से, <math>\lambda_0(t)</math>, यह अनुमान लगाया गया था, कि पूरे संकट की गणना नहीं की जा सकती है। चूँकि, संगठनों <i>i</i> और <i>j</i> के संकटों के अनुपात पर विचार करते है:


::<math>
::<math>
Line 360: Line 360:
\end{align}
\end{align}
</math>
</math>
दाईं ओर सभी शर्तें ज्ञात हैं, इसलिए कंपनियों के बीच खतरों के अनुपात की गणना करना संभव है। चूँकि दाईं ओर कोई समय-निर्भर शब्द नहीं है (सभी पद स्थिर हैं), खतरे एक-दूसरे के लिए <i>आनुपातिक</i> हैं। उदाहरण के लिए, कंपनी 5 से कंपनी 2 का जोखिम अनुपात है <math>\exp(-0.34 (6.3 - 3.0)) = 0.33</math>. इसका मतलब यह है कि, अध्ययन के अंतराल के भीतर, कंपनी 5 की मृत्यु का जोखिम कंपनी 2 की मृत्यु के जोखिम के बराबर 0.33 ≈ 1/3 है।
दाईं ओर सभी स्थितियां ज्ञात होती है, इसलिए संगठनों के बीच संकटों के अनुपात की गणना करना संभव होता है। चूँकि दाईं ओर कोई समय-निर्भर शब्द नहीं होता है (सभी पद स्थिर है), संकट एक-दूसरे के लिए <i>आनुपातिक</i> होते है। उदाहरण के लिए, संगठन 5 से संगठन 2 का संकट अनुपात है <math>\exp(-0.34 (6.3 - 3.0)) = 0.33</math>. इसका मतलब यह है कि, अध्ययन के समय के भीतर, संगठन 5 की मृत्यु का संकट संगठन 2 की मृत्यु के संकट के बराबर 0.33 ≈ 1/3 है।


व्याख्या के बारे में उल्लेख करने योग्य महत्वपूर्ण चेतावनियाँ हैं:
व्याख्या के बारे में उल्लेख करने योग्य महत्वपूर्ण संकेत है:


# <i>खतरा अनुपात</i> मात्रा है <math>\exp(\beta_1)</math>, जो है  <math>\exp(-0.34) = 0.71</math> उपरोक्त उदाहरण में. उपरोक्त अंतिम गणना से, इसकी व्याख्या दो विषयों के बीच खतरों के अनुपात के रूप में होती है जिनके चर एक इकाई से भिन्न होते हैं: यदि <math>P_{i} = P_{j} + 1</math>, तब <math>\exp(\beta_1 (P_{i} - P_{j}) = \exp(\beta_1 (1))</math>. एक इकाई द्वारा भिन्न का चुनाव सुविधा है, क्योंकि यह सटीक रूप से मूल्य का संचार करता है <math>\beta_1</math>.
# <i>संकट अनुपात</i> मात्रा है <math>\exp(\beta_1)</math>, जो है  <math>\exp(-0.34) = 0.71</math> उपरोक्त उदाहरण में. उपरोक्त अंतिम गणना से, इसकी व्याख्या दो विषयों के बीच संकटों के अनुपात के रूप में होती है जिनके चर एक इकाई से भिन्न होते है: यदि <math>P_{i} = P_{j} + 1</math>, तब <math>\exp(\beta_1 (P_{i} - P_{j}) = \exp(\beta_1 (1))</math> एक इकाई त्रुटिहीन रूप से मूल्य का संचार करता है <math>\beta_1</math>.
# बेसलाइन खतरे का प्रतिनिधित्व तब किया जा सकता है जब स्केलिंग फैक्टर 1 हो, यानी। <math>P=0</math>. <पी><math>
# आधारभूत संकट का प्रतिनिधित्व तब किया जा सकता है जब स्केलिंग वर्ग होता है, अर्थात <math>P=0</math>. <पी><math>
\lambda(t|P_{i}=0) = \lambda_0(t)\cdot\exp(-0.34 \cdot 0) = \lambda_0(t)
\lambda(t|P_{i}=0) = \lambda_0(t)\cdot\exp(-0.34 \cdot 0) = \lambda_0(t)
</math></p> क्या हम बेसलाइन खतरे की व्याख्या उस बेसलाइन कंपनी के खतरे के रूप में कर सकते हैं जिसका पी/ई 0 है? आधारभूत विषय के खतरे के रूप में आधारभूत खतरे की यह व्याख्या अपूर्ण है, क्योंकि यह संभव है कि सहसंयोजक 0 होना असंभव है। इस एप्लिकेशन में, 0 का पी/ई अर्थहीन है (इसका मतलब है कि कंपनी का स्टॉक मूल्य 0 है, यानी, वे मर चुके हैं)। खतरे की अधिक उपयुक्त व्याख्या तब होगी जब सभी चर शून्य हों।
</math></p> क्या हम आधारभूत संकट की व्याख्या उस आधारभूत संगठन के संकट के रूप में कर सकते है जिसका पी/ई 0 है? आधारभूत विषय के संकट के रूप में आधारभूत संकट की यह व्याख्या अपूर्ण होती है, क्योंकि यह संभव है कि सहसंयोजक 0 होना असंभव है। इस उपकरण में, 0 का पी/ई अर्थहीन होता है (इसका मतलब है कि संगठन का मूल्य 0 है, अर्थात, वे मर चुके है)। संकट की अधिक उपयुक्त व्याख्या तब होती है जब सभी चर शून्य होते है।
# जैसे मूल्य को समझना और व्याख्या करना आकर्षक है <math>\exp(\beta_1 P_{i})</math> किसी कंपनी के खतरे का प्रतिनिधित्व करने के लिए। हालाँकि, विचार करें कि यह वास्तव में क्या दर्शाता है: <math>\exp(\beta_1 P_{i}) = \exp(\beta_1 (P_{i}-0))= \frac{\exp(\beta_1 P_{i})}{\exp(\beta_1 0)} = \frac{\lambda(t|P_{i})}{\lambda(t|0)}</math>. यहां खतरों का अनुपात स्पष्ट रूप से है, कंपनी के खतरे की तुलना 0 पी/ई वाली एक काल्पनिक बेसलाइन कंपनी से की जाती है। हालाँकि, जैसा कि ऊपर बताया गया है, इस एप्लिकेशन में 0 का पी/ई असंभव है <math>\exp(\beta_1 P_{i})</math> इस उदाहरण में अर्थहीन है. हालाँकि, संभावित खतरों के बीच अनुपात सार्थक है।
# जैसे मूल्य को समझना और व्याख्या करना आकर्षक होता है <math>\exp(\beta_1 P_{i})</math> किसी संगठन के संकट का प्रतिनिधित्व करने के लिए होता है। चूँकि, विचार करते है कि यह वास्तव में क्या दर्शाता है: <math>\exp(\beta_1 P_{i}) = \exp(\beta_1 (P_{i}-0))= \frac{\exp(\beta_1 P_{i})}{\exp(\beta_1 0)} = \frac{\lambda(t|P_{i})}{\lambda(t|0)}</math>. यहां संकटों का अनुपात स्पष्ट रूप से होता है, संगठन के संकट की तुलना 0 पी/ई वाली एक काल्पनिक आधारभूत संगठन से की जाती है। चूँकि, जैसा कि ऊपर बताया गया है, इस उपकरण में 0 का पी/ई असंभव होता है <math>\exp(\beta_1 P_{i})</math> इस उदाहरण में अर्थहीन होते है. चूँकि, संभावित संकटों के बीच अनुपात सार्थक होता है।


==समय-परिवर्तनशील भविष्यवक्ता और गुणांक==
==समय-परिवर्तनशील भविष्यवक्ता और गुणांक==
समय पर निर्भर चर, समय पर निर्भर स्तर और प्रति विषय कई घटनाओं के विस्तार को एंडरसन और गिल की गिनती प्रक्रिया सूत्रीकरण द्वारा शामिल किया जा सकता है।<ref>
समय पर निर्भर चर, समय पर निर्भर स्तर और प्रति विषय कई घटनाओं के विस्तार को एंडरसन और गिल की गिनती प्रक्रिया सूत्रीकरण द्वारा सम्मलित किया जा सकता है।<ref>
{{cite journal
{{cite journal
| doi = 10.1214/aos/1176345976
| doi = 10.1214/aos/1176345976
Line 377: Line 377:
| year = 1982
| year = 1982
| title = Cox's regression model for counting processes, a large sample study.
| title = Cox's regression model for counting processes, a large sample study.
| journal = Annals of Statistics |volume = 10 | issue=4 | pages = 1100–1120 | jstor=2240714| doi-access = free}}</ref> समय-भिन्न प्रतिगामी के साथ जोखिम मॉडल के उपयोग का एक उदाहरण बेरोजगारी मंत्रों पर बेरोजगारी बीमा के प्रभाव का अनुमान लगाना है।<ref>{{cite journal |last=Meyer |first=B. D. |year=1990 |title=बेरोजगारी बीमा और बेरोजगारी मंत्र|journal=Econometrica |volume=58 |issue=4 |pages=757–782 |jstor=2938349 |doi=10.2307/2938349 |url=http://www.nber.org/papers/w2546.pdf }}</ref><ref>{{cite journal |last=Bover |first=O. |first2=M. |last2=Arellano |author-link2=Manuel Arellano |first3=S. |last3=Bentolila |year=2002 |title=बेरोजगारी की अवधि, लाभ की अवधि और व्यापार चक्र|journal=The Economic Journal |volume=112 |issue=479 |pages=223–265 |doi=10.1111/1468-0297.00034 |url=http://www.bde.es/f/webbde/Secciones/Publicaciones/PublicacionesSeriadas/EstudiosEconomicos/azul57e.pdf }}</ref>
| journal = Annals of Statistics |volume = 10 | issue=4 | pages = 1100–1120 | jstor=2240714| doi-access = free}}</ref> समय-भिन्न प्रतिगामी के साथ संकट नमूने का उपयोग एक उदाहरण बेरोजगारी बीमा के प्रभाव का अनुमान लगाना होता है।<ref>{{cite journal |last=Meyer |first=B. D. |year=1990 |title=बेरोजगारी बीमा और बेरोजगारी मंत्र|journal=Econometrica |volume=58 |issue=4 |pages=757–782 |jstor=2938349 |doi=10.2307/2938349 |url=http://www.nber.org/papers/w2546.pdf }}</ref><ref>{{cite journal |last=Bover |first=O. |first2=M. |last2=Arellano |author-link2=Manuel Arellano |first3=S. |last3=Bentolila |year=2002 |title=बेरोजगारी की अवधि, लाभ की अवधि और व्यापार चक्र|journal=The Economic Journal |volume=112 |issue=479 |pages=223–265 |doi=10.1111/1468-0297.00034 |url=http://www.bde.es/f/webbde/Secciones/Publicaciones/PublicacionesSeriadas/EstudiosEconomicos/azul57e.pdf }}</ref>
समय-भिन्न सहसंयोजकों (यानी, भविष्यवक्ताओं) की अनुमति देने के अलावा, कॉक्स मॉडल को समय-भिन्न गुणांकों के लिए भी सामान्यीकृत किया जा सकता है। अर्थात्, उपचार का आनुपातिक प्रभाव समय के साथ भिन्न हो सकता है; जैसे यदि कोई दवा रुग्णता के एक महीने के भीतर दी जाए तो वह बहुत प्रभावी हो सकती है, और समय बीतने के साथ कम प्रभावी हो जाती है। तब गुणांक के समय (स्थिरता) के साथ कोई परिवर्तन नहीं होने की परिकल्पना का परीक्षण किया जा सकता है। विवरण और सॉफ़्टवेयर (आर (प्रोग्रामिंग भाषा)#पैकेज) मार्टिनुसेन और शेइक (2006) में उपलब्ध हैं।<ref>{{cite book |last=Martinussen |last2=Scheike |year=2006 |title=उत्तरजीविता डेटा के लिए गतिशील प्रतिगमन मॉडल|publisher=Springer |isbn=978-0-387-20274-7 |doi=10.1007/0-387-33960-4 }}</ref><ref>{{cite web |title=timereg: Flexible Regression Models for Survival Data |work=CRAN |url=https://cran.r-project.org/web/packages/timereg/index.html }}</ref> इस संदर्भ में, यह भी उल्लेख किया जा सकता है कि योगात्मक खतरों का उपयोग करके सहसंयोजकों के प्रभाव को निर्दिष्ट करना सैद्धांतिक रूप से संभव है,<ref>{{cite conference
 
समय-भिन्न सहसंयोजकों (अर्थात, भविष्यवक्ताओं) की अनुमति देने के अतिरिक्त, कॉक्स नमूने को समय-भिन्न गुणांकों के लिए भी सामान्यीकृत किया जा सकता है। अर्थात्, उपचार का आनुपातिक प्रभाव समय के साथ भिन्न हो सकता है, जैसे यदि कोई दवा रुग्णता के एक महीने के भीतर दी जाए तो वह बहुत प्रभावी हो सकती है, और समय बीतने के साथ कम प्रभावी हो जाती है। तब गुणांक के समय (स्थिरता) के साथ कोई परिवर्तन नहीं होने की परिकल्पना का परीक्षण किया जा सकता है। विवरण और सॉफ्टवेयर (आर (प्रोग्रामिंग भाषा)पैकेज) मार्टिनुसेन और शेइक (2006) में उपलब्ध है।<ref>{{cite book |last=Martinussen |last2=Scheike |year=2006 |title=उत्तरजीविता डेटा के लिए गतिशील प्रतिगमन मॉडल|publisher=Springer |isbn=978-0-387-20274-7 |doi=10.1007/0-387-33960-4 }}</ref><ref>{{cite web |title=timereg: Flexible Regression Models for Survival Data |work=CRAN |url=https://cran.r-project.org/web/packages/timereg/index.html }}</ref>
 
इस संदर्भ में, यह भी उल्लेख किया जा सकता है कि योगात्मक संकटों का उपयोग करके सहसंयोजकों के प्रभाव को निर्दिष्ट करना सैद्धांतिक रूप से संभव होता है,<ref>{{cite conference
| last = Cox |first = D. R. |author-link= David Cox (statistician)
| last = Cox |first = D. R. |author-link= David Cox (statistician)
| title = Some remarks on the analysis of survival data
| title = Some remarks on the analysis of survival data
| conference = the First Seattle Symposium of Biostatistics: Survival Analysis
| conference = the First Seattle Symposium of Biostatistics: Survival Analysis
| year = 1997 }}</ref> यानी निर्दिष्ट करना
| year = 1997 }}</ref> अर्थात निर्दिष्ट करता है
::<math>
::<math>
\lambda(t|X_i) = \lambda_0(t) + \beta_1X_{i1} + \cdots + \beta_pX_{ip} = \lambda_0(t) + X_i \cdot \beta.
\lambda(t|X_i) = \lambda_0(t) + \beta_1X_{i1} + \cdots + \beta_pX_{ip} = \lambda_0(t) + X_i \cdot \beta.
</math>
</math>
यदि ऐसे योगात्मक खतरों के मॉडल का उपयोग उन स्थितियों में किया जाता है जहां (लॉग-)संभावना अधिकतमकरण उद्देश्य है, तो इसे प्रतिबंधित करने के लिए सावधानी बरतनी चाहिए <math>\lambda(t\mid X_i)</math> गैर-नकारात्मक मानों के लिए. शायद इसी जटिलता के परिणामस्वरूप ऐसे मॉडल कम ही देखने को मिलते हैं। यदि उद्देश्य न्यूनतम वर्ग है तो गैर-नकारात्मकता प्रतिबंध की सख्ती से आवश्यकता नहीं है।
यदि ऐसे योगात्मक संकटों के नमूने का उपयोग उन स्थितियों में किया जाता है जहां (लॉग-)संभावना अधिकतमकरण उद्देश्य होते है, तो इसे सावधानी से प्रतिबंधित करा जाता है <math>\lambda(t\mid X_i)</math> गैर-ऋणात्मक मानों के लिए संभवतः इसी जटिलता के परिणामस्वरूप ऐसे नमूने कम ही देखने को मिलते है। यदि उद्देश्य न्यूनतम वर्ग है तो गैर-ऋणात्मक प्रतिबंध की आवश्यकता नहीं होती है।


==बेसलाइन खतरा फ़ंक्शन निर्दिष्ट करना==
==आधारभूत संकट फलन निर्दिष्ट करना==


कॉक्स मॉडल को विशिष्ट बनाया जा सकता है यदि यह मानने का कोई कारण मौजूद है कि आधारभूत खतरा एक विशेष रूप का अनुसरण करता है। इस मामले में, आधारभूत खतरा <math>\lambda_0(t)</math> किसी दिए गए फ़ंक्शन द्वारा प्रतिस्थापित किया जाता है। उदाहरण के लिए, जोखिम फ़ंक्शन को वेइबुल वितरण#संचयी वितरण फ़ंक्शन मानने से वेइबुल आनुपातिक ख़तरा मॉडल मिलता है।
कॉक्स नमूने को विशिष्ट बनाया जा सकता है यदि यह मानने का कोई कारण उपस्थित होता है कि आधारभूत संकट एक विशेष रूप का अनुसरण करता है। इस स्थिति में, आधारभूत संकट <math>\lambda_0(t)</math> किसी दिए गए फलन द्वारा प्रतिस्थापित किया जाता है। उदाहरण के लिए, संकट फलन को वेइबुल वितरण संचयी वितरण फलन मानने से वेइबुल आनुपातिक संकट नमूना प्राप्त होता है।


संयोग से, वेइबुल बेसलाइन खतरे का उपयोग करना एकमात्र परिस्थिति है जिसके तहत मॉडल आनुपातिक खतरों और त्वरित विफलता समय मॉडल मॉडल दोनों को संतुष्ट करता है।
संयोग से, वेइबुल आधारभूत संकट का उपयोग नमूने आनुपातिक संकटों और त्वरित विफलता समय नमूने दोनों को संतुष्ट करता है।


सामान्य शब्द पैरामीट्रिक आनुपातिक खतरा मॉडल का उपयोग आनुपातिक खतरा मॉडल का वर्णन करने के लिए किया जा सकता है जिसमें खतरा कार्य निर्दिष्ट है। इसके विपरीत कॉक्स आनुपातिक ख़तरे मॉडल को कभी-कभी [[अर्धपैरामीट्रिक मॉडल]] कहा जाता है।
सामान्य शब्द प्राचलिक आनुपातिक संकट नमूने का उपयोग आनुपातिक संकट नमूने का वर्णन करने के लिए किया जा सकता है जिसमें संकट कार्य निर्दिष्ट होते है। इसके विपरीत कॉक्स आनुपातिक संकट नमूने को कभी-कभी [[अर्धपैरामीट्रिक मॉडल|अर्धप्राचलिक नमूना]] कहा जाता है।


कुछ लेखक अंतर्निहित खतरे के कार्य को निर्दिष्ट करते समय भी कॉक्स आनुपातिक खतरा मॉडल शब्द का उपयोग करते हैं,<ref>{{cite journal |last=Bender |first=R. |last2=Augustin |first2=T. |last3=Blettner |first3=M. |year=2006 |title=कॉक्स आनुपातिक खतरों के मॉडल का अनुकरण करने के लिए जीवित रहने का समय उत्पन्न करना|journal=[[Statistics in Medicine (journal)|Statistics in Medicine]] |volume=24 |issue= 11|pages=1713–1723 |doi=10.1002/sim.2369 |pmid=16680804 }}</ref> डेविड कॉक्स को पूरे क्षेत्र का ऋण स्वीकार करने के लिए।
कुछ लेखक अंतर्निहित संकट के कार्य को निर्दिष्ट करते समय भी कॉक्स आनुपातिक संकट नमूने शब्द का उपयोग करते है।<ref>{{cite journal |last=Bender |first=R. |last2=Augustin |first2=T. |last3=Blettner |first3=M. |year=2006 |title=कॉक्स आनुपातिक खतरों के मॉडल का अनुकरण करने के लिए जीवित रहने का समय उत्पन्न करना|journal=[[Statistics in Medicine (journal)|Statistics in Medicine]] |volume=24 |issue= 11|pages=1713–1723 |doi=10.1002/sim.2369 |pmid=16680804 }}</ref>


कॉक्स रिग्रेशन मॉडल (आनुपातिक खतरों को छोड़ना) शब्द का उपयोग कभी-कभी समय-निर्भर कारकों को शामिल करने के लिए कॉक्स मॉडल के विस्तार का वर्णन करने के लिए किया जाता है। हालाँकि, यह उपयोग संभावित रूप से अस्पष्ट है क्योंकि कॉक्स आनुपातिक खतरे मॉडल को स्वयं एक प्रतिगमन मॉडल के रूप में वर्णित किया जा सकता है।
कॉक्स प्रतिगमन नमूना (आनुपातिक संकटों को छोड़ना) शब्द का उपयोग कभी-कभी समय-निर्भर कारकों को सम्मलित करने के लिए कॉक्स नमूना के विस्तार का वर्णन करने के लिए किया जाता है। चूँकि, यह उपयोग संभावित रूप से अस्पष्ट होते है क्योंकि कॉक्स आनुपातिक संकट नमूना स्वयं एक प्रतिगमन नमूने के रूप में वर्णित किया जा सकता है।


==पॉइसन मॉडल से संबंध==
==पॉइसन नमूना से संबंध==


आनुपातिक खतरों के मॉडल और [[पॉइसन प्रतिगमन]] मॉडल के बीच एक संबंध है जिसे कभी-कभी पॉइसन प्रतिगमन के लिए सॉफ़्टवेयर में अनुमानित आनुपातिक खतरों के मॉडल को फिट करने के लिए उपयोग किया जाता है। ऐसा करने का सामान्य कारण यह है कि गणना बहुत तेज होती है। धीमे कंप्यूटरों के दिनों में यह अधिक महत्वपूर्ण था लेकिन विशेष रूप से बड़े डेटा सेट या जटिल समस्याओं के लिए अभी भी उपयोगी हो सकता है। लैयर्ड और ओलिवियर (1981)<ref>
आनुपातिक संकटों के नमूने और [[पॉइसन प्रतिगमन]] नमूने के बीच एक संबंध होता है जिसे कभी-कभी पॉइसन प्रतिगमन के लिए सॉफ़्टवेयर में अनुमानित आनुपातिक संकटों के नमूना को उपयुक्त करने के लिए उपयोग किया जाता है। ऐसा करने का सामान्य कारण यह है कि गणना बहुत तेज होती है। धीमे कंप्यूटरों के दिनों में यह अधिक महत्वपूर्ण था लेकिन विशेष रूप से बड़े डेटा समूह या जटिल समस्याओं के लिए अभी भी उपयोगी हो सकता है। लैयर्ड और ओलिवियर (1981)<ref>
{{cite journal|doi=10.2307/2287816|author=Nan Laird and Donald Olivier
{{cite journal|doi=10.2307/2287816|author=Nan Laird and Donald Olivier
|title=Covariance Analysis of Censored Survival Data Using Log-Linear Analysis Techniques
|title=Covariance Analysis of Censored Survival Data Using Log-Linear Analysis Techniques
|journal=Journal of the American Statistical Association
|journal=Journal of the American Statistical Association
|volume=76|issue=374|year=1981|pages=231–240 | jstor=2287816}}</ref> गणितीय विवरण प्रदान करें. वे ध्यान देते हैं, हम यह नहीं मानते हैं कि [पॉइसन मॉडल] सत्य है, लेकिन इसे केवल संभावना प्राप्त करने के लिए एक उपकरण के रूप में उपयोग करते हैं। मैक्कलघ और नेल्डर का<ref>
|volume=76|issue=374|year=1981|pages=231–240 | jstor=2287816}}</ref> गणितीय विवरण प्रदान करते है वे ध्यान देते है, हम यह नहीं मानते है कि [पॉइसन नमूना] सत्य है, लेकिन इसे केवल संभावना प्राप्त करने के लिए एक उपकरण के रूप में उपयोग करते है। मैक्कलघ और नेल्डर का<ref>
{{cite book|author=P. McCullagh and J. A. Nelder
{{cite book|author=P. McCullagh and J. A. Nelder
|edition=Second|year=2000
|edition=Second|year=2000
Line 413: Line 416:
|chapter=Chapter 13: Models for Survival Data
|chapter=Chapter 13: Models for Survival Data
|isbn=978-0-412-31760-6}} (Second edition 1989; first CRC reprint 1999.)
|isbn=978-0-412-31760-6}} (Second edition 1989; first CRC reprint 1999.)
</ref> [[सामान्यीकृत रैखिक मॉडल]] पर पुस्तक में आनुपातिक खतरों के मॉडल को सामान्यीकृत रैखिक मॉडल में परिवर्तित करने पर एक अध्याय है।
</ref> [[सामान्यीकृत रैखिक मॉडल|सामान्यीकृत रैखिक नमूने]] पर पुस्तक में आनुपातिक संकटों के नमूने को सामान्यीकृत रैखिक नमूने में परिवर्तित करने पर एक अध्याय है।


==उच्च-आयामी सेटअप के अंतर्गत==
==उच्च-आयामी समूह के अंतर्गत==


उच्च-आयाम में, जब नमूना आकार n की तुलना में सहसंयोजक p की संख्या बड़ी होती है, तो [[लैस्सो (सांख्यिकी)]] शास्त्रीय मॉडल-चयन रणनीतियों में से एक है। तिबशिरानी (1997) ने आनुपातिक खतरा प्रतिगमन पैरामीटर के लिए एक लासो प्रक्रिया प्रस्तावित की है।<ref>{{cite journal |first=R. |last=Tibshirani |year=1997 |title=कॉक्स मॉडल में चर चयन के लिए लैस्सो विधि|journal=[[Statistics in Medicine (journal)|Statistics in Medicine]] |volume=16 |issue=4 |pages=385–395 |doi=10.1002/(SICI)1097-0258(19970228)16:4<385::AID-SIM380>3.0.CO;2-3 |citeseerx=10.1.1.411.8024 }}</ref> प्रतिगमन पैरामीटर β के लैस्सो अनुमानक को L1-मानदंड|L के तहत कॉक्स आंशिक लॉग-संभावना के विपरीत के न्यूनतम के रूप में परिभाषित किया गया है।<sup>1</sup>-मानक प्रकार की बाधा।
उच्च-आयाम में, जब नमूना आकार n की तुलना में सहसंयोजक p की संख्या बड़ी होती है, तो [[लैस्सो (सांख्यिकी)]] मौलिक नमूना-चयन रणनीतियों में से एक होता है। (1997) में आनुपातिक संकट प्रतिगमन प्राचल के लिए एक लासो प्रक्रिया प्रस्तावित की गयी थी।<ref>{{cite journal |first=R. |last=Tibshirani |year=1997 |title=कॉक्स मॉडल में चर चयन के लिए लैस्सो विधि|journal=[[Statistics in Medicine (journal)|Statistics in Medicine]] |volume=16 |issue=4 |pages=385–395 |doi=10.1002/(SICI)1097-0258(19970228)16:4<385::AID-SIM380>3.0.CO;2-3 |citeseerx=10.1.1.411.8024 }}</ref> प्रतिगमन प्राचल β के लैस्सो अनुमानक को L1-मानदंड L के अनुसार कॉक्स आंशिक लॉग-संभावना के विपरीत के न्यूनतम के रूप में परिभाषित किया गया है।<sup>1</sup>


::<math>
::<math>
Line 424: Line 427:
,
,
</math>
</math>
इस विषय पर हाल ही में सैद्धांतिक प्रगति हुई है।<ref name="Bradic et al. (2012)">{{cite journal |first=J. |last=Bradić |first2=J. |last2=Fan|first3=J. |last3=Jiang|year=2011 |title=एनपी-आयामीता के साथ कॉक्स के आनुपातिक खतरों के मॉडल के लिए नियमितीकरण|journal=[[Annals of Statistics]] |volume=39 |issue=6 |pages=3092–3120 |doi=10.1214/11-AOS911 |pmid=23066171 |pmc=3468162 |arxiv=1010.5233 }}</ref><रेफ नाम = ब्रैडिक
इस विषय पर हाल ही में सैद्धांतिक प्रगति हुई है।<ref name="Bradic et al. (2012)">{{cite journal |first=J. |last=Bradić |first2=J. |last2=Fan|first3=J. |last3=Jiang|year=2011 |title=एनपी-आयामीता के साथ कॉक्स के आनुपातिक खतरों के मॉडल के लिए नियमितीकरण|journal=[[Annals of Statistics]] |volume=39 |issue=6 |pages=3092–3120 |doi=10.1214/11-AOS911 |pmid=23066171 |pmc=3468162 |arxiv=1010.5233 }}</ref><ref name="Kong and Nan (2012)">{{cite journal |first=S. |last=Kong |first2=B. |last2=Nan  |title=लैस्सो के माध्यम से उच्च-आयामी कॉक्स प्रतिगमन के लिए गैर-स्पर्शोन्मुख दैवज्ञ असमानताएँ|journal=[[Statistica Sinica]] |year=2014 |volume=24 |issue=1 |pages=25–42 |doi=10.5705/ss.2012.240 |pmid=24516328 |pmc=3916829 |arxiv=1204.1992 }}</ref><ref name="Huang et al. (2013)">{{cite journal |first=J. |last=Huang |first2=T. |last2=Sun|first3=Z. |last3=Ying|first4=Y. |last4=Yu |first5= C. H. |last5=Zhang |year=2011 |title=कॉक्स मॉडल में लैस्सो के लिए ओरेकल असमानताएँ|journal=The Annals of Statistics |volume=41 |issue=3 |pages=1142–1165 |doi=10.1214/13-AOS1098|pmid=24086091 |pmc=3786146 |arxiv=1306.4847 }}</ref>
और गाना (2012) >{{cite journal |first=J. |last=Bradić |first2=R. |last2=Song  |title=नॉनपैरामीट्रिक कॉक्स मॉडल में संरचित अनुमान|journal=[[Electronic Journal of Statistics]] |volume=9 |issue=1 |year=2015 |pages=492–534 |doi=10.1214/15-EJS1004 |arxiv=1207.4510 }}</ref><ref name="Kong and Nan (2012)">{{cite journal |first=S. |last=Kong |first2=B. |last2=Nan  |title=लैस्सो के माध्यम से उच्च-आयामी कॉक्स प्रतिगमन के लिए गैर-स्पर्शोन्मुख दैवज्ञ असमानताएँ|journal=[[Statistica Sinica]] |year=2014 |volume=24 |issue=1 |pages=25–42 |doi=10.5705/ss.2012.240 |pmid=24516328 |pmc=3916829 |arxiv=1204.1992 }}</ref><ref name="Huang et al. (2013)">{{cite journal |first=J. |last=Huang |first2=T. |last2=Sun|first3=Z. |last3=Ying|first4=Y. |last4=Yu |first5= C. H. |last5=Zhang |year=2011 |title=कॉक्स मॉडल में लैस्सो के लिए ओरेकल असमानताएँ|journal=The Annals of Statistics |volume=41 |issue=3 |pages=1142–1165 |doi=10.1214/13-AOS1098|pmid=24086091 |pmc=3786146 |arxiv=1306.4847 }}</ref>
 
 
==सॉफ़्टवेयर कार्यान्वयन==
==सॉफ़्टवेयर कार्यान्वयन==
* <b>गणित</b>: <code>CoxModelFit</code> समारोह।<ref>{{cite web |title=कॉक्समॉडलफिट|url=https://reference.wolfram.com/language/ref/CoxModelFit.html |website=Wolfram Language & System Documentation Center}}</ref>
* <b>गणित</b>: <code>CoxModelFit</code> फलन।<ref>{{cite web |title=कॉक्समॉडलफिट|url=https://reference.wolfram.com/language/ref/CoxModelFit.html |website=Wolfram Language & System Documentation Center}}</ref>
* <b>आर</b>: <code>coxph()</code> फ़ंक्शन, <b>उत्तरजीविता</b> पैकेज में स्थित है।
* <b>आर</b>: <code>coxph()</code> फलन, <b>उत्तरजीविता</b> पैकेज में स्थित है।
* <b>एसएएस</b>: <code>phreg</code> प्रक्रिया
* <b>एसएएस</b>: <code>phreg</code> प्रक्रिया
* <b>स्टेटा</b>: <code>stcox</code> आज्ञा
* <b>स्टेटा</b>: <code>stcox</code> आज्ञा
* <b>पायथन</b>: <code>CoxPHFitter</code> <b>लाइफलाइन्स</b> लाइब्रेरी में स्थित है। <code>phreg</code> स्टेटमॉडल लाइब्रेरी में।
* <b>पायथन</b>: <code>CoxPHFitter</code> <b>लाइफलाइन्स</b> लाइब्रेरी में स्थित है। <code>phreg</code> स्टेटनमूना लाइब्रेरी में।
* <b>एसपीएसएस</b>: <b>कॉक्स रिग्रेशन</b> के अंतर्गत उपलब्ध है।
* <b>एसपीएसएस</b>: <b>कॉक्स रिग्रेशन</b> के अंतर्गत उपलब्ध है।
* <b>मतलब</b>: <code>coxphfit</code> समारोह
* <b>मतलब</b>: <code>coxphfit</code> फलन
* <b>जूलिया</b>: <b>Survival.jl</b> लाइब्रेरी में उपलब्ध है।
* <b>जूलिया</b>: <b>Survival.jl</b> लाइब्रेरी में उपलब्ध है।
* <b>जेएमपी</b>: <b>फिट आनुपातिक खतरों</b> प्लेटफॉर्म में उपलब्ध है।
* <b>जेएमपी</b>: <b>फिट आनुपातिक संकटों</b> प्लेटफॉर्म में उपलब्ध है।
* <b>प्रिज्म</b>: सर्वाइवल एनालिसिस और मल्टीपल वेरिएबल एनालिसिस में उपलब्ध
* <b>प्रिज्म</b>: उत्तरजीविता विश्लेषण और बहु प्रकार विश्लेषण में उपलब्ध


==यह भी देखें==
==यह भी देखें==
{{Portal|Mathematics}}
{{Portal|Mathematics}}
* त्वरित विफलता समय मॉडल
* त्वरित विफलता समय नमूना
* [[दस में से एक नियम]]
* [[दस में से एक नियम]]
* [[वेइबुल वितरण]]
* [[वेइबुल वितरण]]

Revision as of 02:07, 14 July 2023

आनुपातिक संकट नमूना सांख्यिकी में उत्तरजीविता विश्लेषण का एक वर्ग होता है। उत्तरजीविता नमूना किसी घटना के घटित होने से पहले बीतने वाले समय को एक या अधिक सहसंयोजकों से जोड़ता है। आनुपातिक संकटों के नमूने में, सहसंयोजक में एक इकाई वृद्धि का अनूठा प्रभाव संकट की दर के संबंध में गुणक होता है। उदाहरण के लिए, दवा लेने से स्ट्रोक होने की संकट दर आधी हो सकती है, या, जिस सामग्री से निर्मित घटक का निर्माण किया जाता है उसे बदलने से विफलता की संकट दर दोगुनी हो सकती है। अन्य प्रकार के उत्तरजीविता नमूना जैसे त्वरित विफलता समय नमूना आनुपातिक संकटों को प्रदर्शित नहीं करते है। त्वरित विफलता समय नमूना उस स्थिति का वर्णन करता है जहां किसी घटना का जैविक या यांत्रिक जीवन इतिहास त्वरित (या धीमा) हो जाता है।ka

पृष्ठभूमि

उत्तरजीविता नमूना को दो भागों से मिलकर देखा जा सकता है: अंतर्निहित आधारभूत संकट फलन, जिसे अधिकांशतः दर्शाया जाता है , यह वर्णन करते हुए कि सहसंयोजकों के आधारभूत स्तरों पर प्रति समय इकाई घटना का संकट समय के साथ कैसे बदलता है, और प्रभाव प्राचल, यह वर्णन करते है कि व्याख्यात्मक सहसंयोजकों की प्रतिक्रिया में संकट कैसे भिन्न होता है। एक विशिष्ट चिकित्सा उदाहरण में परिवर्तनशीलता को कम करने और भ्रम को नियंत्रित करने के लिए सहसंयोजक जैसे उपचार, साथ ही रोगी की विशेषताएं जैसे अध्ययन की प्रारंभ में उम्र, लिंग और अध्ययन की प्रारंभ में अन्य बीमारियों की उपस्थिति सम्मलित होती है।

आनुपातिक संकटों की स्थिति[1] बताता है कि सहसंयोजक संकट से गुणात्मक रूप से संबंधित है। स्थिर गुणांक के सबसे सरल स्थिति में, उदाहरण के लिए, किसी दवा के साथ उपचार, किसी भी समय किसी विषय के संकट को आधा कर सकता है , जबकि आधारभूत संकट भिन्न हो सकता है। चूँकि, ध्यान दें कि इससे विषय का जीवनकाल दोगुना नहीं होता है, जीवनकाल पर सहसंयोजकों का त्रुटिहीन प्रभाव किस प्रकार पर निर्भर करता है . यह सहसंयोजक द्विआधारी भविष्यवक्ताओं तक ही सीमित नहीं होता है, सतत सहसंयोजक के स्थिति में , सामान्यतः यह माना जाता है कि संकट तेजी से प्रतिक्रिया करता है, प्रत्येक इकाई में वृद्धि होती है इसके परिणामस्वरूप संकट आनुपातिक रूप से बढ़ जाता है।

कॉक्स नमूना

परिचय

डेविड कॉक्स (सांख्यिकीविद्) ने देखा कि यदि आनुपातिक संकटों की धारणा स्वीकृत है (या, स्वीकृत मानी जाती है) तो प्रभाव प्राचल का अनुमान लगाना संभव होता है, जिसे दर्शाया जाता है नीचे, पूर्ण संकट फलन पर कोई विचार किए बिना उत्तरजीविता डेटा के इस दृष्टिकोण को कॉक्स आनुपातिक संकट नमूना का अनुप्रयोग कहा जाता है,[2] कभी-कभी इसे कॉक्स नमूना या आनुपातिक संकट नमूना के रूप में संक्षिप्त किया जाता है।[3] चूँकि, कॉक्स ने यह भी कहा कि आनुपातिक संकटों की धारणा की जैविक व्याख्या अधिक कठिन हो सकती है।[4][5]

मान लेते है Xi = (Xi1, … , Xip) विषय i के लिए सहसंयोजकों के वास्तविक मूल्य कॉक्स आनुपातिक संकट नमूना के लिए संकट फलन का रूप होता है

यह अभिव्यक्ति सहसंयोजक वेक्टर (व्याख्यात्मक चर) एक्स के साथ विषय i के लिए समय टी पर संकट फलन प्रस्तुत करता हैi. ध्यान दें कि विषयों के बीच, आधारभूत संकट समरूप होते है (i पर कोई निर्भरता नहीं होती है)। विषयों के संकटों के बीच एकमात्र अंतर आधारभूत स्केलिंग कारक से आता है .

इसे आनुपातिक क्यों कहा जाता है

आरंभ करने के लिए, मान लीजिए कि हमारे पास केवल एक ही सहसंयोजक है, , और इसलिए एक एकल गुणांक, . बढ़ने के प्रभाव पर विचार करते है 1 इसके द्वारा:

हम देख सकते है कि एक सहसंयोजक को 1 से बढ़ाने से मूल संकट स्थिरांक से बढ़ जाता है . वस्तुओं को थोड़ा पुनर्व्यवस्थित करने पर, हम देखते है कि:

दायीं ओर का भाग समय के साथ स्थिर रहता है (किसी भी पद का कोई मतलब नहीं होता है)। इस संबंध, , को आनुपातिकता_(गणित) कहा जाता है।

अधिक सामान्यतः, सहसंयोजकों के साथ दो विषयों, i और j पर विचार करते है और । उनके संकटों के अनुपात पर विचार करते है:

दायीं ओर का भाग समय पर निर्भर नहीं होता है, केवल समय पर निर्भर कारक के रूप में, , समाप्त कर दिया जाता है। इस प्रकार दो विषयों के संकटों का अनुपात स्थिर होता है, अर्थात संकट आनुपातिक होता है।

अवरोधन पद का अभाव

प्रतिगमन नमूने में अधिकांशतः एक अवरोधन शब्द (जिसे स्थिर शब्द या पूर्वाग्रह शब्द भी कहा जाता है) का उपयोग किया जाता है। कॉक्स नमूने में आधारभूत संकट के कारण एक का अभाव होता है, , यह उसका स्थान ले लेता है। हम यह देखते कि क्या होगा यदि हम किसी भी तरह से निरूपित एक अवरोधन शब्द सम्मलित करते है :

जहां हमने पुनः परिभाषित किया है एक नया आधारभूत संकट बन जाता है, . इस प्रकार, आधारभूत संकट में संकट के सभी भाग सम्मलित होते है जो विषयों के सहसंयोजकों पर निर्भर नहीं होते है, जिसमें कोई भी अवरोधन शब्द सम्मलित होता है (जो परिभाषा के अनुसार सभी विषयों के लिए स्थिर होते है)।

अद्वितीय समय की संभावना

कॉक्स आंशिक संभावना, आधारभूत संकट फलन के ब्रेस्लो के अनुमान का उपयोग करके प्राप्त किया जाता है, इसे पूर्ण संभावना में उपयुक्त किया जाता है और फिर यह देखा जाता है कि परिणाम दो कारकों का एक उत्पाद है। पहला कारक नीचे दिखाई गई आंशिक संभावना है, जिसमें आधारभूत संकट समाप्त हो जाता है। दूसरा कारक प्रतिगमन गुणांक से मुक्त है और केवल सेंसरिंग (सांख्यिकी) के माध्यम से डेटा पर निर्भर करता है। किसी भी आनुपातिक संकट नमूने द्वारा अनुमानित सहसंयोजकों के प्रभाव को इस प्रकार संकट के अनुपात के रूप में रिपोर्ट किया जा सकता है।

समय Y पर विषय i के लिए देखी जाने वाली घटना के घटित होने की संभावनाi इस प्रकार लिखा जा सकता है:

जहाँ θj = exp(Xjβ) और सारांश विषयों j के समूह पर है जहां घटना समय Y से पहले नहीं हुई हैi (स्वयं विषय सहित)। सामान्यतः 0 <Li(β) ≤ 1. यह एक संभावना फलन आंशिक संभावना है: समय के साथ संकट के परिवर्तन के सहसंयोजकों के प्रभाव का अनुमान लगाया जा सकता है।

विषये सांख्यिकीय रूप से एक-दूसरे से स्वतंत्र होते है, सभी वास्तविक घटनाओं की संयुक्त संभावना[6] निम्नलिखित आंशिक संभावना होती है, जहां घटना को घटना सी द्वारा इंगित किया जाता हैi = 1:

संगत लॉग आंशिक संभावना है

नमूने मापदंडों के अधिकतम आंशिक संभावना अनुमान उत्पन्न करने के लिए इस फलन को β से अधिक बढ़ाया जा सकता है।

आंशिक अंक (सांख्यिकी) है

और आंशिक लॉग संभावना का हेस्सियन आव्यूह है

इस अंक फलन और हेस्सियन आव्यूह का उपयोग करके, न्यूटन की विधि का उपयोग करके आंशिक संभावना को अधिकतम किया जा सकता है। हेसियन आव्यूह का व्युत्क्रम, जिसका मूल्यांकन β के अनुमान पर किया जाता है, इसका उपयोग अनुमान के लिए अनुमानित विचरण-सहप्रसरण आव्यूह के रूप में किया जा सकता है, और प्रतिगमन गुणांक के लिए अनुमानित मानक त्रुटियां उत्पन्न करने के लिए इसका उपयोग किया जा सकता है।

बंधे हुए समय के उपस्थित होने की संभावना

उन स्थितियों को संभालने के लिए कई दृष्टिकोण प्रस्तावित किए गए है जिनमें समय डेटा में संबंध होता है। ब्रेस्लो की विधि उस दृष्टिकोण का वर्णन करती है जिसमें ऊपर वर्णित प्रक्रिया को असंशोधित रूप से उपयोग किया जाता है, तब भी जब संबंध उपस्थित होता है। एक वैकल्पिक दृष्टिकोण जिसे बेहतर परिणाम देने वाला माना जाता है वह एफ्रॉन की विधि होती है।[7] टीj अद्वितीय समय को निरूपित करता है, मान लेते है Hj सूचकांकों के समुच्चय को इस प्रकार निरूपित करता कि Yi= टीj और सीi= 1, और एमj= |एचj| एफ्रॉन का दृष्टिकोण निम्नलिखित आंशिक संभावना को अधिकतम करता है।

संगत लॉग आंशिक संभावना है

अंक फलन है

और हेस्सियन आव्यूह है

जहाँ

ध्यान दें कि जब hj शून्य है (समय tj के साथ सभी अवलोकन सेंसर किया गया है), इन अभिव्यक्तियों में सारांश को शून्य माना जाता है।

उदाहरण

व्यवहार में कॉक्स नमूने के कुछ व्यावहारिक उदाहरण नीचे दिए गए है।

एक एकल द्विआधारी सहसंयोजक

मान लेते है कि जिस अंतिम बिंदु में हम रुचि रखते है वह सर्जरी के बाद 5 साल की अवलोकन अवधि के समय में रोगी जीवित रहता है। मरीज़ 5 साल की अवधि के भीतर मर सकता है, और हम रिकॉर्ड करते है कि उनकी मृत्यु कब हुई, या मरीज़ 5 साल से अधिक जीवित रह सकते है, और हम केवल यह रिकॉर्ड करते है कि वे 5 साल से अधिक जीवित रहते है। सर्जरी दो अस्पतालों, A या B में से एक में की गई थी, और हमे यह जानना होता है कि क्या अस्पताल का स्थान 5 साल के जीवित रहने से जुड़ा होता है। विशेष रूप से, हम अस्पताल बी की तुलना में अस्पताल ए में की गई सर्जरी से संकट में सापेक्ष वृद्धि (या कमी) जानना चाहा जाता है। कुछ डेटा प्रदान किया जाता है, जहां प्रत्येक पंक्ति एक मरीज का प्रतिनिधित्व करते है: T यह दर्शाता है कि मृत्यु से पहले मरीज़ पर कितने समय तक निगरानी रखी जाती है या 5 साल (महीनों में मापा गया), और C दर्शाता है कि मरीज़ की मृत्यु 5 साल की अवधि में हुई थी या नहीं हुई थी। हमने अस्पताल को एक द्विआधारी प्रकार के रूप में एन्कोड किया जाता है जिसे X के रूप दर्शाया जाता है: 1 यदि अस्पताल A से है, 0 यदि अस्पताल B से है।

अस्पताल एक्स टी सी
बी 0 60 गलत
बी 0 32 सही
बी 0 60 गलत
बी 0 60 गलत
बी 0 60 गलत
1 4 सही
1 18 सही
1 60 गलत
1 9 सही
1 31 सही
1 53 सही
1 17 सही

हमारा एकल-सहसंयोजक कॉक्स आनुपातिक नमूना निम्नलिखित दिखाता है अस्पताल के प्रभाव का प्रतिनिधित्व करता है, और i प्रत्येक रोगी को अनुक्रमित करता है:

सांख्यिकीय सॉफ्टवेयर का उपयोग करके हम अनुमान लगा सकते है 2.12 संकट अनुपात इस मान का घातीय होते है, . इसका कारण जानने के लिए, विशेष रूप से संकटों के अनुपात पर विचार करता है:

इस प्रकार, अस्पताल ए और अस्पताल बी का संकट अनुपात है . एक पल के लिए सांख्यिकीय महत्व को अलग रखते हुए, हम यह कहते हुए एक उत्तर दे सकते है कि अस्पताल ए में मरीज़ अस्पताल बी की तुलना में किसी भी कम समय में मृत्यु के 8.3 गुना अधिक संकट से जुड़ा होता है।

व्याख्या के बारे में उल्लेख करने योग्य महत्वपूर्ण संकेत है:

  1. मृत्यु के 8.3 गुना अधिक संकट का मतलब यह नहीं है कि अस्पताल बी में 8.3 गुना अधिक मरीज मरेंगे: उत्तरजीविता विश्लेषण यह प्राप्त करता है कि घटनाएं कितनी जल्दी घटित होती है, न कि केवल यह कि वे घटित होती है या नहीं होता है।
  2. अधिक विशेष रूप से, मृत्यु का संकट एक दर का माप होता है। दर में इकाइयाँ होती है, जैसे मीटर प्रति सेकंड। चूँकि, एक सापेक्ष दर नहीं है: एक साइकिल किसी अन्य साइकिल (संदर्भ साइकिल) की तुलना में दो गुना तेज चल सकती है, बिना किसी इकाई को निर्दिष्ट किए हुए। इसी तरह, अस्पताल में मृत्यु का संकट (मृत्यु की दर) अस्पताल बी (संदर्भ समूह) में मृत्यु के संकट की तुलना में 8.3 गुना अधिक (तेज़) होता है।
  3. व्युत्क्रम मात्रा, अस्पताल A के सापेक्ष अस्पताल B का संकट अनुपात है।
  4. हम अस्पतालों के बीच जीवित रहने की संभावनाओं के बारे में कोई अनुमान नहीं लगा सकते है। ऐसा इसलिए है क्योंकि हमें आधारभूत संकट दर के अनुमान की आवश्यकता होती, , साथ ही हमारा भी अनुमान लगाया जाता है। चूँकि, कॉक्स आनुपातिक संकट नमूने का मानक अनुमान सामान्यतः आधारभूत संकट की दर का अनुमान नहीं लगाता है।
  5. क्योंकि हमने नमूना के एकमात्र समय-परिवर्तनशील घटक, आधारभूत संकट दर को देखते नहीं है, हमारा अनुमान समय स्केल-अपरिवर्तनीय होता है। उदाहरण के लिए, यदि हमने समय को महीनों के अतिरिक्त वर्षों में मापा होता, तो हमें वही अनुमान प्राप्त होता है।
  6. यह कहना आकर्षक है कि अस्पताल ने दोनों समूहों के बीच संकटों में अंतर उत्पन्न किया था, लेकिन चूंकि हमारा अध्ययन कारणात्मक नहीं है (अर्थात्, हम नहीं जानते कि डेटा कैसे उत्पन्न हुआ), हम स्वीकृत होते है जैसी शब्दावली के साथ संबद्ध।

एक एकल सतत सहसंयोजक

उत्तरजीविता विश्लेषण के कम पारंपरिक उपयोग के स्थिति को प्रदर्शित करने के लिए, अगला उदाहरण एक अर्थशास्त्र प्रश्न होता है: संगठनों के आईपीओ की 1 साल की सालगिरह पर मूल्य-से-आय अनुपात (पी/ई) और उनके भविष्य के अस्तित्व के बीच क्या संबंध होता है ? अधिक विशेष रूप से, यदि हम किसी संगठन के जन्म की घटना को उनकी 1-वर्षीय आईपीओ वर्षगांठ मानते है, और किसी दिवालियापन, बिक्री, निजी होने आदि को संगठन की मृत्यु की घटना मानते है, तो हम संगठनों के पी के प्रभाव को जानना चाहेंगे।

प्रदान किया गया ए डेटासमूह है जिसमें 12 संगठनों के अस्तित्व डेटा होते है: T 1-वर्षीय आईपीओ वर्षगांठ और मृत्यु (या 2022-01-01 की अंतिम तिथि, यदि नहीं किया गया है) के बीच दिनों की संख्या का प्रतिनिधित्व करता है)। सी दर्शाता है कि संगठन 2022-01-01 से पहले समाप्त हो जाती है। पी/ई संगठनों की 1-वर्षीय आईपीओ वर्षगांठ पर मूल्य-से-आय अनुपात का प्रतिनिधित्व करता है।

सीओ. 1 साल की आईपीओ तारीख मौत की तिथि* सी टी पी/ई
0 2000-11-05 2011-01-22 सही 3730 9.7
1 2000-12-01 2003-03-30 सही 849 12.0
2 2011-01-05 2012-03-30 सही 450 3.0
3 2010-05-29 2011-02-22 सही 269 5.3
4 2005-06-23 2022-01-01 गलत 6036 10.8
5 2000-06-10 2002-07-24 सही 774 6.3
6 2011-07-11 2014-05-01 सही 1025 11.6
7 2007-09-27 2022-01-01 गलत 5210 10.3
8 2006-07-30 2010-06-03 सही 1404 8.0
9 2000-07-13 2001-07-19 सही 371 4.0
10 2013-06-10 2018-10-10 सही 1948 5.9
11 2011-07-16 2014-08-15 सही 1126 8.3

पिछले उदाहरण के विपरीत जहां एक द्विआधारी प्रकार था, इस डेटासमूह में एक सतत प्रकार, पी/ई है। चूँकि, नमूना समान दिखता है:

जहाँ किसी संगठन के पी/ई अनुपात का प्रतिनिधित्व करता है। कॉक्स नमूने के माध्यम से इस डेटासमूह को चलाने से अज्ञात के मूल्य का अनुमान उत्पन्न होता है , जो -0.34 है। इसलिए, संपूर्ण संकट का एक अनुमान इस प्रकार है:

आधारभूत संकट के बाद से, , यह अनुमान लगाया गया था, कि पूरे संकट की गणना नहीं की जा सकती है। चूँकि, संगठनों i और j के संकटों के अनुपात पर विचार करते है:

दाईं ओर सभी स्थितियां ज्ञात होती है, इसलिए संगठनों के बीच संकटों के अनुपात की गणना करना संभव होता है। चूँकि दाईं ओर कोई समय-निर्भर शब्द नहीं होता है (सभी पद स्थिर है), संकट एक-दूसरे के लिए आनुपातिक होते है। उदाहरण के लिए, संगठन 5 से संगठन 2 का संकट अनुपात है . इसका मतलब यह है कि, अध्ययन के समय के भीतर, संगठन 5 की मृत्यु का संकट संगठन 2 की मृत्यु के संकट के बराबर 0.33 ≈ 1/3 है।

व्याख्या के बारे में उल्लेख करने योग्य महत्वपूर्ण संकेत है:

  1. संकट अनुपात मात्रा है , जो है उपरोक्त उदाहरण में. उपरोक्त अंतिम गणना से, इसकी व्याख्या दो विषयों के बीच संकटों के अनुपात के रूप में होती है जिनके चर एक इकाई से भिन्न होते है: यदि , तब एक इकाई त्रुटिहीन रूप से मूल्य का संचार करता है .
  2. आधारभूत संकट का प्रतिनिधित्व तब किया जा सकता है जब स्केलिंग वर्ग होता है, अर्थात . <पी>

    क्या हम आधारभूत संकट की व्याख्या उस आधारभूत संगठन के संकट के रूप में कर सकते है जिसका पी/ई 0 है? आधारभूत विषय के संकट के रूप में आधारभूत संकट की यह व्याख्या अपूर्ण होती है, क्योंकि यह संभव है कि सहसंयोजक 0 होना असंभव है। इस उपकरण में, 0 का पी/ई अर्थहीन होता है (इसका मतलब है कि संगठन का मूल्य 0 है, अर्थात, वे मर चुके है)। संकट की अधिक उपयुक्त व्याख्या तब होती है जब सभी चर शून्य होते है।
  3. जैसे मूल्य को समझना और व्याख्या करना आकर्षक होता है किसी संगठन के संकट का प्रतिनिधित्व करने के लिए होता है। चूँकि, विचार करते है कि यह वास्तव में क्या दर्शाता है: . यहां संकटों का अनुपात स्पष्ट रूप से होता है, संगठन के संकट की तुलना 0 पी/ई वाली एक काल्पनिक आधारभूत संगठन से की जाती है। चूँकि, जैसा कि ऊपर बताया गया है, इस उपकरण में 0 का पी/ई असंभव होता है इस उदाहरण में अर्थहीन होते है. चूँकि, संभावित संकटों के बीच अनुपात सार्थक होता है।

समय-परिवर्तनशील भविष्यवक्ता और गुणांक

समय पर निर्भर चर, समय पर निर्भर स्तर और प्रति विषय कई घटनाओं के विस्तार को एंडरसन और गिल की गिनती प्रक्रिया सूत्रीकरण द्वारा सम्मलित किया जा सकता है।[8] समय-भिन्न प्रतिगामी के साथ संकट नमूने का उपयोग एक उदाहरण बेरोजगारी बीमा के प्रभाव का अनुमान लगाना होता है।[9][10]

समय-भिन्न सहसंयोजकों (अर्थात, भविष्यवक्ताओं) की अनुमति देने के अतिरिक्त, कॉक्स नमूने को समय-भिन्न गुणांकों के लिए भी सामान्यीकृत किया जा सकता है। अर्थात्, उपचार का आनुपातिक प्रभाव समय के साथ भिन्न हो सकता है, जैसे यदि कोई दवा रुग्णता के एक महीने के भीतर दी जाए तो वह बहुत प्रभावी हो सकती है, और समय बीतने के साथ कम प्रभावी हो जाती है। तब गुणांक के समय (स्थिरता) के साथ कोई परिवर्तन नहीं होने की परिकल्पना का परीक्षण किया जा सकता है। विवरण और सॉफ्टवेयर (आर (प्रोग्रामिंग भाषा)पैकेज) मार्टिनुसेन और शेइक (2006) में उपलब्ध है।[11][12]

इस संदर्भ में, यह भी उल्लेख किया जा सकता है कि योगात्मक संकटों का उपयोग करके सहसंयोजकों के प्रभाव को निर्दिष्ट करना सैद्धांतिक रूप से संभव होता है,[13] अर्थात निर्दिष्ट करता है

यदि ऐसे योगात्मक संकटों के नमूने का उपयोग उन स्थितियों में किया जाता है जहां (लॉग-)संभावना अधिकतमकरण उद्देश्य होते है, तो इसे सावधानी से प्रतिबंधित करा जाता है गैर-ऋणात्मक मानों के लिए संभवतः इसी जटिलता के परिणामस्वरूप ऐसे नमूने कम ही देखने को मिलते है। यदि उद्देश्य न्यूनतम वर्ग है तो गैर-ऋणात्मक प्रतिबंध की आवश्यकता नहीं होती है।

आधारभूत संकट फलन निर्दिष्ट करना

कॉक्स नमूने को विशिष्ट बनाया जा सकता है यदि यह मानने का कोई कारण उपस्थित होता है कि आधारभूत संकट एक विशेष रूप का अनुसरण करता है। इस स्थिति में, आधारभूत संकट किसी दिए गए फलन द्वारा प्रतिस्थापित किया जाता है। उदाहरण के लिए, संकट फलन को वेइबुल वितरण संचयी वितरण फलन मानने से वेइबुल आनुपातिक संकट नमूना प्राप्त होता है।

संयोग से, वेइबुल आधारभूत संकट का उपयोग नमूने आनुपातिक संकटों और त्वरित विफलता समय नमूने दोनों को संतुष्ट करता है।

सामान्य शब्द प्राचलिक आनुपातिक संकट नमूने का उपयोग आनुपातिक संकट नमूने का वर्णन करने के लिए किया जा सकता है जिसमें संकट कार्य निर्दिष्ट होते है। इसके विपरीत कॉक्स आनुपातिक संकट नमूने को कभी-कभी अर्धप्राचलिक नमूना कहा जाता है।

कुछ लेखक अंतर्निहित संकट के कार्य को निर्दिष्ट करते समय भी कॉक्स आनुपातिक संकट नमूने शब्द का उपयोग करते है।[14]

कॉक्स प्रतिगमन नमूना (आनुपातिक संकटों को छोड़ना) शब्द का उपयोग कभी-कभी समय-निर्भर कारकों को सम्मलित करने के लिए कॉक्स नमूना के विस्तार का वर्णन करने के लिए किया जाता है। चूँकि, यह उपयोग संभावित रूप से अस्पष्ट होते है क्योंकि कॉक्स आनुपातिक संकट नमूना स्वयं एक प्रतिगमन नमूने के रूप में वर्णित किया जा सकता है।

पॉइसन नमूना से संबंध

आनुपातिक संकटों के नमूने और पॉइसन प्रतिगमन नमूने के बीच एक संबंध होता है जिसे कभी-कभी पॉइसन प्रतिगमन के लिए सॉफ़्टवेयर में अनुमानित आनुपातिक संकटों के नमूना को उपयुक्त करने के लिए उपयोग किया जाता है। ऐसा करने का सामान्य कारण यह है कि गणना बहुत तेज होती है। धीमे कंप्यूटरों के दिनों में यह अधिक महत्वपूर्ण था लेकिन विशेष रूप से बड़े डेटा समूह या जटिल समस्याओं के लिए अभी भी उपयोगी हो सकता है। लैयर्ड और ओलिवियर (1981)[15] गणितीय विवरण प्रदान करते है वे ध्यान देते है, हम यह नहीं मानते है कि [पॉइसन नमूना] सत्य है, लेकिन इसे केवल संभावना प्राप्त करने के लिए एक उपकरण के रूप में उपयोग करते है। मैक्कलघ और नेल्डर का[16] सामान्यीकृत रैखिक नमूने पर पुस्तक में आनुपातिक संकटों के नमूने को सामान्यीकृत रैखिक नमूने में परिवर्तित करने पर एक अध्याय है।

उच्च-आयामी समूह के अंतर्गत

उच्च-आयाम में, जब नमूना आकार n की तुलना में सहसंयोजक p की संख्या बड़ी होती है, तो लैस्सो (सांख्यिकी) मौलिक नमूना-चयन रणनीतियों में से एक होता है। (1997) में आनुपातिक संकट प्रतिगमन प्राचल के लिए एक लासो प्रक्रिया प्रस्तावित की गयी थी।[17] प्रतिगमन प्राचल β के लैस्सो अनुमानक को L1-मानदंड L के अनुसार कॉक्स आंशिक लॉग-संभावना के विपरीत के न्यूनतम के रूप में परिभाषित किया गया है।1

इस विषय पर हाल ही में सैद्धांतिक प्रगति हुई है।[18][19][20]

सॉफ़्टवेयर कार्यान्वयन

  • गणित: CoxModelFit फलन।[21]
  • आर: coxph() फलन, उत्तरजीविता पैकेज में स्थित है।
  • एसएएस: phreg प्रक्रिया
  • स्टेटा: stcox आज्ञा
  • पायथन: CoxPHFitter लाइफलाइन्स लाइब्रेरी में स्थित है। phreg स्टेटनमूना लाइब्रेरी में।
  • एसपीएसएस: कॉक्स रिग्रेशन के अंतर्गत उपलब्ध है।
  • मतलब: coxphfit फलन
  • जूलिया: Survival.jl लाइब्रेरी में उपलब्ध है।
  • जेएमपी: फिट आनुपातिक संकटों प्लेटफॉर्म में उपलब्ध है।
  • प्रिज्म: उत्तरजीविता विश्लेषण और बहु प्रकार विश्लेषण में उपलब्ध

यह भी देखें

टिप्पणियाँ

  1. Breslow, N. E. (1975). "Analysis of Survival Data under the Proportional Hazards Model". International Statistical Review / Revue Internationale de Statistique. 43 (1): 45–57. doi:10.2307/1402659. JSTOR 1402659.
  2. Cox, David R (1972). "प्रतिगमन मॉडल और जीवन तालिका". Journal of the Royal Statistical Society, Series B. 34 (2): 187–220. JSTOR 2985181. MR 0341758.
  3. Kalbfleisch, John D.; Schaubel, Douglas E. (10 March 2023). "कॉक्स मॉडल के पचास वर्ष". Annual Review of Statistics and Its Application (in English). 10 (1): 1–23. doi:10.1146/annurev-statistics-033021-014043. ISSN 2326-8298.
  4. Reid, N. (1994). "A Conversation with Sir David Cox". Statistical Science. 9 (3): 439–455. doi:10.1214/ss/1177010394.
  5. Cox, D. R. (1997). Some remarks on the analysis of survival data. the First Seattle Symposium of Biostatistics: Survival Analysis.
  6. "Each failure contributes to the likelihood function", Cox (1972), page 191.
  7. Efron, Bradley (1974). "सेंसर किए गए डेटा के लिए कॉक्स के संभावना फ़ंक्शन की दक्षता". Journal of the American Statistical Association. 72 (359): 557–565. doi:10.1080/01621459.1977.10480613. JSTOR 2286217.
  8. Andersen, P.; Gill, R. (1982). "Cox's regression model for counting processes, a large sample study". Annals of Statistics. 10 (4): 1100–1120. doi:10.1214/aos/1176345976. JSTOR 2240714.
  9. Meyer, B. D. (1990). "बेरोजगारी बीमा और बेरोजगारी मंत्र" (PDF). Econometrica. 58 (4): 757–782. doi:10.2307/2938349. JSTOR 2938349.
  10. Bover, O.; Arellano, M.; Bentolila, S. (2002). "बेरोजगारी की अवधि, लाभ की अवधि और व्यापार चक्र" (PDF). The Economic Journal. 112 (479): 223–265. doi:10.1111/1468-0297.00034.
  11. Martinussen; Scheike (2006). उत्तरजीविता डेटा के लिए गतिशील प्रतिगमन मॉडल. Springer. doi:10.1007/0-387-33960-4. ISBN 978-0-387-20274-7.
  12. "timereg: Flexible Regression Models for Survival Data". CRAN.
  13. Cox, D. R. (1997). Some remarks on the analysis of survival data. the First Seattle Symposium of Biostatistics: Survival Analysis.
  14. Bender, R.; Augustin, T.; Blettner, M. (2006). "कॉक्स आनुपातिक खतरों के मॉडल का अनुकरण करने के लिए जीवित रहने का समय उत्पन्न करना". Statistics in Medicine. 24 (11): 1713–1723. doi:10.1002/sim.2369. PMID 16680804.
  15. Nan Laird and Donald Olivier (1981). "Covariance Analysis of Censored Survival Data Using Log-Linear Analysis Techniques". Journal of the American Statistical Association. 76 (374): 231–240. doi:10.2307/2287816. JSTOR 2287816.
  16. P. McCullagh and J. A. Nelder (2000). "Chapter 13: Models for Survival Data". Generalized Linear Models (Second ed.). Boca Raton, Florida: Chapman & Hall/CRC. ISBN 978-0-412-31760-6. (Second edition 1989; first CRC reprint 1999.)
  17. Tibshirani, R. (1997). "कॉक्स मॉडल में चर चयन के लिए लैस्सो विधि". Statistics in Medicine. 16 (4): 385–395. CiteSeerX 10.1.1.411.8024. doi:10.1002/(SICI)1097-0258(19970228)16:4<385::AID-SIM380>3.0.CO;2-3.
  18. Bradić, J.; Fan, J.; Jiang, J. (2011). "एनपी-आयामीता के साथ कॉक्स के आनुपातिक खतरों के मॉडल के लिए नियमितीकरण". Annals of Statistics. 39 (6): 3092–3120. arXiv:1010.5233. doi:10.1214/11-AOS911. PMC 3468162. PMID 23066171.
  19. Kong, S.; Nan, B. (2014). "लैस्सो के माध्यम से उच्च-आयामी कॉक्स प्रतिगमन के लिए गैर-स्पर्शोन्मुख दैवज्ञ असमानताएँ". Statistica Sinica. 24 (1): 25–42. arXiv:1204.1992. doi:10.5705/ss.2012.240. PMC 3916829. PMID 24516328.
  20. Huang, J.; Sun, T.; Ying, Z.; Yu, Y.; Zhang, C. H. (2011). "कॉक्स मॉडल में लैस्सो के लिए ओरेकल असमानताएँ". The Annals of Statistics. 41 (3): 1142–1165. arXiv:1306.4847. doi:10.1214/13-AOS1098. PMC 3786146. PMID 24086091.
  21. "कॉक्समॉडलफिट". Wolfram Language & System Documentation Center.


संदर्भ