आनुपातिक संकट नमूना: Difference between revisions
(Created page with "{{short description|Class of statistical survival models}} आनुपातिक ख़तरे मॉडल सांख्यिकी में उत्तरजी...") |
No edit summary |
||
Line 1: | Line 1: | ||
{{short description|Class of statistical survival models}} | {{short description|Class of statistical survival models}} | ||
आनुपातिक | '''आनुपातिक संकट नमूना''' सांख्यिकी में [[उत्तरजीविता विश्लेषण]] का एक वर्ग होता है। उत्तरजीविता नमूना किसी घटना के घटित होने से पहले बीतने वाले समय को एक या अधिक [[सहसंयोजक|सहसंयोजकों]] से जोड़ता है। आनुपातिक संकटों के नमूने में, सहसंयोजक में एक इकाई वृद्धि का अनूठा प्रभाव संकट की दर के संबंध में गुणक होता है। उदाहरण के लिए, दवा लेने से स्ट्रोक होने की [[जोखिम दर|संकट दर]] आधी हो सकती है, या, जिस सामग्री से निर्मित घटक का निर्माण किया जाता है उसे बदलने से विफलता की संकट दर दोगुनी हो सकती है। अन्य प्रकार के उत्तरजीविता नमूना जैसे [[त्वरित विफलता समय मॉडल|त्वरित विफलता समय नमूना]] आनुपातिक संकटों को प्रदर्शित नहीं करते है। त्वरित विफलता समय नमूना उस स्थिति का वर्णन करता है जहां किसी घटना का जैविक या यांत्रिक जीवन इतिहास त्वरित (या धीमा) हो जाता है।ka | ||
==पृष्ठभूमि== | ==पृष्ठभूमि== | ||
उत्तरजीविता | उत्तरजीविता नमूना को दो भागों से मिलकर देखा जा सकता है: अंतर्निहित आधारभूत संकट फलन, जिसे अधिकांशतः दर्शाया जाता है <math>\lambda_0(t)</math>, यह वर्णन करते हुए कि सहसंयोजकों के आधारभूत स्तरों पर प्रति समय इकाई घटना का संकट समय के साथ कैसे बदलता है, और प्रभाव प्राचल, यह वर्णन करते है कि व्याख्यात्मक सहसंयोजकों की प्रतिक्रिया में संकट कैसे भिन्न होता है। एक विशिष्ट चिकित्सा उदाहरण में परिवर्तनशीलता को कम करने और भ्रम को नियंत्रित करने के लिए सहसंयोजक जैसे उपचार, साथ ही रोगी की विशेषताएं जैसे अध्ययन की प्रारंभ में उम्र, लिंग और अध्ययन की प्रारंभ में अन्य बीमारियों की उपस्थिति सम्मलित होती है। | ||
आनुपातिक | आनुपातिक संकटों की स्थिति<ref>{{cite journal | ||
| doi = 10.2307/1402659 | | doi = 10.2307/1402659 | ||
| last = Breslow |first = N. E. |author-link= Norman Breslow | | last = Breslow |first = N. E. |author-link= Norman Breslow | ||
Line 12: | Line 12: | ||
| journal = International Statistical Review / Revue Internationale de Statistique | | journal = International Statistical Review / Revue Internationale de Statistique | ||
| year = 1975 | volume = 43 | issue=1 |pages = 45–57 | | year = 1975 | volume = 43 | issue=1 |pages = 45–57 | ||
| jstor = 1402659}}</ref> बताता है कि सहसंयोजक | | jstor = 1402659}}</ref> बताता है कि सहसंयोजक संकट से गुणात्मक रूप से संबंधित है। स्थिर गुणांक के सबसे सरल स्थिति में, उदाहरण के लिए, किसी दवा के साथ उपचार, किसी भी समय किसी विषय के संकट को आधा कर सकता है <math>t</math>, जबकि आधारभूत संकट भिन्न हो सकता है। चूँकि, ध्यान दें कि इससे विषय का जीवनकाल दोगुना नहीं होता है, जीवनकाल पर सहसंयोजकों का त्रुटिहीन प्रभाव किस प्रकार पर निर्भर करता है <math>\lambda_0(t)</math>. यह सहसंयोजक द्विआधारी भविष्यवक्ताओं तक ही सीमित नहीं होता है, सतत सहसंयोजक के स्थिति में <math>x</math>, सामान्यतः यह माना जाता है कि संकट तेजी से प्रतिक्रिया करता है, प्रत्येक इकाई में वृद्धि होती है <math>x</math> इसके परिणामस्वरूप संकट आनुपातिक रूप से बढ़ जाता है। | ||
==कॉक्स | ==कॉक्स नमूना== | ||
=== परिचय === | === परिचय === | ||
[[डेविड कॉक्स (सांख्यिकीविद्)]] ने देखा कि यदि आनुपातिक | [[डेविड कॉक्स (सांख्यिकीविद्)]] ने देखा कि यदि आनुपातिक संकटों की धारणा स्वीकृत है (या, स्वीकृत मानी जाती है) तो प्रभाव प्राचल का अनुमान लगाना संभव होता है, जिसे दर्शाया जाता है <math>\beta_i</math> नीचे, पूर्ण संकट फलन पर कोई विचार किए बिना उत्तरजीविता डेटा के इस दृष्टिकोण को ''कॉक्स आनुपातिक संकट नमूना'' का अनुप्रयोग कहा जाता है,<ref>{{cite journal | last=Cox | first=David R | author-link=David Cox (statistician) | year=1972 | journal=Journal of the Royal Statistical Society, Series B | volume=34 | issue=2 | title=प्रतिगमन मॉडल और जीवन तालिका| pages=187–220 | jstor=2985181 |mr=0341758}}</ref> कभी-कभी इसे ''कॉक्स नमूना'' या ''आनुपातिक संकट नमूना'' के रूप में संक्षिप्त किया जाता है।<ref name="Kalbfleisch">{{cite journal |last1=Kalbfleisch |first1=John D. |last2=Schaubel |first2=Douglas E. |title=कॉक्स मॉडल के पचास वर्ष|journal=Annual Review of Statistics and Its Application |date=10 March 2023 |volume=10 |issue=1 |pages=1–23 |doi=10.1146/annurev-statistics-033021-014043 |url=https://doi.org/10.1146/annurev-statistics-033021-014043 |language=en |issn=2326-8298}}</ref> चूँकि, कॉक्स ने यह भी कहा कि आनुपातिक संकटों की धारणा की जैविक व्याख्या अधिक कठिन हो सकती है।<ref>{{cite journal | ||
| last = Reid |first = N. | | last = Reid |first = N. | ||
| title = A Conversation with Sir David Cox | | title = A Conversation with Sir David Cox | ||
Line 28: | Line 28: | ||
| conference = the First Seattle Symposium of Biostatistics: Survival Analysis | | conference = the First Seattle Symposium of Biostatistics: Survival Analysis | ||
| year = 1997 }}</ref> | | year = 1997 }}</ref> | ||
मान लेते है {{math|1=''X''<sub>''i''</sub> = (''X''<sub>''i''1</sub>, … , ''X''<sub>''ip''</sub>)}} विषय i के लिए सहसंयोजकों के वास्तविक मूल्य कॉक्स आनुपातिक संकट नमूना के लिए संकट फलन का रूप होता है | |||
::<math> | ::<math> | ||
Line 36: | Line 37: | ||
\end{align} | \end{align} | ||
</math> | </math> | ||
यह अभिव्यक्ति सहसंयोजक वेक्टर (व्याख्यात्मक चर) एक्स के साथ विषय i के लिए समय टी पर | यह अभिव्यक्ति सहसंयोजक वेक्टर (व्याख्यात्मक चर) एक्स के साथ विषय i के लिए समय टी पर संकट फलन प्रस्तुत करता है<sub>''i''</sub>. ध्यान दें कि विषयों के बीच, आधारभूत संकट <math>\lambda_0(t)</math> समरूप होते है (i पर कोई निर्भरता नहीं होती है)। विषयों के संकटों के बीच एकमात्र अंतर आधारभूत स्केलिंग कारक से आता है <math>\exp(X_i \cdot \beta)</math>. | ||
=== इसे आनुपातिक क्यों कहा जाता है === | === इसे आनुपातिक क्यों कहा जाता है === | ||
आरंभ करने के लिए, मान लीजिए कि हमारे पास केवल एक ही सहसंयोजक है, <math>x</math>, और इसलिए एक एकल गुणांक, <math>\beta_1</math>. बढ़ने के प्रभाव पर विचार | आरंभ करने के लिए, मान लीजिए कि हमारे पास केवल एक ही सहसंयोजक है, <math>x</math>, और इसलिए एक एकल गुणांक, <math>\beta_1</math>. बढ़ने के प्रभाव पर विचार करते है <math>x</math> 1 इसके द्वारा: | ||
::<math> | ::<math> | ||
Line 50: | Line 51: | ||
\end{align} | \end{align} | ||
</math> | </math> | ||
हम देख सकते | हम देख सकते है कि एक सहसंयोजक को 1 से बढ़ाने से मूल संकट स्थिरांक से बढ़ जाता है <math>\exp(\beta_1)</math>. वस्तुओं को थोड़ा पुनर्व्यवस्थित करने पर, हम देखते है कि: | ||
::<math> | ::<math> | ||
\frac{\lambda(t|x+1)}{\lambda(t|x)} = \exp(\beta_1) | \frac{\lambda(t|x+1)}{\lambda(t|x)} = \exp(\beta_1) | ||
</math> | </math> | ||
दायीं ओर का भाग समय के साथ स्थिर रहता है (किसी भी पद का कोई मतलब नहीं है)। <math>t</math> इस | दायीं ओर का भाग समय के साथ स्थिर रहता है (किसी भी पद का कोई मतलब नहीं होता है)। <math>t</math> इस संबंध, <math>x/y = \text{constant}</math>, को आनुपातिकता_(गणित) कहा जाता है। | ||
अधिक सामान्यतः, सहसंयोजकों के साथ दो विषयों, <i>i</i> और <i>j</i> पर विचार करते है <math>X_i</math> और <math>X_j</math>। उनके संकटों के अनुपात पर विचार करते है: | |||
अधिक सामान्यतः, सहसंयोजकों के साथ दो विषयों, <i>i</i> और <i>j</i> पर विचार | |||
::<math> | ::<math> | ||
Line 67: | Line 67: | ||
\end{align} | \end{align} | ||
</math> | </math> | ||
दायीं ओर का भाग समय पर निर्भर नहीं है, केवल समय पर निर्भर कारक के रूप में, <math>\lambda_0(t)</math>, | दायीं ओर का भाग समय पर निर्भर नहीं होता है, केवल समय पर निर्भर कारक के रूप में, <math>\lambda_0(t)</math>, समाप्त कर दिया जाता है। इस प्रकार दो विषयों के संकटों का अनुपात स्थिर होता है, अर्थात संकट आनुपातिक होता है। | ||
=== अवरोधन पद का अभाव === | === अवरोधन पद का अभाव === | ||
प्रतिगमन | प्रतिगमन नमूने में अधिकांशतः एक अवरोधन शब्द (जिसे स्थिर शब्द या पूर्वाग्रह शब्द भी कहा जाता है) का उपयोग किया जाता है। कॉक्स नमूने में आधारभूत संकट के कारण एक का अभाव होता है, <math>\lambda_0(t)</math>, यह उसका स्थान ले लेता है। हम यह देखते कि क्या होगा यदि हम किसी भी तरह से निरूपित एक अवरोधन शब्द सम्मलित करते है <math>\beta_0</math>: | ||
::<math> | ::<math> | ||
Line 80: | Line 80: | ||
\end{align} | \end{align} | ||
</math> | </math> | ||
जहां हमने पुनः परिभाषित किया है <math>\exp(\beta_0)\lambda_0(t)</math> एक नया आधारभूत | जहां हमने पुनः परिभाषित किया है <math>\exp(\beta_0)\lambda_0(t)</math> एक नया आधारभूत संकट बन जाता है, <math>\lambda^*_0(t)</math>. इस प्रकार, आधारभूत संकट में संकट के <i>सभी</i> भाग सम्मलित होते है जो विषयों के सहसंयोजकों पर निर्भर नहीं होते है, जिसमें कोई भी अवरोधन शब्द सम्मलित होता है (जो परिभाषा के अनुसार सभी विषयों के लिए स्थिर होते है)। | ||
=== अद्वितीय समय की संभावना === | === अद्वितीय समय की संभावना === | ||
कॉक्स [[आंशिक संभावना]], | कॉक्स [[आंशिक संभावना]], आधारभूत संकट फलन के ब्रेस्लो के अनुमान का उपयोग करके प्राप्त किया जाता है, इसे पूर्ण संभावना में उपयुक्त किया जाता है और फिर यह देखा जाता है कि परिणाम दो कारकों का एक उत्पाद है। पहला कारक नीचे दिखाई गई आंशिक संभावना है, जिसमें आधारभूत संकट समाप्त हो जाता है। दूसरा कारक प्रतिगमन गुणांक से मुक्त है और केवल [[सेंसरिंग (सांख्यिकी)]] के माध्यम से डेटा पर निर्भर करता है। किसी भी आनुपातिक संकट नमूने द्वारा अनुमानित सहसंयोजकों के प्रभाव को इस प्रकार संकट के अनुपात के रूप में रिपोर्ट किया जा सकता है। | ||
समय Y पर विषय i के लिए देखी जाने वाली घटना के घटित होने की संभावना<sub>''i''</sub> इस प्रकार लिखा जा सकता है: | समय Y पर विषय i के लिए देखी जाने वाली घटना के घटित होने की संभावना<sub>''i''</sub> इस प्रकार लिखा जा सकता है: | ||
Line 93: | Line 93: | ||
=\frac{\theta_i}{\sum_{j:Y_j\ge Y_i}\theta_j}, | =\frac{\theta_i}{\sum_{j:Y_j\ge Y_i}\theta_j}, | ||
</math> | </math> | ||
जहाँ {{math|1=''θ''<sub>''j''</sub> = exp(''X''<sub>''j''</sub> ⋅ ''β''}}) और सारांश विषयों j के समूह पर है जहां घटना समय Y से पहले नहीं हुई है<sub>''i''</sub> (स्वयं विषय सहित)। सामान्यतः 0 <L<sub>''i''</sub>(β) ≤ 1. यह एक संभावना फलन आंशिक संभावना है: समय के साथ संकट के परिवर्तन के सहसंयोजकों के प्रभाव का अनुमान लगाया जा सकता है। | |||
विषये सांख्यिकीय रूप से एक-दूसरे से स्वतंत्र होते है, सभी वास्तविक घटनाओं की संयुक्त संभावना<ref>"Each failure contributes to the likelihood function", Cox (1972), page 191.</ref> निम्नलिखित आंशिक संभावना होती है, जहां घटना को घटना सी द्वारा इंगित किया जाता है<sub>''i''</sub> = 1: | |||
::<math> | ::<math> | ||
L(\beta) = \prod_{i:C_i=1} L_i(\beta) . | L(\beta) = \prod_{i:C_i=1} L_i(\beta) . | ||
Line 103: | Line 103: | ||
\ell(\beta) = \sum_{i:C_i=1} \left(X_i \cdot \beta - \log \sum_{j:Y_j\ge Y_i}\theta_j\right). | \ell(\beta) = \sum_{i:C_i=1} \left(X_i \cdot \beta - \log \sum_{j:Y_j\ge Y_i}\theta_j\right). | ||
</math> | </math> | ||
नमूने मापदंडों के अधिकतम आंशिक संभावना अनुमान उत्पन्न करने के लिए इस फलन को β से अधिक बढ़ाया जा सकता है। | |||
आंशिक [[स्कोर (सांख्यिकी)]] है | आंशिक [[स्कोर (सांख्यिकी)|अंक (सांख्यिकी)]] है | ||
::<math> | ::<math> | ||
\ell^\prime(\beta) = \sum_{i:C_i=1} \left(X_i - \frac{\sum_{j:Y_j\ge Y_i}\theta_jX_j}{\sum_{j:Y_j\ge Y_i}\theta_j}\right), | \ell^\prime(\beta) = \sum_{i:C_i=1} \left(X_i - \frac{\sum_{j:Y_j\ge Y_i}\theta_jX_j}{\sum_{j:Y_j\ge Y_i}\theta_j}\right), | ||
</math> | </math> | ||
और आंशिक लॉग संभावना का [[ हेस्सियन मैट्रिक्स ]] है | और आंशिक लॉग संभावना का [[ हेस्सियन मैट्रिक्स | हेस्सियन आव्यूह]] है | ||
::<math> | ::<math> | ||
\ell^{\prime\prime}(\beta) = -\sum_{i:C_i=1} \left(\frac{\sum_{j:Y_j\ge Y_i}\theta_jX_jX_j^\prime}{\sum_{j:Y_j\ge Y_i}\theta_j} - \frac{\left[\sum_{j:Y_j\ge Y_i}\theta_jX_j\right] \left[\sum_{j:Y_j\ge Y_i}\theta_jX_j^\prime\right]}{\left[\sum_{j:Y_j\ge Y_i}\theta_j\right]^2}\right). | \ell^{\prime\prime}(\beta) = -\sum_{i:C_i=1} \left(\frac{\sum_{j:Y_j\ge Y_i}\theta_jX_jX_j^\prime}{\sum_{j:Y_j\ge Y_i}\theta_j} - \frac{\left[\sum_{j:Y_j\ge Y_i}\theta_jX_j\right] \left[\sum_{j:Y_j\ge Y_i}\theta_jX_j^\prime\right]}{\left[\sum_{j:Y_j\ge Y_i}\theta_j\right]^2}\right). | ||
</math> | </math> | ||
इस | इस अंक फलन और हेस्सियन आव्यूह का उपयोग करके, न्यूटन की विधि का उपयोग करके आंशिक संभावना को अधिकतम किया जा सकता है। हेसियन आव्यूह का व्युत्क्रम, जिसका मूल्यांकन β के अनुमान पर किया जाता है, इसका उपयोग अनुमान के लिए अनुमानित विचरण-सहप्रसरण आव्यूह के रूप में किया जा सकता है, और प्रतिगमन गुणांक के लिए अनुमानित [[मानक त्रुटि|मानक त्रुटियां]] उत्पन्न करने के लिए इसका उपयोग किया जा सकता है। | ||
=== | ===बंधे हुए समय के उपस्थित होने की संभावना=== | ||
उन स्थितियों को संभालने के लिए कई दृष्टिकोण प्रस्तावित किए गए | उन स्थितियों को संभालने के लिए कई दृष्टिकोण प्रस्तावित किए गए है जिनमें समय डेटा में संबंध होता है। ब्रेस्लो की विधि उस दृष्टिकोण का वर्णन करती है जिसमें ऊपर वर्णित प्रक्रिया को असंशोधित रूप से उपयोग किया जाता है, तब भी जब संबंध उपस्थित होता है। एक वैकल्पिक दृष्टिकोण जिसे बेहतर परिणाम देने वाला माना जाता है वह एफ्रॉन की विधि होती है।<ref>{{cite journal | last=Efron | first=Bradley | year=1974 | journal=Journal of the American Statistical Association | pages=557–565 | volume=72 | title=सेंसर किए गए डेटा के लिए कॉक्स के संभावना फ़ंक्शन की दक्षता| issue=359 | jstor=2286217 | doi = 10.1080/01621459.1977.10480613 }}</ref> टी<sub>''j''</sub> अद्वितीय समय को निरूपित करता है, मान लेते है H<sub>''j''</sub> सूचकांकों के समुच्चय को इस प्रकार निरूपित करता कि Y<sub>''i''</sub>= टी<sub>''j''</sub> और सी<sub>''i''</sub>= 1, और एम<sub>''j''</sub>= |एच<sub>''j''</sub>| एफ्रॉन का दृष्टिकोण निम्नलिखित आंशिक संभावना को अधिकतम करता है। | ||
::<math> | ::<math> | ||
Line 128: | Line 128: | ||
\ell(\beta) = \sum_j \left(\sum_{i\in H_j} X_i \cdot \beta -\sum_{\ell=0}^{m_j-1}\log\left(\sum_{i:Y_i\ge t_j}\theta_i - \frac{\ell}{m_j} \sum_{i\in H_j}\theta_i\right)\right), | \ell(\beta) = \sum_j \left(\sum_{i\in H_j} X_i \cdot \beta -\sum_{\ell=0}^{m_j-1}\log\left(\sum_{i:Y_i\ge t_j}\theta_i - \frac{\ell}{m_j} \sum_{i\in H_j}\theta_i\right)\right), | ||
</math> | </math> | ||
अंक फलन है | |||
::<math> | ::<math> | ||
\ell^\prime(\beta) = \sum_j \left(\sum_{i\in H_j} X_i -\sum_{\ell=0}^{m_j-1}\frac{\sum_{i:Y_i\ge t_j}\theta_iX_i - \frac{\ell}{m_j}\sum_{i\in H_j}\theta_iX_i}{\sum_{i:Y_i\ge t_j}\theta_i - \frac{\ell}{m_j}\sum_{i\in H_j}\theta_i}\right), | \ell^\prime(\beta) = \sum_j \left(\sum_{i\in H_j} X_i -\sum_{\ell=0}^{m_j-1}\frac{\sum_{i:Y_i\ge t_j}\theta_iX_i - \frac{\ell}{m_j}\sum_{i\in H_j}\theta_iX_i}{\sum_{i:Y_i\ge t_j}\theta_i - \frac{\ell}{m_j}\sum_{i\in H_j}\theta_i}\right), | ||
</math> | </math> | ||
और हेस्सियन | और हेस्सियन आव्यूह है | ||
::<math> | ::<math> | ||
\ell^{\prime\prime}(\beta) = -\sum_j \sum_{\ell=0}^{m_j-1} \left(\frac{\sum_{i:Y_i\ge t_j}\theta_iX_iX_i^\prime - \frac{\ell}{m_j}\sum_{i\in H_j}\theta_iX_iX_i^\prime}{\phi_{j,\ell,m_j}} - \frac{Z_{j,\ell,m_j} Z_{j,\ell,m_j}^\prime}{\phi_{j,\ell,m_j}^2}\right), | \ell^{\prime\prime}(\beta) = -\sum_j \sum_{\ell=0}^{m_j-1} \left(\frac{\sum_{i:Y_i\ge t_j}\theta_iX_iX_i^\prime - \frac{\ell}{m_j}\sum_{i\in H_j}\theta_iX_iX_i^\prime}{\phi_{j,\ell,m_j}} - \frac{Z_{j,\ell,m_j} Z_{j,\ell,m_j}^\prime}{\phi_{j,\ell,m_j}^2}\right), | ||
</math> | </math> | ||
जहाँ | |||
::<math> | ::<math> | ||
Line 146: | Line 146: | ||
Z_{j,\ell,m_j} = \sum_{i:Y_i\ge t_j}\theta_iX_i - \frac{\ell}{m_j}\sum_{i\in H_j}\theta_iX_i. | Z_{j,\ell,m_j} = \sum_{i:Y_i\ge t_j}\theta_iX_i - \frac{\ell}{m_j}\sum_{i\in H_j}\theta_iX_i. | ||
</math> | </math> | ||
ध्यान दें कि जब | ध्यान दें कि जब h<sub>''j''</sub> शून्य है (समय t<sub>''j''</sub> के साथ सभी अवलोकन सेंसर किया गया है), इन अभिव्यक्तियों में सारांश को शून्य माना जाता है। | ||
===उदाहरण=== | ===उदाहरण=== | ||
व्यवहार में कॉक्स | व्यवहार में कॉक्स नमूने के कुछ व्यावहारिक उदाहरण नीचे दिए गए है। | ||
====एक एकल | ====एक एकल द्विआधारी सहसंयोजक==== | ||
मान | मान लेते है कि जिस अंतिम बिंदु में हम रुचि रखते है वह सर्जरी के बाद 5 साल की अवलोकन अवधि के समय में रोगी जीवित रहता है। मरीज़ 5 साल की अवधि के भीतर मर सकता है, और हम रिकॉर्ड करते है कि उनकी मृत्यु कब हुई, या मरीज़ 5 साल से अधिक जीवित रह सकते है, और हम केवल यह रिकॉर्ड करते है कि वे 5 साल से अधिक जीवित रहते है। सर्जरी दो अस्पतालों, <i>A</i> या <i>B</i> में से एक में की गई थी, और हमे यह जानना होता है कि क्या अस्पताल का स्थान 5 साल के जीवित रहने से जुड़ा होता है। विशेष रूप से, हम अस्पताल बी की तुलना में अस्पताल ए में की गई सर्जरी से संकट में <i>सापेक्ष</i> वृद्धि (या कमी) जानना चाहा जाता है। कुछ डेटा प्रदान किया जाता है, जहां प्रत्येक पंक्ति एक मरीज का प्रतिनिधित्व करते है: <i>T</i> यह दर्शाता है कि मृत्यु से पहले मरीज़ पर कितने समय तक निगरानी रखी जाती है या 5 साल (महीनों में मापा गया), और <i>C</i> दर्शाता है कि मरीज़ की मृत्यु 5 साल की अवधि में हुई थी या नहीं हुई थी। हमने अस्पताल को एक द्विआधारी प्रकार के रूप में एन्कोड किया जाता है जिसे <i>X</i> के रूप दर्शाया जाता है: 1 यदि अस्पताल <i>A</i> से है, 0 यदि अस्पताल <i>B</i> से है। | ||
{| class="wikitable floatright" | {| class="wikitable floatright" | ||
|- | |- | ||
! | ! अस्पताल | ||
! | ! एक्स | ||
! | ! टी | ||
! | ! सी | ||
|- | |- | ||
| | | बी | ||
| 0 | | 0 | ||
| 60 | | 60 | ||
| | | गलत | ||
|- | |- | ||
| | | बी | ||
| 0 | | 0 | ||
| 32 | | 32 | ||
| | | सही | ||
|- | |- | ||
| | | बी | ||
| 0 | | 0 | ||
| 60 | | 60 | ||
| | | गलत | ||
|- | |- | ||
| | | बी | ||
| 0 | | 0 | ||
| 60 | | 60 | ||
| | | गलत | ||
|- | |- | ||
| | | बी | ||
| 0 | | 0 | ||
| 60 | | 60 | ||
| | | गलत | ||
|- | |- | ||
| | | ए | ||
| 1 | | 1 | ||
| 4 | | 4 | ||
| | | सही | ||
|- | |- | ||
| | | ए | ||
| 1 | | 1 | ||
| 18 | | 18 | ||
| | | सही | ||
|- | |- | ||
| | | ए | ||
| 1 | | 1 | ||
| 60 | | 60 | ||
| | | गलत | ||
|- | |- | ||
| | | ए | ||
| 1 | | 1 | ||
| 9 | | 9 | ||
| | | सही | ||
|- | |- | ||
| | | ए | ||
| 1 | | 1 | ||
| 31 | | 31 | ||
| | | सही | ||
|- | |- | ||
| | | ए | ||
| 1 | | 1 | ||
| 53 | | 53 | ||
| | | सही | ||
|- | |- | ||
| | | ए | ||
| 1 | | 1 | ||
| 17 | | 17 | ||
| | | सही | ||
|} | |} | ||
हमारा एकल-सहसंयोजक कॉक्स आनुपातिक | हमारा एकल-सहसंयोजक कॉक्स आनुपातिक नमूना निम्नलिखित दिखाता है <math>\beta_1</math> अस्पताल के प्रभाव का प्रतिनिधित्व करता है, और <i>i</i> प्रत्येक रोगी को अनुक्रमित करता है: | ||
::<math> | ::<math> | ||
\overbrace{\lambda(t|X_{i})}^{\text{hazard for i}} = \underbrace{\lambda_0(t)}_{\text{baseline} \atop \text{hazard} }\cdot\overbrace{\exp(\beta_1 X_{i})}^{\text{scaling factor for i}} | \overbrace{\lambda(t|X_{i})}^{\text{hazard for i}} = \underbrace{\lambda_0(t)}_{\text{baseline} \atop \text{hazard} }\cdot\overbrace{\exp(\beta_1 X_{i})}^{\text{scaling factor for i}} | ||
</math> | </math> | ||
सांख्यिकीय सॉफ्टवेयर का उपयोग करके हम अनुमान लगा सकते | सांख्यिकीय सॉफ्टवेयर का उपयोग करके हम अनुमान लगा सकते है <math>\beta_1</math> 2.12 संकट अनुपात इस मान का <i>घातीय</i> होते है, <math>\exp(\beta_1) = \exp(2.12)</math>. इसका कारण जानने के लिए, विशेष रूप से संकटों के अनुपात पर विचार करता है: | ||
::<math> | ::<math> | ||
\frac{\lambda(t|X=1)}{\lambda(t|X=0)} = \frac{\cancel{\lambda_0(t)}\exp(\beta_1 \cdot 1)}{\cancel{\lambda_0(t)}\exp(\beta_1 \cdot 0)} = \exp(\beta_1) | \frac{\lambda(t|X=1)}{\lambda(t|X=0)} = \frac{\cancel{\lambda_0(t)}\exp(\beta_1 \cdot 1)}{\cancel{\lambda_0(t)}\exp(\beta_1 \cdot 0)} = \exp(\beta_1) | ||
</math> | </math> | ||
इस प्रकार, अस्पताल ए और अस्पताल बी का | इस प्रकार, अस्पताल ए और अस्पताल बी का संकट अनुपात है <math>\exp(2.12) = 8.32 </math>. एक पल के लिए सांख्यिकीय महत्व को अलग रखते हुए, हम यह कहते हुए एक उत्तर दे सकते है कि अस्पताल ए में मरीज़ अस्पताल बी की तुलना में किसी भी कम समय में मृत्यु के 8.3 गुना अधिक संकट से जुड़ा होता है। | ||
व्याख्या के बारे में उल्लेख करने योग्य महत्वपूर्ण | व्याख्या के बारे में उल्लेख करने योग्य महत्वपूर्ण संकेत है: | ||
# मृत्यु के 8.3 गुना अधिक | # मृत्यु के 8.3 गुना अधिक संकट का मतलब यह नहीं है कि अस्पताल बी में 8.3 गुना अधिक मरीज मरेंगे: उत्तरजीविता विश्लेषण यह प्राप्त करता है कि घटनाएं कितनी जल्दी घटित होती है, न कि केवल यह कि वे घटित होती है या नहीं होता है। | ||
# अधिक विशेष रूप से, मृत्यु का | # अधिक विशेष रूप से, मृत्यु का संकट एक दर का माप होता है। दर में इकाइयाँ होती है, जैसे मीटर प्रति सेकंड। चूँकि, एक <i>सापेक्ष</i> दर नहीं है: एक साइकिल किसी अन्य साइकिल (संदर्भ साइकिल) की तुलना में दो गुना तेज चल सकती है, बिना किसी इकाई को निर्दिष्ट किए हुए। इसी तरह, अस्पताल <i>ए</i> में मृत्यु का संकट (मृत्यु की दर) अस्पताल <i>बी</i> (संदर्भ समूह) में मृत्यु के संकट की तुलना में 8.3 गुना अधिक (तेज़) होता है। | ||
# व्युत्क्रम मात्रा, <math> 1/8.32 = \frac{1}{\exp(2.12)} = \exp(-2.12) = 0.12</math> अस्पताल <i>A</i> के सापेक्ष अस्पताल <i>B</i> का | # व्युत्क्रम मात्रा, <math> 1/8.32 = \frac{1}{\exp(2.12)} = \exp(-2.12) = 0.12</math> अस्पताल <i>A</i> के सापेक्ष अस्पताल <i>B</i> का संकट अनुपात है। | ||
# | # हम अस्पतालों के बीच जीवित रहने की <i>संभावनाओं</i> के बारे में कोई अनुमान नहीं लगा सकते है। ऐसा इसलिए है क्योंकि हमें आधारभूत संकट दर के अनुमान की आवश्यकता होती, <math>\lambda_0(t)</math>, साथ ही हमारा भी <math>\beta_1</math> अनुमान लगाया जाता है। चूँकि, कॉक्स आनुपातिक संकट नमूने का मानक अनुमान सामान्यतः आधारभूत संकट की दर का अनुमान नहीं लगाता है। | ||
# क्योंकि हमने | # क्योंकि हमने नमूना के एकमात्र समय-परिवर्तनशील घटक, आधारभूत संकट दर को देखते नहीं है, हमारा अनुमान समय स्केल-अपरिवर्तनीय होता है। उदाहरण के लिए, यदि हमने समय को महीनों के अतिरिक्त वर्षों में मापा होता, तो हमें वही अनुमान प्राप्त होता है। | ||
# यह कहना आकर्षक है कि अस्पताल ने दोनों समूहों के बीच | # यह कहना आकर्षक है कि अस्पताल ने दोनों समूहों के बीच संकटों में अंतर उत्पन्न किया था, लेकिन चूंकि हमारा अध्ययन कारणात्मक नहीं है (अर्थात्, हम नहीं जानते कि डेटा कैसे उत्पन्न हुआ), हम स्वीकृत होते है जैसी शब्दावली के साथ संबद्ध। | ||
====एक एकल सतत सहसंयोजक==== | ====एक एकल सतत सहसंयोजक==== | ||
उत्तरजीविता विश्लेषण के कम पारंपरिक उपयोग के | उत्तरजीविता विश्लेषण के कम पारंपरिक उपयोग के स्थिति को प्रदर्शित करने के लिए, अगला उदाहरण एक अर्थशास्त्र प्रश्न होता है: संगठनों के आईपीओ की 1 साल की सालगिरह पर मूल्य-से-आय अनुपात (पी/ई) और उनके भविष्य के अस्तित्व के बीच क्या संबंध होता है ? अधिक विशेष रूप से, यदि हम किसी संगठन के जन्म की घटना को उनकी 1-वर्षीय आईपीओ वर्षगांठ मानते है, और किसी दिवालियापन, बिक्री, निजी होने आदि को संगठन की मृत्यु की घटना मानते है, तो हम संगठनों के पी के प्रभाव को जानना चाहेंगे। | ||
प्रदान किया गया | प्रदान किया गया ए डेटासमूह है जिसमें 12 संगठनों के अस्तित्व डेटा होते है: <i>T</i> 1-वर्षीय आईपीओ वर्षगांठ और मृत्यु (या 2022-01-01 की अंतिम तिथि, यदि नहीं किया गया है) के बीच दिनों की संख्या का प्रतिनिधित्व करता है)। <i>सी</i> दर्शाता है कि संगठन 2022-01-01 से पहले समाप्त हो जाती है। पी/ई संगठनों की 1-वर्षीय आईपीओ वर्षगांठ पर मूल्य-से-आय अनुपात का प्रतिनिधित्व करता है। | ||
{| class="wikitable floatright" | {| class="wikitable floatright" | ||
|- | |- | ||
! | ! सीओ. | ||
! 1 | ! 1 साल की आईपीओ तारीख | ||
! | ! मौत की तिथि* | ||
! | ! सी | ||
! | ! टी | ||
! | ! पी/ई | ||
|- | |- | ||
| 0 | | 0 | ||
| 2000-11-05 | | 2000-11-05 | ||
| 2011-01-22 | | 2011-01-22 | ||
| | | सही | ||
| 3730 | | 3730 | ||
| 9.7 | | 9.7 | ||
Line 267: | Line 267: | ||
| 2000-12-01 | | 2000-12-01 | ||
| 2003-03-30 | | 2003-03-30 | ||
| | | सही | ||
| 849 | | 849 | ||
| 12.0 | | 12.0 | ||
Line 274: | Line 274: | ||
| 2011-01-05 | | 2011-01-05 | ||
| 2012-03-30 | | 2012-03-30 | ||
| | | सही | ||
| 450 | | 450 | ||
| 3.0 | | 3.0 | ||
Line 281: | Line 281: | ||
| 2010-05-29 | | 2010-05-29 | ||
| 2011-02-22 | | 2011-02-22 | ||
| | | सही | ||
| 269 | | 269 | ||
| 5.3 | | 5.3 | ||
Line 288: | Line 288: | ||
| 2005-06-23 | | 2005-06-23 | ||
| 2022-01-01 | | 2022-01-01 | ||
| | | गलत | ||
| 6036 | | 6036 | ||
| 10.8 | | 10.8 | ||
Line 295: | Line 295: | ||
| 2000-06-10 | | 2000-06-10 | ||
| 2002-07-24 | | 2002-07-24 | ||
| | | सही | ||
| 774 | | 774 | ||
| 6.3 | | 6.3 | ||
Line 302: | Line 302: | ||
| 2011-07-11 | | 2011-07-11 | ||
| 2014-05-01 | | 2014-05-01 | ||
| | | सही | ||
| 1025 | | 1025 | ||
| 11.6 | | 11.6 | ||
Line 309: | Line 309: | ||
| 2007-09-27 | | 2007-09-27 | ||
| 2022-01-01 | | 2022-01-01 | ||
| | | गलत | ||
| 5210 | | 5210 | ||
| 10.3 | | 10.3 | ||
Line 316: | Line 316: | ||
| 2006-07-30 | | 2006-07-30 | ||
| 2010-06-03 | | 2010-06-03 | ||
| | | सही | ||
| 1404 | | 1404 | ||
| 8.0 | | 8.0 | ||
Line 323: | Line 323: | ||
| 2000-07-13 | | 2000-07-13 | ||
| 2001-07-19 | | 2001-07-19 | ||
| | | सही | ||
| 371 | | 371 | ||
| 4.0 | | 4.0 | ||
Line 330: | Line 330: | ||
| 2013-06-10 | | 2013-06-10 | ||
| 2018-10-10 | | 2018-10-10 | ||
| | | सही | ||
| 1948 | | 1948 | ||
| 5.9 | | 5.9 | ||
Line 337: | Line 337: | ||
| 2011-07-16 | | 2011-07-16 | ||
| 2014-08-15 | | 2014-08-15 | ||
| | | सही | ||
| 1126 | | 1126 | ||
| 8.3 | | 8.3 | ||
|} | |} | ||
पिछले उदाहरण के विपरीत जहां एक | पिछले उदाहरण के विपरीत जहां एक द्विआधारी प्रकार था, इस डेटासमूह में एक सतत प्रकार, पी/ई है। चूँकि, नमूना समान दिखता है: | ||
::<math> | ::<math> | ||
\lambda(t|P_{i}) = \lambda_0(t)\cdot\exp(\beta_1 P_{i}) | \lambda(t|P_{i}) = \lambda_0(t)\cdot\exp(\beta_1 P_{i}) | ||
</math> | </math> | ||
जहाँ <math>P_i</math> किसी संगठन के पी/ई अनुपात का प्रतिनिधित्व करता है। कॉक्स नमूने के माध्यम से इस डेटासमूह को चलाने से अज्ञात के मूल्य का <i>अनुमान</i> उत्पन्न होता है <math>\beta_1</math>, जो -0.34 है। इसलिए, संपूर्ण संकट का एक अनुमान इस प्रकार है: | |||
::<math> | ::<math> | ||
\lambda(t|P_{i}) = \lambda_0(t)\cdot\exp(-0.34 P_{i}) | \lambda(t|P_{i}) = \lambda_0(t)\cdot\exp(-0.34 P_{i}) | ||
</math> | </math> | ||
आधारभूत | आधारभूत संकट के बाद से, <math>\lambda_0(t)</math>, यह अनुमान लगाया गया था, कि पूरे संकट की गणना नहीं की जा सकती है। चूँकि, संगठनों <i>i</i> और <i>j</i> के संकटों के अनुपात पर विचार करते है: | ||
::<math> | ::<math> | ||
Line 360: | Line 360: | ||
\end{align} | \end{align} | ||
</math> | </math> | ||
दाईं ओर सभी | दाईं ओर सभी स्थितियां ज्ञात होती है, इसलिए संगठनों के बीच संकटों के अनुपात की गणना करना संभव होता है। चूँकि दाईं ओर कोई समय-निर्भर शब्द नहीं होता है (सभी पद स्थिर है), संकट एक-दूसरे के लिए <i>आनुपातिक</i> होते है। उदाहरण के लिए, संगठन 5 से संगठन 2 का संकट अनुपात है <math>\exp(-0.34 (6.3 - 3.0)) = 0.33</math>. इसका मतलब यह है कि, अध्ययन के समय के भीतर, संगठन 5 की मृत्यु का संकट संगठन 2 की मृत्यु के संकट के बराबर 0.33 ≈ 1/3 है। | ||
व्याख्या के बारे में उल्लेख करने योग्य महत्वपूर्ण | व्याख्या के बारे में उल्लेख करने योग्य महत्वपूर्ण संकेत है: | ||
# <i> | # <i>संकट अनुपात</i> मात्रा है <math>\exp(\beta_1)</math>, जो है <math>\exp(-0.34) = 0.71</math> उपरोक्त उदाहरण में. उपरोक्त अंतिम गणना से, इसकी व्याख्या दो विषयों के बीच संकटों के अनुपात के रूप में होती है जिनके चर एक इकाई से भिन्न होते है: यदि <math>P_{i} = P_{j} + 1</math>, तब <math>\exp(\beta_1 (P_{i} - P_{j}) = \exp(\beta_1 (1))</math> एक इकाई त्रुटिहीन रूप से मूल्य का संचार करता है <math>\beta_1</math>. | ||
# | # आधारभूत संकट का प्रतिनिधित्व तब किया जा सकता है जब स्केलिंग वर्ग होता है, अर्थात <math>P=0</math>. <पी><math> | ||
\lambda(t|P_{i}=0) = \lambda_0(t)\cdot\exp(-0.34 \cdot 0) = \lambda_0(t) | \lambda(t|P_{i}=0) = \lambda_0(t)\cdot\exp(-0.34 \cdot 0) = \lambda_0(t) | ||
</math></p> क्या हम | </math></p> क्या हम आधारभूत संकट की व्याख्या उस आधारभूत संगठन के संकट के रूप में कर सकते है जिसका पी/ई 0 है? आधारभूत विषय के संकट के रूप में आधारभूत संकट की यह व्याख्या अपूर्ण होती है, क्योंकि यह संभव है कि सहसंयोजक 0 होना असंभव है। इस उपकरण में, 0 का पी/ई अर्थहीन होता है (इसका मतलब है कि संगठन का मूल्य 0 है, अर्थात, वे मर चुके है)। संकट की अधिक उपयुक्त व्याख्या तब होती है जब सभी चर शून्य होते है। | ||
# जैसे मूल्य को समझना और व्याख्या करना आकर्षक है <math>\exp(\beta_1 P_{i})</math> किसी | # जैसे मूल्य को समझना और व्याख्या करना आकर्षक होता है <math>\exp(\beta_1 P_{i})</math> किसी संगठन के संकट का प्रतिनिधित्व करने के लिए होता है। चूँकि, विचार करते है कि यह वास्तव में क्या दर्शाता है: <math>\exp(\beta_1 P_{i}) = \exp(\beta_1 (P_{i}-0))= \frac{\exp(\beta_1 P_{i})}{\exp(\beta_1 0)} = \frac{\lambda(t|P_{i})}{\lambda(t|0)}</math>. यहां संकटों का अनुपात स्पष्ट रूप से होता है, संगठन के संकट की तुलना 0 पी/ई वाली एक काल्पनिक आधारभूत संगठन से की जाती है। चूँकि, जैसा कि ऊपर बताया गया है, इस उपकरण में 0 का पी/ई असंभव होता है <math>\exp(\beta_1 P_{i})</math> इस उदाहरण में अर्थहीन होते है. चूँकि, संभावित संकटों के बीच अनुपात सार्थक होता है। | ||
==समय-परिवर्तनशील भविष्यवक्ता और गुणांक== | ==समय-परिवर्तनशील भविष्यवक्ता और गुणांक== | ||
समय पर निर्भर चर, समय पर निर्भर स्तर और प्रति विषय कई घटनाओं के विस्तार को एंडरसन और गिल की गिनती प्रक्रिया सूत्रीकरण द्वारा | समय पर निर्भर चर, समय पर निर्भर स्तर और प्रति विषय कई घटनाओं के विस्तार को एंडरसन और गिल की गिनती प्रक्रिया सूत्रीकरण द्वारा सम्मलित किया जा सकता है।<ref> | ||
{{cite journal | {{cite journal | ||
| doi = 10.1214/aos/1176345976 | | doi = 10.1214/aos/1176345976 | ||
Line 377: | Line 377: | ||
| year = 1982 | | year = 1982 | ||
| title = Cox's regression model for counting processes, a large sample study. | | title = Cox's regression model for counting processes, a large sample study. | ||
| journal = Annals of Statistics |volume = 10 | issue=4 | pages = 1100–1120 | jstor=2240714| doi-access = free}}</ref> समय-भिन्न प्रतिगामी के साथ | | journal = Annals of Statistics |volume = 10 | issue=4 | pages = 1100–1120 | jstor=2240714| doi-access = free}}</ref> समय-भिन्न प्रतिगामी के साथ संकट नमूने का उपयोग एक उदाहरण बेरोजगारी बीमा के प्रभाव का अनुमान लगाना होता है।<ref>{{cite journal |last=Meyer |first=B. D. |year=1990 |title=बेरोजगारी बीमा और बेरोजगारी मंत्र|journal=Econometrica |volume=58 |issue=4 |pages=757–782 |jstor=2938349 |doi=10.2307/2938349 |url=http://www.nber.org/papers/w2546.pdf }}</ref><ref>{{cite journal |last=Bover |first=O. |first2=M. |last2=Arellano |author-link2=Manuel Arellano |first3=S. |last3=Bentolila |year=2002 |title=बेरोजगारी की अवधि, लाभ की अवधि और व्यापार चक्र|journal=The Economic Journal |volume=112 |issue=479 |pages=223–265 |doi=10.1111/1468-0297.00034 |url=http://www.bde.es/f/webbde/Secciones/Publicaciones/PublicacionesSeriadas/EstudiosEconomicos/azul57e.pdf }}</ref> | ||
समय-भिन्न सहसंयोजकों ( | |||
समय-भिन्न सहसंयोजकों (अर्थात, भविष्यवक्ताओं) की अनुमति देने के अतिरिक्त, कॉक्स नमूने को समय-भिन्न गुणांकों के लिए भी सामान्यीकृत किया जा सकता है। अर्थात्, उपचार का आनुपातिक प्रभाव समय के साथ भिन्न हो सकता है, जैसे यदि कोई दवा रुग्णता के एक महीने के भीतर दी जाए तो वह बहुत प्रभावी हो सकती है, और समय बीतने के साथ कम प्रभावी हो जाती है। तब गुणांक के समय (स्थिरता) के साथ कोई परिवर्तन नहीं होने की परिकल्पना का परीक्षण किया जा सकता है। विवरण और सॉफ्टवेयर (आर (प्रोग्रामिंग भाषा)पैकेज) मार्टिनुसेन और शेइक (2006) में उपलब्ध है।<ref>{{cite book |last=Martinussen |last2=Scheike |year=2006 |title=उत्तरजीविता डेटा के लिए गतिशील प्रतिगमन मॉडल|publisher=Springer |isbn=978-0-387-20274-7 |doi=10.1007/0-387-33960-4 }}</ref><ref>{{cite web |title=timereg: Flexible Regression Models for Survival Data |work=CRAN |url=https://cran.r-project.org/web/packages/timereg/index.html }}</ref> | |||
इस संदर्भ में, यह भी उल्लेख किया जा सकता है कि योगात्मक संकटों का उपयोग करके सहसंयोजकों के प्रभाव को निर्दिष्ट करना सैद्धांतिक रूप से संभव होता है,<ref>{{cite conference | |||
| last = Cox |first = D. R. |author-link= David Cox (statistician) | | last = Cox |first = D. R. |author-link= David Cox (statistician) | ||
| title = Some remarks on the analysis of survival data | | title = Some remarks on the analysis of survival data | ||
| conference = the First Seattle Symposium of Biostatistics: Survival Analysis | | conference = the First Seattle Symposium of Biostatistics: Survival Analysis | ||
| year = 1997 }}</ref> | | year = 1997 }}</ref> अर्थात निर्दिष्ट करता है | ||
::<math> | ::<math> | ||
\lambda(t|X_i) = \lambda_0(t) + \beta_1X_{i1} + \cdots + \beta_pX_{ip} = \lambda_0(t) + X_i \cdot \beta. | \lambda(t|X_i) = \lambda_0(t) + \beta_1X_{i1} + \cdots + \beta_pX_{ip} = \lambda_0(t) + X_i \cdot \beta. | ||
</math> | </math> | ||
यदि ऐसे योगात्मक | यदि ऐसे योगात्मक संकटों के नमूने का उपयोग उन स्थितियों में किया जाता है जहां (लॉग-)संभावना अधिकतमकरण उद्देश्य होते है, तो इसे सावधानी से प्रतिबंधित करा जाता है <math>\lambda(t\mid X_i)</math> गैर-ऋणात्मक मानों के लिए संभवतः इसी जटिलता के परिणामस्वरूप ऐसे नमूने कम ही देखने को मिलते है। यदि उद्देश्य न्यूनतम वर्ग है तो गैर-ऋणात्मक प्रतिबंध की आवश्यकता नहीं होती है। | ||
== | ==आधारभूत संकट फलन निर्दिष्ट करना== | ||
कॉक्स | कॉक्स नमूने को विशिष्ट बनाया जा सकता है यदि यह मानने का कोई कारण उपस्थित होता है कि आधारभूत संकट एक विशेष रूप का अनुसरण करता है। इस स्थिति में, आधारभूत संकट <math>\lambda_0(t)</math> किसी दिए गए फलन द्वारा प्रतिस्थापित किया जाता है। उदाहरण के लिए, संकट फलन को वेइबुल वितरण संचयी वितरण फलन मानने से वेइबुल आनुपातिक संकट नमूना प्राप्त होता है। | ||
संयोग से, वेइबुल | संयोग से, वेइबुल आधारभूत संकट का उपयोग नमूने आनुपातिक संकटों और त्वरित विफलता समय नमूने दोनों को संतुष्ट करता है। | ||
सामान्य शब्द | सामान्य शब्द प्राचलिक आनुपातिक संकट नमूने का उपयोग आनुपातिक संकट नमूने का वर्णन करने के लिए किया जा सकता है जिसमें संकट कार्य निर्दिष्ट होते है। इसके विपरीत कॉक्स आनुपातिक संकट नमूने को कभी-कभी [[अर्धपैरामीट्रिक मॉडल|अर्धप्राचलिक नमूना]] कहा जाता है। | ||
कुछ लेखक अंतर्निहित | कुछ लेखक अंतर्निहित संकट के कार्य को निर्दिष्ट करते समय भी कॉक्स आनुपातिक संकट नमूने शब्द का उपयोग करते है।<ref>{{cite journal |last=Bender |first=R. |last2=Augustin |first2=T. |last3=Blettner |first3=M. |year=2006 |title=कॉक्स आनुपातिक खतरों के मॉडल का अनुकरण करने के लिए जीवित रहने का समय उत्पन्न करना|journal=[[Statistics in Medicine (journal)|Statistics in Medicine]] |volume=24 |issue= 11|pages=1713–1723 |doi=10.1002/sim.2369 |pmid=16680804 }}</ref> | ||
कॉक्स | कॉक्स प्रतिगमन नमूना (आनुपातिक संकटों को छोड़ना) शब्द का उपयोग कभी-कभी समय-निर्भर कारकों को सम्मलित करने के लिए कॉक्स नमूना के विस्तार का वर्णन करने के लिए किया जाता है। चूँकि, यह उपयोग संभावित रूप से अस्पष्ट होते है क्योंकि कॉक्स आनुपातिक संकट नमूना स्वयं एक प्रतिगमन नमूने के रूप में वर्णित किया जा सकता है। | ||
==पॉइसन | ==पॉइसन नमूना से संबंध== | ||
आनुपातिक | आनुपातिक संकटों के नमूने और [[पॉइसन प्रतिगमन]] नमूने के बीच एक संबंध होता है जिसे कभी-कभी पॉइसन प्रतिगमन के लिए सॉफ़्टवेयर में अनुमानित आनुपातिक संकटों के नमूना को उपयुक्त करने के लिए उपयोग किया जाता है। ऐसा करने का सामान्य कारण यह है कि गणना बहुत तेज होती है। धीमे कंप्यूटरों के दिनों में यह अधिक महत्वपूर्ण था लेकिन विशेष रूप से बड़े डेटा समूह या जटिल समस्याओं के लिए अभी भी उपयोगी हो सकता है। लैयर्ड और ओलिवियर (1981)<ref> | ||
{{cite journal|doi=10.2307/2287816|author=Nan Laird and Donald Olivier | {{cite journal|doi=10.2307/2287816|author=Nan Laird and Donald Olivier | ||
|title=Covariance Analysis of Censored Survival Data Using Log-Linear Analysis Techniques | |title=Covariance Analysis of Censored Survival Data Using Log-Linear Analysis Techniques | ||
|journal=Journal of the American Statistical Association | |journal=Journal of the American Statistical Association | ||
|volume=76|issue=374|year=1981|pages=231–240 | jstor=2287816}}</ref> गणितीय विवरण प्रदान | |volume=76|issue=374|year=1981|pages=231–240 | jstor=2287816}}</ref> गणितीय विवरण प्रदान करते है वे ध्यान देते है, हम यह नहीं मानते है कि [पॉइसन नमूना] सत्य है, लेकिन इसे केवल संभावना प्राप्त करने के लिए एक उपकरण के रूप में उपयोग करते है। मैक्कलघ और नेल्डर का<ref> | ||
{{cite book|author=P. McCullagh and J. A. Nelder | {{cite book|author=P. McCullagh and J. A. Nelder | ||
|edition=Second|year=2000 | |edition=Second|year=2000 | ||
Line 413: | Line 416: | ||
|chapter=Chapter 13: Models for Survival Data | |chapter=Chapter 13: Models for Survival Data | ||
|isbn=978-0-412-31760-6}} (Second edition 1989; first CRC reprint 1999.) | |isbn=978-0-412-31760-6}} (Second edition 1989; first CRC reprint 1999.) | ||
</ref> [[सामान्यीकृत रैखिक मॉडल]] पर पुस्तक में आनुपातिक | </ref> [[सामान्यीकृत रैखिक मॉडल|सामान्यीकृत रैखिक नमूने]] पर पुस्तक में आनुपातिक संकटों के नमूने को सामान्यीकृत रैखिक नमूने में परिवर्तित करने पर एक अध्याय है। | ||
==उच्च-आयामी | ==उच्च-आयामी समूह के अंतर्गत== | ||
उच्च-आयाम में, जब नमूना आकार n की तुलना में सहसंयोजक p की संख्या बड़ी होती है, तो [[लैस्सो (सांख्यिकी)]] | उच्च-आयाम में, जब नमूना आकार n की तुलना में सहसंयोजक p की संख्या बड़ी होती है, तो [[लैस्सो (सांख्यिकी)]] मौलिक नमूना-चयन रणनीतियों में से एक होता है। (1997) में आनुपातिक संकट प्रतिगमन प्राचल के लिए एक लासो प्रक्रिया प्रस्तावित की गयी थी।<ref>{{cite journal |first=R. |last=Tibshirani |year=1997 |title=कॉक्स मॉडल में चर चयन के लिए लैस्सो विधि|journal=[[Statistics in Medicine (journal)|Statistics in Medicine]] |volume=16 |issue=4 |pages=385–395 |doi=10.1002/(SICI)1097-0258(19970228)16:4<385::AID-SIM380>3.0.CO;2-3 |citeseerx=10.1.1.411.8024 }}</ref> प्रतिगमन प्राचल β के लैस्सो अनुमानक को L1-मानदंड L के अनुसार कॉक्स आंशिक लॉग-संभावना के विपरीत के न्यूनतम के रूप में परिभाषित किया गया है।<sup>1</sup> | ||
::<math> | ::<math> | ||
Line 424: | Line 427: | ||
, | , | ||
</math> | </math> | ||
इस विषय पर हाल ही में सैद्धांतिक प्रगति हुई है।<ref name="Bradic et al. (2012)">{{cite journal |first=J. |last=Bradić |first2=J. |last2=Fan|first3=J. |last3=Jiang|year=2011 |title=एनपी-आयामीता के साथ कॉक्स के आनुपातिक खतरों के मॉडल के लिए नियमितीकरण|journal=[[Annals of Statistics]] |volume=39 |issue=6 |pages=3092–3120 |doi=10.1214/11-AOS911 |pmid=23066171 |pmc=3468162 |arxiv=1010.5233 | इस विषय पर हाल ही में सैद्धांतिक प्रगति हुई है।<ref name="Bradic et al. (2012)">{{cite journal |first=J. |last=Bradić |first2=J. |last2=Fan|first3=J. |last3=Jiang|year=2011 |title=एनपी-आयामीता के साथ कॉक्स के आनुपातिक खतरों के मॉडल के लिए नियमितीकरण|journal=[[Annals of Statistics]] |volume=39 |issue=6 |pages=3092–3120 |doi=10.1214/11-AOS911 |pmid=23066171 |pmc=3468162 |arxiv=1010.5233 }}</ref><ref name="Kong and Nan (2012)">{{cite journal |first=S. |last=Kong |first2=B. |last2=Nan |title=लैस्सो के माध्यम से उच्च-आयामी कॉक्स प्रतिगमन के लिए गैर-स्पर्शोन्मुख दैवज्ञ असमानताएँ|journal=[[Statistica Sinica]] |year=2014 |volume=24 |issue=1 |pages=25–42 |doi=10.5705/ss.2012.240 |pmid=24516328 |pmc=3916829 |arxiv=1204.1992 }}</ref><ref name="Huang et al. (2013)">{{cite journal |first=J. |last=Huang |first2=T. |last2=Sun|first3=Z. |last3=Ying|first4=Y. |last4=Yu |first5= C. H. |last5=Zhang |year=2011 |title=कॉक्स मॉडल में लैस्सो के लिए ओरेकल असमानताएँ|journal=The Annals of Statistics |volume=41 |issue=3 |pages=1142–1165 |doi=10.1214/13-AOS1098|pmid=24086091 |pmc=3786146 |arxiv=1306.4847 }}</ref> | ||
==सॉफ़्टवेयर कार्यान्वयन== | ==सॉफ़्टवेयर कार्यान्वयन== | ||
* <b>गणित</b>: <code>CoxModelFit</code> | * <b>गणित</b>: <code>CoxModelFit</code> फलन।<ref>{{cite web |title=कॉक्समॉडलफिट|url=https://reference.wolfram.com/language/ref/CoxModelFit.html |website=Wolfram Language & System Documentation Center}}</ref> | ||
* <b>आर</b>: <code>coxph()</code> | * <b>आर</b>: <code>coxph()</code> फलन, <b>उत्तरजीविता</b> पैकेज में स्थित है। | ||
* <b>एसएएस</b>: <code>phreg</code> प्रक्रिया | * <b>एसएएस</b>: <code>phreg</code> प्रक्रिया | ||
* <b>स्टेटा</b>: <code>stcox</code> आज्ञा | * <b>स्टेटा</b>: <code>stcox</code> आज्ञा | ||
* <b>पायथन</b>: <code>CoxPHFitter</code> <b>लाइफलाइन्स</b> लाइब्रेरी में स्थित है। <code>phreg</code> | * <b>पायथन</b>: <code>CoxPHFitter</code> <b>लाइफलाइन्स</b> लाइब्रेरी में स्थित है। <code>phreg</code> स्टेटनमूना लाइब्रेरी में। | ||
* <b>एसपीएसएस</b>: <b>कॉक्स रिग्रेशन</b> के अंतर्गत उपलब्ध है। | * <b>एसपीएसएस</b>: <b>कॉक्स रिग्रेशन</b> के अंतर्गत उपलब्ध है। | ||
* <b>मतलब</b>: <code>coxphfit</code> | * <b>मतलब</b>: <code>coxphfit</code> फलन | ||
* <b>जूलिया</b>: <b>Survival.jl</b> लाइब्रेरी में उपलब्ध है। | * <b>जूलिया</b>: <b>Survival.jl</b> लाइब्रेरी में उपलब्ध है। | ||
* <b>जेएमपी</b>: <b>फिट आनुपातिक | * <b>जेएमपी</b>: <b>फिट आनुपातिक संकटों</b> प्लेटफॉर्म में उपलब्ध है। | ||
* <b>प्रिज्म</b>: | * <b>प्रिज्म</b>: उत्तरजीविता विश्लेषण और बहु प्रकार विश्लेषण में उपलब्ध | ||
==यह भी देखें== | ==यह भी देखें== | ||
{{Portal|Mathematics}} | {{Portal|Mathematics}} | ||
* त्वरित विफलता समय | * त्वरित विफलता समय नमूना | ||
* [[दस में से एक नियम]] | * [[दस में से एक नियम]] | ||
* [[वेइबुल वितरण]] | * [[वेइबुल वितरण]] |
Revision as of 02:07, 14 July 2023
आनुपातिक संकट नमूना सांख्यिकी में उत्तरजीविता विश्लेषण का एक वर्ग होता है। उत्तरजीविता नमूना किसी घटना के घटित होने से पहले बीतने वाले समय को एक या अधिक सहसंयोजकों से जोड़ता है। आनुपातिक संकटों के नमूने में, सहसंयोजक में एक इकाई वृद्धि का अनूठा प्रभाव संकट की दर के संबंध में गुणक होता है। उदाहरण के लिए, दवा लेने से स्ट्रोक होने की संकट दर आधी हो सकती है, या, जिस सामग्री से निर्मित घटक का निर्माण किया जाता है उसे बदलने से विफलता की संकट दर दोगुनी हो सकती है। अन्य प्रकार के उत्तरजीविता नमूना जैसे त्वरित विफलता समय नमूना आनुपातिक संकटों को प्रदर्शित नहीं करते है। त्वरित विफलता समय नमूना उस स्थिति का वर्णन करता है जहां किसी घटना का जैविक या यांत्रिक जीवन इतिहास त्वरित (या धीमा) हो जाता है।ka
पृष्ठभूमि
उत्तरजीविता नमूना को दो भागों से मिलकर देखा जा सकता है: अंतर्निहित आधारभूत संकट फलन, जिसे अधिकांशतः दर्शाया जाता है , यह वर्णन करते हुए कि सहसंयोजकों के आधारभूत स्तरों पर प्रति समय इकाई घटना का संकट समय के साथ कैसे बदलता है, और प्रभाव प्राचल, यह वर्णन करते है कि व्याख्यात्मक सहसंयोजकों की प्रतिक्रिया में संकट कैसे भिन्न होता है। एक विशिष्ट चिकित्सा उदाहरण में परिवर्तनशीलता को कम करने और भ्रम को नियंत्रित करने के लिए सहसंयोजक जैसे उपचार, साथ ही रोगी की विशेषताएं जैसे अध्ययन की प्रारंभ में उम्र, लिंग और अध्ययन की प्रारंभ में अन्य बीमारियों की उपस्थिति सम्मलित होती है।
आनुपातिक संकटों की स्थिति[1] बताता है कि सहसंयोजक संकट से गुणात्मक रूप से संबंधित है। स्थिर गुणांक के सबसे सरल स्थिति में, उदाहरण के लिए, किसी दवा के साथ उपचार, किसी भी समय किसी विषय के संकट को आधा कर सकता है , जबकि आधारभूत संकट भिन्न हो सकता है। चूँकि, ध्यान दें कि इससे विषय का जीवनकाल दोगुना नहीं होता है, जीवनकाल पर सहसंयोजकों का त्रुटिहीन प्रभाव किस प्रकार पर निर्भर करता है . यह सहसंयोजक द्विआधारी भविष्यवक्ताओं तक ही सीमित नहीं होता है, सतत सहसंयोजक के स्थिति में , सामान्यतः यह माना जाता है कि संकट तेजी से प्रतिक्रिया करता है, प्रत्येक इकाई में वृद्धि होती है इसके परिणामस्वरूप संकट आनुपातिक रूप से बढ़ जाता है।
कॉक्स नमूना
परिचय
डेविड कॉक्स (सांख्यिकीविद्) ने देखा कि यदि आनुपातिक संकटों की धारणा स्वीकृत है (या, स्वीकृत मानी जाती है) तो प्रभाव प्राचल का अनुमान लगाना संभव होता है, जिसे दर्शाया जाता है नीचे, पूर्ण संकट फलन पर कोई विचार किए बिना उत्तरजीविता डेटा के इस दृष्टिकोण को कॉक्स आनुपातिक संकट नमूना का अनुप्रयोग कहा जाता है,[2] कभी-कभी इसे कॉक्स नमूना या आनुपातिक संकट नमूना के रूप में संक्षिप्त किया जाता है।[3] चूँकि, कॉक्स ने यह भी कहा कि आनुपातिक संकटों की धारणा की जैविक व्याख्या अधिक कठिन हो सकती है।[4][5]
मान लेते है Xi = (Xi1, … , Xip) विषय i के लिए सहसंयोजकों के वास्तविक मूल्य कॉक्स आनुपातिक संकट नमूना के लिए संकट फलन का रूप होता है
यह अभिव्यक्ति सहसंयोजक वेक्टर (व्याख्यात्मक चर) एक्स के साथ विषय i के लिए समय टी पर संकट फलन प्रस्तुत करता हैi. ध्यान दें कि विषयों के बीच, आधारभूत संकट समरूप होते है (i पर कोई निर्भरता नहीं होती है)। विषयों के संकटों के बीच एकमात्र अंतर आधारभूत स्केलिंग कारक से आता है .
इसे आनुपातिक क्यों कहा जाता है
आरंभ करने के लिए, मान लीजिए कि हमारे पास केवल एक ही सहसंयोजक है, , और इसलिए एक एकल गुणांक, . बढ़ने के प्रभाव पर विचार करते है 1 इसके द्वारा:
हम देख सकते है कि एक सहसंयोजक को 1 से बढ़ाने से मूल संकट स्थिरांक से बढ़ जाता है . वस्तुओं को थोड़ा पुनर्व्यवस्थित करने पर, हम देखते है कि:
दायीं ओर का भाग समय के साथ स्थिर रहता है (किसी भी पद का कोई मतलब नहीं होता है)। इस संबंध, , को आनुपातिकता_(गणित) कहा जाता है।
अधिक सामान्यतः, सहसंयोजकों के साथ दो विषयों, i और j पर विचार करते है और । उनके संकटों के अनुपात पर विचार करते है:
दायीं ओर का भाग समय पर निर्भर नहीं होता है, केवल समय पर निर्भर कारक के रूप में, , समाप्त कर दिया जाता है। इस प्रकार दो विषयों के संकटों का अनुपात स्थिर होता है, अर्थात संकट आनुपातिक होता है।
अवरोधन पद का अभाव
प्रतिगमन नमूने में अधिकांशतः एक अवरोधन शब्द (जिसे स्थिर शब्द या पूर्वाग्रह शब्द भी कहा जाता है) का उपयोग किया जाता है। कॉक्स नमूने में आधारभूत संकट के कारण एक का अभाव होता है, , यह उसका स्थान ले लेता है। हम यह देखते कि क्या होगा यदि हम किसी भी तरह से निरूपित एक अवरोधन शब्द सम्मलित करते है :
जहां हमने पुनः परिभाषित किया है एक नया आधारभूत संकट बन जाता है, . इस प्रकार, आधारभूत संकट में संकट के सभी भाग सम्मलित होते है जो विषयों के सहसंयोजकों पर निर्भर नहीं होते है, जिसमें कोई भी अवरोधन शब्द सम्मलित होता है (जो परिभाषा के अनुसार सभी विषयों के लिए स्थिर होते है)।
अद्वितीय समय की संभावना
कॉक्स आंशिक संभावना, आधारभूत संकट फलन के ब्रेस्लो के अनुमान का उपयोग करके प्राप्त किया जाता है, इसे पूर्ण संभावना में उपयुक्त किया जाता है और फिर यह देखा जाता है कि परिणाम दो कारकों का एक उत्पाद है। पहला कारक नीचे दिखाई गई आंशिक संभावना है, जिसमें आधारभूत संकट समाप्त हो जाता है। दूसरा कारक प्रतिगमन गुणांक से मुक्त है और केवल सेंसरिंग (सांख्यिकी) के माध्यम से डेटा पर निर्भर करता है। किसी भी आनुपातिक संकट नमूने द्वारा अनुमानित सहसंयोजकों के प्रभाव को इस प्रकार संकट के अनुपात के रूप में रिपोर्ट किया जा सकता है।
समय Y पर विषय i के लिए देखी जाने वाली घटना के घटित होने की संभावनाi इस प्रकार लिखा जा सकता है:
जहाँ θj = exp(Xj ⋅ β) और सारांश विषयों j के समूह पर है जहां घटना समय Y से पहले नहीं हुई हैi (स्वयं विषय सहित)। सामान्यतः 0 <Li(β) ≤ 1. यह एक संभावना फलन आंशिक संभावना है: समय के साथ संकट के परिवर्तन के सहसंयोजकों के प्रभाव का अनुमान लगाया जा सकता है।
विषये सांख्यिकीय रूप से एक-दूसरे से स्वतंत्र होते है, सभी वास्तविक घटनाओं की संयुक्त संभावना[6] निम्नलिखित आंशिक संभावना होती है, जहां घटना को घटना सी द्वारा इंगित किया जाता हैi = 1:
संगत लॉग आंशिक संभावना है
नमूने मापदंडों के अधिकतम आंशिक संभावना अनुमान उत्पन्न करने के लिए इस फलन को β से अधिक बढ़ाया जा सकता है।
आंशिक अंक (सांख्यिकी) है
और आंशिक लॉग संभावना का हेस्सियन आव्यूह है
इस अंक फलन और हेस्सियन आव्यूह का उपयोग करके, न्यूटन की विधि का उपयोग करके आंशिक संभावना को अधिकतम किया जा सकता है। हेसियन आव्यूह का व्युत्क्रम, जिसका मूल्यांकन β के अनुमान पर किया जाता है, इसका उपयोग अनुमान के लिए अनुमानित विचरण-सहप्रसरण आव्यूह के रूप में किया जा सकता है, और प्रतिगमन गुणांक के लिए अनुमानित मानक त्रुटियां उत्पन्न करने के लिए इसका उपयोग किया जा सकता है।
बंधे हुए समय के उपस्थित होने की संभावना
उन स्थितियों को संभालने के लिए कई दृष्टिकोण प्रस्तावित किए गए है जिनमें समय डेटा में संबंध होता है। ब्रेस्लो की विधि उस दृष्टिकोण का वर्णन करती है जिसमें ऊपर वर्णित प्रक्रिया को असंशोधित रूप से उपयोग किया जाता है, तब भी जब संबंध उपस्थित होता है। एक वैकल्पिक दृष्टिकोण जिसे बेहतर परिणाम देने वाला माना जाता है वह एफ्रॉन की विधि होती है।[7] टीj अद्वितीय समय को निरूपित करता है, मान लेते है Hj सूचकांकों के समुच्चय को इस प्रकार निरूपित करता कि Yi= टीj और सीi= 1, और एमj= |एचj| एफ्रॉन का दृष्टिकोण निम्नलिखित आंशिक संभावना को अधिकतम करता है।
संगत लॉग आंशिक संभावना है
अंक फलन है
और हेस्सियन आव्यूह है
जहाँ
ध्यान दें कि जब hj शून्य है (समय tj के साथ सभी अवलोकन सेंसर किया गया है), इन अभिव्यक्तियों में सारांश को शून्य माना जाता है।
उदाहरण
व्यवहार में कॉक्स नमूने के कुछ व्यावहारिक उदाहरण नीचे दिए गए है।
एक एकल द्विआधारी सहसंयोजक
मान लेते है कि जिस अंतिम बिंदु में हम रुचि रखते है वह सर्जरी के बाद 5 साल की अवलोकन अवधि के समय में रोगी जीवित रहता है। मरीज़ 5 साल की अवधि के भीतर मर सकता है, और हम रिकॉर्ड करते है कि उनकी मृत्यु कब हुई, या मरीज़ 5 साल से अधिक जीवित रह सकते है, और हम केवल यह रिकॉर्ड करते है कि वे 5 साल से अधिक जीवित रहते है। सर्जरी दो अस्पतालों, A या B में से एक में की गई थी, और हमे यह जानना होता है कि क्या अस्पताल का स्थान 5 साल के जीवित रहने से जुड़ा होता है। विशेष रूप से, हम अस्पताल बी की तुलना में अस्पताल ए में की गई सर्जरी से संकट में सापेक्ष वृद्धि (या कमी) जानना चाहा जाता है। कुछ डेटा प्रदान किया जाता है, जहां प्रत्येक पंक्ति एक मरीज का प्रतिनिधित्व करते है: T यह दर्शाता है कि मृत्यु से पहले मरीज़ पर कितने समय तक निगरानी रखी जाती है या 5 साल (महीनों में मापा गया), और C दर्शाता है कि मरीज़ की मृत्यु 5 साल की अवधि में हुई थी या नहीं हुई थी। हमने अस्पताल को एक द्विआधारी प्रकार के रूप में एन्कोड किया जाता है जिसे X के रूप दर्शाया जाता है: 1 यदि अस्पताल A से है, 0 यदि अस्पताल B से है।
अस्पताल | एक्स | टी | सी |
---|---|---|---|
बी | 0 | 60 | गलत |
बी | 0 | 32 | सही |
बी | 0 | 60 | गलत |
बी | 0 | 60 | गलत |
बी | 0 | 60 | गलत |
ए | 1 | 4 | सही |
ए | 1 | 18 | सही |
ए | 1 | 60 | गलत |
ए | 1 | 9 | सही |
ए | 1 | 31 | सही |
ए | 1 | 53 | सही |
ए | 1 | 17 | सही |
हमारा एकल-सहसंयोजक कॉक्स आनुपातिक नमूना निम्नलिखित दिखाता है अस्पताल के प्रभाव का प्रतिनिधित्व करता है, और i प्रत्येक रोगी को अनुक्रमित करता है:
सांख्यिकीय सॉफ्टवेयर का उपयोग करके हम अनुमान लगा सकते है 2.12 संकट अनुपात इस मान का घातीय होते है, . इसका कारण जानने के लिए, विशेष रूप से संकटों के अनुपात पर विचार करता है:
इस प्रकार, अस्पताल ए और अस्पताल बी का संकट अनुपात है . एक पल के लिए सांख्यिकीय महत्व को अलग रखते हुए, हम यह कहते हुए एक उत्तर दे सकते है कि अस्पताल ए में मरीज़ अस्पताल बी की तुलना में किसी भी कम समय में मृत्यु के 8.3 गुना अधिक संकट से जुड़ा होता है।
व्याख्या के बारे में उल्लेख करने योग्य महत्वपूर्ण संकेत है:
- मृत्यु के 8.3 गुना अधिक संकट का मतलब यह नहीं है कि अस्पताल बी में 8.3 गुना अधिक मरीज मरेंगे: उत्तरजीविता विश्लेषण यह प्राप्त करता है कि घटनाएं कितनी जल्दी घटित होती है, न कि केवल यह कि वे घटित होती है या नहीं होता है।
- अधिक विशेष रूप से, मृत्यु का संकट एक दर का माप होता है। दर में इकाइयाँ होती है, जैसे मीटर प्रति सेकंड। चूँकि, एक सापेक्ष दर नहीं है: एक साइकिल किसी अन्य साइकिल (संदर्भ साइकिल) की तुलना में दो गुना तेज चल सकती है, बिना किसी इकाई को निर्दिष्ट किए हुए। इसी तरह, अस्पताल ए में मृत्यु का संकट (मृत्यु की दर) अस्पताल बी (संदर्भ समूह) में मृत्यु के संकट की तुलना में 8.3 गुना अधिक (तेज़) होता है।
- व्युत्क्रम मात्रा, अस्पताल A के सापेक्ष अस्पताल B का संकट अनुपात है।
- हम अस्पतालों के बीच जीवित रहने की संभावनाओं के बारे में कोई अनुमान नहीं लगा सकते है। ऐसा इसलिए है क्योंकि हमें आधारभूत संकट दर के अनुमान की आवश्यकता होती, , साथ ही हमारा भी अनुमान लगाया जाता है। चूँकि, कॉक्स आनुपातिक संकट नमूने का मानक अनुमान सामान्यतः आधारभूत संकट की दर का अनुमान नहीं लगाता है।
- क्योंकि हमने नमूना के एकमात्र समय-परिवर्तनशील घटक, आधारभूत संकट दर को देखते नहीं है, हमारा अनुमान समय स्केल-अपरिवर्तनीय होता है। उदाहरण के लिए, यदि हमने समय को महीनों के अतिरिक्त वर्षों में मापा होता, तो हमें वही अनुमान प्राप्त होता है।
- यह कहना आकर्षक है कि अस्पताल ने दोनों समूहों के बीच संकटों में अंतर उत्पन्न किया था, लेकिन चूंकि हमारा अध्ययन कारणात्मक नहीं है (अर्थात्, हम नहीं जानते कि डेटा कैसे उत्पन्न हुआ), हम स्वीकृत होते है जैसी शब्दावली के साथ संबद्ध।
एक एकल सतत सहसंयोजक
उत्तरजीविता विश्लेषण के कम पारंपरिक उपयोग के स्थिति को प्रदर्शित करने के लिए, अगला उदाहरण एक अर्थशास्त्र प्रश्न होता है: संगठनों के आईपीओ की 1 साल की सालगिरह पर मूल्य-से-आय अनुपात (पी/ई) और उनके भविष्य के अस्तित्व के बीच क्या संबंध होता है ? अधिक विशेष रूप से, यदि हम किसी संगठन के जन्म की घटना को उनकी 1-वर्षीय आईपीओ वर्षगांठ मानते है, और किसी दिवालियापन, बिक्री, निजी होने आदि को संगठन की मृत्यु की घटना मानते है, तो हम संगठनों के पी के प्रभाव को जानना चाहेंगे।
प्रदान किया गया ए डेटासमूह है जिसमें 12 संगठनों के अस्तित्व डेटा होते है: T 1-वर्षीय आईपीओ वर्षगांठ और मृत्यु (या 2022-01-01 की अंतिम तिथि, यदि नहीं किया गया है) के बीच दिनों की संख्या का प्रतिनिधित्व करता है)। सी दर्शाता है कि संगठन 2022-01-01 से पहले समाप्त हो जाती है। पी/ई संगठनों की 1-वर्षीय आईपीओ वर्षगांठ पर मूल्य-से-आय अनुपात का प्रतिनिधित्व करता है।
सीओ. | 1 साल की आईपीओ तारीख | मौत की तिथि* | सी | टी | पी/ई |
---|---|---|---|---|---|
0 | 2000-11-05 | 2011-01-22 | सही | 3730 | 9.7 |
1 | 2000-12-01 | 2003-03-30 | सही | 849 | 12.0 |
2 | 2011-01-05 | 2012-03-30 | सही | 450 | 3.0 |
3 | 2010-05-29 | 2011-02-22 | सही | 269 | 5.3 |
4 | 2005-06-23 | 2022-01-01 | गलत | 6036 | 10.8 |
5 | 2000-06-10 | 2002-07-24 | सही | 774 | 6.3 |
6 | 2011-07-11 | 2014-05-01 | सही | 1025 | 11.6 |
7 | 2007-09-27 | 2022-01-01 | गलत | 5210 | 10.3 |
8 | 2006-07-30 | 2010-06-03 | सही | 1404 | 8.0 |
9 | 2000-07-13 | 2001-07-19 | सही | 371 | 4.0 |
10 | 2013-06-10 | 2018-10-10 | सही | 1948 | 5.9 |
11 | 2011-07-16 | 2014-08-15 | सही | 1126 | 8.3 |
पिछले उदाहरण के विपरीत जहां एक द्विआधारी प्रकार था, इस डेटासमूह में एक सतत प्रकार, पी/ई है। चूँकि, नमूना समान दिखता है:
जहाँ किसी संगठन के पी/ई अनुपात का प्रतिनिधित्व करता है। कॉक्स नमूने के माध्यम से इस डेटासमूह को चलाने से अज्ञात के मूल्य का अनुमान उत्पन्न होता है , जो -0.34 है। इसलिए, संपूर्ण संकट का एक अनुमान इस प्रकार है:
आधारभूत संकट के बाद से, , यह अनुमान लगाया गया था, कि पूरे संकट की गणना नहीं की जा सकती है। चूँकि, संगठनों i और j के संकटों के अनुपात पर विचार करते है:
दाईं ओर सभी स्थितियां ज्ञात होती है, इसलिए संगठनों के बीच संकटों के अनुपात की गणना करना संभव होता है। चूँकि दाईं ओर कोई समय-निर्भर शब्द नहीं होता है (सभी पद स्थिर है), संकट एक-दूसरे के लिए आनुपातिक होते है। उदाहरण के लिए, संगठन 5 से संगठन 2 का संकट अनुपात है . इसका मतलब यह है कि, अध्ययन के समय के भीतर, संगठन 5 की मृत्यु का संकट संगठन 2 की मृत्यु के संकट के बराबर 0.33 ≈ 1/3 है।
व्याख्या के बारे में उल्लेख करने योग्य महत्वपूर्ण संकेत है:
- संकट अनुपात मात्रा है , जो है उपरोक्त उदाहरण में. उपरोक्त अंतिम गणना से, इसकी व्याख्या दो विषयों के बीच संकटों के अनुपात के रूप में होती है जिनके चर एक इकाई से भिन्न होते है: यदि , तब एक इकाई त्रुटिहीन रूप से मूल्य का संचार करता है .
- आधारभूत संकट का प्रतिनिधित्व तब किया जा सकता है जब स्केलिंग वर्ग होता है, अर्थात . <पी> क्या हम आधारभूत संकट की व्याख्या उस आधारभूत संगठन के संकट के रूप में कर सकते है जिसका पी/ई 0 है? आधारभूत विषय के संकट के रूप में आधारभूत संकट की यह व्याख्या अपूर्ण होती है, क्योंकि यह संभव है कि सहसंयोजक 0 होना असंभव है। इस उपकरण में, 0 का पी/ई अर्थहीन होता है (इसका मतलब है कि संगठन का मूल्य 0 है, अर्थात, वे मर चुके है)। संकट की अधिक उपयुक्त व्याख्या तब होती है जब सभी चर शून्य होते है।
- जैसे मूल्य को समझना और व्याख्या करना आकर्षक होता है किसी संगठन के संकट का प्रतिनिधित्व करने के लिए होता है। चूँकि, विचार करते है कि यह वास्तव में क्या दर्शाता है: . यहां संकटों का अनुपात स्पष्ट रूप से होता है, संगठन के संकट की तुलना 0 पी/ई वाली एक काल्पनिक आधारभूत संगठन से की जाती है। चूँकि, जैसा कि ऊपर बताया गया है, इस उपकरण में 0 का पी/ई असंभव होता है इस उदाहरण में अर्थहीन होते है. चूँकि, संभावित संकटों के बीच अनुपात सार्थक होता है।
समय-परिवर्तनशील भविष्यवक्ता और गुणांक
समय पर निर्भर चर, समय पर निर्भर स्तर और प्रति विषय कई घटनाओं के विस्तार को एंडरसन और गिल की गिनती प्रक्रिया सूत्रीकरण द्वारा सम्मलित किया जा सकता है।[8] समय-भिन्न प्रतिगामी के साथ संकट नमूने का उपयोग एक उदाहरण बेरोजगारी बीमा के प्रभाव का अनुमान लगाना होता है।[9][10]
समय-भिन्न सहसंयोजकों (अर्थात, भविष्यवक्ताओं) की अनुमति देने के अतिरिक्त, कॉक्स नमूने को समय-भिन्न गुणांकों के लिए भी सामान्यीकृत किया जा सकता है। अर्थात्, उपचार का आनुपातिक प्रभाव समय के साथ भिन्न हो सकता है, जैसे यदि कोई दवा रुग्णता के एक महीने के भीतर दी जाए तो वह बहुत प्रभावी हो सकती है, और समय बीतने के साथ कम प्रभावी हो जाती है। तब गुणांक के समय (स्थिरता) के साथ कोई परिवर्तन नहीं होने की परिकल्पना का परीक्षण किया जा सकता है। विवरण और सॉफ्टवेयर (आर (प्रोग्रामिंग भाषा)पैकेज) मार्टिनुसेन और शेइक (2006) में उपलब्ध है।[11][12]
इस संदर्भ में, यह भी उल्लेख किया जा सकता है कि योगात्मक संकटों का उपयोग करके सहसंयोजकों के प्रभाव को निर्दिष्ट करना सैद्धांतिक रूप से संभव होता है,[13] अर्थात निर्दिष्ट करता है
यदि ऐसे योगात्मक संकटों के नमूने का उपयोग उन स्थितियों में किया जाता है जहां (लॉग-)संभावना अधिकतमकरण उद्देश्य होते है, तो इसे सावधानी से प्रतिबंधित करा जाता है गैर-ऋणात्मक मानों के लिए संभवतः इसी जटिलता के परिणामस्वरूप ऐसे नमूने कम ही देखने को मिलते है। यदि उद्देश्य न्यूनतम वर्ग है तो गैर-ऋणात्मक प्रतिबंध की आवश्यकता नहीं होती है।
आधारभूत संकट फलन निर्दिष्ट करना
कॉक्स नमूने को विशिष्ट बनाया जा सकता है यदि यह मानने का कोई कारण उपस्थित होता है कि आधारभूत संकट एक विशेष रूप का अनुसरण करता है। इस स्थिति में, आधारभूत संकट किसी दिए गए फलन द्वारा प्रतिस्थापित किया जाता है। उदाहरण के लिए, संकट फलन को वेइबुल वितरण संचयी वितरण फलन मानने से वेइबुल आनुपातिक संकट नमूना प्राप्त होता है।
संयोग से, वेइबुल आधारभूत संकट का उपयोग नमूने आनुपातिक संकटों और त्वरित विफलता समय नमूने दोनों को संतुष्ट करता है।
सामान्य शब्द प्राचलिक आनुपातिक संकट नमूने का उपयोग आनुपातिक संकट नमूने का वर्णन करने के लिए किया जा सकता है जिसमें संकट कार्य निर्दिष्ट होते है। इसके विपरीत कॉक्स आनुपातिक संकट नमूने को कभी-कभी अर्धप्राचलिक नमूना कहा जाता है।
कुछ लेखक अंतर्निहित संकट के कार्य को निर्दिष्ट करते समय भी कॉक्स आनुपातिक संकट नमूने शब्द का उपयोग करते है।[14]
कॉक्स प्रतिगमन नमूना (आनुपातिक संकटों को छोड़ना) शब्द का उपयोग कभी-कभी समय-निर्भर कारकों को सम्मलित करने के लिए कॉक्स नमूना के विस्तार का वर्णन करने के लिए किया जाता है। चूँकि, यह उपयोग संभावित रूप से अस्पष्ट होते है क्योंकि कॉक्स आनुपातिक संकट नमूना स्वयं एक प्रतिगमन नमूने के रूप में वर्णित किया जा सकता है।
पॉइसन नमूना से संबंध
आनुपातिक संकटों के नमूने और पॉइसन प्रतिगमन नमूने के बीच एक संबंध होता है जिसे कभी-कभी पॉइसन प्रतिगमन के लिए सॉफ़्टवेयर में अनुमानित आनुपातिक संकटों के नमूना को उपयुक्त करने के लिए उपयोग किया जाता है। ऐसा करने का सामान्य कारण यह है कि गणना बहुत तेज होती है। धीमे कंप्यूटरों के दिनों में यह अधिक महत्वपूर्ण था लेकिन विशेष रूप से बड़े डेटा समूह या जटिल समस्याओं के लिए अभी भी उपयोगी हो सकता है। लैयर्ड और ओलिवियर (1981)[15] गणितीय विवरण प्रदान करते है वे ध्यान देते है, हम यह नहीं मानते है कि [पॉइसन नमूना] सत्य है, लेकिन इसे केवल संभावना प्राप्त करने के लिए एक उपकरण के रूप में उपयोग करते है। मैक्कलघ और नेल्डर का[16] सामान्यीकृत रैखिक नमूने पर पुस्तक में आनुपातिक संकटों के नमूने को सामान्यीकृत रैखिक नमूने में परिवर्तित करने पर एक अध्याय है।
उच्च-आयामी समूह के अंतर्गत
उच्च-आयाम में, जब नमूना आकार n की तुलना में सहसंयोजक p की संख्या बड़ी होती है, तो लैस्सो (सांख्यिकी) मौलिक नमूना-चयन रणनीतियों में से एक होता है। (1997) में आनुपातिक संकट प्रतिगमन प्राचल के लिए एक लासो प्रक्रिया प्रस्तावित की गयी थी।[17] प्रतिगमन प्राचल β के लैस्सो अनुमानक को L1-मानदंड L के अनुसार कॉक्स आंशिक लॉग-संभावना के विपरीत के न्यूनतम के रूप में परिभाषित किया गया है।1
इस विषय पर हाल ही में सैद्धांतिक प्रगति हुई है।[18][19][20]
सॉफ़्टवेयर कार्यान्वयन
- गणित:
CoxModelFit
फलन।[21] - आर:
coxph()
फलन, उत्तरजीविता पैकेज में स्थित है। - एसएएस:
phreg
प्रक्रिया - स्टेटा:
stcox
आज्ञा - पायथन:
CoxPHFitter
लाइफलाइन्स लाइब्रेरी में स्थित है।phreg
स्टेटनमूना लाइब्रेरी में। - एसपीएसएस: कॉक्स रिग्रेशन के अंतर्गत उपलब्ध है।
- मतलब:
coxphfit
फलन - जूलिया: Survival.jl लाइब्रेरी में उपलब्ध है।
- जेएमपी: फिट आनुपातिक संकटों प्लेटफॉर्म में उपलब्ध है।
- प्रिज्म: उत्तरजीविता विश्लेषण और बहु प्रकार विश्लेषण में उपलब्ध
यह भी देखें
- त्वरित विफलता समय नमूना
- दस में से एक नियम
- वेइबुल वितरण
टिप्पणियाँ
- ↑ Breslow, N. E. (1975). "Analysis of Survival Data under the Proportional Hazards Model". International Statistical Review / Revue Internationale de Statistique. 43 (1): 45–57. doi:10.2307/1402659. JSTOR 1402659.
- ↑ Cox, David R (1972). "प्रतिगमन मॉडल और जीवन तालिका". Journal of the Royal Statistical Society, Series B. 34 (2): 187–220. JSTOR 2985181. MR 0341758.
- ↑ Kalbfleisch, John D.; Schaubel, Douglas E. (10 March 2023). "कॉक्स मॉडल के पचास वर्ष". Annual Review of Statistics and Its Application (in English). 10 (1): 1–23. doi:10.1146/annurev-statistics-033021-014043. ISSN 2326-8298.
- ↑ Reid, N. (1994). "A Conversation with Sir David Cox". Statistical Science. 9 (3): 439–455. doi:10.1214/ss/1177010394.
- ↑ Cox, D. R. (1997). Some remarks on the analysis of survival data. the First Seattle Symposium of Biostatistics: Survival Analysis.
- ↑ "Each failure contributes to the likelihood function", Cox (1972), page 191.
- ↑ Efron, Bradley (1974). "सेंसर किए गए डेटा के लिए कॉक्स के संभावना फ़ंक्शन की दक्षता". Journal of the American Statistical Association. 72 (359): 557–565. doi:10.1080/01621459.1977.10480613. JSTOR 2286217.
- ↑ Andersen, P.; Gill, R. (1982). "Cox's regression model for counting processes, a large sample study". Annals of Statistics. 10 (4): 1100–1120. doi:10.1214/aos/1176345976. JSTOR 2240714.
- ↑ Meyer, B. D. (1990). "बेरोजगारी बीमा और बेरोजगारी मंत्र" (PDF). Econometrica. 58 (4): 757–782. doi:10.2307/2938349. JSTOR 2938349.
- ↑ Bover, O.; Arellano, M.; Bentolila, S. (2002). "बेरोजगारी की अवधि, लाभ की अवधि और व्यापार चक्र" (PDF). The Economic Journal. 112 (479): 223–265. doi:10.1111/1468-0297.00034.
- ↑ Martinussen; Scheike (2006). उत्तरजीविता डेटा के लिए गतिशील प्रतिगमन मॉडल. Springer. doi:10.1007/0-387-33960-4. ISBN 978-0-387-20274-7.
- ↑ "timereg: Flexible Regression Models for Survival Data". CRAN.
- ↑ Cox, D. R. (1997). Some remarks on the analysis of survival data. the First Seattle Symposium of Biostatistics: Survival Analysis.
- ↑ Bender, R.; Augustin, T.; Blettner, M. (2006). "कॉक्स आनुपातिक खतरों के मॉडल का अनुकरण करने के लिए जीवित रहने का समय उत्पन्न करना". Statistics in Medicine. 24 (11): 1713–1723. doi:10.1002/sim.2369. PMID 16680804.
- ↑ Nan Laird and Donald Olivier (1981). "Covariance Analysis of Censored Survival Data Using Log-Linear Analysis Techniques". Journal of the American Statistical Association. 76 (374): 231–240. doi:10.2307/2287816. JSTOR 2287816.
- ↑ P. McCullagh and J. A. Nelder (2000). "Chapter 13: Models for Survival Data". Generalized Linear Models (Second ed.). Boca Raton, Florida: Chapman & Hall/CRC. ISBN 978-0-412-31760-6. (Second edition 1989; first CRC reprint 1999.)
- ↑ Tibshirani, R. (1997). "कॉक्स मॉडल में चर चयन के लिए लैस्सो विधि". Statistics in Medicine. 16 (4): 385–395. CiteSeerX 10.1.1.411.8024. doi:10.1002/(SICI)1097-0258(19970228)16:4<385::AID-SIM380>3.0.CO;2-3.
- ↑ Bradić, J.; Fan, J.; Jiang, J. (2011). "एनपी-आयामीता के साथ कॉक्स के आनुपातिक खतरों के मॉडल के लिए नियमितीकरण". Annals of Statistics. 39 (6): 3092–3120. arXiv:1010.5233. doi:10.1214/11-AOS911. PMC 3468162. PMID 23066171.
- ↑ Kong, S.; Nan, B. (2014). "लैस्सो के माध्यम से उच्च-आयामी कॉक्स प्रतिगमन के लिए गैर-स्पर्शोन्मुख दैवज्ञ असमानताएँ". Statistica Sinica. 24 (1): 25–42. arXiv:1204.1992. doi:10.5705/ss.2012.240. PMC 3916829. PMID 24516328.
- ↑ Huang, J.; Sun, T.; Ying, Z.; Yu, Y.; Zhang, C. H. (2011). "कॉक्स मॉडल में लैस्सो के लिए ओरेकल असमानताएँ". The Annals of Statistics. 41 (3): 1142–1165. arXiv:1306.4847. doi:10.1214/13-AOS1098. PMC 3786146. PMID 24086091.
- ↑ "कॉक्समॉडलफिट". Wolfram Language & System Documentation Center.
संदर्भ
- Bagdonavicius, V.; Levuliene, R.; Nikulin, M. (2010). "Goodness-of-fit Criteria for the Cox model from Left Truncated and Right Censored Data". Journal of Mathematical Sciences. 167 (4): 436–443. doi:10.1007/s10958-010-9929-6.
- Cox, D. R.; Oakes, D. (1984). Analysis of Survival Data. New York: Chapman & Hall. ISBN 978-0412244902.
- Collett, D. (2003). Modelling Survival Data in Medical Research (2nd ed.). Boca Raton: CRC. ISBN 978-1584883258.
- Gouriéroux, Christian (2000). "Duration Models". Econometrics of Qualitative Dependent Variables. New York: Cambridge University Press. pp. 284–362. ISBN 978-0-521-58985-7.
- Singer, Judith D.; Willett, John B. (2003). "Fitting Cox Regression Models". Applied Longitudinal Data Analysis: Modeling Change and Event Occurrence. New York: Oxford University Press. pp. 503–542. ISBN 978-0-19-515296-8.
- Therneau, T. M.; Grambsch, P. M. (2000). Modeling Survival Data: Extending the Cox Model. New York: Springer. ISBN 978-0387987842.