ऑर्डर लॉगिट: Difference between revisions
(Created page with "{{short description|Regression model for ordinal dependent variables}} {{Regression bar}} आँकड़ों में, ऑर्डर किया गया लॉगि...") |
No edit summary |
||
Line 2: | Line 2: | ||
{{Regression bar}} | {{Regression bar}} | ||
सांख्यिकी में, '''ऑर्डर लॉगिट मॉडल''' ('''ऑर्डर लॉजिस्टिक रिग्रेशन''' या '''आनुपातिक ऑड्स मॉडल''') एक [[क्रमिक प्रतिगमन|क्रमसूचक प्रतिगमन]] मॉडल है - यानी, माप के स्तर ऑर्डिनल प्रकार के आश्रित चर के लिए एक रिग्रेशन विश्लेषण मॉडल है- जिसे पहले [[पीटर मैक्कुलघ]] ने माना था।<ref>{{cite journal |first=Peter |last=McCullagh |title=सामान्य डेटा के लिए प्रतिगमन मॉडल|journal=[[Journal of the Royal Statistical Society]] |series=Series B (Methodological) |volume=42 |issue=2 |year=1980 |pages=109–142 |jstor=2984952 }}</ref> उदाहरण के लिए, यदि किसी सर्वेक्षण में एक प्रश्न का उत्तर लिकर्ट मापन द्वारा दिया जाना है कि <nowiki>''गरीब'', ''निष्पक्ष'', ''अच्छा'', ''बहुत अच्छा'' और ''उत्कृष्ट''</nowiki> के बीच चयन, और विश्लेषण का उद्देश्य यह देखना है कि प्रतिक्रियाओं द्वारा उस प्रतिक्रिया की कितनी अच्छी भविष्यवाणी की जा सकती है अन्य प्रश्नों के लिए, जिनमें से कुछ मात्रात्मक हो सकते हैं, तो आदेशित [[ संभार तन्त्र परावर्तन ]] का उपयोग किया जा सकता है। इसे लॉजिस्टिक रिग्रेशन मॉडल के विस्तार के रूप में सोचा जा सकता है जो द्विभाजित आश्रित चर पर लागू होता है, जो दो से अधिक (आदेशित) प्रतिक्रिया श्रेणियों की अनुमति देता है। | |||
==मॉडल और आनुपातिक बाधाओं की धारणा== | ==मॉडल और आनुपातिक बाधाओं की धारणा== | ||
मॉडल केवल उस डेटा पर लागू होता है जो आनुपातिक बाधाओं की धारणा को पूरा करता है, जिसका अर्थ निम्नानुसार उदाहरण दिया जा सकता है। मान लीजिए कि पाँच परिणाम हैं: ख़राब, निष्पक्ष, अच्छा, बहुत अच्छा और | मॉडल केवल उस डेटा पर लागू होता है जो आनुपातिक बाधाओं की धारणा को पूरा करता है, जिसका अर्थ निम्नानुसार उदाहरण दिया जा सकता है। मान लीजिए कि पाँच परिणाम हैं: <nowiki>''</nowiki>ख़राब<nowiki>''</nowiki>, <nowiki>''</nowiki>निष्पक्ष<nowiki>''</nowiki>, <nowiki>''</nowiki>अच्छा<nowiki>''</nowiki>, <nowiki>''</nowiki>बहुत अच्छा<nowiki>''</nowiki> और <nowiki>''</nowiki>उत्कृष्ट<nowiki>''</nowiki>। हम मानते हैं कि इन परिणामों की संभावनाएँ द्वारा दी गई हैं p<sub>1</sub>(x), p<sub>2</sub>(x), p<sub>3</sub>(x), p<sub>4</sub>(x), p<sub>5</sub>(x), ये सभी कुछ स्वतंत्र चर x के फलन हैं। फिर, x के एक निश्चित मान के लिए, कुछ निश्चित तरीकों से उत्तर देने की संभावनाओं के लघुगणक (संभावनाओं के लघुगणक नहीं) हैं: | ||
: <math> | : <math> | ||
Line 16: | Line 16: | ||
\end{array} | \end{array} | ||
</math> | </math> | ||
आनुपातिक बाधाओं की धारणा बताती है कि इनमें से प्रत्येक लघुगणक में अगला प्राप्त करने के लिए जोड़ी गई संख्याएँ ''x'' की परवाह किए बिना समान हैं। दूसरे शब्दों में, खराब या ठीक स्वास्थ्य होने की संभावना के लघुगणक में से खराब स्वास्थ्य होने का लघुगणक घटाने के बीच का अंतर ''x'' की परवाह किए बिना समान है; इसी तरह, खराब, निष्पक्ष, या अच्छे स्वास्थ्य होने की संभावना का लघुगणक माइनस खराब या उचित स्वास्थ्य होने का लघुगणक ''x'' की परवाह किए बिना समान है; वगैरह।<ref>{{cite web |title=rologit.pdf|url=https://www.stata.com/manuals/rologit.pdf|publisher=Stata}}</ref> बहु-आदेशित प्रतिक्रिया श्रेणियों के उदाहरणों में बांड रेटिंग, दृढ़ता से सहमत से लेकर दृढ़ता से असहमत तक की प्रतिक्रियाओं के साथ राय सर्वेक्षण, सरकारी कार्यक्रमों पर राज्य के खर्च का स्तर (उच्च, मध्यम या निम्न), चुने गए बीमा कवरेज का स्तर (कोई नहीं, आंशिक) | '''आनुपातिक बाधाओं की धारणा''' बताती है कि इनमें से प्रत्येक लघुगणक में अगला प्राप्त करने के लिए जोड़ी गई संख्याएँ ''x'' की परवाह किए बिना समान हैं। दूसरे शब्दों में, खराब या ठीक स्वास्थ्य होने की संभावना के लघुगणक में से खराब स्वास्थ्य होने का लघुगणक घटाने के बीच का अंतर ''x'' की परवाह किए बिना समान है; इसी तरह, खराब, निष्पक्ष, या अच्छे स्वास्थ्य होने की संभावना का लघुगणक माइनस खराब या उचित स्वास्थ्य होने का लघुगणक ''x'' की परवाह किए बिना समान है; वगैरह।<ref>{{cite web |title=rologit.pdf|url=https://www.stata.com/manuals/rologit.pdf|publisher=Stata}}</ref> | ||
बहु-आदेशित प्रतिक्रिया श्रेणियों के उदाहरणों में बांड रेटिंग, दृढ़ता से सहमत से लेकर दृढ़ता से असहमत तक की प्रतिक्रियाओं के साथ राय सर्वेक्षण, सरकारी कार्यक्रमों पर राज्य के खर्च का स्तर (उच्च, मध्यम या निम्न), चुने गए बीमा कवरेज का स्तर (कोई नहीं, आंशिक) सम्मिलित हैं। या पूर्ण), और रोज़गार की स्थिति (रोज़गार नहीं, अंशकालिक नियोजित, या पूरी तरह से नियोजित)।<ref>{{cite book |last=Greene |first=William H. |author-link=William Greene (economist) |title=अर्थमितीय विश्लेषण|edition=Seventh |location=Boston |publisher=Pearson Education |year=2012 |isbn=978-0-273-75356-8 |pages=824–827 }}</ref> | |||
ऑर्डर किए गए लॉगिट को एक अव्यक्त-चर मॉडल से प्राप्त किया जा सकता है, उसी के समान जिससे लॉजिस्टिक रिग्रेशन#एक अव्यक्त-चर मॉडल को प्राप्त किया जा सकता है। मान लीजिए कि अंतर्निहित प्रक्रिया की विशेषता है | ऑर्डर किए गए लॉगिट को एक अव्यक्त-चर मॉडल से प्राप्त किया जा सकता है, उसी के समान जिससे लॉजिस्टिक रिग्रेशन#एक अव्यक्त-चर मॉडल को प्राप्त किया जा सकता है। मान लीजिए कि अंतर्निहित प्रक्रिया की विशेषता है | ||
:<math>y^{*} = \mathbf{x}^{\mathsf{T}} \beta + \varepsilon, \, </math> | :<math>y^{*} = \mathbf{x}^{\mathsf{T}} \beta + \varepsilon, \, </math> | ||
जहाँ <math>y^{*}</math> एक अवलोकित आश्रित चर है (शायद सर्वेक्षणकर्ता द्वारा प्रस्तावित कथन के साथ समझौते का सटीक स्तर); <math>\mathbf{x}</math> स्वतंत्र चरों का सदिश है; <math>\varepsilon</math> [[त्रुटियाँ और अवशेष]] हैं, जो एक मानक लॉजिस्टिक वितरण का पालन करने के लिए माने गए हैं; और <math>\beta</math> प्रतिगमन गुणांक का सदिश है जिसका हम अनुमान लगाना चाहते हैं। इसके अलावा मान लीजिए कि हम निरीक्षण नहीं कर सकते <math>y^{*}</math>इसके बजाय, हम केवल प्रतिक्रिया की श्रेणियों का निरीक्षण कर सकते हैं | |||
:<math> y= \begin{cases} | :<math> y= \begin{cases} | ||
Line 29: | Line 32: | ||
N & \text{if } \mu_{N} < y^* | N & \text{if } \mu_{N} < y^* | ||
\end{cases}</math> | \end{cases}</math> | ||
जहां पैरामीटर <math>\mu_i</math> अवलोकन योग्य श्रेणियों के बाहरी रूप से लगाए गए समापन बिंदु हैं। फिर ऑर्डर की गई लॉगिट तकनीक पैरामीटर | जहां पैरामीटर <math>\mu_i</math> अवलोकन योग्य श्रेणियों के बाहरी रूप से लगाए गए समापन बिंदु हैं। फिर ऑर्डर की गई लॉगिट तकनीक पैरामीटर सदिश को फिट करने के लिए y पर अवलोकनों का उपयोग करेगी, जो y * पर [[सेंसरिंग (सांख्यिकी)]] का एक रूप है <math>\beta</math>. | ||
==अनुमान== | ==अनुमान== | ||
समीकरण का अनुमान कैसे लगाया जाता है, इसके विवरण के लिए, ऑर्डिनल रिग्रेशन लेख देखें। | समीकरण का अनुमान कैसे लगाया जाता है, इसके विवरण के लिए, ऑर्डिनल रिग्रेशन लेख देखें। | ||
Line 45: | Line 46: | ||
{{Reflist}} | {{Reflist}} | ||
==अग्रिम पठन== | ==अग्रिम पठन== | ||
* {{cite book |first=Andrew |last=Gelman |first2=Jennifer |last2=Hill|author2-link=Jennifer Hill |title=Data Analysis Using Regression and Multilevel/Hierarchical Models |location=New York |publisher=Cambridge University Press |year=2007 |isbn=978-0-521-68689-1 |pages=119–124 |url=https://books.google.com/books?id=lV3DIdV0F9AC&pg=PA119 }} | * {{cite book |first=Andrew |last=Gelman |first2=Jennifer |last2=Hill|author2-link=Jennifer Hill |title=Data Analysis Using Regression and Multilevel/Hierarchical Models |location=New York |publisher=Cambridge University Press |year=2007 |isbn=978-0-521-68689-1 |pages=119–124 |url=https://books.google.com/books?id=lV3DIdV0F9AC&pg=PA119 }} | ||
Line 52: | Line 51: | ||
* {{cite book |last=Woodward |first=Mark |year=2005 |title=Epidemiology: Study Design and Data Analysis |url=https://archive.org/details/epidemiologystud0000wood |url-access=registration |publisher=Chapman & Hall/CRC |isbn=978-1-58488-415-6 | edition=2nd }} | * {{cite book |last=Woodward |first=Mark |year=2005 |title=Epidemiology: Study Design and Data Analysis |url=https://archive.org/details/epidemiologystud0000wood |url-access=registration |publisher=Chapman & Hall/CRC |isbn=978-1-58488-415-6 | edition=2nd }} | ||
* {{cite book |first=Jeffrey |last=Wooldridge |author-link=Jeffrey Wooldridge |title=Econometric Analysis of Cross Section and Panel Data |location=Cambridge |publisher=MIT Press |edition=Second |year=2010 |isbn=978-0-262-23258-6 |pages=643–666 |url=https://books.google.com/books?id=hSs3AgAAQBAJ&pg=PA655 }} | * {{cite book |first=Jeffrey |last=Wooldridge |author-link=Jeffrey Wooldridge |title=Econometric Analysis of Cross Section and Panel Data |location=Cambridge |publisher=MIT Press |edition=Second |year=2010 |isbn=978-0-262-23258-6 |pages=643–666 |url=https://books.google.com/books?id=hSs3AgAAQBAJ&pg=PA655 }} | ||
==बाहरी संबंध== | ==बाहरी संबंध== | ||
*{{cite web |title=Sample size for an ordinal outcome |date=2004-09-22 |url=http://www.pmean.com/04/OrdinalLogistic.html |first=Steve |last=Simon |work=STATS − STeve's Attempt to Teach Statistics |access-date=2014-08-22 }} | *{{cite web |title=Sample size for an ordinal outcome |date=2004-09-22 |url=http://www.pmean.com/04/OrdinalLogistic.html |first=Steve |last=Simon |work=STATS − STeve's Attempt to Teach Statistics |access-date=2014-08-22 }} |
Revision as of 21:40, 13 July 2023
एक श्रृंखला का हिस्सा |
प्रतिगमन विश्लेषण |
---|
मॉडल |
अनुमान |
पार्श्वभूमि |
|
सांख्यिकी में, ऑर्डर लॉगिट मॉडल (ऑर्डर लॉजिस्टिक रिग्रेशन या आनुपातिक ऑड्स मॉडल) एक क्रमसूचक प्रतिगमन मॉडल है - यानी, माप के स्तर ऑर्डिनल प्रकार के आश्रित चर के लिए एक रिग्रेशन विश्लेषण मॉडल है- जिसे पहले पीटर मैक्कुलघ ने माना था।[1] उदाहरण के लिए, यदि किसी सर्वेक्षण में एक प्रश्न का उत्तर लिकर्ट मापन द्वारा दिया जाना है कि ''गरीब'', ''निष्पक्ष'', ''अच्छा'', ''बहुत अच्छा'' और ''उत्कृष्ट'' के बीच चयन, और विश्लेषण का उद्देश्य यह देखना है कि प्रतिक्रियाओं द्वारा उस प्रतिक्रिया की कितनी अच्छी भविष्यवाणी की जा सकती है अन्य प्रश्नों के लिए, जिनमें से कुछ मात्रात्मक हो सकते हैं, तो आदेशित संभार तन्त्र परावर्तन का उपयोग किया जा सकता है। इसे लॉजिस्टिक रिग्रेशन मॉडल के विस्तार के रूप में सोचा जा सकता है जो द्विभाजित आश्रित चर पर लागू होता है, जो दो से अधिक (आदेशित) प्रतिक्रिया श्रेणियों की अनुमति देता है।
मॉडल और आनुपातिक बाधाओं की धारणा
मॉडल केवल उस डेटा पर लागू होता है जो आनुपातिक बाधाओं की धारणा को पूरा करता है, जिसका अर्थ निम्नानुसार उदाहरण दिया जा सकता है। मान लीजिए कि पाँच परिणाम हैं: ''ख़राब'', ''निष्पक्ष'', ''अच्छा'', ''बहुत अच्छा'' और ''उत्कृष्ट''। हम मानते हैं कि इन परिणामों की संभावनाएँ द्वारा दी गई हैं p1(x), p2(x), p3(x), p4(x), p5(x), ये सभी कुछ स्वतंत्र चर x के फलन हैं। फिर, x के एक निश्चित मान के लिए, कुछ निश्चित तरीकों से उत्तर देने की संभावनाओं के लघुगणक (संभावनाओं के लघुगणक नहीं) हैं:
आनुपातिक बाधाओं की धारणा बताती है कि इनमें से प्रत्येक लघुगणक में अगला प्राप्त करने के लिए जोड़ी गई संख्याएँ x की परवाह किए बिना समान हैं। दूसरे शब्दों में, खराब या ठीक स्वास्थ्य होने की संभावना के लघुगणक में से खराब स्वास्थ्य होने का लघुगणक घटाने के बीच का अंतर x की परवाह किए बिना समान है; इसी तरह, खराब, निष्पक्ष, या अच्छे स्वास्थ्य होने की संभावना का लघुगणक माइनस खराब या उचित स्वास्थ्य होने का लघुगणक x की परवाह किए बिना समान है; वगैरह।[2]
बहु-आदेशित प्रतिक्रिया श्रेणियों के उदाहरणों में बांड रेटिंग, दृढ़ता से सहमत से लेकर दृढ़ता से असहमत तक की प्रतिक्रियाओं के साथ राय सर्वेक्षण, सरकारी कार्यक्रमों पर राज्य के खर्च का स्तर (उच्च, मध्यम या निम्न), चुने गए बीमा कवरेज का स्तर (कोई नहीं, आंशिक) सम्मिलित हैं। या पूर्ण), और रोज़गार की स्थिति (रोज़गार नहीं, अंशकालिक नियोजित, या पूरी तरह से नियोजित)।[3]
ऑर्डर किए गए लॉगिट को एक अव्यक्त-चर मॉडल से प्राप्त किया जा सकता है, उसी के समान जिससे लॉजिस्टिक रिग्रेशन#एक अव्यक्त-चर मॉडल को प्राप्त किया जा सकता है। मान लीजिए कि अंतर्निहित प्रक्रिया की विशेषता है
जहाँ एक अवलोकित आश्रित चर है (शायद सर्वेक्षणकर्ता द्वारा प्रस्तावित कथन के साथ समझौते का सटीक स्तर); स्वतंत्र चरों का सदिश है; त्रुटियाँ और अवशेष हैं, जो एक मानक लॉजिस्टिक वितरण का पालन करने के लिए माने गए हैं; और प्रतिगमन गुणांक का सदिश है जिसका हम अनुमान लगाना चाहते हैं। इसके अलावा मान लीजिए कि हम निरीक्षण नहीं कर सकते इसके बजाय, हम केवल प्रतिक्रिया की श्रेणियों का निरीक्षण कर सकते हैं
जहां पैरामीटर अवलोकन योग्य श्रेणियों के बाहरी रूप से लगाए गए समापन बिंदु हैं। फिर ऑर्डर की गई लॉगिट तकनीक पैरामीटर सदिश को फिट करने के लिए y पर अवलोकनों का उपयोग करेगी, जो y * पर सेंसरिंग (सांख्यिकी) का एक रूप है .
अनुमान
समीकरण का अनुमान कैसे लगाया जाता है, इसके विवरण के लिए, ऑर्डिनल रिग्रेशन लेख देखें।
यह भी देखें
- बहुपदीय लॉगिट
- बहुपदीय प्रोबेट
- आदेश दिया गया प्रोबेट
संदर्भ
- ↑ McCullagh, Peter (1980). "सामान्य डेटा के लिए प्रतिगमन मॉडल". Journal of the Royal Statistical Society. Series B (Methodological). 42 (2): 109–142. JSTOR 2984952.
- ↑ "rologit.pdf" (PDF). Stata.
- ↑ Greene, William H. (2012). अर्थमितीय विश्लेषण (Seventh ed.). Boston: Pearson Education. pp. 824–827. ISBN 978-0-273-75356-8.
अग्रिम पठन
- Gelman, Andrew; Hill, Jennifer (2007). Data Analysis Using Regression and Multilevel/Hierarchical Models. New York: Cambridge University Press. pp. 119–124. ISBN 978-0-521-68689-1.
- Hardin, James; Hilbe, Joseph (2007). Generalized Linear Models and Extensions (2nd ed.). College Station: Stata Press. ISBN 978-1-59718-014-6.
- Woodward, Mark (2005). Epidemiology: Study Design and Data Analysis (2nd ed.). Chapman & Hall/CRC. ISBN 978-1-58488-415-6.
- Wooldridge, Jeffrey (2010). Econometric Analysis of Cross Section and Panel Data (Second ed.). Cambridge: MIT Press. pp. 643–666. ISBN 978-0-262-23258-6.
बाहरी संबंध
- Simon, Steve (2004-09-22). "Sample size for an ordinal outcome". STATS − STeve's Attempt to Teach Statistics. Retrieved 2014-08-22.
- Rodríguez, Germán. "Ordered Logit Models". Princeton University.