रैखिक विभेदक विश्लेषण: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
 
(7 intermediate revisions by 3 users not shown)
Line 7: Line 7:
</ref><ref name="McLachlan:2004">{{cite book |title=विभेदक विश्लेषण और सांख्यिकीय पैटर्न पहचान|first1=G. J. |last1=McLachlan |publisher=Wiley Interscience |isbn=978-0-471-69115-0 |year=2004 |mr=1190469}}</ref> चूंकि, एनोवा श्रेणीबद्ध चर स्वतंत्र चर और एक सतत चर आश्रित चर के रूप में  उपयोग करता है, जबकि विवेचक विश्लेषण में निरंतर स्वतंत्र चर होता है और एक श्रेणीबद्ध आश्रित चर अर्थात वर्ग लेबल के रूप में होता है।<ref>Analyzing Quantitative Data: An Introduction for Social Researchers, Debra Wetcher-Hendricks, p.288</ref> लॉजिस्टिक प्रतिगमन और [[प्रोबिट प्रतिगमन]] एनोवा की तुलना में एलडीए से अधिक मिलते-जुलते हैं, क्योंकि ये निरंतर स्वतंत्र चर के मूल्यों द्वारा एक श्रेणीगत चर की व्याख्या भी करते हैं। ये अन्य विधि उन अनुप्रयोगों में उत्तम हैं, जहां यह मान लेना उचित नहीं है, कि स्वतंत्र चर सामान्य रूप से वितरित किए जाते हैं, जो एलडीए पद्धति की एक मौलिक धारणा है।  
</ref><ref name="McLachlan:2004">{{cite book |title=विभेदक विश्लेषण और सांख्यिकीय पैटर्न पहचान|first1=G. J. |last1=McLachlan |publisher=Wiley Interscience |isbn=978-0-471-69115-0 |year=2004 |mr=1190469}}</ref> चूंकि, एनोवा श्रेणीबद्ध चर स्वतंत्र चर और एक सतत चर आश्रित चर के रूप में  उपयोग करता है, जबकि विवेचक विश्लेषण में निरंतर स्वतंत्र चर होता है और एक श्रेणीबद्ध आश्रित चर अर्थात वर्ग लेबल के रूप में होता है।<ref>Analyzing Quantitative Data: An Introduction for Social Researchers, Debra Wetcher-Hendricks, p.288</ref> लॉजिस्टिक प्रतिगमन और [[प्रोबिट प्रतिगमन]] एनोवा की तुलना में एलडीए से अधिक मिलते-जुलते हैं, क्योंकि ये निरंतर स्वतंत्र चर के मूल्यों द्वारा एक श्रेणीगत चर की व्याख्या भी करते हैं। ये अन्य विधि उन अनुप्रयोगों में उत्तम हैं, जहां यह मान लेना उचित नहीं है, कि स्वतंत्र चर सामान्य रूप से वितरित किए जाते हैं, जो एलडीए पद्धति की एक मौलिक धारणा है।  


एलडीए [[ प्रमुख कंपोनेंट विश्लेषण | प्रमुख घटक विश्लेषण]] (पीसीए) और [[ कारक विश्लेषण | कारक विश्लेषण]] से काफी निकटता से संबंधित है, जिसमें वे दोनों  चर के रैखिक संयोजनों की तलाश करते हैं, जो डेटा को सर्वोत्तम रूप से समझाते हैं।।<ref name="Martinez:2001">{{cite journal |last1=Martinez |first1=A. M. |last2=Kak |first2=A. C. |title=पीसीए बनाम एलडीए|journal=[[IEEE Transactions on Pattern Analysis and Machine Intelligence]] |volume=23| issue = 2 |pages=228–233 |year=2001 |url=http://www.ece.osu.edu/~aleix/pami01.pdf |doi=10.1109/34.908974}}</ref> एलडीए स्पष्ट रूप से डेटा की कक्षाओं के बीच अंतर को मॉडल करने का प्रयास करता है। इसके विपरीत, पीसीए वर्ग किसी भी अंतर को ध्यान में नहीं रखता है और गुणक विश्लेषण समानता के बजाय मतभेदों पर आधारित फीचर संयोजन बनाता है।। विभेदक विश्लेषण भी कारक विश्लेषण से भिन्न है, क्योंकि यह एक अन्योन्याश्रित प्रद्योगिकी  नहीं है:स्वतंत्र चरों तथा आश्रित चरों के बीच भेद को भी मानक चर कहा जाता है।  
एलडीए [[ प्रमुख कंपोनेंट विश्लेषण | प्रमुख घटक विश्लेषण]] (पीसीए) और [[ कारक विश्लेषण | कारक विश्लेषण]] से काफी निकटता से संबंधित है, जिसमें वे दोनों  चर के रैखिक संयोजनों की तलाश करते हैं, जो डेटा को सर्वोत्तम रूप से समझते हैं।।<ref name="Martinez:2001">{{cite journal |last1=Martinez |first1=A. M. |last2=Kak |first2=A. C. |title=पीसीए बनाम एलडीए|journal=[[IEEE Transactions on Pattern Analysis and Machine Intelligence]] |volume=23| issue = 2 |pages=228–233 |year=2001 |url=http://www.ece.osu.edu/~aleix/pami01.pdf |doi=10.1109/34.908974}}</ref> एलडीए स्पष्ट रूप से डेटा की कक्षाओं के बीच अंतर को मॉडल करने का प्रयास करता है। इसके विपरीत, पीसीए वर्ग किसी भी अंतर को ध्यान में नहीं रखता है और गुणक विश्लेषण समानता के बजाय मतभेदों पर आधारित फीचर संयोजन बनाता है।। विभेदक विश्लेषण भी कारक विश्लेषण से भिन्न है, क्योंकि यह एक अन्योन्याश्रित प्रद्योगिकी  नहीं है:स्वतंत्र चरों तथा आश्रित चरों के बीच भेद को भी मानक चर कहा जाता है।  


एलडीए काम करता है जब प्रत्येक अवलोकन के लिए स्वतंत्र चर पर किए गए माप निरंतर मात्रा के रूप में होते हैं। स्पष्ट स्वतंत्र चर के साथ काम करते समय, समतुल्य प्रद्योगिकी  भेदभावपूर्ण  पत्राचार विश्लेषण के रूप में है।<ref name="Abdi 2007">Abdi, H. (2007) [http://www.utdallas.edu/~herve/Abdi-DCA2007-pretty.pdf "Discriminant correspondence analysis."] In: N.J. Salkind (Ed.): ''Encyclopedia of Measurement and Statistic''. Thousand Oaks (CA): Sage. pp.&nbsp;270–275.</ref><ref name="Perriere 2003">{{cite journal | last1 = Perriere | first1 = G. | last2 = Thioulouse | first2 = J. | year = 2003 | title = बैक्टीरियल प्रोटीन के उपकोशिकीय स्थान की भविष्यवाणी करने के लिए पत्राचार विभेदक विश्लेषण का उपयोग| journal = Computer Methods and Programs in Biomedicine | volume = 70 | issue = 2| pages = 99–105 | doi=10.1016/s0169-2607(02)00011-1| pmid = 12507786 }}</ref>  
एलडीए काम करता है जब प्रत्येक अवलोकन के लिए स्वतंत्र चर पर किए गए माप निरंतर मात्रा के रूप में होते हैं। स्पष्ट स्वतंत्र चर के साथ काम करते समय, समतुल्य प्रद्योगिकी  भेदभावपूर्ण  पत्राचार विश्लेषण के रूप में है।<ref name="Abdi 2007">Abdi, H. (2007) [http://www.utdallas.edu/~herve/Abdi-DCA2007-pretty.pdf "Discriminant correspondence analysis."] In: N.J. Salkind (Ed.): ''Encyclopedia of Measurement and Statistic''. Thousand Oaks (CA): Sage. pp.&nbsp;270–275.</ref><ref name="Perriere 2003">{{cite journal | last1 = Perriere | first1 = G. | last2 = Thioulouse | first2 = J. | year = 2003 | title = बैक्टीरियल प्रोटीन के उपकोशिकीय स्थान की भविष्यवाणी करने के लिए पत्राचार विभेदक विश्लेषण का उपयोग| journal = Computer Methods and Programs in Biomedicine | volume = 70 | issue = 2| pages = 99–105 | doi=10.1016/s0169-2607(02)00011-1| pmid = 12507786 }}</ref>  
Line 25: Line 25:
किसी और धारणा के बिना, परिणामी वर्गीकारक को [[द्विघात वर्गीकारक]] (QDA) के रूप में संदर्भित किया जाता है।
किसी और धारणा के बिना, परिणामी वर्गीकारक को [[द्विघात वर्गीकारक]] (QDA) के रूप में संदर्भित किया जाता है।


एलडीए इसके अतिरिक्त अतिरिक्त सरलीकृत समरूपता धारणा बनाता है अर्थात कि वर्ग सहप्रसरण समान हैं, इसलिए <math>\Sigma_0 = \Sigma_1 = \Sigma</math>) और यह कि सहप्रसरण की पूरी रैंक है।
एलडीए इसके अतिरिक्त सरलीकृत समरूपता धारणा बनाता है अर्थात कि वर्ग सहप्रसरण समान हैं, इसलिए <math>\Sigma_0 = \Sigma_1 = \Sigma</math>) और यह कि सहप्रसरण की पूरी रैंक है।


इस मामले में कई शर्तें रद्द:
इस मामले में कई शर्तें रद्द:
Line 41: Line 41:
:<math>\vec w = \Sigma^{-1} (\vec \mu_1 - \vec \mu_0)</math>
:<math>\vec w = \Sigma^{-1} (\vec \mu_1 - \vec \mu_0)</math>
:<math> c = \frac12 \, {\vec w}^\mathrm{T} (\vec \mu_1 + \vec \mu_0)</math>
:<math> c = \frac12 \, {\vec w}^\mathrm{T} (\vec \mu_1 + \vec \mu_0)</math>
इसका मतलब है कि एक इनपुट की कसौटी <math> \vec{ x }</math> एक कक्षा में होना <math>y</math> विशुद्ध रूप से ज्ञात प्रेक्षणों के इस रैखिक संयोजन का संकल्पना है।
इसका मतलब है कि एक इनपुट की कसौटी <math> \vec{ x }</math> एक कक्षा में होना <math>y</math> विशुद्ध रूप से ज्ञात प्रेक्षणों के इस रैखिक संयोजन के संकल्पना का रूप है।


वाई पूरी तरह से ज्ञात टिप्पणियों के इस रैखिक संयोजन का एक  
वाई पूरी तरह से ज्ञात टिप्पणियों के इस रैखिक संयोजन का एक रूप है।


इस निष्कर्ष को ज्यामितीय दृष्टि से देखना अधिकांशतः उपयोगी होता है, एक इनपुट की कसौटी <math> \vec{ x }</math> एक कक्षा में होना <math>y</math> विशुद्ध रूप से बहुआयामी अंतरिक्ष बिंदु के प्रक्षेपण का कार्य है <math> \vec{ x }</math>  सदिश पर <math> \vec{ w }</math> इस प्रकार हम मात्र इसकी दिशा पर विचार करते हैं। दूसरे शब्दों में अवलोकन का है <math>y</math> यदि संगत है <math> \vec{ x }</math> के लंबवत अधिसमतल के एक निश्चित तरफ स्थित है। <math> \vec{ w }</math>. विमान का स्थान दहलीज द्वारा परिभाषित किया गया है <math>c</math>.जो कि के रूप में है।
इस निष्कर्ष को ज्यामितीय दृष्टि से देखना अधिकांशतः उपयोगी होता है, एक इनपुट की कसौटी <math> \vec{ x }</math> एक कक्षा में होना <math>y</math> विशुद्ध रूप से बहुआयामी अंतरिक्ष बिंदु के प्रक्षेपण का कार्य है <math> \vec{ x }</math>  सदिश पर <math> \vec{ w }</math> इस प्रकार हम मात्र इसकी दिशा पर विचार करते हैं। दूसरे शब्दों में अवलोकन का है <math>y</math> यदि संगत है <math> \vec{ x }</math> के लंबवत अधिसमतल के एक निश्चित तरफ स्थित है। <math> \vec{ w }</math>. विमान का स्थान दहलीज द्वारा परिभाषित किया गया है <math>c</math>.जो कि के रूप में है।
Line 59: Line 59:


== भेदभावपूर्ण कार्य ==
== भेदभावपूर्ण कार्य ==
विवेकशील विश्लेषण भविष्यवक्ताओं के एक या अधिक रैखिक संयोजन बनाकर काम करता है, प्रत्येक  संकल्पना के लिए एक नया [[अव्यक्त चर]] बन जाता है। इन कार्यों को विभेदक कार्य कहा जाता है। संभव कार्यों की संख्या या तो है <math>N_g-1</math> जहाँ <math>N_g</math> = समूहों की संख्या, या <math>p</math> भविष्यवक्ताओं की संख्या है, जो कि छोटा हैइस  संकल्पना ने बनाया है। पहला संकल्पनाउस  संकल्पनाके समूहों के बीच के अंतर को अधिकतम करता है। दूसरा संकल्पना उस संकल्पना के अंतर को अधिकतम करता है, लेकिन पिछले संकल्पना के साथ सहसंबद्ध भी नहीं होना चाहिए। यह बाद के कार्यों के साथ इन आवश्यकता के साथ जारी रहता है, कि नया कार्य पिछले कार्यों में से किसी के साथ सहसंबद्ध न हो।
विवेकशील विश्लेषण भविष्यवक्ताओं के एक या अधिक रैखिक संयोजन बनाकर काम करता है, प्रत्येक  संकल्पना के लिए एक नया [[अव्यक्त चर]] बन जाता है। इन कार्यों को विभेदक कार्य कहा जाता है। संभव कार्यों की संख्या या तो है <math>N_g-1</math> जहाँ <math>N_g</math> = समूहों की संख्या, या <math>p</math> भविष्यवक्ताओं की संख्या है, जो कि छोटा हैइस  संकल्पना ने बनाया है। पहला संकल्पना उस संकल्पना के समूहों के बीच के अंतर को अधिकतम करता है। दूसरा संकल्पना उस संकल्पना के अंतर को अधिकतम करता है, लेकिन पिछले संकल्पना के साथ सहसंबद्ध भी नहीं होना चाहिए। यह बाद के कार्यों के साथ इन आवश्यकता के साथ जारी रहता है, कि नया कार्य पिछले कार्यों में से किसी के साथ सहसंबद्ध न हो सके ।


दिया गया समूह <math>j</math>, साथ  <math>\mathbb{R}_j</math> नमूना स्थान के सेट, एक भेदभावपूर्ण नियम है जैसे कि यदि <math>x \in\mathbb{R}_j</math>, तब <math>x\in j</math>. भेदभावपूर्ण विश्लेषण तब, के "भोजन" क्षेत्रों को खोजें  <math>\mathbb{R}_j</math> वर्गीकरण त्रुटि को कम करने के लिए, इसलिए वर्गीकरण तालिका में उच्च प्रतिशत सही वर्गीकृत करने के लिए अग्रणी होता है।<ref>Hardle, W., Simar, L. (2007). ''Applied Multivariate Statistical Analysis''. Springer Berlin Heidelberg. pp.&nbsp;289–303.</ref>
दिया गया समूह <math>j</math>, साथ  <math>\mathbb{R}_j</math> नमूना स्थान के सेट, एक भेदभावपूर्ण नियम है जैसे कि यदि <math>x \in\mathbb{R}_j</math>, तब <math>x\in j</math>. भेदभावपूर्ण विश्लेषण तब, के "भोजन" क्षेत्रों को खोजें  <math>\mathbb{R}_j</math> वर्गीकरण त्रुटि को कम करने के लिए, इसलिए वर्गीकरण तालिका में उच्च प्रतिशत सही वर्गीकृत करने के लिए अग्रणी होता है।<ref>Hardle, W., Simar, L. (2007). ''Applied Multivariate Statistical Analysis''. Springer Berlin Heidelberg. pp.&nbsp;289–303.</ref>
Line 66: Line 66:
*संरचना सहसंबंध गुणांक: प्रत्येक भविष्यवक्ता और प्रत्येक  संकल्पना के विवेचक स्कोर के बीच सहसंबंध होता है। यह एक शून्य क्रम सहसंबंध है अर्थात अन्य भविष्यवक्ताओं के लिए सही नहीं होता है ।<ref>Garson, G. D. (2008). Discriminant function analysis. https://web.archive.org/web/20080312065328/http://www2.chass.ncsu.edu/garson/pA765/discrim.htm.</ref>
*संरचना सहसंबंध गुणांक: प्रत्येक भविष्यवक्ता और प्रत्येक  संकल्पना के विवेचक स्कोर के बीच सहसंबंध होता है। यह एक शून्य क्रम सहसंबंध है अर्थात अन्य भविष्यवक्ताओं के लिए सही नहीं होता है ।<ref>Garson, G. D. (2008). Discriminant function analysis. https://web.archive.org/web/20080312065328/http://www2.chass.ncsu.edu/garson/pA765/discrim.htm.</ref>
*मानकीकृत गुणांक: रैखिक संयोजन में प्रत्येक भविष्यवक्ता का वजन जो कि विभेदक कार्य है। एक प्रतिगमन समीकरण की तरह ये गुणांक आंशिक हैं अर्थात अन्य भविष्यवक्ताओं के लिए सही हैं। समूह असाइनमेंट की भविष्यवाणी करने में प्रत्येक भविष्यवक्ता के अद्वितीय योगदान को इंगित करता है।
*मानकीकृत गुणांक: रैखिक संयोजन में प्रत्येक भविष्यवक्ता का वजन जो कि विभेदक कार्य है। एक प्रतिगमन समीकरण की तरह ये गुणांक आंशिक हैं अर्थात अन्य भविष्यवक्ताओं के लिए सही हैं। समूह असाइनमेंट की भविष्यवाणी करने में प्रत्येक भविष्यवक्ता के अद्वितीय योगदान को इंगित करता है।
*ग्रुप सेंट्रोइड्स पर कार्य: प्रत्येक संकल्पना के लिए ग्रुपिंग चर के लिए औसत विभेदक स्कोर दिए गए हैं।। साधन जितने दूर होंगे, वर्गीकरण में त्रुटि उतनी ही कम होगी।
*ग्रुप सेंट्रोइड्स पर कार्य: प्रत्येक संकल्पना के लिए ग्रुपिंग चर के लिए औसत विभेदक के रूप में  स्कोर दिए गए हैं।। साधन जितने दूर होंगे, वर्गीकरण में त्रुटि उतनी ही कम होगी।


== डिस्क्रिमिनेशननियम ==
== डिस्क्रिमिनेशननियम ==
Line 73: Line 73:
*बेयस डिस्क्रिमिनेंट रूल: असाइन करता है <math>x</math> उस समूह के लिए जो अधिकतम करता है, <math>\pi_i f_i(x)</math> जहां πi उस वर्गीकरण की [[पूर्व संभावना]] का प्रतिनिधित्व करता है, और <math>f_i(x)</math> जनसंख्या घनत्व का प्रतिनिधित्व करता है।<ref name="har"/>
*बेयस डिस्क्रिमिनेंट रूल: असाइन करता है <math>x</math> उस समूह के लिए जो अधिकतम करता है, <math>\pi_i f_i(x)</math> जहां πi उस वर्गीकरण की [[पूर्व संभावना]] का प्रतिनिधित्व करता है, और <math>f_i(x)</math> जनसंख्या घनत्व का प्रतिनिधित्व करता है।<ref name="har"/>
*फिशर का रेखीय  विविक्तकर नियम:  एसएस के बीच अनुपात को अधिकतम करता है और एस.एस समूह की भविष्यवाणी करने के लिए भविष्यवक्ताओं का एक रैखिक संयोजन पाता है।<ref name="har" />
*फिशर का रेखीय  विविक्तकर नियम:  एसएस के बीच अनुपात को अधिकतम करता है और एस.एस समूह की भविष्यवाणी करने के लिए भविष्यवक्ताओं का एक रैखिक संयोजन पाता है।<ref name="har" />
== ईजेनवेल्यूज ==
== अभिलक्षणिक मान ==
विवेचक विश्लेषण में एक अभिलाक्षणिक मान प्रत्येक  संकल्पनाकी विशेष जड़ होती है।{{clarify|date=April 2012}} यह इस बात का संकेत है कि यह  संकल्पनासमूहों को कितनी अच्छी प्रकार से भिन्न करता है, जहां अभिलाक्षणिक मान जितना बड़ा होता है, उतना ही उत्तम संकल्पनाको भिन्न करता है।<ref name="buy"/>चूंकि इसे सावधानी के साथ समझा जाना चाहिए, क्योंकि अभिलाक्षणिक मान की कोई ऊपरी सीमा नहीं है।<ref name="green"/><ref name="buy"/>
विवेचक विश्लेषण में एक अभिलाक्षणिक मान प्रत्येक  संकल्पना की विशेष जड़ होती है।{{clarify|date=April 2012}} यह इस बात का संकेत है, कि यह  संकल्पना समूहों को कितनी अच्छी प्रकार से भिन्न करता है, जहां अभिलाक्षणिक मान जितना बड़ा होता है, उतना ही उत्तम संकल्पना को भिन्न करता है।<ref name="buy"/>चूंकि इसे सावधानी के साथ समझा जाना चाहिए, क्योंकि अभिलाक्षणिक मान की कोई ऊपरी सीमा नहीं है।<ref name="green"/><ref name="buy"/>


इस प्रकार अभिलाक्षणिक मान को एनोवा के रूप में एसएस के बीच में और एस.एस  के अंदर अनुपात के रूप में देखा जा सकता है,जब आश्रित चर विवेकशील के रूप में कार्य करता है, और समूह [[वाद्य चर]] स्तर के रूप में  होते हैं,{{clarify|date=April 2012}}.<ref name="green" />इसका मतलब यह है कि सबसे बड़ा अभिलाक्षणिक मान पहले  संकल्पनाके साथ जुड़ा हुआ है, दूसरा सबसे बड़ा दूसरे के साथ आदि।
इस प्रकार अभिलाक्षणिक मान को एनोवा के रूप में एसएस के बीच में और एस.एस  के अंदर अनुपात के रूप में देखा जा सकता है,जब आश्रित चर विवेकशील के रूप में कार्य करता है, और समूह [[वाद्य चर]] स्तर के रूप में  होते हैं,{{clarify|date=April 2012}}.<ref name="green" />इसका मतलब यह है कि सबसे बड़ा अभिलाक्षणिक मान पहले  संकल्पनाके साथ जुड़ा हुआ है, दूसरा सबसे बड़ा दूसरे के साथ आदि।
Line 138: Line 138:
यह नियमित विभेदक विश्लेषण के ढांचे की ओर ले जाता है।<ref name="Friedman:2001">{{cite journal |last=Friedman |first=J. H. |title=नियमित विभेदक विश्लेषण|journal=[[Journal of the American Statistical Association]] |volume=84 |issue=405 |pages=165–175 |year=1989 |url=http://www.slac.stanford.edu/cgi-wrap/getdoc/slac-pub-4389.pdf |doi=10.2307/2289860 |jstor=2289860 |mr=0999675|citeseerx=10.1.1.382.2682 }}</ref> या संकोचन विभेदक विश्लेषण होता है ।<ref>{{cite journal | last1 = Ahdesmäki | first1 = M. | last2 = Strimmer | first2 = K. | year = 2010 | title = कैट स्कोर और फाल्स नॉनडिस्कवरी रेट कंट्रोल का उपयोग करते हुए ओमिक्स भविष्यवाणी समस्याओं में फीचर चयन| journal = Annals of Applied Statistics | volume = 4 | issue = 1| pages = 503–519 | doi=10.1214/09-aoas277| arxiv = 0903.2003 | s2cid = 2508935 }}</ref>
यह नियमित विभेदक विश्लेषण के ढांचे की ओर ले जाता है।<ref name="Friedman:2001">{{cite journal |last=Friedman |first=J. H. |title=नियमित विभेदक विश्लेषण|journal=[[Journal of the American Statistical Association]] |volume=84 |issue=405 |pages=165–175 |year=1989 |url=http://www.slac.stanford.edu/cgi-wrap/getdoc/slac-pub-4389.pdf |doi=10.2307/2289860 |jstor=2289860 |mr=0999675|citeseerx=10.1.1.382.2682 }}</ref> या संकोचन विभेदक विश्लेषण होता है ।<ref>{{cite journal | last1 = Ahdesmäki | first1 = M. | last2 = Strimmer | first2 = K. | year = 2010 | title = कैट स्कोर और फाल्स नॉनडिस्कवरी रेट कंट्रोल का उपयोग करते हुए ओमिक्स भविष्यवाणी समस्याओं में फीचर चयन| journal = Annals of Applied Statistics | volume = 4 | issue = 1| pages = 503–519 | doi=10.1214/09-aoas277| arxiv = 0903.2003 | s2cid = 2508935 }}</ref>


कई व्यावहारिक मामलों में रैखिक विवेचक उपयुक्त नहीं होते हैं। एलडीए और फिशर के विवेचक को [[कर्नेल चाल]] के माध्यम से गैर-रैखिक वर्गीकरण में उपयोग के लिए बढ़ाया जा सकता है। यहां, मूल प्रेक्षणों को प्रभावी रूप से एक उच्च आयामी गैर-रैखिकअंतरिक्ष में प्रतिचित्रित किया गया है। इस गैर-रैखिक स्थान में रैखिक वर्गीकरण फिर मूल स्थान में गैर-रैखिक वर्गीकरण के समतुल्य होता है। इसका सबसे अधिक उपयोग किया जाने वाला उदाहरण कर्नेल [[एकाधिक विभेदक विश्लेषण]]  होता है।  
कई व्यावहारिक मामलों में रैखिक विवेचक उपयुक्त नहीं होते हैं। एलडीए और फिशर के विवेचक को [[कर्नेल चाल]] के माध्यम से गैर-रैखिक वर्गीकरण में उपयोग के लिए बढ़ाया जा सकता है। यहां, मूल प्रेक्षणों को प्रभावी रूप से एक उच्च आयामी गैर रैखिक अंतरिक्ष में प्रतिचित्रित किया गया है। इस गैर रैखिक स्थान में रैखिक वर्गीकरण फिर मूल स्थान में गैर रैखिक वर्गीकरण के समतुल्य होता है। इसका सबसे अधिक उपयोग किया जाने वाला उदाहरण कर्नेल [[एकाधिक विभेदक विश्लेषण]]  होता है।  


एलडीए को कई विभेदक विश्लेषणों के लिए सामान्यीकृत किया जा सकता है, जहां सी मात्र दो के अतिरिक्त एन संभावित राज्यों के साथ एक श्रेणीबद्ध चर बन जाता है। जिसे अनुरूप रूप से यदि वर्ग-सशर्त घनत्व <math>p(\vec x\mid c=i)</math> साझा सहप्रसरण के साथ सामान्य होता हैं,  [[पर्याप्त आँकड़ा]] <math>P(c\mid\vec x)</math> एन अनुमानों के मूल्य हैं, जो एन साधनों द्वारा फैलाए गए रैखिक उप-स्थान हैं, व्युत्क्रम सहप्रसरण  आव्यूह द्वारा परिशोधित परिवर्तन। इन अनुमानों को एक  आव्यूह सामान्यीकृत अभिलाक्षणिक मान समस्या को हल करके पाया जा सकता है, ईजेन डीकंपोजीशन होता है, जो नमूनों के माध्यम से मापन से तैयार किया जाता है, और हर भाग में साझा सहप्रसविताआव्यूह होता है। विवरण के लिए ऊपर "मल्टीक्लास एलडीए" के रूप में देखें।
एलडीए को कई विभेदक विश्लेषणों के लिए सामान्यीकृत किया जा सकता है, जहां सी मात्र दो के अतिरिक्त एन संभावित राज्यों के साथ एक श्रेणीबद्ध चर बन जाता है। जिसे अनुरूप रूप से यदि वर्ग-सशर्त घनत्व <math>p(\vec x\mid c=i)</math> साझा सहप्रसरण के साथ सामान्य होता हैं,  [[पर्याप्त आँकड़ा]] <math>P(c\mid\vec x)</math> एन अनुमानों के मूल्य हैं, जो एन साधनों द्वारा फैलाए गए रैखिक उप-स्थान हैं, व्युत्क्रम सहप्रसरण  आव्यूह द्वारा परिशोधित परिवर्तन। इन अनुमानों को एक  आव्यूह सामान्यीकृत अभिलाक्षणिक मान समस्या को हल करके पाया जा सकता है, ईजेन डीकंपोजीशन होता है, जो नमूनों के माध्यम से मापन से तैयार किया जाता है, और हर भाग में साझा सहप्रसविताआव्यूह होता है। विवरण के लिए ऊपर "मल्टीक्लास एलडीए" के रूप में देखें।


== अनुप्रयोग ==
== अनुप्रयोग ==
नीचे दिए गए उदाहरणों के अतिरिक्त, एलडीए को [[ स्थिति (विपणन) ]] और [[उत्पाद प्रबंधन]] में लागू किया जाता है।
नीचे दिए गए उदाहरणों के अतिरिक्त, एलडीए को [[ स्थिति (विपणन) | स्थिति (मार्केटिंग)]] और [[उत्पाद प्रबंधन]] में लागू किया जाता है।


=== दिवालियापन की भविष्यवाणी ===
=== दिवालियापन की भविष्यवाणी ===
लेखा अनुपात और अन्य वित्तीय चर के आधार पर दिवालियापन की भविष्यवाणी में, रैखिक विभेदक विश्लेषण व्यवस्थित रूप से यह समझाने के लिए लागू किया गया था। कि प्रथम सांख्यिकीय पद्धति के रूप में लागू किया गया था।जिसका इस्तेमाल दिवालियापन बनाम अस्तित्व में था।एलडीए के सामान्य वितरण मान्यताओं के अनुरूप लेखा-करण अनुपात की अनदेखी के बावजूद, [[एडवर्ड ऑल्टमैन]] का [[जेड-स्कोर वित्तीय विश्लेषण उपकरण]] अभी भी व्यावहारिक उपयोग में अभी भी अग्रणी मॉडल है।
लेखा अनुपात और अन्य वित्तीय चर के आधार पर दिवालियापन की भविष्यवाणी में, रैखिक विभेदक विश्लेषण व्यवस्थित रूप से यह समझाने के लिए था। कि प्रथम सांख्यिकीय पद्धति के रूप में लागू किया गया था।जिसका इस्तेमाल दिवालियापन बनाम अस्तित्व में था।एलडीए के सामान्य वितरण मान्यताओं के अनुरूप लेखा करण अनुपात की अनदेखी के बावजूद, [[एडवर्ड ऑल्टमैन]] का [[जेड-स्कोर वित्तीय विश्लेषण उपकरण]] अभी भी व्यावहारिक उपयोग में अभी भी अग्रणी मॉडल के रूप में है।


=== फेसेस  की पहचान ===
=== फेसेस  की पहचान ===
कम्प्यूटरीकृत [[चेहरे की पहचान प्रणाली|फेसेस की आइडेंटिटी प्रणाली]] में, प्रत्येक फेसेस को बड़ी संख्या में पिक्सेल मानों द्वारा प्रदर्शित किया जाता है। रेखीय डिस्क्रिमिनेशन विश्लेषण का प्रमुख रूप से प्रयोग वर्गीकरण से पूर्व लक्षणों की संख्या को अधिक प्रबंधनीय संख्या में घटाने के लिए किया जाता है। प्रत्येक नया आयाम पिक्सेल मानों का एक रैखिक संयोजन है, जो एक टेम्पलेट का निर्माण करता है। फिशर के रैखिक विवेचक का उपयोग करके प्राप्त रैखिक संयोजनों को फिशर फेसेस कहा जाता है, जबकि संबंधित प्रमुख घटक विश्लेषण के उपयोग से प्राप्त रेखीय संयोजनों को ईजीफेसेस  कहा जाता है।
कम्प्यूटरीकृत [[चेहरे की पहचान प्रणाली|फेसेस की आइडेंटिटी प्रणाली]] में, प्रत्येक फेसेस को बड़ी संख्या में पिक्सेल मानों द्वारा प्रदर्शित किया जाता है। रेखीय डिस्क्रिमिनेशन विश्लेषण का प्रमुख रूप से प्रयोग वर्गीकरण से पूर्व लक्षणों की संख्या को अधिक प्रबंधनीय संख्या में घटाने के लिए किया जाता है। प्रत्येक नया आयाम पिक्सेल मानों का एक रैखिक संयोजन है, जो एक टेम्पलेट का निर्माण करता है। फिशर के रैखिक विवेचक का उपयोग करके प्राप्त रैखिक संयोजनों को फिशर फेसेस कहा जाता है, जबकि संबंधित प्रमुख घटक विश्लेषण के उपयोग से प्राप्त रेखीय संयोजनों को ईजीफेसेस  कहा जाता है।


=== मार्केटिंग ===
=== मार्केटिंग ===
मार्केटिंगमें, भेदभावपूर्ण विश्लेषण का उपयोग अधिकांशतः उन कारकों को निर्धारित करने के लिए किया जाता था, जो विभिन्न प्रकार के ग्राहकों और  उत्पादों को सर्वेक्षण या अन्य प्रकार के एकत्रित डेटा के आधार पर भिन्न करते हैं। लॉजिस्टिक रिग्रेशन या अन्य विधि अब अधिक सामान्य रूप से उपयोग किए जाते हैं। मार्केटिंगमें विभेदक विश्लेषण के उपयोग को निम्नलिखित चरणों द्वारा वर्णित किया जा सकता है:
मार्केटिंगमें, भेदभावपूर्ण विश्लेषण का उपयोग अधिकांशतः उन कारकों को निर्धारित करने के लिए किया जाता था, जो विभिन्न प्रकार के ग्राहकों और  उत्पादों को सर्वेक्षण या अन्य प्रकार के एकत्रित डेटा के आधार पर भिन्न करते हैं। लॉजिस्टिक रिग्रेशन या अन्य विधि अब अधिक सामान्य रूप से उपयोग किए जाते हैं। मार्केटिंग में विभेदक विश्लेषण के उपयोग को निम्नलिखित चरणों द्वारा वर्णित किया जा सकता है:
#समस्या तैयार करना और डेटा एकत्र करना- इस श्रेणी में उत्पादों का मूल्यांकन करने के लिए उपयोग किए जाने वाले सामाजिक गुणों की आइडेंटिटीकरना [[मात्रात्मक विपणन अनुसंधान|मात्रात्मक मार्केटिंगअनुसंधान]] प्रद्योगिक जैसे [[सांख्यिकीय सर्वेक्षण]] का उपयोग करें जिससे की सभी उत्पाद विशेषताओं की रेटिंग के संबंध में संभावित ग्राहकों के नमूने से डेटा एकत्र किए जा सकते है, डेटा संग्रह चरण सामान्यतः मार्केटिंगअनुसंधान पेशेवरों द्वारा की जाती है। सर्वेक्षण के प्रश्न प्रतिवादी को शोधकर्ता द्वारा चुनी गई विशेषताओं की एक श्रृंखला पर उत्पाद को एक से पांच (या 1 से 7, या 1 से 10) तक रेट करने के लिए कहते हैं। कहीं भी पाँच से बीस विशेषताओं का चयन किया जाता है। उनमें निम्न चीज़ें सम्मलित हो सकती हैं: उपयोग में आसानी, वजन, उपयुक्तता, टिकाऊपन, रंगीनता, कीमत या बनावट। चुने गए गुण अध्ययन किए जा रहे उत्पाद के आधार पर भिन्न-भिन्न होंगे। अध्ययन में सभी उत्पादों के बारे में एक ही प्रश्न पूछा गया है। कई उत्पादों के डेटा को संहिताबद्ध किया जाता है और एक सांख्यिकीय कार्यक्रम जैसे [[आर भाषा]], [[एसपीएसएस]] या [[एसएएस प्रोग्रामिंग भाषा]] में इनपुट किया जाता है। यह चरण कारक विश्लेषण के समान है।
#समस्या तैयार करना और डेटा एकत्र करना- इस श्रेणी में उत्पादों का मूल्यांकन करने के लिए उपयोग किए जाने वाले सामाजिक गुणों की आइडेंटिटी करना [[मात्रात्मक विपणन अनुसंधान|मात्रात्मक मार्केटिंग अनुसंधान]] प्रद्योगिक के रूप में है। जैसे [[सांख्यिकीय सर्वेक्षण]] का उपयोग करें जिससे की सभी उत्पाद विशेषताओं की रेटिंग के संबंध में संभावित ग्राहकों के नमूने से डेटा एकत्र किए जा सकते है, डेटा संग्रह चरण सामान्यतः मार्केटिंग अनुसंधान पेशेवरों द्वारा की जाती है। सर्वेक्षण के प्रश्न प्रतिवादी को शोधकर्ता द्वारा चुनी गई विशेषताओं की एक श्रृंखला पर उत्पाद को एक से पांच (या 1 से 7, या 1 से 10) तक रेट करने के लिए कहते हैं। कहीं भी पाँच से बीस विशेषताओं का चयन किया जाता है। उनमें निम्न चीज़ें सम्मलित हो सकती हैं: उपयोग में आसानी, वजन, उपयुक्तता, टिकाऊपन, रंगीनता, कीमत या बनावट के रूप में हो सकती है। और इस प्रकार गुण अध्ययन किए जा रहे है। उत्पाद के आधार पर गुण भिन्न-भिन्न होंगे। अध्ययन में सभी उत्पादों के बारे में एक ही प्रश्न पूछा गया है। कई उत्पादों के डेटा को संहिताबद्ध किया जाता है और एक सांख्यिकीय कार्यक्रम जैसे [[आर भाषा]], [[एसपीएसएस]] या [[एसएएस प्रोग्रामिंग भाषा]] में इनपुट किया जाता है। यह चरण कारक विश्लेषण के समान है।
#डिस्क्रिमिनेंट  संकल्पना गुणांक का अनुमान लगाएं और सांख्यिकीय महत्व और वैधता निर्धारित करें उपयुक्त डिस्क्रिमिनेंट विश्लेषण विधि चुनें। प्रत्यक्ष विधि में विवेचक  संकल्पना का आकलन करना सम्मलित है, जिससे की सभी भविष्यवक्ताओं का एक साथ मूल्यांकन किया जा सके। स्टेप [[चरणबद्ध प्रतिगमन]] भविष्यवाणियों में क्रमिक रूप से प्रवेश करता है। दो-समूह विधि का उपयोग तब किया जाना चाहिए जब आश्रित चर में दो श्रेणियां या अवस्थाएँ हों। एकाधिक विभेदक विधि का उपयोग तब किया जाता है जब आश्रित चर में तीन या अधिक श्रेणीबद्ध अवस्थाएँ होती हैं। विल्क्स लैम्ब्डा डिस्ट्रीब्यूशन का प्रयोग करें। एसपीएसएस में महत्व या एसएएस में एफ स्टेट के परीक्षण के लिए विल्क्स लैम्ब्डा का उपयोग करें। वैधता का परीक्षण करने के लिए उपयोग की जाने वाली सबसे आम विधि नमूने को एक अनुमान या विश्लेषण नमूने और एक सत्यापन या होल्डआउट नमूने में विभाजित करना है। अनुमान नमूना का उपयोग विवेचक  संकल्पना के निर्माण में किया जाता है। सत्यापन नमूने का उपयोग एक वर्गीकरण आव्यूह के निर्माण के लिए किया जाता है जिसमें सही ढंग से वर्गीकृत और गलत वर्गीकृत मामलों की संख्या सम्मलित होती है। सही ढंग से वर्गीकृत मामलों के प्रतिशत को हिट अनुपात कहा जाता है।
#डिस्क्रिमिनेंट  संकल्पना गुणांक का अनुमान लगाएं और सांख्यिकीय महत्व और वैधता निर्धारित करें उपयुक्त डिस्क्रिमिनेंट विश्लेषण विधि चुनें। प्रत्यक्ष विधि में विवेचक  संकल्पना का आकलन करना सम्मलित है, जिससे की सभी भविष्यवक्ताओं का एक साथ मूल्यांकन किया जा सके। स्टेप [[चरणबद्ध प्रतिगमन]] भविष्यवाणियों में क्रमिक रूप से प्रवेश करता है। दो-समूह विधि का उपयोग तब किया जाना चाहिए जब आश्रित चर में दो श्रेणियां या अवस्थाएँ हों। एकाधिक विभेदक विधि का उपयोग तब किया जाता है जब आश्रित चर में तीन या अधिक श्रेणीबद्ध अवस्थाएँ होती हैं। विल्क्स लैम्ब्डा डिस्ट्रीब्यूशन का प्रयोग करें। एसपीएसएस में महत्व या एसएएस में एफ स्टेट के परीक्षण के लिए विल्क्स लैम्ब्डा का उपयोग करें। वैधता का परीक्षण करने के लिए उपयोग की जाने वाली सबसे आम विधि नमूने को एक अनुमान या विश्लेषण नमूने और एक सत्यापन या होल्डआउट नमूने में विभाजित करना है। अनुमान नमूना का उपयोग विवेचक  संकल्पना के निर्माण में किया जाता है। सत्यापन नमूने का उपयोग एक वर्गीकरण आव्यूह के निर्माण के लिए किया जाता है जिसमें सही ढंग से वर्गीकृत और गलत वर्गीकृत मामलों की संख्या सम्मलित होती है। सही ढंग से वर्गीकृत मामलों के प्रतिशत को हिट अनुपात कहा जाता है।
# परिणामों को दो आयामी मानचित्र पर प्लॉट करें, आयामों को परिभाषित करें और परिणामों की व्याख्या करें। सांख्यिकीय कार्यक्रम या संबंधित मॉड्यूल परिणामों को  प्रतिचित्रित करता है। प्रत्येक उत्पाद को सामान्यतया दो-आयामी स्थान में मानचित्र से ग्रथित किया जायेगा।एक दूसरे से उत्पादों की दूरी या तो वे कितने अलग हैं संकेत मिलता है.आयामों को शोधकर्ता द्वारा लेबल किया जाना चाहिए। इसके लिए व्यक्तिपरक निर्णय की आवश्यकता होती है और अक्सर यह बहुत ही चुनौतीपूर्ण होता है। [[अवधारणात्मक मानचित्रण]] देखें।
# परिणामों को दो आयामी मानचित्र पर प्लॉट करें, आयामों को परिभाषित करें और परिणामों की व्याख्या करें। सांख्यिकीय कार्यक्रम या संबंधित मॉड्यूल परिणामों को  प्रतिचित्रित करता है। प्रत्येक उत्पाद को सामान्यतया दो-आयामी स्थान में मानचित्र से ग्रथित किया जायेगा।एक दूसरे से उत्पादों की दूरी या तो वे कितने अलग हैं संकेत मिलता है.आयामों को शोधकर्ता द्वारा लेबल किया जाना चाहिए। इसके लिए व्यक्तिपरक निर्णय की आवश्यकता होती है और अक्सर यह बहुत ही चुनौतीपूर्ण होता है। [[अवधारणात्मक मानचित्रण]] देखें।


=== बायोमेडिकल अध्ययन ===
=== बायोमेडिकल अध्ययन ===
चिकित्सा में विभेदक विश्लेषण का मुख्य उपयोग रोगी की तीक्ष्णता की स्थिति और रोग के परिणाम का पूर्वानुमान है। उदाहरण के लिए, पूर्वव्यापी विश्लेषण के दौरान रोगी को बीमारी की गंभीरता के अनुसार हल्के, मध्यम और गंभीर रूप में समूहों में विभाजित किया जाता है।इसके बाद नैदानिक और प्रयोगशाला के विश्लेषणों का अध्ययन किया जाता है,जिससे की आंकड़ों के आधार पर विभिन्न स्तरों का पता लगाया जा सके।इन चर भेदभावपूर्ण कार्यों का उपयोग करते हुए, भेदभावपूर्ण कार्यों का निर्माण किया जाता है जो रोग को किसी भावी रोगी में हल्के, मध्यम या गंभीर रूप में वर्गीकृत करने में सहायक होता है।
चिकित्सा में विभेदक विश्लेषण का मुख्य उपयोग रोगी की तीक्ष्णता की स्थिति और रोग के परिणाम का पूर्वानुमान है। उदाहरण के लिए, पूर्वव्यापी विश्लेषण के दौरान रोगी को बीमारी की गंभीरता के अनुसार हल्के, मध्यम और गंभीर रूप में समूहों में विभाजित किया जाता है। इसके बाद नैदानिक और प्रयोगशाला के विश्लेषणों का अध्ययन किया जाता है, जिससे की आंकड़ों के आधार पर विभिन्न स्तरों का पता लगाया जा सके।इन चर भेदभावपूर्ण कार्यों का उपयोग करते हुए, भेदभावपूर्ण कार्यों का निर्माण किया जाता है जो रोग को किसी भावी रोगी में हल्के, मध्यम या गंभीर रूप में वर्गीकृत करने में सहायक होता है।


जीव विज्ञान में, समान सिद्धांतों का उपयोग विभिन्न जैविक वस्तुओं के समूहों को वर्गीकृत करने और परिभाषित करने के लिए किया जाता है, उदाहरण के लिए, फूरियर ट्रांसफॉर्म इन्फ्रारेड स्पेक्ट्रा के आधार पर साल्मोनेला एंटरिटिडिस के फेज प्रकारों को परिभाषित करने के लिए,<ref>{{cite journal | last1 = Preisner | first1 = O | last2 = Guiomar | first2 = R | last3 = Machado | first3 = J | last4 = Menezes | first4 = JC | last5 = Lopes | first5 = JA | year = 2010 | title = साल्मोनेला एंटरिका सेरोवर एंटरिटिडिस फेज प्रकारों के विभेदन के लिए फूरियर ट्रांसफॉर्म इंफ्रारेड स्पेक्ट्रोस्कोपी और केमोमेट्रिक्स का अनुप्रयोग| journal = Appl Environ Microbiol | volume = 76 | issue = 11| pages = 3538–3544 | doi=10.1128/aem.01589-09| pmid = 20363777 | pmc = 2876429 | bibcode = 2010ApEnM..76.3538P }}</ref> एस्चेरिचिया कोलाई के पशु स्रोत का पता लगाने के लिए इसके विषाणु कारकों का अध्ययन करना<ref>{{cite journal | last1 = David | first1 = DE | last2 = Lynne | first2 = AM | last3 = Han | first3 = J | last4 = Foley | first4 = SL | year = 2010 | title = पशु चिकित्सा Escherichia कोलाई आइसोलेट्स के लक्षण वर्णन में विषाणु कारक प्रोफाइलिंग का मूल्यांकन| journal = Appl Environ Microbiol | volume = 76 | issue = 22| pages = 7509–7513 | doi=10.1128/aem.00726-10| pmid = 20889790 | pmc = 2976202 | bibcode = 2010ApEnM..76.7509D }}</ref> वगैरह के रूप में होता है।
जीव विज्ञान में, समान सिद्धांतों का उपयोग विभिन्न जैविक वस्तुओं के समूहों को वर्गीकृत करने और परिभाषित करने के लिए किया जाता है, उदाहरण के लिए, फूरियर ट्रांसफॉर्म इन्फ्रारेड स्पेक्ट्रा के आधार पर साल्मोनेला एंटरिटिडिस के फेज प्रकारों को परिभाषित करने के लिए,<ref>{{cite journal | last1 = Preisner | first1 = O | last2 = Guiomar | first2 = R | last3 = Machado | first3 = J | last4 = Menezes | first4 = JC | last5 = Lopes | first5 = JA | year = 2010 | title = साल्मोनेला एंटरिका सेरोवर एंटरिटिडिस फेज प्रकारों के विभेदन के लिए फूरियर ट्रांसफॉर्म इंफ्रारेड स्पेक्ट्रोस्कोपी और केमोमेट्रिक्स का अनुप्रयोग| journal = Appl Environ Microbiol | volume = 76 | issue = 11| pages = 3538–3544 | doi=10.1128/aem.01589-09| pmid = 20363777 | pmc = 2876429 | bibcode = 2010ApEnM..76.3538P }}</ref> एस्चेरिचिया कोलाई के पशु स्रोत का पता लगाने के लिए इसके विषाणु कारकों का अध्ययन करना<ref>{{cite journal | last1 = David | first1 = DE | last2 = Lynne | first2 = AM | last3 = Han | first3 = J | last4 = Foley | first4 = SL | year = 2010 | title = पशु चिकित्सा Escherichia कोलाई आइसोलेट्स के लक्षण वर्णन में विषाणु कारक प्रोफाइलिंग का मूल्यांकन| journal = Appl Environ Microbiol | volume = 76 | issue = 22| pages = 7509–7513 | doi=10.1128/aem.00726-10| pmid = 20889790 | pmc = 2976202 | bibcode = 2010ApEnM..76.7509D }}</ref> वगैरह के रूप में होता है।
Line 213: Line 213:
{{Authority control}}
{{Authority control}}


{{DEFAULTSORT:Linear Discriminant Analysis}}[[Category: वर्गीकरण एल्गोरिदम]] [[Category: बाजार अनुसंधान]] [[Category: बाजार विभाजन]] [[Category: सांख्यिकीय वर्गीकरण]]
{{DEFAULTSORT:Linear Discriminant Analysis}}


 
[[Category:Collapse templates|Linear Discriminant Analysis]]
 
[[Category:Created On 31/05/2023|Linear Discriminant Analysis]]
[[Category: Machine Translated Page]]
[[Category:Lua-based templates|Linear Discriminant Analysis]]
[[Category:Created On 31/05/2023]]
[[Category:Machine Translated Page|Linear Discriminant Analysis]]
[[Category:Navigational boxes| ]]
[[Category:Navigational boxes without horizontal lists|Linear Discriminant Analysis]]
[[Category:Pages with empty portal template|Linear Discriminant Analysis]]
[[Category:Pages with script errors|Linear Discriminant Analysis]]
[[Category:Portal-inline template with redlinked portals|Linear Discriminant Analysis]]
[[Category:Sidebars with styles needing conversion|Linear Discriminant Analysis]]
[[Category:Template documentation pages|Documentation/doc]]
[[Category:Templates Vigyan Ready|Linear Discriminant Analysis]]
[[Category:Templates generating microformats|Linear Discriminant Analysis]]
[[Category:Templates that add a tracking category|Linear Discriminant Analysis]]
[[Category:Templates that are not mobile friendly|Linear Discriminant Analysis]]
[[Category:Templates that generate short descriptions|Linear Discriminant Analysis]]
[[Category:Templates using TemplateData|Linear Discriminant Analysis]]
[[Category:Wikipedia articles needing clarification from April 2012|Linear Discriminant Analysis]]
[[Category:Wikipedia articles needing clarification from April 2019|Linear Discriminant Analysis]]
[[Category:Wikipedia articles needing clarification from May 2021|Linear Discriminant Analysis]]
[[Category:Wikipedia metatemplates|Linear Discriminant Analysis]]
[[Category:बाजार अनुसंधान|Linear Discriminant Analysis]]
[[Category:बाजार विभाजन|Linear Discriminant Analysis]]
[[Category:वर्गीकरण एल्गोरिदम|Linear Discriminant Analysis]]
[[Category:सांख्यिकीय वर्गीकरण|Linear Discriminant Analysis]]

Latest revision as of 20:44, 5 July 2023

अव्यक्त डिरिचलेट आवंटन के साथ भ्रमित न हों।

रेखीय विवेचक विश्लेषण (एलडीए) सामान्य विभेदक विश्लेषण (एनडीए) या विवेचक कार्य विश्लेषण फिशर के रेखीय विवेचक का एक सामान्यीकरण है, यह विधि सांख्यिकी और अन्य क्षेत्रों में प्रयुक्त होती है। जो दो या दो से अधिक वर्गों को चिह्नित या भिन्न करने वाली विशेषताओं का एक रैखिक संयोजन खोजने के लिए किया जाता है। वस्तुओं या घटनाओं का परिणामस्वरूप संयोजन का प्रयोग रेखीय वर्गीकारक के रूप में किया जा सकता है, या बाद में सांख्यिकीय वर्गीकरण से पहले आयामीता में कमी के लिए अधिक सामान्यतः के रूप में  किया जा सकता है।

एलडीए विचरण (एनोवा) और प्रतिगमन विश्लेषण निकटता से संबंधित है, जो एक आश्रित चर के रूप में होता है, जो कि अन्य विशेषताओं या मापों के रैखिक संयोजन के रूप में व्यक्त करने का प्रयास करता है।[1][2] चूंकि, एनोवा श्रेणीबद्ध चर स्वतंत्र चर और एक सतत चर आश्रित चर के रूप में उपयोग करता है, जबकि विवेचक विश्लेषण में निरंतर स्वतंत्र चर होता है और एक श्रेणीबद्ध आश्रित चर अर्थात वर्ग लेबल के रूप में होता है।[3] लॉजिस्टिक प्रतिगमन और प्रोबिट प्रतिगमन एनोवा की तुलना में एलडीए से अधिक मिलते-जुलते हैं, क्योंकि ये निरंतर स्वतंत्र चर के मूल्यों द्वारा एक श्रेणीगत चर की व्याख्या भी करते हैं। ये अन्य विधि उन अनुप्रयोगों में उत्तम हैं, जहां यह मान लेना उचित नहीं है, कि स्वतंत्र चर सामान्य रूप से वितरित किए जाते हैं, जो एलडीए पद्धति की एक मौलिक धारणा है।

एलडीए प्रमुख घटक विश्लेषण (पीसीए) और कारक विश्लेषण से काफी निकटता से संबंधित है, जिसमें वे दोनों चर के रैखिक संयोजनों की तलाश करते हैं, जो डेटा को सर्वोत्तम रूप से समझते हैं।।[4] एलडीए स्पष्ट रूप से डेटा की कक्षाओं के बीच अंतर को मॉडल करने का प्रयास करता है। इसके विपरीत, पीसीए वर्ग किसी भी अंतर को ध्यान में नहीं रखता है और गुणक विश्लेषण समानता के बजाय मतभेदों पर आधारित फीचर संयोजन बनाता है।। विभेदक विश्लेषण भी कारक विश्लेषण से भिन्न है, क्योंकि यह एक अन्योन्याश्रित प्रद्योगिकी नहीं है:स्वतंत्र चरों तथा आश्रित चरों के बीच भेद को भी मानक चर कहा जाता है।

एलडीए काम करता है जब प्रत्येक अवलोकन के लिए स्वतंत्र चर पर किए गए माप निरंतर मात्रा के रूप में होते हैं। स्पष्ट स्वतंत्र चर के साथ काम करते समय, समतुल्य प्रद्योगिकी भेदभावपूर्ण पत्राचार विश्लेषण के रूप में है।[5][6]

भेदभावपूर्ण विश्लेषण उस समय उपयोग किया जाता है, जब समूहों को प्राथमिकता क्लस्टर विश्लेषण के रूप में जाना जाता है। प्रत्येक मामले में एक मात्रात्मक भविष्यवक्ता उपायों पर एक अंक और एक समूह माप पर एक अंक होना चाहिए।[7] सरल शब्दों में विवेचक संकल्पना विश्लेषण के रूप में चीजों को समूह वर्गों या एक ही प्रकार की श्रेणियों में बांटने की क्रिया का वर्गीकरण है।

इतिहास

1936 में सर रोनाल्ड फिशर द्वारा मूल द्विभाजित विभेदक विश्लेषण विकसित किया गया था।[8] यह एक एनोवा या मनोवा से भिन्न है, जिसका उपयोग एक या एक से अधिक स्वतंत्र श्रेणीबद्ध चर के रूप में किया जाता है। एक एनोवा या बहु मनोवा के निरंतर आश्रित चर की भविष्यवाणी करने के लिए किया जाता है। भेदभावपूर्ण कार्य विश्लेषण यह निर्धारित करने में उपयोगी है, कि श्रेणी सदस्यता की भविष्यवाणी करने में चर का एक सेट प्रभावी है या नहीं।[9]

दो वर्गों के लिए एलडीए

टिप्पणियों के एक सेट पर विचार करें ज्ञात वर्ग के साथ किसी वस्तु या घटना के प्रत्येक नमूने के लिए (जिसे विशेषताएं, चर या माप भी कहा जाता है)। . नमूनों के इस सेट को प्रशिक्षण सेट कहा जाता है। वर्गीकरण समस्या तब वर्ग के लिए एक अच्छा भविष्यवक्ता खोजने की है एक ही वितरण के किसी भी नमूने का आवश्यक नहीं कि प्रशिक्षण सेट से मात्र एक अवलोकन दिया गया हो .[10]: 338 

एलडीए सशर्त संभाव्यता घनत्व कार्यों को मानकर समस्या का समाधान करता है और माध्य और सहप्रसरण मापदंडों के साथ दोनों बहुभिन्नरूपी सामान्य वितरण हैं और , क्रमश। इस धारणा के अनुसार, बेयस वर्गीकारक | बेयस-इष्टतम समाधान अंक को दूसरी श्रेणी से होने की भविष्यवाणी करना है यदि संभावना अनुपात का लॉग कुछ थ्रेशोल्ड टी से बड़ा है, जिससे की:

किसी और धारणा के बिना, परिणामी वर्गीकारक को द्विघात वर्गीकारक (QDA) के रूप में संदर्भित किया जाता है।

एलडीए इसके अतिरिक्त सरलीकृत समरूपता धारणा बनाता है अर्थात कि वर्ग सहप्रसरण समान हैं, इसलिए ) और यह कि सहप्रसरण की पूरी रैंक है।

इस मामले में कई शर्तें रद्द:

क्योंकि हर्मिटियन आव्यूह है।

और उपरोक्त निर्णय मानदंड के रूप में है।

डॉट उत्पाद पर दहलीज बन जाता है।

कुछ दहलीज स्थिर सी के लिए, जहां

इसका मतलब है कि एक इनपुट की कसौटी एक कक्षा में होना विशुद्ध रूप से ज्ञात प्रेक्षणों के इस रैखिक संयोजन के संकल्पना का रूप है।

वाई पूरी तरह से ज्ञात टिप्पणियों के इस रैखिक संयोजन का एक रूप है।

इस निष्कर्ष को ज्यामितीय दृष्टि से देखना अधिकांशतः उपयोगी होता है, एक इनपुट की कसौटी एक कक्षा में होना विशुद्ध रूप से बहुआयामी अंतरिक्ष बिंदु के प्रक्षेपण का कार्य है सदिश पर इस प्रकार हम मात्र इसकी दिशा पर विचार करते हैं। दूसरे शब्दों में अवलोकन का है यदि संगत है के लंबवत अधिसमतल के एक निश्चित तरफ स्थित है। . विमान का स्थान दहलीज द्वारा परिभाषित किया गया है .जो कि के रूप में है।

अनुमान

विवेचक विश्लेषण की धारणाएं मनोवा के समान ही हैं। विश्लेषण आउटलेयर के प्रति पर्याप्त संवेदनशील है और सबसे छोटे समूह का आकार भविष्यवाणी करने वाले चरों की संख्या से बड़ा होना चाहिए।।[7]

  • बहुभिन्नरूपी सामान्य वितरण: समूहीकरण चर के प्रत्येक स्तर के लिए स्वतंत्र चर सामान्य होते हैं।[9][7]
  • प्रसरण/सहप्रसरण की एकरूपता (समरूपता): सभी चरों के बीच भिन्नताएँ भविष्यवक्ताओं के स्तरों पर समान होती हैं।।बॉक्स के एम आंकड़ों के साथ परीक्षण किया जा सकता है ।[9]
  • चूंकि यह सुझाव दिया गया है कि सहप्रसरण समान होने पर रैखिक विभेदक विश्लेषण का उपयोग किया जाता है, और जब सहप्रसरण समान नहीं होते हैं तो द्विघात क्लासिफायर क्वाड्रैटिक विवेचक विश्लेषण का उपयोग किया जा सकता है।[7]
  • बहुसंरेखता: पूर्वसूचक चरों के बीच बढ़े हुए सहसंबंध के साथ भविष्य कहनेवाला शक्ति घट सकती है।[7]
  • सांख्यिकीय स्वतंत्र: प्रतिभागियों को यादृच्छिक नमूना माना जाता है और एक चर पर एक प्रतिभागी का स्कोर अन्य सभी प्रतिभागियों के लिए उस चर पर स्कोर से स्वतंत्र माना जाता है।[9][7]

यह सुझाव दिया गया है कि भेदभावपूर्ण विश्लेषण इन मान्यताओं के मामूली उल्लंघनों के लिए अपेक्षाकृत मजबूत है,[11] और यह भी दिखाया गया है कि द्विबीजपत्री चरों का उपयोग करते समय विभेदक विश्लेषण अभी भी विश्वसनीय हो सकता है। जहां बहुभिन्नरूपी सामान्यता का अधिकांशतः उल्लंघन किया जाता है।[12]

भेदभावपूर्ण कार्य

विवेकशील विश्लेषण भविष्यवक्ताओं के एक या अधिक रैखिक संयोजन बनाकर काम करता है, प्रत्येक संकल्पना के लिए एक नया अव्यक्त चर बन जाता है। इन कार्यों को विभेदक कार्य कहा जाता है। संभव कार्यों की संख्या या तो है जहाँ = समूहों की संख्या, या भविष्यवक्ताओं की संख्या है, जो कि छोटा हैइस संकल्पना ने बनाया है। पहला संकल्पना उस संकल्पना के समूहों के बीच के अंतर को अधिकतम करता है। दूसरा संकल्पना उस संकल्पना के अंतर को अधिकतम करता है, लेकिन पिछले संकल्पना के साथ सहसंबद्ध भी नहीं होना चाहिए। यह बाद के कार्यों के साथ इन आवश्यकता के साथ जारी रहता है, कि नया कार्य पिछले कार्यों में से किसी के साथ सहसंबद्ध न हो सके ।

दिया गया समूह , साथ नमूना स्थान के सेट, एक भेदभावपूर्ण नियम है जैसे कि यदि , तब . भेदभावपूर्ण विश्लेषण तब, के "भोजन" क्षेत्रों को खोजें वर्गीकरण त्रुटि को कम करने के लिए, इसलिए वर्गीकरण तालिका में उच्च प्रतिशत सही वर्गीकृत करने के लिए अग्रणी होता है।[13]

प्रत्येक संकल्पना को एक विवेकशील स्कोर दिया जाता है,[clarification needed] यह निर्धारित करने के लिए कि यह समूह प्लेसमेंट की कितनी अच्छी भविष्यवाणी करता है।

  • संरचना सहसंबंध गुणांक: प्रत्येक भविष्यवक्ता और प्रत्येक संकल्पना के विवेचक स्कोर के बीच सहसंबंध होता है। यह एक शून्य क्रम सहसंबंध है अर्थात अन्य भविष्यवक्ताओं के लिए सही नहीं होता है ।[14]
  • मानकीकृत गुणांक: रैखिक संयोजन में प्रत्येक भविष्यवक्ता का वजन जो कि विभेदक कार्य है। एक प्रतिगमन समीकरण की तरह ये गुणांक आंशिक हैं अर्थात अन्य भविष्यवक्ताओं के लिए सही हैं। समूह असाइनमेंट की भविष्यवाणी करने में प्रत्येक भविष्यवक्ता के अद्वितीय योगदान को इंगित करता है।
  • ग्रुप सेंट्रोइड्स पर कार्य: प्रत्येक संकल्पना के लिए ग्रुपिंग चर के लिए औसत विभेदक के रूप में स्कोर दिए गए हैं।। साधन जितने दूर होंगे, वर्गीकरण में त्रुटि उतनी ही कम होगी।

डिस्क्रिमिनेशननियम

  • अधिकतम संभावना: असाइन करें उस समूह के लिए जो जनसंख्या (समूह) घनत्व को अधिकतम करता है।[15]
  • बेयस डिस्क्रिमिनेंट रूल: असाइन करता है उस समूह के लिए जो अधिकतम करता है, जहां πi उस वर्गीकरण की पूर्व संभावना का प्रतिनिधित्व करता है, और जनसंख्या घनत्व का प्रतिनिधित्व करता है।[15]
  • फिशर का रेखीय विविक्तकर नियम: एसएस के बीच अनुपात को अधिकतम करता है और एस.एस समूह की भविष्यवाणी करने के लिए भविष्यवक्ताओं का एक रैखिक संयोजन पाता है।[15]

अभिलक्षणिक मान

विवेचक विश्लेषण में एक अभिलाक्षणिक मान प्रत्येक संकल्पना की विशेष जड़ होती है।[clarification needed] यह इस बात का संकेत है, कि यह संकल्पना समूहों को कितनी अच्छी प्रकार से भिन्न करता है, जहां अभिलाक्षणिक मान जितना बड़ा होता है, उतना ही उत्तम संकल्पना को भिन्न करता है।[7]चूंकि इसे सावधानी के साथ समझा जाना चाहिए, क्योंकि अभिलाक्षणिक मान की कोई ऊपरी सीमा नहीं है।[9][7]

इस प्रकार अभिलाक्षणिक मान को एनोवा के रूप में एसएस के बीच में और एस.एस के अंदर अनुपात के रूप में देखा जा सकता है,जब आश्रित चर विवेकशील के रूप में कार्य करता है, और समूह वाद्य चर स्तर के रूप में होते हैं,[clarification needed].[9]इसका मतलब यह है कि सबसे बड़ा अभिलाक्षणिक मान पहले संकल्पनाके साथ जुड़ा हुआ है, दूसरा सबसे बड़ा दूसरे के साथ आदि।

प्रभाव बनावट

कुछ सुझाव देते हैं कि प्रभावी आकार उपायों के रूप में अभिलाक्षणिक मान उपयोग किया जाता है, चूंकि, यह सामान्यतः समर्थित नहीं है।[9]इसके अतिरिक्त, विहित सहसंबंध प्रभावी आकार का पसंदीदा उपाय है। यह अभिलाक्षणिक मान के समान है, लेकिन एस.एस के बीच और एस.एस के कुल अनुपात का वर्गमूल है।. यह समूहों और कार्यों के बीच संबंध है।[9]

प्रभाव आकार का एक अन्य लोकप्रिय उपाय प्रत्येक संकल्पना के लिए विचरण स्पष्टीकरण आवश्यकता का प्रतिशत है।[clarification needed] प्रत्येक संकल्पना के लिए इसकी गणना इस प्रकार की जाती है: (λx/ क्रमi) एक्स 100 जहां λxफ़ंक्शन और Σλ के लिए अभिलाक्षणिक मान है, और Σλi सभी अभिलाक्षणिक मान ​​​​का योग है। यह हमें बताता है कि अन्य कार्यों की तुलना में उस विशेष कार्य के लिए भविष्यवाणी कितनी मजबूत है।[9]

सही ढंग से वर्गीकृत प्रतिशत का प्रभाव आकार के रूप में भी विश्लेषण किया जा सकता है। कप्पा मूल्य इस बात का वर्णन कर सकता है, कि आकस्मिक करार में सुधार होता है।कप्पा एक बहुत अच्छे या खराब प्रदर्शन वाले वर्गों द्वारा पक्षपातपूर्ण होने के बजाय सभी श्रेणियों में सामान्य बनाता है। स्पष्टीकरण की आवश्यकता होती है।[9]Kappa normalizes across all categorizes rather than biased by a significantly good or poorly performing classes.[clarification needed][16]

के वर्गों के लिए विहित विभेदक विश्लेषण

कैनोनिकल डिस्क्रिमिनेंट एनालिसिस (सीडीए) अक्षों को पाता है, (k − 1 कैनोनिकल निर्देशांक, k वर्गों की संख्या है) जो श्रेणियों को उत्तम प्रकार से भिन्न करते हैं। ये रैखिक कार्य असंबद्ध हैं और वास्तव में डेटा के एन आयामी बादल के माध्यम से एक इष्टतम k − 1 स्थान को प्रभावी रूप से परिभाषित करते हैं, जो k समूहों के उस स्थान में अनुमानों को सबसे अच्छी प्रकार से भिन्न करता है। नीचे विवरण के लिए "मल्टीक्लास एलडीए"के रूप में देखें।

फिशर का रैखिक विवेचक

फ़िशर के रैखिक विवेचक और एलडीए शब्द अधिकांशतः एक दूसरे के स्थान पर उपयोग किया जाता है, चूंकि रोनाल्ड ए फ़िशर का मूल लेख होता है [1]वास्तव में थोड़ा भिन्न डिस्क्रिमिनेशनका वर्णन करता है, जो एलडीए की कुछ धारणाओं को नहीं बनाता है, जैसे कि सामान्य वितरण वर्ग या समान वर्ग सहप्रसरण होता है।

मान लीजिए कि टिप्पणियों के दो वर्गों का मतलब है और सहप्रसरण . फिर सुविधाओं का रैखिक संयोजन साधन होंगे और प्रसरण के लिए . फिशर ने इन दो संभाव्यता वितरण के बीच भिन्नता के वर्गों के बीच भिन्नता के अनुपात के रूप में परिभाषित किया जाता है।


यह उपाय, कुछ अर्थों में, वर्ग लेबलिंग के लिए संकेत-ध्वनि अनुपात का माप होता है। यह दिखाया जा सकता है कि अधिकतम पृथक्करण तब होता है,

जब एलडीए की धारणाएं संतुष्ट होती हैं, तो उपरोक्त समीकरण एलडीए के समतुल्य होता है।

फिशर का रेखीय विभेदक एक अक्ष के रूप में देखा गया

ध्यान दें कि सदिश विवेचक हाइपरप्लेन के लिए सतह सामान्य है। एक उदाहरण के रूप में, दो आयामी समस्या में, दो समूहों को विभाजित करने वाली रेखा लंबवत होती है .

सामान्यतः, डिस्क्रिमिनेशनकिए जाने वाले डेटा बिंदुओं को प्रक्षेपित किया जाता है, ; फिर एक आयामी वितरण के विश्लेषण से डेटा को सबसे भिन्न करने वाली सीमा को चुना जाता है। दहलीज के लिए कोई सामान्य नियम नहीं है। चूंकि, यदि दोनों कक्षाओं के बिंदुओं के अनुमान लगभग समान वितरण प्रदर्शित करता है, तो एक अच्छा विकल्प दो साधनों के अनुमानों के बीच हाइपरप्लेन होगा, और . इस स्थिति में पैरामीटर c दहलीज स्थिति में है स्पष्ट रूप से पाया जा सकता है।

.

ओत्सु की विधि फिशर के रेखीय विवेचक से संबंधित है, और एक ग्रेस्केल छवि में पिक्सेल के हिस्टोग्राम को एक काली/सफेद थ्रेसहोल्ड को चुनने के लिए बनाया गया है, जो कि इंट्रा-क्लास विचरण को कम करता है और काले और सफेद पिक्सेल कक्षाओं को दिये गये होते है, ग्रेस्केल के भीतर / बीच अंतर-वर्ग विचरण को अधिकतम करता है।

मल्टीक्लास एलडीए

3डी में 4 वर्गों के लिए एक-बनाम-सभी एलडीए अक्षों के लिए विज़ुअलाइज़ेशन
4 वर्गों के लिए रेखीय विवेचक अक्षों के साथ प्रक्षेपण

ऐसे मामले में जहां दो से अधिक वर्ग हैं, फिशर विवेचक की व्युत्पत्ति में उपयोग किए गए विश्लेषण को एक रेखीय उप स्थान खोजने के लिए विस्तारित किया जा सकता है, जो कि सभी वर्ग परिवर्तनशीलता को समाहित करता प्रतीत होता है।[17] यह सामान्यीकरण सी. आर. राव के कारण है।[18] मान लीजिए कि प्रत्येक C वर्ग का माध्य है और वही सहप्रसरण .के साथ तब वर्ग परिवर्तनशीलता के बीच बिखराव को वर्ग माध्य के नमूना सहप्रसरण द्वारा परिभाषित किया जा सकता है।

जहां वर्ग का माध्य है। एक दिशा में वर्ग जुदाई इस मामले में दिया जाएगा

इसका मतलब है कि जब का अभिलक्षणिक सदिश है पृथक्करण संगत अभिलाक्षणिक मान के समतुल्य होगा।

चूंकि का विकर्णीय किया जा सकता है, सुविधाओं के बीच परिवर्तनशीलता सी − 1 सबसे बड़े अभिलाक्षणिक मान के अनुरूप पैरामीटर के आकार में समाहित किया जाएगा. चूंकि अधिक से अधिक रैंक C − 1 का है। ये ईगेन सदिश मुख्य रूप से पीसीए के प्रकार के फीचर रिडक्शन में उपयोग किए जाते हैं। छोटे अभिलाक्षणिक मान ​​​​के अनुरूप ईगेंवैक्टर प्रशिक्षण डेटा की उपयुक्त पसंद के प्रति बहुत संवेदनशील होते हैं, और अगले खंड में वर्णित नियमितीकरण का उपयोग करना अधिकांशतः आवश्यक होता है.

यदि आयाम में कमी के अतिरिक्त, वर्गीकरण की आवश्यकता होती है, तो कई वैकल्पिक प्रद्योगिकी के रूप में उपलब्ध हैं। उदाहरण के लिए, वर्गों को विभाजित किया जा सकता है, और प्रत्येक विभाजन को वर्गीकृत करने के लिए एक मानक फिशर डिस्क्रिमिनेंट या एलडीए का उपयोग किया जाता है। इसका एक सामान्य उदाहरण "एक बनाम बाकी" है, जहां एक वर्ग के अंक एक समूह में रखे जाते हैं, और बाकी सब दूसरे में और फिर एलडीए लागू होता है। इसका परिणाम सी क्लासिफायर होगा, जिसके परिणाम संयुक्त होंगे।

एक अन्य सामान्य विधि जोड़ीदार वर्गीकरण है जहां प्रत्येक वर्ग के जोड़े के लिए एक नया वर्गीकारक बनाया जाता है,जिसमें कुल मिलाकर कुल C(C − 1)/2 वर्गीकारक होते हैं। एक अंतिम वर्गीकरण तैयार करने के लिए भिन्न-भिन्न वर्गीकारकों संयोजन के साथ होते हैं।

इंक्रीमेंटल एलडीए

एलडीए प्रद्योगिकी के विशिष्ट कार्यान्वयन के लिए सभी नमूने अग्रिम में उपलब्ध होने की आवश्यकता होती है.। चूंकि ऐसी स्थितियाँ होती हैं जहाँ संपूर्ण डेटा सेट उपलब्ध नहीं होता है और इनपुट डेटा को एक धारा के रूप में देखा जाता है। इस स्थिति में यह एलडीए सुविधा निष्कर्षण के लिए यह वांछनीय है कि पूरे डेटा सेट पर एल्गोरिथ्म को चलाए बिना नए नमूनों को देखकर गणना की गई है,एलडीए विशेषताओं को अद्यतन करने की क्षमता रखने के लिए वांछनीय होती है। उदाहरण के लिए, वास्तविक समय में मोबाइल रोबोटिक्स जैसे अनुप्रयोगों में नए प्रेक्षण उपलब्ध होते ही एक्सट्रेक्ट किए गए एवास्तविक समय में मोबाइल रोबोटिक्स जैसे अनुप्रयोगों में नए प्रेक्षण उपलब्ध होते ही एक्सट्रेक्ट किए गए एल. डी. ए. फीचर को अपडेट करना महत्वपूर्ण है। एक एल. डी. ए. विशेषता निष्कर्षण प्रद्योगिकी जो सिर्फ नए नमूने देख कर एल. डी. ए. सुविधाओं को अद्यतन कर सकते हैं, एक वृद्धिशील एल. डी. ए. एल्गोरिथ्म है और इस विचार का पिछले दो दशकों में बड़े पैमाने पर अध्ययन किया गया है।[19] चटर्जी और रॉयचौधरी ने एलडीए सुविधाओं को अद्यतन करने के लिए एक वृद्धिशील स्वयं संगठित एलडीए कलन विधिप्रस्तावित किया।[20] अन्य कार्य में, डेमिर और ओजमेमेट ने त्रुटि-सुधार और हेब्बियन सीखने के नियमों का उपयोग करते हुए एलडीए सुविधाओं को अद्यतन करने के लिए ऑनलाइन स्थानीय शिक्षण एल्गोरिदम प्रस्तावित किया।[21] बाद में, अलियारी एट अल के नए नमूने देखकर एलडीए सुविधाओं को अद्यतन करने के लिए तेजी से वृद्धिशील एल्गोरिदम व्युत्पन्न किया गया था ।[19]

व्यावहारिक उपयोग

व्यवहार में वर्ग का अर्थ और सहप्रसरण ज्ञात नहीं हैं। चूंकि,प्रशिक्षण सेट से इनका अनुमान लगाया जा सकता है। उपरोक्त समीकरणों में उपयुक्त मान के स्थान पर या तो अधिकतम संभावना अनुमान या अधिकतम पश्च अनुमान का उपयोग किया जा सकता है। चूंकि सहप्रसरण के अनुमानों को कुछ अर्थों में इष्टतम माना जा सकता है, इसका मतलब यह नहीं है कि इन मूल्यों को प्रतिस्थापित करके प्राप्त परिणामी विवेचक किसी भी अर्थ में इष्टतम है, भले ही सामान्य रूप से वितरित वर्गों की धारणा सही हो सकती है।

एलडीए और फिशर के विवेचक को वास्तविक डेटा पर लागू करने में एक और जटिलता तब होती है, जब प्रत्येक नमूने के माप की संख्या अर्थात प्रत्येक डेटा सदिश की आयाम प्रत्येक कक्षा में नमूनों की संख्या से अधिक हो जाती है।[4]इस मामले में सहप्रसरण अनुमानों की पूरी रैंक नहीं होती है और इसलिए इसे उल्टा नहीं किया जा सकता है। इससे निपटने के कई तरीके हैं। उपरोक्त सूत्रों में सामान्य आव्यूह व्युत्क्रम के अतिरिक्त छद्म व्युत्क्रम का उपयोग करना है। चूंकि, उत्तम संख्यात्मक स्थिरता प्राप्त करने के लिए सबसे पहले समस्या के सबस्पेस को प्रक्षेपित करते हुए किया जा सकता है।.[22]

छोटे नमूने के बनावट से निपटने के लिए एक अन्य रणनीति सहप्रसरण आव्यूह के संकोचन अनुमानक का उपयोग होता है।

जिसे गणितीय रूप में व्यक्त किया जा सकता है।

जहाँ आइडेंटिटीआव्यूह है, और संकोचन तीव्रता या नियमितीकरण पैरामीटर है।

यह नियमित विभेदक विश्लेषण के ढांचे की ओर ले जाता है।[23] या संकोचन विभेदक विश्लेषण होता है ।[24]

कई व्यावहारिक मामलों में रैखिक विवेचक उपयुक्त नहीं होते हैं। एलडीए और फिशर के विवेचक को कर्नेल चाल के माध्यम से गैर-रैखिक वर्गीकरण में उपयोग के लिए बढ़ाया जा सकता है। यहां, मूल प्रेक्षणों को प्रभावी रूप से एक उच्च आयामी गैर रैखिक अंतरिक्ष में प्रतिचित्रित किया गया है। इस गैर रैखिक स्थान में रैखिक वर्गीकरण फिर मूल स्थान में गैर रैखिक वर्गीकरण के समतुल्य होता है। इसका सबसे अधिक उपयोग किया जाने वाला उदाहरण कर्नेल एकाधिक विभेदक विश्लेषण होता है।

एलडीए को कई विभेदक विश्लेषणों के लिए सामान्यीकृत किया जा सकता है, जहां सी मात्र दो के अतिरिक्त एन संभावित राज्यों के साथ एक श्रेणीबद्ध चर बन जाता है। जिसे अनुरूप रूप से यदि वर्ग-सशर्त घनत्व साझा सहप्रसरण के साथ सामान्य होता हैं, पर्याप्त आँकड़ा एन अनुमानों के मूल्य हैं, जो एन साधनों द्वारा फैलाए गए रैखिक उप-स्थान हैं, व्युत्क्रम सहप्रसरण आव्यूह द्वारा परिशोधित परिवर्तन। इन अनुमानों को एक आव्यूह सामान्यीकृत अभिलाक्षणिक मान समस्या को हल करके पाया जा सकता है, ईजेन डीकंपोजीशन होता है, जो नमूनों के माध्यम से मापन से तैयार किया जाता है, और हर भाग में साझा सहप्रसविताआव्यूह होता है। विवरण के लिए ऊपर "मल्टीक्लास एलडीए" के रूप में देखें।

अनुप्रयोग

नीचे दिए गए उदाहरणों के अतिरिक्त, एलडीए को स्थिति (मार्केटिंग) और उत्पाद प्रबंधन में लागू किया जाता है।

दिवालियापन की भविष्यवाणी

लेखा अनुपात और अन्य वित्तीय चर के आधार पर दिवालियापन की भविष्यवाणी में, रैखिक विभेदक विश्लेषण व्यवस्थित रूप से यह समझाने के लिए था। कि प्रथम सांख्यिकीय पद्धति के रूप में लागू किया गया था।जिसका इस्तेमाल दिवालियापन बनाम अस्तित्व में था।एलडीए के सामान्य वितरण मान्यताओं के अनुरूप लेखा करण अनुपात की अनदेखी के बावजूद, एडवर्ड ऑल्टमैन का जेड-स्कोर वित्तीय विश्लेषण उपकरण अभी भी व्यावहारिक उपयोग में अभी भी अग्रणी मॉडल के रूप में है।

फेसेस की पहचान

कम्प्यूटरीकृत फेसेस की आइडेंटिटी प्रणाली में, प्रत्येक फेसेस को बड़ी संख्या में पिक्सेल मानों द्वारा प्रदर्शित किया जाता है। रेखीय डिस्क्रिमिनेशन विश्लेषण का प्रमुख रूप से प्रयोग वर्गीकरण से पूर्व लक्षणों की संख्या को अधिक प्रबंधनीय संख्या में घटाने के लिए किया जाता है। प्रत्येक नया आयाम पिक्सेल मानों का एक रैखिक संयोजन है, जो एक टेम्पलेट का निर्माण करता है। फिशर के रैखिक विवेचक का उपयोग करके प्राप्त रैखिक संयोजनों को फिशर फेसेस कहा जाता है, जबकि संबंधित प्रमुख घटक विश्लेषण के उपयोग से प्राप्त रेखीय संयोजनों को ईजीफेसेस कहा जाता है।

मार्केटिंग

मार्केटिंगमें, भेदभावपूर्ण विश्लेषण का उपयोग अधिकांशतः उन कारकों को निर्धारित करने के लिए किया जाता था, जो विभिन्न प्रकार के ग्राहकों और उत्पादों को सर्वेक्षण या अन्य प्रकार के एकत्रित डेटा के आधार पर भिन्न करते हैं। लॉजिस्टिक रिग्रेशन या अन्य विधि अब अधिक सामान्य रूप से उपयोग किए जाते हैं। मार्केटिंग में विभेदक विश्लेषण के उपयोग को निम्नलिखित चरणों द्वारा वर्णित किया जा सकता है:

  1. समस्या तैयार करना और डेटा एकत्र करना- इस श्रेणी में उत्पादों का मूल्यांकन करने के लिए उपयोग किए जाने वाले सामाजिक गुणों की आइडेंटिटी करना मात्रात्मक मार्केटिंग अनुसंधान प्रद्योगिक के रूप में है। जैसे सांख्यिकीय सर्वेक्षण का उपयोग करें जिससे की सभी उत्पाद विशेषताओं की रेटिंग के संबंध में संभावित ग्राहकों के नमूने से डेटा एकत्र किए जा सकते है, डेटा संग्रह चरण सामान्यतः मार्केटिंग अनुसंधान पेशेवरों द्वारा की जाती है। सर्वेक्षण के प्रश्न प्रतिवादी को शोधकर्ता द्वारा चुनी गई विशेषताओं की एक श्रृंखला पर उत्पाद को एक से पांच (या 1 से 7, या 1 से 10) तक रेट करने के लिए कहते हैं। कहीं भी पाँच से बीस विशेषताओं का चयन किया जाता है। उनमें निम्न चीज़ें सम्मलित हो सकती हैं: उपयोग में आसानी, वजन, उपयुक्तता, टिकाऊपन, रंगीनता, कीमत या बनावट के रूप में हो सकती है। और इस प्रकार गुण अध्ययन किए जा रहे है। उत्पाद के आधार पर गुण भिन्न-भिन्न होंगे। अध्ययन में सभी उत्पादों के बारे में एक ही प्रश्न पूछा गया है। कई उत्पादों के डेटा को संहिताबद्ध किया जाता है और एक सांख्यिकीय कार्यक्रम जैसे आर भाषा, एसपीएसएस या एसएएस प्रोग्रामिंग भाषा में इनपुट किया जाता है। यह चरण कारक विश्लेषण के समान है।
  2. डिस्क्रिमिनेंट संकल्पना गुणांक का अनुमान लगाएं और सांख्यिकीय महत्व और वैधता निर्धारित करें उपयुक्त डिस्क्रिमिनेंट विश्लेषण विधि चुनें। प्रत्यक्ष विधि में विवेचक संकल्पना का आकलन करना सम्मलित है, जिससे की सभी भविष्यवक्ताओं का एक साथ मूल्यांकन किया जा सके। स्टेप चरणबद्ध प्रतिगमन भविष्यवाणियों में क्रमिक रूप से प्रवेश करता है। दो-समूह विधि का उपयोग तब किया जाना चाहिए जब आश्रित चर में दो श्रेणियां या अवस्थाएँ हों। एकाधिक विभेदक विधि का उपयोग तब किया जाता है जब आश्रित चर में तीन या अधिक श्रेणीबद्ध अवस्थाएँ होती हैं। विल्क्स लैम्ब्डा डिस्ट्रीब्यूशन का प्रयोग करें। एसपीएसएस में महत्व या एसएएस में एफ स्टेट के परीक्षण के लिए विल्क्स लैम्ब्डा का उपयोग करें। वैधता का परीक्षण करने के लिए उपयोग की जाने वाली सबसे आम विधि नमूने को एक अनुमान या विश्लेषण नमूने और एक सत्यापन या होल्डआउट नमूने में विभाजित करना है। अनुमान नमूना का उपयोग विवेचक संकल्पना के निर्माण में किया जाता है। सत्यापन नमूने का उपयोग एक वर्गीकरण आव्यूह के निर्माण के लिए किया जाता है जिसमें सही ढंग से वर्गीकृत और गलत वर्गीकृत मामलों की संख्या सम्मलित होती है। सही ढंग से वर्गीकृत मामलों के प्रतिशत को हिट अनुपात कहा जाता है।
  3. परिणामों को दो आयामी मानचित्र पर प्लॉट करें, आयामों को परिभाषित करें और परिणामों की व्याख्या करें। सांख्यिकीय कार्यक्रम या संबंधित मॉड्यूल परिणामों को प्रतिचित्रित करता है। प्रत्येक उत्पाद को सामान्यतया दो-आयामी स्थान में मानचित्र से ग्रथित किया जायेगा।एक दूसरे से उत्पादों की दूरी या तो वे कितने अलग हैं संकेत मिलता है.आयामों को शोधकर्ता द्वारा लेबल किया जाना चाहिए। इसके लिए व्यक्तिपरक निर्णय की आवश्यकता होती है और अक्सर यह बहुत ही चुनौतीपूर्ण होता है। अवधारणात्मक मानचित्रण देखें।

बायोमेडिकल अध्ययन

चिकित्सा में विभेदक विश्लेषण का मुख्य उपयोग रोगी की तीक्ष्णता की स्थिति और रोग के परिणाम का पूर्वानुमान है। उदाहरण के लिए, पूर्वव्यापी विश्लेषण के दौरान रोगी को बीमारी की गंभीरता के अनुसार हल्के, मध्यम और गंभीर रूप में समूहों में विभाजित किया जाता है। इसके बाद नैदानिक और प्रयोगशाला के विश्लेषणों का अध्ययन किया जाता है, जिससे की आंकड़ों के आधार पर विभिन्न स्तरों का पता लगाया जा सके।इन चर भेदभावपूर्ण कार्यों का उपयोग करते हुए, भेदभावपूर्ण कार्यों का निर्माण किया जाता है जो रोग को किसी भावी रोगी में हल्के, मध्यम या गंभीर रूप में वर्गीकृत करने में सहायक होता है।

जीव विज्ञान में, समान सिद्धांतों का उपयोग विभिन्न जैविक वस्तुओं के समूहों को वर्गीकृत करने और परिभाषित करने के लिए किया जाता है, उदाहरण के लिए, फूरियर ट्रांसफॉर्म इन्फ्रारेड स्पेक्ट्रा के आधार पर साल्मोनेला एंटरिटिडिस के फेज प्रकारों को परिभाषित करने के लिए,[25] एस्चेरिचिया कोलाई के पशु स्रोत का पता लगाने के लिए इसके विषाणु कारकों का अध्ययन करना[26] वगैरह के रूप में होता है।

एर्थ विज्ञान

इस विधि का उपयोग परिवर्तन ज़ोनस्क्रीरिफिकेशन को आवश्यक अलग-अलग करने के लिए किया जा सकता हैseparate the alteration zones[clarification needed]. उदाहरण के लिए, जब विभिन्न क्षेत्रों से भिन्न-भिन्न डेटा उपलब्ध होते हैं, तो विवेकशील विश्लेषण डेटा के पैटर्न को ढूंढ सकता है और इसे प्रभावी ढंग से वर्गीकृत कर सकता है।[27]

रसद प्रतिगमन की तुलना

विभेदक कार्य विश्लेषण रसद प्रतिगमन के समान है, और दोनों का उपयोग समान शोध प्रश्नों के उत्तर देने के लिए किया जा सकता है।[9]तार्किक प्रतिगमन में विवेकपूर्ण विश्लेषण के रूप में कई धारणाएं और प्रतिबंध नहीं हैं। चूंकि, जब डिस्क्रिमिनेंट एनालिसिस की धारणाएँ पूरी होती हैं, तो यह लॉजिस्टिक रिग्रेशन से अधिक शक्तिशाली होता है।[28] लॉजिस्टिक प्रतिगमन के विपरीत, विभेदक विश्लेषण का उपयोग छोटे नमूना बनावटों के साथ किया जा सकता है। यह दिखाया गया है कि जब नमूना बनावट समान होते हैं, और विचरण सहप्रसरण की एकरूपता हो, तो विवेचक विश्लेषण अधिक उपयुक्त होता है।[7]इन सभी फायदों के अतिरिक्त, लॉजिस्टिक रिग्रेशन कम से कम आम पसंद बन गया है, क्योंकि भेदभावपूर्ण विश्लेषण की धारणाएं संभवतः ही कभी पूरी होती हैं।[8][7]

उच्च आयाम में रैखिक विवेचक

उच्च आयामों में ज्यामितीय विसंगतियाँ आयामीता के प्रसिद्ध अभिशाप को जन्म देती हैं। फिर भी, माप की घटना की एकाग्रता के उचित उपयोग से अभिकलन आसान हो सकता है।।[29] आयामीता के इन अभिशाप का एक महत्वपूर्ण स्थिति डोनो और टैनर द्वारा प्रकाश में लाया गया था, यदि एक नमूना अनिवार्य रूप से उच्च आयामी है, तो प्रत्येक बिंदु को रेखीय असमानता के द्वारा, यहां तक कि अत्यधिक बड़ी नमूनों के लिए भी, शेष बिंदु से अलग किया जा सकता है। ।[30] इन रैखिक असमानताओं को संभाव्यता वितरण के एक समृद्ध परिवार के लिए रैखिक विवेचक के मानक (फिशर) रूप में चुना जा सकता है।[31] विशेष रूप से, इस प्रकार के प्रमेय लॉगरिदमिक रूप से अवतल माप के लिए सिद्ध होते हैं। बहुभिन्नरूपी सामान्य वितरण सहित लॉग-अवतल वितरण प्रमाण लॉग अवतल माध्यमों के लिए एकाग्रता असमानताओं पर आधारित है[32] और एक बहुआयामी घन पर उत्पाद के माध्यमों के लिए यह उत्पाद संभाव्यता रिक्त स्थान के लिए तालग्रैंड की एकाग्रता असमानता का उपयोग करके सिद्ध होता है। मौलिक रेखीय विभेदकों द्वारा डेटा पृथक्करण उच्च आयाम में कृत्रिम बुद्धिमत्ता प्रणालियों के लिए त्रुटि सुधार की समस्या को सरल करता है।[33]

यह भी देखें

संदर्भ

  1. 1.0 1.1 Fisher, R. A. (1936). "टैक्सोनोमिक समस्याओं में एकाधिक मापन का उपयोग" (PDF). Annals of Eugenics. 7 (2): 179–188. doi:10.1111/j.1469-1809.1936.tb02137.x. hdl:2440/15227.
  2. McLachlan, G. J. (2004). विभेदक विश्लेषण और सांख्यिकीय पैटर्न पहचान. Wiley Interscience. ISBN 978-0-471-69115-0. MR 1190469.
  3. Analyzing Quantitative Data: An Introduction for Social Researchers, Debra Wetcher-Hendricks, p.288
  4. 4.0 4.1 Martinez, A. M.; Kak, A. C. (2001). "पीसीए बनाम एलडीए" (PDF). IEEE Transactions on Pattern Analysis and Machine Intelligence. 23 (2): 228–233. doi:10.1109/34.908974.
  5. Abdi, H. (2007) "Discriminant correspondence analysis." In: N.J. Salkind (Ed.): Encyclopedia of Measurement and Statistic. Thousand Oaks (CA): Sage. pp. 270–275.
  6. Perriere, G.; Thioulouse, J. (2003). "बैक्टीरियल प्रोटीन के उपकोशिकीय स्थान की भविष्यवाणी करने के लिए पत्राचार विभेदक विश्लेषण का उपयोग". Computer Methods and Programs in Biomedicine. 70 (2): 99–105. doi:10.1016/s0169-2607(02)00011-1. PMID 12507786.
  7. 7.0 7.1 7.2 7.3 7.4 7.5 7.6 7.7 7.8 7.9 Büyüköztürk, Ş. & Çokluk-Bökeoğlu, Ö. (2008). Discriminant function analysis: Concept and application. Egitim Arastirmalari - Eurasian Journal of Educational Research, 33, 73-92.
  8. 8.0 8.1 Cohen et al. Applied Multiple Regression/Correlation Analysis for the Behavioural Sciences 3rd ed. (2003). Taylor & Francis Group.
  9. 9.00 9.01 9.02 9.03 9.04 9.05 9.06 9.07 9.08 9.09 9.10 Green, S.B. Salkind, N. J. & Akey, T. M. (2008). Using SPSS for Windows and Macintosh: Analyzing and understanding data. New Jersey: Prentice Hall.
  10. Venables, W. N.; Ripley, B. D. (2002). एस के साथ आधुनिक एप्लाइड सांख्यिकी (4th ed.). Springer Verlag. ISBN 978-0-387-95457-8.
  11. Lachenbruch, P. A. (1975). Discriminant analysis. NY: Hafner
  12. Klecka, William R. (1980). Discriminant analysis. Quantitative Applications in the Social Sciences Series, No. 19. Thousand Oaks, CA: Sage Publications.
  13. Hardle, W., Simar, L. (2007). Applied Multivariate Statistical Analysis. Springer Berlin Heidelberg. pp. 289–303.
  14. Garson, G. D. (2008). Discriminant function analysis. https://web.archive.org/web/20080312065328/http://www2.chass.ncsu.edu/garson/pA765/discrim.htm.
  15. 15.0 15.1 15.2 Hardle, W., Simar, L. (2007). Applied Multivariate Statistical Analysis. Springer Berlin Heidelberg. pp. 289-303.
  16. Israel, Steven A. (June 2006). "Performance Metrics: How and When". Geocarto International. 21 (2): 23–32. doi:10.1080/10106040608542380. ISSN 1010-6049. S2CID 122376081.
  17. Garson, G. D. (2008). Discriminant function analysis. "PA 765: Discriminant Function Analysis". Archived from the original on 2008-03-12. Retrieved 2008-03-04. .
  18. Rao, R. C. (1948). "जैविक वर्गीकरण की समस्याओं में बहु मापन का उपयोग". Journal of the Royal Statistical Society, Series B. 10 (2): 159–203. JSTOR 2983775.
  19. 19.0 19.1 Aliyari Ghassabeh, Youness; Rudzicz, Frank; Moghaddam, Hamid Abrishami (2015-06-01). "तेजी से वृद्धिशील एलडीए सुविधा निष्कर्षण". Pattern Recognition. 48 (6): 1999–2012. Bibcode:2015PatRe..48.1999A. doi:10.1016/j.patcog.2014.12.012.
  20. Chatterjee, C.; Roychowdhury, V.P. (1997-05-01). "वर्ग-विभाजन सुविधाओं के लिए स्व-संगठित एल्गोरिदम और नेटवर्क पर". IEEE Transactions on Neural Networks. 8 (3): 663–678. doi:10.1109/72.572105. ISSN 1045-9227. PMID 18255669.
  21. Demir, G. K.; Ozmehmet, K. (2005-03-01). "रैखिक विभेदक विश्लेषण के लिए ऑनलाइन स्थानीय शिक्षण एल्गोरिदम". Pattern Recognit. Lett. 26 (4): 421–431. Bibcode:2005PaReL..26..421D. doi:10.1016/j.patrec.2004.08.005. ISSN 0167-8655.
  22. Yu, H.; Yang, J. (2001). "A direct LDA algorithm for high-dimensional data — with application to face recognition". Pattern Recognition. 34 (10): 2067–2069. Bibcode:2001PatRe..34.2067Y. CiteSeerX 10.1.1.70.3507. doi:10.1016/s0031-3203(00)00162-x.
  23. Friedman, J. H. (1989). "नियमित विभेदक विश्लेषण" (PDF). Journal of the American Statistical Association. 84 (405): 165–175. CiteSeerX 10.1.1.382.2682. doi:10.2307/2289860. JSTOR 2289860. MR 0999675.
  24. Ahdesmäki, M.; Strimmer, K. (2010). "कैट स्कोर और फाल्स नॉनडिस्कवरी रेट कंट्रोल का उपयोग करते हुए ओमिक्स भविष्यवाणी समस्याओं में फीचर चयन". Annals of Applied Statistics. 4 (1): 503–519. arXiv:0903.2003. doi:10.1214/09-aoas277. S2CID 2508935.
  25. Preisner, O; Guiomar, R; Machado, J; Menezes, JC; Lopes, JA (2010). "साल्मोनेला एंटरिका सेरोवर एंटरिटिडिस फेज प्रकारों के विभेदन के लिए फूरियर ट्रांसफॉर्म इंफ्रारेड स्पेक्ट्रोस्कोपी और केमोमेट्रिक्स का अनुप्रयोग". Appl Environ Microbiol. 76 (11): 3538–3544. Bibcode:2010ApEnM..76.3538P. doi:10.1128/aem.01589-09. PMC 2876429. PMID 20363777.
  26. David, DE; Lynne, AM; Han, J; Foley, SL (2010). "पशु चिकित्सा Escherichia कोलाई आइसोलेट्स के लक्षण वर्णन में विषाणु कारक प्रोफाइलिंग का मूल्यांकन". Appl Environ Microbiol. 76 (22): 7509–7513. Bibcode:2010ApEnM..76.7509D. doi:10.1128/aem.00726-10. PMC 2976202. PMID 20889790.
  27. Tahmasebi, P.; Hezarkhani, A.; Mortazavi, M. (2010). "Application of discriminant analysis for alteration separation; sungun copper deposit, East Azerbaijan, Iran. Australian" (PDF). Journal of Basic and Applied Sciences. 6 (4): 564–576.
  28. Trevor Hastie; Robert Tibshirani; Jerome Friedman. सांख्यिकीय सबक के तत्व। डेटा खनन, अनुमान और भविष्यवाणी (second ed.). Springer. p. 128.
  29. Kainen P.C. (1997) Utilizing geometric anomalies of high dimension: When complexity makes computation easier. In: Kárný M., Warwick K. (eds) Computer Intensive Methods in Control and Signal Processing: The Curse of Dimensionality, Springer, 1997, pp. 282–294.
  30. Donoho, D., Tanner, J. (2009) Observed universality of phase transitions in high-dimensional geometry, with implications for modern data analysis and signal processing, Phil. Trans. R. Soc. A 367, 4273–4293.
  31. Gorban, Alexander N.; Golubkov, Alexander; Grechuck, Bogdan; Mirkes, Evgeny M.; Tyukin, Ivan Y. (2018). "Correction of AI systems by linear discriminants: Probabilistic foundations". Information Sciences. 466: 303–322. arXiv:1811.05321. doi:10.1016/j.ins.2018.07.040. S2CID 52876539.
  32. Guédon, O., Milman, E. (2011) Interpolating thin-shell and sharp large-deviation estimates for isotropic log-concave measures, Geom. Funct. Anal. 21 (5), 1043–1068.
  33. Gorban, Alexander N.; Makarov, Valeri A.; Tyukin, Ivan Y. (July 2019). "उच्च-आयामी मस्तिष्क में छोटे तंत्रिका टुकड़ियों की अनुचित प्रभावशीलता". Physics of Life Reviews. 29: 55–88. arXiv:1809.07656. Bibcode:2019PhLRv..29...55G. doi:10.1016/j.plrev.2018.09.005. PMID 30366739.


अग्रिम पठन


बाहरी संबंध