कारक विश्लेषण: Difference between revisions
No edit summary |
No edit summary |
||
Line 1: | Line 1: | ||
{{Short description|Statistical method}} | {{Short description|Statistical method}} | ||
{{About| | {{About|कारक लोडिंग|फ़ैक्टोरियल डिजाइन|फैक्टोरियल प्रयोग}} | ||
कारक विश्लेषण सांख्यिकी पद्धति है जिसका उपयोग प्रेक्षित, सहसंबद्ध [[चर (गणित)]] के | |||
सीधे शब्दों में | '''कारक विश्लेषण''' सांख्यिकी पद्धति है जिसका उपयोग प्रेक्षित, सहसंबद्ध [[चर (गणित)|वेरिएबल (गणित)]] के मध्य विचरण का वर्णन करने के लिए संभावित रूप से कम संख्या में न देखे गए वेरिएबल के संदर्भ में किया जाता है जिन्हें कारक कहा जाता है। उदाहरण के लिए, यह संभव है कि छह देखे गए वेरिएबलों में भिन्नताएं मुख्य रूप से दो न देखे गए (अंतर्निहित) वेरिएबलों में भिन्नताएं दर्शाती हैं। कारक विश्लेषण न देखे गए [[अव्यक्त चर|अव्यक्त वेरिएबलों]] की प्रतिक्रिया में ऐसी संयुक्त विविधताओं की खोज करता है। इसको देखे गए वेरिएबल के आंकड़ों के संदर्भ में संभावित कारकों और त्रुटियों और अवशेषों के [[रैखिक संयोजन]] के रूप में तैयार किया गया है, इसलिए कारक विश्लेषण को वेरिएबल-में-त्रुटि मॉडल के विशेष स्तिथियों के रूप में माना जा सकता है। <ref>{{cite book |first=Karl G. |last=Jöreskog |authorlink=Karl Gustav Jöreskog |chapter=Factor Analysis as an Errors-in-Variables Model |pages=185–196 |title=आधुनिक मनोवैज्ञानिक मापन के सिद्धांत|location=Hillsdale |publisher=Erlbaum |year=1983 |isbn=0-89859-277-1 }}</ref> सीधे शब्दों में कहेंतब, किसी वेरिएबल का फैक्टर लोडिंग उस सीमा को निर्धारित करता है, जिस सीमा तक वेरिएबल किसी दिए गए फैक्टर से संबंधित होता है। <ref>{{cite book |last=Bandalos |first=Deborah L. |year=2017 |title=सामाजिक विज्ञान के लिए मापन सिद्धांत और अनुप्रयोग|publisher=The Guilford Press |isbn= }}</ref> | ||
कारक विश्लेषणात्मक | |||
कारक विश्लेषणात्मक विधियों के पीछे सामान्य तर्क यह है कि देखे गए वेरिएबल के मध्य अन्योन्याश्रितताओं के बारे में प्राप्त जानकारी का उपयोग और इसके पश्चात में डेटासमुच्चय में वेरिएबल के समुच्चय को कम करने के लिए किया जा सकता है। कारक विश्लेषण का उपयोग सामान्यतः [[साइकोमेट्रिक्स]], [[व्यक्तित्व]] मनोविज्ञान, जीव विज्ञान, [[विपणन]], [[उत्पाद प्रबंधन]], संचालन अनुसंधान, [[वित्त]] और [[ यंत्र अधिगम |यंत्र अधिगम]] में किया जाता है। यह उन डेटा समुच्चयों से निपटने में सहायता कर सकता है जहां बड़ी संख्या में देखे गए वेरिएबल हैं जो अंतर्निहित/अव्यक्त वेरिएबल की लघु संख्या को प्रतिबिंबित करते हैं। यह सबसे अधिक उपयोग की जाने वाली अंतर-निर्भरता तकनीकों में से है और इसका उपयोग तब किया जाता है जब वेरिएबल का प्रासंगिक समुच्चय व्यवस्थित अंतर-निर्भरता दिखाता है और इसका उद्देश्य उन अव्यक्त कारकों का पता लगाना है जो समानता बनाते हैं। | |||
==सांख्यिकीय मॉडल== | ==सांख्यिकीय मॉडल== | ||
===परिभाषा=== | ===परिभाषा=== | ||
मॉडल | मॉडल प्रत्येक <math>n</math> व्यक्तियों में <math>k</math> सामान्य कारकों <math>f_{i,j}</math> के समुच्चय के साथ <math>p</math> अवलोकनों के समुच्चय को समझाने का प्रयास करता है, जहां प्रति इकाई अवलोकनों की तुलना में प्रति इकाई कम कारक <math>k<p</math> होते हैं। प्रत्येक व्यक्ति के समीप अपने स्वयं के सामान्य कारक <math>k</math> होते हैं, और ये एकल अवलोकन के लिए, कारक लोडिंग आव्युह <math>L \in \mathbb{R}^{p \times k}</math> के माध्यम से अवलोकनों से संबंधित होते हैं। | ||
: <math>x_{i,m} - \mu_{i} = l_{i,1} f_{1,m} + \dots + l_{i,k} f_{k,m} + \varepsilon_{i,m} </math> | : <math>x_{i,m} - \mu_{i} = l_{i,1} f_{1,m} + \dots + l_{i,k} f_{k,m} + \varepsilon_{i,m} </math> | ||
जहाँ | |||
* <math>x_{i,m}</math> | *<math>x_{i,m}</math> <math>m</math>वें व्यक्ति के <math>i</math>वें अवलोकन का मान है, | ||
* <math>\mu_i</math> | * <math>\mu_i</math> <math>i</math>वें अवलोकन के लिए अवलोकन माध्य है, | ||
* <math>l_{i,j}</math> | *<math>l_{i,j}</math> <math>j</math>वें कारक के <math>i</math>वें अवलोकन के लिए लोडिंग है, | ||
* <math>f_{j,m}</math> | *<math>f_{j,m}</math> <math>m</math>वें व्यक्ति के <math>j</math>वें कारक का मान है, और | ||
* <math>\varepsilon_{i,m} </math> | *<math>\varepsilon_{i,m} </math> माध्य शून्य और परिमित विचरण के साथ <math>(i,m)</math>वां अवलोकित स्टोकेस्टिक त्रुटि शब्द है। | ||
आव्युह नोटेशन में | |||
: <math>X - \Mu = L F + \varepsilon</math> | : <math>X - \Mu = L F + \varepsilon</math> | ||
जहां अवलोकन | जहां अवलोकन आव्यूह <math>X \in \mathbb{R}^{p \times n}</math>, लोडिंग आव्यूह <math>L \in \mathbb{R}^{p \times k}</math>, फैक्टर आव्यूह <math>F \in \mathbb{R}^{k \times n}</math>, त्रुटि टर्म आव्यूह <math>\varepsilon \in \mathbb{R}^{p \times n}</math> और माध्य आव्यूह <math>\Mu \in \mathbb{R}^{p \times n}</math> है, जिससे <math>(i,m)</math>वां अवयव सिर्फ <math>\Mu_{i,m}=\mu_i</math> है। | ||
इसके | इसके अतिरिक्त हम <math>F</math> निम्नलिखित धारणाएँ भी लागू करेंगे : | ||
# <math>F</math> और <math>\varepsilon</math> स्वतंत्र हैं. | # <math>F</math> और <math>\varepsilon</math> स्वतंत्र हैं. | ||
# <math>\mathrm{E}(F) = 0</math>; | #<math>\mathrm{E}(F) = 0</math>; जहां <math>\mathrm E</math> अपेक्षा है | ||
# <math>\mathrm{Cov}(F)=I</math> | # <math>\mathrm{Cov}(F)=I</math> जहाँ <math>\mathrm{Cov}</math> सहप्रसरण आव्युह है, यह सुनिश्चित करने के लिए कि कारक असंबंधित हैं, और <math>I</math> पहचान आव्युह है. | ||
कल्पना करना <math>\mathrm{Cov}(X - \Mu)=\Sigma</math>. तब | कल्पना करना <math>\mathrm{Cov}(X - \Mu)=\Sigma</math>. तब | ||
Line 35: | Line 36: | ||
: <math>\Sigma = L \mathrm{Cov}(F) L^T + \mathrm{Cov}(\varepsilon),\,</math> | : <math>\Sigma = L \mathrm{Cov}(F) L^T + \mathrm{Cov}(\varepsilon),\,</math> | ||
या, | या, समुच्चयिंग <math>\Psi:=\mathrm{Cov}(\varepsilon)</math>, | ||
: <math>\Sigma = LL^T + \Psi.\,</math> | : <math>\Sigma = LL^T + \Psi.\,</math> | ||
ध्यान दें कि किसी भी [[ऑर्थोगोनल मैट्रिक्स]] | ध्यान दें कि किसी भी [[ऑर्थोगोनल मैट्रिक्स|ऑर्थोगोनल आव्युह]] <math>Q</math> के लिए,यदि <math>L^\prime=\ LQ</math> और <math>F^\prime=Q^T F</math> और हम अगर हम समुच्चय करते हैं तब कारक और कारक लोडिंग के मानदंड अभी भी दृढ़ हैं। इसलिए कारकों और कारक लोडिंग का समुच्चय केवल [[ऑर्थोगोनल परिवर्तन]] तक अद्वितीय है। | ||
===उदाहरण=== | ===उदाहरण=== | ||
मान लीजिए कि मनोवैज्ञानिक की परिकल्पना है कि [[बुद्धि (विशेषता)]] दो प्रकार की होती है, मौखिक बुद्धि और गणितीय बुद्धि, जिनमें से कोई भी प्रत्यक्ष रूप से नहीं देखी जाती है। | मान लीजिए कि मनोवैज्ञानिक की परिकल्पना है कि [[बुद्धि (विशेषता)]] दो प्रकार की होती है, मौखिक बुद्धि और गणितीय बुद्धि, जिनमें से कोई भी प्रत्यक्ष रूप से नहीं देखी जाती है। इसमें 1000 छात्रों के 10 भिन्न-भिन्न शैक्षणिक क्षेत्रों में से प्रत्येक के परीक्षा अंकों में परिकल्पना के साक्ष्य मांगे गए हैं। यदि प्रत्येक छात्र को बड़ी आपश्चाती (सांख्यिकी) से यादृच्छिक रूप से चुना जाता है,तब प्रत्येक छात्र के 10 अंक यादृच्छिक वेरिएबल होते हैं। मनोवैज्ञानिक की परिकल्पना कह सकती है कि 10 अकादमिक क्षेत्रों में से प्रत्येक के लिए, उन सभी छात्रों के समूह पर औसत स्कोर जो मौखिक और गणितीय बुद्धि के लिए मूल्यों की कुछ सामान्य जोड़ी साझा करते हैं, कुछ [[स्थिरांक (गणित)]] उनकी मौखिक बुद्धि के स्तर का यह अनेक गुना होता है और अन्य स्थिरांक उनके गणितीय बुद्धि के स्तर का अनेक गुना है, अथार्त, यह उन दो कारकों का रैखिक संयोजन है। किसी विशेष विषय के लिए संख्याएँ होती हैं, जिनके द्वारा अपेक्षित स्कोर प्राप्त करने के लिए दो प्रकार की बुद्धिमत्ता को गुणा किया जाता है, परिकल्पना द्वारा सभी बुद्धिमत्ता स्तर के जोड़े के लिए समान मानी जाती हैं, और इस विषय के लिए कारक लोडिंग कहलाती हैं। उदाहरण के लिए, परिकल्पना यह मान सकती है कि [[खगोल]] विज्ञान के क्षेत्र में अनुमानित औसत छात्र की योग्यता है | ||
:{10 × छात्र की मौखिक बुद्धि} + {6 × छात्र की गणितीय बुद्धि}। | :{10 × छात्र की मौखिक बुद्धि} + {6 × छात्र की गणितीय बुद्धि}। | ||
संख्या 10 और 6 खगोल विज्ञान से जुड़े कारक लोडिंग हैं। अन्य शैक्षणिक विषयों में | संख्या 10 और 6 खगोल विज्ञान से जुड़े कारक लोडिंग हैं। अन्य शैक्षणिक विषयों में भिन्न-भिन्न कारक लोड हो सकते हैं। | ||
ऐसा माना जाता है कि मौखिक और गणितीय बुद्धि की समान डिग्री वाले दो छात्रों की खगोल विज्ञान में | ऐसा माना जाता है कि मौखिक और गणितीय बुद्धि की समान डिग्री वाले दो छात्रों की खगोल विज्ञान में भिन्न-भिन्न मापी गई योग्यताएं हो सकती हैं क्योंकि व्यक्तिगत योग्यताएं औसत योग्यताओं (ऊपर अनुमानित) से भिन्न होती हैं और इसमें माप त्रुटि के कारण ही भिन्न होती हैं। इस प्रकार के मतभेदों को सामूहिक रूप से त्रुटि कहा जाता है - सांख्यिकीय शब्द जिसका अर्थ है वह मात्रा जिसके द्वारा किसी व्यक्ति को मापा जाता है, जो उसकी बुद्धिमत्ता के स्तर के लिए औसत या अनुमानित से भिन्न होता है (आंकड़ों में त्रुटियां और अवशेष देखें)। | ||
कारक विश्लेषण में जाने वाला अवलोकन योग्य डेटा 1000 छात्रों में से प्रत्येक के 10 अंक, कुल 10,000 नंबर | कारक विश्लेषण में जाने वाला अवलोकन योग्य डेटा 1000 छात्रों में से प्रत्येक के 10 अंक, कुल 10,000 नंबर होंते हैं। डेटा से प्रत्येक छात्र की दो प्रकार की बुद्धि के कारक लोडिंग और स्तर का अनुमान लगाया जाना चाहिए। | ||
===उसी उदाहरण का गणितीय मॉडल=== | ===उसी उदाहरण का गणितीय मॉडल=== | ||
निम्नलिखित में, | निम्नलिखित में, आव्युह को अनुक्रमित वेरिएबल द्वारा दर्शाया जाएगा। "विषय" सूचकांकों को अक्षर <math>a</math>, <math>b</math> और <math>c</math>,का उपयोग करके दर्शाया जाएगा, जिसमें मान <math>1</math>से <math>p</math> तक चलेंगे जो उपरोक्त उदाहरण में <math>10</math> के सामान्य है। "कारक" सूचकांकों को अक्षर <math>p</math>, <math>q</math> और <math>r</math> का उपयोग करके दर्शाया जाएगा, जिसका मान <math>1</math> से <math>k</math> तक होगा जो उपरोक्त उदाहरण में <math>2</math> के सामान्य है। "उदाहरण" या "प्रतिरूप" सूचकांकों को <math>i</math>, <math>j</math> और <math>k</math> अक्षरों का उपयोग करके दर्शाया जाएगा, जिसमें मान <math>1</math> से <math>N</math> तक चलेंगे। उपरोक्त उदाहरण में, यदि <math>N=1000</math> छात्रों के प्रतिरूप ने <math>p=10</math> परीक्षाओं में भाग लिया, तब <math>i</math> <math>a</math> परीक्षा के लिए छात्र का स्कोर <math>x_{ai}</math> द्वारा दिया गया है। कारक विश्लेषण का उद्देश्य चर <math>x_a</math> के मध्य सहसंबंधों को चिह्नित करना है, जिनमें से <math>x_{ai}</math> विशेष उदाहरण, या अवलोकनों का समुच्चय है। वेरिएबलों को समान स्तर पर रखने के लिए, उन्हें मानक स्कोर <math>z</math> में [[सामान्यीकरण (सांख्यिकी)|सामान्यीकरण (सांख्यिकी]] किया जाता है | | ||
:<math>z_{ai}=\frac{x_{ai}-\hat\mu_a}{\hat\sigma_a}</math> | :<math>z_{ai}=\frac{x_{ai}-\hat\mu_a}{\hat\sigma_a}</math> | ||
जहां | जहां प्रतिरूप माध्य है: | ||
:<math>\hat\mu_a=\tfrac{1}{N}\sum_i x_{ai}</math> | :<math>\hat\mu_a=\tfrac{1}{N}\sum_i x_{ai}</math> | ||
और | और प्रतिरूप विचरण इस प्रकार दिया गया है: | ||
:<math>\hat\sigma_a^2=\tfrac{1}{N-1}\sum_i (x_{ai}-\mu_a)^2</math> | :<math>\hat\sigma_a^2=\tfrac{1}{N-1}\sum_i (x_{ai}-\mu_a)^2</math> | ||
इस विशेष | इस विशेष प्रतिरूप के लिए कारक विश्लेषण मॉडल तब है: | ||
:<math>\begin{matrix}z_{1,i} & = & \ell_{1,1}F_{1,i} & + & \ell_{1,2}F_{2,i} & + & \varepsilon_{1,i} \\ | :<math>\begin{matrix}z_{1,i} & = & \ell_{1,1}F_{1,i} & + & \ell_{1,2}F_{2,i} & + & \varepsilon_{1,i} \\ | ||
\vdots & & \vdots & & \vdots & & \vdots \\ | \vdots & & \vdots & & \vdots & & \vdots \\ | ||
Line 67: | Line 68: | ||
z_{ai}=\sum_p \ell_{ap}F_{pi}+\varepsilon_{ai} | z_{ai}=\sum_p \ell_{ap}F_{pi}+\varepsilon_{ai} | ||
</math> | </math> | ||
जहाँ | |||
* <math>F_{1i}</math> | * <math>F_{1i}</math>,<math>i</math>वें छात्र की मौखिक बुद्धि है, | ||
* <math>F_{2i}</math> | * <math>F_{2i}</math>,<math>i</math>वें छात्र की गणितीय बुद्धि हैं, | ||
* <math>\ell_{ap}</math> | * <math>\ell_{ap}</math>,<math>a</math>वें विषय, के लिए <math>p=1,2</math> के लिए कारक लोडिंग हैं। | ||
[[मैट्रिक्स (गणित)]] नोटेशन में, हमारे | [[मैट्रिक्स (गणित)|आव्युह (गणित)]] नोटेशन में, हमारे समीप है | ||
:<math>Z=LF+\varepsilon</math> | :<math>Z=LF+\varepsilon</math> | ||
उस | उस मापदंड को दोगुना करके देखें जिस पर मौखिक बुद्धिमत्ता <math>F</math>- प्रत्येक कॉलम में पहला घटक है मापा जाता है, और साथ ही मौखिक बुद्धिमत्ता के लिए कारक लोडिंग को आधा करने से मॉडल पर कोई भिन्नता नहीं दिखाई पड़ती है। इस प्रकार, यह मानने से कोई व्यापकता नहीं खोती है कि मौखिक बुद्धि के लिए कारकों का मानक विचलन <math>1</math> है | इसी प्रकार गणितीय बुद्धि के लिए भी हैं इसके अतिरिक्त, समान कारणों से, यह मानने से कोई व्यापकता विलुप्त नहीं है कि दोनों कारक एक-दूसरे से असंबद्ध हैं। दूसरे शब्दों में: | ||
:<math>\sum_i F_{pi}F_{qi}=\delta_{pq}</math> | :<math>\sum_i F_{pi}F_{qi}=\delta_{pq}</math> | ||
जहाँ <math>\delta_{pq}</math> [[क्रोनकर डेल्टा]] है और (<math>0</math> जब <math>p \ne q</math> और <math>1</math> जब <math>p=q</math>).त्रुटियों को कारकों से स्वतंत्र माना जाता है: | |||
:<math>\sum_i F_{pi}\varepsilon_{ai}=0</math> | :<math>\sum_i F_{pi}\varepsilon_{ai}=0</math> | ||
ध्यान दें, चूँकि किसी समाधान का कोई भी घुमाव भी समाधान है, इससे कारकों की व्याख्या करना कठिन हो जाता है। नीचे नुकसान देखें. इस विशेष उदाहरण में, यदि हम पहले से नहीं जानते हैं कि दो प्रकार की बुद्धि असंबद्ध हैं, | ध्यान दें, चूँकि किसी समाधान का कोई भी घुमाव भी समाधान है, इससे कारकों की व्याख्या करना कठिन हो जाता है। नीचे नुकसान देखें. इस विशेष उदाहरण में, यदि हम पहले से नहीं जानते हैं कि दो प्रकार की बुद्धि असंबद्ध हैं,तब हम दो कारकों की दो भिन्न-भिन्न प्रकार की बुद्धि के रूप में व्याख्या नहीं कर सकते हैं। भले ही वे असंबंधित हों, हम बिना किसी बाहरी तर्क के यह नहीं बता सकते कि कौन सा कारक मौखिक बुद्धि से मेल खाता है और कौन सा गणितीय बुद्धि से मेल खाता है। | ||
लोडिंग का मान <math>L</math>, औसत <math>\mu</math>, और त्रुटियों की भिन्नताएँ <math>\varepsilon</math> प्रेक्षित डेटा को देखते हुए अनुमान लगाया जाना चाहिए <math>X</math> और <math>F</math> (कारकों के स्तर के बारे में धारणा किसी दिए गए के लिए तय की गई है <math>F</math>). | लोडिंग का मान <math>L</math>, औसत <math>\mu</math>, और त्रुटियों की भिन्नताएँ <math>\varepsilon</math> प्रेक्षित डेटा को देखते हुए अनुमान लगाया जाना चाहिए <math>X</math> और <math>F</math> (कारकों के स्तर के बारे में धारणा किसी दिए गए के लिए तय की गई है <math>F</math>). | ||
मौलिक प्रमेय उपरोक्त शर्तों से प्राप्त किया जा सकता है: | मौलिक प्रमेय उपरोक्त शर्तों से प्राप्त किया जा सकता है: | ||
:<math>\sum_i z_{ai}z_{bi}=\sum_j \ell_{aj}\ell_{bj}+\sum_i \varepsilon_{ai}\varepsilon_{bi}</math> | :<math>\sum_i z_{ai}z_{bi}=\sum_j \ell_{aj}\ell_{bj}+\sum_i \varepsilon_{ai}\varepsilon_{bi}</math> | ||
बाईं ओर का शब्द है <math>(a,b)</math>-सहसंबंध | बाईं ओर का शब्द है <math>(a,b)</math>-सहसंबंध आव्युह की अवधि (ए <math>p \times p</math> के उत्पाद के रूप में प्राप्त आव्युह <math> p \times N</math> देखे गए डेटा के स्थानान्तरण के साथ मानकीकृत अवलोकनों का आव्युह, और इसका <math>p</math> विकर्ण अवयव होंगे <math>1</math>एस। दाईं ओर दूसरा पद विकर्ण आव्युह होगा जिसमें इकाई से कम पद होंगे। दाईं ओर पहला पद कम सहसंबंध आव्युह है और इसके विकर्ण मानों को छोड़कर सहसंबंध आव्युह के सामान्य होगा जो एकता से कम होगा। कम सहसंबंध आव्युह के इन विकर्ण अवयवों को सांप्रदायिकताएं कहा जाता है (जो कि देखे गए वेरिएबल में भिन्नता के अंश का प्रतिनिधित्व करते हैं जो कारकों के कारण होता है): | ||
:<math> | :<math> | ||
h_a^2=1-\psi_a=\sum_j \ell_{aj}\ell_{aj} | h_a^2=1-\psi_a=\sum_j \ell_{aj}\ell_{aj} | ||
</math> | </math> | ||
प्रतिरूप डेटा <math>z_{ai}</math> प्रतिरूपकरण त्रुटियों, मॉडल की अपर्याप्तता आदि के कारण ऊपर दिए गए मौलिक समीकरण का बिल्कुल पालन नहीं किया जाएगा। उपरोक्त मॉडल के किसी भी विश्लेषण का लक्ष्य कारकों का पता लगाना है <math>F_{pi}</math> और लोडिंग <math>\ell_{ap}</math> जो डेटा को सर्वोत्तम रूप से फिट करता है। कारक विश्लेषण में, सर्वोत्तम फिट को सहसंबंध आव्युह के ऑफ-विकर्ण अवशेषों में न्यूनतम माध्य वर्ग त्रुटि के रूप में परिभाषित किया गया है:<ref name="Harman">{{cite book |last=Harman |first=Harry H. |year=1976 |title=आधुनिक कारक विश्लेषण|publisher=University of Chicago Press |pages=175, 176 |isbn=978-0-226-31652-9 }}</ref> | |||
:<math>\varepsilon^2 = \sum_{a\ne b} \left[\sum_i z_{ai}z_{bi}-\sum_j \ell_{aj}\ell_{bj}\right]^2</math> | :<math>\varepsilon^2 = \sum_{a\ne b} \left[\sum_i z_{ai}z_{bi}-\sum_j \ell_{aj}\ell_{bj}\right]^2</math> | ||
यह त्रुटि सहप्रसरण के ऑफ-विकर्ण घटकों को कम करने के | यह त्रुटि सहप्रसरण के ऑफ-विकर्ण घटकों को कम करने के सामान्य है, जिसमें मॉडल समीकरणों में शून्य के अपेक्षित मान होते हैं। इसकी तुलना प्रमुख घटक विश्लेषण से की जानी चाहिए जो सभी अवशेषों की माध्य वर्ग त्रुटि को कम करने का प्रयास करता है।<ref name="Harman"/>हाई-स्पीड कंप्यूटर के आगमन से पहले, समस्या के अनुमानित समाधान खोजने के लिए काफी प्रयास किए गए थे, विशेष रूप से अन्य विधियों से सांप्रदायिकताओं का अनुमान लगाने में, जो तब ज्ञात कम सहसंबंध आव्युह उत्पन्न करके समस्या को काफी सरल बनाता है। इसके पश्चात कारकों और लोडिंग का अनुमान लगाने के लिए इसका उपयोग किया गया। हाई-स्पीड कंप्यूटर के आगमन के साथ, न्यूनतमकरण की समस्या को पर्याप्त गति के साथ पुनरावृत्त रूप से हल किया जा सकता है, और सामुदायिकताओं की गणना पहले से आवश्यक होने के बजाय प्रक्रिया में की जाती है। [[सामान्यीकृत न्यूनतम अवशिष्ट विधि]] एल्गोरिथ्म इस समस्या के लिए विशेष रूप से उपयुक्त है, लेकिन समाधान खोजने का शायद ही यह एकमात्र पुनरावृत्त साधन है। | ||
यदि समाधान कारकों को सहसंबंधित करने की अनुमति दी जाती है (उदाहरण के लिए 'ओब्लिमिन' रोटेशन में), | यदि समाधान कारकों को सहसंबंधित करने की अनुमति दी जाती है (उदाहरण के लिए 'ओब्लिमिन' रोटेशन में),तब संबंधित गणितीय मॉडल ऑर्थोगोनल निर्देशांक के बजाय [[तिरछा निर्देशांक]] का उपयोग करता है। | ||
===ज्यामितीय व्याख्या=== | ===ज्यामितीय व्याख्या=== | ||
[[File:FactorPlot.svg|thumb|upright=1.5|प्रश्न पूछने के लिए 3 उत्तरदाताओं के लिए कारक विश्लेषण मापदंडों की ज्यामितीय व्याख्या। उत्तर इकाई वेक्टर द्वारा दर्शाया गया है <math>\mathbf{z}_a</math>, जिसे दो ऑर्थोनॉर्मल वैक्टर द्वारा परिभाषित विमान पर प्रक्षेपित किया जाता है <math>\mathbf{F}_1</math> और <math>\mathbf{F}_2</math>. प्रक्षेपण वेक्टर है <math>\hat{\mathbf{z}}_a</math> और त्रुटि <math>\boldsymbol{\varepsilon}_a</math> समतल के लंबवत है, ताकि <math>\mathbf{z}_a=\hat{\mathbf{z}}_a+\boldsymbol{\varepsilon}_a</math>. प्रक्षेपण वेक्टर <math>\hat{\mathbf{z}}_a</math> कारक सदिशों के रूप में दर्शाया जा सकता है <math>\hat{\mathbf{z}}_a=\ell_{a1}\mathbf{F}_1+\ell_{a2}\mathbf{F}_2</math>. प्रक्षेपण वेक्टर की लंबाई का वर्ग समुदाय है: <math>||\hat{\mathbf{z}}_a||^2=h^2_a</math>. यदि कोई अन्य डेटा वेक्टर <math>\mathbf{z}_b</math> के | [[File:FactorPlot.svg|thumb|upright=1.5|प्रश्न पूछने के लिए 3 उत्तरदाताओं के लिए कारक विश्लेषण मापदंडों की ज्यामितीय व्याख्या। उत्तर इकाई वेक्टर द्वारा दर्शाया गया है <math>\mathbf{z}_a</math>, जिसे दो ऑर्थोनॉर्मल वैक्टर द्वारा परिभाषित विमान पर प्रक्षेपित किया जाता है <math>\mathbf{F}_1</math> और <math>\mathbf{F}_2</math>. प्रक्षेपण वेक्टर है <math>\hat{\mathbf{z}}_a</math> और त्रुटि <math>\boldsymbol{\varepsilon}_a</math> समतल के लंबवत है, ताकि <math>\mathbf{z}_a=\hat{\mathbf{z}}_a+\boldsymbol{\varepsilon}_a</math>. प्रक्षेपण वेक्टर <math>\hat{\mathbf{z}}_a</math> कारक सदिशों के रूप में दर्शाया जा सकता है <math>\hat{\mathbf{z}}_a=\ell_{a1}\mathbf{F}_1+\ell_{a2}\mathbf{F}_2</math>. प्रक्षेपण वेक्टर की लंबाई का वर्ग समुदाय है: <math>||\hat{\mathbf{z}}_a||^2=h^2_a</math>. यदि कोई अन्य डेटा वेक्टर <math>\mathbf{z}_b</math> के मध्य के कोण की कोज्या को आलेखित किया गया <math>\mathbf{z}_a</math> और <math>\mathbf{z}_b</math> होगा <math>r_{ab}</math> : द <math>(a,b)</math>-सहसंबंध आव्युह में प्रवेश। (हरमन चित्र 4.3 से अनुकूलित)<ref name="Harman"/>]]कारक विश्लेषण के मापदंडों और वेरिएबल को ज्यामितीय व्याख्या दी जा सकती है। आंकड़ा (<math>z_{ai}</math>), कारक (<math>F_{pi}</math>) और त्रुटियाँ (<math>\varepsilon_{ai}</math>) को वेक्टर के रूप में देखा जा सकता है <math>N</math>-आयामी यूक्लिडियन स्पेस (प्रतिरूप स्थान), के रूप में दर्शाया गया है <math>\mathbf{z}_a</math>, <math>\mathbf{F}_p</math> और <math>\boldsymbol{\varepsilon}_a</math> क्रमश। चूँकि डेटा मानकीकृत है, डेटा वेक्टर इकाई लंबाई के हैं (<math>||\mathbf{z}_a||=1</math>). कारक सदिश को परिभाषित करते हैं <math>k</math>इस स्थान में -आयामी रैखिक उपस्थान (अथार्त हाइपरप्लेन), जिस पर डेटा वैक्टर को ऑर्थोगोनल रूप से प्रक्षेपित किया जाता है। यह मॉडल समीकरण से निम्नानुसार है | ||
:<math>\mathbf{z}_a=\sum_p \ell_{ap} \mathbf{F}_p+\boldsymbol{\varepsilon}_a</math> | :<math>\mathbf{z}_a=\sum_p \ell_{ap} \mathbf{F}_p+\boldsymbol{\varepsilon}_a</math> | ||
और कारकों और त्रुटियों की स्वतंत्रता: <math>\mathbf{F}_p\cdot\boldsymbol{\varepsilon}_a=0</math>. उपरोक्त उदाहरण में, हाइपरप्लेन केवल दो कारक वैक्टर द्वारा परिभाषित 2-आयामी विमान है। हाइपरप्लेन पर डेटा वैक्टर का प्रक्षेपण इसके द्वारा दिया गया है | और कारकों और त्रुटियों की स्वतंत्रता: <math>\mathbf{F}_p\cdot\boldsymbol{\varepsilon}_a=0</math>. उपरोक्त उदाहरण में, हाइपरप्लेन केवल दो कारक वैक्टर द्वारा परिभाषित 2-आयामी विमान है। हाइपरप्लेन पर डेटा वैक्टर का प्रक्षेपण इसके द्वारा दिया गया है | ||
:<math>\hat{\mathbf{z}}_a=\sum_p \ell_{ap}\mathbf{F}_p</math> | :<math>\hat{\mathbf{z}}_a=\sum_p \ell_{ap}\mathbf{F}_p</math> | ||
और त्रुटियाँ उस अनुमानित बिंदु से डेटा बिंदु तक वेक्टर हैं और हाइपरप्लेन के लंबवत हैं। कारक विश्लेषण का लक्ष्य हाइपरप्लेन ढूंढना है जो कुछ अर्थों में डेटा के लिए सबसे उपयुक्त है, इसलिए इससे कोई | और त्रुटियाँ उस अनुमानित बिंदु से डेटा बिंदु तक वेक्टर हैं और हाइपरप्लेन के लंबवत हैं। कारक विश्लेषण का लक्ष्य हाइपरप्लेन ढूंढना है जो कुछ अर्थों में डेटा के लिए सबसे उपयुक्त है, इसलिए इससे कोई भिन्नता नहीं पड़ता कि इस हाइपरप्लेन को परिभाषित करने वाले कारक वैक्टर को कैसे चुना जाता है, जब तक कि वे स्वतंत्र हैं और हाइपरप्लेन में स्थित हैं। हम उन्हें ऑर्थोगोनल और सामान्य दोनों के रूप में निर्दिष्ट करने के लिए स्वतंत्र हैं (<math>\mathbf{F}_p\cdot \mathbf{F}_q=\delta_{pq}</math>) व्यापकता की हानि के बिना। कारकों का उपयुक्त समुच्चय पाए जाने के पश्चात, उन्हें हाइपरप्लेन के भीतर मनमाने ढंग से घुमाया जा सकता है, ताकि कारक वैक्टर का कोई भी घुमाव उसी हाइपरप्लेन को परिभाषित करेगा, और समाधान भी होगा। परिणामस्वरूप, उपरोक्त उदाहरण में, जिसमें फिटिंग हाइपरप्लेन दो आयामी है, यदि हम पहले से नहीं जानते हैं कि दो प्रकार की बुद्धि असंबंधित हैं,तब हम दो कारकों की दो भिन्न-भिन्न प्रकार की बुद्धि के रूप में व्याख्या नहीं कर सकते हैं। भले ही वे असंबंधित हों, हम बिना किसी बाहरी तर्क के यह नहीं बता सकते कि कौन सा कारक मौखिक बुद्धि से मेल खाता है और कौन सा गणितीय बुद्धि से मेल खाता है, या क्या कारक दोनों का रैखिक संयोजन हैं। | ||
डेटा वैक्टर <math>\mathbf{z}_a</math> इकाई लंबाई है. डेटा के लिए सहसंबंध | डेटा वैक्टर <math>\mathbf{z}_a</math> इकाई लंबाई है. डेटा के लिए सहसंबंध आव्युह की प्रविष्टियाँ दी गई हैं <math>r_{ab}=\mathbf{z}_a\cdot\mathbf{z}_b</math>. सहसंबंध आव्युह को ज्यामितीय रूप से दो डेटा वैक्टर के मध्य के कोण के कोसाइन के रूप में व्याख्या किया जा सकता है <math>\mathbf{z}_a</math> और <math>\mathbf{z}_b</math>. विकर्ण अवयव स्पष्ट रूप से होंगे <math>1</math>s और ऑफ विकर्ण अवयवों का निरपेक्ष मान एकता से कम या उसके सामान्य होगा। घटे हुए सहसंबंध आव्युह को इस प्रकार परिभाषित किया गया है | ||
:<math>\hat{r}_{ab}=\hat{\mathbf{z}}_a\cdot\hat{\mathbf{z}}_b</math>. | :<math>\hat{r}_{ab}=\hat{\mathbf{z}}_a\cdot\hat{\mathbf{z}}_b</math>. | ||
कारक विश्लेषण का लक्ष्य फिटिंग हाइपरप्लेन का चयन करना है, ताकि सहसंबंध | कारक विश्लेषण का लक्ष्य फिटिंग हाइपरप्लेन का चयन करना है, ताकि सहसंबंध आव्युह के विकर्ण अवयवों को छोड़कर, कम सहसंबंध आव्युह सहसंबंध आव्युह को यथासंभव पुन: उत्पन्न कर सके, जिन्हें इकाई मान के रूप में जाना जाता है। दूसरे शब्दों में, लक्ष्य डेटा में क्रॉस-सहसंबंधों को यथासंभव सटीक रूप से पुन: पेश करना है। विशेष रूप से, फिटिंग हाइपरप्लेन के लिए, ऑफ-विकर्ण घटकों में माध्य वर्ग त्रुटि | ||
:<math>\varepsilon^2=\sum_{a\ne b} \left(r_{ab}-\hat{r}_{ab}\right)^2</math> | :<math>\varepsilon^2=\sum_{a\ne b} \left(r_{ab}-\hat{r}_{ab}\right)^2</math> | ||
इसे न्यूनतम किया जाना है, और इसे ऑर्थोनॉर्मल फैक्टर वैक्टर के | इसे न्यूनतम किया जाना है, और इसे ऑर्थोनॉर्मल फैक्टर वैक्टर के समुच्चय के संबंध में इसे कम करके पूरा किया जाता है। यह देखा जा सकता है | ||
:<math> | :<math> | ||
r_{ab}-\hat{r}_{ab}= \boldsymbol{\varepsilon}_a\cdot\boldsymbol{\varepsilon}_b | r_{ab}-\hat{r}_{ab}= \boldsymbol{\varepsilon}_a\cdot\boldsymbol{\varepsilon}_b | ||
</math> | </math> | ||
दाईं ओर का शब्द केवल त्रुटियों का सहप्रसरण है। मॉडल में, त्रुटि सहप्रसरण को विकर्ण | दाईं ओर का शब्द केवल त्रुटियों का सहप्रसरण है। मॉडल में, त्रुटि सहप्रसरण को विकर्ण आव्युह कहा गया है और इसलिए उपरोक्त न्यूनतमकरण समस्या वास्तव में मॉडल के लिए सबसे उपयुक्त होगी: यह त्रुटि सहप्रसरण का प्रतिरूप अनुमान प्राप्त करेगी जिसके ऑफ-विकर्ण घटकों को औसत वर्ग अर्थ में न्यूनतम किया गया है। यह देखा जा सकता है कि जब से <math>\hat{z}_a</math> डेटा वेक्टर के ऑर्थोगोनल प्रक्षेपण हैं, उनकी लंबाई अनुमानित डेटा वेक्टर की लंबाई से कम या उसके सामान्य होगी, जो कि एकता है। इन लंबाइयों का वर्ग कम सहसंबंध आव्युह के विकर्ण अवयव मात्र हैं। कम सहसंबंध आव्युह के इन विकर्ण अवयवों को सांप्रदायिकता के रूप में जाना जाता है: | ||
:<math> | :<math> | ||
{h_a}^2=||\hat{\mathbf{z}}_a||^2= \sum_p {\ell_{ap}}^2 | {h_a}^2=||\hat{\mathbf{z}}_a||^2= \sum_p {\ell_{ap}}^2 | ||
</math> | </math> | ||
समुदायों के बड़े मूल्य यह संकेत देंगे कि फिटिंग हाइपरप्लेन सहसंबंध | समुदायों के बड़े मूल्य यह संकेत देंगे कि फिटिंग हाइपरप्लेन सहसंबंध आव्युह को सटीक रूप से पुन: प्रस्तुत कर रहा है। कारकों के माध्य मानों को भी शून्य होने के लिए बाध्य किया जाना चाहिए, जिससे यह निष्कर्ष निकलता है कि त्रुटियों का माध्य मान भी शून्य होगा। | ||
==व्यावहारिक कार्यान्वयन== | ==व्यावहारिक कार्यान्वयन== | ||
Line 121: | Line 122: | ||
====खोजपूर्ण कारक विश्लेषण==== | ====खोजपूर्ण कारक विश्लेषण==== | ||
{{broader|Exploratory factor analysis}} | {{broader|Exploratory factor analysis}} | ||
खोजपूर्ण कारक विश्लेषण (ईएफए) का उपयोग उन वस्तुओं और समूह वस्तुओं के | खोजपूर्ण कारक विश्लेषण (ईएफए) का उपयोग उन वस्तुओं और समूह वस्तुओं के मध्य जटिल अंतर्संबंधों की पहचान करने के लिए किया जाता है जो एकीकृत अवधारणाओं का हिस्सा हैं।<ref name=Polit>{{cite book |author=Polit DF Beck CT |title=Nursing Research: Generating and Assessing Evidence for Nursing Practice, 9th ed. |year=2012 |publisher=Wolters Klower Health, Lippincott Williams & Wilkins |location=Philadelphia, USA}}</ref> शोधकर्ता कारकों के मध्य संबंधों के बारे में कोई पूर्व धारणा नहीं बनाता है।<ref name=Polit/> | ||
====पुष्टि कारक विश्लेषण==== | ====पुष्टि कारक विश्लेषण==== | ||
{{broader|Confirmatory factor analysis}} | {{broader|Confirmatory factor analysis}} | ||
पुष्टिकरण कारक विश्लेषण (सीएफए) अधिक जटिल दृष्टिकोण है जो इस परिकल्पना का परीक्षण करता है कि आइटम विशिष्ट कारकों से जुड़े हैं।<ref name=Polit/>सीएफए माप मॉडल का परीक्षण करने के लिए [[संरचनात्मक समीकरण मॉडलिंग]] का उपयोग करता है जिससे कारकों पर लोड करने से देखे गए | पुष्टिकरण कारक विश्लेषण (सीएफए) अधिक जटिल दृष्टिकोण है जो इस परिकल्पना का परीक्षण करता है कि आइटम विशिष्ट कारकों से जुड़े हैं।<ref name=Polit/>सीएफए माप मॉडल का परीक्षण करने के लिए [[संरचनात्मक समीकरण मॉडलिंग]] का उपयोग करता है जिससे कारकों पर लोड करने से देखे गए वेरिएबल और न देखे गए वेरिएबल के मध्य संबंधों के मूल्यांकन की अनुमति मिलती है।<ref name=Polit/> संरचनात्मक समीकरण मॉडलिंग दृष्टिकोण माप त्रुटि को समायोजित कर सकते हैं और [[न्यूनतम-वर्ग अनुमान]] की तुलना में कम प्रतिबंधात्मक हैं।<ref name=Polit/> परिकल्पित मॉडल का परीक्षण वास्तविक डेटा के विरुद्ध किया जाता है, और विश्लेषण अव्यक्त वेरिएबल (कारकों) पर देखे गए वेरिएबल के लोडिंग के साथ-साथ अव्यक्त वेरिएबल के मध्य सहसंबंध को प्रदर्शित करेगा।<ref name=Polit/> | ||
Line 132: | Line 133: | ||
प्रमुख घटक विश्लेषण (पीसीए) कारक निष्कर्षण के लिए व्यापक रूप से उपयोग की जाने वाली विधि है, जो ईएफए का पहला चरण है।<ref name=Polit/>अधिकतम संभावित विचरण निकालने के लिए कारक भार की गणना की जाती है, क्रमिक फैक्टरिंग तब तक जारी रहती है जब तक कि कोई और सार्थक विचरण नहीं बचा हो।<ref name=Polit/>फिर विश्लेषण के लिए कारक मॉडल को घुमाया जाना चाहिए।<ref name=Polit/> | प्रमुख घटक विश्लेषण (पीसीए) कारक निष्कर्षण के लिए व्यापक रूप से उपयोग की जाने वाली विधि है, जो ईएफए का पहला चरण है।<ref name=Polit/>अधिकतम संभावित विचरण निकालने के लिए कारक भार की गणना की जाती है, क्रमिक फैक्टरिंग तब तक जारी रहती है जब तक कि कोई और सार्थक विचरण नहीं बचा हो।<ref name=Polit/>फिर विश्लेषण के लिए कारक मॉडल को घुमाया जाना चाहिए।<ref name=Polit/> | ||
कैनोनिकल फैक्टर विश्लेषण, जिसे राव की कैनोनिकल फैक्टरिंग भी कहा जाता है, पीसीए के समान मॉडल की गणना करने की | कैनोनिकल फैक्टर विश्लेषण, जिसे राव की कैनोनिकल फैक्टरिंग भी कहा जाता है, पीसीए के समान मॉडल की गणना करने की भिन्न विधि है, जो प्रमुख अक्ष विधि का उपयोग करती है। विहित कारक विश्लेषण उन कारकों की तलाश करता है जिनका प्रेक्षित वेरिएबल के साथ उच्चतम विहित सहसंबंध होता है। विहित कारक विश्लेषण डेटा के मनमाने पुनर्स्केलिंग से अप्रभावित रहता है। | ||
सामान्य कारक विश्लेषण, जिसे [[प्रमुख कारक विश्लेषण]] (पीएफए) या प्रमुख अक्ष फैक्टरिंग (पीएएफ) भी कहा जाता है, सबसे कम कारकों की तलाश करता है जो | सामान्य कारक विश्लेषण, जिसे [[प्रमुख कारक विश्लेषण]] (पीएफए) या प्रमुख अक्ष फैक्टरिंग (पीएएफ) भी कहा जाता है, सबसे कम कारकों की तलाश करता है जो वेरिएबल के समुच्चय के सामान्य विचरण (सहसंबंध) के लिए जिम्मेदार हो सकते हैं। | ||
छवि फैक्टरिंग वास्तविक | छवि फैक्टरिंग वास्तविक वेरिएबल के बजाय अनुमानित वेरिएबल के सहसंबंध आव्युह पर आधारित है, जहां प्रत्येक वेरिएबल की भविष्यवाणी कई प्रतिगमन का उपयोग करके दूसरों से की जाती है। | ||
अल्फा फैक्टरिंग कारकों की विश्वसनीयता को अधिकतम करने पर आधारित है, यह मानते हुए कि | अल्फा फैक्टरिंग कारकों की विश्वसनीयता को अधिकतम करने पर आधारित है, यह मानते हुए कि वेरिएबल को वेरिएबल के ब्रह्मांड से यादृच्छिक रूप से प्रतिरूप लिया जाता है। अन्य सभी विधियाँ यह मानती हैं कि मामलों को प्रतिरूपकृत किया गया है और वेरिएबलों को निश्चित किया गया है। | ||
कारक प्रतिगमन मॉडल कारक मॉडल और प्रतिगमन मॉडल का संयोजन मॉडल है; या वैकल्पिक रूप से, इसे हाइब्रिड कारक मॉडल के रूप में देखा जा सकता है,<ref name="meng2011">{{cite journal|last=Meng |first=J. |title=एक गैर-नकारात्मक हाइब्रिड कारक मॉडल का उपयोग करके ग्लियोब्लास्टोमा में माइक्रोआरएनए और प्रतिलेखन कारकों द्वारा सहकारी जीन नियमों को उजागर करें|journal=International Conference on Acoustics, Speech and Signal Processing |year=2011 |url=http://www.cmsworldwide.com/ICASSP2011/Papers/ViewPapers.asp?PaperNum=4439 |url-status=dead |archive-url=https://web.archive.org/web/20111123144133/http://www.cmsworldwide.com/ICASSP2011/Papers/ViewPapers.asp?PaperNum=4439 |archive-date=2011-11-23 }}</ref> जिनके कारक आंशिक रूप से ज्ञात हैं। | कारक प्रतिगमन मॉडल कारक मॉडल और प्रतिगमन मॉडल का संयोजन मॉडल है; या वैकल्पिक रूप से, इसे हाइब्रिड कारक मॉडल के रूप में देखा जा सकता है,<ref name="meng2011">{{cite journal|last=Meng |first=J. |title=एक गैर-नकारात्मक हाइब्रिड कारक मॉडल का उपयोग करके ग्लियोब्लास्टोमा में माइक्रोआरएनए और प्रतिलेखन कारकों द्वारा सहकारी जीन नियमों को उजागर करें|journal=International Conference on Acoustics, Speech and Signal Processing |year=2011 |url=http://www.cmsworldwide.com/ICASSP2011/Papers/ViewPapers.asp?PaperNum=4439 |url-status=dead |archive-url=https://web.archive.org/web/20111123144133/http://www.cmsworldwide.com/ICASSP2011/Papers/ViewPapers.asp?PaperNum=4439 |archive-date=2011-11-23 }}</ref> जिनके कारक आंशिक रूप से ज्ञात हैं। | ||
Line 162: | Line 163: | ||
===कारकों की संख्या निर्धारित करने के लिए मानदंड=== | ===कारकों की संख्या निर्धारित करने के लिए मानदंड=== | ||
शोधकर्ता कारक प्रतिधारण के लिए ऐसे व्यक्तिपरक या मनमाने मानदंडों से बचना चाहते हैं क्योंकि यह मेरे लिए समझ में आता है। इस समस्या को हल करने के लिए कई वस्तुनिष्ठ | शोधकर्ता कारक प्रतिधारण के लिए ऐसे व्यक्तिपरक या मनमाने मानदंडों से बचना चाहते हैं क्योंकि यह मेरे लिए समझ में आता है। इस समस्या को हल करने के लिए कई वस्तुनिष्ठ विधियों विकसित किए गए हैं, जो उपयोगकर्ताओं को जांच के लिए समाधानों की उचित श्रृंखला निर्धारित करने की अनुमति देते हैं।<ref name="Zwick1986">{{cite journal |last1=Zwick |first1=William R. |last2=Velicer |first2=Wayne F. |title=बनाए रखने के लिए घटकों की संख्या निर्धारित करने के लिए पांच नियमों की तुलना।|journal=Psychological Bulletin |date=1986 |volume=99 |issue=3 |pages=432–442 |doi=10.1037/0033-2909.99.3.432}}</ref> हालाँकि ये भिन्न-भिन्न विधियाँ अक्सर एक-दूसरे से असहमत होती हैं कि कितने कारकों को बरकरार रखा जाना चाहिए। उदाहरण के लिए, [[समानांतर विश्लेषण]] 5 कारकों का सुझाव दे सकता है जबकि वेलिसर का एमएपी 6 का सुझाव देता है, इसलिए शोधकर्ता 5 और 6-कारक समाधान दोनों का अनुरोध कर सकता है और बाहरी डेटा और सिद्धांत के संबंध में प्रत्येक पर चर्चा कर सकता है। | ||
====आधुनिक मानदंड==== | ====आधुनिक मानदंड==== | ||
हॉर्न का समानांतर विश्लेषण (पीए):<ref name="Horn1965">{{cite journal |last1=Horn |first1=John L. |title=कारक विश्लेषण में कारकों की संख्या के लिए एक तर्क और परीक्षण|journal=Psychometrika |date=June 1965 |volume=30 |issue=2 |pages=179–185 |doi=10.1007/BF02289447|pmid=14306381 |s2cid=19663974 }}</ref> मोंटे-कार्लो आधारित सिमुलेशन विधि जो देखे गए स्वदेशी मूल्यों की तुलना असंबद्ध सामान्य | हॉर्न का समानांतर विश्लेषण (पीए):<ref name="Horn1965">{{cite journal |last1=Horn |first1=John L. |title=कारक विश्लेषण में कारकों की संख्या के लिए एक तर्क और परीक्षण|journal=Psychometrika |date=June 1965 |volume=30 |issue=2 |pages=179–185 |doi=10.1007/BF02289447|pmid=14306381 |s2cid=19663974 }}</ref> मोंटे-कार्लो आधारित सिमुलेशन विधि जो देखे गए स्वदेशी मूल्यों की तुलना असंबद्ध सामान्य वेरिएबल से प्राप्त मूल्यों से करती है। कारक या घटक को बरकरार रखा जाता है यदि संबंधित आइगेनवैल्यू यादृच्छिक डेटा से प्राप्त आइजेनवैल्यू के वितरण के 95वें प्रतिशतक से बड़ा है। बनाए रखने के लिए घटकों की संख्या निर्धारित करने के लिए पीए अधिक सामान्यतः अनुशंसित नियमों में से है,<ref name="Zwick1986" /><ref>{{Cite arXiv|last=Dobriban|first=Edgar|date=2017-10-02|title=कारक विश्लेषण और पीसीए के लिए क्रमपरिवर्तन विधियाँ|class=math.ST|language=en|eprint=1710.00479v2}}</ref> लेकिन कई प्रोग्राम इस विकल्प को शामिल करने में विफल रहते हैं (एक उल्लेखनीय अपवाद [[आर (प्रोग्रामिंग भाषा)]] है)।<ref>* {{cite journal | last1 = Ledesma | first1 = R.D. | last2 = Valero-Mora | first2 = P. | year = 2007 | title = Determining the Number of Factors to Retain in EFA: An easy-to-use computer program for carrying out Parallel Analysis | url = http://pareonline.net/getvn.asp?v=12&n=2 | journal = Practical Assessment Research & Evaluation | volume = 12 | issue = 2| pages = 1–11 }}</ref> हालाँकि, एंटोन फॉर्मैन ने सैद्धांतिक और अनुभवजन्य दोनों साक्ष्य प्रदान किए कि इसका अनुप्रयोग कई मामलों में उचित नहीं हो सकता है क्योंकि इसका प्रदर्शन प्रतिरूप आकार, आइटम प्रतिक्रिया सिद्धांत # आइटम प्रतिक्रिया फ़ंक्शन और [[सहसंबंध गुणांक]] के प्रकार से काफी प्रभावित होता है।<ref>Tran, U. S., & Formann, A. K. (2009). Performance of parallel analysis in retrieving unidimensionality in the presence of binary data. ''Educational and Psychological Measurement, 69,'' 50-61.</ref> | ||
वेलिसर (1976) एमएपी परीक्षण<ref name=Velicer>{{cite journal|last=Velicer|first=W.F.|title=आंशिक सहसंबंधों के मैट्रिक्स से घटकों की संख्या निर्धारित करना|journal=Psychometrika|year=1976|volume=41|issue=3|pages=321–327|doi=10.1007/bf02293557|s2cid=122907389}}</ref> जैसा कि कर्टनी द्वारा वर्णित है (2013)<ref name="pareonline.net">Courtney, M. G. R. (2013). Determining the number of factors to retain in EFA: Using the SPSS R-Menu v2.0 to make more judicious estimations. Practical Assessment, Research and Evaluation, 18(8). Available online: | वेलिसर (1976) एमएपी परीक्षण<ref name=Velicer>{{cite journal|last=Velicer|first=W.F.|title=आंशिक सहसंबंधों के मैट्रिक्स से घटकों की संख्या निर्धारित करना|journal=Psychometrika|year=1976|volume=41|issue=3|pages=321–327|doi=10.1007/bf02293557|s2cid=122907389}}</ref> जैसा कि कर्टनी द्वारा वर्णित है (2013)<ref name="pareonline.net">Courtney, M. G. R. (2013). Determining the number of factors to retain in EFA: Using the SPSS R-Menu v2.0 to make more judicious estimations. Practical Assessment, Research and Evaluation, 18(8). Available online: | ||
http://pareonline.net/getvn.asp?v=18&n=8</ref> "इसमें पूर्ण प्रमुख घटक विश्लेषण शामिल है जिसके | http://pareonline.net/getvn.asp?v=18&n=8</ref> "इसमें पूर्ण प्रमुख घटक विश्लेषण शामिल है जिसके पश्चात आंशिक सहसंबंधों के आव्युह की श्रृंखला की जांच की जाती है" (पृष्ठ 397 (हालांकि ध्यान दें कि यह उद्धरण वेलिसर (1976) में नहीं होता है और उद्धृत पृष्ठ संख्या उद्धरण के पृष्ठों के बाहर है)। चरण "0" के लिए वर्ग सहसंबंध (चित्र 4 देखें) अपूर्ण सहसंबंध आव्युह के लिए औसत वर्ग-विकर्ण सहसंबंध है। चरण 1 पर, पहले प्रमुख घटक और उससे संबंधित वस्तुओं को आंशिक रूप से हटा दिया जाता है। इसके पश्चात, पश्चात के सहसंबंध आव्युह के लिए औसत वर्ग-विकर्ण सहसंबंध की गणना चरण 1 के लिए की जाती है। चरण 2 पर, पहले दो प्रमुख घटकों को आंशिक रूप से हटा दिया जाता है और परिणामी औसत वर्ग-विकर्ण सहसंबंध की फिर से गणना की जाती है। गणना k शून्य से चरण के लिए की जाती है (k आव्युह में वेरिएबल की कुल संख्या का प्रतिनिधित्व करता है)। इसके पश्चात, प्रत्येक चरण के लिए सभी औसत वर्ग सहसंबंधों को पंक्तिबद्ध किया जाता है और विश्लेषण में चरण संख्या जिसके परिणामस्वरूप सबसे कम औसत वर्ग आंशिक सहसंबंध होता है, घटकों की संख्या निर्धारित करता है या बनाए रखने के लिए कारक।<ref name=Velicer/>इस विधि द्वारा, घटकों को तब तक बनाए रखा जाता है जब तक सहसंबंध आव्युह में भिन्नता अवशिष्ट या त्रुटि भिन्नता के विपरीत व्यवस्थित भिन्नता का प्रतिनिधित्व करती है। यद्यपि पद्धतिगत रूप से प्रमुख घटक विश्लेषण के समान, एमएपी तकनीक को कई सिमुलेशन अध्ययनों में बनाए रखने के लिए कारकों की संख्या निर्धारित करने में काफी अच्छा प्रदर्शन करते दिखाया गया है।<ref name="Zwick1986" /><ref name="Warne, R. T. 2014"/><ref name =Ruscio>{{cite journal|last=Ruscio|first=John|author2=Roche, B.|title=ज्ञात तथ्यात्मक संरचना के तुलनात्मक डेटा का उपयोग करके खोजपूर्ण कारक विश्लेषण में बनाए रखने के लिए कारकों की संख्या निर्धारित करना|journal=Psychological Assessment|year=2012|volume=24|issue=2|pages=282–292|doi=10.1037/a0025697|pmid=21966933}}</ref><ref name="Garrido">Garrido, L. E., & Abad, F. J., & Ponsoda, V. (2012). A new look at Horn's parallel analysis with ordinal variables. Psychological Methods. Advance online publication. {{doi|10.1037/a0030005}}</ref> यह प्रक्रिया SPSS के उपयोगकर्ता इंटरफ़ेस के माध्यम से उपलब्ध कराई गई है,<ref name="pareonline.net"/>साथ ही आर (प्रोग्रामिंग भाषा) के लिए मनोवैज्ञानिक पैकेज।<ref>{{cite journal |last1=Revelle |first1=William |title=Determining the number of factors: the example of the NEO-PI-R |date=2007 |url=http://www.personality-project.org/r/book/numberoffactors.pdf}}</ref><ref>{{cite web |last1=Revelle |first1=William |title=psych: Procedures for Psychological, Psychometric, and PersonalityResearch |url=https://cran.r-project.org/web/packages/psych/ |date=8 January 2020}}</ref> | ||
==== पुराने | ==== पुराने विधियों ==== | ||
कैसर मानदंड: कैसर नियम 1.0 के तहत eigenvalues के साथ सभी घटकों को छोड़ने के लिए है - यह औसत एकल आइटम द्वारा दर्ज की गई जानकारी के | कैसर मानदंड: कैसर नियम 1.0 के तहत eigenvalues के साथ सभी घटकों को छोड़ने के लिए है - यह औसत एकल आइटम द्वारा दर्ज की गई जानकारी के सामान्य eigenvalue है।<ref name="Kaiser1960">{{cite journal |last1=Kaiser |first1=Henry F. |title=कारक विश्लेषण के लिए इलेक्ट्रॉनिक कंप्यूटर का अनुप्रयोग|journal=Educational and Psychological Measurement |date=April 1960 |volume=20 |issue=1 |pages=141–151 |doi=10.1177/001316446002000116|s2cid=146138712 }}</ref> [[एसपीएसएस]] और अधिकांश सांख्यिकीय सॉफ़्टवेयर में कैसर मानदंड डिफ़ॉल्ट है, लेकिन कारकों की संख्या का अनुमान लगाने के लिए एकमात्र कट-ऑफ मानदंड के रूप में उपयोग किए जाने पर इसकी अनुशंसा नहीं की जाती है क्योंकि यह कारकों को अधिक निकालने की प्रवृत्ति रखता है।<ref>{{cite book |first1=D.L. |last1=Bandalos |first2=M.R. |last2=Boehm-Kaufman |chapter=Four common misconceptions in exploratory factor analysis |editor1-first=Charles E. |editor1-last=Lance |editor2-first=Robert J. |editor2-last=Vandenberg |title=Statistical and Methodological Myths and Urban Legends: Doctrine, Verity and Fable in the Organizational and Social Sciences |chapter-url=https://books.google.com/books?id=KFAnkvqD8CgC&pg=PA61 |year=2008 |publisher=Taylor & Francis |isbn=978-0-8058-6237-9 |pages=61–87}}</ref> इस पद्धति का रूपांतर तैयार किया गया है जहां शोधकर्ता प्रत्येक आइगेनवैल्यू के लिए आत्म[[विश्वास अंतराल]] की गणना करता है और केवल उन कारकों को बरकरार रखता है जिनका संपूर्ण आत्मविश्वास अंतराल 1.0 से अधिक है।<ref name="Warne, R. T. 2014">{{cite journal | last1 = Warne | first1 = R. T. | last2 = Larsen | first2 = R. | year = 2014 | title = खोजपूर्ण कारक विश्लेषण में कारकों की संख्या निर्धारित करने के लिए गुटमैन नियम के प्रस्तावित संशोधन का मूल्यांकन करना| journal = Psychological Test and Assessment Modeling | volume = 56 | pages = 104–123 }}</ref><ref>{{cite journal | last1 = Larsen | first1 = R. | last2 = Warne | first2 = R. T. | year = 2010 | title = खोजपूर्ण कारक विश्लेषण में eigenvalues के लिए आत्मविश्वास अंतराल का अनुमान लगाना| journal = Behavior Research Methods | volume = 42 | issue = 3| pages = 871–876 | doi = 10.3758/BRM.42.3.871 | pmid = 20805609 | doi-access = free }}</ref> | ||
[[मिट्टी - रोढ़ी वाला भूखंड]]:<ref>{{cite journal|first1=Raymond |last1=Cattell|journal=Multivariate Behavioral Research|volume=1|number=2|pages=245–76|year=1966|title=गुणनखंडों की संख्या के लिए रोड़ी परीक्षण|doi=10.1207/s15327906mbr0102_10|pmid=26828106}}</ref> | [[मिट्टी - रोढ़ी वाला भूखंड]]:<ref>{{cite journal|first1=Raymond |last1=Cattell|journal=Multivariate Behavioral Research|volume=1|number=2|pages=245–76|year=1966|title=गुणनखंडों की संख्या के लिए रोड़ी परीक्षण|doi=10.1207/s15327906mbr0102_10|pmid=26828106}}</ref> | ||
कैटेल स्क्री परीक्षण घटकों को एक्स-अक्ष के रूप में और संबंधित [[eigenvalue]] को वाई-अक्ष के रूप में प्लॉट करता है। जैसे-जैसे कोई दाईं ओर बढ़ता है, | कैटेल स्क्री परीक्षण घटकों को एक्स-अक्ष के रूप में और संबंधित [[eigenvalue]] को वाई-अक्ष के रूप में प्लॉट करता है। जैसे-जैसे कोई दाईं ओर बढ़ता है, पश्चात के घटकों की ओर, स्वदेशी मूल्य कम हो जाते हैं। जब गिरावट बंद हो जाती है और वक्र कम तेज गिरावट की ओर कोहनी बनाता है,तब कैटेल का स्क्री परीक्षण कोहनी से शुरू होने वाले सभी घटकों को छोड़ने के लिए कहता है। शोधकर्ता-नियंत्रित विक्षनरी:फज फ़ैक्टर के प्रति उत्तरदायी होने के कारण कभी-कभी इस नियम की आलोचना की जाती है। अथार्त, चूंकि कोहनी चुनना व्यक्तिपरक हो सकता है क्योंकि वक्र में कई कोहनी होती हैं या चिकनी वक्र होती है, शोधकर्ता को अपने शोध एजेंडे द्वारा वांछित कारकों की संख्या पर कट-ऑफ निर्धारित करने का प्रलोभन दिया जा सकता है। | ||
वेरिएंस ने मानदंड समझाया: कुछ शोधकर्ता भिन्नता के 90% (कभी-कभी 80%) को ध्यान में रखने के लिए पर्याप्त कारकों को रखने के नियम का उपयोग करते हैं। जहां शोधकर्ता का लक्ष्य ओकाम के रेजर पर जोर देता है (यथासंभव कुछ कारकों के साथ भिन्नता की व्याख्या करना), मानदंड 50% तक कम हो सकता है। | वेरिएंस ने मानदंड समझाया: कुछ शोधकर्ता भिन्नता के 90% (कभी-कभी 80%) को ध्यान में रखने के लिए पर्याप्त कारकों को रखने के नियम का उपयोग करते हैं। जहां शोधकर्ता का लक्ष्य ओकाम के रेजर पर जोर देता है (यथासंभव कुछ कारकों के साथ भिन्नता की व्याख्या करना), मानदंड 50% तक कम हो सकता है। | ||
Line 183: | Line 184: | ||
===रोटेशन विधियाँ=== | ===रोटेशन विधियाँ=== | ||
अनरोटेटेड आउटपुट पहले कारक, फिर दूसरे फैक्टर आदि के कारण होने वाले विचरण को अधिकतम करता है। अनरोटेटेड समाधान [[ ओर्थोगोनल |ओर्थोगोनल]] है। इसका मतलब है कि कारकों के | अनरोटेटेड आउटपुट पहले कारक, फिर दूसरे फैक्टर आदि के कारण होने वाले विचरण को अधिकतम करता है। अनरोटेटेड समाधान [[ ओर्थोगोनल |ओर्थोगोनल]] है। इसका मतलब है कि कारकों के मध्य सहसंबंध शून्य है। अनरोटेटेड समाधान का उपयोग करने का नुकसान यह है कि सामान्यतः अधिकांश आइटम शुरुआती कारकों पर लोड होते हैं और कई आइटम से अधिक कारकों पर काफी सीमा तक लोड होते हैं। | ||
रोटेशन, लोडिंग का पैटर्न बनाने के लिए समन्वय प्रणाली के अक्षों को रोटेशन (गणित) द्वारा व्याख्या करना आसान बनाता है, जहां प्रत्येक आइटम केवल कारक पर दृढ़ता से लोड होता है और अन्य कारकों पर अधिक कमजोर रूप से लोड होता है। घुमाव ऑर्थोगोनल या तिरछा हो सकता है। तिरछा घुमाव कारकों को सहसंबंधित करने की अनुमति देता है।<ref name="StackExchangeRotation">{{cite web |title=कारक रोटेशन के तरीके|url=https://stats.stackexchange.com/q/185216 |website=Stack Exchange |access-date=7 November 2022}}</ref> | रोटेशन, लोडिंग का पैटर्न बनाने के लिए समन्वय प्रणाली के अक्षों को रोटेशन (गणित) द्वारा व्याख्या करना आसान बनाता है, जहां प्रत्येक आइटम केवल कारक पर दृढ़ता से लोड होता है और अन्य कारकों पर अधिक कमजोर रूप से लोड होता है। घुमाव ऑर्थोगोनल या तिरछा हो सकता है। तिरछा घुमाव कारकों को सहसंबंधित करने की अनुमति देता है।<ref name="StackExchangeRotation">{{cite web |title=कारक रोटेशन के तरीके|url=https://stats.stackexchange.com/q/185216 |website=Stack Exchange |access-date=7 November 2022}}</ref> | ||
[[वेरिमैक्स रोटेशन]] सबसे अधिक इस्तेमाल की जाने वाली रोटेशन विधि है। वेरिमैक्स कारक अक्षों का ऑर्थोगोनल रोटेशन है जो कारक लोडिंग | [[वेरिमैक्स रोटेशन]] सबसे अधिक इस्तेमाल की जाने वाली रोटेशन विधि है। वेरिमैक्स कारक अक्षों का ऑर्थोगोनल रोटेशन है जो कारक लोडिंग आव्युह में सभी वेरिएबल (पंक्तियों) पर कारक (स्तंभ) के वर्ग लोडिंग के विचरण को अधिकतम करता है। प्रत्येक कारक में कारक द्वारा बड़े लोडिंग के साथ केवल कुछ वेरिएबल होते हैं। वेरिमैक्स लोडिंग आव्युह के कॉलम को सरल बनाता है। इससे प्रत्येक वेरिएबल को ही कारक से पहचानना यथासंभव आसान हो जाता है। | ||
क्वार्टिमैक्स रोटेशन ऑर्थोगोनल रोटेशन है जो | क्वार्टिमैक्स रोटेशन ऑर्थोगोनल रोटेशन है जो वेरिएबल को समझाने के लिए आवश्यक कारकों की संख्या को कम करता है। यह कॉलम के बजाय लोडिंग आव्युह की पंक्तियों को सरल बनाता है। क्वार्टिमैक्स अक्सर सामान्य कारक उत्पन्न करता है जिसमें कई वेरिएबल के लिए लोडिंग होती है। यह अघुलनशील समाधान के करीब है। यदि कई वेरिएबल सहसंबद्ध हैंतब क्वार्टिमैक्स उपयोगी है ताकि प्रमुख कारक की उम्मीद की जा सके।<ref name=Neuhaus>{{cite journal|last=Neuhaus|first=Jack O|author2=Wrigley, C.|title=क्वार्टिमैक्स विधि|journal=British Journal of Statistical Psychology|date=1954|volume=7|issue=2|pages=81–91|doi=10.1111/j.2044-8317.1954.tb00147.x}}</ref> इक्विमैक्स रोटेशन वेरिमैक्स और क्वार्टिमैक्स के मध्य समझौता है। | ||
कई व्यावहारिक अनुप्रयोगों में, यह मान लेना अवास्तविक है कि कारक असंबंधित हैं। इस स्थिति में तिरछे घुमाव को प्राथमिकता दी जाती है। एक-दूसरे से सहसंबद्ध कारकों को अनुमति देना विशेष रूप से साइकोमेट्रिक अनुसंधान में लागू होता है, क्योंकि दृष्टिकोण, राय और बौद्धिक क्षमताएं सहसंबद्ध होती हैं और अन्यथा मान लेना अवास्तविक होगा।<ref>{{cite journal |last=Russell |first=D.W. |title=In search of underlying dimensions: The use (and abuse) of factor analysis in Personality and Social Psychology Bulletin |journal=Personality and Social Psychology Bulletin |volume=28 |issue=12 |pages=1629–46 |date=December 2002 |doi=10.1177/014616702237645|s2cid=143687603 }}</ref> | कई व्यावहारिक अनुप्रयोगों में, यह मान लेना अवास्तविक है कि कारक असंबंधित हैं। इस स्थिति में तिरछे घुमाव को प्राथमिकता दी जाती है। एक-दूसरे से सहसंबद्ध कारकों को अनुमति देना विशेष रूप से साइकोमेट्रिक अनुसंधान में लागू होता है, क्योंकि दृष्टिकोण, राय और बौद्धिक क्षमताएं सहसंबद्ध होती हैं और अन्यथा मान लेना अवास्तविक होगा।<ref>{{cite journal |last=Russell |first=D.W. |title=In search of underlying dimensions: The use (and abuse) of factor analysis in Personality and Social Psychology Bulletin |journal=Personality and Social Psychology Bulletin |volume=28 |issue=12 |pages=1629–46 |date=December 2002 |doi=10.1177/014616702237645|s2cid=143687603 }}</ref> | ||
जब कोई व्यक्ति तिरछा (गैर-ऑर्थोगोनल) समाधान चाहता | जब कोई व्यक्ति तिरछा (गैर-ऑर्थोगोनल) समाधान चाहता हैतब ओब्लिमिन रोटेशन मानक विधि है। | ||
प्रोमैक्स रोटेशन वैकल्पिक तिरछा रोटेशन विधि है जो ओब्लिमिन विधि की तुलना में कम्प्यूटेशनल रूप से तेज़ है और इसलिए कभी-कभी बहुत बड़े [[ डाटासेट | | प्रोमैक्स रोटेशन वैकल्पिक तिरछा रोटेशन विधि है जो ओब्लिमिन विधि की तुलना में कम्प्यूटेशनल रूप से तेज़ है और इसलिए कभी-कभी बहुत बड़े [[ डाटासेट |डाटा]]समुच्चय के लिए उपयोग किया जाता है। | ||
====कारक घूर्णन के साथ समस्याएँ==== | ====कारक घूर्णन के साथ समस्याएँ==== | ||
जब प्रत्येक | जब प्रत्येक वेरिएबल कई कारकों पर लोड हो रहा होतब कारक संरचना की व्याख्या करना मुश्किल हो सकता है। | ||
डेटा में छोटे परिवर्तन कभी-कभी कारक रोटेशन मानदंड में संतुलन बना सकते हैं ताकि पूरी | डेटा में छोटे परिवर्तन कभी-कभी कारक रोटेशन मानदंड में संतुलन बना सकते हैं ताकि पूरी प्रकार से भिन्न कारक रोटेशन उत्पन्न हो। इससे विभिन्न प्रयोगों के परिणामों की तुलना करना कठिन हो सकता है। इस समस्या को विश्वव्यापी सांस्कृतिक भिन्नताओं के विभिन्न अध्ययनों की तुलना से स्पष्ट किया गया है। प्रत्येक अध्ययन ने सांस्कृतिक वेरिएबल के विभिन्न मापों का उपयोग किया है और भिन्न-भिन्न घुमाए गए कारक विश्लेषण परिणाम का उत्पादन किया है। प्रत्येक अध्ययन के लेखकों का मानना था कि उन्होंने कुछ नया खोजा है, और उन्होंने जो कारक पाए उनके लिए नए नाम ईजाद किए। अध्ययनों की पश्चात की तुलना में पाया गया कि जब अनियंत्रित परिणामों की तुलना की गईतब परिणाम समान थे। कारक रोटेशन के सामान्य अभ्यास ने विभिन्न अध्ययनों के परिणामों के मध्य समानता को अस्पष्ट कर दिया है।<ref name="Fog2022">{{cite journal |last1=Fog |first1=A |title=Two-Dimensional Models of Cultural Differences: Statistical and Theoretical Analysis |journal=Cross-Cultural Research |date=2022 |volume=57 |issue=2–3 |pages=115–165 |doi=10.1177/10693971221135703|s2cid=253153619 |url=https://backend.orbit.dtu.dk/ws/files/292673942/Two_dimensional_models_of_culture.pdf }}</ref> | ||
===उच्च क्रम कारक विश्लेषण=== | ===उच्च क्रम कारक विश्लेषण=== | ||
उच्च-क्रम कारक विश्लेषण सांख्यिकीय पद्धति है जिसमें दोहराए जाने वाले चरण कारक विश्लेषण - तिरछा रोटेशन - घुमाए गए कारकों का कारक विश्लेषण शामिल है। इसकी योग्यता शोधकर्ता को अध्ययन की गई घटनाओं की पदानुक्रमित संरचना को देखने में सक्षम बनाना है। परिणामों की व्याख्या करने के लिए, कोई | उच्च-क्रम कारक विश्लेषण सांख्यिकीय पद्धति है जिसमें दोहराए जाने वाले चरण कारक विश्लेषण - तिरछा रोटेशन - घुमाए गए कारकों का कारक विश्लेषण शामिल है। इसकी योग्यता शोधकर्ता को अध्ययन की गई घटनाओं की पदानुक्रमित संरचना को देखने में सक्षम बनाना है। परिणामों की व्याख्या करने के लिए, कोई यातब [[मैट्रिक्स गुणन|आव्युह गुणन]] द्वारा आगे बढ़ता है | प्राथमिक [[कारक पैटर्न मैट्रिक्स|कारक पैटर्न आव्युह]] को उच्च-क्रम कारक पैटर्न आव्युह (गोर्सच, 1983) द्वारा गुणा करने और शायद परिणाम के लिए वेरिमैक्स रोटेशन लागू करने (थॉम्पसन, 1990) या श्मिड-लीमन समाधान (एसएलएस, श्मिड और लीमन, 1957, जिसे श्मिड-लीमन परिवर्तन के रूप में भी जाना जाता है) का उपयोग करके आगे बढ़ता है जो [[सांख्यिकीय फैलाव]] का गुण बताता है। प्राथमिक कारकों से दूसरे क्रम के कारकों तक। | ||
==खोजपूर्ण कारक विश्लेषण (ईएफए) बनाम प्रमुख घटक विश्लेषण (पीसीए)== | ==खोजपूर्ण कारक विश्लेषण (ईएफए) बनाम प्रमुख घटक विश्लेषण (पीसीए)== | ||
{{see also|Principal component analysis|Exploratory factor analysis}} | {{see also|Principal component analysis|Exploratory factor analysis}} | ||
कारक विश्लेषण प्रमुख घटक विश्लेषण (पीसीए) से संबंधित है, लेकिन दोनों समान नहीं हैं।<ref name="Bartholomew2008">{{cite book |last1=Bartholomew |first1=D.J. |last2=Steele |first2=F. |last3=Galbraith |first3=J. |last4=Moustaki |first4=I. |title=बहुभिन्नरूपी सामाजिक विज्ञान डेटा का विश्लेषण|publisher=Taylor & Francis |year=2008 |isbn=978-1584889601 |edition=2nd |series=Statistics in the Social and Behavioral Sciences Series}}</ref> दोनों तकनीकों के | कारक विश्लेषण प्रमुख घटक विश्लेषण (पीसीए) से संबंधित है, लेकिन दोनों समान नहीं हैं।<ref name="Bartholomew2008">{{cite book |last1=Bartholomew |first1=D.J. |last2=Steele |first2=F. |last3=Galbraith |first3=J. |last4=Moustaki |first4=I. |title=बहुभिन्नरूपी सामाजिक विज्ञान डेटा का विश्लेषण|publisher=Taylor & Francis |year=2008 |isbn=978-1584889601 |edition=2nd |series=Statistics in the Social and Behavioral Sciences Series}}</ref> दोनों तकनीकों के मध्य अंतर को लेकर क्षेत्र में महत्वपूर्ण विवाद रहा है। पीसीए को [[खोजपूर्ण कारक विश्लेषण]] (ईएफए) का अधिक बुनियादी संस्करण माना जा सकता है जिसे हाई-स्पीड कंप्यूटर के आगमन से पहले शुरुआती दिनों में विकसित किया गया था। पीसीए और कारक विश्लेषण दोनों का लक्ष्य डेटा के समुच्चय की आयामीता को कम करना है, लेकिन ऐसा करने के लिए अपनाए गए दृष्टिकोण दोनों तकनीकों के लिए भिन्न-भिन्न हैं। कारक विश्लेषण स्पष्ट रूप से देखे गए वेरिएबल से कुछ अप्राप्य कारकों की पहचान करने के उद्देश्य से डिज़ाइन किया गया है, जबकि पीसीए सीधे इस उद्देश्य को संबोधित नहीं करता है; सर्वोत्तम रूप से, पीसीए आवश्यक कारकों का अनुमान प्रदान करता है।<ref name="Principal Component Analysis">Jolliffe I.T. ''Principal Component Analysis'', Series: Springer Series in Statistics, 2nd ed., Springer, NY, 2002, XXIX, 487 p. 28 illus. {{isbn|978-0-387-95442-4}}</ref> खोजपूर्ण विश्लेषण के दृष्टिकोण से, पीसीए के [[eigenvalues]] फुलाए गए घटक लोडिंग हैं, अथार्त, त्रुटि भिन्नता से दूषित हैं।<ref>Cattell, R. B. (1952). ''Factor analysis''. New York: Harper.</ref><ref>Fruchter, B. (1954). ''Introduction to Factor Analysis''. Van Nostrand.</ref><ref>Cattell, R. B. (1978). ''Use of Factor Analysis in Behavioral and Life Sciences''. New York: Plenum.</ref><ref>Child, D. (2006). ''The Essentials of Factor Analysis, 3rd edition''. Bloomsbury Academic Press.</ref><ref>Gorsuch, R. L. (1983). ''Factor Analysis, 2nd edition''. Hillsdale, NJ: Erlbaum.</ref><ref>McDonald, R. P. (1985). ''Factor Analysis and Related Methods''. Hillsdale, NJ: Erlbaum.</ref> | ||
जबकि खोजपूर्ण कारक विश्लेषण और प्रमुख घटक विश्लेषण को सांख्यिकी के कुछ क्षेत्रों में पर्यायवाची तकनीकों के रूप में माना जाता है, इसकी आलोचना की गई है।<ref name=Fabrigar>{{cite web|last=Fabrigar|title=मनोवैज्ञानिक अनुसंधान में खोजपूर्ण कारक विश्लेषण के उपयोग का मूल्यांकन करना।|year=1999|url=http://www.statpower.net/Content/312/Handout/Fabrigar1999.pdf|publisher=Psychological Methods|display-authors=etal}}</ref><ref name=Suhr>{{cite web|last=Suhr|first=Diane|year=2009|title=प्रमुख घटक विश्लेषण बनाम खोजपूर्ण कारक विश्लेषण|url=http://www2.sas.com/proceedings/sugi30/203-30.pdf|publisher=SUGI 30 Proceedings|access-date=5 April 2012}}</ref> कारक विश्लेषण अंतर्निहित कारण संरचना की धारणा से संबंधित है: [यह] मानता है कि देखे गए | जबकि खोजपूर्ण कारक विश्लेषण और प्रमुख घटक विश्लेषण को सांख्यिकी के कुछ क्षेत्रों में पर्यायवाची तकनीकों के रूप में माना जाता है, इसकी आलोचना की गई है।<ref name=Fabrigar>{{cite web|last=Fabrigar|title=मनोवैज्ञानिक अनुसंधान में खोजपूर्ण कारक विश्लेषण के उपयोग का मूल्यांकन करना।|year=1999|url=http://www.statpower.net/Content/312/Handout/Fabrigar1999.pdf|publisher=Psychological Methods|display-authors=etal}}</ref><ref name=Suhr>{{cite web|last=Suhr|first=Diane|year=2009|title=प्रमुख घटक विश्लेषण बनाम खोजपूर्ण कारक विश्लेषण|url=http://www2.sas.com/proceedings/sugi30/203-30.pdf|publisher=SUGI 30 Proceedings|access-date=5 April 2012}}</ref> कारक विश्लेषण अंतर्निहित कारण संरचना की धारणा से संबंधित है: [यह] मानता है कि देखे गए वेरिएबल में सहसंयोजन या अधिक अव्यक्त वेरिएबल (कारकों) की उपस्थिति के कारण होता है जो इन देखे गए वेरिएबल पर कारण प्रभाव डालते हैं।<ref name=Sas>{{cite web|title=प्रमुख घटक विश्लेषण|url=http://support.sas.com/publishing/pubcat/chaps/55129.pdf|work=SAS Support Textbook|author=SAS Statistics}}</ref> इसके विपरीत, पीसीए ऐसे अंतर्निहित कारण संबंध को नतब मानता है और न ही उस पर निर्भर करता है। शोधकर्ताओं ने तर्क दिया है कि दो तकनीकों के मध्य अंतर का मतलब यह हो सकता है कि विश्लेषणात्मक लक्ष्य के आधार पर को दूसरे पर प्राथमिकता देने के उद्देश्यपूर्ण लाभ हैं। यदि कारक मॉडल गलत विधियों से तैयार किया गया है या मान्यताओं को पूरा नहीं किया गया है,तब कारक विश्लेषण गलत परिणाम देगा। कारक विश्लेषण का सफलतापूर्वक उपयोग किया गया है जहां सिस्टम की पर्याप्त समझ अच्छे प्रारंभिक मॉडल फॉर्मूलेशन की अनुमति देती है। पीसीए मूल डेटा में गणितीय परिवर्तन को नियोजित करता है, जिसमें सहप्रसरण आव्युह के रूप के बारे में कोई धारणा नहीं होती है। पीसीए का उद्देश्य मूल वेरिएबल के रैखिक संयोजनों को निर्धारित करना और कुछ का चयन करना है जिनका उपयोग अधिक जानकारी खोए बिना डेटा समुच्चय को सारांशित करने के लिए किया जा सकता है।<ref>{{cite journal |last1=Meglen|first1=R.R. |title=Examining Large Databases: A Chemometric Approach Using Principal Component Analysis|journal=Journal of Chemometrics |volume=5 |issue=3|pages=163–179 |date=1991 |doi=10.1002/cem.1180050305 |s2cid=120886184 }}</ref> | ||
=== पीसीए और ईएफए के विपरीत तर्क === | === पीसीए और ईएफए के विपरीत तर्क === | ||
फैब्रिगर एट अल. (1999)<ref name=Fabrigar />ऐसे कई कारणों का पता लगाएं जिनका उपयोग यह सुझाव देने के लिए किया जाता है कि पीसीए कारक विश्लेषण के | फैब्रिगर एट अल. (1999)<ref name=Fabrigar />ऐसे कई कारणों का पता लगाएं जिनका उपयोग यह सुझाव देने के लिए किया जाता है कि पीसीए कारक विश्लेषण के सामान्य नहीं है: | ||
# कभी-कभी यह सुझाव दिया जाता है कि पीसीए कम्प्यूटेशनल रूप से तेज़ है और कारक विश्लेषण की तुलना में कम संसाधनों की आवश्यकता होती है। फैब्रिगर एट अल. सुझाव है कि आसानी से उपलब्ध कंप्यूटर संसाधनों ने इस व्यावहारिक चिंता को अप्रासंगिक बना दिया है। | # कभी-कभी यह सुझाव दिया जाता है कि पीसीए कम्प्यूटेशनल रूप से तेज़ है और कारक विश्लेषण की तुलना में कम संसाधनों की आवश्यकता होती है। फैब्रिगर एट अल. सुझाव है कि आसानी से उपलब्ध कंप्यूटर संसाधनों ने इस व्यावहारिक चिंता को अप्रासंगिक बना दिया है। | ||
# पीसीए और कारक विश्लेषण समान परिणाम उत्पन्न कर सकते हैं। इस बिंदु को फैब्रिगर एट अल द्वारा भी संबोधित किया गया है; कुछ मामलों में, जहाँ सामुदायिकताएँ कम हैं (जैसे 0.4), दोनों तकनीकें | # पीसीए और कारक विश्लेषण समान परिणाम उत्पन्न कर सकते हैं। इस बिंदु को फैब्रिगर एट अल द्वारा भी संबोधित किया गया है; कुछ मामलों में, जहाँ सामुदायिकताएँ कम हैं (जैसे 0.4), दोनों तकनीकें भिन्न-भिन्न परिणाम उत्पन्न करती हैं। वास्तव में, फैब्रिगर एट अल। तर्क है कि ऐसे मामलों में जहां डेटा सामान्य कारक मॉडल की मान्यताओं के अनुरूप है, पीसीए के परिणाम गलत परिणाम हैं। | ||
# ऐसे कुछ | # ऐसे कुछ स्तिथियों हैं जहां कारक विश्लेषण से 'हेवुड स्तिथियों' सामने आते हैं। इनमें वे स्थितियाँ शामिल हैं जिनमें मापे गए वेरिएबल में 100% या अधिक भिन्नता का अनुमान मॉडल द्वारा लगाया जाता है। फैब्रिगर एट अल. सुझाव दें कि ये स्तिथियों वास्तव में शोधकर्ता के लिए जानकारीपूर्ण हैं, जो गलत विधियों से निर्दिष्ट मॉडल या सामान्य कारक मॉडल के उल्लंघन का संकेत देते हैं। पीसीए दृष्टिकोण में हेवुड मामलों की कमी का मतलब यह हो सकता है कि ऐसे मुद्दों पर ध्यान नहीं दिया जाता है। | ||
# शोधकर्ता पीसीए दृष्टिकोण से अतिरिक्त जानकारी प्राप्त करते हैं, जैसे किसी निश्चित घटक पर किसी व्यक्ति का स्कोर; ऐसी जानकारी कारक विश्लेषण से नहीं मिलती है। हालाँकि, फैब्रिगर एट अल के रूप में। तर्क दें, कारक विश्लेषण का विशिष्ट उद्देश्य - | # शोधकर्ता पीसीए दृष्टिकोण से अतिरिक्त जानकारी प्राप्त करते हैं, जैसे किसी निश्चित घटक पर किसी व्यक्ति का स्कोर; ऐसी जानकारी कारक विश्लेषण से नहीं मिलती है। हालाँकि, फैब्रिगर एट अल के रूप में। तर्क दें, कारक विश्लेषण का विशिष्ट उद्देश्य - अथार्त मापे गए वेरिएबल के मध्य [[सहसंबंध और निर्भरता]] की संरचना के लिए लेखांकन कारकों को निर्धारित करना - कारक स्कोर के ज्ञान की आवश्यकता नहीं है और इस प्रकार यह लाभ अस्वीकार कर दिया गया है। कारक विश्लेषण से कारक स्कोर की गणना करना भी संभव है। | ||
=== प्रसरण बनाम सहप्रसरण === | === प्रसरण बनाम सहप्रसरण === | ||
कारक विश्लेषण माप में निहित यादृच्छिक त्रुटि को ध्यान में रखता है, जबकि पीसीए ऐसा करने में विफल रहता है। इस बिंदु का उदाहरण ब्राउन (2009) द्वारा दिया गया है,<ref name=Brown>{{cite web|last=Brown|first=J. D.|title=Principal components analysis and exploratory factor analysis – Definitions, differences and choices.|date=January 2009|url=http://jalt.org/test/PDF/Brown29.pdf|publisher=Shiken: JALT Testing & Evaluation SIG Newsletter|access-date=16 April 2012}}</ref> किसने संकेत दिया कि, गणना में शामिल सहसंबंध | कारक विश्लेषण माप में निहित यादृच्छिक त्रुटि को ध्यान में रखता है, जबकि पीसीए ऐसा करने में विफल रहता है। इस बिंदु का उदाहरण ब्राउन (2009) द्वारा दिया गया है,<ref name=Brown>{{cite web|last=Brown|first=J. D.|title=Principal components analysis and exploratory factor analysis – Definitions, differences and choices.|date=January 2009|url=http://jalt.org/test/PDF/Brown29.pdf|publisher=Shiken: JALT Testing & Evaluation SIG Newsletter|access-date=16 April 2012}}</ref> किसने संकेत दिया कि, गणना में शामिल सहसंबंध आव्युह के संबंध में: | ||
{{Quotation|"In PCA, 1.00s are put in the diagonal meaning that all of the variance in the matrix is to be accounted for (including variance unique to each variable, variance common among variables, and error variance). That would, therefore, by definition, include all of the variance in the variables. In contrast, in EFA, the communalities are put in the diagonal meaning that only the variance shared with other variables is to be accounted for (excluding variance unique to each variable and error variance). That would, therefore, by definition, include only variance that is common among the variables."|Brown (2009)|Principal components analysis and exploratory factor analysis – Definitions, differences and choices}} | {{Quotation|"In PCA, 1.00s are put in the diagonal meaning that all of the variance in the matrix is to be accounted for (including variance unique to each variable, variance common among variables, and error variance). That would, therefore, by definition, include all of the variance in the variables. In contrast, in EFA, the communalities are put in the diagonal meaning that only the variance shared with other variables is to be accounted for (excluding variance unique to each variable and error variance). That would, therefore, by definition, include only variance that is common among the variables."|Brown (2009)|Principal components analysis and exploratory factor analysis – Definitions, differences and choices}} | ||
इस कारण से, ब्राउन (2009) कारक विश्लेषण का उपयोग करने की सलाह देते हैं जब | इस कारण से, ब्राउन (2009) कारक विश्लेषण का उपयोग करने की सलाह देते हैं जब वेरिएबल के मध्य संबंधों के बारे में सैद्धांतिक विचार मौजूद होते हैं, जबकि पीसीए का उपयोग किया जाना चाहिए यदि शोधकर्ता का लक्ष्य अपने डेटा में पैटर्न का पता लगाना है। | ||
===प्रक्रिया और परिणाम में अंतर=== | ===प्रक्रिया और परिणाम में अंतर=== | ||
पीसीए और कारक विश्लेषण (एफए) के | पीसीए और कारक विश्लेषण (एफए) के मध्य अंतर को सुहर (2009) द्वारा और अधिक स्पष्ट किया गया है:<ref name=Suhr />* पीसीए के परिणामस्वरूप प्रमुख घटक बनते हैं जो प्रेक्षित वेरिएबलों के लिए अधिकतम मात्रा में विचरण का कारण बनते हैं; एफए डेटा में सामान्य भिन्नता का हिसाब रखता है। | ||
* पीसीए सहसंबंध | * पीसीए सहसंबंध आव्युह के विकर्णों पर सम्मिलित करता है; एफए अद्वितीय कारकों के साथ सहसंबंध आव्युह के विकर्णों को समायोजित करता है। | ||
* पीसीए घटक अक्ष पर वर्गाकार लंबवत दूरी के योग को कम करता है; एफए उन कारकों का अनुमान लगाता है जो देखे गए | * पीसीए घटक अक्ष पर वर्गाकार लंबवत दूरी के योग को कम करता है; एफए उन कारकों का अनुमान लगाता है जो देखे गए वेरिएबल पर प्रतिक्रियाओं को प्रभावित करते हैं। | ||
* पीसीए में घटक स्कोर [[आइगेनवैल्यूज़ एवं आइगेनवेक्टर्स]] द्वारा भारित देखे गए | * पीसीए में घटक स्कोर [[आइगेनवैल्यूज़ एवं आइगेनवेक्टर्स]] द्वारा भारित देखे गए वेरिएबल के रैखिक संयोजन का प्रतिनिधित्व करते हैं; एफए में देखे गए वेरिएबल अंतर्निहित और अद्वितीय कारकों के रैखिक संयोजन हैं। | ||
* पीसीए में, प्राप्त घटक व्याख्या योग्य नहीं हैं, | * पीसीए में, प्राप्त घटक व्याख्या योग्य नहीं हैं, अथार्त वे अंतर्निहित 'निर्माण' का प्रतिनिधित्व नहीं करते हैं; एफए में, सटीक मॉडल विनिर्देश दिए जाने पर, अंतर्निहित निर्माणों को लेबल किया जा सकता है और आसानी से व्याख्या की जा सकती है। | ||
==साइकोमेट्रिक्स में== | ==साइकोमेट्रिक्स में== | ||
===इतिहास=== | ===इतिहास=== | ||
[[चार्ल्स स्पीयरमैन]] सामान्य कारक विश्लेषण पर चर्चा करने वाले पहले मनोवैज्ञानिक थे<ref name=":0">{{Cite book|last=Mulaik|first=Stanley A|title=कारक विश्लेषण की नींव. दूसरा संस्करण|publisher=CRC Press|year=2010|isbn=978-1-4200-9961-4|location=Boca Raton, Florida|pages=6}}</ref> और अपने 1904 के पेपर में ऐसा किया।<ref>{{Cite journal|last=Spearman|first=Charles|date=1904|title=सामान्य बुद्धि वस्तुनिष्ठ रूप से निर्धारित और मापी जाती है|journal=American Journal of Psychology|volume=15|issue=2|pages=201–293|doi=10.2307/1412107|jstor=1412107}}</ref> इसने उनके | [[चार्ल्स स्पीयरमैन]] सामान्य कारक विश्लेषण पर चर्चा करने वाले पहले मनोवैज्ञानिक थे<ref name=":0">{{Cite book|last=Mulaik|first=Stanley A|title=कारक विश्लेषण की नींव. दूसरा संस्करण|publisher=CRC Press|year=2010|isbn=978-1-4200-9961-4|location=Boca Raton, Florida|pages=6}}</ref> और अपने 1904 के पेपर में ऐसा किया।<ref>{{Cite journal|last=Spearman|first=Charles|date=1904|title=सामान्य बुद्धि वस्तुनिष्ठ रूप से निर्धारित और मापी जाती है|journal=American Journal of Psychology|volume=15|issue=2|pages=201–293|doi=10.2307/1412107|jstor=1412107}}</ref> इसने उनके विधियों के बारे में कुछ विवरण प्रदान किए और एकल-कारक मॉडल से संबंधित था।<ref>{{Cite journal|last=Bartholomew|first=D. J.|date=1995|title=स्पीयरमैन और कारक विश्लेषण की उत्पत्ति और विकास|journal=British Journal of Mathematical and Statistical Psychology|volume=48|issue=2|pages=211–220|doi=10.1111/j.2044-8317.1995.tb01060.x}}</ref> उन्होंने पाया कि विभिन्न प्रकार के असंबंधित विषयों पर स्कूली बच्चों के स्कोर सकारात्मक रूप से सहसंबद्ध थे, जिससे उन्हें यह मानने मेंसहायता मिली कि सामान्य मानसिक क्षमता, या जी कारक (साइकोमेट्रिक्स), मानव संज्ञानात्मक प्रदर्शन को रेखांकित और आकार देता है। | ||
कई कारकों के साथ सामान्य कारक विश्लेषण का प्रारंभिक विकास 1930 के दशक की शुरुआत में [[लुई लियोन थर्स्टन]] द्वारा दो पत्रों में दिया गया था,<ref>{{Cite journal|last=Thurstone|first=Louis|date=1931|title=एकाधिक कारक विश्लेषण|journal=Psychological Review|volume=38|issue=5|pages=406–427|doi=10.1037/h0069792}}</ref><ref>{{Cite journal|last=Thurstone|first=Louis|date=1934|title=मन के सदिश|journal=The Psychological Review|volume=41|pages=1–32|doi=10.1037/h0075959}}</ref> उनकी 1935 की पुस्तक, [[मन के सदिश]] में इसका सारांश दिया गया है।<ref>{{Cite book|last=Thurstone|first=L. L.|title=मन के सदिश. प्राथमिक लक्षणों के अलगाव के लिए बहु-कारक विश्लेषण।|publisher=University of Chicago Press|year=1935|location=Chicago, Illinois}}</ref> थर्स्टन ने सामुदायिकता, विशिष्टता और रोटेशन सहित कई महत्वपूर्ण कारक विश्लेषण अवधारणाएँ पेश कीं।<ref>{{Cite book|last=Bock|first=Robert|title=100 पर कारक विश्लेषण|publisher=Lawrence Erlbaum Associates|year=2007|isbn=978-0-8058-6212-6 |editor=Cudeck, Robert |editor2=MacCallum, Robert C.|location=Mahwah, New Jersey|pages=37|chapter=Rethinking Thurstone}}</ref> उन्होंने सरल संरचना की वकालत की, और रोटेशन के | कई कारकों के साथ सामान्य कारक विश्लेषण का प्रारंभिक विकास 1930 के दशक की शुरुआत में [[लुई लियोन थर्स्टन]] द्वारा दो पत्रों में दिया गया था,<ref>{{Cite journal|last=Thurstone|first=Louis|date=1931|title=एकाधिक कारक विश्लेषण|journal=Psychological Review|volume=38|issue=5|pages=406–427|doi=10.1037/h0069792}}</ref><ref>{{Cite journal|last=Thurstone|first=Louis|date=1934|title=मन के सदिश|journal=The Psychological Review|volume=41|pages=1–32|doi=10.1037/h0075959}}</ref> उनकी 1935 की पुस्तक, [[मन के सदिश]] में इसका सारांश दिया गया है।<ref>{{Cite book|last=Thurstone|first=L. L.|title=मन के सदिश. प्राथमिक लक्षणों के अलगाव के लिए बहु-कारक विश्लेषण।|publisher=University of Chicago Press|year=1935|location=Chicago, Illinois}}</ref> थर्स्टन ने सामुदायिकता, विशिष्टता और रोटेशन सहित कई महत्वपूर्ण कारक विश्लेषण अवधारणाएँ पेश कीं।<ref>{{Cite book|last=Bock|first=Robert|title=100 पर कारक विश्लेषण|publisher=Lawrence Erlbaum Associates|year=2007|isbn=978-0-8058-6212-6 |editor=Cudeck, Robert |editor2=MacCallum, Robert C.|location=Mahwah, New Jersey|pages=37|chapter=Rethinking Thurstone}}</ref> उन्होंने सरल संरचना की वकालत की, और रोटेशन के विधियों का विकास किया जिसका उपयोग ऐसी संरचना को प्राप्त करने के विधियों के रूप में किया जा सकता है।<ref name=":0" /> | ||
[[क्यू पद्धति]] में, स्पीयरमैन के छात्र, [[विलियम स्टीफेंसन (मनोवैज्ञानिक)]], अंतर-व्यक्तिगत मतभेदों के अध्ययन की ओर उन्मुख आर कारक विश्लेषण और व्यक्तिपरक अंतर-व्यक्तिगत मतभेदों की ओर उन्मुख क्यू कारक विश्लेषण के | [[क्यू पद्धति]] में, स्पीयरमैन के छात्र, [[विलियम स्टीफेंसन (मनोवैज्ञानिक)]], अंतर-व्यक्तिगत मतभेदों के अध्ययन की ओर उन्मुख आर कारक विश्लेषण और व्यक्तिपरक अंतर-व्यक्तिगत मतभेदों की ओर उन्मुख क्यू कारक विश्लेषण के मध्य अंतर करते हैं।<ref>{{cite work | author= Mckeown, Bruce | title= क्यू पद्धति| isbn= 9781452242194 | oclc= 841672556| date= 2013-06-21 }}</ref><ref>{{cite journal |title=कारक विश्लेषण की तकनीक|journal=Nature |last=Stephenson |first=W. |volume=136 |issue=3434 |page=297 |date=August 1935 |issn=0028-0836 |doi=10.1038/136297b0|bibcode=1935Natur.136..297S |s2cid=26952603 |doi-access=free }}</ref> | ||
[[रेमंड कैटेल]] कारक विश्लेषण और साइकोमेट्रिक्स के प्रबल समर्थक थे और उन्होंने बुद्धि को समझाने के लिए थर्स्टन के बहु-कारक सिद्धांत का इस्तेमाल किया। कैटेल ने स्क्री प्लॉट और समानता गुणांक भी विकसित किया। | [[रेमंड कैटेल]] कारक विश्लेषण और साइकोमेट्रिक्स के प्रबल समर्थक थे और उन्होंने बुद्धि को समझाने के लिए थर्स्टन के बहु-कारक सिद्धांत का इस्तेमाल किया। कैटेल ने स्क्री प्लॉट और समानता गुणांक भी विकसित किया। | ||
===मनोविज्ञान में अनुप्रयोग=== | ===मनोविज्ञान में अनुप्रयोग=== | ||
कारक विश्लेषण का उपयोग उन कारकों की पहचान करने के लिए किया जाता है जो विभिन्न परीक्षणों पर विभिन्न प्रकार के परिणामों की व्याख्या करते हैं। उदाहरण के लिए, खुफिया शोध में पाया गया कि जो लोग मौखिक क्षमता के परीक्षण में उच्च अंक प्राप्त करते हैं वे अन्य परीक्षणों में भी अच्छे होते हैं जिनके लिए मौखिक क्षमताओं की आवश्यकता होती है। शोधकर्ताओं ने कारक को | कारक विश्लेषण का उपयोग उन कारकों की पहचान करने के लिए किया जाता है जो विभिन्न परीक्षणों पर विभिन्न प्रकार के परिणामों की व्याख्या करते हैं। उदाहरण के लिए, खुफिया शोध में पाया गया कि जो लोग मौखिक क्षमता के परीक्षण में उच्च अंक प्राप्त करते हैं वे अन्य परीक्षणों में भी अच्छे होते हैं जिनके लिए मौखिक क्षमताओं की आवश्यकता होती है। शोधकर्ताओं ने कारक को भिन्न करने के लिए कारक विश्लेषण का उपयोग करके इसे समझाया, जिसे अक्सर मौखिक बुद्धिमत्ता कहा जाता है, जो उस डिग्री का प्रतिनिधित्व करता है जिस तक कोई व्यक्ति मौखिक कौशल से जुड़ी समस्याओं को हल करने में सक्षम है। | ||
मनोविज्ञान में कारक विश्लेषण अक्सर खुफिया अनुसंधान से जुड़ा होता है। हालाँकि, इसका उपयोग व्यक्तित्व, दृष्टिकोण, विश्वास आदि जैसे डोमेन की विस्तृत श्रृंखला में कारकों को खोजने के लिए भी किया गया है। यह साइकोमेट्रिक्स से जुड़ा हुआ है, क्योंकि यह किसी उपकरण की वैधता का आकलन यह पता लगाकर कर सकता है कि क्या उपकरण वास्तव में अनुमानित कारकों को मापता है। | मनोविज्ञान में कारक विश्लेषण अक्सर खुफिया अनुसंधान से जुड़ा होता है। हालाँकि, इसका उपयोग व्यक्तित्व, दृष्टिकोण, विश्वास आदि जैसे डोमेन की विस्तृत श्रृंखला में कारकों को खोजने के लिए भी किया गया है। यह साइकोमेट्रिक्स से जुड़ा हुआ है, क्योंकि यह किसी उपकरण की वैधता का आकलन यह पता लगाकर कर सकता है कि क्या उपकरण वास्तव में अनुमानित कारकों को मापता है। | ||
===फायदे=== | ===फायदे=== | ||
* दो या दो से अधिक | * दो या दो से अधिक वेरिएबलों को ही कारक में संयोजित करके वेरिएबलों की संख्या में कमी करना। उदाहरण के लिए, दौड़ने, गेंद फेंकने, बल्लेबाजी, कूदने और वजन उठाने में प्रदर्शन को सामान्य एथलेटिक क्षमता जैसे कारक में जोड़ा जा सकता है। सामान्यतः, किसी आइटम द्वारा लोगों के आव्युह में, संबंधित आइटमों को समूहीकृत करके कारकों का चयन किया जाता है। क्यू कारक विश्लेषण तकनीक में, आव्युह को स्थानांतरित किया जाता है और संबंधित लोगों को समूहीकृत करके कारक बनाए जाते हैं। उदाहरण के लिए, उदारवादी, स्वतंत्रतावादी, रूढ़िवादी और समाजवादी भिन्न-भिन्न समूहों में बन सकते हैं। | ||
* अंतर-संबंधित | * अंतर-संबंधित वेरिएबलों के समूहों की पहचान करना, यह देखना कि वे एक-दूसरे से कैसे संबंधित हैं। उदाहरण के लिए, कैरोल ने अपने [[थ्री स्ट्रेटम थ्योरी]] के निर्माण के लिए कारक विश्लेषण का उपयोग किया। उन्होंने पाया कि व्यापक दृश्य धारणा नामक कारक इस बात से संबंधित है कि कोई व्यक्ति दृश्य कार्यों में कितना अच्छा है। उन्होंने श्रवण कार्य क्षमता से संबंधित व्यापक श्रवण धारणा कारक भी पाया। इसके अतिरिक्त, उन्होंने वैश्विक कारक पाया, जिसे जी या सामान्य बुद्धि कहा जाता है, जो व्यापक दृश्य धारणा और व्यापक श्रवण धारणा दोनों से संबंधित है। इसका मतलब यह है कि उच्च जी वाले व्यक्ति में उच्च दृश्य धारणा क्षमता और उच्च श्रवण धारणा क्षमता दोनों होने की संभावना है, और यह जी इस बात का अच्छा हिस्सा बताता है कि कोई व्यक्ति उन दोनों डोमेन में अच्छा या बुरा क्यों है। | ||
===नुकसान=== | ===नुकसान=== | ||
* ...प्रत्येक अभिविन्यास गणितीय रूप से समान रूप से स्वीकार्य है। लेकिन | * ...प्रत्येक अभिविन्यास गणितीय रूप से समान रूप से स्वीकार्य है। लेकिन भिन्न-भिन्न फैक्टोरियल सिद्धांत किसी दिए गए समाधान के लिए फैक्टोरियल अक्षों के झुकाव के संदर्भ में उतने ही भिन्न साबित हुए जितने कि किसी अन्य चीज़ के संदर्भ में, इसलिए मॉडल फिटिंग सिद्धांतों के मध्य अंतर करने में उपयोगी साबित नहीं हुई। (स्टर्नबर्ग, 1977<ref name=Sternberg>{{cite book |last=Sternberg |first=R. J. |title=Metaphors of Mind: Conceptions of the Nature of Intelligence |year=1977 |location=New York |publisher=Cambridge University Press |pages=85–111 }}{{Verify source|date=November 2013}}</ref>). इसका मतलब है कि सभी घुमाव भिन्न-भिन्न अंतर्निहित प्रक्रियाओं का प्रतिनिधित्व करते हैं, लेकिन सभी घुमाव मानक कारक विश्लेषण अनुकूलन के समान रूप से मान्य परिणाम हैं। इसलिए, अकेले कारक विश्लेषण का उपयोग करके उचित रोटेशन चुनना असंभव है। | ||
* कारक विश्लेषण केवल उतना ही अच्छा हो सकता है जितना डेटा अनुमति देता है। मनोविज्ञान में, जहां शोधकर्ताओं को अक्सर स्व-रिपोर्ट जैसे कम वैध और विश्वसनीय उपायों पर निर्भर रहना पड़ता है, यह समस्याग्रस्त हो सकता है। | * कारक विश्लेषण केवल उतना ही अच्छा हो सकता है जितना डेटा अनुमति देता है। मनोविज्ञान में, जहां शोधकर्ताओं को अक्सर स्व-रिपोर्ट जैसे कम वैध और विश्वसनीय उपायों पर निर्भर रहना पड़ता है, यह समस्याग्रस्त हो सकता है। | ||
* कारक विश्लेषण की व्याख्या अनुमान का उपयोग करने पर आधारित है, जो ऐसा समाधान है जो सुविधाजनक है भले ही पूरी | * कारक विश्लेषण की व्याख्या अनुमान का उपयोग करने पर आधारित है, जो ऐसा समाधान है जो सुविधाजनक है भले ही पूरी प्रकार सच न हो।<ref>{{cite web|title=कारक विश्लेषण|access-date=July 22, 2004 |url=http://comp9.psych.cornell.edu/Darlington/factor.htm |url-status=dead |archive-url=https://web.archive.org/web/20040818062948/http://comp9.psych.cornell.edu/Darlington/factor.htm |archive-date=August 18, 2004 }} | ||
</ref> ही | </ref> ही प्रकार से तथ्यांकित किए गए ही डेटा की से अधिक व्याख्याएं की जा सकती हैं, और कारक विश्लेषण कार्य-कारण की पहचान नहीं कर सकता है। | ||
==पार-सांस्कृतिक अनुसंधान में== | ==पार-सांस्कृतिक अनुसंधान में== | ||
Line 266: | Line 267: | ||
1965 के शुरुआती अध्ययन में, संबंधित सैद्धांतिक मॉडल और अनुसंधान के निर्माण, राजनीतिक प्रणालियों की तुलना करने और टाइपोलॉजिकल श्रेणियां बनाने के लिए कारक विश्लेषण के माध्यम से दुनिया भर की राजनीतिक प्रणालियों की जांच की जाती है।<ref name="gregg1965">{{Cite journal|last1=Gregg|first1=Phillip M.|last2=Banks|first2=Arthur S.|date=1965|title=Dimensions of political systems: Factor analysis of a cross-polity survey|url=|journal=American Political Science Review|series=|language=en|volume=59|issue=3|pages=602-614|doi=10.2307/1953171|issn=}}</ref> इन उद्देश्यों के लिए, इस अध्ययन में सात बुनियादी राजनीतिक आयामों की पहचान की गई है, जो विभिन्न प्रकार के राजनीतिक व्यवहार से संबंधित हैं: ये आयाम हैं पहुंच, भेदभाव, आम सहमति, अनुभागवाद, वैधीकरण, रुचि और नेतृत्व सिद्धांत और अनुसंधान। | 1965 के शुरुआती अध्ययन में, संबंधित सैद्धांतिक मॉडल और अनुसंधान के निर्माण, राजनीतिक प्रणालियों की तुलना करने और टाइपोलॉजिकल श्रेणियां बनाने के लिए कारक विश्लेषण के माध्यम से दुनिया भर की राजनीतिक प्रणालियों की जांच की जाती है।<ref name="gregg1965">{{Cite journal|last1=Gregg|first1=Phillip M.|last2=Banks|first2=Arthur S.|date=1965|title=Dimensions of political systems: Factor analysis of a cross-polity survey|url=|journal=American Political Science Review|series=|language=en|volume=59|issue=3|pages=602-614|doi=10.2307/1953171|issn=}}</ref> इन उद्देश्यों के लिए, इस अध्ययन में सात बुनियादी राजनीतिक आयामों की पहचान की गई है, जो विभिन्न प्रकार के राजनीतिक व्यवहार से संबंधित हैं: ये आयाम हैं पहुंच, भेदभाव, आम सहमति, अनुभागवाद, वैधीकरण, रुचि और नेतृत्व सिद्धांत और अनुसंधान। | ||
अन्य राजनीतिक वैज्ञानिक 1988 के राष्ट्रीय चुनाव अध्ययन में जोड़े गए चार नए प्रश्नों का उपयोग करके आंतरिक राजनीतिक प्रभावकारिता के माप का पता लगाते हैं। यहां कारक विश्लेषण का उपयोग यह पता लगाने के लिए किया जाता है कि ये आइटम बाहरी प्रभावकारिता और राजनीतिक विश्वास से | अन्य राजनीतिक वैज्ञानिक 1988 के राष्ट्रीय चुनाव अध्ययन में जोड़े गए चार नए प्रश्नों का उपयोग करके आंतरिक राजनीतिक प्रभावकारिता के माप का पता लगाते हैं। यहां कारक विश्लेषण का उपयोग यह पता लगाने के लिए किया जाता है कि ये आइटम बाहरी प्रभावकारिता और राजनीतिक विश्वास से भिन्न एकल अवधारणा को मापते हैं, और ये चार प्रश्न उस समय तक आंतरिक राजनीतिक प्रभावकारिता का सबसे अच्छा उपाय प्रदान करते हैं।<ref name="niemi1991">{{Cite journal|last1=Niemi|first1=Richard G.|last2=Craig|first2=Stephen C.|last3=Mattei|first3=Franco|date=December 1991|title=Measuring Internal Political Efficacy in the 1988 National Election Study|url=https://doi.org/10.2307/1963953|journal=American Political Science Review|series=|language=en|volume=85|issue=4|pages=1407-1413|doi=10.2307/1963953|issn=0003-0554}}</ref> संयुक्त राज्य अमेरिका के राष्ट्रपति पद की बहस, रैलियों और हिलेरी क्लिंटन ईमेल विवाद जैसे महत्वपूर्ण अभियान कार्यक्रमों के प्रभाव का अध्ययन करने के लिए| हिलेरी क्लिंटन के ईमेल विवाद, कारक विश्लेषण का उपयोग 2016 में डोनाल्ड ट्रम्प और 2012 में ओबामा जैसे अमेरिकी राष्ट्रपति पद के उम्मीदवारों के लिए लोकप्रियता के उपाय बनाने के लिए किया जाता है। लोकप्रियता कारकों को ट्विटर, फेसबुक, यूट्यूब, इंस्टाग्राम, [[पाँच अड़तीस]] और भविष्यवाणी बाजारों से एकत्र किए गए डेटा से संश्लेषित किया जाता है।<ref name="franch2021">{{Cite journal|last1=Franch|first1=Fabio|date=May 2021|title= Political preferences nowcasting with factor analysis and internet data: The 2012 and 2016 US presidential elections|url=https://doi.org/10.1016/j.techfore.2021.120667|journal=Technological Forecasting and Social Change|series=|language=en|volume=166|issue=|pages=120667|doi=10.1016/j.techfore.2021.120667|issn=0040-1625}}</ref> | ||
Line 272: | Line 273: | ||
बुनियादी कदम हैं: | बुनियादी कदम हैं: | ||
* इस श्रेणी में [[उत्पाद (व्यवसाय)]] का मूल्यांकन करने के लिए उपभोक्ताओं द्वारा उपयोग की जाने वाली मुख्य विशेषताओं की पहचान करें। | * इस श्रेणी में [[उत्पाद (व्यवसाय)]] का मूल्यांकन करने के लिए उपभोक्ताओं द्वारा उपयोग की जाने वाली मुख्य विशेषताओं की पहचान करें। | ||
* सभी उत्पाद विशेषताओं की रेटिंग के संबंध में संभावित [[ग्राहक]]ों के | * सभी उत्पाद विशेषताओं की रेटिंग के संबंध में संभावित [[ग्राहक]]ों के प्रतिरूप से डेटा एकत्र करने के लिए [[मात्रात्मक विपणन अनुसंधान]] तकनीकों (जैसे [[सांख्यिकीय सर्वेक्षण]]) का उपयोग करें। | ||
* डेटा को सांख्यिकीय कार्यक्रम में इनपुट करें और कारक विश्लेषण प्रक्रिया चलाएँ। कंप्यूटर अंतर्निहित विशेषताओं (या कारकों) का | * डेटा को सांख्यिकीय कार्यक्रम में इनपुट करें और कारक विश्लेषण प्रक्रिया चलाएँ। कंप्यूटर अंतर्निहित विशेषताओं (या कारकों) का समुच्चय उत्पन्न करेगा। | ||
* [[अवधारणात्मक मानचित्रण]] और अन्य [[ पोजिशनिंग (विपणन) |पोजिशनिंग (विपणन)]] उपकरणों के निर्माण के लिए इन कारकों का उपयोग करें। | * [[अवधारणात्मक मानचित्रण]] और अन्य [[ पोजिशनिंग (विपणन) |पोजिशनिंग (विपणन)]] उपकरणों के निर्माण के लिए इन कारकों का उपयोग करें। | ||
=== सूचना संग्रह === | === सूचना संग्रह === | ||
डेटा संग्रह चरण | डेटा संग्रह चरण सामान्यतः विपणन अनुसंधान पेशेवरों द्वारा किया जाता है। सर्वेक्षण प्रश्न उत्तरदाता से किसी उत्पाद के प्रतिरूप या उत्पाद अवधारणाओं के विवरण को विभिन्न विशेषताओं के आधार पर रेटिंग देने के लिए कहते हैं। कहीं भी पाँच से बीस विशेषताएँ चुनी जाती हैं। उनमें ये चीजें शामिल हो सकती हैं: उपयोग में आसानी, वजन, सटीकता, स्[[था]]यित्व, रंगीनता, कीमत या आकार। चुनी गई विशेषताएँ अध्ययन किए जा रहे उत्पाद के आधार पर भिन्न-भिन्न होंगी। अध्ययन में सभी उत्पादों के बारे में ही प्रश्न पूछा गया है। कई उत्पादों के डेटा को कोडित किया जाता है और आर (प्रोग्रामिंग भाषा), एसपीएसएस, [[एसएएस प्रणाली]], स्टेटा, [[आंकड़े]], जेएमपी और सिस्टैट जैसे सांख्यिकीय कार्यक्रम में इनपुट किया जाता है। | ||
=== विश्लेषण === | === विश्लेषण === | ||
विश्लेषण उन अंतर्निहित कारकों को | विश्लेषण उन अंतर्निहित कारकों को भिन्न करेगा जो एसोसिएशन के आव्युह का उपयोग करके डेटा की व्याख्या करते हैं।<ref>Ritter, N. (2012). A comparison of distribution-free and non-distribution free methods in factor analysis. Paper presented at Southwestern Educational Research Association (SERA) Conference 2012, New Orleans, LA (ED529153).</ref> कारक विश्लेषण अन्योन्याश्रय तकनीक है। अन्योन्याश्रित संबंधों के संपूर्ण समुच्चय की जांच की जाती है। आश्रित वेरिएबल , स्वतंत्र वेरिएबल , या कार्य-कारण का कोई विनिर्देश नहीं है। कारक विश्लेषण मानता है कि विभिन्न विशेषताओं पर सभी रेटिंग डेटा को कुछ महत्वपूर्ण आयामों तक कम किया जा सकता है। यह कमी इसलिए संभव है क्योंकि कुछ विशेषताएँ एक-दूसरे से संबंधित हो सकती हैं। किसी विशेषता को दी गई रेटिंग आंशिक रूप से अन्य विशेषताओं के प्रभाव का परिणाम होती है। सांख्यिकीय एल्गोरिदम रेटिंग को उसके विभिन्न घटकों में विभाजित करता है (जिसे कच्चा स्कोर कहा जाता है) और आंशिक स्कोर को अंतर्निहित कारक स्कोर में पुनर्निर्मित करता है। प्रारंभिक कच्चे स्कोर और अंतिम कारक स्कोर के मध्य सहसंबंध की डिग्री को कारक लोडिंग कहा जाता है। | ||
===फायदे=== | ===फायदे=== | ||
Line 288: | Line 289: | ||
===नुकसान=== | ===नुकसान=== | ||
* उपयोगिता उत्पाद विशेषताओं का पर्याप्त | * उपयोगिता उत्पाद विशेषताओं का पर्याप्त समुच्चय एकत्र करने की शोधकर्ताओं की क्षमता पर निर्भर करती है। यदि महत्वपूर्ण विशेषताओं को बाहर रखा जाता है या उपेक्षित किया जाता है,तब प्रक्रिया का मूल्य कम हो जाता है। | ||
* यदि देखे गए | * यदि देखे गए वेरिएबल के समुच्चय एक-दूसरे के समान हैं और अन्य वस्तुओं से भिन्न हैं,तब कारक विश्लेषण उन्हें ही कारक प्रदान करेगा। यह उन कारकों को अस्पष्ट कर सकता है जो अधिक दिलचस्प रिश्तों का प्रतिनिधित्व करते हैं। | ||
* नामकरण कारकों के लिए सिद्धांत के ज्ञान की आवश्यकता हो सकती है क्योंकि प्रतीत होता है कि भिन्न गुण अज्ञात कारणों से दृढ़ता से सहसंबद्ध हो सकते हैं। | * नामकरण कारकों के लिए सिद्धांत के ज्ञान की आवश्यकता हो सकती है क्योंकि प्रतीत होता है कि भिन्न गुण अज्ञात कारणों से दृढ़ता से सहसंबद्ध हो सकते हैं। | ||
Line 296: | Line 297: | ||
भूजल गुणवत्ता प्रबंधन में, विभिन्न रसायनों के स्थानिक वितरण को जोड़ना महत्वपूर्ण है | भूजल गुणवत्ता प्रबंधन में, विभिन्न रसायनों के स्थानिक वितरण को जोड़ना महत्वपूर्ण है | ||
विभिन्न संभावित स्रोतों के पैरामीटर, जिनके | विभिन्न संभावित स्रोतों के पैरामीटर, जिनके भिन्न-भिन्न रासायनिक हस्ताक्षर हैं। उदाहरण के लिए, सल्फाइड खदान उच्च स्तर की अम्लता, घुले हुए सल्फेट्स और संक्रमण धातुओं से जुड़ी होने की संभावना है। इन हस्ताक्षरों को आर-मोड कारक विश्लेषण के माध्यम से कारकों के रूप में पहचाना जा सकता है, और कारक स्कोर को समोच्च करके संभावित स्रोतों का स्थान सुझाया जा सकता है।<ref>{{cite journal |last1=Love |first1=D. |last2=Hallbauer |first2=D.K. |last3=Amos |first3=A. |last4=Hranova |first4=R.K. |title=Factor analysis as a tool in groundwater quality management: two southern African case studies |journal=Physics and Chemistry of the Earth |volume=29 |issue= 15–18|pages=1135–43 |year=2004 |doi=10.1016/j.pce.2004.09.027 |bibcode=2004PCE....29.1135L }}</ref> | ||
भू-रसायन विज्ञान में, विभिन्न कारक विभिन्न खनिज संघों और इस प्रकार खनिजकरण के अनुरूप हो सकते हैं।<ref>{{cite journal |last1=Barton |first1=E.S. |last2=Hallbauer |first2=D.K. |title=Trace-element and U—Pb isotope compositions of pyrite types in the Proterozoic Black Reef, Transvaal Sequence, South Africa: Implications on genesis and age |journal=Chemical Geology |volume=133 |issue= 1–4|pages=173–199 |year=1996 |doi=10.1016/S0009-2541(96)00075-7 }}</ref> | भू-रसायन विज्ञान में, विभिन्न कारक विभिन्न खनिज संघों और इस प्रकार खनिजकरण के अनुरूप हो सकते हैं।<ref>{{cite journal |last1=Barton |first1=E.S. |last2=Hallbauer |first2=D.K. |title=Trace-element and U—Pb isotope compositions of pyrite types in the Proterozoic Black Reef, Transvaal Sequence, South Africa: Implications on genesis and age |journal=Chemical Geology |volume=133 |issue= 1–4|pages=173–199 |year=1996 |doi=10.1016/S0009-2541(96)00075-7 }}</ref> | ||
==माइक्रोएरे विश्लेषण में== | ==माइक्रोएरे विश्लेषण में== | ||
[[एफिमेट्रिक्स]] जीनचिप्स के लिए जांच स्तर पर उच्च-घनत्व [[oligonucleotide]] [[डीएनए माइक्रोएरे]] डेटा को सारांशित करने के लिए कारक विश्लेषण का उपयोग किया जा सकता है। इस | [[एफिमेट्रिक्स]] जीनचिप्स के लिए जांच स्तर पर उच्च-घनत्व [[oligonucleotide]] [[डीएनए माइक्रोएरे]] डेटा को सारांशित करने के लिए कारक विश्लेषण का उपयोग किया जा सकता है। इस स्तिथियों में, अव्यक्त वेरिएबल प्रतिरूप में आरएनए एकाग्रता से मेल खाता है।<ref>{{cite journal |first1=Sepp |last1=Hochreiter |first2=Djork-Arné |last2=Clevert |first3=Klaus |last3=Obermayer |title=एफिमेट्रिक्स जांच स्तर डेटा के लिए एक नई सारांशीकरण विधि|journal=Bioinformatics |volume=22 |issue=8 |pages=943–9 |year=2006 |pmid=16473874 |doi=10.1093/bioinformatics/btl033 |doi-access=free }}</ref> | ||
Revision as of 10:31, 3 August 2023
कारक विश्लेषण सांख्यिकी पद्धति है जिसका उपयोग प्रेक्षित, सहसंबद्ध वेरिएबल (गणित) के मध्य विचरण का वर्णन करने के लिए संभावित रूप से कम संख्या में न देखे गए वेरिएबल के संदर्भ में किया जाता है जिन्हें कारक कहा जाता है। उदाहरण के लिए, यह संभव है कि छह देखे गए वेरिएबलों में भिन्नताएं मुख्य रूप से दो न देखे गए (अंतर्निहित) वेरिएबलों में भिन्नताएं दर्शाती हैं। कारक विश्लेषण न देखे गए अव्यक्त वेरिएबलों की प्रतिक्रिया में ऐसी संयुक्त विविधताओं की खोज करता है। इसको देखे गए वेरिएबल के आंकड़ों के संदर्भ में संभावित कारकों और त्रुटियों और अवशेषों के रैखिक संयोजन के रूप में तैयार किया गया है, इसलिए कारक विश्लेषण को वेरिएबल-में-त्रुटि मॉडल के विशेष स्तिथियों के रूप में माना जा सकता है। [1] सीधे शब्दों में कहेंतब, किसी वेरिएबल का फैक्टर लोडिंग उस सीमा को निर्धारित करता है, जिस सीमा तक वेरिएबल किसी दिए गए फैक्टर से संबंधित होता है। [2]
कारक विश्लेषणात्मक विधियों के पीछे सामान्य तर्क यह है कि देखे गए वेरिएबल के मध्य अन्योन्याश्रितताओं के बारे में प्राप्त जानकारी का उपयोग और इसके पश्चात में डेटासमुच्चय में वेरिएबल के समुच्चय को कम करने के लिए किया जा सकता है। कारक विश्लेषण का उपयोग सामान्यतः साइकोमेट्रिक्स, व्यक्तित्व मनोविज्ञान, जीव विज्ञान, विपणन, उत्पाद प्रबंधन, संचालन अनुसंधान, वित्त और यंत्र अधिगम में किया जाता है। यह उन डेटा समुच्चयों से निपटने में सहायता कर सकता है जहां बड़ी संख्या में देखे गए वेरिएबल हैं जो अंतर्निहित/अव्यक्त वेरिएबल की लघु संख्या को प्रतिबिंबित करते हैं। यह सबसे अधिक उपयोग की जाने वाली अंतर-निर्भरता तकनीकों में से है और इसका उपयोग तब किया जाता है जब वेरिएबल का प्रासंगिक समुच्चय व्यवस्थित अंतर-निर्भरता दिखाता है और इसका उद्देश्य उन अव्यक्त कारकों का पता लगाना है जो समानता बनाते हैं।
सांख्यिकीय मॉडल
परिभाषा
मॉडल प्रत्येक व्यक्तियों में सामान्य कारकों के समुच्चय के साथ अवलोकनों के समुच्चय को समझाने का प्रयास करता है, जहां प्रति इकाई अवलोकनों की तुलना में प्रति इकाई कम कारक होते हैं। प्रत्येक व्यक्ति के समीप अपने स्वयं के सामान्य कारक होते हैं, और ये एकल अवलोकन के लिए, कारक लोडिंग आव्युह के माध्यम से अवलोकनों से संबंधित होते हैं।
जहाँ
- वें व्यक्ति के वें अवलोकन का मान है,
- वें अवलोकन के लिए अवलोकन माध्य है,
- वें कारक के वें अवलोकन के लिए लोडिंग है,
- वें व्यक्ति के वें कारक का मान है, और
- माध्य शून्य और परिमित विचरण के साथ वां अवलोकित स्टोकेस्टिक त्रुटि शब्द है।
आव्युह नोटेशन में
जहां अवलोकन आव्यूह , लोडिंग आव्यूह , फैक्टर आव्यूह , त्रुटि टर्म आव्यूह और माध्य आव्यूह है, जिससे वां अवयव सिर्फ है।
इसके अतिरिक्त हम निम्नलिखित धारणाएँ भी लागू करेंगे :
- और स्वतंत्र हैं.
- ; जहां अपेक्षा है
- जहाँ सहप्रसरण आव्युह है, यह सुनिश्चित करने के लिए कि कारक असंबंधित हैं, और पहचान आव्युह है.
कल्पना करना . तब
और इसलिए, लगाई गई शर्तों 1 और 2 से ऊपर, और , देना
या, समुच्चयिंग ,
ध्यान दें कि किसी भी ऑर्थोगोनल आव्युह के लिए,यदि और और हम अगर हम समुच्चय करते हैं तब कारक और कारक लोडिंग के मानदंड अभी भी दृढ़ हैं। इसलिए कारकों और कारक लोडिंग का समुच्चय केवल ऑर्थोगोनल परिवर्तन तक अद्वितीय है।
उदाहरण
मान लीजिए कि मनोवैज्ञानिक की परिकल्पना है कि बुद्धि (विशेषता) दो प्रकार की होती है, मौखिक बुद्धि और गणितीय बुद्धि, जिनमें से कोई भी प्रत्यक्ष रूप से नहीं देखी जाती है। इसमें 1000 छात्रों के 10 भिन्न-भिन्न शैक्षणिक क्षेत्रों में से प्रत्येक के परीक्षा अंकों में परिकल्पना के साक्ष्य मांगे गए हैं। यदि प्रत्येक छात्र को बड़ी आपश्चाती (सांख्यिकी) से यादृच्छिक रूप से चुना जाता है,तब प्रत्येक छात्र के 10 अंक यादृच्छिक वेरिएबल होते हैं। मनोवैज्ञानिक की परिकल्पना कह सकती है कि 10 अकादमिक क्षेत्रों में से प्रत्येक के लिए, उन सभी छात्रों के समूह पर औसत स्कोर जो मौखिक और गणितीय बुद्धि के लिए मूल्यों की कुछ सामान्य जोड़ी साझा करते हैं, कुछ स्थिरांक (गणित) उनकी मौखिक बुद्धि के स्तर का यह अनेक गुना होता है और अन्य स्थिरांक उनके गणितीय बुद्धि के स्तर का अनेक गुना है, अथार्त, यह उन दो कारकों का रैखिक संयोजन है। किसी विशेष विषय के लिए संख्याएँ होती हैं, जिनके द्वारा अपेक्षित स्कोर प्राप्त करने के लिए दो प्रकार की बुद्धिमत्ता को गुणा किया जाता है, परिकल्पना द्वारा सभी बुद्धिमत्ता स्तर के जोड़े के लिए समान मानी जाती हैं, और इस विषय के लिए कारक लोडिंग कहलाती हैं। उदाहरण के लिए, परिकल्पना यह मान सकती है कि खगोल विज्ञान के क्षेत्र में अनुमानित औसत छात्र की योग्यता है
- {10 × छात्र की मौखिक बुद्धि} + {6 × छात्र की गणितीय बुद्धि}।
संख्या 10 और 6 खगोल विज्ञान से जुड़े कारक लोडिंग हैं। अन्य शैक्षणिक विषयों में भिन्न-भिन्न कारक लोड हो सकते हैं।
ऐसा माना जाता है कि मौखिक और गणितीय बुद्धि की समान डिग्री वाले दो छात्रों की खगोल विज्ञान में भिन्न-भिन्न मापी गई योग्यताएं हो सकती हैं क्योंकि व्यक्तिगत योग्यताएं औसत योग्यताओं (ऊपर अनुमानित) से भिन्न होती हैं और इसमें माप त्रुटि के कारण ही भिन्न होती हैं। इस प्रकार के मतभेदों को सामूहिक रूप से त्रुटि कहा जाता है - सांख्यिकीय शब्द जिसका अर्थ है वह मात्रा जिसके द्वारा किसी व्यक्ति को मापा जाता है, जो उसकी बुद्धिमत्ता के स्तर के लिए औसत या अनुमानित से भिन्न होता है (आंकड़ों में त्रुटियां और अवशेष देखें)।
कारक विश्लेषण में जाने वाला अवलोकन योग्य डेटा 1000 छात्रों में से प्रत्येक के 10 अंक, कुल 10,000 नंबर होंते हैं। डेटा से प्रत्येक छात्र की दो प्रकार की बुद्धि के कारक लोडिंग और स्तर का अनुमान लगाया जाना चाहिए।
उसी उदाहरण का गणितीय मॉडल
निम्नलिखित में, आव्युह को अनुक्रमित वेरिएबल द्वारा दर्शाया जाएगा। "विषय" सूचकांकों को अक्षर , और ,का उपयोग करके दर्शाया जाएगा, जिसमें मान से तक चलेंगे जो उपरोक्त उदाहरण में के सामान्य है। "कारक" सूचकांकों को अक्षर , और का उपयोग करके दर्शाया जाएगा, जिसका मान से तक होगा जो उपरोक्त उदाहरण में के सामान्य है। "उदाहरण" या "प्रतिरूप" सूचकांकों को , और अक्षरों का उपयोग करके दर्शाया जाएगा, जिसमें मान से तक चलेंगे। उपरोक्त उदाहरण में, यदि छात्रों के प्रतिरूप ने परीक्षाओं में भाग लिया, तब परीक्षा के लिए छात्र का स्कोर द्वारा दिया गया है। कारक विश्लेषण का उद्देश्य चर के मध्य सहसंबंधों को चिह्नित करना है, जिनमें से विशेष उदाहरण, या अवलोकनों का समुच्चय है। वेरिएबलों को समान स्तर पर रखने के लिए, उन्हें मानक स्कोर में सामान्यीकरण (सांख्यिकी किया जाता है |
जहां प्रतिरूप माध्य है:
और प्रतिरूप विचरण इस प्रकार दिया गया है:
इस विशेष प्रतिरूप के लिए कारक विश्लेषण मॉडल तब है:
या, अधिक संक्षेप में:
जहाँ
- ,वें छात्र की मौखिक बुद्धि है,
- ,वें छात्र की गणितीय बुद्धि हैं,
- ,वें विषय, के लिए के लिए कारक लोडिंग हैं।
आव्युह (गणित) नोटेशन में, हमारे समीप है
उस मापदंड को दोगुना करके देखें जिस पर मौखिक बुद्धिमत्ता - प्रत्येक कॉलम में पहला घटक है मापा जाता है, और साथ ही मौखिक बुद्धिमत्ता के लिए कारक लोडिंग को आधा करने से मॉडल पर कोई भिन्नता नहीं दिखाई पड़ती है। इस प्रकार, यह मानने से कोई व्यापकता नहीं खोती है कि मौखिक बुद्धि के लिए कारकों का मानक विचलन है | इसी प्रकार गणितीय बुद्धि के लिए भी हैं इसके अतिरिक्त, समान कारणों से, यह मानने से कोई व्यापकता विलुप्त नहीं है कि दोनों कारक एक-दूसरे से असंबद्ध हैं। दूसरे शब्दों में:
जहाँ क्रोनकर डेल्टा है और ( जब और जब ).त्रुटियों को कारकों से स्वतंत्र माना जाता है:
ध्यान दें, चूँकि किसी समाधान का कोई भी घुमाव भी समाधान है, इससे कारकों की व्याख्या करना कठिन हो जाता है। नीचे नुकसान देखें. इस विशेष उदाहरण में, यदि हम पहले से नहीं जानते हैं कि दो प्रकार की बुद्धि असंबद्ध हैं,तब हम दो कारकों की दो भिन्न-भिन्न प्रकार की बुद्धि के रूप में व्याख्या नहीं कर सकते हैं। भले ही वे असंबंधित हों, हम बिना किसी बाहरी तर्क के यह नहीं बता सकते कि कौन सा कारक मौखिक बुद्धि से मेल खाता है और कौन सा गणितीय बुद्धि से मेल खाता है।
लोडिंग का मान , औसत , और त्रुटियों की भिन्नताएँ प्रेक्षित डेटा को देखते हुए अनुमान लगाया जाना चाहिए और (कारकों के स्तर के बारे में धारणा किसी दिए गए के लिए तय की गई है ). मौलिक प्रमेय उपरोक्त शर्तों से प्राप्त किया जा सकता है:
बाईं ओर का शब्द है -सहसंबंध आव्युह की अवधि (ए के उत्पाद के रूप में प्राप्त आव्युह देखे गए डेटा के स्थानान्तरण के साथ मानकीकृत अवलोकनों का आव्युह, और इसका विकर्ण अवयव होंगे एस। दाईं ओर दूसरा पद विकर्ण आव्युह होगा जिसमें इकाई से कम पद होंगे। दाईं ओर पहला पद कम सहसंबंध आव्युह है और इसके विकर्ण मानों को छोड़कर सहसंबंध आव्युह के सामान्य होगा जो एकता से कम होगा। कम सहसंबंध आव्युह के इन विकर्ण अवयवों को सांप्रदायिकताएं कहा जाता है (जो कि देखे गए वेरिएबल में भिन्नता के अंश का प्रतिनिधित्व करते हैं जो कारकों के कारण होता है):
प्रतिरूप डेटा प्रतिरूपकरण त्रुटियों, मॉडल की अपर्याप्तता आदि के कारण ऊपर दिए गए मौलिक समीकरण का बिल्कुल पालन नहीं किया जाएगा। उपरोक्त मॉडल के किसी भी विश्लेषण का लक्ष्य कारकों का पता लगाना है और लोडिंग जो डेटा को सर्वोत्तम रूप से फिट करता है। कारक विश्लेषण में, सर्वोत्तम फिट को सहसंबंध आव्युह के ऑफ-विकर्ण अवशेषों में न्यूनतम माध्य वर्ग त्रुटि के रूप में परिभाषित किया गया है:[3]
यह त्रुटि सहप्रसरण के ऑफ-विकर्ण घटकों को कम करने के सामान्य है, जिसमें मॉडल समीकरणों में शून्य के अपेक्षित मान होते हैं। इसकी तुलना प्रमुख घटक विश्लेषण से की जानी चाहिए जो सभी अवशेषों की माध्य वर्ग त्रुटि को कम करने का प्रयास करता है।[3]हाई-स्पीड कंप्यूटर के आगमन से पहले, समस्या के अनुमानित समाधान खोजने के लिए काफी प्रयास किए गए थे, विशेष रूप से अन्य विधियों से सांप्रदायिकताओं का अनुमान लगाने में, जो तब ज्ञात कम सहसंबंध आव्युह उत्पन्न करके समस्या को काफी सरल बनाता है। इसके पश्चात कारकों और लोडिंग का अनुमान लगाने के लिए इसका उपयोग किया गया। हाई-स्पीड कंप्यूटर के आगमन के साथ, न्यूनतमकरण की समस्या को पर्याप्त गति के साथ पुनरावृत्त रूप से हल किया जा सकता है, और सामुदायिकताओं की गणना पहले से आवश्यक होने के बजाय प्रक्रिया में की जाती है। सामान्यीकृत न्यूनतम अवशिष्ट विधि एल्गोरिथ्म इस समस्या के लिए विशेष रूप से उपयुक्त है, लेकिन समाधान खोजने का शायद ही यह एकमात्र पुनरावृत्त साधन है।
यदि समाधान कारकों को सहसंबंधित करने की अनुमति दी जाती है (उदाहरण के लिए 'ओब्लिमिन' रोटेशन में),तब संबंधित गणितीय मॉडल ऑर्थोगोनल निर्देशांक के बजाय तिरछा निर्देशांक का उपयोग करता है।
ज्यामितीय व्याख्या
कारक विश्लेषण के मापदंडों और वेरिएबल को ज्यामितीय व्याख्या दी जा सकती है। आंकड़ा (), कारक () और त्रुटियाँ () को वेक्टर के रूप में देखा जा सकता है -आयामी यूक्लिडियन स्पेस (प्रतिरूप स्थान), के रूप में दर्शाया गया है , और क्रमश। चूँकि डेटा मानकीकृत है, डेटा वेक्टर इकाई लंबाई के हैं (). कारक सदिश को परिभाषित करते हैं इस स्थान में -आयामी रैखिक उपस्थान (अथार्त हाइपरप्लेन), जिस पर डेटा वैक्टर को ऑर्थोगोनल रूप से प्रक्षेपित किया जाता है। यह मॉडल समीकरण से निम्नानुसार है
और कारकों और त्रुटियों की स्वतंत्रता: . उपरोक्त उदाहरण में, हाइपरप्लेन केवल दो कारक वैक्टर द्वारा परिभाषित 2-आयामी विमान है। हाइपरप्लेन पर डेटा वैक्टर का प्रक्षेपण इसके द्वारा दिया गया है
और त्रुटियाँ उस अनुमानित बिंदु से डेटा बिंदु तक वेक्टर हैं और हाइपरप्लेन के लंबवत हैं। कारक विश्लेषण का लक्ष्य हाइपरप्लेन ढूंढना है जो कुछ अर्थों में डेटा के लिए सबसे उपयुक्त है, इसलिए इससे कोई भिन्नता नहीं पड़ता कि इस हाइपरप्लेन को परिभाषित करने वाले कारक वैक्टर को कैसे चुना जाता है, जब तक कि वे स्वतंत्र हैं और हाइपरप्लेन में स्थित हैं। हम उन्हें ऑर्थोगोनल और सामान्य दोनों के रूप में निर्दिष्ट करने के लिए स्वतंत्र हैं () व्यापकता की हानि के बिना। कारकों का उपयुक्त समुच्चय पाए जाने के पश्चात, उन्हें हाइपरप्लेन के भीतर मनमाने ढंग से घुमाया जा सकता है, ताकि कारक वैक्टर का कोई भी घुमाव उसी हाइपरप्लेन को परिभाषित करेगा, और समाधान भी होगा। परिणामस्वरूप, उपरोक्त उदाहरण में, जिसमें फिटिंग हाइपरप्लेन दो आयामी है, यदि हम पहले से नहीं जानते हैं कि दो प्रकार की बुद्धि असंबंधित हैं,तब हम दो कारकों की दो भिन्न-भिन्न प्रकार की बुद्धि के रूप में व्याख्या नहीं कर सकते हैं। भले ही वे असंबंधित हों, हम बिना किसी बाहरी तर्क के यह नहीं बता सकते कि कौन सा कारक मौखिक बुद्धि से मेल खाता है और कौन सा गणितीय बुद्धि से मेल खाता है, या क्या कारक दोनों का रैखिक संयोजन हैं।
डेटा वैक्टर इकाई लंबाई है. डेटा के लिए सहसंबंध आव्युह की प्रविष्टियाँ दी गई हैं . सहसंबंध आव्युह को ज्यामितीय रूप से दो डेटा वैक्टर के मध्य के कोण के कोसाइन के रूप में व्याख्या किया जा सकता है और . विकर्ण अवयव स्पष्ट रूप से होंगे s और ऑफ विकर्ण अवयवों का निरपेक्ष मान एकता से कम या उसके सामान्य होगा। घटे हुए सहसंबंध आव्युह को इस प्रकार परिभाषित किया गया है
- .
कारक विश्लेषण का लक्ष्य फिटिंग हाइपरप्लेन का चयन करना है, ताकि सहसंबंध आव्युह के विकर्ण अवयवों को छोड़कर, कम सहसंबंध आव्युह सहसंबंध आव्युह को यथासंभव पुन: उत्पन्न कर सके, जिन्हें इकाई मान के रूप में जाना जाता है। दूसरे शब्दों में, लक्ष्य डेटा में क्रॉस-सहसंबंधों को यथासंभव सटीक रूप से पुन: पेश करना है। विशेष रूप से, फिटिंग हाइपरप्लेन के लिए, ऑफ-विकर्ण घटकों में माध्य वर्ग त्रुटि
इसे न्यूनतम किया जाना है, और इसे ऑर्थोनॉर्मल फैक्टर वैक्टर के समुच्चय के संबंध में इसे कम करके पूरा किया जाता है। यह देखा जा सकता है
दाईं ओर का शब्द केवल त्रुटियों का सहप्रसरण है। मॉडल में, त्रुटि सहप्रसरण को विकर्ण आव्युह कहा गया है और इसलिए उपरोक्त न्यूनतमकरण समस्या वास्तव में मॉडल के लिए सबसे उपयुक्त होगी: यह त्रुटि सहप्रसरण का प्रतिरूप अनुमान प्राप्त करेगी जिसके ऑफ-विकर्ण घटकों को औसत वर्ग अर्थ में न्यूनतम किया गया है। यह देखा जा सकता है कि जब से डेटा वेक्टर के ऑर्थोगोनल प्रक्षेपण हैं, उनकी लंबाई अनुमानित डेटा वेक्टर की लंबाई से कम या उसके सामान्य होगी, जो कि एकता है। इन लंबाइयों का वर्ग कम सहसंबंध आव्युह के विकर्ण अवयव मात्र हैं। कम सहसंबंध आव्युह के इन विकर्ण अवयवों को सांप्रदायिकता के रूप में जाना जाता है:
समुदायों के बड़े मूल्य यह संकेत देंगे कि फिटिंग हाइपरप्लेन सहसंबंध आव्युह को सटीक रूप से पुन: प्रस्तुत कर रहा है। कारकों के माध्य मानों को भी शून्य होने के लिए बाध्य किया जाना चाहिए, जिससे यह निष्कर्ष निकलता है कि त्रुटियों का माध्य मान भी शून्य होगा।
व्यावहारिक कार्यान्वयन
कारक विश्लेषण के प्रकार
खोजपूर्ण कारक विश्लेषण
खोजपूर्ण कारक विश्लेषण (ईएफए) का उपयोग उन वस्तुओं और समूह वस्तुओं के मध्य जटिल अंतर्संबंधों की पहचान करने के लिए किया जाता है जो एकीकृत अवधारणाओं का हिस्सा हैं।[4] शोधकर्ता कारकों के मध्य संबंधों के बारे में कोई पूर्व धारणा नहीं बनाता है।[4]
पुष्टि कारक विश्लेषण
पुष्टिकरण कारक विश्लेषण (सीएफए) अधिक जटिल दृष्टिकोण है जो इस परिकल्पना का परीक्षण करता है कि आइटम विशिष्ट कारकों से जुड़े हैं।[4]सीएफए माप मॉडल का परीक्षण करने के लिए संरचनात्मक समीकरण मॉडलिंग का उपयोग करता है जिससे कारकों पर लोड करने से देखे गए वेरिएबल और न देखे गए वेरिएबल के मध्य संबंधों के मूल्यांकन की अनुमति मिलती है।[4] संरचनात्मक समीकरण मॉडलिंग दृष्टिकोण माप त्रुटि को समायोजित कर सकते हैं और न्यूनतम-वर्ग अनुमान की तुलना में कम प्रतिबंधात्मक हैं।[4] परिकल्पित मॉडल का परीक्षण वास्तविक डेटा के विरुद्ध किया जाता है, और विश्लेषण अव्यक्त वेरिएबल (कारकों) पर देखे गए वेरिएबल के लोडिंग के साथ-साथ अव्यक्त वेरिएबल के मध्य सहसंबंध को प्रदर्शित करेगा।[4]
कारक निष्कर्षण के प्रकार
प्रमुख घटक विश्लेषण (पीसीए) कारक निष्कर्षण के लिए व्यापक रूप से उपयोग की जाने वाली विधि है, जो ईएफए का पहला चरण है।[4]अधिकतम संभावित विचरण निकालने के लिए कारक भार की गणना की जाती है, क्रमिक फैक्टरिंग तब तक जारी रहती है जब तक कि कोई और सार्थक विचरण नहीं बचा हो।[4]फिर विश्लेषण के लिए कारक मॉडल को घुमाया जाना चाहिए।[4]
कैनोनिकल फैक्टर विश्लेषण, जिसे राव की कैनोनिकल फैक्टरिंग भी कहा जाता है, पीसीए के समान मॉडल की गणना करने की भिन्न विधि है, जो प्रमुख अक्ष विधि का उपयोग करती है। विहित कारक विश्लेषण उन कारकों की तलाश करता है जिनका प्रेक्षित वेरिएबल के साथ उच्चतम विहित सहसंबंध होता है। विहित कारक विश्लेषण डेटा के मनमाने पुनर्स्केलिंग से अप्रभावित रहता है।
सामान्य कारक विश्लेषण, जिसे प्रमुख कारक विश्लेषण (पीएफए) या प्रमुख अक्ष फैक्टरिंग (पीएएफ) भी कहा जाता है, सबसे कम कारकों की तलाश करता है जो वेरिएबल के समुच्चय के सामान्य विचरण (सहसंबंध) के लिए जिम्मेदार हो सकते हैं।
छवि फैक्टरिंग वास्तविक वेरिएबल के बजाय अनुमानित वेरिएबल के सहसंबंध आव्युह पर आधारित है, जहां प्रत्येक वेरिएबल की भविष्यवाणी कई प्रतिगमन का उपयोग करके दूसरों से की जाती है।
अल्फा फैक्टरिंग कारकों की विश्वसनीयता को अधिकतम करने पर आधारित है, यह मानते हुए कि वेरिएबल को वेरिएबल के ब्रह्मांड से यादृच्छिक रूप से प्रतिरूप लिया जाता है। अन्य सभी विधियाँ यह मानती हैं कि मामलों को प्रतिरूपकृत किया गया है और वेरिएबलों को निश्चित किया गया है।
कारक प्रतिगमन मॉडल कारक मॉडल और प्रतिगमन मॉडल का संयोजन मॉडल है; या वैकल्पिक रूप से, इसे हाइब्रिड कारक मॉडल के रूप में देखा जा सकता है,[5] जिनके कारक आंशिक रूप से ज्ञात हैं।
शब्दावली
- फैक्टर लोडिंग
- सामुदायिकता किसी वस्तु की मानकीकृत बाहरी लोडिंग का वर्ग है। पियर्सन का आर-वर्ग के अनुरूप, वर्ग कारक लोडिंग कारक द्वारा समझाए गए उस संकेतक चर में भिन्नता का प्रतिशत है। प्रत्येक कारक के हिसाब से सभी चर में भिन्नता का प्रतिशत प्राप्त करने के लिए, उस कारक (स्तंभ) के लिए वर्ग कारक लोडिंग का योग जोड़ें और चर की संख्या से विभाजित करें। (ध्यान दें कि चरों की संख्या उनके प्रसरणों के योग के बराबर होती है क्योंकि एक मानकीकृत चर का प्रसरण 1 होता है।) यह कारक के eigenvalue को चरों की संख्या से विभाजित करने के समान है। व्याख्या करते समय, पुष्टिकारक कारक विश्लेषण में अंगूठे के एक नियम के अनुसार, कारक लोडिंग .7 या उच्चतर होनी चाहिए ताकि यह पुष्टि की जा सके कि प्राथमिकता से पहचाने गए स्वतंत्र चर एक विशेष कारक द्वारा दर्शाए जाते हैं, इस तर्क पर कि .7 स्तर मेल खाता है संकेतक में लगभग आधे विचरण को कारक द्वारा समझाया जा रहा है। हालाँकि, .7 मानक एक उच्च है और वास्तविक जीवन का डेटा इस मानदंड को पूरा नहीं कर सकता है, यही कारण है कि कुछ शोधकर्ता, विशेष रूप से खोजपूर्ण उद्देश्यों के लिए, निचले स्तर का उपयोग करेंगे जैसे कि केंद्रीय कारक के लिए .4 और .25 के लिए। अन्य कारक। किसी भी घटना में, कारक लोडिंग की व्याख्या सिद्धांत के आलोक में की जानी चाहिए, न कि मनमाने कटऑफ स्तरों के आधार पर। तिरछा रोटेशन में, कोई पैटर्न मैट्रिक्स और संरचना मैट्रिक्स दोनों की जांच कर सकता है। संरचना मैट्रिक्स केवल ऑर्थोगोनल रोटेशन के रूप में कारक लोडिंग मैट्रिक्स है, जो एक अद्वितीय और सामान्य योगदान के आधार पर एक कारक द्वारा समझाए गए मापा चर में भिन्नता का प्रतिनिधित्व करता है। इसके विपरीत, पैटर्न मैट्रिक्स में गुणांक होते हैं जो अद्वितीय योगदान का प्रतिनिधित्व करते हैं। जितने अधिक कारक होंगे, एक नियम के रूप में पैटर्न गुणांक उतना ही कम होगा क्योंकि विचरण में अधिक सामान्य योगदान समझाया जाएगा। तिरछे घुमाव के लिए, शोधकर्ता किसी कारक को लेबल देते समय संरचना और पैटर्न गुणांक दोनों को देखता है। तिरछे घूर्णन के सिद्धांतों को क्रॉस एन्ट्रॉपी और इसकी दोहरी एन्ट्रॉपी दोनों से प्राप्त किया जा सकता है.[6]
- समुदाय
- किसी दिए गए चर (पंक्ति) के लिए सभी कारकों के वर्गांकित कारक लोडिंग का योग उस चर में सभी कारकों के कारण होने वाला विचरण है। सामुदायिकता सभी कारकों द्वारा संयुक्त रूप से समझाए गए किसी दिए गए चर में भिन्नता के प्रतिशत को मापती है और इसे प्रस्तुत किए गए कारकों के संदर्भ में संकेतक की विश्वसनीयता के रूप में व्याख्या किया जा सकता है।
- नकली समाधान
- यदि सामुदायिकता 1.0 से अधिक है, तो एक नकली समाधान है, जो बहुत छोटे नमूने या बहुत अधिक या बहुत कम कारकों को निकालने के विकल्प को प्रतिबिंबित कर सकता है।
- Uniqueness of a variable
- The variability of a variable minus its communality.
- Eigenvalues/characteristic roots
- Eigenvalues measure the amount of variation in the total sample accounted for by each factor. The ratio of eigenvalues is the ratio of explanatory importance of the factors with respect to the variables. If a factor has a low eigenvalue, then it is contributing little to the explanation of variances in the variables and may be ignored as less important than the factors with higher eigenvalues.
- Extraction sums of squared loadings
- Initial eigenvalues and eigenvalues after extraction (listed by SPSS as "Extraction Sums of Squared Loadings") are the same for PCA extraction, but for other extraction methods, eigenvalues after extraction will be lower than their initial counterparts. SPSS also prints "Rotation Sums of Squared Loadings" and even for PCA, these eigenvalues will differ from initial and extraction eigenvalues, though their total will be the same.
- Factor scores
- Component scores (in PCA)
- Template:Ghat The scores of each case (row) on each factor (column). To compute the factor score for a given case for a given factor, one takes the case's standardized score on each variable, multiplies by the corresponding loadings of the variable for the given factor, and sums these products. Computing factor scores allows one to look for factor outliers. Also, factor scores may be used as variables in subsequent modeling.
कारकों की संख्या निर्धारित करने के लिए मानदंड
शोधकर्ता कारक प्रतिधारण के लिए ऐसे व्यक्तिपरक या मनमाने मानदंडों से बचना चाहते हैं क्योंकि यह मेरे लिए समझ में आता है। इस समस्या को हल करने के लिए कई वस्तुनिष्ठ विधियों विकसित किए गए हैं, जो उपयोगकर्ताओं को जांच के लिए समाधानों की उचित श्रृंखला निर्धारित करने की अनुमति देते हैं।[7] हालाँकि ये भिन्न-भिन्न विधियाँ अक्सर एक-दूसरे से असहमत होती हैं कि कितने कारकों को बरकरार रखा जाना चाहिए। उदाहरण के लिए, समानांतर विश्लेषण 5 कारकों का सुझाव दे सकता है जबकि वेलिसर का एमएपी 6 का सुझाव देता है, इसलिए शोधकर्ता 5 और 6-कारक समाधान दोनों का अनुरोध कर सकता है और बाहरी डेटा और सिद्धांत के संबंध में प्रत्येक पर चर्चा कर सकता है।
आधुनिक मानदंड
हॉर्न का समानांतर विश्लेषण (पीए):[8] मोंटे-कार्लो आधारित सिमुलेशन विधि जो देखे गए स्वदेशी मूल्यों की तुलना असंबद्ध सामान्य वेरिएबल से प्राप्त मूल्यों से करती है। कारक या घटक को बरकरार रखा जाता है यदि संबंधित आइगेनवैल्यू यादृच्छिक डेटा से प्राप्त आइजेनवैल्यू के वितरण के 95वें प्रतिशतक से बड़ा है। बनाए रखने के लिए घटकों की संख्या निर्धारित करने के लिए पीए अधिक सामान्यतः अनुशंसित नियमों में से है,[7][9] लेकिन कई प्रोग्राम इस विकल्प को शामिल करने में विफल रहते हैं (एक उल्लेखनीय अपवाद आर (प्रोग्रामिंग भाषा) है)।[10] हालाँकि, एंटोन फॉर्मैन ने सैद्धांतिक और अनुभवजन्य दोनों साक्ष्य प्रदान किए कि इसका अनुप्रयोग कई मामलों में उचित नहीं हो सकता है क्योंकि इसका प्रदर्शन प्रतिरूप आकार, आइटम प्रतिक्रिया सिद्धांत # आइटम प्रतिक्रिया फ़ंक्शन और सहसंबंध गुणांक के प्रकार से काफी प्रभावित होता है।[11] वेलिसर (1976) एमएपी परीक्षण[12] जैसा कि कर्टनी द्वारा वर्णित है (2013)[13] "इसमें पूर्ण प्रमुख घटक विश्लेषण शामिल है जिसके पश्चात आंशिक सहसंबंधों के आव्युह की श्रृंखला की जांच की जाती है" (पृष्ठ 397 (हालांकि ध्यान दें कि यह उद्धरण वेलिसर (1976) में नहीं होता है और उद्धृत पृष्ठ संख्या उद्धरण के पृष्ठों के बाहर है)। चरण "0" के लिए वर्ग सहसंबंध (चित्र 4 देखें) अपूर्ण सहसंबंध आव्युह के लिए औसत वर्ग-विकर्ण सहसंबंध है। चरण 1 पर, पहले प्रमुख घटक और उससे संबंधित वस्तुओं को आंशिक रूप से हटा दिया जाता है। इसके पश्चात, पश्चात के सहसंबंध आव्युह के लिए औसत वर्ग-विकर्ण सहसंबंध की गणना चरण 1 के लिए की जाती है। चरण 2 पर, पहले दो प्रमुख घटकों को आंशिक रूप से हटा दिया जाता है और परिणामी औसत वर्ग-विकर्ण सहसंबंध की फिर से गणना की जाती है। गणना k शून्य से चरण के लिए की जाती है (k आव्युह में वेरिएबल की कुल संख्या का प्रतिनिधित्व करता है)। इसके पश्चात, प्रत्येक चरण के लिए सभी औसत वर्ग सहसंबंधों को पंक्तिबद्ध किया जाता है और विश्लेषण में चरण संख्या जिसके परिणामस्वरूप सबसे कम औसत वर्ग आंशिक सहसंबंध होता है, घटकों की संख्या निर्धारित करता है या बनाए रखने के लिए कारक।[12]इस विधि द्वारा, घटकों को तब तक बनाए रखा जाता है जब तक सहसंबंध आव्युह में भिन्नता अवशिष्ट या त्रुटि भिन्नता के विपरीत व्यवस्थित भिन्नता का प्रतिनिधित्व करती है। यद्यपि पद्धतिगत रूप से प्रमुख घटक विश्लेषण के समान, एमएपी तकनीक को कई सिमुलेशन अध्ययनों में बनाए रखने के लिए कारकों की संख्या निर्धारित करने में काफी अच्छा प्रदर्शन करते दिखाया गया है।[7][14][15][16] यह प्रक्रिया SPSS के उपयोगकर्ता इंटरफ़ेस के माध्यम से उपलब्ध कराई गई है,[13]साथ ही आर (प्रोग्रामिंग भाषा) के लिए मनोवैज्ञानिक पैकेज।[17][18]
पुराने विधियों
कैसर मानदंड: कैसर नियम 1.0 के तहत eigenvalues के साथ सभी घटकों को छोड़ने के लिए है - यह औसत एकल आइटम द्वारा दर्ज की गई जानकारी के सामान्य eigenvalue है।[19] एसपीएसएस और अधिकांश सांख्यिकीय सॉफ़्टवेयर में कैसर मानदंड डिफ़ॉल्ट है, लेकिन कारकों की संख्या का अनुमान लगाने के लिए एकमात्र कट-ऑफ मानदंड के रूप में उपयोग किए जाने पर इसकी अनुशंसा नहीं की जाती है क्योंकि यह कारकों को अधिक निकालने की प्रवृत्ति रखता है।[20] इस पद्धति का रूपांतर तैयार किया गया है जहां शोधकर्ता प्रत्येक आइगेनवैल्यू के लिए आत्मविश्वास अंतराल की गणना करता है और केवल उन कारकों को बरकरार रखता है जिनका संपूर्ण आत्मविश्वास अंतराल 1.0 से अधिक है।[14][21] मिट्टी - रोढ़ी वाला भूखंड:[22] कैटेल स्क्री परीक्षण घटकों को एक्स-अक्ष के रूप में और संबंधित eigenvalue को वाई-अक्ष के रूप में प्लॉट करता है। जैसे-जैसे कोई दाईं ओर बढ़ता है, पश्चात के घटकों की ओर, स्वदेशी मूल्य कम हो जाते हैं। जब गिरावट बंद हो जाती है और वक्र कम तेज गिरावट की ओर कोहनी बनाता है,तब कैटेल का स्क्री परीक्षण कोहनी से शुरू होने वाले सभी घटकों को छोड़ने के लिए कहता है। शोधकर्ता-नियंत्रित विक्षनरी:फज फ़ैक्टर के प्रति उत्तरदायी होने के कारण कभी-कभी इस नियम की आलोचना की जाती है। अथार्त, चूंकि कोहनी चुनना व्यक्तिपरक हो सकता है क्योंकि वक्र में कई कोहनी होती हैं या चिकनी वक्र होती है, शोधकर्ता को अपने शोध एजेंडे द्वारा वांछित कारकों की संख्या पर कट-ऑफ निर्धारित करने का प्रलोभन दिया जा सकता है।
वेरिएंस ने मानदंड समझाया: कुछ शोधकर्ता भिन्नता के 90% (कभी-कभी 80%) को ध्यान में रखने के लिए पर्याप्त कारकों को रखने के नियम का उपयोग करते हैं। जहां शोधकर्ता का लक्ष्य ओकाम के रेजर पर जोर देता है (यथासंभव कुछ कारकों के साथ भिन्नता की व्याख्या करना), मानदंड 50% तक कम हो सकता है।
बायेसियन विधि
भारतीय बुफ़े प्रक्रिया पर आधारित बायेसियन दृष्टिकोण अव्यक्त कारकों की प्रशंसनीय संख्या पर संभाव्यता वितरण देता है।[23]
रोटेशन विधियाँ
अनरोटेटेड आउटपुट पहले कारक, फिर दूसरे फैक्टर आदि के कारण होने वाले विचरण को अधिकतम करता है। अनरोटेटेड समाधान ओर्थोगोनल है। इसका मतलब है कि कारकों के मध्य सहसंबंध शून्य है। अनरोटेटेड समाधान का उपयोग करने का नुकसान यह है कि सामान्यतः अधिकांश आइटम शुरुआती कारकों पर लोड होते हैं और कई आइटम से अधिक कारकों पर काफी सीमा तक लोड होते हैं।
रोटेशन, लोडिंग का पैटर्न बनाने के लिए समन्वय प्रणाली के अक्षों को रोटेशन (गणित) द्वारा व्याख्या करना आसान बनाता है, जहां प्रत्येक आइटम केवल कारक पर दृढ़ता से लोड होता है और अन्य कारकों पर अधिक कमजोर रूप से लोड होता है। घुमाव ऑर्थोगोनल या तिरछा हो सकता है। तिरछा घुमाव कारकों को सहसंबंधित करने की अनुमति देता है।[24] वेरिमैक्स रोटेशन सबसे अधिक इस्तेमाल की जाने वाली रोटेशन विधि है। वेरिमैक्स कारक अक्षों का ऑर्थोगोनल रोटेशन है जो कारक लोडिंग आव्युह में सभी वेरिएबल (पंक्तियों) पर कारक (स्तंभ) के वर्ग लोडिंग के विचरण को अधिकतम करता है। प्रत्येक कारक में कारक द्वारा बड़े लोडिंग के साथ केवल कुछ वेरिएबल होते हैं। वेरिमैक्स लोडिंग आव्युह के कॉलम को सरल बनाता है। इससे प्रत्येक वेरिएबल को ही कारक से पहचानना यथासंभव आसान हो जाता है।
क्वार्टिमैक्स रोटेशन ऑर्थोगोनल रोटेशन है जो वेरिएबल को समझाने के लिए आवश्यक कारकों की संख्या को कम करता है। यह कॉलम के बजाय लोडिंग आव्युह की पंक्तियों को सरल बनाता है। क्वार्टिमैक्स अक्सर सामान्य कारक उत्पन्न करता है जिसमें कई वेरिएबल के लिए लोडिंग होती है। यह अघुलनशील समाधान के करीब है। यदि कई वेरिएबल सहसंबद्ध हैंतब क्वार्टिमैक्स उपयोगी है ताकि प्रमुख कारक की उम्मीद की जा सके।[25] इक्विमैक्स रोटेशन वेरिमैक्स और क्वार्टिमैक्स के मध्य समझौता है।
कई व्यावहारिक अनुप्रयोगों में, यह मान लेना अवास्तविक है कि कारक असंबंधित हैं। इस स्थिति में तिरछे घुमाव को प्राथमिकता दी जाती है। एक-दूसरे से सहसंबद्ध कारकों को अनुमति देना विशेष रूप से साइकोमेट्रिक अनुसंधान में लागू होता है, क्योंकि दृष्टिकोण, राय और बौद्धिक क्षमताएं सहसंबद्ध होती हैं और अन्यथा मान लेना अवास्तविक होगा।[26] जब कोई व्यक्ति तिरछा (गैर-ऑर्थोगोनल) समाधान चाहता हैतब ओब्लिमिन रोटेशन मानक विधि है।
प्रोमैक्स रोटेशन वैकल्पिक तिरछा रोटेशन विधि है जो ओब्लिमिन विधि की तुलना में कम्प्यूटेशनल रूप से तेज़ है और इसलिए कभी-कभी बहुत बड़े डाटासमुच्चय के लिए उपयोग किया जाता है।
कारक घूर्णन के साथ समस्याएँ
जब प्रत्येक वेरिएबल कई कारकों पर लोड हो रहा होतब कारक संरचना की व्याख्या करना मुश्किल हो सकता है। डेटा में छोटे परिवर्तन कभी-कभी कारक रोटेशन मानदंड में संतुलन बना सकते हैं ताकि पूरी प्रकार से भिन्न कारक रोटेशन उत्पन्न हो। इससे विभिन्न प्रयोगों के परिणामों की तुलना करना कठिन हो सकता है। इस समस्या को विश्वव्यापी सांस्कृतिक भिन्नताओं के विभिन्न अध्ययनों की तुलना से स्पष्ट किया गया है। प्रत्येक अध्ययन ने सांस्कृतिक वेरिएबल के विभिन्न मापों का उपयोग किया है और भिन्न-भिन्न घुमाए गए कारक विश्लेषण परिणाम का उत्पादन किया है। प्रत्येक अध्ययन के लेखकों का मानना था कि उन्होंने कुछ नया खोजा है, और उन्होंने जो कारक पाए उनके लिए नए नाम ईजाद किए। अध्ययनों की पश्चात की तुलना में पाया गया कि जब अनियंत्रित परिणामों की तुलना की गईतब परिणाम समान थे। कारक रोटेशन के सामान्य अभ्यास ने विभिन्न अध्ययनों के परिणामों के मध्य समानता को अस्पष्ट कर दिया है।[27]
उच्च क्रम कारक विश्लेषण
उच्च-क्रम कारक विश्लेषण सांख्यिकीय पद्धति है जिसमें दोहराए जाने वाले चरण कारक विश्लेषण - तिरछा रोटेशन - घुमाए गए कारकों का कारक विश्लेषण शामिल है। इसकी योग्यता शोधकर्ता को अध्ययन की गई घटनाओं की पदानुक्रमित संरचना को देखने में सक्षम बनाना है। परिणामों की व्याख्या करने के लिए, कोई यातब आव्युह गुणन द्वारा आगे बढ़ता है | प्राथमिक कारक पैटर्न आव्युह को उच्च-क्रम कारक पैटर्न आव्युह (गोर्सच, 1983) द्वारा गुणा करने और शायद परिणाम के लिए वेरिमैक्स रोटेशन लागू करने (थॉम्पसन, 1990) या श्मिड-लीमन समाधान (एसएलएस, श्मिड और लीमन, 1957, जिसे श्मिड-लीमन परिवर्तन के रूप में भी जाना जाता है) का उपयोग करके आगे बढ़ता है जो सांख्यिकीय फैलाव का गुण बताता है। प्राथमिक कारकों से दूसरे क्रम के कारकों तक।
खोजपूर्ण कारक विश्लेषण (ईएफए) बनाम प्रमुख घटक विश्लेषण (पीसीए)
कारक विश्लेषण प्रमुख घटक विश्लेषण (पीसीए) से संबंधित है, लेकिन दोनों समान नहीं हैं।[28] दोनों तकनीकों के मध्य अंतर को लेकर क्षेत्र में महत्वपूर्ण विवाद रहा है। पीसीए को खोजपूर्ण कारक विश्लेषण (ईएफए) का अधिक बुनियादी संस्करण माना जा सकता है जिसे हाई-स्पीड कंप्यूटर के आगमन से पहले शुरुआती दिनों में विकसित किया गया था। पीसीए और कारक विश्लेषण दोनों का लक्ष्य डेटा के समुच्चय की आयामीता को कम करना है, लेकिन ऐसा करने के लिए अपनाए गए दृष्टिकोण दोनों तकनीकों के लिए भिन्न-भिन्न हैं। कारक विश्लेषण स्पष्ट रूप से देखे गए वेरिएबल से कुछ अप्राप्य कारकों की पहचान करने के उद्देश्य से डिज़ाइन किया गया है, जबकि पीसीए सीधे इस उद्देश्य को संबोधित नहीं करता है; सर्वोत्तम रूप से, पीसीए आवश्यक कारकों का अनुमान प्रदान करता है।[29] खोजपूर्ण विश्लेषण के दृष्टिकोण से, पीसीए के eigenvalues फुलाए गए घटक लोडिंग हैं, अथार्त, त्रुटि भिन्नता से दूषित हैं।[30][31][32][33][34][35] जबकि खोजपूर्ण कारक विश्लेषण और प्रमुख घटक विश्लेषण को सांख्यिकी के कुछ क्षेत्रों में पर्यायवाची तकनीकों के रूप में माना जाता है, इसकी आलोचना की गई है।[36][37] कारक विश्लेषण अंतर्निहित कारण संरचना की धारणा से संबंधित है: [यह] मानता है कि देखे गए वेरिएबल में सहसंयोजन या अधिक अव्यक्त वेरिएबल (कारकों) की उपस्थिति के कारण होता है जो इन देखे गए वेरिएबल पर कारण प्रभाव डालते हैं।[38] इसके विपरीत, पीसीए ऐसे अंतर्निहित कारण संबंध को नतब मानता है और न ही उस पर निर्भर करता है। शोधकर्ताओं ने तर्क दिया है कि दो तकनीकों के मध्य अंतर का मतलब यह हो सकता है कि विश्लेषणात्मक लक्ष्य के आधार पर को दूसरे पर प्राथमिकता देने के उद्देश्यपूर्ण लाभ हैं। यदि कारक मॉडल गलत विधियों से तैयार किया गया है या मान्यताओं को पूरा नहीं किया गया है,तब कारक विश्लेषण गलत परिणाम देगा। कारक विश्लेषण का सफलतापूर्वक उपयोग किया गया है जहां सिस्टम की पर्याप्त समझ अच्छे प्रारंभिक मॉडल फॉर्मूलेशन की अनुमति देती है। पीसीए मूल डेटा में गणितीय परिवर्तन को नियोजित करता है, जिसमें सहप्रसरण आव्युह के रूप के बारे में कोई धारणा नहीं होती है। पीसीए का उद्देश्य मूल वेरिएबल के रैखिक संयोजनों को निर्धारित करना और कुछ का चयन करना है जिनका उपयोग अधिक जानकारी खोए बिना डेटा समुच्चय को सारांशित करने के लिए किया जा सकता है।[39]
पीसीए और ईएफए के विपरीत तर्क
फैब्रिगर एट अल. (1999)[36]ऐसे कई कारणों का पता लगाएं जिनका उपयोग यह सुझाव देने के लिए किया जाता है कि पीसीए कारक विश्लेषण के सामान्य नहीं है:
- कभी-कभी यह सुझाव दिया जाता है कि पीसीए कम्प्यूटेशनल रूप से तेज़ है और कारक विश्लेषण की तुलना में कम संसाधनों की आवश्यकता होती है। फैब्रिगर एट अल. सुझाव है कि आसानी से उपलब्ध कंप्यूटर संसाधनों ने इस व्यावहारिक चिंता को अप्रासंगिक बना दिया है।
- पीसीए और कारक विश्लेषण समान परिणाम उत्पन्न कर सकते हैं। इस बिंदु को फैब्रिगर एट अल द्वारा भी संबोधित किया गया है; कुछ मामलों में, जहाँ सामुदायिकताएँ कम हैं (जैसे 0.4), दोनों तकनीकें भिन्न-भिन्न परिणाम उत्पन्न करती हैं। वास्तव में, फैब्रिगर एट अल। तर्क है कि ऐसे मामलों में जहां डेटा सामान्य कारक मॉडल की मान्यताओं के अनुरूप है, पीसीए के परिणाम गलत परिणाम हैं।
- ऐसे कुछ स्तिथियों हैं जहां कारक विश्लेषण से 'हेवुड स्तिथियों' सामने आते हैं। इनमें वे स्थितियाँ शामिल हैं जिनमें मापे गए वेरिएबल में 100% या अधिक भिन्नता का अनुमान मॉडल द्वारा लगाया जाता है। फैब्रिगर एट अल. सुझाव दें कि ये स्तिथियों वास्तव में शोधकर्ता के लिए जानकारीपूर्ण हैं, जो गलत विधियों से निर्दिष्ट मॉडल या सामान्य कारक मॉडल के उल्लंघन का संकेत देते हैं। पीसीए दृष्टिकोण में हेवुड मामलों की कमी का मतलब यह हो सकता है कि ऐसे मुद्दों पर ध्यान नहीं दिया जाता है।
- शोधकर्ता पीसीए दृष्टिकोण से अतिरिक्त जानकारी प्राप्त करते हैं, जैसे किसी निश्चित घटक पर किसी व्यक्ति का स्कोर; ऐसी जानकारी कारक विश्लेषण से नहीं मिलती है। हालाँकि, फैब्रिगर एट अल के रूप में। तर्क दें, कारक विश्लेषण का विशिष्ट उद्देश्य - अथार्त मापे गए वेरिएबल के मध्य सहसंबंध और निर्भरता की संरचना के लिए लेखांकन कारकों को निर्धारित करना - कारक स्कोर के ज्ञान की आवश्यकता नहीं है और इस प्रकार यह लाभ अस्वीकार कर दिया गया है। कारक विश्लेषण से कारक स्कोर की गणना करना भी संभव है।
प्रसरण बनाम सहप्रसरण
कारक विश्लेषण माप में निहित यादृच्छिक त्रुटि को ध्यान में रखता है, जबकि पीसीए ऐसा करने में विफल रहता है। इस बिंदु का उदाहरण ब्राउन (2009) द्वारा दिया गया है,[40] किसने संकेत दिया कि, गणना में शामिल सहसंबंध आव्युह के संबंध में:
"In PCA, 1.00s are put in the diagonal meaning that all of the variance in the matrix is to be accounted for (including variance unique to each variable, variance common among variables, and error variance). That would, therefore, by definition, include all of the variance in the variables. In contrast, in EFA, the communalities are put in the diagonal meaning that only the variance shared with other variables is to be accounted for (excluding variance unique to each variable and error variance). That would, therefore, by definition, include only variance that is common among the variables."
— Brown (2009), Principal components analysis and exploratory factor analysis – Definitions, differences and choices
इस कारण से, ब्राउन (2009) कारक विश्लेषण का उपयोग करने की सलाह देते हैं जब वेरिएबल के मध्य संबंधों के बारे में सैद्धांतिक विचार मौजूद होते हैं, जबकि पीसीए का उपयोग किया जाना चाहिए यदि शोधकर्ता का लक्ष्य अपने डेटा में पैटर्न का पता लगाना है।
प्रक्रिया और परिणाम में अंतर
पीसीए और कारक विश्लेषण (एफए) के मध्य अंतर को सुहर (2009) द्वारा और अधिक स्पष्ट किया गया है:[37]* पीसीए के परिणामस्वरूप प्रमुख घटक बनते हैं जो प्रेक्षित वेरिएबलों के लिए अधिकतम मात्रा में विचरण का कारण बनते हैं; एफए डेटा में सामान्य भिन्नता का हिसाब रखता है।
- पीसीए सहसंबंध आव्युह के विकर्णों पर सम्मिलित करता है; एफए अद्वितीय कारकों के साथ सहसंबंध आव्युह के विकर्णों को समायोजित करता है।
- पीसीए घटक अक्ष पर वर्गाकार लंबवत दूरी के योग को कम करता है; एफए उन कारकों का अनुमान लगाता है जो देखे गए वेरिएबल पर प्रतिक्रियाओं को प्रभावित करते हैं।
- पीसीए में घटक स्कोर आइगेनवैल्यूज़ एवं आइगेनवेक्टर्स द्वारा भारित देखे गए वेरिएबल के रैखिक संयोजन का प्रतिनिधित्व करते हैं; एफए में देखे गए वेरिएबल अंतर्निहित और अद्वितीय कारकों के रैखिक संयोजन हैं।
- पीसीए में, प्राप्त घटक व्याख्या योग्य नहीं हैं, अथार्त वे अंतर्निहित 'निर्माण' का प्रतिनिधित्व नहीं करते हैं; एफए में, सटीक मॉडल विनिर्देश दिए जाने पर, अंतर्निहित निर्माणों को लेबल किया जा सकता है और आसानी से व्याख्या की जा सकती है।
साइकोमेट्रिक्स में
इतिहास
चार्ल्स स्पीयरमैन सामान्य कारक विश्लेषण पर चर्चा करने वाले पहले मनोवैज्ञानिक थे[41] और अपने 1904 के पेपर में ऐसा किया।[42] इसने उनके विधियों के बारे में कुछ विवरण प्रदान किए और एकल-कारक मॉडल से संबंधित था।[43] उन्होंने पाया कि विभिन्न प्रकार के असंबंधित विषयों पर स्कूली बच्चों के स्कोर सकारात्मक रूप से सहसंबद्ध थे, जिससे उन्हें यह मानने मेंसहायता मिली कि सामान्य मानसिक क्षमता, या जी कारक (साइकोमेट्रिक्स), मानव संज्ञानात्मक प्रदर्शन को रेखांकित और आकार देता है।
कई कारकों के साथ सामान्य कारक विश्लेषण का प्रारंभिक विकास 1930 के दशक की शुरुआत में लुई लियोन थर्स्टन द्वारा दो पत्रों में दिया गया था,[44][45] उनकी 1935 की पुस्तक, मन के सदिश में इसका सारांश दिया गया है।[46] थर्स्टन ने सामुदायिकता, विशिष्टता और रोटेशन सहित कई महत्वपूर्ण कारक विश्लेषण अवधारणाएँ पेश कीं।[47] उन्होंने सरल संरचना की वकालत की, और रोटेशन के विधियों का विकास किया जिसका उपयोग ऐसी संरचना को प्राप्त करने के विधियों के रूप में किया जा सकता है।[41]
क्यू पद्धति में, स्पीयरमैन के छात्र, विलियम स्टीफेंसन (मनोवैज्ञानिक), अंतर-व्यक्तिगत मतभेदों के अध्ययन की ओर उन्मुख आर कारक विश्लेषण और व्यक्तिपरक अंतर-व्यक्तिगत मतभेदों की ओर उन्मुख क्यू कारक विश्लेषण के मध्य अंतर करते हैं।[48][49] रेमंड कैटेल कारक विश्लेषण और साइकोमेट्रिक्स के प्रबल समर्थक थे और उन्होंने बुद्धि को समझाने के लिए थर्स्टन के बहु-कारक सिद्धांत का इस्तेमाल किया। कैटेल ने स्क्री प्लॉट और समानता गुणांक भी विकसित किया।
मनोविज्ञान में अनुप्रयोग
कारक विश्लेषण का उपयोग उन कारकों की पहचान करने के लिए किया जाता है जो विभिन्न परीक्षणों पर विभिन्न प्रकार के परिणामों की व्याख्या करते हैं। उदाहरण के लिए, खुफिया शोध में पाया गया कि जो लोग मौखिक क्षमता के परीक्षण में उच्च अंक प्राप्त करते हैं वे अन्य परीक्षणों में भी अच्छे होते हैं जिनके लिए मौखिक क्षमताओं की आवश्यकता होती है। शोधकर्ताओं ने कारक को भिन्न करने के लिए कारक विश्लेषण का उपयोग करके इसे समझाया, जिसे अक्सर मौखिक बुद्धिमत्ता कहा जाता है, जो उस डिग्री का प्रतिनिधित्व करता है जिस तक कोई व्यक्ति मौखिक कौशल से जुड़ी समस्याओं को हल करने में सक्षम है।
मनोविज्ञान में कारक विश्लेषण अक्सर खुफिया अनुसंधान से जुड़ा होता है। हालाँकि, इसका उपयोग व्यक्तित्व, दृष्टिकोण, विश्वास आदि जैसे डोमेन की विस्तृत श्रृंखला में कारकों को खोजने के लिए भी किया गया है। यह साइकोमेट्रिक्स से जुड़ा हुआ है, क्योंकि यह किसी उपकरण की वैधता का आकलन यह पता लगाकर कर सकता है कि क्या उपकरण वास्तव में अनुमानित कारकों को मापता है।
फायदे
- दो या दो से अधिक वेरिएबलों को ही कारक में संयोजित करके वेरिएबलों की संख्या में कमी करना। उदाहरण के लिए, दौड़ने, गेंद फेंकने, बल्लेबाजी, कूदने और वजन उठाने में प्रदर्शन को सामान्य एथलेटिक क्षमता जैसे कारक में जोड़ा जा सकता है। सामान्यतः, किसी आइटम द्वारा लोगों के आव्युह में, संबंधित आइटमों को समूहीकृत करके कारकों का चयन किया जाता है। क्यू कारक विश्लेषण तकनीक में, आव्युह को स्थानांतरित किया जाता है और संबंधित लोगों को समूहीकृत करके कारक बनाए जाते हैं। उदाहरण के लिए, उदारवादी, स्वतंत्रतावादी, रूढ़िवादी और समाजवादी भिन्न-भिन्न समूहों में बन सकते हैं।
- अंतर-संबंधित वेरिएबलों के समूहों की पहचान करना, यह देखना कि वे एक-दूसरे से कैसे संबंधित हैं। उदाहरण के लिए, कैरोल ने अपने थ्री स्ट्रेटम थ्योरी के निर्माण के लिए कारक विश्लेषण का उपयोग किया। उन्होंने पाया कि व्यापक दृश्य धारणा नामक कारक इस बात से संबंधित है कि कोई व्यक्ति दृश्य कार्यों में कितना अच्छा है। उन्होंने श्रवण कार्य क्षमता से संबंधित व्यापक श्रवण धारणा कारक भी पाया। इसके अतिरिक्त, उन्होंने वैश्विक कारक पाया, जिसे जी या सामान्य बुद्धि कहा जाता है, जो व्यापक दृश्य धारणा और व्यापक श्रवण धारणा दोनों से संबंधित है। इसका मतलब यह है कि उच्च जी वाले व्यक्ति में उच्च दृश्य धारणा क्षमता और उच्च श्रवण धारणा क्षमता दोनों होने की संभावना है, और यह जी इस बात का अच्छा हिस्सा बताता है कि कोई व्यक्ति उन दोनों डोमेन में अच्छा या बुरा क्यों है।
नुकसान
- ...प्रत्येक अभिविन्यास गणितीय रूप से समान रूप से स्वीकार्य है। लेकिन भिन्न-भिन्न फैक्टोरियल सिद्धांत किसी दिए गए समाधान के लिए फैक्टोरियल अक्षों के झुकाव के संदर्भ में उतने ही भिन्न साबित हुए जितने कि किसी अन्य चीज़ के संदर्भ में, इसलिए मॉडल फिटिंग सिद्धांतों के मध्य अंतर करने में उपयोगी साबित नहीं हुई। (स्टर्नबर्ग, 1977[50]). इसका मतलब है कि सभी घुमाव भिन्न-भिन्न अंतर्निहित प्रक्रियाओं का प्रतिनिधित्व करते हैं, लेकिन सभी घुमाव मानक कारक विश्लेषण अनुकूलन के समान रूप से मान्य परिणाम हैं। इसलिए, अकेले कारक विश्लेषण का उपयोग करके उचित रोटेशन चुनना असंभव है।
- कारक विश्लेषण केवल उतना ही अच्छा हो सकता है जितना डेटा अनुमति देता है। मनोविज्ञान में, जहां शोधकर्ताओं को अक्सर स्व-रिपोर्ट जैसे कम वैध और विश्वसनीय उपायों पर निर्भर रहना पड़ता है, यह समस्याग्रस्त हो सकता है।
- कारक विश्लेषण की व्याख्या अनुमान का उपयोग करने पर आधारित है, जो ऐसा समाधान है जो सुविधाजनक है भले ही पूरी प्रकार सच न हो।[51] ही प्रकार से तथ्यांकित किए गए ही डेटा की से अधिक व्याख्याएं की जा सकती हैं, और कारक विश्लेषण कार्य-कारण की पहचान नहीं कर सकता है।
पार-सांस्कृतिक अनुसंधान में
अंतर-सांस्कृतिक अनुसंधान में कारक विश्लेषण अक्सर उपयोग की जाने वाली तकनीक है। यह हॉफस्टेड के सांस्कृतिक आयाम सिद्धांत को निकालने के उद्देश्य को पूरा करता है। सबसे प्रसिद्ध सांस्कृतिक आयाम मॉडल गीर्ट हॉफस्टेड, रोनाल्ड इंगलहार्ट, क्रिश्चियन वेलज़ेल, शालोम एच. श्वार्ट्ज और माइकल मिनकोव द्वारा विस्तृत हैं। लोकप्रिय दृश्य विश्व का इंगलहार्ट-वेल्ज़ेल सांस्कृतिक मानचित्र है|इंगलहार्ट और वेल्ज़ेल का विश्व का सांस्कृतिक मानचित्र।[27]
राजनीति विज्ञान में
1965 के शुरुआती अध्ययन में, संबंधित सैद्धांतिक मॉडल और अनुसंधान के निर्माण, राजनीतिक प्रणालियों की तुलना करने और टाइपोलॉजिकल श्रेणियां बनाने के लिए कारक विश्लेषण के माध्यम से दुनिया भर की राजनीतिक प्रणालियों की जांच की जाती है।[52] इन उद्देश्यों के लिए, इस अध्ययन में सात बुनियादी राजनीतिक आयामों की पहचान की गई है, जो विभिन्न प्रकार के राजनीतिक व्यवहार से संबंधित हैं: ये आयाम हैं पहुंच, भेदभाव, आम सहमति, अनुभागवाद, वैधीकरण, रुचि और नेतृत्व सिद्धांत और अनुसंधान।
अन्य राजनीतिक वैज्ञानिक 1988 के राष्ट्रीय चुनाव अध्ययन में जोड़े गए चार नए प्रश्नों का उपयोग करके आंतरिक राजनीतिक प्रभावकारिता के माप का पता लगाते हैं। यहां कारक विश्लेषण का उपयोग यह पता लगाने के लिए किया जाता है कि ये आइटम बाहरी प्रभावकारिता और राजनीतिक विश्वास से भिन्न एकल अवधारणा को मापते हैं, और ये चार प्रश्न उस समय तक आंतरिक राजनीतिक प्रभावकारिता का सबसे अच्छा उपाय प्रदान करते हैं।[53] संयुक्त राज्य अमेरिका के राष्ट्रपति पद की बहस, रैलियों और हिलेरी क्लिंटन ईमेल विवाद जैसे महत्वपूर्ण अभियान कार्यक्रमों के प्रभाव का अध्ययन करने के लिए| हिलेरी क्लिंटन के ईमेल विवाद, कारक विश्लेषण का उपयोग 2016 में डोनाल्ड ट्रम्प और 2012 में ओबामा जैसे अमेरिकी राष्ट्रपति पद के उम्मीदवारों के लिए लोकप्रियता के उपाय बनाने के लिए किया जाता है। लोकप्रियता कारकों को ट्विटर, फेसबुक, यूट्यूब, इंस्टाग्राम, पाँच अड़तीस और भविष्यवाणी बाजारों से एकत्र किए गए डेटा से संश्लेषित किया जाता है।[54]
विपणन में
बुनियादी कदम हैं:
- इस श्रेणी में उत्पाद (व्यवसाय) का मूल्यांकन करने के लिए उपभोक्ताओं द्वारा उपयोग की जाने वाली मुख्य विशेषताओं की पहचान करें।
- सभी उत्पाद विशेषताओं की रेटिंग के संबंध में संभावित ग्राहकों के प्रतिरूप से डेटा एकत्र करने के लिए मात्रात्मक विपणन अनुसंधान तकनीकों (जैसे सांख्यिकीय सर्वेक्षण) का उपयोग करें।
- डेटा को सांख्यिकीय कार्यक्रम में इनपुट करें और कारक विश्लेषण प्रक्रिया चलाएँ। कंप्यूटर अंतर्निहित विशेषताओं (या कारकों) का समुच्चय उत्पन्न करेगा।
- अवधारणात्मक मानचित्रण और अन्य पोजिशनिंग (विपणन) उपकरणों के निर्माण के लिए इन कारकों का उपयोग करें।
सूचना संग्रह
डेटा संग्रह चरण सामान्यतः विपणन अनुसंधान पेशेवरों द्वारा किया जाता है। सर्वेक्षण प्रश्न उत्तरदाता से किसी उत्पाद के प्रतिरूप या उत्पाद अवधारणाओं के विवरण को विभिन्न विशेषताओं के आधार पर रेटिंग देने के लिए कहते हैं। कहीं भी पाँच से बीस विशेषताएँ चुनी जाती हैं। उनमें ये चीजें शामिल हो सकती हैं: उपयोग में आसानी, वजन, सटीकता, स्थायित्व, रंगीनता, कीमत या आकार। चुनी गई विशेषताएँ अध्ययन किए जा रहे उत्पाद के आधार पर भिन्न-भिन्न होंगी। अध्ययन में सभी उत्पादों के बारे में ही प्रश्न पूछा गया है। कई उत्पादों के डेटा को कोडित किया जाता है और आर (प्रोग्रामिंग भाषा), एसपीएसएस, एसएएस प्रणाली, स्टेटा, आंकड़े, जेएमपी और सिस्टैट जैसे सांख्यिकीय कार्यक्रम में इनपुट किया जाता है।
विश्लेषण
विश्लेषण उन अंतर्निहित कारकों को भिन्न करेगा जो एसोसिएशन के आव्युह का उपयोग करके डेटा की व्याख्या करते हैं।[55] कारक विश्लेषण अन्योन्याश्रय तकनीक है। अन्योन्याश्रित संबंधों के संपूर्ण समुच्चय की जांच की जाती है। आश्रित वेरिएबल , स्वतंत्र वेरिएबल , या कार्य-कारण का कोई विनिर्देश नहीं है। कारक विश्लेषण मानता है कि विभिन्न विशेषताओं पर सभी रेटिंग डेटा को कुछ महत्वपूर्ण आयामों तक कम किया जा सकता है। यह कमी इसलिए संभव है क्योंकि कुछ विशेषताएँ एक-दूसरे से संबंधित हो सकती हैं। किसी विशेषता को दी गई रेटिंग आंशिक रूप से अन्य विशेषताओं के प्रभाव का परिणाम होती है। सांख्यिकीय एल्गोरिदम रेटिंग को उसके विभिन्न घटकों में विभाजित करता है (जिसे कच्चा स्कोर कहा जाता है) और आंशिक स्कोर को अंतर्निहित कारक स्कोर में पुनर्निर्मित करता है। प्रारंभिक कच्चे स्कोर और अंतिम कारक स्कोर के मध्य सहसंबंध की डिग्री को कारक लोडिंग कहा जाता है।
फायदे
- वस्तुनिष्ठ और व्यक्तिपरक दोनों विशेषताओं का उपयोग किया जा सकता है, बशर्ते व्यक्तिपरक विशेषताओं को अंकों में परिवर्तित किया जा सके।
- कारक विश्लेषण अव्यक्त आयामों या निर्माणों की पहचान कर सकता है जो प्रत्यक्ष विश्लेषण नहीं कर सकता है।
- यह आसान और सस्ता है.
नुकसान
- उपयोगिता उत्पाद विशेषताओं का पर्याप्त समुच्चय एकत्र करने की शोधकर्ताओं की क्षमता पर निर्भर करती है। यदि महत्वपूर्ण विशेषताओं को बाहर रखा जाता है या उपेक्षित किया जाता है,तब प्रक्रिया का मूल्य कम हो जाता है।
- यदि देखे गए वेरिएबल के समुच्चय एक-दूसरे के समान हैं और अन्य वस्तुओं से भिन्न हैं,तब कारक विश्लेषण उन्हें ही कारक प्रदान करेगा। यह उन कारकों को अस्पष्ट कर सकता है जो अधिक दिलचस्प रिश्तों का प्रतिनिधित्व करते हैं।
- नामकरण कारकों के लिए सिद्धांत के ज्ञान की आवश्यकता हो सकती है क्योंकि प्रतीत होता है कि भिन्न गुण अज्ञात कारणों से दृढ़ता से सहसंबद्ध हो सकते हैं।
भौतिक और जैविक विज्ञान में
भू-रसायन विज्ञान, जल रसायन विज्ञान जैसे भौतिक विज्ञानों में भी कारक विश्लेषण का व्यापक रूप से उपयोग किया गया है।[56] खगोल भौतिकी और ब्रह्मांड विज्ञान, साथ ही जैविक विज्ञान, जैसे पारिस्थितिकी, आणविक जीव विज्ञान, तंत्रिका विज्ञान और जैव रसायन।
भूजल गुणवत्ता प्रबंधन में, विभिन्न रसायनों के स्थानिक वितरण को जोड़ना महत्वपूर्ण है विभिन्न संभावित स्रोतों के पैरामीटर, जिनके भिन्न-भिन्न रासायनिक हस्ताक्षर हैं। उदाहरण के लिए, सल्फाइड खदान उच्च स्तर की अम्लता, घुले हुए सल्फेट्स और संक्रमण धातुओं से जुड़ी होने की संभावना है। इन हस्ताक्षरों को आर-मोड कारक विश्लेषण के माध्यम से कारकों के रूप में पहचाना जा सकता है, और कारक स्कोर को समोच्च करके संभावित स्रोतों का स्थान सुझाया जा सकता है।[57] भू-रसायन विज्ञान में, विभिन्न कारक विभिन्न खनिज संघों और इस प्रकार खनिजकरण के अनुरूप हो सकते हैं।[58]
माइक्रोएरे विश्लेषण में
एफिमेट्रिक्स जीनचिप्स के लिए जांच स्तर पर उच्च-घनत्व oligonucleotide डीएनए माइक्रोएरे डेटा को सारांशित करने के लिए कारक विश्लेषण का उपयोग किया जा सकता है। इस स्तिथियों में, अव्यक्त वेरिएबल प्रतिरूप में आरएनए एकाग्रता से मेल खाता है।[59]
कार्यान्वयन
1980 के दशक से कई सांख्यिकीय विश्लेषण कार्यक्रमों में कारक विश्लेषण लागू किया गया है:
- बीएमडीपी
- जेएमपी (सांख्यिकीय सॉफ्टवेयर)
- एमप्लस (सांख्यिकीय सॉफ्टवेयर)]
- पायथन (प्रोग्रामिंग भाषा): मॉड्यूल स्किकिट-लर्न[60]
- आर (प्रोग्रामिंग भाषा) (पैकेज 'साइक' में बेस फ़ंक्शन फैक्टनल या एफए फ़ंक्शन के साथ)। GPArotation R पैकेज में रोटेशन लागू किए जाते हैं।
- एसएएस (सॉफ्टवेयर) (प्रोक फैक्टर या प्रोक कैलिस का उपयोग करके)
- एसपीएसएस[61]
- था
स्टैंडअलोन
- फैक्टर [1] - रोविरा और वर्जिली विश्वविद्यालय द्वारा विकसित मुफ्त फैक्टर विश्लेषण सॉफ्टवेयर
यह भी देखें
- पुष्टि कारक विश्लेषण
- खोजपूर्ण कारक विश्लेषण
- प्रयोगों की रूप रेखा
- औपचारिक अवधारणा विश्लेषण
- स्वतंत्र घटक विश्लेषण
- गैर-नकारात्मक मैट्रिक्स गुणनखंडन
- क्यू पद्धति
- सिफ़ारिश प्रणाली
- मूल कारण विश्लेषण
- पहलू सिद्धांत
टिप्पणियाँ
संदर्भ
- ↑ Jöreskog, Karl G. (1983). "Factor Analysis as an Errors-in-Variables Model". आधुनिक मनोवैज्ञानिक मापन के सिद्धांत. Hillsdale: Erlbaum. pp. 185–196. ISBN 0-89859-277-1.
- ↑ Bandalos, Deborah L. (2017). सामाजिक विज्ञान के लिए मापन सिद्धांत और अनुप्रयोग. The Guilford Press.
- ↑ 3.0 3.1 3.2 Harman, Harry H. (1976). आधुनिक कारक विश्लेषण. University of Chicago Press. pp. 175, 176. ISBN 978-0-226-31652-9.
- ↑ 4.0 4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8 Polit DF Beck CT (2012). Nursing Research: Generating and Assessing Evidence for Nursing Practice, 9th ed. Philadelphia, USA: Wolters Klower Health, Lippincott Williams & Wilkins.
- ↑ Meng, J. (2011). "एक गैर-नकारात्मक हाइब्रिड कारक मॉडल का उपयोग करके ग्लियोब्लास्टोमा में माइक्रोआरएनए और प्रतिलेखन कारकों द्वारा सहकारी जीन नियमों को उजागर करें". International Conference on Acoustics, Speech and Signal Processing. Archived from the original on 2011-11-23.
- ↑ Liou, C.-Y.; Musicus, B.R. (2008). "Cross Entropy Approximation of Structured Gaussian Covariance Matrices" (PDF). IEEE Transactions on Signal Processing. 56 (7): 3362–3367. Bibcode:2008ITSP...56.3362L. doi:10.1109/TSP.2008.917878. S2CID 15255630.
- ↑ 7.0 7.1 7.2 Zwick, William R.; Velicer, Wayne F. (1986). "बनाए रखने के लिए घटकों की संख्या निर्धारित करने के लिए पांच नियमों की तुलना।". Psychological Bulletin. 99 (3): 432–442. doi:10.1037/0033-2909.99.3.432.
- ↑ Horn, John L. (June 1965). "कारक विश्लेषण में कारकों की संख्या के लिए एक तर्क और परीक्षण". Psychometrika. 30 (2): 179–185. doi:10.1007/BF02289447. PMID 14306381. S2CID 19663974.
- ↑ Dobriban, Edgar (2017-10-02). "कारक विश्लेषण और पीसीए के लिए क्रमपरिवर्तन विधियाँ" (in English). arXiv:1710.00479v2 [math.ST].
- ↑ * Ledesma, R.D.; Valero-Mora, P. (2007). "Determining the Number of Factors to Retain in EFA: An easy-to-use computer program for carrying out Parallel Analysis". Practical Assessment Research & Evaluation. 12 (2): 1–11.
- ↑ Tran, U. S., & Formann, A. K. (2009). Performance of parallel analysis in retrieving unidimensionality in the presence of binary data. Educational and Psychological Measurement, 69, 50-61.
- ↑ 12.0 12.1 Velicer, W.F. (1976). "आंशिक सहसंबंधों के मैट्रिक्स से घटकों की संख्या निर्धारित करना". Psychometrika. 41 (3): 321–327. doi:10.1007/bf02293557. S2CID 122907389.
- ↑ 13.0 13.1 Courtney, M. G. R. (2013). Determining the number of factors to retain in EFA: Using the SPSS R-Menu v2.0 to make more judicious estimations. Practical Assessment, Research and Evaluation, 18(8). Available online: http://pareonline.net/getvn.asp?v=18&n=8
- ↑ 14.0 14.1 Warne, R. T.; Larsen, R. (2014). "खोजपूर्ण कारक विश्लेषण में कारकों की संख्या निर्धारित करने के लिए गुटमैन नियम के प्रस्तावित संशोधन का मूल्यांकन करना". Psychological Test and Assessment Modeling. 56: 104–123.
- ↑ Ruscio, John; Roche, B. (2012). "ज्ञात तथ्यात्मक संरचना के तुलनात्मक डेटा का उपयोग करके खोजपूर्ण कारक विश्लेषण में बनाए रखने के लिए कारकों की संख्या निर्धारित करना". Psychological Assessment. 24 (2): 282–292. doi:10.1037/a0025697. PMID 21966933.
- ↑ Garrido, L. E., & Abad, F. J., & Ponsoda, V. (2012). A new look at Horn's parallel analysis with ordinal variables. Psychological Methods. Advance online publication. doi:10.1037/a0030005
- ↑ Revelle, William (2007). "Determining the number of factors: the example of the NEO-PI-R" (PDF).
{{cite journal}}
: Cite journal requires|journal=
(help) - ↑ Revelle, William (8 January 2020). "psych: Procedures for Psychological, Psychometric, and PersonalityResearch".
- ↑ Kaiser, Henry F. (April 1960). "कारक विश्लेषण के लिए इलेक्ट्रॉनिक कंप्यूटर का अनुप्रयोग". Educational and Psychological Measurement. 20 (1): 141–151. doi:10.1177/001316446002000116. S2CID 146138712.
- ↑ Bandalos, D.L.; Boehm-Kaufman, M.R. (2008). "Four common misconceptions in exploratory factor analysis". In Lance, Charles E.; Vandenberg, Robert J. (eds.). Statistical and Methodological Myths and Urban Legends: Doctrine, Verity and Fable in the Organizational and Social Sciences. Taylor & Francis. pp. 61–87. ISBN 978-0-8058-6237-9.
- ↑ Larsen, R.; Warne, R. T. (2010). "खोजपूर्ण कारक विश्लेषण में eigenvalues के लिए आत्मविश्वास अंतराल का अनुमान लगाना". Behavior Research Methods. 42 (3): 871–876. doi:10.3758/BRM.42.3.871. PMID 20805609.
{{cite journal}}
: zero width space character in|title=
at position 40 (help) - ↑ Cattell, Raymond (1966). "गुणनखंडों की संख्या के लिए रोड़ी परीक्षण". Multivariate Behavioral Research. 1 (2): 245–76. doi:10.1207/s15327906mbr0102_10. PMID 26828106.
- ↑ Alpaydin (2020). मशीन लर्निंग का परिचय (5th ed.). pp. 528–9.
- ↑ "कारक रोटेशन के तरीके". Stack Exchange. Retrieved 7 November 2022.
- ↑ Neuhaus, Jack O; Wrigley, C. (1954). "क्वार्टिमैक्स विधि". British Journal of Statistical Psychology. 7 (2): 81–91. doi:10.1111/j.2044-8317.1954.tb00147.x.
- ↑ Russell, D.W. (December 2002). "In search of underlying dimensions: The use (and abuse) of factor analysis in Personality and Social Psychology Bulletin". Personality and Social Psychology Bulletin. 28 (12): 1629–46. doi:10.1177/014616702237645. S2CID 143687603.
- ↑ 27.0 27.1 Fog, A (2022). "Two-Dimensional Models of Cultural Differences: Statistical and Theoretical Analysis" (PDF). Cross-Cultural Research. 57 (2–3): 115–165. doi:10.1177/10693971221135703. S2CID 253153619.
- ↑ Bartholomew, D.J.; Steele, F.; Galbraith, J.; Moustaki, I. (2008). बहुभिन्नरूपी सामाजिक विज्ञान डेटा का विश्लेषण. Statistics in the Social and Behavioral Sciences Series (2nd ed.). Taylor & Francis. ISBN 978-1584889601.
- ↑ Jolliffe I.T. Principal Component Analysis, Series: Springer Series in Statistics, 2nd ed., Springer, NY, 2002, XXIX, 487 p. 28 illus. ISBN 978-0-387-95442-4
- ↑ Cattell, R. B. (1952). Factor analysis. New York: Harper.
- ↑ Fruchter, B. (1954). Introduction to Factor Analysis. Van Nostrand.
- ↑ Cattell, R. B. (1978). Use of Factor Analysis in Behavioral and Life Sciences. New York: Plenum.
- ↑ Child, D. (2006). The Essentials of Factor Analysis, 3rd edition. Bloomsbury Academic Press.
- ↑ Gorsuch, R. L. (1983). Factor Analysis, 2nd edition. Hillsdale, NJ: Erlbaum.
- ↑ McDonald, R. P. (1985). Factor Analysis and Related Methods. Hillsdale, NJ: Erlbaum.
- ↑ 36.0 36.1 Fabrigar; et al. (1999). "मनोवैज्ञानिक अनुसंधान में खोजपूर्ण कारक विश्लेषण के उपयोग का मूल्यांकन करना।" (PDF). Psychological Methods.
- ↑ 37.0 37.1 Suhr, Diane (2009). "प्रमुख घटक विश्लेषण बनाम खोजपूर्ण कारक विश्लेषण" (PDF). SUGI 30 Proceedings. Retrieved 5 April 2012.
- ↑ SAS Statistics. "प्रमुख घटक विश्लेषण" (PDF). SAS Support Textbook.
- ↑ Meglen, R.R. (1991). "Examining Large Databases: A Chemometric Approach Using Principal Component Analysis". Journal of Chemometrics. 5 (3): 163–179. doi:10.1002/cem.1180050305. S2CID 120886184.
- ↑ Brown, J. D. (January 2009). "Principal components analysis and exploratory factor analysis – Definitions, differences and choices" (PDF). Shiken: JALT Testing & Evaluation SIG Newsletter. Retrieved 16 April 2012.
- ↑ 41.0 41.1 Mulaik, Stanley A (2010). कारक विश्लेषण की नींव. दूसरा संस्करण. Boca Raton, Florida: CRC Press. p. 6. ISBN 978-1-4200-9961-4.
- ↑ Spearman, Charles (1904). "सामान्य बुद्धि वस्तुनिष्ठ रूप से निर्धारित और मापी जाती है". American Journal of Psychology. 15 (2): 201–293. doi:10.2307/1412107. JSTOR 1412107.
- ↑ Bartholomew, D. J. (1995). "स्पीयरमैन और कारक विश्लेषण की उत्पत्ति और विकास". British Journal of Mathematical and Statistical Psychology. 48 (2): 211–220. doi:10.1111/j.2044-8317.1995.tb01060.x.
- ↑ Thurstone, Louis (1931). "एकाधिक कारक विश्लेषण". Psychological Review. 38 (5): 406–427. doi:10.1037/h0069792.
- ↑ Thurstone, Louis (1934). "मन के सदिश". The Psychological Review. 41: 1–32. doi:10.1037/h0075959.
- ↑ Thurstone, L. L. (1935). मन के सदिश. प्राथमिक लक्षणों के अलगाव के लिए बहु-कारक विश्लेषण।. Chicago, Illinois: University of Chicago Press.
- ↑ Bock, Robert (2007). "Rethinking Thurstone". In Cudeck, Robert; MacCallum, Robert C. (eds.). 100 पर कारक विश्लेषण. Mahwah, New Jersey: Lawrence Erlbaum Associates. p. 37. ISBN 978-0-8058-6212-6.
- ↑ Mckeown, Bruce (2013-06-21). क्यू पद्धति. ISBN 9781452242194. OCLC 841672556.
- ↑ Stephenson, W. (August 1935). "कारक विश्लेषण की तकनीक". Nature. 136 (3434): 297. Bibcode:1935Natur.136..297S. doi:10.1038/136297b0. ISSN 0028-0836. S2CID 26952603.
- ↑ Sternberg, R. J. (1977). Metaphors of Mind: Conceptions of the Nature of Intelligence. New York: Cambridge University Press. pp. 85–111.[verification needed]
- ↑ "कारक विश्लेषण". Archived from the original on August 18, 2004. Retrieved July 22, 2004.
- ↑ Gregg, Phillip M.; Banks, Arthur S. (1965). "Dimensions of political systems: Factor analysis of a cross-polity survey". American Political Science Review (in English). 59 (3): 602–614. doi:10.2307/1953171.
- ↑ Niemi, Richard G.; Craig, Stephen C.; Mattei, Franco (December 1991). "Measuring Internal Political Efficacy in the 1988 National Election Study". American Political Science Review (in English). 85 (4): 1407–1413. doi:10.2307/1963953. ISSN 0003-0554.
- ↑ Franch, Fabio (May 2021). "Political preferences nowcasting with factor analysis and internet data: The 2012 and 2016 US presidential elections". Technological Forecasting and Social Change (in English). 166: 120667. doi:10.1016/j.techfore.2021.120667. ISSN 0040-1625.
- ↑ Ritter, N. (2012). A comparison of distribution-free and non-distribution free methods in factor analysis. Paper presented at Southwestern Educational Research Association (SERA) Conference 2012, New Orleans, LA (ED529153).
- ↑ Subbarao, C.; Subbarao, N.V.; Chandu, S.N. (December 1996). "कारक विश्लेषण का उपयोग करके भूजल संदूषण का लक्षण वर्णन". Environmental Geology. 28 (4): 175–180. Bibcode:1996EnGeo..28..175S. doi:10.1007/s002540050091. S2CID 129655232.
- ↑ Love, D.; Hallbauer, D.K.; Amos, A.; Hranova, R.K. (2004). "Factor analysis as a tool in groundwater quality management: two southern African case studies". Physics and Chemistry of the Earth. 29 (15–18): 1135–43. Bibcode:2004PCE....29.1135L. doi:10.1016/j.pce.2004.09.027.
- ↑ Barton, E.S.; Hallbauer, D.K. (1996). "Trace-element and U—Pb isotope compositions of pyrite types in the Proterozoic Black Reef, Transvaal Sequence, South Africa: Implications on genesis and age". Chemical Geology. 133 (1–4): 173–199. doi:10.1016/S0009-2541(96)00075-7.
- ↑ Hochreiter, Sepp; Clevert, Djork-Arné; Obermayer, Klaus (2006). "एफिमेट्रिक्स जांच स्तर डेटा के लिए एक नई सारांशीकरण विधि". Bioinformatics. 22 (8): 943–9. doi:10.1093/bioinformatics/btl033. PMID 16473874.
- ↑ "sklearn.decomposition.FactorAnalysis — scikit-learn 0.23.2 documentation". scikit-learn.org.
- ↑ MacCallum, Robert (June 1983). "A comparison of factor analysis programs in SPSS, BMDP, and SAS". Psychometrika. 48 (2): 223–231. doi:10.1007/BF02294017. S2CID 120770421.
अग्रिम पठन
- Child, Dennis (2006), The Essentials of Factor Analysis (3rd ed.), Continuum International, ISBN 978-0-8264-8000-2.
- Fabrigar, L.R.; Wegener, D.T.; MacCallum, R.C.; Strahan, E.J. (September 1999). "Evaluating the use of exploratory factor analysis in psychological research". Psychological Methods. 4 (3): 272–299. doi:10.1037/1082-989X.4.3.272.
- B.T. Gray (1997) Higher-Order Factor Analysis (Conference paper)
- Jennrich, Robert I., "Rotation to Simple Loadings Using Component Loss Function: The Oblique Case," Psychometrika, Vol. 71, No. 1, pp. 173–191, March 2006.
- Katz, Jeffrey Owen, and Rohlf, F. James. Primary product functionplane: An oblique rotation to simple structure. Multivariate Behavioral Research, April 1975, Vol. 10, pp. 219–232.
- Katz, Jeffrey Owen, and Rohlf, F. James. Functionplane: A new approach to simple structure rotation. Psychometrika, March 1974, Vol. 39, No. 1, pp. 37–51.
- Katz, Jeffrey Owen, and Rohlf, F. James. Function-point cluster analysis. Systematic Zoology, September 1973, Vol. 22, No. 3, pp. 295–301.
- Mulaik, S. A. (2010), Foundations of Factor Analysis, Chapman & Hall.
- Preacher, K.J.; MacCallum, R.C. (2003). "Repairing Tom Swift's Electric Factor Analysis Machine" (PDF). Understanding Statistics. 2 (1): 13–43. doi:10.1207/S15328031US0201_02. hdl:1808/1492.
- J.Schmid and J. M. Leiman (1957). The development of hierarchical factor solutions. Psychometrika, 22(1), 53–61.
- Thompson, B. (2004), Exploratory and Confirmatory Factor Analysis: Understanding concepts and applications, Washington DC: American Psychological Association, ISBN 978-1591470939.
- Hans-Georg Wolff, Katja Preising (2005)Exploring item and higher order factor structure with the schmid-leiman solution : Syntax codes for SPSS and SASBehavior research methods, instruments & computers, 37 (1), 48-58
बाहरी संबंध
- A Beginner's Guide to Factor Analysis
- Exploratory Factor Analysis. A Book Manuscript by Tucker, L. & MacCallum R. (1993). Retrieved June 8, 2006, from: [2] Archived 2013-05-23 at the Wayback Machine
- Garson, G. David, "Factor Analysis," from Statnotes: Topics in Multivariate Analysis. Retrieved on April 13, 2009 from StatNotes: Topics in Multivariate Analysis, from G. David Garson at North Carolina State University, Public Administration Program
- Factor Analysis at 100 — conference material
- FARMS — Factor Analysis for Robust Microarray Summarization, an R package