कारक विश्लेषण: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 1: Line 1:
{{Short description|Statistical method}}
{{Short description|Statistical method}}
{{About|factor loadings|factorial design|Factorial experiment}}
{{About|कारक लोडिंग|फ़ैक्टोरियल डिजाइन|फैक्टोरियल प्रयोग}}
कारक विश्लेषण सांख्यिकी पद्धति है जिसका उपयोग प्रेक्षित, सहसंबद्ध [[चर (गणित)]] के बीच विचरण का वर्णन करने के लिए संभावित रूप से कम संख्या में न देखे गए चरों के संदर्भ में किया जाता है जिन्हें कारक कहा जाता है। उदाहरण के लिए, यह संभव है कि छह देखे गए चरों में भिन्नताएं मुख्य रूप से दो न देखे गए (अंतर्निहित) चरों में भिन्नताएं दर्शाती हैं। कारक विश्लेषण न देखे गए [[अव्यक्त चर]]ों की प्रतिक्रिया में ऐसी संयुक्त विविधताओं की खोज करता है। देखे गए चर को आंकड़ों के संदर्भ में संभावित कारकों और त्रुटियों और अवशेषों के [[रैखिक संयोजन]] के रूप में तैयार किया गया है, इसलिए कारक विश्लेषण को चर-में-त्रुटि मॉडल के विशेष मामले के रूप में माना जा सकता है।<ref>{{cite book |first=Karl G. |last=Jöreskog |authorlink=Karl Gustav Jöreskog |chapter=Factor Analysis as an Errors-in-Variables Model |pages=185–196 |title=आधुनिक मनोवैज्ञानिक मापन के सिद्धांत|location=Hillsdale |publisher=Erlbaum |year=1983 |isbn=0-89859-277-1 }}</ref>
 
सीधे शब्दों में कहें तो, किसी वेरिएबल का फैक्टर लोडिंग उस सीमा को निर्धारित करता है, जिस हद तक वेरिएबल किसी दिए गए फैक्टर से संबंधित है।<ref>{{cite book |last=Bandalos |first=Deborah L. |year=2017 |title=सामाजिक विज्ञान के लिए मापन सिद्धांत और अनुप्रयोग|publisher=The Guilford Press |isbn= }}</ref>
'''कारक विश्लेषण''' सांख्यिकी पद्धति है जिसका उपयोग प्रेक्षित, सहसंबद्ध [[चर (गणित)|वेरिएबल (गणित)]] के मध्य विचरण का वर्णन करने के लिए संभावित रूप से कम संख्या में न देखे गए वेरिएबल के संदर्भ में किया जाता है जिन्हें कारक कहा जाता है। उदाहरण के लिए, यह संभव है कि छह देखे गए वेरिएबलों में भिन्नताएं मुख्य रूप से दो न देखे गए (अंतर्निहित) वेरिएबलों में भिन्नताएं दर्शाती हैं। कारक विश्लेषण न देखे गए [[अव्यक्त चर|अव्यक्त वेरिएबलों]] की प्रतिक्रिया में ऐसी संयुक्त विविधताओं की खोज करता है। इसको देखे गए वेरिएबल के आंकड़ों के संदर्भ में संभावित कारकों और त्रुटियों और अवशेषों के [[रैखिक संयोजन]] के रूप में तैयार किया गया है, इसलिए कारक विश्लेषण को वेरिएबल-में-त्रुटि मॉडल के विशेष स्तिथियों के रूप में माना जा सकता है। <ref>{{cite book |first=Karl G. |last=Jöreskog |authorlink=Karl Gustav Jöreskog |chapter=Factor Analysis as an Errors-in-Variables Model |pages=185–196 |title=आधुनिक मनोवैज्ञानिक मापन के सिद्धांत|location=Hillsdale |publisher=Erlbaum |year=1983 |isbn=0-89859-277-1 }}</ref> सीधे शब्दों में कहेंतब, किसी वेरिएबल का फैक्टर लोडिंग उस सीमा को निर्धारित करता है, जिस सीमा तक वेरिएबल किसी दिए गए फैक्टर से संबंधित होता है। <ref>{{cite book |last=Bandalos |first=Deborah L. |year=2017 |title=सामाजिक विज्ञान के लिए मापन सिद्धांत और अनुप्रयोग|publisher=The Guilford Press |isbn= }}</ref>  
कारक विश्लेषणात्मक तरीकों के पीछे सामान्य तर्क यह है कि देखे गए चर के बीच अन्योन्याश्रितताओं के बारे में प्राप्त जानकारी का उपयोग बाद में डेटासेट में चर के सेट को कम करने के लिए किया जा सकता है। कारक विश्लेषण का उपयोग आमतौर पर [[साइकोमेट्रिक्स]], [[व्यक्तित्व]] मनोविज्ञान, जीव विज्ञान, [[विपणन]], [[उत्पाद प्रबंधन]], संचालन अनुसंधान, [[वित्त]] और [[ यंत्र अधिगम |यंत्र अधिगम]] में किया जाता है। यह उन डेटा सेटों से निपटने में मदद कर सकता है जहां बड़ी संख्या में देखे गए चर हैं जो अंतर्निहित/अव्यक्त चर की छोटी संख्या को प्रतिबिंबित करते हैं। यह सबसे अधिक उपयोग की जाने वाली अंतर-निर्भरता तकनीकों में से है और इसका उपयोग तब किया जाता है जब चर का प्रासंगिक सेट व्यवस्थित अंतर-निर्भरता दिखाता है और इसका उद्देश्य उन अव्यक्त कारकों का पता लगाना है जो समानता बनाते हैं।
 
कारक विश्लेषणात्मक विधियों के पीछे सामान्य तर्क यह है कि देखे गए वेरिएबल के मध्य अन्योन्याश्रितताओं के बारे में प्राप्त जानकारी का उपयोग और इसके पश्चात में डेटासमुच्चय में वेरिएबल के समुच्चय को कम करने के लिए किया जा सकता है। कारक विश्लेषण का उपयोग सामान्यतः [[साइकोमेट्रिक्स]], [[व्यक्तित्व]] मनोविज्ञान, जीव विज्ञान, [[विपणन]], [[उत्पाद प्रबंधन]], संचालन अनुसंधान, [[वित्त]] और [[ यंत्र अधिगम |यंत्र अधिगम]] में किया जाता है। यह उन डेटा समुच्चयों से निपटने में सहायता कर सकता है जहां बड़ी संख्या में देखे गए वेरिएबल हैं जो अंतर्निहित/अव्यक्त वेरिएबल की लघु संख्या को प्रतिबिंबित करते हैं। यह सबसे अधिक उपयोग की जाने वाली अंतर-निर्भरता तकनीकों में से है और इसका उपयोग तब किया जाता है जब वेरिएबल का प्रासंगिक समुच्चय व्यवस्थित अंतर-निर्भरता दिखाता है और इसका उद्देश्य उन अव्यक्त कारकों का पता लगाना है जो समानता बनाते हैं।


==सांख्यिकीय मॉडल==
==सांख्यिकीय मॉडल==


===परिभाषा===
===परिभाषा===
मॉडल सेट को समझाने का प्रयास करता है <math>p</math> प्रत्येक में अवलोकन <math>n</math> के सेट वाले व्यक्ति <math>k</math> सामान्य तथ्य (<math>f_{i,j}</math>) जहां प्रति इकाई प्रेक्षणों की तुलना में प्रति इकाई कम कारक हैं (<math>k<p</math>). प्रत्येक व्यक्ति के पास है <math>k</math> अपने स्वयं के सामान्य कारकों के, और ये कारक लोडिंग मैट्रिक्स के माध्यम से टिप्पणियों से संबंधित हैं (<math>L  \in \mathbb{R}^{p \times k}</math>), एकल अवलोकन के अनुसार, के अनुसार
मॉडल प्रत्येक <math>n</math> व्यक्तियों में <math>k</math> सामान्य कारकों <math>f_{i,j}</math> के समुच्चय के साथ <math>p</math> अवलोकनों के समुच्चय को समझाने का प्रयास करता है, जहां प्रति इकाई अवलोकनों की तुलना में प्रति इकाई कम कारक <math>k<p</math> होते हैं। प्रत्येक व्यक्ति के समीप अपने स्वयं के सामान्य कारक <math>k</math> होते हैं, और ये एकल अवलोकन के लिए, कारक लोडिंग आव्युह <math>L  \in \mathbb{R}^{p \times k}</math> के माध्यम से अवलोकनों से संबंधित होते हैं।


: <math>x_{i,m} - \mu_{i} = l_{i,1} f_{1,m} + \dots + l_{i,k} f_{k,m} + \varepsilon_{i,m} </math>
: <math>x_{i,m} - \mu_{i} = l_{i,1} f_{1,m} + \dots + l_{i,k} f_{k,m} + \varepsilon_{i,m} </math>
कहाँ
जहाँ
* <math>x_{i,m}</math> का मान है <math>i</math>का अवलोकन <math>m</math>वें व्यक्ति,
*<math>x_{i,m}</math> <math>m</math>वें व्यक्ति के <math>i</math>वें अवलोकन का मान है,
* <math>\mu_i</math> के लिए अवलोकन माध्य है <math>i</math>वें अवलोकन,
* <math>\mu_i</math> <math>i</math>वें अवलोकन के लिए अवलोकन माध्य है,
* <math>l_{i,j}</math> के लिए लोड हो रहा है <math>i</math>का अवलोकन <math>j</math>वें कारक,
*<math>l_{i,j}</math> <math>j</math>वें कारक के <math>i</math>वें अवलोकन के लिए लोडिंग है,
* <math>f_{j,m}</math> का मान है <math>j</math>का वां कारक <math>m</math>वें व्यक्ति, और
*<math>f_{j,m}</math> <math>m</math>वें व्यक्ति के <math>j</math>वें कारक का मान है, और
* <math>\varepsilon_{i,m} </math> है <math>(i,m)</math>माध्य शून्य और परिमित विचरण के साथ अवलोकित स्टोकेस्टिक त्रुटि पद।
*<math>\varepsilon_{i,m} </math> माध्य शून्य और परिमित विचरण के साथ <math>(i,m)</math>वां अवलोकित स्टोकेस्टिक त्रुटि शब्द है।


मैट्रिक्स नोटेशन में
आव्युह नोटेशन में


: <math>X - \Mu = L F + \varepsilon</math>
: <math>X - \Mu = L F + \varepsilon</math>
जहां अवलोकन मैट्रिक्स <math>X \in \mathbb{R}^{p \times n}</math>, मैट्रिक्स लोड हो रहा है <math>L \in \mathbb{R}^{p \times k}</math>, कारक मैट्रिक्स <math>F \in \mathbb{R}^{k \times n}</math>, त्रुटि शब्द मैट्रिक्स <math>\varepsilon \in \mathbb{R}^{p \times n}</math> और माध्य मैट्रिक्स <math>\Mu \in \mathbb{R}^{p \times n}</math> जिससे <math>(i,m)</math>वां तत्व बस है <math>\Mu_{i,m}=\mu_i</math>.
जहां अवलोकन आव्यूह <math>X \in \mathbb{R}^{p \times n}</math>, लोडिंग आव्यूह <math>L \in \mathbb{R}^{p \times k}</math>, फैक्टर आव्यूह <math>F \in \mathbb{R}^{k \times n}</math>, त्रुटि टर्म आव्यूह <math>\varepsilon \in \mathbb{R}^{p \times n}</math> और माध्य आव्यूह <math>\Mu \in \mathbb{R}^{p \times n}</math> है, जिससे <math>(i,m)</math>वां अवयव सिर्फ <math>\Mu_{i,m}=\mu_i</math> है।


इसके अलावा हम निम्नलिखित धारणाएँ भी लागू करेंगे <math>F</math>:
इसके अतिरिक्त हम <math>F</math> निम्नलिखित धारणाएँ भी लागू करेंगे :


# <math>F</math> और <math>\varepsilon</math> स्वतंत्र हैं.
# <math>F</math> और <math>\varepsilon</math> स्वतंत्र हैं.
# <math>\mathrm{E}(F) = 0</math>; कहाँ <math>\mathrm E</math> बहुभिन्नरूपी यादृच्छिक चर#अपेक्षित मान है
#<math>\mathrm{E}(F) = 0</math>; जहां <math>\mathrm E</math> अपेक्षा है
# <math>\mathrm{Cov}(F)=I</math> कहाँ <math>\mathrm{Cov}</math> सहप्रसरण मैट्रिक्स है, यह सुनिश्चित करने के लिए कि कारक असंबंधित हैं, और <math>I</math> पहचान मैट्रिक्स है.
# <math>\mathrm{Cov}(F)=I</math> जहाँ <math>\mathrm{Cov}</math> सहप्रसरण आव्युह है, यह सुनिश्चित करने के लिए कि कारक असंबंधित हैं, और <math>I</math> पहचान आव्युह है.


कल्पना करना <math>\mathrm{Cov}(X - \Mu)=\Sigma</math>. तब
कल्पना करना <math>\mathrm{Cov}(X - \Mu)=\Sigma</math>. तब
Line 35: Line 36:


: <math>\Sigma = L \mathrm{Cov}(F) L^T + \mathrm{Cov}(\varepsilon),\,</math>
: <math>\Sigma = L \mathrm{Cov}(F) L^T + \mathrm{Cov}(\varepsilon),\,</math>
या, सेटिंग <math>\Psi:=\mathrm{Cov}(\varepsilon)</math>,
या, समुच्चयिंग <math>\Psi:=\mathrm{Cov}(\varepsilon)</math>,


: <math>\Sigma = LL^T + \Psi.\,</math>
: <math>\Sigma = LL^T + \Psi.\,</math>
ध्यान दें कि किसी भी [[ऑर्थोगोनल मैट्रिक्स]] के लिए <math>Q</math>, अगर हम सेट करते हैं <math>L^\prime=\ LQ</math> और <math>F^\prime=Q^T F</math>, कारक होने और कारक लोडिंग के मानदंड अभी भी कायम हैं। इसलिए कारकों और कारक लोडिंग का सेट केवल [[ऑर्थोगोनल परिवर्तन]] तक अद्वितीय है।
ध्यान दें कि किसी भी [[ऑर्थोगोनल मैट्रिक्स|ऑर्थोगोनल आव्युह]] <math>Q</math> के लिए,यदि <math>L^\prime=\ LQ</math> और <math>F^\prime=Q^T F</math> और हम अगर हम समुच्चय करते हैं तब कारक और कारक लोडिंग के मानदंड अभी भी दृढ़ हैं। इसलिए कारकों और कारक लोडिंग का समुच्चय केवल [[ऑर्थोगोनल परिवर्तन]] तक अद्वितीय है।


===उदाहरण===
===उदाहरण===
मान लीजिए कि मनोवैज्ञानिक की परिकल्पना है कि [[बुद्धि (विशेषता)]] दो प्रकार की होती है, मौखिक बुद्धि और गणितीय बुद्धि, जिनमें से कोई भी प्रत्यक्ष रूप से नहीं देखी जाती है।{{Explanatory footnote|In this example, "verbal intelligence" and "mathematical intelligence" are latent variables.  The fact that they're not directly observed is what makes them latent.|name=latent variables|group=note}} 1000 छात्रों के 10 अलग-अलग शैक्षणिक क्षेत्रों में से प्रत्येक के परीक्षा अंकों में परिकल्पना के साक्ष्य मांगे गए हैं। यदि प्रत्येक छात्र को बड़ी आबादी (सांख्यिकी) से यादृच्छिक रूप से चुना जाता है, तो प्रत्येक छात्र के 10 अंक यादृच्छिक चर होते हैं। मनोवैज्ञानिक की परिकल्पना कह सकती है कि 10 अकादमिक क्षेत्रों में से प्रत्येक के लिए, उन सभी छात्रों के समूह पर औसत स्कोर जो मौखिक और गणितीय बुद्धि के लिए मूल्यों की कुछ सामान्य जोड़ी साझा करते हैं, कुछ [[स्थिरांक (गणित)]] उनकी मौखिक बुद्धि के स्तर का गुना है और अन्य स्थिरांक उनके गणितीय बुद्धि के स्तर का गुना है, यानी, यह उन दो कारकों का रैखिक संयोजन है। किसी विशेष विषय के लिए संख्याएँ, जिनके द्वारा अपेक्षित स्कोर प्राप्त करने के लिए दो प्रकार की बुद्धिमत्ता को गुणा किया जाता है, परिकल्पना द्वारा सभी बुद्धिमत्ता स्तर के जोड़े के लिए समान मानी जाती हैं, और इस विषय के लिए कारक लोडिंग कहलाती हैं। उदाहरण के लिए, परिकल्पना यह मान सकती है कि [[खगोल]] विज्ञान के क्षेत्र में अनुमानित औसत छात्र की योग्यता है
मान लीजिए कि मनोवैज्ञानिक की परिकल्पना है कि [[बुद्धि (विशेषता)]] दो प्रकार की होती है, मौखिक बुद्धि और गणितीय बुद्धि, जिनमें से कोई भी प्रत्यक्ष रूप से नहीं देखी जाती है। इसमें 1000 छात्रों के 10 भिन्न-भिन्न शैक्षणिक क्षेत्रों में से प्रत्येक के परीक्षा अंकों में परिकल्पना के साक्ष्य मांगे गए हैं। यदि प्रत्येक छात्र को बड़ी आपश्चाती (सांख्यिकी) से यादृच्छिक रूप से चुना जाता है,तब प्रत्येक छात्र के 10 अंक यादृच्छिक वेरिएबल होते हैं। मनोवैज्ञानिक की परिकल्पना कह सकती है कि 10 अकादमिक क्षेत्रों में से प्रत्येक के लिए, उन सभी छात्रों के समूह पर औसत स्कोर जो मौखिक और गणितीय बुद्धि के लिए मूल्यों की कुछ सामान्य जोड़ी साझा करते हैं, कुछ [[स्थिरांक (गणित)]] उनकी मौखिक बुद्धि के स्तर का यह अनेक गुना होता है और अन्य स्थिरांक उनके गणितीय बुद्धि के स्तर का अनेक गुना है, अथार्त, यह उन दो कारकों का रैखिक संयोजन है। किसी विशेष विषय के लिए संख्याएँ होती हैं, जिनके द्वारा अपेक्षित स्कोर प्राप्त करने के लिए दो प्रकार की बुद्धिमत्ता को गुणा किया जाता है, परिकल्पना द्वारा सभी बुद्धिमत्ता स्तर के जोड़े के लिए समान मानी जाती हैं, और इस विषय के लिए कारक लोडिंग कहलाती हैं। उदाहरण के लिए, परिकल्पना यह मान सकती है कि [[खगोल]] विज्ञान के क्षेत्र में अनुमानित औसत छात्र की योग्यता है


:{10 × छात्र की मौखिक बुद्धि} + {6 × छात्र की गणितीय बुद्धि}।
:{10 × छात्र की मौखिक बुद्धि} + {6 × छात्र की गणितीय बुद्धि}।


संख्या 10 और 6 खगोल विज्ञान से जुड़े कारक लोडिंग हैं। अन्य शैक्षणिक विषयों में अलग-अलग कारक लोड हो सकते हैं।
संख्या 10 और 6 खगोल विज्ञान से जुड़े कारक लोडिंग हैं। अन्य शैक्षणिक विषयों में भिन्न-भिन्न कारक लोड हो सकते हैं।


ऐसा माना जाता है कि मौखिक और गणितीय बुद्धि की समान डिग्री वाले दो छात्रों की खगोल विज्ञान में अलग-अलग मापी गई योग्यताएं हो सकती हैं क्योंकि व्यक्तिगत योग्यताएं औसत योग्यताओं (ऊपर अनुमानित) से भिन्न होती हैं और माप त्रुटि के कारण ही भिन्न होती हैं। इस तरह के मतभेदों को सामूहिक रूप से त्रुटि कहा जाता है - सांख्यिकीय शब्द जिसका अर्थ है वह मात्रा जिसके द्वारा किसी व्यक्ति को मापा जाता है, जो उसकी बुद्धिमत्ता के स्तर के लिए औसत या अनुमानित से भिन्न होता है (आंकड़ों में त्रुटियां और अवशेष देखें)।
ऐसा माना जाता है कि मौखिक और गणितीय बुद्धि की समान डिग्री वाले दो छात्रों की खगोल विज्ञान में भिन्न-भिन्न मापी गई योग्यताएं हो सकती हैं क्योंकि व्यक्तिगत योग्यताएं औसत योग्यताओं (ऊपर अनुमानित) से भिन्न होती हैं और इसमें माप त्रुटि के कारण ही भिन्न होती हैं। इस प्रकार के मतभेदों को सामूहिक रूप से त्रुटि कहा जाता है - सांख्यिकीय शब्द जिसका अर्थ है वह मात्रा जिसके द्वारा किसी व्यक्ति को मापा जाता है, जो उसकी बुद्धिमत्ता के स्तर के लिए औसत या अनुमानित से भिन्न होता है (आंकड़ों में त्रुटियां और अवशेष देखें)।


कारक विश्लेषण में जाने वाला अवलोकन योग्य डेटा 1000 छात्रों में से प्रत्येक के 10 अंक, कुल 10,000 नंबर होंगे। डेटा से प्रत्येक छात्र की दो प्रकार की बुद्धि के कारक लोडिंग और स्तर का अनुमान लगाया जाना चाहिए।
कारक विश्लेषण में जाने वाला अवलोकन योग्य डेटा 1000 छात्रों में से प्रत्येक के 10 अंक, कुल 10,000 नंबर होंते हैं। डेटा से प्रत्येक छात्र की दो प्रकार की बुद्धि के कारक लोडिंग और स्तर का अनुमान लगाया जाना चाहिए।


===उसी उदाहरण का गणितीय मॉडल===
===उसी उदाहरण का गणितीय मॉडल===
निम्नलिखित में, मैट्रिक्स को अनुक्रमित चर द्वारा दर्शाया जाएगा। विषय सूचकांकों को अक्षरों का उपयोग करके दर्शाया जाएगा <math>a</math>,<math>b</math> और <math>c</math>, से चलने वाले मानों के साथ <math>1</math> को <math>p</math> जो के बराबर है <math>10</math> उपरोक्त उदाहरण में. कारक सूचकांकों को अक्षरों का उपयोग करके दर्शाया जाएगा <math>p</math>, <math>q</math> और <math>r</math>, से चलने वाले मानों के साथ <math>1</math> को <math>k</math> जो के बराबर है <math>2</math> उपरोक्त उदाहरण में. उदाहरण या नमूना सूचकांकों को अक्षरों का उपयोग करके दर्शाया जाएगा <math>i</math>,<math>j</math> और <math>k</math>, से चलने वाले मानों के साथ <math>1</math> को <math>N</math>. उपरोक्त उदाहरण में, यदि नमूना <math>N=1000</math> विद्यार्थियों ने भाग लिया <math>p=10</math> परीक्षा, <math>i</math>छात्र इसके लिए स्कोर करते हैं <math>a</math>की परीक्षा दी है <math>x_{ai}</math>. कारक विश्लेषण का उद्देश्य चरों के बीच सहसंबंधों को चिह्नित करना है <math>x_a</math> जिनमें से <math>x_{ai}</math> विशेष उदाहरण, या अवलोकनों का समूह हैं। चर को समान स्तर पर रखने के लिए, उन्हें मानक स्कोर में [[सामान्यीकरण (सांख्यिकी)]] किया जाता है <math>z</math>:
निम्नलिखित में, आव्युह को अनुक्रमित वेरिएबल द्वारा दर्शाया जाएगा। "विषय" सूचकांकों को अक्षर <math>a</math>, <math>b</math> और <math>c</math>,का उपयोग करके दर्शाया जाएगा, जिसमें मान <math>1</math>से <math>p</math> तक चलेंगे जो उपरोक्त उदाहरण में <math>10</math> के सामान्य है। "कारक" सूचकांकों को अक्षर <math>p</math>, <math>q</math> और <math>r</math> का उपयोग करके दर्शाया जाएगा, जिसका मान <math>1</math> से <math>k</math> तक होगा जो उपरोक्त उदाहरण में <math>2</math> के सामान्य है। "उदाहरण" या "प्रतिरूप" सूचकांकों को <math>i</math>, <math>j</math> और <math>k</math> अक्षरों का उपयोग करके दर्शाया जाएगा, जिसमें मान <math>1</math> से <math>N</math> तक चलेंगे। उपरोक्त उदाहरण में, यदि <math>N=1000</math> छात्रों के प्रतिरूप ने <math>p=10</math> परीक्षाओं में भाग लिया, तब <math>i</math> <math>a</math> परीक्षा के लिए छात्र का स्कोर <math>x_{ai}</math> द्वारा दिया गया है। कारक विश्लेषण का उद्देश्य चर <math>x_a</math> के मध्य सहसंबंधों को चिह्नित करना है, जिनमें से <math>x_{ai}</math> विशेष उदाहरण, या अवलोकनों का समुच्चय है। वेरिएबलों को समान स्तर पर रखने के लिए, उन्हें मानक स्कोर <math>z</math> में [[सामान्यीकरण (सांख्यिकी)|सामान्यीकरण (सांख्यिकी]] किया जाता है |
:<math>z_{ai}=\frac{x_{ai}-\hat\mu_a}{\hat\sigma_a}</math>
:<math>z_{ai}=\frac{x_{ai}-\hat\mu_a}{\hat\sigma_a}</math>
जहां नमूना माध्य है:
जहां प्रतिरूप माध्य है:
:<math>\hat\mu_a=\tfrac{1}{N}\sum_i x_{ai}</math>
:<math>\hat\mu_a=\tfrac{1}{N}\sum_i x_{ai}</math>
और नमूना विचरण इस प्रकार दिया गया है:
और प्रतिरूप विचरण इस प्रकार दिया गया है:
:<math>\hat\sigma_a^2=\tfrac{1}{N-1}\sum_i (x_{ai}-\mu_a)^2</math>
:<math>\hat\sigma_a^2=\tfrac{1}{N-1}\sum_i (x_{ai}-\mu_a)^2</math>
इस विशेष नमूने के लिए कारक विश्लेषण मॉडल तब है:
इस विशेष प्रतिरूप के लिए कारक विश्लेषण मॉडल तब है:
:<math>\begin{matrix}z_{1,i} & =  & \ell_{1,1}F_{1,i} & + & \ell_{1,2}F_{2,i} & + & \varepsilon_{1,i} \\
:<math>\begin{matrix}z_{1,i} & =  & \ell_{1,1}F_{1,i} & + & \ell_{1,2}F_{2,i} & + & \varepsilon_{1,i} \\
\vdots & & \vdots & & \vdots & & \vdots \\
\vdots & & \vdots & & \vdots & & \vdots \\
Line 67: Line 68:
z_{ai}=\sum_p \ell_{ap}F_{pi}+\varepsilon_{ai}
z_{ai}=\sum_p \ell_{ap}F_{pi}+\varepsilon_{ai}
</math>
</math>
कहाँ
जहाँ
* <math>F_{1i}</math> है <math>i</math>वें छात्र की मौखिक बुद्धि,
* <math>F_{1i}</math>,<math>i</math>वें छात्र की मौखिक बुद्धि है,
* <math>F_{2i}</math> है <math>i</math>वें छात्र की गणितीय बुद्धि,
* <math>F_{2i}</math>,<math>i</math>वें छात्र की गणितीय बुद्धि हैं,
* <math>\ell_{ap}</math> के लिए कारक लोडिंग हैं <math>a</math>वें विषय, के लिए <math>p=1,2</math>.
* <math>\ell_{ap}</math>,<math>a</math>वें विषय, के लिए <math>p=1,2</math> के लिए कारक लोडिंग हैं।


[[मैट्रिक्स (गणित)]] नोटेशन में, हमारे पास है
[[मैट्रिक्स (गणित)|आव्युह (गणित)]] नोटेशन में, हमारे समीप है
:<math>Z=LF+\varepsilon</math>
:<math>Z=LF+\varepsilon</math>
उस पैमाने को दोगुना करके देखें जिस पर मौखिक बुद्धिमत्ता - प्रत्येक कॉलम में पहला घटक है <math>F</math>- मापा जाता है, और साथ ही मौखिक बुद्धिमत्ता के लिए कारक लोडिंग को आधा करने से मॉडल पर कोई फर्क नहीं पड़ता है। इस प्रकार, यह मानने से कोई व्यापकता नहीं खोती है कि मौखिक बुद्धि के लिए कारकों का मानक विचलन है <math>1</math>. इसी प्रकार गणितीय बुद्धि के लिए भी। इसके अलावा, समान कारणों से, यह मानने से कोई व्यापकता नहीं खोती है कि दोनों कारक एक-दूसरे से असंबद्ध हैं। दूसरे शब्दों में:
उस मापदंड को दोगुना करके देखें जिस पर मौखिक बुद्धिमत्ता <math>F</math>- प्रत्येक कॉलम में पहला घटक है मापा जाता है, और साथ ही मौखिक बुद्धिमत्ता के लिए कारक लोडिंग को आधा करने से मॉडल पर कोई भिन्नता नहीं दिखाई पड़ती है। इस प्रकार, यह मानने से कोई व्यापकता नहीं खोती है कि मौखिक बुद्धि के लिए कारकों का मानक विचलन <math>1</math> है | इसी प्रकार गणितीय बुद्धि के लिए भी हैं इसके अतिरिक्त, समान कारणों से, यह मानने से कोई व्यापकता विलुप्त नहीं है कि दोनों कारक एक-दूसरे से असंबद्ध हैं। दूसरे शब्दों में:
:<math>\sum_i F_{pi}F_{qi}=\delta_{pq}</math>
:<math>\sum_i F_{pi}F_{qi}=\delta_{pq}</math>
कहाँ <math>\delta_{pq}</math> [[क्रोनकर डेल्टा]] है (<math>0</math> कब <math>p \ne q</math> और <math>1</math> कब <math>p=q</math>).त्रुटियों को कारकों से स्वतंत्र माना जाता है:
जहाँ <math>\delta_{pq}</math> [[क्रोनकर डेल्टा]] है और (<math>0</math> जब <math>p \ne q</math> और <math>1</math> जब <math>p=q</math>).त्रुटियों को कारकों से स्वतंत्र माना जाता है:
:<math>\sum_i F_{pi}\varepsilon_{ai}=0</math>
:<math>\sum_i F_{pi}\varepsilon_{ai}=0</math>
ध्यान दें, चूँकि किसी समाधान का कोई भी घुमाव भी समाधान है, इससे कारकों की व्याख्या करना कठिन हो जाता है। नीचे नुकसान देखें. इस विशेष उदाहरण में, यदि हम पहले से नहीं जानते हैं कि दो प्रकार की बुद्धि असंबद्ध हैं, तो हम दो कारकों की दो अलग-अलग प्रकार की बुद्धि के रूप में व्याख्या नहीं कर सकते हैं। भले ही वे असंबंधित हों, हम बिना किसी बाहरी तर्क के यह नहीं बता सकते कि कौन सा कारक मौखिक बुद्धि से मेल खाता है और कौन सा गणितीय बुद्धि से मेल खाता है।
ध्यान दें, चूँकि किसी समाधान का कोई भी घुमाव भी समाधान है, इससे कारकों की व्याख्या करना कठिन हो जाता है। नीचे नुकसान देखें. इस विशेष उदाहरण में, यदि हम पहले से नहीं जानते हैं कि दो प्रकार की बुद्धि असंबद्ध हैं,तब हम दो कारकों की दो भिन्न-भिन्न प्रकार की बुद्धि के रूप में व्याख्या नहीं कर सकते हैं। भले ही वे असंबंधित हों, हम बिना किसी बाहरी तर्क के यह नहीं बता सकते कि कौन सा कारक मौखिक बुद्धि से मेल खाता है और कौन सा गणितीय बुद्धि से मेल खाता है।


लोडिंग का मान <math>L</math>, औसत <math>\mu</math>, और त्रुटियों की भिन्नताएँ <math>\varepsilon</math> प्रेक्षित डेटा को देखते हुए अनुमान लगाया जाना चाहिए <math>X</math> और <math>F</math> (कारकों के स्तर के बारे में धारणा किसी दिए गए के लिए तय की गई है <math>F</math>).
लोडिंग का मान <math>L</math>, औसत <math>\mu</math>, और त्रुटियों की भिन्नताएँ <math>\varepsilon</math> प्रेक्षित डेटा को देखते हुए अनुमान लगाया जाना चाहिए <math>X</math> और <math>F</math> (कारकों के स्तर के बारे में धारणा किसी दिए गए के लिए तय की गई है <math>F</math>).
मौलिक प्रमेय उपरोक्त शर्तों से प्राप्त किया जा सकता है:
मौलिक प्रमेय उपरोक्त शर्तों से प्राप्त किया जा सकता है:
:<math>\sum_i z_{ai}z_{bi}=\sum_j \ell_{aj}\ell_{bj}+\sum_i \varepsilon_{ai}\varepsilon_{bi}</math>
:<math>\sum_i z_{ai}z_{bi}=\sum_j \ell_{aj}\ell_{bj}+\sum_i \varepsilon_{ai}\varepsilon_{bi}</math>
बाईं ओर का शब्द है <math>(a,b)</math>-सहसंबंध मैट्रिक्स की अवधि (ए <math>p \times p</math> के उत्पाद के रूप में प्राप्त मैट्रिक्स <math> p \times N</math> देखे गए डेटा के स्थानान्तरण के साथ मानकीकृत अवलोकनों का मैट्रिक्स, और इसका <math>p</math> विकर्ण तत्व होंगे <math>1</math>एस। दाईं ओर दूसरा पद विकर्ण मैट्रिक्स होगा जिसमें इकाई से कम पद होंगे। दाईं ओर पहला पद कम सहसंबंध मैट्रिक्स है और इसके विकर्ण मानों को छोड़कर सहसंबंध मैट्रिक्स के बराबर होगा जो एकता से कम होगा। कम सहसंबंध मैट्रिक्स के इन विकर्ण तत्वों को सांप्रदायिकताएं कहा जाता है (जो कि देखे गए चर में भिन्नता के अंश का प्रतिनिधित्व करते हैं जो कारकों के कारण होता है):
बाईं ओर का शब्द है <math>(a,b)</math>-सहसंबंध आव्युह की अवधि (ए <math>p \times p</math> के उत्पाद के रूप में प्राप्त आव्युह <math> p \times N</math> देखे गए डेटा के स्थानान्तरण के साथ मानकीकृत अवलोकनों का आव्युह, और इसका <math>p</math> विकर्ण अवयव होंगे <math>1</math>एस। दाईं ओर दूसरा पद विकर्ण आव्युह होगा जिसमें इकाई से कम पद होंगे। दाईं ओर पहला पद कम सहसंबंध आव्युह है और इसके विकर्ण मानों को छोड़कर सहसंबंध आव्युह के सामान्य होगा जो एकता से कम होगा। कम सहसंबंध आव्युह के इन विकर्ण अवयवों को सांप्रदायिकताएं कहा जाता है (जो कि देखे गए वेरिएबल में भिन्नता के अंश का प्रतिनिधित्व करते हैं जो कारकों के कारण होता है):
:<math>
:<math>
h_a^2=1-\psi_a=\sum_j \ell_{aj}\ell_{aj}
h_a^2=1-\psi_a=\sum_j \ell_{aj}\ell_{aj}
</math>
</math>
नमूना डेटा <math>z_{ai}</math> नमूनाकरण त्रुटियों, मॉडल की अपर्याप्तता आदि के कारण ऊपर दिए गए मौलिक समीकरण का बिल्कुल पालन नहीं किया जाएगा। उपरोक्त मॉडल के किसी भी विश्लेषण का लक्ष्य कारकों का पता लगाना है <math>F_{pi}</math> और लोडिंग <math>\ell_{ap}</math> जो डेटा को सर्वोत्तम रूप से फिट करता है। कारक विश्लेषण में, सर्वोत्तम फिट को सहसंबंध मैट्रिक्स के ऑफ-विकर्ण अवशेषों में न्यूनतम माध्य वर्ग त्रुटि के रूप में परिभाषित किया गया है:<ref name="Harman">{{cite book |last=Harman |first=Harry H. |year=1976 |title=आधुनिक कारक विश्लेषण|publisher=University of Chicago Press |pages=175, 176 |isbn=978-0-226-31652-9 }}</ref>
प्रतिरूप डेटा <math>z_{ai}</math> प्रतिरूपकरण त्रुटियों, मॉडल की अपर्याप्तता आदि के कारण ऊपर दिए गए मौलिक समीकरण का बिल्कुल पालन नहीं किया जाएगा। उपरोक्त मॉडल के किसी भी विश्लेषण का लक्ष्य कारकों का पता लगाना है <math>F_{pi}</math> और लोडिंग <math>\ell_{ap}</math> जो डेटा को सर्वोत्तम रूप से फिट करता है। कारक विश्लेषण में, सर्वोत्तम फिट को सहसंबंध आव्युह के ऑफ-विकर्ण अवशेषों में न्यूनतम माध्य वर्ग त्रुटि के रूप में परिभाषित किया गया है:<ref name="Harman">{{cite book |last=Harman |first=Harry H. |year=1976 |title=आधुनिक कारक विश्लेषण|publisher=University of Chicago Press |pages=175, 176 |isbn=978-0-226-31652-9 }}</ref>
:<math>\varepsilon^2 = \sum_{a\ne b} \left[\sum_i z_{ai}z_{bi}-\sum_j \ell_{aj}\ell_{bj}\right]^2</math>
:<math>\varepsilon^2 = \sum_{a\ne b} \left[\sum_i z_{ai}z_{bi}-\sum_j \ell_{aj}\ell_{bj}\right]^2</math>
यह त्रुटि सहप्रसरण के ऑफ-विकर्ण घटकों को कम करने के बराबर है, जिसमें मॉडल समीकरणों में शून्य के अपेक्षित मान होते हैं। इसकी तुलना प्रमुख घटक विश्लेषण से की जानी चाहिए जो सभी अवशेषों की माध्य वर्ग त्रुटि को कम करने का प्रयास करता है।<ref name="Harman"/>हाई-स्पीड कंप्यूटर के आगमन से पहले, समस्या के अनुमानित समाधान खोजने के लिए काफी प्रयास किए गए थे, विशेष रूप से अन्य तरीकों से सांप्रदायिकताओं का अनुमान लगाने में, जो तब ज्ञात कम सहसंबंध मैट्रिक्स उत्पन्न करके समस्या को काफी सरल बनाता है। इसके बाद कारकों और लोडिंग का अनुमान लगाने के लिए इसका उपयोग किया गया। हाई-स्पीड कंप्यूटर के आगमन के साथ, न्यूनतमकरण की समस्या को पर्याप्त गति के साथ पुनरावृत्त रूप से हल किया जा सकता है, और सामुदायिकताओं की गणना पहले से आवश्यक होने के बजाय प्रक्रिया में की जाती है। [[सामान्यीकृत न्यूनतम अवशिष्ट विधि]] एल्गोरिथ्म इस समस्या के लिए विशेष रूप से उपयुक्त है, लेकिन समाधान खोजने का शायद ही यह एकमात्र पुनरावृत्त साधन है।
यह त्रुटि सहप्रसरण के ऑफ-विकर्ण घटकों को कम करने के सामान्य है, जिसमें मॉडल समीकरणों में शून्य के अपेक्षित मान होते हैं। इसकी तुलना प्रमुख घटक विश्लेषण से की जानी चाहिए जो सभी अवशेषों की माध्य वर्ग त्रुटि को कम करने का प्रयास करता है।<ref name="Harman"/>हाई-स्पीड कंप्यूटर के आगमन से पहले, समस्या के अनुमानित समाधान खोजने के लिए काफी प्रयास किए गए थे, विशेष रूप से अन्य विधियों से सांप्रदायिकताओं का अनुमान लगाने में, जो तब ज्ञात कम सहसंबंध आव्युह उत्पन्न करके समस्या को काफी सरल बनाता है। इसके पश्चात कारकों और लोडिंग का अनुमान लगाने के लिए इसका उपयोग किया गया। हाई-स्पीड कंप्यूटर के आगमन के साथ, न्यूनतमकरण की समस्या को पर्याप्त गति के साथ पुनरावृत्त रूप से हल किया जा सकता है, और सामुदायिकताओं की गणना पहले से आवश्यक होने के बजाय प्रक्रिया में की जाती है। [[सामान्यीकृत न्यूनतम अवशिष्ट विधि]] एल्गोरिथ्म इस समस्या के लिए विशेष रूप से उपयुक्त है, लेकिन समाधान खोजने का शायद ही यह एकमात्र पुनरावृत्त साधन है।


यदि समाधान कारकों को सहसंबंधित करने की अनुमति दी जाती है (उदाहरण के लिए 'ओब्लिमिन' रोटेशन में), तो संबंधित गणितीय मॉडल ऑर्थोगोनल निर्देशांक के बजाय [[तिरछा निर्देशांक]] का उपयोग करता है।
यदि समाधान कारकों को सहसंबंधित करने की अनुमति दी जाती है (उदाहरण के लिए 'ओब्लिमिन' रोटेशन में),तब संबंधित गणितीय मॉडल ऑर्थोगोनल निर्देशांक के बजाय [[तिरछा निर्देशांक]] का उपयोग करता है।


===ज्यामितीय व्याख्या===
===ज्यामितीय व्याख्या===
[[File:FactorPlot.svg|thumb|upright=1.5|प्रश्न पूछने के लिए 3 उत्तरदाताओं के लिए कारक विश्लेषण मापदंडों की ज्यामितीय व्याख्या। उत्तर इकाई वेक्टर द्वारा दर्शाया गया है <math>\mathbf{z}_a</math>, जिसे दो ऑर्थोनॉर्मल वैक्टर द्वारा परिभाषित विमान पर प्रक्षेपित किया जाता है <math>\mathbf{F}_1</math> और <math>\mathbf{F}_2</math>. प्रक्षेपण वेक्टर है <math>\hat{\mathbf{z}}_a</math> और त्रुटि <math>\boldsymbol{\varepsilon}_a</math> समतल के लंबवत है, ताकि <math>\mathbf{z}_a=\hat{\mathbf{z}}_a+\boldsymbol{\varepsilon}_a</math>. प्रक्षेपण वेक्टर <math>\hat{\mathbf{z}}_a</math> कारक सदिशों के रूप में दर्शाया जा सकता है <math>\hat{\mathbf{z}}_a=\ell_{a1}\mathbf{F}_1+\ell_{a2}\mathbf{F}_2</math>. प्रक्षेपण वेक्टर की लंबाई का वर्ग समुदाय है: <math>||\hat{\mathbf{z}}_a||^2=h^2_a</math>. यदि कोई अन्य डेटा वेक्टर <math>\mathbf{z}_b</math> के बीच के कोण की कोज्या को आलेखित किया गया <math>\mathbf{z}_a</math> और <math>\mathbf{z}_b</math> होगा <math>r_{ab}</math> : द <math>(a,b)</math>-सहसंबंध मैट्रिक्स में प्रवेश। (हरमन चित्र 4.3 से अनुकूलित)<ref name="Harman"/>]]कारक विश्लेषण के मापदंडों और चर को ज्यामितीय व्याख्या दी जा सकती है। आंकड़ा (<math>z_{ai}</math>), कारक (<math>F_{pi}</math>) और त्रुटियाँ (<math>\varepsilon_{ai}</math>) को वेक्टर के रूप में देखा जा सकता है <math>N</math>-आयामी यूक्लिडियन स्पेस (नमूना स्थान), के रूप में दर्शाया गया है <math>\mathbf{z}_a</math>, <math>\mathbf{F}_p</math> और <math>\boldsymbol{\varepsilon}_a</math> क्रमश। चूँकि डेटा मानकीकृत है, डेटा वेक्टर इकाई लंबाई के हैं (<math>||\mathbf{z}_a||=1</math>). कारक सदिश को परिभाषित करते हैं <math>k</math>इस स्थान में -आयामी रैखिक उपस्थान (यानी हाइपरप्लेन), जिस पर डेटा वैक्टर को ऑर्थोगोनल रूप से प्रक्षेपित किया जाता है। यह मॉडल समीकरण से निम्नानुसार है
[[File:FactorPlot.svg|thumb|upright=1.5|प्रश्न पूछने के लिए 3 उत्तरदाताओं के लिए कारक विश्लेषण मापदंडों की ज्यामितीय व्याख्या। उत्तर इकाई वेक्टर द्वारा दर्शाया गया है <math>\mathbf{z}_a</math>, जिसे दो ऑर्थोनॉर्मल वैक्टर द्वारा परिभाषित विमान पर प्रक्षेपित किया जाता है <math>\mathbf{F}_1</math> और <math>\mathbf{F}_2</math>. प्रक्षेपण वेक्टर है <math>\hat{\mathbf{z}}_a</math> और त्रुटि <math>\boldsymbol{\varepsilon}_a</math> समतल के लंबवत है, ताकि <math>\mathbf{z}_a=\hat{\mathbf{z}}_a+\boldsymbol{\varepsilon}_a</math>. प्रक्षेपण वेक्टर <math>\hat{\mathbf{z}}_a</math> कारक सदिशों के रूप में दर्शाया जा सकता है <math>\hat{\mathbf{z}}_a=\ell_{a1}\mathbf{F}_1+\ell_{a2}\mathbf{F}_2</math>. प्रक्षेपण वेक्टर की लंबाई का वर्ग समुदाय है: <math>||\hat{\mathbf{z}}_a||^2=h^2_a</math>. यदि कोई अन्य डेटा वेक्टर <math>\mathbf{z}_b</math> के मध्य के कोण की कोज्या को आलेखित किया गया <math>\mathbf{z}_a</math> और <math>\mathbf{z}_b</math> होगा <math>r_{ab}</math> : द <math>(a,b)</math>-सहसंबंध आव्युह में प्रवेश। (हरमन चित्र 4.3 से अनुकूलित)<ref name="Harman"/>]]कारक विश्लेषण के मापदंडों और वेरिएबल को ज्यामितीय व्याख्या दी जा सकती है। आंकड़ा (<math>z_{ai}</math>), कारक (<math>F_{pi}</math>) और त्रुटियाँ (<math>\varepsilon_{ai}</math>) को वेक्टर के रूप में देखा जा सकता है <math>N</math>-आयामी यूक्लिडियन स्पेस (प्रतिरूप स्थान), के रूप में दर्शाया गया है <math>\mathbf{z}_a</math>, <math>\mathbf{F}_p</math> और <math>\boldsymbol{\varepsilon}_a</math> क्रमश। चूँकि डेटा मानकीकृत है, डेटा वेक्टर इकाई लंबाई के हैं (<math>||\mathbf{z}_a||=1</math>). कारक सदिश को परिभाषित करते हैं <math>k</math>इस स्थान में -आयामी रैखिक उपस्थान (अथार्त हाइपरप्लेन), जिस पर डेटा वैक्टर को ऑर्थोगोनल रूप से प्रक्षेपित किया जाता है। यह मॉडल समीकरण से निम्नानुसार है
:<math>\mathbf{z}_a=\sum_p \ell_{ap} \mathbf{F}_p+\boldsymbol{\varepsilon}_a</math>
:<math>\mathbf{z}_a=\sum_p \ell_{ap} \mathbf{F}_p+\boldsymbol{\varepsilon}_a</math>
और कारकों और त्रुटियों की स्वतंत्रता: <math>\mathbf{F}_p\cdot\boldsymbol{\varepsilon}_a=0</math>. उपरोक्त उदाहरण में, हाइपरप्लेन केवल दो कारक वैक्टर द्वारा परिभाषित 2-आयामी विमान है। हाइपरप्लेन पर डेटा वैक्टर का प्रक्षेपण इसके द्वारा दिया गया है
और कारकों और त्रुटियों की स्वतंत्रता: <math>\mathbf{F}_p\cdot\boldsymbol{\varepsilon}_a=0</math>. उपरोक्त उदाहरण में, हाइपरप्लेन केवल दो कारक वैक्टर द्वारा परिभाषित 2-आयामी विमान है। हाइपरप्लेन पर डेटा वैक्टर का प्रक्षेपण इसके द्वारा दिया गया है
:<math>\hat{\mathbf{z}}_a=\sum_p \ell_{ap}\mathbf{F}_p</math>
:<math>\hat{\mathbf{z}}_a=\sum_p \ell_{ap}\mathbf{F}_p</math>
और त्रुटियाँ उस अनुमानित बिंदु से डेटा बिंदु तक वेक्टर हैं और हाइपरप्लेन के लंबवत हैं। कारक विश्लेषण का लक्ष्य हाइपरप्लेन ढूंढना है जो कुछ अर्थों में डेटा के लिए सबसे उपयुक्त है, इसलिए इससे कोई फर्क नहीं पड़ता कि इस हाइपरप्लेन को परिभाषित करने वाले कारक वैक्टर को कैसे चुना जाता है, जब तक कि वे स्वतंत्र हैं और हाइपरप्लेन में स्थित हैं। हम उन्हें ऑर्थोगोनल और सामान्य दोनों के रूप में निर्दिष्ट करने के लिए स्वतंत्र हैं (<math>\mathbf{F}_p\cdot \mathbf{F}_q=\delta_{pq}</math>) व्यापकता की हानि के बिना। कारकों का उपयुक्त सेट पाए जाने के बाद, उन्हें हाइपरप्लेन के भीतर मनमाने ढंग से घुमाया जा सकता है, ताकि कारक वैक्टर का कोई भी घुमाव उसी हाइपरप्लेन को परिभाषित करेगा, और समाधान भी होगा। परिणामस्वरूप, उपरोक्त उदाहरण में, जिसमें फिटिंग हाइपरप्लेन दो आयामी है, यदि हम पहले से नहीं जानते हैं कि दो प्रकार की बुद्धि असंबंधित हैं, तो हम दो कारकों की दो अलग-अलग प्रकार की बुद्धि के रूप में व्याख्या नहीं कर सकते हैं। भले ही वे असंबंधित हों, हम बिना किसी बाहरी तर्क के यह नहीं बता सकते कि कौन सा कारक मौखिक बुद्धि से मेल खाता है और कौन सा गणितीय बुद्धि से मेल खाता है, या क्या कारक दोनों का रैखिक संयोजन हैं।
और त्रुटियाँ उस अनुमानित बिंदु से डेटा बिंदु तक वेक्टर हैं और हाइपरप्लेन के लंबवत हैं। कारक विश्लेषण का लक्ष्य हाइपरप्लेन ढूंढना है जो कुछ अर्थों में डेटा के लिए सबसे उपयुक्त है, इसलिए इससे कोई भिन्नता नहीं पड़ता कि इस हाइपरप्लेन को परिभाषित करने वाले कारक वैक्टर को कैसे चुना जाता है, जब तक कि वे स्वतंत्र हैं और हाइपरप्लेन में स्थित हैं। हम उन्हें ऑर्थोगोनल और सामान्य दोनों के रूप में निर्दिष्ट करने के लिए स्वतंत्र हैं (<math>\mathbf{F}_p\cdot \mathbf{F}_q=\delta_{pq}</math>) व्यापकता की हानि के बिना। कारकों का उपयुक्त समुच्चय पाए जाने के पश्चात, उन्हें हाइपरप्लेन के भीतर मनमाने ढंग से घुमाया जा सकता है, ताकि कारक वैक्टर का कोई भी घुमाव उसी हाइपरप्लेन को परिभाषित करेगा, और समाधान भी होगा। परिणामस्वरूप, उपरोक्त उदाहरण में, जिसमें फिटिंग हाइपरप्लेन दो आयामी है, यदि हम पहले से नहीं जानते हैं कि दो प्रकार की बुद्धि असंबंधित हैं,तब हम दो कारकों की दो भिन्न-भिन्न प्रकार की बुद्धि के रूप में व्याख्या नहीं कर सकते हैं। भले ही वे असंबंधित हों, हम बिना किसी बाहरी तर्क के यह नहीं बता सकते कि कौन सा कारक मौखिक बुद्धि से मेल खाता है और कौन सा गणितीय बुद्धि से मेल खाता है, या क्या कारक दोनों का रैखिक संयोजन हैं।


डेटा वैक्टर <math>\mathbf{z}_a</math> इकाई लंबाई है. डेटा के लिए सहसंबंध मैट्रिक्स की प्रविष्टियाँ दी गई हैं <math>r_{ab}=\mathbf{z}_a\cdot\mathbf{z}_b</math>. सहसंबंध मैट्रिक्स को ज्यामितीय रूप से दो डेटा वैक्टर के बीच के कोण के कोसाइन के रूप में व्याख्या किया जा सकता है <math>\mathbf{z}_a</math> और <math>\mathbf{z}_b</math>. विकर्ण तत्व स्पष्ट रूप से होंगे <math>1</math>s और ऑफ विकर्ण तत्वों का निरपेक्ष मान एकता से कम या उसके बराबर होगा। घटे हुए सहसंबंध मैट्रिक्स को इस प्रकार परिभाषित किया गया है
डेटा वैक्टर <math>\mathbf{z}_a</math> इकाई लंबाई है. डेटा के लिए सहसंबंध आव्युह की प्रविष्टियाँ दी गई हैं <math>r_{ab}=\mathbf{z}_a\cdot\mathbf{z}_b</math>. सहसंबंध आव्युह को ज्यामितीय रूप से दो डेटा वैक्टर के मध्य के कोण के कोसाइन के रूप में व्याख्या किया जा सकता है <math>\mathbf{z}_a</math> और <math>\mathbf{z}_b</math>. विकर्ण अवयव स्पष्ट रूप से होंगे <math>1</math>s और ऑफ विकर्ण अवयवों का निरपेक्ष मान एकता से कम या उसके सामान्य होगा। घटे हुए सहसंबंध आव्युह को इस प्रकार परिभाषित किया गया है
:<math>\hat{r}_{ab}=\hat{\mathbf{z}}_a\cdot\hat{\mathbf{z}}_b</math>.
:<math>\hat{r}_{ab}=\hat{\mathbf{z}}_a\cdot\hat{\mathbf{z}}_b</math>.


कारक विश्लेषण का लक्ष्य फिटिंग हाइपरप्लेन का चयन करना है, ताकि सहसंबंध मैट्रिक्स के विकर्ण तत्वों को छोड़कर, कम सहसंबंध मैट्रिक्स सहसंबंध मैट्रिक्स को यथासंभव पुन: उत्पन्न कर सके, जिन्हें इकाई मान के रूप में जाना जाता है। दूसरे शब्दों में, लक्ष्य डेटा में क्रॉस-सहसंबंधों को यथासंभव सटीक रूप से पुन: पेश करना है। विशेष रूप से, फिटिंग हाइपरप्लेन के लिए, ऑफ-विकर्ण घटकों में माध्य वर्ग त्रुटि
कारक विश्लेषण का लक्ष्य फिटिंग हाइपरप्लेन का चयन करना है, ताकि सहसंबंध आव्युह के विकर्ण अवयवों को छोड़कर, कम सहसंबंध आव्युह सहसंबंध आव्युह को यथासंभव पुन: उत्पन्न कर सके, जिन्हें इकाई मान के रूप में जाना जाता है। दूसरे शब्दों में, लक्ष्य डेटा में क्रॉस-सहसंबंधों को यथासंभव सटीक रूप से पुन: पेश करना है। विशेष रूप से, फिटिंग हाइपरप्लेन के लिए, ऑफ-विकर्ण घटकों में माध्य वर्ग त्रुटि
:<math>\varepsilon^2=\sum_{a\ne b} \left(r_{ab}-\hat{r}_{ab}\right)^2</math>
:<math>\varepsilon^2=\sum_{a\ne b} \left(r_{ab}-\hat{r}_{ab}\right)^2</math>
इसे न्यूनतम किया जाना है, और इसे ऑर्थोनॉर्मल फैक्टर वैक्टर के सेट के संबंध में इसे कम करके पूरा किया जाता है। यह देखा जा सकता है
इसे न्यूनतम किया जाना है, और इसे ऑर्थोनॉर्मल फैक्टर वैक्टर के समुच्चय के संबंध में इसे कम करके पूरा किया जाता है। यह देखा जा सकता है
:<math>
:<math>
r_{ab}-\hat{r}_{ab}= \boldsymbol{\varepsilon}_a\cdot\boldsymbol{\varepsilon}_b
r_{ab}-\hat{r}_{ab}= \boldsymbol{\varepsilon}_a\cdot\boldsymbol{\varepsilon}_b
</math>
</math>
दाईं ओर का शब्द केवल त्रुटियों का सहप्रसरण है। मॉडल में, त्रुटि सहप्रसरण को विकर्ण मैट्रिक्स कहा गया है और इसलिए उपरोक्त न्यूनतमकरण समस्या वास्तव में मॉडल के लिए सबसे उपयुक्त होगी: यह त्रुटि सहप्रसरण का नमूना अनुमान प्राप्त करेगी जिसके ऑफ-विकर्ण घटकों को औसत वर्ग अर्थ में न्यूनतम किया गया है। यह देखा जा सकता है कि जब से <math>\hat{z}_a</math> डेटा वेक्टर के ऑर्थोगोनल प्रक्षेपण हैं, उनकी लंबाई अनुमानित डेटा वेक्टर की लंबाई से कम या उसके बराबर होगी, जो कि एकता है। इन लंबाइयों का वर्ग कम सहसंबंध मैट्रिक्स के विकर्ण तत्व मात्र हैं। कम सहसंबंध मैट्रिक्स के इन विकर्ण तत्वों को सांप्रदायिकता के रूप में जाना जाता है:
दाईं ओर का शब्द केवल त्रुटियों का सहप्रसरण है। मॉडल में, त्रुटि सहप्रसरण को विकर्ण आव्युह कहा गया है और इसलिए उपरोक्त न्यूनतमकरण समस्या वास्तव में मॉडल के लिए सबसे उपयुक्त होगी: यह त्रुटि सहप्रसरण का प्रतिरूप अनुमान प्राप्त करेगी जिसके ऑफ-विकर्ण घटकों को औसत वर्ग अर्थ में न्यूनतम किया गया है। यह देखा जा सकता है कि जब से <math>\hat{z}_a</math> डेटा वेक्टर के ऑर्थोगोनल प्रक्षेपण हैं, उनकी लंबाई अनुमानित डेटा वेक्टर की लंबाई से कम या उसके सामान्य होगी, जो कि एकता है। इन लंबाइयों का वर्ग कम सहसंबंध आव्युह के विकर्ण अवयव मात्र हैं। कम सहसंबंध आव्युह के इन विकर्ण अवयवों को सांप्रदायिकता के रूप में जाना जाता है:


:<math>
:<math>
{h_a}^2=||\hat{\mathbf{z}}_a||^2= \sum_p {\ell_{ap}}^2
{h_a}^2=||\hat{\mathbf{z}}_a||^2= \sum_p {\ell_{ap}}^2
</math>
</math>
समुदायों के बड़े मूल्य यह संकेत देंगे कि फिटिंग हाइपरप्लेन सहसंबंध मैट्रिक्स को सटीक रूप से पुन: प्रस्तुत कर रहा है। कारकों के माध्य मानों को भी शून्य होने के लिए बाध्य किया जाना चाहिए, जिससे यह निष्कर्ष निकलता है कि त्रुटियों का माध्य मान भी शून्य होगा।
समुदायों के बड़े मूल्य यह संकेत देंगे कि फिटिंग हाइपरप्लेन सहसंबंध आव्युह को सटीक रूप से पुन: प्रस्तुत कर रहा है। कारकों के माध्य मानों को भी शून्य होने के लिए बाध्य किया जाना चाहिए, जिससे यह निष्कर्ष निकलता है कि त्रुटियों का माध्य मान भी शून्य होगा।


==व्यावहारिक कार्यान्वयन==
==व्यावहारिक कार्यान्वयन==
Line 121: Line 122:
====खोजपूर्ण कारक विश्लेषण====
====खोजपूर्ण कारक विश्लेषण====
{{broader|Exploratory factor analysis}}
{{broader|Exploratory factor analysis}}
खोजपूर्ण कारक विश्लेषण (ईएफए) का उपयोग उन वस्तुओं और समूह वस्तुओं के बीच जटिल अंतर्संबंधों की पहचान करने के लिए किया जाता है जो एकीकृत अवधारणाओं का हिस्सा हैं।<ref name=Polit>{{cite book |author=Polit DF Beck CT |title=Nursing Research: Generating and Assessing Evidence for Nursing Practice, 9th ed. |year=2012 |publisher=Wolters Klower Health, Lippincott Williams & Wilkins |location=Philadelphia, USA}}</ref> शोधकर्ता कारकों के बीच संबंधों के बारे में कोई पूर्व धारणा नहीं बनाता है।<ref name=Polit/>
खोजपूर्ण कारक विश्लेषण (ईएफए) का उपयोग उन वस्तुओं और समूह वस्तुओं के मध्य जटिल अंतर्संबंधों की पहचान करने के लिए किया जाता है जो एकीकृत अवधारणाओं का हिस्सा हैं।<ref name=Polit>{{cite book |author=Polit DF Beck CT |title=Nursing Research: Generating and Assessing Evidence for Nursing Practice, 9th ed. |year=2012 |publisher=Wolters Klower Health, Lippincott Williams & Wilkins |location=Philadelphia, USA}}</ref> शोधकर्ता कारकों के मध्य संबंधों के बारे में कोई पूर्व धारणा नहीं बनाता है।<ref name=Polit/>




====पुष्टि कारक विश्लेषण====
====पुष्टि कारक विश्लेषण====
{{broader|Confirmatory factor analysis}}
{{broader|Confirmatory factor analysis}}
पुष्टिकरण कारक विश्लेषण (सीएफए) अधिक जटिल दृष्टिकोण है जो इस परिकल्पना का परीक्षण करता है कि आइटम विशिष्ट कारकों से जुड़े हैं।<ref name=Polit/>सीएफए माप मॉडल का परीक्षण करने के लिए [[संरचनात्मक समीकरण मॉडलिंग]] का उपयोग करता है जिससे कारकों पर लोड करने से देखे गए चर और न देखे गए चर के बीच संबंधों के मूल्यांकन की अनुमति मिलती है।<ref name=Polit/> संरचनात्मक समीकरण मॉडलिंग दृष्टिकोण माप त्रुटि को समायोजित कर सकते हैं और [[न्यूनतम-वर्ग अनुमान]] की तुलना में कम प्रतिबंधात्मक हैं।<ref name=Polit/> परिकल्पित मॉडल का परीक्षण वास्तविक डेटा के विरुद्ध किया जाता है, और विश्लेषण अव्यक्त चर (कारकों) पर देखे गए चर के लोडिंग के साथ-साथ अव्यक्त चर के बीच सहसंबंध को प्रदर्शित करेगा।<ref name=Polit/>
पुष्टिकरण कारक विश्लेषण (सीएफए) अधिक जटिल दृष्टिकोण है जो इस परिकल्पना का परीक्षण करता है कि आइटम विशिष्ट कारकों से जुड़े हैं।<ref name=Polit/>सीएफए माप मॉडल का परीक्षण करने के लिए [[संरचनात्मक समीकरण मॉडलिंग]] का उपयोग करता है जिससे कारकों पर लोड करने से देखे गए वेरिएबल और न देखे गए वेरिएबल के मध्य संबंधों के मूल्यांकन की अनुमति मिलती है।<ref name=Polit/> संरचनात्मक समीकरण मॉडलिंग दृष्टिकोण माप त्रुटि को समायोजित कर सकते हैं और [[न्यूनतम-वर्ग अनुमान]] की तुलना में कम प्रतिबंधात्मक हैं।<ref name=Polit/> परिकल्पित मॉडल का परीक्षण वास्तविक डेटा के विरुद्ध किया जाता है, और विश्लेषण अव्यक्त वेरिएबल (कारकों) पर देखे गए वेरिएबल के लोडिंग के साथ-साथ अव्यक्त वेरिएबल के मध्य सहसंबंध को प्रदर्शित करेगा।<ref name=Polit/>




Line 132: Line 133:
प्रमुख घटक विश्लेषण (पीसीए) कारक निष्कर्षण के लिए व्यापक रूप से उपयोग की जाने वाली विधि है, जो ईएफए का पहला चरण है।<ref name=Polit/>अधिकतम संभावित विचरण निकालने के लिए कारक भार की गणना की जाती है, क्रमिक फैक्टरिंग तब तक जारी रहती है जब तक कि कोई और सार्थक विचरण नहीं बचा हो।<ref name=Polit/>फिर विश्लेषण के लिए कारक मॉडल को घुमाया जाना चाहिए।<ref name=Polit/>
प्रमुख घटक विश्लेषण (पीसीए) कारक निष्कर्षण के लिए व्यापक रूप से उपयोग की जाने वाली विधि है, जो ईएफए का पहला चरण है।<ref name=Polit/>अधिकतम संभावित विचरण निकालने के लिए कारक भार की गणना की जाती है, क्रमिक फैक्टरिंग तब तक जारी रहती है जब तक कि कोई और सार्थक विचरण नहीं बचा हो।<ref name=Polit/>फिर विश्लेषण के लिए कारक मॉडल को घुमाया जाना चाहिए।<ref name=Polit/>


कैनोनिकल फैक्टर विश्लेषण, जिसे राव की कैनोनिकल फैक्टरिंग भी कहा जाता है, पीसीए के समान मॉडल की गणना करने की अलग विधि है, जो प्रमुख अक्ष विधि का उपयोग करती है। विहित कारक विश्लेषण उन कारकों की तलाश करता है जिनका प्रेक्षित चर के साथ उच्चतम विहित सहसंबंध होता है। विहित कारक विश्लेषण डेटा के मनमाने पुनर्स्केलिंग से अप्रभावित रहता है।
कैनोनिकल फैक्टर विश्लेषण, जिसे राव की कैनोनिकल फैक्टरिंग भी कहा जाता है, पीसीए के समान मॉडल की गणना करने की भिन्न विधि है, जो प्रमुख अक्ष विधि का उपयोग करती है। विहित कारक विश्लेषण उन कारकों की तलाश करता है जिनका प्रेक्षित वेरिएबल के साथ उच्चतम विहित सहसंबंध होता है। विहित कारक विश्लेषण डेटा के मनमाने पुनर्स्केलिंग से अप्रभावित रहता है।


सामान्य कारक विश्लेषण, जिसे [[प्रमुख कारक विश्लेषण]] (पीएफए) या प्रमुख अक्ष फैक्टरिंग (पीएएफ) भी कहा जाता है, सबसे कम कारकों की तलाश करता है जो चर के सेट के सामान्य विचरण (सहसंबंध) के लिए जिम्मेदार हो सकते हैं।
सामान्य कारक विश्लेषण, जिसे [[प्रमुख कारक विश्लेषण]] (पीएफए) या प्रमुख अक्ष फैक्टरिंग (पीएएफ) भी कहा जाता है, सबसे कम कारकों की तलाश करता है जो वेरिएबल के समुच्चय के सामान्य विचरण (सहसंबंध) के लिए जिम्मेदार हो सकते हैं।


छवि फैक्टरिंग वास्तविक चर के बजाय अनुमानित चर के सहसंबंध मैट्रिक्स पर आधारित है, जहां प्रत्येक चर की भविष्यवाणी कई प्रतिगमन का उपयोग करके दूसरों से की जाती है।
छवि फैक्टरिंग वास्तविक वेरिएबल के बजाय अनुमानित वेरिएबल के सहसंबंध आव्युह पर आधारित है, जहां प्रत्येक वेरिएबल की भविष्यवाणी कई प्रतिगमन का उपयोग करके दूसरों से की जाती है।


अल्फा फैक्टरिंग कारकों की विश्वसनीयता को अधिकतम करने पर आधारित है, यह मानते हुए कि चर को चर के ब्रह्मांड से यादृच्छिक रूप से नमूना लिया जाता है। अन्य सभी विधियाँ यह मानती हैं कि मामलों को नमूनाकृत किया गया है और चरों को निश्चित किया गया है।
अल्फा फैक्टरिंग कारकों की विश्वसनीयता को अधिकतम करने पर आधारित है, यह मानते हुए कि वेरिएबल को वेरिएबल के ब्रह्मांड से यादृच्छिक रूप से प्रतिरूप लिया जाता है। अन्य सभी विधियाँ यह मानती हैं कि मामलों को प्रतिरूपकृत किया गया है और वेरिएबलों को निश्चित किया गया है।


कारक प्रतिगमन मॉडल कारक मॉडल और प्रतिगमन मॉडल का संयोजन मॉडल है; या वैकल्पिक रूप से, इसे हाइब्रिड कारक मॉडल के रूप में देखा जा सकता है,<ref name="meng2011">{{cite journal|last=Meng |first=J. |title=एक गैर-नकारात्मक हाइब्रिड कारक मॉडल का उपयोग करके ग्लियोब्लास्टोमा में माइक्रोआरएनए और प्रतिलेखन कारकों द्वारा सहकारी जीन नियमों को उजागर करें|journal=International Conference on Acoustics, Speech and Signal Processing |year=2011 |url=http://www.cmsworldwide.com/ICASSP2011/Papers/ViewPapers.asp?PaperNum=4439 |url-status=dead |archive-url=https://web.archive.org/web/20111123144133/http://www.cmsworldwide.com/ICASSP2011/Papers/ViewPapers.asp?PaperNum=4439 |archive-date=2011-11-23 }}</ref> जिनके कारक आंशिक रूप से ज्ञात हैं।
कारक प्रतिगमन मॉडल कारक मॉडल और प्रतिगमन मॉडल का संयोजन मॉडल है; या वैकल्पिक रूप से, इसे हाइब्रिड कारक मॉडल के रूप में देखा जा सकता है,<ref name="meng2011">{{cite journal|last=Meng |first=J. |title=एक गैर-नकारात्मक हाइब्रिड कारक मॉडल का उपयोग करके ग्लियोब्लास्टोमा में माइक्रोआरएनए और प्रतिलेखन कारकों द्वारा सहकारी जीन नियमों को उजागर करें|journal=International Conference on Acoustics, Speech and Signal Processing |year=2011 |url=http://www.cmsworldwide.com/ICASSP2011/Papers/ViewPapers.asp?PaperNum=4439 |url-status=dead |archive-url=https://web.archive.org/web/20111123144133/http://www.cmsworldwide.com/ICASSP2011/Papers/ViewPapers.asp?PaperNum=4439 |archive-date=2011-11-23 }}</ref> जिनके कारक आंशिक रूप से ज्ञात हैं।
Line 162: Line 163:


===कारकों की संख्या निर्धारित करने के लिए मानदंड===
===कारकों की संख्या निर्धारित करने के लिए मानदंड===
शोधकर्ता कारक प्रतिधारण के लिए ऐसे व्यक्तिपरक या मनमाने मानदंडों से बचना चाहते हैं क्योंकि यह मेरे लिए समझ में आता है। इस समस्या को हल करने के लिए कई वस्तुनिष्ठ तरीके विकसित किए गए हैं, जो उपयोगकर्ताओं को जांच के लिए समाधानों की उचित श्रृंखला निर्धारित करने की अनुमति देते हैं।<ref name="Zwick1986">{{cite journal |last1=Zwick |first1=William R. |last2=Velicer |first2=Wayne F. |title=बनाए रखने के लिए घटकों की संख्या निर्धारित करने के लिए पांच नियमों की तुलना।|journal=Psychological Bulletin |date=1986 |volume=99 |issue=3 |pages=432–442 |doi=10.1037/0033-2909.99.3.432}}</ref> हालाँकि ये अलग-अलग विधियाँ अक्सर एक-दूसरे से असहमत होती हैं कि कितने कारकों को बरकरार रखा जाना चाहिए। उदाहरण के लिए, [[समानांतर विश्लेषण]] 5 कारकों का सुझाव दे सकता है जबकि वेलिसर का एमएपी 6 का सुझाव देता है, इसलिए शोधकर्ता 5 और 6-कारक समाधान दोनों का अनुरोध कर सकता है और बाहरी डेटा और सिद्धांत के संबंध में प्रत्येक पर चर्चा कर सकता है।
शोधकर्ता कारक प्रतिधारण के लिए ऐसे व्यक्तिपरक या मनमाने मानदंडों से बचना चाहते हैं क्योंकि यह मेरे लिए समझ में आता है। इस समस्या को हल करने के लिए कई वस्तुनिष्ठ विधियों विकसित किए गए हैं, जो उपयोगकर्ताओं को जांच के लिए समाधानों की उचित श्रृंखला निर्धारित करने की अनुमति देते हैं।<ref name="Zwick1986">{{cite journal |last1=Zwick |first1=William R. |last2=Velicer |first2=Wayne F. |title=बनाए रखने के लिए घटकों की संख्या निर्धारित करने के लिए पांच नियमों की तुलना।|journal=Psychological Bulletin |date=1986 |volume=99 |issue=3 |pages=432–442 |doi=10.1037/0033-2909.99.3.432}}</ref> हालाँकि ये भिन्न-भिन्न विधियाँ अक्सर एक-दूसरे से असहमत होती हैं कि कितने कारकों को बरकरार रखा जाना चाहिए। उदाहरण के लिए, [[समानांतर विश्लेषण]] 5 कारकों का सुझाव दे सकता है जबकि वेलिसर का एमएपी 6 का सुझाव देता है, इसलिए शोधकर्ता 5 और 6-कारक समाधान दोनों का अनुरोध कर सकता है और बाहरी डेटा और सिद्धांत के संबंध में प्रत्येक पर चर्चा कर सकता है।


====आधुनिक मानदंड====
====आधुनिक मानदंड====
हॉर्न का समानांतर विश्लेषण (पीए):<ref name="Horn1965">{{cite journal |last1=Horn |first1=John L. |title=कारक विश्लेषण में कारकों की संख्या के लिए एक तर्क और परीक्षण|journal=Psychometrika |date=June 1965 |volume=30 |issue=2 |pages=179–185 |doi=10.1007/BF02289447|pmid=14306381 |s2cid=19663974 }}</ref> मोंटे-कार्लो आधारित सिमुलेशन विधि जो देखे गए स्वदेशी मूल्यों की तुलना असंबद्ध सामान्य चर से प्राप्त मूल्यों से करती है। कारक या घटक को बरकरार रखा जाता है यदि संबंधित आइगेनवैल्यू यादृच्छिक डेटा से प्राप्त आइजेनवैल्यू के वितरण के 95वें प्रतिशतक से बड़ा है। बनाए रखने के लिए घटकों की संख्या निर्धारित करने के लिए पीए अधिक सामान्यतः अनुशंसित नियमों में से है,<ref name="Zwick1986" /><ref>{{Cite arXiv|last=Dobriban|first=Edgar|date=2017-10-02|title=कारक विश्लेषण और पीसीए के लिए क्रमपरिवर्तन विधियाँ|class=math.ST|language=en|eprint=1710.00479v2}}</ref> लेकिन कई प्रोग्राम इस विकल्प को शामिल करने में विफल रहते हैं (एक उल्लेखनीय अपवाद [[आर (प्रोग्रामिंग भाषा)]] है)।<ref>* {{cite journal | last1 = Ledesma | first1 = R.D. | last2 = Valero-Mora | first2 = P. | year = 2007 | title = Determining the Number of Factors to Retain in EFA: An easy-to-use computer program for carrying out Parallel Analysis | url = http://pareonline.net/getvn.asp?v=12&n=2 | journal = Practical Assessment Research & Evaluation | volume = 12 | issue = 2| pages = 1–11 }}</ref> हालाँकि, एंटोन फॉर्मैन ने सैद्धांतिक और अनुभवजन्य दोनों साक्ष्य प्रदान किए कि इसका अनुप्रयोग कई मामलों में उचित नहीं हो सकता है क्योंकि इसका प्रदर्शन नमूना आकार, आइटम प्रतिक्रिया सिद्धांत # आइटम प्रतिक्रिया फ़ंक्शन और [[सहसंबंध गुणांक]] के प्रकार से काफी प्रभावित होता है।<ref>Tran, U. S., & Formann, A. K. (2009). Performance of parallel analysis in retrieving unidimensionality in the presence of binary data. ''Educational and Psychological Measurement, 69,'' 50-61.</ref>
हॉर्न का समानांतर विश्लेषण (पीए):<ref name="Horn1965">{{cite journal |last1=Horn |first1=John L. |title=कारक विश्लेषण में कारकों की संख्या के लिए एक तर्क और परीक्षण|journal=Psychometrika |date=June 1965 |volume=30 |issue=2 |pages=179–185 |doi=10.1007/BF02289447|pmid=14306381 |s2cid=19663974 }}</ref> मोंटे-कार्लो आधारित सिमुलेशन विधि जो देखे गए स्वदेशी मूल्यों की तुलना असंबद्ध सामान्य वेरिएबल से प्राप्त मूल्यों से करती है। कारक या घटक को बरकरार रखा जाता है यदि संबंधित आइगेनवैल्यू यादृच्छिक डेटा से प्राप्त आइजेनवैल्यू के वितरण के 95वें प्रतिशतक से बड़ा है। बनाए रखने के लिए घटकों की संख्या निर्धारित करने के लिए पीए अधिक सामान्यतः अनुशंसित नियमों में से है,<ref name="Zwick1986" /><ref>{{Cite arXiv|last=Dobriban|first=Edgar|date=2017-10-02|title=कारक विश्लेषण और पीसीए के लिए क्रमपरिवर्तन विधियाँ|class=math.ST|language=en|eprint=1710.00479v2}}</ref> लेकिन कई प्रोग्राम इस विकल्प को शामिल करने में विफल रहते हैं (एक उल्लेखनीय अपवाद [[आर (प्रोग्रामिंग भाषा)]] है)।<ref>* {{cite journal | last1 = Ledesma | first1 = R.D. | last2 = Valero-Mora | first2 = P. | year = 2007 | title = Determining the Number of Factors to Retain in EFA: An easy-to-use computer program for carrying out Parallel Analysis | url = http://pareonline.net/getvn.asp?v=12&n=2 | journal = Practical Assessment Research & Evaluation | volume = 12 | issue = 2| pages = 1–11 }}</ref> हालाँकि, एंटोन फॉर्मैन ने सैद्धांतिक और अनुभवजन्य दोनों साक्ष्य प्रदान किए कि इसका अनुप्रयोग कई मामलों में उचित नहीं हो सकता है क्योंकि इसका प्रदर्शन प्रतिरूप आकार, आइटम प्रतिक्रिया सिद्धांत # आइटम प्रतिक्रिया फ़ंक्शन और [[सहसंबंध गुणांक]] के प्रकार से काफी प्रभावित होता है।<ref>Tran, U. S., & Formann, A. K. (2009). Performance of parallel analysis in retrieving unidimensionality in the presence of binary data. ''Educational and Psychological Measurement, 69,'' 50-61.</ref>
वेलिसर (1976) एमएपी परीक्षण<ref name=Velicer>{{cite journal|last=Velicer|first=W.F.|title=आंशिक सहसंबंधों के मैट्रिक्स से घटकों की संख्या निर्धारित करना|journal=Psychometrika|year=1976|volume=41|issue=3|pages=321–327|doi=10.1007/bf02293557|s2cid=122907389}}</ref> जैसा कि कर्टनी द्वारा वर्णित है (2013)<ref name="pareonline.net">Courtney, M. G. R. (2013). Determining the number of factors to retain in EFA: Using the SPSS R-Menu v2.0 to make more judicious estimations. Practical Assessment, Research and Evaluation, 18(8). Available online:
वेलिसर (1976) एमएपी परीक्षण<ref name=Velicer>{{cite journal|last=Velicer|first=W.F.|title=आंशिक सहसंबंधों के मैट्रिक्स से घटकों की संख्या निर्धारित करना|journal=Psychometrika|year=1976|volume=41|issue=3|pages=321–327|doi=10.1007/bf02293557|s2cid=122907389}}</ref> जैसा कि कर्टनी द्वारा वर्णित है (2013)<ref name="pareonline.net">Courtney, M. G. R. (2013). Determining the number of factors to retain in EFA: Using the SPSS R-Menu v2.0 to make more judicious estimations. Practical Assessment, Research and Evaluation, 18(8). Available online:
http://pareonline.net/getvn.asp?v=18&n=8</ref> "इसमें पूर्ण प्रमुख घटक विश्लेषण शामिल है जिसके बाद आंशिक सहसंबंधों के मैट्रिक्स की श्रृंखला की जांच की जाती है" (पृष्ठ 397 (हालांकि ध्यान दें कि यह उद्धरण वेलिसर (1976) में नहीं होता है और उद्धृत पृष्ठ संख्या उद्धरण के पृष्ठों के बाहर है)। चरण "0" के लिए वर्ग सहसंबंध (चित्र 4 देखें) अपूर्ण सहसंबंध मैट्रिक्स के लिए औसत वर्ग-विकर्ण सहसंबंध है। चरण 1 पर, पहले प्रमुख घटक और उससे संबंधित वस्तुओं को आंशिक रूप से हटा दिया जाता है। इसके बाद, बाद के सहसंबंध मैट्रिक्स के लिए औसत वर्ग-विकर्ण सहसंबंध की गणना चरण 1 के लिए की जाती है। चरण 2 पर, पहले दो प्रमुख घटकों को आंशिक रूप से हटा दिया जाता है और परिणामी औसत वर्ग-विकर्ण सहसंबंध की फिर से गणना की जाती है। गणना k शून्य से चरण के लिए की जाती है (k मैट्रिक्स में चर की कुल संख्या का प्रतिनिधित्व करता है)। इसके बाद, प्रत्येक चरण के लिए सभी औसत वर्ग सहसंबंधों को पंक्तिबद्ध किया जाता है और विश्लेषण में चरण संख्या जिसके परिणामस्वरूप सबसे कम औसत वर्ग आंशिक सहसंबंध होता है, घटकों की संख्या निर्धारित करता है या बनाए रखने के लिए कारक।<ref name=Velicer/>इस विधि द्वारा, घटकों को तब तक बनाए रखा जाता है जब तक सहसंबंध मैट्रिक्स में भिन्नता अवशिष्ट या त्रुटि भिन्नता के विपरीत व्यवस्थित भिन्नता का प्रतिनिधित्व करती है। यद्यपि पद्धतिगत रूप से प्रमुख घटक विश्लेषण के समान, एमएपी तकनीक को कई सिमुलेशन अध्ययनों में बनाए रखने के लिए कारकों की संख्या निर्धारित करने में काफी अच्छा प्रदर्शन करते दिखाया गया है।<ref name="Zwick1986" /><ref name="Warne, R. T. 2014"/><ref name =Ruscio>{{cite journal|last=Ruscio|first=John|author2=Roche, B.|title=ज्ञात तथ्यात्मक संरचना के तुलनात्मक डेटा का उपयोग करके खोजपूर्ण कारक विश्लेषण में बनाए रखने के लिए कारकों की संख्या निर्धारित करना|journal=Psychological Assessment|year=2012|volume=24|issue=2|pages=282–292|doi=10.1037/a0025697|pmid=21966933}}</ref><ref name="Garrido">Garrido, L. E., & Abad, F. J., & Ponsoda, V. (2012). A new look at Horn's parallel analysis with ordinal variables. Psychological Methods. Advance online publication. {{doi|10.1037/a0030005}}</ref> यह प्रक्रिया SPSS के उपयोगकर्ता इंटरफ़ेस के माध्यम से उपलब्ध कराई गई है,<ref name="pareonline.net"/>साथ ही आर (प्रोग्रामिंग भाषा) के लिए मनोवैज्ञानिक पैकेज।<ref>{{cite journal |last1=Revelle |first1=William |title=Determining the number of factors: the example of the NEO-PI-R |date=2007 |url=http://www.personality-project.org/r/book/numberoffactors.pdf}}</ref><ref>{{cite web |last1=Revelle |first1=William |title=psych: Procedures for Psychological, Psychometric, and PersonalityResearch |url=https://cran.r-project.org/web/packages/psych/ |date=8 January 2020}}</ref>
http://pareonline.net/getvn.asp?v=18&n=8</ref> "इसमें पूर्ण प्रमुख घटक विश्लेषण शामिल है जिसके पश्चात आंशिक सहसंबंधों के आव्युह की श्रृंखला की जांच की जाती है" (पृष्ठ 397 (हालांकि ध्यान दें कि यह उद्धरण वेलिसर (1976) में नहीं होता है और उद्धृत पृष्ठ संख्या उद्धरण के पृष्ठों के बाहर है)। चरण "0" के लिए वर्ग सहसंबंध (चित्र 4 देखें) अपूर्ण सहसंबंध आव्युह के लिए औसत वर्ग-विकर्ण सहसंबंध है। चरण 1 पर, पहले प्रमुख घटक और उससे संबंधित वस्तुओं को आंशिक रूप से हटा दिया जाता है। इसके पश्चात, पश्चात के सहसंबंध आव्युह के लिए औसत वर्ग-विकर्ण सहसंबंध की गणना चरण 1 के लिए की जाती है। चरण 2 पर, पहले दो प्रमुख घटकों को आंशिक रूप से हटा दिया जाता है और परिणामी औसत वर्ग-विकर्ण सहसंबंध की फिर से गणना की जाती है। गणना k शून्य से चरण के लिए की जाती है (k आव्युह में वेरिएबल की कुल संख्या का प्रतिनिधित्व करता है)। इसके पश्चात, प्रत्येक चरण के लिए सभी औसत वर्ग सहसंबंधों को पंक्तिबद्ध किया जाता है और विश्लेषण में चरण संख्या जिसके परिणामस्वरूप सबसे कम औसत वर्ग आंशिक सहसंबंध होता है, घटकों की संख्या निर्धारित करता है या बनाए रखने के लिए कारक।<ref name=Velicer/>इस विधि द्वारा, घटकों को तब तक बनाए रखा जाता है जब तक सहसंबंध आव्युह में भिन्नता अवशिष्ट या त्रुटि भिन्नता के विपरीत व्यवस्थित भिन्नता का प्रतिनिधित्व करती है। यद्यपि पद्धतिगत रूप से प्रमुख घटक विश्लेषण के समान, एमएपी तकनीक को कई सिमुलेशन अध्ययनों में बनाए रखने के लिए कारकों की संख्या निर्धारित करने में काफी अच्छा प्रदर्शन करते दिखाया गया है।<ref name="Zwick1986" /><ref name="Warne, R. T. 2014"/><ref name =Ruscio>{{cite journal|last=Ruscio|first=John|author2=Roche, B.|title=ज्ञात तथ्यात्मक संरचना के तुलनात्मक डेटा का उपयोग करके खोजपूर्ण कारक विश्लेषण में बनाए रखने के लिए कारकों की संख्या निर्धारित करना|journal=Psychological Assessment|year=2012|volume=24|issue=2|pages=282–292|doi=10.1037/a0025697|pmid=21966933}}</ref><ref name="Garrido">Garrido, L. E., & Abad, F. J., & Ponsoda, V. (2012). A new look at Horn's parallel analysis with ordinal variables. Psychological Methods. Advance online publication. {{doi|10.1037/a0030005}}</ref> यह प्रक्रिया SPSS के उपयोगकर्ता इंटरफ़ेस के माध्यम से उपलब्ध कराई गई है,<ref name="pareonline.net"/>साथ ही आर (प्रोग्रामिंग भाषा) के लिए मनोवैज्ञानिक पैकेज।<ref>{{cite journal |last1=Revelle |first1=William |title=Determining the number of factors: the example of the NEO-PI-R |date=2007 |url=http://www.personality-project.org/r/book/numberoffactors.pdf}}</ref><ref>{{cite web |last1=Revelle |first1=William |title=psych: Procedures for Psychological, Psychometric, and PersonalityResearch |url=https://cran.r-project.org/web/packages/psych/ |date=8 January 2020}}</ref>




==== पुराने तरीके ====
==== पुराने विधियों ====
कैसर मानदंड: कैसर नियम 1.0 के तहत eigenvalues ​​​​के साथ सभी घटकों को छोड़ने के लिए है - यह औसत एकल आइटम द्वारा दर्ज की गई जानकारी के बराबर eigenvalue है।<ref name="Kaiser1960">{{cite journal |last1=Kaiser |first1=Henry F. |title=कारक विश्लेषण के लिए इलेक्ट्रॉनिक कंप्यूटर का अनुप्रयोग|journal=Educational and Psychological Measurement |date=April 1960 |volume=20 |issue=1 |pages=141–151 |doi=10.1177/001316446002000116|s2cid=146138712 }}</ref> [[एसपीएसएस]] और अधिकांश सांख्यिकीय सॉफ़्टवेयर में कैसर मानदंड डिफ़ॉल्ट है, लेकिन कारकों की संख्या का अनुमान लगाने के लिए एकमात्र कट-ऑफ मानदंड के रूप में उपयोग किए जाने पर इसकी अनुशंसा नहीं की जाती है क्योंकि यह कारकों को अधिक निकालने की प्रवृत्ति रखता है।<ref>{{cite book |first1=D.L. |last1=Bandalos |first2=M.R. |last2=Boehm-Kaufman |chapter=Four common misconceptions in exploratory factor analysis |editor1-first=Charles E. |editor1-last=Lance |editor2-first=Robert J. |editor2-last=Vandenberg |title=Statistical and Methodological Myths and Urban Legends: Doctrine, Verity and Fable in the Organizational and Social Sciences |chapter-url=https://books.google.com/books?id=KFAnkvqD8CgC&pg=PA61 |year=2008 |publisher=Taylor & Francis |isbn=978-0-8058-6237-9 |pages=61–87}}</ref> इस पद्धति का रूपांतर तैयार किया गया है जहां शोधकर्ता प्रत्येक आइगेनवैल्यू के लिए आत्म[[विश्वास अंतराल]] की गणना करता है और केवल उन कारकों को बरकरार रखता है जिनका संपूर्ण आत्मविश्वास अंतराल 1.0 से अधिक है।<ref name="Warne, R. T. 2014">{{cite journal | last1 = Warne | first1 = R. T. | last2 = Larsen | first2 = R. | year = 2014 | title = खोजपूर्ण कारक विश्लेषण में कारकों की संख्या निर्धारित करने के लिए गुटमैन नियम के प्रस्तावित संशोधन का मूल्यांकन करना| journal = Psychological Test and Assessment Modeling | volume = 56 | pages = 104–123 }}</ref><ref>{{cite journal | last1 = Larsen | first1 = R. | last2 = Warne | first2 = R. T. | year = 2010 | title = खोजपूर्ण कारक विश्लेषण में eigenvalues ​​​​के लिए आत्मविश्वास अंतराल का अनुमान लगाना| journal = Behavior Research Methods | volume = 42 | issue = 3| pages = 871–876 | doi = 10.3758/BRM.42.3.871 | pmid = 20805609 | doi-access = free }}</ref>
कैसर मानदंड: कैसर नियम 1.0 के तहत eigenvalues ​​​​के साथ सभी घटकों को छोड़ने के लिए है - यह औसत एकल आइटम द्वारा दर्ज की गई जानकारी के सामान्य eigenvalue है।<ref name="Kaiser1960">{{cite journal |last1=Kaiser |first1=Henry F. |title=कारक विश्लेषण के लिए इलेक्ट्रॉनिक कंप्यूटर का अनुप्रयोग|journal=Educational and Psychological Measurement |date=April 1960 |volume=20 |issue=1 |pages=141–151 |doi=10.1177/001316446002000116|s2cid=146138712 }}</ref> [[एसपीएसएस]] और अधिकांश सांख्यिकीय सॉफ़्टवेयर में कैसर मानदंड डिफ़ॉल्ट है, लेकिन कारकों की संख्या का अनुमान लगाने के लिए एकमात्र कट-ऑफ मानदंड के रूप में उपयोग किए जाने पर इसकी अनुशंसा नहीं की जाती है क्योंकि यह कारकों को अधिक निकालने की प्रवृत्ति रखता है।<ref>{{cite book |first1=D.L. |last1=Bandalos |first2=M.R. |last2=Boehm-Kaufman |chapter=Four common misconceptions in exploratory factor analysis |editor1-first=Charles E. |editor1-last=Lance |editor2-first=Robert J. |editor2-last=Vandenberg |title=Statistical and Methodological Myths and Urban Legends: Doctrine, Verity and Fable in the Organizational and Social Sciences |chapter-url=https://books.google.com/books?id=KFAnkvqD8CgC&pg=PA61 |year=2008 |publisher=Taylor & Francis |isbn=978-0-8058-6237-9 |pages=61–87}}</ref> इस पद्धति का रूपांतर तैयार किया गया है जहां शोधकर्ता प्रत्येक आइगेनवैल्यू के लिए आत्म[[विश्वास अंतराल]] की गणना करता है और केवल उन कारकों को बरकरार रखता है जिनका संपूर्ण आत्मविश्वास अंतराल 1.0 से अधिक है।<ref name="Warne, R. T. 2014">{{cite journal | last1 = Warne | first1 = R. T. | last2 = Larsen | first2 = R. | year = 2014 | title = खोजपूर्ण कारक विश्लेषण में कारकों की संख्या निर्धारित करने के लिए गुटमैन नियम के प्रस्तावित संशोधन का मूल्यांकन करना| journal = Psychological Test and Assessment Modeling | volume = 56 | pages = 104–123 }}</ref><ref>{{cite journal | last1 = Larsen | first1 = R. | last2 = Warne | first2 = R. T. | year = 2010 | title = खोजपूर्ण कारक विश्लेषण में eigenvalues ​​​​के लिए आत्मविश्वास अंतराल का अनुमान लगाना| journal = Behavior Research Methods | volume = 42 | issue = 3| pages = 871–876 | doi = 10.3758/BRM.42.3.871 | pmid = 20805609 | doi-access = free }}</ref>
[[मिट्टी - रोढ़ी वाला भूखंड]]:<ref>{{cite journal|first1=Raymond |last1=Cattell|journal=Multivariate Behavioral Research|volume=1|number=2|pages=245–76|year=1966|title=गुणनखंडों की संख्या के लिए रोड़ी परीक्षण|doi=10.1207/s15327906mbr0102_10|pmid=26828106}}</ref>
[[मिट्टी - रोढ़ी वाला भूखंड]]:<ref>{{cite journal|first1=Raymond |last1=Cattell|journal=Multivariate Behavioral Research|volume=1|number=2|pages=245–76|year=1966|title=गुणनखंडों की संख्या के लिए रोड़ी परीक्षण|doi=10.1207/s15327906mbr0102_10|pmid=26828106}}</ref>
कैटेल स्क्री परीक्षण घटकों को एक्स-अक्ष के रूप में और संबंधित [[eigenvalue]] को वाई-अक्ष के रूप में प्लॉट करता है। जैसे-जैसे कोई दाईं ओर बढ़ता है, बाद के घटकों की ओर, स्वदेशी मूल्य कम हो जाते हैं। जब गिरावट बंद हो जाती है और वक्र कम तेज गिरावट की ओर कोहनी बनाता है, तो कैटेल का स्क्री परीक्षण कोहनी से शुरू होने वाले सभी घटकों को छोड़ने के लिए कहता है। शोधकर्ता-नियंत्रित विक्षनरी:फज फ़ैक्टर के प्रति उत्तरदायी होने के कारण कभी-कभी इस नियम की आलोचना की जाती है। यानी, चूंकि कोहनी चुनना व्यक्तिपरक हो सकता है क्योंकि वक्र में कई कोहनी होती हैं या चिकनी वक्र होती है, शोधकर्ता को अपने शोध एजेंडे द्वारा वांछित कारकों की संख्या पर कट-ऑफ निर्धारित करने का प्रलोभन दिया जा सकता है।
कैटेल स्क्री परीक्षण घटकों को एक्स-अक्ष के रूप में और संबंधित [[eigenvalue]] को वाई-अक्ष के रूप में प्लॉट करता है। जैसे-जैसे कोई दाईं ओर बढ़ता है, पश्चात के घटकों की ओर, स्वदेशी मूल्य कम हो जाते हैं। जब गिरावट बंद हो जाती है और वक्र कम तेज गिरावट की ओर कोहनी बनाता है,तब कैटेल का स्क्री परीक्षण कोहनी से शुरू होने वाले सभी घटकों को छोड़ने के लिए कहता है। शोधकर्ता-नियंत्रित विक्षनरी:फज फ़ैक्टर के प्रति उत्तरदायी होने के कारण कभी-कभी इस नियम की आलोचना की जाती है। अथार्त, चूंकि कोहनी चुनना व्यक्तिपरक हो सकता है क्योंकि वक्र में कई कोहनी होती हैं या चिकनी वक्र होती है, शोधकर्ता को अपने शोध एजेंडे द्वारा वांछित कारकों की संख्या पर कट-ऑफ निर्धारित करने का प्रलोभन दिया जा सकता है।


वेरिएंस ने मानदंड समझाया: कुछ शोधकर्ता भिन्नता के 90% (कभी-कभी 80%) को ध्यान में रखने के लिए पर्याप्त कारकों को रखने के नियम का उपयोग करते हैं। जहां शोधकर्ता का लक्ष्य ओकाम के रेजर पर जोर देता है (यथासंभव कुछ कारकों के साथ भिन्नता की व्याख्या करना), मानदंड 50% तक कम हो सकता है।
वेरिएंस ने मानदंड समझाया: कुछ शोधकर्ता भिन्नता के 90% (कभी-कभी 80%) को ध्यान में रखने के लिए पर्याप्त कारकों को रखने के नियम का उपयोग करते हैं। जहां शोधकर्ता का लक्ष्य ओकाम के रेजर पर जोर देता है (यथासंभव कुछ कारकों के साथ भिन्नता की व्याख्या करना), मानदंड 50% तक कम हो सकता है।
Line 183: Line 184:


===रोटेशन विधियाँ===
===रोटेशन विधियाँ===
अनरोटेटेड आउटपुट पहले कारक, फिर दूसरे फैक्टर आदि के कारण होने वाले विचरण को अधिकतम करता है। अनरोटेटेड समाधान [[ ओर्थोगोनल |ओर्थोगोनल]] है। इसका मतलब है कि कारकों के बीच सहसंबंध शून्य है। अनरोटेटेड समाधान का उपयोग करने का नुकसान यह है कि आमतौर पर अधिकांश आइटम शुरुआती कारकों पर लोड होते हैं और कई आइटम से अधिक कारकों पर काफी हद तक लोड होते हैं।
अनरोटेटेड आउटपुट पहले कारक, फिर दूसरे फैक्टर आदि के कारण होने वाले विचरण को अधिकतम करता है। अनरोटेटेड समाधान [[ ओर्थोगोनल |ओर्थोगोनल]] है। इसका मतलब है कि कारकों के मध्य सहसंबंध शून्य है। अनरोटेटेड समाधान का उपयोग करने का नुकसान यह है कि सामान्यतः अधिकांश आइटम शुरुआती कारकों पर लोड होते हैं और कई आइटम से अधिक कारकों पर काफी सीमा तक लोड होते हैं।


रोटेशन, लोडिंग का पैटर्न बनाने के लिए समन्वय प्रणाली के अक्षों को रोटेशन (गणित) द्वारा व्याख्या करना आसान बनाता है, जहां प्रत्येक आइटम केवल कारक पर दृढ़ता से लोड होता है और अन्य कारकों पर अधिक कमजोर रूप से लोड होता है। घुमाव ऑर्थोगोनल या तिरछा हो सकता है। तिरछा घुमाव कारकों को सहसंबंधित करने की अनुमति देता है।<ref name="StackExchangeRotation">{{cite web |title=कारक रोटेशन के तरीके|url=https://stats.stackexchange.com/q/185216 |website=Stack Exchange |access-date=7 November 2022}}</ref>
रोटेशन, लोडिंग का पैटर्न बनाने के लिए समन्वय प्रणाली के अक्षों को रोटेशन (गणित) द्वारा व्याख्या करना आसान बनाता है, जहां प्रत्येक आइटम केवल कारक पर दृढ़ता से लोड होता है और अन्य कारकों पर अधिक कमजोर रूप से लोड होता है। घुमाव ऑर्थोगोनल या तिरछा हो सकता है। तिरछा घुमाव कारकों को सहसंबंधित करने की अनुमति देता है।<ref name="StackExchangeRotation">{{cite web |title=कारक रोटेशन के तरीके|url=https://stats.stackexchange.com/q/185216 |website=Stack Exchange |access-date=7 November 2022}}</ref>
[[वेरिमैक्स रोटेशन]] सबसे अधिक इस्तेमाल की जाने वाली रोटेशन विधि है। वेरिमैक्स कारक अक्षों का ऑर्थोगोनल रोटेशन है जो कारक लोडिंग मैट्रिक्स में सभी चर (पंक्तियों) पर कारक (स्तंभ) के वर्ग लोडिंग के विचरण को अधिकतम करता है। प्रत्येक कारक में कारक द्वारा बड़े लोडिंग के साथ केवल कुछ चर होते हैं। वेरिमैक्स लोडिंग मैट्रिक्स के कॉलम को सरल बनाता है। इससे प्रत्येक चर को ही कारक से पहचानना यथासंभव आसान हो जाता है।
[[वेरिमैक्स रोटेशन]] सबसे अधिक इस्तेमाल की जाने वाली रोटेशन विधि है। वेरिमैक्स कारक अक्षों का ऑर्थोगोनल रोटेशन है जो कारक लोडिंग आव्युह में सभी वेरिएबल (पंक्तियों) पर कारक (स्तंभ) के वर्ग लोडिंग के विचरण को अधिकतम करता है। प्रत्येक कारक में कारक द्वारा बड़े लोडिंग के साथ केवल कुछ वेरिएबल होते हैं। वेरिमैक्स लोडिंग आव्युह के कॉलम को सरल बनाता है। इससे प्रत्येक वेरिएबल को ही कारक से पहचानना यथासंभव आसान हो जाता है।


क्वार्टिमैक्स रोटेशन ऑर्थोगोनल रोटेशन है जो चर को समझाने के लिए आवश्यक कारकों की संख्या को कम करता है। यह कॉलम के बजाय लोडिंग मैट्रिक्स की पंक्तियों को सरल बनाता है। क्वार्टिमैक्स अक्सर सामान्य कारक उत्पन्न करता है जिसमें कई चर के लिए लोडिंग होती है। यह अघुलनशील समाधान के करीब है। यदि कई चर सहसंबद्ध हैं तो क्वार्टिमैक्स उपयोगी है ताकि प्रमुख कारक की उम्मीद की जा सके।<ref name=Neuhaus>{{cite journal|last=Neuhaus|first=Jack O|author2=Wrigley, C.|title=क्वार्टिमैक्स विधि|journal=British Journal of Statistical Psychology|date=1954|volume=7|issue=2|pages=81–91|doi=10.1111/j.2044-8317.1954.tb00147.x}}</ref> इक्विमैक्स रोटेशन वेरिमैक्स और क्वार्टिमैक्स के बीच समझौता है।
क्वार्टिमैक्स रोटेशन ऑर्थोगोनल रोटेशन है जो वेरिएबल को समझाने के लिए आवश्यक कारकों की संख्या को कम करता है। यह कॉलम के बजाय लोडिंग आव्युह की पंक्तियों को सरल बनाता है। क्वार्टिमैक्स अक्सर सामान्य कारक उत्पन्न करता है जिसमें कई वेरिएबल के लिए लोडिंग होती है। यह अघुलनशील समाधान के करीब है। यदि कई वेरिएबल सहसंबद्ध हैंतब क्वार्टिमैक्स उपयोगी है ताकि प्रमुख कारक की उम्मीद की जा सके।<ref name=Neuhaus>{{cite journal|last=Neuhaus|first=Jack O|author2=Wrigley, C.|title=क्वार्टिमैक्स विधि|journal=British Journal of Statistical Psychology|date=1954|volume=7|issue=2|pages=81–91|doi=10.1111/j.2044-8317.1954.tb00147.x}}</ref> इक्विमैक्स रोटेशन वेरिमैक्स और क्वार्टिमैक्स के मध्य समझौता है।


कई व्यावहारिक अनुप्रयोगों में, यह मान लेना अवास्तविक है कि कारक असंबंधित हैं। इस स्थिति में तिरछे घुमाव को प्राथमिकता दी जाती है। एक-दूसरे से सहसंबद्ध कारकों को अनुमति देना विशेष रूप से साइकोमेट्रिक अनुसंधान में लागू होता है, क्योंकि दृष्टिकोण, राय और बौद्धिक क्षमताएं सहसंबद्ध होती हैं और अन्यथा मान लेना अवास्तविक होगा।<ref>{{cite journal |last=Russell |first=D.W. |title=In search of underlying dimensions: The use (and abuse) of factor analysis in Personality and Social Psychology Bulletin |journal=Personality and Social Psychology Bulletin |volume=28 |issue=12 |pages=1629–46 |date=December 2002 |doi=10.1177/014616702237645|s2cid=143687603 }}</ref>
कई व्यावहारिक अनुप्रयोगों में, यह मान लेना अवास्तविक है कि कारक असंबंधित हैं। इस स्थिति में तिरछे घुमाव को प्राथमिकता दी जाती है। एक-दूसरे से सहसंबद्ध कारकों को अनुमति देना विशेष रूप से साइकोमेट्रिक अनुसंधान में लागू होता है, क्योंकि दृष्टिकोण, राय और बौद्धिक क्षमताएं सहसंबद्ध होती हैं और अन्यथा मान लेना अवास्तविक होगा।<ref>{{cite journal |last=Russell |first=D.W. |title=In search of underlying dimensions: The use (and abuse) of factor analysis in Personality and Social Psychology Bulletin |journal=Personality and Social Psychology Bulletin |volume=28 |issue=12 |pages=1629–46 |date=December 2002 |doi=10.1177/014616702237645|s2cid=143687603 }}</ref>
जब कोई व्यक्ति तिरछा (गैर-ऑर्थोगोनल) समाधान चाहता है तो ओब्लिमिन रोटेशन मानक विधि है।
जब कोई व्यक्ति तिरछा (गैर-ऑर्थोगोनल) समाधान चाहता हैतब ओब्लिमिन रोटेशन मानक विधि है।


प्रोमैक्स रोटेशन वैकल्पिक तिरछा रोटेशन विधि है जो ओब्लिमिन विधि की तुलना में कम्प्यूटेशनल रूप से तेज़ है और इसलिए कभी-कभी बहुत बड़े [[ डाटासेट |डाटासेट]] के लिए उपयोग किया जाता है।
प्रोमैक्स रोटेशन वैकल्पिक तिरछा रोटेशन विधि है जो ओब्लिमिन विधि की तुलना में कम्प्यूटेशनल रूप से तेज़ है और इसलिए कभी-कभी बहुत बड़े [[ डाटासेट |डाटा]]समुच्चय के लिए उपयोग किया जाता है।


====कारक घूर्णन के साथ समस्याएँ====
====कारक घूर्णन के साथ समस्याएँ====
जब प्रत्येक चर कई कारकों पर लोड हो रहा हो तो कारक संरचना की व्याख्या करना मुश्किल हो सकता है।
जब प्रत्येक वेरिएबल कई कारकों पर लोड हो रहा होतब कारक संरचना की व्याख्या करना मुश्किल हो सकता है।
डेटा में छोटे परिवर्तन कभी-कभी कारक रोटेशन मानदंड में संतुलन बना सकते हैं ताकि पूरी तरह से अलग कारक रोटेशन उत्पन्न हो। इससे विभिन्न प्रयोगों के परिणामों की तुलना करना कठिन हो सकता है। इस समस्या को विश्वव्यापी सांस्कृतिक भिन्नताओं के विभिन्न अध्ययनों की तुलना से स्पष्ट किया गया है। प्रत्येक अध्ययन ने सांस्कृतिक चर के विभिन्न मापों का उपयोग किया है और अलग-अलग घुमाए गए कारक विश्लेषण परिणाम का उत्पादन किया है। प्रत्येक अध्ययन के लेखकों का मानना ​​था कि उन्होंने कुछ नया खोजा है, और उन्होंने जो कारक पाए उनके लिए नए नाम ईजाद किए। अध्ययनों की बाद की तुलना में पाया गया कि जब अनियंत्रित परिणामों की तुलना की गई तो परिणाम समान थे। कारक रोटेशन के सामान्य अभ्यास ने विभिन्न अध्ययनों के परिणामों के बीच समानता को अस्पष्ट कर दिया है।<ref name="Fog2022">{{cite journal |last1=Fog |first1=A |title=Two-Dimensional Models of Cultural Differences: Statistical and Theoretical Analysis |journal=Cross-Cultural Research |date=2022 |volume=57 |issue=2–3 |pages=115–165 |doi=10.1177/10693971221135703|s2cid=253153619 |url=https://backend.orbit.dtu.dk/ws/files/292673942/Two_dimensional_models_of_culture.pdf }}</ref>
डेटा में छोटे परिवर्तन कभी-कभी कारक रोटेशन मानदंड में संतुलन बना सकते हैं ताकि पूरी प्रकार से भिन्न कारक रोटेशन उत्पन्न हो। इससे विभिन्न प्रयोगों के परिणामों की तुलना करना कठिन हो सकता है। इस समस्या को विश्वव्यापी सांस्कृतिक भिन्नताओं के विभिन्न अध्ययनों की तुलना से स्पष्ट किया गया है। प्रत्येक अध्ययन ने सांस्कृतिक वेरिएबल के विभिन्न मापों का उपयोग किया है और भिन्न-भिन्न घुमाए गए कारक विश्लेषण परिणाम का उत्पादन किया है। प्रत्येक अध्ययन के लेखकों का मानना ​​था कि उन्होंने कुछ नया खोजा है, और उन्होंने जो कारक पाए उनके लिए नए नाम ईजाद किए। अध्ययनों की पश्चात की तुलना में पाया गया कि जब अनियंत्रित परिणामों की तुलना की गईतब परिणाम समान थे। कारक रोटेशन के सामान्य अभ्यास ने विभिन्न अध्ययनों के परिणामों के मध्य समानता को अस्पष्ट कर दिया है।<ref name="Fog2022">{{cite journal |last1=Fog |first1=A |title=Two-Dimensional Models of Cultural Differences: Statistical and Theoretical Analysis |journal=Cross-Cultural Research |date=2022 |volume=57 |issue=2–3 |pages=115–165 |doi=10.1177/10693971221135703|s2cid=253153619 |url=https://backend.orbit.dtu.dk/ws/files/292673942/Two_dimensional_models_of_culture.pdf }}</ref>




===उच्च क्रम कारक विश्लेषण===
===उच्च क्रम कारक विश्लेषण===


उच्च-क्रम कारक विश्लेषण सांख्यिकीय पद्धति है जिसमें दोहराए जाने वाले चरण कारक विश्लेषण - तिरछा रोटेशन - घुमाए गए कारकों का कारक विश्लेषण शामिल है। इसकी योग्यता शोधकर्ता को अध्ययन की गई घटनाओं की पदानुक्रमित संरचना को देखने में सक्षम बनाना है। परिणामों की व्याख्या करने के लिए, कोई या तो [[मैट्रिक्स गुणन]] द्वारा आगे बढ़ता है | प्राथमिक [[कारक पैटर्न मैट्रिक्स]] को उच्च-क्रम कारक पैटर्न मैट्रिक्स (गोर्सच, 1983) द्वारा गुणा करने और शायद परिणाम के लिए वेरिमैक्स रोटेशन लागू करने (थॉम्पसन, 1990) या श्मिड-लीमन समाधान (एसएलएस, श्मिड और लीमन, 1957, जिसे श्मिड-लीमन परिवर्तन के रूप में भी जाना जाता है) का उपयोग करके आगे बढ़ता है जो [[सांख्यिकीय फैलाव]] का गुण बताता है। प्राथमिक कारकों से दूसरे क्रम के कारकों तक।
उच्च-क्रम कारक विश्लेषण सांख्यिकीय पद्धति है जिसमें दोहराए जाने वाले चरण कारक विश्लेषण - तिरछा रोटेशन - घुमाए गए कारकों का कारक विश्लेषण शामिल है। इसकी योग्यता शोधकर्ता को अध्ययन की गई घटनाओं की पदानुक्रमित संरचना को देखने में सक्षम बनाना है। परिणामों की व्याख्या करने के लिए, कोई यातब [[मैट्रिक्स गुणन|आव्युह गुणन]] द्वारा आगे बढ़ता है | प्राथमिक [[कारक पैटर्न मैट्रिक्स|कारक पैटर्न आव्युह]] को उच्च-क्रम कारक पैटर्न आव्युह (गोर्सच, 1983) द्वारा गुणा करने और शायद परिणाम के लिए वेरिमैक्स रोटेशन लागू करने (थॉम्पसन, 1990) या श्मिड-लीमन समाधान (एसएलएस, श्मिड और लीमन, 1957, जिसे श्मिड-लीमन परिवर्तन के रूप में भी जाना जाता है) का उपयोग करके आगे बढ़ता है जो [[सांख्यिकीय फैलाव]] का गुण बताता है। प्राथमिक कारकों से दूसरे क्रम के कारकों तक।


==खोजपूर्ण कारक विश्लेषण (ईएफए) बनाम प्रमुख घटक विश्लेषण (पीसीए)==
==खोजपूर्ण कारक विश्लेषण (ईएफए) बनाम प्रमुख घटक विश्लेषण (पीसीए)==
{{see also|Principal component analysis|Exploratory factor analysis}}
{{see also|Principal component analysis|Exploratory factor analysis}}


कारक विश्लेषण प्रमुख घटक विश्लेषण (पीसीए) से संबंधित है, लेकिन दोनों समान नहीं हैं।<ref name="Bartholomew2008">{{cite book |last1=Bartholomew |first1=D.J. |last2=Steele |first2=F. |last3=Galbraith |first3=J. |last4=Moustaki |first4=I. |title=बहुभिन्नरूपी सामाजिक विज्ञान डेटा का विश्लेषण|publisher=Taylor & Francis |year=2008 |isbn=978-1584889601 |edition=2nd |series=Statistics in the Social and Behavioral Sciences Series}}</ref> दोनों तकनीकों के बीच अंतर को लेकर क्षेत्र में महत्वपूर्ण विवाद रहा है। पीसीए को [[खोजपूर्ण कारक विश्लेषण]] (ईएफए) का अधिक बुनियादी संस्करण माना जा सकता है जिसे हाई-स्पीड कंप्यूटर के आगमन से पहले शुरुआती दिनों में विकसित किया गया था। पीसीए और कारक विश्लेषण दोनों का लक्ष्य डेटा के सेट की आयामीता को कम करना है, लेकिन ऐसा करने के लिए अपनाए गए दृष्टिकोण दोनों तकनीकों के लिए अलग-अलग हैं। कारक विश्लेषण स्पष्ट रूप से देखे गए चर से कुछ अप्राप्य कारकों की पहचान करने के उद्देश्य से डिज़ाइन किया गया है, जबकि पीसीए सीधे इस उद्देश्य को संबोधित नहीं करता है; सर्वोत्तम रूप से, पीसीए आवश्यक कारकों का अनुमान प्रदान करता है।<ref name="Principal Component Analysis">Jolliffe I.T. ''Principal Component Analysis'', Series: Springer Series in Statistics, 2nd ed., Springer, NY, 2002, XXIX, 487 p. 28 illus. {{isbn|978-0-387-95442-4}}</ref> खोजपूर्ण विश्लेषण के दृष्टिकोण से, पीसीए के [[eigenvalues]] फुलाए गए घटक लोडिंग हैं, यानी, त्रुटि भिन्नता से दूषित हैं।<ref>Cattell, R. B. (1952). ''Factor analysis''. New York: Harper.</ref><ref>Fruchter, B. (1954). ''Introduction to Factor Analysis''. Van Nostrand.</ref><ref>Cattell, R. B. (1978). ''Use of Factor Analysis in Behavioral and Life Sciences''. New York: Plenum.</ref><ref>Child, D. (2006). ''The Essentials of Factor Analysis, 3rd edition''. Bloomsbury Academic Press.</ref><ref>Gorsuch, R. L. (1983). ''Factor Analysis, 2nd edition''. Hillsdale, NJ: Erlbaum.</ref><ref>McDonald, R. P. (1985). ''Factor Analysis and Related Methods''. Hillsdale, NJ: Erlbaum.</ref>
कारक विश्लेषण प्रमुख घटक विश्लेषण (पीसीए) से संबंधित है, लेकिन दोनों समान नहीं हैं।<ref name="Bartholomew2008">{{cite book |last1=Bartholomew |first1=D.J. |last2=Steele |first2=F. |last3=Galbraith |first3=J. |last4=Moustaki |first4=I. |title=बहुभिन्नरूपी सामाजिक विज्ञान डेटा का विश्लेषण|publisher=Taylor & Francis |year=2008 |isbn=978-1584889601 |edition=2nd |series=Statistics in the Social and Behavioral Sciences Series}}</ref> दोनों तकनीकों के मध्य अंतर को लेकर क्षेत्र में महत्वपूर्ण विवाद रहा है। पीसीए को [[खोजपूर्ण कारक विश्लेषण]] (ईएफए) का अधिक बुनियादी संस्करण माना जा सकता है जिसे हाई-स्पीड कंप्यूटर के आगमन से पहले शुरुआती दिनों में विकसित किया गया था। पीसीए और कारक विश्लेषण दोनों का लक्ष्य डेटा के समुच्चय की आयामीता को कम करना है, लेकिन ऐसा करने के लिए अपनाए गए दृष्टिकोण दोनों तकनीकों के लिए भिन्न-भिन्न हैं। कारक विश्लेषण स्पष्ट रूप से देखे गए वेरिएबल से कुछ अप्राप्य कारकों की पहचान करने के उद्देश्य से डिज़ाइन किया गया है, जबकि पीसीए सीधे इस उद्देश्य को संबोधित नहीं करता है; सर्वोत्तम रूप से, पीसीए आवश्यक कारकों का अनुमान प्रदान करता है।<ref name="Principal Component Analysis">Jolliffe I.T. ''Principal Component Analysis'', Series: Springer Series in Statistics, 2nd ed., Springer, NY, 2002, XXIX, 487 p. 28 illus. {{isbn|978-0-387-95442-4}}</ref> खोजपूर्ण विश्लेषण के दृष्टिकोण से, पीसीए के [[eigenvalues]] फुलाए गए घटक लोडिंग हैं, अथार्त, त्रुटि भिन्नता से दूषित हैं।<ref>Cattell, R. B. (1952). ''Factor analysis''. New York: Harper.</ref><ref>Fruchter, B. (1954). ''Introduction to Factor Analysis''. Van Nostrand.</ref><ref>Cattell, R. B. (1978). ''Use of Factor Analysis in Behavioral and Life Sciences''. New York: Plenum.</ref><ref>Child, D. (2006). ''The Essentials of Factor Analysis, 3rd edition''. Bloomsbury Academic Press.</ref><ref>Gorsuch, R. L. (1983). ''Factor Analysis, 2nd edition''. Hillsdale, NJ: Erlbaum.</ref><ref>McDonald, R. P. (1985). ''Factor Analysis and Related Methods''. Hillsdale, NJ: Erlbaum.</ref>
जबकि खोजपूर्ण कारक विश्लेषण और प्रमुख घटक विश्लेषण को सांख्यिकी के कुछ क्षेत्रों में पर्यायवाची तकनीकों के रूप में माना जाता है, इसकी आलोचना की गई है।<ref name=Fabrigar>{{cite web|last=Fabrigar|title=मनोवैज्ञानिक अनुसंधान में खोजपूर्ण कारक विश्लेषण के उपयोग का मूल्यांकन करना।|year=1999|url=http://www.statpower.net/Content/312/Handout/Fabrigar1999.pdf|publisher=Psychological Methods|display-authors=etal}}</ref><ref name=Suhr>{{cite web|last=Suhr|first=Diane|year=2009|title=प्रमुख घटक विश्लेषण बनाम खोजपूर्ण कारक विश्लेषण|url=http://www2.sas.com/proceedings/sugi30/203-30.pdf|publisher=SUGI 30 Proceedings|access-date=5 April 2012}}</ref> कारक विश्लेषण अंतर्निहित कारण संरचना की धारणा से संबंधित है: [यह] मानता है कि देखे गए चर में सहसंयोजन या अधिक अव्यक्त चर (कारकों) की उपस्थिति के कारण होता है जो इन देखे गए चर पर कारण प्रभाव डालते हैं।<ref name=Sas>{{cite web|title=प्रमुख घटक विश्लेषण|url=http://support.sas.com/publishing/pubcat/chaps/55129.pdf|work=SAS Support Textbook|author=SAS Statistics}}</ref> इसके विपरीत, पीसीए ऐसे अंतर्निहित कारण संबंध को न तो मानता है और न ही उस पर निर्भर करता है। शोधकर्ताओं ने तर्क दिया है कि दो तकनीकों के बीच अंतर का मतलब यह हो सकता है कि विश्लेषणात्मक लक्ष्य के आधार पर को दूसरे पर प्राथमिकता देने के उद्देश्यपूर्ण लाभ हैं। यदि कारक मॉडल गलत तरीके से तैयार किया गया है या मान्यताओं को पूरा नहीं किया गया है, तो कारक विश्लेषण गलत परिणाम देगा। कारक विश्लेषण का सफलतापूर्वक उपयोग किया गया है जहां सिस्टम की पर्याप्त समझ अच्छे प्रारंभिक मॉडल फॉर्मूलेशन की अनुमति देती है। पीसीए मूल डेटा में गणितीय परिवर्तन को नियोजित करता है, जिसमें सहप्रसरण मैट्रिक्स के रूप के बारे में कोई धारणा नहीं होती है। पीसीए का उद्देश्य मूल चर के रैखिक संयोजनों को निर्धारित करना और कुछ का चयन करना है जिनका उपयोग अधिक जानकारी खोए बिना डेटा सेट को सारांशित करने के लिए किया जा सकता है।<ref>{{cite journal |last1=Meglen|first1=R.R. |title=Examining Large Databases: A Chemometric Approach Using Principal Component Analysis|journal=Journal of Chemometrics |volume=5 |issue=3|pages=163–179 |date=1991 |doi=10.1002/cem.1180050305 |s2cid=120886184 }}</ref>
जबकि खोजपूर्ण कारक विश्लेषण और प्रमुख घटक विश्लेषण को सांख्यिकी के कुछ क्षेत्रों में पर्यायवाची तकनीकों के रूप में माना जाता है, इसकी आलोचना की गई है।<ref name=Fabrigar>{{cite web|last=Fabrigar|title=मनोवैज्ञानिक अनुसंधान में खोजपूर्ण कारक विश्लेषण के उपयोग का मूल्यांकन करना।|year=1999|url=http://www.statpower.net/Content/312/Handout/Fabrigar1999.pdf|publisher=Psychological Methods|display-authors=etal}}</ref><ref name=Suhr>{{cite web|last=Suhr|first=Diane|year=2009|title=प्रमुख घटक विश्लेषण बनाम खोजपूर्ण कारक विश्लेषण|url=http://www2.sas.com/proceedings/sugi30/203-30.pdf|publisher=SUGI 30 Proceedings|access-date=5 April 2012}}</ref> कारक विश्लेषण अंतर्निहित कारण संरचना की धारणा से संबंधित है: [यह] मानता है कि देखे गए वेरिएबल में सहसंयोजन या अधिक अव्यक्त वेरिएबल (कारकों) की उपस्थिति के कारण होता है जो इन देखे गए वेरिएबल पर कारण प्रभाव डालते हैं।<ref name=Sas>{{cite web|title=प्रमुख घटक विश्लेषण|url=http://support.sas.com/publishing/pubcat/chaps/55129.pdf|work=SAS Support Textbook|author=SAS Statistics}}</ref> इसके विपरीत, पीसीए ऐसे अंतर्निहित कारण संबंध को नतब मानता है और न ही उस पर निर्भर करता है। शोधकर्ताओं ने तर्क दिया है कि दो तकनीकों के मध्य अंतर का मतलब यह हो सकता है कि विश्लेषणात्मक लक्ष्य के आधार पर को दूसरे पर प्राथमिकता देने के उद्देश्यपूर्ण लाभ हैं। यदि कारक मॉडल गलत विधियों से तैयार किया गया है या मान्यताओं को पूरा नहीं किया गया है,तब कारक विश्लेषण गलत परिणाम देगा। कारक विश्लेषण का सफलतापूर्वक उपयोग किया गया है जहां सिस्टम की पर्याप्त समझ अच्छे प्रारंभिक मॉडल फॉर्मूलेशन की अनुमति देती है। पीसीए मूल डेटा में गणितीय परिवर्तन को नियोजित करता है, जिसमें सहप्रसरण आव्युह के रूप के बारे में कोई धारणा नहीं होती है। पीसीए का उद्देश्य मूल वेरिएबल के रैखिक संयोजनों को निर्धारित करना और कुछ का चयन करना है जिनका उपयोग अधिक जानकारी खोए बिना डेटा समुच्चय को सारांशित करने के लिए किया जा सकता है।<ref>{{cite journal |last1=Meglen|first1=R.R. |title=Examining Large Databases: A Chemometric Approach Using Principal Component Analysis|journal=Journal of Chemometrics |volume=5 |issue=3|pages=163–179 |date=1991 |doi=10.1002/cem.1180050305 |s2cid=120886184 }}</ref>




=== पीसीए और ईएफए के विपरीत तर्क ===
=== पीसीए और ईएफए के विपरीत तर्क ===
फैब्रिगर एट अल. (1999)<ref name=Fabrigar />ऐसे कई कारणों का पता लगाएं जिनका उपयोग यह सुझाव देने के लिए किया जाता है कि पीसीए कारक विश्लेषण के बराबर नहीं है:
फैब्रिगर एट अल. (1999)<ref name=Fabrigar />ऐसे कई कारणों का पता लगाएं जिनका उपयोग यह सुझाव देने के लिए किया जाता है कि पीसीए कारक विश्लेषण के सामान्य नहीं है:


# कभी-कभी यह सुझाव दिया जाता है कि पीसीए कम्प्यूटेशनल रूप से तेज़ है और कारक विश्लेषण की तुलना में कम संसाधनों की आवश्यकता होती है। फैब्रिगर एट अल. सुझाव है कि आसानी से उपलब्ध कंप्यूटर संसाधनों ने इस व्यावहारिक चिंता को अप्रासंगिक बना दिया है।
# कभी-कभी यह सुझाव दिया जाता है कि पीसीए कम्प्यूटेशनल रूप से तेज़ है और कारक विश्लेषण की तुलना में कम संसाधनों की आवश्यकता होती है। फैब्रिगर एट अल. सुझाव है कि आसानी से उपलब्ध कंप्यूटर संसाधनों ने इस व्यावहारिक चिंता को अप्रासंगिक बना दिया है।
# पीसीए और कारक विश्लेषण समान परिणाम उत्पन्न कर सकते हैं। इस बिंदु को फैब्रिगर एट अल द्वारा भी संबोधित किया गया है; कुछ मामलों में, जहाँ सामुदायिकताएँ कम हैं (जैसे 0.4), दोनों तकनीकें अलग-अलग परिणाम उत्पन्न करती हैं। वास्तव में, फैब्रिगर एट अल। तर्क है कि ऐसे मामलों में जहां डेटा सामान्य कारक मॉडल की मान्यताओं के अनुरूप है, पीसीए के परिणाम गलत परिणाम हैं।
# पीसीए और कारक विश्लेषण समान परिणाम उत्पन्न कर सकते हैं। इस बिंदु को फैब्रिगर एट अल द्वारा भी संबोधित किया गया है; कुछ मामलों में, जहाँ सामुदायिकताएँ कम हैं (जैसे 0.4), दोनों तकनीकें भिन्न-भिन्न परिणाम उत्पन्न करती हैं। वास्तव में, फैब्रिगर एट अल। तर्क है कि ऐसे मामलों में जहां डेटा सामान्य कारक मॉडल की मान्यताओं के अनुरूप है, पीसीए के परिणाम गलत परिणाम हैं।
# ऐसे कुछ मामले हैं जहां कारक विश्लेषण से 'हेवुड मामले' सामने आते हैं। इनमें वे स्थितियाँ शामिल हैं जिनमें मापे गए चर में 100% या अधिक भिन्नता का अनुमान मॉडल द्वारा लगाया जाता है। फैब्रिगर एट अल. सुझाव दें कि ये मामले वास्तव में शोधकर्ता के लिए जानकारीपूर्ण हैं, जो गलत तरीके से निर्दिष्ट मॉडल या सामान्य कारक मॉडल के उल्लंघन का संकेत देते हैं। पीसीए दृष्टिकोण में हेवुड मामलों की कमी का मतलब यह हो सकता है कि ऐसे मुद्दों पर ध्यान नहीं दिया जाता है।
# ऐसे कुछ स्तिथियों हैं जहां कारक विश्लेषण से 'हेवुड स्तिथियों' सामने आते हैं। इनमें वे स्थितियाँ शामिल हैं जिनमें मापे गए वेरिएबल में 100% या अधिक भिन्नता का अनुमान मॉडल द्वारा लगाया जाता है। फैब्रिगर एट अल. सुझाव दें कि ये स्तिथियों वास्तव में शोधकर्ता के लिए जानकारीपूर्ण हैं, जो गलत विधियों से निर्दिष्ट मॉडल या सामान्य कारक मॉडल के उल्लंघन का संकेत देते हैं। पीसीए दृष्टिकोण में हेवुड मामलों की कमी का मतलब यह हो सकता है कि ऐसे मुद्दों पर ध्यान नहीं दिया जाता है।
# शोधकर्ता पीसीए दृष्टिकोण से अतिरिक्त जानकारी प्राप्त करते हैं, जैसे किसी निश्चित घटक पर किसी व्यक्ति का स्कोर; ऐसी जानकारी कारक विश्लेषण से नहीं मिलती है। हालाँकि, फैब्रिगर एट अल के रूप में। तर्क दें, कारक विश्लेषण का विशिष्ट उद्देश्य - यानी मापे गए चर के बीच [[सहसंबंध और निर्भरता]] की संरचना के लिए लेखांकन कारकों को निर्धारित करना - कारक स्कोर के ज्ञान की आवश्यकता नहीं है और इस प्रकार यह लाभ अस्वीकार कर दिया गया है। कारक विश्लेषण से कारक स्कोर की गणना करना भी संभव है।
# शोधकर्ता पीसीए दृष्टिकोण से अतिरिक्त जानकारी प्राप्त करते हैं, जैसे किसी निश्चित घटक पर किसी व्यक्ति का स्कोर; ऐसी जानकारी कारक विश्लेषण से नहीं मिलती है। हालाँकि, फैब्रिगर एट अल के रूप में। तर्क दें, कारक विश्लेषण का विशिष्ट उद्देश्य - अथार्त मापे गए वेरिएबल के मध्य [[सहसंबंध और निर्भरता]] की संरचना के लिए लेखांकन कारकों को निर्धारित करना - कारक स्कोर के ज्ञान की आवश्यकता नहीं है और इस प्रकार यह लाभ अस्वीकार कर दिया गया है। कारक विश्लेषण से कारक स्कोर की गणना करना भी संभव है।


=== प्रसरण बनाम सहप्रसरण ===
=== प्रसरण बनाम सहप्रसरण ===
कारक विश्लेषण माप में निहित यादृच्छिक त्रुटि को ध्यान में रखता है, जबकि पीसीए ऐसा करने में विफल रहता है। इस बिंदु का उदाहरण ब्राउन (2009) द्वारा दिया गया है,<ref name=Brown>{{cite web|last=Brown|first=J. D.|title=Principal components analysis and exploratory factor analysis – Definitions, differences and choices.|date=January 2009|url=http://jalt.org/test/PDF/Brown29.pdf|publisher=Shiken: JALT Testing & Evaluation SIG Newsletter|access-date=16 April 2012}}</ref> किसने संकेत दिया कि, गणना में शामिल सहसंबंध मैट्रिक्स के संबंध में:
कारक विश्लेषण माप में निहित यादृच्छिक त्रुटि को ध्यान में रखता है, जबकि पीसीए ऐसा करने में विफल रहता है। इस बिंदु का उदाहरण ब्राउन (2009) द्वारा दिया गया है,<ref name=Brown>{{cite web|last=Brown|first=J. D.|title=Principal components analysis and exploratory factor analysis – Definitions, differences and choices.|date=January 2009|url=http://jalt.org/test/PDF/Brown29.pdf|publisher=Shiken: JALT Testing & Evaluation SIG Newsletter|access-date=16 April 2012}}</ref> किसने संकेत दिया कि, गणना में शामिल सहसंबंध आव्युह के संबंध में:


{{Quotation|"In PCA, 1.00s are put in the diagonal meaning that all of the variance in the matrix is to be accounted for (including variance unique to each variable, variance common among variables, and error variance). That would, therefore, by definition, include all of the variance in the variables. In contrast, in EFA, the communalities are put in the diagonal meaning that only the variance shared with other variables is to be accounted for (excluding variance unique to each variable and error variance). That would, therefore, by definition, include only variance that is common among the variables."|Brown (2009)|Principal components analysis and exploratory factor analysis – Definitions, differences and choices}}
{{Quotation|"In PCA, 1.00s are put in the diagonal meaning that all of the variance in the matrix is to be accounted for (including variance unique to each variable, variance common among variables, and error variance). That would, therefore, by definition, include all of the variance in the variables. In contrast, in EFA, the communalities are put in the diagonal meaning that only the variance shared with other variables is to be accounted for (excluding variance unique to each variable and error variance). That would, therefore, by definition, include only variance that is common among the variables."|Brown (2009)|Principal components analysis and exploratory factor analysis – Definitions, differences and choices}}


इस कारण से, ब्राउन (2009) कारक विश्लेषण का उपयोग करने की सलाह देते हैं जब चर के बीच संबंधों के बारे में सैद्धांतिक विचार मौजूद होते हैं, जबकि पीसीए का उपयोग किया जाना चाहिए यदि शोधकर्ता का लक्ष्य अपने डेटा में पैटर्न का पता लगाना है।
इस कारण से, ब्राउन (2009) कारक विश्लेषण का उपयोग करने की सलाह देते हैं जब वेरिएबल के मध्य संबंधों के बारे में सैद्धांतिक विचार मौजूद होते हैं, जबकि पीसीए का उपयोग किया जाना चाहिए यदि शोधकर्ता का लक्ष्य अपने डेटा में पैटर्न का पता लगाना है।


===प्रक्रिया और परिणाम में अंतर===
===प्रक्रिया और परिणाम में अंतर===
पीसीए और कारक विश्लेषण (एफए) के बीच अंतर को सुहर (2009) द्वारा और अधिक स्पष्ट किया गया है:<ref name=Suhr />* पीसीए के परिणामस्वरूप प्रमुख घटक बनते हैं जो प्रेक्षित चरों के लिए अधिकतम मात्रा में विचरण का कारण बनते हैं; एफए डेटा में सामान्य भिन्नता का हिसाब रखता है।
पीसीए और कारक विश्लेषण (एफए) के मध्य अंतर को सुहर (2009) द्वारा और अधिक स्पष्ट किया गया है:<ref name=Suhr />* पीसीए के परिणामस्वरूप प्रमुख घटक बनते हैं जो प्रेक्षित वेरिएबलों के लिए अधिकतम मात्रा में विचरण का कारण बनते हैं; एफए डेटा में सामान्य भिन्नता का हिसाब रखता है।
* पीसीए सहसंबंध मैट्रिक्स के विकर्णों पर सम्मिलित करता है; एफए अद्वितीय कारकों के साथ सहसंबंध मैट्रिक्स के विकर्णों को समायोजित करता है।
* पीसीए सहसंबंध आव्युह के विकर्णों पर सम्मिलित करता है; एफए अद्वितीय कारकों के साथ सहसंबंध आव्युह के विकर्णों को समायोजित करता है।
* पीसीए घटक अक्ष पर वर्गाकार लंबवत दूरी के योग को कम करता है; एफए उन कारकों का अनुमान लगाता है जो देखे गए चर पर प्रतिक्रियाओं को प्रभावित करते हैं।
* पीसीए घटक अक्ष पर वर्गाकार लंबवत दूरी के योग को कम करता है; एफए उन कारकों का अनुमान लगाता है जो देखे गए वेरिएबल पर प्रतिक्रियाओं को प्रभावित करते हैं।
* पीसीए में घटक स्कोर [[आइगेनवैल्यूज़ एवं आइगेनवेक्टर्स]] द्वारा भारित देखे गए चर के रैखिक संयोजन का प्रतिनिधित्व करते हैं; एफए में देखे गए चर अंतर्निहित और अद्वितीय कारकों के रैखिक संयोजन हैं।
* पीसीए में घटक स्कोर [[आइगेनवैल्यूज़ एवं आइगेनवेक्टर्स]] द्वारा भारित देखे गए वेरिएबल के रैखिक संयोजन का प्रतिनिधित्व करते हैं; एफए में देखे गए वेरिएबल अंतर्निहित और अद्वितीय कारकों के रैखिक संयोजन हैं।
* पीसीए में, प्राप्त घटक व्याख्या योग्य नहीं हैं, यानी वे अंतर्निहित 'निर्माण' का प्रतिनिधित्व नहीं करते हैं; एफए में, सटीक मॉडल विनिर्देश दिए जाने पर, अंतर्निहित निर्माणों को लेबल किया जा सकता है और आसानी से व्याख्या की जा सकती है।
* पीसीए में, प्राप्त घटक व्याख्या योग्य नहीं हैं, अथार्त वे अंतर्निहित 'निर्माण' का प्रतिनिधित्व नहीं करते हैं; एफए में, सटीक मॉडल विनिर्देश दिए जाने पर, अंतर्निहित निर्माणों को लेबल किया जा सकता है और आसानी से व्याख्या की जा सकती है।


==साइकोमेट्रिक्स में==
==साइकोमेट्रिक्स में==


===इतिहास===
===इतिहास===
[[चार्ल्स स्पीयरमैन]] सामान्य कारक विश्लेषण पर चर्चा करने वाले पहले मनोवैज्ञानिक थे<ref name=":0">{{Cite book|last=Mulaik|first=Stanley A|title=कारक विश्लेषण की नींव. दूसरा संस्करण|publisher=CRC Press|year=2010|isbn=978-1-4200-9961-4|location=Boca Raton, Florida|pages=6}}</ref> और अपने 1904 के पेपर में ऐसा किया।<ref>{{Cite journal|last=Spearman|first=Charles|date=1904|title=सामान्य बुद्धि वस्तुनिष्ठ रूप से निर्धारित और मापी जाती है|journal=American Journal of Psychology|volume=15|issue=2|pages=201–293|doi=10.2307/1412107|jstor=1412107}}</ref> इसने उनके तरीकों के बारे में कुछ विवरण प्रदान किए और एकल-कारक मॉडल से संबंधित था।<ref>{{Cite journal|last=Bartholomew|first=D. J.|date=1995|title=स्पीयरमैन और कारक विश्लेषण की उत्पत्ति और विकास|journal=British Journal of Mathematical and Statistical Psychology|volume=48|issue=2|pages=211–220|doi=10.1111/j.2044-8317.1995.tb01060.x}}</ref> उन्होंने पाया कि विभिन्न प्रकार के असंबंधित विषयों पर स्कूली बच्चों के स्कोर सकारात्मक रूप से सहसंबद्ध थे, जिससे उन्हें यह मानने में मदद मिली कि सामान्य मानसिक क्षमता, या जी कारक (साइकोमेट्रिक्स), मानव संज्ञानात्मक प्रदर्शन को रेखांकित और आकार देता है।
[[चार्ल्स स्पीयरमैन]] सामान्य कारक विश्लेषण पर चर्चा करने वाले पहले मनोवैज्ञानिक थे<ref name=":0">{{Cite book|last=Mulaik|first=Stanley A|title=कारक विश्लेषण की नींव. दूसरा संस्करण|publisher=CRC Press|year=2010|isbn=978-1-4200-9961-4|location=Boca Raton, Florida|pages=6}}</ref> और अपने 1904 के पेपर में ऐसा किया।<ref>{{Cite journal|last=Spearman|first=Charles|date=1904|title=सामान्य बुद्धि वस्तुनिष्ठ रूप से निर्धारित और मापी जाती है|journal=American Journal of Psychology|volume=15|issue=2|pages=201–293|doi=10.2307/1412107|jstor=1412107}}</ref> इसने उनके विधियों के बारे में कुछ विवरण प्रदान किए और एकल-कारक मॉडल से संबंधित था।<ref>{{Cite journal|last=Bartholomew|first=D. J.|date=1995|title=स्पीयरमैन और कारक विश्लेषण की उत्पत्ति और विकास|journal=British Journal of Mathematical and Statistical Psychology|volume=48|issue=2|pages=211–220|doi=10.1111/j.2044-8317.1995.tb01060.x}}</ref> उन्होंने पाया कि विभिन्न प्रकार के असंबंधित विषयों पर स्कूली बच्चों के स्कोर सकारात्मक रूप से सहसंबद्ध थे, जिससे उन्हें यह मानने मेंसहायता मिली कि सामान्य मानसिक क्षमता, या जी कारक (साइकोमेट्रिक्स), मानव संज्ञानात्मक प्रदर्शन को रेखांकित और आकार देता है।


कई कारकों के साथ सामान्य कारक विश्लेषण का प्रारंभिक विकास 1930 के दशक की शुरुआत में [[लुई लियोन थर्स्टन]] द्वारा दो पत्रों में दिया गया था,<ref>{{Cite journal|last=Thurstone|first=Louis|date=1931|title=एकाधिक कारक विश्लेषण|journal=Psychological Review|volume=38|issue=5|pages=406–427|doi=10.1037/h0069792}}</ref><ref>{{Cite journal|last=Thurstone|first=Louis|date=1934|title=मन के सदिश|journal=The Psychological Review|volume=41|pages=1–32|doi=10.1037/h0075959}}</ref> उनकी 1935 की पुस्तक, [[मन के सदिश]] में इसका सारांश दिया गया है।<ref>{{Cite book|last=Thurstone|first=L. L.|title=मन के सदिश. प्राथमिक लक्षणों के अलगाव के लिए बहु-कारक विश्लेषण।|publisher=University of Chicago Press|year=1935|location=Chicago, Illinois}}</ref> थर्स्टन ने सामुदायिकता, विशिष्टता और रोटेशन सहित कई महत्वपूर्ण कारक विश्लेषण अवधारणाएँ पेश कीं।<ref>{{Cite book|last=Bock|first=Robert|title=100 पर कारक विश्लेषण|publisher=Lawrence Erlbaum Associates|year=2007|isbn=978-0-8058-6212-6 |editor=Cudeck, Robert |editor2=MacCallum, Robert C.|location=Mahwah, New Jersey|pages=37|chapter=Rethinking Thurstone}}</ref> उन्होंने सरल संरचना की वकालत की, और रोटेशन के तरीकों का विकास किया जिसका उपयोग ऐसी संरचना को प्राप्त करने के तरीके के रूप में किया जा सकता है।<ref name=":0" />
कई कारकों के साथ सामान्य कारक विश्लेषण का प्रारंभिक विकास 1930 के दशक की शुरुआत में [[लुई लियोन थर्स्टन]] द्वारा दो पत्रों में दिया गया था,<ref>{{Cite journal|last=Thurstone|first=Louis|date=1931|title=एकाधिक कारक विश्लेषण|journal=Psychological Review|volume=38|issue=5|pages=406–427|doi=10.1037/h0069792}}</ref><ref>{{Cite journal|last=Thurstone|first=Louis|date=1934|title=मन के सदिश|journal=The Psychological Review|volume=41|pages=1–32|doi=10.1037/h0075959}}</ref> उनकी 1935 की पुस्तक, [[मन के सदिश]] में इसका सारांश दिया गया है।<ref>{{Cite book|last=Thurstone|first=L. L.|title=मन के सदिश. प्राथमिक लक्षणों के अलगाव के लिए बहु-कारक विश्लेषण।|publisher=University of Chicago Press|year=1935|location=Chicago, Illinois}}</ref> थर्स्टन ने सामुदायिकता, विशिष्टता और रोटेशन सहित कई महत्वपूर्ण कारक विश्लेषण अवधारणाएँ पेश कीं।<ref>{{Cite book|last=Bock|first=Robert|title=100 पर कारक विश्लेषण|publisher=Lawrence Erlbaum Associates|year=2007|isbn=978-0-8058-6212-6 |editor=Cudeck, Robert |editor2=MacCallum, Robert C.|location=Mahwah, New Jersey|pages=37|chapter=Rethinking Thurstone}}</ref> उन्होंने सरल संरचना की वकालत की, और रोटेशन के विधियों का विकास किया जिसका उपयोग ऐसी संरचना को प्राप्त करने के विधियों के रूप में किया जा सकता है।<ref name=":0" />


[[क्यू पद्धति]] में, स्पीयरमैन के छात्र, [[विलियम स्टीफेंसन (मनोवैज्ञानिक)]], अंतर-व्यक्तिगत मतभेदों के अध्ययन की ओर उन्मुख आर कारक विश्लेषण और व्यक्तिपरक अंतर-व्यक्तिगत मतभेदों की ओर उन्मुख क्यू कारक विश्लेषण के बीच अंतर करते हैं।<ref>{{cite work | author= Mckeown, Bruce | title= क्यू पद्धति| isbn= 9781452242194 | oclc= 841672556| date= 2013-06-21 }}</ref><ref>{{cite journal |title=कारक विश्लेषण की तकनीक|journal=Nature |last=Stephenson |first=W. |volume=136 |issue=3434 |page=297 |date=August 1935 |issn=0028-0836 |doi=10.1038/136297b0|bibcode=1935Natur.136..297S |s2cid=26952603 |doi-access=free }}</ref>
[[क्यू पद्धति]] में, स्पीयरमैन के छात्र, [[विलियम स्टीफेंसन (मनोवैज्ञानिक)]], अंतर-व्यक्तिगत मतभेदों के अध्ययन की ओर उन्मुख आर कारक विश्लेषण और व्यक्तिपरक अंतर-व्यक्तिगत मतभेदों की ओर उन्मुख क्यू कारक विश्लेषण के मध्य अंतर करते हैं।<ref>{{cite work | author= Mckeown, Bruce | title= क्यू पद्धति| isbn= 9781452242194 | oclc= 841672556| date= 2013-06-21 }}</ref><ref>{{cite journal |title=कारक विश्लेषण की तकनीक|journal=Nature |last=Stephenson |first=W. |volume=136 |issue=3434 |page=297 |date=August 1935 |issn=0028-0836 |doi=10.1038/136297b0|bibcode=1935Natur.136..297S |s2cid=26952603 |doi-access=free }}</ref>
[[रेमंड कैटेल]] कारक विश्लेषण और साइकोमेट्रिक्स के प्रबल समर्थक थे और उन्होंने बुद्धि को समझाने के लिए थर्स्टन के बहु-कारक सिद्धांत का इस्तेमाल किया। कैटेल ने स्क्री प्लॉट और समानता गुणांक भी विकसित किया।
[[रेमंड कैटेल]] कारक विश्लेषण और साइकोमेट्रिक्स के प्रबल समर्थक थे और उन्होंने बुद्धि को समझाने के लिए थर्स्टन के बहु-कारक सिद्धांत का इस्तेमाल किया। कैटेल ने स्क्री प्लॉट और समानता गुणांक भी विकसित किया।


===मनोविज्ञान में अनुप्रयोग===
===मनोविज्ञान में अनुप्रयोग===
कारक विश्लेषण का उपयोग उन कारकों की पहचान करने के लिए किया जाता है जो विभिन्न परीक्षणों पर विभिन्न प्रकार के परिणामों की व्याख्या करते हैं। उदाहरण के लिए, खुफिया शोध में पाया गया कि जो लोग मौखिक क्षमता के परीक्षण में उच्च अंक प्राप्त करते हैं वे अन्य परीक्षणों में भी अच्छे होते हैं जिनके लिए मौखिक क्षमताओं की आवश्यकता होती है। शोधकर्ताओं ने कारक को अलग करने के लिए कारक विश्लेषण का उपयोग करके इसे समझाया, जिसे अक्सर मौखिक बुद्धिमत्ता कहा जाता है, जो उस डिग्री का प्रतिनिधित्व करता है जिस तक कोई व्यक्ति मौखिक कौशल से जुड़ी समस्याओं को हल करने में सक्षम है।
कारक विश्लेषण का उपयोग उन कारकों की पहचान करने के लिए किया जाता है जो विभिन्न परीक्षणों पर विभिन्न प्रकार के परिणामों की व्याख्या करते हैं। उदाहरण के लिए, खुफिया शोध में पाया गया कि जो लोग मौखिक क्षमता के परीक्षण में उच्च अंक प्राप्त करते हैं वे अन्य परीक्षणों में भी अच्छे होते हैं जिनके लिए मौखिक क्षमताओं की आवश्यकता होती है। शोधकर्ताओं ने कारक को भिन्न करने के लिए कारक विश्लेषण का उपयोग करके इसे समझाया, जिसे अक्सर मौखिक बुद्धिमत्ता कहा जाता है, जो उस डिग्री का प्रतिनिधित्व करता है जिस तक कोई व्यक्ति मौखिक कौशल से जुड़ी समस्याओं को हल करने में सक्षम है।


मनोविज्ञान में कारक विश्लेषण अक्सर खुफिया अनुसंधान से जुड़ा होता है। हालाँकि, इसका उपयोग व्यक्तित्व, दृष्टिकोण, विश्वास आदि जैसे डोमेन की विस्तृत श्रृंखला में कारकों को खोजने के लिए भी किया गया है। यह साइकोमेट्रिक्स से जुड़ा हुआ है, क्योंकि यह किसी उपकरण की वैधता का आकलन यह पता लगाकर कर सकता है कि क्या उपकरण वास्तव में अनुमानित कारकों को मापता है।
मनोविज्ञान में कारक विश्लेषण अक्सर खुफिया अनुसंधान से जुड़ा होता है। हालाँकि, इसका उपयोग व्यक्तित्व, दृष्टिकोण, विश्वास आदि जैसे डोमेन की विस्तृत श्रृंखला में कारकों को खोजने के लिए भी किया गया है। यह साइकोमेट्रिक्स से जुड़ा हुआ है, क्योंकि यह किसी उपकरण की वैधता का आकलन यह पता लगाकर कर सकता है कि क्या उपकरण वास्तव में अनुमानित कारकों को मापता है।


===फायदे===
===फायदे===
* दो या दो से अधिक चरों को ही कारक में संयोजित करके चरों की संख्या में कमी करना। उदाहरण के लिए, दौड़ने, गेंद फेंकने, बल्लेबाजी, कूदने और वजन उठाने में प्रदर्शन को सामान्य एथलेटिक क्षमता जैसे कारक में जोड़ा जा सकता है। आमतौर पर, किसी आइटम द्वारा लोगों के मैट्रिक्स में, संबंधित आइटमों को समूहीकृत करके कारकों का चयन किया जाता है। क्यू कारक विश्लेषण तकनीक में, मैट्रिक्स को स्थानांतरित किया जाता है और संबंधित लोगों को समूहीकृत करके कारक बनाए जाते हैं। उदाहरण के लिए, उदारवादी, स्वतंत्रतावादी, रूढ़िवादी और समाजवादी अलग-अलग समूहों में बन सकते हैं।
* दो या दो से अधिक वेरिएबलों को ही कारक में संयोजित करके वेरिएबलों की संख्या में कमी करना। उदाहरण के लिए, दौड़ने, गेंद फेंकने, बल्लेबाजी, कूदने और वजन उठाने में प्रदर्शन को सामान्य एथलेटिक क्षमता जैसे कारक में जोड़ा जा सकता है। सामान्यतः, किसी आइटम द्वारा लोगों के आव्युह में, संबंधित आइटमों को समूहीकृत करके कारकों का चयन किया जाता है। क्यू कारक विश्लेषण तकनीक में, आव्युह को स्थानांतरित किया जाता है और संबंधित लोगों को समूहीकृत करके कारक बनाए जाते हैं। उदाहरण के लिए, उदारवादी, स्वतंत्रतावादी, रूढ़िवादी और समाजवादी भिन्न-भिन्न समूहों में बन सकते हैं।
* अंतर-संबंधित चरों के समूहों की पहचान करना, यह देखना कि वे एक-दूसरे से कैसे संबंधित हैं। उदाहरण के लिए, कैरोल ने अपने [[थ्री स्ट्रेटम थ्योरी]] के निर्माण के लिए कारक विश्लेषण का उपयोग किया। उन्होंने पाया कि व्यापक दृश्य धारणा नामक कारक इस बात से संबंधित है कि कोई व्यक्ति दृश्य कार्यों में कितना अच्छा है। उन्होंने श्रवण कार्य क्षमता से संबंधित व्यापक श्रवण धारणा कारक भी पाया। इसके अलावा, उन्होंने वैश्विक कारक पाया, जिसे जी या सामान्य बुद्धि कहा जाता है, जो व्यापक दृश्य धारणा और व्यापक श्रवण धारणा दोनों से संबंधित है। इसका मतलब यह है कि उच्च जी वाले व्यक्ति में उच्च दृश्य धारणा क्षमता और उच्च श्रवण धारणा क्षमता दोनों होने की संभावना है, और यह जी इस बात का अच्छा हिस्सा बताता है कि कोई व्यक्ति उन दोनों डोमेन में अच्छा या बुरा क्यों है।
* अंतर-संबंधित वेरिएबलों के समूहों की पहचान करना, यह देखना कि वे एक-दूसरे से कैसे संबंधित हैं। उदाहरण के लिए, कैरोल ने अपने [[थ्री स्ट्रेटम थ्योरी]] के निर्माण के लिए कारक विश्लेषण का उपयोग किया। उन्होंने पाया कि व्यापक दृश्य धारणा नामक कारक इस बात से संबंधित है कि कोई व्यक्ति दृश्य कार्यों में कितना अच्छा है। उन्होंने श्रवण कार्य क्षमता से संबंधित व्यापक श्रवण धारणा कारक भी पाया। इसके अतिरिक्त, उन्होंने वैश्विक कारक पाया, जिसे जी या सामान्य बुद्धि कहा जाता है, जो व्यापक दृश्य धारणा और व्यापक श्रवण धारणा दोनों से संबंधित है। इसका मतलब यह है कि उच्च जी वाले व्यक्ति में उच्च दृश्य धारणा क्षमता और उच्च श्रवण धारणा क्षमता दोनों होने की संभावना है, और यह जी इस बात का अच्छा हिस्सा बताता है कि कोई व्यक्ति उन दोनों डोमेन में अच्छा या बुरा क्यों है।


===नुकसान===
===नुकसान===
* ...प्रत्येक अभिविन्यास गणितीय रूप से समान रूप से स्वीकार्य है। लेकिन अलग-अलग फैक्टोरियल सिद्धांत किसी दिए गए समाधान के लिए फैक्टोरियल अक्षों के झुकाव के संदर्भ में उतने ही भिन्न साबित हुए जितने कि किसी अन्य चीज़ के संदर्भ में, इसलिए मॉडल फिटिंग सिद्धांतों के बीच अंतर करने में उपयोगी साबित नहीं हुई। (स्टर्नबर्ग, 1977<ref name=Sternberg>{{cite book |last=Sternberg |first=R. J. |title=Metaphors of Mind: Conceptions of the Nature of Intelligence |year=1977 |location=New York |publisher=Cambridge University Press |pages=85–111 }}{{Verify source|date=November 2013}}</ref>). इसका मतलब है कि सभी घुमाव अलग-अलग अंतर्निहित प्रक्रियाओं का प्रतिनिधित्व करते हैं, लेकिन सभी घुमाव मानक कारक विश्लेषण अनुकूलन के समान रूप से मान्य परिणाम हैं। इसलिए, अकेले कारक विश्लेषण का उपयोग करके उचित रोटेशन चुनना असंभव है।
* ...प्रत्येक अभिविन्यास गणितीय रूप से समान रूप से स्वीकार्य है। लेकिन भिन्न-भिन्न फैक्टोरियल सिद्धांत किसी दिए गए समाधान के लिए फैक्टोरियल अक्षों के झुकाव के संदर्भ में उतने ही भिन्न साबित हुए जितने कि किसी अन्य चीज़ के संदर्भ में, इसलिए मॉडल फिटिंग सिद्धांतों के मध्य अंतर करने में उपयोगी साबित नहीं हुई। (स्टर्नबर्ग, 1977<ref name=Sternberg>{{cite book |last=Sternberg |first=R. J. |title=Metaphors of Mind: Conceptions of the Nature of Intelligence |year=1977 |location=New York |publisher=Cambridge University Press |pages=85–111 }}{{Verify source|date=November 2013}}</ref>). इसका मतलब है कि सभी घुमाव भिन्न-भिन्न अंतर्निहित प्रक्रियाओं का प्रतिनिधित्व करते हैं, लेकिन सभी घुमाव मानक कारक विश्लेषण अनुकूलन के समान रूप से मान्य परिणाम हैं। इसलिए, अकेले कारक विश्लेषण का उपयोग करके उचित रोटेशन चुनना असंभव है।
* कारक विश्लेषण केवल उतना ही अच्छा हो सकता है जितना डेटा अनुमति देता है। मनोविज्ञान में, जहां शोधकर्ताओं को अक्सर स्व-रिपोर्ट जैसे कम वैध और विश्वसनीय उपायों पर निर्भर रहना पड़ता है, यह समस्याग्रस्त हो सकता है।
* कारक विश्लेषण केवल उतना ही अच्छा हो सकता है जितना डेटा अनुमति देता है। मनोविज्ञान में, जहां शोधकर्ताओं को अक्सर स्व-रिपोर्ट जैसे कम वैध और विश्वसनीय उपायों पर निर्भर रहना पड़ता है, यह समस्याग्रस्त हो सकता है।
* कारक विश्लेषण की व्याख्या अनुमान का उपयोग करने पर आधारित है, जो ऐसा समाधान है जो सुविधाजनक है भले ही पूरी तरह सच न हो।<ref>{{cite web|title=कारक विश्लेषण|access-date=July 22, 2004 |url=http://comp9.psych.cornell.edu/Darlington/factor.htm |url-status=dead |archive-url=https://web.archive.org/web/20040818062948/http://comp9.psych.cornell.edu/Darlington/factor.htm |archive-date=August 18, 2004 }}
* कारक विश्लेषण की व्याख्या अनुमान का उपयोग करने पर आधारित है, जो ऐसा समाधान है जो सुविधाजनक है भले ही पूरी प्रकार सच न हो।<ref>{{cite web|title=कारक विश्लेषण|access-date=July 22, 2004 |url=http://comp9.psych.cornell.edu/Darlington/factor.htm |url-status=dead |archive-url=https://web.archive.org/web/20040818062948/http://comp9.psych.cornell.edu/Darlington/factor.htm |archive-date=August 18, 2004 }}
</ref> ही तरह से तथ्यांकित किए गए ही डेटा की से अधिक व्याख्याएं की जा सकती हैं, और कारक विश्लेषण कार्य-कारण की पहचान नहीं कर सकता है।
</ref> ही प्रकार से तथ्यांकित किए गए ही डेटा की से अधिक व्याख्याएं की जा सकती हैं, और कारक विश्लेषण कार्य-कारण की पहचान नहीं कर सकता है।


==पार-सांस्कृतिक अनुसंधान में==
==पार-सांस्कृतिक अनुसंधान में==
Line 266: Line 267:
1965 के शुरुआती अध्ययन में, संबंधित सैद्धांतिक मॉडल और अनुसंधान के निर्माण, राजनीतिक प्रणालियों की तुलना करने और टाइपोलॉजिकल श्रेणियां बनाने के लिए कारक विश्लेषण के माध्यम से दुनिया भर की राजनीतिक प्रणालियों की जांच की जाती है।<ref name="gregg1965">{{Cite journal|last1=Gregg|first1=Phillip M.|last2=Banks|first2=Arthur S.|date=1965|title=Dimensions of political systems: Factor analysis of a cross-polity survey|url=|journal=American Political Science Review|series=|language=en|volume=59|issue=3|pages=602-614|doi=10.2307/1953171|issn=}}</ref> इन उद्देश्यों के लिए, इस अध्ययन में सात बुनियादी राजनीतिक आयामों की पहचान की गई है, जो विभिन्न प्रकार के राजनीतिक व्यवहार से संबंधित हैं: ये आयाम हैं पहुंच, भेदभाव, आम सहमति, अनुभागवाद, वैधीकरण, रुचि और नेतृत्व सिद्धांत और अनुसंधान।
1965 के शुरुआती अध्ययन में, संबंधित सैद्धांतिक मॉडल और अनुसंधान के निर्माण, राजनीतिक प्रणालियों की तुलना करने और टाइपोलॉजिकल श्रेणियां बनाने के लिए कारक विश्लेषण के माध्यम से दुनिया भर की राजनीतिक प्रणालियों की जांच की जाती है।<ref name="gregg1965">{{Cite journal|last1=Gregg|first1=Phillip M.|last2=Banks|first2=Arthur S.|date=1965|title=Dimensions of political systems: Factor analysis of a cross-polity survey|url=|journal=American Political Science Review|series=|language=en|volume=59|issue=3|pages=602-614|doi=10.2307/1953171|issn=}}</ref> इन उद्देश्यों के लिए, इस अध्ययन में सात बुनियादी राजनीतिक आयामों की पहचान की गई है, जो विभिन्न प्रकार के राजनीतिक व्यवहार से संबंधित हैं: ये आयाम हैं पहुंच, भेदभाव, आम सहमति, अनुभागवाद, वैधीकरण, रुचि और नेतृत्व सिद्धांत और अनुसंधान।


अन्य राजनीतिक वैज्ञानिक 1988 के राष्ट्रीय चुनाव अध्ययन में जोड़े गए चार नए प्रश्नों का उपयोग करके आंतरिक राजनीतिक प्रभावकारिता के माप का पता लगाते हैं। यहां कारक विश्लेषण का उपयोग यह पता लगाने के लिए किया जाता है कि ये आइटम बाहरी प्रभावकारिता और राजनीतिक विश्वास से अलग एकल अवधारणा को मापते हैं, और ये चार प्रश्न उस समय तक आंतरिक राजनीतिक प्रभावकारिता का सबसे अच्छा उपाय प्रदान करते हैं।<ref name="niemi1991">{{Cite journal|last1=Niemi|first1=Richard G.|last2=Craig|first2=Stephen C.|last3=Mattei|first3=Franco|date=December 1991|title=Measuring Internal Political Efficacy in the 1988 National Election Study|url=https://doi.org/10.2307/1963953|journal=American Political Science Review|series=|language=en|volume=85|issue=4|pages=1407-1413|doi=10.2307/1963953|issn=0003-0554}}</ref> संयुक्त राज्य अमेरिका के राष्ट्रपति पद की बहस, रैलियों और हिलेरी क्लिंटन ईमेल विवाद जैसे महत्वपूर्ण अभियान कार्यक्रमों के प्रभाव का अध्ययन करने के लिए| हिलेरी क्लिंटन के ईमेल विवाद, कारक विश्लेषण का उपयोग 2016 में डोनाल्ड ट्रम्प और 2012 में ओबामा जैसे अमेरिकी राष्ट्रपति पद के उम्मीदवारों के लिए लोकप्रियता के उपाय बनाने के लिए किया जाता है। लोकप्रियता कारकों को ट्विटर, फेसबुक, यूट्यूब, इंस्टाग्राम, [[पाँच अड़तीस]] और भविष्यवाणी बाजारों से एकत्र किए गए डेटा से संश्लेषित किया जाता है।<ref name="franch2021">{{Cite journal|last1=Franch|first1=Fabio|date=May 2021|title= Political preferences nowcasting with factor analysis and internet data: The 2012 and 2016 US presidential elections|url=https://doi.org/10.1016/j.techfore.2021.120667|journal=Technological Forecasting and Social Change|series=|language=en|volume=166|issue=|pages=120667|doi=10.1016/j.techfore.2021.120667|issn=0040-1625}}</ref>
अन्य राजनीतिक वैज्ञानिक 1988 के राष्ट्रीय चुनाव अध्ययन में जोड़े गए चार नए प्रश्नों का उपयोग करके आंतरिक राजनीतिक प्रभावकारिता के माप का पता लगाते हैं। यहां कारक विश्लेषण का उपयोग यह पता लगाने के लिए किया जाता है कि ये आइटम बाहरी प्रभावकारिता और राजनीतिक विश्वास से भिन्न एकल अवधारणा को मापते हैं, और ये चार प्रश्न उस समय तक आंतरिक राजनीतिक प्रभावकारिता का सबसे अच्छा उपाय प्रदान करते हैं।<ref name="niemi1991">{{Cite journal|last1=Niemi|first1=Richard G.|last2=Craig|first2=Stephen C.|last3=Mattei|first3=Franco|date=December 1991|title=Measuring Internal Political Efficacy in the 1988 National Election Study|url=https://doi.org/10.2307/1963953|journal=American Political Science Review|series=|language=en|volume=85|issue=4|pages=1407-1413|doi=10.2307/1963953|issn=0003-0554}}</ref> संयुक्त राज्य अमेरिका के राष्ट्रपति पद की बहस, रैलियों और हिलेरी क्लिंटन ईमेल विवाद जैसे महत्वपूर्ण अभियान कार्यक्रमों के प्रभाव का अध्ययन करने के लिए| हिलेरी क्लिंटन के ईमेल विवाद, कारक विश्लेषण का उपयोग 2016 में डोनाल्ड ट्रम्प और 2012 में ओबामा जैसे अमेरिकी राष्ट्रपति पद के उम्मीदवारों के लिए लोकप्रियता के उपाय बनाने के लिए किया जाता है। लोकप्रियता कारकों को ट्विटर, फेसबुक, यूट्यूब, इंस्टाग्राम, [[पाँच अड़तीस]] और भविष्यवाणी बाजारों से एकत्र किए गए डेटा से संश्लेषित किया जाता है।<ref name="franch2021">{{Cite journal|last1=Franch|first1=Fabio|date=May 2021|title= Political preferences nowcasting with factor analysis and internet data: The 2012 and 2016 US presidential elections|url=https://doi.org/10.1016/j.techfore.2021.120667|journal=Technological Forecasting and Social Change|series=|language=en|volume=166|issue=|pages=120667|doi=10.1016/j.techfore.2021.120667|issn=0040-1625}}</ref>




Line 272: Line 273:
बुनियादी कदम हैं:
बुनियादी कदम हैं:
* इस श्रेणी में [[उत्पाद (व्यवसाय)]] का मूल्यांकन करने के लिए उपभोक्ताओं द्वारा उपयोग की जाने वाली मुख्य विशेषताओं की पहचान करें।
* इस श्रेणी में [[उत्पाद (व्यवसाय)]] का मूल्यांकन करने के लिए उपभोक्ताओं द्वारा उपयोग की जाने वाली मुख्य विशेषताओं की पहचान करें।
* सभी उत्पाद विशेषताओं की रेटिंग के संबंध में संभावित [[ग्राहक]]ों के नमूने से डेटा एकत्र करने के लिए [[मात्रात्मक विपणन अनुसंधान]] तकनीकों (जैसे [[सांख्यिकीय सर्वेक्षण]]) का उपयोग करें।
* सभी उत्पाद विशेषताओं की रेटिंग के संबंध में संभावित [[ग्राहक]]ों के प्रतिरूप से डेटा एकत्र करने के लिए [[मात्रात्मक विपणन अनुसंधान]] तकनीकों (जैसे [[सांख्यिकीय सर्वेक्षण]]) का उपयोग करें।
* डेटा को सांख्यिकीय कार्यक्रम में इनपुट करें और कारक विश्लेषण प्रक्रिया चलाएँ। कंप्यूटर अंतर्निहित विशेषताओं (या कारकों) का सेट उत्पन्न करेगा।
* डेटा को सांख्यिकीय कार्यक्रम में इनपुट करें और कारक विश्लेषण प्रक्रिया चलाएँ। कंप्यूटर अंतर्निहित विशेषताओं (या कारकों) का समुच्चय उत्पन्न करेगा।
* [[अवधारणात्मक मानचित्रण]] और अन्य [[ पोजिशनिंग (विपणन) |पोजिशनिंग (विपणन)]] उपकरणों के निर्माण के लिए इन कारकों का उपयोग करें।
* [[अवधारणात्मक मानचित्रण]] और अन्य [[ पोजिशनिंग (विपणन) |पोजिशनिंग (विपणन)]] उपकरणों के निर्माण के लिए इन कारकों का उपयोग करें।


=== सूचना संग्रह ===
=== सूचना संग्रह ===
डेटा संग्रह चरण आमतौर पर विपणन अनुसंधान पेशेवरों द्वारा किया जाता है। सर्वेक्षण प्रश्न उत्तरदाता से किसी उत्पाद के नमूने या उत्पाद अवधारणाओं के विवरण को विभिन्न विशेषताओं के आधार पर रेटिंग देने के लिए कहते हैं। कहीं भी पाँच से बीस विशेषताएँ चुनी जाती हैं। उनमें ये चीजें शामिल हो सकती हैं: उपयोग में आसानी, वजन, सटीकता, स्[[था]]यित्व, रंगीनता, कीमत या आकार। चुनी गई विशेषताएँ अध्ययन किए जा रहे उत्पाद के आधार पर अलग-अलग होंगी। अध्ययन में सभी उत्पादों के बारे में ही प्रश्न पूछा गया है। कई उत्पादों के डेटा को कोडित किया जाता है और आर (प्रोग्रामिंग भाषा), एसपीएसएस, [[एसएएस प्रणाली]], स्टेटा, [[आंकड़े]], जेएमपी और सिस्टैट जैसे सांख्यिकीय कार्यक्रम में इनपुट किया जाता है।
डेटा संग्रह चरण सामान्यतः विपणन अनुसंधान पेशेवरों द्वारा किया जाता है। सर्वेक्षण प्रश्न उत्तरदाता से किसी उत्पाद के प्रतिरूप या उत्पाद अवधारणाओं के विवरण को विभिन्न विशेषताओं के आधार पर रेटिंग देने के लिए कहते हैं। कहीं भी पाँच से बीस विशेषताएँ चुनी जाती हैं। उनमें ये चीजें शामिल हो सकती हैं: उपयोग में आसानी, वजन, सटीकता, स्[[था]]यित्व, रंगीनता, कीमत या आकार। चुनी गई विशेषताएँ अध्ययन किए जा रहे उत्पाद के आधार पर भिन्न-भिन्न होंगी। अध्ययन में सभी उत्पादों के बारे में ही प्रश्न पूछा गया है। कई उत्पादों के डेटा को कोडित किया जाता है और आर (प्रोग्रामिंग भाषा), एसपीएसएस, [[एसएएस प्रणाली]], स्टेटा, [[आंकड़े]], जेएमपी और सिस्टैट जैसे सांख्यिकीय कार्यक्रम में इनपुट किया जाता है।


=== विश्लेषण ===
=== विश्लेषण ===
विश्लेषण उन अंतर्निहित कारकों को अलग करेगा जो एसोसिएशन के मैट्रिक्स का उपयोग करके डेटा की व्याख्या करते हैं।<ref>Ritter, N. (2012). A comparison of distribution-free and non-distribution free methods in factor analysis. Paper presented at Southwestern Educational Research Association (SERA) Conference 2012, New Orleans, LA (ED529153).</ref> कारक विश्लेषण अन्योन्याश्रय तकनीक है। अन्योन्याश्रित संबंधों के संपूर्ण सेट की जांच की जाती है। आश्रित चर, स्वतंत्र चर, या कार्य-कारण का कोई विनिर्देश नहीं है। कारक विश्लेषण मानता है कि विभिन्न विशेषताओं पर सभी रेटिंग डेटा को कुछ महत्वपूर्ण आयामों तक कम किया जा सकता है। यह कमी इसलिए संभव है क्योंकि कुछ विशेषताएँ एक-दूसरे से संबंधित हो सकती हैं। किसी विशेषता को दी गई रेटिंग आंशिक रूप से अन्य विशेषताओं के प्रभाव का परिणाम होती है। सांख्यिकीय एल्गोरिदम रेटिंग को उसके विभिन्न घटकों में विभाजित करता है (जिसे कच्चा स्कोर कहा जाता है) और आंशिक स्कोर को अंतर्निहित कारक स्कोर में पुनर्निर्मित करता है। प्रारंभिक कच्चे स्कोर और अंतिम कारक स्कोर के बीच सहसंबंध की डिग्री को कारक लोडिंग कहा जाता है।
विश्लेषण उन अंतर्निहित कारकों को भिन्न करेगा जो एसोसिएशन के आव्युह का उपयोग करके डेटा की व्याख्या करते हैं।<ref>Ritter, N. (2012). A comparison of distribution-free and non-distribution free methods in factor analysis. Paper presented at Southwestern Educational Research Association (SERA) Conference 2012, New Orleans, LA (ED529153).</ref> कारक विश्लेषण अन्योन्याश्रय तकनीक है। अन्योन्याश्रित संबंधों के संपूर्ण समुच्चय की जांच की जाती है। आश्रित वेरिएबल , स्वतंत्र वेरिएबल , या कार्य-कारण का कोई विनिर्देश नहीं है। कारक विश्लेषण मानता है कि विभिन्न विशेषताओं पर सभी रेटिंग डेटा को कुछ महत्वपूर्ण आयामों तक कम किया जा सकता है। यह कमी इसलिए संभव है क्योंकि कुछ विशेषताएँ एक-दूसरे से संबंधित हो सकती हैं। किसी विशेषता को दी गई रेटिंग आंशिक रूप से अन्य विशेषताओं के प्रभाव का परिणाम होती है। सांख्यिकीय एल्गोरिदम रेटिंग को उसके विभिन्न घटकों में विभाजित करता है (जिसे कच्चा स्कोर कहा जाता है) और आंशिक स्कोर को अंतर्निहित कारक स्कोर में पुनर्निर्मित करता है। प्रारंभिक कच्चे स्कोर और अंतिम कारक स्कोर के मध्य सहसंबंध की डिग्री को कारक लोडिंग कहा जाता है।


===फायदे===
===फायदे===
Line 288: Line 289:


===नुकसान===
===नुकसान===
* उपयोगिता उत्पाद विशेषताओं का पर्याप्त सेट एकत्र करने की शोधकर्ताओं की क्षमता पर निर्भर करती है। यदि महत्वपूर्ण विशेषताओं को बाहर रखा जाता है या उपेक्षित किया जाता है, तो प्रक्रिया का मूल्य कम हो जाता है।
* उपयोगिता उत्पाद विशेषताओं का पर्याप्त समुच्चय एकत्र करने की शोधकर्ताओं की क्षमता पर निर्भर करती है। यदि महत्वपूर्ण विशेषताओं को बाहर रखा जाता है या उपेक्षित किया जाता है,तब प्रक्रिया का मूल्य कम हो जाता है।
* यदि देखे गए चर के सेट एक-दूसरे के समान हैं और अन्य वस्तुओं से अलग हैं, तो कारक विश्लेषण उन्हें ही कारक प्रदान करेगा। यह उन कारकों को अस्पष्ट कर सकता है जो अधिक दिलचस्प रिश्तों का प्रतिनिधित्व करते हैं।  
* यदि देखे गए वेरिएबल के समुच्चय एक-दूसरे के समान हैं और अन्य वस्तुओं से भिन्न हैं,तब कारक विश्लेषण उन्हें ही कारक प्रदान करेगा। यह उन कारकों को अस्पष्ट कर सकता है जो अधिक दिलचस्प रिश्तों का प्रतिनिधित्व करते हैं।
* नामकरण कारकों के लिए सिद्धांत के ज्ञान की आवश्यकता हो सकती है क्योंकि प्रतीत होता है कि भिन्न गुण अज्ञात कारणों से दृढ़ता से सहसंबद्ध हो सकते हैं।
* नामकरण कारकों के लिए सिद्धांत के ज्ञान की आवश्यकता हो सकती है क्योंकि प्रतीत होता है कि भिन्न गुण अज्ञात कारणों से दृढ़ता से सहसंबद्ध हो सकते हैं।


Line 296: Line 297:


भूजल गुणवत्ता प्रबंधन में, विभिन्न रसायनों के स्थानिक वितरण को जोड़ना महत्वपूर्ण है
भूजल गुणवत्ता प्रबंधन में, विभिन्न रसायनों के स्थानिक वितरण को जोड़ना महत्वपूर्ण है
विभिन्न संभावित स्रोतों के पैरामीटर, जिनके अलग-अलग रासायनिक हस्ताक्षर हैं। उदाहरण के लिए, सल्फाइड खदान उच्च स्तर की अम्लता, घुले हुए सल्फेट्स और संक्रमण धातुओं से जुड़ी होने की संभावना है। इन हस्ताक्षरों को आर-मोड कारक विश्लेषण के माध्यम से कारकों के रूप में पहचाना जा सकता है, और कारक स्कोर को समोच्च करके संभावित स्रोतों का स्थान सुझाया जा सकता है।<ref>{{cite journal |last1=Love |first1=D. |last2=Hallbauer |first2=D.K. |last3=Amos |first3=A. |last4=Hranova |first4=R.K. |title=Factor analysis as a tool in groundwater quality management: two southern African case studies |journal=Physics and Chemistry of the Earth |volume=29 |issue= 15–18|pages=1135–43 |year=2004 |doi=10.1016/j.pce.2004.09.027 |bibcode=2004PCE....29.1135L }}</ref>
विभिन्न संभावित स्रोतों के पैरामीटर, जिनके भिन्न-भिन्न रासायनिक हस्ताक्षर हैं। उदाहरण के लिए, सल्फाइड खदान उच्च स्तर की अम्लता, घुले हुए सल्फेट्स और संक्रमण धातुओं से जुड़ी होने की संभावना है। इन हस्ताक्षरों को आर-मोड कारक विश्लेषण के माध्यम से कारकों के रूप में पहचाना जा सकता है, और कारक स्कोर को समोच्च करके संभावित स्रोतों का स्थान सुझाया जा सकता है।<ref>{{cite journal |last1=Love |first1=D. |last2=Hallbauer |first2=D.K. |last3=Amos |first3=A. |last4=Hranova |first4=R.K. |title=Factor analysis as a tool in groundwater quality management: two southern African case studies |journal=Physics and Chemistry of the Earth |volume=29 |issue= 15–18|pages=1135–43 |year=2004 |doi=10.1016/j.pce.2004.09.027 |bibcode=2004PCE....29.1135L }}</ref>
भू-रसायन विज्ञान में, विभिन्न कारक विभिन्न खनिज संघों और इस प्रकार खनिजकरण के अनुरूप हो सकते हैं।<ref>{{cite journal |last1=Barton |first1=E.S. |last2=Hallbauer |first2=D.K. |title=Trace-element and U—Pb isotope compositions of pyrite types in the Proterozoic Black Reef, Transvaal Sequence, South Africa: Implications on genesis and age |journal=Chemical Geology |volume=133 |issue= 1–4|pages=173–199 |year=1996 |doi=10.1016/S0009-2541(96)00075-7 }}</ref>
भू-रसायन विज्ञान में, विभिन्न कारक विभिन्न खनिज संघों और इस प्रकार खनिजकरण के अनुरूप हो सकते हैं।<ref>{{cite journal |last1=Barton |first1=E.S. |last2=Hallbauer |first2=D.K. |title=Trace-element and U—Pb isotope compositions of pyrite types in the Proterozoic Black Reef, Transvaal Sequence, South Africa: Implications on genesis and age |journal=Chemical Geology |volume=133 |issue= 1–4|pages=173–199 |year=1996 |doi=10.1016/S0009-2541(96)00075-7 }}</ref>




==माइक्रोएरे विश्लेषण में==
==माइक्रोएरे विश्लेषण में==
[[एफिमेट्रिक्स]] जीनचिप्स के लिए जांच स्तर पर उच्च-घनत्व [[oligonucleotide]] [[डीएनए माइक्रोएरे]] डेटा को सारांशित करने के लिए कारक विश्लेषण का उपयोग किया जा सकता है। इस मामले में, अव्यक्त चर नमूने में आरएनए एकाग्रता से मेल खाता है।<ref>{{cite journal |first1=Sepp |last1=Hochreiter |first2=Djork-Arné |last2=Clevert |first3=Klaus |last3=Obermayer |title=एफिमेट्रिक्स जांच स्तर डेटा के लिए एक नई सारांशीकरण विधि|journal=Bioinformatics |volume=22 |issue=8 |pages=943–9 |year=2006 |pmid=16473874 |doi=10.1093/bioinformatics/btl033 |doi-access=free }}</ref>
[[एफिमेट्रिक्स]] जीनचिप्स के लिए जांच स्तर पर उच्च-घनत्व [[oligonucleotide]] [[डीएनए माइक्रोएरे]] डेटा को सारांशित करने के लिए कारक विश्लेषण का उपयोग किया जा सकता है। इस स्तिथियों में, अव्यक्त वेरिएबल प्रतिरूप में आरएनए एकाग्रता से मेल खाता है।<ref>{{cite journal |first1=Sepp |last1=Hochreiter |first2=Djork-Arné |last2=Clevert |first3=Klaus |last3=Obermayer |title=एफिमेट्रिक्स जांच स्तर डेटा के लिए एक नई सारांशीकरण विधि|journal=Bioinformatics |volume=22 |issue=8 |pages=943–9 |year=2006 |pmid=16473874 |doi=10.1093/bioinformatics/btl033 |doi-access=free }}</ref>





Revision as of 10:31, 3 August 2023

कारक विश्लेषण सांख्यिकी पद्धति है जिसका उपयोग प्रेक्षित, सहसंबद्ध वेरिएबल (गणित) के मध्य विचरण का वर्णन करने के लिए संभावित रूप से कम संख्या में न देखे गए वेरिएबल के संदर्भ में किया जाता है जिन्हें कारक कहा जाता है। उदाहरण के लिए, यह संभव है कि छह देखे गए वेरिएबलों में भिन्नताएं मुख्य रूप से दो न देखे गए (अंतर्निहित) वेरिएबलों में भिन्नताएं दर्शाती हैं। कारक विश्लेषण न देखे गए अव्यक्त वेरिएबलों की प्रतिक्रिया में ऐसी संयुक्त विविधताओं की खोज करता है। इसको देखे गए वेरिएबल के आंकड़ों के संदर्भ में संभावित कारकों और त्रुटियों और अवशेषों के रैखिक संयोजन के रूप में तैयार किया गया है, इसलिए कारक विश्लेषण को वेरिएबल-में-त्रुटि मॉडल के विशेष स्तिथियों के रूप में माना जा सकता है। [1] सीधे शब्दों में कहेंतब, किसी वेरिएबल का फैक्टर लोडिंग उस सीमा को निर्धारित करता है, जिस सीमा तक वेरिएबल किसी दिए गए फैक्टर से संबंधित होता है। [2]

कारक विश्लेषणात्मक विधियों के पीछे सामान्य तर्क यह है कि देखे गए वेरिएबल के मध्य अन्योन्याश्रितताओं के बारे में प्राप्त जानकारी का उपयोग और इसके पश्चात में डेटासमुच्चय में वेरिएबल के समुच्चय को कम करने के लिए किया जा सकता है। कारक विश्लेषण का उपयोग सामान्यतः साइकोमेट्रिक्स, व्यक्तित्व मनोविज्ञान, जीव विज्ञान, विपणन, उत्पाद प्रबंधन, संचालन अनुसंधान, वित्त और यंत्र अधिगम में किया जाता है। यह उन डेटा समुच्चयों से निपटने में सहायता कर सकता है जहां बड़ी संख्या में देखे गए वेरिएबल हैं जो अंतर्निहित/अव्यक्त वेरिएबल की लघु संख्या को प्रतिबिंबित करते हैं। यह सबसे अधिक उपयोग की जाने वाली अंतर-निर्भरता तकनीकों में से है और इसका उपयोग तब किया जाता है जब वेरिएबल का प्रासंगिक समुच्चय व्यवस्थित अंतर-निर्भरता दिखाता है और इसका उद्देश्य उन अव्यक्त कारकों का पता लगाना है जो समानता बनाते हैं।

सांख्यिकीय मॉडल

परिभाषा

मॉडल प्रत्येक व्यक्तियों में सामान्य कारकों के समुच्चय के साथ अवलोकनों के समुच्चय को समझाने का प्रयास करता है, जहां प्रति इकाई अवलोकनों की तुलना में प्रति इकाई कम कारक होते हैं। प्रत्येक व्यक्ति के समीप अपने स्वयं के सामान्य कारक होते हैं, और ये एकल अवलोकन के लिए, कारक लोडिंग आव्युह के माध्यम से अवलोकनों से संबंधित होते हैं।

जहाँ

  • वें व्यक्ति के वें अवलोकन का मान है,
  • वें अवलोकन के लिए अवलोकन माध्य है,
  • वें कारक के वें अवलोकन के लिए लोडिंग है,
  • वें व्यक्ति के वें कारक का मान है, और
  • माध्य शून्य और परिमित विचरण के साथ वां अवलोकित स्टोकेस्टिक त्रुटि शब्द है।

आव्युह नोटेशन में

जहां अवलोकन आव्यूह , लोडिंग आव्यूह , फैक्टर आव्यूह , त्रुटि टर्म आव्यूह और माध्य आव्यूह है, जिससे वां अवयव सिर्फ है।

इसके अतिरिक्त हम निम्नलिखित धारणाएँ भी लागू करेंगे :

  1. और स्वतंत्र हैं.
  2. ; जहां अपेक्षा है
  3. जहाँ सहप्रसरण आव्युह है, यह सुनिश्चित करने के लिए कि कारक असंबंधित हैं, और पहचान आव्युह है.

कल्पना करना . तब

और इसलिए, लगाई गई शर्तों 1 और 2 से ऊपर, और , देना

या, समुच्चयिंग ,

ध्यान दें कि किसी भी ऑर्थोगोनल आव्युह के लिए,यदि और और हम अगर हम समुच्चय करते हैं तब कारक और कारक लोडिंग के मानदंड अभी भी दृढ़ हैं। इसलिए कारकों और कारक लोडिंग का समुच्चय केवल ऑर्थोगोनल परिवर्तन तक अद्वितीय है।

उदाहरण

मान लीजिए कि मनोवैज्ञानिक की परिकल्पना है कि बुद्धि (विशेषता) दो प्रकार की होती है, मौखिक बुद्धि और गणितीय बुद्धि, जिनमें से कोई भी प्रत्यक्ष रूप से नहीं देखी जाती है। इसमें 1000 छात्रों के 10 भिन्न-भिन्न शैक्षणिक क्षेत्रों में से प्रत्येक के परीक्षा अंकों में परिकल्पना के साक्ष्य मांगे गए हैं। यदि प्रत्येक छात्र को बड़ी आपश्चाती (सांख्यिकी) से यादृच्छिक रूप से चुना जाता है,तब प्रत्येक छात्र के 10 अंक यादृच्छिक वेरिएबल होते हैं। मनोवैज्ञानिक की परिकल्पना कह सकती है कि 10 अकादमिक क्षेत्रों में से प्रत्येक के लिए, उन सभी छात्रों के समूह पर औसत स्कोर जो मौखिक और गणितीय बुद्धि के लिए मूल्यों की कुछ सामान्य जोड़ी साझा करते हैं, कुछ स्थिरांक (गणित) उनकी मौखिक बुद्धि के स्तर का यह अनेक गुना होता है और अन्य स्थिरांक उनके गणितीय बुद्धि के स्तर का अनेक गुना है, अथार्त, यह उन दो कारकों का रैखिक संयोजन है। किसी विशेष विषय के लिए संख्याएँ होती हैं, जिनके द्वारा अपेक्षित स्कोर प्राप्त करने के लिए दो प्रकार की बुद्धिमत्ता को गुणा किया जाता है, परिकल्पना द्वारा सभी बुद्धिमत्ता स्तर के जोड़े के लिए समान मानी जाती हैं, और इस विषय के लिए कारक लोडिंग कहलाती हैं। उदाहरण के लिए, परिकल्पना यह मान सकती है कि खगोल विज्ञान के क्षेत्र में अनुमानित औसत छात्र की योग्यता है

{10 × छात्र की मौखिक बुद्धि} + {6 × छात्र की गणितीय बुद्धि}।

संख्या 10 और 6 खगोल विज्ञान से जुड़े कारक लोडिंग हैं। अन्य शैक्षणिक विषयों में भिन्न-भिन्न कारक लोड हो सकते हैं।

ऐसा माना जाता है कि मौखिक और गणितीय बुद्धि की समान डिग्री वाले दो छात्रों की खगोल विज्ञान में भिन्न-भिन्न मापी गई योग्यताएं हो सकती हैं क्योंकि व्यक्तिगत योग्यताएं औसत योग्यताओं (ऊपर अनुमानित) से भिन्न होती हैं और इसमें माप त्रुटि के कारण ही भिन्न होती हैं। इस प्रकार के मतभेदों को सामूहिक रूप से त्रुटि कहा जाता है - सांख्यिकीय शब्द जिसका अर्थ है वह मात्रा जिसके द्वारा किसी व्यक्ति को मापा जाता है, जो उसकी बुद्धिमत्ता के स्तर के लिए औसत या अनुमानित से भिन्न होता है (आंकड़ों में त्रुटियां और अवशेष देखें)।

कारक विश्लेषण में जाने वाला अवलोकन योग्य डेटा 1000 छात्रों में से प्रत्येक के 10 अंक, कुल 10,000 नंबर होंते हैं। डेटा से प्रत्येक छात्र की दो प्रकार की बुद्धि के कारक लोडिंग और स्तर का अनुमान लगाया जाना चाहिए।

उसी उदाहरण का गणितीय मॉडल

निम्नलिखित में, आव्युह को अनुक्रमित वेरिएबल द्वारा दर्शाया जाएगा। "विषय" सूचकांकों को अक्षर , और ,का उपयोग करके दर्शाया जाएगा, जिसमें मान से तक चलेंगे जो उपरोक्त उदाहरण में के सामान्य है। "कारक" सूचकांकों को अक्षर , और का उपयोग करके दर्शाया जाएगा, जिसका मान से तक होगा जो उपरोक्त उदाहरण में के सामान्य है। "उदाहरण" या "प्रतिरूप" सूचकांकों को , और अक्षरों का उपयोग करके दर्शाया जाएगा, जिसमें मान से तक चलेंगे। उपरोक्त उदाहरण में, यदि छात्रों के प्रतिरूप ने परीक्षाओं में भाग लिया, तब परीक्षा के लिए छात्र का स्कोर द्वारा दिया गया है। कारक विश्लेषण का उद्देश्य चर के मध्य सहसंबंधों को चिह्नित करना है, जिनमें से विशेष उदाहरण, या अवलोकनों का समुच्चय है। वेरिएबलों को समान स्तर पर रखने के लिए, उन्हें मानक स्कोर में सामान्यीकरण (सांख्यिकी किया जाता है |

जहां प्रतिरूप माध्य है:

और प्रतिरूप विचरण इस प्रकार दिया गया है:

इस विशेष प्रतिरूप के लिए कारक विश्लेषण मॉडल तब है:

या, अधिक संक्षेप में:

जहाँ

  • ,वें छात्र की मौखिक बुद्धि है,
  • ,वें छात्र की गणितीय बुद्धि हैं,
  • ,वें विषय, के लिए के लिए कारक लोडिंग हैं।

आव्युह (गणित) नोटेशन में, हमारे समीप है

उस मापदंड को दोगुना करके देखें जिस पर मौखिक बुद्धिमत्ता - प्रत्येक कॉलम में पहला घटक है मापा जाता है, और साथ ही मौखिक बुद्धिमत्ता के लिए कारक लोडिंग को आधा करने से मॉडल पर कोई भिन्नता नहीं दिखाई पड़ती है। इस प्रकार, यह मानने से कोई व्यापकता नहीं खोती है कि मौखिक बुद्धि के लिए कारकों का मानक विचलन है | इसी प्रकार गणितीय बुद्धि के लिए भी हैं इसके अतिरिक्त, समान कारणों से, यह मानने से कोई व्यापकता विलुप्त नहीं है कि दोनों कारक एक-दूसरे से असंबद्ध हैं। दूसरे शब्दों में:

जहाँ क्रोनकर डेल्टा है और ( जब और जब ).त्रुटियों को कारकों से स्वतंत्र माना जाता है:

ध्यान दें, चूँकि किसी समाधान का कोई भी घुमाव भी समाधान है, इससे कारकों की व्याख्या करना कठिन हो जाता है। नीचे नुकसान देखें. इस विशेष उदाहरण में, यदि हम पहले से नहीं जानते हैं कि दो प्रकार की बुद्धि असंबद्ध हैं,तब हम दो कारकों की दो भिन्न-भिन्न प्रकार की बुद्धि के रूप में व्याख्या नहीं कर सकते हैं। भले ही वे असंबंधित हों, हम बिना किसी बाहरी तर्क के यह नहीं बता सकते कि कौन सा कारक मौखिक बुद्धि से मेल खाता है और कौन सा गणितीय बुद्धि से मेल खाता है।

लोडिंग का मान , औसत , और त्रुटियों की भिन्नताएँ प्रेक्षित डेटा को देखते हुए अनुमान लगाया जाना चाहिए और (कारकों के स्तर के बारे में धारणा किसी दिए गए के लिए तय की गई है ). मौलिक प्रमेय उपरोक्त शर्तों से प्राप्त किया जा सकता है:

बाईं ओर का शब्द है -सहसंबंध आव्युह की अवधि (ए के उत्पाद के रूप में प्राप्त आव्युह देखे गए डेटा के स्थानान्तरण के साथ मानकीकृत अवलोकनों का आव्युह, और इसका विकर्ण अवयव होंगे एस। दाईं ओर दूसरा पद विकर्ण आव्युह होगा जिसमें इकाई से कम पद होंगे। दाईं ओर पहला पद कम सहसंबंध आव्युह है और इसके विकर्ण मानों को छोड़कर सहसंबंध आव्युह के सामान्य होगा जो एकता से कम होगा। कम सहसंबंध आव्युह के इन विकर्ण अवयवों को सांप्रदायिकताएं कहा जाता है (जो कि देखे गए वेरिएबल में भिन्नता के अंश का प्रतिनिधित्व करते हैं जो कारकों के कारण होता है):

प्रतिरूप डेटा प्रतिरूपकरण त्रुटियों, मॉडल की अपर्याप्तता आदि के कारण ऊपर दिए गए मौलिक समीकरण का बिल्कुल पालन नहीं किया जाएगा। उपरोक्त मॉडल के किसी भी विश्लेषण का लक्ष्य कारकों का पता लगाना है और लोडिंग जो डेटा को सर्वोत्तम रूप से फिट करता है। कारक विश्लेषण में, सर्वोत्तम फिट को सहसंबंध आव्युह के ऑफ-विकर्ण अवशेषों में न्यूनतम माध्य वर्ग त्रुटि के रूप में परिभाषित किया गया है:[3]

यह त्रुटि सहप्रसरण के ऑफ-विकर्ण घटकों को कम करने के सामान्य है, जिसमें मॉडल समीकरणों में शून्य के अपेक्षित मान होते हैं। इसकी तुलना प्रमुख घटक विश्लेषण से की जानी चाहिए जो सभी अवशेषों की माध्य वर्ग त्रुटि को कम करने का प्रयास करता है।[3]हाई-स्पीड कंप्यूटर के आगमन से पहले, समस्या के अनुमानित समाधान खोजने के लिए काफी प्रयास किए गए थे, विशेष रूप से अन्य विधियों से सांप्रदायिकताओं का अनुमान लगाने में, जो तब ज्ञात कम सहसंबंध आव्युह उत्पन्न करके समस्या को काफी सरल बनाता है। इसके पश्चात कारकों और लोडिंग का अनुमान लगाने के लिए इसका उपयोग किया गया। हाई-स्पीड कंप्यूटर के आगमन के साथ, न्यूनतमकरण की समस्या को पर्याप्त गति के साथ पुनरावृत्त रूप से हल किया जा सकता है, और सामुदायिकताओं की गणना पहले से आवश्यक होने के बजाय प्रक्रिया में की जाती है। सामान्यीकृत न्यूनतम अवशिष्ट विधि एल्गोरिथ्म इस समस्या के लिए विशेष रूप से उपयुक्त है, लेकिन समाधान खोजने का शायद ही यह एकमात्र पुनरावृत्त साधन है।

यदि समाधान कारकों को सहसंबंधित करने की अनुमति दी जाती है (उदाहरण के लिए 'ओब्लिमिन' रोटेशन में),तब संबंधित गणितीय मॉडल ऑर्थोगोनल निर्देशांक के बजाय तिरछा निर्देशांक का उपयोग करता है।

ज्यामितीय व्याख्या

प्रश्न पूछने के लिए 3 उत्तरदाताओं के लिए कारक विश्लेषण मापदंडों की ज्यामितीय व्याख्या। उत्तर इकाई वेक्टर द्वारा दर्शाया गया है , जिसे दो ऑर्थोनॉर्मल वैक्टर द्वारा परिभाषित विमान पर प्रक्षेपित किया जाता है और . प्रक्षेपण वेक्टर है और त्रुटि समतल के लंबवत है, ताकि . प्रक्षेपण वेक्टर कारक सदिशों के रूप में दर्शाया जा सकता है . प्रक्षेपण वेक्टर की लंबाई का वर्ग समुदाय है: . यदि कोई अन्य डेटा वेक्टर के मध्य के कोण की कोज्या को आलेखित किया गया और होगा  : द -सहसंबंध आव्युह में प्रवेश। (हरमन चित्र 4.3 से अनुकूलित)[3]

कारक विश्लेषण के मापदंडों और वेरिएबल को ज्यामितीय व्याख्या दी जा सकती है। आंकड़ा (), कारक () और त्रुटियाँ () को वेक्टर के रूप में देखा जा सकता है -आयामी यूक्लिडियन स्पेस (प्रतिरूप स्थान), के रूप में दर्शाया गया है , और क्रमश। चूँकि डेटा मानकीकृत है, डेटा वेक्टर इकाई लंबाई के हैं (). कारक सदिश को परिभाषित करते हैं इस स्थान में -आयामी रैखिक उपस्थान (अथार्त हाइपरप्लेन), जिस पर डेटा वैक्टर को ऑर्थोगोनल रूप से प्रक्षेपित किया जाता है। यह मॉडल समीकरण से निम्नानुसार है

और कारकों और त्रुटियों की स्वतंत्रता: . उपरोक्त उदाहरण में, हाइपरप्लेन केवल दो कारक वैक्टर द्वारा परिभाषित 2-आयामी विमान है। हाइपरप्लेन पर डेटा वैक्टर का प्रक्षेपण इसके द्वारा दिया गया है

और त्रुटियाँ उस अनुमानित बिंदु से डेटा बिंदु तक वेक्टर हैं और हाइपरप्लेन के लंबवत हैं। कारक विश्लेषण का लक्ष्य हाइपरप्लेन ढूंढना है जो कुछ अर्थों में डेटा के लिए सबसे उपयुक्त है, इसलिए इससे कोई भिन्नता नहीं पड़ता कि इस हाइपरप्लेन को परिभाषित करने वाले कारक वैक्टर को कैसे चुना जाता है, जब तक कि वे स्वतंत्र हैं और हाइपरप्लेन में स्थित हैं। हम उन्हें ऑर्थोगोनल और सामान्य दोनों के रूप में निर्दिष्ट करने के लिए स्वतंत्र हैं () व्यापकता की हानि के बिना। कारकों का उपयुक्त समुच्चय पाए जाने के पश्चात, उन्हें हाइपरप्लेन के भीतर मनमाने ढंग से घुमाया जा सकता है, ताकि कारक वैक्टर का कोई भी घुमाव उसी हाइपरप्लेन को परिभाषित करेगा, और समाधान भी होगा। परिणामस्वरूप, उपरोक्त उदाहरण में, जिसमें फिटिंग हाइपरप्लेन दो आयामी है, यदि हम पहले से नहीं जानते हैं कि दो प्रकार की बुद्धि असंबंधित हैं,तब हम दो कारकों की दो भिन्न-भिन्न प्रकार की बुद्धि के रूप में व्याख्या नहीं कर सकते हैं। भले ही वे असंबंधित हों, हम बिना किसी बाहरी तर्क के यह नहीं बता सकते कि कौन सा कारक मौखिक बुद्धि से मेल खाता है और कौन सा गणितीय बुद्धि से मेल खाता है, या क्या कारक दोनों का रैखिक संयोजन हैं।

डेटा वैक्टर इकाई लंबाई है. डेटा के लिए सहसंबंध आव्युह की प्रविष्टियाँ दी गई हैं . सहसंबंध आव्युह को ज्यामितीय रूप से दो डेटा वैक्टर के मध्य के कोण के कोसाइन के रूप में व्याख्या किया जा सकता है और . विकर्ण अवयव स्पष्ट रूप से होंगे s और ऑफ विकर्ण अवयवों का निरपेक्ष मान एकता से कम या उसके सामान्य होगा। घटे हुए सहसंबंध आव्युह को इस प्रकार परिभाषित किया गया है

.

कारक विश्लेषण का लक्ष्य फिटिंग हाइपरप्लेन का चयन करना है, ताकि सहसंबंध आव्युह के विकर्ण अवयवों को छोड़कर, कम सहसंबंध आव्युह सहसंबंध आव्युह को यथासंभव पुन: उत्पन्न कर सके, जिन्हें इकाई मान के रूप में जाना जाता है। दूसरे शब्दों में, लक्ष्य डेटा में क्रॉस-सहसंबंधों को यथासंभव सटीक रूप से पुन: पेश करना है। विशेष रूप से, फिटिंग हाइपरप्लेन के लिए, ऑफ-विकर्ण घटकों में माध्य वर्ग त्रुटि

इसे न्यूनतम किया जाना है, और इसे ऑर्थोनॉर्मल फैक्टर वैक्टर के समुच्चय के संबंध में इसे कम करके पूरा किया जाता है। यह देखा जा सकता है

दाईं ओर का शब्द केवल त्रुटियों का सहप्रसरण है। मॉडल में, त्रुटि सहप्रसरण को विकर्ण आव्युह कहा गया है और इसलिए उपरोक्त न्यूनतमकरण समस्या वास्तव में मॉडल के लिए सबसे उपयुक्त होगी: यह त्रुटि सहप्रसरण का प्रतिरूप अनुमान प्राप्त करेगी जिसके ऑफ-विकर्ण घटकों को औसत वर्ग अर्थ में न्यूनतम किया गया है। यह देखा जा सकता है कि जब से डेटा वेक्टर के ऑर्थोगोनल प्रक्षेपण हैं, उनकी लंबाई अनुमानित डेटा वेक्टर की लंबाई से कम या उसके सामान्य होगी, जो कि एकता है। इन लंबाइयों का वर्ग कम सहसंबंध आव्युह के विकर्ण अवयव मात्र हैं। कम सहसंबंध आव्युह के इन विकर्ण अवयवों को सांप्रदायिकता के रूप में जाना जाता है:

समुदायों के बड़े मूल्य यह संकेत देंगे कि फिटिंग हाइपरप्लेन सहसंबंध आव्युह को सटीक रूप से पुन: प्रस्तुत कर रहा है। कारकों के माध्य मानों को भी शून्य होने के लिए बाध्य किया जाना चाहिए, जिससे यह निष्कर्ष निकलता है कि त्रुटियों का माध्य मान भी शून्य होगा।

व्यावहारिक कार्यान्वयन

कारक विश्लेषण के प्रकार

खोजपूर्ण कारक विश्लेषण

खोजपूर्ण कारक विश्लेषण (ईएफए) का उपयोग उन वस्तुओं और समूह वस्तुओं के मध्य जटिल अंतर्संबंधों की पहचान करने के लिए किया जाता है जो एकीकृत अवधारणाओं का हिस्सा हैं।[4] शोधकर्ता कारकों के मध्य संबंधों के बारे में कोई पूर्व धारणा नहीं बनाता है।[4]


पुष्टि कारक विश्लेषण

पुष्टिकरण कारक विश्लेषण (सीएफए) अधिक जटिल दृष्टिकोण है जो इस परिकल्पना का परीक्षण करता है कि आइटम विशिष्ट कारकों से जुड़े हैं।[4]सीएफए माप मॉडल का परीक्षण करने के लिए संरचनात्मक समीकरण मॉडलिंग का उपयोग करता है जिससे कारकों पर लोड करने से देखे गए वेरिएबल और न देखे गए वेरिएबल के मध्य संबंधों के मूल्यांकन की अनुमति मिलती है।[4] संरचनात्मक समीकरण मॉडलिंग दृष्टिकोण माप त्रुटि को समायोजित कर सकते हैं और न्यूनतम-वर्ग अनुमान की तुलना में कम प्रतिबंधात्मक हैं।[4] परिकल्पित मॉडल का परीक्षण वास्तविक डेटा के विरुद्ध किया जाता है, और विश्लेषण अव्यक्त वेरिएबल (कारकों) पर देखे गए वेरिएबल के लोडिंग के साथ-साथ अव्यक्त वेरिएबल के मध्य सहसंबंध को प्रदर्शित करेगा।[4]


कारक निष्कर्षण के प्रकार

प्रमुख घटक विश्लेषण (पीसीए) कारक निष्कर्षण के लिए व्यापक रूप से उपयोग की जाने वाली विधि है, जो ईएफए का पहला चरण है।[4]अधिकतम संभावित विचरण निकालने के लिए कारक भार की गणना की जाती है, क्रमिक फैक्टरिंग तब तक जारी रहती है जब तक कि कोई और सार्थक विचरण नहीं बचा हो।[4]फिर विश्लेषण के लिए कारक मॉडल को घुमाया जाना चाहिए।[4]

कैनोनिकल फैक्टर विश्लेषण, जिसे राव की कैनोनिकल फैक्टरिंग भी कहा जाता है, पीसीए के समान मॉडल की गणना करने की भिन्न विधि है, जो प्रमुख अक्ष विधि का उपयोग करती है। विहित कारक विश्लेषण उन कारकों की तलाश करता है जिनका प्रेक्षित वेरिएबल के साथ उच्चतम विहित सहसंबंध होता है। विहित कारक विश्लेषण डेटा के मनमाने पुनर्स्केलिंग से अप्रभावित रहता है।

सामान्य कारक विश्लेषण, जिसे प्रमुख कारक विश्लेषण (पीएफए) या प्रमुख अक्ष फैक्टरिंग (पीएएफ) भी कहा जाता है, सबसे कम कारकों की तलाश करता है जो वेरिएबल के समुच्चय के सामान्य विचरण (सहसंबंध) के लिए जिम्मेदार हो सकते हैं।

छवि फैक्टरिंग वास्तविक वेरिएबल के बजाय अनुमानित वेरिएबल के सहसंबंध आव्युह पर आधारित है, जहां प्रत्येक वेरिएबल की भविष्यवाणी कई प्रतिगमन का उपयोग करके दूसरों से की जाती है।

अल्फा फैक्टरिंग कारकों की विश्वसनीयता को अधिकतम करने पर आधारित है, यह मानते हुए कि वेरिएबल को वेरिएबल के ब्रह्मांड से यादृच्छिक रूप से प्रतिरूप लिया जाता है। अन्य सभी विधियाँ यह मानती हैं कि मामलों को प्रतिरूपकृत किया गया है और वेरिएबलों को निश्चित किया गया है।

कारक प्रतिगमन मॉडल कारक मॉडल और प्रतिगमन मॉडल का संयोजन मॉडल है; या वैकल्पिक रूप से, इसे हाइब्रिड कारक मॉडल के रूप में देखा जा सकता है,[5] जिनके कारक आंशिक रूप से ज्ञात हैं।

शब्दावली

फैक्टर लोडिंग
सामुदायिकता किसी वस्तु की मानकीकृत बाहरी लोडिंग का वर्ग है। पियर्सन का आर-वर्ग के अनुरूप, वर्ग कारक लोडिंग कारक द्वारा समझाए गए उस संकेतक चर में भिन्नता का प्रतिशत है। प्रत्येक कारक के हिसाब से सभी चर में भिन्नता का प्रतिशत प्राप्त करने के लिए, उस कारक (स्तंभ) के लिए वर्ग कारक लोडिंग का योग जोड़ें और चर की संख्या से विभाजित करें। (ध्यान दें कि चरों की संख्या उनके प्रसरणों के योग के बराबर होती है क्योंकि एक मानकीकृत चर का प्रसरण 1 होता है।) यह कारक के eigenvalue को चरों की संख्या से विभाजित करने के समान है।
व्याख्या करते समय, पुष्टिकारक कारक विश्लेषण में अंगूठे के एक नियम के अनुसार, कारक लोडिंग .7 या उच्चतर होनी चाहिए ताकि यह पुष्टि की जा सके कि प्राथमिकता से पहचाने गए स्वतंत्र चर एक विशेष कारक द्वारा दर्शाए जाते हैं, इस तर्क पर कि .7 स्तर मेल खाता है संकेतक में लगभग आधे विचरण को कारक द्वारा समझाया जा रहा है। हालाँकि, .7 मानक एक उच्च है और वास्तविक जीवन का डेटा इस मानदंड को पूरा नहीं कर सकता है, यही कारण है कि कुछ शोधकर्ता, विशेष रूप से खोजपूर्ण उद्देश्यों के लिए, निचले स्तर का उपयोग करेंगे जैसे कि केंद्रीय कारक के लिए .4 और .25 के लिए। अन्य कारक। किसी भी घटना में, कारक लोडिंग की व्याख्या सिद्धांत के आलोक में की जानी चाहिए, न कि मनमाने कटऑफ स्तरों के आधार पर।
तिरछा रोटेशन में, कोई पैटर्न मैट्रिक्स और संरचना मैट्रिक्स दोनों की जांच कर सकता है। संरचना मैट्रिक्स केवल ऑर्थोगोनल रोटेशन के रूप में कारक लोडिंग मैट्रिक्स है, जो एक अद्वितीय और सामान्य योगदान के आधार पर एक कारक द्वारा समझाए गए मापा चर में भिन्नता का प्रतिनिधित्व करता है। इसके विपरीत, पैटर्न मैट्रिक्स में गुणांक होते हैं जो अद्वितीय योगदान का प्रतिनिधित्व करते हैं। जितने अधिक कारक होंगे, एक नियम के रूप में पैटर्न गुणांक उतना ही कम होगा क्योंकि विचरण में अधिक सामान्य योगदान समझाया जाएगा। तिरछे घुमाव के लिए, शोधकर्ता किसी कारक को लेबल देते समय संरचना और पैटर्न गुणांक दोनों को देखता है। तिरछे घूर्णन के सिद्धांतों को क्रॉस एन्ट्रॉपी और इसकी दोहरी एन्ट्रॉपी दोनों से प्राप्त किया जा सकता है.[6]
समुदाय
किसी दिए गए चर (पंक्ति) के लिए सभी कारकों के वर्गांकित कारक लोडिंग का योग उस चर में सभी कारकों के कारण होने वाला विचरण है। सामुदायिकता सभी कारकों द्वारा संयुक्त रूप से समझाए गए किसी दिए गए चर में भिन्नता के प्रतिशत को मापती है और इसे प्रस्तुत किए गए कारकों के संदर्भ में संकेतक की विश्वसनीयता के रूप में व्याख्या किया जा सकता है।
नकली समाधान
यदि सामुदायिकता 1.0 से अधिक है, तो एक नकली समाधान है, जो बहुत छोटे नमूने या बहुत अधिक या बहुत कम कारकों को निकालने के विकल्प को प्रतिबिंबित कर सकता है।
Uniqueness of a variable
The variability of a variable minus its communality.
Eigenvalues/characteristic roots
Eigenvalues measure the amount of variation in the total sample accounted for by each factor. The ratio of eigenvalues is the ratio of explanatory importance of the factors with respect to the variables. If a factor has a low eigenvalue, then it is contributing little to the explanation of variances in the variables and may be ignored as less important than the factors with higher eigenvalues.
Extraction sums of squared loadings
Initial eigenvalues and eigenvalues after extraction (listed by SPSS as "Extraction Sums of Squared Loadings") are the same for PCA extraction, but for other extraction methods, eigenvalues after extraction will be lower than their initial counterparts. SPSS also prints "Rotation Sums of Squared Loadings" and even for PCA, these eigenvalues will differ from initial and extraction eigenvalues, though their total will be the same.
Factor scores
Component scores (in PCA)
Template:Ghat The scores of each case (row) on each factor (column). To compute the factor score for a given case for a given factor, one takes the case's standardized score on each variable, multiplies by the corresponding loadings of the variable for the given factor, and sums these products. Computing factor scores allows one to look for factor outliers. Also, factor scores may be used as variables in subsequent modeling.

कारकों की संख्या निर्धारित करने के लिए मानदंड

शोधकर्ता कारक प्रतिधारण के लिए ऐसे व्यक्तिपरक या मनमाने मानदंडों से बचना चाहते हैं क्योंकि यह मेरे लिए समझ में आता है। इस समस्या को हल करने के लिए कई वस्तुनिष्ठ विधियों विकसित किए गए हैं, जो उपयोगकर्ताओं को जांच के लिए समाधानों की उचित श्रृंखला निर्धारित करने की अनुमति देते हैं।[7] हालाँकि ये भिन्न-भिन्न विधियाँ अक्सर एक-दूसरे से असहमत होती हैं कि कितने कारकों को बरकरार रखा जाना चाहिए। उदाहरण के लिए, समानांतर विश्लेषण 5 कारकों का सुझाव दे सकता है जबकि वेलिसर का एमएपी 6 का सुझाव देता है, इसलिए शोधकर्ता 5 और 6-कारक समाधान दोनों का अनुरोध कर सकता है और बाहरी डेटा और सिद्धांत के संबंध में प्रत्येक पर चर्चा कर सकता है।

आधुनिक मानदंड

हॉर्न का समानांतर विश्लेषण (पीए):[8] मोंटे-कार्लो आधारित सिमुलेशन विधि जो देखे गए स्वदेशी मूल्यों की तुलना असंबद्ध सामान्य वेरिएबल से प्राप्त मूल्यों से करती है। कारक या घटक को बरकरार रखा जाता है यदि संबंधित आइगेनवैल्यू यादृच्छिक डेटा से प्राप्त आइजेनवैल्यू के वितरण के 95वें प्रतिशतक से बड़ा है। बनाए रखने के लिए घटकों की संख्या निर्धारित करने के लिए पीए अधिक सामान्यतः अनुशंसित नियमों में से है,[7][9] लेकिन कई प्रोग्राम इस विकल्प को शामिल करने में विफल रहते हैं (एक उल्लेखनीय अपवाद आर (प्रोग्रामिंग भाषा) है)।[10] हालाँकि, एंटोन फॉर्मैन ने सैद्धांतिक और अनुभवजन्य दोनों साक्ष्य प्रदान किए कि इसका अनुप्रयोग कई मामलों में उचित नहीं हो सकता है क्योंकि इसका प्रदर्शन प्रतिरूप आकार, आइटम प्रतिक्रिया सिद्धांत # आइटम प्रतिक्रिया फ़ंक्शन और सहसंबंध गुणांक के प्रकार से काफी प्रभावित होता है।[11] वेलिसर (1976) एमएपी परीक्षण[12] जैसा कि कर्टनी द्वारा वर्णित है (2013)[13] "इसमें पूर्ण प्रमुख घटक विश्लेषण शामिल है जिसके पश्चात आंशिक सहसंबंधों के आव्युह की श्रृंखला की जांच की जाती है" (पृष्ठ 397 (हालांकि ध्यान दें कि यह उद्धरण वेलिसर (1976) में नहीं होता है और उद्धृत पृष्ठ संख्या उद्धरण के पृष्ठों के बाहर है)। चरण "0" के लिए वर्ग सहसंबंध (चित्र 4 देखें) अपूर्ण सहसंबंध आव्युह के लिए औसत वर्ग-विकर्ण सहसंबंध है। चरण 1 पर, पहले प्रमुख घटक और उससे संबंधित वस्तुओं को आंशिक रूप से हटा दिया जाता है। इसके पश्चात, पश्चात के सहसंबंध आव्युह के लिए औसत वर्ग-विकर्ण सहसंबंध की गणना चरण 1 के लिए की जाती है। चरण 2 पर, पहले दो प्रमुख घटकों को आंशिक रूप से हटा दिया जाता है और परिणामी औसत वर्ग-विकर्ण सहसंबंध की फिर से गणना की जाती है। गणना k शून्य से चरण के लिए की जाती है (k आव्युह में वेरिएबल की कुल संख्या का प्रतिनिधित्व करता है)। इसके पश्चात, प्रत्येक चरण के लिए सभी औसत वर्ग सहसंबंधों को पंक्तिबद्ध किया जाता है और विश्लेषण में चरण संख्या जिसके परिणामस्वरूप सबसे कम औसत वर्ग आंशिक सहसंबंध होता है, घटकों की संख्या निर्धारित करता है या बनाए रखने के लिए कारक।[12]इस विधि द्वारा, घटकों को तब तक बनाए रखा जाता है जब तक सहसंबंध आव्युह में भिन्नता अवशिष्ट या त्रुटि भिन्नता के विपरीत व्यवस्थित भिन्नता का प्रतिनिधित्व करती है। यद्यपि पद्धतिगत रूप से प्रमुख घटक विश्लेषण के समान, एमएपी तकनीक को कई सिमुलेशन अध्ययनों में बनाए रखने के लिए कारकों की संख्या निर्धारित करने में काफी अच्छा प्रदर्शन करते दिखाया गया है।[7][14][15][16] यह प्रक्रिया SPSS के उपयोगकर्ता इंटरफ़ेस के माध्यम से उपलब्ध कराई गई है,[13]साथ ही आर (प्रोग्रामिंग भाषा) के लिए मनोवैज्ञानिक पैकेज।[17][18]


पुराने विधियों

कैसर मानदंड: कैसर नियम 1.0 के तहत eigenvalues ​​​​के साथ सभी घटकों को छोड़ने के लिए है - यह औसत एकल आइटम द्वारा दर्ज की गई जानकारी के सामान्य eigenvalue है।[19] एसपीएसएस और अधिकांश सांख्यिकीय सॉफ़्टवेयर में कैसर मानदंड डिफ़ॉल्ट है, लेकिन कारकों की संख्या का अनुमान लगाने के लिए एकमात्र कट-ऑफ मानदंड के रूप में उपयोग किए जाने पर इसकी अनुशंसा नहीं की जाती है क्योंकि यह कारकों को अधिक निकालने की प्रवृत्ति रखता है।[20] इस पद्धति का रूपांतर तैयार किया गया है जहां शोधकर्ता प्रत्येक आइगेनवैल्यू के लिए आत्मविश्वास अंतराल की गणना करता है और केवल उन कारकों को बरकरार रखता है जिनका संपूर्ण आत्मविश्वास अंतराल 1.0 से अधिक है।[14][21] मिट्टी - रोढ़ी वाला भूखंड:[22] कैटेल स्क्री परीक्षण घटकों को एक्स-अक्ष के रूप में और संबंधित eigenvalue को वाई-अक्ष के रूप में प्लॉट करता है। जैसे-जैसे कोई दाईं ओर बढ़ता है, पश्चात के घटकों की ओर, स्वदेशी मूल्य कम हो जाते हैं। जब गिरावट बंद हो जाती है और वक्र कम तेज गिरावट की ओर कोहनी बनाता है,तब कैटेल का स्क्री परीक्षण कोहनी से शुरू होने वाले सभी घटकों को छोड़ने के लिए कहता है। शोधकर्ता-नियंत्रित विक्षनरी:फज फ़ैक्टर के प्रति उत्तरदायी होने के कारण कभी-कभी इस नियम की आलोचना की जाती है। अथार्त, चूंकि कोहनी चुनना व्यक्तिपरक हो सकता है क्योंकि वक्र में कई कोहनी होती हैं या चिकनी वक्र होती है, शोधकर्ता को अपने शोध एजेंडे द्वारा वांछित कारकों की संख्या पर कट-ऑफ निर्धारित करने का प्रलोभन दिया जा सकता है।

वेरिएंस ने मानदंड समझाया: कुछ शोधकर्ता भिन्नता के 90% (कभी-कभी 80%) को ध्यान में रखने के लिए पर्याप्त कारकों को रखने के नियम का उपयोग करते हैं। जहां शोधकर्ता का लक्ष्य ओकाम के रेजर पर जोर देता है (यथासंभव कुछ कारकों के साथ भिन्नता की व्याख्या करना), मानदंड 50% तक कम हो सकता है।

बायेसियन विधि

भारतीय बुफ़े प्रक्रिया पर आधारित बायेसियन दृष्टिकोण अव्यक्त कारकों की प्रशंसनीय संख्या पर संभाव्यता वितरण देता है।[23]


रोटेशन विधियाँ

अनरोटेटेड आउटपुट पहले कारक, फिर दूसरे फैक्टर आदि के कारण होने वाले विचरण को अधिकतम करता है। अनरोटेटेड समाधान ओर्थोगोनल है। इसका मतलब है कि कारकों के मध्य सहसंबंध शून्य है। अनरोटेटेड समाधान का उपयोग करने का नुकसान यह है कि सामान्यतः अधिकांश आइटम शुरुआती कारकों पर लोड होते हैं और कई आइटम से अधिक कारकों पर काफी सीमा तक लोड होते हैं।

रोटेशन, लोडिंग का पैटर्न बनाने के लिए समन्वय प्रणाली के अक्षों को रोटेशन (गणित) द्वारा व्याख्या करना आसान बनाता है, जहां प्रत्येक आइटम केवल कारक पर दृढ़ता से लोड होता है और अन्य कारकों पर अधिक कमजोर रूप से लोड होता है। घुमाव ऑर्थोगोनल या तिरछा हो सकता है। तिरछा घुमाव कारकों को सहसंबंधित करने की अनुमति देता है।[24] वेरिमैक्स रोटेशन सबसे अधिक इस्तेमाल की जाने वाली रोटेशन विधि है। वेरिमैक्स कारक अक्षों का ऑर्थोगोनल रोटेशन है जो कारक लोडिंग आव्युह में सभी वेरिएबल (पंक्तियों) पर कारक (स्तंभ) के वर्ग लोडिंग के विचरण को अधिकतम करता है। प्रत्येक कारक में कारक द्वारा बड़े लोडिंग के साथ केवल कुछ वेरिएबल होते हैं। वेरिमैक्स लोडिंग आव्युह के कॉलम को सरल बनाता है। इससे प्रत्येक वेरिएबल को ही कारक से पहचानना यथासंभव आसान हो जाता है।

क्वार्टिमैक्स रोटेशन ऑर्थोगोनल रोटेशन है जो वेरिएबल को समझाने के लिए आवश्यक कारकों की संख्या को कम करता है। यह कॉलम के बजाय लोडिंग आव्युह की पंक्तियों को सरल बनाता है। क्वार्टिमैक्स अक्सर सामान्य कारक उत्पन्न करता है जिसमें कई वेरिएबल के लिए लोडिंग होती है। यह अघुलनशील समाधान के करीब है। यदि कई वेरिएबल सहसंबद्ध हैंतब क्वार्टिमैक्स उपयोगी है ताकि प्रमुख कारक की उम्मीद की जा सके।[25] इक्विमैक्स रोटेशन वेरिमैक्स और क्वार्टिमैक्स के मध्य समझौता है।

कई व्यावहारिक अनुप्रयोगों में, यह मान लेना अवास्तविक है कि कारक असंबंधित हैं। इस स्थिति में तिरछे घुमाव को प्राथमिकता दी जाती है। एक-दूसरे से सहसंबद्ध कारकों को अनुमति देना विशेष रूप से साइकोमेट्रिक अनुसंधान में लागू होता है, क्योंकि दृष्टिकोण, राय और बौद्धिक क्षमताएं सहसंबद्ध होती हैं और अन्यथा मान लेना अवास्तविक होगा।[26] जब कोई व्यक्ति तिरछा (गैर-ऑर्थोगोनल) समाधान चाहता हैतब ओब्लिमिन रोटेशन मानक विधि है।

प्रोमैक्स रोटेशन वैकल्पिक तिरछा रोटेशन विधि है जो ओब्लिमिन विधि की तुलना में कम्प्यूटेशनल रूप से तेज़ है और इसलिए कभी-कभी बहुत बड़े डाटासमुच्चय के लिए उपयोग किया जाता है।

कारक घूर्णन के साथ समस्याएँ

जब प्रत्येक वेरिएबल कई कारकों पर लोड हो रहा होतब कारक संरचना की व्याख्या करना मुश्किल हो सकता है। डेटा में छोटे परिवर्तन कभी-कभी कारक रोटेशन मानदंड में संतुलन बना सकते हैं ताकि पूरी प्रकार से भिन्न कारक रोटेशन उत्पन्न हो। इससे विभिन्न प्रयोगों के परिणामों की तुलना करना कठिन हो सकता है। इस समस्या को विश्वव्यापी सांस्कृतिक भिन्नताओं के विभिन्न अध्ययनों की तुलना से स्पष्ट किया गया है। प्रत्येक अध्ययन ने सांस्कृतिक वेरिएबल के विभिन्न मापों का उपयोग किया है और भिन्न-भिन्न घुमाए गए कारक विश्लेषण परिणाम का उत्पादन किया है। प्रत्येक अध्ययन के लेखकों का मानना ​​था कि उन्होंने कुछ नया खोजा है, और उन्होंने जो कारक पाए उनके लिए नए नाम ईजाद किए। अध्ययनों की पश्चात की तुलना में पाया गया कि जब अनियंत्रित परिणामों की तुलना की गईतब परिणाम समान थे। कारक रोटेशन के सामान्य अभ्यास ने विभिन्न अध्ययनों के परिणामों के मध्य समानता को अस्पष्ट कर दिया है।[27]


उच्च क्रम कारक विश्लेषण

उच्च-क्रम कारक विश्लेषण सांख्यिकीय पद्धति है जिसमें दोहराए जाने वाले चरण कारक विश्लेषण - तिरछा रोटेशन - घुमाए गए कारकों का कारक विश्लेषण शामिल है। इसकी योग्यता शोधकर्ता को अध्ययन की गई घटनाओं की पदानुक्रमित संरचना को देखने में सक्षम बनाना है। परिणामों की व्याख्या करने के लिए, कोई यातब आव्युह गुणन द्वारा आगे बढ़ता है | प्राथमिक कारक पैटर्न आव्युह को उच्च-क्रम कारक पैटर्न आव्युह (गोर्सच, 1983) द्वारा गुणा करने और शायद परिणाम के लिए वेरिमैक्स रोटेशन लागू करने (थॉम्पसन, 1990) या श्मिड-लीमन समाधान (एसएलएस, श्मिड और लीमन, 1957, जिसे श्मिड-लीमन परिवर्तन के रूप में भी जाना जाता है) का उपयोग करके आगे बढ़ता है जो सांख्यिकीय फैलाव का गुण बताता है। प्राथमिक कारकों से दूसरे क्रम के कारकों तक।

खोजपूर्ण कारक विश्लेषण (ईएफए) बनाम प्रमुख घटक विश्लेषण (पीसीए)

कारक विश्लेषण प्रमुख घटक विश्लेषण (पीसीए) से संबंधित है, लेकिन दोनों समान नहीं हैं।[28] दोनों तकनीकों के मध्य अंतर को लेकर क्षेत्र में महत्वपूर्ण विवाद रहा है। पीसीए को खोजपूर्ण कारक विश्लेषण (ईएफए) का अधिक बुनियादी संस्करण माना जा सकता है जिसे हाई-स्पीड कंप्यूटर के आगमन से पहले शुरुआती दिनों में विकसित किया गया था। पीसीए और कारक विश्लेषण दोनों का लक्ष्य डेटा के समुच्चय की आयामीता को कम करना है, लेकिन ऐसा करने के लिए अपनाए गए दृष्टिकोण दोनों तकनीकों के लिए भिन्न-भिन्न हैं। कारक विश्लेषण स्पष्ट रूप से देखे गए वेरिएबल से कुछ अप्राप्य कारकों की पहचान करने के उद्देश्य से डिज़ाइन किया गया है, जबकि पीसीए सीधे इस उद्देश्य को संबोधित नहीं करता है; सर्वोत्तम रूप से, पीसीए आवश्यक कारकों का अनुमान प्रदान करता है।[29] खोजपूर्ण विश्लेषण के दृष्टिकोण से, पीसीए के eigenvalues फुलाए गए घटक लोडिंग हैं, अथार्त, त्रुटि भिन्नता से दूषित हैं।[30][31][32][33][34][35] जबकि खोजपूर्ण कारक विश्लेषण और प्रमुख घटक विश्लेषण को सांख्यिकी के कुछ क्षेत्रों में पर्यायवाची तकनीकों के रूप में माना जाता है, इसकी आलोचना की गई है।[36][37] कारक विश्लेषण अंतर्निहित कारण संरचना की धारणा से संबंधित है: [यह] मानता है कि देखे गए वेरिएबल में सहसंयोजन या अधिक अव्यक्त वेरिएबल (कारकों) की उपस्थिति के कारण होता है जो इन देखे गए वेरिएबल पर कारण प्रभाव डालते हैं।[38] इसके विपरीत, पीसीए ऐसे अंतर्निहित कारण संबंध को नतब मानता है और न ही उस पर निर्भर करता है। शोधकर्ताओं ने तर्क दिया है कि दो तकनीकों के मध्य अंतर का मतलब यह हो सकता है कि विश्लेषणात्मक लक्ष्य के आधार पर को दूसरे पर प्राथमिकता देने के उद्देश्यपूर्ण लाभ हैं। यदि कारक मॉडल गलत विधियों से तैयार किया गया है या मान्यताओं को पूरा नहीं किया गया है,तब कारक विश्लेषण गलत परिणाम देगा। कारक विश्लेषण का सफलतापूर्वक उपयोग किया गया है जहां सिस्टम की पर्याप्त समझ अच्छे प्रारंभिक मॉडल फॉर्मूलेशन की अनुमति देती है। पीसीए मूल डेटा में गणितीय परिवर्तन को नियोजित करता है, जिसमें सहप्रसरण आव्युह के रूप के बारे में कोई धारणा नहीं होती है। पीसीए का उद्देश्य मूल वेरिएबल के रैखिक संयोजनों को निर्धारित करना और कुछ का चयन करना है जिनका उपयोग अधिक जानकारी खोए बिना डेटा समुच्चय को सारांशित करने के लिए किया जा सकता है।[39]


पीसीए और ईएफए के विपरीत तर्क

फैब्रिगर एट अल. (1999)[36]ऐसे कई कारणों का पता लगाएं जिनका उपयोग यह सुझाव देने के लिए किया जाता है कि पीसीए कारक विश्लेषण के सामान्य नहीं है:

  1. कभी-कभी यह सुझाव दिया जाता है कि पीसीए कम्प्यूटेशनल रूप से तेज़ है और कारक विश्लेषण की तुलना में कम संसाधनों की आवश्यकता होती है। फैब्रिगर एट अल. सुझाव है कि आसानी से उपलब्ध कंप्यूटर संसाधनों ने इस व्यावहारिक चिंता को अप्रासंगिक बना दिया है।
  2. पीसीए और कारक विश्लेषण समान परिणाम उत्पन्न कर सकते हैं। इस बिंदु को फैब्रिगर एट अल द्वारा भी संबोधित किया गया है; कुछ मामलों में, जहाँ सामुदायिकताएँ कम हैं (जैसे 0.4), दोनों तकनीकें भिन्न-भिन्न परिणाम उत्पन्न करती हैं। वास्तव में, फैब्रिगर एट अल। तर्क है कि ऐसे मामलों में जहां डेटा सामान्य कारक मॉडल की मान्यताओं के अनुरूप है, पीसीए के परिणाम गलत परिणाम हैं।
  3. ऐसे कुछ स्तिथियों हैं जहां कारक विश्लेषण से 'हेवुड स्तिथियों' सामने आते हैं। इनमें वे स्थितियाँ शामिल हैं जिनमें मापे गए वेरिएबल में 100% या अधिक भिन्नता का अनुमान मॉडल द्वारा लगाया जाता है। फैब्रिगर एट अल. सुझाव दें कि ये स्तिथियों वास्तव में शोधकर्ता के लिए जानकारीपूर्ण हैं, जो गलत विधियों से निर्दिष्ट मॉडल या सामान्य कारक मॉडल के उल्लंघन का संकेत देते हैं। पीसीए दृष्टिकोण में हेवुड मामलों की कमी का मतलब यह हो सकता है कि ऐसे मुद्दों पर ध्यान नहीं दिया जाता है।
  4. शोधकर्ता पीसीए दृष्टिकोण से अतिरिक्त जानकारी प्राप्त करते हैं, जैसे किसी निश्चित घटक पर किसी व्यक्ति का स्कोर; ऐसी जानकारी कारक विश्लेषण से नहीं मिलती है। हालाँकि, फैब्रिगर एट अल के रूप में। तर्क दें, कारक विश्लेषण का विशिष्ट उद्देश्य - अथार्त मापे गए वेरिएबल के मध्य सहसंबंध और निर्भरता की संरचना के लिए लेखांकन कारकों को निर्धारित करना - कारक स्कोर के ज्ञान की आवश्यकता नहीं है और इस प्रकार यह लाभ अस्वीकार कर दिया गया है। कारक विश्लेषण से कारक स्कोर की गणना करना भी संभव है।

प्रसरण बनाम सहप्रसरण

कारक विश्लेषण माप में निहित यादृच्छिक त्रुटि को ध्यान में रखता है, जबकि पीसीए ऐसा करने में विफल रहता है। इस बिंदु का उदाहरण ब्राउन (2009) द्वारा दिया गया है,[40] किसने संकेत दिया कि, गणना में शामिल सहसंबंध आव्युह के संबंध में:

"In PCA, 1.00s are put in the diagonal meaning that all of the variance in the matrix is to be accounted for (including variance unique to each variable, variance common among variables, and error variance). That would, therefore, by definition, include all of the variance in the variables. In contrast, in EFA, the communalities are put in the diagonal meaning that only the variance shared with other variables is to be accounted for (excluding variance unique to each variable and error variance). That would, therefore, by definition, include only variance that is common among the variables."

— Brown (2009), Principal components analysis and exploratory factor analysis – Definitions, differences and choices

इस कारण से, ब्राउन (2009) कारक विश्लेषण का उपयोग करने की सलाह देते हैं जब वेरिएबल के मध्य संबंधों के बारे में सैद्धांतिक विचार मौजूद होते हैं, जबकि पीसीए का उपयोग किया जाना चाहिए यदि शोधकर्ता का लक्ष्य अपने डेटा में पैटर्न का पता लगाना है।

प्रक्रिया और परिणाम में अंतर

पीसीए और कारक विश्लेषण (एफए) के मध्य अंतर को सुहर (2009) द्वारा और अधिक स्पष्ट किया गया है:[37]* पीसीए के परिणामस्वरूप प्रमुख घटक बनते हैं जो प्रेक्षित वेरिएबलों के लिए अधिकतम मात्रा में विचरण का कारण बनते हैं; एफए डेटा में सामान्य भिन्नता का हिसाब रखता है।

  • पीसीए सहसंबंध आव्युह के विकर्णों पर सम्मिलित करता है; एफए अद्वितीय कारकों के साथ सहसंबंध आव्युह के विकर्णों को समायोजित करता है।
  • पीसीए घटक अक्ष पर वर्गाकार लंबवत दूरी के योग को कम करता है; एफए उन कारकों का अनुमान लगाता है जो देखे गए वेरिएबल पर प्रतिक्रियाओं को प्रभावित करते हैं।
  • पीसीए में घटक स्कोर आइगेनवैल्यूज़ एवं आइगेनवेक्टर्स द्वारा भारित देखे गए वेरिएबल के रैखिक संयोजन का प्रतिनिधित्व करते हैं; एफए में देखे गए वेरिएबल अंतर्निहित और अद्वितीय कारकों के रैखिक संयोजन हैं।
  • पीसीए में, प्राप्त घटक व्याख्या योग्य नहीं हैं, अथार्त वे अंतर्निहित 'निर्माण' का प्रतिनिधित्व नहीं करते हैं; एफए में, सटीक मॉडल विनिर्देश दिए जाने पर, अंतर्निहित निर्माणों को लेबल किया जा सकता है और आसानी से व्याख्या की जा सकती है।

साइकोमेट्रिक्स में

इतिहास

चार्ल्स स्पीयरमैन सामान्य कारक विश्लेषण पर चर्चा करने वाले पहले मनोवैज्ञानिक थे[41] और अपने 1904 के पेपर में ऐसा किया।[42] इसने उनके विधियों के बारे में कुछ विवरण प्रदान किए और एकल-कारक मॉडल से संबंधित था।[43] उन्होंने पाया कि विभिन्न प्रकार के असंबंधित विषयों पर स्कूली बच्चों के स्कोर सकारात्मक रूप से सहसंबद्ध थे, जिससे उन्हें यह मानने मेंसहायता मिली कि सामान्य मानसिक क्षमता, या जी कारक (साइकोमेट्रिक्स), मानव संज्ञानात्मक प्रदर्शन को रेखांकित और आकार देता है।

कई कारकों के साथ सामान्य कारक विश्लेषण का प्रारंभिक विकास 1930 के दशक की शुरुआत में लुई लियोन थर्स्टन द्वारा दो पत्रों में दिया गया था,[44][45] उनकी 1935 की पुस्तक, मन के सदिश में इसका सारांश दिया गया है।[46] थर्स्टन ने सामुदायिकता, विशिष्टता और रोटेशन सहित कई महत्वपूर्ण कारक विश्लेषण अवधारणाएँ पेश कीं।[47] उन्होंने सरल संरचना की वकालत की, और रोटेशन के विधियों का विकास किया जिसका उपयोग ऐसी संरचना को प्राप्त करने के विधियों के रूप में किया जा सकता है।[41]

क्यू पद्धति में, स्पीयरमैन के छात्र, विलियम स्टीफेंसन (मनोवैज्ञानिक), अंतर-व्यक्तिगत मतभेदों के अध्ययन की ओर उन्मुख आर कारक विश्लेषण और व्यक्तिपरक अंतर-व्यक्तिगत मतभेदों की ओर उन्मुख क्यू कारक विश्लेषण के मध्य अंतर करते हैं।[48][49] रेमंड कैटेल कारक विश्लेषण और साइकोमेट्रिक्स के प्रबल समर्थक थे और उन्होंने बुद्धि को समझाने के लिए थर्स्टन के बहु-कारक सिद्धांत का इस्तेमाल किया। कैटेल ने स्क्री प्लॉट और समानता गुणांक भी विकसित किया।

मनोविज्ञान में अनुप्रयोग

कारक विश्लेषण का उपयोग उन कारकों की पहचान करने के लिए किया जाता है जो विभिन्न परीक्षणों पर विभिन्न प्रकार के परिणामों की व्याख्या करते हैं। उदाहरण के लिए, खुफिया शोध में पाया गया कि जो लोग मौखिक क्षमता के परीक्षण में उच्च अंक प्राप्त करते हैं वे अन्य परीक्षणों में भी अच्छे होते हैं जिनके लिए मौखिक क्षमताओं की आवश्यकता होती है। शोधकर्ताओं ने कारक को भिन्न करने के लिए कारक विश्लेषण का उपयोग करके इसे समझाया, जिसे अक्सर मौखिक बुद्धिमत्ता कहा जाता है, जो उस डिग्री का प्रतिनिधित्व करता है जिस तक कोई व्यक्ति मौखिक कौशल से जुड़ी समस्याओं को हल करने में सक्षम है।

मनोविज्ञान में कारक विश्लेषण अक्सर खुफिया अनुसंधान से जुड़ा होता है। हालाँकि, इसका उपयोग व्यक्तित्व, दृष्टिकोण, विश्वास आदि जैसे डोमेन की विस्तृत श्रृंखला में कारकों को खोजने के लिए भी किया गया है। यह साइकोमेट्रिक्स से जुड़ा हुआ है, क्योंकि यह किसी उपकरण की वैधता का आकलन यह पता लगाकर कर सकता है कि क्या उपकरण वास्तव में अनुमानित कारकों को मापता है।

फायदे

  • दो या दो से अधिक वेरिएबलों को ही कारक में संयोजित करके वेरिएबलों की संख्या में कमी करना। उदाहरण के लिए, दौड़ने, गेंद फेंकने, बल्लेबाजी, कूदने और वजन उठाने में प्रदर्शन को सामान्य एथलेटिक क्षमता जैसे कारक में जोड़ा जा सकता है। सामान्यतः, किसी आइटम द्वारा लोगों के आव्युह में, संबंधित आइटमों को समूहीकृत करके कारकों का चयन किया जाता है। क्यू कारक विश्लेषण तकनीक में, आव्युह को स्थानांतरित किया जाता है और संबंधित लोगों को समूहीकृत करके कारक बनाए जाते हैं। उदाहरण के लिए, उदारवादी, स्वतंत्रतावादी, रूढ़िवादी और समाजवादी भिन्न-भिन्न समूहों में बन सकते हैं।
  • अंतर-संबंधित वेरिएबलों के समूहों की पहचान करना, यह देखना कि वे एक-दूसरे से कैसे संबंधित हैं। उदाहरण के लिए, कैरोल ने अपने थ्री स्ट्रेटम थ्योरी के निर्माण के लिए कारक विश्लेषण का उपयोग किया। उन्होंने पाया कि व्यापक दृश्य धारणा नामक कारक इस बात से संबंधित है कि कोई व्यक्ति दृश्य कार्यों में कितना अच्छा है। उन्होंने श्रवण कार्य क्षमता से संबंधित व्यापक श्रवण धारणा कारक भी पाया। इसके अतिरिक्त, उन्होंने वैश्विक कारक पाया, जिसे जी या सामान्य बुद्धि कहा जाता है, जो व्यापक दृश्य धारणा और व्यापक श्रवण धारणा दोनों से संबंधित है। इसका मतलब यह है कि उच्च जी वाले व्यक्ति में उच्च दृश्य धारणा क्षमता और उच्च श्रवण धारणा क्षमता दोनों होने की संभावना है, और यह जी इस बात का अच्छा हिस्सा बताता है कि कोई व्यक्ति उन दोनों डोमेन में अच्छा या बुरा क्यों है।

नुकसान

  • ...प्रत्येक अभिविन्यास गणितीय रूप से समान रूप से स्वीकार्य है। लेकिन भिन्न-भिन्न फैक्टोरियल सिद्धांत किसी दिए गए समाधान के लिए फैक्टोरियल अक्षों के झुकाव के संदर्भ में उतने ही भिन्न साबित हुए जितने कि किसी अन्य चीज़ के संदर्भ में, इसलिए मॉडल फिटिंग सिद्धांतों के मध्य अंतर करने में उपयोगी साबित नहीं हुई। (स्टर्नबर्ग, 1977[50]). इसका मतलब है कि सभी घुमाव भिन्न-भिन्न अंतर्निहित प्रक्रियाओं का प्रतिनिधित्व करते हैं, लेकिन सभी घुमाव मानक कारक विश्लेषण अनुकूलन के समान रूप से मान्य परिणाम हैं। इसलिए, अकेले कारक विश्लेषण का उपयोग करके उचित रोटेशन चुनना असंभव है।
  • कारक विश्लेषण केवल उतना ही अच्छा हो सकता है जितना डेटा अनुमति देता है। मनोविज्ञान में, जहां शोधकर्ताओं को अक्सर स्व-रिपोर्ट जैसे कम वैध और विश्वसनीय उपायों पर निर्भर रहना पड़ता है, यह समस्याग्रस्त हो सकता है।
  • कारक विश्लेषण की व्याख्या अनुमान का उपयोग करने पर आधारित है, जो ऐसा समाधान है जो सुविधाजनक है भले ही पूरी प्रकार सच न हो।[51] ही प्रकार से तथ्यांकित किए गए ही डेटा की से अधिक व्याख्याएं की जा सकती हैं, और कारक विश्लेषण कार्य-कारण की पहचान नहीं कर सकता है।

पार-सांस्कृतिक अनुसंधान में

अंतर-सांस्कृतिक अनुसंधान में कारक विश्लेषण अक्सर उपयोग की जाने वाली तकनीक है। यह हॉफस्टेड के सांस्कृतिक आयाम सिद्धांत को निकालने के उद्देश्य को पूरा करता है। सबसे प्रसिद्ध सांस्कृतिक आयाम मॉडल गीर्ट हॉफस्टेड, रोनाल्ड इंगलहार्ट, क्रिश्चियन वेलज़ेल, शालोम एच. श्वार्ट्ज और माइकल मिनकोव द्वारा विस्तृत हैं। लोकप्रिय दृश्य विश्व का इंगलहार्ट-वेल्ज़ेल सांस्कृतिक मानचित्र है|इंगलहार्ट और वेल्ज़ेल का विश्व का सांस्कृतिक मानचित्र।[27]


राजनीति विज्ञान में

1965 के शुरुआती अध्ययन में, संबंधित सैद्धांतिक मॉडल और अनुसंधान के निर्माण, राजनीतिक प्रणालियों की तुलना करने और टाइपोलॉजिकल श्रेणियां बनाने के लिए कारक विश्लेषण के माध्यम से दुनिया भर की राजनीतिक प्रणालियों की जांच की जाती है।[52] इन उद्देश्यों के लिए, इस अध्ययन में सात बुनियादी राजनीतिक आयामों की पहचान की गई है, जो विभिन्न प्रकार के राजनीतिक व्यवहार से संबंधित हैं: ये आयाम हैं पहुंच, भेदभाव, आम सहमति, अनुभागवाद, वैधीकरण, रुचि और नेतृत्व सिद्धांत और अनुसंधान।

अन्य राजनीतिक वैज्ञानिक 1988 के राष्ट्रीय चुनाव अध्ययन में जोड़े गए चार नए प्रश्नों का उपयोग करके आंतरिक राजनीतिक प्रभावकारिता के माप का पता लगाते हैं। यहां कारक विश्लेषण का उपयोग यह पता लगाने के लिए किया जाता है कि ये आइटम बाहरी प्रभावकारिता और राजनीतिक विश्वास से भिन्न एकल अवधारणा को मापते हैं, और ये चार प्रश्न उस समय तक आंतरिक राजनीतिक प्रभावकारिता का सबसे अच्छा उपाय प्रदान करते हैं।[53] संयुक्त राज्य अमेरिका के राष्ट्रपति पद की बहस, रैलियों और हिलेरी क्लिंटन ईमेल विवाद जैसे महत्वपूर्ण अभियान कार्यक्रमों के प्रभाव का अध्ययन करने के लिए| हिलेरी क्लिंटन के ईमेल विवाद, कारक विश्लेषण का उपयोग 2016 में डोनाल्ड ट्रम्प और 2012 में ओबामा जैसे अमेरिकी राष्ट्रपति पद के उम्मीदवारों के लिए लोकप्रियता के उपाय बनाने के लिए किया जाता है। लोकप्रियता कारकों को ट्विटर, फेसबुक, यूट्यूब, इंस्टाग्राम, पाँच अड़तीस और भविष्यवाणी बाजारों से एकत्र किए गए डेटा से संश्लेषित किया जाता है।[54]


विपणन में

बुनियादी कदम हैं:

सूचना संग्रह

डेटा संग्रह चरण सामान्यतः विपणन अनुसंधान पेशेवरों द्वारा किया जाता है। सर्वेक्षण प्रश्न उत्तरदाता से किसी उत्पाद के प्रतिरूप या उत्पाद अवधारणाओं के विवरण को विभिन्न विशेषताओं के आधार पर रेटिंग देने के लिए कहते हैं। कहीं भी पाँच से बीस विशेषताएँ चुनी जाती हैं। उनमें ये चीजें शामिल हो सकती हैं: उपयोग में आसानी, वजन, सटीकता, स्थायित्व, रंगीनता, कीमत या आकार। चुनी गई विशेषताएँ अध्ययन किए जा रहे उत्पाद के आधार पर भिन्न-भिन्न होंगी। अध्ययन में सभी उत्पादों के बारे में ही प्रश्न पूछा गया है। कई उत्पादों के डेटा को कोडित किया जाता है और आर (प्रोग्रामिंग भाषा), एसपीएसएस, एसएएस प्रणाली, स्टेटा, आंकड़े, जेएमपी और सिस्टैट जैसे सांख्यिकीय कार्यक्रम में इनपुट किया जाता है।

विश्लेषण

विश्लेषण उन अंतर्निहित कारकों को भिन्न करेगा जो एसोसिएशन के आव्युह का उपयोग करके डेटा की व्याख्या करते हैं।[55] कारक विश्लेषण अन्योन्याश्रय तकनीक है। अन्योन्याश्रित संबंधों के संपूर्ण समुच्चय की जांच की जाती है। आश्रित वेरिएबल , स्वतंत्र वेरिएबल , या कार्य-कारण का कोई विनिर्देश नहीं है। कारक विश्लेषण मानता है कि विभिन्न विशेषताओं पर सभी रेटिंग डेटा को कुछ महत्वपूर्ण आयामों तक कम किया जा सकता है। यह कमी इसलिए संभव है क्योंकि कुछ विशेषताएँ एक-दूसरे से संबंधित हो सकती हैं। किसी विशेषता को दी गई रेटिंग आंशिक रूप से अन्य विशेषताओं के प्रभाव का परिणाम होती है। सांख्यिकीय एल्गोरिदम रेटिंग को उसके विभिन्न घटकों में विभाजित करता है (जिसे कच्चा स्कोर कहा जाता है) और आंशिक स्कोर को अंतर्निहित कारक स्कोर में पुनर्निर्मित करता है। प्रारंभिक कच्चे स्कोर और अंतिम कारक स्कोर के मध्य सहसंबंध की डिग्री को कारक लोडिंग कहा जाता है।

फायदे

  • वस्तुनिष्ठ और व्यक्तिपरक दोनों विशेषताओं का उपयोग किया जा सकता है, बशर्ते व्यक्तिपरक विशेषताओं को अंकों में परिवर्तित किया जा सके।
  • कारक विश्लेषण अव्यक्त आयामों या निर्माणों की पहचान कर सकता है जो प्रत्यक्ष विश्लेषण नहीं कर सकता है।
  • यह आसान और सस्ता है.

नुकसान

  • उपयोगिता उत्पाद विशेषताओं का पर्याप्त समुच्चय एकत्र करने की शोधकर्ताओं की क्षमता पर निर्भर करती है। यदि महत्वपूर्ण विशेषताओं को बाहर रखा जाता है या उपेक्षित किया जाता है,तब प्रक्रिया का मूल्य कम हो जाता है।
  • यदि देखे गए वेरिएबल के समुच्चय एक-दूसरे के समान हैं और अन्य वस्तुओं से भिन्न हैं,तब कारक विश्लेषण उन्हें ही कारक प्रदान करेगा। यह उन कारकों को अस्पष्ट कर सकता है जो अधिक दिलचस्प रिश्तों का प्रतिनिधित्व करते हैं।
  • नामकरण कारकों के लिए सिद्धांत के ज्ञान की आवश्यकता हो सकती है क्योंकि प्रतीत होता है कि भिन्न गुण अज्ञात कारणों से दृढ़ता से सहसंबद्ध हो सकते हैं।

भौतिक और जैविक विज्ञान में

भू-रसायन विज्ञान, जल रसायन विज्ञान जैसे भौतिक विज्ञानों में भी कारक विश्लेषण का व्यापक रूप से उपयोग किया गया है।[56] खगोल भौतिकी और ब्रह्मांड विज्ञान, साथ ही जैविक विज्ञान, जैसे पारिस्थितिकी, आणविक जीव विज्ञान, तंत्रिका विज्ञान और जैव रसायन।

भूजल गुणवत्ता प्रबंधन में, विभिन्न रसायनों के स्थानिक वितरण को जोड़ना महत्वपूर्ण है विभिन्न संभावित स्रोतों के पैरामीटर, जिनके भिन्न-भिन्न रासायनिक हस्ताक्षर हैं। उदाहरण के लिए, सल्फाइड खदान उच्च स्तर की अम्लता, घुले हुए सल्फेट्स और संक्रमण धातुओं से जुड़ी होने की संभावना है। इन हस्ताक्षरों को आर-मोड कारक विश्लेषण के माध्यम से कारकों के रूप में पहचाना जा सकता है, और कारक स्कोर को समोच्च करके संभावित स्रोतों का स्थान सुझाया जा सकता है।[57] भू-रसायन विज्ञान में, विभिन्न कारक विभिन्न खनिज संघों और इस प्रकार खनिजकरण के अनुरूप हो सकते हैं।[58]


माइक्रोएरे विश्लेषण में

एफिमेट्रिक्स जीनचिप्स के लिए जांच स्तर पर उच्च-घनत्व oligonucleotide डीएनए माइक्रोएरे डेटा को सारांशित करने के लिए कारक विश्लेषण का उपयोग किया जा सकता है। इस स्तिथियों में, अव्यक्त वेरिएबल प्रतिरूप में आरएनए एकाग्रता से मेल खाता है।[59]


कार्यान्वयन

1980 के दशक से कई सांख्यिकीय विश्लेषण कार्यक्रमों में कारक विश्लेषण लागू किया गया है:

स्टैंडअलोन

यह भी देखें

टिप्पणियाँ


संदर्भ

  1. Jöreskog, Karl G. (1983). "Factor Analysis as an Errors-in-Variables Model". आधुनिक मनोवैज्ञानिक मापन के सिद्धांत. Hillsdale: Erlbaum. pp. 185–196. ISBN 0-89859-277-1.
  2. Bandalos, Deborah L. (2017). सामाजिक विज्ञान के लिए मापन सिद्धांत और अनुप्रयोग. The Guilford Press.
  3. 3.0 3.1 3.2 Harman, Harry H. (1976). आधुनिक कारक विश्लेषण. University of Chicago Press. pp. 175, 176. ISBN 978-0-226-31652-9.
  4. 4.0 4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8 Polit DF Beck CT (2012). Nursing Research: Generating and Assessing Evidence for Nursing Practice, 9th ed. Philadelphia, USA: Wolters Klower Health, Lippincott Williams & Wilkins.
  5. Meng, J. (2011). "एक गैर-नकारात्मक हाइब्रिड कारक मॉडल का उपयोग करके ग्लियोब्लास्टोमा में माइक्रोआरएनए और प्रतिलेखन कारकों द्वारा सहकारी जीन नियमों को उजागर करें". International Conference on Acoustics, Speech and Signal Processing. Archived from the original on 2011-11-23.
  6. Liou, C.-Y.; Musicus, B.R. (2008). "Cross Entropy Approximation of Structured Gaussian Covariance Matrices" (PDF). IEEE Transactions on Signal Processing. 56 (7): 3362–3367. Bibcode:2008ITSP...56.3362L. doi:10.1109/TSP.2008.917878. S2CID 15255630.
  7. 7.0 7.1 7.2 Zwick, William R.; Velicer, Wayne F. (1986). "बनाए रखने के लिए घटकों की संख्या निर्धारित करने के लिए पांच नियमों की तुलना।". Psychological Bulletin. 99 (3): 432–442. doi:10.1037/0033-2909.99.3.432.
  8. Horn, John L. (June 1965). "कारक विश्लेषण में कारकों की संख्या के लिए एक तर्क और परीक्षण". Psychometrika. 30 (2): 179–185. doi:10.1007/BF02289447. PMID 14306381. S2CID 19663974.
  9. Dobriban, Edgar (2017-10-02). "कारक विश्लेषण और पीसीए के लिए क्रमपरिवर्तन विधियाँ" (in English). arXiv:1710.00479v2 [math.ST].
  10. * Ledesma, R.D.; Valero-Mora, P. (2007). "Determining the Number of Factors to Retain in EFA: An easy-to-use computer program for carrying out Parallel Analysis". Practical Assessment Research & Evaluation. 12 (2): 1–11.
  11. Tran, U. S., & Formann, A. K. (2009). Performance of parallel analysis in retrieving unidimensionality in the presence of binary data. Educational and Psychological Measurement, 69, 50-61.
  12. 12.0 12.1 Velicer, W.F. (1976). "आंशिक सहसंबंधों के मैट्रिक्स से घटकों की संख्या निर्धारित करना". Psychometrika. 41 (3): 321–327. doi:10.1007/bf02293557. S2CID 122907389.
  13. 13.0 13.1 Courtney, M. G. R. (2013). Determining the number of factors to retain in EFA: Using the SPSS R-Menu v2.0 to make more judicious estimations. Practical Assessment, Research and Evaluation, 18(8). Available online: http://pareonline.net/getvn.asp?v=18&n=8
  14. 14.0 14.1 Warne, R. T.; Larsen, R. (2014). "खोजपूर्ण कारक विश्लेषण में कारकों की संख्या निर्धारित करने के लिए गुटमैन नियम के प्रस्तावित संशोधन का मूल्यांकन करना". Psychological Test and Assessment Modeling. 56: 104–123.
  15. Ruscio, John; Roche, B. (2012). "ज्ञात तथ्यात्मक संरचना के तुलनात्मक डेटा का उपयोग करके खोजपूर्ण कारक विश्लेषण में बनाए रखने के लिए कारकों की संख्या निर्धारित करना". Psychological Assessment. 24 (2): 282–292. doi:10.1037/a0025697. PMID 21966933.
  16. Garrido, L. E., & Abad, F. J., & Ponsoda, V. (2012). A new look at Horn's parallel analysis with ordinal variables. Psychological Methods. Advance online publication. doi:10.1037/a0030005
  17. Revelle, William (2007). "Determining the number of factors: the example of the NEO-PI-R" (PDF). {{cite journal}}: Cite journal requires |journal= (help)
  18. Revelle, William (8 January 2020). "psych: Procedures for Psychological, Psychometric, and PersonalityResearch".
  19. Kaiser, Henry F. (April 1960). "कारक विश्लेषण के लिए इलेक्ट्रॉनिक कंप्यूटर का अनुप्रयोग". Educational and Psychological Measurement. 20 (1): 141–151. doi:10.1177/001316446002000116. S2CID 146138712.
  20. Bandalos, D.L.; Boehm-Kaufman, M.R. (2008). "Four common misconceptions in exploratory factor analysis". In Lance, Charles E.; Vandenberg, Robert J. (eds.). Statistical and Methodological Myths and Urban Legends: Doctrine, Verity and Fable in the Organizational and Social Sciences. Taylor & Francis. pp. 61–87. ISBN 978-0-8058-6237-9.
  21. Larsen, R.; Warne, R. T. (2010). "खोजपूर्ण कारक विश्लेषण में eigenvalues ​​​​के लिए आत्मविश्वास अंतराल का अनुमान लगाना". Behavior Research Methods. 42 (3): 871–876. doi:10.3758/BRM.42.3.871. PMID 20805609. {{cite journal}}: zero width space character in |title= at position 40 (help)
  22. Cattell, Raymond (1966). "गुणनखंडों की संख्या के लिए रोड़ी परीक्षण". Multivariate Behavioral Research. 1 (2): 245–76. doi:10.1207/s15327906mbr0102_10. PMID 26828106.
  23. Alpaydin (2020). मशीन लर्निंग का परिचय (5th ed.). pp. 528–9.
  24. "कारक रोटेशन के तरीके". Stack Exchange. Retrieved 7 November 2022.
  25. Neuhaus, Jack O; Wrigley, C. (1954). "क्वार्टिमैक्स विधि". British Journal of Statistical Psychology. 7 (2): 81–91. doi:10.1111/j.2044-8317.1954.tb00147.x.
  26. Russell, D.W. (December 2002). "In search of underlying dimensions: The use (and abuse) of factor analysis in Personality and Social Psychology Bulletin". Personality and Social Psychology Bulletin. 28 (12): 1629–46. doi:10.1177/014616702237645. S2CID 143687603.
  27. 27.0 27.1 Fog, A (2022). "Two-Dimensional Models of Cultural Differences: Statistical and Theoretical Analysis" (PDF). Cross-Cultural Research. 57 (2–3): 115–165. doi:10.1177/10693971221135703. S2CID 253153619.
  28. Bartholomew, D.J.; Steele, F.; Galbraith, J.; Moustaki, I. (2008). बहुभिन्नरूपी सामाजिक विज्ञान डेटा का विश्लेषण. Statistics in the Social and Behavioral Sciences Series (2nd ed.). Taylor & Francis. ISBN 978-1584889601.
  29. Jolliffe I.T. Principal Component Analysis, Series: Springer Series in Statistics, 2nd ed., Springer, NY, 2002, XXIX, 487 p. 28 illus. ISBN 978-0-387-95442-4
  30. Cattell, R. B. (1952). Factor analysis. New York: Harper.
  31. Fruchter, B. (1954). Introduction to Factor Analysis. Van Nostrand.
  32. Cattell, R. B. (1978). Use of Factor Analysis in Behavioral and Life Sciences. New York: Plenum.
  33. Child, D. (2006). The Essentials of Factor Analysis, 3rd edition. Bloomsbury Academic Press.
  34. Gorsuch, R. L. (1983). Factor Analysis, 2nd edition. Hillsdale, NJ: Erlbaum.
  35. McDonald, R. P. (1985). Factor Analysis and Related Methods. Hillsdale, NJ: Erlbaum.
  36. 36.0 36.1 Fabrigar; et al. (1999). "मनोवैज्ञानिक अनुसंधान में खोजपूर्ण कारक विश्लेषण के उपयोग का मूल्यांकन करना।" (PDF). Psychological Methods.
  37. 37.0 37.1 Suhr, Diane (2009). "प्रमुख घटक विश्लेषण बनाम खोजपूर्ण कारक विश्लेषण" (PDF). SUGI 30 Proceedings. Retrieved 5 April 2012.
  38. SAS Statistics. "प्रमुख घटक विश्लेषण" (PDF). SAS Support Textbook.
  39. Meglen, R.R. (1991). "Examining Large Databases: A Chemometric Approach Using Principal Component Analysis". Journal of Chemometrics. 5 (3): 163–179. doi:10.1002/cem.1180050305. S2CID 120886184.
  40. Brown, J. D. (January 2009). "Principal components analysis and exploratory factor analysis – Definitions, differences and choices" (PDF). Shiken: JALT Testing & Evaluation SIG Newsletter. Retrieved 16 April 2012.
  41. 41.0 41.1 Mulaik, Stanley A (2010). कारक विश्लेषण की नींव. दूसरा संस्करण. Boca Raton, Florida: CRC Press. p. 6. ISBN 978-1-4200-9961-4.
  42. Spearman, Charles (1904). "सामान्य बुद्धि वस्तुनिष्ठ रूप से निर्धारित और मापी जाती है". American Journal of Psychology. 15 (2): 201–293. doi:10.2307/1412107. JSTOR 1412107.
  43. Bartholomew, D. J. (1995). "स्पीयरमैन और कारक विश्लेषण की उत्पत्ति और विकास". British Journal of Mathematical and Statistical Psychology. 48 (2): 211–220. doi:10.1111/j.2044-8317.1995.tb01060.x.
  44. Thurstone, Louis (1931). "एकाधिक कारक विश्लेषण". Psychological Review. 38 (5): 406–427. doi:10.1037/h0069792.
  45. Thurstone, Louis (1934). "मन के सदिश". The Psychological Review. 41: 1–32. doi:10.1037/h0075959.
  46. Thurstone, L. L. (1935). मन के सदिश. प्राथमिक लक्षणों के अलगाव के लिए बहु-कारक विश्लेषण।. Chicago, Illinois: University of Chicago Press.
  47. Bock, Robert (2007). "Rethinking Thurstone". In Cudeck, Robert; MacCallum, Robert C. (eds.). 100 पर कारक विश्लेषण. Mahwah, New Jersey: Lawrence Erlbaum Associates. p. 37. ISBN 978-0-8058-6212-6.
  48. Mckeown, Bruce (2013-06-21). क्यू पद्धति. ISBN 9781452242194. OCLC 841672556.
  49. Stephenson, W. (August 1935). "कारक विश्लेषण की तकनीक". Nature. 136 (3434): 297. Bibcode:1935Natur.136..297S. doi:10.1038/136297b0. ISSN 0028-0836. S2CID 26952603.
  50. Sternberg, R. J. (1977). Metaphors of Mind: Conceptions of the Nature of Intelligence. New York: Cambridge University Press. pp. 85–111.[verification needed]
  51. "कारक विश्लेषण". Archived from the original on August 18, 2004. Retrieved July 22, 2004.
  52. Gregg, Phillip M.; Banks, Arthur S. (1965). "Dimensions of political systems: Factor analysis of a cross-polity survey". American Political Science Review (in English). 59 (3): 602–614. doi:10.2307/1953171.
  53. Niemi, Richard G.; Craig, Stephen C.; Mattei, Franco (December 1991). "Measuring Internal Political Efficacy in the 1988 National Election Study". American Political Science Review (in English). 85 (4): 1407–1413. doi:10.2307/1963953. ISSN 0003-0554.
  54. Franch, Fabio (May 2021). "Political preferences nowcasting with factor analysis and internet data: The 2012 and 2016 US presidential elections". Technological Forecasting and Social Change (in English). 166: 120667. doi:10.1016/j.techfore.2021.120667. ISSN 0040-1625.
  55. Ritter, N. (2012). A comparison of distribution-free and non-distribution free methods in factor analysis. Paper presented at Southwestern Educational Research Association (SERA) Conference 2012, New Orleans, LA (ED529153).
  56. Subbarao, C.; Subbarao, N.V.; Chandu, S.N. (December 1996). "कारक विश्लेषण का उपयोग करके भूजल संदूषण का लक्षण वर्णन". Environmental Geology. 28 (4): 175–180. Bibcode:1996EnGeo..28..175S. doi:10.1007/s002540050091. S2CID 129655232.
  57. Love, D.; Hallbauer, D.K.; Amos, A.; Hranova, R.K. (2004). "Factor analysis as a tool in groundwater quality management: two southern African case studies". Physics and Chemistry of the Earth. 29 (15–18): 1135–43. Bibcode:2004PCE....29.1135L. doi:10.1016/j.pce.2004.09.027.
  58. Barton, E.S.; Hallbauer, D.K. (1996). "Trace-element and U—Pb isotope compositions of pyrite types in the Proterozoic Black Reef, Transvaal Sequence, South Africa: Implications on genesis and age". Chemical Geology. 133 (1–4): 173–199. doi:10.1016/S0009-2541(96)00075-7.
  59. Hochreiter, Sepp; Clevert, Djork-Arné; Obermayer, Klaus (2006). "एफिमेट्रिक्स जांच स्तर डेटा के लिए एक नई सारांशीकरण विधि". Bioinformatics. 22 (8): 943–9. doi:10.1093/bioinformatics/btl033. PMID 16473874.
  60. "sklearn.decomposition.FactorAnalysis — scikit-learn 0.23.2 documentation". scikit-learn.org.
  61. MacCallum, Robert (June 1983). "A comparison of factor analysis programs in SPSS, BMDP, and SAS". Psychometrika. 48 (2): 223–231. doi:10.1007/BF02294017. S2CID 120770421.


अग्रिम पठन


बाहरी संबंध