मिश्रित डेटा का कारक विश्लेषण

From Vigyanwiki

आंकड़ों में, मिश्रित डेटा का कारक विश्लेषण या मिश्रित डेटा का तथ्यात्मक विश्लेषण (एफएएमडी, फ़्रेंच मूल में, एएफडीएम या विश्लेषण फैक्टरिएले डी डोनीज़ मिक्सटेस), डेटा तालिकाओं के लिए समर्पित कारक विश्लेषण है जिसमें व्यक्तियों के एक समूह को मात्रात्मक और गुणात्मक दोनों चर द्वारा वर्णित किया जाता है। यह जीन-पॉल बेंज़ेक्रि द्वारा स्थापित विश्लेषण डेस डोनीज़ (डेटा विश्लेषण) नामक फ्रांसीसी स्कूल द्वारा विकसित खोजपूर्ण तरीकों से संबंधित है।

मिश्रित शब्द मात्रात्मक और गुणात्मक दोनों चर के उपयोग को संदर्भित करता है। मोटे तौर पर, हम कह सकते हैं कि एफएएमडी मात्रात्मक चर के लिए प्रमुख घटक विश्लेषण (पीसीए) के रूप में और गुणात्मक चर के लिए एकाधिक पत्राचार विश्लेषण (एमसीए) के रूप में काम करता है।

विस्तार

जब डेटा में दोनों प्रकार के चर सम्मिलित होते हैं लेकिन सक्रिय चर सजातीय होते हैं, तो पीसीए या एमसीए का उपयोग किया जा सकता है।

वास्तव में, व्यक्तियों पर चर और कारक विश्लेषण के बीच सहसंबंध गुणांक द्वारा एमसीए में पूरक मात्रात्मक चर को सम्मिलित करना आसान है (व्यक्तियों पर एक कारक एक क्रमगुणित अक्ष पर व्यक्तियों के निर्देशांक को संग्रहण करने वाला सदिश है), प्राप्त प्रतिनिधित्व एक सहसंबंध चक्र (जैसा कि पीसीए में है) है।

इसी प्रकार, पीसीए में पूरक श्रेणीगत चर सम्मिलित करना आसान है।[1] इसके लिए, प्रत्येक श्रेणी को उन व्यक्तियों के गुरुत्वाकर्षण के केंद्र द्वारा दर्शाया जाता है जिनके पास यह (एमसीए के रूप में) है।

जब सक्रिय चर मिश्रित होते हैं, तो सामान्य अभ्यास मात्रात्मक चर (उदाहरण के लिए आमतौर पर सर्वेक्षणों में आयु को आयु वर्गों में बदल दिया जाता है) पर विवेकीकरण करना होता है। इस प्रकार प्राप्त डेटा को एमसीए द्वारा संसाधित किया जा सकता है।

यह पद्धति अपनी सीमा तक पहुँचती है,

  • जब कुछ व्यक्ति होते हैं (विचारों को ठीक करने के लिए सौ से भी कम) तो ऐसी स्थिति में एमसीए अस्थिर होता है,
  • जब मात्रात्मक चर के संबंध में कुछ गुणात्मक चर होते हैं (एक एकल गुणात्मक चर को ध्यान में रखने के लिए बीस मात्रात्मक चर को अलग करने में कोई अनिच्छुक हो सकता है)।

मानदंड

डेटा में मात्रात्मक चर और गुणात्मक चर सम्मिलित है।

एक मात्रात्मक चर है। हम लिखते हैं,

  • चर और के बीच सहसंबंध गुणांक,
  • चर और के बीच वर्ग सहसंबंध अनुपात

के पीसीए में, हम ( पर एक फलन प्रत्येक व्यक्ति को एक मान निर्दिष्ट करता है, यह प्रारंभिक चर और प्रमुख घटकों की स्थिति है) पर फलन का अवलोकन करते हैं जो निम्नलिखित अर्थों में सभी चर से सबसे अधिक सहसंबद्ध है,

अधिकतम।

Q के एमसीए में, हम निम्नलिखित अर्थों में सभी चरो से संबंधित पर फलन का अवलोकन करते हैं,

अधिकतम।

एफएएमडी में, हम निम्नलिखित अर्थों में सभी चर से संबंधित पर फलन का अवलोकन करते हैं,

अधिकतम।

इस मानदंड में, दोनों प्रकार के चर समान भूमिका निभाते हैं। इस मानदंड में प्रत्येक चर का योगदान 1 से परिबद्ध है।

प्लॉट

व्यक्तियों का प्रतिनिधित्व सीधे कारकों से किया जाता है।

मात्रात्मक चर का प्रतिनिधित्व पीसीए (सहसंबंध चक्र) के रूप में बनाया गया है।

गुणात्मक चर की श्रेणियों का प्रतिनिधित्व एमसीए के समान है, एक श्रेणी उन व्यक्तियों के केंद्र में होती है जिनके पास यह होती है। ध्यान दें कि हम सटीक केन्द्रक लेते हैं, न कि, अक्ष (एमसीए में यह गुणांक अभिलक्षणिक मान के वर्गमूल के व्युत्क्रम के बराबर है, यह एफएएमडी में अपर्याप्त होगा) पर निर्भर गुणांक तक का केन्द्रक जैसा कि एमसीए में प्रथागत है।

चरों के निरूपण को संबंध वर्ग कहा जाता है। अक्ष के अनुदिश गुणात्मक चर का निर्देशांक चर और श्रेणी (लक्षित ) के कारक के बीच वर्ग सहसंबंध अनुपात के बराबर है। अक्ष के साथ मात्रात्मक चर के निर्देशांक चर और श्रेणी (लक्षित ) के कारक के बीच वर्ग सहसंबंध गुणांक के बराबर हैं।

व्याख्या में सहायता

प्रारंभिक चरों के बीच संबंध संकेतक एक तथाकथित संबंध मैट्रिक्स में संयुक्त होते हैं, जिसमें पंक्ति के चौराहे पर सम्मिलित होते हैं और स्तंभ :

  • यदि चर और मात्रात्मक हैं, चर के बीच वर्ग सहसंबंध गुणांक और  ;
  • यदि चर गुणात्मक एवं परिवर्तनशील है मात्रात्मक है, के बीच चुकता सहसंबंध अनुपात और ;
  • यदि चर और गुणात्मक, सूचक हैं चरों के बीच और .

उदाहरण

एक बहुत छोटा डेटा सेट (तालिका 1) एफएएमडी के संचालन और आउटपुट को दर्शाता है। छह व्यक्तियों का वर्णन तीन मात्रात्मक चर और तीन गुणात्मक चर द्वारा किया जाता है। आर पैकेज फलन FAMD FactoMineR का उपयोग करके डेटा का विश्लेषण किया गया।

Table 1. Data (test example).
2 4.5 4 -A -B -C
5 4.5 4 -C -B -C
3 1 2 -B -B -B
4 1 2 -B -B -B
1 1 1 -A -A -A
6 1 2 -C -A -A
Table 2. Test example. Relationship matrix.
1 0.00 0.05 0.91 0.00 0.00
0.00 1 0.90 0.25 0.25 1.00
0.05 0.90 1 0.13 0.40 0.93
0.91 0.25 0.13 2 0.25 1.00
0.00 0.25 0.40 0.25 1 1.00
0.00 1.00 0.93 1.00 1.00 2

संबंध मैट्रिक्स में, गुणांक बराबर होते हैं (मात्रात्मक चर), (गुणात्मक चर) या (प्रत्येक प्रकार का एक चर)।

मैट्रिक्स दो प्रकार के चरों के बीच संबंधों की उलझन को दर्शाता है।

व्यक्तियों का प्रतिनिधित्व (चित्र 1) स्पष्ट रूप से व्यक्तियों के तीन समूहों को दर्शाता है। पहली धुरी व्यक्ति 1 और 2 का अन्य सभी से विरोध करती है। दूसरी धुरी व्यक्ति 3 और 4 का व्यक्ति 5 और 6 से विरोध करती है।

Figure1. FAMD. Test example. Representation of individuals.
Figure2. FAMD. Test example. Relationship square.
Figure3. FAMD. Test example. Correlation circle.
Figure4. FAMD. Test example. Representation of the categories of qualitative variables.

चरों का प्रतिनिधित्व (संबंध वर्ग, चित्र 2) दर्शाता है कि पहली धुरी () चरों से निकटता से जुड़ा हुआ है , और . सहसंबंध चक्र (चित्रा 3) के बीच सहसंबंध का संकेत निर्दिष्ट करता है , और ; श्रेणियों का प्रतिनिधित्व (चित्र 4) बीच संबंध की प्रकृति को स्पष्ट करता है और . अंत में व्यक्ति 1 और 2, पहली धुरी द्वारा वैयक्तिकृत, उच्च मूल्यों की विशेषता रखते हैं और और श्रेणियों द्वारा का भी।

यह उदाहरण दिखाता है कि एफएएमडी एक साथ मात्रात्मक और गुणात्मक चर का विश्लेषण कैसे करता है। इस प्रकार, इस उदाहरण में, यह दो प्रकार के चर पर आधारित पहला आयाम दिखाता है।

इतिहास

FAMD का मूल कार्य ब्रिगिट एस्कोफ़ियर के कारण है[2] और गिल्बर्ट सपोर्टा।[3] यह काम 2002 में जेरोम पेजेस द्वारा फिर से शुरू किया गया था।[4] अंग्रेजी में एफएएमडी की सबसे संपूर्ण प्रस्तुति जेरोम पेजेस की पुस्तक में सम्मिलित है।[5]


सॉफ़्टवेयर

विधि आर पैकेज FactoMineR में लागू की गई है। यह विधि पायथन लाइब्रेरी Prince में लागू की गई है।

संदर्भ

  1. Escofier, Brigitte; Pagès, Jérôme (2016). Analyses factorielles simples et multiples : cours et études de cas (PDF) (in français). Paris: Dunod. ISBN 978-2-10-074144-1. OCLC 951230297.
  2. Escofier Brigitte (1979). "Traitement simultané de variables quantitatives et qualitatives en analyse factorielle" (PDF). Les cahiers de l'analyse des données. 4 (2): 137–146.
  3. Saporta Gilbert (1990). Simultaneous analysis of qualitative and quantitative data. Atti della XXXV riunione scientifica ; società italiana di Statistica, 63–72 . http://cedric.cnam.fr/~saporta/SAQQD.pdf
  4. Pagès Jérôme (2002). "Analyse factorielle de données mixtes" (PDF). Revue de Statistique appliquée. 52 (4): 93–111.
  5. Pagès, Jérôme (2015). आर का उपयोग करके उदाहरण के द्वारा एकाधिक कारक विश्लेषण. Boca Raton: CRC Press. ISBN 978-1-4822-0547-3. OCLC 894169715.