मिश्रित डेटा का कारक विश्लेषण

From Vigyanwiki

आंकड़ों में, मिश्रित डेटा का कारक विश्लेषण या मिश्रित डेटा का तथ्यात्मक विश्लेषण (एफएएमडी, फ़्रेंच मूल में, एएफडीएम या विश्लेषण फैक्टरिएले डी डोनीज़ मिक्सटेस), डेटा तालिकाओं के लिए समर्पित कारक विश्लेषण है जिसमें व्यक्तियों के एक समूह को मात्रात्मक और गुणात्मक दोनों चर द्वारा वर्णित किया जाता है। यह जीन-पॉल बेंज़ेक्रि द्वारा स्थापित विश्लेषण डेस डोनीज़ (डेटा विश्लेषण) नामक फ्रांसीसी स्कूल द्वारा विकसित खोजपूर्ण तरीकों से संबंधित है।

मिश्रित शब्द मात्रात्मक और गुणात्मक दोनों चर के उपयोग को संदर्भित करता है। मोटे तौर पर, हम कह सकते हैं कि एफएएमडी मात्रात्मक चर के लिए प्रमुख घटक विश्लेषण (पीसीए) के रूप में और गुणात्मक चर के लिए एकाधिक पत्राचार विश्लेषण (एमसीए) के रूप में काम करता है।

विस्तार

जब डेटा में दोनों प्रकार के चर सम्मिलित होते हैं लेकिन सक्रिय चर सजातीय होते हैं, तो पीसीए या एमसीए का उपयोग किया जा सकता है।

वास्तव में, व्यक्तियों पर चर और कारक विश्लेषण के बीच सहसंबंध गुणांक द्वारा एमसीए में पूरक मात्रात्मक चर को सम्मिलित करना आसान है (व्यक्तियों पर एक कारक एक क्रमगुणित अक्ष पर व्यक्तियों के निर्देशांक को संग्रहण करने वाला सदिश है), प्राप्त प्रतिनिधित्व एक सहसंबंध चक्र (जैसा कि पीसीए में है) है।

इसी प्रकार, पीसीए में पूरक श्रेणीगत चर सम्मिलित करना आसान है।[1] इसके लिए, प्रत्येक श्रेणी को उन व्यक्तियों के गुरुत्वाकर्षण के केंद्र द्वारा दर्शाया जाता है जिनके पास यह (एमसीए के रूप में) है।

जब सक्रिय चर मिश्रित होते हैं, तो सामान्य अभ्यास मात्रात्मक चर (उदाहरण के लिए आमतौर पर सर्वेक्षणों में आयु को आयु वर्गों में बदल दिया जाता है) पर विवेकीकरण करना होता है। इस प्रकार प्राप्त डेटा को एमसीए द्वारा संसाधित किया जा सकता है।

यह पद्धति अपनी सीमा तक पहुँचती है,

  • जब कुछ व्यक्ति होते हैं (विचारों को ठीक करने के लिए सौ से भी कम) तो ऐसी स्थिति में एमसीए अस्थिर होता है,
  • जब मात्रात्मक चर के संबंध में कुछ गुणात्मक चर होते हैं (एक एकल गुणात्मक चर को ध्यान में रखने के लिए बीस मात्रात्मक चर को अलग करने में कोई अनिच्छुक हो सकता है)।

मानदंड

डेटा में मात्रात्मक चर और गुणात्मक चर सम्मिलित है।

एक मात्रात्मक चर है। हम लिखते हैं,

  • चर और के बीच सहसंबंध गुणांक,
  • चर और के बीच वर्ग सहसंबंध अनुपात

के पीसीए में, हम ( पर एक फलन प्रत्येक व्यक्ति को एक मान निर्दिष्ट करता है, यह प्रारंभिक चर और प्रमुख घटकों की स्थिति है) पर फलन का अवलोकन करते हैं जो निम्नलिखित अर्थों में सभी चर से सबसे अधिक सहसंबद्ध है,

अधिकतम।

Q के एमसीए में, हम निम्नलिखित अर्थों में सभी चरो से संबंधित पर फलन का अवलोकन करते हैं,

अधिकतम।

एफएएमडी में, हम निम्नलिखित अर्थों में सभी चर से संबंधित पर फलन का अवलोकन करते हैं,

अधिकतम।

इस मानदंड में, दोनों प्रकार के चर समान भूमिका निभाते हैं। इस मानदंड में प्रत्येक चर का योगदान 1 से परिबद्ध है।

प्लॉट (आलेख)

व्यक्तियों का प्रतिनिधित्व सीधे कारकों से किया जाता है।

मात्रात्मक चर का प्रतिनिधित्व पीसीए (सहसंबंध चक्र) के रूप में बनाया गया है।

गुणात्मक चर की श्रेणियों का प्रतिनिधित्व एमसीए के समान है, एक श्रेणी उन व्यक्तियों के केंद्र में होती है जिनके पास यह होती है। ध्यान दें कि हम सटीक केन्द्रक लेते हैं, न कि, अक्ष (एमसीए में यह गुणांक अभिलक्षणिक मान के वर्गमूल के व्युत्क्रम के बराबर है, यह एफएएमडी में अपर्याप्त होगा) पर निर्भर गुणांक तक का केन्द्रक जैसा कि एमसीए में प्रथागत है।

चरों के निरूपण को संबंध वर्ग कहा जाता है। अक्ष के अनुदिश गुणात्मक चर का निर्देशांक चर और श्रेणी (लक्षित ) के कारक के बीच वर्ग सहसंबंध अनुपात के बराबर है। अक्ष के साथ मात्रात्मक चर के निर्देशांक चर और श्रेणी (लक्षित ) के कारक के बीच वर्ग सहसंबंध गुणांक के बराबर हैं।

व्याख्या में सहायक

प्रारंभिक चरों के बीच संबंध संकेतक एक तथाकथित संबंध आव्यूह में संयोजित होते हैं, जिसमें पंक्ति और स्तंभ का प्रतिच्छेदन होता है।

  • यदि चर और मात्रात्मक हैं, तो चर और के बीच वर्ग सहसंबंध गुणांक होगा,
  • यदि चर गुणात्मक है और चर मात्रात्मक है, तो और के बीच वर्ग सहसंबंध अनुपात होगा,
  • यदि चर और गुणात्मक हैं, तो चर और के बीच सूचक होगा,

उदाहरण

एक बहुत छोटा डेटा सेट (तालिका 1) एफएएमडी के संचालन और निर्गत को दर्शाता है। छह व्यक्तियों का वर्णन तीन मात्रात्मक चर और तीन गुणात्मक चर द्वारा किया जाता है। आर पैकेज फलन एफएएमडी फैक्टो माइनआर का उपयोग करके डेटा का विश्लेषण किया गया।

तालिका 1. डेटा (परीक्षण उदाहरण)।
2 4.5 4 -A -B -C
5 4.5 4 -C -B -C
3 1 2 -B -B -B
4 1 2 -B -B -B
1 1 1 -A -A -A
6 1 2 -C -A -A
तालिका 2. परीक्षण उदाहरण। संबंध आव्यूह।
1 0.00 0.05 0.91 0.00 0.00
0.00 1 0.90 0.25 0.25 1.00
0.05 0.90 1 0.13 0.40 0.93
0.91 0.25 0.13 2 0.25 1.00
0.00 0.25 0.40 0.25 1 1.00
0.00 1.00 0.93 1.00 1.00 2

संबंध आव्यूह में, गुणांक (मात्रात्मक चर), (गुणात्मक चर) या (प्रत्येक प्रकार का एक चर) के बराबर होते हैं।

आव्यूह दो प्रकार के चरों के बीच संबंधों के अनुचित संबंध को दर्शाता है।

व्यक्तियों का प्रतिनिधित्व (चित्र 1) स्पष्ट रूप से व्यक्तियों के तीन समूहों को दर्शाता है। पहला अक्ष व्यक्ति 1 और 2 का अन्य सभी से विरोध करता है। दूसरा अक्ष व्यक्ति 3 और 4 का व्यक्ति 5 और 6 से विरोध करता है।

आकृति 1। एफएएमडी। परीक्षण उदाहरण। व्यक्तियों का प्रतिनिधित्व।
चित्र 2। एफएएमडी। परीक्षण उदाहरण। संबंध वर्ग।
चित्र तीन। एफएएमडी। परीक्षण उदाहरण। सहसंबंध चक्र।
चित्र4। एफएएमडी। परीक्षण उदाहरण। गुणात्मक चरों की श्रेणियों का निरूपण।

चरों का प्रतिनिधित्व (संबंध वर्ग, चित्र 2) दर्शाता है कि पहला अक्ष () चर , और से निकटता से जुड़ा हुआ है। सहसंबंध चक्र (चित्र 3) , और के बीच सहसंबंध का संकेत निर्दिष्ट करता है। श्रेणियों का प्रतिनिधित्व (चित्र 4) और के बीच संबंध की प्रकृति को स्पष्ट करता है।

अंत में व्यक्ति 1 और 2, पहले अक्ष द्वारा वैयक्तिकृत, और के उच्च मूल्यों और की श्रेणियों द्वारा भी चित्रित किए जाते हैं।

यह उदाहरण दिखाता है कि एफएएमडी एक साथ मात्रात्मक और गुणात्मक चर का विश्लेषण कैसे करता है। इस प्रकार, इस उदाहरण में, यह दो प्रकार के चर पर आधारित पहला आयाम दिखाता है।

इतिहास

एफएएमडी का मूल कार्य ब्रिगिट एस्कोफ़ियर[2] और गिल्बर्ट सपोर्टा के कारण है।[3] उनका काम 2002 में जेरोम पेजेस द्वारा फिर से शुरू किया गया था।[4] अंग्रेजी में एफएएमडी की सबसे संपूर्ण प्रस्तुति जेरोम पेजेस की पुस्तक में सम्मिलित है।[5]

सॉफ़्टवेयर

यह विधि R पैकेज फैक्टो माइनआर में लागू की गई है। यह विधि पायथन लाइब्रेरी प्रिंस में लागू की गई है।

संदर्भ

  1. Escofier, Brigitte; Pagès, Jérôme (2016). Analyses factorielles simples et multiples : cours et études de cas (PDF) (in français). Paris: Dunod. ISBN 978-2-10-074144-1. OCLC 951230297.
  2. Escofier Brigitte (1979). "Traitement simultané de variables quantitatives et qualitatives en analyse factorielle" (PDF). Les cahiers de l'analyse des données. 4 (2): 137–146.
  3. Saporta Gilbert (1990). Simultaneous analysis of qualitative and quantitative data. Atti della XXXV riunione scientifica ; società italiana di Statistica, 63–72 . http://cedric.cnam.fr/~saporta/SAQQD.pdf
  4. Pagès Jérôme (2002). "Analyse factorielle de données mixtes" (PDF). Revue de Statistique appliquée. 52 (4): 93–111.
  5. Pagès, Jérôme (2015). आर का उपयोग करके उदाहरण के द्वारा एकाधिक कारक विश्लेषण. Boca Raton: CRC Press. ISBN 978-1-4822-0547-3. OCLC 894169715.