मिश्रित डेटा का कारक विश्लेषण: Difference between revisions

From Vigyanwiki
Line 63: Line 63:


{| class="wikitable centre" width="60%"
{| class="wikitable centre" width="60%"
|+ Table 1. Data (test example).
|+ तालिका 1. डेटा (परीक्षण उदाहरण)
|-  
|-  
!  !! <math>k_1</math> !! <math>k_2</math> !! <math>k_3</math> !! <math>q_1</math> !! <math>q_2</math> !! <math>q_3</math>
!  !! <math>k_1</math> !! <math>k_2</math> !! <math>k_3</math> !! <math>q_1</math> !! <math>q_2</math> !! <math>q_3</math>
Line 87: Line 87:
| चौड़ाई=50% |
| चौड़ाई=50% |
{| class="wikitable centre" width="60%"
{| class="wikitable centre" width="60%"
|+ Table 2. Test example. Relationship matrix.
|+ तालिका 2. परीक्षण उदाहरण। संबंध आव्यूह।
|-
|-
!  !! <math>k_1</math> !! <math>k_2</math> !! <math>k_3</math> !! <math>q_1</math> !! <math>q_2</math> !! <math>q_3</math>
!  !! <math>k_1</math> !! <math>k_2</math> !! <math>k_3</math> !! <math>q_1</math> !! <math>q_2</math> !! <math>q_3</math>
Line 110: Line 110:
|}
|}
|}
|}
संबंध मैट्रिक्स में, गुणांक बराबर होते हैं <math>R^2 </math> (मात्रात्मक चर), <math> \phi^2 </math> (गुणात्मक चर) या <math> \eta^2 </math> (प्रत्येक प्रकार का एक चर)
संबंध आव्यूह में, गुणांक <math>R^2 </math> (मात्रात्मक चर), <math> \phi^2 </math> (गुणात्मक चर) या <math> \eta^2 </math> (प्रत्येक प्रकार का एक चर) के बराबर होते हैं।


मैट्रिक्स दो प्रकार के चरों के बीच संबंधों की उलझन को दर्शाता है।
आव्यूह दो प्रकार के चरों के बीच संबंधों के अनुचित संबंध को दर्शाता है।


व्यक्तियों का प्रतिनिधित्व (चित्र 1) स्पष्ट रूप से व्यक्तियों के तीन समूहों को दर्शाता है। पहली धुरी व्यक्ति 1 और 2 का अन्य सभी से विरोध करती है। दूसरी धुरी व्यक्ति 3 और 4 का व्यक्ति 5 और 6 से विरोध करती है।
व्यक्तियों का प्रतिनिधित्व (चित्र 1) स्पष्ट रूप से व्यक्तियों के तीन समूहों को दर्शाता है। पहली धुरी व्यक्ति 1 और 2 का अन्य सभी से विरोध करती है। दूसरी धुरी व्यक्ति 3 और 4 का व्यक्ति 5 और 6 से विरोध करती है।
Line 119: Line 119:
|-
|-
| width=50% |
| width=50% |
[[File:Fig1FADM.png|thumb|center|Figure1. FAMD. Test example. Representation of individuals.]]
[[File:Fig1FADM.png|thumb|center|आकृति 1। एफएएमडी। परीक्षण उदाहरण। व्यक्तियों का प्रतिनिधित्व।]]
| width=50% |
| width=50% |
[[File:Fig2FADM.png|thumb|center|Figure2. FAMD. Test example. Relationship square.]]
[[File:Fig2FADM.png|thumb|center|चित्र 2। एफएएमडी। परीक्षण उदाहरण। संबंध वर्ग।]]
|-
|-
| width=50% |
| width=50% |
[[File:Fig3FADM.png|thumb|center|Figure3. FAMD. Test example. Correlation circle.]]
[[File:Fig3FADM.png|thumb|center|चित्र तीन। एफएएमडी। परीक्षण उदाहरण। सहसंबंध चक्र।]]
| width=50% |
| width=50% |
[[File:Fig4FADM.png|thumb|center|Figure4. FAMD. Test example. Representation of the categories of qualitative variables.]]
[[File:Fig4FADM.png|thumb|center|चित्र4। एफएएमडी। परीक्षण उदाहरण। गुणात्मक चरों की श्रेणियों का निरूपण।]]
|}
|}
चरों का प्रतिनिधित्व (संबंध वर्ग, चित्र 2) दर्शाता है कि पहली धुरी (<math> F1</math>) चरों से निकटता से जुड़ा हुआ है <math> k_2 </math>, <math> k_3 </math> और <math> Q_3 </math> . सहसंबंध चक्र (चित्रा 3) के बीच सहसंबंध का संकेत निर्दिष्ट करता है <math> F1 </math>, <math> k_2 </math> और <math> k_3 </math>; श्रेणियों का प्रतिनिधित्व (चित्र 4) बीच संबंध की प्रकृति को स्पष्ट करता है <math> F1 </math> और <math> Q_3 </math>. अंत में व्यक्ति 1 और 2, पहली धुरी द्वारा वैयक्तिकृत, उच्च मूल्यों की विशेषता रखते हैं <math> k_2</math> और <math> k_3 </math> और श्रेणियों द्वारा <math> c </math> का <math> Q_3 </math> भी।
चरों का प्रतिनिधित्व (संबंध वर्ग, चित्र 2) दर्शाता है कि पहली धुरी (<math> F1</math>) चरों से निकटता से जुड़ा हुआ है <math> k_2 </math>, <math> k_3 </math> और <math> Q_3 </math> . सहसंबंध चक्र (चित्रा 3) के बीच सहसंबंध का संकेत निर्दिष्ट करता है <math> F1 </math>, <math> k_2 </math> और <math> k_3 </math>; श्रेणियों का प्रतिनिधित्व (चित्र 4) बीच संबंध की प्रकृति को स्पष्ट करता है <math> F1 </math> और <math> Q_3 </math>. अंत में व्यक्ति 1 और 2, पहली धुरी द्वारा वैयक्तिकृत, उच्च मूल्यों की विशेषता रखते हैं <math> k_2</math> और <math> k_3 </math> और श्रेणियों द्वारा <math> c </math> का <math> Q_3 </math> भी।

Revision as of 09:41, 3 August 2023

आंकड़ों में, मिश्रित डेटा का कारक विश्लेषण या मिश्रित डेटा का तथ्यात्मक विश्लेषण (एफएएमडी, फ़्रेंच मूल में, एएफडीएम या विश्लेषण फैक्टरिएले डी डोनीज़ मिक्सटेस), डेटा तालिकाओं के लिए समर्पित कारक विश्लेषण है जिसमें व्यक्तियों के एक समूह को मात्रात्मक और गुणात्मक दोनों चर द्वारा वर्णित किया जाता है। यह जीन-पॉल बेंज़ेक्रि द्वारा स्थापित विश्लेषण डेस डोनीज़ (डेटा विश्लेषण) नामक फ्रांसीसी स्कूल द्वारा विकसित खोजपूर्ण तरीकों से संबंधित है।

मिश्रित शब्द मात्रात्मक और गुणात्मक दोनों चर के उपयोग को संदर्भित करता है। मोटे तौर पर, हम कह सकते हैं कि एफएएमडी मात्रात्मक चर के लिए प्रमुख घटक विश्लेषण (पीसीए) के रूप में और गुणात्मक चर के लिए एकाधिक पत्राचार विश्लेषण (एमसीए) के रूप में काम करता है।

विस्तार

जब डेटा में दोनों प्रकार के चर सम्मिलित होते हैं लेकिन सक्रिय चर सजातीय होते हैं, तो पीसीए या एमसीए का उपयोग किया जा सकता है।

वास्तव में, व्यक्तियों पर चर और कारक विश्लेषण के बीच सहसंबंध गुणांक द्वारा एमसीए में पूरक मात्रात्मक चर को सम्मिलित करना आसान है (व्यक्तियों पर एक कारक एक क्रमगुणित अक्ष पर व्यक्तियों के निर्देशांक को संग्रहण करने वाला सदिश है), प्राप्त प्रतिनिधित्व एक सहसंबंध चक्र (जैसा कि पीसीए में है) है।

इसी प्रकार, पीसीए में पूरक श्रेणीगत चर सम्मिलित करना आसान है।[1] इसके लिए, प्रत्येक श्रेणी को उन व्यक्तियों के गुरुत्वाकर्षण के केंद्र द्वारा दर्शाया जाता है जिनके पास यह (एमसीए के रूप में) है।

जब सक्रिय चर मिश्रित होते हैं, तो सामान्य अभ्यास मात्रात्मक चर (उदाहरण के लिए आमतौर पर सर्वेक्षणों में आयु को आयु वर्गों में बदल दिया जाता है) पर विवेकीकरण करना होता है। इस प्रकार प्राप्त डेटा को एमसीए द्वारा संसाधित किया जा सकता है।

यह पद्धति अपनी सीमा तक पहुँचती है,

  • जब कुछ व्यक्ति होते हैं (विचारों को ठीक करने के लिए सौ से भी कम) तो ऐसी स्थिति में एमसीए अस्थिर होता है,
  • जब मात्रात्मक चर के संबंध में कुछ गुणात्मक चर होते हैं (एक एकल गुणात्मक चर को ध्यान में रखने के लिए बीस मात्रात्मक चर को अलग करने में कोई अनिच्छुक हो सकता है)।

मानदंड

डेटा में मात्रात्मक चर और गुणात्मक चर सम्मिलित है।

एक मात्रात्मक चर है। हम लिखते हैं,

  • चर और के बीच सहसंबंध गुणांक,
  • चर और के बीच वर्ग सहसंबंध अनुपात

के पीसीए में, हम ( पर एक फलन प्रत्येक व्यक्ति को एक मान निर्दिष्ट करता है, यह प्रारंभिक चर और प्रमुख घटकों की स्थिति है) पर फलन का अवलोकन करते हैं जो निम्नलिखित अर्थों में सभी चर से सबसे अधिक सहसंबद्ध है,

अधिकतम।

Q के एमसीए में, हम निम्नलिखित अर्थों में सभी चरो से संबंधित पर फलन का अवलोकन करते हैं,

अधिकतम।

एफएएमडी में, हम निम्नलिखित अर्थों में सभी चर से संबंधित पर फलन का अवलोकन करते हैं,

अधिकतम।

इस मानदंड में, दोनों प्रकार के चर समान भूमिका निभाते हैं। इस मानदंड में प्रत्येक चर का योगदान 1 से परिबद्ध है।

प्लॉट

व्यक्तियों का प्रतिनिधित्व सीधे कारकों से किया जाता है।

मात्रात्मक चर का प्रतिनिधित्व पीसीए (सहसंबंध चक्र) के रूप में बनाया गया है।

गुणात्मक चर की श्रेणियों का प्रतिनिधित्व एमसीए के समान है, एक श्रेणी उन व्यक्तियों के केंद्र में होती है जिनके पास यह होती है। ध्यान दें कि हम सटीक केन्द्रक लेते हैं, न कि, अक्ष (एमसीए में यह गुणांक अभिलक्षणिक मान के वर्गमूल के व्युत्क्रम के बराबर है, यह एफएएमडी में अपर्याप्त होगा) पर निर्भर गुणांक तक का केन्द्रक जैसा कि एमसीए में प्रथागत है।

चरों के निरूपण को संबंध वर्ग कहा जाता है। अक्ष के अनुदिश गुणात्मक चर का निर्देशांक चर और श्रेणी (लक्षित ) के कारक के बीच वर्ग सहसंबंध अनुपात के बराबर है। अक्ष के साथ मात्रात्मक चर के निर्देशांक चर और श्रेणी (लक्षित ) के कारक के बीच वर्ग सहसंबंध गुणांक के बराबर हैं।

व्याख्या में सहायक

प्रारंभिक चरों के बीच संबंध संकेतक एक तथाकथित संबंध आव्यूह में संयोजित होते हैं, जिसमें पंक्ति और स्तंभ का प्रतिच्छेदन होता है।

  • यदि चर और मात्रात्मक हैं, तो चर और के बीच वर्ग सहसंबंध गुणांक होगा,
  • यदि चर गुणात्मक है और चर मात्रात्मक है, तो और के बीच वर्ग सहसंबंध अनुपात होगा,
  • यदि चर और गुणात्मक हैं, तो चर और के बीच सूचक होगा,

उदाहरण

एक बहुत छोटा डेटा सेट (तालिका 1) एफएएमडी के संचालन और निर्गत को दर्शाता है। छह व्यक्तियों का वर्णन तीन मात्रात्मक चर और तीन गुणात्मक चर द्वारा किया जाता है। आर पैकेज फलन एफएएमडी फैक्टो माइनआर का उपयोग करके डेटा का विश्लेषण किया गया।

तालिका 1. डेटा (परीक्षण उदाहरण)।
2 4.5 4 -A -B -C
5 4.5 4 -C -B -C
3 1 2 -B -B -B
4 1 2 -B -B -B
1 1 1 -A -A -A
6 1 2 -C -A -A
तालिका 2. परीक्षण उदाहरण। संबंध आव्यूह।
1 0.00 0.05 0.91 0.00 0.00
0.00 1 0.90 0.25 0.25 1.00
0.05 0.90 1 0.13 0.40 0.93
0.91 0.25 0.13 2 0.25 1.00
0.00 0.25 0.40 0.25 1 1.00
0.00 1.00 0.93 1.00 1.00 2

संबंध आव्यूह में, गुणांक (मात्रात्मक चर), (गुणात्मक चर) या (प्रत्येक प्रकार का एक चर) के बराबर होते हैं।

आव्यूह दो प्रकार के चरों के बीच संबंधों के अनुचित संबंध को दर्शाता है।

व्यक्तियों का प्रतिनिधित्व (चित्र 1) स्पष्ट रूप से व्यक्तियों के तीन समूहों को दर्शाता है। पहली धुरी व्यक्ति 1 और 2 का अन्य सभी से विरोध करती है। दूसरी धुरी व्यक्ति 3 और 4 का व्यक्ति 5 और 6 से विरोध करती है।

आकृति 1। एफएएमडी। परीक्षण उदाहरण। व्यक्तियों का प्रतिनिधित्व।
चित्र 2। एफएएमडी। परीक्षण उदाहरण। संबंध वर्ग।
चित्र तीन। एफएएमडी। परीक्षण उदाहरण। सहसंबंध चक्र।
चित्र4। एफएएमडी। परीक्षण उदाहरण। गुणात्मक चरों की श्रेणियों का निरूपण।

चरों का प्रतिनिधित्व (संबंध वर्ग, चित्र 2) दर्शाता है कि पहली धुरी () चरों से निकटता से जुड़ा हुआ है , और . सहसंबंध चक्र (चित्रा 3) के बीच सहसंबंध का संकेत निर्दिष्ट करता है , और ; श्रेणियों का प्रतिनिधित्व (चित्र 4) बीच संबंध की प्रकृति को स्पष्ट करता है और . अंत में व्यक्ति 1 और 2, पहली धुरी द्वारा वैयक्तिकृत, उच्च मूल्यों की विशेषता रखते हैं और और श्रेणियों द्वारा का भी।

यह उदाहरण दिखाता है कि एफएएमडी एक साथ मात्रात्मक और गुणात्मक चर का विश्लेषण कैसे करता है। इस प्रकार, इस उदाहरण में, यह दो प्रकार के चर पर आधारित पहला आयाम दिखाता है।

इतिहास

FAMD का मूल कार्य ब्रिगिट एस्कोफ़ियर के कारण है[2] और गिल्बर्ट सपोर्टा।[3] यह काम 2002 में जेरोम पेजेस द्वारा फिर से शुरू किया गया था।[4] अंग्रेजी में एफएएमडी की सबसे संपूर्ण प्रस्तुति जेरोम पेजेस की पुस्तक में सम्मिलित है।[5]


सॉफ़्टवेयर

विधि आर पैकेज FactoMineR में लागू की गई है। यह विधि पायथन लाइब्रेरी Prince में लागू की गई है।

संदर्भ

  1. Escofier, Brigitte; Pagès, Jérôme (2016). Analyses factorielles simples et multiples : cours et études de cas (PDF) (in français). Paris: Dunod. ISBN 978-2-10-074144-1. OCLC 951230297.
  2. Escofier Brigitte (1979). "Traitement simultané de variables quantitatives et qualitatives en analyse factorielle" (PDF). Les cahiers de l'analyse des données. 4 (2): 137–146.
  3. Saporta Gilbert (1990). Simultaneous analysis of qualitative and quantitative data. Atti della XXXV riunione scientifica ; società italiana di Statistica, 63–72 . http://cedric.cnam.fr/~saporta/SAQQD.pdf
  4. Pagès Jérôme (2002). "Analyse factorielle de données mixtes" (PDF). Revue de Statistique appliquée. 52 (4): 93–111.
  5. Pagès, Jérôme (2015). आर का उपयोग करके उदाहरण के द्वारा एकाधिक कारक विश्लेषण. Boca Raton: CRC Press. ISBN 978-1-4822-0547-3. OCLC 894169715.