मिश्रित डेटा का कारक विश्लेषण: Difference between revisions

From Vigyanwiki
No edit summary
Line 3: Line 3:
''मिश्रित'' शब्द मात्रात्मक और गुणात्मक दोनों चर के उपयोग को संदर्भित करता है। मोटे तौर पर, हम कह सकते हैं कि एफएएमडी मात्रात्मक चर के लिए [[प्रमुख घटक विश्लेषण]] (पीसीए) के रूप में और गुणात्मक चर के लिए [[एकाधिक पत्राचार विश्लेषण]] (एमसीए) के रूप में काम करता है।
''मिश्रित'' शब्द मात्रात्मक और गुणात्मक दोनों चर के उपयोग को संदर्भित करता है। मोटे तौर पर, हम कह सकते हैं कि एफएएमडी मात्रात्मक चर के लिए [[प्रमुख घटक विश्लेषण]] (पीसीए) के रूप में और गुणात्मक चर के लिए [[एकाधिक पत्राचार विश्लेषण]] (एमसीए) के रूप में काम करता है।


==दायरा ==
==विस्तार ==
जब डेटा में दोनों प्रकार के चर शामिल होते हैं लेकिन सक्रिय चर सजातीय होते हैं, तो पीसीए या एमसीए का उपयोग किया जा सकता है।
जब डेटा में दोनों प्रकार के चर सम्मिलित होते हैं लेकिन सक्रिय चर सजातीय होते हैं, तो पीसीए या एमसीए का उपयोग किया जा सकता है।


वास्तव में, व्यक्तियों पर चर और कारक विश्लेषण के बीच [[सहसंबंध गुणांक]] द्वारा एमसीए में पूरक मात्रात्मक चर को शामिल करना आसान है (व्यक्तियों पर एक कारक एक फैक्टोरियल अक्ष पर व्यक्तियों के निर्देशांक को इकट्ठा करने वाला वेक्टर है); प्राप्त प्रतिनिधित्व एक सहसंबंध चक्र है (जैसा कि पीसीए में है)।
वास्तव में, व्यक्तियों पर चर और कारक विश्लेषण के बीच [[सहसंबंध गुणांक]] द्वारा एमसीए में पूरक मात्रात्मक चर को सम्मिलित करना आसान है (व्यक्तियों पर एक कारक एक फैक्टोरियल अक्ष पर व्यक्तियों के निर्देशांक को इकट्ठा करने वाला वेक्टर है), प्राप्त प्रतिनिधित्व एक सहसंबंध चक्र है (जैसा कि पीसीए में है)।


इसी प्रकार, पीसीए में पूरक श्रेणीगत चर शामिल करना आसान है।<ref> {{cite book | last1=Escofier | first1=Brigitte | last2=Pagès|first2=Jérôme|title=Analyses factorielles simples et multiples : cours et études de cas | publisher=Dunod | publication-place=Paris | year=2016 | url=https://www.dunod.com/sites/default/files/atoms/files/9782100741441/Feuilletage.pdf| isbn=978-2-10-074144-1 | oclc=951230297 | language=fr}}</ref> इसके लिए, प्रत्येक श्रेणी को उन व्यक्तियों के गुरुत्वाकर्षण के केंद्र द्वारा दर्शाया जाता है जिनके पास यह (एमसीए के रूप में) है।
इसी प्रकार, पीसीए में पूरक श्रेणीगत चर सम्मिलित करना आसान है।<ref> {{cite book | last1=Escofier | first1=Brigitte | last2=Pagès|first2=Jérôme|title=Analyses factorielles simples et multiples : cours et études de cas | publisher=Dunod | publication-place=Paris | year=2016 | url=https://www.dunod.com/sites/default/files/atoms/files/9782100741441/Feuilletage.pdf| isbn=978-2-10-074144-1 | oclc=951230297 | language=fr}}</ref> इसके लिए, प्रत्येक श्रेणी को उन व्यक्तियों के गुरुत्वाकर्षण के केंद्र द्वारा दर्शाया जाता है जिनके पास यह (एमसीए के रूप में) है।


जब सक्रिय चर मिश्रित होते हैं, तो सामान्य अभ्यास मात्रात्मक चर पर विवेकीकरण करना होता है (उदाहरण के लिए आमतौर पर सर्वेक्षणों में आयु को आयु वर्गों में बदल दिया जाता है)। इस प्रकार प्राप्त डेटा को MCA द्वारा संसाधित किया जा सकता है।
जब सक्रिय चर मिश्रित होते हैं, तो सामान्य अभ्यास मात्रात्मक चर पर विवेकीकरण करना होता है (उदाहरण के लिए आमतौर पर सर्वेक्षणों में आयु को आयु वर्गों में बदल दिया जाता है)। इस प्रकार प्राप्त डेटा को MCA द्वारा संसाधित किया जा सकता है।
Line 18: Line 18:
==मानदंड==
==मानदंड==


डेटा शामिल है <math> K </math> मात्रात्मक चर <math>{k = 1,\dots, K} </math> और <math>Q</math> गुणात्मक चर <math> {q = 1,\dots, Q}</math> .
डेटा सम्मिलित है <math> K </math> मात्रात्मक चर <math>{k = 1,\dots, K} </math> और <math>Q</math> गुणात्मक चर <math> {q = 1,\dots, Q}</math> .


<math> z </math> एक मात्रात्मक चर है. हम लिखते हैं:
<math> z </math> एक मात्रात्मक चर है. हम लिखते हैं:
Line 50: Line 50:
==व्याख्या में सहायता==
==व्याख्या में सहायता==


प्रारंभिक चरों के बीच संबंध संकेतक एक तथाकथित संबंध मैट्रिक्स में संयुक्त होते हैं, जिसमें पंक्ति के चौराहे पर शामिल होते हैं <math> l </math> और स्तंभ <math> c </math>:
प्रारंभिक चरों के बीच संबंध संकेतक एक तथाकथित संबंध मैट्रिक्स में संयुक्त होते हैं, जिसमें पंक्ति के चौराहे पर सम्मिलित होते हैं <math> l </math> और स्तंभ <math> c </math>:
* यदि चर <math> l</math> और <math> c </math> मात्रात्मक हैं, चर के बीच वर्ग सहसंबंध गुणांक <math> l</math> और <math> c </math> ;
* यदि चर <math> l</math> और <math> c </math> मात्रात्मक हैं, चर के बीच वर्ग सहसंबंध गुणांक <math> l</math> और <math> c </math> ;
* यदि चर <math> l</math> गुणात्मक एवं परिवर्तनशील है <math> c</math> मात्रात्मक है, के बीच चुकता सहसंबंध अनुपात <math> l</math> और <math> c</math>;
* यदि चर <math> l</math> गुणात्मक एवं परिवर्तनशील है <math> c</math> मात्रात्मक है, के बीच चुकता सहसंबंध अनुपात <math> l</math> और <math> c</math>;
Line 133: Line 133:


==इतिहास ==
==इतिहास ==
FAMD का मूल कार्य ब्रिगिट एस्कोफ़ियर के कारण है<ref>{{cite journal|author=Escofier Brigitte|year=1979|title=Traitement simultané de variables quantitatives et qualitatives en analyse factorielle|journal=Les cahiers de l'analyse des données|volume=4|issue=2|pages=137–146|url=http://archive.numdam.org/ARCHIVE/CAD/CAD_1979__4_2/CAD_1979__4_2_137_0/CAD_1979__4_2_137_0.pdf}}</ref> और गिल्बर्ट सपोर्टा।<ref>Saporta Gilbert (1990). Simultaneous analysis of qualitative and quantitative data. ''Atti della XXXV riunione scientifica ; società italiana di Statistica'', 63–72 . http://cedric.cnam.fr/~saporta/SAQQD.pdf</ref> यह काम 2002 में जेरोम पेजेस द्वारा फिर से शुरू किया गया था।<ref>{{cite journal|author=Pagès Jérôme |year=2002|title=Analyse factorielle de données mixtes|journal=Revue de Statistique appliquée|volume=52|issue=4|pages=93–111 |url=http://archive.numdam.org/ARCHIVE/RSA/RSA_2004__52_4/RSA_2004__52_4_93_0/RSA_2004__52_4_93_0.pdf}}</ref> अंग्रेजी में एफएएमडी की सबसे संपूर्ण प्रस्तुति जेरोम पेजेस की पुस्तक में शामिल है।<ref>{{cite book | last=Pagès | first=Jérôme | title=आर का उपयोग करके उदाहरण के द्वारा एकाधिक कारक विश्लेषण| publisher=CRC Press | publication-place=Boca Raton | year=2015 | isbn=978-1-4822-0547-3 | oclc=894169715}}</ref>
FAMD का मूल कार्य ब्रिगिट एस्कोफ़ियर के कारण है<ref>{{cite journal|author=Escofier Brigitte|year=1979|title=Traitement simultané de variables quantitatives et qualitatives en analyse factorielle|journal=Les cahiers de l'analyse des données|volume=4|issue=2|pages=137–146|url=http://archive.numdam.org/ARCHIVE/CAD/CAD_1979__4_2/CAD_1979__4_2_137_0/CAD_1979__4_2_137_0.pdf}}</ref> और गिल्बर्ट सपोर्टा।<ref>Saporta Gilbert (1990). Simultaneous analysis of qualitative and quantitative data. ''Atti della XXXV riunione scientifica ; società italiana di Statistica'', 63–72 . http://cedric.cnam.fr/~saporta/SAQQD.pdf</ref> यह काम 2002 में जेरोम पेजेस द्वारा फिर से शुरू किया गया था।<ref>{{cite journal|author=Pagès Jérôme |year=2002|title=Analyse factorielle de données mixtes|journal=Revue de Statistique appliquée|volume=52|issue=4|pages=93–111 |url=http://archive.numdam.org/ARCHIVE/RSA/RSA_2004__52_4/RSA_2004__52_4_93_0/RSA_2004__52_4_93_0.pdf}}</ref> अंग्रेजी में एफएएमडी की सबसे संपूर्ण प्रस्तुति जेरोम पेजेस की पुस्तक में सम्मिलित है।<ref>{{cite book | last=Pagès | first=Jérôme | title=आर का उपयोग करके उदाहरण के द्वारा एकाधिक कारक विश्लेषण| publisher=CRC Press | publication-place=Boca Raton | year=2015 | isbn=978-1-4822-0547-3 | oclc=894169715}}</ref>





Revision as of 07:49, 3 August 2023

आंकड़ों में, मिश्रित डेटा का कारक विश्लेषण या मिश्रित डेटा का तथ्यात्मक विश्लेषण (एफएएमडी, फ़्रेंच मूल में, एएफडीएम या विश्लेषण फैक्टरिएले डी डोनीज़ मिक्सटेस), डेटा तालिकाओं के लिए समर्पित कारक विश्लेषण है जिसमें व्यक्तियों के एक समूह को मात्रात्मक और गुणात्मक दोनों चर द्वारा वर्णित किया जाता है। यह जीन-पॉल बेंज़ेक्रि द्वारा स्थापित विश्लेषण डेस डोनीज़ (डेटा विश्लेषण) नामक फ्रांसीसी स्कूल द्वारा विकसित खोजपूर्ण तरीकों से संबंधित है।

मिश्रित शब्द मात्रात्मक और गुणात्मक दोनों चर के उपयोग को संदर्भित करता है। मोटे तौर पर, हम कह सकते हैं कि एफएएमडी मात्रात्मक चर के लिए प्रमुख घटक विश्लेषण (पीसीए) के रूप में और गुणात्मक चर के लिए एकाधिक पत्राचार विश्लेषण (एमसीए) के रूप में काम करता है।

विस्तार

जब डेटा में दोनों प्रकार के चर सम्मिलित होते हैं लेकिन सक्रिय चर सजातीय होते हैं, तो पीसीए या एमसीए का उपयोग किया जा सकता है।

वास्तव में, व्यक्तियों पर चर और कारक विश्लेषण के बीच सहसंबंध गुणांक द्वारा एमसीए में पूरक मात्रात्मक चर को सम्मिलित करना आसान है (व्यक्तियों पर एक कारक एक फैक्टोरियल अक्ष पर व्यक्तियों के निर्देशांक को इकट्ठा करने वाला वेक्टर है), प्राप्त प्रतिनिधित्व एक सहसंबंध चक्र है (जैसा कि पीसीए में है)।

इसी प्रकार, पीसीए में पूरक श्रेणीगत चर सम्मिलित करना आसान है।[1] इसके लिए, प्रत्येक श्रेणी को उन व्यक्तियों के गुरुत्वाकर्षण के केंद्र द्वारा दर्शाया जाता है जिनके पास यह (एमसीए के रूप में) है।

जब सक्रिय चर मिश्रित होते हैं, तो सामान्य अभ्यास मात्रात्मक चर पर विवेकीकरण करना होता है (उदाहरण के लिए आमतौर पर सर्वेक्षणों में आयु को आयु वर्गों में बदल दिया जाता है)। इस प्रकार प्राप्त डेटा को MCA द्वारा संसाधित किया जा सकता है।

यह प्रथा अपनी सीमा तक पहुँचती है:

  • जब कुछ व्यक्ति होते हैं (विचारों को ठीक करने के लिए सौ से भी कम) तो ऐसी स्थिति में एमसीए अस्थिर होता है;
  • जब मात्रात्मक चर के संबंध में कुछ गुणात्मक चर होते हैं (एक एकल गुणात्मक चर को ध्यान में रखने के लिए बीस मात्रात्मक चर को अलग करने में कोई अनिच्छुक हो सकता है)।

मानदंड

डेटा सम्मिलित है मात्रात्मक चर और गुणात्मक चर .

एक मात्रात्मक चर है. हम लिखते हैं:

  • चरों के बीच सहसंबंध गुणांक और  ;
  • चरों के बीच वर्ग सहसंबंध अनुपात और .

के पीसीए में , हम फ़ंक्शन की तलाश करते हैं (एक समारोह पर प्रत्येक व्यक्ति को एक मान निर्दिष्ट करता है, यह प्रारंभिक चर और प्रमुख घटकों का मामला है) सभी से सबसे अधिक सहसंबंधित निम्नलिखित अर्थों में चर:

अधिकतम।

Q के MCA में, हम फ़ंक्शन की तलाश करते हैं सभी से अधिक संबंधित निम्नलिखित अर्थों में चर:

अधिकतम।

FAMD में , हम फ़ंक्शन की तलाश करते हैं सभी से अधिक संबंधित निम्नलिखित अर्थों में चर:

अधिकतम।

इस मानदंड में, दोनों प्रकार के चर समान भूमिका निभाते हैं। इस मानदंड में प्रत्येक चर का योगदान 1 से घिरा है।

प्लॉट

व्यक्तियों का प्रतिनिधित्व सीधे कारकों से होता है .

मात्रात्मक चर का प्रतिनिधित्व पीसीए (सहसंबंध सर्कल) के रूप में बनाया गया है।

गुणात्मक चर की श्रेणियों का प्रतिनिधित्व एमसीए के समान है: एक श्रेणी उन व्यक्तियों के केंद्र में होती है जिनके पास यह होती है। ध्यान दें कि हम सटीक सेंट्रोइड लेते हैं, न कि, जैसा कि एमसीए में प्रथागत है, अक्ष पर निर्भर गुणांक तक का सेंट्रोइड (एमसीए में यह गुणांक आइगेनवैल्यू के वर्गमूल के व्युत्क्रम के बराबर है; यह एफएएमडी में अपर्याप्त होगा)।

चरों के निरूपण को संबंध वर्ग कहा जाता है। गुणात्मक चर का निर्देशांक अक्ष के अनुदिश चर के बीच वर्ग सहसंबंध अनुपात के बराबर है और रैंक का कारक (संकेतित ). मात्रात्मक चर के निर्देशांक अक्ष के अनुदिश चर के बीच वर्ग सहसंबंध गुणांक के बराबर है और रैंक का कारक (संकेतित ).

व्याख्या में सहायता

प्रारंभिक चरों के बीच संबंध संकेतक एक तथाकथित संबंध मैट्रिक्स में संयुक्त होते हैं, जिसमें पंक्ति के चौराहे पर सम्मिलित होते हैं और स्तंभ :

  • यदि चर और मात्रात्मक हैं, चर के बीच वर्ग सहसंबंध गुणांक और  ;
  • यदि चर गुणात्मक एवं परिवर्तनशील है मात्रात्मक है, के बीच चुकता सहसंबंध अनुपात और ;
  • यदि चर और गुणात्मक, सूचक हैं चरों के बीच और .

उदाहरण

एक बहुत छोटा डेटा सेट (तालिका 1) एफएएमडी के संचालन और आउटपुट को दर्शाता है। छह व्यक्तियों का वर्णन तीन मात्रात्मक चर और तीन गुणात्मक चर द्वारा किया जाता है। आर पैकेज फ़ंक्शन FAMD FactoMineR का उपयोग करके डेटा का विश्लेषण किया गया।

Table 1. Data (test example).
2 4.5 4 -A -B -C
5 4.5 4 -C -B -C
3 1 2 -B -B -B
4 1 2 -B -B -B
1 1 1 -A -A -A
6 1 2 -C -A -A
Table 2. Test example. Relationship matrix.
1 0.00 0.05 0.91 0.00 0.00
0.00 1 0.90 0.25 0.25 1.00
0.05 0.90 1 0.13 0.40 0.93
0.91 0.25 0.13 2 0.25 1.00
0.00 0.25 0.40 0.25 1 1.00
0.00 1.00 0.93 1.00 1.00 2

संबंध मैट्रिक्स में, गुणांक बराबर होते हैं (मात्रात्मक चर), (गुणात्मक चर) या (प्रत्येक प्रकार का एक चर)।

मैट्रिक्स दो प्रकार के चरों के बीच संबंधों की उलझन को दर्शाता है।

व्यक्तियों का प्रतिनिधित्व (चित्र 1) स्पष्ट रूप से व्यक्तियों के तीन समूहों को दर्शाता है। पहली धुरी व्यक्ति 1 और 2 का अन्य सभी से विरोध करती है। दूसरी धुरी व्यक्ति 3 और 4 का व्यक्ति 5 और 6 से विरोध करती है।

Figure1. FAMD. Test example. Representation of individuals.
Figure2. FAMD. Test example. Relationship square.
Figure3. FAMD. Test example. Correlation circle.
Figure4. FAMD. Test example. Representation of the categories of qualitative variables.

चरों का प्रतिनिधित्व (संबंध वर्ग, चित्र 2) दर्शाता है कि पहली धुरी () चरों से निकटता से जुड़ा हुआ है , और . सहसंबंध चक्र (चित्रा 3) के बीच सहसंबंध का संकेत निर्दिष्ट करता है , और ; श्रेणियों का प्रतिनिधित्व (चित्र 4) बीच संबंध की प्रकृति को स्पष्ट करता है और . अंत में व्यक्ति 1 और 2, पहली धुरी द्वारा वैयक्तिकृत, उच्च मूल्यों की विशेषता रखते हैं और और श्रेणियों द्वारा का भी।

यह उदाहरण दिखाता है कि एफएएमडी एक साथ मात्रात्मक और गुणात्मक चर का विश्लेषण कैसे करता है। इस प्रकार, इस उदाहरण में, यह दो प्रकार के चर पर आधारित पहला आयाम दिखाता है।

इतिहास

FAMD का मूल कार्य ब्रिगिट एस्कोफ़ियर के कारण है[2] और गिल्बर्ट सपोर्टा।[3] यह काम 2002 में जेरोम पेजेस द्वारा फिर से शुरू किया गया था।[4] अंग्रेजी में एफएएमडी की सबसे संपूर्ण प्रस्तुति जेरोम पेजेस की पुस्तक में सम्मिलित है।[5]


सॉफ़्टवेयर

विधि आर पैकेज FactoMineR में लागू की गई है। यह विधि पायथन लाइब्रेरी Prince में लागू की गई है।

संदर्भ

  1. Escofier, Brigitte; Pagès, Jérôme (2016). Analyses factorielles simples et multiples : cours et études de cas (PDF) (in français). Paris: Dunod. ISBN 978-2-10-074144-1. OCLC 951230297.
  2. Escofier Brigitte (1979). "Traitement simultané de variables quantitatives et qualitatives en analyse factorielle" (PDF). Les cahiers de l'analyse des données. 4 (2): 137–146.
  3. Saporta Gilbert (1990). Simultaneous analysis of qualitative and quantitative data. Atti della XXXV riunione scientifica ; società italiana di Statistica, 63–72 . http://cedric.cnam.fr/~saporta/SAQQD.pdf
  4. Pagès Jérôme (2002). "Analyse factorielle de données mixtes" (PDF). Revue de Statistique appliquée. 52 (4): 93–111.
  5. Pagès, Jérôme (2015). आर का उपयोग करके उदाहरण के द्वारा एकाधिक कारक विश्लेषण. Boca Raton: CRC Press. ISBN 978-1-4822-0547-3. OCLC 894169715.