इष्टतम मिलान
इष्टतम मिलान सामाजिक विज्ञान पद्धति में एक अनुक्रम विश्लेषण है जिसका उपयोग सामाजिक विज्ञान में टोकन के क्रमबद्ध सरणियों की असमानता का आकलन करने के लिए किया जाता है जो आमतौर पर दो व्यक्तियों द्वारा अनुभव किए गए सामाजिक-आर्थिक राज्यों के समय-आदेशित अनुक्रम का प्रतिनिधित्व करते हैं। एक बार इस तरह की दूरियों की गणना टिप्पणियों के एक सेट के लिए की जाती है (उदाहरण के लिए एक समूह (सांख्यिकी) में व्यक्ति) शास्त्रीय उपकरण (जैसे क्लस्टर विश्लेषण) का उपयोग किया जा सकता है। विधि सामाजिक विज्ञानों के अनुरूप थी[1] मूल रूप से आणविक जीव विज्ञान (प्रोटीन या आनुवंशिक) अनुक्रमों का अध्ययन करने के लिए शुरू की गई तकनीक से (अनुक्रम संरेखण देखें)। इष्टतम मिलान नीडलमैन इच्छा एल्गोरिथ्म का उपयोग करता है।
एल्गोरिथम
होने देना राज्यों का एक क्रम हो संभावित राज्यों के एक परिमित सेट से संबंधित। आइए बताते हैं अनुक्रम स्थान, यानी राज्यों के सभी संभावित अनुक्रमों का सेट।
इष्टतम मिलान एल्गोरिदम सरल ऑपरेटर बीजगणित को परिभाषित करके काम करते हैं जो अनुक्रमों में हेरफेर करते हैं, यानी ऑपरेटरों का एक सेट . सबसे सरल दृष्टिकोण में, अनुक्रमों को बदलने के लिए केवल तीन मूलभूत संक्रियाओं से बना एक सेट का उपयोग किया जाता है:
- एक राज्य क्रम में डाला जाता है
- एक स्थिति को क्रम से हटा दिया जाता है और
- एक राज्य राज्य द्वारा प्रतिस्थापित (प्रतिस्थापित) किया जाता है , .
अब कल्पना कीजिए कि एक लागत से जुड़ा हुआ है
प्रत्येक ऑपरेटर को। दो क्रम दिए गए हैं और ,
विचार प्राप्त करने की लागत को मापना है से
बीजगणित से ऑपरेटरों का उपयोग करना। होने देना ऑपरेटरों का एक क्रम हो जैसे कि इस क्रम के सभी ऑपरेटरों का आवेदन पहले क्रम के लिए दूसरा क्रम देता है :
कहाँ कंपाउंड ऑपरेटर को दर्शाता है।
इस सेट से हम लागत को जोड़ते हैं , वह
परिवर्तन की कुल लागत का प्रतिनिधित्व करता है। इस बिंदु पर विचार करना चाहिए कि इस तरह के अलग-अलग क्रम मौजूद हो सकते हैं वह परिवर्तन में ; इस तरह के दृश्यों में से सबसे सस्ता चयन करना एक उचित विकल्प है। हम इस प्रकार
कॉल दूरी
अर्थात, रूपांतरणों के कम से कम खर्चीले सेट की लागत में . नोटिस जो परिभाषा के अनुसार गैर-ऋणात्मक है क्योंकि यह सकारात्मक लागतों का योग है, और तुच्छ रूप से अगर और केवल अगर यानी कोई कीमत नहीं है। यदि सम्मिलन और विलोपन लागत समान हैं, तो दूरी फ़ंक्शन सममित है ; इंडेल लागत शब्द आमतौर पर सम्मिलन और विलोपन की सामान्य लागत को संदर्भित करता है।
ऊपर वर्णित केवल तीन मूल संक्रियाओं से बने एक सेट को ध्यान में रखते हुए, यह निकटता माप त्रिकोणीय असमानता को संतुष्ट करता है। सकर्मक संबंध हालांकि, प्रारंभिक संक्रियाओं के समुच्चय की परिभाषा पर निर्भर करता है।
आलोचना
यद्यपि इष्टतम मिलान तकनीकों का व्यापक रूप से समाजशास्त्र और जनसांख्यिकी में उपयोग किया जाता है, ऐसी तकनीकों में भी उनकी खामियां हैं। जैसा कि कई लेखकों द्वारा इंगित किया गया था (उदाहरण के लिए एलएल वू[2]), इष्टतम मिलान के आवेदन में मुख्य समस्या लागतों को उचित रूप से परिभाषित करना है .
सॉफ्टवेयर
- TDA एक शक्तिशाली कार्यक्रम है, जो संक्रमण डेटा विश्लेषण में कुछ नवीनतम विकासों तक पहुंच प्रदान करता है।
- STATA ने इष्टतम मिलान विश्लेषण चलाने के लिए एक पैकेज लागू किया है।
- TraMineR एक ओपन सोर्स R (प्रोग्रामिंग लैंग्वेज)-पैकेज है, जो स्थितियों और घटनाओं के अनुक्रमों का विश्लेषण और कल्पना करने के लिए है, जिसमें इष्टतम मिलान विश्लेषण भी शामिल है।
संदर्भ और नोट्स
- ↑ A. Abbott and A. Tsay, (2000) Sequence Analysis and Optimal Matching Methods in Sociology: Review and Prospect Sociological Methods & Research], Vol. 29, 3-33. doi:10.1177/0049124100029001001
- ↑ L. L. Wu. (2000) Some Comments on "Sequence Analysis and Optimal Matching Methods in Sociology: Review and Prospect" Archived 2006-10-24 at the Wayback Machine Sociological Methods & Research, 29 41-64. doi:10.1177/0049124100029001003