इष्टतम मिलान: Difference between revisions
(Created page with "{{distinguish|text=maximum matching in graph theory or the statistical problem of finding an optimal match for causa...") |
No edit summary |
||
Line 1: | Line 1: | ||
{{distinguish|text=[[maximum cardinality matching|maximum matching]] in graph theory or the statistical problem of finding an [[matching (statistics)|optimal match]] for causal inference}} | {{distinguish|text=[[maximum cardinality matching|maximum matching]] in graph theory or the statistical problem of finding an [[matching (statistics)|optimal match]] for causal inference}} | ||
इष्टतम मिलान [[सामाजिक विज्ञान]] | इष्टतम मिलान [[सामाजिक विज्ञान]] में उपयोग की जाने वाली अनुक्रम विश्लेषण विधि है, टोकन के क्रमबद्ध सरणियों की असमानता का आकलन करने के लिए जो सामान्यतः दो व्यक्तियों द्वारा अनुभव किए गए सामाजिक-आर्थिक राज्यों के समय-आदेशित अनुक्रम का प्रतिनिधित्व करते हैं। टिप्पणियों के समूह के लिए इस प्रकार की दूरियों की गणना कर ली जाती है (उदाहरण के लिए समूह में व्यक्ति) शास्त्रीय उपकरण (जैसे [[क्लस्टर विश्लेषण]]) का उपयोग किया जा सकता है। विधि मूल रूप से आणविक जीव विज्ञान (प्रोटीन या आनुवंशिक) अनुक्रमों का अध्ययन करने के लिए प्रारंभ की गई कार्यविधि से सामाजिक विज्ञानों के अनुरूप थी<ref>A. Abbott and A. Tsay, (2000) ''[http://smr.sagepub.com/cgi/content/abstract/29/1/3 Sequence Analysis and Optimal Matching Methods in Sociology: Review and Prospect]'' Sociological Methods & Research], Vol. 29, 3-33. {{doi|10.1177/0049124100029001001}}</ref>([[अनुक्रम संरेखण]] देखें)। इष्टतम मिलान [[नीडलमैन इच्छा एल्गोरिथ्म]] का उपयोग करता है। | ||
== एल्गोरिथम == | == एल्गोरिथम == | ||
मान लो <math>S = (s_1, s_2, s_3, \ldots s_T)</math> राज्यों का क्रम हो <math>s_i</math> संभावित राज्यों के परिमित समुच्चय से संबंधित। आइए बताते हैं <math>{\mathbf S}</math> अनुक्रम स्थान, अर्थात राज्यों के सभी संभावित अनुक्रमों का समुच्चय। | |||
इष्टतम मिलान एल्गोरिदम सरल ऑपरेटर बीजगणित को परिभाषित करके | इष्टतम मिलान एल्गोरिदम सरल ऑपरेटर बीजगणित को परिभाषित करके कार्य करते हैं जो अनुक्रमों में परिवर्तन करते हैं, अर्थात ऑपरेटरों का समुच्चय <math>a_i: {\mathbf S} \rightarrow {\mathbf S}</math>. सबसे सरल दृष्टिकोण में, अनुक्रमों को परिवर्तन के लिए मात्र तीन मूलभूत संक्रियाओं से बना समुच्चय का उपयोग किया जाता है: | ||
* | * राज्य <math>s</math> क्रम में है <math>a^{\rm Ins}_{s'} (s_1, s_2, s_3, \ldots s_T) = (s_1, s_2, s_3, \ldots, s', \ldots s_T) </math> | ||
* | * स्थिति को क्रम से हटा दिया जाता है <math>a^{\rm Del}_{s_2} (s_1, s_2, s_3, \ldots s_T) = (s_1, s_3, \ldots s_T)</math> और | ||
* | * राज्य <math>s_1</math> राज्य द्वारा प्रतिस्थापित (प्रतिस्थापित) किया जाता है <math>s'_1</math>, <math>a^{\rm Sub}_{s_1,s'_1} (s_1, s_2, s_3, \ldots s_T) = (s'_1, s_2, s_3, \ldots s_T)</math>. | ||
अब कल्पना कीजिए कि | अब कल्पना कीजिए कि व्यय <math>c(a_i) \in {\mathbf R}^+_0</math> प्रत्येक ऑपरेटर से संबद्ध है। दो क्रम दिए गए हैं <math>S_1</math> और <math>S_2</math>, प्राप्त करने की व्यय को मापना के लिए विचार है <math>S_2</math> से <math>S_1</math>बीजगणित से संकारकों का उपयोग करके। मान लो <math>A={a_1, a_2, \ldots a_n}</math> ऑपरेटरों का क्रम हो जैसे कि इस क्रम के सभी ऑपरेटरों का आवेदन <math>A</math> पूर्व क्रम के लिए <math>S_1</math> दूसरा क्रम देता है <math>S_2</math>: | ||
प्रत्येक ऑपरेटर | <math>S_2 = a_1 \circ a_2 \circ \ldots \circ a_{n} (S_1)</math> जहां <math>a_1 \circ a_2</math> कंपाउंड ऑपरेटर को दर्शाता है। | ||
इस समुच्चय से हम व्यय को जोड़ते हैं <math>c(A) = \sum_{i=1}^n c(a_i)</math>, वह परिवर्तन की कुल व्यय का प्रतिनिधित्व करता है। इस बिंदु पर विचार करना चाहिए कि इस प्रकार के भिन्न- भिन्न क्रम उपस्थित हो सकते हैं <math>A</math> वह परिवर्तन <math>S_1</math> में <math>S_2</math>; इस प्रकार के दृश्यों में से सबसे अल्पमूल्य चयन करना उचित विकल्प है। हम इस प्रकार कॉल दूरी <math>d(S_1,S_2)= \min_A \left \{ c(A)~{\rm such~that}~S_2 = A (S_1) \right \} </math><br>अर्थात, रूपांतरणों के अल्प अतिव्ययी समुच्चय की व्यय <math>S_1</math> में <math>S_2</math> नोटिस जो <math>d(S_1,S_2)</math> परिभाषा के अनुसार गैर-ऋणात्मक है क्योंकि यह सकारात्मक व्ययों का योग है, और तुच्छ रूप से <math>d(S_1,S_2)=0</math> यदि <math>S_1=S_2</math>अर्थात कोई मूल्य नहीं है। यदि सम्मिलन और विलोपन व्यय समान हैं, तो दूरी फ़ंक्शन [[सममित]] है <math>c(a^{\rm Ins}) = c(a^{\rm Del})</math>; इंडेल व्यय शब्द सामान्यतः सम्मिलन और विलोपन की सामान्य व्यय को संदर्भित करता है। | |||
बीजगणित से | |||
<math>S_2 = a_1 \circ a_2 \circ \ldots \circ a_{n} (S_1)</math> | |||
इस | |||
परिवर्तन की कुल | |||
कॉल दूरी | |||
<br> अर्थात, रूपांतरणों के | |||
ऊपर वर्णित | ऊपर वर्णित मात्र तीन मूल संक्रियाओं से बने समुच्चय को ध्यान में रखते हुए, यह निकटता माप त्रिकोणीय असमानता को संतुष्ट करता है। चूँकि, [[सकर्मक संबंध]] प्रारंभिक संक्रियाओं के समुच्चय की परिभाषा पर निर्भर करता है। | ||
== आलोचना == | == आलोचना == | ||
यद्यपि इष्टतम मिलान | यद्यपि इष्टतम मिलान प्रणाली का व्यापक रूप से समाजशास्त्र और जनसांख्यिकी में उपयोग किया जाता है, ऐसी प्रणाली में भी उनकी क्षिति हैं। जैसा कि कई लेखकों द्वारा इंगित किया गया था (उदाहरण के लिए एल एल वू),<ref>L. L. Wu. (2000) ''[http://smr.sagepub.com/cgi/content/refs/29/1/41 Some Comments on "Sequence Analysis and Optimal Matching Methods in Sociology: Review and Prospect"] {{Webarchive|url=https://web.archive.org/web/20061024143211/http://smr.sagepub.com/cgi/content/refs/29/1/41 |date=2006-10-24 }}'' Sociological Methods & Research, 29 41-64. {{doi|10.1177/0049124100029001003}}</ref> इष्टतम मिलान के आवेदन में मुख्य समस्या व्ययों को उचित रूप से परिभाषित <math>c(a_i)</math> करना है। | ||
== सॉफ्टवेयर == | == सॉफ्टवेयर == | ||
* [http://www.stat.ruhr-uni-bochum.de/tda.html TDA] | * [http://www.stat.ruhr-uni-bochum.de/tda.html TDA] शक्तिशाली कार्यक्रम है, जो संक्रमण डेटा विश्लेषण में कुछ नवीनतम विकासों तक पहुंच प्रदान करता है। | ||
* [http://ideas.repec.org/a/tsj/stataj/v6y2006i4p435-460.html STATA] ने इष्टतम मिलान विश्लेषण चलाने के लिए | * [http://ideas.repec.org/a/tsj/stataj/v6y2006i4p435-460.html STATA] ने इष्टतम मिलान विश्लेषण चलाने के लिए पैकेज प्रारम्भ किया है। | ||
* [http://traminer.unige.ch/ TraMineR] | * [http://traminer.unige.ch/ TraMineR] ओपन सोर्स R (प्रोग्रामिंग लैंग्वेज) पैकेज है, जो स्थितियों और घटनाओं के अनुक्रमों का विश्लेषण और कल्पना करने के लिए है, जिसमें इष्टतम मिलान विश्लेषण भी सम्मिलित है। | ||
== संदर्भ और नोट्स == | == संदर्भ और नोट्स == |
Revision as of 22:13, 18 May 2023
इष्टतम मिलान सामाजिक विज्ञान में उपयोग की जाने वाली अनुक्रम विश्लेषण विधि है, टोकन के क्रमबद्ध सरणियों की असमानता का आकलन करने के लिए जो सामान्यतः दो व्यक्तियों द्वारा अनुभव किए गए सामाजिक-आर्थिक राज्यों के समय-आदेशित अनुक्रम का प्रतिनिधित्व करते हैं। टिप्पणियों के समूह के लिए इस प्रकार की दूरियों की गणना कर ली जाती है (उदाहरण के लिए समूह में व्यक्ति) शास्त्रीय उपकरण (जैसे क्लस्टर विश्लेषण) का उपयोग किया जा सकता है। विधि मूल रूप से आणविक जीव विज्ञान (प्रोटीन या आनुवंशिक) अनुक्रमों का अध्ययन करने के लिए प्रारंभ की गई कार्यविधि से सामाजिक विज्ञानों के अनुरूप थी[1](अनुक्रम संरेखण देखें)। इष्टतम मिलान नीडलमैन इच्छा एल्गोरिथ्म का उपयोग करता है।
एल्गोरिथम
मान लो राज्यों का क्रम हो संभावित राज्यों के परिमित समुच्चय से संबंधित। आइए बताते हैं अनुक्रम स्थान, अर्थात राज्यों के सभी संभावित अनुक्रमों का समुच्चय।
इष्टतम मिलान एल्गोरिदम सरल ऑपरेटर बीजगणित को परिभाषित करके कार्य करते हैं जो अनुक्रमों में परिवर्तन करते हैं, अर्थात ऑपरेटरों का समुच्चय . सबसे सरल दृष्टिकोण में, अनुक्रमों को परिवर्तन के लिए मात्र तीन मूलभूत संक्रियाओं से बना समुच्चय का उपयोग किया जाता है:
- राज्य क्रम में है
- स्थिति को क्रम से हटा दिया जाता है और
- राज्य राज्य द्वारा प्रतिस्थापित (प्रतिस्थापित) किया जाता है , .
अब कल्पना कीजिए कि व्यय प्रत्येक ऑपरेटर से संबद्ध है। दो क्रम दिए गए हैं और , प्राप्त करने की व्यय को मापना के लिए विचार है से बीजगणित से संकारकों का उपयोग करके। मान लो ऑपरेटरों का क्रम हो जैसे कि इस क्रम के सभी ऑपरेटरों का आवेदन पूर्व क्रम के लिए दूसरा क्रम देता है :
जहां कंपाउंड ऑपरेटर को दर्शाता है।
इस समुच्चय से हम व्यय को जोड़ते हैं , वह परिवर्तन की कुल व्यय का प्रतिनिधित्व करता है। इस बिंदु पर विचार करना चाहिए कि इस प्रकार के भिन्न- भिन्न क्रम उपस्थित हो सकते हैं वह परिवर्तन में ; इस प्रकार के दृश्यों में से सबसे अल्पमूल्य चयन करना उचित विकल्प है। हम इस प्रकार कॉल दूरी
अर्थात, रूपांतरणों के अल्प अतिव्ययी समुच्चय की व्यय में नोटिस जो परिभाषा के अनुसार गैर-ऋणात्मक है क्योंकि यह सकारात्मक व्ययों का योग है, और तुच्छ रूप से यदि अर्थात कोई मूल्य नहीं है। यदि सम्मिलन और विलोपन व्यय समान हैं, तो दूरी फ़ंक्शन सममित है ; इंडेल व्यय शब्द सामान्यतः सम्मिलन और विलोपन की सामान्य व्यय को संदर्भित करता है।
ऊपर वर्णित मात्र तीन मूल संक्रियाओं से बने समुच्चय को ध्यान में रखते हुए, यह निकटता माप त्रिकोणीय असमानता को संतुष्ट करता है। चूँकि, सकर्मक संबंध प्रारंभिक संक्रियाओं के समुच्चय की परिभाषा पर निर्भर करता है।
आलोचना
यद्यपि इष्टतम मिलान प्रणाली का व्यापक रूप से समाजशास्त्र और जनसांख्यिकी में उपयोग किया जाता है, ऐसी प्रणाली में भी उनकी क्षिति हैं। जैसा कि कई लेखकों द्वारा इंगित किया गया था (उदाहरण के लिए एल एल वू),[2] इष्टतम मिलान के आवेदन में मुख्य समस्या व्ययों को उचित रूप से परिभाषित करना है।
सॉफ्टवेयर
- TDA शक्तिशाली कार्यक्रम है, जो संक्रमण डेटा विश्लेषण में कुछ नवीनतम विकासों तक पहुंच प्रदान करता है।
- STATA ने इष्टतम मिलान विश्लेषण चलाने के लिए पैकेज प्रारम्भ किया है।
- TraMineR ओपन सोर्स R (प्रोग्रामिंग लैंग्वेज) पैकेज है, जो स्थितियों और घटनाओं के अनुक्रमों का विश्लेषण और कल्पना करने के लिए है, जिसमें इष्टतम मिलान विश्लेषण भी सम्मिलित है।
संदर्भ और नोट्स
- ↑ A. Abbott and A. Tsay, (2000) Sequence Analysis and Optimal Matching Methods in Sociology: Review and Prospect Sociological Methods & Research], Vol. 29, 3-33. doi:10.1177/0049124100029001001
- ↑ L. L. Wu. (2000) Some Comments on "Sequence Analysis and Optimal Matching Methods in Sociology: Review and Prospect" Archived 2006-10-24 at the Wayback Machine Sociological Methods & Research, 29 41-64. doi:10.1177/0049124100029001003