समाधान अवधारणा: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
 
(6 intermediate revisions by 3 users not shown)
Line 1: Line 1:
{{Short description|Formal rule for predicting how a game will be played}}
{{Short description|Formal rule for predicting how a game will be played}}
[[File:Equilibrium refinements.svg|thumb|250px|गेम सिद्धांत में चयनित संतुलन परिशोधन। तीर परिशोधन से अधिक सामान्य अवधारणा (अथार्त , ईएसएस) की ओर इशारा करते हैं <math> \subset </math> उचित)।]]
[[File:Equilibrium refinements.svg|thumb|250px|गेम सिद्धांत में चयनित संतुलन परिशोधन। तीर परिशोधन से अधिक सामान्य अवधारणा (अथार्त , ईएसएस) की ओर इशारा करते हैं <math> \subset </math> उचित)।]]




Line 8: Line 9:


==औपचारिक परिभाषा==
==औपचारिक परिभाषा==
मान लीजिए <math>\Gamma</math> सभी गेम का वर्ग है और, प्रत्येक गेम <math>G \in \Gamma</math> के लिए, मान लीजिए <math>S_G</math>, <math>G</math> की रणनीति प्रोफाइल का सेट है। एक समाधान अवधारणा प्रत्यक्ष उत्पाद <math>\Pi_{G \in \Gamma}2^{S_G};</math> का एक तत्व है; अथार्त एक कार्य <math>F: \Gamma \rightarrow \bigcup\nolimits_{G \in \Gamma} 2^{S_G}</math> ऐसा कि सभी <math>F(G) \subseteq S_G</math> के लिए <math>G \in \Gamma.</math> है ।
मान लीजिए <math>\Gamma</math> सभी गेम का वर्ग है और, प्रत्येक गेम <math>G \in \Gamma</math> के लिए, मान लीजिए <math>S_G</math>, <math>G</math> की रणनीति प्रोफाइल का सेट है। एक समाधान अवधारणा प्रत्यक्ष उत्पाद <math>\Pi_{G \in \Gamma}2^{S_G};</math> का एक तत्व है; अथार्त एक कार्य <math>F: \Gamma \rightarrow \bigcup\nolimits_{G \in \Gamma} 2^{S_G}</math> ऐसा कि सभी <math>F(G) \subseteq S_G</math> के लिए <math>G \in \Gamma.</math> है ।
==तर्कसंगतता और पुनरावृत्त प्रभुत्व==
==तर्कसंगतता और पुनरावृत्त प्रभुत्व==
{{main|युक्तिसंगतता}}
{{main|युक्तिसंगतता}}


इस समाधान अवधारणा में, खिलाड़ियों को तर्कसंगत माना जाता है और इसलिए प्रभुत्व (गेम सिद्धांत) या वर्चस्व वाली रणनीतियों को उन रणनीतियों के सेट से हटा दिया जाता है जिन्हें संभवतः खेला जा सकता है। एक रणनीति तब प्रभुत्व वाली रणनीति होती है जब खिलाड़ी के लिए कोई अन्य रणनीति उपलब्ध होती है जिसका लाभ सदैव अधिक होता है, तथापि अन्य खिलाड़ी कोई भी रणनीति चुनें। ([[अल्पमहिष्ठ]] [[ गेम-ट्री खोज ]] में सख्ती से [[हावी रणनीति|प्रभावित रणनीति]]यां भी महत्वपूर्ण हैं।) उदाहरण के लिए, (एकल अवधि) कैदी की दुविधा में कैदियों की दुविधा (नीचे दिखाया गया है), दोनों खिलाड़ियों के लिए सहयोग पर दोष का सख्ती से प्रभुत्व है क्योंकि दोष की परवाह किए बिना कोई भी खिलाड़ी सदैव उत्तम होता है। उसका प्रतिद्वंद्वी क्या करता है.
इस समाधान अवधारणा में, खिलाड़ियों को तर्कसंगत माना जाता है और इसलिए प्रभुत्व (गेम सिद्धांत) या वर्चस्व वाली रणनीतियों को उन रणनीतियों के सेट से हटा दिया जाता है जिन्हें संभवतः खेला जा सकता है। एक रणनीति तब प्रभुत्व वाली रणनीति होती है जब खिलाड़ी के लिए कोई अन्य रणनीति उपलब्ध होती है जिसका लाभ सदैव अधिक होता है, तथापि अन्य खिलाड़ी कोई भी रणनीति चुनें। ([[अल्पमहिष्ठ]] [[ गेम-ट्री खोज |गेम-ट्री खोज]] में सख्ती से [[हावी रणनीति|प्रभावित रणनीति]]यां भी महत्वपूर्ण हैं।) उदाहरण के लिए, (एकल अवधि) कैदी की दुविधा में कैदियों की दुविधा (नीचे दिखाया गया है), दोनों खिलाड़ियों के लिए सहयोग पर दोष का सख्ती से प्रभुत्व है क्योंकि दोष की परवाह किए बिना कोई भी खिलाड़ी सदैव उत्तम होता है। उसका प्रतिद्वंद्वी क्या करता है.


{| class="wikitable" style="margin: 1em auto 1em auto"
{| class="wikitable" style="margin: 1em auto 1em auto"
Line 37: Line 38:
उदाहरण के लिए, एक उपस्थित फर्म और उद्योग में संभावित प्रवेशकर्ता के साथ एक गतिशील गेम पर विचार करें। पदधारी का एकाधिकार है और वह अपनी बाजार साझेदारी बनाए रखना चाहता है। यदि प्रवेशकर्ता प्रवेश करता है, तो पदधारी या तो प्रवेशकर्ता से लड़ सकता है या उसे समायोजित कर सकता है। यदि पदधारी समायोजित करता है, तो प्रवेशकर्ता प्रवेश करेगा और लाभ प्राप्त करता है। यदि सत्ताधारी लड़ता है, तो वह अपनी मूल्य कम कर देगा, प्रवेशकर्ता को व्यवसाय से बाहर कर देता है (बाहर निकलने की निवेश वहन करेगा) और अपने स्वयं के लाभ को हानि पहुंचाएगा।
उदाहरण के लिए, एक उपस्थित फर्म और उद्योग में संभावित प्रवेशकर्ता के साथ एक गतिशील गेम पर विचार करें। पदधारी का एकाधिकार है और वह अपनी बाजार साझेदारी बनाए रखना चाहता है। यदि प्रवेशकर्ता प्रवेश करता है, तो पदधारी या तो प्रवेशकर्ता से लड़ सकता है या उसे समायोजित कर सकता है। यदि पदधारी समायोजित करता है, तो प्रवेशकर्ता प्रवेश करेगा और लाभ प्राप्त करता है। यदि सत्ताधारी लड़ता है, तो वह अपनी मूल्य कम कर देगा, प्रवेशकर्ता को व्यवसाय से बाहर कर देता है (बाहर निकलने की निवेश वहन करेगा) और अपने स्वयं के लाभ को हानि पहुंचाएगा।


यदि प्रवेशकर्ता प्रवेश करता है तो पदधारी के लिए सबसे अच्छी प्रतिक्रिया प्रवेश करना है, और यदि प्रवेशकर्ता समायोजित करता है तो प्रवेशकर्ता के लिए सर्वोत्तम प्रतिक्रिया प्रवेश करना है। इसका परिणाम नैश संतुलन में होता है। चूँकि यदि पदधारी लड़ने का विकल्प चुनता है, तो प्रवेशकर्ता के लिए सबसे अच्छी प्रतिक्रिया प्रवेश न करना है। यदि प्रवेशकर्ता प्रवेश नहीं करता है, तो इससे कोई प्रभाव नहीं पड़ता कि पदधारी क्या करना चाहता है। इसलिए, यदि प्रवेशकर्ता प्रवेश नहीं करता है तो लड़ाई को पदधारी के लिए सर्वोत्तम प्रतिक्रिया माना जा सकता है, जिसके परिणामस्वरूप एक और नैश संतुलन उत्पन्न होता है।
यदि प्रवेशकर्ता प्रवेश करता है तो पदधारी के लिए सबसे अच्छी प्रतिक्रिया प्रवेश करना है, और यदि प्रवेशकर्ता समायोजित करता है तो प्रवेशकर्ता के लिए सर्वोत्तम प्रतिक्रिया प्रवेश करना है। इसका परिणाम नैश संतुलन में होता है। चूँकि यदि पदधारी लड़ने का विकल्प चुनता है, तो प्रवेशकर्ता के लिए सबसे अच्छी प्रतिक्रिया प्रवेश न करना है। यदि प्रवेशकर्ता प्रवेश नहीं करता है, तो इससे कोई प्रभाव नहीं पड़ता कि पदधारी क्या करना चाहता है। इसलिए, यदि प्रवेशकर्ता प्रवेश नहीं करता है तो लड़ाई को पदधारी के लिए सर्वोत्तम प्रतिक्रिया माना जा सकता है, जिसके परिणामस्वरूप एक और नैश संतुलन उत्पन्न होता है।


चूँकि इस दूसरे नैश संतुलन को बैकवर्ड इंडक्शन द्वारा समाप्त किया जा सकता है क्योंकि यह उपस्थित व्यक्ति के गैर-विश्वसनीय खतरे पर निर्भर करता है। जब तक पदधारी निर्णय बिंदु तक पहुंचता है जहां वह लड़ना चुन सकता है, ऐसा करना अतार्किक होगा क्योंकि प्रवेशकर्ता पहले ही प्रवेश कर चुका है। इसलिए, बैकवर्ड इंडक्शन इस अवास्तविक नैश संतुलन को समाप्त कर देता है।
चूँकि इस दूसरे नैश संतुलन को बैकवर्ड इंडक्शन द्वारा समाप्त किया जा सकता है क्योंकि यह उपस्थित व्यक्ति के गैर-विश्वसनीय खतरे पर निर्भर करता है। जब तक पदधारी निर्णय बिंदु तक पहुंचता है जहां वह लड़ना चुन सकता है, ऐसा करना अतार्किक होगा क्योंकि प्रवेशकर्ता पहले ही प्रवेश कर चुका है। इसलिए, बैकवर्ड इंडक्शन इस अवास्तविक नैश संतुलन को समाप्त कर देता है।


यह सभी देखें:
यह सभी देखें:
Line 45: Line 46:
*[[स्टैकेलबर्ग प्रतियोगिता]]
*[[स्टैकेलबर्ग प्रतियोगिता]]


==सबगेम परफेक्ट नैश संतुलन==
==उपगेम परफेक्ट नैश संतुलन==
{{main|उपखेल पूर्ण संतुलन}}
{{main|उपखेल पूर्ण संतुलन}}


'''बैकवर्ड इंडक्शन का सामान्यीकरण [[ उपखेल | उपगेम]] पूर्णता है। बै'''कवर्ड इंडक्शन मानता है कि भविष्य के सभी गेम तर्कसंगत होंगे। सबगेम परफेक्ट इक्विलिब्रिया में, प्रत्येक सबगेम में खेलना तर्कसंगत है (विशेष रूप से नैश इक्विलिब्रियम)बैकवर्ड इंडक्शन का उपयोग केवल निश्चित लंबाई के गेम को समाप्त करने में किया जा सकता है और इसे [[अपूर्ण जानकारी]] वाले गेम पर प्रयुक्त नहीं किया जा सकता है। इन मामलों में, सबगेम पूर्णता का उपयोग किया जा सकता है। ऊपर वर्णित समाप्त नैश संतुलन सबगेम अपूर्ण है क्योंकि यह सबगेम का नैश संतुलन नहीं है जो प्रवेशकर्ता के प्रवेश करने के बाद नोड पर शुरू होता है।
बैकवर्ड इंडक्शन का सामान्यीकरण [[ उपखेल |उपगेम]] पूर्णता है। बैकवर्ड इंडक्शन मानता है कि भविष्य के सभी गेम तर्कसंगत होंगे। उपगेम परफेक्ट इक्विलिब्रिया में प्रत्येक उपगेम में खेलना तर्कसंगत है (विशेष रूप से नैश इक्विलिब्रियम) बैकवर्ड इंडक्शन का उपयोग केवल निश्चित लंबाई के गेम को समाप्त करने में किया जा सकता है और इसे [[अपूर्ण जानकारी]] वाले गेम पर प्रयुक्त नहीं किया जा सकता है। इन स्थिति में उपगेम पूर्णता का उपयोग किया जा सकता है। ऊपर वर्णित समाप्त नैश संतुलन उपगेम अपूर्ण है क्योंकि यह उपगेम का नैश संतुलन नहीं है जो प्रवेशकर्ता के प्रवेश करने के बाद नोड पर प्रारंभ होता है।


==परफेक्ट बायेसियन संतुलन==
==परफेक्ट बायेसियन संतुलन==
{{main|Bayesian game}}
{{main|बायेसियन गेम}}


कभी-कभी सबगेम पूर्णता अनुचित परिणामों पर पर्याप्त बड़ा प्रतिबंध नहीं लगाती है। उदाहरण के लिए, चूंकि सबगेम [[सूचना सेट (गेम थ्योरी)|सूचना सेट (गेम सिद्धांत)]] को नहीं तोड़ सकते, अपूर्ण जानकारी वाले गेम में केवल एक ही सबगेम हो सकता है - स्वयं - और इसलिए किसी भी नैश संतुलन को खत्म करने के लिए सबगेम पूर्णता का उपयोग नहीं किया जा सकता है। एक पूर्ण बायेसियन संतुलन (पीबीई) खिलाड़ियों की रणनीतियों और विश्वासों का एक विनिर्देश है जिसके बारे में जानकारी सेट में कौन सा नोड गेम खेलने से पहुंचा है। निर्णय नोड के बारे में एक धारणा यह संभावना है कि एक विशेष खिलाड़ी सोचता है कि नोड गेम में है या होगा (संतुलन पथ पर)। विशेष रूप से, पीबीई का अंतर्ज्ञान यह है कि यह खिलाड़ी की रणनीतियों को निर्दिष्ट करता है जो कि खिलाड़ी की मान्यताओं को देखते हुए तर्कसंगत हैं और जो मान्यताएं इसे निर्दिष्ट करती हैं वे इसके द्वारा निर्दिष्ट रणनीतियों के अनुरूप हैं।
कभी-कभी उपगेम पूर्णता अनुचित परिणामों पर पर्याप्त बड़ा प्रतिबंध नहीं लगाती है। उदाहरण के लिए चूंकि उपगेम [[सूचना सेट (गेम थ्योरी)|सूचना सेट (गेम सिद्धांत)]] को नहीं तोड़ सकते है जो की अपूर्ण जानकारी वाले गेम में केवल एक ही उपगेम हो सकता है - स्वयं - और इसलिए किसी भी नैश संतुलन को खत्म करने के लिए उपगेम पूर्णता का उपयोग नहीं किया जा सकता है। एक पूर्ण बायेसियन संतुलन (पीबीई) खिलाड़ियों की रणनीतियों और विश्वासों का एक विनिर्देश है जिसके बारे में जानकारी सेट में कौन सा नोड गेम खेलने से पहुंचा है। निर्णय नोड के बारे में एक धारणा यह संभावना है कि एक विशेष खिलाड़ी सोचता है कि नोड गेम में है या होगा (संतुलन पथ पर)। विशेष रूप से पीबीई का अंतर्ज्ञान यह है कि यह खिलाड़ी की रणनीतियों को निर्दिष्ट करता है जो कि खिलाड़ी की मान्यताओं को देखते हुए तर्कसंगत हैं और जो मान्यताएं इसे निर्दिष्ट करती हैं वे इसके द्वारा निर्दिष्ट रणनीतियों के अनुरूप हैं।


बायेसियन गेम में एक रणनीति यह निर्धारित करती है कि एक खिलाड़ी उस खिलाड़ी द्वारा नियंत्रित प्रत्येक सूचना सेट पर क्या खेलता है। आवश्यकता यह है कि विश्वास रणनीतियों के अनुरूप हों, यह सबगेम पूर्णता द्वारा निर्दिष्ट नहीं है। इसलिए, पीबीई खिलाड़ियों के विश्वास पर एक स्थिरता की स्थिति है। जिस प्रकार नैश संतुलन में किसी भी खिलाड़ी की रणनीति पर सख्ती से प्रभावित नहीं होती, उसी तरह पीबीई में, किसी भी सूचना सेट के लिए उस सूचना सेट से शुरू करके किसी भी खिलाड़ी की रणनीति पर सख्ती से प्रभावित नहीं होती है। अर्थात्, प्रत्येक विश्वास के लिए कि खिलाड़ी उस सूचना सेट पर कायम रह सकता है, ऐसी कोई रणनीति नहीं है जो उस खिलाड़ी के लिए अधिक अपेक्षित भुगतान प्रदान करती हो। उपरोक्त समाधान अवधारणाओं के विपरीत, किसी भी खिलाड़ी की रणनीति किसी भी सूचना सेट पर सख्ती से प्रभावित नहीं होती है, तथापि वह संतुलन पथ से दूर हो। इस प्रकार पीबीई में, खिलाड़ी उन रणनीतियों को खेलने की धमकी नहीं दे सकते हैं जो संतुलन पथ से निर्धारित किसी भी जानकारी पर सख्ती से प्रभावित हैं।
बायेसियन गेम में एक रणनीति यह निर्धारित करती है कि एक खिलाड़ी उस खिलाड़ी द्वारा नियंत्रित प्रत्येक सूचना सेट पर क्या खेलता है। आवश्यकता यह है जो कि विश्वास रणनीतियों के अनुरूप होते है और यह उपगेम पूर्णता द्वारा निर्दिष्ट नहीं है। इसलिए, पीबीई खिलाड़ियों के विश्वास पर एक स्थिरता की स्थिति है। जिस प्रकार नैश संतुलन में किसी भी खिलाड़ी की रणनीति पर सख्ती से प्रभावित नहीं होती है, उसी के अनुसार पीबीई में, किसी भी सूचना सेट के लिए उस सूचना सेट से प्रारंभ करके किसी भी खिलाड़ी की रणनीति पर सख्ती से प्रभावित नहीं होती है। अर्थात् प्रत्येक विश्वास के लिए कि खिलाड़ी उस सूचना सेट पर बना रह सकता है, ऐसी कोई रणनीति नहीं है जो उस खिलाड़ी के लिए अधिक अपेक्षित भुगतान प्रदान करती हो। उपरोक्त समाधान अवधारणाओं के विपरीत किसी भी खिलाड़ी की रणनीति किसी भी सूचना सेट पर सख्ती से प्रभावित नहीं होती है, तथापि वह संतुलन पथ से दूर होता है। इस प्रकार पीबीई में, खिलाड़ी उन रणनीतियों को खेलने की धमकी नहीं दे सकते हैं जो संतुलन पथ से निर्धारित किसी भी जानकारी पर सख्ती से प्रभावित हैं।


इस समाधान अवधारणा के नाम में बायेसियन इस तथ्य की ओर संकेत करता है कि खिलाड़ी बेयस प्रमेय के अनुसार अपनी मान्यताओं को अद्यतन करते हैं। गेम में जो पहले ही हो चुका है, उसे देखते हुए वे संभावनाओं की गणना करते हैं।
इस समाधान अवधारणा के नाम में बायेसियन इस तथ्य की ओर संकेत करता है कि खिलाड़ी बेयस प्रमेय के अनुसार अपनी मान्यताओं को अद्यतन करते हैं। गेम में जो पहले ही हो चुका है उसे देखते हुए वे संभावनाओं की गणना करते हैं।


==फॉरवर्ड इंडक्शन==
==फॉरवर्ड इंडक्शन==


फॉरवर्ड इंडक्शन को ऐसा इसलिए कहा जाता है क्योंकि जैसे बैकवर्ड इंडक्शन मानता है कि भविष्य का गेम तर्कसंगत होगा, फॉरवर्ड इंडक्शन मानता है कि पिछला गेम तर्कसंगत था। जहां एक खिलाड़ी को यह नहीं पता होता है कि दूसरा खिलाड़ी किस ''प्रकार'' का है (अथार्त अपूर्ण और असममित जानकारी है), तो वह खिलाड़ी उस खिलाड़ी के पिछले कार्यों को देखकर यह धारणा बना सकता है कि वह खिलाड़ी किस प्रकार का है। इसलिए उस खिलाड़ी द्वारा प्रतिद्वंद्वी के एक निश्चित प्रकार के होने की संभावना के बारे में बनाई गई धारणा उस प्रतिद्वंद्वी के पिछले गेम के तर्कसंगत होने पर आधारित है। एक खिलाड़ी अपने कार्यों के माध्यम से अपने प्रकार का संकेत देने का चुनाव कर सकता है।
फॉरवर्ड इंडक्शन को ऐसा इसलिए कहा जाता है क्योंकि जैसे बैकवर्ड इंडक्शन मानता है कि भविष्य का गेम तर्कसंगत होगा, फॉरवर्ड इंडक्शन मानता है कि पिछला गेम तर्कसंगत था। जहां एक खिलाड़ी को यह नहीं पता होता है कि दूसरा खिलाड़ी किस ''प्रकार'' का है (अथार्त अपूर्ण और असममित जानकारी है), तो वह खिलाड़ी उस खिलाड़ी के पिछले कार्यों को देखकर यह धारणा बना सकता है कि वह खिलाड़ी किस प्रकार का है। इसलिए उस खिलाड़ी द्वारा प्रतिद्वंद्वी के एक निश्चित प्रकार के होने की संभावना के बारे में बनाई गई धारणा उस प्रतिद्वंद्वी के पिछले गेम के तर्कसंगत होने पर आधारित है। एक खिलाड़ी अपने कार्यों के माध्यम से अपने प्रकार का संकेत देने का चुनाव कर सकता है।
 
कोहलबर्ग और मर्टेंस (1986) ने स्थिर संतुलन की समाधान अवधारणा पेश की, एक शोधन जो आगे के प्रेरण को संतुष्ट करता है। एक प्रति-उदाहरण पाया गया जहां ऐसा स्थिर संतुलन पिछड़े प्रेरण को संतुष्ट नहीं करता था। समस्या को हल करने के लिए जीन-फ्रांकोइस मर्टेंस ने पेश किया जिसे गेम सिद्धांतकार अब [[मर्टेंस-स्थिर संतुलन]] अवधारणा कहते हैं, संभवतः पहली समाधान अवधारणा जो आगे और पीछे दोनों प्रेरण को संतुष्ट करती है।


फॉरवर्ड इंडक्शन बैटल_ऑफ_द_सेक्सेस_(गेम_सिद्धांत)#बर्निंग_मनी के लिए एक अनूठा समाधान देता है।
कोहलबर्ग और मर्टेंस (1986) ने स्थिर संतुलन की समाधान अवधारणा प्रस्तुत की कि एक शोधन जो आगे के प्रेरण को संतुष्ट करता है। एक प्रति-उदाहरण पाया गया जहां ऐसा स्थिर संतुलन पिछड़े प्रेरण को संतुष्ट नहीं करता था। समस्या को हल करने के लिए जीन-फ्रांकोइस मर्टेंस ने प्रस्तुत किया जिसे गेम सिद्धांतकार अब [[मर्टेंस-स्थिर संतुलन]] अवधारणा कहते हैं, संभवतः पहली समाधान अवधारणा जो आगे और पीछे दोनों प्रेरण को संतुष्ट करती है।


फॉरवर्ड इंडक्शन बर्निंग मनी गेम के लिए एक विचित्र समाधान देता है।
==यह भी देखें==
==यह भी देखें==
*[[व्यापक रूप का खेल]]
*[[व्यापक रूप का खेल]]
* कांपते हाथ का संतुलन
* कांपते हाथ का संतुलन
* [[सहज मानदंड]] {{harv|Cho | Kreps |1987}}
* [[सहज मानदंड]] {{harv|सिएचओ |क्रेप्स|1987}}


==संदर्भ==
==संदर्भ==
Line 80: Line 80:
* Kohlberg, Elon & Jean-François Mertens, 1986. "[http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.295.4592&rep=rep1&type=pdf On the Strategic Stability of Equilibria]," Econometrica, Econometric Society, vol. 54(5), pages 1003-37, September.
* Kohlberg, Elon & Jean-François Mertens, 1986. "[http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.295.4592&rep=rep1&type=pdf On the Strategic Stability of Equilibria]," Econometrica, Econometric Society, vol. 54(5), pages 1003-37, September.
* {{cite book | last2=Shoham | first2=Yoav | last1=Leyton-Brown | first1=Kevin | title=Essentials of Game Theory: A Concise, Multidisciplinary Introduction  | publisher=Morgan & Claypool Publishers | isbn=978-1-59829-593-1 | url=http://www.gtessentials.org | year=2008 | location=San Rafael, CA}}
* {{cite book | last2=Shoham | first2=Yoav | last1=Leyton-Brown | first1=Kevin | title=Essentials of Game Theory: A Concise, Multidisciplinary Introduction  | publisher=Morgan & Claypool Publishers | isbn=978-1-59829-593-1 | url=http://www.gtessentials.org | year=2008 | location=San Rafael, CA}}
* Mertens, Jean-François, 1989. "Stable Equilibria - A reformulation. Part 1 Basic Definitions and Properties," Mathematics of Operations Research,   Vol. 14, No. 4, Nov. [https://www.jstor.org/pss/3689732]
* Mertens, Jean-François, 1989. "Stable Equilibria - A reformulation. Part 1 Basic Definitions and Properties," Mathematics of Operations Research, Vol. 14, No. 4, Nov. [https://www.jstor.org/pss/3689732]
* Noldeke, G. & Samuelson, L. (1993) [https://core.ac.uk/download/pdf/6519267.pdf An evolutionary analysis of backward and forward induction]. ''Games & Economic Behaviour'' 5:425–454.
* Noldeke, G. & Samuelson, L. (1993) [https://core.ac.uk/download/pdf/6519267.pdf An evolutionary analysis of backward and forward induction]. ''Games & Economic Behaviour'' 5:425–454.
* [[John Maynard Smith|Maynard Smith, J.]] (1982) ''[[Evolution and the Theory of Games]]''. {{ISBN|0-521-28884-3}}
* [[John Maynard Smith|Maynard Smith, J.]] (1982) ''[[Evolution and the Theory of Games]]''. {{ISBN|0-521-28884-3}}
* {{Cite book | last2=Rubinstein | first2=Ariel | author2-link=Ariel Rubinstein | last1=Osborne | first1=Martin J. | title=A course in game theory | publisher=[[MIT Press]] | isbn=978-0-262-65040-3 | year=1994}}.
* {{Cite book | last2=Rubinstein | first2=Ariel | author2-link=Ariel Rubinstein | last1=Osborne | first1=Martin J. | title=A course in game theory | publisher=[[MIT Press]] | isbn=978-0-262-65040-3 | year=1994}}.
* [[Reinhard Selten|Selten, R.]] (1983) [https://www.sciencedirect.com/science/article/pii/0165489683900124 Evolutionary stability in extensive two-person games]. ''Math. Soc. Sci.'' 5:269–363.
* [[Reinhard Selten|Selten, R.]] (1983) [https://www.sciencedirect.com/science/article/pii/0165489683900124 Evolutionary stability in extensive two-person games]. ''Math. Soc. Sci.'' 5:269–363.
Line 91: Line 91:


{{Game theory}}
{{Game theory}}
[[Category: खेल सिद्धांत]] [[Category: खेल सिद्धांत संतुलन अवधारणाएँ]]


[[Category: Machine Translated Page]]
[[Category:Articles with hatnote templates targeting a nonexistent page]]
[[Category:Collapse templates]]
[[Category:Created On 06/07/2023]]
[[Category:Created On 06/07/2023]]
[[Category:Lua-based templates]]
[[Category:Machine Translated Page]]
[[Category:Navigational boxes| ]]
[[Category:Navigational boxes without horizontal lists]]
[[Category:Pages with script errors]]
[[Category:Sidebars with styles needing conversion]]
[[Category:Template documentation pages|Documentation/doc]]
[[Category:Templates Vigyan Ready]]
[[Category:Templates generating microformats]]
[[Category:Templates that add a tracking category]]
[[Category:Templates that are not mobile friendly]]
[[Category:Templates that generate short descriptions]]
[[Category:Templates using TemplateData]]
[[Category:Wikipedia metatemplates]]
[[Category:खेल सिद्धांत]]
[[Category:खेल सिद्धांत संतुलन अवधारणाएँ]]

Latest revision as of 10:43, 18 July 2023

गेम सिद्धांत में चयनित संतुलन परिशोधन। तीर परिशोधन से अधिक सामान्य अवधारणा (अथार्त , ईएसएस) की ओर इशारा करते हैं उचित)।


गेम सिद्धांत में, समाधान अवधारणा यह अनुमान लगाने के लिए एक औपचारिक नियम है कि गेम कैसे खेला जाएगा। इन भविष्यवाणियों को "समाधान" कहा जाता है, और यह वर्णन करता है कि खिलाड़ियों द्वारा कौन सी रणनीतियाँ अपनाई जाएंगी और इसलिए, गेम का परिणाम क्या होगा। सबसे अधिक उपयोग की जाने वाली समाधान अवधारणाएँ संतुलन अवधारणाएँ हैं जिनमें सबसे प्रसिद्ध नैश संतुलन है।

कई खेलों के लिए कई समाधान अवधारणाओं का परिणाम एक से अधिक समाधान होगा। यह समाधानों में से किसी एक को संदेह में डाल देता है, इसलिए एक गेम सिद्धांतकार समाधानों को सीमित करने के लिए परिशोधन प्रयुक्त कर सकता है। निम्नलिखित में प्रस्तुत प्रत्येक क्रमिक समाधान अवधारणा समृद्ध खेलों में अकल्पनीय संतुलन को समाप्त करके अपने पूर्ववर्ती में सुधार करती है।

औपचारिक परिभाषा

मान लीजिए सभी गेम का वर्ग है और, प्रत्येक गेम के लिए, मान लीजिए , की रणनीति प्रोफाइल का सेट है। एक समाधान अवधारणा प्रत्यक्ष उत्पाद का एक तत्व है; अथार्त एक कार्य ऐसा कि सभी के लिए है ।

तर्कसंगतता और पुनरावृत्त प्रभुत्व

इस समाधान अवधारणा में, खिलाड़ियों को तर्कसंगत माना जाता है और इसलिए प्रभुत्व (गेम सिद्धांत) या वर्चस्व वाली रणनीतियों को उन रणनीतियों के सेट से हटा दिया जाता है जिन्हें संभवतः खेला जा सकता है। एक रणनीति तब प्रभुत्व वाली रणनीति होती है जब खिलाड़ी के लिए कोई अन्य रणनीति उपलब्ध होती है जिसका लाभ सदैव अधिक होता है, तथापि अन्य खिलाड़ी कोई भी रणनीति चुनें। (अल्पमहिष्ठ गेम-ट्री खोज में सख्ती से प्रभावित रणनीतियां भी महत्वपूर्ण हैं।) उदाहरण के लिए, (एकल अवधि) कैदी की दुविधा में कैदियों की दुविधा (नीचे दिखाया गया है), दोनों खिलाड़ियों के लिए सहयोग पर दोष का सख्ती से प्रभुत्व है क्योंकि दोष की परवाह किए बिना कोई भी खिलाड़ी सदैव उत्तम होता है। उसका प्रतिद्वंद्वी क्या करता है.

प्रिजनर 2 को-ओपरेट प्रिजनर 2 डिफेक्ट
प्रिजनर 1 को-ओपरेट −0.5, −0.5 −10, 0
प्रिजनर 1 डिफेक्ट 0, −10 −2, −2


नैश संतुलन

नैश संतुलन एक रणनीति प्रोफ़ाइल है (एक रणनीति प्रोफ़ाइल प्रत्येक खिलाड़ी के लिए एक रणनीति निर्दिष्ट करती है, उदाहरण के लिए उपरोक्त कैदियों के दुविधा गेम में (सहयोग करें, दोष) निर्दिष्ट करता है कि कैदी 1 सहयोग खेलता है और कैदी 2 दोष खेलता है) जिसमें प्रत्येक रणनीति सर्वोत्तम होती है खेली गई हर दूसरी रणनीति का उत्तर में एक खिलाड़ी द्वारा बनाई गई रणनीति किसी अन्य खिलाड़ी की रणनीति के लिए सबसे अच्छी प्रतिक्रिया होती है यदि ऐसी कोई अन्य रणनीति नहीं है जिसे खेला जा सके जो कि किसी भी स्थिति में जिसमें दूसरे खिलाड़ी की रणनीति खेली जाती है, उच्च भुगतान प्राप्त करता है।

बैकवर्ड इंडक्शन

कुछ खेलों में, कई नैश संतुलन होते हैं, किंतु उनमें से सभी यथार्थवादी नहीं होते हैं। गतिशील खेलों में, अवास्तविक नैश संतुलन को खत्म करने के लिए बैकवर्ड इंडक्शन का उपयोग किया जा सकता है। बैकवर्ड इंडक्शन मानता है कि खिलाड़ी तर्कसंगत हैं और अपनी भविष्य की अपेक्षाओं के आधार पर सर्वोत्तम निर्णय लेते है। जो की यह गैर-विश्वसनीय खतरों को समाप्त कर देता है, जो ऐसी धमकियाँ हैं जिन्हें एक खिलाड़ी तब पूरा नहीं करेगा जब उन्हें ऐसा करने के लिए कभी भी बुलाया जाएगा।

उदाहरण के लिए, एक उपस्थित फर्म और उद्योग में संभावित प्रवेशकर्ता के साथ एक गतिशील गेम पर विचार करें। पदधारी का एकाधिकार है और वह अपनी बाजार साझेदारी बनाए रखना चाहता है। यदि प्रवेशकर्ता प्रवेश करता है, तो पदधारी या तो प्रवेशकर्ता से लड़ सकता है या उसे समायोजित कर सकता है। यदि पदधारी समायोजित करता है, तो प्रवेशकर्ता प्रवेश करेगा और लाभ प्राप्त करता है। यदि सत्ताधारी लड़ता है, तो वह अपनी मूल्य कम कर देगा, प्रवेशकर्ता को व्यवसाय से बाहर कर देता है (बाहर निकलने की निवेश वहन करेगा) और अपने स्वयं के लाभ को हानि पहुंचाएगा।

यदि प्रवेशकर्ता प्रवेश करता है तो पदधारी के लिए सबसे अच्छी प्रतिक्रिया प्रवेश करना है, और यदि प्रवेशकर्ता समायोजित करता है तो प्रवेशकर्ता के लिए सर्वोत्तम प्रतिक्रिया प्रवेश करना है। इसका परिणाम नैश संतुलन में होता है। चूँकि यदि पदधारी लड़ने का विकल्प चुनता है, तो प्रवेशकर्ता के लिए सबसे अच्छी प्रतिक्रिया प्रवेश न करना है। यदि प्रवेशकर्ता प्रवेश नहीं करता है, तो इससे कोई प्रभाव नहीं पड़ता कि पदधारी क्या करना चाहता है। इसलिए, यदि प्रवेशकर्ता प्रवेश नहीं करता है तो लड़ाई को पदधारी के लिए सर्वोत्तम प्रतिक्रिया माना जा सकता है, जिसके परिणामस्वरूप एक और नैश संतुलन उत्पन्न होता है।

चूँकि इस दूसरे नैश संतुलन को बैकवर्ड इंडक्शन द्वारा समाप्त किया जा सकता है क्योंकि यह उपस्थित व्यक्ति के गैर-विश्वसनीय खतरे पर निर्भर करता है। जब तक पदधारी निर्णय बिंदु तक पहुंचता है जहां वह लड़ना चुन सकता है, ऐसा करना अतार्किक होगा क्योंकि प्रवेशकर्ता पहले ही प्रवेश कर चुका है। इसलिए, बैकवर्ड इंडक्शन इस अवास्तविक नैश संतुलन को समाप्त कर देता है।

यह सभी देखें:

उपगेम परफेक्ट नैश संतुलन

बैकवर्ड इंडक्शन का सामान्यीकरण उपगेम पूर्णता है। बैकवर्ड इंडक्शन मानता है कि भविष्य के सभी गेम तर्कसंगत होंगे। उपगेम परफेक्ट इक्विलिब्रिया में प्रत्येक उपगेम में खेलना तर्कसंगत है (विशेष रूप से नैश इक्विलिब्रियम) बैकवर्ड इंडक्शन का उपयोग केवल निश्चित लंबाई के गेम को समाप्त करने में किया जा सकता है और इसे अपूर्ण जानकारी वाले गेम पर प्रयुक्त नहीं किया जा सकता है। इन स्थिति में उपगेम पूर्णता का उपयोग किया जा सकता है। ऊपर वर्णित समाप्त नैश संतुलन उपगेम अपूर्ण है क्योंकि यह उपगेम का नैश संतुलन नहीं है जो प्रवेशकर्ता के प्रवेश करने के बाद नोड पर प्रारंभ होता है।

परफेक्ट बायेसियन संतुलन

कभी-कभी उपगेम पूर्णता अनुचित परिणामों पर पर्याप्त बड़ा प्रतिबंध नहीं लगाती है। उदाहरण के लिए चूंकि उपगेम सूचना सेट (गेम सिद्धांत) को नहीं तोड़ सकते है जो की अपूर्ण जानकारी वाले गेम में केवल एक ही उपगेम हो सकता है - स्वयं - और इसलिए किसी भी नैश संतुलन को खत्म करने के लिए उपगेम पूर्णता का उपयोग नहीं किया जा सकता है। एक पूर्ण बायेसियन संतुलन (पीबीई) खिलाड़ियों की रणनीतियों और विश्वासों का एक विनिर्देश है जिसके बारे में जानकारी सेट में कौन सा नोड गेम खेलने से पहुंचा है। निर्णय नोड के बारे में एक धारणा यह संभावना है कि एक विशेष खिलाड़ी सोचता है कि नोड गेम में है या होगा (संतुलन पथ पर)। विशेष रूप से पीबीई का अंतर्ज्ञान यह है कि यह खिलाड़ी की रणनीतियों को निर्दिष्ट करता है जो कि खिलाड़ी की मान्यताओं को देखते हुए तर्कसंगत हैं और जो मान्यताएं इसे निर्दिष्ट करती हैं वे इसके द्वारा निर्दिष्ट रणनीतियों के अनुरूप हैं।

बायेसियन गेम में एक रणनीति यह निर्धारित करती है कि एक खिलाड़ी उस खिलाड़ी द्वारा नियंत्रित प्रत्येक सूचना सेट पर क्या खेलता है। आवश्यकता यह है जो कि विश्वास रणनीतियों के अनुरूप होते है और यह उपगेम पूर्णता द्वारा निर्दिष्ट नहीं है। इसलिए, पीबीई खिलाड़ियों के विश्वास पर एक स्थिरता की स्थिति है। जिस प्रकार नैश संतुलन में किसी भी खिलाड़ी की रणनीति पर सख्ती से प्रभावित नहीं होती है, उसी के अनुसार पीबीई में, किसी भी सूचना सेट के लिए उस सूचना सेट से प्रारंभ करके किसी भी खिलाड़ी की रणनीति पर सख्ती से प्रभावित नहीं होती है। अर्थात् प्रत्येक विश्वास के लिए कि खिलाड़ी उस सूचना सेट पर बना रह सकता है, ऐसी कोई रणनीति नहीं है जो उस खिलाड़ी के लिए अधिक अपेक्षित भुगतान प्रदान करती हो। उपरोक्त समाधान अवधारणाओं के विपरीत किसी भी खिलाड़ी की रणनीति किसी भी सूचना सेट पर सख्ती से प्रभावित नहीं होती है, तथापि वह संतुलन पथ से दूर होता है। इस प्रकार पीबीई में, खिलाड़ी उन रणनीतियों को खेलने की धमकी नहीं दे सकते हैं जो संतुलन पथ से निर्धारित किसी भी जानकारी पर सख्ती से प्रभावित हैं।

इस समाधान अवधारणा के नाम में बायेसियन इस तथ्य की ओर संकेत करता है कि खिलाड़ी बेयस प्रमेय के अनुसार अपनी मान्यताओं को अद्यतन करते हैं। गेम में जो पहले ही हो चुका है उसे देखते हुए वे संभावनाओं की गणना करते हैं।

फॉरवर्ड इंडक्शन

फॉरवर्ड इंडक्शन को ऐसा इसलिए कहा जाता है क्योंकि जैसे बैकवर्ड इंडक्शन मानता है कि भविष्य का गेम तर्कसंगत होगा, फॉरवर्ड इंडक्शन मानता है कि पिछला गेम तर्कसंगत था। जहां एक खिलाड़ी को यह नहीं पता होता है कि दूसरा खिलाड़ी किस प्रकार का है (अथार्त अपूर्ण और असममित जानकारी है), तो वह खिलाड़ी उस खिलाड़ी के पिछले कार्यों को देखकर यह धारणा बना सकता है कि वह खिलाड़ी किस प्रकार का है। इसलिए उस खिलाड़ी द्वारा प्रतिद्वंद्वी के एक निश्चित प्रकार के होने की संभावना के बारे में बनाई गई धारणा उस प्रतिद्वंद्वी के पिछले गेम के तर्कसंगत होने पर आधारित है। एक खिलाड़ी अपने कार्यों के माध्यम से अपने प्रकार का संकेत देने का चुनाव कर सकता है।

कोहलबर्ग और मर्टेंस (1986) ने स्थिर संतुलन की समाधान अवधारणा प्रस्तुत की कि एक शोधन जो आगे के प्रेरण को संतुष्ट करता है। एक प्रति-उदाहरण पाया गया जहां ऐसा स्थिर संतुलन पिछड़े प्रेरण को संतुष्ट नहीं करता था। समस्या को हल करने के लिए जीन-फ्रांकोइस मर्टेंस ने प्रस्तुत किया जिसे गेम सिद्धांतकार अब मर्टेंस-स्थिर संतुलन अवधारणा कहते हैं, संभवतः पहली समाधान अवधारणा जो आगे और पीछे दोनों प्रेरण को संतुष्ट करती है।

फॉरवर्ड इंडक्शन बर्निंग मनी गेम के लिए एक विचित्र समाधान देता है।

यह भी देखें

संदर्भ