नैश संतुलन

नैश संतुलन
नैश संतुलन
A solution concept in game theory
Relationship
Subset of	तर्कसंगतता, एप्सिलॉन-संतुलन, सहसंबंधित संतुलन
Superset of	विकासात्मक रूप से स्थिर रणनीति, सबगेम परफेक्ट इक्विलिब्रियम, परफेक्ट बायेसियन इक्विलिब्रियम, ट्रेंबलिंग हैंड परफेक्ट इक्विलिब्रियम, स्टेबल नैश इक्विलिब्रियम, स्ट्रॉन्ग नैश संतुलन, कोर्टनॉट संतुलन
Significance
Proposed by	जॉन फोर्ब्स नैश जूनियर
Used for	सभी असहयोगी खेलएस

खेल सिद्धांत में, गणितज्ञ जॉन फोर्ब्स नैश जूनियर के नाम पर रखा गया नैश संतुलन, दो या दो से अधिक खिलाड़ियों को सम्मिलित करने वाले गैर-सहकारी खेल की समाधान अवधारणा को परिभाषित करने का सबसे समान विधि है। नैश संतुलन में, प्रत्येक खिलाड़ी को अन्य खिलाड़ियों की संतुलन रणनीतियों को जानने के लिए माना जाता है, और केवल अपनी रणनीति को बदलकर किसी को कुछ प्राप्त नहीं होता है।^[1] नैश संतुलन का सिद्धांत एंटोनी ऑगस्टिन कोर्टन के समय का है । जिन्होंने 1838 में इसे आउटपुट चुनने वाली प्रतिस्पर्धी फर्मों पर प्रयुक्त किया था।^[2]

यदि प्रत्येक खिलाड़ी ने एक रणनीति (खेल सिद्धांत) चुनी है । खेल में अब तक जो हुआ है । उसके आधार पर एक कार्य योजना और कोई भी अपनी रणनीति को बदलकर अपनी अपेक्षित पेआफ में वृद्धि नहीं कर सकता है, जबकि अन्य खिलाड़ी अपनी रणनीति को अपरिवर्तित रखते हैं, तो रणनीति विकल्पों का वर्तमान समुच्चय नैश संतुलन का गठन करता है।

यदि दो खिलाड़ी ऐलिस और बॉब रणनीति A और B चुनते हैं, (A, B) एक नैश संतुलन है यदि ऐलिस के पास कोई अन्य रणनीति उपलब्ध नहीं है जो बॉब के B को चुनने के उत्तर में उसके भुगतान को अधिकतम करने में A से उत्तम है, और बॉब के पास कोई अन्य रणनीति नहीं है उपलब्ध है जो ऐलिस के A को चुनने के उत्तर में अपने पेआफ को अधिकतम करने में B से उत्तम करता है। एक ऐसे खेल में जिसमें कैरल और डैन भी खिलाड़ी हैं, (A, B, C, D) एक नैश संतुलन है यदि A एलिस की सबसे अच्छी प्रतिक्रिया है । ( B, C, D), B बॉब की सबसे अच्छी (A, C, D), और आगे प्रतिक्रिया है ।

नैश ने दिखाया कि प्रत्येक परिमित खेल के लिए नैश संतुलन होता है (देखें रणनीति (खेल सिद्धांत)).

अनुप्रयोग

खेल सिद्धांतकार कई निर्णय लेने की रणनीति के परिणाम का विश्लेषण करने के लिए नैश संतुलन का उपयोग करते हैं। एक रणनीतिक परस्पर क्रिया में, प्रत्येक निर्णयकर्ता के लिए परिणाम दूसरों के साथ-साथ उनके स्वयं के निर्णयों पर निर्भर करता है। नैश के विचार में अंतर्निहित सरल अंतर्दृष्टि यह है कि यदि कोई उन निर्णयों का अलग-अलग विश्लेषण करता है, तो वह कई निर्णय निर्माताओं के विकल्पों की पूर्वानुमान नहीं कर सकता है। इसके अतिरिक्त, किसी को यह पूछना चाहिए कि प्रत्येक खिलाड़ी इस बात को ध्यान में रखते हुए क्या करेगा कि खिलाड़ी दूसरों से क्या करने की अपेक्षा करता है। नैश संतुलन के लिए आवश्यक है कि किसी की पसंद सुसंगत हो कोई भी खिलाड़ी अपने निर्णय को पूर्ववत नहीं करना चाहता, यह देखते हुए कि दूसरे क्या निर्णय ले रहे हैं।

अवधारणा का उपयोग युद्ध और हथियारों की दौड़ जैसी शत्रुतापूर्ण स्थितियों का विश्लेषण करने के लिए किया गया है ॥^[3] (प्रिजनर की दुविधा देखें), और बार-बार परस्पर क्रिया से संघर्ष को कैसे कम किया जा सकता है (देखें जैसे को तैसा)। इसका उपयोग यह अध्ययन करने के लिए भी किया गया है कि विभिन्न प्राथमिकताओं वाले लोग किस सीमा तक सहयोग कर सकते हैं (देखें लिंगों की लड़ाई (खेल सिद्धांत)), और क्या वे सहकारी परिणाम प्राप्त करने के लिए कठिन परिस्थिति उठाएंगे (देखें हरिण का शिकार )। इसका उपयोग विधि मानक को अपनाने के अध्ययन के लिए किया गया है, और बैंक चलाना और मुद्रा संकट की घटना भी (समन्वय खेल देखें)। अन्य अनुप्रयोगों में यातायात प्रवाह (वार्ड्रोप का सिद्धांत देखें), नीलामी कैसे व्यवस्थित करें (नीलामी सिद्धांत देखें), शिक्षा प्रक्रिया में कई दलों द्वारा किए गए प्रयासों के परिणाम सम्मिलित हैं,^[4] नियामक नियम जैसे पर्यावरणीय नियम (देखें कॉमन्स की त्रासदी),^[5] प्राकृतिक संसाधन प्रबंधन,^[6] विपणन में रणनीतियों का विश्लेषण,^[7] फ़ुटबॉल संघ में पेनल्T किक भी मिलती है (मिलान पैसे देखें),^[8] ऊर्जा प्रणाली, परिवहन प्रणाली, निकासी की समस्याएं ^[9] और वायरलेस संचार है।^[10]

इतिहास

नैश संतुलन का नाम अमेरिकी गणितज्ञ जॉन फोर्ब्स नैश जूनियर के नाम पर रखा गया है। इसी विचार का उपयोग 1838 में एक विशेष अनुप्रयोग में एंटोनी ऑगस्टिन कौरनॉट ने अपने अल्पाधिकार के सिद्धांत में किया था।^[11] कौरनॉट के सिद्धांत में, कई फर्मों में से प्रत्येक यह चुनती है कि अपने लाभ को अधिकतम करने के लिए कितना उत्पादन करना है। एक फर्म का सर्वोत्तम उत्पादन दूसरी फर्म के उत्पादन पर निर्भर करता है। एक कोर्टन संतुलन तब होता है जब प्रत्येक फर्म का उत्पादन अन्य फर्मों के उत्पादन को देखते हुए अपने लाभ को अधिकतम करता है ॥ जो एक शुद्ध रणनीति है। शुद्ध-रणनीति नैश संतुलन। कोर्टन ने संतुलन की स्थिरता के अपने विश्लेषण में सर्वश्रेष्ठ प्रतिक्रिया गतिकी की अवधारणा को भी प्रस्तुत किया था। चूँकि, कोर्टनोट ने किसी अन्य अनुप्रयोग में इस विचार का उपयोग नहीं किया, या इसे सामान्यतः परिभाषित नहीं किया था।

इसके अतिरिक्त नैश संतुलन की आधुनिक अवधारणा को मिश्रित रणनीति के संदर्भ में परिभाषित किया गया है ॥ जहां खिलाड़ी संभावित शुद्ध रणनीतियों पर संभाव्यता वितरण चुनते हैं (जो एक शुद्ध रणनीति पर संभावना का 100% डाल सकता है । ऐसी शुद्ध रणनीतियाँ मिश्रित रणनीतियों का एक सबसमुच्चय हैं)। जॉन वॉन न्यूमैन और ऑस्कर मॉर्गनस्टर्न ने अपनी 1944 की पुस्तक द सिद्धांत ऑफ़ खेल्स एंड इकोनॉमिक बिहेवियर में एक मिश्रित-रणनीति संतुलन की अवधारणा प्रस्तुत की थी, किन्तु उनका विश्लेषण शून्य-राशि वाले खेलों के विशेष स्थिति तक ही सीमित था। उन्होंने दिखाया कि एक मिश्रित-रणनीति नैश संतुलन किसी भी शून्य-राशि वाले खेल के लिए क्रियाओं के सीमित समुच्चय के साथ उपस्थित रहेगा।^[12] अपने 1951 के लेख गैर-सहकारी खेलों में नैश का योगदान किसी भी खेल के लिए एक मिश्रित-रणनीति नैश संतुलन को क्रियाओं के सीमित समुच्चय के साथ परिभाषित करना था और यह सिद्ध करना था कि इस तरह के खेल में कम से कम एक (मिश्रित-रणनीति) नैश संतुलन उपस्थित होना चाहिए। वॉन न्यूमैन की तुलना में कहीं अधिक सामान्य रूप से अस्तित्व को सिद्ध करने की नैश की क्षमता की कुंजी संतुलन की उनकी परिभाषा में निहित है। नैश के अनुसार, एक संतुलन बिंदु एक n-टपल है जैसे कि प्रत्येक खिलाड़ी की मिश्रित रणनीति उसके भुगतान को अधिकतम करती है यदि दूसरों की रणनीतियों को स्थिर रखा जाता है। इस प्रकार प्रत्येक खिलाड़ी की रणनीति दूसरों के खिलाफ इष्टतम होती है। समस्या को इस ढाँचे में डालने से नैश ने संतुलन के अस्तित्व को सिद्ध करने के लिए अपने 1950 के पेपर में अब निश्चित बिंदु प्रमेय को नियोजित करने की अनुमति दी। उनके 1951 के पेपर में इसी उद्देश्य के लिए सरल ब्रोवर फिक्स्ड-पॉइंट प्रमेय का उपयोग किया गया था।^[13] खेल सिद्धांतकारों ने पता लगाया है कि कुछ परिस्थितियों में नैश संतुलन अमान्य पूर्वानुमान करता है या एक अद्वितीय पूर्वानुमान करने में विफल रहता है। उन्होंने कई समाधान अवधारणाओं (नैश इक्विलिब्रिया के 'शोधन') का प्रस्ताव दिया है, जिन्हें अकल्पनीय नैश इक्विलिब्रिया से बाहर करने के लिए डिज़ाइन किया गया है। एक विशेष रूप से महत्वपूर्ण कथन यह है कि कुछ नैश संतुलन उन खतरों पर आधारित हो सकते हैं जो 'विश्वसनीयता' नहीं हैं। 1965 में रेइनहार्ड दुर्लभ ने उप खेल पूर्ण संतुलन को एक परिशोधन के रूप में प्रस्तावित किया था । जो गैर-विश्वसनीय खतरों पर निर्भर साम्यावस्था को समाप्त करता है। नैश संतुलन अवधारणा के अन्य विस्तारों ने यह बताया है कि क्या होता है । यदि कोई खेल दोहराया जाता है, या क्या होता है यदि कोई खेल वैश्विक खेल में खेला जाता है। चूँकि, नैश संतुलन के बाद के शोधन और विस्तार मुख्य अंतर्दृष्टि को साझा करते हैं । जिस पर नैश की अवधारणा टिकी हुई है । संतुलन रणनीतियों का एक समुच्चय है जैसे कि प्रत्येक खिलाड़ी की रणनीति दूसरों के विकल्पों को देखते हुए इष्टतम होती है।

परिभाषाएँ

नैश संतुलन

एक रणनीति प्रोफ़ाइल रणनीतियों का एक समुच्चय है, प्रत्येक खिलाड़ी के लिए एक। अनौपचारिक रूप से, एक रणनीति प्रोफ़ाइल एक नैश संतुलन है यदि कोई खिलाड़ी अपनी रणनीति को एकतरफा बदलकर उत्तम नहीं कर सकता है। यह देखने के लिए कि इसका क्या कारण है, कल्पना करें कि प्रत्येक खिलाड़ी को दूसरों की रणनीतियों के बारे में बताया जाता है। मान लीजिए कि प्रत्येक खिलाड़ी खुद से पूछता है: अन्य खिलाड़ियों की रणनीतियों को जानना, और अन्य खिलाड़ियों की रणनीतियों को पत्थर की तरह समझना, क्या मुझे अपनी रणनीति बदलने से लाभ हो सकता है?

यदि कोई खिलाड़ी हां में उत्तर दे सकता है, तो रणनीतियों का वह समुच्चय नैश संतुलन नहीं है। किन्तु यदि हर खिलाड़ी स्विच नहीं करना पसंद करता है (या स्विच करने और न करने के बीच उदासीन है) तो रणनीति प्रोफ़ाइल नैश संतुलन है। इस प्रकार, नैश संतुलन में प्रत्येक रणनीति उस संतुलन में अन्य खिलाड़ियों की रणनीतियों के लिए सबसे अच्छी प्रतिक्रिया होती है।^[14]

औपचारिक रूप से, माना $S_{i}$ खिलाड़ी के लिए सभी संभावित रणनीतियों का समुच्चय हो $i$ , जहाँ $i=1,\ldots ,N$ . माना $s^{*}=(s_{i}^{*},s_{-i}^{*})$ एक रणनीति प्रोफ़ाइल हो, प्रत्येक खिलाड़ी के लिए एक रणनीति वाला एक समुच्चय, जहां $s_{-i}^{*}$ दर्शाता है । $N-1$ को छोड़कर सभी खिलाड़ियों की रणनीति $i$ . माना $u_{i}(s_{i},s_{-i}^{*})$ रणनीति के फलन के रूप में खिलाड़ी का प्रतिदान होना। रणनीति प्रोफ़ाइल $s^{*}$ एक नैश संतुलन है यदि

u_{i}(s_{i}^{*},s_{-i}^{*})\geq u_{i}(s_{i},s_{-i}^{*})\;\;{\rm {for\;all}}\;\;s_{i}\in S_{i}

एक खेल में एक से अधिक नैश संतुलन हो सकते हैं। यहां तक कि यदि संतुलन अद्वितीय है, तो यह अशक्त हो सकता है: एक खिलाड़ी दूसरे खिलाड़ियों की पसंद को देखते हुए कई रणनीतियों के बीच उदासीन हो सकता है। यह अद्वितीय है और सख्त नैश संतुलन कहा जाता है । यदि असमानता सख्त है तो एक रणनीति अद्वितीय सर्वोत्तम प्रतिक्रिया है ।

u_{i}(s_{i}^{*},s_{-i}^{*})>u_{i}(s_{i},s_{-i}^{*})\;\;{\rm {for\;all}}\;\;s_{i}\in S_{i},s_{i}\neq s_{i}^{*}

ध्यान दें कि रणनीति समुच्चय $S_{i}$ अलग-अलग खिलाड़ियों के लिए अलग-अलग हो सकते हैं, और इसके तत्व विभिन्न प्रकार की गणितीय वस्तुएं हो सकते हैं। सबसे सरलता से, एक खिलाड़ी दो रणनीतियों के बीच चयन कर सकता है, उदाहरण $S_{i}=\{{\text{Yes}},{\text{No}}\}.$ या, रणनीति समुच्चय अन्य खिलाड़ियों को उत्तर देने वाली सनियम रणनीतियों का एक सीमित समुच्चय हो सकता है, उदाहरण $S_{i}=\{{\text{Yes}}|p={\text{Low}},{\text{No}}|p={\text{High}}\}.$ या, यह एक अनंत समुच्चय हो सकता है । एक सातत्य या असीमित, उदा. $S_{i}=\{{\text{Price}}\}$ ऐसा है कि ${\text{Price}}$ एक गैर-ऋणात्मक वास्तविक संख्या है। नैश के अस्तित्व प्रमाण एक सीमित रणनीति समुच्चय मानते हैं, किन्तु नैश संतुलन की अवधारणा को इसकी आवश्यकता नहीं है।

नैश संतुलन कभी-कभी तीसरे व्यक्ति के परिप्रेक्ष्य में गैर-तर्कसंगत दिखाई दे सकता है। ऐसा इसलिए है क्योंकि नैश संतुलन आवश्यक रूप से परेटो दक्षता नहीं है।

नैश संतुलन के अनुक्रमिक खेल में गैर-तर्कसंगत परिणाम भी हो सकते हैं । क्योंकि खिलाड़ी एक-दूसरे को उन खतरों से धमका सकते हैं जो वे वास्तव में नहीं करेंगे। ऐसे खेलों के लिए सबखेल परफेक्ट नैश इक्विलिब्रियम विश्लेषण के उपकरण के रूप में अधिक अर्थपूर्ण हो सकता है।

सख्त/अशक्त संतुलन

मान लीजिए कि नैश संतुलन में, प्रत्येक खिलाड़ी खुद से पूछता है । अन्य खिलाड़ियों की रणनीतियों को जानना, और अन्य खिलाड़ियों की रणनीतियों को पत्थर की तरह समझना, क्या मुझे अपनी रणनीति बदलने से हानि होगा?

यदि प्रत्येक खिलाड़ी का उत्तर हां है, तो संतुलन को सख्त नैश संतुलन के रूप में वर्गीकृत किया जाता है।^[15] यदि इसके अतिरिक्त, किसी खिलाड़ी के लिए, नैश संतुलन में रणनीति और कुछ अन्य रणनीति के बीच स्पष्ट समानता है । जो बिल्कुल समान भुगतान देती है (अर्थात यह खिलाड़ी स्विचिंग और नहीं के बीच उदासीन है), तो संतुलन को अशक्त नैश संतुलन के रूप में वर्गीकृत किया जाता है।

एक खेल में एक शुद्ध रणनीति हो सकती है | शुद्ध-रणनीति या एक मिश्रित रणनीति नैश संतुलन (उत्तरार्द्ध में एक निश्चित संभावना के साथ एक शुद्ध रणनीति को यादृच्छिक रूप से चुना जाता है)।

नैश का अस्तित्व प्रमेय

नैश ने सिद्ध किया कि यदि रणनीति (खेल सिद्धांत) शुद्ध और मिश्रित रणनीतियां (जहां एक खिलाड़ी विभिन्न शुद्ध रणनीतियों का उपयोग करने की संभावनाओं को चुनता है) की अनुमति दी जाती है, तो खिलाड़ियों की एक सीमित संख्या वाले प्रत्येक खेल जिसमें प्रत्येक खिलाड़ी निश्चित रूप से कई शुद्ध रणनीतियों में से चुन सकता है कम से कम एक नैश संतुलन, जो प्रत्येक खिलाड़ी के लिए एक शुद्ध रणनीति हो सकती है या प्रत्येक खिलाड़ी के लिए रणनीतियों पर संभाव्यता वितरण हो सकता है।

यदि विकल्पों का समुच्चय अनंत और गैर-कॉम्पैक्ट है तो नैश संतुलन उपस्थित नहीं है। एक उदाहरण एक खेल है । जहां दो खिलाड़ी एक साथ एक संख्या का नाम लेते हैं और बड़ी संख्या का नाम रखने वाला खिलाड़ी जीत जाता है। एक और उदाहरण है जहां दो खिलाड़ियों में से प्रत्येक 5 से कम वास्तविक संख्या चुनता है और विजेता वह होता है जिसके पास सबसे बड़ी संख्या होती है । 5 से कम कोई भी सबसे बड़ी संख्या उपस्थित नहीं है (यदि संख्या 5 के समान हो सकती है, तो नैश संतुलन में दोनों खिलाड़ी 5 का चयन करेंगे और खेल को बांधेंगे)। चूँकि, एक नैश संतुलन उपस्थित है यदि विकल्पों का समुच्चय सभी खिलाड़ियों की रणनीतियों में निरंतर प्रत्येक खिलाड़ी के भुगतान के साथ कॉम्पैक्ट स्थान है।^[16]

उदाहरण

समन्वय खेल

खिलाड़ी 1 (पंक्ति) \ खिलाड़ी 2 (स्तंभ) के लिए अदायगी दिखाने वाला समन्वय खेल
खिलाड़ी 1 रणनीति	खिलाड़ी 2 रणनीति
खिलाड़ी 1 रणनीति	खिलाड़ी 2 रणनीति A को अपनाता है	प्लेयर 2 रणनीति बी को अपनाता है
खिलाड़ी 1 रणनीति A को अपनाता है	4 4	3 1
खिलाड़ी 1 रणनीति बी को अपनाता है	1 3	2 2

समन्वय खेल एक क्लासिक दो-खिलाड़ी, दो-रणनीति (खेल सिद्धांत) खेल है, जैसा कि उदाहरण में दाईं ओर पेआफ आव्युह में दिखाया गया है। दो शुद्ध-रणनीति संतुलन हैं, (A, A) प्रत्येक खिलाड़ी के लिए भुगतान 4 के साथ और (B, B) प्रत्येक के लिए भुगतान 2 के साथ। संयोजन (B, B) एक नैश संतुलन है क्योंकि यदि कोई खिलाड़ी एकतरफा अपनी रणनीति को B से A में बदलता है, तो उसका भुगतान 2 से 1 तक गिर जाएगा।

द स्टैग हंट
खिलाड़ी 1 रणनीति	खिलाड़ी 2 रणनीति
खिलाड़ी 1 रणनीति	स्टैग हंट	हंट रैबिट
स्टैग हंट	2 2	1 0
हंट रैबिट	0 1	1 1

समन्वय खेल का एक प्रसिद्ध उदाहरण हरिण का शिकार है। दो खिलाड़ी खरगोश (1 उपयोगिता इकाई) की तुलना में अधिक मांस (4 उपयोगिता इकाइयां, प्रत्येक खिलाड़ी के लिए 2) प्रदान करने वाले हरिण या खरगोश का शिकार करना चुन सकते हैं। चेतावनी यह है कि हरिण को सहकारी रूप से शिकार किया जाना चाहिए, इसलिए यदि एक खिलाड़ी हरिण का शिकार करने का प्रयास करता है । जबकि दूसरा खरगोश का शिकार करता है, तो हरिण शिकारी पूरी तरह से विफल हो जाएगा, 0 के भुगतान के लिए, जबकि खरगोश-शिकारी सफल होगा, के लिए 1 का भुगतान खेल में दो संतुलन होते हैं, (स्टैग, स्टैग) और (खरगोश, खरगोश), क्योंकि एक खिलाड़ी की इष्टतम रणनीति उसकी अपेक्षा पर निर्भर करती है कि दूसरा खिलाड़ी क्या करेगा यदि एक शिकारी को विश्वास हो कि दूसरा हरिण का शिकार करेगा, तो उसे हरिण का शिकार करना चाहिए । चूँकि यदि वह सोचता है कि दूसरा खरगोश का शिकार करेगा, तो वह भी खरगोश का शिकार करेगा इस खेल का उपयोग सामाजिक सहयोग के लिए एक सादृश्य के रूप में किया जाता है, क्योंकि समाज में लोगों को जो लाभ मिलता है । वह सहयोग करने वाले लोगों पर निर्भर करता है और सहयोग के अनुरूप कार्य करने के लिए एक-दूसरे पर भरोसा करता है।

एक आने वाली कार के खिलाफ सड़क पर ड्राइविंग करना, और या तो बायीं ओर मुड़ना है या सड़क के दायीं ओर मुड़ना है, यह भी एक समन्वय खेल है। उदाहरण के लिए, पेआफ के साथ 10 का अर्थ कोई दुर्घटना नहीं है और 0 का अर्थ दुर्घटना है, समन्वय खेल को निम्नलिखित पेआफ आव्युह के साथ परिभाषित किया जा सकता है ।

ड्राइविंग खेल
खिलाड़ी 1 रणनीति	खिलाड़ी 2 रणनीति
खिलाड़ी 1 रणनीति	बाईं ओर परिचालित करें	दाईं ओर ड्राइव करें
बाईं ओर परिचालित करें	10 10	0 0
दाईं ओर ड्राइव करें	0 0	10 10

इस स्थिति में दो शुद्ध-रणनीति नैश संतुलन हैं, जब दोनों बाईं ओर या दाईं ओर ड्राइव करना चुनते हैं। यदि हम मिश्रित रणनीति को स्वीकार करते हैं (जहां एक निश्चित संभावना के अधीन एक शुद्ध रणनीति को यादृच्छिक रूप से चुना जाता है), तो एक ही स्थिति के लिए तीन नैश संतुलन हैं: दो हमने शुद्ध-रणनीति के रूप में देखे हैं, जहां संभावनाएं हैं (0) पहले खिलाड़ी के लिए %, 100%), दूसरे खिलाड़ी के लिए (0%, 100%); और (100%, 0%) खिलाड़ी एक के लिए, (100%, 0%) खिलाड़ी दो के लिए क्रमशः। हम एक और जोड़ते हैं जहां प्रत्येक खिलाड़ी की संभावनाएं (50%, 50%) हैं।

नेटवर्क ट्रैफ़िक

नमूना नेटवर्क ग्राफ। किनारों पर मान उस किनारे से नीचे की ओर यात्रा करने वाली कार द्वारा अनुभव किया गया यात्रा समय है।

x

उस किनारे से यात्रा करने वाली कारों की संख्या है।

नैश संतुलन का एक अनुप्रयोग एक नेटवर्क में यातायात के अपेक्षित प्रवाह को निर्धारित करने में है। दाईं ओर दिए गए ग्राफ़ पर विचार करें। यदि हम मान लें कि हैं $x$ से यात्रा करने वाली कारें $A$ को $D$ , नेटवर्क में ट्रैफ़िक का अपेक्षित वितरण क्या है?

इस स्थिति को एक खेल सिद्धांत के रूप में प्रतिरूपित किया जा सकता है, जहां प्रत्येक यात्री के पास 3 रणनीतियों का विकल्प होता है और जहां प्रत्येक रणनीति एक मार्ग है । $A$ को $D$ (में से एक $ABD$ , $ABCD$ , या $ACD$ ). प्रत्येक रणनीति का भुगतान प्रत्येक मार्ग का यात्रा समय है। दाईं ओर ग्राफ में, एक कार यात्रा कर रही है $ABD$ यात्रा के समय का अनुभव करता है $1+{\frac {x}{100}}+2$ , जहाँ $x$ किनारे पर यात्रा करने वाली कारों की संख्या है $AB$ . इस प्रकार, किसी भी रणनीति के लिए पेआफ अन्य खिलाड़ियों की पसंद पर निर्भर करती है, जैसा कि सदैव होता है। चूँकि, इस स्थिति में, लक्ष्य यात्रा के समय को कम करना है, इसे अधिकतम नहीं करना है। संतुलन तब होगा जब सभी रास्तों पर समय बिल्कुल समान होगा। जब ऐसा होता है, तो किसी एक चालक के पास मार्ग बदलने के लिए कोई प्रोत्साहन नहीं होता है, क्योंकि यह केवल उनके यात्रा के समय को बढ़ा सकता है। दाईं ओर ग्राफ के लिए, उदाहरण के लिए, यदि 100 कारें यात्रा कर रही हैं $A$ को $D$ , तो संतुलन तब होगा जब 25 ड्राइवर यात्रा करेंगे $ABD$ , 50 वाया $ABCD$ , और 25 के माध्यम से $ACD$ . प्रत्येक चालक के पास अब कुल यात्रा समय 3.75 है (इसे देखने के लिए, ध्यान दें कि कुल 75 कारें समय लेती हैं $AB$ बढ़त, और इसी तरह, 75 कारें लेती हैं $CD$ किनारा)। ध्यान दें कि यह वितरण वास्तव में सामाजिक रूप से इष्टतम नहीं है। यदि 100 कारों ने सहमति व्यक्त की कि 50 के माध्यम से यात्रा करें $ABD$ और अन्य 50 के माध्यम से $ACD$ , तो किसी एक कार के लिए यात्रा समय वास्तव में 3.5 होगा, जो 3.75 से कम है। यह नैश संतुलन भी है यदि बीच का रास्ता $B$ और $C$ को हटा दिया जाता है, जिसका अर्थ है कि एक और संभावित मार्ग जोड़ने से प्रणाली की दक्षता कम हो सकती है, इस घटना को ब्रेस के विरोधाभास के रूप में जाना जाता है।

प्रतियोगिता खेल

प्रतियोगिता का एक खेल
खिलाड़ी 1 रणनीति	खिलाड़ी 2 रणनीति
खिलाड़ी 1 रणनीति	चयन "0"	चयन "1"	चयन "2"	चयन "3"
चयन "0"	0, 0	2, −2	2, −2	2, −2
चयन "1"	−2, 2	1, 1	3, −1	3, −1
चयन "2"	−2, 2	−1, 3	2, 2	4, 0
चयन "3"	−2, 2	−1, 3	0, 4	3, 3

इसे दो-खिलाड़ियों के खेल द्वारा चित्रित किया जा सकता है जिसमें दोनों खिलाड़ी एक साथ 0 से 3 तक एक पूर्णांक चुनते हैं और वे दोनों अंक में दो संख्याओं में से छोटे को जीतते हैं। इसके अतिरिक्त, यदि एक खिलाड़ी दूसरे की तुलना में बड़ी संख्या चुनता है, तो उसे दूसरे को दो अंक देने होंगे।

इस खेल में एक अद्वितीय शुद्ध-रणनीति नैश संतुलन है: दोनों खिलाड़ी 0 चुनते हैं (हल्के लाल रंग में हाइलाइट किया गया)। किसी खिलाड़ी द्वारा दूसरे खिलाड़ी की तुलना में अपनी संख्या को एक से कम पर स्विच करके किसी भी अन्य रणनीति में सुधार किया जा सकता है। बगल की तालिका में, यदि खेल हरे वर्ग से प्रारंभ होता है, तो बैंगनी वर्ग में जाने के लिए खिलाड़ी 1 के हित में है और नीले वर्ग में जाने के लिए खिलाड़ी 2 के हित में है। चूँकि यह एक प्रतियोगिता खेल की परिभाषा में फिट नहीं होगा, यदि खेल को संशोधित किया जाता है जिससे दो खिलाड़ी नामांकित राशि जीत सकें यदि वे दोनों एक ही नंबर चुनते हैं, और अन्यथा कुछ भी नहीं जीतते हैं, तो 4 (0,0) ), (1,1), (2,2), और (3,3) नैश संतुलन हैं।

पेआफ आव्युह में नैश संतुलन

पेआफ आव्युह पर नैश संतुलन की पहचान करने का एक सरल संख्यात्मक विधि है। यह दो-व्यक्ति खेलों में विशेष रूप से सहायक होता है जहाँ खिलाड़ियों के पास दो से अधिक रणनीतियाँ होती हैं। इस स्थिति में औपचारिक विश्लेषण बहुत लंबा हो सकता है। यह नियम उस स्थिति पर प्रयुक्त नहीं होता है जहां मिश्रित (स्टोकेस्टिक) रणनीतियाँ रुचिकर हों। नियम इस प्रकार है: यदि पहली पेआफ संख्या, सेल के पेआफ जोड़ी में, सेल के कॉलम का अधिकतम है और यदि दूसरी संख्या सेल की पंक्ति की अधिकतम है - तो सेल एक नैश का प्रतिनिधित्व करता है।

एक अदायगी मैट्रिक्स - नैश संतुलन बोल्ड में
खिलाड़ी 1 रणनीति	खिलाड़ी 2 रणनीति
खिलाड़ी 1 रणनीति	विकल्प A	विकल्प B	विकल्प C
विकल्प A	0, 0	25, 40	5, 10
विकल्प B	40, 25	0, 0	5, 15
विकल्प C	10, 5	15, 5	10, 10

हम इस नियम को 3×3 आव्युह पर प्रयुक्त कर सकते हैं:

नियम का उपयोग करके, हम बहुत जल्दी (औपचारिक विश्लेषण की तुलना में बहुत तेज) देख सकते हैं कि नैश संतुलन कोशिकाएं (B, A), (A, B), और (C, C) हैं। दरअसल, सेल (B, A) के लिए, 40 पहले कॉलम का अधिकतम है और 25 दूसरी पंक्ति का अधिकतम है। (A, B) के लिए, 25 दूसरे कॉलम का अधिकतम है और 40 पहली पंक्ति का अधिकतम है; सेल (C, C) के लिए भी यही प्रयुक्त होता है। अन्य कक्षों के लिए, या तो एक या दोनों डुप्लेट सदस्य संबंधित पंक्तियों और स्तंभों के अधिकतम नहीं होते हैं।

इसने कहा, संतुलन कोशिकाओं को खोजने का वास्तविक यांत्रिकी स्पष्ट है: अधिकतम कॉलम खोजें और जांचें कि जोड़ी का दूसरा सदस्य पंक्ति का अधिकतम है या नहीं। यदि ये नियमें पूरी होती हैं, तो सेल नैश संतुलन का प्रतिनिधित्व करता है। सभी NE कक्षों को खोजने के लिए सभी स्तंभों की इस तरह जाँच करें। एक N×N आव्युह में 0 और N×N के बीच शुद्ध रणनीति हो सकती है।

स्थिरता

कई प्रकार के संतुलनों के विश्लेषण में उपयोगी स्थिरता सिद्धांत की अवधारणा को नैश संतुलनों पर भी प्रयुक्त किया जा सकता है।

एक मिश्रित-रणनीति खेल के लिए नैश संतुलन स्थिर होता है यदि एक खिलाड़ी के लिए संभावनाओं में एक छोटा परिवर्तन (विशेष रूप से, एक अतिसूक्ष्म परिवर्तन) ऐसी स्थिति की ओर ले जाता है जहां दो स्थितियाँ होती हैं:

जो खिलाड़ी नहीं बदला उसके पास नई परिस्थिति में कोई उत्तम रणनीति नहीं है
जिस खिलाड़ी ने बदलाव किया था, वह अब सख्त बदतर रणनीति के साथ खेल रहा है।

यदि ये दोनों स्थिति मिलते हैं, तो उनकी मिश्रित रणनीति में छोटे बदलाव वाला खिलाड़ी तुरंत नैश संतुलन में वापस आ जाएगा। संतुलन स्थिर कहा जाता है। यदि नियम एक नहीं है तो संतुलन अस्थिर है। यदि केवल एक नियम है तो बदलने वाले खिलाड़ी के लिए अनंत संख्या में इष्टतम रणनीतियाँ होने की संभावना है।

ऊपर दिए गए ड्राइविंग खेल के उदाहरण में स्थिर और अस्थिर संतुलन दोनों हैं। 100% संभावनाओं के साथ मिश्रित रणनीतियों वाला संतुलन स्थिर है। यदि कोई भी खिलाड़ी अपनी संभावनाओं को थोड़ा बदल देता है, तो वे दोनों हानि में होंगे, और उनके प्रतिद्वंद्वी के पास बदले में अपनी रणनीति बदलने का कोई कारण नहीं होगा। (50%, 50%) संतुलन अस्थिर है। यदि कोई भी खिलाड़ी अपनी संभावनाओं को बदलता है (जिससे परिवर्तन करने वाले खिलाड़ी के अपेक्षित मूल्य को न तो लाभ होगा और न ही हानि होगा, यदि दूसरे खिलाड़ी की मिश्रित रणनीति अभी भी (50%, 50%) है), तो दूसरे खिलाड़ी के पास तुरंत उत्तम रणनीति होगी या तो (0%, 100%) या (100%, 0%) पर है।

नैश संतुलन के व्यावहारिक अनुप्रयोगों में स्थिरता महत्वपूर्ण है, क्योंकि प्रत्येक खिलाड़ी की मिश्रित रणनीति पूरी तरह से ज्ञात नहीं है, किन्तु खेल में उनके कार्यों के सांख्यिकीय वितरण से अनुमान लगाया जाना है। इस स्थिति में अस्थिर संतुलन व्यवहार में उत्पन्न होने की बहुत संभावना नहीं है, क्योंकि देखी गई प्रत्येक रणनीति के अनुपात में किसी भी मिनट के बदलाव से रणनीति में बदलाव और संतुलन का टूटना होता है।

नैश संतुलन केवल एकतरफा विचलन के संदर्भ में स्थिरता को परिभाषित करता है। सहकारी खेलों में ऐसी अवधारणा पर्याप्त रूप से आश्वस्त करने वाली नहीं है। शक्तिशाली नैश संतुलन हर बोधगम्य गठबंधन द्वारा विचलन की अनुमति देता है।^[17] औपचारिक रूप से, एक शक्तिशाली नैश संतुलन एक नैश संतुलन है जिसमें कोई भी गठबंधन, इसके पूरक के कार्यों को दिए गए रूप में लेते हुए, सहकारी रूप से विचलित नहीं हो सकता है जो इसके सभी सदस्यों को लाभान्वित करता है।^[18] चूँकि, शक्तिशाली नैश अवधारणा को कभी-कभी बहुत शक्तिशाली माना जाता है क्योंकि पर्यावरण असीमित निजी संचार की अनुमति देता है। वास्तव में, शक्तिशाली नैश संतुलन पारेतो कुशल होना चाहिए। इन आवश्यकताओं के परिणामस्वरूप, खेल सिद्धांत की कई शाखाओं में उपयोगी होने के लिए शक्तिशाली नैश बहुत दुर्लभ है। चूँकि, संभावित परिणामों की तुलना में कई अधिक खिलाड़ियों वाले चुनाव जैसे खेलों में, यह एक स्थिर संतुलन की तुलना में अधिक सामान्य हो सकता है।

गठबंधन प्रूफ नैश संतुलन (सीपीएनई) के रूप में जाना जाने वाला परिष्कृत नैश संतुलन ^[17] तब होता है जब खिलाड़ी उत्तम नहीं कर सकते हैं तथापि उन्हें संवाद करने और विचलित करने के लिए आत्म-प्रवर्तन समझौता करने की अनुमति हो। प्रभुत्व (खेल सिद्धांत) और परेटो सीमा द्वारा समर्थित हर सहसंबद्ध रणनीति एक सीपीएनई है।^[19] इसके अतिरिक्त, एक खेल के लिए नैश संतुलन होना संभव है जो एक निर्दिष्ट आकार, k से कम गठबंधन के खिलाफ लचीला है। सीपीएनई कोर (अर्थशास्त्र) से संबंधित है।

अंत में अस्सी के दशक में, इस तरह के विचारों पर बड़ी गहराई के साथ मेर्टेंस-स्थिर संतुलन को एक समाधान अवधारणा के रूप में प्रस्तुत किया गया। मेर्टेंस का स्थिर संतुलन फॉरवर्ड इंडक्शन और पीछे की ओर प्रेरण दोनों को संतुष्ट करता है। एक खेल सिद्धांत के संदर्भ में स्थिर संतुलन अब सामान्यतः मेर्टेंस स्थिर संतुलन को संदर्भित करता है।

घटना

यदि किसी खेल में अद्वितीय (गणित) नैश संतुलन है और कुछ नियमो के अनुसार खिलाड़ियों के बीच खेला जाता है, तो NE रणनीति समुच्चय को अपनाया जाएगा। यह गारंT देने के लिए पर्याप्त नियमें हैं कि नैश संतुलन खेला जाता है:

सभी खिलाड़ी खेल द्वारा बताए अनुसार अपने अपेक्षित भुगतान को अधिकतम करने के लिए भरसक प्रयास करता है।
खिलाड़ी निष्पादन में निर्दोष हैं।
खिलाड़ियों के पास समाधान निकालने के लिए पर्याप्त बुद्धि है।
खिलाड़ी अन्य सभी खिलाड़ियों की नियोजित संतुलन रणनीति को जानते हैं।
खिलाड़ियों का मानना है कि उनकी अपनी रणनीति में विचलन किसी अन्य खिलाड़ी द्वारा विचलन का कारण नहीं बनेगा।
सामान्य ज्ञान (तर्क) है कि सभी खिलाड़ी इन नियमो को पूरा करते हैं, इसमें यह भी सम्मिलित है। इसलिए, प्रत्येक खिलाड़ी को न केवल यह जानना चाहिए कि अन्य खिलाड़ी नियमो को पूरा करते हैं, किन्तु उन्हें यह भी पता होना चाहिए कि वे सभी जानते हैं कि वे उनसे मिलते हैं, और जानते हैं कि वे जानते हैं कि वे जानते हैं कि वे उनसे मिलते हैं ॥

जहां नियमें पूरी नहीं होती हैं

खेल सिद्धांत समस्याओं के उदाहरण जिनमें ये नियमें पूरी नहीं होती हैं:

पहली नियम पूरी नहीं होती है यदि खेल सही ढंग से उन मात्राओं का वर्णन नहीं करता है जो खिलाड़ी अधिकतम करना चाहता है। इस स्थिति में उस खिलाड़ी के लिए संतुलन की रणनीति अपनाने का कोई विशेष कारण नहीं है। उदाहरण के लिए, प्रिजनर की दुविधा कोई दुविधा नहीं है यदि कोई भी खिलाड़ी अनिश्चित काल के लिए जेल जाने से खुश है।
निष्पादन में जानबूझकर या आकस्मिक अपूर्णता। उदाहरण के लिए, एक दूसरे दोषरहित कंप्यूटर का सामना करने में दोषरहित तार्किक खेल में सक्षम कंप्यूटर का परिणाम संतुलन होगा। अपूर्णता का परिचय या तो गलती करने वाले खिलाड़ी को हानि के माध्यम से, या सामान्य ज्ञान (तर्क) मानदंड की उपेक्षा के माध्यम से खिलाड़ी के लिए संभावित जीत की ओर जाता है। (एक उदाहरण चिकन के खेल में अचानक कार को रिवर्स में डालने वाला एक खिलाड़ी होगा, जो नो-लॉस नो-विन परिदृश्य सुनिश्चित करता है)।
कई स्थितियों में, तीसरी नियम पूरी नहीं होती है, तथापि संतुलन उपस्थित होना चाहिए, यह खेल की जटिलता के कारण अज्ञात है, उदाहरण के लिए चीनी शतरंज में।^[20] या, यदि ज्ञात हो, तो यह सभी खिलाड़ियों को ज्ञात नहीं हो सकता है, जैसे कि एक छोटे बच्चे के साथ टिक Tएसी को पैर की अंगुली खेलते समय जो जीतना चाहता है (अन्य मानदंडों को पूरा करना)।
सामान्य ज्ञान की कसौT पूरी नहीं हो सकती है, तथापि सभी खिलाड़ी वास्तव में अन्य सभी मानदंडों को पूरा करते हों। खिलाड़ी गलत तरीके से एक-दूसरे की तर्कसंगतता पर अविश्वास करते हुए अपने विरोधियों की ओर से अपेक्षित तर्कहीन खेल के प्रति-रणनीतियों को अपना सकते हैं। उदाहरण के लिए चिकन के खेल या हथियारों की दौड़ में यह एक प्रमुख विचार है।

जहां नियमें पूरी होती हैं

उनकी पीH.D. निबंध, जॉन नैश ने अपनी संतुलन अवधारणा की दो व्याख्याओं का प्रस्ताव दिया, यह दिखाने के उद्देश्य से कि कैसे संतुलन बिंदुओं को अवलोकन योग्य घटना से जोड़ा जा सकता है।

(...) एक व्याख्या तर्कसंगत है: यदि हम मानते हैं कि खिलाड़ी तर्कसंगत हैं, खेल की पूरी संरचना को जानते हैं, खेल सिर्फ एक बार खेला जाता है, और केवल एक नैश संतुलन है, तो खिलाड़ी उसी के अनुसार खेलेंगे संतुलन।

इस विचार को आर. ऑमन और ए. ब्रैंडनबर्गर, 1995, एपिस्टेमिक कंडीशंस फॉर नैश इक्विलिब्रियम, इकोनोमेट्रिका, 63, 1161-1180 द्वारा औपचारिक रूप दिया गया, जिन्होंने प्रत्येक खिलाड़ी की मिश्रित रणनीति को अन्य खिलाड़ियों के व्यवहार के बारे में एक अनुमान के रूप में व्याख्यायित किया और दिखाया कि यदि खेल और खिलाड़ियों की तर्कसंगतता परस्पर ज्ञात है और ये अनुमान सामान्यतः ज्ञात हैं, तो अनुमान एक नैश संतुलन होना चाहिए (सामान्य रूप से इस परिणाम के लिए एक सामान्य पूर्व धारणा की आवश्यकता होती है । किन्तु दो खिलाड़ियों के स्थिति में नहीं। इस स्थिति में, अनुमानों को केवल परस्पर ज्ञात होना चाहिए)।

एक दूसरी व्याख्या, जिसे नैश ने सामूहिक कार्रवाई व्याख्या द्वारा संदर्भित किया है, खिलाड़ियों पर कम मांग है:

[i] यह मानना अनावश्यक है कि प्रतिभागियों को खेल की कुल संरचना, या किसी भी जटिल तर्क प्रक्रिया से निकलने की क्षमता और झुकाव का पूरा ज्ञान है। क्या माना जाता है कि खेल में प्रत्येक स्थिति के लिए प्रतिभागियों की आबादी है, जो अलग-अलग आबादी से यादृच्छिक रूप से खींचे गए प्रतिभागियों द्वारा पूरे समय खेली जाएगी। यदि एक स्थिर औसत आवृत्ति है जिसके साथ प्रत्येक शुद्ध रणनीति उपयुक्त जनसंख्या के औसत सदस्य द्वारा नियोजित की जाती है, तो यह स्थिर औसत आवृत्ति एक मिश्रित रणनीति नैश संतुलन बनाती है।

इन पंक्तियों के साथ एक औपचारिक परिणाम के लिए, देखें कुह्न, H. और अन्य, 1996, द वर्क ऑफ़ जॉन नैश इन खेल सिद्धांत, जर्नल ऑफ़ इकोनॉमिक सिद्धांत, 69, 153-185 है।

सीमित स्थितियों के कारण जिनमें एनई वास्तव में देखा जा सकता है । उन्हें संभवतः ही कभी दिन-प्रतिदिन के व्यवहार के लिए एक मार्गदर्शक के रूप में माना जाता है, या मानव वार्ताओं में अभ्यास में देखा जाता है। चूँकि, अर्थशास्त्र और विकासवादी जीव विज्ञान में एक सैद्धांतिक अवधारणा के रूप में, NE के पास व्याख्यात्मक शक्ति है। अर्थशास्त्र में पेआफ उपयोगिता (या कभी-कभी धन) है, और विकासवादी जीव विज्ञान में जीन संचरण है; दोनों अस्तित्व की मूलभूत निचली रेखा हैं। इन क्षेत्रों में खेल सिद्धांत प्रयुक्त करने वाले शोधकर्ताओं का प्रमाणित है कि किसी भी कारण से इन्हें अधिकतम करने में विफल रहने वाली रणनीतियों का बाजार या पर्यावरण से मुकाबला किया जाएगा, जिन्हें सभी रणनीतियों का परीक्षण करने की क्षमता का श्रेय दिया जाता है। यह निष्कर्ष उपरोक्त नैश संतुलन स्थिरता सिद्धांत से लिया गया है। इन स्थितियों में धारणा है कि देखी गई रणनीति वास्तव में एक एनई है जो अधिकांशतः अनुसंधान द्वारा उत्पन्न की गई है।^[21]

एनई और गैर-विश्वसनीय खतरे

व्यापक और सामान्य रूप चित्रण जो एसपीएनई और अन्य एनई के बीच अंतर दिखाते हैं। नीला संतुलन सबखेल परफेक्ट नहीं है क्योंकि खिलाड़ी दो 2 (2) पर निर्दयी (यू) होने के लिए एक गैर-विश्वसनीय खतरा बनाता है।

नैश संतुलन उप खेल पूर्ण नैश संतुलन का सुपरसमुच्चय है। नैश संतुलन के अतिरिक्त सबखेल पूर्ण संतुलन के लिए आवश्यक है कि रणनीति भी उस खेल के प्रत्येक उपखेल में नैश संतुलन हो। यह सभी गैर-विश्वसनीय खतरों को समाप्त करता है, अर्थात ऐसी रणनीतियाँ जिनमें गैर-तर्कसंगत चालें होती हैं जिससे काउंटर-प्लेयर को अपनी रणनीति बदलने के लिए अशक्त किया जा सकता है।

दाईं ओर की छवि एक सरल अनुक्रमिक खेल दिखाती है जो सबखेल इम्परफेक्ट नैश इक्विलिब्रिया के साथ समस्या को दर्शाती है। इस खेल में खिलाड़ी बाएं (एल) या दाएं (आर) को चुनता है, जिसके बाद खिलाड़ी दो को खिलाड़ी एक के प्रति दयालु (के) या निर्दयी (यू) कहा जाता है, चूँकि, खिलाड़ी दो केवल होने से लाभ प्राप्त करने के लिए खड़ा होता है। निर्दयी यदि खिलाड़ी एक बाएं जाता है। यदि खिलाड़ी एक सही हो जाता है तो तर्कसंगत खिलाड़ी दो वास्तव में उस सबखेल में उसके प्रति दयालु होगा। चूँकि, 2(2) पर निर्दयी होने का गैर-विश्वसनीय खतरा अभी भी नीला (L, (U,U)) नैश संतुलन का हिस्सा है। इसलिए, यदि दोनों पक्षों द्वारा तर्कसंगत व्यवहार की उम्मीद की जा सकती है, तो ऐसी गतिशील असंगति उत्पन्न होने पर सबखेल परफेक्ट नैश संतुलन एक अधिक सार्थक समाधान अवधारणा हो सकती है।

अस्तित्व का प्रमाण

काकुटानी निश्चित-बिंदु प्रमेय का उपयोग करके प्रमाण नैश के मूल प्रमाण (उनकी थीसिस में) ने ब्रौवर के फिक्स्ड-पॉइंट प्रमेय का उपयोग किया (उदाहरण के लिए, एक संस्करण के लिए नीचे देखें)। नैश के 1950 के पेपर के बाद, हम काकुटानी फिक्स्ड-पॉइंट प्रमेय के माध्यम से एक सरल प्रमाण देते हैं (वह डेविड गेल को अवलोकन के साथ श्रेय देते हैं कि ऐसा सरलीकरण संभव है)।

नैश संतुलन के अस्तित्व को सिद्ध करने के लिए, आइए $r_{i}(\sigma _{-i})$ अन्य सभी खिलाड़ियों की रणनीतियों के लिए खिलाड़ी की सर्वश्रेष्ठ प्रतिक्रिया है।

r_{i}(\sigma _{-i})=\mathop {\underset {\sigma _{i}}{\operatorname {arg\,max} }} u_{i}(\sigma _{i},\sigma _{-i})

यहाँ, $\sigma \in \Sigma$ , जहाँ $\Sigma =\Sigma _{i}\times \Sigma _{-i}$ , सभी मिश्रित रणनीतियों के समुच्चय में एक मिश्रित-रणनीति प्रोफ़ाइल है और $u_{i}$ खिलाड़ी i के लिए पेआफ फलन है। एक समुच्चय-वैल्यू फलन को परिभाषित करें $r\colon \Sigma \rightarrow 2^{\Sigma }$ ऐसा है कि $r=r_{i}(\sigma _{-i})\times r_{-i}(\sigma _{i})$ . नैश संतुलन का अस्तित्व समान है । $r$ एक निश्चित बिंदु होता है।

काकुटानी का निश्चित बिंदु प्रमेय एक निश्चित बिंदु के अस्तित्व की गारंT देता है यदि निम्नलिखित चार नियमें पूरी होती हैं।

$\Sigma$ कॉम्पैक्ट, उत्तल और गैर-खाली है।
$r(\sigma )$ खाली नहीं है।
$r(\sigma )$ अर्ध निरंतरता है
$r(\sigma )$ उत्तल है।

नियम 1. इस तथ्य से संतुष्ट है कि $\Sigma$ एक सरल और इस प्रकार कॉम्पैक्ट है। उत्तलता खिलाड़ियों की रणनीतियों को मिलाने की क्षमता का अनुसरण करती है। $\Sigma$ जब तक खिलाड़ियों के पास रणनीतियाँ हैं, तब तक खाली नहीं है।

नियम 2. और 3. बर्ज के अधिकतम प्रमेय के माध्यम से संतुष्ट हैं। क्योंकि $u_{i}$ निरंतर और कॉम्पैक्ट है, $r(\sigma _{i})$ खाली नहीं है और अर्ध निरंतरता है।

नियम 4. मिश्रित रणनीतियों के परिणामस्वरूप संतुष्ट है। कल्पना करना $\sigma _{i},\sigma '_{i}\in r(\sigma _{-i})$ , तब $\lambda \sigma _{i}+(1-\lambda )\sigma '_{i}\in r(\sigma _{-i})$ . अर्थात यदि दो रणनीतियाँ भुगतान को अधिकतम करती हैं, तो दो रणनीतियों के बीच मिश्रण से समान भुगतान प्राप्त होता है।

इसलिए, इसमें एक निश्चित बिंदु उपस्थित है $r$ और नैश संतुलन ^[22] जब नैश ने 1949 में जॉन वॉन न्यूमैन को यह बात बताई, तो वॉन न्यूमैन ने प्रसिद्ध रूप से इसे इन शब्दों के साथ खारिज कर दिया, यह तुच्छ है, आप जानते हैं। यह सिर्फ एक निश्चित बिंदु प्रमेय है। (नसर, 1998, पृष्ठ 94 देखें।)

ब्रौवर फिक्स्ड-पॉइंट प्रमेय का उपयोग करके वैकल्पिक प्रमाण

हमारे पास एक खेल है $G=(N,A,u)$ जहाँ $N$ खिलाड़ियों की संख्या है और $A=A_{1}\times \cdots \times A_{N}$ खिलाड़ियों के लिए कार्रवाई समुच्चय है। सभी एक्शन समुच्चय $A_{i}$ परिमित हैं। माना $\Delta =\Delta _{1}\times \cdots \times \Delta _{N}$ खिलाड़ियों के लिए मिश्रित रणनीतियों के समुच्चय को निरूपित करें। की परिमितता $A_{i}$ s की कॉम्पैक्टनेस $\Delta$ सुनिश्चित करता है।

अब हम लाभ कार्यों को परिभाषित कर सकते हैं। मिश्रित रणनीति के लिए $\sigma \in \Delta$ , हम खिलाड़ी के लिए लाभ देते हैं । $i$ कार्रवाई पर $a\in A_{i}$ होता है ।

{\text{Gain}}_{i}(\sigma ,a)=\max\{0,u_{i}(a,\sigma _{-i})-u_{i}(\sigma _{i},\sigma _{-i})\}.

गेन फलन उस लाभ का प्रतिनिधित्व करता है जो एक खिलाड़ी को एकतरफा रूप से अपनी रणनीति बदलने से मिलता है। अब हम परिभाषित करते हैं । $g=(g_{1},\dotsc ,g_{N})$ जहाँ

g_{i}(\sigma )(a)=\sigma _{i}(a)+{\text{Gain}}_{i}(\sigma ,a)

$\sigma \in \Delta ,a\in A_{i}$ के लिए हमने देखा कि

\sum _{a\in A_{i}}g_{i}(\sigma )(a)=\sum _{a\in A_{i}}\sigma _{i}(a)+{\text{Gain}}_{i}(\sigma ,a)=1+\sum _{a\in A_{i}}{\text{Gain}}_{i}(\sigma ,a)>0.

अगला हम परिभाषित करते हैं ।

{\begin{cases}f=(f_{1},\cdots ,f_{N}):\Delta \to \Delta \\f_{i}(\sigma )(a)={\frac {g_{i}(\sigma )(a)}{\sum _{b\in A_{i}}g_{i}(\sigma )(b)}}&a\in A_{i}\end{cases}}

यह देखना सरल है कि प्रत्येक $f_{i}$ में एक वैध मिश्रित रणनीति है । यह जांचना $\Delta _{i}$ भी सरल है कि प्रत्येक $f_{i}$ का एक सतत कार्य $\sigma$ है , और इसलिए $f$ एक सतत कार्य है। कॉम्पैक्ट उत्तल समुच्चयों की एक परिमित संख्या के क्रॉस उत्पाद के रूप में, $\Delta$ सघन और उत्तल भी है। ब्राउवर निश्चित बिंदु प्रमेय को प्रयुक्त करना $f$ और $\Delta$ हम यह निष्कर्ष निकालते हैं । $f$ में एक निश्चित बिंदु $\Delta$ है , इसे कहते $\sigma ^{*}$ हैं । हम यह प्रमाणित $\sigma ^{*}$ करते हैं । $G$ में नैश संतुलन है । इस उद्देश्य के लिए, यह दिखाने के लिए पर्याप्त है ।

\forall i\in \{1,\cdots ,N\},\forall a\in A_{i}:\quad {\text{Gain}}_{i}(\sigma ^{*},a)=0.

यह केवल यह बताता है कि प्रत्येक खिलाड़ी को अपनी रणनीति को एकतरफा रूप से बदलने से कोई लाभ नहीं होता है, जो कि नैश संतुलन के लिए बिल्कुल आवश्यक नियम है।

अब मान लीजिए कि सभी लाभ शून्य नहीं हैं। इसलिए, $\exists i\in \{1,\cdots ,N\},$ और $a\in A_{i}$ ऐसा है कि ${\text{Gain}}_{i}(\sigma ^{*},a)>0$ . तो ध्यान दें

\sum _{a\in A_{i}}g_{i}(\sigma ^{*},a)=1+\sum _{a\in A_{i}}{\text{Gain}}_{i}(\sigma ^{*},a)>1.

तो माना

C=\sum _{a\in A_{i}}g_{i}(\sigma ^{*},a).

साथ ही हम निरूपित करेंगे ${\text{Gain}}(i,\cdot )$ क्रियाओं द्वारा अनुक्रमित लाभ सदिश के रूप में $A_{i}$ . तब से $\sigma ^{*}$ हमारे पास निश्चित बिंदु है:

{\begin{aligned}\sigma ^{*}=f(\sigma ^{*})&\Rightarrow \sigma _{i}^{*}=f_{i}(\sigma ^{*})\\&\Rightarrow \sigma _{i}^{*}={\frac {g_{i}(\sigma ^{*})}{\sum _{a\in A_{i}}g_{i}(\sigma ^{*})(a)}}\\[6pt]&\Rightarrow \sigma _{i}^{*}={\frac {1}{C}}\left(\sigma _{i}^{*}+{\text{Gain}}_{i}(\sigma ^{*},\cdot )\right)\\[6pt]&\Rightarrow C\sigma _{i}^{*}=\sigma _{i}^{*}+{\text{Gain}}_{i}(\sigma ^{*},\cdot )\\&\Rightarrow \left(C-1\right)\sigma _{i}^{*}={\text{Gain}}_{i}(\sigma ^{*},\cdot )\\&\Rightarrow \sigma _{i}^{*}=\left({\frac {1}{C-1}}\right){\text{Gain}}_{i}(\sigma ^{*},\cdot ).\end{aligned}}

तब से $C>1$ हमारे पास वह है $\sigma _{i}^{*}$ सदिश का कुछ सकारात्मक स्केलिंग है । ${\text{Gain}}_{i}(\sigma ^{*},\cdot )$ . अब हम यह प्रमाणित करते हैं

\forall a\in A_{i}:\quad \sigma _{i}^{*}(a)(u_{i}(a_{i},\sigma _{-i}^{*})-u_{i}(\sigma _{i}^{*},\sigma _{-i}^{*}))=\sigma _{i}^{*}(a){\text{Gain}}_{i}(\sigma ^{*},a)

इसे देखने के लिए, हम पहले ध्यान दें कि यदि ${\text{Gain}}_{i}(\sigma ^{*},a)>0$ तो यह लाभ फलन की परिभाषा के अनुसार सत्य है। अब मान लीजिए ${\text{Gain}}_{i}(\sigma ^{*},a)=0$ . हमारे पिछले कथनों से हमारे पास वह है ।

\sigma _{i}^{*}(a)=\left({\frac {1}{C-1}}\right){\text{Gain}}_{i}(\sigma ^{*},a)=0

और इसलिए बायां पद शून्य है, जिससे हमें यह पता चलता है कि संपूर्ण व्यंजक है ।

तो हमारे पास वह है ।

{\begin{aligned}0&=u_{i}(\sigma _{i}^{*},\sigma _{-i}^{*})-u_{i}(\sigma _{i}^{*},\sigma _{-i}^{*})\\&=\left(\sum _{a\in A_{i}}\sigma _{i}^{*}(a)u_{i}(a_{i},\sigma _{-i}^{*})\right)-u_{i}(\sigma _{i}^{*},\sigma _{-i}^{*})\\&=\sum _{a\in A_{i}}\sigma _{i}^{*}(a)(u_{i}(a_{i},\sigma _{-i}^{*})-u_{i}(\sigma _{i}^{*},\sigma _{-i}^{*}))\\&=\sum _{a\in A_{i}}\sigma _{i}^{*}(a){\text{Gain}}_{i}(\sigma ^{*},a)&&{\text{ by the previous statements }}\\&=\sum _{a\in A_{i}}\left(C-1\right)\sigma _{i}^{*}(a)^{2}>0\end{aligned}}

जहां $\sigma _{i}^{*}$ से आखिरी असमानता आती है । एक गैर-शून्य सदिश है। किन्तु यह एक स्पष्ट विरोधाभास है, इसलिए सभी लाभ वास्तव में शून्य होने चाहिए। इसलिए, $\sigma ^{*}$ के लिए नैश संतुलन $G$ जरुरत के अनुसार है।

कम्प्यूटिंग नैश संतुलन

यदि किसी खिलाड़ी A की प्रभावी रणनीति $s_{A}$ है तब एक नैश संतुलन उपस्थित होता है जिसमें A खेलता $s_{A}$ है । दो खिलाड़ियों A और B के स्थिति में, नैश संतुलन उपस्थित है जिसमें A खेलता है । $s_{A}$ और B के लिए सबसे अच्छी प्रतिक्रिया $s_{A}$ निभाता है । यदि $s_{A}$ एक सख्ती से प्रभावशाली रणनीति है । A खेलता है $s_{A}$ सभी नैश संतुलन में यदि A और B दोनों में सख्ती से प्रभावशाली रणनीतियां हैं, तो एक अद्वितीय नैश संतुलन उपस्थित है जिसमें प्रत्येक अपनी सख्ती से प्रभावी रणनीति खेलता है।

मिश्रित-रणनीति नैश इक्विलिब्रिया वाले खेलों में, किसी खिलाड़ी द्वारा किसी विशेष (इतनी शुद्ध) रणनीति को चुनने की संभावना की गणना प्रत्येक रणनीति के लिए एक चर निर्दिष्ट करके की जा सकती है जो उस रणनीति को चुनने के लिए एक निश्चित संभावना का प्रतिनिधित्व करता है। एक खिलाड़ी को यादृच्छिक करने के लिए तैयार होने के लिए, प्रत्येक (शुद्ध) रणनीति के लिए उनकी अपेक्षित पेआफ समान होनी चाहिए। इसके अतिरिक्त, किसी विशेष खिलाड़ी की प्रत्येक रणनीति के लिए संभावनाओं का योग 1 होना चाहिए। यह समीकरणों की एक प्रणाली बनाता है जिससे प्रत्येक रणनीति को चुनने की संभावनाएं प्राप्त की जा सकती हैं।^[14]

उदाहरण

मैचिंग पेनीज़
रणनीति	खिलाड़ी B, H खेलता है	खिलाड़ी B, T खेलता है
खिलाड़ी A, H खेलता है	−1, +1	+1, −1
खिलाड़ी A, T खेलता है	+1, −1	−1, +1

मैचिंग पेनीज़ खेल में, खिलाड़ी A, B से एक बिंदु खो देता है यदि A और B एक ही रणनीति खेलते हैं और यदि वे अलग-अलग रणनीतियाँ खेलते हैं तो B से एक अंक जीतता है। मिश्रित-रणनीति नैश संतुलन की गणना करने के लिए, A को प्रायिकता असाइन करें $p$ खेलने का H और $(1-p)$ T खेलने का, और B को प्रायिकता असाइन करें $q$ खेलने का H और $(1-q)$ T खेलने है ।

{\begin{aligned}&\mathbb {E} [{\text{payoff for A playing H}}]=(-1)q+(+1)(1-q)=1-2q\\&\mathbb {E} [{\text{payoff for A playing T}}]=(+1)q+(-1)(1-q)=2q-1\\&\mathbb {E} [{\text{payoff for A playing H}}]=\mathbb {E} [{\text{payoff for A playing T}}]\implies 1-2q=2q-1\implies q={\frac {1}{2}}\\&\mathbb {E} [{\text{payoff for B playing H}}]=(+1)p+(-1)(1-p)=2p-1\\&\mathbb {E} [{\text{payoff for B playing T}}]=(-1)p+(+1)(1-p)=1-2p\\&\mathbb {E} [{\text{payoff for B playing H}}]=\mathbb {E} [{\text{payoff for B playing T}}]\implies 2p-1=1-2p\implies p={\frac {1}{2}}\\\end{aligned}}

इस प्रकार, इस खेल में एक मिश्रित-रणनीति नैश संतुलन प्रत्येक खिलाड़ी के लिए H या T को यादृच्छिक $p={\frac {1}{2}}$ और $q={\frac {1}{2}}$ रूप से चुनने के लिए है ।

संतुलन बिंदुओं की विषमता

1971 में, रॉबर्ट विल्सन विषमता प्रमेय के साथ आए, ^[23] जो कहता है कि लगभग सभी परिमित खेलों में नैश संतुलन की परिमित और विषम संख्या होती है। 1993 में, हरसनी ने परिणाम का एक वैकल्पिक प्रमाण प्रकाशित किया।^[24] यहाँ लगभग सभी का कारण है कि अनंत या सम संख्या वाले संतुलन वाला कोई भी खेल इस अर्थ में बहुत खास है कि यदि इसके भुगतान को थोड़ा सा बेतरतीब ढंग से परेशान किया जाता है, तो प्रायिकता के साथ इसके अतिरिक्त विषम संख्या में संतुलन होगा।

फ्री मनी गेम
रणनीति	खिलाड़ी B हाँ वोट करता है	खिलाड़ी B वोट नं
खिलाड़ी A हाँ वोट करता है	1, 1	0, 0
खिलाड़ी A वोट नं	0, 0	0, 0

उदाहरण के लिए, प्रिजनर की दुविधा में एक संतुलन होता है, जबकि लिंगों की लड़ाई (खेल सिद्धांत) में तीन होते हैं - दो शुद्ध और एक मिश्रित, और यह सही रहता है, तथापि पेआफ थोड़ा बदल जाए। फ्री मनी खेल एक विशेष खेल का एक उदाहरण है जिसमें संतुलन की संख्या समान है। इसमें दो खिलाड़ियों को इनाम पाने के लिए ना की बजाय हां में वोट देना होता है और वोट एक साथ होते हैं। दो शुद्ध-रणनीति नैश संतुलन हैं, (हाँ, हाँ) और (नहीं, नहीं), और कोई मिश्रित रणनीति संतुलन नहीं है, क्योंकि रणनीति हाँ अशक्त रूप से नहीं पर हावी है। दूसरे खिलाड़ी के एक्शन की परवाह किए बिना हां उतना ही अच्छा है, किन्तु यदि कोई मौका है कि दूसरा खिलाड़ी हां चुनता है तो हां सबसे अच्छा उत्तर है। पेआफ के एक छोटे से यादृच्छिक अस्तव्यस्तता के अनुसार, चूँकि, संभावना है कि कोई भी दो पेआफ बंधी रहेगी, चाहे 0 या किसी अन्य संख्या पर, विलुप्त रूप से छोटा है, और खेल में इसके अतिरिक्त एक या तीन संतुलन होते है।

यह भी देखें

संदर्भ

↑ Osborne, Martin J.; Rubinstein, Ariel (12 Jul 1994). गेम थ्योरी में एक कोर्स. Cambridge, MA: MIT. p. 14. ISBN 9780262150415.
↑ Kreps D.M. (1987) "Nash Equilibrium." In: Palgrave Macmillan (eds) The New Palgrave Dictionary of Economics. Palgrave Macmillan, London.
↑ Schelling, Thomas, The Strategy of Conflict, copyright 1960, 1980, Harvard University Press, ISBN 0-674-84031-3.
↑ De Fraja, G.; Oliveira, T.; Zanchi, L. (2010). "Must Try Harder: Evaluating the Role of Effort in Educational Attainment". Review of Economics and Statistics. 92 (3): 577. doi:10.1162/REST_a_00013. hdl:2108/55644. S2CID 57072280.
↑ Ward, H. (1996). "Game Theory and the Politics of Global Warming: The State of Play and Beyond". Political Studies. 44 (5): 850–871. doi:10.1111/j.1467-9248.1996.tb00338.x. S2CID 143728467.,
↑ Thorpe, Robert B.; Jennings, Simon; Dolder, Paul J. (2017). "बहुप्रजाति मिश्रित मात्स्यिकी में बहुत अच्छी उपज पकड़ने के जोखिम और लाभ". ICES Journal of Marine Science. 74 (8): 2097–2106. doi:10.1093/icesjms/fsx062.,
↑ "डॉ. नैश - एंड्रयू फ्रैंक से मार्केटिंग के सबक". 2015-05-25. Retrieved 2015-08-30.
↑ Chiappori, P. -A.; Levitt, S.; Groseclose, T. (2002). "Testing Mixed-Strategy Equilibria when Players Are Heterogeneous: The Case of Penalty Kicks in Soccer" (PDF). American Economic Review. 92 (4): 1138. CiteSeerX 10.1.1.178.1646. doi:10.1257/00028280260344678.
↑ Djehiche, B.; Tcheukam, A.; Tembine, H. (2017). "बहुस्तरीय भवन में निकासी का एक मीन-फील्ड गेम". IEEE Transactions on Automatic Control. 62 (10): 5154–5169. doi:10.1109/TAC.2017.2679487. ISSN 0018-9286. S2CID 21850096.
↑ Djehiche, Boualem; Tcheukam, Alain; Tembine, Hamidou (2017-09-27). "इंजीनियरिंग में मीन-फील्ड-टाइप गेम्स". AIMS Electronics and Electrical Engineering (in English). 1: 18–73. arXiv:1605.03281. doi:10.3934/ElectrEng.2017.1.18. S2CID 16055840.
↑ Cournot A. (1838) Researches on the Mathematical Principles of the Theory of Wealth
↑ J. Von Neumann, O. Morgenstern, Theory of Games and Economic Behavior, copyright 1944, 1953, Princeton University Press
↑ Carmona, Guilherme; Podczeck, Konrad (2009). "बड़े खेलों में शुद्ध रणनीति नैश इक्विलिब्रिया के अस्तित्व पर" (PDF). Journal of Economic Theory. 144 (3): 1300–1319. doi:10.1016/j.jet.2008.11.009. hdl:10362/11577. SSRN 882466.
↑ ^14.0 ^14.1 von Ahn, Luis. "गेम थ्योरी की प्रारंभिक" (PDF). Archived from the original (PDF) on 2011-10-18. Retrieved 2008-11-07.
↑ "नैश संतुलन". hoylab.cornell.edu. Retrieved 2019-12-08.
↑ MIT OpenCourseWare. 6.254: Game Theory with Engineering Applications, Spring 2010. Lecture 6: Continuous and Discontinuous Games.
↑ ^17.0 ^17.1 B. D. Bernheim; B. Peleg; M. D. Whinston (1987), "Coalition-Proof Equilibria I. Concepts", Journal of Economic Theory, 42 (1): 1–12, doi:10.1016/0022-0531(87)90099-8.
↑ Aumann, R. (1959). "Acceptable points in general cooperative n-person games". खेलों के सिद्धांत में योगदान. Vol. IV. Princeton, N.J.: Princeton University Press. ISBN 978-1-4008-8216-8.
↑ D. Moreno; J. Wooders (1996), "Coalition-Proof Equilibrium" (PDF), Games and Economic Behavior, 17 (1): 80–112, doi:10.1006/game.1996.0095, hdl:10016/4408.
↑ T. L. Turocy, B. Von Stengel, Game Theory, copyright 2001, Texas A&M University, London School of Economics, pages 141-144. Nash proved that a perfect NE exists for this type of finite extensive form game^{[citation needed]} – it can be represented as a strategy complying with his original conditions for a game with a NE. Such games may not have unique NE, but at least one of the many equilibrium strategies would be played by hypothetical players having perfect knowledge of all 10¹⁵⁰ game trees^{[citation needed]}.
↑ J. C. Cox, M. Walker, Learning to Play Cournot Duoploy Strategies Archived 2013-12-11 at the Wayback Machine, copyright 1997, Texas A&M University, University of Arizona, pages 141-144
↑ Fudenburg, Drew; Tirole, Jean (1991). खेल सिद्धांत. MIT Press. ISBN 978-0-262-06141-4.
↑ Wilson, Robert (1971-07-01). "एन-पर्सन गेम्स का कम्प्यूटिंग इक्विलिब्रिया". SIAM Journal on Applied Mathematics. 21 (1): 80–87. doi:10.1137/0121011. ISSN 0036-1399.
↑ Harsanyi, J. C. (1973-12-01). "Oddness of the Number of Equilibrium Points: A New Proof". International Journal of Game Theory (in English). 2 (1): 235–250. doi:10.1007/BF01737572. ISSN 1432-1270. S2CID 122603890.

ग्रन्थसूची

खेल सिद्धांत पाठ्यपुस्तकें

Binmore, Ken (2007), Playing for Real: A Text on Game Theory, Oxford University Press, ISBN 978-0195300574.
दीक्षित, अविनाश, सुसान स्केथ और डेविड रेली। रणनीति के खेल। डब्ल्यू.डब्ल्यू. नॉर्टन एंड कंपनी। (तीसरा संस्करण 2009 में।) एक पूर्वस्नातक पाठ।
Dutta, Prajit K. (1999), Strategies and games: theory and practice, MIT Press, ISBN 978-0-262-04169-0. स्नातक और व्यावसायिक छात्रों के लिए उपयुक्त।
फडेनबर्ग, ड्रू और जॉन टिरोल (1991) गेम थ्योरी एमआईटी प्रेस।
Gibbons, Robert (1992), Game Theory for Applied Economists, Princeton University Press (July 13, 1992), ISBN 978-0-691-00395-5. स्पष्ट रूप से आर्थिक संदर्भ में गेम थ्योरी का स्पष्ट और विस्तृत परिचय।
ऑस्कर मॉर्गनस्टर्न | मॉर्गनस्टर्न, ऑस्कर और जॉन वॉन न्यूमैन (1947) द थ्योरी ऑफ़ गेम्स एंड इकोनॉमिक बिहेवियर प्रिंसटन यूनिवर्सिटी प्रेस।
Myerson, Roger B. (1997), Game Theory: Analysis of Conflict, Harvard University Press, ISBN 978-0-674-34116-6
Osborne, Martin (2004), An Introduction to Game Theory, Oxford University Press, ISBN 978-0-19-512895-6.
Papayoanou, Paul (2010), Game Theory for Business: A Primer in Strategic Gaming, Probabilistic Publishing, ISBN 978-0964793873
Rubinstein, Ariel; Osborne, Martin J. (1994), A Course in Game Theory, MIT Press, ISBN 978-0-262-65040-3. स्नातक स्तर पर एक आधुनिक परिचय।
Shoham, Yoav; Leyton-Brown, Kevin (2009), Multiagent Systems: Algorithmic, Game-Theoretic, and Logical Foundations, New York: Cambridge University Press, ISBN 978-0-521-89943-7. कम्प्यूटेशनल परिप्रेक्ष्य से एक व्यापक संदर्भ; अध्याय 3 देखें। मुफ्त ऑनलाइन डाउनलोड करने योग्य।

मूल नैश पेपर

जॉन फोर्ब्स नैश|नैश, जॉन (1950) एन-पर्सन गेम्स राष्ट्रीय विज्ञान अकादमी की कार्यवाही 36(1):48-49 में संतुलन अंक।
जॉन फ़ोर्ब्स नैश|नैश, जॉन (1951) असहयोगी खेल गणित के इतिहास 54(2):286-295.

अन्य संदर्भ

मेहल्मन, ए. (2000) द गेम्स अफूट! गेम थ्योरी इन मिथ एंड पैराडॉक्स, अमेरिकी गणितीय सोसायटी

सिल्विया नासर|नासर, सिल्विया (1998), एक सुंदर मन (पुस्तक)पुस्तक), साइमन एंड शूस्टर।
एवियाड रुबिनस्टीन: पी और एनपी के बीच सन्निकटन की कठोरता, एसीएम, आईएसबीएन 978-1-947487-23-9 (मई 2019), डीओआई: https://doi.org/10.1145/3241304। # बताते हैं कि नैश इक्विलिब्रियम गणना में एक कठिन समस्या है।

बाहरी संबंध

"Nash theorem (in game theory)", Encyclopedia of Mathematics, EMS Press, 2001 [1994]
Complete Proof of Existence of Nash Equilibria
Simplified Form and Related Results Archived 2021-07-31 at the Wayback Machine

[Osborne-1] Osborne, Martin J.; Rubinstein, Ariel (12 Jul 1994). गेम थ्योरी में एक कोर्स. Cambridge, MA: MIT. p. 14. ISBN 9780262150415.

[2] Kreps D.M. (1987) "Nash Equilibrium." In: Palgrave Macmillan (eds) The New Palgrave Dictionary of Economics. Palgrave Macmillan, London.

[3] Schelling, Thomas, The Strategy of Conflict, copyright 1960, 1980, Harvard University Press, ISBN 0-674-84031-3.

[4] De Fraja, G.; Oliveira, T.; Zanchi, L. (2010). "Must Try Harder: Evaluating the Role of Effort in Educational Attainment". Review of Economics and Statistics. 92 (3): 577. doi:10.1162/REST_a_00013. hdl:2108/55644. S2CID 57072280.

[5] Ward, H. (1996). "Game Theory and the Politics of Global Warming: The State of Play and Beyond". Political Studies. 44 (5): 850–871. doi:10.1111/j.1467-9248.1996.tb00338.x. S2CID 143728467.,

[6] Thorpe, Robert B.; Jennings, Simon; Dolder, Paul J. (2017). "बहुप्रजाति मिश्रित मात्स्यिकी में बहुत अच्छी उपज पकड़ने के जोखिम और लाभ". ICES Journal of Marine Science. 74 (8): 2097–2106. doi:10.1093/icesjms/fsx062.,

[7] "डॉ. नैश - एंड्रयू फ्रैंक से मार्केटिंग के सबक". 2015-05-25. Retrieved 2015-08-30.

[8] Chiappori, P. -A.; Levitt, S.; Groseclose, T. (2002). "Testing Mixed-Strategy Equilibria when Players Are Heterogeneous: The Case of Penalty Kicks in Soccer" (PDF). American Economic Review. 92 (4): 1138. CiteSeerX 10.1.1.178.1646. doi:10.1257/00028280260344678.

[9] Djehiche, B.; Tcheukam, A.; Tembine, H. (2017). "बहुस्तरीय भवन में निकासी का एक मीन-फील्ड गेम". IEEE Transactions on Automatic Control. 62 (10): 5154–5169. doi:10.1109/TAC.2017.2679487. ISSN 0018-9286. S2CID 21850096.

[10] Djehiche, Boualem; Tcheukam, Alain; Tembine, Hamidou (2017-09-27). "इंजीनियरिंग में मीन-फील्ड-टाइप गेम्स". AIMS Electronics and Electrical Engineering (in English). 1: 18–73. arXiv:1605.03281. doi:10.3934/ElectrEng.2017.1.18. S2CID 16055840.

[11] Cournot A. (1838) Researches on the Mathematical Principles of the Theory of Wealth

[12] J. Von Neumann, O. Morgenstern, Theory of Games and Economic Behavior, copyright 1944, 1953, Princeton University Press

[13] Carmona, Guilherme; Podczeck, Konrad (2009). "बड़े खेलों में शुद्ध रणनीति नैश इक्विलिब्रिया के अस्तित्व पर" (PDF). Journal of Economic Theory. 144 (3): 1300–1319. doi:10.1016/j.jet.2008.11.009. hdl:10362/11577. SSRN 882466.

[preliminaries-14] 14.0 ^14.1 von Ahn, Luis. "गेम थ्योरी की प्रारंभिक" (PDF). Archived from the original (PDF) on 2011-10-18. Retrieved 2008-11-07.

[15] "नैश संतुलन". hoylab.cornell.edu. Retrieved 2019-12-08.

[16] MIT OpenCourseWare. 6.254: Game Theory with Engineering Applications, Spring 2010. Lecture 6: Continuous and Discontinuous Games.

[CoalitionProof-17] 17.0 ^17.1 B. D. Bernheim; B. Peleg; M. D. Whinston (1987), "Coalition-Proof Equilibria I. Concepts", Journal of Economic Theory, 42 (1): 1–12, doi:10.1016/0022-0531(87)90099-8.

[SNE-18] Aumann, R. (1959). "Acceptable points in general cooperative n-person games". खेलों के सिद्धांत में योगदान. Vol. IV. Princeton, N.J.: Princeton University Press. ISBN 978-1-4008-8216-8.

[CPNE-19] D. Moreno; J. Wooders (1996), "Coalition-Proof Equilibrium" (PDF), Games and Economic Behavior, 17 (1): 80–112, doi:10.1006/game.1996.0095, hdl:10016/4408.

[20] T. L. Turocy, B. Von Stengel, Game Theory, copyright 2001, Texas A&M University, London School of Economics, pages 141-144. Nash proved that a perfect NE exists for this type of finite extensive form game^{[citation needed]} – it can be represented as a strategy complying with his original conditions for a game with a NE. Such games may not have unique NE, but at least one of the many equilibrium strategies would be played by hypothetical players having perfect knowledge of all 10¹⁵⁰ game trees^{[citation needed]}.

[21] J. C. Cox, M. Walker, Learning to Play Cournot Duoploy Strategies Archived 2013-12-11 at the Wayback Machine, copyright 1997, Texas A&M University, University of Arizona, pages 141-144

[22] Fudenburg, Drew; Tirole, Jean (1991). खेल सिद्धांत. MIT Press. ISBN 978-0-262-06141-4.

[23] Wilson, Robert (1971-07-01). "एन-पर्सन गेम्स का कम्प्यूटिंग इक्विलिब्रिया". SIAM Journal on Applied Mathematics. 21 (1): 80–87. doi:10.1137/0121011. ISSN 0036-1399.

[24] Harsanyi, J. C. (1973-12-01). "Oddness of the Number of Equilibrium Points: A New Proof". International Journal of Game Theory (in English). 2 (1): 235–250. doi:10.1007/BF01737572. ISSN 1432-1270. S2CID 122603890.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

v t e Topics in game theory
Definitions	Congestion game Cooperative game Determinacy Escalation of commitment Extensive-form game First-player and second-player win Game complexity Game description language Graphical game Hierarchy of beliefs Information set Normal-form game Preference Sequential game Simultaneous game Simultaneous action selection Solved game Succinct game
Equilibrium concepts	Bayesian Nash equilibrium Berge equilibrium Core Correlated equilibrium Epsilon-equilibrium Evolutionarily stable strategy Gibbs equilibrium Mertens-stable equilibrium Markov perfect equilibrium Nash equilibrium Pareto efficiency Perfect Bayesian equilibrium Proper equilibrium Quantal response equilibrium Quasi-perfect equilibrium Risk dominance Satisfaction equilibrium Self-confirming equilibrium Sequential equilibrium Shapley value Strong Nash equilibrium Subgame perfection Trembling hand
Strategies	Backward induction Bid shading Collusion Forward induction Grim trigger Markov strategy Dominant strategies Pure strategy Mixed strategy Strategy-stealing argument Tit for tat
Classes of games	Bargaining problem Cheap talk Global game Intransitive game Mean-field game Mechanism design n-player game Perfect information Large Poisson game Potential game Repeated game Screening game Signaling game Stackelberg competition Strictly determined game Stochastic game Symmetric game Zero-sum game
Games	Go Chess Infinite chess Checkers Tic-tac-toe Prisoner's dilemma Gift-exchange game Optional prisoner's dilemma Traveler's dilemma Coordination game Chicken Centipede game Lewis signaling game Volunteer's dilemma Dollar auction Battle of the sexes Stag hunt Matching pennies Ultimatum game Rock paper scissors Pirate game Dictator game Public goods game Blotto game War of attrition El Farol Bar problem Fair division Fair cake-cutting Cournot game Deadlock Diner's dilemma Guess 2/3 of the average Kuhn poker Nash bargaining game Induction puzzles Trust game Princess and monster game Rendezvous problem
Theorems	Arrow's impossibility theorem Aumann's agreement theorem Folk theorem Minimax theorem Nash's theorem Purification theorem Revelation principle Zermelo's theorem
Key figures	Albert W. Tucker Amos Tversky Antoine Augustin Cournot Ariel Rubinstein Claude Shannon Daniel Kahneman David K. Levine David M. Kreps Donald B. Gillies Drew Fudenberg Eric Maskin Harold W. Kuhn Herbert Simon Hervé Moulin John Conway Jean Tirole Jean-François Mertens Jennifer Tour Chayes John Harsanyi John Maynard Smith John Nash John von Neumann Kenneth Arrow Kenneth Binmore Leonid Hurwicz Lloyd Shapley Melvin Dresher Merrill M. Flood Olga Bondareva Oskar Morgenstern Paul Milgrom Peyton Young Reinhard Selten Robert Axelrod Robert Aumann Robert B. Wilson Roger Myerson Samuel Bowles Suzanne Scotchmer Thomas Schelling William Vickrey
Miscellaneous	All-pay auction Alpha–beta pruning Bertrand paradox Bounded rationality Combinatorial game theory Confrontation analysis Coopetition Evolutionary game theory First-move advantage in chess Game Description Language Game mechanics Glossary of game theory List of game theorists List of games in game theory No-win situation Solving chess Topological game Tragedy of the commons Tyranny of small decisions

Anonymous

Search

नैश संतुलन

Namespaces

More

Page actions

Contents

अनुप्रयोग

इतिहास

परिभाषाएँ

नैश संतुलन

सख्त/अशक्त संतुलन

नैश का अस्तित्व प्रमेय

उदाहरण

समन्वय खेल

नेटवर्क ट्रैफ़िक

प्रतियोगिता खेल

पेआफ आव्युह में नैश संतुलन

स्थिरता

घटना

जहां नियमें पूरी नहीं होती हैं

जहां नियमें पूरी होती हैं

एनई और गैर-विश्वसनीय खतरे

अस्तित्व का प्रमाण

कम्प्यूटिंग नैश संतुलन

उदाहरण

संतुलन बिंदुओं की विषमता

यह भी देखें

संदर्भ

ग्रन्थसूची

खेल सिद्धांत पाठ्यपुस्तकें

मूल नैश पेपर

अन्य संदर्भ

बाहरी संबंध

Navigation

Navigation

Wiki tools

Wiki tools

Anonymous

Search

नैश संतुलन

अनुप्रयोग

इतिहास

परिभाषाएँ

नैश संतुलन

सख्त/अशक्त संतुलन

नैश का अस्तित्व प्रमेय

उदाहरण

समन्वय खेल

नेटवर्क ट्रैफ़िक

प्रतियोगिता खेल

पेआफ आव्युह में नैश संतुलन

स्थिरता

घटना

जहां नियमें पूरी नहीं होती हैं

जहां नियमें पूरी होती हैं

एनई और गैर-विश्वसनीय खतरे

अस्तित्व का प्रमाण

कम्प्यूटिंग नैश संतुलन

उदाहरण

संतुलन बिंदुओं की विषमता

यह भी देखें

संदर्भ

ग्रन्थसूची

खेल सिद्धांत पाठ्यपुस्तकें

मूल नैश पेपर

अन्य संदर्भ

बाहरी संबंध

Navigation

Wiki tools

Page tools

Other projects

Categories