सामान्य रूप का खेल: Difference between revisions

From Vigyanwiki
(Created page with "{{Short description|Representation of a game in game theory}} {{Redirect|Matrix game|Chris Engle's game|Storytelling game#Alternate form role-playing games|the publisher|Matri...")
 
No edit summary
 
(8 intermediate revisions by 3 users not shown)
Line 1: Line 1:
{{Short description|Representation of a game in game theory}}
{{Short description|Representation of a game in game theory}}
{{Redirect|Matrix game|Chris Engle's game|Storytelling game#Alternate form role-playing games|the publisher|Matrix Games}}
{{Redirect|आव्यूह खेल|क्रिस एंगल का खेल|कहानी कहने का खेल या वैकल्पिक रूप में भूमिका निभाने वाले खेल|प्रकाशक|आव्यूह खेल}}
[[खेल सिद्धांत]] में, सामान्य रूप एक ''खेल'' का वर्णन है। व्यापक रूप वाले खेल के विपरीत, सामान्य-रूप का प्रतिनिधित्व ग्राफ़ (अलग-अलग गणित) नहीं होता है, बल्कि एक [[मैट्रिक्स (गणित)]] के माध्यम से खेल का प्रतिनिधित्व करता है। हालांकि यह दृष्टिकोण सख्ती से प्रभुत्व वाली रणनीतियों और [[नैश संतुलन]] की पहचान करने में अधिक उपयोगी हो सकता है, लेकिन व्यापक-रूप प्रतिनिधित्व की तुलना में कुछ जानकारी खो जाती है। किसी गेम के सामान्य रूप के प्रतिनिधित्व में प्रत्येक खिलाड़ी के लिए सभी बोधगम्य और बोधगम्य रणनीति (गेम थ्योरी), और उनके संबंधित भुगतान शामिल होते हैं।
[[खेल सिद्धांत]] में, सामान्य रूप एक ''खेल'' का वर्णन है। व्यापक रूप वाले खेल के विपरीत, सामान्य-रूप का प्रतिनिधित्व ग्राफ़ (अलग-अलग गणित) नहीं होता है, किंतु एक [[मैट्रिक्स (गणित)|आव्यूह (गणित)]] के माध्यम से खेल का प्रतिनिधित्व करता है। चूँकि यह दृष्टिकोण सख्ती से प्रभुत्व वाली रणनीतियों और [[नैश संतुलन]] की पहचान करने में अधिक उपयोगी हो सकता है, किंतु व्यापक-रूप प्रतिनिधित्व की तुलना में कुछ जानकारी खो जाती है। किसी गेम के सामान्य रूप के प्रतिनिधित्व में प्रत्येक खिलाड़ी के लिए सभी बोधगम्य और बोधगम्य रणनीति (गेम सिद्धांत ), और उनके संबंधित भुगतान सम्मिलित होते हैं।


पूर्ण जानकारी, संपूर्ण जानकारी के स्थिर खेलों में, खेल का एक सामान्य-रूप प्रतिनिधित्व खिलाड़ियों की रणनीति स्थानों और भुगतान कार्यों का एक विनिर्देश है। एक खिलाड़ी के लिए एक रणनीति स्थान उस खिलाड़ी के लिए उपलब्ध सभी रणनीतियों का सेट है, जबकि एक रणनीति खेल के हर चरण के लिए कार्य की एक पूरी योजना है, भले ही वह चरण वास्तव में खेल में उत्पन्न हुआ हो या नहीं। एक खिलाड़ी के लिए भुगतान फ़ंक्शन खिलाड़ियों के रणनीति स्थानों के क्रॉस-उत्पाद से उस खिलाड़ी के भुगतान के सेट (सामान्य रूप से वास्तविक संख्याओं का सेट, जहां संख्या एक [[कार्डिनल उपयोगिता]] या क्रमिक उपयोगिता का प्रतिनिधित्व करती है - अक्सर सामान्य में कार्डिनल-) की मैपिंग होती है। एक खिलाड़ी का फॉर्म प्रतिनिधित्व) यानी एक खिलाड़ी का भुगतान फ़ंक्शन अपने इनपुट के रूप में एक रणनीति प्रोफ़ाइल लेता है (जो कि प्रत्येक खिलाड़ी के लिए रणनीतियों का एक विनिर्देश है) और इसके आउटपुट के रूप में भुगतान का प्रतिनिधित्व उत्पन्न करता है।
पूर्ण जानकारी, संपूर्ण जानकारी के स्थिर खेलों में, खेल का एक सामान्य-रूप प्रतिनिधित्व खिलाड़ियों की रणनीति स्थानों और भुगतान कार्यों का एक विनिर्देश है। एक खिलाड़ी के लिए एक रणनीति स्थान उस खिलाड़ी के लिए उपलब्ध सभी रणनीतियों का समुच्चय है, जबकि एक रणनीति खेल के हर चरण के लिए कार्य की एक पूर्ण योजना है, तथापि वह चरण वास्तव में खेल में उत्पन्न हुआ हो या नहीं। एक खिलाड़ी के लिए भुगतान खिलाड़ियों के रणनीति स्थानों के क्रॉस-उत्पाद से उस खिलाड़ी के भुगतान के समुच्चय (सामान्य रूप से वास्तविक संख्याओं का समुच्चय , जहां संख्या एक [[कार्डिनल उपयोगिता]] या क्रमिक उपयोगिता का प्रतिनिधित्व करती है - अधिकांशतः सामान्य में कार्डिनल-) की मानचित्र होती है। एक खिलाड़ी का फॉर्म प्रतिनिधित्व) अथार्त एक खिलाड़ी का भुगतान फलन अपने इनपुट के रूप में एक रणनीति प्रोफ़ाइल लेता है (जो कि प्रत्येक खिलाड़ी के लिए रणनीतियों का एक विनिर्देश है) और इसके आउटपुट के रूप में भुगतान का प्रतिनिधित्व उत्पन्न करता है।


== एक उदाहरण ==
== एक उदाहरण ==


{| class="wikitable" style="float:right; text-align:center; margin-left:1em;"
{| class="wikitable" style="float:right; text-align:center; margin-left:1em;"
|+ A normal-form game
|+ एक सामान्य रूप का खेल
! {{diagonal split header|{{color|#009|<br />Player 1}}|{{color|#900|Player 2}}}}
! {{diagonal split header|{{color|#009|<br />Player 1}}|{{color|#900|Player 2}}}}
! scope="col" | {{color|#900|Left}}
! scope="col" | {{color|#900|बाएं}}
! scope="col" | {{color|#900|Right}}
! scope="col" | {{color|#900|दाहिने}}
|-
|-
! scope="col" | {{color|#009|Top}}
! scope="col" | शीर्ष
| {{color|#009|4}}, {{color|#900|3}}
| {{color|#009|4}}, {{color|#900|3}}
| {{color|#009|−1}}, {{color|#900|−1}}
| {{color|#009|−1}}, {{color|#900|−1}}
|-
|-
! scope="col" | {{color|#009|Bottom}}
! scope="col" | नीचे
| {{color|#009|0}}, {{color|#900|0}}
| {{color|#009|0}}, {{color|#900|0}}
| {{color|#009|3}}, {{color|#900|4}}
| {{color|#009|3}}, {{color|#900|4}}
|}
|}
प्रदान किया गया मैट्रिक्स एक गेम का एक सामान्य-रूप प्रतिनिधित्व है जिसमें खिलाड़ी एक साथ चलते हैं (या कम से कम अपने कदम उठाने से पहले दूसरे खिलाड़ी की चाल का निरीक्षण नहीं करते हैं) और खेले गए कार्यों के संयोजन के लिए निर्दिष्ट भुगतान प्राप्त करते हैं। उदाहरण के लिए, यदि खिलाड़ी 1 शीर्ष पर खेलता है और खिलाड़ी 2 बाईं ओर खेलता है, तो खिलाड़ी 1 को 4 मिलते हैं और खिलाड़ी 2 को 3 मिलते हैं। प्रत्येक सेल में, पहला नंबर पंक्ति के खिलाड़ी को भुगतान दर्शाता है (इस मामले में खिलाड़ी 1), और दूसरा नंबर कॉलम प्लेयर को भुगतान का प्रतिनिधित्व करता है (इस मामले में प्लेयर 2)।
अतः प्रदान किया गया आव्यूह एक गेम का एक सामान्य-रूप प्रतिनिधित्व है जिसमें खिलाड़ी एक साथ चलते हैं (या कम से कम अपने कदम उठाने से पहले दूसरे खिलाड़ी की चाल का निरीक्षण नहीं करते हैं) और खेले गए कार्यों के संयोजन के लिए निर्दिष्ट भुगतान प्राप्त करते हैं। उदाहरण के लिए, यदि खिलाड़ी 1 शीर्ष पर खेलता है और खिलाड़ी 2 बाईं ओर खेलता है, तो खिलाड़ी 1 को 4 मिलते हैं और खिलाड़ी 2 को 3 मिलते हैं। प्रत्येक सेल में, पहला नंबर पंक्ति के खिलाड़ी को भुगतान दर्शाता है (इस स्थिति में खिलाड़ी 1), और दूसरा नंबर स्तम्भ प्लेयर को भुगतान का प्रतिनिधित्व करता है (इस स्थिति में प्लेयर 2)।


=== अन्य प्रतिनिधित्व ===
=== अन्य प्रतिनिधित्व ===
फ़ाइल:2x2chart110602.pdf|thumb|दो-खिलाड़ियों, दो-रणनीति वाले खेलों की एक आंशिक टोपोलॉजी, जिसमें प्रिज़नर्स डिलमाइक, [[ हरिण का शिकार ]] और [[ चिकन (खेल) ]] जैसे गेम शामिल हैं।
प्रायः, [[सममित खेल]] (जहां भुगतान इस बात पर निर्भर नहीं होता है कि कौन सा खिलाड़ी प्रत्येक क्रिया को चुनता है) को केवल एक भुगतान के साथ दर्शाया जाता है। यह पंक्ति खिलाड़ी के लिए भुगतान है. उदाहरण के लिए, नीचे दाईं और बाईं ओर भुगतान आव्यूह एक ही खेल का प्रतिनिधित्व करते हैं।
 
अक्सर, [[सममित खेल]] (जहां भुगतान इस बात पर निर्भर नहीं होता है कि कौन सा खिलाड़ी प्रत्येक क्रिया को चुनता है) को केवल एक भुगतान के साथ दर्शाया जाता है। यह पंक्ति खिलाड़ी के लिए भुगतान है. उदाहरण के लिए, नीचे दाईं और बाईं ओर भुगतान मैट्रिक्स एक ही खेल का प्रतिनिधित्व करते हैं।


{| style="margin:0 auto;text-align:center;"
{| style="margin:0 auto;text-align:center;"
|
|
{| class="wikitable"  
{| class="wikitable"  
|+ align="bottom"|''Both players''
|+ align="bottom"|''दोनों खिलाड़ी''
! {{diagonal split header|<br />Player 1|Player 2}}
! {{diagonal split header|<br />Player 1|Player 2}}
! ''Stag''
! स्टैग
! ''Hare''
!हायर
|-
|-
! ''Stag''
! स्टैग
| 3, 3
| 3, 3
| 0, 2
| 0, 2
|-
|-
! ''Hare''
!हायर
| 2, 0
| 2, 0
| 2, 2
| 2, 2
Line 46: Line 44:
| शैली= पैडिंग-बाएँ:2em; |
| शैली= पैडिंग-बाएँ:2em; |
{| class="wikitable"  
{| class="wikitable"  
|+ align="bottom"|''Just row''
|+ align="bottom"|बस पंक्ति
! {{diagonal split header|<br />Player 1|Player 2}}
! {{diagonal split header|<br />Player 1|Player 2}}
! ''Stag''
! स्टैग
! ''Hare''
!हायर
|-
|-
! ''Stag''
! स्टैग
| 3
| 3
| 0
| 0
|-
|-
! ''Hare''
!हायर
| 2
| 2
| 2
| 2
Line 61: Line 59:
|}
|}


संबंधित भुगतान मैट्रिक्स वाले गेम के टोपोलॉजिकल स्पेस को भी मैप किया जा सकता है, आसन्न गेम में सबसे समान मैट्रिक्स होते हैं। इससे पता चलता है कि कैसे वृद्धिशील प्रोत्साहन परिवर्तन खेल को बदल सकते हैं।
संबंधित भुगतान आव्यूह वाले गेम के टोपोलॉजिकल स्पेस को भी मानचित्र किया जा सकता है, आसन्न गेम में अधिक समान आव्यूह होते हैं। इससे पता चलता है कि कैसे वृद्धिशील प्रोत्साहन परिवर्तन खेल में परिवर्तित कर सकते हैं।


== सामान्य रूप का उपयोग ==
== सामान्य रूप का उपयोग ==
Line 67: Line 65:
=== प्रभुत्व वाली रणनीतियाँ ===
=== प्रभुत्व वाली रणनीतियाँ ===
{| class="wikitable" style="float:right; margin-left:1em; text-align:center;"
{| class="wikitable" style="float:right; margin-left:1em; text-align:center;"
|+ align="bottom"|''The Prisoner's Dilemma''
|+ align="bottom"|''प्रिजनर डिलेम्मा''  
! {{diagonal split header|<br />Player 1|Player 2}}
! {{diagonal split header|<br />Player 1|Player 2}}
! ''Cooperate''
!सहयोग
! ''Defect''
!त्रुटि
|-
|-
! ''Cooperate''
!सहयोग
| −1, −1
| −1, −1
| −5, 0
| −5, 0
|-
|-
! ''Defect''
!त्रुटि
| 0, −5
| 0, −5
| −2, −2
| −2, −2
|}
|}
अदायगी मैट्रिक्स प्रभुत्व वाली रणनीति को खत्म करने की सुविधा प्रदान करता है, और इसका उपयोग आमतौर पर इस अवधारणा को चित्रित करने के लिए किया जाता है। उदाहरण के लिए, कैदी की दुविधा में, हम देख सकते हैं कि प्रत्येक कैदी या तो सहयोग कर सकता है या गलती कर सकता है। यदि वास्तव में एक कैदी गलती करता है, तो वह आसानी से छूट जाता है और दूसरा कैदी लंबे समय तक बंद रहता है। हालाँकि, यदि वे दोनों दलबदल करते हैं, तो उन दोनों को थोड़े समय के लिए बंद कर दिया जाएगा। कोई यह निर्धारित कर सकता है कि सहयोग पर दोष का सख्ती से प्रभुत्व है। प्रत्येक कॉलम में पहली संख्याओं की तुलना करनी चाहिए, इस मामले में 0 > −1 और −2 > −5। इससे पता चलता है कि कॉलम प्लेयर चाहे जो भी चुने, पंक्ति प्लेयर दोष चुनकर बेहतर प्रदर्शन करता है। इसी प्रकार, प्रत्येक पंक्ति में दूसरे भुगतान की तुलना की जाती है; पुनः 0 > −1 और −2 > −5. इससे पता चलता है कि कोई फर्क नहीं पड़ता कि पंक्ति क्या करती है, दोष चुनने से कॉलम बेहतर काम करता है। यह दर्शाता है कि इस खेल का अद्वितीय नैश संतुलन (दोष, दोष) है।
अदायगी आव्यूह प्रभुत्व वाली रणनीति को समाप्त करने की सुविधा प्रदान करता है, और इसका उपयोग समान्यत: इस अवधारणा को चित्रित करने के लिए किया जाता है। उदाहरण के लिए, प्रिजनर डिलेम्मा में, हम देख सकते हैं कि प्रत्येक कैदी या तो सहयोग कर सकता है या गलती कर सकता है। यदि वास्तव में एक कैदी गलती करता है, तो वह सरलता से छूट जाता है और दूसरा कैदी लंबे समय तक संवर्त रहता है। चूँकि , यदि वे दोनों पक्षत्याग करते हैं, तो उन दोनों को थोड़े समय के लिए संवर्त कर दिया जाएगा। कोई यह निर्धारित कर सकता है कि सहयोग पर दोष का सख्ती से प्रभुत्व है। प्रत्येक स्तम्भ में पहली संख्याओं की तुलना करनी चाहिए, इस स्थिति में 0 > −1 और −2 > −5। इससे पता चलता है कि स्तम्भ प्लेयर चाहे जो भी चुने, पंक्ति प्लेयर दोष चुनकर उत्तम प्रदर्शन करता है। इसी प्रकार, प्रत्येक पंक्ति में दूसरे भुगतान की तुलना की जाती है; पुनः 0 > −1 और −2 > −5. इससे पता चलता है कि कोई अंतर नहीं पड़ता कि पंक्ति क्या करती है, दोष चुनने से स्तम्भ उत्तम काम करता है। यह दर्शाता है कि इस खेल का अद्वितीय नैश संतुलन (दोष, दोष) है।


=== सामान्य रूप में अनुक्रमिक खेल ===
=== सामान्य रूप में अनुक्रमिक खेल ===
Line 86: Line 84:


{| class="wikitable" style="float:right; margin-left:1em; text-align:center;"
{| class="wikitable" style="float:right; margin-left:1em; text-align:center;"
|+ align="bottom"|''A sequential game''
|+ align="bottom"|''एक अनुक्रमिक खेल''
! {{diagonal split header|<br />Player 1|Player 2}}
! {{diagonal split header|<br />Player 1|Player 2}}
! ''Left, Left''
!बाएँ, बाएँ
! ''Left, Right''
!बाएँ दांए
! ''Right, Left''
!दाएं से बाएं
! ''Right, Right''
! ''दाएं , दाएं''  
|-
|-
! ''Top''
!शीर्ष
|align=center|4, 3
|align=center|4, 3
|align=center|4, 3
|align=center|4, 3
Line 99: Line 97:
|align=center|−1, −1
|align=center|−1, −1
|-
|-
! ''Bottom''
!तल
|align=center|0, 0
|align=center|0, 0
|align=center|3, 4
|align=center|3, 4
Line 105: Line 103:
|align=center|3, 4
|align=center|3, 4
|}
|}
ये मैट्रिक्स केवल उन खेलों का प्रतिनिधित्व करते हैं जिनमें चालें एक साथ होती हैं (या, अधिक सामान्यतः, जानकारी पूर्ण जानकारी होती है)। उपरोक्त मैट्रिक्स उस खेल का प्रतिनिधित्व नहीं करता है जिसमें खिलाड़ी 1 पहले चलता है, जिसे खिलाड़ी 2 द्वारा देखा जाता है, और फिर खिलाड़ी 2 चलता है, क्योंकि यह इस मामले में खिलाड़ी 2 की प्रत्येक रणनीति को निर्दिष्ट नहीं करता है। इस [[अनुक्रमिक खेल]] का प्रतिनिधित्व करने के लिए हमें खिलाड़ी 2 के सभी कार्यों को निर्दिष्ट करना होगा, यहां तक ​​​​कि उन आकस्मिकताओं में भी जो खेल के दौरान कभी उत्पन्न नहीं हो सकती हैं। इस गेम में, खिलाड़ी 2 के पास पहले की तरह बाएँ और दाएँ क्रियाएँ हैं। पहले के विपरीत, उसके पास चार रणनीतियाँ हैं, जो खिलाड़ी 1 के कार्यों पर निर्भर करती हैं। रणनीतियाँ हैं:
ये आव्यूह केवल उन खेलों का प्रतिनिधित्व करते हैं जिनमें चालें एक साथ होती हैं (या, अधिक सामान्यतः, जानकारी पूर्ण जानकारी होती है)। उपरोक्त आव्यूह उस खेल का प्रतिनिधित्व नहीं करता है जिसमें खिलाड़ी 1 पहले चलता है, जिसे खिलाड़ी 2 द्वारा देखा जाता है, और फिर खिलाड़ी 2 चलता है, क्योंकि यह इस स्थिति में खिलाड़ी 2 की प्रत्येक रणनीति को निर्दिष्ट नहीं करता है। इस [[अनुक्रमिक खेल]] का प्रतिनिधित्व करने के लिए हमें खिलाड़ी 2 के सभी कार्यों को निर्दिष्ट करना होगा, यहां तक ​​​​कि उन आकस्मिकताओं में भी जो खेल के समय कभी उत्पन्न नहीं हो सकती हैं। इस गेम में, खिलाड़ी 2 के पास पहले की तरह बाएँ और दाएँ क्रियाएँ हैं। पहले के विपरीत, उसके पास चार रणनीतियाँ हैं, जो खिलाड़ी 1 के कार्यों पर निर्भर करती हैं। रणनीतियाँ हैं:
# यदि खिलाड़ी 1 टॉप खेलता है तो बाएँ और अन्यथा बाएँ
# यदि खिलाड़ी 1 टॉप खेलता है तो बाएँ और अन्यथा बाएँ
# यदि खिलाड़ी 1 शीर्ष खेलता है तो बाएँ और अन्यथा दाएँ
# यदि खिलाड़ी 1 शीर्ष खेलता है तो बाएँ और अन्यथा दाएँ
# यदि खिलाड़ी 1 टॉप खेलता है तो दाएँ और अन्यथा बाएँ
# यदि खिलाड़ी 1 टॉप खेलता है तो दाएँ और अन्यथा बाएँ
# अगर खिलाड़ी 1 टॉप खेलता है तो सही और अन्यथा सही
# यदि खिलाड़ी 1 टॉप खेलता है तो सही और अन्यथा सही
दाईं ओर इस खेल का सामान्य-रूप प्रतिनिधित्व है।
दाईं ओर इस खेल का सामान्य-रूप प्रतिनिधित्व है।


Line 116: Line 114:
किसी खेल को सामान्य रूप में लाने के लिए, हमें निम्नलिखित डेटा प्रदान किया जाता है:
किसी खेल को सामान्य रूप में लाने के लिए, हमें निम्नलिखित डेटा प्रदान किया जाता है:


खिलाड़ियों का एक सीमित सेट I है, प्रत्येक खिलाड़ी को i द्वारा दर्शाया जाता है। प्रत्येक खिलाड़ी के पास [[शुद्ध रणनीति]] की एक सीमित k संख्या होती है
खिलाड़ियों का एक सीमित समुच्चय I है, प्रत्येक खिलाड़ी को i द्वारा दर्शाया जाता है। प्रत्येक खिलाड़ी के पास [[शुद्ध रणनीति]] की एक सीमित k संख्या होती है


::<math> S_i = \{1, 2, \ldots, k\}. </math>
::<math> S_i = \{1, 2, \ldots, k\}. </math>
ए{{vanchor|pure strategy profile}} खिलाड़ियों के लिए रणनीतियों का एक संघ है, जो एक ''आई''-[[ टपल ]] है
एक शुद्ध रणनीति प्रोफ़ाइल खिलाड़ियों के लिए रणनीतियों का एक संघ है, जो कि एक आई-ट्यूपल है


:<math> \vec{s} = (s_1, s_2, \ldots,s_I) </math>
:<math> \vec{s} = (s_1, s_2, \ldots,s_I) </math>
Line 125: Line 123:


:<math> s_1 \in S_1, s_2 \in S_2, \ldots, s_I \in S_I </math>
:<math> s_1 \in S_1, s_2 \in S_2, \ldots, s_I \in S_I </math>
ए{{vanchor|payoff function}} एक फ़ंक्शन है
अदायगी फलन एक फलन है


:<math> u_i: S_1 \times S_2 \times \ldots \times S_I \rightarrow \mathbb{R}. </math>
:<math> u_i: S_1 \times S_2 \times \ldots \times S_I \rightarrow \mathbb{R}. </math>
जिसकी इच्छित व्याख्या खेल के नतीजे पर एकल खिलाड़ी को दिया जाने वाला पुरस्कार है। तदनुसार, किसी खेल को पूरी तरह से निर्दिष्ट करने के लिए, खिलाड़ी सेट I= {1, 2, ..., I} में प्रत्येक खिलाड़ी के लिए भुगतान फ़ंक्शन निर्दिष्ट करना होगा।
जिसकी इच्छित व्याख्या खेल के परिणाम पर एकल खिलाड़ी को दिया जाने वाला पुरस्कार है। इसलिए , किसी खेल को पूर्ण रूप से निर्दिष्ट करने के लिए, खिलाड़ी समुच्चय I= {1, 2, ..., I} में प्रत्येक खिलाड़ी के लिए भुगतान फलन निर्दिष्ट करना होगा।


'परिभाषा': सामान्य रूप में एक खेल एक संरचना है
'परिभाषा': सामान्य रूप में एक खेल एक संरचना है                                                                                                        


:<math> \Tau=\langle I, \mathbf{S}, \mathbf{u}\rangle </math>
:<math> \Tau=\langle I, \mathbf{S}, \mathbf{u}\rangle                                                                                                                                      
कहाँ:
                                                                                                                                                                                                                                                                                                </math>
जहाँ :


:<math>I=\{1,2, \ldots , I\}</math>
:<math>I=\{1,2, \ldots , I\}</math>
Line 139: Line 138:


:<math>\mathbf{S}=  \{S_1, S_2, \ldots, S_I\} </math>
:<math>\mathbf{S}=  \{S_1, S_2, \ldots, S_I\} </math>
शुद्ध रणनीति सेटों का एक आई-टुपल है, प्रत्येक खिलाड़ी के लिए एक, और
शुद्ध रणनीति समुच्चय ों का एक आई-टुपल है, प्रत्येक खिलाड़ी के लिए एक, और


:<math> \mathbf{u} = \{u_1, u_2, \ldots, u_I\} </math>
:<math> \mathbf{u} = \{u_1, u_2, \ldots, u_I\} </math>
Line 150: Line 149:
* {{Cite book | last1=Shoham | first1=Yoav | last2=Leyton-Brown | first2=Kevin | title=Multiagent Systems: Algorithmic, Game-Theoretic, and Logical Foundations | publisher=[[Cambridge University Press]] | isbn=978-0-521-89943-7 | url=http://www.masfoundations.org | year=2009 | location=New York}}. A comprehensive reference from a computational perspective; see Chapter 3. [http://www.masfoundations.org/download.html Downloadable free online].
* {{Cite book | last1=Shoham | first1=Yoav | last2=Leyton-Brown | first2=Kevin | title=Multiagent Systems: Algorithmic, Game-Theoretic, and Logical Foundations | publisher=[[Cambridge University Press]] | isbn=978-0-521-89943-7 | url=http://www.masfoundations.org | year=2009 | location=New York}}. A comprehensive reference from a computational perspective; see Chapter 3. [http://www.masfoundations.org/download.html Downloadable free online].
* {{cite book |first=J. |last=Weibull |title=Evolutionary Game Theory |publisher=MIT Press |year=1996 |isbn=0-262-23181-6 }}
* {{cite book |first=J. |last=Weibull |title=Evolutionary Game Theory |publisher=MIT Press |year=1996 |isbn=0-262-23181-6 }}
* [[John von Neumann|J. von Neumann]] and [[Oskar Morgenstern|O. Morgenstern]], ''Theory of games and Economic Behavior'', John Wiley Science Editions, 1964. Which was originally published in 1944 by Princeton University Press.
* [[John von Neumann|J. von Neumann]] and [[Oskar Morgenstern|O. Morgenstern]], ''Theory of games and Economic Behavior'', John Wiley Science Editions, 1964. Which was originally published in 1944 by Princeton University Press.


{{game theory}}
{{game theory}}
{{Matrix classes}}
{{Matrix classes}}
[[Category: गेम थ्योरी गेम कक्षाएं]]


[[Category: Machine Translated Page]]
[[Category:Articles with hatnote templates targeting a nonexistent page]]
[[Category:Collapse templates]]
[[Category:Created On 19/07/2023]]
[[Category:Created On 19/07/2023]]
[[Category:Lua-based templates]]
[[Category:Machine Translated Page]]
[[Category:Missing redirects]]
[[Category:Navigational boxes| ]]
[[Category:Navigational boxes without horizontal lists]]
[[Category:Pages with empty portal template]]
[[Category:Pages with script errors]]
[[Category:Portal-inline template with redlinked portals]]
[[Category:Short description with empty Wikidata description]]
[[Category:Sidebars with styles needing conversion]]
[[Category:Template documentation pages|Documentation/doc]]
[[Category:Templates Vigyan Ready]]
[[Category:Templates generating microformats]]
[[Category:Templates that add a tracking category]]
[[Category:Templates that are not mobile friendly]]
[[Category:Templates that generate short descriptions]]
[[Category:Templates using TemplateData]]
[[Category:Wikipedia metatemplates]]
[[Category:गेम थ्योरी गेम कक्षाएं]]

Latest revision as of 13:15, 4 August 2023

खेल सिद्धांत में, सामान्य रूप एक खेल का वर्णन है। व्यापक रूप वाले खेल के विपरीत, सामान्य-रूप का प्रतिनिधित्व ग्राफ़ (अलग-अलग गणित) नहीं होता है, किंतु एक आव्यूह (गणित) के माध्यम से खेल का प्रतिनिधित्व करता है। चूँकि यह दृष्टिकोण सख्ती से प्रभुत्व वाली रणनीतियों और नैश संतुलन की पहचान करने में अधिक उपयोगी हो सकता है, किंतु व्यापक-रूप प्रतिनिधित्व की तुलना में कुछ जानकारी खो जाती है। किसी गेम के सामान्य रूप के प्रतिनिधित्व में प्रत्येक खिलाड़ी के लिए सभी बोधगम्य और बोधगम्य रणनीति (गेम सिद्धांत ), और उनके संबंधित भुगतान सम्मिलित होते हैं।

पूर्ण जानकारी, संपूर्ण जानकारी के स्थिर खेलों में, खेल का एक सामान्य-रूप प्रतिनिधित्व खिलाड़ियों की रणनीति स्थानों और भुगतान कार्यों का एक विनिर्देश है। एक खिलाड़ी के लिए एक रणनीति स्थान उस खिलाड़ी के लिए उपलब्ध सभी रणनीतियों का समुच्चय है, जबकि एक रणनीति खेल के हर चरण के लिए कार्य की एक पूर्ण योजना है, तथापि वह चरण वास्तव में खेल में उत्पन्न हुआ हो या नहीं। एक खिलाड़ी के लिए भुगतान खिलाड़ियों के रणनीति स्थानों के क्रॉस-उत्पाद से उस खिलाड़ी के भुगतान के समुच्चय (सामान्य रूप से वास्तविक संख्याओं का समुच्चय , जहां संख्या एक कार्डिनल उपयोगिता या क्रमिक उपयोगिता का प्रतिनिधित्व करती है - अधिकांशतः सामान्य में कार्डिनल-) की मानचित्र होती है। एक खिलाड़ी का फॉर्म प्रतिनिधित्व) अथार्त एक खिलाड़ी का भुगतान फलन अपने इनपुट के रूप में एक रणनीति प्रोफ़ाइल लेता है (जो कि प्रत्येक खिलाड़ी के लिए रणनीतियों का एक विनिर्देश है) और इसके आउटपुट के रूप में भुगतान का प्रतिनिधित्व उत्पन्न करता है।

एक उदाहरण

एक सामान्य रूप का खेल
Player 2

Player 1
बाएं दाहिने
शीर्ष 4, 3 −1, −1
नीचे 0, 0 3, 4

अतः प्रदान किया गया आव्यूह एक गेम का एक सामान्य-रूप प्रतिनिधित्व है जिसमें खिलाड़ी एक साथ चलते हैं (या कम से कम अपने कदम उठाने से पहले दूसरे खिलाड़ी की चाल का निरीक्षण नहीं करते हैं) और खेले गए कार्यों के संयोजन के लिए निर्दिष्ट भुगतान प्राप्त करते हैं। उदाहरण के लिए, यदि खिलाड़ी 1 शीर्ष पर खेलता है और खिलाड़ी 2 बाईं ओर खेलता है, तो खिलाड़ी 1 को 4 मिलते हैं और खिलाड़ी 2 को 3 मिलते हैं। प्रत्येक सेल में, पहला नंबर पंक्ति के खिलाड़ी को भुगतान दर्शाता है (इस स्थिति में खिलाड़ी 1), और दूसरा नंबर स्तम्भ प्लेयर को भुगतान का प्रतिनिधित्व करता है (इस स्थिति में प्लेयर 2)।

अन्य प्रतिनिधित्व

प्रायः, सममित खेल (जहां भुगतान इस बात पर निर्भर नहीं होता है कि कौन सा खिलाड़ी प्रत्येक क्रिया को चुनता है) को केवल एक भुगतान के साथ दर्शाया जाता है। यह पंक्ति खिलाड़ी के लिए भुगतान है. उदाहरण के लिए, नीचे दाईं और बाईं ओर भुगतान आव्यूह एक ही खेल का प्रतिनिधित्व करते हैं।

दोनों खिलाड़ी
Player 2

Player 1
स्टैग हायर
स्टैग 3, 3 0, 2
हायर 2, 0 2, 2
बस पंक्ति
Player 2

Player 1
स्टैग हायर
स्टैग 3 0
हायर 2 2

संबंधित भुगतान आव्यूह वाले गेम के टोपोलॉजिकल स्पेस को भी मानचित्र किया जा सकता है, आसन्न गेम में अधिक समान आव्यूह होते हैं। इससे पता चलता है कि कैसे वृद्धिशील प्रोत्साहन परिवर्तन खेल में परिवर्तित कर सकते हैं।

सामान्य रूप का उपयोग

प्रभुत्व वाली रणनीतियाँ

प्रिजनर डिलेम्मा
Player 2

Player 1
सहयोग त्रुटि
सहयोग −1, −1 −5, 0
त्रुटि 0, −5 −2, −2

अदायगी आव्यूह प्रभुत्व वाली रणनीति को समाप्त करने की सुविधा प्रदान करता है, और इसका उपयोग समान्यत: इस अवधारणा को चित्रित करने के लिए किया जाता है। उदाहरण के लिए, प्रिजनर डिलेम्मा में, हम देख सकते हैं कि प्रत्येक कैदी या तो सहयोग कर सकता है या गलती कर सकता है। यदि वास्तव में एक कैदी गलती करता है, तो वह सरलता से छूट जाता है और दूसरा कैदी लंबे समय तक संवर्त रहता है। चूँकि , यदि वे दोनों पक्षत्याग करते हैं, तो उन दोनों को थोड़े समय के लिए संवर्त कर दिया जाएगा। कोई यह निर्धारित कर सकता है कि सहयोग पर दोष का सख्ती से प्रभुत्व है। प्रत्येक स्तम्भ में पहली संख्याओं की तुलना करनी चाहिए, इस स्थिति में 0 > −1 और −2 > −5। इससे पता चलता है कि स्तम्भ प्लेयर चाहे जो भी चुने, पंक्ति प्लेयर दोष चुनकर उत्तम प्रदर्शन करता है। इसी प्रकार, प्रत्येक पंक्ति में दूसरे भुगतान की तुलना की जाती है; पुनः 0 > −1 और −2 > −5. इससे पता चलता है कि कोई अंतर नहीं पड़ता कि पंक्ति क्या करती है, दोष चुनने से स्तम्भ उत्तम काम करता है। यह दर्शाता है कि इस खेल का अद्वितीय नैश संतुलन (दोष, दोष) है।

सामान्य रूप में अनुक्रमिक खेल

उप-गेम अपूर्ण और पूर्ण नैश संतुलन के साथ अनुक्रमिक गेम का व्यापक और सामान्य रूप चित्रण क्रमशः लाल और नीले रंग से चिह्नित है।
एक अनुक्रमिक खेल
Player 2

Player 1
बाएँ, बाएँ बाएँ दांए दाएं से बाएं दाएं , दाएं
शीर्ष 4, 3 4, 3 −1, −1 −1, −1
तल 0, 0 3, 4 0, 0 3, 4

ये आव्यूह केवल उन खेलों का प्रतिनिधित्व करते हैं जिनमें चालें एक साथ होती हैं (या, अधिक सामान्यतः, जानकारी पूर्ण जानकारी होती है)। उपरोक्त आव्यूह उस खेल का प्रतिनिधित्व नहीं करता है जिसमें खिलाड़ी 1 पहले चलता है, जिसे खिलाड़ी 2 द्वारा देखा जाता है, और फिर खिलाड़ी 2 चलता है, क्योंकि यह इस स्थिति में खिलाड़ी 2 की प्रत्येक रणनीति को निर्दिष्ट नहीं करता है। इस अनुक्रमिक खेल का प्रतिनिधित्व करने के लिए हमें खिलाड़ी 2 के सभी कार्यों को निर्दिष्ट करना होगा, यहां तक ​​​​कि उन आकस्मिकताओं में भी जो खेल के समय कभी उत्पन्न नहीं हो सकती हैं। इस गेम में, खिलाड़ी 2 के पास पहले की तरह बाएँ और दाएँ क्रियाएँ हैं। पहले के विपरीत, उसके पास चार रणनीतियाँ हैं, जो खिलाड़ी 1 के कार्यों पर निर्भर करती हैं। रणनीतियाँ हैं:

  1. यदि खिलाड़ी 1 टॉप खेलता है तो बाएँ और अन्यथा बाएँ
  2. यदि खिलाड़ी 1 शीर्ष खेलता है तो बाएँ और अन्यथा दाएँ
  3. यदि खिलाड़ी 1 टॉप खेलता है तो दाएँ और अन्यथा बाएँ
  4. यदि खिलाड़ी 1 टॉप खेलता है तो सही और अन्यथा सही

दाईं ओर इस खेल का सामान्य-रूप प्रतिनिधित्व है।

सामान्य सूत्रीकरण

किसी खेल को सामान्य रूप में लाने के लिए, हमें निम्नलिखित डेटा प्रदान किया जाता है:

खिलाड़ियों का एक सीमित समुच्चय I है, प्रत्येक खिलाड़ी को i द्वारा दर्शाया जाता है। प्रत्येक खिलाड़ी के पास शुद्ध रणनीति की एक सीमित k संख्या होती है

एक शुद्ध रणनीति प्रोफ़ाइल खिलाड़ियों के लिए रणनीतियों का एक संघ है, जो कि एक आई-ट्यूपल है

ऐसा है कि

अदायगी फलन एक फलन है

जिसकी इच्छित व्याख्या खेल के परिणाम पर एकल खिलाड़ी को दिया जाने वाला पुरस्कार है। इसलिए , किसी खेल को पूर्ण रूप से निर्दिष्ट करने के लिए, खिलाड़ी समुच्चय I= {1, 2, ..., I} में प्रत्येक खिलाड़ी के लिए भुगतान फलन निर्दिष्ट करना होगा।

'परिभाषा': सामान्य रूप में एक खेल एक संरचना है

जहाँ :

खिलाड़ियों का एक समूह है,

शुद्ध रणनीति समुच्चय ों का एक आई-टुपल है, प्रत्येक खिलाड़ी के लिए एक, और

भुगतान कार्यों का एक I-टुपल है।

संदर्भ

  • Fudenberg, D.; Tirole, J. (1991). Game Theory. MIT Press. ISBN 0-262-06141-4.
  • Leyton-Brown, Kevin; Shoham, Yoav (2008). Essentials of Game Theory: A Concise, Multidisciplinary Introduction. San Rafael, CA: Morgan & Claypool Publishers. ISBN 978-1-59829-593-1.. An 88-page mathematical introduction; free online at many universities.
  • Luce, R. D.; Raiffa, H. (1989). Games and Decisions. Dover Publications. ISBN 0-486-65943-7.
  • Shoham, Yoav; Leyton-Brown, Kevin (2009). Multiagent Systems: Algorithmic, Game-Theoretic, and Logical Foundations. New York: Cambridge University Press. ISBN 978-0-521-89943-7.. A comprehensive reference from a computational perspective; see Chapter 3. Downloadable free online.
  • Weibull, J. (1996). Evolutionary Game Theory. MIT Press. ISBN 0-262-23181-6.
  • J. von Neumann and O. Morgenstern, Theory of games and Economic Behavior, John Wiley Science Editions, 1964. Which was originally published in 1944 by Princeton University Press.