सामान्य रूप का खेल

From Vigyanwiki
Revision as of 09:19, 19 July 2023 by alpha>Indicwiki (Created page with "{{Short description|Representation of a game in game theory}} {{Redirect|Matrix game|Chris Engle's game|Storytelling game#Alternate form role-playing games|the publisher|Matri...")
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

खेल सिद्धांत में, सामान्य रूप एक खेल का वर्णन है। व्यापक रूप वाले खेल के विपरीत, सामान्य-रूप का प्रतिनिधित्व ग्राफ़ (अलग-अलग गणित) नहीं होता है, बल्कि एक मैट्रिक्स (गणित) के माध्यम से खेल का प्रतिनिधित्व करता है। हालांकि यह दृष्टिकोण सख्ती से प्रभुत्व वाली रणनीतियों और नैश संतुलन की पहचान करने में अधिक उपयोगी हो सकता है, लेकिन व्यापक-रूप प्रतिनिधित्व की तुलना में कुछ जानकारी खो जाती है। किसी गेम के सामान्य रूप के प्रतिनिधित्व में प्रत्येक खिलाड़ी के लिए सभी बोधगम्य और बोधगम्य रणनीति (गेम थ्योरी), और उनके संबंधित भुगतान शामिल होते हैं।

पूर्ण जानकारी, संपूर्ण जानकारी के स्थिर खेलों में, खेल का एक सामान्य-रूप प्रतिनिधित्व खिलाड़ियों की रणनीति स्थानों और भुगतान कार्यों का एक विनिर्देश है। एक खिलाड़ी के लिए एक रणनीति स्थान उस खिलाड़ी के लिए उपलब्ध सभी रणनीतियों का सेट है, जबकि एक रणनीति खेल के हर चरण के लिए कार्य की एक पूरी योजना है, भले ही वह चरण वास्तव में खेल में उत्पन्न हुआ हो या नहीं। एक खिलाड़ी के लिए भुगतान फ़ंक्शन खिलाड़ियों के रणनीति स्थानों के क्रॉस-उत्पाद से उस खिलाड़ी के भुगतान के सेट (सामान्य रूप से वास्तविक संख्याओं का सेट, जहां संख्या एक कार्डिनल उपयोगिता या क्रमिक उपयोगिता का प्रतिनिधित्व करती है - अक्सर सामान्य में कार्डिनल-) की मैपिंग होती है। एक खिलाड़ी का फॉर्म प्रतिनिधित्व) यानी एक खिलाड़ी का भुगतान फ़ंक्शन अपने इनपुट के रूप में एक रणनीति प्रोफ़ाइल लेता है (जो कि प्रत्येक खिलाड़ी के लिए रणनीतियों का एक विनिर्देश है) और इसके आउटपुट के रूप में भुगतान का प्रतिनिधित्व उत्पन्न करता है।

एक उदाहरण

A normal-form game
Player 2

Player 1
Left Right
Top 4, 3 −1, −1
Bottom 0, 0 3, 4

प्रदान किया गया मैट्रिक्स एक गेम का एक सामान्य-रूप प्रतिनिधित्व है जिसमें खिलाड़ी एक साथ चलते हैं (या कम से कम अपने कदम उठाने से पहले दूसरे खिलाड़ी की चाल का निरीक्षण नहीं करते हैं) और खेले गए कार्यों के संयोजन के लिए निर्दिष्ट भुगतान प्राप्त करते हैं। उदाहरण के लिए, यदि खिलाड़ी 1 शीर्ष पर खेलता है और खिलाड़ी 2 बाईं ओर खेलता है, तो खिलाड़ी 1 को 4 मिलते हैं और खिलाड़ी 2 को 3 मिलते हैं। प्रत्येक सेल में, पहला नंबर पंक्ति के खिलाड़ी को भुगतान दर्शाता है (इस मामले में खिलाड़ी 1), और दूसरा नंबर कॉलम प्लेयर को भुगतान का प्रतिनिधित्व करता है (इस मामले में प्लेयर 2)।

अन्य प्रतिनिधित्व

फ़ाइल:2x2chart110602.pdf|thumb|दो-खिलाड़ियों, दो-रणनीति वाले खेलों की एक आंशिक टोपोलॉजी, जिसमें प्रिज़नर्स डिलमाइक, हरिण का शिकार और चिकन (खेल) जैसे गेम शामिल हैं।

अक्सर, सममित खेल (जहां भुगतान इस बात पर निर्भर नहीं होता है कि कौन सा खिलाड़ी प्रत्येक क्रिया को चुनता है) को केवल एक भुगतान के साथ दर्शाया जाता है। यह पंक्ति खिलाड़ी के लिए भुगतान है. उदाहरण के लिए, नीचे दाईं और बाईं ओर भुगतान मैट्रिक्स एक ही खेल का प्रतिनिधित्व करते हैं।

Both players
Player 2

Player 1
Stag Hare
Stag 3, 3 0, 2
Hare 2, 0 2, 2
Just row
Player 2

Player 1
Stag Hare
Stag 3 0
Hare 2 2

संबंधित भुगतान मैट्रिक्स वाले गेम के टोपोलॉजिकल स्पेस को भी मैप किया जा सकता है, आसन्न गेम में सबसे समान मैट्रिक्स होते हैं। इससे पता चलता है कि कैसे वृद्धिशील प्रोत्साहन परिवर्तन खेल को बदल सकते हैं।

सामान्य रूप का उपयोग

प्रभुत्व वाली रणनीतियाँ

The Prisoner's Dilemma
Player 2

Player 1
Cooperate Defect
Cooperate −1, −1 −5, 0
Defect 0, −5 −2, −2

अदायगी मैट्रिक्स प्रभुत्व वाली रणनीति को खत्म करने की सुविधा प्रदान करता है, और इसका उपयोग आमतौर पर इस अवधारणा को चित्रित करने के लिए किया जाता है। उदाहरण के लिए, कैदी की दुविधा में, हम देख सकते हैं कि प्रत्येक कैदी या तो सहयोग कर सकता है या गलती कर सकता है। यदि वास्तव में एक कैदी गलती करता है, तो वह आसानी से छूट जाता है और दूसरा कैदी लंबे समय तक बंद रहता है। हालाँकि, यदि वे दोनों दलबदल करते हैं, तो उन दोनों को थोड़े समय के लिए बंद कर दिया जाएगा। कोई यह निर्धारित कर सकता है कि सहयोग पर दोष का सख्ती से प्रभुत्व है। प्रत्येक कॉलम में पहली संख्याओं की तुलना करनी चाहिए, इस मामले में 0 > −1 और −2 > −5। इससे पता चलता है कि कॉलम प्लेयर चाहे जो भी चुने, पंक्ति प्लेयर दोष चुनकर बेहतर प्रदर्शन करता है। इसी प्रकार, प्रत्येक पंक्ति में दूसरे भुगतान की तुलना की जाती है; पुनः 0 > −1 और −2 > −5. इससे पता चलता है कि कोई फर्क नहीं पड़ता कि पंक्ति क्या करती है, दोष चुनने से कॉलम बेहतर काम करता है। यह दर्शाता है कि इस खेल का अद्वितीय नैश संतुलन (दोष, दोष) है।

सामान्य रूप में अनुक्रमिक खेल

उप-गेम अपूर्ण और पूर्ण नैश संतुलन के साथ अनुक्रमिक गेम का व्यापक और सामान्य रूप चित्रण क्रमशः लाल और नीले रंग से चिह्नित है।
A sequential game
Player 2

Player 1
Left, Left Left, Right Right, Left Right, Right
Top 4, 3 4, 3 −1, −1 −1, −1
Bottom 0, 0 3, 4 0, 0 3, 4

ये मैट्रिक्स केवल उन खेलों का प्रतिनिधित्व करते हैं जिनमें चालें एक साथ होती हैं (या, अधिक सामान्यतः, जानकारी पूर्ण जानकारी होती है)। उपरोक्त मैट्रिक्स उस खेल का प्रतिनिधित्व नहीं करता है जिसमें खिलाड़ी 1 पहले चलता है, जिसे खिलाड़ी 2 द्वारा देखा जाता है, और फिर खिलाड़ी 2 चलता है, क्योंकि यह इस मामले में खिलाड़ी 2 की प्रत्येक रणनीति को निर्दिष्ट नहीं करता है। इस अनुक्रमिक खेल का प्रतिनिधित्व करने के लिए हमें खिलाड़ी 2 के सभी कार्यों को निर्दिष्ट करना होगा, यहां तक ​​​​कि उन आकस्मिकताओं में भी जो खेल के दौरान कभी उत्पन्न नहीं हो सकती हैं। इस गेम में, खिलाड़ी 2 के पास पहले की तरह बाएँ और दाएँ क्रियाएँ हैं। पहले के विपरीत, उसके पास चार रणनीतियाँ हैं, जो खिलाड़ी 1 के कार्यों पर निर्भर करती हैं। रणनीतियाँ हैं:

  1. यदि खिलाड़ी 1 टॉप खेलता है तो बाएँ और अन्यथा बाएँ
  2. यदि खिलाड़ी 1 शीर्ष खेलता है तो बाएँ और अन्यथा दाएँ
  3. यदि खिलाड़ी 1 टॉप खेलता है तो दाएँ और अन्यथा बाएँ
  4. अगर खिलाड़ी 1 टॉप खेलता है तो सही और अन्यथा सही

दाईं ओर इस खेल का सामान्य-रूप प्रतिनिधित्व है।

सामान्य सूत्रीकरण

किसी खेल को सामान्य रूप में लाने के लिए, हमें निम्नलिखित डेटा प्रदान किया जाता है:

खिलाड़ियों का एक सीमित सेट I है, प्रत्येक खिलाड़ी को i द्वारा दर्शाया जाता है। प्रत्येक खिलाड़ी के पास शुद्ध रणनीति की एक सीमित k संख्या होती है

pure strategy profile खिलाड़ियों के लिए रणनीतियों का एक संघ है, जो एक आई-टपल है

ऐसा है कि

payoff function एक फ़ंक्शन है

जिसकी इच्छित व्याख्या खेल के नतीजे पर एकल खिलाड़ी को दिया जाने वाला पुरस्कार है। तदनुसार, किसी खेल को पूरी तरह से निर्दिष्ट करने के लिए, खिलाड़ी सेट I= {1, 2, ..., I} में प्रत्येक खिलाड़ी के लिए भुगतान फ़ंक्शन निर्दिष्ट करना होगा।

'परिभाषा': सामान्य रूप में एक खेल एक संरचना है

कहाँ:

खिलाड़ियों का एक समूह है,

शुद्ध रणनीति सेटों का एक आई-टुपल है, प्रत्येक खिलाड़ी के लिए एक, और

भुगतान कार्यों का एक I-टुपल है।

संदर्भ

  • Fudenberg, D.; Tirole, J. (1991). Game Theory. MIT Press. ISBN 0-262-06141-4.
  • Leyton-Brown, Kevin; Shoham, Yoav (2008). Essentials of Game Theory: A Concise, Multidisciplinary Introduction. San Rafael, CA: Morgan & Claypool Publishers. ISBN 978-1-59829-593-1.. An 88-page mathematical introduction; free online at many universities.
  • Luce, R. D.; Raiffa, H. (1989). Games and Decisions. Dover Publications. ISBN 0-486-65943-7.
  • Shoham, Yoav; Leyton-Brown, Kevin (2009). Multiagent Systems: Algorithmic, Game-Theoretic, and Logical Foundations. New York: Cambridge University Press. ISBN 978-0-521-89943-7.. A comprehensive reference from a computational perspective; see Chapter 3. Downloadable free online.
  • Weibull, J. (1996). Evolutionary Game Theory. MIT Press. ISBN 0-262-23181-6.
  • J. von Neumann and O. Morgenstern, Theory of games and Economic Behavior, John Wiley Science Editions, 1964. Which was originally published in 1944 by Princeton University Press.