सामान्य रूप का खेल: Difference between revisions
No edit summary |
No edit summary |
||
Line 3: | Line 3: | ||
[[खेल सिद्धांत]] में, सामान्य रूप एक ''खेल'' का वर्णन है। व्यापक रूप वाले खेल के विपरीत, सामान्य-रूप का प्रतिनिधित्व ग्राफ़ (अलग-अलग गणित) नहीं होता है, किंतु एक [[मैट्रिक्स (गणित)|आव्यूह (गणित)]] के माध्यम से खेल का प्रतिनिधित्व करता है। चूँकि यह दृष्टिकोण सख्ती से प्रभुत्व वाली रणनीतियों और [[नैश संतुलन]] की पहचान करने में अधिक उपयोगी हो सकता है, किंतु व्यापक-रूप प्रतिनिधित्व की तुलना में कुछ जानकारी खो जाती है। किसी गेम के सामान्य रूप के प्रतिनिधित्व में प्रत्येक खिलाड़ी के लिए सभी बोधगम्य और बोधगम्य रणनीति (गेम सिद्धांत ), और उनके संबंधित भुगतान सम्मिलित होते हैं। | [[खेल सिद्धांत]] में, सामान्य रूप एक ''खेल'' का वर्णन है। व्यापक रूप वाले खेल के विपरीत, सामान्य-रूप का प्रतिनिधित्व ग्राफ़ (अलग-अलग गणित) नहीं होता है, किंतु एक [[मैट्रिक्स (गणित)|आव्यूह (गणित)]] के माध्यम से खेल का प्रतिनिधित्व करता है। चूँकि यह दृष्टिकोण सख्ती से प्रभुत्व वाली रणनीतियों और [[नैश संतुलन]] की पहचान करने में अधिक उपयोगी हो सकता है, किंतु व्यापक-रूप प्रतिनिधित्व की तुलना में कुछ जानकारी खो जाती है। किसी गेम के सामान्य रूप के प्रतिनिधित्व में प्रत्येक खिलाड़ी के लिए सभी बोधगम्य और बोधगम्य रणनीति (गेम सिद्धांत ), और उनके संबंधित भुगतान सम्मिलित होते हैं। | ||
पूर्ण जानकारी, संपूर्ण जानकारी के स्थिर खेलों में, खेल का एक सामान्य-रूप प्रतिनिधित्व खिलाड़ियों की रणनीति स्थानों और भुगतान कार्यों का एक विनिर्देश है। एक खिलाड़ी के लिए एक रणनीति स्थान उस खिलाड़ी के लिए उपलब्ध सभी रणनीतियों का | पूर्ण जानकारी, संपूर्ण जानकारी के स्थिर खेलों में, खेल का एक सामान्य-रूप प्रतिनिधित्व खिलाड़ियों की रणनीति स्थानों और भुगतान कार्यों का एक विनिर्देश है। एक खिलाड़ी के लिए एक रणनीति स्थान उस खिलाड़ी के लिए उपलब्ध सभी रणनीतियों का समुच्चय है, जबकि एक रणनीति खेल के हर चरण के लिए कार्य की एक पूर्ण योजना है, तथापि वह चरण वास्तव में खेल में उत्पन्न हुआ हो या नहीं। एक खिलाड़ी के लिए भुगतान खिलाड़ियों के रणनीति स्थानों के क्रॉस-उत्पाद से उस खिलाड़ी के भुगतान के समुच्चय (सामान्य रूप से वास्तविक संख्याओं का समुच्चय , जहां संख्या एक [[कार्डिनल उपयोगिता]] या क्रमिक उपयोगिता का प्रतिनिधित्व करती है - अधिकांशतः सामान्य में कार्डिनल-) की मानचित्र होती है। एक खिलाड़ी का फॉर्म प्रतिनिधित्व) अथार्त एक खिलाड़ी का भुगतान फलन अपने इनपुट के रूप में एक रणनीति प्रोफ़ाइल लेता है (जो कि प्रत्येक खिलाड़ी के लिए रणनीतियों का एक विनिर्देश है) और इसके आउटपुट के रूप में भुगतान का प्रतिनिधित्व उत्पन्न करता है। | ||
== एक उदाहरण == | == एक उदाहरण == | ||
{| class="wikitable" style="float:right; text-align:center; margin-left:1em;" | {| class="wikitable" style="float:right; text-align:center; margin-left:1em;" | ||
|+ | |+ एक सामान्य रूप का खेल | ||
! {{diagonal split header|{{color|#009|<br />Player 1}}|{{color|#900|Player 2}}}} | ! {{diagonal split header|{{color|#009|<br />Player 1}}|{{color|#900|Player 2}}}} | ||
! scope="col" | {{color|#900| | ! scope="col" | {{color|#900|बाएं}} | ||
! scope="col" | {{color|#900| | ! scope="col" | {{color|#900|दाहिने}} | ||
|- | |- | ||
! scope="col" | | ! scope="col" | शीर्ष | ||
| {{color|#009|4}}, {{color|#900|3}} | | {{color|#009|4}}, {{color|#900|3}} | ||
| {{color|#009|−1}}, {{color|#900|−1}} | | {{color|#009|−1}}, {{color|#900|−1}} | ||
|- | |- | ||
! scope="col" | | ! scope="col" | नीचे | ||
| {{color|#009|0}}, {{color|#900|0}} | | {{color|#009|0}}, {{color|#900|0}} | ||
| {{color|#009|3}}, {{color|#900|4}} | | {{color|#009|3}}, {{color|#900|4}} | ||
|} | |} | ||
प्रदान किया गया आव्यूह एक गेम का एक सामान्य-रूप प्रतिनिधित्व है जिसमें खिलाड़ी एक साथ चलते हैं (या कम से कम अपने कदम उठाने से पहले दूसरे खिलाड़ी की चाल का निरीक्षण नहीं करते हैं) और खेले गए कार्यों के संयोजन के लिए निर्दिष्ट भुगतान प्राप्त करते हैं। उदाहरण के लिए, यदि खिलाड़ी 1 शीर्ष पर खेलता है और खिलाड़ी 2 बाईं ओर खेलता है, तो खिलाड़ी 1 को 4 मिलते हैं और खिलाड़ी 2 को 3 मिलते हैं। प्रत्येक सेल में, पहला नंबर पंक्ति के खिलाड़ी को भुगतान दर्शाता है (इस स्थिति में खिलाड़ी 1), और दूसरा नंबर स्तम्भ प्लेयर को भुगतान का प्रतिनिधित्व करता है (इस स्थिति में प्लेयर 2)। | अतः प्रदान किया गया आव्यूह एक गेम का एक सामान्य-रूप प्रतिनिधित्व है जिसमें खिलाड़ी एक साथ चलते हैं (या कम से कम अपने कदम उठाने से पहले दूसरे खिलाड़ी की चाल का निरीक्षण नहीं करते हैं) और खेले गए कार्यों के संयोजन के लिए निर्दिष्ट भुगतान प्राप्त करते हैं। उदाहरण के लिए, यदि खिलाड़ी 1 शीर्ष पर खेलता है और खिलाड़ी 2 बाईं ओर खेलता है, तो खिलाड़ी 1 को 4 मिलते हैं और खिलाड़ी 2 को 3 मिलते हैं। प्रत्येक सेल में, पहला नंबर पंक्ति के खिलाड़ी को भुगतान दर्शाता है (इस स्थिति में खिलाड़ी 1), और दूसरा नंबर स्तम्भ प्लेयर को भुगतान का प्रतिनिधित्व करता है (इस स्थिति में प्लेयर 2)। | ||
=== अन्य प्रतिनिधित्व === | === अन्य प्रतिनिधित्व === | ||
प्रायः, [[सममित खेल]] (जहां भुगतान इस बात पर निर्भर नहीं होता है कि कौन सा खिलाड़ी प्रत्येक क्रिया को चुनता है) को केवल एक भुगतान के साथ दर्शाया जाता है। यह पंक्ति खिलाड़ी के लिए भुगतान है. उदाहरण के लिए, नीचे दाईं और बाईं ओर भुगतान आव्यूह एक ही खेल का प्रतिनिधित्व करते हैं। | |||
{| style="margin:0 auto;text-align:center;" | {| style="margin:0 auto;text-align:center;" | ||
Line 59: | Line 59: | ||
|} | |} | ||
संबंधित भुगतान आव्यूह वाले गेम के टोपोलॉजिकल स्पेस को भी | संबंधित भुगतान आव्यूह वाले गेम के टोपोलॉजिकल स्पेस को भी मानचित्र किया जा सकता है, आसन्न गेम में अधिक समान आव्यूह होते हैं। इससे पता चलता है कि कैसे वृद्धिशील प्रोत्साहन परिवर्तन खेल में परिवर्तित कर सकते हैं। | ||
== सामान्य रूप का उपयोग == | == सामान्य रूप का उपयोग == | ||
Line 107: | Line 107: | ||
# यदि खिलाड़ी 1 शीर्ष खेलता है तो बाएँ और अन्यथा दाएँ | # यदि खिलाड़ी 1 शीर्ष खेलता है तो बाएँ और अन्यथा दाएँ | ||
# यदि खिलाड़ी 1 टॉप खेलता है तो दाएँ और अन्यथा बाएँ | # यदि खिलाड़ी 1 टॉप खेलता है तो दाएँ और अन्यथा बाएँ | ||
# | # यदि खिलाड़ी 1 टॉप खेलता है तो सही और अन्यथा सही | ||
दाईं ओर इस खेल का सामान्य-रूप प्रतिनिधित्व है। | दाईं ओर इस खेल का सामान्य-रूप प्रतिनिधित्व है। | ||
Line 114: | Line 114: | ||
किसी खेल को सामान्य रूप में लाने के लिए, हमें निम्नलिखित डेटा प्रदान किया जाता है: | किसी खेल को सामान्य रूप में लाने के लिए, हमें निम्नलिखित डेटा प्रदान किया जाता है: | ||
खिलाड़ियों का एक सीमित | खिलाड़ियों का एक सीमित समुच्चय I है, प्रत्येक खिलाड़ी को i द्वारा दर्शाया जाता है। प्रत्येक खिलाड़ी के पास [[शुद्ध रणनीति]] की एक सीमित k संख्या होती है | ||
::<math> S_i = \{1, 2, \ldots, k\}. </math> | ::<math> S_i = \{1, 2, \ldots, k\}. </math> | ||
Line 126: | Line 126: | ||
:<math> u_i: S_1 \times S_2 \times \ldots \times S_I \rightarrow \mathbb{R}. </math> | :<math> u_i: S_1 \times S_2 \times \ldots \times S_I \rightarrow \mathbb{R}. </math> | ||
जिसकी इच्छित व्याख्या खेल के परिणाम पर एकल खिलाड़ी को दिया जाने वाला पुरस्कार है। इसलिए , किसी खेल को | जिसकी इच्छित व्याख्या खेल के परिणाम पर एकल खिलाड़ी को दिया जाने वाला पुरस्कार है। इसलिए , किसी खेल को पूर्ण रूप से निर्दिष्ट करने के लिए, खिलाड़ी समुच्चय I= {1, 2, ..., I} में प्रत्येक खिलाड़ी के लिए भुगतान फलन निर्दिष्ट करना होगा। | ||
'परिभाषा': सामान्य रूप में एक खेल एक संरचना है | 'परिभाषा': सामान्य रूप में एक खेल एक संरचना है | ||
Line 138: | Line 138: | ||
:<math>\mathbf{S}= \{S_1, S_2, \ldots, S_I\} </math> | :<math>\mathbf{S}= \{S_1, S_2, \ldots, S_I\} </math> | ||
शुद्ध रणनीति | शुद्ध रणनीति समुच्चय ों का एक आई-टुपल है, प्रत्येक खिलाड़ी के लिए एक, और | ||
:<math> \mathbf{u} = \{u_1, u_2, \ldots, u_I\} </math> | :<math> \mathbf{u} = \{u_1, u_2, \ldots, u_I\} </math> |
Revision as of 18:29, 30 July 2023
खेल सिद्धांत में, सामान्य रूप एक खेल का वर्णन है। व्यापक रूप वाले खेल के विपरीत, सामान्य-रूप का प्रतिनिधित्व ग्राफ़ (अलग-अलग गणित) नहीं होता है, किंतु एक आव्यूह (गणित) के माध्यम से खेल का प्रतिनिधित्व करता है। चूँकि यह दृष्टिकोण सख्ती से प्रभुत्व वाली रणनीतियों और नैश संतुलन की पहचान करने में अधिक उपयोगी हो सकता है, किंतु व्यापक-रूप प्रतिनिधित्व की तुलना में कुछ जानकारी खो जाती है। किसी गेम के सामान्य रूप के प्रतिनिधित्व में प्रत्येक खिलाड़ी के लिए सभी बोधगम्य और बोधगम्य रणनीति (गेम सिद्धांत ), और उनके संबंधित भुगतान सम्मिलित होते हैं।
पूर्ण जानकारी, संपूर्ण जानकारी के स्थिर खेलों में, खेल का एक सामान्य-रूप प्रतिनिधित्व खिलाड़ियों की रणनीति स्थानों और भुगतान कार्यों का एक विनिर्देश है। एक खिलाड़ी के लिए एक रणनीति स्थान उस खिलाड़ी के लिए उपलब्ध सभी रणनीतियों का समुच्चय है, जबकि एक रणनीति खेल के हर चरण के लिए कार्य की एक पूर्ण योजना है, तथापि वह चरण वास्तव में खेल में उत्पन्न हुआ हो या नहीं। एक खिलाड़ी के लिए भुगतान खिलाड़ियों के रणनीति स्थानों के क्रॉस-उत्पाद से उस खिलाड़ी के भुगतान के समुच्चय (सामान्य रूप से वास्तविक संख्याओं का समुच्चय , जहां संख्या एक कार्डिनल उपयोगिता या क्रमिक उपयोगिता का प्रतिनिधित्व करती है - अधिकांशतः सामान्य में कार्डिनल-) की मानचित्र होती है। एक खिलाड़ी का फॉर्म प्रतिनिधित्व) अथार्त एक खिलाड़ी का भुगतान फलन अपने इनपुट के रूप में एक रणनीति प्रोफ़ाइल लेता है (जो कि प्रत्येक खिलाड़ी के लिए रणनीतियों का एक विनिर्देश है) और इसके आउटपुट के रूप में भुगतान का प्रतिनिधित्व उत्पन्न करता है।
एक उदाहरण
Player 2 Player 1 |
बाएं | दाहिने |
---|---|---|
शीर्ष | 4, 3 | −1, −1 |
नीचे | 0, 0 | 3, 4 |
अतः प्रदान किया गया आव्यूह एक गेम का एक सामान्य-रूप प्रतिनिधित्व है जिसमें खिलाड़ी एक साथ चलते हैं (या कम से कम अपने कदम उठाने से पहले दूसरे खिलाड़ी की चाल का निरीक्षण नहीं करते हैं) और खेले गए कार्यों के संयोजन के लिए निर्दिष्ट भुगतान प्राप्त करते हैं। उदाहरण के लिए, यदि खिलाड़ी 1 शीर्ष पर खेलता है और खिलाड़ी 2 बाईं ओर खेलता है, तो खिलाड़ी 1 को 4 मिलते हैं और खिलाड़ी 2 को 3 मिलते हैं। प्रत्येक सेल में, पहला नंबर पंक्ति के खिलाड़ी को भुगतान दर्शाता है (इस स्थिति में खिलाड़ी 1), और दूसरा नंबर स्तम्भ प्लेयर को भुगतान का प्रतिनिधित्व करता है (इस स्थिति में प्लेयर 2)।
अन्य प्रतिनिधित्व
प्रायः, सममित खेल (जहां भुगतान इस बात पर निर्भर नहीं होता है कि कौन सा खिलाड़ी प्रत्येक क्रिया को चुनता है) को केवल एक भुगतान के साथ दर्शाया जाता है। यह पंक्ति खिलाड़ी के लिए भुगतान है. उदाहरण के लिए, नीचे दाईं और बाईं ओर भुगतान आव्यूह एक ही खेल का प्रतिनिधित्व करते हैं।
|
|
संबंधित भुगतान आव्यूह वाले गेम के टोपोलॉजिकल स्पेस को भी मानचित्र किया जा सकता है, आसन्न गेम में अधिक समान आव्यूह होते हैं। इससे पता चलता है कि कैसे वृद्धिशील प्रोत्साहन परिवर्तन खेल में परिवर्तित कर सकते हैं।
सामान्य रूप का उपयोग
प्रभुत्व वाली रणनीतियाँ
Player 2 Player 1 |
सहयोग | त्रुटि |
---|---|---|
सहयोग | −1, −1 | −5, 0 |
त्रुटि | 0, −5 | −2, −2 |
अदायगी आव्यूह प्रभुत्व वाली रणनीति को समाप्त करने की सुविधा प्रदान करता है, और इसका उपयोग समान्यत: इस अवधारणा को चित्रित करने के लिए किया जाता है। उदाहरण के लिए, प्रिजनर डिलेम्मा में, हम देख सकते हैं कि प्रत्येक कैदी या तो सहयोग कर सकता है या गलती कर सकता है। यदि वास्तव में एक कैदी गलती करता है, तो वह सरलता से छूट जाता है और दूसरा कैदी लंबे समय तक संवर्त रहता है। चूँकि , यदि वे दोनों पक्षत्याग करते हैं, तो उन दोनों को थोड़े समय के लिए संवर्त कर दिया जाएगा। कोई यह निर्धारित कर सकता है कि सहयोग पर दोष का सख्ती से प्रभुत्व है। प्रत्येक स्तम्भ में पहली संख्याओं की तुलना करनी चाहिए, इस स्थिति में 0 > −1 और −2 > −5। इससे पता चलता है कि स्तम्भ प्लेयर चाहे जो भी चुने, पंक्ति प्लेयर दोष चुनकर उत्तम प्रदर्शन करता है। इसी प्रकार, प्रत्येक पंक्ति में दूसरे भुगतान की तुलना की जाती है; पुनः 0 > −1 और −2 > −5. इससे पता चलता है कि कोई अंतर नहीं पड़ता कि पंक्ति क्या करती है, दोष चुनने से स्तम्भ उत्तम काम करता है। यह दर्शाता है कि इस खेल का अद्वितीय नैश संतुलन (दोष, दोष) है।
सामान्य रूप में अनुक्रमिक खेल
Player 2 Player 1 |
बाएँ, बाएँ | बाएँ दांए | दाएं से बाएं | दाएं , दाएं |
---|---|---|---|---|
शीर्ष | 4, 3 | 4, 3 | −1, −1 | −1, −1 |
तल | 0, 0 | 3, 4 | 0, 0 | 3, 4 |
ये आव्यूह केवल उन खेलों का प्रतिनिधित्व करते हैं जिनमें चालें एक साथ होती हैं (या, अधिक सामान्यतः, जानकारी पूर्ण जानकारी होती है)। उपरोक्त आव्यूह उस खेल का प्रतिनिधित्व नहीं करता है जिसमें खिलाड़ी 1 पहले चलता है, जिसे खिलाड़ी 2 द्वारा देखा जाता है, और फिर खिलाड़ी 2 चलता है, क्योंकि यह इस स्थिति में खिलाड़ी 2 की प्रत्येक रणनीति को निर्दिष्ट नहीं करता है। इस अनुक्रमिक खेल का प्रतिनिधित्व करने के लिए हमें खिलाड़ी 2 के सभी कार्यों को निर्दिष्ट करना होगा, यहां तक कि उन आकस्मिकताओं में भी जो खेल के समय कभी उत्पन्न नहीं हो सकती हैं। इस गेम में, खिलाड़ी 2 के पास पहले की तरह बाएँ और दाएँ क्रियाएँ हैं। पहले के विपरीत, उसके पास चार रणनीतियाँ हैं, जो खिलाड़ी 1 के कार्यों पर निर्भर करती हैं। रणनीतियाँ हैं:
- यदि खिलाड़ी 1 टॉप खेलता है तो बाएँ और अन्यथा बाएँ
- यदि खिलाड़ी 1 शीर्ष खेलता है तो बाएँ और अन्यथा दाएँ
- यदि खिलाड़ी 1 टॉप खेलता है तो दाएँ और अन्यथा बाएँ
- यदि खिलाड़ी 1 टॉप खेलता है तो सही और अन्यथा सही
दाईं ओर इस खेल का सामान्य-रूप प्रतिनिधित्व है।
सामान्य सूत्रीकरण
किसी खेल को सामान्य रूप में लाने के लिए, हमें निम्नलिखित डेटा प्रदान किया जाता है:
खिलाड़ियों का एक सीमित समुच्चय I है, प्रत्येक खिलाड़ी को i द्वारा दर्शाया जाता है। प्रत्येक खिलाड़ी के पास शुद्ध रणनीति की एक सीमित k संख्या होती है
एक शुद्ध रणनीति प्रोफ़ाइल खिलाड़ियों के लिए रणनीतियों का एक संघ है, जो कि एक आई-ट्यूपल है
ऐसा है कि
अदायगी फलन एक फलन है
जिसकी इच्छित व्याख्या खेल के परिणाम पर एकल खिलाड़ी को दिया जाने वाला पुरस्कार है। इसलिए , किसी खेल को पूर्ण रूप से निर्दिष्ट करने के लिए, खिलाड़ी समुच्चय I= {1, 2, ..., I} में प्रत्येक खिलाड़ी के लिए भुगतान फलन निर्दिष्ट करना होगा।
'परिभाषा': सामान्य रूप में एक खेल एक संरचना है
जहाँ :
खिलाड़ियों का एक समूह है,
शुद्ध रणनीति समुच्चय ों का एक आई-टुपल है, प्रत्येक खिलाड़ी के लिए एक, और
भुगतान कार्यों का एक I-टुपल है।
संदर्भ
- Fudenberg, D.; Tirole, J. (1991). Game Theory. MIT Press. ISBN 0-262-06141-4.
- Leyton-Brown, Kevin; Shoham, Yoav (2008). Essentials of Game Theory: A Concise, Multidisciplinary Introduction. San Rafael, CA: Morgan & Claypool Publishers. ISBN 978-1-59829-593-1.. An 88-page mathematical introduction; free online at many universities.
- Luce, R. D.; Raiffa, H. (1989). Games and Decisions. Dover Publications. ISBN 0-486-65943-7.
- Shoham, Yoav; Leyton-Brown, Kevin (2009). Multiagent Systems: Algorithmic, Game-Theoretic, and Logical Foundations. New York: Cambridge University Press. ISBN 978-0-521-89943-7.. A comprehensive reference from a computational perspective; see Chapter 3. Downloadable free online.
- Weibull, J. (1996). Evolutionary Game Theory. MIT Press. ISBN 0-262-23181-6.
- J. von Neumann and O. Morgenstern, Theory of games and Economic Behavior, John Wiley Science Editions, 1964. Which was originally published in 1944 by Princeton University Press.