पश्चवर्ती प्रवर्तन: Difference between revisions

From Vigyanwiki
No edit summary
 
(12 intermediate revisions by 4 users not shown)
Line 1: Line 1:
{{Short description|Process of reasoning backwards in time}}
{{Short description|Process of reasoning backwards in time}}
{{distinguish|Backpropagation}}
{{distinguish|Backpropagation}}
पीछे की ओर प्रेरण किसी समस्या या स्थिति के अंत से इष्टतम क्रियाओं के क्रम को निर्धारित करने के लिए समय में पीछे की ओर तर्क करने की प्रक्रिया है यह अंतिम बिंदु की जांच करके आगे बढ़ता है जिस पर निर्णय लिया जाना है और फिर यह पहचानना है कि उस समय कौन सी कार्रवाई सबसे सही होगी इस जानकारी का उपयोग करके कोई यह निर्धारित कर सकता है कि निर्णय के दूसरे-से-अंतिम समय में क्या करना है यह प्रक्रिया पीछे की ओर तब तक जारी रहती है जब तक कि हर समय हर संभव स्थिति यानी हर संभव [[सूचना सेट (गेम थ्योरी)|सूचना समूह खेल की परिभाषा]] के लिए सबसे अच्छी कार्रवाई निर्धारित नहीं की जाती है पीछे की ओर प्रेरण का पहली बार उपयोग 1875 में [[आर्थर केली]] द्वारा किया गया था जिन्होंने विख्यात [[सचिव समस्या]] को हल करने की कोशिश करते हुए इस विधि को उजागर किया गया था <ref>{{cite book |last1=Rust |first1=John |title=गतिशील प्रोग्रामिंग|date=9 September 2016 |publisher=Palgrave Macmillan |location=The New Palgrave Dictionary of Economics |isbn=978-1-349-95121-5}}</ref>[[गतिशील प्रोग्रामिंग|गतिशील कार्यक्रम]] के गणितीय [[अनुकूलन (गणित)|अनुकूलन गणित]] पद्धति में [[बेलमैन समीकरण]] को हल करने के लिए पीछे की ओर प्रेरण मुख्य तरीकों में से एक है <ref>Jerome Adda and Russell Cooper, "[https://books.google.com/books?id=d6MD_DWhqwwC&q=Bellman&pg=PA1 Dynamic Economics: Quantitative Methods and Applications]", Section 3.2.1, page 28. MIT Press, 2003.</ref><ref>Mario Miranda and Paul Fackler, "[https://books.google.com/books?id=yMXxCwAAQBAJ&q=Bellman&pg=PR7 Applied Computational Economics and Finance]", Section 7.3.1, page 164. MIT Press, 2002.</ref> [[ खेल सिद्धांत ]]में पीछे की ओर प्रेरण [[अनुक्रमिक खेल]] में [[सबगेम पूर्णता|सब खेल पूर्णता]] की गणना करने के लिए उपयोग की जाने वाली एक विधि है इसमें <ref>Drew Fudenberg and Jean Tirole, "Game Theory", Section 3.5, page 92. MIT Press, 1991.</ref> अंतर केवल इतना है कि अनुकूलन में एक [[निर्णय सिद्धांत]] सम्मिलित होता है जो प्रत्येक समय पर क्या करना है यह चुनता है जबकि खेल सिद्धांत विश्लेषण   कई खिलाड़ियों रखेल  के निर्णय कैसे परस्पर क्रिया करते हैं अर्थात् यह अनुमान लगाकर कि प्रत्येक स्थिति में अंतिम खिलाड़ी क्या करेगा यह निर्धारित करना संभव है कि दूसरा खिलाड़ी क्या करेगा इत्यादि [[स्वचालित योजना और शेड्यूलिंग]] और स्वचालित प्रमेय को प्रमाण देने के क्षेत्र में इस विधि को पीछे की ओर खोज या [[बैकवर्ड चेनिंग|पीछे की ओर श्रृंखलन]] कहा जाता है शतरंज में इसे [[प्रतिगामी विश्लेषण]] कहा जाता है
पश्चवर्ती प्रवर्तन किसी समस्या या स्थिति के अंत से इष्टतम क्रियाओं के क्रम को निर्धारित करने के लिए पश्चवर्ती प्रवर्तन की ओर तर्क करने की प्रक्रिया है यह प्रवर्तन अंतिम बिंदु की जांच करके आगे बढ़ता है जिस पर निर्णय लिया जाता है और फिर यह पहचाना जाता है कि उस समय कौन सी कार्रवाई सबसे सही होगी इस जानकारी का उपयोग करके यह निर्धारित किया जा सकता है कि निर्णय के दूसरे या अंतिम समय में क्या करना है यह प्रक्रिया   तब तक जारी रहती है जब तक कि हर समय हर संभव स्थिति यानी हर संभव [[सूचना सेट (गेम थ्योरी)|सूचना समूह खेल की परिभाषा]] की सबसे अच्छी कार्रवाई निर्धारित नहीं कर लेती है पश्चवर्ती प्रवर्तन का उपयोग 1875 में [[आर्थर केली]] द्वारा किया गया था जिन्होंने विख्यात [[सचिव समस्या]] को हल करने की कोशिश करते हुए इस विधि को उजागर किया गया था <ref>{{cite book |last1=Rust |first1=John |title=गतिशील प्रोग्रामिंग|date=9 September 2016 |publisher=Palgrave Macmillan |location=The New Palgrave Dictionary of Economics |isbn=978-1-349-95121-5}}</ref>[[गतिशील प्रोग्रामिंग|गतिशील कार्यक्रम]] के गणितीय [[अनुकूलन (गणित)|अनुकूलन गणित]] पद्धति में [[बेलमैन समीकरण]] को हल करने के लिए पश्चवर्ती प्रवर्तन के मुख्य तरीकों में से एक है <ref>Jerome Adda and Russell Cooper, "[https://books.google.com/books?id=d6MD_DWhqwwC&q=Bellman&pg=PA1 Dynamic Economics: Quantitative Methods and Applications]", Section 3.2.1, page 28. MIT Press, 2003.</ref><ref>Mario Miranda and Paul Fackler, "[https://books.google.com/books?id=yMXxCwAAQBAJ&q=Bellman&pg=PR7 Applied Computational Economics and Finance]", Section 7.3.1, page 164. MIT Press, 2002.</ref> [[ खेल सिद्धांत ]]में पश्चवर्ती प्रवर्तन की [[अनुक्रमिक खेल]] में [[सबगेम पूर्णता|उप खेल पूर्णता]] की गणना करने के लिए उपयोग की जाने वाली एक विधि है इसमें <ref>Drew Fudenberg and Jean Tirole, "Game Theory", Section 3.5, page 92. MIT Press, 1991.</ref> अंतर केवल इतना है कि अनुकूलन में एक [[निर्णय सिद्धांत]] सम्मिलित होता है जो प्रत्येक समय पर क्या करना है यह चुनता है जबकि खेल सिद्धांत विश्लेषण कई खिलाड़ियों के निर्णय कैसे क्रिया करते हैं अर्थात् यह अनुमान लगाकर कि प्रत्येक स्थिति में अंतिम खिलाड़ी क्या करेगा यह निर्धारित करना संभव है कि दूसरा खिलाड़ी क्या करेगा इत्यादि [[स्वचालित योजना और शेड्यूलिंग]] और स्वचालित प्रमेय को प्रमाण देने के क्षेत्र में इस विधि को पश्चवर्ती प्रवर्तन खोज या [[बैकवर्ड चेनिंग|पश्चवर्ती प्रवर्तन श्रृंखलन]] कहा जाता है शतरंज में इसे [[प्रतिगामी विश्लेषण]] भी कहा जाता है


जब तक खेल परिभाषा का क्षेत्र एकत्र है तब तक खेलों को हल करने के लिए पीछे की ओर प्रेरण का उपयोग किया जाता रहा है [[जॉन वॉन न्यूमैन]] और [[ऑस्कर मॉर्गनस्टर्न]] ने अपनी 'थ्योरी ऑफ गेम्स एंड इकोनॉमिक बिहेवियर' 1944 में पीछे की ओर प्रेरण द्वारा [[शून्य राशि]] में दो व्यक्ति ने खेल को हल करने का सुझाव दिया जिसने खेल परिभाषा को अध्ययन के क्षेत्र के रूप में स्थापित किया।<ref name=":0">[http://www-groups.dcs.st-and.ac.uk/~history/Projects/MacQuarrie/Chapters/Ch4.html Mathematics of Chess], webpage by John MacQuarrie.</ref><ref>John von Neumann and Oskar Morgenstern, "Theory of Games and Economic Behavior", Section 15.3.1. Princeton University Press. [https://archive.org/details/theoryofgamesand030098mbp Third edition, 1953.] (First edition, 1944.)</ref>
जब तक खेल परिभाषा का क्षेत्र एकत्र है तब तक खेलों को हल करने के लिए पश्चवर्ती प्रवर्तन का उपयोग किया जाता है [[जॉन वॉन न्यूमैन]] और [[ऑस्कर मॉर्गनस्टर्न]] ने अपनी 'थ्योरी ऑफ गेम्स एंड इकोनॉमिक बिहेवियर' 1944 में पश्चवर्ती प्रवर्तन द्वारा [[शून्य राशि]] में दो व्यक्ति ने खेल को हल करने का सुझाव दिया जिसने खेल को अध्ययन के क्षेत्र के रूप में स्थापित किया।<ref name=":0">[http://www-groups.dcs.st-and.ac.uk/~history/Projects/MacQuarrie/Chapters/Ch4.html Mathematics of Chess], webpage by John MacQuarrie.</ref><ref>John von Neumann and Oskar Morgenstern, "Theory of Games and Economic Behavior", Section 15.3.1. Princeton University Press. [https://archive.org/details/theoryofgamesand030098mbp Third edition, 1953.] (First edition, 1944.)</ref>




==निर्णय लेने में पीछे की ओर प्रेरण एक इष्टतम रोक की समस्या==
==निर्णय लेने में पश्चवर्ती प्रवर्तन एक इष्टतम रोक की समस्या==


एक बेरोजगार व्यक्ति पर विचार करें जो दस वर्षों तक काम करने में सक्षम होगा t = 1,2,...,10 मान लीजिए कि प्रत्येक वर्ष जिसमें वे बेरोजगार रहते हैं उन्हें एक 'अच्छी' नौकरी की पेशकश की जा सकती है जो $100 का भुगतान करती है या एक खराब नौकरी जो $44 का भुगतान करती है समान संभावना 50/50 के साथ एक बार जब वे नौकरी स्वीकार कर लेते हैं तो वे दस वर्षों तक उस नौकरी में बने रहेंगे सरलता के लिए मान लें कि वे केवल अपनी मौद्रिक कमाई के बारे में परवाह करते हैं और वे अलग-अलग समय पर कमाई को समान रूप से महत्व देते हैं यानी [[समय वरीयता]] एक है।
एक बेरोजगार व्यक्ति पर विचार करें जो दस वर्षों तक काम करने में सक्षम होगा t = 1,2,...,10 मान लीजिए कि प्रत्येक वर्ष जिसमें वे बेरोजगार रहते हैं उन्हें एक अच्छी नौकरी की पेशकश की जा सकती है जो 100 डॉलर का भुगतान करती है जबकि एक खराब नौकरी जो 44 डॉलर का भुगतान करती है समान संभावना 50/50 के साथ एक बार जब वे नौकरी स्वीकार कर लेते हैं तो वे दस वर्षों तक उस नौकरी में बने रहते हैं सरलता के लिए मान लें कि वे केवल अपनी मौद्रिक कमाई के बारे में परवाह करते हैं और वे अलग-अलग समय पर कमाई को समान रूप से महत्व देते हैं यानी [[समय वरीयता]] एक है।


क्या इस व्यक्ति को खराब नौकरी स्वीकार करनी चाहिए इस प्रश्न का उत्तर देने के लिए हम समय t = 10 से पीछे की ओर तर्क कर सकते हैं।
क्या इस व्यक्ति को खराब नौकरी स्वीकार करनी चाहिए इस प्रश्न का उत्तर देने के लिए हम समय t = 10 से पीछे की ओर तर्क कर सकते हैं।
*समय 10 पर एक अच्छी नौकरी स्वीकार करने का मूल्य $100 है खराब नौकरी को स्वीकार करने का मूल्य $44 है उपलब्ध नौकरी को अस्वीकार करने का मूल्य शून्य है इसलिए यदि वे अंतिम अवधि में अभी भी बेरोजगार हैं तो उन्हें उस समय जो भी नौकरी की पेशकश की जाती है उसे स्वीकार कर लेना चाहिए।
*समय 10 पर एक अच्छी नौकरी स्वीकार करने का मूल्य 100 डॉलर है तथा खराब नौकरी को स्वीकार करने का मूल्य 44 डॉलर है इसमें उपलब्ध नौकरी को अस्वीकार करने का मूल्य शून्य है इसलिए यदि वे अंतिम अवधि में अभी भी बेरोजगार हैं तो उन्हें उस समय जो भी नौकरी पेश की जाती है उसे स्वीकार कर लेना चाहिए।
*समय 9 पर एक अच्छी नौकरी स्वीकार करने का मूल्य $200 है क्योंकि वह नौकरी दो साल तक चलेगी खराब नौकरी को स्वीकार करने का मूल्य 2*$44 = $88 है नौकरी की पेशकश को स्वीकार करने का मूल्य अब $ 0 है साथ ही अगले नौकरी की पेशकश की प्रतीक्षा करने का मूल्य जो 0.5 के औसत के अपेक्षित मूल्य के लिए या तो 50 प्रतिशत संभावना के साथ $ 44 या 50 प्रतिशत के साथ $ 100 होगा $100+$44 = $72 इसलिए इस बात की परवाह किए बिना कि 9 समय पर उपलब्ध नौकरी अच्छी है या बुरी उस प्रस्ताव को स्वीकार करना बेहतर है।
*समय 9 पर एक अच्छी नौकरी स्वीकार करने का मूल्य 200 डॉलर है क्योंकि वह नौकरी दो साल तक चलेगी खराब नौकरी को स्वीकार करने का मूल्य 2*44 डॉलर= 88 डॉलर है नौकरी की पेशकश को स्वीकार करने का मूल्य अब 0 डॉलर है साथ ही अगले नौकरी की पेशकश की प्रतीक्षा करने का मूल्य जो 0.5 के औसत के अपेक्षित मूल्य के लिए या तो 50 प्रतिशत संभावना के साथ 44 डॉलर या 50 प्रतिशत के साथ 100 डॉलर होगा 100 डॉलर+44 डॉलर = 72 डॉलर इसलिए इस बात की परवाह किए बिना कि नौकरी अच्छी है या बुरी उस प्रस्ताव को स्वीकार करना बेहतर है।
*समय 8 पर एक अच्छी नौकरी स्वीकार करने का मूल्य $300 है यह तीन साल तक चलेगा खराब नौकरी को स्वीकार करने का मूल्य 3*$44 = $132 है नौकरी की पेशकश को अस्वीकार करने का मूल्य अब $ 0 है साथ ही समय 9 पर नौकरी की पेशकश की प्रतीक्षा करने का मूल्य निम्न है चूंकि हम पहले ही निष्कर्ष निकाल चुके हैं कि समय 9 पर प्रस्तावों को स्वीकार किया जाना चाहिए समय 9 पर नौकरी की पेशकश की प्रतीक्षा करने का अपेक्षित मूल्य 0.5*$200+$88 = $144 है इसलिए 8 बजे तक खराब नौकरी स्वीकार करने की तुलना में अगले प्रस्ताव की प्रतीक्षा करना अधिक मूल्यवान है।
*समय 8 पर एक अच्छी नौकरी स्वीकार करने का मूल्य 300 डॉलर है यह तीन साल तक चलेगा खराब नौकरी को स्वीकार करने का मूल्य 3*44 डॉलर = 132 डॉलर है नौकरी की पेशकश को अस्वीकार करने का मूल्य अब 0 डॉलर है साथ ही नौकरी की पेशकश की प्रतीक्षा करने का मूल्य निम्न है चूंकि हम पहले ही निष्कर्ष निकाल चुके हैं कि प्रस्तावों को स्वीकार किया जाना चाहिए नौकरी की पेशकश की प्रतीक्षा करने का अपेक्षित मूल्य 0.5*200+88 डॉलर =144 डॉलर है इसलिए खराब नौकरी स्वीकार करने की तुलना में अगले प्रस्ताव की प्रतीक्षा करना अधिक मूल्यवान है।


पीछे की ओर काम करना जारी रखकर यह सत्यापित किया जा सकता है कि खराब प्रस्तावों को केवल तभी स्वीकार किया जाना चाहिए जब कोई 9 या 10 बार बेरोजगार हो उन्हें हर समय t = 8 तक समाप्त कर दिया जाना चाहिए अंतर्ज्ञान यह है कि यदि कोई लंबे समय तक नौकरी में काम करने की उम्मीद करता है तो इससे यह अधिक मूल्यवान हो जाता है कि हमें किस नौकरी को स्वीकार करना है।
पश्चवर्ती प्रवर्तन यह सत्यापित करता है कि खराब प्रस्तावों को केवल तभी स्वीकार किया जाना चाहिए जब कोई 9 या 10 बार बेरोजगार हो उन्हें हर समय t = 8 तक समाप्त कर दिया जाना चाहिए अंतर्ज्ञान यह है कि यदि कोई लंबे समय तक नौकरी में काम करने की आशा करता है तो इससे यह अधिक मूल्यवान हो जाता है कि हमें किस नौकरी को स्वीकार करना है।


इस तरह की एक गतिशील अनुकूलन समस्या को [[इष्टतम रोक]] समस्या कहा जाता है क्योंकि बेहतर प्रस्ताव की प्रतीक्षा कब बंद करनी है [[खोज सिद्धांत]] सूक्ष्म अर्थशास्त्र का क्षेत्र है जो इस प्रकार की समस्याओं को खरीदारी नौकरी की खोज और विवाह जैसे संदर्भों में लागू करता है।
इस तरह की एक गतिशील अनुकूलन समस्या को [[इष्टतम रोक]] समस्या कहा जाता है क्योंकि बेहतर प्रस्ताव की प्रतीक्षा कब बंद करनी है [[खोज सिद्धांत]] सूक्ष्म अर्थशास्त्र का क्षेत्र है जो इस प्रकार की समस्याओं को खरीदारी नौकरी की खोज और विवाह जैसे संदर्भों में लागू करता है।


== खेल परिभाषा में पीछे की ओर प्रेरण ==
== खेल परिभाषा में पश्चवर्ती प्रवर्तन ==


खेल परिभाषा में पीछे की ओर प्रेरण एक समाधान अवधारणा है यह तर्कसंगत अवधारणा का परिशोधन है जो एक खेल के व्यापक रूप के प्रतिनिधित्व में व्यक्तिगत सूचना समूह के प्रति संवेदनशील है <ref>{{cite book |last1=Watson |first1=Joel |title=Strategy: an introduction to game theory |date=2002 |publisher=W.W. Norton & Company |location=New York |page=63 |edition=3}}</ref> पीछे की ओर प्रेरण का विचार किसी दिए गए [[ खेल का पेड़ |खेल का पेड़]] में प्रत्येक जानकारी के लिए एक इष्टतम क्रिया की पहचान करके अनुक्रमिक तर्कसंगतता का उपयोग करता है।
खेल परिभाषा में पश्चवर्ती प्रवर्तन एक समाधान अवधारणा है यह तर्कसंगत अवधारणा का परिशोधन है जो एक खेल को व्यापक रूप में प्रतिनिधित्व व्यक्तिगत सूचना समूह के प्रति संवेदनशील है <ref>{{cite book |last1=Watson |first1=Joel |title=Strategy: an introduction to game theory |date=2002 |publisher=W.W. Norton & Company |location=New York |page=63 |edition=3}}</ref> पश्चवर्ती प्रवर्तन का विचार किसी दिए गए [[ खेल का पेड़ |खेल]] में प्रत्येक जानकारी के लिए एक इष्टतम क्रिया की पहचान करके अनुक्रमिक तर्कसंगतता का उपयोग करता है।


जोएल वाटसन द्वारा रणनीति खेल परिभाषा का एक परिचय में पीछे की ओर प्रेरण प्रक्रिया को इस प्रकार परिभाषित किया गया है तथा यह अंत से शुरुआत तक खेल का विश्लेषण करने की प्रक्रिया प्रत्येक निर्णय नोड पर किसी भी कार्रवाई पर विचार किया जाता है टर्मिनल नोड्स को देखते हुए जो उत्तराधिकारी नोड्स पर पहचाने गए कार्यों के खेल के माध्यम से पहुंचाया जा सकता है <ref>{{cite book |last1=Watson |first1=Joel |title=Strategy: an introduction to game theory |date=2002 |publisher=W.W. Norton & Company |location=New York |pages=186–187 |edition=3}}</ref> पीछे की ओर प्रेरण प्रक्रिया का एक दोष यह है कि इसे केवल खेलों की सीमित कक्षाओं में ही लागू किया जा सकता है उपयोगिता के बंधनों के बिना सही जानकारी के किसी भी खेल के लिए प्रक्रिया [[अच्छी तरह से परिभाषित]] है यह संबंधों के साथ सही जानकारी वाले खेलों के लिए भी अच्छी तरह से परिभाषित और सार्थक है जबकि यह एक से अधिक रणनीति परिचय की ओर ले जाता है इस प्रक्रिया को गैर-तुच्छ सूचना समूह वाले कुछ खेलों पर लागू किया जा सकता है लेकिन यह सामान्य रूप से अविश्वसनीय है सही जानकारी वाले खेलों को हल करने के लिए प्रक्रिया सबसे उपयुक्त है इसलिए यदि सभी खिलाड़ी अन्य खिलाड़ियों के कार्यों और प्रत्येक निर्णय नोड पर अदायगी के प्रति सचेत नहीं है तो पीछे की ओर प्रेरण इतनी आसानी से लागू नहीं होता है वाटसन ने <ref>{{cite book |last1=Watson |first1=Joel |title=Strategy: an introduction to game theory |date=2002 |publisher=W.W. Norton & Company |location=New York |page=188 |edition=3}}</ref>पीछे की ओर प्रेरण की प्रक्रिया को एक साधारण उदाहरण के साथ प्रदर्शित किया जा सकता है।
जोएल वाटसन द्वारा रणनीति खेल परिभाषा के एक परिचय में पश्चवर्ती प्रवर्तन प्रक्रिया को इस प्रकार परिभाषित किया गया है कि यह अंत से शुरुआत तक खेल का विश्लेषण करने की प्रक्रिया पर निर्भर है प्रत्येक निर्णय नोड किसी भी कार्रवाई पर विचार किया जाता है टर्मिनल नोड्स को देखते हुए जो उत्तराधिकारी नोड्स पर पहचाने गए कार्यों के खेल के माध्यम से पहुंचाया जा सकता है <ref>{{cite book |last1=Watson |first1=Joel |title=Strategy: an introduction to game theory |date=2002 |publisher=W.W. Norton & Company |location=New York |pages=186–187 |edition=3}}</ref> पश्चवर्ती प्रवर्तन प्रक्रिया का एक दोष यह है कि इसे केवल खेलों की सीमित कक्षाओं में ही लागू किया जा सकता है उपयोगिता के बंधनों के बिना सही जानकारी के किसी भी खेल के लिए प्रक्रिया [[अच्छी तरह से परिभाषित]] है यह संबंधों के साथ सही जानकारी वाले खेलों के लिए भी अच्छी तरह से परिभाषित और सार्थक है जबकि यह एक से अधिक रणनीति परिचय की ओर ले जाता है इस प्रक्रिया को गैर-तुच्छ सूचना समूह वाले कुछ खेलों पर लागू किया जा सकता है लेकिन यह सामान्य रूप से अविश्वसनीय है सही जानकारी वाले खेलों को हल करने के लिए प्रक्रिया सबसे उपयुक्त है इसलिए यदि सभी खिलाड़ी अन्य खिलाड़ियों के कार्यों और प्रत्येक निर्णय नोड के प्रति सचेत नहीं है तो पश्चवर्ती प्रवर्तन इतनी आसानी से लागू नहीं होता है वाटसन ने <ref>{{cite book |last1=Watson |first1=Joel |title=Strategy: an introduction to game theory |date=2002 |publisher=W.W. Norton & Company |location=New York |page=188 |edition=3}}</ref> पश्चवर्ती प्रवर्तन की प्रक्रिया को एक साधारण उदाहरण के साथ प्रदर्शित किया जा सकता है।


== गेम थ्योरी में बैकवर्ड इंडक्शन: [[मल्टी-स्टेज गेम]] ==
== खेल परिभाषा में पश्चवर्ती प्रवर्तन ==


प्रस्तावित गेम एक मल्टी-स्टेज गेम है जिसमें 2 खिलाड़ी शामिल हैं। खिलाड़ी फिल्म देखने जाने की योजना बना रहे हैं। वर्तमान में, 2 फिल्में हैं जो बहुत लोकप्रिय हैं, जोकर और टर्मिनेटर। खिलाड़ी 1 टर्मिनेटर देखना चाहता है और खिलाड़ी 2 जोकर देखना चाहता है। खिलाड़ी 1 पहले टिकट खरीदेगा और खिलाड़ी 2 को अपनी पसंद के बारे में बताएगा। फिर, खिलाड़ी 2 उसका टिकट खरीदेगा। एक बार जब वे दोनों विकल्पों का निरीक्षण कर लेते हैं, तो वे फिल्म जाने या घर पर रहने के बारे में चुनाव करेंगे। पहले चरण की तरह ही, खिलाड़ी 1 पहले चुनता है। प्लेयर 2 खिलाड़ी 1 की पसंद को देखने के बाद अपनी पसंद बनाता है।
प्रस्तावित खेल एक बहु चरण खेल है जिसमें 2 खिलाड़ी सम्मिलित हैं खिलाड़ी फिल्म देखने की योजना रहे हैं वर्तमान में 2 फिल्में हैं जोकर और टर्मिनेटर जो बहुत लोकप्रिय हैं खिलाड़ी 1 टर्मिनेटर देखना चाहता है और खिलाड़ी 2 जोकर देखना चाहता है इसलिए खिलाड़ी 1 पहले टिकट खरीदेगा और खिलाड़ी 2 को अपनी पसंद के बारे में बताएगा फिर खिलाड़ी 2 उसका टिकट खरीदेगा एक बार जब वे दोनों विकल्पों का निरीक्षण कर लेते हैं तो वे फिल्म जाने या घर पर रहने के बारे में चुनाव करेंगे पहले चरण की तरह ही खिलाड़ी 1 पहले चुनता है 2 खिलाड़ी 1 की पसंद को देखने के बाद अपनी पसंद बनाता है।


इस उदाहरण के लिए, हम मानते हैं कि अदायगी विभिन्न चरणों में जोड़ी जाती है। खेल एक संपूर्ण सूचना खेल है।
इस उदाहरण के लिए हम मानते हैं कि अदायगी विभिन्न चरणों में जोड़ी जाती है जो एक संपूर्ण सूचना खेल है।


[[सामान्य रूप का खेल]]|नॉर्मल-फ़ॉर्म मैट्रिक्स:
[[सामान्य रूप का खेल]]


{| class="wikitable" style="text-align:center;"
{| class="wikitable" style="text-align:center;"
Line 62: Line 62:
| -2, -2
| -2, -2
|}
|}
[[व्यापक रूप का खेल]] | एक्सटेंसिव-फॉर्म रिप्रेजेंटेशन:
[[व्यापक रूप का खेल]]  


[[File:Normal form game joker terminator.jpg|right|thumb|व्यापक फॉर्म गेम जोकर टर्मिनेटर]]इस मल्टी-स्टेज गेम को हल करने के चरण, व्यापक रूप से दाईं ओर देखे गए हैं:
इस बहु चरण खेल को हल करने के चरण व्यापक रूप से दाईं ओर देखे गए हैं
# बैकवर्ड इंडक्शन गेम को अंतिम नोड्स से हल करना शुरू करता है।
# पश्चवर्ती प्रवर्तन खेल को अंतिम नोड्स से हल करना शुरू करता है।
#खिलाड़ी 2 "गो टू मूवी" या "स्टे होम" चुनने के लिए अंतिम नोड्स से 8 [[ subgame ]]्स का अवलोकन करेगा
#खिलाड़ी 2 गो टू मूवी या स्टे होम चुनने के लिए अंतिम नोड्स से 8[[ subgame | उप खेल]] का अवलोकन करेगा।
##दूसरे खिलाड़ी से कुल 4 तुलनाएं होंगी। वह उच्च भुगतान के साथ एक विकल्प का चयन करेगा।
##दूसरे खिलाड़ी से कुल 4 तुलनाएं होंगी वह उच्च भुगतान के साथ एक विकल्प का चयन करेगा।  
##उदाहरण के लिए, पहले सबगेम पर विचार करते हुए, 11 का भुगतान 7 से अधिक है। इसलिए, खिलाड़ी 2 "मूवी पर जाएं" चुनता है।
##उदाहरण के लिए पहले उप खेल पर विचार करते हुए 11 का भुगतान 7 से अधिक है इसलिए खिलाड़ी 2 मूवी चुनता है।
##विधि प्रत्येक उपखेल के लिए जारी रहती है।
##विधि प्रत्येक उपखेल के लिए जारी रहती है।
#एक बार जब खिलाड़ी 2 अपनी पसंद पूरी कर लेता है, तो खिलाड़ी 1 चयनित सबगेम्स के आधार पर अपनी पसंद बनाएगा।
#एक बार जब खिलाड़ी 2 अपनी पसंद पूरी कर लेता है तो खिलाड़ी 1 चयनित उप खेलों के आधार पर अपनी पसंद बनाएगा।
##प्रक्रिया चरण 2 के समान है। खिलाड़ी 1 अपनी पसंद बनाने के लिए अपने भुगतान की तुलना करती है।
##प्रक्रिया चरण 2 के समान है खिलाड़ी 1 अपनी पसंद बनाने के लिए अपने भुगतान की तुलना करती है।
##पिछले चरण से प्लेयर 2 द्वारा नहीं चुने गए सबगेम्स पर अब दोनों खिलाड़ियों द्वारा विचार नहीं किया जाता है क्योंकि वे इष्टतम नहीं हैं।
##पिछले चरण से खिलाड़ी 2 द्वारा चुने गए उपखेल पर अब दोनों खिलाड़ियों द्वारा विचार नहीं किया जाता है क्योंकि वे इष्टतम नहीं हैं।
##उदाहरण के लिए, "गो टू मूवी" का विकल्प 9 (9,11) का भुगतान प्रदान करता है और "स्टे होम" का विकल्प 1 (1, 9) का भुगतान प्रदान करता है। प्लेयर 1 "मूवी पर जाएं" का चयन करेगा।
##उदाहरण के लिए गो टू मूवी का विकल्प 9,11 का भुगतान प्रदान करता है और स्टे होम का विकल्प 1, 9 का भुगतान प्रदान करता है खिलाड़ी 1 मूवी का चयन करेगा।
# प्रक्रिया प्रत्येक खिलाड़ी के लिए तब तक दोहराती है जब तक कि प्रारंभिक नोड तक नहीं पहुंच जाता।
# प्रक्रिया प्रत्येक खिलाड़ी के लिए तब तक दोहराती है जब तक कि प्रक्रिया प्रारंभिक नोड तक नहीं पहुंच जाता।
##उदाहरण के लिए, खिलाड़ी 2 "जोकर" को चुनेगा क्योंकि 11 (9, 11) का भुगतान 6 (6, 6) के भुगतान वाले "टर्मिनेटर" से अधिक है।
##उदाहरण के लिए खिलाड़ी 2 जोकर को चुनेगा क्योंकि 11 (9, 11) का भुगतान 6 (6, 6) के भुगतान वाले समापक से अधिक है।
##उदाहरण के लिए, खिलाड़ी 1, प्रारंभिक नोड पर, "टर्मिनेटर" का चयन करेगा क्योंकि यह 11 का उच्च भुगतान प्रदान करता है। टर्मिनेटर: (11, 9)> जोकर: (9, 11)
##उदाहरण के लिए खिलाड़ी 1 प्रारंभिक नोड पर समापक का चयन करेगा क्योंकि यह 11 का उच्च भुगतान प्रदान करता है समापक (11, 9)> जोकर (9, 11) चयन करता है।
# [[सबगेम सही संतुलन]] की पहचान करने के लिए, हमें एक मार्ग की पहचान करने की आवश्यकता है जो प्रत्येक सूचना सेट पर इष्टतम सबगेम का चयन करता है।
# [[सबगेम सही संतुलन|उप खेल में सही संतुलन]] की पहचान करने के लिए हमें एक मार्ग की पहचान करने की आवश्यकता है जो प्रत्येक सूचना समूह पर इष्टतम उप खेल का चयन करता है।
##इस उदाहरण में, खिलाड़ी 1 "टर्मिनेटर" चुनता है और खिलाड़ी 2 भी "टर्मिनेटर" चुनता है। फिर, वे दोनों "गो टू मूवी" चुनते हैं।
##इस उदाहरण में खिलाड़ी 1 टर्मिनेटर चुनता है और खिलाड़ी 2 भी टर्मिनेटर चुनता है फिर वे दोनों गो टू मूवी चुनते हैं।
## सबगेम सही संतुलन (11,9) के भुगतान की ओर ले जाता है
## उप खेल सही संतुलन (11,9) के भुगतान की ओर ले जाता है।


== गेम थ्योरी में बैकवर्ड इंडक्शन: अल्टीमेटम गेम ==
== खेल परिभाषा में पश्चवर्ती प्रवर्तन का अंतिम खेल ==


बैकवर्ड इंडक्शन 'एक गेम को अंत से शुरुआत तक विश्लेषण करने की प्रक्रिया है। अन्य [[नैश संतुलन]] के समाधान के साथ, खिलाड़ियों की तर्कसंगतता और पूर्ण ज्ञान ग्रहण किया जाता है। बैकवर्ड इंडक्शन की अवधारणा इस धारणा से मेल खाती है कि यह सामान्य ज्ञान है कि प्रत्येक खिलाड़ी प्रत्येक निर्णय नोड के साथ तर्कसंगत रूप से कार्य करेगा जब वह एक विकल्प चुनता है - भले ही उसकी तर्कसंगतता का अर्थ यह होगा कि ऐसा नोड नहीं पहुंचेगा।<ref>{{cite web |last1=Yildiz |first1=Muhamet |title=14.12 Game Theory Lecture Notes - Lectures 7-9 |url=http://web.mit.edu/14.12/www/02F_lecture7-9.pdf |website=web.mit.edu |access-date=3 November 2022 |archive-url=https://web.archive.org/web/20220912221307/http://web.mit.edu/14.12/www/02F_lecture7-9.pdf |archive-date=12 September 2022 |language=en-US |url-status=live}}</ref> तर्कसंगतता की पारस्परिक धारणा के तहत, इसलिए, बैकवर्ड इंडक्शन प्रत्येक खिलाड़ी को यह अनुमान लगाने की अनुमति देता है कि खेल के प्रत्येक चरण में उनका प्रतिद्वंद्वी क्या करेगा।
पश्चवर्ती प्रवर्तन एक खेल को अंत से शुरुआत तक विश्लेषण करने की प्रक्रिया है अन्य [[नैश संतुलन]] के समाधान के साथ खिलाड़ियों की तर्कसंगतता और पूर्ण ज्ञान ग्रहण किया जाता है पश्चवर्ती प्रवर्तन की अवधारणा इस धारणा से मेल खाती है कि यह सामान्य ज्ञान है और प्रत्येक खिलाड़ी प्रत्येक निर्णय नोड के साथ तर्कसंगत रूप से कार्य करेगा जब वह एक विकल्प चुनता है तो भले ही उसकी तर्कसंगतता का अर्थ यह हो कि यह ऐसा नोड नहीं है तर्कसंगतता की पारस्परिक धारणा के तहत पश्चवर्ती प्रवर्तन प्रत्येक खिलाड़ी को यह अनुमान लगाने की अनुमति देता है कि खेल के प्रत्येक चरण में उनका प्रतिद्वंद्वी क्या करेगा।


एक सबगेम के लिए बैकवर्ड इंडक्शन के साथ सही संतुलन को हल करने के लिए, गेम को एक्सटेंसिव-फॉर्म गेम में लिखा जाना चाहिए और फिर सबगेम्स में विभाजित किया जाना चाहिए। शुरुआती नोड, या शुरुआती बिंदु से सबगेम से शुरू होकर, इस सबगेम के लिए सूचीबद्ध अपेक्षित अदायगी को तौला जाता है और तर्कसंगत खिलाड़ी अपने लिए उच्च अदायगी वाले विकल्प का चयन करेगा। उच्चतम भुगतान वेक्टर का चयन और चिह्नित किया गया है। शुरुआती बिंदु पर पहुंचने तक सबगेम से सबगेम तक लगातार पीछे की ओर काम करके सबगेम सही संतुलन के लिए हल करें। जैसे-जैसे यह प्रक्रिया आगे बढ़ती है, आपका प्रारंभिक व्यापक रूप का खेल छोटा और छोटा होता जाएगा। सदिशों का चिन्हित पथ उपखेल पूर्ण संतुलन है।<ref>{{cite book |last1=Rust |first1=John |title=गतिशील प्रोग्रामिंग|date=9 September 2016 |publisher=Palgrave Macmillan |location=The New Palgrave Dictionary of Economics |isbn=978-1-349-95121-5}}</ref>
एक उप खेल के लिए पश्चवर्ती प्रवर्तन के साथ सही संतुलन को हल करने के लिए खेल को व्यापक खेल के रूप में लिखा जाना चाहिए और फिर उप खेलों में विभाजित किया जाना चाहिए शुरुआती नोड या शुरुआती बिंदु उपखेल से शुरू होकर इस उपखेल के लिए सूचीबद्ध अपेक्षित से तौला जाता है और तर्कसंगत खिलाड़ी अपने लिए उच्च विकल्प का चयन करेगा उच्चतम भुगतान चिह्नित किया गया है शुरुआती बिंदु पर पहुंचने तक उपखेल से लगातार पश्चवर्ती प्रवर्तन का काम करके उपखेल सही संतुलन के लिए हल करें जैसे-जैसे यह प्रक्रिया आगे बढ़ती है तो प्रारंभिक खेल छोटा होता जाएगा सदिशों का चिन्हित पथ उपखेल पूर्ण संतुलन है <ref>{{cite book |last1=Rust |first1=John |title=गतिशील प्रोग्रामिंग|date=9 September 2016 |publisher=Palgrave Macmillan |location=The New Palgrave Dictionary of Economics |isbn=978-1-349-95121-5}}</ref> पश्चवर्ती प्रवर्तन [[ अल्टीमेटम खेल | अंतिम खेल]] पर लागू होता है।
बैकवर्ड इंडक्शन [[ अल्टीमेटम खेल ]] पर लागू होता है


दो खिलाड़ियों के बीच एक खेल के बारे में सोचें जहां खिलाड़ी 1 खिलाड़ी 2 के साथ एक डॉलर बांटने का प्रस्ताव रखता है। यह एक प्रसिद्ध, असममित खेल है जिसे क्रमिक रूप से खेला जाता है जिसे अल्टीमेटम गेम कहा जाता है। खिलाड़ी एक डॉलर को विभाजित करके पहले कार्य करता है, हालांकि वे फिट दिखते हैं। अब, खिलाड़ी दो या तो खिलाड़ी एक द्वारा निपटाए गए हिस्से को स्वीकार कर सकते हैं या विभाजन को अस्वीकार कर सकते हैं। यदि खिलाड़ी 2 विभाजन को स्वीकार करता है, तो खिलाड़ी 1 और खिलाड़ी 2 दोनों को उस विभाजन के अनुसार अदायगी मिलती है। यदि खिलाड़ी दो खिलाड़ी 1 के प्रस्ताव को अस्वीकार करने का निर्णय लेता है, तो दोनों खिलाड़ियों को कुछ नहीं मिलता है। दूसरे शब्दों में, खिलाड़ी 2 के पास खिलाड़ी 1 के प्रस्तावित आवंटन पर वीटो शक्ति है लेकिन वीटो लागू करने से दोनों खिलाड़ियों के लिए कोई इनाम समाप्त हो जाता है।<ref>{{Cite journal|last=Kamiński|first=Marek M.|date=2017|title=Backward Induction: Merits And Flaws.|journal=Studies in Logic, Grammar and Rhetoric|volume=50|issue=1|pages=9–24|doi=10.1515/slgr-2017-0016|doi-access=free}}</ref> इसलिए इस गेम के लिए रणनीति प्रोफ़ाइल को 0 और 1 के बीच सभी x के लिए जोड़े (x, f(x)) के रूप में लिखा जा सकता है, जहां f(x)) एक द्वि-मूल्यवान फ़ंक्शन है जो यह व्यक्त करता है कि x स्वीकार किया गया है या नहीं।
दो खिलाड़ियों के बीच एक खेल के बारे में सोचें जहां खिलाड़ी 1 खिलाड़ी 2 के साथ एक डॉलर बांटने का प्रस्ताव रखता है यह एक प्रसिद्ध असममित खेल है जिसे क्रमिक रूप से खेला जाता है जिसे अंतिम खेल कहा जाता है खिलाड़ी एक डॉलर को विभाजित करके पहले कार्य करता है जबकि वे फिट दिखते हैं अब यह दो खिलाड़ी एक द्वारा निपटाए गए हिस्से को स्वीकार कर सकते हैं या विभाजन को अस्वीकार कर सकते हैं यदि खिलाड़ी 2 विभाजन को स्वीकार करता है तो खिलाड़ी 1 और खिलाड़ी 2 दोनों को उस विभाजन के अनुसार अदायगी मिलती है यदि खिलाड़ी दो खिलाड़ी 1 के प्रस्ताव को अस्वीकार करने का निर्णय लेता है तो दोनों खिलाड़ियों को कुछ नहीं मिलता है दूसरे शब्दों में खिलाड़ी 2 के पास खिलाड़ी 1 के प्रस्तावित आवंटन शक्ति हैं लेकिन रोक लागू करने से दोनों खिलाड़ियों के लिए इनाम समाप्त हो जाता है <ref>{{Cite journal|last=Kamiński|first=Marek M.|date=2017|title=Backward Induction: Merits And Flaws.|journal=Studies in Logic, Grammar and Rhetoric|volume=50|issue=1|pages=9–24|doi=10.1515/slgr-2017-0016|doi-access=free}}</ref> इसलिए इस खेल के लिए रणनीति परिचय को 0 और 1 के बीच सभी x के लिए जोड़े x, fx के रूप में लिखा जा सकता है जहां fx एक द्वि-मूल्यवान कार्यक्रम है जो यह व्यक्त करता है कि x स्वीकार किया गया है या नहीं।


खिलाड़ी 1 द्वारा किसी भी मनमाने प्रस्ताव को देखते हुए खिलाड़ी 2 की पसंद और प्रतिक्रिया पर विचार करें, यह मानते हुए कि प्रस्ताव $0 से बड़ा है। बैकवर्ड इंडक्शन का उपयोग करते हुए, निश्चित रूप से हम उम्मीद करेंगे कि खिलाड़ी 2 $0 से अधिक या उसके बराबर किसी भी अदायगी को स्वीकार करेगा। तदनुसार, खिलाड़ी 1 को विभाजन के सबसे बड़े हिस्से को हासिल करने के लिए जितना संभव हो उतना कम खिलाड़ी 2 देने का प्रस्ताव देना चाहिए। खिलाड़ी 1 खिलाड़ी 2 को पैसे की सबसे छोटी इकाई देना और बाकी को उसके लिए रखना अद्वितीय उप खेल सही संतुलन है। अल्टीमेटम गेम में कई अन्य नैश इक्विलिब्रिया होते हैं जो सबगेम परफेक्ट नहीं होते हैं और इसलिए बैकवर्ड इंडक्शन की आवश्यकता नहीं होती है।
खिलाड़ी 1 द्वारा किसी भी मनमाने प्रस्ताव को देखते हुए खिलाड़ी 2 की पसंद और प्रतिक्रिया पर विचार करें यह मानते हुए कि प्रस्ताव $0 से बड़ा है पीछे की ओर प्रेरण का उपयोग करते हुए निश्चित रूप से हम उम्मीद करेंगे कि खिलाड़ी 2 डॉलर 0 से अधिक या उसके बराबर किसी भी अदायगी को स्वीकार करेगा तदनुसार खिलाड़ी 1 को विभाजन के सबसे बड़े हिस्से को हासिल करने के लिए जितना संभव हो उतना कम खिलाड़ी देने का प्रस्ताव देना चाहिए लेकिन खिलाड़ी 1 खिलाड़ी 2 को पैसे की सबसे छोटी इकाई देना और संतुलन इसके लिए रखना अद्वितीय है जो उप खेल का सही संतुलन है।


अल्टीमेटम गेम अनंत खेलों पर विचार करते समय बैकवर्ड इंडक्शन की उपयोगिता का एक उदाहरण है; हालाँकि, खेल के सैद्धांतिक रूप से अनुमानित परिणामों की आलोचना की जाती है। अनुभवजन्य, प्रायोगिक साक्ष्यों से पता चला है कि प्रस्तावक शायद ही कभी $0 की ​​पेशकश करता है और खिलाड़ी 2 कभी-कभी निष्पक्षता के आधार पर $0 से अधिक के प्रस्तावों को भी अस्वीकार करता है। खिलाड़ी 2 द्वारा किसे उचित माना जाता है, यह संदर्भ के अनुसार भिन्न होता है और अन्य खिलाड़ियों के दबाव या उपस्थिति का मतलब यह हो सकता है कि गेम थ्योरिटिक मॉडल आवश्यक रूप से भविष्यवाणी नहीं कर सकता है कि वास्तविक लोग क्या चुनेंगे।
अंतिम चरण में खेल अनंत खेलों पर विचार करते समय पश्चवर्ती प्रवर्तन की उपयोगिता का एक उदाहरण है जबकि खेल के सैद्धांतिक रूप से अनुमानित परिणामों की आलोचना की जाती है प्रायोगिक साक्ष्यों से पता चला है कि प्रस्तावक ही कभी 0 डॉलर की ​​पेशकश करता है और खिलाड़ी 2 कभी-कभी निष्पक्षता के आधार पर 0 डॉलर से अधिक के प्रस्तावों को भी अस्वीकार करता है खिलाड़ी 2 द्वारा किसे उचित माना जाता है यह संदर्भ के अनुसार भिन्न होता है और अन्य खिलाड़ियों के दबाव या उपस्थिति का मतलब यह हो सकता है कि खेल परिभाषा प्रारूप आवश्यक रूप से भविष्यवाणी नहीं कर सकता है कि वास्तविक लोग क्या चुनेंगे।


व्यवहार में, सबगेम सही संतुलन हमेशा प्राप्त नहीं होता है। कैमरर के अनुसार, एक अमेरिकी व्यवहारवादी अर्थशास्त्री, खिलाड़ी 2 "लगभग आधे समय में एक्स के 20 प्रतिशत से कम के प्रस्तावों को अस्वीकार करता है, भले ही वे कुछ भी नहीं समाप्त करते हैं।"<ref>{{cite journal |last1=Camerer |first1=Colin F |title=व्यवहार गेम थ्योरी में प्रगति|journal=Journal of Economic Perspectives |date=1 November 1997 |volume=11 |issue=4 |pages=167–188 |doi=10.1257/jep.11.4.167 |jstor=2138470 |url=https://authors.library.caltech.edu/22122/ }}</ref> जबकि बैकवर्ड इंडक्शन यह भविष्यवाणी करेगा कि उत्तरदाता शून्य के बराबर या उससे अधिक के किसी भी प्रस्ताव को स्वीकार करता है, उत्तरदाता वास्तव में तर्कसंगत खिलाड़ी नहीं हैं और इसलिए संभावित मौद्रिक लाभ के बजाय 'निष्पक्षता' की पेशकश के बारे में अधिक ध्यान रखते हैं।
व्यवहार में उप खेल सही संतुलन हमेशा प्राप्त नहीं होता है कैमरर के अनुसार एक अमेरिकी व्यवहारवादी अर्थशास्त्री खिलाड़ी 2 लगभग आधे समय में एक्स के 20 प्रतिशत से कम के प्रस्तावों को करता है भले ही वे कुछ भी नहीं समाप्त करते हैं <ref>{{cite journal |last1=Camerer |first1=Colin F |title=व्यवहार गेम थ्योरी में प्रगति|journal=Journal of Economic Perspectives |date=1 November 1997 |volume=11 |issue=4 |pages=167–188 |doi=10.1257/jep.11.4.167 |jstor=2138470 |url=https://authors.library.caltech.edu/22122/ }}</ref> जबकि पश्चवर्ती प्रवर्तन यह भविष्यवाणी करेगा कि उत्तरदाता शून्य के बराबर या उससे अधिक किसी भी प्रस्ताव को स्वीकार करता है उत्तरदाता वास्तव में तर्कसंगत खिलाड़ी नहीं हैं और इसलिए संभावित मौद्रिक लाभ के अलावा निष्पक्षता की पेशकश के बारे में अधिक ध्यान रखते हैं।


[[कनखजूरा खेल]] भी देखें।
[[कनखजूरा खेल]]  


== अर्थशास्त्र में पिछड़ा प्रवेश: प्रवेश-निर्णय समस्या ==
== अर्थशास्त्र में पिछड़ा प्रवेश प्रवेश-निर्णय समस्या ==


एक [[गतिशील खेल]] पर विचार करें जिसमें खिलाड़ी एक उद्योग में एक मौजूदा फर्म हैं और उस उद्योग के संभावित प्रवेशकर्ता हैं। जैसा कि यह खड़ा है, अवलंबी का उद्योग पर [[एकाधिकार]] है और वह प्रवेशकर्ता को अपना कुछ बाजार हिस्सा खोना नहीं चाहता है। यदि प्रवेशकर्ता प्रवेश नहीं करना चुनता है, तो अवलंबी को अदायगी अधिक होती है (यह अपना एकाधिकार बनाए रखता है) और प्रवेशकर्ता न तो हारता है और न ही लाभ प्राप्त करता है (इसका भुगतान शून्य है)। यदि प्रवेशकर्ता प्रवेश करता है, तो अवलंबी प्रवेशकर्ता से लड़ सकता है या समायोजित कर सकता है। यह अपनी कीमत कम करके, प्रवेश करने वाले को व्यवसाय से बाहर (और बाहर निकलने की लागत - एक नकारात्मक अदायगी) चलाकर और अपने स्वयं के मुनाफे को नुकसान पहुँचाकर लड़ेगा। यदि यह प्रवेशकर्ता को समायोजित करता है तो इसकी बिक्री में कुछ कमी आएगी, लेकिन एक उच्च कीमत बनी रहेगी और इसकी कीमत कम करने की तुलना में इसे अधिक लाभ प्राप्त होगा (लेकिन एकाधिकार लाभ से कम)।
एक [[गतिशील खेल]] पर विचार करें जिसमें खिलाड़ी एक उद्योग में एक एकत्र फर्म हैं और उस उद्योग के संभावित प्रवेशकर्ता हैं जैसा कि यह खड़ा है अवलंबी का उद्योग पर [[एकाधिकार]] है और वह प्रवेशकर्ता को अपना कुछ बाजार हिस्सा खोना नहीं चाहता है यदि प्रवेशकर्ता प्रवेश नहीं चुनता है तो अवलंबी को अदायगी अधिक होती है यह अपना एकाधिकार बनाए रखता है और प्रवेशकर्ता न तो हारता है और न ही लाभ प्राप्त करता है इसका भुगतान शून्य है यदि प्रवेशकर्ता प्रवेश करता है तो अवलंबी प्रवेशकर्ता से लड़ सकता है या समायोजित कर सकता है यह अपनी कीमत कम करके प्रवेश करने वाले को व्यवसाय से बाहर और बाहर निकलने की लागत एक नकारात्मक अदायगी चलाकर और अपने स्वयं के मुनाफे को नुकसान पहुँचाकर लड़ेगा यदि यह प्रवेशकर्ता को समायोजित करता है तो इसकी बिक्री में कुछ कमी आएगी लेकिन एक उच्च कीमत बनी रहेगी और इसकी कीमत कम करने की तुलना में इसे अधिक लाभ प्राप्त होगा लेकिन एकाधिकार लाभ से कम है।


इस बात पर विचार करें कि यदि प्रवेशकर्ता प्रवेश करता है तो अवलंबी की सबसे अच्छी प्रतिक्रिया समायोजित करना है या नहीं। यदि अवलंबी समायोजित करता है, तो प्रवेशकर्ता की सबसे अच्छी प्रतिक्रिया प्रवेश करना (और लाभ प्राप्त करना) है। इसलिए रणनीति प्रोफ़ाइल जिसमें प्रवेशकर्ता प्रवेश करता है और यदि प्रवेशकर्ता प्रवेश करता है तो अवलंबी समायोजित करता है, पिछड़े प्रेरण के साथ संगत नैश संतुलन है। हालांकि, यदि अवलंबी लड़ने जा रहा है, तो प्रवेशकर्ता की सबसे अच्छी प्रतिक्रिया प्रवेश नहीं करना है, और यदि प्रवेशी प्रवेश नहीं करता है, तो इससे कोई फर्क नहीं पड़ता कि प्रवेशकर्ता प्रवेश करने वाले काल्पनिक मामले में क्या करना चाहता है। इसलिए रणनीति प्रोफ़ाइल जिसमें प्रवेश करने वाला प्रवेश करता है, लेकिन प्रवेशकर्ता प्रवेश नहीं करता है, तो वह नैश संतुलन भी है। हालांकि, प्रवेश करने वाले को विचलित करने और प्रवेश करने के लिए, अवलंबी की सबसे अच्छी प्रतिक्रिया समायोजित करना है - लड़ाई का खतरा विश्वसनीय नहीं है। इस दूसरे नैश संतुलन को पश्चगामी प्रेरण द्वारा समाप्त किया जा सकता है।
इस बात पर विचार करें कि यदि प्रवेशकर्ता प्रवेश करता है तो अवलंबी की सबसे अच्छी प्रतिक्रिया समायोजित करना है या नहीं यदि अवलंबी समायोजित करता है तो प्रवेशकर्ता की सबसे अच्छी प्रतिक्रिया प्रवेश करना और लाभ प्राप्त करना है इसलिए रणनीति परिचय जिसमें प्रवेशकर्ता प्रवेश करता है और यदि प्रवेशकर्ता प्रवेश करता है तो अवलंबी समायोजित करता है पिछड़े प्रेरण के साथ संगत संतुलन है जबकि यदि अवलंबी लड़ने जा रहा है तो प्रवेशकर्ता की सबसे अच्छी प्रतिक्रिया प्रवेश नहीं करना है और यदि प्रवेशी प्रवेश नहीं करता है तो इससे कोई फर्क नहीं पड़ता कि प्रवेशकर्ता प्रवेश करने वाले काल्पनिक जगहों में क्या करना चाहता है इसलिए रणनीति परिचय जिसमें प्रवेश करने वाला प्रवेश करता है लेकिन प्रवेशकर्ता प्रवेश नहीं करता है तो वह संतुलन भी है जबकि प्रवेश करने वाले को विचलित करने और प्रवेश करने के लिए अवलंबी की सबसे अच्छी प्रतिक्रिया समायोजित करना है लड़ाई का खतरा विश्वसनीय नहीं है इस दूसरे संतुलन को पश्चगामी प्रवर्तन द्वारा समाप्त किया जा सकता है।


प्रत्येक निर्णय लेने की प्रक्रिया (सबगेम) में नैश संतुलन ढूँढना पूर्ण सबगेम संतुलन के रूप में बनता है। इस प्रकार, ये रणनीति प्रोफाइल जो सबगेम सही संतुलन दर्शाती हैं, अविश्वसनीय खतरों जैसी कार्रवाइयों की संभावना को बाहर करती हैं जो एक प्रवेशी को डराने के लिए उपयोग की जाती हैं। यदि अवलंबी एक प्रवेशी के साथ मूल्य युद्ध शुरू करने की धमकी देता है, तो वे अपनी कीमतों को एक एकाधिकार मूल्य से प्रवेशकर्ता की तुलना में थोड़ा कम करने की धमकी दे रहे हैं, जो कि अव्यावहारिक और अविश्वसनीय होगा, यदि प्रवेशकर्ता जानता था कि मूल्य युद्ध वास्तव में नहीं होगा। क्योंकि इससे दोनों पक्षों को नुकसान होगा। एकल एजेंट अनुकूलन के विपरीत, जिसमें संतुलन शामिल है जो संभव या इष्टतम नहीं है, एक सबगेम सही संतुलन दूसरे खिलाड़ी के कार्यों के लिए खाता है, इस प्रकार यह सुनिश्चित करता है कि कोई भी खिलाड़ी उपगेम में गलती से नहीं पहुंचता है। इस मामले में, बैकवर्ड इंडक्शन यील्डिंग परफेक्ट सबगेम इक्विलिब्रिया यह सुनिश्चित करता है कि प्रवेशकर्ता यह जानकर कि यह रणनीति प्रोफ़ाइल में सबसे अच्छी प्रतिक्रिया नहीं थी, अवलंबी की धमकी के प्रति आश्वस्त नहीं होगा।<ref>Rust J. (2008) Dynamic Programming. In: Palgrave Macmillan (eds) The New Palgrave Dictionary of Economics. Palgrave Macmillan, London</ref>
प्रत्येक निर्णय लेने की प्रक्रिया उप खेल में नैश संतुलन ढूँढना पूर्ण संतुलन के रूप में बनता है इस प्रकार ये रणनीति परिचय जो सही संतुलन दर्शाती हैं अविश्वसनीय खतरों जैसी कार्रवाइयों की संभावना को बाहर करती हैं जो एक प्रवेशी को डराने के लिए उपयोग की जाती हैं यदि अवलंबी एक प्रवेशी के साथ मूल्य युद्ध शुरू करने की धमकी देता है तो वे अपनी कीमतों को एक एकाधिकार मूल्य से प्रवेशकर्ता की तुलना में थोड़ा कम करने की धमकी दे रहे हैं जो कि अव्यावहारिक और अविश्वसनीय होगा यदि प्रवेशकर्ता जानता था कि मूल्य युद्ध वास्तव में नहीं होगा क्योंकि इससे दोनों पक्षों को नुकसान होगा एकल अनुकूलन के विपरीत जिसमें संतुलन सम्मिलित है जो संभव या इष्टतम नहीं है एक उप खेल सही संतुलन दूसरे खिलाड़ी के कार्यों के लिए मेल खाता है तथा यह सुनिश्चित करता है कि कोई भी खिलाड़ी उप खेल में गलती से नहीं पहुंचता है इस जगह में पश्चवर्ती प्रवर्तन यह सुनिश्चित करता है कि प्रवेशकर्ता यह जानकर रणनीति परिचय में सबसे अच्छी प्रतिक्रिया नहीं बनाता तथा अवलंबी की धमकी के प्रति आश्वस्त नहीं होता है।<ref>Rust J. (2008) Dynamic Programming. In: Palgrave Macmillan (eds) The New Palgrave Dictionary of Economics. Palgrave Macmillan, London</ref>




== पिछड़ा प्रेरण [[विरोधाभास]]: अप्रत्याशित फांसी ==
== पिछड़ा प्रवर्तन [[विरोधाभास]] अप्रत्याशित फांसी ==


[[अप्रत्याशित फांसी विरोधाभास]] बैकवर्ड इंडक्शन से संबंधित विरोधाभास है। मान लीजिए किसी कैदी को बताया जाता है कि उसे अगले सप्ताह के सोमवार और शुक्रवार के बीच किसी समय फांसी दी जाएगी। हालांकि, सटीक दिन एक आश्चर्य होगा (यानी वह रात से पहले नहीं जान पाएगी कि उसे अगले दिन मार दिया जाएगा)। कैदी, अपने जल्लाद को चतुराई से मात देने में रुचि रखती है, यह निर्धारित करने का प्रयास करती है कि निष्पादन किस दिन होगा।
[[अप्रत्याशित फांसी विरोधाभास]] पश्चवर्ती प्रवर्तन से संबंधित विरोधाभास है मान लीजिए किसी कैदी को बताया जाता है कि उसे अगले सप्ताह के सोमवार और शुक्रवार के बीच किसी समय फांसी दी जाएगी जबकि सटीक दिन एक आश्चर्य होगा कि वह रात से पहले नहीं जान पाएगी कि उसे अगले दिन मार दिया दी जायेगी अपने जल्लाद को चतुराई से मात देने में रुचि रखती है यह निर्धारित करने का प्रयास करती है कि निष्पादन किस दिन होगा।


वह तर्क देती है कि यह शुक्रवार को नहीं हो सकता है, क्योंकि अगर यह गुरुवार के अंत तक नहीं हुआ होता, तो उसे पता होता कि निष्पादन शुक्रवार को होगा। इसलिए, वह शुक्रवार को एक संभावना के रूप में समाप्त कर सकती है। शुक्रवार को समाप्त होने के साथ, वह फैसला करती है कि यह गुरुवार को नहीं हो सकता, क्योंकि अगर यह बुधवार को नहीं हुआ होता, तो उसे पता होता कि यह गुरुवार को होना चाहिए। इसलिए वो गुरुवार को एलिमिनेट कर सकती हैं। यह तर्क तब तक आगे बढ़ता है जब तक कि उसने सभी संभावनाओं को समाप्त नहीं कर दिया। उसने निष्कर्ष निकाला कि उसे अगले सप्ताह फांसी नहीं दी जाएगी।
वह तर्क देती है कि यह शुक्रवार को नहीं हो सकता है क्योंकि अगर यह गुरुवार के अंत तक नहीं हुआ होता तो उसे पता होता कि निष्पादन शुक्रवार को होगा इसलिए वह शुक्रवार को एक संभावना के रूप में समाप्त कर सकती है शुक्रवार को समाप्त होने के साथ वह फैसला करती है कि यह गुरुवार को नहीं हो सकता क्योंकि अगर यह बुधवार को नहीं हुआ होता तो उसे पता होता कि यह गुरुवार को होना चाहिए इसलिए वो गुरुवार को निष्कासन कर सकती हैं यह तर्क तब तक आगे बढ़ता है जब तक कि उसने सभी संभावनाओं को समाप्त नहीं कर दिया उसने निष्कर्ष निकाला कि उसे अगले सप्ताह फांसी नहीं दी जाएगी।


उसके आश्चर्य करने के लिए, उसे बुधवार को फांसी दी गई। उसने यह मानने की गलती की कि वह निश्चित रूप से जानती है कि अज्ञात भविष्य का कारक जो उसके निष्पादन का कारण होगा वह वह था जिसके बारे में वह तर्क कर सकती थी।
उसके आश्चर्य करने के लिए उसे बुधवार को फांसी दी गई उसने यह मानने की गलती की कि वह निश्चित रूप से जानती है कि भविष्य का कारक जो उसके निष्पादन का कारण वह था जिसके बारे में वह तर्क कर सकती थी।


यहां कैदी पिछड़ा प्रेरण द्वारा तर्क करता है, लेकिन ऐसा लगता है कि वह गलत निष्कर्ष पर पहुंचा है। ध्यान दें, हालाँकि, समस्या का वर्णन यह मानता है कि किसी ऐसे व्यक्ति को आश्चर्यचकित करना संभव है जो बैकवर्ड इंडक्शन कर रहा है। बैकवर्ड इंडक्शन का गणितीय सिद्धांत यह धारणा नहीं बनाता है, इसलिए विरोधाभास इस सिद्धांत के परिणामों पर सवाल नहीं उठाता है। बहरहाल, इस विरोधाभास को दार्शनिकों द्वारा कुछ पर्याप्त चर्चा मिली है।
यहां कैदी पिछड़ा प्रेरण द्वारा तर्क करता है लेकिन ऐसा लगता है कि वह गलत निष्कर्ष पर पहुंचा है ध्यान दें जबकि समस्या का वर्णन यह मानता है कि किसी ऐसे व्यक्ति को आश्चर्यचकित करना संभव है जो पश्चवर्ती प्रवर्तन कर रहा है गणितीय सिद्धांत यह धारणा नहीं बनाता है कि विरोधाभास इस सिद्धांत के परिणामों पर सवाल नहीं उठाता है इस विरोधाभास को दार्शनिकों द्वारा कुछ पर्याप्त चर्चा मिली है।


== पिछड़ा प्रेरण और तर्कसंगतता का सामान्य ज्ञान ==
== पिछड़ा प्रेरण और तर्कसंगतता का सामान्य ज्ञान ==
बैकवर्ड इंडक्शन तभी काम करता है जब दोनों खिलाड़ी तर्कसंगत हों, यानी हमेशा एक ऐसी क्रिया का चयन करें जो उनके भुगतान को अधिकतम करे। हालाँकि, तर्कसंगतता पर्याप्त नहीं है: प्रत्येक खिलाड़ी को यह भी मानना ​​चाहिए कि अन्य सभी खिलाड़ी तर्कसंगत हैं। यह भी पर्याप्त नहीं है: प्रत्येक खिलाड़ी को यह विश्वास होना चाहिए कि अन्य सभी खिलाड़ी जानते हैं कि अन्य सभी खिलाड़ी तर्कसंगत हैं। और इसी तरह अनंत तक। दूसरे शब्दों में, तार्किकता [[सामान्य ज्ञान (तर्क)]] होनी चाहिए।<ref>{{cite journal |last1=Aumann |first1=Robert J. |title=बैकवर्ड इंडक्शन और तर्कसंगतता का सामान्य ज्ञान|journal=Games and Economic Behavior |date=January 1995 |volume=8 |issue=1 |pages=6–19 |doi=10.1016/S0899-8256(05)80015-6 }}</ref>
पश्चवर्ती प्रवर्तन तभी काम करता है जब दोनों खिलाड़ी तर्कसंगत हों यानी हमेशा एक ऐसी क्रिया का चयन करें जो उनके भुगतान को अधिकतम करे जबकि तर्कसंगतता पर्याप्त नहीं है प्रत्येक खिलाड़ी को यह भी मानना ​​चाहिए कि अन्य सभी खिलाड़ी तर्कसंगत हैं यह भी पर्याप्त नहीं है प्रत्येक खिलाड़ी को यह विश्वास होना चाहिए कि अन्य सभी खिलाड़ी जानते हैं कि खिलाड़ी तर्कसंगत हैं और इसी तरह अनंत तक दूसरे शब्दों में तार्किकता [[सामान्य ज्ञान (तर्क)|सामान्य ज्ञान तर्क]] होनी चाहिए।<ref>{{cite journal |last1=Aumann |first1=Robert J. |title=बैकवर्ड इंडक्शन और तर्कसंगतता का सामान्य ज्ञान|journal=Games and Economic Behavior |date=January 1995 |volume=8 |issue=1 |pages=6–19 |doi=10.1016/S0899-8256(05)80015-6 }}</ref>




== सीमित पिछड़ा प्रेरण ==
== सीमित पिछड़ा प्रेरण ==
सीमित बैकवर्ड इंडक्शन पूरी तरह से तर्कसंगत बैकवर्ड इंडक्शन से विचलन है। इसमें पूर्ण दूरदर्शिता के बिना बैकवर्ड इंडक्शन की नियमित प्रक्रिया को लागू करना शामिल है। सैद्धांतिक रूप से, यह तब होता है जब एक या अधिक खिलाड़ियों की दूरदर्शिता सीमित होती है और वे सभी टर्मिनल नोड्स के माध्यम से बैकवर्ड इंडक्शन नहीं कर सकते हैं।<ref>Marco Mantovani, 2015. "Limited backward induction: foresight and behavior in sequential games," Working Papers 289, University of Milano-Bicocca, Department of Economics</ref> सीमित बैकवर्ड इंडक्शन लंबे खेलों में बहुत बड़ी भूमिका निभाता है क्योंकि सीमित बैकवर्ड इंडक्शन के प्रभाव बाद के खेलों में अधिक शक्तिशाली होते हैं।
सीमित प्रेरण पूरी तरह से तर्कसंगत पश्चवर्ती प्रवर्तन से विचलन है इसमें पूर्ण दूरदर्शिता के बिना प्रवर्तन की नियमित प्रक्रिया को लागू करना सम्मिलित है सैद्धांतिक रूप से यह तब होता है जब एक या अधिक खिलाड़ियों की दूरदर्शिता सीमित होती है और वे सभी सहायक नोड्स के माध्यम से पश्चवर्ती प्रवर्तन नहीं कर सकते हैं <ref>Marco Mantovani, 2015. "Limited backward induction: foresight and behavior in sequential games," Working Papers 289, University of Milano-Bicocca, Department of Economics</ref> सीमित प्रेरण लंबे खेलों में बहुत बड़ी भूमिका निभाता है क्योंकि सीमित प्रेरण के प्रभाव बाद के खेलों में अधिक शक्तिशाली होते हैं प्रयोगों से पता चला है कि क्रमिक सौदेबाजी के खेल में जैसे कि चालीस पद खेल सैद्धांतिक भविष्यवाणियों से विचलित होते हैं और कुछ जगह सीमित पिछड़े प्रेरण में संलग्न होते हैं यह विचलन सीमित तर्कसंगतता के परिणामस्वरूप होते हैं जहां खिलाड़ी केवल कुछ ही चरणों को पूरी तरह से आगे देख सकते हैं <ref>{{cite journal |last1=Ke |first1=Shaowei |title=बाउंडली रेशनल बैकवर्ड इंडक्शन|journal=Theoretical Economics |date=2019 |volume=14 |issue=1 |pages=103–134 |doi=10.3982/TE2402 |s2cid=9053484 |doi-access=free }}</ref> यह निर्णयों में अप्रत्याशितता और उप खेल पूर्ण रूप नैश संतुलन को खोजने और प्राप्त करने में अक्षमता की अनुमति देता है।
[[File:A_four_stage_sequential_game_with_a_foresight_bound.jpg|thumb|160x160px|दूरदर्शिता के साथ एक चार चरणों वाला अनुक्रमिक खेल]]प्रयोगों से पता चला है कि क्रमिक सौदेबाजी के खेल में, जैसे कि सेंटीपीड खेल, विषय सैद्धांतिक भविष्यवाणियों से विचलित होते हैं और इसके बजाय सीमित पिछड़े प्रेरण में संलग्न होते हैं। यह विचलन सीमित तर्कसंगतता के परिणामस्वरूप होता है, जहां खिलाड़ी केवल कुछ ही चरणों को पूरी तरह से आगे देख सकते हैं।<ref>{{cite journal |last1=Ke |first1=Shaowei |title=बाउंडली रेशनल बैकवर्ड इंडक्शन|journal=Theoretical Economics |date=2019 |volume=14 |issue=1 |pages=103–134 |doi=10.3982/TE2402 |s2cid=9053484 |doi-access=free }}</ref> यह निर्णयों में अप्रत्याशितता और सबगेम परफेक्ट नैश संतुलन को खोजने और प्राप्त करने में अक्षमता की अनुमति देता है।


इस घटना के लिए तीन व्यापक परिकल्पनाएँ हैं;
इस घटना के लिए तीन व्यापक परिकल्पनाएँ हैं-


# सामाजिक कारकों की उपस्थिति (जैसे निष्पक्षता)
# सामाजिक कारकों की उपस्थिति गैर-सामाजिक कारकों की उपस्थिति जैसे सीमित पिछड़े प्रेरण।
# गैर-सामाजिक कारकों की उपस्थिति (जैसे सीमित पिछड़े प्रेरण)
# सांस्कृतिक अंतर।                                                                                  पश्चवर्ती प्रवर्तन
# सांस्कृतिक अंतर
#
 
का उल्लंघन मुख्य रूप से सामाजिक कारकों की उपस्थिति के लिए जिम्मेदार है जबकि अनुक्रमिक सौदेबाजी के खेल [[संज्ञानात्मक पदानुक्रम सिद्धांत]] का उपयोग करते हुए डेटा-संचालित प्रारूप भविष्यवाणियों ने इस बात पर प्रकाश डाला है कि कुछ खेलों में सीमित पिछड़े प्रेरण की उपस्थिति एक प्रमुख भूमिका निभा सकती है <ref>{{cite journal |last1=Qu |first1=Xia |last2=Doshi |first2=Prashant |title=अनुक्रमिक सौदेबाजी के खेल में निष्पक्षता और सीमित पिछड़े प्रवेश की भूमिका पर|journal=Annals of Mathematics and Artificial Intelligence |date=1 March 2017 |volume=79 |issue=1 |pages=205–227 |doi=10.1007/s10472-015-9481-7 |s2cid=23565130 }}</ref>बार-बार होने वाले पब्लिक अच्छे खेल में समूह का व्यवहार श्चवर्तीभप्रवर्तन ावित होता है जहां यह स्पष्ट है कि टीम के सदस्यों का प्रारंभिक योगदान अंत में योगदान से अधिक है सीमित पीछे कीप्रभावित करता है कि किसी समूह की जनता अच्छे खेल में नियमित रूप से मुक्त सवारी कैसे होती है प्रारंभिक रूप से जब सीमित पिछड़े प्रेरण के प्रभाव कम होते हैं तो मुक्त सवारी कम होती है जबकि अंत की ओर जब प्रभाव अधिक होते हैं तो मुक्त सवारी अधिक होती है <ref>{{cite journal |last1=Cox |first1=Caleb A. |last2=Stoddard |first2=Brock |title=सार्वजनिक वस्तुओं के खेल में टीमों के साथ रणनीतिक सोच|journal=Journal of Public Economics |date=May 2018 |volume=161 |pages=31–43 |doi=10.1016/j.jpubeco.2018.03.007 }}</ref>दौड खेल के एक प्रकार के भीतर सीमित पीछे की ओर प्रेरण का भी परपश्चवर्ती प्रवर्तन ं खिलाड़ी क्रमिक रूप से एक सीमा के भीतर पूर्णांकों का चयन करेंगे और लक्ष्य संख्या तक पहुंचने तक अपनी पसंद का योग करेंगे लक्ष्य को भेदने से उस खिलाड़ी को पुरस्कार मिलता है जबकि दूसरा हार जाता है खेलों की एक श्रृंखला के बीच में एक छोटा पुरस्कार पेश किया गया था अधिकांश खिलाड़ियों ने तब सीमित पिछड़े प्रेरण का प्रदर्शन किया क्योंकि उन्होंने मूल पुरस्कार के बजाय छोटे पुरस्कार के लिए हल कियजगह में खिलाड़ियों के केवल एक छोटगया े से अंश ने दोनों पुरस्कारों पर विचार किया कि पीछे की ओर प्रेरण के अधिकांश परीक्िणपश्चवर्ती प्रवर्तन िभागियों को कार्य को अच्छी तरह से करने के लिए प्रोत्साहित नहीं किेा जाता है जबकि पिछड़े पलंघन भी उच्च-दांव वाले वातावरण में सामान्य प्रतीत होते हैं उदाहरण के लिए अमेरिकी टेलीविजन का एक बड़े पैमाने पर विश्लेषण सीमित दूरदर्शिता का प्रमण प्रदान करता है तथा हर प्रतियोगी खेलते हैं जो सही जानकारी का एक क्रमिक खेल है जिसके लिए पीछे के प्रेरण के माध्यम से इष्टतम रणनीति पाई जा सकती पश्चवर्तीहप्रवर्तन के े लगातार और व्यवस्थित विचलन सुझाव देते हैं कि प्रतियोगियों का एक बड़ा अनुपात ठीक से पिछड़े प्रवेश में विफल रहता है और यह खेल के अगले चरण पर विचार करता है।<ref>{{cite document |last1=Klein Teeselink |first1=Bouke |last2=van Dolder |first2=Dennie |last3=van den Assem |first3=Martijn |last4=Dana |first4=Jason |date=2022 |title=High-Stakes Failures of Backward Induction: Evidence from "The Price Is Right" |url = https://ssrn.com/abstract=4130176 |journal= }}</ref>
बैकवर्ड इंडक्शन का उल्लंघन मुख्य रूप से सामाजिक कारकों की उपस्थिति के लिए जिम्मेदार है। हालांकि अनुक्रमिक सौदेबाजी के खेल ([[संज्ञानात्मक पदानुक्रम सिद्धांत]] का उपयोग करते हुए) के लिए डेटा-संचालित मॉडल भविष्यवाणियों ने इस बात पर प्रकाश डाला है कि कुछ खेलों में सीमित पिछड़े प्रेरण की उपस्थिति एक प्रमुख भूमिका निभा सकती है।<ref>{{cite journal |last1=Qu |first1=Xia |last2=Doshi |first2=Prashant |title=अनुक्रमिक सौदेबाजी के खेल में निष्पक्षता और सीमित पिछड़े प्रवेश की भूमिका पर|journal=Annals of Mathematics and Artificial Intelligence |date=1 March 2017 |volume=79 |issue=1 |pages=205–227 |doi=10.1007/s10472-015-9481-7 |s2cid=23565130 }}</ref>
बार-बार होने वाले पब्लिक गुड्स गेम्स में, टीम का व्यवहार सीमित बैकवर्ड इंडक्शन से प्रभावित होता है; जहां यह स्पष्ट है कि टीम के सदस्यों का प्रारंभिक योगदान अंत में योगदान से अधिक है। सीमित बैकवर्ड इंडक्शन यह भी प्रभावित करता है कि किसी टीम के पब्लिक गुड्स गेम में नियमित रूप से फ्री-राइडिंग कैसे होती है। प्रारंभिक रूप से जब सीमित पिछड़े प्रेरण के प्रभाव कम होते हैं, तो फ्री-राइडिंग कम होती है, जबकि अंत की ओर, जब प्रभाव अधिक होते हैं, तो फ्री राइडिंग अधिक बार होती है।<ref>{{cite journal |last1=Cox |first1=Caleb A. |last2=Stoddard |first2=Brock |title=सार्वजनिक वस्तुओं के खेल में टीमों के साथ रणनीतिक सोच|journal=Journal of Public Economics |date=May 2018 |volume=161 |pages=31–43 |doi=10.1016/j.jpubeco.2018.03.007 }}</ref>
रेस गेम के एक प्रकार के भीतर सीमित बैकवर्ड इंडक्शन का भी परीक्षण किया गया है। खेल में, खिलाड़ी क्रमिक रूप से एक सीमा के भीतर पूर्णांकों का चयन करेंगे और लक्ष्य संख्या तक पहुंचने तक अपनी पसंद का योग करेंगे। लक्ष्य को भेदने से उस खिलाड़ी को पुरस्कार मिलता है; दूसरा हार जाता है। खेलों की एक श्रृंखला के बीच में, एक छोटा पुरस्कार पेश किया गया था। अधिकांश खिलाड़ियों ने तब सीमित पिछड़े प्रेरण का प्रदर्शन किया, क्योंकि उन्होंने मूल पुरस्कार के बजाय छोटे पुरस्कार के लिए हल किया। शुरुआत में खिलाड़ियों के केवल एक छोटे से अंश ने दोनों पुरस्कारों पर विचार किया।<ref>{{cite document |last=Mantovani |first=Marco |date=2013 |title=सीमित पिछड़ा प्रेरण|citeseerx=10.1.1.399.8991 }}</ref>
बैकवर्ड इंडक्शन के अधिकांश परीक्षण प्रयोगों पर आधारित होते हैं, जिनमें प्रतिभागियों को कार्य को अच्छी तरह से करने के लिए प्रोत्साहित नहीं किया जाता है या केवल कुछ हद तक ही किया जाता है। हालाँकि, पिछड़े प्रेरण के उल्लंघन भी उच्च-दांव वाले वातावरण में सामान्य प्रतीत होते हैं। उदाहरण के लिए, अमेरिकी टेलीविजन गेम शो द प्राइस इज़ राइट का एक बड़े पैमाने पर विश्लेषण सीमित दूरदर्शिता का प्रमाण प्रदान करता है। हर एपिसोड में, प्रतियोगी शोकेस शोडाउन खेलते हैं, जो सही जानकारी का एक क्रमिक गेम है, जिसके लिए बैकवर्ड इंडक्शन के माध्यम से इष्टतम रणनीति पाई जा सकती है। इष्टतम व्यवहार से लगातार और व्यवस्थित विचलन सुझाव देते हैं कि प्रतियोगियों का एक बड़ा अनुपात ठीक से पिछड़े प्रवेश में विफल रहता है और केवल खेल के अगले चरण पर विचार करता है।<ref>{{cite document |last1=Klein Teeselink |first1=Bouke |last2=van Dolder |first2=Dennie |last3=van den Assem |first3=Martijn |last4=Dana |first4=Jason |date=2022 |title=High-Stakes Failures of Backward Induction: Evidence from "The Price Is Right" |url = https://ssrn.com/abstract=4130176 |journal= }}</ref>




Line 141: Line 135:


{{Game theory}}
{{Game theory}}
[[Category: गतिशील प्रोग्रामिंग]] [[Category: खेल सिद्धांत]] [[Category: आगमनात्मक कारण]] [[Category: आगमनात्मक कारण]] [Category:Inductive reasoni
    [Category:Inductive reasoni
 


[[Category: Machine Translated Page]]
[[Category:Articles with hatnote templates targeting a nonexistent page]]
[[Category:CS1 errors]]
[[Category:Collapse templates]]
[[Category:Created On 26/05/2023]]
[[Category:Created On 26/05/2023]]
[[Category:Lua-based templates]]
[[Category:Machine Translated Page]]
[[Category:Navigational boxes| ]]
[[Category:Navigational boxes without horizontal lists]]
[[Category:Pages with script errors]]
[[Category:Sidebars with styles needing conversion]]
[[Category:Template documentation pages|Documentation/doc]]
[[Category:Templates Vigyan Ready]]
[[Category:Templates generating microformats]]
[[Category:Templates that add a tracking category]]
[[Category:Templates that are not mobile friendly]]
[[Category:Templates that generate short descriptions]]
[[Category:Templates using TemplateData]]
[[Category:Wikipedia metatemplates]]
[[Category:आगमनात्मक कारण]]
[[Category:खेल सिद्धांत]]
[[Category:गतिशील प्रोग्रामिंग]]

Latest revision as of 09:00, 15 June 2023

पश्चवर्ती प्रवर्तन किसी समस्या या स्थिति के अंत से इष्टतम क्रियाओं के क्रम को निर्धारित करने के लिए पश्चवर्ती प्रवर्तन की ओर तर्क करने की प्रक्रिया है यह प्रवर्तन अंतिम बिंदु की जांच करके आगे बढ़ता है जिस पर निर्णय लिया जाता है और फिर यह पहचाना जाता है कि उस समय कौन सी कार्रवाई सबसे सही होगी इस जानकारी का उपयोग करके यह निर्धारित किया जा सकता है कि निर्णय के दूसरे या अंतिम समय में क्या करना है यह प्रक्रिया तब तक जारी रहती है जब तक कि हर समय हर संभव स्थिति यानी हर संभव सूचना समूह खेल की परिभाषा की सबसे अच्छी कार्रवाई निर्धारित नहीं कर लेती है पश्चवर्ती प्रवर्तन का उपयोग 1875 में आर्थर केली द्वारा किया गया था जिन्होंने विख्यात सचिव समस्या को हल करने की कोशिश करते हुए इस विधि को उजागर किया गया था [1]गतिशील कार्यक्रम के गणितीय अनुकूलन गणित पद्धति में बेलमैन समीकरण को हल करने के लिए पश्चवर्ती प्रवर्तन के मुख्य तरीकों में से एक है [2][3] खेल सिद्धांत में पश्चवर्ती प्रवर्तन की अनुक्रमिक खेल में उप खेल पूर्णता की गणना करने के लिए उपयोग की जाने वाली एक विधि है इसमें [4] अंतर केवल इतना है कि अनुकूलन में एक निर्णय सिद्धांत सम्मिलित होता है जो प्रत्येक समय पर क्या करना है यह चुनता है जबकि खेल सिद्धांत विश्लेषण कई खिलाड़ियों के निर्णय कैसे क्रिया करते हैं अर्थात् यह अनुमान लगाकर कि प्रत्येक स्थिति में अंतिम खिलाड़ी क्या करेगा यह निर्धारित करना संभव है कि दूसरा खिलाड़ी क्या करेगा इत्यादि स्वचालित योजना और शेड्यूलिंग और स्वचालित प्रमेय को प्रमाण देने के क्षेत्र में इस विधि को पश्चवर्ती प्रवर्तन खोज या पश्चवर्ती प्रवर्तन श्रृंखलन कहा जाता है शतरंज में इसे प्रतिगामी विश्लेषण भी कहा जाता है

जब तक खेल परिभाषा का क्षेत्र एकत्र है तब तक खेलों को हल करने के लिए पश्चवर्ती प्रवर्तन का उपयोग किया जाता है जॉन वॉन न्यूमैन और ऑस्कर मॉर्गनस्टर्न ने अपनी 'थ्योरी ऑफ गेम्स एंड इकोनॉमिक बिहेवियर' 1944 में पश्चवर्ती प्रवर्तन द्वारा शून्य राशि में दो व्यक्ति ने खेल को हल करने का सुझाव दिया जिसने खेल को अध्ययन के क्षेत्र के रूप में स्थापित किया।[5][6]


निर्णय लेने में पश्चवर्ती प्रवर्तन एक इष्टतम रोक की समस्या

एक बेरोजगार व्यक्ति पर विचार करें जो दस वर्षों तक काम करने में सक्षम होगा t = 1,2,...,10 मान लीजिए कि प्रत्येक वर्ष जिसमें वे बेरोजगार रहते हैं उन्हें एक अच्छी नौकरी की पेशकश की जा सकती है जो 100 डॉलर का भुगतान करती है जबकि एक खराब नौकरी जो 44 डॉलर का भुगतान करती है समान संभावना 50/50 के साथ एक बार जब वे नौकरी स्वीकार कर लेते हैं तो वे दस वर्षों तक उस नौकरी में बने रहते हैं सरलता के लिए मान लें कि वे केवल अपनी मौद्रिक कमाई के बारे में परवाह करते हैं और वे अलग-अलग समय पर कमाई को समान रूप से महत्व देते हैं यानी समय वरीयता एक है।

क्या इस व्यक्ति को खराब नौकरी स्वीकार करनी चाहिए इस प्रश्न का उत्तर देने के लिए हम समय t = 10 से पीछे की ओर तर्क कर सकते हैं।

  • समय 10 पर एक अच्छी नौकरी स्वीकार करने का मूल्य 100 डॉलर है तथा खराब नौकरी को स्वीकार करने का मूल्य 44 डॉलर है इसमें उपलब्ध नौकरी को अस्वीकार करने का मूल्य शून्य है इसलिए यदि वे अंतिम अवधि में अभी भी बेरोजगार हैं तो उन्हें उस समय जो भी नौकरी पेश की जाती है उसे स्वीकार कर लेना चाहिए।
  • समय 9 पर एक अच्छी नौकरी स्वीकार करने का मूल्य 200 डॉलर है क्योंकि वह नौकरी दो साल तक चलेगी खराब नौकरी को स्वीकार करने का मूल्य 2*44 डॉलर= 88 डॉलर है नौकरी की पेशकश को स्वीकार करने का मूल्य अब 0 डॉलर है साथ ही अगले नौकरी की पेशकश की प्रतीक्षा करने का मूल्य जो 0.5 के औसत के अपेक्षित मूल्य के लिए या तो 50 प्रतिशत संभावना के साथ 44 डॉलर या 50 प्रतिशत के साथ 100 डॉलर होगा 100 डॉलर+44 डॉलर = 72 डॉलर इसलिए इस बात की परवाह किए बिना कि नौकरी अच्छी है या बुरी उस प्रस्ताव को स्वीकार करना बेहतर है।
  • समय 8 पर एक अच्छी नौकरी स्वीकार करने का मूल्य 300 डॉलर है यह तीन साल तक चलेगा खराब नौकरी को स्वीकार करने का मूल्य 3*44 डॉलर = 132 डॉलर है नौकरी की पेशकश को अस्वीकार करने का मूल्य अब 0 डॉलर है साथ ही नौकरी की पेशकश की प्रतीक्षा करने का मूल्य निम्न है चूंकि हम पहले ही निष्कर्ष निकाल चुके हैं कि प्रस्तावों को स्वीकार किया जाना चाहिए नौकरी की पेशकश की प्रतीक्षा करने का अपेक्षित मूल्य 0.5*200+88 डॉलर =144 डॉलर है इसलिए खराब नौकरी स्वीकार करने की तुलना में अगले प्रस्ताव की प्रतीक्षा करना अधिक मूल्यवान है।

पश्चवर्ती प्रवर्तन यह सत्यापित करता है कि खराब प्रस्तावों को केवल तभी स्वीकार किया जाना चाहिए जब कोई 9 या 10 बार बेरोजगार हो उन्हें हर समय t = 8 तक समाप्त कर दिया जाना चाहिए अंतर्ज्ञान यह है कि यदि कोई लंबे समय तक नौकरी में काम करने की आशा करता है तो इससे यह अधिक मूल्यवान हो जाता है कि हमें किस नौकरी को स्वीकार करना है।

इस तरह की एक गतिशील अनुकूलन समस्या को इष्टतम रोक समस्या कहा जाता है क्योंकि बेहतर प्रस्ताव की प्रतीक्षा कब बंद करनी है खोज सिद्धांत सूक्ष्म अर्थशास्त्र का क्षेत्र है जो इस प्रकार की समस्याओं को खरीदारी नौकरी की खोज और विवाह जैसे संदर्भों में लागू करता है।

खेल परिभाषा में पश्चवर्ती प्रवर्तन

खेल परिभाषा में पश्चवर्ती प्रवर्तन एक समाधान अवधारणा है यह तर्कसंगत अवधारणा का परिशोधन है जो एक खेल को व्यापक रूप में प्रतिनिधित्व व्यक्तिगत सूचना समूह के प्रति संवेदनशील है [7] पश्चवर्ती प्रवर्तन का विचार किसी दिए गए खेल में प्रत्येक जानकारी के लिए एक इष्टतम क्रिया की पहचान करके अनुक्रमिक तर्कसंगतता का उपयोग करता है।

जोएल वाटसन द्वारा रणनीति खेल परिभाषा के एक परिचय में पश्चवर्ती प्रवर्तन प्रक्रिया को इस प्रकार परिभाषित किया गया है कि यह अंत से शुरुआत तक खेल का विश्लेषण करने की प्रक्रिया पर निर्भर है प्रत्येक निर्णय नोड किसी भी कार्रवाई पर विचार किया जाता है टर्मिनल नोड्स को देखते हुए जो उत्तराधिकारी नोड्स पर पहचाने गए कार्यों के खेल के माध्यम से पहुंचाया जा सकता है [8] पश्चवर्ती प्रवर्तन प्रक्रिया का एक दोष यह है कि इसे केवल खेलों की सीमित कक्षाओं में ही लागू किया जा सकता है उपयोगिता के बंधनों के बिना सही जानकारी के किसी भी खेल के लिए प्रक्रिया अच्छी तरह से परिभाषित है यह संबंधों के साथ सही जानकारी वाले खेलों के लिए भी अच्छी तरह से परिभाषित और सार्थक है जबकि यह एक से अधिक रणनीति परिचय की ओर ले जाता है इस प्रक्रिया को गैर-तुच्छ सूचना समूह वाले कुछ खेलों पर लागू किया जा सकता है लेकिन यह सामान्य रूप से अविश्वसनीय है सही जानकारी वाले खेलों को हल करने के लिए प्रक्रिया सबसे उपयुक्त है इसलिए यदि सभी खिलाड़ी अन्य खिलाड़ियों के कार्यों और प्रत्येक निर्णय नोड के प्रति सचेत नहीं है तो पश्चवर्ती प्रवर्तन इतनी आसानी से लागू नहीं होता है वाटसन ने [9] पश्चवर्ती प्रवर्तन की प्रक्रिया को एक साधारण उदाहरण के साथ प्रदर्शित किया जा सकता है।

खेल परिभाषा में पश्चवर्ती प्रवर्तन

प्रस्तावित खेल एक बहु चरण खेल है जिसमें 2 खिलाड़ी सम्मिलित हैं खिलाड़ी फिल्म देखने की योजना रहे हैं वर्तमान में 2 फिल्में हैं जोकर और टर्मिनेटर जो बहुत लोकप्रिय हैं खिलाड़ी 1 टर्मिनेटर देखना चाहता है और खिलाड़ी 2 जोकर देखना चाहता है इसलिए खिलाड़ी 1 पहले टिकट खरीदेगा और खिलाड़ी 2 को अपनी पसंद के बारे में बताएगा फिर खिलाड़ी 2 उसका टिकट खरीदेगा एक बार जब वे दोनों विकल्पों का निरीक्षण कर लेते हैं तो वे फिल्म जाने या घर पर रहने के बारे में चुनाव करेंगे पहले चरण की तरह ही खिलाड़ी 1 पहले चुनता है 2 खिलाड़ी 1 की पसंद को देखने के बाद अपनी पसंद बनाता है।

इस उदाहरण के लिए हम मानते हैं कि अदायगी विभिन्न चरणों में जोड़ी जाती है जो एक संपूर्ण सूचना खेल है।

सामान्य रूप का खेल

Stage 1
Player 2

Player 1
Joker Terminator
Joker 3, 5 0, 0
Terminator 1, 1 5, 3
Stage 2
Player 2

Player 1
Go to Movie Stay Home
Go to Movie 6, 6 4, -2
Stay Home -2, 4 -2, -2

व्यापक रूप का खेल

इस बहु चरण खेल को हल करने के चरण व्यापक रूप से दाईं ओर देखे गए हैं

  1. पश्चवर्ती प्रवर्तन खेल को अंतिम नोड्स से हल करना शुरू करता है।
  2. खिलाड़ी 2 गो टू मूवी या स्टे होम चुनने के लिए अंतिम नोड्स से 8 उप खेल का अवलोकन करेगा।
    1. दूसरे खिलाड़ी से कुल 4 तुलनाएं होंगी वह उच्च भुगतान के साथ एक विकल्प का चयन करेगा।
    2. उदाहरण के लिए पहले उप खेल पर विचार करते हुए 11 का भुगतान 7 से अधिक है इसलिए खिलाड़ी 2 मूवी चुनता है।
    3. विधि प्रत्येक उपखेल के लिए जारी रहती है।
  3. एक बार जब खिलाड़ी 2 अपनी पसंद पूरी कर लेता है तो खिलाड़ी 1 चयनित उप खेलों के आधार पर अपनी पसंद बनाएगा।
    1. प्रक्रिया चरण 2 के समान है खिलाड़ी 1 अपनी पसंद बनाने के लिए अपने भुगतान की तुलना करती है।
    2. पिछले चरण से खिलाड़ी 2 द्वारा न चुने गए उपखेल पर अब दोनों खिलाड़ियों द्वारा विचार नहीं किया जाता है क्योंकि वे इष्टतम नहीं हैं।
    3. उदाहरण के लिए गो टू मूवी का विकल्प 9,11 का भुगतान प्रदान करता है और स्टे होम का विकल्प 1, 9 का भुगतान प्रदान करता है खिलाड़ी 1 मूवी का चयन करेगा।
  4. प्रक्रिया प्रत्येक खिलाड़ी के लिए तब तक दोहराती है जब तक कि प्रक्रिया प्रारंभिक नोड तक नहीं पहुंच जाता।
    1. उदाहरण के लिए खिलाड़ी 2 जोकर को चुनेगा क्योंकि 11 (9, 11) का भुगतान 6 (6, 6) के भुगतान वाले समापक से अधिक है।
    2. उदाहरण के लिए खिलाड़ी 1 प्रारंभिक नोड पर समापक का चयन करेगा क्योंकि यह 11 का उच्च भुगतान प्रदान करता है समापक (11, 9)> जोकर (9, 11) चयन करता है।
  5. उप खेल में सही संतुलन की पहचान करने के लिए हमें एक मार्ग की पहचान करने की आवश्यकता है जो प्रत्येक सूचना समूह पर इष्टतम उप खेल का चयन करता है।
    1. इस उदाहरण में खिलाड़ी 1 टर्मिनेटर चुनता है और खिलाड़ी 2 भी टर्मिनेटर चुनता है फिर वे दोनों गो टू मूवी चुनते हैं।
    2. उप खेल सही संतुलन (11,9) के भुगतान की ओर ले जाता है।

खेल परिभाषा में पश्चवर्ती प्रवर्तन का अंतिम खेल

पश्चवर्ती प्रवर्तन एक खेल को अंत से शुरुआत तक विश्लेषण करने की प्रक्रिया है अन्य नैश संतुलन के समाधान के साथ खिलाड़ियों की तर्कसंगतता और पूर्ण ज्ञान ग्रहण किया जाता है पश्चवर्ती प्रवर्तन की अवधारणा इस धारणा से मेल खाती है कि यह सामान्य ज्ञान है और प्रत्येक खिलाड़ी प्रत्येक निर्णय नोड के साथ तर्कसंगत रूप से कार्य करेगा जब वह एक विकल्प चुनता है तो भले ही उसकी तर्कसंगतता का अर्थ यह हो कि यह ऐसा नोड नहीं है तर्कसंगतता की पारस्परिक धारणा के तहत पश्चवर्ती प्रवर्तन प्रत्येक खिलाड़ी को यह अनुमान लगाने की अनुमति देता है कि खेल के प्रत्येक चरण में उनका प्रतिद्वंद्वी क्या करेगा।

एक उप खेल के लिए पश्चवर्ती प्रवर्तन के साथ सही संतुलन को हल करने के लिए खेल को व्यापक खेल के रूप में लिखा जाना चाहिए और फिर उप खेलों में विभाजित किया जाना चाहिए शुरुआती नोड या शुरुआती बिंदु उपखेल से शुरू होकर इस उपखेल के लिए सूचीबद्ध अपेक्षित से तौला जाता है और तर्कसंगत खिलाड़ी अपने लिए उच्च विकल्प का चयन करेगा उच्चतम भुगतान चिह्नित किया गया है शुरुआती बिंदु पर पहुंचने तक उपखेल से लगातार पश्चवर्ती प्रवर्तन का काम करके उपखेल सही संतुलन के लिए हल करें जैसे-जैसे यह प्रक्रिया आगे बढ़ती है तो प्रारंभिक खेल छोटा होता जाएगा सदिशों का चिन्हित पथ उपखेल पूर्ण संतुलन है [10] पश्चवर्ती प्रवर्तन अंतिम खेल पर लागू होता है।

दो खिलाड़ियों के बीच एक खेल के बारे में सोचें जहां खिलाड़ी 1 खिलाड़ी 2 के साथ एक डॉलर बांटने का प्रस्ताव रखता है यह एक प्रसिद्ध असममित खेल है जिसे क्रमिक रूप से खेला जाता है जिसे अंतिम खेल कहा जाता है खिलाड़ी एक डॉलर को विभाजित करके पहले कार्य करता है जबकि वे फिट दिखते हैं अब यह दो खिलाड़ी एक द्वारा निपटाए गए हिस्से को स्वीकार कर सकते हैं या विभाजन को अस्वीकार कर सकते हैं यदि खिलाड़ी 2 विभाजन को स्वीकार करता है तो खिलाड़ी 1 और खिलाड़ी 2 दोनों को उस विभाजन के अनुसार अदायगी मिलती है यदि खिलाड़ी दो खिलाड़ी 1 के प्रस्ताव को अस्वीकार करने का निर्णय लेता है तो दोनों खिलाड़ियों को कुछ नहीं मिलता है दूसरे शब्दों में खिलाड़ी 2 के पास खिलाड़ी 1 के प्रस्तावित आवंटन शक्ति हैं लेकिन रोक लागू करने से दोनों खिलाड़ियों के लिए इनाम समाप्त हो जाता है [11] इसलिए इस खेल के लिए रणनीति परिचय को 0 और 1 के बीच सभी x के लिए जोड़े x, fx के रूप में लिखा जा सकता है जहां fx एक द्वि-मूल्यवान कार्यक्रम है जो यह व्यक्त करता है कि x स्वीकार किया गया है या नहीं।

खिलाड़ी 1 द्वारा किसी भी मनमाने प्रस्ताव को देखते हुए खिलाड़ी 2 की पसंद और प्रतिक्रिया पर विचार करें यह मानते हुए कि प्रस्ताव $0 से बड़ा है पीछे की ओर प्रेरण का उपयोग करते हुए निश्चित रूप से हम उम्मीद करेंगे कि खिलाड़ी 2 डॉलर 0 से अधिक या उसके बराबर किसी भी अदायगी को स्वीकार करेगा तदनुसार खिलाड़ी 1 को विभाजन के सबसे बड़े हिस्से को हासिल करने के लिए जितना संभव हो उतना कम खिलाड़ी देने का प्रस्ताव देना चाहिए लेकिन खिलाड़ी 1 खिलाड़ी 2 को पैसे की सबसे छोटी इकाई देना और संतुलन इसके लिए रखना अद्वितीय है जो उप खेल का सही संतुलन है।

अंतिम चरण में खेल अनंत खेलों पर विचार करते समय पश्चवर्ती प्रवर्तन की उपयोगिता का एक उदाहरण है जबकि खेल के सैद्धांतिक रूप से अनुमानित परिणामों की आलोचना की जाती है प्रायोगिक साक्ष्यों से पता चला है कि प्रस्तावक ही कभी 0 डॉलर की ​​पेशकश करता है और खिलाड़ी 2 कभी-कभी निष्पक्षता के आधार पर 0 डॉलर से अधिक के प्रस्तावों को भी अस्वीकार करता है खिलाड़ी 2 द्वारा किसे उचित माना जाता है यह संदर्भ के अनुसार भिन्न होता है और अन्य खिलाड़ियों के दबाव या उपस्थिति का मतलब यह हो सकता है कि खेल परिभाषा प्रारूप आवश्यक रूप से भविष्यवाणी नहीं कर सकता है कि वास्तविक लोग क्या चुनेंगे।

व्यवहार में उप खेल सही संतुलन हमेशा प्राप्त नहीं होता है कैमरर के अनुसार एक अमेरिकी व्यवहारवादी अर्थशास्त्री खिलाड़ी 2 लगभग आधे समय में एक्स के 20 प्रतिशत से कम के प्रस्तावों को करता है भले ही वे कुछ भी नहीं समाप्त करते हैं [12] जबकि पश्चवर्ती प्रवर्तन यह भविष्यवाणी करेगा कि उत्तरदाता शून्य के बराबर या उससे अधिक किसी भी प्रस्ताव को स्वीकार करता है उत्तरदाता वास्तव में तर्कसंगत खिलाड़ी नहीं हैं और इसलिए संभावित मौद्रिक लाभ के अलावा निष्पक्षता की पेशकश के बारे में अधिक ध्यान रखते हैं।

कनखजूरा खेल

अर्थशास्त्र में पिछड़ा प्रवेश प्रवेश-निर्णय समस्या

एक गतिशील खेल पर विचार करें जिसमें खिलाड़ी एक उद्योग में एक एकत्र फर्म हैं और उस उद्योग के संभावित प्रवेशकर्ता हैं जैसा कि यह खड़ा है अवलंबी का उद्योग पर एकाधिकार है और वह प्रवेशकर्ता को अपना कुछ बाजार हिस्सा खोना नहीं चाहता है यदि प्रवेशकर्ता प्रवेश नहीं चुनता है तो अवलंबी को अदायगी अधिक होती है यह अपना एकाधिकार बनाए रखता है और प्रवेशकर्ता न तो हारता है और न ही लाभ प्राप्त करता है इसका भुगतान शून्य है यदि प्रवेशकर्ता प्रवेश करता है तो अवलंबी प्रवेशकर्ता से लड़ सकता है या समायोजित कर सकता है यह अपनी कीमत कम करके प्रवेश करने वाले को व्यवसाय से बाहर और बाहर निकलने की लागत एक नकारात्मक अदायगी चलाकर और अपने स्वयं के मुनाफे को नुकसान पहुँचाकर लड़ेगा यदि यह प्रवेशकर्ता को समायोजित करता है तो इसकी बिक्री में कुछ कमी आएगी लेकिन एक उच्च कीमत बनी रहेगी और इसकी कीमत कम करने की तुलना में इसे अधिक लाभ प्राप्त होगा लेकिन एकाधिकार लाभ से कम है।

इस बात पर विचार करें कि यदि प्रवेशकर्ता प्रवेश करता है तो अवलंबी की सबसे अच्छी प्रतिक्रिया समायोजित करना है या नहीं यदि अवलंबी समायोजित करता है तो प्रवेशकर्ता की सबसे अच्छी प्रतिक्रिया प्रवेश करना और लाभ प्राप्त करना है इसलिए रणनीति परिचय जिसमें प्रवेशकर्ता प्रवेश करता है और यदि प्रवेशकर्ता प्रवेश करता है तो अवलंबी समायोजित करता है पिछड़े प्रेरण के साथ संगत संतुलन है जबकि यदि अवलंबी लड़ने जा रहा है तो प्रवेशकर्ता की सबसे अच्छी प्रतिक्रिया प्रवेश नहीं करना है और यदि प्रवेशी प्रवेश नहीं करता है तो इससे कोई फर्क नहीं पड़ता कि प्रवेशकर्ता प्रवेश करने वाले काल्पनिक जगहों में क्या करना चाहता है इसलिए रणनीति परिचय जिसमें प्रवेश करने वाला प्रवेश करता है लेकिन प्रवेशकर्ता प्रवेश नहीं करता है तो वह संतुलन भी है जबकि प्रवेश करने वाले को विचलित करने और प्रवेश करने के लिए अवलंबी की सबसे अच्छी प्रतिक्रिया समायोजित करना है लड़ाई का खतरा विश्वसनीय नहीं है इस दूसरे संतुलन को पश्चगामी प्रवर्तन द्वारा समाप्त किया जा सकता है।

प्रत्येक निर्णय लेने की प्रक्रिया उप खेल में नैश संतुलन ढूँढना पूर्ण संतुलन के रूप में बनता है इस प्रकार ये रणनीति परिचय जो सही संतुलन दर्शाती हैं अविश्वसनीय खतरों जैसी कार्रवाइयों की संभावना को बाहर करती हैं जो एक प्रवेशी को डराने के लिए उपयोग की जाती हैं यदि अवलंबी एक प्रवेशी के साथ मूल्य युद्ध शुरू करने की धमकी देता है तो वे अपनी कीमतों को एक एकाधिकार मूल्य से प्रवेशकर्ता की तुलना में थोड़ा कम करने की धमकी दे रहे हैं जो कि अव्यावहारिक और अविश्वसनीय होगा यदि प्रवेशकर्ता जानता था कि मूल्य युद्ध वास्तव में नहीं होगा क्योंकि इससे दोनों पक्षों को नुकसान होगा एकल अनुकूलन के विपरीत जिसमें संतुलन सम्मिलित है जो संभव या इष्टतम नहीं है एक उप खेल सही संतुलन दूसरे खिलाड़ी के कार्यों के लिए मेल खाता है तथा यह सुनिश्चित करता है कि कोई भी खिलाड़ी उप खेल में गलती से नहीं पहुंचता है इस जगह में पश्चवर्ती प्रवर्तन यह सुनिश्चित करता है कि प्रवेशकर्ता यह जानकर रणनीति परिचय में सबसे अच्छी प्रतिक्रिया नहीं बनाता तथा अवलंबी की धमकी के प्रति आश्वस्त नहीं होता है।[13]


पिछड़ा प्रवर्तन विरोधाभास अप्रत्याशित फांसी

अप्रत्याशित फांसी विरोधाभास पश्चवर्ती प्रवर्तन से संबंधित विरोधाभास है मान लीजिए किसी कैदी को बताया जाता है कि उसे अगले सप्ताह के सोमवार और शुक्रवार के बीच किसी समय फांसी दी जाएगी जबकि सटीक दिन एक आश्चर्य होगा कि वह रात से पहले नहीं जान पाएगी कि उसे अगले दिन मार दिया दी जायेगी अपने जल्लाद को चतुराई से मात देने में रुचि रखती है यह निर्धारित करने का प्रयास करती है कि निष्पादन किस दिन होगा।

वह तर्क देती है कि यह शुक्रवार को नहीं हो सकता है क्योंकि अगर यह गुरुवार के अंत तक नहीं हुआ होता तो उसे पता होता कि निष्पादन शुक्रवार को होगा इसलिए वह शुक्रवार को एक संभावना के रूप में समाप्त कर सकती है शुक्रवार को समाप्त होने के साथ वह फैसला करती है कि यह गुरुवार को नहीं हो सकता क्योंकि अगर यह बुधवार को नहीं हुआ होता तो उसे पता होता कि यह गुरुवार को होना चाहिए इसलिए वो गुरुवार को निष्कासन कर सकती हैं यह तर्क तब तक आगे बढ़ता है जब तक कि उसने सभी संभावनाओं को समाप्त नहीं कर दिया उसने निष्कर्ष निकाला कि उसे अगले सप्ताह फांसी नहीं दी जाएगी।

उसके आश्चर्य करने के लिए उसे बुधवार को फांसी दी गई उसने यह मानने की गलती की कि वह निश्चित रूप से जानती है कि भविष्य का कारक जो उसके निष्पादन का कारण वह था जिसके बारे में वह तर्क कर सकती थी।

यहां कैदी पिछड़ा प्रेरण द्वारा तर्क करता है लेकिन ऐसा लगता है कि वह गलत निष्कर्ष पर पहुंचा है ध्यान दें जबकि समस्या का वर्णन यह मानता है कि किसी ऐसे व्यक्ति को आश्चर्यचकित करना संभव है जो पश्चवर्ती प्रवर्तन कर रहा है गणितीय सिद्धांत यह धारणा नहीं बनाता है कि विरोधाभास इस सिद्धांत के परिणामों पर सवाल नहीं उठाता है इस विरोधाभास को दार्शनिकों द्वारा कुछ पर्याप्त चर्चा मिली है।

पिछड़ा प्रेरण और तर्कसंगतता का सामान्य ज्ञान

पश्चवर्ती प्रवर्तन तभी काम करता है जब दोनों खिलाड़ी तर्कसंगत हों यानी हमेशा एक ऐसी क्रिया का चयन करें जो उनके भुगतान को अधिकतम करे जबकि तर्कसंगतता पर्याप्त नहीं है प्रत्येक खिलाड़ी को यह भी मानना ​​चाहिए कि अन्य सभी खिलाड़ी तर्कसंगत हैं यह भी पर्याप्त नहीं है प्रत्येक खिलाड़ी को यह विश्वास होना चाहिए कि अन्य सभी खिलाड़ी जानते हैं कि खिलाड़ी तर्कसंगत हैं और इसी तरह अनंत तक दूसरे शब्दों में तार्किकता सामान्य ज्ञान तर्क होनी चाहिए।[14]


सीमित पिछड़ा प्रेरण

सीमित प्रेरण पूरी तरह से तर्कसंगत पश्चवर्ती प्रवर्तन से विचलन है इसमें पूर्ण दूरदर्शिता के बिना प्रवर्तन की नियमित प्रक्रिया को लागू करना सम्मिलित है सैद्धांतिक रूप से यह तब होता है जब एक या अधिक खिलाड़ियों की दूरदर्शिता सीमित होती है और वे सभी सहायक नोड्स के माध्यम से पश्चवर्ती प्रवर्तन नहीं कर सकते हैं [15] सीमित प्रेरण लंबे खेलों में बहुत बड़ी भूमिका निभाता है क्योंकि सीमित प्रेरण के प्रभाव बाद के खेलों में अधिक शक्तिशाली होते हैं प्रयोगों से पता चला है कि क्रमिक सौदेबाजी के खेल में जैसे कि चालीस पद खेल सैद्धांतिक भविष्यवाणियों से विचलित होते हैं और कुछ जगह सीमित पिछड़े प्रेरण में संलग्न होते हैं यह विचलन सीमित तर्कसंगतता के परिणामस्वरूप होते हैं जहां खिलाड़ी केवल कुछ ही चरणों को पूरी तरह से आगे देख सकते हैं [16] यह निर्णयों में अप्रत्याशितता और उप खेल पूर्ण रूप नैश संतुलन को खोजने और प्राप्त करने में अक्षमता की अनुमति देता है।

इस घटना के लिए तीन व्यापक परिकल्पनाएँ हैं-

  1. सामाजिक कारकों की उपस्थिति गैर-सामाजिक कारकों की उपस्थिति जैसे सीमित पिछड़े प्रेरण।
  2. सांस्कृतिक अंतर। पश्चवर्ती प्रवर्तन

का उल्लंघन मुख्य रूप से सामाजिक कारकों की उपस्थिति के लिए जिम्मेदार है जबकि अनुक्रमिक सौदेबाजी के खेल संज्ञानात्मक पदानुक्रम सिद्धांत का उपयोग करते हुए डेटा-संचालित प्रारूप भविष्यवाणियों ने इस बात पर प्रकाश डाला है कि कुछ खेलों में सीमित पिछड़े प्रेरण की उपस्थिति एक प्रमुख भूमिका निभा सकती है [17]बार-बार होने वाले पब्लिक अच्छे खेल में समूह का व्यवहार श्चवर्तीभप्रवर्तन ावित होता है जहां यह स्पष्ट है कि टीम के सदस्यों का प्रारंभिक योगदान अंत में योगदान से अधिक है सीमित पीछे कीप्रभावित करता है कि किसी समूह की जनता अच्छे खेल में नियमित रूप से मुक्त सवारी कैसे होती है प्रारंभिक रूप से जब सीमित पिछड़े प्रेरण के प्रभाव कम होते हैं तो मुक्त सवारी कम होती है जबकि अंत की ओर जब प्रभाव अधिक होते हैं तो मुक्त सवारी अधिक होती है [18]दौड खेल के एक प्रकार के भीतर सीमित पीछे की ओर प्रेरण का भी परपश्चवर्ती प्रवर्तन ं खिलाड़ी क्रमिक रूप से एक सीमा के भीतर पूर्णांकों का चयन करेंगे और लक्ष्य संख्या तक पहुंचने तक अपनी पसंद का योग करेंगे लक्ष्य को भेदने से उस खिलाड़ी को पुरस्कार मिलता है जबकि दूसरा हार जाता है खेलों की एक श्रृंखला के बीच में एक छोटा पुरस्कार पेश किया गया था अधिकांश खिलाड़ियों ने तब सीमित पिछड़े प्रेरण का प्रदर्शन किया क्योंकि उन्होंने मूल पुरस्कार के बजाय छोटे पुरस्कार के लिए हल कियजगह में खिलाड़ियों के केवल एक छोटगया े से अंश ने दोनों पुरस्कारों पर विचार किया कि पीछे की ओर प्रेरण के अधिकांश परीक्िणपश्चवर्ती प्रवर्तन िभागियों को कार्य को अच्छी तरह से करने के लिए प्रोत्साहित नहीं किेा जाता है जबकि पिछड़े पलंघन भी उच्च-दांव वाले वातावरण में सामान्य प्रतीत होते हैं उदाहरण के लिए अमेरिकी टेलीविजन का एक बड़े पैमाने पर विश्लेषण सीमित दूरदर्शिता का प्रमण प्रदान करता है तथा हर प्रतियोगी खेलते हैं जो सही जानकारी का एक क्रमिक खेल है जिसके लिए पीछे के प्रेरण के माध्यम से इष्टतम रणनीति पाई जा सकती पश्चवर्तीहप्रवर्तन के े लगातार और व्यवस्थित विचलन सुझाव देते हैं कि प्रतियोगियों का एक बड़ा अनुपात ठीक से पिछड़े प्रवेश में विफल रहता है और यह खेल के अगले चरण पर विचार करता है।[19]


टिप्पणियाँ

  1. Rust, John (9 September 2016). गतिशील प्रोग्रामिंग. The New Palgrave Dictionary of Economics: Palgrave Macmillan. ISBN 978-1-349-95121-5.
  2. Jerome Adda and Russell Cooper, "Dynamic Economics: Quantitative Methods and Applications", Section 3.2.1, page 28. MIT Press, 2003.
  3. Mario Miranda and Paul Fackler, "Applied Computational Economics and Finance", Section 7.3.1, page 164. MIT Press, 2002.
  4. Drew Fudenberg and Jean Tirole, "Game Theory", Section 3.5, page 92. MIT Press, 1991.
  5. Mathematics of Chess, webpage by John MacQuarrie.
  6. John von Neumann and Oskar Morgenstern, "Theory of Games and Economic Behavior", Section 15.3.1. Princeton University Press. Third edition, 1953. (First edition, 1944.)
  7. Watson, Joel (2002). Strategy: an introduction to game theory (3 ed.). New York: W.W. Norton & Company. p. 63.
  8. Watson, Joel (2002). Strategy: an introduction to game theory (3 ed.). New York: W.W. Norton & Company. pp. 186–187.
  9. Watson, Joel (2002). Strategy: an introduction to game theory (3 ed.). New York: W.W. Norton & Company. p. 188.
  10. Rust, John (9 September 2016). गतिशील प्रोग्रामिंग. The New Palgrave Dictionary of Economics: Palgrave Macmillan. ISBN 978-1-349-95121-5.
  11. Kamiński, Marek M. (2017). "Backward Induction: Merits And Flaws". Studies in Logic, Grammar and Rhetoric. 50 (1): 9–24. doi:10.1515/slgr-2017-0016.
  12. Camerer, Colin F (1 November 1997). "व्यवहार गेम थ्योरी में प्रगति". Journal of Economic Perspectives. 11 (4): 167–188. doi:10.1257/jep.11.4.167. JSTOR 2138470.
  13. Rust J. (2008) Dynamic Programming. In: Palgrave Macmillan (eds) The New Palgrave Dictionary of Economics. Palgrave Macmillan, London
  14. Aumann, Robert J. (January 1995). "बैकवर्ड इंडक्शन और तर्कसंगतता का सामान्य ज्ञान". Games and Economic Behavior. 8 (1): 6–19. doi:10.1016/S0899-8256(05)80015-6.
  15. Marco Mantovani, 2015. "Limited backward induction: foresight and behavior in sequential games," Working Papers 289, University of Milano-Bicocca, Department of Economics
  16. Ke, Shaowei (2019). "बाउंडली रेशनल बैकवर्ड इंडक्शन". Theoretical Economics. 14 (1): 103–134. doi:10.3982/TE2402. S2CID 9053484.
  17. Qu, Xia; Doshi, Prashant (1 March 2017). "अनुक्रमिक सौदेबाजी के खेल में निष्पक्षता और सीमित पिछड़े प्रवेश की भूमिका पर". Annals of Mathematics and Artificial Intelligence. 79 (1): 205–227. doi:10.1007/s10472-015-9481-7. S2CID 23565130.
  18. Cox, Caleb A.; Stoddard, Brock (May 2018). "सार्वजनिक वस्तुओं के खेल में टीमों के साथ रणनीतिक सोच". Journal of Public Economics. 161: 31–43. doi:10.1016/j.jpubeco.2018.03.007.
  19. Klein Teeselink, Bouke; van Dolder, Dennie; van den Assem, Martijn; Dana, Jason (2022). "High-Stakes Failures of Backward Induction: Evidence from "The Price Is Right"". {{cite journal}}: Cite journal requires |journal= (help)
   [Category:Inductive reasoni