पश्चवर्ती प्रवर्तन
पश्चवर्ती प्रवर्तन किसी समस्या या स्थिति के अंत से इष्टतम क्रियाओं के क्रम को निर्धारित करने के लिए पश्चवर्ती प्रवर्तन की ओर तर्क करने की प्रक्रिया है यह प्रवर्तन अंतिम बिंदु की जांच करके आगे बढ़ता है जिस पर निर्णय लिया जाना है और फिर यह पहचानना है कि उस समय कौन सी कार्रवाई सबसे सही होगी इस जानकारी का उपयोग करके यह निर्धारित किया जा सकता है कि निर्णय के दूसरे या अंतिम समय में क्या करना है यह प्रक्रिया पीछे की ओर तब तक जारी रहती है जब तक कि हर समय हर संभव स्थिति यानी हर संभव सूचना समूह खेल की परिभाषा की सबसे अच्छी कार्रवाई निर्धारित नहीं की जाती है पश्चवर्ती प्रवर्तन का उपयोग 1875 में आर्थर केली द्वारा किया गया था जिन्होंने विख्यात सचिव समस्या को हल करने की कोशिश करते हुए इस विधि को उजागर किया गया था [1]गतिशील कार्यक्रम के गणितीय अनुकूलन गणित पद्धति में बेलमैन समीकरण को हल करने के लिए पश्चवर्ती प्रवर्तन के मुख्य तरीकों में से एक है [2][3] खेल सिद्धांत में पश्चवर्ती प्रवर्तन की अनुक्रमिक खेल में उप खेल पूर्णता की गणना करने के लिए उपयोग की जाने वाली एक विधि है इसमें [4] अंतर केवल इतना है कि अनुकूलन में एक निर्णय सिद्धांत सम्मिलित होता है जो प्रत्येक समय पर क्या करना है यह चुनता है जबकि खेल सिद्धांत विश्लेषण कई खिलाड़ियों के निर्णय कैसे क्रिया करते हैं अर्थात् यह अनुमान लगाकर कि प्रत्येक स्थिति में अंतिम खिलाड़ी क्या करेगा यह निर्धारित करना संभव है कि दूसरा खिलाड़ी क्या करेगा इत्यादि स्वचालित योजना और शेड्यूलिंग और स्वचालित प्रमेय को प्रमाण देने के क्षेत्र में इस विधि को पश्चवर्ती प्रवर्तन खोज या पीछे की ओर श्रृंखलन कहा जाता है शतरंज में इसे प्रतिगामी विश्लेषण भी कहा जाता है
जब तक खेल परिभाषा का क्षेत्र एकत्र है तब तक खेलों को हल करने के लिए पीछे की ओर प्रेरण का उपयोग किया जाता रहा है जॉन वॉन न्यूमैन और ऑस्कर मॉर्गनस्टर्न ने अपनी 'थ्योरी ऑफ गेम्स एंड इकोनॉमिक बिहेवियर' 1944 में पीछे की ओर प्रेरण द्वारा शून्य राशि में दो व्यक्ति ने खेल को हल करने का सुझाव दिया जिसने खेल परिभाषा को अध्ययन के क्षेत्र के रूप में स्थापित किया।[5][6]
निर्णय लेने में पीछे की ओर प्रेरण एक इष्टतम रोक की समस्या
एक बेरोजगार व्यक्ति पर विचार करें जो दस वर्षों तक काम करने में सक्षम होगा t = 1,2,...,10 मान लीजिए कि प्रत्येक वर्ष जिसमें वे बेरोजगार रहते हैं उन्हें एक 'अच्छी' नौकरी की पेशकश की जा सकती है जो $100 का भुगतान करती है या एक खराब नौकरी जो $44 का भुगतान करती है समान संभावना 50/50 के साथ एक बार जब वे नौकरी स्वीकार कर लेते हैं तो वे दस वर्षों तक उस नौकरी में बने रहेंगे सरलता के लिए मान लें कि वे केवल अपनी मौद्रिक कमाई के बारे में परवाह करते हैं और वे अलग-अलग समय पर कमाई को समान रूप से महत्व देते हैं यानी समय वरीयता एक है।
क्या इस व्यक्ति को खराब नौकरी स्वीकार करनी चाहिए इस प्रश्न का उत्तर देने के लिए हम समय t = 10 से पीछे की ओर तर्क कर सकते हैं।
- समय 10 पर एक अच्छी नौकरी स्वीकार करने का मूल्य $100 है खराब नौकरी को स्वीकार करने का मूल्य $44 है उपलब्ध नौकरी को अस्वीकार करने का मूल्य शून्य है इसलिए यदि वे अंतिम अवधि में अभी भी बेरोजगार हैं तो उन्हें उस समय जो भी नौकरी की पेशकश की जाती है उसे स्वीकार कर लेना चाहिए।
- समय 9 पर एक अच्छी नौकरी स्वीकार करने का मूल्य $200 है क्योंकि वह नौकरी दो साल तक चलेगी खराब नौकरी को स्वीकार करने का मूल्य 2*$44 = $88 है नौकरी की पेशकश को स्वीकार करने का मूल्य अब $ 0 है साथ ही अगले नौकरी की पेशकश की प्रतीक्षा करने का मूल्य जो 0.5 के औसत के अपेक्षित मूल्य के लिए या तो 50 प्रतिशत संभावना के साथ $ 44 या 50 प्रतिशत के साथ $ 100 होगा $100+$44 = $72 इसलिए इस बात की परवाह किए बिना कि 9 समय पर उपलब्ध नौकरी अच्छी है या बुरी उस प्रस्ताव को स्वीकार करना बेहतर है।
- समय 8 पर एक अच्छी नौकरी स्वीकार करने का मूल्य $300 है यह तीन साल तक चलेगा खराब नौकरी को स्वीकार करने का मूल्य 3*$44 = $132 है नौकरी की पेशकश को अस्वीकार करने का मूल्य अब $ 0 है साथ ही समय 9 पर नौकरी की पेशकश की प्रतीक्षा करने का मूल्य निम्न है चूंकि हम पहले ही निष्कर्ष निकाल चुके हैं कि समय 9 पर प्रस्तावों को स्वीकार किया जाना चाहिए समय 9 पर नौकरी की पेशकश की प्रतीक्षा करने का अपेक्षित मूल्य 0.5*$200+$88 = $144 है इसलिए 8 बजे तक खराब नौकरी स्वीकार करने की तुलना में अगले प्रस्ताव की प्रतीक्षा करना अधिक मूल्यवान है।
पीछे की ओर काम करना जारी रखकर यह सत्यापित किया जा सकता है कि खराब प्रस्तावों को केवल तभी स्वीकार किया जाना चाहिए जब कोई 9 या 10 बार बेरोजगार हो उन्हें हर समय t = 8 तक समाप्त कर दिया जाना चाहिए अंतर्ज्ञान यह है कि यदि कोई लंबे समय तक नौकरी में काम करने की उम्मीद करता है तो इससे यह अधिक मूल्यवान हो जाता है कि हमें किस नौकरी को स्वीकार करना है।
इस तरह की एक गतिशील अनुकूलन समस्या को इष्टतम रोक समस्या कहा जाता है क्योंकि बेहतर प्रस्ताव की प्रतीक्षा कब बंद करनी है खोज सिद्धांत सूक्ष्म अर्थशास्त्र का क्षेत्र है जो इस प्रकार की समस्याओं को खरीदारी नौकरी की खोज और विवाह जैसे संदर्भों में लागू करता है।
खेल परिभाषा में पीछे की ओर प्रेरण
खेल परिभाषा में पीछे की ओर प्रेरण एक समाधान अवधारणा है यह तर्कसंगत अवधारणा का परिशोधन है जो एक खेल के व्यापक रूप के प्रतिनिधित्व में व्यक्तिगत सूचना समूह के प्रति संवेदनशील है [7] पीछे की ओर प्रेरण का विचार किसी दिए गए खेल का पेड़ में प्रत्येक जानकारी के लिए एक इष्टतम क्रिया की पहचान करके अनुक्रमिक तर्कसंगतता का उपयोग करता है।
जोएल वाटसन द्वारा रणनीति खेल परिभाषा का एक परिचय में पीछे की ओर प्रेरण प्रक्रिया को इस प्रकार परिभाषित किया गया है तथा यह अंत से शुरुआत तक खेल का विश्लेषण करने की प्रक्रिया प्रत्येक निर्णय नोड पर किसी भी कार्रवाई पर विचार किया जाता है टर्मिनल नोड्स को देखते हुए जो उत्तराधिकारी नोड्स पर पहचाने गए कार्यों के खेल के माध्यम से पहुंचाया जा सकता है [8] पीछे की ओर प्रेरण प्रक्रिया का एक दोष यह है कि इसे केवल खेलों की सीमित कक्षाओं में ही लागू किया जा सकता है उपयोगिता के बंधनों के बिना सही जानकारी के किसी भी खेल के लिए प्रक्रिया अच्छी तरह से परिभाषित है यह संबंधों के साथ सही जानकारी वाले खेलों के लिए भी अच्छी तरह से परिभाषित और सार्थक है जबकि यह एक से अधिक रणनीति परिचय की ओर ले जाता है इस प्रक्रिया को गैर-तुच्छ सूचना समूह वाले कुछ खेलों पर लागू किया जा सकता है लेकिन यह सामान्य रूप से अविश्वसनीय है सही जानकारी वाले खेलों को हल करने के लिए प्रक्रिया सबसे उपयुक्त है इसलिए यदि सभी खिलाड़ी अन्य खिलाड़ियों के कार्यों और प्रत्येक निर्णय नोड पर अदायगी के प्रति सचेत नहीं है तो पीछे की ओर प्रेरण इतनी आसानी से लागू नहीं होता है वाटसन ने [9]पीछे की ओर प्रेरण की प्रक्रिया को एक साधारण उदाहरण के साथ प्रदर्शित किया जा सकता है।
खेल परिभाषा में पीछे की ओर प्रेरण
प्रस्तावित खेल एक बहु चरण खेल है जिसमें 2 खिलाड़ी सम्मिलित हैं खिलाड़ी फिल्म देखने की योजना रहे हैं वर्तमान में 2 फिल्में हैं जोकर और टर्मिनेटर जो बहुत लोकप्रिय हैं खिलाड़ी 1 टर्मिनेटर देखना चाहता है और खिलाड़ी 2 जोकर देखना चाहता है इसलिए खिलाड़ी 1 पहले टिकट खरीदेगा और खिलाड़ी 2 को अपनी पसंद के बारे में बताएगा फिर खिलाड़ी 2 उसका टिकट खरीदेगा एक बार जब वे दोनों विकल्पों का निरीक्षण कर लेते हैं तो वे फिल्म जाने या घर पर रहने के बारे में चुनाव करेंगे पहले चरण की तरह ही खिलाड़ी 1 पहले चुनता है 2 खिलाड़ी 1 की पसंद को देखने के बाद अपनी पसंद बनाता है।
इस उदाहरण के लिए हम मानते हैं कि अदायगी विभिन्न चरणों में जोड़ी जाती है जो एक संपूर्ण सूचना खेल है।
Player 2 Player 1 |
Joker | Terminator |
---|---|---|
Joker | 3, 5 | 0, 0 |
Terminator | 1, 1 | 5, 3 |
Player 2 Player 1 |
Go to Movie | Stay Home |
---|---|---|
Go to Movie | 6, 6 | 4, -2 |
Stay Home | -2, 4 | -2, -2 |
इस बहु चरण खेल को हल करने के चरण व्यापक रूप से दाईं ओर देखे गए हैं
- पीछे की ओर प्रेरण खेल को अंतिम नोड्स से हल करना शुरू करता है।
- खिलाड़ी 2 गो टू मूवी या स्टे होम चुनने के लिए अंतिम नोड्स से 8 उप खेल का अवलोकन करेगा
- दूसरे खिलाड़ी से कुल 4 तुलनाएं होंगी वह उच्च भुगतान के साथ एक विकल्प का चयन करेगा
- उदाहरण के लिए पहले उप खेल पर विचार करते हुए 11 का भुगतान 7 से अधिक है इसलिए खिलाड़ी 2 मूवी चुनता है।
- विधि प्रत्येक उपखेल के लिए जारी रहती है।
- एक बार जब खिलाड़ी 2 अपनी पसंद पूरी कर लेता है तो खिलाड़ी 1 चयनित उप खेलों के आधार पर अपनी पसंद बनाएगा।
- प्रक्रिया चरण 2 के समान है खिलाड़ी 1 अपनी पसंद बनाने के लिए अपने भुगतान की तुलना करती है।
- पिछले चरण से खिलाड़ी 2 द्वारा न चुने गए उपखेल पर अब दोनों खिलाड़ियों द्वारा विचार नहीं किया जाता है क्योंकि वे इष्टतम नहीं हैं।
- उदाहरण के लिए गो टू मूवी का विकल्प 9,11 का भुगतान प्रदान करता है और स्टे होम का विकल्प 1, 9 का भुगतान प्रदान करता है खिलाड़ी 1 मूवी का चयन करेगा।
- प्रक्रिया प्रत्येक खिलाड़ी के लिए तब तक दोहराती है जब तक कि प्रक्रिया प्रारंभिक नोड तक नहीं पहुंच जाता।
- उदाहरण के लिए खिलाड़ी 2 जोकर को चुनेगा क्योंकि 11 (9, 11) का भुगतान 6 (6, 6) के भुगतान वाले टर्मिनेटर से अधिक है।
- उदाहरण के लिए खिलाड़ी 1 प्रारंभिक नोड पर टर्मिनेटर का चयन करेगा क्योंकि यह 11 का उच्च भुगतान प्रदान करता है टर्मिनेटर (11, 9)> जोकर (9, 11) चयन करता है।
- उप खेल में सही संतुलन की पहचान करने के लिए हमें एक मार्ग की पहचान करने की आवश्यकता है जो प्रत्येक सूचना समूह पर इष्टतम उप खेल का चयन करता है।
- इस उदाहरण में खिलाड़ी 1 टर्मिनेटर चुनता है और खिलाड़ी 2 भी टर्मिनेटर चुनता है फिर वे दोनों गो टू मूवी चुनते हैं।
- उप खेल सही संतुलन (11,9) के भुगतान की ओर ले जाता है।
खेल परिभाषा में पीछे की ओर प्रेरण अंतिम स्थित खेल
पीछे की ओर प्रेरण एक खेल को अंत से शुरुआत तक विश्लेषण करने की प्रक्रिया है अन्य नैश संतुलन के समाधान के साथ खिलाड़ियों की तर्कसंगतता और पूर्ण ज्ञान ग्रहण किया जाता है पीछे की ओर प्रेरण की अवधारणा इस धारणा से मेल खाती है कि यह सामान्य ज्ञान है और प्रत्येक खिलाड़ी प्रत्येक निर्णय नोड के साथ तर्कसंगत रूप से कार्य करेगा जब वह एक विकल्प चुनता है तो भले ही उसकी तर्कसंगतता का अर्थ यह हो कि यह ऐसा नोड नहीं है तर्कसंगतता की पारस्परिक धारणा के तहत पीछे की ओर प्रेरण प्रत्येक खिलाड़ी को यह अनुमान लगाने की अनुमति देता है कि खेल के प्रत्येक चरण में उनका प्रतिद्वंद्वी क्या करेगा।
एक उप खेल के लिए पीछे की ओर प्रेरण के साथ सही संतुलन को हल करने के लिए खेल को व्यापक खेल के रूप में लिखा जाना चाहिए और फिर उप खेलों में विभाजित किया जाना चाहिए शुरुआती नोड या शुरुआती बिंदु उपखेल से शुरू होकर इस उपखेल के लिए सूचीबद्ध अपेक्षित अदायगी को तौला जाता है और तर्कसंगत खिलाड़ी अपने लिए उच्च अदायगी वाले विकल्प का चयन करेगा उच्चतम भुगतान सदिश चयन और चिह्नित किया गया है शुरुआती बिंदु पर पहुंचने तक उपखेल से लगातार पीछे की ओर काम करके उपखेल सही संतुलन के लिए हल करें जैसे-जैसे यह प्रक्रिया आगे बढ़ती है आपका प्रारंभिक व्यापक रूप का खेल छोटा होता जाएगा सदिशों का चिन्हित पथ उपखेल पूर्ण संतुलन है [10] पीछे की ओर प्रेरण अंतिम खेल पर लागू होता है।
दो खिलाड़ियों के बीच एक खेल के बारे में सोचें जहां खिलाड़ी 1 खिलाड़ी 2 के साथ एक डॉलर बांटने का प्रस्ताव रखता है यह एक प्रसिद्ध असममित खेल है जिसे क्रमिक रूप से खेला जाता है जिसे अंतिम खेल कहा जाता है खिलाड़ी एक डॉलर को विभाजित करके पहले कार्य करता है जबकि वे फिट दिखते हैं अब यह दो खिलाड़ी एक द्वारा निपटाए गए हिस्से को स्वीकार कर सकते हैं या विभाजन को अस्वीकार कर सकते हैं यदि खिलाड़ी 2 विभाजन को स्वीकार करता है तो खिलाड़ी 1 और खिलाड़ी 2 दोनों को उस विभाजन के अनुसार अदायगी मिलती है यदि खिलाड़ी दो खिलाड़ी 1 के प्रस्ताव को अस्वीकार करने का निर्णय लेता है तो दोनों खिलाड़ियों को कुछ नहीं मिलता है दूसरे शब्दों में खिलाड़ी 2 के पास खिलाड़ी 1 के प्रस्तावित आवंटन शक्ति हैं लेकिन रोक लागू करने से दोनों खिलाड़ियों के लिए इनाम समाप्त हो जाता है [11] इसलिए इस खेल के लिए रणनीति परिचय को 0 और 1 के बीच सभी x के लिए जोड़े x, fx के रूप में लिखा जा सकता है जहां fx एक द्वि-मूल्यवान कार्यक्रम है जो यह व्यक्त करता है कि x स्वीकार किया गया है या नहीं।
खिलाड़ी 1 द्वारा किसी भी मनमाने प्रस्ताव को देखते हुए खिलाड़ी 2 की पसंद और प्रतिक्रिया पर विचार करें यह मानते हुए कि प्रस्ताव $0 से बड़ा है पीछे की ओर प्रेरण का उपयोग करते हुए निश्चित रूप से हम उम्मीद करेंगे कि खिलाड़ी 2 डॉलर 0 से अधिक या उसके बराबर किसी भी अदायगी को स्वीकार करेगा तदनुसार खिलाड़ी 1 को विभाजन के सबसे बड़े हिस्से को हासिल करने के लिए जितना संभव हो उतना कम खिलाड़ी देने का प्रस्ताव देना चाहिए लेकिन खिलाड़ी 1 खिलाड़ी 2 को पैसे की सबसे छोटी इकाई देना और बाकी को उसके लिए रखना अद्वितीय है जो उप खेल का सही संतुलन है
अंतिम चरण में खेल अनंत खेलों पर विचार करते समय पीछे की ओर प्रेरण की उपयोगिता का एक उदाहरण है जबकि खेल के सैद्धांतिक रूप से अनुमानित परिणामों की आलोचना की जाती है प्रायोगिक साक्ष्यों से पता चला है कि प्रस्तावक ही कभी $0 की पेशकश करता है और खिलाड़ी 2 कभी-कभी निष्पक्षता के आधार पर $0 से अधिक के प्रस्तावों को भी अस्वीकार करता है खिलाड़ी 2 द्वारा किसे उचित माना जाता है यह संदर्भ के अनुसार भिन्न होता है और अन्य खिलाड़ियों के दबाव या उपस्थिति का मतलब यह हो सकता है कि खेल परिभाषा प्रारूप आवश्यक रूप से भविष्यवाणी नहीं कर सकता है कि वास्तविक लोग क्या चुनेंगे।
व्यवहार में उप खेल सही संतुलन हमेशा प्राप्त नहीं होता है कैमरर के अनुसार एक अमेरिकी व्यवहारवादी अर्थशास्त्री खिलाड़ी 2 लगभग आधे समय में एक्स के 20 प्रतिशत से कम के प्रस्तावों को करता है भले ही वे कुछ भी नहीं समाप्त करते हैं [12] जबकि पीछे की ओर प्रेरण यह भविष्यवाणी करेगा कि उत्तरदाता शून्य के बराबर या उससे अधिक किसी भी प्रस्ताव को स्वीकार करता है उत्तरदाता वास्तव में तर्कसंगत खिलाड़ी नहीं हैं और इसलिए संभावित मौद्रिक लाभ के बजाय निष्पक्षता की पेशकश के बारे में अधिक ध्यान रखते हैं।
अर्थशास्त्र में पिछड़ा प्रवेश प्रवेश-निर्णय समस्या
एक गतिशील खेल पर विचार करें जिसमें खिलाड़ी एक उद्योग में एक एकत्र फर्म हैं और उस उद्योग के संभावित प्रवेशकर्ता हैं जैसा कि यह खड़ा है अवलंबी का उद्योग पर एकाधिकार है और वह प्रवेशकर्ता को अपना कुछ बाजार हिस्सा खोना नहीं चाहता है यदि प्रवेशकर्ता प्रवेश नहीं चुनता है तो अवलंबी को अदायगी अधिक होती है यह अपना एकाधिकार बनाए रखता है और प्रवेशकर्ता न तो हारता है और न ही लाभ प्राप्त करता है इसका भुगतान शून्य है यदि प्रवेशकर्ता प्रवेश करता है तो अवलंबी प्रवेशकर्ता से लड़ सकता है या समायोजित कर सकता है यह अपनी कीमत कम करके प्रवेश करने वाले को व्यवसाय से बाहर और बाहर निकलने की लागत एक नकारात्मक अदायगी चलाकर और अपने स्वयं के मुनाफे को नुकसान पहुँचाकर लड़ेगा यदि यह प्रवेशकर्ता को समायोजित करता है तो इसकी बिक्री में कुछ कमी आएगी लेकिन एक उच्च कीमत बनी रहेगी और इसकी कीमत कम करने की तुलना में इसे अधिक लाभ प्राप्त होगा लेकिन एकाधिकार लाभ से कम है।
इस बात पर विचार करें कि यदि प्रवेशकर्ता प्रवेश करता है तो अवलंबी की सबसे अच्छी प्रतिक्रिया समायोजित करना है या नहीं यदि अवलंबी समायोजित करता है तो प्रवेशकर्ता की सबसे अच्छी प्रतिक्रिया प्रवेश करना और लाभ प्राप्त करना है इसलिए रणनीति परिचय जिसमें प्रवेशकर्ता प्रवेश करता है और यदि प्रवेशकर्ता प्रवेश करता है तो अवलंबी समायोजित करता है पिछड़े प्रेरण के साथ संगत संतुलन है जबकि यदि अवलंबी लड़ने जा रहा है तो प्रवेशकर्ता की सबसे अच्छी प्रतिक्रिया प्रवेश नहीं करना है और यदि प्रवेशी प्रवेश नहीं करता है तो इससे कोई फर्क नहीं पड़ता कि प्रवेशकर्ता प्रवेश करने वाले काल्पनिक जगहों में क्या करना चाहता है इसलिए रणनीति परिचय जिसमें प्रवेश करने वाला प्रवेश करता है लेकिन प्रवेशकर्ता प्रवेश नहीं करता है तो वह संतुलन भी है जबकि प्रवेश करने वाले को विचलित करने और प्रवेश करने के लिए अवलंबी की सबसे अच्छी प्रतिक्रिया समायोजित करना है लड़ाई का खतरा विश्वसनीय नहीं है इस दूसरे संतुलन को पश्चगामी प्रेरण द्वारा समाप्त किया जा सकता है।
प्रत्येक निर्णय लेने की प्रक्रिया उप खेल में नैश संतुलन ढूँढना पूर्ण संतुलन के रूप में बनता है इस प्रकार ये रणनीति परिचय जो सही संतुलन दर्शाती हैं अविश्वसनीय खतरों जैसी कार्रवाइयों की संभावना को बाहर करती हैं जो एक प्रवेशी को डराने के लिए उपयोग की जाती हैं यदि अवलंबी एक प्रवेशी के साथ मूल्य युद्ध शुरू करने की धमकी देता है तो वे अपनी कीमतों को एक एकाधिकार मूल्य से प्रवेशकर्ता की तुलना में थोड़ा कम करने की धमकी दे रहे हैं जो कि अव्यावहारिक और अविश्वसनीय होगा यदि प्रवेशकर्ता जानता था कि मूल्य युद्ध वास्तव में नहीं होगा क्योंकि इससे दोनों पक्षों को नुकसान होगा। एकल अनुकूलन के विपरीत जिसमें संतुलन सम्मिलित है जो संभव या इष्टतम नहीं है एक उप खेल सही संतुलन दूसरे खिलाड़ी के कार्यों के लिए खाता है इस प्रकार यह सुनिश्चित करता है कि कोई भी खिलाड़ी उप खेल में गलती से नहीं पहुंचता है इस जगह में पीछे की ओर प्रेरण यह सुनिश्चित करता है कि प्रवेशकर्ता यह जानकर कि यह रणनीति परिचय में सबसे अच्छी प्रतिक्रिया नहीं थी अवलंबी की धमकी के प्रति आश्वस्त नहीं होगा।[13]
पिछड़ा प्रेरण विरोधाभास अप्रत्याशित फांसी
अप्रत्याशित फांसी विरोधाभास पीछे की ओर प्रेरण से संबंधित विरोधाभास है मान लीजिए किसी कैदी को बताया जाता है कि उसे अगले सप्ताह के सोमवार और शुक्रवार के बीच किसी समय फांसी दी जाएगी जबकि सटीक दिन एक आश्चर्य होगा कि वह रात से पहले नहीं जान पाएगी कि उसे अगले दिन मार दिया दी जायेगी अपने जल्लाद को चतुराई से मात देने में रुचि रखती है यह निर्धारित करने का प्रयास करती है कि निष्पादन किस दिन होगा।
वह तर्क देती है कि यह शुक्रवार को नहीं हो सकता है क्योंकि अगर यह गुरुवार के अंत तक नहीं हुआ होता तो उसे पता होता कि निष्पादन शुक्रवार को होगा इसलिए वह शुक्रवार को एक संभावना के रूप में समाप्त कर सकती है शुक्रवार को समाप्त होने के साथ वह फैसला करती है कि यह गुरुवार को नहीं हो सकता क्योंकि अगर यह बुधवार को नहीं हुआ होता तो उसे पता होता कि यह गुरुवार को होना चाहिए इसलिए वो गुरुवार को निष्कासन कर सकती हैं यह तर्क तब तक आगे बढ़ता है जब तक कि उसने सभी संभावनाओं को समाप्त नहीं कर दिया उसने निष्कर्ष निकाला कि उसे अगले सप्ताह फांसी नहीं दी जाएगी।
उसके आश्चर्य करने के लिए उसे बुधवार को फांसी दी गई उसने यह मानने की गलती की कि वह निश्चित रूप से जानती है कि भविष्य का कारक जो उसके निष्पादन का कारण वह था जिसके बारे में वह तर्क कर सकती थी।
यहां कैदी पिछड़ा प्रेरण द्वारा तर्क करता है लेकिन ऐसा लगता है कि वह गलत निष्कर्ष पर पहुंचा है ध्यान दें जबकि समस्या का वर्णन यह मानता है कि किसी ऐसे व्यक्ति को आश्चर्यचकित करना संभव है जो पीछे की ओर प्रेरण कर रहा है गणितीय सिद्धांत यह धारणा नहीं बनाता है कि विरोधाभास इस सिद्धांत के परिणामों पर सवाल नहीं उठाता है इस विरोधाभास को दार्शनिकों द्वारा कुछ पर्याप्त चर्चा मिली है।
पिछड़ा प्रेरण और तर्कसंगतता का सामान्य ज्ञान
पीछे की ओर प्रेरण तभी काम करता है जब दोनों खिलाड़ी तर्कसंगत हों यानी हमेशा एक ऐसी क्रिया का चयन करें जो उनके भुगतान को अधिकतम करे जबकि तर्कसंगतता पर्याप्त नहीं है प्रत्येक खिलाड़ी को यह भी मानना चाहिए कि अन्य सभी खिलाड़ी तर्कसंगत हैं यह भी पर्याप्त नहीं है प्रत्येक खिलाड़ी को यह विश्वास होना चाहिए कि अन्य सभी खिलाड़ी जानते हैं कि अन्य सभी खिलाड़ी तर्कसंगत हैं और इसी तरह अनंत तक दूसरे शब्दों में तार्किकता सामान्य ज्ञान तर्क होनी चाहिए।[14]
सीमित पिछड़ा प्रेरण
सीमित प्रेरण पूरी तरह से तर्कसंगत पीछे की ओर प्रेरण से विचलन है इसमें पूर्ण दूरदर्शिता के बिना प्रेरण की नियमित प्रक्रिया को लागू करना सम्मिलित है सैद्धांतिक रूप से यह तब होता है जब एक या अधिक खिलाड़ियों की दूरदर्शिता सीमित होती है और वे सभी टर्मिनल नोड्स के माध्यम से पीछे की ओर प्रेरण नहीं कर सकते हैं [15] सीमित प्रेरण लंबे खेलों में बहुत बड़ी भूमिका निभाता है क्योंकि सीमित प्रेरण के प्रभाव बाद के खेलों में अधिक शक्तिशाली होते हैं प्रयोगों से पता चला है कि क्रमिक सौदेबाजी के खेल में जैसे कि सेंटीपीड खेल सैद्धांतिक भविष्यवाणियों से विचलित होते हैं और कुछ जगह सीमित पिछड़े प्रेरण में संलग्न होते हैं यह विचलन सीमित तर्कसंगतता के परिणामस्वरूप होता है जहां खिलाड़ी केवल कुछ ही चरणों को पूरी तरह से आगे देख सकते हैं [16] यह निर्णयों में अप्रत्याशितता और उप खेल पूर्ण रूप नैश संतुलन को खोजने और प्राप्त करने में अक्षमता की अनुमति देता है।
इस घटना के लिए तीन व्यापक परिकल्पनाएँ हैं
- सामाजिक कारकों की उपस्थिति गैर-सामाजिक कारकों की उपस्थिति जैसे सीमित पिछड़े प्रेरण।
- सांस्कृतिक अंतर।
पीछे की ओर प्रेरण का उल्लंघन मुख्य रूप से सामाजिक कारकों की उपस्थिति के लिए जिम्मेदार है जबकि अनुक्रमिक सौदेबाजी के खेल संज्ञानात्मक पदानुक्रम सिद्धांत का उपयोग करते हुए डेटा-संचालित प्रारूप भविष्यवाणियों ने इस बात पर प्रकाश डाला है कि कुछ खेलों में सीमित पिछड़े प्रेरण की उपस्थिति एक प्रमुख भूमिका निभा सकती है [17]बार-बार होने वाले पब्लिक अच्छे खेल में समूह का व्यवहार सीमित पीछे की ओर प्रेरण से प्रभावित होता है जहां यह स्पष्ट है कि टीम के सदस्यों का प्रारंभिक योगदान अंत में योगदान से अधिक है सीमित पीछे की ओर प्रेरण यह भी प्रभावित करता है कि किसी समूह की जनता अच्छे खेल में नियमित रूप से मुक्त सवारी कैसे होती है प्रारंभिक रूप से जब सीमित पिछड़े प्रेरण के प्रभाव कम होते हैं तो मुक्त सवारी कम होती है जबकि अंत की ओर जब प्रभाव अधिक होते हैं तो मुक्त सवारी अधिक होती है [18]दौड खेल के एक प्रकार के भीतर सीमित पीछे की ओर प्रेरण का भी परीक्षण किया गया है खेल में खिलाड़ी क्रमिक रूप से एक सीमा के भीतर पूर्णांकों का चयन करेंगे और लक्ष्य संख्या तक पहुंचने तक अपनी पसंद का योग करेंगे लक्ष्य को भेदने से उस खिलाड़ी को पुरस्कार मिलता है जबकि दूसरा हार जाता है खेलों की एक श्रृंखला के बीच में एक छोटा पुरस्कार पेश किया गया था अधिकांश खिलाड़ियों ने तब सीमित पिछड़े प्रेरण का प्रदर्शन किया क्योंकि उन्होंने मूल पुरस्कार के बजाय छोटे पुरस्कार के लिए हल किया शुरुआत में खिलाड़ियों के केवल एक छोटे से अंश ने दोनों पुरस्कारों पर विचार किया कि पीछे की ओर प्रेरण के अधिकांश परीक्षण प्रयोगों पर आधारित होते हैं जिनमें प्रतिभागियों को कार्य को अच्छी तरह से करने के लिए प्रोत्साहित नहीं किया जाता है जबकि पिछड़े प्रेरण के उल्लंघन भी उच्च-दांव वाले वातावरण में सामान्य प्रतीत होते हैं उदाहरण के लिए अमेरिकी टेलीविजन का एक बड़े पैमाने पर विश्लेषण सीमित दूरदर्शिता का प्रमाण प्रदान करता है तथा हर प्रतियोगी खेलते हैं जो सही जानकारी का एक क्रमिक खेल है जिसके लिए पीछे के प्रेरण के माध्यम से इष्टतम रणनीति पाई जा सकती है इष्टतम व्यवहार से लगातार और व्यवस्थित विचलन सुझाव देते हैं कि प्रतियोगियों का एक बड़ा अनुपात ठीक से पिछड़े प्रवेश में विफल रहता है और यह खेल के अगले चरण पर विचार करता है।[19]
टिप्पणियाँ
- ↑ Rust, John (9 September 2016). गतिशील प्रोग्रामिंग. The New Palgrave Dictionary of Economics: Palgrave Macmillan. ISBN 978-1-349-95121-5.
- ↑ Jerome Adda and Russell Cooper, "Dynamic Economics: Quantitative Methods and Applications", Section 3.2.1, page 28. MIT Press, 2003.
- ↑ Mario Miranda and Paul Fackler, "Applied Computational Economics and Finance", Section 7.3.1, page 164. MIT Press, 2002.
- ↑ Drew Fudenberg and Jean Tirole, "Game Theory", Section 3.5, page 92. MIT Press, 1991.
- ↑ Mathematics of Chess, webpage by John MacQuarrie.
- ↑ John von Neumann and Oskar Morgenstern, "Theory of Games and Economic Behavior", Section 15.3.1. Princeton University Press. Third edition, 1953. (First edition, 1944.)
- ↑ Watson, Joel (2002). Strategy: an introduction to game theory (3 ed.). New York: W.W. Norton & Company. p. 63.
- ↑ Watson, Joel (2002). Strategy: an introduction to game theory (3 ed.). New York: W.W. Norton & Company. pp. 186–187.
- ↑ Watson, Joel (2002). Strategy: an introduction to game theory (3 ed.). New York: W.W. Norton & Company. p. 188.
- ↑ Rust, John (9 September 2016). गतिशील प्रोग्रामिंग. The New Palgrave Dictionary of Economics: Palgrave Macmillan. ISBN 978-1-349-95121-5.
- ↑ Kamiński, Marek M. (2017). "Backward Induction: Merits And Flaws". Studies in Logic, Grammar and Rhetoric. 50 (1): 9–24. doi:10.1515/slgr-2017-0016.
- ↑ Camerer, Colin F (1 November 1997). "व्यवहार गेम थ्योरी में प्रगति". Journal of Economic Perspectives. 11 (4): 167–188. doi:10.1257/jep.11.4.167. JSTOR 2138470.
- ↑ Rust J. (2008) Dynamic Programming. In: Palgrave Macmillan (eds) The New Palgrave Dictionary of Economics. Palgrave Macmillan, London
- ↑ Aumann, Robert J. (January 1995). "बैकवर्ड इंडक्शन और तर्कसंगतता का सामान्य ज्ञान". Games and Economic Behavior. 8 (1): 6–19. doi:10.1016/S0899-8256(05)80015-6.
- ↑ Marco Mantovani, 2015. "Limited backward induction: foresight and behavior in sequential games," Working Papers 289, University of Milano-Bicocca, Department of Economics
- ↑ Ke, Shaowei (2019). "बाउंडली रेशनल बैकवर्ड इंडक्शन". Theoretical Economics. 14 (1): 103–134. doi:10.3982/TE2402. S2CID 9053484.
- ↑ Qu, Xia; Doshi, Prashant (1 March 2017). "अनुक्रमिक सौदेबाजी के खेल में निष्पक्षता और सीमित पिछड़े प्रवेश की भूमिका पर". Annals of Mathematics and Artificial Intelligence. 79 (1): 205–227. doi:10.1007/s10472-015-9481-7. S2CID 23565130.
- ↑ Cox, Caleb A.; Stoddard, Brock (May 2018). "सार्वजनिक वस्तुओं के खेल में टीमों के साथ रणनीतिक सोच". Journal of Public Economics. 161: 31–43. doi:10.1016/j.jpubeco.2018.03.007.
- ↑ Klein Teeselink, Bouke; van Dolder, Dennie; van den Assem, Martijn; Dana, Jason (2022). "High-Stakes Failures of Backward Induction: Evidence from "The Price Is Right"".
{{cite journal}}
: Cite journal requires|journal=
(help)
[Category:Inductive reasoni