पश्चवर्ती प्रवर्तन: Difference between revisions

Latest revision as of 09:00, 15 June 2023

पश्चवर्ती प्रवर्तन किसी समस्या या स्थिति के अंत से इष्टतम क्रियाओं के क्रम को निर्धारित करने के लिए पश्चवर्ती प्रवर्तन की ओर तर्क करने की प्रक्रिया है यह प्रवर्तन अंतिम बिंदु की जांच करके आगे बढ़ता है जिस पर निर्णय लिया जाता है और फिर यह पहचाना जाता है कि उस समय कौन सी कार्रवाई सबसे सही होगी इस जानकारी का उपयोग करके यह निर्धारित किया जा सकता है कि निर्णय के दूसरे या अंतिम समय में क्या करना है यह प्रक्रिया तब तक जारी रहती है जब तक कि हर समय हर संभव स्थिति यानी हर संभव सूचना समूह खेल की परिभाषा की सबसे अच्छी कार्रवाई निर्धारित नहीं कर लेती है पश्चवर्ती प्रवर्तन का उपयोग 1875 में आर्थर केली द्वारा किया गया था जिन्होंने विख्यात सचिव समस्या को हल करने की कोशिश करते हुए इस विधि को उजागर किया गया था ^[1]गतिशील कार्यक्रम के गणितीय अनुकूलन गणित पद्धति में बेलमैन समीकरण को हल करने के लिए पश्चवर्ती प्रवर्तन के मुख्य तरीकों में से एक है ^[2]^[3] खेल सिद्धांत में पश्चवर्ती प्रवर्तन की अनुक्रमिक खेल में उप खेल पूर्णता की गणना करने के लिए उपयोग की जाने वाली एक विधि है इसमें ^[4] अंतर केवल इतना है कि अनुकूलन में एक निर्णय सिद्धांत सम्मिलित होता है जो प्रत्येक समय पर क्या करना है यह चुनता है जबकि खेल सिद्धांत विश्लेषण कई खिलाड़ियों के निर्णय कैसे क्रिया करते हैं अर्थात् यह अनुमान लगाकर कि प्रत्येक स्थिति में अंतिम खिलाड़ी क्या करेगा यह निर्धारित करना संभव है कि दूसरा खिलाड़ी क्या करेगा इत्यादि स्वचालित योजना और शेड्यूलिंग और स्वचालित प्रमेय को प्रमाण देने के क्षेत्र में इस विधि को पश्चवर्ती प्रवर्तन खोज या पश्चवर्ती प्रवर्तन श्रृंखलन कहा जाता है शतरंज में इसे प्रतिगामी विश्लेषण भी कहा जाता है

जब तक खेल परिभाषा का क्षेत्र एकत्र है तब तक खेलों को हल करने के लिए पश्चवर्ती प्रवर्तन का उपयोग किया जाता है जॉन वॉन न्यूमैन और ऑस्कर मॉर्गनस्टर्न ने अपनी 'थ्योरी ऑफ गेम्स एंड इकोनॉमिक बिहेवियर' 1944 में पश्चवर्ती प्रवर्तन द्वारा शून्य राशि में दो व्यक्ति ने खेल को हल करने का सुझाव दिया जिसने खेल को अध्ययन के क्षेत्र के रूप में स्थापित किया।^[5]^[6]

निर्णय लेने में पश्चवर्ती प्रवर्तन एक इष्टतम रोक की समस्या

एक बेरोजगार व्यक्ति पर विचार करें जो दस वर्षों तक काम करने में सक्षम होगा t = 1,2,...,10 मान लीजिए कि प्रत्येक वर्ष जिसमें वे बेरोजगार रहते हैं उन्हें एक अच्छी नौकरी की पेशकश की जा सकती है जो 100 डॉलर का भुगतान करती है जबकि एक खराब नौकरी जो 44 डॉलर का भुगतान करती है समान संभावना 50/50 के साथ एक बार जब वे नौकरी स्वीकार कर लेते हैं तो वे दस वर्षों तक उस नौकरी में बने रहते हैं सरलता के लिए मान लें कि वे केवल अपनी मौद्रिक कमाई के बारे में परवाह करते हैं और वे अलग-अलग समय पर कमाई को समान रूप से महत्व देते हैं यानी समय वरीयता एक है।

क्या इस व्यक्ति को खराब नौकरी स्वीकार करनी चाहिए इस प्रश्न का उत्तर देने के लिए हम समय t = 10 से पीछे की ओर तर्क कर सकते हैं।

समय 10 पर एक अच्छी नौकरी स्वीकार करने का मूल्य 100 डॉलर है तथा खराब नौकरी को स्वीकार करने का मूल्य 44 डॉलर है इसमें उपलब्ध नौकरी को अस्वीकार करने का मूल्य शून्य है इसलिए यदि वे अंतिम अवधि में अभी भी बेरोजगार हैं तो उन्हें उस समय जो भी नौकरी पेश की जाती है उसे स्वीकार कर लेना चाहिए।
समय 9 पर एक अच्छी नौकरी स्वीकार करने का मूल्य 200 डॉलर है क्योंकि वह नौकरी दो साल तक चलेगी खराब नौकरी को स्वीकार करने का मूल्य 2*44 डॉलर= 88 डॉलर है नौकरी की पेशकश को स्वीकार करने का मूल्य अब 0 डॉलर है साथ ही अगले नौकरी की पेशकश की प्रतीक्षा करने का मूल्य जो 0.5 के औसत के अपेक्षित मूल्य के लिए या तो 50 प्रतिशत संभावना के साथ 44 डॉलर या 50 प्रतिशत के साथ 100 डॉलर होगा 100 डॉलर+44 डॉलर = 72 डॉलर इसलिए इस बात की परवाह किए बिना कि नौकरी अच्छी है या बुरी उस प्रस्ताव को स्वीकार करना बेहतर है।
समय 8 पर एक अच्छी नौकरी स्वीकार करने का मूल्य 300 डॉलर है यह तीन साल तक चलेगा खराब नौकरी को स्वीकार करने का मूल्य 3*44 डॉलर = 132 डॉलर है नौकरी की पेशकश को अस्वीकार करने का मूल्य अब 0 डॉलर है साथ ही नौकरी की पेशकश की प्रतीक्षा करने का मूल्य निम्न है चूंकि हम पहले ही निष्कर्ष निकाल चुके हैं कि प्रस्तावों को स्वीकार किया जाना चाहिए नौकरी की पेशकश की प्रतीक्षा करने का अपेक्षित मूल्य 0.5*200+88 डॉलर =144 डॉलर है इसलिए खराब नौकरी स्वीकार करने की तुलना में अगले प्रस्ताव की प्रतीक्षा करना अधिक मूल्यवान है।

पश्चवर्ती प्रवर्तन यह सत्यापित करता है कि खराब प्रस्तावों को केवल तभी स्वीकार किया जाना चाहिए जब कोई 9 या 10 बार बेरोजगार हो उन्हें हर समय t = 8 तक समाप्त कर दिया जाना चाहिए अंतर्ज्ञान यह है कि यदि कोई लंबे समय तक नौकरी में काम करने की आशा करता है तो इससे यह अधिक मूल्यवान हो जाता है कि हमें किस नौकरी को स्वीकार करना है।

इस तरह की एक गतिशील अनुकूलन समस्या को इष्टतम रोक समस्या कहा जाता है क्योंकि बेहतर प्रस्ताव की प्रतीक्षा कब बंद करनी है खोज सिद्धांत सूक्ष्म अर्थशास्त्र का क्षेत्र है जो इस प्रकार की समस्याओं को खरीदारी नौकरी की खोज और विवाह जैसे संदर्भों में लागू करता है।

खेल परिभाषा में पश्चवर्ती प्रवर्तन

खेल परिभाषा में पश्चवर्ती प्रवर्तन एक समाधान अवधारणा है यह तर्कसंगत अवधारणा का परिशोधन है जो एक खेल को व्यापक रूप में प्रतिनिधित्व व्यक्तिगत सूचना समूह के प्रति संवेदनशील है ^[7] पश्चवर्ती प्रवर्तन का विचार किसी दिए गए खेल में प्रत्येक जानकारी के लिए एक इष्टतम क्रिया की पहचान करके अनुक्रमिक तर्कसंगतता का उपयोग करता है।

जोएल वाटसन द्वारा रणनीति खेल परिभाषा के एक परिचय में पश्चवर्ती प्रवर्तन प्रक्रिया को इस प्रकार परिभाषित किया गया है कि यह अंत से शुरुआत तक खेल का विश्लेषण करने की प्रक्रिया पर निर्भर है प्रत्येक निर्णय नोड किसी भी कार्रवाई पर विचार किया जाता है टर्मिनल नोड्स को देखते हुए जो उत्तराधिकारी नोड्स पर पहचाने गए कार्यों के खेल के माध्यम से पहुंचाया जा सकता है ^[8] पश्चवर्ती प्रवर्तन प्रक्रिया का एक दोष यह है कि इसे केवल खेलों की सीमित कक्षाओं में ही लागू किया जा सकता है उपयोगिता के बंधनों के बिना सही जानकारी के किसी भी खेल के लिए प्रक्रिया अच्छी तरह से परिभाषित है यह संबंधों के साथ सही जानकारी वाले खेलों के लिए भी अच्छी तरह से परिभाषित और सार्थक है जबकि यह एक से अधिक रणनीति परिचय की ओर ले जाता है इस प्रक्रिया को गैर-तुच्छ सूचना समूह वाले कुछ खेलों पर लागू किया जा सकता है लेकिन यह सामान्य रूप से अविश्वसनीय है सही जानकारी वाले खेलों को हल करने के लिए प्रक्रिया सबसे उपयुक्त है इसलिए यदि सभी खिलाड़ी अन्य खिलाड़ियों के कार्यों और प्रत्येक निर्णय नोड के प्रति सचेत नहीं है तो पश्चवर्ती प्रवर्तन इतनी आसानी से लागू नहीं होता है वाटसन ने ^[9] पश्चवर्ती प्रवर्तन की प्रक्रिया को एक साधारण उदाहरण के साथ प्रदर्शित किया जा सकता है।

खेल परिभाषा में पश्चवर्ती प्रवर्तन

प्रस्तावित खेल एक बहु चरण खेल है जिसमें 2 खिलाड़ी सम्मिलित हैं खिलाड़ी फिल्म देखने की योजना रहे हैं वर्तमान में 2 फिल्में हैं जोकर और टर्मिनेटर जो बहुत लोकप्रिय हैं खिलाड़ी 1 टर्मिनेटर देखना चाहता है और खिलाड़ी 2 जोकर देखना चाहता है इसलिए खिलाड़ी 1 पहले टिकट खरीदेगा और खिलाड़ी 2 को अपनी पसंद के बारे में बताएगा फिर खिलाड़ी 2 उसका टिकट खरीदेगा एक बार जब वे दोनों विकल्पों का निरीक्षण कर लेते हैं तो वे फिल्म जाने या घर पर रहने के बारे में चुनाव करेंगे पहले चरण की तरह ही खिलाड़ी 1 पहले चुनता है 2 खिलाड़ी 1 की पसंद को देखने के बाद अपनी पसंद बनाता है।

इस उदाहरण के लिए हम मानते हैं कि अदायगी विभिन्न चरणों में जोड़ी जाती है जो एक संपूर्ण सूचना खेल है।

सामान्य रूप का खेल

*Stage 1*
Player 2 Player 1	Joker	Terminator
Joker	3, 5	0, 0
Terminator	1, 1	5, 3

*Stage 2*
Player 2 Player 1	Go to Movie	Stay Home
Go to Movie	6, 6	4, -2
Stay Home	-2, 4	-2, -2

व्यापक रूप का खेल

इस बहु चरण खेल को हल करने के चरण व्यापक रूप से दाईं ओर देखे गए हैं

पश्चवर्ती प्रवर्तन खेल को अंतिम नोड्स से हल करना शुरू करता है।
खिलाड़ी 2 गो टू मूवी या स्टे होम चुनने के लिए अंतिम नोड्स से 8 उप खेल का अवलोकन करेगा।
1. दूसरे खिलाड़ी से कुल 4 तुलनाएं होंगी वह उच्च भुगतान के साथ एक विकल्प का चयन करेगा।
2. उदाहरण के लिए पहले उप खेल पर विचार करते हुए 11 का भुगतान 7 से अधिक है इसलिए खिलाड़ी 2 मूवी चुनता है।
3. विधि प्रत्येक उपखेल के लिए जारी रहती है।
एक बार जब खिलाड़ी 2 अपनी पसंद पूरी कर लेता है तो खिलाड़ी 1 चयनित उप खेलों के आधार पर अपनी पसंद बनाएगा।
1. प्रक्रिया चरण 2 के समान है खिलाड़ी 1 अपनी पसंद बनाने के लिए अपने भुगतान की तुलना करती है।
2. पिछले चरण से खिलाड़ी 2 द्वारा न चुने गए उपखेल पर अब दोनों खिलाड़ियों द्वारा विचार नहीं किया जाता है क्योंकि वे इष्टतम नहीं हैं।
3. उदाहरण के लिए गो टू मूवी का विकल्प 9,11 का भुगतान प्रदान करता है और स्टे होम का विकल्प 1, 9 का भुगतान प्रदान करता है खिलाड़ी 1 मूवी का चयन करेगा।
प्रक्रिया प्रत्येक खिलाड़ी के लिए तब तक दोहराती है जब तक कि प्रक्रिया प्रारंभिक नोड तक नहीं पहुंच जाता।
1. उदाहरण के लिए खिलाड़ी 2 जोकर को चुनेगा क्योंकि 11 (9, 11) का भुगतान 6 (6, 6) के भुगतान वाले समापक से अधिक है।
2. उदाहरण के लिए खिलाड़ी 1 प्रारंभिक नोड पर समापक का चयन करेगा क्योंकि यह 11 का उच्च भुगतान प्रदान करता है समापक (11, 9)> जोकर (9, 11) चयन करता है।
उप खेल में सही संतुलन की पहचान करने के लिए हमें एक मार्ग की पहचान करने की आवश्यकता है जो प्रत्येक सूचना समूह पर इष्टतम उप खेल का चयन करता है।
1. इस उदाहरण में खिलाड़ी 1 टर्मिनेटर चुनता है और खिलाड़ी 2 भी टर्मिनेटर चुनता है फिर वे दोनों गो टू मूवी चुनते हैं।
2. उप खेल सही संतुलन (11,9) के भुगतान की ओर ले जाता है।

खेल परिभाषा में पश्चवर्ती प्रवर्तन का अंतिम खेल

पश्चवर्ती प्रवर्तन एक खेल को अंत से शुरुआत तक विश्लेषण करने की प्रक्रिया है अन्य नैश संतुलन के समाधान के साथ खिलाड़ियों की तर्कसंगतता और पूर्ण ज्ञान ग्रहण किया जाता है पश्चवर्ती प्रवर्तन की अवधारणा इस धारणा से मेल खाती है कि यह सामान्य ज्ञान है और प्रत्येक खिलाड़ी प्रत्येक निर्णय नोड के साथ तर्कसंगत रूप से कार्य करेगा जब वह एक विकल्प चुनता है तो भले ही उसकी तर्कसंगतता का अर्थ यह हो कि यह ऐसा नोड नहीं है तर्कसंगतता की पारस्परिक धारणा के तहत पश्चवर्ती प्रवर्तन प्रत्येक खिलाड़ी को यह अनुमान लगाने की अनुमति देता है कि खेल के प्रत्येक चरण में उनका प्रतिद्वंद्वी क्या करेगा।

एक उप खेल के लिए पश्चवर्ती प्रवर्तन के साथ सही संतुलन को हल करने के लिए खेल को व्यापक खेल के रूप में लिखा जाना चाहिए और फिर उप खेलों में विभाजित किया जाना चाहिए शुरुआती नोड या शुरुआती बिंदु उपखेल से शुरू होकर इस उपखेल के लिए सूचीबद्ध अपेक्षित से तौला जाता है और तर्कसंगत खिलाड़ी अपने लिए उच्च विकल्प का चयन करेगा उच्चतम भुगतान चिह्नित किया गया है शुरुआती बिंदु पर पहुंचने तक उपखेल से लगातार पश्चवर्ती प्रवर्तन का काम करके उपखेल सही संतुलन के लिए हल करें जैसे-जैसे यह प्रक्रिया आगे बढ़ती है तो प्रारंभिक खेल छोटा होता जाएगा सदिशों का चिन्हित पथ उपखेल पूर्ण संतुलन है ^[10] पश्चवर्ती प्रवर्तन अंतिम खेल पर लागू होता है।

दो खिलाड़ियों के बीच एक खेल के बारे में सोचें जहां खिलाड़ी 1 खिलाड़ी 2 के साथ एक डॉलर बांटने का प्रस्ताव रखता है यह एक प्रसिद्ध असममित खेल है जिसे क्रमिक रूप से खेला जाता है जिसे अंतिम खेल कहा जाता है खिलाड़ी एक डॉलर को विभाजित करके पहले कार्य करता है जबकि वे फिट दिखते हैं अब यह दो खिलाड़ी एक द्वारा निपटाए गए हिस्से को स्वीकार कर सकते हैं या विभाजन को अस्वीकार कर सकते हैं यदि खिलाड़ी 2 विभाजन को स्वीकार करता है तो खिलाड़ी 1 और खिलाड़ी 2 दोनों को उस विभाजन के अनुसार अदायगी मिलती है यदि खिलाड़ी दो खिलाड़ी 1 के प्रस्ताव को अस्वीकार करने का निर्णय लेता है तो दोनों खिलाड़ियों को कुछ नहीं मिलता है दूसरे शब्दों में खिलाड़ी 2 के पास खिलाड़ी 1 के प्रस्तावित आवंटन शक्ति हैं लेकिन रोक लागू करने से दोनों खिलाड़ियों के लिए इनाम समाप्त हो जाता है ^[11] इसलिए इस खेल के लिए रणनीति परिचय को 0 और 1 के बीच सभी x के लिए जोड़े x, fx के रूप में लिखा जा सकता है जहां fx एक द्वि-मूल्यवान कार्यक्रम है जो यह व्यक्त करता है कि x स्वीकार किया गया है या नहीं।

खिलाड़ी 1 द्वारा किसी भी मनमाने प्रस्ताव को देखते हुए खिलाड़ी 2 की पसंद और प्रतिक्रिया पर विचार करें यह मानते हुए कि प्रस्ताव $0 से बड़ा है पीछे की ओर प्रेरण का उपयोग करते हुए निश्चित रूप से हम उम्मीद करेंगे कि खिलाड़ी 2 डॉलर 0 से अधिक या उसके बराबर किसी भी अदायगी को स्वीकार करेगा तदनुसार खिलाड़ी 1 को विभाजन के सबसे बड़े हिस्से को हासिल करने के लिए जितना संभव हो उतना कम खिलाड़ी देने का प्रस्ताव देना चाहिए लेकिन खिलाड़ी 1 खिलाड़ी 2 को पैसे की सबसे छोटी इकाई देना और संतुलन इसके लिए रखना अद्वितीय है जो उप खेल का सही संतुलन है।

अंतिम चरण में खेल अनंत खेलों पर विचार करते समय पश्चवर्ती प्रवर्तन की उपयोगिता का एक उदाहरण है जबकि खेल के सैद्धांतिक रूप से अनुमानित परिणामों की आलोचना की जाती है प्रायोगिक साक्ष्यों से पता चला है कि प्रस्तावक ही कभी 0 डॉलर की पेशकश करता है और खिलाड़ी 2 कभी-कभी निष्पक्षता के आधार पर 0 डॉलर से अधिक के प्रस्तावों को भी अस्वीकार करता है खिलाड़ी 2 द्वारा किसे उचित माना जाता है यह संदर्भ के अनुसार भिन्न होता है और अन्य खिलाड़ियों के दबाव या उपस्थिति का मतलब यह हो सकता है कि खेल परिभाषा प्रारूप आवश्यक रूप से भविष्यवाणी नहीं कर सकता है कि वास्तविक लोग क्या चुनेंगे।

व्यवहार में उप खेल सही संतुलन हमेशा प्राप्त नहीं होता है कैमरर के अनुसार एक अमेरिकी व्यवहारवादी अर्थशास्त्री खिलाड़ी 2 लगभग आधे समय में एक्स के 20 प्रतिशत से कम के प्रस्तावों को करता है भले ही वे कुछ भी नहीं समाप्त करते हैं ^[12] जबकि पश्चवर्ती प्रवर्तन यह भविष्यवाणी करेगा कि उत्तरदाता शून्य के बराबर या उससे अधिक किसी भी प्रस्ताव को स्वीकार करता है उत्तरदाता वास्तव में तर्कसंगत खिलाड़ी नहीं हैं और इसलिए संभावित मौद्रिक लाभ के अलावा निष्पक्षता की पेशकश के बारे में अधिक ध्यान रखते हैं।

कनखजूरा खेल

अर्थशास्त्र में पिछड़ा प्रवेश प्रवेश-निर्णय समस्या

एक गतिशील खेल पर विचार करें जिसमें खिलाड़ी एक उद्योग में एक एकत्र फर्म हैं और उस उद्योग के संभावित प्रवेशकर्ता हैं जैसा कि यह खड़ा है अवलंबी का उद्योग पर एकाधिकार है और वह प्रवेशकर्ता को अपना कुछ बाजार हिस्सा खोना नहीं चाहता है यदि प्रवेशकर्ता प्रवेश नहीं चुनता है तो अवलंबी को अदायगी अधिक होती है यह अपना एकाधिकार बनाए रखता है और प्रवेशकर्ता न तो हारता है और न ही लाभ प्राप्त करता है इसका भुगतान शून्य है यदि प्रवेशकर्ता प्रवेश करता है तो अवलंबी प्रवेशकर्ता से लड़ सकता है या समायोजित कर सकता है यह अपनी कीमत कम करके प्रवेश करने वाले को व्यवसाय से बाहर और बाहर निकलने की लागत एक नकारात्मक अदायगी चलाकर और अपने स्वयं के मुनाफे को नुकसान पहुँचाकर लड़ेगा यदि यह प्रवेशकर्ता को समायोजित करता है तो इसकी बिक्री में कुछ कमी आएगी लेकिन एक उच्च कीमत बनी रहेगी और इसकी कीमत कम करने की तुलना में इसे अधिक लाभ प्राप्त होगा लेकिन एकाधिकार लाभ से कम है।

इस बात पर विचार करें कि यदि प्रवेशकर्ता प्रवेश करता है तो अवलंबी की सबसे अच्छी प्रतिक्रिया समायोजित करना है या नहीं यदि अवलंबी समायोजित करता है तो प्रवेशकर्ता की सबसे अच्छी प्रतिक्रिया प्रवेश करना और लाभ प्राप्त करना है इसलिए रणनीति परिचय जिसमें प्रवेशकर्ता प्रवेश करता है और यदि प्रवेशकर्ता प्रवेश करता है तो अवलंबी समायोजित करता है पिछड़े प्रेरण के साथ संगत संतुलन है जबकि यदि अवलंबी लड़ने जा रहा है तो प्रवेशकर्ता की सबसे अच्छी प्रतिक्रिया प्रवेश नहीं करना है और यदि प्रवेशी प्रवेश नहीं करता है तो इससे कोई फर्क नहीं पड़ता कि प्रवेशकर्ता प्रवेश करने वाले काल्पनिक जगहों में क्या करना चाहता है इसलिए रणनीति परिचय जिसमें प्रवेश करने वाला प्रवेश करता है लेकिन प्रवेशकर्ता प्रवेश नहीं करता है तो वह संतुलन भी है जबकि प्रवेश करने वाले को विचलित करने और प्रवेश करने के लिए अवलंबी की सबसे अच्छी प्रतिक्रिया समायोजित करना है लड़ाई का खतरा विश्वसनीय नहीं है इस दूसरे संतुलन को पश्चगामी प्रवर्तन द्वारा समाप्त किया जा सकता है।

प्रत्येक निर्णय लेने की प्रक्रिया उप खेल में नैश संतुलन ढूँढना पूर्ण संतुलन के रूप में बनता है इस प्रकार ये रणनीति परिचय जो सही संतुलन दर्शाती हैं अविश्वसनीय खतरों जैसी कार्रवाइयों की संभावना को बाहर करती हैं जो एक प्रवेशी को डराने के लिए उपयोग की जाती हैं यदि अवलंबी एक प्रवेशी के साथ मूल्य युद्ध शुरू करने की धमकी देता है तो वे अपनी कीमतों को एक एकाधिकार मूल्य से प्रवेशकर्ता की तुलना में थोड़ा कम करने की धमकी दे रहे हैं जो कि अव्यावहारिक और अविश्वसनीय होगा यदि प्रवेशकर्ता जानता था कि मूल्य युद्ध वास्तव में नहीं होगा क्योंकि इससे दोनों पक्षों को नुकसान होगा एकल अनुकूलन के विपरीत जिसमें संतुलन सम्मिलित है जो संभव या इष्टतम नहीं है एक उप खेल सही संतुलन दूसरे खिलाड़ी के कार्यों के लिए मेल खाता है तथा यह सुनिश्चित करता है कि कोई भी खिलाड़ी उप खेल में गलती से नहीं पहुंचता है इस जगह में पश्चवर्ती प्रवर्तन यह सुनिश्चित करता है कि प्रवेशकर्ता यह जानकर रणनीति परिचय में सबसे अच्छी प्रतिक्रिया नहीं बनाता तथा अवलंबी की धमकी के प्रति आश्वस्त नहीं होता है।^[13]

पिछड़ा प्रवर्तन विरोधाभास अप्रत्याशित फांसी

अप्रत्याशित फांसी विरोधाभास पश्चवर्ती प्रवर्तन से संबंधित विरोधाभास है मान लीजिए किसी कैदी को बताया जाता है कि उसे अगले सप्ताह के सोमवार और शुक्रवार के बीच किसी समय फांसी दी जाएगी जबकि सटीक दिन एक आश्चर्य होगा कि वह रात से पहले नहीं जान पाएगी कि उसे अगले दिन मार दिया दी जायेगी अपने जल्लाद को चतुराई से मात देने में रुचि रखती है यह निर्धारित करने का प्रयास करती है कि निष्पादन किस दिन होगा।

वह तर्क देती है कि यह शुक्रवार को नहीं हो सकता है क्योंकि अगर यह गुरुवार के अंत तक नहीं हुआ होता तो उसे पता होता कि निष्पादन शुक्रवार को होगा इसलिए वह शुक्रवार को एक संभावना के रूप में समाप्त कर सकती है शुक्रवार को समाप्त होने के साथ वह फैसला करती है कि यह गुरुवार को नहीं हो सकता क्योंकि अगर यह बुधवार को नहीं हुआ होता तो उसे पता होता कि यह गुरुवार को होना चाहिए इसलिए वो गुरुवार को निष्कासन कर सकती हैं यह तर्क तब तक आगे बढ़ता है जब तक कि उसने सभी संभावनाओं को समाप्त नहीं कर दिया उसने निष्कर्ष निकाला कि उसे अगले सप्ताह फांसी नहीं दी जाएगी।

उसके आश्चर्य करने के लिए उसे बुधवार को फांसी दी गई उसने यह मानने की गलती की कि वह निश्चित रूप से जानती है कि भविष्य का कारक जो उसके निष्पादन का कारण वह था जिसके बारे में वह तर्क कर सकती थी।

यहां कैदी पिछड़ा प्रेरण द्वारा तर्क करता है लेकिन ऐसा लगता है कि वह गलत निष्कर्ष पर पहुंचा है ध्यान दें जबकि समस्या का वर्णन यह मानता है कि किसी ऐसे व्यक्ति को आश्चर्यचकित करना संभव है जो पश्चवर्ती प्रवर्तन कर रहा है गणितीय सिद्धांत यह धारणा नहीं बनाता है कि विरोधाभास इस सिद्धांत के परिणामों पर सवाल नहीं उठाता है इस विरोधाभास को दार्शनिकों द्वारा कुछ पर्याप्त चर्चा मिली है।

पिछड़ा प्रेरण और तर्कसंगतता का सामान्य ज्ञान

पश्चवर्ती प्रवर्तन तभी काम करता है जब दोनों खिलाड़ी तर्कसंगत हों यानी हमेशा एक ऐसी क्रिया का चयन करें जो उनके भुगतान को अधिकतम करे जबकि तर्कसंगतता पर्याप्त नहीं है प्रत्येक खिलाड़ी को यह भी मानना चाहिए कि अन्य सभी खिलाड़ी तर्कसंगत हैं यह भी पर्याप्त नहीं है प्रत्येक खिलाड़ी को यह विश्वास होना चाहिए कि अन्य सभी खिलाड़ी जानते हैं कि खिलाड़ी तर्कसंगत हैं और इसी तरह अनंत तक दूसरे शब्दों में तार्किकता सामान्य ज्ञान तर्क होनी चाहिए।^[14]

सीमित पिछड़ा प्रेरण

सीमित प्रेरण पूरी तरह से तर्कसंगत पश्चवर्ती प्रवर्तन से विचलन है इसमें पूर्ण दूरदर्शिता के बिना प्रवर्तन की नियमित प्रक्रिया को लागू करना सम्मिलित है सैद्धांतिक रूप से यह तब होता है जब एक या अधिक खिलाड़ियों की दूरदर्शिता सीमित होती है और वे सभी सहायक नोड्स के माध्यम से पश्चवर्ती प्रवर्तन नहीं कर सकते हैं ^[15] सीमित प्रेरण लंबे खेलों में बहुत बड़ी भूमिका निभाता है क्योंकि सीमित प्रेरण के प्रभाव बाद के खेलों में अधिक शक्तिशाली होते हैं प्रयोगों से पता चला है कि क्रमिक सौदेबाजी के खेल में जैसे कि चालीस पद खेल सैद्धांतिक भविष्यवाणियों से विचलित होते हैं और कुछ जगह सीमित पिछड़े प्रेरण में संलग्न होते हैं यह विचलन सीमित तर्कसंगतता के परिणामस्वरूप होते हैं जहां खिलाड़ी केवल कुछ ही चरणों को पूरी तरह से आगे देख सकते हैं ^[16] यह निर्णयों में अप्रत्याशितता और उप खेल पूर्ण रूप नैश संतुलन को खोजने और प्राप्त करने में अक्षमता की अनुमति देता है।

इस घटना के लिए तीन व्यापक परिकल्पनाएँ हैं-

सामाजिक कारकों की उपस्थिति गैर-सामाजिक कारकों की उपस्थिति जैसे सीमित पिछड़े प्रेरण।
सांस्कृतिक अंतर। पश्चवर्ती प्रवर्तन

का उल्लंघन मुख्य रूप से सामाजिक कारकों की उपस्थिति के लिए जिम्मेदार है जबकि अनुक्रमिक सौदेबाजी के खेल संज्ञानात्मक पदानुक्रम सिद्धांत का उपयोग करते हुए डेटा-संचालित प्रारूप भविष्यवाणियों ने इस बात पर प्रकाश डाला है कि कुछ खेलों में सीमित पिछड़े प्रेरण की उपस्थिति एक प्रमुख भूमिका निभा सकती है ^[17]बार-बार होने वाले पब्लिक अच्छे खेल में समूह का व्यवहार श्चवर्तीभप्रवर्तन ावित होता है जहां यह स्पष्ट है कि टीम के सदस्यों का प्रारंभिक योगदान अंत में योगदान से अधिक है सीमित पीछे कीप्रभावित करता है कि किसी समूह की जनता अच्छे खेल में नियमित रूप से मुक्त सवारी कैसे होती है प्रारंभिक रूप से जब सीमित पिछड़े प्रेरण के प्रभाव कम होते हैं तो मुक्त सवारी कम होती है जबकि अंत की ओर जब प्रभाव अधिक होते हैं तो मुक्त सवारी अधिक होती है ^[18]दौड खेल के एक प्रकार के भीतर सीमित पीछे की ओर प्रेरण का भी परपश्चवर्ती प्रवर्तन ं खिलाड़ी क्रमिक रूप से एक सीमा के भीतर पूर्णांकों का चयन करेंगे और लक्ष्य संख्या तक पहुंचने तक अपनी पसंद का योग करेंगे लक्ष्य को भेदने से उस खिलाड़ी को पुरस्कार मिलता है जबकि दूसरा हार जाता है खेलों की एक श्रृंखला के बीच में एक छोटा पुरस्कार पेश किया गया था अधिकांश खिलाड़ियों ने तब सीमित पिछड़े प्रेरण का प्रदर्शन किया क्योंकि उन्होंने मूल पुरस्कार के बजाय छोटे पुरस्कार के लिए हल कियजगह में खिलाड़ियों के केवल एक छोटगया े से अंश ने दोनों पुरस्कारों पर विचार किया कि पीछे की ओर प्रेरण के अधिकांश परीक्िणपश्चवर्ती प्रवर्तन िभागियों को कार्य को अच्छी तरह से करने के लिए प्रोत्साहित नहीं किेा जाता है जबकि पिछड़े पलंघन भी उच्च-दांव वाले वातावरण में सामान्य प्रतीत होते हैं उदाहरण के लिए अमेरिकी टेलीविजन का एक बड़े पैमाने पर विश्लेषण सीमित दूरदर्शिता का प्रमण प्रदान करता है तथा हर प्रतियोगी खेलते हैं जो सही जानकारी का एक क्रमिक खेल है जिसके लिए पीछे के प्रेरण के माध्यम से इष्टतम रणनीति पाई जा सकती पश्चवर्तीहप्रवर्तन के े लगातार और व्यवस्थित विचलन सुझाव देते हैं कि प्रतियोगियों का एक बड़ा अनुपात ठीक से पिछड़े प्रवेश में विफल रहता है और यह खेल के अगले चरण पर विचार करता है।^[19]

↑ Rust, John (9 September 2016). गतिशील प्रोग्रामिंग. The New Palgrave Dictionary of Economics: Palgrave Macmillan. ISBN 978-1-349-95121-5.
↑ Jerome Adda and Russell Cooper, "Dynamic Economics: Quantitative Methods and Applications", Section 3.2.1, page 28. MIT Press, 2003.
↑ Mario Miranda and Paul Fackler, "Applied Computational Economics and Finance", Section 7.3.1, page 164. MIT Press, 2002.
↑ Drew Fudenberg and Jean Tirole, "Game Theory", Section 3.5, page 92. MIT Press, 1991.
↑ Mathematics of Chess, webpage by John MacQuarrie.
↑ John von Neumann and Oskar Morgenstern, "Theory of Games and Economic Behavior", Section 15.3.1. Princeton University Press. Third edition, 1953. (First edition, 1944.)
↑ Watson, Joel (2002). Strategy: an introduction to game theory (3 ed.). New York: W.W. Norton & Company. p. 63.
↑ Watson, Joel (2002). Strategy: an introduction to game theory (3 ed.). New York: W.W. Norton & Company. pp. 186–187.
↑ Watson, Joel (2002). Strategy: an introduction to game theory (3 ed.). New York: W.W. Norton & Company. p. 188.
↑ Rust, John (9 September 2016). गतिशील प्रोग्रामिंग. The New Palgrave Dictionary of Economics: Palgrave Macmillan. ISBN 978-1-349-95121-5.
↑ Kamiński, Marek M. (2017). "Backward Induction: Merits And Flaws". Studies in Logic, Grammar and Rhetoric. 50 (1): 9–24. doi:10.1515/slgr-2017-0016.
↑ Camerer, Colin F (1 November 1997). "व्यवहार गेम थ्योरी में प्रगति". Journal of Economic Perspectives. 11 (4): 167–188. doi:10.1257/jep.11.4.167. JSTOR 2138470.
↑ Rust J. (2008) Dynamic Programming. In: Palgrave Macmillan (eds) The New Palgrave Dictionary of Economics. Palgrave Macmillan, London
↑ Aumann, Robert J. (January 1995). "बैकवर्ड इंडक्शन और तर्कसंगतता का सामान्य ज्ञान". Games and Economic Behavior. 8 (1): 6–19. doi:10.1016/S0899-8256(05)80015-6.
↑ Marco Mantovani, 2015. "Limited backward induction: foresight and behavior in sequential games," Working Papers 289, University of Milano-Bicocca, Department of Economics
↑ Ke, Shaowei (2019). "बाउंडली रेशनल बैकवर्ड इंडक्शन". Theoretical Economics. 14 (1): 103–134. doi:10.3982/TE2402. S2CID 9053484.
↑ Qu, Xia; Doshi, Prashant (1 March 2017). "अनुक्रमिक सौदेबाजी के खेल में निष्पक्षता और सीमित पिछड़े प्रवेश की भूमिका पर". Annals of Mathematics and Artificial Intelligence. 79 (1): 205–227. doi:10.1007/s10472-015-9481-7. S2CID 23565130.
↑ Cox, Caleb A.; Stoddard, Brock (May 2018). "सार्वजनिक वस्तुओं के खेल में टीमों के साथ रणनीतिक सोच". Journal of Public Economics. 161: 31–43. doi:10.1016/j.jpubeco.2018.03.007.
↑ Klein Teeselink, Bouke; van Dolder, Dennie; van den Assem, Martijn; Dana, Jason (2022). "High-Stakes Failures of Backward Induction: Evidence from "The Price Is Right"". {{cite journal}}: Cite journal requires |journal= (help)

   [Category:Inductive reasoni

[1] Rust, John (9 September 2016). गतिशील प्रोग्रामिंग. The New Palgrave Dictionary of Economics: Palgrave Macmillan. ISBN 978-1-349-95121-5.

[2] Jerome Adda and Russell Cooper, "Dynamic Economics: Quantitative Methods and Applications", Section 3.2.1, page 28. MIT Press, 2003.

[3] Mario Miranda and Paul Fackler, "Applied Computational Economics and Finance", Section 7.3.1, page 164. MIT Press, 2002.

[4] Drew Fudenberg and Jean Tirole, "Game Theory", Section 3.5, page 92. MIT Press, 1991.

[:0-5] Mathematics of Chess, webpage by John MacQuarrie.

[6] John von Neumann and Oskar Morgenstern, "Theory of Games and Economic Behavior", Section 15.3.1. Princeton University Press. Third edition, 1953. (First edition, 1944.)

[7] Watson, Joel (2002). Strategy: an introduction to game theory (3 ed.). New York: W.W. Norton & Company. p. 63.

[8] Watson, Joel (2002). Strategy: an introduction to game theory (3 ed.). New York: W.W. Norton & Company. pp. 186–187.

[9] Watson, Joel (2002). Strategy: an introduction to game theory (3 ed.). New York: W.W. Norton & Company. p. 188.

[10] Rust, John (9 September 2016). गतिशील प्रोग्रामिंग. The New Palgrave Dictionary of Economics: Palgrave Macmillan. ISBN 978-1-349-95121-5.

[11] Kamiński, Marek M. (2017). "Backward Induction: Merits And Flaws". Studies in Logic, Grammar and Rhetoric. 50 (1): 9–24. doi:10.1515/slgr-2017-0016.

[12] Camerer, Colin F (1 November 1997). "व्यवहार गेम थ्योरी में प्रगति". Journal of Economic Perspectives. 11 (4): 167–188. doi:10.1257/jep.11.4.167. JSTOR 2138470.

[13] Rust J. (2008) Dynamic Programming. In: Palgrave Macmillan (eds) The New Palgrave Dictionary of Economics. Palgrave Macmillan, London

[14] Aumann, Robert J. (January 1995). "बैकवर्ड इंडक्शन और तर्कसंगतता का सामान्य ज्ञान". Games and Economic Behavior. 8 (1): 6–19. doi:10.1016/S0899-8256(05)80015-6.

[15] Marco Mantovani, 2015. "Limited backward induction: foresight and behavior in sequential games," Working Papers 289, University of Milano-Bicocca, Department of Economics

[16] Ke, Shaowei (2019). "बाउंडली रेशनल बैकवर्ड इंडक्शन". Theoretical Economics. 14 (1): 103–134. doi:10.3982/TE2402. S2CID 9053484.

[17] Qu, Xia; Doshi, Prashant (1 March 2017). "अनुक्रमिक सौदेबाजी के खेल में निष्पक्षता और सीमित पिछड़े प्रवेश की भूमिका पर". Annals of Mathematics and Artificial Intelligence. 79 (1): 205–227. doi:10.1007/s10472-015-9481-7. S2CID 23565130.

[18] Cox, Caleb A.; Stoddard, Brock (May 2018). "सार्वजनिक वस्तुओं के खेल में टीमों के साथ रणनीतिक सोच". Journal of Public Economics. 161: 31–43. doi:10.1016/j.jpubeco.2018.03.007.

[19] Klein Teeselink, Bouke; van Dolder, Dennie; van den Assem, Martijn; Dana, Jason (2022). "High-Stakes Failures of Backward Induction: Evidence from "The Price Is Right"". {{cite journal}}: Cite journal requires |journal= (help)

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

@@ Line 135: / Line 135: @@
 {{Game theory}}
-[[Category: गतिशील प्रोग्रामिंग]] [[Category: खेल सिद्धांत]] [[Category: आगमनात्मक कारण]] [[Category: आगमनात्मक कारण]] [Category:Inductive reasoni
+    [Category:Inductive reasoni
+[[Category:Articles with hatnote templates targeting a nonexistent page]]
-[[Category: Machine Translated Page]]
+[[Category:CS1 errors]]
+[[Category:Collapse templates]]
 [[Category:Created On 26/05/2023]]
-[[Category:Vigyan Ready]]
+[[Category:Lua-based templates]]
+[[Category:Machine Translated Page]]
+[[Category:Navigational boxes| ]]
+[[Category:Navigational boxes without horizontal lists]]
+[[Category:Pages with script errors]]
+[[Category:Sidebars with styles needing conversion]]
+[[Category:Template documentation pages|Documentation/doc]]
+[[Category:Templates Vigyan Ready]]
+[[Category:Templates generating microformats]]
+[[Category:Templates that add a tracking category]]
+[[Category:Templates that are not mobile friendly]]
+[[Category:Templates that generate short descriptions]]
+[[Category:Templates using TemplateData]]
+[[Category:Wikipedia metatemplates]]
+[[Category:आगमनात्मक कारण]]
+[[Category:खेल सिद्धांत]]
+[[Category:गतिशील प्रोग्रामिंग]]

v t e Topics in game theory
Definitions	Congestion game Cooperative game Determinacy Escalation of commitment Extensive-form game First-player and second-player win Game complexity Game description language Graphical game Hierarchy of beliefs Information set Normal-form game Preference Sequential game Simultaneous game Simultaneous action selection Solved game Succinct game
Equilibrium concepts	Bayesian Nash equilibrium Berge equilibrium Core Correlated equilibrium Epsilon-equilibrium Evolutionarily stable strategy Gibbs equilibrium Mertens-stable equilibrium Markov perfect equilibrium Nash equilibrium Pareto efficiency Perfect Bayesian equilibrium Proper equilibrium Quantal response equilibrium Quasi-perfect equilibrium Risk dominance Satisfaction equilibrium Self-confirming equilibrium Sequential equilibrium Shapley value Strong Nash equilibrium Subgame perfection Trembling hand
Strategies	Backward induction Bid shading Collusion Forward induction Grim trigger Markov strategy Dominant strategies Pure strategy Mixed strategy Strategy-stealing argument Tit for tat
Classes of games	Bargaining problem Cheap talk Global game Intransitive game Mean-field game Mechanism design n-player game Perfect information Large Poisson game Potential game Repeated game Screening game Signaling game Stackelberg competition Strictly determined game Stochastic game Symmetric game Zero-sum game
Games	Go Chess Infinite chess Checkers Tic-tac-toe Prisoner's dilemma Gift-exchange game Optional prisoner's dilemma Traveler's dilemma Coordination game Chicken Centipede game Lewis signaling game Volunteer's dilemma Dollar auction Battle of the sexes Stag hunt Matching pennies Ultimatum game Rock paper scissors Pirate game Dictator game Public goods game Blotto game War of attrition El Farol Bar problem Fair division Fair cake-cutting Cournot game Deadlock Diner's dilemma Guess 2/3 of the average Kuhn poker Nash bargaining game Induction puzzles Trust game Princess and monster game Rendezvous problem
Theorems	Arrow's impossibility theorem Aumann's agreement theorem Folk theorem Minimax theorem Nash's theorem Purification theorem Revelation principle Zermelo's theorem
Key figures	Albert W. Tucker Amos Tversky Antoine Augustin Cournot Ariel Rubinstein Claude Shannon Daniel Kahneman David K. Levine David M. Kreps Donald B. Gillies Drew Fudenberg Eric Maskin Harold W. Kuhn Herbert Simon Hervé Moulin John Conway Jean Tirole Jean-François Mertens Jennifer Tour Chayes John Harsanyi John Maynard Smith John Nash John von Neumann Kenneth Arrow Kenneth Binmore Leonid Hurwicz Lloyd Shapley Melvin Dresher Merrill M. Flood Olga Bondareva Oskar Morgenstern Paul Milgrom Peyton Young Reinhard Selten Robert Axelrod Robert Aumann Robert B. Wilson Roger Myerson Samuel Bowles Suzanne Scotchmer Thomas Schelling William Vickrey
Miscellaneous	All-pay auction Alpha–beta pruning Bertrand paradox Bounded rationality Combinatorial game theory Confrontation analysis Coopetition Evolutionary game theory First-move advantage in chess Game Description Language Game mechanics Glossary of game theory List of game theorists List of games in game theory No-win situation Solving chess Topological game Tragedy of the commons Tyranny of small decisions

Anonymous

Search

पश्चवर्ती प्रवर्तन: Difference between revisions

Namespaces

More

Page actions

Latest revision as of 09:00, 15 June 2023

Contents

निर्णय लेने में पश्चवर्ती प्रवर्तन एक इष्टतम रोक की समस्या

खेल परिभाषा में पश्चवर्ती प्रवर्तन

खेल परिभाषा में पश्चवर्ती प्रवर्तन

खेल परिभाषा में पश्चवर्ती प्रवर्तन का अंतिम खेल

अर्थशास्त्र में पिछड़ा प्रवेश प्रवेश-निर्णय समस्या

पिछड़ा प्रवर्तन विरोधाभास अप्रत्याशित फांसी

पिछड़ा प्रेरण और तर्कसंगतता का सामान्य ज्ञान

सीमित पिछड़ा प्रेरण

टिप्पणियाँ

Navigation

Navigation

Wiki tools

Wiki tools

Anonymous

Search

पश्चवर्ती प्रवर्तन: Difference between revisions

Latest revision as of 09:00, 15 June 2023

निर्णय लेने में पश्चवर्ती प्रवर्तन एक इष्टतम रोक की समस्या

खेल परिभाषा में पश्चवर्ती प्रवर्तन

खेल परिभाषा में पश्चवर्ती प्रवर्तन

खेल परिभाषा में पश्चवर्ती प्रवर्तन का अंतिम खेल

अर्थशास्त्र में पिछड़ा प्रवेश प्रवेश-निर्णय समस्या

पिछड़ा प्रवर्तन विरोधाभास अप्रत्याशित फांसी

पिछड़ा प्रेरण और तर्कसंगतता का सामान्य ज्ञान

सीमित पिछड़ा प्रेरण

टिप्पणियाँ

Navigation

Wiki tools

Page tools

Other projects

Categories