सचिव समस्या: Difference between revisions

From Vigyanwiki
Line 101: Line 101:


==1/सर्वश्रेष्ठ विकल्प का ई-कानून==
==1/सर्वश्रेष्ठ विकल्प का ई-कानून==
मॉडल का सार इस विचार पर आधारित है कि जीवन अनुक्रमिक है और वास्तविक दुनिया की समस्याएं वास्तविक समय में उत्पन्न होती हैं। इसके अलावा, ऐसे समय का अनुमान लगाना आसान होता है जिसमें विशिष्ट घटनाओं (आवेदकों के आगमन) को अधिक बार होना चाहिए (यदि वे करते हैं) तो होने वाली विशिष्ट घटनाओं की संख्या के वितरण का अनुमान लगाने के बजाय। इस विचार ने निम्नलिखित दृष्टिकोण को जन्म दिया, तथाकथित एकीकृत दृष्टिकोण (1984):
प्रारूप का सार इस विचार पर आधारित है कि जीवन अनुक्रमिक है और वास्तविक दुनिया की समस्याएं वास्तविक समय में उत्पन्न होती हैं इसके अलावा ऐसे समय का अनुमान लगाना आसान होता है जिसमें विशिष्ट घटनाओं आवेदकों के आगमन को अधिक बार होना चाहिए यदि वे ऐसा करते हैं तो होने वाली विशिष्ट घटनाओं की संख्या के वितरण का अनुमान लगाने के जगह इस विचार ने निम्नलिखित दृष्टिकोण को जन्म दिया तथाकथित एकीकृत दृष्टिकोण 1984 में लागू हुआ।


मॉडल को इस प्रकार परिभाषित किया गया है: एक आवेदक को कुछ समय अंतराल पर चुना जाना चाहिए <math>[0,T]</math> किसी अनजान नंबर से <math> N</math> रैंक करने योग्य आवेदकों की। लक्ष्य इस परिकल्पना के तहत केवल सर्वश्रेष्ठ का चयन करने की संभावना को अधिकतम करना है कि विभिन्न रैंकों के सभी आगमन ऑर्डर समान रूप से होने की संभावना है। मान लीजिए कि सभी आवेदकों का आगमन समय घनत्व समान है, लेकिन एक-दूसरे से स्वतंत्र है <math>f</math> पर <math>[0,T]</math> और जाने  <math>F</math> इसी आगमन समय वितरण फ़ंक्शन को निरूपित करें, अर्थात
प्रारूप को इस प्रकार परिभाषित किया गया है कि एक आवेदक को कुछ समय अंतराल पर चुना जाना चाहिए <math>[0,T]</math> किसी अनजान नंबर से <math> N</math> पद करने योग्य आवेदकों का लक्ष्य इस परिकल्पना के तहत केवल सर्वश्रेष्ठ का चयन करने की संभावना को अधिकतम करना है किसी विभिन्न पदों के सभी आगमन आदेशित समान रूप से होने की संभावना है मान लीजिए कि सभी आवेदकों का आगमन समय घनत्व समान है लेकिन एक-दूसरे से स्वतंत्र है <math>f</math> पर <math>[0,T]</math> और जाने  <math>F</math> इसी आगमन समय वितरण कार्यक्रम को निरूपित करें अर्थात


: <math>F(t) = \int_{0}^{t} f(s)ds </math>, <math>\, 0\le t\le T</math>.
: <math>F(t) = \int_{0}^{t} f(s)ds </math>, <math>\, 0\le t\le T</math>.


होने देना <math>\tau</math> ऐसा हो कि <math> F(\tau)=1/e.</math> सभी आवेदकों को समय-समय पर प्रतीक्षा करने और निरीक्षण करने की रणनीति पर विचार करें <math>\tau </math> और यदि संभव हो तो समय के बाद पहले उम्मीदवार का चयन करना <math>\tau </math> जो पिछले सभी से बेहतर है। फिर इस रणनीति, जिसे 1/ई-रणनीति कहा जाता है, में निम्नलिखित गुण हैं:
<math>\tau</math> ऐसा हो कि <math> F(\tau)=1/e.</math> सभी आवेदक समय-समय पर प्रतीक्षा करने और निरीक्षण करने की रणनीति पर विचार करें <math>\tau </math> यदि संभव हो तो समय के बाद पहले उम्मीदवार का चयन करना <math>\tau </math> जो पिछले सभी से बेहतर है फिर इस रणनीति को जिसे 1/ई-रणनीति कहा जाता है इसमें निम्नलिखित गुण हैं


1/ई-रणनीति
1/ई-रणनीति


:(i) सभी के लिए पैदावार <math>N</math> कम से कम 1/e की सफलता की संभावना,
:(i) सभी के लिए पैदावार <math>N</math> कम से कम 1/e की सफलता की संभावना।


: (ii) चयनकर्ता के लिए एक न्यूनतम-इष्टतम रणनीति है जो नहीं जानता है <math>N</math>,
: (ii) चयनकर्ता के लिए एक न्यूनतम-इष्टतम रणनीति है जो <math>N</math>को नहीं जानता है।


:(iii) चयन करता है, यदि कम से कम एक आवेदक है, बिल्कुल 1/e संभावना के साथ कोई नहीं।
:(iii) चयन करता है यदि कम से कम एक आवेदक हो जो 1/e संभावना के साथ कोई न हो।


एफ. थॉमस ब्रस द्वारा 1984 में सिद्ध किया गया पहला/ई-कानून एक आश्चर्य के रूप में सामने आया। कारण यह था कि अज्ञात के लिए एक मॉडल में पहुंच से बाहर होने से पहले लगभग 1/e के मान पर विचार किया गया था <math> N </math>, जबकि यह मान 1/e अब सफलता की संभावना के लिए एक निचली सीमा के रूप में प्राप्त किया गया था, और यह यकीनन बहुत कमजोर परिकल्पनाओं वाले मॉडल में है (उदाहरण के लिए गणित देखें। समीक्षाएं 85:m)।
एफ. थॉमस ब्रस द्वारा 1984 में सिद्ध किया गया पहला/ई-कानून एक आश्चर्य के रूप में सामने आया। कारण यह था कि अज्ञात के लिए एक मॉडल में पहुंच से बाहर होने से पहले लगभग 1/e के मान पर विचार किया गया था <math> N </math>, जबकि यह मान 1/e अब सफलता की संभावना के लिए एक निचली सीमा के रूप में प्राप्त किया गया था, और यह यकीनन बहुत कमजोर परिकल्पनाओं वाले मॉडल में है (उदाहरण के लिए गणित देखें। समीक्षाएं 85:m)।

Revision as of 10:40, 23 May 2023

n अनुप्रयोगों से सर्वश्रेष्ठ उम्मीदवार (लाल वृत्त) प्राप्त करने की संभावनाओं का ग्राफ, और k/n (नीला क्रॉस) जहां k नमूना आकार है

सचिव समस्या इष्टतम रोक परिभाषा से जुड़े एक परिदृश्य को प्रदर्शित करती है[1][2] जिसका व्यवहार संभाव्यता, सांख्यिकी और निर्णय सिद्धांत के क्षेत्र में बड़े पैमाने पर अध्ययन किया जाता है इसे शादी की समस्या, सुल्तान की दहेज समस्या, उधम मचाने वाली समस्या, गूगल खेल और अच्छी पसंद समस्या के रूप में भी जानी जाती है

समस्या का मूल रूप निम्नलिखित है यह एक ऐसे प्रशासक की कल्पना करता है जो सबसे अच्छे सचिव को नियुक्त करना चाहता है एक पद के लिए पद करने योग्य आवेदक या आवेदकों का यादृच्छिक क्रम में एक-एक करके साक्षात्कार लिया जाता है साक्षात्कार के तुरंत बाद प्रत्येक विशेष आवेदक के बारे में निर्णय लिया जाना है एक बार निर्णय कर दिए जाने के बाद एक आवेदक को वापस नहीं बुलाया जा सकता है साक्षात्कार के दौरान प्रशासक आवेदक को अब तक साक्षात्कार किए गए सभी आवेदकों के बीच पद प्राप्त करने के लिए पर्याप्त जानकारी प्राप्त करता है लेकिन अभी तक अनदेखे आवेदकों की गुणवत्ता से अनभिज्ञ है प्रश्न सर्वश्रेष्ठ आवेदक के चयन की संभावना को अधिकतम करने के लिए इष्टतम रणनीति नियम को रोकने के बारे में है यदि निर्णय को अंत तक टाला जाये तो इससे चल रहे अधिकतम चयन प्रारूप द्वारा हल किया जा सकता है और अंत में समग्र अधिकतम का चयन किया जा सकता है कठिनाई यह है कि निर्णय तुरंत किया जाना चाहिए।

अब तक ज्ञात सबसे छोटा कठोर प्रमाण बाधाओं प्रारूप द्वारा प्रदान किया गया है इसका तात्पर्य है कि इष्टतम जीत की संभावना हमेशा कम से कम होती है जहाँ e गणितीय स्थिरांक प्राकृतिक लघुगणक का आधार है और यह बाद वाला बहुत अधिक सामान्यता भी धारण करता है इष्टतम रोक नियम हमेशा पहले को अस्वीकार करने की सलाह देता है जिन आवेदकों का साक्षात्कार लिया जाता है वे पहले आवेदक पर रुकते हैं जो अब तक के साक्षात्कार वाले प्रत्येक आवेदक से बेहतर है या यदि ऐसा कभी नहीं होता है तो अंतिम आवेदक को जारी रखें कभी-कभी इस रणनीति को रोक नियम कहा जाता है क्योंकि इस रणनीति के साथ सबसे अच्छे आवेदक को रोकने की संभावना लगभग है से पहले ही मध्यम मूल्यों के लिए . सचिव समस्या पर इतना अधिक ध्यान देने का एक कारण यह है कि समस्या के लिए इष्टतम नीति रोकने का नियम सरल है और 100 या 100 मिलियन आवेदक होने के बाद भी लगभग 37 प्रतिशत समय में सबसे अच्छे उम्मीदवार का चयन करता है।

सूत्रीकरण

जबकि इसमें कई विविधताएँ हैं मूल समस्या को निम्नानुसार कहा जा सकता है जो इस प्रकार हैं-

  • भरने के लिए एक ही पद है।
  • पद के लिए n आवेदक हैं और n का मान ज्ञात है।
  • आवेदकों को यदि सभी को एक साथ देखा जाए तो उन्हें स्पष्ट रूप से सर्वश्रेष्ठ या सबसे खराब क्रम में रखा जा सकता है।
  • आवेदकों का यादृच्छिक क्रम में क्रमिक रूप से साक्षात्कार किया जाता है जिसमें प्रत्येक आदेश समान रूप से होने की संभावना होती है।
  • एक साक्षात्कार के तुरंत बाद साक्षात्कार के आवेदक को स्वीकार या अस्वीकार कर दिया जाता है और निर्णय अपरिवर्तनीय है।
  • किसी आवेदक को स्वीकार या अस्वीकार करने का निर्णय अब तक साक्षात्कार किए गए आवेदकों के सापेक्ष पद पर ही आधारित हो सकता है।
  • सामान्य समाधान का उद्देश्य पूरे समूह के सर्वश्रेष्ठ आवेदक के चयन की उच्चतम संभावना है यह अपेक्षित अदायगी को अधिकतम करने के समान है जिसमें अदायगी को सर्वश्रेष्ठ आवेदक के लिए एक और अन्यथा शून्य के रूप में परिभाषित किया गया है।

एक उम्मीदवार को एक आवेदक के रूप में परिभाषित किया जाता है जिसका साक्षात्कार होने पर पहले साक्षात्कार किए गए सभी आवेदकों से बेहतर होता है इसका मतलब साक्षात्कार के तुरंत बाद हटाना होता है जिससे समस्या का उद्देश्य एकल सर्वश्रेष्ठ आवेदक का चयन करना है इसलिए स्वीकृति के लिए केवल उम्मीदवारों पर विचार किया जाएगा इस संदर्भ में उम्मीदवार क्रम परिवर्तन में रिकॉर्ड की अवधारणा से मेल खाता है।

इष्टतम नीति प्राप्त करना

समस्या के लिए इष्टतम नीति एक रोक नियम है इसके तहत साक्षात्कारकर्ता पहले r − 1 आवेदकों अस्वीकार करता है और आवेदक M को इन r − 1 आवेदकों में से सबसे अच्छा आवेदक होने दें और फिर बाद में पहले आवेदक का चयन करसे जो आवेदक M से बेहतर होता है इसमें यह दिखाया जाता है कि इष्टतम रणनीतियों के इस वर्ग में निहित है आवेदक का चयन नहीं करना चाहिए जो अब तक हमने देखा है कि सबसे अच्छा आवेदक नहीं है क्योंकि वे समग्र रूप से सर्वश्रेष्ठ आवेदक नहीं हो सकते हैं एक मनमाना कटऑफ आर के लिए सबसे अच्छा आवेदक चुने जाने की संभावना है

राशि r = 1 के लिए परिभाषित नहीं है लेकिन ऐसे स्थानों में एकमात्र व्यवहार्य नीति पहले आवेदक का चयन करना है और P(1) = 1/n यह राशि इस बात को ध्यान में रखते हुए प्राप्त की जाती है कि यदि आवेदक i सबसे अच्छा आवेदक है तो इसे चुना जाता है और यदि अगर पहले i − 1 आवेदकों में से सबसे अच्छा आवेदक उन पहले r − 1 आवेदकों में से है जिन्हें अस्वीकार कर दिया गया था तो एन को अनंत की ओर ले जाने या लिखने के लिए (r−1)/n की सीमा के रूप में (i−1)/n के लिए t और 1/n के लिए dt का उपयोग करके योग को समाकल द्वारा अनुमानित किया जा सकता है।

के संबंध में P(x) का अवकलन लेना इसे 0 पर एकत्र करके और x के लिए हल करके हम पाते हैं कि इष्टतम x 1/e के बराबर है या नहीं इस प्रकार इष्टतम कटऑफ एन / ई के रूप में बढ़ता है और सबसे अच्छा आवेदक 1 / ई संभावना के साथ चुना जाता है।

n के छोटे मानों के लिए मानक गतिशील कार्यक्रमिक विधियों द्वारा इष्टतम r भी प्राप्त किया जा सकता है इष्टतम आर और एन के कई मूल्यों के लिए सबसे अच्छा विकल्प पी चुनने की संभावना निम्न तालिका में दिखायी गयी है।

1 2 3 4 5 6 7 8 9
1 1 2 2 3 3 3 4 4
1.000 0.500 0.500 0.458 0.433 0.428 0.414 0.410 0.406

शास्त्रीय सचिव समस्या में सर्वश्रेष्ठ आवेदक के चयन की संभावना की ओर अभिसरण होता है। .

वैकल्पिक समाधान

इस समस्या और कई संशोधनों को कठिनाई प्रारूप द्वारा सीधे तरीके से इष्टतमता के प्रमाण सहित हल किया जा सकता है जिसमें अन्य अनुप्रयोग भी हैं इस प्रारूप द्वारा हल की जा सकने वाली सचिव समस्या के लिए संशोधनों में आवेदकों की यादृच्छिक उपलब्धता आवेदकों के लिए अधिक सामाशा परिकल्पनाएं सम्मिलित हैं जो निर्णयकर्ता के लिए रुचिकर हों आवेदकों के लिए समूह साक्षात्कार साथ ही आवेदकों की यादृच्छिक संख्या के लिए कुछ प्रयुक्त आवेदक हैं।[citation needed]

सीमाएं

सचिव समस्या का समाधान केवल तभी सार्थक है जब आवेदकों को नियोजित निर्णय रणनीति का कोई ज्ञान न हो क्योंकि शुरुआती आवेदकों के पास कोई मौका नहीं है और यह दिखाई भी नहीं दे सकता है।

शास्त्रीय सचिव समस्या के समाधान के अनुप्रयोगों के लिए एक महत्वपूर्ण दोष आवेदकों की संख्या है जो इस समस्या को दूर करने का तरीका यह मान लेता है कि आवेदकों की संख्या एक यादृच्छिक चर है के ज्ञात वितरण के साथ प्रेसमैन और सोनिन 1972 में इस प्रारूप के लिए इष्टतम समाधान सामान्य रूप से अधिक कठिन है इसके सफलता की संभावना अब 1/e के आसपास नहीं है लेकिन आमतौर पर कम है इसे आवेदकों की संख्या न जानने की कीमत चुकाने के संदर्भ में समझा जा सकता है जबकि इस प्रारूप में कीमत ज्यादा है यह इसके वितरण की पसंद पर निर्भर करता है इष्टतम जीत संभावना शून्य तक पहुंच सकती है इस नई समस्या से निपटने के तरीकों की तलाश में एक नए प्रारूप का नेतृत्व किया गया जो तथाकथित 1/ई-कानून को सर्वोत्तम विकल्प प्रदान करता है।

1/सर्वश्रेष्ठ विकल्प का ई-कानून

प्रारूप का सार इस विचार पर आधारित है कि जीवन अनुक्रमिक है और वास्तविक दुनिया की समस्याएं वास्तविक समय में उत्पन्न होती हैं इसके अलावा ऐसे समय का अनुमान लगाना आसान होता है जिसमें विशिष्ट घटनाओं आवेदकों के आगमन को अधिक बार होना चाहिए यदि वे ऐसा करते हैं तो होने वाली विशिष्ट घटनाओं की संख्या के वितरण का अनुमान लगाने के जगह इस विचार ने निम्नलिखित दृष्टिकोण को जन्म दिया तथाकथित एकीकृत दृष्टिकोण 1984 में लागू हुआ।

प्रारूप को इस प्रकार परिभाषित किया गया है कि एक आवेदक को कुछ समय अंतराल पर चुना जाना चाहिए किसी अनजान नंबर से पद करने योग्य आवेदकों का लक्ष्य इस परिकल्पना के तहत केवल सर्वश्रेष्ठ का चयन करने की संभावना को अधिकतम करना है किसी विभिन्न पदों के सभी आगमन आदेशित समान रूप से होने की संभावना है मान लीजिए कि सभी आवेदकों का आगमन समय घनत्व समान है लेकिन एक-दूसरे से स्वतंत्र है पर और जाने इसी आगमन समय वितरण कार्यक्रम को निरूपित करें अर्थात

, .

ऐसा हो कि सभी आवेदक समय-समय पर प्रतीक्षा करने और निरीक्षण करने की रणनीति पर विचार करें यदि संभव हो तो समय के बाद पहले उम्मीदवार का चयन करना जो पिछले सभी से बेहतर है फिर इस रणनीति को जिसे 1/ई-रणनीति कहा जाता है इसमें निम्नलिखित गुण हैं

1/ई-रणनीति

(i) सभी के लिए पैदावार कम से कम 1/e की सफलता की संभावना।
(ii) चयनकर्ता के लिए एक न्यूनतम-इष्टतम रणनीति है जो को नहीं जानता है।
(iii) चयन करता है यदि कम से कम एक आवेदक हो जो 1/e संभावना के साथ कोई न हो।

एफ. थॉमस ब्रस द्वारा 1984 में सिद्ध किया गया पहला/ई-कानून एक आश्चर्य के रूप में सामने आया। कारण यह था कि अज्ञात के लिए एक मॉडल में पहुंच से बाहर होने से पहले लगभग 1/e के मान पर विचार किया गया था , जबकि यह मान 1/e अब सफलता की संभावना के लिए एक निचली सीमा के रूप में प्राप्त किया गया था, और यह यकीनन बहुत कमजोर परिकल्पनाओं वाले मॉडल में है (उदाहरण के लिए गणित देखें। समीक्षाएं 85:m)।

हालाँकि, कई अन्य रणनीतियाँ हैं जो (i) और (ii) प्राप्त करती हैं और, इसके अलावा, 1/ई-रणनीति की तुलना में सख्ती से बेहतर प्रदर्शन करती हैं। एक साथ सभी के लिए > 2। एक सरल उदाहरण वह रणनीति है जो समय के बाद पहले अपेक्षाकृत सर्वश्रेष्ठ उम्मीदवार का चयन करती है (यदि संभव हो)। बशर्ते कि कम से कम एक आवेदक इस समय से पहले पहुंचे, और अन्यथा समय के बाद दूसरे अपेक्षाकृत सर्वश्रेष्ठ उम्मीदवार का चयन करें (यदि संभव हो)। .[3]

संख्या 1/ई की समान भूमिका के कारण 1/ई-कानून कभी-कभी ऊपर वर्णित शास्त्रीय सचिव समस्या के समाधान के साथ भ्रमित हो जाता है। हालांकि, 1/ई-कानून में, यह भूमिका अधिक सामान्य है। परिणाम भी मजबूत है, क्योंकि यह अज्ञात संख्या में आवेदकों के लिए है और चूंकि आगमन समय वितरण एफ पर आधारित मॉडल अनुप्रयोगों के लिए अधिक ट्रैक्टेबल है।

गोगोल का खेल

थॉमस एस. फर्ग्यूसन के अनुसार, सेक्रेटरी प्रॉब्लम पहली बार प्रिंट में दिखाई दी, जब इसे मार्टिन गार्डनर ने अपने फरवरी 1960 में अमेरिकी वैज्ञानिक में गणितीय खेल स्तंभ में चित्रित किया।[1] यहां बताया गया है कि गार्डनर ने इसे कैसे तैयार किया: किसी को कागज की जितनी चाहें उतनी पर्चियां लेने के लिए कहें, और प्रत्येक पर्ची पर एक अलग सकारात्मक संख्या लिखें। संख्याएँ 1 के छोटे अंशों से लेकर एक गोगोल के आकार की संख्या (1 के बाद सौ शून्य) या इससे भी बड़ी हो सकती हैं। इन पर्चियों को उल्टा कर दिया जाता है और एक मेज के ऊपर से फेर दिया जाता है। एक समय में आप स्लिप्स को उल्टा कर देते हैं। लक्ष्य यह है कि जब आप उस संख्या तक पहुंचें जिसे आप श्रृंखला में सबसे बड़ा मानते हैं तो मुड़ना बंद कर दें। आप वापस नहीं जा सकते हैं और पहले से मुड़ी हुई पर्ची नहीं उठा सकते हैं। यदि आप सभी पर्चियों को पलट देते हैं, तो निश्चित रूप से आपको अंतिम मुड़ी हुई पर्चियों को चुनना चाहिए।[4]

लेख में सचिव समस्या का समाधान किसने किया? फर्ग्यूसन ने बताया कि सेक्रेटरी की समस्या अनसुलझी रही, जैसा कि एम. गार्डनर ने कहा था, जो दो विरोधी खिलाड़ियों के साथ दो-व्यक्ति शून्य-राशि के खेल के रूप में है।[1] इस खेल में ऐलिस, सूचित खिलाड़ी, गुप्त रूप से अलग-अलग नंबर लिखता है पत्ते। बॉब, रोकने वाला खिलाड़ी, वास्तविक मूल्यों को देखता है और जब भी वह चाहता है तो कार्ड को बदलना बंद कर सकता है, अगर आखिरी कार्ड बदल गया तो जीतना कुल अधिकतम संख्या है। बुनियादी सचिव की समस्या से अंतर यह है कि बॉब कार्डों पर लिखे वास्तविक मूल्यों का अवलोकन करता है, जिसका उपयोग वह अपनी निर्णय प्रक्रियाओं में कर सकता है। सचिव समस्या के कुछ संस्करणों में कार्ड पर संख्या आवेदकों के संख्यात्मक गुणों के अनुरूप होती है। संख्याओं का संयुक्त संभाव्यता वितरण ऐलिस के नियंत्रण में है।

बॉब उच्चतम संभव संभावना के साथ अधिकतम संख्या का अनुमान लगाना चाहता है, जबकि ऐलिस का लक्ष्य इस संभावना को यथासंभव कम रखना है। ऐलिस के लिए कुछ निश्चित वितरण से स्वतंत्र रूप से संख्याओं का नमूना लेना इष्टतम नहीं है, और वह कुछ आश्रित तरीके से यादृच्छिक संख्याओं को चुनकर बेहतर खेल सकती है। के लिए ऐलिस की कोई न्यूनतम रणनीति नहीं है, जो थॉमस एम. कवर|टी के विरोधाभास से निकटता से संबंधित है। ढकना। लेकिन के लिए खेल में एक समाधान है: ऐलिस यादृच्छिक संख्या (जो आश्रित यादृच्छिक चर हैं) को इस तरह से चुन सकता है कि बॉब सापेक्ष रैंकों के आधार पर शास्त्रीय रोक रणनीति का उपयोग करने से बेहतर नहीं खेल सकता।[5]

अनुमानित प्रदर्शन

शेष लेख आवेदकों की ज्ञात संख्या के लिए फिर से सचिव समस्या से संबंधित है।

तीन अनुमानों के लिए अपेक्षित सफलता की संभावनाएं।

Stein, Seale & Rapoport 2003 ने कई मनोवैज्ञानिक रूप से प्रशंसनीय अनुमानों के लिए अपेक्षित सफलता की संभावनाएँ प्राप्त कीं जिन्हें सचिव समस्या में नियोजित किया जा सकता है। उन्होंने जिन ह्यूरिस्टिक्स की जांच की वे थे:

  • कटऑफ नियम (CR): पहले y आवेदकों में से किसी को भी स्वीकार न करें; इसके बाद, पहले सामना करने वाले उम्मीदवार (यानी, सापेक्ष रैंक 1 वाला आवेदक) का चयन करें। इस नियम में एक विशेष मामले के रूप में शास्त्रीय सचिव समस्या के लिए इष्टतम नीति है जिसके लिए y = r।
  • उम्मीदवार गणना नियम (सीसीआर): वाई-वें सामना करने वाले उम्मीदवार का चयन करें। ध्यान दें कि यह नियम आवश्यक रूप से किसी भी आवेदक को छोड़ नहीं देता है; यह केवल इस बात पर विचार करता है कि कितने उम्मीदवारों का अवलोकन किया गया है, यह नहीं कि आवेदक अनुक्रम में निर्णय निर्माता कितना गहरा है।
  • लगातार गैर-उम्मीदवार नियम (एसएनसीआर): वाई गैर-उम्मीदवारों (यानी, संबंधित रैंक वाले आवेदक > 1) का अवलोकन करने के बाद सबसे पहले सामना करने वाले उम्मीदवार का चयन करें।

प्रत्येक अनुमानी का एक एकल पैरामीटर y होता है। आंकड़ा (दाईं ओर दिखाया गया है) n = 80 के साथ समस्याओं के लिए y के एक समारोह के रूप में प्रत्येक अनुमानी के लिए अपेक्षित सफलता की संभावनाएं प्रदर्शित करता है।

कार्डिनल पेऑफ वेरिएंट

एकल सर्वश्रेष्ठ आवेदक ढूँढना एक सख्त उद्देश्य की तरह लग सकता है। कोई कल्पना कर सकता है कि साक्षात्कारकर्ता एक कम-मूल्यवान आवेदक की तुलना में एक उच्च-मूल्यवान आवेदक को नियुक्त करेगा, और न केवल सर्वश्रेष्ठ प्राप्त करने के लिए चिंतित होगा। अर्थात्, साक्षात्कारकर्ता एक आवेदक का चयन करने से कुछ मूल्य प्राप्त करेगा जो आवश्यक रूप से सर्वोत्तम नहीं है, और व्युत्पन्न मूल्य चयनित के मूल्य के साथ बढ़ता है।

इस समस्या को मॉडल करने के लिए, मान लीजिए कि आवेदकों के पास वास्तविक मूल्य हैं जो यादृच्छिक चर एक्स तैयार i.i.d हैं। [0, 1] पर एक समान वितरण (निरंतर) से। ऊपर वर्णित शास्त्रीय समस्या के समान, साक्षात्कारकर्ता केवल यह देखता है कि क्या प्रत्येक आवेदक अब तक का सबसे अच्छा है (एक उम्मीदवार), प्रत्येक को मौके पर ही स्वीकार या अस्वीकार कर देना चाहिए, और यदि वह पहुंच जाता है तो अंतिम को स्वीकार करना चाहिए। (स्पष्ट होने के लिए, साक्षात्कारकर्ता प्रत्येक आवेदक की वास्तविक सापेक्ष रैंक नहीं सीखता है। वह केवल यह सीखता है कि आवेदक की सापेक्ष रैंक 1 है या नहीं।) हालांकि, इस संस्करण में भुगतान चयनित आवेदक के सही मूल्य द्वारा दिया गया है। उदाहरण के लिए, यदि वह एक आवेदक का चयन करता है जिसका सही मूल्य 0.8 है, तो वह 0.8 कमाएगा। साक्षात्कारकर्ता का उद्देश्य चयनित आवेदक के अपेक्षित मूल्य को अधिकतम करना है।

चूंकि आवेदक के मान i.i.d. [0, 1] पर एक समान वितरण से प्राप्त करता है, दिए गए tवें आवेदक का अपेक्षित मूल्य द्वारा दिया गया है

शास्त्रीय समस्या के रूप में, इष्टतम नीति एक दहलीज द्वारा दी गई है, जिसे इस समस्या के लिए हम निरूपित करेंगे , जिस पर साक्षात्कारकर्ता को उम्मीदवारों को स्वीकार करना शुरू कर देना चाहिए। बेयरडेन ने दिखाया कि सी या तो है या .[6] (वास्तव में, जो भी सबसे करीब है ।) यह इस तथ्य से अनुसरण करता है कि एक समस्या दी गई है आवेदकों, कुछ मनमाने ढंग से सीमा के लिए अपेक्षित अदायगी है

फर्क सी के संबंध में, एक प्राप्त करता है

फ़ाइल: RelativeRankLearning2.pdf|thumb|आंशिक-सूचना अनुक्रमिक खोज प्रतिमान में सीखना। संख्या खोज में विभिन्न बिंदुओं पर उनके सापेक्ष रैंक (अब तक देखे गए कुल आवेदकों में से) के आधार पर आवेदकों के अपेक्षित मूल्यों को प्रदर्शित करती है। उम्मीदों की गणना मामले के आधार पर की जाती है जब उनके मान समान रूप से 0 और 1 के बीच वितरित किए जाते हैं। सापेक्ष रैंक की जानकारी साक्षात्कारकर्ता को आवेदकों का अधिक बारीकी से मूल्यांकन करने की अनुमति देती है क्योंकि वे उनकी तुलना करने के लिए अधिक डेटा बिंदु जमा करते हैं। तब से के सभी अनुमेय मूल्यों के लिए , हम पाते हैं पर अधिकतम होता है . चूँकि V उत्तल है , इष्टतम पूर्णांक-मान थ्रेशोल्ड या तो होना चाहिए या . इस प्रकार, के अधिकांश मूल्यों के लिए साक्षात्कारकर्ता शास्त्रीय संस्करण की तुलना में कार्डिनल पेऑफ संस्करण में जल्द ही आवेदकों को स्वीकार करना शुरू कर देगा, जहां उद्देश्य एकल सर्वश्रेष्ठ आवेदक का चयन करना है। ध्यान दें कि यह एक स्पर्शोन्मुख परिणाम नहीं है: यह सभी के लिए है . हालांकि, ज्ञात वितरण से अपेक्षित मूल्य को अधिकतम करने के लिए यह इष्टतम नीति नहीं है। ज्ञात वितरण के मामले में, गतिशील प्रोग्रामिंग के माध्यम से इष्टतम खेल की गणना की जा सकती है।

इस समस्या का एक अधिक सामान्य रूप पाले और क्रेमर (2014) द्वारा पेश किया गया[7] मानता है कि प्रत्येक नए आवेदक के आने पर, साक्षात्कारकर्ता उन सभी आवेदकों के सापेक्ष उनकी रैंक देखता है जो पहले देखे जा चुके हैं। यह मॉडल एक साक्षात्कारकर्ता सीखने की धारणा के अनुरूप है क्योंकि वे पिछले डेटा बिंदुओं के एक सेट को जमा करके खोज प्रक्रिया जारी रखते हैं जिसका उपयोग वे नए उम्मीदवारों के आने पर उनका मूल्यांकन करने के लिए कर सकते हैं। इस तथाकथित आंशिक-सूचना मॉडल का एक लाभ यह है कि यदि साक्षात्कारकर्ता को प्रत्येक आवेदक के मूल्य के बारे में पूरी जानकारी दी गई थी, तो सापेक्ष रैंक की जानकारी के साथ प्राप्त किए गए निर्णयों और परिणामों की सीधे संबंधित इष्टतम निर्णयों और परिणामों से तुलना की जा सकती है। यह पूर्ण-सूचना समस्या, जिसमें आवेदकों को एक ज्ञात वितरण से स्वतंत्र रूप से लिया जाता है और साक्षात्कारकर्ता चयनित आवेदक के अपेक्षित मूल्य को अधिकतम करना चाहता है, मूल रूप से मोजर (1956) द्वारा हल किया गया था,[8] सकागुची (1961),[9] और कार्लिन (1962)।

अन्य संशोधन

सचिव समस्या के कई रूप हैं जिनका सरल और सुरुचिपूर्ण समाधान भी है।

एक संस्करण दूसरे सर्वश्रेष्ठ को चुनने की इच्छा के साथ सर्वश्रेष्ठ चुनने की इच्छा को प्रतिस्थापित करता है।[10][11][12] रॉबर्ट जे। वेंडरबी ने इसे पोस्टडॉक समस्या कहते हुए तर्क दिया कि सबसे अच्छा हार्वर्ड जाएगा। इस समस्या के लिए, समान संख्या में आवेदकों के लिए सफलता की संभावना ठीक है . यह प्रायिकता 1/4 हो जाती है क्योंकि n अनंत की ओर जाता है जो इस तथ्य को दर्शाता है कि दूसरे-सर्वश्रेष्ठ की तुलना में सर्वश्रेष्ठ को चुनना आसान है।

दूसरे संस्करण के लिए, चयनों की संख्या एक से अधिक होने के लिए निर्दिष्ट है। दूसरे शब्दों में, साक्षात्कारकर्ता सिर्फ एक सचिव को नहीं बल्कि भर्ती कर रहा है बल्कि, कहते हैं, एक आवेदक पूल से छात्रों की एक कक्षा को स्वीकार करना। इस धारणा के तहत कि सभी चयनित उम्मीदवारों को अगर और केवल तभी सफलता मिलती है सभी गैर-चयनित उम्मीदवारों से बेहतर हैं, यह फिर से एक समस्या है जिसे हल किया जा सकता है। में दिखाया गया था Vanderbei 1980 कि जब n सम है और ठीक आधे उम्मीदवारों का चयन करने की इच्छा है, तो इष्टतम रणनीति की सफलता की संभावना पैदा होती है .

एक अन्य संस्करण सर्वश्रेष्ठ का चयन करने का है सचिव पूल से बाहर , फिर से एक ऑनलाइन एल्गोरिथम में। यह क्लासिक एक और कटऑफ दहलीज से संबंधित रणनीति की ओर जाता है जिसके लिए शास्त्रीय समस्या एक विशेष मामला है।[13]

बहुविकल्पी समस्या

एक खिलाड़ी की अनुमति है विकल्प, और वह जीतता है यदि कोई विकल्प सबसे अच्छा है। Gilbert & Mosteller 1966 ने दिखाया कि एक इष्टतम रणनीति एक दहलीज रणनीति (कटऑफ रणनीति) द्वारा दी गई है। एक इष्टतम रणनीति थ्रेसहोल्ड संख्याओं के सेट द्वारा परिभाषित रणनीतियों की श्रेणी से संबंधित है , कहाँ . पहली पसंद के साथ शुरू होने वाले पहले उम्मीदवारों पर इस्तेमाल किया जाना है वें आवेदक, और एक बार पहली पसंद का उपयोग करने के बाद, दूसरी पसंद का उपयोग पहले उम्मीदवार पर किया जाना है वें आवेदक, और इसी तरह।

गिल्बर्ट और मोस्टेलर ने दिखाया . आगे के मामलों के लिए कि , देखना Matsui & Ano 2016 (उदाहरण के लिए ).

कब , जीत की संभावना अभिसरित होती है .[14] Matsui & Ano 2016 ने दिखाया कि किसी भी सकारात्मक पूर्णांक के लिए , जीत की संभावना (का चॉइस सेक्रेटरी प्रॉब्लम) में परिवर्तित हो जाता है कहाँ . इस प्रकार, जीत की संभावना परिवर्तित हो जाती है और कब क्रमश।

प्रायोगिक अध्ययन

प्रायोगिक प्रायोगिक मनोविज्ञान और प्रायोगिक अर्थशास्त्र ने सचिव समस्या स्थितियों में वास्तविक लोगों के निर्णय लेने का अध्ययन किया है।[15] बड़े हिस्से में, इस काम ने दिखाया है कि लोग बहुत जल्दी खोज करना बंद कर देते हैं। उम्मीदवारों के मूल्यांकन की लागत से इसे कम से कम आंशिक रूप से समझाया जा सकता है। वास्तविक दुनिया की सेटिंग में, यह सुझाव दे सकता है कि लोग पर्याप्त खोज नहीं करते हैं जब भी उन्हें समस्याओं का सामना करना पड़ता है जहां निर्णय विकल्प क्रमिक रूप से सामने आते हैं। उदाहरण के लिए, जब यह तय करने की कोशिश की जा रही है कि हाइवे के किनारे कौन से गैस स्टेशन पर गैस के लिए रुकना है, तो हो सकता है कि लोग रुकने से पहले पर्याप्त खोज न करें। यदि यह सच है, तो वे गैस के लिए अधिक भुगतान करने की प्रवृत्ति रखते हैं, यदि उन्होंने अधिक समय तक खोज की होती। जब लोग एयरलाइन टिकट के लिए ऑनलाइन खोज करते हैं तो भी ऐसा ही हो सकता है। सचिव समस्या जैसी समस्याओं पर प्रायोगिक शोध को कभी-कभी व्यवहार संचालन अनुसंधान के रूप में संदर्भित किया जाता है।

तंत्रिका संबंध

जबकि दोनों जानवरों का उपयोग करके अवधारणात्मक निर्णय लेने के कार्यों में सूचना एकीकरण, या विश्वास का प्रतिनिधित्व पर तंत्रिका विज्ञान अनुसंधान का एक बड़ा हिस्सा है।[16][17] और मानव विषय,[18] इस बारे में अपेक्षाकृत कम जानकारी है कि सूचना एकत्र करना बंद करने का निर्णय किस प्रकार लिया जाता है।

शोधकर्ताओं ने कार्यात्मक एमआरआई का उपयोग करके स्वस्थ स्वयंसेवकों में सचिव समस्या को हल करने के तंत्रिका आधारों का अध्ययन किया है।[19] एक मार्कोव निर्णय प्रक्रिया (एमडीपी) का उपयोग वर्तमान विकल्प के लिए खोज बनाम कमिटमेंट जारी रखने के मूल्य की मात्रा निर्धारित करने के लिए किया गया था। एक विकल्प लगे पार्श्विका प्रांतस्था और पृष्ठीय प्रीफ्रंटल कॉर्टेक्स कॉर्टिस के साथ-साथ वेंट्रल स्ट्रिएटम, द्वीपीय प्रांतस्था और पूर्वकाल सिंगुलेट लेने बनाम अस्वीकार करने के निर्णय। इसलिए, मस्तिष्क क्षेत्रों को पहले साक्ष्य एकीकरण और इनाम प्रणाली प्रतिनिधित्व में फंसाया गया था, जो थ्रेशोल्ड क्रॉसिंग को सांकेतिक शब्दों में बदलना है जो एक विकल्प के लिए निर्णय लेने के लिए ट्रिगर करता है।

इतिहास

सेक्रेटरी प्रॉब्लम स्पष्ट रूप से 1949 में मेरिल एम. फ्लड द्वारा पेश की गई थी, जिन्होंने उस वर्ष अपने एक व्याख्यान में इसे मंगेतर समस्या कहा था। 1950 के दशक के दौरान उन्होंने कई बार इसका उल्लेख किया, उदाहरण के लिए, 9 मई 1958 को पर्ड्यू विश्वविद्यालय में एक सम्मेलन वार्ता में, और यह अंततः लोककथाओं में व्यापक रूप से जाना जाने लगा, हालांकि उस समय कुछ भी प्रकाशित नहीं हुआ था। 1958 में उन्होंने लियोनार्ड गिलमैन को एक पत्र भेजा, जिसकी प्रतियां सैमुअल कार्लिन और जे. रॉबिंस सहित एक दर्जन दोस्तों को भेजी गईं, जिसमें आर. पलेर्मो द्वारा एक परिशिष्ट के साथ इष्टतम रणनीति के प्रमाण की रूपरेखा दी गई, जिसने साबित किया कि सभी रणनीतियों में एक रणनीति का प्रभुत्व है। फॉर्म पहले पी को बिना शर्त खारिज कर देता है, फिर अगले उम्मीदवार को स्वीकार करता है जो बेहतर है।[20]

पहला प्रकाशन स्पष्ट रूप से फरवरी 1960 में साइंटिफिक अमेरिकन में मार्टिन गार्डनर द्वारा किया गया था। उन्होंने इसके बारे में जॉन एच. फॉक्स जूनियर और एल. गेराल्ड मार्नी से सुना था, जो स्वतंत्र रूप से 1958 में एक समान समस्या लेकर आए थे; उन्होंने इसे गूगोल का खेल कहा। फॉक्स और मार्नी इष्टतम समाधान नहीं जानते थे; गार्डनर ने लियो मोजर से सलाह मांगी, जिन्होंने (जे.आर. पाउंडर के साथ मिलकर) पत्रिका में प्रकाशन के लिए एक सही विश्लेषण प्रदान किया। इसके तुरंत बाद, कई गणितज्ञों ने गार्डनर को लिखा कि वे उसी समतुल्य समस्या के बारे में बताएं जो उन्होंने अंगूर की बेल के माध्यम से सुनी थी, जिनमें से सभी को संभवतः फ्लड के मूल कार्य में खोजा जा सकता है।[21]

सर्वोत्तम पसंद का 1/ई-कानून एफ. थॉमस ब्रस के कारण है।[22]

फर्ग्यूसन की एक व्यापक ग्रंथ सूची है और बताते हैं कि एक समान (लेकिन अलग) समस्या पर 1875 में आर्थर केली और यहां तक ​​​​कि जोहान्स केपलर # दूसरी शादी से बहुत पहले विचार किया गया था।[23]

मिश्रित सामान्यीकरण

सचिव समस्या को उस मामले में सामान्यीकृत किया जा सकता है जहां कई अलग-अलग नौकरियां हैं। फिर से, वहाँ हैं आवेदक यादृच्छिक क्रम में आ रहे हैं। जब कोई उम्मीदवार आता है, तो वह गैर-नकारात्मक संख्याओं का एक सेट प्रकट करती है। प्रत्येक मान किसी एक कार्य के लिए उसकी योग्यता निर्दिष्ट करता है। प्रशासक को न केवल यह तय करना है कि आवेदक को लेना है या नहीं, बल्कि यदि ऐसा है, तो उसे स्थायी रूप से किसी एक नौकरी पर नियुक्त करना होगा। उद्देश्य एक ऐसा असाइनमेंट ढूंढना है जहां योग्यता का योग जितना संभव हो उतना बड़ा हो। यह समस्या किनारे-भारित द्विपक्षीय ग्राफ में अधिकतम-वजन मिलान खोजने के समान है जहां एक तरफ के नोड यादृच्छिक क्रम में ऑनलाइन आते हैं। इस प्रकार, यह मिलान (ग्राफ़ सिद्धांत) #ऑनलाइन द्विदलीय मिलान समस्या का एक विशेष मामला है।

सेक्रेटरी प्रॉब्लम के लिए क्लासिक एल्गोरिद्म के सामान्यीकरण से, एक असाइनमेंट प्राप्त करना संभव है जहां योग्यता का अपेक्षित योग केवल एक कारक है एक इष्टतम (ऑफ़लाइन) असाइनमेंट से कम।[24]


यह भी देखें

टिप्पणियाँ

  1. 1.0 1.1 1.2 Ferguson, Thomas S. (August 1989). "Who Solved the Secretary Problem?". Statistical Science. 4 (3): 282–289. doi:10.1214/ss/1177012493.
  2. Hill, Theodore P. (2009). "कब रुकना है यह जानना". American Scientist. 97 (2): 126–133. doi:10.1511/2009.77.126. ISSN 1545-2786. S2CID 124798270. For French translation, see cover story in the July issue of Pour la Science (2009).
  3. Gnedin 2021.
  4. Gardner 1966.
  5. Gnedin 1994.
  6. Bearden 2006.
  7. Palley, Asa B.; Kremer, Mirko (8 July 2014). "Sequential Search and Learning from Rank Feedback: Theory and Experimental Evidence". Management Science. 60 (10): 2525–2542. doi:10.1287/mnsc.2014.1902. ISSN 0025-1909.
  8. Moser, Leo (1956). "केली की समस्या पर". Scripta Math. 22: 289–292.
  9. Sakaguchi, Minoru (1 June 1961). "कुछ अनुक्रमिक नमूनाकरण डिजाइन की गतिशील प्रोग्रामिंग". Journal of Mathematical Analysis and Applications (in English). 2 (3): 446–466. doi:10.1016/0022-247X(61)90023-3. ISSN 0022-247X.
  10. Rose, John S. (1982). "एक यादृच्छिक अनुक्रम से गैर-अत्यधिक उम्मीदवारों का चयन". J. Optim. Theory Appl. 38 (2): 207–219. doi:10.1007/BF00934083. ISSN 0022-3239. S2CID 121339045.
  11. Szajowski, Krzysztof (1982). "एथ रैंक के साथ किसी वस्तु का इष्टतम विकल्प". Matematyka Stosowana. Annales Societatis Mathematicae Polonae, Series III. 10 (19): 51–65. doi:10.14708/ma.v10i19.1533. ISSN 0137-2890.
  12. Vanderbei, Robert J. (21 June 2021). "सचिव समस्या का पोस्टडॉक संस्करण". Mathematica Applicanda. Annales Societatis Mathematicae Polonae, Series III. 49 (1): 3–13. doi:10.14708/ma.v49i1.7076. ISSN 2299-4009.{{cite journal}}: CS1 maint: date and year (link)
  13. Girdhar & Dudek 2009.
  14. Gilbert & Mosteller 1966.
  15. Bearden, Murphy, and Rapoport, 2006; Bearden, Rapoport, and Murphy, 2006; Seale and Rapoport, 1997; Palley and Kremer, 2014
  16. Shadlen, M. N.; Newsome, W. T. (23 January 1996). "Motion perception: seeing and deciding". Proceedings of the National Academy of Sciences. 93 (2): 628–633. Bibcode:1996PNAS...93..628S. doi:10.1073/pnas.93.2.628. PMC 40102. PMID 8570606.
  17. Roitman, Jamie D.; Shadlen, Michael N. (1 November 2002). "एक संयुक्त दृश्य भेदभाव रिएक्शन टाइम टास्क के दौरान लेटरल इंट्रापैरिएटल एरिया में न्यूरॉन्स की प्रतिक्रिया". The Journal of Neuroscience. 22 (21): 9475–9489. doi:10.1523/JNEUROSCI.22-21-09475.2002. PMC 6758024. PMID 12417672.
  18. Heekeren, Hauke R.; Marrett, Sean; Ungerleider, Leslie G. (9 May 2008). "तंत्रिका तंत्र जो मानव अवधारणात्मक निर्णय लेने में मध्यस्थता करता है". Nature Reviews Neuroscience. 9 (6): 467–479. doi:10.1038/nrn2374. PMID 18464792. S2CID 7416645.
  19. Costa, V. D.; Averbeck, B. B. (18 October 2013). "ललाट-पार्श्विका और लिम्बिक-स्ट्राइटल गतिविधि सर्वश्रेष्ठ विकल्प समस्या में सूचना नमूनाकरण को रेखांकित करती है". Cerebral Cortex. 25 (4): 972–982. doi:10.1093/cercor/bht286. PMC 4366612. PMID 24142842.
  20. Flood 1958.
  21. Gardner 1966, Problem 3.
  22. Bruss 1984.
  23. Ferguson 1989.
  24. Kesselheim, Thomas; Radke, Klaus; Tönnis, Andreas; Vöcking, Berthold (2013). "An Optimal Online Algorithm for Weighted Bipartite Matching and Extensions to Combinatorial Auctions". Algorithms – ESA 2013. Lecture Notes in Computer Science. Vol. 8125. pp. 589–600. doi:10.1007/978-3-642-40450-4_50. ISBN 978-3-642-40449-8.


संदर्भ


बाहरी संबंध