समकालिक प्रक्षोभ प्रसंभाव्यता सन्निकटन: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
 
(10 intermediate revisions by 4 users not shown)
Line 1: Line 1:
समकालिक गड़बड़ी [[स्टोकेस्टिक सन्निकटन]] (SPSA ) कई अज्ञात [[पैरामीटर]] वाली प्रणाली को अनुकूलित करने के लिए [[कलन विधि]] विधि है। यह प्रकार का स्टोकेस्टिक सन्निकटन एल्गोरिथम है। [[अनुकूलन]] पद्धति के रूप में यह बड़े पैमाने पर जनसंख्या मॉडल, अनुकूली प्रतिरूप , अनुरूप अनुकूलन और [[वायुमंडलीय मॉडल|वायुमंडलीय]] प्रतिरूप के लिए उपयुक्त है। SPSA की वेबसाइट http://www.jhuapl.edu/SPSA पर कई उदाहरण प्रस्तुत किए गए हैं। इस विषय पर विस्तृत पुस्तक भटनागर एवं अन्य हैं। (2013). इस विषय पर प्रारंभिक कागज मंत्र (1987) है और मुख्य सिद्धांत और औचित्य प्रदान करने वाला मूलभूत कागज मंत्र (1992) है।
समकालिक प्रक्षोभ प्रसंभाव्यता सन्निकटन (एसपीएसए) कई अज्ञात [[पैरामीटर]] वाली प्रणाली को अनुकूलित करने के लिए [[कलन विधि]] विधि है। यह प्रकार का स्टोकेस्टिक सन्निकटन कलन विधि है। [[अनुकूलन]] पद्धति के रूप में यह बड़े पैमाने पर जनसंख्या मॉडल, अनुकूली प्रतिरूप , अनुरूप अनुकूलन और [[वायुमंडलीय मॉडल|वायुमंडलीय]] प्रतिरूप के लिए उपयुक्त है। एसपीएसए की वेबसाइट [http://www.jhuapl.edu/SPSA http://www.jhuapl.edu/एसपीएसए] पर कई उदाहरण प्रस्तुत किए गए हैं। इस विषय पर विस्तृत पुस्तक भटनागर एवं अन्य हैं। (2013). इस विषय पर प्रारंभिक कागज मंत्र (1987) है और मुख्य सिद्धांत और औचित्य प्रदान करने वाला मूलभूत कागज मंत्र (1992) है।


SPSA वैश्विक न्यूनतम खोजने में सक्षम मूल विधि है, इस संपत्ति को [[तैयार किए हुयी धातु पे पानी चढाने की कला]] के रूप में अन्य विधि से साझा करना है। इसकी मुख्य विशेषता ढाल सन्निकटन है जिसके लिए अनुकूलन समस्या के आयाम की ध्यान किए बिना उद्देश्य फ़ंक्शन के केवल दो मापों की आवश्यकता होती है। याद रखें कि हम अनुकूलतम नियंत्रण खोजना चाहते हैं <math>u^*</math> क्षति के साथ कार्य <math>J(u)</math>:
एसपीएसए एक मूल विधि है जो वैश्विक मिनीमा खोजने में सक्षम है, इस संपत्ति को सिम्युलेटेड एनीलिंग के रूप में अन्य तरीकों से साझा कर रही है। इसकी मुख्य विशेषता प्रवणता सन्निकटन है जिसके लिए अनुकूलन समस्या के आयाम की ध्यान किए बिना उद्देश्य फलन के केवल दो मापों की आवश्यकता होती है। याद रखें कि हम अनुकूलतम नियंत्रण खोजना चाहते हैं <math>u^*</math> क्षति के साथ कार्य <math>J(u)</math>:


:<math>u^* = \arg  \min_{u \in U} J(u).</math>
:<math>u^* = \arg  \min_{u \in U} J(u).</math>
दोनों परिमित अंतर स्टोकेस्टिक सन्निकटन (FDSA) और SPSA समान पुनरावृत्ति प्रक्रिया का उपयोग करते हैं
दोनों परिमित अंतर स्टोकेस्टिक सन्निकटन (एफडीएसए) और एसपीएसए समान पुनरावृत्ति प्रक्रिया का उपयोग करते हैं


:<math>u_{n+1} = u_n - a_n\hat{g}_n(u_n),</math>
:<math>u_{n+1} = u_n - a_n\hat{g}_n(u_n),</math>
जहाँ <math>u_n=((u_n)_1,(u_n)_2,\ldots,(u_n)_p)^T</math> का प्रतिनिधित्व करता है <math>n^{th}</math> पुनरावृति, <math>\hat{g}_n(u_n)</math> उद्देश्य कार्य के ढाल का अनुमान है <math>g(u)= \frac{\partial}{\partial u}J(u)</math> पर मूल्यांकन किया गया <math>{u_n}</math>, और <math>\{a_n\}</math> धनात्मक संख्या क्रम है जो 0 में परिवर्तित हो रहा है। यदि <math>u_n</math> P-आयामी वेक्टर है <math>i^{th}</math> [[सममित]] परिमित अंतर ढाल अनुमानक का घटक है।
जहाँ <math>u_n=((u_n)_1,(u_n)_2,\ldots,(u_n)_p)^T</math> का प्रतिनिधित्व करता है <math>n^{th}</math> पुनरावृति, <math>\hat{g}_n(u_n)</math> उद्देश्य कार्य के प्रवणता का अनुमान है <math>g(u)= \frac{\partial}{\partial u}J(u)</math> पर मूल्यांकन किया गया <math>{u_n}</math>, और <math>\{a_n\}</math> धनात्मक संख्या क्रम है जो 0 में परिवर्तित हो रहा है। यदि <math>u_n</math> P-आयामी दिष्‍ट है <math>i^{th}</math> [[सममित]] परिमित अंतर प्रवणता अनुमानक का घटक है।


:FD <math>(\hat{g_n}(u_n))_i = \frac{J(u_n+c_ne_i)-J(u_n-c_ne_i)}{2c_n},</math>
:FD <math>(\hat{g_n}(u_n))_i = \frac{J(u_n+c_ne_i)-J(u_n-c_ne_i)}{2c_n},</math>
1 ≤i ≤p, जहां <math>e_i</math> 1 के साथ इकाई वेक्टर है <math>i^{th}</math> स्थान , और <math>c_n</math> छोटी धनात्मक संख्या है जो n से घटती है। इस पद्धति के साथ, प्रत्येक के लिए J का 2p मूल्यांकन <math>g_n</math> आवश्यकता है। स्पष्ट रूप से, जब p बड़ा होता है, तो यह अनुमानक दक्षता खो देता है।
1 ≤i ≤p, जहां <math>e_i</math> 1 के साथ इकाई दिष्‍ट है <math>i^{th}</math> स्थान , और <math>c_n</math> छोटी धनात्मक संख्या है जो n से घटती है। इस पद्धति के साथ, प्रत्येक के लिए J का 2p मूल्यांकन <math>g_n</math> आवश्यकता है। स्पष्ट रूप से, जब p बड़ा होता है, तो यह अनुमानक दक्षता खो देता है।


अभी चलो <math>\Delta_n</math> यादृच्छिक गड़बड़ी वेक्टर बनें। <math>i^{th}</math> h> स्टोकेस्टिक गड़बड़ी ढाल अनुमानक का घटक है।
देख है  <math>\Delta_n</math> यादृच्छिक प्रक्षोभ दिष्‍ट बनें। <math>i^{th}</math> h> स्टोकेस्टिक प्रक्षोभ प्रवणता अनुमानक का घटक है।


: SP : <math>(\hat{g_n}(u_n))_i = \frac{J(u_n+c_n\Delta_n)-J(u_n-c_n\Delta_n)}{2c_n(\Delta_n)_i}.</math>
: SP : <math>(\hat{g_n}(u_n))_i = \frac{J(u_n+c_n\Delta_n)-J(u_n-c_n\Delta_n)}{2c_n(\Delta_n)_i}.</math>
टिप्पणी करें कि FD समय में केवल दिशा को परेशान करता है, जबकि SP अनुमानक ही समय में सभी दिशाओं को परेशान करता है। सभी P घटकों में अंश समान होता है। प्रत्येक के लिए SPSA पद्धति में आवश्यक हानि फ़ंक्शन मापों की संख्या <math>g_n</math> [[आयाम]] p से स्वतंत्र सदैव 2 होता है। इस प्रकार, SPSA, FDSA की तुलना में p गुना कम फ़ंक्शन मूल्यांकन का उपयोग करता है, जो इसे बहुत अधिक कुशल बनाता है।
टिप्पणी करें कि FD समय में केवल दिशा को परेशान करता है, जबकि SP अनुमानक ही समय में सभी दिशाओं को परेशान करता है। सभी P घटकों में अंश समान होता है। प्रत्येक के लिए एसपीएसए पद्धति में आवश्यक हानि फलन मापों की संख्या <math>g_n</math> [[आयाम]] p से स्वतंत्र सदैव 2 होता है। इस प्रकार, एसपीएसए, एफडीएसए की तुलना में p गुना कम फलन मूल्यांकन का उपयोग करता है, जो इसे बहुत अधिक कुशल बनाता है।


P = 2 के साथ सरल प्रयोगों से पता चला है कि SPSA उसी संख्या में पुनरावृत्तियों में FDSA के रूप में अभिसरण करता है। उत्तरार्द्ध ढाल पद्धति की भांति व्यवहार करते हुए, सबसे [[तेज]] वंश दिशा का अनुसरण करता है। दूसरी ओर, SPSA , यादृच्छिक खोज दिशा के साथ पूरी भांति से ढाल पथ का पालन नहीं करता है। चूँकि औसतन, यह इसे लगभग चिह्नित करता है क्योंकि प्रवणता [[सन्निकटन]] लगभग [[निष्पक्ष]] है ढाल का अनुमानक, जैसा कि निम्नलिखित लेम्मा में दिखाया गया है।
P = 2 के साथ सरल प्रयोगों से पता चला है कि एसपीएसए उसी संख्या में पुनरावृत्तियों में एफडीएसए के रूप में अभिसरण करता है। उत्तरार्द्ध प्रवणता पद्धति की भांति व्यवहार करते हुए, सबसे [[तेज]] वंश दिशा का अनुसरण करता है। दूसरी ओर, एसपीएसए , यादृच्छिक खोज दिशा के साथ पूरी भांति से प्रवणता पथ का पालन नहीं करता है। चूँकि औसतन, यह इसे लगभग चिह्नित करता है क्योंकि प्रवणता [[सन्निकटन]] लगभग [[निष्पक्ष]] है प्रवणता का अनुमानक, जैसा कि निम्नलिखित लेम्मा में दिखाया गया है।


== अभिसरण लेम्मा ==
== अभिसरण लेम्मा ==
Line 26: Line 26:


== प्रमाण का रेखाचित्र ==
== प्रमाण का रेखाचित्र ==
मुख्य [[विचार]] कंडीशनिंग का उपयोग करना है <math>\Delta_n</math> ज़ाहिर करना <math>E[(\hat{g}_n)_i]</math> और फिर दूसरे क्रम के टेलर विस्तार का उपयोग करने के लिए <math>J(u_n+c_n\Delta_n)_i</math> और <math>J(u_n-c_n\Delta_n)_i</math>. शून्य माध्य और स्वतंत्रता का उपयोग करके बीजगणितीय जोड़तोड़ के बाद <math>\{(\Delta_n)_i\}</math>, हम पाते हैं
मुख्य [[विचार]] अनुकूलन का उपयोग करना है <math>\Delta_n</math> संकेत करना <math>E[(\hat{g}_n)_i]</math> और फिर दूसरे क्रम के टेलर विस्तार का उपयोग करने के लिए <math>J(u_n+c_n\Delta_n)_i</math> और <math>J(u_n-c_n\Delta_n)_i</math>. शून्य माध्य और स्वतंत्रता का उपयोग करके बीजगणितीय जोड़ तोड़ के बाद <math>\{(\Delta_n)_i\}</math>, हम पाते हैं


:<math>E[(\hat{g}_n)_i]=(g_n)_i + O(c_n^2)</math>
:<math>E[(\hat{g}_n)_i]=(g_n)_i + O(c_n^2)</math>
परिणाम [[परिकल्पना]] से आता है कि <math>c_n</math>→ 0।
परिणाम [[परिकल्पना]] से आता है कि <math>c_n</math>→ 0।


इसके बाद हम कुछ परिकल्पनाओं को फिर से शुरू करते हैं जिनके तहत <math>u_t</math> के वैश्विक न्यूनतम के सेट की [[संभावना]] में अभिसरण करता है <math>J(u)</math>. की दक्षता
इसके बाद हम कुछ परिकल्पनाओं को फिर से प्रारंभ करते हैं जिनके अनुसार <math>u_t</math> के वैश्विक न्यूनतम चयनकी [[संभावना]] में अभिसरण करता है <math>J(u)</math>. की दक्षता विधि के आकार पर निर्भर करती है <math>J(u)</math>, मापदंडों के मान <math>a_n</math> और <math>c_n</math> और प्रक्षोभ की परिस्थिति का वितरण <math>\Delta_{ni}</math>. सबसे पहले, कलन विधि मापदंडों को संतुष्ट करना चाहिए निम्नलिखित अवस्था,
विधि के आकार पर निर्भर करती है <math>J(u)</math>, मापदंडों के मान <math>a_n</math> और <math>c_n</math> और गड़बड़ी की शर्तों का वितरण <math>\Delta_{ni}</math>. सबसे पहले, एल्गोरिथ्म मापदंडों को संतुष्ट करना चाहिए
निम्नलिखित शर्तें:


*  <math>a_n</math> >0, <math>a_n</math>→0 जब n→∝ और <math>\sum_{n=1}^{\infty} a_n = \infty </math>. अच्छा विकल्प होगा <math>a_n=\frac{a}{n};</math> ए> 0;
*  <math>a_n</math> >0, <math>a_n</math>→0 जब n→∝ और <math>\sum_{n=1}^{\infty} a_n = \infty </math>. अच्छा विकल्प होगा <math>a_n=\frac{a}{n};</math> ए> 0;
*  <math>c_n=\frac{c}{n^\gamma}</math>, जहां सी> 0, <math> \gamma \in \left[\frac{1}{6},\frac{1}{2}\right]</math>;
*  <math>c_n=\frac{c}{n^\gamma}</math>, जहां सी> 0, <math> \gamma \in \left[\frac{1}{6},\frac{1}{2}\right]</math>;
* <math>\sum_{n=1}^{\infty} (\frac {a_n}{c_n})^2 < \infty </math>
* <math>\sum_{n=1}^{\infty} (\frac {a_n}{c_n})^2 < \infty </math>
* <math> \Delta_{ni} </math> पारस्परिक रूप से स्वतंत्र शून्य-मतलब यादृच्छिक चर होना चाहिए, सममित रूप से शून्य के साथ वितरित किया जाना चाहिए <math>\Delta_{ni} < a_1 < \infty </math>. का उलटा पहला और दूसरा क्षण <math> \Delta_{ni} </math> परिमित होना चाहिए।
* <math> \Delta_{ni} </math> पारस्परिक रूप से स्वतंत्र शून्य-अर्थात यादृच्छिक चर होना चाहिए। सममित रूप से शून्य के साथ वितरित किया जाना चाहिए <math>\Delta_{ni} < a_1 < \infty </math>. का उलटा पहला और दूसरा क्षण <math> \Delta_{ni} </math> परिमित होना चाहिए।
के लिए अच्छा विकल्प है <math>\Delta_{ni}</math> रैडेमाकर बंटन है, अर्थात बर्नौली +-1 जिसकी प्रायिकता 0.5 है। अन्य विकल्प भी संभव हैं, लेकिन ध्यान दें कि समान और सामान्य वितरण का उपयोग नहीं किया जा सकता क्योंकि वे परिमित व्युत्क्रम क्षण स्थितियों को संतुष्ट नहीं करते हैं।
इसके लिए अच्छा विकल्प है <math>\Delta_{ni}</math> यादृच्छिक चर है, अर्थात बर्नौली +-1 जिसकी प्रायिकता 0.5 है। अन्य विकल्प भी संभव हैं, किन्तु ध्यान दें कि समान और सामान्य वितरण का उपयोग नहीं किया जा सकता, क्योंकि वे परिमित व्युत्क्रम क्षण स्थितियों को संतुष्ट नहीं करते हैं।


हानि फ़ंक्शन जे (यू) तीन बार लगातार भिन्न होने वाला फ़ंक्शन होना चाहिए और तीसरे डेरिवेटिव के अलग-अलग तत्वों को बाध्य किया जाना चाहिए: <math>|J^{(3)}(u)| < a_3 < \infty </math>. भी, <math>|J(u)|\rightarrow\infty</math> जैसा <math>u\rightarrow\infty</math>.
हानि फलन जे (यू) तीन बार लगातार भिन्न होने वाला फलन होना चाहिए और तीसरे यौगिक के अलग-अलग तत्वों को बाध्य किया जाना चाहिए। <math>|J^{(3)}(u)| < a_3 < \infty </math>. भी, <math>|J(u)|\rightarrow\infty</math> जैसा <math>u\rightarrow\infty</math>.


इसके साथ ही, <math>\nabla J</math> Lipschitz निरंतर, परिबद्ध और ODE होना चाहिए <math> \dot{u}=g(u)</math> प्रत्येक प्रारंभिक स्थिति के लिए अनूठा समाधान होना चाहिए।
इसके साथ ही, <math>\nabla J</math> लिप्सचिट्ज़ निरंतर, परिबद्ध और स्तोत्र होना चाहिए <math> \dot{u}=g(u)</math> प्रत्येक प्रारंभिक स्थिति के लिए अनूठा समाधान होना चाहिए। इन परिस्थिति के अनुसार और कुछ अन्य, <math>u_k</math> J(u) के वैश्विक न्यूनतम के समुच्चय की प्रायिकता में [[अभिसरण (गणित)]] (देखें मैरीक और चिन, 2008)।
इन शर्तों के तहत और कुछ अन्य, <math>u_k</math> J(u) के वैश्विक न्यूनतम के समुच्चय की प्रायिकता में [[अभिसरण (गणित)]] (देखें मैरीक और चिन, 2008)।


यह दिखाया गया है कि भिन्नता की आवश्यकता नहीं है: निरंतरता और उत्तलता अभिसरण के लिए पर्याप्त हैं।<ref>    {{cite journal |last1=He |first1=Ying |last2=Fu |first2=Michael C. |last3=Steven I. |first3=Marcus |date=August 2003 |title=Convergence of simultaneous perturbation stochastic approximation for nondifferentiable optimization |url=https://ieeexplore.ieee.org/document/1220767 |journal=IEEE Transactions on Automatic Control |volume=48 |issue=8 |pages=1459–1463 |doi=10.1109/TAC.2003.815008 |access-date=March 6, 2022}}</ref>
यह दिखाया गया है कि भिन्नता की आवश्यकता नहीं है, निरंतरता और उत्तलता अभिसरण के लिए पर्याप्त हैं।<ref>    {{cite journal |last1=He |first1=Ying |last2=Fu |first2=Michael C. |last3=Steven I. |first3=Marcus |date=August 2003 |title=Convergence of simultaneous perturbation stochastic approximation for nondifferentiable optimization |url=https://ieeexplore.ieee.org/document/1220767 |journal=IEEE Transactions on Automatic Control |volume=48 |issue=8 |pages=1459–1463 |doi=10.1109/TAC.2003.815008 |access-date=March 6, 2022}}</ref>




== दूसरे क्रम (न्यूटन) विधियों का विस्तार ==
== दूसरे क्रम (न्यूटन) विधियों का विस्तार ==
यह ज्ञात है कि मानक (नियतात्मक) न्यूटन-रैफसन एल्गोरिथम ("द्वितीय-क्रम" विधि) का स्टोकेस्टिक संस्करण स्टोकेस्टिक सन्निकटन का विषम रूप से अनुकूलतम या निकट-अनुकूलतम रूप प्रदान करता है। SPSA का उपयोग या तो शोर हानि माप या शोर ढाल माप (स्टोकास्टिक ग्रेडियेंट) के आधार पर हानि कार्य के हेसियन मैट्रिक्स का कुशलतापूर्वक अनुमान लगाने के लिए भी किया जा सकता है। मूल SPSA विधि के साथ, समस्या आयाम P के बावजूद, प्रत्येक पुनरावृत्ति पर हानि माप या ढाल माप की केवल छोटी निश्चित संख्या की आवश्यकता होती है। [[स्टोचैस्टिक ग्रेडिएंट डिसेंट|स्टोकेस्टिक प्रवणता डिसेंट]] में संक्षिप्त चर्चा देखें।
यह ज्ञात है कि मानक नियतात्मक न्यूटन-रैफसन कलन विधि ("द्वितीय-क्रम" विधि) का स्टोकेस्टिक संस्करण स्टोकेस्टिक सन्निकटन का विषम रूप से अनुकूलतम या निकट-अनुकूलतम रूप प्रदान करता है। एसपीएसए का उपयोग ध्वनि हानि माप या ध्वनि प्रवणता माप स्टोकास्टिक प्रवणता के आधार पर हानि कार्य के हेसियन मैट्रिक्स का कुशलतापूर्वक अनुमान लगाने के लिए भी किया जा सकता है। मूल एसपीएसए विधि के साथ, समस्या आयाम P के अतिरिक्त, प्रत्येक पुनरावृत्ति पर हानि माप या प्रवणता माप की केवल छोटी निश्चित संख्या की आवश्यकता होती है। [[स्टोचैस्टिक ग्रेडिएंट डिसेंट|स्टोकेस्टिक प्रवणता डिसेंट]] में संक्षिप्त चर्चा देखें।


==संदर्भ==
==संदर्भ==
Line 62: Line 59:


<references/>
<references/>
[[Category: संख्यात्मक जलवायु और मौसम मॉडल]] [[Category: स्टोचैस्टिक अनुकूलन]] [[Category: यादृच्छिक एल्गोरिदम]] [[Category: अनुकूलन एल्गोरिदम और तरीके]]


[[Category: Machine Translated Page]]
[[Category:Created On 13/02/2023]]
[[Category:Created On 13/02/2023]]
[[Category:Machine Translated Page]]
[[Category:Templates Vigyan Ready]]
[[Category:अनुकूलन एल्गोरिदम और तरीके]]
[[Category:यादृच्छिक एल्गोरिदम]]
[[Category:संख्यात्मक जलवायु और मौसम मॉडल]]
[[Category:स्टोचैस्टिक अनुकूलन]]

Latest revision as of 16:59, 24 February 2023

समकालिक प्रक्षोभ प्रसंभाव्यता सन्निकटन (एसपीएसए) कई अज्ञात पैरामीटर वाली प्रणाली को अनुकूलित करने के लिए कलन विधि विधि है। यह प्रकार का स्टोकेस्टिक सन्निकटन कलन विधि है। अनुकूलन पद्धति के रूप में यह बड़े पैमाने पर जनसंख्या मॉडल, अनुकूली प्रतिरूप , अनुरूप अनुकूलन और वायुमंडलीय प्रतिरूप के लिए उपयुक्त है। एसपीएसए की वेबसाइट http://www.jhuapl.edu/एसपीएसए पर कई उदाहरण प्रस्तुत किए गए हैं। इस विषय पर विस्तृत पुस्तक भटनागर एवं अन्य हैं। (2013). इस विषय पर प्रारंभिक कागज मंत्र (1987) है और मुख्य सिद्धांत और औचित्य प्रदान करने वाला मूलभूत कागज मंत्र (1992) है।

एसपीएसए एक मूल विधि है जो वैश्विक मिनीमा खोजने में सक्षम है, इस संपत्ति को सिम्युलेटेड एनीलिंग के रूप में अन्य तरीकों से साझा कर रही है। इसकी मुख्य विशेषता प्रवणता सन्निकटन है जिसके लिए अनुकूलन समस्या के आयाम की ध्यान किए बिना उद्देश्य फलन के केवल दो मापों की आवश्यकता होती है। याद रखें कि हम अनुकूलतम नियंत्रण खोजना चाहते हैं क्षति के साथ कार्य :

दोनों परिमित अंतर स्टोकेस्टिक सन्निकटन (एफडीएसए) और एसपीएसए समान पुनरावृत्ति प्रक्रिया का उपयोग करते हैं

जहाँ का प्रतिनिधित्व करता है पुनरावृति, उद्देश्य कार्य के प्रवणता का अनुमान है पर मूल्यांकन किया गया , और धनात्मक संख्या क्रम है जो 0 में परिवर्तित हो रहा है। यदि P-आयामी दिष्‍ट है सममित परिमित अंतर प्रवणता अनुमानक का घटक है।

FD

1 ≤i ≤p, जहां 1 के साथ इकाई दिष्‍ट है स्थान , और छोटी धनात्मक संख्या है जो n से घटती है। इस पद्धति के साथ, प्रत्येक के लिए J का 2p मूल्यांकन आवश्यकता है। स्पष्ट रूप से, जब p बड़ा होता है, तो यह अनुमानक दक्षता खो देता है।

देख है यादृच्छिक प्रक्षोभ दिष्‍ट बनें। h> स्टोकेस्टिक प्रक्षोभ प्रवणता अनुमानक का घटक है।

SP :

टिप्पणी करें कि FD समय में केवल दिशा को परेशान करता है, जबकि SP अनुमानक ही समय में सभी दिशाओं को परेशान करता है। सभी P घटकों में अंश समान होता है। प्रत्येक के लिए एसपीएसए पद्धति में आवश्यक हानि फलन मापों की संख्या आयाम p से स्वतंत्र सदैव 2 होता है। इस प्रकार, एसपीएसए, एफडीएसए की तुलना में p गुना कम फलन मूल्यांकन का उपयोग करता है, जो इसे बहुत अधिक कुशल बनाता है।

P = 2 के साथ सरल प्रयोगों से पता चला है कि एसपीएसए उसी संख्या में पुनरावृत्तियों में एफडीएसए के रूप में अभिसरण करता है। उत्तरार्द्ध प्रवणता पद्धति की भांति व्यवहार करते हुए, सबसे तेज वंश दिशा का अनुसरण करता है। दूसरी ओर, एसपीएसए , यादृच्छिक खोज दिशा के साथ पूरी भांति से प्रवणता पथ का पालन नहीं करता है। चूँकि औसतन, यह इसे लगभग चिह्नित करता है क्योंकि प्रवणता सन्निकटन लगभग निष्पक्ष है प्रवणता का अनुमानक, जैसा कि निम्नलिखित लेम्मा में दिखाया गया है।

अभिसरण लेम्मा

द्वारा निरूपित करें

अनुमानक में पक्षपात . ये मान लीजिए शून्य-माध्य, बंधे हुए दूसरे के साथ सभी परस्पर स्वतंत्र हैं क्षण, और समान रूप से बंधा हुआ। तब → 0 W.P. 1.

प्रमाण का रेखाचित्र

मुख्य विचार अनुकूलन का उपयोग करना है संकेत करना और फिर दूसरे क्रम के टेलर विस्तार का उपयोग करने के लिए और . शून्य माध्य और स्वतंत्रता का उपयोग करके बीजगणितीय जोड़ तोड़ के बाद , हम पाते हैं

परिणाम परिकल्पना से आता है कि → 0।

इसके बाद हम कुछ परिकल्पनाओं को फिर से प्रारंभ करते हैं जिनके अनुसार के वैश्विक न्यूनतम चयनकी संभावना में अभिसरण करता है . की दक्षता विधि के आकार पर निर्भर करती है , मापदंडों के मान और और प्रक्षोभ की परिस्थिति का वितरण . सबसे पहले, कलन विधि मापदंडों को संतुष्ट करना चाहिए निम्नलिखित अवस्था,

  • >0, →0 जब n→∝ और . अच्छा विकल्प होगा ए> 0;
  • , जहां सी> 0, ;
  • पारस्परिक रूप से स्वतंत्र शून्य-अर्थात यादृच्छिक चर होना चाहिए। सममित रूप से शून्य के साथ वितरित किया जाना चाहिए . का उलटा पहला और दूसरा क्षण परिमित होना चाहिए।

इसके लिए अच्छा विकल्प है यादृच्छिक चर है, अर्थात बर्नौली +-1 जिसकी प्रायिकता 0.5 है। अन्य विकल्प भी संभव हैं, किन्तु ध्यान दें कि समान और सामान्य वितरण का उपयोग नहीं किया जा सकता, क्योंकि वे परिमित व्युत्क्रम क्षण स्थितियों को संतुष्ट नहीं करते हैं।

हानि फलन जे (यू) तीन बार लगातार भिन्न होने वाला फलन होना चाहिए और तीसरे यौगिक के अलग-अलग तत्वों को बाध्य किया जाना चाहिए। . भी, जैसा .

इसके साथ ही, लिप्सचिट्ज़ निरंतर, परिबद्ध और स्तोत्र होना चाहिए प्रत्येक प्रारंभिक स्थिति के लिए अनूठा समाधान होना चाहिए। इन परिस्थिति के अनुसार और कुछ अन्य, J(u) के वैश्विक न्यूनतम के समुच्चय की प्रायिकता में अभिसरण (गणित) (देखें मैरीक और चिन, 2008)।

यह दिखाया गया है कि भिन्नता की आवश्यकता नहीं है, निरंतरता और उत्तलता अभिसरण के लिए पर्याप्त हैं।[1]


दूसरे क्रम (न्यूटन) विधियों का विस्तार

यह ज्ञात है कि मानक नियतात्मक न्यूटन-रैफसन कलन विधि ("द्वितीय-क्रम" विधि) का स्टोकेस्टिक संस्करण स्टोकेस्टिक सन्निकटन का विषम रूप से अनुकूलतम या निकट-अनुकूलतम रूप प्रदान करता है। एसपीएसए का उपयोग ध्वनि हानि माप या ध्वनि प्रवणता माप स्टोकास्टिक प्रवणता के आधार पर हानि कार्य के हेसियन मैट्रिक्स का कुशलतापूर्वक अनुमान लगाने के लिए भी किया जा सकता है। मूल एसपीएसए विधि के साथ, समस्या आयाम P के अतिरिक्त, प्रत्येक पुनरावृत्ति पर हानि माप या प्रवणता माप की केवल छोटी निश्चित संख्या की आवश्यकता होती है। स्टोकेस्टिक प्रवणता डिसेंट में संक्षिप्त चर्चा देखें।

संदर्भ

  • Bhatnagar, S., Prasad, H. L., and Prashanth, L. A. (2013), Stochastic Recursive Algorithms for Optimization: Simultaneous Perturbation Methods, Springer [1].
  • Hirokami, T., Maeda, Y., Tsukada, H. (2006) "Parameter estimation using simultaneous perturbation stochastic approximation", Electrical Engineering in Japan, 154 (2), 30–3 [2]
  • Maryak, J.L., and Chin, D.C. (2008), "Global Random Optimization by Simultaneous Perturbation Stochastic Approximation," IEEE Transactions on Automatic Control, vol. 53, pp. 780-783.
  • Spall, J. C. (1987), “A Stochastic Approximation Technique for Generating Maximum Likelihood Parameter Estimates,” Proceedings of the American Control Conference, Minneapolis, MN, June 1987, pp. 1161–1167.
  • Spall, J. C. (1992), “Multivariate Stochastic Approximation Using a Simultaneous Perturbation Gradient Approximation,” IEEE Transactions on Automatic Control, vol. 37(3), pp. 332–341.
  • Spall, J.C. (1998). "Overview of the Simultaneous Perturbation Method for Efficient Optimization" 2. Johns Hopkins APL Technical Digest, 19(4), 482–492.
  • Spall, J.C. (2003) Introduction to Stochastic Search and Optimization: Estimation, Simulation, and Control, Wiley. ISBN 0-471-33052-3 (Chapter 7)
  1. He, Ying; Fu, Michael C.; Steven I., Marcus (August 2003). "Convergence of simultaneous perturbation stochastic approximation for nondifferentiable optimization". IEEE Transactions on Automatic Control. 48 (8): 1459–1463. doi:10.1109/TAC.2003.815008. Retrieved March 6, 2022.